模型
老黄玩Nano Banana上瘾,拉着哈萨比斯大夸特夸,“不会有人不喜欢吧?”
英伟达CEO黄仁勋也被Nano Banana迷住了。 在伦敦,他面对一众记者,公开宣称自己是Nano Banana的忠实粉丝:怎么会有人不喜欢Nano Banana? 老黄还透露,他前一天也当着DeepMind CEO哈萨比斯的面对Nano Banana大夸特夸。
9/18/2025 12:47:05 PM
ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格
「还我GPT-4o! 」GPT-5发布后不到一周,在用户强大的反对声浪中,OpenAI不得不火速宣布GPT-4o等前代模型回归。 至此,大家才意识到:用户对4o等上一代模型,已经产生了深深的「依恋感」。
9/18/2025 12:44:33 PM
GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色
9月初,一篇挂在arXiv的论文在学界扔下一颗炸弹——GPT-5被写进了数学研究成果里。 研究者在文中公开写道:GPT-5在他们的实验中完成了一项此前从未解决的数学工作,并将结果直接纳入正式稿件。 这是大型语言模型首次以「定理贡献者」的身份出现在数学研究论文中。
9/18/2025 12:41:22 PM
阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定
阿里又双叒叕上大分了! 就在昨天,阿里旗下首个深度研究Agent模型——通义DeepResearch正式开源。 在多项权威基准上,通义DeepResearch狂飙SOTA,仅依靠30B参数(激活3B)就能大杀四方!
9/18/2025 12:39:10 PM
通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
通义 DeepResearch 重磅发布,让 AI 从 “能聊天” 跃迁到 “会做研究”。 在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同时实现模型、框架、方案全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用,通义 DeepResearch 团队做到了完全开源!
9/18/2025 9:56:47 AM
震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩
在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。
9/18/2025 9:07:19 AM
给模型狂堆参数的“大力出奇迹”真的失效了吗?剑桥说:AI的真正潜力才刚开始
在人们都认为疯狂砸钱,拼命地把大语言模型的参数规模往上堆的Scaling Law已经到头了的时候。 一篇叫《递减收益的错觉:衡量LLMs中的长时程执行能力》的论文又给大家来了一剂“强心针”。 这篇报告由剑桥大学、斯图加特大学人工智能研究所、马克斯普朗克智能系统研究所以及图宾根ELLIS研究所的大神们联手发布。
9/18/2025 9:03:11 AM
终结数据荒!智源开源首个Deep Research数据合成框架InfoSeek
近日,北京智源人工智能研究院(简称「智源研究院」)发布开源数据集InfoSeek,成为首个面向深度研究(Deep Research)场景的大规模开源数据集。 在这一工作中,智源研究团队揭示了深度研究问题与层级约束满足问题(Hierarchical Constraint Satisfaction Problem)之间的数学等价关系,并由此提出了基于「扩散-回溯」过程的数据合成方法,实现了深度研究训练数据的大规模自动扩增。 利用上述方法,研究团队总计合成了包含5万条训练样本的数据集InfoSeek,并据此训练出参数规模仅3B的智能体模型。
9/17/2025 2:47:51 PM
来自MIT最强AI实验室:OpenAI天才华人研究员博士毕业了!
不到4年完成顶级AI实验室博士、顺便辅修了哲学、GPT图像生成核心5人研究团队成员、OpenAI视频生成模型Sora小组成员……刚刚,OpenAI华人研究科学家陈博远,完成了MIT博士论文答辩! 他激动地表示:我很兴奋能够在工业界继续推进世界模型的发展——现在加入了GPT图像生成和Sora视频团队。 没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
9/17/2025 2:46:05 PM
小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马
2025年,大模型持续高速进化,科技巨头在为「燃料」——高质量数据,展开了激烈的角逐。 数据,不再是幕后的配角,而是直接决定AI成败的核心战场。 如今,全球AI圈的「数据大战」愈演愈烈。
9/17/2025 1:23:11 PM
技术大神用纯Rust从零构建了LLM,在GitHub上大火
Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。 而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。 一个用纯Rust从零开始实现完整大语言模型的项目RustGPT,在GitHub上火了,两天星标超过1.4k。
9/17/2025 9:30:40 AM
一周休4天!老黄、盖茨站台,网友炸锅:是AI福利,还是裁员信号?
每周工作三天? 刚刚,Fortune的一篇报道,把这个话题点着了,引发网友热议。 Zoom CEO袁征预测:AI聊天机器人和智能体,将带来3-4天工作制。
9/17/2025 9:03:00 AM
马斯克周末血裁xAI 500人
什么情况,帮马斯克训练大模型的人说失业就失业了? 上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。 这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
9/17/2025 8:50:00 AM
国产王炸!上海AI Lab开源Lumina-DiMOO,开创多模态理解与生成新范式
上海人工智能实验室,上海创新研究院,上海交大,南京大学,悉尼大学,港中大,清华,共同推出了被誉为新一代多模态生成与理解统一模型的Lumina-DiMOO。 “An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding”,翻译过来就是“面向多模态生成与理解的全方位扩散大语言模型”。 关键词:“全方位”。
9/16/2025 10:28:57 AM
GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭
奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM
反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假
全球最快开源AI推理模型! 这个标签为K2‑Think带来轰动效果:福布斯、VentureBeat、Wired、CNBC等媒体争先报道,甚至图灵奖得主转发相关推文介绍! 然而,苏黎世联邦理工学院计算机科学系SRI实验室的研究者,却泼了一盆冷水:虽然K2-Think不错,但报告的性能被夸大了。
9/16/2025 9:12:00 AM
新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单
81岁的拉里·埃里森(Larry Ellison),好胜心极强,长期霸榜福布斯财富榜Top10,但他不满意,只想做第一。 就在上周,他终于凭借OpenAI千亿订单重大利好带飞了甲骨文股价,短暂成为了世界首富,完成了夙愿。 他创办了甲骨文(Oracle)公司,至今仍担任董事会主席,CEO职位也是做了37年才卸任。
9/16/2025 9:10:00 AM
面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码
「所有面试,本质上都是表演。 」在历经数轮苛刻面试后,成功入职OpenAI后,Bas van Opheusden得出的终极结论。 你需要准备的不仅是完美的代码,还有一个能展现领导力的「失败故事」,一套应对「非正式聊天」的标准话术,甚至是一间光线完美的房间和两个显示器。
9/16/2025 9:06:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉