GPT-5
DeepMind一篇论文终结十年之争!GPT-5推理靠世界模型
                        GPT-5上线后,最让人震惊的不是它能写诗画画,而是它展现出的推理能力。 网友惊呼:「感觉像是在和博士讨论问题」,媒体更是直言它的逻辑水平已经「堪比专家」。 为什么会出现这种「突然开窍」的效果?
                    
                    10/31/2025 4:04:17 PM
                        新智元
                    颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞
                        刚刚,OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。 目前,Aardvark还处于beta测试阶段。 OpenAI称,Aardvark开创了「防御者优先」的新范式:作为自主安全研究智能体,随代码不断演化,为团队提供持续保护(continuous protection)。
                    
                    10/31/2025 3:53:06 PM
                        
                    OpenAI“Company Knowledge”上线 可以连接企业知识和数据源
                        OpenAI正式推出ChatGPT的“Company Knowledge”功能,这一创新直接响应了企业用户对数据碎片化痛点的呼声。 根据最新动态,这一功能于率先向Business、Enterprise和Edu计划用户开放,已在全球范围内引发热议。 它标志着ChatGPT从通用聊天工具向深度企业助理的华丽转身,帮助团队高效整合散布在多平台的内部知识。
                    
                    10/27/2025 10:56:25 AM
                        AI在线
                    DATAMIND:构建专业级数据分析智能体的可扩展方法论
                        大家好,我是肆〇柒。 今天来看看来自浙江大学与阿里巴巴集团联合研究团队的最新工作——《Scaling Generalist Data-Analytic Agents》。 这项研究不仅提出了名为 DATAMIND 的高质量数据合成与智能体训练框架,更训练出了在多项基准上超越 GPT-5 的开源数据分析智能体 DATAMIND-14B,为构建专业领域 Agentic AI 提供了一套可复现、可扩展的方法论。
                    
                    10/27/2025 9:00:09 AM
                        肆零柒
                    仅100种子题,合成数据质量超GPT-5,阿里、上交提出Socratic-Zero框架
                        本文(共同)第一作者为王少博(上交 AI)、焦政博(上财)。 (共同)通讯作者为魏虎(阿里巴巴)和张林峰(上交 AI)。 本文其他作者来自阿里巴巴、武大、浙大等。
                    
                    10/23/2025 4:45:09 PM
                        
                    蚂蚁万亿模型震撼开源!数学推理碾压GPT,国产AI首次问鼎奥数银牌
                        92.6分 vs 94.6分——当我看到蚂蚁集团刚发布的Ring-1T模型在AIME25测试中的成绩时,第一反应是有点不敢相信。 一个国产开源模型,居然能在数学推理上逼近GPT-5的水平? 更震撼的是,这个叫Ring-1T的模型在模拟IMO(国际数学奥林匹克)近十年真题的测试中,正确率达到了银牌选手平均水平的93%。
                    
                    10/22/2025 12:00:00 AM
                        阿丸笔记
                    惊爆!Vercel CEO 称 Kimi K2 在 AI 应用中超越 GPT-5,准确率高出 50%!
                        近日,美国初创公司 Vercel 的首席执行官吉列尔莫在社交媒体上发布了一项引人注目的声明,称中国开源模型 Kimi K2在智能体应用场景中的表现远超其对手,包括前沿的闭源模型 GPT-5和 Claude Sonnet4.5。 根据吉列尔莫的分享,Kimi K2不仅在准确率上领先了50%,而且运行速度更是快了整整5倍,这一发现引发了科技界的广泛关注。 在一项真实场景基准测试中,吉列尔莫提供的数据表明,Kimi K2的运行时间仅为2分钟,而其竞争对手 GPT-5和 Sonnet4.5则需要8到10分钟才能完成相同任务。
                    
                    10/21/2025 5:56:11 PM
                        AI在线
                    图灵奖得主联手前谷歌CEO,发布全球首份AGI“成绩单”!GPT-5仅获58分,最大缺陷是“金鱼脑”
                        编辑 | 听雨“什么是 AGI? ”这是所有科技公司都在喊的口号,却也是一个模糊得几乎无法定义的词。 OpenAI 说它要“追求 AGI”;Anthropic 宣称 Claude 是“朝向 AGI 的安全智能体”;谷歌和 Meta 则都声称自己“正在逼近 AGI”。
                    
                    10/20/2025 3:43:10 PM
                        听雨
                    GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
                        鹭羽 发自 凹非寺. 量子位 | 公众号 QbitAI在某种程度上,GPT-5可以被视作是o3.1。 该观点出自OpenAI研究副总裁Jerry Tworek的首次播客采访,而Jerry其人,正是o1模型的主导者之一。
                    
                    10/20/2025 3:42:59 PM
                        鹭羽
                    OpenAI GPT-5 被指数学成就夸大,引发科技界热议
                        近日,OpenAI 的 GPT-5在数学领域的宣称引发了广泛的争议。 Meta 的首席 AI 科学家 Yann LeCun 形容此次事件为 “自作自受”,而 Google DeepMind 的 CEO Demis Hassabis 则表示 “这太尴尬了”。 图源备注:图片由AI生成,图片授权服务商Midjourney事情的起因是 OpenAI 副总裁 Kevin Weil 在一条已被删除的推文中声称,GPT-5解决了10个之前未解的 Erdős 问题,并在11个其他问题上取得了进展。
                    
                    10/20/2025 10:17:09 AM
                        AI在线
                    OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬
                        太尴尬了。 就在周末,GPT-5又双叒带来了数学方面的新突破,一道难题被宣称解决…然鹅……很快就被发现是OpenAI的“营销过度”,小题大作,根本算不上什么突破。 友商大咖们也都不装了。
                    
                    10/20/2025 9:22:56 AM
                        
                    GPT-5破解世纪难题,竟是上网抄来的!哈萨比斯:太尴尬了
                        OpenAI团队狂吹了一波GPT-5,结果竟是闹剧一场......事情是这样的。 几天前,OpenAI科学家Sebastien Bubeck激动转发,两位研究员联手GPT-5 Pro,仅用了一个周末,破解了10个「百年悬案」——埃尔德什难题(Erdos problems)紧接着,OpenAI科学副总裁Kevin Weil等人纷纷加入,大肆宣传。 然而,真相很快浮出水面:这十道难题,早就被学界解决,并非由GPT-5独立解决,它只是通过检索网络文献给出了答案。
                    
                    10/20/2025 9:13:00 AM
                        
                    GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧
                        10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
                    
                    10/20/2025 2:00:00 AM
                        
                    GPT-5 Pro惊现「神之一手」,30分钟攻克黑洞难题!
                        OpenAI真的要放大招了! 今天,黑洞理论物理学家Alex Lupsasca官宣入职,正式成为OpenAI新成立的「科学团队」的一员。 曾经,Alex一直认为AI离科研前沿遥不可及,直到他亲眼见证了GPT-5 Pro的惊人能力——它在短短30分钟内,竟破解了困扰Alex数日的「黑洞微扰」理论难题!
                    
                    10/17/2025 5:49:11 PM
                        
                    驳“AI 泡沫论”:一场被误读的、正在进行中的产业结构性调整
                        目前流传着一种看似合理的说法:GPT-5 表现未达预期,因此 AI 泡沫正在破裂。 这个观点看似顺理成章,实则是错误的。 这个说法将四个不同维度的事情强行捆绑,硬是揉成了一个整体:(1)产品体验的设计选择;(2)应用层的投资回报;(3)基础设施投入与供应链;(4)科研进展与规模化应用。
                    
                    10/15/2025 3:15:00 AM
                        Baihai IDP
                    人类遗忘的难题解法,被GPT-5重新找出来了
                        人类遗忘的难题解法,被GPT-5 Pro重新找出来了! 这事儿聚焦于埃尔德什问题#339,这是著名数学家保罗・埃尔德什提出或转述的近千道问题之一,收录于erdosproblems.com网站。 该网站记录了每道题目的当前状态,其中约三分之一已解决,大部分仍待解。
                    
                    10/14/2025 8:54:00 AM
                        
                    马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型
                        近日,OpenAI 在马来西亚推出了全新的 ChatGPT Go 订阅服务,月费仅为38.99马币(约9.25美元),大幅降低了 AI 高级功能的使用门槛。 此次推出的 ChatGPT Go 不仅包括了最新的 GPT-5模型,还提供了丰富的功能,如图片生成、文件上传及记忆功能,极大地提升了用户的体验。 这一举措正值马来西亚 AI 用户数量在过去一年中激增的背景下进行,OpenAI 希望通过更亲民的价格吸引中端用户和学生,进而扩展用户基础。
                    
                    10/13/2025 5:31:58 PM
                        AI在线
                    大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金
                        人工智能真是日新月异。 早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。 记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获得了金牌。
                    
                    10/13/2025 1:07:00 PM
                        机器之心
                    
        资讯热榜
    
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                