AI在线 AI在线

GPT-5

OpenAI以为GPT-5搞出了数学大新闻,结果…哈萨比斯都觉得尴尬

太尴尬了。 就在周末,GPT-5又双叒带来了数学方面的新突破,一道难题被宣称解决…然鹅……很快就被发现是OpenAI的“营销过度”,小题大作,根本算不上什么突破。 友商大咖们也都不装了。
10/20/2025 9:22:56 AM

GPT-5破解世纪难题,竟是上网抄来的!哈萨比斯:太尴尬了

OpenAI团队狂吹了一波GPT-5,结果竟是闹剧一场......事情是这样的。 几天前,OpenAI科学家Sebastien Bubeck激动转发,两位研究员联手GPT-5 Pro,仅用了一个周末,破解了10个「百年悬案」——埃尔德什难题(Erdos problems)紧接着,OpenAI科学副总裁Kevin Weil等人纷纷加入,大肆宣传。 然而,真相很快浮出水面:这十道难题,早就被学界解决,并非由GPT-5独立解决,它只是通过检索网络文献给出了答案。
10/20/2025 9:13:00 AM

GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧

10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
10/20/2025 2:00:00 AM

GPT-5 Pro惊现「神之一手」,30分钟攻克黑洞难题!

OpenAI真的要放大招了! 今天,黑洞理论物理学家Alex Lupsasca官宣入职,正式成为OpenAI新成立的「科学团队」的一员。 曾经,Alex一直认为AI离科研前沿遥不可及,直到他亲眼见证了GPT-5 Pro的惊人能力——它在短短30分钟内,竟破解了困扰Alex数日的「黑洞微扰」理论难题!
10/17/2025 5:49:11 PM

驳“AI 泡沫论”:一场被误读的、正在进行中的产业结构性调整

目前流传着一种看似合理的说法:GPT-5 表现未达预期,因此 AI 泡沫正在破裂。 这个观点看似顺理成章,实则是错误的。 这个说法将四个不同维度的事情强行捆绑,硬是揉成了一个整体:(1)产品体验的设计选择;(2)应用层的投资回报;(3)基础设施投入与供应链;(4)科研进展与规模化应用。
10/15/2025 3:15:00 AM
Baihai IDP

人类遗忘的难题解法,被GPT-5重新找出来了

人类遗忘的难题解法,被GPT-5 Pro重新找出来了! 这事儿聚焦于埃尔德什问题#339,这是著名数学家保罗・埃尔德什提出或转述的近千道问题之一,收录于erdosproblems.com网站。 该网站记录了每道题目的当前状态,其中约三分之一已解决,大部分仍待解。
10/14/2025 8:54:00 AM

马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型

近日,OpenAI 在马来西亚推出了全新的 ChatGPT Go 订阅服务,月费仅为38.99马币(约9.25美元),大幅降低了 AI 高级功能的使用门槛。 此次推出的 ChatGPT Go 不仅包括了最新的 GPT-5模型,还提供了丰富的功能,如图片生成、文件上传及记忆功能,极大地提升了用户的体验。 这一举措正值马来西亚 AI 用户数量在过去一年中激增的背景下进行,OpenAI 希望通过更亲民的价格吸引中端用户和学生,进而扩展用户基础。
10/13/2025 5:31:58 PM
AI在线

大模型追逐星辰大海,GPT和Gemini国际天文奥赛夺金

人工智能真是日新月异。 早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。 记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获得了金牌。
10/13/2025 1:07:00 PM
机器之心

Open Library 任务为何难倒 GPT-5?SWE-Bench Pro 揭示 AI 编程智能体的真实边界

大家好,我是肆〇柒。 今天要与大家分享的是一项由 Scale AI 研究团队最新发布的重磅研究成果——SWE-Bench Pro。 这项研究增强了我们对 AI 编程智能体能力的认知,它不再满足于测试模型能否完成简单的代码修改,而是直面真实企业环境中那些需要修改数百行代码、跨越多个文件的复杂任务。
10/13/2025 9:33:19 AM
肆零柒

快手KAT-Dev-72B-Exp震撼发布!74.6%解决率碾压GPT-5,编程Agent新王者

你有没有想过,什么时候一个国产开源模型能在编程领域真正"碾压"GPT-5? 这个问题的答案,快手给出了。 昨天看到快手开源KAT-Dev-72B-Exp的消息时,我第一反应是——这数据是不是搞错了?
10/13/2025 12:00:05 AM
阿丸笔记

OpenAI新研究称GPT-5为迄今“政治偏见最少”的AI模型

根据 OpenAI 的最新研究,刚刚发布的 GPT-5模型在政治偏见方面的表现远远优于以往的同类产品。 这一研究成果由 OpenAI 团队向 Axios 披露,标志着 AI 模型在偏见控制方面的重要进展。 图源备注:图片由AI生成,图片授权服务商Midjourney长期以来,公众和政界人士对 AI 系统的偏见问题表示关注,呼吁提高透明度,并确保这些模型不受偏见的影响。
10/12/2025 9:24:51 AM
AI在线

GPT-5偏见测试结果公布:500问验证客观性飞跃,情感化问题仍是挑战

OpenAI最新向Axios披露的研究成果显示,刚刚发布的GPT-5模型在政治偏见控制方面取得突破性进展,偏见水平较前代产品降低30%。 长期以来,AI系统的偏见问题一直是公众和政界关注的焦点。 今年7月,美国政府发布行政命令,要求政府使用的AI系统须剔除"觉醒型"特征,避免政治或意识形态偏见,但具体合规标准仍不明确。
10/12/2025 9:24:09 AM
AI在线

刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API

OpenAI 今年的开发者大会(OpenAI DevDay 2025)正在进行中。 Keynote 一开场,山姆・奥特曼便分享了 OpenAI 这两年取得的成绩:400 万开发者、8 亿周活 ChatGPT 用户、API 每分钟 60 亿 token 消耗量。 更重要的是,OpenAI 在今年的开发者大会上可真是发布了不少东西,简单总结起来包括:AgentKit、Codex 正式版、ChatGPT 内置应用与 Apps SDK、gpt-realtime-mini、gpt-image-1-mini、Sora 2 API、GPT-5 pro API。
10/7/2025 10:16:00 AM
机器之心

OpenAI被指欺诈,用户输入可能会被秘密路由到新模型GPT-5-Chat-Safety

今年 8 月,GPT-5 发布,其在多个任务和基准上都表现卓越,但几乎和人世间的所有事物一样,并不是所有人都满意。 尤其是 GPT-5 发布后「OpenAI 移除 ChatGPT 中模型选择器」的做法更是备受诟病(尤其是移除了情感表达更佳的 GPT-4o),甚至引发了诸多用户的「网上请愿」,详见我们的报道《用户痛批 GPT-5,哭诉「还我 GPT-4o」,奥特曼妥协了》。 一位用户在 Reddit 愤怒发帖表示 OpenAI 的做法让他直接取消了订阅,并称「OpenAI 失去了我所有的尊重」。
9/28/2025 3:14:00 PM
机器之心

OpenAI CEO 预测:2030 年前AI可能接管 30%-40% 工作

在最近的一次采访中,OpenAI 的首席执行官萨姆・奥尔特曼分享了关于未来人工智能的见解。 他预测,通用人工智能(AGI)将在2030年前到来,并将会接管人类经济社会中30% 至40% 的工作。 这一预测引发了人们对未来就业市场变化的广泛讨论。
9/28/2025 9:21:11 AM
AI在线

OpenAI 最新基准测试显示 GPT-5 在多个行业中逐渐逼近人类专家

近日,OpenAI 推出了一项新的基准测试,旨在评估其人工智能模型在各行业与人类专业人士的表现差异。 这项名为 GDPval 的测试,是 OpenAI 对其人工智能系统在经济价值工作中是否能超越人类的重要探索。 根据 OpenAI 的说法,GPT-5模型与 Anthropic 的 Claude Opus4.1模型在某些领域的工作质量已经接近行业专家。
9/26/2025 3:01:13 PM
AI在线

GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题

GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。
9/26/2025 9:24:46 AM

ChatGPT新功能Pulse,GPT-5主动给你推消息,大家玩得停不下来

这是 OpenAI CEO 山姆・奥特曼迄今为止最喜欢的 ChatGPT 功能。 本周五凌晨,OpenAI 宣布推出 ChatGPT 新功能「Pulse」的预览版,首先向 Pro 订阅用户开放。 ChatGPT 现在会每天晚上主动进行研究,根据你每天的聊天记录、反馈以及日历等关联应用提供个性化更新。
9/26/2025 9:09:32 AM