GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

作者： 2025-10-20 09:13

OpenAI团队狂吹了一波GPT-5，结果竟是闹剧一场......事情是这样的。几天前，OpenAI科学家Sebastien Bubeck激动转发，两位研究员联手GPT-5 Pro，仅用了一个周末，破解了10个「百年悬案」——埃尔德什难题（Erdos problems）紧接着，OpenAI科学副总裁Kevin Weil等人纷纷加入，大肆宣传。然而，真相很快浮出水面：这十道难题，早就被学界解决，并非由GPT-5独立解决，它只是通过检索网络文献给出了答案。

OpenAI团队狂吹了一波GPT-5，结果竟是闹剧一场......

事情是这样的。

几天前，OpenAI科学家Sebastien Bubeck激动转发，两位研究员联手GPT-5 Pro，仅用了一个周末，破解了10个「百年悬案」——

埃尔德什难题（Erdos problems）

紧接着，OpenAI科学副总裁Kevin Weil等人纷纷加入，大肆宣传。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

然而，真相很快浮出水面：

这十道难题，早就被学界解决，并非由GPT-5独立解决，它只是通过检索网络文献给出了答案。

消息一出，舆论哗然。就连谷歌DeepMind CEO Demis Hassabis也忍不住评价，「这也太尬了」。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

还有，图灵奖得主LeCun闪现X上嘲讽，「简直就是，搬起石头（GPT）砸自己的脚」。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

GPT-5，一场闹剧

这场闹剧，可以说OpenAI团队的自导自演。

研究人员Mark Sellke和Mehtaab Sawhney发文很明确，并没有说GPT-5破解了难题。

他们原帖是，通过GPT-5数千条查询后，找到了十个被列为Erdos问题的解。

当时的结果是，问题223、339、494、515、621、822、883、903、1043、1079都得到了解决，同时在另外 11 个问题上也取得了部分进展。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

另一方面，这十道难题早已有了答案，只不过网站管理者并未更新。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

传送门：https://www.erdosproblems.com/

英国皇家学会研究院Thomas Bloom，网站erdosproblems.com运营者，却对此并不知情。

网站上，「开放」状态仅代表他个人并不了解该问题的解法，而不是表示该问题在科学界尚未被解决。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

总言之，两个误会，凑在了一起，让人们产生了「幻觉」——GPT-5攻克了埃尔德什难题。

一方面，难题并非未解决，只是网站维护者不清楚；另一方面，GPT-5仅通过搜索文献完成，并非自己解决。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

Sebastien Bubeck尴尬回复道，GPT-5只是在文献中找到了解决方案，仅此而已。

即便如此，已经非常高效了，因为我知道搜索文献是有多么地困难。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

网友热议，还需同行评审

评论区的大佬们，正坐在前排吃瓜。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

通过这场争论，开发者Matt Mazur认真地表示，所有人必须谨慎地对待任何关于AI发现新科学/数学成果的说法」。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

Hyperbolic创始人Yuchen Jin称，「关于AI发现科学/数学的新发现，需要更多的同行评审」。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

不过也有人认为，这对GPT-5来说并不尴尬，毕竟它在文献检索方面表现还是很出色的。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

几天前，陶哲轩也曾发文表示，我越来越觉得，眼下AI要在数学领域真正发挥作用，关键可能不在用最牛的模型去攻克最难的题目——

当然偶尔会有这种案例，特别是当人们砸了大量算力和专家精力进去的时候。

但更靠谱的路线，反而是用中等水平的AI工具，去帮我们搞定那些研究里绕不开的琐碎活、体力活。

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

无论何时，对AI原创发现保持审慎都是第一位的，但这并不妨碍AI辅助科研成为未来的必经之路。

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

2025 年 8 月，OpenAI 终于推出备受期待的 GPT-5，但其表现并未如市场预期般带来 “革命性突破”，反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测：亮点有限，失望声四起YouTube播主 Mrwhosetheboss 的实测显示，GPT-5 并非全面领先：在创建象棋游戏时优于 . GPT-4o-mini-high，撰写视频脚本时强于 GPT-4o，且能根据任务自动匹配最优模型；但在生成 YouTube .

8/18/2025 9:57:30 AM

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后，OpenAI并未停下在该领域探索的脚步，现在这家ChatGPT的创造者再次发力，推出了三款全新的自主研发语音模型，分别为:gpt-4o-transcribe， gpt-4o-mini-transcribe and gpt-4o-mini-tts。其中最受瞩目的当属gpt-4o-transcribe。目前，这些新模型已经率先通过应用程序接口（API）向第三方开发者开放，开发者们可以利用它们打造更智能的应用程序。

3/21/2025 9:01:00 AM AI在线

OpenAI发布GPT-4.1系列模型：能力全面超越前代

4月15日，OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型，涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。该系列在编程能力、指令理解及长文本处理等方面实现重大突破，全面超越前代 GPT-4o 及 GPT-4o mini。其中，模型上下文窗口扩展至100万 tokens，知识库更新至2024年6月，为复杂任务提供更强支持。

4/15/2025 9:00:45 AM AI在线

GPT-5破解世纪难题，竟是上网抄来的！哈萨比斯：太尴尬了

GPT-5，一场闹剧

网友热议，还需同行评审

相关资讯

GPT-5遭用户吐槽 “垃圾”：缩放定律失效，AGI梦渐行渐远？

OpenAI推全新语音转录模型gpt-4o-transcribe，语音转文字准确率飙升

OpenAI发布GPT-4.1系列模型：能力全面超越前代