AI在线 AI在线

真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下

GPT-5真不愧是博士水平的AI! 在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。 简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。

GPT-5真不愧是博士水平的AI!

在数学教授引导下,它首次将定性的第四矩定理扩展为带有显式收敛率的定量形式。

简单来讲就是,原来的定理仅说明收敛会发生,却没有给出具体速度,而借助GPT-5,这项研究首次明确了收敛速率。

图片图片

OpenAI联合创始人Greg Brockman对此表示甚是欣慰。

图片图片

网友同样表示,真是奇迹。

图片图片

借助GPT-5解决第四矩定理的定量收敛率

上个月,OpenAI研究人员Sebastien Bubeck称,GPT-5 Pro在数分钟内解决了凸优化领域的一个开放性问题,将已知的边界值从1/L改进为1.5/L。

图片图片

受此启发,三位数学教授在Malliavin–Stein框架下开展了一项对照实验。

目标在于考察GPT-5能否突破既有成果,将定性的第四矩定理推广为带有显式收敛率的定量形式,并涵盖高斯情形与泊松情形。

首先,研究人员从以下初始提示开始:

论文2502.03596v1建立了一个定性的第四矩定理,适用于两个Wiener–Itô积分(阶数分别为p和q)的和,其中p和q的奇偶性不同。

基于Malliavin–Stein方法(具体可参见1203.4147v3),你能否推导出一个针对总变差距离的定量版本,其收敛速率仅依赖于该和的第四阶累积量?

图片图片

(具体分析步骤已省略,感兴趣的读者可阅读原论文。)

第一次互动效果非常显著,GPT-5给出了总体正确的结论,并采用了恰当的工具和方法。

然而,它在推理过程中出现了错误,导致图片的表达式不正确,如果不加以纠正,可能会使整个证明失效。

发现这一点后,研究者随后提出了新的问题:

你能检查一下你给出的图片公式,并提供详细推导吗?

GPT-5照做了,提供了所需的详细信息。然而,公式依然不正确,附带的解释也有误。随后,研究人员更准确地指出了其中的错误:

我认为你在声称图片时有误。为什么会是这样呢?

GPT-5最终承认该说法是错误的。但更重要的是,它理解了错误的来源。随后,继续给出了正确的推理过程和公式。

图片图片

随后,应研究者的要求,GPT-5将最终结果整理成论文的格式,包括引言、主要定理的陈述、完整且正确的证明过程,以及参考文献。具体提示语如下:

请将此整理成一篇可投稿的研究论文,遵循我的风格(见附带论文0705.0570v4):

  • 以引言开始,提供一定的背景信息;
  • 接着陈述主要结果,并给出非常详细的证明,确保每一步都完整;
  • 最后附上完整的参考文献。

最终文档应为一个可编译的LaTeX文件。

最后,研究人员还让它增加一个结论部分,讨论该结果在未来研究中可能的拓展方向。

你能添加一个“结论与展望”部分吗?在其中总结主要内容,并提出未来研究可能的方向或拓展思路。

GPT-5依旧很听话,提出这个方法甚至可以推广到非高斯框架中。

扩展到泊松情形

基于这一建议,研究人员决定继续深入研究,尝试将其推广到泊松情形。

由于这时研究者发现上下文窗口已经相当长,可能会影响其性能,于是他们开启了一个新对话,并使用了如下提示:

这里有一篇论文(2502.03596v1),证明了两个奇偶性不同的Wiener–Itô积分之和的第四矩定理。我希望你能将其推广到泊松情形,使用论文1707.01889v2中包含的思路。

图片图片

在这个新对话中,GPT-5很快就识别出了泊松情形与高斯情形的结构性差异,提出:当X和Y是不同阶的泊松积分时,混合期望图片不一定为零。

但同时,它也完全忽略了一个重要事实,就是即使在泊松情形下,也仍然有图片

随后,研究者试图通过提问来引导GPT-5进入正轨。

在论文1707.01889v2中,难道没有任何内容可以表明图片总是非负的吗?

但是,由于研究者问的问题是开放性的,这还不足以触发正确的思路。GPT-5非常自信地回答道:“没有”,随后给出了一个不太令人信服的解释。

然而,一旦研究者指出具体信息:

那 (2.4) 呢?

GPT-5就能立刻将非负性考虑进去,并在研究者提出问题后,重新表述了定理。

图片

One More Thing

有趣的是,作者最开始想将GPT-5列为共同作者提交论文,几个小时后,arXiv告诉他们,政策禁止将AI列为作者。

最后,他们只能提交作者列表中不含GPT-5的论文。

论文链接:https://arxiv.org/pdf/2509.03065v1

参考链接:

[1]https://x.com/gdb/status/1964474141295464675

[2]https://www.linkedin.com/posts/ivan-nourdin-61698a131_mathematical-research-with-gpt-5-activity-7368607852220805120-qLJA/?utm_source=share&utm_medium=member_desktop&rcm=ACoAAAzTDtoBh8KeVDRAqwRd0mUwfVpwfyirm80

[3]https://arxiv.org/abs/2502.03596[4]https://arxiv.org/pdf/1707.01889

相关资讯

GPT-5遭用户吐槽 “垃圾”:缩放定律失效,AGI梦渐行渐远?

2025 年 8 月,OpenAI 终于推出备受期待的 GPT-5,但其表现并未如市场预期般带来 “革命性突破”,反而让 “AI 进步失速”“缩放定律失效” 的讨论再度升温。 GPT-5 实测:亮点有限,失望声四起YouTube播主 Mrwhosetheboss 的实测显示,GPT-5 并非全面领先:在创建象棋游戏时优于 . GPT-4o-mini-high,撰写视频脚本时强于 GPT-4o,且能根据任务自动匹配最优模型;但在生成 YouTube .
8/18/2025 9:57:30 AM

OpenAI推全新语音转录模型gpt-4o-transcribe,语音转文字准确率飙升

继此前在语音 AI 领域引发一些关注后,OpenAI并未停下在该领域探索的脚步,现在这家ChatGPT的创造者再次发力,推出了三款全新的自主研发语音模型,分别为:gpt-4o-transcribe, gpt-4o-mini-transcribe and gpt-4o-mini-tts。 其中最受瞩目的当属gpt-4o-transcribe。 目前,这些新模型已经率先通过应用程序接口(API)向第三方开发者开放,开发者们可以利用它们打造更智能的应用程序。
3/21/2025 9:01:00 AM
AI在线

OpenAI发布GPT-4.1系列模型:能力全面超越前代

4月15日,OpenAI 在其官方博客宣布正式发布 GPT-4.1系列模型,涵盖 GPT-4.1、GPT-4.1mini 和 GPT-4.1nano 三款子模型。 该系列在编程能力、指令理解及长文本处理等方面实现重大突破,全面超越前代 GPT-4o 及 GPT-4o mini。 其中,模型上下文窗口扩展至100万 tokens,知识库更新至2024年6月,为复杂任务提供更强支持。
4/15/2025 9:00:45 AM
AI在线
  • 1