AI在线 AI在线

字节跳动发布 Seed Prover1.5:推动形式化数学推理的新进展

近日,字节跳动 Seed 团队推出了其最新的形式化数学推理模型 Seed Prover1.5,标志着在数学推理领域的一次重要突破。 此次模型的推出,得益于对大规模 Agentic 强化学习的深入探索,使得其在推理能力和效率方面都取得了显著提升。 在参加2025年国际数学奥林匹克(IMO)比赛时,Seed Prover 展现了其强大的性能。

近日,字节跳动 Seed 团队推出了其最新的形式化数学推理模型 Seed Prover1.5,标志着在数学推理领域的一次重要突破。此次模型的推出,得益于对大规模 Agentic 强化学习的深入探索,使得其在推理能力和效率方面都取得了显著提升。

在参加2025年国际数学奥林匹克(IMO)比赛时,Seed Prover 展现了其强大的性能。在短短三天内,该模型成功解决了六道题目中的四道,并对其中一道进行了部分证明,最终获得了官方认证的银牌成绩。相比之下,Seed Prover1.5在16.5小时内针对 IMO2025的前五道题目生成了完整的可编译验证的 Lean 证明代码,达到金牌分数线的标准。

QQ20251224-141739.png

更值得注意的是,Seed Prover1.5在2025年普特南数学竞赛中的表现同样出色,仅用时9小时便完成了12道题目中的11道生成可编译验证的 Lean 代码。这一成绩刷新了形式化数学推理模型在多个评测集上的最佳表现,特别是在包含硕士和博士生数学难度的评估集上,分别解决了80% 和33% 的问题。

Seed Prover1.5的创新之处在于其全新的 Agentic Prover 架构,这一架构将自然语言推理与形式化证明的优势相结合。与以往的形式化证明器不同,Seed Prover1.5能够在证明过程中灵活调用多种工具,例如主动检索庞大的数学库 Mathlib 和执行 Python 代码来辅助验证。通过增量式引理验证,该模型将复杂问题拆解为若干引理,逐步构建形式化证明。

此外,Seed Prover1.5还引入了 Sketch Model,该模型模拟了人类数学家的解决思路,将自然语言证明转化为高层的证明框架,从而大大降低了复杂定理证明的难度。通过这种 “分而治之” 的策略,Seed Prover1.5能够有效避免生成长文本时的错误累积。

技术报告:

https://arxiv.org/abs/2512.17260

Lean 证明代码:

https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip

相关资讯

字节 Seed 新模型问世:数学竞赛金牌实力爆表,AI 推理迈入新阶段!

字节 Seed 新模型问世:数学竞赛金牌实力爆表,AI 推理迈入新阶段!

近日,字节跳动旗下的 Seed AI 团队发布了一款名为 Seed Prover1.5的数学推理模型,该模型在国际数学奥林匹克(IMO)比赛中表现卓越,成功获得金牌,标志着人工智能在数学领域的又一突破。 Seed Prover1.5采用了 Scaling Law 理论,并在16.5小时内解决了 IMO2025的前五道题,仅失一题,最终以35分的成绩达到了金牌标准。 这一成绩与谷歌 Gemini 并驾齐驱,而字节之前的模型在当时需用三天才完成四道题,最终仅获得银牌。
12/25/2025 5:17:25 PM AI在线
​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

​字节跳动推出的AI视频生成模型 Seedance 1.0悄然超越谷歌 Veo 3

在近期的人工智能视频生成领域,字节跳动(TikTok 的母公司)悄然发布了一款名为 Seedance1.0的新模型,该模型在独立的评测中已经超越了谷歌最新推出的 Veo3。 Veo3以其音频合成和电影级工具而受到广泛关注,但 Seedance1.0的技术实力却令人刮目相看,成为视频生成的领头羊。 Seedance1.0的研究论文中详细介绍了该模型的创新之处。
6/18/2025 6:01:46 PM AI在线
字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元

字节跳动Seaweed APT2震撼发布!实时互动AI视频生成,解锁3D虚拟世界新纪元

近日,字节跳动推出了一款革命性的AI视频生成模型Seaweed APT2,其在实时视频流生成、互动相机控制及虚拟人类生成方面的突破引发了业界热议。 这款模型以其高效的性能和创新的交互特性,被誉为“通往虚拟全息甲板(HoloDeck)的重要一步”。 Seaweed APT2:实时视频生成新标杆Seaweed APT2是字节跳动Seed团队开发的一款8亿参数的生成式AI模型,专为实时交互视频生成设计。
6/16/2025 3:01:33 PM AI在线