数学推理新标杆！DeepSeek-Prover-V2 实现数学证明的飞跃

作者：AI在线 2025-05-01 10:00

在人工智能领域，最近一项重磅技术发布引发广泛关注 ——DeepSeek-Prover-V2。这一模型不仅在推理性能上取得了显著提升，还被誉为通向人工通用智能（AGI）的关键一步。 DeepSeek-Prover-V2在推理能力和训练效率上都进行了革命性的创新，给数学推理研究带来了新的希望。

在人工智能领域，最近一项重磅技术发布引发广泛关注 ——DeepSeek-Prover-V2。这一模型不仅在推理性能上取得了显著提升，还被誉为通向人工通用智能（AGI）的关键一步。DeepSeek-Prover-V2在推理能力和训练效率上都进行了革命性的创新，给数学推理研究带来了新的希望。

DeepSeek-Prover-V2提供了两种不同规模的模型:671B 和7B 参数。特别是671B 参数的版本，其推理性能在 DeepSeek-V3-Base 的基础上得到了显著增强，适用于更复杂的数学问题。而7B 版本则基于 DeepSeek-Prover-V1.5-Base 构建，支持高达32K 的上下文长度，能够处理更为复杂的推理任务。

DeepSeek-Prover-V2的核心在于其训练方法 —— 递归与强化学习的结合。该模型能够将复杂的数学定理拆解为一系列子目标，并通过智能算法选择最优解。在冷启动阶段，DeepSeek-V3会首先提示模型将复杂问题分解为可管理的小目标，随后利用强化学习整合这些小目标的证明，从而形成一个完整的思维链。

该技术不仅提高了数学证明的效率，还揭示了 AI “黑盒” 行为的内在逻辑。通过优化算法，DeepSeek-Prover-V2能够在推理过程中实现更快的计算速度和更高的智能性。这种创新方法预计将推动 AI 领域的重大突破，使得未来的 AI 能够处理更为复杂的数学问题，甚至有可能在几年内达到人类无法理解的高级数学水平。

DeepSeek-Prover-V2还建立了名为 ProverBench 的基准数据集，包含325道题目。其中包括来自 AIME 竞赛的数论和代数题目，以及精选的教科书例题。这一数据集不仅评估高中竞赛和本科阶段的数学水平，更为数学推理的研究提供了丰富的素材。

https://github.com/deepseek-ai/DeepSeek-Prover-V2/tree/main

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

近日，由普林斯顿大学牵头，联合清华大学、北京大学、上海交通大学、斯坦福大学，以及英伟达、亚马逊、Meta FAIR 等多家顶尖机构的研究者共同推出了新一代开源数学定理证明模型——Goedel-Prover-V2。该项目的 32B 旗舰模型在多个自动数学定理证明的主要基准测试上均大幅超过之前的最先进开源模型 DeepSeek-Prover-V2-671B；而 8B 小尺寸模型在特定基准上，性能表现与 DeepSeek-Prover-V2-671B 持平，展示了其在效率和能力上的新突破。项目主页：模型下载：性能新高：其 32B 旗舰模型在 MiniF2F 测试中，Pass@32 （每道测试题目尝试 32 次；pass 数越小，计算开销越小）的正确率相较于之前的 SOTA 模型 DeepSeek-Prover-V2-671B 提升了 8.0%。

7/17/2025 1:14:00 PM 机器之心

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索，显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展，正前所未有地交织在一起。前段时间，著名数学家陶哲轩在牛津数学公开讲座中做了主题为「AI 在科学和数学中的潜力」的主题分享。他指出，将 AI 整合到数学领域将使形式化证明的编写速度超过人类证明（人类证明容易出错）。这将成为一个关键转折点，意味着形式化证明的使用将不仅限于验证现有的证明，还将用于创造新的数学知识。这将通过广泛的人类数学家与 AI 数学家之间的协作来实现。我们将迎来一个

8/18/2024 3:09:00 PM 机器之心

开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude

【AIbase 报道】近日，一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型（LLM），试图在拥挤的开源AI赛道中突围。不同于传统的参数堆叠策略，这家由前谷歌工程师创立的公司，押注“机器直觉”与自我改进的推理能力，打造出真正能“边用边学”的AI模型。模型不仅回答问题，更学习“如何回答问题”Cogito v2系列包括四个模型，参数规模从 70B 到671B 不等，分为密集模型（Dense）和专家混合模型（MoE），均已在 Hugging Face、Together AI 等平台开放使用。

8/1/2025 10:42:09 AM AI在线

数学推理新标杆！DeepSeek-Prover-V2 实现数学证明的飞跃

相关资讯

普林斯顿团队领衔发布最强开源数学定理证明模型：32B性能大幅超越前代SOTA DeepSeek 671B

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

开源AI黑马突围!Cogito v2用机器直觉挑战DeepSeek与Claude