AI在线 AI在线

英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理

AI在线 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。 该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。 通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。

AI在线 7 月 20 日消息,英伟达今日推出了全新推理模型套件 OpenReasoning-Nemotron。该套件包含四个基于 Qwen-2.5 微调的模型,参数规模分别为 1.5B、7B、14B 和 32B,全部源自 6710 亿参数的 DeepSeek R1 0528 大模型。通过“蒸馏”这一过程,英伟达成功将这一超大规模模型压缩成更轻量的推理模型,降低了部署门槛,使得即使在标准游戏电脑上也能进行高级推理实验,避免了高昂的 GPU 与云计算成本。

英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理

据AI在线了解,英伟达此次模型的核心优势并非在于训练手段的复杂创新,而是依托强大的数据支撑。公司利用 NeMo Skills 生成了 500 万个涵盖数学、科学与编程的解答数据集,并通过纯监督学习方式对模型进行微调。经测试,32B 模型在 AIME24 数学竞赛中获得 89.2 分,在 HMMT 2 月赛中达到 73.8 分,甚至最小的 1.5B 模型也分别拿下 55.5 和 31.5 分,展现出良好的推理与解题能力。

英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理

英伟达推出 OpenReasoning-Nemotron 推理模型,普通游戏电脑也能玩转高级推理

英伟达将 OpenReasoning-Nemotron 定位为科研探索的有力工具,四个模型的完整检查点将在 Hugging Face 开放下载,便于研究人员基于此进行强化学习等进一步实验,或针对特定任务定制优化。同时,模型支持“GenSelect 模式”,即每个问题可生成多种解答版本,通过筛选最优解来提升准确率。在该模式下,32B 模型在多项数学与编程基准测试中已达到甚至超越 OpenAI o3-high 的表现。

值得一提的是,英伟达此次模型训练全程未引入强化学习,仅采用监督微调,为社区提供了干净且处于技术前沿的起点,便于未来开展强化学习相关研究。对于拥有高性能游戏 GPU 的玩家及个人开发者而言,这套模型让本地运行接近业界最先进水平的推理模型成为现实。

相关资讯

消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟

由于美国当局对英伟达H20芯片的出口限制,DeepSeek R2 AI模型的开发进程被迫延迟。这不仅影响了新模型的研发,也对现有R1模型的实际部署造成困扰。#AI芯片# #DeepSeek#
6/27/2025 8:09:47 AM
漾仔

英伟达推进合作,旨在加速人工智能代理在医疗保健研究中的应用

这些合作基于英伟达的“人工智能工厂”概念,即把原始数据转化为可操作的人工智能模型或“tokens”的数据中心,这些模型或“tokens”可作为各种应用的智能工具。 这些联盟还旨在开发能力更强的代理,即具有决策能力的自主行动数字机器人,这些机器人通常以目标或目的为指导。 代理系统可以规划、推理和执行多步骤的任务,适应不断变化的环境和背景,超越回答问题,发起行动。
1/14/2025 2:37:35 PM
PAUL GILLIN

投行称英伟达市值将冲击6万亿美元 AI之外还有机器人万亿市场

在AI浪潮的持续驱动下,英伟达股价近年屡创新高且涨势未止。 投行Loop Capital最新研判显示,其市值最终或冲至6万亿美元。 当前英伟达市值约为3.6万亿美元,若达成这一目标,意味着仍有65%上涨空间。
6/30/2025 1:00:00 AM
小刀
  • 1