英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列，吞吐量达上一代 4 倍

作者：汪淼 2025-12-15 10:27

AI在线 12 月 15 日消息，英伟达今日发布 Nemotron 3 开源模型系列，包括 Nano、Super 和 Ultra 三种规格，宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。 Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家（MoE）架构，帮助开发者大规模构建和部署可靠的多智能体系统。英伟达表示，随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统，开发者面临着越来越多的挑战，包括通信开销、上下文漂移和高昂的推理成本。

AI在线 12 月 15 日消息，英伟达今日发布 Nemotron 3 开源模型系列，包括 Nano、Super 和 Ultra 三种规格，宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。

Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家（MoE）架构，帮助开发者大规模构建和部署可靠的多智能体系统。

英伟达表示，随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统，开发者面临着越来越多的挑战，包括通信开销、上下文漂移和高昂的推理成本。此外，开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron 3 直接应对这些挑战，提供客户所需的表现力和开放性，以构建专门化的智能体 AI。

早期采用者包括安永、思科、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys、Zoom、Accenture、Cadence 和 Cursor，正在将 Nemotron 家族的模型集成到 AI 工作流中，以推动制造业、网络安全、软件开发、媒体、通信等行业的应用。

开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 智能体，并加速从原型到企业部署的创新。

AI在线从英伟达官方获悉，Nemotron 3 的 MoE 模型系列包括三种规格：

Nemotron 3 Nano，一款小型的 30-billion-parameter 模型，每次激活最多 30 亿参数，适用于针对性强、高度高效的任务。
Nemotron 3 Super，一款高准确性的推理模型，拥有约 1000 亿参数，每个 token 最多激活 100 亿参数，适用于多智能体应用。
Nemotron 3 Ultra 是一款拥有约 5000 亿参数和每 token 最多 500 亿活跃参数的大型推理引擎，适用于复杂的 AI 应用。

Nemotron 3 Nano 宣称是目前计算成本效率最高的模型，专为软件调试、内容摘要、AI 助手工作流程和低推理成本的信息检索等任务进行优化。该模型相比 Nemotron 2 Nano 实现了高达 4 倍的 token 处理吞吐量，并将推理 token 生成减少了 60%，显著降低了推理成本。凭借 100 万 token 的上下文窗口，Nemotron 3 Nano 能记住更多信息，使其在处理长时间、多步骤任务时更加准确且具备更强的信息关联能力。

Nemotron 3 Nano 今日已在 Hugging Face 上线，Nemotron 3 Super 和 Ultra 预计将在 2026 年上半年推出。AI在线附开源地址：

https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达最新发布 Llama Nemotron 系列开放推理 AI 模型，支持“智能体 AI”系统，可独立推理、规划并执行多步骤任务，适用于机器人、自动化和决策优化等场景，显著降低推理成本，助力企业实现 AI 自主化升级。

3/20/2025 11:17:47 AM 故渊

英伟达新开源模型 Llama-Nemotron 震撼发布，推理性能超越 DeepSeek-R1

近日，英伟达正式推出了其最新开源模型系列 ——Llama-Nemotron，该系列模型不仅在推能力上超越了 DeepSeek-R1，更是在内存效率和吞吐量上实现了显著提升。根据最新发布的技术报告，Llama-Nemotron 的训练过程与众不同，采用了合成数据监督微调与强化学习的方法，以全方位提升模型的推理能力。 Llama-Nemotron 系列模型包括 LN-Nano8B、LN-Super49B 和 LN-Ultra253B。

5/7/2025 10:01:04 AM AI在线

英伟达发布“行业最高效”Nemotron 3 开源 AI 模型系列，吞吐量达上一代 4 倍

相关资讯

超越 DeepSeek-R1，英伟达开源模型 Llama-Nemotron 登顶

英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

英伟达新开源模型 Llama-Nemotron 震撼发布，推理性能超越 DeepSeek-R1