英伟达与 Mistral AI 合作推出全新开放模型家族

作者：AI在线 2025-12-09 11:36

近日，英伟达宣布与大型语言模型开发商 Mistral AI 达成合作，旨在加速开发和部署一系列新的开放源模型。根据双方的合作协议，英伟达将利用其强大的平台来支持 Mistral 最新推出的模型家族 ——Mistral 3。 Mistral 3 系列被描述为开放源、多语言和多模态的，且针对英伟达的超级计算和边缘平台进行了优化。

近日，英伟达宣布与大型语言模型开发商 Mistral AI 达成合作，旨在加速开发和部署一系列新的开放源模型。根据双方的合作协议，英伟达将利用其强大的平台来支持 Mistral 最新推出的模型家族 ——Mistral 3。

Mistral 3 系列被描述为开放源、多语言和多模态的，且针对英伟达的超级计算和边缘平台进行了优化。该模型采用混合专家（MoE）架构，这种架构的特点是只有与特定任务相关的部分会被激活，从而实现更高效和更精确的部署。英伟达表示，结合其 GB200 NVL72 系统与 Mistral 的 MoE 架构，将使企业能够更高效地部署和扩展大型模型，充分利用 “先进的并行性” 和硬件优化。

Mistral 3 模型具有 410 亿个活跃参数、6750 亿个总参数以及 256K 的大上下文窗口，能够为企业 AI 工作负载提供良好的可扩展性、效率和适应性。双方还透露，该新模型将于 12 月 2 日全面上线，可在云端、数据中心及边缘设备上使用。

此次合作还延续了两家公司之前的合作基础，包括为聊天机器人和编码任务开发的 Mistral NeMo 12B 语言模型。此外，Mistral 还发布了九个小型语言模型，旨在帮助开发者在各种设备上运行 AI。这些模型设计用于在英伟达的硬件上运行，包括 Spark、RTX PC 和笔记本电脑，以及 Jetson 设备。开发者可以通过 AI 框架 Llama.cpp 和 Ollama 访问这些模型。

Mistral 3 家族对研究人员和开发者开放，这一举措被认为是帮助 “民主化” 前沿 AI 的努力。值得一提的是，英伟达还在同一周内宣布对芯片制造商 Synopsys 投资 20 亿美元，这进一步强调了公司在 AI 和计算领域的实力。

划重点：
🌟 英伟达与 Mistral AI 合作，推出开放源的 Mistral 3 模型家族，旨在提高 AI 模型的开发和部署效率。
🔍 Mistral 3 系列采用混合专家架构，具备 410 亿活跃参数和 6750 亿总参数，适用于企业 AI 应用。
💻 同时发布的九个小型语言模型支持多种硬件，推动 AI 技术的普及和应用。

Mistral AI发布Mistral 3系列开源模型：128K上下文、单A100可跑，定价对标 GPT-4o 一半

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型，包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3，覆盖从边缘设备到企业级推理的全场景需求。新模型沿用 Apache2.0开源协议，权重已同步上传至 Hugging Face 与 GitHub，允许商业免费使用。 Mistral3系列在保持前代低延迟优势的同时，将上下文长度扩展至128K，并在 MMLU、HumanEval、MT-Bench 等主流基准中与 Llama3.1同规格模型打平或小幅领先。

12/3/2025 10:01:38 AM AI在线

字节发布豆包1.5深度思考模型：多模态深度思考、延迟低

在4月17日的火山引擎 AI 创新巡展杭州站上，字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注，谭待在会上分享了该模型在多个领域的优异表现。据悉，豆包1.5模型在数学、编程、科学推理等专业领域，以及创意写作等任务中，都展现出了卓越的能力。

4/17/2025 12:01:15 PM AI在线

免费！DeepSeek R1T Chimera 正式上线 OpenRouter 平台

由TNG Technology Consulting 研发的 DeepSeek R1T Chimera 模型已正式上线 OpenRouter 平台，为全球开发者提供高效、强大的推理能力。这一全新开源模型结合了 DeepSeek R1的卓越推理能力和 V3-0324的高效性能，标志着开源 AI 技术在性能与效率平衡上的又一重大突破。以下为 AIbase 整理的最新资讯，带您深入了解这一激动人心的进展。

4/28/2025 11:00:52 AM AI在线

​英伟达与 Mistral AI 合作推出全新开放模型家族

相关资讯

Mistral AI发布Mistral 3系列开源模型：128K上下文、单A100可跑，定价对标 GPT-4o 一半

字节发布豆包1.5深度思考模型：多模态深度思考、延迟低

免费！DeepSeek R1T Chimera 正式上线 OpenRouter 平台

英伟达与 Mistral AI 合作推出全新开放模型家族