AI在线 AI在线

​英伟达与 Mistral AI 合作推出全新开放模型家族

近日,英伟达宣布与大型语言模型开发商 Mistral AI 达成合作,旨在加速开发和部署一系列新的开放源模型。 根据双方的合作协议,英伟达将利用其强大的平台来支持 Mistral 最新推出的模型家族 ——Mistral 3。 Mistral 3 系列被描述为开放源、多语言和多模态的,且针对英伟达的超级计算和边缘平台进行了优化。

近日,英伟达宣布与大型语言模型开发商 Mistral AI 达成合作,旨在加速开发和部署一系列新的开放源模型。根据双方的合作协议,英伟达将利用其强大的平台来支持 Mistral 最新推出的模型家族 ——Mistral 3。

Mistral 3 系列被描述为开放源、多语言和多模态的,且针对英伟达的超级计算和边缘平台进行了优化。该模型采用混合专家(MoE)架构,这种架构的特点是只有与特定任务相关的部分会被激活,从而实现更高效和更精确的部署。英伟达表示,结合其 GB200 NVL72 系统与 Mistral 的 MoE 架构,将使企业能够更高效地部署和扩展大型模型,充分利用 “先进的并行性” 和硬件优化。

Mistral 3 模型具有 410 亿个活跃参数、6750 亿个总参数以及 256K 的大上下文窗口,能够为企业 AI 工作负载提供良好的可扩展性、效率和适应性。双方还透露,该新模型将于 12 月 2 日全面上线,可在云端、数据中心及边缘设备上使用。

此次合作还延续了两家公司之前的合作基础,包括为聊天机器人和编码任务开发的 Mistral NeMo 12B 语言模型。此外,Mistral 还发布了九个小型语言模型,旨在帮助开发者在各种设备上运行 AI。这些模型设计用于在英伟达的硬件上运行,包括 Spark、RTX PC 和笔记本电脑,以及 Jetson 设备。开发者可以通过 AI 框架 Llama.cpp 和 Ollama 访问这些模型。

Mistral 3 家族对研究人员和开发者开放,这一举措被认为是帮助 “民主化” 前沿 AI 的努力。值得一提的是,英伟达还在同一周内宣布对芯片制造商 Synopsys 投资 20 亿美元,这进一步强调了公司在 AI 和计算领域的实力。

划重点:

🌟 英伟达与 Mistral AI 合作,推出开放源的 Mistral 3 模型家族,旨在提高 AI 模型的开发和部署效率。

🔍 Mistral 3 系列采用混合专家架构,具备 410 亿活跃参数和 6750 亿总参数,适用于企业 AI 应用。

💻 同时发布的九个小型语言模型支持多种硬件,推动 AI 技术的普及和应用。

相关资讯

Mistral AI发布Mistral 3系列开源模型:128K上下文、单A100可跑,定价对标 GPT-4o 一半

法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景需求。 新模型沿用 Apache2.0开源协议,权重已同步上传至 Hugging Face 与 GitHub,允许商业免费使用。 Mistral3系列在保持前代低延迟优势的同时,将上下文长度扩展至128K,并在 MMLU、HumanEval、MT-Bench 等主流基准中与 Llama3.1同规格模型打平或小幅领先。
12/3/2025 10:01:38 AM
AI在线

字节发布豆包1.5深度思考模型:多模态深度思考、延迟低

在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。 此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。 据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。
4/17/2025 12:01:15 PM
AI在线

免费!DeepSeek R1T Chimera 正式上线 OpenRouter 平台

由TNG Technology Consulting 研发的 DeepSeek R1T Chimera 模型已正式上线 OpenRouter 平台,为全球开发者提供高效、强大的推理能力。 这一全新开源模型结合了 DeepSeek R1的卓越推理能力和 V3-0324的高效性能,标志着开源 AI 技术在性能与效率平衡上的又一重大突破。 以下为 AIbase 整理的最新资讯,带您深入了解这一激动人心的进展。
4/28/2025 11:00:52 AM
AI在线