AI在线 AI在线

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源

6 月 11 日消息,法国人工智能实验室 Mistral 周二宣布进军推理人工智能模型领域。 6 月 . 10 日,Mistral 正式推出其首个推理模型系列 .

6 月 11 日消息,法国人工智能实验室 Mistral 周二宣布进军推理人工智能模型领域。6 月 10 日,Mistral 正式推出其首个推理模型系列 ——Magistral。该系列模型通过分步骤解决问题,旨在提升在数学、物理等学科领域的一致性和可靠性,与 OpenAI 的 o3 模型和谷歌的 Gemini 2.5 Pro 等其他推理模型类似。

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源

Magistral 系列包含两个版本:Magistral Small 和 Magistral Medium。Magistral Small 拥有 240 亿参数,已在人工智能开发平台 Hugging Face 上以 Apache 2.0 许可证开放下载。而 Magistral Medium 是一个能力更强的模型,目前处于预览阶段,仅在 Mistral 的 Le Chat 聊天平台、公司 API 以及第三方合作伙伴云平台上提供。

Mistral 在其博客文章中表示:“Magistral 适用于广泛的企业级应用场景,包括结构化计算、程序化逻辑、决策树和基于规则的系统。这些模型经过多步骤逻辑的微调,能够提升可解释性,并以用户语言提供可追溯的思考过程。”

Mistral 成立于 2023 年,是一家前沿模型实验室,致力于开发一系列人工智能驱动的服务,包括 Le Chat 和移动应用程序。该公司获得了 General Catalyst 等风险投资机构的支持,目前已筹集超过 11 亿欧元(IT之家注:现汇率约合 90.22 亿元人民币)的资金。

尽管 Mistral 拥有强大的资源,但在某些领域,例如开发推理模型方面,其落后于其他领先的人工智能实验室。从 Mistral 自己的基准测试来看,Magistral 的竞争力似乎也不够突出。在评估模型物理、数学和科学技能的 GPQA Diamond 和 AIME 测试中,Magistral Medium 的表现不如 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。此外,在流行的编程基准测试 LiveCodeBench 中,Magistral Medium 也未能超越 Gemini 2.5 Pro。

法国 AI 实验室 Mistral 推出推理模型 Magistral 系列,Small 版已开源

或许正因如此,Mistral 在其博客文章中着重强调了 Magistral 的其他优势。Mistral 声称,Magistral 在 Le Chat 上的答题速度是竞争对手的 10 倍,并且支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。

该公司在文章中写道:“基于我们的旗舰模型,Magistral 专为研究、战略规划、运营优化和数据驱动决策而设计,无论是执行多因素风险评估和建模,还是在约束条件下计算最优交付窗口,都能胜任。”

Magistral 的发布是在 Mistral 推出“氛围编程”客户端 Mistral Code 之后不久。而在几周前,Mistral 还发布了多个专注于编程的模型,并推出了 Le Chat Enterprise,这是一款面向企业的聊天服务,提供人工智能代理构建器等工具,并将 Mistral 的模型与 Gmail 和 SharePoint 等第三方服务集成。

相关资讯

Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争

在伦敦科技周的炉边谈话中,门施告诉 CNBC:Mistral 的新模型“擅长数学,也擅长编码”。他强调,该模型“具备与所有其他模型的竞争力”,包括 OpenAI o1 及 DeepSeek R1。
6/10/2025 6:00:35 PM
问舟

微软开源 Phi-4 推理模型:啰嗦AI,反卷出圈

AI圈子最有意思的事,已经不是“谁家模型参数最多”,而是——谁家小模型,能把大模型打趴下。 最近,微软研究院开源了一款“小而强”的研究:Phi-4-reasoning-plus。 这是一款专为深度结构化推理任务设计的开源语言模型。
5/8/2025 4:45:32 PM
文摘菌

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

大模型强推理赛道,又迎来一位重量级玩家。 本周二,欧洲人工智能公司 Mistral AI 发布了 Magistral,这是一个全新的大语言模型(LLM)系列,展现了强大的推理能力。 它能够进行不断反思,并解决更复杂的任务。
6/11/2025 2:39:50 PM
  • 1