AI在线 AI在线

MiniMax推M2推理大模型:2300亿参数、100 token/s,专为智能Agent而生

在大模型竞赛从“拼参数”转向“拼效率”的关键节点,MiniMax于10月27日发布新一代开源推理模型M2,以精准的工程取舍,锚定智能Agent这一下一代AI应用的核心战场。 M2采用混合专家架构(Mixture-of-Experts, MoE),总参数量达2300亿,但每次推理仅激活100亿参数,实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。 尤为关键的是,M2专为智能Agent设计,强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率,为构建真正自主的AI智能体提供底层引擎。

在大模型竞赛从“拼参数”转向“拼效率”的关键节点,MiniMax于10月27日发布新一代开源推理模型M2,以精准的工程取舍,锚定智能Agent这一下一代AI应用的核心战场。

M2采用混合专家架构(Mixture-of-Experts, MoE),总参数量达2300亿,但每次推理仅激活100亿参数,实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。尤为关键的是,M2专为智能Agent设计,强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率,为构建真正自主的AI智能体提供底层引擎。

MiniMax、稀宇科技、AI、人工智能

值得注意的是,相比前代M1模型,M2在上下文窗口上做出战略调整:从M1支持的100万token大幅缩减至20.48万token。这一变化并非技术倒退,而是MiniMax在长文本处理、推理速度与部署成本之间做出的务实权衡。M1虽以“百万上下文”创下纪录,但高资源消耗限制了实际落地;而M2则聚焦高频、高响应的Agent任务,在保证足够上下文长度的同时,大幅提升吞吐效率与经济性。

作为开源模型,M2进一步降低了开发者构建定制化智能体的门槛。无论是打造具备复杂任务链的虚拟助手、自动化工作流机器人,还是嵌入企业系统的决策Agent,开发者均可基于M2快速迭代,灵活调优。

MiniMax明确将M2定位为“Agent时代的推理基座”。在AI正从“问答工具”迈向“行动代理”的浪潮中,M2的推出不仅是一次模型升级,更是对下一代AI应用范式的押注——当智能体需要快速思考、持续行动、高效交互,速度与成本,或许比上下文长度更为关键。

相关资讯

8%价格,2倍速度!国产MiniMax M2暴打Claude Sonnet 4.5?我们实测后发现堪称性价比之王!

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)10月27日,MiniMax正式开源并上线了 MiniMax M2。 官方口号喊得非常响亮:“专为 Agent 和代码而生,仅 Claude Sonnet 8% 价格,2倍速度,限时免费! ”这就引发了很多网友纷纷前去体验,再加上官方延长了限时免费的时间,截至11月7日前都可以免费体验Agent平台和调用API,政策十分诱人。
10/31/2025 10:24:42 AM
听雨

国家超算互联网平台上线MiniMax国产AI大模型,助力AI开源生态与智能交互新发展

中国人工智能产业正在加速迈向全球舞台。 AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。 与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。
4/16/2025 2:01:15 PM
AI在线

HuggingFace发布AI Agent课程

Hugging Face 近期推出了一门名为 “Agent课程” 的在线学习课程,旨在帮助学习者深入理解智能Agent的基础知识及应用。 课程内容丰富,共分为五个单元,从Agent的基本概念到最终的作业评估,循序渐进,帮助学员掌握所需技能。 课程的首个单元为 “欢迎来到课程”,提供了课程的概述、指导方针以及所需工具,确保学员在学习过程中拥有良好的基础。
2/12/2025 9:18:00 AM
AI在线
  • 1