MiniMax推M2推理大模型：2300亿参数、100 token/s，专为智能Agent而生

作者：AI在线 2025-10-28 10:11

在大模型竞赛从“拼参数”转向“拼效率”的关键节点，MiniMax于10月27日发布新一代开源推理模型M2，以精准的工程取舍，锚定智能Agent这一下一代AI应用的核心战场。 M2采用混合专家架构（Mixture-of-Experts， MoE），总参数量达2300亿，但每次推理仅激活100亿参数，实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。尤为关键的是，M2专为智能Agent设计，强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率，为构建真正自主的AI智能体提供底层引擎。

在大模型竞赛从“拼参数”转向“拼效率”的关键节点，MiniMax于10月27日发布新一代开源推理模型M2，以精准的工程取舍，锚定智能Agent这一下一代AI应用的核心战场。

M2采用混合专家架构（Mixture-of-Experts， MoE），总参数量达2300亿，但每次推理仅激活100亿参数，实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。尤为关键的是，M2专为智能Agent设计，强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率，为构建真正自主的AI智能体提供底层引擎。

MiniMax、稀宇科技、AI、人工智能

值得注意的是，相比前代M1模型，M2在上下文窗口上做出战略调整:从M1支持的100万token大幅缩减至20.48万token。这一变化并非技术倒退，而是MiniMax在长文本处理、推理速度与部署成本之间做出的务实权衡。M1虽以“百万上下文”创下纪录，但高资源消耗限制了实际落地;而M2则聚焦高频、高响应的Agent任务，在保证足够上下文长度的同时，大幅提升吞吐效率与经济性。

作为开源模型，M2进一步降低了开发者构建定制化智能体的门槛。无论是打造具备复杂任务链的虚拟助手、自动化工作流机器人，还是嵌入企业系统的决策Agent，开发者均可基于M2快速迭代，灵活调优。

MiniMax明确将M2定位为“Agent时代的推理基座”。在AI正从“问答工具”迈向“行动代理”的浪潮中，M2的推出不仅是一次模型升级，更是对下一代AI应用范式的押注——当智能体需要快速思考、持续行动、高效交互，速度与成本，或许比上下文长度更为关键。

人均「95后」，账上超十亿美金，MiniMax叩响港股大门

没想到，大模型创业公司上市的节奏变的如此之快。本周日晚消息，国内知名 AI 创业公司 MiniMax（稀宇科技）在港交所刊发其聆讯后资料集（PHIP）版本的招股书资料，上市进程进入关键冲刺阶段。 MiniMax 于 2021 年 12 月成立，总部位于上海，由前商汤科技高管闫俊杰等人创立，专注于研发文本、语音、视觉多模态融合的通用人工智能技术（AGI）。

12/22/2025 10:21:00 AM 机器之心

实测MiniMax M2.1之后，我们终于看懂了其招股书里的技术底气

这两天，中国 AI 行业关注的核心无疑是 MiniMax。 12 月 21 日，MiniMax（稀宇科技）正式向港交所递交招股书，披露的一连串数字瞬间引爆了舆论场：账上坐拥超 10 亿美元的现金储备，2025 年前九个月营收同比激增 174.7%，而在保持高强度研发的同时，经调整净亏损控制在 1.86 亿美元。资本市场的喧嚣还没结束，23 日，MiniMax 又反手甩出了一张技术牌：正式上线 MiniMax M2.1 模型。

12/24/2025 4:22:00 PM 机器之心

国家超算互联网平台上线MiniMax国产AI大模型，助力AI开源生态与智能交互新发展

中国人工智能产业正在加速迈向全球舞台。 AIbase从社交媒体获悉，国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型，包括MiniMax-Text-01和MiniMax-VL-01，并入驻超算互联网AI开源社区。与此同时，MiniMax的ChatBot对话服务也同步接入平台，为用户提供高效的智能交互体验。

4/16/2025 2:01:15 PM AI在线

MiniMax推M2推理大模型：2300亿参数、100 token/s，专为智能Agent而生

相关资讯

人均「95后」，账上超十亿美金，MiniMax叩响港股大门

实测MiniMax M2.1之后，我们终于看懂了其招股书里的技术底气

国家超算互联网平台上线MiniMax国产AI大模型，助力AI开源生态与智能交互新发展