AI在线 AI在线

MiniMax 推出全球首个开源混合架构模型 M1,强化训练成本大幅降低!

6月17日,上海的 AI 独角兽公司 MiniMax 发布了其全新研发的 MiniMax-M1系列模型,号称是全球首个开源的大规模混合架构推理模型。 这个创新的模型在上下文处理能力和成本控制方面都取得了显著的突破。 MiniMax-M1模型的最大亮点在于其原生支持高达100万 Token 的上下文窗口,甚至在推理输出上支持业内最长的8万 Token。

6月17日,上海的 AI 独角兽公司 MiniMax 发布了其全新研发的 MiniMax-M1系列模型,号称是全球首个开源的大规模混合架构推理模型。这个创新的模型在上下文处理能力和成本控制方面都取得了显著的突破。

MiniMax-M1模型的最大亮点在于其原生支持高达100万 Token 的上下文窗口,甚至在推理输出上支持业内最长的8万 Token。这一技术进步与谷歌的 Gemini2.5Pro 相当,同时在工具使用场景(TAU-bench)中,MiniMax-M1-40k 的表现超过了 Gemini-2.5Pro,展现了其强大的实力。此外,MiniMax 还表示,M1模型的强化训练成本仅为53.5万美元,相比以往减少了一个数量级。

image.png

在定价策略上,MiniMax 采用了阶梯式定价,随着输入文本长度的增加,费用也会相应提高。具体来说,0-32k Token 的输入费用为每百万 Token0.8元,而输出则为每百万 Token8元;32k-128k Token 则为1.2元和16元;128k-1M Token 的输入和输出费用分别为2.4元和24元。这一价格设置使得 MiniMax-M1在市场上更具竞争力,尤其是在前两个档位的定价上,均低于同类产品 DeepSeek-R1。

值得一提的是,MiniMax 此次还推出了 CISPO 算法,其收敛速度比字节跳动最近推出的 DAPO 算法快了一倍,强化学习阶段的算力需求仅为 DeepSeek R1的30%。这使得 MiniMax-M1模型的训练更加高效,使用的算力资源显著减少,进一步降低了运营成本。

在 AI 行业的 “六小虎” 竞争者面前,MiniMax 的这一发布标志着其希望在大模型的竞争中继续前行。随着 DeepSeek R2的即将推出,未来的市场局势将更加复杂。MiniMax 也在持续进行开源技术的更新,预计在接下来的日子里会有更多的技术和产品亮相。

相关资讯

国家超算互联网平台上线MiniMax国产AI大模型,助力AI开源生态与智能交互新发展

中国人工智能产业正在加速迈向全球舞台。 AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。 与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。
4/16/2025 2:01:15 PM
AI在线

国家超算平台发布新一代多模态大模型,推动 AI 智能体发展

国家超算互联网平台最近正式上线了一款名为 “超长文本多模态大模型” 的新技术,旨在加速人工智能智能体的开发。 这一模型是由上海稀宇科技有限公司研发的,主要包括两个版本:MiniMax-Text-01和 MiniMax-VL-01。 这些大模型的推出不仅为技术界带来了新的可能性,也为各行各业的智能化转型提供了支持。
4/16/2025 11:01:34 AM
AI在线

独家丨MiniMax 高级研究总监钟怡然已于半年前离职

据公开资料显示,钟怡然博士毕业于澳大利亚国立大学,师从李宏东教授与 Richard Hartley 院士。 并曾在国际权威期刊及顶级学术会议上累计发表了 40 余篇研究论文,涵盖 TPAMI、IJCV、IEEE TIP、CVPR、NeurIPS、ECCV、ICCV、ICLR、EMNLP 等领域,且持有多项美国专利。 钟怡然的科研成果在学术界与产业界都受到了广泛关注,相关论文累计被引用近 2000 次。
10/28/2025 6:06:00 PM
郑佳美