AI在线 AI在线

MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

中国AI公司MiniMax正式宣布开源其最新大型语言模型(LLM)MiniMax-M1,该模型以超长上下文推理能力和高效训练成本引发全球关注。 AIbase整理最新信息,为您带来MiniMax-M1的全面解读。 创纪录的上下文窗口:1M输入,80k输出MiniMax-M1以其惊人的100万token输入和8万token输出的上下文窗口,成为目前开源模型中最擅长长上下文推理的佼佼者。

中国AI公司MiniMax正式宣布开源其最新大型语言模型(LLM)MiniMax-M1,该模型以超长上下文推理能力和高效训练成本引发全球关注。AIbase整理最新信息,为您带来MiniMax-M1的全面解读。

创纪录的上下文窗口:1M输入,80k输出

MiniMax-M1以其惊人的100万token输入和8万token输出的上下文窗口,成为目前开源模型中最擅长长上下文推理的佼佼者。这一能力意味着模型能够一次性处理相当于一本小说甚至整个书系列的信息量,远超OpenAI GPT-4o的128,000token上下文窗口。无论是复杂文档分析、长篇代码生成,还是多轮对话,MiniMax-M1都能游刃有余,为企业和开发者提供了强大的工具。

图片

开源模型中的代理能力先锋

MiniMax-M1在代理工具使用方面表现卓越,性能媲美顶级商业模型如OpenAI o3和Claude4Opus。得益于其混合专家模型(MoE)架构与Lightning Attention机制的结合,MiniMax-M1在复杂任务如软件工程、工具调用和长上下文推理中展现出接近最先进的性能。这种开源模型的强大代理能力,为全球开发者社区带来了前所未有的机会。

图片

超高性价比:53万美元打造前沿LLM

MiniMax-M1的训练成本令人瞩目,仅需53.47万美元,相比DeepSeek R1的500-600万美元和OpenAI GPT-4的超1亿美元,堪称“平价奇迹”。通过高效的强化学习(RL)技术和仅512个H800GPU的硬件支持,MiniMax在短短三周内完成了模型开发。此外,MiniMax首创的CISPO优化算法进一步提升了推理效率,确保重要信息不丢失,同时降低训练成本。

技术亮点:456亿参数与高效架构

MiniMax-M1基于MiniMax-Text-01开发,拥有4560亿总参数,每个token激活约45.9亿参数,通过MoE架构实现高效计算。模型支持40k和80k思维预算的两种推理模式,满足不同场景需求。在数学、编码等推理密集型任务的基准测试中,MiniMax-M1表现强劲,超越了DeepSeek R1和Qwen3-235B-A22B等模型。

开源生态的里程碑

MiniMax-M1采用Apache2.0许可证,已上架Hugging Face平台,供全球开发者免费使用。这一举措不仅挑战了DeepSeek等中国AI企业的开源模型,也为全球AI生态注入了新的活力。MiniMax表示,未来还将发布更多技术细节,进一步推动开源社区的创新。

MiniMax-M1的发布标志着开源AI模型在长上下文推理和代理能力上的重大突破。其超长上下文窗口、高效训练成本和强大性能,为企业和开发者提供了极具性价比的解决方案。AIbase认为,MiniMax-M1的开源将加速AI技术在复杂任务中的应用,推动全球AI生态迈向新高度。

相关资讯

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)

降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设备上。这样复杂的环境,对软件的适应性和模型的可裁剪、可伸缩性提出了极高要求。AI 开源框架也在顺应这股潮流,昇腾发布的 CANN、MindSpore、MindX 等工具,可以让开发者实现「统一端边云,全端自动部署」,开启了机器学习开发的新时代,一直被人们寄予厚望。昇腾的 AI 全栈软件平台。其中,基础架构作为连接硬件与
3/19/2021 11:23:00 AM
机器之心
  • 1