AI在线 AI在线

8%价格,2倍速度!国产MiniMax M2暴打Claude Sonnet 4.5?我们实测后发现堪称性价比之王!

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)10月27日,MiniMax正式开源并上线了 MiniMax M2。 官方口号喊得非常响亮:“专为 Agent 和代码而生,仅 Claude Sonnet 8% 价格,2倍速度,限时免费! ”这就引发了很多网友纷纷前去体验,再加上官方延长了限时免费的时间,截至11月7日前都可以免费体验Agent平台和调用API,政策十分诱人。

编辑 | 听雨

出品 | 51CTO技术栈(微信号:blog51cto)

10月27日,MiniMax正式开源并上线了 MiniMax M2。官方口号喊得非常响亮:“专为 Agent 和代码而生,仅 Claude Sonnet 8% 价格,2倍速度,限时免费!”

这就引发了很多网友纷纷前去体验,再加上官方延长了限时免费的时间,截至11月7日前都可以免费体验Agent平台和调用API,政策十分诱人。

现在MiniMax首页已经有很多网友分享了自己的作品,可以说是五花八门:有MBTI测试、在线扑克游戏、儿童绘本等等……

图片图片

小编也迫不及待地实测了一下MiniMax M2的Agent能力,分别体验了网页制作和游戏制作,并与Sonnet 4.5进行了对比。

先放结论:M2的综合性能还是很不错的,最后的输出结果与Sonnet 4.5相比是各有千秋,有些方面甚至更加出彩。

老规矩,在测试开始前,先简单介绍一下MiniMax M2这款模型。从官方介绍可以看出,这个模型的定位还是非常聚焦的:

  • 顶级代码能力:

专为端到端开发工作流打造,在Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越强大

  • Agentic表现:

出色规划并稳定执行复杂长链条工具调用任务,协同调用Shell、Browser、Python代码执行器和各种MCP工具

  • 极致性价比&速度:

通过高效的激活参数设计,实现智能、速度与成本的最佳平衡

在Artificial Analysis的测试中,MiniMax M2以61分获得了开源模型第一、全球第五的成绩,紧随Claude 4.5 Sonnet,排在前面的也都是几位大佬。

图片图片

在Agent最关键的三个能力——编程能力、工具使用能力和深度搜索能力上,M2在工具使用和深度搜索方面都不逊于海外顶尖模型,编程能力也在国内名列前茅。

图片图片

MiniMax M2主打的就是性价比。目前,MiniMax官方对模型的API价格定在每百万Token输入0.3美金/2.1元人民币,以及输出1.2美金/8.4元人民币,同时在线上提供TPS(每秒输出Token数)在100左右的推理服务(还在快速提升)。 这个价格是Claude Sonnet 4.5 的8%,而推理速度快了接近一倍。

目前,M2的完整模型权重已经开源,采用MIT协议,在线Agent平台和API截至11月7日前都免费。

Round 1:制作元素周期表

小编出的第一道题是制作一个介绍元素周期表的网站,给出的prompt也非常简单,“帮我制作一个介绍元素周期表的网页,要求可交互,风格简洁美观”。

没有用GPT生成一个复杂详细的prompt,目的就是想测试一下编程小白能不能用M2直出一个网页。

图片图片

MiniMax M2收到指令后,很快就进一步拆解制作思路,并给出了几种设计方案供用户选择。

图片图片

小编选择了第一种设计方案,也是MiniMax推荐的瑞士国际主义风格。确认方案后,M2就开始了漫长的生成过程。

这里不得不吐槽一下,M2的网页制作过程耗时实在太久了,整体上花了大约20-30分钟,而且中间M2还失败了一次,又重新进行开发。

图片图片

不过M2的思考过程非常丰富,可以看到整个网页开发的设计、构建、部署、测试、验证的完整流程。

图片图片

图片图片

最后还有“验证”这个步骤,事无巨细地测试了搜索、筛选、交互卡片、模态框等各个功能。

图片图片

终于,网页生成了!让我们来看看MiniMax做的元素周期表。

首先,整个网页让人眼前一亮,风格简洁明了。但仔细一看,118个元素并没有展示完整,镧系元素和锕系元素都有缺失,而卤素和惰性气体则是一个元素也没列出来。

图片图片

图片图片

其次,网页交互还是做得很不错的,点击各个元素可以查看元素的具体信息,包括原子序数、原子量、基本属性、物理属性,部分元素还能查看发现年代及发现者。

图片图片

上方有搜索框,显示输入元素的名称、序号或符号都可以进行搜索。

图片图片

输入“氢”会出现氢元素,输入“20”会出现钙元素,这都没问题。

图片图片

但是这个功能也有Bug。输入“Fe"没有出现相应的铁元素,而小编随手输入一个“L”,却出现了很多结果。

图片图片

仔细一看,某个元素的英文中有字母“l”,也会被归入搜索结果中。

再次,这个网页还有筛选功能,点击相应类别,下方就会出现相应元素。不过也归咎于元素展示不完整,点击部分类别时没有出现相应的元素。

图片图片

还有一个小细节,就是鼠标悬停在某个元素上时,会出现一点阴影效果,这也是M2自己想出的设计。

页脚部分,显示数据来源为国际纯粹与应用化学联合会(IUPAC),这个组织及其官网都是真实存在的,官网上也有元素周期表的展示。

图片图片

图片图片

总的来说,MiniMax M2生成的这个网站功能很多样,检索、分类筛选、交互等功能应有尽有,设计风格也很美观。但最大的硬伤就是元素展示不完整、网页生成时间较长。

另外,小编还同步测试了Sonnet 4.5。使用的是一模一样的Prompt,大概三四分钟整个网页就生成好了。

图片图片

可以看到,Sonnet 4.5生成的网页还是很简洁明了的。

首先,完整展示了118个元素,并用不同颜色对不同类型的元素进行了标注(碱金属、碱土金属、过渡金属、卤素、稀有气体等)。

其次,网页有基本的交互效果,点击元素可查看基本信息,包括原子序数、相对原子质量、元素符号等,但没有MiniMax M2生成得那么全面。

再次,整个网页的功能也比较简单,只有元素展示、点击查看具体信息这两个功能,不像M2还做了检索、分类筛选等功能。

图片图片

另外还有一点差评,那就是Sonnet4.5说自己做了一个简单的悬停效果,鼠标悬停时元素会放大。但是小编发现其实并没有这个效果。

总的来说,在网页制作这个项目上,MiniMax M2和Claude Sonnet 4.5是各有千秋。

M2的整体设计风格更美观,功能也更加丰富,但略微有些本末倒置,最重要的元素展示反而有所缺失。

而Sonnet 4.5则胜在输出速度快,信息完整全面。不过在功能和交互上,一行简单的prompt就不能指望太多了,只能说是迅速给到你一个各方面都合格的网页。

Round 2 :俄罗斯方块游戏

这一回我给出的propmt依旧非常简单:“帮我制作一个俄罗斯方块游戏,要求能够玩起来,没有bug”。

这回我们先来看看Sonnet 4.5,它的速度依然快得惊人,仅仅半分钟左右,游戏就做好了。

图片图片

游戏包含7种经典的方块形状(I、O、T、S、Z、J、L),具备完整的碰撞检测系统,可以实现自动消除满行并计分,方块旋转和移动也十分流畅。

另外,游戏还设计了暂停/继续功能,很适合办公摸鱼。

图片图片

Sonnet 4.5生成的这个俄罗斯方块游戏,在小编心里妥妥的是超出及格线的水平。

来到MiniMax M2这边。一如往常,M2收到指令后会进行分析,并询问用户是否有特殊要求。

图片图片

小编确认无特殊要求后,模型就进入了开发流程。大约等待20分钟后,游戏终于制作完毕。

图片图片

游戏的整体效果还是可以的,键盘操作、计分系统、游戏的暂停/继续等功能都没有问题,方块的旋转移动也十分流畅。

唯一的bug在于方块不能自动下降,只能键盘控制,这就比较放水了。

另外,游戏左下方还会提示下一个图形的形状,这也给游戏降低了难度。

但在页面设计上,M2生成的游戏风格要比Sonnet更加美观,元素和色彩也更加丰富,还多了一个“重新开始”功能,看来这么长的输出时间也没有完全白费。

结论:M2更有亮点、性价比之王,Sonnet表现更稳定

经过这两轮测试,小编认为MiniMax M2的综合性能还是非常不错的。从测试结果来看,在页面风格、功能设计等方面,M2的表现甚至超越了Sonnet,还有一些出彩的点,令人惊喜。

但M2给出的结果都存在一些硬伤,比如元素周期表的元素不全、俄罗斯方块游戏中方块不能自动下降等,反而是Sonnet的表现会更加稳定,并且在输出效率上也明显超越M2。

不过在价格方面,MiniMax M2的定价只有Claude Sonnet 4.5的8%,而生成质量却能保持在八九成的水准,这个价格还要什么自行车?性价比压倒一切!

再加上现在 MiniMax 还针对性推出了免费活动:新的 M2 模型,以及 Agent 产品都可以限时免费使用 14 天,包括 API  也免费。这也是小编见过的免费幅度最大的活动。

伙计们,还等什么?赶紧体验起来吧!

在线Agent体验地址:https://agent.minimaxi.com/

相关资讯

MiniMax推M2推理大模型:2300亿参数、100 token/s,专为智能Agent而生

在大模型竞赛从“拼参数”转向“拼效率”的关键节点,MiniMax于10月27日发布新一代开源推理模型M2,以精准的工程取舍,锚定智能Agent这一下一代AI应用的核心战场。 M2采用混合专家架构(Mixture-of-Experts, MoE),总参数量达2300亿,但每次推理仅激活100亿参数,实现高达每秒100个token的输出速度——这一性能指标使其在实时交互场景中具备显著优势。 尤为关键的是,M2专为智能Agent设计,强化了在行为决策、多轮任务规划与环境交互中的推理连贯性与响应效率,为构建真正自主的AI智能体提供底层引擎。
10/28/2025 10:11:33 AM
AI在线

国家超算互联网平台上线MiniMax国产AI大模型,助力AI开源生态与智能交互新发展

中国人工智能产业正在加速迈向全球舞台。 AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。 与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。
4/16/2025 2:01:15 PM
AI在线

苹果M2笔记本固态硬盘反向升级:降速还加价1500

涨价 1500 元,你获得了更长时间的续航,更好的屏幕,更小的体积…… 但硬盘却降级了。
7/16/2022 11:54:00 AM
机器之心
  • 1