AI在线 AI在线

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

上周五,ChatGPT Agent mode 上线了。 之前一直有点偷懒,也嫌贵,嫌麻烦,没咋做 Agent 的对比,这次真的想好好评测一下,让我自己有一个认知,于是花了一天的时间,构建了一些我自己的任务。 拿去测一下各家通用 Agent 的情况。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

上周五,ChatGPT Agent mode 上线了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

之前一直有点偷懒,也嫌贵,嫌麻烦,没咋做 Agent 的对比,这次真的想好好评测一下,让我自己有一个认知,于是花了一天的时间,构建了一些我自己的任务。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

拿去测一下各家通用 Agent 的情况。

烧了将近 1000 多块钱后。

发现,ChatGPT 的 Agent mode 是真的拉。。。

但是在体验过程中,意外的让我发现了一个神奇的 Agent 产品,直接让我一个周末快通宵的在那跑任务。

我很久没有这种,能最快速度把脑子里的想法变成现实的快感了。

这玩意,真的强的有点离谱,甚至感觉领先同类型产品一个代际,特别是在开发能力上,我必须要给大家分享一下。

这就是,MiniMax 家的 Agent。

网址在此: https://agent.minimax.io/

我先给你们看看我用它开发的东西。

比如,和 AI 下围棋。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

比如,做个萨拉热窝事件没有发生的话,世界会变成什么样子的 PPT。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

或者,做一个传说中的西风博物馆的网页。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

太离谱了。

你永远可以相信 MiniMax 的技术和审美。

但是这还不是最重要的。这个 Agent 跟别人最大的不同,除了任务的完整度还有细节之外,我觉得最牛逼的,还是他们把后端的服务集成进去了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我们都知道,很多的 Agent,做一个网页是没什么问题的,甚至你做一个网站也没有问题,但是那个东西,本质上是一个静态的。

是没有后端,没有交互的。

AI+前端的应用现在最火的就是可视化了,把长文做成网页进行可视化,把视频可视化,把音频可视化等等。

然后呢?

但是我们真正需要的,其实是一个前端+后端的产品,这个产品可以很小,可以只给企业内部用,可以根本不需要多少并发,但,他也需要服务器需要数据库等等。

因为,你真的会涉及到数据、涉及到存储等等,但是这块,真的难,对于我这种菜鸡而言,真的就跟天书一样。

你让我 vibe coding 搓一个 Chrome 插件、搓一个 H5 小应用,没啥问题,但是你要让我搓一个类似于上面那样的,自动监控的网站、AI 活动平台那真的是难死我了,我真的是一丁点都搞不来了。

但是这块,才是真正有生产力的需求啊,也是不仅仅是图一乐,而是能实际用在工作中的。

所以这就是我为什么觉得 MiniMax 离谱,是因为,我一个 Prompt,他能给我的,是真的一个前端+后端能实际可用的网站,这个太离谱了。

我直接给大家看一个案例。

比如最近各种活动实在太多了,朋友们和群友们,一直想要一个 AI 活动大全,就是在一个网站上,集合了各种各样线上线下的活动,大家可以发布,我作为管理员进行审核,通过的就展示在首页上。

就是这么个小东西。

我其实之前已经搜集过最近的一些活动信息了,放在了多维表格里,但是还是懒,整理的信息质量非常的离谱且粗糙。。。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我们想开发一个活动网站,还是需要第一批的标准化数据作为代表的,所以,我想把这个表格补全,然后再把这份表格扔给 Agent,让它把这些信息作为首批上线的活动,存到数据库里,然后给大家展现。

所以,说干就干,我也懒得古法手补了,直接把这个表格,扔给了 MiniMax Agent,然后说了一句:

“这些都是 2025 年最近的活动,帮我按照表格里的数据,搜集全网信息,然后把空缺的单元格按照搜索的信息进行修改和补全。 线上的活动需要的信息为:活动名称、类型、主办方、活动链接、状态、结束时间、奖励类型、活动规则、奖励明细 线下的活动需要的信息为:活动名称、类型、主办方、活动链接、状态、时间”

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

MiniMax Agent 的运行模式跟一些通用 Agent 也没啥区别,左边是运行过程,右边是步骤可视化窗口。

在思考了一会以后,它把素材看明白了,然后给我列了任务和 To do list,问我这么执行行不行。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我回复了一句,同意。

它就开始了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

具体过程我就按下不表了。

大概十几二十分钟过后,任务完成了,给了我两份非常精确的表格。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

OK,我们可以直接拿着这两个表格,来去建站了。

把两个表格扔进去,再写一段 Prompt,Prompt 也非常简单。

“创建一个轻量级的 AI 活动信息分享平台,让对 AI 感兴趣的学生、开发者和研究人员能发现、发布并收藏各类 AI 相关的赛事、讲座和黑客松等活动。平台支持用户注册登录后提交活动信息,并通过管理员后台进行审核与管理,以确保信息的准确性和高质量。

第一批活动可以表格里的信息填充。”

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

整体的流程跟前面的其实一样,还是先分析、然后给 to do list,问我同不同意。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

同意了以后,就会开始。

但是这次,你会发现,出来了一个不一样的东西。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

Supabase 集成。

这玩意就是 MiniMax agent 能实现后端能力的核心。

你可以简单粗暴地把它理解为一个后端即服务(BaaS)平台。

说人话,就是它已经帮你提前搞定了后端那些特别复杂的玩意儿:数据库、实时数据同步、用户认证、文件存储啥的,都已经做好了现成的模块。

MiniMax 把 Supabase 打通了。

所以,当 MiniMax Agent 把 Supabase 整合进来之后,事情就变得贼离谱了。

只需要扔进去一个 Prompt,比如就是我上面的给我搞一个 AI 活动发布网站,它不仅前端帮你画好了页面,甚至后台数据库、用户注册登录、管理员审核权限的全套服务,也都自动帮你搞定了。

而且更骚的是,这些数据还能自动和前端实时同步,你前端一发布活动,后端数据库自动更新,所有用户的页面立马就能看到。

对我这种前端半吊子、后端啥也不会的菜鸡来说,MiniMax Agent + Supabase 的存在,简直就是救我于水火的黑科技。

你直接点击那个 Supabase 集成的按钮,一路跟着登录注册填写各种表单就行。

然后,他会让你建组织,建项目。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

一切就绪以后,点击链接,就完事了。

非常的简单方便,你根本不需要懂后端。

然后 MiniMax Agent 就会继续开始自动执行。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

你要做的就是,等一段时间以后,过来收菜就行了。

大概十几分钟到半小时以后,系统跑好了,真的是结结实实的半小时。

这个任务,我先给你们看看,ChatGPT Agent 跑出来的东西。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我不是说他不好,而是对于普通用户来说,这玩意真的没法用。。。

黑框里的代码怎么执行?终端是啥?啥叫 uvicorn 启动服务?我要的是个网站为什么是个压缩包?我要怎么让别人用?

很多时候,真的。

AI 圈子和大众之间的 gap,如隔山海。

新技术,本就是应该让更多的普通人,享受科技的乐趣。

我只是想要一个网站,我希望你给我一个搭好的网站,仅此而已。

回到 MiniMax Agent 这边,可以看到已经开发完了,同时给你两个选项。

  1. 它来帮你做一个全面的测试。
  2. 我自己上去体验一下。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

秉持这懒人就懒到底的原则,我就选了 1。

测试大概又测了 10 分钟,然后给我了一个新的网址。

我进去看了下。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

所有的信息,都在,控件也全部写好了,牛逼。。。

但是有一个 BUG,就是我再注册的时候,一直提示报错,我也不知道为啥。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

反正就复制回去,继续改。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

每几分钟,好了,给了我一个新链接,果然,可以了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

直接登录,就能看到顶部,有一个发布活动的按钮。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

你可以直接发布活动。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

当你提交完毕以后,就会显示等待审核中。

而如果我们,用管理员账号登录的话。

你就会发现。

你可以看到等待审核的活动们,还有那些已经注册的用户们。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

真的,喜极而泣。。。

这才是我想要的 Agent 啊。

我们点击审批通过时候,这个活动的状态就会变化。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

此时我们回到首页,你就会发现,这个 hhhhhh 的活动。

真的出现了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我知道,这个网站对于很多开发者来说,肯定是小菜一碟,但是对于普通人来说,这真的,是一个再好不过的途径了。

而且内部用用,也不需要什么大规模的并发,真的足够了。

把你的想象变成现实,真的,即刻造梦。

除了这个,我又搞了一个小东西。

最近因为一直在频繁的招人,然后很多小伙伴给我投了简历。

数量真的非常非常多。

但是我真的很想说,投简历,真的就别海投了。。。

比如这种,一个“发自我的 iPhone”,简历也是最平平无奇的简历,我真的不知道该从哪下手。。。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

所以,正好毕业季,我就搞了一个帮大家,优化简历的 Agent Prompt。

我就用的内容编辑岗位来举例子。

他会给你找到你的简历,跟这个职位之间的优劣势,然后帮你改一份你的简历。

同时会开始全面的搜集你要投的公司和职位的信息,形成一份研究报告。

再会给你一份针对性的面试真题和一份参考答案。

最后还帮你开发了一个 AI 网页,模拟 AI 面试官,针对之前的所有报告,来跟你进行一场模拟面试。

如果你真的很喜欢或者很想进某一家公司,这个方法和研究程度,应该可以帮你大大的提高成功率。

我拿了我的公司一个同学的简历,给大家举个例子看一下。

当你把你的简历和 Prompt,扔给 MiniMax Agent 之后,他就会给你全部跑完,然后咱们再正常全面测试一下。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

你的那些研究报告,都在右边的文件库里。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

真的,详细的不能再详细了,你能把这些看完,就一定已经胸有成竹了。

如果你还想更进一步,那就进入 Agent 给你生成的网址里面,去来一次 AI 面试。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

可以写你的名字,然后就能直接开始。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我看了一下,我觉得它问的问题质量是真的还可以。。。

我就不信,这一圈干完,你的成功率还能跟其他人一样。

最后,说一下可能大家最关心的问题,钱。。。

坦诚的讲,现在的 Agent,是真的不便宜,跟 23 年的大模型 API 价格是真的有点像,太贵了。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我是真的肉疼。

MiniMax Agent 的文章里的任务,大概消耗是这些积分。

每个任务的改 BUG 次数大概是 1~2 次。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

而每个积分对应的价格,是这样的。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

我氪了最狠的那个套餐,69 刀,2 万分。

我的任务都比较大,所以花的比较多,你如果只是调研或者写个 PPT 啥的,大概率就是几百积分。

而这实际上,2 万分,我周五+周六,一天多就干完了。

所以,我周日,又加了额外氪了 1 万积分。

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

总计在 MiniMax Agent 上,就花了我将近 150 刀,以为后面已经不是测试了,就是自己单纯想玩。

别的 Agent 加起来,差不多也是 150 刀。

所以说,Agent 在现在这个节点,远远称不上平价,贵,真的太贵了,我自己这个周末用的心都在滴血。

等 Agent 的价格平权,还得靠厂商们开卷,优化 Token 消耗。

但是一想想,之前的有些想法,现在可以非常快速的实现了,这个感觉还是很爽的,因为后端实在太难搞了,要是外面找外包,真的,上千起步。

所以,大家要是用的话,一定要珍惜积分,一定尽量要做一些,适合自己生产力的事。

MiniMax Agent 新用户送 1000 积分,大家可以去试着玩玩看,至于要不要氪金,一定要想清楚,如果你原本的任务,需要上千块,而现在,它可以让你可以 19 刀或者 69 刀就能解决。

那就不要想,直接氪就完事了。

Agent 的天花板,远比我们想象的要高。

现在,越来越考验所有的人的,创意和洞察能力了。

这个时代的生产力。

一定会重新定义的。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,谢谢你看我的文章,我们,下次再见。

相关资讯

国家超算互联网平台上线MiniMax国产AI大模型,助力AI开源生态与智能交互新发展

中国人工智能产业正在加速迈向全球舞台。 AIbase从社交媒体获悉,国家超算互联网平台已正式上线MiniMax稀宇科技的国产AI大模型,包括MiniMax-Text-01和MiniMax-VL-01,并入驻超算互联网AI开源社区。 与此同时,MiniMax的ChatBot对话服务也同步接入平台,为用户提供高效的智能交互体验。
4/16/2025 2:01:15 PM
AI在线

国家超算平台发布新一代多模态大模型,推动 AI 智能体发展

国家超算互联网平台最近正式上线了一款名为 “超长文本多模态大模型” 的新技术,旨在加速人工智能智能体的开发。 这一模型是由上海稀宇科技有限公司研发的,主要包括两个版本:MiniMax-Text-01和 MiniMax-VL-01。 这些大模型的推出不仅为技术界带来了新的可能性,也为各行各业的智能化转型提供了支持。
4/16/2025 11:01:34 AM
AI在线

MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

中国AI公司MiniMax正式宣布开源其最新大型语言模型(LLM)MiniMax-M1,该模型以超长上下文推理能力和高效训练成本引发全球关注。 AIbase整理最新信息,为您带来MiniMax-M1的全面解读。 创纪录的上下文窗口:1M输入,80k输出MiniMax-M1以其惊人的100万token输入和8万token输出的上下文窗口,成为目前开源模型中最擅长长上下文推理的佼佼者。
6/17/2025 10:02:37 AM
AI在线
  • 1