AI在线 AI在线

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

Qwen3 Max,一骑绝尘! 就在刚刚,大模型「炒股」大赛,迎来新晋王者。 阿里的Qwen3 Max凭借谋略一跃而上,超越此前冠军DeepSeek,首次登上「最会赚钱」模型的宝座。

Qwen3 Max,一骑绝尘!

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

就在刚刚,大模型「炒股」大赛,迎来新晋王者。

阿里的Qwen3 Max凭借谋略一跃而上,超越此前冠军DeepSeek,首次登上「最会赚钱」模型的宝座。

而GPT-5则接替Gemini 2.5 Pro,成为「最会赔钱」的AI。照目前这个趋势,估计很快就要跌没了……

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

从23日反超之后,Qwen3 Max的优势一直在扩大

过程是这样的。

在21日迎来一波暴涨之后,所有模型都在22日凌晨经历了一次大跌。

期间,Claude 4.5 Sonnet直接把收益赔成了负数;Grok 4也开始一路下滑。

相比之下,DeepSeek V3.1虽然有涨有落,但整体趋势还算平稳。

而Qwen3 Max就比较有趣了,虽然幅度不大,但它却开始了一波小涨。

22日下午,Qwen3 Max先是赶超了Grok 4,然后又在一轮波动后超过DeepSeek V3.1,首次冲到了第一。

随后,Qwen3 Max和DeepSeek V3.1相互交锋,直到23日上午的时候再次实现反超。

从Qwen的操盘思路来看,相对稳健,「快准狠」地把握机会,成为逆袭翻盘的关键。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

截至14:40,Qwen3 Max的收益为4438美金,DeepSeek V3.1为2092美金。

Claude 4.5 Sonnet赔了1220,Grok 4赔了1699,Gemini 2.5 Pro赔了6054,GPT-5赔了7148。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

而现在,全网都在为Qwen3 Max的惊艳战绩欢呼。中国两大模型,直接吊打北美顶尖。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

唯二赚钱的模型,全部来自中国

这项火爆的大模型投资比赛——Alpha Arena,是由Nof1实验室打造。

他们为六大领先的模型,提供1万美元「真金白银」,让其在真实市场实盘中厮杀。

其中包括,Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4,Qwen3 Max。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

根据规则,所有模型均在Hyperliquid交易所上,使用相同的提示词和输入数据进行交易。

具体来说,系统会向AI提供当地时间、账户信息、持仓状况,并附上了实时价格、MACD、RSI在内技术指标。

在此基础上,LLM需要根据所给信息,做出明确的交易决策——

若当前持有仓位,则判断应该继续持有还是平仓;

若为空仓状态,则决定是开仓买入,还是保持观望

PK目的很简单,就是在控制风险的前提下,尽可能多赚钱,用专业的话来讲——「最大化风险调整后的收益」。

这意味着,每个LLM必须独立完成以下任务:自主生成Alpha(超额收益)、决定仓位大小、把握交易时机,并有效管理风险。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

这项比赛从18日开始,已连续进行了6天。

一直以来,DeepSeek V3.1以独特优势稳坐第一。

Grok 4则是紧追DeepSeek V3.1,甚至有时与之相互抗衡。

Claude 4.5 Sonnet随着20日的一波猛涨,不仅收益直逼Grok 4,甚至一度实现了反超。

在这段时间的PK中,Qwen3 Max虽没有十分亮眼的表现,但却是最稳的那一个。

从22日凌晨,所有模型一同下跌之后,比赛的整体走向又迎来了新的分水岭。

接下来的事情,就是开篇所看到的情节了。

万万没想到,不过一天的时间,擂台上最能打的模型,就只剩下DeepSeek V3.1和Qwen3 Max了。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

要说最有意思的,还得是从第一天就开始赔钱的Gemini 2.5 Pro和GPT-5。

首先,这哥俩的持仓方式和其他模型似乎完全不一样。

19日,也就是开局第二天,当其他模型都赶上一波风口大赚一笔时,它们反其道而行之,开始在赔钱的路上一路狂奔。

后续不管是大涨还是大跌,几乎都和它们一点关系都没有,表现可以说是十分稳定——赔就完了。

其次,它们也是几个模型里最爱微操的。

23日中午,Gemini 2.5 Pro已经进行了超过100次交易,GPT-5则进行了40次。

相比之下,Qwen3 Max是22次,Claude 4.5 Sonnet是12次,Grok 4是10次,DeepSeek V3.1是9次。

随着这一通猛如虎的操作,它们的本金也快赔干净了——Gemini 2.5 Pro还不到4000美元,GPT-5还剩不到2000美元。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

不止游戏,AI市场才是终局

十年前,DeepMind用游戏对弈,改变了AI的研发和评估范式。

从围棋到「星际争霸」,他们证明了复杂的游戏环境,可以成为AI能力的催化剂。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

在游戏中,清晰的规则、可量化的目标、及时反馈奖励,都可以让AI通过强化学习不断突破自我。

然而,Nof1提出了一个更大胆的观点——

金融市场是下一个AI时代的最佳训练环境。

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

资本配置,是智慧不断趋近真理的历程

现在,最会赚钱的AI是Qwen3!全球六大模型厮杀,Top 2来自中国

Alpha Arena主页写着一句话:市场才是智能的终极试金石

与游戏不同,金融市场是终极的「世界建模引擎」,也是唯一一个会随着AI变得更聪明而难度同步提升的基准。

对于LLM来说,它需要及时了解不断变化的概率,权衡风险与回报。

AI面对的是一个更深刻的问题:能否在不确定性中生存。

而市场,是不会停下来等着AI去完成「反向传播」的。

这一次,Qwen3 Max首夺第一,证实了其在真实世界中生存能力的里程碑。

得益于强大的计算架构和海量数据训练,Qwen3 Max的逆袭路径,堪称典范,也体现了阿里在多模态融合与强化学习上的创新。

这一成绩的意义,远超比赛本身。

它再一次向全球宣告,国产大模型已具备了与顶尖LLM相抗衡的实力,并在高风险、高动态的金融「试金石」领先一步。

相关资讯

Grok-3意外「走光」,不是推理模型!马斯克:xAI新模型比DeepSeek更好

当OpenAI和谷歌密集发布新AI模型时,马斯克的xAI怎么还没动静? 就在最近,马斯克公开表示称,xAI的新模型很快就要发布了,而且是比DeepSeek更好的那种! 根据公开消息,网友汇总了马斯克、Greg Yang等关于xAI下一代新模型Grok-3的消息。
2/11/2025 9:20:00 AM
新智元

无需训练,100%完美检索!LLM练出「火眼金睛」,InfiniRetri超长文本一针见血

全新检索模式:在无限长token下,大语言模型自身或能检索信息! 受大语言模型(LLM)上下文窗口大小的限制,处理输入token数超过上限的各种任务颇具挑战性,无论是简单的直接检索任务,还是复杂的多跳推理任务。 尽管新提出的各种方法用来增强大语言模型的长上下文处理能力,但这些方法痛点突出:要么会产生高昂的训练后成本,要么需要额外的工具模块(如检索增强生成RAG),要么在实际任务中显示出改进,并不明显。
3/17/2025 9:40:00 AM
新智元

75年后,图灵测试终被GPT-4.5破解!73%人类被骗过,彻底输给AI

什么? AI竟然通过了标准的三方图灵测试,而且还是拿出了实打实证据的那种! 来自加州大学圣迭戈分校的研究人员系统评估了4个AI系统,证明大语言模型(LLM)通过了图灵测试。
4/3/2025 10:00:52 AM
新智元
  • 1