AI在线 AI在线

AlphaArena

Grok 4.20 炒股封神:2周1万美元变1.2万,12%回报率碾压GPT-5.1与 Gemini 3.0

由量化平台 nof1.ai 主办的 Alpha Arena1.5赛季揭晓成绩单:xAI 内部代号 Grok4.20的实验模型以 12.11% 报率夺冠,将1万美元起始资金在14个交易日内变为12,193美元,成为唯一实现正收益的大型语言模型;同期 GPT-51与 Gemini3.0分别亏损3.4% 与5.7%。 四种“地狱模式”下无人干预赛事规则禁止任何人类调仓,模型需在“苦行僧模式”(高杠杆限制)与“情境感知模式”(可窥探对手持仓)之间自动切换。 Grok4.20在情境感知回合提前2小时建立 Palantir(PLTR)10倍杠杆多单,当日散户情绪指数飙升38%,收盘获利11.4%,被主办方称为“教科书级情绪套利”。
12/8/2025 9:46:33 AM
AI在线

AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成

专注于金融市场研究的人工智能实验室 nof1 宣布启动大型模型交易实测项目 Alpha Arena,以检验不同主流大模型在真实金融环境中的交易决策与风险控制能力。 此次测试在去中心化交易平台 Hyperliquid 上进行,所有模型均以 相同提示与统一数据输入 运行,每个模型获得 1万美元真实资金 进行独立交易。 参与测试的共有六款领先 AI 模型,分别为 GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1 与 Qwen3Max。
10/21/2025 5:56:09 PM
AI在线