AI 模型“炒股”比拼!DeepSeek 收益超14%，Gemini2.5Pro 惨亏四成

作者：AI在线 2025-10-21 05:56

专注于金融市场研究的人工智能实验室 nof1 宣布启动大型模型交易实测项目 Alpha Arena，以检验不同主流大模型在真实金融环境中的交易决策与风险控制能力。此次测试在去中心化交易平台 Hyperliquid 上进行，所有模型均以相同提示与统一数据输入运行，每个模型获得 1万美元真实资金进行独立交易。参与测试的共有六款领先 AI 模型，分别为 GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1 与 Qwen3Max。

专注于金融市场研究的人工智能实验室 nof1 宣布启动大型模型交易实测项目 Alpha Arena，以检验不同主流大模型在真实金融环境中的交易决策与风险控制能力。此次测试在去中心化交易平台 Hyperliquid 上进行，所有模型均以相同提示与统一数据输入运行，每个模型获得 1万美元真实资金进行独立交易。

股票趋势图 (2)

参与测试的共有六款领先 AI 模型，分别为 GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1 与 Qwen3Max。在测试周期结束时，结果显示表现最为突出的是 DeepSeek V3.1与 Grok-4，两者收益率均超过 14%，并列第二名;而 Gemini2.5Pro 的表现不佳，出现高达 4257% 的亏损，成为本轮测试中最意外的结果。

nof1表示，Alpha Arena 的目标并非单纯比较模型优劣，而是验证不同架构在高波动市场中的策略稳定性与风险响应机制，为未来基于 AI 的自主量化交易提供技术与方法论参考。这项实验的推出，也反映出大模型正从文本理解与推理任务，快速向真实金融决策与资产管理场景拓展。

Grok 4.20 炒股封神：2周1万美元变1.2万，12%回报率碾压GPT-5.1与 Gemini 3.0

由量化平台 nof1.ai 主办的 Alpha Arena1.5赛季揭晓成绩单:xAI 内部代号 Grok4.20的实验模型以 12.11% 报率夺冠，将1万美元起始资金在14个交易日内变为12，193美元，成为唯一实现正收益的大型语言模型;同期 GPT-51与 Gemini3.0分别亏损3.4% 与5.7%。四种“地狱模式”下无人干预赛事规则禁止任何人类调仓，模型需在“苦行僧模式”（高杠杆限制）与“情境感知模式”(可窥探对手持仓)之间自动切换。 Grok4.20在情境感知回合提前2小时建立 Palantir(PLTR)10倍杠杆多单，当日散户情绪指数飙升38%，收盘获利11.4%，被主办方称为“教科书级情绪套利”。

12/8/2025 9:46:33 AM AI在线

DeepSeek V3.1被曝“极字Bug”:API调用惊现神秘字符，官方已回应

AIbase报道近日，大模型社区因DeepSeek V3.1的一个神秘“极字Bug”而炸开了锅。多位开发者陆续发现，在使用API进行代码开发时，模型的输出结果中会随机夹杂着“极”字，引发了广泛讨论和担忧。这一问题最初在火山引擎和chutes等平台上被开发者们发现，随后迅速蔓延至更多平台，包括腾讯的CodeBuddy，甚至在DeepSeek官方自己的服务中也出现了类似情况。

8/27/2025 2:57:07 PM AI在线

特斯拉 Grok 车载 AI 助手或将推出:多性格定制与儿童模式功能亮相

特斯拉正在加速推出其最新的车载 AI 助手 Grok，预计不久将上线。尽管目前 Grok 尚未集成到特斯拉的汽车中，但通过固件分析，特斯拉的黑客 “green” 发现了关于 Grok 的多项新功能。特斯拉首席执行官埃隆・马斯克几个月前曾表示，Grok 将带来更真实的互动体验，用户能够与车辆进行自由对话，询问任何问题。

6/18/2025 10:01:58 AM AI在线

AI 模型“炒股”比拼!DeepSeek 收益超14%，Gemini2.5Pro 惨亏四成

相关资讯

Grok 4.20 炒股封神：2周1万美元变1.2万，12%回报率碾压GPT-5.1与 Gemini 3.0

DeepSeek V3.1被曝“极字Bug”:API调用惊现神秘字符，官方已回应

特斯拉 Grok 车载 AI 助手或将推出:多性格定制与儿童模式功能亮相