AI在线 AI在线

AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成

专注于金融市场研究的人工智能实验室 nof1 宣布启动大型模型交易实测项目 Alpha Arena,以检验不同主流大模型在真实金融环境中的交易决策与风险控制能力。 此次测试在去中心化交易平台 Hyperliquid 上进行,所有模型均以 相同提示与统一数据输入 运行,每个模型获得 1万美元真实资金 进行独立交易。 参与测试的共有六款领先 AI 模型,分别为 GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1 与 Qwen3Max。

专注于金融市场研究的人工智能实验室 nof1 宣布启动大型模型交易实测项目 Alpha Arena,以检验不同主流大模型在真实金融环境中的交易决策与风险控制能力。此次测试在去中心化交易平台 Hyperliquid 上进行,所有模型均以 相同提示与统一数据输入 运行,每个模型获得 1万美元真实资金 进行独立交易。

股票趋势图 (2)

参与测试的共有六款领先 AI 模型,分别为 GPT-5、Gemini2.5Pro、Grok-4、Claude Sonet4.5、DeepSeek V3.1 与 Qwen3Max。在测试周期结束时,结果显示表现最为突出的是 DeepSeek V3.1与 Grok-4,两者收益率均超过 14%,并列第二名;而 Gemini2.5Pro 的表现不佳,出现高达 4257% 的亏损,成为本轮测试中最意外的结果。

nof1表示,Alpha Arena 的目标并非单纯比较模型优劣,而是验证不同架构在高波动市场中的策略稳定性与风险响应机制,为未来基于 AI 的自主量化交易提供技术与方法论参考。这项实验的推出,也反映出大模型正从文本理解与推理任务,快速向 真实金融决策与资产管理场景 拓展。

相关资讯

DeepSeek V3.1被曝“极字Bug”:API调用惊现神秘字符,官方已回应

AIbase报道 近日,大模型社区因DeepSeek V3.1的一个神秘“极字Bug”而炸开了锅。 多位开发者陆续发现,在使用API进行代码开发时,模型的输出结果中会随机夹杂着“极”字,引发了广泛讨论和担忧。 这一问题最初在火山引擎和chutes等平台上被开发者们发现,随后迅速蔓延至更多平台,包括腾讯的CodeBuddy,甚至在DeepSeek官方自己的服务中也出现了类似情况。
8/27/2025 2:57:07 PM
AI在线

特斯拉 Grok 车载 AI 助手或将推出:多性格定制与儿童模式功能亮相

特斯拉正在加速推出其最新的车载 AI 助手 Grok,预计不久将上线。 尽管目前 Grok 尚未集成到特斯拉的汽车中,但通过固件分析,特斯拉的黑客 “green” 发现了关于 Grok 的多项新功能。 特斯拉首席执行官埃隆・马斯克几个月前曾表示,Grok 将带来更真实的互动体验,用户能够与车辆进行自由对话,询问任何问题。
6/18/2025 10:01:58 AM
AI在线

DeepSeek-V3 模型完成小版本升级,已可试用体验

DeepSeek 在其官方交流群宣布称,DeepSeek-V3 模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。
3/24/2025 9:10:06 PM
远洋
  • 1