AI在线 AI在线

AI国际象棋大赛火热开战!Grok 4一骑绝尘,DeepSeek与 Kimi K2的冤屈

近日,谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。 在这一场 “智力的较量” 中,马斯克旗下的 Grok4展现了非凡的实力,成为首日比赛的绝对焦点。 这场比赛聚集了多款顶尖 AI 模型,参赛选手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude Opus4和 Grok4。

近日,谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中,马斯克旗下的 Grok4展现了非凡的实力,成为首日比赛的绝对焦点。

这场比赛聚集了多款顶尖 AI 模型,参赛选手包括 OpenAI 的 o3和 o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash、Claude Opus4和 Grok4。比赛于8月5日至7日每天下午10:30(太平洋时间)准时直播,国际象棋特级大师中村光(Hikaru Nakamura)也受邀担任解说。

马斯克、xAI、Grok

首日对决中,Grok4以超凡的战术表现和快速反应获得了最高评价,而 DeepSeek R1虽表现强劲,但不敌 o4-mini,Kimi K2则被认为惨遭不公,网友们纷纷为其鸣冤。马斯克对此次比赛的成功表现淡定回应:“我们并没有特别训练,这只是一个副产品。” 可见,他对此次比赛的宣传价值可谓深谙其道。

虽然比赛结果引起了热议,但其真正的意义在于测试 AI 的 “涌现能力”。国际象棋以其明确的规则和高复杂度(存在约10^120种可能局面)成为了评估 AI 决策能力的理想舞台。很多网友表示,这场比赛不仅仅是输赢的较量,更是 AI 综合能力的全面展示。

经过首轮较量,Grok4与 Gemini2.5Pro、OpenAI 的 o4-mini 和 o3晋级半决赛。各对决中,Grok4如猛兽般的表现让人惊叹,而 Kimi K2的频繁违规行为则让其面临被淘汰的境地,观众对此颇有微词。尽管如此,比赛仍在继续,大家期待后续的精彩对决。

为何选择国际象棋作为 AI 对战的舞台?这主要是因为国际象棋规则清晰但战略复杂,能够有效评估 AI 的决策能力。正如网友所说,这场比赛的结果不仅是对各模型能力的检测,更是对 AI 技术的一次深度探索。

相关资讯

​Google Kaggle 举办 AI 国际象棋锦标赛,模型智力较量即将展开

在人工智能领域,围棋和国际象棋等战略游戏一直是测试模型推理能力的重要舞台。 最近,Google DeepMind 与 Kaggle 联合宣布,将于8月5日至7日举办一场 AI 国际象棋锦标赛。 这场比赛不仅汇聚了全球性能最强的人工智能模型,还将通过 Kaggle 全新推出的 Game Arena 平台进行直播,吸引了广泛的关注。
8/5/2025 3:01:52 PM
AI在线

OpenAI o4-mini携强化微调正式上线,AI专业能力迈向专家级

5月8日,OpenAI o4-mini携强化微调正式上线。 这两项技术的结合彻底改变了AI专业化的成本结构和技术门槛,让企业能以少量训练数据将通用AI迅速转变为特定领域的专家系统。 从通用智能到专家级AI的跨越式飞跃强化微调技术作为此次发布的核心亮点,标志着OpenAI在定制化模型领域取得重大突破。
5/9/2025 5:00:51 PM
AI在线

OpenAI CEO 奥尔特曼宣布本周将推出多款新产品

OpenAI 的创始人兼首席执行官山姆・奥尔特曼在社交平台𝕏上发布消息,宣布接下来的一周将推出 “很多” 令人期待的新产品。 这些产品将从周二开始陆续上线,吸引了众多科技爱好者和业内人士的关注。 奥尔特曼在本月初曾提到,OpenAI 可能会在几周内发布新版本的 o3和 o4-mini,并预计在未来几个月发布 GPT-5。
4/14/2025 10:01:22 AM
AI在线
  • 1