AI 大战超级玛丽！Claude 3.7 封神：Gemini、GPT-4o 全军覆没，谁才是游戏界真王者？

作者：AI在线 2025-03-04 05:00

谁是游戏界真王者?AI 竟向经典游戏《超级马力欧兄弟》发起挑战! 加州大学圣地亚哥分校 Hao 人工智能实验室传来惊人战报:在一场别开生面的 AI “马力欧” 大乱斗中，Anthropic 旗下的 Claude3.7模型 “一骑绝尘”，力压群雄，荣登 “最强 AI 马力欧” 宝座! 紧随其后的是同门师弟 Claude3.5，而谷歌 Gemini1.5Pro 和 OpenAI 的 GPT-4o 这两位 “AI 界大佬” 却意外 “翻车”，表现令人大跌眼镜!

这场 AI “马力欧” 争霸赛，并非在古老的红白机上进行，而是在一个 “高科技” 模拟器中展开。研究人员专门打造了一个名为 GamingAgent 的框架，作为 AI 与游戏世界的 “桥梁”。在这个虚拟世界里， AI 化身 “马力欧”，手握 “游戏手柄”，接收来自系统的 “作战指令”: “前方有障碍!跳!”，“敌人来袭!躲!”，指令简洁明了，却也充满挑战。系统还会 “贴心” 地送上游戏截图，帮助 “AI 马力欧” “眼观六路，耳听八方”，更好地 “掌控” 战局。更酷的是， AI 竟然能 “现场编写” Python 代码，指挥 “马力欧” 做出各种 “骚操作”，上蹿下跳，躲避障碍，简直 “秀” 到飞起!

然而，赛场上的 “战况” 却出人意料。那些 “身经百战” 、以 “推理能力” 著称的 AI 模型，比如 OpenAI 的 o1，竟然 “马失前蹄”，表现还不如一些 “非推理型” 选手! 这是为何? 原来， “推理大神” 也有 “致命弱点”—— “反应太慢”! 在《超级马力欧兄弟》这种 “分秒必争” 的实时游戏中， “推理模型” 需要花费数秒钟 “深思熟虑” 才能 “慢吞吞” 地做出决策，但 “战机稍纵即逝”，一秒钟的 “迟疑”，就可能导致 “马力欧” “命丧黄泉”! 看来，在瞬息万变的游戏世界里， “反应速度” 才是 “硬道理”!

尽管游戏早已成为 AI 竞技的 “重要舞台”，但也有专家对此 “另眼相看”。在他们看来，游戏世界毕竟是 “虚拟世界”，与 “真实世界” 相比，还是 “Too young， Too simple”! 游戏环境 “过于简单” 和 “抽象”， AI 可以从中 “无限量” 地 “刷经验值”，积累 “理论数据”，但 “纸上谈兵终觉浅”，这些 AI 模型的 “真实能力” 究竟如何，还有待 “实战检验”。 OpenAI 的研究科学家安德烈・卡帕西甚至发出了 “评估危机” 的 “灵魂拷问”，让人不禁 “陷入沉思”。

不过，质疑归质疑，围观 AI “花式玩转” 超级玛丽，依然是一场 “赏心悦目” 的 “技术秀”，它生动地展现了 AI 技术的 “日新月异”，也为我们打开了一扇 “窥探未来” 的 “窗口”。谁能想到，曾经只能在 “棋盘” 上 “运筹帷幄” 的 AI，如今也能在 “游戏世界” 里 “大显身手”? 或许在不久的将来， AI 真的能 “统治” 游戏界，甚至 “超越” 人类玩家，成为 “游戏界” 的 “真·王者”! 让我们拭目以待!

研究：生成式 AI 更像是记忆大师而非推理高手

生成式 AI 的迅猛发展和广泛应用引发了诸多担忧，从隐私安全到潜在的失业危机。虽然 AI 聊天机器人如 ChatGPT 和微软 Copilot 在短短时间内取得了惊人进步，能够写代码、纠错甚至挑战人类创意，但它们真的像表面看起来那么聪明吗？麻省理工学院计算机科学与人工智能实验室（CSAIL）的一项最新研究指出，这些强大的大型语言模型（LLM）似乎更依赖记忆而不是真正的推理能力。它们在熟悉的任务上表现出色，但在面对新问题时却显得力不从心。AI在线注意到，研究人员通过对比 AI 在不同任务上的表现得出这一结论。例如，G

7/17/2024 4:18:05 PM 远洋

Faker 回应马斯克英雄联盟 AI 挑战：我们明年可能会赢，但 AI 迟早能赢

AI在线 12 月 19 日消息，埃隆・马斯克今年 11 月在 X 平台发帖称，AI 大模型 Grok 5 将在 2026 年挑战《英雄联盟》顶级人类战队。对此，《英雄联盟》T1 战队选手、全球总决赛“六冠王”Faker（李相赫）在 12 月 18 日的新闻发布会上表示，他相信自己的队伍能够在明年可能举行的比赛中击败 Grok AI 对手。据 Korea JoongAng Daily 报道，Faker 欢迎马斯克提出的挑战。

12/19/2025 8:55:25 PM 汪淼

每帧都是AI实时生成的，全球首款AI游戏问世了！

欢迎来到 Transformer 的世界。两个月前，我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。他们实现了历史性的突破，从此不再需要游戏引擎，AI 能基于扩散模型，为玩家生成实时可玩的游戏。

11/2/2024 3:04:00 PM 机器之心

AI 大战超级玛丽！Claude 3.7 封神：Gemini、GPT-4o 全军覆没，谁才是游戏界真王者？

相关资讯

研究：生成式 AI 更像是记忆大师而非推理高手

Faker 回应马斯克英雄联盟 AI 挑战：我们明年可能会赢，但 AI 迟早能赢

每帧都是AI实时生成的，全球首款AI游戏问世了！