AI在线 AI在线

GPT-4.5崛起仅六小时便失宠,xAI Grok-3 逆袭夺冠

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。 然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。 根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。

OpenAI 的 GPT-4.5模型在刚刚发布后的六小时内,成功登顶人工智能竞技场,并成为全任务分类的第一名。然而,这一荣耀并未持续太久,马斯克的 xAI Grok-3模型迅速逆袭,反超成为总榜第一名。

根据投票数据显示,GPT-4.5与 Grok-3各自获得超过3000票,最终总分为1412对1411,仅差一分。尽管 GPT-4.5在大多数项目上表现优秀,但 Grok-3在特定的 “带风格控制” 和 “困难提示词” 任务上略有优势,这使得它在总分上实现了反超。

image.png

对于这场 “六小时逆转”,不少用户表示怀疑,认为如此迅速的变化是否合理。对此,有业内人士解释称,竞争榜单设有投票门槛,只有在同一时间内达到3000票的模型才能登上榜单。因此,刚刚发布不久的这两款模型能够同步达到该标准,是一场巧合的结果。

值得一提的是,尽管 GPT-4.5刚发布时面临着一些负面评价,用户对于其高情商的认可度却在日后显著上升。OpenAI 的首席执行官萨姆・奥尔特曼甚至分享了与 GPT-4.5的对话,表示这是他首次收到用户请求其承诺不再下架该模型。

image.png

与此同时,GPT-4.5还在一项另类竞赛中取得了优异表现,参与了一场类似于 “大模型狼人杀” 的游戏。在这场比赛中,各大 AI 模型需进行辩论、策略制定与投票,最终的胜者由被淘汰的成员组成的陪审团决定。GPT-4.5在合作、欺骗及策略制定等方面展现出超越人类的优秀表现。

这一切都表明,人工智能的竞争愈加激烈,各大模型在各自领域内不断创新、提升。未来,谁将最终赢得这场智能之战,值得我们持续关注。

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。
2/16/2025 11:23:49 AM
远洋

马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI

马斯克宣布下周将向SuperGrok订阅者发布Grok 3.5早期测试版,称这是首个能准确回答火箭发动机或电化学技术问题的AI。Grok 3.5能从第一原理推理并得出互联网上不存在的答案。#AI##马斯克#
4/29/2025 3:58:47 PM
远洋

特斯拉 Grok 车载 AI 助手或将推出:多性格定制与儿童模式功能亮相

特斯拉正在加速推出其最新的车载 AI 助手 Grok,预计不久将上线。 尽管目前 Grok 尚未集成到特斯拉的汽车中,但通过固件分析,特斯拉的黑客 “green” 发现了关于 Grok 的多项新功能。 特斯拉首席执行官埃隆・马斯克几个月前曾表示,Grok 将带来更真实的互动体验,用户能够与车辆进行自由对话,询问任何问题。
6/18/2025 10:01:58 AM
AI在线
  • 1