AI在线 AI在线

马斯克开始疯狂剧透Grok 5了

马斯克的Grok 5偷偷藏不住了。 刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4 程序合成技术微调。 好小汁,啥时候开始Grok都弯道超车了?

马斯克的Grok 5偷偷藏不住了。

刚刚ARC-AGI榜单官宣出现新SOTA,用的还是Grok 4+程序合成技术微调

好小汁,啥时候开始Grok都弯道超车了?OpenAI、Anthropic、谷歌一众明星模型都被压一头。

图片

一石激起千层浪,网友纷纷发问,那等Grok5出来,岂不是……

图片

马斯克也随即出来回应:

我现在认为Grok 5能达到AGI。

图片

顺便附赠了一堆有关Grok 5的爆料。

马斯克疯狂剧透Grok 5

这事还得从Grok 4超越预期的表现说起,发布才两个月就登上多个榜单第一的宝座,而就在刚刚,ARC Prize发布了两个最新的ARC-AGI榜单SOTA方案:

  • 都是开源的。
  • 都使用的是Grok 4作为基础模型。
  • 都实现了带测试自适应的程序合成外循环。

图片

先简单介绍一下ARC-AGI排行榜,其旨在评估AI解决复杂难题的能力,类似于人类的智力测试,从而反映LLM的推理能力。

测试任务包含v1和v2版本,v2需要LLM完成更多的多步骤推理,一般来说,即使是最优秀的LLM也只能在v2中获得16%的准确率。

图片

GPT-5在二者上的得分依次是65.7%和9.9%,Claude Opus 4的得分是35.7%和8.6%,而Grok 4则是66.7%和16%。

Jeremy Berman的新方案则是在Grok 4基础上,用英语替代了传统的Python,最终得分来到79.6%和29.44%。

Eric Pang则在Jeremy的工作上,设计了一个受DreamCoder启发、LLM辅助的程序合成系统,能够通过从不断扩展的程序库中学习来解决越来越难的任务。

图片

虽然得分没有进一步升高(77.1%和26%),但是成功让每个任务的平均费用得以下降(v1:8.42美元→2.56美元;v2:30.4美元→3.97美元)。

当问及两位作者选择Grok 4的理由,他们均表示,这是他们测试下来效果最好的模型。

当中所体现出的AGI潜力,也让马斯克感到自豪,随即透露了一系列有关Grok 5的消息。

老马表示,这才只是Grok 4,而Grok 5将很有可能达成AGI

图片

而这个可能性也许能达到10%或者更高,要知道他此前并不认为Grok版本会出现AGI。

图片

与此同时,他表示Grok 5将会在几周之内开始训练

图片

加上此前他曾表示Grok 5将在今年年底前推出,或许我们将在不久后见证新的“LLM怪物”诞生。

所以为什么老马能对Grok 5抱以如此强烈的信心呢?

训练数据及硬件资源的投入

归根结底,是马斯克在Grok训练中投入之深。

据悉,Grok 5将拥有较之前代更多的训练数据

Grok 4的训练量是Grok 2的100倍、Grok 3的10倍,而Grok 5则只会更多。

图片

马斯克拥有一整套的最新真实数据收集体系,其中xAI可以为其提供最新的直接数据,特斯拉可以定期利用FSD和摄像头捕获图像从而生成数据,而擎天柱机器人也能从现实世界中生成大量数据。

可以说,马斯克在当下数据为王的时代,最不缺的就是数据。

此外,xAI在硬件资源上也投入颇多,目标在5年内完成相当于5000万台H100 GPU同等算力的部署。

其专门为Grok系列打造的超级计算集群Colossus,已经部署了约23万张GPU。其中包括3万张NVIDIA GB200(基于Nvidia的Blackwell架构),将会持续为Grok提供强大的算力支持。

图片

不过Grok 5究竟能否真正实现AGI,网友们对此也提出了质疑:毕竟要成为AGI靠的可不仅仅是数据和马斯克的声明,一切还得看成品

图片

所以究竟谁才是能吃到第一只AGI螃蟹的AI公司,且让我们拭目以待。

相关资讯

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上最聪明的人工智能。
2/16/2025 11:23:49 AM
远洋

马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI

马斯克宣布下周将向SuperGrok订阅者发布Grok 3.5早期测试版,称这是首个能准确回答火箭发动机或电化学技术问题的AI。Grok 3.5能从第一原理推理并得出互联网上不存在的答案。#AI##马斯克#
4/29/2025 3:58:47 PM
远洋

马斯克宣布将推出儿童版 AI 应用“Baby Grok”,暂未披露功能细节

AI在线 7 月 20 日消息,马斯克今日通过社交平台 X 宣布,其人工智能公司 xAI 将开发一款专为儿童设计的应用“Baby Grok”。 马斯克未透露“Baby Grok”的具体功能细节,仅表示该应用将为儿童提供“友好型内容”。 AI在线注意到,马斯克于当地时间周一宣布,Grok 付费订阅用户现可试用 AI 聊天机器人新版“虚拟伙伴”(Companions)功能,但也有部分免费用户表示可以访问该功能。
7/20/2025 1:25:42 PM
浩渺
  • 1