7月9日晚间,Elon Musk正式发布他迄今为止最强的人工智能模型:Grok 4。
这款模型由他领导的xAI团队打造,被Musk本人形容为“大爆炸级别的智能进化”。
在推特上,官方账号称:Grok 4是“地表最强”(世界上最强大)的AI模型。显然,这不是简单升级,而是一次全方位能力的跃迁。
图片
据悉,Grok 4具备自然语音对话功能,能像人类一样顺畅表达,打破以往AI对话割裂感。
它不仅能处理文本,还可支持图像输入,未来甚至可能加入视频识别功能,大步迈入真正的多模态AI时代。
开发者还将获得“Grok 4 Code”专属版本,用于写代码、调试和解释逻辑,直逼GitHub Copilot与GPT-4的水平。
据说,Grok 4不只是聪明,它甚至“会唱歌”,声音自然,还能理解互联网语言、俚语和段子,成为最懂网络文化的AI之一。
图片
目前,对于Gork-4,在官网付费用户已经可以使用。
Grok 4的发布并非“情绪宣传”,而是有硬核数据为背书。根据Artificial Analysis的完整基准测试,Grok 4以AI指数73分,首次登顶全球第一。
图片
这一分数直接击败了OpenAI的O3(70分)、Google的Gemini 2.5 Pro(70分)和Anthropic的Claude 4 Opus(64分)。
更关键的是,Grok 4在数学、编码和综合推理测试中全面碾压,成为“人类最后的考试”上表现最强的AI。
在LiveCodeBench和SciCode测试中,Grok 4取得编码准确率88%,创造历史最高纪录。
Image
图片来源:https://x.com/apples_jimmy/status/1943167164359545137/photo/1
在GPQA Diamond测试中也拿下88%的高分,超过此前由Gemini 2.5 Pro保持的84%记录。
“人类最后的考试”中,Grok 4 heavy版获得50.7%的突破性成绩,是目前唯一触及这一高度的模型。
在AIME 2024和MMLU-Pro这两项权威测试中,分别斩获94%和87%的惊人得分。
图片
据推特网友,对于这个模型的能力,Elon Musk说:“Grok 4可能在所有领域达到博士水平的模型。”
图片
也有技术观察者提醒:“那场考试的名字叫‘人类最后的考试’,但很可能不是AI的极限,而是人类理解力的终点。”
此外,虽然它的输出速度(75 tokens/s)低于O3(188 tokens/s)和Gemini 2.5 Pro(142 tokens/s),但依旧优于Claude 4 Opus(66 tokens/s),性能稳居一线。
同时,Grok 4支持长达256k token的上下文处理,允许进行复杂文档分析与记忆性任务处理。
它还能调用函数、生成结构化结果,整体架构更适合应用于科研、商业、教育等高负载任务场景。
定价方面仍与Grok 3持平:每百万输入token收取3美元,输出为15美元,缓存输入更低至0.75美元。