Grok 4 发布，地表最强 AI，所有学术领域达到博士水平

作者： 2025-07-10 02:42

7月9日晚间，Elon Musk正式发布他迄今为止最强的人工智能模型：Grok 4。这款模型由他领导的xAI团队打造，被Musk本人形容为“大爆炸级别的智能进化”。在推特上，官方账号称：Grok 4是“地表最强”（世界上最强大）的AI模型。

7月9日晚间，Elon Musk正式发布他迄今为止最强的人工智能模型：Grok 4。

这款模型由他领导的xAI团队打造，被Musk本人形容为“大爆炸级别的智能进化”。

在推特上，官方账号称：Grok 4是“地表最强”（世界上最强大）的AI模型。显然，这不是简单升级，而是一次全方位能力的跃迁。

图片

据悉，Grok 4具备自然语音对话功能，能像人类一样顺畅表达，打破以往AI对话割裂感。

它不仅能处理文本，还可支持图像输入，未来甚至可能加入视频识别功能，大步迈入真正的多模态AI时代。

开发者还将获得“Grok 4 Code”专属版本，用于写代码、调试和解释逻辑，直逼GitHub Copilot与GPT-4的水平。

据说，Grok 4不只是聪明，它甚至“会唱歌”，声音自然，还能理解互联网语言、俚语和段子，成为最懂网络文化的AI之一。

图片

目前，对于Gork-4，在官网付费用户已经可以使用。

Grok 4的发布并非“情绪宣传”，而是有硬核数据为背书。根据Artificial Analysis的完整基准测试，Grok 4以AI指数73分，首次登顶全球第一。

图片

这一分数直接击败了OpenAI的O3（70分）、Google的Gemini 2.5 Pro（70分）和Anthropic的Claude 4 Opus（64分）。

更关键的是，Grok 4在数学、编码和综合推理测试中全面碾压，成为“人类最后的考试”上表现最强的AI。

在LiveCodeBench和SciCode测试中，Grok 4取得编码准确率88%，创造历史最高纪录。

Image

图片来源：https://x.com/apples_jimmy/status/1943167164359545137/photo/1

在GPQA Diamond测试中也拿下88%的高分，超过此前由Gemini 2.5 Pro保持的84%记录。

“人类最后的考试”中，Grok 4 heavy版获得50.7%的突破性成绩，是目前唯一触及这一高度的模型。

在AIME 2024和MMLU-Pro这两项权威测试中，分别斩获94%和87%的惊人得分。

图片

据推特网友，对于这个模型的能力，Elon Musk说：“Grok 4可能在所有领域达到博士水平的模型。”

图片

也有技术观察者提醒：“那场考试的名字叫‘人类最后的考试’，但很可能不是AI的极限，而是人类理解力的终点。”

此外，虽然它的输出速度（75 tokens/s）低于O3（188 tokens/s）和Gemini 2.5 Pro（142 tokens/s），但依旧优于Claude 4 Opus（66 tokens/s），性能稳居一线。

同时，Grok 4支持长达256k token的上下文处理，允许进行复杂文档分析与记忆性任务处理。

它还能调用函数、生成结构化结果，整体架构更适合应用于科研、商业、教育等高负载任务场景。

定价方面仍与Grok 3持平：每百万输入token收取3美元，输出为15美元，缓存输入更低至0.75美元。

相关资讯