xAI 推出了 Grok4Fast,这是一款轻量级的旗舰模型,据该公司称,其性能可媲美 Grok4,但计算量减少了40%。据AIbase报道,这一显著的效率提升使得每项任务的成本最多可降低98%。
性能与效率的平衡
Grok4Fast 在多个基准测试中表现出色,例如在 GPQA Diamond 中得分高达85.7%,在 AIME2025 中得分为92.0%,这些成绩与 Grok4甚至 GPT-5等顶尖模型不相上下。xAI 强调,该模型通过减少“思考标记”实现了这一成就,平均使用比 Grok4少40% 的标记就能获得相似的结果。在处理需要复杂推理的问题时,这种效率优势尤为突出。
集成架构与外部工具
与依赖单独模型处理不同任务的早期版本不同,Grok4Fast 将两种方法整合到一个架构中,并通过系统提示进行行为控制,体现了混合模型的最新趋势。
该模型还具备强大的外部工具使用能力,包括网页浏览和代码执行。在 BrowseComp 和 X Bench Deepsearch 等基准测试中,Grok4Fast 的表现均优于 Grok4。在 LMArena-Search 基准测试中,它甚至超越了此前领先的 OpenAI o3-websearch 模型。在 Text Arena 排名中,Grok4Fast 暂列第八,领先于其他同等规模的模型。
可用性与定价
Grok4Fast 提供了两个版本,一个针对推理密集型任务优化,另一个则专注于快速解答。两个版本都支持200万个令牌的上下文窗口。该模型可通过 grok.com、iOS 和 Android 应用程序以及 xAI API 获取。其定价为每百万个令牌0.05美元至1.00美元,具体取决于令牌类型。目前,用户也可以通过 OpenRouter 和 Vercel 免费使用 Grok4Fast。