AI在线 AI在线

从编码到创意写作 xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场

xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。 这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。  xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。

xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。

 xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3,000票,并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型(LLM)评估的众包平台,使用 Elo 评级系统为模型排名,提供全面的性能衡量。

QQ20250304-093515.png

这一成就标志着 xAI 和其创始人埃隆·马斯克在 AI 发展领域的显著进展。马斯克一直倡导开发强大且与人类价值观相符的 AI。Grok-3在这一基准测试中的成功凸显了模型的能力,以及 xAI 在竞争激烈的 AI 领域的进步。

值得注意的是,“grok-3preview-02-24”被描述为最新生产模型,但名称中包含“preview”,这可能表明它仍处于测试阶段,这一细节可能引发对其完全生产就绪性的讨论。

相关资讯

MiniMax Speech-02碾压OpenAI与ElevenLabs,登顶全球TTS榜首

MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权威榜单,力压ElevenLabs、OpenAI等国际顶尖竞争对手。 这款模型以超高语音逼真度和多语言支持惊艳业界,成为AI语音技术的全新标杆。 AIbase综合最新动态,深入解析Speech-02的技术亮点及其对行业的深远影响。
5/16/2025 3:00:55 PM
AI在线

Figure 02 人形机器人明日发布,创始人放豪言称其“地表最强”

北京时间 8 月 2 日晚间,由 OpenAI 等公司支持的 Figure AI 发布了旗下新一代人形机器人 Figure 02 的预告片,并宣布将于 8 月 6(明)日正式发布。 预告片的重点在于这款机器人的硬件。其展示了 Figure 02 的关节、肢体细节,手指运动相当灵活,关节活动度可达 195°、扭矩额定值高达 150N・m。Figure AI 创始人 Brett Adcock 更是宣称,Figure 02 将是地球上最先进的人形机器人。该公司曾在今年 3 月展示了 Figure 01 的技能和参数。据A
8/5/2024 9:52:18 AM
清源

国产MiniMax语音模型横扫国际舞台,迈入个性化语音新时代

在人工智能领域的快速发展中,国产大模型的进步速度让人惊叹。 早在今年初,DeepSeek-R1以超低成本获得了超越 OpenAI 的表现,令人重新审视国外大模型的垄断地位。 如今,MiniMax 再次带来了重磅消息:其全新一代文本转语音(TTS)模型 “Speech-02” 在国际权威的语音评测榜单 Artificial Analysis 上强势登顶,击败了 OpenAI 和 ElevenLabs 等行业巨头。
5/16/2025 10:01:05 AM
AI在线
  • 1