AI在线 AI在线

​国产大模型首登顶!文心5.0 Preview在LMArena全球竞技场拿下中国最高分

近日,全球公认的大模型“竞技场”LMArena发布了最新的模型排名。 根据AIbase获悉的最新数据显示,百度新一代模型ERNIE-5.0-Preview-1203凭借1451的高分正式登上文本榜单。 值得关注的是,这一成绩使其成功问鼎国内大模型第一的宝座,标志着国产原生大模型在国际主流测评体系中取得了里程碑式的突破。

近日,全球公认的大模型“竞技场”LMArena发布了最新的模型排名。根据AIbase获悉的最新数据显示,百度新一代模型ERNIE-5.0-Preview-1203凭借1451的高分正式登上文本榜单。值得关注的是,这一成绩使其成功问鼎国内大模型第一的宝座,标志着国产原生大模型在国际主流测评体系中取得了里程碑式的突破。

image.png

在实际测评表现中,文心5.0Preview展示了极强的综合实力,尤其在创意写作和高难度复杂指令的理解上表现尤为突出。据LMArena榜单反馈,该模型能够精准捕捉用户的深层需求,生成的文本内容不仅结构清晰,且在逻辑一致性上超过了多款国内外主流模型。此前,该模型在视觉理解榜单中也已展现出领先优势,稳居国内首位。

作为百度今年11月发布的旗舰级原生全模态大模型,文心5.0的参数量达到了惊人的2.4万亿。AIbase了解到,该模型采用了先进的原生全模态统一建模技术。这意味着它不再是简单地将不同模型组合,而是实现了文本、图像、音频、视频等多种信息的原生融合。无论是在理解还是生成能力上,文心5.0都展示了全模态大模型的协同效应,进一步降低了复杂任务的处理门槛。

从2019年首次发布至今,文心系列模型经历了多次迭代。此次5.0Preview版本在LMArena的亮眼表现,不仅是技术参数的堆叠,更是国产大模型在处理中文语境及复杂逻辑任务上趋于成熟的体现。

划重点:

  • 🏆 排名新高:文心5.0Preview以1451分登上LMArena文本榜,位居国内第一、全球并列第二。

  • 🧠 性能卓越:模型在创意写作和复杂任务场景下表现优异,具备极强的指令遵循与逻辑生成能力。

  • 🌐 超大规模:该模型参数量达2.4万亿,采用原生全模态建模技术,支持文、图、音、视全方位交互。

相关资讯

开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

开源即登顶!文心思考模型ERNIE-4.5-21B-A3B-Thinking登顶HuggingFace全球模型趋势榜

据HuggingFace官网数据,截至2025年9月11日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趋势榜上排名第一,模型总榜排名第三。 据介绍,ERNIE-4.5-21B-A3B-Thinking 采用了混合专家(MoE) 架构,总参数规模达21B,每个 token 激活 3B参数,通过指令微调及强化学习训练。 ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。
9/11/2025 6:04:23 PM 量子位的朋友们
百度重磅发布新一代多模态AI模型ERNIE-4.5-VL

百度重磅发布新一代多模态AI模型ERNIE-4.5-VL

近日,百度在人工智能领域又迈出了重要一步,正式发布了其最新的多模态思考模型 ——ERNIE-4.5-VL-28B-A3B-Thinking。 这个新模型不仅具备强大的语言处理能力,还引入了 “图像思考” 的创新功能,意味着它在理解和处理图像方面有了显著提升。 根据百度的介绍,ERNIE-4.5-VL 模型采用了仅有3B 的激活参数,展现出优秀的计算效率和灵活性。
11/11/2025 2:56:36 PM AI在线
刷新50多个NLP任务基准,并登顶SuperGLUE全球榜首,百度ERNIE 3.0知识增强大模型显威力

刷新50多个NLP任务基准,并登顶SuperGLUE全球榜首,百度ERNIE 3.0知识增强大模型显威力

百度 ERNIE 3.0 不仅一举刷新 54 个中文 NLP 任务基准,而且进一步挖掘大规模预训练模型的潜力,首次在百亿级预训练模型中引入大规模知识图谱。
7/6/2021 2:38:00 PM 机器之心