通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

作者：问舟 2025-01-29 03:15

据介绍，通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

感谢新年之际，阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型，大家可以通过 API 的方式进行访问，也可以登录 Qwen Chat 进行体验，例如直接与模型对话，或者使用 artifacts、搜索等功能。

据介绍，通义千问 Qwen 2.5-Max 使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

性能

阿里云直接对比了指令模型的性能表现（AI在线注：指令模型即我们平常使用的可以直接对话的模型）。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，结果如下：

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，阿里云将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示：

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

我们的基座模型在大多数基准测试中都展现出了显著的优势。我们相信，随着后训练技术的不断进步，下一个版本的 Qwen2.5-Max 将会达到更高的水平。

AI 发现16万种新RNA病毒成果登上《Cell》后，我们和阿里云算法专家贺勇聊了聊

近期，AI for Science 领域的惊喜不断，持续在物理、化学、生物领域开花结果。不仅诺贝尔物理和化学奖双双颁给 AI 领域的科学家，阿里云与中山大学的科研也带来了RNA病毒寻找的突破，国际顶级学术期刊《Cell》收录了这一研究论文。《基于人工智能探索和记录隐藏的RNA病毒世界》论文提出深度学习模型"LucaProt"，用于快速准确判别RNA病毒，颠覆传统病毒发现方法。

10/15/2024 3:18:00 PM 王轶群

通义千问 Qwen 2.5-Max 超大规模 MoE 模型发布：号称优于 Deepseek V3 等竞品，暂未开源

性能

相关资讯

AI 发现16万种新RNA病毒成果登上《Cell》后，我们和阿里云算法专家贺勇聊了聊

从 DeepSeek 火热，到李飞飞团队新成果，“幕后高手”竟是它

全球第一：阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI 大模型榜单