阿里云通义千问 Qwen 3 旗舰版模型宣布更新：性能全面提升，超越 Kimi、DeepSeek 等行业顶尖水平

作者：问舟 2025-07-22 06:34

AI在线 7 月 22 日消息，阿里云今天更新了旗舰版 Qwen3 模型，推出 Qwen3-235B-A22B-FP8 非思考模式（Non-thinking）的更新版本，命名为 Qwen3-235B-A22B-Instruct-2507-FP8。阿里云表示，在经过与社区沟通和深思熟虑后，决定停止使用混合思考模式，转为分别训练 Instruct 和 Thinking 模型，以获得最佳质量。据介绍，新的 Qwen3 模型通用能力显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面，在 GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等众多测评中表现出色，超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。

AI在线 7 月 22 日消息，阿里云今天更新了旗舰版 Qwen3 模型，推出 Qwen3-235B-A22B-FP8 非思考模式（Non-thinking）的更新版本，命名为 Qwen3-235B-A22B-Instruct-2507-FP8。

阿里云表示，在经过与社区沟通和深思熟虑后，决定停止使用混合思考模式，转为分别训练 Instruct 和 Thinking 模型，以获得最佳质量。

据介绍，新的 Qwen3 模型通用能力显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面，在 GQPA（知识）、AIME25（数学）、LiveCodeBench（编程）、Arena-Hard（人类偏好对齐）、BFCL（Agent 能力）等众多测评中表现出色，超过 Kimi-K2、DeepSeek-V3 等顶级开源模型以及 Claude-Opus4-Non-thinking 等领先闭源模型。

阿里云通义千问 Qwen 3 旗舰版模型宣布更新：性能全面提升，超越 Kimi、DeepSeek 等行业顶尖水平

模型概述

FP8 版本的 Qwen3-235B-A22B-Instruct-2507 具有以下功能特点：

类型：因果语言模型 / 自回归语言模型
训练阶段：预训练与后训练
参数量：总共 235B，激活 22B
参数量（非嵌入）：234B
层数：94
注意头数（GQA）： Q 为 64，KV 为 4
专家数：128
激活专家数：8
上下文长度：原生支持 262,144。

阿里云表示，本次更新的 Qwen3 模型，还增强了以下关键性能：

在多语言的长尾知识覆盖方面，模型取得显著进步。
在主观及开放性任务中，模型显著增强了对用户偏好的契合能力，能够提供更有用的回复，生成更高质量的文本。
长文本提升到 256K，上下文理解能力进一步增强。

阿里云通义千问 Qwen 3 旗舰版模型宣布更新：性能全面提升，超越 Kimi、DeepSeek 等行业顶尖水平

目前，Qwen3 新模型已在魔搭社区和 HuggingFace 上开源更新，AI在线附官方地址：

官网地址：https://chat.qwen.ai/
HuggingFace：https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
魔塔社区：https://modelscope.cn/models/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

近日，阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型，旨在通过文本指令生成或克隆声音。其中，Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音，用户可以精确定义声音的特征，如情感和说话节奏。例如，用户可以请求生成一个 “中年男性，洪亮的男中音 —— 充满活力的广告解说，快速的语速，夸张的音调变化，充满销售魅力的声音”。

12/24/2025 11:41:18 AM AI在线

通义千问再放大招！Qwen3-VL 家族新增 2B 与 32B 模型，开源矩阵全面升级

当全球大模型竞赛进入深水区，阿里云选择用更密集、更开放的模型矩阵回应挑战。 10 月 22 日，通义千问团队正式推出 Qwen3-VL 家族的两款全新密集型（Dense）模型——2B 与 32B，不仅填补了现有产品线的关键档位，更将整个系列的开源模型数量推至 24 个，构建起从轻量级到超大规模的完整技术生态。至此，Qwen3-VL 家族已拥有四款 Dense 模型（2B、4B、8B、32B）和两款 Mixture of Experts（MoE）架构模型（30B-A3B 与 235B-A22B），参数规模横跨 20 亿至 2350 亿，精准覆盖从边缘设备部署到云端超大规模推理的全场景需求。

10/22/2025 3:02:02 PM AI在线

AI 发现16万种新RNA病毒成果登上《Cell》后，我们和阿里云算法专家贺勇聊了聊

近期，AI for Science 领域的惊喜不断，持续在物理、化学、生物领域开花结果。不仅诺贝尔物理和化学奖双双颁给 AI 领域的科学家，阿里云与中山大学的科研也带来了RNA病毒寻找的突破，国际顶级学术期刊《Cell》收录了这一研究论文。《基于人工智能探索和记录隐藏的RNA病毒世界》论文提出深度学习模型"LucaProt"，用于快速准确判别RNA病毒，颠覆传统病毒发现方法。

10/15/2024 3:18:00 PM 王轶群

阿里云通义千问 Qwen 3 旗舰版模型宣布更新：性能全面提升，超越 Kimi、DeepSeek 等行业顶尖水平

模型概述

相关资讯

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

通义千问再放大招！Qwen3-VL 家族新增 2B 与 32B 模型，开源矩阵全面升级

AI 发现16万种新RNA病毒成果登上《Cell》后，我们和阿里云算法专家贺勇聊了聊