凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o

作者：机器之心 2025-07-30 10:20

继前段时间密集发布了三款 AI 大模型后，Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本：Qwen3-30B-A3B-Instruct-2507。这个新版本是一个非思考模式（non-thinking mode）的新模型。它的亮点在于，仅激活 30 亿（3B）参数，就能展现出与业界顶尖闭源模型，如谷歌的 Gemini 2.5-Flash（非思考模式）和 OpenAI 的 GPT-4o 相媲美的超强实力，这标志着在模型效率和性能优化上的一次重大突破。

继前段时间密集发布了三款 AI 大模型后，Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本：Qwen3-30B-A3B-Instruct-2507。

这个新版本是一个非思考模式（non-thinking mode）的新模型。它的亮点在于，仅激活 30 亿（3B）参数，就能展现出与业界顶尖闭源模型，如谷歌的 Gemini 2.5-Flash（非思考模式）和 OpenAI 的 GPT-4o 相媲美的超强实力，这标志着在模型效率和性能优化上的一次重大突破。

下图展示了该模型的性能数据，可以看出，与更新前的版本相比，新版本在多项测试中都实现了跨越式提升，比如 AIME25 从之前的 21.6 提升到了 61.3，Arena-Hard v2 成绩从 24.8 提升到了 69.0。

下图展示了新版本和 DeepSeek-V3-0324 等模型的性能对比结果，可以看到，在很多基准测试中，新版本模型可以基本追平甚至超过 DeepSeek-V3-0324。

这让人感叹模型计算效率的提升速度。

具体来说，Qwen3-30B-A3B-Instruct-2507 在诸多方面实现了关键提升：

通用能力大幅提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等多方面；
在多语言的长尾知识覆盖方面，模型进步显著；
在主观和开放任务中，新模型与进一步紧密对齐了用户偏好，可以生成更高质量的文本，为用户提供更有帮助的回答；
长文本理解能力提升至 256K。

现在模型已经在魔搭社区和 HuggingFace 等平台开源。QwenChat 上也可以直接体验。

体验链接：http://chat.qwen.ai/

该模型发布后也很快得到了社区的支持，有了更多的使用渠道，甚至还有了量化版本。这就是开源的力量。

它的出现，让大家在消费级 GPU 上运行 AI 模型有了新的选择。

有人晒出了这个新版本在自己的 Mac 电脑、搭载 RTX 3090 的 PC 等设备上的运行体验。

如果你也想运行这个模型，可以参考这个配置要求：

值得注意的是，这次的新版本模型是一个非推理模型。著名开发者 Simon Willison 将该模型与他之前测试过的「推理」模型（如 GLM-4.5 Air）进行了对比。他得出的核心结论是：对于生成「开箱即用」的复杂代码这类任务，模型是否具备「推理」能力可能是一个至关重要的因素。

Qwen 团队的这次更新依然在深夜进行，这让其他同行再次感觉被卷到了。不过，每天醒来都能看到 AI 的能力又上了一个新台阶，这本身就是一件激动人心的事。

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

近日，阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型，旨在通过文本指令生成或克隆声音。其中，Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音，用户可以精确定义声音的特征，如情感和说话节奏。例如，用户可以请求生成一个 “中年男性，洪亮的男中音 —— 充满活力的广告解说，快速的语速，夸张的音调变化，充满销售魅力的声音”。

12/24/2025 11:41:18 AM AI在线

通义千问正式发布Qwen3-Embedding系列模型

近日，通义千问官方正式发布了Qwen3-Embedding系列模型，作为Qwen模型家族的新成员，该系列模型专为文本表征、检索与排序任务而设计。 Qwen3-Embedding系列基于Qwen3基础模型进行训练，充分继承了Qwen3在多语言文本理解能力上的显著优势。该系列模型在多项基准测试中表现出色，特别是在文本表征和排序任务中展现了卓越性能。

6/6/2025 9:00:55 AM AI在线

凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o

相关资讯

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

阿里通义千问 Qwen3 系列模型有望今日发布，支持 256K 上下文长度

通义千问正式发布Qwen3-Embedding系列模型