阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

作者：故渊 2025-05-01 10:30

阿里巴巴持续发力 AI 领域，其 Qwen 团队于 3 月发布 Qwen2.5-Omni-7B 模型后，昨日（4 月 30 日）再次发布 Qwen2.5-Omni-3B，目前可以在 Hugging Face 上开放下载。

AI在线注：这款 3B 参数模型是其 7B 旗舰多模态模型的轻量版本，专为消费级硬件设计，覆盖文本、音频、图像和视频等多种输入功能。

团队表示，尽管参数规模缩小，3B 版本在多模态性能上仍保持了 7B 模型的 90% 以上，尤其在实时文本生成和自然语音输出方面表现亮眼。

基准测试显示，其在视频理解（VideoBench: 68.8）和语音生成（Seed-tts-eval test-hard: 92.1）等任务中接近 7B 模型水平。

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

Qwen2.5-Omni-3B 在内存使用上的改进尤为突出。团队报告称，处理 25,000 token 的长上下文输入时，该模型 VRAM 占用减少 53%，从 7B 模型的 60.2 GB 降至 28.2 GB。

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

这意味着该模型可在 24GB GPU 上运行，无需企业级 GPU 集群支持，可以在高端台式机和笔记本电脑上运行。

其架构创新，如 Thinker-Talker 设计和定制位置嵌入方法 TMRoPE，确保了视频与音频输入的同步理解。此外，模型支持 FlashAttention 2 和 BF16 精度优化，进一步提升速度并降低内存消耗。

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

Qwen2.5-Omni-3B 的使用受到严格限制。根据许可条款，该模型仅限研究用途，企业若想开发商业产品，必须先从阿里巴巴 Qwen 团队获取单独许可，意味着该模型非直接生产部署，定位更偏向于测试和原型开发。

参考

Hugging Face
GitHub 页面
魔搭社区
Multimodal AI on Developer GPUs: Alibaba Releases Qwen2.5-Omni-3B with 50% Lower VRAM Usage and Nearly-7B Model Performance
Qwen swings for a double with 2.5-Omni-3B model that runs on consumer PCs, laptops

TCL联手阿里云深度布局AI赛道，半导体显示专家大模型"星智"正式亮相

家电巨头TCL与云计算龙头阿里云正式宣布达成全栈AI战略合作，这一合作将重点围绕半导体显示和智能终端两大核心领域展开。双方计划充分利用阿里云在"云 AI"方面的技术优势，联合开发面向垂直行业的专业大模型解决方案。在技术研发层面，TCL与阿里云将基于Qwen3、Qwen-VL、QwQ等先进模型，持续优化升级半导体显示专家大模型——星智X-Intelligence。

5/22/2025 5:00:55 PM

AI在线

阿里通义千问发布 Qwen3-Coder-Flash 模型，AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型

AI在线 8 月 1 日消息，阿里通义千问 Qwen 昨日（7 月 31 日）发布公告，宣布推出 Qwen3-Coder-Flash（全称 Qwen3-Coder-30B-A3B-Instruct）模型，在保持出色的性能和效率基础上，改进智能体编码、智能体浏览器使用及其他基础编码任务性能。官方介绍称该模型具备卓越的智能体能力，在智能体编程 (Agentic Coding)、浏览器使用 (AgenticBrowser-Use)、工具调用 (Tool Use) 等领域，超越当前顶级开源模型，仅略逊于顶配版 Qwen3-Coder-480B-A35B-Instruct, 及 ClaudeSonnet-4、GPT4.1 等领先闭源模型。 AI在线援引官方概述，该模型是因果语言模型，总参数量为 30.5B，激活参数为 3.3B，共有 48 层，专家数为 128 个，激活专家数为 8 个，上下文长度原生支持 262144 个 tokens，使用 Yarn 可扩展到 100 万个 tokens。

8/1/2025 6:55:19 AM

故渊

AI 编程能力哪家强？阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini 夺冠超 90% 人类程序员

阿里通义千问 Qwen 最新推出 CodeElo 基准测试，通过和人类程序员对比的 Elo 评级系统，来评估大语言模型（LLM）的编程水平。

1/4/2025 1:32:24 PM

故渊

阿里通义千问 2.5-Omni-3B AI 全模态登场：7B 版 90% 性能，显存占用减少 53%

相关资讯

TCL联手阿里云深度布局AI赛道，半导体显示专家大模型"星智"正式亮相

阿里通义千问发布 Qwen3-Coder-Flash 模型，AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型

AI 编程能力哪家强？阿里通义千问 Qwen 推 CodeElo 基准，OpenAI o1-mini 夺冠超 90% 人类程序员