AI在线 AI在线

阿里巴巴重磅发布全模态大模型 Qwen3-Omni

阿里巴巴近日发布了通义全模态预训练大模型 Qwen3-Omni 系列。 这款模型的特点在于其能够处理音频、视频及文本等多种信息,堪比人类的感知能力。 这不仅是 AI 技术的重大进步,也为未来的应用场景打开了更多可能。

阿里巴巴近日发布了通义全模态预训练大模型 Qwen3-Omni 系列。这款模型的特点在于其能够处理音频、视频及文本等多种信息,堪比人类的感知能力。这不仅是 AI 技术的重大进步,也为未来的应用场景打开了更多可能。

据悉,Qwen3-Omni 在36项音视频基准测试中,取得了22项 SOTA(State Of The Art)水平的成绩,表现出色,甚至在32项测试中成为开源模型中的佼佼者。特别是在语音识别和音频理解方面,其能力已达到与谷歌的 Gemini2.5-Pro 不相上下的水平。这无疑为需要高质量音频处理的应用奠定了坚实的基础。

通义 Qwen (2)

图源备注:图片由AI生成

Qwen3-Omni 的设计理念独特,其一开始就进行了 “听”“说”“写” 多模态的混合训练,模拟人类婴儿对世界的全面感知。这种训练方法结合了单模态和跨模态数据,使得模型在音频和视频处理上表现优异的同时,文本和图像的处理能力也保持了稳定。这是行业内首次实现如此全面的训练效果,显示了阿里在 AI 技术上的前瞻性和创新性。

未来,Qwen3-Omni 有望广泛应用于智能客服、内容创作、语音交互等领域,为用户提供更智能、更人性化的服务。随着技术的不断进步,我们可以期待 AI 与生活的结合将更加紧密,为我们带来更加便捷的体验。

阿里巴巴的这一创新,标志着全模态 AI 的发展迈上了新台阶,也为全球科技公司提供了新的参考标杆。

相关资讯

Qwen3正式确认本周发布,阿里云AI新篇章即将开启

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。 据AIbase了解,Qwen3将推出包括0.6B、4B、8B、30B-A3B在内的多种模型规模,支持高达256K的上下文长度,涵盖推理与非推理任务。 社交平台上的热烈讨论凸显了其全球影响力,相关细节已通过Hugging Face与Qwen官网逐步公开。
4/28/2025 6:00:40 PM
AI在线

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

阿里通义千问Qwen3系列模型今日发布,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,支持高达256K的上下文长度。#AI模型##开源技术#
4/28/2025 8:18:40 PM
远洋

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。 据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。 社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
4/29/2025 9:00:40 AM
AI在线
  • 1