AI在线 AI在线

上线仅7天,阿里通义千问3问鼎全球开源模型

近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。 这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。 据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。

近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。

据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。这一榜单由著名图灵奖得主、Meta 首席 AI 科学家杨立昆联合纽约大学等多个机构共同发布,全面评估大模型的数学、推理、编程及语言理解等多个维度。由于其采用动态更新的题库,通义千问3被誉为 “全球首个无法作弊的模型基准测试”。

通义 Qwen (4)

图源备注:图片由AI生成

通义千问3的正式发布是在4月29日。该模型的参数量仅为 DeepSeek-R1的三分之一,成本大幅降低,同时性能却超越了包括 OpenAI 在内的多款全球顶尖模型。千问3是国内首个 “混合推理模型”,它结合了 “快思考” 和 “慢思考” 两种模式,能够在处理简单问题时快速响应,而在面对复杂问题时进行多步骤深入思考,这样不仅提高了算力的使用效率,也显著节省了资源。

另外,通义千问3的部署成本也非常友好,用户只需四张 H20就能实现千问3的满血版部署,显存占用仅为性能相近模型的三分之一。这一显著的性能提升,充分证明了阿里巴巴在大模型领域的创新能力与技术实力。

通义千问3的发布,将推动更多企业与开发者参与到开源 AI 模型的构建中,为行业的发展注入新的活力。随着大模型技术的不断进步,我们期待未来将有更多实用而创新的应用出现。

相关资讯

通义千问首次落地天玑9300移动平台!阿里云携手MediaTek探索端侧AI智能体

3月28日,阿里云与知名半导体公司MediaTek联合宣布,通义千问18亿、40亿参数大模型已成功部署进天玑9300移动平台,可离线流畅运行即时且精准的多轮AI对话应用,连续推理功耗增量不到3W,实现手机AI体验的大幅提升。这是通义大模型首次完成芯片级的软硬适配,仅依靠终端算力便能拥有极佳的推理性能及功耗表现,标志着Model-on-Chip的探索正式从验证走向商业化落地新阶段。端侧AI是大模型落地的极具潜力的场景之一。利用终端算力进行AI推理,可大幅降低推理成本、保证数据安全并提升AI响应速度,让大模型可以更好地
3/28/2024 9:34:00 AM
新闻助手

通义App全面上线千问3 第一时间体验全球最强开源模型

4月29日,通义App与通义网页版(tongyi.com)全面上线阿里新一代通义千问开源模型Qwen3(简称千问3)。 用户可以第一时间在通义App和网页版中的专属智能体“千问大模型”,以及主对话页面,体验到全球最强开源模型的顶级智能能力。 据了解,千问3一经发布便登顶全球最强开源模型。
4/29/2025 12:01:00 PM
AI在线

千亿规模参数,阿里云通义千问进化到2.0:性能超GPT-3.5,加速追赶GPT-4

10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0。在 10 个权威测评中,通义千问 2.0 综合性能超过 GPT-3.5,正在加速追赶 GPT-4。当天,通义千问 APP 在各大手机应用市场正式上线,所有人都可通过 APP 直接体验最新模型能力。过去 6 个月,通义千问 2.0 在性能上取得巨大飞跃,相比 4 月发布的 1.0 版本,通义千问 2.0 在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过 GPT-3.5,加速追赶 GPT-4。
10/31/2023 3:32:00 PM
机器之心
  • 1