近日,阿里巴巴推出的开源大模型 “通义千问3”(Qwen3)在上线仅七天后,便成功夺得了全球开源模型的冠军地位。这一成果是在国际权威大模型评测榜 LiveBench 最新发布的排名中取得的,标志着阿里在人工智能领域又一次取得了重要突破。
据悉,通义千问3在指令遵循能力方面,表现超越了诸多顶级闭源模型,如 o3High、o4-Mini High 和 Gemini2.5pro,成功跻身全球第一的位置。这一榜单由著名图灵奖得主、Meta 首席 AI 科学家杨立昆联合纽约大学等多个机构共同发布,全面评估大模型的数学、推理、编程及语言理解等多个维度。由于其采用动态更新的题库,通义千问3被誉为 “全球首个无法作弊的模型基准测试”。
图源备注:图片由AI生成
通义千问3的正式发布是在4月29日。该模型的参数量仅为 DeepSeek-R1的三分之一,成本大幅降低,同时性能却超越了包括 OpenAI 在内的多款全球顶尖模型。千问3是国内首个 “混合推理模型”,它结合了 “快思考” 和 “慢思考” 两种模式,能够在处理简单问题时快速响应,而在面对复杂问题时进行多步骤深入思考,这样不仅提高了算力的使用效率,也显著节省了资源。
另外,通义千问3的部署成本也非常友好,用户只需四张 H20就能实现千问3的满血版部署,显存占用仅为性能相近模型的三分之一。这一显著的性能提升,充分证明了阿里巴巴在大模型领域的创新能力与技术实力。
通义千问3的发布,将推动更多企业与开发者参与到开源 AI 模型的构建中,为行业的发展注入新的活力。随着大模型技术的不断进步,我们期待未来将有更多实用而创新的应用出现。