AI在线 AI在线

推理水平对标OpenAI o1!阿里云通义开源最新推理模型QwQ

11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。 评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。 QwQ(Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的AI推理模型。

11月28日,阿里云通义团队发布全新AI推理模型QwQ-32B-Preview,并同步开源。评测数据显示,预览版本的QwQ,已展现出研究生水平的科学推理能力,在数学和编程方面表现尤为出色,整体推理水平比肩OpenAI o1。

QwQ(Qwen with Questions)是通义千问Qwen大模型最新推出的实验性研究模型,也是阿里云首个开源的AI推理模型。阿里云通义千问团队研究发现,当模型有足够的时间思考、质疑和反思时,其对数学和编程的理解就会深化。基于此,QwQ取得了解决复杂问题的突破性进展。

推理水平对标OpenAI o1!阿里云通义开源最新推理模型QwQ

在考察科学问题解决能力的GPQA评测集上,QwQ获得65.2%的准确率,具备研究生水平的科学推理能力;在涵盖综合数学主题的AIME评测中,QwQ以50%的胜率证明其拥有解决数学问题的丰富技能;在全面考察数学解题能力的MATH-500评测中,QwQ斩获90.6%的高分,一举超越o1-preview和o1-mini;在评估高难度代码生成的LiveCodeBench评测中,QwQ答对一半的题,在编程竞赛题场景中也有出色表现。

面对复杂问题,QwQ展现了深度自省的能力,会质疑自身假设,进行深思熟虑的自我对话,并仔细审视其推理过程的每一步。比如,在经典智力题“猜牌问题”中,QwQ通过梳理各方对话并推演现实情况,像个擅长思考的人一样,揣摩“这句话有点tricky”,反思“等一下,也许我需要更仔细地思考”,最终分析得出正确答案,让人惊艳。

目前,QwQ-32B-Preview已在魔搭社区和HuggingFace等平台上开源。发布短短几小时,引起全球开发者热情体验。有开发者认为该模型“是完全没有预料到的疯狂的跃进”、“今年开源领域最重大的突破”、“让中国在开源大模型和AI推理上占据先机”。通义团队透露,尽管QwQ展现了强大的分析能力,但该模型仍是个供研究的实验型模型,存在不同语言的混合使用、偶有不恰当偏见、对专业领域问题不了解等局限。随着研究深入模型迭代,这些问题将逐步得到解决。

附:

Modelscope开源地址:https://modelscope.cn/models/Qwen/QwQ-32B-Preview

Modelscope创空间体验:https://modelscope.cn/studios/Qwen/QwQ-32B-preview

HuggingFace开源地址:https://huggingface.co/Qwen/QwQ-32B-Preview

HuggingFace Space体验:https://huggingface.co/spaces/Qwen/QwQ-32B-preview

相关资讯

性能跃迁,幻觉清零!中国移动“九天”3.0震撼登场,多项核心技术同步开源

7月26日,在2025世界人工智能大会“AI 焕新 产业共赢”企业人工智能产业发展论坛上,中国移动隆重发布了其自主研发的 “九天”基础大模型3.0。 此次发布不仅彰显了中国移动在大模型领域的深厚自研实力和持续创新能力,更标志着其在人工智能产业化发展道路上迈出了坚实一步。 作为国务院国资委战新“百大工程”的重要成果,“九天”基础大模型3.0在继承“高安全、高可控、全国产、全行业”四大特性的基础上,实现了三大关键“焕新”:一、九天众擎语言大模型:架构与性能双重跃迁“九天众擎语言大模型”实现了架构上的突破性创新,采用可扩展至万亿级的 MoE 架构。
7/29/2025 11:32:33 AM
AI在线

无需高攀云端!阿里开源全新的推理模型通义千问QwQ-32B,消费级显卡也能跑出S级性能!

AI圈再掀巨浪!阿里巴巴震撼发布并全面开源了其最新力作——通义千问QwQ-32B推理模型。 这款被寄予厚望的新模型,并非徒有虚名,而是经过大规模强化学习的千锤百炼,在硬核的数学运算、复杂的代码编写以及通用的AI能力上实现了质的飞跃,整体性能已经能够正面硬刚行业标杆DeepSeek-R1,实力不容小觑。 更令人兴奋的是,通义千问QwQ-32B一举打破了高性能AI模型“高价难用”的魔咒。
3/6/2025 10:04:00 AM
AI在线

通义App首发千问QwQ-32B智能体,AI体验持续升级

3月6日,AIbase发现阿里AI To C业务旗下AI应用通义,已经接入阿里最新开源推理模型通义千问QwQ-32B,目前在移动端与网页端均可体验。 千问QwQ-32B是阿里最新发布的强大推理模型,其特点是兼具性能与效率。 千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。
3/6/2025 10:17:00 AM
AI在线
  • 1