AI在线 AI在线

​阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹,挑战 OpenAI 的领先地位

近日,中国科技巨头阿里巴巴集团发布了升级版的人工智能推理模型 ——Qwen3-Max-Thinking。 该模型在两项全球顶级数学竞赛中取得了满分,展示了其在推理和问题解决方面的强大能力。 这使得 Qwen3-Max-Thinking 成为首个在美国邀请数学考试(AIME)和哈佛 - 麻省理工数学锦标赛(HMMT)中取得100% 准确率的中国 AI 推理模型。

近日,中国科技巨头阿里巴巴集团发布了升级版的人工智能推理模型 ——Qwen3-Max-Thinking。该模型在两项全球顶级数学竞赛中取得了满分,展示了其在推理和问题解决方面的强大能力。这使得 Qwen3-Max-Thinking 成为首个在美国邀请数学考试(AIME)和哈佛 - 麻省理工数学锦标赛(HMMT)中取得100% 准确率的中国 AI 推理模型。

通义 Qwen (1)

图源备注:图片由AI生成

AIME 和 HMMT 是全球最具挑战性的数学竞赛之一,考察选手在算术、代数、数论和概率等领域的解题能力。根据位于圣荷西的 AI 软件公司 Intuition Labs 的说法,高分的数学推理测试对于评估 AI 模型的推理和问题解决技能至关重要。这些竞赛代表了 AI 进步的一个重要前沿,显示了开发更强推理模型的竞争。

Qwen3-Max-Thinking 模型是阿里巴巴 AI 与云计算部门推出的 Qwen3-Max 系列中的最新版本,具备超过1万亿个参数。Qwen3-Max 于9月底发布,而原始的 Qwen3则在4月推出。阿里云在发布会上表示,Qwen3-Max 在国内外的竞争对手中表现突出,包括 Anthropic 的 Claude Opus4、DeepSeek 的 V3.1、xAI 的 Grok4以及 OpenAI 的 GPT-5Pro。

值得一提的是,Qwen3-Max 还在一项涉及真实市场的实验中表现出色,与五个美国和中国的领先 AI 系统在加密货币交易中对决。在两周的时间内,Qwen3-Max 实现了22.3% 的投资回报,而其他模型的表现则不尽人意,OpenAI 的 GPT-5更是遭遇了62.7% 的损失。

目前,Qwen3-Max-Thinking 已通过 Qwen 聊天机器人的网页版本和阿里云的 API 平台向个人用户开放。Qwen 团队的研究员林俊扬在社交媒体上透露,他们仍在继续改进这一新推理模型,表示工作尚未完成。

划重点:

- 📊 阿里巴巴的 Qwen3-Max-Thinking 在国际数学竞赛中获得满分,挑战 OpenAI。

- 🏆 该模型具备超过1万亿个参数,是首个在 AIME 和 HMMT 中取得100% 准确率的中国 AI。

- 📈 Qwen3-Max 在真实市场的加密货币交易中表现优异,获得22.3% 的投资回报。

相关资讯

Qwen3正式确认本周发布,阿里云AI新篇章即将开启

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。 据AIbase了解,Qwen3将推出包括0.6B、4B、8B、30B-A3B在内的多种模型规模,支持高达256K的上下文长度,涵盖推理与非推理任务。 社交平台上的热烈讨论凸显了其全球影响力,相关细节已通过Hugging Face与Qwen官网逐步公开。
4/28/2025 6:00:40 PM
AI在线

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

阿里通义千问Qwen3系列模型今日发布,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,支持高达256K的上下文长度。#AI模型##开源技术#
4/28/2025 8:18:40 PM
远洋

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。 据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。 社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
4/29/2025 9:00:40 AM
AI在线
  • 1