Qwen
研究揭示大量 “垃圾” 数据影响大语言模型推理能力
                        根据一项新研究,大语言模型(LLM)在持续接触无意义的在线内容后,可能会出现显著的性能下降。 这项研究表明,这些模型的推理能力和自信心都受到影响,引发了对它们长期健康的担忧。 研究团队来自多个美国大学,提出了 “LLM 脑衰退假说”,借鉴了人类在过度接触无脑在线内容时可能造成的认知损害。
                    
                    10/27/2025 10:56:30 AM
                        AI在线
                    比Qwen3-Max更Max?夸克抢先用上最新闭源模型
                        最强搜索「牵手」最强模型,能碰撞出什么火花? Qwen 最新闭源模型,让夸克先用上了。 10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。
                    
                    10/24/2025 1:45:00 PM
                        机器之心
                    阿里 Qwen 推出 Deep Research:一键生成报告、网页与播客
                        近日,阿里巴巴旗下 Qwen 团队 宣布对其 Qwen Deep Research 工具进行重大升级。 这一功能可在网页版 Qwen Chat(ChatGPT 竞品)中激活,为用户带来从研究、生成到发布的完整闭环体验。 此次更新的最大亮点是:用户不仅能生成带有引文的综合研究报告,还可一键创建 交互式网页 与 多说话者播客。
                    
                    10/23/2025 6:31:49 PM
                        AI在线
                    阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队
                        衡宇 发自 凹非寺. 量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具身智能小分队! 这一消息由通义千问技术负责人林俊旸(Justin Lin)在上对外公开。
                    
                    10/9/2025 3:17:37 PM
                        衡宇
                    Qwen要入局机器人了:林俊旸官宣成立具身智能团队
                        已经成为开源模型领头羊的 Qwen,终于要开始入局机器人了。 昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,旨在提供更强基座模型,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。 这一举动让关注 Qwen 的开发者兴奋不已。
                    
                    10/9/2025 1:01:00 PM
                        机器之心
                    AIME'25满分炸场!Qwen一波七连发,全家桶大更新
                        它来了,它来了! 新一代旗舰模型Qwen3-Max带着满分成绩,正式地来了——国产大模型首次在AIME25和HMMT这两个数学评测榜单拿下100分! 和前不久Qwen3-Max-Preview一致,参数量依旧是超万亿的规模。
                    
                    9/24/2025 2:50:58 PM
                        
                    Qwen3-Next 发布:通义千问的训练&推理效率革命
                        近日,阿里巴巴旗下的通义千问(Qwen)团队发布了全新模型 Qwen3-Next,在保持性能的同时大幅提升训练与推理效率,引起了 AI 界广泛关注。 下面带大家深入了解一下 Qwen3-Next 的亮点、技术突破,以及它对未来应用的意义。 什么是 Qwen3-NextQwen3-Next 是 Qwen 系列的最新成员,基于 Qwen3 架构进行改进与优化。
                    
                    9/15/2025 3:00:00 AM
                        AI大模型应用开发
                    实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+,性价比提升10倍
                        Qwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。 基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
                    
                    9/12/2025 5:19:38 PM
                        
                    实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+性价比提升10倍
                        时令 发自 凹非寺. 量子位 | 公众号 QbitAIQwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。
                    
                    9/12/2025 4:51:17 PM
                        时令
                    Qwen又立功,全球最快开源模型诞生,超2000 tokens/秒!
                        全球最快的开源大模型来了——速度达到了每秒2000个tokens! 虽然只有320亿参数(32B),吞吐量却是超过典型GPU部署的10倍以上的那种。 它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学(MBZUAI)和初创公司G42 AI合作推出的K2 Think。
                    
                    9/10/2025 7:21:11 PM
                        十三
                    凌晨战神Qwen又搞事情!新模型让图像编辑“哪里不对改哪里”
                        henry 发自 凹非寺. 量子位 | 公众号 QbitAI用提示词就能点对点编辑图片? Qwen:没错,正是在下。
                    
                    8/19/2025 3:56:06 PM
                        henry
                    阿里通义千问发布 Qwen3-Coder-Flash 模型,AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型
                        AI在线 8 月 1 日消息,阿里通义千问 Qwen 昨日(7 月 31 日)发布公告,宣布推出 Qwen3-Coder-Flash(全称 Qwen3-Coder-30B-A3B-Instruct)模型,在保持出色的性能和效率基础上,改进智能体编码、智能体浏览器使用及其他基础编码任务性能。 官方介绍称该模型具备卓越的智能体能力,在智能体编程 (Agentic Coding)、浏览器使用 (AgenticBrowser-Use)、工具调用 (Tool Use) 等领域,超越当前顶级开源模型,仅略逊于顶配版 Qwen3-Coder-480B-A35B-Instruct, 及 ClaudeSonnet-4、GPT4.1 等领先闭源模型。 AI在线援引官方概述,该模型是因果语言模型,总参数量为 30.5B,激活参数为 3.3B,共有 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens,使用 Yarn 可扩展到 100 万个 tokens。
                    
                    8/1/2025 6:55:19 AM
                        故渊
                    国产AI新突破:Qwen思考166秒背后的技术野心
                        想象一下这个场景:你让AI画一只骑自行车的鹈鹕,其他模型可能会立刻给你一个结果,但有一个AI却开始了长达166秒的深度思考。 它在想什么? 鹈鹕的嘴巴应该怎么画?
                    
                    7/28/2025 9:19:22 AM
                        阿丸笔记
                    性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
                        AI在线 7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。 自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;新模型支持 256K 长文本理解,处理超长上下文不费力。 Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用。
                    
                    7/25/2025 11:29:18 PM
                        汪淼
                    阿里千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini
                        7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。 本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。 两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的新浪潮。
                    
                    7/25/2025 6:54:10 PM
                        允中
                    阿里云为什么要押注 Coding AI
                        7 月 23 日凌晨,阿里云一次看似平淡的模型开源操作,却迅速引爆了市场情绪。 这次发布的模型名为 Qwen3-Coder,由阿里通义实验室推出,是一款全新的开源代码大模型。 一经上线,便迅速在 Hugging Face 与 GitHub 上收获数千颗星标,模型权重文件更在数小时内被下载超万次。
                    
                    7/25/2025 4:36:00 PM
                        郑佳美
                    开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文
                        编程Agent王座,国产开源模型拿下了! 就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。 图片网友当即实测了一把小球弹跳,效果是酱婶的:效果之强,甚至引来惊呼:简直改变游戏规则。
                    
                    7/23/2025 8:33:00 AM
                        
                    Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了
                        开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。
                    
                    7/22/2025 1:05:00 PM
                        闻乐
                    
        资讯热榜
    
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                