AI在线 AI在线

Qwen

阿里通义千问发布 Qwen3-Coder-Flash 模型,AI 智能体编程 / 操控浏览器等领域媲美 GPT-4.1 等领先闭源模型

AI在线 8 月 1 日消息,阿里通义千问 Qwen 昨日(7 月 31 日)发布公告,宣布推出 Qwen3-Coder-Flash(全称 Qwen3-Coder-30B-A3B-Instruct)模型,在保持出色的性能和效率基础上,改进智能体编码、智能体浏览器使用及其他基础编码任务性能。 官方介绍称该模型具备卓越的智能体能力,在智能体编程 (Agentic Coding)、浏览器使用 (AgenticBrowser-Use)、工具调用 (Tool Use) 等领域,超越当前顶级开源模型,仅略逊于顶配版 Qwen3-Coder-480B-A35B-Instruct, 及 ClaudeSonnet-4、GPT4.1 等领先闭源模型。 AI在线援引官方概述,该模型是因果语言模型,总参数量为 30.5B,激活参数为 3.3B,共有 48 层,专家数为 128 个,激活专家数为 8 个,上下文长度原生支持 262144 个 tokens,使用 Yarn 可扩展到 100 万个 tokens。
8/1/2025 6:55:19 AM
故渊

国产AI新突破:Qwen思考166秒背后的技术野心

想象一下这个场景:你让AI画一只骑自行车的鹈鹕,其他模型可能会立刻给你一个结果,但有一个AI却开始了长达166秒的深度思考。 它在想什么? 鹈鹕的嘴巴应该怎么画?
7/28/2025 9:19:22 AM
阿丸笔记

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

AI在线 7 月 25 日消息,阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。 自千问 3 旗舰模型发布后,阿里通义千问团队一直在努力拓展大模型的推理性能,全新开源的 Qwen3-235B-A22B-Thinking-2507,在推理性能和通用能力上均实现巨大飞跃,号称可比肩 Gemini-2.5 pro、O4-mini 等顶尖闭源模型,并创下全球开源模型 SOTA 最佳性能表现:在编程(LiveCodeBench)、数学(AIME25)等核心能力上,Qwen3 推理模型实现了推理性能的再突破;在知识(SuperGPQA)、创意写作能力(WritingBench)、人类偏好对齐(Arena-Hard v2)、多语言能力(MultilF)等通用能力上,Qwen3 推理模型也取得了显著进步;新模型支持 256K 长文本理解,处理超长上下文不费力。 Qwen3-235B-A22B-Thinking-2507 目前已在魔搭社区、Hugging Face 开源,采用宽松的 Apache2.0 开源协议,人人均可免费下载商用。
7/25/2025 11:29:18 PM
汪淼

阿里千问3推理模型重磅更新,比肩Gemini-2.5 pro、o4-mini

7月25日,阿里巴巴全新开源千问3推理模型,性能大幅提升,一举夺下「全球最强开源模型」王座,比肩顶级闭源模型Gemini-2.5 pro、o4-mini。 本周阿里已连续开源3款重磅模型,分别斩获基础模型、编程模型、推理模型等主流领域的三项全球开源冠军。 两天前开源的AI编程模型Qwen3-Coder,更是引爆全球AI圈,掀起一波用中国千问开源模型替代闭源模型的新浪潮。
7/25/2025 6:54:10 PM
允中

阿里云为什么要押注 Coding AI

7 月 23 日凌晨,阿里云一次看似平淡的模型开源操作,却迅速引爆了市场情绪。 这次发布的模型名为 Qwen3-Coder,由阿里通义实验室推出,是一款全新的开源代码大模型。 一经上线,便迅速在 Hugging Face 与 GitHub 上收获数千颗星标,模型权重文件更在数小时内被下载超万次。
7/25/2025 4:36:00 PM
郑佳美

开源Qwen凌晨暴击闭源Claude!刷新AI编程SOTA,支持1M上下文

编程Agent王座,国产开源模型拿下了! 就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。 图片网友当即实测了一把小球弹跳,效果是酱婶的:效果之强,甚至引来惊呼:简直改变游戏规则。
7/23/2025 8:33:00 AM

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。
7/22/2025 1:05:00 PM
闻乐

中国AI新王者?Kimi K2正在突破Claude的编程壁垒

一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记

Qwen深夜升级235B模型,重夺王座、全面超越Kimi K2!还预告了一个重磅更新

Qwen 深夜上新!  Qwen3-235B-A22B-2507 系列正式启动,今天率先登场的是非思考模型 —— Qwen3-235B-A22B-Instruct-2507。 在最新基准测试中,新模型全面超越 Kimi K2,开源王冠再度回到 Qwen 头上!
7/22/2025 11:03:07 AM

阿里巴巴蔡崇信自曝:被 DeepSeek 逼急了,工程师春节睡办公室搞研发

阿里巴巴董事会主席蔡崇信坦言公司曾“迷失方向”,如今全力押注AI。面对DeepSeek的竞争压力,阿里工程师春节不休,加速推出Qwen系列模型。蔡崇信表示开源Qwen是为了推动AI普及,反哺云计算业务。#阿里巴巴AI战略# #Qwen开源模型#
6/12/2025 3:22:29 PM
易句

新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了

“欧洲的OpenAI”Mistral AI终于发布了首款推理模型——Magistral。 然而再一次遭到网友质疑:怎么又不跟最新版Qwen和DeepSeek R1 0528对比? (此前该公司发布Ministral 3B/8B时,声称“始终优于同行”,却没有对比Qwen2.5)图片图片在该模型发布的前几个小时,Mistral AI的CEO Arthur Mensch在接受炉边访谈时声称即将发布的Magistral能够与其他所有竞争对手相抗衡。
6/11/2025 2:28:34 PM

Qwen:PARSCALE 让语言模型在并行中飞跃

大家好,我是肆〇柒。 今天,我们来聊聊大型语言模型(LLM)领域的一项研究——PARSCALE。 在人工智能快速发展的当下,大型语言模型应用前景无比广阔,然而,随着模型规模的不断膨胀,我们正面临着前所未有的挑战。
6/11/2025 2:00:00 AM
肆零柒

Qwen和DeepSeek为何都选YaRN?

这篇文章,我们还是从面试官的视角出发,一起来分析一下,如果你在面试现场被问到这个题目,应该如何回答? 1.面试官心理分析首先还是分析一下面试官的心理,面试官问这个问题,主要是想考察三点:第一,你知不知道长度外推这个概念? 很多同学可能听都没听过这个概念,那这个问题当然也就无从答起了。
6/6/2025 1:26:00 AM
丁师兄

互联网女皇最新报告:全球 AI 竞争格局生变 中国与开源AI全面突围

硅谷投资人Mary Meeker最新发布的AI报告揭示:全球AI竞争格局正经历深刻重塑。 中国力量与开源浪潮正在撼动OpenAI等头部公司主导的生态,全球进入“群雄逐鹿”的新阶段。 中国AI:性能逼近国际一线,产业融合爆发报告指出,中国在大型语言模型发布节奏上正快速逼近美国,DeepSeek、阿里Qwen、百度文心一言等模型在代码生成与数学推理等核心任务中表现优异。
6/5/2025 3:00:56 PM
AI在线

我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型

我国水利标准AI大模型正式发布,采用海量知识库+DeepSeek/Qwen双模型,实现水利标准全生命周期数字化、智能化管理。查重比对准确率超96.7%,标准编制效率提高2.5倍。#水利科技##AI大模型#
6/3/2025 10:04:47 AM
远洋

TCL联手阿里云深度布局AI赛道,半导体显示专家大模型"星智"正式亮相

家电巨头TCL与云计算龙头阿里云正式宣布达成全栈AI战略合作,这一合作将重点围绕半导体显示和智能终端两大核心领域展开。 双方计划充分利用阿里云在"云 AI"方面的技术优势,联合开发面向垂直行业的专业大模型解决方案。 在技术研发层面,TCL与阿里云将基于Qwen3、Qwen-VL、QwQ等先进模型,持续优化升级半导体显示专家大模型——星智X-Intelligence。
5/22/2025 5:00:55 PM
AI在线

通义千问 Qwen 免费上线 AI“深入研究”:十几分钟完成数小时任务

通义千问 Qwen 官方公众号昨日(5 月 13 日)发布博文,宣布推出 Deep Research (深入研究),该智能助理系统能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 10:42:06 AM
故渊

免费开放!通义千问Qwen上线「深入研究」Deep Research功能

在数字化时代,面对海量信息和高强度的任务压力,系统地研究一件事变得费时且难以聚焦。 为了解决这一问题,Qwen团队推出了一款名为“Deep Research”的智能助理系统,旨在帮助用户梳理复杂问题,快速理清头绪,并生成条理清晰、数据可信的研究报告。 “Deep Research”是一个强大的智能助理系统,它能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 8:00:42 AM
AI在线