Qwen3

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

近日，艾伦人工智能研究所（Ai2）发布了全新的 Molmo2开源视频语言模型。这一系列新模型和相关训练数据展示了该非营利机构在开源领域的坚定承诺，特别是在企业希望掌控模型使用的背景下，这无疑是一项重大利好。 Molmo2包含几种不同的模型版本，包括基于阿里巴巴 Qwen3语言模型的 Molmo2-4B 和 Molmo2-8B，此外还有基于 Ai2Olmo 语言模型的完全开源版本 Molmo2-O-7B。

12/17/2025 11:02:02 AM AI在线

推理大模型机制解析！为什么Qwen3要把脑子一分为二？

近期，Qwen3模型的一个重大转变，让整个行业都在重新思考一个根本问题：推理大模型到底应该什么时候思考，什么时候直接给答案？这已不再是技术问题，也是关乎AI产品体验的核心议题...Qwen3的"分家"背后：理想很丰满，现实很骨感回到今年4月，Qwen3刚发布时，阿里团队雄心勃勃地推出了"混合思考模式"。听起来很美好：一个模型既能快速响应简单问题，又能深度思考复杂任务。

9/4/2025 1:00:00 AM 大数据AI智能圈

阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR，该模型通过强化上下文感知与高精度转写能力，在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。实测数据显示，保险行业准确率较前代提升18%，家装、畜牧等领域增幅达15%-20%。作为大语言模型驱动的语音识别算法，Fun-ASR采用自研语音算法与Qwen3监督微调技术，结合前沿模型架构与文本模态对齐技术，在保持语言处理优势的同时，集成RAG检索增强方案，支持超1000个自定义热词导入。

8/24/2025 4:02:03 PM AI在线

阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了

编辑 | 云昭出品 | 51CTO技术栈（微信号：blog51cto）好家活！千问这是要干嘛，简直要踢了GPT-5的馆子了！就在刚刚，小编发现，千问官方X账号“Qwen”宣布：Qwen图像编辑功能重磅上线了！

8/19/2025 12:00:26 PM 云昭

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

众所周知，大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」，开发者利用大规模文本数据集训练模型，让它学会预测句子中的下一个词。第二阶段是「后训练」，旨在教会模型如何更好地理解和执行人类指令。

8/7/2025 9:46:00 PM 机器之心

Qwen3杀入全球前三，中国技术正式挑战OpenAI霸权

说实话，看到Qwen3 2507版本跻身全球AI模型前三的消息时，我第一反应是有点不敢相信。毕竟在这个被OpenAI、Anthropic主导的AI世界里，国产模型能达到这个高度，确实让人意外。但数据不会撒谎。

8/4/2025 9:19:06 AM 阿丸笔记

阿里Qwen3-Coder 4800亿参数代码模型免费开源！是时候告别Cursor和Claude了？

480B参数，35B活跃，完全免费。这不是科幻小说，而是阿里巴巴刚刚开源的Qwen3-Coder给程序员群体的真实礼物。当GitHub Copilot每月收费20美元，Claude Code让钱包瑟瑟发抖时，阿里直接端出了一道"免费的满汉全席"。

7/24/2025 9:19:54 AM 阿丸笔记

国产最强！免费平替ClaudeCode！Qwen3-Coder玩疯了！自主特性惊艳！真实测：深扒奥特曼生平、稚晖君视频封面，成了

编辑｜云昭出品 | 51CTO技术栈（微信号：blog51cto）Claude Code 终于有了免费平替了。几个小时前，阿里 Qwen 团队发布了其自研最强代码模型 —— Qwen3-Coder，不过，各位不要被“代码模型”迷惑了。（昨天开源的Qwen3-235B-A22B-Instruct-2507 只能说是开胃菜了~）挺让人惊讶的，这一次发布的模型，重点竟然不再是编程，而是 Agentic 能力。

7/23/2025 1:29:23 PM 云昭

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛，然而不到一周，Qwen3就迎来最新升级，235B总参数量仅占Kimi K2 1T规模的四分之一。基准测试性能上却超越了Kimi K2。

7/22/2025 1:05:00 PM 闻乐

iPhone上也能跑Qwen3了！阿里一口气开源32款MLX模型，适配苹果全家桶！千问打入苹果生态，国行版苹果智能即将落地？！

编辑 | 伊风出品 | 51CTO技术栈（微信号：blog51cto）“源神”千问，又一次闷声干大事！今天刷 Reddit 才发现：昨晚，阿里千问一口气开源了 32 款，适配苹果 MLX 架构的 Qwen3 模型。没错，32 款，就是这么量大实惠。

6/17/2025 5:54:25 PM 伊风

阿里巴巴发布 Qwen3 升级版，适配苹果 MLX 架构

阿里巴巴集团宣布推出其旗舰人工智能模型 Qwen3的全新升级版，该版本已成功适配苹果的 MLX 架构，这意味着苹果智能（Apple Intelligence）在中国市场的推出似乎指日可待。根据阿里巴巴的消息，新的 Qwen3版本具备更强的性能，支持119种语言和方言，进一步提升了用户体验。在此前的 iOS18.4版本中，苹果智能已经开始支持简体中文，但其生成式人工智能功能在中国大陆尚未正式上线。

6/17/2025 9:02:17 AM AI在线

为 Apple Intelligence 入华铺路？阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

阿里巴巴推出Qwen3升级版，兼容苹果MLX架构，苹果智能中国上线指日可待。该模型支持119种语言，性能优于前代。iOS 18.6或向中国用户提供苹果智能预览。#AI技术##苹果智能#

6/17/2025 7:53:02 AM 远洋

我让十个大模型又参加了完整版数学高考，第一名居然是它......

昨天，我不是发了几个大模型参加数学高考的测试文章嘛。没想到热度挺高，大家还挺关注的。图片不过，很多评论区的小伙伴也说，根本看不出来区别。

6/10/2025 11:25:31 AM 数字生命卡兹克

Qwen3：开源 LLM 的革新者与多语言先锋（万字）

“ Qwen3 模型以其卓越的性能、效率和多语言能力，为开源大语言模型领域树立了新的标杆，引领着技术发展的新潮流。 ”大家好，我是肆〇柒。在 4 月底的时候 Qwen3 开源放出了权重，在热火朝天开炉炼丹后的不久，上周三千问团队又放出了 Qwen3 的技术报告，最近有点小忙，所以虽然第一时间阅读了技术报告，但是一直没有发文出来。

5/22/2025 5:00:00 AM 肆零柒

解锁 LLM 新高度！一文深度解读 Qwen3 大模型

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型，参数规模从 0.6 亿到 2350 亿不等，满足不同下游应用需求。旗舰模型 Qwen3-235B-A22B 作为 MoE 模型，总参数量达 2350 亿，每 token 激活参数量为 220 亿，在性能与效率间取得平衡。密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似，采用 Grouped Query Attention（GQA）和 QK-Norm 改进注意力机制，使用 SwiGLU 作为激活函数，搭配 Rotary Positional Embeddings（RoPE）进行位置编码，采用 RMSNorm 并预归一化。

5/21/2025 9:04:38 AM Goldma

使用 Unsloth 高效微调 Qwen3，国产大模型的轻量化和部署实践

近年来，大语言模型在自然语言处理任务中取得了显著进展。然而，对于开发者和中小型企业，模型微调的资源需求仍是一个挑战。本文将讨论如何利用 Unsloth 框架，在有限的硬件资源下完成 Qwen3-14B 的高效微调，并支持后续部署。

5/19/2025 9:32:06 AM 口袋数据

Llamafile 0.9.3震撼支持Qwen3！单文件运行大模型，跨平台便携性炸裂，AI推理更简单！

近日，Mozilla旗下开源项目Llamafile发布0.9.3版本，正式宣布支持Qwen3系列大语言模型。这一更新通过融合llama.cpp与Cosmopolitan Libc，将复杂的大模型推理过程浓缩为一个可执行文件，极大提升了跨平台便携性和部署效率。 AIbase深入解读这一突破性进展，探索Llamafile如何为AI开发者与用户带来全新体验。

5/16/2025 10:01:05 AM AI在线

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！采用了双模式架构，一个模型同时支持推理和非推理任务，根据需要自动切换。训练和微调过程采取分段式策略，逐步构建模型能力。

5/14/2025 1:22:08 PM 量子位

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

Qwen3

​艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

推理大模型机制解析！为什么Qwen3要把脑子一分为二？

阿里通义Fun-ASR语音模型升级 垂直领域识别率跃升超15%

阿里千问踢馆子了！Qwen3新作秒杀ChatGPT，侧脸杀切换第一人称视角，表情包绝绝子，小编：再也不用美图秀秀去水印了

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

Qwen3杀入全球前三，中国技术正式挑战OpenAI霸权

阿里Qwen3-Coder 4800亿参数代码模型免费开源！是时候告别Cursor和Claude了？

国产最强！免费平替ClaudeCode！Qwen3-Coder玩疯了！自主特性惊艳！真实测：深扒奥特曼生平、稚晖君视频封面，成了

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

iPhone上也能跑Qwen3了！阿里一口气开源32款MLX模型，适配苹果全家桶！千问打入苹果生态，国行版苹果智能即将落地？！

​阿里巴巴发布 Qwen3 升级版，适配苹果 MLX 架构

为 Apple Intelligence 入华铺路？阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

我让十个大模型又参加了完整版数学高考，第一名居然是它......

Qwen3：开源 LLM 的革新者与多语言先锋（万字）

解锁 LLM 新高度！一文深度解读 Qwen3 大模型​

使用 Unsloth 高效微调 Qwen3，国产大模型的轻量化和部署实践

Llamafile 0.9.3震撼支持Qwen3！单文件运行大模型，跨平台便携性炸裂，AI推理更简单！

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

艾伦人工智能研究所推出 Molmo 2 开源视频语言模型

阿里通义Fun-ASR语音模型升级垂直领域识别率跃升超15%

阿里巴巴发布 Qwen3 升级版，适配苹果 MLX 架构

解锁 LLM 新高度！一文深度解读 Qwen3 大模型