AI在线 AI在线

Qwen3

阿里通义Fun-ASR语音模型升级 垂直领域识别率跃升超15%

阿里通义正式推出新一代端到端语音识别大模型Fun-ASR,该模型通过强化上下文感知与高精度转写能力,在家装、保险等垂直行业场景中实现语音识别准确率超15%的突破性提升。 实测数据显示,保险行业准确率较前代提升18%,家装、畜牧等领域增幅达15%-20%。 作为大语言模型驱动的语音识别算法,Fun-ASR采用自研语音算法与Qwen3监督微调技术,结合前沿模型架构与文本模态对齐技术,在保持语言处理优势的同时,集成RAG检索增强方案,支持超1000个自定义热词导入。
8/24/2025 4:02:03 PM
AI在线

阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)好家活! 千问这是要干嘛,简直要踢了GPT-5的馆子了! 就在刚刚,小编发现,千问官方X账号“Qwen”宣布:Qwen图像编辑功能重磅上线了!
8/19/2025 12:00:26 PM
云昭

DeepSeek的GRPO会导致模型崩溃?看下Qwen3新范式GSPO

众所周知,大型语言模型的训练通常分为两个阶段。 第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。 第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。
8/7/2025 9:46:00 PM
机器之心

Qwen3杀入全球前三,中国技术正式挑战OpenAI霸权

说实话,看到Qwen3 2507版本跻身全球AI模型前三的消息时,我第一反应是有点不敢相信。 毕竟在这个被OpenAI、Anthropic主导的AI世界里,国产模型能达到这个高度,确实让人意外。 但数据不会撒谎。
8/4/2025 9:19:06 AM
阿丸笔记

阿里Qwen3-Coder 4800亿参数代码模型免费开源!是时候告别Cursor和Claude了?

480B参数,35B活跃,完全免费。 这不是科幻小说,而是阿里巴巴刚刚开源的Qwen3-Coder给程序员群体的真实礼物。 当GitHub Copilot每月收费20美元,Claude Code让钱包瑟瑟发抖时,阿里直接端出了一道"免费的满汉全席"。
7/24/2025 9:19:54 AM
阿丸笔记

国产最强!免费平替ClaudeCode!Qwen3-Coder玩疯了!自主特性惊艳!真实测:深扒奥特曼生平、稚晖君视频封面,成了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)Claude Code 终于有了免费平替了。 几个小时前,阿里 Qwen 团队发布了其自研最强代码模型 —— Qwen3-Coder,不过,各位不要被“代码模型”迷惑了。 (昨天开源的Qwen3-235B-A22B-Instruct-2507 只能说是开胃菜了~)挺让人惊讶的,这一次发布的模型,重点竟然不再是编程,而是 Agentic 能力。
7/23/2025 1:29:23 PM
云昭

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。
7/22/2025 1:05:00 PM
闻乐

iPhone上也能跑Qwen3了!阿里一口气开源32款MLX模型,适配苹果全家桶!千问打入苹果生态,国行版苹果智能即将落地?!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“源神”千问,又一次闷声干大事! 今天刷 Reddit 才发现:昨晚,阿里千问一口气开源了 32 款,适配苹果 MLX 架构的 Qwen3 模型。 没错,32 款,就是这么量大实惠。
6/17/2025 5:54:25 PM
伊风

​阿里巴巴发布 Qwen3 升级版,适配苹果 MLX 架构

阿里巴巴集团宣布推出其旗舰人工智能模型 Qwen3的全新升级版,该版本已成功适配苹果的 MLX 架构,这意味着苹果智能(Apple Intelligence)在中国市场的推出似乎指日可待。 根据阿里巴巴的消息,新的 Qwen3版本具备更强的性能,支持119种语言和方言,进一步提升了用户体验。 在此前的 iOS18.4版本中,苹果智能已经开始支持简体中文,但其生成式人工智能功能在中国大陆尚未正式上线。
6/17/2025 9:02:17 AM
AI在线

为 Apple Intelligence 入华铺路?阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

阿里巴巴推出Qwen3升级版,兼容苹果MLX架构,苹果智能中国上线指日可待。该模型支持119种语言,性能优于前代。iOS 18.6或向中国用户提供苹果智能预览。#AI技术##苹果智能#
6/17/2025 7:53:02 AM
远洋

我让十个大模型又参加了完整版数学高考,第一名居然是它......

昨天,我不是发了几个大模型参加数学高考的测试文章嘛。 没想到热度挺高,大家还挺关注的。 图片不过,很多评论区的小伙伴也说,根本看不出来区别。
6/10/2025 11:25:31 AM
数字生命卡兹克

Qwen3:开源 LLM 的革新者与多语言先锋(万字)

“ Qwen3 模型以其卓越的性能、效率和多语言能力,为开源大语言模型领域树立了新的标杆,引领着技术发展的新潮流。 ”大家好,我是肆〇柒。 在 4 月底的时候 Qwen3 开源放出了权重,在热火朝天开炉炼丹后的不久,上周三千问团队又放出了 Qwen3 的技术报告,最近有点小忙,所以虽然第一时间阅读了技术报告,但是一直没有发文出来。
5/22/2025 5:00:00 AM
肆零柒

解锁 LLM 新高度!一文深度解读 Qwen3 大模型​

1、模型架构Qwen3 系列涵盖 6 种密集型模型和 2 种 MoE 模型,参数规模从 0.6 亿到 2350 亿不等,满足不同下游应用需求。 旗舰模型 Qwen3-235B-A22B 作为 MoE 模型,总参数量达 2350 亿,每 token 激活参数量为 220 亿,在性能与效率间取得平衡。 密集型模型Qwen3 的密集型模型架构与 Qwen2.5 类似,采用 Grouped Query Attention(GQA)和 QK-Norm 改进注意力机制,使用 SwiGLU 作为激活函数,搭配 Rotary Positional Embeddings(RoPE)进行位置编码,采用 RMSNorm 并预归一化。
5/21/2025 9:04:38 AM
Goldma

使用 Unsloth 高效微调 Qwen3,国产大模型的轻量化和部署实践

近年来,大语言模型在自然语言处理任务中取得了显著进展。 然而,对于开发者和中小型企业,模型微调的资源需求仍是一个挑战。 本文将讨论如何利用 Unsloth 框架,在有限的硬件资源下完成 Qwen3-14B 的高效微调,并支持后续部署。
5/19/2025 9:32:06 AM
口袋数据

Llamafile 0.9.3震撼支持Qwen3!单文件运行大模型,跨平台便携性炸裂,AI推理更简单!

近日,Mozilla旗下开源项目Llamafile发布0.9.3版本,正式宣布支持Qwen3系列大语言模型。 这一更新通过融合llama.cpp与Cosmopolitan Libc,将复杂的大模型推理过程浓缩为一个可执行文件,极大提升了跨平台便携性和部署效率。 AIbase深入解读这一突破性进展,探索Llamafile如何为AI开发者与用户带来全新体验。
5/16/2025 10:01:05 AM
AI在线

Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型

Qwen3技术报告新鲜出炉,8款模型背后的关键技术被揭晓! 采用了双模式架构,一个模型同时支持推理和非推理任务,根据需要自动切换。 训练和微调过程采取分段式策略,逐步构建模型能力。
5/14/2025 1:22:08 PM
量子位

Unsloth 微调 Qwen3 实战教程来了!

unsloth微调Qwen3模型提供显著优势:训练速度提高2倍,VRAM使用减少70%,支持8倍长的上下文。 Qwen3–30B-A3B仅需17.5GB VRAM即可运行。 unsloth的Dynamic 2.0量化技术保证了高精度,同时支持原生128K上下文长度。
5/14/2025 1:00:00 AM

阿里通义Qwen3语言模型上线 ,开源实力再升级!

在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。 今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。 此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。
5/6/2025 6:00:51 PM
AI在线