AI在线 AI在线

通义千问正式发布Qwen3-Embedding系列模型

近日,通义千问官方正式发布了Qwen3-Embedding系列模型,作为Qwen模型家族的新成员,该系列模型专为文本表征、检索与排序任务而设计。 Qwen3-Embedding系列基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能力上的显著优势。 该系列模型在多项基准测试中表现出色,特别是在文本表征和排序任务中展现了卓越性能。

近日,通义千问官方正式发布了Qwen3-Embedding系列模型,作为Qwen模型家族的新成员,该系列模型专为文本表征、检索与排序任务而设计。Qwen3-Embedding系列基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能力上的显著优势。

该系列模型在多项基准测试中表现出色,特别是在文本表征和排序任务中展现了卓越性能。测试使用了MTEB(包括英文版v2、中文版v1、多语言版以及代码版)中的检索数据集,排序结果基于Qwen3-Embedding-0.6B的top-100向量召回结果。值得一提的是,8B参数规模的Embedding模型在MTEB多语言榜单中位列第一,得分高达70.58,性能超越众多商业API服务。

微信截图_20250606082710.png

Qwen3-Embedding系列提供了从0.6B到8B参数规模的三种模型配置,以满足不同场景下的性能与效率需求。开发者可以灵活组合表征与排序模块,实现功能的扩展。此外,模型还支持表征维度自定义和指令适配优化,允许用户根据实际需求调整表征维度,并自定义指令模板,以提升特定任务、语言或场景下的性能表现。

在多语言支持方面,Qwen3-Embedding系列表现出色,支持超过100种语言,涵盖主流自然语言及多种编程语言,具备强大的多语言、跨语言及代码检索能力。该系列模型采用了双塔结构和单塔结构的设计,分别用于Embedding模型和Reranker模型,通过LoRA微调最大限度地保留并继承了基础模型的文本理解能力。

训练过程中,Qwen3-Embedding系列采用了多阶段训练范式,并针对具体应用场景进行了深度优化。Embedding模型通过三阶段训练架构,包括超大规模弱监督数据的对比学习预训练、高质量标注数据的监督训练以及模型融合策略,有效平衡了模型的泛化能力与任务适配性。而Reranker模型则直接采用高质量标注数据进行监督训练,以提升训练效率。

此次发布的Qwen3-Embedding系列模型已在Hugging Face、ModelScope和GitHub平台开源,用户也可直接使用阿里云百炼平台提供的最新文本向量模型服务。官方表示,这只是一个新的起点,依托于Qwen基础模型的持续优化,将继续提升文本表征与排序模型的训练效率,并计划拓展多模态表征体系,构建跨模态语义理解能力。

ModelScope:

  • https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

  • https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f

Hugging Face:

  • https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f

  • https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

GitHub:

  • https://github.com/QwenLM/Qwen3-Embedding

相关资讯

阿里通义千问 Qwen3 系列模型有望今日发布,支持 256K 上下文长度

阿里通义千问Qwen3系列模型今日发布,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,支持高达256K的上下文长度。#AI模型##开源技术#
4/28/2025 8:18:40 PM
远洋

Qwen3正式确认本周发布,阿里云AI新篇章即将开启

阿里云Qwen团队通过社交平台正式确认,Qwen3系列模型将于本周内发布,标志着其旗舰大语言模型(LLM)与多模态能力的又一次重大升级。 据AIbase了解,Qwen3将推出包括0.6B、4B、8B、30B-A3B在内的多种模型规模,支持高达256K的上下文长度,涵盖推理与非推理任务。 社交平台上的热烈讨论凸显了其全球影响力,相关细节已通过Hugging Face与Qwen官网逐步公开。
4/28/2025 6:00:40 PM
AI在线

Qwen3正式发布,优化编码与代理能力,强化MCP支持引领AI新潮流

阿里云Qwen团队宣布Qwen3系列模型正式发布,以卓越的编码能力、增强的代理功能和对Model Context Protocol(MCP)的深度支持,掀起AI社区热潮。 据AIbase了解,Qwen3涵盖从0.6B到235B-A22B的多种模型规模,优化了数学推理、代码生成和多模态任务,性能直追GPT-4o与Gemini-2.5-Pro。 社交平台上的讨论显示,Qwen3的MCP集成与开源策略备受期待,相关细节已通过Hugging Face与Qwen官网公开。
4/29/2025 9:00:40 AM
AI在线
  • 1