AI在线 AI在线

Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人

昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。 AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。 Qwen-TTS:超真实语音合成Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度、韵律、节奏和情感表达上达到了极高水平。

昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。

Qwen-TTS:超真实语音合成

Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度、韵律、节奏和情感表达上达到了极高水平。用户通过Qwen API即可体验到接近真人发声的语音效果,适用于教育、娱乐、智能客服等多种场景。

Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人

图源备注:图片由AI生成

支持多方言与双语声音

Qwen-TTS的亮点之一是其多样化的语言支持。模型不仅支持标准普通话,还覆盖了北京话、上海话和四川话三种中文方言,为用户提供更具地域特色的语音体验。此外,Qwen-TTS提供七种中英双语音色,包括Cherry、Ethan、Chelsie、Serena、Dylan、Jada和Sunny,每种音色都经过精心调校,确保发音地道且富有表现力。这种多方言、多音色的设计极大拓展了模型的应用场景,满足不同文化背景用户的需求。

技术突破:流式输出与情感调节

Qwen-TTS支持流式音频输出,能够根据输入文本动态调整语调、语速和情感变化,生成的声音不仅真实,还能传递细腻的情感表达。相较于传统TTS模型,Qwen-TTS在真实感和表现力上几乎无差别,甚至在特定评测(如SeedTTS-Eval)中达到业内顶尖水平。这得益于其背后大规模语料库的训练支持,以及通义团队在语音合成算法上的持续优化。

行业影响与未来前景

Qwen-TTS的发布进一步推动了语音合成技术的普及与应用。无论是为影视配音、虚拟主播,还是智能助手提供更自然的交互体验,Qwen-TTS都展现了巨大潜力。AIbase认为,随着语音合成技术在真实感上的差距逐渐缩小,方言支持和个性化音色的创新将成为未来竞争的关键。通义团队此次通过API开放Qwen-TTS,不仅降低了使用门槛,也为开发者提供了更多创作空间。

相关资讯

原来,这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。 」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。 前段时间,一位海外技术分析师在一篇博客中提出了一个猜想:一些顶级的 AI 科技公司可能已经构建出了非常智能的模型,比如 OpenAI 可能构建出了 GPT-5,Claude 构建出了 Opus 3.5。
1/29/2025 6:40:00 PM
机器之心

全球开源大模型榜单揭晓,阿里通义千问独占鳌头

近日,全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜(Open LLM Leaderboard),结果显示,排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。 这一成就标志着 Qwen 在开源 AI 领域的主导地位,进一步推动了其在全球的影响力。 Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单,测试维度涵盖了多个领域,包括阅读理解、逻辑推理、数学计算及事实问答等。
2/11/2025 11:55:00 AM
AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布,其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术,利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化,进一步提升了模型性能。 在 watsonx.ai平台上,用户可以通过两种方式使用 DeepSeek 蒸馏模型。
2/11/2025 2:25:00 PM
AI在线
  • 1