阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

作者：AI在线 2025-12-24 11:41

近日，阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型，旨在通过文本指令生成或克隆声音。其中，Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音，用户可以精确定义声音的特征，如情感和说话节奏。例如，用户可以请求生成一个 “中年男性，洪亮的男中音 —— 充满活力的广告解说，快速的语速，夸张的音调变化，充满销售魅力的声音”。

近日，阿里巴巴云计算的 Qwen 团队发布了两款全新的人工智能模型，旨在通过文本指令生成或克隆声音。其中，Qwen3-TTS-VD-Flash 模型允许用户根据详细描述生成声音，用户可以精确定义声音的特征，如情感和说话节奏。

例如，用户可以请求生成一个 “中年男性，洪亮的男中音 —— 充满活力的广告解说，快速的语速，夸张的音调变化，充满销售魅力的声音”。根据制造商的说法，该模型在性能上超过了 OpenAI 最近推出的 GPT-4o mini-tts API。

第二款模型 Qwen3-TTS-VC-Flash，则可以仅通过三秒的音频复制声音，并能在十种语言中进行复现。Qwen 声称，该模型的错误率低于竞争对手，例如 Elevenlabs 或 MiniMax。

此外，该 AI 还能够处理复杂的文本，模仿动物声音，并从录音中提取声音。两款模型均可通过阿里巴巴云的 API 访问，用户还可以在 Hugging Face 平台上尝试设计模型和克隆模型的演示。

划重点:
🌟 新款 Qwen 模型支持通过文本描述生成和克隆声音。
🎤 Qwen3-TTS-VC-Flash 可在三秒内复制声音，支持十种语言。
🚀 模型表现优于竞争对手，适用于处理复杂文本及声音模仿。

调查：超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告，企业在人工智能（AI）领域的投资高达2.5亿美元，尽管在证明投资回报率(ROI)方面面临挑战。商业领袖们正努力提高生产力，但新技术的集成往往需要重构现有应用、更新流程并激励员工学习，以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查，以揭示 AI 采用的现实情况，探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。

3/18/2025 10:02:00 AM AI在线

可保护作品免遭 AI 训练，Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity，用于保护创意工作者的作品署名权，即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试，用户上传需要保护的图像，应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签，帮助确认作品归属和保护作品免遭 AI 训练。

4/24/2025 9:32:18 PM 准泽（实习）

城商行掀起大模型招标潮，百万级投入成行业新风口！

在人工智能技术快速发展的背景下，越来越多的城商行开始纷纷参与到大模型的招标中。根据最新消息，超过10家中小银行近期启动了大模型相关项目的招标，标志着这一领域的竞争加剧。这些银行希望通过大模型技术优化现有的金融服务流程，提高运营效率，进而为客户提供更优质的服务。

7/11/2025 11:11:51 AM AI在线

阿里巴巴推出新款 Qwen 模型，三秒音频即可克隆声音

相关资讯

调查：超72% 的企业选择 AI 工具时最看重易用性

可保护作品免遭 AI 训练，Adobe 推出 Content Authenticity 应用

城商行掀起大模型招标潮，百万级投入成行业新风口！