AI在线 AI在线

ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色

2025 年 8 月 20 日,全球领先的 AI 语音技术公司 ElevenLabs 正式宣布推出其最新的 Eleven v3 Alpha API,为开发者提供了一个突破性的文本转语音(Text-to-Speech, TTS)工具。 Eleven v3 Alpha API 被誉为“地球上最具表现力的文本转语音模型”,其核心优势在于支持超过 70 种语言,能够生成自然、流畅且富有情感的语音输出。 该 API 引入了全新的对话模式(Dialogue Mode),允许开发者创建多角色对话场景,支持无限数量的虚拟角色,并能处理语气变化、情感波动和对话中的自然中断。

2025 年 8 月 20 日,全球领先的 AI 语音技术公司 ElevenLabs 正式宣布推出其最新的 Eleven v3 Alpha API,为开发者提供了一个突破性的文本转语音(Text-to-Speech, TTS)工具。

Eleven v3 Alpha API 被誉为“地球上最具表现力的文本转语音模型”,其核心优势在于支持超过 70 种语言,能够生成自然、流畅且富有情感的语音输出。

该 API 引入了全新的对话模式(Dialogue Mode),允许开发者创建多角色对话场景,支持无限数量的虚拟角色,并能处理语气变化、情感波动和对话中的自然中断。这种功能使其特别适用于制作多角色互动的音频内容,例如有声书、互动游戏叙述和多媒体项目。

此外,Eleven v3 Alpha API 还支持高级音频标签(Audio Tags)功能,开发者可以通过在脚本中插入如 [happy]、[whispering] 或 [sighs] 等标签,精确控制语音的语气、情感和节奏。这种技术突破使得 AI 语音不仅能“说话”,还能“表演”,为用户带来更真实、更具沉浸感的听觉体验。例如,开发者可以轻松实现从戏剧性独白到轻松幽默对话的动态语音生成。

相关资讯

ElevenLabs推出V3声音模型:支持70多种语言,可通过标签控制情感、语气

全球领先的 AI 语音技术公司 ElevenLabs 正式发布了其最新文本转语音模型 Eleven v3(Alpha 版),被誉为迄今最具表现力的 AI 语音模型。 这一突破性进展不仅提升了语音合成的自然度和情感表达能力,还为内容创作者和开发者提供了更强大的工具,助力视频、音频书和多媒体工具的开发。 技术突破:更自然的对话与情感表达Eleven v3引入了全新的架构,能够更深入地理解文本语义,显著提升语音的表现力。
6/6/2025 12:01:06 PM
AI在线

OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。 作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。 技术亮点:轻量化与高性能兼得OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,适合在资源受限的环境中部署,如边缘设备或本地化应用。
6/6/2025 3:01:06 PM
AI在线

Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人

昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。 AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。 Qwen-TTS:超真实语音合成Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度、韵律、节奏和情感表达上达到了极高水平。
7/1/2025 12:00:51 PM
AI在线
  • 1