AI在线 AI在线

Fish Audio 推出 S1 语音克隆模型升级:10 秒即可复刻真人语音

【AIbase 报道】语音生成公司 Fish Audio 正式发布升级版 S1语音克隆模型,在情感表现力与拟真度方面实现重大突破。 新版模型能够生成富有情绪、节奏感与语气变化的真人级声音,几乎可以完美再现人类说话时的细微差别。 据介绍,用户只需提供约 10秒的语音样本,S1即可克隆任意人声,并完整保留原声的口音、语调与节奏,还原个人的说话习惯与情感特征,生成效果几乎与真人无异。

【AIbase 报道】语音生成公司 Fish Audio 正式发布升级版 S1语音克隆模型,在情感表现力与拟真度方面实现重大突破。新版模型能够生成富有情绪、节奏感与语气变化的真人级声音,几乎可以完美再现人类说话时的细微差别。

据介绍,用户只需提供约 10秒的语音样本,S1即可克隆任意人声,并完整保留原声的口音、语调与节奏,还原个人的说话习惯与情感特征,生成效果几乎与真人无异。相比国际知名产品 ElevenLabs,Fish Audio 的语音克隆服务价格低约 六倍,在语音生成成本和性能平衡上具备明显优势。

与此同时,Fish Audio S1API 也已同步上线,显著提升了实时语音生成体验。其 首帧延迟(TTFT)低于500毫秒,一句话不到半秒即可开始播放;同时支持输入与输出的流式传输,实现边接收文字边即时朗读的自然交互,并可无限克隆不同人声、自由切换使用。

业内认为,Fish Audio S1的升级意味着语音克隆技术正从“可用”迈向“可感”,其高保真、低延迟的特性将加速 AI 语音在虚拟人、智能助理、内容创作及配音等领域的广泛落地。

相关资讯

今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇

今天凌晨1点,OpenAI接连扔出AI语音能力的两个重磅更新。 一个是Realtime API,可支持生产级的实时智能体。 另一个是最先进的语音到语音模型gpt-realtime。
8/29/2025 2:38:42 PM

Fish Audio发布OpenAudio S1:媲美专业配音演员的AI语音新标杆

Fish Audio正式推出其最新一代语音生成模型——OpenAudio S1,以其高度自然的声音、丰富的语气控制和强大的指令跟随能力,号称达到专业配音演员的表现力和自然度。 这一模型在TTS-Arena排行榜中荣登第一,成为文本转语音(TTS)领域的新标杆。 AIbase为您深入解析OpenAudio S1的突破性功能及其潜在影响。
6/4/2025 10:01:25 AM
AI在线

OpenAudio 发布开源 TTS 模型 S1-Mini:0.5B 参数打造超自然 AI 语音

AI 语音技术领域迎来重要进展,Fish Audio 宣布开源其全新文本转语音(TTS)模型 OpenAudio S1-Mini。 作为广受好评的 S1模型的精简版,S1-Mini 以其轻量化设计、高表现力和多语言支持引发行业热议。 技术亮点:轻量化与高性能兼得OpenAudio S1-Mini 是从4B 参数的 S1模型蒸馏而来的轻量化版本,仅包含0.5B 参数,大幅降低计算需求,适合在资源受限的环境中部署,如边缘设备或本地化应用。
6/6/2025 3:01:06 PM
AI在线
  • 1