人工智能语音
开源免费语音克隆模型ChatterBox AI,性能测试超ElevenLabs
人工智能语音技术领域迎来重大突破!加拿大初创公司Resemble AI近日发布其首款开源文本转语音(TTS)模型ChatterBox,采用MIT许可证。 这一模型以其卓越的语音克隆能力、情绪控制功能和超低延迟特性,迅速成为行业焦点,甚至在盲测中超越了知名闭源模型ElevenLabs。 ChatterBox的发布背景ChatterBox是Resemble AI在语音合成领域的最新成果,基于0.5亿参数的Llama架构,训练数据高达50万小时的精选音频。
6/4/2025 10:01:29 AM
AI在线
- 1
资讯热榜
秘塔AI搜索“今天学点啥”视频讲解页面上线PPT导出功能
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!
Character.AI 推出新功能AvatarFX,用户可制作个性化动画视频
NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
为什么非要做Agent?我用传统方法也能实现啊!
基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
蛋白质
开发者
腾讯
神经网络
研究
3D
生成
计算
训练
Sora
苹果
机器学习
智能体
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
xAI
预测
大语言模型
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
驾驶
API
应用
大型语言模型
LLM
RAG
亚马逊