语音合成
开源革命!Kyutai TTS发布:超低延迟语音合成,AI语音新纪元来袭!
近日,法国AI实验室Kyutai宣布,其全新文本转语音模型 Kyutai TTS 正式开源,为全球开发者与研究者带来了一款高性能、低延迟的语音合成解决方案。 这一突破性发布不仅推动了开源AI技术的发展,也为多语言语音交互应用开辟了新的可能性。 AIbase为您独家解析这一技术亮点及其潜在影响。
7/5/2025 7:46:46 AM
AI在线
ElevenLabs 推出移动应用,免费用户享10分钟文本转语音额度
在人工智能领域,ElevenLabs 又迈出了重要一步,正式推出其独立的移动应用,支持 iOS 和 Android 用户随时随地生成语音片段。 此前,用户仅能通过网页应用利用 ElevenLabs 的 AI 语音库,现在,这款移动应用让语音合成变得更加便捷。 用户在应用中只需输入或粘贴文本,然后选择适合的语音模型,就可以生成音频片段。
6/25/2025 9:00:44 AM
AI在线
语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然!
人工智能语音合成技术迎来重大突破!AIbase从社交媒体平台获取最新信息,了解到Bland AI正式发布了其全新Bland TTS引擎,号称首个跨越“恐怖谷”的语音AI技术。 这一引擎利用大型语言模型(LLM)直接生成语音,仅需一个短音频即可实现任意人声克隆,并支持语调、节奏等风格的灵活“混搭”。 本文将为您深入解析Bland TTS的创新功能及其对AI语音应用的深远影响。
6/5/2025 2:00:55 PM
AI在线
名场面来了,李云龙、徐江、王多鱼同台飙戏,背后是小红书的AI
AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]近日,来自小红书的技术团队 FireRed,提出了基于大语言模型的 FireRedTTS 语音合成系统,并分享了在短视频配音及聊天式语音对话等应用的一些实践。FireRedTTS 只需要给
9/8/2024 1:15:00 PM
机器之心
- 1
资讯热榜
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
OpenAI豪赌5000亿美元估值神话:60亿股权大甩卖背后,GPT-5却遭用户冷遇
蚂蚁集团携手北医三院成立AI医疗联合实验室 打造专属AI就医助理
国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
OpenAI加速推进GPT-6开发,奥尔特曼承诺打造"有记忆"的个性化AI助手
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用