Voice
MiniMax推出Voice Design音色设计功能,任意组合语言 、口音、音色
MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计,这标志着语音合成技术的一次重大突破。 自5月发布以来,MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一,并赢得了用户的广泛认可。 迄今为止,Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音,与全球30多个国家的用户建立了合作。
6/23/2025 12:00:38 PM
AI在线
MiniMax发布Voice Design音色设计功能 可自定义无限组合
稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。 该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。 据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。
6/23/2025 10:00:48 AM
AI在线
智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣
智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。 官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。 据介绍,GLM-4-Voice 具备如下特点:情感表达和情感共鸣:声音有不同的情感和细腻的变化,如高兴、悲伤、生气、害怕等。
10/25/2024 4:06:56 PM
清源
15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型
感谢OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。OpenAI 公司表示,目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa
3/30/2024 11:50:43 AM
故渊
- 1
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用