AI在线 AI在线

​MiniMax推出Voice Design音色设计功能,任意组合语言 、口音、音色

MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计,这标志着语音合成技术的一次重大突破。 自5月发布以来,MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一,并赢得了用户的广泛认可。 迄今为止,Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音,与全球30多个国家的用户建立了合作。

MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计,这标志着语音合成技术的一次重大突破。自5月发布以来,MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一,并赢得了用户的广泛认可。迄今为止,Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音,与全球30多个国家的用户建立了合作。

image.png

Voice Design 功能允许用户通过自然语言描述自己理想中的音色,从而实现对语音的多维度精准控制,甚至可以生成一些世界上从未存在过的音色。这项新功能与 Speech-02语音模型紧密结合,用户在进行文字转语音时,能够真正实现 “所需即所得”。用户可以自由选择 “任意语言 × 任意口音 × 任意音色”,进行全自定义的无限组合。

通过简单的文本描述,用户可以得到不同风格的 AI 助手语音。例如,用户可以请求一个积极鼓励的 AI 助手,语调活泼,韵律变化丰富,来表达关心和支持;或者选择一个严厉的 AI 助手,快速的女声带有命令和责备的语气;还可以让助手以小心翼翼的语气表达歉意。

Voice Design 功能解决了语音合成领域的两个主要挑战。首先,现有的音色库虽然质量高,但通常难以满足用户在特定场景下的细分需求;其次,尽管复刻音色可以实现 “所听即所得”,用户为了获得满意的效果通常需要花费大量时间准备高质量的输入素材,还可能面临版权风险。

image.png

通过 Voice Design,用户只需描述他们对音色的需求,模型便会自动将其拆解为音色相关的描述信息,生成新的音色编码。用户还可以像抽卡一样多次尝试,轻松获得理想的专属音色,并将其存储用于后续音频创作。

MiniMax 始终致力于降低全球用户使用 AI 技术的门槛,让不同语言的用户都能体验到语音模型带来的价值。立即打开 MiniMax Audio,体验这一创新功能吧!

国内版:minimaxi.com/audio

海外版:minimax.io/audio

划重点:

🎤 MiniMax 推出 Voice Design 音色设计功能,用户可通过自然语言生成个性化语音。  

🌍 该功能与 Speech-02模型结合,支持 “任意语言 × 任意口音 × 任意音色” 的自定义组合。  

⚙️ Voice Design 解决了语音合成中的音色匹配难题,用户只需简单描述即可获得满意的音色。

相关资讯

MiniMax发布Voice Design音色设计功能 可自定义无限组合

MiniMax发布Voice Design音色设计功能 可自定义无限组合

稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。 该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。 据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。
6/23/2025 10:00:48 AM AI在线
Willow Voice secures 4.2 million USD in funding AI voice input redefines efficient work experience

Willow Voice secures 4.2 million USD in funding AI voice input redefines efficient work experience

July 15, 2025 – The AI voice input platform Willow Voice announced the successful completion of a $4.2 million seed round, dedicated to advancing the innovation of voice-first interaction technology. This funding will be used to refine its advanced voice input technology and accelerate the realization of its vision to create a universal voice operating system layer.Willow Voice was founded in 2025 by a group of entrepreneurs with extensive experience in computer science and machine learning.
7/16/2025 4:11:53 PM AI在线
百度文心一言上线新功能,可快速定制自己的 AI 声音

百度文心一言上线新功能,可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。据IT之家了解,想要体验这一功能,只需打开文心一言 App,点击下方“ ”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。在确认声音质量后,你的专属“语音库”就在瞬间构建完成。今后,在与智能体的每一次对话中,你都可以点击播放键,使用自己合成的音色进行语音播报。此外,还可以点击对话框上的通话按钮,与你自己构建的数字分身实时对话
4/7/2024 3:10:28 PM 远洋