AI在线 AI在线

MiniMax发布Voice Design音色设计功能 可自定义无限组合

稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。 该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。 据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。

稀宇科技(MiniMax)宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位,并正式推出Voice Design音色设计功能。该功能允许用户通过自然语言描述生成个性化音色,实现“任意语言 × 任意口音 × 任意音色”的全自定义组合,进一步降低语音合成领域的技术门槛。

据稀宇科技介绍,Voice Design功能可精准控制音色的多个维度,包括音频质量、发声方式、情感基调及人物画像。用户仅需输入文本描述,模型即可自动拆解需求并生成对应的音色编码。例如,用户可描述“带有积极鼓励的AI助手,语调积极,韵律变化丰富”,或“严厉的AI助手,女声,语速较快,音色明亮”,系统将生成符合要求的语音。

微信截图_20250623093512.png

为验证功能效果,稀宇科技展示了多组音色示例:古代侠客的洪亮正直、悬疑故事播音员的低沉磁性、权威新闻女主播的清晰利落,以及充满活力的推销员语速等。这些示例展示了Voice Design在音色定制方面的灵活性,可满足不同场景的语音需求。

稀宇科技指出,Voice Design的推出解决了语音合成领域的两大挑战:一是传统音色库难以匹配细分场景的多样化需求,二是复刻音色存在版权风险且操作复杂。通过Voice Design,用户无需准备高质量输入素材,即可快速生成理想音色,并可存储用于后续音频创作。

目前,稀宇科技的两代Speech模型已累计生成超过1.5亿小时的语音,与全球超30个国家的客户达成合作。此次Voice Design功能的上线,标志着稀宇科技在语音技术领域的持续创新,并致力于为全球用户提供更便捷、高效的语音解决方案。

用户可通过稀宇科技国内版平台(minimaxi.com/audio)或海外版平台(minimax.io/audio)体验Voice Design功能,探索语音合成的无限可能。

相关资讯

​MiniMax推出Voice Design音色设计功能,任意组合语言 、口音、音色

MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计,这标志着语音合成技术的一次重大突破。 自5月发布以来,MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一,并赢得了用户的广泛认可。 迄今为止,Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音,与全球30多个国家的用户建立了合作。
6/23/2025 12:00:38 PM
AI在线

百度文心一言上线新功能,可快速定制自己的 AI 声音

感谢近日百度文心一言上线了新功能,仅需几秒钟即可定制自己的声音。据IT之家了解,想要体验这一功能,只需打开文心一言 App,点击下方“ ”,然后选择创建智能体。在声音选项里,会发现一个名为“创建我的声音”的功能。根据系统提示读出一段话,只需两秒左右的时间,系统便能捕捉到你的声音特点,为你生成一个独特的“语音助手”。在确认声音质量后,你的专属“语音库”就在瞬间构建完成。今后,在与智能体的每一次对话中,你都可以点击播放键,使用自己合成的音色进行语音播报。此外,还可以点击对话框上的通话按钮,与你自己构建的数字分身实时对话
4/7/2024 3:10:28 PM
远洋

智谱清言上线情感语音模型 GLM-4-Voice:可理解情感,有情绪表达和共鸣

智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。 官方表示,其能够理解情感,有情绪表达、情感共鸣,可自助调节语速,支持多语言和方言,并且延时更低、可随时打断,用户即日起可在“智谱清言”App 上体验。 据介绍,GLM-4-Voice 具备如下特点:情感表达和情感共鸣:声音有不同的情感和细腻的变化,如高兴、悲伤、生气、害怕等。
10/25/2024 4:06:56 PM
清源
  • 1