Voice

MiniMax推出Voice Design音色设计功能，任意组合语言、口音、音色

MiniMax推出Voice Design音色设计功能，任意组合语言、口音、音色

MiniMax 最近推出了一项创新功能 ——Voice Design 音色设计，这标志着语音合成技术的一次重大突破。自5月发布以来，MiniMax Speech-02模型在 Artificial Analysis 榜单上稳居全球第一，并赢得了用户的广泛认可。迄今为止，Speech-01和 Speech-02两代模型已经帮助客户生成了超过1.5亿小时的语音，与全球30多个国家的用户建立了合作。

6/23/2025 12:00:38 PM AI在线

MiniMax发布Voice Design音色设计功能可自定义无限组合

MiniMax发布Voice Design音色设计功能可自定义无限组合

稀宇科技（MiniMax）宣布其Speech-02语音模型在Artificial Analysis榜单中持续保持全球领先地位，并正式推出Voice Design音色设计功能。该功能允许用户通过自然语言描述生成个性化音色，实现“任意语言 × 任意口音 × 任意音色”的全自定义组合，进一步降低语音合成领域的技术门槛。据稀宇科技介绍，Voice Design功能可精准控制音色的多个维度，包括音频质量、发声方式、情感基调及人物画像。

6/23/2025 10:00:48 AM AI在线

智谱清言上线情感语音模型 GLM-4-Voice：可理解情感，有情绪表达和共鸣

智谱清言上线情感语音模型 GLM-4-Voice：可理解情感，有情绪表达和共鸣

智谱今天宣布上线 GLM-4-Voice 端到端情感语音模型。官方表示，其能够理解情感，有情绪表达、情感共鸣，可自助调节语速，支持多语言和方言，并且延时更低、可随时打断，用户即日起可在“智谱清言”App 上体验。据介绍，GLM-4-Voice 具备如下特点：情感表达和情感共鸣：声音有不同的情感和细腻的变化，如高兴、悲伤、生气、害怕等。

10/25/2024 4:06:56 PM 清源

15 秒语音片段就能合成某人声音，OpenAI 小规模开放 Voice Engine 模型

15 秒语音片段就能合成某人声音，OpenAI 小规模开放 Voice Engine 模型

感谢OpenAI 公司近日发布公告，有限开放 Voice Engine 的访问权限，该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示：“通过开放小规模部署，有助于我们按照现有方法、保障措施等推进产品落地，并在不断磨合、探索过程中思考，如何将 Voice Engine 用于各行各业”。OpenAI 公司表示，目前已经向教育技术公司 Age of Learning、视觉故事平台 HeyGen、前线健康软件制造商 Dimagi、人工智能通信应用开发商 Livox 和健康系统 Lifespa

3/30/2024 11:50:43 AM 故渊

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉