AI在线 AI在线

延迟低于250毫秒!MiniMax Speech 2.6发布,Fluent LoRA一键复刻任意音色,语音合成迈入实时交互时代

当AI语音不仅能“像人说话”,还能“像你说话”,且快到几乎无感,语音交互的边界正在被彻底重构。 10 月 30 日凌晨,MiniMax稀宇科技正式发布其新一代语音合成模型——MiniMax Speech 2.6,以端到端延迟低于 250 毫秒的实时性能与革命性的Fluent LoRA音色复刻技术,将语音生成推向高自然度、低延迟、强个性化的全新阶段。 250 毫秒以内:逼近人类对话的实时响应在语音交互场景中,延迟是体验的生命线。

当AI语音不仅能“像人说话”,还能“像你说话”,且快到几乎无感,语音交互的边界正在被彻底重构。 10 月 30 日凌晨,MiniMax稀宇科技正式发布其新一代语音合成模型——MiniMax Speech 2.6,以端到端延迟低于 250 毫秒的实时性能与革命性的Fluent LoRA音色复刻技术,将语音生成推向高自然度、低延迟、强个性化的全新阶段。

250 毫秒以内:逼近人类对话的实时响应

在语音交互场景中,延迟是体验的生命线。Speech 2. 6 通过底层架构优化,实现从文本输入到音频输出全程低于 250 毫秒,接近人类自然对话的响应节奏。这意味着在智能客服、实时字幕、虚拟主播等高要求场景中,AI语音不再“慢半拍”,真正实现流畅对答与沉浸式交互。

Fluent LoRA: 30 秒音频即可克隆专属音色

本次最大突破在于Fluent LoRA(Low-Rank Adaptation)技术的深度集成。用户仅需提供 30 秒以上的参考音频,模型即可精准捕捉说话人的音色、语调、节奏甚至情感风格,并生成与目标文本高度匹配的自然语音。无论是复刻自己的声音讲述睡前故事,还是为品牌定制专属虚拟代言人,音色克隆从未如此简单、高效且逼真。

更关键的是,Fluent LoRA在保证音色一致性的前提下,显著提升语音流畅度,避免传统TTS常见的“机械断句”或“情感错位”问题,让合成语音真正具备“表达力”。

全场景覆盖:从个人创作到企业级部署

MiniMax Speech 2. 6 同时面向个人创作者与企业客户开放:

  • 教育领域:教师可快速生成带讲解的课件音频;
  • 客户服务:企业能部署具备品牌音色的智能语音机器人;
  • 智能硬件:车载、家居设备可实现低延迟、高拟真语音交互;
  • 内容生产:UP主、播客主一键生成多角色配音,大幅提升创作效率。

作为MiniMax多模态大模型生态的关键一环,Speech 2. 6 不仅强化了其在AIGC领域的技术纵深,更标志着语音合成正从“功能可用”迈向“情感可信、个性可定制”的新纪元。

在AI竞争日益聚焦“体验细节”的今天,MiniMax用 250 毫秒的延迟与一句“像你一样说话”的能力,证明了:真正的智能,不仅在于算得快,更在于说得像人、说得动人。

相关资讯

百川智能联合创始人焦可、陈炜鹏相继离职,投身AI创业热潮

近日,据界面报道,AI独角兽百川智能联合创始人焦可已正式离职,而另一位联合创始人陈炜鹏也将离开,目前仍在办理内部离职手续。 这一消息引发业内广泛关注。 据知情人士透露,焦可已开启AI语音领域的创业项目,并积极寻求融资支持。
3/17/2025 3:23:00 PM
AI在线

ElevenLabs CEO预言:AI语音模型将走向“商品化”,公司押注“模型+应用”双轮驱动

在TechCrunch Disrupt2025大会上,AI语音巨头ElevenLabs联合创始人兼CEO马蒂·斯塔尼斯泽夫斯基(Mati Staniszewski)做出一项惊人判断:AI语音模型将在未来两三年内走向“商品化”——尽管短期内仍是核心竞争力,但长期来看,模型之间的性能差异将逐渐缩小,尤其在主流语言和通用音色上。 图源备注:图片由AI生成,图片授权服务商Midjourney短期靠模型,长期靠产品面对“既然模型终将同质化,为何还要重投入研发”的质疑,Staniszewski坦言:“今天,模型仍是最大的技术壁垒。 如果AI语音听起来不自然、不流畅,用户体验就无从谈起。
10/30/2025 9:51:45 AM
AI在线

Speaking AI!效果真实的文本转语音神器,可以一键克隆自己的声音

大家好,这里是和你们一起探索 AI 的花生~ 之前推荐过 AI 无痕翻译视频的相关内容,它的实现条件包括文本内容的准确翻译、人物语音克隆及嘴型匹配。今天我们就来看一款效果非常不错的 AI 语音克隆工具 Speaking AI,它可以将文本转为如真人说话一般自然的语音,还支持用户免费克隆自己的声音。 上期回顾:一、Speaking AI 介绍 网站直达: Speaking AI 是一个初创公司,创始人为 Harry Zheng,其团队成员也都是中国人。公司创立的初衷是坚信对话式生成语音代表着人类与人工智能之间的未来
11/23/2023 8:45:49 AM
夏花生
  • 1