MiniMax
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。
1/22/2025 2:07:00 PM
王悦
MiniMax 海螺语音 AI 产品上线:支持 17 种语言生成,最长可输入多达 10000 字符
MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。
1/21/2025 6:16:30 PM
浩渺
未经授权使用相关内容进行模型训练,爱奇艺起诉 MiniMax 索赔 10 万元
据凤凰网科技报道,爱奇艺日前已向上海市徐汇区人民法院正式提起诉讼,指控国内 AI 初创企业 MiniMax 在 AI 模型训练及内容生成流程中涉嫌侵犯其版权。
1/6/2025 3:31:55 PM
浩渺
细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新
3 个月前,MiniMax 发布了首款 AI 高清视频生成模型 Abab-video-1。 只用了 5 周时间,海螺 AI 的网页版访问量便增速超 800%,还登上了 AI 产品榜当月全球增速榜、国内增速榜双榜单 TOP 1。 一时间,不少国内网友直呼其为“国产之光”。
12/16/2024 2:04:00 PM
郑佳美
实测字节豆包·视频生成模型:Sora画的饼被实现了......
但更多的网友则是期待字节的视频生成模型,因为早在去年11月,字节的项目Make Pixels Dance就展示字节具备了解决长AI视频中角色一致性难以保持的问题。 所以我也看到很多外网网友的另一个问题“Where is ByteDacne?”。 而就在9.24火山引擎AI创新巡展深圳站上,火山引擎一口气发布了个视频生成模型PixelDance和Seaweed模型。
9/27/2024 5:55:00 PM
林杰鑫
消息称国内 AI 大模型初创公司 MiniMax 产品负责人张前川离职
感谢据《智能涌现》报道,中国 AI 大模型初创公司 MiniMax 产品负责人、前今日头条用户产品负责人张前川,因个人原因目前已淡出公司事务,改任产品顾问一职。MiniMax 回应称,消息内容属实,感谢前川的付出和努力。一名知情者表示,产品顾问其实是虚职,张前川已经不参与公司业务,与离职无异。报道称,张前川此前在 MiniMax 内负责“星野”和“海螺”两款公司主力产品。2024 年中,张前川又淡出“星野”的决策,参与 MiniMax 生产力工具“海螺 AI”和部分其他产品的日常事务。张前川离职后,MiniMax
9/14/2024 2:20:37 PM
汪淼
成立996天,MiniMax 每日与世界的30亿次交互
8月31日,“2024 MiniMax Link伙伴日”活动在上海正式举行。 本次活动以Link(连接)为主题,聚焦AI创新技术发展。 活动现场,MiniMax创始人闫俊杰分享了基于MOE(混合专家模型) Linear Attention(线性注意力)的新一代模型技术。
9/2/2024 5:02:00 PM
王悦
MiniMax不声不响出了款让人惊喜的生产力产品:「海螺AI」大测评
继 1 月推出国内首个基于 MoE 架构的千亿参数量大语言模型 abab6 后,上周,通用人工智能创业公司、中国估值最高的大模型公司之一 MiniMax 推出了万亿 MoE 模型 abab 6.5。根据 MiniMax 发布的技术报告,在各类核心能力测试中,abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。 MiniMax 用业界标准的开源测试集测试两个模型。abab 6.5系列包含两个模型 abab 6.5和abab 6.5s,在知识、推理、数
4/25/2024 12:02:00 PM
机器之心
MiniMax 稀宇科技发布万亿参数 MoE 模型 abab 6.5,核心能力接近 GPT-4
国内 AI 初创企业 MiniMax 稀宇科技今日正式推出 MoE 混合专家模型架构的 abab 6.5 系列模型,核心能力开始接近 GPT-4、 Claude-3、 Gemini-1.5。abab 6.5 系列包含两个模型:abab 6.5:包含万亿参数,支持 200k tokens 的上下文长度;abab 6.5s:与 abab 6.5 使用了同样的训练技术和数据,但是更高效,支持 200k tokens 的上下文长度,可以 1 秒内处理近 3 万字的文本。自一月发布国内首个基于 MoE 架构的 abab 6
4/17/2024 2:50:25 PM
泓澄(实习)
个性经济时代,MiniMax 语音大模型如何 To C?
大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 ChatGPT Plus 开发的三个 Agent(又称“GPTs”),其中一个 Agent 是关于美国费城旅游出行的个人指南“PhillyGPT”,它能访问当地 SEPTA 公共交通 API,为个人提供费城当地的实时天气、旅游资讯、文艺演出活动、出行路线、公交车站与地标数据、预计抵达时间等等。 具体可访问 PhillyGPT 链接:,实际是人们对于 GPT 时代 C 端个性消费产品的真正想象。 无独有偶,1 月 11 日 OpenAI 正式上线 GPT Store 后,公布 300 万个 GPTs 之余,也将与用户日常消费活动息息相关的徒步路线指南“AllTrails”放在推荐榜单上。
2/2/2024 2:22:00 PM
王悦
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP