应用
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。
1/22/2025 2:07:00 PM
王悦
李飞飞:语言之外,另一半的智能还有待实现
「语言是人类的语言,而 3D 是自然的语言。 」「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。 」「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。
1/22/2025 1:25:00 PM
机器之心
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首
就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。 谷歌 AI 掌门人 Jeff Dean 亲发贺信:「我们在此实验性更新中引入了 1M 长的上下文,以便对长篇文本(如多篇研究论文或大量数据集)进行更深入的分析。
1/22/2025 1:23:00 PM
机器之心
字节跳动豆包大模型 1.5 Pro 发布,综合得分优于 GPT-4o、Claude 3.5 Sonnet
字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。
1/22/2025 12:57:08 PM
汪淼
有道子曰推理模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强推理效果
2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 1月22日,网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。 作为14B轻量级单模型,子曰-o1支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:32:00 AM
新闻助手
网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”
据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:26:32 AM
问舟
DeepSeek-R1 最新发布,剑指 OpenAI o1
昨日 1 月20 号,DeepSeek 团队推出了全新开源模型 DeepSeek-R1,一夜之间模型就在 Github 上收获了 4k star,引爆大模型领域。 而这次的 R1 模型一出,不仅反驳了之前蒸馏 OpenAI o1 的说法,官方更是直接下场表示:“我们可以和开源版的 o1 打成平手”。 值得一提的是, R1 突破了以往的模型训练形式,完全没有使用任何 SFT 数据,仅通过纯粹的 RL 来训练模型,这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。
1/22/2025 10:48:00 AM
郑佳美
刚刚,特朗普联手奥特曼,狂砸5000亿美元启动AI「星际之门」
「如果以占 GDP 的比例来衡量,这一规模与阿波罗(登月)计划和曼哈顿(原子弹)计划相当。 」刚刚,在白宫新闻发布会上,特朗普和OpenAI CEO Sam Altman、软银CEO孙正义等人联合宣布了一个名为「星际之门」(Stargate Project)的人工智能项目。 图源:the Verge星际之门是一家新成立的公司,计划在未来四年内投资 5000 亿美元,为 OpenAI 在美国建设新的人工智能基础设施。
1/22/2025 10:29:00 AM
机器之心
微软解绑:OpenAI 获更大 AI 算力自主权,携手软银、甲骨文等启动 5000 亿美元“星际之门”项目
微软公司昨日(1 月 21 日)发布公告,宣布调整和 OpenAI 公司的合作关系,允许 OpenAI 使用竞争对手的计算资源。此次调整旨在满足 OpenAI 日益增长的算力需求,并缓解双方因算力供应问题产生的摩擦。
1/22/2025 7:59:04 AM
故渊
联合国教科文组织呼吁推动人工智能在教育领域的理性应用
联合国教科文组织总干事阿祖莱今日宣布,2025 年“国际教育日”(1 月 24 日)将聚焦人工智能议题,并呼吁教科文组织会员国加大对教师和学生的培训投入,推动人工智能在教育领域的理性应用。
1/21/2025 10:58:28 PM
浩渺
消息称蔚来已组建 20 人左右团队,调研机器狗项目
据《21 汽车》报道,蔚来汽车已组建了一支约 20 人的团队,专门调研机器狗项目,并由前 Momenta 算法专家徐抗担任负责人。徐抗于 2020 年加入蔚来自动驾驶团队,此次转向机器狗项目,标志着蔚来在具身智能(Embodied AI)领域的进一步探索。
1/21/2025 10:28:20 PM
远洋
蓝思科技向智元批量交付灵犀 X1 人形机器人产品
今日,蓝思科技与智元机器人公司在长沙举行了灵犀 X1 人形机器人套餐交付仪式,成功批量交付灵犀 X1 人形机器人相关产品。
1/21/2025 9:42:00 PM
浩渺
OpenAI CFO 回应马斯克诉讼:这是竞争手段,AI 太烧钱非营利模式难以为继
在达沃斯世界经济论坛期间,OpenAI 首席财务官莎拉・弗里亚(Sarah Friar)接受彭博社采访时,针对埃隆・马斯克(Elon Musk)通过法律手段阻止 OpenAI 转型为营利性公司的行为表示,这是一种竞争手段。
1/21/2025 8:08:28 PM
远洋
预测精度媲美实验!哥大团队开发可解释细胞「基础」模型,揭示213种人类细胞调控语法
编辑 | 萝卜皮转录调控涉及调控序列和蛋白质之间的复杂相互作用,指导所有生物过程。 转录计算模型缺乏通用性,无法准确推断未知的细胞类型和条件。 哥伦比亚大学的研究人员介绍了 GET(general expression transformer),这是一种可解释的基础模型,旨在揭示 213 种人类胎儿和成人细胞类型的调控语法。
1/21/2025 7:13:00 PM
ScienceAI
MiniMax 海螺语音 AI 产品上线:支持 17 种语言生成,最长可输入多达 10000 字符
MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。
1/21/2025 6:16:30 PM
浩渺
原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」
基础模型的革新,才是通向未来之路。 下一代 AI 的发展,似乎遇到了难以逾越的瓶颈。 去年 12 月,OpenAI 在 ChatGPT 两周年期间连续发布了 12 天,我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。
1/21/2025 5:17:00 PM
机器之心
1 句话做中文海报,美图 WHEE“AI 海报”功能即将上线
美图 WHEE 昨晚宣布即将上线的「AI 海报」功能,用户只需要一句话就能生成各种海报,关键是支持中文字体。
1/21/2025 5:00:20 PM
浩渺
腾讯混元 3D 生成大模型 2.0 开源发布,同步上线“业界首个一站式 3D 内容 AI 创作平台”
腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎,号称是“业界首个一站式 3D 内容 AI 创作平台”。
1/21/2025 3:33:19 PM
汪淼
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
论文
Anthropic
代码
训练
算法
Stable Diffusion
AI新词
芯片
LLM
蛋白质
腾讯
开发者
苹果
生成式
Claude
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
RAG
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视频生成
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用