AI在线 AI在线

应用

几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的

试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。
1/22/2025 2:07:00 PM
王悦

李飞飞:语言之外,另一半的智能还有待实现

「语言是人类的语言,而 3D 是自然的语言。 」「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。 」「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。
1/22/2025 1:25:00 PM
机器之心

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。 谷歌 AI 掌门人 Jeff Dean 亲发贺信:「我们在此实验性更新中引入了 1M 长的上下文,以便对长篇文本(如多篇研究论文或大量数据集)进行更深入的分析。
1/22/2025 1:23:00 PM
机器之心

字节跳动豆包大模型 1.5 Pro 发布,综合得分优于 GPT-4o、Claude 3.5 Sonnet

字节跳动旗下豆包大模型 1.5 Pro 今日正式发布,全新 Doubao-1.5-pro 模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。
1/22/2025 12:57:08 PM
汪淼

有道子曰推理模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强推理效果

2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 1月22日,网易有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。 作为14B轻量级单模型,子曰-o1支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:32:00 AM
新闻助手

网易有道推出国内首个输出分步式讲解的推理模型“子曰-o1”

据官方介绍,子曰-o1 是 14B 轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,能够提供细致解题过程,以强逻辑和推理能力,实现更高的解题准确性,并提供中文逻辑推理。
1/22/2025 11:26:32 AM
问舟

DeepSeek-R1 最新发布,剑指 OpenAI o1

昨日 1 月20 号,DeepSeek 团队推出了全新开源模型 DeepSeek-R1,一夜之间模型就在 Github 上收获了 4k star,引爆大模型领域。 而这次的 R1 模型一出,不仅反驳了之前蒸馏 OpenAI o1 的说法,官方更是直接下场表示:“我们可以和开源版的 o1 打成平手”。 值得一提的是, R1 突破了以往的模型训练形式,完全没有使用任何 SFT 数据,仅通过纯粹的 RL 来训练模型,这一点说明 R1 已经学会了自己思考问题——这实则更符合人类的思维规则。
1/22/2025 10:48:00 AM
郑佳美

刚刚,特朗普联手奥特曼,狂砸5000亿美元启动AI「星际之门」

「如果以占 GDP 的比例来衡量,这一规模与阿波罗(登月)计划和曼哈顿(原子弹)计划相当。 」刚刚,在白宫新闻发布会上,特朗普和OpenAI CEO Sam Altman、软银CEO孙正义等人联合宣布了一个名为「星际之门」(Stargate Project)的人工智能项目。                                 图源:the Verge星际之门是一家新成立的公司,计划在未来四年内投资 5000 亿美元,为 OpenAI 在美国建设新的人工智能基础设施。
1/22/2025 10:29:00 AM
机器之心

微软解绑:OpenAI 获更大 AI 算力自主权,携手软银、甲骨文等启动 5000 亿美元“星际之门”项目

微软公司昨日(1 月 21 日)发布公告,宣布调整和 OpenAI 公司的合作关系,允许 OpenAI 使用竞争对手的计算资源。此次调整旨在满足 OpenAI 日益增长的算力需求,并缓解双方因算力供应问题产生的摩擦。
1/22/2025 7:59:04 AM
故渊

联合国教科文组织呼吁推动人工智能在教育领域的理性应用

联合国教科文组织总干事阿祖莱今日宣布,2025 年“国际教育日”(1 月 24 日)将聚焦人工智能议题,并呼吁教科文组织会员国加大对教师和学生的培训投入,推动人工智能在教育领域的理性应用。
1/21/2025 10:58:28 PM
浩渺

消息称蔚来已组建 20 人左右团队,调研机器狗项目

据《21 汽车》报道,蔚来汽车已组建了一支约 20 人的团队,专门调研机器狗项目,并由前 Momenta 算法专家徐抗担任负责人。徐抗于 2020 年加入蔚来自动驾驶团队,此次转向机器狗项目,标志着蔚来在具身智能(Embodied AI)领域的进一步探索。
1/21/2025 10:28:20 PM
远洋

蓝思科技向智元批量交付灵犀 X1 人形机器人产品

今日,蓝思科技与智元机器人公司在长沙举行了灵犀 X1 人形机器人套餐交付仪式,成功批量交付灵犀 X1 人形机器人相关产品。
1/21/2025 9:42:00 PM
浩渺

OpenAI CFO 回应马斯克诉讼:这是竞争手段,AI 太烧钱非营利模式难以为继

在达沃斯世界经济论坛期间,OpenAI 首席财务官莎拉・弗里亚(Sarah Friar)接受彭博社采访时,针对埃隆・马斯克(Elon Musk)通过法律手段阻止 OpenAI 转型为营利性公司的行为表示,这是一种竞争手段。
1/21/2025 8:08:28 PM
远洋

预测精度媲美实验!哥大团队开发可解释细胞「基础」模型,揭示213种人类细胞调控语法

编辑 | 萝卜皮转录调控涉及调控序列和蛋白质之间的复杂相互作用,指导所有生物过程。 转录计算模型缺乏通用性,无法准确推断未知的细胞类型和条件。 哥伦比亚大学的研究人员介绍了 GET(general expression transformer),这是一种可解释的基础模型,旨在揭示 213 种人类胎儿和成人细胞类型的调控语法。
1/21/2025 7:13:00 PM
ScienceAI

MiniMax 海螺语音 AI 产品上线:支持 17 种语言生成,最长可输入多达 10000 字符

MiniMax 昨日宣布,带来全新升级的 T2A-01 系列语音模型,并全球同步上线海螺语音产品。据介绍,依托于 T2A-01 系列语音模型,用户在海螺 AI 仅需输入文字即可生成自然、流畅的超拟人人声,最长可输入多达 10000 字符。
1/21/2025 6:16:30 PM
浩渺

原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」

基础模型的革新,才是通向未来之路。 下一代 AI 的发展,似乎遇到了难以逾越的瓶颈。 去年 12 月,OpenAI 在 ChatGPT 两周年期间连续发布了 12 天,我们期待的新一代大模型 GPT-5 却从头到尾没有踪影。
1/21/2025 5:17:00 PM
机器之心

1 句话做中文海报,美图 WHEE“AI 海报”功能即将上线

美图 WHEE 昨晚宣布即将上线的「AI 海报」功能,用户只需要一句话就能生成各种海报,关键是支持中文字体。
1/21/2025 5:00:20 PM
浩渺

腾讯混元 3D 生成大模型 2.0 开源发布,同步上线“业界首个一站式 3D 内容 AI 创作平台”

腾讯今日官宣开源上线混元 3D 生成大模型 2.0。腾讯混元还同步上线混元 3D AI 创作引擎,号称是“业界首个一站式 3D 内容 AI 创作平台”。
1/21/2025 3:33:19 PM
汪淼