AI在线 AI在线

资讯列表

0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。 Muyan-TTS 基于超10万小时播客数据预训练,仅需 0.33秒即可生成1秒高质量音频,支持无需打断地朗读数分钟文本,语音自然流畅。 更支持说话人定制,任意声音克隆,一键生成具有个性化语气与节奏的语音内容。
5/13/2025 9:00:52 AM
AI在线

Kimi与小红书联手,推出21天打卡挑战吸引用户

近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM
AI在线

​Google Gemma AI 模型下载量突破 1.5 亿次

Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。 Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。 Gemma 于2024年2月正式发布,旨在与 Meta 的 Llama 等其他开放模型系列进行竞争。
5/13/2025 9:00:52 AM
AI在线

ICML 2025 | 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

该工作第一作者为中国人民大学高瓴人工智能学院硕士生程传奇,目前于蚂蚁技术研究院实习,其主要研究领域为多模态大模型,蚂蚁技术研究院副研究员关健为共同第一作者。 在视觉语言模型(Vision-Language Models,VLMs)取得突破性进展的当下,长视频理解的挑战显得愈发重要。 以标准 24 帧率的标清视频为例,仅需数分钟即可产生逾百万的视觉 token,这已远超主流大语言模型 4K-128K 的上下文处理极限。
5/13/2025 8:59:20 AM

如何规划AI提示词搜索需要的内容

如何规划AI提示词搜索需要的内容开发者在规划AI提示词时,需要考虑多个因素以确保能够从AI工具中获得高质量、准确且符合预期的输出。 以下是一些关键步骤和策略,以及具体的例子来说明如何规划有效的AI提示词。 明确角色与任务首先,应当明确AI在对话中的角色以及它需要完成的任务。
5/13/2025 8:58:00 AM
前端老兵

连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定

科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM

OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。
5/13/2025 8:41:48 AM
问舟

o3 vs o4 mini vs Gemini 2.5 pro:终极推理之战

译者 | 李睿审校 | 重楼随着技术的发展和进步,人工智能模型越来越智能,但究竟哪一种人工智能模型能在压力下展现出真正的推理能力? 本文对o3、o4-mini和Gemini 2.5 Pro这三种人工智能模型进行了一系列测试:物理谜题、数学问题、编码任务和现实世界的智商测试。 而应对这些挑战并没有任何捷径,而只有对它们思维能力的考验。
5/13/2025 8:24:14 AM
李睿

CodeBuddy的七种武器

中学时代非常喜欢看武侠小说,“飞雪连天射白鹿,笑书神侠倚碧鸳”自然不在话下,还看过梁羽生的《白发魔女传》与《七剑下天山》等书,当然还有古龙的《多情剑客无情剑》《绝代双骄》等,以及颇具特色的《七种武器》。 近来使用CodeBuddy,于是借用“七种武器”的噱头,聊一下CodeBuddy的七个功能特性,过一把武侠瘾。 1.长生剑:Craft智能体在编程江湖的传说里,Craft智能体就像一柄藏在键盘中的"长生剑"——这柄剑没有锋刃却通晓编程,剑鸣轻响间便能将言语化作代码星河。
5/13/2025 8:20:58 AM
曹洪伟

无需邀请码!国产AI智能体Manus宣布向所有人开放注册

近日,国产AI智能体平台Manus正式宣布开放用户注册,用户无需加入等待名单即可直接注册使用。 Manus在公告中明确表示,所有注册用户每日均可免费执行一项任务,并获得300积分的奖励,同时,新用户还将一次性获得1000积分的额外馈赠。 回顾Manus的发展历程,该平台由来自中国的创业公司Monica于今年3月6日正式发布。
5/13/2025 8:00:42 AM
AI在线

热潮过后 Manus 宣布全面开放注册,用户每天可免费执行一项任务

Manus在公告中表示,Manus向所有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用户一次性获得1,000积分奖励。
5/13/2025 7:21:25 AM
问舟

CIO如何将AI炒作转化为切实的业务成果

在企业中,AI的优先级并不总是被完全理解,技术投入与投资既可以相辅相成,也可能相互掣肘。 在Foundry的《2025年AI优先级研究》中,企业透露他们正在为AI项目分配比以往更多的资金,近一半的企业现在都在为AI项目预留预算,这一比例从2023年的36%有所上升,此外,他们还将近25%的IT支出用于AI计划。 虽然有些企业比其他企业采取更为审慎的态度,但南非科技领袖们的共识是,AI投资必须带来切实的成果,且AI预算必须在整个企业中战略性地分配。
5/13/2025 7:00:00 AM
Joanne

推理模型越来越强,大模型微调还有必要吗?

最近笔者在将大模型服务应用于实际业务系统时,首先一般习惯性用一些闭源api服务,花上几块钱快速测试下流程,然后在去分析下大模型效果。 如果通过几次调整Prompt或者超参数还是出现的bad cases比较多(比如输出结果的结构化有问题,输出结果不理想,在某些专业领域不同模型结果表现不一并且效果比较差),这个时候需要考虑下通过微调的方式来训练大模型。 现在的大模型推理能力越来越厉害,人们开始怀疑:我们还需要花时间和资源去微调大模型吗?
5/13/2025 5:11:00 AM
ChallengeHub

AI训练的反直觉发现:添加"有毒"数据反而能造就更好的语言模型?

"当坏数据能够创造出好模型,AI训练领域又一个传统观念被颠覆"你有没有听说过这样一个说法:垃圾进,垃圾出? 在AI大语言模型的训练中,这一直是个不言自明的准则。 工程师们花费大量时间和资源过滤训练数据,移除那些含有有毒、有害或不适当内容的文本,以防止模型学习和生成这些内容。
5/13/2025 2:22:00 AM
无影寺

速通BOSS需求!零基础AI Agent高效工作流设计指南(二)

前言. 此次会连载一套 AI Agent 构建的系列,主要分为三部分,上篇是速通 AI Agent 构建的工作流基础,本篇则是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,给大家提供一些思路与窍门,下篇则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试为自己搭建一些可用的 AI 助手,或是提供构建的方法指引。 上期回顾:.
5/13/2025 2:16:53 AM
泡泡bing

国产大模型「五强争霸」,决战AGI!

DeepSeek的横空出世,已经彻底改变了全球的AI局势。 从此,不仅中美大模型竞争格局改变,国产大模型的产业版图,也被一举打破! 纵观中国基础大模型的市场,可以看到,如今的基础大模型版图已然改天换地,演变为全新的五强格局——字节、阿里、阶跃星辰、智谱,以及DeepSeek。
5/13/2025 2:00:22 AM
新智元

AI自我复制:技术突破下的风险挑战

从诞生之初到现在,人工智能已经取得了长足的进步。 早期的人工智能系统是人类创造的奇迹,但完全依赖于人类的持续指导,存在很大局限性。 几十年来,伴随技术的发展,人工智能从基础的机器学习演变为更为复杂的神经网络。
5/13/2025 2:00:00 AM
Yu

一文了解!MCP 技术生态全面解析:核心组件、工作流程、生命周期

在 AI 领域,模型上下文协议(MCP)的出现,就像是一场及时雨,完美地解决了 AI 模型与外部工具和资源交互的难题,让它们之间的协作变得轻松又自然,彻底打破了数据孤岛的困境,让不同系统之间的互操作性不再是梦想。 一、MCP 核心组件:架构精解MCP 架构 :MCP 主要有三个核心组件,分别是 MCP 主机、MCP 客户端和 MCP 服务器,它们三个相互配合,让 AI 应用和外部工具、数据源之间能够无缝通信。 MCP 主机 :就好比是一个大舞台,为执行 AI 任务提供了演出环境,并且在这个舞台上运行着 MCP 客户端,没有它,整个表演就没办法开始。
5/13/2025 1:45:00 AM
小智