AI在线 AI在线

应用

字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移

字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线

知名女演员强烈要求 Meta 删除 AI 伪造广告,强调肖像权的重要性

近日,知名女演员杰米・李・柯蒂斯(Jamie Lee Curtis)在社交媒体上对 Meta 公司 CEO 马克・扎克伯格(Mark Zuckerberg)发出强烈呼吁,要求其立即删除一则使用 AI 深度伪造技术制作的虚假广告。 这则广告通过修改柯蒂斯接受 MSNBC 采访的视频片段,歪曲她的言论来推销一款未公开的产品。 柯蒂斯在声明中指出,她从未授权或同意这则广告的制作和发布,认为这种行为严重侵犯了她的肖像权和个人信誉。
5/13/2025 9:00:52 AM
AI在线

合合信息推出 MCP 服务,助力大模型高效智能文档处理

在人工智能和大模型技术飞速发展的今天,如何高效调用外部工具已成为开发者们面临的新挑战。 不同大模型的调用结构和参数格式各不相同,导致开发者不得不为每种模型单独编写工具调用逻辑,进而影响了集成的效率。 为了解决这一难题,合合信息近日推出了文档处理领域首批 MCP(Model Context Protocol)服务,为企业和开发者提供了一个 “万能接口”。
5/13/2025 9:00:52 AM
AI在线

​谷歌启动人工智能初创企业基金

谷歌宣布推出一项新的投资基金,旨在支持人工智能领域的初创企业。 这一名为 “人工智能未来基金” 的项目,将为符合条件的初创公司提供多方面的支持,包括资金投资、提前体验谷歌最新人工智能模型的机会,以及来自谷歌团队的专业指导。 在发布的博客文章中,谷歌表示,这项基金不仅仅是财务上的支持,还包括使用谷歌云服务的积分。
5/13/2025 9:00:52 AM
AI在线

​Google Gemma AI 模型下载量突破 1.5 亿次

Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。 Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。 Gemma 于2024年2月正式发布,旨在与 Meta 的 Llama 等其他开放模型系列进行竞争。
5/13/2025 9:00:52 AM
AI在线

Kimi与小红书联手,推出21天打卡挑战吸引用户

近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM
AI在线

0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。 Muyan-TTS 基于超10万小时播客数据预训练,仅需 0.33秒即可生成1秒高质量音频,支持无需打断地朗读数分钟文本,语音自然流畅。 更支持说话人定制,任意声音克隆,一键生成具有个性化语气与节奏的语音内容。
5/13/2025 9:00:52 AM
AI在线

​苹果 iOS 19 将推出AI电池管理新功能

据彭博社的最新报道,苹果公司在即将推出的 iOS19更新中,将引入一项由人工智能驱动的电池管理功能,旨在帮助用户更有效地延长 iPhone 的电池寿命。 这一新功能将能够分析用户的使用习惯,并相应地优化设备设置,以减少电池的耗损。 iOS19中的电池管理选项将作为 Apple Intelligence 功能套件的一部分。
5/13/2025 9:00:52 AM
AI在线

ChatGPT神更新!Deep Research报告一键导出PDF,表格图像全保留,效率翻倍!

ChatGPT的Deep Research功能正式上线PDF导出功能,为用户提供更便捷的报告分享与存档体验()。 用户现可通过点击分享图标并选择“下载为PDF”,将研究报告导出为包含表格、图像、链接引文和来源的格式化文档。 这一功能不仅适用于新生成的研究报告,还支持历史报告的导出,显著提升了Deep Research的实用性与企业适用性。
5/13/2025 9:00:52 AM
AI在线

OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。
5/13/2025 8:41:48 AM
问舟

无需邀请码!国产AI智能体Manus宣布向所有人开放注册

近日,国产AI智能体平台Manus正式宣布开放用户注册,用户无需加入等待名单即可直接注册使用。 Manus在公告中明确表示,所有注册用户每日均可免费执行一项任务,并获得300积分的奖励,同时,新用户还将一次性获得1000积分的额外馈赠。 回顾Manus的发展历程,该平台由来自中国的创业公司Monica于今年3月6日正式发布。
5/13/2025 8:00:42 AM
AI在线

热潮过后 Manus 宣布全面开放注册,用户每天可免费执行一项任务

Manus在公告中表示,Manus向所有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用户一次性获得1,000积分奖励。
5/13/2025 7:21:25 AM
问舟

速通BOSS需求!零基础AI Agent高效工作流设计指南(二)

前言. 此次会连载一套 AI Agent 构建的系列,主要分为三部分,上篇是速通 AI Agent 构建的工作流基础,本篇则是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,给大家提供一些思路与窍门,下篇则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试为自己搭建一些可用的 AI 助手,或是提供构建的方法指引。 上期回顾:.
5/13/2025 2:16:53 AM
泡泡bing

新研究用逆强化学习识别 Reddit 用户行为:部分网友“就是爱抬杠”

以往的方法多半着眼于用户说了什么或和谁互动,但这些方式本身也有盲点。新研究提出了一个更有效的视角:观察用户的行为模式,而不仅仅是他们说的话。
5/12/2025 10:36:09 PM
清源

腾讯混元 T1-Vision 上线元宝:可深度理解图片内容

腾讯混元T1-Vision上线元宝,融合多模态原生长思维链,可深度理解图片内容,反应时间更快,完答速度提升1.5倍。 #腾讯混元# #AI技术#
5/12/2025 8:35:19 PM
远洋

阿联酋拟为国立学校低年级普及 AI 教育:重点培养学生判断力

阿联酋正从国立学校的低年级开始普及AI课程,意在确立自身作为中东 AI 枢纽的地位,并吸取在社交媒体兴起时应对不足的教训。该国教育部长萨拉·阿米里表示,这次改革旨在避免重蹈覆辙。
5/12/2025 8:25:34 PM
清源

热门消除游戏《糖果传奇》引入生成式 AI:助力开发者重新设计超 1.8 万关卡

《糖果传奇》系列总经理托德·格林表示,借助 AI 可以为开发者腾出时间去创作新关卡。他坦言,要靠人力重新设计逾1.8万个关卡,几乎是不可能完成的任务,AI 能先“打个底”,大大提高效率。
5/12/2025 6:42:09 PM
清源

关税带来不确定性,软银、OpenAI 千亿美元“AI 基建”项目被曝陷入停滞

今年 1 月,软银创始人孙正义与 OpenAI 联合创始人奥尔特曼发布“星际之门”计划,宣称将“立即”启动 1000 亿美元投资,并最终扩大至约 5000 亿美元。
5/12/2025 6:29:48 PM
清源