应用
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移
字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线
知名女演员强烈要求 Meta 删除 AI 伪造广告,强调肖像权的重要性
近日,知名女演员杰米・李・柯蒂斯(Jamie Lee Curtis)在社交媒体上对 Meta 公司 CEO 马克・扎克伯格(Mark Zuckerberg)发出强烈呼吁,要求其立即删除一则使用 AI 深度伪造技术制作的虚假广告。 这则广告通过修改柯蒂斯接受 MSNBC 采访的视频片段,歪曲她的言论来推销一款未公开的产品。 柯蒂斯在声明中指出,她从未授权或同意这则广告的制作和发布,认为这种行为严重侵犯了她的肖像权和个人信誉。
5/13/2025 9:00:52 AM
AI在线
合合信息推出 MCP 服务,助力大模型高效智能文档处理
在人工智能和大模型技术飞速发展的今天,如何高效调用外部工具已成为开发者们面临的新挑战。 不同大模型的调用结构和参数格式各不相同,导致开发者不得不为每种模型单独编写工具调用逻辑,进而影响了集成的效率。 为了解决这一难题,合合信息近日推出了文档处理领域首批 MCP(Model Context Protocol)服务,为企业和开发者提供了一个 “万能接口”。
5/13/2025 9:00:52 AM
AI在线
谷歌启动人工智能初创企业基金
谷歌宣布推出一项新的投资基金,旨在支持人工智能领域的初创企业。 这一名为 “人工智能未来基金” 的项目,将为符合条件的初创公司提供多方面的支持,包括资金投资、提前体验谷歌最新人工智能模型的机会,以及来自谷歌团队的专业指导。 在发布的博客文章中,谷歌表示,这项基金不仅仅是财务上的支持,还包括使用谷歌云服务的积分。
5/13/2025 9:00:52 AM
AI在线
Google Gemma AI 模型下载量突破 1.5 亿次
Google 近期宣布,其人工智能模型集合 Gemma 的下载量已经突破1.5亿次,标志着该项目取得了显著进展。 Google DeepMind 的开发者关系工程师 Omar Sanseviero 在社交平台 X 上分享了这一消息,并透露,目前在人工智能开发平台 Hugging Face 上,开发者们已经创造出了超过7万个不同版本的 Gemma 模型。 Gemma 于2024年2月正式发布,旨在与 Meta 的 Llama 等其他开放模型系列进行竞争。
5/13/2025 9:00:52 AM
AI在线
Kimi与小红书联手,推出21天打卡挑战吸引用户
近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM
AI在线
0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配
开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。 Muyan-TTS 基于超10万小时播客数据预训练,仅需 0.33秒即可生成1秒高质量音频,支持无需打断地朗读数分钟文本,语音自然流畅。 更支持说话人定制,任意声音克隆,一键生成具有个性化语气与节奏的语音内容。
5/13/2025 9:00:52 AM
AI在线
苹果 iOS 19 将推出AI电池管理新功能
据彭博社的最新报道,苹果公司在即将推出的 iOS19更新中,将引入一项由人工智能驱动的电池管理功能,旨在帮助用户更有效地延长 iPhone 的电池寿命。 这一新功能将能够分析用户的使用习惯,并相应地优化设备设置,以减少电池的耗损。 iOS19中的电池管理选项将作为 Apple Intelligence 功能套件的一部分。
5/13/2025 9:00:52 AM
AI在线
ChatGPT神更新!Deep Research报告一键导出PDF,表格图像全保留,效率翻倍!
ChatGPT的Deep Research功能正式上线PDF导出功能,为用户提供更便捷的报告分享与存档体验()。 用户现可通过点击分享图标并选择“下载为PDF”,将研究报告导出为包含表格、图像、链接引文和来源的格式化文档。 这一功能不仅适用于新生成的研究报告,还支持历史报告的导出,显著提升了Deep Research的实用性与企业适用性。
5/13/2025 9:00:52 AM
AI在线
OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力
与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。
5/13/2025 8:41:48 AM
问舟
无需邀请码!国产AI智能体Manus宣布向所有人开放注册
近日,国产AI智能体平台Manus正式宣布开放用户注册,用户无需加入等待名单即可直接注册使用。 Manus在公告中明确表示,所有注册用户每日均可免费执行一项任务,并获得300积分的奖励,同时,新用户还将一次性获得1000积分的额外馈赠。 回顾Manus的发展历程,该平台由来自中国的创业公司Monica于今年3月6日正式发布。
5/13/2025 8:00:42 AM
AI在线
热潮过后 Manus 宣布全面开放注册,用户每天可免费执行一项任务
Manus在公告中表示,Manus向所有人开放,无需等待名单;所有用户每天可免费执行一项任务(300积分),所有用户一次性获得1,000积分奖励。
5/13/2025 7:21:25 AM
问舟
速通BOSS需求!零基础AI Agent高效工作流设计指南(二)
前言. 此次会连载一套 AI Agent 构建的系列,主要分为三部分,上篇是速通 AI Agent 构建的工作流基础,本篇则是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,给大家提供一些思路与窍门,下篇则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试为自己搭建一些可用的 AI 助手,或是提供构建的方法指引。 上期回顾:.
5/13/2025 2:16:53 AM
泡泡bing
新研究用逆强化学习识别 Reddit 用户行为:部分网友“就是爱抬杠”
以往的方法多半着眼于用户说了什么或和谁互动,但这些方式本身也有盲点。新研究提出了一个更有效的视角:观察用户的行为模式,而不仅仅是他们说的话。
5/12/2025 10:36:09 PM
清源
腾讯混元 T1-Vision 上线元宝:可深度理解图片内容
腾讯混元T1-Vision上线元宝,融合多模态原生长思维链,可深度理解图片内容,反应时间更快,完答速度提升1.5倍。 #腾讯混元# #AI技术#
5/12/2025 8:35:19 PM
远洋
阿联酋拟为国立学校低年级普及 AI 教育:重点培养学生判断力
阿联酋正从国立学校的低年级开始普及AI课程,意在确立自身作为中东 AI 枢纽的地位,并吸取在社交媒体兴起时应对不足的教训。该国教育部长萨拉·阿米里表示,这次改革旨在避免重蹈覆辙。
5/12/2025 8:25:34 PM
清源
热门消除游戏《糖果传奇》引入生成式 AI:助力开发者重新设计超 1.8 万关卡
《糖果传奇》系列总经理托德·格林表示,借助 AI 可以为开发者腾出时间去创作新关卡。他坦言,要靠人力重新设计逾1.8万个关卡,几乎是不可能完成的任务,AI 能先“打个底”,大大提高效率。
5/12/2025 6:42:09 PM
清源
关税带来不确定性,软银、OpenAI 千亿美元“AI 基建”项目被曝陷入停滞
今年 1 月,软银创始人孙正义与 OpenAI 联合创始人奥尔特曼发布“星际之门”计划,宣称将“立即”启动 1000 亿美元投资,并最终扩大至约 5000 亿美元。
5/12/2025 6:29:48 PM
清源
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉