AI在线 AI在线

应用

高一致性、强控制力,腾讯发布多模态视频生成利器 HunyuanCustom

腾讯近日正式开源其全新多模态定制视频生成框架——HunyuanCustom,标志着AI视频创作进入更高自由度与精准控制的全新阶段。 该框架基于腾讯自研的 HunyuanVideo 打造,主打**“主体一致性”与“多模态灵活输入”**,致力于实现视频内容与输入素材高度匹配的个性化生成。 HunyuanCustom 的核心优势在于其强大的多模态输入能力:支持用户通过文本描述、单图或多图图像、参考音频甚至已有的视频片段作为输入,系统可综合这些信息生成定制化视频。
5/12/2025 10:01:12 AM
AI在线

特朗普解除版权局局长职务,因拒绝支持 AI 企业采集版权作品

美国总统特朗普近期解除版权局局长希拉・珀尔穆特(Shira Perlmutter)的职务,此举引起了广泛关注。 根据 CBS 新闻和 Politico 的报道,众议员乔・莫雷尔(Joe Morelle)对此表示强烈反对,称这是一场 “公然、前所未有的权力夺取,毫无法律依据”。 他指出,珀尔穆特的解职与她拒绝支持特斯拉创始人埃隆・马斯克(Elon Musk)将大量版权作品用于人工智能训练的请求密切相关。
5/12/2025 10:01:12 AM
AI在线

微软研究:API 代理速度更快,但 GUI 代理更灵活

近日,微软的研究团队对 API 代理和 GUI 代理进行了对比研究,发现这两种代理各有特点,可以根据不同需求进行合理选择。 API 代理通过可编程接口与软件进行交互,而 GUI 代理则模拟人类的操作方式,通过点击按钮和导航菜单来完成任务。 例如,若要安排一个活动,API 代理可能只需一次函数调用,而 GUI 代理则需要打开日历应用,逐步填写相关信息。
5/12/2025 10:01:12 AM
AI在线

谷歌推出面向 13 岁以下儿童Gemini AI聊天机器人

谷歌最近宣布,将推出其新的 Gemini 人工智能(AI)聊天机器人,专门面向13岁以下的儿童。 这个新产品将在未来一周内在美国和加拿大上线,预计今年晚些时候也会在澳大利亚推出。 值得注意的是,这款聊天机器人将仅通过谷歌的家庭链接账户提供,这意味着家长可以对儿童的使用进行一定的控制。
5/12/2025 10:01:12 AM
AI在线

Cursor 0.50版本重磅更新,简化定价与增强AI编程体验

Cursor于2025年5月9日推出0.50版本重大更新,带来了简化的定价模式、全面升级的Max模式以及一系列功能增强()。 此次更新聚焦于提升AI编程效率,新增跨文件代码建议、后台代理和多代码库支持等功能,进一步巩固了Cursor作为AI驱动代码编辑器的领先地位。 AIbase观察到,开发者社区对新版本的响应速度和多任务处理能力给予高度评价。
5/12/2025 10:01:12 AM
AI在线

自变量机器人完成数亿元 A 轮融资,由美团战投领投

公众号《智能涌现》今日发文,具身智能公司「自变量机器人」近日完成数亿元 A 轮融资,由美团战投领投、美团龙珠跟投。该文自变量机器人被官方转发。
5/12/2025 9:49:44 AM
浩渺

Claude AI API 引入全新的网页搜索功能

在人工智能领域备受瞩目的公司 Anthropic宣布为其 Claude AI API 引入全新的网页搜索功能。 这一创新标志着 Claude AI 能够实时访问网络信息,从而提升其回答问题的准确性,并为传统搜索引擎如谷歌带来了新的竞争压力。 开发者现在可以在发送请求时启用 Claude 的网页搜索工具。
5/12/2025 9:01:02 AM
AI在线

​2025 年度十大 IP 揭晓,DeepSeek App等作品入选

由中国版权协会与中国文化娱乐行业协会指导的 “2025 世界 IP 经济发展大会暨全球 IP 授权博览会” 在广州成功举行。 本次博览会吸引了众多专家和业内人士的关注,最终评选出了 2025 年度十大 IP 和多个细分领域的 TOP10 名单。 此次评选共计有 2368 个参赛 IP 参与角逐,经过专家评审和网络投票的双重筛选,最终确定了十个优秀作品。
5/12/2025 9:01:02 AM
AI在线

亚马逊推出 “火神” 机器人,仓库工人的新机遇与挑战

最近,亚马逊在这一领域展示了其最新成果:一种新型 “能感知” 的 “火神” 机器人,正在取代部分仓库工人的工作。 亚马逊首席执行官安迪・雅西在社交媒体上表示,这款 “火神” 机器人通过处理符合人体工程学的任务,能够提高工作安全性,并为员工提供了提升技能的机会。 根据亚马逊的博客文章,火神机器人可以协助人类从仓库的高处和低处获取物品,这样一来,工人们就不必再频繁攀爬梯子或弯腰劳作。
5/12/2025 9:01:02 AM
AI在线

Anthropic推出Claude API网页搜索功能,挑战谷歌搜索

近日,知名 AI 公司 Anthropic 在本月8日宣布,为其 Claude API 引入网页搜索功能,这一举动无疑为以谷歌为首的传统搜索引擎带来了新的挑战。 随着 Claude AI 能够访问最新的网络信息,开发者们可以利用这一功能构建更智能、更具实时性的应用程序,满足用户对最新信息的需求。 通过启用网络搜索工具,开发者在向 Claude 发送请求时,可以获取到现实世界中的最新数据。
5/12/2025 9:01:02 AM
AI在线

马斯克透露 Grok 3.5 尚需优化,预计下周发布

近日,埃隆・马斯克在社交平台 X 上回答了一位网友的提问,谈及他最新的人工智能项目 ——Grok3.5。 该网友询问了 Grok3.5、GPT-03Pro 以及即将发布的游戏 GTA6哪个会先上线。 对此,马斯克坦言:“Grok3.5仍然有些粗糙,预计还需要一周左右的时间进行打磨。
5/12/2025 9:01:02 AM
AI在线

首个智能文档处理基准发布:Gemini领跑但短板待补,多模态AI面临现实挑战

5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。 该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、关键信息提取、视觉问答、表格提取、分类和长文档处理六大核心任务上的表现,为行业发展提供了可量化参考。 测试结果显示,Gemini2.5Flash在综合实力上力压群雄,但却在OCR和分类任务中出现意外"滑铁卢",表现甚至不如上一代的Gemini2.0Flash,分别下降了1.84%和0.05%。
5/12/2025 9:01:02 AM
AI在线

快手推出 AI 作图工具 Poify,聚焦电商市场

近日,快手正式推出其新型 AI 作图工具 Poify,旨在为电商领域提供更加高效和经济的图像处理解决方案。 与现有的可灵 AI 相比,Poify 在功能上更加专注于 AI 作图,尤其是在电商相关的应用上。 Poify 的核心功能包括文生图和图生图,同时特别针对电商需求推出了一系列创新的 AI 作图能力。
5/12/2025 9:01:02 AM
AI在线

谷歌搜索再迎新挑战:Anthropic 为其 API 引入网页搜索功能

Anthropic Claude API 可根据推理能力判断使用网络搜索是否有助于提供更准确的答案,还支持渐进式搜索功能。
5/12/2025 8:32:42 AM
溯波(实习)

马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨

有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”
5/12/2025 7:45:36 AM
汪淼

噱头大于实用?深度测评3款人气超高的AI智能体产品

关于 Manus 这类产品,我想说.... 从 Manus 发布至今,围绕着这类通用型智能体的讨论从没停过。 如今,在舆情平息的时候,我们觉得是时候好好评价一下这类产品了。
5/12/2025 1:39:19 AM
Infinite AI

Midjourney又更新了!一个指令带你100%实现场景穿越!

大家好,还记得 Midjourney 之前说要 60 天高频更新吗? 他们还真没吹牛! 最近更新很频繁!
5/12/2025 12:21:28 AM
旭晨AI设计实验室

OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决

OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#
5/11/2025 9:15:07 PM
远洋