应用
高一致性、强控制力,腾讯发布多模态视频生成利器 HunyuanCustom
腾讯近日正式开源其全新多模态定制视频生成框架——HunyuanCustom,标志着AI视频创作进入更高自由度与精准控制的全新阶段。 该框架基于腾讯自研的 HunyuanVideo 打造,主打**“主体一致性”与“多模态灵活输入”**,致力于实现视频内容与输入素材高度匹配的个性化生成。 HunyuanCustom 的核心优势在于其强大的多模态输入能力:支持用户通过文本描述、单图或多图图像、参考音频甚至已有的视频片段作为输入,系统可综合这些信息生成定制化视频。
5/12/2025 10:01:12 AM
AI在线
特朗普解除版权局局长职务,因拒绝支持 AI 企业采集版权作品
美国总统特朗普近期解除版权局局长希拉・珀尔穆特(Shira Perlmutter)的职务,此举引起了广泛关注。 根据 CBS 新闻和 Politico 的报道,众议员乔・莫雷尔(Joe Morelle)对此表示强烈反对,称这是一场 “公然、前所未有的权力夺取,毫无法律依据”。 他指出,珀尔穆特的解职与她拒绝支持特斯拉创始人埃隆・马斯克(Elon Musk)将大量版权作品用于人工智能训练的请求密切相关。
5/12/2025 10:01:12 AM
AI在线
微软研究:API 代理速度更快,但 GUI 代理更灵活
近日,微软的研究团队对 API 代理和 GUI 代理进行了对比研究,发现这两种代理各有特点,可以根据不同需求进行合理选择。 API 代理通过可编程接口与软件进行交互,而 GUI 代理则模拟人类的操作方式,通过点击按钮和导航菜单来完成任务。 例如,若要安排一个活动,API 代理可能只需一次函数调用,而 GUI 代理则需要打开日历应用,逐步填写相关信息。
5/12/2025 10:01:12 AM
AI在线
谷歌推出面向 13 岁以下儿童Gemini AI聊天机器人
谷歌最近宣布,将推出其新的 Gemini 人工智能(AI)聊天机器人,专门面向13岁以下的儿童。 这个新产品将在未来一周内在美国和加拿大上线,预计今年晚些时候也会在澳大利亚推出。 值得注意的是,这款聊天机器人将仅通过谷歌的家庭链接账户提供,这意味着家长可以对儿童的使用进行一定的控制。
5/12/2025 10:01:12 AM
AI在线
Cursor 0.50版本重磅更新,简化定价与增强AI编程体验
Cursor于2025年5月9日推出0.50版本重大更新,带来了简化的定价模式、全面升级的Max模式以及一系列功能增强()。 此次更新聚焦于提升AI编程效率,新增跨文件代码建议、后台代理和多代码库支持等功能,进一步巩固了Cursor作为AI驱动代码编辑器的领先地位。 AIbase观察到,开发者社区对新版本的响应速度和多任务处理能力给予高度评价。
5/12/2025 10:01:12 AM
AI在线
自变量机器人完成数亿元 A 轮融资,由美团战投领投
公众号《智能涌现》今日发文,具身智能公司「自变量机器人」近日完成数亿元 A 轮融资,由美团战投领投、美团龙珠跟投。该文自变量机器人被官方转发。
5/12/2025 9:49:44 AM
浩渺
Claude AI API 引入全新的网页搜索功能
在人工智能领域备受瞩目的公司 Anthropic宣布为其 Claude AI API 引入全新的网页搜索功能。 这一创新标志着 Claude AI 能够实时访问网络信息,从而提升其回答问题的准确性,并为传统搜索引擎如谷歌带来了新的竞争压力。 开发者现在可以在发送请求时启用 Claude 的网页搜索工具。
5/12/2025 9:01:02 AM
AI在线
2025 年度十大 IP 揭晓,DeepSeek App等作品入选
由中国版权协会与中国文化娱乐行业协会指导的 “2025 世界 IP 经济发展大会暨全球 IP 授权博览会” 在广州成功举行。 本次博览会吸引了众多专家和业内人士的关注,最终评选出了 2025 年度十大 IP 和多个细分领域的 TOP10 名单。 此次评选共计有 2368 个参赛 IP 参与角逐,经过专家评审和网络投票的双重筛选,最终确定了十个优秀作品。
5/12/2025 9:01:02 AM
AI在线
亚马逊推出 “火神” 机器人,仓库工人的新机遇与挑战
最近,亚马逊在这一领域展示了其最新成果:一种新型 “能感知” 的 “火神” 机器人,正在取代部分仓库工人的工作。 亚马逊首席执行官安迪・雅西在社交媒体上表示,这款 “火神” 机器人通过处理符合人体工程学的任务,能够提高工作安全性,并为员工提供了提升技能的机会。 根据亚马逊的博客文章,火神机器人可以协助人类从仓库的高处和低处获取物品,这样一来,工人们就不必再频繁攀爬梯子或弯腰劳作。
5/12/2025 9:01:02 AM
AI在线
Anthropic推出Claude API网页搜索功能,挑战谷歌搜索
近日,知名 AI 公司 Anthropic 在本月8日宣布,为其 Claude API 引入网页搜索功能,这一举动无疑为以谷歌为首的传统搜索引擎带来了新的挑战。 随着 Claude AI 能够访问最新的网络信息,开发者们可以利用这一功能构建更智能、更具实时性的应用程序,满足用户对最新信息的需求。 通过启用网络搜索工具,开发者在向 Claude 发送请求时,可以获取到现实世界中的最新数据。
5/12/2025 9:01:02 AM
AI在线
马斯克透露 Grok 3.5 尚需优化,预计下周发布
近日,埃隆・马斯克在社交平台 X 上回答了一位网友的提问,谈及他最新的人工智能项目 ——Grok3.5。 该网友询问了 Grok3.5、GPT-03Pro 以及即将发布的游戏 GTA6哪个会先上线。 对此,马斯克坦言:“Grok3.5仍然有些粗糙,预计还需要一周左右的时间进行打磨。
5/12/2025 9:01:02 AM
AI在线
首个智能文档处理基准发布:Gemini领跑但短板待补,多模态AI面临现实挑战
5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。 该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、关键信息提取、视觉问答、表格提取、分类和长文档处理六大核心任务上的表现,为行业发展提供了可量化参考。 测试结果显示,Gemini2.5Flash在综合实力上力压群雄,但却在OCR和分类任务中出现意外"滑铁卢",表现甚至不如上一代的Gemini2.0Flash,分别下降了1.84%和0.05%。
5/12/2025 9:01:02 AM
AI在线
快手推出 AI 作图工具 Poify,聚焦电商市场
近日,快手正式推出其新型 AI 作图工具 Poify,旨在为电商领域提供更加高效和经济的图像处理解决方案。 与现有的可灵 AI 相比,Poify 在功能上更加专注于 AI 作图,尤其是在电商相关的应用上。 Poify 的核心功能包括文生图和图生图,同时特别针对电商需求推出了一系列创新的 AI 作图能力。
5/12/2025 9:01:02 AM
AI在线
谷歌搜索再迎新挑战:Anthropic 为其 API 引入网页搜索功能
Anthropic Claude API 可根据推理能力判断使用网络搜索是否有助于提供更准确的答案,还支持渐进式搜索功能。
5/12/2025 8:32:42 AM
溯波(实习)
马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨
有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”
5/12/2025 7:45:36 AM
汪淼
噱头大于实用?深度测评3款人气超高的AI智能体产品
关于 Manus 这类产品,我想说.... 从 Manus 发布至今,围绕着这类通用型智能体的讨论从没停过。 如今,在舆情平息的时候,我们觉得是时候好好评价一下这类产品了。
5/12/2025 1:39:19 AM
Infinite AI
Midjourney又更新了!一个指令带你100%实现场景穿越!
大家好,还记得 Midjourney 之前说要 60 天高频更新吗? 他们还真没吹牛! 最近更新很频繁!
5/12/2025 12:21:28 AM
旭晨AI设计实验室
OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决
OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#
5/11/2025 9:15:07 PM
远洋
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉