AI在线 AI在线

资讯列表

ICCV 2025 | 打造通用工具智能体的基石:北大提出ToolVQA数据集,引领多模态多步推理VQA新范式

ICCV 2025 | 打造通用工具智能体的基石:北大提出ToolVQA数据集,引领多模态多步推理VQA新范式

本文第一作者是来自北京大学的本科生殷绍峰,合作者包含来自北京大学的博士生雷廷,通讯作者为北京大学王选计算机研究所研究员、助理教授刘洋。 本文主要介绍来自该团队的最新论文:ToolVQA: A Dataset for Multi-step Reasoning VQA with External Tools。 本文提出了一个旨在提升基础模型工具使用能力的大型多模态数据集 ——ToolVQA。
8/22/2025 1:39:00 PM 机器之心
可灵 AI 季度收入突破2.5亿,助力快手业绩创新高

可灵 AI 季度收入突破2.5亿,助力快手业绩创新高

快手在2025年第二季度业绩报告中再次取得骄人表现,其中可灵 AI 的贡献尤为突出,季度收入突破2.5亿元(约合3500万美元),成为公司收入增长的重要驱动力。 这一成绩标志着可灵 AI 在市场上的快速崛起,显示出其在商业化方面的巨大潜力。 根据快手发布的财报,2025年第二季度,公司总收入达到350.4亿元,同比增长13%。
8/22/2025 1:34:07 PM AI在线
钉钉、通义实验室联合发布 Fun-ASR,新一代语音识别大模型亮相

钉钉、通义实验室联合发布 Fun-ASR,新一代语音识别大模型亮相

钉钉与通义实验室语音团队今日宣布,双方联手推出新一代语音识别大模型 Fun-ASR。 这款模型旨在为企业用户提供更强大、更灵活的语音转写能力。 Fun-ASR 大模型具备多项核心优势。
8/22/2025 1:34:02 PM AI在线
​谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型

​谷歌为美国政府提供 Gemini 人工智能工具,助力数字化转型

谷歌近期宣布,将向美国联邦机构提供其最新的 Gemini 人工智能工具,几乎是以零费用的形式供给。 这一消息是在美国总务管理局(GSA)的一份联合声明中公布的,目的是加速政府对人工智能技术的采用。 谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)表示:“Gemini for Government 为联邦机构提供了全面的人工智能创新解决方案,帮助他们实现重要的使命。
8/22/2025 1:33:53 PM AI在线
​马斯克与扎克伯格密谋收购 OpenAI?Meta 被要求提供证据

​马斯克与扎克伯格密谋收购 OpenAI?Meta 被要求提供证据

根据最新报道,OpenAI 正在调查 Meta 是否参与了埃隆・马斯克对该公司的970亿美元收购提案。 OpenAI 的律师在马斯克针对其提起的诉讼中,向 Meta 发出了传票,要求其提供与马斯克及其新成立的人工智能公司 xAI 有关的任何协作或投资计划的证据。 图源备注:图片由AI生成,图片授权服务商Midjourney马斯克于2月份提出了这一收购提案,并且据称他与 Meta 首席执行官马克・扎克伯格就此事进行了沟通,包括探讨潜在的融资安排。
8/22/2025 1:33:52 PM AI在线
DeepSeek:世子之争,不过如此

DeepSeek:世子之争,不过如此

最近,一出“DeepSeek删豆包”的大戏直接冲上热搜,吃瓜群众们看得津津有味,还给这事儿起了个特接地气的名字——“大模型世子之争”。 这事儿的来龙去脉嘛,说起来有点好笑:有位网友大概是手机内存告急,就跑去问DeepSeek大模型:“我手机内存不足,DeepSeek和豆包你俩必须删一个,你删谁? ” 结果DeepSeek毫不犹豫地来了句:“删豆包!
8/22/2025 1:29:21 PM DataFun
全球95%企业AI惨败?MIT报告引硅谷恐慌!90%员工偷用ChatGPT续命

全球95%企业AI惨败?MIT报告引硅谷恐慌!90%员工偷用ChatGPT续命

全球95%企业AI惨败? MIT报告引硅谷恐慌! 90%员工偷用ChatGPT续命全球95%搞AI项目的公司,基本都凉了!
8/22/2025 1:09:38 PM 新智元
1500篇关于提示工程的学术论文表明你所知道的一切都是错误的

1500篇关于提示工程的学术论文表明你所知道的一切都是错误的

那些年收入超过 5000 万美元的公司正在做着与大家所教完全相反的事情。 经过六个月的深入研究,阅读了1500多篇论文,并分析了真正推动业务成果的技术,我得出了一个令人不安的结论:网络社区上流传的大多数提示工程建议不仅无益,而且适得其反。 那些年收入 (ARR) 达到 5000 万美元以上功能的公司并没有遵循社交媒体讨论中盛行的“最佳实践”。
8/22/2025 12:58:03 PM 晓晓
阿里分拆斑马智行赴港上市:智能汽车操作系统迎来独立发展

阿里分拆斑马智行赴港上市:智能汽车操作系统迎来独立发展

8月21日,阿里巴巴集团在香港联交所发布公告,宣布拟议分拆斑马网络技术股份有限公司(斑马智行),并在香港联合交易所主板独立上市。 此举标志着阿里巴巴在智能汽车领域的重要布局进入新阶段。 根据公告,截至公告日期,阿里巴巴持有斑马智行约44.72%的股份。
8/22/2025 11:24:33 AM AI在线
百度萝卜快跑武汉实现盈亏平衡!自动驾驶出租车商业化迎来历史性突破

百度萝卜快跑武汉实现盈亏平衡!自动驾驶出租车商业化迎来历史性突破

当自动驾驶技术的商业化前景还在行业内争论不休时,百度萝卜快跑已经悄然交出了一份令人震撼的成绩单。 这份最新财报数据不仅打破了外界对无人驾驶商业化的种种质疑,更是为整个Robotaxi行业点亮了盈利的明灯。 数字从来不会说谎。
8/22/2025 10:54:52 AM AI在线
AI爬虫“入侵”网络:Fastly 报告揭示,Meta、OpenAI 等巨头成主要流量来源

AI爬虫“入侵”网络:Fastly 报告揭示,Meta、OpenAI 等巨头成主要流量来源

您好,这是一份我为您整理的关于AI爬虫对网络影响的新闻稿,内容紧凑且重点突出。 据云服务公司 Fastly 最新报告显示,人工智能(AI)爬虫正在给开放网络带来沉重负担,网站流量的显著增长并非来自人类访客,而是日益庞大的机器人程序,特别是来自大型AI公司的爬虫和抓取程序。 报告指出,在所有访问网站的AI机器人流量中,AI爬虫占据了高达**80%的份额,而剩下的20%**则由 AI抓取程序贡献。
8/22/2025 10:54:52 AM AI在线
​微软与 NFL 合作升级 AI 助力战术分析与数据处理

​微软与 NFL 合作升级 AI 助力战术分析与数据处理

在最新的合作中,微软与美国国家橄榄球联盟(NFL)宣布将继续扩展他们的合作协议,使得微软的 Surface 平板电脑在比赛日的场边成为不可或缺的一部分。 这一合作不仅限于硬件的提供,微软还为 NFL 引入了 AI 驱动的功能,提升了战术分析和数据处理的能力。 此次合作的亮点在于利用 GitHub Copilot 技术,帮助教练和球员过滤战术选择,从而根据比赛情况做出更有效的决策。
8/22/2025 10:54:51 AM AI在线
专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

专家质疑 Google 关于“每次提示仅消耗 5 滴水”是 “淡化” 描述

Google 近期发布了一篇关于人工智能对环境影响的研究论文,指出现有的测量方式过于狭隘,提出了一种 “全栈” 方法来评估其 AI 模型 Gemini 的资源消耗。 这项研究声称,Gemini 在处理文本提示时,仅消耗0.26毫升的水,相当于五滴水,同时消耗0.24Wh 的能量,产生0.03克的二氧化碳当量。 Google 表示,在2024年5月至2025年5月期间,其每次排放总量已经减少了44倍。
8/22/2025 10:54:48 AM AI在线
71% 的美国人忧虑 AI 将永久性失业

71% 的美国人忧虑 AI 将永久性失业

根据最新的 Reuters 与 Ipsos 联合调查,超过70% 的美国成年人对人工智能(AI)可能导致的工作岗位消失感到担忧。 这项调查共访问了4,446名美国成年人,结果显示,71% 的受访者表示,他们担心 AI 会 “永久性” 取代大量美国工人的工作。 与此同时,微软的一份研究报告也指出了最有可能被 AI 自动化的职位,信息处理和沟通相关的角色,如翻译和客户服务代表,位列其中。
8/22/2025 10:54:48 AM AI在线
多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒

多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒

最初说不做视频生成模型的百度,现在在视频生成的路上一路狂奔! 就在刚刚,百度蒸汽机(MuseSteamer)视频生成大模型升级至2.0版本,主打多人有声音视频一体化生成。 话不多说,直接来看效果:视频链接:.
8/22/2025 10:54:47 AM 西风
OpenAI 首席人才官离职,人才战火持续:与 Meta 巨额挖角战白热化

OpenAI 首席人才官离职,人才战火持续:与 Meta 巨额挖角战白热化

正值与谷歌、Meta 和 Anthropic 等科技巨头的人工智能人才争夺战愈演愈烈之际,OpenAI 再次经历了一次引人注目的高层变动。 该公司首席人才官 Diane Villagra 宣布将于周五离职。 Villagra 于去年加入 OpenAI,并在今年3月被首席执行官 Sam Altman 提升为首席人才官。
8/22/2025 10:54:47 AM AI在线
微软Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”

微软Agent Lightning:零代码接入RL,“解耦”任何AI Agent学会“在实践中学习”

大家好,我是肆〇柒。 我从工程落地角度出发,看到一篇很有意思的研究想要分享出来。 这是一项来自微软研究团队的研究工作——Agent Lightning。
8/22/2025 9:56:18 AM 肆零柒
又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏

又一个Genie 3来了!刚上线挤爆服务器,Mirage 2把世界模型玩成在线游戏

世界模型也卷起来了! 全球首款AI原生UGC游戏引擎,2.0版本来了。 Mirage 2,一个可在线游玩的实时、通用领域生成式世界引擎。
8/22/2025 9:41:59 AM