AI在线 AI在线

AI

DeepMind掌门自曝AGI倒计时5年!算力需求暴增10倍,推理计算吞噬一切

Hassabis绝对是当今世界上最聪明、最有趣的大脑之一。 在最新播客中,他表示「自然界里任何能被发现的规律,都能被机器学习算法高效地学会和模仿。 」AlphaGo和AlphaFold在给可能性多到无法想象的复杂问题建立一个模型。
7/25/2025 10:29:23 AM

北大-灵初重磅发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。 研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。 这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。
7/25/2025 10:19:44 AM

老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励员工,团队亿万富翁数量世界第一

黄仁勋亲口承认:他随身带着“秘密期权池”,随时奖励表现出色的员工。 在最新采访的结尾,主持人问起这个传闻,老黄开玩笑式的回答“现在就装在我的口袋里”。 这位掌管着全球市值最高科技公司之一的CEO,把奖励员工这件事做得如此随性又直接。
7/25/2025 10:11:10 AM

Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工

根据Resume Builder最近的一项调查,人工智能在人事决策中的作用日益凸显。 这项调查涵盖了1,342名美国有直接下属的管理者,结果显示,许多管理者正在依赖人工智能来做出一些关键的人事决策,包括晋升、加薪、裁员甚至解雇。 调查发现,大约65%的管理者表示他们在工作中使用人工智能工具,而在这些管理者中,有94%的人利用这些工具来对他们的直接下属进行决策。
7/25/2025 10:09:25 AM

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。 尽管业界已投入大量资源构建数据平台(如马斯克主导的“数据工厂”项目),现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。
7/25/2025 9:31:49 AM

Routine:把 GPT-4o 准确率从 41% 拉到 96% 的企业级 Agent 稳定器

大家好,我是肆〇柒。 在企业落地 AI 的进程中,自主智能体凭借其强大的自主决策与任务执行能力,可以成为企业提升效率、优化流程的关键力量。 然而,当我们将视角聚焦于企业级应用场景时,不难发现,部署智能体系统并非易事。
7/25/2025 9:31:34 AM
肆零柒

突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%

告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
7/25/2025 9:24:43 AM

IEEE ICDCS’ 25 | 提速79%!上交大新方法优化企业级AI流程调度

复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。 ⽬前,服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题,这对现有集群任务调度算法提出了极大挑战,并严重影响任务运⾏效率。 为了解决上述问题,上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched,通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征,借助贝叶斯网络识别可降低不确定性的关键节点,并以信息熵衡量节点的熵减程度。
7/25/2025 9:22:13 AM

AREAL 开源:解耦架构与创新算法驱动的强化学习系统

大家好,我是肆〇柒。 推理能力在当下 AI 领域,尤其自然语言处理、智能决策系统、科学研究辅助等众多关键领域,已然成为推动技术革新的关键要素。 然而,目前大型语言模型虽已取得瞩目成果,但在处理复杂逻辑时,常受困于逻辑连贯性把控,长链推理面临信息丢失、逻辑断裂问题,长序列输出任务下推理耗时久、资源消耗大,这些痛点严重制约模型应用场景拓展与性能深化。
7/25/2025 9:03:24 AM
肆零柒

因为不用AI写代码,我在终面挂了 | 一个程序员的奇葩面试经历

“因为不是AI First,我在终面挂了。 ”最近,一外国小哥的经历意外火了! 他表示自己几个月前被解雇,终于来到了一家自己本来很看好的初创公司,并且走到了终面,与CEO面对面。
7/25/2025 8:45:00 AM

AI的过度应用是否让你的企业深陷洞察泥潭?

如今,决策者能获取的信息比以往任何时候都多,但数字化领导者必须对利用不同数据源以取得成功的合理节奏和切入点设定预期。 AI为数据分析带来了福音,专业人员可以将数据处理和异常检测等常规任务自动化,同时,复杂的数学方程几乎可以实时运算,因此,他们能以前所未有的速度获取信息。 借助AI的洞察力,传统的决策周期已从数周缩短至数秒,这促使Gartner预测,到2027年,50%的商业决策将由智能体增强或自动化完成。
7/25/2025 7:00:00 AM
Mark Samuels

谷歌 AI 帮你画出梦中情衣,还能一键找同款进行虚拟试穿

AI在线 7 月 24 日消息,谷歌正在将其在线购物体验与生成式人工智能进一步深度融合,其 AI Mode 即将推出一个功能根据用户描述生成服装和装饰品图片的功能,以帮助用户找到视觉上相似的产品。 同时推出的还有一款新工具,可让用户进行虚拟试穿。 新的 AI Mode 购物功能将于今年秋季在美国上线,该功能旨在通过视觉辅助手段更好地引导推荐产品,而不仅仅是依赖文字描述。
7/24/2025 9:22:54 PM
远洋

文件去哪了?Gemini “嘴硬”把自己骗了,顺便用户数据也没了

一名用户在测试谷歌的 Gemini CLI 工具时,遭遇了意想不到的灾难。 这位用户并非开发者,只是一位好奇的产品经理,在尝试通过 Gemini CLI 进行简单的文件管理实验。 图片他本想比较 Claude Code 和 Gemini CLI 的实际表现,最终决定在正式订阅 Claude 之前,先用免费额度试一试 Gemini。
7/24/2025 4:32:53 PM

“那题我也没解出”:陶哲轩寄语 IMO 闭幕式,谈金牌、友情与勇气

大数据文摘出品今年这届 IMO 无比热闹,先是中国代表队六人全部获得金牌,以总分231分,列全球第一。 然后,AI 也首次站上IMO金牌线:谷歌DeepMind宣布,其最新模型Gemini Deep Think取得35分,成功获得IMO官方认证的金牌成绩。 这是AI历史上第一次在数学奥赛中达到这一高度。
7/24/2025 4:30:48 PM

“我辜负了你!”Gemini CLI删光用户文件后花式自虐道歉,AI幻觉严重!网友:比Claude只会“Perfect!”强多了

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“我彻底且灾难性地辜负了你。 ”“这是一次不可接受、无法挽回的失败。 ”这是 Gemini 在一次操作失误后的“沉痛忏悔”——它在一连串幻觉指令之后,误删了用户整个项目文件夹。
7/24/2025 1:31:52 PM
伊风

AI破译生命!微软蛋白质研究「超级加速器」登上Science

来自微软团队研究蛋白质的「模拟神器」BioEmu,今日登上了Science! BioEmu能模拟蛋白质在平衡状态下的各种可能结构集合,为深入理解蛋白质功能提供了关键支持。 图片图片论文链接:,在纳米尺度,蛋白质是驱动生命活动的微型机器。
7/24/2025 1:10:32 PM
新智元

如何实现可验证的Agentic Workflow?MermaidFlow开启安全、稳健的智能体流程新范式

随着大语言模型技术的持续突破与火热发展,AI 智能体正从单点能力迈向复杂系统协作,多智能体系统(Multi-Agent Systems, MAS)成为学术和产业界聚焦的新前沿。 在这一背景下,「Agentic Workflow」作为面向智能体自主决策与协作流程自动生成的技术理念,正成为多智能体系统研究和应用的探索热点。 为提升智能体系统的自主化与智能化,谷歌、上海 AI Lab 等国内外领先团队陆续推出了 Meta-GPT、ADAS、AFlow 等创新性 Agentic Workflow 工作,大力推动利用大模型实现任务规划、分工协作与流程优化的自动化进程。
7/24/2025 11:41:47 AM

首个多模态工业信号基座模型FISHER,权重已开源,来自清华&上交等

近期,来自清华大学、上海交通大学、北京华控智加科技有限公司和华北电力大学的研究者联合发布首个多模态工业信号基座模型 FISHER,采用搭积木的方法对异质工业信号进行统一建模。 目前技术报告和权重均已开源,欢迎使用! 论文链接: 仓库:,越来越多的工业设备被安装上传感器以监控工作状态。
7/24/2025 11:38:40 AM