AI在线 AI在线

理论

AI教父Hinton首次现身中国,合照全网刷屏!预警AI觉醒临界点已至

深度学习之父、图灵奖巨头、2024物理学诺奖得主Hinton,亲自来中国了! 这似乎是第一次,Hinton在公开活动上以真人肉身踏上中国的土地。 现在,这张他和市委书记陈吉宁会见的照片,已经在全网刷屏了。
7/25/2025 3:10:15 PM

港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!

本文一作彭道杰,香港科技大学广州在读博士生;共同一作曹嘉航,北京人形机器人创新中心实习生;共同一作张强香港科技大学广州在读博士生,北京人形机器人创新中心学术委员会主任;通讯导师马骏,香港科技大学广州&香港科技大学助理教授。 在复杂的开放环境中,让足式机器人像人类一样自主完成「先跑到椅子旁,再快速接近行人」这类长程多目标任务,一直是 robotics 领域的棘手难题。 传统方法要么局限于固定目标类别,要么难以应对运动中的视觉抖动、目标丢失等实时挑战,导致机器人在真实场景中常常「迷路」或「认错对象」。
7/25/2025 2:59:51 PM

Dify 1.7.0重磅更新:基于支持OAuth认证功能的插件开发GitHub智能体

前言Dify是一款开源的大语言模型应用开发平台,旨在降低AI应用的开发门槛,帮助开发者和企业快速构建、部署及管理生成式AI应用。 通过接入Dify的RESTful API,可以将Dify智能体集成到你的业务系统。 全新版本Dify v1.7.0 已正式发布,为插件系统带来了两个关键更新: OAuth认证支持与插件自动升级策略增强,进一步释放Dify的灵活性与稳定性。
7/25/2025 1:46:47 PM
AI大模型应用开发

“流量波动”下的DeepSeek:东南亚机遇显现,但观望心态未解

几个月前,当DeepSeek横空出世、席卷全球时,曾引发行业欢呼雀跃。 但数月过去,“DeepSeek热潮已过”的声音在国内外蔓延。 关注其近期表现,或许能让我们深入理解中国大语言模型(LLM)存在的机遇和挑战。
7/25/2025 11:44:34 AM
小刀

为什么日本代码‘稳如狗’?走访丰田等多家日本团队:写代码像做寿司,每天进步1%「侘寂」美学让系统跑几十年,网友:任天堂都30年了

编译 | 云昭这周一,小编偶然看到了一篇角度很奇特的、有关日本代码风格的文章。 虽说现在 Vibe Coding 盛行,很多老铁们都不那么关注代码本身了,但若要真的让 AI 工具编写含金量组足够的代码,反而对于开发者的“代码审美”提出了更高的要求。 这篇文章的作者是一位老鸟后端工程师 Sohail Saifi,也在用各种 AI Coding 工具。
7/25/2025 10:51:38 AM
云昭

智能体协作的力量:Anthropic 的「Research」多智能体实践

大家好,我是肆〇柒。 在 AI 领域,多智能体系统正逐渐成为解决复杂任务的关键技术之一。 昨天,我看到一篇出自 Anthropic 官网 Engineering 板块的博文,主要分享了Anthropic 在 Research 这个功能对于多智能体的工程实践。
7/25/2025 10:31:52 AM
肆零柒

DeepMind掌门自曝AGI倒计时5年!算力需求暴增10倍,推理计算吞噬一切

Hassabis绝对是当今世界上最聪明、最有趣的大脑之一。 在最新播客中,他表示「自然界里任何能被发现的规律,都能被机器学习算法高效地学会和模仿。 」AlphaGo和AlphaFold在给可能性多到无法想象的复杂问题建立一个模型。
7/25/2025 10:29:23 AM

北大-灵初重磅发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。 研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。 这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。
7/25/2025 10:19:44 AM

老黄自曝皮衣口袋藏“秘密期权池”!随时准备奖励员工,团队亿万富翁数量世界第一

黄仁勋亲口承认:他随身带着“秘密期权池”,随时奖励表现出色的员工。 在最新采访的结尾,主持人问起这个传闻,老黄开玩笑式的回答“现在就装在我的口袋里”。 这位掌管着全球市值最高科技公司之一的CEO,把奖励员工这件事做得如此随性又直接。
7/25/2025 10:11:10 AM

Resume Builder报告:多数经理使用AI来决定,晋升或解雇员工

根据Resume Builder最近的一项调查,人工智能在人事决策中的作用日益凸显。 这项调查涵盖了1,342名美国有直接下属的管理者,结果显示,许多管理者正在依赖人工智能来做出一些关键的人事决策,包括晋升、加薪、裁员甚至解雇。 调查发现,大约65%的管理者表示他们在工作中使用人工智能工具,而在这些管理者中,有94%的人利用这些工具来对他们的直接下属进行决策。
7/25/2025 10:09:25 AM

AgentRM 奖励建模:智能体泛化能力的“导航仪”与“加速器”

大家好,我是肆〇柒。 在 AI 领域,大型语言模型(LLM)基础智能体正逐渐成为解决复杂交互任务的关键力量。 然而,一个不容忽视的问题是:尽管它们在训练中见过的任务上表现出色,但面对未见过的新任务时,泛化能力却往往不尽人意。
7/25/2025 10:06:41 AM
肆零柒

媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型

阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。 根据阿里公布的测试数据显示,Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中,500轮交互的测试分数达到了69.6%,常规分数为67%,可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。 同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。
7/25/2025 10:06:05 AM

vivo自研蓝河操作系统内核开源!Rust开发新机遇来了

芜湖~在AI重塑智能终端这个关键时刻,首个适用于嵌入式和移动设备的开源Rust内核,来了! vivo最新宣布,开源自研蓝河操作系统内核。 它完全由Rust语言编写,从根本上解决了传统C语言在内存安全、维护成本上的长期难点。
7/25/2025 9:35:47 AM

亿级短视频数据突破具身智能Scaling Law!Being-H0提出VLA训练新范式

如何让机器人从看懂世界,到理解意图,再到做出动作,是具身智能领域当下最受关注的技术重点。 但真机数据的匮乏,正在使对应的视觉-语言-动作(VLA)模型面临发展瓶颈。 尽管业界已投入大量资源构建数据平台(如马斯克主导的“数据工厂”项目),现有真机数据规模仍较模型规模定律所需的上亿级训练样本相差三个数量级。
7/25/2025 9:31:49 AM

Routine:把 GPT-4o 准确率从 41% 拉到 96% 的企业级 Agent 稳定器

大家好,我是肆〇柒。 在企业落地 AI 的进程中,自主智能体凭借其强大的自主决策与任务执行能力,可以成为企业提升效率、优化流程的关键力量。 然而,当我们将视角聚焦于企业级应用场景时,不难发现,部署智能体系统并非易事。
7/25/2025 9:31:34 AM
肆零柒

马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖

马斯克昨天在X上发了一条消息:"xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100,这什么概念? 我算了一下,这相当于35个核电站的发电量才能供得起。
7/25/2025 9:25:05 AM
阿丸笔记

突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%

告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
7/25/2025 9:24:43 AM

IEEE ICDCS’ 25 | 提速79%!上交大新方法优化企业级AI流程调度

复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。 ⽬前,服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题,这对现有集群任务调度算法提出了极大挑战,并严重影响任务运⾏效率。 为了解决上述问题,上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched,通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征,借助贝叶斯网络识别可降低不确定性的关键节点,并以信息熵衡量节点的熵减程度。
7/25/2025 9:22:13 AM