AI在线 AI在线

模型

毕树超入职Meta后首发声:十年前怀疑AGI,如今深信AGI已至!

加入Meta超级智能实验室后,毕树超首次发声:大多数人可能低估了AI的影响! 十年前,他非常怀疑AGI,但在过去十年中,他逐渐接受了AGI,日渐笃定,甚至宣称:2025,AGI已来。 上个月,他在哥伦比亚大学和哈佛大学就人工智能发表了两次演讲。
7/29/2025 9:07:00 AM

人类在被大语言模型“反向图灵测试”

2018 年,我曾在《深度学习》一书中,讲述了人工智能从逻辑运算模型向类脑计算模型转变的历程。 回想 20 世纪 80 年代深度学习算法刚被发明时,计算机性能仅及今日的百万分之一。 那时的我们无法预知,当这些算法随着规模扩大和数据增加会具备怎样的能力。
7/29/2025 2:55:00 AM

谁是Adam?NeurIPS 2025审稿爆年度最大笑话!Hinton也曾被拒稿

这几天,NeurIPS 2025的评审结果,陆续出炉了! 让人措不及防的是,「Who's Adam」明晃晃地出现在了一位作者的审稿建议中,成为近来学术圈最大的笑柄。 究竟是大模型不懂,还是审稿人疏忽了?
7/28/2025 9:14:00 AM

首次结合RL与SFT各自优势,动态引导模型实现推理⾼效训练

刘子儒博士毕业于香港城市大学数据科学专业,导师为赵翔宇教授及数学家周定轩教授。 目前就职于华为香港研究所小艺团队,负责 RLVR 算法与扩散语言模型方向的研究。 龚成目前在香港城市大学攻读博士学位,导师为张青富教授。
7/28/2025 9:12:00 AM

万亿美元新大陆!谁将主宰「人机共生」智能体经济时代?

人机共生、生态自治的未来经济形态人类社会正站在智能革命的临界点。 当通用人工智能(AGI)的曙光尚未普照大地之时,一场由垂直领域智能体(Agent)驱动的经济变革已悄然席卷产业腹地。 这场变革的必然性深植于技术演进与商业逻辑的双重土壤:基础大模型在算力、算法与数据的能效博弈中渐趋平稳,而真正的价值创造正从基础设施层向应用层猛烈迁移。
7/28/2025 9:10:00 AM

CEO卷走24亿,二号员工血亏99%!30亿Windsurf梦碎内幕曝光

Prem Qu Nair可能刚刚度过了一生中最跌宕起伏的时光。 他是原Windsurf的2号员工。 为了继续探索软件工程的未来,他从谷歌DeepMind离职,加入了AI初创Cognition。
7/28/2025 9:09:00 AM

字节跳动刚把自己招牌AI Agent开源了,可商用、超6000颗星

如果你是智能体资深玩家,相信一定用过字节跳动的招牌产品扣子(Coze),现在已经开源了,并且支持商业化。 扣子是一个AI Agent开发平台,提供各类最新大模型、工具、多种开发模式和框架,从开发到部署提供可视化一站式开发环境。 多数情况下,甚至不用编写代码就能完成所有开发流程。
7/28/2025 9:04:01 AM

刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25

你是否想过,工厂是如何在很多种不同产品中,精准识别出浅浅的划痕、缺失的元件,甚至是几乎察觉不到的微小缺陷? 这远比「图像识别」要复杂。 在工业质检、安防监控、医疗影像等场景中,无监督异常检测(Unsupervised Anomaly Detection, UAD)日益成为核心技术之一。
7/28/2025 9:03:00 AM

GPT-5实锤,悄悄上线代号「龙虾」!版本号曝光,实测编程惊人能改屎山代码

GPT-5来了? 但是「龙虾」版! GPT-5「Lobster」疑似现身WebDev Arena,引发社区狂热猜测:网友实测比Grok-4好的离谱。
7/28/2025 8:54:00 AM

OpenAI 多智能体研究框架:构建高效协作的AI代理系统

在人工智能快速发展的今天,单一AI模型已难以满足复杂任务的需求,多智能体系统正成为解决复杂问题的重要方向。 OpenAI推出的多智能体研究框架(Multi-AI Agent Research Framework)通过协调多个各司其职的AI代理,实现了远超单一模型的研究能力和应用价值。 本文将深入解析这一框架的核心原理、架构设计、实际应用及未来潜力,为开发者和企业提供全面的参考指南。
7/28/2025 1:33:00 AM
大模型之路

Hinton上海演讲:大模型跟人类智能很像,警惕养虎为患

深度学习之父、诺奖得主Hinton在中国的首次公开演讲,实录来了! 演讲主题是《数字智能是否会取代生物智能》。 主要观点如下:人类有可能就是大语言模型,人类也会和大语言模型一样有幻觉。
7/27/2025 6:08:51 PM

AI教父Hinton对话上海AI Lab周伯文:多模态聊天机器人已经具有意识,让AI聪明和让AI善良是两件事

AI圈众所周知,家族渊源与中国颇深的Geoffrey Hinton因为患有严重的背疾几乎无法长途旅行,只在去年因为领取诺奖才勉强“带伤”飞抵瑞典。 所以当本周的一张他与上海市领导会面照片出现在国内互联网络的时候,立刻引爆了朋友圈——终于可以在中国一睹教父真容。 △图片来自“上海发布”不过Hinton此次的中国上海之行,参与的基本都是闭门以及定向邀请研讨,7月26日下午,他与上海人工智能实验室主任周伯文的对话此次中国行程里的唯一一场面向AI和科学前沿研究者的公开对话活动,这也是他中国之行的最后一天,这场浓缩高密度智慧的尖峰对话,将Hinton的上海之行推向新高潮。
7/27/2025 6:08:51 PM

训练数据爆减至1/1200!清华&生数发布国产视频具身基座模型,高效泛化复杂物理操作达SOTA水平

机器人能通过普通视频来学会实际物理操作了! 来看效果,对于所有没见过的物品,它能精准识别并按照指令完成动作。 比如清理桌面垃圾,或者是从零食筐里找到人类想要的糖果。
7/25/2025 3:22:20 PM

AI教父Hinton首次现身中国,合照全网刷屏!预警AI觉醒临界点已至

深度学习之父、图灵奖巨头、2024物理学诺奖得主Hinton,亲自来中国了! 这似乎是第一次,Hinton在公开活动上以真人肉身踏上中国的土地。 现在,这张他和市委书记陈吉宁会见的照片,已经在全网刷屏了。
7/25/2025 3:10:15 PM

北大-灵初重磅发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。 研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。 这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。
7/25/2025 10:19:44 AM

媲美Claude 4,支持100万上下文!阿里开源超强代码AI Agent模型

阿里巴巴开源了超强AI Agent模型Qwen3-Coder-480B-A35B-Instruct。 根据阿里公布的测试数据显示,Qwen3-Coder在OpenAI发布的Agent测试基准SWE-bench Verified中,500轮交互的测试分数达到了69.6%,常规分数为67%,可媲美最强闭源代码模型之一Claude Sonnet 4的70.4%和68%。 同时Qwen3-Coder也大幅度超越了DeepSeek R1-0528版本的41.4%和V3-0324版本的38.8%。
7/25/2025 10:06:05 AM

突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%

告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
7/25/2025 9:24:43 AM

IEEE ICDCS’ 25 | 提速79%!上交大新方法优化企业级AI流程调度

复合LLM应用 (compound LLM applications) 是一种结合大语言模型(LLM)与外部工具、API、或其他LLM的高效多阶段工作流应用。 ⽬前,服务这些应⽤任务需要⾯对运⾏时⻓不确定、⼯作流结构不确定等问题,这对现有集群任务调度算法提出了极大挑战,并严重影响任务运⾏效率。 为了解决上述问题,上海交通大学朱怡飞教授团队联合江行智能提出调度框架LLMSched,通过引入三类新节点来扩展传统任务表征方法实现复合LLM应用任务的有效表征,借助贝叶斯网络识别可降低不确定性的关键节点,并以信息熵衡量节点的熵减程度。
7/25/2025 9:22:13 AM