资讯列表
从失败中学习:Google 提出 ReasoningBank 让 LLM 智能体真正“吃一堑长一智”
大家好,我是肆〇柒。 今天要和大家分享一项来自 Google Cloud AI Research 与 伊利诺伊大学香槟分校(UIUC) 等机构的最新研究成果——ReasoningBank。 这项工作直面当前 LLM 智能体在持久任务中记不住教训、重复犯错的根本瓶颈,提出了一种全新的记忆框架:不仅能从成功中提炼策略,更能从失败中提取预防性教训,让智能体实现“越用越聪明”的自进化能力。
10/16/2025 2:00:00 AM
肆零柒
高性能智算网关打通 GPU 集群与 AI 存储高速链路,硬件成本直降 95%
在企业级智算场景中,AI 训练需依托大规模 GPU 集群进行算力输出,同时依赖存储资源池存放训练数据与模型文件等。 行业普遍采用「计算 - 存储分区部署」架构 —— 即 GPU 服务器集中部署于专属计算区、存储资源整合为公共存储池。 模型训练过程中需要不断对数据进行读写操作,例如 GPU 集群从存储池加载训练数据集、实时回传训练中间结果、保存训练过程中的 Checkpoint 文件等,因此在分区部署的架构下,计算和 AI 存储之间会产生高频次、大容量的跨区数据交互,跨区通信效率也因此成为决定 AI 训练任务整体性能的关键环节。
10/16/2025 1:35:00 AM
WXK&LSJ
连锁零售巨头克罗格构建能大规模稳健运行的负责任AI的实战经验
84.51˚(美国零售业领军者克罗格的数据科学部门)数据科学与AI高级副总裁Kristin . Foster正处于这一转型的核心位置。 Foster领导工作的核心在于,关注将原始数据转化为实际价值的基础设施建设。
10/16/2025 1:00:00 AM
Pritam
全面升级AI能力,OPPO引领业界的AIOS来了
不论是智慧生活还是影像能力,OPPO 新系统都带来了更加实用化的 AI。 在 10 月 15 日举行的 OPPO 开发者大会上,OPPO 正式发布了全新一代系统 ColorOS 16。 本次的升级不仅带了来全新流畅技术架构、流畅双引擎以及自研繁星编译器全面提升了流畅体验,也在 AI 能力方面有了很大提升。
10/15/2025 11:40:00 PM
李泽南
Litex:面向高效形式化验证的极简语言设计与实践
上海人工智能实验室和复旦大学的研究团队近日开源了 Litex——一门专为降低形式化推理门槛而设计的极简语言。 该项目致力于解决传统形式化语言(如 Lean、Coq)学习曲线陡峭的问题,使任何背景的开发者都能够在 1-2 小时内掌握基本的形式化证明编写能力,而非传统的 3-6 个月学习周期。 在过去的一年里,Litex 在开源社区引起了持续关注。
10/15/2025 7:19:00 PM
新闻助手
具身智能迎来ImageNet时刻:RoboChallenge开放首个大规模真机基准测试集
近日,RoboChallenge 重磅推出! 这是全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试。 通过科学的评估体系构建一个开放、公正、可复现的「真实考场」,克服真实环境下的性能验证、标准化测试条件、公开可访问测试平台等关键挑战,RoboChallenge 可为视觉-语言-动作模型(VLAs)在机器人的实际应用提供更加可靠和可比较的评估标准,推动具身智能从「实验室智能」走向「现实世界智能」。
10/15/2025 7:13:00 PM
机器之心
首个多轮LLM Router问世, Router-R1可让大模型学会「思考–路由–聚合」
Haozhen Zhang 现为南洋理工大学(NTU)博士一年级学生,本工作完成于其在伊利诺伊大学厄巴纳-香槟分校(UIUC)实习期间。 Tao Feng 为 UIUC 博士二年级学生,Jiaxuan You 为 UIUC 计算机系助理教授。 团队长期聚焦 LLM Router 方向,已产出 GraphRouter、FusionFactory 及本文 Router-R1 等多项代表性研究成果。
10/15/2025 7:04:00 PM
机器之心
Nscale 数据中心初创企业与微软达成 140 亿美元合作,谋求上市
近日,英国数据中心初创企业 Nscale 宣布与科技巨头微软达成一项高达140亿美元的合同。 这项交易标志着 Nscale 在推动其上市计划方面迈出了重要一步。 Nscale 成立于不久前,得到了英伟达的支持,专注于为企业提供高效的 AI 云计算服务。
10/15/2025 6:06:46 PM
AI在线
英国政府提出 AI 节省 450 亿英镑计划,但专家质疑其可行性
近日,英国政府计划通过人工智能(AI)在公共部门节省450亿英镑的提案引发了广泛关注。 然而,在国会科学、创新与技术委员会上,专家指出这一数字缺乏明确依据,并且基于粗略假设。 英国政府的资金主要用于员工薪资和基础设施建设,如何在这些领域实现如此巨额的节省,成为了质疑的焦点。
10/15/2025 6:06:44 PM
AI在线
百度蒸汽机再进化:AI长视频可边生成边改,发布互动数字人与开放世界
10月15日,视频生成模型百度蒸汽机(文心专精)再次升级,行业首次实现AI长视频实时交互生成。 该功能升级依托流式视频技术实现“无限时长”生成,突破传统AI视频生成10秒左右的时长限制,生成速度超越国内主流视频生成模型。 据悉,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理全部内容。
10/15/2025 5:12:36 PM
百度搜索文心助手全面升级创作能力 支持一键调用多工具解决多场景问题
10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作,且能够一键调用多工具解决多场景问题。 截至目前,百度搜索用户日均生成AIGC内容已破千万。 此外,百度搜索还发布行业首个开放式实时互动的数字人智能体,具备高逼真度、低延时、开放式实时互动与情感识别能力,为用户提供更专业的内容和服务。
10/15/2025 5:05:58 PM
Airtel 与 IBM 携手推进云计算和 AI 技术的创新
Airtel 近期宣布与 IBM 建立战略合作关系,旨在提升其新推出的 Airtel Cloud 服务。 此合作将结合 Airtel Cloud 在电信领域的高可靠性、安全性及数据驻留优势,和 IBM 在云解决方案、先进基础设施以及人工智能推理软件方面的专业技术。 根据 Airtel 的声明,双方将致力于帮助监管行业的企业更有效地扩展其 AI 工作负载,确保不同基础设施之间的互操作性,包括本地部署、云端以及边缘计算环境。
10/15/2025 4:56:30 PM
AI在线
巨人网络联手清华大学首创DiaMoE-TTS,开源多方言语音合成大模型框架
巨人网络AI Lab与清华大学电子工程系SATLab研究团队近日联合发布一项重大突破:首创多方言语音合成大模型框架DiaMoE-TTS,并宣布将数据、代码、方法全方位开源,旨在推动方言语音合成的公平与普惠。 在当前通用TTS(文本转语音)大模型能力惊人的时代,方言TTS(Dialect TTS)仍是业界难以触及的“灰色地带”。 现有的工业级方言模型过于依赖巨量的专有数据,导致方言从业者和研究者面临缺乏统一语料构建方法和端到端开源框架的困境。
10/15/2025 4:56:28 PM
AI在线
开源模型TOP5,被中国厂商包圆了
鱼羊 发自 凹非寺. 量子位 | 公众号 QbitAI开源大模型,进入中国时间。 10月,公开数据显示,来自中国的开源大模型已经牢牢占据榜单前五。
10/15/2025 4:37:33 PM
鱼羊
Robotaxi逐鹿香港上市,小马和文远同日公告了
杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto港交所门口,又加入了两位自动驾驶龙头。 Robotaxi中概股双雄——小马智行和文远知行,同日官宣了好消息:.
10/15/2025 4:36:18 PM
杰西卡
MIT发现金属制造中的隐藏秩序,机器学习揭开被忽视的非平衡化学结构
编辑丨&好像在大众的印象中,制造合金就是一场极端的「原子洗牌」。 高温、巨压、反复变形——这些过程被认为能把合金里的原子彻底搅匀。 几十年来,材料科学的共识是:只要加热到足够高、变形够剧烈,金属内部的化学秩序就会被完全抹去。
10/15/2025 4:05:00 PM
ScienceAI
报名|IROS 2025举杯时刻!与你Pick的圈内大神共饮一杯!
当具身智能开始自主决策,当机器人学会在复杂环境中“思考”,我们正站在一个新时代的门槛上。 2025 年 IEEE/RSJ 智能机器人与系统国际会议(IROS 2025)即将于下周在杭州启幕。 作为全球最具影响力的机器人顶会之一,IROS 每年汇聚全球顶尖学者,覆盖从理论研究到应用落地的全链条议题。
10/15/2025 4:02:00 PM
机器之心
Sutton判定「LLM是死胡同」后,新访谈揭示AI困境
在这个新访谈中,Sutton 与多位专家一起,进一步探讨 AI 研究领域存在的具体问题。 在大模型圈子里,强化学习之父、图灵奖得主 Rich Sutton 所著《苦涩的教训(The Bitter Lesson)》已经成为圣经一般的存在。 如果一个方法能够随着算力的增加而自然受益,大家就会觉得这个方法符合《苦涩的教训》所传达的精神,值得进一步研究。
10/15/2025 3:58:00 PM
机器之心