资讯列表
用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA
如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。 在实际应用中,具有长时间跨度和稀疏奖励特征的任务非常常见,而强化学习方法在这类任务中的表现仍难令人满意。 传统强化学习方法在此类任务中的探索能力常常不足,因为只有在执行一系列较长的动作序列后才能获得奖励,这导致合理时间内找到有效策略变得极其困难。
7/14/2025 1:47:29 PM
蔚来李斌:祝理想i8大卖,只要选纯电就是队友
订单又爆了? 这是蔚来乐道L90开启预售后,外界最关注的话题。 李斌这次依然没有透露具体订单量,只表示“早上起来订单增长很快”,“达到预期”。
7/14/2025 1:45:09 PM
一凡
Windsurf交易内幕疯传:24亿美元被瓜分,背刺数百员工?
这个周末,大家都在看 OpenAI 的热闹。 起因是谷歌 DeepMind 截胡了 OpenAI 原本打算收购 Windsurf 的计划。 此前 OpenAI 就以 30 亿美元收购这家初创公司一事展开了长达数月的谈判,没想到,还是被 DeepMind 抢先了。
7/14/2025 1:25:00 PM
机器之心
ACL 2025|自我怀疑还是自我纠正?清华团队揭示LLMs反思技术的暗面
本文第一作者是张清杰,清华大学博士生,研究方向是大语言模型异常行为和可解释性;本文通讯作者是清华大学邱寒副教授;其他合作者来自南洋理工大学和蚂蚁集团。 反思技术因其简单性和有效性受到了广泛的研究和应用,具体表现为在大语言模型遇到障碍或困难时,提示其“再想一下”,可以显著提升性能 [1]。 然而,2024 年谷歌 DeepMind 的研究人员在一项研究中指出,大模型其实分不清对与错,如果不是仅仅提示模型反思那些它回答错误的问题,这样的提示策略反而可能让模型更倾向于把回答正确的答案改错 [2]。
7/14/2025 1:19:00 PM
机器之心
天塌了!Cursor和Windsurf用户零日漏洞曝光,一键劫持,数百万开发者开源插件噩梦,网友:零信任太重要了
编译 | 沈建苗审校 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)近日,一位来自 Koi Security 的安全研究员,偶然发现了一个深藏于当今 AI 编程工具基础架构中的严重零日漏洞。 如果该漏洞被利用,一个技术水平不高的攻击者就可能“一键”劫持超过一千万台设备。 Cursor 和 Windsurf 等 AI 编程助手日益流行,向全球开发者承诺“生产力加速”。
7/14/2025 12:24:07 PM
沈建苗
亚马逊 AWS 展示 Project Rainier 分布式集群,有望成为最强 AI 模型训练计算机
AI在线 7 月 14 日消息,亚马逊 AWS 在发布于 6 月 24 日的一篇文章中介绍了其大型分布式集群 Project Rainier,该项目有望成为世界上最强大的 AI 模型训练计算机。 Project Rainier 分布在美国境内的多个不同数据中心中,基于 AWS 旗下 Annapurna Labs 芯片部门开发的 AI 芯片 Trainium2:每个服务器配备 16 颗 Trainium2,每 4 个服务器合为一个 UltraServer,数以万计的 UltraServer 互联构成 Project Rainier 这一 UltraCluster 超级集群。 在互联方面,蓝色电缆的 NeuronLinks 负责 Tn2 UltraServer 内部高速互联,而单一数据中心内部和跨数据中心互联则交由黄色电缆的 Elastic Fabric Adapter (EFA) 技术负责。
7/14/2025 11:40:51 AM
溯波(实习)
OpenAI 推迟开源大模型发布,重视安全测试
OpenAI 近日在官网上宣布,原定于本周发布的开源大模型将推迟。 OpenAI 的联合创始人兼首席执行官 Sam Altman 在公告中表示,推迟的主要原因是需要更多的时间进行安全测试。 尽管 OpenAI 计划在下周推出这一模型,但为了确保其安全性与可靠性,团队决定将发布时间推迟。
7/14/2025 11:40:47 AM
AI在线
SpaceX 大手笔投资!将向xAI注入20亿美元资金
近日,根据《华尔街日报》的报道,埃隆・马斯克旗下的太空探索技术公司 SpaceX 计划向他的人工智能初创公司 xAI 投资高达20亿美元。 这一投资将成为 SpaceX 首次对 xAI 的直接投资,并且也是该公司在其他企业中的一次重大资金注入。 据了解,这笔投资将成为 Morgan Stanley 在六月底宣布的50亿美元股权融资的一部分,此外还计划进行50亿美元的债务融资。
7/14/2025 11:40:47 AM
AI在线
高盛引入AI新员工德文,开启智能金融时代
在金融科技不断发展的今天,高盛(Goldman Sachs)宣布将引入 Cognition 公司研发的 AI 编码助手 “德文”(Devin),作为其新的 “员工”。 高盛首席信息官马尔科・阿根提(Marco Argenti)在接受 CNBC 采访时表示,德文将用于增强公司的开发团队,预计将推出数百个德文实例,未来可能会增加到数千个。 这一举措标志着高盛在科技创新方面的又一步突破。
7/14/2025 11:40:47 AM
AI在线
ICCV 2025满分论文:一个模型实现空间理解与主动探索大统一
本论文核心团队来自北京通用人工智能研究院机器学习实验室,团队负责人李庆博士长期从事多模态理解、多模态智能体、具身智能等方向,主页:,人工智能正逐步从虚拟的互联网空间(Cyber Space)迈向真实的物理世界(Physical Space)[1]。 这一转变的核心挑战之一,是如何赋予智能体对三维空间的理解能力 [2],实现自然语言与真实物理环境的对齐(grounding)。 尽管已有的 3D 空间理解模型在视觉感知和语言对齐方面取得了显著进展,但它们普遍依赖于静态的世界的观察,缺乏对主动探索行为的建模。
7/14/2025 11:18:00 AM
机器之心
英伟达&MIT等推出Long-RL,长视频训练速度翻倍
请想象……一个 AI—— 它要完整看完一场几十分钟的世界杯决赛,不只是数球门数,更要跨越上百个镜头的线索、情绪、战术细节,甚至要像人一样推断:谁会赢点球大战? 足球比赛预测分析预测《星际争霸 2》这样的即时战略游戏同样需要考虑许多不同的变量,难度也非常巨大。 星际争霸 2 比赛预测分析再换个场景:同样是 AI,在一场紧张的德州扑克超级豪客赛上,面对职业牌手的每一次下注、加注、弃牌,能否像一个顶尖牌手一样,推理出对手藏在手里的那两张底牌?
7/14/2025 11:09:00 AM
机器之心
曝安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能
AI在线 7 月 14 日消息,科技媒体 9To5Google 上周(当地时间 7 月 11 日)发文,曝光了安卓版谷歌 Gemini AI 助手正在灰度测试“聊天历史记录搜索”功能,可更加便捷地找到用户需要的聊天历史记录。 ▲ 灰度测试用户截图,下同据该媒体所述,部分用户在打开安卓版 Gemini App 后,再点击汉堡菜单(AI在线注:抽屉菜单)按钮时,顶部出现了“搜索聊天记录(Search for chats)”的搜索按钮。 在点击后可以看到一个全屏覆盖的搜索菜单,界面较为简洁,使用逻辑上与 ChatGPT 等 AI 助手的搜索功能无异。
7/14/2025 11:00:50 AM
潞源(实习)
甲骨文FY26战略解析:融合数据库与AI如何重塑企业未来?
近日,甲骨文公司 FY26 中国媒体沟通会在北京召开。 不久前,甲骨文披露了FY25财报数据:预计整体云业务增长率(包括云应用和云基础设施)将从2025财年的24%提升至2026 财年的40% 以上。 此外,OCI 的增长率也将从2025财年的 50% 提升至 2026 财年的 70% 以上。
7/14/2025 10:37:06 AM
OpenAI的o3在新的「解答科学问题AI排行榜」上排名第一,DeepSeek的R1排名第二
编辑 | 白菜叶根据近期推出的基准测试平台,o3 是由 ChatGPT 的创建者开发的人工智能 (AI) 模型,被评为回答多个领域科学问题的最佳 AI 工具。 由华盛顿州西雅图艾伦人工智能研究所 (Ai2) 开发的 SciArena,根据 23 个大型语言模型 (LLM) 对科学问题的回答进行了排名。 102 位研究人员对答案的质量进行了投票。
7/14/2025 10:17:00 AM
ScienceAI
Meta收购AI语音初创公司Play AI,强势布局智能语音领域!
近日,Meta 公司宣布收购了初创企业 Play AI,这是一家专注于利用人工智能生成自然人声的公司。 根据彭博社的报道,Meta 的一位发言人已确认这一收购消息,并表示 Play AI 的 “整个团队将在下周加入 Meta”。 这一举动标志着 Meta 在 AI 领域的又一次重要布局,尤其是在语音技术方面的持续投资。
7/14/2025 10:12:23 AM
AI在线
ChatGPT助力揭发 500 万美元遗产欺诈案,网友成功翻盘
在一起复杂的遗产纠纷中,一位名叫 Rejeana Leatherwood 的女子利用 ChatGPT 揭露了一桩长达十年的遗产欺诈案。 她的父亲于2015年在墨西哥去世,留下了价值约500万美元的遗产,但这笔遗产的合法性却被他父亲的异国女友 Irma 质疑。 Irma 声称自己是父亲的合法妻子,并迅速采取行动,将遗产占为己有。
7/14/2025 10:12:19 AM
AI在线
研究警告使用人工智能治疗聊天机器人存在“重大风险”
随着人工智能技术的发展,越来越多的聊天机器人开始被应用于心理治疗领域。 然而,斯坦福大学的最新研究警告我们,依赖这些由大型语言模型驱动的 AI 疗法聊天机器人,可能会给用户带来 “显著风险”。 这项名为《表达污名与不当反应阻碍大型语言模型安全替代心理健康提供者》的研究,将在即将召开的 ACM 公平性、问责制与透明度会议上发表。
7/14/2025 10:12:19 AM
AI在线
实时视频生成新突破:Meta StreamDiT 仅需单 GPU,逐帧生成高质量视频
Meta 和加州大学伯克利分校的研究人员共同开发了 StreamDiT,这是一款革命性的 AI 模型,能够以每秒16帧的速度实时创建512p 分辨率的视频,并且仅需单个高端 GPU。 与以往需要完整生成视频片段才能播放的方法不同,StreamDiT 实现了逐帧实时视频流生成。 StreamDiT 模型拥有 40亿个参数,展现了令人印象深刻的多功能性。
7/14/2025 10:12:19 AM
AI在线