理论
无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」
本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。 在机器人学习领域,提升基于生成式模型的控制策略(Policy)的性能通常意味着投入巨额成本进行额外的数据采集和模型训练,这极大地限制了机器人能力的快速迭代与升级。
10/20/2025 9:07:00 AM
长上下文窗口、Agent崛起,RAG已死?
在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。 「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。 向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死,上下文工程当立」的表述,主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。
10/20/2025 9:06:00 AM
Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law
在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。 但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale? scale 什么是有价值的?
10/20/2025 9:05:00 AM
教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题
多模态大模型表现越来越惊艳,但人们也时常困于它的“耿直”。 无论是生成代码、分析图表还是回答问题,诸多多模态大模型(MLLM)都倾向于给出一个“一步到位”的答案。 它们就像一个从不检查作业的“学霸”,虽然知识渊博,但一旦在复杂的、需要反复试错的问题上走错一步,就很难回头。
10/20/2025 9:02:00 AM
让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准
多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对AI自动化前端开发充满期待。 然而,一个网页的真正价值远不止于其静态布局。 用户的点击、筛选、表单提交,乃至游戏中的每一步操作,都构成了其核心的交互功能。
10/20/2025 9:01:00 AM
企业云+AI融合的未来图景与应对策略
作者 | 孙杰审校 | 重楼引言:AI浪潮驱动云战略转型随着人工智能技术的迅猛发展,尤其是大模型应用的广泛落地,企业对云计算的需求已从基础设施的“资源上云”逐步转向业务与智能不断融合的“深度用云”。 据Canalys统计,2024年中国云服务总支出达400亿美元,同比增长13%,而DeepSeek于2025年初推出的高性能低成本大模型DeepSeek R1,更是进一步点燃了市场对“云 AI”融合的热情。 调研显示,已有33%的中国企业认识到,云与AI的深度融合能够推动产品与服务创新。
10/20/2025 9:00:00 AM
孙杰
马斯克发起编程人机大战!卡帕西说了不
拒绝世界首富是什么体验? 卡帕西:这事我熟! 刚刚,马斯克高调邀请卡帕西,与Grok 5来一场编程对决——就像当年的“卡斯帕罗夫大战深蓝”。
10/20/2025 9:00:00 AM
薛定谔亲外孙创业量子计算,老黄早早就成了股东
什么样的量子计算创业公司,一次能获得10亿美元的巨额融资? 而且就连年初还在给量子计算泼冷水的英伟达创始人黄仁勋,转头就成为了这家公司投资股东。 或许是因为这家公司的BP里,有一页是《我的爷爷薛定谔》(doge)。
10/20/2025 8:59:00 AM
训练成本暴降99%,35秒出1分钟高清视频!英伟达MIT等引爆视频AI革命
27帧每秒的实时视频生成、35秒合成1分钟高清视频——这不是遥远的未来,而是刚刚由英伟达联合MIT与港大团队带来的现实。 全新一代视频扩散模型SANA-Video横空出世,凭借革命性的线性DiT架构与恒定显存KV缓存机制,不仅速度超越所有同类模型,更以高达720p的分辨率与分钟级时长生成,重新定义了AI视频生成的效率极限。 SANA-Video不仅在速度和性能上表现出色,生成的图像质量也非常高。
10/20/2025 8:58:00 AM
数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始
科学研究,尤其是数学研究,真的要被AI彻底改变了。 两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。 埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。
10/20/2025 8:57:00 AM
为何99%的企业AI集成尝试遭遇失败,又该如何成为那1%?
企业要确保面向未来,就不能仅仅把AI应用局限在聊天机器人或者部分任务自动化,更要让AI成为整个组织的基础技能。 据麦肯锡调查,仅有1%的企业领导者表示真正实现了AI成熟,并将这项新技术完全融入工作流程。 Gartner也做出预测,称到2027年底超40%的代理式AI项目将被取消。
10/20/2025 8:00:00 AM
核子可乐
自主式AI对SaaS及合作伙伴生态系统的影响
作为一名架构师,我深切体会到,在过去十年里,企业支持应用程序和数据生态系统间互操作性的能力,已成为实现差异化竞争和快速上市的关键主题。 行业渠道合作伙伴和SaaS原始设备制造商早已认识到这一点,并构建了跨其他合作伙伴网络和渠道的生态系统。 API的早期实现基于这样一种理念:将专有软件“黑盒”之外的功能和数据接口开放,以实现与其他异构系统的集成。
10/20/2025 7:00:00 AM
Dion
GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧
10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
10/20/2025 2:00:00 AM
Andrej Karpathy 最新访谈:强化学习是糟糕的,只是其他一切都更糟
最近,前特斯拉AI负责人、OpenAI早期成员 Andrej Karpathy 在接受播客节目 Dwarkesh Patel Show 采访时,系统反思了当下AI研究的方向。 原文地址:,“强化学习是糟糕的,只是其他一切都更糟。 ”Karpathy解释,强化学习的问题不在算法的复杂性,而在信息的稀缺性。
10/20/2025 1:00:00 AM
AI赋能的主动防御是如何从概念走向真实落地的?
AI赋能的主动防御无疑是未来企业网络安全的应对趋势,但对于大多数企业而言,AI赋能安全听起来不知从何下手。 是否需要一下子投入大量资金购买昂贵的AI平台? 还是可以从现有的安全工具开始升级?
10/20/2025 12:00:00 AM
礼貌=更不准?宾夕法尼大学新论文:对 AI 粗鲁点,提升 4% 准确率
据2025年9月发表于arXiv的论文《Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy》。 图片论文地址:arxiv.org/abs/2510.04950宾夕法尼亚州立大学的两位研究者提出了一个出人意料的发现:越有礼貌的提问,ChatGPT 的回答越不准确。 实验结果显示,当用户以“非常礼貌”的语气提问时,ChatGPT-4o 的平均准确率仅为 80.8%。
10/20/2025 12:00:00 AM
Andrej Karpathy 开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
AI 会给世界带来每年 2% 的 GDP 增量,不过不是以你想的那样。 「总的来说,这种模型并不存在。 我觉得这个行业…… 它的步子迈得太大了,而且还试图假装这很了不起…… 但事实并非如此 —— 这只是垃圾!
10/18/2025 9:49:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
AI模型
特斯拉
场景
深度学习
亚马逊
架构
Transformer
MCP
Copilot
编程
视觉