AI在线 AI在线

AI

无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」

无需再训练即可增强性能!港大团队提出GPC框架,实现机器人「策略组合」

本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。 在机器人学习领域,提升基于生成式模型的控制策略(Policy)的性能通常意味着投入巨额成本进行额外的数据采集和模型训练,这极大地限制了机器人能力的快速迭代与升级。
10/20/2025 9:07:00 AM
长上下文窗口、Agent崛起,RAG已死?

长上下文窗口、Agent崛起,RAG已死?

在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。 「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。 向量数据库 Chroma 创始人兼 CEO Jeff Huber 在播客与访谈中抛出「RAG 已死,上下文工程当立」的表述,主张以上下文工程框架取代对「RAG」这一术语的狭义依赖。
10/20/2025 9:06:00 AM
教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题

教多模态大模型学会“反思”和“复盘”,上交&上海AI Lab重磅发布MM-HELIX&AHPO,破解多模态复杂推理难题

多模态大模型表现越来越惊艳,但人们也时常困于它的“耿直”。 无论是生成代码、分析图表还是回答问题,诸多多模态大模型(MLLM)都倾向于给出一个“一步到位”的答案。 它们就像一个从不检查作业的“学霸”,虽然知识渊博,但一旦在复杂的、需要反复试错的问题上走错一步,就很难回头。
10/20/2025 9:02:00 AM
让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准

让模型“看视频写网页”,GPT-5仅得36.35分!上海AI Lab联合发布首个video2code基准

多模态大模型在根据静态截图生成网页代码(Image-to-Code)方面已展现出不俗能力,这让许多人对AI自动化前端开发充满期待。 然而,一个网页的真正价值远不止于其静态布局。 用户的点击、筛选、表单提交,乃至游戏中的每一步操作,都构成了其核心的交互功能。
10/20/2025 9:01:00 AM
企业云+AI融合的未来图景与应对策略

企业云+AI融合的未来图景与应对策略

作者 | 孙杰审校 | 重楼引言:AI浪潮驱动云战略转型随着人工智能技术的迅猛发展,尤其是大模型应用的广泛落地,企业对云计算的需求已从基础设施的“资源上云”逐步转向业务与智能不断融合的“深度用云”。 据Canalys统计,2024年中国云服务总支出达400亿美元,同比增长13%,而DeepSeek于2025年初推出的高性能低成本大模型DeepSeek R1,更是进一步点燃了市场对“云 AI”融合的热情。 调研显示,已有33%的中国企业认识到,云与AI的深度融合能够推动产品与服务创新。
10/20/2025 9:00:00 AM 孙杰
马斯克发起编程人机大战!卡帕西说了不

马斯克发起编程人机大战!卡帕西说了不

拒绝世界首富是什么体验? 卡帕西:这事我熟! 刚刚,马斯克高调邀请卡帕西,与Grok 5来一场编程对决——就像当年的“卡斯帕罗夫大战深蓝”。
10/20/2025 9:00:00 AM
薛定谔亲外孙创业量子计算,老黄早早就成了股东

薛定谔亲外孙创业量子计算,老黄早早就成了股东

什么样的量子计算创业公司,一次能获得10亿美元的巨额融资? 而且就连年初还在给量子计算泼冷水的英伟达创始人黄仁勋,转头就成为了这家公司投资股东。 或许是因为这家公司的BP里,有一页是《我的爷爷薛定谔》(doge)。
10/20/2025 8:59:00 AM
训练成本暴降99%,35秒出1分钟高清视频!英伟达MIT等引爆视频AI革命

训练成本暴降99%,35秒出1分钟高清视频!英伟达MIT等引爆视频AI革命

27帧每秒的实时视频生成、35秒合成1分钟高清视频——这不是遥远的未来,而是刚刚由英伟达联合MIT与港大团队带来的现实。 全新一代视频扩散模型SANA-Video横空出世,凭借革命性的线性DiT架构与恒定显存KV缓存机制,不仅速度超越所有同类模型,更以高达720p的分辨率与分钟级时长生成,重新定义了AI视频生成的效率极限。 SANA-Video不仅在速度和性能上表现出色,生成的图像质量也非常高。
10/20/2025 8:58:00 AM
数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始

数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始

科学研究,尤其是数学研究,真的要被AI彻底改变了。 两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。 埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。
10/20/2025 8:57:00 AM
AI芯片战争关键一役!英伟达最强Blackwell首次「美国造」

AI芯片战争关键一役!英伟达最强Blackwell首次「美国造」

全球科技竞争,集中在AI。 AI背后是芯片。 芯片的背后则是工厂。
10/20/2025 2:11:00 AM 新智元
GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧

GPT-5 数学神话“塌房”:文献检索被当成原创突破。LeCun冷笑:被自家 GPT 傻子坑了吧

10月17日的晚上,AI世界一片喧嚣。 OpenAI研究员、前斯坦福数学家Mark Sellke发推,宣布GPT-5“找到了十个此前未解的Erdős问题的解”。 他列出十个编号,像在展示一场数学奇迹的战利品。
10/20/2025 2:00:00 AM
Andrej Karpathy 最新访谈:强化学习是糟糕的,只是其他一切都更糟

Andrej Karpathy 最新访谈:强化学习是糟糕的,只是其他一切都更糟

最近,前特斯拉AI负责人、OpenAI早期成员 Andrej Karpathy 在接受播客节目 Dwarkesh Patel Show 采访时,系统反思了当下AI研究的方向。 原文地址:,“强化学习是糟糕的,只是其他一切都更糟。 ”Karpathy解释,强化学习的问题不在算法的复杂性,而在信息的稀缺性。
10/20/2025 1:00:00 AM
AI赋能的主动防御是如何从概念走向真实落地的?

AI赋能的主动防御是如何从概念走向真实落地的?

AI赋能的主动防御无疑是未来企业网络安全的应对趋势,但对于大多数企业而言,AI赋能安全听起来不知从何下手。 是否需要一下子投入大量资金购买昂贵的AI平台? 还是可以从现有的安全工具开始升级?
10/20/2025 12:00:00 AM
礼貌=更不准?宾夕法尼大学新论文:对 AI 粗鲁点,提升 4% 准确率

礼貌=更不准?宾夕法尼大学新论文:对 AI 粗鲁点,提升 4% 准确率

据2025年9月发表于arXiv的论文《Mind Your Tone: Investigating How Prompt Politeness Affects LLM Accuracy》。 图片论文地址:arxiv.org/abs/2510.04950宾夕法尼亚州立大学的两位研究者提出了一个出人意料的发现:越有礼貌的提问,ChatGPT 的回答越不准确。 实验结果显示,当用户以“非常礼貌”的语气提问时,ChatGPT-4o 的平均准确率仅为 80.8%。
10/20/2025 12:00:00 AM
AI爆发不会带来GDP爆涨!AI大神罕见暴论:强化学习糟透了!互联网数据很烂!曝未来新训练范式:反思型监督、预训练是一场劣质进化

AI爆发不会带来GDP爆涨!AI大神罕见暴论:强化学习糟透了!互联网数据很烂!曝未来新训练范式:反思型监督、预训练是一场劣质进化

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)“现在的互联网训练数据烂到离谱! ”“强化学习远比人们想象要糟糕得多! ”“AGI 仍然还有十年之遥!
10/18/2025 8:43:14 PM 云昭
推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作

推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作

近两年,思维链(Chain-of-Thought, CoT)推理让大语言模型在复杂推理任务上展现出前所未有的能力——从数学解题到逻辑分析,表现令人惊叹。 然而,这种强大的推理能力也带来了一个长期存在的挑战:推理过程过于缓慢。 每生成一个 token,模型都要完整算一遍前向传播。
10/17/2025 5:50:01 PM
GPT-5 Pro惊现「神之一手」,30分钟攻克黑洞难题!

GPT-5 Pro惊现「神之一手」,30分钟攻克黑洞难题!

OpenAI真的要放大招了! 今天,黑洞理论物理学家Alex Lupsasca官宣入职,正式成为OpenAI新成立的「科学团队」的一员。 曾经,Alex一直认为AI离科研前沿遥不可及,直到他亲眼见证了GPT-5 Pro的惊人能力——它在短短30分钟内,竟破解了困扰Alex数日的「黑洞微扰」理论难题!
10/17/2025 5:49:11 PM
AI圈正陷入命名地狱!Claude Skills上线,却遭开发者集体吐槽:LLM生态要爆炸了!

AI圈正陷入命名地狱!Claude Skills上线,却遭开发者集体吐槽:LLM生态要爆炸了!

编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)还记得当年大家调侃 ChatGPT:“它什么都会,就是不会干正事。 ”现在,Anthropic 把 Claude 往前推了一大步——它不仅能「干活」,还开始「学技能」。 今天,Anthropic 发布全新功能 Claude Skills,让 Claude 能调用特定“技能”完成专业任务。
10/17/2025 4:17:43 PM 听雨