AI在线 AI在线

资讯列表

UC伯克利大牛预警:留给人类能干的活,只剩5年了!

折衣、做饭、拖地,五年后可能都不用你亲自动手! UC伯克利教授、机器人顶级专家Sergey Levine预言:2030年前,机器人就能像家政阿姨一样,独立打理整个家庭。 这不是炫技演示,而是「自我进化飞轮」即将启动的信号。
10/11/2025 3:55:08 PM

陶哲轩用GPT5-Pro跨界挑战!3年无解的难题,11分钟出完整证明

陶哲轩与GPT-5 Pro这对搭档再大发神威,解决了一个3年无人解决的难题。 而且是“不太在自己专业范围内”的问题:微分几何领域的开放问题。 要知道,陶哲轩擅长的分析、数论、组合学等研究的往往是整数、函数、算子的性质。
10/11/2025 3:44:23 PM

77岁「AI教父」Hinton:AI早有意识!我们打造的智能,可能终结人类文明

当大家热议AI算力与应用之时,「AI教父」Hinton猛地扯回「何为人」的原点。 几十年来,Hinton像一位耐心的炼金术士,致力于将模仿大脑运作的理论,锻造成驱动现代AI的强大引擎。 然而,这位创造者如今却站在了自己创造物的阴影之下,发出了沉重的警告。
10/11/2025 3:38:01 PM

Anthropic 最新研究:仅需250份恶意文档,大模型即可被攻陷,无关参数规模

2025年10月8日,英国AI安全研究院、Anthropic、艾伦·图灵研究所与牛津大学OATML实验室等机构联合发布的一项研究,打破了业界关于“大模型越大越安全”的核心假设。 这项研究题为《Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples》,论文发表于arXiv。 研究团队发现,只需约250个恶意文档,就足以在任意规模的大语言模型(LLM)中植入可触发的后门(Backdoor)。
10/11/2025 3:18:35 PM

医学文献也有「AI专职助手」:LEADS帮研究者节省近三成时间,比通用大模型更懂医学综述

编辑丨%AI 正越来越广泛的应用在各类科研工作里,它对数据的处理能力在加强循证医学方面具有巨大潜力,但由于训练和评估不足而受到限制。 考虑到这种情况,美国 KeiJi AI 牵头了一项研究,提出了 LEADS,这是一种 AI 基础模型,该模型在 633,759 个样本上进行了训练,并于测试中达到了 0.81 的召回率与 0.85 的数据提取准确率。 相关研究内容以「A foundation model for human-AI collaboration in medical literature mining」为题,于 2025 年 9 月 24 日发布在《Nature Communications》。
10/11/2025 2:35:00 PM
ScienceAI

找出iPhone漏洞,库克给你200万美元

时令 发自 凹非寺. 量子位 | 公众号 QbitAI挖出一个普通漏洞,最高奖励200万美元(1420万人民币)。 挖到一个特殊漏洞,奖金更是高达500万美元(3560万人民币)。
10/11/2025 2:32:50 PM
时令

斯坦福新论文:微调已死,自主上下文当立

时令 发自 凹非寺. 量子位 | 公众号 QbitAI是时候为传统微调献上挽歌了。 一项全新研究,刚刚又给微调致命一击。
10/11/2025 2:12:42 PM
时令

熬死5家初创公司老鸟揭露业内残酷真相:70%的Agent产品系OpenAI套壳,没有上下文和工具,智能体就是笨蛋!无限记忆是陷阱

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto). 先坦白一件事:AI Agent 不是魔法。 它们脆弱、多变,更像是喝了咖啡的实习生,而不是能独立完成任务的员工。
10/11/2025 2:04:09 PM
云昭

Vision-Zero:零数据VLM自我进化!陈怡然团队提出零监督训练新范式

本文作者包括来自杜克大学的汪勤思、林阅千、李海教授、陈怡然教授,新加坡国立大学的刘博,马里兰大学的周天翼教授,和 Adobe 的研究员施靖、万锟、赵文天。 开源代码&模型:::,但训练过度依赖人工标注的数据与精心设计的强化学习奖励。 这种依赖带来数据稀缺问题:多模态标注成本高昂,限制了训练数据的规模与多样性。
10/11/2025 1:51:21 PM

首家AIOS落地来自vivo:个人化智能复刻人类思维,手机还能这样用

真正实用化的生成式 AI,应该是这个样子 ——作为助手可以帮你代打电话,根据你的选项进行应答,还能引导对方转人工:功能覆盖多个场景,连接大量第三方应用,实现多智能体的一键协同:拍照时可以 AI 修图消除路人,live photo 也可以:昨天刚刚结束的 2025 年 vivo 开发者大会上,我们看到了 vivo 展示的全新端侧 AI 能力。 这一次,AI 手机终于不再是个概念,而是成为了我们生活工作的理想助手。 One Model 领衔  模型矩阵重塑手机 AI 体验为什么要说这一次不一样?
10/11/2025 1:20:00 PM
机器之心

陶哲轩:用了GPT-5 Pro后,小尺度、宏观尺度很赞,中尺度有点垮

说起对 AI 的使用,著名数学家陶哲轩可谓是最具代表性的一位。 这位菲尔兹奖得主,不仅在数学领域不断拓展边界,如今也积极尝试与 AI 协作,探索人工智能在数学研究中的真正潜力。 他最近使用 ChatGPT-5 Pro 挑战一个自己并不熟悉的开放问题,曲率有界的球面(Sphere with bounded curvature),并在过程中详细记录了 AI 在不同层面上带来的帮助与局限。
10/11/2025 1:16:00 PM
机器之心

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

过去一年,OpenAI在算力上斥资70亿美元。 其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。 图片可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。
10/11/2025 10:34:49 AM
新智元

蚂蚁新发万亿开源旗舰大模型,究竟有多强?

国产大模型最近真是百花齐放啊,卷到家了。 这不,蚂蚁最近也发布了他的万亿级开源大模型 Ling 1T,把大模型的数量级又拉升到了新的高度。 那这个大模型到底好不好用呢?
10/11/2025 10:04:00 AM
磊哥

别再给大模型打鸡血,先救救被“智能体”三个字忽悠的预算

“兄弟,我们老板昨天看完路演,拍桌子要上Agent,说三个月让客服成本归零。 ”“归零? 他以为Agent是灭霸,打个响指预算就蒸发?
10/11/2025 9:40:11 AM
大数据AI智能圈

AI 智能体写代码靠谱吗?GitHub 上 567 个 PR 的实证告诉你真相

大家好,我是肆〇柒。 近期 AI 编程工具如 Claude Code 越来越火,但很多人心里打鼓:AI 自动生成的代码真能被开源项目接受吗? 会不会全是“花架子”?
10/11/2025 9:35:05 AM
肆零柒

李飞飞发起机器人家务挑战赛!老黄第一时间批钱赞助

李飞飞要用ImageNet的方式,推动具身智能了。 依然是一个“挑战赛”。 就在最近,由李飞飞团队发起、英伟达赞助(其中之一)的首届BEHAVIOR家务挑战赛正式启动。
10/11/2025 9:35:00 AM
一水

RLPT:用强化学习“重读”预训练数据,让大模型学会思考

大家好,我是肆〇柒。 今天要和大家分享的是一项来自腾讯大模型部门(LLM Department, Tencent) 与香港中文大学合作的前沿研究——RLPT(Reinforcement Learning on Pre-Training Data)。 面对高质量数据增长见顶、计算资源持续膨胀的矛盾,这项工作提出了一种全新的训练范式:让大模型在原始预训练数据上通过强化学习自主探索推理路径,从而突破传统监督学习的泛化瓶颈。
10/11/2025 9:23:28 AM
肆零柒

破解MoE模型“规模越大,效率越低”困境!中科院自动化所提出新框架

大模型参数量飙升至千亿、万亿级,却陷入“规模越大,效率越低” 困境? 中科院自动化所新研究给出破局方案——首次让MoE专家告别“静态孤立”,开启动态“组队学习”。 具体而言,MoE本是大语言模型(LLM)实现参数量扩张且计算成本仅呈线性增长的核心路径,却长期受困于负载失衡、参数冗余、通信开销的“三难困境”,成为大模型落地部署的主要瓶颈。
10/11/2025 9:20:13 AM
量子位