AI在线 AI在线

理论

GPT-5是口袋博士?诺奖得主哈萨比斯怒怼奥特曼:博士级AI纯属扯淡!

目前的博士级人工智能就是扯淡! 实属没想到,诺奖得主、谷歌DeepMind CEO哈萨比斯(Demis Hassabis)竟公然怒怼奥特曼。 在最近的访谈中,哈萨比斯公开表示,把如今的LLM称作「博士级智能」,纯属无稽之谈!
9/15/2025 9:13:00 AM

"顿悟"会传染,94%性能跃升:SAPO如何用“共享经验”重构小模型RL训练

大家好,我是肆〇柒。 我看到了一个很有趣的研究,它涉及经验共享,群体RL进化。 今天我们要探讨的,不是来自谷歌或OpenAI的最新成果,而是一家名为Gensyn AI的前沿研究团队提出的革命性想法。
9/15/2025 9:12:53 AM
肆零柒

干货!2025年AI Agent超100页全景报告:MCP、RAG、实战案例

知名AI、数据科学家Avi Chawla最近精心整合关于AI Agent的,117页PDF的全景技术报告。 这份报告的内容非常全面,无论是技术新手或老手都能深度了解关于智能体的相关内容。 在基础理论部分,清晰阐述基础概念,深入剖析大模型、RAG与智能体的区别和关系,帮助开发者构建扎实认知根基。
9/15/2025 9:12:40 AM

重磅!5年破解黎曼猜想,10年接管人类认知,AI超级增长曲线揭秘

「如果未来五年内看到 AI 解出黎曼猜想,我一点也不会太惊讶。 」近日,Epoch AI负责人Jaime Sevilla,与公司数据与分析负责人Yafah Edelman在一次播客节目中,为我们揭示了未来十年,AI的发展路线图。 Jaime Sevilla(左)与Yafah Edelman(右)对话谈到了以下问题:我们是否会持续每年5x的算力扩张节奏?
9/15/2025 9:11:00 AM

阿里巴巴Mobile-Agent-v3震撼发布!国产移动AI突破苹果谷歌封锁

你有没有想过,有一天国产AI会在移动端彻底"反杀"苹果和谷歌? 昨天看到阿里巴巴发布Mobile-Agent v3的消息时,我第一反应是,牛逼(破音~)。 说实话,国产AI在移动端的表现一直让人不太满意。
9/15/2025 9:10:18 AM
阿丸笔记

昔日王者TensorFlow,已死

噫吁嚱! 那个昔日叱咤风云的开源框架——TensorFlow,已然是行将就木了。 如此断言并非空穴来风,而是根据一份冷静的数据洞察所得出的结论。
9/15/2025 9:10:09 AM

马斯克深夜挥刀,Grok幕后员工1/3失业!谷歌AI靠人肉堆起,血汗工厂曝光

昨天,马斯克xAI内部曝出最大规模裁员。 标注团队中,500名通用标注员一夜被炒鱿鱼,Slack群聊人数(1500人)骤降至1000人。 与此同时,xAI将招募10倍「专业导师」团队。
9/15/2025 9:04:00 AM

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM

突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026

高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM

攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍

强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM

谷歌DeepMind用AI探测引力波,登上Science了

探测宇宙深处的时空涟漪引力波,AI也派上用场了。 谷歌DeepMind、LIGO(激光干涉仪引力波探测器)团队和GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术,将引力波探测的低频降噪能力拉到了新高度。 该研究现已登上Science。
9/15/2025 8:40:00 AM

人格陷阱:AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐

Qwen-Image:AI 设计师新搭档,文字排版不再是难题

在生成式 AI 日益成熟的今天,图像生成/编辑能力的发展越来越受到人们的期待。 而在所有能力中,“文字渲染”(尤其是中文/中英混排/长段落/复杂布局字体等)的精度,一直是个难点。 今天,我们要介绍的是通义千问系列中的最新图像基础模型 —— Qwen-Image,它在文字渲染与图像编辑方面取得了显著突破,是内容创作者、设计师和视觉工作者的有力助手。
9/15/2025 5:00:00 AM
AI大模型应用开发

推理的深度边界:神经网络如何在有限参数下实现多步推理?

大家好,我是肆〇柒。 今天要和大家分享的这项突破性研究来自MBZUAI(穆罕默德·本·扎耶德人工智能大学)、莫斯科物理技术学院神经网络与深度学习实验室、莫斯科人工智能研究院以及伦敦数学科学研究所的联合团队。 这项研究通过精心设计的1dCA基准,首次清晰地区分了模型的规则抽象能力和多步状态传播能力,为我们理解神经网络的"思考"机制提供了新视角。
9/15/2025 4:00:00 AM
肆零柒

Qwen3-Next 发布:通义千问的训练&推理效率革命

近日,阿里巴巴旗下的通义千问(Qwen)团队发布了全新模型 Qwen3-Next,在保持性能的同时大幅提升训练与推理效率,引起了 AI 界广泛关注。 下面带大家深入了解一下 Qwen3-Next 的亮点、技术突破,以及它对未来应用的意义。 什么是 Qwen3-NextQwen3-Next 是 Qwen 系列的最新成员,基于 Qwen3 架构进行改进与优化。
9/15/2025 3:00:00 AM
AI大模型应用开发

AI 正在让初级开发人员消失

——两年招人带人后的冷水与警钟你不会在技术大会上听到这一幕,更不会在 LinkedIn 的“AI 赋能人类创造力”帖里读到它。 可在招募与培养工程师十余年、近两年持续招聘与导师制实践之后,几乎笃定:传统意义上的“初级开发者”岗位,正被系统性地撤掉。 这并不意味着编程工作会在一夜之间蒸发。
9/15/2025 2:22:00 AM
dev

微软加码自研大模型:不把鸡蛋放在OpenAI一个篮子里

近日,微软(MSFT.US)宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施,加码自研 AI 模型开发。 这一动作引发行业广泛关注,毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。 为何微软选择在与 OpenAI 保持合作的同时,大力推进自研大模型?
9/15/2025 1:00:00 AM
小菲

Claude记忆系统逆向研究!与ChatGPT完全相反!网友:放弃广告了?Claude深夜祭出记忆选项,隐身聊天,按项目单独记忆

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上一篇文章中,小编分享了一位狠人逆向研究了 OpenAI 的 ChatGPT 底层记忆机制。 它的记忆系统主要分为四个板块:交互元数据、最近会话内容、模型设定上下文、用户知识记忆。 正是基于这样的设计,才会让 ChatGPT 充满了十足的留人能力。
9/14/2025 11:57:57 AM
云昭