AI在线 AI在线

理论

啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了

不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM

突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026

高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM

攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍

强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM

谷歌DeepMind用AI探测引力波,登上Science了

探测宇宙深处的时空涟漪引力波,AI也派上用场了。 谷歌DeepMind、LIGO(激光干涉仪引力波探测器)团队和GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术,将引力波探测的低频降噪能力拉到了新高度。 该研究现已登上Science。
9/15/2025 8:40:00 AM

人格陷阱:AI如何假装人类

译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐

Qwen-Image:AI 设计师新搭档,文字排版不再是难题

在生成式 AI 日益成熟的今天,图像生成/编辑能力的发展越来越受到人们的期待。 而在所有能力中,“文字渲染”(尤其是中文/中英混排/长段落/复杂布局字体等)的精度,一直是个难点。 今天,我们要介绍的是通义千问系列中的最新图像基础模型 —— Qwen-Image,它在文字渲染与图像编辑方面取得了显著突破,是内容创作者、设计师和视觉工作者的有力助手。
9/15/2025 5:00:00 AM
AI大模型应用开发

推理的深度边界:神经网络如何在有限参数下实现多步推理?

大家好,我是肆〇柒。 今天要和大家分享的这项突破性研究来自MBZUAI(穆罕默德·本·扎耶德人工智能大学)、莫斯科物理技术学院神经网络与深度学习实验室、莫斯科人工智能研究院以及伦敦数学科学研究所的联合团队。 这项研究通过精心设计的1dCA基准,首次清晰地区分了模型的规则抽象能力和多步状态传播能力,为我们理解神经网络的"思考"机制提供了新视角。
9/15/2025 4:00:00 AM
肆零柒

Qwen3-Next 发布:通义千问的训练&推理效率革命

近日,阿里巴巴旗下的通义千问(Qwen)团队发布了全新模型 Qwen3-Next,在保持性能的同时大幅提升训练与推理效率,引起了 AI 界广泛关注。 下面带大家深入了解一下 Qwen3-Next 的亮点、技术突破,以及它对未来应用的意义。 什么是 Qwen3-NextQwen3-Next 是 Qwen 系列的最新成员,基于 Qwen3 架构进行改进与优化。
9/15/2025 3:00:00 AM
AI大模型应用开发

AI 正在让初级开发人员消失

——两年招人带人后的冷水与警钟你不会在技术大会上听到这一幕,更不会在 LinkedIn 的“AI 赋能人类创造力”帖里读到它。 可在招募与培养工程师十余年、近两年持续招聘与导师制实践之后,几乎笃定:传统意义上的“初级开发者”岗位,正被系统性地撤掉。 这并不意味着编程工作会在一夜之间蒸发。
9/15/2025 2:22:00 AM
dev

微软加码自研大模型:不把鸡蛋放在OpenAI一个篮子里

近日,微软(MSFT.US)宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施,加码自研 AI 模型开发。 这一动作引发行业广泛关注,毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。 为何微软选择在与 OpenAI 保持合作的同时,大力推进自研大模型?
9/15/2025 1:00:00 AM
小菲

Claude记忆系统逆向研究!与ChatGPT完全相反!网友:放弃广告了?Claude深夜祭出记忆选项,隐身聊天,按项目单独记忆

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上一篇文章中,小编分享了一位狠人逆向研究了 OpenAI 的 ChatGPT 底层记忆机制。 它的记忆系统主要分为四个板块:交互元数据、最近会话内容、模型设定上下文、用户知识记忆。 正是基于这样的设计,才会让 ChatGPT 充满了十足的留人能力。
9/14/2025 11:57:57 AM
云昭

清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路

超高规格团队,重新审视RL推理领域发展策略。 在人工智能的发展中,强化学习 (RL) 一直是一种非常重要的方法。 自 1998 年 Sutton 提出强化学习概念以来,就明确了只要给出明确的奖励信号,智能体就能学会在复杂环境中超越人类。
9/13/2025 6:20:00 PM
机器之心

如何为LLM智能体编写工具?Anthropic官方教程来了

好工具,才有好智能体。 智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。 为了让智能体真正释放潜力,我们需要重新思考工具开发的方式。
9/12/2025 9:26:00 PM
机器之心

云原生边缘与AI训练场景:两类高频隐蔽Bug的深度排查与架构修复

在云原生技术向边缘计算与AI训练场景的过程中,基础设施层的问题往往会被场景特性放大——边缘环境的弱网络、异构硬件,AI训练的高资源依赖、分布式协作,都可能让原本隐藏的Bug以“业务故障”的形式爆发。 这些问题大多不具备直观的报错信息,而是表现为任务崩溃、数据断连等表层现象,若仅从业务层排查,很容易陷入“调参无效、重启治标”的循环。 本文结合两个真实生产场景的高频Bug,从技术环境还原到根因拆解,再到架构级修复方案,完整呈现问题解决的全链路,为云原生运维与AI研发团队提供可复用的实践经验,避开那些文档未提及、经验难复制的隐性陷阱。
9/12/2025 6:17:31 PM
许辉

Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动

作者 | 论文团队编辑 | ScienceAI地球的未来,写在海洋的每一寸波澜里。 近日,一篇发表于《Science Advances》的重磅研究,为我们破译海洋这部「天书」提供了一种全新的视角。 由上海人工智能实验室、复旦大学、南京信息工程大学等多家国际顶尖机构联合攻关,该研究构建了一个名为 ORCA-DL 的数据驱动全球海洋模型。
9/12/2025 5:57:00 PM
ScienceAI

实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+,性价比提升10倍

Qwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。 基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
9/12/2025 5:19:38 PM

高德一夜刷榜:十亿用户用脚投票,美食到店榜单乱象被AI横扫

阿里藏了3个月,亮相即提4个热搜。 万众瞩目的神秘项目,「高德扫街榜」终于揭开了庐山真面目……热议中有夸赞和激动,终于有人出来整顿到店和评价的乱象了。 讨论里也有质疑:已经固化了十多年的格局,阿里和高德,凭什么一夜打破?
9/12/2025 4:55:31 PM

港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题

当AI遇上复杂网络搜索随着大型语言模型(LLM)的快速发展,AI Agent的能力边界不断扩展。 网络搜索Agent作为这一发展的重要组成部分,能够自主地从广泛的在线资源中检索信息。 然而,现有的开源网络Agent在处理复杂搜索任务时表现有限,而更强大的商业模型又缺乏透明的训练细节。
9/12/2025 4:54:00 PM
特邀精选