理论
啥?陶哲轩18个月没搞定的数学挑战,被这个“AI高斯”三周完成了
不得了,这个名叫Gauss(高斯)的新AI Agent,有点杀疯了的感觉。 因为它只用了三周的时间,就完成了陶哲轩和Alex Kontorovich提出的数学挑战——在Lean中形式化强素数定理(Prime Number Theorem,PNT)。 要知道,陶哲轩和Kontorovich在2024年1月提出这个挑战后,足足花了18个月(今年7月)的时间,也才取得阶段性的进展。
9/15/2025 9:00:00 AM
突发!苹果AI大失血:Siri前掌门离职,核心团队被挖角,新功能延期到2026
高管出走、人才流失新品发布会因缺乏「AI进展」被投行降级Siri升级延期,新AI功能未就绪Apple Intelligence落地受限……从年中高调,到9月「轻AI」的产品发布,苹果AI近半年来在跌宕中失速。 近日,苹果AI高层再传震荡:前Siri负责人、AI资深高管Robby Walker即将离任。 Walker是AI负责人John Giannandrea的少数直接汇报人之一。
9/15/2025 8:54:00 AM
攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍
强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/15/2025 8:50:00 AM
谷歌DeepMind用AI探测引力波,登上Science了
探测宇宙深处的时空涟漪引力波,AI也派上用场了。 谷歌DeepMind、LIGO(激光干涉仪引力波探测器)团队和GSSI(格兰萨索科学研究所)合作开发的Deep Loop Shaping技术,将引力波探测的低频降噪能力拉到了新高度。 该研究现已登上Science。
9/15/2025 8:40:00 AM
人格陷阱:AI如何假装人类
译者 | 核子可乐审校 | 重楼最近有个趣闻:一位女士在邮局排队时跟工作人员争执起来,原因是ChatGPT说邮政网站上公布了“保价承诺”,但实际上这只是AI的幻觉。 而相较于信任面前的邮政人员,这位女士显然更相信AI的建议——AI在她眼中不只是文本生成器,更像是“带来神谕的使者”。 也就是说,很多人对于AI聊天机器人存在着根本性误解。
9/15/2025 8:00:57 AM
核子可乐
Qwen-Image:AI 设计师新搭档,文字排版不再是难题
在生成式 AI 日益成熟的今天,图像生成/编辑能力的发展越来越受到人们的期待。 而在所有能力中,“文字渲染”(尤其是中文/中英混排/长段落/复杂布局字体等)的精度,一直是个难点。 今天,我们要介绍的是通义千问系列中的最新图像基础模型 —— Qwen-Image,它在文字渲染与图像编辑方面取得了显著突破,是内容创作者、设计师和视觉工作者的有力助手。
9/15/2025 5:00:00 AM
AI大模型应用开发
推理的深度边界:神经网络如何在有限参数下实现多步推理?
大家好,我是肆〇柒。 今天要和大家分享的这项突破性研究来自MBZUAI(穆罕默德·本·扎耶德人工智能大学)、莫斯科物理技术学院神经网络与深度学习实验室、莫斯科人工智能研究院以及伦敦数学科学研究所的联合团队。 这项研究通过精心设计的1dCA基准,首次清晰地区分了模型的规则抽象能力和多步状态传播能力,为我们理解神经网络的"思考"机制提供了新视角。
9/15/2025 4:00:00 AM
肆零柒
Qwen3-Next 发布:通义千问的训练&推理效率革命
近日,阿里巴巴旗下的通义千问(Qwen)团队发布了全新模型 Qwen3-Next,在保持性能的同时大幅提升训练与推理效率,引起了 AI 界广泛关注。 下面带大家深入了解一下 Qwen3-Next 的亮点、技术突破,以及它对未来应用的意义。 什么是 Qwen3-NextQwen3-Next 是 Qwen 系列的最新成员,基于 Qwen3 架构进行改进与优化。
9/15/2025 3:00:00 AM
AI大模型应用开发
AI 正在让初级开发人员消失
——两年招人带人后的冷水与警钟你不会在技术大会上听到这一幕,更不会在 LinkedIn 的“AI 赋能人类创造力”帖里读到它。 可在招募与培养工程师十余年、近两年持续招聘与导师制实践之后,几乎笃定:传统意义上的“初级开发者”岗位,正被系统性地撤掉。 这并不意味着编程工作会在一夜之间蒸发。
9/15/2025 2:22:00 AM
dev
微软加码自研大模型:不把鸡蛋放在OpenAI一个篮子里
近日,微软(MSFT.US)宣布一项重大战略举措 —— 豪掷重金扩大物理基础设施,加码自研 AI 模型开发。 这一动作引发行业广泛关注,毕竟微软长期以来深度依赖 OpenAI 的大型语言模型支撑自身产品生态。 为何微软选择在与 OpenAI 保持合作的同时,大力推进自研大模型?
9/15/2025 1:00:00 AM
小菲
Claude记忆系统逆向研究!与ChatGPT完全相反!网友:放弃广告了?Claude深夜祭出记忆选项,隐身聊天,按项目单独记忆
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上一篇文章中,小编分享了一位狠人逆向研究了 OpenAI 的 ChatGPT 底层记忆机制。 它的记忆系统主要分为四个板块:交互元数据、最近会话内容、模型设定上下文、用户知识记忆。 正是基于这样的设计,才会让 ChatGPT 充满了十足的留人能力。
9/14/2025 11:57:57 AM
云昭
清华、上海AI Lab等顶级团队发布推理模型RL超全综述,探索通往超级智能之路
超高规格团队,重新审视RL推理领域发展策略。 在人工智能的发展中,强化学习 (RL) 一直是一种非常重要的方法。 自 1998 年 Sutton 提出强化学习概念以来,就明确了只要给出明确的奖励信号,智能体就能学会在复杂环境中超越人类。
9/13/2025 6:20:00 PM
机器之心
如何为LLM智能体编写工具?Anthropic官方教程来了
好工具,才有好智能体。 智能体(Agent)时代,工具已不再只是传统 API 或函数接口的简单封装,而是决定智能体能否高效完成任务的关键。 为了让智能体真正释放潜力,我们需要重新思考工具开发的方式。
9/12/2025 9:26:00 PM
机器之心
云原生边缘与AI训练场景:两类高频隐蔽Bug的深度排查与架构修复
在云原生技术向边缘计算与AI训练场景的过程中,基础设施层的问题往往会被场景特性放大——边缘环境的弱网络、异构硬件,AI训练的高资源依赖、分布式协作,都可能让原本隐藏的Bug以“业务故障”的形式爆发。 这些问题大多不具备直观的报错信息,而是表现为任务崩溃、数据断连等表层现象,若仅从业务层排查,很容易陷入“调参无效、重启治标”的循环。 本文结合两个真实生产场景的高频Bug,从技术环境还原到根因拆解,再到架构级修复方案,完整呈现问题解决的全链路,为云原生运维与AI研发团队提供可复用的实践经验,避开那些文档未提及、经验难复制的隐性陷阱。
9/12/2025 6:17:31 PM
许辉
Science Advances | AI for Earth:聆听海洋的「脉搏」,新一代AI大模型精准预测十年气候脉动
作者 | 论文团队编辑 | ScienceAI地球的未来,写在海洋的每一寸波澜里。 近日,一篇发表于《Science Advances》的重磅研究,为我们破译海洋这部「天书」提供了一种全新的视角。 由上海人工智能实验室、复旦大学、南京信息工程大学等多家国际顶尖机构联合攻关,该研究构建了一个名为 ORCA-DL 的数据驱动全球海洋模型。
9/12/2025 5:57:00 PM
ScienceAI
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+,性价比提升10倍
Qwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。 基于Qwen3-Next,团队先开源了Qwen3-Next-80B-A3B-Base。
9/12/2025 5:19:38 PM
高德一夜刷榜:十亿用户用脚投票,美食到店榜单乱象被AI横扫
阿里藏了3个月,亮相即提4个热搜。 万众瞩目的神秘项目,「高德扫街榜」终于揭开了庐山真面目……热议中有夸赞和激动,终于有人出来整顿到店和评价的乱象了。 讨论里也有质疑:已经固化了十多年的格局,阿里和高德,凭什么一夜打破?
9/12/2025 4:55:31 PM
港科大 X MiniMax:高质量数据、小模型挑战复杂网络搜索难题
当AI遇上复杂网络搜索随着大型语言模型(LLM)的快速发展,AI Agent的能力边界不断扩展。 网络搜索Agent作为这一发展的重要组成部分,能够自主地从广泛的在线资源中检索信息。 然而,现有的开源网络Agent在处理复杂搜索任务时表现有限,而更强大的商业模型又缺乏透明的训练细节。
9/12/2025 4:54:00 PM
特邀精选
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型