资讯列表
EMNLP2025 | 通研院揭秘MoE可解释性,提升Context忠实性!
论文发表于EMNLP2025主会,核心作者为北京通用人工智能研究院(通研院)研究工程师白骏、刘洋,以及通计划武汉大学联培一年级博士生童铭颢,通讯作者为通研院语言交互实验室研究员贾子夏,实验室主任郑子隆。 MoE 遇上机制可解释性:鲜为人知的探索之旅在大模型研究领域,做混合专家模型(MoE)的团队很多,但专注机制可解释性(Mechanistic Interpretability)的却寥寥无几 —— 而将二者深度结合,从底层机制理解复杂推理过程的工作,更是凤毛麟角。 这条路为何少有人走?
他「二本」出身,数学很差:最终成了PyTorch之父、Meta副总裁
如果你正有放弃的念头,你一定要读读这篇从未被公开分享过的故事,关于 PyTorch 创造者、Meta 前副总裁 Soumith Chintala 的故事。 原文地址:・钦塔拉 (Soumith Chintala) 这个名字,但如果你比较了解人工智能领域,肯定知道 PyTorch。 对于 AI 来说,它就像写文章用 Word,P 图用 Photoshop 一样,是最流行的开发工具。
⽆需任何监督信号!自博弈机制让深度搜索Agent实现自我进化
近期,搜索型 Agent 的热度持续攀升⸺从 OpenAI 的 Deep Research 到各类学术探索,「多轮检索 ⼯具调⽤ 深度推理」的新范式正在深刻改变 AI 获取和整合信息的⽅式。 但如何让这些 Agent 能⼒持续提升,达到接近⼈类的表现⽔平,仍然是⼀个核⼼挑战。 ⽬前主流的训练⽅法是可验证奖励强化学习(RLVR):给定任务题⽬和标准答案,⽤最终预测结果的正确性作为奖励信号来训练 Agent。
AAAI 2026|教会视频扩散模型「理解科学现象」:从初始帧生成整个物理演化
近年来,Stable Diffusion、CogVideoX 等视频生成模型在自然场景中表现惊艳,但面对科学现象 —— 如流体模拟或气象过程 —— 却常常 “乱画”:如下视频所示,生成的流体很容易产生违背物理直觉的现象,比如气旋逆向旋转或整体平移等等。 上述问题的根源在于,这些模型缺乏对科学规律的内在理解。 它们学习到的只是像素分布,而非支配这些分布的动力学方程。
议程公布!2025人工智能+大会,图灵奖得主姚期智来啦!
11月15日-17日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI 》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、中关村发展集团等联合主办的2025人工智能 大会将在北京中关村国际创新中心&中关村国家自主创新示范区会议中心举办。 2025人工智能 大会倒计时1天! 诚邀人工智能领域专家学者、企业家、.
告别无效提问!深度解析用户提示词和系统提示词
感觉大模型很牛,但自己用起来总有点不得劲? 这太正常了。 多数人跟 AI 聊天,就像跟一个新来的天才同事说话,话说一半,背景不说,指望他能完美 get 到你的点。
这届清华特奖机器人含量爆表!丘成桐(国内版)现身点评
梦瑶 发自 凹非寺. 量子位 | 公众号 QbitAI一年一度“神仙打架”的清华特奖,又到了揭榜名场面! 11月13日下午,本科生特等奖学金15进10刚打完,网上立刻炸开了锅,疑似TOP10入围名单流出了:但这次让网友们刷屏的,不光是谁进了前十,而是,方向太统一了!
ChatGPT 将应用户要求停止使用长破折号
近日,OpenAI 首席执行官 Sam Altman 在社交媒体 X 上表示,用户在 ChatGPT 的自定义指令中可以选择不使用长破折号(em dash)。 他表示:“这终于实现了它应该做到的功能。 ” ChatGPT 的自定义指令允许用户调整 AI 的响应方式,这一功能可以在设置菜单中的个性化选项中找到。
超大参数量具身VLM开源:首创DPPO训练范式,模型性价比天花板,来自北京人形
最近,国内具身智能的开源 VLM 登顶了行业之巅。 2025 年以来,具身智能的行业研发力似乎也迎来了井喷式爆发。 11 月 13 日,北京人形机器人创新中心正式开源了具身智能 VLM 模型 ——Pelican-VL 1.0,根据介绍,该模型覆盖 7B、72B 参数规模,被称为 “最大规模的开源具身多模态大脑模型”。
SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控
随着生成式 AI 的快速发展,从文本生成图像、视频,到构建完整的三维世界,AI “创造空间” 的能力正以前所未有的速度突破边界。 然而,现有 3D 场景生成方法仍存在明显局限:模型往往直接输出每个物体的几何参数(位置、大小、方向等),结果容易出现漂浮、重叠、穿模等问题;场景结构缺乏逻辑一致性,难以编辑或复用,更无法像程序那样精确控制空间关系与生成逻辑。 想象这样一个画面:你输入一句话 ——“在黄昏的码头上,一位渔夫坐在木椅上,旁边是一盏摇曳的灯。
百度亮出秘密武器:一个自我演化的AI,给出了人类做不到的最优解
从「执行者」到「发明家」,AI 进化的幅度又加快了。 这就是未来解决难题的方式? 只要你输入自然语言指令和必要的数据,一群智能体就可以针对复杂问题设立项目进行研究,自己去寻找解法。
聊AI,当然得来量子位MEET大会!首波嘉宾阵容曝光
MEET组委会 发自 凹非寺. 量子位|公众号 QbitAI2025年,我们正迈入一个由人工智能重塑一切的新时代。 12月10日,量子位MEET2026智能未来大会将带你聚焦这一年里最受关注的前沿技术与产业落地进展。
OpenAI新论文拆解语言模型内部机制:用「稀疏电路」解释模型行为
在如今的 AI 领域,大多数大语言模型在很大程度上仍以「黑箱」方式工作,即使是专业的研究者也难以完全理解它们的内部计算过程。 因此,提升模型的透明度有助于分析和解释大语言模型产生幻觉、行为不稳定或在关键场景做出不可靠判断的潜在原因。 就在今天,OpenAI 发布了一项新研究,使用新方法来训练内部机制更易于解释的小型稀疏模型,其神经元之间的连接更少、更简单,从而观察它们的计算过程是否更容易被人理解。
2025宝山·智能机器人产业大会暨嘉年华,邀您共赴科技盛宴
2025 年 11 月 21 日至 22 日,“2025 宝山・智能机器人产业大会暨嘉年华” 将重磅来袭。 本次活动不仅有顶尖专家坐镇的行业论坛、优秀项目汇聚的创业路演,更有明星企业云集的硬核展览,以及能摸能玩的互动体验,等你来解锁! 科技盛宴,共启未来活动首日,一场备受瞩目的开幕式将为大会拉开精彩序幕。
NeurIPS Spotlight|GHAP:把3DGS“剪枝”变成“重建更小的高斯世界”
本文第一作者王涛来自中国人民大学,共同第一作者李梦雨 () 来自清华大学。 通讯作者为中国人民大学张琼助理教授 () 与孟澄助理教授 ()。 其他作者还包括来自中国人民大学的曾舸舵。
研究:97% 的听众无法分辨 AI 音乐与人类创作
近日,Deezer与市场调研公司Ipsos联合发布了一项关于 AI 与音乐的独特研究。 这项调查在美国、加拿大、巴西、英国、法国、荷兰、德国和日本等八个国家进行,共计收集了9000名参与者的反馈。 研究结果显示,大多数人对 AI 生成的音乐有着强烈的标签需求,并对版权问题表示关注。
YC少年放弃向农化巨头出售AI工具 转身农药赛道获投600万美元
18岁Tyler Rose与19岁Navvye Anand创办的Bindwell宣布完成600万美元种子轮融资,由General Catalyst与A Capital联合领投,Y Combinator联合创始人Paul Graham个人跟投。 公司放弃向农化巨头出售AI工具的计划,转而自研农药分子并对外授权,估值与交易条款未披露。 Bindwell将药物发现领域的靶点设计思路引入农药研发。
TRAE 发布 SOLO 正式版:实时感知 + 多智能体 开启新一代专业级 AI 编码模式
TRAE 宣布推出 SOLO 正式版,定位为 “The Responsive Coding Agent”,面向专业开发者提供更加实时、可掌控、多任务并行的 AI 编程体验。 即日起,该版本已在 TRAE 国际版全面开放,并开启限时免费体验活动。 今年7月,TRAE 推出 SOLO Beta 版,内置智能体 SOLO Builder,能够基于多模态上下文执行需求理解、任务分解、工具调度与结果交付,帮助开发者快速构建端到端应用。