模型
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
在大型语言模型的优化中,业界通常认为计算量与模型性能正相关。 然而,杜克大学陈怡然教授团队的一项最新研究DPad,却揭示了一个反直觉的现象:对于扩散大语言模型(dLLMs),通过一种「先验丢弃」策略,主动减少其计算量,不仅能带来高达61倍的推理加速,还能意外地增强模型语境学习的能力。 这一发现源于对dLLM内部一种「中奖彩票」(Lottery Ticket)现象的洞察。
9/28/2025 9:10:00 AM
2025全球前2%顶尖科学家榜单发布!清华国内第一、Bengio全球前十
当地时间9月19日,斯坦福大学和国际权威学术出版社爱思唯尔(Elsevier)共同发布了「斯坦福2025全球前2%顶尖科学家榜单」。 全榜单链接:,国内共有1435人入选终身「斯坦福2025全球前2%顶尖科学家榜单」;有2270人入选年度「斯坦福2025全球前2%顶尖科学家榜单」。 这份榜单是学术界关注度最高的爱思唯尔发布的年度清单之一。
9/28/2025 9:08:00 AM
创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化
本文来自于上海创智学院和上海交大刘鹏飞老师团队,团队专注于构建最前沿 AI 系统。 核心作者来自于香港理工大学,上海交通大学,以及中国科学技术大学。 从 ChatGPT 到 Claude,从 Codex 到 Claude Code,全球科技公司正在 "能动性" 领域展开激烈竞争。
9/28/2025 9:07:00 AM
强化学习之父Richard Sutton最新采访:LLM是“死路一条”
强化学习之父Richard Sutton老爷子加入了Yann LeCun行列,认为当前的LLM路线行不通,不可能通向AGI。 图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。 他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。
9/28/2025 8:58:55 AM
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
全球首个具备模拟推理能力的具身模型来了! 谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
9/28/2025 2:00:00 AM
量子位
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。 然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。 为此,研究团队提出了SimpleVLA-RL。
9/26/2025 10:59:55 AM
多模态推理最高加速3.2倍!华为诺亚新算法入选NeurIPS 2025
不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍! 华为诺亚方舟实验室最新研究已入选NeurIPS 2025。 截至目前,投机推理(Speculative Decoding)技术已成为大语言模型(LLM)推理加速的“标准动作”,但在多模态大模型(VLM)上的应用却举步维艰,现有方法加速比不到1.5倍,性能提升有限。
9/26/2025 10:58:03 AM
“零人”搞医学研究:清华AI智能体从灵感到论文全程自主
医学研究迎来“零人工”时代了? 清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI。 首次实现从文献挖掘→实验设计→数据分析→代码生成→可投稿论文的全链条自动化闭环。
9/26/2025 10:47:35 AM
Nature重磅:AI和人脑的根本区别找到了,我们对“聪明”的理解可能全错了
一篇发表在2025年《自然·机器智能》(Nature Machine Intelligence)上的研究,像一颗深水炸弹,炸开了人工智能和人类认知之间最深的那道墙。 这篇由二十多位国际顶尖专家联手的研究,它告诉我们,AI和人类在“泛化能力”上,压根就不是一回事。 什么叫泛化能力?
9/26/2025 9:37:06 AM
“iFold”,苹果AI新成果
起猛了,苹果怎么搞起跨界AI模型了? ? 发布了一个基于流匹配的蛋白质折叠模型SimpleFold,被网友戏称为“iFold”。
9/26/2025 9:34:35 AM
攻克结构化长文档检索难题!新框架让模型告别“结构性失明”
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑? 解决方案来了——SEAL全新对比学习框架通过带结构感知 元素对齐,让模型更懂长文。 该方法创新性地将文档的宏观层级结构和微观元素语义同时融入到统一的Embedding空间中,显著增强了预训练语言模型对结构化数据的理解和表示能力。
9/26/2025 9:32:47 AM
GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题
GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。
9/26/2025 9:24:46 AM
刚刚,谷歌发布机器人最新「大脑」模型!思考能力SOTA,还能「跨物种」学习
谷歌又给机器人「换大脑」了! 刚刚,DeepMind发布了针对机器人和具身智能的Gemini Robotics 1.5系列家族模型,专为机器人和具身智能打造的新一代「大脑」。 Gemini Robotics 1.5系列包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5。
9/26/2025 9:15:40 AM
NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数
论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。 第二作者为美国伊利诺伊大学香槟分校博四学生张昊。 通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。
9/26/2025 9:12:49 AM
ChatGPT新功能Pulse,GPT-5主动给你推消息,大家玩得停不下来
这是 OpenAI CEO 山姆・奥特曼迄今为止最喜欢的 ChatGPT 功能。 本周五凌晨,OpenAI 宣布推出 ChatGPT 新功能「Pulse」的预览版,首先向 Pro 订阅用户开放。 ChatGPT 现在会每天晚上主动进行研究,根据你每天的聊天记录、反馈以及日历等关联应用提供个性化更新。
9/26/2025 9:09:32 AM
15 分钟吃透核心:卷积 / 池化 / 全连接 + 六大经典模型对比
卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,专门用于处理和分析视觉数据,在图像识别、目标检测等任务中表现尤为出色。 然而,CNN的架构因其固有的复杂性和快速演进的特性,往往难以掌握。 在本文中,将详细介绍标准CNN架构及CNN家族中的各类模型,并拆解其核心组成部分,包括:卷积层、池化层、全连接层同时讲解步长(stride)、卷积核(kernel)、池化(pooling)等关键概念。
9/26/2025 9:08:27 AM
奖励模型:为什么要用评估专家及其设计方案
大模型最根本的价值就是替代人的工作,而在训练大模型的过程中,还有很多操作是需要人工的。 比如数据工程里的数据质量检查、模型评估阶段的人工测评等。 关于这个问题,我的答案是使用评估专家模型技术,让这些过程实现完全无人化。
9/26/2025 2:11:00 AM
greencoatman
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测