模型
大语言模型不知“今夕是何年”——解决方案在此
在黑色星期五这个物流行业的关键节点,你的团队正争分夺秒地赶交付期限。 然而,欧洲突发的恶劣天气打乱了货运节奏,你必须立即重新规划卡车路线、调配仓库人员,并及时更新客户预期。 情急之下,你向AI助手询问:“目前法兰克福枢纽有多少包裹正在运输途中?
9/28/2025 9:26:57 AM
大模型之路
刚刚,北大&360里程碑式突破!32B安全分碾压千亿巨兽
2025年9月23日,由「北大-360大模型联合实验室」研发的TinyR1-32B模型正式发布。 近年来开源大模型层出不穷,但对「安全性」的关注却严重不足。 北大-360联合实验室聚焦于大模型安全方向,以极高的安全性能和轻量化的创新设计,推出更安全的模型TinyR1-32B。
9/28/2025 9:12:00 AM
苹果掀桌!扔掉AlphaFold核心模块,开启蛋白折叠「生成式AI」时代
蛋白质折叠,一直是计算生物学中的一个核心难题,并对药物研发等领域产生着深远影响。 若把蛋白质折叠类比为视觉领域的生成模型,氨基酸序列相当于「提示词」,模型输出则是原子的三维坐标。 受此思维启发,研究人员构建了一个基于标准Transformer模块与自适应层的通用且强大的架构——SimpleFold。
9/28/2025 9:12:00 AM
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
在大型语言模型的优化中,业界通常认为计算量与模型性能正相关。 然而,杜克大学陈怡然教授团队的一项最新研究DPad,却揭示了一个反直觉的现象:对于扩散大语言模型(dLLMs),通过一种「先验丢弃」策略,主动减少其计算量,不仅能带来高达61倍的推理加速,还能意外地增强模型语境学习的能力。 这一发现源于对dLLM内部一种「中奖彩票」(Lottery Ticket)现象的洞察。
9/28/2025 9:10:00 AM
2025全球前2%顶尖科学家榜单发布!清华国内第一、Bengio全球前十
当地时间9月19日,斯坦福大学和国际权威学术出版社爱思唯尔(Elsevier)共同发布了「斯坦福2025全球前2%顶尖科学家榜单」。 全榜单链接:,国内共有1435人入选终身「斯坦福2025全球前2%顶尖科学家榜单」;有2270人入选年度「斯坦福2025全球前2%顶尖科学家榜单」。 这份榜单是学术界关注度最高的爱思唯尔发布的年度清单之一。
9/28/2025 9:08:00 AM
创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化
本文来自于上海创智学院和上海交大刘鹏飞老师团队,团队专注于构建最前沿 AI 系统。 核心作者来自于香港理工大学,上海交通大学,以及中国科学技术大学。 从 ChatGPT 到 Claude,从 Codex 到 Claude Code,全球科技公司正在 "能动性" 领域展开激烈竞争。
9/28/2025 9:07:00 AM
强化学习之父Richard Sutton最新采访:LLM是“死路一条”
强化学习之父Richard Sutton老爷子加入了Yann LeCun行列,认为当前的LLM路线行不通,不可能通向AGI。 图灵奖获得者Richard Sutton,强化学习之父最新采访,认为当前热门的大语言模型是一条死胡同。 他的核心观点是,LLMs 的架构从根本上缺乏从实际互动(on-the-job)中持续学习的能力。
9/28/2025 8:58:55 AM
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
全球首个具备模拟推理能力的具身模型来了! 谷歌DeepMind正式发布新一代通用机器人基座模型——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作(VLA),并通过具身推理(Embodied Reasoning)来实现“先思考,再行动”。
9/28/2025 2:00:00 AM
量子位
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
视觉-语言-动作模型是实现机器人在复杂环境中灵活操作的关键因素。 然而,现有训练范式存在一些核心瓶颈,比如数据采集成本高、泛化能力不足等。 为此,研究团队提出了SimpleVLA-RL。
9/26/2025 10:59:55 AM
多模态推理最高加速3.2倍!华为诺亚新算法入选NeurIPS 2025
不牺牲任何生成质量,将多模态大模型推理最高加速3.2倍! 华为诺亚方舟实验室最新研究已入选NeurIPS 2025。 截至目前,投机推理(Speculative Decoding)技术已成为大语言模型(LLM)推理加速的“标准动作”,但在多模态大模型(VLM)上的应用却举步维艰,现有方法加速比不到1.5倍,性能提升有限。
9/26/2025 10:58:03 AM
“零人”搞医学研究:清华AI智能体从灵感到论文全程自主
医学研究迎来“零人工”时代了? 清华大学自动化系索津莉课题组,发布首个专为医疗信息学设计的全自主AI研究框架——OpenLens AI。 首次实现从文献挖掘→实验设计→数据分析→代码生成→可投稿论文的全链条自动化闭环。
9/26/2025 10:47:35 AM
Nature重磅:AI和人脑的根本区别找到了,我们对“聪明”的理解可能全错了
一篇发表在2025年《自然·机器智能》(Nature Machine Intelligence)上的研究,像一颗深水炸弹,炸开了人工智能和人类认知之间最深的那道墙。 这篇由二十多位国际顶尖专家联手的研究,它告诉我们,AI和人类在“泛化能力”上,压根就不是一回事。 什么叫泛化能力?
9/26/2025 9:37:06 AM
“iFold”,苹果AI新成果
起猛了,苹果怎么搞起跨界AI模型了? ? 发布了一个基于流匹配的蛋白质折叠模型SimpleFold,被网友戏称为“iFold”。
9/26/2025 9:34:35 AM
攻克结构化长文档检索难题!新框架让模型告别“结构性失明”
AI读不懂HTML、Markdown长文档的标题和结构,找信息总踩坑? 解决方案来了——SEAL全新对比学习框架通过带结构感知 元素对齐,让模型更懂长文。 该方法创新性地将文档的宏观层级结构和微观元素语义同时融入到统一的Embedding空间中,显著增强了预训练语言模型对结构化数据的理解和表示能力。
9/26/2025 9:32:47 AM
GPT-5通过“哥德尔测试”!独创性解决博士生都得花几天时间的开放数学问题
GPT-5,你这家伙! 究竟还有什么事是我不知道的? 在一篇最新论文中,研究人员让它挑战了5个尚未解决的优化猜想。
9/26/2025 9:24:46 AM
刚刚,谷歌发布机器人最新「大脑」模型!思考能力SOTA,还能「跨物种」学习
谷歌又给机器人「换大脑」了! 刚刚,DeepMind发布了针对机器人和具身智能的Gemini Robotics 1.5系列家族模型,专为机器人和具身智能打造的新一代「大脑」。 Gemini Robotics 1.5系列包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5。
9/26/2025 9:15:40 AM
NeurIPS Spotlight|运动遮挡都不怕,0先验、一段视频精准预测相机参数
论文一作李放,美国伊利诺伊大学香槟分校 (UIUC) 博二学生,研究方向为 4D 视觉定位、重建/新视角合成以及理解。 第二作者为美国伊利诺伊大学香槟分校博四学生张昊。 通讯作者是 Narendra Ahuja, 美国伊利诺伊大学香槟分校 Donald Biggar Willet Professor(Ming-hsuan Yang, Jia-bin Huang 博士导师)。
9/26/2025 9:12:49 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉