资讯列表
打造图像编辑领域的ImageNet?苹果用Nano Banana开源了一个超大数据集
苹果在大模型和大模型应用上总是慢人一步。 Apple Intelligence 发布也已经一年多了,除去其仍未能在国行设备上提供服务外,功能上也很难称得上有多好用。 就拿视觉生成类功能举例子,苹果的图像生成大概是这个画风:但在开放研究领域里,苹果似乎一整个脱胎换骨,在纯粹的研究中经常会有一些出彩的工作。
10/26/2025 6:52:00 PM
机器之心
NVIDIA港大MIT联合推出Fast-dLLM v2:端到端吞吐量提升2.5倍
自回归(AR)大语言模型逐 token 顺序解码的范式限制了推理效率;扩散 LLM(dLLM)以并行生成见长,但过去难以稳定跑赢自回归(AR)模型,尤其是在 KV Cache 复用、和 可变长度 支持上仍存挑战。 Fast-dLLM v2 给出了一条务实路线:将预训练 AR 模型适配为适配为能并行解码的 Block-dLLM—— 且只需~1B tokens 量级的微调即可达到 “无损” 迁移,不必训练数百 B tokens(如 Dream 需~580B tokens)。 在 A100/H100 上,它在保持精度的同时,将端到端吞吐显著拉高,最高可达 2.5×。
10/26/2025 6:48:00 PM
机器之心
深度拆解,硬核解构,揭开vLLM推理系统实现高效吞吐的秘籍
在大模型应用快速发展的今天,如何让推理变得更快、更高效,已经成为研究和产业界共同关注的焦点。 vLLM 便是在这样的背景下诞生的一套高性能推理框架。 它专门针对大语言模型的推理优化,在保持模型准确性的同时,大幅提升了吞吐量与响应速度。
10/26/2025 6:40:00 PM
机器之心
Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
编辑 | 听雨出品 | 51CTO技术栈(微信号:blog51cto)“我真的已经受够了 Transformer。 ”——这句话来自 Transformer 的共同作者、Sakana AI 联合创始人 Llion Jones。 在旧金山 TED AI 大会上,这位被誉为“生成式 AI 时代奠基人”的研究者,突然“开炮”——不仅公开批评了整个 AI 行业的研究方向,还宣布自己已经“离开 Transformer”,开始寻找下一次重大突破。
10/26/2025 2:50:25 PM
听雨
破解AI对不同上下⽂位置的敏感度不⼀致,新框架使出“解铃还须系铃人”
Pos2Distill团队 投稿. 量子位 | 公众号 QbitAI语言模型遭遇严重的位置偏见,即模型对不同上下⽂位置的敏感度不⼀致。 模型倾向于过度关注输⼊序列中的特定位置,严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。
10/26/2025 12:15:35 PM
衡宇
P图老本事搭上了对话框,美图这AI Agent到底香不香?
梦瑶 发自 凹非寺. 量子位 | 公众号 QbitAI这些刷屏的AI图片,你刷到了没? 就是那种——和自己专属emoji合影的黏土风照片,画风长这样:本来以为是NanoBanana整的新玩法,结果点开评论区一看:嗐,原来是美图自家的AI Agent——叫RoboNeo~.
10/26/2025 12:09:23 PM
衡宇
5个大疆离职员工,把3D打印带回风口
Jay 发自 凹非寺量子位 | 公众号 QbitAI3D打印机,重新火了。 上一次是概念,这一次是实实在在的日常产品。 街头巷尾,越来越多的夜市摊位开始摆上3D打印出来的产品,龙蛋、关节龙、关节蛇成了新一代「地摊网红」。
10/26/2025 8:23:33 AM
Jay
Perplexity 重磅发布!7个章节深度解析全新AI浏览器Comet
作为一位体验设计师我很热衷于体验各类产品,早前OpenAI也发布了ChatGPT Atlas,可惜老三的电脑版本过低无法体验。 看到Comet可以用时,让我兴奋不已,因为这是对"人与信息交互方式"这一本质问题的重新思考。 更多相关干货:注:文末分享邀请链接,可注册登录免费领取一个月会员体验。
10/26/2025 1:42:06 AM
要爆炸的张老三
Yoshua Bengio,刚刚成为全球首个百万引用科学家!
刚刚,计算机科学家 Yoshua Bengio 创造了新的历史,成为 Google Scholar 上首个引用量超过 100 万的人! 打个直观的比方,如果我们将每一篇引用论文打印成册(假设平均厚度为 1 毫米),然后将它们垂直堆叠起来,这座由知识构成的纸塔将高达 1000 米。 这是什么概念?
10/25/2025 11:10:00 PM
机器之心
Anthropic、Thinking Machines Lab论文曝光:30万次压力测试揭示AI规范缺陷
即便是最详细的模型规范,也存在内部矛盾、粒度不足与解释歧义。 现如今,LLM 正越来越多地受到模型规范的约束,这些规范为模型的行为准则与伦理边界提供了清晰定义。 它们构成了 Constitutional AI(宪法式 AI) 与 Deliberate Alignment(审慎对齐) 的核心基础。
10/25/2025 11:05:00 PM
机器之心
让机器人「不仅会想,还能准确去做」,VLA-R1把「推理+行动」带进真实世界
在机器人与智能体领域,一个老大难问题是:当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时,它不仅要看懂环境,更要解释指令、规划路径 / 可操作区域,并把这些推理落实为准确的动作。 目前,很多 VLA(Vision-Language-Action)模型仍倾向直接输出动作,缺乏对可供性(affordance)与轨迹(trajectory)几何关系的显式推理,一旦遇到颜色相近、目标重复或容器多选等场景,就容易出错。 VLA-R1 的目标,不仅把 “会想” 这步补上,而且通过强化学习进一步加强执行动作的准确性,让机器人解释清楚再去准确执行。
10/25/2025 11:02:00 PM
机器之心
NeurIPS 2025 | ARGRE框架实现高效LLM解毒:自回归奖励引导,安全对齐更快、更准、更轻
作者为北京航空航天大学的肖宜松,刘艾杉,应宗浩,刘祥龙,新加坡国立大学的梁思源,新加坡南洋理工大学的陶大程。 本文已被 NeurIPS 2025 录用。 LLM 已在智能创作、企业服务等领域广泛应用,但其内容安全问题仍是落地过程中的关键挑战。
10/25/2025 10:54:00 PM
机器之心
「我受够了Transformer」:其作者Llion Jones称AI领域已僵化,正错失下一个突破
这两天,VentureBeat 一篇报道在 Hacker News 上引发热议。 颠覆性论文《Attention is all you need》的作者之一,现任 Sakana AI CTO 的 Llion Jones 在近日的 TED AI 大会上表示他已经厌倦了 Transformer。 是什么,让这位 Transformer 的创造者发出了如此言论?
10/25/2025 10:51:00 PM
机器之心
让VLM学会「心中有世界」:VAGEN用多轮RL把视觉智能变成「世界模型」推理机器
当今的 AI 智能体(Agent)越来越强大,尤其是像 VLM(视觉-语言模型)这样能「看懂」世界的智能体。 但研究者发现一个大问题:相比于只处理文本的 LLM 智能体,VLM 智能体在面对复杂的视觉任务时,常常表现得像一个「莽撞的执行者」,而不是一个「深思熟虑的思考者」。 它们为什么会这样?
10/25/2025 10:46:00 PM
机器之心
2025谷歌博士生奖学金揭晓,清华、科大、南大等校友入选
他们是正在塑造技术格局的人。 本周四,谷歌公布了 2025 年度的博士奖学金入围名单。 谷歌于 2009 年创建了博士奖学金计划(Google PhD Fellows),以表彰和支持在计算机科学及相关领域进行杰出研究的优秀研究生,培养专注于关键基础科学的下一代科学家。
10/25/2025 10:38:00 PM
机器之心
快手Klear团队提出CE-GPPO:通过梯度保留协调熵,解决强化学习中的熵不稳定问题
本研究由快手科技 Klear 语言大模型团队完成,核心作者苏振鹏,潘雷宇,吕民轩,胡文凭,张富峥,周国睿等。 快手 Klear 语言大模型团队聚焦在基础语言大模型研发、Agent RL 等前沿技术创新等方向,积累务实的探索 AGI 的能力边界,并不断推进 AI 领域新技术和新产品的发展。 此前,该团队已开源了 Klear-46B-A2.5B 和 Klear-Reasoner-8B 等模型,其中 Klear-Reasoner-8B 在数学和代码的基准测试上达到了同参数级别模型的 SOTA 效果。
10/25/2025 10:29:00 PM
机器之心
开源模型首次物理奥赛夺金!上海AI Lab 235B模型击败GPT5和Grok4
P1团队 投稿量子位 | 公众号 QbitAI开源模型首次在国际物理奥林匹克竞赛夺金了。 来自上海AI Lab的P1-235B-A22B取得了21.2分的成绩,成功跨越金牌线。 在覆盖2024-2025年全球13场顶级物理竞赛的HiPhO基准测试中,P1-235B-A22B获12金1银,与谷歌Gemini-2.5-Pro并列奖牌榜第一。
10/25/2025 2:48:12 PM
梦晨
Cell子刊封面 | 统一虚拟筛选和活性优化,IDEA研究院等提出亲和力基础模型LigUnity
作者 | 论文团队编辑 | ScienceAI2025 年 10 月,一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文,作为封面文章发表于 Cell 旗下期刊《Patterns》。 该研究由粤港澳大湾区数字经济研究院(IDEA)AI4Science 团队、晶泰科技(XtalPi)及华盛顿大学的研究团队联合攻关,成功开发了名为 LigUnity 的亲和力基础模型。 论文地址:(25)00219-3?_returnURL=::,更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间,让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。
10/24/2025 10:22:00 PM
ScienceAI