资讯列表

分类

标签

打造图像编辑领域的ImageNet？苹果用Nano Banana开源了一个超大数据集

苹果在大模型和大模型应用上总是慢人一步。 Apple Intelligence 发布也已经一年多了，除去其仍未能在国行设备上提供服务外，功能上也很难称得上有多好用。就拿视觉生成类功能举例子，苹果的图像生成大概是这个画风：但在开放研究领域里，苹果似乎一整个脱胎换骨，在纯粹的研究中经常会有一些出彩的工作。

10/26/2025 6:52:00 PM

机器之心

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。 Fast-dLLM v2 给出了一条务实路线：将预训练 AR 模型适配为适配为能并行解码的 Block-dLLM—— 且只需～1B tokens 量级的微调即可达到 “无损” 迁移，不必训练数百 B tokens（如 Dream 需～580B tokens）。在 A100/H100 上，它在保持精度的同时，将端到端吞吐显著拉高，最高可达 2.5×。

10/26/2025 6:48:00 PM

机器之心

深度拆解，硬核解构，揭开vLLM推理系统实现高效吞吐的秘籍

在大模型应用快速发展的今天，如何让推理变得更快、更高效，已经成为研究和产业界共同关注的焦点。 vLLM 便是在这样的背景下诞生的一套高性能推理框架。它专门针对大语言模型的推理优化，在保持模型准确性的同时，大幅提升了吞吐量与响应速度。

10/26/2025 6:40:00 PM

机器之心

Transformer 之父“叛逃”：我已经受够了 Transformer！警告：AI研究变得越来越窄，我们需要找到新的架构

编辑 | 听雨出品 | 51CTO技术栈（微信号：blog51cto）“我真的已经受够了 Transformer。 ”——这句话来自 Transformer 的共同作者、Sakana AI 联合创始人 Llion Jones。在旧金山 TED AI 大会上，这位被誉为“生成式 AI 时代奠基人”的研究者，突然“开炮”——不仅公开批评了整个 AI 行业的研究方向，还宣布自己已经“离开 Transformer”，开始寻找下一次重大突破。

10/26/2025 2:50:25 PM

听雨

破解AI对不同上下⽂位置的敏感度不⼀致，新框架使出“解铃还须系铃人”

Pos2Distill团队投稿. 量子位 | 公众号 QbitAI语言模型遭遇严重的位置偏见，即模型对不同上下⽂位置的敏感度不⼀致。模型倾向于过度关注输⼊序列中的特定位置，严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。

10/26/2025 12:15:35 PM

衡宇

P图老本事搭上了对话框，美图这AI Agent到底香不香？

梦瑶发自凹非寺. 量子位 | 公众号 QbitAI这些刷屏的AI图片，你刷到了没？就是那种——和自己专属emoji合影的黏土风照片，画风长这样：本来以为是NanoBanana整的新玩法，结果点开评论区一看：嗐，原来是美图自家的AI Agent——叫RoboNeo～.

10/26/2025 12:09:23 PM

衡宇

5个大疆离职员工，把3D打印带回风口

Jay 发自凹非寺量子位 | 公众号 QbitAI3D打印机，重新火了。上一次是概念，这一次是实实在在的日常产品。街头巷尾，越来越多的夜市摊位开始摆上3D打印出来的产品，龙蛋、关节龙、关节蛇成了新一代「地摊网红」。

10/26/2025 8:23:33 AM

Jay

Perplexity 重磅发布！7个章节深度解析全新AI浏览器Comet

作为一位体验设计师我很热衷于体验各类产品，早前OpenAI也发布了ChatGPT Atlas，可惜老三的电脑版本过低无法体验。看到Comet可以用时，让我兴奋不已，因为这是对"人与信息交互方式"这一本质问题的重新思考。更多相关干货：注：文末分享邀请链接，可注册登录免费领取一个月会员体验。

10/26/2025 1:42:06 AM

要爆炸的张老三

Yoshua Bengio，刚刚成为全球首个百万引用科学家！

刚刚，计算机科学家 Yoshua Bengio 创造了新的历史，成为 Google Scholar 上首个引用量超过 100 万的人！打个直观的比方，如果我们将每一篇引用论文打印成册（假设平均厚度为 1 毫米），然后将它们垂直堆叠起来，这座由知识构成的纸塔将高达 1000 米。这是什么概念？

10/25/2025 11:10:00 PM

机器之心

Anthropic、Thinking Machines Lab论文曝光：30万次压力测试揭示AI规范缺陷

即便是最详细的模型规范，也存在内部矛盾、粒度不足与解释歧义。现如今，LLM 正越来越多地受到模型规范的约束，这些规范为模型的行为准则与伦理边界提供了清晰定义。它们构成了 Constitutional AI（宪法式 AI）与 Deliberate Alignment（审慎对齐）的核心基础。

10/25/2025 11:05:00 PM

机器之心

让机器人「不仅会想，还能准确去做」，VLA-R1把「推理+行动」带进真实世界

在机器人与智能体领域，一个老大难问题是：当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时，它不仅要看懂环境，更要解释指令、规划路径 / 可操作区域，并把这些推理落实为准确的动作。目前，很多 VLA（Vision-Language-Action）模型仍倾向直接输出动作，缺乏对可供性（affordance）与轨迹（trajectory）几何关系的显式推理，一旦遇到颜色相近、目标重复或容器多选等场景，就容易出错。 VLA-R1 的目标，不仅把 “会想” 这步补上，而且通过强化学习进一步加强执行动作的准确性，让机器人解释清楚再去准确执行。

10/25/2025 11:02:00 PM

机器之心

NeurIPS 2025 | ARGRE框架实现高效LLM解毒：自回归奖励引导，安全对齐更快、更准、更轻

作者为北京航空航天大学的肖宜松，刘艾杉，应宗浩，刘祥龙，新加坡国立大学的梁思源，新加坡南洋理工大学的陶大程。本文已被 NeurIPS 2025 录用。 LLM 已在智能创作、企业服务等领域广泛应用，但其内容安全问题仍是落地过程中的关键挑战。

10/25/2025 10:54:00 PM

机器之心

「我受够了Transformer」：其作者Llion Jones称AI领域已僵化，正错失下一个突破

这两天，VentureBeat 一篇报道在 Hacker News 上引发热议。颠覆性论文《Attention is all you need》的作者之一，现任 Sakana AI CTO 的 Llion Jones 在近日的 TED AI 大会上表示他已经厌倦了 Transformer。是什么，让这位 Transformer 的创造者发出了如此言论？

10/25/2025 10:51:00 PM

机器之心

让VLM学会「心中有世界」：VAGEN用多轮RL把视觉智能变成「世界模型」推理机器

当今的 AI 智能体（Agent）越来越强大，尤其是像 VLM（视觉-语言模型）这样能「看懂」世界的智能体。但研究者发现一个大问题：相比于只处理文本的 LLM 智能体，VLM 智能体在面对复杂的视觉任务时，常常表现得像一个「莽撞的执行者」，而不是一个「深思熟虑的思考者」。它们为什么会这样？

10/25/2025 10:46:00 PM

机器之心

2025谷歌博士生奖学金揭晓，清华、科大、南大等校友入选

他们是正在塑造技术格局的人。本周四，谷歌公布了 2025 年度的博士奖学金入围名单。谷歌于 2009 年创建了博士奖学金计划（Google PhD Fellows），以表彰和支持在计算机科学及相关领域进行杰出研究的优秀研究生，培养专注于关键基础科学的下一代科学家。

10/25/2025 10:38:00 PM

机器之心

快手Klear团队提出CE-GPPO：通过梯度保留协调熵，解决强化学习中的熵不稳定问题

本研究由快手科技 Klear 语言大模型团队完成，核心作者苏振鹏，潘雷宇，吕民轩，胡文凭，张富峥，周国睿等。快手 Klear 语言大模型团队聚焦在基础语言大模型研发、Agent RL 等前沿技术创新等方向，积累务实的探索 AGI 的能力边界，并不断推进 AI 领域新技术和新产品的发展。此前，该团队已开源了 Klear-46B-A2.5B 和 Klear-Reasoner-8B 等模型，其中 Klear-Reasoner-8B 在数学和代码的基准测试上达到了同参数级别模型的 SOTA 效果。

10/25/2025 10:29:00 PM

机器之心

开源模型首次物理奥赛夺金！上海AI Lab 235B模型击败GPT5和Grok4

P1团队投稿量子位 | 公众号 QbitAI开源模型首次在国际物理奥林匹克竞赛夺金了。来自上海AI Lab的P1-235B-A22B取得了21.2分的成绩，成功跨越金牌线。在覆盖2024-2025年全球13场顶级物理竞赛的HiPhO基准测试中，P1-235B-A22B获12金1银，与谷歌Gemini-2.5-Pro并列奖牌榜第一。

10/25/2025 2:48:12 PM

梦晨

Cell子刊封面 | 统一虚拟筛选和活性优化，IDEA研究院等提出亲和力基础模型LigUnity

作者 | 论文团队编辑 | ScienceAI2025 年 10 月，一篇题为《Hierarchical affinity landscape navigation through learning a shared pocket-ligand space》的论文，作为封面文章发表于 Cell 旗下期刊《Patterns》。该研究由粤港澳大湾区数字经济研究院（IDEA）AI4Science 团队、晶泰科技（XtalPi）及华盛顿大学的研究团队联合攻关，成功开发了名为 LigUnity 的亲和力基础模型。论文地址：(25)00219-3?_returnURL=：：，更是一次范式级的革新 —— 它通过构建蛋白质与配体的共享表示空间，让 AI 统一学习并驾驭从大规模筛选到精细活性优化的完整药物发现流程。

10/24/2025 10:22:00 PM

ScienceAI

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评深度拆解！这可能是全网最详细的AI视频创作教程 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体 Gemini 马斯克 Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景 AI模型深度学习亚马逊架构 Transformer MCP 编程 Copilot 视觉