资讯列表

分类

标签

化学反应的「全景地图」来了，机器人帮科学家导航高维实验空间

编辑丨&不知道诸位读者在做实验的时候是否经历过一些玄学——明明步骤都是一样的，但就是因为某些奇异的问题，导致实验无法顺利进行下去。人类化学家只能探索这些流形的一个有限子集，对反应超空间的理解仍然是零碎的。产率分布是平滑还是波状？

10/9/2025 4:35:00 PM

ScienceAI

OpenAI奥特曼认错：我天生不适合管理公司

OpenAI最近的动作属实让人眼花缭乱了！一边是火爆出圈的Sora 2，另一边是各种引人注目的投资合作（入股AMD、获得英伟达千亿美元投资等等），而且还在几天前的开发者日上发布了一大堆新品。人们不禁要问了，OpenAI这是要干啥？

10/9/2025 3:18:09 PM

一水

阿里亲身入局具身智能！Qwen内部组团，通义千问技术负责人带队

衡宇发自凹非寺. 量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具身智能小分队！这一消息由通义千问技术负责人林俊旸（Justin Lin）在上对外公开。

10/9/2025 3:17:37 PM

衡宇

VaseVQA：古希腊陶器多模态智能体与基准测试平台

我们构建了VaseVQA，一个专注于古希腊陶器的大规模视觉问答数据集。在该数据集上对多模态大语言模型（MLLMs）进行fine-tuning，我们采用SFT-then-RL的训练范式，并提出“诊断式”奖励机制，将SFT评估结果转为监督信号，以弥补MLLMs在薄弱任务类型上的推理能力缺陷。，文化遗产领域仍然缺乏专门的数据集。

10/9/2025 2:51:00 PM

新闻资讯

更高智商更快思考！蚂蚁开源最新万亿语言模型，多项复杂推理SOTA

时令发自凹非寺. 量子位 | 公众号 QbitAI又一个万亿参数级国产模型开源了！就在刚刚，蚂蚁正式发布百灵大模型的第一款旗舰模型——.

10/9/2025 2:48:22 PM

时令

黄仁勋回应AMD送股OpenAI：很高明的交易，OpenAI没钱给我付账

梦晨发自凹非寺量子位 | 公众号 QbitAI黄仁勋出面回应竞争对手的大动作了。面对AMD拿出公司10%股权换取OpenAI订单的操作，老黄接连用了两次“惊讶”（surprised/suprising）这个词，还称这招”挺高明的”（it’s clever）。考虑到他们对下一代产品如此兴奋，这真是富有想象力、独一无二、令人惊讶。

10/9/2025 1:43:48 PM

梦晨

备受Meta折磨，LeCun依旧猛发论文！新作：JEPAs不只学特征，还能精准感知数据密度

闻乐发自凹非寺. 量子位 | 公众号 QbitAI备受Meta审核规定“折磨”，依旧猛发论文！表示可能要辞职的LeCun带着最新研究来了，仍然和三位FAIR同事合作。

10/9/2025 1:23:39 PM

闻乐

700万参数击败DeepSeek R1等，三星一人独作爆火，用递归颠覆大模型推理

Training Small, Thinking Big.大模型的推理架构颠覆的未免有些太快了。今年 6 月，来自 Sapient Intelligence 的研究者提出了分层推理模型（HRM），用循环架构打破了传统思维链（CoT）的架构限制，对大模型推理结构产生了重大的影响。 HRM 仅包含 2700 万个参数（大约比最小的 Qwen3 0.6B 模型小 22 倍），仅使用 1000 个训练样本，便在复杂的推理任务上取得了卓越的性能。

10/9/2025 1:05:00 PM

机器之心

Qwen要入局机器人了：林俊旸官宣成立具身智能团队

已经成为开源模型领头羊的 Qwen，终于要开始入局机器人了。昨天，阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣，他们在 Qwen 内部组建了一个小型机器人、具身智能团队，旨在提供更强基座模型，同时表示「多模态基础模型正转变为基础智能体，这些智能体可以利用工具和记忆通过强化学习进行长程推理，它们绝对应该从虚拟世界走向物理世界」。这一举动让关注 Qwen 的开发者兴奋不已。

10/9/2025 1:01:00 PM

机器之心

NeurIPS 2025 Spotlight | 只需一条演示，DexFlyWheel框架让机器人学会「自我造数据」

当我们谈论机器人灵巧操作时，数据稀缺始终是悬浮在头顶的达摩克利斯之剑。在大模型、自动驾驶领域纷纷依靠海量数据 “涌现” 出强大能力的今天，机器人灵巧操作依然困在数据瓶颈。近期，北京大学、哈尔滨工业大学联合 PsiBot 灵初智能提出首个自我增强的灵巧操作数据生成框架 ——DexFlyWheel。

10/9/2025 12:59:00 PM

机器之心

更大，还能更快，更准！蚂蚁开源万亿参数语言模型Ling-1T，刷新多项SOTA

Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备，百亿级开销，产业级落地。规模、速度与推理精度，其实可以兼顾。完全测不过来了。

10/9/2025 11:03:00 AM

机器之心

听说，大家都在梭后训练？最佳指南来了

LLM 后训练最佳入门介绍。在大模型时代，Scaling Law 一度是 AI 领域公认的准则：只要堆更多数据、参数、算力，模型能力就会持续增长。 GPT-3、PaLM 等的成功，几乎都是这种策略的胜利。

10/9/2025 10:56:00 AM

机器之心

机器人「看片」自学新技能：NovaFlow从生成视频中提取动作流，实现零样本操控

本文共同第一作者为李鸿宇（布朗大学博士生）和孙凌峰（Robotics and AI Institute 研究员，博士毕业于加州大学伯克利分校）。通讯作者付佳慧在 Robotics and AI Institute 任研究员，博士毕业于麻省理工学院。 George Konidaris 为布朗大学副教授。

10/9/2025 10:45:00 AM

机器之心

Being-VL的视觉BPE路线：把「看」和「说」真正统一起来

在多模态模型里，CLIP-style encoder 往往把视觉表征过早地拉近到文本空间：对于抽象层面的问答，如总结图片大致内容，这样的表征其实是没有什么问题的，但一旦追问与语言无强依赖的细节，模型就更易出现幻觉。根本原因之一，是在文本空间对齐之前，原生视觉结构已被不可逆地压缩 / 丢失，而语言模型不得不「二次解码」来自他模态的 embedding，导致对齐脆弱、推理链条变长。为此，北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。

10/9/2025 10:40:00 AM

机器之心

教你用Lovart+Midjourney轻松批量输出分镜图！

嗨大家好！我是阿真！响应群友催更，今天我们来看点轻轻松松的，Lovart第三弹，分享关于Midjourney在Lovart工作流与其他模型批量输出分镜图的一些方法给大家。

10/9/2025 12:53:06 AM

阿真Irene

直播预告：光轮智能 × NVIDIA带来Sim2Real关键突破

允中发自凹非寺. 量子位 | 公众号 QbitAI光轮智能 × NVIDIA重磅直播即将开启！双方将携手揭秘如何利用SimReady与AI打通Sim2Real（仿真到现实）。

10/8/2025 7:28:24 PM

衡宇

重磅｜清华物理系传奇姚顺宇离职，不认同Anthropic，加入DeepMind

最新消息，清华物理系传奇特奖得主 Yao Shunyu（姚顺宇）离开 Anthropic，加入 Google DeepMind。根据姚顺宇在博客上发表的文章得知，他于 9 月 19 日从 Anthropic 正式离职，9 月 29 日加入 Google DeepMind。是的，不是姚顺雨，而是姚顺宇，前者是学计算机出身，也是著名的《AI 下半场》作者，而后者是学物理出身，且在本科期间就名声大噪。

10/8/2025 7:27:00 PM

机器之心

谷歌大神出手，免费发布《智能体设计模式》，AI Agent开发的终极秘籍

当前，AI 领域最火热的浪潮无疑是 AI Agent（智能体）。从科技巨头到创业公司，无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。然而，在这股「淘金热」的背后，开发者们也面临着巨大的挑战：如何系统性地设计智能体的行为？

10/8/2025 7:26:00 PM

机器之心

资讯热榜

看完刘润年度演讲，教你做好AI时代的能力迁徙！谷歌流量显著下降，People Inc. 与微软达成 AI 内容授权协议中国华电发布 “华电智” 大模型，能源管理进入智能新时代蚂蚁数科发布多语种视觉大模型训练框架，打破语言壁垒！苹果Siri将大变样！付费请谷歌助力AI升级黑客新手法：利用 OpenAI API 创建 “隐形” 后门恶意软件后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）谷歌推出新款 Vertex AI 代理构建工具，助力企业智能化

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 亚马逊编程视觉 Transformer AI模型预测特斯拉 MCP