AI在线 AI在线

资讯列表

化学反应的「全景地图」来了,机器人帮科学家导航高维实验空间

编辑丨&不知道诸位读者在做实验的时候是否经历过一些玄学——明明步骤都是一样的,但就是因为某些奇异的问题,导致实验无法顺利进行下去。 人类化学家只能探索这些流形的一个有限子集,对反应超空间的理解仍然是零碎的 。 产率分布是平滑还是波状?
10/9/2025 4:35:00 PM
ScienceAI

OpenAI奥特曼认错:我天生不适合管理公司

OpenAI最近的动作属实让人眼花缭乱了! 一边是火爆出圈的Sora 2,另一边是各种引人注目的投资合作(入股AMD、获得英伟达千亿美元投资等等),而且还在几天前的开发者日上发布了一大堆新品。 人们不禁要问了,OpenAI这是要干啥?
10/9/2025 3:18:09 PM
一水

阿里亲身入局具身智能!Qwen内部组团,通义千问技术负责人带队

衡宇 发自 凹非寺. 量子位 | 公众号 QbitAIQwen团队内部组建了一个全新的具身智能小分队! 这一消息由通义千问技术负责人林俊旸(Justin Lin)在上对外公开。
10/9/2025 3:17:37 PM
衡宇

VaseVQA:古希腊陶器多模态智能体与基准测试平台

我们构建了VaseVQA,一个专注于古希腊陶器的大规模视觉问答数据集。 在该数据集上对多模态大语言模型(MLLMs)进行fine-tuning,我们采用SFT-then-RL的训练范式,并提出“诊断式”奖励机制,将SFT评估结果转为监督信号,以弥补MLLMs在薄弱任务类型上的推理能力缺陷。 ,文化遗产领域仍然缺乏专门的数据集。
10/9/2025 2:51:00 PM
新闻资讯

更高智商更快思考!蚂蚁开源最新万亿语言模型,多项复杂推理SOTA

时令 发自 凹非寺. 量子位 | 公众号 QbitAI又一个万亿参数级国产模型开源了! 就在刚刚,蚂蚁正式发布百灵大模型的第一款旗舰模型——.
10/9/2025 2:48:22 PM
时令

黄仁勋回应AMD送股OpenAI:很高明的交易,OpenAI没钱给我付账

梦晨 发自 凹非寺量子位 | 公众号 QbitAI黄仁勋出面回应竞争对手的大动作了。 面对AMD拿出公司10%股权换取OpenAI订单的操作,老黄接连用了两次“惊讶”(surprised/suprising)这个词,还称这招”挺高明的”(it’s clever)。 考虑到他们对下一代产品如此兴奋,这真是富有想象力、独一无二、令人惊讶。
10/9/2025 1:43:48 PM
梦晨

备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度

闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI备受Meta审核规定“折磨”,依旧猛发论文! 表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。
10/9/2025 1:23:39 PM
闻乐

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

Training Small, Thinking Big.大模型的推理架构颠覆的未免有些太快了。 今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。 HRM 仅包含 2700 万个参数(大约比最小的 Qwen3 0.6B 模型小 22 倍),仅使用 1000 个训练样本,便在复杂的推理任务上取得了卓越的性能。
10/9/2025 1:05:00 PM
机器之心

Qwen要入局机器人了:林俊旸官宣成立具身智能团队

已经成为开源模型领头羊的 Qwen,终于要开始入局机器人了。 昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,旨在提供更强基座模型,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。 这一举动让关注 Qwen 的开发者兴奋不已。
10/9/2025 1:01:00 PM
机器之心

NeurIPS 2025 Spotlight | 只需一条演示,DexFlyWheel框架让机器人学会「自我造数据」

当我们谈论机器人灵巧操作时,数据稀缺始终是悬浮在头顶的达摩克利斯之剑。 在大模型、自动驾驶领域纷纷依靠海量数据 “涌现” 出强大能力的今天,机器人灵巧操作依然困在数据瓶颈。 近期,北京大学、哈尔滨工业大学联合 PsiBot 灵初智能提出首个自我增强的灵巧操作数据生成框架 ——DexFlyWheel。
10/9/2025 12:59:00 PM
机器之心

更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA

Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。 规模、速度与推理精度,其实可以兼顾。 完全测不过来了。
10/9/2025 11:03:00 AM
机器之心

听说,大家都在梭后训练?最佳指南来了

LLM 后训练最佳入门介绍。 在大模型时代,Scaling Law 一度是 AI 领域公认的准则:只要堆更多数据、参数、算力,模型能力就会持续增长。 GPT-3、PaLM 等的成功,几乎都是这种策略的胜利。
10/9/2025 10:56:00 AM
机器之心

机器人「看片」自学新技能:NovaFlow从生成视频中提取动作流,实现零样本操控

本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。 通讯作者付佳慧在 Robotics and AI Institute 任研究员,博士毕业于麻省理工学院。 George Konidaris 为布朗大学副教授。
10/9/2025 10:45:00 AM
机器之心

Being-VL的视觉BPE路线:把「看」和「说」真正统一起来

在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就更易出现幻觉。 根本原因之一,是在文本空间对齐之前,原生视觉结构已被不可逆地压缩 / 丢失,而语言模型不得不「二次解码」来自他模态的 embedding,导致对齐脆弱、推理链条变长。 为此,北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。
10/9/2025 10:40:00 AM
机器之心

教你用Lovart+Midjourney轻松批量输出分镜图!

嗨大家好! 我是阿真! 响应群友催更,今天我们来看点轻轻松松的,Lovart第三弹,分享关于Midjourney在Lovart工作流与其他模型批量输出分镜图的一些方法给大家。
10/9/2025 12:53:06 AM
阿真Irene

直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破

允中 发自 凹非寺. 量子位 | 公众号 QbitAI光轮智能 × NVIDIA重磅直播即将开启! 双方将携手揭秘如何利用SimReady与AI打通Sim2Real(仿真到现实)。
10/8/2025 7:28:24 PM
衡宇

重磅|清华物理系传奇姚顺宇离职,不认同Anthropic,加入DeepMind

最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。 根据姚顺宇在博客上发表的文章得知,他于 9 月 19 日从 Anthropic 正式离职,9 月 29 日加入 Google DeepMind。 是的,不是姚顺雨,而是姚顺宇,前者是学计算机出身,也是著名的《AI 下半场》作者,而后者是学物理出身,且在本科期间就名声大噪。
10/8/2025 7:27:00 PM
机器之心

谷歌大神出手,免费发布《智能体设计模式》,AI Agent开发的终极秘籍

当前,AI 领域最火热的浪潮无疑是 AI Agent(智能体)。 从科技巨头到创业公司,无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。 然而,在这股「淘金热」的背后,开发者们也面临着巨大的挑战:如何系统性地设计智能体的行为?
10/8/2025 7:26:00 PM
机器之心