资讯列表
黄仁勋回应AMD送股OpenAI:很高明的交易,OpenAI没钱给我付账
梦晨 发自 凹非寺量子位 | 公众号 QbitAI黄仁勋出面回应竞争对手的大动作了。 面对AMD拿出公司10%股权换取OpenAI订单的操作,老黄接连用了两次“惊讶”(surprised/suprising)这个词,还称这招”挺高明的”(it’s clever)。 考虑到他们对下一代产品如此兴奋,这真是富有想象力、独一无二、令人惊讶。
10/9/2025 1:43:48 PM
梦晨
备受Meta折磨,LeCun依旧猛发论文!新作:JEPAs不只学特征,还能精准感知数据密度
闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI备受Meta审核规定“折磨”,依旧猛发论文! 表示可能要辞职的LeCun带着最新研究来了,仍然和三位FAIR同事合作。
10/9/2025 1:23:39 PM
闻乐
700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理
Training Small, Thinking Big.大模型的推理架构颠覆的未免有些太快了。 今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。 HRM 仅包含 2700 万个参数(大约比最小的 Qwen3 0.6B 模型小 22 倍),仅使用 1000 个训练样本,便在复杂的推理任务上取得了卓越的性能。
10/9/2025 1:05:00 PM
机器之心
Qwen要入局机器人了:林俊旸官宣成立具身智能团队
已经成为开源模型领头羊的 Qwen,终于要开始入局机器人了。 昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,旨在提供更强基座模型,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。 这一举动让关注 Qwen 的开发者兴奋不已。
10/9/2025 1:01:00 PM
机器之心
NeurIPS 2025 Spotlight | 只需一条演示,DexFlyWheel框架让机器人学会「自我造数据」
当我们谈论机器人灵巧操作时,数据稀缺始终是悬浮在头顶的达摩克利斯之剑。 在大模型、自动驾驶领域纷纷依靠海量数据 “涌现” 出强大能力的今天,机器人灵巧操作依然困在数据瓶颈。 近期,北京大学、哈尔滨工业大学联合 PsiBot 灵初智能提出首个自我增强的灵巧操作数据生成框架 ——DexFlyWheel。
10/9/2025 12:59:00 PM
机器之心
更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA
Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。 规模、速度与推理精度,其实可以兼顾。 完全测不过来了。
10/9/2025 11:03:00 AM
机器之心
听说,大家都在梭后训练?最佳指南来了
LLM 后训练最佳入门介绍。 在大模型时代,Scaling Law 一度是 AI 领域公认的准则:只要堆更多数据、参数、算力,模型能力就会持续增长。 GPT-3、PaLM 等的成功,几乎都是这种策略的胜利。
10/9/2025 10:56:00 AM
机器之心
机器人「看片」自学新技能:NovaFlow从生成视频中提取动作流,实现零样本操控
本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。 通讯作者付佳慧在 Robotics and AI Institute 任研究员,博士毕业于麻省理工学院。 George Konidaris 为布朗大学副教授。
10/9/2025 10:45:00 AM
机器之心
Being-VL的视觉BPE路线:把「看」和「说」真正统一起来
在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就更易出现幻觉。 根本原因之一,是在文本空间对齐之前,原生视觉结构已被不可逆地压缩 / 丢失,而语言模型不得不「二次解码」来自他模态的 embedding,导致对齐脆弱、推理链条变长。 为此,北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。
10/9/2025 10:40:00 AM
机器之心
教你用Lovart+Midjourney轻松批量输出分镜图!
嗨大家好! 我是阿真! 响应群友催更,今天我们来看点轻轻松松的,Lovart第三弹,分享关于Midjourney在Lovart工作流与其他模型批量输出分镜图的一些方法给大家。
10/9/2025 12:53:06 AM
阿真Irene
直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破
允中 发自 凹非寺. 量子位 | 公众号 QbitAI光轮智能 × NVIDIA重磅直播即将开启! 双方将携手揭秘如何利用SimReady与AI打通Sim2Real(仿真到现实)。
10/8/2025 7:28:24 PM
衡宇
重磅|清华物理系传奇姚顺宇离职,不认同Anthropic,加入DeepMind
最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。 根据姚顺宇在博客上发表的文章得知,他于 9 月 19 日从 Anthropic 正式离职,9 月 29 日加入 Google DeepMind。 是的,不是姚顺雨,而是姚顺宇,前者是学计算机出身,也是著名的《AI 下半场》作者,而后者是学物理出身,且在本科期间就名声大噪。
10/8/2025 7:27:00 PM
机器之心
谷歌大神出手,免费发布《智能体设计模式》,AI Agent开发的终极秘籍
当前,AI 领域最火热的浪潮无疑是 AI Agent(智能体)。 从科技巨头到创业公司,无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。 然而,在这股「淘金热」的背后,开发者们也面临着巨大的挑战:如何系统性地设计智能体的行为?
10/8/2025 7:26:00 PM
机器之心
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
DeepScientist团队 投稿. 量子位 | 公众号 QbitAI人类科学家三年的工作量,如今AI两周就能轻松搞定! 最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。
10/8/2025 7:24:27 PM
衡宇
开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题
AI 时代,智能体对短期对话的处理能力已不再是难题。 真正的挑战是让智能体在数百步的探索中依然保持清晰的推理与稳健的决策。 传统的强化学习框架在几十步内尚能应付,但一旦任务延展至数百步,奖励稀疏、历史冗长、策略崩塌便接踵而至。
10/8/2025 7:23:00 PM
机器之心
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。
10/8/2025 7:20:00 PM
机器之心
直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了
作者 | 论文团队编辑 | ScienceAI面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。 来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。 论文:::::覆盖更广:统一 I/O 与「任务分组奖励」让单一骨干跨化学 / 生命 / 材料等多领域;可验证性更强:从数据标注到思维链再到 RL 奖励全面「科学化」,强调度量统一与工具可复核;工程更到位:明确的数据配比、训练日程与算力规模,保证性能与可复现性。
10/8/2025 3:18:00 PM
ScienceAI
30家Tokens吞金兽,每家烧光万亿Tokens!OpenAI最大客户名单曝光,多邻国上榜
Jay 发自 凹非寺量子位 | 公众号 QbitAI什么AI应用公司和方向是OpenAI看好的? 这不,OpenAI公布了30家Tokens消耗破万亿的“大金主”。 图中,黄色底代表初创公司,紫色底则是已实现规模化的企业,两者在榜单中几乎平分秋色。
10/8/2025 12:37:13 PM
Jay