资讯列表
更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA
Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。 规模、速度与推理精度,其实可以兼顾。 完全测不过来了。
10/9/2025 11:03:00 AM
机器之心
听说,大家都在梭后训练?最佳指南来了
LLM 后训练最佳入门介绍。 在大模型时代,Scaling Law 一度是 AI 领域公认的准则:只要堆更多数据、参数、算力,模型能力就会持续增长。 GPT-3、PaLM 等的成功,几乎都是这种策略的胜利。
10/9/2025 10:56:00 AM
机器之心
机器人「看片」自学新技能:NovaFlow从生成视频中提取动作流,实现零样本操控
本文共同第一作者为李鸿宇(布朗大学博士生)和孙凌峰(Robotics and AI Institute 研究员,博士毕业于加州大学伯克利分校)。 通讯作者付佳慧在 Robotics and AI Institute 任研究员,博士毕业于麻省理工学院。 George Konidaris 为布朗大学副教授。
10/9/2025 10:45:00 AM
机器之心
Being-VL的视觉BPE路线:把「看」和「说」真正统一起来
在多模态模型里,CLIP-style encoder 往往把视觉表征过早地拉近到文本空间:对于抽象层面的问答,如总结图片大致内容,这样的表征其实是没有什么问题的,但一旦追问与语言无强依赖的细节,模型就更易出现幻觉。 根本原因之一,是在文本空间对齐之前,原生视觉结构已被不可逆地压缩 / 丢失,而语言模型不得不「二次解码」来自他模态的 embedding,导致对齐脆弱、推理链条变长。 为此,北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。
10/9/2025 10:40:00 AM
机器之心
教你用Lovart+Midjourney轻松批量输出分镜图!
嗨大家好! 我是阿真! 响应群友催更,今天我们来看点轻轻松松的,Lovart第三弹,分享关于Midjourney在Lovart工作流与其他模型批量输出分镜图的一些方法给大家。
10/9/2025 12:53:06 AM
阿真Irene
直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破
允中 发自 凹非寺. 量子位 | 公众号 QbitAI光轮智能 × NVIDIA重磅直播即将开启! 双方将携手揭秘如何利用SimReady与AI打通Sim2Real(仿真到现实)。
10/8/2025 7:28:24 PM
衡宇
重磅|清华物理系传奇姚顺宇离职,不认同Anthropic,加入DeepMind
最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。 根据姚顺宇在博客上发表的文章得知,他于 9 月 19 日从 Anthropic 正式离职,9 月 29 日加入 Google DeepMind。 是的,不是姚顺雨,而是姚顺宇,前者是学计算机出身,也是著名的《AI 下半场》作者,而后者是学物理出身,且在本科期间就名声大噪。
10/8/2025 7:27:00 PM
机器之心
谷歌大神出手,免费发布《智能体设计模式》,AI Agent开发的终极秘籍
当前,AI 领域最火热的浪潮无疑是 AI Agent(智能体)。 从科技巨头到创业公司,无数开发者正投身于构建能够自主理解、规划和执行复杂任务的智能系统。 然而,在这股「淘金热」的背后,开发者们也面临着巨大的挑战:如何系统性地设计智能体的行为?
10/8/2025 7:26:00 PM
机器之心
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
DeepScientist团队 投稿. 量子位 | 公众号 QbitAI人类科学家三年的工作量,如今AI两周就能轻松搞定! 最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。
10/8/2025 7:24:27 PM
衡宇
开源RL框架Verlog来了,专为LLM智能体打造,400回合不成问题
AI 时代,智能体对短期对话的处理能力已不再是难题。 真正的挑战是让智能体在数百步的探索中依然保持清晰的推理与稳健的决策。 传统的强化学习框架在几十步内尚能应付,但一旦任务延展至数百步,奖励稀疏、历史冗长、策略崩塌便接踵而至。
10/8/2025 7:23:00 PM
机器之心
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。
10/8/2025 7:20:00 PM
机器之心
直击科学计算与设计痛点,跨学科推理统一基座模型SciReasoner来了
作者 | 论文团队编辑 | ScienceAI面对多模态、跨尺度、强约束的科研问题,通用 LLM 正从「工具」升级为「合作者」。 来自上海人工智能实验室等机构的研究团队提出了一款为科学数据「读 — 思 — 设」而生的统一科学基座模型:以更完整的科学数据基座、更系统的训练日程与更可验证的推理机制,直击科学计算与设计痛点。 论文:::::覆盖更广:统一 I/O 与「任务分组奖励」让单一骨干跨化学 / 生命 / 材料等多领域;可验证性更强:从数据标注到思维链再到 RL 奖励全面「科学化」,强调度量统一与工具可复核;工程更到位:明确的数据配比、训练日程与算力规模,保证性能与可复现性。
10/8/2025 3:18:00 PM
ScienceAI
30家Tokens吞金兽,每家烧光万亿Tokens!OpenAI最大客户名单曝光,多邻国上榜
Jay 发自 凹非寺量子位 | 公众号 QbitAI什么AI应用公司和方向是OpenAI看好的? 这不,OpenAI公布了30家Tokens消耗破万亿的“大金主”。 图中,黄色底代表初创公司,紫色底则是已实现规模化的企业,两者在榜单中几乎平分秋色。
10/8/2025 12:37:13 PM
Jay
另一位Yao Shunyu也跳槽了:与Anthropic价值观有根本分歧
衡宇 发自 麦蒿寺. 量子位 | 公众号 QbitAI另一位“尧舜禹”也转会了! 刚刚,谷歌DeepMind迎来一位新研究科学家,他叫姚顺宇——.
10/8/2025 12:29:53 PM
衡宇
AI黑话听不懂?收藏这份3分钟快速扫盲指南!
第一次进 AI 项目组开会,你可能会有这种体验:大家自信满满地聊着——“我们先优化下 RAG系统的延迟,再调人设,顺便做个 A/B test看看效果。 ”而你坐在角落里,内心 OS:别慌,这些所谓的“AI 黑话”,其实就是业内人习惯的专业术语。 听起来玄乎,其实拆开来都挺接地气。
10/8/2025 12:30:05 AM
MoeDesigner
2025诺贝尔物理学奖花落宏观量子隧穿:他们在实验中「造出」了薛定谔的猫
刚刚,本年度的诺贝尔物理学奖得主正式揭晓:美国加州大学 John Clarke、美国耶鲁大学 Michel H. Devoret、美国加州大学 John M. 获奖理由是「发现电路中的宏观量子力学隧穿和能量量子化」。
10/7/2025 8:08:00 PM
机器之心
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化
众所周知,开发者「苦软件漏洞久已」,即使使用模糊测试等传统的自动化方法,也难以发现和将其修复,且耗时耗力。 而在 AI 大行其道的当下,用 AI 来修复关键软件漏洞技术与产品也开始涌现,那么,如何才能使得 AI 修复安全代码是值得信任的,答案在于「通过严格的验证」。 近日,DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender,它使用 Gemini Deep Think 自动修补关键软件漏洞。
10/7/2025 8:04:00 PM
机器之心
田渊栋与Russell团队联手,证明Transformer能在训练中自然学会叠加推理
对于大型语言模型而言,生成更长、更复杂的推理链,往往意味着巨大的计算成本。 为了解决这一难题,田渊栋团队在 2024 年提出的「连续思维链」 (Coconut) 提供了一种全新的范式,它将推理轨迹保留在连续的隐空间中,而非离散的文字符号。 现在,他们与 Stuart Russell 团队的最新合作研究则从理论上回答了一个核心问题:这种高效的推理范式是如何在训练中自发产生的?
10/7/2025 7:37:00 PM
机器之心