应用
700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理
Training Small, Thinking Big.大模型的推理架构颠覆的未免有些太快了。 今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。 HRM 仅包含 2700 万个参数(大约比最小的 Qwen3 0.6B 模型小 22 倍),仅使用 1000 个训练样本,便在复杂的推理任务上取得了卓越的性能。
10/9/2025 1:05:00 PM
机器之心
Qwen要入局机器人了:林俊旸官宣成立具身智能团队
已经成为开源模型领头羊的 Qwen,终于要开始入局机器人了。 昨天,阿里通义千问大语言模型负责人林俊旸在社交媒体上官宣,他们在 Qwen 内部组建了一个小型机器人、具身智能团队,旨在提供更强基座模型,同时表示「多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界」。 这一举动让关注 Qwen 的开发者兴奋不已。
10/9/2025 1:01:00 PM
机器之心
更大,还能更快,更准!蚂蚁开源万亿参数语言模型Ling-1T,刷新多项SOTA
Ling-1T给效率革命交了一份更贴近场景的答卷——万亿级储备,百亿级开销,产业级落地。 规模、速度与推理精度,其实可以兼顾。 完全测不过来了。
10/9/2025 11:03:00 AM
机器之心
教你用Lovart+Midjourney轻松批量输出分镜图!
嗨大家好! 我是阿真! 响应群友催更,今天我们来看点轻轻松松的,Lovart第三弹,分享关于Midjourney在Lovart工作流与其他模型批量输出分镜图的一些方法给大家。
10/9/2025 12:53:06 AM
阿真Irene
直播预告:光轮智能 × NVIDIA带来Sim2Real关键突破
允中 发自 凹非寺. 量子位 | 公众号 QbitAI光轮智能 × NVIDIA重磅直播即将开启! 双方将携手揭秘如何利用SimReady与AI打通Sim2Real(仿真到现实)。
10/8/2025 7:28:24 PM
衡宇
重磅|清华物理系传奇姚顺宇离职,不认同Anthropic,加入DeepMind
最新消息,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)离开 Anthropic,加入 Google DeepMind。 根据姚顺宇在博客上发表的文章得知,他于 9 月 19 日从 Anthropic 正式离职,9 月 29 日加入 Google DeepMind。 是的,不是姚顺雨,而是姚顺宇,前者是学计算机出身,也是著名的《AI 下半场》作者,而后者是学物理出身,且在本科期间就名声大噪。
10/8/2025 7:27:00 PM
机器之心
首个全自动AI科学家诞生!西湖大学最新成果:性能超越人类SOTA基线183.7%
DeepScientist团队 投稿. 量子位 | 公众号 QbitAI人类科学家三年的工作量,如今AI两周就能轻松搞定! 最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。
10/8/2025 7:24:27 PM
衡宇
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。
10/8/2025 7:20:00 PM
机器之心
30家Tokens吞金兽,每家烧光万亿Tokens!OpenAI最大客户名单曝光,多邻国上榜
Jay 发自 凹非寺量子位 | 公众号 QbitAI什么AI应用公司和方向是OpenAI看好的? 这不,OpenAI公布了30家Tokens消耗破万亿的“大金主”。 图中,黄色底代表初创公司,紫色底则是已实现规模化的企业,两者在榜单中几乎平分秋色。
10/8/2025 12:37:13 PM
Jay
另一位Yao Shunyu也跳槽了:与Anthropic价值观有根本分歧
衡宇 发自 麦蒿寺. 量子位 | 公众号 QbitAI另一位“尧舜禹”也转会了! 刚刚,谷歌DeepMind迎来一位新研究科学家,他叫姚顺宇——.
10/8/2025 12:29:53 PM
衡宇
AI黑话听不懂?收藏这份3分钟快速扫盲指南!
第一次进 AI 项目组开会,你可能会有这种体验:大家自信满满地聊着——“我们先优化下 RAG系统的延迟,再调人设,顺便做个 A/B test看看效果。 ”而你坐在角落里,内心 OS:别慌,这些所谓的“AI 黑话”,其实就是业内人习惯的专业术语。 听起来玄乎,其实拆开来都挺接地气。
10/8/2025 12:30:05 AM
MoeDesigner
2025诺贝尔物理学奖花落宏观量子隧穿:他们在实验中「造出」了薛定谔的猫
刚刚,本年度的诺贝尔物理学奖得主正式揭晓:美国加州大学 John Clarke、美国耶鲁大学 Michel H. Devoret、美国加州大学 John M. 获奖理由是「发现电路中的宏观量子力学隧穿和能量量子化」。
10/7/2025 8:08:00 PM
机器之心
DeepMind发布代码修复AI智能体CodeMender,实现「被动响应」与「主动防御」一体化
众所周知,开发者「苦软件漏洞久已」,即使使用模糊测试等传统的自动化方法,也难以发现和将其修复,且耗时耗力。 而在 AI 大行其道的当下,用 AI 来修复关键软件漏洞技术与产品也开始涌现,那么,如何才能使得 AI 修复安全代码是值得信任的,答案在于「通过严格的验证」。 近日,DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender,它使用 Gemini Deep Think 自动修补关键软件漏洞。
10/7/2025 8:04:00 PM
机器之心
2025诺贝尔物理学奖颁给了谷歌量子计算机打造者
西风 闻乐 发自 凹非寺. 量子位 | 公众号 QbitAI刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H.
10/7/2025 7:27:11 PM
闻乐
ChatGPT内嵌App!OpenAI开发者日全览,Agent工具链+应用生态+模型API多箭齐发
西风 发自 凹非寺. 量子位 | 公众号 QbitAIOpenAI开发者日2025,新品发布密度远超往年。 奥特曼带着一系列最新内容来了——.
10/7/2025 12:50:17 PM
西风
刚刚,OpenAI开发者大会重磅发布:AgentKit、Codex正式版、Apps SDK与Sora 2 API
OpenAI 今年的开发者大会(OpenAI DevDay 2025)正在进行中。 Keynote 一开场,山姆・奥特曼便分享了 OpenAI 这两年取得的成绩:400 万开发者、8 亿周活 ChatGPT 用户、API 每分钟 60 亿 token 消耗量。 更重要的是,OpenAI 在今年的开发者大会上可真是发布了不少东西,简单总结起来包括:AgentKit、Codex 正式版、ChatGPT 内置应用与 Apps SDK、gpt-realtime-mini、gpt-image-1-mini、Sora 2 API、GPT-5 pro API。
10/7/2025 10:16:00 AM
机器之心
用四大章节,总结AI智能体交互设计的高频问题
过去一年里我带领我的 UI 小伙伴深耕 AI agent 领域,在人机对话的细节里摸爬滚打,攒下了一些带实战温度的 EXP,趁着有更新的热情分享给大家。 和传统交互不同,AI 智能体的设计处处藏着 “反常识” 的坑:精心设计的表单,使用体验却很割裂;花心思做的图文混排卡片,反而让对话逻辑变得混乱;自以为贴心的预输入提示词,要么被用户忽略,要么限制了真实需求的表达……. 今天我把这些踩过的坑拆解成具体场景 ,希望这些经验能帮 UI 小伙伴少走些弯路,毕竟让 AI 智能体真正 “懂用户、好用、不添乱”,需要在一次次的试错里摸索出更清晰的解决方案。
10/7/2025 12:37:21 AM
MoeDesigner
苹果再发论文:精准定位LLM幻觉,GPT-5、o3都办不到
苹果这几天真是进入了论文高产期,时不时就有新的研究发布出来。 就在近日,苹果又发布了一篇引发学界与业界关注的重磅论文。 这篇论文非常有意思,它用强化学习训练模型,让模型能够准确标出答案中哪些部分是幻觉(hallucinated)。
10/6/2025 6:34:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测