具身智能
智元发布第二代一体化具身大小脑系统 GenieReasoner,推理能力达 SOTA
AI在线 1 月 1 日消息,智元具身研究中心今日宣布推出第二代一体化具身大小脑系统 GenieReasoner。 针对 VLA 模型中语义推理与动作控制的模态对齐难题,智元具身研究中心提出了一种支持统一离散化预训练的模型架构,并通过流匹配(Flow-matching)缓解了传统离散 Tokenizer 的动作精度瓶颈。 同时具身研究中心开源了 ERIQ-聚焦于真机操控全流程的具身推理评测基准,用以解耦量化评估 VLA 中具身大脑不同维度的推理能力。
苏州乐享发布具身智能品牌“元点智能”,全尺寸机器人原型首度亮相
今日,苏州乐享智能科技有限公司(以下简称“乐享科技”)正式发布全新具身智能品牌**“元点智能(Zeroth)”。 伴随品牌TVC的发布,其首个全尺寸大人形机器人原型**也揭开了神秘面纱,标志着公司正式进入通用机器人研发的新阶段。 多元矩阵:从户外探索到家庭陪伴随着全尺寸机器人的加入,元点智能已初步构建起覆盖全场景的产品矩阵:户外领域(W1): 履带式机器人,适配复杂地形。
微分智飞高飞:我们正处于通用飞行智能爆发前夜丨GAIR 2025
过去两年,具身智能的火热源于一个共同期待:大语言模型的出色能力有目共睹,若将其接入机器人,有望赋予机器人更聪明的大脑,从而为行业打开新空间。 然而热闹两年后,具身智能仍没有标准答案,却出现了很多细分领域,智能飞行机器人就是其中一个重要分支。 浙江大学控制学院长聘副教授、博士生导师高飞,就是这个领域的一位非常优秀的年轻学者。
对话微分智飞高飞:看具身智能如何引发飞行认知革命 | GAIR 2025
作者丨齐铖湧编辑丨马晓宁本文整理自高飞与AI科技评论的对话:01传统无人机和飞行具身智能AI科技评论:您提出“飞行具身智能”这一概念,它与传统的无人机智能有何本质区别? 高飞:具身智能的本质是“智能机器人”,赋予各种机器人认知、推理和泛化决策的能力,对于飞行也不例外,将会重新定义飞行机器人。 拿操作类的机器人打比方,双臂具身智能和传统工业机械臂的本体很相似,甚至可能完全长得一样,但双臂具身智能具备几个关键能力:泛化通用、自主决策。
三维空间太难懂?RoboTracer让机器人理解复杂空间指令,推理3D空间轨迹,开放世界也能精确行动
本文的主要作者来自北京航空航天大学、北京大学、北京智源人工智能研究院和中科院自动化研究所。 本文的第一作者为北京航空航天大学博士生周恩申,主要研究方向为具身智能和多模态大模型。 本文的共一作者兼项目负责人为北京智源研究院研究员迟程。
全异构、全异步的RLinf v0.2尝鲜版发布,支持真机强化学习,像使用GPU一样使用你的机器人!
在具身智能领域,特别是如何构造一个高泛化性的 VLA,数据之争一直存在:仿真数据 vs 真机数据。 数据来源不同,导致算法设计迥然不同,进一步对系统设计提出了更多的要求。 做 infra 的目标是做好服务,支持不同技术路线的探索。
智能体如何学会「想象」?深度解析世界模型嵌入具身系统的三大技术范式
长期以来,具身智能系统主要依赖「感知 - 行动」的反应式回路,缺乏对未来的预测能力。 而世界模型的引入,让智能体拥有了「想象」未来的能力。 具身智能机器人通过世界模型想象抓杯子任务那么关键问题来了:世界模型应该如何「放进」具身系统中?
造硬件造数据:诺亦腾机器人完成 Pre-A+ 轮融资,加速攻克具身智能数据荒
具身智能与人形机器人数据服务商**诺亦腾机器人(Noitom Robotics)**近日宣布完成 Pre-A 轮融资。 本轮融资由启明创投领投,五源资本、君联资本等机构参投,经纬创投、英诺天使基金追加投资,最终实现超额认购。 本轮融资后,加上此前由阿尔法公社领投的 Pre-A 轮,诺亦腾机器人累计募集资金已达数亿元人民币。
国内首个国标 VLA 大模型开源!北京人形 XR-1让机器人真正“会干活”
国内具身智能领域在12月18日迎来重大突破:北京人形机器人创新中心宣布正式开源具身 VLA 大模型 XR-1。 这是国内首个、也是目前唯一通过具身智能国家标准测试的视觉-语言-动作(VLA)大模型,标志着我国人形机器人从“实验室行走”向“真实场景干活”迈出了关键一步。 此次开源不仅包含 XR-1大模型,还配套发布了强大的数据底座 RoboMIND2.0 以及高保真数字资产数据集 ArtVIP 最新版。
国内唯一通过具身智能国标测试,北京人形机器人创新中心开源 XR-1 模型
AI在线 12 月 19 日消息,12 月 18 日,北京人形机器人创新中心正式开源国内首个且唯一通过具身智能国标测试的具身 VLA 大模型 XR-1,以及配套的数据基础 RoboMIND 2.0、ArtVIP 最新版。 围绕“具身天工”平台,北京人形已发布具身天工 2.0、天轶 2.0 等多类型通用本体,为人形机器人干活奠定物理本体基础。 而具身大脑和小脑的协同是人形机器人干活的另一前提,目前围绕“慧思开物”,北京人形已开源 WoW(我悟)世界模型和 Pelican-VL(天鹕)等具身大脑相关成果。
与Physical Intelligence同日发声:深度机智亮出「情境数采」杀手锏,具身智能的通用性天花板要被捅破了?
机器之心发布具身智能通往通用性的征途,正被 “数据荒漠” 所阻隔。 当模型在模拟器中刷出高分,却在现实复杂场景中频频 “炸机” 时,行业开始反思:我们喂给机器人的数据,是否真的包含人类操作的精髓? 近日,深度机智在以人类第一视角为代表的真实情境数据,筑牢物理智能基座,解决具身智能通用性难题的道路上又有重要举措。
工业具身新标杆:人形机器人“小墨”规模化入驻宁德时代产线
近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。 由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。 这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。
具身智能的数据难题,终于有了可规模化的解法
允中 发自 凹非寺. 量子位 | 公众号 QbitAI科技赛道从不缺“造梦者”,但能精准击中行业痛点的“破局者”往往寥寥。 在ToB世界里,真正称得上“标杆”的,或许不是那些自称“通用AI模型玩家”的公司,而是另一类更务实的路径:.
Dexmal原力灵机提出ManiAgent,用多智能体协作重构机器人操控
在机器人操控领域,Vision-Language-Action (VLA) 模型曾被视为通往通用机器人的“圣杯”。 当前,它却面临着严重的瓶颈问题:数据饥渴与分布外(OOD)失效:VLA 很依赖大规模、高质量的演示数据;一旦遇到训练数据分布之外的场景,或者数据量稍有不足,性能明显下降。 模型容量与推理能力互斥:为了让模型学会动作控制而进行的微调,会破坏 LLM 原本拥有的高层语义理解和推理能力。
图灵奖得主姚期智:具身智能发展要从模仿走向推理
AI在线 12 月 14 日消息,12 月 13 日,全球开发者先锋大会暨国际具身智能技能大赛(GDPS 2025)在上海开幕。 图灵奖得主、中国科学院院士、大赛指导委员会主任姚期智阐述了具身智能发展的关键方向,并分享了四点前瞻性见解:首先,要从模仿走向推理。 当前方法多依赖模仿,缺乏可解释的世界模型和物理因果推理。
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25
AEOS-Bench&AEOS-Former团队 投稿. 量子位 | 公众号 QbitAI将卫星星座送入轨道我们都知道很难,但高效规划调度在轨卫星星座执行任务也不简单。 随着部署的星座规模越来越大,通过人力进行任务规划的效率已经赶不上卫星的任务执行效率,于是研究人员将希望寄托在了AI上。
深圳将建全国首个机器人友好示范城区,广东具身智能训练场体系发布
AI在线 12 月 13 日消息,12 月 12 日至 14 日,“2025 年粤港澳大湾区人工智能与机器人产业大会暨广东省人工智能与机器人技能大赛”在广州举办。 据悉,本次大会上,广东省具身智能训练场“1 1 N”体系将正式发布。 具体包括:“1”个广东核心中枢 —— 广东省具身智能训练场(简称“省训练场”),由主训练场和管理中心两部分构成。
对话英诺王建明:机器人目前面临的核心问题是数据 | GAIR 2025
每晚 10 点,城市渐入静谧,英诺天使基金 ED 王建明的 “专属写作时间” 才刚刚开启;周末的时光,也早已被她固定分配给了采访与写作。 这份坚持,源于一直在坚持做的 “石麻笔记”,最初她只是想随手记录工作中接触的技术信息,未曾想,石麻笔记受到了越来越多业内人士的关注,也在潜移默化中改变着她对机器人行业的认知。 早在具身智能成为资本热词之前,英诺王建明就已经踏入机器人赛道。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
腾讯
算法
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉