具身智能
万字实录:VLA 范式,具身智能的曙光与迷雾丨GAIR Live
整理丨赖文昕编辑丨陈彩娴VLA(视觉-语言-动作模型)作为具身智能领域的关键新范式,能有效整合视觉信息、语言指令与行动决策,显著提升机器人对复杂环境的理解和适应能力,对推动机器人从单一任务执行向多样化场景自主决策的跨越至关重要 ,已成为当下学术界和工业界炙手可热的研究焦点。 圆桌主持人为北京大学计算机学院助理教授、智源学者仉尚航,并邀请了清华大学交叉信息院助理教授、千寻智能联合创始人高阳,清华大学交叉信息院助理教授、星海图联合创始人赵行,与北京大学人工智能研究院助理教授、北大-灵初智能联合实验室主任杨耀东一起进行了一场深度的讨论。 会上,主持人仉尚航带领讨论 VLA,先是探讨其定义、起源及相关模型区别;接着分析技术路线与新成果,探讨不同路线的优缺点;随后围绕机器人常见任务,剖析核心技术瓶颈与主流输出范式;还研究强化学习结合、泛化能力提升、异构数据利用与协同训练;最后关注落地场景,并探讨执行长程任务的难点与可能。
6/3/2025 2:22:00 PM
赖文昕
国家新型工业化操作系统“鸿道”发布:用于具身智能机器人,支持华为、龙芯、英伟达、英特尔等 GPU / NPU 架构
据上证报报道,鸿道操作系统实现了芯片-系统-应用的垂直整合,支持包括龙芯,华为、海光、英伟达、英特尔、高通等在内的一众GPU/NPU架构。
5/29/2025 9:21:39 PM
清源
自变量机器人完成数亿元 A 轮融资,由美团战投领投
公众号《智能涌现》今日发文,具身智能公司「自变量机器人」近日完成数亿元 A 轮融资,由美团战投领投、美团龙珠跟投。该文自变量机器人被官方转发。
5/12/2025 9:49:44 AM
浩渺
千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
作者 | 赖文昕编辑 | 陈彩娴不久前,首届“人形机器人半程马拉松”在北京亦庄举办,为本就热度满满的具身智能行业再添了一把火。 一共 20 支队伍组成的“钢铁生命竞赛”,让此前集中在实验室 demo 阶段的人形机器人们,跑到真实场景中接受试炼,最终共有 6 支队伍完赛,完赛率为 30%。 质疑随着掌声纷杳而至:具身智能真的不是泡沫吗?
4/29/2025 4:26:00 PM
赖文昕
阿德莱德大学吴琦:VLN 仍是 VLA 的未竟之战丨具身先锋十人谈
作者 | 赖文昕编辑 | 陈彩娴2018 年 6 月,在澳大利亚机器人视觉研究中心(ACRV)做博士后研究员的吴琦和博士生 Peter Anderson 首次将 VL(视觉-语言)和彼时机器人领域主流的导航方向联系起来,在 CVPR 2018 发表了第一篇 VLN(视觉-语言-导航)工作;紧接着,Abhishek Das 作为一作发表的“EmbodiedQA(具身问答)”又让“Embodied”一词走入科研视野。 一个月后,一年一度的 NLP 领域顶会 ACL 在冬季的墨尔本召开。 在火热的会场里,吴琦、Peter Anderson 和 Abhishek Das 举办了一场题为“将语言和视觉与动作联系起来” 的 tutorial,真正地开启了 VLA(视觉-语言-动作)这个全新领域。
4/29/2025 4:21:00 PM
赖文昕
首届具身智能机器人运动会在无锡举行:超 150 名“选手”上场比拼
这次运动会有超150台机器人参与,涵盖竞速跑、越野跑、足球、篮球、舞蹈等10个项目,有100余家科研团队、知名企业及高校代表参与,场馆面积达2000平方米。
4/26/2025 3:48:45 PM
清源
共同阶跃星辰与原力灵机达成战略合作
阶跃星辰与原力灵机在北京签署了战略合作协议,双方将利用各自的技术优势,在多模态大模型技术、智能终端 Agent 和具身智能场景方面展开深入合作。 此次合作的目标是实现 “实现在物理世界的推理”,共同开发一种名为 “RoboAgent” 的智能机器人,推动通用人工智能(AGI)在实际应用中的落地。 签约仪式上,阶跃星辰的创始人兼 CEO 姜大昕博士和原力灵机的联合创始人范浩强共同见证了这一重要时刻。
4/24/2025 2:00:46 PM
AI在线
首届具身智能机器人运动会启动,宇树机器人携舞蹈与竞速项目参赛
首届具身智能机器人运动会将在无锡市盛大举行。 作为重要参赛队伍之一,宇树科技将与来自全国各地的机器人企业同台竞技,参与激烈的竞速跑比赛以及精彩的舞蹈表演环节。 截至目前,已有100多家相关企业报名参赛,来自北京、上海、深圳、西安、重庆等地的顶尖机器人公司将参与竞速跑项目,宇树机器人将在这一项目中与国家地方共建具身智能机器人创新中心(北京)、人形机器人创新中心(上海)等知名机构展开激烈竞争。
4/24/2025 12:00:46 PM
AI在线
智元机器人发布具身智能一站式开发平台Genie Studio
智元机器人宣布推出 Genie Studio,这是行业内首个专为具身智能场景打造的一站式开发平台。 Genie Studio 拥有数据采集、模型训练、仿真评测、模型推理的全链路产品能力,为开发者提供从“采”到“训”到“测”再到“推”的标准化解决方案,极大地降低了开发门槛,提升了开发效率。 Genie Studio 的数据采集模块深度重构了机器人数据生命周期,打造了一站式数据中枢,支持多本体、多末端的设备管理,提供全流程功能服务。
4/21/2025 6:00:37 PM
AI在线
行业首款,智元发布具身智能一站式开发平台 Genie Studio
智元机器人今日发布行业首款面向具身智能开发者的一站式开发平台 Genie Studio。据介绍,Genie Studio 是智元机器人专为具身智能场景打造的一站式开发平台,具备数据采集、模型训练、仿真评测、模型推理的全链路产品能力,让“采”、“训”、“测”、“推”每个环节都能找到标准化解决方案。平台优势如下:
· 提供覆盖数据全生命周期的数据解决方案,高效采集海量数据,单机单日产能高达 1000 条。
· 提供自研和主流开源机器人基座模型,打通训练、微调、量化、部署链路,降低训练门槛。
· 提供仿真评测能力,拥有 6000 + 物体资产与仿真场景,实现用户侧场景重建、专家轨迹数据获取、评测结果可视化。
· 提供“⼀键真机部署”能力,轻松实现算法从云端到真机环境的无缝迁移,比传统方案单卡推理性能提升 2-3 倍。
4/21/2025 5:00:37 PM
归泷
英特尔®具身智能大小脑融合方案发布:构建具身智能落地新范式
在 4 月 18 日举办的 2025 英特尔具身智能解决方案推介会上,英特尔正式发布其具身智能大小脑融合方案(下称具身智能方案)。 该方案基于英特尔® 酷睿™ Ultra 处理器的强大算力,以及全新的具身智能软件开发套件和 AI 加速框架打造。 凭借创新性地模块化设计,其不仅能够兼顾操作精度和智能泛化能力,而且以卓越的性价比满足不同领域需求,为具身智能的规模化、场景化应用落地夯实基础。
4/20/2025 10:18:00 AM
机器之心
MIT 具身智能达人志
作者 | 赖文昕编辑 | 陈彩娴「伟大的事情从来不是一个人做的,而是由一群人做的。 」智驾向左,具身向右2015 年的一天,赵行走出 MIT的实验室,收到了浙大本科同级朋友董思远的消息,向同样涉足过光学的他了解 CSAIL 里各位教授的具体研究方向,也想到 MIT 里做些 CV 的工作。 两年前,这两位青年从浙大毕业后赴美深造,都围着视觉打转:赵行到 MIT读博,先后师从Ramesh Raskar和Antonio Torralba教授,研究计算成像和多模态学习;董思远到康涅狄格大学读研,师从郑国安,研究傅里叶叠层成像技术。
4/18/2025 11:05:00 AM
赖文昕
3D视觉大模型SpatialLM开源,实时识别场景内容
在人工智能领域,3D视觉与空间理解技术正成为推动具身智能、自主导航及虚拟现实等应用的关键。 2025年3月,杭州群核科技在GTC2025全球大会上宣布正式开源其自主研发的3D视觉大语言模型 SpatialLM,引发业界广泛关注。 这一模型以其强大的空间认知能力和低成本的数据处理方式,为机器人训练、建筑设计及AR/VR等领域带来了革命性突破。
4/16/2025 10:01:17 AM
AI在线
超仿真:全球首款可拉伸电子皮肤触觉传感器产品亮相,能感知 1 克物体所产生的力
据央视财经消息,全球首款可拉伸电子皮肤触觉传感器产品已正式亮相,该产品采用超仿真设计,能拉伸、揉搓,可感知 1 克物体所产生的力。
4/8/2025 10:37:14 PM
归泷
5.28 亿融资砸向杭州具身智能公司:清华叉院机器人天才坐镇,被称为“中国版 Figure”
就在今天上午,具身智能创业公司千寻智能 (Spirit AI)官宣完成 5.28 亿元人 Pre-A 轮融资。
3/31/2025 2:55:14 PM
清源
阿美P7、招商局重磅入局!千寻智能完成5.28亿元Pre-A轮融资
近日,具身智能领跑企业千寻智能 Spirit AI 宣布完成5.28亿元人民币Pre-A轮融资。 本轮融资由阿美风险投资旗下Prosperity7 Ventures(P7)领投,招商局创投、广发信德、靖亚资本、东方富海、华控基金等多家资本深度参与,华发集团、浙江省科创母基金与上市公司浙江东方在杭州共同发起设立的善富科创子基金战略加持,为千寻智能在具身智能领域的产业布局注入了强大动力。 此外,老股东达晨财智、柏睿资本、弘晖基金以及千乘资本在本轮持续加码,进一步凸显资本市场对千寻智能的高度认可。
3/31/2025 11:01:00 AM
新闻助手
张亚勤院士预言:无人驾驶将迎来 “ChatGPT 时刻”
在最近举行的2025中国电动汽车百人会论坛上,中国工程院院士、清华大学智能产业研究院院长张亚勤提出了一个激动人心的预测:无人驾驶技术将在2025年迎来其发展的 “ChatGPT 时刻”。 这一论断让业界对未来的自动驾驶充满期待。 张亚勤表示,无人驾驶将成为未来五年内最大的具身智能应用,而这一技术将首次通过 “新图灵测试”。
3/31/2025 9:47:00 AM
AI在线
具身智能企业千寻智能完成5.28亿元Pre-A轮融资
2025年3月31日,具身智能领域的领军企业千寻智能(Spirit AI)宣布完成了一轮5.28亿元人民币的Pre-A轮融资。 本轮融资由阿美风险投资旗下的Prosperity7Ventures(P7)领投,招商局创投、广发信德、靖亚资本、东方富海、华控基金等多家知名资本深度参与。 此外,华发集团、浙江省科创母基金与上市公司浙江东方在杭州共同发起设立的善富科创子基金也对千寻智能进行了战略加持。
3/31/2025 8:34:00 AM
AI在线
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
首月 1 美元,ChatGPT Team 会员美区 / 英区 / 欧洲区 / 澳洲区迎优惠
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
ChatGPT 语音功能升级,实时翻译对话更自然流畅
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊