AI在线 AI在线

蔚来:世界模型 NWM 在小路、窄路、人车混行道路上的表现格外出色

AI在线 7 月 16 日消息,蔚来世界模型全量推送至「Banyan 榕」、「Cedar 雪松」、「Cedar S 雪松」车型,官方称智能辅助驾驶的使用率翻了好几倍。 蔚来官方今日发布“蔚来世界模型 NWM 有问必答第 1 期”,就用户对蔚来世界模型关心的问题进行解答,包括世界模型和常规端到端的区别、世界模型上来后群体智能是否还需要、世界模型为什么会被称为“小路之王”等。 AI在线附蔚来此次世界模型 NWM 有问必答详情如下:蔚来世界模型和常规的端到端架构有什么区别?

AI在线 7 月 16 日消息,蔚来世界模型全量推送至「Banyan 榕」、「Cedar 雪松」、「Cedar S 雪松」车型,官方称智能辅助驾驶的使用率翻了好几倍。蔚来官方今日发布“蔚来世界模型 NWM 有问必答第 1 期”,就用户对蔚来世界模型关心的问题进行解答,包括世界模型和常规端到端的区别、世界模型上来后群体智能是否还需要、世界模型为什么会被称为“小路之王”等。

蔚来:世界模型 NWM 在小路、窄路、人车混行道路上的表现格外出色

AI在线附蔚来此次世界模型 NWM 有问必答详情如下:

蔚来世界模型和常规的端到端架构有什么区别?

端到端架构让智能辅助驾驶从人工手写规则变成了靠数据驱动迭代的模型,并且基于模型能自动抽取信息,减少了信息损失,数据利用更加充分。比如在下雨天,明明前方看不太清,但在人工手写规则下,感知模型依然必须要输出具体的距离。而端到端架构可以由模型直接输出执行结果,场景覆盖与性能上都有很大的提升。

不过,如果想要真正实现智能辅助驾驶像人一样开车,仅靠端到端架构是不够的。人类大脑有两个非常核心的能力:一个是空间认知能力,也叫想象重建能力;另一个是时间认知能力,也叫想象推演能力。这两个能力合起来,就构成了人类的时空认知能力,也就是对我们生活的三维空间和一维时间所发生的所有变化和可能性的认知能力。

所以,智能辅助驾驶进化的下一步,就是要具备和人一样的时空认知能力。但端到端架构,并不必然具备这样的能力。而蔚来世界模型,既要去建立时空认知能力,而且还具备在想象的平行世界里规划轨迹的能力。

相比常规的端到端架构,蔚来世界模型有三个主要优势:

  • 在空间理解上,通过生成式模型重构传感器输入,更加泛化地抽取信息;

  • 在时间理解上,通过自回归模型,自动建模长时序环境

  • 在海量数据使用上,通过自监督学习的方式,无需人工标注

图片

这样的模型对于算力的要求也会更高。蔚来在「Banyan 榕」系统搭载的 4×Orin-X 芯片,提供了充足的算力储备为用户提供长期的领先体验。而在「Cedar 雪松」系统上搭载的「神玑 NX9031」芯片,更是今天全球智能辅助驾驶芯片的算力天花板,为蔚来世界模型原生设计,将来会有更高的上限。

蔚来世界模型还需要群体智能吗?

在大规模的人工智能应用中,真实的数据并不容易获取,而智能辅助驾驶是这些应用中数据闭环最为成熟的,也是最有可能率先形成大规模安全性应用落地的。在蔚来「Banyan 榕」系统的 4×Orin-X 芯片中,有一颗是群体智能专用芯片,可以将智能辅助驾驶待验证的新版本分发到数十万量级的量产车上,去对比人类驾驶的状态,或是对比之前稳定版本的状态,从而针对性提升新算法的适用性,大大加快智能辅助驾驶的总体进化速度,确保用户的智能辅助驾驶体验更好。

图片

而在更新蔚来世界模型架构后,对数据的需求量变得更大,群体智能依然具备不可或缺的重要性,在「神玑 NX9031」芯片中也设计了专门用于群体智能的模块。除了群体智能,蔚来世界模型在数据层面的另一个杀手锏是生成式仿真,基于真实世界的视频去重建一个虚拟的、可以任意编辑的世界,从而将真实世界的结果和想象出的结果做验证、对比和学习,在千万个变化的世界里去共同训练模型,让蔚来世界模型想象的结果更真、驾驶输出更好。

图片

群体智能和生成式仿真,共同满足蔚来世界模型庞大的数据需求。

为什么蔚来世界模型在小路、人车混行等复杂场景中的表现格外出色?

蔚来世界模型具备很强的认知、理解、推理能力,尤其是空间理解能力和长时序的建模能力突出。而小路通行空间狭窄,行人、二轮车、三轮车运动相对无序,各类障碍物摆放无规则,特别考验智能辅助驾驶系统的动态博弈能力和预测能力,而这些恰恰是蔚来世界模型基础能力的体现。因此,蔚来世界模型在小路、窄路、人车混行道路上的表现格外出色。

相关资讯

蔚来发布“中国首个”智能驾驶世界模型 NWM:0.1 秒内推演出 216 种可能发生的场景

在今日下午的 NIO IN 2024 蔚来创新科技日活动中,蔚来发布智能驾驶世界模型 NWM(NIO World Model),号称是“中国首个”。据介绍,它是一个多元自回归生成式的具身驾驶模型,可全量理解数据、具有长时序推演和决策能力,能在 100 毫秒内推演出 216 种可能发生的场景,在「万千平行世界」中寻找最优路径。作为生成式模型,NWM 还能基于 3 秒的驾驶视频,生成 120 秒的想象视频。NWM 具备与生俱来的闭环仿真测试能力,已在复杂交互场景中全面测试并验证性能。AI在线从发布会获悉,蔚来还发布了智
7/27/2024 4:33:32 PM
汪淼

LeCun团队新作:在世界模型中导航

现实世界版的 Genie-2? 最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。 继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
12/7/2024 5:04:00 PM
机器之心

消息称蔚来已组建 20 人左右团队,调研机器狗项目

据《21 汽车》报道,蔚来汽车已组建了一支约 20 人的团队,专门调研机器狗项目,并由前 Momenta 算法专家徐抗担任负责人。徐抗于 2020 年加入蔚来自动驾驶团队,此次转向机器狗项目,标志着蔚来在具身智能(Embodied AI)领域的进一步探索。
1/21/2025 10:28:20 PM
远洋
  • 1