AI在线 AI在线

自动驾驶

Mamba与元学习双管齐下,打造新的语义补全方案!

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 && 笔者理解传统的自动驾驶框架下,现有感知而后又规控,所以可以说感知在这套框架下扮演着非常基础性的工作。 然而,动态交通参与者的突发性和可变性,加上静态对象的较大的范围和距离,给自动驾驶车辆在感知复杂驾驶场景时带来了不小的挑战。
11/20/2024 10:00:00 AM
Yansong Qu等

Waymo玩明白了!全新多模态端到端算法EMMA:感知规划一网打尽~

写在前面 & 笔者的个人理解本文介绍了EMMA,一种用于自动驾驶的端到端多模态模型。 EMMA建立在多模态大型语言模型的基础上,将原始摄像头传感器数据直接映射到各种特定于驾驶的输出中,包括规划者轨迹、感知目标和道路图元素。 EMMA通过将所有非传感器输入(如导航指令和自车状态)和输出(如轨迹和3D位置)表示为自然语言文本,最大限度地利用了预训练的大型语言模型中的世界知识。
11/14/2024 10:17:38 AM
Jyh-Jing Hwang等

通用场景拉满了!GenXD:生成任何3D&4D场景(新加坡国立&微软最新)

写在前面&笔者的个人理解近年来,利用扩散和自回归建模生成2D视觉内容已经取得了显著成功,并已在实际应用中进行广泛使用。 除了 2D 生成之外,3D 内容生成也至关重要,可应用于视频游戏、视觉效果和可穿戴混合现实设备。 然而,由于 3D 建模的复杂性和 3D 数据的局限性,3D 内容生成仍然远远不能令人满意,并且正在引起学术界和工业界越来越多的关注。
11/12/2024 9:34:48 AM
Yuyang Zhao等

自动驾驶界秋名山车神!CoRL杰出论文让自驾车学会漂移,机器人整出新活

今年的机器人顶会 CoRL 杰出论文,竟然帮自动驾驶车稳稳地完成了漂移。 先来个甜甜圈漂移热个身:然后,上点难度,来个「8 字」: 最后来个蛇形绕桩(Slalom,这次没有实体的桩)。 可以听见,在绕到一半的时候,工作人员忍不住欢呼了一下。
11/11/2024 2:59:00 PM
机器之心

LVLM赋能端到端!地平线&华科联手打造更强自动驾驶系统Senna!

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解近年来,自动驾驶技术发展迅速,在驾驶感知、运动预测、规划等领域取得了重大进展,为实现更准确、更安全的驾驶决策奠定了坚实的基础。 其中,端到端自动驾驶技术取得了重大突破,端到端方法以大规模数据为基础,展现出卓越的规划能力。
11/7/2024 9:31:55 AM
Bo Jiang等

nuPlan又一SOTA!赵行团队新作STR2:运动规划的重新出发,仿真闭环的强大泛化!

本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接::::大型实际驾驶数据集推动了有关自动驾驶数据驱动运动规划器的各个方面的研究,包括数据增强、模型架构、奖励设计、训练策略和规划器架构。 在处理复杂和少样本情况下,这些方法有较好的表现。
11/6/2024 9:48:10 AM
Qiao Sun等

重新思考轨迹预测 | 复旦提出PIFM:如何将规划引入预测?

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 && 笔者理解传统的自动驾驶主要可以分为感知、预测、规控三个大的部分,其中预测模块承担着十分重要的角色,为下游规划路径提供重要的信息。 然而,现实世界驾驶环境的复杂性,其中包括多个动态智能体(如车辆和行人)之间的相互作用,给预测造成了不小的挑战。
11/5/2024 9:41:27 AM
Yunhao Liu等

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。 DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。 论文链接:::。
10/28/2024 1:11:00 PM
机器之心

Waymo获得56亿美元融资,有史以来最大一轮

这笔资金将被用于进一步扩展 Waymo 的无人驾驶出租车服务。 Alphabet 旗下的自动驾驶子公司Waymo刚刚完成一轮56亿美元的C轮超额认购融资,以进一步扩大其无人驾驶出租车服务。 这是该公司迄今为止筹集的最大一轮融资。
10/26/2024 3:07:00 PM
机器之心

Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人

自己称赞自己千句,不如别人称赞你一句。 例如马斯克在播客、推特上经常自称特斯拉的自动驾驶和机器人“天下第一”,但这样的话看多了,难免也有些审美疲劳。 不过,前几天,Andrej Karpathy在No Priors播客中现身,透露了特斯拉在Optimus人形机器人和自动驾驶领域的一些鲜为人知的进展。
9/12/2024 10:42:00 AM
刘洁

首届AI方程式大赛,8圈开了一个小时

好消息:大多数 AI 赛车都完赛了。在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同之处就是自动驾驶代码。全球第一场自动驾驶大奖赛开战了。上周日,阿布扎比自动驾驶赛车联赛 A2RL 的第一场比赛在 Yas Marina 阿布扎比一级方程式赛道上举行;这场比赛汇集了来自世界各地的技术娴熟的科学家、工程师和开发者团队,并将尖端技术融入赛车中,所有这些都是为了通过极限运动重塑移动性的未来。智能驾驶技术在量产汽车上一直处于正在发展,以及「即将覆盖城区」的阶段。因为 AI 技术的快
4/29/2024 2:59:00 PM
机器之心

自动驾驶领域,「决策」和「感知」终于握手言和

作者丨郭思编辑丨陈彩娴围绕大模型应用于自动驾驶的讨论热度持续升温,却呈现出愈发复杂而矛盾的现象。 一方面,资本力量的积极投入,行业巨头纷纷抢占先机。 例如,特斯拉近期推出了其“端到端”的全自动驾驶软件FSD v12版本,并已在美国和加拿大地区逐步面向非员工用户提供更新服务。
2/27/2024 10:59:00 AM
郭思

清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力

在自动驾驶领域,研究人员也在朝着 GPT/Sora 等大模型方向进行探索。与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领域之一。要想构建完全的自动驾驶系统,人们面临的主要挑战是 AI 的场景理解,这会涉及到复杂、不可预测的场景,例如恶劣天气、复杂的道路布局和不可预见的人类行为。现有的自动驾驶系统通常包括 3D 感知、运动预测和规划组成部分。具体来说,3D 感知仅限于检测和跟踪熟悉的物体,忽略了罕见物体及其属性, 运动预测和规划则关注物体的轨迹动作,通常会忽略物体和车辆之间的决策级交互。自动驾驶需
2/23/2024 10:56:00 AM
机器之心

GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了

GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近,一篇题为《On the Road with GPT-4V (ision): Early Explorations of Visual-Language Model on Autonomous Driving》的论文针对自动驾驶场景对 GPT-4V 的能力进行了难度递增的测试,从情景理解到推理,再到作为真实场景驾驶员的连续判断和决策。论文地址:,论文对 GPT-4V 在自动驾驶领域的探索主要集中在
11/20/2023 3:42:00 PM
机器之心