自动驾驶
真实闭环拉满!浙大&华为发布全新闭环仿真工具HUGSIM
写在前面 & 笔者的个人理解在过去的几十年里,自动驾驶算法在感知、规划和控制方面取得了重大进展。 然而,评估单个组件并不能完全反映整个系统的性能,这突显了对更全面评估方法的需求。 这推动了HUGSIM的发展,这是一个闭环、真实和实时的仿真器,用于评估自动驾驶算法。
12/6/2024 9:47:13 AM
Hongyu Zhou等
北大王选最新OpenAD!助力自动驾驶迈向开放3D世界
写在前面 & 笔者的个人理解开放世界自动驾驶包括域泛化和开放词汇。 领域泛化是指自动驾驶系统在不同场景和传感器参数配置下的能力。 开放词汇是指识别训练中没有遇到的各种语义类别的能力。
12/4/2024 10:00:00 AM
自动驾驶之心
3DGS自监督预训练全新范式!VisionPAD:三大感知任务全部暴力涨点(港中文&华为)
写在前面 && 笔者理解虽然近一年端到端的自动驾驶发展火热,但是以多视角图像推导BEV视角和占用空间的感知技术引领的自动驾驶框架,仍然在很多企业中占据主体。 比如今天要分享的这篇,就是华为诺亚方舟实验室对BEV OCC的继续研究。 但是不得不说,这些模型在很大程度上依赖于精确的3D标注,而数据标注的高成本使得越来越多的研究人员和工程师开始关注预训练策略。
12/3/2024 9:49:07 AM
黄哲威 hzwer
大幅超越所有SOTA!地平线DiffusionDrive:生成式方案或将重塑端到端格局?
写在前面&笔者的个人理解近年来,由于感知模型的性能持续进步,端到端自动驾驶受到了来自工业界和学术界的广泛关注,端到端自动驾驶算法直接从原始传感器采集到的信息输入中学习驾驶策略。 这种基于数据驱动的方法为传统的基于规则的运动规划提供了一种可扩展且强大的替代方案,而传统的基于规则的运动规划通常难以推广到复杂的现实世界驾驶环境。 为了有效地从数据中学习驾驶过程,主流的端到端规划器通常从自车查询中回归出单模轨迹,如下图所示。
12/3/2024 9:36:52 AM
Bencheng Liao等
魔法降临!港中文MagicDriveDiT:暴力提升生成质量40%!
写在前面 & 笔者的个人理解扩散模型的快速发展极大地改善了视频合成,特别是在可控视频生成方面,这对自动驾驶等应用至关重要。 然而,现有的方法受到可扩展性和控制条件集成方式的限制,无法满足自动驾驶应用对高分辨率和长视频的需求。 本文介绍了一种基于DiT架构的新方法MagicDriveDiT,并解决了这些挑战。
11/28/2024 9:31:44 AM
Ruiyuan Gao等
专为自动驾驶而生!DeSiRe-GS:彻底摒弃3D框,动静态重建完美解耦(UC Berkeley最新)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 & 个人理解UC Berkeley最新的工作,提出了DeSiRe GS。 全新自监督高斯飞溅表示,可以在复杂的驾驶场景中实现有效的静态-动态分解和高保真表面重建。
11/27/2024 9:28:00 AM
Chensheng Peng等
闭环仿真杀器!DrivingSphere:理想提出直接构建高保真4D世界
写在前面&笔者的个人理解近年来,端到端自动驾驶算法取得了重大进展,准确评估这些模型是一项非常紧迫的任务。 为了安全、负责任地进行评估,必须有一个精确的模拟环境,准确反映现实世界的驾驶条件。 这个要求通常包括两个方面:一是高保真传感数据的生成,二是闭环反馈机制的实现。
11/26/2024 9:43:37 AM
Tianyi Yan等
Mamba与元学习双管齐下,打造新的语义补全方案!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 && 笔者理解传统的自动驾驶框架下,现有感知而后又规控,所以可以说感知在这套框架下扮演着非常基础性的工作。 然而,动态交通参与者的突发性和可变性,加上静态对象的较大的范围和距离,给自动驾驶车辆在感知复杂驾驶场景时带来了不小的挑战。
11/20/2024 10:00:00 AM
Yansong Qu等
Waymo玩明白了!全新多模态端到端算法EMMA:感知规划一网打尽~
写在前面 & 笔者的个人理解本文介绍了EMMA,一种用于自动驾驶的端到端多模态模型。 EMMA建立在多模态大型语言模型的基础上,将原始摄像头传感器数据直接映射到各种特定于驾驶的输出中,包括规划者轨迹、感知目标和道路图元素。 EMMA通过将所有非传感器输入(如导航指令和自车状态)和输出(如轨迹和3D位置)表示为自然语言文本,最大限度地利用了预训练的大型语言模型中的世界知识。
11/14/2024 10:17:38 AM
Jyh-Jing Hwang等
通用场景拉满了!GenXD:生成任何3D&4D场景(新加坡国立&微软最新)
写在前面&笔者的个人理解近年来,利用扩散和自回归建模生成2D视觉内容已经取得了显著成功,并已在实际应用中进行广泛使用。 除了 2D 生成之外,3D 内容生成也至关重要,可应用于视频游戏、视觉效果和可穿戴混合现实设备。 然而,由于 3D 建模的复杂性和 3D 数据的局限性,3D 内容生成仍然远远不能令人满意,并且正在引起学术界和工业界越来越多的关注。
11/12/2024 9:34:48 AM
Yuyang Zhao等
自动驾驶界秋名山车神!CoRL杰出论文让自驾车学会漂移,机器人整出新活
今年的机器人顶会 CoRL 杰出论文,竟然帮自动驾驶车稳稳地完成了漂移。 先来个甜甜圈漂移热个身:然后,上点难度,来个「8 字」: 最后来个蛇形绕桩(Slalom,这次没有实体的桩)。 可以听见,在绕到一半的时候,工作人员忍不住欢呼了一下。
11/11/2024 2:59:00 PM
机器之心
LVLM赋能端到端!地平线&华科联手打造更强自动驾驶系统Senna!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解近年来,自动驾驶技术发展迅速,在驾驶感知、运动预测、规划等领域取得了重大进展,为实现更准确、更安全的驾驶决策奠定了坚实的基础。 其中,端到端自动驾驶技术取得了重大突破,端到端方法以大规模数据为基础,展现出卓越的规划能力。
11/7/2024 9:31:55 AM
Bo Jiang等
nuPlan又一SOTA!赵行团队新作STR2:运动规划的重新出发,仿真闭环的强大泛化!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 论文链接::::大型实际驾驶数据集推动了有关自动驾驶数据驱动运动规划器的各个方面的研究,包括数据增强、模型架构、奖励设计、训练策略和规划器架构。 在处理复杂和少样本情况下,这些方法有较好的表现。
11/6/2024 9:48:10 AM
Qiao Sun等
重新思考轨迹预测 | 复旦提出PIFM:如何将规划引入预测?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 && 笔者理解传统的自动驾驶主要可以分为感知、预测、规控三个大的部分,其中预测模块承担着十分重要的角色,为下游规划路径提供重要的信息。 然而,现实世界驾驶环境的复杂性,其中包括多个动态智能体(如车辆和行人)之间的相互作用,给预测造成了不小的挑战。
11/5/2024 9:41:27 AM
Yunhao Liu等
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果
近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。 DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。 论文链接:::。
10/28/2024 1:11:00 PM
机器之心
Waymo获得56亿美元融资,有史以来最大一轮
这笔资金将被用于进一步扩展 Waymo 的无人驾驶出租车服务。 Alphabet 旗下的自动驾驶子公司Waymo刚刚完成一轮56亿美元的C轮超额认购融资,以进一步扩大其无人驾驶出租车服务。 这是该公司迄今为止筹集的最大一轮融资。
10/26/2024 3:07:00 PM
机器之心
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
自己称赞自己千句,不如别人称赞你一句。 例如马斯克在播客、推特上经常自称特斯拉的自动驾驶和机器人“天下第一”,但这样的话看多了,难免也有些审美疲劳。 不过,前几天,Andrej Karpathy在No Priors播客中现身,透露了特斯拉在Optimus人形机器人和自动驾驶领域的一些鲜为人知的进展。
9/12/2024 10:42:00 AM
刘洁
首届AI方程式大赛,8圈开了一个小时
好消息:大多数 AI 赛车都完赛了。在阿布扎比的 F1 赛道上,8 辆赛车使用相同的轮胎,相同的发动机,完全一样的车身,唯一不同之处就是自动驾驶代码。全球第一场自动驾驶大奖赛开战了。上周日,阿布扎比自动驾驶赛车联赛 A2RL 的第一场比赛在 Yas Marina 阿布扎比一级方程式赛道上举行;这场比赛汇集了来自世界各地的技术娴熟的科学家、工程师和开发者团队,并将尖端技术融入赛车中,所有这些都是为了通过极限运动重塑移动性的未来。智能驾驶技术在量产汽车上一直处于正在发展,以及「即将覆盖城区」的阶段。因为 AI 技术的快
4/29/2024 2:59:00 PM
机器之心
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用