AI在线 AI在线

​英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

在近期于圣地亚哥举行的 NeurIPS 大会上,英伟达推出了其最新的自动驾驶 AI 模型 Alpamayo-R1(AR1),旨在加速实现更广泛的无人驾驶汽车。 英伟达称,AR1是全球首个用于自动驾驶的行业级开放推理视觉语言行动(VLA)模型,能够同时处理文本和图像,帮助汽车传感器将所 “看到” 的信息转化为自然语言描述。 AR1结合了推理链 AI 和路径规划技术,能够更好地处理复杂情境。

在近期于圣地亚哥举行的 NeurIPS 大会上,英伟达推出了其最新的自动驾驶 AI 模型 Alpamayo-R1(AR1),旨在加速实现更广泛的无人驾驶汽车。英伟达称,AR1是全球首个用于自动驾驶的行业级开放推理视觉语言行动(VLA)模型,能够同时处理文本和图像,帮助汽车传感器将所 “看到” 的信息转化为自然语言描述。

AR1结合了推理链 AI 和路径规划技术,能够更好地处理复杂情境。与以往的自动驾驶软件相比,它通过分析场景并考虑所有可能选项,模拟人类的思考方式,从而进行决策。英伟达指出,这一能力对于实现四级自动化至关重要,四级自动化被汽车工程师协会定义为在特定情况下,汽车完全控制驾驶过程。

在一篇与发布会同步的博文中,英伟达应用深度学习研究副总裁布莱恩・卡坦扎罗(Bryan Catanzaro)提供了一个实例,说明 AR1的工作原理。他表示,在行驶于行人密集区域和自行车道旁的情况下,AR1可以利用推理链分析路径数据,做出更合理的驾驶决策,比如避开自行车道或对潜在的横穿马路者停车等。这种基于推理的思考方式,能让工程师更清晰地了解 AI 为何做出某种决策,从而帮助提升车辆安全性。

AR1模型基于英伟达今年早些时候推出的 Cosmos Reason,开放访问使得研究人员可以为自己的非商业用途定制这一模型,进行基准测试或开发自主驾驶汽车。AR1现已在 GitHub 和 Hugging Face 上发布,卡坦扎罗提到,后期强化学习训练在提升推理能力方面效果显著,研究人员反馈取得了 “显著改善”。

划重点:

🌟 AR1是全球首个行业级开放推理 VLA 模型,能够同时处理文本和图像。  

🚗 AR1模拟人类推理,提升自动驾驶技术的复杂场景处理能力。  

🔍 模型已开放在 GitHub 和 Hugging Face 上,供研究人员进行非商业性定制使用。

相关资讯

Adobe AI代理再扩军:新增产品支持与全球上线数据洞察代理

Adobe持续推进其AI代理生态扩展,正式发布“产品支持代理”,旨在简化Adobe Experience Platform中的故障排除流程,并优化客户体验管理。 同时,Adobe宣布其“数据洞察代理”现已在全球范围内上线。 新发布的“产品支持代理”由Adobe Experience Platform Agent Orchestrator提供技术支持,能够在AI Assistant的对话界面中,为用户提供即时的操作指导和支持案例创建流程。
6/6/2025 11:00:55 AM
AI在线

OpenAI 升级 ChatGPT 语音模式,体验更自然对话

OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
6/9/2025 11:00:56 AM
AI在线

ChatGPT 新笔记工具发布:隐形记录,智能整理会议精华

OpenAI 旗下热门 AI 工具 ChatGPT 推出了一项备受期待的新功能——笔记工具,专为会议记录、头脑风暴和个人笔记管理设计。 这一功能目前仅在 ChatGPT 的 macOS 桌面应用程序中可用,为用户提供了一种高效、无缝的信息整理方式。 隐形记录,智能整理ChatGPT 的新笔记工具主打“隐形”记录体验,用户只需在 macOS 桌面应用中点击聊天窗口右侧的圆形图标,即可启动录音模式。
6/20/2025 5:01:01 PM
AI在线