Waymo引入谷歌Gemini大语言模型开发新型自动驾驶系统

2024-11-01 09:01:19

11月1日消息，据报道，Waymo近日宣布其最新研究成果——一种名为“端到端多模态自动驾驶模型”（EMMA）的新模型。这一模型基于谷歌的多模态大语言模型（MLLM）“Gemini”，旨在提高无人驾驶车辆在复杂环境中的导航能力。据报道，传统的自动驾驶系统通常会为感知、映射、预测和规划等各种功能开发特定的“模块”。这种方法虽然在过去表现出色，但在扩展性和新环境适应性方面存在局限。Waymo认为，利用像 Gemini 这样的 MLLM 可以有效解决这些问题。这些模型通过大量互联网数据训练，不仅拥有丰富的“世界知识”，还能通过“链式推理”等技术展现出卓越的推理能力，模仿人类的思维方式处理复杂任务。尽管如此，EMMA 模型在实际应用中仍面临一些挑战。例如，由于计算开销过高，该模型目前无法整合来自激光雷达或雷达的 3D 传感器输入，只能处理有限数量的图像帧。此外，研究中也提到，像 Gemini 这样的 MLLM 可能会产生“幻觉”，而无人驾驶汽车中的容错率极为有限，因此在这些模型能够大规模部署之前，还需要进行更多的研究和测试。

TAGS:

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源;
2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任;
3.作者投稿可能会经我们编辑修改或补充。