但是高精度地图的采集过程相对来说比较繁杂,首先,只有具备相关资质的图商才能够进行高精度地图的测绘。同时,采集车需要进行改装,车上布满了激光雷达、摄像头、GNSS等传感器和设备,其次,采集到的数据还要进行加工、标注,最终上传,流程复杂,成本昂贵。
况且,各家测绘机构的测绘车等物资都比较有限,想要实现全国大大小小路段的高精度数据全覆盖,是一件非常困难的事情。更何况,后期还有巨大的维护成本。
高精度地图确实能够为自动驾驶提供感知补充、地图围栏、辅助控制、超视距的路径规划等信息。但是弊端则在于它的更新频次太慢,车企一旦依赖上这根“拐杖”,想要快速“跑起来”就会比较困难。
于是在最近一段时间内,各家车企纷纷对外表达了“去高精度地图化”的想法。
2022年 5 月,余承东曾在接受媒体采访时明确表示,自动驾驶未来不过分依赖高精地图、车路协同。在2023年2月接受采访时,他再次重申这一理念,余承东表示,今年一定会上不依赖高精地图的智能驾驶。车企想要获得好的智驾用户体验,就需要华为供应不依赖高精地图的智能驾驶。
何小鹏也在2023年1月份的小鹏汽车全员信上提出,2023年的X-NGP辅助驾驶要抛掉高精地图。
而更早提出这一概念的是毫末智行。
2022年4月,毫末智行提出要做重感知的城市智能驾驶,降低智能驾驶中高精地图的权重,乃至做到无需高精地图。
以“重感知”为基底的技术路线突然得到了认可,而最早提出这一技术路线的毫末能力如何?
重感知,自动驾驶的技术基底
高精地图更新频次太低,无法满足智能驾驶的需求。另外,毫末智行CEO顾维灏也曾提出过一个非常有意思的观点:高精度地图提供的是道路先验信息,但是它并不稳定,总是施工。如果你把它当做是激光雷达,且这个激光雷达总是施工不可用,那它的置信度当然就会被降低。
所以车端的感知能力就变得至关重要。
在感知模型方面,毫末智行是国内最早使用基于Transformer大模型的自动驾驶公司之一。Transformer最早是由谷歌团队提出,并用于NLP(自然语言处理)领域,被用来处理序列文本数据。特斯拉最早将这一网络模型应用于视觉处理任务。这一模型对于图像的处理能力显著高于过去常用的RNN网络,数据量越大,Transformer处理效果越好,非常匹配自动驾驶的图像处理需求。
与特斯拉一样,毫末也基于时序Transformer模型在BEV环视空间上做了虚拟实时建图,通过这种方式让车道线的感知输出更加稳定和准确。
技术需要通过产品落地。
在乘用车领域,毫末已经推出了三代乘用车辅助驾驶解决方案HPilot。这里我们可以着重了解第三代智能驾驶HPilot3.0。
在功能性上,HPilot3.0可根据导航提供的行驶路线,在城市环境下实现自动变道超车、红绿灯识别与控车、复杂路口通行、无保护左右转等功能。
在场景上,HPilot3.0可以应对车辆近距离切入、车辆阻塞占道、交叉路口、环岛、隧道、立交桥等复杂的城市交通场景。
这些场景看似常规,但想要实现与人类一样的驾驶策略和能力,想要在感知上下很多功夫。我们可以拿日常最常见的红绿灯举例,红绿灯识别难点主要在于检测目标小、状态会变化(闪烁等);同时不同地区的红绿灯形状也不同,当然最能难的还是“绑路”的问题,通俗地说,红绿灯对应哪条路,这里面包含了语义理解,人有时都会判断错误,更何况机器。
针对这一场景,毫末采用的是用大量的数据去训练,通过图像合成和迁移学习,来加快技术的更新。毫末为此设计了独创“双流”感知模型,将红绿灯检测和绑路问题分解成两个通道。通俗地讲,这个模型有两路通道,一路是检测物体(是什么,即 what),一路理解空间、位置关系(即 where)。