夏一平所说的发新车,即通过OTA大小新版本更新使用户的车常用常新。25日的AI DAY上,极越也推送了V1.4.0版本,涉及舱、驾、互联、三电等领域的200多项功能。如升级OCC占用网络可视化效果、SIMO与文心一言大模型双向融合、基于大模型的人车家生态正式“上车”等。这也是极越01在90天内连续推出的第3次、上市后的第5次OTA。
更大的看点则是未来的2.0系统上。
百度智能驾驶事业群组首席研发架构师、IDG技术委员会主席王亮基于VTA,展示了一部分大模型在智驾领域的应用前景。VTA的部分能力将落地于极越2.0版本的系统中,”2.0已经开始在我们内部试驾测试。”夏一平表示。
从架构来看,VTA虽然还是主干网络+多任务头的结构,但其主干模型相较于专家型,更偏向于高通用性的基础网络(foundation model),多头任务模型也被集中为通用性更高的“在线建图、目标检测/时序跟踪、OCC占据网络和场景理解”四个特点任务。
其中,在线建图包括道路元素识别、几何测距、广义拓扑三个能力;检测和跟踪则主要有关联跟踪、速度估计的能力;OCC则将推出远、中、近距离的检测网络,在200、120和30米距离内的物体检测能力可比1550nm超长距激光雷达、905nm长距激光雷达和905nm补盲激光雷达的性能,用以提供行泊一体的能力。
值得注意的是,无论是基础网络还是四个任务头,VTA都主要采用数据驱动的训练方法,以更多的神经网络解决问题,为未来实现端到端打下基础。
如VTA的基础网络首先基于自动驾驶车采集的原始道路数据,采用掩码自监督的学习方式进行基础能力的培养,之后再用标注数据对目标检测、深度/光流估计、图像识别等能力进行专项训练。而目前大部分主干网络都是首先使用标注数据训练以快速建立性能。