最终小鹏给出的解决方案是,给到小鹏P5 P版车主价值20000元的智驾先享代金券权益,同时保证针对P5车型持续OTA座舱更新。
P5在开城方面的“断更”,这固然是企业研发投入下的取舍,但更是技术迭代下的结果。
单颗Orin X芯片算力达254TOPS,远超Xavier芯片的30 TOPS,哪个在开城上更具优势,答案显而易见。
要想开城,高算力不能没有,但需要高到什么程度,这里还没有个准数。
地平线总裁陈黎明就曾提到,「百TOPS算力已经能够支持城区NOA的应用,算力不是瓶颈,挑战主要还是在算法上。」
此外,以腾势N7支持城区智驾的版本来看,它也只采用了单颗Orin-X芯片,而非像小鹏那样主打2颗。
客观来说,芯片算力只是其中一个技术指标,同时还是个理论峰值,并不代表真正可用到的效能。
例如,芯片架构是否对transformer有更多内置支持,这也会影响芯片对智驾的效用。
当然,算力峰值越高,可升级的空间越大。
双/单Orin芯片的算力差距,有/无双激光雷达的方案差距,单从小鹏的智驾版本能力区分上也能看出一二。
小鹏指出,AI代驾功能只会在Max车型上实现,Pro版不会有城区智驾能力。
从中也引出了关于智驾开城工具的第二个难点——激光雷达和纯视觉路线之争。
关于激光雷达的优势,在于其测距能力和精度是摄像头所无法比拟的。
特别对于一些体积细小、非规则物体,激光雷达的点云能够对视觉探测起到补充作用。
正因如此,理想商业副总裁刘杰直言,「激光雷达的作用非常像安全气囊,虽然没有它也能实现智驾,但视觉总有未见过的场景,激光雷达能为此起到安全兜底的作用。」
于是,他进一步表示,理想短期内不会放弃激光雷达。
激光雷达虽好,但也不是好得那么绝对。
「贵」,这是人尽皆知的特点,相较于2016年前后曾售价高达7-8万美元/颗,目前激光雷达已下降到了1千美元以下/颗的水平。
但成本,还是远在摄像头之上。
再者,激光雷达的点云数据比较稀疏,稳定性不算强,也容易因此造成系统识别上的出错。
相反,摄像头采用了非常多的像素去描述周围环境,在强大数据量的支撑下,系统稳定性也会有着更高冗余度。
关于数据的积累量及闭环处理能力,这点是纯视觉路线的竞争壁垒,也是目前特斯拉FSD的领先所在。
禾赛科技战略负责人施叶舟表示,「特斯拉已建立了在纯视觉方案上的“算法+算力+数据”竞争壁垒,先发优势很强,后来者已很难超越。」
「纯视觉方案取消了激光雷达,看似节省了硬件成本,但需要在算力、数据等方面投入很大,隐性成本被拉高。」
轻舟智航产品负责人许诺进一步指出,相比于纯视觉方案,激光雷达是以投入换时间,加速城市NOA落地的捷径。
虽然纯视觉路线不容易,但仍然有“头铁”的玩家愿意加入——极越。
实际在早期研发阶段,极越就以「视觉+激光雷达」的融合方案以及纯视觉方案来“两条腿走路”,两套独立系统相互备份、相互补充。
最终,极越选择了纯视觉路线。
能给到极越这般选择的底气,是它采用了OCC占用网络技术,这也是特斯拉在去年AI Day上亮出的核心手段。
但让人没想到的是,率先将占用网络带火的不是极越,而是华为。
开城难,难在应对每一个复杂的长尾场景。
各城市不同设计的路口指引、不同的交通灯信号形状、不同的交通复杂情况,都在对「开城」目标提出了更多的挑战。
在此其中,「感知识别」作为最基础一环,如何在第一步工序上尽可能不出错,这对于智驾体验及安全性都有着至为重要的影响。
对此,基于BEV+transformer的底层路线,占用网络技术的应用,进一步提升了对异形障碍物的识别率。
有了占用网络,系统在识别前方障碍物时,都会以一格格「体素」的形式来表达,告诉系统前方有障碍物的存在。
知道有这么个东西的存在,但不需要明确识别到它的身份,此举区别于过往系统需要反复靠白名单来训练学习、识别障碍物的做法。
占用网络最能发挥效用的地方,是将其融合到BEV的近场感知,在低速区间作出更准确的识别。
在此基础上,融合了占用网络技术的AEB,自然也就能使出更强大的作用。
这,就是华为“小视频”出处的源头。
一开始,何小鹏对于这些小视频也是抱着不信任的态度。
「友商讲了AEB,我认为99%是假的,它就是造假。」
「那些宣传都不是公司官方发布的,全是来自小视频,我们的人也去问了,它的AEB根本不能开,路上误刹车的情况太多了。」
「我觉得把客户当小白鼠是不对的,有一些企业敢于这样做,但也会有反噬。」
后来,余承东也回击了。
「有的车企整天忙着做智能驾驶,AEB主动安全测试结果非常差,一问才知道,他们却连AEB这基本功能居然都没有做。」
「这让我十分吃惊!要么让手下忽悠了,要么是对汽车行业的发展缺乏最基本的认知!」
再接下来,一场由垂直类媒体组织的AEB测试很快终结了这场骂战。
从成绩来看,华为系车型明显占据了上风。
之所以这样,正是因为华为率先将占用网络技术下放到了AEB,做到更有效识别异形障碍物。
「由于形状不规则、遭遇概率低,很难被标记和训练,传统AEB算法对它们无可奈何,一旦发生碰撞,后果不堪设想。」
「为根除这类长尾场景,华为首创激光融合的GOD网络,并将其应用于AEB功能。」
时任阿维塔CEO的谭本宏就对此作出过明确解释。
值得一提的是,极越和小鹏都提及过应用占用网络技术,但实际上车时间,都是在2024年。
技术落地时间的差距,导致了不同车企智驾表现的水平差异。
而相比于多数中国车企还在等着应用占用网络,另一边的特斯拉再次走在了更前沿的方向——端到端。
8月底,马斯克试驾了业内首个端到端方案的FSD Beta V12版,在45分钟的试驾路程里,马斯克只接管了一次。
关于端到端,最直接的解释是系统只需输入原始数据,即可输出最终结果。
这意味着,智驾系统里的感知、预测和规划,这三大部分都统一为了一个整体。
虽然这看起来运行效率是提高了,但在省去由人工规则交织的中间环节以后,也使得系统变成了一个不透明的黑盒子。
一旦系统出错,人工也很难找到对应模块来完成调整优化。
「V12系统从头到尾都是通过AI实现,我们没有编程。」
「我们没有让程序员写一行代码来识别道路、行人等,包括让特斯拉在停车标志处停车或等待另一辆车,我们全部交给了神经网络。」
马斯克自豪地为自家V12系统站台。
不过也有声音指出,虽然V12版本采用了端到端方案、省去了不少控制代码,但实际还是通过动态BEV、静态BEV、占用网络,规划网络和控制网络的不同模块组合起来,并非只由一个神经网络去覆盖全部。
具体理由是,测试车辆的仪表盘上还显示着车道线、其它车辆、路沿等信息。
反之如果是纯单一的端到端模型,输出信息应该就只有转向角度、加减速等车辆控制相关的情况。
不管怎样,特斯拉在前沿技术上的进展是有目共睹的,这样的端到端方案到了明年以后,或许也将成为各大中国车企跟随学习的新路线。