正文
长城SEE模型端到端技术的应用,
核心在于感知、决策、规控等环节的全链路一体化整合。
其表现是使用数据驱动替代规则驱动,不再由规则具象化定义什么是好的驾驶行为,而是让模型像人类司机一样直接学习“如何开车”,实现从机器到大脑的转变,还具备无限成长性,只要不断投喂数据,就能持续进化。这也是SEE2.0在这两个月内表现会不断优化的原因。
不过,现阶段端到端真正落地还有很多难以解决的问题。
首先是
端到端的黑盒问题,这其实也涉及行业中端到端实现路径的问题,即模块化的端到端和完全端到端。
在吴国苏州看来,端到端有很多不可预知的问题,通过人工规则对一些场景的修补也是比较难的事情。所以长城选择将模块化的端到端和完全端到端结合起来,既有直接输出驾驶的轨迹,又有感知加上模块化智能决策规划的结果。
长城汽车智能平台开发中心高级总监姜海鹏列举了路上的黑色塑料袋的例子,这种场景下,人类司机会选择直接开过去,但算法认为是障碍物,会选择刹车或避让。这就是在落地实践中,算法不可避免的一些错漏或是极端场景,甚至会产生安全隐患的场景。
所以长城
在基于数据驱动的算法外,加上人为编写的规则作为极端场景下的兜底措施。
这相当于在处理正常的路况问题之外,再增加对于复杂问题的逻辑推理和理解能力,提升智驾的安全性。
其次,
是端到端的优化问题。除了算力和算法,其中的关键还在于数据训练。
吴国苏州介绍说,这两个多月的时间里,长城通过模型优化,增加了近300万Clips的实车数据,完成了全国高速高驾道路超过30万公里的数据泛化,以及四个首先开通城市NOA城市场景的泛化测试,采集数据量超过了1PB,测试总里程超过了100万公里,泊车方面泛化测试了200多种泊车场景。相当于两个多月就将训练的数据量进行了翻番。
不过姜海鹏强调说,行业有一个误区,对于端到端训练数据要求,
不仅仅是海量的数据推理,还要有完善的分布,也就是能覆盖各种场景,
否则再多的数据也是有问题的。
对于国内主流智驾企业而言,眼下端到端的主要目标是解决城市 NOA 量产落地。但从更长远的目标来看,实现更高阶的自动驾驶,
对算法、算力和数据的要求也将会越来越高。
从算力层面来看,
行业中目前奉行的原则是大力出奇迹,即模仿特斯拉重投算力。
所谓手中有粮,心中不慌,当算力愈高,企业可做模型训练的空间便会越大,端到端智驾上限就会不断提升。
目前国内头部车企或供应商,比如吉利、长城、蔚小理、华为、百度、商汤等,基本都重金投了超算中心,一场关乎算力的军备竞赛也在悄悄展开。
以长城为例,目前
长城汽车超算中心总算力规模达1.64EFLOPS
,作为对比,华为有3.5EFLOPS,小鹏有0.6EFLOPS。虽然都无法与特斯拉相提并论,但在中国算力储备层面,
长城算得上是在第一梯队,能确保为模型训练提供坚实的算力底座。
其实从这些挑战也可以看出,作为一个新技术路径,
端到端其实就是一场高门槛游戏,并不是所有企业都有特斯拉、华为和长城这样的家底,可以不断投入来满足持续提升的大算力、大数据和算法的高需求。所以企业必须要在能力范围之内,充分考虑投入产出的问题。
英伟达汽车事业部副总裁吴新宙曾说,端到端是智驾三部曲的最终曲。不过姜海鹏认为,端到端技术本身是为了加快产品迭代,并且让处理每一个case解决的效率更高
。对于未来的全场景自动驾驶,仅依靠端到端是不够的。
“端到端和场景理解是一个必然的趋势。端到端一定是未来,但不是终点,现在还有更超前的东西,真正智能驾驶终点一定像人一样有思考,对场景有理解,在此基础之上再做智驾的动作。所以端到端是一个技术发展阶段,但不是智能驾驶的终点。”