正文
詹锟:我从技术角度来说,我们有安全兜底模块,甚至有些东西我们会保证它有绝对的下限。
以前写了很多规则应对不同的场景,但是现在只需要写下限的规则,上限全靠端的端 、VLM 去捕捉,甚至有些防御性驾驶,VLM 都可以提前告诉系统,比如丁字路口、坑洼小路等,这些都在一定程度上提升了系统安全性。无论是数据还是算法,都是在把安全性往上提升。
并不是大家说的那样,用端到端了安全就差了,这是针对设计不完善的一种想法。
另外,AEB/AES 其实是在最极端的情况下,最兜底的一种保证绝对安全的方式。
这就是用算法、冗余一起来解决安全问题。
Q4:现在从生成到输出,对于传感器包括数据需要有一些质量监测,这个过程中如果出现恶意攻击,甚至说出现各种故障,这种情况理想汽车怎么解决这数据安全的问题?
詹锟:面对数据被污染或者传感器遭受恶意攻击,以及对神经网络进行对抗性破坏,我们已经将这种情况涵盖到整个网络训练过程中。
模型训练并不是针对单一的传感器,比如一个传感器损坏,我们能够通过 BEV 解决。
即使在雨天某个传感器脏污的很厉害,我们依然能稳健驾驶,同时能给用户对应提醒,会告诉你找个安全的地方停车,不会让系统直接失效。
因为有 Radar、Lidar 等多个传感器,各个传感器在不同环境下能冗余互补,单一的攻击很难起效,这就是为什么很难有单一的攻击策略能让智驾系统失效,因为在技术上做了很多防护。
Q5:理想汽车怎么衡量技术发展和销售规模平衡问题?
郎咸朋:理想 L 系列外观比较相似,外界也说是在套娃,但是这让我们有个最大的优势。
传感器布局和传感器型号完全一致,所以理想L系列的数据可以完全复用,这个是我们比其他企业想的更长远的,所以说大家觉得我们套娃了,实际上对自动驾驶的研发非常有好处。
我认为技术发展和销售规模平衡并不矛盾,最近两个月我们的 AD Max 车型销量每个月保持 10% 以上的提升,30 万元以上车型 AD Max 销量占比达到 70%,部分车型部分地域 AD Max 占比达到 90% 以上,这就是我们最近这几个月技术发展带来的变化。
如果技术没有影响销售的话,可能是技术落地没有做好,没有真正解决用户需求。
之前行业普遍做轻图和有图方案的时候,其实也在做一些功能,但是一定没有端到端的使用效果好。
我觉得还是因为到了端到端这个时代,大家对这个产品的效果有了更好的体验之后,用户就会买单。
Q6:智能驾驶的技术升级是否能带来销量提升?
郎咸朋:销售有几个非常重要的漏斗,第一个是品牌,只有用户认可品牌后才会比较智驾、电池、续航等。
如果说一开始品牌就不在老百姓的选择范围内,那可能做什么都跟销量没有关系。
Q7:现在端到端在不同城市的表现不一样,我们会针对不同城市来做不同模型吗?还是说会在一个模型上不断地去调优?
詹锟:首先,模型在不同城市有不同表现,这并不代表我们要对不同城市下发不同模型,让模型获得不一样的错题。
而是说在世界模型的评测体系下,能够精准地知道这个模型在不同城市是什么表现,便于我们对其做有针对性的分析。
比如在过去的 Case 里,杭州和广州偏弱,那么对应补足杭州、广州的一些特定场景,加入训练数据中,放到模型中,让模型有全面的提升,所以模型迭代的过程并不是盲目的。
如果我们不知道产品在不同城市的表现,我们就会盲目地寻找全国各地的数据,最后实车体验时用户发现杭州还是不行。
这样的结果就是迭代效率非常低,训练数据量增加并没有效果,这就是大家都在说的大模型需要高质量数据。有精准的评测才能提高质量,而不是盲目增加数据量。
不同城市不同模型的效果其实是我们非常好的一个特点,能知道很细节的评测维度,不同模型我们有很多维度。在不同城市,还能知道它更细分的情况,让我们更有针对性。
比如是不是因为广州的高架桥特别复杂,是不是杭州的可变车道特别复杂才导致端到端的表现不如其他城市,我们是通过这种方式迭代我们的智能驾驶。
最终,我们肯定最后会把一个在全国都非常均衡的智能驾驶推送给用户。
Q8:One Model 模型怎么优化?只能靠优质数据吗?系统本身是否会有调整?
詹锟:我们现在用数据大幅训练模型。
微博上有人总结我们三个版号的含义。
第一个版号是数据,1 表示 100 万量级的 clips;2 表示 200 万的clips。
第二个版本号是模型结构。
所以优化不只是依靠数据,模型结构也很重要,里面有各种细分类型,比如 Cross Attention、Self Attention,我们在这方面会做各种各样的设计和实验,所以第二个版号有各种变化,训练策略也会发生变化,模型训练一遍就结束,还是训练一遍以后把重点那点挑出来,再重新训练一遍?还是先训练一部分,再做精选数据的训练。
这些都是在大模型训练过程中,我们逐渐积累的经验,肯定不是仅用数据来迭代。
Q9:大家都在探索自动驾驶,没有一个共识方案,所以理想端到端 +VLM 进入市场的同时,还会不会有其他探索?关于智能驾驶的短期目标,或者最终目标是怎么样?
詹锟:第一个事实是,大家都在研发阶段、尝试阶段,我们之所以敢把目前的版本推送给用户,是因为我们觉得可以类比 CNN 深度学习网络时期,当时因为一个竞赛,CNN 的性能优化了 10% 左右,性能和安全体验得到了大幅提升。
第二个事实是,在这个过程当中,不同数据、不同的模型结构、不同的训练方法,对模型的迭代都有帮助。