看不懂「世界模型」，就像你看不懂人间爱情

焉知新能源汽车 · 公众号 · · 2024-09-07 14:17

正文

请到「今天看啥」查看全文

詹锟：我从技术角度来说，我们有安全兜底模块，甚至有些东西我们会保证它有绝对的下限。

以前写了很多规则应对不同的场景，但是现在只需要写下限的规则，上限全靠端的端、VLM 去捕捉，甚至有些防御性驾驶，VLM 都可以提前告诉系统，比如丁字路口、坑洼小路等，这些都在一定程度上提升了系统安全性。无论是数据还是算法，都是在把安全性往上提升。

并不是大家说的那样，用端到端了安全就差了，这是针对设计不完善的一种想法。

另外，AEB/AES 其实是在最极端的情况下，最兜底的一种保证绝对安全的方式。

这就是用算法、冗余一起来解决安全问题。

Q4：现在从生成到输出，对于传感器包括数据需要有一些质量监测，这个过程中如果出现恶意攻击，甚至说出现各种故障，这种情况理想汽车怎么解决这数据安全的问题？

詹锟：面对数据被污染或者传感器遭受恶意攻击，以及对神经网络进行对抗性破坏，我们已经将这种情况涵盖到整个网络训练过程中。

模型训练并不是针对单一的传感器，比如一个传感器损坏，我们能够通过 BEV 解决。

即使在雨天某个传感器脏污的很厉害，我们依然能稳健驾驶，同时能给用户对应提醒，会告诉你找个安全的地方停车，不会让系统直接失效。

因为有 Radar、Lidar 等多个传感器，各个传感器在不同环境下能冗余互补，单一的攻击很难起效，这就是为什么很难有单一的攻击策略能让智驾系统失效，因为在技术上做了很多防护。

Q5：理想汽车怎么衡量技术发展和销售规模平衡问题？

郎咸朋：理想 L 系列外观比较相似，外界也说是在套娃，但是这让我们有个最大的优势。

传感器布局和传感器型号完全一致，所以理想L系列的数据可以完全复用，这个是我们比其他企业想的更长远的，所以说大家觉得我们套娃了，实际上对自动驾驶的研发非常有好处。

我认为技术发展和销售规模平衡并不矛盾，最近两个月我们的 AD Max 车型销量每个月保持 10% 以上的提升，30 万元以上车型 AD Max 销量占比达到 70%，部分车型部分地域 AD Max 占比达到 90% 以上，这就是我们最近这几个月技术发展带来的变化。

如果技术没有影响销售的话，可能是技术落地没有做好，没有真正解决用户需求。

之前行业普遍做轻图和有图方案的时候，其实也在做一些功能，但是一定没有端到端的使用效果好。

我觉得还是因为到了端到端这个时代，大家对这个产品的效果有了更好的体验之后，用户就会买单。

Q6：智能驾驶的技术升级是否能带来销量提升？

郎咸朋：销售有几个非常重要的漏斗，第一个是品牌，只有用户认可品牌后才会比较智驾、电池、续航等。

如果说一开始品牌就不在老百姓的选择范围内，那可能做什么都跟销量没有关系。

Q7：现在端到端在不同城市的表现不一样，我们会针对不同城市来做不同模型吗？还是说会在一个模型上不断地去调优？

詹锟：首先，模型在不同城市有不同表现，这并不代表我们要对不同城市下发不同模型，让模型获得不一样的错题。

而是说在世界模型的评测体系下，能够精准地知道这个模型在不同城市是什么表现，便于我们对其做有针对性的分析。

比如在过去的 Case 里，杭州和广州偏弱，那么对应补足杭州、广州的一些特定场景，加入训练数据中，放到模型中，让模型有全面的提升，所以模型迭代的过程并不是盲目的。

如果我们不知道产品在不同城市的表现，我们就会盲目地寻找全国各地的数据，最后实车体验时用户发现杭州还是不行。

这样的结果就是迭代效率非常低，训练数据量增加并没有效果，这就是大家都在说的大模型需要高质量数据。有精准的评测才能提高质量，而不是盲目增加数据量。

不同城市不同模型的效果其实是我们非常好的一个特点，能知道很细节的评测维度，不同模型我们有很多维度。在不同城市，还能知道它更细分的情况，让我们更有针对性。

比如是不是因为广州的高架桥特别复杂，是不是杭州的可变车道特别复杂才导致端到端的表现不如其他城市，我们是通过这种方式迭代我们的智能驾驶。

最终，我们肯定最后会把一个在全国都非常均衡的智能驾驶推送给用户。

Q8：One Model 模型怎么优化？只能靠优质数据吗？系统本身是否会有调整？

詹锟：我们现在用数据大幅训练模型。

微博上有人总结我们三个版号的含义。

第一个版号是数据，1 表示 100 万量级的 clips；2 表示 200 万的clips。

第二个版本号是模型结构。

所以优化不只是依靠数据，模型结构也很重要，里面有各种细分类型，比如 Cross Attention、Self Attention，我们在这方面会做各种各样的设计和实验，所以第二个版号有各种变化，训练策略也会发生变化，模型训练一遍就结束，还是训练一遍以后把重点那点挑出来，再重新训练一遍？还是先训练一部分，再做精选数据的训练。

这些都是在大模型训练过程中，我们逐渐积累的经验，肯定不是仅用数据来迭代。

Q9：大家都在探索自动驾驶，没有一个共识方案，所以理想端到端 +VLM 进入市场的同时，还会不会有其他探索？关于智能驾驶的短期目标，或者最终目标是怎么样？

詹锟：第一个事实是，大家都在研发阶段、尝试阶段，我们之所以敢把目前的版本推送给用户，是因为我们觉得可以类比 CNN 深度学习网络时期，当时因为一个竞赛，CNN 的性能优化了 10% 左右，性能和安全体验得到了大幅提升。

第二个事实是，在这个过程当中，不同数据、不同的模型结构、不同的训练方法，对模型的迭代都有帮助。

​看不懂「世界模型」，就像你看不懂人间爱情

正文

请到「今天看啥」查看全文

请到「今天看啥」查看全文

看不懂「世界模型」，就像你看不懂人间爱情