专栏名称: 焉知新能源汽车
新能源汽车三电科技资讯、干货等,专注:燃料电池、动力电池、电机电控、充电基础设施
目录
相关文章推荐
三个妈妈六个娃  ·  高考首日!那些从小学就重视这三点的家庭,现在赢麻了 ·  17 小时前  
丁香妈妈  ·  妇科问题,不好意思去医院?试试这个办法 ·  2 天前  
DataEye短剧观察  ·  DataEyeDataEye微短剧热力榜:番 ... ·  2 天前  
DataEye短剧观察  ·  DataEyeDataEye微短剧热力榜:番 ... ·  2 天前  
51好读  ›  专栏  ›  焉知新能源汽车

​看不懂「世界模型」,就像你看不懂人间爱情

焉知新能源汽车  · 公众号  ·  · 2024-09-07 14:17

正文

请到「今天看啥」查看全文


詹锟:我从技术角度来说,我们有安全兜底模块,甚至有些东西我们会保证它有绝对的下限。

以前写了很多规则应对不同的场景,但是现在只需要写下限的规则,上限全靠端的端 、VLM 去捕捉,甚至有些防御性驾驶,VLM 都可以提前告诉系统,比如丁字路口、坑洼小路等,这些都在一定程度上提升了系统安全性。无论是数据还是算法,都是在把安全性往上提升。

并不是大家说的那样,用端到端了安全就差了,这是针对设计不完善的一种想法。

另外,AEB/AES 其实是在最极端的情况下,最兜底的一种保证绝对安全的方式。

这就是用算法、冗余一起来解决安全问题。

Q4:现在从生成到输出,对于传感器包括数据需要有一些质量监测,这个过程中如果出现恶意攻击,甚至说出现各种故障,这种情况理想汽车怎么解决这数据安全的问题?

詹锟:面对数据被污染或者传感器遭受恶意攻击,以及对神经网络进行对抗性破坏,我们已经将这种情况涵盖到整个网络训练过程中。

模型训练并不是针对单一的传感器,比如一个传感器损坏,我们能够通过 BEV 解决。

即使在雨天某个传感器脏污的很厉害,我们依然能稳健驾驶,同时能给用户对应提醒,会告诉你找个安全的地方停车,不会让系统直接失效。

因为有 Radar、Lidar 等多个传感器,各个传感器在不同环境下能冗余互补,单一的攻击很难起效,这就是为什么很难有单一的攻击策略能让智驾系统失效,因为在技术上做了很多防护。

Q5:理想汽车怎么衡量技术发展和销售规模平衡问题?

郎咸朋:理想 L 系列外观比较相似,外界也说是在套娃,但是这让我们有个最大的优势。

传感器布局和传感器型号完全一致,所以理想L系列的数据可以完全复用,这个是我们比其他企业想的更长远的,所以说大家觉得我们套娃了,实际上对自动驾驶的研发非常有好处。

我认为技术发展和销售规模平衡并不矛盾,最近两个月我们的 AD Max 车型销量每个月保持 10% 以上的提升,30 万元以上车型 AD Max 销量占比达到 70%,部分车型部分地域 AD Max 占比达到 90% 以上,这就是我们最近这几个月技术发展带来的变化。

如果技术没有影响销售的话,可能是技术落地没有做好,没有真正解决用户需求。

之前行业普遍做轻图和有图方案的时候,其实也在做一些功能,但是一定没有端到端的使用效果好。

我觉得还是因为到了端到端这个时代,大家对这个产品的效果有了更好的体验之后,用户就会买单。

Q6:智能驾驶的技术升级是否能带来销量提升?

郎咸朋:销售有几个非常重要的漏斗,第一个是品牌,只有用户认可品牌后才会比较智驾、电池、续航等。

如果说一开始品牌就不在老百姓的选择范围内,那可能做什么都跟销量没有关系。

Q7:现在端到端在不同城市的表现不一样,我们会针对不同城市来做不同模型吗?还是说会在一个模型上不断地去调优?

詹锟:首先,模型在不同城市有不同表现,这并不代表我们要对不同城市下发不同模型,让模型获得不一样的错题。

而是说在世界模型的评测体系下,能够精准地知道这个模型在不同城市是什么表现,便于我们对其做有针对性的分析。

比如在过去的 Case 里,杭州和广州偏弱,那么对应补足杭州、广州的一些特定场景,加入训练数据中,放到模型中,让模型有全面的提升,所以模型迭代的过程并不是盲目的。

如果我们不知道产品在不同城市的表现,我们就会盲目地寻找全国各地的数据,最后实车体验时用户发现杭州还是不行。

这样的结果就是迭代效率非常低,训练数据量增加并没有效果,这就是大家都在说的大模型需要高质量数据。有精准的评测才能提高质量,而不是盲目增加数据量。

不同城市不同模型的效果其实是我们非常好的一个特点,能知道很细节的评测维度,不同模型我们有很多维度。在不同城市,还能知道它更细分的情况,让我们更有针对性。

比如是不是因为广州的高架桥特别复杂,是不是杭州的可变车道特别复杂才导致端到端的表现不如其他城市,我们是通过这种方式迭代我们的智能驾驶。

最终,我们肯定最后会把一个在全国都非常均衡的智能驾驶推送给用户。

Q8:One Model 模型怎么优化?只能靠优质数据吗?系统本身是否会有调整?

詹锟:我们现在用数据大幅训练模型。

微博上有人总结我们三个版号的含义。

第一个版号是数据,1 表示 100 万量级的 clips;2 表示 200 万的clips。

第二个版本号是模型结构。

所以优化不只是依靠数据,模型结构也很重要,里面有各种细分类型,比如 Cross Attention、Self Attention,我们在这方面会做各种各样的设计和实验,所以第二个版号有各种变化,训练策略也会发生变化,模型训练一遍就结束,还是训练一遍以后把重点那点挑出来,再重新训练一遍?还是先训练一部分,再做精选数据的训练。

这些都是在大模型训练过程中,我们逐渐积累的经验,肯定不是仅用数据来迭代。

Q9:大家都在探索自动驾驶,没有一个共识方案,所以理想端到端 +VLM 进入市场的同时,还会不会有其他探索?关于智能驾驶的短期目标,或者最终目标是怎么样?

詹锟:第一个事实是,大家都在研发阶段、尝试阶段,我们之所以敢把目前的版本推送给用户,是因为我们觉得可以类比 CNN 深度学习网络时期,当时因为一个竞赛,CNN 的性能优化了 10% 左右,性能和安全体验得到了大幅提升。

第二个事实是,在这个过程当中,不同数据、不同的模型结构、不同的训练方法,对模型的迭代都有帮助。







请到「今天看啥」查看全文