专栏名称: 三联生活周刊
一本杂志和他倡导的生活。
目录
相关文章推荐
新周刊  ·  作家李静睿:当两个P人成为父母后 ·  8 小时前  
三联生活周刊  ·  买不起12000的人机工程椅,从GL8上拆一把也行 ·  9 小时前  
三联生活周刊  ·  曾绝食抗议的“草根政客”,当上了韩国新总统 ·  15 小时前  
三联生活周刊  ·  哈佛女孩的演讲为什么引发争议? ·  昨天  
新周刊  ·  是谁发明了“老钱风笑声” ·  昨天  
51好读  ›  专栏  ›  三联生活周刊

“智驾”集体改名:真正的自动驾驶走到哪一步了?

三联生活周刊  · 公众号  · 杂志  · 2025-05-09 18:00

正文

请到「今天看啥」查看全文


而且接管这个动作本身也有不小难度。当驾驶员进入智能辅助驾驶模式时,系统对于周边环境是否可以进入,还能有一个比较明确的判断。但在系统退出,交给人接管时,系统的判断往往没有那么清晰。试想如果需要人接管时,人没有接管,车开到沟里去了,反倒可能更加危险。当下智驾系统对场景的理解,往往还没有办法达到让接管很平顺的程度。同样的问题也出现在对于接管时速度的把控上,在高速上,很难硬性规定接管时的速度要降到多少,因为一旦后面有跟车,可能造成追尾,因而也需要具体判断。

所以目前L2+难以保证驾驶员能够安全接管,业内对于智驾系统在何时、在何种条件下需要驾驶员接管,也没有明确的规定。

三联生活周刊:智驾系统是否能够确认自身的技术水平面对哪些场景是安全的,哪些是有风险的?

孙辉: 对于边缘场景,因为是“黑天鹅”,所以实际上是无法预知的。面对这种局面,以特斯拉FSD (完全自动驾驶) 为代表的技术路线,希望将端到端大模型部署到车上,智驾系统一端感知,经过自己系统处理后直接输出结果。因为端到端大模型具有举一反三的泛化能力,能够自己“认出”“黑天鹅”。

但一方面这种方式需要海量的数据做支撑,特斯拉FSD的V12版本已经覆盖了30亿公里的行驶里程数据,这些数据从采集到标注的成本要七八十亿元。国内的车企若想训练出同等水平的大模型,就面临同样巨大的成本。据我所知,以往研发自动驾驶的企业,每年大约会投入数千万元做数据标注,而对于目前生产乘用车的企业,投入的成本要高五到十倍。而像华为在算力建设上,要投入上百亿元,它们的模型要做到五天一迭代,两三周一次OTA (空中下载技术,也就是远程升级)

另一方面,由于是依靠数据,总有遇到突发情况的可能。像同样是FSD,美国的FSD就比中国引进的FSD效果好很多。而除了增加传感器数量,使用“激光雷达+纯视觉”的办法,国内企业需要不断投喂数据,或是做分解模型,生成场景再让系统学习,但同样杜绝不了边缘场景的可能性。

2021款特斯拉 Model Y配备 FSD 系统。 FSD的V12版本已经覆盖了30亿公里的行驶数据,国内车企想要训练出同水平的大模型,需要付出巨大成本

除此之外,现在我们能够知道的是,想要达到比较顺滑的自动驾驶状态,在自动驾驶系统里使用端到端大模型,需要3000TOPS (也就是要求芯片每秒执行3000万亿次计算) 的算力。目前比较好的算力在500〜1000TOPS,根据摩尔定律推测,达到3000TOPS的水平,还需要两到三年。

对于验证不同软硬件水平面对哪些场景是安全的,属于预期功能安全的范畴,目前国内有关部门正在做测试,但没有任何一个车企的产品获得过预期功能安全证书。而无论面对哪些场景,预计未来L3的标准形成后,配备激光雷达作为安全冗余,大概率会是车企的普遍选择,因为从车企担责的角度考虑,激光雷达的成本远低于算法会带来的风险。

2024年1月11日,一辆自动驾驶网约车行驶在武汉街头,目前武汉已成为全球最大的自动驾驶运营服务区 (柯皓 摄 / 视觉中国 供图)

三联生活周刊:在当前没有完美接管办法的情况下,智驾系统应如何尽量保证安全?

孙辉:实际上,从技术层面来说,DMS (驾驶员监测系统) 就可以很好地实时监测驾驶员的微表情信息,一旦驾驶员分神或疲劳,就提示驾驶员保持注意力,保证智驾系统只是辅助的功能。但是,由于驾驶员会介意车内隐私,甚至一些车型的DMS摄像头在出厂时就有一个挡板,法规中也没有强制要求乘用车的智驾系统安装DMS的监控摄像头,所以DMS的作用很有限。

我认为,通过监控驾驶员来规范驾驶行为本身就很难,在具备相当自动驾驶能力的情况下,更应该采用高阶自动驾驶系统会采取的最小风险策略。就是当系统感知到驾驶员不在安全状态,或是外部环境超出设计运行条件,或是非常严重的自动驾驶系统、车辆故障,或是紧急碰撞风险时,系统能够迅速应急处理,采取降级运行模式,如将车辆安全地引导至路边停车,或在确保安全的前提下,以较低的速度行驶到安全位置。

名不副实的功能推广

三联生活周刊:听起来,最小风险策略的方式对于车企和驾驶员都有利,为什么在目前的L2+中没有实现?

孙辉: 因为能够实现最小风险策略也需要硬件做支持,比如当下如果智驾系统没有配备激光雷达,无法对物体有准确的判断,有这个策略也无济于事。目前智驾系统发现风险后,很难保证安全地将车辆交与驾驶员接管,驾驶员很可能是在速度很快、距离障碍物很近的情况下接管。甚至智驾系统可能无法发现风险。而目前一颗激光雷达的价格在2000到3000元人民币之间,达到500TOPS的芯片价格在500到1000美元之间。一些低端车型显然无法承受,目前也已经出现过一些低端车型无法识别障碍物的情况。而对于车企而言,往往在同一款车的不同配置中配备不同的传感器和芯片,如果高端车型具备最小风险策略的能力,低端车型却不具备,那么低端车型可能就卖不出去,所以车企对此的宣传几乎没有。

三联生活周刊:类似的情况是不是个例?在技术的能力边界并不清晰的情况下,车企对智驾技术的推广有什么特点?

孙辉: 在我的印象里,智驾的卖点每隔几年就会更新一次。 随着智驾系统的发展,智驾作为卖点,往往被车企夸大了能力。 五六年前,车企推出智驾系统时,会宣传高速上的自主变道功能,而如今整体而言,自主变道做得也不是很好。两三年前,城市NOA开始出现。如今的技术路线也已经日渐明确,基本就是城市NOA和AVP (自主代客泊车系统) 这两个功能在不断迭代。于是,车企这两年在发布新车时,会宣称智驾开城,也就是NOA技术能够应用到多少个城市。开城速度快慢、数量多寡,成为NOA技术成熟与否、市场覆盖面大小的评判标准。不过,车企往往采用的是“先硬后软”的策略,先进行所谓“全国都能开”的宣传,之后期望通过OTA的形式再后续升级。可是,现在能够达到NOA的城市也没有几个。现在车企又宣称自己的车都配备了端到端大模型。而就像之前所说,实际上目前还达不到。

2022年9月18日,北京,2022世界智能网联汽车大会,参观者在无人智能驾驶系统技术示范区观看(视觉中国供图)

三联生活周刊:今年被称为“智驾平权”元年,高速NOA的技术甚至被下放到5万元一档的车型上。而这样的车型只会采用纯视觉的路线。纯视觉的路线目前成了车企降低成本、推广智驾的一个手段?

孙辉: 是的。一些声称具有智驾功能的低配车型,它们的价格在5万到10万元人民币之间,使用的芯片往往低于100美元,算力只有数十TOPS。为了减少算力的负担,它们会在运算时加载高精地图,但它们对临时的维修路段等边缘场景的感知能力可想而知。

这些营销策略对于年轻用户的风险可能更大。一方面,年轻人群体的消费能力低,又更容易接受新事物,低价又具有智驾功能的车,对他们很有吸引力;但另一方面,作为他们人生中的第一辆车,他们的驾驶经验又往往不足。

所以需要始终明确的是,L2+仍是L2,在这个级别下,一旦出现事故,仍然是驾驶员的责任。而L2的核心目的,一个是让驾驶员少疲劳,一个是在极端情况下,通过一些操作使车辆实现避险。当下的宣传容易造成误导,反倒削弱了L2原本的功能。 即便智驾系统被宣传得再先进,对于驾驶员来说,没有达到L3之前,目前也应该像L2级别那样约束自己的驾驶行为,始终保持注意力的集中。







请到「今天看啥」查看全文