2017GAITC智能驾驶分论坛实录丨Claire J. Tomlin ：Safe Learning

中国人工智能学会 · 公众号 · AI · 2017-05-30 18:35

正文

请到「今天看啥」查看全文

我们也对这个系统进行了测试，我们在伯克利有自己的机器人实验室，我们也有四旋翼的飞行器，在加利福尼亚NASA实验室，我们也对两个无人机做了实验，这里是飞行员的驾驶坐舱，我们也是避免两架飞机的相撞，大家在右上角可以看到视频的截图，下面是相关的数据。因此这两架飞机它们是相对而行，第一个是它的轨迹，蓝色的飞机处于可达极当中的，这样的计算也可以在实时进行。

我们也用真实的飞机进行了测试，比如说这里大家看到的飞机，还有无人机等等，这是波音F15飞机，我们也将它在无人机上进行了实验，我们有一个F15飞机，这也被我们放到第一轨道上，所有这些都是可达极当中的。大家看到这架飞机，根据避免撞击的努力而进行的计算，这里是两个不同的飞机它们的撞击轨迹。这张图显示我们可以实时应用技术，来计算它们的轨迹，这里都是四旋翼飞行器，我之前还在斯坦福当教授的时候就做了类似的实验，在每个街角可以做四旋翼的飞行器，4个学生控制着四架飞行器，下面可以看到相应的控制，每个飞机周围可以看到一个可达极，每一架飞行器和其他三架飞行器了相撞的可能性，还有就是安全区在哪里，如果出现这种撞击的可能，旋翼飞行器上的自动系统就会启动，防止相撞，可以最大保证它们处于安全距离之内。我们习惯用模型在这里进行计算，我们有一个系统可以计算最差的情况，我们认为最差的情况也是有极限的，所以可以找出一些可行的解决方案。我们也可以用这个技术达到我们理想的效果，我们看一下这是一个理想化的例子，我们将所有的这些干扰因素纳入到这个因素当中进行控制，这是非常重要的，我们可以进行路径的跟踪。

我们还可以对它们进行排序，可以看到目标和不同的极子，包括目标极和避免极，这样就可以让我们的飞行员去控制这些干扰的因素，从而控制我们碰撞的情况。另外就是我们在NASA也开展了另外一个实验，在NASA有一个交通管制系统，这是在北部海湾地区的地图，在这张地图上，显示出了海湾的地形情况，这里展示出了我们飞行的最短路径，右边的图显示的就是在这个图形上面也进行速度的分析，以及最短路径的展示，我们可以看到，在人口低密集的地区，我们可以看到这个最短的路径可以更快速的到达，这个要比人口密集的地区更加快速的到达，所以我们可以看到，在人口密集的地区，会存在一些风险的因素，我们需要进行控制。

在这个理论的基础上，我们就开发了一个控制系统来进行无人机的控制，这是一个控制系统，它是基于一个车队开展的控制系统，我们可以看到，在这个模型当中，这些车队都是以同样的速度开发的，我们可以看到，这是我们控制系统其中的一个部分，我们可以看到它们可以加入到高速公路当中，也可以加入车队当中，而且我们可以看到不同的模型的位置，它们也是受到了自动化的控制。我们需要使用这个控制系统，能够让这些车辆安全的进行切换，所以说在这个车队当中，我们因为有了这个控制系统，所以所有的车辆都能够非常安全的驾驶。这是一个例子，我们可以看到可达极的情况，虚线表示的是高速公路，圆圈表示的是目标的位置。我们通过对风险因素的控制，可以让我们保留在一个非常安全的区域，实际上我们是使用一些算法进行计算，所有的计算都是通过自动化的进行计算的。另外我们将侵入者也要考虑进来，它们也是属于干扰的因素，我们的车队需要对这些干扰者，也就是红色的车辆表示的位置进行控制，我们需要对这些干扰的因素进行控制，这样的话我们就能够让车辆从高速公路上再次加入到车队当中，从而进行安全的驾驶。

我们可以看到这里有三个车辆，它们都在追随其他的车辆，形成了一个车队，这里有一个非常小的实验室进行车辆的控制。另外我们还有干扰者，在这里，这个干扰者就进入到了车队的最前端，我们可以看到，这里我们也有一个可达极，我们也可以使用三辆车子形成的进行自动化的控制，从而让这个车队进行安全的控制，这也是我们在NASA开展的实验。

所有我刚才讲的内容都是基于模型的，我们可以在模型上进行计算，进行控制。好的，对于一个模型来说，典型的组成部分就是我们有一个可达极为五，我们要根据环境设置我们的可达极，一般来说需要建立一个非常好的模型，人们的行为和互动也要纳入进去，我们需要更新安全的配置。

我们看一下一个有趣的体验，我们要进行一个基于模型的控制。我们设计了一个使用神经网络和深度学习进行的在线的数据控制系统，这个车辆它有两个操作系统，其中一个正旋曲线系统进行控制，另外一个车辆是使用偏航的系统进行控制，这是我们的培训极，在这个模型基础之上，能够跟踪这些车辆的路线和轨迹，这样我们就可以了解到这些车辆的轨迹，从而对它们进行安全的控制。我认为这个系统运作的非常的良好，可以通过实践来证明它的运作非常良好，通过这个控制系统，我们可以追踪这个车辆的轨迹，这是一个非常简单的两层模型。

再看最后一部分，也就是将学习和安全结合起来。首先，我们将这两方面分离开来，成为两个不同的问题，可能在这个过程中会遇到非常大的干扰因素，但是我们有基于安全的控制，所以我们就会保证在这个驾驶的过程当中的安全，我们有了对于可达极的计算以后，我们就能够确保驾驶在最糟糕的情况下也能够确保安全。另外，我们设置了一个名以上的安全极，我们使用在线的数据的学习，来更新我们的模型。另外我们将学习和安全分为两个不同的因素，并且进行一些函数的运算，保证安全性。

在这里我们使用了四旋翼飞行器进行了实验，实验当中飞行器上上下下进行飞行，在这个实验当中我们找出了实验的安全区。我们在这个曲线当中找到了它的区间所在，以及可达极，然后我们再把这个车辆的模型拿走，需要去学习自己的模型，来控制它的安全性。所以，在这个过程当中，也是将安全和学习分离开来了，这里是我们使用的使用的安全曲线，实际上这个学习的曲线也是非常简单的。我们在运行它的时候发生了什么呢，首先就是这个飞行器落到了地上，但是它并没有触碰到地面，因为在飞行器的底部有一个缓冲器，然后它就会反弹过来，也就是说在这个飞行器坠落与反弹的过程当中，它就会自动进行学习，在线的系统上面对它的轨迹进行追踪，就可以学习到如何追踪这个轨迹了，所以说我们的飞行器总是在缓冲区保护范围之内的，我们可以将这两个简单的部分组合在一起，因为它是整个系统。对于人类的司机来说也是这样的，最开始，人类司机最初学习驾驶的时候也是非常保守的，然后慢慢接近安全的阈值了，所以慢慢就胆大一些，这个道理同样适用于飞行器，因为有缓冲器的保护，所以它也是慢慢的开放的进行驾驶的。这里展示的是一个高斯的过程，是通过函数进行高斯的分配，所以我们可以学到在这个系统当中有一些平均的函数，还有一些方差，还有对干扰因素进行衡量等等。

这里的观点呢，我们通过一些函数的计算进行安全控制，我们需要了解一些不安全的因素，它们的组成是什么，以及它们在函数当中的权重是什么，我们要考虑最糟糕的因子，对这些不安全因素进行控制。随着时间的推移，我们开始建立一个非常好的名以上的模型，在模型当中加入到我们的考虑，我给大家展示一个视频，显示了我们做的实验，而且在这个实验当中我们用实际数据对缓冲器进行了更新。在这里有两个实验进行排序，我们是平行的进行排序，左边进行四旋翼飞行器的实验，这和我们之前的实验是一样的，但是在这个实验当中并没有对数据进行更新，另外一个实验当中，我们对安全性进行了更新，我们只是根据这个模型进行运行，根据一些算法进行计算，对这个轨迹进行追踪，就能够控制它的飞行。我们可以看到，这个飞行器也是下坠，但是由于我们的安全控制，由于缓冲器的保护，它就没有碰到地面，反弹回来了，这里有一个风机，打开风机就会产生风的干扰。在过去的实验当中，我们并没有将它纳入到实验当中，现在我们在这个实验当中，将风产生的阻力的干扰因素纳入进来了，所以这两个是研究会产生不同的结果。我们可以看到在这个实验当中，我们会将不安全的干扰因素纳入进来，然后在这个模型当中进行计算，在左边的图形当中可以看到，缓冲器能够反弹，将飞行器反弹回来。可以看到，开始对这个飞行器的缓冲器进行边界的计算和了解，我们就可以对这个轨迹进行验证，可以更加安全控制这个飞行器的驾驶。我们可以对安全极进行精简。如果我们将风机关闭以后，缓冲器又可以不受干扰进行工作了。