可用于自动驾驶领域的神经网络及深度学习

集微网 · 公众号 · 硬件 · 2017-05-23 07:52

正文

请到「今天看啥」查看全文

卷积式神经网络 (CNN) 的应用可分为三个阶段：训练、转化及 CNN 在生产就绪解决方案中的执行。要想获得一个高性价比、针对大规模车辆应用的高效结果，必须在每阶段使用最为有利的系统。

训练往往在线下通过基于 CPU 的系统、图形处理器 (GPU) 或现场可编程门阵列 (FPGA) 来完成。由于计算功能强大且设计人员对其很熟悉，这些是用于神经网络训练的最为理想的系统。

在训练阶段，开发商利用诸如 Caffe 等的框架对 CNN 进行训练及优化。参考图像数据库用于确定网络中神经元的最佳权重参数。 训练结束即可采用传统方法在 CPU、GPU 或 FPGA 上生成网络及原型，尤其是执行浮点运算以确保最高的精确度。

作为一种车载使用解决方案，这种方法有一些明显的缺点。运算效率低及成本高使其无法在大批量量产系统中使用。

CEVA 已经推出了另一种解决方案。这种解决方案可降低浮点运算的工作负荷，并在汽车应用可接受的功耗水平上获得实时的处理性能表现。 随着全自动驾驶所需的计算技术的进一步发展，对关键功能进行加速的策略才能保证这些系统得到广泛应用。

利用被称为 CDNN 的框架对网络生成策略进行改进。经过改进的策略采用在高功耗浮点计算平台上（利用诸如 Caffe 的传统网络生成器）开发的受训网络结构和权重,并将其转化为基于定点运算，结构紧凑的轻型的定制网络模型。接下来，此模型会在一个基于专门优化的成像和视觉 DSP 芯片的低功耗嵌入式平台上运行。图 1 显示了轻型嵌入式神经网络的生成过程。 与原始网络相比，这种技术可在当今量产型车辆的有限功率预算下带来高性能的神经处理表现，而图像识别精确度降低不到 1%。