MIT“跨越性”AI芯片解密：真的是颠覆性创新吗？

矽说 · 公众号 · 半导体 · 2018-02-18 16:42

正文

请到「今天看啥」查看全文

为了降低内存访问能耗，可以在CNN中使用1-bit权重，并且根据相关论文1-bit权重在AlexNet上能实现还不错的效果。所以，本论文也将会使用 1-bit权重 ，具体地说，CNN输入是高精度数字，而权重则是binary（-1或1）。这里需要提醒读者的是，虽然1-bit在一些场合可以实现不错的效果，但是选择使用1-bit作为权重也大大限制了论文中描述架构的灵活性，因为1-bit权重目前使用的场合毕竟还比较有限。

如果做一些数学变换，卷积输出实际上是输入的加权平均。所以该论文使用Multiplication-And-Average (MAV)操作来实现内存内计算。

Conv-SRAM与MAV具体实现

Conv-SRAM的具体实现如下图所示：权重（1-bit）储存在SRAM中，输入数据（7-bit数字信号）经过DAC成为模拟信号，而根据SRAM中的对应权重，DAC的输出在模拟域被乘以1或者-1，然后在模拟域做平均，最后由ADC读出成为数字信号，这个操作即MAV。

这么做能实现几个特点：首先，这里不再有明显的“读写内存”的动作，因为根据当前内存的内容（即权重）直接对输入数据进行操作，避免了之前的“从内存读数据——从内存读权重——权重与数据相乘——结果存回内存”的冯诺伊曼式计算过程。当然，不用读写内存这件事从另一个角度看是因为计算全部是在模拟域完成，做模拟信号处理的时候不使用冯诺伊曼式的处理模型本来就很常见。第二个特点是，因为CNN中输入数据是被带不同权重的卷积核复用的，因此一组输入数据可以广播给多组不同卷积核做并行处理。