专栏名称: 传感器技术

制造业的未来是智能化，智能化的基础就是传感器；互联网的方向是物联网，物联网的基石也是传感器；关注传感器技术，获得技术资讯、产品应用、市场机会，掌握最黑科技，为中国工业导航。

3D成像：光学的再次创新

传感器技术 · 公众号 · · 2017-06-04 05:47

正文

请到「今天看啥」查看全文

1）结构光的原理

结构光顾名思义就是有特殊结构的光，比如离散光斑、条纹光、编码结构光等。将这样的一维或二维的图像投影至被测物上，根据图像的大小畸变，就能判断被测物的表面形状即深度信息。

举个例子，拿一个手电照射墙壁，站近或站远，墙上的光斑是不同大小的，从不同角度照射墙，光斑也会呈现不同的椭圆。这就是结构光的基础。而深度计算的方式也有多种，如我们这里重点说一下被苹果公司收购的以色列PrimeSense公司Light Coding方案。

Light Coding的光源称为“激光散斑”，根据PrimeSense在专利中的描述，红外激光生成器射出准直后的激光束，通过光学衍射元件DOE（Diffractive Optical Elements，如扩散片和光栅）进行衍射，进而得到所需的散斑图案。这些散斑具有高度的随机性，而且会随着距离的不同而变换图案。也就是说空间中任意两处的散斑图案都是不同的。

只要在空间中打上这样的结构光，整个空间就都被做了标记，把一个物体放进这个空间，只要看看物体上面的散斑图案，就可以知道这个物体在什么位置了。当然，在这之前要把整个空间的散斑图案都记录下来，所以要先做一次光源基准标定（pattern）。

Light Coding 发射940nm波长的近红外激光，透过diffuser（光栅、扩散片）将激光均匀分布投射在测量空间中，再透过红外线摄影机记录下空间中每个参考面上的每个散斑，形成基准标定。标定时取的参考面越密，则测量越精确。获取原始数据后，IR传感器捕捉经过被测物体畸变（调制）后的激光散斑pattern；通过芯片计算，可以得到已知pattern与接收pattern在空间（x, y, z）上的偏移量，求解出被测物体的深度信息。

2）技术实现

结构光的实现难度有如下几个方面：

1）首先是经济成本，深度摄像头远高于一般的摄像头；

2）摄像头需要的空间和功率限制，手机摄像头已经可以做到很小的体积和很小的功率，但是深度摄像头还很难，特别是如果希望能达到比较高的精度；

3）很多深度摄像头是需要额外光源的，因此还要专门的散热设备。4）后端的软件匹配。

1.3.2 TOF原理及技术实现

1）TOF原理

Time of Flight是一种主动式深度感应技术，在每个像素点，除了记录光线强度信息之外，也记录下来光线从光源到该像素点的时间（即Time of Flight）。首先让装置发出脉冲光，同时接收目标物的反射光，藉由测量时间差算出目标物的距离。

如上图所示，假设脉冲波形的频率为f，接收与发送脉冲波形的相位偏移是∆φ，则∆φ/2πf为脉冲波形往返所经历的时间。用光速c乘以时间则可以得到往返距离。

2）TOF技术实现

TOF的硬件实现方式和结构光类似，区别只是在于算法上，结构光采用编码过的光pattern进行投射，而TOF直接计算相位差。

1.3.3 双目测距，传统的3D感知方法

双目测距原理类似人的双眼，在自然光下通过两个摄像头抓取图像，通过三角形原理来计算并获得深度信息。目前的双摄就是双目测距的典型应用。

1.4 3D成像是开启AI和AR时代的感知钥匙

以AI的机器视觉为例，目前主流在2D图像上通过算法实现智能识别，但是由于2D图像本身包含的信息有限，即使算法再先进，输入信息将成为智能化的短板，如果能够有全面的三维信息，每个对象的三维轮廓、物理特征将更为充分识别，提升导航、轨迹、识别等AI应用能力。同样的，AR应用中3D成像也是必不可少。

2、3D成像即将带动下一轮光学创新浪潮

2.1 交互向三维升级，想象空间巨大

纵观人机交互的历史，打孔指令带、DOS系统+键盘形成了早期一维人机交互；Windows+鼠标的二维交互方式开启了互联网/PC时代，触摸屏和摄像头的二维交互方式则开启了移动互联网/智能手机时代，而到了以AR为代表的下一代计算平台，则需要三维的交互方式。

在移动互联网时代，触摸屏和摄像头成为主要的人机交互媒介。触摸屏可以方便地实现各种操作，相比键盘和鼠标更为自然和顺畅。摄像头实现了大量的内容输入，也是一种重要的人机交互媒介。

但触摸屏和摄像头仍属于2D的交互方式。在触摸屏上，我们只能实现平面范围内的感应和触控，即使出现了3D Touch等新的触控方式，人机交互也依然只局限在一个平面上。而现有的摄像头则只能实现2D图片的拍摄，无法实现3D图像的交互。

而到了以AR为代表的下一代计算平台，则需要3D的交互方式，这是由AR设备的定义所要求的。AR技术是指借助计算机视觉技术和人工智能技术产生物理世界中不存在的虚拟对象, 并将虚拟对象准确“放置”在现实世界中。通过更自然的交互，呈现给用户一个感知效果更丰富的新环境。