业界 | AlphaGo 与柯洁华山论剑，人工智能一手遮天指日可待？

AI科技评论 · 公众号 · AI · 2017-05-22 23:47

正文

请到「今天看啥」查看全文

假设机器人能正确识别出桌子和苹果，下一步就是找到苹果。这就涉及到计算机视觉难题——就是让计算机长出一双人类的眼睛，能分辨出人可以看到的景象，提取出人能提取的信息。假设机器人能够完美捕捉三维信息，接下来就是如何理解“看到”的图像。

人类轻松识别出来图中是“几个苹果放在桌子上”

对计算机来说，“几个苹果在桌子上”的画面只是很多0或1的数字流

现在需要回答：这些0或1到底代表什么？计算机用像素来代表一张图片，每个像素都有一组数据代表该像素的颜色和光照信息，可以用下面的数学表达式来代表计算机图像识别的工作原理：

I=P(O,W)

其中I表示图像，O表示包含多个不同类别的物体集合，W表示影响因素

一张图像首先包含多个不同类别的物体集合。同一类的物体本身就存在差异，物体自身也是五颜六色。即使是同一个物体在图像中的像素值也会受到很多因素的影响，包括光照强度和方向、相对摄像机的位置和姿态、物体之间的遮挡关系、物体自身的运动、摄像机参数等。在数学分析中，从图像(I)中感知物体集合(O)就必须同时恢复这些相关参数(W)。这是一个高维度数学问题，而答案的不唯一极大地增加了计算难度。与之相比，“棋圣”AlphaGo需要求解的未知参数仅仅是下一步棋子的坐标，参数维度大大降低。这是机器人下围棋比做家务更为简单的原因之一。