专栏名称: AI科技评论
「AI科技评论」是国内顶尖人工智能媒体和产业服务平台,专注全球 AI 业界、学术和开发三大方向的深度报道。
目录
相关文章推荐
爱可可-爱生活  ·  //@爱可可-爱生活:欢迎参与~-20250 ... ·  13 小时前  
爱可可-爱生活  ·  【[2k星]PandaWiki:AI大模型驱 ... ·  21 小时前  
AI产品阿颖  ·  灵魂拷问Sam Altman。 ·  2 天前  
51好读  ›  专栏  ›  AI科技评论

业界 | AlphaGo 与柯洁华山论剑,人工智能一手遮天指日可待?

AI科技评论  · 公众号  · AI  · 2017-05-22 23:47

正文

请到「今天看啥」查看全文


假设机器人能正确识别出桌子和苹果,下一步就是找到苹果。这就涉及到计算机视觉难题——就是让计算机长出一双人类的眼睛,能分辨出人可以看到的景象,提取出人能提取的信息。假设机器人能够完美捕捉三维信息,接下来就是如何理解“看到”的图像。

人类轻松识别出来图中是“几个苹果放在桌子上”

对计算机来说,“几个苹果在桌子上”的画面只是很多0或1的数字流

现在需要回答:这些0或1到底代表什么?计算机用像素来代表一张图片, 每个像素都有一组数据代表该像素的颜色和光照信息,可以用下面的数学表达式来代表计算机图像识别的工作原理:

I=P(O,W)

其中I表示图像,O表示包含多个不同类别的物体集合,W表示影响因素

一张图像首先包含多个不同类别的物体集合。同一类的物体本身就存在差异,物体自身也是五颜六色。即使是同一个物体在图像中的像素值也会受到很多因素的影响,包括光照强度和方向、相对摄像机的位置和姿态、物体之间的遮挡关系、物体自身的运动、摄像机参数等。在数学分析中,从图像(I)中感知物体集合(O)就必须同时恢复这些相关参数(W)。这是一个高维度数学问题,而答案的不唯一极大地增加了计算难度。与之相比,“棋圣”AlphaGo需要求解的未知参数仅仅是下一步棋子的坐标,参数维度大大降低。这是机器人下围棋比做家务更为简单的原因之一。







请到「今天看啥」查看全文