专栏名称: 算法与数学之美
从生活中挖掘数学之美,在实践中体验算法之奇,魅力旅程,从此开始!
目录
相关文章推荐
九章算法  ·  微软宣布裁员8000人!强制员工RTO赶超亚麻! ·  3 小时前  
九章算法  ·  又一批美国码农要暴富了! ·  昨天  
九章算法  ·  Meta猛发offer!杀疯了! ·  2 天前  
51好读  ›  专栏  ›  算法与数学之美

计算机视觉随谈

算法与数学之美  · 公众号  · 算法  · 2016-12-08 22:37

正文

请到「今天看啥」查看全文


好了,视觉是啥?视觉就是看东西,呃,不是很专业。视觉是为了获取关于环境中物体和事件的信息,从物体发射或者反射出来的光中提取信息的过程。所以我们第一件需要考虑的事情是,这些信息在什么形式的时候才是有效的?

物体发出或者反射的光会被收集和度量,当然了,这里没有特定任务的信息提取的处理。生物视觉系统和人工视觉系统都通过同一种方式来完成这第一个步骤,也就是将这些光投影到一个二维的图像中。对于人眼和摄像头,虽然存在不少差别,但图像信息的处理基本是相同的。通过非常多的感光的细胞或者感光的原件接受光,然后将这些光的强度变成一个二维图像。然后图像的每个点的光强度就保存了某种信息。

一般来说,投影图像还具有时间和彩色的维度。但我们大部分关注静态和灰度的图像。这个图像可以表示为二维的标量函数I(x,y),也就是给定每个位置(x,y),会得到一个对应的灰度值I(x,y)。尽管位置和灰度值都应该是连续的,但典型的情况是离散采样。也就是说x和y是整数,而灰度值在每个点采样。在数字系统中,采样一般也是矩形。但实际上,生物系统中的空间采集采样并不是矩形的,甚至是无规律的。

视觉就是从这种图像数据中提取信息的。物理环境的信息包含在这个图像中的,但很遗憾,是隐含着的。视觉系统必须将这种隐含的信息变换成明确的形式,例如识别环境中的物体。但这不是一件容易的事情。

二、人类视觉系统的魔法

视觉是个非常棘手的任务。尽管这对搞视觉的人来说没什么可以惊讶的,但对其他人来说,他们可能会觉得非常惊讶,他似乎没有意识到自己与生俱来的双眼是如此的强大和不可复制。因为他几乎毫不费力的无时无刻的既有效又快速执行这个任务。但实际上在你看我的文字的时候,你大脑的整个计算过程是非常复杂的,但可惜呀,我们一般只在乎这个结果,大脑直接给我们它的计算结果,而没有告诉我们它完成这个是多么的辛苦。默默无闻,以使得被忽略和遗忘。







请到「今天看啥」查看全文