专栏名称: 雷峰网
中国智能硬件第一媒体
目录
51好读  ›  专栏  ›  雷峰网

【文末惊喜福利】北大计算机系黄铁军CCF-ADL讲习班:从计算机发展史讲解制造超人工智能的正途——类...

雷峰网  · 公众号  · 科技媒体  · 2017-08-15 15:50

正文

请到「今天看啥」查看全文


为什么后面几个问题一直发展很有限,背后有两个原理。一个是因为我们一直在用计算机做智能,在计算机上做神经网络、深度学习,是架构在冯诺依曼体系结构上的神经网络模型。神经网络是没有什么中心的,大量的节点进行复杂交互的网络,跟计算机体系不是一回事。二是由于没有一个针对神经网络的一种体系结构的硬件,晶体管促进了计算机的快速发展,但是没有合适的神经元器件,没有物理上做出一个硬的神经网络,又能符合我们希望的模型,没有类似于香农这样的人物出现,提供一个物理的桥梁,让你实现这些想法,数学和神经网络的想法,就不像计算机发展那么快。

但是我们还是要找这样一种路径来实现神经网络。所以神经网络发展这么多年,有高潮、有低潮,但是总有人比较坚持。1985年Hinton提出boltzman机模型。今天大家用深度学习去说boltzman机说多层网络的时候,好像是一个很新的。从1985年到2006年,没有人做的时候,我也坚持去做这个,就是报着这样一种心态,在坚持做神经网络。我是1995年读博士,1996年选题,那个时候,我们所有11个博士生,就只有一个人做神经网络,这种精神就是首先你逻辑对不对,你要认定是对的,你就坚持做下去,不管别人怎么看我这个事,为什么会有这么一种精神?因为Hinton是布尔的曾孙子,布尔逻辑那个布尔的后代,这些人是有贵族精神的,不会被流俗所影响,我认为这个方向对,我就坚持做,慢慢调吧,有人给钱,我就做,没人给钱,一个人做,有人给钱,几个人做。

2006年,Geoffrey Hinton在《Science》发表关于深度神经网络的论文,现在深度学习已经过热了。2011年,深度学习没有那么热的时候,我在斯坦福的半年访问,他们就是用layer做图象识别、语音识别、自然语言处理提升的百分点数,当然都是几个百分点,没有超过10%。后来,李飞飞组织的深度学习在比赛中,对图像识别的能力提高了11个百分点。现在已经变成用更多的数据,更深的网络,调调参数,然后一个结果,这就没有什么,从研究的角度没有什么太大意义了,但是我们都喜欢干这个事。

Alpha  go的实现里面有很多它新的想法,是一个标志性的事件,但这还不是强人工智能,自主智能,但是超出了我们传统上对人工智能的一种理解——总要把很多东西进行形式化然后表达。它的突破在把围棋当成一个图像去识别,这个跟人去识别的过程是类似的。所以我们讲高手就是棋感,棋感从哪来?就是你下的棋数,下的多,看的棋谱多,阿尔法狗看完3000万盘棋,棋感已经超出人了。你说棋感这种我们通常认为只有人类有的,机器一样可以有。这种神秘性,我们认为独有性的东西,逐渐被机器替代。

所以2030年国家的重大科技项目里面,潘院士提了五大方向:大数据智能、跨媒体智能、群体智能、混合增强智能、自主无人系统。 2030年的时候,计算机达到什么样的能力?当时定了一个目标,就是要逼近人脑的信息处理能力,具有自我认知,自主的通用人工智能。

以上是一些背景,花了不少时间,后来应该是相对好讲。

二、制造强人工智能

第二个话题,是制造强人工智能。强人工智能又叫通用人工智能,到现在为止,包括阿法狗在内的,都是弱人工智能, 专用人工智能。专用人工智能是指就事论事,要解决某个智能问题。强人工智能是要达到人类水平,能够自适应的应对外界环境挑战的具有自我意识的人工智能。一旦达到人类水平,就会超过人类水平,所以强人工智能是我们要应对的一个挑战,这个挑战也许是我们人类出现以来,要应对最大的挑战。

实际上世界上存在超级人工智能,本来我们人就是,我们本来就是一个强人工智能,我们的强人工智能基于我们的大脑,神经系统。到目前现在为止,除了人脑之外,没有任何一个自然或者人工智能系统,具有对新环境、新挑战,能够自适应,人是最典型的具有强人工智能的。

既然人可以有,我们怎么让机器有?一开始我就说类脑计算这个词,很容易用不同的角度去理解,比如说Brain-inspired  computing,受脑启发的计算,这个事已经从人工智能开始,大家都在做,脑给了我们一些模型原理,尽管很有限,但是我们得到了一些认知,认知科学给我们一些启发,我们可以设计新的算法,包括疑团算法,各种各样的。其实背后或多或少都有认知的应用。但是这样的一个理解是不能解决我说的强人工智能问题的,这样一个思路,把我们引入歧途。

我们刚才说人类大脑有强人工智能,人类大脑的强智能是怎么出现的?换一个说法,人的意识是怎么回事,或者人的思维是怎么回事,人的意识起源是什么,意识背后的原理是什么,就是这样一个问题。这样一个问题,是我们人类三大科学问题。人类面对三个最大的科学问题,第一个宇宙的起源,生命的起源,意识的起源,这三大科学问题,是一个很难的问题,要不然就不叫它大问题了。这么一个大的科学问题,什么时候能解决,你去问脑科学家,再保守的脑科学家,也不会跟你说在100年之内能解决,一般都会说大概几百年的时间,也有人说会在1000年的时间,也许永远解决不了。因为这种大问题,他们没有找到一个可行的方案,只能是说不断往这个方向探索而已,所以不能给你一个确定的答案,因为太难了。如果他们不能告诉我们,大脑是怎么产生我们的意识这种强人工智能的,我们怎么办?

别人没有给你模型,我们是不是等模型出来再去做?我们多少年来被这么教育,科学是基础,技术是基于科学我们才能发展新的技术。所以但是这种思维方式在有些情况是对的,但是大多数情况下是有问题的。比如说飞机和空气动力学,1903年莱特兄弟就造出了飞机,但是1939年才出现空气动力学用来解释飞机为什么能飞。但是今天的飞机,靠空气动力学的指导才能做得更好,但是那只是更好。第一架飞机是没有科学理论做基础的。回顾一下,我们人类历史上的技术进步和科学进步,技术进步几乎可以说都是领先于科学进步的,原创性、颠覆性的。中国四大发明,没有一个有科学原理的,你说中国没有科学技术,中国有技术,指南针早就用了,郑和也不知道地球是圆的,也不知道指南针真的指南,但是我们就做出来了。后来,等到科学逐渐的磁学,这些地球我们知道怎么回事的时候,我们才理解为什么指南针能指南。

所以我们做通用人工智能,强人工智能,是不是一定要回答——智能是怎么回事这个问题?大脑到底是怎么产生的智能,我们是不是一定要回答这个问题,如果回答等几百年之后,再去做了,那这件事就没有必要再去讨论了。实际上不是这样的,类脑计算不是Brain-inspired  computing,类脑计算是Brain-like。什么是类脑计算?我们现在并不知道大脑为什么会产生这么高级的,创造性的知觉。但是我们知道是什么样的物理系统在产生这个功能。这个大脑在物理意义上讲是怎么回事,在物质上是怎么回事,我们不说精神不说思维智能,我们说神经系统是怎么回事,是什么样的生物系统,什么样的神经网络,在发生这样一个复杂现象。所以这是大脑的解析仿真,大脑能不能解剖开,能不能把大脑的画出来,我们要搞清楚,我们要看清楚 ,是什么样的结构在做,在发生这样一个行为。所以这件事可以做的,等会儿还会讲画到什么程度。

第二个,如果我们知道大脑的神经元,神经网络这样一个结构,产生了高级的功能,我们能不能用电子也做一个。当然我们不用再去复制一个生物的东西,我们可以用神经元、神经网络的功能,连接也一样,做一个同样的系统。因为神经元也是一个信号处理,图谱是信号的加工,这样的功能我们可以用电子器件做出来,人脑其实也是一样,你抓住一定程度上的结构相似形,就会出现类似的功能,如果结构的相似性精确到一定程度,复杂性就有可能出现。所以是照葫芦画瓢做一个东西,我们不问为什么。

这样一个系统,你可以去训练它,就像今天我们说深度学习没有一个人不信,深度学习的功能在那,多层网络在那个地方,你用大量的数据训练它,它就会出现抽象能力,分类识别各种各样的能力。如果你做了一个大脑神经网络的东西去训练它,用实时的,用各种各样的刺激去训练它,它也应该出现类似的现象。一个复杂网络,会产生更复杂的现象。像简单的神经网络会产生简单的现象,复杂网络会产生复杂现象。人类一定是先理解机器智能,最终理解我们自身的智能。因为从可实现上,也应该是这样。所以你看走了四步,最终实现了理解意识,但是如果按常规的科学为先的思路,上来就现问意识怎么回事,这四步都不用走,我们就在原地等着就好了,就不会有类脑计算,不会有真正的下一代计算机了。

因为今天大家给我三个小时来讲,所以我还可以详细的去说下。2015年的时候,为了给北京市说清楚,我总结了三句话,他们说明白了,你们做吧。 结构层次模仿脑,器件层次逼近脑,智能层次超越脑。 结构层次模仿,把大脑的神经网络结构搞清楚,仿真大脑,这就是大脑反向工程。第二个,做出神经形态器件,从尺寸、功能上,逼近生物神经元,这是神经形态工程。智能层次超越脑就像我们今天去训练一个神经网络一样,用大数据,用各种的感官,当然可以用虚拟现实和虚拟环境去刺激它,让它产生复杂的行为,就是刚才说的,类似行为主义的训练。这三个层次做完之后,这个系统就会拥有高级的复杂功能。大概是这样一个路径。

所以我们所谓的类脑计算,类脑计算机,是仿造生物神经网络,采用神经形态器件构造的,以时空信息处理为中心的智能机器。为什么要强调时空信息处理,因为我们老说复杂环境。图灵机处理的数据流,实际上是已经拆借的时空信息了,尽管可以做视频,做视觉,做现在复杂的任务。但是最终时间、空间都拆碎,变成一个一起进行的数据流。一旦时间、空间被破坏之后,很多智能的任务,就很难做了。我们生物视觉、生物听觉,从来没有把时间、空间破坏掉,我们眼睛看世界,从来没有时间、空间最后变成一个一味的流,我们在真正的实施并行在做。这种新的机器,要能直接出来,以这种方式处理信息,这就是以时空信息处理为中心,时空不能破坏,时空不破坏的情况能够满足,直接进行处理。







请到「今天看啥」查看全文