正文
这里有另外一个例子,来自于最近的一个研究,自然语言的研究已经得到了很大的提升
。比如谷歌翻译现在也比之前要更加精确了,为什么呢?主要是由于深层次的神经网络,甚至是因为有一些储存。通过对大脑的研究,我们来研究大脑怎么样用这个神经活动来解释相应的一些词义,这些词义给我们一些更好的回答问题的方式。对这些细节进行研究后,我们产生一种模型或者理论来帮助我们对大脑的活动进行预测,任何一个词输入人脑会出现怎样的一个词义。通过这样一个模型的结构,任何输入都可以被研究。比如说电话,首先这个模型产生一个代码,用它预测大脑的神经活动,能预测出大脑中两万多个不同的位置。进一步通过矢量预测,比如这里是“芹菜”和“飞机”两个矢量,两个矢量的特征都和相应的词对应,我们可以看到和芹菜相关联的有“吃”,“味道”一类,而对“飞机”来说,相关联的就出现很多动词,相关的一些词就出现了。
通过这样一些模型当中的编码,可以很好地反映出皮层中出现的词,有助于我们对模型进行训练。我们看到对任何词的神经活动,比如“芹菜”,把这些语义的特征组合起来,通过模型分析,关联这些特征,“吃”这个词和“芹菜”这个词是关联度最高的,通过这样的研究很有意义,给到一个新词,比如说之前没有培训过。我们发现,在83%的情况下有两个新的词,哪个是第一个关联,哪个是第二个关联,有50%的可能性是正确的,有的词从来没有出现也是有很高的识别率。词义的表达,是我们矢量表达法在词义解释上的应用。
第三个例子是强化学习
,这个是非常流行的,比如相关的训练当中会出现强化学习。很多时候对动物的奖励是强化学习的一种很好的方式。
这里有张图,底部有一些横线,每一个点都是对应到猴子一个正在放电的神经元,在下面可以看到有时间的序列,给猴子一些糖,猴子的神经元就有放电的现象。神经元放电代表什么呢?可能是猴脑对这个奖励,也就是这个糖有所感应,所以放电了。
所以,实验的第二部分是,实验者培训这些猴子,让它们知道给糖之后的1秒就会开始闪光,这个图就变了。我们可以看到的就是给猴子糖以后,猴子的神经元没有任何反应,而是当闪光以后,猴子的神经元才放电,说明并不是因为给了糖神经元才反应,而是对奖励这个事情本身放电,这是很酷的情况。
第三种情况,没有给糖,只是闪光,猴子怎么反应?没有给糖,没有任何奖励,这个神经元就会怎么样来表达呢?我们发现,闪光之后没有给糖,是一种令猴子抑郁的举动。一些物质是与强化学习直接相关的。在这样的信号之下,我们可以看到的是能出现奖励和这个时间的方程式,在这样的一个情况下,很好来解释了我们能看到猴子神经元的一个表现,因此在我们的人工智能的算法和我们人的大脑之间或者动物的大脑之间,有这样一种桥梁和关系。因此强化学习的算法对机器人的控制是可以用的,或者是可以用于打败人类冠军的AlphaGo的训练。因此,这样一些对大脑行为的观测和检测可以帮助我们进行一些人工神经网络的训练。
这就是我要讲的三个例子, 一个是计算机视觉,一个是文本含义与预测,一个是通过奖赏强化学习。
人工智能和大脑是两种研究智能的方式,二者发展都很迅速,现在到了二者融合的时间了。尽管人的大脑不是由硅组成的计算机,但是任何产生智能的物理的方式,它都是有一些信息的约束条件的,形成一种结构,这样的一种结构可以深层次地学习。在人工智能和人脑之间的学习中,我们可以找到更多的答案帮助我们推进科学的进步。
制版编辑:邓志英
丨
本页刊发内容未经书面许可禁止转载及使用
公众号、报刊等转载请联系授权
[email protected]