为机器赋予记忆：DeepMind重磅研究提出弹性权重巩固算法

机器之心 · 公众号 · AI · 2017-03-15 12:44

正文

请到「今天看啥」查看全文

近日，DeepMind 又发布一份新研究（这一方法不同于之前提出的 PathNet ），宣称实现了神经网络的连续学习（Continual Learning），让计算机程序可以不忘记之前学习过的内容并渐进式地学习新内容。这篇论文结合了生物学、突触弹性理论，并讨论了突触不仅存储权重还存储这一权重不确定性的理论。这项研究得到了广泛的关注，比如 Bloomberg 的报道写道，这项研究「可能将为能被更轻松地应用于多种任务的人工智能系统开启新的道路，它也应该可以提升人工智能系统在任务之间迁移知识的能力和掌握一系列互相链接的步骤的能力。」机器之心在此对 DeepMind 与该研究相关的官方博客文章和论文摘要进行了介绍。

论文地址： http://www.pnas.org/content/early/2017/03/13/1611835114.full.pdf

学习执行任务的计算机程序通常也会很快地忘记这些任务。我们的研究表明可以修改学习规则使程序在学习新任务的时候还记得旧任务。这是向能渐进学习和自适应学习的更加智能的机器所迈出的重要一步。

深度神经网络是目前最成功的机器学习技术，可用于解决语言翻译、图像分类和图像生成等多种任务。但是，通常只有当数据是一次性全部呈现时，它们才能学习多种任务。随着一个网络在一项特定任务上的训练的进行，其参数也将逐渐适应此任务的解决。而当引入一个新任务的时候，新的适应过程会改写该网络之前已经获得的知识。这种现象在认知科学领域被称为「灾难性遗忘（catastrophic forgetting）」，这也被认为是神经网络的基本限制之一。

相对而言，我们的大脑却有着不同的工作方式。我们可以渐进地学习，可以一次只学习一个技能，而且也能在学习新任务时应用我们之前获得知识。这也是我们最近在 PNAS 上发表的论文《Overcoming catastrophic forgetting in neural networks》的起点。在这篇论文中，我们提出了一种可以克服神经网络的灾难性遗忘的方法。我们的灵感来自于神经科学，涉及到有关哺乳动物和人类大脑巩固之前习得的技能和记忆的理论。

神经科学家已经识别出了大脑之中的两种巩固（consolidation）方式：系统巩固（systems consolidation）和突触巩固（synaptic consolidation）。系统巩固是指这样一个过程：将我们大脑中的快速学习部分已经获得的记忆印刻到慢速学习的部分。这种印刻过程被认为是通过有意识或无意识的回忆实现的——比如说，这可能会发生在做梦的时候。而对于第二种机制——突触巩固，是指如果一些突触连接在之前所学到的任务中是很重要的，那么它们被改写的可能性就更小。具体而言，我们的算法就从这种机制中获得了解决灾难性遗忘的灵感。