专访 | Gigaom对话吴恩达：迁移学习是未来五年的重要研究方向

机器之心 · 公众号 · AI · 2017-01-12 12:48

正文

请到「今天看啥」查看全文

：我们在基础研究领域做了很多工作，有趣的是，成功的基础研究一开始会以基础研究的面貌出现，但是，一旦你看到了它的应用价值，过一段时间后就会变得不那么基础了。我们做了很多这样的研究。可以说，在百度，早期的面部识别是以基础研究的面貌起步的，但是，这个服务如今融入产品中了，也服务着产品的百万用户。神经机器翻译最初也是一项基础研究。实际上，这个故事有着不广为人知的另一面：神经机器翻译是在中国开创、研发和使用的。美国公司的研发和使用是在百度之后。中国团队在某个研究领域领先其他国家，这只是例子之一。我们在计算机视觉方面的基础研究，比如，面部识别，也一直处于领先位置。今天，我们正在会学习的机器人和机器学习领域进行广泛的基础研究。我们的研究覆盖了从非常基础的研究到非常应用的研究的所有阶段。

问：百度团队是什么样子？通常你的团队的都是小规模的吗？团队以开发人员为重？你找到了一个成功的分配有限资源的办法了吗？

答：这个问题比较复杂。很多项目开始时是小规模的。比如，一年前，自动驾驶团队有 22 个人。但是在团队展现了自己的实力、初步显示出前景并制定一个深思熟虑过的商业计划后，公司就有理由为其团队建设注入庞大资源，如今团队可能有几百个成员。团队从最初的一个基础研究项目变成一个崭新的业务分支。所以很多项目都是从相对小的团队开始的，不过，在其迈入正轨而且价值也清晰了后，我们就能将其嵌入一个拥有很多成员（几十人甚至几百人）的团队中。

问：如今人工智能领域，你认为五年内可以解决的难题之一是什么? 也就是今天很难解决但是五年后就会普遍加以实现的事情？

答：从研究角度出发，我认为迁移学习和多任务学习是我想试着解决的问题之一。今天，机器学习全部经济价值都是应用学习，从针对特定任务的标记数据中学习，比如通过大量标记数据人脸数据库学习识别面部。对于很多任务来说，特定垂直领域的数据并不足以支持系统建构。因此，迁移学习会是一个很有活力的领域，机器机器可以学会一个不同的任务。比如，学会大体上识别物体。学会大体上识别物体后，这个知识中有多少会对识别面部的特定目的有用。

从研究角度看，我认为这个非常非常有前途，现在也有广泛使用着的用于这类迁移学习的技术，不过有关如何实现的理论和最佳实践仍然处于相当早期阶段。我们之所以对迁移学习感到兴奋，其原因在于现代深度学习的巨大价值是针对我们拥有海量数据的问题。但是，也有很多问题领域，我们没有足够数据。比如语音识别。在一些语言中，比如普通话，我们有很多数据，但是那些只有少数人说的语言，我们的数据就不够庞大。所以，为了针对数据量不那么多的中国少数人所说的方言进行语音识别，能将从学习普通话中得到的东西进行迁移吗？我们的技术确实可以做到这一点，我们也正在做，但是，这一领域的进步能让人工智能有能力解决广泛得多的问题。

问：人工智能可以告诉我们任何有关人类智能的有用信息吗？或者，反过来，从人工智能那里获取的线索能帮助 AI 更好地工作吗？亦或是这种情形，人工智能和人类智能只是都用了「智能」这个词而已，两者没有任何相似之处？

答：从神经科学中获取的知识对当前人工智能的发展只有一丁点用。现实一点说，尽管神经科学研究了几个世纪，今天我们对人类大脑的工作方式几乎还是完全不了解，对大脑工作原理那点极为少量的知识仅能为人工智能提供一些并不可靠的灵感，不过，实际一点说，今天人工智能取得的成绩更多的是受计算机科学原理驱动的，而不是神经科学原理。我已经说过，在自动化人类所能的事情上，人工智能已经变得非常擅长了。比如，人非常善于语音识别，但是人工智能在语音识别上表现不好。人非常善于人脸识别，人工智能正在人脸识别上进展迅速。

事实证明，当我们试着将人类可以做的一件事情自动化而不是解决人类都无法完成的任务时，用于推进该人工智能技术的工具也会更好地发挥作用。原因很多，但是原因之一在于，当我们试着选择一个人类也可以胜任的任务，让人工智能参与进来时，我们就能深入找出人类怎么可以迅速完成这一任务原因。因此，在展望很多人工智能垂直领域时，我们当然可以做一些甚至人类自己都不很擅长的事情。我认为，现在亚马逊向我推荐的书目甚至比我妻子推荐的还要好。我妻子当然非常了解我，但是亚马逊能做到这个程度是因为它积累了大量有关我的浏览和阅读书目数据，这些数据远远多于被妻子看到的阅读书目。我大致认为，有了几个类似这样的例外，当人工智能试着自动化至少人类也能做到的事情时，就会进展神速。