正文
High:我理解 Google/Alphabet 各部门的分离,是出于想要维持一定的灵活性,和划分开不同的活动的逻辑。这个评价是否公允?
Dean: 是的。我认为这使得 Alphabet 下面一些其他实体可以更独立地操作。关于规模的成倍增长,有一个有趣的转变是:以前我们每个人都是在同一个大楼,现在每个人都不在同一个大楼。
另一个转变,以前员工只在山景城,后来在瑞士苏黎世、纽约、日本东京和西雅图都设有办事处。我们一度有 5 个办事处,都相当大而完善。然后在短短几年内,我们的办事处从 5 个扩张到 35 个,因为我们觉得在世界各地设有许多办事处很好,在哪里可以找到有才华的人才,就在他们身边设立一个办事处。这促使我们不得不重新思考,如何去组织我们工程师的诸多成果。如果你有一个小的办公室,他们可能不应该做一百件事;他们应该做少数几件事,并专心把他们做好。一些小办公室采取的模式是看山景城的人在做什么,他们看到他们在做一百件事,所以他们认为他们也应该做一百件事。我们慢慢摸索到有一种更好的方式来充分发挥这些散布在各地的工程办事处的人的能力。
High:谷歌 CEO Sundar Pichai 曾说,从长远来看,设备装置将会消失,计算将从移动设备优先向人工智能优先进化。你如何看待谷歌对于人工智能优先的愿景?
Dean:我认为我们已经从桌面计算进入到了移动计算,这时候每个人都有一个计算设备随身随时携带。随着设备不断地缩小,语音识别和其他可用的 UI 变得实际可用,这将改变我们与计算设备交流的方式。他们将会退居到幕后或者只是周边,允许我们与他们对话就像我们与其他可信赖的伙伴对话一样。他们将会帮助我们获取我们需要的信息和完成各种任务。我认为这是推动机器学习的一个主要目标:在提供咨询方面让计算机提供其他人类伙伴能够提供的智慧,期待必要的时候有更多的信息和更多这类的事情。我认为在下个 5 到 10 年,将会是一个激动人心的时期。
High:随着各种进步和各种关于 AI 的目标的实现,看起来很多人不再谈论那些已经实现的真正的 AI。那就是,AI 在被谈论时似乎总是带有未来色彩。你怎么定义 AI 的边界?
Dean:我认为真正的通用人工智能将是一个系统,能够执行人类水平的推理,理解和完成复杂的任务。我们显然还没有达到这个水平,但你说得很对,确实有了很多进展。5 年前,给计算机一张图片,它还不能生成一个人类水平的句子来描述这个图片。现在,计算机生成的句子会说,“这张图片描述的是一个男人拿着网球拍在网球场上。”同时,一个人可能会说,“这是一张网球运动员发球的图片。”人的描述更为微妙,但事实上,现在计算机能够生成看起来几乎是人类写的标题,这是一个相当大的进步。这只是过去的 5~6 年间已实现的众多更具智慧的机器学习模型中的其中一个成就。随着他们应用更大的数据和计算,结果会更好。
High:你认为我们距离通用人工智能还有多远?
Dean:不同的问法有不同的回答,这个问题有点广泛。我只敢给出一个宽泛的猜测。大约就是 15 到 50 年,也有可能比 15 年更早。
High:正如你所提到的,语言是关键,许多谷歌的人工智能都围绕着语言、阅读和理解网页上的一切或从事智能对话和理解背景。你能谈谈能使得机器更好的解释事物的路径吗?你预见的事情,以及你从事的事情正朝什么方向进展,如果还没完全达到全面的通用人工智能的话?
Dean:我认为有趣的事之一是信息检索领域,这基本上就是谷歌早期做的工作。传统上,它并不试图真正理解用户在查询时需要什么。它更多的是关于查找包含或者接近这个单词的文档。有趣的是,在过去的四五年,我们已经开始发展出这样一种技术,可以更好地理解“car”这个单词的本质。知道 “car” 和 “cars”、 “automobile”、“passenger car”、“pickup truck” 在某种意义上都是相关联的,能够以更顺畅的方式匹配出文章,在许多语言理解任务上可以得出更好的结果。
我们能理解的不仅仅是单词,我们的理解还能达到这个水平,即理解在阐释上不同但意思相同的两个句子。这开始促使我们的语言理解达到这样一个层次:以更机器学习的方式理解更长得多的序列文本。