正文
要探访人工智能降临的前沿阵地,那就去观察机器学习系统在狭窄的受限领域是如何完败人类的。今年,最瞩目的人工智能与人类的对决就来自 Google。三月份,世界级围棋选手(李世乭九段)对决 DeepMind 的 AlphaGo 遭遇屈辱的惨败。DeepMind 的研究人员还制作了一个可以针对视频读唇的系统,其精确度相对人类而言一骑绝尘。几周前,Google 的计算机科学家和医学研究人员合作推出了一个算法,该算法可以像眼科医生一样通过眼睛图像检测发现糖尿病性视网膜病变。这是许多公司目前正在追逐的目标 —— 通过自动分析医疗扫描来帮助医生 —— 的一个早期步骤。
也是在今年秋天,微软公布了一个可以转录人类语音的系统,相比专业的速记员它的准确度高的多。语音识别是 Cortana(微软)、Alexa(亚马逊) 和 Siri(苹果) 这些语音助手系统的基础,并且在这项任务中达到人类的表现水准已是数十年的目标。对于微软首席语音科学家黄学东(XD Huang)来说:“这本身就像一个梦,在三十年后变成了现实。”
然而,人工智能在 2016 年碾压人类的一系列胜利仅仅是个开始。最新研究表明,我们很快将从这些“狭义”(受限于特定领域,应用范围相对窄)人工智能转变到“广义”(更丰富和复杂的应用领域)的人工智能。虽然离一个真正的通用人工智能至少还有几十年,但因为这些人工智能系统不断扩张的应用领域,社会仍将见证巨变。这就是为什么白宫(好吧,至少奥巴马还在位时)没有缩减投入人工智能的预算。我们正在发展一种强大的力量来彻底改变曾经我们创造的一切。
忽略这种趋势,而非积极投身其中去理解、塑造和监控它,很可能是一个国家所能犯的最大错误。
2
之前提及的那些成功的人工智能产品选择的工具都是深度学习。人工智能技术的竞争进入白热化,它的特殊性体现了我们为什么处在通用人工智能的边缘。(译注:深度学习模拟的是人脑的思维过程,所以作者才特别提及它和过去方法相比的特殊性)
虽然我们已经能够训练人工智能来完成任务数十年了,但是专家们不得不煞费苦心的为每一个应用手工打造许多定制组件。例如,在让人工智能识别图像中的物体这件事上,人类耗费了数年的工作积累,但在面对解析转录声音的问题时这些积累却毫无用处。换句话说,我们不得不预先咀嚼喂给人工智能的食物,一次,又一次,再一次。(译注:形象的形容过去训练人工智能的工作过程)
过去四年的教训是,这类枯燥乏味的“预咀嚼”过程,从目前来看在很大程度上是不相关的。取而代之的是,本质上存在一个算法(包含很多微变量)可以直接从你喂给它的任意大小数据集开始,通过调整自身的结构来解决问题。结果带来的不仅是表现更好的系统,而且能更快的进行实验。“许许多多曾经让我们竭尽全力但却困顿不前的问题,如今,六个月内将迎刃而解。” Google 副总裁与工程师 Fernando Pereira 如是说。