专栏名称: 安在
人物、热点、互动、传播,最有内涵的信息安全新媒体。
目录
51好读  ›  专栏  ›  安在

研究人工智能三十年,Facebook AI 负责人Yann LeCun到底有多牛?

安在  · 公众号  · 互联网安全  · 2017-04-27 17:22

正文

请到「今天看啥」查看全文



Vapnik赢了一半,2000年,神经网络的内部工作原理基本上仍然被神秘所笼罩,甚至到现在也没什么改观,研究人员无法精确地判断出如何让神经网络更好地应用在现实生活之中。但是Jackel也赢了一半,对于LeCun来说这一半胜利更为重要。在2005年,深度神经网络仍然应用在银行和ATM机上,这完全得益于LeCun在上世纪80年代中后期和90年代初的工作成就。


人工智能之视觉


LeCun从小就相信可以让计算机拥有视觉。如今,面部识别和图像检测已经变得十分寻常,但是当20世纪80年代初,LeCun在巴黎上大学时,计算机实际上是瞎子,无法识别图像中的东西,更不知道摄像机镜头里有什么。在大学期间,LeCun偶然发现了自60年代以来几乎没有人探索过的人工智能的一种途径。他认为,他的研究可以让机器学会完成多种任务,包括感知。


这种途径就叫做“人工神经网络”,它采用小型传感器互联形成的系统把图像等内容分解成非常细小的部分,然后识别出其中的模式,最后根据所有的输入数据确定它们看到了什么。在阅读了反对神经网络的论据(即难以训练,性能不够强大)后,LeCun决定推动这项研究,尽管遇到了质疑,但他还是在攻读博士学位期间专注研究人工神经网络。


人工智能领域的艰难时期出现频率和强度都很大,这样的时期有一个专属称呼:“人工智能寒冬”。这些时期主要出现在研究人员取得的成果无法达到最初设想之时,这让人觉得该技术不可行,进而导致人们对人工智能的投资和兴趣枯竭,技术进步趋于停滞。



本世纪初,LeCun研究的神经网络也遭遇了“人工智能寒冬”。其他学者甚至不允许他在学术会议上提交论文。神经网络先驱、谷歌的工程专家、多伦多大学教授Geoff Hinton表示:“计算机视觉圈子把他拒之门外。外界的看法是,他在从事在上世纪80年代看起来很有前景的研究,但现在他应该放弃这方面的研究。”


他继续补充道,“现在没有人再这么认为了。”


当时,其他神经网络研究人员也遇到了类似问题。蒙特利尔大学教授、蒙特利尔学习算法研究所所长Yoshua Bengio发现很难找到愿意与他合作的研究生。他表示,“我不得不强迫学生从事这方面的研究,因为他们害怕在博士毕业后找不到工作。”


2003年,LeCun为自己的回归奠定了基础。那年,他成为纽约大学教授,并与Hinton和Bengio结成非正式的联盟,共同合作研究神经网络。LeCun笑着称:“我们开始了我一直说的‘深度学习阴谋(Deep LearningConspiracy)’。”


“深度学习阴谋”在神经网络研究领域发挥了至关重要的作用。主要是因为他们坚持认为,不需要为每一类检测对象开发专门的神经网络,可以使用同样的模板开发一个神经网络,就可以检测图像、视频和语音。因此,你不必为识别企鹅和猫分别开发一个神经网络,你可以建立一个能够检测两者并能识别其差异的神经网络。这种新的神经网络也可以被修改用于其他任务,例如检测声波,识别语音模式等。


“深度学习阴谋”的研究受益于两个重要的外因驱动:一是计算机性能大幅度提升,有助于神经网络的运行速度足够实用。二是由于互联网的普及,可用数据(图片、文字等)实现了指数级增长,让神经网络得到足够的训练,变得更加智能。



得益于LeCun及其同盟打下的基础,计算机视觉在本世纪10年代初实现了爆炸式增长。计算机开始学会识别图像内容,随后又能识别视频中的物体,最后能够识别相机拍摄的实时画面中的物体。现在,你可以把相机指向篮球,人工智能可以知道摄像头前方有什么。


自此,LeCun迅速从人工智能领域的边缘人物变为行业领导者。他说,“一年之内,原来无人问津的领域受到了所有人的青睐。这真是疯了,完全是疯了。”


2013年12月,LeCun加入Facebook,这对于有意将人工智能研究应用于图像识别的科研人员来说是一个理想的环境。因为Facebook平台上有数十亿张图像,这给LeCun及其团队提供了用于践行新想法的丰富资源。FAIR团队经常与AML团队合作,在Facebook平台上将研究成果付诸实践。


这两个团队构建了新的系统,使Facebook公司可以受益于技术的进步。AML团队使用FAIR团队的研究成果来识别用户News Feed中的内容,或将Facebook中的内容翻译成其他语言;他们还将其部署在Facebook相机中,让相机根据用户动作生成各种特效。


【FAIR推出的计算机视觉工具SharpMark】


人工智能之思维


计算机的视觉能力是教会它们理解世界如何运作的基础。人类了解世界如何运作,是因为我们反复观察相同的场景,进而了解这些场景将会如何展开。例如,当一辆汽车在道路上超速行驶,我们预计这辆汽车可能会撞上我们时就会紧急避让。当天黑了,我们了解按一下电灯开关就会亮起来,所以我们这样做了。


FAIR团队正在尝试使用类似的方法来教计算机像人类一样来预测结果。LeCun解释说,该团队正在向人工智能展示大量相关视频,然后在某个点暂停视频,并要求机器预测接下来会发生什么。例如,如果你反复向人工智能系统展示水瓶在人的头顶上倒过来的视频,那么它可能会预测这样的动作会把人弄湿。


LeCun解释说,“智能的本质在某种程度上是预测能力。如果你可以预测你的行为会造成什么结果,那么你就能够做出计划。你可以计划一系列预计达到特定目标的行为。”


教会人工智能预测能力是当前该领域面临的最棘手的挑战之一。主要是因为在许多情况下,多个预测结果在理论上都是正确的。



LeCun说,想象一下,在桌子上垂直地放上一支笔再放手。如果你问计算机,一秒钟后这支笔将在何处,可以说没有准确的回答。机器知道笔会掉下来,但它不能准确知道笔会掉在哪里。所以,你需要告诉系统这个问题有多个正确的答案,事实上发生的结果只是多个可能中的一个。这就是在不确定性下学习预测可能遇到的问题。


帮助人工智能理解并接受不确定性是人工智能研究的一个分支——“无监督学习”,是机器学习的最前沿领域。当人工智能观察到足够的知识后,它会知道世界如何运作并学会预测接下来会发生什么,它可以开始像人类一样思考,获得一些常识。LeCun认为,这是使机器更加智能的关键。


LeCun及其研究团队承认,人工智能可能需要很多年才能完全掌握这种技能,但他们相信自己会实现这个目标。LeCun下属的研究经理Larry Zitnick说:“一切都会实现的,但我会说这需要超过10年的时间。”







请到「今天看啥」查看全文


推荐文章
内蒙古市场监管  ·  公开征集问题线索,事关网络餐饮食品安全!
3 天前
内蒙古市场监管  ·  公开征集问题线索,事关网络餐饮食品安全!
3 天前
上海发布  ·  应勇当选上海市人民政府市长
8 年前
丁香医生  ·  晒黑了之后,要多久能白回来?
7 年前