正文
LeCun 目前感兴趣的研究领域包括人工智能、机器学习、计算机感知、机器人和计算神经科学。他最出名的是对深度学习和神经网络的贡献,特别是广泛用于计算机视觉和语音识别应用的卷积神经网络模型。他在这些主题以及手写字体识别、图像压缩和人工智能硬件等主题上发表过 190 多份论文。
LeCun 是 ICLR 的发起人和常任联合主席(general co-chair),并且曾在多个编辑委员会和会议组织委员会任职。他是加拿大高级研究所(Canadian Institute for Advanced Research)机器与大脑学习(Learning in Machines and Brains)项目的联合主席。他同样是 IPAM 和 ICERM 的理事会成员。他曾是许多初创公司的顾问,并是 Elements Inc 和 Museami 的联合创始人。LeCun 位列新泽西州的发明家名人堂,并获得 2014 年 IEEE 神经网络先锋奖(Neural Network Pioneer Award)、2015 年 IEEE PAMI 杰出研究奖、2016 年 Lovie 终身成就奖和来自墨西哥 IPN 的名誉博士学位。
概述
在这篇演讲中,LeCun 一开始介绍了最近人工智能的发展情况,然后谈到了人工智能面临的难题。接着,他深入论述了预测性学习以及 Goodfellow 在 2014 年提出的新概念:生成对抗性网络。除此之外,「常识」也是这篇演讲中多次提及的重要概念,我稍后会做解释。
这篇演讲的主题分为 4 个部分:
-
人工智能当前发展情况概览
-
人工智能所面临的难题
-
预测学习(无监督学习)
-
对抗训练
-
监督学习
实际上,去年取得的所有成功都是基于监督学习。我们在大量样本上(比如桌子、椅子、狗、汽车和人)训练机器,不过,机器可以识别之前没有见过的桌子、椅子等吗?
这两张幻灯片讲的是训练深度神经网络的过程,所有灰色图片是每一层提取的特征。当然,如果你觉得这些幻灯片内容很难理解,可以首先学习卷积神经网络以及反向传播算法。
他也介绍了 深度卷积网络的架构:VGG、GoogleNet 和 ResNet
接着,他介绍了一些驾驶方面的研究——使用卷积网络对行驶中的汽车进行图像标注和语义分割。另外,他也给出了一些图像识别的例子。
在这一过程中,我们使用了计算机视觉和卷积网络方面的知识。
Obstacles to Progress in AI [33:50]
人工智能发展中所面临的难题
上面这张幻灯片告诉我们,机器需要通过观察和行动来获取某种程度的常识,这样才能准确预测、规划以及关注重要事项。记忆相关事件并预测如何行动才能得到我们想要的世界的状态。
-
智能&常识=感知+预测模型+记忆+推理&规划
-
常识是一种填空能力
-
从部分信息推出世界状态
-
从过去和现在推断未来
-
从当前状态推断过去事件
-
补充视觉盲点的视野内容
-
补充被遮挡的图像
-
补充文本、语音缺失部分
-
预测行动结果
-
预测导致结果的行动序列
人类有常识。比如,看看下面这幅图片