专栏名称: 两个质子
我们是谁?我们从哪里来?我们到哪里去?一群为科学着迷的普通人,一群为生活着迷的科学家。我们就是两个质子。
目录
51好读  ›  专栏  ›  两个质子

我们在多大程度上能信任人工智能?听听科学家们怎么说

两个质子  · 公众号  · 科学  · 2017-01-29 16:08

正文

请到「今天看啥」查看全文



面对这样的挑战,AI研究者们采取了和Pomerleau一样的应对方式——打开黑箱,用相当于研究人脑的神经科学的研究来理解其中的网络。但研究者们得到的答案并不是让人豁然开朗的洞见,Vincenzo Innocente表示;他是欧洲核子研究中心的一位物理学家,是在粒子物理学领域应用人工智能的先锋。“作为科学家,”他说,“我对仅仅将小猫和小狗区分开来是不满意的,科学家会希望能说出区别到底在哪里。”


好的开始

历史上第一个人工神经网络出现在上世纪50年代初,几乎与有能力执行算法的计算机同时产生。人工神经网络的思路是模拟排列成不同层次的小计算单元(也就是“神经元”),与大量数字“突触”相连。底层的单元会收集外部数据,比如图像中的像素,然后将信息传递给下一层次中的单元(可能是其中一些,也可能是全部)。下一层中的单元随后会根据简单数学法则整合来自底层的输入数据,然后将结果向上传递。顶层最终会给出答案——比如判断原图到底是“猫”还是“狗”。


这类网络的优势在于它们的学习能力。有了附带正确答案的训练数据集,神经网络便能调整每层连接的强度,直到顶层的输出结果也是正确的,大大提升其表现。这一过程模拟了大脑通过强化或弱化突触学习的过程,最终得到能成功归类不在训练集中的数据的神经网络。


在上世纪90年代,神经网络的学习能力是吸引欧核中心物理学家的一大要素。他们是在科研中例行使用大规模神经网络的先行者:这些网络对重建大型强子对撞机(LHC)在粒子对撞中产生的亚原子碎片的轨迹帮助良多。


但这种学习方式也是神经网络中的信息如此分散的原因:就像人脑一样,记忆是在许多连接中编码的,而不是像常规数据库一样储存在固定的位置。“你手机号的第一位存在大脑的哪里?也许是在一堆突触当中,也许离存储号码中其他数字的地方不远,”加州大学欧文分校的机器学习研究者Pierre Baldi说。但人脑中并没有明确定义用于编码手机号的比特序列。因此,“我们虽然是这些网络的创造者,但我们对它们的理解也并不比对人脑的理解深入多少,”怀俄明大学的计算机科学家Jeff Clune表示。



Google开发的人工智能AlphaGo在围棋这项复杂的棋类游戏中击败了世界上最强的人类棋手。

图片来自Nature Video


对需要在各自学科中处理大数据的科学家来说,这使得深度学习成了一种使用时需要多加谨慎的工具。为了理解个中原因,英国牛津大学的计算机科学家Andrea Vedaldi让我们想象这样的情景:在不久的将来,人们用乳房X光片来训练深度学习神经网络,这些X光片根据拍摄的女性之后是否罹患乳腺癌区分开来。Vedaldi说,经过训练后,一位外表健康的女性的乳腺组织在机器“看来”或许已经有了患癌的迹象。“神经网络或许暗中学会了辨认标志物——人们还不知道,但能预测癌症的特征,”他说。


但是,如果机器无法解释它是怎么知道的,Vedaldi说,就会给医生和病人带来严重困扰。对女性来说,因为拥有已知会显著提升乳腺癌风险的遗传变异而选择乳房切除术已经够困难了,但如果连风险因素是什么都不知道,做这样的选择就更加困难了,即使是在给出这一建议的机器预测非常准确的情况下。


问题在于,获得知识的是网络,而不是我们, ”Michael Tyka说,他是一位就职于Google的生物物理学家兼程序员,“我们真的理解了什么东西吗?并没有——获得见解的其实是网络。”







请到「今天看啥」查看全文