专栏名称: 知识分子
《知识分子》是由饶毅、鲁白、谢宇三位学者创办的移动新媒体平台,致力于关注科学、人文、思想。我们将兼容并包,时刻为渴望知识、独立思考的人努力,共享人类知识、共析现代思想、共建智趣中国。欢迎关注。
目录
51好读  ›  专栏  ›  知识分子

机器究竟如何思考?

知识分子  · 公众号  · 科学  · 2024-10-17 08:37

主要观点总结

本文介绍了计算机科学中使用描述人类大脑活动的术语如“记忆”、“学习”、“神经网络”、“突触”等在人工智能语境中的不同含义,并讨论了人工智能的两种构建方式及其局限性。文章还探讨了深度学习带来的革命性技术变革,以及人工智能与人类智能的区别。

关键观点总结

关键观点1: 人工智能中使用的术语如“记忆”、“学习”等与日常语言中的含义不同,需要警惕误解。

这些术语在人工智能中用于描述计算机的功能,而非真正的人类智能。

关键观点2: 人工智能存在智能,但与人类思维大不相同。

人工智能能够对话、推理、得出结论,但缺乏逻辑能力。

关键观点3: 人工智能由两种截然不同的组件构成,对应两种不同的模拟人类智能的方式。

一种关注逻辑推理能力,另一种从底层模仿学习和记忆相关的生物意义神经运作过程。

关键观点4: 深度学习带来的技术变革类似于工业革命,产生了新的科学理论来解决新问题。

现代人工智能从数据中提取知识,实现之前只有人类能执行的任务。

关键观点5: 人工智能的发展引发了关于什么是革命性技术的讨论。

人工智能的进步迫使我们提高标准,而且这些最新的能力不能算作新的力量测试。

关键观点6: 人工智能与人类智能存在本质区别。

人工智能可以对话、思考、推理,但与人类思维不同。必须承认人工智能是真正的智能,但本质不同于人类智能。


正文

请到「今天看啥」查看全文



说这些是为了给这篇简短文章提供一些背景:每个人对这些术语都有直接的个人感知,并且这些术语的含义也是有一定的社会共识,但将这些个人感知和含义直接套用到计算机的话,就会导致严重的误解。


01

机器的“思考”

想像一下,机器究竟是如何思考的? 它们是如何推理的? 它们是如何得出结论的? 所有的人工智能归根结底是由两种截然不同的组件构成,这两种组件对应于两种不同的构想——因此也对应于两种不同的模拟人类智能的方式。


一种关注的是运用逻辑进行推理的能力,这种能力被认为是更高智能的体现。举一个贴切的例子。在数学里,我们可以进行加法、乘法,甚至执行更复杂的运算。我们所有的数学计算可以说是又敬又怕,因为要进行这些计算,我们不得不集中注意力,当计算变得特别复杂时,我们所需的时间会大幅增加。高效计算的方法会随着时间和实践而获得的,这也是专业数学家工作的重要组成部分。


逻辑在某种程度上是计算的抽象化;它也被视为支撑我们推理能力的基础。而计算机——从完全机械的安迪基西拉机 (模拟计算机) 到现代高效的电子计算机——在某种程度上都意味着自动化逻辑思维过程是有可能的。逻辑编程——本质上是一种非数字、概念化的语言进行编码的技术——这是上世纪发展出来和流行的人工智能技术。虽然这种技术取得了一些成果,但还有很大的局限性。例如,这种版本的人工智能从未实现图像分类和识别,也不能将文本翻译成不同语言。


与上述类型对应的另一种人工智能是从底层开始就模仿学习和记忆相关的生物意义的神经的运作过程,尤其是神经元之间突触连接的“可塑性”。在生物大脑中,记忆和学习的过程就是突触对外部刺激的适应过程。通过神经元和突触共同作用,我们既可以概念化和形成这些知识,也可以记忆这些知识。随着深度学习的不断发展,这种类型的人工智能目前增长速度很快主要得益于算力的提升和大数据时代的到来。现代人工智能从这些信息里提取有用的知识,从而可以做到一些之前只有人类可以执行的任务。


但需要指出的是,我们刚刚说的第二类人工智能是“前科学”。所谓“前科学”,就是指的是那些能够改变科学的部分,因为它们推动新的科学的产生,去解决新的问题。举个例子方便理解:想一下工业革命初期的第一批蒸汽机是如何产生的。这些蒸汽机不仅仅是一组杠杆和齿轮;它们还有燃烧室,蒸汽在那里扩张和收缩。这些发动机可以在没有马的情况下就推动火车车厢。尽管我们知道如何制造它们也知道他们的工作原理,但我们仍然无法回答许多科学问题。例如:在煤耗相等的情况下,为什么柏林的蒸汽马车比巴黎的行驶得更远?为了解答这些问题就产生了一个新的科学理论——热力学,它引入了最大效率和绝对温度的概念,并提出了现代科学中最重要的量之一:熵。


同样的,现在可以与我们对话的计算机并不仅仅是由人手工编写的代码程序 (例如,用于加分数的程序或用于操作“if-then”逻辑的程序,这些程序是计算机科学的杠杆和齿轮,是模仿更高智能的最初尝试) 。现代机器还包含一个主动部分,它不再像十九世纪的机器那样将能量转化为工作,而是将原始信息 (数据中包含的信息) 转化为小而珍贵的 知识片段。理解这些机器为何能工作——即识别它们的原理以及由此带来的性能限制,以便对其进行优化——是当今和未来科学的一个重要任务。


02







请到「今天看啥」查看全文