专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
51好读  ›  专栏  ›  DeepTech深科技

哈萨比斯谈AI的过去、现在与未来:从“神之一手”到“数字生物学”,再到理解宇宙

DeepTech深科技  · 公众号  · 科技媒体  · 2025-04-15 17:35

正文

请到「今天看啥」查看全文



更关键的是, DeepMind 将深度学习与强化学习(RL, Reinforcement Learning)相结合,后者同样源于对动物行为和神经科学的研究。强化学习的核心是通过试错来学习,在环境中采取行动,根据结果获得奖励或惩罚,最终目标是最大化累积奖励。 “这 基本上是人脑工作的两大核心组成部分。”哈萨比斯解释说,“大脑是一个神经网络,一个模式匹配和结构发现系统。但它同时也有强化学习机制……(大脑中的)多巴胺系统就实现了这一点。”


这种生物学上的合理性,在 AI 研究的寒冬时期给予了他们极大的信心。“当你身处沙漠……你需要任何水源或证据来指引方向……而当时的 AI 正处于这种困境,因为之前的尝试(专家系统)多次失败,基本走到了天花板。” DeepMind 开创性地将这两种方法融合为“深度强化学习”(deep reinforcement learning),创造出能够从零开始学习复杂任务的智能体(agent)。


AlphaGo、“上帝之手”与创造力的本质


游戏成为了检验和完善这些理念的完美“坩埚”。它们提供了可控的环境、明确的目标(获胜、最大化得分)、可量化的进展(Elo 等级分),以及与人类顶尖专家进行校准的机会。而终极挑战,便是古老的围棋。


围棋的复杂度远超象棋——哈萨比斯指出,其可能的状态数估计高达 10 的 170 次方,“比宇宙中的原子还多”。蛮力计算毫无可能。此外,围棋高度依赖直觉;顶尖棋手常常难以清晰描述其落子背后的逻辑,只是说感觉“对”。这种基于模式识别和美感的特性,让传统专家系统束手无策。


DeepMind 的 AlphaGo 采用了不同的策略。它通过观察数百万局人类棋谱进行学习,随后又与自身进行了数百万局的对弈。它发展出了自己对“好”的模式、棋形和致胜局面的理解。2016 年,AlphaGo 在首尔与世界冠军李世石进行了一场载入史册的人机大战。决定性的时刻出现在第二局:第 37 手。


“那是一步真正充满创造力的棋。” 哈萨比斯 回忆道。围棋已有数千年历史,其策略已被深入探索。然而,第 37 手前所未见,甚至最初被顶尖解说认为是失误。 “他们以为操作员 Aja 点错了鼠标……因为那一步太不可思议了。”哈萨比斯说。但在一百多手之后,这步棋被证明是制胜的关键。


图丨 AlphaGo 和李世石对战第二局的前 99 步(来源:WikiPedia)


第 37 手(常被称为“神之一手”)完美诠释了哈萨比斯所定义的第二层次创造力:外推(extrapolation)。“你从已知信息出发进行推演,得出一个前所未见的新策略,就像第 37 手。这本身就非常有价值。” 这与第一层次的内插(interpolation,例如从数百万张猫的图片中生成一张平均的猫脸)以及尚难企及的第三层次——发明(invention)或“跳出框架思考”(out-of-the-box thinking)——形成对比。AI 能否发明围棋本身?或者基于 1900 年代的信息推导出广义相对论?“显然,今天的答案是否定的,”哈萨比斯坦诚,“仍然缺少一些东西……但我认为它(真正的创造力)终将到来。”


DeepMind 随后通过 AlphaStar 继续拓展边界,挑战了复杂的即时战略(RTS, Real-Time Strategy)电子游戏《星际争霸 II》(StarCraft II)。与围棋不同,《星际争霸》包含不完美信息(玩家无法看到全部地图)、实时决策和资源管理等要素。为了攻克这一难关,DeepMind 设计了一个“智能体联盟”(league of agents),让不同的 AI 策略在内部联赛中相互竞争。获胜的策略得以进化,并产生新的变种,形成一种类似演化的动态过程,最终培养出能够击败顶尖职业玩家的智能体。这成功解决了部分信息环境下的决策问题,向模拟真实世界挑战迈进了一大步。


哈萨比斯将这种利用游戏的方式与“游戏的人”(Homo Ludens)概念联系起来,认为玩耍是人类经验的基础,它不仅孕育创造力,也提供了一个安全的“练习场”,让人们可以在压力下模拟和训练关键决策能力。因此,游戏不仅是基准测试,更是开发通用 AI 能力的理想训练场。


从像素到蛋白质:AlphaFold 与“数字生物学”的黎明


在证明了学习系统在复杂游戏领域的强大能力后, 哈萨比斯







请到「今天看啥」查看全文