专栏名称: 云技术实践

关注云计算，云技术，云运维，云存储，存储，分布式，OpenStack，SDN，Ceph，虚拟化，运维，分享在云计算/虚拟化/运维项目实施中的资讯、经验、技术，坚持干货。

AlphaGo Zero证明，机器无需帮助即可成为超人

云技术实践 · 公众号 · 架构 · 2017-10-19 20:00

正文

请到「今天看啥」查看全文

围棋中各种变数的数量，甚至超过了宇宙中原子的数量

毫无疑问，AlphaGo Zero在围棋世界标志着颠覆性进步，但是，它对世界其他领域有什么潜在影响？麻省理工学院计算机科学和人工智能实验室（CSAIL）的研究生尼克·海因斯（Nick Hynes）认为，在一段时间内，它只是一种专门工具，不太可能对我们的日常生活造成冲击。

“到目前为止，该算法只适用于采取简单几个步骤就能解决的问题，如果要将其运用于移动等连续控制问题，那就需要加以改进，”海因斯告诉Gizmodo。“而且，它要求你具备非常好的环境模型。在这种情况下，它差不多了解所有规则。这就像你拥有一个机器人，你可以准确地预测它的行动结果，但在不完美的现实系统中，它是不灵的。”

他说，好消息是目前有几项人工智能研究正在致力于解决上述两个问题（例如机器学习、进化算法等），所以，它实际上只是个集成问题。海因斯说，“这里的真正关键在于技术。”

“正如预期和期望的那样，我们正在与获得一堆人类标记数据并训练一种模型来模仿它的经典模式渐行渐远，”他说，“我们在这里看到的是一个毫无人类偏见和预设的模型：它可以从它认为最优的东西中学习，可能比我们自己对这个概念的看法更加细致入微。如同一种外星文明发明了自己的数学，允许它去做像时间旅行之类的事情，”对此他补充说，“尽管我们距离奇点还很远，但我们肯定正在朝着那个方向前进。”

正如海因斯所承认的，这一最新突破并不意味着技术奇点（即在未来某个假定时间，超过人类的机器智能实现爆炸性增长）即将来临，但它应该让人们停下思想的脚步。一旦我们教一种系统学会游戏规则或某一现实世界问题的强制规定，增强学习的力量将使其可以简单地按下开始按钮，让系统做余下工作。然后，它将找出在这项任务中取得成功的最佳方法，设计出超越人类能力、甚至可能是人类理解能力的解决方案和战略。

DeepMind研究人员在其论文中所总结道：“我们的研究结果全面展示了即使在最具挑战性的领域，纯粹的强化学习方法也是完全可行的：不借助人类的示范或指导，不用学习超越基本规则的知识，就可以培养出超人。”

而事实上，现在人类玩家已经无法在国际象棋、围棋等游戏中独占鳌头，可以说，我们已经进入了超级智能的时代。这一最新突破是对未来的最细微暗示。

加拿大艾伯塔大学的马丁·穆勒（Martin Mueller）教授曾对围棋软件做出重要贡献，AlphaGo Zero的设计给他留下了深刻印象，认为它使强化学习更上层楼。他说：“这种架构比以前的版本更简单，功能更强大。”