正文
要想从图像数据库中拿到所有这些种类的图片并不容易。而要派人去拍下这些所有类型的图像,又太耗费人力了。所以,Filipowicz 博士选择了游戏“Grand Theft Auto V " (侠盗猎车手 V),这是一个最近很火的视频游戏。“侠盗猎车手 V” 因为包含了大量的犯罪和暴力而饱受争议,但是,在Filipowicz 看来,这款游戏很完美,因为它同样描绘了现实世界中的交通信号。通过修补游戏软件,他从游戏中拿到了数千张关于这些信号的照片,关于几乎各个场景,来让他的算法进行消化。
Filipowicz 博士的交通信号标志很好地说明了人工智能研究者对视频游戏的喜爱。其中有几个原因:一些人,例如 Filipowicz 博士,使用视频游戏作为训练场,用来代替真实世界。也有人观察到,不同的游戏要求具备不同的认知技能,他们认为,游戏可以帮助他们理解如何将智能分解为更小的、更加可以管理的细块。还有一些人,基于以上两个观察,认为游戏能帮助他们建立更加正确的人工智能(或者,甚至是自然智能)理论。
Open AI、DeepMind 和微软的开源AI游戏训练平台
显然,对于机器和人来说,“玩”游戏并不是同一回事。在上文提到的所有这些情况下,这些游戏需要先被调整解构,以便它们能被另一个计算机程序直接播放,而不是一般情况的人用屏幕来播放观看。例如,利用一个叫做“Deep Drive”的软件,“侠盗猎车手V”可以由一个有很多道路标志图像的图片源转变为一个自动驾驶汽车的驾驶模拟器。这样,这些车辆的驾驶和导航程序就可以控制了,这比让它们在真实的道路上测试更便宜,也更安全。
游戏公司也开始明白这一点。例如,2015年5月,微软启动了 Malmo 项目,这是基于一个流行游戏“Minecraft”的 AI 开发平台。2016年11月,“星际争霸II”的所有者暴雪公司与 DeepMind 宣布了类似的合作。12月,OpenAI 开源了 Universe 平台,免费供所有人使用,其中包含数百个游戏,可以通过适当的程序直接播放。Universe 提供的游戏从畅销的大型游戏如“传送门2”(一个基于物理的解谜游戏),到低成本的娱乐网游,如“小海马泡泡龙”和“太空斑马”,应有尽有。
1. 微软Malmo
微软的 Malmo 项目的目的之一就是教会 AI 软件与人类合作。为此,该项目的负责人 Katja Hofman 试图利用“我的世界”游戏创建一个智能的私人助理。她的目标是,这个软件能够预测它的人类操作者想要的东西,并帮助他实现。“我的世界”游戏里的世界虽然比现实世界简单,但仍然很复杂,吸引了研究者们的兴趣,可以说是完美的测试地。Hofman 博士和她的同事们使用这个游戏来试图教计算机与人类玩家合作,在游戏里捕捉一只虚拟的猪。由于机器无法理解书面的指示,因此,必须通过观察游戏中人类伙伴的动作来学习如何合作。
2. DeepMind Lab
DeepMind的DeepMind Lab 是一个专为基于智能体的 AI 研究设计的,完全像 3D 游戏般的平台。它从自己的视角,通过模拟智能体的眼睛进行观察。场景呈现的视觉效果是科幻风格。可用的操作能让智能体环顾四周,并且以3D的形式移动。智能体的“身体”是一个悬浮的球体,通过激活与期望运动方向相反的推动器实现悬浮和移动,并且具有围绕其主体运动的,能够观察其旋转时动作的摄像头。示例任务包括收集水果、走迷宫、穿越危险的通道且要避免从悬崖上坠落、使用发射台在平台间穿越、玩激光笔、以及快速学习并记住随机生成的环境。下面是智能体在 DeepMind Lab 中如何感知并与世界交互的图示。
3. OpenAI Universe
OpenAI Universe, 根据其官方博客的介绍,这是一个能在几乎所有环境中衡量和训练 AI 通用智能水平的开源平台,当下的目标是让 AI 智能体能像人一样使用计算机。目前,Universe 已经有1000种训练环境,由微软、英伟达等公司参与建设。
研究人员介绍说,Universe 从李飞飞等人创立的 ImageNet 上获得启发,希望把 ImageNet 在降低图像识别错误率上的成功经验引入到通用人工智能的研究上来,取得实质进展。
DeepMind的启示:对神经网络来说,为数据中心降低能耗的任务与游戏无异