正文
我喜欢深度学习...
深度学习最近取得的成功势不可挡:从图像分类和语音识别到图片标注、理解视觉场景、视频概述、语言翻译、绘画,甚至是生成图像、语音、声音和音乐!
…而我想让它运行得飞快!
其成果令人震惊,因而需求就会增长。比如你是谷歌/ Facebook / Twitter 的工作人员:在你找到一种「阅读」图片或视频内容的方法来建立一个更贴近用户特征(他们的喜好、谈论对象、推荐、分享的内容)的模型之后,你会做什么?你可能会想做得更多!
或许你会使用 ResNet / Xception / denseNet 的某个版本来将用户图片分类为成千上万个类别。而如果你是某个互联网巨头企业的一员,你拥有许多的服务器和服务器群组,因而理想情况下你希望在这个现有架构上运行深度学习算法。然这种方法曾经很有效……直到你意识到自己用来分析文本语法结构的这些服务器现在所不得不进行的运算是你之前运行单一图像分类所需操作次数的一百万倍以上。而用户产生的数据则流动得越来越快:现实生活中每过一分钟就会产生 300 小时时长的视频!
服务器群组会消耗大量的功率,并且如果我们需要使用大量基础设施来处理图像和视频,那么我们就需要建立大量的发电装置,或是使用效率更高的方式在云端进行深度学习计算。能耗问题很难解决,因此我们最好走提高效率的路线。
然而对于需要更多用于深度学习解决方案的硬件和优化型芯片的领域来说,数据中心只是其中的一个方面。1000 瓦的计算系统对于自动驾驶汽车来说或许可行,但在许多其它的应用中,功率是一个很大的限制。比如无人机、机器人、手机、平板电脑和其它的移动设备。它们都需要几瓦甚至不到 1 瓦的功率预算才行。
还有很多消费类电子产品,比如智能相机、增强现实眼镜等设备,它们需要小功率,并且由于隐私问题,用户们可能不会想要采用云计算解决方案。
随着我们的家变得越来越智能,你会发现许多设备都会需要连续地使用深度学习应用、收集和处理数据。
那么…你就需要新的硬件,对吗?
所以我们需要新的硬件,一个比 Intel Xeon 所驱动的服务器更加高效的硬件。一个英特尔服务器 CPU 可能会消耗 100-150 瓦功率并需要一个有着冷却装置的超大系统来支持其性能的正常发挥。
还有哪些其它的选择?