人工智能系统研究的挑战

科Way · 公众号 · 科技媒体 · 2017-11-28 12:03

正文

请到「今天看啥」查看全文

计算机系统近年来推动了人工智能技术的发展，并行计算设备[31, 58, 90]和高扩展性软件系统[32, 46, 114]的进步促进了机器学习框架[14, 31, 98]和算法[18, 56, 62, 91]的发展，使人工智能可以处理真实世界的大规模问题；存储设备、众包、移动APP、物联网、数据采集成本的迅速降低[1, 40, 80]促使了数据处理系统和人工智能技术的进一步发展[87]。在很多实际任务中，人工智能已经接近甚至超过了人类，成熟的人工智能技术不仅大大提高了网络搜索和电子商务等主流产品的服务质量，也促进了物联网、增强现实、生物技术、自动驾驶汽车等新兴产业的发展。

人工智能成功背后的原因

人工智能在过去二十年飞速发展的原因归结于三点：

1）大数据，

2）高扩展性的计算机和软件系统，

3）开源软件（Spark、TensorFlow、MXNet、Caffe、PyTorch、BigDL）及公有云服务（Amazon AWS、Google Cloud、MS Azure）的兴起和流行，这使研究人员可以很容易的租用GPU服务器或者FPGA服务器来验证他们的算法。

趋势和挑战

虽然人工智能已经应用到了众多应用领域，但是人类希望在更多领域发挥人工智能的作用，包括健康医疗、交通运输、工业制造、国防、娱乐、能源、农业、销售业等等领域。大规模系统和机器学习框架已经帮助人工智能取得了一定程度的成功，我们期待计算机系统能够可以更进一步地促进人工智能的发展。我们需要考虑如下几个人工智能发展的趋势来应对挑战。

3.1 关键性任务的人工智能（Mission-critical AI）

从银行交易到自动驾驶，再到机器人手术和家居自动化，人工智能开始涉及到一些关键性任务，这些应用往往与人们的生命安全息息相关。如果人工智能要在动态变化的环境中部署，人工智能系统必须能够不断地适应新环境并且学习新技能。例如，自动驾驶汽车应该快速适应各种无法预料的危险路况（如事故或冰面道路），这可以通过观察其它汽车处理这些危险的行为进行实时学习；还有基于人工智能的入侵检测系统必须在入侵行为发生后立刻迅速地检测到新的攻击行为。另外，这些关键性任务也必须能够处理各种噪声数据及防范各种恶意的人为攻击。

挑战：设计多组织机构数据的共享机制，支持跨多组织机构的人工智能系统，同时要保障各组织机构自己数据的保密性，甚至是共享给竞争对手的数据也要保证数据的隐私信息不被泄露。

3.4 后摩尔定律时期的人工智能（AI demands outpacing the Moore’s Law）

处理和存储大数据的能力是近年来人工智能成功的关键因素，然而匹配人工智能进步需求的大数据处理能力将变得越来越困难，主要有以下两点原因：

第一，数据量持续以指数级规模增长。 2015年思科白皮书[25]声称，万物网（Internetof Everything）设备采集的数据量到2018年将达到400ZB，几乎是2015年估计数据量的50倍；近期研究[100]预测，到2025年，为了处理人类基因组，我们需要计算机处理能力有3到4个数量级的增长，这就需要计算机处理能力每年至少以2倍的速度增长。

第二，相对于数据爆炸，计算硬件设备处理能力的增长遇到了瓶颈[53]。 DRAM内存和磁盘容量预计在未来十年才能翻倍，而CPU性能预计在未来二十年才能翻倍，这种不匹配的增长速度意味着，在未来，存储和处理大数据将变得异常困难。

挑战：开发针对特定用途（domain-specific）的架构和软件系统，以适应后摩尔定律时期人工智能应用的需要，这包括针对特定人工智能应用的定制芯片、以提高数据处理效率为目的的边缘-云联合计算系统（edge-cloud systems）、以及数据抽象技术和数据采样技术。