正文
让我们来看一下人脑是怎样工作的。我们的人脑是 general 的、像 CPU 一样的 computer,还是一个 special purpose 的 computer?人脑是一个特殊硬件还是一个通用计算的硬件?认为是通用计算的请举手(不少同学都举起手来)。还是有不少同学这么认为。人脑确实很发达,有很强的计算能力,但如果你认为这样人脑就是通用计算的硬件了,那我来问一下,你看你能回答这个问题吗?(PPT 上显示:1729×568=?) 你会发现,面对这样一个简单的问题,你会觉得如此的无奈。你会发现,人脑不是无所不能的,它的能力明显有边限。当然人脑有它擅长的东西,比如这个(PPT 上出现了一段在一定程度上打乱了顺序的文字,现场观众惊讶地发现,这并不影响阅读,甚至有人都没有发现顺序被打乱了)。我们发现,原来大脑是这么奇妙,这么特殊,它的机制可能和现在显示器的逐行扫描、顺序扫描是完全不同的机制。它对图像是并行处理的,因此对顺序是不敏感的。但是背后又有一个 language model,还有一个类似于 recurrent neural net 的东西在进行 correct。我们发现,原来人脑是有所长、有所短的。在漫长的进化过程中,人在不断地发展和自己生存有关的能力,而和生存无关的能力,发展则是不足的。所以说,人脑是一个特殊设计的硬件。同时人脑还有很多个不同的子系统,比如有一部分是专门对听觉优化的,有一部分是专门对视觉优化的,前几年有一个获得诺贝尔奖的发现,发现人脑中有一块是专门负责定位的,相当于 GPS。
我们看到,如果我们做通用处理器,做 CPU,那么它可能非常 flexible,因为它可以做很多任务。但它整个 efficiency 并不高。但如果针对每个人物做专门的优化,会把 efficiency 提高两到三个数量级。
给大家讲一个我自己经历的故事。2011年,谷歌大脑的项目,当时都是用 CPU 来做的计算。当时我们加入百度,开始在百度做深度学习计算,用的是 GPU。我们私下里不断的比较,比较 CPU 跟 GPU 的效率。2012年的 GPU 比 CPU 效率大概要快四十倍左右,但是 Google 的一些人告诉我们,他们的 CPU 优化的非常好,据说能达到 CPU 跟 GPU 只是六倍的difference。但是我们觉得很难相信,这一点就跟我们的数据太不一样了。我们觉得 GPU 做深度神经网络的性能明显要更高嘛。不管怎么说,我们开始 launch 我们的系统,大规模使用 GPU 来做计算,到后来证明我们是对的。Google 后来也开始大规模地使用GPU。所以实际上,百度比 Google 更早使用 GPU。所以 Andrew 在2014年5月份加入百度,他接受采访时说,当时加入百度的原因,当然除了余凯,另外还有一个原因,就是可以随便买 GPU。
到了14年,广告系统上线跟语音系统上线都需要实时计算,并且它的流量特别大,特别是广告,这种情况下 CPU 跟 GPU 其实都扛不住,所以我们当时用 FPGA 去做专门的硬件加速。这时我们更加清醒地认识到,硬件对计算力有多么重要。
好,我们现在看另外一个趋势,这个趋势就是从中心到边缘。
我们可以看到从 PC 互联网到移动互联网到 internet of smart things,实际上对 AI 的要求越来越高。对 PC 互联网来说,对 AI 的要求其实没有那么高,但在移动互联网上,这种要求出现了。比如说最近我们看到今日头条的新闻,它跟百度一个很不一样的地方是百度是即搜即得,而今日头条是不搜即得。这个“不搜即得”,在移动设备上,因为它有一个主动去做推荐的机制,使得人机交和信息的获取更加智能更加的高效。未来,这些移动设备上,会有越来越强的AI需求。我们有很多的计算,会从数据中心往这些移动设备上去转移。在这些设备上,做 perception,做人机交互,还有决策等事情。
这些计算要求 low latency,没有延迟,并且是实时的,low power,low cost,并且是 privacy protect 的。那我们看到,就是说在汽车上面的话呢,就说这是一个很大的一个应用场景。
不可能前面有小孩子突然横穿马路,你还要把数据传上数据中心,处理完了以后再传回来,这是不可想象的。
所以一定要本地计算,要实时处理没有延迟。很多移动设备,比如 Amazon 的 Echo,就是把很多计算往边缘设备上去推,使得它整个的用户体验会更好,这也是未来的一个趋势。又比如监控摄像头,中国去年一共部署了一亿个。监控摄像头的资料,其实存3个月就扔掉了。未来,对于所有这些摄像头,都会有专门的处理器,去处理实时的视频,这是一个大的趋势。孙正义认为,很多计算未来会在边缘进行,边缘的这些设备上的计算,使得这些设备变成了机器人。他认为,15年以后,机器人的数目会超过人类,达到一百亿个。孙正义基正是基于这样一个逻辑,他以极高的溢价收购了英国的 ARM,300多亿美金。所以这是以 VC 的思维去做几百亿美金的巨型并购。
第三个趋势,是在边缘的竞赛,就是更快更高更强。比如今天的每辆车,有1个摄像头,就是倒车的摄像头,但未来的自动驾驶是平均8到12个摄像头。Tesla 的新车上,已经有8个摄像头了。然后每个摄像头,会从720P的解析度到1080P的解析度,到高清的4k,因为解析度越高,你可以看得更远。另外一点,未来的10到20年时间,因为自动驾驶技术的发展,会使得高速公路上的汽车的平均的速度从100公里每小时到接近它的物理的极限——200公里每小时,速度会越来越快,这是一个 global trend,这要求处理的数据量持续增长,所以在边缘上,计算会持续的追求更快更高更强,这是一个新的竞赛。
未来的5到10年,最具颠覆性的产业机会是什么?我跟大家分享一下我的思考。通常来讲,产业机会分成两个阶段,通常的话,我们会看到,首先是一波2B的机会。2B的机会,就是 Enabling Technology,公司就是做 technology 本身的。它是提供枪炮弹药的,给谁提供呢?给第二波的机会提供。第二波的机会是什么呢?就是 Technology-enabled Business。当然这些都是2C的。2B就是给 Enterprise 提供服务。这些 Enterprise 再去捕捉 consumer-orient 的机会。这个 pattern确实在历史上反复发生。举一个例子,当年 PC 互联网刚出现的时候,时间是在90年代末,那时没有一家互联网公司是挣钱的,大家都看到了这里面存在机会,但在这个阶段,首先要做的工作是把架构、网络给做起来吧? 所以 CISCO 这样的公司会表现得更好。另外也会有一些2B的培训师等等,这个阶段整体上属于为B端造枪造炮提供弹药的阶段,这算是一种曲线救国吧。然后才有2C的大的互联网公司的出现,比如 Google。再比如移动互联网,首先要有 CDMA 这样的软件算法,放在芯片里面,使每个移动设备 stay connected。然后才是 Apple 这样的公司的崛起。中国的大部分投资者、创业者和企业家,他们看重的就是这样一波机会。
在我们进入这个市场的时候,美国人把这些基础技术已经做完了,从2000年开始到今天,我们是在享受上个世纪八九十年代科技成长的所带来的的一个环境,然后我们去做了这些用户导向的企业。但今天我们去看这个整个这个创业环境,2C的这种创新其实代价已经非常的高昂,比如嘀嘀融了上百亿美元,美团也有几十亿美元,这个投资其实越来越沉重。其实你想想看,当时 Google 只融了两千万美元就上市了,百度差不多也就是千万美元,腾讯也是如此。在那个时候其实有大把的机会去捕捉。但是现在的话呢?八九十年代技术创新所带来的这些能力其实已经被发掘的差不多了,所以我们会发现创新越来越沉重。
好,然后我们来看一下未来的机会。过去的12个月里,大概近半年的时间里,我们看到整个高科技行业有一个机会,今天所有的这个二级市场投资者都开始研究它、关注他,这个让他们觉得很 surprised。因为在整个高科技市场比较低迷的时候,有一只股票是 NVIDIA,从20块钱到现在涨到差不多100块钱,曾经一度到119块,在过去一年多的时间里成长了5倍,是整个高科技市场成长速度最快的一个机会。这里面核心的逻辑其实很简单,他就是造枪造炮嘛。现在很多企业,无论大小,即使不知道深度学习用来干什么,怎么挣钱,大家都要去抢购 GPU 这些。所以我们也非常看重这点,希望做一个深度神经网络的这种处理器,让大家能够利用这些软硬件结合的解决方案。