正文
我们与祖母可能交流困难,如何应用 NLP 技术与她进行交流,增强人与人之间的沟通;第二张图片与医疗相关;第三张图片中是微软的工程师,是一个天生的盲人,微软现在有一种眼镜能够进行物体识别,这也是基于deep learning很好的应用。
第一张图是我们在平安城市中抓取特征点;第二张图是服务型机器人;第三张图是在农业方面的应用。因此,在 AI月 deep learning 的时代,有很多领域大家可以尝试去做。
这张图想与大家分享一下英伟达在自动驾驶领域的应用。我们将自动驾驶变为AI
的任务,模拟人进行驾驶。当人驾驶时,人需要知道周围环境,车的位置,并作出相应的驾驶策略,这也是AI的任务。1)感知:我们会用多样的传感器将周围环境情况了解清楚;2)reasoning:判断周围环境是否安全;3)驾驶:依托于高精度地图,高精度地图能够提供丰富的环境信息和精确的定位。
这是一个总结,可以看到人工智能时代在架构、软硬件、算法等方面不断向前发展。
下面我会跟大家分享一下,在 GTC 2017 中一些比较好的收获。
第一个就是,英伟达在
GTC上宣布了新一代的 GPU,VOLTA100。我们每一代的GPU有一个科学家的名字,这一代的GPU 对我们来说,有几方面的提高,第一是它有
210 亿个晶体管,12纳米线程,然后整个核心板的面积在815毫米平方,这是一个非常大的进步,整个架构上有一个非常大的进步。
这一代,我们的架构有一个很好的一个提升,我们会在这一代架构里面放入一个Tensor
核,它完成了以前矩阵式同步这种的矩阵式相乘,实现非常高速的运转。这样的结果会让我们产生120Teraflops 的计算能力,这种计算能力无论针对
Training 端还是 Inference 端都是非常好的进步。这一代产品是英伟达最新在 GTC上发布的。
这一页是跟大家讲一个蛮有意思的产品,其实机器人或者说我们叫智能体的这种产品已经出了挺长时间,但是机器人这种产品有一个问题,就是说机器人这种场景,你真正去训练它的时候,其实是挺困难的,包括有各种场景你要去模拟,这是比较大的困难,因为第一个是时间长,第二个你不会去造很多机器人一块去学一些东西,这样的话,你这个研发包括这种开发的周期会很长。
这是我们叫 ISAAC 的
SIMULATOR,其实是把深度学习和模拟结合在一起,它其实是用一个模拟的平台去训练机器人,比如说我训练一个机器人做一个动作,做什么动作呢?我做一个比如说打高尔夫球的动作,那他就去做模拟,他一遍一遍的做,这样的话,如果一个机器人的公司,它以使用这样的模拟器。它去做这种模拟的时候,可以同步去做多个,或者是把一种机器人同步做多个机器人的模拟,然后做多个场景的模拟,甚至是一个场景多个机器人去模拟,这样去做。这样的话,会极大的提升模拟和开发的效率。
这一页是我们这一次的颁奖。我们的评委有的来自高盛,有的来自微软,这些评委都是来自于这些公司。那么我们发现很有意思,这里面有六家公司(获奖),有三家第一。这三家都是做医疗和健康相关的。有一家是做针对心脏病的快速检测,它这个好处在哪呢?就是说我个人如果心脏很不舒服的时候,真正送到急诊或者医院时,很难很快就定它这个心脏有什么样的问题,但是里面有一家的技术就能让它做一个相对来说比较简单的检测,它通过这个检测后,它的后台会用
Deep learing,这样它的检测会去看心脏大部分概率是哪一种病,第一准确度高,第二很快速,所以这对这种病人的快速诊断起到了很大的作用。
还有一家公司是在做针对皮肤癌的检测,另外一个公司在做什么呢?另外一个公司在做针对血液的检测,它这个血液检测主要是看白细胞,通过血液里面的白细胞来看免疫力,这三家无一例外都在用
Deep
learing去做他们核心技术的这种检测,第四家公司是做计算机安全的公司,它也是利用现在网上的样本,比如说它会把现在网上攻击的样本,包括病毒的样本在他们的
DNN
里面去做训练,去看到底是哪一类型的病毒,或者说是攻击。底下这一家公司做了一个大家都没有做的市场,它要做建筑工地的市场,他们发现建筑工地有一个问题是,建筑工地里面的一些技术人员拍建筑工业外形照的时候,手机也拍了,拿相机也拍了,但很难把这些照片很快的进行分类,这些建筑工地一个是条件差,也没有很好的办公条件,所以很难分类,很难分类的问题是在于带来工作上这种工作效率降低,这是第一个。
第二个是信息上传不及时。这家公司拿了一个类似于 Pad 的设备上工地,拍了需要检测的照片以后自动做分类、上传。它提供了这样一套智能解决方案。
关于 Focal,刚才跟大家讲过,就是针对传统商店的解决方案。
这是一段录像,这段录像其实是想跟大家分享一下在自动驾驶方面的一些应用,把这个放在这里分享就想跟大家说一下,其实自动驾驶和 AI 是强相关的,这里面无论从技术还是商业还是前景上都是非常好的,大家可以看一下。
这段视频是简单讲了一下自动驾驶中我们的一个路测,看起来好像很简单,从一个地方起步然后转弯,从普通高速上来再下高速,这里面用到的 AI
技术是非常多的,最简单的就像在路上跑的时候,物体的识别,包括车道线检测,包括移动物体的检测,包括自动驾驶的策略,怎么样做驾驶的策略等等,其实这里面包括了很多
AI 相关的技术,所以我们可以看到自动驾驶其实是一个跟 AI 强相关的行业,这也是一个非常具备挑战的行业,当然也很有意思。
这里有一个我一直很想跟大家分享的视频。
视频地址:https://www.bloomberg.com/features/2016-hello-world-new-zealand/
刚才有一个同学提了很好的问题,问
AI 和 VR 会不会有一种结合的过程。其实我们想说,AI 和 VR 有一种非常强的结合,也就是在 VR
里面模拟一个人,我们把这个人定义成一个智慧体,这个跟机器人是完全不同的场景,为什么这么说呢?因为这个机器人如果是智慧体的话,比如说这个地方有一个机器人,那就只是一个机器人,它长什么样就是什么样。如果在虚拟世界里面,它跟
AI
技术结合以后,这个人它可以自己成长,它可以学东西,它其实是一个智慧体,这个应用最早来自于哪里呢?这个应用最早来自于电影里面的需求,电影里面我们会说我设一个人物,这个人物本身就能跟你交互学习,是一个类人体,但是它是用计算机模拟出来的,电影行业最开始有这个需求,这个需求有一个拓展。比如说我可以在计算机中模拟一个孩子,而这个天真无害的小孩,他会随着年龄的增长,会变老,他是一个智慧体,智慧体说明什么呢?你可以跟他进行互动,你教他英语他会英语,你教他爸爸妈妈他会爸爸妈妈,这样一个智慧体的商业价值我不知道,但是我觉得他对人类带来的价值很大,比如说有些人,比如说有些家庭,孩子没有了或者找不到了,或者父母很长时间没有见小孩非常想小孩,我怎么办呢?通过这种技术,因为小孩他会去学,你从视觉上的感觉,他就跟真人一模一样非常的感动。
这段视频其实就是虚拟现实和 AI
相结合的一个案例,这最早是奥尔兰大学一个工作组在研究的一个很不错研究的主题,主要是通过这种模拟的技术,首先是在虚拟屏幕上构建一个智慧体,然后这个智慧体后面其实是用深度神经网络去训练智慧体,这样这个孩子会理解你的话,他会去学英语,我第一次看到这个在网上看到这个视频,感到非常震憾,我今天想分享给大家。
其实从这段视频分享中,我们可以看一下,它其实有几个方面的工作在做。首先,在模拟方面,包括对细节的处理,肯定是做的非常好,这是一方面的工作。