正文
张亚勤:
今天下雨还有雾,自然情况不是很好,但乌镇上车也比较少,在这个环境下,我觉得还是很有价值的,不过出于安全方面的考虑,所以最终阀值,以及对系统的灵敏性控制的严格一些。
新浪科技:
之前有想过这么快就坐上无人车吗?
张亚勤:
这个速度比我想象的要快。这也是机器学习的好处,机器学习一个车所收集的数据,你所学到的决策,它马上可以大规模复制,所以这个是相乘的效果,不是一个复制给多少个,它是这个一乘复制所有人。
比如说我有一百辆车,每辆车收集的东西是不一样的,然后它是集合效应,然后“啪”就放到了一百多个车哪里,一百个车同时进行收集数据,进行离线的训练,等于说IQ马上是相乘的。
新浪科技:
很快能成一个老司机。
张亚勤:
对。就像AlphaGo,它提高速度很快,它两个机器,百度无人车更多,两个机器互相对抗训练,等于左手打右手,一直不会休息。人的话,还要去琢磨还要休息,你水平高了另外一个水平不一定高,这个还是挺神奇的。
无人车来讲,包括上面的激光雷达,今天看到有3个十六线的激光雷达,扫盲区用的。这个是人工智能去挑战的东西,有视觉、有语音、有各种目标、有决策,以及行为规划,数据量其实很大,而且容错率很低。刚才我演讲里也谈到,自动驾驶等级里,L4和L3的区别是,L4的容错率基本是0。L3是一个有限的有条件下的一个自动驾驶的。L4的话,它在以后相当于美国的高速公路,你都可以无人驾驶。到了城区可能有问题,因为有行人的情况,会比较复杂一些。
新浪科技:
除了无人车,上一次您和吴恩达博士一起发布了百度医疗大脑。那么下一步的话,在哪一些领域它可能推出类似人工智能的大脑,是按什么节奏,先后顺序是什么样的?
张亚勤:
现在人工智能大脑有四个模块,先看这几个功能模块比较成熟的,一个是语音和图像,还有一些视频;还有一个是自然语言对话;还有一个叫做用户画像。这4个东西就是基本的功能模块,但是还有一些新东西不断开发出来,这些东西的组合可以用到不同的场景里面去。比如说度秘就是一个应用。我刚才也说了一下,度秘用语音功能里面去,然后像医疗也是利用知识图谱,包括对知识的理解、对话的逻辑、对自然语言的理解。所以有这样的场景都可以被克服。
里面的原因和逻辑是,机器可以很快把目前的资料都读了,人读则很慢,机器自己去读文献、去读病人病历,全部都读下来,它可以去查各种资料,就像AlphaGo,它基本上把棋谱都读了,读了之后还可以理解它,也可以结构化,把这种模型和模式找出来,任何有这样的东西,都可以用。
那医疗大脑来说,你比如说医生和病人交互,有很深的专业性,但专业性对于人工智能是一个好事,越专业说明这个数据越可模型化、更模式化,越容易找到里面的标签。
第二点就是自然对话的过程,其实人和对话的效率并不是很高,你可以问很多重复的问题,问了问题之后,他答的可能未必是医生有用的信息,这个对话会消耗很长的时间。如果用机器和人对话的时候,你会发现,机器如果发现是废话,就会跳过去。第二点把流程减到最低,因为至少把医生的时间省出来了,然后最后等医生看到这个机器结果,就知道大致是怎么回事。
然后好处就是说,你做的越多,机器就能做得越好。你看我们系统里面,病人和医生也有对话,它可以学习怎么对话,然后把很多东西综合起来,然后越来越好。
这些东西其实对于基层医生很有好处,因为可能这些医生的水平比较低,但他们学到的是专业医生的三甲医院顶级医生的知识。而对这个顶级医生的话,现在是辅助诊断治疗的功能,给作出最后诊断。最后这个诊断信息又可以反馈给基层医生用。这种自我学习、自我完善、自我提高的过程非常好。