正文
马化腾
:我们期待有本质性的飞跃,比如说发现飞机的空气动力学、流体动力学和鸟不一样的,车轮和人型马一样,仿生是某些垂直的领域,包括围棋是选非常窄的领域,通过各种参数训练。
郭为刚提到用AlphaGo下一盘棋消耗多少能源,垂直领域训练消耗能源,但是实际用消耗不了多少。现在训练出来的单机版本跟职业棋手差不多,训练需要很长时间,最麻烦的是改一个参数,规则改一点、算法改一点,全部重新来消耗很大,所以这属于很窄的技能模拟。
未来下一步到通用的,再下一步是不是有更本质性的发现背后的原理,智能其实可以超越现在碳基智慧,是不是有其他的元素可以形成更高级的生命和智慧呢?这是超越人类现在发现的知识,这是有可能的。
有人突发奇想说,现在认识的宇宙是高智能生命用量子计算模拟出来的环节,一切都是模拟起来的,这是发挥大家脑洞大开的想象力吧。
问:有没有可能把数据分享出来,让这些创业公司来用?
马化腾
:这个问题在内部我们也有激烈讨论。首先看人工智能我们关注那几块,第一个是场景。第二个是大数据。场景就是你想把这个技术应用在什么场景下,你是不是有高频的跟用户接触,这是一个落地的很重要的地方。所以我们看到很多研究院也好,包括我们内部研发团队。如果没有场景落地,没有平台支持,基本上就是空中楼阁,研究一半很难往下走。
第二个是大数据,大数据也是从平台、业务部门有大量实际运转数据才能产生出来。但是这里面很多大数据是垃圾数据,因为没有标签,每人做规划定义,用多好的算法也学不出来,学出来也是走火入魔,没有用的。数据清洗、标签化难度非常高,我们甚至要雇佣很多人用人手的办法,先用人脑清洗干净,再让AI学习。这里面是一个混合结合的过程。第三,计算能力,也就是你有云的资源,拿几十万核的计算能力,CPU、GPU,我们还是有这个能力的。
而且在云里面本身就可以很好的调用,这是我们第三个优势。第四个,一年前我们比较缺乏的就是人才。通过一年我们也招了挺多的人,我们在微软、在西雅图还设置了一个实验室。因为很多微软的人不愿意离开西雅图,所以我们就在旁边设,没有办法,人才就是这样。几个方面结合起来才有办法真正在某一个领域看到它的成效。
我们现在观察到很多的AI所谓的大拿们,他们更关注怎么落地,能不能把毕生研究成果能够体现出来,所以在我们内部在吸引人才的时候,往往也会说你们微信、手机QQ里面的平台数据能不能给他们用,但是事实上大家都知道,BG、部门里面的平台他们也很希望近水楼台先得月,数据就在我身边流动,我为什么不能招人先研究一把,为什么给你呢。我们现在还处在内部怎么把数据分享出来这个阶段。
当然这里面还有一个用户很关注的个人隐私,别把我的数据都卖了,到时候大家都知道,这里面还有一个很复杂的信息安全个人隐私脱敏,你是不知道无法根据数据倒推到哪一个人做了什么事情,我们要把这些处理干净才能往下一步谈。这里面数据清理到什么标签,才能给其他部门、包括外部合作伙伴怎么用。同时有很多数据来自合作伙伴,业界其他公司,他们也遇到这样的问题那者一堆裸数据不怎么用,这样业界还要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。
李彦宏:人工智能不是互联网的一部分,它是颠覆性的
问:当年百度为什么那么早做人工智能布局?
李彦宏
:我其实也思考过这个问题。从百度的基因来说,我们从一开始成立到现在最主要是做搜索。搜索本质上是机器试图理解人想要的东西。我们一开始用各种各样计算机方法试图理解人的意图。我在想一个问题,深度学习在图像检索里头的效果不错,是一个偶然还是它代表一种趋势?分析完之后,觉得它是代表一种趋势的,它不仅仅对于图像搜索有用,它对很多其他计算机科学要解决的问题都是非常有用的。原因就是,随着互联网这么多年发展,数据越来越多,越来越丰富,计算资源越来越便宜,越来越强大。