李彦宏、马化腾、沈向洋三巨头对话人工智能的应用和未来 | IT领袖峰会

雷峰网 · 公众号 · 科技媒体 · 2017-04-02 16:42

正文

请到「今天看啥」查看全文

马化腾 ：我们期待有本质性的飞跃，比如说发现飞机的空气动力学、流体动力学和鸟不一样的，车轮和人型马一样，仿生是某些垂直的领域，包括围棋是选非常窄的领域，通过各种参数训练。

郭为刚提到用AlphaGo下一盘棋消耗多少能源，垂直领域训练消耗能源，但是实际用消耗不了多少。现在训练出来的单机版本跟职业棋手差不多，训练需要很长时间，最麻烦的是改一个参数，规则改一点、算法改一点，全部重新来消耗很大，所以这属于很窄的技能模拟。

未来下一步到通用的，再下一步是不是有更本质性的发现背后的原理，智能其实可以超越现在碳基智慧，是不是有其他的元素可以形成更高级的生命和智慧呢？这是超越人类现在发现的知识，这是有可能的。

有人突发奇想说，现在认识的宇宙是高智能生命用量子计算模拟出来的环节，一切都是模拟起来的，这是发挥大家脑洞大开的想象力吧。

问：有没有可能把数据分享出来，让这些创业公司来用？

马化腾 ：这个问题在内部我们也有激烈讨论。首先看人工智能我们关注那几块，第一个是场景。第二个是大数据。场景就是你想把这个技术应用在什么场景下，你是不是有高频的跟用户接触，这是一个落地的很重要的地方。所以我们看到很多研究院也好，包括我们内部研发团队。如果没有场景落地，没有平台支持，基本上就是空中楼阁，研究一半很难往下走。

第二个是大数据，大数据也是从平台、业务部门有大量实际运转数据才能产生出来。但是这里面很多大数据是垃圾数据，因为没有标签，每人做规划定义，用多好的算法也学不出来，学出来也是走火入魔，没有用的。数据清洗、标签化难度非常高，我们甚至要雇佣很多人用人手的办法，先用人脑清洗干净，再让AI学习。这里面是一个混合结合的过程。第三，计算能力，也就是你有云的资源，拿几十万核的计算能力，CPU、GPU，我们还是有这个能力的。

而且在云里面本身就可以很好的调用，这是我们第三个优势。第四个，一年前我们比较缺乏的就是人才。通过一年我们也招了挺多的人，我们在微软、在西雅图还设置了一个实验室。因为很多微软的人不愿意离开西雅图，所以我们就在旁边设，没有办法，人才就是这样。几个方面结合起来才有办法真正在某一个领域看到它的成效。

我们现在观察到很多的AI所谓的大拿们，他们更关注怎么落地，能不能把毕生研究成果能够体现出来，所以在我们内部在吸引人才的时候，往往也会说你们微信、手机QQ里面的平台数据能不能给他们用，但是事实上大家都知道，BG、部门里面的平台他们也很希望近水楼台先得月，数据就在我身边流动，我为什么不能招人先研究一把，为什么给你呢。我们现在还处在内部怎么把数据分享出来这个阶段。

当然这里面还有一个用户很关注的个人隐私，别把我的数据都卖了，到时候大家都知道，这里面还有一个很复杂的信息安全个人隐私脱敏，你是不知道无法根据数据倒推到哪一个人做了什么事情，我们要把这些处理干净才能往下一步谈。这里面数据清理到什么标签，才能给其他部门、包括外部合作伙伴怎么用。同时有很多数据来自合作伙伴，业界其他公司，他们也遇到这样的问题那者一堆裸数据不怎么用，这样业界还要有一个标准，互惠互利交换，这是一个大方向，还有很长的路要走。

李彦宏：人工智能不是互联网的一部分，它是颠覆性的

问：当年百度为什么那么早做人工智能布局？

李彦宏 ：我其实也思考过这个问题。从百度的基因来说，我们从一开始成立到现在最主要是做搜索。搜索本质上是机器试图理解人想要的东西。我们一开始用各种各样计算机方法试图理解人的意图。我在想一个问题，深度学习在图像检索里头的效果不错，是一个偶然还是它代表一种趋势？分析完之后，觉得它是代表一种趋势的，它不仅仅对于图像搜索有用，它对很多其他计算机科学要解决的问题都是非常有用的。原因就是，随着互联网这么多年发展，数据越来越多，越来越丰富，计算资源越来越便宜，越来越强大。