正文
营销是人工智能今天比较典型的应用场景,但也同样会碰到很多问题:如何知道消费者是否看到了这个广告?他们是否真正喜欢这个广告提到的品牌或商品?这些问题其实也是一个非常难解决的问题。一般来讲营销平台会有一个DMP系统给消费者打上正确的标签,然后做人群定向,之后再做Matching和Ranking,最后进行算法优化。但上千万的广告主需求多样化,也很难满足每一家的精准投放需求。
无人驾驶涉及到非常多的东西,要对道路、行人、车做出识别,对交通标识与障碍物做出决策。众多场景,需求多样。
围棋拥有大量的模式与规则,需要多个围棋专家与工程师的支持。在AlphaGo之前,基本上是通过MCTS+规则来做围棋,围棋也做了几十年的时间,请了大量的专家,但做下来的效果等同于现在业余一段、两段的水平,真的要到高段位的,非常有挑战。
今天有大量的学习任务,大量的参数调优,大量的数据标定需求以及大量的不可定义的因素影响,以至于这么多的事情让我们的算法和机器学习工程师变成调参工程师了。因此,我们思考下一步的人工智能会往哪里走。今天我们觉得通用人工智能(AGI)可能是一个未来解决这个问题的方向,也是我要介绍的第二个内容:通用人工智能。
通用人工智能为什么最近能火起来?也是因为有了AlphaGo的原因,AlphaGo打败李世石以后,其团队提出了叫通用目的的学习机器人,所谓的通用在哪里?包括两个方面,一方面是学习的过程更加自然,而不需要大量的工程师预先编程;另一方面叫通用,通用的意思是它能够被应用在多个项目上,能够用同样的一套学习框架来做多个问题的学习。
整个学习框架是这样的:给定一个目标, AI系统发出一个指令到环境当中,然后环境会给一个反馈到系统,整个过程当中机器自动进行学习,最后再给出一些预判。大家不要觉得这件事情是不可能的,其实这样的事情现在在很多地方已经慢慢的发生了。
通用人工智能整个输入是什么?是我们观测到的像素级的图片、语音、数据流等,目标是希望它能够做更好的学习,同时这个系统也是一个不断迭代优化的过程。通用人工智能的框架体系核心是深度加强化学习,简称DQN系统,这个系统我们会用在很多场景当中,可以用在营销、游戏当中,也可以用在围棋、电力流量、网络流量的优化、量化投资,还可以用在机器人、机械臂、飞行器、无人驾驶等领域。
我们在几个场景中进行了测试,具体如下
: