正文
反洗钱
另外一个很大的问题是反洗钱,
怎么
通过机器学习的角度,自动地系统化地来学习
,是非常有意思的一个问题。所以我们建立了反洗钱模型,用的是无监督或者弱监督图算法,用于资金交易网络特征挖掘和无监督隐案挖掘。这都用到了真实的这案例中。
垃圾账户识别
举一个具体化的例子:垃圾账户识别。垃圾账户注册防控能够降低后端风险基数,稳定大盘指标,极大地提高整体的账户质量。
控制垃圾账户的注册,确定账户是一个真实的有效的账户,是一个很关键的问题。
对于新注册用户,怎么来判定这是不是一个垃圾用户?
我们的想法是从系统的角度来考虑人和这个社会之间的关联,然后构造网络,从网络结构来思考,一个人的信息不会很多,那么可以借整个网络的信息来一起分析。具体来讲就是组里老师开发了一个叫Struc2vec的算法,核心思想非常简单:把网络和深度学习结合起来。
Struc2vec算法的规则,很好地平衡了预测准确率和预测召回率。基本上是在90%的召回率情况下,准确率也基本能达到90%左右。
说明这个算法有非常强的区分能力,能够比较准确地区分一个账号的好坏,同时和经典的规则以及Node2vec比较,预测召回率也有所提升。
智能营销
再说一下智能营销中的应用。很多公司都有增长用户的需求,那怎么来促进增长?平台怎么把商家和用户连接起来,那是非常关键的一个问题。
这里面我们就考虑到强化学习和加强学习,
它的核心思想是:把现实的决策问题,放在数学的框架下来考虑。
它的优势是能精准刻画用户状态、多渠道组合决策和全人群差异化决策。
去年提过,深度学习有一个非常大的提升,现在比深度学习的方法又有了一个很大的提升。在推荐卡片点击率上,实时深度强化模型较深度学习提升了70%;在最终签约率上,提升了50%。
再讲另外一个跟营销相关的问题。在现实生活中,大家可以看到不同的信息,那能不能把所有的信息源融合在一起?也就是怎么把信息融合在一起,使我们能看到更全面的细信息,来帮助更加精准地理解和判断。在金融的场景里,怎么把不同的行为结合起来。
这是非常有意思的一个问题。在这上面也可以理解为把很多数据源都接进来,然后在隐含空间里面把数据做一个综合,用统一的框架来表示。
举个真实的例子。看右边这张图,大家看到什么共同的特征?是很多穿着紧身牛仔裤的年轻女孩子,分析这个行为,发现买紧身牛仔裤的女孩,较其他人,买手机碎屏的服务的概率比较高。
于是我们就开发了叫做“碎屏险”的产品,这是非常小但很创新的产品,我们做推荐的人群就是左图这群人。
还有非常多类似的事情,一旦发现数据间的强关联之后,就能用很多应用来解决一些小的问题。
保险
举一个定损宝的例子。