专栏名称: 大数据风控联盟
传递大数据风控前沿讯息;聚合顶尖信贷行业精英;分享云风控实操案例 。
目录
相关文章推荐
大数据D1net  ·  大数据行业市场调查分析:2028年中国大数据 ... ·  5 小时前  
51好读  ›  专栏  ›  大数据风控联盟

互联网金融风控模型,需要多大的数据?

大数据风控联盟  · 公众号  · 大数据  · 2017-03-17 10:19

正文

请到「今天看啥」查看全文


。比如,法律,旅游,水电,社保,娱乐,消费 …… 等等维度的增加,也体现了大数据的“大”。

在互联网金融领域现阶段,分析这些数据产生个人信用的评分,和 P2P 公司实际业务所需要的评分模型,还有一定差距。


单纯基于大数据的模型

效用有限


互联网金融的风险控制模型经常用到评分卡,例如:个人信用等级评分卡。然而要做评分卡,要计算相应的违约率,首先应该 根据业务,定义目标变量,即输出变量 :什么样的客户算好客户,什么样的客户是坏客户。根据这个目标变量,我们再选择相关的其它变量来考察各输入变量对输出变量的贡献。


目前,很多企业在做单纯基于大数据的评分模型, 并没有把违约与否的情况和网上的行为数据拼接起来 ,貌似有了一个评分,那也不过是按照自己的理解,对网上行为做了一个初步的整理,从模型的角度,已经有了偏差,即模型偏差。所以在应用上,要做到对风险进行准确定价, 实用价值有限


然而我并不是说所有的主要基于大数据的模型都不能用,我们要分开来看这个问题, 对于像淘宝,京东等形成自己的业务闭环的商业模式中,尽可以使用各种方法对自己业务中产生大数据进行分析,因为他们的目标变量和所谓大数据变量是可以拼接到一起的。 但是对于 P2P 机构来说,由于并不是所有的贷款申请人都有淘宝账户,京东账户,所以这里的所谓大数据,大数据模型要落地还是比较困难的。


回归到互联网金融领域,对于申请人,如果拉一个央行的征信报告,那还算方便,其实征信报告的数据也比较规范,只不过是维度增加了;如果要拼接在网上的行为,各方面难度就比较大了。


同时由于 大数据 的收集,整理,存储,预处理,分析等的投入都比较大,所以我在这里说,有个所谓的费效比的 8/2 效应。即对大数据分析投入的精力与其产出实际效应的比例约为8:2。由此可见,单纯基于大数据构建的互联网金融风控模型意义是有限的。


如果为P2P公司构建风控模型的工作中,使用的大多数是脱敏数据(不包含姓名等个人信息),这就使与大数据拼接十分困难。 目前大数据对于互联网金融领域的贡献,我们认为主要在 反欺诈领域 我们为P2P公司风险控制设计的反欺诈模型就利用了很多互联网的数据源。








请到「今天看啥」查看全文