正文
人脸识别是「刷脸」支付技术的基础。传统上意义上,人脸识别技术有三个核心:人脸检测,关键点定位,特征提取和比对。即首先找到图像里人脸的位置,再找鼻子、嘴等关键点,提取出主要特征并对特征进行比对。比对分为 1:1 和 1:N 两种方式,相应地,也存在两种应用场景。在金融领域做身份验证的时候,我们大部分时候是通过设备关联到账户,知道用户预留的人脸图像,然后将活体的脸和预留的脸做一个算法的比对,这是 1:1 的比对。而 1:N 则是从已有的人脸数据库中找到最为相似的人脸,比如在视频监控的场景下,实时定位画面中人群里的脸,把脸和库里面已有的脸做一个 1:N 的搜索,从而找到最相似的结果。虽然这两类比对方式应用场景不同,但技术基础都是相同的。
人脸比对的核心算法主要是经历了几个过程。最早在 20 世纪 60 年代,人们就已经开始研究人脸比对算法了;80 年代后期,随着是计算机技术和光学成像技术的快速发展,不同的算法模型应运而生,最早的就是基于人脸的局部特征的识别模型;之后,更多的是提取全局特征后,再做一些特征的变换;再后来还有基于二维、三维模板做人脸建模的识别模型。
这两年,人脸识别技术取得了突破式的发展,一个是源于深度学习的深入应用,另一个就是海量数据的爆发。随着深度学习的发展,人们可以基于神经网络让机器模拟出人类大脑的学习过程。以前人脸识别的准确率只有 70%、80%,而通过卷积神经网络模型和海量的图片数据进行训练,最近两年已经能够到达 99.6%、甚至 99.7%,已经到了可以商用的程度。从数据的角度来说,很多算法、参数都是通过海量数据训练来实现优化,这是一个不断迭代的过程。我们相比于其他人脸识别厂商的优势正是我们已经拥有大规模数据基础。其实,我个人的背景也不是生物识别,更多的是偏向于大数据、机器学习、人工智能。很早我就觉得数据一定是未来的一个大方向,我做过很多数据领域的应用,比如广告、搜索等,更关注从数据挖掘出的价值。对于金融场景下的生物识别来说,我个人认为数据的应用价值会更大。信用评估、风险管理、身份验证等金融核心都需要数据来解决、并通过算法精准地评估。生物识别在人工智能领域已经比较成熟,它在数据应用方面也是最成功的案例。我对数据驱动人工智能从而引发行业变革是十分看好的。
机器之心:对「刷脸」支付应用的定位是怎样的?
陈继东:
《麻省理工科技评论》对于突破技术的定位主要在技术本身之外的应用,强调的是运用科技解决方案,从而带来不同以往的改变,而这正跟我们的定位很相似。我们所希望的是整个人脸识别在金融级进行应用实践,这是应用驱动的、需求驱动的,不是单纯为了做人脸识别这个技术。一个技术能否大规模商用,很多情况下跟它应用的场景是有很大关系的。我们更关注大规模的商业应用,而不是娱乐性的、社交类的,比如说 Facebook 通过人脸识别做照片的分类,或者是预估年龄等应用,我们更偏向于身份验证,这是一个对安全性、识别准确度要求更高的场景。
2016 年云栖大会上,蚂蚁金服展区开张了一家「未来咖啡馆」,客人对着摄像头刷刷脸,就能完成支付。据悉,刷脸支付很快就将落地真实场景。
机器之心:在众多生物识别技术中,为什么选择人脸识别结合眼纹识别的验证方式?
陈继东:
生物识别在金融级的应用始于需求。短信、密码体验差,很多人记不住。比如在网络不好的情况下短信不可达,手机上经常被植入木马,受到攻击之后短信校验码很容易截获。可能用户在不同网站上设置相同的密码,使密码容易被撞库得到。在生物识别方面,不光人脸识别,我们一直也在研发声纹,眼纹,然后包括虹膜、掌纹、笔迹甚至是行为的特征,也一直在进行比较。
选择人脸识别是基于用户的非接触式体验,这不同于指纹识别;还有一个原因是人们拍照是比较自然的一个习惯;另外,人脸照片可以拿来与证件上的照片、以及本人进行交叉比对。那么,我们为什么选择和眼纹识别结合呢?因为刷脸的过程中也会扫描识别眼部特征,用户体验是非常自然的。市场上有一些与声纹相结合的,比如要求用户在扫脸的过程中念一串数字,因为不同人的声音具有唯一性,我们自己也在研究这一类算法,也做过相关尝试,这是双因子的校验。不过这个体验跟扫脸结合扫眼这样的双因子比要差点,受声音环境影响较大。未来除了主动验证,还会发展一些被动的验证。比如根据手机上各种传感器数据来验证这个人,从走路的姿势、拿手机的角度等行为来判断是不是本人,这是一种不需要用户参与的身份验证方式,可以给用户一个更加自然的体验,也是未来我们希望去探索的一个方向。