正文
2015年,我们开始关注AR这个领域,当时为2016年制定的一个新春红包方案就是用手机识别猴子。这个方案让大家有了AR的感觉,项目组也想做一些AR的创新玩法。但是,由于当时相关技术储备不足,就放弃了。
方案虽然放弃了,但探索AR的新玩法这件事,深深地烙在了我们的心里。2016年一开春,我们创新组就开始储备相关技术知识:识别跟踪算,OpenGL、3D渲染引擎,建模能力,AR体系架构,等等。这些相关技术也陆续在小视频美颜、人脸贴图等社交场景进行了实践,为后续AR相关技术快速成型提供了保障。
如何推进AR的新玩法呢?当时,我们团队定下了两个目标,一是找一个小场景落地AR概念,二是在春节红包上使用AR技术,后者是我们的年度终极目标。
2016年的“中秋节扫月亮”,算是支付宝在AR领域的第一次尝鲜,体验和反响还不错。迈出这第一步之后,各种业务需求也接踵而来,AR新玩法也越来越多——双12线下商圈“扫双12集四宝”的活动,2017年春节AR实景红包,扫可口可乐福娃领红,扫福集福……
新玩法自然会带来新挑战,不说别的,单单用怎么样一种方式呈现AR红包,就是非常大的挑战。
大多数AR的玩法都是针对预设的2D图片,离线训练好识别模型,然后在此基础上实现识别互动。由于是2D图片并且预先验证过,因此能较好的保证识别的效果。
支付宝AR实景红包算是业界的一次大胆尝试。用户自由选择真实3D场景,拍摄一张图片作为线索图,其他人根据线索图到指定位置拍摄图片进行比对。而这种方式呈现AR红包,自然也对图像匹配的算法性能提出了新的挑战,主要涉及如下方面。
-
算法鲁棒性:由于针对真实的3D场景拍照,匹配算法需要容忍一定的遮挡和角度、距离、光线、图片质量等的变化;
-
计算复杂度:由于在终端上进行实时匹配,算法的复杂度不能太高,否则会导致用户寻找红包时间变长,手机功耗消耗过大等问题;
-
手机流量:移动端应用需要考虑用户的流量问题,需要在数据大小和识别率之间做好平衡;
-
手机兼容性:对拥有亿级用户的支付宝而言,机型特别是Andriod机型分布很广。对于我们3D模型渲染带来了很大的挑战,需要制定完善的兼容性方案,确保AR功能的正常使用。
AR红包的初期方案也和很多已有的产品类似,仅依靠LBS和手机陀螺仪来进行互动:用户在某个位置发一个红包,其他人到达这个地点后打开摄像头,朝着某个方向拍摄就能看到别人发的红包。这个方案由于仅依赖LBS和手机陀螺仪,方案比较成熟,但主要存在两个问题:
-
定位精度:产品初期的定位是让附近的人领取红包(比如附近几十米的人或者同一层楼的人),这对近距离定位要求就很高。内部也讨论了很多潜在的方案,比如结合WiFi定位、室内定位等等,但都不是很通用或者不成熟,没有很好的解决方案;