专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
目录
51好读  ›  专栏  ›  腾讯研究院

用声音开启微信的秘密

腾讯研究院  · 公众号  · 科技媒体  · 2016-12-07 17:30

正文

请到「今天看啥」查看全文



简单来讲, 声纹识别可以分为注册和测试两个部分 。每个部分都包含从语音信号中提取说话人相关信息的特征参数,行话是“特征提取模块”。此外,在注册的环节,包含了“模型训练模块”,测试部分还包含“确认判决模块”。

用户通过注册,提取了声纹特征数据,形成自身的声纹模型,而在测试环节,再说一次话,提取这段语音的特征参数,与声纹模型进行相似度得分的计算。如果最终相似度得分超过了系统设定的“阈值”,则登录通过。否则就会被拒。

传统的声纹识别,主要应用在相对较长时的电话场景中,相信你也在谍战、警匪类的影视剧中看到过类似场景,漫长的监听后,男主带着如释重负的表情,说“就是他!终于出现了!”


而用声纹识别来做登录验证,如果验证语音很长,比如要你巴拉巴拉对着手机先说上一分钟,你会感觉很不爽。

但是,如果很短的话……


(机器os:人家都还没听清呢,怎么识别!!!)

因此,微信声音锁的用户的验证语音很简短,实现念一串数字一秒登录,用这么短的语音来做验证,难度可想而知。再加上,登录验证是一个比较严肃和敏感的使用场景,对识别准确率要求又极高。


这咋整?



鱼和熊掌真不可兼得?


当使用声纹识别登录时,最理想的状态当然是,自己随便地、漫不经心地说上一串数字或者词语短句,系统就能准确识别,让我通过,而其他人无论如何伪装,如何逼真模仿,甚至是录音,都不会被通过。







请到「今天看啥」查看全文