专栏名称: DeepTech深科技
“DeepTech深科技”是与麻省理工科技评论官方独家合作的一个新科技内容品牌。我们专注于关注三个方面:1、基于科学的发现;2、真正的科技创新;3、深科技应用的创新。
目录
相关文章推荐
36氪  ·  小拉出行,打一场更理性的低价持久战 ·  7 小时前  
新浪科技  ·  【#鸿蒙微信安装量突破500万#】华为应用市 ... ·  12 小时前  
36氪  ·  10年前学钢琴的人,现在找不到工作 ·  20 小时前  
51好读  ›  专栏  ›  DeepTech深科技

Alexa数据优势助力亚马逊打败谷歌

DeepTech深科技  · 公众号  · 科技媒体  · 2017-01-22 15:50

正文

请到「今天看啥」查看全文


“现在Alexa语音助手已经出现在数百万的家庭中,幸运的是这些Alexa语音助手并非摆设。”Nikko Strom在前不久于加利福尼亚州圣克拉拉举办的人工智能前沿峰会上说道。Nikko Strom不仅是语音识别专家,同时也是亚马逊Alexa和Echo团队的创始成员。

据Strom介绍,用户提供的宝贵数据已经帮助亚马逊在鸡尾酒会问题(cocktail party problem)方面有所建树。这是计算机语音识别领域的一个问题,当前语音识别技术已经可以以较高精度识别一个人所讲的话,但是当说话的人数超过一人时,语音识别率就会极大地降低。


最初Alexa可以很容易地辨识出是谁呼叫了它的名字,但是和其他语音识别系统一样,Alexa很难辨识具体的请求是什么。然后Strom的团队开发了一个系统,这个系统可以辨识使用Alexa语音助手的声音的特点,并且通过这些特点来寻找向Alexa寻求帮助的人所说的话。

亚马逊积累的数据可以说是独一无二的 。据加州大学洛杉矶分校语音识别领域教授AbeerAlwan介绍,用于训练和测试语音识别系统的标准数据库通常并不包含家庭环境下的音频,也不包括类似于Echo通过使用麦克风阵列来获取特定方向的语音。

“人们已经使用麦克风阵列很长时间,但是我认为还没有一项部署能达到亚马逊所谈论的部署规模。”Alwan认为,通常来讲,更多关于特定场景或语音类型的数据能转化为更好的性能。


Strom也希望他们团队的数据库最终能够帮助Alexa进一步升级,从而能够同时识别两个人说话的声音。“虽然这非常困难,但是我们已经取得了一些进步。对于我们来说,如果我们可以解决这个问题,那将会是非常有趣的事情。”

Strom并没有提到,当这个问题解决的时候Alexa能做什么,但是这或许会使得多人与Echo或其他设备交互的时候更加自然。

Alexa收集的数据还可以帮助亚马逊打败Echo的竞争对手——谷歌公司去年年底推出的Google Home。谷歌可以将网络搜索和语音搜索领域多年的积淀以及大量资金投入到人工智能领域,但是该公司之前的产品和业务都没有收集类似于用户在家中呼叫语音助手设备的语音、或用户使用家庭助手时相同类型的请求的语音。

或许亚马逊希望这场人工智能领域的比赛会变得像网页搜索市场一样。研究表明,谷歌的主导地位无法被初创公司或者资金雄厚的竞争对手(例如微软)撼动的一个原因就是,谷歌已经收集了人们搜索和点击的海量数据。







请到「今天看啥」查看全文