正文
Skill大家可以简单理解成手机端的一个和手机APP相类比的,一个语音端的的智能音箱的APP的npr接口。现在在这两万个的skill当中,上升最快的是三类的skill,播报式、指令式、互动式。
播报式主要是音乐和新闻;
指令式主要是我们传统的智能家居通过音箱来控制;
互动式主要是娱乐和游戏
我觉得后面智能音箱生态建立起来后,
可能他的机会在智能音箱本身并不是很大。因为巨头都已经在做了,而且他可以硬件上不赚钱,但是在这个平台这上,比如说
智能家居
可能会迎来一个新的春天,还有一些
游戏厂家
、
内容厂家
可能会有一些新的机会。智能硬件的话其实我们也可以考虑如何和智能音箱相结合去做一些爆品,在这个生态系统上面去做一些事情。
在国内的话 bat各自也有自己的平台(腾讯云、DUEROS、AliGenie)也在做,来抢占这个流量的路口,
科大讯飞、思必驰也在做一些从云端到整个硬件模块的一些方案。
AI音箱和传统的蓝牙音箱另一个区别就是它做了麦克风阵列,下图看到的是目前
以6(+1)麦为主流的方案,
图中
(
绿色的部分对应的是麦克风)。
AI音箱的麦克风阵列
最近两周我在家体验AI音箱,
给我带来的感受,第一个是远程交互,通过关键词的唤醒就可以与他交流。我去做一些应用的时候葛优躺也可以,我还可以远距离的和他说话,我尝试过在家里有十米的距离我和它沟通,连上网之后我发现反应也是非常快的。最快的我觉得是Echo,从开始说话到反馈小于一秒,这个体验是非常好的。然后国内厂家的话,我觉得小米也是非常的快,天猫精灵稍慢一些,但是总体来说还可以接受。
AI智能音箱有哪些特点?
AI音箱对传统音箱主要有两大块的技术区别,
一块是
语音信号的前处理
,包括回声消除、波速成型、音源定位、降噪、去混响、自动语音电平控制这块是偏硬件的控制。还有一块是
智能语音交互,
包括语音关键词搜索、本地语音识别、声纹识别、语音合成。
语音处理流程:
语音检测→基本信号处理→模块唤醒→麦列信号处理→语音交互
第一步(语音检测)因为会有很多环境噪声,音箱要识别是否为语音这个是基础。
第二步(基本信号处理)识别到语音之后去判断是不是唤醒词、识别到唤醒词之后才开始启动麦克风阵列然后再进行语音交互。