正文
很快,把亚马逊做为自己参照系的京东,年底就与科大讯飞开始合作,到了2015年正式注册了合资公司灵隆科技,京东占股45%,科大讯飞占股55%。这是中国探索智能音箱最早的公司之一。魏强后来担任了这家公司的CEO。
同年8月,第一款叮咚正式发售,售价798元。三块功能拼起了它最初的形态:基本的音乐播放器、能简单聊天的助手,以及用语音操控京东微联中400款家居的能力。相当于给京东微联加了张嘴和喇叭。
刘强东对这个项目非常重视。首发时京东商城拨给魏强一个月的3C类战略单品首页位置,还有各种免费资源、秒杀、优惠券。
同样在Echo出现那年,创业公司Rokid,也决定做款入口性质的智能语音机器人。创始人Misa之前是阿里巴巴M工作室领头人,负责深度学习、视觉和自然语言处理研发。现在,36氪跟智能音箱从业者打交道时发现,大家一般都会拿先行者Rokid的产品作为研究样板。
Rokid设计第一代产品时,希望吸引到虽然小众但是高端的用户,力求突出“黑科技”的感觉:实现语音、视觉多种交互模式,同时希望能有类似视频通话、给小孩子看绘本故事等功能。
最终,去年初代产品ALIEN面市时,带有麦克风音箱、投影仪和来自苹果供应商的面板。尽管已经按成本定价,但售价依然高达5280元。
更重要的是,这家公司发现,周全的交互设计,或许反而限制了用户对语音的使用率。
亚马逊Echo最初曾经因为只支持语音交互,饱受诟病。比如,当你想用智能音箱订外卖,通过阅读屏幕文字选定菜品或许只需要花费你几十秒,要等语音把餐厅的整张菜单报完,却需要几分钟。
但事后反观,恰恰因为Echo的这种设计,“迫使”用户大量使用语音来操作音箱,一来为亚马逊积累了大量交互数据,二来也让用户形成使用语音的习惯。
从如今国内的产品来看,用户使用语音的习惯堪忧。
“目前(语音交互)也只有电视上能看到明确的消费场景,每天有固定量级的用户通过语音搜电影,进行消费。而且每年的量级达到千万,远超过音箱。”一位行业内人士对36氪说,目前电视端语音的使用比例在20%。
每天,魏强都要看叮咚音箱的活跃度。因为足够活跃才能吸收更多数据,提升语音识别的精准度。而准确率和用户体验,才是让一个全新品类成为爆款的基础。他告诉36氪,目前叮咚语音交互的日活为25%,周活40%,月活70%。
一个共识是,Echo的兴起,其实跟大家最开始对echo的低预期有关。亚马逊最初并没有大推Echo,所以早期用户对echo的语音识别准确率,以及有用程度期待不高,加上价钱也不贵,结果用了后反而有惊喜,口碑很好。而且,实际上新鲜感过后,把echo扔在一旁的用户也大有人在。
一名业内人士对36氪说,几个月前自己在一场展会上看了一百多款智能音箱,
其中语音识别准确度最高的,十句里也只能听懂三四句指令,更不乏全部辨识失败的产品。
一家内容提供商对36氪说,
即使是语音识别准确率最好的叮咚音箱,目前点播准确率也只有40-50%。