专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
新浪科技  ·  【#今年新股0破发#!#打新人数创2年多新高 ... ·  18 小时前  
新浪科技  ·  【#国联民生合并后架构调整# ... ·  昨天  
51好读  ›  专栏  ›  雷峰网

Human-like learning在对话机器人中的魔性运用

雷峰网  · 公众号  · 科技媒体 硬件  · 2016-09-26 22:01

正文

请到「今天看啥」查看全文



所以这类问题 最关键的地方就是要针对问题本身去建模,把问题抽象出来,逼近问题本质,不可能有一个现成的通用的框架来搞定。


接着上面问题:二是知道第三方app都可以完成哪些任务,需要点击哪里,然后才能与用户想做的事(语义理解)进行对接。


这个你们用什么应用内搜索技术解决的?


【这个问题看起来完全误解了我们的工作,我们根本不关注一个app是如何操作的,实际上也无需和具体app对接。】


再回到问题本质这个思想上来,现在的APP的操作是基于鼠标,键盘,触摸屏的输入方式来设计的,不管APP做得多么友好或者简洁,其都受限于这几种机械的输入方式,简单地说,现在的APP不过是这几种输入方式的一个组合操作。为什么要把语义理解和这种低级的操作方式对应起来呢?完全没有必要这么做!对话是一种全新的交互方式,也只有对话的交互方式才是最接近人与人之间的交互方式,当然也是人与机器最自然的交互方式。


脱离技术细节层面,我们要完成某个任务或者做某个决策,这个过程本身和输入方式无关, 它就是一个任务流,可能有一些关键节点 ,不同的人都需要遵守,但更多的是其实没什么规律,每个人都要自己不同的个性化处理过程。比如“买飞机票”的过程:有人会去网上买,有人会打电话买,有人会去柜台买;有人很固执,只要满足其所有既定条件下的机票;有人犹豫不决,不停地对比,边询问边考虑;更多的人是有一个基本优化目标,比如价格要尽量低,或者说时间要尽可能快,然后根据当前航班情况选择一个自认为最好的。


我们要做就是在人完成一个任务的抽象层面,用一种最自然的方式来辅助人决策,以尽快推进任务的执行,这其中最合适的方式显然就是人与人之间的对话方式。其瞄准的是人完成某个具体任务的场景,用对话的方式来推进整个任务的快速进行, 并在恰当的时候调用可能的第三方接口 ,比如展现特定信息,下单等,以使得整个任务朝着某个目标优化下去,比如获得最符合当前用户个性化的订单。这是典型的AI思路,所涉及的技术也是上面所说的各种复杂技术的融合。


当一个语音机器人的重心变成了帮用户决策,调动第三方应用来快速响应,它会变成一个重对接技术和资源的事情。


甚至重运营合作的事情,怎么看这个问题?


【这个问题是不是问我们需要对接很多服务,所以在服务对接的运营上会比较重?】


我们的确需要对接诸多服务,以在具体的任务场景中灵活地恰当地调用某种服务来辅助决策。


但和问题中的理解完全相反, 我们可以针对网络上不同的服务接口,全自动地构建语义分析和服务对接程序 (抛开具体商业谈判不谈,这里只从技术上考虑,毕竟网络上使用越广泛的服务就越是免费的),这也正是我们另外一个优势所在。除了我们的语义分析方法可以快速地从一个场景迁移到另外一个场景外,我们针对不同的服务,可以完全自动地构建起对应的对接程序。更直白地说就是针对一个特定服务的接口,我们会让我们的系统自动“写”一段程序来处理这个服务下人和服务之间的对接过程,也就是针对这个服务接口的对话流程。从程序编写的角度看,就是我们设计了一个可以生成特定程序的程序,来代替本来可能需要程序员手工编写的工作。


调动第三方App来响应任务,范围很广,需要深度垂直化才有优势,如何平衡?


基于我们设计的模型的通用性,理论上,只要我们持续深入下去,我们就可以做到全场景对话,甚至多语言对话。但是从当前用户的接受程度,相关产品的成熟度,还有商业模式上看,我们更倾向于在车载和家居环境中突破。也就是说纯语音对话的方式现在还只是一种非主流手段,只有当人双手被占用的情况下,这种方式才会变得有用和有效。但是,随着语言理解和对话技术的快速发展,这一情况正在变得越来越普及,有望在数年后成为一种主流的人机交互方式。



读者提问


NLP在人机交互上的应用现状能否介绍一下?在AR/VR场景下能做到怎样的程度?例如游戏中的NPC能够像微软小冰一样进行复杂的随机交流吗?


首先要说明的是我个人觉得小冰根本没有什么复杂的技术,虽然可能用了深度学习,用了句子生成方法。但其核心还是通过大量聊天语料(问答对)训练一个新问题在当前上下文下最“相关“的一个已有问题,从技术上其更近似于检索的方式,只是选用不同的模型对上下文的描述能力可能不同,效果也有所差异。


但总体上,这种对话和“语言理解”无关,也就说和推理没有半点关系,还只是一种纯统计上的相似度计算而已。所以要问的或许应该是:游戏中的NPC可否像真正的游戏玩家一样和电脑前面的游戏玩家进行自然对话。


其实特定的某个游戏是一个非常细分的场景,我个人觉得这这种受限场景下,人机对话可以做得更接近于人与人之间的对话,但是需要考虑的是游戏中角色很多,不同角色的设置也不同,需要真正比较通用且能快速实现个性化的对话模型,而且这种模型的冷启动也需要针对不同角色有所差别。







请到「今天看啥」查看全文