正文
通常将意图识别抽象成机器学习中的分类问题,在阿里小蜜的技术方案中除了传统的文本特征之外,考虑到本身在对话领域中存在语义意图不完整的情况,我们也加入了用实时、离线用户本身的行为及用户本身相关的特征,通过深度学习方案构建模型,对用户意图进行预测, 具体如图4。
图4 结合用户行为的深度学习意图分类
在基于深度学习的分类预测模型上,我们有两种具体的选型方案:一种是多分类模型,一种是二分类模型。多分类模型的优点是性能快,但是对于需要扩展分类领域是整个模型需要重新训练;而二分类模型的优点就是扩展领域场景时原来的模型都可以复用,可以平台进行扩展,缺点也很明显需要不断进行二分,整体性能上不如多分类好,因此在具体的场景和数据量上可以做不同的选型。
小蜜用DL做意图分类的整体技术思路是将行为因子与文本特征分别进行Embedding处理,通过向量叠加之后再进行多分类或者二分类处理。这里的文本特征维度可以选择通过传统的bag of words的方法,也可使用Deep Learning的方法进行向量化,具体如图5。
图5 结合用户行为的深度学习意图分类的网络结构
匹配模型overview:介绍行业三大匹配模型
目前主流的智能匹配技术分为如下三种方法:
1. 基于模板匹配(Rule-Based)
2. 基于检索模型(Retrieval Model)
3. 基于深度学习模型(Deep Learning)
在阿里小蜜的技术场景下,我们采用了基于模板匹配,检索模型以及深度学习模型为基础的方法原型来进行分场景(问答型、任务型、语聊型)的会话系统构建。
智能导购:基于增强学习的智能导购
智能导购主要通过支持和用户的多轮交互,不断的理解和明确用户的意图。并在此基础上利用深度强化学习不断地优化导购的交互过程。图6展示了智能导购的技术架构图。
图6 智能导购的架构图
这里两个核心的问题:
1. 在多轮交互中理解用户的意图。
2. 根据用户的意图结果,优化排序的结果和交互的过程。
下面主要介绍导购意图理解、以及深度增强学习的交互策略优化。
智能导购下的意图理解主要是识别用户想要购买的商品以及商品对应的属性,相对于传统的意图理解,也带来了四个新的挑战:
第一:用户偏向于短句的表达。因此,识别用户的意图,要结合用户的多轮会话和意图的边界。
第二:在多轮交互中用户会不断添加或修改意图的子意图,需要维护一份当前识别的意图集合。
第三:商品意图之间存在着互斥,相似,上下位等关系。不同的关系对应的意图管理也不同。
第四:属性意图存在着归类和互斥的问题。
针对短语表达,我们通过品类管理和属性管理维护了一个意图堆,从而较好地解决了短语表示,意图边界和具体的意图切换和修改逻辑。同时,针对较大的商品库问题,我们采用知识图谱结合语义索引的方式,使得商品的识别变得非常高效。下面我们分别介绍品类管理和属性管理。
智能导购场景下的品类管理分为品类识别,以及品类的关系计算,图7是品类关系的架构图。
图7 品类管理架构图