基于意图识别模型的意图识别方法、训练方法和设备与流程

文档序号:33639782发布日期:2023-03-29 01:44阅读:来源:国知局

技术特征:
1.一种基于意图识别模型的意图识别方法,其特征在于,所述方法包括:获取待识别集合;其中,所述待识别集合中包括多个待识别的消费行为数据,所述待识别的消费行为数据包括用户和多个特征信息,所述用户与每一所述特征信息之间具有二元关系;根据所述待识别集合,生成多个对偶超图信息;其中,所述对偶超图信息包括与每一特征信息对应的第一超图和与每一特征信息对应的第二超图,所述第一超图表征用户在特征信息上的关联关系,所述第二超图表征特征信息在用户上的关联关系;将所述多个对偶超图信息输入到意图识别模型的编码器中,生成所述待识别的消费行为数据的意图特征;其中,所述意图特征表征待识别的消费行为数据在每一特征信息上的子特征;将所述意图特征输入到所述意图识别模型的解码器中,得到所述待识别的消费行为数据的意图信息。2.根据权利要求1所述的方法,其特征在于,将所述多个对偶超图信息输入到意图识别模型的编码器中,生成所述待识别的消费行为数据的意图特征,包括:将所述多个对偶超图信息,输入到所述编码器中,生成与所述编码器中的每一超图卷积层对应的卷积特征;对各所述卷积特征进行聚合,得到聚合特征;并根据聚合特征,确定所述待识别的消费行为数据的意图特征。3.根据权利要求1所述的方法,其特征在于,所述第一超图具有第一关联矩阵特征、第一节点度矩阵特征、第一超边度矩阵特征、以及第一节点特征;其中,所述第一关联矩阵特征表征第一超图所归属的对偶超图信息的特征表达;所述第一节点度矩阵特征表征第一超图中的用户节点的连接关系;所述第一超边度矩阵特征表征第一超图中的边的节点对应关系;所述第一节点特征表征第一超图中的用户节点的节点信息;所述第二超图具有第二关联矩阵特征、第二节点度矩阵特征、第二超边度矩阵特征、以及第二节点特征;其中,所述第二关联矩阵特征表征第二超图所归属的对偶超图信息的特征表达;所述第二节点度矩阵特征表征第二超图中的特征信息节点的连接关系;所述第二超边度矩阵特征表征第二超图中的边的节点对应关系;所述第二节点特征表征第二超图中的特征信息节点的节点信息。4.根据权利要求2所述的方法,其特征在于,将所述多个对偶超图信息,输入到所述编码器中,生成与所述编码器中的每一超图卷积层对应的卷积特征,包括:将所述多个对偶超图信息,输入到所述编码器中,根据与特征信息对应的第一超图的特征、以及第二超图中的部分特征,生成与特征信息对应的第一初始嵌入特征;根据与特征信息对应的第二超图的特征、以及第一超图中的部分特征,生成与特征信息对应的第二初始嵌入特征;根据与特征信息对应的第一初始嵌入特征和第二初始嵌入特征,基于每一超图卷积层进行处理,得到与每一超图卷积层对应的卷积特征。5.根据权利要求4所述的方法,其特征在于,根据与特征信息对应的第一超图的特征、以及第二超图中的部分特征,生成与特征信息对应的第一初始嵌入特征,包括:
根据与特征信息对应的第一超图的第一关联矩阵特征、第一节点度矩阵特征、第一超边度矩阵特征、以及第一节点特征,确定与特征信息对应的第一图内传播特征;其中,所述第一图内传播特征表征用户在特征信息上的特征表达;根据与特征信息对应的第二超图的第二关联矩阵特征、第二超边度矩阵特征、以及第二节点特征,确定与特征信息对应的第一图间传播特征;其中,所述第一图间传播特征表征用户与特征信息之间的特征表达;根据与特征信息对应的第一图内传播特征、以及与特征信息对应的第一图间传播特征,确定与特征信息对应的第一初始嵌入特征。6.根据权利要求4所述的方法,其特征在于,根据与特征信息对应的第二超图的特征、以及第一超图中的部分特征,生成与特征信息对应的第二初始嵌入特征,包括:根据与特征信息对应的第二超图的第二关联矩阵特征、第二节点度矩阵特征、第二超边度矩阵特征、以及第二节点特征,确定与特征信息对应的第二图内传播特征;其中,所述第二图内传播特征表征特征信息在用户上的特征表达;根据与特征信息对应的第一超图的第一关联矩阵特征、第一超边度矩阵特征、以及第一节点特征,确定与特征信息对应的第二图间传播特征;其中,所述第二图间传播特征表征用户与特征信息之间的特征表达;根据与特征信息对应的第二图内传播特征、以及与特征信息对应的第二图间传播特征,确定与特征信息对应的第二初始嵌入特征。7.根据权利要求2所述的方法,其特征在于,根据聚合特征,确定所述待识别的消费行为数据的意图特征,包括:基于多层感知方式对所述聚合特征进行处理,生成所述待识别的消费行为数据的意图特征。8.根据权利要求1所述的方法,其特征在于,所述待识别集合包括第一集合和第二集合;所述第一集合中待识别的消费行为数据具有实际的意图信息,所述第二集合中待识别的消费行为数据不具有实际的意图信息。9.根据权利要求1-7中任一项所述的方法,其特征在于,所述待识别集合包括第一集合和第二集合;所述第一集合中待识别的消费行为数据具有实际的意图信息,所述第二集合中待识别的消费行为数据不具有实际的意图信息;将所述意图特征输入到所述意图识别模型的解码器中,得到所述待识别的消费行为数据的意图信息,包括:对各所述待识别的消费行为数据的意图特征进行聚类处理,得到多个意图信息;根据所述意图识别模型的解码器,对所述待识别的消费行为数据对应的意图特征进行解码处理,以将所述待识别的消费行为数据分类到所得到的所述多个意图信息中,得到所述待识别的消费行为数据的意图信息。10.根据权利要求9所述的方法,其特征在于,根据所述意图识别模型的解码器,对所述待识别的消费行为数据对应的意图特征进行解码处理,以将所述待识别的消费行为数据分类到所得到的所述多个意图信息中,得到所述待识别的消费行为数据的意图信息,包括:根据所述意图识别模型的解码器,对所述待识别的消费行为数据对应的意图特征进行解码处理,以将所述待识别的消费行为数据分类到所得到的所述多个意图信息中,得到所述待识别的消费行为数据在每一特征信息上的概率分布信息;其中,所述概率分布信息表
征待识别的消费行为数据归属于所述多个意图信息中的意图信息的概率分布情况;根据所述待识别的消费行为数据在每一特征信息上的子特征,确定所述待识别的消费行为数据在每一特征信息上的权重信息;根据所述待识别的消费行为数据在每一特征信息上的概率分布信息和权重信息,确定所述待识别的消费行为数据在每一特征信息上的初始意图;根据所述待识别的消费行为数据对应的各所述初始意图,确定所述待识别的消费行为数据的意图信息。11.根据权利要求1-7中任一项所述的方法,其特征在于,所述方法,还包括:根据所述待识别的消费行为数据的意图信息,向用户推荐物品。12.一种应用于意图识别的模型训练方法,其特征在于,所述方法包括:获取待训练集合;其中,所述待训练集合中包括多个待训练的消费行为数据,所述待训练的消费行为数据包括用户和多个特征信息,所述用户与每一所述特征信息之间具有二元关系;根据所述待训练集合,生成多个对偶超图信息;其中,所述对偶超图信息包括与每一特征信息对应的第一超图和与每一特征信息对应的第二超图,所述第一超图表征用户在特征信息上的关联关系,所述第二超图表征特征信息在用户上的关联关系;将所述多个对偶超图信息输入到初始模型的编码器中进行训练,生成所述待训练的消费行为数据的意图特征;其中,所述意图特征表征待训练的消费行为数据在每一特征信息上的子特征;并根据所述意图特征对所述编码器进行更新;将所述意图特征输入到所述初始模型的解码器中进行训练,以更新所述解码器,得到意图识别模型;其中,所述意图识别模型用于对待识别的消费行为数据进行识别得到意图信息。13.根据权利要求12所述的方法,其特征在于,将所述多个对偶超图信息输入到初始模型的编码器中进行训练,生成所述待训练的消费行为数据的意图特征,包括:将所述多个对偶超图信息,输入到所述编码器中,生成与所述编码器中的每一超图卷积层对应的卷积特征;对各所述卷积特征进行聚合,得到聚合特征;并根据聚合特征,确定所述待训练的消费行为数据的意图特征。14.根据权利要求12所述的方法,其特征在于,所述第一超图具有第一关联矩阵特征、第一节点度矩阵特征、第一超边度矩阵特征、以及第一节点特征;其中,所述第一关联矩阵特征表征第一超图所归属的对偶超图信息的特征表达;所述第一节点度矩阵特征表征第一超图中的用户节点的连接关系;所述第一超边度矩阵特征表征第一超图中的边的节点对应关系;所述第一节点特征表征第一超图中的用户节点的节点信息;所述第二超图具有第二关联矩阵特征、第二节点度矩阵特征、第二超边度矩阵特征、以及第二节点特征;其中,所述第二关联矩阵特征表征第二超图所归属的对偶超图信息的特征表达;所述第二节点度矩阵特征表征第二超图中的特征信息节点的连接关系;所述第二超边度矩阵特征表征第二超图中的边的节点对应关系;所述第二节点特征表征第二超图中的特征信息节点的节点信息。
15.根据权利要求13所述的方法,其特征在于,将所述多个对偶超图信息,输入到所述编码器中,生成与所述编码器中的每一超图卷积层对应的卷积特征,包括:将所述多个对偶超图信息,输入到所述编码器中,根据与特征信息对应的第一超图的特征、以及第二超图中的部分特征,生成与特征信息对应的第一初始嵌入特征;根据与特征信息对应的第二超图的特征、以及第一超图中的部分特征,生成与特征信息对应的第二初始嵌入特征;根据与特征信息对应的第一初始嵌入特征和第二初始嵌入特征,基于每一超图卷积层进行处理,得到与每一超图卷积层对应的卷积特征。16.根据权利要求15所述的方法,其特征在于,根据与特征信息对应的第一超图的特征、以及第二超图中的部分特征,生成与特征信息对应的第一初始嵌入特征,包括:根据与特征信息对应的第一超图的第一关联矩阵特征、第一节点度矩阵特征、第一超边度矩阵特征、以及第一节点特征,确定与特征信息对应的第一图内传播特征;其中,所述第一图内传播特征表征用户在特征信息上的特征表达;根据与特征信息对应的第二超图的第二关联矩阵特征、第二超边度矩阵特征、以及第二节点特征,确定与特征信息对应的第一图间传播特征;其中,所述第一图间传播特征表征用户与特征信息之间的特征表达;根据与特征信息对应的第一图内传播特征、以及与特征信息对应的第一图间传播特征,确定与特征信息对应的第一初始嵌入特征。17.根据权利要求15所述的方法,其特征在于,根据与特征信息对应的第二超图的特征、以及第一超图中的部分特征,生成与特征信息对应的第二初始嵌入特征,包括:根据与特征信息对应的第二超图的第二关联矩阵特征、第二节点度矩阵特征、第二超边度矩阵特征、以及第二节点特征,确定与特征信息对应的第二图内传播特征;其中,所述第二图内传播特征表征特征信息在用户上的特征表达;根据与特征信息对应的第一超图的第一关联矩阵特征、第一超边度矩阵特征、以及第一节点特征,确定与特征信息对应的第二图间传播特征;其中,所述第二图间传播特征表征用户与特征信息之间的特征表达;根据与特征信息对应的第二图内传播特征、以及与特征信息对应的第二图间传播特征,确定与特征信息对应的第二初始嵌入特征。18.根据权利要求13所述的方法,其特征在于,根据聚合特征,确定所述待训练的消费行为数据的意图特征,包括:基于多层感知方式对所述聚合特征进行处理,生成所述待训练的消费行为数据的意图特征。19.根据权利要求12-18中任一项所述的方法,其特征在于,所述待训练的消费行为数据具有实际的行为信息,所述实际的行为信息表征用户是否购买消费行为数据中的物品;根据所述意图特征对所述编码器进行更新,包括:根据所述待训练的消费行为数据对应的每一对子特征、以及所述待训练集合的待训练的消费行为数据的总个数,确定独立损失函数;根据所述待训练的消费行为数据对应的各子特征,确定所述待训练的消费行为数据的预测的行为信息,并根据所述待训练的消费行为数据的预测的行为信息和实际的行为信
息,确定bpr损失函数;根据所述bpr损失函数、所述独立损失函数以及预设的超参数,确定总体损失函数,并根据所述总体损失函数更新所述解码器。20.根据权利要求12所述的方法,其特征在于,所述待训练集合包括第一集合和第二集合;所述第一集合中待训练的消费行为数据具有实际的意图信息,所述第二集合中待训练的消费行为数据不具有实际的意图信息。21.根据权利要求12-18中任一项所述的方法,其特征在于,所述待训练集合包括第一集合和第二集合;所述第一集合中待训练的消费行为数据具有实际的意图信息,所述第二集合中待训练的消费行为数据不具有实际的意图信息;将所述意图特征输入到所述初始模型的解码器中进行训练,以更新所述解码器,得到意图识别模型,包括:对各所述待训练的消费行为数据的意图特征进行聚类处理,得到多个意图信息;根据所述初始模型的解码器,对所述第一集合中待训练的消费行为数据对应的意图特征进行解码处理,得到交叉熵损失函数;根据所述初始模型的解码器,对与所述第二集合中待训练的消费行为数据对应的意图特征进行解码处理,以将所述第二集合中待训练的消费行为数据分类到所得到的所述多个意图信息中,得到二分类交叉熵优化损失函数;根据所述交叉熵损失函数和所述二分类交叉熵优化损失函数,更新所述解码器,得到所述意图识别模型。22.根据权利要求21所述的方法,其特征在于,根据所述初始模型的解码器,对与所述第二集合中待训练的消费行为数据对应的意图特征进行解码处理,以将所述第二集合中待训练的消费行为数据分类到所得到的所述多个意图信息中,得到二分类交叉熵优化损失函数,包括:根据所述初始模型的解码器,对与所述第二集合中待训练的消费行为数据对应的意图特征进行解码处理,以将所述第二集合中待训练的消费行为数据分类到所得到的所述多个意图信息中;并且针对每一种子特征,针对所述第二集合中每一对待训练的消费行为数据的子特征进行相似度计算,得到所述第二集合中的每一对待训练的消费行为数据在每一子特征上的相似度信息;针对每一种子特征,确定所述第二集合中的每一对待训练的消费行为数据在每一子特征上的分数信息,所述分数信息表征一对待训练的消费行为数据在子特征维度上属于同一意图信息的分数;根据所述第二集合中的每一对待训练的消费行为数据在每一子特征上的相似度信息、所述第二集合中的每一对待训练的消费行为数据在每一子特征上的分数信息,确定所述二分类交叉熵优化损失函数。23.一种意图识别的识别装置,其特征在于,所述装置包括:获取单元,用于获取待识别集合;其中,所述待识别集合中包括多个待识别的消费行为数据,所述待识别的消费行为数据包括用户和多个特征信息,所述用户与每一所述特征信息之间具有二元关系;处理单元,用于根据所述待识别集合,生成多个对偶超图信息;其中,所述对偶超图信息包括与每一特征信息对应的第一超图和与每一特征信息对应的第二超图,所述第一超图
表征用户在特征信息上的关联关系,所述第二超图表征特征信息在用户上的关联关系;第一确定单元,用于将所述多个对偶超图信息输入到意图识别模型的编码器中,生成所述待识别的消费行为数据的意图特征;其中,所述意图特征表征待识别的消费行为数据在每一特征信息上的子特征;第二确定单元,用于将所述意图特征输入到所述意图识别模型的解码器中,得到所述待识别的消费行为数据的意图信息;应用单元,用于根据所述待识别的消费行为数据的意图信息,向用户推荐物品。24.一种应用于意图识别的模型训练装置,其特征在于,所述装置包括:获取单元,用于获取待训练集合;其中,所述待训练集合中包括多个待训练的消费行为数据,所述待训练的消费行为数据包括用户和多个特征信息,所述用户与每一所述特征信息之间具有二元关系;处理单元,用于根据所述待训练集合,生成多个对偶超图信息;其中,所述对偶超图信息包括与每一特征信息对应的第一超图和与每一特征信息对应的第二超图,所述第一超图表征用户在特征信息上的关联关系,所述第二超图表征特征信息在用户上的关联关系;第一更新单元,用于将所述多个对偶超图信息输入到初始模型的编码器中进行训练,生成所述待训练的消费行为数据的意图特征;其中,所述意图特征表征待训练的消费行为数据在每一特征信息上的子特征;并根据所述意图特征对所述编码器进行更新;第二更新单元,用于将所述意图特征输入到所述初始模型的解码器中进行训练,以更新所述解码器,得到意图识别模型;其中,所述意图识别模型用于对待识别的消费行为数据进行识别得到意图信息。25.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如权利要求1-11中任一项所述的方法,或者,以实现如权利要求12-22中任一项所述的方法。26.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-11任一项所述的方法,或者,所述计算机执行指令被处理器执行时用于实现如权利要求12-22任一项所述的方法。27.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-22中任一项所述的方法。

技术总结
本申请提供一种基于意图识别模型的意图识别方法、训练方法和设备。方法包括:获取待识别集合;待识别集合中包括多个待识别的消费行为数据;根据待识别集合,生成多个对偶超图信息,对偶超图信息包括与每一特征信息对应的第一超图和第二超图;将对偶超图信息输入到意图识别模型的编码器中,生成待识别的消费行为数据的意图特征;将意图特征输入到意图识别模型的解码器中,得到待识别的消费行为数据的意图信息。可以对消费行为数据进行充分建模,基于少量标注的意图信息发现消费行为数据中的未知意图信息,从而提升电商推荐的精度和可解释性,提升用户体验。提升用户体验。提升用户体验。


技术研发人员:李勇 李银峰 高宸 杜小毅 韦华周 罗恒亮 金德鹏
受保护的技术使用者:北京三快在线科技有限公司
技术研发日:2022.11.03
技术公布日:2023/3/28
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1