本说明书一个或多个实施例涉及机器学习,尤其涉及一种训练行为意图识别模型的方法、行为意图识别方法及装置。
背景技术:
1、随着互联网技术的迅猛发展,人们越来越多地利用互联网进行通信、学习、工作,甚至通过互联网进行交易、支付、转账、投资等行为。这些行为可能存在一定的风险,对网络行为的安全性带来了威胁,因此对于行为意图的识别就非常重要。对行为意图进行识别能够为后续风险识别提供参考依据和分析基础。
2、传统的行为意图识别模型采用的是一种多分类模型,将行为特征映射到具体的意图类别上。然而在很多场景中,常常会涉及到诸如二层级类别、三层级类别等多层级类别的分类任务。假设最下层类别为个,行为意图识别模型采用的是一个多分类模型将用户行为特征映射至个行为意图类别上,采用诸如softmax函数作为输出层的激活函数。目前在模型训练过程中使用交叉熵损失函数以最小化行为意图识别模型输出的意图类别与对应标签之间的差异。但这种方式得到的行为意图识别模型的识别准确度有待提高。
技术实现思路
1、有鉴于此,本说明书一个或多个实施例公开了一种训练行为意图识别模型的方法、行为意图识别方法及装置,以便于提高行为意图识别的准确度。
2、根据第一方面,本技术提供了一种训练行为意图识别模型的方法,所述方法包括:
3、获取包括多个训练样本的训练数据,所述训练样本包括行为样本以及所述行为样本被标注的类别标签,所述类别标签为多层级行为意图类别中的最下层类别的标签;
4、利用所述训练数据训练多分类模型和附加模型;其中,将所述行为样本输入所述多分类模型,由所述多分类模型输出所述行为样本在所述多层级行为意图类别中各最下层类别上的第一概率;所述附加模型利用所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述多层级行为意图类别中第n层类别上的分配权重,所述第n层类别为非最下层类别,所述n为预设的正整数,利用所述行为样本在所述第n层类别上的分配权重以及所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述各最下层类别上的第二概率;所述训练的目标包括:最小化依据所述第二概率得到的所述行为样本所属的最下层类别与所述行为样本内标注的类别标签之间的差异;
5、训练结束后,利用所述多分类模型得到行为意图识别模型。
6、根据本技术实施例中一可实现的方式,利用所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述多层级行为意图类别中第n层类别上的分配权重包括:
7、分别对各第n层类别下所述行为样本在最下层类别上的第一概率进行池化处理,得到各第n层类别对应的池化结果;
8、利用各第n层类别对应的池化结果进行映射处理,得到所述行为样本在各第n层类别上的分配权重。
9、根据本技术实施例中一可实现的方式,所述利用各第n层类别对应的池化结果进行映射处理,得到所述行为样本在各第n层类别上的分配权重包括:
10、将所述各第n层类别对应的池化结果进行拼接,将拼接得到的结果进行softmax处理得到所述行为样本在各第n层类别上的分配权重。
11、根据本技术实施例中一可实现的方式,利用所述行为样本在所述第n层类别上的分配权重以及所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述各最下层类别上的第二概率包括:
12、将所述行为样本在最下层类别上的第一概率乘以所述行为样本在该最下层类别所属第n层类别上的分配权重,得到所述行为样本在该最下层类别上的第二概率。
13、根据本技术实施例中一可实现的方式,所述训练还包括:
14、在每一轮迭代中利用交叉熵损失函数的取值,更新所述多分类模型和附加模型的模型参数,直至满足预设的训练结束条件,所述交叉熵损失函数是利用所述训练的目标构造的。
15、根据本技术实施例中一可实现的方式,所述行为样本为用户的交易行为数据;
16、所述多层级行为意图类别为二层级行为意图类别,其中第一层类别包括经营意图和个人意图;所述经营意图下对应的第二层类别包括多种行业对应的经营意图,所述个人意图下对应的第二层类别包括多种关系之间的交易意图。
17、第二方面,提供了一种行为意图识别方法,所述方法包括:
18、获取用户行为数据;
19、将所述用户行为数据输入行为意图识别模型,依据所述行为意图识别模型得到的所述用户行为数据在多层级行为意图类别中各最下层类别上的第一概率,确定所述用户行为数据所属的行为意图类别;
20、其中所述行为意图识别模型是采用如上第一方面中任一项所述的方法预先训练得到的。
21、第三方面,提供了一种训练行为意图识别模型的装置,所述装置包括:
22、样本获取单元,被配置为获取包括多个训练样本的训练数据,所述训练样本包括行为样本以及所述行为样本被标注的类别标签,所述类别标签为多层级行为意图类别中的最下层类别的标签;
23、模型训练单元,被配置为利用所述训练数据训练多分类模型和附加模型;其中,将所述行为样本输入所述多分类模型,由所述多分类模型输出所述行为样本在所述多层级行为意图类别中各最下层类别上的第一概率;所述附加模型利用所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述多层级行为意图类别中第n层类别上的分配权重,所述第n层类别为非最下层类别,所述n为预设的正整数,利用所述行为样本在所述第n层类别上的分配权重以及所述行为样本在所述各最下层类别上的第一概率,确定所述行为样本在所述各最下层类别上的第二概率;所述训练的目标包括:最小化依据所述第二概率得到的所述行为样本所属的最下层类别与所述行为样本内标注的类别标签之间的差异;
24、模型获取单元,被配置为训练结束后,利用所述多分类模型得到行为意图识别模型。
25、第四方面,提供了一种行为意图识别装置,所述装置包括:
26、行为获取单元,被配置为获取用户行为数据;
27、意图识别单元,被配置为将所述用户行为数据输入行为意图识别模型,依据所述行为意图识别模型得到的所述用户行为数据在多层级行为意图类别中各最下层类别上的第一概率,确定所述用户行为数据所属的行为意图类别;
28、其中所述行为意图识别模型是采用如上第三方面所述的装置预先训练得到的。
29、根据第五方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行如上所述的方法。
30、根据第六方面,本技术提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现如上所述的方法。
31、由以上技术方案可以看出,本技术可以具备以下优点:
32、本技术在训练行为意图识别模型的过程中,利用了最下层类别所属的上层类别(即第n层类别)的信息,确定行为样本在各上层类别上的分配权重,并利用分配权重和多分类模型输出的第一概率生成行为样本在各最下层类别上的第二概率,利用该第二概率进行模型训练,实现了上层类别对模型训练方向的指导,从而提升了意图识别模型的识别准确率。