本技术涉及计算机风控,具体而言,涉及一种应用于机器学习的欺诈行为识别方法及系统。
背景技术:
1、互联网金融就是互联网技术和金融功能的有机结合,依托大数据和云计算在开放的互联网平台上形成的功能化金融业态及其服务体系,包括基于网络平台的金融市场体系、金融服务体系、金融组织体系、金融产品体系以及互联网金融监管体系等,并具有普惠金融、平台金融、信息金融和碎片金融等相异于传统金融的金融模式。反欺诈是对包含交易诈骗,网络诈骗,电话诈骗,盗卡盗号等欺诈行为进行识别的一项服务。在线反欺诈是互联网金融必不可少的一部分,相关技术中,如何提高对任意用户会话活动数据进行欺诈行为识别的准确性,进而提高后续反欺诈处理的可靠性,是亟待解决的技术问题。
技术实现思路
1、有鉴于此,本技术的目的在于提供一种应用于机器学习的欺诈行为识别方法及系统。
2、依据本技术的第一方面,提供一种应用于机器学习的欺诈行为识别方法,应用于云服务器,所述方法包括:
3、从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据,所述第一模板用户会话活动数据序列包括多个欺诈标签的欺诈行为对应的模板用户会话活动数据,每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段,所述多个待学习用户会话活动数据分别属于多个欺诈标签的欺诈行为对应的模板用户会话活动数据;
4、基于第一欺诈行为识别网络提取所述多个待学习用户会话活动数据中每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量;
5、基于所述第一欺诈行为识别网络提取每个所述待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段;
6、基于每个所述待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、所述待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段,生成欺诈学习误差值;
7、基于所述欺诈学习误差值更新所述第一欺诈行为识别网络的网络权重信息,直至满足网络收敛要求时得到第二欺诈行为识别网络,并基于所述第二欺诈行为识别网络对任意输入的用户会话活动数据进行欺诈行为识别,以基于欺诈行为识别结果进行对应的反欺诈处理。
8、在第一方面的一种可能的实施方式中,基于每个所述待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量以及第一用户会话知识节点的模板欺诈字段、所述待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量以及每个第二用户会话知识节点对应的欺诈估计字段,生成欺诈学习误差值,包括:
9、基于所述待学习用户会话活动数据中的第一用户会话知识节点,从该待学习用户会话活动数据对应的多个第二用户会话知识节点中选取目标用户会话知识节点;
10、基于每个所述待学习用户会话活动数据对应的第一欺诈判别向量、每个所述待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个所述待学习用户会话活动数据所属的欺诈标签得到第一误差度量值;
11、基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及每个所述待学习用户会话活动数据对应的各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值;
12、将所述第一误差度量值与所述第二误差度量值进行相加获得欺诈学习误差值。
13、在第一方面的一种可能的实施方式中,所述基于每个所述待学习用户会话活动数据对应的第一欺诈判别向量、每个所述待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量以及每个所述待学习用户会话活动数据所属的欺诈标签得到第一误差度量值,包括:
14、对所述待学习用户会话活动数据对应的第一欺诈判别向量、该待学习用户会话活动数据的目标用户会话知识节点的第二欺诈判别向量进行融合生成所述待学习用户会话活动数据的第三欺诈判别向量;
15、将属于同一欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第一特征代价值,所述第一特征代价值用于表征类内特征特征偏离值;
16、将属于不同欺诈标签的待学习用户会话活动数据的第三欺诈判别向量进行特征代价计算得到第二特征代价值,所述第二特征代价值用于表征类间特征特征偏离值;
17、基于所述第一特征代价值与所述第二特征代价值之间的商得到第一误差度量值。
18、在第一方面的一种可能的实施方式中,所述基于每个所述待学习用户会话活动数据中的第一用户会话知识节点从该待学习用户会话活动数据对应多个第二用户会话知识节点中选取目标用户会话知识节点,包括:
19、将所述待学习用户会话活动数据中的第一用户会话知识节点与该待学习用户会话活动数据对应的各第二用户会话知识节点进行会话依赖值计算,生成该待学习用户会话活动数据对应的各第二用户会话知识节点的会话依赖值,其中,所述会话依赖值用于表征所述第一用户会话知识节点与所述第二用户会话知识节点存在相同会话意图的置信度值;
20、获取会话依赖值大于设定依赖值的第二用户会话知识节点,作为所述待学习用户会话活动数据的目标用户会话知识节点。
21、在第一方面的一种可能的实施方式中,所述基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和该第一用户会话知识节点对应的模板欺诈字段、以及各第二用户会话知识节点和各第二用户会话知识节点对应的欺诈估计字段得到第二误差度量值,包括:
22、基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话知识节点,生成该待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值;
23、基于每个所述待学习用户会话活动数据对应的第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数;
24、基于所述待学习用户会话活动数据中第一用户会话知识节点对应的模板欺诈字段和各第二用户会话知识节点对应的欺诈估计字段,生成所述待学习用户会话活动数据的欺诈估计置信度;
25、基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度,生成第二误差度量值。
26、在第一方面的一种可能的实施方式中,基于每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话知识节点,生成该待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值,包括:
27、将每个所述待学习用户会话活动数据对应的第一用户会话知识节点和各第二用户会话活动数据进行共享特征数量计算,生成每个待学习用户会话活动数据中各第二用户会话活动数据对应的共享特征值,每个所述第二用户会话活动数据对应的共享特征值为该第二用户会话知识节点对应的网络学习价值;
28、所述基于每个所述待学习用户会话活动数据对应第二用户会话知识节点的第一数量和目标用户会话知识节点的第二数量得到该待学习用户会话活动数据的训练价值参数,包括:
29、获取所述待学习用户会话活动数据对应的第二用户会话知识节点的第一数量与目标用户会话知识节点的第二数量之间的差值;
30、基于所述待学习用户会话活动数据对应的差值与和该待学习用户会话活动数据对应的目标用户会话分支数据的第三数量之间的商,生成待学习用户会话活动数据的训练价值参数;
31、所述基于所述待学习用户会话活动数据中第一用户会话知识节点对应的模板欺诈字段和各第二用户会话知识节点对应的欺诈估计字段,生成所述待学习用户会话活动数据的欺诈估计置信度,包括:
32、获取所述待学习用户会话活动数据中各第二用户会话知识节点对应的欺诈估计字段中与第一用户会话知识节点对应的模板欺诈字段相同的欺诈估计字段的第四数量;
33、将该第四数量与待学习用户会话活动数据对应的第二用户会话知识节点的第一数量相除获得的商,确定为所述待学习用户会话活动数据的欺诈估计置信度;
34、所述基于每个待学习用户会话活动数据中各第二用户会话知识节点对应的网络学习价值、该待学习用户会话活动数据的训练价值参数和欺诈估计置信度,生成第二误差度量值,包括:
35、对所述待学习用户会话活动数据中各第二用户会话活动数据对应的网络学习价值进行融合生成所述待学习用户会话活动数据的网络学习价值;
36、对所述待学习用户会话活动数据的欺诈估计置信度计算信息散度,将计算的信息散度与该待学习用户会话活动数据的网络学习价值和训练价值参数进行加权融合得到该待学习用户会话活动数据对应的误差度量值;
37、对每个所述待学习用户会话活动数据的误差度量值进行相加,生成第二误差度量值。
38、在第一方面的一种可能的实施方式中,所述第一欺诈行为识别网络的训练步骤,包括:
39、获取第二模板用户会话活动数据序列,所述第二模板用户会话活动数据序列中包括多个欺诈标签的欺诈行为对应的模板用户会话活动数据,每个模板用户会话活动数据分别携带包括欺诈行为定位数据的第一用户会话知识节点及该第一用户会话知识节点对应的模板欺诈字段;
40、将第二模板用户会话活动数据序列中的各模板用户会话活动数据加载到长短期记忆网络模型中,依据各模板用户会话活动数据对长短期记忆网络模型进行迭代权重信息更新,生成第一欺诈行为识别网络。
41、依据本技术的第二方面,提供一种云服务器,所述云服务器包括机器可读存储介质及处理器,所述机器可读存储介质存储有机器可执行指令,所述处理器在执行所述机器可执行指令时,该云服务器实现前述的应用于机器学习的欺诈行为识别方法。
42、依据本技术的第三方面,提供提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,当所述计算机可执行指令被执行时,实现前述的应用于机器学习的欺诈行为识别方法。
43、依据上述任一方面,本技术的有效效果为:
44、通过从第一模板用户会话活动数据序列中获取多个待学习用户会话活动数据,基于第一欺诈行为识别网络提取每个待学习用户会话活动数据的第一用户会话知识节点的第一欺诈判别向量,以及提取每个待学习用户会话活动数据在多个衍生特征维度下对应有欺诈行为的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段,基于每个待学习用户会话活动数据中的第一用户会话知识节点、第一用户会话知识节点的第一欺诈判别向量和模板欺诈字段、待学习用户会话活动数据中的第二用户会话知识节点、每个第二用户会话知识节点对应的第二欺诈判别向量和欺诈估计字段,生成欺诈学习误差值,基于欺诈学习误差值更新第一欺诈行为识别网络的网络权重信息,直至满足网络收敛要求时得到第二欺诈行为识别网络。由此可以获得欺诈行为识别性能更强的第二欺诈行为识别网络,提高对任意用户会话活动数据进行欺诈行为识别的准确性,进而提高后续反欺诈处理的可靠性。