技术特征:
1.一种互联网服务的用户设备鉴别方法,其特征在于,包括:获取历史用户设备的设备数据和设备互联网服务表现数据,筛选变量特征数据,确定正、负样本,以建立第一风险模型的第一训练数据集d1和测试数据集d3;对所述第一风险模型进行验证训练,以建立第二训练数据集d2;使用梯度调和机制方法,并使用所述第二训练数据集d2对第二风险模型进行训练;使用训练好的所述第二风险模型,对申请所述互联网服务的新用户设备进行鉴别处理。2.根据权利要求1所述的互联网服务的用户设备鉴别方法,其特征在于,所述使用梯度均衡机制方法,并使用所述第二训练数据集d2对第二风险模型进行训练包括:根据所述第二训练数据集d2,拟合所述第二训练数据集d2的样本分布图形,以计算梯度密度调和参数β
i
。3.根据权利要求2所述的互联网服务的用户设备鉴别方法,其特征在于,所述使用梯度均衡机制方法,并使用所述第二训练数据集d2对第二风险模型进行训练包括:根据梯度密度调和参数β
i
,使用如下表达式计算每个训练样本的损失梯度,即为预测值和真值的差距:其中,n是指第二训练数据集的训练样本的总量;p
i
∈[0,1]是使用所述第二风险模型计算的预测概率;是指用于确定用户设备是否是风险设备的类标签;是指各训练样本的交叉熵损失;gd(g)是指第二训练数据集的训练样本的梯度密度,其物理含义为单位梯度模长g部分的样本个数;δ
ε
(g
k
,g)是指训练样本中梯度模长分布在范围内的样本个数;l
ε
(g)是指区间的梯度模长。4.根据权利要求3所述的用户设备鉴别方法,其特征在于,包括:当所述第二训练数据集中训练样本的损失梯度大于设定值的训练样本占比在所述第二训练数据集的样本总量的指定比率以上时,结束对所述第二风险模型的训练。5.根据权利要求1或2所述的用户设备鉴别方法,其特征在于,所述对所述第一风险模型进行验证训练包括:使用k折交叉验证算法,将所述第一训练数据集d1拆分为训练集d
11
和验证集d
12
,其中,k为5~10;使用训练集d
11
和验证集d
12
,对所述第一风险模型进行验证训练。6.根据权利要求5所述的用户设备鉴别方法,其特征在于,对每次交叉验证中的验证集d
12
的预测值进行拼接处理,得到用户设备相关的区别度特征和风险特征,以作为所述第二风险模型的输入特征;使用如下至少两个特征量化生成的标签值表征所述第二风险模型的标签值:设备的app欺诈数据、设备的逾期数据、设备的多头特征数据和设备关联用户的关系网
特征数据。7.根据权利要求1所述的用户设备鉴别方法,其特征在于,所述使用训练好的所述第二风险模型,对申请所述互联网服务的新用户设备进行鉴别处理包括:当接收到所述新用户设备向互联网服务平台的资源服务请求时,获取所述新用户设备的设备数据,将所述设备数据输入所述第二风险模型,输出所述新用户设备的预测值;根据所所计算的预测值,判断所述新用户设备是否为风险设备。8.一种互联网服务的用户设备鉴别装置,其特征在于,包括:筛选处理模块,用于获取历史用户设备的设备数据和设备互联网服务表现数据,筛选变量特征数据,确定正、负样本,以建立第一风险模型的第一训练数据集d1和测试数据集d3;第一训练模块,用于对所述第一风险模型进行验证训练,以建立第二训练数据集d2;第二训练模块,用于使用梯度调和机制方法,并使用所述第二训练数据集d2对第二风险模型进行训练;鉴别处理模块,用于使用训练好的所述第二风险模型,对申请所述互联网服务的新用户设备进行鉴别处理。9.根据权利要求8所述的互联网服务的用户设备鉴别装置,其特征在于,还包括计算处理模块,所述计算处理模块用于根据所述第二训练数据集d2,拟合所述第二训练数据集d2的样本分布图形,以计算梯度密度调和参数β
i
。10.一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机可执行程序,当所述计算机程序被所述处理器执行时,所述处理器执行如权利要求1
‑
7中任一项所述的互联网服务的用户设备鉴别方法。
技术总结
本发明提供了一种互联网服务的用户设备鉴别方法、装置和计算机设备。该方法包括:获取历史用户设备的设备数据和设备互联网服务表现数据,筛选变量特征数据,确定正、负样本,以建立第一风险模型的第一训练数据集D1和测试数据集D3;对所述第一风险模型进行验证训练,以建立第二训练数据集D2;使用梯度调和机制方法,并使用所述第二训练数据集D2对第二风险模型进行训练;使用训练好的所述第二风险模型,对申请所述互联网服务的新用户设备进行鉴别处理。本发明能够提高模型对正负样本的区分能力,提高模型预测精度,且无需调整模型超参数;能够有效拒绝风险设备,能够有效减少互联网服务平台的损失。务平台的损失。务平台的损失。
技术研发人员:沈赟 杨雪君 朱维娜
受保护的技术使用者:上海淇玥信息技术有限公司
技术研发日:2021.07.29
技术公布日:2021/11/4