一种风险对象预测方法、装置、电子设备及存储介质与流程

文档序号:37909553发布日期:2024-05-10 23:49阅读:19来源:国知局
一种风险对象预测方法、装置、电子设备及存储介质与流程

本技术涉及通信,尤其涉及一种风险对象预测方法、装置、电子设备及存储介质。


背景技术:

1、走逃企业是指不履行税收义务并脱离税务机关监管的企业,少数违法分子会在开具增值税专用发票后走逃,使得国家税款严重流失,税收经济秩序遭到破坏,同时也侵害了守法经营纳税人的合法权益。相关技术中,通过训练普通的机器学习模型来预测有走逃风险的企业,然而,在训练模型时,为提高模型的预测准确性,需要综合来自不同机构的企业的税务相关数据作为训练样本进行训练,然而需要训练模型的机构可能无法获取到来自其他机构的数据,如果能够获取到其他机构的数据将会造成其他机构隐私数据的泄露。

2、因此,如何在提高有走逃风险的企业预测的准确性的同时,确保数据的安全,是亟待解决的技术问题之一。


技术实现思路

1、本技术实施例提供了一种风险对象预测方法、装置、电子设备及存储介质,在提高了具有走逃风险的企业预测的准确性的同时,保障了数据的安全。

2、第一方面,本技术实施例提供了一种风险对象预测方法,包括:

3、获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果;其中,所述第一风险预测模型和所述第二风险预测模型是基于所述第一参与方的第一训练样本和所述第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的;

4、汇总所述第一预测结果和所述第二预测结果,得到针对所述待检测目标对象的目标预测结果。

5、在一种实施方式中,所述第一风险预测模型和所述第二风险预测模型是通过以下方式训练获得的:

6、获取所述第一参与方根据第一训练样本训练第一风险预测模型生成并加密的第一中间结果,以及所述第二参与方根据第二训练样本训练第二风险预测模型生成并加密的第二中间结果;

7、将所述加密的第二中间结果发送至所述第一参与方,以使所述第一参与方根据所述加密的第二中间结果计算第一加密梯度值;

8、将所述加密的第一中间结果发送至所述第二参与方,以使所述第二参与方根据所述加密的第一中间结果计算第二加密梯度值;

9、获取所述第一加密梯度值和所述第二加密梯度值,根据解密后的第一梯度值和解密后的第二梯度值生成目标梯度值,并将所述目标梯度值发送至所述第一参与方和所述第二参与方,以使所述第一参与方基于所述目标梯度值更新所述第一风险预测模型的参数,得到训练后的第一风险预测模型,以及所述第二参与方基于所述目标梯度值更新所述第二风险预测模型的参数,得到训练后的第二风险预测模型。

10、在一种实施方式中,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。

11、在一种实施方式中,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。

12、在一种实施方式中,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。

13、第二方面,本技术实施例提供了一种风险对象预测装置,包括:

14、获取单元,用于获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果;其中,所述第一风险预测模型和所述第二风险预测模型是基于所述第一参与方的第一训练样本和所述第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的;

15、预测单元,用于汇总所述第一预测结果和所述第二预测结果,得到针对所述待检测目标对象的目标预测结果。

16、在一种实施方式中,所述装置,还包括:

17、训练单元,用于通过以下方式训练所述第一风险预测模型和所述第二风险预测模型:获取所述第一参与方根据第一训练样本训练第一风险预测模型生成并加密的第一中间结果,以及所述第二参与方根据第二训练样本训练第二风险预测模型生成并加密的第二中间结果;将所述加密的第二中间结果发送至所述第一参与方,以使所述第一参与方根据所述加密的第二中间结果计算第一加密梯度值;将所述加密的第一中间结果发送至所述第二参与方,以使所述第二参与方根据所述加密的第一中间结果计算第二加密梯度值;获取所述第一加密梯度值和所述第二加密梯度值,根据解密后的第一梯度值和解密后的第二梯度值生成目标梯度值,并将所述目标梯度值发送至所述第一参与方和所述第二参与方,以使所述第一参与方基于所述目标梯度值更新所述第一风险预测模型的参数,得到训练后的第一风险预测模型,以及所述第二参与方基于所述目标梯度值更新所述第二风险预测模型的参数,得到训练后的第二风险预测模型。

18、在一种实施方式中,所述第一训练样本和所述第二训练样本为对二者进行对齐后的训练样本。

19、在一种实施方式中,所述第一训练样本包括所述第一参与方的第一样本对象的第一样本特征数据和样本标签;所述第二训练样本包括所述第二参与方的第二样本对象的第二样本特征数据。

20、在一种实施方式中,所述待检测目标对象为待检测目标纳税人标识对应的企业;所述第一样本特征数据至少包括:纳税人标识对应的企业的行业代码、登记注册类型代码和登记日期;所述第二样本特征数据至少包括:纳税人标识对应的发票中的交易特征,所述样本标签表征所述纳税人标识对应的企业是否为风险企业。

21、第三方面,本技术实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本技术所述的风险对象预测方法。

22、第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本技术所述的风险对象预测方法中的步骤。

23、本技术的有益效果如下:

24、本技术实施例提供的风险对象预测方法、装置、电子设备及存储介质,可信服务器获取第一参与方基于待检测目标对象的第一特征数据和第一风险预测模型获得的第一预测结果,以及获取第二参与方基于所述待检测目标对象的第二特征数据和第二风险预测模型获得的第二预测结果,其中,第一风险预测模型和第二风险预测模型是基于第一参与方的第一训练样本和第二参与方的第二训练样本采用纵向联邦学习方式进行训练获得的,汇总第一中间结果和第二中间结果,得到针对待检测目标对象的目标预测结果,本技术实施例中,各参与方采用纵向联邦学习方式训练各自的风险预测模型,分别采用各自训练的风险预测模型预测待检测目标对象是否为风险对象,可信服务器汇总各参与方的预测结果,得到针对待检测目标对象最终的目标预测结果,由于各参与方采用纵向联邦学习方式训练各自的模型,模型参数调整时通过可信服务器进行交互,不会产生数据泄露,相对于单一模型训练的方式,提高了风险对象预测的准确性,并保障了各参与方的数据安全。

25、本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1