本发明涉及一种混合区块链下安全可靠的加密货币交易欺诈检测模型设计方法,属于区块链。
背景技术:
1、随着区块链技术的发展,加密货币受到越来越多的关注。与此同时,加密货币的交易欺诈活动变得更加猖獗和复杂,如钓鱼诈骗、庞氏骗局等。为了有效地检测伪造的加密货币交易,监管者必须收集用户之间的交易记录。然而,现有的隐私保护支付机制为了防御去匿名化攻击,也阻止了监管机构收集交易记录进行交易欺诈检测。但是用户会将自己的原始交易记录保存在本地,这使得我们可以通过使用联邦学习(federated learning,fl)来协同训练加密货币交易欺诈检测模型。
2、传统的联邦学习框架以集中式的方式聚合本地模型,会导致单点故障。由于区块链具有去中心化、不可篡改、可追溯等特性,一些研究将联邦学习与区块链融合以应对上述不足。在这种框架下,每个用户根据自己的数据训练本地模型,并将本地模型发送给区块链。在聚合接收到的模型后,区块链将向用户广播全局模型并进行奖励。同时,区块链将全局模型和本地模型存储到每个区块中,提供了追踪和惩罚攻击者的机会。然而,在构建具有隐私保护的加密货币交易欺诈检测模型时,存在两个挑战。
3、首先,区块链可以分为公有区块链和联盟区块链。一些研究提出了支持公有区块链的fl。然而,基于公有区块链的方法是开放和透明的。它们将为攻击者提供漏洞以模糊智能合约的监管或发起信息推理攻击。将本地模型保存在公有数据库中也会占用大量存储空间。为了保护隐私和减少达成共识的时间消耗,一些研究提出了基于区块链的联盟fl框架。然而,基于联盟区块链的方法是部分去中心化的,这可以授权特权节点恶意更改区块链的内容,从而潜在地损害其他节点的利益。因此,在支持区块链的fl框架下,如何在不牺牲去中心化的前提下减少存储消耗、保证安全性和可靠性是一个挑战。
4、其次,虽然fl可以在本地保持数据的同时构建欺诈检测模型,但上传的本地模型仍然存在隐私泄露漏洞。一些研究利用差分隐私(differential privacy,dp)来防御上述攻击。基于dp的方法通常需要在欺诈检测模型性能和隐私预算之间进行良好的权衡。良好的隐私保护性能会严重影响检测性能。现有的自适应差分隐私算法可以根据本地模型参数的取值范围添加不同程度的噪声。但是,其忽略了不同攻击的异质性风险和梯度相似性对隐私预算的影响,在保护隐私时牺牲了检测性能。因此,有必要考虑不同推理攻击的相似性和异构风险,设计更细粒度的dp方法。
技术实现思路
1、本发明的目的是:在支持区块链的联邦学习框架下,以不牺牲去中心化为前提,减少区块链的存储消耗,并保证交易检测过程的安全性和可靠性,从而构建具有隐私保护功能的安全可靠的加密货币交易欺诈检测模型。
2、为了达到上述目的,本发明的技术方案是公开了一种混合区块链下安全可靠的加密货币交易欺诈检测模型设计方法,其特征在于,包括以下步骤:
3、步骤1、构建基于联邦学习的轻型混合区块链加密货币交易欺诈检测模型,包括以下步骤:
4、步骤101、公有区块链参与者基于全局模型和本地数据训练其本地模型;
5、步骤102、部分公有区块链的普通用户被选为委员会成员,公有区块链参与者计算本地模型的哈希值,并发送给当前委员会与联盟区块链;
6、步骤103、联盟区块链参与者对本地模型进行验证和汇总,并计算参与者ci的可信度评分可信度评分高的参与者更值得信赖,通过聚合通过验证的本地模型获得全局模型;
7、步骤104、当联盟区块链参与者达成共识时,在联盟区块链中修补模型训练指纹;
8、步骤105、联盟区块链参与者从委员会成员中选择公有区块链的记账节点,并向其发送全局模型;
9、步骤106、在委员会成员达成共识后,记账节点将本地模型的哈希值和全局模型打补丁到公有区块链中;
10、步骤107、公有区块链参与者从公链中得到全局模型并开始下一轮次的本地模型训练;
11、步骤2、根据用户可信度评分,提出一种基于轻型混合区块链的共识机制,包括以下步骤:
12、步骤201、对于第k轮联邦学习,上一轮公有区块链的参与者自动成为共识委员会c={c1,c2,…,cn},其中n表示委员会成员的个数;
13、步骤202、本轮参与者基于全局模型和本地数据训练其本地模型;
14、步骤203、本轮参与者计算本地模型的哈希值,并将本地模型及其哈希值发送给联盟链;
15、步骤204、联盟链计算每个参与者的可信度分数
16、
17、其中,toa(cj)为参与者cj的本地模型时间偏移累积;
18、步骤205、联盟链在达成共识以后,记账节点根据哈希值和私钥,利用可验证随机函数生成哈希值β和vrf证明π,其中,根据委员会成员的可信度分数选择公有区块链的记账节点,评分较好的参与者成为记账节点的概率较高;
19、步骤206、联盟链将哈希值β、vrf证明π以及记账节点的选择发送给委员会成员;
20、步骤207、一旦记账节点的选择被委员会成员验证,记账节点就将区块打补丁到公有区块链中;
21、步骤3、基于梯度相似性与攻击异质性,设计了自适应隐私预算和灵敏度计算的差分隐私方法。
22、优选地,步骤1中,由公有区块链和联盟区块链组成混合区块链;在混合区块链中,公有区块链由一些普通节点组成,联盟区块链由一些权威机构组成。
23、优选地,对于轻型混合区块链而言,在基于联邦学习的混合区块链框架下设计了只保留本地模型哈希值的轻量级公有区块链,公有区块链与联联盟区块链区块结构的区别为公有区块链仅存储本地模型的哈希值,而联盟区块链不仅存储本地模型的哈希值,还存储本地模型的模型参数,其中:
24、公有区块链存储一些公开的或脱敏的数据,并运行一些没有隐私关注的智能合约,提供一些基本的可靠服务来监管联盟区块链;
25、联盟区块链存储私有数据,运行一些复杂的或基于安全的智能合约。
26、优选地,步骤1中,公有区块链中包含矿工和记账节点:记账节点接收并保存联盟链发送过来的本地模型的哈希值以及全局模型;矿工负责依据接收到的全局模型和本地数据训练模型并上传本地模型及其哈希值给联盟链;
27、联盟区块链包含普通客户端和记账节点:普通客户端接收本地模型及其哈希值,验证上传的本地模型参数,以及信誉分计算;记账节点:记录信誉值、奖励值、检测费用的账本应用,同时负责奖励的发放与欺诈检测费用的收取,并存储本地模型参数。
28、优选地,步骤205中,记账节点的选择取决于委员会成员的可信度分数,则每个参与者ci的可信度评分计算选择概率ps(ci):
29、
30、对于每个参与者ci,对应于[0,2l)中的一个子区间sii,有:
31、
32、其中,l表示哈希值β的位数,若β落在子区间sii,则对应的参与者ci将被选为公有区块链的记账节点。
33、优选地,步骤3中,通过自适应隐私预算的差分隐私方法来防御dlg和mia攻击,其中:
34、对于dlg攻击,根据模型梯度自适应地改变用户i在第t轮本地训练的隐私预算如下:
35、
36、其中,ε表示预定义的隐私预算,表示用户i在第t轮通信中对dlg攻击的隐私预算,表示用户i在第t轮中的模型梯度,||||2符号代表了求欧几里得范数;
37、对mia攻击的隐私预算可以自适应地改变如下:
38、
39、式中,var()为方差运算,表示用户i在第t轮通信中对mia攻击的隐私预算,表示基于元组xm的欺诈检测模型的预测;
40、自适应地改变第t轮中第i个参与者的隐私预算,以防御dlg和mia攻击,如下所示:
41、
42、其中,表示用户i在第t轮通信中的隐私预算。
43、优选地,步骤3中,基于自适应隐私预算分配和灵敏度计算方法,构建了基于混合区块链的联邦学习框架下的加密货币交易欺诈检测模型,包括以下步骤:
44、联盟区块链初始化全局交易欺诈检测模型;
45、参与者通过使用自适应隐私预算分配和自适应灵敏度计算协同训练全局欺诈检测模型,具体包括以下步骤:每个参与者根据全局交易欺诈检测模型获得本地模型梯度;每个参与者计算偏置和权重梯度的噪声尺度;在获得噪声尺度后,每个参与者算出具有自适应噪声的新梯度,每个参与者根据新的梯度使用梯度下降方法更新本地模型;每个参与者将其本地模型发送到联盟区块链后,使用基于混合区块链的联邦学习框架更新和修补全局模型;混合区块链将全局模型同步到其他参与者;当达到最大全局轮数时,训练过程将停止并输出最终的加密货币交易欺诈检测模型。
46、优选地,步骤3中,第k层的第i个输入和第j个输出之间的权重梯度的噪声尺度定义为则有:
47、
48、为第k层的第i个输入和第j个输出之间针对r-gap攻击的权重梯度的噪声尺度:
49、
50、式中,ε为隐私预算,为损失函数,表示第k层的第j个输出的偏置,||||1代表了求曼哈顿范数;
51、为第k层在第t轮的拉普拉斯机制的噪声尺度:
52、
53、式中,为第t轮对第k层的灵敏度表示示第k层在第t轮的梯度,表示用户i在第t轮通信中的隐私预算。
54、优选地,步骤3中,每个参与者采用下式算出具有自适应噪声的新梯度:
55、第k层的第i个输入和第j个输出之间的新权重梯度计算为:
56、
57、式中,lap()表示拉普拉斯机制。
58、第k层在第t轮的偏置的新梯度计算为:
59、本发明所公开的技术方案与现有技术方案相比具有以下效果:
60、混合区块链模型可以提高吞吐量并减少内存使用,还能够通过自适应的隐私分配和灵敏度计算很好地防御信息推理攻击,保证交易参与者的隐私不被泄露,同时降低了欺诈检测的性能损失。