本技术涉及信息处理,尤其涉及区块链交易异常检测模型的训练方法、检测方法及装置。
背景技术:
1、区块链技术的快速发展促使信息互联网向价值互联网转型,其应用场景广泛,但也衍生出许多风险或违法违规行为。其中异常交易检测对区块链产业的健康发展起到了积极的推动作用。异常交易检测的常规方案是设计基于固定阈值规则的警报系统来检测和标记可疑交易,然后对可疑行为进行人工决策或判断。但是互联网金融的出现导致基于规则的监管方案面临巨大挑战。打破传统的监管思维,构建以数据为基础、以人工智能和大数据分析等技术为手段的智能化监管方案已成趋势。
2、目前,智能化监管中异常交易检测的研究工作主要集中在有监督学习和无监督学习。有监督学习通过使用标注数据来学习区分的二分类(如合法与非法交易)或多分类机器学习检测模型,从而预测未知数据样本(测试集)的分类。无监督学习则探索未标注数据的结构及特征,找出簇或类的最优划分,将远离其他样本点的孤点视为离群点,即异常数据。
3、然而,无论是上述哪一种,均因训练模型时采用的区块链数据集中常存在的数据不均衡、缺乏数据特征的先验信息等问题,而无法选择合适的模型和参数,进而会影响区块链交易异常检测的准确性和有效性。
技术实现思路
1、鉴于此,本技术实施例提供了区块链交易异常检测模型的训练方法、检测方法及装置,以消除或改善现有技术中存在的一个或更多个缺陷。
2、本技术的一个方面提供了一种区块链交易异常检测模型的训练方法,包括:
3、采用预先训练得到的对抗生成网络生成合成区块链交易数据,并将所述合成区块链交易数据和预获取的真实区块链交易数据分别作为扩展训练集中的各个样本数据,其中,每个所述样本数据均设有用于表示是否为异常交易的标签;
4、基于所述扩展训练集训练自动编码器,以将该自动编码器训练成用于提取所述样本数据的特征数据的编码模型;
5、将所述编码模型作为一卷积神经网络的特征提取器,并基于所述扩展训练集训练该卷积神经网络,以得到用于生成区块链交易数据对应的交易异常检测结果的区块链交易异常检测模型。
6、在本技术的一些实施例中,在所述采用预先训练得到的对抗生成网络生成合成区块链交易数据之前,还包括:
7、获取多个真实区块链交易数据以构成对应的真实数据集;
8、基于所述真实数据集训练预设的对抗生成网络,以使该对抗生成网络中的生成器生成多个合成样本数据以构成先验分布数据集,再基于所述对抗生成网络中的判别器对所述真实数据集和所述先验分布数据集进行判定,进而使得所述对抗生成网络用于根据真实区块链交易数据生成对应的合成区块链交易数据。
9、在本技术的一些实施例中,所述对抗生成网络包括:wgan;
10、相对应的,所述基于所述真实数据集训练预设的对抗生成网络,包括:
11、更新wgan中判别器对应的判别器参数和生成器对应的生成器参数,若当前的所述生成器未收敛,则基于所述真实数据集,针对所述wgan在当前迭代轮次执行预设的梯度训练步骤;
12、其中,所述梯度训练步 骤包括:
13、在所述真实数据集中取样以得到对应的真实样本数据,以及在所述先验分布数据集中取样以得到对应的合成样本数据;
14、基于所述真实样本数据和所述合成样本数据获取所述判别器的当前梯度,并采用rmsprop算法,根据所述判别器的当前梯度预设的学习率和梯度裁剪参数对所述判别器当前的判别器参数进行优化,得到所述判别器对应的更新后判别器参数;
15、基于所述合成样本数据获取所述生成器的当前梯度;并采用rmsprop算法,根据所述生成器的当前梯度和所述学习率对所述生成器当前的生成器参数进行优化,得到所述生成器对应的更新后生成器参数。
16、在本技术的一些实施例中,所述采用预先训练得到的对抗生成网络生成合成区块链交易数据,包括:
17、基于wgan中的所述生成器生成多个合成区块链交易数据;
18、其中,所述合成区块链交易数据包括:区块链中交易的本地信息,该本地信息包括:时间步长、输入数量、输出数量、交易费用、输出量和汇总数字。
19、在本技术的一些实施例中,所述基于所述扩展训练集训练自动编码器,以将该自动编码器训练成用于提取所述样本数据的特征数据的编码模型,包括:
20、基于所述扩展训练集,采用最小化负对数似然的损失函数训练所述自动编码器中的编码器和解码器,以得到用于提取所述样本数据的特征数据并进行降维的编码模型。
21、在本技术的一些实施例中,所述卷积神经网络包括:一维cnn;
22、相对应的,所述将所述编码模型作为一卷积神经网络的特征提取器,并基于所述扩展训练集训练该卷积神经网络,以得到用于生成区块链交易数据对应的交易异常结果的区块链交易异常检测模型,包括:
23、将所述扩展训练集中的各个样本数据输入所述特征提取器,以使该特征提取器分别输出各个所述样本数据各自对应的特征数据,并基于各个所述特征数据训练所述一维cnn,以将包含有所述特征提取器的该一维cnn训练成用于生成区块链交易数据对应的交易异常结果的区块链交易异常检测模型;
24、其中,所述一维cnn包括依次连接的输入层、一维卷积层、池化层、拉平层、全连接层和输出层。
25、本技术的另一个方面提供了一种区块链交易异常检测方法,包括:
26、接收区块链的目标区块链交易数据;
27、将所述目标区块链交易数据输入区块链交易异常检测模型,以使该区块链交易异常检测模型输出所述目标区块链交易数据对应的交易异常结果检测数据,其中,所述区块链交易异常检测模型预先基于所述的区块链交易异常检测模型的训练方法训练得到。
28、本技术的第三个方面提供了一种区块链交易异常检测模型的训练装置,包括:
29、合成数据生成模块,用于采用预先训练得到的对抗生成网络生成合成区块链交易数据,并将所述合成区块链交易数据和预获取的真实区块链交易数据分别作为扩展训练集中的各个样本数据,其中,每个所述样本数据均设有用于表示是否为异常交易的标签;
30、编码模型训练模块,用于基于所述扩展训练集训练自动编码器,以将该自动编码器训练成用于提取所述样本数据的特征数据的编码模型;
31、检测模型训练模块,用于将所述编码模型作为一卷积神经网络的特征提取器,并基于所述扩展训练集训练该卷积神经网络,以得到用于生成区块链交易数据对应的交易异常检测结果的区块链交易异常检测模型。
32、本技术的第四个方面提供了一种区块链交易异常检测装置,包括:
33、数据接收模块,用于接收区块链的目标区块链交易数据;
34、异常检测模块,用于将所述目标区块链交易数据输入区块链交易异常检测模型,以使该区块链交易异常检测模型输出所述目标区块链交易数据对应的交易异常结果检测数据,其中,所述区块链交易异常检测模型预先基于所述的区块链交易异常检测模型的训练方法训练得到。
35、本技术的第五个方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述区块链交易异常检测模型的训练方法,和/或,实现所述区块链交易异常检测方法。
36、本技术的第六个方面提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述区块链交易异常检测模型的训练方法,和/或,实现所述区块链交易异常检测方法。
37、本技术提供的区块链交易异常检测模型的训练方法,采用预先训练得到的对抗生成网络生成合成区块链交易数据,并将所述合成区块链交易数据和预获取的真实区块链交易数据分别作为扩展训练集中的各个样本数据,其中,每个所述样本数据均设有用于表示是否为异常交易的标签;基于所述扩展训练集训练自动编码器,以将该自动编码器训练成用于提取所述样本数据的特征数据的编码模型;将所述编码模型作为一卷积神经网络的特征提取器,并基于所述扩展训练集训练该卷积神经网络,以得到用于生成区块链交易数据对应的交易异常检测结果的区块链交易异常检测模型,能够有效弱化区块链数据集中常存在的数据不均衡、缺乏数据特征的先验信息等问题带来的影响,能够有效提高训练得到的区块链交易异常检测模型的异常检测性能,进而能够有效提高区块链交易异常检测的准确性和有效性。
38、本技术的附加优点、目的,以及特征将在下面的描述中将部分地加以阐述,且将对于本领域普通技术人员在研究下文后部分地变得明显,或者可以根据本技术的实践而获知。本技术的目的和其它优点可以通过在说明书以及附图中具体指出的结构实现到并获得。
39、本领域技术人员将会理解的是,能够用本技术实现的目的和优点不限于以上具体所述,并且根据以下详细说明将更清楚地理解本技术能够实现的上述和其他目的。