本申请涉及数据交易,尤其涉及一种数据交易中的异常交易识别方法、设备及介质。
背景技术:
1、随着大数据技术的不断成熟和广泛应用,数据已成为当今社会的关键生产要素,驱动着各行各业的创新与发展。在此背景下,数据交易市场应运而生,并迅速呈现出蓬勃发展的态势。数据交易市场为数据提供方和数据需求方搭建了一个高效的交易平台,促进了数据的流通与价值转化。
2、然而,数据交易市场的快速发展也伴随着一系列挑战和风险。由于数据交易涉及多个环节和参与方,包括数据提供方、数据需求方、交易平台等,这些环节和参与方之间的信息不对称、利益冲突等问题日益凸显,给数据交易带来了诸多不确定性。其中,异常情况(如欺诈交易、数据泄露、非法交易等)的频发更是对数据交易的安全性构成了严重威胁。
3、为了应对这些挑战和风险,业界开始积极探索利用先进的技术手段来提高数据交易的安全性和效率。传统的异常交易识别方法往往依赖于人工审核和经验判断,存在效率低下、错误率高等问题。因此,如何更加高效、准确的识别异常交易以保障数据交易的安全成为亟待解决的技术问题。
技术实现思路
1、本申请实施例提供了一种数据交易中的异常交易识别方法、设备及介质,用以解决如下的技术问题:如何更加高效、准确的识别异常交易以保障数据交易的安全。
2、第一方面,本申请实施例提供了一种数据交易中的异常交易识别方法,其特征在于,方法包括:解析数据交易中的订单数据,以确定订单数据中的特征变量;通过z-score统计法对特征变量进行归一化处理,以确定特征变量对应的变量z-score值;基于预设的特征变量类别表,对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值,并通过z-score统计法对特征类别累加值进行归一化处理,以获得对应的类别z-score值;基于类别z-score值,通过孤立森林算法,确定订单数据对应的数据交易是否为异常交易。
3、在本申请的一种实现方式中,解析数据交易中的订单数据,以确定订单数据中的特征变量,具体包括:识别并提取订单数据中与交易行为相关的各个字段信息;基于预设的字段信息与特征变量的映射关系,确定字段信息对应的特征变量。
4、在本申请的一种实现方式中,通过z-score统计法对特征变量进行归一化处理,以确定特征变量对应的变量z-score值,具体包括:基于映射关系对订单数据进行计算,以确定特征变量对应的变量数据;基于变量数据,计算特征变量的均值和标准差;根据特征变量的均值和标准差,利用z-score统计法,以确定特征变量对应的变量z-score值。
5、在本申请的一种实现方式中,基于预设的特征变量类别表,对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值,具体包括:查询特征变量类别表,确定特征变量所属的特征类别;对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值。
6、在本申请的一种实现方式中,通过z-score统计法对特征类别累加值进行归一化处理,以获得对应的类别z-score值,具体包括:基于特征类别累加值对应的同类别特征变量的变量z-score值,计算特征类别累加值的均值和标准差;根据特征类别累加值的均值和标准差,利用z-score统计法,以获得对应的类别z-score值。
7、在本申请的一种实现方式中,基于类别z-score值,通过孤立森林算法,确定订单数据对应的数据交易是否为异常交易,具体包括:构建孤立森林模型;其中,孤立森林模型中的每个孤立树通过随机选择特征变量和分割点来进行构建;将类别z-score值作为输入数据,输入到孤立森林模型中;计算每个输入数据在孤立森林中的路径长度,并基于路径长度,确定订单数据对应的数据交易是否为异常交易。
8、在本申请的一种实现方式中,基于路径长度,确定订单数据对应的数据交易是否为异常交易,具体包括:判断路径长度是否小于或等于预设的路径长度阈值;在确定路径长度小于或等于预设的路径长度阈值时,确定订单数据对应的数据交易为异常交易;在确定路径长度大于预设的路径长度阈值时,确定订单数据对应的数据交易为正常交易。
9、在本申请的一种实现方式中,方法还包括:在确定订单数据对应的数据交易为异常交易后,生成异常交易警报,并将异常交易警报发送至预设的管理员账户,以便管理员账户对异常交易进行人工复核。
10、第二方面,本申请实施例还提供了一种数据交易中的异常交易识别设备,其特征在于,设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:解析数据交易中的订单数据,以确定订单数据中的特征变量;通过z-score统计法对特征变量进行归一化处理,以确定特征变量对应的变量z-score值;基于预设的特征变量类别表,对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值,并通过z-score统计法对特征类别累加值进行归一化处理,以获得对应的类别z-score值;基于类别z-score值,通过孤立森林算法,确定订单数据对应的数据交易是否为异常交易。
11、第三方面,本申请实施例还提供了一种数据交易中的异常交易识别的非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,计算机可执行指令设置为:解析数据交易中的订单数据,以确定订单数据中的特征变量;通过z-score统计法对特征变量进行归一化处理,以确定特征变量对应的变量z-score值;基于预设的特征变量类别表,对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值,并通过z-score统计法对特征类别累加值进行归一化处理,以获得对应的类别z-score值;基于类别z-score值,通过孤立森林算法,确定订单数据对应的数据交易是否为异常交易。
12、本申请实施例提供的一种,通过。
1.一种数据交易中的异常交易识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种数据交易中的异常交易识别方法,其特征在于,解析数据交易中的订单数据,以确定所述订单数据中的特征变量,具体包括:
3.根据权利要求2所述的一种数据交易中的异常交易识别方法,其特征在于,通过z-score统计法对所述特征变量进行归一化处理,以确定所述特征变量对应的变量z-score值,具体包括:
4.根据权利要求1所述的一种数据交易中的异常交易识别方法,其特征在于,基于预设的特征变量类别表,对同类别特征变量的变量z-score值进行累加,以获得特征类别累加值,具体包括:
5.根据权利要求1所述的一种数据交易中的异常交易识别方法,其特征在于,通过所述z-score统计法对所述特征类别累加值进行归一化处理,以获得对应的类别z-score值,具体包括:
6.根据权利要求1所述的一种数据交易中的异常交易识别方法,其特征在于,基于所述类别z-score值,通过孤立森林算法,确定所述订单数据对应的数据交易是否为异常交易,具体包括:
7.根据权利要求6所述的一种数据交易中的异常交易识别方法,其特征在于,基于所述路径长度,确定所述订单数据对应的数据交易是否为异常交易,具体包括:
8.根据权利要求1所述的一种数据交易中的异常交易识别方法,其特征在于,所述方法还包括:
9.一种数据交易中的异常交易识别设备,其特征在于,所述设备包括:
10.一种数据交易中的异常交易识别的非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为: