一种异常商户分类方法及装置与流程

文档序号:35682061发布日期:2023-10-08 21:23阅读:30来源:国知局
一种异常商户分类方法及装置与流程

本技术涉及图神经网络领域,尤其涉及一种异常商户分类方法及装置。


背景技术:

1、由于现有的图神经网络的目的是完成节点的类别的预测,其认为边的信息和节点的信息并没有直接的关联,所以并没有特定的将边信息转换为点信息的方法,于是边的信息很难被利用。现有的通过图神经网络对商户进行分类的方式中,主要也是利用边的结构信息,即将边作为一种用来传递信息的介质,没有充分利用边的内容信息。但实际上,边的内容信息可能反应了节点之间的紧密程度,而节点之间的紧密程度也会对最终的预测结果造成影响。因此,现有的通过图神经网络对商户进行分类的预测结果不够准确。


技术实现思路

1、本技术提供一种异常商户分类方法及装置,用以充分利用图神经网络中边的内容信息,从而提高商户分类的准确性。

2、第一方面,本技术提供一种异常商户分类方法,该方法包括:接收图结构数据;所述图结构数据中的节点包括表征商户实体信息的商户节点和表征用户实体信息的用户节点,所述图结构数据中的边用于表征用户实体与商户实体间的交易信息;通过所述图结构数据的元路径中两条边之间的相似程度,确定所述元路径的强度;其中,任一元路径为通过同一用户节点在两个商户节点间的边构建的;两条边之间的相似程度表征两个交易信息之间的相似程度,相似程度越高强度值越高;针对任一商户节点,基于所述商户节点与其它商户节点间的各元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况。

3、上述技术方案中,根据用户实体与商户实体间的交易信息确定商户节点间的各元路径的强度,将图结构数据中边的内容信息作为判断边的关系强弱的度量,有效地利用了利用的边的内容信息,并将内容信息优化为结构信息的一种。进而在基于商户节点间的各元路径的强度和商户实体的初始异常值确定商户实体的异常情况时,可以提高商户实体异常情况分类的准确性。在一种可能的设计中,元路径按照强度分为强元路径、中元路径及弱元路径三种;基于所述商户节点与其它商户节点间的元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况之前,还包括:确定所述商户节点与其它商户节点间的所有元路径中至少包括一个强元路径或至少一个中元路径。

4、上述技术方案中,在实际应用中,商户实体间绝大部分的元路径都是弱元路径,通过弱元路径连接的商户实体的异常情况不会传播。因此,通过对元路径的分类,在确定商户实体的异常情况之前,将商户实体间的弱元路径舍弃,或者说不考虑弱元路径,只考虑实体的异常情况在中元路径和强元路径上的传递,可以减少大量的计算,极大地提升了算法的运算效率,节约了计算资源。

5、在一种可能的设计中,基于所述商户节点与其它商户节点间的元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况,包括:根据商户实体的异常行为可传递至元路径上其它商户实体的原则,若任一其它商户节点的初始异常值为异常,则对所述商户实体的初始异常值进行修正,得到所述商户实体的异常情况。

6、上述技术方案中,由于正负样本的影响力是不同的,因此与正常商户实体相比,异常商户实体的异常行为对与其存在关联的其它商户实体的影响更大、更有决定性。因此,根据商户实体的异常行为可传递至元路径上其它商户实体的原则,对所述商户实体的初始异常值进行修正,可以提高商户实体异常情况判断的准确性。在一种可能的设计中,所述根据商户实体的异常行为可传递至元路径上其它商户实体的原则,若任一其它商户节点的初始异常值为异常,则对所述商户实体的初始异常值进行修正,包括:若第一商户实体与第二商户实体之间存在强元路径,且所述第二商户实体的初始异常值为异常,则将所述第一商户实体的初始异常值修正为异常;若第三商户实体与各第四商户实体之间不存在强元路径但存在至少一条中元路径,则根据所述第三商户实体的初始异常值及所述各第四商户实体的初始异常值,确定所述第三商户实体修正后的异常值。

7、上述技术方案中,强元路径的商户实体可将异常行为传递给强元路径上的其他商户实体,中元路径的商户实体可将部分异常行为传递给中元路径上的其他商户实体。根据不同强度的元路径的消息传递强度不同,对商户实体的初始异常值进行修正,可以提高商户实体异常情况判断的准确性。

8、在一种可能的设计中,所述方法包括:通过如下公式确定所述第三商户实体修正后的异常值:

9、

10、t′(x)为三商户实体修正后的异常值,t(x)为第三商户实体的初始异常值,∑t(n)为各第四商户实体的初始异常值的和,n为第四商户实体的数目,μ1、μ2为训练参数,μ1+μ2=1。

11、在一种可能的设计中,所述对所述商户实体的初始异常值进行修正之前,还包括:针对任一其他商户节点,确定所述商户节点与所述其它商户节点间的相似元路径数目;确定所述商户节点与所述其他商户节点之间的相似元路径数目小于设定阈值;其中,相似元路径为具有相同的商户实体但不同的用户实体的元路径。

12、上述技术方案中,若两个商户实体间存在过多的相似元路径,则可能这两个商户实体为某一类具有共同性的正常商户实体。因此,可以通过两个商户实体间相似元路径的数目来防止误杀。通过商户实体间相似元路径的数目辅助判断两个商户的关联关系,可以提高商户实体异常情况判断的准确性。

13、在一种可能的设计中,所述设定阈值根据所述图结构数据中各商户实体间的相似元路径数目,及设定的相似元路径的分位数确定。

14、在一种可能的设计中,所述交易信息包括交易时间和交易金额;所述通过所述图结构数据的元路径中两条边之间的相似程度,确定所述元路径的强度,包括:针对所述图结构数据中的任一元路径,根据所述元路径的两条交易信息中交易时间的相似程度,及交易金额的相似程度,确定所述元路径的强度值;其中,若交易时间越接近且交易金额越接近,则元路径的强度值越强;根据所述元路径的强度值及各个强度元路径的强度值范围,确定所述元路径的强度。

15、在一种可能的设计中,所述方法包括:通过如下公式确定元路径的强度值:

16、

17、

18、

19、其中,i为两个商户实体之间元路径的强度值;a1、a2为两条交易的交易金额;t1、t2为两条交易的交易时间;m、ft1、ft2、θ1为参数。

20、第二方面,本技术实施例提供一种异常商户分类装置,该装置包括:

21、接收模块,用于接收图结构数据;所述图结构数据中的节点包括表征商户实体信息的商户节点和表征用户实体信息的用户节点,所述图结构数据中的边用于表征用户实体与商户实体间的交易信息;

22、处理模块,用于通过所述图结构数据的元路径中两条边之间的相似程度,确定所述元路径的强度;其中,任一元路径为通过同一用户节点在两个商户节点间的边构建的;两条边之间的相似程度表征两个交易信息之间的相似程度,相似程度越高强度值越高;

23、所述处理模块,还用于针对任一商户节点,基于所述商户节点与其它商户节点间的各元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况。

24、在一种可能的设计中,元路径按照强度分为强元路径、中元路径及弱元路径三种;基于所述商户节点与其它商户节点间的元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况之前,所述处理模块,还用于确定所述商户节点与其它商户节点间的所有元路径中至少包括一个强元路径或至少一个中元路径。

25、在一种可能的设计中,所述处理模块,在基于所述商户节点与其它商户节点间的元路径的强度及所述商户节点对应的商户实体的初始异常值,确定所述商户节点对应的商户实体的异常情况时,还用于根据商户实体的异常行为可传递至元路径上其它商户实体的原则,若任一其它商户节点的初始异常值为异常,则对所述商户实体的初始异常值进行修正,得到所述商户实体的异常情况。

26、在一种可能的设计中,所述处理模块,在根据商户实体的异常行为可传递至元路径上其它商户实体的原则,若任一其它商户节点的初始异常值为异常,则对所述商户实体的初始异常值进行修正时,还用于若第一商户实体与第二商户实体之间存在强元路径,且所述第二商户实体的初始异常值为异常,则将所述第一商户实体的初始异常值修正为异常;若第三商户实体与各第四商户实体之间不存在强元路径但存在至少一条中元路径,则根据所述第三商户实体的初始异常值及所述各第四商户实体的初始异常值,确定所述第三商户实体修正后的异常值。

27、在一种可能的设计中,所述处理模块,还用于通过如下公式确定所述第三商户实体修正后的异常值:

28、

29、t′(x)为三商户实体修正后的异常值,t(x)为第三商户实体的初始异常值,∑t(n)为各第四商户实体的初始异常值的和,n为第四商户实体的数目,μ1、μ2为训练参数,μ1+μ2=1。

30、在一种可能的设计中,所述处理模块,在对所述商户实体的初始异常值进行修正之前,还用于针对任一其他商户节点,确定所述商户节点与所述其它商户节点间的相似元路径数目;确定所述商户节点与所述其他商户节点之间的相似元路径数目小于设定阈值;其中,相似元路径为具有相同的商户实体但不同的用户实体的元路径。

31、在一种可能的设计中,所述设定阈值根据所述图结构数据中各商户实体间的相似元路径数目,及设定的相似元路径的分位数确定。

32、在一种可能的设计中,所述交易信息包括交易时间和交易金额;所述处理模块,在通过所述图结构数据的元路径中两条边之间的相似程度,确定所述元路径的强度时,还用于针对所述图结构数据中的任一元路径,根据所述元路径的两条交易信息中交易时间的相似程度,及交易金额的相似程度,确定所述元路径的强度值;其中,若交易时间越接近且交易金额越接近,则元路径的强度值越强;根据所述元路径的强度值及各个强度元路径的强度值范围,确定所述元路径的强度。

33、在一种可能的设计中,所述处理模块,还用于通过如下公式确定元路径的强度值:

34、

35、

36、

37、其中,i为两个商户实体之间元路径的强度值;a1、a2为两条交易的交易金额;t1、t2为两条交易的交易时间;m、ft1、ft2、θ1为参数。

38、第三方面,本技术实施例还提供一种计算设备,包括:

39、存储器,用于存储程序指令;

40、处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面的任一种可能的设计中所述的方法。

41、第四方面,本技术实施例还提供一种计算机可读存储介质,其中存储有计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得上述第一方面的任一种可能的设计中所述的方法实现。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1