集群识别方法和装置、计算设备、存储介质及程序产品与流程

文档序号:35528728发布日期:2023-09-21 05:54阅读:24来源:国知局
集群识别方法和装置、计算设备、存储介质及程序产品与流程

本技术涉及互联网,特别涉及一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、互联网技术的迅速发展为资源的转移和流通提供了新的方式。日常的资源交易中,有可能夹杂着非正常或异常资源转移活动,而参与异常资源转移活动的往往是多个主体的构成的集群,可以被称为异常集群,其中单个主体可以称为异常主体。在相关技术中,识别异常集群的方法包括预先确定从事异常资源转移活动的单个主体的交易特征,根据这些交易特征开发识别模型或者训练机器学习模型,以便利用上述模型确定待识别资源转移主体是否为从事异常资源转移活动的可疑主体;另外还包括使用现有算法或模型来对主体进行分类或分群,从而确定可疑主体集群。

2、相关技术的异常集群识别方法往往以单个主体的交易特征为核心,而忽略了参与异常资源转移活动的集群中各个主体的相互关联以及不同资源系统之间的资源转移过程,这导致集群识别的思路存在片面性和局限性,无法准确地挖掘潜在的异常集群,漏判率和/或误判率较大。


技术实现思路

1、鉴于此,本技术提供了一种集群识别方法和装置、计算设备、计算机可读存储介质及计算机程序产品,期望缓解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。

2、根据本技术的一个方面,提供了一种集群识别方法,该方法包括:获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关,并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。

3、在根据本技术的一些实施例的集群识别方法中,至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:以所述候选主体中的各个主体为节点,基于各节点之间的资源转移关系定义不同节点之间的有向边,并根据所述节点和所述节点之间的有向边建立资源转移多分有向图,所述资源转移多分有向图包括多个分图,同一分图中的节点具有相同的层级,所述节点的层级指示该节点与所述第二资源系统或所述第三资源系统的相关程度;至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,其中所述每个节点的属性值指示该节点属于目标集群的可能性;基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群。

4、在根据本技术的一些实施例的集群识别方法中,每个节点的资源转移水平包括每个节点的资源转移留存值,所述每个节点的资源转移留存值表示该节点的资源支出总量和资源接收总量之差的绝对值。

5、在根据本技术的一些实施例的集群识别方法中,每个节点的资源转移水平进一步包括每个节点的资源收支最小值,所述每个节点的资源收支最小值表示该节点的资源支出总量和资源接收总量中的较小者。

6、在根据本技术的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且资源转移多分有向图中的每个节点的属性值满足下述条件中至少一个:与所述节点的资源转移留存值成负相关;与所述节点的第一类型层级和第二类型层级中的较小者成负相关;以及与所述节点的资源收支最小值成正相关。

7、在根据本技术的一些实施例的集群识别方法中,节点的层级包括指示该节点与第二资源系统相关程度的第一类型层级和指示该节点与第三资源系统相关程度的第二类型层级,并且至少根据所述资源转移多分有向图中各个节点的资源转移水平和层级,确定所述资源转移多分有向图中每个节点的属性值,包括:对于所述资源转移多分有向图中的每个节点,使用下述公式确定所述节点的属性值:

8、

9、其中表示资源转移多分有向图s中节点i的属性值,表示节点i的资源支出总量和资源接收总量中的较小者,表示节点i的资源支出总量和资源接收总量中的较大者,表示节点i的第一类型层级和第二类型层级中的较小者,a为大于或等于0且小于1的预设参数。

10、在根据本技术的一些实施例的集群识别方法中,基于所述资源转移多分有向图中的每个节点的属性值,从所述资源转移多分有向图的节点中识别目标集群,包括:

11、将所述资源转移多分有向图中的各个节点的集合作为当前候选集群,通过迭代方式依次执行下述步骤,以获取候选集群集合:迭代结束判定步骤:响应于当前候选集群对应的资源转移多分有向图中存在节点为空的分图,结束迭代;集群特征值计算步骤:基于当前候选集群中各个节点的属性值,计算当前候选集群的集群特征值,并将当前候选集群作为候选集群集合中的一个候选集群;当前候选集群更新步骤:从当前候选集群中移除属性值最低的节点并更新所移除的节点的相邻节点的属性值,以更新当前候选集群,并转到迭代结束判定步骤,以及基于候选集群集合中各候选集群的集群特征值,从候选集群集合中识别目标集群。

12、在根据本技术的一些实施例的集群识别方法中,获取第一资源系统中多个主体的资源转移数据包括:获取预设时间段内多个主体的资源转移数据。

13、在根据本技术的一些实施例的集群识别方法中,预设时间段的长度大于或等于3个小时。

14、在根据本技术的一些实施例的集群识别方法中,基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,包括:基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合;基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合;根据第一主体集合和第二主体集合的交集确定候选主体。

15、在根据本技术的一些实施例的集群识别方法中,基于所述多个主体的资源接收数据,从所述多个主体中筛选与所述第二资源系统存在资源转移关系的第一主体集合,包括:基于所述多个主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在直接资源转移关系的直接接收主体;根据直接接收主体的资源接收数据,从所述多个主体中提取与所述第二资源系统存在间接资源转移关系的间接接收主体;基于直接接收主体和间接接收主体,确定第一主体集合,并且/或者基于所述多个主体的资源支出收数据,从所述多个主体中筛选与所述第三资源系统存在资源转移关系的第二主体集合,包括:基于所述多个主体的资源支出数据,从所述多个主体中提取与所述第三资源系统存在直接资源转移关系的直接支出主体;根据直接支出主体的资源支出数据,从所述多个主体中提取与所述第三资源系统存在间接资源转移关系的间接支出主体;基于直接支出主体和间接支出主体,确定第二主体集合。

16、在根据本技术的一些实施例的集群识别方法中,至少根据所述候选主体中每个主体的资源转移水平,从所述候选主体中识别目标集群,包括:基于所述候选主体的资源接收数据和资源支出数据,计算候选主体中存在直接资源转移关系的主体对之间的资源转移总量;响应于所述主体对之间的资源转移总量小于资源转移阈值,从所述候选主体中删除所述主体对,以得到更新的候选主体;至少根据所述更新的候选主体中每个主体的资源转移水平,从所述更新的候选主体中识别目标集群。

17、根据本技术的另一方面,提供了一种集群识别装置,该装置包括:获取模块,配置为获取第一资源系统中多个主体的资源转移数据,其中所述资源转移数据包括所述多个主体中的每个主体的资源接收数据和资源支出数据;第一确定模块,配置为基于所述多个主体的资源转移数据,从所述多个主体中确定候选主体,所述候选主体的资源接收数据与不同于所述第一资源系统的第二资源系统相关并且所述候选主体的资源支出数据与不同于所述第一资源系统的第三资源系统相关,其中所述第二资源系统用于向所述第一资源系统中的所述候选主体支出资源,所述第三资源系统用于从所述第一资源系统中的所述候选主体接收资源;第二确定模块,配置为根据所述候选主体的资源接收数据和资源支出数据,确定所述候选主体中每个主体的资源转移水平;识别模块,配置为至少根据所述候选主体的中每个主体的资源转移水平,从所述候选主体中识别目标集群,所述目标集群包括从所述第二资源系统经由所述第一资源系统到所述第三资源系统的资源转移过程所涉及的至少一个候选主体。

18、根据本技术的又一方面,提供了一种计算设备,包括存储器和处理器,其中所述存储器中存储有计算机程序,所述计算机程序在被所述处理器执行时促使所述处理器执行根据本技术一些实施例的集群方法的步骤。

19、根据本技术的另外又一方面,提供了一种计算机可读存储介质,其其上存储计算机可读指令,所述计算机可读指令在被执行时实现根据本技术一些实施例的集群识别方法。

20、根据本技术的另一方面,提供了一种计算机程序产品,包括计算机指令,计算机指令在被处理器执行时实现根据本技术一些实施例的集群识别方法的步骤。

21、在根据本技术一些实施例的集群识别方法和装置中,从第一资源系统中的多个主体中,利用各个主体的资源接收数据和资源支出数据识别参与异常资源转移过程(即,从另一资源系统(即第二资源系统)中接收的资源经过第一资源系统流动或支出到又一资源系统(即第三资源系统)的资源转移过程)的主体集群,作为目标集群(即异常集群),从而考虑了异常资源(例如来自第二资源系统经由第一资源系统转入第三资源系统的某些资源)在第一资源系统中完整的资源转移过程或资源流向;不仅如此,还基于该完整的资源转移过程分别计算每个主体的资源转移水平,将每个主体的资源转移水平作为识别目标集群的识别依据。这样的识别方法既考虑了各个主体自身的交易特征,又兼顾了不同主体之间的资源转移关系和资源流动特征,克服了相关技术的片面性和局限性;同时这种识别方法由于仅涉及参与第一资源系统中完整的资源转移过程的主体集群,因此可以有效排除无关主体(例如从事正常资源转移活动的正常主体)的干扰或正常资源转移过程的干扰,从而显著提高识别集群的准确率。

22、根据下文描述的实施例,本技术的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本技术的这些和其它优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1