1.一种套利用户识别方法,其特征在于,包括:
基于预识别出的套利用户确定目标社群中各个用户的标签;
基于预定的目标概率密度函数及社群中各个用户的特征变量确定社群中各个用户的概率密度值;
基于社群中的套利用户的概率密度值以及社群中的其他用户的概率密度值,确定社群中的其他用户是否为套利用户。
2.根据权利要求1所述的方法,其特征在于,所述基于社群中的套利用户的概率密度值以及社群中的其他用户的概率密度值,确定社群中的其他用户是否为套利用户,包括:
基于社群中的套利用户的概率密度值确定最小概率密度值与最大概率密度值;
如果任一其他用户的概率密度值在最小概率密度值与最大概率密度值区间内,则将所述任一其他用户确定为套利用户。
3.根据权利要求1所述的方法,其特征在于,所述预定的目标概率密度函数的确定过程包括:
确定目标用户集中各个用户的目标特征变量;
基于确定的所述目标用户集中各个用户的目标特征变量进行均值估计、方差估计;
基于均值估计、方差估计结果确定目标概率密度函数。
4.根据权利要求3所述的方法,其特征在于,所述目标概率密度函数为联合概率密度函数,所述目标特征变量包括多个特征变量,该方法还包括:
确定其中一个特征变量的概率密度函数步骤,用于针对目标用户集中各个用户目标特征变量中的其中一个特征变量进行均值估计、方差估计,并基于均值估计、方差估计结果确定针对所述其中一个特征变量的概率密度密度函数;
重复执行所述确定其中一个特征变量的概率密度函数步骤,得到各个特征变量对应的概率密度函数;
基于确定的各个特征变量对应的概率密度函数确定目标概率密度函数。
5.根据权利要求4所述的方法,其特征在于,所述基于确定的各个特征变量对应的概率密度函数确定目标概率密度函数,包括:
对所述确定的各个特征变量对应的概率密度函数进行乘积得到目标概率密度函数。
6.根据权利要求3所述的方法,其特征在于,所述基于确定的所述目标用户集中各个用户的目标特征变量进行均值估计、方差估计,之前包括:
基于目标用户集中各个用户的目标特征变量的分布情况判断是否符合正态分布;
如果所述分布情况不符合正态分布,则对目标用户集中各个用户的目标特征变量进行数学转换使其分布情况符合正态分布。
7.根据权利要求3所述的方法,其特征在于,目标特征变量确定过程包括:
确定用户的多个候选特征变量;
确定两两候选特征变量的相关性;
基于两两候选特征变量的相关性进行候选特征变量的筛选确定目标特征变量。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述特征变量如下至少一种数据确定:
用户交易数据、用户信用数据、用户社交数据。
9.根据权利要求1所述的方法,其特征在于,该方法还包括:
基于目标用户集中各个用户的用户数据构建用户关系知识图谱;
基于所述用户关系知识图谱通过社群发现算法确定至少一个社群。
10.根据权利要求9所述的方法,其特征在于,所述用户数据为交易相关数据,所述基于目标用户集中各个用户的用户数据构建用户关系知识图谱,包括:
以用户作为节点、用户之间的交易关系作为边构建用户关联关系三元组;
基于构建的用户关联关系三元组通过连通子图算法确定用户关系知识图谱。
11.根据权利要求10所述的方法,其特征在于,所述社群发现算法为基于模块度的社区发现算法;
所诉模块度的计算公式为:
12.一种套利用户识别装置,其特征在于,包括:
第一确定模块,用于基于预识别出的套利用户确定目标社群中各个用户的标签;
第二确定模块,用于基于预定的目标概率密度函数及社群中各个用户的特征变量确定社群中各个用户的概率密度值;
第三确定模块,用于基于社群中的套利用户的概率密度值以及社群中的其他用户的概率密度值,确定社群中的其他用户是否为套利用户。
13.根据权利要求12所述的装置,其特征在于,所述第三确定模块包括:
第一确定单元,用于基于社群中的套利用户的概率密度值确定最小概率密度值与最大概率密度值;
第二确定单元,用于如果任一其他用户的概率密度值在最小概率密度值与最大概率密度值区间内,则将所述任一其他用户确定为套利用户。
14.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1至11任一项所述的套利用户识别方法。
15.一种计算机可读存储介质,其特征在于,所述计算机存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1至11中任一项所述的套利用户识别方法。