本发明涉及资金数据处理,具体涉及一种用于数字纪检行业大数据的用户行为分析系统及方法。
背景技术:
1、数字纪检分析系统是通过大数据分析,将监察过程嵌入被监督单位履职的全过程,动态预警异常数据,做到全过程主动监督,并且通过用户群体行为特征所形成的数据集中性,监督各种类数据的比对,挖掘出潜在的风险以及问题线索,为纪检工作提供有力的数据支持。
2、现有技术,根据经验设定资金流水阈值的方法对资金的使用进行分析,资金的使用额度超过资金流水阈值,判断用户资金使用行为存在异常;但由于采购、报销等公有资金使用时,资金的花销过程透明度低,且部分为了规避审查往往通过多人进行同一笔资金使用的分担,单用户的使用额度变化情况不容易显著地从群体中筛选识别,造成异常的资金使用情况逃避大数据纪检监察的问题,分析用户资金使用行为的异常存在误差,纪检监察的结果较差。
技术实现思路
1、为了解决分析用户资金使用行为的异常存在误差的技术问题,本发明的目的在于提供一种用于数字纪检行业大数据的用户行为分析系统及方法,所采用的技术方案具体如下:
2、本发明提出了一种用于数字纪检行业大数据的用户行为分析方法,所述方法包括:
3、获取用户在每个周期范围内的资金使用频率以及每笔资金使用额度;
4、对于任一周期范围内,根据每个用户的资金使用频率以及资金使用额度的分布情况,获得每个用户的使用风险系数;根据所有用户的所述使用风险系数的变化趋势和分布特征,获得多个用户组;根据每个用户组中用户的使用风险系数水平以及每个用户组的用户数量,获得每个用户组在每个周期范围内的初始异常度;
5、根据每个用户组在不同周期范围内所述初始异常度的变化趋势,获得更新异常度;
6、根据每个用户组的所述更新异常度判断出目标异常用户组。
7、进一步地,所述使用风险系数的获取方法包括:
8、对于任一周期范围内,根据每个用户的资金使用频率相对于其他用户中最大资金使用频率的变化情况,获得每个用户的资金使用活跃程度;
9、获得每个用户的每笔资金使用额度和平均资金使用额度之间的第一差值;对所述第一差值进行标准化,作为标准化差值;计算每个用户的所有资金使用额度和平均资金使用额度之间的标准化差值的预设偶次方后,并求均值,获得额度波动程度;
10、根据每个用户的所述资金使用活跃程度和所述额度波动程度,获得每个用户的使用风险系数,资金使用活跃程度和额度波动程度与使用风险系数呈正相关。
11、进一步地,所述用户组的获取方法包括:
12、根据所有用户的所述使用风险系数的变化趋势和分布特征,筛选出多个参考使用风险系数;
13、依次获取每两个参考使用风险系数的范围内使用风险系数对应的用户,构成一个用户组。
14、进一步地,所述参考使用风险系数的获取方法包括:
15、构建所有用户的使用风险系数降序序列;
16、获取使用风险系数降序序列的使用风险系数差分序列,获得使用风险系数差分序列的多个极大值点;将极大值点对应的使用风险系数、最大使用风险系数和最小使用风险系数作为参考使用风险系数。
17、进一步地,所述初始异常度的获取方法包括:
18、获得每个用户组中所有用户的使用风险系数的均值,作为整体使用风险水平;
19、依据所述整体使用风险水平从大到小对用户组进行排序,根据每个用户组的所述整体使用风险水平与相邻所述整体使用风险水平之间的差异特征,以及所有用户组的整体使用风险水平的集中趋势,获得每个用户组的使用风险集中程度,差异特征与所述使用风险集中程度呈正相关,所述集中趋势与所述使用风险集中程度呈负相关;
20、计算每个用户组的用户数量和所有用户数量的比值,作为异常因子;
21、将每个用户组的所述使用风险集中程度和所述异常因子进行融合,获得每个用户组在每个周期范围内的初始异常度。
22、进一步地,所述更新异常度的获取方法包括:
23、获得用户组在所有周期范围内初始异常度的均值,作为整体异常度水平;
24、根据每个用户组的所述整体异常度水平,以及相邻周期范围之间所述初始异常度的变化量,获得每个用户组的更新异常度。
25、进一步地,所述根据每个用户组的所述整体异常度水平,以及相邻周期范围之间所述初始异常度的变化量,获得每个用户组的更新异常度包括:
26、选取所述变化量中不等于预设变化量的,对应相邻周期范围作为参考相邻周期范围;
27、获得所述整体异常水平和每个参考相邻周期范围之间所述初始异常度的变化量之间的第一比值,计算所述整体异常水平和所有参考相邻周期范围之间的第一比值的累加和,作为每个用户组的更新异常度。
28、进一步地,所述目标异常用户组的获取方法包括:
29、将每个用户组的所述更新异常度进行归一化,若归一化结果大于或者等于预设异常阈值,判断对应用户组为目标异常用户组。
30、进一步地,所述极大值点的获取方法包括:
31、采用ampd算法获得使用风险系数差分序列的极大值点。
32、本发明还提出了一种用于数字纪检行业大数据的用户行为分析系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现任意一项所述一种用于数字纪检行业大数据的用户行为分析方法的步骤。
33、本发明具有如下有益效果:
34、本发明对于任一周期范围内,根据每个用户的资金使用频率以及资金使用额度的分布情况,获得每个用户的使用风险系数,通过考虑周期范围内用户的资金使用频率和额度分布,更准确反映用户的资金使用习惯;根据所有用户的使用风险系数的变化趋势和分布特征,获得多个用户组,将用户划分为具有相似的资金使用特征的不同组别,针对性的进行分析,提高处理效率;由于使用风险系数水平可以反映用户行为可信度,量化用户组的风险程度,用户数量可以评估该用户组在整体用户群体中的相对重要性或代表性,根据每个用户组中用户的使用风险系数水平以及每个用户组的用户数量,获得每个用户组在每个周期范围内的初始异常度,可以更加精准地评估每个用户组的初始异常度;考虑到异常的资金使用体现的行为不间断、小额度的特点,根据每个用户组在不同周期范围内初始异常度的变化趋势,获得更新异常度,更准确地反映用户组的风险状况;根据每个用户组的更新异常度判断出目标异常用户组,精准地定位到在资金使用方面存在较高的风险或异常行为的目标异常用户组。本发明通过自适应调整每个用户组的异常度,提高纪检监察的准确性。
1.一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述使用风险系数的获取方法包括:
3.根据权利要求1所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述用户组的获取方法包括:
4.根据权利要求3所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述参考使用风险系数的获取方法包括:
5.根据权利要求1所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述初始异常度的获取方法包括:
6.根据权利要求1所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述更新异常度的获取方法包括:
7.根据权利要求6所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述根据每个用户组的所述整体异常度水平,以及相邻周期范围之间所述初始异常度的变化量,获得每个用户组的更新异常度包括:
8.根据权利要求1所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述目标异常用户组的获取方法包括:
9.根据权利要求4所述的一种用于数字纪检行业大数据的用户行为分析方法,其特征在于,所述极大值点的获取方法包括:
10.一种用于数字纪检行业大数据的用户行为分析系统,所述系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~9任意一项所述一种用于数字纪检行业大数据的用户行为分析方法的步骤。