本公开涉及计算机,尤其涉及一种白名单用户确定方法、白名单用户确定装置、存储介质及电子设备。
背景技术:
1、随着网络的发展,电商平台薅羊毛、直播平台刷量、社交平台刷粉等黑产用户行为越来越多。黑产用户为了获得更大利益,攻击方式和手段也在持续变化。为打击黑产用户,各平台会上线风控策略,但风控策略常会造成误伤,影响用户体验。而采用一份优质的白名单用户集合来评估风控策略结果可以有效降低其误伤率,因此,白名单选取的质量至关重要。
2、目前,在确定白名单用户时,平台通过对用户多个指标进行评价,然后综合判断该名单用户集用户是否属于白名单范畴,通过上述算法选取的用户构成白名单。为了评估白名单用户集合是否准确以及集合人数是否充足,目前采用独立的第三方评估手段业务指标综合反馈进行打分评估,分数越高说明白名单用户集合选取的越好。
3、为了提高白名单用户集合的选取质量,选取算法通常需要对参数进行反复调节,目前需要人工方法进行手动调节。具体来说,通过手动去调节各个参数然后再观察选取结果,通过不断的调整参数来得到比较满意的结果。但是手动调整速度慢且需要投入大量人力,且效率低下。
4、需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本公开的目的在于提供一种白名单用户确定方法、装置、存储介质及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的人力资源浪费,且效率低下的问题。
2、本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
3、根据本公开的第一方面,提供一种白名单用户确定方法,包括:
4、采用预设优化算法从样本特征参数中选取目标特征参数;
5、获取待确定用户的第一特征参数;
6、根据所述第一特征参数和所述目标特征参数确定所述待确定用户是否为白名单用户。
7、在本公开的一种示例性实施例中,所述样本特征参数为样本集中样本用户的特征参数,所述采用预设优化算法从样本特征参数中选取的目标特征参数包括:
8、根据所述样本集中各所述样本用户的特征参数和样本标签获取白名单选取函数;
9、循环执行预设步骤,直至确定满足预设条件,将所述白名单选取函数中的极值点对应的特征参数作为所述目标特征参数;所述预设步骤包括:从所述白名单选取函数中获取极值点;
10、采用所述样本集和所述极值点生成所述白名单选取函数。
11、在本公开的一种示例性实施例中,所述样本标签包括白名单用户以及黑名单用户,所述根据所述样本集中各所述样本用户的特征参数和样本标签获取白名单选取函数包括:
12、将所述样本集中的特征参数所在的区间划分成多个参数子区间;
13、针对每个参数子区间,获取该参数子区间内所述样本用户的特征参数的均值;以及
14、根据该参数子区间内所述各样本用户的样本标签确定该参数子区间内所述样本用户为白名单用户的概率;
15、根据所述均值以及所述概率生成所述白名单选取函数。
16、在本公开的一种示例性实施例中,所述确定满足预设条件包括:
17、若循环执行所述预设步骤的次数大于或者等于预设次数,或所述极值点对应的白名单用户概率大于或者等于预设概率阈值,则确定满足所述预设条件。
18、在本公开的一种示例性实施例中,所述根据所述样本集中各所述样本用户的特征参数和样本标签获取白名单选取函数前,所述方法还包括:
19、获取所述样本特征参数的样本空间;
20、采用随机抽样算法从所述样本空间中抽取所述样本用户的特征参数。
21、在本公开的一种示例性实施例中,所述获取待确定用户的第一特征参数包括:
22、针对各所述样本用户,获取所述样本用户的多个特征的第二特征参数;
23、针对所述样本用户的每个特征,对该特征的第二特征参数进行归一化,得到归一化的特征参数;
24、对所述样本用户的多个特征的归一化的特征参数进行加权运算,得到所述第一特征参数。
25、在本公开的一种示例性实施例中,所述根据所述第一特征参数和所述目标特征参数确定所述待确定用户是否为白名单用户包括:
26、获取所述第一特征参数与所述目标特征参数的差值;
27、若所述差值小于或者等于预设阈值,则确定所述待确定用户是白名单用户;
28、若所述差值大于所述预设阈值,则确定所述待确定用户不是白名单用户。
29、根据本公开的第二方面,提供一种白名单用户确定装置,包括:
30、目标特征参数获取模块,用于采用预设优化算法从样本特征参数中选取目标特征参数;
31、第一特征参数获取模块,用于获取待确定用户的第一特征参数;
32、白名单用户确定模块,用于根据所述第一特征参数和所述目标特征参数确定所述待确定用户是否为白名单用户。
33、在本公开的一种示例性实施例中,所述样本特征参数为样本集中样本用户的特征参数,所述目标特征参数获取模块包括:
34、白名单选取函数获取单元,用于根据所述样本集中各所述样本用户的特征参数和样本标签获取白名单选取函数;
35、预设步骤执行单元,用于循环执行预设步骤,直至确定满足预设条件,将所述白名单选取函数中的极值点对应的特征参数作为所述目标特征参数;所述预设步骤包括:从所述白名单选取函数中获取极值点;
36、采用所述样本集和所述极值点生成所述白名单选取函数。
37、在本公开的一种示例性实施例中,所述样本标签包括白名单用户以及黑名单用户,所述白名单选取函数获取单元包括:
38、参数区间生成单元,用于将所述样本集中的特征参数所在的区间划分成多个参数子区间;
39、均值获取单元,用于针对每个参数子区间,获取该参数子区间内所述样本用户的特征参数的均值;以及
40、根据该参数子区间内所述各样本用户的样本标签确定该参数子区间内所述样本用户为白名单用户的概率;
41、白名单选取函数生成单元,用于根据所述均值以及所述概率生成所述白名单选取函数。
42、在本公开的一种示例性实施例中,所述预设步骤执行单元包括:
43、预设条件确定单元,用于若循环执行所述预设步骤的次数大于或者等于预设次数,或所述极值点对应的白名单用户概率大于或者等于预设概率阈值,则确定满足所述预设条件。
44、在本公开的一种示例性实施例中,所述装置还包括:
45、特征参数抽取模块,用于:
46、获取所述样本特征参数的样本空间;
47、采用随机抽样算法从所述样本空间中抽取所述样本用户的特征参数。
48、在本公开的一种示例性实施例中,所述第一特征参数获取模块包括:
49、第二特征参数获取单元,用于针对各所述样本用户,获取所述样本用户的多个特征的第二特征参数;
50、归一化的特征参数获取单元,用于针对所述样本用户的每个特征,对该特征的第二特征参数进行归一化,得到归一化的特征参数;
51、第一特征参数生成单元,用于对所述样本用户的多个特征的归一化的特征参数进行加权运算,得到所述第一特征参数。
52、在本公开的一种示例性实施例中,所述白名单用户确定模块包括:
53、差值获取单元,用于获取所述第一特征参数与所述目标特征参数的差值;
54、第一白名单用户确定单元,用于若所述差值小于或者等于预设阈值,则确定所述待确定用户是白名单用户;
55、第二白名单用户确定单元,用于若所述差值大于所述预设阈值,则确定所述待确定用户不是白名单用户。
56、根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据第一方面中任一项所述的白名单用户确定方法。
57、根据本公开的第四方面,提供一种电子设备,包括:
58、处理器;以及
59、存储器,用于存储所述处理器的可执行指令;
60、其中,所述处理器配置为经由执行所述可执行指令来执行第一方面中任一项所述的白名单用户确定方法。
61、本公开的实施例提供的技术方案可以包括以下有益效果:
62、综上所述,本公开提供的方法,通过采用预设优化算法从样本特征参数中选取目标特征参数;获取待确定用户的第一特征参数;根据所述第一特征参数和所述目标特征参数确定所述待确定用户是否为白名单用户,根据预设优化算法选取的目标特征参数和用户的第一特征参数即可确定用户是否为白名单用户,无需手动调节参数,大大节省了人力,并且提高了运算效率。
63、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。