本技术涉及计算机,尤其涉及一种账号处理方法、一种账号处理装置、一种计算机设备、一种计算机可读存储介质、以及一种计算机程序产品。
背景技术:
1、在日常生活中,经常存在接收到陌生账号的通信请求的场景,在这样的场景中,如果能够知晓陌生账号的用途(陌生账号的用途可以通过标记类型进行标示),那么我们可以根据陌生账号的用途,对陌生账号的通行请求的响应方式做出选择。例如,如果知晓陌生账号的标记类型为骚扰、欺骗等非法类型,那么我们可以拒绝陌生账号的通信请求;又如,如果知晓陌生账号的标记类型为快递送餐、出租车专车等服务类型,那么我们可以接受陌生账号的通信请求。如此看来,如何识别账号的标记类型是当前的迫切需求。
技术实现思路
1、本技术实施例提供了一种账号处理方法、装置及计算机设备、存储介质、程序产品,可以较为准确地识别账号的标记类型。
2、一方面,本技术实施例提供了一种账号处理方法,该账号处理方法包括:
3、获取待识别的目标账号的访问时序数据,目标账号的访问时序信息用于表征目标账号的访问次数随时间的变化情况;目标账号的访问时序数据包括目标账号在n个统计时间粒度下的访问时序信息,n为正整数;
4、获取多种标记类型的访问时序数据,每种标记类型的访问时序数据用于表征每种标记类型下的参考账号的访问次数随时间的变化情况;每种标记类型的访问时序数据包括每种标记类型在n个统计时间粒度下的访问时序信息;
5、根据目标账号在每个统计时间粒度下的访问时序信息,与每种标记类型在对应统计时间粒度下的访问时序模板之间的相似度,确定目标账号与每种标记类型在对应统计时间粒度下的匹配度;
6、根据目标账号与每种标记类型在每个统计时间粒度下的匹配度,对目标账号进行标记类型预测,得到目标账号的标记类型。
7、相应地,本技术实施例提供了一种账号处理装置,该账号处理装置包括:
8、获取单元,用于获取待识别的目标账号的访问时序数据,目标账号的访问时序数据用于表征目标账号的访问次数随时间的变化情况;目标账号的访问时序数据包括目标账号在n个统计时间粒度下的访问时序信息,n为正整数;
9、获取单元,还用于获取多种标记类型的访问时序数据,每种标记类型的访问时序数据用于表征每种标记类型下的参考账号的访问次数随时间的变化情况;每种标记类型的访问时序数据包括每种标记类型在n个统计时间粒度下的访问时序信息;
10、处理单元,用于根据目标账号在每个统计时间粒度下的访问时序信息,与每种标记类型在对应统计时间粒度下的访问时序模板之间的相似度,确定目标账号与每种标记类型在对应统计时间粒度下的匹配度;
11、处理单元,还用于根据目标账号与每种标记类型在每个统计时间粒度下的匹配度,对目标账号进行标记类型预测,得到目标账号的标记类型。
12、在一种实现方式中,不同的统计时间粒度用于指示不同的统计时间单位,n个统计时间粒度中的任一个统计时间粒度为第i个统计时间粒度,i为小于或等于n的正整数;获取单元,用于获取目标账号在第i个统计时间粒度下的访问时序信息时,具体用于执行如下步骤:
13、获取目标账号在统计时间窗口内的访问日志信息,目标账号的访问日志信息包括目标账号在统计时间窗口内的访问时间记录;
14、按照第i个统计时间粒度指示的统计时间单位,对目标账号的访问日志信息进行统计分析,得到目标账号在统计时间窗口内的每个统计时间单位下的访问次数;目标账号在第i个统计时间粒度下的访问时序信息包括:目标账号在统计时间窗口内的每个统计时间单位下的访问次数。
15、在一种实现方式中,不同的统计时间粒度用于指示不同的统计时间单位,所述n个统计时间粒度中的任一个统计时间粒度为第i个统计时间粒度,i为小于或等于n的正整数;多种标记类型中的任一种标记类型表示为目标标记类型,目标标记类型下的参考账号的数量为多个;目标标记类型在第i个统计时间粒度下的访问时序模板的确定过程,包括:
16、获取目标标记类型在统计时间窗口内的访问日志信息,目标标记类型的访问日志信息包括目标标记类型下的各个参考账号在统计时间窗口内的访问日志信息,任一参考账号的访问日志信息包括相应参考账号在统计时间窗口内的访问时间记录;
17、按照第i个统计时间粒度指示的统计时间单位,对每个参考账号的访问日志信息进行统计分析,得到每个参考账号在统计时间窗口内的每个统计时间单位下的访问次数;
18、对目标标记类型下的各个参考账号在统计时间窗口内的每个统计时间单位下的访问次数进行平均处理,得到目标标记类型在统计时间窗口内的每个统计时间单位下的访问次数;目标标记类型在第i个统计时间粒度下的访问时序模板包括:目标标记类型在统计时间窗口内的每个统计时间单位下的访问次数。
19、在一种实现方式中,多种标记类型下的任一种标记类型表示为目标标记类型;所述n个统计时间粒度中的任一个统计时间粒度为第i个统计时间粒度,i为小于或等于n的正整数;根据目标账号在第i个统计时间粒度下的访问时序信息与目标标记类型在第i个统计时间粒度下的访问时序模板之间的相似度,确定目标账号与目标标记类型在第i个统计时间粒度下的匹配度的过程,包括:
20、获取多个相似度处理策略;
21、获取多个相似度处理策略中的每个相似度处理策略下,目标账号在第i个统计时间粒度下的访问时序信息与目标标记类型在第i个统计时间粒度下的访问时序模板之间的相似度;
22、对各个相似度处理策略下的相似度进行平均处理,得到目标账号与目标标记类型在第i个统计时间粒度下的匹配度。
23、在一种实现方式中,处理单元,用于根据所述目标账号与每种标记类型在每个统计时间粒度下的匹配度,对目标账号进行标记类型预测,得到目标账号的标记类型时,具体用于执行如下步骤:
24、若多种标记类型中存在与目标账号之间的匹配度大于匹配度阈值的标记类型,则获取目标账号的时序特征,目标账号的时序特征是对目标账号在多个维度下的时序子特征进行拼接处理得到的;一个维度对应目标账号的一种使用方式,任一个维度下的时序子特征用于表征目标账号在相应维度对应的使用方式下的使用次数随时间的变化情况;
25、根据目标账号的时序特征,对目标账号进行标记类型预测,确定目标账号的标记类型。
26、在一种实现方式中,处理单元,用于根据目标账号的时序特征,对目标账号进行标记类型预测,确定目标账号的标记类型时,具体用于执行如下步骤:
27、对目标账号的时序特征进行特征编码,得到目标账号的时序特征向量;
28、根据目标账号的时序特征向量,对目标账号进行标记类型预测,确定目标账号的标记类型。
29、在一种实现方式中,在统计分析目标账号的时序特征时设置了多个统计时间窗口,目标账号在每个统计时间窗口内的时序特征经特征编码,得到目标账号在每个统计时间窗口下的时序特征向量;
30、处理单元,用于根据目标账号的时序特征向量,对目标账号进行标记类型预测,确定目标账号的标记类型时,具体用于执行如下步骤:
31、按照多个统计时间窗口的时间顺序,对多个统计时间窗口下的时序特征向量进行拼接处理,得到目标账号的时序拼接向量;
32、获取目标账号所属的账号分段内除目标账号外的其他账号的时序拼接向量;
33、按照账号分段内的各个账号的排列顺序,对账号分段内的各个账号的时序拼接向量进行拼接处理,得到账号分段的时序拼接向量;
34、根据账号分段的时序拼接向量,对目标账号进行标记类型预测,确定目标账号的标记类型。
35、在一种实现方式中,在统计分析目标账号的时序特征时每个统计时间窗口设置了多个统计时间粒度,目标账号在每个统计时间窗口的不同统计时间粒度下的时序特征经特征编码,得到目标账号在每个统计时间窗口的不同统计时间粒度下的时序特征向量;
36、处理单元,用于按照多个统计时间窗口的时间顺序,对多个统计时间窗口下的时序特征向量进行拼接处理,得到目标账号的时序拼接向量时,具体用于执行如下步骤:
37、针对任一统计时间粒度,按照多个统计时间窗口的时间顺序,对多个统计时间窗口下的时序特征向量进行拼接处理,得到相应统计时间粒度下的时序拼接向量;
38、对多个统计时间粒度的时序拼接向量进行拼接处理,得到目标账号的时序拼接向量。
39、在一种实现方式中,处理单元,用于根据账号分段的时序拼接向量,对目标账号进行标记类型预测,确定目标账号的标记类型时,具体用于执行如下步骤:
40、根据账号分段的时序拼接向量,对目标账号进行标记类型预测,得到目标账号在多个候选标记类型下的预测概率;任一候选标记类型下的预测概率用于指示目标账号的标记类型为相应候选标记类型的可能性;
41、在多个候选标记类型对应的预测概率中,确定最高的预测概率对应的目标候选标记类型;
42、若目标候选标记类型为无标记类型,则确定目标账号的标记类型为无标记类型;
43、若目标候选标记类型为有标记类型,但目标候选标记类型对应的预测概率小于概率阈值,则确定目标账号的标记类型为无标记类型;
44、若目标候选标记类型为有标记类型,且目标候选标记类型对应的预测概率大于或等于概率阈值,则确定目标账号的标记类型为目标候选标记类型。
45、在一种实现方式中,处理单元,用于根据所述目标账号与每种标记类型在每个统计时间粒度下的匹配度,对目标账号进行标记类型预测,得到目标账号的标记类型时,具体用于执行如下步骤:
46、在目标账号与每种标记类型在每个统计时间粒度下的匹配度中,确定最高的匹配度对应的参考标记类型;
47、若目标账号与参考标记类型之间的匹配度大于或等于匹配度阈值,则确定目标账号的标记类型为参考标记类型;
48、若目标账号与参考标记类型之间的匹配度小于匹配度阈值,则确定目标账号的标记类型为无标记类型。
49、在一种实现方式中,处理单元,还用于执行如下步骤:
50、根据目标账号的标记类型,对目标账号进行账号业务处理;
51、其中,账号业务处理包括以下任一种或多种:
52、若目标账号的标记类型为有标记类型,则在访问目标账号时输出目标账号的标记类型;
53、若目标账号的标记类型为异常标记类型,则在访问目标账号时对目标账号进行访问拦截;
54、若目标账号的标记类型为异常标记类型,则在访问目标账号时输出异常提示。
55、相应地,本技术实施例提供一种计算机设备,该计算机设备包括:
56、处理器,适于实现计算机程序;
57、计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序适于由处理器加载并执行上述的账号处理方法。
58、相应地,本技术实施例提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被计算机设备的处理器读取并执行时,使得计算机设备执行上述的账号处理方法。
59、相应地,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的账号处理方法。
60、本技术实施例中,对于待识别的目标账号,可以获取目标账号的访问时序数据,目标账号的访问时序数据可以用于表征目标账号的访问次数随时间的变化情况,目标账号的访问时序数据可以包括目标账号在n个统计时间粒度下的访问时序信息;可以获取多种标记类型的访问时序数据,每种标记类型的访问时序数据可以用于表征每种标记类型下的参考账号的访问次数随时间的变化情况,每种标记类型的访问时序数据包括每种标记类型在n个统计时间粒度下的访问时序信息;然后,可以根据目标账号在每个统计时间粒度下的访问时序信息,与每种标记类型在对应统计时间粒度下的访问时序模板之间的相似度,确定目标账号与每种标记类型在每个统计时间粒度下的匹配度,根据目标账号与每种标记类型在每个统计时间粒度下的匹配度,确定目标账号的标记类型。可以看出,每种标记类型的时序访问数据可以反映每种标记类型的访问时序特点,待识别账号的访问时序数据可以反映待识别账号的访问时序特点,基于待识别账号与每种标记类型之间的访问时序相似性,可以较为准确地识别账号的标记类型;并且,提供一个或多个访问时序性的统计时间粒度,可以在不同的统计时间粒度下分析待识别账号与每种标记类型之间的访问时序相似性,可以进一步提高识别账号标记类型的准确性。