社交网络上可疑账号的检测方法及装置

文档序号:31036105发布日期:2022-08-06 03:11阅读:164来源:国知局
社交网络上可疑账号的检测方法及装置

1.本发明涉及网络舆情治理领域,具体为一种社交网络上可疑账号的检测方法及装置。


背景技术:

2.目前,社交网络上,海量正常用户中掺杂着可疑账号,这些账号或单独行动或协同作案,频频散布不实或有害信息,制造舆情事件,严重影响正常网络空间秩序,为网络舆情治理提出严重挑战,急需构建有效的方法检测和治理这些可疑账号。
3.为此,各大社交平台纷纷设置专门团队,负责网上账号管理处置。但恶意账号往往行动隐密,混杂于海量正常用户之中,使检测如大海捞针,同时这些账号负责炒作的舆情事件又随时变换,这使得有效的账号处置困难重重。
4.为解决以上问题,有多个团队探索采用各种机器学习技术,利用历史行为数据或内容数据等,训练人工智能模型,构建自动的账号检测方法。但恶意账号往往会主动调整和伪装自身行为,躲避模型检测。这就使得单纯依赖对历史数据做训练的各类模型方法效果不佳。


技术实现要素:

5.为了克服现有的对隐密可疑账号检测方法的不足,本发明提供一种检测社交网络上可疑账号的检测方法。
6.为实现上述目的,本发明采用如下技术方案:
7.一种社交网络上可疑账号的检测方法,所述方法包括:
8.针对待检测账号集合,获取各待检测账号i的特征;
9.计算各特征j的特征异常值其中t为检测次数,表示待检测账号i的第j个特征为正常;
10.根据人工确定的可疑账号的相应的特征异常值变化,来动态更新异常值权重
11.基于所述特征异常值与异常值权重计算待检测账号i的账号异常值并根据账号异常值大小排序,构建第t次检测的可疑账号推荐列表b
t

12.判断所述可疑账号推荐列表b
t
中的可疑账号是否稳定:
13.当稳定时,将所述可疑账号推荐列表b
t
提交由人工审核;
14.当不稳定时,返回至所述计算各特征j的特征异常值以判断可疑账号推荐列表b
(t+1)
中的可疑账号是否稳定。
15.进一步地,所述根据人工确定的可疑账号的相应的特征异常值变化,来动态更新异常值权重包括:
16.管理员审核可疑账号推荐列表b
(t)
,得到可疑账号列表v
(t)
,作为可疑账号检测结
果;
17.基于第t-1次与第t次检测之间,由人工审核确定的可疑账号的非零特征异常值的变化,计算特征j的异常值方差
18.获取第t-1次检测时,由人工确定的可疑账号的特征j的异常值权重与异常值方差并结合所述异常值方差计算第t次检测时特征j的异常值权重
19.计算可疑账号列表v
(t)
中特征j的特征异常值均值;
20.针对所述特征异常值均值最小的特征项,将相应的异常值权重乘以一个小于1的衰减系数,以更新该特征的异常值权重
21.进一步地,所述方法,还包括:
22.管理员审核所述检测结果,并将审核通过后的可疑账号作为种子;
23.将所述种子的账号异常值按节点度做扩散,以更新其它账号异常值;
24.根据所述其它账号的账号异常值构建新可疑账号推荐列表并提交至管理员审核,得到进一步的可疑账号检测结果。
25.进一步地,所述待检测账号i的特征包括:账号名称、账号活跃度、账号行为协同度、账号帖子相似度、账号帖子内容关键词、账号帖子内容话题、账号帖子链接、账号帖子多媒体内容、账号全网络范围内容流行度、账号全网络范围行为协同度、账号网络地址、账号历史处置信息、账号社、账号朋友和账号发帖回帐比中的一种或多种。
26.进一步地,计算所述账号活跃度的特征异常值包括:
27.统计历史周期内的各设定时段中的账号活跃度,所述账号活跃度包括:在线时长、发帖数和回帖数;
28.统计最近设定时段中的账号活跃度;
29.将所述最近设定时段中的账号活跃度与所述历史周期内的各设定时段中的账号活跃度进行比较,得到所述账号活跃度的特征异常值
30.进一步地,计算账号帖子相似度的特征异常值包括:
31.获取一预训练语言模型;
32.基于所述预训练语言模型,分别获取待检测账号i的帖子与敏感帖子的内容向量;
33.匹配待检测账号i的帖子与敏感帖子的内容向量,得到所述账号帖子相似度的特征异常值
34.进一步地,计算账号帖子链接的特征异常值包括:
35.构建异常链接库;
36.获取所述待检测账号i的链接地址;
37.将所述链接地址与异常链接库进行匹配,得到所述账号帖子链接的特征异常值
38.进一步地,计算账号全网络范围行为协同度的特征异常值包括:
39.构建活跃异常账号库,所述活跃异常账号库包含若干活动异常账号;
40.基于所述待检测账号i与所述活动异常账号,构建行为矩阵;
41.对所述行为矩阵进行协同度分析,得到所述账号全网络范围行为协同度的特征异常值
42.进一步地,计算账号社团的特征异常值包括:
43.获取所述待检测账号i所在的社团;
44.将社团成员的账号异常值均值作为所述账号社团的特征异常值其中,当所述待检测账号i处于多社团时,将各社团的账号异常值均值累加后,乘以一个第二衰减系数,得到所述账号社团的特征异常值
45.一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一所述方法。
46.一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一所述方法。
47.与现有技术相比,本发明利用人工参与,规避现有方法对基于历史数据训练的模型的过分依赖,有利于发现隐密伪装的问题账号。
附图说明
48.图1本发明检测方法的流程图。
具体实施方式
49.为使本发明的上述特征和优点能更明显易懂,下面通过具体实施例,对本发明的技术方案做进一步说明。
50.本发明的技术方案是:
51.一,为各账号设置账号异常值。规定异常值为0表示账号正常,异常值越大可疑性越高。其中,账号异常值计算方法:1,根据平台具体情况,设定可提取的账号特征集,如,账号登陆发帖回帖等行为特征、账号帖子话题标签等内容特征和音视频等多媒体特征、账号朋友社团等社交关系特征,计算各特征的异常值,同样规定,异常值为0表示特征正常,异常值越大可疑性越高;2,计算账号异常值,账号异常值为账号各特征的异常值的加权和。其中,各特征权重,默认值设为1,后续,运行期间,采用人机交互方式调整更新。具体,由系统给出推荐的更新值,由管理员审核更新。
52.二,周期性计算各账号异常值,并根据异常值大小排序,将异常值偏高的账号集合,作为推荐的可疑账号集,提供给系统管理员人工审核,确定可疑账号以备后续处理,同时系统根据审核结果,计算出各特征可能合适的权重更新值,再次提交管理员人工审核,并由管理员调整各特征异常值的权重。
53.三,系统根据人工审核结果,把可疑账号设定为种子集,在由账号组成的网络上对其它账号做账号可疑性推断。并将可疑性高的账号集合,提交人工审核确定可疑账号。之后
由管理员决定,是否启动新一轮账号可疑性推断。若启动,则系统把新审核结果加入种子集合,做新一轮推断。
54.如图1流程图所示,(1)系统初始化,准备账号特征数据、各种资源库和对应的特征异常值计算模块;(2)周期性计算各账号异常值,多轮统计,构建可疑账号推荐列表,以待提交管理员审核,本部分包括三部分,(2.1)计算账号各个特征的异常值,(2.2)计算各账号异常值,账号异常值为账号各特征的异常值的加权和,(2.3)账号异常值排序,统计异常值偏高的账号,构建可疑账号推荐列表;(3)提交可疑账号列表,以待管理员审核,提交特征权重更新值,以待管理员审核;(4)根据人工审核结果,推断其他账号可译性;(5)提交新的可疑账号列表由管理员审核。
55.(1)系统初始化,
56.准备账号特征数据、各种资源库(如关键词库、关键标签库、异常链接库、图片特征向量库、媒体向量库、异常网络地址库等)和对应的特征异常值计算模块。
57.(2)周期性计算各账号异常值,多轮统计,构建可疑账号推荐列表,以待提交管理员审核,本部分包括三部分,
58.(2.1)计算账号各个特征的异常值,
59.1,账号名称异常,
60.异常值为0表示特征正常,异常值越大可疑性越高,按特殊模式字符串,判断是否异常,对应构造异常模式库,比如全数字串,或数字开头串,或其它特殊字符串模式,
61.2,账号活跃度异常,
62.异常值为0表示特征正常,异常值越大可疑性越高,记录近一个时间窗口长度,可人工设置长度,比如最近一个月每小时在线时长,发帖回帖数,统计近一个小时数值,和近一个月数值,比较,当次数突然增加,为异常,
63.3,账号行为协同度异常,
64.异常值为0表示特征正常,异常值越大可疑性越高,统计账号与朋友账号活跃度一致性,如果一致性高,为异常,
65.4,账号帖子相似度异常,
66.异常值为0表示特征正常,异常值越大可疑性越高,用预训练语言模型生成帖子内容向量,与敏感帖子内容向量相似度匹配,判定异常,
67.5,账号帖子内容关键词异常,
68.词典匹配,异常值为0表示特征正常,异常值越大可疑性越高,
69.6,账号帖子内容话题异常,
70.对帖子文本内容做话题分析,同4,帖子内容向量敏感度分析,异常值为0表示特征正常,异常值越大可疑性越高,
71.7,账号帖子链接异常,
72.链接分析,构建异常链接库,匹配到,为异常,
73.8,账号帖子多媒体内容异常,
74.媒体分析,利用图片、音频、视频等分析模型,分别做敏感度分析,异常值为0表示特征正常,异常值越大可疑性越高,
75.9,账号全网络范围内容流行度异常,
76.序列分析,帖子与全网热帖做内容向量匹配分析,匹配到为异常,
77.10,账号全网络范围行为协同度异常,
78.矩阵分析,采样构建维护活跃异常账号库,用当前账号与活跃异常账号构建行为矩阵做协同度分析,异常值为0表示特征正常,异常值越大可疑性越高,
79.11,账号网络地址异常,
80.构建异常网络地址库,匹配到为异常,
81.12,账号历史处置信息,
82.维护对账号状态判定的历史信息库,取值为历史异常打分值,乘以一个大于0小于1的衰减系数,
83.13,账号社团异常,
84.社团分析,周期更新账号社团分析结果,按社团成员账号异常值均值,设定为,社团异常值,账号处于多社团,本项为累加值,乘以一个大于0小于1的衰减系数,
85.14,账号朋友异常,
86.同13,按朋友账号异异常值均值,设定该值,乘以一个大于0小于1的衰减系数,
87.15,账号发帖回帐比异常,
88.计算账号近一小时发回帖比值与本帖号历史均值,明显波动为异常,
89.(2.2)计算各账号异常值,
90.账号异常值为账号各特征的异常值的加权和。其中,各特征权重,默认值设为1,后续运行期间,采用人机交互方式调整更新。由系统给出推荐的更新值,
91.其中,计算所述更新值的过程包括:
92.(1)计算上次权重更新到当前时间点,各特征非0异常值的方差变化,用权重原值乘以新方差和老方差的比值,作为更新值;
93.(2)统计本轮人工审核过程中核准的所有可疑账号,计算这些账号各个特征异常值的均值,找出特征异常值均值最小的特征项,将特征对应的权重更新值,乘以一个大于0小于1的衰减系数。
94.(2.3)账号异常值排序,统计异常值偏高的账号,构建可疑账号推荐列表;
95.采用堆排序算法对账号做异常值排序,每次统计异常值偏高的1-5%的账号,多轮计算(2.1)计算账号各个特征的异常值,和(2.2)计算各账号异常值,统计稳定处于账号异常值前1%的账号集合,构建可疑账号推荐列表,以待后续管理员审核;
96.(3)管理员审核可疑账号与特征权重
97.提交可疑账号列表与特征权重,由管理员审核;
98.(4)根据人工审核结果,推断其他账号可译性
99.以可疑异常账号作种子找其它异常账号,在账号网络上做可疑度扩散,具体是把,可疑账号异常值按节点度做扩散,填加其它账号,当遇到其它可疑账号,跳过,之后重新计算其它账号异常值,(此处,只用当前特征权重计算账号异常值,不作特征权重更新),重新做异常值排序,对异常值偏高1%账号,构建新的可疑账号推荐列表,以待管理员审核;
100.(5)提交新的可疑账号列表由管理员审核
101.提交人工审核确定可疑账号,由管理员决定,是否启动新一轮账号可疑性推断。若启动,则系统把新审核结果加入种子集合,做新一轮推断。
102.以上实施例仅用以说明本发明的技术方案而非对其进行限制,本领域的普通技术人员可以对本发明的技术方案进行修改或者等同替换,本发明的保护范围应以权利要求所述为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1