基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统的制作方法

文档序号:6637095阅读:490来源:国知局
基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统的制作方法
【专利摘要】本发明涉及一种基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统,其特征在于包括:对用户输入数据进行预处理,从输入数据提取关键信息;构建社交网络图模型;设置参数;运行社团发现算法;输出发现的结果,列出犯罪嫌疑人员,本发明与现有技术相比,具有以下有益效果:能够从给定的犯罪嫌疑人社交圈内发现潜在的关联犯罪嫌疑人,方法性能好,系统运行快,同时考虑了真实场景的需求,在用户指定的范围进行分析,具有良好的扩展性。
【专利说明】基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统

【技术领域】
[0001] 本发明涉及公安犯罪网络分析【技术领域】,具体地说是一种能够根据已知罪犯的 社交网络数据挖掘相关联犯罪嫌疑人的基于社交网络分析的犯罪嫌疑人挖掘关联方法及 系统。

【背景技术】
[0002] 人类是天然的社会性生物,因此人类的行为也自然的带有社会性。选择、行动等这 些人类的行为都根植于庞大的社会环境中。因此,研究社交网络在犯罪行为中的作用也成 为了犯罪学研究领域的一个重要课题。已有的研究表明,社交网络在团伙犯罪行为中起到 了重要的辅助作用。此外,犯罪社交网络并不是分离的,而是由一系列的社团交织而成。对 于公安部门的决策者来说,从社交网络中挖掘犯罪信息变得越来越重要。
[0003] 随着犯罪网络分析的需求不断增长,社交网络分析技术越来越多的应用于犯罪分 析过程。社交网络分析是一种社会科学方法,包含了一系列的量化准则和良好的量化展示, 借助这个方法,办案人员能够快速的挖掘发现隐藏在深处的破案线索。在社交网络分析中, 社团发现是一个至关重要的问题。社团发现可以帮助发现一些潜在的组织模块,这对公安 部门侦破团伙作案可以起到很好的辅助作用。社团发现会将网络分成几个子网络,每个子 网络内部的点联系紧密,而不同子网络之间的点联系松散。经过社团发现算法处理后,一个 犯罪团伙有很大可能会被分到同一个子网络里,这为办案人员排查犯罪嫌疑人提供了极大 的便利。
[0004] 目前学术界关于社团发现已经有大量的算法成果,但是这些算法多是过于理论 化,并没有结合实际应用场景做特定的优化,尤其是针对警用犯罪分析方面的优化更少。公 安部门人力有限,只能在一定人员范围内进行嫌犯排查,所以社团发现算法输出的结果必 须要满足现实需求才能真的起到有益作用。在案件侦破中,初始阶段一般会有特定的几个 嫌疑人目标,所以只需要针对特定的嫌疑人,关注局部的社交网络分析,将初始确定的嫌疑 人所在的社团找出来即可。另外,社交网络分析中的社团发现结果该如何输出展现才能更 好的辅助办案人员也没有很好的解决方案。


【发明内容】

[0005] 本发明针对现有技术中存在的缺点和不足,提出了一种能够根据已知罪犯的社交 网络数据挖掘相关联犯罪嫌疑人的基于社交网络分析的犯罪嫌疑人挖掘关联方法及系统。
[0006] 本发明可以通过以下措施达到: 一种基于社交网络分析的犯罪嫌疑人挖掘关联方法,其特征在于包括以下步骤: 步骤1:对数据中的每个人分配一个唯一的id,统计计算人与人之间的关联信息,给每 个关联赋予权重,然后对用户输入数据进行预处理,从输入数据提取关键信息; 步骤2:构建社交网络图模型,根据第一步提取的信息,将每个人抽象成网络图中的一 个节点,将人与人之间的关联抽象成网络图中的边,所述社交网络是一个图论模型,模型表 达如下: G = (V1E),其中G表示社交网络,V表示网络中的点,E表示网络中的边; 步骤3 :设置参数,参数包括两个,重点目标人员对应的网络点集合C,社团所能包含的 点的个数上限阈值A,根据实际的情况,设置一个或者多个重点目标人员,在社交网络中找 到这些人对应的节点,还可以选择设置一个阈值,用于控制最终输出的社团大小, 步骤4:运行社团发现算法,对社交网络进行划分,根据用户预设的重点目标人员,在 满足阈值条件的情况下进行层次聚类,直到满足算法的终止条件,其中运行的社团发现算 法采用层次聚类的方法,算法过程中使用模块度作为度量标准,模块度的定义如下:

【权利要求】
1. 一种基于社交网络分析的犯罪嫌疑人挖掘关联方法,其特征在于包括以下步骤: 步骤1:对数据中的每个人分配一个唯一的id,统计计算人与人之间的关联信息,给每 个关联赋予权重,然后对用户输入数据进行预处理,从输入数据提取关键信息; 步骤2:构建社交网络图模型,根据第一步提取的信息,将每个人抽象成网络图中的一 个节点,将人与人之间的关联抽象成网络图中的边,所述社交网络是一个图论模型,模型表 达如下: G= ,其中G表示社交网络,v表示网络中的点,E表示网络中的边; V * ? 步骤3 :设置参数,参数包括两个,重点目标人员对应的网络点集合C,社团所能包含的 点的个数上限阈值A,根据实际的情况,设置一个或者多个重点目标人员,在社交网络中找 到这些人对应的节点,还可以选择设置一个阈值,用于控制最终输出的社团大小, 步骤4:运行社团发现算法,对社交网络进行划分,根据用户预设的重点目标人员,在 满足阈值条件的情况下进行层次聚类,直到满足算法的终止条件,其中运行的社团发现算 法采用层次聚类的方法,算法过程中使用模块度作为度量标准,模块度的定义如下:
其中表示点i和点j之间的边的权重:
是所有与点i相连的 边的权重之和,表示点i所属的社团,如果
函数为1,否则
,是归一化因子; 步骤5 :输出发现的结果,列出犯罪嫌疑人员。
2. 根据权利要求1所述的一种基于社交网络分析的犯罪嫌疑人挖掘关联方法,其特征 在于步骤4中运行社团发现算法具体步骤如下:输入:社交网络图模型G= (V,E), 重点目标人员集合Czlcpc2,c3, ......ck}, 权重数组W={wi,w2,w3, ......wm},m为E中边的条数, 社团规模阈值X; 输出:社团集合P={Pi,p2,p3,......,pn}, 开始 初始时每个网络节点是一个单独的社团,即P={PiIViGppViGV}; 定义|P|为集合P包含的社团的个数,定义|v|为集合V包含的点的个数,循环开始: 对于
对于j= 1 4 |尸|, 如果满足阈值A,算法结束; 将点Vi从原来的社团移除,加入新的社团IV计算模块度的变化AQ,并记录,找到找到A Q大于0且值最大的操作并执行,如果不存在大于0的A Q,则进行下一轮循环; 如果本次循环没有任何操作,算法结束; 对于本次循环得到的社团集合P={Pl,P2,P3,……,Pt},将P中的每个社团看成一个点, 将不同的社团之间的链接及权重统一合并计算为一条带权重的边,这样得到了一个新的社 交网络图'=z 以及一个新的权重向量_+y '重新开始循环 过程。
3. -种基于社交网络分析的犯罪嫌疑人挖掘关联系统,其特征在于设有依次串联的用 于完成关键信息抽取的数据分析和提取模块;用于将结构化数据抽象为网络图模型的社交 网络构建模块;用于对社交网络进行划分的社团发现模块;以及用于将初始指定目标所在 的社团按照一定的规则输出的结果输出及展示模块。
【文档编号】G06F17/30GK104408149SQ201410726472
【公开日】2015年3月11日 申请日期:2014年12月4日 优先权日:2014年12月4日
【发明者】孙圣鹏, 张玉超, 高明, 张友春, 向俊敏, 夏俊玲 申请人:威海北洋电气集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1