本发明涉及数据分析,具体涉及一种基于关系图谱的社交网络分析方法。
背景技术:
1、随着网络信息技术突飞猛进的发展,社交网络的普及率与使用率日益提高。互联网成为海量信息的第一集聚地和分发地,也成为开源数据分析的重要来源。互联网用户在社交网站或者各大门户网站平台每天产生大量的网络行为数据。
2、目前企业和有关单位主要使用的互联网社交网络平台每天产生大量的数据,这些数据中包含很多关于关注对象、组织、事件、热点的关键信息。面对如此海量的数据大小和复杂的社交网络关系,通过手工分析的方式已经不能够满足需求。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于关系图谱的社交网络分析方法,克服了现有技术的不足,通过实时采集全网数据形成资料库,自动分析分类构建知识图谱,将智能应用与人工研判相结合,实现情报高效落地。
2、为实现以上目的,本发明通过以下技术方案予以实现:
3、一种基于关系图谱的社交网络分析方法,包括以下步骤:
4、步骤s1:数据采集:通过数据采集引擎完成对目标社交网络平台社交消息数据的快速采集;并根据不同的数据类型存储在数据仓库、全文索引以及图数据库中;
5、步骤s2:重点对象监控:针对实际业务工作中需要关注的关注对象、重点组织、重点网站进行重点监控,以实时掌握目标对象网络动态;
6、步骤s3:关系分析及扩充:通过对指定的社交网络平台账号在步骤s1所采集的数据中进行亲密度计算和人员、组织关系分析,并针对分析结果进行再次的扩线分析,不断完善关系图谱;
7、步骤s4:报表导出推送:采用可视化技术动态呈现关系分析的实际效果,呈现关系分析的结果图谱。
8、优选地,所述步骤s1具体包括以下步骤:
9、步骤s11:采集线路管理;根据需要采集的社交网络平台访问地区以及是否需要加密链路,以初始化采集线路;
10、步骤s12:采集来源管理;配置社交网络平台采集来源;
11、步骤s13:采集爬虫管理;配置采集爬虫,采集爬虫根据实际的可用资源和网络环境进行自定义配置;
12、步骤s14:采集策略管理;配置采集策略,包括分布式采集、指定线路区域采集、指定时间段采集、指定社交平台采集、采集流量达到多少tb自动停止;
13、步骤s15:采集任务执行;在采集任务执行过程中,通过预设的采集线路、采集来源、采集爬虫以及采集策略,执行采集任务;并详细记录采集日志;
14、步骤s16:数据落地和解析;根据采集回来的对象基本信息、对象关注数据、对象粉丝数据、对象发布的帖子、点赞转发评论数据进行解析和存储落地,完成数据采集。
15、优选地,所述步骤s2具体包括以下步骤:
16、步骤s21:关注对象监控;通过对社交网络平台的关注对象添加账号监控,实时获取关注对象发布的动态、关注和粉丝数据的变化、与好友的互动信息;
17、步骤s22:重点组织监控;通过对社交网络平台的重点组织和团体添加账号监控,实时获取重点组织的行为动态、关注和粉丝的变化、与其他组织的互动信息;
18、步骤s23:重点网站监控;通过对公开站点添加网站监控,实时获取网站发布的一些热点新闻、时事评论、突发事件,以及站点访问者对于一些新闻事件的评论和反应情况;
19、步骤s24:监控策略管理;通过对关注对象、重点组织、重点网站进行监控策略配置,完成重点对象监控;
20、步骤s25:监控预警;通过预先配置预警条件、预警关键词、预警方式完成对重点对象监控的结果预警。
21、优选地,所述步骤s24中,监控策略配置包括重点对象监控时间及频率设置和重点对象监控内容设置。
22、优选地,所述步骤s3具体包括以下步骤:
23、步骤s31:关系分析帐号选取;选取一个帐号入口,以这个帐号为初始帐号进行亲密度分析;
24、步骤s32:亲密度设置;支持调整亲密度数值来查看更多或更少的结果图谱;可以根据实际业务需要手动调整关系分析的亲密度;
25、步骤s33:人员、组织关系亲密度分析:通过预设的关系分析帐号选取、亲密度设置,自动查找所有已采集的社交网络平台数据,从中获取与选取帐号有好友粉丝关系、点赞评论转发行为关系的结果图谱并展示;
26、步骤s34:亲密度筛选;如果步骤s33分析的结果图谱过多,可以重新进行亲密度筛选,调大亲密度,减少结果图谱再次分析;如果步骤s33分析的结果图谱较少,通过调小亲密度,增加结果图谱再次分析;
27、步骤s35:关系扩线分析;针对上一次的分析结果,在图谱中找到另一个重点对象,针对该帐号再次进行关系分析,实现对关系分析的扩线分析。
28、优选地,所述步骤s4中关系分析的结果图谱具体包括:
29、支持节点拖拽和动态交互;如果业务需要对某个重点帐号进行分析,通过将该帐号的节点拖拽到空白处,双击该节点进行交互操作;
30、关系分析图表展示采用图数据库的查询;
31、关系分析图表展示支持导出和推送。
32、本发明提供了一种基于关系图谱的社交网络分析方法。具备以下有益效果:通过数据采集引擎,采集线路管理、采集来源管理、采集爬虫管理、采集策略管理、采集任务执行、数据落地和解析,实现对社交网络平台数据的高效采集。通过重点对象监控,实时掌握关注对象、组织的行为动态,自动触发监控预警。通过量化关系亲密度,针对关注对象、组织帐号进行关系亲密度分析,支持亲密度筛选和关系扩线,遍历社交网络平台关系网。并且基于图数据库的关系报表查询展示,可以给用户呈现直观、准确、高效的关系图谱。
1.一种基于关系图谱的社交网络分析方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s1具体包括以下步骤:
3.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s12中,社交网络平台包括但不限于twitter、facebook、youtube、instagram和linkedin。
4.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s2具体包括以下步骤:
5.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s24中,监控策略配置包括重点对象监控时间及频率设置和重点对象监控内容设置。
6.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s3具体包括以下步骤:
7.根据权利要求1所述的一种基于关系图谱的社交网络分析方法,其特征在于:所述步骤s4中关系分析的结果图谱具体包括: