网络社区的挖掘方法及装置与流程

文档序号:12465075阅读:来源:国知局

技术特征:

1.一种网络社区的挖掘方法,其特征在于,包括:

获取以弹性分布式数据集合RDD形式存储的原始网络社区,以及所有前次挖掘得到的前次挖掘网络社区;

获取与所述原始网络社区中的成员存在通联关系的初步网络社区成员,并以RDD形式将所有初步网络社区成员存储为初步网络社区;

获取所有一个成员属于所述初步网络社区,另一个成员属于所述初步网络社区,或者所述原始网络社区,或者所述前次挖掘网络社区的目标通联关系,并以RDD形式将所述目标通联关系所涉及的网络社区成员存储为泛化网络社区;

获取所述泛化网络社区与所述原始网络社区及所述前次挖掘网络社区之间的差集,并以RDD形式将所述差集中的成员存储为目标网络社区;

重复上述挖掘操作,直至所述目标网络社区的规模维持稳定,或者目标网络社区达到预定规模,或者所述挖掘操作的次数达到挖掘次数上限。

2.根据权利要求1所述的方法,其特征在于,所述通联关系表示:一个成员与另一个成员之间存在关联。

3.根据权利要求2所述的方法,其特征在于,所述关联包括:所述一个成员与所述另一个成员之间存在通讯联系。

4.根据权利要求1至3任一所述的方法,其特征在于,还包括:

在获取以RDD形式存储的原始网络社区,以及前次挖掘得到的前次挖掘网络社区之前,通过数据挖掘技术,以流式处理框架挖掘成员真实身份数据,以及成员通联关系数据。

5.根据权利要求4所述的方法,其特征在于,还包括:

在完成所述挖掘操作之后,根据成员之间的通联关系对所述目标网络社区的成员打分,以挖掘所述目标网络社区中的核心成员。

6.一种网络社区的挖掘装置,其特征在于,包括:

原始获取模块,用于获取以弹性分布式数据集合RDD形式存储的原始网络社区,以及所有前次挖掘得到的前次挖掘网络社区;

初步获取模块,用于获取与所述原始网络社区中的成员存在通联关系的初步网络社区成员,并以RDD形式将所有初步网络社区成员存储为初步网络社区;

泛化获取模块,用于获取所有一个成员属于所述初步网络社区,另一个成员属于所述初步网络社区,或者所述原始网络社区,或者所述前次挖掘网络社区的目标通联关系,并以RDD形式将所述目标通联关系所涉及的网络社区成员存储为泛化网络社区;

目标获取模块,用于获取所述泛化网络社区与所述原始网络社区及所述前次挖掘网络社区之间的差集,并以RDD形式将所述差集中的成员存储为目标网络社区;

重复执行模块,用于重复上述挖掘操作,直至所述目标网络社区的规模维持稳定,或者目标网络社区达到预定规模,或者所述挖掘操作的次数达到挖掘次数上限。

7.根据权利要求6所述的方法,其特征在于,所述通联关系表示:一个成员与另一个成员之间存在关联。

8.根据权利要求7所述的方法,其特征在于,所述关联包括:所述一个成员与所述另一个成员之间存在通讯联系。

9.根据权利要求6至8任一所述的方法,其特征在于,还包括:

原始数据挖掘模块,用于在获取以RDD形式存储的原始网络社区,以及前次挖掘得到的前次挖掘网络社区之前,通过数据挖掘技术,以流式处理框架挖掘成员真实身份数据,以及成员通联关系数据。

10.根据权利要求9所述的方法,其特征在于,还包括:

核心成员挖掘模块,用于在完成所述挖掘操作之后,根据成员之间的通联关系对所述目标网络社区的成员打分,以挖掘所述目标网络社区中的核心成员。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1