社群画像构建方法、装置、设备及存储介质与流程

文档序号:21634176发布日期:2020-07-29 02:44阅读:247来源:国知局
社群画像构建方法、装置、设备及存储介质与流程

本发明涉及人工智能的群体画像技术领域,尤其涉及一种社群画像构建方法、装置、设备及存储介质。



背景技术:

在客户关系管理场景中,为实现通过社群进行营销推广,一般需要对社群进行分组或特征分析等处理,目前采用机器学习技术实现社群分组和用户购买预测,然而通过机器学习技术存在模型准确性难以验证、也无法通过社群用户实现自发性传播推广。此外,还采用人工方式进行手动构建社群或分析社群特征,然而通过人工方式造成成本居高。因此,目前进行社群营销推广分析方式存在局限性,社群营销推广分析的效率和效果不足。



技术实现要素:

本发明的主要目的在于解决现有社群营销推广分析方式存在局限性的问题,以提高社群营销推广分析的效率和效果。

为实现上述目的,本发明第一方面提供了一种社群画像构建方法,包括:

根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像;

计算每一个所述社群的用户规模、每一个所述社群内每一个用户的关系数以及每一个所述用户的连通三角形数,所述用户规模为社群内用户的数量,所述关系数为目标用户与其它用户连接的数目,所述连通三角形数为目标用户与其它用户连接形成的三角形的个数,所述连通三角形数用于衡量所述目标用户与其它用户的紧密程度;

对每一个所述社群对应的关系数进行求和,得到每一个所述社群对应的关系数总数;

对每一个所述社群对应的连通三角形数进行求和,得到每一个所述社群对应的连通三角形总数,所述连通三角形总数用于衡量所述目标用户所在社群的用户紧密程度;

根据所述用户规模、关系数总数以及连通三角形总数,计算得到每一个所述社群对应的社群紧密度,所述社群紧密度用于衡量所述社群内成员的关联程度;

根据所述社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

可选的,在本发明第一方面的另一种实现方式中,在所述根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像之后,包括:

计算每一个所述用户的发散度,所述发散度为目标用户作为发射节点与其它用户连接的关系数,所述发散度用于衡量所述目标用户传播信息的能力;

将每一个所述社群内每一个用户的发散度进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第一方面的另一种实现方式中,在所述根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像之后,还包括:

计算每一个所述用户的接收度,所述接收度为目标用户作为接收节点与其它用户连接的关系数,所述接收度用于衡量所述目标用户接收信息的能力;

将每一个所述社群内每一个用户的接收度进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第一方面的另一种实现方式中,在对每一个所述社群对应的连通三角形数进行求和,得到每一个所述社群对应的连通三角形总数,所述连通三角形总数用于衡量所述目标用户所在社群的用户紧密程度之后,还包括:

将每一个所述社群内每一个用户的连通三角形数进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第一方面的另一种实现方式中,在所述根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像之前,包括:

对所述预置社群关系网络进行切分,并去除不同社群之间的关联信息,所述关联信息为某一目标社群与其它社群之间用户连接的关联数据。

可选的,在本发明第一方面的另一种实现方式中,在所述根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像之后,还包括:

将每一个所述社群中的孤立用户剔除,所述孤立用户作为发射节点与其它用户连接的关系数为0,所述孤立用户作为接收节点与其它用户连接的关系数为0。

可选的,在本发明第一方面的另一种实现方式中,在所述根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像之前,还包括:

获取用户数据,所述用户数据包括用户节点数据和用户关联数据,所述用户节点数据包括用户画像;

将所述用户数据导入数据仓库;

读取所述数据仓库中的用户节点数据和用户关联数据,并构建得到对应的预置社群关系网络。

本发明第二方面提供了一种社群画像构建装置,包括:

社群分组模块,用于根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像;

计算模块,用于计算每一个所述社群的用户规模、每一个所述社群内每一个用户的关系数以及每一个所述用户的连通三角形数,所述用户规模为社群内用户的数量,所述关系数为目标用户与其它用户连接的数目,所述连通三角形数为目标用户与其它用户连接形成的三角形的个数,所述连通三角形数用于衡量所述目标用户与其它用户的紧密程度;

关系数总数获取模块,用于对每一个所述社群对应的关系数进行求和,得到每一个所述社群对应的关系数总数;

连通三角形总数获取模块,用于对每一个所述社群对应的连通三角形数进行求和,得到每一个所述社群对应的连通三角形总数,所述连通三角形总数用于衡量所述目标用户所在社群的用户紧密程度;

社群紧密度模块,用于根据所述用户规模、关系数总数以及连通三角形总数,计算得到每一个所述社群对应的社群紧密度,所述社群紧密度用于衡量所述社群内成员的关联程度;

社群画像排序模块,用于根据所述社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

发散度计算模块,用于计算每一个所述用户的发散度,所述发散度为目标用户作为发射节点与其它用户连接的关系数,所述发散度用于衡量所述目标用户传播信息的能力;

第一用户画像排序模块,用于将每一个所述社群内每一个用户的发散度进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

接收度计算模块,用于计算每一个所述用户的接收度,所述接收度为目标用户作为接收节点与其它用户连接的关系数,所述接收度用于衡量所述目标用户接收信息的能力;

第二用户画像排序模块,用于将每一个所述社群内每一个用户的接收度进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

第三用户画像排序模块,用于将每一个所述社群内每一个用户的连通三角形数进行从大到小排序,并按排序顺序将每一个所述用户的用户画像进行排序。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

关系网络切分模块,用于对所述预置社群关系网络进行切分,并去除不同社群之间的关联信息,所述关联信息为某一目标社群与其它社群之间用户连接的关联数据。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

孤立用户剔除模块,用于将每一个所述社群中的孤立用户剔除,所述孤立用户作为发射节点与其它用户连接的关系数为0,所述孤立用户作为接收节点与其它用户连接的关系数为0。

可选的,在本发明第二方面的另一种实现方式中,所述社群画像构建装置,还包括:

用户数据获取模块,用于获取用户数据,所述用户数据包括用户节点数据和用户关联数据,所述用户节点数据包括用户画像;

用户数据导入模块,用于将所述用户数据导入数据仓库;

预置社群关系网络构建模块,用于读取所述数据仓库中的用户节点数据和用户关联数据,并构建得到对应的预置社群关系网络。

本发明第三方面提供了一种社群画像构建设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互联;所述至少一个处理器调用所述存储器中的所述指令,以使得所述社群画像构建设备执行上述第一方面所述的方法。

本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。

本发明提供的技术方案中,根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个所述社群都有对应的社群画像,每一个所述用户都有对应的用户画像;计算每一个所述社群的用户规模、每一个所述社群内每一个用户的关系数以及每一个所述用户的连通三角形数;对每一个所述社群对应的关系数进行求和,得到每一个所述社群对应的关系数总数;对每一个所述社群对应的连通三角形数进行求和,得到每一个所述社群对应的连通三角形总数;根据所述用户规模、关系数总数以及连通三角形总数,计算得到每一个所述社群对应的社群紧密度;根据所述社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。本发明实施例通过对社群关系网络中的用户进行社群分组,并计算获取每一个社群的用户规模、关系数总数以及连通三角形总数,从而计算得出每一个所述社群对应的社群紧密度,用于衡量社群内成员的关联程度,并根据所述社群紧密度从大到小的顺序,将社群关系网络中的每一个社群对应的社群画像进行排序,从而实现将海量的社群画像进行自动化构建,并且根据社群紧密度进行排序,可以根据社群画像找出具有优秀推广能力的社群,提高了社群营销推广分析的效率和效果。

附图说明

图1为本发明实施例中社群画像构建方法的一个实施例示意图;

图2为本发明实施例中社群画像构建方法的另一个实施例示意图;

图3为本发明实施例中社群画像构建装置的一个实施例示意图;

图4为本发明实施例中社群画像构建装置的另一个实施例示意图;

图5为本发明实施例中社群画像构建设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种社群画像构建方法、装置、设备及存储介质,用于提高社群画像构建的精确度和识别效率。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中社群画像构建方法的一个实施例包括:

101、根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个社群都有对应的社群画像,每一个用户都有对应的用户画像。

具体的,服务器根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个社群都有对应的社群画像,每一个用户都有对应的用户画像;社群标签可以根据具体需求进行设置,采用不同的数字标识或数字字母结合的标识以区分,在此不作限定,譬如三个社群分别用“1”、“2”“3”这三个社群标签进行标识区分。

进一步地,可以预先构建预置社群关系网络,因而在步骤101之前,包括:

获取用户数据,用户数据包括用户节点数据和用户关联数据,用户节点数据包括用户画像;

将用户数据导入数据仓库;

读取数据仓库中的用户节点数据和用户关联数据,并构建得到对应的预置社群关系网络。

具体的,服务器通过先获取用户数据,用户数据包括用户节点数据和用户关联数据,用户节点数据包括用户画像。具体实施时,用户数据来源不作限定,可以为社交场景的微信用户数据,也可以为金融场景的交易用户数据。并且,用户节点数据、用户关系数据的表示方式也不作限定,譬如用户节点数据可以表示为:id,age,sex,其中第一列为用户的唯一标识,如“id”表示身份证号,其余列为用户的属性,如“age”、“sex”表示年龄、性别。用户关系数据可以表示为:id1,id2,type,其中第一列为源用户唯一标识,第二列为目标用户唯一标识,第三列为关系类型,譬如“type”为“关注”,则表示标识为id1的用户关注了标识为id2的用户。

进一步地,服务器通过集群计算平台apachespark中的graphx模块,将用户数据导入数据仓库;并通过graphx模块的预置graph函数,即采用graphx模块的部分功能和scala语言编写预置graph函数,以自动读取数据仓库中的用户节点数据和用户关联数据,并构建得到对应的预置社群关系网络,该预置社群关系网络内包括了众多性质及来源不同的用户数据,构建社群关系网络为实现针对社群的营销推广作出重要基础。

进一步地,在步骤101之前,还包括:

对预置社群关系网络进行切分,并去除不同社群之间的关联信息,关联信息为某一目标社群与其它社群之间用户连接的关联数据。

本实施例中,服务器还将社群关系网络进行切分,并去除不同社群之间的关联信息,关联信息为某一目标社群与其它社群之间用户连接的关联数据。

具体的,在客户关系场景中,通常需要了解哪些人属于同一社群,这样可以通过某一人向其他人推送消息。并且社群关系网络内包括了众多性质及来源不同的用户数据,需要区分具有相同属性或来源的用户,并将具有相同属性或来源的用户归为一个社群,因此需要根据情况对社群关系网络进行切分。并且由于社群和社群之间的关系脆弱,并没有营销推广的意义,因此需要去除不同社群之间的关联信息,因此在进行社群画像构建时,需要将这些不同社群之间的关联信息进行剔除,也进一步地提高了社群画像构建的准确性和质量,从而提高针对社群的营销推广分析的准确性及质量。

进一步地,在步骤101之前,还包括:

将每一个社群中的孤立用户剔除,孤立用户作为发射节点与其它用户连接的关系数为0,孤立用户作为接收节点与其它用户连接的关系数为0。

具体的,服务器还通过graphx模块的预置graph函数,将每一个社群中的孤立用户剔除,其中,孤立用户作为发射节点与其它用户连接的关系数为0,孤立用户作为接收节点与其它用户连接的关系数为0。具体的,孤立用户是指该用户与其他用户不存在任何连接关系,即在用户节点数据中存在该用户,但不在用户关联数据中不存在该用户,譬如用户节点数据中用户集合{id1,id2,id3},用户关联数据中用户集合{id1,id2},那么孤立用户为{id1,id2,id3}-{id1,id2}={id3}。本发明可以通过在graphx模块中独立编写的预置graph函数自动从将该孤立用户剔除。因此在进行社群画像构建时,需要将这些社群内的所有孤立用户进行剔除,也进一步地提高了社群画像构建的准确性和质量,从而提高针对社群的营销推广分析的准确性及质量。

102、计算每一个社群的用户规模、每一个社群内每一个用户的关系数以及每一个用户的连通三角形数,用户规模为社群内用户的数量,关系数为目标用户与其它用户连接的数目,连通三角形数为目标用户与其它用户连接形成的三角形的个数,连通三角形数用于衡量目标用户与其它用户的紧密程度。

具体的,服务器在计算用户规模时,采用集群计算平台apachespark中的graphx模块的graph.vertices.count函数,计算每一个社群的用户规模,用户规模为社群内用户的数量,用户规模越大说明目标社群的用户越多,表明在该目标社群内进行营销推广的潜力越大。

服务器在计算每一个用户的关系数时,采用集群计算平台apachespark中的graphx模块的graph.edges.count函数,计算每一个社群内每一个用户的关系数,关系数为目标用户与其它用户连接的数目,关系数越大说明目标用户与其它用户的连接数目越多,也表明该目标用户对外的传播推广潜力越大。

服务器在计算每一个用户的连通三角形数时,采用集群计算平台apachespark中的graphx模块的graph.trianglecount函数,计算每一个用户的连通三角形数,连通三角形数为目标用户与其它用户连接形成的三角形的个数,连通三角形数用于衡量目标用户与其它用户的紧密程度,连通三角形数越大说明目标用户与其它用户的紧密程度越强,该目标用户的传播推广能力越强。

103、对每一个社群对应的关系数进行求和,得到每一个社群对应的关系数总数。

进一步地,服务器采用求和算法对每一个社群对应的关系数进行求和,得到每一个社群对应的关系数总数。

104、对每一个社群对应的连通三角形数进行求和,得到每一个社群对应的连通三角形总数,连通三角形总数用于衡量目标用户所在社群的用户紧密程度。

进一步地,服务器采用求和算法对每一个社群对应的连通三角形数进行求和,得到每一个社群对应的连通三角形总数,连通三角形总数用于衡量目标用户所在社群的用户紧密程度。

105、根据用户规模、关系数总数以及连通三角形总数,计算得到每一个社群对应的社群紧密度,社群紧密度用于衡量社群内成员的关联程度。

进一步地,服务器在上述计算出每一个社群的用户规模、关系数总数以及连通三角形总数后,则可以根据用户规模、关系数总数以及连通三角形总数,计算得到对应的社群紧密度,社群紧密度用于衡量社群内成员的关联程度。该社群紧密度具体计算公式如下:

其中,union为社群紧密度,e为连通三角形总数,k为关系数总数,union的取值区间为[0,1],当union的值为1时,表示这个对应的社群最紧密,社群内成员的关联程度最好。

106、根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

进一步地,服务器根据上述步骤105计算得出的社群紧密度,根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序,从而实现将海量的社群画像进行自动化构建,并且根据社群紧密度进行排序,可以根据社群画像找出具有优秀推广能力的社群,提高社群营销推广分析的效率和效果。

由上述可见,本发明方法实施例通过对社群关系网络中的用户进行社群分组,并计算获取每一个社群的用户规模、关系数总数以及连通三角形总数,从而计算得出每一个社群对应的社群紧密度,用于衡量社群内成员的关联程度,并根据社群紧密度从大到小的顺序,将社群关系网络中的每一个社群对应的社群画像进行排序,从而实现将海量的社群画像进行自动化构建,并且根据社群紧密度进行排序,可以根据社群画像找出具有优秀推广能力的社群,提高了社群营销推广分析的效率和效果。

进一步地,请参阅图2,本发明实施例中社群画像构建方法的另一个实施例中,还包括:

201、根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个社群都有对应的社群画像,每一个用户都有对应的用户画像。

202、计算每一个社群的用户规模、每一个社群内每一个用户的关系数以及每一个用户的连通三角形数,用户规模为社群内用户的数量,关系数为目标用户与其它用户连接的数目,连通三角形数为目标用户与其它用户连接形成的三角形的个数,连通三角形数用于衡量目标用户与其它用户的紧密程度。

203、对每一个社群对应的关系数进行求和,得到每一个社群对应的关系数总数。

204、对每一个社群对应的连通三角形数进行求和,得到每一个社群对应的连通三角形总数,连通三角形总数用于衡量目标用户所在社群的用户紧密程度。

205、根据用户规模、关系数总数以及连通三角形总数,计算得到每一个社群对应的社群紧密度,社群紧密度用于衡量社群内成员的关联程度。

206、根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

本实施例步骤201~206的具体实施方式和细节如上述步骤101~106一致,在此不作赘述。

207、计算每一个用户的发散度,发散度为目标用户作为发射节点与其它用户连接的关系数,发散度用于衡量目标用户传播信息的能力。

进一步地,服务器通过计算每一个用户的发散度,发散度为目标用户作为发射节点与其它用户连接的关系数,发散度用于衡量目标用户传播信息的能力。具体实施时,通过集群计算平台apachespark中的graphx模块的graph.indegrees函数,计算每一个用户的发散度,发散度为目标用户作为发射节点与其它用户连接的关系数,发散度用于衡量目标用户传播信息的能力。

208、将每一个社群内每一个用户的发散度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

进一步地,服务器根据上述步骤207计算得出的每一个用户的发散度,通过将每一个社群内每一个用户的发散度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。服务器根据发散度从大到小的顺序将对应的用户画像进行排序,因而可以根据用户画像的排序结果找出具有优秀推广能力的用户,这些具有优秀推广能力的用户将对社群内进行自发营销推广作出贡献。

209、计算每一个用户的接收度,接收度为目标用户作为接收节点与其它用户连接的关系数,接收度用于衡量目标用户接收信息的能力。

进一步地,服务器通过计算每一个用户的接收度,接收度为目标用户作为接收节点与其它用户连接的关系数,接收度用于衡量目标用户接收信息的能力。具体实施时,服务器通过集群计算平台apachespark中的graphx模块的graph.outdegrees函数,计算每一个用户的接收度,接收度为目标用户作为接收节点与其它用户连接的关系数,接收度用于衡量目标用户接收信息的能力。

210、将每一个社群内每一个用户的接收度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

具体的,服务器根据上述步骤209计算得出的每一个用户的接收度,通过将每一个社群内每一个用户的接收度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序,因而可以根据用户画像的排序结果找出具有强接收能力的用户,这些具有强接收能力的用户将对社群内进行自发营销推广作出贡献。

211、将每一个社群内每一个用户的连通三角形数进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

具体的,服务器将社群关系网络中每一个社群内每一个用户的连通三角形数进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。由于连通三角形数用于衡量目标用户与其它用户的紧密程度,因此连通三角形数越大,目标用户与其它用户连接形成的三角形的个数越多,该目标用户与其它用户的紧密程度就越高,是衡量目标用户在社群内传播推广能力的一个重要标准,因而可以根据用户画像的排序结果找出具有优秀推广能力的用户,这些具有优秀推广能力的用户将对社群内进行自发营销推广作出贡献。

上述步骤207~208、步骤209~210与步骤211没有先后顺序,并且可以单独执行,也可以同时执行,还可以任意组合同时执行;譬如步骤207~208、步骤209~210与步骤211同时执行。

进一步地,服务器还可以根据预设的区间大小,分别对已经过排序的用户画像进行区间分组;并根据用户画像的区间分组情况,筛选得出发散度较大的分组画像和接收度较大的分组画像;最后将发散度较大的分组画像对应用户、与接收度较大的分组画像对应用户进行配对。

具体实施时,上述预设的区间大小可以根据具体的配对规模而设定,譬如要将5个发散度较大的用户与5个接收度较大的用户进行配对,则将预设的区间大小设定为5。通过进一步地将这些具有优秀推广能力的用户与具有优秀推广能力的用户进行配对或组成一个社群,可以实现社群内自发推广,减少了产品营销渠道成本和人工进行营销分析的时间及人工成本。

进一步地,服务器可以将筛选得出发散度最大的用户画像和接收度最大的用户画像、并分别获取对应的用户;通过路径遍历的方式将发散度最大的用户画像对应用户与接收度最大的用户画像对应用户进行配对,从而实现了精准的用户一一配对,将大大提高了社群内自发营销推广的效率和质量。

具体实施时,譬如发散度最大的用户画像对应用户为a1、接收度最大的用户画像对应用户为a5,用户a1与用户a5之间连接有用户a2、用户a3、用户a4,因而通过集群计算平台apachespark中的graphx模块的sendmessage函数,先从用户a1将消息发送到用户a2或用户a3或用户a4,再经过这3个用户发送信息到用户a5。

由上述可见,通过分别计算出各个社群的社群紧密度,根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序,从而可以筛选得到具有优秀推广能力的社群,提高了社群营销推广分析的效率和效果。并且进一步地,还能计算出目标社群中每一个用户的发散度和接收度,从而分别根据发散度、接收度将对应的用户画像进行排序,可以根据用户画像的排序结果找出具有优秀推广能力的用户,这些具有优秀推广能力的用户将对社群内进行自发营销推广作出贡献,也进一步地提高了社群营销推广分析的效率和效果。

上面对本发明实施例中社群画像构建方法进行了描述,下面对本发明实施例中社群画像构建装置进行描述,请参阅图3,本发明实施例中社群画像构建装置的一个实施例包括:

社群分组模块301,用于根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个社群都有对应的社群画像,每一个用户都有对应的用户画像。

计算模块302,用于计算每一个社群的用户规模、每一个社群内每一个用户的关系数以及每一个用户的连通三角形数,用户规模为社群内用户的数量,关系数为目标用户与其它用户连接的数目,连通三角形数为目标用户与其它用户连接形成的三角形的个数,连通三角形数用于衡量目标用户与其它用户的紧密程度。

关系数总数获取模块303,用于对每一个社群对应的关系数进行求和,得到每一个社群对应的关系数总数。

连通三角形总数获取模块304,用于对每一个社群对应的连通三角形数进行求和,得到每一个社群对应的连通三角形总数,连通三角形总数用于衡量目标用户所在社群的用户紧密程度。

社群紧密度模块305,用于根据用户规模、关系数总数以及连通三角形总数,计算得到每一个社群对应的社群紧密度,社群紧密度用于衡量社群内成员的关联程度。

社群画像排序模块306,用于根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

可选的,在本发明社群画像构建装置的另一种实现方式中,如图4所示,社群画像构建装置包括:

社群分组模块401,用于根据不同的社群标签对预置社群关系网络中的用户进行分组,分别得到对应的多个社群,每一个社群都有对应的社群画像,每一个用户都有对应的用户画像。

计算模块402,用于计算每一个社群的用户规模、每一个社群内每一个用户的关系数以及每一个用户的连通三角形数,用户规模为社群内用户的数量,关系数为目标用户与其它用户连接的数目,连通三角形数为目标用户与其它用户连接形成的三角形的个数,连通三角形数用于衡量目标用户与其它用户的紧密程度。

关系数总数获取模块403,用于对每一个社群对应的关系数进行求和,得到每一个社群对应的关系数总数。

连通三角形总数获取模块404,用于对每一个社群对应的连通三角形数进行求和,得到每一个社群对应的连通三角形总数,连通三角形总数用于衡量目标用户所在社群的用户紧密程度。

社群紧密度模块405,用于根据用户规模、关系数总数以及连通三角形总数,计算得到每一个社群对应的社群紧密度,社群紧密度用于衡量社群内成员的关联程度。

社群画像排序模块406,用于根据社群紧密度从大到小的顺序,将预置社群关系网络中的每一个社群对应的社群画像进行排序。

发散度计算模块407,用于计算每一个用户的发散度,发散度为目标用户作为发射节点与其它用户连接的关系数,发散度用于衡量目标用户传播信息的能力。

第一用户画像排序模块408,用于将每一个社群内每一个用户的发散度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

接收度计算模块409,用于计算每一个用户的接收度,接收度为目标用户作为接收节点与其它用户连接的关系数,接收度用于衡量目标用户接收信息的能力。

第二用户画像排序模块410,用于将每一个社群内每一个用户的接收度进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

第三用户画像排序模块411,用于将每一个社群内每一个用户的连通三角形数进行从大到小排序,并按排序顺序将每一个用户的用户画像进行排序。

可选的,在本发明社群画像构建装置的另一种实现方式中,社群画像构建装置,还包括:

关系网络切分模块,用于对预置社群关系网络进行切分,并去除不同社群之间的关联信息,关联信息为某一目标社群与其它社群之间用户连接的关联数据。

可选的,在本发明社群画像构建装置的另一种实现方式中,社群画像构建装置,还包括:

孤立用户剔除模块,用于将每一个社群中的孤立用户剔除,孤立用户作为发射节点与其它用户连接的关系数为0,孤立用户作为接收节点与其它用户连接的关系数为0。

可选的,在本发明社群画像构建装置的另一种实现方式中,社群画像构建装置,还包括:

用户数据获取模块,用于获取用户数据,用户数据包括用户节点数据和用户关联数据,用户节点数据包括用户画像。

用户数据导入模块,用于将用户数据导入数据仓库。

预置社群关系网络构建模块,用于读取数据仓库中的用户节点数据和用户关联数据,并构建得到对应的预置社群关系网络。

可选的,在本发明社群画像构建装置的另一种实现方式中,社群画像构建装置,还包括:

向量化模块,用于对每一个社群进行向量化表示,得到对应社群特征,社群特征包括用户规模、关系数总数以及连通三角形总数;

统计分析模块,用于采用统计分析算法对目标社群中对应的某一目标社群特征进行统计分析,统计分析算法是求最大值算法、求最小值算法、求平均值算法、求标准差算法或求方差算法中的至少一种;

异常判断模块,用于根据统计分析的结果,判断目标社群的结构是否存在异常。

上面图3和图4从模块化功能实体的角度对本发明实施例中的社群画像构建装置进行详细描述,下面从硬件处理的角度对本发明实施例中社群画像构建设备进行详细描述。

图5是本发明实施例提供的一种社群画像构建设备的结构示意图,该社群画像构建设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)501(例如,一个或一个以上处理器)和存储器509,一个或一个以上存储应用程序507或数据506的存储介质508(例如一个或一个以上海量存储设备)。其中,存储器509和存储介质508可以是短暂存储或持久存储。存储在存储介质508的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对社群画像构建中的一系列指令操作。更进一步地,处理器501可以设置为与存储介质508通信,在社群画像构建设备500上执行存储介质508中的一系列指令操作。

社群画像构建设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统505,例如windowsserve,macosx,unix,linux,freebsd等等。本领域技术人员可以理解,图5中示出的社群画像构建设备结构并不构成对社群画像构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1