本发明创造属于舆情监测的,具体涉及了一种意见领袖的确定方法。
背景技术:
1、在现代化信息技术的助力下,网络已经成为网民表达观点和意见倾向的主阵地。基于当前现状,意见领袖的影响力日益凸显。意见领袖是指一些在人际关系网络中表现活跃,且具有较高的代表性和威信的人物。意见领袖的影响力可通过多种传播渠道,以更为直接、迅速的方式影响社会舆论和公众意见。因此在突发舆情事件中进行精准识别意见领袖,是十分有必要的。由于在网络事件下,存在有大量的用户留言,且不同用户的观点存在有差异,所以现有技术难以在众多用户的中快速、精准的寻找到意见领袖。
技术实现思路
1、针对上述技术问题,本发明创造提出了一种意见领袖的确定方法。本申请通过一种意见领袖的确定方法,包括;获取目标事件的网络评价集,其中所述网络评价集中包括多个网络评论文本;根据所述网络评价集确定所述目标事件的最优主题数量;根据所述最优主题数量将所述网络评价集分为多个主题集;根据所述主题集中的各个所述网络评论文本确定各个所述主题集的当前意见领袖。通过对大量的留言文本分析,使得能够快速精准的甄别意见领袖。
2、第一方面,本申请提供了一种意见领袖的确定方法,包括;获取目标事件的网络评价集,其中所述网络评价集中包括多个网络评论文本;根据所述网络评价集确定所述目标事件的最优主题数量;根据所述最优主题数量将所述网络评价集分为多个主题集;根据所述主题集中的各个所述网络评论文本确定各个所述主题集的当前意见领袖。
3、在一些实施例中,所述根据所述网络评价集确定所述目标事件的主题数量,包括:根据所述网络评价集确定不同主题数量下的困惑度指标;根据所述困惑度指标确定所述最优主题数量。
4、在一些实施例中,所述根据所述最优主题数量将所述网络评价集分为多个主题集,包括:利用lda模型根据所述最优主体数量确定所述网络评价集中各个所述网络评论文本属于各个主题的主题概率;根据所述主题概率确定各个网络评论文本所属的主题;根据各个网络评论文本的所述主题将所述网络评价集分为多个主题集。
5、在一些实施例中,所述根据所述主题集确定各个所述主题集的当前意见领袖,包括:针对任一主题集执行如下操作:根据所述主题集中的第一评论文本确定所述主题集中各个第一评论文本之间的文本相似度矩阵;根据所述文本相似度矩阵确定话题领袖群体;根据话题领袖群体对应的第二评论文本确定各个所述第二评论文本之间的情感相似度矩阵;根据所述情感相似度矩阵在所述话题领袖群体中确定当前意见领袖。
6、在一些实施例中,所述根据所述文本相似度矩阵确定话题领袖群体,包括:获取预设的第一百分比阈值和第一pagerank值阈值;将所述文本相似度矩阵转为一维文本相似度向量,所述一维文本相似度向量中包括多个文本相似度因子;将所述文本相似度因子从大到小排列,形成文本相似度因子序列;根据所述文本相似度因子序列和所述第一百分比阈值确定文本相似度因子阈值;将所述一维文本相似度向量中大于或等于所述文本相似度因子阈值的文本相似度因子确定为重要文本因子;根据所述重要文本因子建立文本无向图;计算所述文本无向图中各个节点的文本pagerank值;根据各个节点的所述文本pagerank值和所述第一pagerank值阈值确定所述话题的话题领袖群体。
7、在一些实施例中,所述根据所述情感相似度矩阵在所述话题领袖群体中确定当前意见领袖,包括:获取预设的第二百分比阈值和第二pagerank值阈值;将所述情感相似度矩阵转为一维情感相似度向量,所述一维情感相似度向量中包括多个情感相似度因子;将所述情感相似度因子从大到小排列,形成情感相似度因子序列;根据所述情感相似度因子序列和所述第二百分比阈值确定情感相似度因子阈值;将所述一维情感相似度向量中大于或等于所述情感相似度因子阈值的情感相似度因子确定为重要情感因子;根据所述重要情感因子建立情感无向图;计算所述情感无向图各个节点的情感pagerank值;根据各个节点的所述情感pagerank值和第二pagerank值阈值确定所述话题的当前意见领袖。
8、在一些实施例中,所述根据所述主题集中的第一评论文本确定所述主题集中各个第一评论文本之间的文本相似度矩阵,包括:计算每条所述第一评论文本中各个词语的词频;计算各个词语在所述主题集中的逆文档频率;根据所述词频和所述逆文档频率确定各个词语在所述第一评论文本中的权重;根据各个词语的权重确定各个所述第一评论文本之间的文本相似度,进而得到所述文本相似度矩阵。
9、在一些实施例中,所述根据话题领袖群体对应的第二评论文本确定各个所述第二评论文本之间的情感相似度矩阵,包括:获取预设的情感词典;根据所述情感词典确定每个所述第二评论文本中的情感词以及所述情感词对应的情感极性;根据所述情感词和所述情感极性确定每个所述第二评论文本的情感倾向得分;根据所述情感倾向得分确定各个所述第二评论文本之间的情感相似度,进而得到所述情感相似度矩阵。
10、在一些实施例中,所述方法还包括:获取每个所述当前意见领袖的用户活动信息;根据所述用户活动信息确定领袖特征重要性序列;根据所述领袖特征重要性序列确定所述用户活动信息中各项特征的权重;根据各项特征的权重预测未来的意见领袖。
11、在一些实施例中,所述根据各项特征的权重预测未来的意见领袖,包括:获取目标用户的目标活动信息;根据所述目标活动信息和各项特征的权重确定所述目标用户的的领袖得分;根据所述领袖得分对所述目标用户能否在未来成为意见领袖进行预测。
12、本发明创造的有益效果:本申请通过一种意见领袖的确定方法,包括;获取目标事件的网络评价集,其中所述网络评价集中包括多个网络评论文本;根据所述网络评价集确定所述目标事件的最优主题数量;根据所述最优主题数量将所述网络评价集分为多个主题集;根据所述主题集中的各个所述网络评论文本确定各个所述主题集的当前意见领袖。通过对大量的留言文本分析,使得能够快速精准的甄别意见领袖。
1.一种意见领袖的确定方法,其特征在于,包括;
2.根据权利要求1所述的方法,其特征在于,所述根据所述网络评价集确定所述目标事件的主题数量,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据所述最优主题数量将所述网络评价集分为多个主题集,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据所述主题集确定各个所述主题集的当前意见领袖,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所述文本相似度矩阵确定话题领袖群体,包括:
6.根据权利要求4所述的方法,其特征在于,所述根据所述情感相似度矩阵在所述话题领袖群体中确定当前意见领袖,包括:
7.根据权利要求4所述的方法,其特征在于,所述根据所述主题集中的第一评论文本确定所述主题集中各个第一评论文本之间的文本相似度矩阵,包括:
8.根据权利要求4所述的方法,其特征在于,所述根据话题领袖群体对应的第二评论文本确定各个所述第二评论文本之间的情感相似度矩阵,包括:
9.根据权利要求1-9任一所述的方法,其特征在于,所述方法还包括:
10.根据权利要求9所述的方法,其特征在于,所述根据各项特征的权重预测未来的意见领袖,包括: