一种舆情监测方法和舆情监测系统

文档序号:31439922发布日期:2022-09-07 09:11阅读:来源:国知局

技术特征:
1.一种舆情监测方法,其特征在于,所述舆情监测方法包括:s1:获取用户输入的关键词;s2:对所述关键词进行关键词扩充操作,得到关键词库;s3:对所述关键词库中的敏感词进行提取操作,得到敏感词库;s4:采集所述关键词库和所述敏感词库的最终舆情数据;s5:对所述最终舆情数据进行预处理操作,得到预处理结果;s6:对所述预处理结果进行舆情分析处理,得到分析结果;s7:根据所述分析结果,得到舆情监测结果。2.根据权利要求1所述的舆情监测方法,其特征在于,所述步骤s2包括:利用所述关键词在相关数据源中进行搜索,得到与所述关键词相匹配的多条数据信息;根据所有所述数据信息,得到所述关键词库。3.根据权利要求1所述的舆情监测方法,其特征在于,所述步骤s3包括:利用分词工具包对所述关键词库中所有数据进行分词操作,得到分词数据库;将所有所述分词数据信息转换为词向量信息;根据所述词向量信息,利用bilstm模型提取所述分词数据库中的负面词;将所述负面词作为敏感词,得到所述敏感词库。4.根据权利要求1所述的舆情监测方法,其特征在于,所述步骤s4包括:s41:配置数据采集表达式,并将所述关键词库和所述敏感词库合并为组合词库;s42:利用所述组合词库检索相关舆情新闻列表;s43:将所述相关舆情新闻列表的当前新闻页的网页地址加入待采集列表;s44:从待采集列表中提取所述网页地址,访问所述当前新闻页的相关信息以形成初始舆情数据;s45:若所述初始舆情数据同时满足完整性和唯一性,进入步骤s46,否则,进入步骤s47;s46:将所述初始舆情数据作为所述最终舆情数据输出;s47:判断所述当前新闻页是否为所述相关舆情新闻列表的最后一页,若是,返回步骤s46,否则,返回步骤s43。5.根据权利要求1所述的舆情监测方法,其特征在于,所述步骤s5包括:对所述最终舆情数据进行分批处理,得到多批舆情数据;利用正则表达式对每批所述舆情数据进行特殊字符和无用字符剔除处理,得到处理后的最终舆情数据;对所述处理后的最终舆情数据进行数据特征提取操作,得到特征提取结果;将所述特征提取结果作为所述预处理结果输出。6.根据权利要求1-5中任意一项所述的舆情监测方法,其特征在于,所述舆情分析处理包括:一般统计性分析、关键词提取、热度计算和多模态情感分析。7.根据权利要求6所述的舆情监测方法,其特征在于,所述热度计算包括单个所述数据源的热度指数计算和多个所述数据源的热度指数计算,多个所述数据源的热度指数计算公式为:
其中,h为热度值,h
i
为第i个相关数据源的所有最终舆情数据的热度指数综合,w
i
为该相关数据源的热度权重;单个所述相关数据源的热度指数x的计算公式为:其中,e为各相关数据源的用户关注指数,t
s
表示相关舆情新闻的新鲜程度且t
s
=a-b,a为发布时间,b为采集时间,t代表的是3天一个热度周期内的总秒数。8.根据权利要求6所述的舆情监测方法,其特征在于,所述多模态情感分析包括:获取所述预处理结果中的图片特征和文字特征;根据所述图片特征和所述文本特征,训练图片文本对齐网络,得到训练好的图片文本对齐网络;根据所述图片特征和所述文本特征,利用所述训练好的图片文本对齐网络,得到融合特征;将所述融合特征作为分类器的输入,得到多模态情感分析结果;所述多模态情感分析模型的损失函数为:l=l
ca-l
da
其中,l
ca
为交叉重建损失且m为样本数量,x
j
代表j模态的原始特征,d
j
表示j模态的编码器,e
i
代表i模态的编码器,x
i
代表i模态的原始特征,l
da
是分布对齐损失且w
ij
为模态i与j之间的2-wasserstein距离且其中,μ与均为编码器生成的隐藏层特征向量。9.根据权利要求8所述的舆情监测方法,其特征在于,所述图片文本对齐网络包括:图片特征编码器、文本特征编码器、共享特征层和多个共享特征解码器,所述图片特征编码器和所述文本特征编码器同时连接所述共享特征层的输入端,多个所述共享特征编码器连接所述共享特征层的输出端,所述共享特征层还连接有分类器;所述图片特征编码器用于对所述图片特征进行编码;所述文本特征编码器用于对所述文本特征进行编码;多个所述共享特征解码器用于对所述共享特征进行解码,以输出重构图片特征和重构文本特征;所述分类器用于对所述共享特征进行分类,以对所述图片文本对齐网络进行训练。10.一种基于权利要求1-9中任意一项所述的舆情监测方法的舆情监测系统,其特征在于,所述舆情监测系统包括:关键词获取模块,所述关键词获取模块用于获取关键词;
关键词扩充模块,所述关键词扩充模块用于对所述关键词进行扩充;敏感词提取模块,所述敏感词提取模块用于对关键词库中的敏感词进行提取;舆情数据采集模块,所述舆情数据采集模块用于采集所述关键词库和所述敏感词库的最终舆情数据;数据预处理模块,所述数据预处理模块用于对所述最终舆情数据进行预处理操作;舆情分析模块,所述舆情分析模块用于对预处理结果进行分析;舆情报告模块,所述舆情报告模块用于将舆情监测结果展示给用户。

技术总结
本发明公开了一种舆情监测方法和舆情监测系统,所述舆情监测方法包括:S1:获取关键词;S2:对所述关键词进行关键词扩充操作,得到关键词库;S3:对所述关键词库中的敏感词进行提取操作,得到敏感词库;S4:采集所述关键词库和所述敏感词库的最终舆情数据;S5:对所述舆情数据进行预处理操作,得到预处理结果;S6:对所述预处理结果进行舆情分析处理,得到分析结果;S7:根据所述分析结果,得到舆情监测结果。本发明所提供的舆情监测方法和舆情监测系统,能够有效提高舆情数据的全面性以及准确性。能够有效提高舆情数据的全面性以及准确性。


技术研发人员:李响 杨国武 李蒍韦 侯柏成
受保护的技术使用者:黄河水利职业技术学院
技术研发日:2022.01.17
技术公布日:2022/9/6
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1