舆情根因分析模型的训练方法和舆情根因分析方法与流程

文档序号:35980845发布日期:2023-11-10 00:46阅读:26来源:国知局
舆情根因分析模型的训练方法和舆情根因分析方法

本说明书涉及自然语言处理领域,尤其涉及一种舆情根因分析模型的训练方法和舆情根因分析方法。


背景技术:

1、舆论情况(简称“舆情”),是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。在数字商业化和开放生态的背景下,越来越多的服务商开始以小程序和/或html5的技术形态为用户提供服务。在繁荣的数字化生态背后,用户针对小程序或/html5反馈的舆情问题数量也日渐增长。而舆情是线上问题一道有效的兜底发现机制。针对用户反馈的舆情进行快速且准确的根因分析,以便基于根因针对舆情进行对应处理,有利于控制问题的影响面和影响程度。

2、然而,目前针对舆情的根因分析定位还没有一套较好的智能识别方案。而人工介入的根因分析不仅效率低下,而且也存在耗时长等问题。


技术实现思路

1、本说明书实施例提供了一种舆情根因分析模型的训练方法和根因分析方法,可以增强针对舆情根因分析的准确性,提高舆情根因分析效率。所述技术方案如下:

2、第一方面,本说明书实施例提供了一种舆情根因分析模型的训练方法,所述方法包括:对多个训练数据进行特征提取,得到各所述训练数据对应的混合特征;

3、根据各所述训练数据对应的混合特征,对所述多个训练数据进行多次聚类处理,得到至少一个聚类结果,所述聚类结果为包括至少一个所述训练数据的数据集;

4、根据各所述聚类结果包括的至少一个所述训练数据分别对应的混合特征,得到各所述聚类结果对应的与舆情根因相关的知识图谱;

5、根据所述至少一个聚类结果和各所述聚类结果对应的知识图谱,训练待训练舆情根因分析模型,直至得到舆情根因分析模型。

6、第二方面,本说明书实施例提供一种舆情根因分析方法,所述方法包括:

7、获取待分析数据;

8、根据舆情根因分析模型对所述待分析数据进行特征提取,得到所述待分析数据对应的混合特征,所述舆情根因分析模型为采用如第一方面所述的舆情根因分析模型的训练方法训练得到的模型;

9、根据所述待分析数据对应的混合特征,将所述待分析数据与所述舆情根因分析模型包括的至少一个聚类结果进行特征匹配,得到所述待分析数据对应的目标聚类结果;

10、根据所述舆情根因分析模型和所述目标聚类结果对应的知识图谱,得到所述待分析数据对应的与舆情根因相关的知识图谱。

11、第三方面,本说明书实施例提供了一种舆情根因分析模型的训练装置,所述装置包括:

12、特征提取模块,用于对多个训练数据进行特征提取,得到各所述训练数据对应的混合特征;

13、多次聚类模块,用于根据各所述训练数据对应的混合特征,对所述多个训练数据进行多次聚类处理,得到至少一个聚类结果,所述聚类结果为包括至少一个所述训练数据的数据集;

14、图谱构建模块,用于根据各所述聚类结果包括的至少一个所述训练数据分别对应的混合特征,得到各所述聚类结果对应的与舆情根因相关的知识图谱;

15、模型训练模块,用于根据所述至少一个聚类结果和各所述聚类结果对应的知识图谱,训练待训练舆情根因分析模型,直至得到舆情根因分析模型。

16、第四方面,本说明书实施例提供了一种舆情根因分析装置,所述装置包括:

17、数据获取模块,用于获取待分析数据;

18、提取特征模块,用于根据舆情根因分析模型对所述待分析数据进行特征提取,得到所述待分析数据对应的混合特征,所述舆情根因分析模型为采用如第一方面所述的舆情根因分析模型的训练方法训练得到的模型;

19、特征匹配模块,用于根据所述待分析数据对应的混合特征,将所述待分析数据与所述舆情根因分析模型包括的至少一个聚类结果进行特征匹配,得到所述待分析数据对应的目标聚类结果;

20、根因分析模块,用于根据所述舆情根因分析模型和所述目标聚类结果对应的知识图谱,得到所述待分析数据对应的与舆情根因相关的知识图谱。

21、第五方面,本说明书实施例提供一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。

22、第六方面,本说明书实施例提供一种计算机程序产品,所述计算机程序产品存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。

23、第七方面,本说明书实施例提供一种电子设备,可包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。

24、本说明书一些实施例提供的技术方案带来的有益效果至少包括:

25、在本说明书中,通过提取多个训练数据的多模态混合特征对多个训练数据进行聚类处理,以及构建多个训练数据对应的与舆情根因相关的知识图谱,从而训练得到舆情根因分析模型。进一步的,对待分析数据进行舆情根因分析时,基于舆情根因分析模型提取待分析数据对应的多模态混合特征并构建知识图谱,通过对待分析数据的知识图谱进行图谱补全的方式,预测待分析数据的舆情根因。由于多个训练数据中存在噪声,在构建多个训练数据对应的知识图谱时会将噪声作为正常节点加入知识图谱中,从而影响通过图谱补全的方式预测待分析数据的舆情根因的准确性。因此,本说明书通过聚类处理有效发现多个训练数据中的噪声并去除,提高知识图谱构建的准确性,进一步提高预测舆情根因的准确性。而相比于仅通过聚类处理预测舆情根因的方法,本说明书将聚类处理和知识图谱构建进行高度融合,基于融合后的方法预测舆情根因,预测效率更高,预测结果更丰富。



技术特征:

1.一种舆情根因分析模型的训练方法,所述方法包括:

2.根据权利要求1所述舆情根因分析模型的训练方法,所述对多个训练数据进行特征提取,得到各所述训练数据对应的混合特征,包括:

3.根据权利要求2所述舆情根因分析模型的训练方法,所述根据所述多个训练数据,提取各所述训练数据对应的图片特征和文字特征,包括:

4.根据权利要求3所述舆情根因分析模型的训练方法,所述根据至少包括所述分割图片的目标训练数据,提取所述至少包括分割图片的目标训练数据对应的图片特征和文字特征,包括:

5.根据权利要求2所述舆情根因分析模型的训练方法,所述根据所述多个训练数据,提取各所述训练数据对应的图片特征和文字特征,包括:

6.根据权利要求2或5所述舆情根因分析模型的训练方法,所述根据所述多个训练数据,提取各所述训练数据对应的图片特征和文字特征,包括:

7.根据权利要求1所述舆情根因分析模型的训练方法,所述训练数据对应的混合特征包括所述训练数据对应的图片特征和文字特征;

8.根据权利要求1所述舆情根因分析模型的训练方法,所述根据各所述聚类结果包括的至少一个所述训练数据分别对应的混合特征,得到各所述聚类结果对应的与舆情根因相关的知识图谱,包括:

9.一种舆情根因分析方法,所述方法包括:

10.根据权利要求9所述舆情根因分析方法,所述根据所述舆情根因分析模型和目标聚类结果对应的知识图谱,得到所述待分析数据对应的与舆情根因相关的知识图谱,包括:

11.一种舆情根因分析模型的训练装置,所述装置包括:

12.一种舆情根因分析装置,所述装置包括:

13.一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~10任意一项的方法步骤。

14.一种计算机程序产品,所述计算机程序产品存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~10任意一项的方法步骤。

15.一种电子设备,包括:处理器和存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行如权利要求1~10任意一项的方法步骤。


技术总结
本说明书实施例公开了一种舆情根因分析模型的训练方法和根因分析方法,涉及自然语言处理领域。在本说明书中,通过提取多个训练数据的多模态混合特征对多个训练数据进行聚类处理,以及构建多个训练数据对应的与舆情根因相关的知识图谱,从而训练得到舆情根因分析模型。进一步的,对待分析数据进行舆情根因分析时,基于舆情根因分析模型提取待分析数据对应的多模态混合特征并构建知识图谱,通过对待分析数据的知识图谱进行图谱补全的方式,预测待分析数据的舆情根因。

技术研发人员:刘琳琅,朱治潮,黄修添,许文浩,姚信威,李强,邢伟伟,陆琦超,袁知恒
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1