本公开涉及数据处理,具体地,涉及一种基于gpt的定向标签舆情分析方法及对应装置。
背景技术:
1、舆情分析是指通过对社交网络、新闻平台、论坛等公开数据进行采集和分析,以识别公众对某个话题、领域或事件的态度和情感。然而,相关技术在进行舆情分析时,一般是基于关键词过滤技术从采集到的舆情数据中识别和提取出关键词或关键短语,然后基于提取出的关键词或关键短语生成舆情报告或舆情分析结果,存在舆情分析结果不准确的情况。
技术实现思路
1、本公开的目的是提供一种基于gpt的定向标签舆情分析方法及对应装置,以解决上述技术问题。
2、为了实现上述目的,本公开第一方面提供一种基于gpt的定向标签舆情分析方法,所述方法包括:
3、响应于针对目标用户配置的数据标签,获取所述目标用户针对所述数据标签的第一舆情数据,其中,所述目标用户为目标领域的领域专家,所述数据标签为所述目标领域中用于标识数据类别的数据标签,所述目标用户是根据所述目标领域中用户的用户影响值和领域影响值确定的,所述用户影响值用于表征所述用户对其他用户的影响程度,所述领域影响值用于表征所述用户对所述目标领域的影响程度;
4、基于gpt和所述第一舆情数据,得到针对所述第一舆情数据的舆情主题以及情感类别,其中,所述gpt用于根据输入的第一舆情数据,输出对应的舆情主题和情感类别;
5、根据所述舆情主题、所述情感类别以及所述目标用户的用户信息,生成舆情分析结果。
6、可选地,所述目标用户包括多个,相应地,所述舆情主题和所述情感类别包括多个,所述根据所述舆情主题、所述情感类别以及所述目标用户的用户信息,生成舆情分析结果,包括:
7、将所述舆情主题作为分类维度,将所述第一舆情数据对应的情感类别划分至所述第一舆情数据对应的舆情主题中,得到每个所述舆情主题下的情感类别;
8、针对每个所述舆情主题,对所述舆情主题下的情感类别进行聚合,得到所述舆情主题的情感分布信息;
9、根据每个所述舆情主题的情感分布信息、多个所述舆情主题以及多个所述目标用户的用户信息,生成舆情分析结果。
10、可选地,所述目标用户通过如下方式得到:
11、通过目标网络平台的应用程序接口,获取所述目标网络平台中的用户针对预设数据标签的第二舆情数据,其中,所述预设数据标签为所述目标领域中的数据标签;
12、根据所述第二舆情数据,确定所述第二舆情数据对应用户在所述目标领域中的舆情影响值;
13、根据所述第二舆情数据对应用户在所述目标领域中的舆情影响值,确定目标用户。
14、可选地,所述第二舆情数据包括所述用户在所述目标网络平台中发布的内容数据、所述用户在所述目标网络平台中的用户数据以及所述用户在目标网络平台中的互动数据,所述根据所述第二舆情数据,确定所述第二舆情数据对应用户在所述目标领域中的舆情影响值,包括:
15、根据所述用户数据,确定所述用户对所述目标网络平台中其他用户的第一影响值,并将所述第一影响值确定为所述用户影响值;
16、根据所述内容数据以及所述互动数据,确定所述用户在所述目标网络平台中发布的内容在所述目标领域中的第二影响值,并将所述第二影响值确定为所述领域影响值;
17、根据所述用户影响值和所述领域影响值,确定所述第二舆情数据对应用户在所述目标领域中的舆情影响值。
18、可选地,所述用户数据包括第一用户数据、第二用户数据以及第三用户数据,所述第一用户数据用于指示所述用户在所述目标网络平台中发布的内容的可信度,所述第二用户数据包括所述用户在所述目标网络平台中的粉丝信息,所述第三用户数据包括所述用户在所述目标网络平台中的关注者信息,所述根据所述用户数据,确定所述用户对所述目标网络平台中其他用户的第一影响值,包括:
19、基于预设的信任分值与所述可信度之间的对应关系以及所述第一用户数据,确定第三影响值;
20、基于所述粉丝信息和所述关注者信息,构建所述用户在所述目标网络平台中的社交网络,并根据所述社交网络,确定所述用户在所述社交网络中的度中心性、紧密中心性、介数中心性以及特征向量中心性,并根据所述度中心性、所述紧密中心性、所述介数中心性以及所述特征向量中心性,确定第四影响值;
21、以目标常数作为底数,并以所述关注者信息中的关注者数量作为指数,得到目标数值,并对所述目标数值进行归一化处理,得到第五影响值;
22、根据所述第三影响值、所述第四影响值以及所述第五影响值,确定所述用户对所述目标网络平台中其他用户的第一影响值。
23、可选地,所述互动数据包括第一互动数据、第二互动数据、第三互动数据以及第四互动数据,所述第一互动数据包括点赞量,所述第二互动数据包括评论量,所述第三互动数据包括转发量,所述第四互动数据包括回复量,所述根据所述内容数据以及所述互动数据,确定所述用户在所述目标网络平台中发布的内容在所述目标领域中的第二影响值,包括:
24、获取所述目标领域中的热点话题,以及所述用户在所述目标网络平台中发布的目标历史内容数据,所述热点话题为网络热度值大于预设网络热度值的话题,所述目标历史内容数据为所述用户在预设时间区间发布的内容数据;
25、基于语义识别模型、所述历史内容数据以及所述热点话题,确定所述历史内容数据与所述热点话题的语义相似度;
26、在所述语义相似度大于预设的语义相似度阈值时,计算所述点赞量、所述评论量、所述转发量以及所述回复量之间的和值,并计算所述和值与所述预设时间区间对应时长的比值,得到内容互动值;
27、根据所述语义相似度和所述内容互动值,确定所述用户在所述目标网络平台中发布的内容在所述目标领域中的第二影响值。
28、本公开第二方面提供一种基于gpt的定向标签舆情分析装置,所述装置包括:
29、第一获取模块,用于响应于针对目标用户配置的数据标签,获取所述目标用户针对所述数据标签的第一舆情数据,其中,所述目标用户为目标领域的领域专家,所述数据标签为所述目标领域中用于标识数据类别的数据标签,所述目标用户是根据所述目标领域中用户的用户影响值和领域影响值确定的,所述用户影响值用于表征所述用户对其他用户的影响程度,所述领域影响值用于表征所述用户对所述目标领域的影响程度;
30、第一处理模块,用于基于gpt和所述第一舆情数据,得到针对所述第一舆情数据的舆情主题以及情感类别,其中,所述gpt用于根据输入的第一舆情数据,输出对应的舆情主题和情感类别;
31、第二处理模块,用于根据所述舆情主题、所述情感类别以及所述目标用户的用户信息,生成舆情分析结果。
32、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理装置执行时实现第一方面中任一项所述方法的步骤。
33、第四方面,本公开提供一种电子设备,包括:
34、存储装置,其上存储有计算机程序;
35、处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中任一项所述方法的步骤。
36、第五方面,本公开提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面中任一项所述方法的步骤。
37、通过上述技术方案,可以对目标用户配置数据标签,从而可以针对性的获取目标用户在数据标签下的第一舆情数据,进而可以根据获取到的第一舆情数据生成对应的舆情分析结果。由此,可以根据用户设置的数据标签,针对性地监控目标领域中的事件,即,针对性的获取第一舆情数据并进行定向的舆情分析,一方面可以减少第一舆情数据的处理量,提高舆情分析效率。另一方面,由于第一舆情数据是数据标签下的舆情数据,由此在基于第一舆情数据生成舆情分析结果时,可以使得舆情分析结果中不包含无关数据,从而提高舆情分析结果的准确性,避免无关数据对用户造成干扰。
38、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。