文章情绪信息的确定方法、装置、计算机设备及存储介质与流程

文档序号:33945666发布日期:2023-04-26 07:46阅读:47来源:国知局
文章情绪信息的确定方法、装置、计算机设备及存储介质与流程

本公开涉及文本处理,具体而言,涉及一种文章情绪信息的确定方法、装置、计算机设备及存储介质。


背景技术:

1、表示向量是当前深度学习领域使用最广泛的技术之一,通过获取词汇的表示向量,可以将许多机器学习算法应用于对文本的处理上,来解决很多场景下的业务问题,比如内容召回、内容审核等。词频-逆向文件频率(term frequency-inverse documentfrequency,tf-idf)是提取文本关键词的常用技术,原理是如过一个词汇在文章中的出现频率很高,但是在其他语料中出现频率不高,则认为该词汇是文章的关键词。文章情绪主要包括但不限于感动、亲切、温暖、愤怒、悲伤、焦虑等,比如一篇见义勇为的文章,可能会带有感动情绪。当前确定文本的情绪信息的方式,存在准确率低的问题。


技术实现思路

1、本公开实施例至少提供一种文章情绪信息的确定方法、装置、计算机设备及存储介质。

2、第一方面,本公开实施例提供了一种文章情绪信息的确定方法,包括:基于目标文章对应的目标评论信息,确定与所述目标文章对应的评论关键词;基于所述评论关键词对应的第一表示向量、以及与至少一种情绪中每种情绪对应的第二表示向量,确定所述第一表示向量和所述第二表示向量之间的第一相似度,所述情绪用于表征文章所表达的情感倾向;基于所述第一相似度、以及为所述至少一种情绪中每种情绪确定的相似度阈值,确定所述目标文章对应的情绪信息。

3、这样,利用目标文章对应的目标评论信息中能够表示情绪信息的关键词,来确定目标文章的情绪信息,而目标评论信息中,通常是用户在阅读了目标文章后所得出的总结性的信息,较之目标文章,往往会具有更多能

4、够表示情绪信息的词汇,因此,利用目标评论信息来确定目标文章对应的5情绪信息,具有较高的准确度。

5、一种可能的实施方式中,所述基于目标文章对应的目标评论信息,确定与所述目标文章对应的评论关键词,包括:获取所述目标文章对应的评论信息;从所述评论信息中筛选置信度满足预设置信度条件的目标评论信

6、息,并将所述目标评论信息合并为目标文本;所述目标评论信息的数量大0于或者等于预设数量阈值;对所述目标文本进行关键词识别处理,得到所述评论关键词。

7、这样,可以从目标文章的评论信息中筛选置信度更高的目标评论信息,进而基于目标评论信息确定的评论关键词也具有更高的置信度,最终为目标文章确定的情绪信息更加准确。

8、5一种可能的实施方式中,所述评论关键词有多个;采用下述方式确定所述评论关键词的第一表示向量:确定多个所述评论关键词分别对应的词向量;基于多个评论关键词分别对应的词向量,确定多个评论关键词对应的平均词向量;将所述平均词向量作为所述评论关键词的第一表示向量。

9、一种可能的实施方式中,采用下述方式确定至少一种情绪中每种情绪0对应的第二表示向量:针对所述每种情绪,从多个备选词汇中,确定与该种情绪对应的情绪关键词;基于与该种情绪对应的情绪关键词的词向量,确定该种情绪对应的第二表示向量。

10、一种可能的实施方式中,所述针对所述每种情绪,从多个备选词汇中,

11、确定与该种情绪对应的情绪关键词,包括:针对所述每种情绪,确定与该5种情绪对应的情绪词汇;基于该种情绪对应的情绪词汇的第一词汇向量、以及多个备选词汇的第二词汇向量,确定所述情绪词汇的第一词汇向量分别和多个所述备选词汇的第二词汇向量的第二相似度;基于所述第二相似度,从多个备选词汇中,确定该种情绪对应的情绪关键词。

12、这样,能够将与情绪对应的情绪关键词充分的从备选词汇中确定出来,使得确定的情绪关键词能够更加全面的覆盖对应情绪,最终确定的情绪对应的第二表示向量更加的准确。

13、一种可能的实施方式中,所述基于所述第一相似度、以及为所述至少一种情绪中每种情绪确定的相似度阈值,确定所述目标文章对应的情绪信息,包括:针对每种情绪,将该种情绪对应的第一相似度和与该种情绪对应的相似度阈值进行比对;响应于所述每种情绪对应的第一相似度大于与所述每种情绪对应的相似度阈值,确定所述目标文章对应的情绪信息包括该种情绪。

14、这样,针对每种情绪针对性的设置相似度阈值,使得为目标文章确定的情绪信息具有更高的准确度。

15、一种可能的实施方式中,采用下述方式确定每种情绪对应的相似度阈值:

16、针对多篇样本文章中的每篇样本文章,基于该篇样本文章对应的样本评论信息,确定与该篇样本文章对应的样本评论关键词;

17、基于所述样本评论关键词对应的第一样本表示向量、以及与该种情绪对应的第二表示向量,确定所述第一样本表示向量和该种情绪对应的第二表示向量之间的第三相似度;

18、基于多篇样本文章分别对应的第三相似度、以及多篇样本文章分别对应的情绪信息标注,确定该种情绪对应的相似度阈值。

19、一种可能的实施方式中,所述基于多篇样本文章分别对应的第三相似度、以及多篇样本文章分别对应的情绪信息标注,确定该种情绪对应的相似度阈值,包括:

20、基于多篇所述样本文章分别对应的第三相似度,对多篇所述样本文章进行排序,并执行下述迭代过程:

21、确定当前迭代周期对应的文章选取参数;所述文章选取参数,包括:从多篇样本文章中确定所述目标样本文章的百分比、或者从多篇文章中确定所述目标样本文章的数量;

22、基于所述文章选取参数,从排序后的多篇样本文章中确定目标样本文章;其中,所述目标样本文章对应的第三相似度大于多篇所述样本文章中非目标样本文章对应的第三相似度;

23、基于所述目标样本文章对应的情绪标注信息,确定所述目标样本文章是否满足预设条件;

24、响应于所述目标样本文章未满足所述预设条件,则跳转至下一迭代周期;

25、响应于所述目标样本文章满足所述预设条件,基于所述目标样本文章对应的第三相似度,确定该种情绪对应的相似度阈值。

26、一种可能的实施方式中,所述基于所述目标样本文章对应的情绪标注信息,确定所述目标样本文章是否满足预设条件,包括:

27、基于所述目标样本文章对应的情绪标注信息,确定第三相似度与对应情绪标注信息匹配的目标样本文章的数量是否满足预设数量阈值;

28、响应于第三相似度与对应情绪标注信息匹配的目标样本文章的数量大于预设数量阈值,确定所述目标样本文章满足所述预设条件。

29、一种可能的实施方式中,所述响应于所述目标样本文章满足所述预设条件,基于所述目标样本文章对应的第三相似度,确定该种情绪对应的相似度阈值,包括:

30、从所述目标样本文章对应的第三相似度中,确定最小第三相似度;

31、将所述最小第三相似度确定为该种情绪对应的相似度阈值。

32、这样,通过上述方式能够更加准确的为每种情绪确定对应的表示向量,以提升利用本公开各实施例为目标文章确定的情绪信息的准确度。

33、一种可能的实施方式中,所述方法还包括:

34、基于所述目标文章对应的情绪信息,确定与所述目标文章对应的推送目标;向所述推送目标推送所述目标文章。

35、这样,能够针对性的利用不同的情绪信息,为不同用户推送对应的目标文章,使得信息的推送更加具有针对性,减少对资源的浪费。

36、一种可能的实施方式中,所述方法还包括:基于所述目标文章对应的情绪信息,确定与预先接收到的召回请求是否匹配;

37、响应于所述目标文章和所述召回请求匹配,向发送所述召回请求的对象发送所述目标文章。

38、这样,使得内容召回更加具有针对性。

39、第二方面,本公开实施例还提供一种文章情绪信息的确定装置,包括:

40、第一处理模块,用于基于目标文章对应的目标评论信息,确定与所述目标文章对应的评论关键词;

41、第二处理模块,用于基于所述评论关键词对应的第一表示向量、以及与至少一种情绪中每种情绪对应的第二表示向量,确定所述第一表示向量和所述第二表示向量之间的第一相似度,所述情绪用于表征文章所表达的情感倾向;

42、第三处理模块,用于基于所述第一相似度、以及为所述至少一种情绪中每种情绪确定的相似度阈值,确定所述目标文章对应的情绪信息。

43、第三方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

44、第四方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

45、关于上述文章情绪信息的确定装置、计算机设备、及计算机可读存储介质的效果描述参见上述文章情绪信息的确定方法的说明,这里不再赘述。

46、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开的技术方案。

47、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1