文本分析方法及装置、存储介质及电子设备与流程

文档序号:38071973发布日期:2024-05-21 20:07阅读:46来源:国知局
文本分析方法及装置、存储介质及电子设备与流程

本公开技术方案涉及计算机通信,尤其涉及一种发送信息的方法及装置、存储介质。


背景技术:

1、随着互联网平台的快速发展,线上汽车行业相关评论的数量日益增多。对于汽车服务商而言,不同的用户对于汽车的评价具有极高的商业价值。而面对线上日益增多的评论数据,如果仅依靠人工进行逐条浏览来进行文本分析,存在成本高、效率低等缺点。


技术实现思路

1、有鉴于此,本公开实施例提供一种文本分析方法及装置、存储介质及电子设备。

2、根据本公开的第一方面,提出了一种文本分析方法,所述方法包括:

3、确定所述评论文本中的目标主体词;所述目标主体词用于表征所述评论文本中的评论对象;

4、根据预先获取的主体词和评论词的对应关系,在所述评论文本中位于所述目标主体词前后预设字窗口范围内匹配与所述目标主体词相对应的目标评论词;所述目标评论词用于表征对所述评论对象所做的评论;

5、分别获取所述目标主体词和所述目标评论词的极性信息;所述极性信息用于表征所述目标主体词或所述目标评论词的正负向指向,所述正负向指向用于表征褒义或者贬义;

6、根据获取到的所述目标主体词和目标评论词的极性信息,确定所述评论文本的整体极性信息,所述整体极性信息用于表征对所述评论对象的评论的正负向指向。

7、结合本公开提供的任一实施方式,所述在所述评论文本中位于所述目标主体词前后预设字窗口范围内匹配与所述目标主体词相对应的目标评论词,包括:

8、响应于在所述评论文本中位于所述目标主体词前后预设字窗口范围内,获取到多个与所述目标主体词相对应的评论词,将距离所述目标主体词最近的评论词,作为所述目标评论词。

9、结合本公开提供的任一实施方式,所述确定所述评论文本中的目标主体词之前,所述方法还包括:

10、构造键值对字典;所述键值对字典包括:主体词-评论词字典;在所述主体词-评论词字典中,键为主体词,值为评论词;

11、所述确定所述评论文本中的目标主体词,包括:

12、将所述评论文本与所述主体词-评论词字典中的主体词进行比对;

13、响应于确定所述评论文本中的第一主体词位于所述主体词-评论词字典中,将所述第一主体词确定为所述评论文本中的目标主体词;

14、所述根据预先获取的主体词和评论词的对应关系,在所述评论文本中位于所述目标主体词前后预设字窗口范围内匹配与所述目标主体词相对应的目标评论词,包括:

15、在所述主体词-评论词字典中,获取与所述目标主体词对应的评论词;

16、在所述评论文本中位于所述目标主体词前后预设字窗口范围内,查找是否存在与所述目标主体词对应的评论词;

17、若存在,将所述评论词作为所述目标主体词相对应的目标评论词。

18、结合本公开提供的任一实施方式,所述键值对字典还包括:主体词-主体极性、主体极性偏置字典和评论词-评论极性、评论极性偏置字典;

19、在所述主体词-主体极性、主体极性偏置字典中,键为主体词,值为主体极性和主体极性偏置;在所述评论词-评论极性、评论极性偏置字典中,键为评论词,值为评论极性和评论极性偏置;所述主体极性用于表征主体词固有的正负指向,所述评论极性用于表征评论词固有的正负指向;

20、所述分别获取所述目标主体词和所述目标评论词的极性信息,包括:

21、根据所述主体词-主体极性、主体极性偏置字典,获取所述目标主体词的目标主体极性和目标主体极性偏置信息;以及

22、根据所述评论词-评论极性、评论极性偏置字典,获取所述目标评论词的目标评论极性和目标评论极性偏置信息。

23、结合本公开提供的任一实施方式,所述键值对字典还包括:评论词-主体词字典;在所述评论词-主体词字典中,键为评论词,值为主体词;

24、所述构造键值对字典之后,所述方法还包括:

25、根据所述评论词-主体词字典,确定第二主体词和第三主体词的共现概率;所述共现概率用于表征所述第二主体词和第三主体词对应同一个评论词的概率;

26、响应于所述第二主体词和第三主体词的共现概率大于预设比例,将所述主体词-评论词字典中与所述第二主体词对应的第二评论词和与所述第三主体词对应的第三评论词合并,得到合并评论词;

27、将所述合并评论词作为所述主体词-评论词字典中与所述第二主体词和第三主体词分别对应的评论词。

28、结合本公开提供的任一实施方式,所述根据所述评论词-主体词字典,确定第二主体词和第三主体词的共现概率,包括:

29、以所述评论词-主体词字典中的单个评价词为窗口,确定所述第二主体词和第三主体词共现的第一频次;

30、以所有评价词为窗口,确定所述第二主体词出现的第二频次;

31、确定所述第一频次与所述第二频次的第一商值,并将所述第一商值作为所述第二主体词和第三主体词的共现概率。

32、结合本公开提供的任一实施方式,所述根据获取到的所述极性信息,分析所述评论文本的正负向指向之后,所述方法还包括:

33、响应于接收到标注有极性信息的主体词和/或评论词,根据标注后的所述主体词和/或评论词,更新主体词-主体极性、主体极性偏置字典、和/或评论词-评论极性、评论极性偏置字典中的极性信息。

34、根据本公开的第二方面,提出了一种文本分析装置,所述装置包括:

35、目标主体词确定模块,用于确定所述评论文本中的目标主体词;所述目标主体词用于表征所述评论文本中的评论对象;

36、目标评论词匹配模块,用于根据预先获取的主体词和评论词的对应关系,在所述评论文本中位于所述目标主体词前后预设字窗口范围内匹配与所述目标主体词相对应的目标评论词;所述目标评论词用于表征对所述评论对象所做的评论;

37、极性信息获取模块,用于分别获取所述目标主体词和所述目标评论词的极性信息;所述极性信息用于表征所述目标主体词或所述目标评论词的正负向指向,所述正负向指向用于表征褒义或者贬义;

38、整体极性信息获取模块,用于根据获取到的所述目标主体词和目标评论词的极性信息,确定所述评论文本的整体极性信息,所述整体极性信息用于表征对所述评论对象的评论的正负向指向。

39、根据本公开的第三方面,提供一种计算机可读存储介质,所述机器可读存储介质存储有机器可读指令,所述机器可读指令在被处理器调用和执行时,促使所述处理器实现本公开任一实施例的文本分析方法。

40、根据本公开的第四方面,提供一种电子设备,包括

41、处理器;

42、用于存储处理器可执行指令的存储器;

43、其中,所述处理器被配置为用于执行本公开任一实施例的文本分析方法。

44、本公开的实施例提供的技术方案可以包括以下有益效果:

45、本公开实施例提供的文本分析方法及装置、存储介质及电子设备,通过确定所述评论文本中的目标主体词;所述目标主体词用于表征所述评论文本中的评论对象。根据预先获取的主体词和评论词的对应关系,在所述评论文本中位于所述目标主体词前后预设字窗口范围内匹配与所述目标主体词相对应的目标评论词;所述目标评论词用于表征对所述评论对象所做的评论。分别获取所述目标主体词和所述目标评论词的极性信息;所述极性信息用于表征所述目标主体词或所述目标评论词的正负向指向,所述正负向指向用于表征褒义或者贬义。根据获取到的所述目标主体词和目标评论词的极性信息,确定所述评论文本的整体极性信息,所述整体极性信息用于表征对所述评论对象的评论的正负向指向。本公开实施例提供的文本分析方法,由服务器对评论文本进行自动分析,效率较高,成本较低。

46、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1