本申请涉及自然语言处理,具体涉及一种文本处理方法、装置、电子设备及存储介质。
背景技术:
1、随着终端移动设备的智能化和交互技术的高速发展,使得人们的在线交流沟通更加高效与频繁,人们越来越习惯通过互联网来表达自己的所思所想,发表自己的观点,例如在短视频平台下发表自己的看法及态度,表达自己的心情,如何从互联网中的文本信息中分析出信息发布者的情感倾向,是自然语言处理技术领域的重要内容之一。
2、现有的技术主要是通过对业务相关的评论文本进行情感分析,然而,仅从文本特征角度分析,导致情感分析的特征维度较为单一,不能准确定位语境信息,进而造成情感分类识别的准确率不高。
技术实现思路
1、有鉴于此,本申请提供了一种文本处理方法、装置、电子设备及存储介质,能够在情感分类过程中,从多个特征维度进行情感预测分析,从而可准确定位语境信息,提升情感分类识别的准确率。
2、根据本公开的第一个方面,提供了一种文本处理方法,包括:
3、获取待进行情感分类的目标文本;
4、提取所述目标文本中热点话题对应的话题文本,所述话题文本中包含字符文本以及表情文本;
5、将所述话题文本输入预设语言模型,得到所述字符文本的第一特征向量,以及所述表情文本的第二特征向量;
6、将所述第一特征向量和所述第二特征向量的拼接向量输入预设情感分类模型,得到所述目标文本中所述热点话题对应的情感分类结果,其中,所述预设情感分类模型用于根据所述拼接向量确定所述话题文本对应不同情感极性的预测分值,将最高所述预设分值对应的情感极性确定为所述热点话题的情感分类结果,所述情感极性用于表征作者对所述热点话题的情感倾向。
7、根据本公开的第二个方面,提供了一种文本处理装置,包括:
8、获取模块,用于获取待进行情感分类的目标文本;
9、提取模块,用于提取所述目标文本中热点话题对应的话题文本,所述话题文本中包含字符文本以及表情文本;
10、第一确定模块,用于将所述话题文本输入预设语言模型,得到所述字符文本的第一特征向量,以及所述表情文本的第二特征向量;
11、第二确定模块,用于将所述第一特征向量和所述第二特征向量的拼接向量输入预设情感分类模型,得到所述目标文本中所述热点话题对应的情感分类结果,其中,所述预设情感分类模型用于根据所述拼接向量确定所述话题文本对应不同情感极性的预测分值,将最高所述预设分值对应的情感极性确定为所述热点话题的情感分类结果,所述情感极性用于表征作者对所述热点话题的情感倾向。
12、根据本公开的第三个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行前述第一方面的方法。
13、根据本公开的第四个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行前述第一方面的方法。
14、根据本公开的第五个方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如前述第一方面的方法。
15、本公开提供的文本处理方法、装置、电子设备及存储介质,可首先获取待进行情感分类的目标文本,进而在目标文本中提取热点话题对应的话题文本,其中,话题文本中包含字符文本以及表情文本;之后可将话题文本输入预设语言模型,得到字符文本的第一特征向量,以及表情文本的第二特征向量;最后将第一特征向量和第二特征向量的拼接向量输入预设情感分类模型,以使预设情感分类模型根据所述拼接向量确定所述话题文本对应不同情感极性的预测分值,将最高所述预设分值对应的情感极性确定为所述热点话题的情感分类结果。本公开中的技术方案,在进行情感分类过程中,在基于字符文本之外,还引入表情文本这一特征维度,利用字符文本和表情文本综合进行情感分类结果的预测,可增强情感识别能力,便于精准定位语境信息,提升情感分类识别的准确率。
1.一种文本处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述提取所述目标文本中热点话题对应的话题文本,包括:
3.根据权利要求2所述的方法,其特征在于,所述在所述目标文本中提取所述热点话题对应的话题文本,包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述话题文本输入预设语言模型,得到所述字符文本的第一特征向量,以及所述表情文本的第二特征向量,包括:
5.根据权利要求4所述的方法,其特征在于,所述预设语言模型的训练过程包括:
6.根据权利要求1所述的方法,其特征在于,所述预设情感分类模型包括全连接层,所述全连接层中存在预设数量个层级节点,每个层级节点表示一种情感极性;
7.根据权利要求1所述的方法,其特征在于,在将所述第一特征向量和所述第二特征向量的拼接向量输入预设情感分类模型,得到所述目标文本中所述热点话题对应的情感分类结果之后,所述方法还包括:
8.一种文本处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。
11.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项所述的方法。