基于文本的情绪识别方法、装置、设备及存储介质与流程

文档序号:30518419发布日期:2022-06-25 04:05阅读:160来源:国知局
基于文本的情绪识别方法、装置、设备及存储介质与流程

1.本技术涉及人工智能决策技术领域,尤其涉及一种基于文本的情绪识别方法、装置、设备及存储介质。


背景技术:

2.随着人工智能技术的发展,智能客服机器人得到了广泛的应用。为了使智能客服机器人的客服服务更加人性化,情绪识别作为人机交互的一项关键技术,也成为了热点的研究方向。在客服场景中,与非负面情绪相比,负面情绪占比极低,然而客户的负面情绪往往更受人们关注,目前现有的情绪识别技术大多并未考虑客服场景的特殊性。而且在客服场景中,现有基于文本的情绪识别技术一般使用单一模型识别负面及非负面情绪,一方面由于非负面情绪样本量远大于负面情绪,模型在绝大部分时间内被用于检测人们并不关心的非负面情绪,耗费大量计算资源,严重影响服务吞吐量,情绪识别效率低,另一方面由于单一模型检测出的负面情绪往往不够准确,需要对检测出的数据做进一步复核,工作量大,从而致使情绪识别的效果并不理想。


技术实现要素:

3.有鉴于此,本技术实施例提供了一种基于文本的情绪识别方法、装置、设备及存储介质,可以同时提高对文本进行情绪识别的准确度和效率,兼顾情绪识别的准确性和高效性。
4.本技术实施例的第一方面提供了一种基于文本的情绪识别方法,包括:
5.从待识别文本中提取出用于表征所述待识别文本的特征关键词,将所述特征关键词与预设的前置识别规则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则;
6.若否,则将所述待识别文本输入到预先训练好的第一情绪识别模型中进行二级情绪识别处理,判断所述待识别文本是否为非负面情绪文本;
7.若否,则将所述待识别文本输入到预先训练好的第二情绪识别模型中进行三级情绪识别处理,识别出所述待识别文本对应的情绪分类类别,并根据所述情绪分类类别生成所述待识别文本的情绪识别结果。
8.结合第一方面,在第一方面的第一种可能实现方式中,所述预设的前置识别规则包括短文本匹配规则和/或正则匹配规则,其中:
9.所述短文本匹配规则表示为短文本与情绪标签之间的对应关系,所述短文本为用于验证所述情绪标签是否适用于所述待识别文本的适用条件;
10.所述正则匹配规则表示为正则表达式与情绪标签之间的对应关系,所述正则表达式为用于验证所述情绪标签是否适用于所述待识别文本的适用条件。
11.结合第一方面的第一种可能实现方式,在第一方面的第二种可能实现方式中,所述若所述前置识别规则为短文本匹配规则,则所述将所述特征关键词与预设的前置识别规
则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则,包括:
12.计算所述特征关键词与所述短文本匹配规则中记录的短文本之间的文本关联度,获取所述特征关键词与所述短文本之间的文本关联度值;
13.将所述文本关联度值与预设的关联度阈值进行比较,若所述文本关联度值小于所述关联度阈值,则判断所述特征关键词未命中所述短文本匹配规则。
14.结合第一方面的第一种可能实现方式,在第一方面的第三种可能实现方式中,所述若所述前置识别规则为正则匹配规则,则所述将所述特征关键词与预设的前置识别规则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则,包括:
15.将所述特征关键词与所述正则匹配规则中记录的正则表达式进行比对,判断所述特征关键词是否与所述正则表达式一致,若不一致,则判断所述特征关键词未命中所述正则匹配规则。
16.结合第一方面,在第一方面的第四种可能实现方式中,所述采用基于fasttext算法搭建的第一情绪识别模型对所述待识别文本进行二级情绪识别处理,判断所述待识别文本是否为非负面情绪文本,包括:
17.采用所述第一情绪识别模型对所述待识别文本中的每个字分别进行第一字向量表征处理,获得所述待识别文本对应的第一字向量集合;
18.将所述第一字向量集合输入到所述第一情绪识别模型的句子表示层中进行句子向量表示,获得用于表征所述待识别文本的第一句子向量;
19.将所述第一句子向量输入到第一情绪识别模型的线性层进行线性变换处理,获得所述待识别文本分别与所述第一情绪识别模型中预设的非负面情绪类别和负面情绪类别之间的匹配概率值;
20.若所述待识别文本与非负面情绪类别之间的匹配概率值大于所述待识别文本与负面情绪类别之间的匹配概率值,则判断所述待识别文本为非负面情绪文本。
21.结合第一方面,在第一方面的第五中可能实现方式中,所述采用基于bert模型训练获得的第二情绪识别模型对所述待识别文本进行三级情绪识别处理,识别出所述待识别文本对应的情绪分类类别,包括:
22.采用所述第二情绪识别模型对所述待识别文本中的每个字分别进行第二子向量表征处理,获得所述待识别文本对应的第二字向量集合;
23.将所述第二字向量集合输入到所述第二情绪识别模型的transformer层中进行双向编码表征处理,获得用于表征所述待识别文本的第二句子向量;
24.将所述第一句子向量输入到第二情绪识别模型的线性层进行线性变换处理,获得所述待识别文本在所述第二情绪识别模型预设的各情绪分类类别中的概率分布数据;
25.根据所述概率分布数据,选取所述概率分布数据中概率最大值对应的情绪分类类别作为所述待识别文本对饮的情绪分类类别。
26.结合第一方面的第五种可能实现方式,在第一方面的第六种可能实现方式中,所述将所述第二字向量集合输入到所述第二情绪识别模型的transformer层中进行双向编码表征处理,获得用于表征所述待识别文本的第二句子向量,包括:
27.对所述第二字向量集合中的各字向量分别进行自注意力计算,获取所述第二字向量集合中每个字向量对应的自注意力数据值;
28.将所述每个字向量对应的自注意力数据值进行归一化处理,获得用于表征所述待识别文本的第二句子向量。
29.本技术实施例的第二方面提供了一种基于文本的情绪识别装置,所述基于文本的情绪识别装置包括:
30.一级情绪识别模块,用于从待识别文本中提取出用于表征所述待识别文本的特征关键词,将所述特征关键词与预设的前置识别规则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则;
31.二级情绪识别模块,用于在所述待识别文本未命中所述前置识别规则的情况下,采用基于fasttext算法搭建的第一情绪识别模型对所述待识别文本进行二级情绪识别处理,判断所述待识别文本是否为非负面情绪文本;
32.三级情绪识别模块,用于在所述待识别文本未被判断为非负面情绪文本的情况下,采用基于bert算法搭建的第二情绪识别模型对所述待识别文本进行三级情绪识别处理,识别出所述待识别文本对应的情绪分类类别,根据所述情绪分类类别生成所述待识别文本的情绪识别结果。
33.本技术实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在电子设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面提供的基于文本的情绪识别方法的各步骤。
34.本技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面提供的基于文本的情绪识别方法的各步骤。
35.本技术实施例提供的一种基于文本的情绪识别方法、装置、电子设备及存储介质,具有以下有益效果:
36.本技术通过从待识别文本中提取出用于表征待识别文本的特征关键词,将特征关键词与预设的前置识别规则进行比对,对待识别文本进行一级情绪识别处理,判断特征关键词是否命中前置识别规则;若否,则采用第一情绪识别模型对待识别文本进行二级情绪识别处理,判断待识别文本是否为非负面情绪文本;若否,则采用第二情绪识别模型对待识别文本进行三级情绪识别处理,识别出待识别文本对应的情绪分类类别,根据情绪分类类别生成待识别文本的情绪识别结果。采用多级情绪识别处理来对待识别文本进行分层检测,融合了规则引擎和机器学习算法模型的双重优势,同时提高对文本进行情绪识别的准确度和效率,兼顾了情绪识别的准确性和高效性。
附图说明
37.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
38.图1为本技术实施例提供的一种基于文本的情绪识别方法的实现流程图;
39.图2为本技术实施例提供的基于文本的情绪识别方法中进行一级情绪识别处理的一种方法流程示意图;
40.图3为本技术实施例提供的基于文本的情绪识别方法中进行二级情绪识别处理的方法流程示意图;
41.图4为本技术实施例提供的基于文本的情绪识别方法中进行三级情绪识别处理的方法流程示意图;
42.图5为本技术实施例提供的基于文本的情绪识别方法中进行双向编码表征处理的方法流程示意图;
43.图6为本技术实施例提供的一种基于文本的情绪识别装置的基础结构框图;
44.图7为本技术实施例提供的一种电子设备的基本结构框图。
具体实施方式
45.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
46.本技术实施例提供的基于文本的情绪识别方法应用在智能客服机器人系统中。智能客服机器人系统在运行过程中会通过采集客户的语音数据并对语音数据进行语音和语义理解,识别并响应客户的需求,实现人机交互,从而实现为客户提供拟人化的服务。
47.请参阅图1,图1为本技术实施例提供的一种基于文本的情绪识别方法的实现流程图。详述如下:
48.s11:从待识别文本中提取出用于表征所述待识别文本的特征关键词,将所述特征关键词与预设的前置识别规则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则。
49.本实施例中,待识别文本通过智能机器人采集到的客户的语音数据进行文本转化获得。在本实施例中,采用自然语言处理技术对该待识别文本进行文本特征提取处理,获得用于表征该待识别文本特征的特征关键词。示例性的,在智能客服机器人系统中,预先设置有用于执行一级情绪识别的规则列表,该规则列表中存储有多组用于判别待识别文本对应情绪的前置识别规则,所有前置识别规则由人工编写并核对,每组前置识别规则中记录有情绪标签以及针对该情绪标签设定的适用条件。在本实施例中,情绪标签包括但不限于包含有“非负面”情绪标签、“轻微负面”情绪标签、“严重负面”情绪标签等,针对情绪标签设定的适用条件可以表示为用于表征该情绪标签的特征或特征集。智能客服机器人系统在执行一级情绪识别处理时,通过从待识别文本中提取出用于表征该待识别文本的特征关键词,然后将特征关键词与预先设置的所有前置识别规则逐一进行比对,判别该特征关键词是否满足该所有前置识别规则中某一前置识别规则记录的使用条件,若该特征关键词满足某个前置识别规则的适用条件,则判断该特征关键词命中前置识别规则,此时,将该特征关键词命中的前置识别规则中记录的情绪标签作为最终情绪识别结果进行输出。若特征关键词并未满足所有前置识别规则中任何一个前置识别规则的适用条件,则判断该特征关键词未命中前置识别规则,此时对待识别文本进行进一步的二级情绪识别处理。
50.本技术的一些实施例中,示例性的,前置识别规则可以设置为文本匹配规则。具体
地,一组文本匹配规则中记录有一个短文本和一个情绪标签,在该文本匹配规则中,短文本作为验证情绪标签是否适用于待识别文本的适用条件。在一组文本匹配规则中,短文本与情绪标签映射关联,使得一个短文本对应一个唯一的情绪标签。在本实施例中,预先设置的用于执行一级情绪识别的规则列表可以表示为短文本与情绪标签之间的对应关系列表。示例性的,前置识别规则还可以设置为正则匹配规则,具体地,一组正则匹配规则中记录有一个正则表达式和一个情绪标签,在该正则匹配规则中,正则表达式作为验证情绪标签是否适用于待识别文本的适用条件。在一组正则匹配规则中,正则表达式与情绪标签映射关联,使得一个正则表达式对应一个唯一的情绪标签。在本实施例中,预先设置的用于执行一级情绪识别的规则列表可以表示为正则表达式与情绪标签之间的对应关系表。
51.本技术的一些实施例中,请参阅图2,图2为本技术实施例提供的基于文本的情绪识别方法中进行一级情绪识别处理的一种方法流程示意图。详细如下:
52.s21:计算所述特征关键词与所述短文本匹配规则中记录的短文本之间的文本关联度,获取所述特征关键词与所述短文本之间的文本关联度值;
53.s22:将所述文本关联度值与预设的关联度阈值进行比较,若所述文本关联度值小于所述关联度阈值,则判断所述特征关键词未命中所述短文本匹配规则。
54.本实施例中,预设的前置识别规则可以设置为短文本匹配规则,一组短文本匹配规则表示为短文本与情绪标签之间的对应关系,其中记录有一个短文本和一个与该短文本具有映射关联关系的情绪标签。在本实施例中,从待识别文本中提取到用于表征待识别文本的特征关键词后,可以预先对获得的特征关键词和短文本匹配规则中记录的短文本分别进行向量化表示,获得用于表征特征关键词的第一向量以及用于表征短文本的第二向量。通过表征向量来计算特征关键词与短文本之间的文本关联度。具体地,采用余弦相似度算法计算第一向量与第二向量之间夹角余弦值,将该计算得到的夹角余弦值作为特征关键词与短文本之间的文本关联度值。获得特征关键词与短文本之间的文本关联度值之后,即可通过将该计算获得的文本关联度值与预设的关联度阈值进行比较,当文本关联度值小于关联度阈值时,判断特征关键词未命中短文本匹配规则。需要说明的时,当预设的前置识别规则中包含有多组短文本匹配规则时,则逐一计算特征关键词与各短文本匹配规则中记录的短文本之间的文本关联度,进而逐一比较,判断特征关键词是否并未满足所有短文本匹配规则中任何一个短文本匹配规则,若是,则判断该特征关键词为命中短文本匹配规则。在本实施例中,预设的关联度阈值通过用户根据对情绪识别准确性的实际需求在智能客服机器人系统中自定义设置获得。
55.示例性的,在本实施例中,在对特征关键词和短文本分别进行向量化表示时,可以结合语义维度和字面维度进行向量化表示,得到获得用于表征特征关键词的第一向量以及用于表征短文本的第二向量,第一向量和第二向量中均包含有语义维度和字面维度两个维度的特征。
56.本技术的一些实施例中,预设的前置识别规则可以设置为正则匹配规则,一组正则匹配规则表示为正则表达式与情绪标签之间的对应关系,其中记录有一个正则表达式和一个与该正则表达式具有映射关联关系的情绪标签。在本实施例中,正则表达式具体采用ascii(全称american standard code for information interchange,美国信息交换标准代码)字符表示。从待识别文本中提取到用于表征待识别文本的特征关键词后,可以基于
ascii字符编码表预先将特征关键词转化为对应的ascii字符表示,进而,再基于用于表示正则表达式的ascii字符从左到右按字符与特征关键词对应的ascii字符进行一对一比对,判断用于表示正则表达式的ascii字符与特征关键词对应的ascii字符是否一致,若不一致,则说明该特征关键词并不满足正则表达式要求,此时,可以判断该特征关键词未命中该正则匹配规则。可以理解的是,在本实施例中,若预设的前置识别规则中包含有多组正则匹配规则时,则将该特征关键词逐一与各正则匹配规则中记录的正则表达式分别进行比对,判断特征关键词是否并未满足所有正则匹配规则中任何一个正则匹配规则,若是,则判断该特征关键词为命中正则匹配规则。
57.s12:若否,则采用基于fasttext模型训练获得的第一情绪识别模型对所述待识别文本进行二级情绪识别处理,判断所述待识别文本是否为非负面情绪文本。
58.本实施例中,智能客服机器人系统通过采用前置识别规则对待识别文本进行一级情绪识别处理后,可以快速准确地识别出某些待识别文本所对应的情绪。针对前置识别规则识别情绪泛化性差的问题,在本实施例中,智能客服机器人系统对于采用前置识别规则未能识别出对应情绪的待识别文本,进一步地,通过二分类处理的方式识别出待识别文本是否为负面情绪文本。示例性的,预先基于fasttext(快速文本分类)模型进行二分类训练,生成用于对待识别文本进行二级情绪识别处理的第一情绪识别模型。进而,将前置识别规则未能识别出对应情绪的待识别文本输入到该第一情绪识别模型中进行二级情绪识别处理,由该第一情绪识别模型输出该待识别文本是否为非负面情绪文本的结果。在机器人客服场景中,非负面情绪的占比远大于负面情绪的占比,而负面情绪更为需要关注。因而,通过第一情绪识别模型对待识别文本进行二分类处理,可以筛选出大部分非负面情绪文本,并对筛选出的大部分非负面情绪文本,直接输出“非负面”情绪标签作为最终情绪识别结果。第一情绪识别模型中的二分类处理可以简单且准确率较高地识别出非负面情绪文本。
59.本技术的一些实施例中,请参阅图3,图3为本技术实施例提供的基于文本的情绪识别方法中进行二级情绪识别处理的方法流程示意图。详细如下:
60.s31:采用所述第一情绪识别模型对所述待识别文本中的每个字分别进行第一字向量表征处理,获得所述待识别文本对应的第一字向量集合;
61.s32:将所述第一字向量集合输入到所述第一情绪识别模型的句子表示层中进行句子向量表示,获得用于表征所述待识别文本的第一句子向量;
62.s33:将所述第一句子向量输入到第一情绪识别模型的线性层进行线性变换处理,获得所述待识别文本分别与所述第一情绪识别模型中预设的非负面情绪类别和负面情绪类别之间的匹配概率值;
63.s34:若所述待识别文本与非负面情绪类别之间的匹配概率值大于所述待识别文本与负面情绪类别之间的匹配概率值,则判断所述待识别文本为非负面情绪文本。
64.本实施例中,在构建第一情绪识别模型时,基于fasttext模型搭建得到一个用于进行二分类的网络架构,其中一个分类配置为非负面情绪类别,另一个分类配置为负面情绪类别,然后采用大量分别标记有非负面情绪标签或负面情绪标签的文本预料作为训练样本对该基于fasttext模型搭建的网络架构进行网络训练,将该网络架构训练至收敛状态,以使得该网络架构具有基于文本内容判断文本是否为非负面情绪文本的能力,从而得到第一情绪识别模型。具体地,第一情绪识别模型中训练好的网络架构包含有句子表示层和线
性层。在本实施例中,采用第一情绪识别模型对待识别文本进行二级情绪识别时,可以将该待识别文本输入到该第一情绪识别模型中,首先采用该第一情绪识别模型将该待识别文本中的字全部拆解,进而对该待识别文本中的每个字分别进行第一字向量表征处理,每个字采用一个向量进行表示,获得每个字对应的字向量,进而再将待识别文本中所有字对应的字向量集合到一起,从而获得该待识别文本对应的第一字向量集合。然后,将该第一字向量集合输入到该第一情绪识别模型的句子表示层中进行句子向量表示,获得用于表征所述待识别文本的第一句子向量。具体地,通过计算第一字向量集合中所有字对应的字向量的均值,将该均值作为用于表征所述待识别文本的第一句子向量。获得第一句子向量后,将该第一句子向量输入到第一情绪识别模型的线性层进行线性变换处理,可以获得第一情绪识别模型中非负面情绪类别和负面情绪类别两个情绪分类类别的概率分布,基于概率分布即可获得该待识别文本分别与第一情绪识别模型中预设的非负面情绪类别和负面情绪类别之间的匹配概率值。此时,若待识别文本与非负面情绪类别之间的匹配概率值大于待识别文本与负面情绪类别之间的匹配概率值,则可以判断待识别文本为非负面情绪文本。
65.s13:若是,则采用基于bert模型训练获得的第二情绪识别模型对所述待识别文本进行三级情绪识别处理,识别出所述待识别文本对应的情绪分类类别,根据所述情绪分类类别生成所述待识别文本的情绪识别结果。
66.本实施例中,智能客服机器人系统通过采用第一情绪识别模型对迁至识别规则未能识别出对应情绪的待识别文本进行二级情绪识别后,可以获得小部分未被第一情绪识别模型判断为是非负面情绪文本的待识别文本。在本实施例中,针对未被第一情绪识别模型判断为是非负面情绪文本的待识别文本,可以通过双向编码表征的方式识别出待识别文本对应的情绪分类类别。在本实施例中,预先基于bert(全称bidirectional encoder representations from transformers,双向编码器表示)模型进行情绪分类类别识别训练,生成用于识别待识别文本对应情绪分类类别的第二情绪识别模型。进而将未被第一情绪识别模型判断为是非负面情绪文本的待识别文本输入到该第二情绪识别模型中进行三级情绪识别处理,从而由该第二情绪识别模型输出该待识别文本对应情绪分类类别的结果。获得待识别文本对应的情绪分类类别后,将该情绪分类类别作为最终情绪识别结果进行输出,实现采用多模型对文本进行分层、递进式的检测,同时提高对文本进行情绪识别的准确度和效率,兼顾情绪识别的准确性和高效性。其中,第二情绪识别模型在训练时,采用的训练样本可以标记由更为细化的情绪分类类别信息,比如非负面、轻微负面、严重负面情绪等。通过第二情绪识别模型,可以复核第一情绪识别模型的判断结果,并做出更加细致和准确的情绪分类。
67.本技术的一些实施例中,请参阅图4,图4为本技术实施例提供的基于文本的情绪识别方法中进行三级情绪识别处理的方法流程示意图。详细如下:
68.s41:采用所述第二情绪识别模型对所述待识别文本中的每个字分别进行第二子向量表征处理,获得所述待识别文本对应的第二字向量集合;
69.s42:将所述第二字向量集合输入到所述第二情绪识别模型的transformer层中进行双向编码表征处理,获得用于表征所述待识别文本的第二句子向量;
70.s43:将所述第一句子向量输入到第二情绪识别模型的线性层进行线性变换处理,获得所述待识别文本在所述第二情绪识别模型预设的各情绪分类类别中的概率分布数据;
71.s44:根据所述概率分布数据,选取所述概率分布数据中概率最大值对应的情绪分类类别作为所述待识别文本对饮的情绪分类类别。
72.本实施例中,在构建第二情绪识别模型时,基于bert模型搭建得到一个可以对文本进行双向编码表征的网络架构,在该网络架构中设置有用于对文本进行双向编码表征处理的transformer层和线性层。可以理解的是,transformer层为利用了self-attention(自注意力)机制的包含有多组编码-解码层的网络层。然后采用大量标记有各类情绪分类类别的文本预料作为训练文本对该基于bert模型搭建的网络架构进行模型训练,将该网络架构训练至收敛状态,以使得该网络架构具有可以基于文本内容识别出对文本对应情绪分类类别的能力,从而得到第二情绪识别模型。在本实施例中,采用第二情绪识别模型对待识别文本进行三级情绪识别处理时,可以将该待识别文本输入到该第二情绪识别模型中,首先采用该第二情绪识别模型将该待识别文本中的字全部拆解,进而对该待识别文本中的每个字分别进行第二字向量表征处理,具体地,针对每个字,从字嵌入、段嵌入和位置嵌入三个维度获得该字的三个分向量,进而将该三个分向量进行相加得到该字对应的字向量,获得每个字对应的字向量后,将待识别文本中所有字对应的字向量集合到一起,从而获得该待识别文本对应的第一字向量集合。然后,将该第二字向量集合输入到该第二情绪识别模型的transformer层中进行双向编码表征处理,获得用于表征该待识别文本的第二句子向量。通过将该第一句子向量输入到第二情绪识别模型的线性层进行线性变换处理,即可获得待识别文本在所述第一情绪识别模型预设的各情绪分类类别中的概率分布数据。最后,根据该概率分布数据,选取该概率分布数据中概率最大值对应的情绪分类类别作为待识别文本对饮的情绪分类类别。
73.本技术的一些实施例中,请参阅图5,图5为本技术实施例提供的基于文本的情绪识别方法中进行双向编码表征处理的方法流程示意图。详细如下:
74.s51:对所述第二字向量集合中的各字向量分别进行自注意力计算,获取所述第二字向量集合中每个字向量对应的自注意力数据值;
75.s52:将所述每个字向量对应的自注意力数据值进行归一化处理,获得用于表征所述待识别文本的第二句子向量。
76.本实施例中,将第二字向量集合输入到第二情绪识别模型的transformer层中进行双向编码表征处理时,具体为再transformer层中对第二字向量集合中的各字向量分别进行自注意力计算,获取该第二字向量集合中每个字向量各自对应的自注意力数据值。进而,再将每个字向量各自对应的自注意力数据值进行归一化处理,从而获得用于表征该待识别文本的第二句子向量。
77.以上可以看出,本实施例提供的基于文本的情绪识别方法首先通过前置识别规则对文本进行一级情绪识别,只要命中规则即基于该命中的规则生成文本的情绪识别结果,速度快。在一级情绪识别未检测出负面情绪的情况下,采用fasttext算法搭建的第一情绪识别模型对文本进行二级情绪识别,可以快速识别在客服场景中占比绝大多数的非负面情绪文本,提高了系统的吞吐量和支持并发的能力。进而,在二级情绪识别检测出文本为负面情绪文本的情况下,采用基于bert算法搭建的第二情绪识别模型对文本进行三级情绪识别,获得文本所对应的情绪分类类别,并根据情绪分类类别生成文本的情绪识别结果。以此,通过采用多模型对文本进行分层检测,融合规则引擎和机器学习算法模型的双重优势
来对文本进行情绪识别,同时提高对文本进行情绪识别的准确度和效率,兼顾情绪识别的准确性和高效性。
78.可以理解的是,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
79.本技术的一些实施例中,请参阅图6,图6为本技术实施例提供的一种基于文本的情绪识别装置的基础结构框图。本实施例中该装置包括的各单元用于执行上述方法实施例中的各步骤。具体请参阅上述方法实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。如图6所示,基于文本的情绪识别装置包括:一级情绪识别模块61、二级情绪识别模块62以及三级情绪识别模块63。其中:所述一级情绪识别模块61用于从待识别文本中提取出用于表征所述待识别文本的特征关键词,将所述特征关键词与预设的前置识别规则进行比对,以对所述待识别文本进行一级情绪识别处理,判断所述特征关键词是否命中所述前置识别规则。所述二级情绪识别模块62用于在所述待识别文本未命中所述前置识别规则的情况下,采用基于fasttext算法搭建的第一情绪识别模型对所述待识别文本进行二级情绪识别处理,判断所述待识别文本是否为非负面情绪文本。所述三级情绪识别模块63用于在所述待识别文本未被判断为非负面情绪文本的情况下,采用基于bert算法搭建的第二情绪识别模型对所述待识别文本进行三级情绪识别处理,识别出所述待识别文本对应的情绪分类类别,根据所述情绪分类类别生成所述待识别文本的情绪识别结果。
80.应当理解的是,上述基于文本的情绪识别装置,与上述的基于文本的情绪识别方法一一对应,此处不再赘述。
81.本技术的一些实施例中,请参阅图7,图7为本技术实施例提供的一种电子设备的基本结构框图。如图7所示,该实施例的电子设备7包括:处理器71、存储器72以及存储在所述存储器72中并可在所述处理器71上运行的计算机程序73,例如基于文本的情绪识别方法的程序。处理器71执行所述计算机程序73时实现上述各个基于文本的情绪识别方法各实施例中的步骤。或者,所述处理器71执行所述计算机程序73时实现上述基于文本的情绪识别装置对应的实施例中各模块的功能。具体请参阅实施例中的相关描述,此处不赘述。
82.示例性的,所述计算机程序73可以被分割成一个或多个模块(单元),所述一个或者多个模块被存储在所述存储器72中,并由所述处理器71执行,以完成本技术。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序73在所述电子设备7中的执行过程。例如,所述计算机程序73可以被分割成一级情绪识别模块、二级情绪识别模块以及三级情绪识别模块,各模块具体功能如上所述。
83.所述电子设备可包括,但不仅限于,处理器71、存储器72。本领域技术人员可以理解,图7仅仅是电子设备7的示例,并不构成对电子设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备还可以包括输入输出设备、网络接入设备、总线等。
84.所述处理器71可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、
分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
85.所述存储器72可以是所述电子设备7的内部存储单元,例如电子设备7的硬盘或内存。所述存储器72也可以是所述电子设备7的外部存储设备,例如所述电子设备7上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器72还可以既包括所述电子设备7的内部存储单元也包括外部存储设备。所述存储器72用于存储所述计算机程序以及所述电子设备所需的其他程序和数据。所述存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
86.需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
87.本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。在本实施例中,所述计算机可读存储介质可以是非易失性,也可以是易失性。
88.本技术实施例提供了一种计算机程序产品,当计算机程序产品在移动终端上运行时,使得移动终端执行时实现可实现上述各个方法实施例中的步骤。
89.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
90.所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
91.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
92.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实
施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1