本发明涉及计算机自然语言处理,尤其涉及基于bert的四元组心情分析方法、模型、装置、计算机设备及存储介质。
背景技术:
1、常见的属性级情感分析最多只能抽取三元组(aspect-category-sentiment)或(aspect-opinion-sentiment),若要抽取四元组,需要在已抽取的三元组上再进行一次抽取,这会是一个2步的方法,总体精度受到上游任务影响,如两步精度均为80%,那么总体精度理论上只有64%。在自然语言常见下,会有非显式的aspect,opinion,常见方法无法抽取这些内容,导致了数据的浪费。为了解决该技术问题,现提出一种基于bert的四元组心情分析方法、模型、装置、计算机设备及存储介质。
技术实现思路
1、为了解决上述现有技术中存在的技术问题,本发明提供了一种基于bert的四元组心情分析方法、模型、装置、计算机设备及存储介质。
2、为实现上述目的,本发明实施例提供了如下的技术方案:
3、第一方面,在本发明提供的一个实施例中,提供了基于bert的四元组心情分析方法,该方法包括以下步骤:
4、获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征;
5、基于所述全局特征,获得判断数据,所述判断数据为判断输入文本数据中是否包含隐式的属性数据或观点数据;
6、基于所述字符特征,获得输入文本数据中的文本对应的序列标签数据;
7、基于所述字符特征、判断数据和序列标签数据,获得四元组结果。
8、作为本发明的进一步方案,所述获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征,包括:
9、获取输入文本数据,所述输入文本数据包括多条语句;
10、将所述输入文本数据转化为第一序列、第二序列和第三序列;所述第一序列为语句序列;所述第二序列为多条语句的分词类型i d值;所述第三序列为多条语句中每个词对应注意力掩码值;
11、利用文本向量化机制将第一序列、第二序列和第三序列映射到高维向量空间,输出用于表示输入文本数据的全局特征和字符特征。
12、作为本发明的进一步方案,所述基于所述全局特征,获得判断数据,所述判断数据为判断输入文本数据中是否包含隐式的属性数据或观点数据,包括:
13、将所述判断数据转换为二维特征向量,用于表示输入文本数据中是否包含隐式的属性数据或观点数据。
14、作为本发明的进一步方案,所述判断数据通过全连接、激活函数和随机失活层三者任一种转换为二维特征向量。
15、作为本发明的进一步方案,所述基于所述字符特征、判断数据和序列标签数据,获得四元组结果,包括:
16、基于判断数据获取输入文本中的候选观点数据和候选属性数据;
17、将候选观点数据与字符特征结合获得第一向量;将候选属性数据与字符特征结合获得第二向量;
18、将第一向量和第二向量结合,获得候选掩码特征;
19、将候选掩码特征变换为维度为n*s+1的向量,其中n表示药品名称的标签数量,s表示药品分类的标签数量,即获得四元组结果输出。
20、作为本发明的进一步方案,所述第一向量和第二向量可以通过相加函数或拼接函数进行结合。
21、第二方面,在本发明提供的又一个实施例中,提供了基于bert的四元组心情分析模型,该模型包括:bert模块和信息处理模块;
22、所述bert模块,用于获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征。
23、所述信息处理模块,用于基于所述全局特征获得判断数据,所述第一结算结果为判断输入文本数据中是否包含属性数据和观点数据;基于所述字符特征,获得输入文本数据中的文本对应的序列标签数据;基于所述字符特征、判断数据和序列标签数据,获得四元组结果。
24、第三方面,在本发明提供的又一个实施例中,提供了基于bert的四元组心情分析装置,该装置包括:第一模块、第二模块、第三模块和第四模块。
25、所述第一模块,用于获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征。
26、所述第二模块,用于基于所述全局特征获得判断数据,所述第一结算结果为判断输入文本数据中是否包含属性数据和观点数据。
27、所述第三模块,用于基于所述字符特征,获得输入文本数据中的文本对应的序列标签数据。
28、所述第四模块,用于基于所述字符特征、判断数据和序列标签数据,获得四元组结果。
29、第四方面,在本发明提供的又一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器加载并执行所述计算机程序时实现基于bert的四元组心情分析方法的步骤。
30、第五方面,在本发明提供的再一个实施例中,提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器加载并执行时实现所述基于bert的四元组心情分析方法的步骤。
31、本发明提供的技术方案,具有如下有益效果:
32、本发明提供的基于bert的四元组心情分析方法、模型、装置、计算机设备及存储介质,本方法获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征,基于所述全局特征,获得判断数据,所述判断数据为判断输入文本数据中是否包含隐式的属性数据或观点数据;基于所述字符特征,获得输入文本数据中的文本对应的序列标签数据;基于所述字符特征、判断数据和序列标签数据,获得四元组结果。本发明能够实现对四元组获取,解决了现有技术抽取四元组结果的不精准问题,同时还有耗时/耗算力的问题。
33、本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
1.一种基于bert的四元组心情分析方法,其特征在于,该方法包括:
2.如权利要求1所述的基于bert的四元组心情分析方法,其特征在于,所述获取输入文本数据,并对所述输入文本数据进行特征提取,以得到全局特征和字符特征,包括:
3.如权利要求1所述的基于bert的四元组心情分析方法,其特征在于,所述基于所述全局特征,获得判断数据,所述判断数据为判断输入文本数据中是否包含隐式的属性数据或观点数据,包括:
4.如权利要求3所述的基于bert的四元组心情分析方法,其特征在于,所述判断数据通过全连接、激活函数和随机失活层三者任一种转换为二维特征向量。
5.如权利要求1所述的基于bert的四元组心情分析方法,其特征在于,所述基于所述字符特征、判断数据和序列标签数据,获得四元组结果,包括:
6.如权利要求1所述的基于bert的四元组心情分析方法,其特征在于,所述第一向量和第二向量通过相加函数或拼接函数进行结合。
7.一种基于bert的四元组心情分析模型,其特征在于,该模型包括:bert模块和信息处理模块;
8.一种基于bert的四元组心情分析装置,其特征在于,该装置包括:第一模块、第二模块、第三模块和第四模块;
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器加载并执行所述计算机程序时实现如权利要求1-5任一项所述的基于bert的四元组心情分析方法的步骤。
10.一种存储介质,存储有计算机程序,所述计算机程序被处理器加载并执行时实现如权利要求1-5任一项所述的基于bert的四元组心情分析方法的步骤。