本申请涉及智能车辆领域,尤其涉及一种实体信息确定方法、装置和设备。
背景技术:
1、车载语音系统的自然语言理解包含语音文本所包括的实体识别阶段,其识别效果决定了车载功能是否可以成功执行。因此提高车载语音系统的实体识别的准确率是非常重要的。
2、现有技术中,通常通过提取文字的语义特征信息以及特征信息的关联来进行实体信息的识别。
3、然而现有技术中,对于复杂场景下,非连续命名实体的识别准确性较低。
技术实现思路
1、本申请提供一种实体信息确定方法、装置和设备,用以解决非连续命名实体的识别准确性较低的问题。
2、第一方面本申请提供一种实体信息确定方法,所述方法包括:
3、获取语音文本,并提取所述语音文本中每一文字的语义特征,其中,所述语音文本中包括n个文字,n为大于1的正整数;
4、根据每一文字的语义特征,确定各个文字的位置特征,其中,所述位置特征表征对应文字相对于所述语音文本中其他文字的相对位置特征;
5、根据每一文字的语义特征和位置特征,确定每一文字对应的文字分数,其中,所述文字分数表征对应文字的实体识别类别分数;
6、根据各个文字的文字分数,确定所述语音文本的实体信息。
7、在可选的一种实施方式中,根据每一文字的语义特征,确定各个文字的位置特征,包括:
8、根据预设的第一权重矩阵,对每一文字的语义特征进行特征映射,确定各个文字的位置特征信息,其中,所述第一权重矩阵用于表征每一文字的语义特征与所述文字位置特征两者之间的相关性。
9、在可选的一种实施方式中,根据每一文字的语义特征和位置特征,确定每一文字的文字分数,包括:
10、根据每一文字的语义特征和位置特征,确定每一所述文字的最终特征;
11、根据每一文字的最终特征,确定每一文字的文字分数。
12、在可选的一种实施方式中,根据每一文字的语义特征和位置特征,确定每一所述文字的最终特征,包括:
13、根据预设的第二权重矩阵,确定每一文字的位置特征所占对应文字的最终特征的特征比例,其中,所述第二权重矩阵用于表征对应文字在所述语音文本中的位置重要性;
14、根据每一文字的所述特征比例、位置特征以及语义特征,确定每一所述文字的最终特征。
15、在可选的一种实施方式中,根据每一文字的最终特征,确定每一文字的文字分数,包括:
16、对每一文字的最终特征进行矩阵转化处理,确定每一所述文字在各个实体分类的文字分数。
17、在可选的一种实施方式中,根据各个文字的文字分数,确定所述语音文本的实体信息,包括:
18、若文字分数大于预设阈值,则确定所述语音文本的实体信息包括所述文字分数对应的实体分类;
19、若文字分数小于或等于所述预设阈值,则确定所述语音文本的实体信息不包括所述文字分数对应的实体分类。
20、第二方面,本申请提供一种实体信息确定装置,所述装置包括:
21、第一处理单元,用于获取语音文本,并提取所述语音文本中每一文字的语义特征,其中,所述语音文本中包括n个文字,n为大于1的正整数;
22、第一确定单元,用于根据每一文字的语义特征,确定各个文字的位置特征,其中,所述位置特征表征对应文字相对于所述语音文本中其他文字的相对位置特征;
23、第二确定单元,用于根据每一文字的语义特征和位置特征,确定每一文字对应的文字分数,其中,所述文字分数表征对应文字的实体识别类别分数;
24、第二处理单元,用于根据各个文字的文字分数,确定所述语音文本的实体信息。
25、第三方面,本申请提供一种电子设备,所述电子设备包括存储器和处理器;
26、所述存储器,用于存储计算机程序;
27、所述处理器,用于读取所述存储器存储的计算机程序,并根据所述存储器中的计算机程序执行如第一方面所述的实体信息确定方法。
28、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面所述的实体信息确定方法。
29、第五方面,本申请提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的实体信息确定方法。
30、本申请提供的实体信息确定方法、装置和设备,通过以下步骤:获取语音文本,并提取语音文本中每一文字的语义特征,其中,语音文本中包括n个文字,n为大于1的正整数;根据每一文字的语义特征,确定各个文字的位置特征,其中,位置特征表征对应文字相对于语音文本中其他文字的相对位置特征;根据每一文字的语义特征和位置特征,确定每一文字对应的文字分数;根据各个文字的文字分数,确定语音文本的实体信息。这个过程中提取了语音文本中的每一文字的高层的位置特征信息,提高了实体信息识别的准确性。
1.一种实体信息确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,根据每一文字的语义特征,确定各个文字的位置特征,包括:
3.根据权利要求1所述的方法,其特征在于,根据每一文字的语义特征和位置特征,确定每一文字对应的文字分数,包括:
4.根据权利要求3所述的方法,其特征在于,根据每一文字的语义特征和位置特征,确定每一所述文字的最终特征,包括:
5.根据权利要求3所述的方法,其特征在于,根据每一文字的最终特征,确定每一文字的文字分数,包括:
6.根据权利要求5所述的方法,其特征在于,根据各个文字的文字分数,确定所述语音文本的实体信息,包括:
7.一种实体信息确定装置,其特征在于,所述装置包括:
8.一种电子设备,其特征在于,包括存储器和处理器;
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-6任一项所述的实体信息确定方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的实体信息确定方法。