本发明涉及人工智能,尤其涉及一种剪枝范式的病症片段抽取方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、随着人工智能的发展,机器学习技术在医疗领域成功落地的应用场景越来越多,在中医问诊过程中,需要获取患者的对话信息,根据对话信息进行病症分析,而门诊专家们的知识库中多为病症的专业名词,因此需要利用人工智能技术提取患者对话信息中的口语化病症片段信息,将其转化为专业名词以供医师进行参考。
2、现有的病症片段提取技术多为单一特征的病症片段抽取,例如,基于阅读理解的问答任务,实际应用中,一次对话信息可能包含多种病症特征,仅考虑单一病症信息提取,可能对导致抽取结果不够精确,影响医生进行病症判断,从而导致进行病症片段抽取时的精确度较低。
技术实现思路
1、本发明提供一种剪枝范式的病症片段抽取方法、装置及计算机可读存储介质,其主要目的在于解决进行病症片段抽取时的精确度较低的问题。
2、为实现上述目的,本发明提供的一种剪枝范式的病症片段抽取方法,包括:
3、获取患者的对话文本,利用预设的融合特征模型对所述对话文本进行特征抽取,得到文本特征序列;
4、利用联合训练后的起始分析模型提取出所述文本特征序列对应的起始特征,对所述起始特征进行归一化,并利用归一化后的起始特征构建所述文本特征序列的起始概率分布序列;
5、利用联合训练后的结束分析模型提取出所述文本特征序列对应的结束特征,对所述结束特征进行归一化,并利用归一化后的结束特征构建所述文本特征序列的结束概率分布序列;
6、根据所述起始概率分布序列以及所述结束概率分布序列建立所述文本特征序列的起止分布组合;
7、利用预设的组合剪枝算法对所述起止分布组合进行剪枝操作,得到目标片段组合,并将所述目标片段组合所对应的文本作为病症片段。
8、可选地,所述利用预设的融合特征模型对所述对话文本进行特征抽取,得到文本特征序列,包括:
9、对所述对话文本进行文本分词,得到对话词语序列;
10、按照从前到后的顺序将所述对话词语序列中的对话词语转化成词向量,得到对话词向量序列;
11、逐个选取所述对话词向量序列中的对话词向量作为目标词向量,为所述目标词向量添加位置向量,得到标准词向量序列;
12、利用所述融合特征模型的多头注意力机制对所述标准词向量序列进行转化,得到隐向量序列;
13、利用所述融合特征模型的融合层对所述隐向量序列进行特征融合,得到文本特征序列。
14、可选地,所述利用所述融合特征模型的多头注意力机制对所述标准词向量序列进行转化,得到隐向量序列,包括:
15、逐个选取所述标准词向量序列中的标准词向量作为目标标准词向量,利用所述目标标准词向量分别生成目标问题向量、目标关键词向量以及目标信息词向量;
16、将所述目标问题词向量与所述目标关键词向量进行叉乘运算,得到目标叉乘矩阵,对所述目标叉乘矩阵进行降维处理,得到目标叉乘向量;
17、将所述目标叉乘向量与所述目标信息词向量进行点乘运算,得到标准词向量权重,对所述标准词向量权重进行归一化处理,得到目标词向量权重;
18、利用所述多头注意力机制根据所述目标词向量权重与所述目标标准词向量生成目标隐向量,将所有的所述目标隐向量汇集成所述隐向量序列。
19、可选地,所述利用所述融合特征模型的融合层对所述隐向量序列进行特征融合,得到文本特征序列,包括:
20、将所述隐向量序列与所述标准词向量序列相加成融合向量序列,利用所述融合层的归一化函数对所述融合向量序列进行归一化,得到初级融合序列;
21、利用所述融合层的前馈网络对所述初级融合序列进行前馈传播,得到次级融合序列;
22、将所述初级融合序列与所述次级融合序列相加成标准融合序列,利用所述融合层的归一化函数对所述标准融合序列进行归一化,得到文本特征序列。
23、可选地,所述利用联合训练后的起始分析模型提取出所述文本特征序列对应的起始特征,包括:
24、逐个选取所述文本特征序列中的文本特征向量作为目标特征向量,利用所述起始分析模型的起始连接网络对所述目标特征向量进行起始预测,得到起始特征向量;
25、将所有的起始特征向量按照所述文本特征序列的序列顺序进行拼接,得到所述文本特征序列对应的起始特征。
26、可选地,所述利用归一化后的起始特征构建所述文本特征序列的起始概率分布序列,包括:
27、逐个选取所述文本特征序列中的文本特征向量所对应的起始特征作为目标起始特征,将目标起始特征归一化后的数值作为所述文本特征向量的起始概率;
28、将所有的所述文本特征向量的起始概率按照所述文本特征序列的顺序汇集成所述起始概率分布序列。
29、可选地,所述根据所述起始概率分布序列以及所述结束概率分布序列建立所述文本特征序列的起止分布组合,包括:
30、逐个选取所述对话词语序列中的对话词语作为目标起始词语,从所述目标文本特征序列中选取所述目标起始词语对应的文本特征向量作为目标起始向量,从所述起始概率分布序列中提取出所述目标起始向量所对应的起始概率作为目标起始概率;
31、逐个选取所述对话词语序列中位于所述目标起始词语之后的对话词语作为目标结束词语,从所述目标文本特征序列中选取所述目标结束词语对应的文本特征向量作为目标结束向量,从所述结束概率分布序列中提取出所述目标结束序列所对应的结束概率作为目标结束概率;
32、将所述对话文本中的从所述目标起始词语开始至所述目标结束词语结束的文本片段作为目标起止片段,将所述目标起始概率乘以所述目标结束概率得到的概率值作为所述目标起止片段的分布概率,将所有的所述目标起止片段以及所述目标起止片段对应的分布概率汇集成所述起止分布组合。
33、为了解决上述问题,本发明还提供一种剪枝范式的病症片段抽取装置,所述装置包括:
34、特征提取模块,用于获取患者的对话文本,利用预设的融合特征模型对所述对话文本进行特征抽取,得到文本特征序列;
35、起始预测模块,用于利用联合训练后的起始分析模型提取出所述文本特征序列对应的起始特征,对所述起始特征进行归一化,并利用归一化后的起始特征构建所述文本特征序列的起始概率分布序列;
36、结束预测模块,用于利用联合训练后的结束分析模型提取出所述文本特征序列对应的结束特征,对所述结束特征进行归一化,并利用归一化后的结束特征构建所述文本特征序列的结束概率分布序列;
37、起止组合模块,用于根据所述起始概率分布序列以及所述结束概率分布序列建立所述文本特征序列的起止分布组合;
38、片段抽取模块,用于利用预设的组合剪枝算法对所述起止分布组合进行剪枝操作,得到目标片段组合,并将所述目标片段组合所对应的文本作为病症片段。
39、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
40、至少一个处理器;以及,
41、与所述至少一个处理器通信连接的存储器;其中,
42、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的剪枝范式的病症片段抽取方法。
43、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的剪枝范式的病症片段抽取方法。
44、本发明实施例通过利用预设的融合特征模型对所述对话文本进行特征抽取,得到文本特征序列,能够提取出文本特征,为后续的起止位置预测奠定了基础,通过利用联合训练后的起始分析模型提取出所述文本特征序列对应的起始特征,能够对确定所述对话文本中每个词语的起始特征,进而确定所述对话文本中每个词语的起始概率,提高了后续病症片段提取的准确性,利用联合训练后的结束分析模型提取出所述文本特征序列对应的结束特征,能够对确定所述对话文本中每个词语的结束特征,进而确定所述对话文本中每个词语的结束概率,提高了后续病症片段提取的准确性,通过根据所述起始概率分布序列以及所述结束概率分布序列建立所述文本特征序列的起止分布组合,能够将所述对话文本且分为多个对话片段,并得到所述对话片段对应的分布概率,进而方便后续通过所述分布概率提取出可能性大的对话片段作为病症片段,通过利用预设的组合剪枝算法对所述起止分布组合进行剪枝操作,得到目标片段组合,可以从有无包含标点符号、信息是否明显以及病症概率可能性等三方面进一步去除所述起止分布组合中不符合病症片段特征的起止片段,从而提高所述病症片段提取的准确性。因此本发明提出的剪枝范式的病症片段抽取方法、装置、电子设备及计算机可读存储介质,可以解决进行病症片段抽取时的精确度较低的问题。