问诊文本补全模型构建、补全方法、装置、设备及介质与流程

文档序号:35696960发布日期:2023-10-11 19:56阅读:29来源:国知局
问诊文本补全模型构建、补全方法、装置、设备及介质与流程

本发明涉及人工智能技术、文本构建、智慧医疗,尤其涉及一种问诊文本补全模型构建、补全方法、装置、设备及介质。


背景技术:

1、随着线上问诊的兴起,医生在接待患者的问诊活动中经常要重复输入大量相似的内容信息,造成问诊效率低下。

2、联想补全是输入文本时显著提高效率的工具。现有联想补全方法是通过深度学习语言模型,根据用户提供的上文语境预测下文。这种方法虽然能够法根据上文语境,推荐补全文本,进行文本补全。

3、但是由于医疗领域的特殊性,进行文本补全时错误率较高,无法适应医疗领域对于补全内容正确性的要求。此外现有文本补全无法做到个性化。由于每个医生的说话风格不同,用其他医生说出的话去补全特定医生的输入内容,往往容易产生错误或词不达意,无法达到文本补全提高效率的效果。


技术实现思路

1、本发明提供一种问诊文本补全模型构建、补全方法、装置、设备及介质,以解决医疗领域问诊文本补全正确率低、效率差的技术问题。

2、第一方面,本发明提供了一种问诊文本补全模型构建方法,包括:

3、获取问诊文本训练数据和历史问诊文本数据;

4、构建问诊文本标注模型,通过所述问诊文本训练数据训练所述问诊文本标注模型,直到模型收敛;

5、通过训练好的所述问诊文本标注模型对所述历史问诊文本数据标注知识类型,且通过语义识别算法对所述历史问诊文本数据标注疾病名称、医生姓名和医生话术,得到消息数据单元,其中,所述消息数据单元包括所述疾病名称、所述知识类型、所述医生姓名和所述医生话术;

6、在所述疾病名称、所述知识类型和所述医生姓名上,通过层次聚类算法对所有所述消息数据单元进行聚类,得到消息数据集群;

7、在所述消息数据集群中选择一种所述消息数据单元中的所述医生话术作为代表话术;

8、在所述代表话术中选取部分语段作为触发词,将所述触发词和所述代表话术配对组成触发词代表话术对;

9、将所述触发词代表话术对按医生姓名分类存储,构建问诊文本补全模型。

10、第二方面,本发明提供了一种问诊文本补全方法,包括:

11、获取待补全问诊文本和医生姓名;

12、将所述待补全问诊文本和所述医生姓名输入问诊文本补全模型,得到补全文本内容;其中,所述问诊文本补全模型采用如上述的问诊文本补全模型构建方法构建得到。

13、第三方面,本发明提供了一种问诊文本补全模型构建装置,包括:

14、获取模块,用于获取问诊文本训练数据和历史问诊文本数据;

15、构建模块,用于构建问诊文本标注模型,通过所述问诊文本训练数据训练所述问诊文本标注模型,直到模型收敛;

16、标注模块,用于通过训练好的所述问诊文本标注模型对所述历史问诊文本数据标注知识类型,且通过语义识别算法对所述历史问诊文本数据标注疾病名称、医生姓名和医生话术,得到消息数据单元,其中,所述消息数据单元包括所述疾病名称、所述知识类型、所述医生姓名和所述医生话术;

17、聚类模块,用于在所述疾病名称、所述知识类型和所述医生姓名上,通过层次聚类算法对所有所述消息数据单元进行聚类,得到消息数据集群;

18、第一处理模块,用于在所述消息数据集群中选择一种所述消息数据单元中的所述医生话术作为代表话术;

19、第二处理模块,用于在所述代表话术中选取部分语段作为触发词,将所述触发词和所述代表话术配对组成触发词代表话术对;

20、存储模块,用于将所述触发词代表话术对按医生姓名分类存储,得到问诊文本补全模型。

21、第四方面,本发明提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的问诊文本补全模型构建方法的步骤,和/或如上述的问诊文本补全方法的步骤。

22、第五方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的问诊文本补全模型构建方法的步骤,和/或如上述的问诊文本补全方法的步骤。

23、上述问诊文本补全模型构建、补全方法、装置、设备及介质所实现的方案中,通过构建问诊文本标注模型,并通过所述问诊文本训练数据训练所述问诊文本标注模型,通过所述问诊文本标注模型对所述历史问诊文本数据标注知识类型,通过语义识别算法对所述历史问诊文本数据标注疾病名称、医生姓名和医生话术,得到了消息数据单元,实现了对所述历史问诊文本数据的标注。通过对所述消息数据单元进行聚类,可以实现在疾病名称、知识类型和医生姓名上相似度高的消息数据单元组成消息数据集群。即消息数据集群中的所述消息数据单元在疾病名称、知识类型和医生姓名上相似度高。在所述消息数据集群中选择一种所述消息数据单元中的所述医生话术作为代表话术。由于所述消息数据集群中的所述消息单元在疾病名称知识类型和医生姓名上相似度高,因此选出一个所述消息数据单元中的医生话术作为代表话术即可,避免了数据冗余。通过在所述代表话术中选取部分语段作为触发词,将所述触发词和所述代表话术配对组成触发词代表话术对,可以实现通过触发词找到代表话术。通过将所述触发词代表话术对按医生姓名分类存储,由此通过触发词和医生姓名即可对应找到代表话术,从而填充进待补全文本实现文本补全。基于此,本发明提供的问诊文本补全模型构建、补全方法、装置、设备及介质所实现的方案,通过对历史问诊文本数据进行标注,得到消息数据单元,并通过对消息数据单元进行聚类,确定每个所述消息数据集群中的代表话术,通过医生姓名和触发词确定实际文本补全过程中使用的代表话术。使得补全内容均来自于相同医生说过的历史消息,具有较高的正确性,且符合医生本人的语言习惯。提高了问诊文本补全的效率。



技术特征:

1.一种问诊文本补全模型构建方法,其特征在于,包括:

2.根据权利要求1所述的问诊文本补全模型构建方法,其特征在于,所述通过所述问诊文本训练数据训练所述问诊文本标注模型,直到模型收敛,包括:

3.根据权利要求1所述的问诊文本补全模型构建方法,其特征在于,所述层次聚类算法的距离方程为:

4.根据权利要求1所述的问诊文本补全模型构建方法,其特征在于,所述在所述消息数据集群中选择一种所述消息数据单元中的所述医生话术作为代表话术,包括:

5.根据权利要求1所述的问诊文本补全模型构建方法,其特征在于,所述在所述代表话术中选取部分语段作为触发词,将所述触发词和所述代表话术配对组成触发词代表话术对,包括:

6.一种问诊文本补全方法,其特征在于,包括:

7.根据权利要求6所述的问诊文本补全方法,其特征在于,所述将所述待补全问诊文本和所述医生姓名输入问诊文本补全模型,得到补全文本内容,包括:

8.一种问诊文本补全模型构建装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述问诊文本补全模型构建方法的步骤,和/或如权利要求6或7所述的问诊文本补全方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述问诊文本补全模型构建方法的步骤,和/或如权利要求6或7所述的问诊文本补全方法的步骤。


技术总结
本发明涉及人工智能技术、文本构建、智慧医疗技术领域,公开了一种问诊文本补全模型构建、补全方法、装置、设备及介质。本发明提供的问诊文本补全模型构建、补全方法、装置、设备及介质所实现的方案,通过对历史问诊文本数据进行标注,得到消息数据单元,并通过对消息数据单元进行聚类,确定每个所述消息数据集群中的代表话术,通过医生姓名和触发词确定实际文本补全过程中使用的代表话术。使得补全内容均来自于相同医生说过的历史消息,具有较高的正确性,且符合医生本人的语言习惯。提高了问诊文本补全的效率。

技术研发人员:徐卓扬
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1