本发明涉及基于人工智能、智慧医疗及金融科技,尤其涉及一种基于人工智能的病案文书识别方法、装置、设备及介质。
背景技术:
1、在金融科技领域,例如保险理赔场景中,需要针对用户提交的一系列病案文书进行病案类型的划分,同时针对不同的病案类型抽取相应的病案信息,比如当病案文书为出院记录时,需要抽取病案文书文书中包含的用户信息、出入院日期、病案号、床号等,以便用于后续的业务处理。病案文书的划分和抽取质量直接决定着理赔人员能否准确高效的进行理赔服务。
2、在智慧医疗领域,例如对病患制定治疗方案时,需要了解病患已接受的治疗,入院时间、病案号、床号等,需要抽取病案文书文书中包含的用户信息、入院日期、病案号、床号等,以便制定治疗方案,病案文书的划分和抽取质量直接决定着医护人员能否准确高效的对病患进行治疗。
3、现有技术中针对病案文书的处理流程主要是先进行图像的光学字符识别技术(optical character recognition,ocr),获取病案文书中的文本内容。然后,将病案文书的类型划分和基本信息抽取作为独立的任务选用为不同的自然语言处理任务提供支持的通用模型(bidirectionalencoder representations from transformer,bert)进行处理,但在bert模型的处理过程中,需要标注一定量的数据集,标注过程带来的成本较高,同时造成研发周期较长,智能程度不高。
技术实现思路
1、有鉴于此,本发明提供了一种基于人工智能的病案文书识别方法、装置、设备及介质,用于解决现有技术中将病案文书类型划分和病案信息抽取作为独立的任务并没有考虑病案文书的类型和病案信息的内在关联性,造成病案文书的识别不准确的问题。
2、为达上述之一或部分或全部目的或是其他目的,本发明提出一种基于人工智能的病案文书识别方法,包括:在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息,所述历史病案文书库为按历史病案文书的类型对所述历史病案文书进行存储的数据库;
3、根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例;
4、获取待识别病案文书,并将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据;
5、将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据,所述预设模型为开源的对话模型。
6、另一方面,本申请提供了一种基于人工智能的病案文书识别装置,所述装置包括:
7、数据采集模块,用于在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息,所述历史病案文书库为按历史病案文书的类型对所述历史病案文书进行存储的数据库;
8、构建模块,用于根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例;
9、拼接模块,用于获取待识别病案文书,并将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据;
10、识别模块,用于将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据,所述预设模型为开源的对话模型。
11、另一方面,本申请提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行:在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息,所述历史病案文书库为按历史病案文书的类型对所述历史病案文书进行存储的数据库;根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例;获取待识别病案文书,并将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据;将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据,所述预设模型为开源的对话模型。
12、另一方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行:在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息,所述历史病案文书库为按历史病案文书的类型对所述历史病案文书进行存储的数据库;根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例;获取待识别病案文书,并将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据;将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据,所述预设模型为开源的对话模型。
13、实施本发明实施例,将具有如下有益效果:
14、通过在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息,所述历史病案文书库为按历史病案文书的类型对所述历史病案文书进行存储的数据库;根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例;获取待识别病案文书,并将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据;将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据,所述预设模型为开源的对话模型,通过构建输入示例,将历史病案文书的类型和病案信息进行关联,通过将输入示例和待识别病案文书进行拼接,使得得到的所述待识别病案文书的结果数据也具有类型和病案信息的关联,增加了其内在的语义交互,降低了模型推理的难度,识别效果也更好,同时,避免采用bert模型,降低了标注的成本,加速了产品的研发周期。
1.一种基于人工智能的病案文书识别方法,其特征在于,包括:
2.如权利要求1所述的基于人工智能的病案文书识别方法,其特征在于,在所述在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书的步骤之前,还包括:
3.如权利要求1所述的基于人工智能的病案文书识别方法,其特征在于,所述在历史病案文书库中选择不同类型的历史病案文书,作为目标病案文书,并记录所述目标病案文书的类型,对所述目标病案文书进行标注,得到所述目标病案文书的病案信息的步骤,包括:
4.如权利要求1所述的基于人工智能的病案文书识别方法,其特征在于,所述根据所述目标病案文书的类型和所述目标病案文书的病案信息构建输入示例的步骤,包括:
5.如权利要求4所述的基于人工智能的病案文书识别方法,其特征在于,在所述将所述目标病案文书的类型和所述目标病案文书的所述病案信息包含的目标实体信息按预设格式进行整理,得到所述输入示例的步骤之前,还包括:
6.如权利要求1所述的基于人工智能的病案文书识别方法,其特征在于,所述将各个所述输入示例和所述待识别病案文书进行拼接,得到输入数据的步骤,包括:
7.如权利要求1所述的基于人工智能的病案文书识别方法,其特征在于,在所述将所述输入数据输入预设模型,得到所述待识别病案文书的结果数据的步骤之后,还包括:
8.一种基于人工智能的病案文书识别装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一项所述的基于人工智能的病案文书识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的基于人工智能的病案文书识别方法的步骤。