一种病案的分类码确定方法和装置与流程

文档序号:21779700发布日期:2020-08-07 19:56阅读:128来源:国知局
一种病案的分类码确定方法和装置与流程

本发明涉及自然语言处理技术领域,特别是涉及一种病案的分类码确定方法和一种病案的分类码确定装置。



背景技术:

一般来说,患者在前往医院就诊后,医生可以为患者填写病案,该病案可以用于记录医生对患者的疾病情况的诊断。为了可以规范地表示患者的疾病情况,可以采用icd-10(internationalclassificationofdiseases,国际疾病分类)分类码,对病案进行分类,便于统计、提高医疗质量管理、保险费用核算等需要。

然而,对于icd-10分类码来说,影响疾病分类的因素可以包括病因、病理、部位、临床表现等。近似的疾病可以具有不同的icd-10分类码,导致正确地为病案进行分类存在一定的难度。此外,医生在填写患者的病案时,可以基于自身的习惯,采用疾病名称的近义词、简称等方式表达患者的病况。导致病案的分类难度进一步增加。一般来说,病案可以通过人工方式进行分类,然而,由于对病案进行icd-10分类比较复杂,导致人工分类的效率较低。



技术实现要素:

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种病案的分类码确定方法和相应的一种病案的分类码确定装置。

为了解决上述问题,本发明实施例公开了一种病案的分类码确定方法,包括:

获取病案记录;

采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;

采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称;

采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码;所述疾病分类码表包括疾病名称与疾病分类码的映射关系。

可选地,所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称;

若所述病案记录中存在与预设的疾病分类码表匹配的疾病名称,采用所述疾病名称以及所述疾病分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的疾病分类码表匹配的疾病名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

可选地,所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称;

若所述病案记录中存在与预设的同义分类码表匹配的同义名称,采用所述同义名称以及所述同义分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的同义分类码表匹配的同义名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

可选地,所述病案处理模型包括第一处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

采用第一处理模型以及预设的逆序字典表,确定所述病案记录中每一病案字符的逆向文件频率;所述逆序字典表包括所述疾病分类码表中的每一分类码表字符与所述疾病字符对应的出现频次的映射关系;

采用所述病案字符,在所述疾病分类码表中确定至少一个候选疾病名称;

采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

可选地,所述病案处理模型包括第二处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

采用第二处理模型以及预设的医学词典,将所述病案记录分为至少一个分词;

采用所述医学词典,确定所述分词对应的至少一个候选疾病名称;

确定所述候选疾病名称与所述病案记录之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

可选地,所述病案处理模型包括第三处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

采用第三处理模型,获取所述病案记录的病案句向量;

确定所述病案句向量与预设的所述疾病名称的疾病句向量之间的相似度;

采用所述相似度,在所述疾病名称中确定至少一个候选疾病名称,并确定所述候选疾病名称的相似度排序。

可选地,所述采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称的步骤,包括:

基于至少两个所述病案处理模型分别对应的所述候选疾病名称,确定所述候选疾病名称的出现频次;

采用所述候选疾病名称的出现频次以及所述候选疾病名称的相似度排序,确定所述病案记录对应的目标疾病名称。

本发明实施例还公开一种病案的分类码确定装置,包括:

获取模块,用于获取病案记录;

排序确定模块,用于采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;

名称确定模块,用于采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称;

分类码确定模块,用于采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码;所述疾病分类码表包括疾病名称与疾病分类码的映射关系。

可选地,所述排序确定模块包括:

确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称;

若所述病案记录中存在与预设的疾病分类码表匹配的疾病名称,采用所述疾病名称以及所述疾病分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的疾病分类码表匹配的疾病名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

可选地,所述排序确定模块包括:

确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称;

若所述病案记录中存在与预设的同义分类码表匹配的同义名称,采用所述同义名称以及所述同义分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的同义分类码表匹配的同义名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

可选地,所述病案处理模型包括第一处理模型;

所述排序确定模块包括:

采用第一处理模型以及预设的逆序字典表,确定所述病案记录中每一病案字符的逆向文件频率;所述逆序字典表包括所述疾病分类码表中的每一分类码表字符与所述疾病字符对应的出现频次的映射关系;

采用所述病案字符,在所述疾病分类码表中确定至少一个候选疾病名称;

采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

可选地,所述病案处理模型包括第二处理模型;

所述排序确定模块包括:

采用第二处理模型以及预设的医学词典,将所述病案记录分为至少一个分词;

采用所述医学词典,确定所述分词对应的至少一个候选疾病名称;

确定所述候选疾病名称与所述病案记录之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

可选地,所述病案处理模型包括第三处理模型;

所述排序确定模块包括:

采用第三处理模型,获取所述病案记录的病案句向量;

确定所述病案句向量与预设的所述疾病名称的疾病句向量之间的相似度;

采用所述相似度,在所述疾病名称中确定至少一个候选疾病名称,并确定所述候选疾病名称的相似度排序。

可选地,所述名称确定模块包括:

基于至少两个所述病案处理模型分别对应的所述候选疾病名称,确定所述候选疾病名称的出现频次;

采用所述候选疾病名称的出现频次以及所述候选疾病名称的相似度排序,确定所述病案记录对应的目标疾病名称。

本发明实施例还公开一种装置,包括:

一个或多个处理器;和

其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如本发明实施例所述的一个或多个的方法。

本发明实施例还公开一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的一个或多个的方法。

本发明实施例包括以下优点:

通过本发明实施例的病案的分类码确定方法,采用预设的病案处理模型对病案记录进行处理,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;并采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称,从而可以通过病案处理模型确定目标疾病名称,且处理效率高。采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码,从而可以确定病案记录的目标疾病分类码,提高对病案记录进行分类的效率。

附图说明

图1是本发明实施例的一种病案的分类码确定方法实施例的步骤流程图;

图2是本发明实施例的另一种病案的分类码确定方法实施例的步骤流程图;

图3是本发明实施例的一种病案的分类码确定装置实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1,示出了本发明实施例的一种病案的分类码确定方法实施例的步骤流程图,具体可以包括如下步骤:

步骤101,获取病案记录;

在本发明实施例中,可以获取至少一个病案记录。所述病案记录可以用于记录患者的患病情况。所述病案记录可以由医生在预设的医疗系统中填写,或者医生填写在纸质病历后,通过光学字符识别的方式转为电子记录,从而可以获取电子版本的病案记录。

步骤102,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;

在本发明实施例中,所述病案处理模型可以对所述病案记录进行处理,将病案记录转换为其他表现方式,例如,向量、分词等,以便于将病案记录与预设的规范表达的疾病名称进行匹配,并比较病案记录与疾病名称之间的相似度,从而确定所述病案记录对应的至少一个候选疾病名称以及所述至少一个候选疾病名称对应的相似度排序。

在本发明实施例中,所述相似度排序可以为所述病案记录与所述候选疾病名称之间的相似度的排序。所述相似度排序越高,所述病案记录与所述候选疾病名称之间可以具有更高的相似度。

在本发明实施例中,所述病案处理模型可以具有至少一种,每一所述病案处理模型可以确定一组所述候选疾病名称以及所述候选疾病名称对应的相似度排序。每组所述候选疾病名称以及所述候选疾病名称对应的相似度排序中可以包括至少一个候选疾病名称以及所述至少一个候选疾病名称对应的相似度排序。从而在采用多个所述病案处理模型对所述病案记录进行处理时,可以获得多组所述候选疾病名称以及所述候选疾病名称对应的相似度排序。便于基于多种所述病案处理模型,获得更加准确的目标疾病名称。

步骤103,采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称;

在本发明实施例中,可以采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,选择至少一个相似度排序较高的候选疾病名称,作为所述病案记录对应的目标疾病名称。

在本发明实施例中,在具有多种病案记录模型的情况下,可以基于多组候选疾病名称以及所述候选疾病名称对应的相似度排序,确定至少一个各组皆具有较高的相似度排序的候选疾病名称,作为所述病案记录对应的目标疾病名称。

在本发明实施例中,在具有多种病案记录模型的情况下,所述病案记录模型还可以具有权重。可以优先基于权重更高的病案记录模型确定的所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录的目标疾病名称。

在本发明实施例中,根据患者的实际患病情况,所述病案记录可以具有一个目标疾病名称或者两种以上的目标疾病名称。所述目标疾病名称可以同时表达一种疾病诊断,或者两种以上的疾病诊断。例如,疾病名称“蛛网膜下腔出血”可以为一种疾病诊断,疾病名称“颈动脉动脉瘤破裂伴蛛网膜下腔出血”可以为两种疾病诊断。由此,可以根据实际需要,在所述候选疾病名称中,选取将表达两种以上的疾病诊断的疾病名称,作为目标疾病名称。在无法采用一种疾病名称表达患者的患病情况下,例如,采用一种疾病名称表示患者的病因,并采用另一种疾病名称表示患者的临床表现,或者,采用第二个疾病名称表示后遗症等情况下,可以将两种以上的候选疾病名称作为目标疾病名称。

在本发明实施例中,可以在确定至少两种疾病名称后,由人工确定在所述目标疾病名称中选取一最合适的目标疾病名称,从而可以通过机器辅助人工选取目标疾病名称,提高人工分类的处理效率。

步骤104,采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码;所述疾病分类码表包括疾病名称与疾病分类码的映射关系。

在本发明实施例中,所述疾病分类码表可以包括疾病名称以及疾病分类码的映射关系。由此,在确定至少一个所述目标疾病名称之后,可以采用所述疾病分类码表,在所述疾病分类码表中查找所述目标疾病名称对应的疾病分类码,从而可以确定所述病案记录对应的至少一个目标疾病分类码。

通过本发明实施例的病案的分类码确定方法,采用预设的病案处理模型对病案记录进行处理,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;并采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称,从而可以通过病案处理模型确定目标疾病名称,且处理效率高。采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码,从而可以确定病案记录的目标疾病分类码,提高对病案记录进行分类码的效率。

参照图2,示出了本发明实施例的另一种病案的分类码确定方法实施例的步骤流程图,具体可以包括如下步骤:

步骤201,获取病案记录;

在本发明实施例中,可以获取至少一个病案记录。所述病案记录可以用于记录患者的患病情况。所述病案记录可以由医生在预设的医疗系统中填写,或者医生填写在纸质病历后,通过光学字符识别的方式转为电子记录,从而可以获取电子版本的病案记录。

步骤202,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;

在本发明实施例中,所述病案处理模型可以对所述病案记录进行处理,将病案记录转换为其他表现方式,例如,向量、分词等,以便于将病案记录与预设的规范表达的疾病名称进行匹配,并比较病案记录与疾病名称之间的相似度,从而确定所述病案记录对应的至少一个候选疾病名称以及所述至少一个候选疾病名称对应的相似度排序。

在本发明实施例中,所述相似度排序可以为所述病案记录与所述候选疾病名称之间的相似度的排序。所述相似度排序越高,所述病案记录与所述候选疾病名称之间可以具有更高的相似度。

在本发明实施例中,所述病案处理模型可以具有至少一种,每一所述病案处理模型可以确定一组所述候选疾病名称以及所述候选疾病名称对应的相似度排序。每组所述候选疾病名称以及所述候选疾病名称对应的相似度排序中可以包括至少一个候选疾病名称以及所述至少一个候选疾病名称对应的相似度排序。从而在采用多个所述病案处理模型对所述病案记录进行处理时,可以获得多组所述候选疾病名称以及所述候选疾病名称对应的相似度排序。便于基于多种所述病案处理模型,获得更加准确的目标疾病名称。

在本发明的一种实施例中,所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

s11,确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称;

在本发明实施例中,所述疾病分类码表中可以存储有疾病名称。所述病案记录可以包括所述疾病名称。则此时可以不需要采用预设的病案处理模型确定所述病案记录对应的目标疾病名称,而可以直接通过匹配关键字的方式,确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称。

在本发明实施例中,所述病案记录中设置有疾病诊断一栏,所述疾病诊断一栏中可以填写医生对患者的疾病诊断信息,由此,可以在疾病诊断一栏中确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称,进一步提高确定目标疾病分类码的效率。

s12,若所述病案记录中存在与预设的疾病分类码表匹配的疾病名称,采用所述疾病名称以及所述疾病分类码表,确定所述病案记录对应的目标疾病分类码;

在本发明实施例中,若所述病案记录中存在与预设的疾病分类码表匹配的疾病名称,则此时可以认为为患者填写了规范的疾病诊断,可以不需要采用预设的病案处理模型确定所述病案记录对应的目标疾病名称,而可以基于所述疾病分类码表中疾病名称与疾病分类码的映射关系,将所述疾病名称对应的疾病分类码,作为目标疾病分类码,从而可以高效率地确定所述病案记录对应的目标疾病分类码,实现对所述病案记录的分类。

s13,若所述病案记录中不存在与预设的疾病分类码表匹配的疾病名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

在本发明实施例中,若所述病案记录中不存在预设的疾病分类码表匹配的疾病名称,则可以采用预设的病案处理模型对病案记录进行处理,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序,并采用候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录的至少一个目标疾病名称,从而得到所述病案记录对应的目标疾病分类码。

在本发明一种实施例中,所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

s21,确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称;

在本发明实施例中,可以基于所述疾病分类码表,设置同义分类码表。所述同义分类码表可以包括所述疾病名称的同义词与所述疾病分类码的映射关系。

在本发明实施例中,所述同义名称可以为所述同义分类码表中存储的与所述疾病名称具有相同意义的名称。所述病案记录可以包括所述同义名称。则此时可以不需要采用预设的病案处理模型确定所述病案记录对应的目标疾病名称,而可以直接通过匹配关键字的方式,确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称。

在本发明实施例中,所述病案记录中设置有疾病诊断一栏,所述疾病诊断一栏中可以填写医生对患者的疾病诊断信息,由此,可以在疾病诊断一栏中确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称,进一步提高确定目标疾病分类码的效率。

s22,若所述病案记录中存在与预设的同义分类码表匹配的同义名称,采用所述同义名称以及所述同义分类码表,确定所述病案记录对应的目标疾病分类码;

在本发明实施例中,若所述病案记录中存在与预设的同义分类码表匹配的同义名称,则可以不需要采用预设的病案处理模型确定所述病案记录对应的目标疾病名称,而可以基于所述同义分类码表中同义名称与疾病分类码的映射关系,将所述同义名称对应的疾病分类码,作为目标疾病分类码,从而可以高效率地确定所述病案记录对应的目标疾病分类码,实现对所述病案记录的分类码。

s23,若所述病案记录中不存在与预设的同义分类码表匹配的同义名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

在本发明实施例中,若所述病案记录中不存在与预设的同义分类码表匹配的同义名称,则可以采用预设的病案处理模型对病案记录进行处理,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序,并采用候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录的至少一个目标疾病名称,从而得到所述病案记录对应的目标疾病分类码。

在本发明的一种实施例中,所述病案处理模型包括第一处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

s31,采用第一处理模型以及预设的逆序字典表,确定所述病案记录中每一病案字符的逆向文件频率;所述逆序字典表包括所述疾病分类码表中的每一分类码表字符与所述分类码表字符对应的出现频次的映射关系;

在本发明实施例中,可以在所述疾病分类码表提取若干分类码表字符。所述分类码表字符可以为所述疾病分类码表中包含的字符。所述分类码表字符可以对应具有出现频次。所述出现频次可以为所述疾病分类码中,包含所述分类码表字符的疾病名称的数量。所述逆序字典表可以用于表示所述分类码表字符与所述分类码表对应的出现频次的映射关系。

在本发明实施例中,所述病案字符可以为所述病案记录中包含的字符。可以采用第一处理模型以及所述逆序字典表,确定所述病案记录中每一病案字符的逆向文件频率。

在本发明实施例中,在所述分类码表字符的出现频次较低的情况下,若病案记录中存在病案字符与该出现频次较低的分类码表字符相同,可以认为所述病案记录可以与包含所述分类码表字符的疾病名称具有更高的相关性。由此,可以确定所述病案字符的逆向文件频率。所述逆向文件频率可以用于为与出现频次较低的分类码表字符相同的病案字符赋予更高的权重。

在本发明实施例中,所述逆向文件频率可以采用第一处理模型以及逆序字典表计算得到。具体地,所述第一处理模型可以采用如下函数表示:

idfi=1/log2(n+1)

其中,idfi为病案字符的逆向文件频率,n为与所述病案字符相同的分类码表字符对应的出现频次。可以采用所述逆序字典表,确定所述与所述病案字符相同的分类码表字符的出现频次。

s32,采用所述病案字符,在所述疾病分类码表中确定至少一个候选疾病名称;

在本发明实施例中,可以将所述疾病分类码表中,包含至少一个所述病案字符的疾病名称,作为候选疾病名称。从而可以在所述疾病分类码表中确定至少一个候选疾病名称。

s33,采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度;

在本发明实施例中,所述病案记录中可以具有至少一个病案字符与一候选疾病名称包含的字符相同。可以采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度。

具体地,在所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的数量越多,以及所述病案字符的逆向文件频率的值越高的情况下,所述病案记录与所述候选疾病名称之间的相似度越高。

作为本发明的一种可选的实施方式,所述相似度可以为在所述病案记录中,与所述候选疾病名称包含的字符相同的至少一个病案字符的逆向文件频率的平方和。

在本发明实施例中,还可以在确定至少一个候选疾病名称之后,确定所述候选疾病名称与所述病案记录之间的最小编辑距离。在所述病案记录中设置有疾病诊断一栏,所述疾病诊断一栏中可以填写医生对患者的疾病诊断信息的情况下,可以确定所述候选疾病名称以及所述疾病诊断信息之间最小编辑距离。

在本发明实施例中,可以综合所述逆向文件频率的逆向文件频率以及所述最小编辑距离,确定所述病案记录以及所述候选疾病名称之间的相似度。具体地,所述相似度可以为所述最小编辑距离,以及在所述病案记录中,与所述候选疾病名称包含的字符相同的至少一个病案字符的逆向文件频率的平方和之间加权平均值。

s34,采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

在本发明实施例中,可以采用所述相似度,由相似度高至相似度低,对所述候选疾病名称进行排序,从而可以得到所述候选疾病名称的相似度排序。从而可以基于所述病案记录中包含的字符,确定所述病案记录对应的候选疾病名称,以及所述候选疾病名称的相似度排序,在所述病案记录与所述疾病名称的相似度较高的情况下,可以以较高的速度获得较好的准确度。

在本发明的一种实施例中,所述病案处理模型包括第二处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

s41,采用第二处理模型以及预设的医学词典,将所述病案记录分为至少一个分词;

在本发明实施例中,所述医学词典可以包括若干现有的医学类别的专有词汇。所述第二处理模型可以为中文分词模型。所述第二处理模型可以采用所述医学词典,将所述病案记录分为至少一个分词。

作为本发明的一种可选的实施方式,所述第二处理模型可以为基于统计的中文分词模型。例如,隐马尔科夫模型,条件随机场模型等,本发明对此不做限制。可以采用所述第二处理模型,对所述病案记录进行分词,从而可以得到至少一个分词的组合,其后,可以采用所述医学词典,对所述至少一个分词的组合进行修正,例如,将被分为若干分词的专有词汇重新组合为正确的专有词汇,或者,调整所述病案记录中的划分分词位置以对中文分词模型的分词结果进行纠错。

作为本发明的一种可选的实施方式,所述第二处理模型可以为基于神经网络的分词模型,例如,lstm(longshort-termmemory,长短期记忆)模型,fcn(fullyconvolutionalnetwork,全卷积网络)模型等。可以采用所述医学词典,对所述第二处理模型进行训练,其后可以采用经过训练的第二处理模型对所述病案记录进行分词,从而将所述病案记录分为至少一个分词。

s42,采用所述医学词典,确定所述分词对应的至少一个候选疾病名称;

在本发明实施例中,所述医学词典还可以包括专业词汇之间的联系。具体地,所述专业词汇之间的联系可以包括近义词关系、同义词关系、上下位词关系。所述专业词汇还可以包括疾病分类码表中的疾病名称。

在本发明实施例中,可以采用所述医学词典,针对每一所述分词,确定与所述分词存在联系的至少一个专业词汇。其后,可以采用所述分词以及所述专业词汇,确定至少一个候选疾病名称。具体地,所述疾病分类码表中,包含所述分词,或者与所述分词存在联系的专业词汇的疾病名称,作为候选疾病名称。

可选地,与所述分词存在联系的专业词汇,可以即为所述疾病分类码表中包含的疾病名称,则可以将与所述分词存在联系的疾病名称作为候选疾病名称。

s43,确定所述候选疾病名称与所述病案记录之间的相似度;

在本发明实施例中,可以将所述候选疾病名称与所述病案记录进行比较,确定两者之间的相似度。具体地,可以采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度。还可以采用所述病案记录与所述候选疾病名称之间的最小编辑距离,确定所述病案记录与所述候选疾病名称之间的最小编辑距离,还可以采用词向量,确定所述病案记录与所述候选疾病名称之间的相似度。本发明对此不做限制。

s44,采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

在本发明实施例中,可以采用所述相似度,由相似度高至相似度低,对所述候选疾病名称进行排序,从而可以得到所述候选疾病名称的相似度排序。从而可以基于所述病案记录中包含的词汇,确定所述病案记录对应的候选疾病名称,以及所述候选疾病名称对应的相似度排序。在所述病案记录较为简洁的情况下,可以基于所述医学词典,获得所述候选疾病名称以及所述候选疾病名称对应的相似度排序。随着所述医学词典的完善,所述第二处理模型的分词准确率可以进一步提高。

在本发明的一种实施例中,所述病案处理模型包括第三处理模型;

所述采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序的步骤,包括:

s51,采用第三处理模型,获取所述病案记录的病案句向量;

在本发明实施例中,所述第三处理模型可以用于将医学领域的一段字符串转换为向量形式的表达。所述第三处理模型可以为word2vec、bert(bidirectionalencoderrepresentationfromtransformers,基于transformer的双向编码表征)等可以将一段字符串转换为向量形式表达的模型。可以采用医学领域的语料,例如,疾病分类码表、医学词典、医学教科书、医学文章等,对所述第三处理模型进行训练,从而可以得到适用于医学领域的第三处理模型。

在本发明实施例中,可以将所述病案记录输入所述第三处理模型,从而可以得到所述病案处理模型的向量形式的表达,即病案句向量。作为本发明的一种示例,第三处理模型可以为bert模型,可以将所述病案记录输入所述第三处理模型,所述第三处理模型可以输出一128维的病案句向量。

s52,确定所述病案句向量与预设的所述疾病名称的疾病句向量之间的相似度;

在本发明实施例中,所述疾病句向量可以为所述疾病名称的向量形式的表达。可以预先采用所述第三处理模型,将所述疾病分类码表中的疾病名称,转换为所述疾病句向量。

在本发明实施例中,可以比较所述病案句向量以及所述疾病句向量,确定两者之间的相似度。具体地,可以计算所述病案句向量与所述疾病句向量之间的余弦距离,从而采用所述余弦距离,确定所述所述病案句向量与所述疾病句向量之间的相似度。所述余弦距离越接近1,可以认为所述所述病案句向量与所述疾病句向量之间的相似度越高。

s53,采用所述相似度,在所述疾病名称中确定至少一个候选疾病名称,并确定所述候选疾病名称的相似度排序。

在本发明实施例中,可以采用所述相似度,由相似度高至相似度低,对所述候选疾病名称进行排序,从而可以得到所述候选疾病名称的相似度排序。从而可以基于所述病案记录,确定所述病案记录对应的候选疾病名称,以及所述候选疾病名称对应的相似度排序。在所述病案记录较为复杂的情况下,可以基于所述第三处理模型计算句子之间的余弦距离,获得所述候选疾病名称以及所述候选疾病名称对应的相似度排序。随着所述第三处理模型处理的病案记录的数量增加,可以进一步采用所述病案记录对所述第三处理模型进行训练,进一步提高所述第三处理模型的准确度。

步骤203,基于至少两个所述病案处理模型分别对应的所述候选疾病名称,确定所述候选疾病名称的出现频次;

在本发明实施例中,每一所述病案处理模型可以确定一组所述候选疾病名称以及所述候选疾病名称对应的相似度排序。每组所述候选疾病名称以及所述候选疾病名称对应的相似度排序中可以包括至少一个候选疾病名称以及所述至少一个候选疾病名称对应的相似度排序。

在本发明实施例中,可以采用至少两个病案处理模型处理所述病案记录,从而可以得到至少两组候选疾病名称以及所述候选疾病名称对应的相似度排序。每组的候选疾病名称可以不同,所述候选疾病名称对应的相似度排序也可以不同。从而可以确定每一候选疾病名称在所述至少两个病案处理模型输出的至少两组候选疾病名称以及所述候选疾病名称对应的相似度排序中的出现频次。

步骤204,采用所述候选疾病名称的出现频次以及所述候选疾病名称的相似度排序,确定所述病案记录对应的目标疾病名称;

在本发明实施例中,可以采用所述候选疾病名称的出现频次以及所述候选疾病名称的相似度排序,确定所述病案记录对应的目标疾病名称。具体地,可以将出现频次较多,且所述候选疾病名称相似度排序较高的候选疾病名称,作为所述病案记录对应的目标疾病名称。

作为本发明的一种可选的实施方式,可以在至少一组候选疾病名称以及疾病疾病名称对应的相似度排序中,选取相似度排序大于预设名次的候选疾病名称;其后在相似度排序大于预设名次的候选疾病名称中出现频次大于预设阈值的至少一个候选疾病名称作为目标疾病名称。

作为本发明的一种可选的实施方式,可以选取出现频次大于预设阈值的候选疾病名称,其后基于所述病案处理模型的权重以及所述候选疾病名称的相似度排序,选取在权重较高的病案处理模型中,相似度排序较高的至少一个候选疾病名称作为目标疾病名称。

步骤205,采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码;所述疾病分类码表包括疾病名称与疾病分类码的映射关系。

在本发明实施例中,所述疾病分类码表可以包括疾病名称以及疾病分类码的映射关系。由此,在确定至少一个所述目标疾病名称之后,可以采用所述疾病分类码表,在所述疾病分类码表中查找所述目标疾病名称对应的疾病分类码,从而可以确定所述病案记录对应的至少一个目标疾病分类码。

通过本发明实施例的病案的分类码确定方法,采用预设的病案处理模型对病案记录进行处理,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;并采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称,从而可以通过病案处理模型确定目标疾病名称,且处理效率高。采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码,从而可以确定病案记录的目标疾病分类码,提高对病案记录进行分类的效率。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图3,示出了本发明的一种病案的分类码确定装置实施例的结构框图,具体可以包括如下模块:

获取模块301,用于获取病案记录;

排序确定模块302,用于采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序;

名称确定模块303,用于采用所述候选疾病名称以及所述候选疾病名称对应的相似度排序,确定所述病案记录对应的目标疾病名称;

分类码确定模块304,用于采用预设的疾病分类码表以及所述目标疾病名称,确定所述病案记录对应的目标疾病分类码;所述疾病分类码表包括疾病名称与疾病分类码的映射关系。

在本发明一种实施例中,所述排序确定模块包括:

确定所述病案记录中是否存在与预设的疾病分类码表匹配的疾病名称;

若所述病案记录中存在与预设的疾病分类码表匹配的疾病名称,采用所述疾病名称以及所述疾病分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的疾病分类码表匹配的疾病名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

在本发明一种实施例中,所述排序确定模块包括:

确定所述病案记录中是否存在与预设的同义分类码表匹配的同义名称;

若所述病案记录中存在与预设的同义分类码表匹配的同义名称,采用所述同义名称以及所述同义分类码表,确定所述病案记录对应的目标疾病分类码;

若所述病案记录中不存在与预设的同义分类码表匹配的同义名称,采用预设的病案处理模型,确定所述病案记录对应的候选疾病名称以及所述候选疾病名称对应的相似度排序。

在本发明一种实施例中,所述病案处理模型包括第一处理模型;

所述排序确定模块包括:

采用第一处理模型以及预设的逆序字典表,确定所述病案记录中每一病案字符的逆向文件频率;所述逆序字典表包括所述疾病分类码表中的每一分类码表字符与所述疾病字符对应的出现频次的映射关系;

采用所述病案字符,在所述疾病分类码表中确定至少一个候选疾病名称;

采用所述病案记录中,与所述候选疾病名称包含的字符相同的病案字符的逆向文件频率,确定所述病案记录与所述候选疾病名称之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

在本发明一种实施例中,所述病案处理模型包括第二处理模型;

所述排序确定模块包括:

采用第二处理模型以及预设的医学词典,将所述病案记录分为至少一个分词;

采用所述医学词典,确定所述分词对应的至少一个候选疾病名称;

确定所述候选疾病名称与所述病案记录之间的相似度;

采用所述相似度对所述候选疾病名称进行排序,得到所述候选疾病名称的相似度排序。

在本发明一种实施例中,所述病案处理模型包括第三处理模型;

所述排序确定模块包括:

采用第三处理模型,获取所述病案记录的病案句向量;

确定所述病案句向量与预设的所述疾病名称的疾病句向量之间的相似度;

采用所述相似度,在所述疾病名称中确定至少一个候选疾病名称,并确定所述候选疾病名称的相似度排序。

在本发明一种实施例中,所述名称确定模块包括:

基于至少两个所述病案处理模型分别对应的所述候选疾病名称,确定所述候选疾病名称的出现频次;

采用所述候选疾病名称的出现频次以及所述候选疾病名称的相似度排序,确定所述病案记录对应的目标疾病名称。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种装置,包括:

一个或多个处理器;和

其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行本发明实施例所述的方法。

本发明实施例还提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行本发明实施例所述的方法。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种病案的分类码确定方法和一种病案的分类码确定装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1