本发明涉及医疗
技术领域:
,特别是指一种相似病历匹配检索系统。
背景技术:
:临床医生在针对某份病历进行病例分析或撰写病例报告时,可以通过借鉴具有一定相似度的历史病历,从中获取一些可参考的诊断意见与治疗方法。或者在临床科研中,某些情况下需要从某份病历作为起始点,寻找更多的相似病历进行研究讨论。在上述两种情境下,如果凭借人工在庞大的电子病历档案库中进行查找,将会耗费许多时间精力。因此,需要开发一种病历匹配检索系统,以某份病历作为起始点,在电子病历档案库中查找具有相似度的电子病历,返回给用户以提供历史病历参考。技术实现要素:针对
背景技术:
中存在的问题,本发明的目的是提供一种相似病历匹配检索系统,通过对导入的电子病历或本地数据库中存放的电子病历进行分析,再在电子病历档案库中查找与原病历具有一定相似度的档案,提供给用户作为参考,提高检索效率。本发明的技术方案是这样实现的:一种相似病历匹配检索系统,包括病历导入单元、变量提取单元、多变量分析单元和整理并返回单元,其中,病历导入单元:用于导入病历并通过过滤器进行处理,过滤器根据系统中预设的电子病历表单控件-患者数据映射关系,向电子病历文档中读取患者的个人信息并存储于临时数据库文件中,而原始文件则存放于临时数据库中;变量提取单元:用于病历匹配的变量提取,根据系统中预设的变量提取关系表,以及对应的电子病历文档控件-变量数据对应关系,向存储于临时数据库中的电子病历文档读取变量存储于变量提取列表中;多变量分析单元:用于多变量的分析,完成变量提取后,将变量提取列表传输至病案管理服务器,服务器根据变量提取列表在病历索引数据库中进行检索,并对变量进行综合汇总,得到各份病历的相似度;整理并返回单元:对所得的相似度进行降序排列,将排序结果返回给用户终端,用户对返回的结果进行判断并勾选,从而索取完整病历。在上述技术方案中,所述变量类型包含数值型变量、字符串型变量和逻辑型变量。在上述技术方案中,所述电子病历文档控件-变量数据对应关系为变量名称与对应控件和变量类型一一对应。在上述技术方案中,所述病历索引数据库中存放根据规定的变量提取关系表,从病历档案数据库中对每份病历分别提取出的变量。本发明相似病历匹配检索系统,包括病历导入单元、变量提取单元、多变量分析单元和整理并返回单元,其中,病历导入单元用于导入病历,通过过滤器进行处理读取患者的个人信息存储于临时数据库文件中;变量提取单元用于病历匹配的变量提取存储于变量提取列表中;多变量分析单元用于多变量的分析和综合汇总,得到各份病历的相似度;整理并返回单元对所得的相似度进行降序排列,将排序结果返回给用户终端,用户对返回结果进行判断并勾选索取完整病历,如此,通过对导入的电子病历或本地数据库中存放的电子病历进行分析提取变量并汇总,再在电子病历档案库中查找与原病历具有一定相似度的档案,提供给用户作为参考,提高检索效率。附图说明图1为本发明相似病历匹配检索系统流程示意图;图2为本发明中客户终端与数据库的交互关系示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明所述的一种相似病历匹配检索系统,在于多变量综合分析,尤以字符串型数据分析方法和数值型数据分析方法以及数据梳的使用为关键。通过对用户导入的某份电子病历或本地数据库中存放的电子病历提取出关键变量,进行多变量综合分析,再将整合过的多变量分析结果发送给病案管理服务器,在电子病历档案库中进行多变量查找与筛选,从而得到与原病历最为相似的病历。每份病历的不同内容可以视为不同的变量,对于某一个变量而言可以有不同的取值。如果两个变量之间取值相同的变量越多,那么两份病历就越相似。其中,有些变量是核心变量,在病历匹配之间起着最为关键的作用。本发明相似病历匹配检索系统具体的包含病历导入单元、变量提取单元、多变量分析单元和整理并返回单元,结合图1所示的本发明相似病历匹配检索系统流程对上述各单元详细说明如下:(1)病历导入单元:用户向电子病历档案管理系统中导入一份电子病历文档,导入的文档进入病历整理系统,采用过滤器进行处理。过滤器根据系统中预设的电子病历表单控件-患者数据映射关系,向电子病历文档中读取患者的个人信息,将读取所得的数据存储于临时数据库文件中,而原始文件则存放于临时数据库中。(2)变量提取单元:用于病历匹配的变量提取,主要是与诊疗信息相关的数据。在系统中预先维护有一份变量提取关系表,以及对应的电子病历文档控件-变量数据对应关系,如下表所示:变量名称对应控件变量类型agedbo.病案首页-textbox3.textintegergenderdbo.病案首页-textbox5.textstringc.c.dbo.病程记录-textbox3.textstringimpdbo.病程记录-textbox5.textstringdiagnosisdbo.病程记录-textbox7.textstring其中,对应于每一个变量都需要规定其变量类型,比如数值、文本、逻辑类型等,不同的变量类型在多变量分析中使用的方法不同。根据变量提取关系表,系统向存储于临时数据库中的电子病历文档读取上述变量,存储于变量提取列表中,如下表所示:agegenderc.c.impdiagnosis…(3)多变量分析单元:在电子病历档案管理系统用户终端完成变量提取后,将变量提取列表传输至病案管理服务器。服务器根据接收到的变量提取列表,在病历索引数据库中进行检索而并非直接在病历档案数据库中进行检索。由于病历档案数据库中的文档为完整存储,其中含有多种与诊疗无关的医疗记录,内容庞杂,如果直接在病历档案数据库中捞取病历将需要极大的运算量。为了减少运算量,需要预先从病历档案数据库中的病历提取出与诊疗最为密切相关的信息。具体方法是根据规定的变量提取关系表,从病历档案数据库中对每份病历分别提取出当中的变量,存放于病历索引数据库。病历索引数据库的结构如下表所示,主键为住院号:住院号agegenderc.c.impdiagnosis…服务器根据发送来的变量提取清单,在病历索引数据库中进行检索。检索的方法是对于每份病历的各个变量进行相似度运算,自上往下,故称为数据梳。数据梳对不同类型的变量使用不同的分析方法,分别为:a.数值型:数值型变量的分析采用公式计算:所求得的a即为数值型变量的相似度。b.字符串型:字符串型变量的分析较数值型为复杂。由于源文件的变量与病历索引数据库中的病历变量总是有相同之处,也有不同之处,不能单纯进行逻辑判断,因此需要从字符串的角度出发进行分析。具体方法为:将源文件的变量中的全部字符以及病历索引数据库中某份病历的对应变量的全部字符混合在一起,成为一个字符串池(当中没有重复字符,重复字符进行合并),再计算两个字符串中都出现的字符数,则字符串型变量的相似度可以用公式计算如下:c.逻辑型变量:逻辑型变量分析较为简单,如果为来自源文件和数据库中的变量逻辑判断相同,则计分为1,否则为0,数据梳完成对变量的运算之后,得到变量记录表如下:住院号agegenderc.c.impdiagnosis…该表结构与病历索引数据库相同,但是当中存放的数据为相似度a,b或c。完成数据梳的处理后,需要对变量进行综合汇总。针对每一份变量,根据下述公式计算出总相似度:其中,weight是权重,对于不同的变量赋予了不同的权重。例如,年龄的权重为0.03,入院诊断的权重为0.1,权重值在服务器中预设。根据上述公式,得到各份病历的相似度φ。(4)整理并返回单元:服务器对计算所得的相似度φ值进行降序排列,将排序结果前若干位在病历索引数据库中的条目返回给用户终端。用户对返回的结果进行判断并勾选,选择当中感兴趣的病历档案,从而向服务器索取完整病历。系统构建病历索取请求消息,发送到服务器,服务器再根据病历索取请求消息,调取病历档案数据库中的完整病历,返回给客户终端。其中,客户终端与数据库的交互关系如图2所示。以下是结合一具体实例进行的进一步说明:某消化内科医生需要对一份消化道出血患者的病历进行相似病历的检索,经过变量提取,该病历的变量提取列表如下表所示:age46gender男c.c.黑色呕吐物imp消化道出血diagnosis急性胃炎…在病历索引数据库中,某份病历的诊疗信息如下表所示:age44gender女c.c.黑色呕吐物,烧心imp消化道出血diagnosis慢性胃炎…不同变量的权重值如下表所示:age0.03gender0.03c.c.0.15imp0.18diagnosis0.32…经过数据梳的梳理,病历索引数据库中该病历各变量的相似度运算结果如下表所示:age0.03gender0.03c.c.0.15imp0.18diagnosis0.32…经过多变量分析公式计算所得:该病历对应的相似度:病历检索数据库中的各份病历完成多变量分析后,最后的降序排序结果为:住院号φ1364090.6541649230.6431532130.5431242430.476将该结果返回给用户终端。用户选择需要获取完整病历的条目之后,发送完整病历索取请求消息,发送给服务器,服务器再根据病历索取请求消息,调取病历档案数据库中的完整病历,返回给客户终端。综上,本发明相似病历匹配检索系统,相比现有技术具有以下有益效果:1.在一份电子病历文档中,包含有诊疗信息以及其他医疗文书记录,如果对档案库中的各份病历中的所有变量都进行分析运算,将会有许多无关的变量对分析结果造成干扰,准确度难以保证。而该种病历匹配检索系统设定了若干对诊疗最为相关的变量,剔除了与诊疗无关的变量,分析时根据变量提取关系表从导入的病历中进行变量提取,并根据提取出的变量在病历索引数据库中通过数据梳进行多变量分析,分为数值型、字符串型以及逻辑型变量对不同变量加以分析,从而得到各份病历的相似度,准确性较高。2.以往临床医生或科研人员需要对某个患者的病历进行分析或撰写病例报告时,如果需要找历史相似病历,需要从数据库中人工进行查看筛选,效率极低,且耗费大量的时间精力。而本系统则根据用户导入的数据,服务器根据提取出来的变量在病历索引数据库中查找,运算速度高,能够在极短的时间内对数据库中的病历进行多变量分析,极大程度上提高了工作效率。3.如果直接在电子病历档案库中进行查找,由于每份电子病历都有相当多的数据内容,且其中许多与诊疗无关,最终数据体量极为庞大,造成运算量较大。而本系统通过新建一个病历索引数据库,提前在电子病历档案库中提取出与诊疗关系最为密切的变量,这样服务器就不需要在电子病历档案库中进行繁复的运算,直接在病历索引数据库中进行运算,一定程度上减少了运算量。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12