基于结构化病历数据库的参考病历检索方法及装置的制造方法

文档序号:8905273阅读:640来源:国知局
基于结构化病历数据库的参考病历检索方法及装置的制造方法
【技术领域】
[0001] 本发明设及模式识别、相似性测度及电子病历领域,更具体地说,设及一种基于结 构化病历数据库的参考病历检索方法及装置。
【背景技术】
[0002] 电子病历是医疗信息化的必然产物,具备传统纸质病历所不具备的优点,比如便 于保存、传阅,并便于进一步开发病历的潜在价值。近年来,有关电子病历的应用研究逐渐 增多,但大多数仅限于记录患者的症状和治疗过程,而对其包含的大量信息再应用设及较 少。电子病历既是患者的诊疗过程的记录,也是医生经验的载体,其包含了医生的经验W及 患者个体化差异的大量信息。所W对于电子病历的信息挖掘,会极大地发挥医疗大数据信 息资源的临床价值。

【发明内容】

[0003] 本发明的目的是提供一种基于结构化病历数据库的参考病历检索方法及装置,该 方法及装置能够找出对患者诊疗方案更具参考意义的参考病历,W解决现有病历大数据未 能有效利用的问题。
[0004] 本发明的具体技术方案如下:
[0005] 一种基于结构化病历数据库的参考病历检索方法,该检索方法包括:
[0006]W新病历的已检查项目为准则、病历数据库中新病历W前的历史病历为待选方案 建立目标层-准则层-方案层=层结构的层次模型;
[0007] 计算准则层相对于目标层的权重;
[000引计算新病历与历史病历的单项相似度,所述单项相似度是对单个检查项目而言两 个病历的相似程度;
[0009] 将相对同一历史病历的各个单项相似度与权重对应相乘获取新病历与历史病历 的综合相似度;
[0010] 利用诊治医师和医院的等级指数计算历史病历的参考价值指数;
[0011] 利用综合相似度与参考价值指数确定新病历与历史病历的综合匹配度;W及
[0012] 选取综合匹配度高的历史病历作为该新病历的参考病历;
[0013] 所述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。
[0014] 在上述的基于结构化病历数据库的参考病历检索方法中,优选地,在计算准则层 相对于目标层的权重的步骤中,包括:用各个已检查项目与疾病的关联度指数构造准则层 相对于目标层的判断矩阵;W及将判断矩阵的各行向量进行几何平均,然后进行归一化处 理得到目标层的权重。
[0015] 在上述的基于结构化病历数据库的参考病历检索方法中,优选地,在计算新病历 与历史病历的单项相似度的步骤中,采用距离系数来判定两个病历之间的匹配度。
[0016] 在上述的基于结构化病历数据库的参考病历检索方法中,优选地,所述距离系数 为相对海明距离Du,单项相似度Su计算如下:
[0017]
[001引其中,i和j表示进行比较的两个病历,Xk表示已检查项目k的指标,Xl_表示所有 病历中Xk指标的最大值,表示所有病历中Xk指标的最小值,m为指标个数,0《Dm。
[0019] 在上述的基于结构化病历数据库的参考病历检索方法中,优选地,所述病历数据 库W时间为主索引,每个时间点上包含各项相关检查的子索引,子索引分层设置。
[0020] 一种基于结构化病历数据库的参考病历检索装置,该检索装置包括:
[0021] 层次模型构造模块,用于W新病历的已检查项目为准则、病历数据库中新病历W 前的历史病历为待选方案建立目标层-准则层-方案层=层结构的层次模型;
[0022] 权重计算模块,用于计算准则层相对于目标层的权重;
[0023] 单项相似度计算模块,用于计算新病历与历史病历的单项相似度,所述单项相似 度是对单个检查项目而言两个病历的相似程度;
[0024] 综合相似度计算模块,用于将相对同一历史病历的各个单项相似度与权重对应相 乘获取新病历与历史病历的综合相似度;
[0025] 参考价值指数计算模块,用于利用诊治医师和医院的等级指数计算历史病历的参 考价值指数;
[0026] 综合匹配度计算模块,用于利用综合相似度与参考价值指数确定新病历与历史病 历的综合匹配度;W及
[0027] 输出检索结果模块,用于选取综合匹配度高的历史病历作为该新病历的参考病 历;
[002引所述病历数据库是对医疗机构的电子病历进行结构化后建立的疾病诊疗数据库。
[0029] 在上述的基于结构化病历数据库的参考病历检索装置中,优选地,所述权重计算 模块包括;判断矩阵构造子模块,用于用各个已检查项目与疾病的关联度指数构造准则层 相对于目标层的判断矩阵;W及矩阵处理子模块,用于将判断矩阵的各行向量进行几何平 均,然后进行归一化处理得到目标层的权重。
[0030] 在上述的基于结构化病历数据库的参考病历检索装置中,优选地,在所述单项相 似度计算模块中,采用距离系数来判定两个病历之间的匹配度。
[0031] 在上述的基于结构化病历数据库的参考病历检索装置中,优选地,在所述单项相 似度计算模块中,所述距离系数为相对海明距离Dy,单项相似度Su计算如下:
[0032]
[0033] 其中,i和j表示进行比较的两个病历,Xk表示已检查项目k的指标,Xl_表示所有 病历中Xk指标的最大值,表示所有病历中Xk指标的最小值,m为指标个数,0《Dm。
[0034] 在上述的基于结构化病历数据库的参考病历检索装置中,优选地,所述病历数据 库W时间为主索引,每个时间点上包含各项相关检查的子索引,子索引分层设置。
[0035] 本发明通过将医疗机构的病历结构化,构建病历数据库,进而依托病人已经进行 的检查结果检索获得与病人最为相似的病历,从而能够为医生进行个性化的诊治提供有价 值的参考。
【附图说明】
[0036] 图1为本发明基于结构化病历数据库的参考病历检索方法一些实施例的流程图;
[0037]图2为其层次模型的示意图;
[0038]图3为其病历数据库部分分类索引的结构示意图。
【具体实施方式】
[0039]下面结合附图和实施例对本发明进一步说明。该些更详细的描述旨在帮助理解本 发明,而不应被用于限制本发明。根据本发明公开的内容,本领域技术人员明白,可W不需 要一些或者所有该些特定细节即可实施本发明。而在其它情况下,为了避免将发明创造淡 化,未详细描述众所周知的操作过程。
[0040]层次分析法是一种利用定性和定量分析寻求最优解决方案的方法,在管理领域应 用较多。本发明在层次分析法基础上进行改进,尝试运用于临床领域,为电子病历的潜在价 值的开发利用提供技术支持。
[0041] 如图1所示,一些实施例基于结构化病历数据库的参考病历检索方法包括W下步 骤:
[0042]步骤S100,W新病历的已检查项目为准则、病历数据库中新病历W前的历史病历 为待选方案建立目标层-准则层-方案层=层结构的层次模型。
[0043]在一些实施例中,W冠屯、病为例进行说明,建立的层次模型如图2所示,已进行的 检查项目包括常规屯、电、运动屯、电、核医学、超声、CT、冠状动脉造影,它们构成了准则层。依 据传统的层次分析法并结合在本技术中的应用建立。计算准则层相对于目标层的权重时利 用层次分析法中的构造判断矩阵的方法,但在计算方案层相对准则层的权重时,由于方案 层中的方案指的是病历数据库中的各个病例,而病例数据量较大,无法由人工判断各病例 相对于各准则的权重,即不能利用构造判断矩阵的方法,所W此处的确定各病例的权重归 为依据各准则(常规屯、电相似、运动屯、电相似、核医学相似、超声相似、CT相似、冠状动脉造 影相似)计算病历数据库中各病例与新入病例的相似度,同时结合每个病历的重要性。
[0044]步骤S200,计算准则层相对于目标层的权重。
[0045]首先,构造准则层相对于目标层的判断矩阵,具体地,用各个已检查项目与疾病的 关联度指数构造准则层相对于目标层的判断矩阵。各项检查相对于冠屯、病确诊的重要性 (即各个已检查项目与疾病的关联度指数)由经验医生给出,举例如下:
[0046]
[0047] 表中,El为常规屯、电,E2为运动屯、电,E3为核医学,E4为超声,E5为CT,E6为冠 状动脉造影,e为关联度指数。贝Ij,判断矩阵为:
[0048]
[0049] 通常ey与ej,呈倒数关系。
[0050] 接下来,利用判断矩阵确定各准则相对于目标的权重系数,具体的,将判断矩阵的 各行向量进行几何平均,然后进行归一化处理得到目标层的权重。举例来说,将上述判断矩 阵A各行向量进行几何平均,由
[0054] 对W向量归一化,由
[005引为了获得更好效果,进一步地,还包括;计算判断矩阵的最大特征根,利用最大特 征根计算一致性指标,检验判断矩阵的一致性,获得具有良好一致性的权重。具体的,根据
[0059]
[0060] 计算判断矩阵的最大特征根Am。,;由
[0061]
[0062] 计算一致性指标CI,与平均随机一致性指标RI计算得到判断矩阵的一致性比率 CR=CI/RI,若CR小于0. 1,说明判断矩阵具有满意的一致性,不需要调整,权重系数W可 用。
[0063] 步骤S300,计算新病历与历史病历的单项相似度,所述单项相似度是对单个检查 项目而言两个病历的相似程度。
[0064] 每个病历都是由一系列诊断指标数据序列所组成,计算两个数据序列的相似度较 常用的方法包括相关系数、相似系数、距离系数和相似离度。相关系数和相似系数一般用来 判断数据序列的形相似,距离系数多用于判断值相似,相似离度是一种比较新的方法,结合 了形相似和值相似,但实际运用中效果并不十分理想。在此应用中,由于病历中每个指标即 每个数据点代表的意义不尽相同,用值相似来判断两个病历之间的匹配度更为合适,所W 一些实施例中采用距离系数来判定两个病历之间的匹配度。
[00化]距离系数主要包括绝对距离(即海明距离)和欧式距离,相比而言,绝对距离更能 反映两序列之间的值相似程度,所W-些实施例中采用绝对距离:
[0066]
[0067] 其中m为每项检查项目下可量化的诊断指标数量。由于在比较病历的相似程度 上,每个用于比较的指标意义不同,量纲不同,为了去除量纲的影响,一些实施例中还对绝 对距离进行了改进,使用相对海明距离:
[0068]
[0069] 具体的,单项相似度Sy计算如下;
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1