医疗数据质量核查方法及装置、终端、存储介质与流程

文档序号:23757171发布日期:2021-01-29 17:55阅读:84来源:国知局
医疗数据质量核查方法及装置、终端、存储介质与流程

[0001]
本发明实施例涉及数据质量核查领域,尤其涉及一种医疗数据质量核查方法及装置、终端、存储介质。


背景技术:

[0002]
随着医疗数据信息化进程的不断推进,各医疗机构的数据需要按照设定的规范进行处理,并将处理后的数据上传至统一的平台。
[0003]
在数据生产、抽取、转化、新老生产库迁移或系统数据库升级及信息采集录入等过程中均可能存在数据的异常。为了获知规范处理后的数据质量,通常需要对数据进行质量核查。然而,对于一个医院来说,每个业务系统均相对独立运行,每个业务系统所产生的数据均分散于各业务系统对应的表中,在数据核查时,易遗漏数据,从而导致数据质量核查结果准确度较低。


技术实现要素:

[0004]
本发明实施例解决的技术问题是数据质量核查结果准确度较低。
[0005]
为解决上述技术问题,本发明实施例提供一种医疗数据质量核查方法,包括:当触发业务数据获取操作时,从关联的多个业务系统中获取业务数据;根据设定的标识信息从所获取的业务数据中查找具有关联关系的业务数据;根据预设业务表中的字段,将所查找到的具有关联关系的业务数据录入对应的预设业务表中,得到处理后的业务数据;获取数据质量核查规则,根据所述数据质量核查规则中的核查项目对所述处理后的业务数据进行数据质量核查,得到数据质量核查结果。
[0006]
可选的,所述根据设定的标识信息从所获取的业务数据中查找具有关联关系的业务数据,包括:从获取的业务数据中查找具有所述设定的标识信息的业务数据,将具有所述设定的标识信息的全部业务数据作为具有关联关系的业务数据。
[0007]
可选的,所述设定的标识信息,包括以下至少一种:就诊标识号、患者标识号、就诊卡号,其中,每次就诊均具有唯一对应的就诊标识号,每个患者均具有唯一的患者标识号。
[0008]
可选的,所述核查项目包括针对字段的核查项目,所述针对字段的核查项目包括如下至少一种:空值率检测、枚举值检测、逻辑性检测、转码率检测,其中,所述逻辑性检测包括以下至少一种:字段的类型的检测、字段的值域范围检测、关联字段之间的合理性检测。
[0009]
可选的,所述核查项目包括针对所述预设业务表的核查项目,所述针对所述表的核查项目包括如下至少一种:数据一致性检测、数据完整性检测、预设业务表间的关联性检测,其中,所述数据一致性检测包括:源表与所述预设业务表的行数一致性检测,其中,所述源表指记录从关联的多个业务系统中获取的业务数据的表;所述数据完整性检测包括:当前第一时间周期内所述预设业务表的记录行数与历史第一时间周期的记录行数的差异,和/或,当前第二时间周期内的总费用值与历史第二时间周期内的总费用值的差异;所述表
间的关联性检测包括:主表与子表之间的关联度情况检测,所述主表及所述子表均属于所述预设业务表。
[0010]
可选的,所述医疗数据质量核查方法还包括:将所述数据质量核查结果输出至预关联终端。
[0011]
可选的,采用如下任一种方式将所述数据质量核查结果输出至预关联终端:短信、电子邮件、oa站内短信接口、网络电话。
[0012]
可选的,所述医疗数据质量核查方法还包括:接收针对所述数据质量核查结果的质量问题分析结果,并将所述质量问题分析结果提交至指定对象。
[0013]
本发明实施例还提供一种医疗数据质量核查装置,包括:获取单元,用于当触发业务数据获取操作时,从关联的多个业务系统中获取业务数据;查找单元,用于根据设定的标识信息从所获取的业务数据中查找具有关联关系的业务数据;处理单元,用于根据预设业务表中的字段,将所查找到的具有关联关系的业务数据录入对应的预设业务表中,得到处理后的业务数据;核查单元,用于获取数据质量核查规则,根据所述数据质量核查规则中的核查项目对所述处理后的业务数据进行数据质量核查,得到数据质量核查结果。
[0014]
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行上述任一种医疗数据质量核查方法的步骤。
[0015]
本发明实施例还提供一种存储介质,存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行上述任一种医疗数据质量核查方法的步骤。
[0016]
与现有技术相比,本发明实施例的技术方案具有以下有益效果:
[0017]
从关联的多个业务系统中获取业务数据,根据设定的标识信息从获取的业务数据中找到具有关联关系的业务数据,然后,根据数据中心中的预设业务表中的字段,将查找到的具有关联关系的业务数据录入至对应的预设业务表中,从而得到处理后的业务数据,此后,根据数据质量核查规则中的核查项目对处理后的业务数据进行数据质量核查,得到数据质量核查结果。由于在对业务数据进行数据质量核查之前,对多个业务系统的业务系统进行关联整合,在进行数据质量核查时,可以降低数据的遗漏概率,以提高数据质量核查结果的准确度。
附图说明
[0018]
图1是本发明实施例中的一种医疗数据质量核查方法的流程图;
[0019]
图2是本发明实施例中的一种医疗数据质量核查装置的结构示意图。
具体实施方式
[0020]
如上所述,各医疗机构的数据在按照设定的规范进行处理过程中,易出现数据质量问题。数据质量问题的因素有多个方面,主要是来自数据生产、抽取、转化等过程,在这些过程中可能出现数据不可识别、数据无法匹配、数据冗余重复、数据不一致、精确度不够、时效性不强等问题,这些问题易导致数据处理困难、管理成本增加、数据不可信、数据贬值等。产生数据质量问题的具体场景如下:由于新老生产库迁移或系统数据库升级,导致的数据
大量缺失及结构不一致;由于生产系统表单设计不合理,导致操作员少录,甚至不录某些关键性数据,比如院内门诊基本信息登记中的紧急联系人电话缺失等;数据的etl指将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,在数据的etl过程中,由于现场厂商口径多样化问题或者etl工具程序报错等,可能导致数据在抽取阶段漏抽、错抽等形成数据的来源端至目的端不一致、数据不及时等。为了获知规范处理后的数据质量,通常需要对数据进行质量核查。然而,对于一个医院来说,每个业务系统均相对独立运行,每个业务系统所产生的数据均分散于各业务系统的表中,在数据核查时,通常需跨系统进行,易遗漏数据,从而导致数据质量核查结果准确度较低。
[0021]
在本发明实施例中,从关联的多个业务系统中获取业务数据,根据设定的标识信息从获取的业务数据中找到具有关联关系的业务数据,然后,根据预设业务表中的字段,将查找到的具有关联关系的业务数据录入至对应的预设业务表中,从而得到处理后的业务数据,此后,根据数据质量核查规则中的核查项目对处理后的业务数据进行数据质量核查,得到数据质量核查结果。由于在对业务数据进行数据质量核查之前,对多个业务系统的业务系统进行关联整合,在进行数据质量核查时,可以降低数据的遗漏概率,以提高数据质量核查结果的准确度。
[0022]
为使本发明实施例的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
[0023]
参照图1,给出了本发明实施例中的一种医疗数据质量核查方法的流程图,具体可以包括如下步骤:
[0024]
步骤s11,当触发业务数据获取操作时,从关联的多个业务系统中获取业务数据。
[0025]
在具体实施中,可以采用多种方式触发业务数据获取操作,可以周期性地触发业务数据获取操作,也可以根据用户需求由用户主动触发业务数据获取操作,还可以当检测关联的业务系统新增数据达到设定的数据量时,触发业务数据获取操作,也可以根据数据生产端也即业务系统的数据生产情况,实时的触发业务数据获取操作,业务数据获取操作的触发方式可以根据实际需求进行设定,上述多种触发方式可以同时存在,也可以存在其中一种。
[0026]
关联的业务系统可以是医院内和/或医院外具有关联关系的多个业务系统,所述业务系统可以包括以下一种或多种:门急诊业务系统、住院业务系统、医政业务系统、药品库房系统、医技业务系统、其他系统等。其中,门急诊业务系统可以包括门急诊挂号系统、门急诊收费系统、门急诊中西药方配发系统、门诊护士工作站系统、急诊护士工作站系统、门急诊医生工作站系统等;住院业务系统可以包括住院入出转管理系统、住院收费管理系统、住院护士工作站系统、住院医生工作站系统、结构化电子病历系统、住院药房配发药系统等;医政业务系统可以包括传染病管理系统、感染管理系统、病案管理系统等;药品库房系统可以包括药库、药房管理系统等;医技业务系统可以包括超声报告系统、心电图报告系统、放射信息系统、内镜报告系统、病理报告系统以及实验室信息系统等,其中实验室信息系统涉及的功能可以包括主体功能、血库、生活、免疫、临检、血液及微生物等,主体功能指临床检验服务的全流程。
[0027]
对于不同医院,各个医院所设定的业务系统、对业务系统的命名、业务系统的功能限定等不同,具体可以根据各个医院所实际设定的业务系统进行业务系统的关联。
[0028]
在具体实施中,所获取到的业务数据可以为指定时间段内的增量数据,也可以为指定时间段内的存量数据,还可以为全量数据。其中,当定期执行医疗数据质量核查时,指定时间段可以根据医疗数据质量核查的执行周期进行设定,如可以将两个执行周期之间的时间段作为指定时间段。为了提高灵活性,指定时间段也可以由用户根据实际需求自主设定。
[0029]
步骤s12,根据设定的标识信息从所获取的业务数据中查找具有关联关系的业务数据。
[0030]
在具体实施中,在从关联的业务系统中获取到业务数据后,可以根据设定的标识信息从获取到的业务数据中查找具有关联关系的业务数据。
[0031]
关联关系可以是一种结构化的关系,指一种对象和另一种对象有直接或间接的联系,在本发明实施例中,对象指业务数据。例如,关联关系为指向同一主体,具有关联关系的业务数据可以与同一主体相关的业务数据。如与患者张三相关的业务数据,与患者李四相关的业务数据等。
[0032]
其中,标识信息用于标识和区分主体,而业务数据通常是针对主体设置的。具体而言,主体可以是患者、医生、护士或者其他适当主体,标识信息可以包括如下至少一种:就诊标识号、患者标识号、就诊卡号等。患者每次就诊均具有唯一对应的就诊标识号。每个患者也具有唯一的患者标识号,患者标识号可以为患者的身份证号码,也可以为每个患者随机生成唯一标识号等。
[0033]
可以采用如下方式根据设定的标识信息从获取的业务数据中查找具有关联关系的业务数据:从获取的业务数据中查找具有设定的标识信息的业务数据,将具有设定的标识信息的全部业务数据作为具有关联关系的业务数据。通过设定的标识信息对从多个业务系统中获取的业务数据建立关联关系,实现数据整合以便于数据的查找以及质量核查。
[0034]
例如,根据患者标识号从获取的业务数据中,查找同一患者标识号下的所有业务数据,并按照就诊标识号对属于同一患者标识号下的所有业务数据进行关联,得到具有关联关系的业务数据。
[0035]
进一步地,为了便于数据管理,从关联的多个业务系统获取的业务数据可以存储于中间数据库中,并对存储于中间数据库中的业务数据进行etl,以及建立业务数据之间的关联关系等。
[0036]
进一步地,当在数据中心模型中进行医疗数据质量核查时,中间数据库与数据中心模型可以建立有关联关系,可以在数据中心模型与中间数据库之间可以进行数据传输。
[0037]
步骤s13,根据预设业务表中的字段,将所查找到的具有关联关系的业务数据录入对应的预设业务表中,得到处理后的业务数据。
[0038]
在具体实施中,可以在数据中心模型中进行医疗数据质量核查,在数据中心模型可以预设有业务表,每个预设业务表中具有预设字段。将所查找到的具有关联关系的业务数据,按照各个预设业务表中的字段分别录入至对应的预设业务表中,得到处理后的业务数据。
[0039]
在数据中心模型中,通常把业务表的列称为字段,所述字段类似于业务表的表头,字段可以用于表示某一列的共有属性,可以用于描述该列数据的数据类型或属性。如姓名字段对应的列记录的内容为患者的姓名,联系电话字段对应的列记录的内容为患者的联系
电话等。
[0040]
其中,业务表可以为一个,也可以为多个,每个业务表中字段可以根据业务之间的关联关系以及实际业务需求等进行设定。
[0041]
例如,关联的业务系统包括:排班系统、预约系统、his系统、医技检查系统、医技检验系统及体检系统。数据中心模型中设置有名称为就诊挂号表及医技报告表等。
[0042]
就诊挂号表包括如下字段:医生排班号、开诊专业、预约号、预约类型等。就诊挂号表中的字段对应的数据来源涉及的业务系统至少包括排班系统、预约系统、his系统、oa系统等。现有技术中排班系统、预约系统、医院信息系统(hospital information system,his)、oa系统之间数据关联性差,甚至不存在数据关联,而经就诊挂号表进行数据整合之后,可以将具有业务、时间、逻辑等关系的数据整理在一起,从而在后续进行数据分析、数据查询、数据质量核查时,不易遗漏数据,能够全面的对数据以及数据之间的关系进行核查,有助于提高数据质量核查结果的准确性。
[0043]
医技报告表中可以包括如下字段:申请单号、医嘱号、体检号、采集时间、检查时间及报告时间等。医技报告表中字段对应的数据来源涉及的业务系统至少包括:医技检查系统、医技检验系统、体检系统、his系统等。his系统通常不包含医技类数据,而与医技类数据相关的字段通常来源于不同业务厂商,而不同厂商之间数据标准不同、格式不同、数据库类型不同,这给数据的查询分析带来极大的不便。业务数据经数据中心模型的医技报告表整合可以实现数据标准、格式等的统一,数据整合之后,不仅可以建立业务数据之间的关联关系,在后续进行数据分析、数据查询、数据质量核查时,无须跨多个数据库及业务系统,不易遗漏数据,从而能够全面的对数据以及数据之间的关系进行核查,有助于提高数据质量核查结果的准确性。
[0044]
可以理解的是,数据中心模型的业务表中的字段还可以存在其他形式,具体根据实际业务需求进行设定,此处不再一一举例。
[0045]
步骤s14,获取数据质量核查规则,根据所述数据质量核查规则中的核查项目对所述处理后的业务数据进行数据质量核查,得到数据质量核查结果。
[0046]
在具体实施中,可以根据国家、行业、医院、平台等设定的标准医疗字典库、电子病历分级评审标准、配合医院需求、医疗业务场景的检测规则如考虑门诊、住院、体检等业务在业务时间顺序的关系等因素的一种或多种创建数据质量核查规则。
[0047]
数据质量核查规则包括一个或多个核查项目,可以根据数据质量核查规则中的核查项目对处理后的业务数据进行数据质量核查,并得到数据质量核查结果。
[0048]
由上可知,从关联的多个业务系统中获取业务数据,根据设定的标识信息从获取的业务数据中找到具有关联关系的业务数据,然后,根据预设业务表中的字段,将查找到的具有关联关系的业务数据录入至对应的预设业务表中,从而得到处理后的业务数据,此后,根据数据质量核查规则中的核查项目对处理后的业务数据进行数据质量核查,得到数据质量核查结果。由于在对业务数据进行数据质量核查之前,对多个业务系统的业务系统进行关联整合,在进行数据质量核查时,可以降低数据的遗漏概率,以提高数据质量核查结果的准确度。
[0049]
在具体实施中,在创建得到数据质量核查规则中的各个核查项目后,针核查项目可以关联核查对象。在进行医疗数据质量核查时,根据核查项目关联的核查对象,对核查对
象进行数据质量核查。
[0050]
在本发明实施例中,核查对象可以为预设业务表或者预设业务表中的字段。在根据核查项目对处理后的业务数据进行核查时,则根据核查项目所指定的预设业务表对所指定的预设业务表进行核查,或者根据核查项目所指定的预设业务表中的字段对指定的字段进行核查。
[0051]
在具体实施中,核查项目可以包括针对字段的核查项目,所述针对字段的核查项目包括如下至少一种:空值率检测、枚举值检测、逻辑性检测、转码率检测。
[0052]
其中,空值率检测指预设业务表中某些列的字段的非空率检测。针对某些列,可以根据空值的行数以及总行数,得到该列的空值率。当一些列的空值率超出设定的空值率阈值或者全部为空值时,可以输出提醒。这种现象可能为数据在处理过程中出现丢失等异常,通过提醒可以及时进行数据处理异常进行修复等。对预设业务表中的某些列的字段的非空率检测也即对业务表的字段的填充率和0值率等进行规范性检测。
[0053]
枚举值检测指预设业务表中的字典字段的不同(distinct)值与标准字典字段的值域进行比较。其中,distinct用于返回唯一不同的值。例如,针对性别,标准字典字段的值域可以包括:男、女、其他。在枚举值检测时,可以检测预设业务表中的性别为男的数据占总数的比例,或者性别为其他的数据占总数据的比例,或者性别为女的数据占总数据的比例。
[0054]
逻辑性检测可以包括以下至少一种:字段的类型的检测、字段的值域范围检测、关联字段之间的合理性检测。例如,年龄字段值在合理区间范围内。又如,在院死亡病人的出院时间和死亡时间的大小要合理等,在院死亡病人的出院时间不得早于死亡时间等。再如,当出现某一字段时,必然出现另一字段,如出现就诊字段时必然出现挂号字段,出现检查字段必然出现缴费字段等,若是仅出现某一字段,而未出现另一字段,如针对同一患者出现检查字段但是没有出现缴费字段,则判定数据异常,此种情况可能是数据处理过程中产生异常,也可能是不规范就医导致的业务流程出现异常,如利用各部门间信息的不互通,利用熟人关系直接开检查单进行检查,而跳过挂号、门诊及缴费等。
[0055]
转码率检测指数据中心模型中的预设业务表中的字段和标准字典字段之间的转码率。
[0056]
例如,关于肺炎,生产库字典字段可以采用的左肺炎、右肺炎、肺炎等多种描述。按照设定规范进行处理之后采用标准字典字段中的字段肺炎。转码率检测则是检测将生产库采用的左肺炎、右肺炎、肺炎等多种描述转换成肺炎描述的程度,其中程度可以采用百分比的方式进行表述。
[0057]
在具体实施中,核查项目可以包括针对所述预设业务表的核查项目,所述针对预设业务表的核查项目包括如下至少一种:数据一致性检测、数据完整性检测、预设业务表间的关联性检测。
[0058]
其中,所述数据一致性检测可以包括:源表与预设业务表的行数一致性检测,其中,源表指记录从关联的多个业务系统中获取的业务数据的表。
[0059]
所述数据完整性检测可以包括:当前第一时间周期内所述预设业务表的记录行数与历史第一时间周期的记录行数的差异,和/或,当前第二时间周期内的总费用值与历史第二时间周期内的总费用值的差异。例如,当天的业务表记录的行数与历史每天记录的行数趋势比较,是否属于设定的趋势变化范围内等。又如,当月的总费用值和历史月份费用值趋
势进行比较。
[0060]
所述表间的关联性检测可以包括:主表与子表之间的关联度情况检测,所述主表及所述子表均属于所述预设业务表。
[0061]
在完成对临床数据质量进行核查之后,得到数据质量核查结果中可以包括各个核查项目的核查结果,根据核查项目的不同,数据质量核查结果的展现形式也可以不同。例如,空值率检测、枚举值检测或转码率检测等可以采用百分比的方式进行表示,也可以结合统计数目进行展示。又如,针对主表与子表之间的关联度情况检测时,若是存在主表或子表缺失时,在数据质量核查结果中可以展示缺失的表的相关信息。
[0062]
在具体实施中,为了便于用户直观的了解数据质量核查结果,数据质量核查结果中还可以包括质量评估。具体而言,可以预设质量评估标准,将数据质量核查结果与质量评估标准进行比对,根据比对结果得到质量评估结果。
[0063]
进一步地,可以分别针对每个核查项目设置对应的质量评估标准,分别将每个核查项目的数据质量核查结果与对应的质量评估标准进行比对,得到每个核查项目的质量评估结果。
[0064]
在具体实施中,针对可以采用百分比表示数据质量核查结果的核查项目,可以设定梯度式的评估标准,比如,百分比为0~40%对应的质量评估结果为极差,百分比40%~60%对应的质量评估结果为差,百分比为60%~70%对应的质量评估结果为一般,百分比为70%~80%对应的质量评估结果为中等,百分比为80%~90%对应的质量评估结果为良好,百分比为90%~100%对应的质量评估结果为优秀。以便于用户直观的获知数据质量核查结果。
[0065]
可以理解的是,还可以采用其他方式基于数据质量核查结果对医疗数据质量进行评估。
[0066]
进一步地,可以将数据质量核查结果输出至预关联终端,其中,预关联终端可以为手机、电脑等。
[0067]
在具体实施中,可以采用如下任一方式将数据质量核查结果输出至预关联终端。根据预关联终端的类型不同,输出数据质量核查结果的方式不同,例如,采用短信将数据质量核查结果发送至对应预关联的手机。又如,采用电子邮件将数据质量核查结果发送至指定的收件人。再如,采用办公自动化(office automation,简称oa)站内短信接口将数据质量核查结果发送至指定对象。再如,通过网络电话拨打设定的联系电话将数据质量核查结果告知对应的负责人等。
[0068]
在具体实施中,还可以接收针对数据质量核查结果的质量问题分析结果,并将质量问题分析结果提交至指定对象。
[0069]
其中,数据质量核查结果的质量分析结果可以由用户根据数据质量核查结果分析得到。
[0070]
通过接收针对数据质量核查结果的质量问题分析结果,并将质量问题分析结果提交至指定对象,从而可以提醒相关的责任人,并可以接收责任人的反馈,并将反馈传递至下一指定责任人,便于相关工作人员针对问题进行总结沉淀,以清晰地对出现的问题进行归类、定位、分析,可以直观准确的获知数据异常或者数据质量较差原因,并给出对应的解决方案,从而可以形成知识沉淀并存储于知识库,达到数据质量管理闭环。
[0071]
此外,通过对医疗数据进行医疗数据质量核查,根据医疗数据质量核查结果,还可以清晰、直观、准确地获知哪些业务系统的医疗数据信息化有待改进,以及医疗数据信息化过程中数据质量情况,从而有助于推动医疗数据信息化进程。
[0072]
参照图2,本发明实施例还提供一种医疗数据质量核查装置,医疗数据质量核查装置20可以包括:
[0073]
获取单元21用于当触发业务数据获取操作时,从关联的多个业务系统中获取业务数据;
[0074]
查找单元22用于根据设定的标识信息从所获取的业务数据中查找具有关联关系的业务数据;
[0075]
处理单元23用于根据预设业务表中的字段,将所查找到的具有关联关系的业务数据录入对应的预设业务表中,得到处理后的业务数据;
[0076]
核查单元24用于获取数据质量核查规则,根据所述数据质量核查规则中的核查项目对所述处理后的业务数据进行数据质量核查,得到数据质量核查结果。
[0077]
在具体实施中,医疗数据质量核查装置20的工作原理及工作流程可以参考本发明上述任一实施例中的描述,此处不再赘述。
[0078]
本发明实施例还提供一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行本发明上述任一实施例提供的医疗数据质量核查方法的步骤。
[0079]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机程序,所述计算机程序被处理器运行时执行本发明上述任一实施例提供的医疗数据质量核查方法的步骤。
[0080]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于任一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。
[0081]
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1