本技术涉及病历数据评估,具体而言,涉及一种病历数据评估处理方法、装置、电子设备及存储介质。
背景技术:
1、在人工智能预训练数据集准备及临床科研目标数据遴选等场景中,通常需要从海量的电子病历数据库中抽取高质量且符合要求的电子病历数据。
2、现有技术中,通常需要人工设置多个条件,然后根据设置的多个条件对海量的电子病历数据进行筛选。
3、但是,由于病历数据逻辑关系复杂,现有技术中的方法会导致数据库查询语句复杂,且语句设计难度大。并且,还可能由于查询语句中的筛选条件设计不全面而导致无法准确筛选出合适的电子病历数据。
技术实现思路
1、本技术的目的在于,针对上述现有技术中的不足,提供一种病历数据评估处理方法、装置、电子设备及存储介质,以解决现有技术中数据库查询语句复杂,且语句设计难度大的问题。
2、为实现上述目的,本技术采用的技术方案如下:
3、第一方面,本技术提供了一种病历数据评估处理方法,所述方法包括:
4、根据多个原始电子病历信息建立多个病历数据底座,所述多个病历数据底座包括:完整性底座、饱和性底座、相关性底座、一致性底座及特征底座,其中,所述完整性底座用于指示数据单元的完整性的判定策略以及预期结果,所述饱和性底座用于指示数据单元的饱和性的判定策略以及预期结果,所述相关性底座用于指示数据单元的相关性的判定策略以及预期结果,所述一致性底座用于指示数据单元的一致性的判定策略以及预期结果,所述特征底座用于指示数据单元的特征的判定策略以及预期结果;
5、获取待评估病历数据,根据所述待评估病历数据及各所述病历数据底座所指示的判定策略,生成所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据以及特征统计数据;
6、根据所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据、特征统计数据以及各所述病历数据底座所指示的预期结果,确定并输出所述待评估病历数据的评估结果。
7、可选地,所述根据所述待评估病历数据及各所述病历数据底座所指示的判定策略,生成所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据以及特征统计数据,包括:
8、根据所述待评估病历数据中的数据单元和数据值以及所述完整性底座所指示的完整性的判定策略,生成所述完整性统计数据;
9、根据所述待评估病历数据中的数据单元和数据存储容量以及所述饱和性底座所指示的饱和性的判定策略,生成所述饱和性统计数据;
10、根据所述待评估病历数据中的数据单元以及所述相关性底座所指示的相关性的判定策略,生成所述相关性统计数据;
11、根据所述待评估病历数据中的数据单元以及所述一致性底座所指示的一致性的判定策略,生成所述一致性统计数据;
12、根据所述待评估病历数据中的数据单元和数据特征以及所述特征底座所指示的特征的判定策略,生成所述特征统计数据。
13、可选地,所述根据所述待评估病历数据中的数据单元和数据值以及所述完整性底座所指示的完整性的判定策略,生成所述完整性统计数据,包括:
14、按照所述完整性的判定策略,对所述待评估病历数据中的数据单元和数据值进行判定,将判定结果作为所述完整性统计数据。
15、可选地,所述根据所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据、特征统计数据以及各所述病历数据底座所指示的预期结果,确定并输出所述待评估病历数据的评估结果,包括:
16、将所述完整性统计数据与所述完整性底座所指示的完整性的预期结果进行比对,得到所述完整性底座对应的第一评估结果;
17、将所述饱和性统计数据与所述饱和性底座所指示的饱和性的预期结果进行比对,得到所述饱和性底座对应的第二评估结果;
18、将所述相关性统计数据与所述相关性底座所指示的相关性的预期结果进行比对,得到所述相关性底座对应的第三评估结果;
19、将所述一致性统计数据与所述一致性底座所指示的一致性的预期结果进行比对,得到所述一致性底座对应的第四评估结果;
20、将所述特征统计数据与所述特征底座所指示的特征的预期结果进行比
21、对,得到所述特征底座对应的第五评估结果;
22、根据所述第一评估结果、第二评估结果、第三评估结果、第四评估结果和第五评估结果,确定并输出所述待评估病历数据的评估结果。
23、可选地,将所述完整性统计数据与所述完整性底座所指示的完整性的预期结果进行比对,得到所述完整性底座对应的第一评估结果,包括:
24、获取所述完整性的预期结果中的各项预期结果,其中,各项预期结果分别为一个数据区间;
25、遍历所述完整性统计数据中的每项数据单元,针对遍历到的当前项数据单元,若所述当前项数据单元位于目标预期结果的数据区间内,则确定所述第一评估结果为符合,否则,确定所述第一评估结果为不符合,其中,所述目标预期结果为所述当前项数据单元在所述完整性的预期结果中对应的一项预期结果。
26、可选地,所述饱和性底座的建立过程包括:
27、对所述多个原始电子病历信息进行统计,根据统计结果确定所述饱和性的判定策略;
28、根据各原始电子病历信息中数据单元对应的数据存储容量,确定数据存储容量均值、数据存储容量最大值及数据存储容量最小值;
29、根据所述数据存储容量均值、数据存储容量最大值及数据存储容量最小值,确定所述饱和性的预期结果。
30、可选地,所述确定并输出所述待评估病历数据的评估结果之后,还包括:
31、若所述待评估病历数据的评估结果为符合,则将所述待评估病历数据作为病历数据载量模型的样本数据。
32、第二方面,本技术提供了一种病历数据评估处理装置,所述装置包括:
33、建立模块,用于根据多个原始电子病历信息建立多个病历数据底座,所述多个病历数据底座包括:完整性底座、饱和性底座、相关性底座、一致性底座及特征底座,其中,所述完整性底座用于指示数据单元的完整性的判定策略以及预期结果,所述饱和性底座用于指示数据单元的饱和性的判定策略以及预期结果,所述相关性底座用于指示数据单元的相关性的判定策略以及预期结果,所述一致性底座用于指示数据单元的一致性的判定策略以及预期结果,所述特征底座用于指示数据单元的特征的判定策略以及预期结果;
34、生成模块,用于获取待评估病历数据,根据所述待评估病历数据及各所述病历数据底座所指示的判定策略,生成所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据以及特征统计数据;
35、确定模块,用于根据所述待评估病历数据对应的完整性统计数据、饱和性统计数据、相关性统计数据、一致性统计数据、特征统计数据以及各所述病历数据底座所指示的预期结果,确定并输出所述待评估病历数据的评估结果。
36、可选地,所述生成模块具体用于:
37、根据所述待评估病历数据中的数据单元和数据值以及所述完整性底座所指示的完整性的判定策略,生成所述完整性统计数据;
38、根据所述待评估病历数据中的数据单元和数据存储容量以及所述饱和性底座所指示的饱和性的判定策略,生成所述饱和性统计数据;
39、根据所述待评估病历数据中的数据单元以及所述相关性底座所指示的相关性的判定策略,生成所述相关性统计数据;
40、根据所述待评估病历数据中的数据单元以及所述一致性底座所指示的一致性的判定策略,生成所述一致性统计数据;
41、根据所述待评估病历数据中的数据单元和数据特征以及所述特征底座所指示的特征的判定策略,生成所述特征统计数据。
42、可选地,所述生成模块具体用于:
43、按照所述完整性的判定策略,对所述待评估病历数据中的数据单元和数据值进行判定,将判定结果作为所述完整性统计数据。
44、可选地,所述确定模块具体用于:
45、将所述完整性统计数据与所述完整性底座所指示的完整性的预期结果进行比对,得到所述完整性底座对应的第一评估结果;
46、将所述饱和性统计数据与所述饱和性底座所指示的饱和性的预期结果进行比对,得到所述饱和性底座对应的第二评估结果;
47、将所述相关性统计数据与所述相关性底座所指示的相关性的预期结果进行比对,得到所述相关性底座对应的第三评估结果;
48、将所述一致性统计数据与所述一致性底座所指示的一致性的预期结果进行比对,得到所述一致性底座对应的第四评估结果;
49、将所述特征统计数据与所述特征底座所指示的特征的预期结果进行比对,得到所述特征底座对应的第五评估结果;
50、根据所述第一评估结果、第二评估结果、第三评估结果、第四评估结果和第五评估结果,确定并输出所述待评估病历数据的评估结果。
51、可选地,所述确定模块具体用于:
52、获取所述完整性的预期结果中的各项预期结果,其中,各项预期结果分别为一个数据区间;
53、遍历所述完整性统计数据中的每项数据单元,针对遍历到的当前项数据单元,若所述当前项数据单元位于目标预期结果的数据区间内,则确定所述第一评估结果为符合,否则,确定所述第一评估结果为不符合,其中,所述目标预期结果为所述当前项数据单元在所述完整性的预期结果中对应的一项预期结果。
54、可选地,所述确定模块具体用于:
55、对所述多个原始电子病历信息进行统计,根据统计结果确定所述饱和性的判定策略;
56、根据各原始电子病历信息中数据单元对应的数据存储容量,确定数据存储容量均值、数据存储容量最大值及数据存储容量最小值;
57、根据所述数据存储容量均值、数据存储容量最大值及数据存储容量最小值,确定所述饱和性的预期结果。
58、可选地,所述确定模块还用于:
59、若所述待评估病历数据的评估结果为符合,则将所述待评估病历数据作为病历数据载量模型的样本数据。
60、第三方面,本技术提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述病历数据评估处理方法的步骤。
61、第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述病历数据评估处理方法的步骤。
62、本技术的有益效果是:根据多个原始电子病历信息建立多个病历数据底座,包括各个底座指示的数据单元的判定策略和预期结果。然后获取待评估病历数据,并根据待评估病历数据及各病历数据底座所指示的判定策略,生成各个统计数据,最后根据待评估病历数据对应的各个统计数据及各病历数据底座所指示的预期结果,确定并输出待评估病历数据的评估结果。本实施例通过各方面的病历数据底座,设置了病历数据在完整性、饱和性、相关性、一致性及特征方面的要求,保证了待评估病历数据在完整性、饱和性、相关性、一致性及特征方面的把控力度,提高数据质量及数据筛选力度。同时,建立数据清晰的逻辑关系,避免通过多个条件对具有复杂查询语句的病历数据进行检索,而是通过病历数据底座直接将统计数据筛选出来,保证筛选及评估得到的电子病历的可靠性。