一种医疗数据文件的标准化处理方法与流程

文档序号:29406683发布日期:2022-03-26 10:48阅读:109来源:国知局
一种医疗数据文件的标准化处理方法与流程

1.本发明涉及数据处理技术领域,特别涉及一种医疗数据文件的标准化处理方法。


背景技术:

2.表格化的医疗数据文件不仅被医院内部信息系统用于电子病历、病案建档,还会用于各种医疗保险的兑付流程。因为每家保险机构对于用做兑付凭证的医疗数据文件的格式标准要求有所不同,所以常规情况下都会通过人工方式对提交的医疗数据文件进行标准化转换。这种操作方式,一方面受人工效率因素影响无法对批量文件进行高效转换从而进一步导致兑付评审滞后;另一方面受人工经验因素影响还可能出现转换错误从而进一步导致兑付评审失败。


技术实现要素:

3.本发明的目的,就是针对现有技术的缺陷,提供一种医疗数据文件的标准化处理方法、电子设备及计算机可读存储介质,基于各家保险结构的格式标准要求创建对应的标准字段对应表、标准数据列表模板和列数据转换规则,并基于上述对应表、模板和规则对原始医疗数据文件的数据表格进行标准化处理。通过本发明可以节省大量的人工操作时间,降低标准化转换出错率,提高标准化转换的总体效率。
4.为实现上述目的,本发明实施例第一方面提供了一种医疗数据文件的标准化处理方法,所述方法包括:
5.获取原始医疗数据文件的数据表格类型,生成对应的第一类型数据;
6.获取所述原始医疗数据文件的数据表格信息,生成对应的第一数据列表;
7.根据预设的标准字段对应表,对所述第一数据列表进行标准字段名替换处理生成对应的第二数据列表;
8.根据预设的与所述第一类型数据匹配的标准数据列表模板,对所述第二数据列表进行缺项数据列设置处理生成对应的第三数据列表;
9.按预设的列数据转换规则,对所述第三数据列表进行列数据转换处理生成对应的第四数据列表;
10.将所述第四数据列表作为标准化处理结果输出。
11.优选的,所述标准字段对应表包括多个标准字段对应记录;所述标准字段对应记录包括标准字段名信息和多个对应的原始字段名信息;
12.所述标准数据列表模板包括多个模板数据列字段名;
13.所述第一数据列表包括多个第一数据列;所述第一数据列包括第一列字段名和一个或多个第一列数据;
14.所述第二数据列表包括多个第二数据列;所述第二数据列包括第二列字段名和一个或多个第二列数据;
15.所述第三数据列表包括多个第三数据列;所述第三数据列包括第三列字段名和一
个或多个第三列数据;
16.所述第四数据列表包括多个第四数据列;所述第四数据列包括第四列字段名和一个或多个第四列数据。
17.优选的,所述根据预设的标准字段对应表,对所述第一数据列表进行标准字段名替换处理生成对应的第二数据列表,具体包括:
18.将所述第一数据列表的各个所述第一数据列的所述第一列字段名,记为第一待匹配字段名;
19.对各个所述第一待匹配字段名,在所述标准字段对应表中进行标准字段名全匹配查询处理得到对应的第一标准字段名;所述第一标准字段名的数量唯一;
20.若所述第一标准字段名不为空,则使用所述第一标准字段名对所述第一数据列表中对应的所述第一列字段名进行替换;若所述第一标准字段名为空,则将对应的所述第一待匹配字段名记为第二待匹配字段名;
21.对各个所述第二待匹配字段名,在所述标准字段对应表中进行标准字段名模糊匹配查询处理得到对应的第二标准字段名;所述第二标准字段名的数量可不唯一;
22.若所述第二标准字段名不为空且数量唯一,则使用唯一的所述第二标准字段名对所述第一数据列表中对应的所述第一列字段名进行替换;若所述第二标准字段名为空,则将对应的所述第二待匹配字段名记为第三待匹配字段名;若所述第二标准字段名数量不唯一,则将对应的所述第二待匹配字段名记为第四待匹配字段名;
23.对各个所述第三待匹配字段名,从所述第一数据列表中对应的所述第一数据列里提取出指定数量的所述第一列数据组成对应的第一列数据组;并将所述第三待匹配字段名和所述第一列数据组,输入预设的第一标准字段名强制匹配接口进行处理生成对应的第三标准字段名;若所述第三标准字段名不为空,则使用所述第三标准字段名对所述第一数据列表中对应的所述第一列字段名进行替换;
24.对各个所述第四待匹配字段名,从所述第一数据列表中对应的所述第一数据列里提取出指定数量的所述第一列数据组成对应的第二列数据组;并将对应的多个所述第二标准字段名组成第一近似字段名数据组;并将所述第四待匹配字段名、所述第二列数据组和所述第一近似字段名数据组,输入预设的第二标准字段名强制匹配接口进行处理生成对应的第四标准字段名;若所述第四标准字段名不为空,则使用所述第四标准字段名对所述第一数据列表中对应的所述第一列字段名进行替换;
25.将完成了所有标准字段名替换的第一数据列表作为所述第二数据列表。
26.进一步的,所述对各个所述第一待匹配字段名,在所述标准字段对应表中进行标准字段名全匹配查询处理得到对应的第一标准字段名,具体包括:
27.将所述标准字段对应表中,与所述第一待匹配字段名完全一致的所述原始字段名信息记为全匹配字段名信息,将与所述全匹配字段名信息对应的所述标准字段对应记录的所述标准字段名信息作为对应的所述第一标准字段名;若所述标准字段对应表中,没有与所述第一待匹配字段名完全一致的所述原始字段名信息,则设置对应的所述第一标准字段名为空。
28.进一步的,所述对各个所述第二待匹配字段名,在所述标准字段对应表中进行标准字段名模糊匹配查询处理得到对应的第二标准字段名,具体包括:
29.对所述标准字段对应表中的所有所述标准字段对应记录进行轮询,并将当前被轮询的所述标准字段对应记录记为当前记录;并按预设的模糊匹配算法,对所述当前记录的所述标准字段名信息与所述第二待匹配字段名进行匹配比对,得到对应的第一比对结果;若所述第一比对结果为匹配,则将所述当前记录的所述标准字段名信息记为对应的所述第二标准字段名,并继续轮询下一条所述标准字段对应记录;若所述第一比对结果为不匹配,则按所述模糊匹配算法对所述当前记录的各个所述原始字段名信息与所述第二待匹配字段名进行匹配比对,得到对应的第二比对结果;若所述第二比对结果为匹配,则将所述当前记录的所述标准字段名信息记为对应的所述第二标准字段名,并继续轮询下一条所述标准字段对应记录;若所述第二比对结果为不匹配,则继续轮询下一条所述标准字段对应记录;
30.结束轮询后,若得到的所述第二标准字段名的数量为1,则将所述第二待匹配字段名作为新的原始字段名信息向与该唯一的第一匹配信息对应的所述标准字段对应记录中添加。
31.进一步的,所述方法还包括:
32.所述第一标准字段名强制匹配接口在接收到所述第三待匹配字段名和所述第一列数据组时,将所述第三待匹配字段名、所述第一列数据组和所述标准字段对应表向复核人员进行输出;并将所述复核人员根据所述第一列数据组的数据特性,从所述标准字段对应表中唯一确认的一个与所述第三待匹配字段名匹配的所述标准字段名信息,作为对应的所述第三标准字段名。
33.进一步的,所述方法还包括:
34.所述第二标准字段名强制匹配接口在接收到所述第四待匹配字段名、所述第二列数据组和所述第一近似字段名数据组时,将所述第四待匹配字段名、所述第二列数据组和所述第一近似字段名数据组向复核人员进行输出;并将所述复核人员根据所述第二列数据组的数据特性,从所述第一近似字段名数据组中唯一确认的一个与所述第四待匹配字段名匹配的所述第二标准字段名,作为对应的所述第四标准字段名。
35.优选的,所述根据预设的与所述第一类型数据匹配的标准数据列表模板,对所述第二数据列表进行缺项数据列设置处理生成对应的第三数据列表,具体包括:
36.根据所述标准数据列表模板中各个所述模板数据列字段名,对所述第二数据列表的所有所述第二列字段名进行检查;若检查发现所述第二数据列表中不存在与当前模板数据列字段名一致的所述第二列字段名,则将所述当前模板数据列字段名记为缺项模板数据列字段名;
37.对各个所述缺项模板数据列字段名,在所述第二数据列表中添加新的第二数据列与之对应,并根据当前缺项模板数据列字段名设置对应的所述新的第二数据列的所述第二列字段名;
38.获取与所述标准数据列表模板对应的模板字段映射关系列表;并根据所述模板字段映射关系列表对各个所述新的第二数据列的所述第二列数据进行设置;所述模板字段映射关系列表包括多个模板字段映射关系记录;所述模板字段映射关系记录包括模板列字段名信息和映射关系式信息;所述映射关系式信息具体为一个关系表达式,所述关系表达式的参数包括一个或多个所述标准字段名信息;
39.将完成了所有新数据列添加和列数据设置的第二数据列表作为对应的所述第三
数据列表。
40.优选的,所述按预设的列数据转换规则,对所述第三数据列表进行列数据转换处理生成对应的第四数据列表,具体包括:
41.对所述第三数据列表各个所述第三数据列对应的列数据类型进行确认,生成对应的第一数据类型;所述第一数据类型至少包括文本型、日期型、数值型、和逻辑型;
42.对各个所述第三数据列进行轮询,并将当前被轮询的所述第三数据列记为当前数据列;若所述当前数据列对应的所述第一数据类型为逻辑型,则按所述列数据转换规则的逻辑数值转换规则,对所述当前数据列的各个所述第三列数据的原内容进行逻辑数值转换处理;若所述当前数据列对应的所述第一数据类型为日期型,则按所述列数据转换规则的日期数值转换规则,对所述当前数据列的各个所述第三列数据的原内容进行日期数值转换处理;
43.将按所述列数据转换规则完成了所有对应列数据转换的所述第三数据列表作为对应的所述第四数据列表。
44.本发明实施例第二方面提供了一种电子设备,包括:存储器、处理器和收发器;
45.所述处理器用于与所述存储器耦合,读取并执行所述存储器中的指令,以实现上述第一方面所述的方法步骤;
46.所述收发器与所述处理器耦合,由所述处理器控制所述收发器进行消息收发。
47.本发明实施例第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行上述第一方面所述的方法的指令。
48.本发明实施例提供了一种医疗数据文件的标准化处理方法、电子设备及计算机可读存储介质,基于各家保险结构的格式标准要求创建对应的标准字段对应表、标准数据列表模板和列数据转换规则,并基于上述标准字段对应表对原始医疗数据文件的数据表格进行标准字段名替换处理生成标准字段表格也就是第二数据列表,并基于上述标准数据列表模板对第二数据列表进行缺项数据列设置处理生成完整的标准字段表格也就是第三数据列表,并基于上述列数据转换规则对第三数据列表进行列数据转换处理生成数据格式合规的完整标准字段表格也就是第四数据列表。通过本发明不但节省了大量的人工操作时间,还降低了标准化转换出错率、提高了标准化转换的总体效率。
附图说明
49.图1为本发明实施例一提供的一种医疗数据文件的标准化处理方法示意图;
50.图2为本发明实施例二提供的一种电子设备的结构示意图。
具体实施方式
51.为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
52.各家保险结构信息处理系统的终端设备或服务器通过本发明实施例一提供的一
种医疗数据文件的标准化处理方法,对输入的原始医疗数据文件的数据表格进行自动化标准转换处理,继而达到无人干预或少人干预的高速批量转换目的;图1为本发明实施例一提供的一种医疗数据文件的标准化处理方法示意图,如图1所示,本方法主要包括如下步骤:
53.步骤1,获取原始医疗数据文件的数据表格类型,生成对应的第一类型数据。
54.这里,因为每种医疗数据文件的数据表格都有对应的类型,诸如,对应体检数据文件的第一类型数据就是体检表格类型、对应化验数据文件的第一类型数据就是化验单表格类型等,并且每种表格类型对应的表格结构不一样,所以在对原始医疗数据文件进行标准化转换时势必要获知该文件对应的表格类型也就是第一类型数据,第一类型数据会用于后续步骤对原始医疗数据文件的格式模板也就是标准数据列表模板进行确认。
55.步骤2,获取原始医疗数据文件的数据表格信息,生成对应的第一数据列表;
56.其中,第一数据列表包括多个第一数据列;第一数据列包括第一列字段名和一个或多个第一列数据。
57.这里,因为医疗数据表格由多个数据对象组成,那么每个第一数据列对应一个数据对象,每个第一数据列的第一列字段名实际对应该数据对象的名称;因为有些数据对象只有一个明确的对象信息,例如姓名、性别、年龄、地址、联系方式、检查类型等,对于这类数据对象分配的第一数据列只包括一个第一列数据;对应的,有些数据对象会有多个记录信息,例如体温表中每日针对体温、血压等信息的测量记录,对于这类数据对象分配的第一数据列就会包括多个第一列数据。
58.步骤3,根据预设的标准字段对应表,对第一数据列表进行标准字段名替换处理生成对应的第二数据列表;
59.其中,标准字段对应表包括多个标准字段对应记录;标准字段对应记录包括标准字段名信息和多个对应的原始字段名信息;第二数据列表包括多个第二数据列;第二数据列包括第二列字段名和一个或多个第二列数据;
60.此处,标准字段对应表是根据当前保险机构的标准字段定义规则设置的表项,该表项中每个标准字段对应记录对应一个标准字段;标准字段名信息为对应标准字段的名称;原始字段名信息可以有多个,分别是对应标准字段名信息的不同表达方式;例如,保险机构1用“保险用户标识”标记用户身份编码数据对象,医疗机构医院1用“身份证编号”标记用户身份编码数据对象,医疗机构医院2用“身份证件号”标记用户身份编码数据对象,那么,在用于对应用户身份编码数据对象的标准字段的标准字段对应记录中,就可将标准字段名信息设为“保险用户标识”,并对应分配2个原始字段名信息:原始字段名信息1为“身份证编号”、原始字段名信息2为“身份证件号”;
61.这里,当前步骤就是根据标准字段对应表,对第一数据列表的所有数据对象的第一数据列的第一列字段名进行规范化处理,将来自不同数据提供方的数据表格的字段名统一规范为本机构的标准字段名;
62.具体包括:步骤31,将第一数据列表的各个第一数据列的第一列字段名,记为第一待匹配字段名;
63.例如,第一数据列表包括1个第一数据列为第一数据列1[第一列字段名“身份证编号”,第一列数据“xxx1”];那么“身份证编号”就是第一待匹配字段名;
[0064]
又例如,第一数据列表包括1个第一数据列为第一数据列1[第一列字段名“身份
id”,第一列数据“xxx2”];那么“身份id”就是第一待匹配字段名;
[0065]
步骤32,对各个第一待匹配字段名,在标准字段对应表中进行标准字段名全匹配查询处理得到对应的第一标准字段名;
[0066]
其中,第一标准字段名的数量唯一;
[0067]
具体包括:将标准字段对应表中,与第一待匹配字段名完全一致的原始字段名信息记为全匹配字段名信息,将与全匹配字段名信息对应的标准字段对应记录的标准字段名信息作为对应的第一标准字段名;若标准字段对应表中,没有与第一待匹配字段名完全一致的原始字段名信息,则设置对应的第一标准字段名为空;
[0068]
这里,若标准字段对应表中有与第一待匹配字段名完全一致的原始字段名信息,则该原始字段名信息对应的标准字段名信息自然是与第一待匹配字段名匹配的最合适标准字段名信息,后续步骤33直接使用其对应的标准字段名信息对第一数据列表中对应的第一列字段名进行替换;若标准字段对应表中没有与第一待匹配字段名完全一致的原始字段名信息,则会由后续步骤33将之转记为第二待匹配字段名,并由后续步骤34在标准字段对应表中进行进一步的模糊比对以期找到与第二待匹配字段名匹配的最合适标准字段名信息;
[0069]
例如,标准字段对应表包括1个标准字段对应记录为:标准字段对应记录1[标准字段名信息“保险用户标识”,原始字段名信息1“身份证编号”,原始字段名信息2“身份证件号”];
[0070]
若第一待匹配字段名为“身份证编号”;那么标准字段对应表中与“身份证编号”完全一致的原始字段名信息就是原始字段名信息1,那么具体为原始字段名信息1的全匹配字段名信息对应的标准字段对应记录就是标准字段对应记录1,对应的第一标准字段名就是“保险用户标识”;
[0071]
若第一待匹配字段名为“身份id”,那么标准字段对应表中与“身份id”完全一致的原始字段名信息不存在,那么第一标准字段名就是空;
[0072]
步骤33,若第一标准字段名不为空,则使用第一标准字段名对第一数据列表中对应的第一列字段名进行替换;若第一标准字段名为空,则将对应的第一待匹配字段名记为第二待匹配字段名;
[0073]
例如,第一数据列表包括1个第一数据列1[第一列字段名“身份证编号”,第一列数据“xxx1”],第一标准字段名为“保险用户标识”;那么,使用“保险用户标识”对第一数据列表中第一数据列1的第一列字段名进行替换后得到的第一数据列表为:第一数据列1[第一列字段名“保险用户标识”,第一列数据“xxx1”];
[0074]
例如,第一数据列表包括1个第一数据列1[第一列字段名“身份id”,第一列数据“xxx2”],第一标准字段名为空,那么对应产生的第二待匹配字段名为“身份id”;
[0075]
步骤34,对各个第二待匹配字段名,在标准字段对应表中进行标准字段名模糊匹配查询处理得到对应的第二标准字段名;
[0076]
其中,第二标准字段名的数量可不唯一;
[0077]
具体包括:步骤341,对标准字段对应表中的所有标准字段对应记录进行轮询,并将当前被轮询的标准字段对应记录记为当前记录;并按预设的模糊匹配算法,对当前记录的标准字段名信息与第二待匹配字段名进行匹配比对,得到对应的第一比对结果;若第一
比对结果为匹配,则将当前记录的标准字段名信息记为对应的第二标准字段名,并继续轮询下一条标准字段对应记录;若第一比对结果为不匹配,则按模糊匹配算法对当前记录的各个原始字段名信息与第二待匹配字段名进行匹配比对,得到对应的第二比对结果;若第二比对结果为匹配,则将当前记录的标准字段名信息记为对应的第二标准字段名,并继续轮询下一条标准字段对应记录;若第二比对结果为不匹配,则继续轮询下一条标准字段对应记录;
[0078]
其中,模糊匹配算法至少包括暴力(brute force,bf)算法;
[0079]
这里,当前步骤对每个标准字段对应记录进行轮询,轮询时若当前记录的标准字段名信息或原始字段名信息能与第二待匹配字段名匹配,则标记当前记录的标准字段名信息为第二标准字段名并跳至下一条标准字段对应记录继续匹配,直到最后一个标准字段对应记录;
[0080]
在按预设的模糊匹配算法对标准字段名信息或原始字段名信息与第二待匹配字段名进行匹配比对时,若第二待匹配字段名为标准字段名信息的一部分则认为匹配,否则为不匹配;例如,标准字段名信息为“123”,若第二待匹配字段名为“1”、“2”、“3”、“12”、“23”、“123”这样具体为“123”一部分或全部子字符串的情况其对应的比对结果也就是第一比对结果为匹配,若第二待匹配字段名为“13”、“21”、“31”、“32”、“321”、“34”这样既不是“123”的一部分子字符串也不是全字符串的情况其对应的第一比对结果为不匹配;
[0081]
这里之所以在找到匹配的标准字段名信息还要继续轮询,是因为当前步骤采用的比对方式是模糊匹配方式,单次匹配成功的标准字段名信息并一定就是最合适的信息,所以需要将所有可能匹配成功的标准字段名信息都统计起来用于后续处理;
[0082]
例如,标准字段对应表中包含了2个带有“心率”的标准字段名信息:标准字段名信息1“平均心率”、标准字段名信息2“心率系数”,第二待匹配字段名为“心率”,那么在轮询结束后,就会得到2个第一匹配信息“平均心率”和“心率系数”;
[0083]
步骤342,结束轮询后,若得到的第二标准字段名的数量为1,则将第二待匹配字段名作为新的原始字段名信息向与该唯一的第一匹配信息对应的标准字段对应记录中添加;
[0084]
若得到的第二标准字段名的数量为1说明标准字段对应表中有且只有一个与第二待匹配字段名匹配的标准字段名信息,这种情况下本发明实施例认为当前这个标准字段名信息就是与第二待匹配字段匹配的最合适标准字段名信息,所以还把第二待匹配字段名作为新的原始字段名信息添加到标准字段对应表中对其进行自动扩充;
[0085]
步骤35,若第二标准字段名不为空且数量唯一,则使用唯一的第二标准字段名对第一数据列表中对应的第一列字段名进行替换;若第二标准字段名为空,则将对应的第二待匹配字段名记为第三待匹配字段名;若第二标准字段名数量不唯一,则将对应的第二待匹配字段名记为第四待匹配字段名;
[0086]
这里,若第二标准字段名不为空且数量唯一说明标准字段对应表中有且只有一个与第二待匹配字段名匹配的标准字段名信息,这种情况下本发明实施例认为当前这个第二标准字段名就是与第二待匹配字段匹配的最合适标准字段名信息,所以直接使用其对第一数据列表中对应的第一列字段名进行替换;
[0087]
若第二标准字段名为空说明标准字段对应表中没有与第二待匹配字段名匹配的最合适标准字段名信息,则会由后续步骤35将其转记为第三待匹配字段名并经由后续步骤
36在标准字段对应表中进行进一步的强制匹配从而确认与第三待匹配字段名匹配的最合适标准字段名信息;
[0088]
若第二标准字段名数量不唯一说明标准字段对应表中有多个与第二待匹配字段名匹配的标准字段名信息,则会由后续步骤35将其转记为第四待匹配字段名并经由后续步骤37在多个匹配的第二标准字段名中进行进一步的强制匹配从而确认与第四待匹配字段名匹配的最合适标准字段名信息;
[0089]
步骤36,对各个第三待匹配字段名,从第一数据列表中对应的第一数据列里提取出指定数量的第一列数据组成对应的第一列数据组;并将第三待匹配字段名和第一列数据组,输入预设的第一标准字段名强制匹配接口进行处理生成对应的第三标准字段名;若第三标准字段名不为空,则使用第三标准字段名对第一数据列表中对应的第一列字段名进行替换;
[0090]
进一步的,第一标准字段名强制匹配接口在接收到第三待匹配字段名和第一列数据组时,将第三待匹配字段名、第一列数据组和标准字段对应表向复核人员进行输出;并将复核人员根据第一列数据组的数据特性,从标准字段对应表中唯一确认的一个与第三待匹配字段名匹配的标准字段名信息,作为对应的第三标准字段名;
[0091]
这里,指定数量常规被设为5;复核人员会根据第一列数据组的实际数据特点确认对应第一数据列的字段特征,再从标准字段对应表中挑选一个与该字段特征最匹配的标准字段名信息返回给第一标准字段名强制匹配接口作为与第三待匹配字段名匹配的标准字段名信息也就是第三标准字段名;自然在得到第三标准字段名之后,就可直接使用其对第一数据列表中对应的第一列字段名进行替换;
[0092]
步骤37,对各个第四待匹配字段名,从第一数据列表中对应的第一数据列里提取出指定数量的第一列数据组成对应的第二列数据组;并将对应的多个第二标准字段名组成第一近似字段名数据组;并将第四待匹配字段名、第二列数据组和第一近似字段名数据组,输入预设的第二标准字段名强制匹配接口进行处理生成对应的第四标准字段名;若第四标准字段名不为空,则使用第四标准字段名对第一数据列表中对应的第一列字段名进行替换;
[0093]
需要说明的是,第二标准字段名强制匹配接口在接收到第四待匹配字段名、第二列数据组和第一近似字段名数据组时,将第四待匹配字段名、第二列数据组和第一近似字段名数据组向复核人员进行输出;并将复核人员根据第二列数据组的数据特性,从第一近似字段名数据组中唯一确认的一个与第四待匹配字段名匹配的第二标准字段名,作为对应的第四标准字段名;
[0094]
这里,指定数量常规被设为5;复核人员会根据第二列数据组的实际数据特点确认对应第一数据列的字段特征,再从第一近似字段名数据组的多个第二标准字段名中挑选一个与该字段特征最匹配的第二标准字段名返回给第一标准字段名强制匹配接口作为与第四待匹配字段名匹配的标准字段名信息也就是第四标准字段名;自然在得到第四标准字段名之后,就可直接使用其对第一数据列表中对应的第一列字段名进行替换;
[0095]
步骤38,将完成了所有标准字段名替换的第一数据列表作为第二数据列表。
[0096]
这里,得到的第二数据列表的所有字段名都已经统一规范为本机构的标准字段名。
[0097]
步骤4,根据预设的与第一类型数据匹配的标准数据列表模板,对第二数据列表进行缺项数据列设置处理生成对应的第三数据列表;
[0098]
其中,标准数据列表模板包括多个模板数据列字段名;第三数据列表包括多个第三数据列;第三数据列包括第三列字段名和一个或多个第三列数据;
[0099]
这里,标准数据列表模板是与当前数据表格类型对应的格式模板,该格式模板中给出了当前机构对该类数据表格的必选标准字段要求,每个模板数据列字段名对应一个必选标准字段;当前步骤就是根据标准数据列表模板,对第二数据列表的必选标准字段进行规范化处理;
[0100]
具体包括:步骤41,根据标准数据列表模板中各个模板数据列字段名,对第二数据列表的所有第二列字段名进行检查;若检查发现第二数据列表中不存在与当前模板数据列字段名一致的第二列字段名,则将当前模板数据列字段名记为缺项模板数据列字段名;
[0101]
这里,当前步骤首先检查第二数据列表中是否由必选标准字段缺失,若有则将缺失的必选标准字段对应的模板数据列字段名标记出来;
[0102]
步骤42,对各个缺项模板数据列字段名,在第二数据列表中添加新的第二数据列与之对应,并根据当前缺项模板数据列字段名设置对应的新的第二数据列的第二列字段名;
[0103]
这里,在第二数据列表中为各个缺失的必选标准字段创建对应的第二数据列;
[0104]
步骤43,获取与标准数据列表模板对应的模板字段映射关系列表;并根据模板字段映射关系列表对各个新的第二数据列的第二列数据进行设置;
[0105]
其中,模板字段映射关系列表包括多个模板字段映射关系记录;模板字段映射关系记录包括模板列字段名信息和映射关系式信息;映射关系式信息具体为一个关系表达式,关系表达式的参数包括一个或多个标准字段名信息;
[0106]
进一步的,根据模板字段映射关系列表对各个新的第二数据列的第二列数据进行设置,具体为:对各个新的第二数据列进行轮询,并将与当前被轮询的第二数据列对应的缺项模板数据列字段名记为当前字段名,并将模板字段映射关系列表中与当前字段名匹配的关系表达式记为当前表达式;并将与当前表达式的参数对应的其他第二数据列的第二列数据代入当前表达式进行赋值和表达式计算处理,并根据计算结果对当前被轮询的第二数据列进行第二列数据设置;
[0107]
例如,新的第二数据列的第二列字段名为“住院时长”,对应的当前表达式为“出院时间
”‑“
入院时间”,从第二数据列表中提取出第二列字段名为“出院时间”的第二数据列的第二列数据为2021-1-10,从第二数据列表中提取出第二列字段名为“入院时间”的第二数据列的第二列数据为2021-1-9,那么将2021-1-10和2021-1-9代入“出院时间
”‑“
入院时间”中就可以得到计算结果为9,那么第二列字段名为“住院时长”新第二数据列的第二列数据就被设为9;
[0108]
步骤45,将完成了所有新数据列添加和列数据设置的第二数据列表作为对应的第三数据列表。
[0109]
这里,得到的第三数据列表中所有字段是满足机构对该类数据列表的必选标准字段要求的。
[0110]
步骤5,按预设的列数据转换规则,对第三数据列表进行列数据转换处理生成对应
的第四数据列表;
[0111]
其中,第四数据列表包括多个第四数据列;第四数据列包括第四列字段名和一个或多个第四列数据;
[0112]
这里,因为每个数据提供方在对一些特定数据类型的表达上都可能存在一定的表达差异,例如对于日期型数据,就可能存在“年/月/日”格式、“年-月-日”格式和“月-日”格式等多种表达方式,对于逻辑型数据,也可能存在“真/假”、“t/f”、“是/否”等多种表达方式;当前步骤就是通过预先设定的列数据转换规则,对每种可能有多种表达方式的数据类型进行标准化数值型转换;
[0113]
具体包括:步骤51,对第三数据列表各个第三数据列对应的列数据类型进行确认,生成对应的第一数据类型;
[0114]
其中,第一数据类型至少包括文本型、日期型、数值型、和逻辑型;
[0115]
步骤52,对各个第三数据列进行轮询,并将当前被轮询的第三数据列记为当前数据列;若当前数据列对应的第一数据类型为逻辑型,则按列数据转换规则的逻辑数值转换规则,对当前数据列的各个第三列数据的原内容进行逻辑数值转换处理;若当前数据列对应的第一数据类型为日期型,则按列数据转换规则的日期数值转换规则,对当前数据列的各个第三列数据的原内容进行日期数值转换处理;
[0116]
这里,因为文本型和数值型歧义表达较少,本发明实施例先行对日期型和逻辑型数据进行转换;另外,列数据转换规则是可以进行新规则定制和现有规则修正的,在具体实施时可以随时通过调整列数据转换规则来对不同类型甚至不同时间、不同地区、不同机构的原始医疗数据文件产生的第三数据列表进行定制的数据类型标准化处理;
[0117]
对逻辑型数据进行逻辑数值转换处理时,本发明实施例定制的逻辑数值转换规则为若逻辑数据为“真”、“t”、“true”或“是”等则统一转换为1,反之统一转换为0,即当第三列数据的原内容为指定的类似“真”、“t”、“true”或“是”这样表示逻辑真的信息时将原内容修改为1,反之当第三列数据的原内容为指定的类似“假”、“伪”、“f”、“false”或“否”这样表示逻辑伪的信息时将原内容修改为1;
[0118]
对逻辑型数据进行日期数值转换处理时,本发明实施例定制的日期数值转换规则为将指定的多种日期格式时(例如,“年/月/日”格式、“年-月-日”格式或“月-日”格式)统一转换为标准日期数值,该标准日期数值为当前日期距离1900年1月1日的偏移天数;
[0119]
步骤53,将按列数据转换规则完成了所有对应列数据转换的第三数据列表作为对应的第四数据列表。
[0120]
这里,得到的第四数据列表中所有字段的数据类型都是满足机构对该类数据列表的标准数据类型要求的。
[0121]
步骤6,将第四数据列表作为标准化处理结果输出。
[0122]
图2为本发明实施例二提供的一种电子设备的结构示意图。该电子设备可以为前述的终端设备或者服务器,也可以为与前述终端设备或者服务器连接的实现本发明实施例方法的终端设备或服务器。如图2所示,该电子设备可以包括:处理器301(例如cpu)、存储器302、收发器303;收发器303耦合至处理器301,处理器301控制收发器303的收发动作。存储器302中可以存储各种指令,以用于完成各种处理功能以及实现前述方法实施例描述的处理步骤。优选的,本发明实施例涉及的电子设备还包括:电源304、系统总线305以及通信端
口306。系统总线305用于实现元件之间的通信连接。上述通信端口306用于电子设备与其他外设之间进行连接通信。
[0123]
在图2中提到的系统总线305可以是外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
[0124]
上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)、图形处理器(graphics processing unit,gpu)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0125]
需要说明的是,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中提供的方法和处理过程。
[0126]
本发明实施例还提供一种运行指令的芯片,该芯片用于执行前述方法实施例描述的处理步骤。
[0127]
本发明实施例提供了一种医疗数据文件的标准化处理方法、电子设备及计算机可读存储介质,基于各家保险结构的格式标准要求创建对应的标准字段对应表、标准数据列表模板和列数据转换规则,并基于上述标准字段对应表对原始医疗数据文件的数据表格进行标准字段名替换处理生成标准字段表格也就是第二数据列表,并基于上述标准数据列表模板对第二数据列表进行缺项数据列设置处理生成完整的标准字段表格也就是第三数据列表,并基于上述列数据转换规则对第三数据列表进行列数据转换处理生成数据格式合规的完整标准字段表格也就是第四数据列表。通过本发明不但节省了大量的人工操作时间,还降低了标准化转换出错率、提高了标准化转换的总体效率。
[0128]
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0129]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0130]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步
详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1