医疗数据智能生成方法、装置、计算机设备及存储介质与流程

文档序号:29789933发布日期:2022-04-23 17:21阅读:101来源:国知局
医疗数据智能生成方法、装置、计算机设备及存储介质与流程

1.本发明涉及数据生成方法,更具体地说是指医疗数据智能生成方法、装置、计算机设备及存储介质。


背景技术:

2.软件厂商在开发医疗场景的应用时,需要用到大量的医疗数据,以进行测试,但是目前的技术并不能取得真实环境的敏感数据,常常面临着缺少测试数据、测试数据不符合业务场景、测试数据数据量少等问题。
3.现有的方式是采用人工自动组装历史数据,形成医疗测试数据,以用于软件测试,但是这种生成医疗数据的方式存在效率低下,且成本高的问题。
4.因此,有必要设计一种新的方法,实现自动生成医疗数据,以用于软件测试,效率高,且成本低。


技术实现要素:

5.本发明的目的在于克服现有技术的缺陷,提供医疗数据智能生成方法、装置、计算机设备及存储介质。
6.为实现上述目的,本发明采用以下技术方案:医疗数据智能生成方法,包括:
7.获取与需要生成的医疗数据相关的数据表信息;
8.根据所述数据表信息解析对应表的字段含义以及字段关联关系;
9.根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则;
10.根据所述数据生成规则生成医疗数据。
11.其进一步技术方案为:所述根据所述数据表信息解析对应表的字段含义以及字段关联关系,包括:
12.根据所述数据表信息将每张表的全部字段名转换为无向图;
13.遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息;
14.采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系。
15.其进一步技术方案为:所述遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息,包括:
16.对所述无向图内的节点进行排序,并采用二分查找的方法进行广度优先搜索关联的节点;
17.通过关联的节点将所有无向图合并,以得到关联信息,并保存所述关联信息。
18.其进一步技术方案为:所述采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系,包括:
19.采用深度优先算法与适配图结构的kmp算法结合所述关联信息在预设的医疗数据库内进行字段匹配,并确定字段所在的位置,结合所述关联信息,得到字段含义以及字段关联关系。
20.其进一步技术方案为:所述根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则,包括:
21.采用广度优先搜索算法遍历所述关联信息;
22.根据字段含义建立采样公式,并根据终端输入的参数结合所述采样公式在数据集合内进行随机采样,以得到采样结果;
23.当所述关联信息内的每个节点都被遍历后,确定所述采样结果为数据生成规则。
24.其进一步技术方案为:所述数据生成规则包括需要生成的数据的字段信息、字段类型、关联关系以及医疗数据字典源。
25.其进一步技术方案为:所述根据所述数据生成规则生成医疗数据,包括:
26.遍历所述数据生成规则内的字段信息,当字段信息有关联关系的字段时,则对字段信息添加关联规则;
27.根据字段类型和字段信息对相关的字段添加构造数据的生成规则;
28.根据所述生成规则构造并生成数据,且当字段需要使用医疗相关数据,则连接医疗数据字典,抽取并生成数据,以得到中间数据;
29.根据数据生成规则将所述中间数据组织成对应的格式,以得到医疗数据;
30.导出所述医疗数据。
31.本发明还提供了医疗数据智能生成装置,包括:
32.信息获取单元,用于获取与需要生成的医疗数据相关的数据表信息;
33.解析单元,用于根据所述数据表信息解析对应表的字段含义以及字段关联关系;
34.采样单元,用于根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则;
35.生成单元,用于根据所述数据生成规则生成医疗数据。
36.本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
37.本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
38.本发明与现有技术相比的有益效果是:本发明通过终端输入的数据表信息,对数据表进行字段含义以及字段关联关系的解析,并根据解析得到的内容在数据集合内进行采样,以得到数据生成规则,依据该规则生成医疗数据,实现自动生成医疗数据,以用于软件测试,效率高,且成本低。
39.下面结合附图和具体实施例对本发明作进一步描述。
附图说明
40.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
41.图1为本发明实施例提供的医疗数据智能生成方法的应用场景示意图;
42.图2为本发明实施例提供的医疗数据智能生成方法的流程示意图;
43.图3为本发明实施例提供的医疗数据智能生成方法的子流程示意图;
44.图4为本发明实施例提供的医疗数据智能生成方法的子流程示意图;
45.图5为本发明实施例提供的医疗数据智能生成方法的子流程示意图;
46.图6为本发明实施例提供的医疗数据智能生成方法的子流程示意图;
47.图7为本发明实施例提供的医疗数据智能生成装置的示意性框图;
48.图8为本发明实施例提供的医疗数据智能生成装置的解析单元的示意性框图;
49.图9为本发明实施例提供的医疗数据智能生成装置的关联节点确定子单元的示意性框图;
50.图10为本发明实施例提供的医疗数据智能生成装置的采样单元的示意性框图;
51.图11为本发明实施例提供的医疗数据智能生成装置的生成单元的示意性框图;
52.图12为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
53.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
54.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
55.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
56.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
57.请参阅图1和图2,图1为本发明实施例提供的医疗数据智能生成方法的应用场景示意图。图2为本发明实施例提供的医疗数据智能生成方法的示意性流程图。该医疗数据智能生成方法应用于服务器中。该服务器与终端进行数据交互,通过终端输入与需要生成的医疗数据相关的数据表信息,根据数据表信息进行字段含义、字段关联关系的解析,并采样对应的数据,形成数据生成规则,依据该规则生成对应的医疗数据。
58.图2是本发明实施例提供的医疗数据智能生成方法的流程示意图。如图2所示,该方法包括以下步骤s110至s140。
59.s110、获取与需要生成的医疗数据相关的数据表信息。
60.在本实施例中,医疗数据的生成是依据现有的多个数据表进行组装等智能生成,因此,需要生成医疗数据时,需要由终端输入需要自动生成数据的表名的集合、数据库连接信息、生成数量等信息,服务器依据输入的信息以及数据库连接信息对表内的字段和关联关系进行确定,利用生成数量生成对应的数据。无需人工组装生成,效率高。
61.s120、根据所述数据表信息解析对应表的字段含义以及字段关联关系。
62.在本实施例中,字段含义是指每个相关数据表内的每个字段的含义,字段关联关系是指这些相关的数据表内的字段关联的关系。
63.在一实施例中,请参阅图3,上述的步骤s120可包括步骤s121~s123。
64.s121、根据所述数据表信息将每张表的全部字段名转换为无向图;
65.在本实施例中,无向图是指每张表的全部字段作为节点形成的图。
66.具体地,可采用现有技术将表格内的字段作为节点,形成树的节点,由此每张表对应一个树,该树则成为无向图。采用转换为无向图的方式,可以快速且准确地确定字段含义以及关联的字段。
67.在本实施例中,将每张表的全部字段名转换为无向图,设无向图为g
x
=〈v,e〉,其中v为无向图的节点,e为无向图的边。则得到一个无向图的数组l={g1,g2,
…gn
},其中n为表的数量,即无向图的数量。
68.s122、遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息。
69.在本实施例中,关联信息是指利用所有无向图所关联的节点将所有无向图合并的一张图。
70.优化搜索范围的广度优先搜索算法是先按照某种特征将每张无向图中的节点进行排序,然后采用二分查找的方法进行广度优先搜索关联的内容。
71.在一实施例中,请参阅图4,上述的步骤s122可包括步骤s1221~s1222。
72.s1221、对所述无向图内的节点进行排序,并采用二分查找的方法进行广度优先搜索关联的节点;
73.s1222、通过关联的节点将所有无向图合并,以得到关联信息,并保存所述关联信息。
74.具体地,在无向图g
x
=《v,e》中找到节点v
x
,首先将g
x
中的v的集合进行排序,然后采用二分查找的方法进行广度优先搜索,找到关联的节点。
75.通过关联的节点将所有无向图g
x
=《v,e》合并为一张无向图g=《v,e》,并去除重复的节点,由此可确定字段的关联关系。
76.s123、采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系。
77.在本实施例中,采用深度优先算法与适配图结构的kmp(克努特—莫里斯—普拉特操作,the knuth-morris-pratt algorithm)算法结合所述关联信息在预设的医疗数据库内进行字段匹配,并确定字段所在的位置,结合所述关联信息,得到字段含义以及字段关联关系。
78.在本实施例中,医疗数据库是指历史的数据库。
79.具体地,kmp算法为一种字符串查找算法,可在一个字符串s内找到一个子字符串w出现的位置。为了使之可以在图结构g=《v,e》上进行查找,假设要在g=《v,e》上查找字符串w。遍历节点的集合,设mn代表在节点vn内匹配字符串w的当前查找位置,in代表匹配字符串w当前做比较的字符位置。若每次匹配失败,则将mn设置为in+len(w),in设置为匹配失败前匹配到的字符的个数,其中len(w)为字符串w的长度。
80.字段匹配可以获取已有的医疗数据库内已定义的含义,而关联信息则可确定字段关联关系。
81.s130、根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则。
82.具体地,基于蒙特卡罗算法针对正反馈采样进行优化过后的算法在数据集合内进行不断采样,采样逼近理想情况的医疗真实数据。
83.在本实施例中,数据生成规则是指数据生成所需要的信息,包括需要生成的数据的字段信息、字段类型、关联关系以及医疗数据字典源。
84.在一实施例中,请参阅图5,上述的步骤s130可包括步骤s131~s133。
85.s131、采用广度优先搜索算法遍历所述关联信息。
86.在本实施例中,采用广度优先搜索遍历图g=《v,e》的节点,按照步骤s132对每个节点都执行数据采样。
87.s132、根据字段含义建立采样公式,并根据终端输入的参数结合所述采样公式在数据集合内进行随机采样,以得到采样结果。
88.在本实施例中,采样结果是指根据终端输入的限定条件结合采样公式在已有的数据集合内进行采样形成的数据。
89.具体地,取出保存的每个节点的含义,也就是字段含义,建立公式y=f(x1,x2…
xn),其中y为最终生成的逼近真实世界中的结果,也就是采样结果,f(x)为采样过程,x1,x2…
xn为采样过程中用到的参数,也就是终端输入的限定条件,比如采样哪一类数据,或者是采样的数据的用途。根据输入的参数在数据集合中进行随机抽样。设本次抽样结果为yn,上一次抽样结果为y
n-1
,则得到一个基于正反馈采样进行优化的函y=jyn+ky
n-1
,其中j和k为反馈参数。在本实施例中,数据集合可以是已有的医疗大数据集,集合所有真实的医疗的数据的数据库。在第一次采样时,假设前两次采样结果皆为最终值,设j=k=1,由于两次采样无法逼近真实结果,则设j=ky
n-1
/yn。在经过大量采样后,j和k即会收敛于某个值,此时则得到一个逼近真实结果的值y。
90.s133、当所述关联信息内的每个节点都被遍历后,确定所述采样结果为数据生成规则。
91.在本实施例中,确保每一个节点均被访问到后,将所有逼近真实结果的值y保存,形成数据生成规则。
92.s140、根据所述数据生成规则生成医疗数据。
93.在一实施例中,请参阅图6,上述的步骤s140可包括步骤s141~s145。
94.s141、遍历所述数据生成规则内的字段信息,当字段信息有关联关系的字段时,则对字段信息添加关联规则。
95.在本实施例中,遍历数据生成规则内的字段信息,确定该字段信息是否与其他字段有关联关系,如果该字段信息与其他字段有关联关系,则为该字段信息添加关联规则,也就是添加该与字段信息有关联关系的字段。
96.字段信息有关联关系的字段时,添加关联规则后,形成的字段信息执行步骤s142;当字段信息无有关联关系的字段时,则利用字段信息执行步骤s142。
97.s142、根据字段类型和字段信息对相关的字段添加构造数据的生成规则。
98.在本实施例中,生成规则是指根据字段类型和字段信息相关的字段如何构造数据的规则。
99.在本实施例中,依据需要生成的医疗数据的特性,将字段类型与字段信息进行组合,形成生成规则。
100.s143、根据所述生成规则构造并生成数据,且当字段需要使用医疗相关数据,则连接医疗数据字典,抽取并生成数据,以得到中间数据。
101.在本实施例中,中间数据是指根据生成规则构建的数据,当构建过程需要引用到医疗相关数据时,依据实际情况连接医疗数据字典,抽取对应的数据,组合形成的数据。
102.s144、根据数据生成规则将所述中间数据组织成对应的格式,以得到医疗数据。
103.在本实施例中,数据生成规则还包括了输出的格式,将中间数据按照该格式形成医疗数据,再导出。
104.s145、导出所述医疗数据。
105.上述的医疗数据智能生成方法,通过终端输入的数据表信息,对数据表进行字段含义以及字段关联关系的解析,并根据解析得到的内容在数据集合内进行采样,以得到数据生成规则,依据该规则生成医疗数据,实现自动生成医疗数据,以用于软件测试,效率高,且成本低。
106.图7是本发明实施例提供的一种医疗数据智能生成装置300的示意性框图。如图7所示,对应于以上医疗数据智能生成方法,本发明还提供一种医疗数据智能生成装置300。该医疗数据智能生成装置300包括用于执行上述医疗数据智能生成方法的单元,该装置可以被配置于服务器中。具体地,请参阅图7,该医疗数据智能生成装置300包括信息获取单元301、解析单元302、采样单元303以及生成单元304。
107.信息获取单元301,用于获取与需要生成的医疗数据相关的数据表信息;解析单元302,用于根据所述数据表信息解析对应表的字段含义以及字段关联关系;采样单元303,用于根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则;生成单元304,用于根据所述数据生成规则生成医疗数据。
108.在一实施例中,如图8所示,所述解析单元302包括转换子单元3021、关联节点确定子单元3022以及搜索子单元3023。
109.转换子单元3021,用于根据所述数据表信息将每张表的全部字段名转换为无向图;关联节点确定子单元3022,用于遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息;搜索子单元3023,用于采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系。
110.在一实施例中,如图9所示,所述关联节点确定子单元3022包括排序模块30221以及合并模块30222。
111.排序模块30221,用于对所述无向图内的节点进行排序,并采用二分查找的方法进行广度优先搜索关联的节点;合并模块30222,用于通过关联的节点将所有无向图合并,以得到关联信息,并保存所述关联信息。
112.在一实施例中,所述搜索子单元3023,用于采用深度优先算法与适配图结构的kmp算法结合所述关联信息在预设的医疗数据库内进行字段匹配,并确定字段所在的位置,结
合所述关联信息,得到字段含义以及字段关联关系。
113.在一实施例中,如图10所示,所述采样单元303包括遍历子单元3031、随机采样子单元3032以及规则确定子单元3033。
114.遍历子单元3031,用于采用广度优先搜索算法遍历所述关联信息;随机采样子单元3032,用于根据字段含义建立采样公式,并根据终端输入的参数结合所述采样公式在数据集合内进行随机采样,以得到采样结果;规则确定子单元3033,用于当所述关联信息内的每个节点都被遍历后,确定所述采样结果为数据生成规则。
115.在一实施例中,如图11所示,所述生成单元304包括添加子单元3041、生成规则构造子单元3042、中间数据生成子单元3043、组织子单元3044以及导出子单元3045。
116.添加子单元3041,用于遍历所述数据生成规则内的字段信息,当字段信息有关联关系的字段时,则对字段信息添加关联规则;生成规则构造子单元3042,用于根据字段类型和字段信息对相关的字段添加构造数据的生成规则;中间数据生成子单元3043,用于根据所述生成规则构造并生成数据,且当字段需要使用医疗相关数据,则连接医疗数据字典,抽取并生成数据,以得到中间数据;组织子单元3044,用于根据数据生成规则将所述中间数据组织成对应的格式,以得到医疗数据;导出子单元3045,用于导出所述医疗数据。
117.需要说明的是,所属领域的技术人员可以清楚地了解到,上述医疗数据智能生成装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
118.上述医疗数据智能生成装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图12所示的计算机设备上运行。
119.请参阅图12,图12是本技术实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
120.参阅图12,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
121.该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种医疗数据智能生成方法。
122.该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
123.该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种医疗数据智能生成方法。
124.该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图12中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
125.其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
126.获取与需要生成的医疗数据相关的数据表信息;根据所述数据表信息解析对应表的字段含义以及字段关联关系;根据所述字段含义以及字段关联关系在数据集合内进行采
样,以得到数据生成规则;根据所述数据生成规则生成医疗数据。
127.在一实施例中,处理器502在实现所述根据所述数据表信息解析对应表的字段含义以及字段关联关系步骤时,具体实现如下步骤:
128.根据所述数据表信息将每张表的全部字段名转换为无向图;遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息;采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系。
129.在一实施例中,处理器502在实现所述遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息步骤时,具体实现如下步骤:
130.对所述无向图内的节点进行排序,并采用二分查找的方法进行广度优先搜索关联的节点;通过关联的节点将所有无向图合并,以得到关联信息,并保存所述关联信息。
131.在一实施例中,处理器502在实现所述采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系步骤时,具体实现如下步骤:
132.采用深度优先算法与适配图结构的kmp算法结合所述关联信息在预设的医疗数据库内进行字段匹配,并确定字段所在的位置,结合所述关联信息,得到字段含义以及字段关联关系。
133.在一实施例中,处理器502在实现所述根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则步骤时,具体实现如下步骤:
134.采用广度优先搜索算法遍历所述关联信息;根据字段含义建立采样公式,并根据终端输入的参数结合所述采样公式在数据集合内进行随机采样,以得到采样结果;当所述关联信息内的每个节点都被遍历后,确定所述采样结果为数据生成规则。
135.其中,所述数据生成规则包括需要生成的数据的字段信息、字段类型、关联关系以及医疗数据字典源。
136.在一实施例中,处理器502在实现所述根据所述数据生成规则生成医疗数据步骤时,具体实现如下步骤:
137.遍历所述数据生成规则内的字段信息,当字段信息有关联关系的字段时,则对字段信息添加关联规则;根据字段类型和字段信息对相关的字段添加构造数据的生成规则;根据所述生成规则构造并生成数据,且当字段需要使用医疗相关数据,则连接医疗数据字典,抽取并生成数据,以得到中间数据;根据数据生成规则将所述中间数据组织成对应的格式,以得到医疗数据;导出所述医疗数据。
138.应当理解,在本技术实施例中,处理器502可以是中央处理单元(central processing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
139.本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,
是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
140.因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
141.获取与需要生成的医疗数据相关的数据表信息;根据所述数据表信息解析对应表的字段含义以及字段关联关系;根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则;根据所述数据生成规则生成医疗数据。
142.在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述数据表信息解析对应表的字段含义以及字段关联关系步骤时,具体实现如下步骤:
143.根据所述数据表信息将每张表的全部字段名转换为无向图;遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息;采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系。
144.在一实施例中,所述处理器在执行所述计算机程序而实现所述遍历所述关联信息,并采用优化搜索范围的广度优先搜索算法确定字段的关联节点,以得到关联信息,并保存所述关联信息步骤时,具体实现如下步骤:
145.对所述无向图内的节点进行排序,并采用二分查找的方法进行广度优先搜索关联的节点;通过关联的节点将所有无向图合并,以得到关联信息,并保存所述关联信息。
146.在一实施例中,所述处理器在执行所述计算机程序而实现所述采用深度优先算法与适配图结构的kmp算法结合所述关联信息搜索匹配的字段,以得到字段含义以及字段关联关系步骤时,具体实现如下步骤:
147.采用深度优先算法与适配图结构的kmp算法结合所述关联信息在预设的医疗数据库内进行字段匹配,并确定字段所在的位置,结合所述关联信息,得到字段含义以及字段关联关系。
148.在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述字段含义以及字段关联关系在数据集合内进行采样,以得到数据生成规则步骤时,具体实现如下步骤:
149.采用广度优先搜索算法遍历所述关联信息;根据字段含义建立采样公式,并根据终端输入的参数结合所述采样公式在数据集合内进行随机采样,以得到采样结果;当所述关联信息内的每个节点都被遍历后,确定所述采样结果为数据生成规则。
150.其中,所述数据生成规则包括需要生成的数据的字段信息、字段类型、关联关系以及医疗数据字典源。
151.在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述数据生成规则生成医疗数据步骤时,具体实现如下步骤:
152.遍历所述数据生成规则内的字段信息,当字段信息有关联关系的字段时,则对字段信息添加关联规则;根据字段类型和字段信息对相关的字段添加构造数据的生成规则;根据所述生成规则构造并生成数据,且当字段需要使用医疗相关数据,则连接医疗数据字典,抽取并生成数据,以得到中间数据;根据数据生成规则将所述中间数据组织成对应的格
式,以得到医疗数据;导出所述医疗数据。
153.所述存储介质可以是u盘、移动硬盘、只读存储器(read-only memory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
154.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
155.在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
156.本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
157.该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
158.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1