基于区块链技术的医疗数据存储及大数据挖掘方法及系统与流程

文档序号：28118123发布日期：2021-12-22 14:54阅读：213来源：国知局

1.本发明涉及区块链技术领域，具体涉及一种基于区块链技术的医疗数据存储及大数据挖掘方法及系统。

背景技术：

2.随着社会的发展，医院的数量越来越多，医疗卫生技术得到极大的改善，这些医院每时每刻都会产生大量的医疗数据，包括但不限于人员的患病信息、药物使用以及医疗设备使用等数据。
3.因为医院之间医疗数据集不共享的原因，所以会存在医院篡改病人病历或者是用药异常等情况的存在，无法获取更加准确的信息，部分医院甚至会存在滥用药品、抬高药价等恶性竞争的情况，目前技术无法从大量医疗数据中挖掘数据特征，对于医院是否有滥用药品以及药价不合理的现象也很难精准识别。

技术实现要素：

4.为了解决上述技术问题，本发明的目的在于提供一种基于区块链技术的医疗数据存储及大数据挖掘方法，所采用的技术方案具体如下：
5.第一方面，本发明一个实施例提供了一种基于区块链技术的医疗数据存储及大数据挖掘方法，该方法包括以下步骤：
6.目标医院遍历区块链上每个区块的医疗数据得到药品使用特征向量，所述区块为医院保存医疗数据的区块；所述药品使用特征向量为所述医疗数据的出现比例；根据所述药品使用特征向量将所遍历的医院分为正常医院集合和异常医院集合；
7.获取所述正常医院集合中药品使用特征向量的均值，根据所述均值获取所述异常医院集合中每个异常医院的异常用药向量，根据异常用药向量序列获取异常特征稳定程度，根据所述异常特征稳定程度将所述医院分类为关注医院集和参考医院集；
8.获取任意两个目标医院所对应的参考医院的异常用药向量序列之间的相似度，根据所述相似度将所述参考医院集划分为多个相似类别；根据每个相似类别内所述参考医院的异常特征稳定程度和异常用药向量获取第一融合向量；
9.获取所述参考医院集中所述异常特征稳定程度的总变差以及所述异常特征稳定程度的均值，根据参考医院集的所述第一融合向量、总变差以及均值获取第二融合向量；
10.根据所述第二融合向量获取医院的异常程度，根据所述异常程度以及工作量获取所述医院的可接受程度；所述工作量为所述目标医院遍历的所述区块的数目与区块链上总区块数目的比值；根据每个医院的可接受程度决定给予奖励的对应医院。
11.优选的，所述根据所述特征向量获取正常医院集合和异常医院集合的步骤，包括：
12.对所遍历的所有所述医院的特征向量进行聚类，所述特征向量集中密集分布的为正常医院集合，其余为异常医院集合。
13.优选的，所述获取所述异常医院集合中每个医院的异常用药向量序列的步骤，进
一步包括：
14.获取所述正常医院集合内所有所述特征向量的均值，计算所述异常医院集合内每个所述特征向量与所述均值的差值，对所述差值取绝对值得到对应异常医院的异常用药向量。
15.优选的，所述根据所述异常用药向量序列获取异常特征稳定程度的步骤，包括：
16.获取所述异常用药向量序列中每个异常用药向量的模长得到异常用药程度序列，根据所述异常用药程度序列中非零元素的比例获取所述异常特征稳定程度。
17.优选的，所述获取任意两个医院所对应所述参考医院集合的相似度的步骤，包括：
18.获取两个目标医院对应所述参考医院集之间的交集，所述交集中的每一个医院对应两个所述异常用药向量序列，计算所述两个参考医院集之间的交并比，以及所述两个异常用药向量序列的异常特征稳定程度，根据所述交并比以及两个所述异常特征稳定程度获取所述相似度。
19.优选的，所述根据每个相似类别内所述参考医院的异常特征稳定程度和异常用药向量获取第一融合向量的步骤，包括：
20.获取所述相似类别中任意参考医院的异常特征稳定程度与所述相似类别中所有参考医院异常特征稳定程度之和的比值，将所述比值作为所述参考医院对应异常用药向量的第一权重，获取所述第一融合向量。
21.优选的，所述根据所述第一融合向量、总变差以及均值获取第二融合向量的步骤，包括：
22.获取所述均值与所述总变差的比值，以所述比值作为所述第一融合向量的第二权重，获取第二融合向量。
23.优选的，所述根据所述异常用药程度以及工作量获取所述医院的可接受程度的步骤，包括：
24.获取所述医院的异常用药程度与所述工作量的乘积，所述乘积为所述可接受程度。
25.第二方面，本发明另一个实施例提供了一种基于区块链技术的医疗数据存储及大数据挖掘系统，该系统包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述方法的步骤。
26.本发明具有如下有益效果：通过获取每个医院的药品使用特征向量将医院分为正常医院集合和异常医院集合，获取异常医院集合中异常医院的异常特征稳定程度，根据异常特征稳定程度将医院划分为参考医院集和关注医院集；进一步根据参考医院之间的异常用药向量序列之间的相似度，将参考医院集划分为多个相似类别，获取每个相似类别的第一融合向量，根据第一融合向量以及参考医院集的总变差和均值获取第二融合向量，并进一步获取每个医院的可接受程度，对可接受程度大的医院分配奖励。通过对大量医疗数据的分析和挖掘获取各个医院的有用信息，对每个医院有用信息进行融合，判断该医院是否存在药品使用异常以及药价不合理的情况，改善医院之间的恶性竞争的情况。
附图说明
27.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施
例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。
28.图1为本发明一个实施例所提供的一种基于区块链技术的医疗数据存储及大数据挖掘的方法流程图。
具体实施方式
29.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效，以下结合附图及较佳实施例，对依据本发明提出的一种基于区块链技术的医疗数据存储及大数据挖掘方法及系统，其具体实施方式、结构、特征及其功效，详细说明如下。在下述说明中，不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外，一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
30.除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
31.本发明实施例应用的具体场景为各个医院之间，为了解决医院之间药价不合理以及恶意竞争的问题，通过获取每个医院的药品使用特征向量将医院分为正常医院集合和异常医院集合，获取异常医院集合中异常医院的异常特征稳定程度，根据异常特征稳定程度将医院划分为参考医院集和关注医院集；进一步根据参考医院之间的异常用药向量序列之间的相似度，将参考医院集划分为多个相似类别，获取每个相似类别的第一融合向量，根据第一融合向量以及参考医院集的总变差和均值获取第二融合向量，并进一步获取每个医院的可接受程度，对可接受程度大的医院分配奖励。根据大数据的分析和挖掘获取到更多的有用信息，对有用信息进行融合判断出医院之间是否存在滥用药品以及药价不合理的情况，更好的改善恶性医疗竞争。
32.下面结合附图具体的说明本发明所提供的一种基于区块链技术的医疗数据存储及大数据挖掘方法及系统的具体方案。
33.请参阅图1，其示出了本发明一个实施例提供的基于区块链技术的医疗数据存储及大数据挖掘的方法流程图，该方法包括以下步骤：
34.步骤s100，目标医院遍历区块链上每个区块的医疗数据得到药品使用特征向量，区块为医院保存医疗数据的区块；药品使用特征向量为医疗数据的出现比例；根据药品使用特征向量将遍历的医院分为正常医院集合和异常医院集合。
35.医疗数据为每个医院在日常的工作当中产生的数据，包括：患者姓名、看病日期、患病情况、诊断的医生、药单、药品价格以及医疗设备的收费，为了实现各个医院部分数据之间的共享，将产生的大量的医疗数据按照时间顺序打包进区块，并将区块连接到历史区块链上，每个医院都能够遍历历史区块链，该历史区块链上的每个区块中包含着一个医院所产生的和存储的所有医疗数据。
36.优选的，为了尽可能快速的、更多的遍历区块链中的区块，增加最终数据的多样性和泛化性，给每个区块设置一个可读概率p，那么该区块的不可读概率为1
‑
p。在医院遍历区块时，可以不必依次遍历每个区块中的医疗数据，而是优选选择遍历可读概率高的区块中的医疗数据。
37.药品使用特征向量的获取方法具体为：选定任意一个生成了新区块的医院作为目标医院，当目标医院遍历了n个区块之后，能够获取到n个区块中的所有的医疗数据。在目标医院读取到的数据中，包含患者诊断结果为m的医疗数据一共有n个，即对应n个药单，在n个药单中药品种类的数量为p；在n个药单中，涉及到医院k的数据为n
k
条，即医院k对应n
k
个药单。将医院k的药品使用特征向量记为v
km
，该药品使用特征向量的维度为药品种类的数量p，其中每一个维度对应这n个药单中的每一种药品，则每个维度的值为：
[0038][0039]
其中，n
k
表示在n个药单数据中涉及到医院k的数据的数量；a表示第p个维度对应的药品在n
k
个药单中出现的次数；b表示第p个维度对应的药品在n个药单里出现的次数。
[0040]
需要说明的是，如果的值越小，说明医院k使用该药品的概率与所有医院使用该药品的概率一致，那么认为医院k是正常使用该药品；如果的值越大，说明医院k使用该药品的概率与所有医院使用该药品的概率值差别较大，认为医院k对该药品的使用时异常的。
[0041]
对所遍历的所有医院的特征向量进行聚类，特征向量集中密集分布的为正常医院集合，其余为异常医院集合。具体的，对于患病诊断结果m获取到的药品使用特征向量进行聚类，本发明实施例中采用均值漂移的方法，并默认最终聚类结果的类别只有一个，在该聚类类别中的药品使用特征向量集中分布，将该类别中每个药品使用特征向量所相应的医院作为正常使用药品的正常医院，所有正常医院组成集合s称为正常医院集合，将另外不属于集合s的分散分布的医院作为异常使用药品的异常医院，组成异常医院集合。当最终聚类结果的类别为多个时，保留元素数量最多的类别作为正常医院集合，其他的为异常医院集合。
[0042]
步骤s200，获取正常医院集合中药品使用特征向量的均值，根据均值获取异常医院集合中每个异常医院的异常用药向量，根据异常用药向量序列获取异常特征稳定程度，根据异常特征稳定程度将医院分类为关注医院集和参考医院集。
[0043]
在后续进行区块遍历获取医疗数据时，为了节省后续的计算时间，只获取关注医院集和参考医院集的医疗数据即可，不必读取区块中的其他医疗数据。
[0044]
由步骤s100中得到异常医院集合和正常医院集合，获取正常医院集合内所有药品使用特征向量的均值，计算异常医院集合内每个药品使用特征向量与均值的差值，对差值取绝对值得到对应异常医院的异常用药向量。
[0045]
具体的，将正常医院集合中的药品使用特征向量的均值记为v1，将每一个异常医院的药品使用特征向量与均值v1的差值的绝对值记为v，最终的结果v为对应异常医院的异常用药向量。
[0046]
需要说明的是，异常用药向量v中的元素值越大，说明该异常医院与其他大多数医院的用药的差异越大，用药越异常。由此可以获取到所有异常医院所对应的异常用药向量，本发明实施例中将零向量作为正常医院的异常用药向量。
[0047]
进一步的，根据异常用药向量序列获取异常特征稳定程度的步骤包括：获取异常用药向量序列中每个异常用药向量的模长得到异常用药程度序列，根据异常用药程度序列
中非零元素的比例获取异常特征稳定程度。
[0048]
具体的，在目标医院遍历完n个区块获取到的所有数据中，将医院k的异常用药向量记为v(n)，计算该异常用药向量的模长l(n)，将模长作为对应异常用药向量的异常用药程度。当遍历到的区块的数目不同时，获取到不同的异常用药向量以及异常用药程度。将遍历区块数目n取不同的值时获取到的异常用药向量组成一个序列，记为异常用药向量序列。
[0049]
由于遍历过程中区块数目n的取值不同，所以每个异常向量序列的维度也不相同。本发明实施例中设置区块数目阈值th1，当区块数目n大于阈值th1时，获取异常用药向量序列及其对应的异常用药程度序列。获取异常用药程度序列中非零元素的数量，计算非零元素的数量与异常用药程度序列中元素的数量的比值，得到异常用药程度序列中非零元素的比例，将该比例作为医院k的异常特征稳定程度。
[0050]
需要说明的是，本发明实施例中将区块数目阈值th1设置为th1＝1000，并将遍历时间设置为3分钟，默认3分钟内至少遍历1000个区块，将区块数目最大时对应的异常用药向量序列的维度作为最终维度，当异常用药向量序列的维度小于最终维度时，利用零元素对该异常用药向量序列进行填充。
[0051]
基于获取医院k异常特征稳定程度相同的原理，获取在遍历n个区块后得到的数据中所有异常医院的异常特征稳定程度，设置异常特征稳定程度的最大阈值和最小阈值，当异常特征稳定程度大于最大阈值时，对应的医院作为关注医院；当异常特征稳定程度小于最小阈值时，对应的医院作为参考医院，由此划分出关注医院集和参考医院集。
[0052]
作为优选，本发明实施例中将异常特征稳定程度的最大阈值设为0.7，最小阈值设为0.3。
[0053]
步骤s300，获取任意两个目标医院所对应的参考医院的异常用药向量序列之间的相似度，根据相似度将参考医院集划分为多个相似类别；根据每个相似类别内参考医院对应的异常特征稳定程度和异常用药向量获取第一融合向量。
[0054]
根据步骤s200中获取到关注医院集和参考医院集。当目标医院每遍历一定数量的区块后，由于获取到的数据的改变，所以关注医院与参考医院也会相应发生变化，需要重新计算关注医院以及参考医院的异常用药向量，将每个目标医院遍历最后一个区块时获取到的数据作为关注医院集和参考医院集以及其中的医院的异常用药向量序列。
[0055]
作为优选，本发明实施例中设置目标医院每遍历100个区块时，重新计算关注医院和参考医院。
[0056]
需要说明的是，在目标医院遍历完1000个区块之后，每遍历100个区块需要重新计算，并且遍历的最后一个区块为3分钟内的最后一个区块。
[0057]
进一步的，每个目标医院在默认时间段3分钟内对历史区块进行遍历和数据提取，获取到每个目标医院所对应的关注医院集和参考医院集以及其中每个医院的异常用药向量序列。
[0058]
对于医院k而言，每个目标医院获取到的数据结果中医院k所对应不同的异常用药向量序列，因此根据每个目标医院获取到的数据结果对医院k的数据进行融合。利用参考医院集之间的相似度将参考医院集划分不同的相似类别，对每一个相似类别进行融合，从而判断医院k是否存在严重的异常用药情况。
[0059]
其中，获取相似度的步骤包括：获取两个目标医院对应参考医院集之间的交集，交
集中的每一个医院对应两个异常用药向量序列，计算两个参考医院集之间的交并比，以及两个异常用药向量序列的异常特征稳定程度，根据交并比以及两个异常特征稳定程度获取相似度。
[0060]
具体的，获取任意两个目标医院所对应参考医院集之间的交集区域，在交集区域中每个参考医院都属于两个参考医院集，即对应两个目标医院，那么每个参考医院都对应两个异常用药向量序列，分别获取这两个异常用药向量序列的异常特征稳定程度，那么两个参考医院集之间相似度具体为：
[0061][0062]
其中，s
m
代表目标医院m对应的参考医院集；s
p
代表目标医院p对应的参考医院集；sim(s
m
、s
p
)表示参考医院集s
m
和参考医院集s
p
之间的相似度；s1表示参考医院集s
m
和参考医院集s
p
之间交集区域；iou表示参考医院集s
m
和参考医院集s
p
的交并比；d
m
(x)表示参考医院集s
m
中参考医院的异常特征稳定程度；d
p
(x)表示参考医院集s
p
中参考医院的异常特征稳定程度；d
m
(a)表示参考医院集s
m
中任意参考医院a的异常特征稳定程度；d
p
(b)表示参考医院集s
p
中任意参考医院b的异常特征稳定程度；|s
m
|表示参考医院集s
m
中所有参考医院的数量；|s
p
|表示参考医院集s
p
中所有参考医院的数量。
[0063]
需要说明的是，d
m
(x)+d
p
(x)表示交集区域中元素x的异常特征稳定程度的和，由于本发明实施例中关注的是交集区域中所有元素的异常特征稳定程度是否足够小，因此使用exp(
‑
(d
m
(x)+d
p
(x)))来进行负相关映射。如果∑
x∈s1
exp(
‑
(d
m
(x)+d
p
(x)))的值足够大时，说明在交集区域中的医院用药情况比较正常，此时需要关注交并比iou的大小，如果参考医院集s
m
和参考医院集s
p
的交并比iou足够大，那么参考医院集s
m
和参考医院集s
p
的相似度就比较高；表示参考医院集s
m
中所有元素的异常特征稳定程度是否足够小；表示参考医院集s
p
中所有元素的异常特征稳定程度是否足够小；当参考医院集s
m
和参考医院集s
p
的交集中参考医院的异常特征稳定程度小并且交并比较大时，参考医院集s
m
和参考医院集s
p
之间的相似度高。
[0064]
对于医院k，其对应多个目标医院和参考医院集，对所有的参考医院集划分为多个相似类别。
[0065]
本发明实施例中采用谱聚类的方式对参考医院集进行划分，具体的，将每个参考医院集作为一个节点，节点之间进行相连，将节点之间的相似度作为边权值，设定边权值阈值，将边权值小于边权值阈值时所对应的参考医院之间断开，由此获取一个图数据；对该图数据进行谱聚类，获取多个相似类别，每个相似类别中是节点的集合，属于同一个相似类别中的节点之间具有较强的相似度。
[0066]
作为优选，由于相似度的取值与交集区域内医院的数量直接相关，所以本发明实施例中将边权值阈值设置为交集区域中医院数量的五分之三。
[0067]
对于任意一个相似类别c1，假设该类别中的元素为c1＝{c1,c2,
…
,c
i
,
…
}，获取该
相似类别中任意参考医院的异常特征稳定程度与该相似类别中所有参考医院异常特征稳定程度之和的比值，将该比值作为参考医院对应异常用药向量的第一权重，获取第一融合向量。
[0068]
第一权重具体为：
[0069][0070]
其中，α
i
表示第一权重；d
c1
(c
i
)表示相似类别c1中第i个参考医院的异常特征稳定程度。
[0071]
进一步的，第一融合向量具体为：
[0072][0073]
其中，z(c1)表示相似类别c1中的第一融合向量；α
i
表示第一权重；c
i
表示相似类别c1中第i个参考医院的异常用药向量。
[0074]
步骤s400，获取参考医院集中异常特征稳定程度的总变差以及异常特征稳定程度的均值，根据参考医院集的第一融合向量、总变差以及均值获取第二融合向量。
[0075]
具体的，以每个相似类别中的参考医院集作为节点构成图数据，该图数据中每个节点的值为该节点对应的异常用药向量序列的异常特征稳定程度。
[0076]
获取该图数据的总变差l(c1)以及该图数据中节点大小的均值d(c1)，当总变差越小时，该图数据的总变差越小时，说明该图数据越平滑，数据变化越小；获取均值与总变差的比值，以比值作为第一融合向量的第二权重，获取第二融合向量。
[0077]
具体的，第二权重为：
[0078][0079]
其中，β(c1)表示第二权重；d(c1)表示相似类别c1的均值；l(c1)表示相似类别c1的总变差；c表示相似类别的集合。
[0080]
则第二融合向量为：
[0081]
z＝∑
c1∈c
β(c1)z(c1)
[0082]
其中，z表示第二融合向量；β(c1)表示第二权重；z(c1)表示第一融合向量；c表示相似类别的集合。
[0083]
步骤s500，根据第二融合向量获取医院的异常程度，根据异常程度以及工作量获取医院的可接受程度；工作量为医院遍历的区块的数目与区块链上总区块数目的比值；根据可接受程度决定给予奖励的对应医院。
[0084]
具体的，根据步骤s400获取医院k的第二融合向量，将第二融合向量的长度作为医院k的异常用药程度，当异常用药程度的值越大时，表示医院k存在严重的药物使用不合理或者滥用药品的情况。将医院k所对应的所有的患病诊断结果的异常用药程度相加，获取医院k的异常程度。
[0085]
获取医院的异常程度与工作量的乘积，将乘积作为可接受程度。
[0086]
具体的，按照异常程度进行从小到大的排序，获取选取前k个异常程度所对应的医院，每个医院的工作量定义为该医院作为目标医院时遍历区块的数目与区块链上总区块数目的比值，将该医院对应的异常程度与其工作量进行相乘，将最后获取到的乘积作为对应医院的可接受程度。
[0087]
需要说明的是，除了前k个异常程度所对应的医院之外，其余医院的可接受程度为0。
[0088]
获取到可接受程度最大的医院，将该医院生成的医疗数据打包成区块后连接到区块链上，并给予该医院奖励，奖励的方式为进行药价的打折，打折力度为0.8；对于可接受程度小的医院，其药品的价格会比可接受程度大的医院药品价格更高，因此可以提高可接受程度大的医院之间的药价竞争能力，逐渐淘汰可接受程度小的用户，即逐渐淘汰滥用药品以及药价不合理的医院。
[0089]
综上所述，本发明实施例通过获取每个医院的药品使用特征向量将医院分为正常医院集合和异常医院集合，获取异常医院集合中异常医院的异常特征稳定程度，根据异常特征稳定程度将医院划分为参考医院集和关注医院集；进一步根据参考医院之间的异常用药向量序列之间的相似度，将参考医院集划分为多个相似类别，获取每个相似类别的第一融合向量，根据第一融合向量以及参考医院集的总变差和均值获取第二融合向量，并进一步获取每个医院的可接受程度，对可接受程度大的医院分配奖励。根据大数据的分析和挖掘获取到更多的有用信息，对有用信息进行融合判断出医院之间是否存在滥用药品以及药价不合理的情况，更好的改善恶性医疗竞争。
[0090]
基于与上述方法实施例相同的发明构思，本发明实施例还提供了一种基于区块链技术的医疗数据存储及大数据挖掘系统，该系统包括：处理器、存储器以及存储在所述存储器中并可在处理器上运行的计算机程序。处理器执行所述计算机程序时实现上述一种基于区块链技术的医疗数据存储及大数据挖掘方法实施例中的步骤，例如图1所示的步骤。该一种基于区块链技术的医疗数据存储及大数据挖掘方法在上述实施例中已经详细说明，不再赘述。
[0091]
需要说明的是：上述本发明实施例先后顺序仅仅为了描述，不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0092]
本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。
[0093]
以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘玉棚;陈梓城
技术所有人：刘玉棚
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。