本发明属于医疗数据分析,具体涉及一种医疗数据分析方法及系统。
背景技术:
1、随着数据分析技术的发展,医疗信息化规模也呈现不断扩大趋势。随着医疗信息化的持续发展,医学数据日渐累积,数量庞大,种类繁多,但是医疗数据大多服务于医生临床诊断,并且各医疗系统之间信息相互独立,标准不统一,给医疗数据的重用带来重重困难。
2、血气分析是指测定血液中的各项血液指标参数并进行分析判断了解机体的通气和换气功能,以及各种酸碱失衡的情况。而血气检测数据作为医疗数据中重要的分析基础数据,大多依靠医务人员进行人为筛选,再继续后续的血气分析,人力成本投入大,并且缺乏系统性的数据筛选体系。再人为筛选得到血气检测数据后,同样需要医务人员进行一对一的气血分析,时间成本投入大,过度依赖医生的专业知识和经验,容易发生急诊状态或医生人数缺乏情况下,产生的气血分析效率低的问题,而且,由于受医务人员的临床知识及指标复杂多变的影响,很难做出准确的诊断性判断,导致血气分析结果准确性低。
技术实现思路
1、为了解决现有技术存在的医学数据应用受限,血气检测数据人为筛选人力成本投入大,气血分析效率低以及结果准确性低的问题,本发明目的在于提供一种医疗数据分析方法及系统。
2、本发明所采用的技术方案为:
3、一种医疗数据分析方法,包括如下步骤:
4、采集血气检测大数据,并根据血气检测大数据,构建血气检测知识图谱;
5、根据血气检测大数据和血气检测知识图谱,构建血气分析模型和血气分析数据库;
6、采集当前患者的医疗数据,得到实时的医疗数据,并将实时的医疗数据输入血气检测知识图谱进行数据筛选,得到实时的血气检测数据;
7、将实时的血气检测数据输入血气分析模型进行血气分析,得到当前患者的血气分析结果;
8、将当前患者的血气分析结果输入血气分析数据库进行核验,若核验通过,则输出当前患者的血气分析结果,否则,重新采集当前患者的医疗数据,得到更新的医疗数据,并根据更新的医疗数据,依次进行数据筛选和血气分析。
9、进一步地,采集血气检测大数据,并根据血气检测大数据,构建血气检测知识图谱,包括如下步骤:
10、采集初始的血气检测大数据,并对初始的血气检测大数据进行格式转换和脱敏处理,得到可识别的血气检测大数据;
11、使用血气检测知识抽取模型对可识别的血气检测大数据中的半结构化数据和非结构化数据进行知识抽取,得到可识别的血气检测大数据的实体、关系以及属性;
12、将可识别的血气检测大数据的实体、关系以及属性与可识别的血气检测大数据中的结构化数据进行知识整合和知识表示,得到第一血气检测知识大数据;
13、对第一血气检测知识大数据进行实体对齐和共指消解的知识融合,得到第二血气检测知识大数据;
14、根据第二血气检测知识大数据,构建血气检测知识图谱。
15、进一步地,血气检测知识抽取模型基于bert-bilstm-crf算法进行训练得到。
16、进一步地,根据血气检测大数据和血气检测知识图谱,构建血气分析模型和血气分析数据库,包括如下步骤:
17、对血气检测大数据中每条历史的血气检测数据进行进行标准化处理和添加血气分析标签,得到带有血气分析标签的模型训练数据集;模型训练数据集中每条模型训练数据为历史的标准化处理后的血气检测数据;
18、基于drn网络建立初始的血气分析模型,并使用igwo寻优算法优化初始的血气分析模型的初始权值和初始阈值,得到优化后的血气分析模型;
19、将带有血气分析标签的模型训练数据集输入优化后的血气分析模型进行训练,将优化后的血气分析模型输出的血气分析标签作为血气分析结果,得到最优的血气分析模型和若干历史的血气分析结果,并根据若干历史的血气分析结果及其对应的历史的血气检测数据,构建血气分析数据库;
20、基于血气检测知识图谱和最优的血气分析模型进行交互深化训练,调整血气检测知识图谱的应用权重和最优的血气分析模型的网络参数,输出最终的血气检测知识图谱和最终的血气分析模型。
21、进一步地,引入circle混沌序列初始化、动态反向学习策略以及自适应位置定位系数对传统的灰狼寻优算法进行优化,得到igwo寻优算法;
22、circle混沌序列初始化公式为:
23、
24、式中,xi+1,j+1为circle混沌映射灰狼种群初始位置;xi,j为随机生成灰狼种群初始位置;mod(·)为mod函数;i为个体指示量;j为维度指示量;
25、动态反向学习策略的公式为:
26、x'ij(t)=k(aj(t)+bj(t))-xij(t)
27、式中,x'ij(t)、xij(t)分别为第i个体第j维的反向位置和正向位置;aj(t)、bj(t)分别为当前灰狼种群第j维的上界和下界;k为递减惯性因子,k=0.9-0.5d/dmax;d、dmax分别为当前迭代次数和最大迭代次数;t为时刻指示量;
28、加入自适应位置定位系数的igwo寻优算法的公式为:
29、
30、式中,x(t+1)为t+1时刻人工灰狼进行猎捕活动移动的位置;x1、x2、x3、xω分别为最优领导者狼α、β、δ以及随机狼ω的位置;d1、d2、d3、dω分别为人工灰狼到α、β、δ、ω狼的距离;a1、a2、a3、aω均为收敛影响系数向量,由收敛因子a决定;w1、w2均为自适应位置定位系数,w1=w·r,w2=(1-w)·r,w为位置定位因子,根据迭代次数决定且与迭代次数负相关,且w∈(0,1],r为[0,1]之间的随机数;i为参数指示量;t为时刻指示量。
31、进一步地,血气分析标签包括正常、血液酸碱度偏高、血液酸碱度偏低、呼吸功能不全、电解质紊乱、缺氧、过度通气以及二氧化碳潴留;
32、血气检测数据包括若干二元组,二元组的第一元素为文字形式的血气检测参数名称,且二元组的第二元素为数字形式的血气检测参数值,第一元素和第二元素之间设置有映射链接;
33、血气检测参数名称为氧分压含量、血氧饱和度、二氧化碳分压含量、血液ph值、血钾浓度、血钠浓度或血乳酸含量。
34、进一步地,采集当前患者的医疗数据,得到实时的医疗数据,并将实时的医疗数据输入血气检测知识图谱进行数据筛选,得到实时的血气检测数据,包括如下步骤:
35、获取当前患者的医疗检测报告,对当前患者的医疗检测报告进行文字识别,得到当前患者的实时的医疗数据;
36、将实时的医疗数据与血气检测知识图谱中的若干已知的血气检测参数名称进行匹配,得到医疗数据的对应的若干血气检测参数名称;
37、根据医疗数据的若干血气检测参数名称及其对应的血气检测参数值,得到实时的血气检测数据。
38、进一步地,将实时的血气检测数据输入血气分析模型进行血气分析,得到当前患者的血气分析结果,包括如下步骤:
39、对实时的血气检测数据进行标准化处理,得到实时的标准化处理后的血气检测数据;
40、将实时的标准化处理后的血气检测数据输入血气分析模型进行血气分析,得到对应的血气分析标签;
41、将得到的血气分析标签作为当前患者的血气分析结果进行输出。
42、进一步地,将当前患者的血气分析结果输入血气分析数据库进行核验,包括如下步骤:
43、将当前患者的血气分析结果对应的血气检测数据在血气分析数据库进行相似度匹配,得到若干相似的历史的血气检测数据;
44、根据若干历史的血气检测数据对应的历史的血气分析结果,对当前患者的血气分析结果进行核验,若与当前患者的血气分析结果相同的历史的血气检测数据的数量超过阈值,则输出核验通过,否则,输出核验不通过。
45、一种医疗数据分析系统,用于实现医疗数据分析方法,系统包括大数据采集单元、知识图谱构建单元、模型构建单元、数据库构建单元、存储单元、数据筛选单元、血气分析单元、结果核验单元以及人机交互单元,存储单元分别与大数据采集单元、知识图谱构建单元、模型构建单元、数据库构建单元、数据筛选单元、血气分析单元、结果核验单元以及人机交互单元连接,数据筛选单元、血气分析单元、结果核验单元以及人机交互单元依次连接,结果核验单元与数据筛选单元连接,大数据采集单元连接有外部的血气检测数据库;
46、大数据采集单元,用于连接外部的血气检测数据库,采集血气检测大数据,并将血气检测大数据存储至存储单元;
47、知识图谱构建单元,用于根据血气检测大数据,构建血气检测知识图谱,并将血气检测知识图谱存储至存储单元;
48、模型构建单元,用于调用存储单元存储的血气检测大数据和血气检测知识图谱,根据血气检测大数据和血气检测知识图谱,构建血气分析模型,并将血气分析模型以及训练血气分析模型输出的若干历史的血气分析结果存储至存储单元;
49、数据库构建单元,用于调用存储单元存储的血气检测大数据和若干历史的血气分析结果,根据若干历史的血气分析结果及其血气检测大数据中对应的历史的血气检测数据,构建血气分析数据库,并将血气分析数据库存储至存储单元;
50、数据筛选单元,用于调用存储单元存储的当前患者的医疗数据,得到实时的医疗数据,调用存储单元存储的血气检测知识图谱,将实时的医疗数据输入血气检测知识图谱进行数据筛选,得到实时的血气检测数据,并将实时的血气检测数据分别发送至存储单元和血气分析单元;
51、血气分析单元,用于调用存储单元存储的血气分析模型,将数据筛选单元发送的实时的血气检测数据输入血气分析模型进行血气分析,得到当前患者的血气分析结果,并将当前患者的血气分析结果分别发送至存储单元和结果核验单元;
52、结果核验单元,用于调用存储单元存储的血气分析数据库,将血气分析单元发送的当前患者的血气分析结果输入血气分析数据库进行核验,若核验通过,则向人机交互单元发送核验通过信息,并将当前患者的血气分析结果发送至人机交互单元,否则,向人机交互单元发送核验不通过信息,并向数据筛选单元发送数据采集控制指令;
53、人机交互单元,用于接收当前患者的医疗数据和用户信息,将用户信息与存储单元存储的合法用户信息进行用户验证,若验证通过,则返回验证通过信息,并将接收的当前患者的医疗数据存储至存储单元,否则,返回验证不通过信息,并拒收当前患者的医疗数据,还用于显示结果核验单元发送的当前患者的血气分析结果;
54、存储单元,用于存储合法用户信息、当前患者的医疗数据、血气检测大数据、血气检测知识图谱、血气分析模型、血气分析数据库、实时的血气检测数据以及当前患者的血气分析结果。
55、本发明的有益效果为:
56、1)本发明提供的一种医疗数据分析方法,通过对血气检测大数据进行分析,构建血气检测知识图谱,实现了医疗数据中血气检测数据的自动筛选,建立了系统性的数据筛选体系,该数据筛选体系保证了血气检测数据筛选的效率和准确率,提高了各医疗体系中不同类型和不同标准的医疗数据之间的连贯性和通用性,为医疗信息化提供了体系支撑,并且,避免了依靠医务人员进行人为筛选,降低了人力成本投入,使用血气分析模型进行精确、自动的血气分析,通过对血气检测数据中的数据特征的深度学习,将血气分析作为期望预测结果进行输出,提高了血气分析的效率和结果准确性,最后使用血气分析数据库对血气分析结果进行核验,保证了血气分析结果的可靠性和参考价值,进一步提升了方法的实用性。
57、2)本发明提供的一种医疗数据分析系统,通过构建相互独立工作且整体连接的系统,实现了医疗数据分析的自动化处理,大大的降低了人力成本和时间成本的投入,并且该系统适用于不同医疗体系的不同标准的医疗数据,实用性强,大大的提升了医疗数据分析的便利性和血气分析的准确性。
58、本发明的其他有益效果将在具体实施方式中进一步进行说明。