本发明涉及医疗大数据技术领域,尤其涉及一种基于医疗大数据的疾病诊断方法及装置。
背景技术:
医疗大数据是一个新的领域,目前,医疗大数据处于初级探索阶段,尤其是基于医疗大数据的疾病诊断是未来发展的必然趋势;现有的利用计算机来辅助疾病诊断的方法是:医生根据经验把和某个疾病相关的患者的数项个人指标挑选出来,计算机将这些数项个人指标转换成数字化值,预处理数字化值以得到预处理的值,把预处理的值输入到含有训练过的神经网络中;其中该训练过的神经网络是专门为诊断或预测该疾病训练的并且产生一个输出值,该输出值对应于患有或不患有该疾病或者该疾病的严重性。
现有的计算机辅助疾病诊断方法,虽然在一定程度上实现了疾病的自动诊断可以克服医生经验的参差不齐,但输入所有的检查的个人指标包含大部分的冗余个人指标,这些冗余个人指标会干扰疾病的诊断,降低疾病诊断的准确率。
技术实现要素:
有鉴于此,本发明实施例期望提供一种基于医疗大数据的疾病诊断方法及装置,以剔除冗余个人指标,提高疾病诊断的准确率。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供一种基于医疗大数据的疾病诊断方法,所述方法包括:
将历史指标集合转化成数字化值集合;其中,所述历史指标集合包括m名患者的k项个人指标及同一疾病状态,所述m、k为正整数;
根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所 述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb;所述b为大于等于1的正整数;
当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;
依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合;
在所述最高的相关度集合中确定最大值的相关度,得到所述最大值的相关度对应的至少一项个人指标。
上述方案中,所述疾病为眼科疾病。
上述方案中,所述个人指标包括:个人信息、家族遗传信息、体检信息、专科检查信息中的至少一项。
上述方案中,所述m为10000,k为30。
本发明还提供一种基于医疗大数据的疾病诊断装置,所述装置包括:
转化模块,用于将历史指标集合转化成数字化值集合;其中,所述历史指标集合包括m名患者的k项个人指标及同一疾病状态,所述m、k为正整数;
计算模块,用于根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb;所述b为大于等于1的正整数;
所述计算模块,还用于当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;
所述计算模块,还用于依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合;
确定模块,用于在所述最高的相关度集合中确定最大值的相关度,得到所 述最大值的相关度对应的至少一个个人指标。
上述方案中,所述疾病为眼科疾病。
上述方案中,所述个人指标包括:个人信息、家族遗传信息、体检信息、专科检查信息中的至少一项。
上述方案中,所述m为10000,k为30。
本发明实施例提供的基于医疗大数据的疾病诊断方法及装置,通过将历史指标集合转化成数字化值集合;根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb;所述b为大于等于1的正整数;当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合;在所述最高的相关度集合中确定最大值的相关度,得到所述最大值的相关度对应的至少一项个人指标;根据至少一个个人指标可以准确的预测和诊断当前患者是否患有该疾病;该方法及装置能够寻找到最佳的个人指标来诊断疾病,无需医生根据经验来挑选个人指标,剔除冗余个人指标,提高了疾病诊断的准确率;另外,利用该方法及装置可以解释疾病诊断的推理过程和推理依据,帮助医生发现原来不知道的知识和规律。
附图说明
图1为本发明基于医疗大数据的疾病诊断方法实施例的流程图;
图2为本发明基于医疗大数据的疾病诊断方法实施例的个人指标与视网膜炎的相关度的曲线图;
图3为本发明基于医疗大数据的疾病诊断装置实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
图1为本发明基于医疗大数据的疾病诊断方法实施例的流程图,如图1所示,本发明的方法可以包括如下步骤:
步骤101、将历史指标集合转化成数字化值集合;
利用基于医疗大数据的疾病诊断装置将历史指标集合转化成数据化值集合,其中,历史指标集合包括m名患者的k项个人指标及同一疾病状态,m、k为正整数;个人指标包括个人信息、家族遗传信息、体检信息、专科检查信息等等它们中的至少一项;这里需要说明的是,在本实施例中,针对多少名患者的多少项个人指标可以按照实际需求进行设定,在此并不加以限定。
例如,对10000名患者的30项个人指标以及是否患有眼科疾病为视网膜炎的历史指标集合转化成数据化值集合;具体的,对于性别的个人指标可以将男性设置为1、女性设置为0;对于个人指标为判断是否状态的时候,可以将是的状态设置为1、将否的状态设置为0;对于个人指标为等级的判断时,可以将低等级设置为1、将中等级设置为2、将高等级设置为3;具体的,表1为患者与个人指标的数据化值集合,如表1所示:
表1
步骤102、根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb。
基于医疗大数据的疾病诊断装置在第a=b=1次时,分别计算每一项个人指标与同一疾病状态的相关度;具体的,依次遍历每一项个人指标,分别计算每一维度(即每一项)的个人指标与同一疾病状态的相关度,得到最高的相关度rb,及最高的相关度rb对应的个人指标nb;所述b为大于等于1的正整数。
例如,在第a=b=1次计算相关度时,首先依次遍历30项中的每一项个人指标,分别计算每一项个人指标与视网膜炎的相关度,得到30个相关度;然后在这30个相关度中取最高的相关度,例如最高的相关度为白细胞指标与视网膜炎的相关度记做r1;最后将r1对应的个人指标为白细胞指标记做n1。
步骤103、当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1。
基于医疗大数据的疾病诊断装置在第a=b+1次时,得到nb与在数字化值集合中除nb外的其他项个人指标的各个两两组合;分别计算各个两两组合与同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;
接着上述例子进行说明,例如,在第a=b+1=1+1=2次计算相关度时,基于 医疗大数据的疾病诊断装置首先会得到白细胞指标n1与在数据化值集合中除白细胞指标n1自身外的其他29项个人指标的各个29个两两组合;其次,分别计算这各个29个两两组合与视网膜炎的相关度,得到29个相关度;然后在这29个相关度中取最高的相关度,例如最高的相关度为白细胞指标+是否眼底出血的组合与视网膜炎的相关度记做r2;最后将r2对应的个人指标组合为白细胞指标+是否眼底出血的组合记做n2。
步骤104、依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合。
基于医疗大数据的疾病诊断装置依次对b进行递归运算,直到a=b+1大于k时为止,得到由每次递归运算得到的最高的相关度所组成的最高的相关度集合。
接着上述例子进行说明,例如,依次对b进行递归运算,在第a=b+1=2+1=3次计算相关度时,基于医疗大数据的疾病诊断装置首先会得到白细胞指标与是否眼底出血的组合n2与在数据化值集合中除白细胞指标与是否眼底出血的组合n2自身外的其他28项个人指标的各个28个三三组合;其次,分别计算这各个28个三三组合与视网膜炎的相关度,得到28个相关度;然后在这28个相关度中取最高的相关度,例如最高的相关度为白细胞指标+是否眼底出血+是否静脉弯曲的组合与视网膜炎的相关度记做r3;最后将r3对应的个人指标组合为白细胞指标+是否眼底出血+是否静脉弯曲的组合记做n3。
依此类推,基于医疗大数据的疾病诊断装置分别得到4项个人指标的组合与视网膜炎的最高的相关度r4以及r4对应的n4;5项个人指标的组合与视网膜炎的最高的相关度r4以及r4对应的n4;直到a大于30时为止,即30项个人指标的组合与视网膜炎的最高的相关度r30以及r30对应的n30为止。
基于医疗大数据的疾病诊断装置将这些r1、r2、r3……r30形成最高的相关度集合。
步骤105、在所述最高的相关度集合中确定最大值的相关度,得到所述最大值的相关度对应的至少一个个人指标。
基于医疗大数据的疾病诊断装置在最高的相关度集合中确定最大值的相关度,得到该最大值的相关度对应的至少一个个人指标,即全局的最优选择;根据至少一个个人指标可以准确的预测和诊断当前患者是否患有该疾病。
接着上述例子进行说明,例如,图2为本发明基于医疗大数据的疾病诊断方法实施例的个人指标与视网膜炎的相关度的曲线图,如图2所示,基于医疗大数据的疾病诊断装置在【r1、r2、r3……r30】集合中确定最高的相关度r11为最大值,就可以得到r11对应的个人指标的组合n11与视网膜炎可以达到最大的相互关联性,也就是用这11项的个人指标可以准确的预测和诊断当前患者是否患有视网膜炎。
本发明实施例提供的基于医疗大数据的疾病诊断方法,通过将历史指标集合转化成数字化值集合;根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb;所述b为大于等于1的正整数;当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合;在所述最高的相关度集合中确定最大值的相关度,得到所述最大值的相关度对应的至少一项个人指标;根据至少一个个人指标可以准确的预测和诊断当前患者是否患有该疾病;该方法能够寻找到最佳的个人指标来诊断疾病,无需医生根据经验来挑选个人指标,剔除冗余个人指标,提高了疾病诊断的准确率;另外,利用该方法可以解释疾病诊断的推理过程和推理依据,帮助医生发现原来不知道的知识和规律。
图3为本发明基于医疗大数据的疾病诊断装置实施例的结构示意图,如图3所示,本发明的基于医疗大数据的疾病诊断装置03包括:转化模块31、计算模块32、确定模块33;其中,
所述转化模块31,用于将历史指标集合转化成数字化值集合;其中,所述 历史指标集合包括m名患者的k项个人指标及同一疾病状态,所述m、k为正整数;
所述计算模块32,用于根据所述数字化值集合计算相关度,其中,当第a=b=1次时,分别计算所述数字化值集合的每一项个人指标与所述同一疾病状态的相关度,得到最高的相关度rb,及rb对应的个人指标nb;所述b为大于等于1的正整数;
所述计算模块32,还用于当第a=b+1次时,得到所述nb与在所述数字化值集合中除所述nb外的其他项个人指标的各个两两组合;分别计算所述各个两两组合与所述同一疾病状态的相关度,得到最高的相关度rb+1,及rb+1对应的个人指标组合nb+1;
所述计算模块32,还用于依次对所述b进行递归运算,直到所述a大于k时为止,得到最高的相关度集合;
所述确定模块33,用于在所述最高的相关度集合中确定最大值的相关度,得到所述最大值的相关度对应的至少一个个人指标。
进一步的,所述疾病为眼科疾病。
进一步的,所述个人指标包括:个人信息、家族遗传信息、体检信息、专科检查信息中的至少一项。
进一步的,所述m为10000,k为30。
本实施例的装置,可以用于执行上述所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在实际应用中,所述转化模块31、计算模块32、确定模块33可由位于装置上的中央处理器(cpu)、微处理器(mpu)、数字信号处理器(dsp)或现场可编程门阵列(fpga)等器件实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储 器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。