一种面向多源信息融合的智慧健康关联分析方法

文档序号:25286142发布日期:2021-06-01 17:35阅读:154来源:国知局
一种面向多源信息融合的智慧健康关联分析方法

本发明属于人工智能领域,具体涉及一种面向多源信息融合的智慧健康关联分析方法。



背景技术:

医疗传感网的普及和应用在为提升诊断精准性提供海量数据支持的同时,也带来了严峻的挑战。传感网收集数据的量太大,速度太快,从传感网收集的数据无法全部经过医生的检查,只能将多源信息融合起来有选择地传递给医生查看。然而,固定的信息融合和选择难免会让医生遗漏掉某些非常规但又有可能很重要的信息,这有可能会导致医生无法作出正确的判断;而动态的信息融合和选择又面临着如何选择才能达到最佳效果的难题,最佳效果往往又要根据实际情况综合考虑多方面因素的,所以解决这个问题就变得更加困难了。更重要的是,医疗传感网的信息融合需要满足医学探索的应用需求,特别是要在海量的医疗传感数据中发现疾病的更多潜在或诱发因素来辅助诊断。这种探索只靠医生查看和查找数据来做基本上是不可能的,毕竟医生作为个体在数据处理和分析能力上都很有限,难以胜任此类大数据任务。然而,医学探索不可能完全脱离医生来做,疾病潜在或诱发因素的发现必须通过人机合作来联系医学领域的专业知识。此外在特征层面的信息融合应选择哪些特征,以及如何优化这些特征的数据转化过程,都要考虑到其在医学探索应用中是否适合人机合作以及是否可以满足探索精准度的问题。概括来说,医疗传感网的数据融合和应用都要考虑到与医生的联系,但这种联系的最优化实现是非常困难的。

由于医疗传感网的成本问题,本发明研究混合架构下的信息融合与应用。具体来说,在医学研究和治疗中心,医疗传感网使用高成本高精准度的数据级别信息融合;在重点医学观察社区,医疗传感网使用中精准度的特征级别信息融合;在其它社区,医疗传感网使用低成本低精准度的决策级别信息融合。本发明在这样的混合架构下研究如何优化信息融合,使与医生保持的联系尽可能完善,并且在辅助诊断、疾病预测等医学探索应用中能通过与医生人机合作充分地发挥医疗传感网的作用。



技术实现要素:

本发明针对如何在医疗传感网中使用基于模糊关联规则的算法进行信息融合与智慧健康的研究问题,提出了面向多源信息融合的智慧健康关联分析方法,对健康相关因素进行监督与辅助预警,从而实现具有智慧学习能力的健康关联分析、健康风险预警与个性健康推荐,进而及时发现健康风险状态与健康风险致因。

一种面向多源信息融合的智慧健康关联分析方法,首先对获得的医疗多源异构数据进行模糊关联规则挖掘,然后进行适合于数据分布动态化的智能平衡参数优化,再分析兼容流式存储架构,最后提出针对上述智能平衡参数优化的动态增量式的建模方法,最终实现健康风险预警;

所述分析方法具体包括如下步骤:

步骤1:分析医疗传感器组成的传感网络得到的多源异构数据,根据不同应用,赋予多源数据不同的隶属度值[0,1],生成对应模糊集合。例如,如果需要预测某种疾病的致因。这时,所有多源数据,根据与这种疾病的相关性进行隶属度赋值。如果,某条数据与这种疾病极为相关,则隶属度赋值越接近1;反之,如果某条数据与这种疾病没有任何关系,则隶属度赋值为0;

步骤2:通过适用于不同应用的多目标函数优化来生成高质量的模糊关联规则,得到满足应用需求的模糊集合;例如,如果需要对某种疾病的致因进行分类。这时优化过程中的多个目标函数可以直接采用分类结果的准确率与判断错误的代价作为优化目标函数;

步骤3:分析数据分布状态,以标准正态分布为基础,进行数据分布动态化的智能平衡模糊集合隶属度参数优化;

步骤4:针对流式数据特点,将预定义数量的数据,定义为一批次数据;每当新出现的流式数据达到预定义的数量,则对数据新出现的一批次进行局部频繁项集挖掘并存储当前批次的频繁项集与其支持度值等信息,这些数据将用于协助处理步骤5-6,因此,原数据流数据可以在此处删除;

步骤5:根据与当前批次数据的数据分布的欧式距离,结合数据正态分布的欧式距离,进行动态的数据批次的数据变化量赋值;

步骤6:根据数据变化量与当前数据的乘积作为历史频繁项集支持度的权重,再结合当前批次频繁项集及其支持度,找出频繁项集支持度高于用户自定义最小支持度,从而进行增量式全局频繁项集挖掘;

步骤7:此时进行判断,如果新的流式数据没有增加到一个自定义的量,则直接进行步骤8,否则重复步骤4-7;步骤4-7为一个迭代过程,即增量式建模的主要过程;每次进行迭代都进行局部频繁项集挖掘,通过这些局部频繁项集,再加上新批次数据与历史数据的数据变化量,进行全局数据分频项集挖掘,由于这个过程中,无需使用全局数据本身,只需要历史频繁项集信息与当前批次数据,故这个过程称为增量式频繁项集挖掘;

步骤8:根据挖掘出的频繁项集,筛选出关联规则;

步骤9:对筛选出的关联规则中与健康状态相关的规则,进行整理;

步骤10:根据挖掘与筛选出的健康相关关联规则,进行健康状态预测与风险分析。

进一步地,本关联分析方法中,利用正态分布描述数据特征之间的变化关系,根据数据分布的变化程度来判断是进行模型更新还是模型重建,即实现动态增量式建模。

进一步地,根据用户自定义数据分布参数变化度量,超过自定义变化度量即重新构建模型,否则只进行模型更。

进一步地,所述按照增量式建模过程,即在旧的关联规则挖掘模型的基础上,根据数据分布变化量对模型进行微调,具体如下:根据新的数据分布计算新旧数据分布变化量:根据正态分布包含的两个参数:均数μ与标准差σ;按照当前数据集合求出其均值做为新的均数其中xi为当前第i个数据的数据值,n为当前数据总个数;同时,求出当前数据集合的标准差作为新的数据分布的标准差得到新的数据集合分布根据新的数据分布,再设旧的数据分布为得数据分布的变化量根据数据分布变化量对新增数据进行加权:将数据变化量v作为为新增数据的加权,这时默认旧数据无需加权。

本发明提出一种面向多源信息融合的智慧健康关联分析方法,其有益效果是:

本发明提出一种面向多源信息融合的智慧健康关联分析方法,利用关联规则方法推断可能的疾病相关指标。旨在通过疾病相关指标监控,检测出可能的潜在高风险状态,并给予警示。该方法主要具有以下优点:

(1)高效性:通过批量数据处理方法,可以在保证一定准确率的前提下进行增量式关联规则挖掘。该批量处理方法可与快速并行处理相结合,能够高效的挖掘出一些与疾病相关的指标。

(2)实时性:用来训练模型的数据可实时更新,根据批量处理方法,每次更新的数据均可实时的关联规则模型更新,从而挖掘出更准确更有效的规则,从而进行健康风险预警。

(3)可行性:提出的动态模型构建方法,更新数据或者优化模型所需要的参数均有当前数据的数据分布状态也自动产生,无需研究人员和用户的参与,具有良好的可行性。

附图说明

图1是本发明实施例中所述面向多源信息融合的智慧健康关联分析方法的工作流程图。

具体实施方式

下面结合说明书附图对本发明的技术方案做进一步的详细说明。

一种面向多源信息融合的智慧健康关联分析方法基于以下两点:首先,数据具有多源动态流式的特征;其次,构建模型中间过程需要考虑新增数据,同时避免为参与,只通过新增数据与已存统计信息进行建模分析。利用增量式建模可以保存大部分前期数据频繁度信息的特性,可以同时从多个方面对信息进行分析并存储,根据用户需求准确率范围调整需要保存的比较频繁的数据及其信息,极大的提高了分析与存储的效率。

本发明利用数据分析方法来解决关联规则算法上的局限性,并提升疾病诊断及预测的准确性,这个问题已经成为医疗传感网信息融合与应用研究领域的一个重要课题并受到广泛关注。因此,探索适用于疾病辅助诊断与预测的信息融合与应用算法对于提高计算机医学诊断上关联分析的数据类型相对有限、规则质量优化能力不足、数据处理过程的频繁度量信息较多且算法耗时较长等问题,以及如何预防重特大疾病的发生具有重要价值。

本发明利用正态分布拟合流式数据,结合正态分布的参数变化,处理传感网多源数据,通过数据分布量化数据内部特征,解决了在不同的数据来源、不同时刻均显现不同数据的内部特性的问题,实现模型动态调整。

动态增量式建模方法能够快速有效的根据用户定义准确率给出需要保存的频繁度下界。从而实现均衡准确性与效率的目的。

综上,可以利用正态分布与动态增量式方法进行建模分析。

本发明主要利用正态分布近似地描述数据特征关系变化,并通过动态增量式的建模方法对流式数据进行建模分析。动态增量式的建模方法的动态性能够使得当数据分布状态变化时,可以依据不同的数据分布对不同来源、不同时刻的数据进行模型更新或者重新建模。

要想利用数据分布描述数据内部特征,就必须从多源数据中获取数据特征信息,并对多源数据分别进行处理:

为了描述数据内部特征,特别是其变化情况,本发明利用正态分布描述数据特征之间的变化关系。正态分布包含两个参数:均数μ与标准差σ,其分布函数可表示为该分布函数随参数μ与σ的不同而呈现数据的不同特征关系变化。而均数μ与标准差σ可根据数据的平均值与标准差简单算得。

动态增量式的建模方法的主要思路是根据数据分布的变化程度来判断是进行模型更新还是模型重建。根据用户自定义数据分布参数变化度量,超过自定义变化度量即重新构建模型,否则只进行模型更新,从而大大减少模型重构次数,提高建模效率。

基于动态增量式建模的面向多源信息融合的智慧健康关联分析方法,是在处理多源信息的同时进行动态增量式建模的。该方法通过对多源数据信息分别处理,并根据其数据分布,构建初步关联规则挖掘模型。随着时间的推移,新的数据的增加,数据分布产生了变化。让这种数据增加量导致数据分布变化到达一定程度时,即可进行模型重构。模型重构过程中,根据新数据计算新的数据分布,然后把当前数据分布与旧的数据分布进行对比,当数据分布变化在用户定义范围内时,则按照增量式建模方法,在旧的关联规则挖掘模型的基础上,根据数据分布变化量对模型进行微调,这里的微调主要针对数据划分间隔变化。当数据分布变化超出用户定义范围时,这说明旧模型完全不适合当前数据,则直接进行模型重构。

下面说明按照增量式建模过程,即如何在旧的关联规则挖掘模型的基础上,根据数据分布变化量对模型进行微调,具体如下。

根据新的数据分布计算新旧数据分布变化量:根据正态分布包含的两个参数:均数μ与标准差σ。按照当前数据集合求出其均值做为新的均数其中xi为当前第i个数据的数据值,n为当前数据总个数。同时,求出当前数据集合的标准差作为新的数据分布的标准差这时,就可以得到新的数据集合分布根据新的数据分布,再设旧的数据分布为易得数据分布的变化量

根据数据分布变化量对新增数据进行加权:将数据变化量v作为为新增数据的加权,这时默认旧数据无需加权。

根据加权后的数据与已有数据整合后挖掘频繁项集:整合加权后的数据,按照频繁项集挖掘的方法挖掘频繁项集,找出经常一起出现的数据特征项,比如“肥胖、饮食过量、糖尿病”。

根据频繁项集找出影响健康的关联规则,同时根据这些规则进行健康预警:根据挖掘出的经常一起出现的数据特征项“肥胖、饮食过量、糖尿病”,结合关联规则挖掘算法,找出健康相关关联规则,如“肥胖、饮食过量→糖尿病”,这一规则表示如果当前人群具有“肥胖、饮食过量”的特征,那么这些人群就是“糖尿病”高危人群,需要特别注意。除了健康风险预警外,此时还需给出健康意见,即去除“肥胖、饮食过量”这些特征的方法。这些方法一般存储在基本知识库中,比如建议“减少饮食、增强锻炼”等等。

本发明的分析方法流程如下:

1.构建初步关联规则挖掘模型。对多源数据进行分别处理,分别计算其数据分布,进而构建初步关联规则挖掘模型。

2.计算数据分布变化量。数据分布变化量随着时间的推移,新的数据的增加,会产生越来越多的变化。当这种变化量过大导致数据分布变化到达一定程度时,即可进行模型重构。在判断是否变化量大而需要重构模型之前,则需要根据新数据计算新的数据分布,然后把新的数据分布与旧的数据分布进行对比。

3.更新/重构规则挖掘模型。首先,当数据分布变化在用户定义范围内时,则按照增量式动态建模方法,在旧的关联规则挖掘模型的基础上,根据数据分布变化量对模型进行微调,这里的微调主要针对数据划分间隔变化。而当数据分布变化量超出用户定义范围时,这说明旧模型完全不适合当前数据,则直接进行模型重构。

其中进行模型重构的具体的实施步骤如下:

步骤a:不间断的获多源信息流式传感数据,并同步进行数据初始化与信息融合。

步骤b:根据当前新数据重新计算数据分布。

步骤c:求出新旧数据分布变化量。

步骤d:当数据分布变化量超出预定义范围,则对当前数据针对数据分布变化量进行数据统计值比重调整,更新规则挖掘模型。否则,直接重构数据规则模型。

步骤e:挖掘出当前频繁项集。

步骤f:根据旧频繁项集与当前模糊频繁项集,找出全局频繁项集。

步骤g:找到截至到当前数据为止的流式数据的全局关联规则。

本发明提出的一种面向多源信息融合的智慧健康关联分析方法,首先研究多源异构数据的模糊关联规则挖掘方法,然后研究适合于数据分布动态化的智能平衡参数优化算法,再后分析兼容流式存储架构,最后提出动态增量式的算法,来实现健康风险预警。具体的:

(1)针对医疗传感数据类型多样化的特点和数据需要关联到病情的需求,研究支持多源异构数据的模糊关联关系挖掘方法,使之能以病理致因探索度归纳总结健康规则。以模糊集隶属度函数做为关联关系挖掘的优化参数,通过多目标优化来生成高质量的模糊关联规则,从而解决智慧医疗中的多源数据关联问题。

(2)针对传感器多源数据分布多样且动态变化的问题,研究适合于数据分布动态化的智能平衡参数优化算法,更精准地解决智慧健康中的智能优化问题。

(3)针对传感网数据的量大和流式存储特点为前述智能优化方法研究增量式算法,使之不需重复扫描数据即可实现数据关联,从而更好地兼容流式存储架构,以便进行健康辅助管理。

(4)针对传感器数据分布随环境、社会习惯等因素变化的特点,研究在信息融合中能自适应地跟随这些分布变化而演化的算法,使之适用于不同时期的医学信息融合,有利于健康风险预警与辅助健康决策。

以上所述仅为本发明的较佳实施方式,本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1