一种基于用户健康数据的健康状态跟踪及预警方法和系统与流程

文档序号:21840224发布日期:2020-08-14 16:27阅读:386来源:国知局
一种基于用户健康数据的健康状态跟踪及预警方法和系统与流程
本发明属于数据挖掘
技术领域
,特别涉及一种基于用户健康数据的健康状态跟踪及预警方法和系统。
背景技术
:随着各类新型传感器设备制造技术的发展以及各种智能终端的不断普及,更多的用户选择使用诸如智能手表、运动手环等可穿戴设备来实现对个人健康状态的监控以及运动数据的记录与处理。但这些设备受制于搭载硬件的计算性能以及软件的复杂度,大多数只能实现对用户健康数据的简单记录与显示,而无法实现对数据的进一步处理与分析。因此,这就造成数据资源的浪费,且无法给用户对个人健康状态的评估提供有价值的参照虽然诸如此类的可穿戴设备无法直接进行较可靠的健康监控,但可以较为全面的记录用户的各种健康数据。通过这些数据我们可以利用技术手段提取出用户的一些健康指标特征,从而尝试对用户健康状态进行跟踪并对异常状态进行识别。技术实现要素:为了克服上述现有技术的缺点,本发明的目的在于提供一种基于用户健康数据的健康状态跟踪及预警方法和系统,从可穿戴设备获取用户健康数据,然后通过统计大量用户健康数据提取用户的心率类、血氧类、体温类、呼吸类等健康指标特征;使用决策树算法建立针对每位用户的健康状态跟踪分类器;通过使用分类器对用户实时健康指标特征进行分类从而获取用户的一系列健康状态标记,并根据健康状态标记计算用户每日健康指数;此外,获取用户历史体检数据并通过人工神经网络方法提取数据特征,使用历史特征训练基于决策树算法的用户健康判别分类器,并根据用户每日健康指数决定是否向用户发送体检提醒。若用户进行体检则提取实时体检数据的特征并输入健康判别分类器进行判别,并根据判别结果决定是否发出疾病预警。本发明不仅考虑了用户的历史健康数据,同时也考虑了用户的当前数据,具有获取成本低、信息内容丰富、覆盖用户广、针对用户的健康模型更精准等优点,使得本申请与传统的方法和系统相比,具有明显优势。为了实现上述目的,本发明采用的技术方案是:一种基于用户健康数据的健康状态跟踪方法,包括如下步骤:步骤1,以可穿戴设备记录的传感器数据为数据源,获取所需的用户健康数据。步骤2,从一段时间内的用户历史健康数据中提取历史健康指标特征,将提取到的全部特征作为历史特征集用于下一步的模型训练。其中,历史健康数据是指用户在健康状态下的一段稳定使用期内的可穿戴设备健康数据,从四类传感器数据中采样获取,包括:心率数据、体温数据、血氧数据以及呼吸频率数据,历史健康指标特征是指从历史健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,一般共计24个。步骤2具体包括:步骤2.1,依据健康数据中的心率数据提取心率类特征:计算每个时间窗内用户心率数据的极大值、极小值、均值、方差、离散度以及一般心率水平,时间窗是指计算一组健康指标特征所用的健康数据的时间范围,一般可设为10分钟,可穿戴设备的数据测量频率均为4次/分钟,则所述离散度的具体计算方法是:首先将用户心率值设置为50—150次/分钟,并划分为[50,60),[60,70),…,[130,140),[140,150]共10个子区间,然后使用所述一个时间窗内的所有心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率,之后根据信息熵计算公式计算心率数据的离散度:h即为心率数据的离散度,表征了心率数据在一般范围内的离散程度,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;步骤2.2,依据健康数据中的体温数据提取体温类特征:计算每个时间窗内用户体温数据的极大值、极小值、均值、方差、离散度以及一般体温水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;步骤2.3,依据健康数据中的心率血氧数据提取血氧类特征:计算每个时间窗内用户血氧数据的极大值、极小值、均值、方差、离散度以及一般血氧水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;步骤2.4,依据健康数据中的呼吸频率数据提取呼吸类特征:计算每个时间窗内用户呼吸数据的极大值、极小值、均值、方差、离散度以及一般呼吸水平,其中离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。步骤3,使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2;步骤3.2,对全部特征值x使用公式进行换算,x*即为标准化后的特征值。步骤4,基于决策树算法,使用步骤3中标准化后的历史健康指标特征训练针对用户本人的健康状态分类器,得到用以预测用户健康状态的分类器模型;具体包括:步骤4.1,将步骤3中得到的标准化后的历史健康指标特征标记为正样本;步骤4.2,使用全部正样本并基于决策树(cart分类树)训练针对每位用户本人的健康状态分类器。步骤5,从可穿戴设备获取用户实时健康数据并提取实时健康指标特征,使用步骤3中的预处理方法对实时健康指标特征进行标准化,然后基于步骤4训练得到的健康状态分类器,输入标准化后的实时健康指标特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数。具体包括:步骤5.1,使用获取到的实时健康数据提取实时健康指标特征;其中,实时健康数据是指用户实时的可穿戴设备健康数据,同样从上述四类传感器数据中采样获取,实时健康指标特征是指从实时健康数据提取的心率类特征、体温类特征、血氧类特征以及呼吸类特征,其提取方法同步骤2的历史健康指标特征提取方法一致;步骤5.2,对实时健康指标特征进行标准化处理,且标准化参数均值μ与方差σ2使用与所述历史健康指标特征的标准化参数相同的值;步骤5.3,将标准化后的实时健康指标特征输入用户健康状态分类器,获得用户健康状态预测标记,健康标记为1,非健康标记为-1;步骤5.4,待获得用户单日内全部健康状态预测标记后,计算全部标记总和的值作为用户的每日健康指数,该值取值范围为[-144,144],当该值小于50时,认为用户健康存在较大风险,需要做出体检提醒。在此基础上,还可进一步获取一种健康状态的预警方法,即在上述步骤1-5之后,继续执行:步骤6,根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于aae算法从用户历史/实时体检数据中提取历史/实时数据特征,然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。具体包括:步骤6.1,获取用户历史体检数据;体检数据是指用户通过正规医疗机构进行体检后获取的一系列身体化验指标数值,包括但不限于:身高、体重、肺活量、血压、血糖、血蛋白类、尿蛋白类、红细胞水平以及白细胞水平;步骤6.2,获取用户被提醒后进行体检所得的实时体检数据;步骤6.3,基于aae(adversarialautoencoder,对抗自编码器)将高维体检数据提取为低维度体检特征;步骤6.4,基于cart分类树,使用历史体检数据特征训练用户健康判别分类器,然后输入实时体检数据特征进行判别,若判别结果为-1,则向用户发出疾病预警。本发明中,用户历史健康数据是指来自用户在健康状态下的一段稳定使用期内(即步骤2所述的一段时间内)的可穿戴设备健康数据,该段时间的用户历史健康数据的获取时间范围由人工设定,一般使用一个月内的全部用户健康数据;所述步骤6中所述获取的用户历史体检数据由用户本人所拥有的数量决定,一般不少于30次记录;所述高维体检数据为包含50项以上指标的体检数据,所述低维度体检特征为高维体检数据经过特征提取算法后获取的维度降低的特征向量,该维度由人为设定,本方法中设置为6维。进一步,本发明中可穿戴设备记录的健康数据是指,例如运动手环上通过搭载的光电传感器得到的使用者的心率、体温等信息的采样数据。进一步,本发明中所提到决策树算法是指cart分类树(classificationandregressiontree),是一种有监督机器学习算法。其核心思想就是通过建立一种树形结构并使用已有数据对其参数进行迭代,其中每个内部节点表示一个特征属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。进一步,本发明中所提到的aae算法是指对抗自编码器算法(adversarialautoencoder),是一种深度学习算法。它通过组合一个对抗网络与自编码器的人工神经网络系统从而实现对原输入数据的还原,而在这过程中原数据会先通过编码器生成一种维度远低于原数据的原数据在低维流形上的映射(通常也是一组向量),这种低维数据就是所谓原数据的“编码”,其可以通过神经网络的后续部分再次“生成”与原数据同维的数据。通过对抗网络的对抗训练,生成的数据会逐渐接近乃至基本还原至原数据,那么此时,低维的“编码”数据也就可以认为是保留了原数据特性的一种低维特征。本发明还提供了一种基于用户健康数据的健康状态跟踪系统,包括:数据获取模块,从可穿戴设备获取用户健康数据,从用户本人获取用户体检数据;特征提取模块,从用户健康数据提取用户健康指标相关的心率类特征、体温类特征、血氧类特征、呼吸类特征;从用户体检数据中基于对抗自编码器方法获取由神经网络自动学习输出的低维度体检特征;健康状态跟踪模块,基于特征提取模块得到的用户健康指标特征,基于决策树算法使用历史健康指标特征训练针对用户本人的健康状态分类器,然后根据输入的实时健康指标特征获得用户的健康状态标记,根据标记对用户健康状态进行跟踪记录,并使用单日内用户健康标记计算用户每日健康指数。相应地,本发明亦可提供一种健康状态预警系统,即在上述健康状态跟踪系统的基础上,还包括:健康模型建立模块,根据从用户历史体检数据提取出的体检特征训练用户健康判别分类器;预警模块,根据用户每日健康指数决定是否向用户发出体检提醒,提醒并获取实时体检数据后,提取出实时体检特征,输入用户健康判别分类器,根据判别结果做出是否向用户发出疾病预警的决策。与现有技术相比,本发明的有益效果是:1.在用户健康状态跟踪和判别模型建立过程中,只需要可穿戴设备上自动记录的数据以及用户提供的体检数据,不需要其他专门产生的数据。且用户在健康状态下产生的数据已经得到医院的判别,不需要再进行人工标记,从而该方法具有很低的人力和财力的花销。2.使用的单类分类器的本身结构决定该算法简单容易实现,同时具有低的时间复杂度,降低了计算开销。3.实现了对用户健康状态的直观性识别,通过分类器分类结果可以对用户的健康指数以及是否健康进行简单明了的判断,大大降低了决策环节的实现难度。附图说明图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。具体实施方式本发明中的方法将分为离线建模和在线分析两部分说明,具体包括数据获取过程、特征提取过程、健康模型建立过程、在线健康状态跟踪与预警过程。图1是本发明的基于用户健康数据的健康状态跟踪及预警方法框图。本发明中的系统以框图形式予以说明。图2是本发明的基于用户健康数据的健康状态跟踪及预警系统框架图。数据获取具体过程如下:(1)通过无线通讯协议,以固定格式固定频率从可穿戴设备下载所需的用户健康数据;或者将可穿戴设备的数据通过其它方式导入,其中可穿戴设备的数据测量频率本实施例中设置为4次/分钟。获取的可穿戴设备用户健康数据实例如表1。(2)通过设备端手动输入或表格批量载入,根据需要添加用户体检数据。或者,在获取用户以及体检机构授权的情况下,从体检机构的系统中直接导入体检数据。获取的用户体检数据实例(血常规部分数据)如表2。表1可穿戴设备用户健康数据实例。表2用户体检数据实例(血常规部分数据)特征提取过程通过批量数据处理和文本挖掘等技术,对用户健康数据进行特征提取。具体特征提取过程如下:(1)依据健康数据中的心率数据提取心率类特征:计算10分钟内用户心率数据的极大值、极小值、均值、方差、离散度、一般心率水平。离散度的具体计算方法是:首先将用户心率值按一般范围设置为50—150次/分钟的区间,并将该区间划分为[50,60),[60,70),…,[130,140),[140,150]这10个子区间。然后使用用户10分钟内的40组心率数据落在第i个区间的频率pi来代替各个心率值区间出现的概率。之后根据信息熵计算公式:h即为心率数据的离散度,表征了心率数据在一般范围内的离散程度。此外,将出现频率最高的心率值区间的中位值设为一般心率水平,该值代表了用户在这段时间内心率的一个普遍水平;(2)依据健康数据中的体温数据提取体温类特征:计算10分钟内用户体温数据的极大值、极小值、均值、方差、离散度、一般体温水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于体温区间设置为在35℃—40℃范围内平均划分的10个子区间;(3)依据健康数据中的心率血氧数据提取血氧类特征:计算10分钟内用户血氧数据的极大值、极小值、均值、方差、离散度、一般血氧水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于血氧区间设置为在80%—100%范围内平均划分的10个子区间;(4)依据健康数据中的呼吸频率数据提取呼吸类特征:计算10分钟内用户呼吸数据的极大值、极小值、均值、方差、离散度、一般呼吸水平。离散度和一般体温水平的计算方法同心率类特征,所不同在于呼吸频率区间设置为在10—30范围内平均划分的10个子区间。特征标准化预处理过程使用特征标准化预处理方法对步骤2中提取到的历史健康指标特征进行标准化处理,得到标准化后的历史健康指标特征;具体包括:步骤3.1,针对每一个特征维度,计算全部特征值的均值μ与方差σ2;步骤3.2,对全部特征值x使用公式进行换算,x*即为标准化后的特征值。健康模型建立过程具体建立过程如下:(1)将表3所示标准化后的用户历史健康指标特征向量标记为正样本;(2)使用全部正样本并基于决策树(cart分类树)训练针对每位用户本人的健康状态分类器。表3标准化后的用户历史健康指标特征心率极大值心率极小值心率均值心率方差心率离散度心率一般水平-0.22834-0.28261-0.29367-0.195532.041101-0.17780.7808350.3216170.657325-0.195530.121386-0.460990.0422750.3057990.1903110.1107970.7932861.190996-0.47865-0.29526-0.48626-0.19553-0.006590.483-0.46408-0.26046-0.46431-0.19553-0.45453-0.460990.158378-0.29526-0.00627-0.195531.2732150.6717991.4536190.1444631.108373-0.195534.9206730.9549980.6262620.8209920.8060111.3476061.54746-0.46099-0.48659-0.09912-0.43038-0.195531.657158-0.46099-0.36939-0.29526-0.40393-0.195530.3133580.954998-0.20825-0.29526-0.24876-0.004081.273215-0.460990.5300870.1212640.5046480.547318-0.32655-0.46099-0.11179-0.16556-0.16893-0.19553-0.6465-0.46099-0.014170.7396460.2142610.88811-0.6465-0.46099在线健康状态跟踪与预警过程(1)从可穿戴设备获取用户实时健康数据,提取健康指标特征并对实时特征进行标准化,然后基于模型建立过程得到的健康状态分类器,输入实时特征计算用户健康状态预测标记,再基于单日内的全部健康状态标记计算用户每日健康指数(2)根据用户每日健康指数决定是否提醒用户体检;用户依据提醒进行体检后,基于aae算法从用户历史/实时体检数据中提取历史/实时数据特征向量(如表4所示),然后基于历史体检数据特征训练用户健康判别分类器,最后根据分类器对实时体检数据特征的判别结果决定是否向用户发出疾病预警。表4从用户历史/实时体检数据中提取的数据特征向量aee特征1aee特征2aee特征3aee特征4aee特征5aee特征60.217085-0.40907-0.67304-0.224041.037399-0.140711.0707730.478028-0.56157-0.15807-0.31802-0.14071-0.010561.2397520.4472430.179638-0.76831-0.14071-0.57969-0.83405-0.73683-0.22404-1.26834-0.14071-0.508550.873185-0.09213-0.224041.010061-0.140710.046348-0.727620.7806350.0615751.290788-0.140714.656261-0.59184-0.20181-0.1757-0.2985-0.140713.3025560.133369-0.60551-0.22404-0.101056.2466640.0036631.2627981.117777-0.22404-1.07348-0.140710.1317160.7026190.3096360.9577461.179158-0.140710.3451380.7398251.871177-0.22404-0.46903-0.140710.0250050.680359-0.32378-0.154940.783951-0.14071表5是某用户的健康状态跟踪和预警在计算机上在线运行的可视化结果,健康状态被标记为“abnormal”的日期表明当日健康指数不正常;健康判别标记为“negative”则表面最终的体检数据判别为具有潜在疾病风险,需发出预警。表5用户单日内健康状态跟踪的判断结果上述的跟踪与预警过程,可仅限于跟踪获取健康指数,也可进一步向用户发出疾病预警。综上,本发明所公开的基于用户健康数据的健康状态跟踪及预警方法和系统,实现简便、系统适应性强,功能完备,可以直接转化为轻量级程序搭载在智能手机或个人计算机上,有效减少用户的计算资源开销,仅需要接收通过网络传输的可穿戴设备数据或手动导入的体检数据,具有实际应用的优势,提供了针对用户个人健康状况的建模化跟踪分析方法,同时对用户是否存在威胁生命健康的疾病风险进行了决策性判断。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1