本发明属于生物医学信号处理技术领域,涉及心电、呼吸和加速度等信号处理,特别涉及一种基于长短时间记忆模型lstm利用多生理信号的自动睡眠分期方法。
背景技术:
睡眠是人体最为重要的生命活动之一,对睡眠规律和睡眠结构的研究有助于帮助人们提高睡眠质量。从20世纪60年代起,睡眠医学经过几十年的发展已经形成了一套标准体系,现在最为常用的是2007年美国睡眠医学学会(americanacademyofsleepmedicine,aasm)制定的睡眠分期标准:以多导睡眠图(polysomngraphy,psg)为基础,根据《aasm睡眠及其相关事件判读手册》将夜间睡眠活动分为五个不同的时期,即清醒期(w)、睡眠ⅰ期(n1)、睡眠ⅱ期(n2)、睡眠ⅲ期(n3)、快速眼动期(rapideyemovement,rem)。其中,psg需同时记录脑电、眼电、肌电、心电(electrocardiogram,ecg)等多导生理信号,然后再由经验丰富的专业医师每30s一帧进行判读,得出临床分类结果。在非临床应用中,也有不同的划分方法,区分觉醒和睡眠的二分类(w,sleep),区分清醒、非快速眼动(non-rapideyemovement,nrem)和快速眼动的三分类(w,nrem,rem),区分清醒、浅睡(lightsleep,ls)、深睡(slowwavesleep,sws)和快速眼动的四分类(w,n1/n2,n3,rem)。考虑到各个睡眠分期之间的关联和过度关系,四分类方法可能比其他的分类标准更具有实用意义。
但是,以psg技术为基础的睡眠分期方法在实际应用中存在很多问题,一般在严格的睡眠实验室中进行,但过多的信号测量会影响睡眠的舒适度,使得测量结果偏离真实情况,同时昂贵的费用也限制了这种方法的普及。因此,探索一种自动睡眠分期方法具有重大意义。目前,自动睡眠分期方法的研究主要是信号的特征提取和模式识别,依据所使用的生理信号,可以分为三个方面:第一,以脑电为基础的睡眠分期研究。这方面的研究现在已经比较成熟,目前,仅利用单导脑电信号对健康人睡眠分期进行五分类可实现90%以上的准确率;同时结合脑电、肌电、眼电对健康人睡眠分期的五分类可以实现92%的准确率,对睡眠障碍患者可以达到86%的准确率。第二,以心肺耦合相关信号为基础的睡眠分期研究。这一方面主要利用的是ecg和呼吸信号,黄文汉等人利用心电和呼吸信号对睡眠呼吸障碍患者进行三分类最高实现了71.9%的准确率。第三,以睡眠过程中加速度信号为基础的睡眠分期方法研究,这一方面主要是进行清醒和睡眠的分类,与psg系统监测结果的一致性最高可达91%。
然而,上述研究均存在一定的现实问题。基于脑电信号的分期方法虽然准确率高,但是脑电是较为微弱的生理信号,容易受到各种各样的干扰,因而对电极和采集过程要求严格,成本比较高。基于加速度信号的睡眠分期方法目前多数只能够用于区分清醒和睡眠,分类结果粗劣,实际参考意义不大。因而基于心肺耦合方面的睡眠分期方法研究最具实用意义。ecg是比较容易获得的生理信号,且幅值较大,受干扰因素少,具有巨大的实际应用价值。目前有部分仅利用ecg信号进行的睡眠分期研究,从ecg信号中提取心律变异性信号(heartratevariability,hrv),根据hrv信号在不同睡眠阶段的差异从而进行睡眠分期。哈卡莱大学电气电子工程学院的团队比较了四种不同的分类方法对健康人的三分类结果,其中,最高的方法实现了87.11%的准确率,但是目前利用hrv进行睡眠分期的效果不甚理想,因此这方面的睡眠分期方法研究还具有巨大的探索意义。
人类的睡眠会持续一定的时间,该时间段内的生理信号变化是一个时间序列,而基于时间序列的长短时间记忆模型(longshorttimememory,lstm)对这类模式识别问题具有良好的处理能力。lstm模型在传统循环神经网络的基础上增加了遗忘门,使得神经网络有选择性的遗忘之前学习到的参数,从而避免长期依赖问题。yulita等人将lstm用于睡眠分期研究,利用脑电、眼电、肌电三种信号,对睡眠障碍患者进行五分类实现了86%的准确率,radha等人利用lstm模型对健康人进行睡眠分期研究也得到了不错的结果。
综上所述,目前关于自动睡眠分期的研究方法都存在各自的局限性,还没有一种简洁、可靠、高效的方法。基于lstm的神经网络方法对于时间序列数据具有良好的分类能力,但是还没有很好的被用于睡眠分期研究领域中。
技术实现要素:
为了克服上述现有自动睡眠分期技术的缺点,本发明的目的在于提供一种基于lstm利用多生理信号的自动睡眠分期方法,利用信号采集设备采集ecg信号、呼吸信号和加速度信号,然后对其进行特征提取,利用lstm网络进行睡眠分期,分别实现二分类、三分类、四分类、五分类共四个不同的睡眠分期任务,从而满足后续不同场合的应用需求,是一种通用、易于实现、经济的睡眠分期方法。
为了达到上述目的,本发明采用的技术方案为:
一种基于lstm利用多生理信号的自动睡眠分期方法,包括以下步骤:
步骤一:信号采集
利用心电测量仪器,呼吸信号测量仪器以及三轴加速度传感器测量得到被测者的一导ecg信号,一导呼吸信号和三导加速度信号。
步骤二:信号处理
对采集得到的一导ecg信号,一导呼吸信号和三导加速度信号进行信号处理,三导为空间x、y、z三个互相垂直的方向;对一导ecg信号的处理得到最终的hrv信号和呼吸波幅度信号rfm;呼吸信号的处理得到最终的rrv信号;加速度信号的处理得到可用的综合加速度信号acc(n);
步骤三:特征提取
对于原始信号处理后得到的四种信号:hrv、呼吸波幅度信号rfm、rrv、综合加速度信号acc(n),首先进行分段处理,以5分钟为窗长、30秒为步长将一整晚的睡眠数据分成相同长度的若干数据段,然后对每段数据进行特征提取,对每一个特征进行归一化处理,归一化的方法是信号获取对象一整晚的特征减去其特征序列的均值,然后除以特征序列的方差。
步骤四:模型构建
构建的模型采用两层lstm,每一层都有四个不同的分类器,分别用以实现二分类、三分类、四分类和五分类的分期任务。
第一层lstm网络的输入序列是步骤三提取的特征序列,输入的特征数据经过第一层lstm层,里面有四个并行的分类器,每个分类器的网络结构相近,包括5层:输入层、批规范化层、bi-lstm层、遗忘层、全连接层。
经过第一个lstm层之后,每个分类器会输出不同维度的数据,代表着每一类分期的概率,将这些概率结合起来,形成一组新的特征,将这组新的特征,与步骤二提取的特征并联起来,作为第二层bi-lstm网络的输入,第二层lstm中同样并行存在四个分类器,每个分类器的结构与前一层一样,各分类器经过训练之后得到最终用于预测的分类模型。
步骤五:预测睡眠分期
将步骤四中得到的四个分类器用于预测睡眠期,对需要预测的数据进行信号处理和特征提取,然后将提取到的特征按照模型训练时的顺序送入分类器,即可输出睡眠分期的结果。
本发明的优点是:首先,本发明应用的生理信号仅有ecg、呼吸信号、加速度信号,这三种生理信号都是易于获得且操作简洁的,克服了利用脑电信号昂贵、复杂等缺点。其次,本发明使用了lstm模型,可以很好的利用睡眠过程中生理信号作为时间序列前后的相关性,提高睡眠分期的精度。当然,本发明具有很广泛的适用场景,可以方便应用于监护病房、睡眠科室和家庭睡眠监测等领域,还可以方便移植于便携式设备中,促进移动医疗的发展。
附图说明
图1是本方法的整体框图。
图2是lstm模型构建的整体框图。
图3是各分类器的网络结构。
具体实施例
为了更加清楚说明本发明的操作过程,下面结合附图及实施例对本发明做详细描述。
参照图1,一种基于lstm利用多生理信号的自动睡眠分期方法,包括以下步骤:
步骤一:信号采集
使用心电测量仪器采集ecg信号,选取第ⅱ导联的心电信号,采样率为100hz,使用呼吸信号测量仪器测量胸腹呼吸信号作为呼吸信号,采样率为100hz,使用三轴加速度传感器测量患者前额叶的头动信息作为加速度信号,采样率为100hz。
步骤二:信号处理
对采集得到的一导ecg信号,一导呼吸信号和三导加速度信号进行信号的处理,三导为空间x、y、z三个互相垂直的方向,信号处理步骤分三个方面进行:
①对ecg信号的处理
首先,对原始ecg信号进行滤波,分别用截止频率为5hz的低通和截止频率为0.5hz的高通的3阶巴特沃斯滤波器滤出心电信号0.5~5hz的有效成分;
其次,从ecg信号中提取hrv信号,根据最大斜率法识别各个r波的峰值点位置,再通过相邻r波峰值位置之间的差值得到相邻两个波峰之间的时间间隔,但是此时得到的时间间隔序列是不均匀的,再利用三次样条插值法对此序列进行等间隔插值,变为目标采样频率下的时间序列,对序列取倒数即可得到最终的hrv信号;最后根据实际需求,将hrv信号降采样输出;
然后,在hrv的基础上提取呼吸波幅度信号rfm,利用频率调制的方法,将hrv通过一个截止频率为0.15hz的三阶巴特沃斯高通滤波器和一个截止频率为0.5hz的三阶巴特沃斯低通滤波器,即可得到呼吸波幅度信号,记作rfm。
②呼吸信号的处理
对原始呼吸信号进行滤波,分别用一个截止频率为1hz的低通和一个截止频率为0.01hz的高通的3阶巴特沃斯滤波器滤出心电信号的0.01~1hz有效成分,然后从有效的呼吸信号中提取hrv信号,根据最大斜率法识别各个呼吸波峰值点位置,再通过相邻波峰位置之间的差值得到相邻两个波峰之间的时间间隔,再利用三次样条插值法对此序列进行等间隔插值,变为目标采样频率下的时间序列,对序列取倒数即可得到最终的rrv信号,最后根据实际需求,将rrv降采样输出。
③加速度信号的处理
对三轴加速度信号,根据公式(1)求其平方和的算术平方根,得到综合加速度信号;对综合加速度信号进行10点平滑滤波,即可得到可用的加速度信号,记作acc(n)。
其中,m=3,表示三个通道的加速度信号。
步骤三:特征提取
对于原始信号处理后得到的四种信号:hrv、呼吸波幅度信号rfm、rrv、综合加速度信号acc(n),首先进行分段处理,以5分钟为窗长、30秒为步长将一整晚的睡眠数据分成相同长度的若干数据段,然后对每段数据进行特征提取,对每一个特征进行归一化处理,归一化的方法是信号获取对象一整晚的特征减去其特征序列的均值,然后除以特征序列的方差。
对呼吸波幅度信号rfm,可提取的特征包括:整段数据的中值除以序列范围;四分之一分位数和四分之三分位数区间序列的中值除以区间范围;整段数据的均值除以方差;呼吸波波峰-波峰时间间隔序列的中值;呼吸波波峰-波谷时间间隔序列的中值;呼吸波波谷-波峰时间间隔序列的中值;呼吸波波峰-波峰时间间隔序列的中值除以序列范围;呼吸波波谷-波峰时间间隔序列的中值除以序列范围;呼吸波波谷-波峰时间间隔序列的中值除以序列范围。
对于hrv和rrv,可提取的特征包括:整段数据的均值;整段数据的方差;整段数据的均值除以方差;整段数据低频段(0.01hz-0.04hz)的功率谱之和;整段数据中频段(0.04hz-0.15hz)的功率谱之和;整段数据高频段(0.15hz-0.4hz)的功率谱之和;整段数据总功率谱之和;整段数据高频段(0.15hz-0.4hz)的功率谱之和与中频段(0.04hz-0.15hz)的功率谱之和的比值。
对综合加速度信号acc(n),可提取的特征包括:整段数据的均值;整段数据的方差;整段数据的均值除以方差;整段数据的中值除以序列范围;四分之一分位数和四分之三分位数区间序列的中值除以区间范围。
以上共列举了30个特征,在此基础上,仍然以5分钟为窗长、30秒为步长选取数据段,将提取的特征序列进行降序排列,排列后特征数据段的十分之七和十分之三位置出的值分别作为该段的一个特征,最终,得到了总计90个特征参数,由于个体之间存在差异,因此在模型构建之前需要对每一个特征进行归一化处理,归一化的方法是信号获取对象的一整晚的特征减去其特征序列的均值,然后除以特征序列的方差。
步骤四:模型构建
本发明构建的模型采用双层lstm,每一层都有四个不同的分类器,用以实现二分类、三分类、四分类和五分类的分期任务,参照图2。
第一层lstm网络的输入序列是步骤二提取的90个特征序列。输入的特征数据经过第一层lstm层,里面有四个并行的分类器,每个分类器的网络结构相近,参照图3,包括5个网络层:输入层、批规范化层、bi-lstm层、遗忘层、全连接层。
经过第一个lstm层之后,每个分类器会输出不同维度的数据,代表着每一类分期的概率,将这些概率结合起来,形成14列新的特征。将这14列新的特征,与步骤二提取的特征并联起来,作为第二层lstm网络的输入,第二层lstm中同样并行存在四个分类器,每个分类器的结构与前一层一样,各分类器经过大量样本训练之后得到最终用于预测的分类模型。
步骤五:预测睡眠分期
将步骤四中得到的四个分类器用于预测睡眠分期,使用相应的仪器测量其余被测者的ecg信号,呼吸信号和加速度信号,对数据进行信号处理和特征提取,然后将提取到的特征按照模型训练时的顺序送入分类器,即可输出睡眠分期的结果。