本发明属于模式识别领域,特别涉及到提取心电图信号特征并结合特征选择解决多种心律失常识别的任务。
背景技术:
心律失常长期的存在将引起严重的心脏病变。由于心脏疾病的高死亡率,对心律失常的检测变得十分重要。专家通过分析ECG检测心律失常,但是长时间分析心电图记录既耗时又枯燥,而且通过人眼很难精准辨别心电信号微小的形态变化,致使专家在诊断时可能会丢失或弄错重要信息,因此需要一个高效准确的计算机辅助诊断系统辅助医生检测心律失常。心律失常分类方法包括:预处理、特征提取、特征降维和分类四个步骤。
按照特征提取方法的不同可以将分类方法分为3类:1)时域方法;2)基于统计的方法;3)基于变换的方法。
时域方法即ECG信号的形态特征。如提取RR间隔、QRS复合波和T波持续时间、ECG信号采样值。此种方法简单、快捷,但时域特征无法揭示ECG信号细微变化和隐藏的信息。基于统计的方法即通过统计学方法提取ECG信号特征。如通过高阶累积量提取特征来获取ECG信号隐藏的非线性信息。此种方法虽然可以提取到一些隐藏信息,但其计算量大且分类效果提升不佳。基于变换的方法是将采集到的心电信号变换到另一个域。如利用傅里叶变换获得信号的频域特征,然而生物医学信号是非平稳信号,傅里叶变换无法表示时间和频率的相互关系,对非平稳信号分析有局限性,在一定程度上会导致误识别。时频变换能反映出非平稳信号频率随时间的变化,可以提取到时域或频域方法所不能提取到ECG信号的局部特征,如短时傅里叶变换、小波变换、S变换等。
时频方法提取的特征往往维数较高,不仅增加了计算量,而且会给分类性能带来负面影响。降低特征维数的方法分为特征抽取和特征选择两大类,特征抽取法破坏了原有的特征空间,会降低分类效果。特征选择不存在这种缺点,其可分为过滤式(Filter)和包裹式(Wrapper)。Filter式独立于后续分类结果,而Wrapper法使用分类结果评估特征子集,其准确率高于Filter法,因此心律失常分类主要采用Wrapper法,如遗传算法。Filter式特征选择算法比Wrapper法具有速度上的优势,所以也经常被使用,如ReliefF算法。
技术实现要素:
本发明提出一种新的心律失常分类方法:在对心电信号预处理的基础上,进行特征提取将得到的形态特征和时频特征组成原始特征向量,然后利用Filter-Wrapper法对原始特征向量进行特征选择得到最优特征向量,最后将最优特征向量送入识别分类器识别出多种心律失常类型。本发明的技术方案如下:
一种基于特征选择的心律失常分类方法,包括下列步骤:
(1)对ECG信号进行预处理;
(2)根据所检测到的R位置,提取形态特征和时频特征,构造原始特征向量;
(3)计算特征权重,使用ReliefF算法计算原始特征向量中每个特征的权重;
(4)根据特征权重指导种群初始化,根据个体适应度好坏依据选择概率、交叉概率和变异概率分别进行选择、交叉和变异操作得到下一代,如此反复循环,直到满足最大迭代次数终止条件,然后输出适应度最好的个体作为优选特征;
(5)根据(4)中选中的优选特征,利用多分类策略将多个二分类器组成识别分类器实现多种心律失常识别。
本发明在利用Wrapper式算法特征选择效果的基础上,为克服其特征选择速度的缺点融入特征选择速度快的Filter算法,即根据Filter算法计算出来的特征权重大小指导遗传算法种群初始化,加速特征选择的速度。同时用Filter-Wrapper法进行特征选择既降低了特征的维数,又提高了多种心律失常识别的准确率。
附图说明
图1基于特征选择的心律失常分类方法的流程图
图2Filter-Wrapper特征选择算法流程图
具体实施方式
本发明在特征提取结合了形态特征和时频特征各自优点并形成互补。即时域分析虽然不能提取信号隐藏的特征,但形态特征是专家在判断心律失常类型的主要方法,所以时域特征是一种识别心律失常重要且有效的特征。时频特征可以提取到时域或频域方法所不能提取到ECG信号的局部特征,且可以同时表示ECG时间和频率的相互关系,揭示ECG信号隐藏的特征。所以提取形态特征和时频特征两种特征并将其组成原始特征向量。特征选择结合了Filter式和Wrapper式特征选择算法的优点。即Filter式特征选择速度快但效果差,Wrapper式特征选择效果好但速度慢。所以将两者结合组成Filter-Wrapper法,即将遗传算法与特征选择分类器结合组成Wrapper式特征选择方法,并在其中融入Filter算法。即采用Filter算法计算特征权重,并根据特征权重大小来指导遗传算法种群初始化,加速特征选择的速度。
下面参照图1所示,对本发明的基于特征选择的心律失常分类方法,进行说明:
(1)ECG信号数据来自心电图仪采集到的数据或者公开数据库。
(2)预处理:在噪声去除方面,使用中值滤波法去除基线漂移,利用低通滤波器去除电力线干扰和高频噪声。R波检测采用幅度阈值、小波阈值等。
(2)特征提取:根据预处理检测到的R位置,提取形态特征和时频特征。
形态特征:提取4个RR间隔特征:preRR指给定心拍和其前一心拍的RR间隔;postRR指给定心拍和其后一心拍的RR间隔;localAvgRR指给定心拍前后各五个心拍,共十个RR间隔的平均值;avgRR指一个记录文件中所有RR间隔的平均值。使用3个时间窗截取QRS复合波、T波和P波,并通过采样获取时间窗内的ECG信号采样值作为形态特征。
时频特征:取R波位置前后各100个采样点信号,然后对这200个采样点进行S变换,利用数学统计方法获取ECG信号频率范围内的时频特征。
(3)特征选择:采用Filter-Wrapper组合特征选择方法,将遗传算法和特征选择分类器(特征选择分类器采用SVM)结合组成Wrapper法进行特征选择。由于好的初始种群可以为遗传算法提供良好的搜索起点,采用Filter法(此处公认效果好的ReliefF算法作为Filter法)先计算出特征权重并根据其大小指导种群初始化,为搜索提供一个好的起点,加快特征选择的速度。
在使用遗传算法做特征选择时,用一串长度为d(d是原始特征向量维数)的二进制串结构(称为染色体或个体)表示一个特征组合,1表示对应的特征被选中,0表示对应的特征未被选中。以N个个体组成的初始种群为基础,根据个体适应度ri好坏依据选择概率pi、交叉概率pc和变异概率pm分别进行选择、交叉和变异操作得到下一代,如此反复循环,直到满足最大迭代次数终止条件,然后输出适应度最好的个体作为最终的特征。
Filter-Wrapper组合特征选择方法的流程图如图2所示,具体实现过程如下:
步骤1:计算特征权重,使用ReliefF算法计算原始特征向量中每个特征的权重。
步骤2:初始化种群,首先设置种群个体数量N。根据步骤1计算出的特征权重指导种群初始化,即让特征权重大小决定该特征在染色体个体中对应位为1的概率,设权重最大的特征被选中的概率为p1,权重最小的特征被选中的概率为p2,然后按等差数列求出其余特征被选中的概率。
步骤3:计算个体适应度ri,将每个个体使用特征选择分类器每个的分类准确率ri作为第i个个体的适应度。
步骤4:选择操作,利用公式计算第i个个体的被选中的概率。
步骤5:交叉操作,根据交叉概率pc交叉种群中个体产生新个体。
步骤6:变异操作,根据变异概率pm改变个体中某位的值产生新个体。
步骤7:判断是否满足收敛条件(最大迭代次数G设置为100),若满足,经个体解码得到最优特征向量,不满足则重复步骤4~6。
(4)多分类:利用多分类策略(如“一对多”、“一对一”等)将多个二分类器(采用SVM)组成识别分类器实现多种心律失常识别。
下面以具体的实验来验证本发明所提供方法的有效性:
MIT-BIH心律失常数据库包含48条ECG记录,每条记录由两种不同类型导联(记为A、B导联)记录了长约30分钟的数据,采样率为360Hz;其中45条记录的A导联采用MLII导联,其余采用V5导联;40条记录的B导联采用V1导联,其余采用II、V2、V4和V5导联。本实验采用的ECG数据集来自MIT数据库中MLII导联记录的以下8种心拍类型:正常搏动(normal beat,NORM)、左束支传导阻滞(left bundle branch block beat,LBBB)、右束支传导阻滞(right bundle branch block beat,RBBB)、室性早搏(premature ventricular contraction,PVC)、房性早搏(atrial premature beat,APB)、起搏心跳(paced beat,PB)、室性扑动波(ventricular flutterwave,VFW)和室性逸搏(ventricular escape beat,VEB)。
表1给出了使用不同特征降维方法进行特征降维后的分类性能,其中SNGA-KPCA属于特征抽取的降维方法,FM-Relief属于Filter法、RF-MI属于Wrapper法。实验结果如下:
表1:不同特征降维方法下的分类性能
通过表1可以看出,本发明所提出的Filter-Wrapper算法明显的优于其他的降维方法,既特征维数降低明显,又分类准确率提高显著。
表2列出了在相同实验环境下,本发明提出的Filter-Wrapper算法与不采用ReliefF算法随机初始化种群的基本遗传算法在特征选择时间和预测准确率上的表现。可以看出本发明提出的Filter-Wrapper算法有更高的预测准确率和更短的特征选择时间。
表2 Filter-Wrapper算法与基本遗传算法性能对比