本发明涉及ecg信号分类领域,具体涉及一种基于超轻量级卷积神经网络的ecg信号分类方法。
背景技术:
心电图(ecg)记录通过心脏的电信号,临床上常用它进一步诊断与心律失常有关的疾病。传统的心律不齐检测方法使用医院笨重的心电仪采集病人的短时ecg信号,并由心脏内科医生通过视觉诊断。然而,由于心律失常是间歇性发生的,尤其是在问题的早期阶段,因此很难从短时间窗口的ecg信号中发现心律失常以至于错过心脏病患者的最佳治疗时机。所以带有实时心律不齐检测能力的长期ecg监测对于早期发现潜在问题十分有必要。
长期且实用的ecg监测设备要求设备具有经济性和便携性的特点,近年来,可穿戴式ecg监测设备作为一种经济有效的解决方案被提出和研究。具有自动检测功能的可穿戴式ecg监测设备可以为用户提供实时的心脏健康建议,同时记录反应异常ecg信号。实时的心律不齐检测对于潜在心脏病患者是很有意义,它能从ecg信号中发现真正发病前的征兆,意味着病人将拥有更多的时间去咨询医生或接受治疗。然而,作为一种边缘设备,它的各种资源都极其有限,而且对于长期实时监测任务而言,使用云来提供核心服务的做法在实际应用中的效果往往不尽人意,所以需要通过边缘计算来满足实际应用需求。因此,可穿戴式ecg监测设备往往具有这样一些基本特性:低成本、高能效和实时性,这些就要求它搭载的核心检测算法具有足够的轻量级和准确率。
最主流的检测心律不齐的方式主要有两种。一种是基于特征的分类方法,特点是先通过数据预处理进行特征提取,随后将提取出的特征送去分类器进行分类。这类方法可以分为相互独立的特征提取器和分类器两个部分。然而,这种结构导致的问题在于方法的整体性能大部分取决于特征提取器提取出的特征的优劣和数量,进而导致这种方法过分依赖于特征工程,这就获得导致良好的算法性能需要大量的人力,而且受限于人类知识和经验的水平。此外,如果通过增加提取的特征的数量来提高检测算法的准确率,带来的不良影响是算法的运算复杂度和实现功耗的显著提高,这不利于设备高能效目的的实现。另外一种就是直接将原始信号送入神经网络进行分类的方法,它因为其结构特点而被称之为端到端的分类方法。以神经网络作为分类器的好处在于只需要给它提供训练样本,它就可以自动学习去提取特征并综合特征图给出分类结果。由于提取特征是根据训练算法自动进行,这种方法可以避免人类知识和经验水平的限制从而获得更高的准确率。然而,神经网络的主要缺点在于由于其运算复杂度和空间复杂度的数量级,使得这类方法很难直接被应用在已有的适用于便携式设备的硬件平台。
综上,目前可穿戴式ecg监测设备面临的主要困境是:1)传统心律不齐检测算法有着设计困难、分类效果一般甚至会导致运算过度复杂(如基于特征的分类方法),而新出现的端到端检测方法克服了上述困难拥有更好的性能,却仍然受限于庞大的运算复杂度和参数复杂度;2)为了满足实时性要求,研发者采用现场可编程逻辑门阵列(fpga)组合数字信号处理器(dsp)这类高端平台的解决方案,导致产品成本不低且功耗水平高,又或者为了进一步追求高能效,使用专用集成电路(asic)解决方案为检测算法设计专用芯片,但asic不仅研发成本和门槛高,而且研发周期也很长,只适合大公司和高端市场。
除此之外,在便携式设备市场中最常见的解决方案还有基于单片微型计算机(mcu)的,不像fpga、dsp,低功耗mcu有着很低的功耗水平、很低的设备成本,对比asic,其优势在于很低的研发成本和门槛、很短的研发周期。然而,由于各种资源极其受限且可定制化能力差,现有的端到端检测算法都难以完整实现在此平台上。
技术实现要素:
针对现有技术中的上述不足,本发明提供的一种基于超轻量级卷积神经网络的ecg信号分类方法解决了端到端检测算法使用的cnn中常规全连接层的参数量庞大以及常规卷积层运算量庞大的问题,实现将算法运算复杂度的数量级拉低到适用于存储资源极其受限设备的水平。
为了达到上述发明目的,本发明采用的技术方案为:一种基于超轻量级卷积神经网络的ecg信号分类方法,包括以下步骤:
s1、获取ecg数据集,并制作成训练集和验证集;
s2、采用训练集和验证集对ecg信号分类模型进行训练和验证,得到最优的ecg信号分类模型;
s3、实时采集ecg心拍信号,并对其进行预处理,得到多段ecg数据;
s4、将多段ecg数据依次输入最优的ecg信号分类模型,得到ecg数据的分类结果。
进一步地,步骤s2中训练过程的ecg信号分类模型包括:第一二分类模型和第一五分类模型;
所述第一二分类模型包括:第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层和第一softmax层;
所述第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层和第一softmax层顺次连接;所述第一dscemp卷积层的输入端作为第一二分类模型的输入端;所述第一softmax层的输出端作为第一二分类模型的输出端;
所述第一五分类模型包括:第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层、第二全连接层和第二softmax层;
所述第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层、第二全连接层和第二softmax层顺次连接;所述第三dscemp卷积层的输入端作为第一五分类模型的输入端,所述第二softmax层的输出端作为第一五分类模型的输出端;
所述步骤s2的训练和验证过程为:
所述第一二分类模型的训练和验证过程为:
a1、采用样本平衡策略处理训练集,得到概率相近的训练集;
a2、将概率相近的训练集输入第一二分类模型中,通过反向传播训练算法对第一二分类模型进行训练,得到训练完成的第一二分类模型,其中,反向传播训练算法的损失函数的计算公式为:
其中,j(ω)为损失函数,k为概率相近的训练集中的样本总数,y(k)为第k个样本的标签值,φ(k)为第k个样本的预测结果,m为偏置因子;
a3、采用验证集对训练完成的第一二分类模型进行验证,保留最优的第一二分类模型;
所述第一五分类模型的训练和验证过程为:
a4、将概率相近的训练集输入第一五分类模型中,并对第一五分类模型进行训练,得到训练完成的第一五分类模型;
a5、从验证集中筛选出心率异常的验证集,并将心率异常的验证集输入训练完成的第一五分类模型中,并对其进行验证,保留最优的第一五分类模型;
a6、去掉最优的第一二分类模型和最优的第一五分类模型中softmax层,并将去掉softmax层后的最优的第一二分类模型和最优的第一五分类模型进行拼接,得到最优的ecg信号分类模型;
上述进一步方案的有益效果为:通过样本平衡策略让少数样本和多数样本被送入网络进行训练的概率相近从而平衡不同种类样本对模型训练过程的影响;并通过修改反向传播训练算法所用的损失函数,给少数样本类对应的损失项乘上一定大小的权重,从而提高模型对异常样本的关注。
进一步地,步骤s2中最优的ecg信号分类模型的结构为:第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层、第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层和第二全连接层顺次连接;所述第一dscemp卷积层的输入端作为最优的ecg信号分类模型的输入端;所述第二全连接的输出端作为最优的ecg信号分类模型的输出端。
进一步地,所述第一dscemp卷积层和第三dscemp卷积层均包括:第一深度卷积层、第一嵌入最大池化层和第一逐点卷积层;
所述第一深度卷积层、第一嵌入最大池化层和第一逐点卷积层顺次连接;所述第一深度卷积层的输入端作为第一dscemp卷积层或第三dscemp卷积层的输入端;所述第一逐点卷积层的输出端作为第一dscemp卷积层或第二dscemp卷积层的输出端;
所述第二dscemp卷积层和第四dscemp卷积层均包括:第二深度卷积层、第二嵌入最大池化层和第二逐点卷积层;
所述第二深度卷积层、第二嵌入最大池化层和第二逐点卷积层顺次连接;所述第二深度卷积层的输入端作为第二dscemp卷积层或第四dscemp卷积层的输入端;所述第二逐点卷积层的输出端作为第二dscemp卷积层或第四dscemp卷积层的输出端;
所述第一dscemp卷积层的通道数为第三dscemp卷积层的通道数的一半;所述第二dscemp卷积层的通道数为第四dscemp卷积层的通道数的一半;
所述第一深度卷积层的卷积核为padc-卷积核,其核的尺寸为:15*1,其中,15为padc-卷积核的长度,1为padc-卷积核的宽度;
所述第一深度卷积层的padc-卷积核的膨胀率为:4*1,其中,4为padc-卷积核长度方向上的膨胀率,1为padc-卷积核宽度方向上的膨胀率;
所述第一嵌入最大池化层的嵌入最大池化为:4*1,其中,4为在输入特征图的长度方向上的池化窗口和步进的大小,1为在输入特征图宽度方向上的池化窗口和步进的大小;
所述第二深度卷积层的卷积核为padc-卷积核,其核长为:9*1,其中,9为padc-卷积核的长度,1为padc-卷积核的宽度;
所述第二深度卷积层的padc-卷积核的膨胀率为:3*1,其中,3为padc-卷积核长度方向上的膨胀率,1为padc-卷积核宽度方向上的膨胀率;
所述第二嵌入最大池化层的嵌入最大池化为:2*1,其中,2为输入特征图的长度方向上的池化窗口和步进的大小,1为输入特征图宽度方向上的池化窗口和步进的大小。
进一步地,第一dscemp卷积层在训练过程中对概率相近的训练集的处理过程包括以下步骤:
b1、采用第一深度卷积层对训练集中每个原始图的单独通道上设置不同的卷积核进行空间感知,得到原始特征图;
b2、采用第一嵌入最大池化层对原始特征图进行降采样处理,得到显著特征图:
其中,f′mp为第一嵌入最大池化层输出的显著特征图,fdc为原始特征图,s为第一嵌入最大池化层的池化窗口的长度,l为第一嵌入最大池化层的通道数;
b3、采用第一逐点卷积层对显著特征图进行逐点卷积,并将逐点卷积后的显著特征图的输出通道投影到高维度的输出张量上,得到第一dscemp卷积层输出的特征图。
上述进一步方案的有益效果为:通过深度卷积层和逐点卷积可以有效减少运算量,而加入第二嵌入最大池化层对原始特征图进行降采样处理后,通过保留显著特征可以进一步减轻运算压力,同时不损失过多的特征信息。
进一步地,第一ldscp全连接层包括:第一投影层、第一全局平均池化层和第一l2-标准化层;
所述第一投影层、第一全局平均池化层和第一l2-标准化层顺次连接;
所述第一投影层的输入端作为第一ldscp全连接层的输入端;
所述第一l2-标准化层的输出端作为第一ldscp全连接层的输出端;
第一lddcp全连接层包括:第二投影层、第一激活层、第一带权全局平均池化层wgap、第一全局最大池化层gmp、第二l2-标准化层和第三l2-标准化层;
所述第二投影层的输入端作为第一lddcp全连接层的输入端,其输出端与第一激活层的输入端连接;
所述第一激活层的输出端分别与第一带权全局平均池化层wgap的输入端和第一全局最大池化层gmp的输入端连接;
所述第一带权全局平均池化层wgap的输出端与第二l2-标准化层的输入端连接;
所述第一全局最大池化层gmp的输出端与第三l2-标准化层的输入端连接;
所述第二l2-标准化层的输出端和第三l2-标准化层的输出端作为第一lddcp全连接层的输出端。
进一步地,第一lddcp全连接层在训练过程中对第四dscemp卷积层提取的特征图进行处理包括以下步骤:
c1、通过第二投影层对特征图进行通道间的关联,并将特征矢量投影到高维数的张量,得到高维投影的特征图;
c2、通过第一激活层的激活函数对高维投影的特征图进行处理,得到非线性特征图;
c3、通过第一带权全局平均池化层wgap对非线性特征图的每一个特征矢量进行全局范围内的加权聚合,得到第一特征矢量:
其中,outi为第一特征矢量中第i个输出值,n是非线性特征图的尺寸,m是非线性特征图的通道数,fij为非线性特征图构成的m*n的特征值矩阵中的第i行第j列的输入特征值,wij为fij对应的权重;
c4、通过第一全局最大池化层gmp对非线性特征图的每一个特征矢量进行全局聚合,得到第二特征矢量;
c5、通过第二l2-标准化层的l2范数对第一特征矢量进行标准化处理,得到标准化的第一特征矢量;
c6、通过第三l2-标准化层的l2范数对第二特征矢量进行标准化处理,得到标准化的第二特征矢量;
c7、对标准化的第一特征矢量和标准化的第二特征矢量进行拼接融合,得到第一lddcp全连接层输出的特征矢量。
上述进一步方案的有益效果为:先通过由1*1卷积核构建的第二投影层对特征图进行通道间关联并将特征矢量投影到更高维数的张量上,再通过激活函数去提高非线性拟合能力,再通过第一带权全局平均池化层wgap进行每一个特征矢量进行的全局范围内的加权聚合,降低了参数数量,同时第一全局最大池化层gmp进行全局聚合,将各个通道中最显著的特征值保留下来,保留了特征的丰富性,将加权聚合和全局聚合的结果都进行标准化处理以避免因分布差异带来的偏向性,将标准化后的特征矢量融合为一个特征矢量作为第一lddcp全连接层的输出,达到即能减少参数数量又使得输出结果保留了特征的丰富性。
进一步地,步骤s2中训练过程的ecg信号分类模型包括:第二二分类模型和第二五分类模型;
所述第二二分类模型包括:第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层和第三softmax层;
所述第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层和第三softmax层顺次连接;所述第五dscemp卷积层的输入端作为第二二分类模型的输入端;所述第三softmax层的输出端作为第二二分类模型的输出端;
所述第二五分类模型包括:第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层、第四全连接层和第四softmax层;
所述第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层、第四全连接层和第四softmax层顺次连接;所述第七dscemp卷积层的输入端作为第二五分类模型的输入端;所述第四softmax层的输出端作为第二五分类模型的输出端。
进一步地,步骤d6中最优的ecg信号分类模型包括:第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层、第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层和第四全连接层;
所述第五dscemp卷积层的输入端作为最优的ecg信号分类模型的输入端,其输出端与第六dscemp卷积层的输入端连接;
所述第六dscemp卷积层的输出端分别与第二ldscp全连接层的输入端、第二lddcp全连接层的输入端和第八dscemp卷积层的输出端连接;
所述第二ldscp全连接层的输出端与第三全连接层的输入端连接;
所述第三全连接层的输出端与第七dscemp卷积层的输入端连接;
所述第七dscemp卷积层的输出端与第八dscemp卷积层的输入端连接;
所述第二lddcp全连接层的输出端与第四全连接层的输入端连接;
所述第四全连接层的输出端作为最优的ecg信号分类模型的输出端;
所述第二ldscp全连接层包括:第三投影层、第二全局平均池化层和第四l2-标准化层;所述第三投影层、第二全局平均池化层和第四l2-标准化层顺次连接;所述第三投影层的输入端作为第二ldscp全连接层的输入端;所述第四l2-标准化层的输出端作为第二ldscp全连接层的输出端;
所述第二lddcp全连接层包括:第四投影层、第二激活层、第二带权全局平均池化层wgap、第二全局最大池化层gmp、第五l2-标准化层和第六l2-标准化层;
所述第四投影层的输入端作为第二lddcp全连接层的输入端,其输出端与第二激活层的输入端连接;所述第二激活层的输出端分别与第二带权全局平均池化层wgap的输入端和第二全局最大池化层gmp的输入端连接;所述第二带权全局平均池化层wgap的输出端与第五l2-标准化层的输入端连接;所述第二全局最大池化层gmp的输出端与第六l2-标准化层的输入端连接;所述第五l2-标准化层的输出端和第六l2-标准化层的输出端作为第二lddcp全连接层的输出端。
上述进一步方案的有益效果为:所有输入的ecg心拍信号都将会先通过第二二分类模型,第二二分类模型中的第六dscemp卷积层的输出特征图将会被保留下来,当该心拍信号被区分为正常心拍时则直接输出分类结果,否则将该心拍信号送入到第二五分类模型中,第二五分类模型中的第八dscemp卷积层的输出特征图将会和前面保留的第六dscemp卷积层的输出特征图进行拼接,然后送入接下来的结构进行处理得到最终的五分类结果并输出,这样使得第二五分类模型在开启后可以节省一半的卷积层运算压力。
进一步地,步骤s3包括以下步骤:
s31、采用带通滤波器对ecg数据进行滤波处理,得到滤波后的ecg数据;
s32、采用pan-tompkins算法对滤波后的ecg数据进行r峰检测,定位出每一个心动周期波形中的r峰位置;
s33、根据每一个心动周期波形中的r峰位置对滤波后的ecg数据进行分割,得到多段ecg数据。
综上,本发明的有益效果为:本发明设计了两种ecg信号分类模型,均有二分类模型先筛选出异常数据,再通过五分类模型对异常数据进行精确的分类,得到异常数据的分类结果,通过二分类模型的初步筛选,减少五分类模型的气动频率,从而降低算法的实际功耗。
附图说明
图1为一种基于超轻量级卷积神经网络的ecg信号分类方法的流程图;
图2为第一二分类模型的结构框图;
图3为第一五分类模型的结构框图;
图4为实施例1中最优的ecg信号分类模型的详细结构框图;
图5为实施例2中最优的ecg信号分类模型的详细结构框图;
图6为常规卷积层没有膨胀率时的示意图;
图7为本发明卷积层设置膨胀率的示意图;
图8为常规的卷积层的结构示意图;
图9为dscemp卷积层的结构示意图;
图10为常规的全连接层的结构示意图;
图11为lddcp全连接层的结构示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
关于下文缩写字符的解释:
lddcp为基于层分解的双通道池化技术;
ldscp为基于层分解的单通道池化技术;
dscemp为带有嵌入最大池化的深度分离卷积技术;
padc为池化感知的膨胀卷积技术。
如图1所示,一种基于超轻量级卷积神经网络的ecg信号分类方法,包括以下步骤:
s1、获取ecg数据集,并制作成训练集和验证集;
s2、采用训练集和验证集对ecg信号分类模型进行训练和验证,得到最优的ecg信号分类模型;
s3、实时采集ecg心拍信号,并对其进行预处理,得到多段ecg数据;
步骤s3包括以下步骤:
s31、采用带通滤波器对ecg数据进行滤波处理,得到滤波后的ecg数据;
在本实施例中:使用一个截止频率分别为0.5hz和40hz的数字带通滤波器作为去噪模块,去除ecg数据中可能包含的基线偏移、工频干扰和肌电干扰噪声;
s32、采用pan-tompkins算法对滤波后的ecg数据进行r峰检测,定位出每一个心动周期波形中的r峰位置;
s33、根据每一个心动周期波形中的r峰位置对滤波后的ecg数据进行分割,得到多段ecg数据。
在本实施例中:根据r峰位置进行心拍分割,其中每一个心拍的波形是由r峰位置左边133个采样点和右边266个采样点组成,包括r峰位置对应的采样点在内的一共400个采样点。
s4、将多段ecg数据依次输入最优的ecg信号分类模型,得到ecg数据的分类结果;
在本实施例中:分类结果包括:n(正常或者束支传导阻滞心拍)、s(室上性异常心拍)、v(心室异常心拍)、f(融合心拍)和q(未能分类的心拍)。
实施例1:步骤s2中训练过程的ecg信号分类模型包括:第一二分类模型和第一五分类模型;
如图2所示,所述第一二分类模型包括:第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层和第一softmax层;
所述第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层和第一softmax层顺次连接;所述第一dscemp卷积层的输入端作为第一二分类模型的输入端;所述第一softmax层的输出端作为第一二分类模型的输出端;
如图3所示,所述第一五分类模型包括:第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层、第二全连接层和第二softmax层;
所述第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层、第二全连接层和第二softmax层顺次连接;所述第三dscemp卷积层的输入端作为第一五分类模型的输入端,所述第二softmax层的输出端作为第一五分类模型的输出端;
所述步骤s2的训练和验证过程为:
所述第一二分类模型的训练和验证过程为:
a1、采用样本平衡策略处理训练集,得到概率相近的训练集;
a2、将概率相近的训练集输入第一二分类模型中,通过反向传播训练算法对第一二分类模型进行训练,得到训练完成的第一二分类模型,其中,反向传播训练算法的损失函数的计算公式为:
其中,j(ω)为损失函数,k为概率相近的训练集中的样本总数,y(k)为第k个样本的标签值,φ(k)为第k个样本的预测结果,m为偏置因子;
a3、采用验证集对训练完成的第一二分类模型进行验证,使用f2分数作为性能指标,保留f2分数最高的模型作为最优的第一二分类模型;
所述第一五分类模型的训练和验证过程为:
a4、将概率相近的训练集输入第一五分类模型中,并对第一五分类模型进行训练,得到训练完成的第一五分类模型;
a5、从验证集中筛选出心率异常的验证集,并将心率异常的验证集输入训练完成的第一五分类模型中,并对其进行验证,保留最优的第一五分类模型;
a6、去掉最优的第一二分类模型和最优的第一五分类模型中softmax层,并将去掉softmax层后的最优的第一二分类模型和最优的第一五分类模型进行拼接,得到最优的ecg信号分类模型;
如图4~5所示,步骤s2中最优的ecg信号分类模型的结构为:第一dscemp卷积层、第二dscemp卷积层、第一ldscp全连接层、第一全连接层、第三dscemp卷积层、第四dscemp卷积层、第一lddcp全连接层和第二全连接层顺次连接;所述第一dscemp卷积层的输入端作为最优的ecg信号分类模型的输入端;所述第二全连接的输出端作为最优的ecg信号分类模型的输出端。
所述第一dscemp卷积层和第三dscemp卷积层均包括:第一深度卷积层、第一嵌入最大池化层和第一逐点卷积层;
所述第一深度卷积层、第一嵌入最大池化层和第一逐点卷积层顺次连接;所述第一深度卷积层的输入端作为第一dscemp卷积层或第三dscemp卷积层的输入端;所述第一逐点卷积层的输出端作为第一dscemp卷积层或第二dscemp卷积层的输出端;
所述第二dscemp卷积层和第四dscemp卷积层均包括:第二深度卷积层、第二嵌入最大池化层和第二逐点卷积层;
所述第二深度卷积层、第二嵌入最大池化层和第二逐点卷积层顺次连接;所述第二深度卷积层的输入端作为第二dscemp卷积层或第四dscemp卷积层的输入端;所述第二逐点卷积层的输出端作为第二dscemp卷积层或第四dscemp卷积层的输出端;
所述第一dscemp卷积层的通道数为第三dscemp卷积层的通道数的一半;所述第二dscemp卷积层的通道数为第四dscemp卷积层的通道数的一半;
所述第一深度卷积层的卷积核为padc-卷积核,其核的尺寸为:15*1,其中,15为padc-卷积核的长度,1为padc-卷积核的宽度;
所述第一深度卷积层的padc-卷积核的膨胀率为:4*1,其中,4为padc-卷积核长度方向上的膨胀率,1为padc-卷积核宽度方向上的膨胀率;
所述第一嵌入最大池化层的嵌入最大池化为:4*1,其中,4为在输入特征图的长度方向上的池化窗口和步进的大小,1为在输入特征图宽度方向上的池化窗口和步进的大小;
所述第二深度卷积层的卷积核为padc-卷积核,其核长为:9*1,其中,9为padc-卷积核的长度,1为padc-卷积核的宽度;
所述第二深度卷积层的padc-卷积核的膨胀率为:3*1,其中,3为padc-卷积核长度方向上的膨胀率,1为padc-卷积核宽度方向上的膨胀率;
所述第二嵌入最大池化层的嵌入最大池化为:2*1,其中,2为输入特征图的长度方向上的池化窗口和步进的大小,1为输入特征图宽度方向上的池化窗口和步进的大小。
如图6~7所示,图6为对卷积层常规设置膨胀率的方法,通过卷积层和池化层交叉堆叠的方式来提高输出神经元的感受野,但存在感受野过度重叠的问题,图7为本发明通过插入空洞进行扩展,从而使一定范围内的相邻卷积神经元彼此间的感知区域相互交错,不仅能快速扩大后续卷积层神经元的感受野,还能减轻逐层传递过程中感受野的过重叠程度,而更少的重叠意味着卷积层的神经元个数更少,网络运算量更低。
设置第一深度卷积层的padc-卷积核的膨胀率的论证过程如下:
在第一深度卷积层中,协同其后的嵌入最大池化层设计卷积核的膨胀率,来最小化在一定范围内相邻神经元的感受野重叠区域,进一步使后续的嵌入最大池化层中单个输出神经元的感受野最大化。
为了使最大池化层神经元的感受野最大化的同时,其输出映射在输入信号上的区域上保持是连续的,以避免信息在后续传递过程中不必要的丢失,因此深度卷积层的膨胀率应该和紧随其后的最大池化层的池化窗口大小一致。
设置第二深度卷积层的padc-卷积核的膨胀率的论证过程如下:
在为第二深度卷积层选用合适的膨胀率时,不同之处在于由于第二深度卷积层的直接输入是前面dscemp卷积层的输出,这些输出之间已经存在了一定的感受野重叠度,所以可以通过微调将膨胀率设置为大于后续嵌入池化层的池化窗口大小的值(但不能远远大于窗口大小,会导致神经网络的分类准确率下降)。
综上,通过运用设置深度卷积核的膨胀率,使得稠密的网络结构变更加稀疏,使得网络中的神经元更少,每个神经元的感受野更宽广,最终有利于减少网络的运算量,并有利于提升分类性能。
第一dscemp卷积层在训练过程中对概率相近的训练集的处理过程包括以下步骤:
b1、采用第一深度卷积层对训练集中每个原始图的单独通道上设置不同的卷积核进行空间感知,得到原始特征图;
b2、采用第一嵌入最大池化层对原始特征图进行降采样处理,得到显著特征图:
其中,f′mp为第一嵌入最大池化层输出的显著特征图,fdc为原始特征图,s为第一嵌入最大池化层的池化窗口的长度,l为第一嵌入最大池化层的通道数;
b3、采用第一逐点卷积层对显著特征图进行逐点卷积,并将逐点卷积后的显著特征图的输出通道投影到高维度的输出张量上,得到第一dscemp卷积层输出的特征图。
第一ldscp全连接层包括:第一投影层、第一全局平均池化层和第一l2-标准化层;
所述第一投影层、第一全局平均池化层和第一l2-标准化层顺次连接;
所述第一投影层的输入端作为第一ldscp全连接层的输入端;
所述第一l2-标准化层的输出端作为第一ldscp全连接层的输出端;
第一lddcp全连接层包括:第二投影层、第一激活层、第一带权全局平均池化层wgap、第一全局最大池化层gmp、第二l2-标准化层和第三l2-标准化层;
所述第二投影层的输入端作为第一lddcp全连接层的输入端,其输出端与第一激活层的输入端连接;
所述第一激活层的输出端分别与第一带权全局平均池化层wgap的输入端和第一全局最大池化层gmp的输入端连接;
所述第一带权全局平均池化层wgap的输出端与第二l2-标准化层的输入端连接;
所述第一全局最大池化层gmp的输出端与第三l2-标准化层的输入端连接;
所述第二l2-标准化层的输出端和第三l2-标准化层的输出端作为第一lddcp全连接层的输出端。
第一lddcp全连接层在训练过程中对第四dscemp卷积层提取的特征图进行处理包括以下步骤:
c1、通过第二投影层对特征图进行通道间的关联,并将特征矢量投影到高维数的张量,得到高维投影的特征图;
c2、通过第一激活层的激活函数对高维投影的特征图进行处理,得到非线性特征图;
c3、通过第一带权全局平均池化层wgap对非线性特征图的每一个特征矢量进行全局范围内的加权聚合,得到第一特征矢量:
其中,outi为第一特征矢量中第i个输出值,n是非线性特征图的尺寸,m是非线性特征图的通道数,fij为非线性特征图构成的m*n的特征值矩阵中的第i行第j列的输入特征值,wij为fij对应的权重;
c4、通过第一全局最大池化层gmp对非线性特征图的每一个特征矢量进行全局聚合,得到第二特征矢量;
c5、通过第二l2-标准化层的l2范数对第一特征矢量进行标准化处理,得到标准化的第一特征矢量;
c6、通过第三l2-标准化层的l2范数对第二特征矢量进行标准化处理,得到标准化的第二特征矢量;
c7、对标准化的第一特征矢量和标准化的第二特征矢量进行拼接融合,得到第一lddcp全连接层输出的特征矢量。
实施例2:步骤s2中训练过程的ecg信号分类模型包括:第二二分类模型和第二五分类模型;
所述第二二分类模型包括:第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层和第三softmax层;
所述第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层和第三softmax层顺次连接;所述第五dscemp卷积层的输入端作为第二二分类模型的输入端;所述第三softmax层的输出端作为第二二分类模型的输出端;
所述第二五分类模型包括:第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层、第四全连接层和第四softmax层;
所述第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层、第四全连接层和第四softmax层顺次连接;所述第七dscemp卷积层的输入端作为第二五分类模型的输入端;所述第四softmax层的输出端作为第二五分类模型的输出端。
如图8所示,步骤d6中最优的ecg信号分类模型包括:第五dscemp卷积层、第六dscemp卷积层、第二ldscp全连接层、第三全连接层、第七dscemp卷积层、第八dscemp卷积层、第二lddcp全连接层和第四全连接层;
所述第五dscemp卷积层的输入端作为最优的ecg信号分类模型的输入端,其输出端与第六dscemp卷积层的输入端连接;
所述第六dscemp卷积层的输出端分别与第二ldscp全连接层的输入端、第二lddcp全连接层的输入端和第八dscemp卷积层的输出端连接;
所述第二ldscp全连接层的输出端与第三全连接层的输入端连接;
所述第三全连接层的输出端与第七dscemp卷积层的输入端连接;
所述第七dscemp卷积层的输出端与第八dscemp卷积层的输入端连接;
所述第二lddcp全连接层的输出端与第四全连接层的输入端连接;
所述第四全连接层的输出端作为最优的ecg信号分类模型的输出端;
第七dscemp卷积层和第五dscemp卷积层的结构与实施例1中的第一dscemp卷积层相同;第八dscemp卷积层和第六dscemp卷积层的结构与实施例1中的第二dscemp卷积层相同;
第一dscemp卷积层、第二dscemp卷积层、第三dscemp卷积层、第四dscemp卷积层、第五dscemp卷积层、第六dscemp卷积层和第七dscemp卷积层的结构均如图9所示。
所述第二ldscp全连接层包括:第三投影层、第二全局平均池化层和第四l2-标准化层;所述第三投影层、第二全局平均池化层和第四l2-标准化层顺次连接;所述第三投影层的输入端作为第二ldscp全连接层的输入端;所述第四l2-标准化层的输出端作为第二ldscp全连接层的输出端;
所述第二lddcp全连接层包括:第四投影层、第二激活层、第二带权全局平均池化层wgap、第二全局最大池化层gmp、第五l2-标准化层和第六l2-标准化层;
所述第四投影层的输入端作为第二lddcp全连接层的输入端,其输出端与第二激活层的输入端连接;所述第二激活层的输出端分别与第二带权全局平均池化层wgap的输入端和第二全局最大池化层gmp的输入端连接;所述第二带权全局平均池化层wgap的输出端与第五l2-标准化层的输入端连接;所述第二全局最大池化层gmp的输出端与第六l2-标准化层的输入端连接;所述第五l2-标准化层的输出端和第六l2-标准化层的输出端作为第二lddcp全连接层的输出端。
第一lddcp全连接层和第二lddcp全连接层详细的结构图如图11所示,图10为常规的全连接层的结构示意图,本发明对常规全连接层进行了改进,常规的全连接层只相当于lddcp全连接层中的投影层。
图8为常规的卷积层的结构示意图,在图8中常规卷积层后面连接池化层,图9为dscemp卷积层的结构示意图,本发明对常规卷积层进行改进,将常规卷积层分成深度卷积层和逐点卷积成,并在深度卷积层和逐点卷积层之间嵌入最大池化层。
为了降低卷积层的运算量,本发明设计的dscemp卷积层首先将一个常规卷积层分解为深度卷积层和逐点卷积层,深度卷积层只进行空间维度上的卷积,逐点卷积层则进行通道间的信息组合,利用上述特点,结合最大池化层仅在空间维度上进行池化的特点,将最大池化层嵌入到深度卷积和逐点卷积之间并不会导致dscemp卷积层的特征提取能力下降,因此本发明设计的dscemp卷积层采用了嵌入最大池化层来进一步减少常规卷积层的运算量。
图8至图11中字符含义的解释:
图8中:输入:(m@n*1),m为输入特征图的通道数,n为输入特征图的尺寸,h@f*1,h为卷积层输出特征图的通道数,n*1为卷积层输出特征图的尺寸,h@g*1,h为最大池化层输出特征图的通道数,g*1为最大池化层输出特征图的尺寸。
图9中:输入:(m@n*1),m为输入特征图的通道数,n*1为输入特征图的尺寸,m@f*1,m为深度卷积层输出特征图的通道数,f*1为深度卷积层输出特征图的尺寸,m@g*1,m为嵌入最大池化层输出特征图的通道数,g*1为嵌入最大池化层输出特征图的尺寸,h@g*1,h为逐点卷积层输出特征图的通道数,g*1为逐点卷积层输出特征图的尺寸,核(m@k*1),m为深度卷积层的输出通道数,k*1为深度卷积核的尺寸,步进(s*1),s*1为最大池化层的步进,核(h@1*1),h为逐点卷积层的输出通道数,1*1代表逐点卷积核的尺寸,m2为逐点卷积层的输入特征图的通道数。
图10中,输入:m*n*1,m为输入特征图的通道数,n*1为输入特征图的尺寸,核(k@n*1),k为全连接层神经元的数量,n*1为全连接层神经元的连接的输入特征图的尺寸,m1为全连接层神经元的连接的输入特征图的通道数,输出:k为输出特征矢量的长度。
图11中,输入:m*n*1,m为输入特征图的通道数,n*1为输入特征图的尺寸,k@n*1,k为投影层输出特征图的通道数,n*1为投影层输出特征图的尺寸,核(k@1*1),k为投影层卷积核的数量,1*1为投影层卷积核的尺寸,m为投影层卷积层的输入通道数,核(k@n*1),k为带权全局平均池化层wgap加权核的数量,n*1为加权核的尺寸,p为带权全局平均池化层wgap和全局最大池化层gmp单独的输出特征矢量长度。