本发明涉及数据处理领域,尤其涉及心电数据的检测方法及存储介质。
背景技术:
我国心血管疾病罹患人数高达2.9亿,死亡率居首位,占居民疾病死亡的40%以上。进而临床上的诊断与治疗就尤为重要。在这个过程中,心电图是一种基本的诊断工具,而计算机辅助诊断在过去的50年间得到了显著的进步,从过去的仅能识别某些特定指标,到现在利用人工智能算法进行智能诊断。但是,这种方法目前仍旧有许多问题,临床上也只是将该方法作为辅助手段,能给到医生的参考建议也有限。
1.基于传统方法,通常来说,传统上的自动心率异常识别流程分为以下几个步骤。
a)信号识别与基本处理,将病人8导联的电信号转化为数据,再进行降噪等基本处理,同时计算另外4导联的辅助信号,形成传统意义上的12导联ecg数据。b)剔除某些异常值。c)波形识别,如p波、t波、qrs波群。d)量化间期指标与其他指标;e)进行疾病的基本判断;f)结果输出并进行解释。
方法局限:准确率不高。
2.基于深度学习的人工智能方法:与传统方法相类似,目前利用深度学习算法识别心率异常也能分为以下几个步骤。
a)同传统方法,获取12导联ecg信号;b)对数据进行标准化切割,切割一般以固定的时间间隔作为标准,得到固定时间内的ecg数据;c)将整个数据以及数据标签(也就是病人临床上已诊断出的疾病)输入到卷积神经网络中,进行网络训练,最后得到的网络便是成果。d)对于新来的数据,带入网络中,得出计算结果;e)结果输出。
方法局限:准确率较高,但还是无法达到人工诊断标准;可解释性差;只能进行单标签的判断,无法判断复合疾病。
技术实现要素:
本发明提供一种心电数据的检测方法,包括:获取步骤,获取单导联或多导联的第一时间序列的心电数据并制作第一样本;数据转换步骤,将所述第一时间序列的心电数据进行傅里叶变换得到所述第一时间序列的频域数据并制作第二样本;分类步骤,将所述第一样本划分为第一训练样本以及第一测试样本,将所述第二样本划分为第二训练样本以及第二测试样本;训练步骤,将所述第一训练样本、所述第二训练样本及相应的多分类标签输入至多标签分分类网络中训练得到多标签分类器,所述多标签分分类网络包括第一卷积神经网络、第二卷积神经网络以及全连接神经网络,所述第一卷积神经网络用以接受所述第一训练样本并输出第一特征图,所述第二卷积神经网络用以接受所述第二训练样本并输出第二特征图,所述全连接神经网络用以将接受所述第一特征图以及所述第二特征图并训练得到所述多标签分类器。
进一步地,所述训练步骤具体包括:第一训练步骤,输入所述第一训练样本以及相应的训练标签,并通过第一卷积神经网络训练得到第一特征图,所述第一特征参数为所述第一卷积神经网络最后一层网络的参数;第二训练步骤,输入所述第二训练样本以及相应的训练标签,并通过第二卷积神经网络训练得到第二特征图,所述第二特征参数为所述第二卷积神经网络最后一层网络的参数;第三训练步骤,输入所述第一特征图、所述第二特征图及多分类标签至全连接神经网络中训练得到所述多标签分类器。
进一步地,所述第一训练步骤具体包括:第一初始化步骤,初始化第一卷积神经网络,初始化所有参数w∈w;第一输入步骤,输入第一训练样本a(i)及训练标签至所述第一卷积神经网络得到第一预估结果
进一步地,所述第二训练步骤具体包括:第二初始化步骤,初始化第二卷积神经网络,初始化所有参数v∈v;第二输入步骤,输入第二训练样本a(i)及训练标签至所述第二卷积神经网络得到第二预估结果
进一步地,所述第二训练步骤具体包括:参数合并步骤,将所述第一特征图以及所述第二特征图进行合并得到输入数据;标签排序步骤,对多分类的标签进行随机排序;构建步骤,将多分类标签以及所述输入数据构建二分类数据集;模型构建步骤,输入所述二分类数据集至所述全连接神经网络中训练得到所述多标签分类器。
进一步地,所述的心电数据的检测方法还包括:优化步骤,分别将测试样本输入至所述多标签分类器中得到测试结果,根据所述测试结果对所述多标签分类器进行优化,所述测试样本包括所述第一测试样本以及所述第二测试样本。
进一步地,所述优化步骤具体包括:输入测试样本步骤,输入x个测试样本至所述初级模型,获取x个预测结果;比对步骤,将所述x个预测结果与所述x个测试样本的x个发电功率比较,统计与所述发电功率差异超过一定阈值的预测结果的个数y;计算步骤,计算预测的错误率,对模型进行评估,计算y与测试样本的样本数x的比值。
进一步地,所述第一卷积神经网络与所述第二卷积神经网络皆包括:数据输入层,用以接受所有训练样本,并进行归一化处理;卷积层,进行卷积计算,寻找训练样本中的特征;非线性激励层,接受所述卷积层的输出并进行非线性映射;池化层,在每两个卷积层中间加入一个池化层,用于压缩数据和参数的量,减小过拟合;批量归一化层,在卷积神经网络中进行节点数据的归一化,以加速收敛速度;遗忘层,将卷积神经网络的部分参数重新初始化,以提高整个网络的泛化性;全连接层,通过全连接的方式连接所述遗忘层。
进一步地,所述多导联包括:3导联或8导联;和/或,所述第一训练样本与所述第一测试样本为8:2;和/或,所述第二训练样本与所述第二测试样本为8:2。
本发明还提供一种存储介质,该存储介质存储一计算机程序,该计算机程序用以执行所述的心电数据的检测方法。
本发明的有益效果是:本发明通过将心电数据的时域数据与频域数据进行卷积得到高阶的第一特征图与第二特征图。再将两种特征图进行多标签训练得到多标签分类器,多标签分类器具有高准确率与低假阴性;本发明将时域和频域的结合可以更好的扩展单个神经网络的泛化能力。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其它有益效果显而易见。
图1为本发明提供的心电数据的检测方法的流程图。
图2为本发明提供的训练步骤的流程图。
图3为本发明提供的第一训练步骤的流程图。
图4为本发明提供的第二训练步骤的流程图。
图5为本发明提供的第三训练步骤的流程图。
图6为本发明提供的优化步骤的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下文的公开提供了许多不同的实施方式或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或参考字母,这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施方式和/或设置之间的关系。此外,本发明提供了的各种特定的工艺和材料的例子,但是本领域普通技术人员可以意识到其他工艺的应用和/或其他材料的使用。
如图1所示,本发明提供一种心电数据的检测方法,包括:
s1、获取步骤,获取单导联或多导联的第一时间序列的心电数据并制作第一样本。
一般所述第一时间序列通过数据采集得到,在临床上通常用大型心电检测仪采集被试多导联心电信号,在日常生活中可由便携式设备,如便携式健康手环、便携式健康胸带等,采集被试单导联或多导联心电信号。
采集后的数据为时间序列数据。由临床心电监测仪采集到的信号为短时的8导联信号,时常大约30秒左右;由便携式设备或可穿戴设备采集的信号由不同型号会产生采集不同导联数的信号,常见的有单导联、3导联、8导联,信号时常会较长,通常能不间断采集信号几十小时以上。
设采集的时间序列数据为{xti},其中t表示时间序号,i表示导联序号。以下以8导联信号作为例子进行说明,即i=1,2,3...,8。
若采集得到的数据时间较长,则需要按照固定时间间隔t截取为所述第一时间序列数据。
每一组时间序列(每一个被试)对应着一组或多组标签,标签标记了这一个被试为健康人群或是罹患某一种或多种心脏疾病,将各种可能的标签序列化后,我们记对应的标签数据为{y},y=1,2,3...9,其代表了9种可能的标签(1类健康与8类疾病)。
s2、数据转换步骤,将所述第一时间序列的心电数据进行傅里叶变换得到所述第一时间序列的频域数据并制作第二样本。
s3、分类步骤,将所述第一样本划分为第一训练样本以及第一测试样本,将所述第二样本划分为第二训练样本以及第二测试样本。
s4、训练步骤,将所述第一训练样本、所述第二训练样本及相应的多分类标签输入至多标签分分类网络中训练得到多标签分类器,所述多标签分分类网络包括第一卷积神经网络、第二卷积神经网络以及全连接神经网络,所述第一卷积神经网络用以接受所述第一训练样本并输出第一特征图,所述第二卷积神经网络用以接受所述第二训练样本并输出第二特征图,所述全连接神经网络用以将接受所述第一特征图以及所述第二特征图并训练得到所述多标签分类器。
如图2所示,所述训练步骤具体包括。
s401、第一训练步骤,输入所述第一训练样本以及相应的训练标签,并通过第一卷积神经网络训练得到第一特征图,所述第一特征参数为所述第一卷积神经网络最后一层网络的参数。
如图3所示,所述第一训练步骤具体包括。
s4011、第一初始化步骤,初始化第一卷积神经网络,初始化所有参数w∈w;第一输入步骤,输入第一训练样本a(i)及训练标签至所述第一卷积神经网络得到第一预估结果
s4012、第一计算步骤,计算第一预估结果
s4013、第一更新步骤,对第一卷积神经网络的参数更新,更新公式为
s402、第二训练步骤,输入所述第二训练样本以及相应的训练标签,并通过第二卷积神经网络训练得到第二特征图,所述第二特征参数为所述第二卷积神经网络最后一层网络的参数。
如图4所示,所述第二训练步骤具体包括。
s4021、第二初始化步骤,初始化第二卷积神经网络,初始化所有参数v∈v;第二输入步骤,输入第二训练样本a(i)及训练标签至所述第二卷积神经网络得到第二预估结果
s4022、第二计算步骤,计算第二预估结果
s4023、第二更新步骤,对第二卷积神经网络的参数更新,更新公式为
s403、第三训练步骤,输入所述第一特征图、所述第二特征图及多分类标签至全连接神经网络中训练得到所述多标签分类器。
如图5所示,所述第三训练步骤具体包括。
s4031、参数合并步骤,将所述第一特征图wa以及所述第二特征图wb进行合并得到输入数据。
s4032、标签排序步骤,对多分类的标签进行随机排序。
s4033、构建步骤,将多分类标签以及所述输入数据构建二分类数据集。
s4034、模型构建步骤,输入所述二分类数据集至所述全连接神经网络中训练得到所述多标签分类器。
s5、优化步骤,分别将测试样本输入至所述多标签分类器中得到测试结果,根据所述测试结果对所述多标签分类器进行优化,所述测试样本包括所述第一测试样本以及所述第二测试样本。
如图6所示,所述优化步骤具体包括。
s501、输入测试样本步骤,输入x个测试样本至所述初级模型,获取x个预测结果;
s502、比对步骤,将所述x个预测结果与所述x个测试样本的x个发电功率比较,统计与所述发电功率差异超过一定阈值的预测结果的个数y;
s503、计算步骤,计算预测的错误率,对模型进行评估,计算y与测试样本的样本数x的比值。
所述第一卷积神经网络与所述第二卷积神经网络皆包括:数据输入层,用以接受所有训练样本,并进行归一化处理;卷积层,进行卷积计算,寻找训练样本中的特征;非线性激励层,接受所述卷积层的输出并进行非线性映射;池化层,在每两个卷积层中间加入一个池化层,用于压缩数据和参数的量,减小过拟合;批量归一化层,在卷积神经网络中进行节点数据的归一化,以加速收敛速度;遗忘层,将卷积神经网络的部分参数重新初始化,以提高整个网络的泛化性;全连接层,通过全连接的方式连接所述遗忘层。
所述多导联包括:3导联或8导联;和/或,所述第一训练样本与所述第一测试样本为8:2;和/或,所述第二训练样本与所述第二测试样本为8:2。
本发明还提供一种存储介质,该存储介质存储一计算机程序,该计算机程序用以执行所述的心电数据的检测方法。
本发明通过将心电数据的时域数据与频域数据进行卷积得到高阶的第一特征图与第二特征图。再将两种特征图进行多标签训练得到多标签分类器,多标签分类器具有高准确率与低假阴性;本发明将时域和频域的结合可以更好的扩展单个神经网络的泛化能力。
本发明可适用实际上多发的多疾病情况;在提取特征的过程中,可以不局限于只有两个cnn模型,可扩展为多个模型,并加入传统方法所提取出的特征。
对比传统方法或者已有的人工智能算法,本发明的疾病判断准确率更高、可解释性更好、普适性更好、可扩展性更好。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想;本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例的技术方案的范围。