一种基于扩散模型的孕产妇心电图数据增强方法与流程

文档序号:40069867发布日期:2024-11-22 17:34阅读:8来源:国知局
一种基于扩散模型的孕产妇心电图数据增强方法与流程

本发明涉及心电图(ecg)信号处理领域,具体涉及一种基于扩散模型的孕产妇心电图数据增强方法。


背景技术:

1、在医学诊断中,心电图(ecg)是一种重要的工具,用于检测和分析心脏的电活动。尤其对于孕产妇,其心电活动可能受到各种生理和病理因素的影响,导致心电图信号复杂多变。然而,在临床实践中,具有多种心搏特征的ecg数据(例如同时包含早搏和房颤的信号)非常稀少且难以获取。其主要原因包括以下几点:

2、(1)概率低下。如早搏和房颤同属于异位心搏,早搏和房颤等心律失常的同时出现在一个孕产妇身上本身就比较罕见,概率较低。但是一旦发生,如果能够即时检测提醒,有利于提醒患者即时就医或者采取医疗干预手段。

3、(2)持续时间短。这类复合型心律失常的出现通常较为短暂和间歇性,不太容易在持续监测中被“捕捉”到。

4、(3)难以检测。临床上主要依赖断断续续的短时间监测来发现问题,要恰好在监测时出现这种混合型心律失常的概率很低。

5、(4)公开数据库的稀缺性:公开ecg数据库包含同时发生的异位心搏的样本也非常少。

6、由于以上原因,这类多标签ecg数据非常稀少,难以构建足够数据量的训练集。这类多种心律失常叠加在一起的ecg信号,获取难度非常大,需要改进监测手段和识别算法,以获得更多这类稀有的数据。但是在心电图诊断检测算法中,需要大量的数据驱动,去寻找合适的策略或者训练高精度的模型去检测心搏分类。

7、近年来,扩散模型(diffusion model)作为一种生成式模型,在机器学习领域尤其是文本理解和二维图像生成方面取得了显著进展。扩散模型最早在1997年被提出,但直到2020年,deepmind在其提出的denoising diffusion probabilistic models(ddpm)中将其与深度学习相结合,才使得这类模型广泛应用于文本到图像生成任务中。2021年,anthropic公司提出的dall-e模型进一步展示了扩散模型在通过文本生成高质量图片方面的巨大潜力。

8、鉴于扩散模型在生成高质量、多样化样本方面的优势,如何探索其在医学数据生成中的应用,尤其是对于稀缺的多标签ecg数据,亟需一种能够基于扩散模型的孕产妇心电图数据增强方法解决在现有技术中ecg异位心搏数据少、多标签数据少的难题。


技术实现思路

1、有鉴于此,为了解决ecg异位心搏数据少、多标签数据少的难题,本发明的目的在于提出一种基于扩散模型的孕产妇心电图数据增强方法,通过扩散模型学习已有数据库的ecg信号,从而可以根据需求生成所需要的单发或并发异位心搏的心电数据。

2、基于上述目的,第一方面,本发明提供了一种基于扩散模型的孕产妇心电图数据增强方法,通过扩散模型学习已有数据库的ecg信号,根据需求生成所需要的单发或并发异位心搏的心电数据,该方法包括以下步骤:

3、获取心电信号,记录心电信号的元数据,并统一信号采样频率;

4、对统一信号采样频率的心电信号进行滑动切片,并初始化标签向量;

5、设置输入噪声模块,生成长度为n、采样频率为fs的噪声序列,设置ln个不同噪声等级;

6、设置sig_encoder、sig_decoder、label encoder和noise predictor模块,设置loss函数,训练sig_encoder、sig_decoder、label encoder和noise predictor模型,计算kl散度损失,反向传播更新参数,迭代训练得到心电信号扩散模型;

7、应用训练后的心电信号扩散模型,生成满足多标签诊断需求的心电图(ecg)数据。

8、作为本发明的进一步方案,通过设备采集或公开数据库获取心电信号,心电信号的元数据包括心电信号的导联、采样频率、佩戴方式、心电信号正向/反向以及心律诊断类型标签;其中:

9、导联:描述了心电信号是从哪个导联(如i、ii、iii、avr、avl、avf、v1-v6)记录的。

10、采样频率:描述了心电信号的采样速率,即每秒采集多少个数据点(例如500hz)。

11、佩戴方式:描述了采集心电信号时传感器或电极的佩戴或放置方法。

12、心电信号正向/反向:描述了信号的极性方向,即信号的正负极是否需要调整。

13、心律诊断类型标签:描述了心电信号的临床诊断结果或特征标签,例如窦性心律、房性早搏、室性早搏等。

14、作为本发明的进一步方案,统一信号采样频率时,对于获得到的心电信号,将心电信号降采样或过采样到统一频率fs;其中,降采样或升采样的方法包括但不限于插值、抽样、时频域转换。

15、作为本发明的进一步方案,对统一信号采样频率的心电信号进行滑动切片时,使用长度为n个采样点的窗口,对心电信号进行滑动切分,滑动步长为s个采样点。

16、作为本发明的进一步方案,初始化标签向量时,清洗心律诊断类型标签,设定待分类的心律类型标签向量m=[m1,m2,...,mn],针对每条切片信号的心律诊断类型具备的标签向量n=[n1,n2,n3......],根据心律类型标签向量m,初始化每一条切片信号的标签向量n。

17、作为本发明的进一步方案,所述输入噪声模块对于长度为n、采样频率为fs的噪声序列,设置的噪声等级由噪声在时域上的平均能量决定,能量越高、噪声等级越高。

18、作为本发明的进一步方案,所述sig_encoder模块用于将输入的ecg信号编码为隐空间向量(latent vector);所述sig_decoder模块用于将隐空间向量(latent vector)解码为ecg信号;所述label encoder模块,用于将标签向量n=[n1,n2,n3......]编码为标签矢量(label vector);所述noise_predictor模块,输入为标签矢量(label vector)和噪声信号,输出为预测噪声(predict noise)。

19、作为本发明的进一步方案,生成满足多标签诊断需求的心电图数据为一条房颤和早搏的ecg信号。

20、作为本发明的进一步方案,设置的输入噪声模块生成一维噪声向量的方法包括以下步骤:

21、为每个采样点生成一个均值为avg、标准差为std的随机数;将所有采样点的随机数连接起来,形成一个长度为n的一维信号序列;

22、或者,生成一个在频率[f_min,f_max]范围内均匀分布的频谱;通过反傅里叶变换,得到时间域的白噪声信号。

23、作为本发明的进一步方案,sig_encoder模块设计为包含8层的卷积神经网络结构,包括:

24、第一层为一维卷积层,卷积核数量为64,核大小为5,步长为1,接relu激活函数和一维最大池化层;

25、第二层为一维卷积层,卷积核数量为128,核大小为3,步长为1,接relu激活函数和一维最大池化层;

26、第三层为一维卷积层,卷积核数量为256,核大小为3,步长为1,接relu激活函数和一维最大池化层;

27、第四层为一维卷积层,卷积核数量为512,核大小为3,步长为1,接relu激活函数和一维最大池化层;

28、第五层为一维卷积层,卷积核数量为1024,核大小为3,步长为1,接relu激活函数和一维最大池化层;

29、第六层为展平层,将数据打平;

30、第七层为全连接层,神经元数量为256,使用relu激活函数;

31、第八层为全连接层,神经元数量为64,使用relu激活函数,输出隐空间向量latentvector。

32、作为本发明的进一步方案,sig_decoder模块设计为包含10层的残差网络(resnet)结构,包括:

33、一个卷积层,包含64个3×3卷积核,步幅为1,输出64个特征图;

34、一个最大池化层,进行2×2池化操作;

35、4个残差模块,每个模块包含2层3×3卷积层,卷积核数依次为64、128、256、512,每层卷积后接bn层和relu激活函数;

36、一个全局平均池化层,将特征图聚合为一个特征向量;

37、一个全连接层,输出一个一维向量。

38、作为本发明的进一步方案,训练sig_encoder、sig_decoder、label encoder和noise predictor模型时,训练过程包括:

39、encoder提取信号特征,加入某一噪声等级的input noise,label encoder提取标签向量特征;

40、decoder试图重构信号,noise predictor试图重构噪声;

41、计算预测噪声分布predict noise与先验目标input noise之间的kl散度,得到klloss;

42、计算总损失,反向传播更新sig_encoder、sig_decoder、label encoder和noisepredictor的参数;

43、重复上述过程,每次稍微减小loss,逐步逼近原信号;

44、用全部训练信号重复上述过程,完成模型训练。

45、本发明的一种基于扩散模型的孕产妇心电图数据增强方法,通过设计sig_encoder、sig_decoder、label encoder和noise predictor模块,有效生成符合特定标签需求的高质量心电图数据,提升心电图分类模型的性能。本发明通过精细化的信号处理和深度学习模型,实现了高质量的ecg信号生成,为孕产妇心律异常检测提供了有效的技术支持。

46、本发明的又一方面,还提供了一种计算机设备,包括存储器和处理器,该存储器中存储有计算机程序,该计算机程序被处理器执行时执行上述任一项根据本发明的基于扩散模型的孕产妇心电图数据增强方法。

47、本发明的再一方面,还提供了一种计算机可读存储介质,存储有计算机程序指令,该计算机程序指令被执行时实现上述任一项根据本发明的基于扩散模型的孕产妇心电图数据增强方法。

48、与现有技术相比较而言,本发明提出的一种基于扩散模型的孕产妇心电图数据增强方法,具有以下有益效果:

49、1.解决了数据不平衡问题。传统的心电图数据采集过程中,经常会遇到某些心律类型数据不足的问题,导致数据不平衡。本发明通过扩散模型可以生成多种心律类型的数据,有效解决了数据不平衡的问题,为模型提供更全面的训练数据。

50、2.提升了模型性能。通过生成高质量的增强数据,提供了更多样化的训练样本,能够显著提升心电图分类模型的性能。尤其在多标签分类任务中,增加了模型对不同心律类型的泛化能力,减少过拟合的风险。

51、3.实现了高质量数据生成。利用扩散模型生成的心电图数据质量高,能真实反映心电图信号的复杂性和多样性。生成的数据不仅在形态上接近真实心电图,还能够包含不同程度的噪声特征,使得模型在训练过程中更具鲁棒性。

52、4.适用于多标签分类。本发明设计的标签编码器和解码器模块,能够处理多标签心电图分类任务,适应复杂的临床诊断需求。通过对标签向量的编码与解码,实现了对多种心律类型的精确生成和分类,提升了诊断的准确性。

53、5.增强了模型泛化能力。通过生成多样化的训练样本,使得模型在面对未知数据时能够更好地泛化,提升了在实际应用中的表现。扩散模型引入的噪声信号使得生成的数据具备更强的多样性,进一步增强了模型的泛化能力。

54、6.实现了数据生成的灵活可控。本发明允许用户根据需求设定特定标签和噪声等级,从而生成满足特定需求的心电图数据,充分利用了不同网络的优势,确保了生成数据的高质量和模型预测的高精度,能够使得数据增强过程更加可控和定制化,适应不同的研究和应用场景。

55、综上所述,本发明通过引入扩散模型进行心电图数据增强,提供了一种有效解决数据不平衡问题的技术方案,显著提升了心电图分类模型的性能和泛化能力,适用于孕产妇心电图数据及其他类型的心电图数据增强,具有重要的临床应用价值和科研意义。

56、本技术的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1