基于稳定扩散模型将背部照片转换成脊柱X光影像的方法

文档序号：37298425发布日期：2024-03-13 20:46阅读：33来源：国知局

本发明一种基于稳定扩散模型将背部照片转换成脊柱x光影像的方法，属于计算机视觉和医学图像分析的。

背景技术：

1、深度学习是目前应用最广的人工智能技术，它能够模拟人脑神经网络的工作方式，从大量数据中自动提取有用信息。医学是一门关乎人类健康的科学，临床上面临着各种复杂的数据和问题。将深度学习和医学结合，可以让患者在社区中享受医院的医疗服务，也可以帮助医生快速、准确地评估，制定更高效和安全的检查和治疗方案。深度学习已经在医学影像分析等领域展现了惊人的潜力和优势。

2、青少年特发性脊柱侧凸（adolescentidiopathic scoliosis，ais）是一种发生于10-18岁的三维脊柱畸形，目前病因尚未被完全揭示。它是影响青少年脊柱健康的最常见的病因，也是影响我国中小学生健康的三大问题之一，发病率仅次于近视和肥胖。ais不仅影响患者的形象和自尊，还会压迫脏器、损害呼吸、心血管、神经等系统，甚至危及生命，因此早期发现和干预ais并延缓侧凸进展的速度具有重要的临床意义。然而，在偏远地区缺乏x光检查，又不能很好地来院定期随访；且x光检查既耗时耗钱，又有辐射暴露危害，还需要配备专业的人员进行操作指导。因此，如何用低成本、无辐射、易获取的背部照片来减少对脊柱x光检查的依赖，是一个重要而困难的问题。

3、我国大部分医院只能线下检测ais。由于医疗资源分布不均，患者难以找到有经验的骨科医生，可能导致ais的诊治延误。患者到医院挂号、候诊、拍x光片等，既花费时间和金钱，又增加了交通和辐射的风险。同时，医患沟通也不顺畅，医生忙碌，患者表达不清，容易出现误诊、漏诊或医疗纠纷。如果我们能在线上做一个初筛评估，就可以节省患者的成本，提升检测的效率，大大改善偏远地区的医疗水平。

4、现有的专利申请如专利号为202110584759.9的专利，其创新点在于可以自动分析获取到的人体背部照片，提取二维背部照片和三维影像信息的特征进行分类，判断是否存在脊柱侧凸。然而，这种方法存在一些缺点，例如不够直观，评估侧凸严重程度的分类准确率不高。相比之下，我们的方法更加直观，从背部照片生成与之对应的x光影像，从而提供了更多的判断依据。

5、图像生成技术是一种能够根据输入的数据或条件，生成新图像的技术。图像生成在医学领域有很多应用，比如生成x光影像、mri影像、ct影像等，用于辅助评估、教育、研究等目的。然而，图像生成也面临着很多挑战，比如如何提高图像的质量、多样性、一致性和可控性。目前，有一些图像生成的模型在x光影像上生成效果不好，比如生成图像模糊、失真、不自然或不符合输入的要求。这些模型可能使用了生成对抗网络（gans）或变分自编码器（vaes）等技术，它们都是基于潜在变量的生成模型，需要从输入数据中学习一个隐含的概率分布，然后从这个分布中采样生成新的数据。这些技术在一些图像生成任务上表现很好，但是在x光影像上可能遇到一些困难，比如x光影像的数据量较少、数据分布较复杂、数据噪声较大等。

6、稳定扩散模型是一种新的图像生成技术，它不需要学习一个潜在变量的分布，而是通过一个反向的扩散过程，将观测到的数据逐渐转化为一个简单的先验分布，比如高斯白噪声。然后，通过一个正向的去噪过程，将先验分布逐步恢复为原始数据。这个过程可以分为很多小的步骤，每一步都使用一个神经网络来预测下一步的去噪分布。稳定扩散模型可以生成高质量、高分辨率、高多样性的图像，而且可以很容易地控制生成的图像的属性，比如文本、类别、风格等。稳定扩散模型已经在医学影像分析等领域展现了其潜力和优势，那么我们是否可以改进稳定扩散模型，使其能够成对输入背部照片和x光影像，从而更好地处理数据的噪声、细节和结构，可以更灵活地适应数据的分布和变化，可以更充分地利用输入的条件。

7、为了解决这个问题，我们提出了一种基于特征映射的稳定扩散模型的方法。

技术实现思路

1、本发明的目的在于提供一种基于稳定扩散模型将背部照片转换成脊柱x光影像的方法，以解决上述背景技术中提出的问题。它可以将背部照片转换为x光影像，从而提高脊柱侧凸的筛查质量。我们的方法通过分析背部照片，来辅助评估脊柱侧凸等疾病的严重程度。这种方法具有以下优点：高效便捷：相比于传统的x光检查，这种方法不需要患者到医院排队等候，只需要拍摄背部照片，就可以在不到一秒的时间内给出结果；无放射暴露危害：相比于x光检查，这种方法不会对患者造成任何辐射伤害，也不会增加患者患癌的风险；提高筛查覆盖率和准确率：相比于人工筛查，这种方法可以大幅提高筛查的覆盖率和准确率，尤其是对于偏远地区和资源匮乏的地区，可以实现低成本、高效率的脊柱侧凸筛查。

2、为实现上述目的，本发明提供如下技术方案：一种基于稳定扩散模型将背部照片转换成脊柱x光影像的方法，包括以下步骤：

3、步骤一：输入用户提供2049例青少年特发性脊柱侧凸（adolescentidiopathicscoliosis，ais）患者的背部照片，该图像无需特殊的设备或条件，保证背部的清晰度和完整度。

4、步骤二：将背部照片作为提示输入到稳定扩散模型中，该模型由编码器、解码器和unet组成，能够将背部照片转换为脊柱x光影像。

5、步骤三：在转换过程中，先对背部照片和x光影像进行对齐处理，使得两者的姿势和形状一致。

6、步骤四：将x光影像输入到编码器中，得到潜在的向量，通过逐渐加入噪声，将其映射到一个各向同性的高斯分布（纯噪声）。

7、步骤五：使用全连接层对背部照片特征进行提取，将背部照片映射到向量空间中。

8、步骤六：使用unet对纯噪声进行去噪，同时将背部照片的特征向量通过交叉注意力映射到unet的中间层。

9、步骤七：将去噪后的潜在向量输入解码器，得到x光影像，预测脊柱侧凸的病情。

10、步骤八：用生成的虚拟x光影像计算cobb角，并与真实的x光影像的cobb角进行比较，评估方法的有效性和准确性。

11、更进一步的，步骤一中，用户提供一张背部照片，该图像无需特殊设备或条件，只要保证背部清晰和完整。这一步的目的是获取用户的背部信息，为后续步骤做准备。用户可以用普通的相机或手机拍摄背部照片，不需要穿戴标记或传感器。用户应保持直立姿势，避免背部遮挡或倾斜。用户可以自拍或请人协助。背部照片应清晰完整，边缘和细节都能看清，不要模糊、暗淡或过曝。

12、更进一步的，步骤二中，将背部照片作为提示输入稳定扩散模型，该模型由编码器、解码器和unet组成，能将背部照片转换为x光影像。编码器将脊柱x光影像编码为潜在向量，解码器将潜在向量解码为x光影像。unet是一个带跳跃连接的卷积神经网络，它对潜在向量去噪，同时通过交叉注意力将背部照片的特征映射到unet的中间层。稳定扩散模型根据背部照片的信息，生成匹配的虚拟脊柱x光影像。

13、更进一步的，步骤三中，在转换前，先对背部照片和x光影像进行对齐，使两者姿势和形状一致。这一步的目的是消除两种图像之间的差异，提高转换的准确性和一致性。由于两种图像是在不同条件下拍摄的，它们可能有姿势和形状的差异，如角度、尺寸等。这些差异会影响稳定扩散模型的转换效果，导致生成的x光影像与真实的x光影像不一致。为了解决这个问题，我们使用了一种基于yolov8模型的目标检测和实例分割的方法，它可以自动地从两种图像中检测和分割出关键的脊柱部位。这样，我们就可以得到一组姿势和形状一致的背部照片和x光影像，作为稳定扩散模型的输入和输出。

14、更进一步的，步骤四中，将x光影像输入编码器，得到潜在向量，通过逐渐加入噪声，将其映射到一个各向同性的高斯分布（纯噪声）。这一步的目的是将观测数据转化为一个简单的先验分布，为后续的去噪和恢复做准备。编码器将x光影像编码为潜在向量，然后通过逐渐加入噪声，将其映射到一个各向同性的高斯分布（纯噪声）。这样，我们就可以将复杂的x光影像转化为一个简单的噪声图像，作为稳定扩散模型的中间状态。

15、更进一步的，步骤五中，使用全连接层对背部照片特征进行提取，可以将背部照片映射到向量空间中。这样做的主要作用是提高条件输入的鲁棒性和可控性，从而提高生成图像的质量。全连接层可以将卷积层提取的特征综合起来，从而得到更高层次的特征表示。这些特征表示可以被映射到向量空间中，使得它们可以被更好地处理和控制。这种方法可以提高生成图像的质量，使得生成的图像更加真实和自然。

16、更进一步的，步骤六中，使用unet对纯噪声进行去噪，同时通过交叉注意力将背部照片的特征映射到unet的中间层。这一步的目的是利用背部照片的信息，对纯噪声进行去噪，从而生成匹配的x光影像。交叉注意力是一种实现特征相互作用和融合的机制，它可以将背部照片的特征加权地传递给unet。

17、更进一步的，步骤七中，将去噪后的潜在向量输入解码器，得到x光影像。这一步的目的是将去噪后的潜在向量恢复为原始数据，即x光影像。解码器的结构和编码器的结构相反，它可以将潜在向量解码为x光影像。

18、更进一步的，步骤八中，用生成的x光影像自动计算cobb角，并与真实的x光影像的cobb角进行比较，评估方法的有效性和准确性。这一步的目的是利用生成的x光影像，辅助评估脊柱侧凸等疾病的严重程度。cobb角是一种测量脊柱侧凸角度的指标，它是指两个最倾斜的椎体的上下端板所形成的角度。cobb角的大小可以反映脊柱侧凸的程度，一般来说，cobb角大于10度时，可以评估为脊柱侧凸，cobb角大于40度时，需要进行手术治疗。我们使用了一种基于深度学习的目标检测的方法，它可以自动地从x光影像中检测出椎体的中心，然后计算出cobb角。我们用生成的x光影像计算出cobb角，并与真实的x光影像的cobb角进行比较，评估我们的方法的有效性和准确性。我们使用了一些评价指标，比如均方误差（mse）等。

19、本发明将背部照片输入到稳定扩散模型中，对背部照片和x光影像进行对齐处理，将x光影像输入到编码器中，使用unet对纯噪声进行去噪，同时将使用全连接层提取背部照片的特征向量通过交叉注意力映射到unet的中间层，最后用生成的x光影像自动计算cobb角，预测脊柱侧凸的病情。

20、本发明提供的技术方案具有以下技术效果：

21、1、采用基于稳定扩散模型可以利用条件输入来指导生成过程，保证图像的真实性和一致性，从背部照片生成与之对应的x光影像。相比pix2pix、cyclegan等模型，稳定扩散模型可以更好地保留图像的细节和对比度，使得生成的x光影像更清晰，更接近真实的x光影像。这样，就可以为ais疾病的评估提供更多信息和依据，帮助医生判断病人的脊柱是否有侧凸的异常现象。

22、2、让患者在家里就能获得专业的医疗服务，节省了患者就医的时间和经济成本，同时医生也可以通过网络平台远程初步查看患者的x光影像。这种方式不仅方便了ais患者，也减轻了医院的压力，提高了医疗效率。而且，通过网络平台，医生还可以与其他专家进行交流和咨询，获取更多的专业意见和建议，从而提高ais患者的治疗质量和效果。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李武军,鲁能,何中,朱泽章
技术所有人：南京大学
我是此专利的发明人

上一篇：一种液压支架阻挡式防滑装置的制作方法
上一篇：一种实况电视转播用摄像机专用摇臂的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。