基于证据调和的不确定性医学图像分布外数据检测方法

文档序号:40934507发布日期:2025-02-14 21:47阅读:21来源:国知局
基于证据调和的不确定性医学图像分布外数据检测方法

本发明涉及计算机医学图像处理领域。


背景技术:

1、传统分类任务中,模型均假设:训练数据与测试数据独立同分布(i.i.d.,independent identically distributed),即训练数据与测试数据相互独立且特征分布相同。在此假设下,拟合了训练集样本特征的模型能够在测试集上取得相似的性能,但这种假设是十分理想化的,大大简化了算法对鲁棒性的要求。在各类实际应用中模型在训练集与测试集表现的不匹配现象已经表明这种假设在绝大多数情况下是不可靠的。特别是在医学辅助诊断中,训练数据与测试数据的特征分布偏移极有可能导致疾病误诊,并为患者带来极大的风险。近年来,深度神经网络已广泛应用于各种医学应用,如分类和分割任务,达到最先进的性能。然而,鉴于传统神经网络对预测结果过度自信引起的潜在风险,具有不确定性估计(uncertainty estimation)的深度学习方法因其能够保证模型在存在分布外(out-of-distribution)测试样本下的稳定性,从而变得越来越重要。

2、基于不确定性估计的分布外检测方法,如证据深度学习及其变体,已经在计算性能、效率和可扩展性方面显示出其优势。在该类方法中,较高的不确定性代表测试样本与训练数据存在更大差异,更有可能属于分布外样本。然而,这些研究中的大多数都考虑识别与训练样本存在显著差异的异常样本,例如采集自然图像作为医学影像数据的分布外样本。这些方法忽略了医学影像中固有的近分布外(near out-of-distribution)问题。在这种情况下,由于训练数据的不完备,测试数据中可能存在不属于任何训练类别的近分布外样本。对这些近分布外样本的误诊在临床应用中会导致错误的治疗方案同时构成极高的风险。最近一些基于密度模型、预处理和离群暴露的近分布外样本检测方法已被提出。然而,这些方法都容易受到训练集质量的影响,并存在计算复杂度高、收敛困难等问题,在实际应用中的可靠性往往得不到保证。


技术实现思路

1、本发明的目的在于克服现有技术方法中,辅助诊断对训练数据完备性的强依赖、深度学习模型对诊断结果的过度自信、不确定性度量不准确等问题,在证据神经网络(evidential neural network)框架下提出一种基于证据调和的不确定性医学图像分布外数据检测方法。其中辅助诊断方法主要分为两个步骤,分别是:调和证据生成,分类预测及分布外检测。

2、本发明技术方案:

3、基于证据调和的不确定性医学图像分布外数据检测方法,包括步骤:

4、步骤1数据集、模型准备:

5、1.1从医院、在线公开数据集中收集影像和对应的类别标签,经过预处理、数据清洗、整理后构建分类影像数据集,包括训练数据、测试数据。

6、1.2收集自然影像数据集上训练完毕的预训练神经网络,用于图像特征提取。

7、1.3构建证据调和神经网络,该网络包括预训练神经网络、证据生成模块、证据调和模块,它们依次连接构成。

8、步骤2训练优化:

9、2.1将步骤1.1获取的训练影像数据使用预训练神经网络进行特征提取。

10、2.2将步骤2.1中得到的特征经过证据生成模块生成原始证据。

11、2.3通过证据调和模块对步骤2.2中得到的原始证据进行调和校正,得到调和证据表示。

12、2.4利用步骤2.3中得到的调和证据生成迪利克雷分布。

13、2.5结合步骤1影像数据集中的类别标签计算调和双伽马证据损失作为评价指标。

14、2.6冻结预训练神经网络参数,并对证据生成模块、证据调和模块进行训练。

15、步骤3针对测试数据的影像类别预测和分布外检测:

16、3.1将测试数据输入已训练的证据调和神经网络,得到调和证据以及对应的迪利克雷分布。

17、3.2由步骤3.1中迪利克雷分布导出测试样本的分类预测、不确定性度量。

18、3.3比较预设的阈值与步骤3.2中不确定性度量值的大小关系,判定样本是否属于分布外样本。

19、3.3.1若不确定性度量值大于阈值,则判定为分布外样本,请求医学专家介入。

20、3.3.2若不确定性度量值小于阈值,则判定为分布内样本,输出分类预测。

21、本发明的有益效果是:

22、本发明提出的基于证据调和的不确定性医学图像分布外数据检测方法对传统不确定性证据方法中得到的证据进行了校正,提高了分布外样本的检出能力,增强了医学辅助诊断的可信性。本发明中的不确定性度量可以作为决策依据,有效降低医学辅助诊断中因训练数据不完备导致的误诊风险,对证据的校准可以有效提高模型对分布外样本的识别效果,作为医学辅助诊断方案,可为医生的后续治疗提供可信的辅助依据。



技术特征:

1.基于证据调和的不确定性医学图像分布外数据检测方法,其特征在于,包括步骤:

2.如权利要求1所述的方法,其特征在于,所述步骤1,具体包括:

3.如权利要求1所述的方法,其特征在于,所述步骤2,具体包括:

4.如权利要求1所述的方法,其特征在于,所述步骤3,具体包括:

5.如权利要求4所述的方法,其特征在于,所述步骤3.3,具体包括:


技术总结
本发明涉及计算机医学图像处理领域,提出了基于证据调和的不确定性医学图像分布外数据检测方法。该方法包括步骤:对输入的医学影像进行特征提取并生成特定证据表示,导出对应预测结果、不确定性度量,对分布外样本进行识别。本发明易于实现,对传统方法中得到的证据进行了校正,提高了分布外样本的检出能力,增强了医学辅助诊断的可信性。利用本发明可以有效降低医学辅助诊断中因训练数据不完备导致的误诊风险,并且不影响原网络的计算复杂度。将来应用:缓解医学辅助诊断中的过度自信问题,为医生诊断提供可信的依据。

技术研发人员:陈宇飞,付巍
受保护的技术使用者:同济大学
技术研发日:
技术公布日:2025/2/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1