基于CBNet模型的乳腺肿瘤良恶性智能识别与预测系统及方法

文档序号:32307867发布日期:2022-11-23 10:35阅读:47来源:国知局
基于CBNet模型的乳腺肿瘤良恶性智能识别与预测系统及方法
基于cbnet模型的乳腺肿瘤良恶性智能识别与预测系统及方法
技术领域
1.本发明属于ai辅助的智慧医疗领域,具体涉及一种基于cbnet模型的乳腺肿瘤良恶性智能识别与预测系统及方法。


背景技术:

2.乳腺疾病是现阶段危害女性健康的主要疾病之一,包括乳腺炎症性疾病、乳腺良性病变、乳腺恶性肿瘤等。其中乳腺肿瘤是最常见的乳腺疾病,约占乳腺疾病的2/3。乳腺肿瘤包括乳腺良性肿瘤、恶性肿瘤和乳腺其他疾病,各占乳腺肿瘤的1/3左右。近年来,乳腺癌已成为我国女性仅次于宫颈癌的第二大高发疾病,并且乳腺癌发病率处于快速上升阶段,因此对乳腺肿瘤的诊断和治疗受到很多人的重视。乳腺癌只要早期发现,治愈率很高,保乳几率也很高,而由于拖延,导致延误了治疗,保乳几率也就大大降低。相对肺癌、胃癌等癌症,乳腺癌更易防治、治愈,早期乳腺癌的五年生存率可达90%以上,发现越晚,生存率和保乳希望就越低。因此,精准、定期的筛查至关重要,通过早筛手段和规范化、个体化综合治疗,能有效的降低乳腺癌死亡率。乳腺肿瘤的影像学诊断有钼靶摄片检查和超声检查等,这些检查能在一定程度上判断肿瘤的良恶性,但判断精度不高,需要结合多个指标综合考虑。
3.乳腺钼靶x线摄影检查是目前国内外常见的乳腺肿瘤筛查手段,医生需要花费大量的精力进行多图比对诊断,在乳腺腺体致密丰富的情况下,准确辨别腺体和病变是一个不小的挑战。为了更好的实现肿瘤图像的分类,人们将计算机技术和有关的核方法引入到医学领域中,通过引入计算机技术和核方法就可以对这些图像进行快速准确的分类,从而提高其对疾病的诊断水平。
4.近年来,深度学习已经被广泛应用于医疗领域,在过去几十年中显示出巨大的潜力。深度学习通过层层网络抽取高度抽象化的特征表达,更能学习数据全面的本质特征,这种多层非线性结构也正是其具备强大的特征表达能力和对复杂任务建模能力的原因。值得注意的是,深度学习属于典型的

黑箱模型’,虽然它具有强大的特征学习能力,但是人们并不了解他是如何学习的,这也是限制深度学习进一步发展的一大问题。另一方面,随着网络层数的加深,网络的复杂度和过拟合的风险也随着增加,会对肿瘤的检测精度造成影响,不能很好的辅助临床医生诊断。


技术实现要素:

5.为了解决现有技术的不足,本发明旨在提供一种基于cbnet模型的乳腺肿瘤良恶性智能识别与预测系统,利用cbnet的独特优势展现出优良的检测效果,通过自定义参数功能最大限度地提高良/恶性肿瘤自动检测与识别准确性和可扩展性,极大地提高了临床医生的肿瘤样片统计效率与识别准确度。
6.为了实现上述目的,本发明采用的技术方案为:
7.基于cbnet模型的乳腺肿瘤良恶性智能识别与预测系统,包括以下模块:
8.图片检测功能模块:用于导入肿瘤图片,设置相应参数,并对导入的图片进行自动检测和识别,将结果保存为相应图像特征数据;
9.cbnet特征提取与识别模块:用于将保存处理后的图像特征数据依据提取的特征进行良/恶性肿瘤的分类识别;
10.模型参数调整功能模块:用于对置信度进行调整,同时为用户提供了导入自己所拥有训练权重的接口;
11.显示和保存检测识别详细信息功能模块:用于显示和保存识别后的肿瘤图像特征数据的详细结果;
12.语言设置功能模块:用户可通过菜单栏的设置语言按钮对系统语言进行中英文切换。
13.相应的,本发明还提出了基于cbnet模型的乳腺肿瘤良恶性智能识别与预测方法,包括以下步骤:
14.1)对采集得到的乳腺钼靶x线摄影图像数据集进行去模糊,再将图像数据集分别按一定的比例分为训练集和测试集;
15.2)对训练集的图像进行训练,计算每次迭代的网络模型的损失函数值,直至损失函数值收敛到最小,保存训练后的网络模型;
16.3)载入训练好的网络模型,指定网络中具体一层的输出作为网络模型最终提取的特征,然后将这些特征作为catboost模型的输入数据进行智能分类;
17.4)通过模型参数调整功能模块,用户可以参与参数调整,对测试集进行检测:若用户认同肿瘤的检测与识别结果,则停止调整参数,保存数据;若存在异议,则用户可以根据需要,不断调整模型参数,直至达到用户满意模型的识别结果为止;
18.5)通过显示和保存检测识别详细信息功能模块进行信息显示和保存。
19.其中,步骤1)具体包括:
20.(1-1)利用x射线设备采集乳腺钼靶x线摄影图像数据集;
21.(1-2)读取采集后的图像,用lucy-richardson算法对图像进行去模糊,并对图像尺寸进行调整;
22.(1-3)分按照用户指定的图像数量比例分为训练集、验证集和测试集,并保存为对应的xml标记文件。
23.步骤(1-2)中lucy-richardson算法对图像去模糊的具体计算方法为:
[0024][0025]
其中f(x,y)表示原始图像,n为迭代次数,g(x,y)表示退化后的图像,h(x,y)是退化函数的空间描述,符号“*”表示空间卷积。
[0026]
步骤2)具体包括:
[0027]
(2-1)读取步骤1)的训练集,并对图像尺寸进行调整;
[0028]
(2-2)设置训练集所需的迭代轮数为p,一次读入肿瘤图像数量为q张,其中p≥1,q≥1;
[0029]
(2-3)采用softmax分类器,接受全连接层输出的特征,然后输出为输入目标对应的标签的概率值映射后的分类预测结果,并计算每轮迭代的网络模型的损失函数值。
[0030]
(2-4)重复步骤(2-3),直至得到的损失函数值最小,并保存训练好的模型。
[0031]
步骤3)中选定其最后一层全连接层的输出作为网络模型最终提取的特征。具体包括:
[0032]
用x,y分别表示第l个残差单元的输入和输出,x表示从图像中提取的特征值(x先由图像中提取得到,再作为残差单元的输入进行下一个过程),y表示图像分类标签;f是残差函数,表示这个残差单元学习到的残差,w1和w2分别表示这个单元的两次卷积参数;激活函数relu用σ表示,则该网络学习到的残差为:
[0033]
f(x)=w2σ(w1x)
[0034]
h是恒等映射,即h(x)=x,计算第l个残差单元的输出y:
[0035]
y=σ(f(x)+h(x))=σ(w2σ(w1x)+x)
[0036]
将最后一层的普通分类层softmax层替换为分类性能更好的集成树模型catboost;集成树模型catboost为训练样本生成s+1个随机序列σ0,σ1,...,σs(s=0,1,2,...);其中σ1,...,σs用来构建决策树,σ0用来选择叶子节点的值;
[0037]
集成树模型catboost模型主要包括以下两个过程:
[0038]
建立一棵树:在算法的每次迭代t中,从{σ1,...,σs}中采样一个随机排列σr(r=1,

s),并在此基础上构建一个树t
t

[0039]
计算叶值:给定树t
t
,解决有监督学习任务的常用方法是最小化损失函数:
[0040][0041]
其中,f(x)是预测值,yi是真实值,l是损失函数,wi是第i个样本xi的权重,j(f)采用l2正则约束项;
[0042]
给定一个候选树f,记ai=f(xi),将损失函数在点a
t-1
=f
t-1
(x)泰勒展开:
[0043][0044][0045][0046][0047]
其中,φ是带求的叶值,||φ||2是对φ的l2正则约束,λ是正则化参数。
[0048]
那么叶值φ
leaf
的最优值是:
[0049][0050]
对于分类问题,集成树模型catboost选择常用的logloss作为分类损失函数,具体公式见下:
[0051]
[0052]
其中,ci是真实值,pi是预测值,wi是第i个样本xi的权重。
[0053]
步骤5)中显示和保存检测识别详细信息功能模块显示内容有:对肿瘤识别得到的肿瘤长、宽表型信息,对目标模型计算得到的病变位置,分类精度。
[0054]
步骤5)中用户自己选择保存的内容有:保存检测结果图,保存肿瘤识别图,保存肿瘤excel数据。
[0055]
本发明具有的有益效果为:
[0056]
1.本发明旨在解决临床医生对肿瘤的识别与分析,将检测识别后的肿瘤的详细信息以图像、excel文件的形式保存到相应位置,方便用户对肿瘤样片中肿瘤进行分析,通过自定义参数功能最大限度地提高良/恶性肿瘤自动检测与识别准确性和可扩展性,极大地提高了临床医生的肿瘤样片统计效率与识别准确度。系统的肿瘤图像的批量处理功能满足了用户多方面检测的需求。
[0057]
2.本发明基于该检测与识别方法的检测与识别系统界功能多样,操作简便,界面人性化,适合各类用户的使用。
附图说明
[0058]
图1为本发明系统主界面;
[0059]
图2为本发明乳腺肿瘤检测识别展示界面;
[0060]
图3为本发明乳腺肿瘤识别流程图;
[0061]
图4为本发明量化打分系统及合成诊断报告界面
具体实施方式
[0062]
如图1-4所示,本发明提出了一种基于cbnet模型的乳腺肿瘤良恶性智能识别与预测系统,将深度学习的特征表示学习能力与集成树模型的解释能力进行优势互补,构建了一个良/恶性乳腺肿瘤智能识别与预测系统cbnet模型,在提高良恶性肿瘤的检测精度与效果的同时,增强结果的可解释性,更好地辅助临床医生诊断。具体包括以下模块:
[0063]
图片检测功能模块:点击图片检测按钮,进入到单图检测页面,用户可在此界面导入乳腺肿瘤钼靶图片,并设置相应参数,点击开始检测按钮,系统将会对导入图片进行自动检测和识别,数据会显示在界面,点击保存按钮即可将结果保存为相应数据。
[0064]
cbnet特征提取与识别模块:用户导入检测图片的文件夹即可完成对文件夹中肿瘤图片的检测,并将自动保存处理后的图像特征数据并依据提取的特征进行良/恶性肿瘤的分类识别。通过搭建人性化的界面与简洁方便的系统,实现了对肿瘤图片、批量图片识别的功能。
[0065]
模型参数调整功能模块:用户可通过菜单栏对置信度进行调整,同时为用户提供了导入自己所拥有训练权重的接口。
[0066]
显示和保存检测识别详细信息功能模块:用于显示和保存识别后的肿瘤图像特征数据的详细结果。
[0067]
语言设置功能模块:用户可通过菜单栏的设置语言按钮对系统语言进行中英文切换,提供中、英两种语言,扩大了使用人群的范围。
[0068]
本系统提供的良/恶性乳腺肿瘤智能识别,可深度挖掘图片特征,对肿瘤样本进行
批量处理,显著提高了工作效率,对探索智慧医疗的新发展具有重要意义,实现了对良/恶性乳腺肿瘤的智能分类,识别效果以及检测效率优势明显,对智慧诊断的发展起到积极推动作用。
[0069]
相应的,本发明还提出基于cbnet模型的乳腺肿瘤良恶性智能识别与预测方法,具体包括以下步骤:
[0070]
1)对采集得到的乳腺钼靶x线摄影图像数据集进行去模糊,再将图像数据集分别按一定的比例分为训练集和测试集。具体包括:
[0071]
(1-1)利用医院专业x射线设备采集乳腺钼靶x线摄影图像数据集;
[0072]
(1-2)读取采集后的图像,由于设备拍摄的视野有限且仪器的晃动或聚焦都对照片或视频的清晰度有影响,因此用lucy-richardson算法对图像进行去模糊,并对图像尺寸进行调整。
[0073]
其中lucy-richardson算法对图像去模糊的具体计算方法为:
[0074][0075]
其中f(x,y)表示原始图像,n为迭代次数,g(x,y)表示退化后的图像,h(x,y)是退化函数的空间描述,符号“*”表示空间卷积。
[0076]
本发明使用lucy-richardson加速算法迭代了10次(即k=10)来得到去模糊图像。
[0077]
(1-3)分按照用户指定的图像数量比例分为训练集、验证集和测试集,并保存为对应的xml标记文件。
[0078]
2)对训练集的图像进行训练,计算每次迭代的网络模型的损失函数值,直至损失函数值收敛到最小,保存训练模型。具体包括:
[0079]
(2-1)读取步骤1)的训练集,并对图像尺寸进行调整;
[0080]
(2-2)设置训练集所需的迭代轮数为p,一次读入肿瘤图像数量为q张,其中p≥1,q≥1;
[0081]
(2-3)采用softmax分类器,接受全连接层输出的特征,然后输出为输入目标对应的标签的概率值映射后的分类预测结果,并计算每轮迭代的网络模型的损失函数值。
[0082]
(2-4)重复步骤(2-3),直至得到的损失函数值最小,并保存训练好的resnet50网络模型。
[0083]
3)载入训练好的resnet50网络模型,指定网络中最后一层全连接层的输出作为网络模型最终提取的特征,然后将这些特征作为catboost模型的输入数据进行智能分类。具体包括:
[0084]
构建肿瘤数据深层表示学习分类模型cbnet。在训练网络模型时,梯度反向传播时相乘可能使梯度趋于无穷小,会存在梯度消失的问题,而且随着设计深度神经网络的层数不断加深,普通网络在传递信息时一般会存在部分信息丢失的问题,准确率反而下降的情况时常出现。而深度残差网络resnet从某种程度上能解决网络难以优化的问题,保护了传递信息的完整性。一个深度残差网络由多个残差单元构成,残差单元所具有的独特结构能有效避免梯度消失的问题,并且具有强大的学习能力,能够挖掘图片数据中隐藏的深层信息。
[0085]
用x,y分别表示第l个残差单元的输入和输出,x表示从图像中提取的特征值,y表
示图像分类标签。这里,x先由图像中提取得到,再作为残差单元的输入进行下一个过程。f是残差函数,表示这个残差单元学习到的残差,w1和w2分别表示这个单元的两次卷积参数;激活函数relu用σ表示,则该网络学习到的残差为:
[0086]
f(x)=w2σ(w1x)
[0087]
h是恒等映射,即h(x)=x,计算第l个残差单元的输出y:
[0088]
y=σ(f(x)+h(x))=σ(w2σ(w1x)+x)
[0089]
resnet包含不同层数的一系列的网络模型,我们根据数据特点和层数过深带来的过拟合风险,最终选择resnet50作为网络基本框架。该网络总共50层,其中49个卷积层和1个全连接层。
[0090]
为了进一步提高分类精度和结果的可读性,将最后一层的普通分类层softmax层替换为分类性能更好的集成树模型catboost。集成树模型catboost为训练样本生成s+1个随机序列σ0,σ1,...,σs(s=0,1,2,...);其中σ1,...,σs用来构建决策树,σ0用来选择叶子节点的值。
[0091]
在catboost中,生成了训练数据集的随机排列,并且使用多种排列来增强算法的鲁棒性:对一个随机排列进行抽样,并在其基础上获得梯度。使用不同的排列来训练不同的模型,因此使用几种排列不会导致过拟合。同时其基学习器为对称树结构,这进一步避免了算法的过拟合,同时也大幅度的减少了模型运行速度,提高了运算效率。
[0092]
集成树模型catboost模型主要包括以下两个过程:
[0093]
建立一棵树:catboost使用对称树作为基本预测器,在整个树种使用相同的分割标准,这种树是平衡的,不易过拟合,并且可以快速评分。在算法的每次迭代t中,从{σ1,...,σs}中采样一个随机排列σr(r=1,

s),并在此基础上构建一个树t
t
。catboost提供了两种模式“plain”,“ordered”,通过实验发现,在前一种模式下可以获得更好的分类精度,同时测试时间相较于后者有明显优势。于是选择了“plain”模式。
[0094]
计算叶值:给定树t
t
,解决有监督学习任务的常用方法是最小化损失函数:
[0095][0096]
其中,f(x)是预测值,yi是真实值,l是损失函数,wi是第i个样本xi的权重,j(f)采用l2正则约束项;
[0097]
给定一个候选树f,记ai=f(xi),将损失函数在点a
t-1
=f
t-1
(x)泰勒展开:
[0098][0099][0100][0101][0102]
其中,φ是带求的叶值,||φ||2是对φ的l2正则约束,λ是正则化参数。
[0103]
那么叶值φ
leaf
的最优值是:
[0104][0105]
对于分类问题,集成树模型catboost选择常用的logloss作为分类损失函数,具体公式见下:
[0106][0107]
其中,ci是真实值,pi是预测值,wi是第i个样本xi的权重。
[0108]
4)通过模型参数调整功能模块,用户可以参与参数调整,对测试集进行检测:若用户认同肿瘤的检测与识别结果,则停止调整参数,保存数据;若存在异议,则用户可以根据需要,不断调整模型参数,直至达到用户满意模型的识别结果为止。
[0109]
5)通过显示和保存检测识别详细信息功能模块进行信息显示和保存。其中,显示和保存检测识别详细信息功能模块显示内容有:对肿瘤识别得到的肿瘤长、宽表型信息,对目标模型计算得到的病变位置,分类精度。用户自己选择保存的内容有:保存检测结果图,保存肿瘤识别图,保存肿瘤excel数据。
[0110]
本发明率先将卷积神经网络和catboost集成树模型结合构建成特征表示学习能力强且具有良好可解释性的catnet网络,并用于乳腺肿瘤良/恶性智能检测与识别。本发明利用数字图像处理技术,支持将输入系统的病人乳腺图像进行分析、计算、处理,得出相关的有效数据。使用这套辅助诊断系统,就可以借助最新的计算机技术,对图片的可疑之处或者说是病变的地方用数字化的方法予以实现,并通过专门的方法来提取其主要特征,从而做出有关的信息报告。然后由经验丰富的专家根据其对肿瘤图像的了解判断其症状。通过使用这种方法可以大大减小误诊率,使患者能够得到早期应有的治疗。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1