基于传统影像组学的胸部增强ct图像处理方法
技术领域
1.本发明涉及医学图像处理的技术领域,尤其涉及一种基于传统影像组学的胸部增强ct图像处理方法。
背景技术:2.胸腺瘤术前影像学检查目的是初步评价肿瘤的恶性程度,推测其组织病理学改变和进行风险评估,从而辅助术前治疗方案选择及临床预后判断。然而,由于胸腺瘤发病率相对较低,目前在术前准确诊断及恶性程度风险评估方面仍面临较大的挑战。ct对于诊断前纵隔肿瘤的敏感性较高,增强ct可更好显示胸腺瘤的轮廓、边界及局部浸润性并评估其恶性程度。是用于诊断与识别的重要检查手段。
3.然而,ct影像学征象评估是基于胸腺瘤病灶本身及其与邻近周围组织结构的关系,多采用经验性、观察性指标而非量化指标,临床工作中与前纵隔其它肿瘤或瘤样病变的影像表现不乏相似而难以鉴别,因此,如何基于ct影像数据采用客观量化的方法对于胸腺瘤进行更为准确的诊断尚需进一步研究。此外,根据胸腺瘤具有不同的侵袭性生物学行为和预后情况,将其划分为低风险(a、ab及b1型)与高风险(b2及b3型)两大类别,临床工作中准确区分胸腺瘤的风险类别有助于治疗方案选择及预后评估。然而,目前传统ct影像学检查和评估尚缺乏客观、量化的评价指标,对于低风险与高风险两类胸腺瘤之间的ct影像表现多有重叠而难以准确区分。因此,如何基于增强ct影像学采用客观、量化指标,对于胸腺瘤的风险类别进行更为精确的评估,是目前胸腺瘤相关影像研究的重要内容。
技术实现要素:4.为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种基于传统影像组学的胸部增强ct图像处理方法,其能够客观量化地评价胸部增强ct图像,准确区分低风险与高风险两类胸腺瘤之间的ct影像表现,可以辅助医生的术前治疗方案选择及临床预后判断,大大提升了治疗效率和准确率。
5.本发明的技术方案是:这种基于传统影像组学的胸部增强ct图像处理方法,其包括以下步骤:
6.(1)ct图像采集:将纳入患者分为第一任务组和第二任务组,均进行ct对比增强扫描;
7.(2)手动勾画分割病灶:由两名放射科医师分别从所有患者中随机挑选一定数量病例,采用对勾画病灶后提取的影像组学特征并计算标签值的icc用于评价观察者间和观察者内对病灶勾画的一致性;
8.(3)影像组学特征提取:对原始图像进行小波滤波和高斯拉普拉斯滤波log,小波滤波分别在x,y,z三个方向组合进行高通和低通两次滤波,共得到8个小波变换图像;log滤波分别采用5个不同的sigma值得到5个log变换图像,再加上原始图像,每例病灶一共得到14个图像用于特征提取;特征提取类型包括:fos特征、glcm特征、glrlm特征、glszm特征、
ngtdm特征、gldm、3d形态特征;对于所有患者提取的影像组学特征均通过计算z值进行标准化处理;
9.(4)特征筛选:把每个特征值在两位医生勾画的病灶中计算出的结果值分别集合,计算两类集合中该特征值的icc,保留高icc的特征;对于初步筛选后的特征通过单变量分析再次进行筛选;对于经过上述两步筛选后的特征,将具有最小绝对收缩和选择算子lasso惩罚的正则化多元logistic回归应用于进一步筛选特征,并计算影像组学特征标签;
10.(5)模型构建:在训练集中采用影像组学特征标签并结合临床信息和ct影像征象作为最终的特征参数,使用多变量logistic回归分析构建预测模型,并分别在验证集中进行验证,以及对预测模型的效能进行评价。
11.本发明基于胸部增强ct图像进行影像征象分析的基础上,采用传统影像组学的研究流程和分析方法,经手动勾画分割病灶和提取病灶的影像组学特征、然后筛选最佳特征和计算影像组学标签,最后将影像组学标签结合患者相关临床资料及ct影像征象构建预测模型用于胸腺瘤的诊断及组织病理学风险评估,并分别在验证集中对预测模型进行验证和评价其预测效能,因此能够客观量化地评价胸部增强ct图像,准确区分低风险与高风险两类胸腺瘤之间的ct影像表现,可以辅助医生的术前治疗方案选择及临床预后判断,大大提升了治疗效率和准确率。
附图说明
12.图1示出了采用icc筛选稳定特征。
13.图2示出了lasso回归最终筛选特征。
14.图3示出了cr预测模型在训练集与验证集中的表现。
15.图4示出了根据本发明的基于传统影像组学对胸部增强ct图像处理方法的流程图。
具体实施方式
16.影像组学是采用流程化的计算机定量影像学分析方法,正越来越多地用于疾病的精确诊断、组织病理学分类及临床预后评估等方面。
17.本发明基于胸部增强ct图像进行影像征象分析的基础上,采用传统影像组学的流程:手动勾画病灶、提取影像组学特征、筛选特征和计算影像组学标签,最后结合患者临床资料及ct影像征象来构建预测模型用于胸腺瘤的诊断及组织病理学风险评估。
18.如图4所示,这种基于传统影像组学的胸部增强ct图像处理方法,其包括以下步骤:
19.(1)ct图像采集:将纳入患者分为第一任务组和第二任务组,均进行ct对比增强扫描;
20.(2)手动勾画分割病灶:由两名放射科医师分别从所有患者中随机挑选一定数量病例,采用对勾画病灶后提取的影像组学特征并计算标签值的组内相关系数icc(intraclass correlation coefficient)用于评价观察者间和观察者内对病灶勾画的一致性;
21.(3)影像组学特征提取:对原始图像进行小波滤波和高斯拉普拉斯滤波log
(laplacian of gaussian),小波滤波分别在x,y,z三个方向组合进行高通和低通两次滤波,共得到8个小波变换图像;log滤波分别采用5个不同的sigma值得到5个log变换图像,再加上原始图像,每例病灶一共得到14个图像用于特征提取;特征提取类型包括:fos特征、glcm特征、glrlm特征、glszm特征、ngtdm特征、gldm、3d形态特征;对于所有患者提取的影像组学特征均通过计算z值进行标准化处理;
22.(4)特征筛选:把每个特征值在两位医生勾画的病灶中计算出的结果值分别集合,计算两类集合中该特征值的icc,保留高icc的特征;对于初步筛选后的特征通过单变量分析再次进行筛选;对于经过上述两步筛选后的特征,将具有最小绝对收缩和选择算子lasso(least absolute shrinkage and selection operator)惩罚的正则化多元logistic回归应用于进一步筛选特征,并计算影像组学特征标签rs(radiomics signature);
23.(5)模型构建:在训练集中采用影像组学特征标签并结合临床信息和ct影像征象作为最终的特征参数,使用多变量logistic回归分析构建预测模型,并分别在验证集中进行验证,以及对预测模型的效能进行评价。
24.本发明基于胸部增强ct图像进行影像征象分析的基础上,采用传统影像组学的研究流程和分析方法,经手动勾画分割病灶和提取病灶的影像组学特征、然后筛选最佳特征和计算影像组学标签,最后将影像组学标签结合患者相关临床资料及ct影像征象构建预测模型用于胸腺瘤的诊断及组织病理学风险评估,并分别在验证集中对预测模型进行验证和评价其预测效能,因此能够客观量化地评价胸部增强ct图像,准确区分低风险与高风险两类胸腺瘤之间的ct影像表现,可以辅助医生的术前治疗方案选择及临床预后判断,大大提升了治疗效率和准确率。
25.基于r软件环境下(version 3.6.0,https://www.r-project.org/)使用影像组学图像分析工具包(radiomics image analysis,ria,版本1.4.2,https://cran.r-project.org/web/packages/ria/index.html)抽取影像组学特征,采用matlab软件(版本2018a,https://www.mathworks.com/)筛选影像组学特征。运用广义线性模型工具包(glmnet版本3.0-2,https://cran.r-project.org/web/packages/glmnet/index.html)进行lasso回归构建方程计算影像组学特征标签。使用spss软件(版本23.0,chicago,usa)整理所有患者一般临床资料、ct影像征象,使用stata软件(版本15.0,https://www.stata.com/)分析一般资料、各ct影像征象与患者分类变量之间的关系并进行logistic回归分析构建预测模型和roc曲线,采用敏感性、特异性和准确率评价预测结果。优选地,该方法还包括步骤(6),统计学分析:患者一般临床资料、各ct影像征象的组间比较,对于连续性变量采用独立样本t检验,对分类变量采用χ2检验或fisher’s精确检验。
26.依据患者的组织病理学检查结果和本研究中相应研究内容,对研究对象进行分组:(1)鉴别胸腺瘤与非胸腺瘤(第一任务组);(2)区分胸腺瘤组织病理学风险类别(第二任务组)。
27.优选地,所述步骤中患者ct扫描采用所述步骤(1)中,第一任务组的患者ct扫描采用16排mdct、320排mdct和256排mdct,第二任务组的患者ct扫描采用双源ct、128排mdct和二代双源ct;采用自动管电压和管电流调节技术,经肘静脉注射对比剂采用碘普罗胺注射液370mgi/ml或者碘佛醇注射液320mgi/ml,注射速率3ml/s,对比剂用量65-80ml,于注入对比剂后40s进行增强扫描;所有患者均仰卧位,双手抱头,嘱患者吸气后屏气时进行图像采
集;分别在纵隔窗和肺窗重建图像(纵隔窗窗宽400-450hu,窗位20-50hu;肺窗窗宽1000-1500hu,窗位-650-450hu);影像组学的研究基于获取在纵隔窗重建的0.5-1.25mm薄层图像进行分析。
28.手动勾画病灶将胸部ct增强图像导入到mitk软件(版本2018.04.2,www.mitk.org/wiki/mitk)并三维显示,基于增强ct图像上对病灶轮廓进行逐层识别并沿病灶边缘手动勾画,同时需要避免包括邻近的纵隔内脂肪组织、肺组织或胸壁结构。每层图像上病灶区域完整勾画,所有病灶层面全部完成勾画后保存为.nii.gz格式,文件命名与原始图像名称相对应。优选地,所述步骤(2)中,采用评价标准:icc为0.81-1.00为几乎完全一致、0.61-0.80为一致性良好、0.41-0.60为一致性中等、0.21-0.40为一致性较低以及icc为0-0.20则为一致性差或无一致性。
29.优选地,所述步骤(3)中,在第一任务组和第二任务组中采用相同方法分别提取病灶影像组学特征;在特征提取前,所有ct图像均预先经各向同性插值处理,生成像素间距为1mm的各向同性三维数据,统一作为进行灰度特征提取和滤波变换的输入图像。
30.优选地,所述步骤(4)中,设定icc阈值为0.8用于筛选特征,保留icc高于0.8的特征,去除icc低的特征;单变量分析采用双样本t检验,按保留的特征数量不超过训练集中较小样本组三分之一的标准再次筛选特征;对于经过上述两步筛选后的特征,通过强制多个参数为零进一步筛选特征。
31.优选地,所述步骤(4)中,lasso回归模型为公式(1)
[0032][0033]
其中,n是病例数量;yi例是第i个患者的标签值;n是特征数量;xij是第i个患者对应的第j个特征;βi(i=0,1,2,
…
,n)是模型参数;β0是常量;λ是正则化参数;
[0034]
使用留一法交叉验证loocv来选择λ参数的最佳值,如果某一λ时可使mse最小并曲线下面积auc最大,此时为最优λ;在最优λ的一个标准误差处λ1se重复特征选择过程以使模型中包含的最终特征数量达到稳定水平;在回归方程中按其各自的系数对所选特征进行加权计算影像组学特征标签rs,回归方程为公式(2)
[0035][0036]
其中,y是患者预测结果值,值为0或1;β0是常量;n是模型中特征数量;βi(i=0,1,2,
…
,n)是模型参数,xj是特征;λ是正则化参数;ε是误差项。
[0037]
优选地,所述步骤(4)中,
[0038]
基于lasso回归结果的变量与系数,采用公式(3)分别计算第一任务组和第二任务组的计算影像组学特征标签cr:
[0039][0040]
其中,rs是标签值;β0是常量;n是保留的特征数量;xi是特征,βi(i=0,1,2,
…
,n)是对应特征的系数。
ngtdm-coarseness,前者是沿x-y-z方向进行低通-低通-高通滤波时的一阶特征,后者是沿x-y-z方向进行低通-低通-低通滤波时的ngtdm特征。基于这些最终保留的特征构建的影像组学标签,推测在第一任务组与第二任务组中分别反映了经小波变换后胸腺瘤与非胸腺瘤、低风险与高风险胸腺瘤组间特定数字化特征的差异。本研究在训练集及验证集中对于第一任务组与第二任务组的影像组学标签值进行组间比较,结果均具有统计学意义,此外在训练集预测模型中变量系数权重最高,因此,影像组学标签具有较高的分类鉴别能力。
[0046]
本研究对于第一任务组胸腺瘤与非胸腺瘤的分类诊断,在训练集中模型的auc为0.7936,对于第二任务组鉴别胸腺瘤的风险类别,在训练集中模型的auc为0.8094;在验证集中task1模型的auc为0.7025,task2模型的auc为0.7930,在验证集中两类模型除敏感性略高于训练集外,特异性和准确率都略降低。这些结果与以往研究结果类似,推测基于训练集构建的预测模型可能因存在不同程度的过拟合而导致验证集的auc有不同程度降低,此外,因验证集与训练集中病例固有特征的差异性而导致敏感性较高,但具体原因尚有待进一步研究。两类模型经hl检验均具有较好拟合优度,hl检验是用来评价观测数与依照某种假设或分布模型计算得到的理论数之间一致性的一种统计假设检验。因此,本研究中传统影像组学模型具有较好的拟合优度,表明模型的拟合值与实际观测数的吻合程度较高。
[0047]
综上所述,本发明基于胸部增强ct图像进行影像征象分析的基础上,采用传统影像组学的方法计算影像组学标签;对于鉴别胸腺瘤与非胸腺瘤,采用影像组学标签结合患者合并mg的数量及病灶的轮廓构建预测模型,对于区分胸腺瘤的风险类别采用影像组学标签结合病灶的轮廓、血管包绕≥50%、胸腔积液构建预测模型,对于两类模型在验证集中分别进行验证并评价模型的效能。本发明的结果为鉴别胸腺瘤及区分其组织学风险类别提供了影像学的客观依据和量化评价方法,有利于辅助临床胸腺瘤诊断和治疗方案的选择。
[0048]
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。