本发明涉及医学图像处理,尤其涉及一种基于多模态影像组学的肿瘤风险分层方法及系统。
背景技术:
1、肿瘤组织活检技术是一种在临床实践中被广泛应用于确定癌症患者风险水平的有创筛查技术,该技术需要对患者在进行局部麻醉的情况下,将带针芯的引导针刺入患者病灶部位以获取到潜在的肿瘤组织样本用于进一步检测。然而,由于肿瘤组织的高度异质性和成像设备的低分辨率,使该技术不仅带来约20%-30%的假阴性率,同时也给患者带来出血性休克和伤口感染的风险。
2、针对现有组织活检技术的缺点,本发明提出一种基于多模态影像组学的肿瘤风险分层方法,解决现有技术在肿瘤风险分层上存在的较高假阴性率,以及有创筛查带来的潜在风险;本发明所提出的方法采用了癌症患者的多模态高通量影像组学特征,构建了基于多模态融合影像组学特征的风险分层预测模型,在提高肿瘤风险分层的灵敏度和特异性的同时,避免了有创筛查给患者带来的潜在负担。
技术实现思路
1、本技术的目的是提供一种基于多模态影像组学的肿瘤风险分层方法及系统,旨在解决现有技术在肿瘤风险分层上存在的较高假阴性率,以及有创筛查带来潜在风险的问题。
2、为实现上述目的,本技术提供如下技术方案:
3、本技术提供一种基于多模态影像组学的肿瘤风险分层方法,包括:
4、根据患者的临床医学信息勾画肿瘤的感兴趣区域;
5、提取感兴趣区域中的影像组学特征;
6、对所述影像组学特征进行筛选后获取更新的影像组学特征;
7、将所述更新的影像组学特征输入风险分层预测模型进行训练,得到肿瘤风险预测模型。
8、进一步的,在根据患者的临床医学信息勾画肿瘤的感兴趣区域的步骤中,所述临床医学信息包括临床医学图像以及对应的肿瘤风险分层标签,所述临床医学图像通过不同的医学成像设备的扫描获取,所述医学成像设备包括但不限于ct、mr及pet,所述临床医学图像的模态不少于2种不同的类别;所述肿瘤风险分层标签根据患者放射治疗前的原始病理数据,采用对应的肿瘤风险分层标签信息,并构建训练数据库。
9、进一步的,在提取感兴趣区域中的影像组学特征的步骤中,所述影像组学特征包括基于形状的特征、基于统计直方图的特征、纹理特征、基于模型的特征以及基于数学变换的特征;
10、基于3d形状的特征定义为:
11、球形度:
12、不成球形比例:
13、其中v为以mm3为单位的网格体积,a表示为以mm2为单位的网格表面积;
14、基于2d形状的特征定义为:
15、球形度:
16、不成球形比例:
17、其中a为以mm2为单位的网格表面积,p为以mm为单位的网格周长;
18、基于统计直方图的特征为:
19、熵:
20、偏度:
21、均匀性:
22、其中所述感兴趣区域的总体素的数量为np,x为包含在所述感兴趣区域中的一组体素,p(i)为具有离散的一阶灰度直方图,p(i)为归一化后的一阶灰度直方图,ng是非0窗宽的数量,ε是一个任意的正数,等于2.2×10-16。
23、进一步的,在对所述影像组学特征进行筛选后获取更新的影像组学特征的步骤中,包括以下步骤:
24、剔除所述影像组学特征具有冗余信息的特征,并筛选出最有利于肿瘤风险分层预测的影像组学特征;
25、对筛选后的新特征进行斯皮尔曼相关系数评估;
26、对系数评估后的影像组学特征采用特征递归消除减少影像组学特征数量。
27、进一步的,在剔除所述影像组学特征具有冗余信息的特征,并筛选出最有利于肿瘤风险分层预测的影像组学特征的步骤中,具体包括下述步骤:
28、通过标准化函数将每一个特征中的特征值进行标准化,公式为:
29、
30、其中μ为所述影像组学特征中特征值的均值,σ为该特征值的标准差,x和xnew分别为标准化前后的数值;通过公式将所述影像组学特征转换为均值为0、标准差为1的标准正态分布的新特征。
31、进一步的,在对筛选后的新特征进行斯皮尔曼相关系数评估的步骤中,具体包括下述步骤:
32、计算任意两组影像组学特征之间的斯皮尔曼相关系数:
33、
34、di=ri-si,
35、其中ri和si分别为两组影像组学特征当中任一样本的观测数值,和分别为两组影响组学特征在样本集上的平均数,n为风险分层预测模型中肿瘤患者的个数;若其中任何一组特征具有大于0.75的相关系数,则保留具有与其他n-2个特征较低平均相关性的特征,且同时丢弃另一个影像组学特征。
36、进一步的,在对系数评估后的影像组学特征采用特征递归消除减少影像组学特征数量的步骤中,具体包括下述步骤:
37、采用特征递归消除影像组学特征的数量,在10折交叉验证,评分模型选择线性回归模型,根据评分模型的结果,选取最高评分对应的影像组学特征数量下的特征输入风险分层预测模型进行训练。
38、进一步的,所述将所述更新的影像组学特征输入风险分层预测模型进行训练,得到肿瘤风险预测模型的步骤中,包括以下步骤:
39、采用最小绝对值收缩和选择算子作为待训练的风险分层预测模型例证,选择算子通过迭代确定惩罚项因子进行优化损失函数,损失函数的公式为:
40、
41、其中m为样本的数量,w,b分别为模型中影像组学特征对应的系数和模型的截距,和yi分别为模型的真实标记和模型的预测数值,n为迭代计算的次数;当损失函数j最小时,对应的λ为模型的参数。
42、进一步的,在所述风险分层预测模型的训练中,得到影像组学特征的集合x={x1,x2,x3,...,xn},及对应影像组学特征的权重系数集合w={w1,w2,w3,......,wn},w≠0;通过参数λ、影像组学特征集合x、权重系数集合w和阈值分割点α,得到最佳肿瘤风险预测模型f(x):
43、
44、其中f(x)输出为1则表示预测结果为高风险患者,输出为0则表示预测结果为非高风险患者。
45、本技术还提供一种基于多模态影像组学的肿瘤风险分层系统,包括:
46、勾画模块:根据患者的临床医学信息勾画肿瘤的感兴趣区域;
47、提取模块:提取感兴趣区域中的影像组学特征;
48、筛选模块:对所述影像组学特征进行筛选后获取更新的影像组学特征;
49、训练模块:将所述更新的影像组学特征输入风险分层预测模型进行训练,得到肿瘤风险预测模型。
50、本技术提供一种设备,所述设备包括处理器、与所述处理器耦接的存储器,其中,所述存储器存储有用于实现一种基于多模态影像组学的肿瘤风险分层方法的程序指令;所述处理器用于执行所述存储器存储的所述程序指令以实现多模态影像组学的肿瘤风险分层。
51、本技术提供一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行一种基于多模态影像组学的肿瘤风险分层方法。
52、本技术提供了一种基于多模态影像组学的肿瘤风险分层方法及系统,具有以下有益效果:
53、(1)本技术通过根据患者的临床医学信息勾画肿瘤的感兴趣区域,采用了多模态医学图像,提取感兴趣区域中的影像组学特征;基于成像生物标志物标准化倡议所定义的影像组学特征,发明了具有高度鲁棒性的肿瘤风险分层预测模型;
54、(2)通过评估组学特征间的相关系数及特征递归消除方法,提供了一种快速,稳定且高效的肿瘤风险影像组学特征筛选方案,筛选出最有利于肿瘤风险分层预测的影像组学特征,保证了模型选取特征在特定病种上的稳定性及可靠性,具有较高的临床应用价值;
55、(3)根据高通量的影像组学特征,构建基于多模态融合特征的风险分层预测模型,在提高前列腺癌风险分层的灵敏度和特异性的同时,避免了有创筛查给患者带来的潜在负担。