1.一种基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征在于,具体步骤如下:
步骤一.图像分割
采用基于卷积神经网络(CNN)的磁共振影像分割方法,CNN网络中包括4层卷积层,2层池化层,2层全连接层,对CNN结构做了如下调整:一是将临近层的磁共振图像信息送入CNN网络中,即将相邻层的信息引入到当前层的训练中,实现输入信息的三维化,使得网络对体积较小的胶质瘤也能得到较好的分割结果;二是将全连接的条件随机场(CRF)被作为后处理环节加入到胶质瘤的图像分割中,使得网络对对比度低的低级别胶质瘤也有很好的分割效果;
CRF后处理环节的具体实现为,将CNN的最后一个全链接层的输出作为P(xi),计算如下能量函数:
θu(xi)=-logP(xi) (1)
任意两个像素间的势计算如下:
其中,核函数如下式所示:
式中,up(xi+xj)计算是否两点是否相似,pi和Ii代表像素i在CNN网络中的位置和灰度;在CNN分割结果的基础上,每层中具有最大相似度的区域被标定为肿瘤区域;
步骤二.特征提取
特征包括位置特征、灰度特征、形状特征、和纹理特征;
位置特征提取,首先将分割后的肿瘤配准到标准脑图集,标准脑图集采用MN152,配准方法采用MNI提供的SPM12软件;采用AAL方法将标准脑图集划分为116个感兴趣区域AVOI;对配准到MN152的胶质瘤,统计其落于116个AVOIs的情况,若肿瘤落在某个AVOI的体素量大于10则认为该胶质瘤在此AVOI,记为1,否则记为0;于是对每个病例得到116个0和1相间的字符串表示该胶质瘤在全脑的分布情况;
对IDH1突变型和野生型胶质分别统计在全脑发生的情况,通过独立样本T检验和U检验统计两类胶质瘤位置分布的统计差异;将每个病例的位置分布表作为116个位置特征用于后继的影像组学分析;
除了提取116个位置特征外,还提取灰度特征21个,形状特征15个,纹理特征39个;,对灰度特征和纹理特征共60个特征进行三维小波分解,得到480个小波特征;
步骤三.特征筛选
对上述671个高通量特征,采用两步特征筛选法进行特征选择:第一步,基于独立样本t检验,选出p<0.05即有统计差异的特征,此步骤中共选择特征197个;第二步,采用改进的遗传算法对197个特征进行进一步筛选,得到110个特征;
其中所述改进的遗传算法,是在原遗传算法中改用一种基于最小冗余-最大相关(mRMR)准则的适应度函数,具体如下:
在特征空间Ω内,已选特征子集S内特征间的最小冗余定义为:
S与目标类别c间的最大相关定义为:
则mRMR准则定义为:
基于mRMR准则的适应度函数定义为:
其中,Accuracy为使用S所获得的分类准确率,Rank表示所选择特征的mRMR排序值之和;
步骤四.分类判决
将遗传算法选出的110个特征送入分类器进行IDH1状态预测,分类器采用经典的支持向量机和AdaBoost算法进行分类。
2.根据权利要求1所述的基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征在于,所述671个特征列表如下:
位置特征,共11个,统计肿瘤出现在AAL共116个分区的出现情况;
灰度特征,共21个,具体为:1)能量,2)直方图的熵,3)峰值,4)最大值,5)平均绝对误差,6)平均,7)中值,8)最小值,9)灰度范围,10)均方根,11)歪斜度,12)标准差,13)直方图均匀度,14)方差,15)高斯拟合的参数a,16)高斯拟合的参数b,17)高斯拟合的参数c,18)直方图均值,19)直方图方差,20)直方图歪斜度,21)直方图峰值;
形状特征,共15个,具体为:1)紧密度1,2)紧密度,3)最长距离,4)不对称度,5)类球度,6)表面积,7)表面积体积比,8)体积,9)面积边界框比,10)最长的椭圆长轴,11)最短的椭圆短轴,12)离心率,13)方向,14)紧致度,15)傅里叶描述子;
纹理特征,共39个,其中:
灰度共生矩阵,有8个,具体为:1)能量,2)对比度,3)相关度,4)同质性,5)方差,6)平均值之和,7)熵,8)不同度;
灰度行程矩阵,有13个,具体为:11)灰度不均匀性,12)长线不均匀性,13)长线百分比,14)低灰度值的线度量,15)高灰度值的线长度,16)短线的低灰度值的线度量,17)短线的高灰度值的线度量,18)长线的低灰度值的线度量,19)长线的高灰度值的线度量,20)灰度值方差,21)长线方差;
灰度区域大小矩阵,有13个,具体为:22)小区块度量,23)大区块度量,24)灰度不均匀性,25)区块不均匀性,26)区块百分比,27)低灰度值的区块度量,28)高灰度值的区块度量,29)小区域的低灰度值的区块度量,30)小区域的高灰度值的区块度量,31)大区域的低灰度值的区块度量,32)大区域的高灰度值的区块度量,33)灰度值方差,34)区块大小方差;
领域灰度矩阵,有5个,具体为:35)粗糙度,36)对比度,37)忙碌度,38)复杂度,39)强度;
小波,共480个,为小波三个方向的8个高频低频分量。
3.根据权利要求2所述的基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征采用采用留一法交叉验证(LOOCV)作为验证模型,并用七个量化指标对预测性能进行定量化评价,分别为:准确度、敏感度、特异度、阳性预测值、阴性预测值、Matthew相关系数,另外,ROC曲线下的面积作为整体评估准则。
4.一种基于权利要求1、2或3所述预测方法的胶质瘤分子标记物IDH1无损预测系统,其特征在于,包括四个模块:图像分割模块,特征提取模块,特征筛选模块,分类判决模块,分别用于执行预测方法的图像分割、特征提取、特征筛选、分类判决四个步骤的操作运算;其中,图像分割模块包括上述公式(1)-(4)的运算;特征提取模块分为位置特征提取子模块、灰度特征提取子模块、形状特征提取子模块、纹理特征提取子模块、小波分解计算子模块,分别用于执行置特征提取、灰度特征提取、形状特征提取、纹理特征提取、小波分解计算的操作运算;这些子模块中包含附录1中对应的计算公式。