基于影像组学的脑胶质瘤分子标记物无损预测方法和预测系统与流程

文档序号:11922133阅读:来源:国知局

技术特征:

1.一种基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征在于,具体步骤如下:

步骤一.图像分割

采用基于卷积神经网络(CNN)的磁共振影像分割方法,CNN网络中包括4层卷积层,2层池化层,2层全连接层,对CNN结构做了如下调整:一是将临近层的磁共振图像信息送入CNN网络中,即将相邻层的信息引入到当前层的训练中,实现输入信息的三维化,使得网络对体积较小的胶质瘤也能得到较好的分割结果;二是将全连接的条件随机场(CRF)被作为后处理环节加入到胶质瘤的图像分割中,使得网络对对比度低的低级别胶质瘤也有很好的分割效果;

CRF后处理环节的具体实现为,将CNN的最后一个全链接层的输出作为P(xi),计算如下能量函数:

θu(xi)=-logP(xi) (1)

<mrow> <mi>E</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>i</mi> </munder> <msub> <mi>&theta;</mi> <mi>u</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> </munder> <msub> <mi>&theta;</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

任意两个像素间的势计算如下:

<mrow> <msub> <mi>&theta;</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&mu;</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </msubsup> <msup> <mi>&omega;</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <msup> <mi>k</mi> <mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

其中,核函数如下式所示:

<mrow> <mi>k</mi> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mi>&omega;</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </msup> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <msup> <mrow> <mo>|</mo> <mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mrow> <mn>2</mn> <msubsup> <mi>&sigma;</mi> <mi>&alpha;</mi> <mn>2</mn> </msubsup> </mrow> </mfrac> <mo>-</mo> <mfrac> <msup> <mrow> <mo>|</mo> <mrow> <msub> <mi>I</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>I</mi> <mi>j</mi> </msub> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mrow> <mn>2</mn> <msubsup> <mi>&sigma;</mi> <mi>&beta;</mi> <mn>2</mn> </msubsup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> <msup> <mi>&omega;</mi> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </msup> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mfrac> <msup> <mrow> <mo>|</mo> <mrow> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> </mrow> <mo>|</mo> </mrow> <mn>2</mn> </msup> <mrow> <mn>2</mn> <msubsup> <mi>&sigma;</mi> <mi>&gamma;</mi> <mn>2</mn> </msubsup> </mrow> </mfrac> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

式中,up(xi+xj)计算是否两点是否相似,pi和Ii代表像素i在CNN网络中的位置和灰度;在CNN分割结果的基础上,每层中具有最大相似度的区域被标定为肿瘤区域;

步骤二.特征提取

特征包括位置特征、灰度特征、形状特征、和纹理特征;

位置特征提取,首先将分割后的肿瘤配准到标准脑图集,标准脑图集采用MN152,配准方法采用MNI提供的SPM12软件;采用AAL方法将标准脑图集划分为116个感兴趣区域AVOI;对配准到MN152的胶质瘤,统计其落于116个AVOIs的情况,若肿瘤落在某个AVOI的体素量大于10则认为该胶质瘤在此AVOI,记为1,否则记为0;于是对每个病例得到116个0和1相间的字符串表示该胶质瘤在全脑的分布情况;

对IDH1突变型和野生型胶质分别统计在全脑发生的情况,通过独立样本T检验和U检验统计两类胶质瘤位置分布的统计差异;将每个病例的位置分布表作为116个位置特征用于后继的影像组学分析;

除了提取116个位置特征外,还提取灰度特征21个,形状特征15个,纹理特征39个;,对灰度特征和纹理特征共60个特征进行三维小波分解,得到480个小波特征;

步骤三.特征筛选

对上述671个高通量特征,采用两步特征筛选法进行特征选择:第一步,基于独立样本t检验,选出p<0.05即有统计差异的特征,此步骤中共选择特征197个;第二步,采用改进的遗传算法对197个特征进行进一步筛选,得到110个特征;

其中所述改进的遗传算法,是在原遗传算法中改用一种基于最小冗余-最大相关(mRMR)准则的适应度函数,具体如下:

在特征空间Ω内,已选特征子集S内特征间的最小冗余定义为:

<mrow> <mi>min</mi> <mi> </mi> <mi>R</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>)</mo> </mrow> <mo>,</mo> <mi>R</mi> <mo>=</mo> <mfrac> <mn>1</mn> <msup> <mi>m</mi> <mn>2</mn> </msup> </mfrac> <msub> <mo>&Sigma;</mo> <mrow> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>S</mi> </mrow> </msub> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>;</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

S与目标类别c间的最大相关定义为:

<mrow> <mi>max</mi> <mi> </mi> <mi>D</mi> <mrow> <mo>(</mo> <mi>S</mi> <mo>,</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>,</mo> <mi>D</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <msub> <mo>&Sigma;</mo> <mrow> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>S</mi> </mrow> </msub> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>;</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

则mRMR准则定义为:

<mrow> <msub> <mi>max</mi> <mrow> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msub> <mi>&Omega;</mi> <mi>S</mi> </msub> </mrow> </msub> <mo>{</mo> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>;</mo> <mi>c</mi> <mo>)</mo> </mrow> <mo>-</mo> <mfrac> <mn>1</mn> <mi>m</mi> </mfrac> <msub> <mo>&Sigma;</mo> <mrow> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <mi>S</mi> </mrow> </msub> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>d</mi> <mi>i</mi> </msub> <mo>;</mo> <msub> <mi>d</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

基于mRMR准则的适应度函数定义为:

<mrow> <msub> <mi>Fitness</mi> <mrow> <mi>m</mi> <mi>R</mi> <mi>M</mi> <mi>R</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>A</mi> <mi>c</mi> <mi>c</mi> <mi>u</mi> <mi>r</mi> <mi>a</mi> <mi>c</mi> <mi>y</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <mi>R</mi> <mi>a</mi> <mi>n</mi> <mi>k</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>+</mo> <mi>A</mi> <mi>c</mi> <mi>c</mi> <mi>u</mi> <mi>r</mi> <mi>a</mi> <mi>c</mi> <mi>y</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

其中,Accuracy为使用S所获得的分类准确率,Rank表示所选择特征的mRMR排序值之和;

步骤四.分类判决

将遗传算法选出的110个特征送入分类器进行IDH1状态预测,分类器采用经典的支持向量机和AdaBoost算法进行分类。

2.根据权利要求1所述的基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征在于,所述671个特征列表如下:

位置特征,共11个,统计肿瘤出现在AAL共116个分区的出现情况;

灰度特征,共21个,具体为:1)能量,2)直方图的熵,3)峰值,4)最大值,5)平均绝对误差,6)平均,7)中值,8)最小值,9)灰度范围,10)均方根,11)歪斜度,12)标准差,13)直方图均匀度,14)方差,15)高斯拟合的参数a,16)高斯拟合的参数b,17)高斯拟合的参数c,18)直方图均值,19)直方图方差,20)直方图歪斜度,21)直方图峰值;

形状特征,共15个,具体为:1)紧密度1,2)紧密度,3)最长距离,4)不对称度,5)类球度,6)表面积,7)表面积体积比,8)体积,9)面积边界框比,10)最长的椭圆长轴,11)最短的椭圆短轴,12)离心率,13)方向,14)紧致度,15)傅里叶描述子;

纹理特征,共39个,其中:

灰度共生矩阵,有8个,具体为:1)能量,2)对比度,3)相关度,4)同质性,5)方差,6)平均值之和,7)熵,8)不同度;

灰度行程矩阵,有13个,具体为:11)灰度不均匀性,12)长线不均匀性,13)长线百分比,14)低灰度值的线度量,15)高灰度值的线长度,16)短线的低灰度值的线度量,17)短线的高灰度值的线度量,18)长线的低灰度值的线度量,19)长线的高灰度值的线度量,20)灰度值方差,21)长线方差;

灰度区域大小矩阵,有13个,具体为:22)小区块度量,23)大区块度量,24)灰度不均匀性,25)区块不均匀性,26)区块百分比,27)低灰度值的区块度量,28)高灰度值的区块度量,29)小区域的低灰度值的区块度量,30)小区域的高灰度值的区块度量,31)大区域的低灰度值的区块度量,32)大区域的高灰度值的区块度量,33)灰度值方差,34)区块大小方差;

领域灰度矩阵,有5个,具体为:35)粗糙度,36)对比度,37)忙碌度,38)复杂度,39)强度;

小波,共480个,为小波三个方向的8个高频低频分量。

3.根据权利要求2所述的基于影像组学的胶质瘤分子标记物IDH1无损预测方法,其特征采用采用留一法交叉验证(LOOCV)作为验证模型,并用七个量化指标对预测性能进行定量化评价,分别为:准确度、敏感度、特异度、阳性预测值、阴性预测值、Matthew相关系数,另外,ROC曲线下的面积作为整体评估准则。

4.一种基于权利要求1、2或3所述预测方法的胶质瘤分子标记物IDH1无损预测系统,其特征在于,包括四个模块:图像分割模块,特征提取模块,特征筛选模块,分类判决模块,分别用于执行预测方法的图像分割、特征提取、特征筛选、分类判决四个步骤的操作运算;其中,图像分割模块包括上述公式(1)-(4)的运算;特征提取模块分为位置特征提取子模块、灰度特征提取子模块、形状特征提取子模块、纹理特征提取子模块、小波分解计算子模块,分别用于执行置特征提取、灰度特征提取、形状特征提取、纹理特征提取、小波分解计算的操作运算;这些子模块中包含附录1中对应的计算公式。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1