一种基于卷积神经网络的癌症边界智能识别方法

文档序号:24622839发布日期:2021-04-09 20:28阅读:149来源:国知局
一种基于卷积神经网络的癌症边界智能识别方法

本发明涉及数据处理分析技术领域,具体涉及一种基于卷积神经网络的癌症边界智能识别方法。



背景技术:

目前,对于癌症边界的判断主要依赖于窥镜呈像,通过观察组织状态判断组织器官癌症边界,这样的判断方式极容易导致经过后续的治疗后,无法彻底清除癌细胞组织,癌症复发,或是过多的切除了正常组织,导致身体机能受影响。



技术实现要素:

为了解决现有技术中癌症边界定位不准的问题,本发明提供一种基于卷积神经网络的癌症边界智能识别方法,包括以下步骤:

(1)采集已知癌症组织的拉曼光谱并进行预处理;

(2)构建并训练基于卷积神经网络的模型;

(3)采集癌症区域的拉曼光谱数据,判断癌症边界。

进一步地,步骤(1)中所述采集已知癌症的光谱的方法为,采集每个已知样品三个不同位置的拉曼光谱数据,每次采集20s。

进一步地,步骤(1)中所述预处理包括数据截取、平滑处理、荧光背景消除和归一化处理;

所述数据截取的范围是600cm-1至1800cm-1

进一步地,步骤(2)中所述训练基于卷积神经网络的模型的方法为,将预处理后的数据用于训练,并将其作为一维信号输入,光谱强度作为一维特征,根据医院病理学分析设定标签,将预处理过的光谱数据进行随机排序,然后输入卷积神经网络。

进一步地,所述基于卷积神经网络的模型是基于改进的神经网络模型,可以将输入的光谱数据进行自动特征提取,所述神经网络模型的最后一层采用全连接层,可以预测所测组织是否为癌症组织。

与现有技术相比,本发明的有益效果是:

本发明提供一种基于卷积神经网络的癌症边界智能识别方法,该方法使用拉曼光谱识别装置采集癌症组织样本的光谱数据,构造深度学习的卷积神经网络模型,使用采集到的拉曼光谱数据对模型进行训练,得到成熟的卷积神经网络模型,使用训练后的卷积神经网络模型对癌症区域进行识别,可以准确的判断癌症边界,以便进行准确的癌症组织切除。

附图说明

图1为本实施例中癌症边界智能识别方法的流程图;

图2为本实施例中卷积神经网络结构示意图。

具体实施方式

通过参考示范性实施例,本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。

在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。下面通过具体的实施例对本发明的一种基于卷积神经网络的癌症边界智能识别方法进行说明:

如图1所示,为本实施例中一种基于卷积神经网络的癌症边界智能识别方法的流程图,该智能识别方法包括以下步骤:

1、采集已知癌症组织的拉曼光谱并进行预处理

使用光纤拉曼设备获取已知癌症组织的拉曼光谱,对获取的拉曼光谱进行预处理操作,获得数据样本,同时根据病理学检验结果对数据进行标定。具体包括如下步骤:

(1)在封闭环境中使用光纤拉曼设备获取不同已知癌症组织样品的拉曼光谱数据,测量每个样品的三个不同位置,每个光谱的采集时间为20s。采用oceanoptics公司的拉曼光谱仪获取不同组织的光谱数据,为了在实验中模拟手术中灯光对数据采集的影响,整个光谱均采用暗室和光照双重采集。

(2)对拉曼光谱数据进行平滑处理,使用savitzky-golay方法来达到降噪的目的,使用了最小二乘法拟合。其包括以下步骤:

a、采用最小二乘法,用于多项式拟合,用以减小平滑对有效的光谱信息造成干扰,最小二乘拟合的表达式如下:

式中是savitzky-golay用于拟合xi后得到的拟合值,xi表示整体数据,xi表示一组数据,a0,a1,a2是二项方程系数。

b、为了求得ai的值,采用最小二乘法,如下所示:

时可得到二项式系数;

其中,ε表示误差平方和,i表示数据中的某一个点,j表示当前的数据,n表示数据范围。

(3)对处理过的光谱数据进行归一化处理:

其中,n为总波长数,xnormal表示归一化后数值。

2.构建并训练基于卷积神经网络的模型

构建卷积神经网络模型,使用经过预处理的数据对其进行训练,其过程包括:

(1)将上述预处理过的数据与对应的标签作为输入,对模型进行正式训练。

(2)本模型采用前向传播,如图2所示,步骤如下:

a、通过一层卷积层,提取光谱数据特征:

其中xi和yj分别是第i个输入映射和第j个输出映射。kij是映射i和j之间的卷积核,*表示卷积,bj是第j个映射的偏置参数;

b、通过一层池化层,可以提炼特征,减少模型规模,送入最大池化层,其中,卷积层输出映射yi中的每个神经元汇集在池化层输入映射xi中的sxs非重叠区域上:

其中,s表示范围,m表示范围中的量;

c、再添加一层卷积层和池化层,进一步提炼特征,增加分类的准确度。

通过损失函数对训练好的模型进行评价,损失函数采用交叉熵,表示如下:

其中,xn是训练光谱,tn是第n个样本的真实标签,yn是第n个样本的网格预测,其中#c是分类c中的样本数。n是样本总数,k是类别总数,w表示权重。

3、采集癌症区域的拉曼光谱数据,判断癌症边界。

结合这里披露的本发明的说明和实践,本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的,本发明的真正范围和主旨均由权利要求所限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1