基于细胞核DNA分析的细胞分析方法、计算机设备、存储介质与流程

文档序号:26053979发布日期:2021-07-27 15:30阅读:198来源:国知局
基于细胞核DNA分析的细胞分析方法、计算机设备、存储介质与流程

本发明涉及一种细胞分析方法,尤其涉及一种基于细胞核dna分析的细胞分析方法、计算机设备、存储介质。



背景技术:

生物体的许多病变都会造成正常细胞的异变,因而,在临床上,经常需要借助对生物样本的镜检结果来确定组织或生物体是否发生病变。

随着ai技术的发展,在细胞分析工作中也越来越多的依赖ai技术来实现,但是,现有的利用ai技术进行生物样本的分析工作还普遍存在如下问题:样本图像数据处理准确率不高,易于造成分析误差;现有的生物样本分析结果中,大多只输出阳性和阴性的输出结果,对于中间状态的生物样本则属于分析盲区,因而,对分析结果的准确率有一定影响,易于出现医疗人员的漏诊、误诊等问题。



技术实现要素:

为了解决上述技术问题,本发明提供了一种基于细胞核dna分析的细胞分析方法、计算机设备、存储介质。利用本发明的方法,能高效、准确地对拍摄得到的生物样本的图像,并可通过第一外观形态判断步骤快速地获得异常细胞信息,随后再通过第二外观形态判断步骤确保对异常细胞的判断结果准确,利用本发明的方法能够提高细胞分析结果的准确度和灵敏度,并可提高医务人员对于疾病的诊断效率,降低误诊、漏诊率。

本发明的基于细胞核dna分析的细胞分析方法包括:第一外观形态判断步骤和第二外观形态判断步骤,所述第一外观形态判断步骤通过获取细胞核面积大小的参数实现,并经其定义为dna参数1,对dna参数1分别预设阈值a、阈值b和阈值c,并将dna参数1划分为四个数值范围,由此将待分析的细胞分为四类:①正常细胞,dna参数1≤阈值a;②可疑异常细胞,阈值a<dna参数1≤阈值b;③高度可疑异常细胞,阈值b<dna参数1≤阈值c;④阳性异常增生细胞,dna参数1>阈值c,所述dna参数1的计算和分析是通过预训练的神经网络实现的;所述神经网络包括输入层、隐含层和输出层,所述神经网络的输出层输出对应所述离体生物样本的不同物理或病理性质的多个评分,以最高评分对应的物理或病理性质作为离体生物样本的物理或病理性质;所述神经网络包括第一神经网络模块、第二神经网络模块个分类器,所述第一神经网络模块为darknet-53网络,所述第二神经网络模块包括5个交替出现的卷积层、relu层、池化层、bn+leakyrelu层和卷积层,所述分类器采用lr逻辑回归分类器。

进一步的,所述神经网络的预训练步骤为:将用于训练的样本分为阳性和可疑两类;所述神经网络的输出层被构造为在预设评分范围内的分数进行分类,以评分>阈值c为最优方案的样本认定为阳性,b<评分≤c为最优方案的样本被认定为高度可疑,以a<评分≤b为最优方案的样本认定为可疑;以评分<a的样本认定为阴性。

进一步的,在第一外观形态判断步骤前,还包括待分析的细胞的图像的获取和预处理步骤,将细胞在显微镜下经不同倍数放大后,经显微镜自动对焦并获取待分析的细胞图像后,并对目标图片中的细胞核进行定位与识别,并利用标记框将细胞核进行标记,同一类型的细胞的标记框采用同一颜色进行标记,任意两种类型的细胞的标记框的颜色均不相同。

更进一步的,待分析的细胞的图像为离体生物样本的图像,待分析的细胞为人体脱落细胞,通过对其进行拍照即得到待分析的离体生物样本的图像。人体脱落细胞包括不限于:子宫颈细胞、胸水细胞、腹水细胞、痰液细胞、尿液细胞、支气管冲洗液细胞,穿刺针吸细胞,脑脊液细胞、腔体冲洗液细胞等人体脱落细胞。细胞染色包括不限于:巴氏染色、he染色、苏木素染色、吉姆萨染色、瑞氏染色、甲苯胺蓝染、feulgen染色等。

更进一步的,所述离体生物样本的图像是按照如下步骤得到:将离体生物样本在显微镜同一视野下拍摄一组图片,并将各幅图片分别分割成r(红)、g(绿)、b(蓝)三个通道,利用其中任意两个通道得出第一复合图像,分别将各幅图片相对第一复合图像进行求取方差运算并得出方差值variance_value,分别对每一副图片的方差值进行比较,选取相对于第一复合图像的方差值最大的图片为该组图片的第一目标图片。

更进一步的,所述离体生物样本的图像是通过将同一视野下多张不同层级的所述第一目标图片进行融合后得到的,其按照如下步骤得到:将一张所述第一目标图片定义为a(x,y),将其上一张图片定义为a_pre(x,y),下一张图片定义为a_next(x,y),定义融合后的图像为fuse_image(x,y),分别将三幅图像在点(x,y)处的像素值设定为a(x,y).value,a_pre(x,y).value和a_next(x,y).value,以3x3区域进行比较,分别对三张第一目标图片的3x3区域像素值的和进行计算得到a_add_value,a_pre_add_value和a_next_add_value,将值最大的照片的对应在点(x,y)处的像素值赋给fuse_image(x,y).value,遍历整幅图像后即为融合后的图像。

更进一步的,对细胞核进行定位与识别,通过yolov3算法定位细胞核位置并分割该细胞核,对分割后的细胞核图像进行通道分离,得出红通道图像r(x,y)、绿通道图像g(x,y)、蓝通道图像b(x,y),并利用任意两个通道的图像复合得到第二复合图像,对第二复合图像求取其meanvalue,将第二复合图像的每个像素与mean_value做差,新的像素值等于第二复合图像的像素-mean_value,在新的像素值大于0时,对其赋值255,在新的像素值小于0时,对其赋值为0,据此得出二值化图像threshold(x,y),对threshold(x,y)图像求出凸包,并求出凸包面积,最后找出最大的面积即为细胞核的面积。

更进一步的,所述第二外观形态判断步骤包括:将待分析的细胞图像从rgb图像空间投影到hsv颜色空间,获取图像的色调参数信息,将色调参数信息与预设的包括了不同色调参数与物理或病理性质的对应关系的色调特征模板相比较,并给出阳性、高度疑似、疑似及不符合的概率。

本发明还提供了一种计算机设备,其包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如前所述方法的步骤。

本发明还提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如前所述方法的步骤。

本发明具有如下有益效果:

1、利用本发明的基于细胞核dna分析的细胞分析方法能对生物样本的图像进行高效而又准确的处理,因而确保在后续步骤中进行细胞分析时具有较高的准确度;

2、利用本发明的方法首先利用细胞核面积大小作为第一评判指标,因而能够快速、灵敏地捕获细胞核面积大小异常的细胞,极大提高了对异常细胞的判断的敏感度与准确率;

3、利用本发明的方法分析得到的细胞图像可通过对不同类型的细胞使用不同颜色的标记框,便于医务人员进行分析和观察,提高工作效率;

4、利用本发明的方法兼顾了对细胞分析的速度和准确度,既可提高分析的敏感性又能提高了分析的特异性,从而解决不同类型脱落细胞学的分析诊断的敏感性与特异性问题,既可提供准确率高的阴性结果,又可提供准确率高的阳性结果,即高特异高敏感的排阴率和排阳率,因而能够提高对细胞的分析效率,减少诊断医生的工作量。

附图说明

图1为本发明实施例一的神经网络的框架图;

图2为本发明实施例一的神经网络中第一神经网络模块的结构示意图;

图3为本发明实施例一的神经网络中第二神经网络模块的结构示意图;

图4为利用本发明实施例一的方法进行细胞分析前的样本图像;

图5为利用本发明实施例一的方法进行细胞分析后的样本图像。

具体实施方式

下面结合具体实施方式对本发明的技术方案作出说明。

在本发明中,“离体”指的是从动物或人体中将目标生物分离到体外环境,无论是通过手术或取样或呕吐物等进行的分离;“生物样本”泛指病原微生物或组织细胞,病原微生物包括但不限于:非细胞型微生物,如:主要包括病毒和朊粒等;原核细胞型微生物,如:细菌、立克次体、衣原体、支原体、螺旋体等;真核细胞型微生物,如:包括真菌、原虫、寄生虫(原虫、蠕虫、医学昆虫)及其虫卵等。组织细胞包括但不限于:组织切片及各种细胞。

在本发明中,图像可以通过各种医学图像采集装置获取。例如对于各种传染病的检测,可以通过显微镜成像的方法获得生物样本的显微图像。图像也可以是通过超声设备、x线设备、核磁共振设备、核医学设备、医用光学设备以及热成像设备等途径获取得到。

本发明的实施例中,图像可以为二维图像,也可以为三维图像。图像可以为灰度图像或二值化图像,也可以为彩色图像。

本发明的图像可以是通过生物显微镜观察得到的离体生物样本的图像。

本发明的“细胞核dna分析”是指通过细胞的dna对细胞核面积带来的影响,并通过细胞核面积大小对细胞进行分析。

实施例一:

本发明的基于细胞核dna分析的细胞分析方法包括下述步骤:

s1:获得离体生物样本的图像;

s2:分析所述图像中离体生物样本中的生物的第一外观形态以判断所述离体生物样本的物理或病理性质;

s3:分析所述图像中离体生物样本中的生物的第二外观形态以判断所述离体生物样本的物理或病理性质;

s4:得到所述离体生物样本的细胞分析结果。

在步骤s1中的图像可以是原始未经染色的生物样本的图像,也可以是经染色后的生物样本。

对生物样本的染色方法可以采用任意现有技术中的染色方式,如可以采用萎-尼氏抗酸染色(在显微镜下结核杆菌被染色成红色,其它非结核杆菌染色蓝色)、金胺o荧光抗酸染色(显镜微下结核杆菌被染成金黄色荧光,其它非结核杆菌为无色或黑背景),以便在图像中具有更好的可辨识性。

生物样本的图像的分辨率可以根据需要进行适当处理,例如分辨率可以是416*416或256*256等。

本发明的离体生物样本包括不限于:子宫颈细胞、胸水细胞、腹水细胞、痰液细胞、尿液细胞、支气管冲洗液细胞,穿刺针吸细胞,脑脊液细胞、腔体冲洗液细胞等人体脱落细胞。细胞染色包括不限于:巴氏染色、he染色、苏木素染色、吉姆萨染色、瑞氏染色、甲苯胺蓝染、feulgen染色等。将离体生物样本在显微镜下经不同倍数放大后,经显微镜自动对焦并获取待分析的细胞图像后,并对目标图片中的细胞核进行定位与识别。

待分析的细胞图像通过如下步骤获得:将离体生物样本在显微镜同一视野下拍摄的一组图片的各幅图片分别分割成r(红)、g(绿)、b(蓝)三个通道,利用其中任意两个通道复合得出第一复合图像,本实施例以b(蓝)通道和g(绿)的复合为例,利用b-g得出新的图像b_g,分别将各幅图片相对图像b_g进行求取方差运算并得出方差值variance_value,分别对每一副图片的方差值进行比较,选取相对于图像b_g的方差值最大的图片为该组图片的第一目标图片。待分析的细胞图像是通过将同一视野下多张不同层级的所述第一目标图片进行融合后得到的,其按照如下步骤得到:将一张所述第一目标图片定义为a(x,y),将其上一张图片定义为a_pre(x,y),下一张图片定义为a_next(x,y),定义融合后的图像为fuse_image(x,y),分别将三幅图像在点(x,y)处的像素值设定为a(x,y).value,a_pre(x,y).value和a_next(x,y).value,以3x3区域进行比较,分别对三张第一目标图片的3x3区域像素值的和进行计算得到a_add_value,a_pre_add_value和a_next_add_value,将值最大的照片的对应在点(x,y)处的像素值赋给fuse_image(x,y).value,遍历整幅图像后即为融合后的图像。对离体生物样本进行拍摄时可以采用多种不同的放大倍数分别进行拍摄。

分析所述图像中离体生物样本中的生物的第一外观形态以判断所述离体生物样本的物理或病理性质。本实施例的步骤s2包括:将步骤s1获得的图像输入到预训练的神经网络中,所述神经网络包括输入层、隐含层和输出层,所述神经网络的输出层输出对应所述离体生物样本的不同物理或病理性质的多个评分,以最高评分对应的物理或病理性质作为离体生物样本的物理或病理性质。

本发明的神经网络可以是现有技术中的卷积、池化、全连接、残差、激励、正则化、张量拼接等一个或多个功能层中的连接,每个功能层所要执行的功能为本领域技术人员所知悉。卷积层可以用于执行卷积操作,提取输入的图像(例如,尺寸为227×227)的特征信息以得到特征图featuremap(例如,尺寸为13×13);池化层可以对输入的图像进行池化操作,例如最大值合并(max-pooling)方法,均值池化(mean-pooling)方法等;激活层通过激活函数引入非线性因素,例如采用性修正单元(relu、leaky-relu、p-relu、r-relu)函数、s型函数(sigmoid函数)或双曲正切函数(tanh函数)等。全连接层用于将卷积输出的特征图转换为一维向量。损失函数用于在神经网络训练时通过评估预测值f(x)与真实值y的不一致程度,例如可以是log对数损失函数、平方损失函数、指数损失函数、hinge损失函数等。

根据具体要执行的功能,可以使用多种类型的神经网络,例如可以采用深度卷积神经网络cnn,如lenet、alexnet、vgg等抽取图像中的特征并通过softmax、svm等分类器输出对图像物理或病理性质的分类结果。

参见附图1-3所示,本实施例的预训练的神经网络包括第一神经网络模块、第二神经网络模块、分类器,其中第一神经网络模块为darknet-53网络,第二神经网络模块包括5个交替出现的卷积层、relu层、池化层、bn+leakyrelu层和卷积层,所述分类器采用lr逻辑回归分类器。

darknet-53网络将生物样本图像采用多尺度融合的方法得到每张图像对应的三个不同尺寸的特征图,并采用k-means聚类算法对标注数据集进行维度聚类得到多个不同尺寸大小的先验框(anchorbox),通过k-means聚类进行bbox预测,采用多个logistic回归对anchor包围的部分进行一个目标评分(找出评分最高的即为最终预测类别)。

第一神经网络模块包括一个卷积层和依次连接的五个残差模块,第一残差模块包括一个卷积层和一个残差单元,第二残差模块包括一个卷积层和两个残差单元,第三残差模块包括一个卷积层和八个残差单元,第四残差模块包括一个卷积层和八个残差单元,第五个残差模块包括一个卷积层和四个残差单元,每个残差单元包括两个卷积层和一个残差连接层,五个残差模块通过resnet跳层连接方式进行连接。其中,第四残差模块和第五残差模块的输出端输入到同一个第一张量拼接层concat,第三残差模块的输出端输入到另一第二张量拼接层concat;其中,第五残差模块输出卷积处理后(conv2d)得到第一特征图,第四残差模块的输出端在第二张量拼接层和第五残差模块的输出经过上采样处理合并输出卷积处理后(conv2d)得到第二特征图;第三残差模块的输出端在张量拼接层和第一张量拼接层的输出经过上采样处理合并后输出卷积处理后

(conv2d)得到第三特征图。

第二神经网络模块包括5个交替出现的卷积层conv、relu层、池化层pooling、dbl层和卷积层conv。

所述分类器采用lr逻辑回归分类器,使用了logistic回归来对第一神经网络模块每个anchor包围的内容和第二神经网络模块输出的特征图进行了一个目标性评分(objectnessscore),评分最高的即为最终预测类别。

本发明通过yolov3算法定位细胞核位置并分割该细胞核,对分割后的细胞核图像进行通道分离,得出红通道图像r(x,y)、绿通道图像g(x,y)、蓝通道图像b(x,y),利用其中任意两个通道的图像复合得到第二复合图像,本实施例以b(x,y)-g(x,y)复合得出新的图像b_g(x,y),对b_g(x,y)图像求出其均值mean_value;b_g(x,y)的每个像素与mean_value做差,新的像素值等于(b_g(x,y)的每个像素-mean_value,在新的像素值大于0时,对其赋值为255;在新的像素值小于0时,对其赋值为0,据此得出二值化图像b_g_threshold(x,y),对b_g_threshold(x,y)图像求出凸包,并求出凸包面积,最后找出最大的面积即为细胞核面积大小,由此得到dna参数1。

本发明根据细胞核面积大小对细胞进行分类和标记(参见附图4和5所示):①dna参数1≤阈值a时,细胞核为正常二倍体细胞核,对这类细胞不进行标记,此类细胞为正常细胞;②阈值a<dna参数1≤阈值b时,通常为轻中度增生或鳞化细胞,该细胞核为在二倍体与三倍体之间的细胞核,对这类细胞采用黄色框进行标记,此类细胞为可疑异常细胞;③阈值b<dna参数1≤阈值c时,细胞核为三倍体到四倍体之间的细胞核,通常为重度增生或异常增生细胞,对这类细胞采用紫红色框进行标记,此类细胞为高度可疑异常细胞;④dna参数1>阈值c时,细胞核四倍于正常细胞二倍体细胞核,对这类细胞采用红色框进行标记,此类细胞为阳性异常增生细胞。

作为本实施例的一种优选的实施方式,在步骤s2中还包括通过训练以形成所述预训练的神经网络的步骤。将用于训练的样本图像分为阳性和可疑两类;所述神经网络的输出层被构造为在预设评分范围内的分数进行分类,以评分≥95%为最优方案的样本认定为阳性,75%≤评分<95%为最优方案的样本被认定为高度可疑,以50%≤评分<75%为最优方案的样本认定为可疑;以评分<50%的样本认定为阴性。

还可以评分≥80%为次优方案并认定为阳性,以60%≤评分<80%为最优方案认定为高度可疑,以35%≤评分<55%作为可疑的最优方案。

也可根据待分析的生物样本类型的不同,设定不同的分类阈值、分类方式等。

因而,通过这样的训练方式,使得利用本发明的分析方法可以对生物样本的图像进行四分类,相对于传统的ai检测方法只能输出阳性结果,其准确率更高,为诊断和临床提供了更丰富的辅助结论。

在本实施例的步骤s3中,通过对图像中离体生物样本中的生物的第二外观形态进行分析以判断所述离体生物样本的物理或病理性质。步骤s3包括:将图像从rgb图像空间投影到hsv颜色空间,获取图像的色调参数信息,将色调参数信息与预设的包括了不同色调参数与物理或病理性质的对应关系的色调特征模板相比较,判断所述离体生物样本的物理或病理性质。通过步骤s3获得图像中的生物的几何参数信息,将几何参数信息与预设的包括了不同几何参数与物理或病理性质的对应关系的几何特征模板相比较,判断所述离体生物样本的物理或病理性质。

利用颜色的色调、大小尺寸等相关第二外形特征进行运算,可以给出符合(阳性)、高度疑似、疑似及不符合(阴性)的概率。

在步骤s3中的特征模板可以采用多种方式获得。本实施例例举的方式包括如下步骤:

s31:获取待训练的样本图像集;

s32:获得生物样本图像的色调、几何尺寸等特征,结合对图像物理或病理性质的标注,进行训练形成满足所需要的神经网络;本步骤的神经网络可以是常见的bp神经网络和卷积神经网络,如包括多个卷积层和全连接层的深度卷积神经网络。训练完成的神经网络包含着第二外观形态与离体生物样本的病理性质的对应关系。在使用时,输入色调参数信息或几何参数信息,神经网络即可输出符合(阳性)、高度疑似、疑似及不符合(阴性)的概率(可利用softmax分类器)或直接给出判断结果。

例如,可以将多个第二外观形态参数与其生物样本物理或病理性质的对应关系构成向量空间,将新的待检测生物样本图像中的第二外观形态参数形成的向量计算与向量空间中不同向量之间的余弦相似性或向量距离,高于预设阈值的相似性对应的特征中的生物样本病理性质作为检测生物样本物理或病理性质的结果。

在利用本发明的分析方法进行判断时,可以将所有待检测的图像经过步骤s2得到的第一外观形态和步骤s3得到的第二外观形态进行识别和对比,并在步骤s2和步骤s3得到的两种外观识别的结果一致的情况下,输出最终的检测结果,从而避免误诊的问题。

对于在步骤s2中无法识别或是判断结果不明确的图像,可通过在步骤s3进一步确认,因而能够避免出现误诊、漏诊的问题。

实施例二:

本实施例提供了一种计算机设备,其包括:处理器;存储器,用于存储计算机程序;当所述计算机程序被处理器执行,使得所述处理器实现实施例一所述的检测方法的步骤。

其中,处理器可以是中央处理单元(cpu)或者现场可编程逻辑阵列(fpga)或者单片机(mcu)或者数字信号处理器(dsp)或者专用集成电路(asic)等具有数据处理能力和/或程序执行能力的逻辑运算器件。一个或多个处理器可以被配置为以并行计算的处理器组同时执行上述检测方法,或者被配置为以部分处理器执行上述检测方法中的部分步骤,部分处理器执行上述检测方法中的其它部分步骤等。计算机指令包括了一个或多个由对应于处理器的指令集架构定义的处理器操作,这些计算机指令可以被一个或多个计算机程序在逻辑上包含和表示。

本实施例的计算机程序可以存储在本地存储器上,或通过通讯组件从网络上被下载和安装。

本实施例的存储器可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、移动存储器件或者上述的任意合适的组合。

为了实现计算机设备的操作,容易理解,还普遍性的具有输入/输出接口、通讯接口等,输入输出接口可以作为组件配置在计算机设备中,也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。通信接口用于实现电子设备与其它装置的信息通讯以实现电子设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。

上述计算机设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。

本发明实施例提供的计算机设备,在医疗应用中可以作为计算机辅助诊断装置(cad),作为对图像进行辅助解读的计算机系统,辅助专业医疗人员等可以基于cad输出的参数或状态描述,结合临床检查、活检等得到的数据并结合个人医疗经验,诊断患者的疾病。

实施例三:

本实施例为一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行实施例一所述的方法的步骤。

以上实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人了解本发明的内容并加以实施,并不能以此限制本发明的保护范围,凡根据本发明精神实质所做的等效变化或修饰,都应涵盖在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1