1.本发明涉及人工智能技术领域,具体涉及一种肺磨玻璃结节识别方法、系统、终端及存储介质。
背景技术:2.随着高分辨率ct的普及,大量的肺小结节被发现,其中磨玻璃结节(ground glass nodule,ggn)很大一部分最后被证实为早期肺癌。由于磨玻璃结节在ct中较为模糊,且不同程度的磨玻璃结节的处理方法是不同的,一旦对磨玻璃结节的程度把握不准就会导致处理方法不当,对病人造成不利影响。现有的磨玻璃结节严重依赖医生经验,导致磨玻璃结节诊断准确率不佳。
技术实现要素:3.针对现有技术的上述不足,本发明提供一种肺磨玻璃结节识别方法、系统、终端及存储介质,以解决上述技术问题。
4.第一方面,本发明提供一种肺磨玻璃结节识别方法,包括:
5.利用预先构建的图像识别模型从ct图像中识别肺磨玻璃结节,得到图像识别结果;
6.接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
7.进一步的,图像识别模型包括:
8.轮廓检测子模型,用于利用canny轮廓检测算法识别ct图像中的轮廓线,并从所有轮廓线中筛选出闭合轮廓线,将闭合轮廓线所在区域从ct图像中分割出来作为识别目标;
9.神经网络子模型,用于对所述识别目标进行处理,得到所述识别目标所属的肺磨玻璃结节种类及概率。
10.进一步的,所述神经网络子模型的训练方法包括:
11.收集大量的ct图像,并对所有ct图像进行边缘检测,并从中提取闭合轮廓线区域,将闭合轮廓线区域标记所属肺磨玻璃结节种类后保存至训练集;
12.利用所述训练集对神经网络子模型进行训练。
13.进一步的,接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果,包括:
14.从对外接口接收用户上传的血清肿瘤标志物检测结果,所述血清肿瘤标志物检测结果包括癌胚抗原和糖类抗原的含量检测结果;
15.从神经网络子模型输出的所有识别目标的概率中选取最大概率;
16.将血清肿瘤标志物检测结果和所述最大概率对应的肺磨玻璃结节类型输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
17.进一步的,所述聚类检测模型的构建方法包括:
18.收集大量的肺磨玻璃结节患者的诊断数据和非肺磨玻璃结节患者的诊断数据,诊断数据包括图像识别结果和血清肿瘤标志物检测结果,将收集的所有数据保存至聚类训练集;
19.构建k-means聚类模型,并指定k-means聚类模型的聚类中心为肺磨玻璃结节种类数量;
20.利用聚类训练集对所述k-means聚类模型训练。
21.第二方面,本发明提供一种肺磨玻璃结节识别系统,包括:
22.图像识别单元,用于利用预先构建的图像识别模型从ct图像中识别肺磨玻璃结节,得到图像识别结果;
23.结果识别单元,用于接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
24.进一步的,图像识别模型包括:
25.轮廓检测子模型,用于利用canny轮廓检测算法识别ct图像中的轮廓线,并从所有轮廓线中筛选出闭合轮廓线,将闭合轮廓线所在区域从ct图像中分割出来作为识别目标;
26.神经网络子模型,用于对所述识别目标进行处理,得到所述识别目标所属的肺磨玻璃结节种类及概率。
27.进一步的,所述神经网络子模型的训练方法包括:
28.收集大量的ct图像,并对所有ct图像进行边缘检测,并从中提取闭合轮廓线区域,将闭合轮廓线区域标记所属肺磨玻璃结节种类后保存至训练集;
29.利用所述训练集对神经网络子模型进行训练。
30.进一步的,所述结果识别单元用于:
31.从对外接口接收用户上传的血清肿瘤标志物检测结果,所述血清肿瘤标志物检测结果包括癌胚抗原和糖类抗原的含量检测结果;
32.从神经网络子模型输出的所有识别目标的概率中选取最大概率;
33.将血清肿瘤标志物检测结果和所述最大概率对应的肺磨玻璃结节类型输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
34.进一步的,所述聚类检测模型的构建方法包括:
35.收集大量的肺磨玻璃结节患者的诊断数据和非肺磨玻璃结节患者的诊断数据,诊断数据包括图像识别结果和血清肿瘤标志物检测结果,将收集的所有数据保存至聚类训练集;
36.构建k-means聚类模型,并指定k-means聚类模型的聚类中心为肺磨玻璃结节种类数量;
37.利用聚类训练集对所述k-means聚类模型训练。
38.第三方面,提供一种终端,包括:
39.处理器、存储器,其中,
40.该存储器用于存储计算机程序,
41.该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
42.第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,
当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
43.本发明的有益效果在于,
44.本发明提供的肺磨玻璃结节识别方法、系统、终端及存储介质,通过利用神经网络模型对ct图像进行识别,并基于图像识别结果,结合血清肿瘤标志物检测结果,通过聚类检测模型得到准确的肺磨玻璃结节识别结果。本发明大大提升了肺磨玻璃结节的识别准确度,为肺磨玻璃结节诊断提供了客观的数据支撑。
45.此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
46.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
47.图1是本发明一个实施例的方法的示意性流程图。
48.图2是本发明一个实施例的系统的示意性框图。
49.图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
50.为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
51.图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种肺磨玻璃结节识别系统。
52.如图1所示,该方法包括:
53.步骤110,利用预先构建的图像识别模型从ct图像中识别肺磨玻璃结节,得到图像识别结果;
54.步骤120,接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
55.该方法通过利用神经网络模型对ct图像进行识别,并基于图像识别结果,结合血清肿瘤标志物检测结果,通过聚类检测模型得到准确的肺磨玻璃结节识别结果。本发明大大提升了肺磨玻璃结节的识别准确度,为肺磨玻璃结节诊断提供了客观的数据支撑。
56.为了便于对本发明的理解,下面以本发明肺磨玻璃结节识别方法的原理,结合实施例中对肺磨玻璃结节进行识别的过程,对本发明提供的肺磨玻璃结节识别方法做进一步的描述。
57.具体的,所述肺磨玻璃结节识别方法包括:
58.s1、利用预先构建的图像识别模型从ct图像中识别肺磨玻璃结节,得到图像识别结果。
59.本实施例将肺磨玻璃结节分为以下几类:纯磨玻璃密度结节(ⅰ型)、实性成分小于
50%的混合密度结节(ⅱ型)、实性成分大于等于50%的混合密度结节(ⅲ型)、散在实性密度结节(ⅳ型)及实性结节(
ⅴ
型)。纯磨玻璃结节(pggn)以最大径为10mm作为分界值来区分浸润性腺癌及浸润前病变,敏感度及特异度分别为53.33%、100%;部分实性结节实性成分最大径为3mm诊断浸润前病变和mia,特异度为100%,磨玻璃密度为提示预后的重要征象。
60.鉴于肺磨玻璃结节在ct图像中可能只占部分区域,而对整张ct图像进行识别会导致识别准确度很低。因此本发明提供的图像识别模型包括:轮廓检测子模型,用于利用canny轮廓检测算法识别ct图像中的轮廓线,并从所有轮廓线中筛选出闭合轮廓线,将闭合轮廓线所在区域从ct图像中分割出来作为识别目标;神经网络子模型,用于对所述识别目标进行处理,得到所述识别目标所属的肺磨玻璃结节种类及概率。
61.其中,canny轮廓检测算法识别ct图像中的轮廓线包括:
62.1)图像降噪。由于噪声就是灰度变化很大的地方,所以容易被识别为伪边缘。
63.2)计算图像梯度,得到可能边缘。计算图像梯度能够得到图像的边缘,因为梯度是灰度变化明显的地方,而边缘也是灰度变化明显的地方。
64.3)非极大值抑制。通常灰度变化的地方都比较集中,将局部范围内的梯度方向上,灰度变化最大的保留下来,其它的不保留,这样可以剔除掉一大部分的点。将有多个像素宽的边缘变成一个单像素宽的边缘。即“胖边缘”变成“瘦边缘”。
65.4)双阈值筛选。通过非极大值抑制后,仍然有很多的可能边缘点,进一步的设置一个双阈值,即低阈值(low),高阈值(high)。灰度变化大于high的,设置为强边缘像素,低于low的,剔除。在low和high之间的设置为弱边缘。进一步判断,如果其领域内有强边缘像素,保留,如果没有,剔除。
66.基于上述步骤得到ct图像中的轮廓线,从所有轮廓线中筛选出闭合轮廓线,将闭合轮廓线所在区域从ct图像中分割出来作为识别目标,一张ct图像内可能存在多个识别目标。如果没有识别目标,则输出不存在结节。
67.本发明采用的神经网络子模型为卷积神经网络模型(cnn)。神经网络子模型的训练方法包括:收集大量的ct图像,并对所有ct图像进行边缘检测,并从中提取闭合轮廓线区域,将闭合轮廓线区域标记所属肺磨玻璃结节种类后保存至训练集;利用所述训练集对神经网络子模型进行训练。
68.s2、接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
69.从对外接口接收用户上传的血清肿瘤标志物检测结果,所述血清肿瘤标志物检测结果包括癌胚抗原和糖类抗原(ca125、ca153)的含量检测结果。血清肿瘤标志物检测结果可以提高肺癌诊断的敏感性和特异性,选择性地联合运用ct扫描及血清肿瘤标志物对肺癌的早期诊断价值很大。
70.从神经网络子模型输出的所有识别目标的概率中选取最大概率;将血清肿瘤标志物检测结果和所述最大概率对应的肺磨玻璃结节类型输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。本实施方式中选取最大概率对应的肺磨玻璃结节类型作为最后识别结果的影响因素,降低了聚类检测模型的计算量,在本发明的其他实施方式中也可以将概率超过设定阈值的肺磨玻璃结节类型分别作为最后识别结果的影响因素。即如果图像识别结果为多个肺磨玻璃结节类型,则需要依次将多个肺磨玻璃结节类型输入聚类检测模
型,每个肺磨玻璃结节类型对应一个肺磨玻璃结节识别结果。
71.聚类检测模型的构建方法包括:收集大量的肺磨玻璃结节患者的诊断数据和非肺磨玻璃结节患者的诊断数据,诊断数据包括图像识别结果和血清肿瘤标志物检测结果,将收集的所有数据保存至聚类训练集;构建k-means聚类模型,并指定k-means聚类模型的聚类中心为肺磨玻璃结节种类数量,本实施例中肺磨玻璃结节种类数量为5;利用聚类训练集对所述k-means聚类模型训练。
72.k-means聚类算法的流程为:(1)指定需要划分的簇的个数,即k值(类的个数);(2)随机的选择k个数据对象作为初始的聚类中心;(3)计算其余的各个数据对象到这k个聚类中心的距离,把数据对象划分到距离它最近的那个中心所在的簇中;(4)调整新类并计算出新的聚类中心;(5)循环步骤(3)和(4),直到聚类中心不再发生变化,聚类结束。
73.如图2所示,该系统200包括:
74.图像识别单元210,用于利用预先构建的图像识别模型从ct图像中识别肺磨玻璃结节,得到图像识别结果;
75.结果识别单元220,用于接收血清肿瘤标志物检测结果,并将图像识别结果和血清肿瘤标志物检测结果输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
76.可选地,作为本发明一个实施例,图像识别模型包括:
77.轮廓检测子模型,用于利用canny轮廓检测算法识别ct图像中的轮廓线,并从所有轮廓线中筛选出闭合轮廓线,将闭合轮廓线所在区域从ct图像中分割出来作为识别目标;
78.神经网络子模型,用于对所述识别目标进行处理,得到所述识别目标所属的肺磨玻璃结节种类及概率。
79.可选地,作为本发明一个实施例,所述神经网络子模型的训练方法包括:
80.收集大量的ct图像,并对所有ct图像进行边缘检测,并从中提取闭合轮廓线区域,将闭合轮廓线区域标记所属肺磨玻璃结节种类后保存至训练集;
81.利用所述训练集对神经网络子模型进行训练。
82.可选地,作为本发明一个实施例,所述结果识别单元用于:
83.从对外接口接收用户上传的血清肿瘤标志物检测结果,所述血清肿瘤标志物检测结果包括癌胚抗原和糖类抗原的含量检测结果;
84.从神经网络子模型输出的所有识别目标的概率中选取最大概率;
85.将血清肿瘤标志物检测结果和所述最大概率对应的肺磨玻璃结节类型输入预先构建的聚类检测模型,得到肺磨玻璃结节识别结果。
86.可选地,作为本发明一个实施例,所述聚类检测模型的构建方法包括:
87.收集大量的肺磨玻璃结节患者的诊断数据和非肺磨玻璃结节患者的诊断数据,诊断数据包括图像识别结果和血清肿瘤标志物检测结果,将收集的所有数据保存至聚类训练集;
88.构建k-means聚类模型,并指定k-means聚类模型的聚类中心为肺磨玻璃结节种类数量;
89.利用聚类训练集对所述k-means聚类模型训练。
90.图3为本发明实施例提供的一种终端300的结构示意图,该终端300可以用于执行本发明实施例提供的肺磨玻璃结节识别方法。
91.其中,该终端300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
92.其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
93.处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(integrated circuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器310可以仅包括中央处理器(central processing unit,简称cpu)。在本发明实施方式中,cpu可以是单运算核心,也可以包括多运算核心。
94.通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
95.本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:rom)或随机存储记忆体(英文:random access memory,简称:ram)等。
96.因此,本发明通过利用神经网络模型对ct图像进行识别,并基于图像识别结果,结合血清肿瘤标志物检测结果,通过聚类检测模型得到准确的肺磨玻璃结节识别结果。本发明大大提升了肺磨玻璃结节的识别准确度,为肺磨玻璃结节诊断提供了客观的数据支撑,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
97.本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
98.本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
99.在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结
合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
100.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
101.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
102.尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。