本发明应用于人工智能医学图像处理,涉及一种基于深度学习技术的智齿识别方法。
背景技术:
1、智齿,又称为第三磨牙,通常在青少年晚期到成年早期长出。这些牙齿可能会引起一系列问题,如长歪、冲压其他牙齿、引起感染或疼痛。因此,定期使用口腔全景片来监测智齿的发展情况是非常重要的。口腔全景片是一种拍摄整个口腔的牙齿、上下颌骨、颞颌关节以及周围结构的x光检查方法。这种x光片可以显示出包括智齿在内的所有牙齿的位置关系和生长状况,即使是那些还没有完全长出牙龈的牙齿。
2、在口腔全景片上检测智齿涉及到放射学的图像分析。通过这种技术,牙医可以观察智齿的位置、角度以及与邻近牙齿的关系,从而评估智齿是否可能造成问题。这包括判断智齿是否有阻生(未能正确生长出来的牙齿),是否有潜在的感染风险,或者是否对其他牙齿的正常排列造成影响。
3、智齿在全景片上是从中间的牙齿往后数的第8颗,通常靠数数的话,会出现因为缺牙的情况导致判断不准,且耗时。基于影像学的诊断的可靠性很大程度取决于评估者的经验,比如资深牙医与学生对智齿的识别能力与速度就有有明显差距。因此,本发明提出一种基于深度学习技术的口腔全景片识别智齿的方法,帮助克服影像学诊断结果的可靠性受评估者经验影响的问题。目前,基于深度学习的目标检测算法已成功落地应用于多种自然图像上的任务,如车辆、行人等常规物体的检测。本发明将结合目标检测算法与图像分类算法,在基于口腔全景片上实现牙齿的自动检测与智齿自动识别,并对智齿实时进行检测达到与临床专家比拟或更高的准确性。
技术实现思路
1、本发明所要解决的技术问题是针对现有技术的不足,提供一种基于深度学习技术的智齿识别方法。
2、为解决上述技术问题,本发明的一种基于深度学习技术的智齿识别方法,具体包括如下步骤:
3、收集口腔全景片图像,进行智齿标注后对全景片图像上所有牙齿进行标注;
4、利用标注结果,训练用于对全景片上的牙齿进行检测分割的mask-rcnn模型;
5、设计并训练用于识别智齿的牙齿分类模型;
6、利用牙齿分类模型根据mask-rcnn模型的目标检测结果进行智齿识别。
7、作为一种可能的实施方式,进一步的,所述收集口腔全景片图像,进行智齿标注后对全景片图像上所有牙齿进行标注步骤具体包括:
8、由医生进行全景片图片分类,选出包含智齿的口腔全景片,使用labelme软件对智齿区域进行标注;
9、由标注人员在医生确认过的口腔全景片上,对剩余牙齿进行标注保存。
10、作为一种可能的实施方式,进一步的,训练所述用于对全景片上的牙齿进行检测分割的mask-rcnn模型时,通过调整每次全景片的亮度与对比度,增加检测模型稳健型性。
11、作为一种可能的实施方式,进一步的,通过调用opencv的cv2.convertscaleabs函数,设定每张全景片的对比度调整范围在[0.5,1.5]之间,亮度在[-30,30]之间,对全景片进行数据增强。
12、作为一种可能的实施方式,进一步的,所述设计并训练用于识别智齿的牙齿分类模型步骤中的设计过程具体包括:
13、设置输入处理模块用于统一口腔全景片图像的分辨率;
14、设置图像特征提取模块用于提取图像的深度特征;
15、设置牙齿距离特征处理模块用于处理并提取牙齿之间的距离特征;
16、设置检测框特征处理模块用于处理检测框的位置信息并提取特征;
17、设置特征融合模块用于将多种特征进行并联和融合;
18、设置分类模块用于对融合后的特征向量进行分类,输出结果。
19、作为一种可能的实施方式,进一步的,所述牙齿分类模型对输入的口腔全景片图像进行如下处理:
20、将输入的全景牙片图像统一到640x1280的分辨率;
21、使用resnet18作为backbone对图像进行特征提取,输出一个512维的特征向量;
22、将所有的距离信息补充到17维,若牙齿数量不足,则用0补充;使用多层感知机提取距离特征,得到128维的特征向量;
23、将检测框特征补充到18x4维,使用mlp和transformer对检测框特征进行处理,得到288维的特征向量;
24、将图像特征、距离特征和检测框特征并联,形成综合的特征向量,通过融合模块对并联的特征进行整合;
25、使用mlp对融合后的特征进行分类,得到最终的输出结果。
26、作为一种可能的实施方式,进一步的,所述设计并训练用于识别智齿的牙齿分类模型步骤中的训练过程包括:
27、在训练时,衡量两个概率分布之间的差异,用来比较真实标签的分布和模型预测的分布,使用使用交叉熵作为训练的损失函数:
28、对于二分类问题,交叉熵的公式为:
29、
30、其中p是真实概率,q是预测概率。训练时使用的最大轮次为100,选择的adam作为优化函数,学习率为1e-4。
31、一种用于识别智齿的牙齿分类模型,包括如下模块:
32、输入处理模块,用于统一口腔全景片图像的分辨率;
33、图像特征提取模块,用于提取图像的深度特征;
34、牙齿距离特征处理模块,用于处理并提取牙齿之间的距离特征;
35、检测框特征处理模块,用于处理检测框的位置信息并提取特征;
36、特征融合模块,用于将多种特征进行并联和融合;
37、分类模块,用于对融合后的特征向量进行分类,输出结果。
38、作为一种可能的实施方式,进一步的,
39、所述输入处理模块将输入的全景牙片图像统一到640x1280的分辨率;
40、所述图像特征提取模块使用resnet18作为backbone对图像进行特征提取并输出512维的特征向量;
41、所述牙齿距离特征处理模块将所有的距离信息补充到17维,若牙齿数量不足,则用0补充;使用多层感知机提取距离特征,得到128维的特征向量;
42、所述检测框特征处理模块将检测框特征补充到18x4维,使用mlp和transformer对检测框特征进行处理,得到288维的特征向量;
43、所述特征融合模块将图像特征、距离特征和检测框特征并联,形成综合的特征向量,通过融合模块对并联的特征进行整合;
44、所述分类模块使用mlp对融合后的特征进行分类,得到最终的输出结果。
45、本发明采用以上技术方案,具有以下有益效果:
46、提高识别准确性:该方法利用深度学习技术,尤其是mask-rcnn模型和resnet18,显著提高了智齿识别的准确性,能够达到与临床专家比拟甚至更高的准确性,减少了人工判断的误差。
47、减少诊断时间:通过自动化的智齿识别过程,显著缩短了医生进行影像学诊断的时间,提高了工作效率,减轻了医生的负担。
48、标准化诊断结果:由于传统影像学诊断依赖于医生的经验,诊断结果可能存在差异。而基于深度学习的自动化方法能够提供一致和标准化的诊断结果,降低了结果的变异性。
49、节省资源:该方法通过自动化处理和分析口腔全景片,减少了对人力资源的依赖,同时通过图像增强技术优化了训练数据,提升了模型的鲁棒性,进一步节省了资源。
50、广泛适用性:该技术可应用于各种不同类型和质量的口腔全景片图像中,适用于不同设备和不同条件下拍摄的图像,具有较强的适应性。