本技术涉及图像数据处理,更为具体地,涉及一种图像标注方法、电子设备、系统及存储介质。
背景技术:
1、随着人工智能技术的发展,越来越多的ai技术在各个领域中得到了广泛的应用。其中,深度学习作为一种机器学习,是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。例如,深度学习的发展促进了计算机视觉技术在医疗领域的应用,特别是医学影像辅助阅片,即利用深度学习技术来分析和学习规模庞大的数据集,以实现基于医学图像的辅助诊疗。
2、目前,脑胶质瘤作为一种源自脑内神经胶质细胞的肿瘤,症状与肿瘤的恶性程度、患者的年龄、肿瘤的部位、生长速度等因素息息相关,其最常见的症状包括头痛、恶心、呕吐、癫痫发作等。此类疾病在就诊过程中,医生会根据病历、神经系统检查、头部ct或mri检查来辅助诊断。
3、但是,针对目前已经提出的医学图像分割算法,大部分需要大量的标注数据才能达到性能要求,而医学图像的标注对标注人员的专业性要求很高,标注过程耗时耗力,成本巨大,导致很难获取大量的、高质量的医学图像标注数据。此外,虽然半监督学习可以利用少量的标注数据和大量的无标注数据,通过深度学习技术提高图像分割的性能。但是,少量标注图像和大量未标注数据之间通常存在分布不一致的问题,导致使用一致的方式处理所有图像存在准确度差,模型整体泛化性能受影响。
4、因此,目前亟需一种图像处理方案,以提高医学图像处理的可靠性及准确度。
技术实现思路
1、鉴于上述问题,本技术的目的是提供一种图像标注方法,以解决现有医学图像处理存在的成本高、准确度差,模型整体泛化性能受影响等问题。
2、第一方面,本技术实施例提供一种图像标注方法,包括:获取原始图像训练数据,同时构建第一网络模型和第二网络模型;其中,所述原始图像训练数据包括未标注数据和已标注数据;
3、基于所述已标注数据对所述第一网络模型进行迭代训练;同时,基于所述原始图像训练数据对所述第二网络模型进行迭代训练;
4、在每次迭代完成后,通过所述第二网络模型的网络参数对所述第一网络模型的网络参数进行更新,直至所述第二网络模型的损失函数的值收敛在预设范围内时,形成图像检测模型;
5、基于所述图像检测模型对待处理图像进行标注。
6、进一步地,所述第一网络模型和所述第二网络模型平行设置;并且,所述第一网络模型和所述第二网络模型的结构相同。
7、进一步地,基于所述已标注数据对所述第一网络模型进行迭代训练,包括:获取所述原始图像训练数据中的已标注数据;
8、对所述已标注数据分别进行弱增广和/或强增广处理,获取对应的弱增广标注数据和强增广标注数据;
9、基于所述已标注数据和/或所述弱增广标注数据和/或所述强增广标注数据对所述第一网络模型进行迭代训练。
10、进一步地,所述基于所述原始图像训练数据对所述第二网络模型进行迭代训练,包括:
11、对所述原始图像训练数据进行弱增广和/或强增广处理,获取对应的弱增广数据和强增广数据;
12、基于所述原始图像训练数据和/或所述弱增广数据和/或所述强增广数据对所述第二网络模型进行迭代训练。
13、进一步地,所述第二网络模型的损失函数的表达式为:
14、
15、其中,表示所述第二网络模型中整体已标注数据的损失,表示所述第二网络模型中整体未标注数据的损失,α表示调节权重。
16、进一步地,所述第二网络模型中整体已标注数据的损失表达式为:
17、
18、
19、其中,nb表示已标注数据的数量,表示第e个已标注数据的损失,w表示已标注数据的宽,h表示已标注数据的高,yi表示第i点的标签,sw,i表示弱增广标注数据上第i点的预测值,ss,i表示强增广标注数据上第i点的预测值,lce(yi,sw,i)表示弱增广标注数据上第i点与已标注数据之间的损失,lce(yi,ss,i)表示强增广标注数据上第i点与已标注数据之间的损失,lce(sw,i,ss,i)表示弱增广标注数据与强增广标注数据第i点之间的损失。
20、进一步地,所述第二网络模型中整体未标注数据的损失表达式为:
21、
22、
23、其中,nu表示未标注数据的数量,表示第f个未标注数据的损失,so,i表示使用第一网络模型产生的未标注数据的第i点的预测值,sw,i表示使用第二网络模型产生的弱增广数据上第i点的预测值,ss,i表示使用第二网络模型产生的强增广数据上第i点的预测值,lce(so,i,sw,i)表示未标注数据与弱增广数据上第i点之间的损失,lce(so,i,ss,i)表示未标注数据与强增广数据上第i点之间的损失,lce(sw,i,ss,i)表示弱增广数据与强增广数据第i点之间的损失。
24、进一步地,所述通过所述第二网络模型的网络参数对所述第一网络模型的网络参数进行更新的表达式为:
25、
26、其中,表示第一网络模型在第t迭代轮次的网络参数,表示第二网络模型在第t迭代轮次的网络参数,λ表示更新调节参数;
27、所述更新调节参数为动态变化值,所述更新调节参数随迭代轮次的增加而增加。
28、第二方面,本技术实施例提供一种电子设备,包括:
29、处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以运行第一方面中的图像标注方法。
30、第三个方面,本技术实施例提供一种图像标注系统,包括:
31、训练数据获取单元,用于获取原始图像训练数据,同时构建第一网络模型和第二网络模型;其中,所述原始图像训练数据包括未标注数据和已标注数据;
32、模型训练单元,用于基于所述已标注数据对所述第一网络模型进行迭代训练;同时,基于所述原始图像训练数据对所述第二网络模型进行迭代训练;
33、参数更新单元,用于在每次迭代完成后,通过所述第二网络模型的网络参数对所述第一网络模型的网络参数进行更新,直至所述第二网络模型的损失函数的值收敛在预设范围内时,形成图像检测模型;
34、标注单元,用于基于所述图像检测模型对待处理图像进行标注。
35、第三方面,本技术实施例提供一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机运行第一方面中的图像标注方法。
36、利用上述图像标注方法、电子设备、系统及存储介质,构建第一网络模型和第二网络模型,并使用不同的数据对两个网络模型进行分别训练,并在训练过程中通过第二网络模型的网络参数对第一网络模型的网络参数进行更新,直至第一网络模型的损失函数收敛在预设范围内,形成图像检测模型,能够有效利用未标注数据进行特征提取,解决标注数据和未标注数据的分布不一致问题,提高模型的泛化能力。
37、为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。