本申请涉及智能医疗,尤其涉及一种基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质。
背景技术:
1、医学图像通常可以反应出多种疾病类型,例如眼底图像可以体现出血管瘤、眼底出血、青光眼等多种眼部疾病。利用深度学习模型(例如神经网络)识别医学图像时,首先要使用样本图像对深度学习模型进行训练。
2、传统的训练通常是基于负样本进行训练,其中,负样本可以通过随机采样与样本图像类别不一样数据的方式得到。然而,基于负样本进行模型训练的训练效率和模型表现都比较差。
技术实现思路
1、本申请提供了一种基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质,旨在基于正样本数据和困难负样本数据实现提升模型的训练效果和模型表现力。
2、为实现上述目的,本申请提供一种基于困难负样本数据的模型训练方法,所述方法包括:
3、获取目标样本数据,基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据;
4、通过初始深度学习模型分别对所述目标样本数据、所述正样本数据以及所述困难负样本数据进行特征提取,得到对应的第一特征向量、第二特征向量以及第三特征向量;
5、分别确定所述第一特征向量与所述第二特征向量的相似度、所述第一特征向量与所述第三特征向量的相似度,得到对应的第三相似度值以及第四相似度值;
6、基于所述第三相似度值以及所述正样本数据对应的标签确定第一损失值,以及基于所述第四相似度值以及所述困难负样本数据对应的标签确定第二损失值;
7、通过所述第一损失值、所述第二损失值对所述初始深度学习模型进行训练,得到目标深度学习模型。
8、为实现上述目的,本申请还提供一种基于困难负样本数据的模型训练装置,其特征在于,包括:
9、获取模块,用于获取获取目标样本数据,基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据;
10、特征提取模块,用于通过初始深度学习模型分别对所述目标样本数据、所述正样本数据以及所述困难负样本数据进行特征提取,得到对应的第一特征向量、第二特征向量以及第三特征向量;
11、相似度计算模块,用于分别确定所述第一特征向量与所述第二特征向量的相似度、所述第一特征向量与所述第三特征向量的相似度,得到对应的第三相似度值以及第四相似度值;
12、损失值确定模块,用于基于所述第三相似度值以及所述正样本数据对应的标签确定第一损失值,以及基于所述第四相似度值以及所述困难负样本数据对应的标签确定第二损失值;
13、模型训练模块,用于通过所述第一损失值、所述第二损失值对所述初始深度学习模型进行训练,得到目标深度学习模型。
14、此外,为实现上述目的,本申请还提供一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的基于困难负样本数据的模型训练方法。
15、此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的基于困难负样本数据的模型训练方法。
16、本申请实施例公开的基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质,能够基于目标样本数据确定正样本数据以及对应的困难负样本数据,并通过初始深度学习模型对目标样本数据、正样本数据以及困难负样本数据进行特征提取,并计算对应的相似度以及正样本、困难负样本对应的损失值,进而基于损失值对初始深度学习模型进行训练,得到目标深度学习模型。由于是基于正样本数据以及正样本数据对应的困难负样本数据对深度学习模型进行训练,因此能够有效的提升深度学习模型的训练效果和模型表现力。尤其对于医疗影像的识别模型,能够提升模型对医疗影像的识别效率以及精确度。
1.一种基于困难负样本数据的模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标样本数据确定所述正样本数据以及若干负样本数据之后,还包括:
4.根据权利要求3所述的方法,其特征在于,所述确定所述正样本数据与每一所述负样本数据的相似度,得到每一所述负样本数据对应的第一相似度值,包括:
5.根据权利要求3所述的方法,所述基于每一所述第一相似度值,确定所述正样本数据与每一所述负样本数据的不确定性,得到每一所述负样本对应的不确定性数值,包括:
6.根据权利要求3所述的方法,其特征在于,所述基于所述每一所述第一的相似度值,确定所述正样本数据与每一所述负样本数据的多样性,得到每一所述负样本对应的多样性数值,包括:
7.根据权利要求2所述的方法,其特征在于,所述基于每一所述负样本数据对应的第一相似度值、不确定性数值以及多样性数值,从若干所述负样本数据中确定困难负样本数据,包括:
8.一种基于困难负样本数据的模型训练装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1-7任一项所述的基于困难负样本数据的模型训练方法。