基于困难负样本数据的模型训练方法、装置、设备及介质与流程

文档序号：35416490发布日期：2023-09-10 03:14阅读：56来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请涉及智能医疗，尤其涉及一种基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质。

背景技术：

1、医学图像通常可以反应出多种疾病类型，例如眼底图像可以体现出血管瘤、眼底出血、青光眼等多种眼部疾病。利用深度学习模型(例如神经网络)识别医学图像时，首先要使用样本图像对深度学习模型进行训练。

2、传统的训练通常是基于负样本进行训练，其中，负样本可以通过随机采样与样本图像类别不一样数据的方式得到。然而，基于负样本进行模型训练的训练效率和模型表现都比较差。

技术实现思路

1、本申请提供了一种基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质，旨在基于正样本数据和困难负样本数据实现提升模型的训练效果和模型表现力。

2、为实现上述目的，本申请提供一种基于困难负样本数据的模型训练方法，所述方法包括：

3、获取目标样本数据，基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据；

4、通过初始深度学习模型分别对所述目标样本数据、所述正样本数据以及所述困难负样本数据进行特征提取，得到对应的第一特征向量、第二特征向量以及第三特征向量；

5、分别确定所述第一特征向量与所述第二特征向量的相似度、所述第一特征向量与所述第三特征向量的相似度，得到对应的第三相似度值以及第四相似度值；

6、基于所述第三相似度值以及所述正样本数据对应的标签确定第一损失值，以及基于所述第四相似度值以及所述困难负样本数据对应的标签确定第二损失值；

7、通过所述第一损失值、所述第二损失值对所述初始深度学习模型进行训练，得到目标深度学习模型。

8、为实现上述目的，本申请还提供一种基于困难负样本数据的模型训练装置，其特征在于，包括：

9、获取模块，用于获取获取目标样本数据，基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据；

10、特征提取模块，用于通过初始深度学习模型分别对所述目标样本数据、所述正样本数据以及所述困难负样本数据进行特征提取，得到对应的第一特征向量、第二特征向量以及第三特征向量；

11、相似度计算模块，用于分别确定所述第一特征向量与所述第二特征向量的相似度、所述第一特征向量与所述第三特征向量的相似度，得到对应的第三相似度值以及第四相似度值；

12、损失值确定模块，用于基于所述第三相似度值以及所述正样本数据对应的标签确定第一损失值，以及基于所述第四相似度值以及所述困难负样本数据对应的标签确定第二损失值；

13、模型训练模块，用于通过所述第一损失值、所述第二损失值对所述初始深度学习模型进行训练，得到目标深度学习模型。

14、此外，为实现上述目的，本申请还提供一种计算机设备，所述计算机设备包括存储器和处理器；所述存储器，用于存储计算机程序；所述处理器，用于执行所述的计算机程序并在执行所述的计算机程序时实现本申请实施例提供的任一项所述的基于困难负样本数据的模型训练方法。

15、此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现本申请实施例提供的任一项所述的基于困难负样本数据的模型训练方法。

16、本申请实施例公开的基于困难负样本数据的模型训练方法、基于困难负样本数据的模型训练装置、计算机设备及计算机可读存储介质，能够基于目标样本数据确定正样本数据以及对应的困难负样本数据，并通过初始深度学习模型对目标样本数据、正样本数据以及困难负样本数据进行特征提取，并计算对应的相似度以及正样本、困难负样本对应的损失值，进而基于损失值对初始深度学习模型进行训练，得到目标深度学习模型。由于是基于正样本数据以及正样本数据对应的困难负样本数据对深度学习模型进行训练，因此能够有效的提升深度学习模型的训练效果和模型表现力。尤其对于医疗影像的识别模型，能够提升模型对医疗影像的识别效率以及精确度。

技术特征：

1.一种基于困难负样本数据的模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标样本数据确定正样本数据以及所述正样本数据对应的困难负样本数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述目标样本数据确定所述正样本数据以及若干负样本数据之后，还包括：

4.根据权利要求3所述的方法，其特征在于，所述确定所述正样本数据与每一所述负样本数据的相似度，得到每一所述负样本数据对应的第一相似度值，包括：

5.根据权利要求3所述的方法，所述基于每一所述第一相似度值，确定所述正样本数据与每一所述负样本数据的不确定性，得到每一所述负样本对应的不确定性数值，包括：

6.根据权利要求3所述的方法，其特征在于，所述基于所述每一所述第一的相似度值，确定所述正样本数据与每一所述负样本数据的多样性，得到每一所述负样本对应的多样性数值，包括：

7.根据权利要求2所述的方法，其特征在于，所述基于每一所述负样本数据对应的第一相似度值、不确定性数值以及多样性数值，从若干所述负样本数据中确定困难负样本数据，包括：

8.一种基于困难负样本数据的模型训练装置，其特征在于，所述装置包括：

9.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时使所述处理器实现如权利要求1-7任一项所述的基于困难负样本数据的模型训练方法。

技术总结
本发明实施例提供一种模型训练方法、装置、设备及存储介质，包括：获取目标样本数据，确定正样本数据和困难负样本数据；通过初始深度学习模型分别对目标样本数据、正样本数据和困难负样本数据进行特征提取，得到第一特征向量、第二特征向量和第三特征向量；确定第一特征向量与第二特征向量的相似度、第一特征向量与第三特征向量的相似度，得到第三相似度值和第四相似度值；确定第一损失值以及第二损失值；通过第一损失值、第二损失值对初始深度学习模型进行训练，得到目标深度学习模型。本申请旨在基于正样本数据和困难负样本数据实现提升模型的训练效果和模型表现力。尤其对于医疗影像的识别模型，能够提升模型对医疗影像的识别效率、精确度。

技术研发人员：舒畅,肖京,陈又新
受保护的技术使用者：平安科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：舒畅肖京陈又新
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：一种自动化飞机蒙皮输送裁割装置及方法与流程
上一篇：建筑砂石筛选除尘一体化设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。