一种模型训练、图像识别方法、装置、设备及存储介质与流程

文档序号：35663782发布日期：2023-10-06 18:54阅读：36来源：国知局

本说明书涉及图像识别，尤其涉及一种模型训练、图像识别方法、装置、设备及存储介质。

背景技术：

1、随着机器学习技术的发展，图像识别模型在各个领域中都得到了广泛的应用，而在对图像识别模型进行训练的过程中，常用的训练方法为有监督训练，在有监督训练过程中需要根据图像识别模型的识别粒度(例如：粗粒度的动物种类识别，如：猫、狗等、细粒度的动物的品种识别，如：哈士奇、金毛等)，构建与该识别粒度相匹配的标注数据以用于对图像识别模型进行训练。

2、其中，用于训练图像识别模型的细粒度的标注数据的获取较为困难，例如：细粒度的图片标注需要对图片的质量以及标注人员所掌握的背景知识有着较高的要求，从而导致获取到的用于训练图像识别模型的细粒度的标注数据的数量有限，进而使得图像识别模型的训练效果较差。

技术实现思路

1、本说明书提供一种模型训练、图像识别方法、装置、设备及存储介质，以部分的解决现有技术存在的问题。

2、本说明书采用下述技术方案：

3、本说明书提供了模型训练方法，所述方法包括：

4、获取样本图像；

5、将所述样本图像输入到图像识别模型中，以通过所述图像识别模型确定所述样本图像属于预设的每个类别的概率值，其中，各类别中包含有按照不同粒度层级划分出的父类别和子类别；

6、针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，确定该父类别对应的第一损失；

7、确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练。

8、可选地，通过所述图像识别模型确定所述样本图像属于每个预设类别的概率值，具体包括：

9、通过所述图像识别模型确定所述样本图像的图像特征；

10、针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征；

11、根据所述调整后类别特征，确定所述样本图像属于所述调整后类别特征对应的类别的概率值。

12、可选地，所述图像识别模型包括：图像特征提取网络、特征交互网络；

13、通过所述图像识别模型确定所述样本图像的图像特征，具体包括：

14、通过所述图像识别模型的所述图像特征提取网络，对所述样本图像进行编码，以确定所述样本图像的图像特征；

15、针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征，具体包括：

16、通过所述图像识别模型的所述特征交互网络，针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征。

17、可选地，确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练之前，所述方法还包括：

18、针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，以及，根据所述样本图像属于该父类别的概率值和所述样本图像属于其他父类别下的子类别的概率值之间的偏差，确定该父类别对应的第二损失；

19、确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练，具体包括：

20、确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各父类别对应的第二损失为优化目标，对所述图像识别模型进行训练。

21、可选地，确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练之前，所述方法还包括：

22、针对每个粒度层级，将所述样本图像在该粒度层级中实际所属的类别，作为目标类别；

23、根据所述样本图像属于所述目标类别的概率值和所述样本图像属于该粒度层级中的其他类别的概率值之间的差值，确定第三损失；

24、确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练，具体包括：

25、确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各第三损失为优化目标，对所述图像识别模型进行训练。

26、本说明书提供了一种图像识别方法，包括：

27、获取待识别图像；

28、将所述待识别图像输入到预先训练的图像识别模型中，以通过所述图像识别模型确定所述待识别图像属于预设的每个类别的概率值，所述图像识别模型是通过上述模型训练方法训练得到；

29、根据所述概率值，确定所述待识别图像的识别结果，并根据所述识别结果进行任务执行。

30、本说明书提供了一种模型训练装置，包括：

31、获取模块，用于获取样本图像；

32、第一确定模块，用于将所述样本图像输入到图像识别模型中，以通过所述图像识别模型确定所述样本图像属于预设的每个类别的概率值，其中，各类别中包含有按照不同粒度层级划分出的父类别和子类别；

33、第二确定模块，用于针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，确定该父类别对应的第一损失；

34、训练模块，用于确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对所述图像识别模型进行训练。

35、可选地，所述第一确定模块具体用于，通过所述图像识别模型确定所述样本图像的图像特征；针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征；根据所述调整后类别特征，确定所述样本图像属于所述调整后类别特征对应的类别的概率值。

36、可选地，所述图像识别模型包括：图像特征提取网络、特征交互网络；

37、所述第一确定模块具体用于，通过所述图像识别模型的所述图像特征提取网络，对所述样本图像进行编码，以确定所述样本图像的图像特征；通过所述图像识别模型的所述特征交互网络，针对每个类别，确定所述图像特征和该类别的初始类别特征之间的关联特征，并通过所述关联特征对所述初始类别特征进行调整，得到所述初始类别特征对应的调整后类别特征。

38、可选地，所述第二确定模块具体用于，针对每个父类别，根据所述样本图像属于该父类别的概率值和所述样本图像属于该父类别下的子类别的概率值之间的偏差，以及，根据所述样本图像属于该父类别的概率值和所述样本图像属于其他父类别下的子类别的概率值之间的偏差，确定该父类别对应的第二损失；确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各父类别对应的第二损失为优化目标，对所述图像识别模型进行训练。

39、可选地，所述第二确定模块具体用于，针对每个粒度层级，将所述样本图像在该粒度层级中实际所属的类别，作为目标类别；根据所述样本图像属于所述目标类别的概率值和所述样本图像属于该粒度层级中的其他类别的概率值之间的差值，确定第三损失；确定所述样本图像对应的标签父类别，并至少以最小化所述样本图像属于各父类别的概率值与所述标签父类别之间的偏差以及最小化各父类别对应的第一损失和各第三损失为优化目标，对所述图像识别模型进行训练。

40、本说明书提供了一种数据查询的装置，包括：

41、图像获取模块，用于获取待识别图像；

42、识别模块，用于将所述待识别图像输入到预先训练的图像识别模型中，以通过所述图像识别模型确定所述待识别图像属于预设的每个类别的概率值，所述图像识别模型是通过上述模型训练方法训练得到；

43、执行模块，用于根据所述概率值，确定所述待识别图像的识别结果，并根据所述识别结果进行任务执行。

44、本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练、图像识别方法。

45、本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练、图像识别方法。

46、本说明书采用的上述至少一个技术方案能够达到以下有益效果：

47、在本说明书提供的模型训练方法，首先获取样本图像，将样本图像输入到图像识别模型中，以通过图像识别模型确定样本图像属于预设的每个类别的概率值，其中，各类别中包含有按照不同粒度层级划分出的父类别和子类别，针对每个父类别，根据样本图像属于该父类别的概率值和样本图像属于该父类别下的子类别的概率值之间的偏差，确定该父类别对应的第一损失，确定样本图像对应的标签父类别，并至少以最小化样本图像属于各父类别的概率与标签父类别之间的偏差以及最小化各父类别对应的第一损失为优化目标，对图像识别模型进行训练。

48、从上述方法中可以看出，可以通过将样本图像属于每个父类别的概率值和样本图像属于每个类别下的子类别的概率值之间的偏差为约束条件，以使图像识别模型输出的样本图像属于任意一个父类别的概率值和图像识别模型输出的样本图像属于这个父类别下的子类别的概率值保持一致，从而使得在对图像识别模型进行训练过程中，可以在使用细粒度的各样本图像对图像识别模型进行训练的同时，使用部分粗粒度的样本图像对图像识别模型进行训练，进而可以在给定的数量有限的细粒度样本图像的基础上，提升图像识别模型的训练效果。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈璟洲冯健明武文琦刘健
技术所有人：支付宝（杭州）信息技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。