图像识别方法、装置、介质、设备和芯片与流程

文档序号：36795884发布日期：2024-01-23 12:18阅读：18来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本公开涉及人工智能，具体地，涉及一种图像识别方法、装置、介质、设备和芯片。

背景技术：

1、随着人工智能技术的发展，出现了各种各样的人工智能模型用于图像识别。人工智能模型可以通过监督学习进行训练，而监督训练所用到的样本数据是制约训练任务能否实现的关键因素，也是影响训练后的人工智能模型的准确性的关键因素之一。

2、在相关技术中，需要人工获取大量的样本数据进行训练，成本较高，且能够获取的样本数据有限。

技术实现思路

1、为克服相关技术中存在的上述问题，本公开提供一种图像识别方法、装置、介质、设备和芯片。

2、根据本公开实施例的第一方面，提供一种图像识别方法，所述方法包括：

3、获取待识别图像；所述待识别图像包括至少一个目标对象；

4、将所述待识别图像输入目标图像识别模型，得到所述目标对象的目标识别结果；

5、其中，所述目标图像识别模型为根据训练样本集对目标神经网络模型进行训练得到的模型，所述训练样本集包括至少一个目标样本图像、所述目标样本图像中的至少一个虚拟对象、以及每个虚拟对象对应的虚拟识别结果；所述目标样本图像为根据目标神经网络模型从多个待定样本图像中确定的图像；所述待定样本图像为根据预设拍摄参数对虚拟模型空间进行拍摄得到的图像；所述虚拟模型空间包括虚拟环境信息、所述虚拟对象、以及每个所述虚拟对象对应的所述虚拟识别结果。

6、在一些实施例中，所述目标图像识别模型是通过以下方式训练得到的：

7、根据预设拍摄参数对虚拟模型空间进行拍摄，得到多个待定样本图像；所述待定样本图像中包括至少一个虚拟对象；

8、根据目标神经网络模型，从所述多个待定样本图像中确定至少一个目标样本图像；

9、根据所述目标样本图像、所述目标样本图像中的至少一个虚拟对象、以及每个所述虚拟对象对应的虚拟识别结果，获取所述训练样本集；

10、根据所述训练样本集对所述目标神经网络模型进行训练，根据训练后的目标神经网络模型确定所述目标图像识别模型。

11、在一些实施例中，所述根据目标神经网络模型，从所述多个待定样本图像中确定至少一个目标样本图像包括：

12、将所述待定样本图像输入所述目标神经网络模型，得到所述目标神经网络模型输出的所述虚拟对象对应的第一预测识别结果；

13、根据所述虚拟对象对应的所述第一预测识别结果和所述虚拟识别结果，获取第一损失值；所述第一损失值用于表征所述目标神经网络对所述虚拟对象的识别准确度；

14、根据所述第一损失值，从所述待定样本图像中确定所述目标样本图像。

15、在一些实施例中，所述根据预设拍摄参数对虚拟模型空间进行拍摄，得到多个待定样本图像包括：

16、确定所述虚拟模型空间中的至少一个目标拍摄位置；

17、根据所述目标拍摄位置和所述预设拍摄参数，对所述虚拟模型空间进行拍摄，获取所述待定样本图像。

18、在一些实施例中，所述确定所述虚拟模型空间中的至少一个目标拍摄位置包括：

19、获取所述虚拟模型空间中的至少一个第一待定拍摄位置；

20、根据所述第一待定拍摄位置和所述预设拍摄参数，对所述虚拟模型空间进行拍摄，得到第一待定图像；

21、根据所述第一待定拍摄位置、所述预设拍摄参数和所述第一待定图像，获取所述第一待定拍摄位置对应的训练权重；所述训练权重用于表征在所述第一待定图像的复杂度，或者，所述目标神经网络模型对所述第一待定图像中的虚拟对象的识别准确度；

22、根据所述第一待定拍摄位置和所述训练权重，获取所述目标拍摄位置。

23、在一些实施例中，所述虚拟模型空间为三维模型空间，所述预设拍摄参数包括拍摄位姿；所述根据所述第一待定拍摄位置、所述预设拍摄参数和所述第一待定图像，获取所述第一待定拍摄位置对应的训练权重包括：

24、获取所述第一待定图像中不包含所述虚拟对象的背景像素的像素数目；

25、根据所述第一待定拍摄位置和所述拍摄位姿，确定当前拍摄视角下的三维模型空间的面数；

26、根据所述像素数目和所述面数，计算得到所述第一待定拍摄位置对应的复杂度；

27、根据所述复杂度确定所述第一待定拍摄位置对应的训练权重。

28、在一些实施例中，所述根据所述第一待定拍摄位置、所述预设拍摄参数和所述第一待定图像，获取所述第一待定拍摄位置对应的训练权重包括：

29、将所述第一待定图像输入所述目标神经网络模型，得到所述目标神经网络模型输出的所述虚拟对象对应的第二预测识别结果；

30、根据所述虚拟对象对应的所述第二预测识别结果和所述虚拟识别结果，获取第二损失值；所述第二损失值用于表征所述目标神经网络对所述虚拟对象的识别准确度；

31、根据所述第二损失值确定所述训练权重。

32、在一些实施例中，所述根据所述第一待定拍摄位置和所述训练权重，获取所述目标拍摄位置包括：

33、根据所述训练权重，从所述第一待定拍摄位置中确定至少一个第二待定拍摄位置；

34、根据所述第二待定拍摄位置确定所述目标拍摄位置。

35、在一些实施例中，所述根据所述第二待定拍摄位置确定所述目标拍摄位置包括：

36、将所述第二待定拍摄位置作为所述目标拍摄位置；或者，

37、根据所述第二待定拍摄位置，获取目标拍摄路径，将所述目标拍摄路径上的位置作为所述目标拍摄位置。

38、在一些实施例中，所述根据训练后的目标神经网络模型确定所述目标图像识别模型包括：

39、将所述训练后的目标神经网络模型作为新的目标神经网络模型，并循环执行所述根据预设拍摄参数对虚拟模型空间进行拍摄至所述根据所述训练样本集对所述目标神经网络模型进行训练的步骤，直至确定训练后的目标神经网络模型满足预设停止迭代条件，将训练后的目标神经网络模型作为所述目标图像识别模型。

40、根据本公开实施例的第二方面，提供一种图像识别装置，所述装置包括：

41、图像获取模块，被配置为获取待识别图像；所述待识别图像包括至少一个目标对象；

42、图像识别模块，被配置为将所述待识别图像输入目标图像识别模型，得到所述目标对象的目标识别结果；其中，所述目标图像识别模型为根据训练样本集对目标神经网络模型进行训练得到的模型，所述训练样本集包括至少一个目标样本图像、所述目标样本图像中的至少一个虚拟对象、以及每个虚拟对象对应的虚拟识别结果；所述目标样本图像为根据目标神经网络模型从多个待定样本图像中确定的图像；所述待定样本图像为根据预设拍摄参数对虚拟模型空间进行拍摄得到的图像；所述虚拟模型空间包括虚拟环境信息、所述虚拟对象、以及每个所述虚拟对象对应的所述虚拟识别结果。

43、在一些实施例中，所述装置还包括：

44、模型训练模块，被配置为根据预设拍摄参数对虚拟模型空间进行拍摄，得到多个待定样本图像；所述待定样本图像中包括至少一个虚拟对象；根据目标神经网络模型，从所述多个待定样本图像中确定至少一个目标样本图像；根据所述目标样本图像、所述目标样本图像中的至少一个虚拟对象、以及每个所述虚拟对象对应的虚拟识别结果，获取所述训练样本集；根据所述训练样本集对所述目标神经网络模型进行训练，根据训练后的目标神经网络模型确定所述目标图像识别模型。

45、在一些实施例中，所述模型训练模块，被配置为将所述待定样本图像输入所述目标神经网络模型，得到所述目标神经网络模型输出的所述虚拟对象对应的第一预测识别结果；根据所述虚拟对象对应的所述第一预测识别结果和所述虚拟识别结果，获取第一损失值；所述第一损失值用于表征所述目标神经网络对所述虚拟对象的识别准确度；根据所述第一损失值，从所述待定样本图像中确定所述目标样本图像。

46、在一些实施例中，所述模型训练模块，被配置为确定所述虚拟模型空间中的至少一个目标拍摄位置；根据所述目标拍摄位置和所述预设拍摄参数，对所述虚拟模型空间进行拍摄，获取所述待定样本图像。

47、在一些实施例中，所述模型训练模块，被配置为获取所述虚拟模型空间中的至少一个第一待定拍摄位置；根据所述第一待定拍摄位置和所述预设拍摄参数，对所述虚拟模型空间进行拍摄，得到第一待定图像；根据所述第一待定拍摄位置、所述预设拍摄参数和所述第一待定图像，获取所述第一待定拍摄位置对应的训练权重；所述训练权重用于表征在所述第一待定图像的复杂度，或者，所述目标神经网络模型对所述第一待定图像中的虚拟对象的识别准确度；根据所述第一待定拍摄位置和所述训练权重，获取所述目标拍摄位置。

48、在一些实施例中，所述虚拟模型空间为三维模型空间，所述预设拍摄参数包括拍摄位姿；所述模型训练模块，被配置为获取所述第一待定图像中不包含所述虚拟对象的背景像素的像素数目；根据所述第一待定拍摄位置和所述拍摄位姿，确定当前拍摄视角下的三维模型空间的面数；根据所述像素数目和所述面数，计算得到所述第一待定拍摄位置对应的复杂度；根据所述复杂度确定所述第一待定拍摄位置对应的训练权重。

49、在一些实施例中，所述模型训练模块，被配置为将所述第一待定图像输入所述目标神经网络模型，得到所述目标神经网络模型输出的所述虚拟对象对应的第二预测识别结果；根据所述虚拟对象对应的所述第二预测识别结果和所述虚拟识别结果，获取第二损失值；所述第二损失值用于表征所述目标神经网络对所述虚拟对象的识别准确度；根据所述第二损失值确定所述训练权重。

50、在一些实施例中，所述模型训练模块，被配置为根据所述训练权重，从所述第一待定拍摄位置中确定至少一个第二待定拍摄位置；根据所述第二待定拍摄位置确定所述目标拍摄位置。

51、在一些实施例中，所述模型训练模块，被配置为将所述第二待定拍摄位置作为所述目标拍摄位置；或者，根据所述第二待定拍摄位置，获取目标拍摄路径，将所述目标拍摄路径上的位置作为所述目标拍摄位置。

52、在一些实施例中，所述模型训练模块，被配置为将所述训练后的目标神经网络模型作为新的目标神经网络模型，并循环执行所述根据预设拍摄参数对虚拟模型空间进行拍摄至所述根据所述训练样本集对所述目标神经网络模型进行训练的步骤，直至确定训练后的目标神经网络模型满足预设停止迭代条件，将训练后的目标神经网络模型作为所述目标图像识别模型。

53、根据本公开实施例的第三方面，提供一种电子设备，包括：

54、处理器；

55、用于存储处理器可执行指令的存储器；

56、其中，所述处理器被配置为执行本公开第一方面所提供的图像识别方法的步骤。

57、根据本公开实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序指令，该计算机程序指令被处理器执行时实现本公开第一方面所提供的图像识别方法的步骤。

58、根据本公开实施例的第五方面，提供一种芯片，包括处理器和接口；所述处理器用于读取指令以执行本公开第一方面所提供的图像识别方法的步骤。

59、本公开的实施例提供的技术方案可以包括以下有益效果：获取待识别图像；该待识别图像包括至少一个目标对象；将该待识别图像输入目标图像识别模型，得到目标对象的目标识别结果；其中，该目标图像识别模型为根据训练样本集对目标神经网络模型进行训练得到的模型，该训练样本集包括至少一个目标样本图像、目标样本图像中的至少一个虚拟对象、以及每个虚拟对象对应的虚拟识别结果；该目标样本图像为根据目标神经网络模型从多个待定样本图像中确定的图像；该待定样本图像为根据预设拍摄参数对虚拟模型空间进行拍摄得到的图像；该虚拟模型空间包括虚拟环境信息、虚拟对象、以及每个虚拟对象对应的虚拟识别结果。这样，通过虚拟模型空间可以获取大量的待定样本图像，根据目标神经网络模型从多个待定样本图像中确定目标样本图像，从而可以方便快速的获取大量目标样本图像，并根据目标样本图像对该目标神经网络模型进行训练，提高了模型训练的效率，并可以提高训练后得到的目标图像识别模型的图像识别准确度。

60、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王铎暾,王显,李雅楠,王晓涛,雷磊
技术所有人：北京小米移动软件有限公司
我是此专利的发明人

上一篇：机油变化量预测方法、装置、电子设备和存储介质与流程
上一篇：编码方法、装置及存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。