一种图像识别算法的自成长方法

文档序号：30955926发布日期：2022-07-30 09:57阅读：178来源：国知局

1.本发明属于图像处理技术领域，具体涉及一种图像识别算法的自成长方法，该方法通过协同训练算法集成以及优化更新的技术来实现实际场景中原生图像识别算法精度的提升。

背景技术：

2.图像识别技术发展至今，已经出现种类繁多的优秀的特征提取和识别方法。目前常见的图像识别算法主要有：brief算法、brisk算法以及orb算法等。其中，brief算法的主要思想是：在特征点周围邻域内选取若干个像素点对，通过对这些点对的灰度值比较，将比较的结果组合成一个二进制字符串用来描述特征点，最后使用汉明距离来计算特征描述子是否匹配。brisk算法原理与brief算法类似，采用邻域采样模式，然后围绕特征点旋转角度，对所有的特征点对进行灰度值比较。orb算法在brief算法基础上引入了方向的计算方法，并在点对的挑选上使用贪婪搜索算法，挑出了一些区分性强的点对用来描述图像特征。然而，未来图像识别技术应用的环境将更加复杂，单独使用某一类技术会存在一定的局限性，如在目标在图像中的颜色与背景颜色一致、多个目标在图像中重叠在一起、识别的目标在图像中遮挡严重等极端环境下将导致目标的识别率大幅下降。且在实际场景中，目标识别过程千变万化，致使没有哪一种方法是万能的，无论建立的学习模型与实际情况多接近还是考虑有多全面，总会有考虑不周的地方。
3.限于以上原因，单独使用某一种优秀的图像识别算法在实际应用中识别效果往往差强人意。所以，迫切需要一种新的图像识别技术，以改善和优化原生图像识别算法的泛化能力，提高图像的识别准确率。

技术实现要素：

4.本发明的目的在于克服现有技术中存在的上述技术问题，提供了一种图像识别算法的自成长方法，该方法采用集成学习技术与协同优化技术相结合，针对实际场景中单一图像识别优秀算法的集成决策，先通过协同训练原生图像识别算法集成技术实现判别正确的未知图像样本协同更新，再通过协同训练优化更新技术实现自成长算法的协同更新或者自更新，以提高实际场景中原生图像识别算法的精度和泛化能力。
5.为实现上述目的，本发明采用的技术方案如下：
6.一种图像识别算法的自成长方法，其特征在于包括如下步骤：
7.a：对未知图像样本进行预处理，针对预处理后的未知图像样本，采用不同原生图像识别算法进行多次测试并计算每次测试的识别准确率，然后根据识别准确率确定出大于设定阈值的原生图像识别算法的种类和数量；
8.b：采用加权集成机制对步骤a得到的原生图像识别算法进行加权以协同判别正确的未知图像样本，加权完成后得到集成决策算法；
9.c：通过跟踪算法识别未知图像样本并获取伪标签，通过集成决策算法识别未知图
像样本并获取判别标签，基于伪标签与判别标签的比较结果更新算法，实现图像识别算法的自成长。
10.步骤a中，确定原生图像识别算法的种类和数量的具体方法为：针对预处理后的未知图像样本，采用随机组合原生图像识别算法的方式对未知图像样本进行多次测试，每种原生图像识别算法至少被组合一次，计算每次测试的平均识别准确率，然后根据平均识别准确率确定出大于设定阈值的原生图像识别算法的种类和数量。
11.步骤a中，所述的对未知图像样本进行预处理是指对未知图像样本进行去噪处理，最大限度地遏制噪声对未知图像样本中目标的边缘和纹理信息的干扰。
12.步骤a中，所述的原生图像识别算法包括但不限于brief算法、brisk算法、orb算法、r-cnn算法、spp-net算法、fast rcnn算法、r-fcn算法、mask r-cnn算法、cascade r-cnn算法、tridentnet算法、yolo系列算法、ssd系列算法、retinanet算法、cornernet算法、centernet算法。
13.步骤a中，所述的设定阈值不低于60％。
14.步骤b的实现方法为：根据原生图像识别算法之间识别结果的一致性程度，赋予原生图像识别算法在融合决策中不同的权值，进而加权集成以协同判别正确的未知图像样本。
15.步骤b中，权值的确定方法为：
[0016][0017]
式中：n代表的是集成决策算法中原生图像识别算法的数量，η为平衡参数，d
i,j
表示任意两个原生图像识别算法识别结果间的距离，dis表示某个原生图像识别算法与其他原生图像识别算法识别结果间的距离；若某个原生图像识别算法与其他原生图像识别算法识别结果间的一致度越低，则dis值越大；反之，与其他原生图像识别算法识别结果间的一致度越高，则dis值越小；
[0018]
设定1-dis代表某个原生图像识别算法与其他原生图像识别算法识别结果间的一致度，则1-dis在所有一致度总和的占比就是在融合决策中的权值。
[0019]
步骤c的实现方法为：
[0020]
s21：通过跟踪算法多次识别未知图像样本，取置信度最高的标签为伪标签；
[0021]
s22：通过集成决策算法多次识别未知图像样本，取集成决策算法中所有原生图像识别算法置信度均大于给定阈值的最多相同标签为判别标签；
[0022]
s23：判断伪标签与判别标签的一致性，若一致，则协同更新步骤a得到的原生图像识别算法，若不一致，则自更新集成决策算法，实现图像识别算法的自成长。
[0023]
步骤s21中，所述的跟踪算法指步骤a中对应平均识别准确率最高的原生图像识别算法。
[0024]
步骤s22中，所述的置信度的计算方法为：
[0025][0026]
式中：p代表的是任意一个原生图像识别算法对无标签图像样本预测得到的结果，
m表示样本类型数量，表示任意一个原生图像识别算法对样本标签的置信度，当时，表示原生图像识别算法预测的图像样本属于某一类的概率值为1，而属于其他类的概率值为0，此时认为原生图像识别算法出现误判的可能性最小，最可信；反之，当时，表示原生图像识别算法预测的图像样本属于各个类的概率值相同，此时认为原生图像识别算法最不可信；若集成决策算法中所有原生图像识别算法对应的值均大于给定阈值，这时才判定集成决策算法对图像样本具有高置信度，得到判别标签。
[0027]
步骤s22中，所述的给定阈值不低于0.95。
[0028]
采用上述技术方案，本发明的有益技术效果是：
[0029]
1.本发明针对实际场景中单一图像识别优秀算法的综合表现不佳，实现了一种图像识别算法自成长机制，本发明能够根据未知图像样本的实际情况自动确定出最为合适的算法进行识别，有效地提高了图像识别的准确率和精度。具体的，本发明中各步骤的优点如下：
[0030]
步骤a作为前期的准备工作，主要是对当前主流的图像识别算法进行筛选，以便于找出能够最佳适应未知图像样本的组合算法。步骤b采用加权集成机制，赋予识别分类器在融合决策中不同的权值，充分考虑到不同分类器在融合决策中的重要性，进一步提高了系统的学习精度。步骤c是一种决策机制，与步骤b结合起来即是原生图像识别算法的集成决策，最终实现了针对不同图像数据集综合表现最佳的图像识别算法的自成长方法，从而能够实现图像识别的最佳效果。
[0031]
2.本发明采用集成学习技术与协同优化技术相结合，针对实际场景中单一图像识别优秀算法的集成决策，先通过协同训练原生图像识别算法集成技术实现判别正确的未知图像样本协同更新，再通过协同训练优化更新技术实现自成长算法模型的协同更新或者自更新，以提高实际场景中原生图像识别算法的精度和泛化能力。
附图说明
[0032]
图1为本发明的流程示意图。
具体实施方式
[0033]
实施例1
[0034]
本发明公开了一种图像识别算法的自成长方法，主要是针对实际场景中单一图像识别优秀算法的集成决策设计的一种图像识别算法自成长机制。如图1所示，其包括如下步骤：
[0035]
a：对未知图像样本进行预处理，该预处理是指对未知图像样本进行去噪处理，最大限度地遏制噪声对未知图像样本中目标的边缘和纹理信息的干扰，以实现后续准确有效地识别未知图像样本中的目标。预处理完成后，针对预处理后的未知图像样本，再采用不同原生图像识别算法进行多次测试并计算每次测试的识别准确率，然后根据识别准确率确定出大于设定阈值的原生图像识别算法的种类和数量。
[0036]
本步骤需要说明的是，所述的原生图像识别算法包括但不限于brief算法、brisk算法、orb算法、r-cnn算法、spp-net算法、fast rcnn算法、r-fcn算法、mask r-cnn算法、cascade r-cnn算法、tridentnet算法、yolo系列算法、ssd系列算法、retinanet算法、
cornernet算法、centernet算法。当然，在具体实施时，可根据实际情况和需求合理选择一定量的原生图像识别算法。
[0037]
基于上述原生图像识别算法，其种类和数量的具体确定方法为：
[0038]
首先，采用随机组合原生图像识别算法的方式对预处理后的未知图像样本进行多次测试，每种原生图像识别算法至少被组合一次，并计算每次测试的平均识别准确率。
[0039]
其次，由于不同的图像识别算法在不同的数据集上表现不尽相同，故本实施例优选将设定阈值设为60％，以确保更佳的识别效果。然后根据平均识别准确率确定出大于设定阈值的原生图像识别算法的种类和数量，其具体确定方法是先将每次测试得到的平均识别准确率与设定阈值进行对比，根据对比结果选择平均识别准确率大于设定阈值所对应原生图像识别算法，进而确定出原生图像识别算法的种类和数量。
[0040]
b：采用加权集成机制对步骤a得到的原生图像识别算法进行加权以协同判别正确的未知图像样本，加权完成后得到集成决策算法。具体来说就是根据原生图像识别算法之间识别结果的一致性程度，赋予原生图像识别算法在融合决策中不同的权值，进而加权集成以协同判别正确的未知图像样本。
[0041]
本步骤中所述权值的确定方法为：
[0042][0043]
式中：n代表的是集成决策算法中原生图像识别算法的数量，η为平衡参数，d
i,j
表示任意两个原生图像识别算法识别结果间的距离，dis表示某个原生图像识别算法与其他原生图像识别算法识别结果间的距离；若某个原生图像识别算法与其他原生图像识别算法识别结果间的一致度越低，则dis值越大；反之，与其他原生图像识别算法识别结果间的一致度越高，则dis值越小。
[0044]
设定1-dis代表某个原生图像识别算法与其他原生图像识别算法识别结果间的一致度，则1-dis在所有一致度总和的占比就是在融合决策中的权值。
[0045]
需要说明的是，本步骤是原生图像识别算法的集成，传统方法通常采用多分类器投票机制完成对未知图像样本的学习，但是没有考虑不同分类器在融合决策中的重要性。而本步骤根据原生图像识别算法之间识别结果的一致性程度，赋予原生图像识别算法在融合决策中不同的权值，进而加权集成实现判别正确的未知样本协同更新，进一步提高了系统的学习精度。
[0046]
c：通过跟踪算法识别未知图像样本并获取伪标签，通过集成决策算法识别未知图像样本并获取判别标签，基于伪标签与判别标签的比较结果更新算法，实现图像识别算法的自成长。
[0047]
本步骤的具体实现方法为：
[0048]
s21：通过跟踪算法多次识别未知图像样本，取置信度最高的标签为伪标签。其中，所述的跟踪算法指步骤a中对应平均识别准确率最高的原生图像识别算法。
[0049]
s22：通过集成决策算法多次识别未知图像样本，另设定给定阈值不低于0.95，然后取集成决策算法中所有原生图像识别算法置信度均大于给定阈值的最多相同标签为判别标签。
[0050]
其中，所述的置信度的计算方法为：
[0051][0052]
式中：p代表的是任意一个原生图像识别算法对无标签图像样本预测得到的结果，m表示样本类型数量，表示任意一个原生图像识别算法对样本标签的置信度，当时，表示原生图像识别算法的预测图像样本属于某一类的概率值为1，而属于其他类的概率值为0，此时认为原生图像识别算法出现误判的可能性最小，最可信；反之，当时，表示原生图像识别算法预测的图像样本属于各个类的概率值相同，此时认为原生图像识别算法最不可信；若集成决策算法中所有原生图像识别算法对应的值均大于给定阈值，这时才判定集成决策算法对图像样本具有高置信度，得到判别标签。
[0053]
s23：判断伪标签与判别标签的一致性，若一致，则协同更新步骤a得到的原生图像识别算法，若不一致，则自更新集成决策算法，实现图像识别算法的自成长。
[0054]
需要说明的是，本步骤是集成算法的协同优化更新，在传统的协同训练算法中，通常采用显式方法对标签置信度进行估计，而本发明是隐式地判断多种原生图像识别算法预测的结果是否一致，进而比较标签的置信度。如果一个无标签的样本被多个原生图像识别算法预测，所得到的类标签是一样的，则认为该无标签样本置信度高。
[0055]
综合而言，本发明采用了集成学习技术与协同优化技术相结合，先通过协同训练原生图像识别算法集成技术实现判别正确的未知图像样本协同更新，再通过协同训练优化更新技术实现自成长算法的协同更新或者自更新，能够有效提高实际场景中原生图像识别算法的精度和泛化能力，进而达到图像识别的最佳效果。
[0056]
实施例2
[0057]
本实施例对实施例1所述方法进行了验证，如下：
[0058]
本实施例使用flowers-17数据集，该数据集的目标是在给定输入图像时，正确的预测flower的种类。由于背景密集和类内差异等变化因素，flowers-17可认为是一个有挑战的数据集。具体验证过程如下：
[0059]
在flowers-17数据集中选择一张未知图像样本(蒲公英)，分别用brief算法、brisk算法、orb算法、brisk算法+r-cnn算法以及orb算法+r-fcn算法+tridentnet算法五种组合方式对未知图像样本分别进行三次识别测试，得到的平均识别准确率分别为40.23％、41.50％、43.75％、62.30％和71.42％，故根据设定阈值选取orb算法、r-fcn算法和tridentnet算法作为原生图像识别算法，确定出原生图像识别算法的种类为3和数量为3。再选取tridentnet算法作为跟踪算法；根据步骤b权值计算方法赋予原生图像识别算法在融合决策中不同的权值，进而加权集成以协同判别正确的未知图像样本，这里得到集成决策算法，此时系统的识别精度已提高到73.67％；根据步骤c置信度计算方法，用tridentnet算法对未知图像样本进行三次识别，置信度分别为0.71、0.73和0.82，取最高置信度对应的标签蒲公英作为伪标签，用集成决策算法对未知图像样本进行识别得到判别标签向日葵，比较伪标签与判别标签结果不一致，于是自更新集成决策算法直至所有原生图像识别算法置信度均大于给定阈值0.95，此时系统的识别精度提高到了92.44％。综上，本发明有效提高了实际场景中原生图像识别算法的精度和泛化能力，进而达到图像识别的最佳效果。
[0060]
以上所述，仅为本发明的具体实施方式，本说明书中所公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的替代特征加以替换；所公开的所有特征、或所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以任何方式组合。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：殷光强王治国李超李耶王加结杨晓宇
技术所有人：电子科技大学
我是此专利的发明人

上一篇：一种喇叭结构、喇叭清灰方法及装置以及发声设备与流程
上一篇：一种汽车保险杠加工用冲压装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。