基于卷积神经网络的目标检测识别的方法与流程

文档序号：34264649发布日期：2023-05-25 06:01阅读：57来源：国知局

本发明属于图像处理应用，尤其涉及一种基于卷积神经网络的目标检测识别的方法。

背景技术：

1、卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类，因此也被称为“平移不变人工神经网络”。随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。

2、目标检测领域从r-cnn开始，通过引入卷积神经网络取得了很多突破性的进展，但是始终未能摆脱传统候选区域算法(如selective search)的限制。使用selective search算法进行候选区域的确定使得fast r-cnn算法的运算时间大大增加，使得fast r-cnn网络结构模型在实时性方面达不到要求。为了解决候选区域提取这个瓶颈，进一步共享卷积运算，任少卿等人在2016年提出了faster r-cnn，有效的解决上述问题。

3、faster r-cnn网络由两个模块组成，rpn网络与fast r-cnn网络。rpn网络主要对可能的目标候选区域进行预测提取，对目标进行初步定位。fast r-cnn网络将区域建议框映射到特征图上，对感兴趣的区域进行类别判断和回归修正，从而区分出目标与背景，达到目标区域框筛选细化的目的。两个模块共享全图提取的特征图和卷积权重，每个位置同时预测目标边界和得分。该网络模型将生成候选区域、分类及回归都融合到一个网络框架中，对尺度和光照等具有不变性，且算法检测精度较为理想。该网络模型将选择性搜索方法换成区域建议网络，在特征图上精准的提取候选区域特征，实现真正的端到端计算，缩短候选框提取时间，极大地提高检测速度与精度，实现快速实时目标检测训练测试。faster r-cnn算法在特征提取网络的最后一个特征图上直接进行目标框的预测等后续操作，忽略了目标前后语义信息的关联性，对小目标物体的检测性能有所欠缺。

技术实现思路

1、本发明针对上述faster r-cnn算法针对小目标物体的检测性能欠缺的技术问题，提出一种方法简单、操作方便且能够提高对小目标物体的检测性能的基于卷积神经网络的目标检测识别的方法。

2、为了达到上述目的，本发明采用的技术方案为，本发明提供一种基于卷积神经网络的目标检测识别的方法，包括以下步骤：

3、a、首先将待识别的图输入到改进后的主干网络vgg16中进行特征提取，得到相应的特征图；

4、b、将得到的特征图分别输入到rpn网络和注意力机制中，其中，特征图输入到rpn网络进行感兴趣区域的选取，生成候选区域；特征图输入到注意力机制中进行加权运算，生成注意力图；

5、c、然后将rpn网络和注意力机制中的输出结果均输入roi池化层中，然后对特征图的候选框进行池化操作；

6、d、将池化操作后的特征图在全连接层对特征信息的类别进行判定分类；

7、e、最后，利用边框回归再次对候选框的位置进行精修与调整，实现目标检测识别；

8、其中，所述改进后的主干网络vgg16的操作方法为：

9、a1、首先，利用卷积核1×1×256使浅层特征通道数变为256，使深层特征通道数也变为256，之后进行反卷积运算；

10、a2、然后，经过反卷积运算后，利用加性融合函数对浅层特征和深层特征进行特征层融合，得到融合后的特征层；

11、a3、将融合后的特征层再通过3×3的卷积核，生成新的特征层，进而得到相应的特征图。

12、作为优选，所述a2步骤中，对每个卷积层后续步骤均加入批量归一化处理，对尺度相同的模块进行求和操作，得到融合后的特征层。

13、作为优选，所述c步骤中，注意力机制使用方法为：首先将特征图利用压缩公式进行压缩，对每个通道的特征值相加求和取其平均值，使输入的特征图的通道数与输出的维度一致。

14、作为优选，压缩公式为：

15、

16、其中zc表示第c个通道压缩后的数值，uc为变换输出u的第c个变量，u∈{u1,u2,...,uc}，h×w表示空间维度。

17、与现有技术相比，本发明的优点和积极效果在于，

18、本发明提供一种基于卷积神经网络的目标检测识别的方法，通过对主干网络vgg16进行改进，将不同层的特征融合起来，使各个尺度下的特征图都含有丰富语义信息，利用正向和反向传递特征进行叠加，使各个卷积层获取不同特性的特征图，整个特征提取过程的鲁棒性得以增强，同时，在rpn网络阶段同时引入注意力机制，使融合后的重要信息得以保留，摒弃多余信息干扰，使整个算法的精度有所提升，对小目标物体的特征提取效果变好。

技术特征：

1.一种基于卷积神经网络的目标检测识别的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于卷积神经网络的目标检测识别的方法，其特征在于，所述a2步骤中，对每个卷积层后续步骤均加入批量归一化处理，对尺度相同的模块进行求和操作，得到融合后的特征层。

3.根据权利要求2所述的基于卷积神经网络的目标检测识别的方法，其特征在于，所述c步骤中，注意力机制使用方法为：首先将特征图利用压缩公式进行压缩，对每个通道的特征值相加求和取其平均值，使输入的特征图的通道数与输出的维度一致。

4.根据权利要求3所述的基于卷积神经网络的目标检测识别的方法，其特征在于，压缩公式为：

技术总结
本发明属于图像处理应用技术领域，尤其涉及一种基于卷积神经网络的目标检测识别的方法。本发明通过对主干网络VGG16进行改进，将不同层的特征融合起来，使各个尺度下的特征图都含有丰富语义信息，利用正向和反向传递特征进行叠加，使各个卷积层获取不同特性的特征图，整个特征提取过程的鲁棒性得以增强，同时，在RPN网络阶段同时引入注意力机制，使融合后的重要信息得以保留，摒弃多余信息干扰，使整个算法的精度有所提升，对小目标物体的特征提取效果变好。

技术研发人员：冯炫,陈帅男,苗思宇,严宁,兰巍
受保护的技术使用者：陕西智引科技有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯炫陈帅男苗思宇严宁兰巍
技术所有人：陕西建材科技集团股份有限公司
我是此专利的发明人

上一篇：一种大分子特种胺专用催化剂及其制备方法与应用与流程
上一篇：一种SaaS平台的权限管理方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。