一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法

文档序号：32348642发布日期：2022-11-26 12:11阅读：来源：国知局

技术特征：
1.一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法，其特征在于，包括以下步骤：s1：将图像输入到主干网络，提取不同尺度下的特征；s2：将步骤s1中提取的特征输入到基于简化ciou和k-means聚类算法的锚框优化方法的双锚框区域建议网络中获取候选框；s3：采用改进的双候选框交叉替换策略对步骤s2生成的候选框对进行比对、替换，生成包含头部和全身候选框的高质量候选框对；s4：将经过roialign后的头部和全身候选框对应的特征输入全连接层进行融合，生成融合后的特征图信息；s5：根据目标内容对融合后的特征图信息，采用基于改进的损失函数对融合后的特征图信息进行分类和回归处理，获得多个预测框，预测行人的位置和类别信息，其中改进的回归损失函数计算公式见公式(1)：l
e-reploss
＝l
e-attr-α*l
e-repgt-β*l
e-repbox
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)公式(1)中，l
e-reploss
是改进的损失函数，l
e-attr
是吸引力损失，l
e-repgt
、l
e-repbox
是排斥力损失，α和β为平衡系数；公式(1)中，吸引力损失l
e-attr
的计算方法见公式(2)，其作用是使目标的预测边界框尽可能靠近自己的真实框：公式(2)中，b和分别表示行人的预测边界框和与之对应的真实框，w表示预测边界框的宽，h表示预测边界框的高，表示真实框的宽，表示真实框的高，c表示两个边界框最小外接矩形的对角线，ρ表示两个边界框最小外接矩形的中心点的距离，c
w
和c
h
分别为两个边界框最小外接矩形的宽和高；公式(1)中，l
e-repgt
为预测边界框与相邻目标真实框的排斥力损失函数，计算方法见公式(3)：公式(3)中，是b与所有真实框交并比值第二大时的真实框，和是其对应的宽和高；公式(1)中，l
e-repbox
为行人预测边界框与相邻行人预测边界框损失函数，计算方法见公式(4)：公式(4)中，b
i
和b
j
表示行人i跟行人j的预测边界框，w
i
、h
i
表示行人i的预测边界框的宽跟高，w
j
、h
j
表示行人j的预测边界框的宽跟高；s6：剔除冗余预测框，输出带有最优预测框的图像。2.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行
人检测方法，其特征在于，所述步骤s1，进一步包括步骤s11至步骤s12：s11：加载在imagenet分类数据集上预训练后生成的深度残差卷积神经网络模型resnet50；s12：将待检测的图像输入到深度残差卷积神经网络resnet50中提取不同尺度下的深度卷积特征。3.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法，其特征在于，所述步骤s2，进一步包括步骤s21至步骤s22：s21：采用基于简化ciou和k-means聚类算法的锚框优化方法对双锚框区域建议网络进行锚框优化，进一步包括步骤s211至步骤s215：s211：将数据集中所有全身标注框的宽和高(x
i
,y
i
)作为待聚类样本，其中，i∈(1,2,...n)，n为样本个数，x
i
为第i个标注框的宽，y
i
为第i个标注框的高；s212：给定k个聚类中心点的坐标(sw
j
,sh
j
)，其中，(sw
j
,sh
j
)为第j个聚类中心点的坐标，j∈(1,2,...k)，k为聚类中心点的数量；s213：根据l
s-ciou
计算每个标注框到每个聚类中心的距离，计算公式见公式(5)，将标注框分配给距离最近的聚类中心；d＝l
s-ciou
[(sw
i
,sh
i
),(sw
j
,sh
j
)]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)公式(5)中，d表示标注框到聚类中心的距离，i∈(1，2，
…
，n)，j∈(l，2，
…
k)，l
s-ciou
为k-means聚类算法中距离计算公式，(sw
i
,sh
i
)为第i个标注框中心位置坐标，l
s-ciou
计算公式见公式(6)：l
s-ciou
＝1-iou+αν
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)公式(6)中，v是宽高比，a是动态权重因子，其中，α的计算方法见公式(7)：公式(7)中，宽高比v的计算方法见公式(8)：公式(8)中，(sw
gt
,sh
gt
)为真实框中心位置坐标，(sw,sh)为标注框中心位置坐标；s214：所有标注框分配完毕以后，对每个簇重新计算聚类中心，计算方法见公式(9)：公式(9)中，(sw’,sh’)为重新计算的第i个类簇的聚类中心位置坐标，n
i
为第i个类簇中对象个数，∑sw
i
为第i个类簇中所有对象横坐标sw向量的和，∑sh
i
为第i个类簇中所有对象纵坐标sh向量的和；s215：重复步骤s213、s214，直到聚类中心不再改变；s22：将步骤s1中提取的特征输入到基于简化ciou和k-means聚类算法的锚框优化方法的双锚框区域建议网络中，由rpn-h和rpn-b生成符合数据集的头部和全身候选框对。4.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法，其特征在于，所述步骤s3，进一步包括以下步骤s31至步骤s32：
s31：设定第一阈值；s32：对rpn-b的低质量头部候选框和rpn-h高质量头部候选框计算交并比，若交并比值大于步骤s31所述的第一阈值，则将rpn-b的头部候选框替换为rpn-h的头部候选框；将替换后头部候选框与rpn-b中身体候选框拼接，最终形成一对高质量候选框对。5.如权利要求1所述的一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法，其特征在于，所述步骤s6，进一步包括步骤s61至步骤s62：s61：通过非极大值抑制法筛选出所述最优预测框；s62：通过open cv将带有最优预测框的图像绘制到操作界面的结果输出框，并进行输出。6.如权利要求6所述的非极大值抑制法筛选出所述最优预测框，其特征在于，所述步骤s61，进一步包括步骤s611至步骤s615：s611：通过联合非极大值抑制的方法，同时利用输出的头部和全身边界框的信息，加权两种边界框的类别得分作为边界框排序的置信度；s612：将置信度最高的预测框记录到最终输出列表中，并将步骤s611所述置信度最高的预测框从预测框列表中删除；s613：计算所述预测框列表中剩余预测框的面积；并根据所述剩余预测框的面积，计算所述置信度最高的预测框与剩余预测框的重叠度；s614：将所述剩余预测框中大于阈值的预测框，从所述预测框列表中删除；s615：重复步骤s612-s614，直到所述预测框列表为空。

技术总结
本发明提供了一种基于改进双候选框交叉替换策略和损失函数的拥挤场景行人检测方法，包括以下步骤：S1：将图像输入到主干网络，提取不同尺度下的特征；S2：将步骤S1提取的特征输入到基于简化CIoU和K-means聚类算法的锚框优化方法的双锚框区域建议网络中获取候选框；S3：采用改进的双候选框交叉替换策略对步骤S2生成的候选框对进行比对、替换，生成高质量候选框对；S4：将经过RoI Align后的头部和全身候选框对应的特征输入全连接层进行融合，并得到特征图信息；S5：采用改进的损失函数对融合后的特征图信息进行分类和回归处理，预测行人的位置和类别信息；S6：剔除冗余预测框，输出带有最优预测框的图像。该方法有效降低了拥挤场景下行人检测的误检率和漏检率。下行人检测的误检率和漏检率。下行人检测的误检率和漏检率。

技术研发人员：周欣欣孟炫宇张龙衣雪婷郭月晨薛青常李茂源杨峰
受保护的技术使用者：东北电力大学
技术研发日：2022.07.20
技术公布日：2022/11/25

完整全部详细技术资料下载

当前第2页1 2