密集型人脸检测方法、装置及计算机设备

文档序号:41643464发布日期:2025-04-15 15:59阅读:4来源:国知局
密集型人脸检测方法、装置及计算机设备

本发明涉及人脸识别,尤其是指一种密集型人脸检测方法、装置及计算机设备。


背景技术:

1、随着人脸识别技术的快速发展,人脸识别在门禁系统,智能防护等领域的应用越来越广泛。通过人脸识别技术可以快速及零接触地对被识别者进行身份识别,具有非常大的应用前景。然而目前主流的人脸识别技术主要针对近距离下的目标识别与检测,且每次检测的目标通常仅为单个,对该区域的多目标并没有进行识别判定,应用场景仍较为有限。

2、因此,针对在社区街道、校园、火车站出入口、地铁站进出口等这类重要的、需要进行人流管控的人流量较大的场合,需要提供了一种能够快速准确识别并判断统计场合内人脸数量的方法,以实现对人群数量的统计以及协助管理员分流人群。


技术实现思路

1、本发明所要解决的技术问题是:提供一种密集型人脸检测方法、装置及计算机设备,旨在解决多人脸的快速人脸识别问题。

2、为了解决上述技术问题,本发明采用的技术方案为:一种密集型人脸检测方法,包括:

3、导入训练集图片训练改进的yolov8模型,得到视觉检测模型;所述改进的yolov8模型包括:在通用的yolov8模型的c2f模块中引入ham混合注意力机制;引入小目标检测头;采用归一化wasserstein距离作为计算训练模型与实际模型之间的相似性的度量标准;引入了block重参数,以优化整个yolov8模型的运行速度;

4、将视觉检测模型部署模型到开发板;

5、利用tensorrt引擎对视觉检测模型进行加速处理;

6、通过视觉检测模型对摄像头采集的图像进行目标检测;

7、判断识别区域内人脸的数量是否大于预设的目标数量;

8、若识别区域内人脸的数量大于预设的目标数量,则向管理人员发出提示。

9、进一步的,所述改进的yolov8模型包括backbone网络、neck网络及head网络;所述导入训练集图片训练改进的yolov8模型,得到视觉检测模型包括:

10、将训练集图片导入到改进的yolov8模型转换为预设大小的图片;

11、将预设大小的图片输入到backbone网络中,通过引入ham混合注意力机制的进行c2f模块进行多次重复运算提取特征,输出第一指定规格的图片;

12、将第一指定规格的图片输入到neck网络进行多次的重复特征图计算,输出第二指定规格的图片;

13、将第二指定规格的图片输入到head网络中进行特征图拼接,拼接后的特征图作为检测头检测判定的特征,得到视觉检测模型。

14、进一步的,所述利用tensorrt引擎对视觉检测模型进行加速处理,包括:

15、在推理前,tensorrt使用校准数据集来估算视觉检测模型的权重和激活值的动态范围;

16、通过校准数据集确定视觉检测模型的每一层的最小值和最大值,设一层激活值的最大范围是[-m,m],int8数值的范围是[-127,127],则缩放因子s为:

17、

18、实际推理时,浮点数激活值x经过量化后变为:

19、xint8=round(s*x)

20、推理结束时,用相同的缩放因子s将int8结果反量化为浮点数:

21、

22、在推理过程中,gpu使用特定的int8内核进行计算,完成视觉检测模型的加速处理。

23、进一步的,所述在通用的yolov8模型的c2f模块中引入ham混合注意力机制具体为,在c2f模块的输入特征输入分支的平均池化及最大池化后求和,让yolov8模型分别学习到对应目标的程度信息及对应目标的判别性特征;通过最大池化编码目标的显著性信息,以补充平均池化编码的全局信息。

24、进一步的,所述最大池化的计算公式为:

25、max_o[i,j]=max(input[i*size:(i+1)*size,j*size:(j+1)*size])

26、其中,max_o[i,j]表示池化后的输出特征图中的某个像素值,input是输入特征图,s ize是池化操作的窗口大小;

27、平均池化的计算公式为:

28、ave_o[i,j]=mean(input[i*size:(i+1)*size,j*size:(j+1)*size])

29、其中,ave_o[i,j]表示池化后的输出特征图中的某个像素值,input是输入特征图,s ize是池化操作的窗口大小,mean表示求里面的像素的平均值。

30、进一步的,所述采用归一化wasserstein距离作为计算训练模型与实际模型之间的相似性的度量标准中,采用高斯分布,公式为:

31、

32、其中,μ是分布的均值,代表分布的中心位置;σ是标准差,表示分布的宽度;exp表示自然指数函数。

33、进一步的,所述引入block重参数,以优化整个yolov8模型的运行速度包括:

34、将可重新参数化双分辨率网络放入c2f模块,将c2f模块内部的bottleneck函数模型替换为rdrnet函数模型,利用可重新参数化双分辨率网络获得浅层特征,把特征图分流到语义分支和细节分支,语义分支用于学习深层语义信息,细节分支用于捕获空间细节信息。

35、本发明还提供了一种密集型人脸检测装置,包括:

36、模型训练模块,用于导入训练集图片训练改进的yolov8模型,得到视觉检测模型;所述改进的yolov8模型包括:在通用的yolov8模型的c2f模块中引入ham混合注意力机制;引入小目标检测头;采用归一化wasserstein距离作为计算训练模型与实际模型之间的相似性的度量标准;引入了block重参数,以优化整个yolov8模型的运行速度;

37、模型部署模块,用于将视觉检测模型部署模型到开发板;

38、模型加速模块,用于利用tensorrt引擎对视觉检测模型进行加速处理;

39、人脸检测模块,用于通过视觉检测模型对摄像头采集的图像进行目标检测;

40、人脸数量判断模块,用于判断识别区域内人脸的数量是否大于预设的目标数量;

41、人脸数量预警模块,用于若识别区域内人脸的数量大于预设的目标数量,则向管理人员发出提示。

42、本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如上任一项所述的密集型人脸检测方法。

43、本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如上任一项所述的密集型人脸检测方法。

44、本发明的有益效果在于:通过在通用的yolov8模型的c2f模块中引入ham混合注意力机制;引入小目标检测头;采用归一化wasserstein距离作为计算训练模型与实际模型之间的相似性的度量标准;引入了block重参数,以优化整个yolov8模型的运行速度;能够快速准确识别并判断统计场合内人群数量,超过预设数量时,及时进行预警,方便管理员分流人群。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1