图像的目标检测方法、装置与流程

文档序号：35234192发布日期：2023-08-25 02:18阅读：30来源：国知局

本申请涉及车联网领域及人工智能，尤其涉及一种图像的目标检测方法、装置、设备、计算机可读存储介质及计算机程序产品。

背景技术：

1、人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

2、目标检测是人工智能在图像处理方面的重要应用，应用于智慧交通、医疗、等领域。

3、在相关技术中，由于待处理的图像具有较大的随机性，图像场景复杂多变，在有些场景的图像中目标较为聚集，在有些场景的图像中目标较为分散，导致目标检测的准确度较低。对于如何有效检测出图像中各种不同尺度的目标，提高目标检测的准确度，相关技术尚无有效解决方案。

技术实现思路

1、本申请实施例提供一种图像的目标检测方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够有效检测出图像中各种不同尺度的目标，提高目标检测的准确度。

2、本申请实施例的技术方案是这样实现的：

3、本申请实施例提供一种图像的目标检测方法，包括：

4、对图像进行密度图预测处理，得到所述图像的密度图，其中，所述密度图表征所述图像中的目标的密度分布，所述密度图预测处理包括多个不同尺度的池化卷积处理；

5、对所述密度图进行识别聚类处理，得到所述密度图中的多个聚类目标区域；

6、基于所述多个聚类目标区域对所述图像进行裁剪处理，得到一一对应的多个子图像，其中，每个所述子图像包括多个所述目标；

7、对每个所述子图像和所述图像依次进行目标检测处理，得到与每个所述子图像和所述图像一一对应的第一目标检测结果；

8、将每个所述第一目标检测结果进行融合处理，得到与所述图像对应的第二目标检测结果。

9、上述方案中，所述第一金字塔网络和所述第二金字塔网络均包括多个按照尺寸顺序排列的卷积神经网络；所述基于所述第一骨干子网络的第i层次化处理结果调用所述第一金字塔网络进行第一次目标检测处理，得到与所述第一骨干子网络的第i层次化处理结果对应的第一检测结果，包括：基于所述第一骨干子网络的第n层次化处理结果调用所述第一金字塔网络的第n卷积神经网络进行识别处理，得到所述第一金字塔网络的第n识别结果；将所述第一骨干子网络的第i层次化处理结果和所述第一金字塔网络的第i+1识别结果进行加和处理，得到第i+1识别加和处理结果；基于所述第i+1识别加和处理结果调用所述第一金字塔网络的第i卷积神经网络进行识别处理，得到所述第一金字塔网络的第i识别结果，其中，所述第i卷积神经网络的尺寸小于所述第i+1卷积神经网络的尺寸；将所述第一金字塔网络的第i识别结果，确定为与所述第一骨干子网络的第i层次化处理结果对应的第一检测结果。

10、本申请实施例提供一种图像的目标检测装置，包括：

11、密度图预测模块，用于对图像进行密度图预测处理，得到所述图像的密度图，其中，所述密度图表征所述图像中的目标的密度分布，所述密度图预测处理包括多个不同尺度的池化卷积处理；

12、识别聚类模块，用于对所述密度图进行识别聚类处理，得到所述密度图中的多个聚类目标区域；

13、裁剪模块，用于基于所述多个聚类目标区域对所述图像进行裁剪处理，得到一一对应的多个子图像，其中，每个所述子图像包括多个所述目标；

14、目标检测模块，用于对每个所述子图像和所述图像依次进行目标检测处理，得到与每个所述子图像和所述图像一一对应的第一目标检测结果；

15、融合模块，用于将每个所述第一目标检测结果进行融合处理，得到与所述图像对应的第二目标检测结果。

16、本申请实施例提供一种电子设备，包括：

17、存储器，用于存储可执行指令；

18、处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的图像的目标检测方法。

19、本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的图像的目标检测方法。

20、本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的图像的目标检测方法。

21、本申请实施例具有以下有益效果：

22、通过对密度图聚类得到的聚类目标区域，从图像中裁剪出子图像并进行识别，从而相对于识别原始的图像的不同局部分别就进行识别，从而能够更加全面识别图像中小尺度目标，将小尺度目标的检测结果(即第一目标检测结果)作为图像的整体的目标检测结果(即第二目标检测结果)的补充，从而兼顾了图像中的大目标和小目标的检测，有效检测出图像中各种不同尺度的目标，提高了目标检测的准确度。

技术特征：

1.一种图像的目标检测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述图像进行密度图预测处理，得到所述图像的密度图，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述图像调用所述训练后的密度图预测网络进行密度图预测处理，得到所述图像的密度图，包括：

4.根据权利要求1所述的方法，其特征在于，所述对所述密度图进行识别聚类处理，得到所述密度图中的多个聚类目标区域，包括：

5.根据权利要求1所述的方法，其特征在于，所述对每个所述子图像和所述图像依次进行目标检测处理，得到与每个所述子图像和所述图像一一对应的第一目标检测结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述多尺度特征提取处理是通过骨干网络实现的，所述骨干网络包括卷积网络、结构相同的至少一个第一骨干子网络和至少一个第二骨干子网络；所述第一骨干子网络和所述第二骨干子网络均包括多个级联的层次网络，所述多个级联的层次网络的尺寸不同；

7.根据权利要求6所述的方法，其特征在于，所述基于所述卷积处理结果调用所述第一骨干子网络中的多个级联的层次网络进行层次化处理，得到所述第一骨干子网络中每个层次网络的层次化处理结果，包括：

8.根据权利要求7所述的方法，其特征在于，所述基于所述卷积处理结果、所述第一骨干子网络中每个层次网络的层次化处理结果调用所述第二骨干子网络中的多个层次网络进行层次化处理，得到所述第二骨干子网络中每个层次网络的层次化处理结果，包括：

9.根据权利要求8所述的方法，其特征在于，所述层次网络包括规则层次网络和移位层次网络；

10.根据权利要求9所述的方法，其特征在于，所述规则层次网络包括规则窗口、归一化处理层和多层感知层；

11.根据权利要求9所述的方法，其特征在于，所述移位层次网络包括移位窗口、归一化处理层和多层感知层；

12.根据权利要求8所述的方法，其特征在于，所述第一次目标检测处理是通过相同结构的至少一个第一金字塔网络和至少一个第二金字塔网络实现的，所述第一金字塔网络的数量与所述第一骨干子网络的数量相同，所述第二金字塔网络的数量与所述第二骨干子网络的数量相同；

13.根据权利要求8所述的方法，其特征在于，所述第二次目标检测处理是通过级联网络实现的，所述级联网络包括一个区域生成网络和多个池化网络；

14.根据权利要求13所述的方法，其特征在于，所述基于所述区域生成处理结果和所述第一检测结果调用所述多个池化网络进行池化处理，得到与每个所述池化网络对应的池化处理结果，包括：

15.一种图像的目标检测装置，其特征在于，所述装置包括：

技术总结
本申请提供了一种图像的目标检测方法、装置，涉及车联网领域；方法包括：对图像进行密度图预测处理，得到图像的密度图，其中，密度图表征图像中的目标的密度分布；对密度图进行识别聚类处理，得到密度图中的多个聚类目标区域；基于多个聚类目标区域对图像进行裁剪处理，得到一一对应的多个子图像，其中，每个子图像包括多个目标；对每个子图像和图像依次进行目标检测处理，得到与每个子图像和图像一一对应的第一目标检测结果；将每个第一目标检测结果进行融合处理，得到与图像对应的第二目标检测结果。通过本申请，能够有效检测出多媒体图像中各种不同尺度的目标，提高目标检测的准确度。

技术研发人员：刘文龙
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：
技术公布日：2024/1/14

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘文龙
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：机油携带量测量装置的制作方法
上一篇：一种电动牵引车的电池箱支架的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。