难样本筛选方法、装置、计算机可读介质及电子设备与流程

文档序号：35971930发布日期：2023-11-09 12:48阅读：27来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本技术涉及人工智能，具体而言，涉及一种难样本筛选方法、装置、计算机可读介质及电子设备。

背景技术：

1、难样本是样本经过算法模型的检测之后确认的包含漏检的目标的样本。

2、随着基于深度学习的人工智能技术的普及，越来越多的业务场景和应用都对智能算法模型有了更多的需求，通常情况下，一个成熟的算法模型需要百万级别的数据量训练才能达到上线标准。即使算法模型上线之后，也会存在难以被算法模型正确检测的难样本。

3、然而，现有的难样本筛选方式通常是采用人工挑拣方式，这种方式不仅效率较低，而且需要消耗大量人力成本。

技术实现思路

1、本技术的实施例提供了一种难样本筛选方法、装置、计算机可读介质及电子设备，进而至少在一定程度上可以提高难样本的筛选效率，并能够节省人力成本。

2、本技术的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本技术的实践而习得。

3、根据本技术实施例的一个方面，提供了一种难样本筛选方法，所述方法包括：将待检测的目标图像输入至目标神经网络中，所述目标神经网络包括特征提取网络、与所述特征提取网络连接的检测头以及分别与所述特征提取网络和所述检测头连接的质量标定模块；通过所述特征提取网络提取出所述目标图像的图像信息特征图，并将所述图像信息特征图分别输入至所述检测头和所述质量标定模块中；通过所述检测头生成与所述图像信息特征图对应的检测结果特征图，并将所述检测结果特征图输入至所述质量标定模块中，所述检测结果特征图用于表征所述目标图像中目标的位置和类别；通过所述质量标定模块对输入的所述图像信息特征图和所述检测结果特征图进行融合和映射操作，得到质量预测分数，并根据所述质量预测分数确定所述目标图像是否为难样本，其中，所述难样本为包含未被所述目标神经网络检测出的目标的图像。

4、根据本技术实施例的一个方面，提供了一种难样本筛选装置，所述装置包括：图像输入单元，用于将待检测的目标图像输入至目标神经网络中，所述目标神经网络包括特征提取网络、与所述特征提取网络连接的检测头以及分别与所述特征提取网络和所述检测头连接的质量标定模块；特征提取和输入单元，用于通过所述特征提取网络提取出所述目标图像的图像信息特征图，并将所述图像信息特征图分别输入至所述检测头和所述质量标定模块中；生成和输入单元，用于通过所述检测头生成与所述图像信息特征图对应的检测结果特征图，并将所述检测结果特征图输入至所述质量标定模块中，所述检测结果特征图用于表征所述目标图像中目标的位置和类别；确定单元，用于通过所述质量标定模块对输入的所述图像信息特征图和所述检测结果特征图进行融合和映射操作，得到质量预测分数，并根据所述质量预测分数确定所述目标图像是否为难样本，其中，所述难样本为包含未被所述目标神经网络检测出的目标的图像。

5、在本技术的一些实施例中，基于前述方案，所述特征提取网络包括骨干网络和与所述骨干网络连接的特征金字塔网络，所述特征提取和输入单元配置为：通过所述骨干网络提取出所述目标图像的基本语义特征图，并将所述基本语义特征图输入至所述特征金字塔网络中；通过所述特征金字塔网络根据所述基本语义特征图生成包含图像高层语义特征信息的图像信息特征图，所述图像高层语义特征信息的特征深度高于所述基本语义特征图中的图像基本语义特征信息的特征深度。

6、在本技术的一些实施例中，基于前述方案，所述确定单元配置为：将所述图像信息特征图和所述检测结果特征图拼接到一起，得到拼接后的特征图；对所述拼接后的特征图进行融合，并将融合结果降维至目标维度；将降维后的融合结果映射为质量预测分数输出。

7、在本技术的一些实施例中，基于前述方案，所述确定单元配置为：通过第一卷积层和修正线性单元激活函数层依次对所述拼接后的特征图进行融合；通过第二卷积层将融合结果降维至预定维度，得到预定维度的融合结果；通过平均池化层将预定维度的融合结果降维至目标维度。

8、在本技术的一些实施例中，基于前述方案，在将待检测的目标图像输入至目标神经网络中之前，所述图像输入单元还用于：获取训练样本集，所述训练样本集包括多个训练样本和与每一训练样本对应的真值标签；将所述训练样本集中的训练样本输入至原始神经网络中，得到所述原始神经网络的质量标定模块输出的质量预测分数和所述原始神经网络的检测头生成的检测结果特征图；根据所述训练样本对应的真值标签和检测结果特征图确定检测任务损失的损失值；对所述检测结果特征图进行后处理操作，得到检测结果，所述检测结果包括用于标记检测出的目标的检测框；根据所述训练样本对应的真值标签和所述检测结果确定质量真实分数，并根据所述质量真实分数和所述质量预测分数确定质量标定损失的损失值；根据所述检测任务损失的损失值和所述质量标定损失的损失值确定训练损失的损失值，并根据所述训练损失的损失值对所述原始神经网络进行训练，以得到目标神经网络。

9、在本技术的一些实施例中，基于前述方案，所述图像输入单元配置为：根据所述训练样本对应的真值标签和所述检测结果确定所述训练样本的所有目标中被正确检测出的目标的数量占比，作为质量真实分数。

10、在本技术的一些实施例中，基于前述方案，在根据所述质量预测分数确定所述目标图像是否为难样本之后，所述确定单元还用于：如果所述目标图像为难样本，则将所述目标图像存储至目标数据库中；根据所述目标数据库中的图像生成新的训练样本，并将所述新的训练样本重新加入所述训练样本集；根据所述训练样本集继续对所述目标神经网络进行优化。

11、在本技术的一些实施例中，基于前述方案，所述目标神经网络包括多个检测头和多个质量标定模块，所述特征提取和输入单元配置为：通过所述特征提取网络提取出所述目标图像的与所述多个检测头分别配对的图像信息特征图，并将各图像信息特征图分别输入至对应的检测头和质量标定模块中；所述确定单元配置为：通过各质量标定模块对输入的图像信息特征图和检测结果特征图进行融合和映射操作，得到各质量标定模块输出的质量预测值；根据各质量标定模块输出的质量预测值确定质量预测分数。

12、在本技术的一些实施例中，基于前述方案，所述确定单元配置为：确定各质量标定模块输出的质量预测值的平均值，作为质量预测分数。

13、根据本技术实施例的一个方面，提供了一种计算机可读介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述实施例中所述的难样本筛选方法。

14、根据本技术实施例的一个方面，提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述实施例中所述的难样本筛选方法。

15、根据本技术实施例的一个方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机指令，所述计算机指令存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令，所述处理器执行所述计算机指令，使得所述计算机设备执行如上述实施例中所述的难样本筛选方法。

16、在本技术的一些实施例所提供的技术方案中，通过在目标神经网络中设置特征提取网络、与特征提取网络连接的检测头以及分别与特征提取网络和检测头连接的质量标定模块，当将待检测的目标图像输入至目标神经网络中之后，通过特征提取网络可以提取出目标图像的图像信息特征图，通过检测头会生成与图像信息特征图对应的检测结果特征图，最终质量标定模块会根据输入的图像信息特征图和检测结果特征图而输出质量预测分数，从而可以根据质量预测分数得到目标图像是否为难样本的筛选结果。因此，本技术实施例所提供的技术方案实现了对难样本的在线自动化筛选，大大提升了难样本的筛选效率，从而能够节省人力和时间成本。

17、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨一帆
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：一种交互方法和相关装置与流程
上一篇：语义解析方法、装置、设备、存储介质及程序产品与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。