一种针对固定场景的异常检测用的样本底库生成方法与流程

文档序号:33887845发布日期:2023-04-21 00:22阅读:72来源:国知局
一种针对固定场景的异常检测用的样本底库生成方法与流程

本发明涉及数字图像处理领域,提供了一种针对固定场景的异常检测用的样本底库生成方法。


背景技术:

1、在现有市场化的异常检测中异常样本极度缺失的情况下,有效底库作为正常样本的数据储存中心,能够为异常检测系统提供比对模板,将当前图像与预先储备当前点位的底图集做对比,找出差异区域及特征信息。异常检测系统是建立在正常样本库的基础上,所以针对异常检测系统的首要任务便是生成有效正常样本底库图。

2、正常样本的底图数据质量与异常检测效果息息相关,但是在传统检测方案里存在的问题:

3、1)对异常样本的高依赖性,没有出现过的异常很难得到高召回率;

4、2)正常样本库冗余或低代表性,入库规则没有针对检测场景多种状态做到高定制化;

5、3)检测时间长,资源利用率低,精度欠缺。


技术实现思路

1、本发明的目的在于针对无法穷举的异常缺陷建立多状态下的正常样本底库,对检测场景定制化入库规则,提高底库图片的代表性,能够有效的减低检测时间,提高检测效率,提高资源利用率。

2、为了实现上述目的本发明采用以下技术手段:

3、一种针对固定场景的异常检测用的样本底库生成方法,包括以下步骤:

4、步骤1、创建采集文件,以每个检测场景为检测点,采集多种状态下的图片数据集,以检测场景为单位储存对应的被检测对象的图片数据集;

5、步骤2、对步骤1得到的图片数据集进行初筛选,采用finch聚类生成初版底图集以及建立二次筛选底图集;

6、步骤3、待检测对象roi配置信息获取,对步骤1得到的图片数据集,进行获取roi区域绘制,roi区域对应灵敏度分为“低敏感”、“中低敏感”、“中敏感”、“中高敏感”、“高敏感”;roi的配置是将低敏感区域的像素值变小,便于后期面积或者宽高比对像素的操作,对低敏感区减少上报过滤。

7、步骤4、将二次筛选底图集里面的图片依次与初版底图集中最相似的图片求异常区域,当异常区域大于设定的阈值,则将当前二次筛选底图集的图片加入初版底图集。

8、上述技术方案中,步骤2具体包括以下步骤:

9、以“检测点”为单位进行快速finch聚类,通过将点位下每个图片数据转化为数据点,使用随机kd树算法对每一个数据点进行计算获得第一个“最近邻居”。计算出最近邻,得到如邻接矩阵,根据下式对邻接矩阵的样本进行连接:

10、

11、上式的含义为:图片数据转化为的数据点下面简称样本

12、a.连接样本i的最近邻;

13、b.如果样本j的最近邻是i,也进行连接;

14、c.如果样本i和样本j的最近邻一致,也进行连接;

15、其中ki1表示样本i的最近邻索引;

16、其中连接在一起的样本点即为同一个聚类,finch聚类出m类,取不同的类别的第一张作为初版底图集即m*1张,其余所有图片为二次筛选底图集

17、上述技术方案中,步骤3具体包括以下步骤:

18、步骤3.1、获取多检测场景的每个检测场景的采集到的图片数据集;

19、步骤3.2、在图片数据集中的图片中进行巡检时强关注区域以及弱关注区域的标记;

20、步骤3.3、根据标记绘制每个检测场景的roi区域。

21、上述技术方案中,步骤4具体包括以下步骤:

22、步骤4.1、将初版底图作为底库,将二次筛选底图里面的图片依次作为测试图片;

23、步骤4.2、逐一将二次筛选底图集的图片和初版底图中所有图片做差值,得到单张二次筛选底图与所有的单张初版底图集的差值图的集合,遍历差值图的集合对每一张差值图的所有数值进行相加求和得到每张差值图的差异值,取得差异值最小的top1,top2,top1为与单张二次筛选底图最相似的一级图片、top2为与单张二次筛选底图最相似的二级图片;

24、步骤4.3、首先使用尺度不变特征sift得到单张二次筛选底图与“top1”的特征点,即可分别得到各自的特征点集,使用knn方法将单张二次筛选底图的特征点和“top1”中特征点一一配对,计算从单张二次筛选底图特征点集到“top1”特征点集的单应性矩阵h,单张二次筛选底图和h相乘,则可得到和“top1”对齐的图片。

25、步骤4.4、将上一步骤中已与“top1”对齐后的单张二次筛选底图与“topl”进行差分,取得最大通道差异图,对二次筛选底图的不同灵敏度区域的像素值去乘以步骤3所述的灵敏度对应的系数,高敏感度区域的像素值变大,低敏感的区域像素值变小,输出roi匹配之后的最大通道差异图,roi匹配之后的得到单张二次筛选底图与“top1”的最大通道差异图,记为topl最大通道差异图;

26、步骤4.5、单张二次筛选底图与“top2”进行处理,得到单张二次筛选底图与“top2”的最大通道差异图,记为top2最大通道差异图;

27、步骤4.5.1、首先使用尺度不变特征sift得到单张二次筛选底图与“top2”的特征点,即可分别得到各自的点集,使用knn方法将单张二次筛选底图点集和“top1”中特征点一一配对,计算从单张二次筛选底图点集到“top2”点集的单应性矩阵h,单张二次筛选底图和h相乘,则可得到和“top2”对齐的图片。

28、步骤4.5.2、将步骤4.5.1中已与“top2”对齐后的单张二次筛选底图与“top2”进行差分,取得最大通道差异图,对二次筛选底图的不同灵敏度区域的像素值去乘以步骤3所述的灵敏度对应的系数,高敏感度区域的像素值变大,低敏感的区域像素值变小,输出roi匹配之后的最大通道差异图,roi匹配之后的得到单张二次筛选底图与“top2”的最大通道差异图;

29、(引用top1和top2的目的是防止单张二次筛选底图和正常样本底图由于非人为原因造成或阈值设定不当造成的异常区域偶然性,比如光照,取top1及top2异常区域的交集则严格了正常样本进入底图的严谨性,保留更多多状态下的正常样本)

30、步骤4.6、对top1最大通道差异图和top2最大通道差异图分别进行非异常区域进行过滤,得到过滤后的topl的异常区域和top2异常区域;

31、步骤4.7、取topl的异常区域与top2异常区域的交集作为最终异常区域,当最终异常区域大于阈值,将测试图片转成底库图片。

32、上述技术方案中,步骤4.6包括:

33、异常宽高比分析:当异常区域在阈值的异常宽高比阈值范围内,将异常区域像素值乘以0.1,降低该异常宽高比区域的像素值,再输出异常区域;

34、异常面积过滤:当异常区域的面积小于异常面积的阈值范围内,对该异常区域进行过滤,不认定为异常区域;

35、异常密度过滤:将异常区域的像素值求和除以异常区域面积,取得异常区域密度值,当异常区域密度值小于异常密度的阈值范围内,对该异常区域进行过滤,不认定为异常区域;

36、异常边缘过滤:待检测图像中存在的不仅仅是规则的多边形,也会存在各种曲线,针对这种曲线对不齐的区域,采取如下过滤方案:

37、取出单张二次筛选底图最大通道差异图及待匹配图像的异常区域;

38、分别对两张异常区域通过sobel算子取出边缘梯度图,并将两张图进行差分,求得异常区域的边缘异常图;

39、对异常区域的边缘异常图进行膨胀处理连通,取得所有差异区域的列表,对所有的差异区域列表求得面积,当列表中最大的差异小于阈值所在的面积时,对该异常区域进行过滤,不认定为异常区域。

40、因为本发明采用上述技术手段,因此具备以下有益效果:

41、一、本提案通过多阶段多尺度针对检测场景聚类正常样本底库方法,找到图片所存在的规律,根据检测场景设定不同的阈值条件,则可高效定制该检测场景入库规则,形成多状态下的正常样本底图库,减负冗余的底库图片,加快检测效率及提高资源利用率。

42、二、传统储存在底库集里较多存储为图片的特征向量,用于对待检测图片提取特征向量与底库集里面的特征向量做比对,检索相似度达到设定阈值极为高相似图片,但是当异常区域较小时很难保证高召回率,而当用于待检测图片与正常样本底库图做异常检测时,正常样本底库图往往冗余并且很难具备多种状态下正常样本的代表性,而本方案中写到的通过四个阶段去自动化制定入库规则,有效的保证的底库图片的科学性及代表性,并且没有出现过的异常也能在底库图片比对中表现出高召回率。

43、三、入库规则中根据检测场景设定动态的阈值条件,可以为检测场景定制化入库规则,不需要更多的花时间实时训练模型得到结果,可调整性和解释性强。

44、四、多状态下的正常样本的数据代表性越强数据越少,能够有效的减低检测时间,提高检测效率,提高资源利用率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1