一种基于背景建模的运动目标检测方法及相关装置与流程

文档序号:39714514发布日期:2024-10-22 13:00阅读:12来源:国知局
一种基于背景建模的运动目标检测方法及相关装置与流程

本发明属于运动目标检测,特别涉及一种基于背景建模的运动目标检测方法及相关装置。


背景技术:

1、在计算机视觉领域目标识别是非常重要的基础任务,背景建模和运动目标检测是实现目标识别的方法之一,能够自动识别静止场景图像中的运动目标。背景建模和运动目标检测可以广泛应用于安防监控和智慧交通等领域,例如安防系统可以通过背景建模和运动目标检测技术实现对入侵者的监测和报警。

2、背景建模是指通过分析图像序列中的像素值,提取出背景信息并建立背景模型,从而实现对背景和前景的区分。它是许多计算机视觉任务的基础,如运动目标检测、行人跟踪和视频分析等。背景建模的关键问题是如何在不同光照条件下准确地估计背景模型,以便更好地检测运动目标。

3、传统的背景建模方法主要基于统计学模型,如高斯混合模型(gmm)和自适应背景平均(abm)。高斯混合模型假设每个像素的像素值是由一个或多个高斯分布组合而成,而自适应背景平均方法则通过对每个像素的像素值进行平均来建模。然而,这些方法对于复杂场景的处理效果有限,比如光照变化和动态场景等。近年来,基于深度学习的背景建模方法逐渐成为研究的热点,深度学习模型能够自动提取图像的特征,并具有较强的非线性建模能力,可以更好的适应不同场景的复杂性。

4、传统的基于高斯混合模型的背景建模方法对光影变化、复杂背景和长时间运动的适应性较差;基于深度学习的背景建模方法虽然对复杂背景对适应能力更强一些,但其计算量较大,不便于在计算资源有限对硬件平台部署。背景建模和运动目标检测技术仍然面临着一些挑战,光影变化和复杂背景可能会导致背景模型的不准确性,进而对运动目标产生误报。


技术实现思路

1、本发明的目的在于提供一种基于背景建模的运动目标检测方法及相关装置,以解决传统方式计算量大、背景模型不准确的问题。

2、为实现上述目的,本发明采用以下技术方案:

3、第一方面,本发明提供一种基于背景建模的运动目标检测方法,包括:

4、构建包括工作背景和候选背景的背景模型,对待检测图像的每个像素建立背景模型数据;

5、背景模型匹配函数调用码字匹配函数,将像素顺序与工作背景每一个码字进行匹配,如果与其中一个匹配上,则将其输出为匹配码字,得到前景像素图像;

6、通过背景模型匹配获得前景像素图像后,将像素聚合为区域得到前景区域图像;

7、对前景区域图像进行干扰区域抑制,输出的运动区域集合。

8、可选的,构建包括工作背景和候选背景的背景模型,对待检测图像的每个像素建立背景模型数据,包括:

9、工作背景由最多四个背景码字值组成,如果当前像素值与这四个背景码字值中的任何一个相匹配,则此像素点为背景,否则为前景;候选背景由一个背景码字组成,在当前像素与工作背景不匹配时,使用其建立候选背景;初始状态时工作背景和候选背景码字为空。

10、可选的,背景模型匹配函数调用码字匹配函数,将像素顺序与工作背景每一个码字进行匹配,如果与其中一个匹配上,则将其输出为匹配码字,得到前景像素图像:

11、输入图像imgin,frm_cnt=frm_cnt+1;

12、对于每一个坐标为像素坐标为xy的像素pix=imgin(xy),计算其与工作背景的匹配函数{mat_succur,mat_cwcur}=mat_pix_to_bgm(pix,bgmcur),如果匹配成功,则置imgfg-m(xy)=0,并调用函数码字更新函数upate_cw_from_pix(cw,pix)对匹配成功的码字mat_cw进行更新,否则imgfg-m(xy)=1,其中imgfg-m定义为背景模型匹配获取的前景;

13、码字匹配函数mat_suc=mat_pix_to_cw(pix,cw)定义如下:

14、i=(r+g+b)/3

15、δi=abs(it-im)

16、||pix||2=(r2+g2+b2)

17、<pixt,pixm>=(rtrm+gtgm+btbm)

18、

19、如果δi<2σi并且δc<2σc,则匹配成功;

20、码字更新函数upate_cw_from_pix(cw,pix)定义如下:

21、pixm=(1-ρ)×pixm+ρ×pixt,其中ρ为学习速率

22、σi=(1-ρ)×σi+ρ×δi,

23、σc=(1-ρ)×σc+ρ×δc,

24、f=f+1

25、λ=max(λ,frm_cnt-tl)

26、tf=tf

27、tl=frm_cnt

28、另外,如果某个码字当前没有匹配上,则λ=λ+1。

29、可选的,如果与工作背景匹配失败,则将像素pix=imgin(xy)与候选背景匹配,同样调用匹配函数{mat_succac,mat_cwcac}=mat_pix_to_bgm(pix,bgmcac),如果匹配成功,则调用函数码字更新函数upate_cw_from_pix(cw,pix)对匹配成功的码字mat_cw进行更新,否则调用码字初始化函数cw=init_cw_from_pix(pix)新建候选背景码字;码字初始化函数cw=init_cw_from_pix(pix)定义如下:

30、cw={pixt,σi0,σc0,1,0,frm_cnt,frm_cnt}。

31、可选的,如果工作背景中的某个码字没有新的像素值与其匹配,则将其从工作背景中剔除;如果候选背景中的某个码字满足状态转换的条件,则将其转移到工作背景中,或者剔除;在候选背景转入工作背景时,在工作背景中选择空闲的空间或者删除最近持续未访问时间最长的背景像素值来腾出空间以容纳新的背景码字;

32、背景码字状态转换的条件:

33、码字从工作背景中剔除的条件函数:is_del_cw_from_cur_bgm(cw,bgmcur)

34、当码字cw满足条件(frm_cnt-tl)>tdel时则从工作背景中剔除,即bgmcur=bgmcur-{cw};

35、码字从候选背景中剔除的条件函数:

36、is_del_cw_from_cache_bgm(cw,bgmcac)

37、当码字cw满足条件((frm_cnt-tf)>nib和λ>(frm_cnt-tf)/ncr)时则从候选背景中剔除,即bgmcac=bgmcac-{cw},其中nib是建立新的工作背景码字所需要的最短时间长度,ncr是码字最长未匹配成功时间间隔比率阈值;

38、码字从候选背景中转移到工作背景的条件函数:

39、is_move_cw_in_cache_bgm(cw,bgmcac)

40、当码字cw满足条件((frm_cnt-tf)>nib和λ≤(frm_cnt-tf)/ncr)时则从将其从候选背景中转移到工作背景,即bgmcac=bgmcac-{cw}和bgmcur=bgmcur+{cw}。

41、可选的,通过背景模型匹配获得前景像素图像后,将像素聚合为区域得到前景区域图像:

42、首先使用数学形态学的开运算和闭运算方法过滤前景像素的噪点;

43、然后使用连通分量标记算法将八连通的像素聚合成前景区域,从而得到运动区域集合:rgsfg={mrg1,mrg2,…,mrglrf},其中运动区域mrg={pos,rgimg},pos是运动区域左上角顶点在原图像中的坐标,rgimg是运动区域的二值图像。

44、可选的,对前景区域图像进行干扰区域抑制,输出的运动区域集合:

45、计算前后两帧图像之间的差分图像frm_diff_img,并取阈值th_diff对差分图像二值化,得到帧间差分前景图像frm_diff_fg,阈值th_diff取值6~12;

46、对运动前景区域mrg提取边界轮廓mrg_outline,并统计轮廓像素数目为nmo;

47、将区域轮廓mrg_outline与帧间差分前景图像相与frm_diff_fg,统计得到属于差分前景的边界像素数目nmd;

48、如果像素数目之比nmd/nmo大于阈值th_mdo,则判定此区域为光影变化区域,th_mdo取值0.6~0.8;

49、对运动前景区域集合rgsfg的每个区域应用上述步骤,过滤掉光影变化区域,得到最后输出的运动区域集合rgsout={mrg1,mrg2,…,mrglro}。

50、第二方面,本发明提供一种基于背景建模的运动目标检测系统,包括:

51、模型构建模块,用于构建包括工作背景和候选背景的背景模型,对待检测图像的每个像素建立背景模型数据;

52、前景像素图像获取模块,用于背景模型匹配函数调用码字匹配函数,将像素顺序与工作背景每一个码字进行匹配,如果与其中一个匹配上,则将其输出为匹配码字,得到前景像素图像;

53、前景区域图像获取模块,用于通过背景模型匹配获得前景像素图像后,将像素聚合为区域得到前景区域图像;

54、检测输出模块,用于对前景区域图像进行干扰区域抑制,输出的运动区域集合。

55、第三方面,本发明提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现一种基于背景建模的运动目标检测方法的步骤。

56、第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现一种基于背景建模的运动目标检测方法的步骤。

57、与现有技术相比,本发明有以下技术效果:

58、本发明使用码本方法对多模态背景进行建模,图像像素的背景模型由工作背景和候选背景组成,对于动态变化的场景,工作背景的多个码字可以模拟像素值的动态变化,候选背景的码字可以学习新的像素值,从而可以适应树枝晃动和水波荡漾等复杂场景。

59、本发明的码本模型数据结构设计简单,每个像素的的背景模型占用40个字节(单个码字10个字节,工作背景和候选背景共4个码字),消耗的内存较少;不像混合高斯模型需要迭代优化计算,码字的匹配和更新操作仅使用一些简单的乘加和比较运算,计算效率较高。

60、本发明结合时空变化光影区域抑制方法,统计前景区域轮廓在空间域(背景匹配)和时间域(帧间差分)的变化特征。然后使用时空变化特征辨识光影变化区域。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1