场景自适应的视频结构化语义提取摄像机及其方法
【专利摘要】本发明公开了一种场景自适应的视频结构化语义提取摄像机及其方法,涉及视频分析和模式识别【技术领域】。本摄像机的结构是:光学镜头(1)、传感器(2)和主控制器(3)依次连接,实现图像的采集和镜头焦距信息的获取;角度检测器(5)和主控制器(3)连接,实现摄像机倾斜角检测功能;主控制器(3)和DSP图像处理器(4)连接,实现视频分析、运动物体特征提取和识别,以及自适应的视频结构化语义提取。本发明为场景自适应视频结构化语义提取摄像机提供了方案,使摄像机安装更加简单,且易于维护;解决了在各种场景下,对运动物体类型的自动判别,提升了运动物体的判别准确性。
【专利说明】场景自适应的视频结构化语义提取摄像机及其方法
【技术领域】
[0001]本发明涉及视频分析和模式识别【技术领域】,尤其涉及一种场景自适应的视频结构化语义提取摄像机及其方法。
【背景技术】
[0002]随着“平安城市”系统建设的快速发展,对视频监控摄像机的需求急剧增加;受摄像机安装与调试时间长以及配置繁琐的影响,严重制约了项目建设的进程。大量的视频监控摄像机的应用,平台存储的视频数据以I比特级增长,非结构化海量视频数据的查询和检索将耗费大量的人力和时间成本,严重制约了事件的响应速度。
[0003]为了解决现有设备安装、调试、参数配置繁琐和耗费时间较长的问题,并实现重点监控区域的运动目标:车辆与行人,进行实时监控、事件监控、主动监控,采用可自动适应视场场景的智能摄像机实现。该摄像机可自动采集摄像机的安装与拍摄角度、摄像机镜头焦距等参数,同时内嵌高性能03?芯片,实现视频智能分析功能,智能分析算法在获得摄像机的拍摄角度和镜头焦距的情况下,自动调整算法参数,有效提升摄像机设备的智能分析能力。
[0004]现有技术中,胡传平在其发明专利申请“基于视频结构化描述的车辆视频特征提取系统及方法”[⑶2012103565565.5]中,提出了一种基于视频结构化描述的车辆视频特征提取系统,依据车辆底层特征提取器,车辆视频标准特征提取器,车牌及车标分割器,摄像机景深标定及车速计算单元,提取车辆类型,车身颜色,车牌,车标,车辆形式速度等信息。
[0005]吴炬在其发明专利申请“一种具有视频结构化描述功能的智能网络摄像机”[201010119021.7]中,提出了一种具有视频结构化描述功能的智能网络摄像机,依据图像采集单元,分析判别单元和描述单元,直接对拍摄到的监控录像进行分析理解,产生关于视频图像的属性和内容的结构画描述信息。
[0006]吴炬在其发明专利申请“一种具有视频结构化描述功能的网络视频服务器及利用其实现视频分析描述的方法”[20101037848.0]中,提出了一种具有视频结构化描述功能的网络视频服务器及利用其实现视频分析描述的方法,依据视频采集模块、视频分析描述模块及其编码输出模块,实现了对监控视频图像信息的结构化描述信息。
[0007]李超在其发明专利申请“一种基于视频结构化描述的多摄像机目标跟踪方法”[201110433267.6]中,提出了一种基于视频结构化描述的多摄像机目标跟踪方法,利于目标跟踪算法对场景中的感兴趣目标进行跟踪,并对跟踪目标特征进行结构化描述。当目标出现出现在另一个摄像机场景中时,对目标的信息进行对比,若符合条件,则进行接力跟示。
[0008]现有技术中的上述系统和方法虽然对视频结构化语义方法进行了探索与应用,但在应用过程中过于繁琐,且不能适应环境变化,应用中安装和维护的工作量较大,限制了该类设备的推广与应用。
【发明内容】
[0009]本发明的目的是为了解决上述应用和技术中的问题,提供一种场景自适应的视频结构化语义提取摄像机及其方法,以提升摄像机设备的安装与调试效率,以及增强产品的环境自适应能力,实现运动物体检测与跟踪、物体特征属性的提取,形成可通过字段检索的结构化视频数据。
[0010]本发明的目的是这样实现的:
[0011]一、场景自适应的视频结构化语义提取摄像机(简称摄像机)
[0012]本摄像机包括光学镜头、传感器、主控制器、03?图像处理器和角度检测器;
[0013]光学镜头、传感器和主控制器依次连接,实现图像的采集和镜头焦距信息的获取;
[0014]角度检测器和主控制器连接,实现摄像机倾斜角检测功能;
[0015]主控制器和03?图像处理器连接,实现视频分析、运动物体特征提取和识别,以及自适应的视频结构化语义提取。
[0016]二、方法
[0017]1、摄像机场景自适应分析方法
[0018]摄像机场景自适应分析方法包括下列步骤:
[0019]①测量摄像机安装高度3 ;
[0020]②光学镜头自动定焦调整焦距后,通过焦距值求出摄像机的视场角13 ;
[0021]③应用角度检测器获取摄像机倾斜角0 ;
[0022]④使摄像机扫描线中线与摄像机支撑杆垂直,求出摄像机扫描线形成的三角形的中线 1, I = 8/008 0 );
[0023]⑤由中线I和视场角3,求出摄像机实际的摄像场景宽度切和摄像场景高度:
[0024]评=2X1X^111(3/2),!!=胃/丫,其中V为摄像机视频图像的宽高比;
[0025]⑥通过摄像机图像的宽度、高度与摄像机实际的摄像场景宽度评和只建立映射关系自适应分析视频中运动目标的实际大小:运动目标实际宽度运动目标实际高度4=,其中%为运动目标在视频中的宽度,00为运动目标在视频中的高度。
[0026]2、视频结构化语义提取方法
[0027]视频结构化语义提取方法包括下列步骤:
[0028]八、输入摄像机视频帧序列;
[0029]8、应用视频运动目标检测方法,提取运动目标物体;
[0030]匕通过场景自适应分析方法,求出运动目标的实际大小,进而判断运动目标是机动车还是行人;
[0031]0、如果判断目标是机动车,则提取机动车的特征并对特征进行识别:车牌号码、车牌颜色、车身颜色、车标、车辆类型和行驶速度,形成视频结构化语义输出;如果判断目标是行人,则提取行人的特征并对特征进行识别:人脸、是否佩戴帽子、是否佩戴眼镜、衣服颜色、衣服纹理和运动速度,形成视频结构化语义输出。
[0032]本发明具有下列优点和积极效果:
[0033]①为场景自适应视频结构化语义提取摄像机提供了方案,使摄像机安装更加简单,且易于维护;
[0034]②本场景自适应分析方法提升了视频结构化语义提取摄像机自适应性和智能性;
[0035]③本视频结构化语义提取方法在各种复杂的背景条件下识别机动车和行人的特性,提升了机动车和行人语义提取的准确性;
[0036]④本发明解决了在各种场景下,对运动物体类型的自动判别,提升了运动物体的判别准确性。
【专利附图】
【附图说明】
[0037]图1为本摄像机的结构方框图;
[0038]图2为本摄像机的场景自适应分析方法建模原理图;
[0039]图3为视频结构化语义提取方法的工作流程图。
[0040]图中:
[0041]1 一光学镜头;
[0042]2—传感器;
[0043]3—主控制器;
[0044]4一08?9:^0(368801',数字信号处理)图像处理器;
[0045]5—角度检测器。
【具体实施方式】
[0046]下面结合附图和实施例详细说明:
[0047]一、摄像机
[0048]1、总体
[0049]如图1,本摄像机包括光学镜头1、传感器2、主控制器3、03?图像处理器4和角度检测器5 ;
[0050]光学镜头1、传感器2和主控制器3依次连接,实现图像的采集和镜头焦距信息的获取;
[0051]角度检测器5和主控制器3连接,实现摄像机倾斜角检测功能;
[0052]主控制器3和03?图像处理器4连接,实现视频分析、运动物体特征提取和识别,以及自适应的视频结构化语义提取。
[0053]2、功能部件
[0054]下列功能部件均为通用件。
[0055]1)光学镜头1
[0056]采集摄像机视频信号,并将视频数据传送到主控制器3,再由主控制器3将视频数据转发。
[0057]2)传感器2
[0058]利于光学镜头1的自动对焦功能,获取光学镜头1的焦距参数并通过传感器2将焦距参数传送到主控制器3,用于计算摄像机的视场角。
[0059]3)主控制器3
[0060]获取摄像机的相关参数,主要包括焦距、拍摄角度和视频数据等,并将相关参数传送到03?图像处理器4。
[0061]4)08?图像处理器4
[0062]对主控制器3传送过来的视频信号,通过视频分析、模式识别技术对视频中的机动车、行人检测与分类,对机动车的行为特征和属性特征(车牌号码、车辆徽标、车身颜色、行驶速度、车辆类型等)进行提取;对行人的行为特征和属性特征(人脸、衣服纹理、是否佩带帽子、是否佩带眼睛等)进行提取,并提取其结构化信息。
[0063]5)角度检测器5
[0064]自动采集摄像机的拍摄角度,将采集到的角度信息,传送到摄像机主控制器3。
[0065]3、工作原理
[0066]本摄像机通过光学镜头1、传感器2采集视频信息,将视频信息和光学镜头1自适应的焦距信息一并传送到主控制器3,角度检测器5通过自动检测角度功能获取摄像机安装时候的倾斜角度,将倾斜角度传送到主控制器3,主控制器3将视频信息,镜头焦距信息,倾斜角度传送到03?图像处理器4,03?图像处理器4通过镜头参数公式由镜头焦距计算出摄像机视场角,并应用视频运动目标检测方法提取视频中运动目标,根据场景自适应分析建模方法计算出视频中运动目标实际大小,最后应用模式识别方法对运动目标的特征进行识别,将特征形成视频结构化语义输出。
[0067]二、方法
[0068]1、场景自适应分析方法建模原理
[0069]如图2,场景自适应分析方法建模过程如下:
[0070]①测量摄像机安装高度3 ;
[0071]②光学镜头自动定焦调整焦距后,获取焦距值?,通过焦距值求出摄像机的视场角¢, ^ = ,其中1为摄像机的片幅;
[0072]③应用角度检测器获取摄像机安装的倾斜角0 ;
[0073]④如图2,求出摄像机视场角形成的等边三角形的中线I的值,I = 8/003(0 );
[0074]⑤计算摄像机实际摄像场景宽度评:1 = 2X1X1:2111(0/2),摄像机实际摄像场景高度为0:? = 1/7,其中V为摄像机视频图像的宽高比;
[0075]⑥摄像机像图像的宽度、高度与摄像机实际的摄像场景宽度I,高度II,建立映射关系自适应分析视频中运动目标的实际大小:运动目标实际宽度^ = ※(^运动目标实际高度4 = ¢/?) 乂00,其中0,为运动目标在视频中的宽度,08为运动目标在视频中的闻度,通过映射关系自适应分析视频中运动目标的实际大小。
[0076]2、视频结构化语义提取方法
[0077]如图3,本方法实现过程如下:
[0078]£1、输入摄像机视频帧序列301
[0079]通过视频采集设备将采集到的视频帧序列输入到03?中进行视频分析处理;
[0080]6、视频分析302
[0081]采用视频检测方法分析视频,主要是采用背景差分和背景建模方法,对视频进行分析;
[0082]0、提取运动目标303
[0083]根据视频检测方法分析结果,分割视频中运动目标和非运动目标,并提取运动目标的位置及其在视频中所占像素点等信息;
[0084]么计算运动目标实际大小304
[0085]通过场景自适应分析方法,计算出视频图像与实际场景大小的比例关系,应用比例关系计算视频中运动目标的实际大小,进而判断运动目标物体是机动车或行人。
[0086]6、机动车 305
[0087]由运动的目标的实际大小判断运动目标为机动车:
[0088]61、特征提取和识别306
[0089]运动目标为机动车,应用特征提取算法和模式识别算法提取车辆的特征并对特征进行识别;
[0090]62、提取结构化语义307
[0091]识别出机动车的车牌号码、车牌颜色、车身颜色、车标、车辆类型和行驶速度等,形成视频结构化语义输出;
[0092]?、行人 308
[0093]由运动的目标的实际大小判断运动目标为行人:
[0094]、特征提取和识别309
[0095]运动目标为行人,应用特征提取算法和模式识别算法提取行人的特征并对特征进行识别;
[0096]?2、提取结构化语义310
[0097]人脸、是否佩戴帽子、是否佩戴眼镜、衣服颜色、衣服纹理和运动速度等,形成视频结构化语义输出。
【权利要求】
1.一种场景自适应的视频结构化语义提取摄像机,其特征在于: 包括光学镜头(I)、传感器(2)、主控制器(3)、DSP图像处理器(4)和角度检测器(5); 光学镜头(I)、传感器(2)和主控制器(3)依次连接,实现图像的采集和镜头焦距信息的获取; 角度检测器(5)和主控制器(3)连接,实现摄像机倾斜角检测功能; 主控制器(3)和DSP图像处理器(4)连接,实现视频分析、运动物体特征提取和识别,以及自适应的视频结构化语义提取。
2.按权利要求1所述摄像机的场景自适应分析方法,其特征在于包括下列步骤: ①测量摄像机安装高度S; ②光学镜头自动定焦调整焦距后,通过焦距值求出摄像机的视场角β; ③应用角度检测器获取摄像机倾斜角α; ④使摄像机扫描线中线与摄像机支撑杆垂直,求出摄像机扫描线形成的三角形的中线L, L=S/cos ( α); ⑤由中线L和视场角β,求出摄像机实际的摄像场景宽度W和摄像场景高度H:W=2 X LXtanW/2),H=W/Y,其中Y为摄像机视频图像的宽高比; ⑥通过摄像机图像的宽度Pw、高度Ph与摄像机实际的摄像场景宽度W和H建立映射关系自适应分析视频中运动目标的实际大小:运动目标实际宽度Rw= (W/Pw)XOw,运动目标实际高度Rh= (H/Ph) X0H,其中Ow为运动目标在视频中的宽度,Oh为运动目标在视频中的高度。
3.按权利要求1所述摄像机的视频结构化语义提取方法,其特征在于包括下列步骤: A、输入摄像机视频帧序列; B、应用视频运动目标检测方法,提取运动目标物体; C、通过场景自适应分析方法,求出运动目标的实际大小,进而判断运动目标是机动车还是行人; D、如果判断目标是机动车,则提取机动车的特征并对特征进行识别:车牌号码、车牌颜色、车身颜色、车标、车辆类型和行驶速度,形成视频结构化语义输出;如果判断目标是行人,则提取行人的特征并对特征进行识别:人脸、是否佩戴帽子、是否佩戴眼镜、衣服颜色、衣服纹理和运动速度,形成视频结构化语义输出。
【文档编号】G06K9/46GK104378539SQ201410707803
【公开日】2015年2月25日 申请日期:2014年11月28日 优先权日:2014年11月28日
【发明者】贺波涛, 余少华 申请人:华中科技大学