动态物件分类的制作方法

文档序号:11157362阅读:342来源:国知局
动态物件分类的制造方法与工艺

技术领域

此揭露内容是概括关于而非为专指视频监视,且尤指物件分类。

相关申请案的交互参照

此申请案是根据美国法典35 U.S.C.§119(e)而主张于公元2008年3月3日所提出的标题为“动态物件与事件分类的方法”的美国临时申请案第61/033,349号及于公元2008年3月3日所提出的标题为“用于追踪于视频监视下的物件的方法与系统”的美国临时申请案第61/033,284号的权益,此二件美国临时申请案是均为以参照方式而整体纳入于本文。



背景技术:

自动化保全及监视系统是典型为运用视频相机或其它影像捕捉装置或传感器以收集影像资料。于最简单系统中,由影像资料所代表的影像是显示以供保全人员的同时审查及/或记录以供在保全违反之后的后续参考。于彼等系统中,侦测有关物件的任务是由一观察人员所实行。重大的进展是当系统其本身为能够部分或完整实行物件侦测与分类而发生。

于一种典型的监视系统中,举例而言,可能对于侦测移动通过环境的诸如人类、载具、动物、等等的物件为有兴趣。不同的物件是可能加诸不同的威胁或警报的程度。举例而言,于场景中的动物是可能为正常,但是于场景中的人类或载具是可能为针对于一警报的原因,且可能需要保全人员的立即注意。能够分类侦测的物件的现存的系统是倾向于运用简单的尝试错误法,以区分物件彼此的广泛的类别。举例而言,针对于长宽比与高度的预定的预期是运用以分类一侦测的物件为人类。理论上,尝试错误方法是计算为不昂贵且容易实施,但是其相较于由运用诸如适应性激增(AdaBoost,Adaptive Boosting)的已知的机器学习算法所形成的最佳化参数分类器而较为不强健许多。然而,已知的参数分类器是受损于下列一或多者:(1)缺乏用于训练的标示资料,及(2)无能力自动进化。

先前技术的分类器是典型为需要人工的几何校准与调整。该种校准及调整是典型为针对于其间接影响系统性能的中间的使用者输入(例如:物件高度),且典型为需要由于装设期间的训练人员的耗时人工。甚者,重新调整及校准是随着季节变化或假如一相机为移动而典型为需要。



技术实现要素:

具体实施方式

参考伴随附图,此段落是描述特定的实施例与其详细的结构与操作。本文所述的实施例是仅为作为举例而非为限制所陈述。熟悉此技术人士是按照本文的揭示内容而将认知的是:对于本文所述的实施例是存在一系列的等效者。特别是,其它的实施例是可能,变化是可作成于本文所述的实施例,且对于构成所述的实施例的构件、零件、或步骤是可能存在等效。

为了简明,某些实施例的构件或步骤的某些层面是不具有过度的细节而呈现,其中,该种细节是将对于熟悉此技术人士于按照本文的揭示内容为显明,且/或其中,该种细节是将混淆所述实施例的较为有关层面的了解。

概述

如熟悉此技术人士是按照此揭示内容而将理解的是:某些实施例是能够达成优于已知的先前技术的某些优点,其或许包括下列的一些或全部:(1)改良的物件分类准确度;(2)使用者反馈的利用以用于一物件分类器的训练及适应;(3)于一种现场部署式相机系统以学习新的物件类别;(4)新物件分类器的线上的评估及部署;(5)聚集自一群相机系统的反馈以训练新及/或更准确的一般物件分类器;(6)于现场操作期间以校准一种现场部署式相机系统;(7)归因于季节变化或相机移动之后,于系统装设与调整期间而于现场的系统人工校准的需求的降低或甚至是免除;及(8)对于变化条件的相机系统的自动调适。种种的实施例的此等与其它优点是于阅读此文件的其余部分而将为显明。

根据一个实施例,一种相机系统是包含:一影像捕捉装置;及一物件分类模块,其连接至该影像捕捉装置。该影像捕捉装置是具有一视野且产生代表该视野的一影像的影像资料。该物件分类模块是可操作以确定于一影像的一物件是否为一物件类别的一成员。该物件分类模块是包括组态于一串级(cascade)组态的N个决策步级(step),其中,该N个决策步级的至少一种是可操作以(a)接受一物件作为该物件类别的一成员,(b)拒绝一物件作为该物件类别的一成员,及(c)请求下一个步级以确定一物件是否为该物件类别的一成员。

根据另一实施例,一种方法是分类由一相机系统所捕捉的一物件,该相机系统是包括一物件分类模块,其具有组态于一串级组态的N个决策步级。该种方法是捕捉一物件的一影像,传送代表该物件的影像资料至该N个决策步级的一第一者。该种方法是识别代表于该影像资料的该物件的一特征,以确定该物件是否为一物件类别的一成员,其中,一决策步级值是自该物件的特征所导出。该种方法是作出一决策以接受该物件作为该物件类别的一成员、拒绝该物件作为该物件类别的一成员、或转送该影像资料至该N个决策步级的一第二者以供进一步分析。该决策是基于该决策步级值对于一接受临限与一拒绝临限的一或多者的一比较。该接受临限是相较于该拒绝临限的一较高值。该物件是当该决策步级值为高于该接受临限而接收作为该物件类别的一成员。该物件是当该决策步级值为低于该拒绝临限而拒绝作为该物件类别的一成员。该影像资料是当该决策步级值为介于该接受与拒绝临限之间而转送至第二个决策步级。

根据另一实施例,一种相机系统是包含:一影像捕捉装置;及一物件分类模块,其连接至该影像捕捉装置。该影像捕捉装置是具有一视野且产生代表该视野的一影像的影像资料。该物件分类模块是可操作以确定于该影像的一物件是否为一物件类别的一成员。该物件分类模块是包括组态于一串级组态的N个决策步级。所述决策步级的各者是包括用于映像物件特征至纯量值的一或多个阶段(stage)。所述阶段的一第一者是包括用于确定一第一纯量值的一第一判别函数,且所述阶段的一第二者是包括用于确定一第二纯量值的一第二判别函数。第一与第二判别函数是不同型式。

根据另一实施例,一种方法是分类由一相机系统所捕捉的一物件。该种方法是产生代表由该相机系统所捕捉的一物件的一影像的影像资料,且识别代表于该影像资料的该物件的第一与第二特征。该种方法是映像该物件的第一与第二特征至个别的第一与第二纯量值。一第一判别函数是运用以产生第一纯量值,且一第二判别函数是运用以产生第二纯量值。第一与第二判别函数是于一训练作业期间而选择自多个不同的判别函数所组成的一群组。该种方法是基于自第一与第二纯量值所导出的一决策步级值,而确定该物件是否为一物件类别的一成员。

根据另一实施例,一种相机系统是包含:一影像捕捉装置;一物件分类模块,连接至该影像捕捉装置;及,一校准模块,连接至该物件分类模块。该影像捕捉装置是具有一视野与一影像平面。该影像捕捉装置是产生代表投射于该影像平面的该视野的一影像的影像资料。该物件分类模块是可操作以基于该影像资料而侦测及分类捕捉于该视野的物件。该物件分类模块是可操作以分类物件作为一物件类别的成员或非成员。该校准模块是连接至该物件分类模块,用于估计所述物件类别的成员的代表尺寸,所述代表尺寸是对应于该影像平面的不同区域。该校准模块是可操作于联机操作期间以响应于由该物件分类模块所实行的分类而自动更新所述代表尺寸。该校准模块是可操作以供应代表所述更新代表尺寸的信息至该物件分类模块以改良其物件分类性能。

根据另一实施例,一种方法是自动校准一种现场部署式(field-deployed)相机系统。该种方法是捕捉该相机系统的一视野的多个影像。该多个影像是对应于该视野为投射于其的该相机系统的一影像平面。该种方法是侦测于该多个影像的一第一物件。第一物件是在该影像平面的不同位置而侦测于该多个影像。第一物件的影像是具有对应于所述不同位置的不同尺寸。该种方法是分类第一物件作为一物件类别的一第一成员且基于第一物件的不同尺寸以计算针对于该影像平面的一尺寸函数的一参数。该尺寸函数是运用以估计针对于该影像平面的该物件类别的代表尺寸。该种方法是响应于该物件类别的一第二成员的侦测与分类以更新该尺寸函数的参数。第二成员是侦测及分类于该相机系统的联机操作期间。

根据另一实施例,一种方法是修改由一使用者所运用于一现场部署式相机系统的一物件分类模块。该种方法是捕捉该相机系统的一视野的多个影像。该多个影像是包括多个物件的代表。该多个物件的一第一组是一物件类别的成员且该多个物件的一第二组是非为该物件类别的成员。该种方法是分类该多个物件作为该物件类别的成员或非成员,其中,该物件分类模块是产生一或多个错误分类。该种方法是基于该一或多个错误分类的至少一些者的由该使用者的认可以产生错误元资料(metadata)。该种方法是基于该错误元资料以修改该物件分类模块,以减少错误分类的数目,该修改是自动实行于该相机系统的实地运用期间。

根据另一实施例,一种相机系统是包含:一影像捕捉装置;一物件分类模块,连接至该影像捕捉装置;一使用者站(station),连接至该影像捕捉装置;及,一分类器进化(evolution)模块。该影像捕捉装置是具有一视野且产生代表该视野的影像的影像资料。该物件分类模块是可操作以确定于所述影像的物件是否为一物件类别的成员,其中,该物件分类模块是产生错误分类。该使用者站是具有一显示器以提出该视野的影像至一使用者。该使用者站是可操作以提出由该物件分类模块所产生的错误分类的代表于该显示器。该使用者站是可操作以响应于所述错误分类的使用者认可而产生使用者反馈信息。该使用者反馈是产生错误元资料。该分类器进化模块是接收该错误元资料且为可操作以运用该错误元资料而修改该物件分类模块,以减少所述错误分类的数目。该分类器进化模块是因而产生一专用分类器。

根据另一实施例,一种方法是构成一种用于一现场部署式相机系统的新物件分类模块。该新物件分类模块是用于分类物件作为由一使用者所选择的一新物件类别的成员或非成员。该种方法是捕捉该相机系统的一视野的多个影像。该多个影像是包括多个物件的代表,其中,该多个物件的一第一组是该新物件类别的成员,且该多个物件的一第二组是非为该新物件类别的成员。该种方法是运用一部署物件分类模块以分类该多个物件作为一部署物件类别的成员。该种方法是提出由该部署物件分类模块所分类的该多个物件的代表于一显示器。一使用者是标示该多个物件作为该新物件类别的成员或非成员。该种方法是基于所述标示以产生元资料,且基于该元资料以修改该部署物件分类模块而构成该新物件分类模块。

前述实施例和其它实施例的建构和操作的另外观点与细节是将参照伴随附图而在下述各子节中提出。

整体系统

图1是根据一个实施例的一种相机系统100的绘图。相机系统100是包括其彼此连接于一网络108的影像捕捉装置102、一使用者接口104、及一远程储存/处理单元106。网络108是可包括任何型式的有线或无线网络。虽然图1的相机系统100是包括为连接于一网络的多个影像捕捉装置102,相机系统100是可包括单一个影像捕捉装置102。影像捕捉装置102是可包括一内部储存系统110,其包含一硬盘机(HD)111与一元资料资料库(DB)112。举例而言,影像捕捉装置102是可包括一种储存系统,其是描述于标题分别为“视频资料的内容觉察储存”与“延伸其用于视频资料储存应用的硬盘机的操作寿命”的共同拥有的美国专利申请案第12/105,971号与第12/105,893号,此二件美国专利申请案是均为以参照方式而整体纳入于本文。使用者接口104是包括一显示器114与一输入装置116。影像捕捉装置102是捕捉其个别的视野的影像且产生代表所述影像的资料资料。要了解的是:影像是可意指静止影像或运动视频影像。影像资料是通过网络108而通讯至使用者接口104,目一或多个视野的影像是提出于显示器114。输入装置116是可操作以允许一使用者为提供针对于相机系统100的使用者反馈信息。影像资料是亦可通过网络108而通讯至远程储存/处理单元106,于其中,储存系统110或其部分者或类似储存系统是可替代或附加为设置。

图2是一个影像捕捉装置102的简化方块图。影像捕捉装置102是可为一种高分辨率的视频相机,诸如:一种百万像素的视频相机。影像捕捉装置102亦可捕捉自外侧的可见频谱(例如:热能)的资料。除了储存系统110之外,影像捕捉装置102是包括一影像处理单元,其包括一视频分析模块200以分析由影像捕捉装置102所捕捉的影像。由视频分析模块200所产生的资料是可为由一规则引擎(未显示)所运用以确定一或多个使用者指定的规则是否为已经违反。举例而言,该规则引擎是可触发其为提出于使用者接口104的显示器114的一警报,若一人是侦测于所述影像捕捉装置102的一者的视野。该影像处理单元是无须为容纳于如图2所绘的影像捕捉装置102的一外壳202的内。甚者,远程储存/处理单元106是亦可包括一影像处理单元。

视频分析模块200是包括用于实行种种任务的一些模块。举例而言,视频分析模块200是包括一物件侦测模块204,用于侦测其出现于影像捕捉装置102的视野的物件。对于物件侦测模块204的输入是视频资料,较佳为自一影像器(未显示)或视频缓冲存储器(未显示)的现场视频资料。物件侦测模块204是例如可运用任何已知的物件侦测方法,诸如:运动侦测及二进制大型物件(blob)侦测。物件侦测模块204是可包括于其标题为“用于侦测于时空讯号的有关物件的方法及系统”的共同拥有的美国专利申请案第10/884,486号的所述的系统且运用所述的侦测方法,此美国专利申请案的整体内容是以参照方式而纳入于本文。

视频分析模块200亦包括一物件追踪模块206,其连接至物件侦测模块204。如运用于本文,术语“连接”是意指直接或间接为通过一或多个中间媒介所逻辑或实体连接。物件追踪模块206是可操作以于时间关联由物件侦测模块204所侦测的一物件的实例。物件追踪模块206是可包括于其标题为“用于追踪、索引、及搜寻的物件匹配”的共同拥有的美国专利申请案(律师档案号码37686/7∶2)的所述的系统且运用所述的方法,此美国专利申请案的整体内容是以参照方式而纳入于本文。物件追踪模块206是产生其对应于所追踪的物件的元资料。该元资料是可对应于物件的签章,其代表物件的外观或其它的特征。该元资料是可传送至元资料数据库112以供储存。

视频分析模块200亦包括一暂时物件分类模块208,其连接至物件追踪模块206。暂时物件分类模块208是可操作以分类一物件为根据其型式(例如:人、载具、动物),由考虑随着时间的该物件的外观。换言之,物件追踪模块206是追踪一物件于多个帧(即:多个影像),且暂时物件分类模块208是基于多个帧的其外观而确定该物件的型式。举例而言,人走路的方式的步伐分析是可用以分类一人,或人腿的分析是可用以分类一骑自行车者。暂时物件分类模块208是可组合关于一物件的轨迹的信息(例如:该轨迹是否为平滑或混乱、物件是否为移动或不动)及于多个帧所平均的由一物件分类模块210(详述于下文)所作成的分类的信赖。举例而言,由物件分类模块210所确定的分类信赖值是可基于物件的轨迹的平滑度而作调整。暂时物件分类模块208是可指定一物件至一未知类别,直到该物件是于一充分的次数及一预定数目的统计资料为已经收集而由该物件分类模块所分类。于分类一物件,暂时物件分类模块208是亦可考量该物件已经于视野为多久。暂时物件分类模块是可基于上述的信息而作成关于一物件的类别的最后确定。暂时物件分类模块208亦可运用一种用于改变一物件的类别的磁滞方法。更具体而言,一临限是可设定以变迁一物件的分类为自未知至明确类别,且该临限是可为大于针对于相反变迁(例如:自人类至未知)的一临限。暂时物件分类模块208是可产生关于一物件的分类的元资料,且该元资料是可储存于元资料数据库112。暂时物件分类模块208是可聚集由物件分类模块210所作成的分类。

物件分类

视频分析模块200亦包括物件分类模块210,其较佳为直接或间接连接至物件侦测模块204。对照于暂时物件分类模块208,物件分类模块210是可基于物件的单一个实例(即:单一个影像)而确定一物件的型式。对于物件分类模块208的输入是较佳为物件而非为视频或影像资料。输入物件至物件分类模块208的益处是在于:整个场景是无须分析以供分类,因而需要较少的处理电力。诸如一种基于启发的模块以捕捉明显的分类,其它的初步模块是亦可纳入以进而简化物件分类模块210的复杂度。

物件侦测、追踪与暂时分类模块204、206与208是选用式而为视频分析模块200的较佳构件。于一个替代配置,物件分类模块210是置放在物件侦测模块204之后而在物件追踪模块206之前,使得物件分类是在物件追踪之前而发生。于另一个替代配置,物件侦测、追踪、暂时分类与分类模块204-210是相互关连,如于上文提及的美国专利申请案第10/884,486号所述。

物件分类模块210是包括一些物件分类器,如于图3的方块图所描绘。举例而言,物件分类模块210是包括:一完整人体分类器300,其确定一侦测的物件的一影像是否对应一完整人体;一人体躯干分类器302,其确定一侦测的物件的一影像是否对应一人体躯干;及一载具分类器304,其确定一侦测的物件的一影像是否对应一载具。物件分类模块210是可包括任何数目的不同分类器,且如更为详细描述于下文,一使用者是可产生针对于物件分类模块210的物件的新类别,甚至是当相机系统是部署且运作时。换言之,物件分类模块210是现场可训练。

物件分类器是可操作以基于物件特征(例如:外观特性)而分类一物件。举例而言,完整人体分类器300是接收对应于一物件特征的资料(即:一输入型态X)且确定该物件是否为对应于一完整人体。在物件分类模块210是分类一物件之后,代表该物件类别与物件特征的元资料是可储存于元资料数据库112。

可为由物件分类模块210所运用的特征是将更为详细描述于后。下述的一种训练算法是自一集合的特征F={f1,f2,f3,…,fn}以选取一子集合的特征输入型态X是由的元素所构成。的元素是可视为一物件的一影像区域R的某个变换。因此,X是可呈现以下形式:

一物件的特征是可对应于一些外观特性,诸如而不限于:长宽比、色彩、边缘方位、与正规化的饱和。甚者,特征是可代表外观特性的特征向量(例如:直方图,其中,直方图的分格是对应于向量分量)且可为由一或多个物件分类器所运用以确定物件的类别(即:型式)。举例而言,物件的边缘方位的直方图是可针对于物件影像的不同区域(例如:子窗口)而作图。换言之,一物件的影像是可分割为子窗口,且边缘方位是可针对于子窗口的各个像素而计算。一像素的边缘方位是可运用一可操纵滤波器(例如:运用一高斯导数滤波器于多个方向)而导出。运用一可操纵滤波器是允许主要方向为指定至一子窗口的像素,且允许所述方向的直方图为针对于该子窗口所作图。举例而言,针对于一已知的像素,一可操纵滤波器是可运用于多个方向以产生多个响应,且对应于最大方向导数响应的方向是指定作为该像素的方向。

针对于所述物件分类器的一种的分类问题是可概括为由一分类器函数Γ(X)所定义,其中,由输入型态X所代表的一物件是当Γ(X)>0而宣告为物件类别的一成员或当Γ(X)<0而宣告为物件类别的一非成员。概括而言,分类器函数Γ(X)是以一组的参数而为参数化,且输入型态X是由上述的特征所构成。一特定分类器ΓC(X)是针对于各个相关的物件类别而训练。由图3的物件分类模块210所代表的多类别的分类模型是可数学式定义如下:

Ω={ω1,ω2,…,ωc}

ω=ωc:(Γc(X)>0且

其中,ω是代表一物件类别,且Ω是代表所有物件类别的集合。

物件分类模块210的一种结构的一个实例是将参考图4至6而更详细描述。为了明白,完整人体分类器300是将详细描述。然而,以下说明是可同样应用至物件分类模块210的其它的物件分类器。分类器300是包括其组态于一种串级组态(即:步级1、随后为步级2、随后为步级3、…、随后为步级N)的多个步级400(N个决策步级),如于图4所示。N个步级是操作以确定一物件的外观是否为对应于该物件类别(即:完整人体)。不同于公元2004年的国际计算机视觉期刊(International Journal of Computer Vision)第137至154页的Paul Viola与Michael Jones的“强健实时脸部侦测”所提出的一种已知的串级分类系统,其中,一物件是拒绝或转送于N-1个初始步级(即:除了最后一个步级之外的全部),分类器300的初始N-1个步级各者是可操作以作成三个决策的一者:(1)接受物件作为该物件类别的成员(即:正类别);(2)拒绝物件作为该物件类别的成员(即:负类别);及(3)转送该决策至下个步级。举例而言,一物件的输入型态X是供应至步级1,且步级1是判断是否(1)接受该物件作为完整人体;(2)拒绝该物件作为完整人体;或(3)转送该输入型态X至步级2以作成确定。接受、拒绝或转送的决策是基于由该步级所产生的一值(即:一决策步级值)。最后或第N个步级是可操作以(1)接受该物件作为完整人体;或(2)拒绝该物件作为完整人体。

图5A是方块图,更为详细显示初始N-1个步级400的一者。各个步级400是包括一或多个阶段500。针对于各个阶段500,特征的一者是自输入型态X而取出(由方块502所代表)且供应至其对应的阶段500。因此,各个阶段500是具有关联于其之一对应特征。阶段/特征的组合是可由于如下所述的一训练方法期间的一种学习算法而预定。甚者,举例而言,供应至图5的第一阶段(阶段1)的一特征是可为不同或相同于供应至第二阶段(阶段2)的特征。

概括而言,一阶段500是可为由一阶段函数g所代表,阶段函数g是定义为如下:

g:x→γ,其中

g∈G (3)

x∈X且

γ∈[-1,1]

其中,G是代表特定阶段函数g为选取自其的一般集合,且x是代表至该阶段的一任意输入。集合G是可为其映像一特征集合至一纯量值的一丰富族的函数,该纯量值的正负号是指出一物件的类别。如上所述,各个阶段500是接收特征的一者而作为一输入。因此,集合G是可写为G=F×T,其中,F是定义于上文且T是代表一组可能的变换(即:映像),以使针对于t∈T,t:因此,阶段函数g是可呈现以下的展开形式:

一阶段500是代表一判别函数,其包括一加权向量与一启动函数β。如上所述,特征是可代表特征向量。阶段函数是可改写为如下:

其中,是代表加权向量与特征向量的内乘积。启动函数βi是可为任何函数,诸如而不限于:一S型函数或一径向基底函数。启动函数βi是运用以映像加权向量与特征向量的内乘积至于0与1之间的一值。纯量值γ是可藉由计算该判别函数的一微分而确定。不同于其包括针对所有阶段的相同判别函数的已知串级分类器,针对于本实施例的阶段的判别函数是可彼此为不同。甚者,针对于各个阶段500的加权向量与启动函数βi是如下所述而自动确定于训练期间。

各个步级400是阶段500之一或多者的一线性组合(由比例及总和方块504所代表)。换言之,阶段500的纯量值γ是比例及总和以产生决策步级值s(X)。概括而言,此函数是可数学式代表如下:

其中,

因为s(X)(即:决策步级值)是阶段的一凸组合,s(X)与g(x)是具有相同的范围。加权系数α是于训练期间为由一种学习算法所选取。决策步级值是相较于一接受临限τα与一拒绝临限τγ之一或二者(由方块506所代表),以确定是否接受该物件作为完整人体、拒绝该物件作为完整人体、或转送该决策至下一个步级400。该比较是可代表为如下:

接受,若τa<s(X)≤1

转送,若τr<s(X)≤τa (7)

拒绝,若-1<s(X)≤τr

图5B是说明于区间[-1,+1]的接受与拒绝临限的一个实例。接受临限τa与拒绝临限τr是基于使用者特定的伪正与伪负率而由一种学习算法所选取于训练期间。各个步级400是可具有其为不同于或相同于其它步级400的针对于τa与τr的值。“接受”的一决策是意指的是:分类器是确信输入型态X为属于正类别(例如:完整人体)。“转送”的一决策是意指的是:分类器是不确定且延缓该决策至下一个步级。“拒绝”的一决策是意指的是:分类器是确信输入型态X为属于负类别(例如:非为完整人体)。于任一个步级,若决策是非“转送”至下一个步级400,接受/拒绝决策是作成于该点且评估是完成。决策步级值是可对应于针对于对应步级400的一决策信赖度。举例而言,相较于稍高于接受临限τa的一决策步级值,接近1的一决策步级值是可代表的是:对应步级400是较确信一物件为一完整人体。替代而言,于决策步级值的一增大是可能非必要为对应于一较高决策信赖度(即:决策为正确的一机率)。由于物件是以不同的决策步级值而正确及不正确分类,关联于各个决策步级值的信赖度是可凭经验估计于训练期间。决策步级值的信赖度是更详细描述于下文。如上所述,于分类器的最后一个步级(步级N)是强制以恒为接受或拒绝:

接受,若0<s(X)≤1

拒绝,若-1<s(X)≤0 (8)

图6是流程图,描绘根据一个实施例的一种利用相机系统的方法600。仅为举例,方法600是将关于相机系统100而描述;方法600是可操作于任何适合的相机系统。首先,一物件的一影像是由影像捕捉装置102的一者所捕捉(步骤602)。物件是由物件侦测模块204所侦测(步骤604)。举例而言,输入型态X是传送至完整人体分类器300的第一个步级400(步骤606)。替代而言,非为传送型态X至第一个步级400,由第一个步级400的阶段500所运用的组合特征是可选择且仅为彼等特征是可传送至第一个步级400。针对于第一个到第S个阶段500的特征是识别于输入型态X且选取自输入型态X(步骤608)。选取的特征是供应至其个别的阶段500,且所述阶段500是映像所选取特征至纯量值(步骤610)。所述纯量值是比例化(即:加权)且总和以产生一决策步级值s(X)(步骤612)。决策步级值是相较于接受临限τa与拒绝临限τr之一或多者(步骤614)。若决策步级值是大于接受临限τa,物件是接受作为该物件类别的一成员(例如:接受作为一完整人体)(步骤616)。若决策步级值是小于或等于拒绝临限τr,物件是拒绝作为该物件类别的一成员(例如:拒绝作为一完整人体)(步骤618)。若决策步级值是大于拒绝临限τr而小于或等于接受临限τa,输入型态X是转送至第二个步级400(或替代而言,仅为由第二个步级400所运用的彼等特征组合是传送至第二个步级400)(步骤620)。一物件是可于串级的内的任一个步级400而接受或拒绝作为该物件类别的一成员。

输入型态X是可同时供应至物件分类模块210的所有的分类器,其中,各个分类器是接受或拒绝该物件作为其对应类别的一成员。若超过一个物件分类器是接受该物件作为其类别的一成员,接受物件的物件分类器的物件分类器决策步级值的输出是可相较。举例而言,完整人体分类器300与载具分类器304是可确定的是:一物件是分别为一完整人体与一载具。于该情形,由其接受该物件的步级所产生的决策步级值是可相较,且该物件是可指定其具有对应于最可信赖(例如:最大)决策步级值的分类器的类别。举例而言,若完整人体分类器的决策步级值是对应于一90%信赖度,且载具分类器的决策步级值是对应于一80%信赖度,物件是分类作为完整人体。若所述分类器是均未宣告一正输出(物件是不接受作为任何类别的一成员),则该物件是可分类作为未知。

当物件分类模块210是确定一物件的类别,诸如由物件追踪模块206所实行的追踪是可纳入考量。图7是显示一种物件追踪方法700的流程图。仅为举例而言,方法700是将关于连同于物件分类模块210所运用的物件追踪模块206而描述。方法700是可运作于任何适合系统。方法700是关联一物件的一影像与该物件的一先前实例(方块702)。方法700是唤回其相关于该物件的先前实例的类别与分类信赖度。物件分类模块210是确定该物件是否为先前分类具有高信赖(方块704)。视为高信赖的信赖度是可由使用者所预定(例如:70%信赖或更高)。若物件分类模块是确定该物件为未先前分类具有高信赖,则多个物件分类器是执行(方块705)。若方法700是确定该物件为先前分类具有高信赖,对应于物件先前宣告类别的分类器的一部分是可执行(方块706)而非为执行多个分类器。举例而言,对应于先前宣告的类别的分类器的仅有第一个步级400是可评估。第一个步级400的输出是可检查以查看其是否为一致于先前宣告的类别(方块708)。若第一个步级400的输出是一致于先前宣告的类别,并无进一步的评估是需要;针对于目前影像的物件的类别是确定,且物件的历史是更新及储存于元资料数据库112(方块710)。另一方面,若第一个步级400的决策是欲拒绝物件作为该物件类别的一成员,则其它的物件分类器之一或多者是执行(方块705)。若第一个步级400的输出是欲转送,其它的步级400之一或多者是可评估而直到该输出是一致或不一致于先前宣告的类别。

训练物件分类器

一种训练物件分类模块210的物件分类器的方法是将描述。现有的分类系统是可为以学习算法AdaBoost或AdaBoost的某种变化者而训练。尽管AdaBoost是已经证明其于一些应用的价值,运用于该学习方法的算法与目标函数是具有一些限制。举例而言,为了AdaBoost为有效,一物件类别的成员或非成员是不能显着重迭彼此于特征空间。换言之,物件的特征是应为相当分开一分类空间。甚者,因为AdaBoost是运用弱的学习器,大量的弱的学习器是可能为必要以形成其能够达成一期望准确度的一全分类器。

根据一个实施例,称为依序判别误差最小化(SDEM,Sequential Discriminant Error Minimization)的一个替代的目标函数与学习算法是较佳为运用以训练物件分类模块210的物件分类器。SDEM是提出于Saptharishi的“依序判别误差最小化:理论与其于实时视频物件辨识的应用”(Carnegie Mellon大学,公元2005年),其整体内容是以参照方式而纳入于本文。SDEM是可处理其非必要为相当分开一分类空间的特征。不同于AdaBoost与其它类似的激增(boosting)技术,SDEM是可运用弱的学习器或其非必要视为弱的其它的判别函数。因此,相较于AdaBoost,运用SDEM以训练,一物件分类器的步级400与阶段500的数目是可为显着较小。针对于一既定特征,SDEM是经常为能够学习针对于对应特征空间的最佳分类器。物件的最佳特征是可针对于一既定分类问题而自动选择。

概括而言,SDEM算法是运用以训练针对于各个步级400的阶段500的组合。如于式(4)所定义,一阶段500是包括一阶段函数gi(x),其为等于一特征的一转变t。训练任务是选取最佳转变t、以及最佳特征以使当一特定的阶段500是相加至一步级400,物件分类器的性能是最大化。换言之,SDEM算法是选择针对于一特定阶段的转变t与特征以最大化一目标函数。特征的集合F是可为有限,且转变的集合T是可为连续且可微分。采用SDEM算法,针对于的各个选取,一搜寻是实行于集合T以识别其实行最佳于一训练资料集的转变t。于集合T的搜寻是运用标准无限制最佳化技术而实行,诸如而不限于:一种准牛顿(Quasi-Newton)最佳化方法。一旦最佳转变t是针对于的各个选取而识别,最佳特征是可根据一估计概括误差而选择。最佳特征的选择是可写为如下:

SDEM算法的一个性质是在于:当一阶段500是增加至一步级400,阶段500的增加是改良该物件分类器于训练资料集的性能。若一个新的阶段是无法识别为改良该物件分类器的性能,SDEM算法是自动终止。替代而言,非为等待SDEM算法以自动终止,一步级400的一些阶段500是可为由使用者所确定。换言之,当由设计者所设定的一最大数目的阶段500是达到或是当并无阶段500是可增加为将改良性能,SDEM算法是终止训练。

SDEM算法是选择一系列特征/转变,俾使当组合,该组合是胜过所述特征/转变的单一者。举例而言,尽管一物件的长宽比是可能仅作为用于分类的一不良特征,当组合于局部梯度信息,长宽比是可改良其对应于仅有局部梯度信息的分类准确度。一些简单的特征与转变是可组合以产生极为准确的物件分类器。实际上,训练任务是由组合针对于一物件的一组的外观特征而产生超特征。

用于建立第一个步级400的阶段500的一种训练方法800是将参照图8的流程图而更详细描述。以下说明是亦可应用至其它步级400的阶段500。针对于一种分类器的训练资料集是包括特定物件类别的成员与非成员的代表。举例而言,欲训练完整人体分类器300,训练资料集是包括完整人体的影像与其它物件的影像的代表。物件的特征是可自该训练资料集而取出。训练资料集的物件是可由一使用者所人工标示为特定物件类别的一个成员与非成员,造成标示物件802。各个标示物件802的特征是识别且取出(步骤804a、804b、与804c)。各个特征是运用以训练一个单独的阶段,且其最大化该目标函数的值的阶段是选择。任何数目个特征是可运用。举例而言,在M(例如:M=60)个特征之中,一种是可为一长宽比且其它M-1个特征是可为尺寸B的向量,其对应于具有针对于一标示物件的影像的M-1个不同区域的B个分格的边缘方位直方图。

在特征是取出自标示物件802之后,最佳转变t是针对于特征的各者而选择(步骤806a、806b、与806c)。转变是可基于标准最佳化技术而选择。一转变t是可视为其分离于特征空间的标示物件的一决策边界。因此,最佳转变t是对应于其最佳分离该物件类别的成员与非成员的一决策边界。就由加权向量与启动函数βi所作成的判别函数的情形而论,最佳转变t的选择是对应于最佳分离该物件类别的成员与非成员的启动函数βi与加权向量的分量的选择。启动函数βi是可选择自一组多个函数型式,诸如而不限于:一S型函数与一径向基底函数(例如:高斯函数)。因此,不同于已知的串级分类器,一第一个阶段是可包括其相较于一第二个阶段的一不同型式的判别函数。

在针对于特征的转变是选择之后,对应于各个特征/转变组合的一目标函数的一值是计算(步骤808a、808b、与808c)。目标函数是可成比例于分类误差的一度量或可为分类误差的一非线性而单调变化的函数。目标函数的计算值是可相关于不同特征/转变组合所作成的分类误差的数目及/或严重程度。举例而言,一第一计算值是可相关于特征与其对应转变所作成的分类误差的数目。目标函数的计算的诸值是比较,具有最大计算值的特征/转变组合是针对于第一个步级400的第一个阶段500而选择(步骤810)。

在特征与转变是针对于第一个阶段500而选择之后,标示物件802是将第一个阶段500所作成的决策纳入考量而加权为具有不同的加权(步骤812)。物件是可加权作为于特征空间的其对应资料点为如何接近于第一个阶段500所代表的决策边界的一函数。举例而言,对应于接近于特征空间的决策边界的资料点的物件是相较于其具有远离决策边界的资料点的物件而可加权为具有较高的加权,使得一第二个阶段500是可由较多针对于其使第一个阶段500为有些困惑的彼等物件而训练。于一物件的一资料点与第一个阶段500的决策边界之间的距离是可关连于针对于该物件所计算的纯量值γ。

训练方法800是重复针对于下一个阶段。在标示物件是加权之后,最佳转变是针对于特征而再次选择(步骤806a、806b、与806c是重复)。然而,特征是已经加权,且针对于特征各者的最佳转变t是将第一个阶段500纳入考量而选择。最佳转变t是可对应于其造成目标函数值的最大增加的转变。目标函数的诸值是再次计算且比较以确定针对于第二个阶段500的特征/转变(步骤808a、808b、808c、与810是重复)。欲建立一第三个阶段500,标示物件是重新加权,其中,对于第一与第二个阶段500为有些困惑的物件是给予较高加权。再次,步骤806a、806b、与806c是重复,而特征是已经重新加权且针对于特征各者的最佳转变t是将第一与第二个阶段500均纳入考量而选择。目标函数的诸值是再次计算且比较以确定针对于第三个阶段500的特征/转变(步骤808a、808b、808c、与810是重复)。通过训练新阶段的各个反复运作以选取最佳特征/转变及加权标示物件的方法是可考虑为于函数空间的一梯度上升、或为提高目标函数的总值的一种方法。

一旦第一个步级400是训练时,临限τa与τr是选择,以使期望的伪正与伪负率是可设定。甚者,随着阶段500是针对于第一个步级400而构成,加权系数α是亦选择。举例而言,随着各个阶段500是增加至第一个步级400,针对于所述阶段的加权系数α是调整以求得对应于针对于第一个步级400的最低整体误差率的所述加权系数α的值。举例而言,加权系数α是可由运用一线搜寻最佳化策略而选择。

在第一个步级400是训练之后,一第二个步级400的阶段500是可训练。然而,运用以训练第二个步级400的训练资料是其运用以训练第一个步级400的训练资料集的一子集合。该子集合的训练资料是对应于第一个步级400可能既不接受且亦不拒绝作为该物件类别的一成员的标示物件。换言之,第二个步级400是训练关于其具有一对应决策步级值为大于拒绝临限τr而小于或等于接受临限τa的标示物件。此是允许第二个步级400以仅为针对于第一个步级400觉得困惑的彼等物件。

因为训练方法800的逐步的渐进,诚然,应为确定于分类器300的N个步级的准则的最佳顺序且造成其为必要以实行分类的最少个步级。结果,实行于一种部署、训练的现场系统的分类是应使得输出一分类所需求的执行时间及产生该分类所需要的处理功率为最小化。

一旦一物件分类器是以标示物件所训练,物件分类器是可继续通过其它训练步骤以改进针对于不同阶段所选择的特征/转变。训练一物件分类器的一种高阶方式是显示于图9的流程图,其是说明一种训练方法900。影像资料901(例如:原始的视频资料)是供应至简单的基底或种子系统,其为能够进行物件的基本侦测、追踪、与分类。基底系统是侦测、追踪、及分类其代表于影像资料901的物件且产生其对应于物件的元资料(步骤902)。基底系统是选择其为侦测及追踪的一组的物件(步骤904)。物件的选择是可取决于一物件为于一影像捕捉装置102的视野的时间量,或可取决于基底系统为多信赖于一物件的其分类。其它规则是可规定以指定一物件是否为由基底系统所选择。

基底分类器所选择的物件的影像是于一显示器而提出至使用者,故使用者是可人工标示所述物件作为其为训练的物件分类器的特定物件类别的成员或非成员。于使用者接口104的使用者是人工标示所述物件,且标示的物件是供应至其为训练的物件分类器(步骤906)。由使用者所人工标示的物件是可对应于上述的标示物件。物件分类器是以标示物件所训练,诸如:根据参考图8的如上所述的训练方法800。训练的物件分类器是分类代表于影像资料901的物件且产生代表物件的类别的元资料(步骤910)。训练的物件分类器所分类的各个物件是具有关联于其的一分类信赖度。分类信赖度是对应于分类该物件作为物件类别的一成员或非成员的步级400的决策步级值。训练的物件分类器所产生的分类信赖度是分析以识别对于训练的物件分类器为困惑的物件(例如:具有一低分类信赖度的物件)。训练的物件分类器的性能是评估以确定该物件分类器的性能是否为可接受(步骤912)。

欲确定该物件分类器的性能是否为可接受,一不相交测试集是可运用,其中,不相交测试集的物件的类别是在由训练的物件分类器的分类前而为已知。供应至训练的物件分类器的影像资料901是可对应于不相交测试集,且由训练的物件分类器所作成的分类是可相较于物件的实际的类别。由此比较,训练的物件分类器的性能是可确定。若该性能是不等于或高于某个预定的性能位准,令人困惑的物件是提交至使用者以供人工标示(步骤904)。使用者是标示令人困惑的物件且新标示的物件是运用以重新训练该物件分类器(步骤906与800)。当物件分类器是重新训练,针对于不同的阶段500的特征/转变组合是可基于新标示的物件而更新。重新训练的物件分类器是运用以分类代表于影像资料901的物件,且重新训练的物件分类器的性能是评估(步骤910与912)。重新训练方法是可继续而直到该重新训练的物件分类器的性能为可接受。当该重新训练的物件分类器的性能是可接受,其可为部署(步骤914)。训练方法是可重新编排成为以下步骤:

1.人工标示一资料集的某个小部分。

2.运用该资料集的部分以训练一物件分类器。

3.运用新训练的分类器以自动标示完整的资料集。

4.选择对于该物件分类器为困惑的一组自动标示的资料点。

5.人工标示所述困惑的资料点。

6.借着所有新标示的资料点而重复训练。

7.至步骤3。

分类信赖

决策步级值s(X)是相关于分类的信赖。该相关性是可非为线性,即:步级400是可产生一高正值,但是物件是可能非为物件类别的一成员。典型而言,由于训练方法,s(X)的值为越高,步级400是越不可能作出一错误。关联于s(X)的某值的信赖度是可计算,首先由定义一指针函数ε(Γ(X)),其中:属于类别且

一信赖函数Ψ(Γ(X))是可定义为步级400宣告一物件属于正类别的机率,且其针对于s(X)=v的一输出为正确。因此,针对于一小量化区间[v-Δ,v+Δ],信赖函数是可表示为如下:

Ψ(Γ(X))=Pε,Ω|Γ(ε(Γ(X))=0,ω=+类别|s(X)<v+Δ)- (11)

Pε,Ω|Γ(ε(Γ(X))=0,ω=+类别|s(X)<v-Δ)

注意,可为考虑的是:步级400是宣告一物件为属于正类别,当s(X)>0,即:P,Ω|Γ(ω=+类别|s(X)>0)=1。因此,针对于v>0,式(11)是可表示为:

Ψ(Γ(X))=Pε|Ω,Г(ε(Γ(X))=0|ω=+类别,0<s(X)≤v+Δ)- (12)

Pε|Ω,Г(ε(Γ(X))=0|ω=+类别,0<s(X)<v-Δ)

式(12)是代表真正率,当v∈[Δ,1-Δ]且s(X)∈[v-Δ,v+Δ]。

同理,针对于v≤-Δ而宣告物件为属于负类别的一步级400的信赖函数是可表示为:

Ψ(Γ(X))=Pε|Ω,Γ(ε(Γ(X))=0|ω=-类别,v+Δ≤s(X)≤0)- (13)

Pε|Ω,Γ(ε(Γ(X))=0|ω=-类别,v-Δ<s(X)≤0)

式(13)是代表真负率,当v∈[-1+Δ,-Δ]且s(X)∈[v-Δ,v+Δ]。因此,若步级400针对于任何观测输出值s(X)=v为正确的机率(如于式(12)与(13)所定义)是高,则步级400是视为信赖于其答案。针对于信赖的此自我评估,一机率测量是自训练资料集所估计且信赖函数Ψ(Γ(X))是推断。若信赖函数Ψ(Γ(X))是小于其针对于s(X)的一既定输出值的一临界信赖临限ψc,则步级400是视为针对于该输出值而不同或令人困惑。不同分类是转送至下一个步级400。因此,信赖函数Ψ(Γ(X))是可运用于训练期间以识别对于一物件分类器为困惑的物件。若其构成阶段500的判别函数是对于贝氏(Bayes)最佳决策边界的良好的近似,则决策步级值s(X)是将为单调相关于信赖函数Ψ(Γ(X))。针对于初始步级400,物件分类器是可能未充分近似贝氏决策边界。因此,针对于一既定步级400的决策步级值s(X)与信赖函数Ψ(Γ(X))是可能非恒为单调相关。

信赖函数Ψ(Γ(X))是可运用以确定针对于不同步级400的接受临限τa与拒绝临限τr。相对于其它串级分类器架构,若针对于正类别的信赖函数Ψ(Γ(X))是随着决策步级值s(X)而单调递增,接受临限τa是可选取,以使真正限制是符合。若信赖函数Ψ(Γ(X))是未随着决策步级值s(X)而单调递增,则接受临限τa是可维持为饱和于1,即:并无型态是接受为于对应步级400的正类别。单调性的欠缺是指出的是:于正区域,决策边界是未充分适当反映贝氏最佳分类器。同理,拒绝临限τr是选取,若负类别信赖是单调相关于决策步级值s(X)。实际上,负类别是相较于正类别而可更密集聚集于特征空间。因此,尽管一单调关系为可能不存在于初期的步级的正类别,极可能存在于初期的步级的负类别。

执行时间分类器进化

对于此论点,分类器模型、其分类操作、与其离线的主动学习是已经描述。接着,分类器的联机进化是将描述。联机的执行时间分类器进化是类似于上述且图标于图9的离线的主动学习方法。执行时间进化是包括以下的步骤:(1)收集使用者反馈;(2)训练针对于分类器的一个新的附加步级;(3)经由被动观察以验证该分类器;(4)若该分类器是被动验证,请求使用者验证且部署该分类器;及,若可能,(5)上载具有性能统计与地点信息的专用分类器至一中央反馈服务器,使得其吸收该专用者的一种更通用的分类器是可产生及训练。

图10是说明一种方法1000,用于收集自操作使用者接口104的使用者的反馈。于许多保全及监视系统,诸如保全人员的一使用者是响应于警报且告知收到警报。若一警报是视作为伪,其可用文件证明为一伪警报或可忽略。具有执行时间分类器进化的一种系统的一较佳实施例是当该警报为一伪警报而令使用者为明确通知该系统。因此,方法1000是提出警报至使用者(步骤1002)。提出至使用者的警报是包括:分类结果(即:如由分类器所确定的物件的类别)与该物件为出现于其的视频资料。使用者是可输入该分类的一认可或拒绝。方法1000是接受该使用者反馈(步骤1010)且确定该分类器是否错误分类物件(步骤1012)。方法1000是收集运用于分类的该组特征且将其储存为“错误元资料”(步骤1014)。当错误的数目是超过一个默认值,方法1000是可起始一校正“专用化”训练程序。

一错误是可能采取一伪正的形式,意指的是:分类器是不正确接受一物件作为于串级的一先前步级的一正类别的部分(例如:分类器是分类一非人类而作为人类型式)。一错误是亦可能采取一伪负的形式,意指的是:分类器是拒绝一物件且断定其为一物件类别的非成员而当该物件是实际为该类别的一成员(例如:分类器是失效以分类一人类作为一人类型式)。举例而言,分类器是可能指定一“可疑”或“未知”类别至其无法分类具有充分信赖的一物件。若该物件是实际为一人类或载具或类似者,使用者是可指出该错误。

一种专用化训练程序是可能需要增加一个附加的步级在其构成该分类器的串级的步级的末端且训练新的步级以分离伪警报与有效或“真”警报,如使用者反馈所指出。增加至分类器的附加的步级是可称为一“专用化步级”。就某种意义而言,考虑其地点、相机、等等,专用化步级是协助该分类器以成为更为专用于分类提出至该特定的分类器的物件。

根据一个实施例,专用化是采取二个形式的一者:(1)地点专用化;及(2)相机专用化。于此实施例,彼等专用化步级是运用伪警报错误而训练。因此,如于图11所示,分类器300是已经于其串级的一些步级1到N而作出一错误的正分类。所述伪正是传送自分类器300至一地点专用化步级1110且然后若必要时而传送至若存在的一相机专用化步级1120。

地点专用化步级1110是一通用步级,其为训练以运用取出作为通用分类器300的操作部分者的特征而降低伪警报。运用以训练地点专用化步级1110的资料是地点特定。因此,一地点专用分类器1130(即:修改或扩增以包括地点专用化步级1110的一分类器)是可能于一不同的地点而未运作为具有提高的准确度。

相机专用化步级1120是一步级,其为训练以仅为针对于一特定相机而降低伪警报。若该地点专用分类器1130是失效以降低伪警报的数目,则一相机专用分类器1140是可训练。

图12是一种专用化训练方法1200的流程图,包括:主动验证。在一充分数目的错误是已经收集之后(步骤1202与1204),一地点专用化步级是增加及训练(步骤1206)。该地点专用分类器的性能是经由一种验证方法而验证(步骤1208)。若其性能是可接受(步骤1210),即:若其误差率是充分低于该通用分类器者,则该种方法是继续进行至步骤1218。然而,若误差率是未充分降低,则一相机专用化步级是针对于其为错误来源的各个相机而增加(步骤1212)。相机专用分类器的性能是经由一种验证方法而验证(步骤1214)。若其性能是可接受(步骤1216),则该种方法是继续进行至步骤1218。若净误差率是仍未充分降低,则使用者反馈收集步骤1202是继续。若一改良的分类器是构成,则任何先前训练的专用化是测试(步骤1218)以查看其是否为一致于新的专用化。若存在其为一致的一先前训练的专用化,则该先前训练的专用化是选择(步骤1220)且指向至该方法1200的一被动验证步骤1224。否则,新训练的专用化是选择(步骤1222)且被动验证于该方法1200的步骤1224。若新的专用化是验证且可为部署(步骤1226),其为增加至专用化步级的数据库(步骤1228)且实际部署(步骤1230)。储存步骤1228是有利,由于不同的专用化是可能针对于一年的不同季节或在监视下的场景的不同组态而需要。因此,先前部署的专用化是可能为再次运用于稍后的时间。

二种不同的验证操作是可实施在部署一分类器之前。首先,被动验证是比较由使用者确认警报所提供的反馈与专用分类器的决策。若专用分类器是相较于部署分类器而较为符合于使用者,专用分类器是视为有效且接着可为受到主动验证,其为第二种型式的验证。于主动验证期间,系统是主动提出专用分类器给使用者,显示该专用分类器拒绝的伪警报及/或由专用分类器所拒绝的真正值。使用者是选择其为可接受的错误与其为否的彼等者。系统是接着企图以调整针对于专用分类器的拒绝临限τr及/或拒绝临限τa,以使该使用者的优选是最接近达成。若性能目标是无法达成,则该分类器是宣告为无效且资料收集步骤是继续。否则,专用分类器是部署。

图13是更详细说明一种被动验证方法1300。方法1300是自一相机102提出警报至一使用者与一专用分类器(步骤1302与1304)。于使用者接口104的使用者是认可或拒绝该警报,且该使用者反馈是由方法1300所接受(步骤1310)。同理,专用分类器是接受或拒绝其造成伪警报的所述引起警报的物件作为该类别的成员,且彼等决策结果是由方法1300所接受(步骤1340)。方法1300是自动比较使用者反馈确认警报与其由专用分类器所作成的决策(步骤1350)。若专用分类器是相较于部署分类器而并未较为符合于使用者(步骤1360),则其为受到继续精化(步骤1370)。若专用分类器是相较于部署分类器而较为符合于使用者(步骤1360),专用分类器是视为有效且继续进行至一主动验证操作(步骤1380)。于一致性的提高是意指的是:专用化是能够拒绝大多数的伪警报而未拒绝真警报。仅有较为一致的专用化是转送至主动验证步骤1380且最终为部署(步骤1390)。

图14是显示一种主动验证方法1400,其是主动使得一使用者为从事于验证一专用分类器。从事于主动验证方法的使用者是较佳为一监督者、管理者、或其更熟练于抓到错误或对于系统的有意破坏的其它高层人士。方法1400是将专用分类器不一致性分为伪正与伪负(步骤1410)。方法1400是将二者提出至使用者(步骤1420与1430)。于使用者接口104的使用者是接着分类错误为可接受或不可接受。一伪警报/伪负的折衷是由适当选取τr而自动实行(步骤1440)。增大τr是提高伪负的数目而降低伪正的数目。系统是企图以调整τr,使得专用分类器是最为接近满足使用者的优选。若性能是不可接受(步骤1450),该分类器是宣告为无效且资料收集步骤是继续(步骤1460)。否则,专用分类器是部署(步骤1470)。

由学习及/或专用化,分类器是可适应于其环境且对于其而自动改变。具有该种分类器的一种相机系统是可能需要少或无人工现场几何校准或调整。此是可造成实质的成本节省,由降低或免除针对于诸如当季节变换或相机移动时而由训练人员安装系统或调整系统的人力的需要。利用如本文所述的分类器的一种相机系统是可通常为由其熟悉相机安装的任何人所安装。

一种准确的分类器的另一个益处是在于:分类物件的改良的准确度是可改良其供应至一物件侦测模块与其构件的反馈的品质,诸如:于上述的美国专利申请案10/884,486号所述的一种前景/背景分离器,因而进一步改良整体系统的性能。

另一个益处是可当关于准确的分类器的反馈为收集自种种的地点而发生。特别是,若一专用化是训练且该地点专用化步级是提供可观的性能改良,则专用分类器是可为上载至一中央反馈服务器。图15是详细显示一种反馈收集及概括化方法1500。若由使用者/地点所允许,针对于关于专用化所修正的错误的错误元资料是收集(步骤1505)、封装具有性能统计资料与地点信息(步骤1510)、且为经由一网络1520而提供至一反馈服务器(步骤1515)。于反馈服务器,元资料与关联资料是储存于一反馈数据库1525。方法1500是评估该专用分类器的性能,运用其储存于在该反馈服务器或由反馈服务器可存取的一视频数据库1530的错误元资料与视频资料。以此方式,专用分类器是可用以自动标示大量的训练资料。通用分类器为不符合于专用分类器的未标示资料是可提出至使用者以供在中央训练设施的标示(未显示)。一新的通用分类器是接着训练以针对于其正确分类的彼等型态而一致于专用分类器(步骤1540)。自多个地点所累积的专用化是可为以类似方式而运用。若一新的通用分类器是可训练为更为一致于所有上载的专用分类器,新的通用分类器是分发至所有地点以供可能的部署。明确而言,方法1500是测试该通用分类器是否相较于先前者为较佳(步骤1545)。若为如此,则其可分发作为一新的通用分类器以供部署在地点(步骤1550)。若为否,则专用分类器是标明为一地点样板。当一专用分类器的性能是视为地点特定,其决策是相较于储存的地点样板(步骤1555)。若存在其为较一致于专用分类器的一地点样板,则该地点样板是可为更新(步骤1565)。否则,专用分类器是可储存作为一新的地点样板(步骤1560)。

选用而言,方法1500是可测试地点样板是否为一季节改良(步骤1570),且若是如此而排定该专用化为季节改良(步骤1575)。

反馈与更新或更新的分类器或分类器参数的中央整合及分配是基于辨识误差而致能整合社群反馈。针对于遭遇类似问题的顾客地点的资料是可整合,且一新的分类器是可训练及传播。该广泛基础的反馈是允许广泛收集的信息为纳入于训练一新分类器;举例而言,关于来自种种系统的伪警报的信息是可共享。概括而言,元资料是包括针对于分类器欲得知的充分信息而无须存取原始视频资料。当一新的分类器是于一顾客地点而内部更新,新版本的分类器是亦传送至其它顾客。举例而言,新的分类器是可运用以确定哪些顾客地点为具有类似的伪警报来源。随着部署系统的数目为增加,收集的反馈的数量与品质亦可提高,因而基于该反馈以致能更为准确的通用分类器的产生。

周期式更新是可推动至所有网络相机,极为类似于一防毒系统。分类器专用化是可视为一新物件定义文件。各个新定义档是可运用被动与主动验证机构而验证于顾客端。若新定义档是验证,则其为提出至使用者以供部署。

学习新通用物件类别是采用如同前述的主动学习方法的相同程序。新物件类别的特定地点的学习是采用如同伪警报降低方法的相同方法。于一种典型情形,一新类别是通常为一较通用类别的一特定型式。举例而言,使用者是可能想要区分一送货卡车与其它载具。因此,“送货卡车”是一特定型式的载具。诸如于图16所示的其具有一新物件分类器1610的一种专用化架构是可接着执行为一个单独的分类器而非为一现存类别的一修改。专用化方法是可视作为一伪警报降低方法,其中,非为载货卡车的载具是伪警报。被动与主动验证操作是较佳为在针对于新物件的一新分类器为部署之前而完成。

自动校准

一校准模块是可纳入于视频分析模块200(图2)以响应于现场操作期间由物件分类模块210所实行的分类而自动更新种种分类物件的代表尺寸。反的,校准模块是可供应其代表已更新后的代表尺寸的信息至物件分类模块以改良其分类性能。

图17是一种方法1700的流程图,方法1700是利用及更新一尺寸函数,尺寸函数是关连一既定型式的一物件的一尺寸至于一视野的其位置。该尺寸函数是可为位置的一参数化的函数,诸如:于X与Y坐标的一个二阶的多项式。由于其具有概括固定尺寸于该类别(例如:成人身高)的所有成员的分类物件1702是由该物件分类模块所作成可利用,该方法1700是确定其是否为具有高或低信赖而分类作为该类别的成员(步骤1710),较佳为由检查上述的信赖估计。若信赖为低,则尺寸函数是应用至物件于其目前位置(步骤1720)且由该尺寸函数所获得的值是相较于影像的实际尺寸以确定其是否为充分接近匹配(步骤1725)。若为如此,则作为物件类别的一成员的物件1702的分类是可确认为正确(步骤1730)。若实际的尺寸与尺寸函数计算的尺寸是并未充分接近匹配,则方法1700是分类该物件作为物件类别的一非成员(步骤1735)。于任一个情形,每当分类器的信赖为低,尺寸函数是不变,由于企图运用可疑的资料以校准该尺寸函数是将为不谨慎。

尺寸函数是可更新(步骤1740),运用物件的实际尺寸作为针对于其出现于影像的位置的该物件类别的预期尺寸的一附加资料点。尺寸函数是由修改其参数而更新,诸如:由一种递归最小平方算法或类似的算法。因此,下次,一低信赖的物件是提出,更新尺寸函数是将应用以确认或否认该分类。以此方式,物件分类是运用现场可靠资料而自动校准于执行时间操作期间。

尺寸函数可为任何参数化函数,其参数是能通过拟合(fit)来决定且调整。例如:能利用一高度尺寸函数的形式:

height(x.y)=ax+by+c (14)

视所需能利用诸如较高阶多项式其它功能。能基于最小平方误差拟合或其它合适准则来决定参数a、b和c,最好是递回实行且每次在实行步骤1740时发生迭代。

运用一选用的尺寸误差函数来预估尺寸预估误差是亦可行。尺寸误差函数error(x,少)是类似影像视场中的坐标的一参数化函数、且是在尺寸函数和实际尺寸之间的差异的预估值。尺寸误差函数本身是能在每次测量一物件的实际尺寸时予以递回地更新。假如尺寸误差函数所回传的一数值太高(即:高于一临限),则尺寸误差函数可能无效且不应用来在由具有低信赖度的物件分类模块210所分类的物件上协助分类。因此,尺寸误差函数是能充当一自我检查技术以供自动校准来避免错误校准。假如对高低信赖度存在多次大错误,则此校准也许由于诸如相机移动的一外部改变而被宣告无效。在停止校准的时期期间,方法1700能继续更新尺寸和尺寸误差函数(即:图17右侧的高信赖度分支),直到尺寸误差变为可接受,低信赖度物件(即:图17左侧的低信赖度分支)的自动尺寸式确认/拒绝能重新开始。

一物件高度栅格是可选择地构成于影像平面,其中针对于各个栅格单元,一物件的平均高度是估计而无须人工校准的辅助。一多项式拟合是可接着为估计以映像一物件的底位置至其顶位置且反的亦然。随着时间经过,准确的物件尺寸估计是可针对于该场景的不同部分而自动产生,无论有否纳入主动使用者反馈。于一个较佳实施例,一种人工校准方法是不必达成准确的物件尺寸估计。随着较大的准确度是发展,得知的信息的信赖度是上升,使得物件尺寸估计是可运用以降低伪侦测。运用自验证及追踪的物件的高度信息且连同相机透镜信息,一完整组的相机参数是可然后为估计,且接着为运用以估计一地平面与影像对真实世界的坐标映像。具有充分的信赖,几何信息是可转移为运用于侦测其位在于地平面的上的物件,例如:于多层为容纳类似载具的一停车库的上层。

图18是根据一个实施例中一种图3的视频分析模块200的方块图,其包含一校准模块240来实行诸如上文所述的自动校准过程。图18同样例示诸如速度预估模块250的数个其它选用模块,其能配合使用校准模块240来使用自校准模块240产生的尺寸信息所推导的比例信息,以预估视场中经分类物件的速度。

图18是同样描述分类器进化模块260,其能诸如通过本文中所述任何技术来实行物件分类模块的现场或使用中自我学习或进化。图18是同样描述一个或更多可操控滤波器220,其能被用来计算边缘取向数值。最后,图18是同样描述一个或更多直方图数据结构230,其所代表诸如边缘取向直方图或颜色直方图的各种直方图是使用作为物件特性以供物件分类目的。直方图信息能被储存在具有数个维值(bin)和维值计数(bin count)的数据结构中,其中数值代表维值领域(bin bound)之间一变量的出现。与图标有所不同,图18例示的模块和其它物件中一个或更多能独立于视频分析模块200,且可以驻留在相机102中的其它位置或相机系统100的其它部分。

如运用于本文,术语“模块”是一构件,其可包含一或多个硬件电路或装置、及/或一或多个软件例程、函式、物件或类似者。一模块是可整体为硬件,整体为软件,包含固件,或包含前述者的某个组合。如运用于本文,术语“系统”是意指一种有形者。

于本文所图标及说明的方法、模块与系统是可存在于主动与非主动的种种形式。举例而言,其可部分或整体存在作为于原始码、目标码、可执行码、或其它格式的程序指令所组成的一或多个软件程序。上述的任一种是可为以压缩或未压缩形式而实施于一计算机可读媒体,其包括储存装置。范例的计算机可读储存装置是包括现有计算机系统的随机存取存储器(RAM)、只读存储器(ROM)、可擦除可程序化ROM(EPROM)、电气式可擦除可程序化ROM(EEPROM)、闪存、与磁盘片或光盘片或磁带。

结论

上文运用的术语与描述是仅为作为举例所陈述而无意为限制。举例而言,该种分类器是可为一远程处理单元的部分者且所述分类方法是可实行于远程处理单元,诸如:远程储存/处理单元106(图1)、关联于使用者接口104的一计算机、于相机系统108的另一个节点、或另一个服务器,诸如:于一中央位置或于另一个网络的一者。熟悉此技术人士是将认知的是:本文所述的概念的彼等与诸多其它的变化、增强及修改是可能而未脱离本发明的基本原理。本发明的范畴是应因此为仅由随附权利要求范围与其等效的内容所确定。

附图简单说明

图1是根据一个实施例的一种相机系统的绘图。

图2是于图1所示的系统的一个影像捕捉装置的简化方块图。

图3是于图2所示的物件分类模块的方块图。

图4是图3的一个分类器的方块图。

图5A是显示于图4所示的分类器的初始N-1个步级的一者的方块图。

图5B是于图5A所示的步级所利用的接受与拒绝临限的绘图。

图6是描绘根据一个实施例的一种利用相机系统的方法的流程图。

图7是显示一种物件追踪方法的流程图。

图8是一种物件分类器训练方法的流程图。

图9是另一种物件分类器训练方法的流程图。

图10是说明一种用于收集自其操作一使用者接口的一使用者的反馈的方法。

图11是一种专用分类器的方块图。

图12是一种包括主动验证的专用训练方法的流程图。

图13是更详细说明一种被动验证方法。

图14是一种主动验证方法的流程图。

图15是显示一种反馈收集及概括化方法。

图16是一种分类器的方块图,具有一附加步级以辨识一新物件型式。

图17是一种利用及更新一尺寸函数的校准方法的流程图。

图18是根据一个实施例中一种图3的视频分析模块的方块图。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1