分类器及分类方法

文档序号：6600074阅读：1497来源：国知局

专利名称：分类器及分类方法
技术领域：
本申请总体上涉及目标分类技术，即分类器及分类方法。具体而言，本申请涉及一种级联分类器，以及一种级联分类方法。
背景技术：
P. Viola 和M. Jones 在文章 Rapid Object Detection using a BoostedCascade of Simple Features (CVPR 2001)中提出了级联方式的分类器，得到广泛的认同和应用。后来又产生了许多变种的级联分类器，例如B. Wu和R. Nevatia的Cluster Boosted Tree Classifier for Multi-view, Multi-PoseObject Detection (ICCV 2007)，以及 C. Huang， H. Ai, Y. Li 和 S.Lao 的 Vector Boosting for Rotation Invariant Multi-View Face Detection (ICCV2005)。以上三篇文献均通过这里的引用全文合并到本申请文件中。如图1所示，无论是哪种级联分类器，都具备以下特点a)分为多个串联的级，例如C1到Cn ；b)输入样本102逐级被验证，只要被任意级拒绝(图1中从子分类器向上的箭头)，则此样本被判别为负样本(图1中的输出“O”)；c)只有被全部级分类器判别为正的样本被最终判别为正样本(图1中的输出“+1”)。因此级联分类器只有两种输出+1和0(或者-1，图1中表示为0)。

发明内容
在下文中给出了关于本发明的简要概述，以便提供关于本发明的某些方面的基本理解。应当理解，这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分，也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。概括而言，本申请针对传统级联分类器结构中只有样本通过全部级才被判别为正的问题设计了通过构建多个决策级来进行置信度的累进，使得分类器对不同样本可以有更好的置信度区分。根据本申请所提供的一种实施例，提供了一种级联分类器，包括多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。根据本申请所提供的另一种实施例，提供了一种分类方法，包括使样本通过多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。按照上述实施例，能够通过累进式置信度计算使得级联分类器对不同的样本有更细致的区分，可以得到更细致的置信度输出，而不是简单的“是与非”。此外，本申请的实施例还提供了能够在计算机上执行以实现上述方法或者装置的计算机程序产品，以及存储有或者传输所述计算机程序的计算机可读介质。

参照下面结合附图对本发明实施例的说明，会更加容易地理解本发明的以上和其它目的、特点和优点。在附图中，相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分，而且用来进一步举例说明本发明的优选实施例和解释本发明的原理和优点。在附图中图1为在“背景技术”部分已经说明的现有级联分类器的示意图；图2为能够用于实现本发明的各实施例的计算设备200的例子的示意图；图3为根据本发明的一种实施方式的级联分类器的示意图；图4为根据本发明的另一种实施方式的级联分类器的示意图；图5为根据本发明的另一种实施方式的级联分类器的示意图；图6为根据本发明的另一种实施方式的级联分类器的示意图；图7为根据本发明的另一种实施方式的级联分类器的示意图；图8为根据本发明的另一种实施方式的级联分类器的示意图；图9为根据本发明的一种实施方式的分类方法的流程图；图10为根据本发明的另一种实施方式的分类方法的流程图。
具体实施例方式在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见，在说明书中并未描述实际实施方式的所有特征。然而，应该了解，在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定，以便实现开发人员的具体目标，例如，符合与系统及业务相关的那些限制条件，并且这些限制条件可能会随着实施方式的不同而有所改变。此外，还应该了解，虽然开发工作有可能是非常复杂和费时的，但对得益于本公开内容的本领域技术人员来说，这种开发工作仅仅是例行的任务。在此，还需要说明的一点是，为了避免因不必要的细节而模糊了本发明，在附图中仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤，而省略了与本发明关系不大的其他细节。首先看图2，图示了能够用于实现本发明的各种实施方式包括级联分类器和分类方法的计算设备200的例子的结构示意图。在图2中，中央处理单元(CPU) 201根据只读存储器(ROM) 202中存储的程序或从存储部分208加载到随机存取存储器(RAM) 203的程序执行各种处理。在RAM 203中，也根据需要存储当CPU 201执行各种处理等等时所需的数据。CPU 201、ROM 202和RAM 203经由总线204彼此连接。输入/输出接口 205也连接到总线204。下述部件连接到输入/输出接口 205 输入部分206，包括键盘、鼠标等等；输出部分207，包括显示器，比如阴极射线管(CRT)显示器、液晶显示器(LCD)等等，和扬声器等等；存储部分208，包括硬盘等等；和通信部分209，包括网络接口卡比如LAN卡、调制解调器等等。通信部分209经由网络比如因特网执行通信处理。根据需要，驱动器210也连接到输入/输出接口 205。可拆卸介质211比如磁盘、
5光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器210上，使得从中读出的计算机程序根据需要被安装到存储部分208中。可以从网络比如因特网或存储介质比如可拆卸介质211向计算设备中安装程序。本领域的技术人员应当理解，这种存储介质不局限于图2所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质211。可拆卸介质211的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(⑶-ROM)和数字通用盘 (DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者，存储介质可以是 ROM 202、存储部分208中包含的硬盘等等，其中存有程序，并且与包含它们的设备一起被分发给用户。第一实施方式按照本申请所提供的第一种实施方式，提供了一种级联分类器，包括多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。这样，级联分类器会对样本给出一个实数置信度值，而不是简单地拒绝或者接受，从而能够通过不同的置信度值更好地对不同的样本予以区分。图3图示了该实施方式的一种具体的结构示例，其中级联分类器具有级联的多级 (记为N级，N为大于1的自然数)子分类器Ci (i为满足l<=i<=N的自然数)。图中，从每一个子分类器向右的箭头表示样本通过该子分类器后输出相应的置信度Vi并且样本进入下一级子分类器。从每一个子分类器向上的箭头表示样本未能通过该级子分类器并输出相应的置信度Vi+在本实施方式中，这些子分类器级被配置为使得输入样本102通过第i级子分类器Ci之后获得的置信度Vi满足Vi > V"，其中Vtl为样本的初始置信度。显然，如果输入样本102未通过某一级子分类器Vi,则输入样本获得的置信度V"是前一级子分类器C^1所赋予的置信度。具体来说，例如，如果输入样本102通过了 C2而未通过C3,则获得置信度V2 ；如果输入样本102进一步通过了 C3,则获得置信度V3,并且V3 > V2。这样，通过该结构的级联分类器，使得能够依据输入样本所通过的子分类器级数，对样本赋予不同的置信度，从而有利于对样本的更为细致的区分，有助于更为准确地实现例如目标检测等目的。按照本实施方式，各级子分类器的置信度逐级递增。对于逐级递增方式，可以是任何方式。例如，根据一种变型，可以与子分类器的性能有关或者无关地直接设定在通过某个子分类器后样本所获得的置信度值。根据另一种变型，可以将通过某个子分类器后样本所获得的置信度值设置为与子分类器的性能有关或者无关地算术递增，例如每通过一个子分类器级就增加一个大于零的固定值，或者增加一个与子分类器本身的置信度或者其它指标(例如误检率等)相关联的大于零的值。根据再一种变型，可以将通过某个子分类器后样本所获得的置信度值设置为与子分类器的性能有关或者无关地指数递增，例如每通过一个子分类器级指数就增加一个固定值，或者增加一个与子分类器本身的置信度或者其它指标(例如误检率等)相关联的值。根据再一个变型，可以将通过某个子分类器后样本所获得的置信度值设置为与子分类器的性能有关或者无关地乘式递增，例如每通过一个子分类器级置信度就乘以一个大于1的固定值，或者乘以一个与子分类器本身的置信度或者其它指标(例如误检率等)相关联的大于1的值。上述各种变型可以任意选用。但是，为了获得更好的效果，可以结合子分类器的内部结构来合适地确定置信度的递增方式。例如，如果子分类器不给出准确的置信度值或者其它指标，则可以直接设定置信度值，否则就依据子分类器的置信度或者其它指标计算置
信度值。例如，可以依据各级子分类器所确定的样本的置信度确定所述递增值。例如，如果某个子分类器级是包括多个基分类器的合并增强(Boosting)分类器(例如Marco Pedersoli 等人的文章“Boosting Histograms ofOriented Gradients for Human Detection" (http://lear. inrialpes. fr/people/triggs/pubs/Dalal-cvpr05. pdf，2009 年8月11日最后访问)就公开了一种这样的合并增强分类器，该文献的内容通过这里的引用合并到本申请中)，该子分类器对置信度的递增值可以与所述多个基分类器的输出之和与该Boosting分类器的阈值之间的差值的绝对值相关。具体而言，Boosting分类器由多个较弱的基分类器构成，每一个基分类器有自己的输出。只有当所有基分类器的输出之和超过该Boosting分类器的阈值时，才算通过该Boosting分类器。因此，所述基分类器输出之和与所述阈值之差的绝对值就反映了该Boosting分类器对样本的置信度。

又例如，置信度是算术递增、指数递增还是乘式递增，最好是考虑在设计子分类器时，每一级子分类器相对于前一级分类器的性能的提升是算术递增、指数递增还是乘式递
+曰O作为一个例子，一般都将各级子分类器设计为乘式递增的。因此本实施方式的置信度也可以采用乘式递增。除了直接设定大于1的递增系数之外，还可以使置信度与子分类器的性能相关联地递增。例如，原理上，各级子分类器的误检率应当逐步降低，因为在训练时下一级子分类器只处理通过了上一级子分类器的样本。因此，可以考虑使用与误检率相关的递增系数。例如，可以使该系数为fi-i/fi，其中fi为第i级子分类器Ci的误检率。由于各级子分类器的误检率应当逐步降低，因此fi < fi-i，进而该递增系数大于1，因此样本的置信度会随着通过的子分类器级数的增加而逐步提高。对于本实施方式的上述所有变型，都可以进行进一步改进。例如，可以对算术递增、指数递增或者乘式递增的递增值或者递增系数针对不同的子分类器级加权。加权系数的确定可以有各种各样的方式。一种方式是依据子分类器级的位置确定，例如，越往下游，意味着样本为正样本的概率越高，因此可以对下游的子分类器级赋予更高的加权系数。或者，可以依据各子分类器级本身对具体的输入样本的不同表现来确定加权系数。例如，可以将子分类器所确定的样本的置信度作为加权系数。在一个更为具体的变型当中，例如，如果某个子分类器级是包括多个基分类器的合并增强(Boosting)分类器，则类似于前文所述，可以将所述加权系数确定为与所述多个基分类器的输出之和与该Boosting 分类器的阈值之间的差值的绝对值相关。显然，每一级子分类器Ci可以是任何类型的分类器，并且如本领域技术人员所知的，每一个子分类器Ci本身可以构建为直接获得样本的置信度值，也就是说，本实施方式的级联分类器可以通过按照上述方式设置每一个子分类器Ci的置信度输出(包括每一个子分类器自身的置信度，以及截止该子分类器为止整个级联分类器的综合置信度)来实现。
7另一方面，也可以在级联分类器中设置一个或者多个置信度计算模块(未图示)，用于基于每一个子分类器Ci的输出来计算截止该子分类器为止整个级联分类器的综合置信度。显然，所述置信度计算模块的部分或者全部可以分别视为每一个子分类器Ci的一部分；反过来，在没有置信度计算模块时，每一级子分类器的置信度计算功能也可以单独地视为每一个子分类器的置信度计算模块，或者综合地视为整个级联分类器的置信度计算模块。另外需要说明的是，输入样本的置信度的计算是按照子分类器的级联顺序来计算的，但是这并不意味着子分类器对输入样本的分类必须依次进行。相反，子分类器对同一输入样本的分类可以按照任何顺序进行，或者并行地进行，只要置信度的计算按照前述方式执行就可以了。也就是说，级联分类器的级联顺序只是逻辑上的顺序，并非实际执行的顺序。至于是串行执行还是并行执行，可以依据计算设备的实际情况而定。例如，如果计算设备的并行计算能力强，则可以考虑并行地执行各子分类器，以缩短串行地依次执行所耗费的时间；如果情况相反，则需串行地执行，以降低计算设备的开销。第二实施方式在上面描述的第一实施方式中，如果输入样本被其中的某一级子分类器拒绝，则所获得的置信度为前一级通过的子分类器所赋予的置信度，而不管该级之后的子分类器的分类结果如何。但是，该拒绝的子分类器有可能是误判。例如，有可能除了该级子分类器拒绝之外，输入样本能被其余绝大多数级或者甚至所有级接受，也就是说该样本本应为正样本。在这种情况下，某一个级的误判就有可能导致整个级联分类器对正样本的置信度较低，从而导致在随后的处理中产生错误的结果——虽然按照该实施方式的设计，对于级联分类器本身来说只是置信度高低的问题，而非现有技术中那样非正即负的判断。尤其是如果这个级比较靠前的话，更会严重影响置信度的值。在负样本与正样本的相似度极高的情况下，发生这种情况的可能性更高。因此，在本实施方式中，如图4所示，可以将级联分类器配置为简单地忽略没有通过的子分类器级。具体而言，例如，如果样本未通过第i级子分类器，则使得Vi = Vi-P这样，前一级的置信度可以传递到下一级，而使当前级被忽略。根据实际情况，可以任意规定可以忽略多少级没有通过的子分类器级。一种极端情况是可以忽略任何没有通过的子分类器级。当然也可以设定最多忽略的级数。例如可以将级联分类器配置为允许忽略一级，也就是在碰到第二个没有通过的子分类器级时，则不再考虑随后的子分类器级的结果，输出此时的置信度。也可以将级联分类器配置为允许忽略两级，也就是在碰到第三个没有通过的子分类器级时，则不再考虑随后的子分类器级的结果，输出此时的置信度。等等。在本实施方式中，对忽略多少级的控制可以通过恰当地配置各个子分类器级或者级联分类器来实现。另外，也可以想到在级联分类器中设置控制装置(图中未示出)，用来对样本未通过的子分类器级进行计数，并依据计数值来控制是否停止分类并输出。显然，所述控制装置的全部或者部分可以分别视为每一个子分类器级的一部分。第三实施方式发明人注意到，在许多应用中，详细区分置信度值的大小只对那些容易误判的正样本和负样本有意义，而对于分类准确率高的正样本和负样本，详细计算置信度值没有意义，反而浪费计算资源。因此对于上述第一实施方式和第二实施方式的技术方案，如图5和图6所示，可以用根据第一实施方式的第一级联分类器504或者根据第二实施方式的第二级联分类器604 与粗分类器502级联。通过该粗分类器502选掉大多数正样本和负样本。粗分类器对输入样本赋予的置信度即为第一实施方式或者第二实施方式的级联分类器的初始置信度V0。换句话说，也可以认为本实施方式是在第一实施方式和第二实施方式的级联分类器中，将第一级子分类器配置为以较高的准确率筛选掉大多数正样本和负样本的粗分类器 (未图示)。进一步，如图7所示，所述粗分类器也可以是第三级联分类器702。具体地，该第三级联分类器702可以是任何类型的级联分类器，尤其可以是传统的级联分类器，即，只要其任一级子分类器拒绝样本，样本即被所拒绝。需要注意的是，图7中仅图示了第一级联分类器504与第三级联分类器702级联的情况，事实上也可以是第二级联分类器604与第三级联分类器702级联。从另一角度看，也可以认为本实施方式是由多级子分类器构成的级联分类器，其中前M(M为大于1的自然数)级子分类器B」(j为满足1 <= j <= M的自然数)按传统方式工作，即只要样本被任意子分类器h拒绝，则此样本被判别为负样本(图7中的输出 “0”)；后N级子分类器按第一或者第二实施方式工作。具体来说，例如，样本在子分类器~ 以前只能是要么通过，要么被拒绝；而在子分类！C1以后，则样本逐级获得随所通过的子分类器Ci的数量增加而提高的置信度。通过本实施方式，能够通过前M级子分类器筛选掉大多数正样本和负样本，而通过后N级子分类器对容易混淆的正样本和负样本赋予更为精细的置信度，以便更精确地区分正样本和负样本。如何选定M值将对分类器的性能有巨大影响，如果M值过大，则整个级联分类器的性能接近传统的级联分类器；如果M值过少，则有大量的样本需要通过后N级子分类器进行置信度计算，效率降低。在具体应用中，M值要依据具体的应用需求和子分类器的特性来确定，是本领域技术人员在掌握了本申请的基本思想之后容易做到的。确定合适M值的一种方式是根据传统级联分类器的性能曲线，例如查全率-准确率曲线，使得所述前M级子分类器的查全率较高，以保证前M级子分类器可以让绝大多数正样本都通过。第四实施方式本申请的上述各实施方式可以应用于任何需要进行分类的技术领域，包括图像、视频、音频中的目标检测技术。对于图像或者视频中的目标检测和分类技术，即在静态图像或者视频图像中检测多种目标物体是否存在，且/或区分是多种目标中的哪一种，并确定其在图像中的位置和尺寸。对于音频中的目标检测技术，则是在音频流中检测是否存在目标(包括特定说话人，和/或者特定的内容例如单词等)，以及目标在时间轴上的位置，等等。在进行目标检测时，人们往往使用窗口进行遍历。对于图像，是使用空间窗口进行遍历；对于音频，是使用时间窗口进行遍历；对于视频，可以对单帧图像使用空间窗口进行遍历，同时可以在时间轴上逐帧遍历。由于检测对象尺度的不确定性，还可以进行多尺度遍历。多尺度遍历可以通过改变窗口大小进行，也可以通过改变样本分辨率来进行(例如构建图像的金字塔图像)。在遍历过程中，由于各种原因(例如检测目标的尺寸大于窗口，或者窗口遍历的步长小于检测目标的尺寸，或者仅仅因为检测目标本身的位置恰好跨越窗口边界)，可能导致检测目标跨越多个窗口，从而使得多个窗口对检测目标有正面响应。换句话说，如果说每一个窗口就是一个样本的话，就是说分类器对多个相邻(时间上相邻，或者空间上相邻，或者二者均相邻)的样本均具有正响应。为此，可以把相邻窗口的样本(下面称之为“相邻样本”)的分类结果进行合并(或者说“融合”)，得到候选检测对象的位置和置信度。例如，本申请人于2009年7月观日递交的题为“检测视频图像中的目标的方法和装置”的中国专利申请200910161669. 8就记载了多尺度遍历和融合的技术，该申请的全文通过这里的引用合并于此。需要认识到，在需要进行合并的多个具有正响应的相邻样本中，各相邻样本的重要性显然是不一样的，甚至可能存在假的正样本。因此，本申请的前述各实施方式可以应用于窗口遍历情况下的相邻窗口(相邻样本)的合并。换句话说，如图8所示，本实施方式的级联分类器还可以包括合并装置806，用于对多个相邻样本的分类结果进行合并，获得候选目标(即合并后的相邻样本，例如多个相邻窗口构成的一个较大窗口所包含的样本)及其置信度。这样，对于样本中的某个目标，本申请的第二级联分类器604会在其附近的多个窗口中得到正响应不但这些窗口中的样本会被接受，而且得到的置信度会较高。因此，对相邻的多个窗口结果的融合可以得到更大的综合置信度。而对于某些比较难以检测的目标(可能因为噪音、光照条件不好等)，本申请的第二级联分类器604会在其附近得到多个较弱的响应，经过多窗口置信度融合后会得到一定的置信度，从而使得该目标可以被检测到。这是因为对象确实存在，即使外界条件不好导致响应较弱，但相邻的多个窗口仍然都会有正响应。而对于只有0/1输出的分类器，则可能会直接拒绝这些相邻窗口中的大多数窗口。对于绝大多数虚假正响应来说，由于其出现多数是偶然的，因此其相邻窗口中只会有极少量的窗口也能够得到正响应。因此，通过窗口融合，其综合置信度仍然较低。也就是说，在遍历和融合过程中，由于第二级联分类器604对样本给出不同的置信度值，而不是简单地通过或者拒绝，从而能够提高对条件不好的对象的查全率，同时有效地排除虚假正响应，从而同时提高了查全率和准确率。需要注意的是，图8仅仅图示了粗分类器502、第二级联分类器604以及合并装置 806的组合，但显而易见的是，前述诸实施方式及其任何变型，均可与所述合并装置806相组合。另外，从所述多个相邻样本的置信度获取合并后的候选目标的置信度可以用多种方式进行。例如，计算各相邻样本的置信度的和；或者将各置信度归一化，并对归一化后的置信度求和或求平均值；或者计算各置信度的平均值；等等。应理解，在此所述的对置信度进行合并的方法仅仅是示例性的，并非意欲将本申请限制于此。在本申请的范围内，本领域的普通技术人员可以利用各种其他适当的合并方法(例如计算直方图等)对所述置信度进行合并。
在本申请中，所谓的相邻窗口或者相邻样本是指所检测到的候选目标(也就是具有正响应的窗口)所对应的区域具有相邻的中心位置。对于视频检测中的帧间融合(见本申请人于2009年7月观日递交的题为“检测视频图像中的目标的方法和装置”的中国专利申请200910161669. 8)来说，所述区域还应当具有大小相近的尺寸。例如，对于图像和视频处理来说，中心位置相邻可以指各中心位置相差一个或多个像素，本领域的技术人员可以理解，像素数可以根据实际需要检测的目标状态(如运动速度、方向等)而定。这里不一一列举。又如，尺寸相近可以指尺寸相差一个或多个像素。本领域的技术人员可以理解，这里相差的像素数可以根据实际需要检测的目标状态(如目标大小、运动速度等)而定。第五实施方式在以上对第一实施方式到第四实施方式的级联分类器的说明中，同时体现了利用所述级联分类器实现的分类方法。因此在此没有必要对所述分类方法进行重复的详细说明，而仅对所述分类方法扼要重述如下。首先，根据前述第一实施方式，同时公开了一种分类方法，包括使样本通过多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。这样，会对样本给出一个实数置信度值，而不是简单地拒绝或者接受，从而能够通过不同的置信度值更好地对不同的样本予以区分。作为该分类方法的一个具体示例，可以使样本通过级联的N级子分类器C1到Cn，N 为大于1的自然数，其中，样本通过第i级子分类器Ci之后获得置信度Vi,其中i为满足1 < =i < = N的自然数，Vi满足Vi > Vh，V0为样本的初始置信度。其中，Vi相对于V"可以算术递增，可以指数递增，也可以乘式递增。对于置信度的逐级递增方式，可以是任何方式。例如，可以与子分类器的性能(置信度或者其它指标如误检率等)有关或者无关地直接设定在通过某个子分类器后样本所获得的置信度值，或者，可以与子分类器的性能(置信度或者其它指标如误检率等)有关或者无关地设定在通过某个子分类器后样本所获得的置信度值的大于0的递增值、指数递增值或者大于1的递增系数等。例如，当至少一个子分类器为包括多个基分类器的Boosting(合并增强)分类器时，该子分类器对置信度的算术递增值、指数递增值或者乘式递增系数可以与所述多个基分类器的输出之和与该Boosting分类器的阈值之间的差值的绝对值相关。作为一个例子，还可以考虑使用与子分类器误检率相关的递增系数。例如，可以使该系数为f^/fi，其中A为第i级子分类器Ci的误检率。由于各级子分类器的误检率应当逐步降低，因此fi < fi-i，进而该递增系数大于1，因此样本的置信度会随着通过的子分类器级数的增加而逐步提高。对于本实施方式的上述所有变型，都可以进行进一步改进。例如，可以对算术递增、指数递增或者乘式递增的递增值或者递增系数针对不同的子分类器级加权。加权系数的确定可以有各种各样的方式。例如可以依据子分类器级的位置或者各子分类器级本身对具体的输入样本的不同表现(例如对样本确定的置信度)来确定加权系数。在某个子分类器级是包括多个基分类器的合并增强(Boosting)分类器的情况下，类似于前文所述，可以将所述加权系数确定为与所述多个基分类器的输出之和与该Boosting分类器的阈值之间的差值的绝对值相关。
根据上述方法，能够对样本赋予更为精细的置信度。根据前述第二实施方式，在上述分类方法中，可以忽略没有通过的子分类器级。具体而言，例如，如果样本未通过第i级子分类器，则使得Vi = Vi^10这样，前一级的置信度可以传递到下一级，而使当前级被忽略，从而避免仅仅由于某一个级的误判就导致整个级联分类器对正样本的置信度较低，从而导致在随后的处理中产生错误的结果。根据实际情况，可以任意规定可以忽略多少级没有通过的子分类器级。对忽略多少级的控制可以通过恰当地配置各个子分类器级或者级联分类器来实现。另外，也可以想到对样本未通过的子分类器级进行计数，并依据计数值来控制是否停止考虑之后的子分类器级的分类结果。显然，所述计数和控制步骤可以分别视为每一个子分类器级的分类操作的一部分；或者反过来，可以将每一个子分类器级对忽略多少级的控制总体上视为一个单一的控制步骤。根据前述第三实施方式，本申请还提出了将粗分类(步骤906)与置信度累进的分类(步骤910)相结合的分类方法，如图9所示。也就是在前述的分类方法的各种实施方式或者变型之前，可以先进行粗分类，以筛选掉大多数准确率高的正样本和负样本，仅对容易发生误判的样本进行置信度累进的分类，同时保证效率。进一步，所述粗分类器也可以使用级联分类器，尤其可以是传统的级联分类器，即，只要其任一级子分类器拒绝样本，样本即被整个级联分类器拒绝。根据前述第四实施方式，本申请的上述分类方法的各种实施方式和变型可以应用于任何需要进行分类的技术领域，包括图像、视频、音频中的目标检测技术。在使用窗口遍历和融合技术的情况下，使用本申请的上述分类方法尤其有利。也就是说，如图10所示，首先对每一个样本按照前述各种分类方法进行分类，即粗分类(步骤906)和置信度累进的分类(步骤910)，然后对多个相邻样本的初步分类结果1012进行合并(步骤1016)，获得候选目标及其置信度。在图10中，粗分类步骤(步骤 906)用虚线表示，是为了说明该步骤也可以没有。从而，通过多样本融合，可以进一步拉大条件好的候选检测目标、条件不好的候选检测目标以及虚假的候选检测目标之间的置信度差距，从而能够提高对条件不好的对象的查全率，同时有效地排除虚假正响应，从而同时提高了查全率和准确率。上面仅对与第一实施方式到第四实施方式相应的分类方法进行了简要的说明。其技术细节可以进一步详细参考前文对第一实施方式到第四实施方式本身的说明。上面对本申请的一些实施方式进行了详细的描述。如本领域的普通技术人员所能理解的，本发明的方法和装置的全部或者任何步骤或者部件，可以在任何计算设备(包括处理器、存储介质等)或者计算设备的网络中，以硬件、固件、软件或者它们的组合加以实现，这是本领域普通技术人员在了解本发明的内容的情况下运用他们的基本编程技能就能实现的，因此不需在此具体说明。此外，显而易见的是，在上面的说明中涉及到可能的外部操作的时候，无疑要使用与任何计算设备相连的任何显示设备和任何输入设备、相应的接口和控制程序。总而言之，计算机、计算机系统或者计算机网络中的相关硬件、软件和实现本发明的前述方法中的各种操作的硬件、固件、软件或者它们的组合，即构成本发明的设备及其各组成部件。因此，基于上述理解，本发明的目的还可以通过在任何信息处理设备上运行一个程序或者一组程序来实现。所述信息处理设备可以是公知的通用设备。因此，本发明的目的也可以仅仅通过提供包含实现所述方法或者设备的程序代码的程序产品来实现。也就是说，这样的程序产品也构成本发明，并且存储有这样的程序产品的存储介质也构成本发明。显然，所述存储介质可以是本领域技术人员已知的，或者将来所开发出来的任何类型的存储介质，包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。在本发明的设备和方法中，显然，各部件或各步骤是可以分解、组合和/或分解后重新组合的。这些分解和/或重新组合应视为本发明的等效方案。还需要指出的是，执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行，但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。另外，虽然上面是一个实施方式一个实施方式地进行描述，但应当理解各个实施方式并不是孤立的。本领域技术人员在阅读了本申请文件之后，显然能够理解，各实施方式所包含的各种技术特征在各种实施方式之间是可以任意组合的，只要它们之间没有冲突即可。当然，在同一实施方式中提及的所有技术特征相互之间也是可以任意组合的，只要它们相互之间没有冲突即可。最后，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外，在没有
更多限制的情况下，由语句“包括一个......，，限定的要素，并不排除在包括所述要素的过
程、方法、物品或者设备中还存在另外的相同要素。虽然已经结合附图详细说明了本发明的实施方式及其优点，但是应当理解，上面所描述的实施方式只是用于说明本发明，而并不构成对本发明的限制。对于本领域的技术人员来说，可以对上述实施方式作出各种修改和变更而不背离本发明的实质和范围。因此，本发明的范围仅由所附的权利要求及其等效含义来限定，在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。
权利要求
1.一种级联分类器，包括多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。
2.如权利要求1所述的级联分类器，包括级联的N级子分类器C1到CN，N为大于1的自然数，其中，样本通过第i级子分类器Ci之后获得置信度Vi，其中i为满足1 < = i < = N的自然数，Vi满足Vi > V"，V0为样本的初始置信度。
3.如权利要求2所述的级联分类器，其中，Vi相对于V"算术递增或者指数递增。
4.如权利要求3所述的级联分类器，其中，至少一个子分类器为包括多个基分类器的合并增强分类器，该子分类器对置信度的算术递增值或者指数递增值与所述多个基分类器的输出之和与该合并增强分类器的阈值之间的差值的绝对值相关。
5.如权利要求2所述的级联分类器，其中，Vi= Vp1 Xg (Ci^g(Ci)为子分类器Ci对置信度的大于1的递增系数。
6.如权利要求5所述的级联分类器，其中，g(Ci)= f^/fi，其中&为第i级子分类器 Ci的误检率，fj < fi_10
7.如权利要求6所述的级联分类器，其中，对g(Ci)乘以一个加权系数。
8.如权利要求7所述的级联分类器，其中，至少一个子分类器为包括多个基分类器的合并增强分类器，所述加权系数与所述多个基分类器的输出之和与该合并增强分类器的阈值之间的差值的绝对值相关。
9.如权利要求2-8之一所述的级联分类器，其中，如果样本未通过第i级子分类器，则使得Vi = V"，或者将Vp1作为样本的最终置信度输出。
10.如权利要求1-8之一所述的级联分类器，还包括前置的粗分类器，通过该粗分类器的样本的置信度为所述初始置信度。
11.如权利要求10所述的级联分类器，其中，所述粗分类器为多级子分类器级联构成，其中，只要该粗分类器的任一级子分类器拒绝样本，样本即被所述粗分类器和所述级联分类器拒绝。
12.如权利要求11所述的级联分类器，还包括合并装置，将对多个相邻样本的分类结果进行合并，获得候选目标及其置信度。
13.一种分类方法，包括使样本通过多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。
14.如权利要求13所述的分类方法，包括使样本通过级联的N级子分类器C1到CN，N为大于1的自然数，其中，样本通过第i级子分类器Ci之后获得置信度Vi,其中i为满足1 < = i < = N的自然数，Vi满足Vi > V"， Vtl为样本的初始置信度。
15.如权利要求14所述的分类方法，其中，Vi相对于V"算术递增或者指数递增。
16.如权利要求15所述的分类方法，其中，至少一个子分类器为包括多个基分类器的合并增强分类器，该子分类器对置信度的算术递增值或者指数递增值与所述多个基分类器的输出之和与该合并增强分类器的阈值之间的差值的绝对值相关。
17.如权利要求14所述的分类方法，其中，Vi= Vp1 Xg (Ci^g(Ci)为子分类器Ci对置信度的大于1的递增系数。
18.如权利要求17所述的分类方法，其中，g(Ci)= Wfi,其中fi为第i级子分类器 Ci的误检率，fi < fi_10
19.如权利要求18所述的分类方法，其中，对g(Ci)乘以一个加权系数。
20.如权利要求19所述的分类方法，其中，至少一个子分类器为包括多个基分类器的合并增强分类器，所述加权系数与所述多个基分类器的输出之和与该合并增强分类器的阈值之间的差值的绝对值相关。
21.如权利要求14-20之一所述的分类方法，其中，如果样本未通过第i级子分类器，则使得\ = A^1，或者将Vp1作为样本的最终置信度输出。
22.如权利要求13-20之一所述的分类方法，还包括使样本首先通过前置的粗分类器，通过该粗分类器的样本的置信度为所述初始置信度。
23.如权利要求22所述的分类方法，其中，所述粗分类器为多级子分类器级联构成，其中，只要该粗分类器的任一级子分类器拒绝样本，样本即被所述粗分类器和所述分类方法拒绝。
24.如权利要求23所述的分类方法，还包括将对多个相邻样本的分类结果进行合并，获得候选目标及其置信度。
全文摘要
本申请涉及一种分类器及分类方法。其中，使用多个级联的子分类器，其中，样本通过其中任一子分类器之后获得相应的置信度，该置信度从样本的初始置信度开始，随通过的子分类器级数而逐渐增加。本申请使得分类器对不同样本可以有更好的置信度区分。
文档编号G06K9/00GK102208009SQ201010137690
公开日2011年10月5日申请日期2010年3月31日优先权日2010年3月31日
发明者吴伟国, 梅树起申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：梅树起;吴伟国
技术所有人：索尼公司
我是此专利的发明人

上一篇：多核内存一致性的实现方法和装置的制作方法
上一篇：遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。