专利名称:用于处理图像中包含的面部的方法和设备的制作方法
技术领域:
本发明的实施方式总体上涉及信息技术领域,更具体地,涉及用于处理图像中包含的面部的方法和设备。
背景技术:
随着图像捕获技术和工具的不断发展,每天都有大量的信息以图像的形式产生。在这些图像中,很多图像包含有身份信息和/或社交信息。从这些图像中提取面部信息并确定对应的身份信息是一类重要的应用,它在诸如社交、国家安全、司法、金融以及人机交互等诸多领域具有重要价值。合理的分析和利用图像中对象的身份信息,能够为用户提供更好的服务和体验。
总体上,可以通过人工和自动这两类方式从图像中提取面部信息并确定对应的身份信息。在人工方式中,用户可以交互式地在给定图像中选择面部和/或指示面部所对应的身份信息。例如,在目前比较常见的社交网络站点中,对于用户上传至例如“相册”的图像,系统通常允许用户例如通过鼠标选择图像中的面部,并且输入该面部所对应的身份信息,例如姓名、年龄以及其他有关信息(“社交网络”和“相册”的定义将在下文描述中给出)。可以理解,这种人工方式将会给用户造成明显的交互负担,并且无法有效处理大量甚至是海量的图像信息。与此相对,在自动方式中,使用例如面部检测、识别和分类等生物特征识别技术来处理图像,从而自动地提取图像中包含的面部并确定对应的身份信息。生物特征识别技术目前已经取得了一定的进展和成果,并且在某些领域得到实践应用。但是,为了能够确定图像中包含的面部所对应的身份,需要事先在训练过程中建立称为分类器(classifier)的识别模型。如本领域中已知的,分类器是一种通过训练和学习而获得的模型,其适用于解决这样的问题在已知至少一个样本类别以及每个类别的样本特性的情况下,对待测样本进行分类判别,即识别它属于哪一类。特别地,对于面部识别而言,为了判别特定的面部所对应的身份,需要确定该面部与已知的哪个面部最为接近或匹配。这就必须创建用于面部识别的分类器。为此,对于每个面部,需要提供包含该面部的多个图像作为训练数据,以建立用于学习的训练集。在现有技术中,这种训练数据通常采用人工方式采集的。具体而言,用户需要收集包含特定面部的图像作为训练图像,而后对每个训练图像进行人工标定,以用于分类器的创建(建模)和识别。显然,人工采集训练数据需要耗费大量的时间和人力成本。特别是当需要识别的面部数量众多时,这种人工方式将是耗时的甚至是不可行的。
发明内容
为了克服现有技术中的上述缺陷,本发明的实施方式提供用于处理图像中包含的面部的方法和设备。
在本发明的一个方面,提供一种用于处理图像中包含的面部的方法。该方法包括针对社交网络的至少一个相册中的每一个检测所述相册的图像中所包含的面部;对检测到的面部进行汇聚,以生成至少一个面部数据集;从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该方法进一步包括基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。根据本发明的某些可选实施方式,所述检测包括估算面部在所述图像中的位置和大小;基于估算的所述位置和大小来检测所述图像中包含的面部。根据本发明的某些可选实施方式,所述检测方法进一步包括对检测到的面部应用过滤以提高检测精度。根据本发明的某些可选实施方式,其中所述汇聚包括对检测到的面部进行正则化;提取经过正则化的面部的特征;基于所提取的特征对检测到的面部进行聚类。根据本发明的某些可选实施方式,其中所述选择包括选择所对应的面部数目最多的面部数据集与所述相册的所有者相关联。根据本发明的某些可选实施方式,其中所述面部分类器基于统计模型。根据本发明的某些可选实施方式,该方法进一步包括利用建立的所述面部分类器,识别输入图像中包含的面部。在本发明的另一方面,提供一种用于处理图像中包含的面部的设备,包括相册处理装置,配置用于处理社交网络中的至少一个相册中的每一个,所述相册处理装置包括检测装置,配置用于检测所述相册的图像中所包含的面部;汇聚装置,配置用于对检测到的面部进行汇聚,以生成至少一个面部数据集;以及选择装置,配置用于从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该设备进一步包括分类器建立装置,配置用于基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。根据本发明的各种实施方式,社交网络的相册中的图像被用于建立相册所有者的面部训练集。这是因为,对社交网络的统计学分析表明在社交网络的相册中,图像中所包含的面部大部分是该相册的所有者的面部。利用社交网络的这一特性,通过将相册中在数量上或出现频率上占主导地位的面部与该相册的所有者相关联,可以有效地采集该所有者的面部信息。这些面部信息随即可以被用作该用户的训练图像。以此方式,通过处理社交网络的海量相册,可以自动、快速、准确地获取大量面部的训练数据,并由此建立用于海量图像面部识别的分类器。因此,根据本发明的实施方式,可以有效地克服现有技术中为了实现海量图像面部识别而需要人工处理训练数据的缺陷,解决海量图像面部识别中获取训练集合的成本和效率问题,从而实现更高的效率和更好的扩展性。利用根据本发明实施方式获得的面部分类器,可以有效地识别给定图像中包含的面部,以用于各种目的。
通过参考附图阅读下文的详细描述,本发明实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中图I示出了根据本发明示例性实施方式的用于处理图像中包含的面部的方法100的流 程图;图2示出了根据本发明示例性实施方式的用于在图像中检测面部的方法200的流程图;图3示出了根据本发明示例性实施方式的用于处理图像中包含的面部的设备300的框图;以及图4示出了适合用来实践本发明实施方式的计算机系统400的框图。在附图中,相同或对应的标号表不相同或对应的部分。
具体实施例方式下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。如上文所述,统计学分析表明在社交网络的相册中,图像中所包含的面部绝大部分是该相册所有者的面部。换言之,与其他人相比,相册所有者的面部在相册的图像中出现的频率和次数占据主导地位。基于这一事实,根据本发明的实施方式,相册中在数量上或者说出现频率上占主导地位的面部被认为是相册所有者的面部并由此与之关联。这样,可以有效地采集该用户的面部训练数据。通过对社交网络中存在的多个相册执行这种处理,可以获得多组训练数据。利用这些训练数据,便可以通过学习来建立用于海量图像面部识别的分类器。注意,在此使用的术语“社交网站”或“社交网络”是指向对特定对象感兴趣或只是一起“闲逛”的人们提供虚拟社区的Web站点。成员通过语音、聊天、即时消息、视频会议和博客等进行通信,并且该服务通常向成员提供了联系其他成员的好友的方法。特别地,很多社交网络都以现实世界的实际生活中的社交为基础。换言之,尽管社交网络成员的关系和数据是虚拟化的,但是这些关系和数据之间的联系往往基于和反映现实生活中确实存在的社交关系。例如,社交网络中的“好友”在很多情况下都是真实世界中的朋友、同事、同学这样的关系。已知的是,此类社交网络通常在注册成员时要求进行实名制认证。另外,在此使用的术语“相册”是指社交网络中可供用户对图像进行上传、保存、编辑、浏览等各种操作的位置或目录。特别地,如上所述,目前社交网络中的很多关系和数据都以现实生活为基础。相应地,常见的情况是,用户上传至其社交网络“相册”的照片往往是与其生活有关的真实照片,例如生活照、艺术照、集体照,等等。通过下文详细描述,本领域技术人员将会理解,本发明的思想在某种程度上依赖于社交网络的这一特点。首先参考图1,其示出了根据本发明示例性实施方式的用于处理图像中包含的面部的方法100的流程图。应当理解,方法100中记载的各个步骤可以按照不同的顺序执行和/或并行执行。此外,方法100可以包括附加的步骤和/或省略执行示出的步骤。本发明的范围在此方面不受限制。方法100开始之后,在步骤S102,检测社交网络的相册的图像中所包含的面部。如本领域已知的,社交网络中通常包含成千上万甚至数以亿计的相册。根据本发明的实施方式,可以根据具体需要和应用场景对任意数目的可用相册进行处理。在步骤S102处,可以采用各种目前已知或将来开发的方法对相册的图像中所包含的面部进行检测,本发明的范围在此方面不受限制。作为一个示例性实施方式,图2中示出了用于检测图像中面部的一种方法的流程图,将在下文详述。接下来,在步骤S104处,确定在步骤S102处是否检测到了至少一个面部。可以理解,在某些情况下,用户相册中的图像可能不包含任何面部。例如,如果用户创建相册专门用于保存例如风景照片,则步骤S102中将无法检测到任何面部信息。在步骤S104处,如果确定当前相册中的所有图像均不包括任何面部,则方法100进行到步骤S110,在此确定是否存在更多待处理的相册,这将在下文详述。另一方面,如果在步骤S104处确定步骤S102中检测到了至少一个面部,则方法100进行到步骤S106,在此对检测到的面部进行汇聚(aggregation),以生成至少一个面部 数据集。根据本发明的实施方式,对面部的汇聚实质上可被视作聚类(clustering)过程。如本领域已知的,聚类是指将对象按照某种相似性进行分组。由聚类所生成的组或簇是相似对象的集合同一个组中的对象彼此相似,不同组之间的对象彼此相异。根据本发明的某些实施方式,步骤S106处的聚类可以通过以下方式实现。首先,可选地,可以对检测到的面部进行正则化(normalization)。例如,可以利用诸如仿射变换(例如,旋转、平移、缩放)等操作在给定的参考系下对检测到的面部进行归一化,以消除面部在图像中的位置、角度和/或尺寸等差异对后续特征提取和建模的潜在影响。接下来,提取经过正则化的面部的特征。根据所采用的建模方法以及具体需求,可以利用目前已知或者将来开发的任何方法来提取任何适当的图像特征,以表征图像中包含的面部信息。此后,可以基于所提取的特征对检测到的面部进行聚类,例如采用K均值(K-means)算法等。注意,现在已知或将来开发的任何聚类方法均可应用于本发明的实施方式。经过步骤S106的汇聚操作之后,可以生成一个或多个面部数据集,每个面部数据集包含表征各自面部的数据。此后,方法100进行到步骤S108,在此选择一个面部数据集与相册的所有者相关联。如上文所述,对社交网络的统计学分析表明在社交网络的相册中,图像中所包含的面部绝大部分是该相册所有者的面部。换言之,与其他人相比,相册所有者的面部在相册的图像中出现的数量和频率占据主导地位。基于这一特点,根据本发明的优选实施方式,在步骤S108处,可以选择所对应的面部数目最多的面部数据集与相册的所有者相关联。根据本发明的此类实施方式中,在相册中出现次数最多(频率最高)的面部被认为是相册所有者的面部,并且由此在二者之间建立关联关系。由此,通过对社交网络中相册的自动化处理,可以获得相册所有者的多个面部图像信息,以用于随后建立该所有者的训练集。以此方式,本发明的实施方式有效地克服了现有技术中需要人工标定大量训练数据的缺陷,降低了识别成本,提高了识别效率。当然,可以理解的是,上述假设并非总是成立的。在某些情况下,用户的相册中出现次数最多的面部可能并非是用户本人的面度。在另一些情况下,相册所有者本人的面部与其他人的面部可能以基本上等同的频率出现。为了应对这些情况,根据本发明的另一些实施方式,同样允许用户通过交互的方式在汇聚得到的至少一个面部数据集中进行选择,以确定与他/她相关联的面部(如果有的话)。接下来,方法100进行到步骤S110,在此确定社交网络中是否还有更多待处理的相册。如果存在这样的相册,则方法100返回到步骤S102,以便按照与上文描述的相同方式处理下一相册。如果在步骤SllO处确定已经处理了所有待处理的相册,则方法100进行到步骤S102,在此通过学习(learning)来建立用于面部识别的面部分类器。通过对社交网络的多个相册分别执行上文描述的步骤S102到S108,可以获得与每个相册的所有者相关联的多个面部数据集。在这种情况下,在步骤SI 12,基于针对所有已处理相册而获得的面部数据集(更具体地,以这些面部数据集作为训练集),可以通过学习来建立用于面部识别的面部分类器。在步骤S112处,可以根据具体的需要建立用于面部识别的各种适当的分类器,包括但不限于基于统计模型的分类器、贝叶斯分类器、神经网络分类器、模板匹配分类器,等等。例如,在本发明的某些示例性实施方式中,可以通过学习建立基于统计模型的分类器,诸如SVM(支持向量机)分类器。应当理解,这里所描述的分类器类型仅仅是示例性的,本发明的范围在此方面不受限制。方法100在步骤S112完成后结束。作为方法100执行的结果,建立了用于面部识别的分类器。特别地,所处理的相册数目越多,该分类器的适用范围也越广。利用目前社交网络上存在的海量相册和图像,可以通过方法100建立用于海量面部识别的分类器。由此,当给定特定的输入图像时,可以利用所建立的面部分类器来识别输入图像中包含的面部所对应的身份。这种身份信息随后可被用于各种后续处理。注意,在上文描述中,方法100被描述为以顺序方式以此处理多个相册。备选地,可以按照任何适当的顺序处理社交网络中存在的任意数目的相册。此外,也可以针对多个相册并行地执行方法100的多个实例。现在参考图2,根据本发明示例性实施方式的用于在图像中检测面部的方法200的流程图。如上文所述,根据本发明的实施方式,方法200可以作为上文描述的方法100中的步骤S102而执行。方法200开始之后,在步骤S202处,估算面部在图像中的位置和大小。步骤S202的目的在于,首先从总体上估计出图像中可能存在面部的区域以及每个区域的大小。根据本发明的实施方式,步骤S202处的估算可以通过目前已知或者将来开发的各种方法来实现。例如,在某些示例性实施方式中,可以利用局部二值模式(Local Binary Patterns,LBP)对图像进行分析处理,提取LBP特征。而后,可以利用ADAB00ST迭代算法对图像进行快速扫描,以粗略估算处图像中可能包含面部的区域的位置和大小。接下来,方法200进行到步骤S204,在此根据步骤S202处估算的位置和尺寸来检测图像中包含的面部。根据本发明的某些实施方式,可以基于步骤S202处估算的人脸区域 的位置和尺寸,使用HAAR特征和ADAB00ST算法对图像进行精确的面部检测。在方法200的某些可选实施方式中,还包括步骤S206,在此对检测到的面部进行过滤以提高检测精度。根据本发明的实施方式,在步骤S206处,可以采用各种方式对步骤S204处获得的备选面部进行过滤。例如,根据本发明的某些实施方式,可以采用主元分析(PCA)对面部区域进行过滤。备选地或附加地,在另一些实施方式中,可以采用支持向量机(SVM)来执行过滤。方法200在步骤S206之后结束。作为方法200的执行结果,可以获得图像中所包含的面部的有关信息。应当理解,上文结合图2描述的仅仅是本发明的某些可行实施方式,并不构成对本发明范围的限制。实际上,在给出上述启示和教导的情况下,本领域的技术人员可以根据具体需求采用任何适当的模式识别和/或图像处理方法,从社交网络相册的图像中检测和提取面部区域。由此,本发明的范围在此方面不受限制。此外,还应理解,上文所提及的诸如LBP、ADABOOST迭代算法、HAAR特征、PCA等方法和特征均是本领域中已知的,故而在此不再详述。
现在参考图3,其示出了根据本发明示例性实施方式的用于处理图像中包含的面部的设备300的框图。如图所示,根据本发明的实施方式,设备300包括相册处理装置302和分类器建立装置304。相册处理装置302配置用于处理社交网络中的至少一个相册中的每一个,其包括检测装置3022,配置用于检测所述相册的图像中所包含的面部;汇聚装置3024,配置用于检测到的面部的进行汇聚,以生成至少一个面部数据集;以及选择装置3026,配置用于从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。分类器建立装置304配置用于基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。根据本发明的某些可选实施方式,检测装置3022进一步包括配置用于估算面部在所述图像中的位置和大小的装置;配置用于基于估算的所述位置和大小来检测所述图像中包含的面部的装置。此外,根据本发明的某些可选实施方式,检测装置3022进一步包括配置用于对检测到的面部应用过滤以提高检测精度的装置。根据本发明的某些可选实施方式,汇聚装置3024进一步包括配置用于对检测到的面部进行正则化的装置;配置用于提取经过正则化的面部的特征的装置;以及配置用于基于所提取的特征对检测到的面部进行聚类的装置。根据本发明的某些可选实施方式,选择装置3026进一步包括配置用于选择所对应的面部数目最多的面部数据集与所述相册的所有者相关联的装置。根据本发明的某些可选实施方式,其中所述面部分类器基于统计模型。根据本发明的某些可选实施方式,进一步包括面部识别装置306,配置用于利用建立的所述面部分类器来识别输入图像中包含的面部。为清晰起见,在图3中并未示出各个装置所包含的子装置。然而,应当理解,设备300中记载的装置与分别参考图I和图2描述的方法100和方法200中的步骤相对应。由此,上文针对方法100和方法200描述的操作和特征同样适用于设备300及其中包含的装置和子装置,在此不再赘述。还应当理解,设备300可以利用各种方式来实现。例如,在某些实施方式中,设备300可以利用软件和/或固件模块来实现。此外,设备300也可以利用硬件模块来实现。例如,设备300可以实现为集成电路(IC)芯片或专用集成电路(ASIC)。设备300也可以实现为片上系统(SOC)。现在已知或者将来开发的其他方式也是可行的,本发明的范围在此方面不受限制。图4示出了适于用来实践本发明实施方式的计算机系统的示意性框图。如图4所示,计算机系统可以包括CPU(中央处理单元)401、RAM(随机存取存储器)402、ROM(只读存储器)403、系统总线404、硬盘控制器405、键盘控制器406、串行接口控制器407、并行接口控制器408、显示控制器409、硬盘410、键盘411、串行外部设备412、并行外部设备413和显示器414。在这些设备中,与系统总线404耦合的有CPU 401、RAM 402、ROM 403、硬盘控制器405、键盘控制器406、串行控制器407、并行控制器408和显示控制器409。硬盘410与硬盘控制器405耦合,键盘411与键盘控制器406耦合,串行外部设备412与串行接口控制器407耦合,并行外部设备413与并行接口控制器408耦合,以及显示器414与显示控制器409耦合。应当理解,图4所述的结构框图仅仅为了示例的目的而示出的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。应当理解,图4所述的结构框图仅仅为了示例的目的而示出的,而不是对本发明范围的限制。在某些情况下,可以根据具体情况而增加或者减少某些设备。特别地,除硬件实施方式之外,本发明的实施方式可以通过计算机程序产品的形式实现。例如,分别参考图I和图2描述的方法100和方法200可以通过计算机程序产品来实现。该计算机程序产品可以存储在例如图4所示的RAM 404、ROM 404、硬盘410和/或任何适当的存储介质中,或者通过网络从适当的位置下载到计算机系统400上。计算机程序产品可以包括计算机代码部分,其包括可由适当的处理设备(例如,图4中示出的CPU 401)执行的程序指令。所述程序指令至少可以包括用于实现上文描述的方法100和方法200的指令。上文已经结合若干具体实施方式
阐释了本发明的精神和原理。根据本发明的实施方式,社交网络的相册中的图像被用于建立相册所有者的面部训练集。实际上,本发明的实施方式主要基于以下事实,即在社交网络的相册中,图像中所包含的面部绝大部分是该相册所有者的面部。利用社交网络的这一特性,通过将相册中在数量上占主导地位的面部与相册所有者相关联,可以有效地采集该所有者的面部训练数据并建立训练集。以此方式,通过处理社交网络的海量相册,可以自动、快速、准确地获取训练集合,以建立用于在海量图像中面部识别的分类器。由此,克服了现有技术中为了实现海量图像面部识别而需要人工处理训练数据的缺陷。利用根据本发明实施方式获得的面部分类器,可以有效地识别给定图像中包含的面部以用于各种目的。应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。说明书中提及的通信网络可以包括各类网络,包括但不限于局域网(“LAN”),广域网(“WAN”),根据IP协议的网络(例如,因特网)以及端对端网络(例如,ad hoc对等网络)。应当注意,尽管在上文详细描述中提及了设备的若干装置或子装置,但是这种划分仅仅并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多装置的特征和功能可以在一个装置中具体化。反之,上文描述的一个装置的特征和功能可以进一步划分为由多个装置来具体化。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。虽然已经参考若干具体实施方式
描述了本发明,但是应该理解,本发明并不限于所公开的具体实施方式
。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改 和等同布置。所附权利要求的范围符合最宽泛的解释,从而包含所有这样的修改及等同结构和功能。
权利要求
1.一种用于处理图像中包含的面部的方法,包括 针对社交网络的至少一个相册中的每一个 检测所述相册的图像中所包含的面部; 对检测到的面部进行汇聚,以生成至少一个面部数据集;以及从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联;以及基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。
2.如权利要求I所述的方法,其中所述检测包括 估算面部在所述图像中的位置和大小;以及 基于估算的所述位置和大小来检测所述图像中包含的面部。
3.如权利要求2所述的方法,其中所述检测进一步包括 对检测到的面部应用过滤以提高检测精度。
4.如权利要求I所述的方法,其中所述汇聚包括 对检测到的面部进行正则化; 提取经过正则化的面部的特征;以及 基于所提取的特征对检测到的面部进行聚类。
5.如权利要求I所述的方法,其中所述选择包括 选择所对应的面部数目最多的面部数据集与所述相册的所有者相关联。
6.如权利要求I所述的方法,其中所述面部分类器基于统计模型。
7.如权利要求I所述的方法,进一步包括 利用建立的所述面部分类器,识别输入图像中包含的面部。
8.一种用于处理图像中包含的面部的设备,包括 相册处理装置,配置用于处理社交网络中的至少一个相册中的每一个,所述相册处理装置包括 检测装置,配置用于检测所述相册的图像中所包含的面部; 汇聚装置,配置用于检测到的面部的进行汇聚,以生成至少一个面部数据集;以及选择装置,配置用于从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联;以及 分类器建立装置,配置用于基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。
9.如权利要求8所述的设备,其中所述检测装置进一步包括 配置用于估算面部在所述图像中的位置和大小的装置; 配置用于基于估算的所述位置和大小来检测所述图像中包含的面部的装置。
10.如权利要求9所述的设备,其中所述检测装置进一步包括 配置用于对检测到的面部应用过滤以提高检测精度的装置。
11.如权利要求8所述的设备,其中所述汇聚装置进一步包括 配置用于对检测到的面部进行正则化的装置; 配置用于提取经过正则化的面部的特征的装置;以及 配置用于基于所提取的特征对检测到的面部进行聚类的装置。
12.如权利要求8所述的设备,其中所述选择装置进一步包括配置用于选择所对应的面部数目最多的面部数据集与所述相册的所有者相关联的装置。
13.如权利要求8所述的设备,其中所述面部分类器基于统计模型。
14.如权利要求8所述的设备,进一步包括面部识别装置,配置用于利用建立的所述面部分类器来识别输入图像中包含的面部。
全文摘要
本发明的实施方式涉及用于处理图像中包含的面部的方法和设备。具体公开了一种用于处理图像中包含的面部的方法,该方法包括针对社交网络的至少一个相册中的每一个,检测所述相册的图像中所包含的面部;对检测到的面部进行汇聚,以生成至少一个面部数据集;以及从所述至少一个面部数据集中选择面部数据集与所述相册的所有者相关联。该方法还包括基于与所述至少一个相册的所有者相关联的面部数据集,通过学习来建立用于面部识别的面部分类器。本发明的实施方式还公开了相应的设备。本发明的实施方式有效地降低了海量图像面部识别的成本,提高了效率。
文档编号G06K9/62GK102637255SQ20111003850
公开日2012年8月15日 申请日期2011年2月12日 优先权日2011年2月12日
发明者刘汀, 邵军辉 申请人:北京千橡网景科技发展有限公司