人脸图像标注方法和系统的制作方法

文档序号:6505178阅读:428来源:国知局
人脸图像标注方法和系统的制作方法
【专利摘要】一种人脸图像标注方法,包括步骤:对需要标注的人脸图像进行人脸聚类;根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注;根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。本发明还提供一种人脸图像标注系统,通过本发明的技术,可以实现对人脸图像的快速准确的人物标注,提升了标注速度和准确率,特别是用于在对海量的人脸图像进行标注时,标注快速和准确性高的效果更加明显,可以极大提高了海量人脸图像标注的效率。
【专利说明】人脸图像标注方法和系统

【技术领域】
[0001]本发明涉及图像处理【技术领域】,特别是涉及一种人脸图像标注方法和系统。

【背景技术】
[0002]有标注人物信息的人脸图像也越来越重要,有了大量的有标注的人脸图像,不但可以用来训练模型提高人脸识别的效果,而且可以用来做很多产品,例如移动互联网社交厂 PR ο
[0003]目前,最常见的人脸图像标注方法仍然是人工标注,通过人的识别能力,人工将每一张人脸标注为一个人物标签。
[0004]人工标注每一张图片,速度非常慢,当标注的人物比较多的时候,人工识别的速度会越来越慢,标注一张图片花费的时间也越来越长。当图片数量和人脸数量都很大的时候,人工标注几乎无法完成。而且,标注的人物数量变多的时候,标注每一张图片都变得很困难,很容易让人疲惫,无形中增加了标注错误的概率。对于陌生人,人的记忆能力有限,标注的人物越多,越容易记不住,越容易标注错误。
[0005]在工业化应用场合,人脸图像的数据一般都是海量的,如果标注出海量数据,科研价值和商业价值都非常大,人脸图像的数据是随着新数据的不断加入而成倍增加的,对于这些不断增加的海量的人脸图像数据,要标注人脸图像就变得更加困难。
[0006]随着人脸识别技术在计算机视觉、模式识别领域广泛应用,为了提高在人脸图像标注的效率,在人脸图像标注【技术领域】,也开始引入了聚类技术,将所有的图片通过聚类算法聚成若干类,每一类中的人脸图片为同一个人,然后人工给每一类批量标注,在一定程度上节省了标注的时间。
[0007]但对于海量的人脸图像的数据来说,利用上述技术来进行人脸图像的标注,由于人脸照片达到海量数据后,聚类得到的类别也是海量的,这就导致了聚类的性能会明显下降,从而使得包括人脸图像标注的速度和准确率都随着下降。因此,基于上述的人脸图像标记技术,会随着人脸图像数据的不断增多,速度和准确性会不断降低,对于每一类照片标注的难度增大,仍然会容易出现标注错误的情况,对海量人脸图像数据的标注效率低,难以普遍应用于目前不断增长的海量人脸图像数据的标注。


【发明内容】

[0008]基于此,有必要针对上述现有技术对海量人脸图像数据的标注效率低的问题,提供一种人脸图像标注方法和系统。
[0009]一种人脸图像标注方法,包括如下步骤:
[0010]对需要标注的人脸图像进行人脸聚类;
[0011]根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注;
[0012]根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
[0013]一种人脸图像标注系统,包括:
[0014]识别和聚类模块,用于对需要标注的人脸图像进行人脸聚类;
[0015]人物标注模块,用于根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注;
[0016]分类器模型更新模块,用于根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
[0017]上述人脸图像标注方法和系统,首先对需要标注的人脸图像进行识别和聚类,然后根据分类器模型计算各类别的人脸图像属于各个标注人物的概率,以该概率作为参考对人脸图像进行标注,可以实现对人脸图像的快速准确的人物标注,提升了标注速度和准确率,而且,随着分类器模型的不断更新,聚类性能越高,特别是用于在对海量的人脸图像进行标注时,标注快速和准确性高的效果更加明显,可以极大提高了海量人脸图像标注的效率。

【专利附图】

【附图说明】
[0018]图1为人脸图像标注方法实施例一的流程图;
[0019]图2为人脸图像标注方法实施例二的流程图;
[0020]图3为一个实施例的人脸图像标注系统结构示意图。

【具体实施方式】
[0021]下面结合附图对本发明的人脸图像标注方法的【具体实施方式】作详细描述。
[0022]实施例一
[0023]参见图1所示,图1为人脸图像标注方法实施例一的流程图,包括如下步骤:
[0024]步骤S101,对需要标注的人脸图像进行人脸聚类。
[0025]步骤S102,根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注。
[0026]步骤S103,根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
[0027]本实施例的人脸图像标注方法,首先对需要标注的人脸图像进行人脸聚类,即利用聚类算法将人脸图像聚成若干类别,若多个类别为同一个人物,则将其合并为一个类别,每一类别中的人脸图片为同一个人。然后采用人脸识别算法识别人脸图像,根据分类器模型计算各类别的人脸图像属于各个标注人物的概率,以该概率作为参考对人脸图像进行标注,标注过程是给每一类别的人脸图像进行批量标注,从而节省了标注的时间。
[0028]通过上述实施例的方案,可以实现对人脸图像的快速准确的人物标注,提升了标注速度和准确率,而且,随着分类器模型的不断更新,聚类性能越高,特别是用于在对海量的人脸图像进行标注时,标注快速和准确性高的效果更加明显,可以极大提高了海量人脸图像标注的效率。
[0029]作为一种实施方式,本实施例的人脸图像标注方法还包括获取所述步骤S102中预存的训练器模型的步骤,具体包括如下:
[0030]获取若干已识别和聚类的人脸图像,对所述人脸图像进行标注,根据各个类别已标注的人脸图像训练出若干个训练器,根据所述训练器获取所述预存的分类器模型。
[0031]在上述步骤中,通过使用一些已标注的人脸图像来训练出若干个训练器,再根据这些训练器获取到分类器模型进行预存,用于对所需标注的人脸图像进行标注时识别时使用。
[0032]对于上述获取所述预存的训练器模型的步骤,也可以将部分需要标注的人脸图像,作为第一批次标注的人脸图像进行人物标注,在该批次人脸图像标注成功后,使用已标注成功的人脸图像训练分类器,获取到分类器模型进行预存,用于下一批次的人脸图像标注中使用。
[0033]对于上述训练分类器的方法,可以根据本专利使用者实际情况进行选定。例如,可以对每一个人物标注信息训练一个两类分类器,然后训练出多个分类器,也可以训练一个整体的多类分类器;其中分类器可以使用SVM (支持向量机)或adaboost等。
[0034]在本实施例中,所述步骤S102中对人脸图像进行标注的过程,可以进一步包括如下:
[0035](I)根据预存的分类器模型分别对各个类别内各个人脸图像逐个识别得到每一个人脸属于每一个已标注人物的第一概率。
[0036]具体的,假设前述步骤中使用了 Tl个人物,训练出的分类器模型Ml。使用分类器模型Ml对需要标注的人脸图像逐个识别,每张人脸图像的识别结果都是一个长度为Tl的向量Vt,向量的每一个元素Vti表示该人脸属于Tl个人物Tli的概率,向量所有元素的和为1,经过识别可以得到每一个人脸属于每一个人物的概率PT,Pt是一个二维矩阵,即为人脸与人物的概率矩阵。
[0037](2)根据所述人脸与标注人物的第一概率计算每一个类别属于每一个标注人物的第二概率,其中,计算第二概率的方法可以包括如下:

P 2 + P 2 +...ρ 2
[0038]ΡηΤ1 二 1Γ1 2η「


■s/n

D 2 I 11—i I/12
^Τ\το ++…/^”
[0039]Ρτ~-^η=-
[0040]......Rt2 +P,T2+ --Pt2
[0041]P1 =—-tjJ=-—;


■sjn
[0042]式中,Pnn?PnTi —个包含η个人脸图像的类别属于包含i个标注人物的第二概率,Pit?PnT为该类别内I?η个人脸图像对应的第一概率,Tl?Ti为对应的I?i个标注人物。
[0043]经过上述计算,可以得到每一类属于每一个人物的概率PnT,Pnl是一个二维矩阵,即为类别与人物的概率矩阵。
[0044](3)根据所述第二概率对所有类别的人脸图像进行标注。
[0045]具体的,根据上述计算获得的类别与人物的概率矩阵,将每一个类别属于每个人物的概率进行排序,得到需要标注的类别属于每一个人物的概率排序以及具体的概率值,在标注每一类别人脸图像时,可以根据概率排序和概率值对该类人脸图像进行标注,从而可以大幅度提升人物标注的速度和准确性,提高了标注效率。
[0046]综上实施例所述,本发明的人脸图像标注方法,结合分类识别、聚类技术,可以采用分批次的方式对人脸图像多轮标注,进而大大简化了标注的流程和难度,速度快、准确性高、标注效率高,特别是针对于海量增量的人脸图像进行人物标注时,效果更佳。
[0047]实施例二
[0048]参见图2所示,图2为人脸图像标注方法实施例二的流程图,包括如下步骤:
[0049]步骤S201,将需要标注的人脸图像放入待标注集合中。
[0050]步骤S202,对待标注集合中的人脸图像进行人脸聚类。
[0051]步骤S203,利用预设的阀值判断各个类别的人脸图像数量,若超过阀值,放入标注集合,否则,将其保留在待标注集合中。
[0052]步骤S204,根据预存的分类器模型计算标注集合中的各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述标注集合中的人脸图像进行标注,然后放入已标注集合中。
[0053]步骤S205,根据所述已标注集合中的人脸图像训练出新的分类器更新所述分类器模型。
[0054]本实施例的人脸图像标注方法,首先,将需要标注的人脸图像放入待标注集合中,在进入标注操作阶段后,对待标注集合中所有人脸图像进行识别和聚类,考虑到有些类别只有一张人脸或者人脸数量很少,直接标注效率较低,因此,利用预设的阀值判断各个类别的人脸图像数量,若超过阀值,放入标注集合,否则,将其保留在待标注集合中,这样,数量少的类别可以选择暂时不标注,留到下一批次人脸图像中一起标注,节省标注时间,提高了标注的效率。
[0055]然后,根据分类器模型计算待标注集合中各类别的人脸图像属于各个标注人物的概率,以该概率作为参考对人脸图像进行标注,经过标注后人脸图像分为两部分,第一部分是已经标注的人脸图像,放入到已标注集合中,第二部分是没有进行标注的人脸图像,继续保留在待标注集合中,等待下一次的标注。可以实现对人脸图像的快速准确的人物标注,提升了标注速度和准确率,标注成功后放入已标注集合中,已标注集合中包括所有已标注的人脸图像,用于输出和训练分类器。
[0056]在标注完成后,根据已标注集合中的所有人脸图像训练出新的分类器,并用于更新预存的分类器模型。随着分类器模型的不断更新,聚类性能越高,特别是用于在对海量的人脸图像进行标注时,效果更加明显,可以极大提高了海量人脸图像标注的效率。
[0057]作为一种实施方式,本实施例的人脸图像标注方法还包括获取所述步骤S204中预存的训练器模型的步骤,其获取过程与步骤S204中获取预存的训练器模型的过程相同,在此不再赘述。
[0058]在本实施例中,所述步骤S204中对人脸图像进行标注的过程,可以与实施例一中步骤S102的标注过程相同,在此不再赘述。
[0059]下面结合附图对本发明的人脸图像标注系统的【具体实施方式】作详细描述。
[0060]参见图3所示,图3为一个实施例的人脸图像标注系统结构示意图,包括:
[0061]识别和聚类模块,用于对需要标注的人脸图像进行人脸聚类;
[0062]人物标注模块,用于根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注;
[0063]分类器模型更新模块,用于根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
[0064]在一个实施例中,本发明的人脸图像标注系统还包括训练器模型获取模块,用于:
[0065]获取若干已识别和聚类的人脸图像;
[0066]对所述人脸图像进行标注;
[0067]根据各个类别已标注的人脸图像训练出若干个训练器;
[0068]根据所述训练器获取所述预存的分类器模型。
[0069]在一个实施例中,所述人物标注模块进一步用于:
[0070]根据预存的分类器模型分别对各个类别内各个人脸图像逐个识别得到每一个人脸属于每一个已标注人物的第一概率;
[0071]根据所述人脸与标注人物的第一概率计算每一个类别属于每一个标注人物的第二概率;
[0072]根据所述第二概率对所有类别的人脸图像进行标注。
[0073]在一个实施例中,所述人物标注模块计算第二概率的方法包括:
η Ετ]2 + Ρ?τ,2-\—Pt,2
[0074]P11;


■sjn
「 π ρ Pir,2 + Prri2+".ΡηΤ12
[0075]ΡηΤ2 -^η=-


■sj η
[0076]......? Rt2 + Rr2H■…Pr2
[0077]PnTj=~^-=llJ=-

yjn
[0078]式中,Pnn?PnTi —个包含η个人脸图像的类别属于包含i个标注人物的第二概率,Pit?PnT为该类别内I?η个人脸图像对应的第一概率,Tl?Ti为对应的I?i个标注人物。
[0079]在一个实施例中,本发明的人脸图像标注系统还包括:人脸图像暂存模块,用于将需要标注的人脸图像放入待标注集合中;
[0080]以及阀值判断模块,用于利用预设的阀值判断各个类别的人脸图像数量,若超过阀值,放入标注集合,否则,将其保留在待标注集合中;
[0081]所述识别和聚类模块进一步用于:对待标注集合中的人脸图像进行人脸聚类;
[0082]人物标注模块进一步用于:根据预存的分类器模型计算标注集合中的各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述标注集合中的人脸图像进行标注,然后放入已标注集合中;
[0083]分类器模型更新模块进一步用于:根据所述已标注集合中的人脸图像训练出新的分类器更新所述分类器模型。
[0084]本发明的人脸图像标注系统与本发明的人脸图像标注方法一一对应,在上述人脸图像标注方法实施例阐述的技术特征及其有益效果均适用于人脸图像标注系统的实施例中,特此说明。
[0085]本领域普通技术人员可以理解实现上述实施方式中的全部或部分流程,以及对应的系统,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各实施方式的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccess Memory, RAM)等。
[0086]以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
【权利要求】
1.一种人脸图像标注方法,其特征在于,包括如下步骤: 对需要标注的人脸图像进行人脸聚类; 根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注; 根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
2.根据权利要求1所述的人脸图像标注方法,其特征在于,还包括获取所述预存的训练器模型的步骤: 获取若干已识别和聚类的人脸图像; 对所述人脸图像进行标注; 根据各个类别已标注的人脸图像训练出若干个训练器; 根据所述训练器获取所述预存的分类器模型。
3.根据权利要求1所述的人脸图像标注方法,其特征在于,所述根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注的步骤包括: 根据预存的分类器模型分别对各个类别内各个人脸图像逐个识别得到每一个人脸属于每一个已标注人物的第一概率; 根据所述人脸与标注人物的第一概率计算每一个类别属于每一个标注人物的第二概率; 根据所述第二概率对所有类别的人脸图像进行标注。
4.根据权利要求1所述的人脸图像标注方法,其特征在于,所述计算第二概率的方法包括:
P 2 + P 2+...ρ 2
P — 1 in ^ 1 2Γ1 丁 1 nTl.ΓηΤ\ —,
-1 P 2ι...ρ -
P — 1 \Τ2 τ 1 2Τ2 T ηΤ2.ΓηΤ2 —Γ=,

\Ι η
P _Ριτι2+P2Ti2 + -Pj.1 _ ^ , 式中,ΡηΤ1?PnTi —个包含η个人脸图像的类别属于包含i个标注人物的第二概率,Pit?PnT为该类别内I?η个人脸图像对应的第一概率,Tl?Ti为对应的I?i个标注人物。
5.根据权利要求1至4任一项所述的人脸图像标注方法,其特征在于,所述对需要标注的人脸图像进行人脸聚类的步骤前还包括:将需要标注的人脸图像放入待标注集合中; 所述对需要标注的人脸图像进行人脸聚类的步骤包括:对待标注集合中的人脸图像进行人脸聚类; 所述根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注的步骤前还包括:利用预设的阀值判断各个类别的人脸图像数量,若超过阀值,放入标注集合,否则,将其保留在待标注集合中; 所述根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注的步骤包括:根据预存的分类器模型计算标注集合中的各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述标注集合中的人脸图像进行标注,然后放入已标注集合中; 所述根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型的步骤包括:根据所述已标注集合中的人脸图像训练出新的分类器更新所述分类器模型。
6.一种人脸图像标注系统,其特征在于,包括: 识别和聚类模块,用于对需要标注的人脸图像进行人脸聚类; 人物标注模块,用于根据预存的分类器模型计算各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述人脸图像进行标注; 分类器模型更新模块,用于根据所述已标注的人脸图像训练出新的分类器更新所述分类器模型。
7.根据权利要求6所述的人脸图像标注系统,其特征在于,还包括训练器模型获取模块,用于: 获取若干已识别和聚类的人脸图像; 对所述人脸图像进行标注; 根据各个类别已标注的人脸图像训练出若干个训练器; 根据所述训练器获取所述预存的分类器模型。
8.根据权利要求6所述的人脸图像标注系统,其特征在于,所述人物标注模块进一步用于: 根据预存的分类器模型分别对各个类别内各个人脸图像逐个识别得到每一个人脸属于每一个已标注人物的第一概率; 根据所述人脸与标注人物的第一概率计算每一个类别属于每一个标注人物的第二概率; 根据所述第二概率对所有类别的人脸图像进行标注。
9.根据权利要求6所述的人脸图像标注系统,其特征在于,所述计算第二概率的方法包括:
P 2 + P 2+...ρ 2
P _ 1 ITl τ 1 2ΤΙ1 nTl.-Sin —,

yjn
P 2 I P 2J____P 2
P _ 1 \T2 ^ 1 2T21 nT2.\[η
P 2 + ρ -.+...P 2
ρ — 1 ITi Ti 2Τ?1 ηΤ?.ΓιιΤ? _/=,

■sjn 式中,Ρηπ?PnTi —个包含η个人脸图像的类别属于包含i个标注人物的第二概率,Pit?PnT为该类别内I?η个人脸图像对应的第一概率,Tl?Ti为对应的I?i个标注人物。
10.根据权利要求6至9任一项所述的人脸图像标注系统,其特征在于,还包括:人脸图像暂存模块,用于将需要标注的人脸图像放入待标注集合中; 以及阀值判断模块,用于利用预设的阀值判断各个类别的人脸图像数量,若超过阀值,放入标注集合,否则,将其保留在待标注集合中; 所述识别和聚类模块进一步用于:对待标注集合中的人脸图像进行人脸聚类; 人物标注模块进一步用于:根据预存的分类器模型计算标注集合中的各个类别的人脸图像属于各个标注人物的概率,并根据所述概率对所述标注集合中的人脸图像进行标注,然后放入已标注集合中; 分类器模型更新模块进一步用于:根据所述已标注集合中的人脸图像训练出新的分类器更新所述分类器模型。
【文档编号】G06K9/00GK104252628SQ201310270811
【公开日】2014年12月31日 申请日期:2013年6月28日 优先权日:2013年6月28日
【发明者】苗广艺, 路香菊, 单霆 申请人:广州华多网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1