一种基于快速监督离散哈希的人脸检索方法

文档序号:10512713阅读:236来源:国知局
一种基于快速监督离散哈希的人脸检索方法
【专利摘要】本发明公开一种基于快速监督离散哈希的人脸检索方法,该方法首先将每个样本通过高斯核映射到核空间,求解针对核化后的样本的投影矩阵;将每个训练样本的类别标记映射到其对应的哈希码,然后通过最小二乘法求解对应的投影矩阵;通过解析法直接求解哈希码。本发明提高了在人脸检索应用中的精度和速度,在保证高精度的同时,相比现有的哈希方法的运算复杂度大大降低,更加适应于大规模数据的处理。本发明更具有通用性,可用于信息安全,公共安全,金融安全的防护和监督。
【专利说明】
一种基于快速监督离散哈希的人脸检索方法
技术领域
[0001] 本发明涉及机器学习、模式识别和数字图像处理等技术领域,特别是涉及一种基 于快速监督离散哈希的人脸检索方法。
【背景技术】
[0002] 人脸检索和识别是被人们所接受的非接触和非侵犯的识别手段,是计算机视觉, 模式识别和图像处理领域一个很热门的研究问题,备受研究者们的广泛关注。人脸检索技 术的目的是输入计算机一个图像,让计算机输出与其相似的众多图像。人脸检索作为一个 科学问题,是一个典型的图像理解,模式分类的计算机问题。它涉及机器学习、模式识别、运 筹学、数字图像处理和计算机视觉等众多学科。作为生物特征识别关键技术之一的人脸检 索技术在信息安全、公共安全和金融等领域具有广阔的应用前景和巨大的研究价值。
[0003] 人脸被普遍认为是在生物特征识别领域中最具有研究价值的物体。这主要原因在 于人脸的"公开性"和"社会性","公开性"是指拍摄人脸图像一般不会被认为是侵犯他人隐 私;而"社会性"是指人脸在人类视觉系统中具有显著的识别能力,日常生活中人们主要依 靠人脸来判断他人的真实身份,人脸可以看成是人们进行社会交往的主要ID,可以被他人 所记忆。此外,人脸还可被用于推断一个人的"年龄"、"性别"、"美丑"、"种族"和"胖瘦"等信 息,并可被视频监控设备主动采集,这对于公共安全的相关应用是非常重要的。因此,人脸 检索和识别等技术的市场前景非常广阔。
[0004] 哈希方法是一种实现高效人脸检索的机器学习方法,因为将人脸转化成二值哈希 码,通过汉明距离就能快速比较两个图像的相似度,相对欧氏距离,计算效率很高。对哈希 码添加整数约束,是一个混合的整数优化问题,一般来说,是一个NP难问题。为了简化在哈 希码学习过程中的优化问题,大多数哈希方法首先抛弃离散约束,解决一个放松的问题,然 后再通过门限法将实数值转化成哈希码。这个放松的策略极大地简化了原始的离散优化问 题。然而,这样一个放松的策略显然是次优的,通常是低质量的。在学习比较长的哈希码的 时候,可能是因为聚集的量化错误,得到的哈希码不是很有效。大多数哈希方法没有考虑在 哈希学习中离散优化的重要性。为此,Fumin Shen等在2015年提出一个名为"监督离散哈 希"(supervised discrete hashing,简称SDH)的检索方法,该方法没有采用放松的策略, 直接学习哈希码。
[0005] 如今,随着大数据时代的来临,需处理的人脸数据规模往往非常大,算法的高效性 愈发重要,例如及时的通过人脸检索来识别罪犯对公共安全和社会治安起着至关重要的作 用。而"监督离散哈希",时间复杂度较高,并不十分适用于大规模人脸数据的处理。因此,针 对实际环境下处理大规模人脸数据的需求,如何快速高效地实现哈希学习,是目前面临的 技术难题。

【发明内容】

[0006] 本发明的目的在于克服上述已有技术的不足而提供一种基于快速监督离散哈希 的人脸检索方法,其可以提高算法的执行效率,从而提高人脸检索方法的效率。
[0007] 为了实现上述目的,本发明采用如下技术方案:
[0008] 一种基于快速监督离散哈希的人脸检索方法,包括以下步骤:
[0009] 步骤S1,训练样本表示为X = e ,其中η是训练样本的个数,d是训练样 本的维数,Xl代表第i个训练样本;
[0010] 测试样本表示为? e ,其中m是测试样本的个数山代表第j个测试样 本;
[0011]将训练样本和测试样本进行归一化,然后通过高斯非线性核映射至核空间得到训 练样本的核化表达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T);
[0012] 随机生成训练样本的初始哈希码S = i^=1 e ,其中1是哈希码的长度;
[0013] 训练样本的标号矩阵表示为F = !.r乂, eiT'c是类别数,如果Xl属于第k类,则ylk = 1,否则为零,yn^yi的第k个元素;
[0014] 步骤S2,利用哈希码B以及训练样本的核化表达矩阵Φ(Χ),计算核化训练样本的 投影矩阵Ρ= ( Φ (Χ)ΤΦ (X))-1Φ (Χ)ΤΒ,Φ (Χ)% Φ (X)的转置;
[0015] 步骤S3,利用训练样本的标号矩阵Y以及哈希码B,计算训练样本的哈希码的投影 矩阵W= (ΥτΥ+λΙ广1YTB,,其中,λ是一个正则化因子,取值为1; Υτ是Y的转置;
[0016] 步骤S4,利用训练样本的标号矩阵Υ、核化训练样本的投影矩阵Ρ以及步骤S3得到 的训练样本的哈希码的投影矩阵W,计算训练样本的哈希码B = sgn(YW+vF(X)),其中F(X) = Φ (X)P,v = le-5;v是一个正则化因子;
[0017]步骤S2-S4反复迭代进行直至最大迭代次数或者算法收敛;
[0018] 步骤S5,根据核化训练样本的投影矩阵P输出训练样本的哈希码;
[0019] B = sgn(F(X)),其中F(X)= Φ (X)P,
[0020] 根据核化训练样本的投影矩阵P输出测试样本的哈希码;
[0021] sgn(F(T)) =sgn( Φ (Τ)Ρ),
[0022] 步骤S6,根据步骤S5输出的训练样本和测试样本的哈希码进行人脸检索。
[0023]所述将所有训练样本和测试样本进行归一化是分别除以对应的模长,得到单位向 量作为新的特征点,其步骤为:
[0024] 将训练样本X归一化的输出为x/l |x| |2,将测试样本t归一化的输出为t/| |t| |2。
[0025] 将训练样本和测试样本通过高斯非线性核映射至核空间,得到训练样本的核化表 达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T)的步骤如下:
[0026]将任意一个训练样本X映射至核空间的步骤为:Φ (X) = [exp( I I x-ai I 12/0),…, exp(| |x-am| |2/0)],其中,是从训练样本X中随机挑选的m个样本,〇是高斯核参数;对 所有训练样本,都采取本操作得到Φ (X);
[0027]对所有测试样本,都采取相同操作得到Φ (T)。
[0028]所述算法收敛的判断依据是:
[0029] norm(B-<i) (X)P)<tol Xnorm(B, 'fro'),tol = le_5,如果该条件得到满足,贝丨J步 骤S2-S4不再迭代进行,执行步骤S5。
[0030] 与现有方法相比,本发明基于快速监督离散哈希的人脸检索方法(Fast supervised discrete hashing,简称FSDH),由于采用了将训练样本的标号矩阵回归到其 对应哈希码,因此在计算针对哈希码的投影矩阵和计算哈希码时,计算效率都得到大大的 提升,本发明的人脸图像的检索方法,不仅可以用于人脸检索,也能应用到其他一般的图像 检索问题中,可用于信息安全,公共安全,金融安全的防护和监督。
【附图说明】
[0031] 图1是基于快速监督离散哈希的人脸检索方法的系统流程图;
[0032] 图2所示为FRGC数据库中的人脸图片样本。
【具体实施方式】
[0033]为使本发明的目的、技术方案和优点更加清晰,下面,结合实例对本发明的实质性 特点和优势作进一步的说明,但本发明并不局限于所列的实施例。
[0034] 参见图1所示,一种基于快速监督离散哈希的人脸检索方法,包括以下步骤:
[0035] 步骤S1,训练样本表示为Z = ,其中n是训练样本的个数,(1是训练样 本的维数,Xl代表第i个训练样本;R是实数集合;
[0036] 测试样本表示为Γ = h丨;^ e iT',其中m是测试样本的个数,tj代表第j个测试样 本;
[0037] 将训练样本和测试样本进行归一化,然后通过高斯非线性核映射至核空间得到训 练样本的核化表达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T);
[0038] 初始化变量,包括随机生成训练样本的初始哈希码i = {AKU e 1,1Γ;,其中1是 哈希码的长度;
[0039] 训练样本的标号矩阵表示为f = ,〇是类别数,如果Xl属于第k类,则y lk = 1,否则为零,yn^yi的第k个元素;
[0040] 步骤S2,利用哈希码B以及训练样本的核化表达矩阵Φ(Χ),计算核化训练样本的 投影矩阵Ρ= ( Φ (Χ)ΤΦ (X))-1 Φ (Χ)ΤΒ,Φ (Χ)% Φ (X)的转置;
[0041] 步骤S3,利用训练样本的标号矩阵Y以及哈希码B,计算训练样本的哈希码的投影 矩阵W= (ΥτΥ+λΙ广1YTB,,其中,λ是一个正则化因子,取值为1; Υτ是Y的转置;
[0042]步骤S4,利用训练样本的标号矩阵Υ、核化训练样本的投影矩阵Ρ以及步骤S3得到 的训练样本的哈希码的投影矩阵W,计算训练样本的哈希码B = sgn(YW+vF(X)),其中F(X) = Φ (X)P,v = le-5;v是一个正则化因子;
[0043]步骤S2-S4反复迭代进行直至最大迭代次数或者算法收敛;
[0044]步骤S5,根据核化训练样本的投影矩阵P输出训练样本的哈希码;
[0045] B = sgn(F(X)),其中F(X)= Φ (X)P,
[0046] 根据核化训练样本的投影矩阵P输出测试样本的哈希码;
[0047] sgn(F(T)) =sgn( Φ (Τ)Ρ),
[0048] 步骤S6,根据步骤S5输出的训练样本和测试样本的哈希码进行人脸检索。
[0049] 进行人脸检索的方法是,根据得到的哈希码,以采用最近邻分类器为例,计算出测 试样本和所有训练样本的哈希码的汉明距离,按照距离从小到大排序,从而实现检索。
[0050] 需要说明的是,本发明的哈希码计算出来,除可以有于人脸检索外,还可以用于分 类、识别等。
[0051] 所述将所有训练样本和测试样本进行归一化是分别除以对应的模长,得到单位向 量作为新的特征点,其步骤为:
[0052] 将训练样本X归一化的输出为x/l |x| |2,将测试样本t归一化的输出为t/| |t| |2。
[0053] 将训练样本和测试样本通过高斯非线性核映射至核空间,得到训练样本的核化表 达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T)的步骤如下:
[0054]将任意一个训练样本X映射至核空间的步骤为:Φ (X) = [exp( I I x-ai I 12/0),…, exp(| |x-am| |2/0)],其中,是从训练样本X中随机挑选的m个样本,〇是高斯核参数;对 所有训练样本都采取本操作得到Φ (X);
[0055] 对所有测试样本,都采取相同操作得到Φ (T)。
[0056] 其中,所述算法收敛的判断依据是:
[0057] norm(B-<i) (X)P)<tol Xnorm(B, 'fro'),tol = le_5,如果该条件得到满足,贝丨J步 骤S2-S4不再迭代进行,执行步骤S5。
[0058]为了详细说明本发明以及验证本发明的有效性,下面将本发明提出的方法应用到 一个公开的人脸数据库一一FRGC人脸数据库,并参照附图,对本发明进行详细说明。但所描 述的实施例子仅旨在便于对本发明的理解,而不限于下述的实例。
[0059]步骤S1、输入的样本是FRGC数据库中的人脸图片样本,如图2所示,该数据库由 3160张正面人脸组成,总共有316个类别,其中每一张图片的尺寸均为64X64,且均根据两 眼的位置经过标准化处理。
[0060] 为了降低计算量,把原始64X64的人脸图像降采样到32X32大小,并将降采样的 图像拉成一个维度为1024的列向量作为输入特征。随机选择七个样本作为训练,其余的三 个作为测试。
[0061] 训练样本表示为1 =丨.^匕^",其中n是训练样本的个数,d是训练样本的维数,本 例中n = 2212, d = 1024,行向量xi代表第i个训练样本。
[0062] 测试样本表示为T = iQJU efχ<?,其中m是测试样本的个数,本例中m = 948,d是测试 样本的维数,行向量k代表第j个测试样本。
[0063]令所有训练样本和测试样本进行归一化,是分别都除以其模长,得到的单位向量 作为新的特征点以利于后续步骤。其步骤为:
[0064] 将训练样本X归一化的输出为x/l |x| |2,将测试样本t归一化的输出为t/| |t| |2
[0065] 将归一化以后的训练样本和测试样本通过高斯非线性核映射至核空间,具体的将 任意一个训练样本X映射至核空间的步骤为:Φ (x) = [exp( | |x_ai | 12/0),···,exp( | | x-am| 2/σ)],Φ(χ)是一个m维行向量,是对样本x核映射的结果。是从训练样本中随机挑选 的m个样本,σ是高斯核参数,在本例中,固定高斯核参数为〇.4。针对所有训练样本,都采取 这个操作得到Φ 00,同样针对所有测试样本,都采取这个操作得到Φ (Τ)。
[0066] 随机生成哈希码s = AC e ,其中η是训练样本的个数,1是哈希码的长度,本 例中1 = 32。训练样本的标号矩阵是F = 是类别数,本例中c = 316。如果Xl属于第 k类,则yik= 1否则为零,其中yik是yi的第k个元素。λ= 1,v= le-5,tol = le-5。
[0067] 步骤S2、计算针对核化训练样本的投影矩阵P=( Φ (Χ)ΤΦ (Χ))」Φ (X)TB。
[0068] 步骤S3、计算针对哈希码的投影矩阵W=(YTY+AI广1Y TB。
[0069] 步骤 S4、计算哈希码 B = sgn(YW+vF(X))。其中 F(X)=(HX)P。
[0070] 步骤S2、S3和S4是反复迭代进行的,最大迭代次数是5,反复迭代直至最大迭代次 数或者算法收敛。
[0071] 其中,该算法收敛的判断依据是:
[0072] η〇Γηι(Β-φ (X)P)<tol Xnorm(B, 'fro')
[0073] 如果该条件得到满足,则步骤S2、S3和S4不再迭代进行,执行步骤S5。
[0074] 步骤S5、输出训练样本的哈希码:
[0075] B = sgn(F(X))
[0076] 输出测试样本的哈希码:
[0077] sgn(F(T)) =sgn( Φ (Τ)Ρ)
[0078] 步骤S6、根据训练样本和测试样本的哈希码进行人脸检索。
[0079]实验结果如表1所示,表1是本发明在FRGC人脸数据数据库上在检索准确率等指标 上与其他方法的对比,(当前的哈希码长度是32):
[0080]
[0081 ]从表1可以看出,本发明方法在实验中,在所有指标,如召回率(recal 1 )、f-度量 (f-measure)、准确率(accuracy)都比现有方法要好,在精确率(precision)这个指标上两 者效果一样好。由此看出,本发明提出的方法要优于现有方法。
[0082]以上所述的具体实施例,对本发明的技术方案、目的和有效效果进行了进一步详 细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡 在本发明的原则和精神之内,所做的任何修改、等同改进、替换等,均应包含在本发明的保 护范围之内。
【主权项】
1. 一种基于快速监督离散哈希的人脸检索方法,其特征在于,包括以下步骤: 步骤S1,训练样本表示为X = ?=1 e iT'",其中n是训练样本的个数,d是训练样本的 维数,Xl代表第i个训练样本; 测试样本表示为?' =氏丨了 e d,其中m是测试样本的个数,tj代表第j个测试样本; 将训练样本和测试样本进行归一化,然后通过高斯非线性核映射至核空间得到训练样 本的核化表达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T); 随机生成训练样本的初始哈希码β = e {-υΓ'其中1是哈希码的长度; 训练样本的标号矩阵表示为7 e c是类别数,如果Xl属于第k类,则ylk= 1,否 则为零,y ik是y i的第k个元素; 步骤S2,利用哈希码B以及训练样本的核化表达矩阵Φ(Χ),计算核化训练样本的投影 矩阵Ρ=( Φ (Χ)ΤΦ (X))-4 (Χ)ΤΒ,Φ ⑴丁为伞(X)的转置; 步骤S3,利用训练样本的标号矩阵Υ以及哈希码Β,计算训练样本的哈希码的投影矩阵W =(ΥτΥ+λΙ广1 YTB,,其中,λ是一个正则化因子,取值为1; Υτ是Y的转置; 步骤S4,利用训练样本的标号矩阵Υ、核化训练样本的投影矩阵Ρ以及步骤S3得到的训 练样本的哈希码的投影矩阵w,计算训练样本的哈希码B = sgn (YW+vF (X)),其中F(X)=<i> (父汗,¥=16-5一是一个正则化因子; 步骤S2-S4反复迭代进行直至最大迭代次数或者算法收敛; 步骤S5,根据核化训练样本的投影矩阵P输出训练样本的哈希码; B = sgn(F(X)),其中 F(X)= Φ(Χ)Ρ, 根据核化训练样本的投影矩阵Ρ输出测试样本的哈希码; sgn(F(T)) = sgn( Φ (Τ)Ρ), 步骤S6,根据步骤S5输出的训练样本和测试样本的哈希码进行人脸检索。2. 根据权利要求1所述人脸检索方法,其特征在于,步骤S1中,所述将所有训练样本和 测试样本进行归一化是分别除以对应的模长,得到单位向量作为新的特征点,其步骤为: 将训练样本X归一化的输出为x/Mxl k将测试样本t归一化的输出为t/| |t| |2。3. 根据权利要求1所述人脸检索方法,其特征在于,将训练样本和测试样本通过高斯非 线性核映射至核空间,得到训练样本的核化表达矩阵Φ (X)和测试样本的核化表达矩阵Φ (T)的步骤如下: 将任意一个训练样本X映射至核空间的步骤为:Φ (x) = [exp( | |x_ai | |2/〇),…,exp( | x_am| |2/〇)],其中,4匕是从训练样本X中随机挑选的m个样本,〇是高斯核参数;对所有训 练样本,都采取本操作得到Φ (X); 对所有测试样本,都采取相同操作得到Φ (Τ)。4. 根据权利要求1所述人脸检索方法,其特征在于,所述算法收敛的判断依据是: norm(B-<i) (X)P)<tol Xnorm(B, 'fro'),tol = le_5,如果该条件得到满足,则步骤S2- S4不再迭代进行,执行步骤S5。
【文档编号】G06F17/30GK105868743SQ201610381769
【公开日】2016年8月17日
【申请日】2016年5月31日
【发明人】孙哲南, 桂杰, 孙运莲
【申请人】天津中科智能识别产业技术研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1