一种用于数字图像内容识别的特征编码方法
【专利摘要】本发明公开了一种用于数字图像内容识别的特征编码方法,涉及信号与信息处理【技术领域】,包括:将输入的图像特征序列分割成具有固定长度的特征矢量,利用稀疏编码获得每个特征矢量的稀疏描述;从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引,对索引序列进行二值化处理;构造原子权重直方图并进行二值化处理;合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。本方法能够将图像特征矢量映射为简短的二值哈希序列,计算复杂度低;且所生成的图像哈希能够抵抗图像处理操作所引入的内容失真,可实现高效、准确的图像内容识别。
【专利说明】一种用于数字图像内容识别的特征编码方法
【技术领域】
[0001] 本发明涉及信号与信息处理【技术领域】,尤其涉及一种用于数字图像内容识别的特 征编码方法。
【背景技术】
[0002] 近年来,社交网络的快速发展和低成本图像传感器(如手机内置摄像头)的普及 极大程度地丰富了数字图像资源,数字图像的数量呈现出激增的态势。海量的图像资源对 高效的查询、索引以及版权管理技术提出了迫切需求,其核心问题是对图像感知内容的识 另IJ,而内容识别的基础是对图像感知内容的描述。为了实现准确的内容识别,图像描述符需 要具备鲁棒性、区分性和简要性的特点。鲁棒性是指当图像经过处理后(如压缩、滤波和加 噪声等),其描述符仍然保持稳定。区分性要求内容不同的数字图像的描述符之间应呈现出 显著差异。简要性则要求描述符的数据量尽量小,以降低内容识别中的比对复杂度和描述 符存储空间。图像哈希(也称图像指纹)是内容识别中常用的描述符,它能够将图像感知 内容用简短的二值序列描述,具有易于比对和存储等优点。图像哈希是对图像特征序列进 行编码后的结果,因此对特征的编码是图像哈希中的关键技术。Swaminathan等人计算图像 的傅立叶梅林变换系数在极坐标系下的圆周积分,采用文献[1]中提出的自适应量化器将 积分结果编码为二元哈希序列[2]。与之类似,文献[3]对图像内显著点的响应进行自适应 量化以生成哈希。为了达到鲁棒性和区分性之间的平衡,文献[4]中采用抖动格型矢量量 化对特征矢量进行编码。文献[5]利用非负矩阵分解生成图像哈希。
[0003] 发明人在实现本发明的过程中,发现现有技术中至少存在以下缺点和不足:
[0004]现有的特征量化技术所生成的哈希序列数据量偏大。现有技术大多以每个特征 量化索引的二进制表示作为哈希,哈希数据量大会增加图像识别的复杂度以及哈希存储空 间。此外,现有技术的鲁棒性不强。例如:自适应量化器所生成的哈希是对特征进行标量量 化的结果。图像处理操作会导致特征的改变,标量量化器存在对特征扰动敏感的特点,由此 导致图像哈希在鲁棒性方面的局限。
【发明内容】
[0005]本发明提供了一种用于数字图像内容识别的特征编码方法,本发明将图像特征编 码为简短的二值哈希序列,该哈希序列能够实现对图像感知内容的简要化描述,同时具有 良好的鲁棒性和区分性,据此可实现高效、准确的图像内容识别,详见下文描述:
[0006] -种用于数字图像内容识别的特征编码方法,所述方法包括以下步骤:
[0007] (1)将输入的图像特征序列分割成具有固定长度的特征矢量,利用稀疏编码获得 每个特征矢量的稀疏描述;
[0008] (2)从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引,对索引序列进 行二值化处理;
[0009] (3)构造原子权重直方图并进行二值化处理;
[0010] ⑷合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。
[0011] 所述从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引,对索引序列进 行二值化处理的步骤具体为:
[0012] 在每个特征矢量的稀疏描述Xi中,获取具有最大绝对值的元素所在的位置(即原 子索引),收集所有特征矢量所对应的最大权重原子索引,组成集合;将集合中的每个元素 与中位数作比较,如果元素大于中位数,输出1,否则输出0,由此获得二值序列。
[0013] 所述构造原子权重直方图并进行二值化处理的步骤具体为:
[0014] 1)统计每个原子在所有稀疏描述中的权重,获取原子权重直方图;
[0015] 2)随机生成Q个随机矢量,对每个随机矢量进行归一化,使其2-范数为1 ;
[0016] 3)将原子权重直方图投影至生成的Q个随机矢量上,计算投影矢量L ;对于投影矢 量L求取相应的中位数,将每个元素与中位数相比较,如果大于中位数,则输出1,否则输出 0,经比较后得到二值序列。
[0017] 本发明提供的技术方案的有益效果是:本发明通过对特征矢量进行稀疏编码生成 图像哈希。首先,稀疏编码能够以最稀疏的方式对特征矢量进行描述,由此可保证哈希序列 的简要性,有利于降低图像识别的复杂度以及哈希存储空间;其次,特征矢量的稀疏描述能 够抵御图像处理操作(如压缩、滤波和加噪声等)所引入的失真,由此保证了图像哈希的鲁 棒性。此外,本发明程序简单,易于实现,所述的特征编码过程计算复杂度低。在CPU主频 为3. 4GHz,内存为3. 2GB的计算机上的测试结果表明,本方法计算单幅尺寸为512X512图 像的哈希序列所需的时间为仅为〇. 0235秒,分别较文献[4]和文献[5]中所述算法快18 倍和30倍。综上所述,本发明所生成的图像哈希具有易于比对和数据量小的优点,可以实 现高效、准确的图像内容识别。
【专利附图】
【附图说明】
[0018] 图1为对图像特征矢量进行编码的流程图;
[0019] 图2为对图像特征矢量进行编码的不意图。
【具体实施方式】
[0020] 为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步 地详细描述。
[0021] 为了实现对图像内容的简要且鲁棒的描述,本发明实施例提出了一种用于图像内 容识别的特征编码方法,参见图1和图2,详见下文描述:
[0022] 101 :将输入的图像特征序列分割成具有固定长度的特征矢量,利用稀疏编码获得 每个特征矢量的稀疏描述;
[0023] 其中该步骤具体为:
[0024] 1)对输入特征序列V = {Vl,…,vN}进行矢量化,将该特征序列分割成一系列维数 为M的特征矢量: yi,i = 1,2,…,N/M。M和N的具体取值根据实际应用中的需要进行设定, 本发明实施例对此不做限制。
[0025] 2)对于集合中的每一个特征矢量yi(i = 1,2,…,N/M),根据稀疏编码字典
【权利要求】
1. 一种用于数字图像内容识别的特征编码方法,其特征在于,所述方法包括以下步 骤: (1) 将输入的图像特征序列分割成具有固定长度的特征矢量,利用稀疏编码获得每个 特征矢量的稀疏描述; (2) 从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引,对索引序列进行二 值化处理; (3) 构造原子权重直方图并进行二值化处理; (4) 合并由原子索引和原子权重直方图所生成的二值序列构成图像哈希。
2. 根据权利要求1所述的一种用于数字图像内容识别的特征编码方法,其特征在于, 所述从各个特征矢量的稀疏描述中抽取具有最大权重的原子索引,对索引序列进行二值化 处理的步骤具体为: 在每个特征矢量的稀疏描述Xi中,获取具有最大绝对值的元素所在的位置,即原子索 弓丨,收集所有特征矢量所对应的最大权重原子索引,组成集合;将集合中的每个元素与中位 数作比较,如果元素大于中位数,输出1,否则输出0,由此获得二值序列。
3. 根据权利要求1所述的一种用于数字图像内容识别的特征编码方法,其特征在于, 所述构造原子权重直方图并进行二值化处理的步骤具体为: 1) 统计每个原子在所有稀疏描述中的权重,获取原子权重直方图; 2) 随机生成Q个随机矢量,对每个随机矢量进行归一化,使其2-范数为1 ; 3) 将原子权重直方图投影至生成的Q个随机矢量上,计算投影矢量L ;对于投影矢量 L求取相应的中位数,将每个元素与中位数相比较,如果大于中位数,则输出1,否则输出0, 经比较后得到二值序列。
【文档编号】G06K9/00GK104392207SQ201410628154
【公开日】2015年3月4日 申请日期:2014年11月10日 优先权日:2014年11月10日
【发明者】李岳楠, 王萍, 苏育挺 申请人:天津大学