用于快速图像相似度搜索的基于片的纹理直方图编码的制作方法

文档序号:6594691阅读:342来源:国知局
专利名称:用于快速图像相似度搜索的基于片的纹理直方图编码的制作方法
用于快速图像相似度搜索的基于片的纹理直方图编码背景数字图片或数字图像像其他艺术作品一样将版权提供给它们的所有者。授权和未 授权方容易地访问、传输、下载、和操纵数字图像。例如,只需通过访问网站,各方就能够在 没有版权所有者的授权的情况下复制数字图像。此外,数字图像还可在没有版权所有者的 同意的情况下容易地在各方之间交换。在许多情况下,未授权的复制的数字图像可被认为 是盗版作品或盗版图像。在某些情况下,期望搜索是原始数字图像的副本的数字图像。这样的搜索可以用 于或可以不用于确定所复制的图像是否是盗版的。可进行尝试来从成百上万的图像中搜索 复制的图像,这可实际上是相当大的工作或任务。包括检测复制或盗版的图像的用于搜索复制的图像的技术包括水印模式,然而, 当原始图像(即,有版权的图像)的内容被修改时,水印模式和某些其他搜索模式可能是低 效的。为检测经稍微修改的图像或近似的图像,需要不同的模式或技术。概述提供此概述以介绍涉及应用程序的远程自动预配和发布的概念。这些概念将在以 下详细描述中进一步描述。本概述并不旨在标识所要求保护的主题的必要特征,也不旨在 用于帮助确定所要求保护的主题的范围。在一个实现中,图像被分成多个片,并且为每一片创建直方图。组合多个直方图来 表示图像。直方图对于每一图像是唯一的。因此,复制的图像可通过分析这些图像的直方 图来找出。附图简述参考附图来描述具体实施方式
。在附图中,附图标记中最左边的数字标识该附图 标记首次出现的附图。在各附图中,使用相同的标号来指示相同的特征和组件。

图1是示出被分成8乘8即64片的示例性图像的图示。图2是示出示例性图像和主导梯度方向的图示。图3是示出被分割成八个纹理方向的示例性片的图示。图4是图像的片的示例性纹理直方图的图示。图5是示出用于对图像进行索引的示例性过程的流程图。图6是示出用于检测图像的副本的示例性过程的流程图。图7是示出示例性计算环境的框图。详细描述假设将原始数字图像(即,有版权的图像)作为查询,重复或近似重复的图像,或 复制的图像可通过内容分析来找出。为找出这样的图像,可实现基于内容的图像检索或称 CB^m模式。对于这一 CB^模式,数字图像(S卩,原始图像)可由特征向量来表示。图像 之间的相似度可被定义为特征空间中的距离。给定一原始图像,其他相似的图像(即,复制 的图像)可通过这一 CB^模式来检索。相似的图像可随后由其他方法来判断以便确定他 们是否是复制的图像。
复制或近似重复检测中的两个问题是高效的图像特征和相似度测量。在大规模近 似重复检测中使用的特征可包括“平均灰度”、色彩直方图、纹理直方图等。对于相似度测 量,可实现行业内已知的距离函数,诸如Minkowski度量、直方图余弦距离、模糊逻辑等。如以下进一步描述的,可以实现大规模重复检测算法或模式。该模式将原始图像 划分成片,并且可将每一片的“平均灰度”用作特征。可从由主分量分析或称PCA挑选的大 多数差异特征维度中生成散列码(行业内已知的许多中的一种),以便于快速相似度比较, 其中PCA及其使用是已知的。在一个实现中,汉明(Hamming)距离可用于相似度测量。因为由PCA挑选的差异特征仅可表征整个数据集,因此查询图像的具体属性可能 没有被很好地利用。因此,根据查询图像(即,原始图像),相似度测量可以是动态的,并且 可以实现面向查询的子空间移位方法来检测近似重复或复制的图像。在一个实现中,特殊散列代码可被用于图像表示和快速相似度搜索两者。原始图 像首先被分割成8乘8(即,64)个块或片,并且可取每一片的平均亮度作为特征维度,从而 得到64维特征向量,这可由PCA进一步缩减为32维特征向量。每一维度可随后根据该维 度是否在平均值之上来被量化成二进制值。以此方式,图像可由32位散列码来表示。取两 个散列码之间汉明距离作为两个图像的相似度测量。基于此方法,可非常迅速地检测相似 的图像。在某些情况下,在特定实例中以上方案可能不能有效地检测复制或盗版的图像。 盗版的图像可与原始图像在色彩、对比度、和/或饱和度上略微不同。这些改变可能显著地 改变图像块的平均亮度,并且得到不同的散列码,从而导致图像检测失败。如以下将进一步详细描述的,可以实现用于测量图像之间相似度的基于片的纹理 直方图编码方法。如以上讨论的,这一基于片的直方图编码方法可对色彩改变问题不敏感。图1示出了原始图像100。图像100也可被认为是查询图像。图像100可以是被 标识为有版权或受保护的图像的原始图像集合的一部分。图像100可被划分成8乘8即64 个大小相等的片102-1到102-64。图2示出了以下描述的等式中被称为“D”的主导梯度方 向200。图3示出了被分割成八个纹理方向d0 300-1、dl 300-2、d2 300-3、d3 300-4、d4 300-5、d5 300-6、d6 300-7 和 d8 300-8 的示例片 102-129。现在回头参考图1和图2,在每一片102中,计算纹理梯度的主导梯度方向200。随 后,根据主导方向200来旋转片102。之后,如以下讨论的,计算图3中示出的八个不同方向 的纹理直方图。在以下等式中,I表示图像,诸如图像100。Ii,」被定义为图像(即,图像100)的 i,j像素值。i,j像素的梯度大小是my。值dy表示在像素i,j处的梯度方向。纹理直 方图的第k个维度h (k)表示其方向位于第k个方向柱dk,k = 0,. . .,7 (即,d0 300-1..., d7 300-8)上的像素梯度的总强度。方向柱300由相对于主导梯度方向200的角度来定义。这提供了从每一图像片102中对纹理直方图特征的提取,其中该特征对于片102 旋转、图像比例变化、以及色彩改变是稳健的。执行基于纹理直方图特征的散列码的生成,并且组合多个片(S卩,片102)的直方 图(例如,400)而不是使用一个直方图来表示图像100。这一表示考虑图像100的全局信 息以及图像100的特征的空间分布,该空间分布对色彩和大小修改是稳健的而对不同的图 像是敏感的。片直方图特征可以用32位散列码来编码,从而使得该方法高效。
对于每一片102,基于以下等式来计算8柱纹理直方图h(k),k = 0, ... ,7C
权利要求
1.一种标识数字图像的方法(500),包括 将所述数字图像划分成大小相等的片(102); 创建所述片的特征(504);从所创建的特征中的每一个创建直方图(600);以及 组合所述直方图G00),其中所组合的直方图表示所述数字图像。
2.如权利要求1所述的方法,其特征在于,所述划分是划分成8乘8(64)个大小相等的片。
3.如权利要求1所述的方法,其特征在于,所述创建使用以下各项的一个或多个来作 为特征平均灰度、色彩直方图、和纹理直方图。
4.如权利要求1所述的方法,其特征在于,进一步包括基于主分量分析来创建对所述 图像特定的散列码。
5.如权利要求1所述的方法,其特征在于,进一步包括使用距离函数来测量所述图像 与其他图像的相似度。
6.一种标识原始图像的副本的方法(600),包括 创建构成所述图像的多个片的特征向量O00); 生成所述多个特征向量的直方图(608);以及将所述直方图编码(610)成散列码。
7.如权利要求6所述的方法,其特征在于,所述创建特征向量是创建64维特征向量。
8.如权利要求6所述的方法,其特征在于,进一步将所述64维特征向量缩减到较小维 数的特征向量。
9.如权利要求6所述的方法,其特征在于,所述创建特征向量包括将所述特征向量的 维度量化成二进制值,并且确定所述维度是否在均值以上。
10.如权利要求8所述的方法,其特征在于,所述生成包括确定所述图像的主导梯度方向。
11.一种检测复制的图像的方法(600),包括 生成多个图像的散列码(610);将所述散列码与查询图像的散列码相比较; 对重复或近似重复图像进行粗略过滤(604)。
12.如权利要求11所述的方法,其特征在于,所述生成散列码是基于划分所述图像的 片的纹理直方图。
13.如权利要求11所述的方法,其特征在于,所述生成散列码包括将图像特征投影到 子空间。
14.如权利要求11所述的方法,其特征在于,所述生成散列码是向量量化过程。
15.如权利要求11所述的方法,其特征在于,粗略过滤使用所述图像的汉明距离。
全文摘要
描述了用于基于原始图像来标识复制的图像的技术。标识复制的图像是基于创建唯一且可标识的特征,这些特征进而被用于生成多个直方图。直方图由图像的片来生成,其中,通过相等地划分图像来创建片。组合的片直方图是图像的表示。
文档编号G06F17/30GK102138162SQ200980134639
公开日2011年7月27日 申请日期2009年6月26日 优先权日2008年6月27日
发明者L·吴, M·李 申请人:微软公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1