专利名称:一种基于区域高斯加权的图像匹配计算方法
技术领域:
本发明涉及一种模式识别特征提取方法,属于模式识别技术领域。
背景技术:
图像匹配技术在很多领域都有广泛的应用,如图像检索,钓鱼网站识别等。传统的图像匹配技术在匹配类似网页图片时有许多的局限性,主要是网页图像通常在结构和纹理上具有某些相似性。在使用传统的低层次的特征,如纹理和颜色进行匹配时,人眼感觉不相似的两幅图像很容易被计算机识别为相似度较高的图像,而同一网页图像有时由于受到页面flash的影响却容易被判定为不相似的图像。而高层次的语义特征在现有的技术上还不容易获得,所以通过高层次的特征也不能很好的解决问题。通过观察网页这一类图像的特点我们可以发现,在人的思维模式特别关注的区域,如网页的logo,页面顶部布局等,往往这些区域也具有很强的判别性,即同一网站的往往很相似,不同网站的往往差别很大。
发明内容
本发明的目的是为了解决现有的图像匹配技术中存在的局限性问题,一种基于区域高斯加权的图像匹配计算方法。通过提前训练,获得图像各个子区域的判别权重,然后统计每个子块内的LBP纹理直方图和颜色直方图,通过直方图与权重的相乘累加得到最终的加权相似度。具体方法的实现如下第一步准备训练样本,对于每一个样本图像都要进行样本的归一化,该归一化的过程即相当于把图像当作一个向量来计算它的模值,整幅图像所有像素作为向量的元素,然后,每个象素点的灰度值除以该模值,从而得到归一化以后的图像,即为图像准备相似图像作为正例,不相似图像作为反例,对于选取的同一类图像根据关键点做对齐处理,消除平移旋转影响,对齐采取的策略是根据图像中的特殊点进行操作,网页的图像在顶端都有一些特定直线,采用hough变换来定位特定直线,利用这些直线作为参考进行对齐处理,然后做背景差分,找出同一类图像的不相似区域;第二步对于第一步选取的反例图像,首先进行归一化,然后计算各幅图像对应子区域的之间的距离,通过累加获得不同类图像各个子块之间的平均距离,通过sm分类器训练或K-means方法获得距离的阈值,首先,随机选取三个图像子块的特征作为聚类的初始中心,然后将其他图像子块按欧式距离聚类到这三个聚类中心上,然后根据聚类结果计算新的聚类中心,反复以上步骤,直到聚类中心前后两次的偏移量小于给定阈值;将图像区域分为类间相似区域,类间不相似区域和中间区域;第三步对于中间区域,权重为1,对于类间相似区域、类间不相似区域权重为其对应的子块特征的高斯函数值;
权利要求
1.一种基于区域高斯加权的图像匹配计算方法,其特征在于如下步骤 第一步准备训练样本,对于每一个样本图像都要进行样本的归一化,该归一化的过程即相当于把图像当作一个向量来计算它的模值,整幅图像所有像素作为向量的元素,然后,每个象素点的灰度值除以该模值,从而得到归一化以后的图像,即为图像准备相似图像作为正例,不相似图像作为反例,对于选取的同一类图像根据关键点做对齐处理,消除平移旋转影响,对齐采取的策略是根据图像中的特殊点进行操作,网页的图像在顶端都有一些特定直线,采用hough变换来定位特定直线,利用这些直线作为参考进行对齐处理,然后做背景差分,找出同一类图像的不相似区域; 第二步对于第一步选取的反例图像,首先进行归一化,然后计算各幅图像对应子区域的之间的距离,通过累加获得不同类图像各个子块之间的平均距离,通过sm分类器训练或K-means方法获得距离的阈值,首先,随机选取三个图像子块的特征作为聚类的初始中心,然后将其他图像子块按欧式距离聚类到这三个聚类中心上,然后根据聚类结果计算新的聚类中心,反复以上步骤,直到聚类中心前后两次的偏移量小于给定阈值;将图像区域分为类间相似区域,类间不相似区域和中间区域; 第三步对于中间区域,权重为1,对于类间相似区域、类间不相似区域权重为其对应的子块特征的高斯函数值;
全文摘要
本发明提出了一种基于区域高斯加权的图像匹配计算方法。通过提前训练,获得图像各个子区域的判别权重,然后统计每个子块内的LBP纹理直方图和颜色直方图,通过直方图与权重的相乘累加得到最终的加权相似度。具体方法的实现如下第一步对同一类归一化之后的图像通过背景差分,找出同一类图像的不相似区域;第二步对于不同类的归一化之后的图像,通过图像子块间的距离按阈值将图像区域分为类间相似区域,类间不相似区域和中间区域;第三步,基于高斯函数计算图像子块的权重;第四步根据所求的区域权重,对区域内的纹理直方图和颜色直方图进行加权累加,并计算总体图像的相似度。
文档编号G06T7/00GK102663754SQ20121011362
公开日2012年9月12日 申请日期2012年4月17日 优先权日2012年4月17日
发明者薄占滨 申请人:北京博研新创数码科技有限公司