一种文档图像匹配方法及设备与流程

文档序号:28563608发布日期:2022-01-19 17:05阅读:70来源:国知局
一种文档图像匹配方法及设备与流程

1.本发明涉及一种文档图像匹配方法及设备,属于图像处理领域。


背景技术:

2.纸质文档可由拍照、扫描或者其他途径转化为电子图像。在实际应用中,由于图像获取途径不同,常常会得到大量重复的电子图像(尤其是由同一份文档经不同转化方法得到的多个电子图像,识别难度大、数量多),占用大量的存储空间,增加后续图像处理的工作量。故需要自动匹配属于同一份文档的不同电子图像。比如,在财税报账系统中,扫描纸质发票得到的图像与发票拍照电子件之间的匹配。
3.常规的图像匹配方案如下:通过surf(speeded up robust features,快速特征点检测)等特征点检测算法提取并描述特征点(即特征描述算子),并根据特征描述算子对两张图像的特征点进行两两匹配,其中具有映射关系的两个特征点即为匹配特征对;根据匹配特征对数量来衡量两张图像之间的匹配程度(数量超过数量阈值则匹配)。然而相较于自然场景下的特征点之间存在强差异性,文档场景的特征点差异性较弱,仅根据单维度信息(即特征描述算子)进行特征匹配,存在较多的误匹配特征对且计算量较大。且由于特征点之间的弱差异性,如果按常规方案直接根据匹配特征对数量判断图像是否匹配,会出现很多误判。
4.现有文档图像匹配的主流方案是基于ocr(optical character recognition,光学字符识别),提取字段信息及其坐标位置进行要素匹配,从而实现图像之间的匹配。此方案匹配准确度较高,但弊端在于匹配正确率易受到纸质文档质量、手写体、电子图像的获得方式(文档以不同角度、不同背景、不同方式转化为电子图像)干扰而导致匹配效果不理想,且计算量大、耗时长。
5.授权公告号为cn109543501a的专利《图像处理装置、图像处理方法和存储介质》公开了以下步骤:该图像处理装置包括:计算单元,其被构造为通过如下方式计算输入文档图像与多个文档图像中的各个文档图像之间的相似度:在输入文档图像和所述多个文档图像中,在对作为相似度的计算目标的、包括特定区域的各个范围进行改变的同时反复进行相似度的计算;以及确定单元,其被构造为,将所计算的相似度是所述多个文档图像中最高的文档图像确定为,与输入文档图像匹配的文档图像。该专利可以高度准确和简单地搜索与同扫描图像有关的文档相同的种类的文档,但该专利提取图像中的文本块并以文本块为依据计算图像相似度(多次进行轮廓线跟踪、递归提取黑色像素等),所需的计算量仍然较大。


技术实现要素:

6.为了解决上述现有技术中存在的问题,本发明提供一种文档图像匹配方法及设备,计算量较小,实现对文档图像的快速匹配。在宽松匹配的需求下,可以快速对多份文档图像进行匹配;在严格匹配的需求在下,可作为ocr识别比对的一种补充方式。
7.本发明的技术方案如下:
8.技术方案一:
9.一种文档图像匹配方法,包括如下步骤:
10.s1、获取待匹配的第一图像与第二图像;
11.s2、分别获取第一图像的第一特征点集和第二图像的第二特征点集;并根据所述第一特征点集和第二特征点集,获取第一图像与第二图像的匹配特征对集;
12.s3、根据匹配特征对的匹配度,剔除匹配特征对集中的误匹配特征对;
13.s4、建立透视变换矩阵;根据匹配特征对集,求解透视变换矩阵;验证透视变换矩阵,若透视变换矩阵通过验证,则认定第一图像与第二图像相似;否则认定第一图像与第二图像不相似。
14.进一步的,还包括:若认定第一图像与第二图像相似,则将匹配特征对划分为完美匹配特征对和较好匹配特征对;根据完美匹配特征对的数量和较好匹配特征对的数量,计算第一图像与第二图像的相似度;
15.其中,完美匹配特征对为特征点之间坐标误差低于第一阈值的匹配特征对;较好匹配特征对为特征点之间坐标误差超过第一阈值的匹配特征对。
16.进一步的,将所述相似度映射至0到100的区间内,以公式表达为:
[0017][0018]
式中:s表示相似分数;n表示匹配特征对的总数量;m表示相似度。
[0019]
进一步的,所述第一特征点集和第二特征点集的获取步骤具体为:
[0020]
分别在第一图像与第二图像上截取感兴趣区域,得到第一区域和第二区域;分别检测第一区域与第二区域内的特征点,得到所述第一特征点集和所述第二特征点集。
[0021]
进一步的,所述匹配特征对集的获取步骤具体为:
[0022]
前向匹配:根据所述第二特征点集建立第二kd树;通过最邻近算法在第二kd树中查找与第一特征点集中各特征点相匹配的特征点,将匹配的两特征点称为匹配特征对,得到第一匹配特征对集;
[0023]
后向匹配:根据所述第一特征点集建立第一kd树;通过最邻近算法在第一kd树中查找与第二特征点集中各特征点相匹配的特征点,得到第二匹配特征对集。
[0024]
进一步的,还包括:若所述第一匹配特征对集与所述第二匹配特征对集中匹配特征对的数量差值超过第二阈值,则认定第一图像与第二图像不相似,不再继续匹配。
[0025]
进一步的,对第一匹配特征对集和第二匹配特征对集求交集,剔除重复匹配特征对和不在交集内的匹配特征对。
[0026]
进一步的,还包括:对坐标信息相同的匹配特征对,删除特征点之间主方向差值超过第三阈值的匹配特征对。
[0027]
进一步的,步骤s4具体为:
[0028]
建立透视变换矩阵;
[0029]
通过ransanc算法,根据所述匹配特征对求解透视变换矩阵;
[0030]
验证透视变换矩阵:自定义一组矩形顶点;将所述矩形顶点输入至所述透视变换矩阵,若透视变换矩阵的输出结果与输入矩形顶点的误差不超过第四阈值,则透视变换矩阵通过验证;否则,透视变换矩阵不通过验证。
[0031]
技术方案二:
[0032]
一种属于同一文档的不同电子图像之间的匹配设备,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
[0033]
s1、获取待匹配的第一图像与第二图像;
[0034]
s2、获取第一图像与第二图像的匹配特征对;
[0035]
s3、剔除匹配特征对中的误匹配特征对;
[0036]
s4、建立透视变换矩阵;根据匹配特征对,求解透视变换矩阵;验证透视变换矩阵,若透视变换矩阵通过验证,则认定第一图像与第二图像相似;否则认定第一图像与第二图像不相似。
[0037]
本发明具有如下有益效果:
[0038]
1、本发明通过截取感兴趣区域来控制进行特征检测的区域,从而避免由于相同的页眉页脚或者logo等部分,误导图像匹配。
[0039]
2、在文档场景下,特征点的特征描述算子之间的区别度相对较小。本发明通过透视变换矩阵验证匹配特征对在坐标位置信息上的差异;若透视变换矩阵通过验证,则说明有足够多数量的匹配特征对在局部邻域梯度信息和位置信息上均高度相似,则表示第一图像与第二图像相似;同时还能验收匹配特征对的准确性,剔除误匹配特征点。
[0040]
3、本发明所述方法所需计算量少,在宽松匹配的需求下,可以快速对多份文档图像进行匹配;在严格匹配的需求下,本发明所述方法仍可作为ocr识别匹配的一种补充方案。
[0041]
4、特征描述算子是一个高维度向量,本发明通过最邻近算法和kd树查找匹配特征对,无需穷举搜索并计算所有第一特征点与所有第二特征点的匹配度(即特征描述算子之间的欧氏距离),显著减少匹配过程所需的计算量。
[0042]
5、本发明根据特征点之间坐标误差,将匹配特征对划分为完美匹配特征对和较好匹配特征对。由于完美特征点能更好表征图像的相似度,且在实践中发现完美匹配特征对的数量相对总数较少,故通过设置权重放大完美匹配特征的比重,则得到相似度能较好地表征图像之间地相似程度,便于后续处理。
[0043]
6、本发明进一步利用所述映射公式调整相似度的分布频率,以获取较大的相似度动态区间及更直观的分数表现。
[0044]
7、本发明利用多维度信息(匹配度、前向匹配与后向匹配结果的一致性、主方向),剔除误匹配特征对,提高图像匹配的准确率。
附图说明
[0045]
图1为本发明流程图;
[0046]
图2为实施例六中的样本1;
[0047]
图3为实施例六中的样本2;
[0048]
图4为实施例六的匹配结果示意图。
具体实施方式
[0049]
下面结合附图和具体实施例来对本发明进行详细的说明。
[0050]
感兴趣区域(roi):在图像处理中,以方框、圆、椭圆、不规则多边形等方式,在被处理的图像勾勒出的需要处理的区域,被称为感兴趣区域。
[0051]
实施例一
[0052]
如图1所示,一种文档图像匹配方法,包括如下步骤:
[0053]
a1、获取待匹配的第一图像与第二图像。第一图像与第二图像均为文档图像。
[0054]
a2、对所述第一图像与第二图像进行预处理,如降噪、调整图像尺寸等。
[0055]
a3、分别在第一图像与第二图像上截取感兴趣区域,得到第一区域和第二区域。在本实施例中,通过定义一个与待截取图像相同分辨率的掩模图像(image masking)来遮挡待截取图像,没有被遮挡的部分即为roi区域,以控制进行特征检测的区域,从而避免由于相同的页眉页脚或者logo等部分,误导图像匹配。
[0056]
a4、通过surf算法,分别检测第一区域与第二区域内的特征点(具体需要通过构建黑塞矩阵、构建尺度空间等步骤获得特征点。此部分并非本案重点且为公知常识,不再赘述),得到第一特征点集和第二特征点集。记录每个特征点的坐标信息,并计算每个特征点的主方向和特征描述算子。
[0057]
a5、根据第一特征点集、第二特征点集以及特征描述算子,获取第一图像与第二图像的匹配特征对集。
[0058]
a6、删去匹配度(匹配度为特征描述算子之间欧式距离)低于第五阈值的匹配特征对。在本实施中,第五阈值为匹配特征对集中匹配特征对特征描述算子之间欧式距离最小值的3倍、最大值的四分之一中的较大者。
[0059]
a7、判断第一图像与第二图像是否相似:
[0060]
a71、建立透视变换矩阵:选择期望值最小时的映射关系作为透视变换矩阵,手动设置透视变换矩阵中的部分参数。
[0061]
a72、通过ransanc算法,根据匹配特征对集求解透视变换矩阵:
[0062]
a721、在匹配特征对集中随机选取四个匹配特征对,并根据这四个匹配特征对计算透视变换矩阵中的未知参数。
[0063]
a722、将剩余匹配特征对输入至透视变换矩阵,若某匹配特征对适应于该透视变换矩阵,则认为该匹配特征对为正解,否则为非正解。
[0064]
a723、若有足够多正解,则认为该模型是合理的,否则跳转至步骤a721重新求得透视变换矩阵。
[0065]
a724、用所有匹配特征对去评估该透视变换矩阵:以非正解数量与所有匹配特征对的数量之差定义损失函数。选择损失函数值最小的透视变换矩阵为最终解。
[0066]
a73、自定义一组矩形顶点;将所述矩形顶点输入至所述透视变换矩阵,若透视变换矩阵的输出结果与输入矩形顶点的误差不超过第四阈值,则透视变换矩阵通过验证,认定第一图像与第二图像相似;否则,透视变换矩阵不通过验证,认定第一图像与第二图像不相似(由相似的图像计算出来的变换矩阵,会将自定义矩形转成畸变较小的矩形)。
[0067]
本实施例的有益效果在于:
[0068]
通过截取roi区域,以控制进行特征检测的区域,从而避免由于相同的页眉页脚或者logo等部分而误导图像匹配。
[0069]
在文档场景下,特征点的特征描述算子(特征描述算子描述特征点的局部邻域梯
度信息)之间的区别度相对较小。故通过透视变换矩阵验证匹配特征对在坐标位置信息上的差异;若透视变换矩阵通过验证,则说明有足够多数量的匹配特征对在局部邻域梯度信息和位置信息上均高度相似,则表示第一图像与第二图像相似;同时还能验收匹配特征对的准确性,剔除误匹配特征点。
[0070]
本发明中采用前向匹配、后向匹配等方法减少计算量,在宽松匹配的需求下,可以快速对多份文档图像进行匹配;在严格匹配的需求下,本发明所述方法仍可作为ocr识别匹配的一种补充方案。
[0071]
实施例二
[0072]
对于同类且相似的图像,比如只填写有少量的信息的同份表单或由同一份文档经不同转化方法得到的图像等,由于图像之间差异性较小,实施例一所述方法判断准确率较低。因此,在实施例一的基础上,进一步提供计算图像相似度的方法,以公式表达为:
[0073]
s=1.8
×
cnt_t+0.2
×
cnt_f
[0074]
其中,cnt_t表示完美匹配特征对的数量,cnt_f表示较好匹配特征对的数量。完美匹配特征对为特征点之间坐标误差低于第一阈值的匹配特征对;较好匹配特征对为特征点之间坐标误差超过第一阈值的匹配特征对。当图像相似的情况下,完美匹配特征对占主导,则分数s会超出配对子总数的上限,但小于分母的2倍。将超出的部分重新压缩在[0.9,1]区间内,从而实现当图像相似的情况下均有90%以上的相似度,且相似图像之间的差异性又能有较大的动态比对区间。而当较好匹配特征对站主导的时,分数s必然不高,折算成百分比再减去0.1,为了补偿多出来的0.1的区,考虑实际意义,设置评分的机制的下限为0。则进一步,对得到的s进行映射/压缩到0到100的区间内,映射公式为:
[0075][0076]
式中:s表示相似分数;n表示匹配特征对总数量;m表示相似度。
[0077]
在文档场景中,尤其是对于同类且相似的文档图像,匹配特征对之间的位置误差在一定程度上反映了匹配特征对的可靠性。
[0078]
本实施例的进步之处在于:根据特征点之间坐标误差,将匹配特征对划分为完美匹配特征对和较好匹配特征对,完美特征点能更好表征图像的相似度,且在实践中发现完美匹配特征对的数量相对总数较少,故通过设置权重放大完美匹配特征的比重,则得到相似度能较好地表征图像之间地相似程度,便于后续处理。
[0079]
进一步利用所述映射公式调整相似度的分布频率,以获取较大的相似度动态区间及更直观的分数表现。
[0080]
实施例三
[0081]
进一步的,对第一图像与第二图像进行双向匹配,具体为:
[0082]
前向匹配:根据第二特征点集建立第二kd树;根据所述描述算子,通过最邻近算法在第二kd树中查找与第一特征点集中各特征点相匹配的特征点,将匹配的两特征点称为匹配特征对,得到第一匹配特征对集;
[0083]
后向匹配:根据第一特征点集建立第一kd树;根据所述描述算子,通过最邻近算法在第一kd树中查找与第二特征点集中各特征点相匹配的特征点,得到第二匹配特征对集;
[0084]
若第一匹配特征对集与第二匹配特征对集中匹配特征对的数量差值超过第二阈
值,则认定第一图像与第二图像不相似,不再继续匹配。
[0085]
在通过最邻近算法进行特征匹配时,需要计算两个特征点的匹配度。比如,点1在kd树中搜索相匹配的特征点,需要沿kd树计算点1与kd树中多个结点的匹配度,最终搜索得到点1与kd树中点2的匹配度最高,即特征描述算子之间的欧式距离最小,则点1与点2为一个匹配特征对。
[0086]
本实施例的进步之处在于:特征描述算子是一个高维度向量,本实施例中通过最邻近算法和kd树查找匹配特征对,无需穷举搜索并计算所有第一特征点与所有第二特征点的匹配度(即特征描述算子之间的欧氏距离),显著减少匹配过程所需的计算量。
[0087]
实施例四
[0088]
进一步的,在实施例三的基础上,剔除误匹配特征对:
[0089]
a61、在第一匹配特征对集和第二匹配特征对集中删去匹配度低于第五阈值的匹配特征对。第五阈值为匹配特征对集中匹配特征对特征描述算子之间欧式距离最小值的3倍、最大值的四分之一中的较大者。显然,第一匹配特征对集与第二匹配特征对集对应的第五阈值的具体数值不一致。
[0090]
a62、没有在两次匹配结果中保持一致的特征点,在梯度幅值和梯度方向存在一定的差异,可认为是误匹配特征点。则对第一匹配特征对集和第二匹配特征对集求交集,并将交集部分整合为第三匹配特征对集。
[0091]
a63、考虑到在没有较大畸变和强烈曝光的情况下,位置信息相同的匹配特征对之间的主方向之差(旋转角度)应该为固定值,则基于特征点主方向,剔除误匹配特征对。具体为:
[0092]
对于第三匹配特征对集中坐标信息相同的匹配特征对,删除特征点之间主方向差值超过第三阈值的匹配特征对。在本实施例中,将特征点的邻域以10
°
为单位进行划分,允许正负值差异,共计72个区间,求匹配特征对的梯度方向差值的直方图,从最高频率区间向两侧拓张2个区间为允许误差范围,即第三阈值。
[0093]
本实施例的进步之处在于:利用多维度信息(匹配度、前向匹配与后向匹配结果的一致性、主方向),剔除误匹配特征对,提高图像匹配的准确率。
[0094]
实施例五
[0095]
进一步的,计算每个特征点的主方向和特征描述算子的具体步骤为:
[0096]
将特征点的邻域以10
°
为单位进行划分,共计36个区间,求特征点的梯度方向的直方图。将最高频率区间代表的梯度方向作为该特征点的主方向。
[0097]
在特征点的尺度内,选取一矩形(在本实施例中,矩形大小为20x20);将矩形划分为16个区域,则每个区域包含25个像素点,统计每个区域的haar小波特征描述算子,所述haar小波特征描述算子包括该区域内所有像素的水平方向值之和、水平方向绝对值之和、垂直方向之和、垂直方向绝对值之和(此处的水平方向与垂直方向都是相较特征点的主方向而言,即水平方向就是特征点主方向),haar小波特征描述算子是4维向量。合并每个区域的haar小波特征描述算子,得到该特征点的特征描述算子,特征描述算子为64维向量。
[0098]
实施例六
[0099]
以实际生产线中的随机样本为例,进行详细说明:
[0100]
图2是纸质件的扫描影像,分辨率为2336*1652;图3是该纸质件的拍照影像,分辨
率为636*1183。
[0101]
b1、获取待匹配的图2和图3;
[0102]
b2、对所述图2与图3进行预处理:
[0103]
图2的分辨率为2336*1652,将分辨率调整为1000*707;
[0104]
图3的分辨率为636*1183,将分辨率调整为537*1000。
[0105]
b3、在图2与图3上截取roi区域;
[0106]
图2:左右各裁剪图像面积的6%,上下各裁剪图像面积的5%,剩下部分为第一区域。
[0107]
图3:左右各截剪图像面积的5%,上下各截剪图像面积的6%,剩下部分为第二区域。
[0108]
b4、通过surf算法,分别检测第一区域与第二区域内的特征点,得到包含427个特征点的第一特征点集和包含555个特征点的第二特征点集。记录每个特征点的坐标信息,并计算每个特征点的主方向和特征描述算子。为更好的阐述本案原理,对特征点进行编号。第一特征点集:(a、b、c、d
……
);第二特征点集:(1、2、3、4、5
……
)。
[0109]
b5、对图2和图3进行特征匹配,具体为:
[0110]
前向匹配:根据第二特征点集建立第二kd树;通过最邻近算法在第二kd树中查找与第一特征点集中各特征点相匹配的特征点,将匹配的两特征点称为匹配特征对,共计427个匹配特征对,得到第一匹配特征对集:(a1、b2、c2、d3
……
)。
[0111]
后向匹配:根据第一特征点集建立第一kd树,通过最邻近算法在第一kd树中查找与第二特征点集中各特征点相匹配的特征点,共计555个匹配特征对,得到第二匹配特征对集:(1a、2c、3d、4b、5a
……
)。
[0112]
第一匹配特征对集与第二匹配特征对集的匹配特征对数量差值128超过第二阈值(50)且两者相差倍数1.29不超过第五阈值(4),故继续下一步;
[0113]
b6、剔除误匹配特征对,具体为:
[0114]
b61、在第一匹配特征对集和第二匹配特征对集中删去相似度低于第五阈值(0.03)的匹配特征对,第一匹配特征对集剩余196个:(a1、b2、c2、d3
……
);第二匹配特征对集剩余208个:(1a、2c、3d、4b、
……
)。
[0115]
b62、对第一匹配特征对集和第二匹配特征对集求交集,并将交集的部分整合为第三匹配特征对集;第三匹配特征对集有124个:(1a、2c、3d、
……
)
[0116]
b63、在第三匹配特征对集中坐标信息相同的匹配特征对,删除特征点主方向差值超过第三阈值(10
°
)的匹配特征对,第三匹配特征对集剩余78个:(1a、3d、
……
)。
[0117]
图4中圆形图案表示图2的特征点,四边形图案表示图3的特征点,方框中圈出完美特征对,圆框中圈出较好匹配特征对。
[0118]
b7、建立透视变换矩阵;根据第三匹配特征对集,求解透视变换矩阵。验证图像透视变换矩阵:
[0119]
自定义一组矩形顶点:坐标为a1(100,100),b1(1100,100),c1(1100,1100),d1(100,1100)。将这四个点带入透视变换矩阵进行透视变换,得到新的坐标:a2(844,165),b2(859,831),d2(142,896),c2(121,156)。分别计算得到角a2b2c2、角b2c2d2和角c2d2a2的余弦值:-0.067,0.061,0.040。
[0120]
允许畸变误差在正负12
°
,即余弦值差值。角a1b1c1与角a2b2c2的余弦值差值的绝对值为0.067、角b1c1d1与角b2c2d2的余弦值差值的绝对值为0.061、角c1d1a1与角c2d2a2的余弦值差值的绝对值为0.040,均不大于0.207。
[0121]
故透视变换矩阵通过验证,则认定图2与图3相似。
[0122]
b8、根据第三匹配特征对集中匹配特征对的数量,计算第一图像与第二图像的相似度分数:
[0123]
将第三匹配特征对集中属于图2的特征点(a、c、d
……
)都进行透视变换,计算变换后新的坐标信息与匹配特征对(1、2、3
……
)的坐标误差。将坐标误差在30个像素点之内的匹配特征对分为完美匹配特征对,其余分为较好匹配特征对,得到49个完美匹配特征对,29个较好匹配特征对。
[0124]
设置完美匹配特征对权重为1.8,较好匹配特征对权重为0.2,根据公式s=1.8
×
cnt_t+0.2
×
cnt_f和可以得到相似度m=90.4,其中cnt_t表示完美匹配特征对的数量,cnt_f表示较好匹配特征对的数量;s表示相似分数;n表示匹配特征对的总数量;m表示相似度。
[0125]
实施例七
[0126]
一种属于同一文档的不同电子图像之间的匹配设备,包括存储器和处理器,所述存储器存储有指令,所述指令适于由处理器加载并执行以下步骤:
[0127]
a1、获取待匹配的第一图像与第二图像。
[0128]
a2、对所述第一图像与第二图像进行预处理,如降噪、调整图像尺寸等。
[0129]
a3、分别在第一图像与第二图像上截取感兴趣区域,得到第一区域和第二区域。在本实施例中,通过定义一个与待截取图像相同分辨率的掩模图像(image masking)来遮挡待截取图像,没有被遮挡的部分即为roi区域,以控制进行特征检测的区域,从而避免由于相同的页眉页脚或者logo等部分,误导图像匹配。
[0130]
a4、通过surf算法,分别检测第一区域与第二区域内的特征点(具体需要通过构建黑塞矩阵、构建尺度空间等步骤获得特征点。此部分并非本案重点且为公知常识,不再赘述),得到第一特征点集和第二特征点集。记录每个特征点的坐标信息,并计算每个特征点的主方向和特征描述算子。
[0131]
a5、根据第一特征点集、第二特征点集以及特征描述算子,获取第一图像与第二图像的匹配特征对集。
[0132]
a6、删去匹配度(匹配度为特征描述算子之间欧式距离)低于第五阈值的匹配特征对。在本实施中,第五阈值为匹配特征对集中匹配特征对特征描述算子之间欧式距离最小值的3倍、最大值的四分之一中的较大者。
[0133]
a7、判断第一图像与第二图像是否相似:
[0134]
a71、建立透视变换矩阵:选择期望值最小时的映射关系作为透视变换矩阵,手动设置透视变换矩阵中的部分参数。
[0135]
a72、通过ransanc算法,根据匹配特征对集求解透视变换矩阵:
[0136]
a721、在匹配特征对集中随机选取四个匹配特征对,并根据这四个匹配特征对计算透视变换矩阵中的未知参数。
[0137]
a722、将剩余匹配特征对输入至透视变换矩阵,若某匹配特征对适应于该透视变换矩阵,则认为该匹配特征对为正解,否则为非正解。
[0138]
a723、若有足够多正解,则认为该模型是合理的,否则跳转至步骤a721重新求得透视变换矩阵。
[0139]
a724、用所有匹配特征对去评估该透视变换矩阵:以非正解数量与所有匹配特征对的数量之差定义损失函数。b5、选择损失函数值最小的透视变换矩阵为最终解。
[0140]
a73、自定义一组矩形顶点;将所述矩形顶点输入至所述透视变换矩阵,若透视变换矩阵的输出结果与输入矩形顶点的误差不超过第四阈值,则透视变换矩阵通过验证,认定第一图像与第二图像相似;否则,透视变换矩阵不通过验证,认定第一图像与第二图像不相似(由相似的图像计算出来的变换矩阵,会将自定义矩形转成畸变较小的矩形)。
[0141]
本实施例的有益效果在于:
[0142]
通过截取roi区域,以控制进行特征检测的区域,从而避免由于相同的页眉页脚或者logo等部分而误导图像匹配。
[0143]
在文档场景下,特征点的特征描述算子(特征描述算子描述特征点的局部邻域梯度信息)之间的区别度相对较小。故通过透视变换矩阵验证匹配特征对在坐标位置信息上的差异;若透视变换矩阵通过验证,则说明有足够多数量的匹配特征对在局部邻域梯度信息和位置信息上均高度相似,则表示认定第一图像与第二图像相似;同时还能验收匹配特征对的准确性,剔除误匹配特征点。
[0144]
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1