图片校正方法、装置和页面检测模型的搭建方法与流程

文档序号：27228420发布日期：2021-11-03 17:28阅读：来源：国知局

技术特征：
1.一种图片校正方法，用于识别图片中的主体区域并对图片中的主体区域进行校正，其特征在于，所述方法包括如下步骤：将所述图片的四个顶点作为参考点，采用回归计算确定若干定位关键点，该些定位关键点用于确定所述图片的主体区域；根据所述定位关键点，对所述主体区域进行识别并校正，以去除无关的信息并规范化所述主体区域；可选地，所述图片的主体区域包括页面区域，所述若干定位关键点包括页面的四个顶点。2.根据权利要求1所述的图片校正方法，其特征在于，所述采用回归计算确定若干定位关键点，包括：建立图像定位回归模型，使用训练好的图像定位回归模型获取所述图片的定位关键点的位置信息。3.根据权利要求2所述的图片校正方法，其特征在于，所述建立图像定位回归模型包括标注样本数据并使用样本数据对该图像定位回归模型进行训练，其中，所述标注样本数据指对样本图片进行了标注，以标注出样本图片中主体区域的定位关键点以及是否包含主体区域。4.根据权利要求2所述的图片校正方法，其特征在于，所述图像定位回归模型输入待处理图片，输出所述图片中主体区域的定位关键点的位置坐标和置信度，该置信度表示输出的所述定位关键点坐标的可靠概率；可选地，当置信度小于预定阈值时，停止对所述主体区域进行校正并输出无主体区域的警示信息。5.根据权利要求3所述的图片校正方法，其特征在于，所述图片的主体区域为页面区域时，所述对样本图片进行标注包括：当所述样本图片的页面区域均位于所述样本图片内时，直接将该页面的四个顶点标注为所述定位关键点；当所述样本图片的页面区域部分位于所述样本图片之外时，根据位于所述样本图片内的页面顶点，和，所述页面的边线与所述图片的边线的交点，来推算出位于所述样本图片之外的页面顶点的位置，并将图片内的页面顶点和推算出的位于所述样本图片外的页面顶点标注为所述定位关键点；可选地，所述推算出位于所述样本图片之外的页面顶点的位置，包括：标注出样品图片的位于图片内的顶点，和，页面的边线与所述图片的边线的交点；遍历样本图片的所有标注点，依次判断相邻两个标注点是否同时位于同一图片边线，所述标注点包括所述位于图片内的顶点和所述交点；在判断为该相邻两个标注点是同时位于同一图片边线时，继续判断该两个标注点所在的两条页面区域边线延长相交所形成的夹角是否满足大于等于第一阈值角度；在所述夹角满足大于等于第一阈值角度时，将该相邻两个标注点标记为非顶点，并将该两个非顶点对应的两条页面区域的边线延长相交后形成的交汇点标注为所述页面区域的位于图片外的预测顶点，同时删除该两个标记为非顶点的标注点，最后得到标注有四个定位关键点的样本图片；
可选地，所述第一角度阈值为60度；可选地，所述对所述主体区域进行校正包括：根据所述定位关键点，对所述主体区域进行放射变换和/或方向校正，以得到校正后图片。6.一种页面检测模型的搭建方法，所述页面检测模型用于检测图片的页面区域的四个顶点，其特征在于，所述方法包括如下步骤：搭建关键点检测模型；使用标注有页面区域的四个顶点的图片，对所述关键点检测模型进行训练，使得经过训练的所述关键点检测模型能够输出所述页面区域的四个顶点及置信度；其中，所述标注有页面区域的四个顶点的图片通过权利要求5所述的对样本图片进行标注的步骤完成。7.一种图片校正方法，其特征在于，所述方法包括如下步骤：将待处理图片输入根据权利要求6所述的页面检测模型的搭建方法生成的页面检测模型，获得所述待处理图片的页面区域的四个顶点及置信度；判断所述置信度是否大于等于第一阈值，当所述置信度大于第一阈值时，根据所述待处理图片的页面区域的四个顶点，对所述待处理图片进行页面区域识别及校正。8.一种图片校正装置，用于识别图片中的主体区域并对该主体区域进行校正，所述装置包括：计算模块，用于将所述图片的四个顶点作为参考点，采用回归计算确定若干定位关键点，该些定位关键点用于确定所述图片的主体区域；校正模块，用于根据所述定位关键点，对所述主体区域进行识别并校正，以去除无关的信息并规范化所述主体区域。9.一种计算机设备，包括处理器和存储器，所述存储器用于存储计算机可执行程序，其特征在于：当所述计算机程序被所述处理器执行时，所述处理器执行如权利要求1
‑
5、7中任一项所述的图片校正方法。10.一种计算机程序产品，存储有计算机可执行程序，其特征在于，所述计算机可执行程序被执行时，实现如权利要求1
‑
5、7中任一项所述的图片校正方法。

技术总结
本发明属于图像处理技术领域，提供一种图片校正方法、装置和计算机设备，用于识别图片中的主体区域并对图片中的主体区域进行校正，所述方法包括：将所述图片的四个顶点作为参考点，采用回归计算确定若干定位关键点，该些定位关键点用于确定所述图片的主体区域；根据所述定位关键点，对所述主体区域进行识别并校正，以去除无关的信息并规范化所述主体区域。本发明通过图像定位回归模型识别待处理图片内的页面区域，能够更精确地识别出页面区域，同时能够更准确识别出待处理图片中有无页面区域，解决了因页面区域相对于图片倾斜、带有无关背景、非主体区域等影响因素引起的图像识别精度低的问题。别精度低的问题。别精度低的问题。

技术研发人员：蔡红王岩杨森安晟王岩
受保护的技术使用者：作业帮教育科技(北京)有限公司
技术研发日：2021.07.23
技术公布日：2021/11/2

完整全部详细技术资料下载

当前第2页1 2