检测内容的方法、装置及终端的制作方法_2

文档序号:8922937阅读:来源:国知局
1所示,在步骤101中,获取待检测内容的扫描图像,其中,上述扫描图像满足预定的版面分布规则。
[0030]一般来说,诸如一些合同及重要公文的部分内容,单据,票据,产品标签等等,都具有严格的填写规则和格式的要求,如果在填写过程中,没有按照规定的要求进行填写,则可能导致填写的信息无效。因此,在完成诸如上述内容之后,要对完成的内容进行检测,以确定完成的内容中的一些信息是否有效。
[0031]在本实施例中,待检测内容为需要被检测的内容,待检测内容可以是一份单据或票据的全部内容或部分内容,也可以是一份文件(合同或公文等)的全部内容或部分内容,还可以是产品标签的内容等等。可以理解,待检测内容还可以是其它形式的内容,本申请对待检测内容的具体形式和具体内容不限定。
[0032]在一种实现中,可以通过终端本身具有的图像扫描功能,对待检测内容直接进行扫描,从而获取待检测内容的扫描图像。在另一种实现中,还可以获取其它设备扫描好的待检测内容的扫描图像,例如,通过通信接口接收其它设备上传的待检测内容的扫描图像,或者从存储设备上获取已存储的待检测内容的扫描图像,或者从指定地址下载待检测内容的扫描图像,等等。可以理解,还可以通过其它的方式获取待检测内容的扫描图像,本申请对获取上述扫描图像的具体方式不限定。
[0033]在本实施例中,上述扫描图像要满足预定的版面分布规则,其中,版面分布规则为扫描图像中的内容在扫描图像的版面上的分布规则。例如,预定的版面分布规则可以是扫描图像中的内容区域的中心与扫描图像版面的中心重合,也可以是扫描图像中的内容区域的中心与扫描图像版面的上边缘之间的距离为预定值。可以理解,预定的版面分布规则还可以是其它的内容,本申请对版面分布规则的具体内容不限定。
[0034]接着,在步骤102中,识别并提取上述扫描图像中预定区域的内容。
[0035]在本实施例中,一个扫描图像中可以包含一个或多个预定区域,预定区域的内容即为待检测内容中需要严格按照填写规则和格式的要求填写的内容。例如,某文件中的签名区域和日期填写区域等等。预定区域可以是结合待检测内容以及预定的版面分布规则预先设定的。
[0036]在本实施例中,首先获取预定区域的位置信息,然后,根据预定区域的位置信息确定预定区域,通过图像文字识别技术识别并提取出上述扫描图像中预定区域的内容。在一种实现方式中,可以采用OCR (Optical Character Recognit1n,光学字符识别)技术识别扫描图像中预定区域的内容。可以理解,还可以采用其它的方式识别扫描图像中预定区域的内容,本申请对识别扫描图像中预定区域的方式不限定。
[0037]继而,在步骤103中,判断上述预定区域的内容是否满足对应的预定规则。
[0038]在本实施例中,一个扫描图像中可以包含一个或多个预定区域,每个不同的预定区域可以对应不同的预定规则。其中,预定规则为预定区域的内容所要满足的内容的规则或格式的规则等。例如,预定规则可以是预定区域的内容不能空白,可以是预定区域内的字符数量不能多于一个预定阈值,也可以是预定区域的内容中必须包含某关键字/关键词,或者预定区域的内容中不能包含某关键字/关键词,也可以是预定区域的内容必须符合某种正则格式,还可以是预定区域的内容中包含的数字的数值必须在预定的范围内等等。可以理解,预定规则还可以是其它内容的规则,本申请对预定规则的具体内容不限定。
[0039]需要说明的是,可以通过检测相关信息确定预定区域在扫描图像中的位置信息以及与该预定区域对应的预定规则。具有不同的内容属性的扫描图像对应不同的检测相关信息,如某合同与某发票的扫描图像对应的检测相关信息不同。其中,检测相关信息至少包括预定区域在扫描图像中的位置信息以及对应于该预定区域的预定规则。
[0040]在本实施例的一种实现中,可以基于用户的操作确定扫描图像对应的检测相关信息。具体来说,可以将用户通过操作界面设置的检测相关信息确定为上述扫描图像对应的检测相关信息。例如,如图2所示,在操作界面201上,提供了多个对应于不同内容属性的扫描图像的检测相关信息模板202。每个检测相关信息模板202中采用预定区域标识203标识出预定区域在版面中的位置,并且,用户可以通过在操作界面上的操作(如将鼠标的光标放在检测相关信息模板上等)查看预定区域对应的预定规则。用户可以根据扫描图像的内容属性在操作界面上选择出合适的检测相关信息模板,从而确定扫描图像对应的检测相关信息。
[0041]需要说明的是,扫描图像的内容属性为扫描图像所对应的待检测内容的版面分布及格式的属性,如发票的内容与标签的内容对应不同的内容属性,同一份合同的不同页的内容对应不同的内容属性,两个版面排布不同的发票的内容对应不同的内容属性等等。
[0042]又例如,如图3所示,在操作界面301上,显示出待检测内容的扫描图像302,用户可以基于待检测内容的扫描图像302,在操作界面301上划出预定区域303在版面中的位置,并输入与预定区域对应的预定规则。从而获得扫描图像对应的检测相关信息。
[0043]还可以根据用户通过操作界面选择的对应于上述扫描图像的内容属性确定该扫描图像对应的检测相关信息。具体来说,具有不同的内容属性的扫描图像对应不同的检测相关信息。在操作界面上,向用户提供不同的扫描图像的内容属性,用户可以在操作界面上选择对应于待检测内容的扫描图像的内容属性。根据上述扫描图像的内容属性,从已存储的数据中获取与该扫描图像对应的检测相关信息。
[0044]在本实施例的另一种实现中,还可以基于对上述扫描图像的识别与分析确定对应的检测相关信息。参考图4,其示出了基于对上述扫描图像的识别与分析确定对应的检测相关信息的方法的一个实施例的流程400。
[0045]如图4所示,在步骤401中,识别扫描图像中部分区域的内容。
[0046]—般来说,可以根据扫描图像中部分区域的内容确定扫描图像的内容属性。例如,可以根据扫描图像中的内容的标题或者某一段内容的关键字/关键词,来确定扫描图像的内容属性。因此,可以识别扫描图像中任意能够反映扫描图像的内容属性的区域的内容。可以理解,本申请对部分区域的具体位置和范围不限定。在本实施例中,可以采用OCR技术识别扫描图像中部分区域的内容。
[0047]在步骤402中,根据上述部分区域的内容包含的关键词确定该扫描图像的内容属性。
[0048]在步骤403中,将上述扫描图像的内容属性对应的检测相关信息确定为该扫描图像对应的检测相关信息。
[0049]接着,在步骤104中,如果预定区域的内容不满足对应的预定规则,将该预定区域确定为错误区域。
[0050]在本实施例中,如果预定区域的内容不满足对应的预定规则,则说明预定区域的内容不能满足预定的内容的规则或格式的规则等。因此,检测出该预定区域的内容为无效的内容,将该预定区域确定为错误区域。
[0051]最后,在步骤105中,对上述错误区域进行标识。
[0
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1