用于智能无线通信终端的识别四边形边框的方法及装置制造方法

文档序号:6514451阅读:134来源:国知局
用于智能无线通信终端的识别四边形边框的方法及装置制造方法
【专利摘要】本发明提供一种应用于智能无线通信终端的图像识别四边形边框的方法及装置。所述图像识别四边形边框的方法为:获取待处理的图像后,通过设定或检测得到识别对象的类别,进而获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框,确定目标四边形边框,最后对目标四边形边框内的图像部分进行处理。所述的装置包括图像获取模块;识别对象类别确定模块;四边形框识别模块;图像处理模块。应用所述的方法或装置可以改进目前对所拍摄的目标区域为矩形区域的图像的处理中存在的需要用户对所拍摄的图像四边形区域都进行手动调整来确保目标四边形边框的准确性的问题。
【专利说明】用于智能无线通信终端的识别四边形边框的方法及装置【技术领域】[0001]本发明涉及一种图像识别技术,特别是涉及一种用于智能无线终端的识别四边形 边框的方法和装置。【背景技术】[0002]随着智能无线终端的普及,越来越多的用户使用智能无线终端对所拍摄对象的图 像信息进行加工和提取。其中,拍摄对象为矩形区域的情况非常多,典型的拍摄得到的图 像有白板图像和文本图像。白板图像是对会议白板,公告牌和其他文本类矩形目标拍摄所 得的图像。文本图像是对标准文本,如A4格式纸质文本,各种书籍中的页面,电影海报等进 行拍摄所得的图像。由于拍摄的角度等原因,这些拍摄的图像可能存在所拍摄对象图像以 外的区域,如白板图像存在目标会议白板图像以外的区域,不规则的四边形,以及缺角等情 况,而所拍摄对象的图像才是用户需要的目标对象。为此,对所拍摄图像的处理通常需要先 进行目标对象的四边形边框检测操作。四边形边框检测操作是指对所拍摄的图像进行检 测,提取目标四边形边框,从而在之后的操作中,去除四边形边框以外的区域,并对所述四 边形边框进行矩形框校正或补角操作。在实际操作中,对所拍摄图像的自动检测所得到的 四边形边框范围常常不是用户期望的结果。因此,需要用户手动调整的概率就很高,而现有 的调整图像四边形边框检测结果的方法,是通过手动拉伸来选择图像中的四边形边框,每 次在对图像进行调整的时候,需要对四个顶点的位置分别进行确定,之后才完成对一个四 边形边框的选择。[0003]这种方法虽然保证了目标四边形边框的正确性,但每次调整都需要对四个顶点的 位置分别进行确定。当存在大量的四边形边框检测操作需要时,用户的任务变得极其繁重。 因此如何在尽量保证四边形边框检测操作能得到用户所期望的四边形边框的情况下,最大 限度的减轻用户的负担是这个领域要解决的重要技术问题。
【发明内容】
[0004]鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用于智能无线通信终 端的识别四边形边框的方法,该方法把所要识别的所拍摄的对象图像作为识别对象,并运 用识别对象的信息特征识别出目标四边形边框,该方法能改进现有技术中对所拍摄的对象 图像为矩形区域的图像的处理中存在的需要用户对识别对象的四边形区域都进行手动调 整来确保目标四边形边框的准确性的问题。[0005]为实现上述目的及其他相关目的,本发明提供一种用于智能无线通信终端的识别 四边形边框的方法,所述识别四边形边框的方法至少包括以下步骤:步骤一,获取待处理的 图像;步骤二,确认所述图像中识别对象的类别;步骤三,根据所述识别对象的类别获取相 对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与该特征信息 相匹配的四边形边框。[0006]优选地,所述步骤一中获取待处理的图像的方式包括采用智能无线通信终端的摄像头进行拍照方式来获取图像或通过打开已有的图像文件方式来获取图像。[0007]优选地,预先存储有所述识别对象的类别及其所对应的四边形边框的特征信息, 所述步骤二中获取识别对象的类别的方式为如下方式中的至少一种:由用户在预先存储的 识别对象的类别中进行选择;通过图像引擎对所述图像数据的内容进行分析来确定识别对 象的类别;通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。[0008]优选地,所述步骤二中获取识别对象的类别的方式为:由用户自定义识别对象的 类别,并由用户自定义所对应的四边形边框的特征信息。[0009]优选地,所述特征信息为以下几项中的至少一项:四边形边框相邻两条边的长度 之比;形状特征;图像中的关键数据内容;图像中字符的格式特征。[0010]优选地,所述特征信息以区间方式进行定义,所述步骤三中相应的特征落入该区 间的四边形边框即为与特征信息相匹配的四边形边框。[0011]优选地,所述步骤三中如果有多个四边形边框与所述特征信息相匹配,则由用户 从该多个四边形边框中做出选择。[0012]优选地,所述识别四边形边框的方法还包括步骤四,与识别对象的类别对应有标 准尺寸,将识别得到的四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。[0013]上述智能无线通信终端的识别四边形边框的方法还可以是一种用于智能无线通 信终端四边形边框识别装置,包括:图像获取模块,用于获取待处理的图像;识别对象类别 确定模块,用于确定所述图像获取模块所获取的所述图像的识别对象的类别;四边形边框 识别模块,根据所述识别对象类别确定模块确定的识别对象的类别,根据所述识别对象的 类别获取相对应的四边形边框的特征信息,在所述图像中结合图像所显示的内容中识别与 该特征信息相匹配的四边形边框。[0014]优选地,所述的四边形框识别装置,其特征在于:所述图像获取模块获取待处理的 图像的方式包括采用智能无线通信终端的摄像头进行拍照方式来获取图像或通过打开已 有的图像文件方式来获取图像。[0015]优选地,所述的四边形框识别装置,其特征在于:预先存储有所述识别对象的类别 及其所对应的四边形边框的特征信息,所述识别对象类别确定模块中获取识别对象的类别 的方式为如下方式中的至少一种:由用户在预先存储的识别对象的类别中进行选择;通过 图像引擎对所述图像获取模块获取的图像的图像数据内容进行分析来确定识别对象的类 别;通过图像引擎对所述图像获取模块获取的图像的图像数据格式进行分析来确定识别对 象的类别。[0016]优选地,所述的四边形框识别装置,其特征在于:所述识别对象类别确定模块中获 取识别对象的类别的方式为:由用户自定义识别对象的类别,并由用户自定义识别对象的 类别所对应的四边形边框的特征信息。[0017]优选地,所述的四边形框识别装置,其特征在于:所述特征信息为以下几项中的至 少一项:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字 符的格式特征。[0018]优选地,所述的四边形框识别装置,其特征在于:所述特征信息以区间方式进行定 义,所述四边形边框识别模块中相应的特征落入该区间的四边形边框即为与特征信息相匹配的四边形边框。[0019]优选地,所述的四边形框识别装置,其特征在于:所述四边形边框识别模块中如果 有多个四边形边框与所述特征信息相匹配,则由用户从该多个四边形边框中做出选择。[0020]优选地,所述的四边形框识别装置,其特征在于:还包括图像处理模块,与识别对 象类别确定模块中得到的识别对象类别对应有标准尺寸,将所述四边形边框识别模块中识 别得到的四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。[0021]如上所述,本发明的用于智能无线通信终端的识别四边形边框的方法及装置,具 有以下有益效果:本发明能在通过获取所述图像的识别对象的类别之后,再通过特征信息 获取与特征信息相匹配的四边形边框,进而获得与所述识别对象对应的目标四边形边框, 这可以大幅减少用户对所拍摄或打开的图像四边形区域进行手动调整的操作,同时也最大 限度的保证了目标四边形边框的正确性。同时,本发明还能对所述目标四边形边框内的图 像进行拉伸处理,转换成符合所述识别对象的标准尺寸的图像,进一步满足用户对识别对 象处理的需要。这大大简化了用户在此处理中的操作,给用户带来了很大的便利。【专利附图】

【附图说明】[0022]图1显示为本发明一种用于智能无线通信终端的识别四边形边框的方法的步骤 流程示意图。[0023]图2显示为本发明一种用于智能无线通信终端的识别四边形边框的装置的模块 示意图。[0024]元件标号说明[0025]SI ?S12 步骤[0026]21图像获取模块[0027]22识别对象类别确定模块[0028]23四边形框识别模块[0029]24图像处理模块【具体实施方式】[0030]以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书 所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实 施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离 本发明的精神下进行各种修饰或改变。[0031]本发明提供一种用于智能无线通信终端的识别四边形边框的方法,可应用在商务 手机等智能无线通信终端中,在具体地实施方式中,所述智能无线通信终端包括但不限于 商务手机,还可应用于PDA等。图1显示为本发明识别四边形边框的方法步骤流程示意图, 如图1所示,所述方法至少包括以下步骤:[0032]首先执行步骤SI,获取待处理的图像,并显示该图像。具体地,所述智能无线通信 终端获取待处理的图像,并将所述图像显示在屏幕中。于本实施例中,所述获取待处理的图 像具体为启动所述智能无线通信终端中的拍摄装置拍摄图像,但并不以此为限,另一种获 取待处理的图像的实现方式是打开智能无线通信终端中预存的图像文件。得到图像后,将图像显示在智能无线通信终端的屏幕上。接着执行步骤S2。[0033]在步骤S2中,获取到图像后,确定用户是否不设定所述图像中识别对象的类别。 具体地,针对图像中识别对象的类别的设定,用户可以选择不设定所述识别对象的类别或 选择设定识别对象的类别。[0034]如果步骤S2中的判断为真,用户选择不设定所述识别对象的类别,则执行步骤 S6 ;如果步骤S2中的判断为假,用户选择设定所述识别对象的类别,则执行步骤S3。[0035]在步骤S3中,确定用户是否选择自定义识别对象的类别。具体地,用户可以选择 自定义识别对象的类别或者用户可以选择在预先存储的识别对象的类别中进行选择,所述 预先存储的识别对象的类别及其相应的特征信息可存储在数据库或数据表中。[0036]如果步骤S3中的判断为真,用户选择自定义识别对象的类别,则执行步骤S5 ;如 果步骤S3中的判断为假,用户选择选择在预先存储的识别对象的类别中进行选择,则执行 步骤S4。[0037]在步骤S4中,用户在预先存储的识别对象的类别中选择出识别对象的类别。接着 执行步骤S7。[0038]在步骤S5中,用户自定义识别对象的类别,即用户自定义所述图像的识别对象的 类别,并由用户自定义所对应的四边形边框的特征信息,这些特征信息可以包括以下几项 中:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字符的 格式特征,标准尺寸。接着执行步骤S7。[0039]在步骤S6中,系统调用图像引擎检测所述图像的数据的内容或/和格式进行分 析,确定识别对象的类别。[0040]具体地,所述分析确认识别对象的类别的方式包括如下方式中的至少一种:[0041]1,通过图像引擎对所述图像数据的内容进行分析来确定识别对象的类别;例如, 假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果系统调用图像引擎 检测所述图像的数据的内容中经过识别后有“公民身份号码”的文字,则确定所述识别对象 的类别为身份证;又假如预先存储的识别对象的类别中有银行卡,通过系统预先设定,如果 系统调用图像引擎检测所述图像的数据的内容中经过识别后有图像数据中经过识别后有 “**银行”的文字,或者有“VISA”标志图案,则确定所述识别对象的类别为银行卡。[0042]2,通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。例如, 假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果图像中的某一区域 中,左侧特定位置上有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定 位置上有身份证号码信息,根据上述格式,确定所述识别对象的类别为身份证。[0043]如果步骤S6的判断为真,能确定识别对象的类别,则执行步骤S7 ;如果步骤S6的 判断为假,不能确定识别对象的类别,则执行步骤S11。[0044]在步骤S7中,根据所述确定的识别对象的特征信息进行匹配检测,确定与特征信 息相匹配的四边形边框,所述与特征信息相匹配的四边形边框也就是配置成功的四边形边 框。具体地,匹配检测的方式包括如下方式中的至少一种:[0045](I)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获 取相对应的四边形边框相邻两条边的长度之比,即边框长宽比,该边框长宽比以区间方式 定义;检测所述图像中存在的所有四边形边框,判断所述四边形边框相邻两条边的长度之比是否落入到所述边框长宽比区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。例如得到所述步骤S4或者步骤S5或者步骤S6确定的所述识别对象的类别为身份证,获取相对应的边框长宽比为【1.4,1.7】,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的相邻两条边的长度之比是否落入所述区间【1.4,1.7】,如所述检测出的四边形边框的相邻两条边的长度之比为1.5,落入所述区间【1.4,1.7】,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0046](2)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的形状特征,即四边形边框中的边框的形状的特征,该形状特征以区间方式定义;检测所述图像中存在的所有四边形边框,寻找到所述四边形边框的形状特征落入到所述形状特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。所述形状特征可以以数字的形式被记录,以基准线条形状数据作为参照来定义一个区间,使得与基准线条形状相似的线条的数据落入该区间内。具体地,所示形状特征可以是边框线条形状特征,例如,所述识别对象的类别相对应的四边形边框的边框线条形状是以波浪线作为参照来定义的一个区间;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框线条形状是否落入所述波浪线区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。所示形状特征也可以是边框顶点形状特征,例如,所述识别对象的类别相对应的四边形边框的边框顶点形状为以圆角作为参照定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框顶点形状是否落入所述圆角区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0047](3)得到所述步骤S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的图像中的关键数据内容,所述关键数据内容以区间方式定义;检测所述图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中的数据内容落入所述关键数据内容区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。由于图像在拍摄的时候可能会有失真,因此需要在图像识别和匹配过程中容许有一定的差别,因此相似的文字或图案也被认为是可以匹配的,所以将所述图像中的关键数据内容以区间方式定义,即以基准文字或基准图案为参照定义的一个区间,使得和该基准文字或基准图案相似的文字或图案也落入该区间。具体地,例如,所述识别对象的图像中的关键数据内容是以基准文字“**银行”定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“**银行”相同或相似的文字,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。又例如,所述识别对象的图像中的关键数据内容是以基准图案为“VISA”标志图案定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“VISA”标志图案相同或相似的图案,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0048](4)得到所述步骤`S4或者步骤S5或者步骤S6中确定的所述识别对象的类别,获取相对应的四边形边框的图像中字符的格式特征,所述格式特征以区间方式定义;检测 所述图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中字符的格 式特征落入所述格式特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹 配的四边形边框。具体地,例如,假定识别对象的类别为身份证;身份证的格式都有以下格 式特征,“左侧特定的位置上分别有姓名、性别、出生年月等信息,右侧特定位置上有头像照 片,下方特定位置上有身份证号码信息”,将身份证类别的图像中字符的格式特征定义为以 上述格式特征为基准定义的一个区间,这样,在检测时被检测四边形边框图像字符的格式 中内容近似,图像近似或者位置近似的信息也被认为是落入到所述区间中,纠正可能因为 失真而使得图像中的数据存在的偏差;通过图像引擎检测出所述图像中存在的所有四边形 边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中字符的格 式特征落入所述格式特征区间中,如果是,则本次判断的所述四边形边框为与所述身份证 类别的特征信息相匹配的四边形边框。[0049]由于特征信息的内容可以用区间的方式进行定义,这就使得不仅仅与基准信息相 同,那些与基准信息相似的,例如内容近似,图像近似或者位置近似的信息也被认为是可以 匹配的内容,由于图像可能因为失真而使得记载的数据存在偏差,这种通过区间的方式对 特征信息进行定义,很好的克服了由于这种偏差而造成的识别匹配错误。[0050]在一个实施例中,当找到一个与特征信息相匹配的四边形边框时,继续进行判断, 寻找出所有与特征信息相匹配的四边形边框。接着执行步骤S8。在另一个实施例中,当找 到一个与特征信息相匹配的四边形边框时,就结束本步骤,接着执行步骤S8。[0051]在步骤S8中,判定步骤S7中是否不存在所述与特征信息相匹配的四边形边框。[0052]如果步骤S8的判断为真,不存在所述与特征信息相匹配的四边形边框,则执行步 骤Sll ;如果步骤S8的判断为假,存在所述与特征信息相匹配的四边形边框,则执行步骤 S9。[0053]在步骤S9中,判定步骤S7中是否存在多个与特征信息相匹配的四边形边框。[0054]如果步骤S9的判断为真,存在多个所述与特征信息相匹配的四边形边框,则执行 步骤SlO ;如果步骤S9的判断为假,只存在有一个所述与特征信息相匹配的四边形边框,该 四边形边框就为识别得到的四边形边框,即目标四边形边框,则执行步骤S12。[0055]在步骤SlO中,由用户从该多个四边形边框中做出选择。具体地,用户从多个所 述与特征信息相匹配的四边形边框中选择出所述识别得到的四边形边框,即目标四边形边 框。接着执行步骤S12。[0056]在步骤Sll中,由用户手动得到与所述识别对象对应的识别得到的四边形边框。 具体地,由用户对四边形边框的四个顶点的位置分别进行确定,得到目标四边形边框。接着 执行步骤S12。[0057]在步骤S12中,从所述识别对象的类别获取相对应的四边形边框的标准尺寸, 将所述目标四边形边框内的图像进行拉伸处理,转换成符合所述标准尺寸的图像。例 如,所述识别对象的类别为“身份证”,获取“身份证”相对应的四边形边框的标准尺寸为 “85.6mmX 54.0mm”,则将所述识别得到的四边形边框或目标四边形边框内的图像进行拉伸 处理,转换成长宽尺寸为“85.6mmX 54.0mm”的图像。[0058]本发明还提供一种用于智能无线通信终端的识别四边形边框的装置,可应用在商务手机等智能无线通信终端中,在具体地实施方式中,所述智能无线通信终端包括但不限于商务手机等。图2显示为本发明识别四边形边框的装置的模块示意图,如图所示,所述装置至少包括以下模块:[0059]图像获取模块21,用于获取待处理的图像。具体地,所述图像获取模块获取到待处理的图像,将所述图像显示在屏幕中。于本实施例中,所述获取到待处理的图像的方式具体为启动所述智能无线通信终端中的拍摄装置拍摄图像,但并不以此为限;另一种获取待处理图像的方式是打开智能无线通信终端中的图像文件。得到所述图像后,调用图像引擎将所述图像显示在智能无线通信终端的屏幕上。[0060]识别对象类别确定模块22,和图像获取模块21连接,用于确定从图像获取模块21 所获取的所述图像的识别对象的类别,所述图像的识别对象的类别可以通过用户设定的方式确定。具体地,用户设定的方式为:用户可以选择用户或者用户可以在预先存储的识别对象的类别中选择设定所述识别对象的类别;所述预先存储的识别对象的类别及其相应的特征信息可存储在数据库或数据表中。用户设定自定义识别对象的类别时,需要用户自定义所对应的四边形边框的特征信息,这些特征信息包括以下几项:四边形边框相邻两条边的长度之比,形状特征,图像中的关键数据内容,图像中字符的格式特征,标准尺寸。[0061]识别对象类别确认模块22的另一种可以实现的方式是,通过图像引擎对从图像获取模块21所获取的所述图像数据的内容进行分析来确定识别对象的类别。例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有“公民身份号码”的文字,则确定所述识别对象的类别为身份证;又假如预先存储的识别对象的类别中有银行卡,通过系统预先设定,如果系统调用图像引擎检测所述图像的数据的内容中经过识别后有图像数据中经过识别后有“**银行”的文字,或者有“VISA,,标志图案,则确定所述识别对象的类别为银行卡。[0062]识别对象类别确认模块22的另一种可以实现的方式是,通过图像引擎对从图像获取模块21所获取的所述图像数据的格式进行分析来确定识别对象的类别。例如,假定预先存储的识别对象的类别中有身份证,通过系统预先设定,如果图像中的某一区域中,左侧特定位置上有姓名、性别、出生年月等信息,右侧特定位置上有头像照片,下方特定位置上有身份证号码信息,根据上述格式,确定所述识别对象的类别为身份证。[0063]四边形边框识别模块23,和图像获取模块21以及识别对象类别确认模块22,用于从识别对象类别确认模块22中得到的所述识别对象的类别,进而获取相对应的四边形边框的特征信息,在所述图像获取模块21中获取的图像中结合图像所显示的内容来识别与该特征信息相匹配的四边形边框,进而得到与所述识别对象对应的目标四边形边框。确定与特征信息相匹配的四边形边框。具体地,结合图像所显示的内容来识别与该特征信息相匹配的四边形边框的方式包括如下方式中的至少一种:[0064](I)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框相邻两条边的长度之比,即边框长宽比,该边框长宽比以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,判断所述四边形边框相邻两条边的长度之比是否落入到所述边框长宽比区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。例如,从识别对象别确认模块22中得到的所述识别对象的类别为身份证,获取身份证相对应的边框长宽比为【1.4,1.7】,通过图像引擎检测出所述图像获取模块21中获取的图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的相邻两条边的长度之比是否落入所述边框长宽比区间 【1.4,1.7】中,如所述检测出的四边形边框的相邻两条边的长度之比为1.5,落入所述边框长宽比区间【1.4,1.7】中,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0065](2)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的形状特征,即四边形边框中的边框的形状的特征,该形状特征以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,寻找到所述四边形边框中的形状的特征落入到所述形状特征区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。所述形状特征可以以数字的形式被记录,以基准线条形状数据作为参照来定义一个区间,使得与基准线条形状相似的线条的数据落入该区间内。具体地,所示形状特征可以是边框线条形状特征,例如,所述识别对象的类别相对应的四边形边框的边框线条形状是以波浪线作为参照来定义的一个区间;通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框线条形状是否落入所述波浪线区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。所示形状特征也可以是边框顶点形状特征,例如,所述识别对象的类别相对应的四边形边框的边框顶点形状为以圆角作为参照定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的边框顶点形状是否落入所述圆角区间,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0066](3)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的图像中的关键数据内容,所述关键数据内容以区间方式定义;检测所述图像获取模块21中获取的图像中存在的所有四边形边框,判断是否有相应的所述四边形框中的图像中的数据内容落入所述关键数据内容区间中,如果是,则本次判断的四边形边框即为与特征信息相匹配的四边形边框。由于图像在拍摄的时候可能会有失真,因此需要在图像识别和匹配过程中容许有一定的差别,因此相似的文字或图案也被认为是可以匹配的,所以将所述图像中的关键数据内容以区间方式定义,即以基准文字或基准图案为参照定义的一个区间,使得和该基准文字或基准图案相似的文字或图案也落入该区间。具体地,例如,所述识别对象的图像中的关键数据内容是以基准文字“**银行”定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“**银行”相同或相似的文字,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。又例如,所述识别对象的图像中的关键数据内容是以基准图案为“VISA”标志图案定义的一个区间,通过图像引擎检测出所述图像中存在的所有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中是否包含有和“VISA”标志图案相同或相似的图案,如果是,则本次判断的所述四边形边框为与特征信息相匹配的四边形边框。[0067](4)从识别对象类别确认模块22中得到所述识别对象的类别,获取相对应的四边形边框的图像中字符的格式特征,所述格式特征以区间方式定义;检测所述图像获取模块 21中获取的图像中存在的所有四边形边框,判断是否有相应的 所述四边形框中的图像中字符的格式特征落入所述格式特征区间中,如果是,则本次判断的四边形边框即为与特征信 息相匹配的四边形边框。具体地,例如,假定识别对象的类别为身份证;身份证的格式都有 以下格式特征,“左侧特定的位置上分别有姓名、性别、出生年月等信息,右侧特定位置上有 头像照片,下方特定位置上有身份证号码信息”,将身份证类别的图像中字符的格式特征定 义为以上述格式特征为基准定义的一个区间,这样,在检测时被检测四边形边框图像中字 符的格式中内容近似,图像近似或者位置近似的信息也被认为是落入到所述区间中,纠正 可能因为失真而使得图像中的数据存在的偏差;通过图像引擎检测出所述图像中存在的所 有四边形边框;针对所有的所述四边形边框,逐一判断所述检测出的四边形边框的图像中 字符的格式特征落入所述格式特征区间中,如果是,则本次判断的所述四边形边框为与所 述身份证类别的特征信息相匹配的四边形边框。[0068]由于特征信息的内容可以用区间的方式进行定义,这就使得不仅仅与基准信息相 同,那些与基准信息相似的,例如内容近似,图像近似或者位置近似的信息也被认为是可以 匹配的内容,由于图像可能因为失真而使得记载的数据存在偏差,这种通过区间的方式对 特征信息进行定义,很好的克服了由于这种偏差而造成的识别匹配错误。[0069]当找到一个与特征信息相匹配的四边形边框时,继续进行判断,继续寻找与特征 信息相匹配的四边形边框。如果得到多个匹配成功的四边形边框,则由用户从多个所述匹 配成功的四边形边框中选定出一个识别得到的四边形边框,即与所述识别对象对应的目标 四边形边框。在另一个实施例中,当找到一个与特征信息相匹配的四边形边框时,直接结束 判断,将该与特征信息相匹配的四边形边框作为所述识别得到的四边形边框,即与所述识 别对象对应的目标四边形边框。[0070]图像处理模块24,和别对象类别确认模块22以及四边形边框识别模块23相连, 用于从所述识别对象类别确认模块22获取识别对象的类别,从所述识别对象的类别获取 相对应的四边形边框的标准尺寸,并对四边形边框识别模块23所识别出的所述目标四边 形边框或目标四边形边框内的图像部分进行图像处理。具体地,从所述识别对象类别确认 模块22获取识别对象的类别,根据所述识别对象的类别获取相对应的四边形边框的标准 尺寸,将所述四边形边框识别模块23得到的所述识别得到的四边形边框或目标四边形边 框内的图像进行拉伸处理,转换成符合所述标准尺寸值的图像。例如,所述识别对象的类别 为“身份证”,获取到“身份证”相对应的四边形边框的标准尺寸为“85.6mm X 54.0mm”,则将 所述识别得到的四边形边框或目标四边形边框内的图像进行拉伸处理,转换成长宽尺寸为 “85.6mmX54.0mm” 的图像。[0071]综上所述,本发明一种用于智能无线通信终端的识别四边形边框的方法及装置, 通过确认待处理图像的类别,获取相对应的四边形边框的特征信息,在所述图像中结合图 像所显示的内容中识别与该特征信息相匹配的四边形边框,从而确定识别得到的四边形边 框,即目标四边形边框,并对目标四边形边框内的图像部分进行处理。本方案能够根据图像 的类别准确的得到图像的目标四边形边框,并且所述处理过程不需要用户对所拍摄的图像 四边形区域进行手动调整来确保目标四边形边框的准确性。所以,本发明有效克服了现有 技术中的种种缺点而具高度产业利用价值。[0072]上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟 悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属【技术领域】中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完 成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
【权利要求】
1.一种用于智能无线通信终端的识别四边形边框的方法,其特征在于,包括:步骤一,获取待处理的图像;步骤二,确认所述图像中识别对象的类别;步骤三,根据所述识别对象的类别获取相对应的四边形边框的特征信息,在所述图像 中结合图像所显示的内容中识别与该特征信息相匹配的四边形边框。
2.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:所述步骤一中获取待处理的图像的方式包括采用智能无线通信终端的摄像头进行拍照 方式来获取图像或通过打开已有的图像文件方式来获取图像。
3.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:预先存储有所述识别对象的类别及其所对应的四边形边框的特征信息,所述步骤二中 获取识别对象的类别的方式为如下方式中的至少一种:由用户在预先存储的识别对象的类别中进行选择;通过图像引擎对所述图像数据的内容进行分析来确定识别对象的类别;通过图像引擎对所述图像数据的格式进行分析来确定识别对象的类别。
4.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:所述步骤二中获取识别对象的类别的方式为:由用户自定义识别对象的类别,并由用 户自定义所对应的四边形边框的特征信息。
5.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:所述特征信息为以下几项中的至少一项:四边形边框相邻两条边的长度之比;形状特征;图像中的关键数据内容;图像中字符的格式特征。
6.根据权利要求5所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:所述特征信息以区间方式进行定义,所述步骤三中相应的特征落入该区间的四边形边 框即为与特征信息相匹配的四边形边框。
7.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:所述步骤三中如果有多个四边形边框与所述特征信息相匹配,则由用户从该多个四边 形边框中做出选择。
8.根据权利要求1所述的用于智能无线通信终端的识别四边形边框的方法,其特征在 于:还包括步骤四,与识别对象的类别对应有标准尺寸,将识别得到的四边形边框内的图像 进行拉伸处理,转换成符合所述标准尺寸的图像。
9.一种基于智能无线通信终端的四边形边框识别装置,其特征在于,采用如权利要求 1-8中任意一项所述的用于智能无线通信终端的识别四边形边框的方法识别四边形边框。
【文档编号】G06K9/00GK103500337SQ201310462071
【公开日】2014年1月8日 申请日期:2013年9月30日 优先权日:2013年9月30日
【发明者】陈青山, 沈东辉, 占大志 申请人:上海合合信息科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1