文字区域图像的获取方法及装置、文字识别系统的制作方法

文档序号:6464332阅读:143来源:国知局
专利名称:文字区域图像的获取方法及装置、文字识别系统的制作方法
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字区域图像的获取方法 及装置、文字识别系统。
背景技术
文字识别进程主要包括,从拍摄文字资料所形成的图像上提取文字内容 所对应的文字区域图像,基于提取到的文字区域图像,进行文字识别,获取 具体的文字内容。
参见图1,图1是现有文字识别系统的结构示意图。图1中,文字检测
模块检测出单帧图像上的文字区域图像,之后由图像处理模块对检测到的文
字区域图像进行图像的质量优化处理,如采用滤波技术滤除噪声,后续再由
文字识别模块基于文字识别技术对文字区域图像进行识别处理,得出文字信 自
其中,在文字检测环节,文字检测模块基于现有文字检测技术能够从被 检测的图像上将文字区域界定出来,获取到文字区域图像。由于噪声或其他 因素的影响,会出现误检的情况,即获取到的文字区域图像中实际并不包含 文字内容。文字检测环节出现的误检一方面浪费硬件资源,另一方面可能因 文字识别错误而导致相关联环节的出错或损失。
为降低文字检测的误检几率, 一些场景中,采用高清晰数码相机、扫描 仪等等设备,为文字识别装置提供待检测的图像。相对来讲,由于待检测的 图像较理想,因此,文字检测模块出现误检的几率被降低。
但是, 一方面,由于高清晰数码相机及扫描仪等成像设备的成本较高,
一些情况下难以及时获取到这些高成本设备;另一方面,即使采用高成本成像设备,但由于现有文字识别进程中,用于获取文字区域图像的文字检测环 节只根据对单帧图像的检测即给出检测结果,而文字检测本身受千扰因素的 影响较大,因此误检几率仍较大。
因此,现有文字识别进程中,获取文字区域图像的方案尚有待改进。

发明内容
本发明的目的在于提供文字区域图像的获取方法及装置、文字识别系统, 确保文字检测环节获取到的图像为包含文字内容的文字区域图像。
本发明提供一种文字区域图像的获取方法,包括
对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域 图像;
将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包
含相同文字内容的候选文字区域图像进行比对处理;
若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确 定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;
获取所述文字区域图像。
优选地,所述比对处理之前,该方法包括
将所述至少两个候选文字区域图像调整到相同尺寸。
优选地,进行比对处理包括
利用预设算法,计算所述至少两个候选文字区域图像中,每个候选文字区 域图像的图像特征参量的值;所述图像特征参量被预设; 计算每两个图像特征参量的值之间的差值。
优选地,确定所述至少两个候选文字区域图像属于所述文字区域图像包括 所述至少两个候选文字区域图像中,两两图像特征参量的值之间的差值在 所述预设范围之内。
优选地,获取所述文字区域图像包括
从所述至少两个候选文字区域图像中选择一个或多个候选文字区域图像用作所述文字区域图像。
优选地,确定所述至少两个候选文字区域图像属于所述文字区域图像之前, 该方法进一步包括
从未参与所述文字检测的 一帧目标图像中,搜索出与所述至少两个候选文 字区域图像中的任意一个候选文字区域图像所存差异最小的区域,用作搜索区 域。
优选地,所述未参与所述文字检测的一帧目标图像为所述一个候选文字区 域图像所在目标图像的下一帧。
优选地,搜索出所述区域,用作搜索区域包括
利用预设算法,计算未参与所述文字检测的目标图像中,多个指定区域的 图像特征参量的值;所述图像特征参量被预设;
计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图 像特征参量的值之间的差值;
选出与所述一个候选文字区域图像的图像特征参量的值之间的差值最小的 指定区域,用作所述搜索区域。
优选地,计算所述多个指定区域的图像特征参量的值包括
预设大小小于或等于所述未参与所述文字检测的目标图像的大小的搜索 窗,且所述搜索窗在该目标图像内;
分别计算所述搜索窗内,与所述一个候选文字区域图像大小相同的各个指
定区域的图像特征参量的值。
优选地,获取所述文字区域图像包括 选择所述搜索区域用作所述文字区域图像。
本发明提供一种文字区域图像的获取装置,包括文字检测单元、比对处 理单元、筛选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目 标图像上的候选文字区域图像;所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标 图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候 选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个 候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字
区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像。
优选地,所述装置进一步包括尺寸调整单元,用于将比对处理单元处理
的至少两个候选文字区域图像调整到相同尺寸。
优选地,所述比对处理单元包括参量值计算单元,差值计算单元;其中, 所述参量值计算单元,用于利用预设算法,计算比对处理单元处理的至少
两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述
图像特征参量被预先设置;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每两
个图像特征参量的值之间的差值。
优选地,所述筛选单元包括判决单元和判决结果处理单元,其中, 所述判决单元,用于根据所述比对处理单元的比对结果,判断至少两个候
选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;
所述判决结果处理单元,用于根据所述判决单元的判断结果,判断所述至
少两个候选文字区域图像中是否包含文字内容。
优选地,所述判决结杲处理单元包括结果获取单元和确定单元;
所述结果获取单元,用于获取所述判决单元的判断结果;
所述确定单元,用于在结果获取单元获取到的判断结果为肯定时,确定所
述至少两个候选文字区域图像中包含文字内容。
优选地,所述判决结果处理单元包括结果获取单元、搜索单元和结果处
理单元;所述结果获取单元,用于获取所述判决单元的判断结果;
所述搜索单元,用于在结果获取单元获取到的判断结果为肯定时,从搜索 未参与所述文字检测的 一帧目标图像中,搜索出与所述至少两个候选文字区域 图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜索区 域;
所述结果处理单元,用于在结果获取单元获取到的判断结果为肯定以及在 所述搜索单元搜索到所述搜索区域时,确定所述至少两个候选文字区域图像中 和/或所述搜索区域对应的图像中包含文字内容。
优选地,所述搜索单元包括定位单元、参量值计算单元、差值计算单元 和选择单元,其中,
所述定位单元,用于指定未参与所述文字检测的目标图像中的多个指定区
域;
所述参量值计算单元,用于计算所述定位单元定位出的各个指定区域的图 像特征参量的值,以及所述一个候选文字区域图像的图像特征参量的值;
所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每个 指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的 值之间的差值;
所述选择单元,用于根据所述差值计算单元的计算结果,选择所述搜索区 域用作所述文字区域图像。
本发明提供一种文字识别系统,包括存储器、文字区域图像的获取装置、 文字识别器和输出单元;
所述存储器,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像;
所述文字区域图像的获取装置,包括文字检测单元、比对处理单元、筛 选单元和获取单元;其中,
所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目 标图像上的候选文字区域图像;所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标 图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候 选文字区域图像进行比对处理;
所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个 候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字
区域图像属于包含文字内容的文字区域图像;
所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图
像;
所述文字识别器,用于根据所述文字区域图像的获取装置获取到的所述文 字区域图像,识别出所述文字内容;
所述输出单元,用于将所述文字识别器识别出的文字内容输出。 本发明提供的上述技术方案,文字检测操作对至少两帧目标图像进行文 字检测,并通过比对得到的至少两帧候选文字区域图像,确定相似程度,来 对验证至少两帧候选文字区域图像上是否确实包含文字内容,若较相似,则 可得出至少两帧候选文字区域图像上所包含的内容基本相同,基于文字检 测,可得出至少两帧候选文字区域图像上确实包含文字内容,从而,确保通 过文字检测获得的文字区域图像确实包含文字内容,排除文字检测所误检到 的图像,降低文字检测的误检几率。


图是现有文字识别系统的结构示意图2是一帧图像上文字检测界定出的文字区域分布示意图3是本发明实施例一中的文字识别流程图4是本发明实施例二中的文字识别流程图5是本发明的实施例二中利用搜索窗W搜索^中与/m相似的搜索区域 的示意图6是本发明的一个实施例中文字区域图像的获取装置的结构示意图;图7是本发明的一个实施例中判决结果处理单元6032的结构示意图8是本发明的另 一个实施例中判决结果处理单元6032的结构示意图9是本发明的一个实施例中文字识别系统的结构示意图。
具体实施例方式
发明人提出获取文字区域图像的技术方案,以确保获取到的文字区域图像 中包含文字内容,具体包括文字检测过程对至少两帧目标图像进行文字检测, 得出每帧目标图像上的候选文字区域图像;通常,每帧目标图像上会检测出多 处包含不同内容的候选文字区域图像,但由于各目标图像是通过拍摄基本相同 的场景得到的,因此,不同的目标图像上检测出的候选文字区域图像中可能包 含相同的内容;而所谓候选是指候选文字区域图像上是否包含文字内容尚不确 定,后续,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上 可能包含相同文字内容的候选文字区域图像进行比对处理;若被比对的至少两 个候选文字区域图像之间的差异在预设范围之内,则说明被比对的候选文字区 域图像较相似,包含的信息基本相同,又由于候选文字区域图像基于文字检测 技术获得,因此,可确定该被比较的至少两个候选文字区域图像包含相同的文 字内容,也即该至少两个候选文字区域图像属于包含文字内容的文字区域图像, 获取确定包含文字内容的文字区域图像。
反之,若上述至少两个候选文字区域图像之间的差异,超出预设范围,则 说明该被比较的至少两个候选文字区域图像上包含的信息差异较大,文字检测 出现误检,被比较的候选文字区域图像也就不能被用作文字区域图像。
相比较现有文字检测环节中获取文字区域图像的做法,本发明的具体实施 中,通过进一步验证文字检测结果是否确实包含文字内容,可有效降低文字检 测环节的误;f企几率,获得确实包含文字内容的文字区域图像。
本发明在具体实现时,在比对处理环节,预设图像特征参量,并通过比对 可能包含相同文字内容的多个候选文字区域图像的图像特征参量的值,来度量 这些候选文字区域图像之间的相似性。本发明的具体实施中,为进一步提高后续的文字识别效率,为文字识别环 节提供优质的文字区域图像,在完成比对处理之后,若比对结果表示被比对的 候选文字区域图像之间的相似性较好,则继续分析未参与比对处理的目标图像, 搜索未参与比对处理的目标图像上与被比对的候选文字图像的差异最小的搜索 区域,用作文字区域图像。
为使本发明的技术方案和优点更加清楚,下面将结合附图及具体的实施例 作进一步详细描述。
实际应用中,基于拍摄对象上文字区域的分布可能是零散的,因此,针对 一帧图像,文字检测过程界定出的文字区域通常有多个,参见图2,图2是一
帧图像上文字检测界定出的文字区域分布示意图。图2中界定出的文字区域如 I、 J、 K。为清楚表述本发明的具体实现方案,设目标图像中只有包含一个文字 区域如I区域,而对于多个文字区域的实际情况,处理方式是类似的。另外, 本发明的具体实施中,目标图像可以是时间间隔非常短的连续帧中的一帧,也 可以是时间间隔相对较长的非连续帧中的一帧。 实施例一
本实施例一中,被处理的目标图像是从多个目标图像中选出两帧图像。本
实施例一中,设置的图像特征参量为图像的像素值。
参见图3,图3是本实施例一的文字识别流程图,该流程可包括以下步骤 步骤301、对选出的每帧目标图像分别进行文字检测,得到两个候选文字
区域图像。
该两个候选文字区域图像中可能包含相同的文字内容。
该步骤301中,文字检测过程基于现有文字检测技术实现,只是与现有技 术不同的是,本实施例一的流程中,检测结果并不直接被用作确定包含文字内 容的文字区域图像,而是需要通过后续的比对处理,来验证检测到的候选文字 区域图像中是否确实包含文字内容。
步骤302、基于预设的图像特征参量为图像的像素值,算出能够用于度量 两个候选文字区域图像的相似性的图像像素差值。该步骤302中,对于各候选文字区域图像上各点的像素值,可基于现有技 术得出。本实施例一中,设两个候选文字区域图像分别用/,、 /2标记,设/,对 应大小为/ j的矩形框,/2对应大小为A的矩形框。由于拍摄的远近距离不同, 尺,与7 2的大小可能不同,因此,本实施例中,为避免因拍摄造成的候选文字区 域图像的差别,基于现有图像缩放技术如插值技术,对/,和/2进行缩放处理, 将/,和/2的大小均调整
实际应用中,也可将/!调整到A的大小,或者将/2调整到/^的大小,总 之,尽量保证两个候选文字区域图像大小基本相同即可。
进一步,基于以下误差计算式(1 )计算/,与/2的差值,用J标记差值,
贝'j, "(/,,/2)二l;力/,(/,力—/2(,',川 (1)
其中,/2为/ 矩形的高度值,W为W矩形的宽度值。基于量度相同的坐标,
给出/,与/2中,各像素点的像素值,如,/, ( /, y')表示/,中,横坐标为,纵
坐标为, 的像素点上的像素值,/2 (,', y)表示/2中,横坐标为,纵坐标为z'的
像素点上的像素值。基于以上计算式(l),算出/,与/2上像素值的差值d (/,,
/2)。
实际应用中,也可采用其他误差计算式计算两个候选文字区域图像之间的差异。
步骤303、若像素差值超过预设范围,则执行步骤304,否则,执行步骤
305。
本实施例一中,由于d(/,, /2)直接体现两个候选文字区域图像之间的差 异程度,即d(/,, /2)越小,则差异越小,d(/,, /2)越大,差异越大,因此, 预设范围可设为小于预设阈值,或可设置为大于一个最小阔值且小于另一最大 域值,其中,各阈值可根据经验设置。
实际应用中,基于计算差值的计算式可能与式(1)不同,d(/p /2)的含 义可能不到,使得可能会出现d(/p /2)越大,体现两个候选文字区域图像之 间的差异越小,而d(/,, /2)越小,体现差异越大的情况,则预设范围可设为大于预设阈值,等等。根据实际情况,设置具体的比对方式。
步骤304、确定两个候选文字区域图像之间的相似性较差,所包含的信息
并不相同,则丟弃候选文字区域图像,退出该流程。 实际应用中,可提示文字检测出错的信息。
步骤305、确定两个候选文字区域图像之间的相似性较好,包含相同的信
息,从而获得确定包含文字内容的文字区域图像。
本实施例一中,选用/,和/2为文字区域图像。实际应用中,
中的任一个进行后续的优化处理。
步骤306、对两个文字区域图像分别进行图像质量的优化处理,并选出效 果较优的文字区域图像。
该步骤306中,对于文字区域图像的优化处理可基于现有相关技术进行, 如,可以使用时域中值滤波、均值滤波、最大值滤波或者最小值滤波赠强图像。 如果图像像素的亮度低于背景物体,就可以使用最大值滤波,可以增强图像中 文字与背景之间的对比,有利于后续文字识别过程的文字分割。反之,若文字 区域图像像素的亮度高于背景物体,使用最小值滤波。如果既有文字像素的亮 度高于背景物体又有文字像素的亮度低于背景物体的情况,就可以使用中值滤 波或者均值滤波。
步骤307、利用文字识别技术,处理经过优化的文字区域图像,识别出相 应的文字内容。
文字识别技术可釆用光学字符识别(OCR)技术。
步骤308、将识别出的文字内容输出。
具体的输出方式可以文本形式或以声音形式输出。
实施例一的流程结束。
上述实施例 一 中,通过对文字检测出的两个候选文字区域图像作进一步的 比对处理,来验证文字检测结果的正确性,在确定两个候选文字区域图像比较 相似后,可获得确定包含文字内容的文字区域图像,而若两个候选文字区域图 像比较相似性较差,则可确定两次文字检测结果并不相同,为避免对误检结果作进一步的文字识别处理,浪费资源,可丟弃本次的文字检测结果。
另外,实际应用中,可选出更多帧作为待检测图像,只是需要计算更多个
候选文字区域图像的图像特征参量值,并可两两比较这些候选文字区域图像的
相似性,选出满足要求的候选文字区域图像,而丟弃与其他文字区域图像相似
性较差的图像。 实施例二
本实施例二中,预设的图像特征参量为图像的色度。
参见图4,图4是本发明实施例二中的文字识别流程图,该流程可包括以 下步骤
步骤401的描述可参考上述步骤301的描述。
步骤402、基于预设的图像特征参量为图像的色度,算出能够用于度量两 个候选文字区域图像的相似性的色度差值。
本实施例二中,色度差值的计算方式可参考上述实施例一中,像素差值的 计算,所不同的是,代入计算式(1 )的值为两个候选文字区域图像上各点的色 度值,如,/, (/,))表示/,中,横坐标为,纵坐标为/的像素点上的色度值, /2 (/, y)表示/2中,横坐标为力纵坐标为/的像素点上的色度值。基于以上计
算式(l),算出/,与/2上色度值的差值d(/p /2)。
步骤403、若色度差值超过预设范围,则执行步骤404,否则,执行步骤
405。
步骤404的描述可参考上述步骤304的描述。
步骤405、标记候选文字区域图像/t-,所在帧为从未参与文字检测处 理的目标图像中,选出一帧,标记为K。
较佳地,可将当前帧用作rt。
本实施例二中,设选用的候选文字区域图像/w的大小为i 。 步骤406、设置大小小于或等于^的搜索窗『,基于搜索窗ff,在R内搜 索与/t-,之间的差异最小的搜索区域,用作文字区域图像。
较佳地,为提高搜索效率,搜索窗的大小可设置为R的两倍大小。参见图5,图5是本实施例二中利用搜索窗w搜索rt中与/w相似的搜索区域的示意图。
图5中,围绕搜索窗『内的任意位置点X(x, _y),提取与i 大小相同的指定 区域,标记为C(x,;;)。并且为减少计算量,搜索窗的中心位置位于与/t.,所 在位置基本相同区域。另外,实际应用中,为减少计算量,可基于R的大小选 取X(x,少),也即设置x和y的最小取值。
利用上述计算式(1)算出该C (jc, y)的色度值与力-,的色度值之间的色 度差值,选出差值最小的搜索区域,标记该搜索区域(x、 _y*),则<formula>formula see original document page 18</formula> ( 2 )
另外,可以根据实际情况,设置一个相似性阈值,如果搜索窗内搜索到的 搜索区域与候选文字区域的相似性仍然低于该相似性阈值,可重新调整搜索窗 的位置,重新搜索。
另外,实际应用中,也可用像素值代替色度值的计算,或设置其他图像特 征参量,如候选文字区域图像的边缘信息等等。并且,根据实际情况,W可能 是实施例一或二所列举的矩形,也可能是其他形状,类似处理。
步骤407、对从步骤406获得的文字区域图像进行优化处理,得到优质的 文字区域图像。
该步骤407中,对文字区域图像的优化处理可参见上述步骤306所采用的 技术,不再赘述。
步骤408至步骤409的描述可参考上述步骤307至步骤308的描述。 实施例二的流程结束。
上述实施例二中,通过搜索未参与文字检测处理的目标图像中与候选文字 区域图像最相似的搜索区域,选出效果较好的文字区域图像,有利于后续文字 识别处理,可提高文字识别效率;另外,基于搜索窗搜索其中的搜索区域,相 比较采用现有文字检测技术检测整个图像,计算量要少很多。
参见图6,图6是本发明的一个实施例中文字区域图像的获取装置的结构 示意图,该装置可包括文字^全测单元601、比对处理单元602、筛选单元603和获取单元604;其中,
文字检测单元601,用于对至少两帧目标图像进行文字^^测,得出每帧 目标图像上的候选文字区域图像;
比对处理单元602,用于根据文字检测单元601的检测结果,将其中一 巾贞目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字 内容的候选文字区域图像进行比对处理;
筛选单元603,用于根据比对处理单元602的处理结果,若被比对的至少 两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候 选文字区域图像属于包含文字内容的文字区域图像;
获取单元604,用于根据筛选单元603的筛选结果,获取包含文字内容的 文字区域图像。
优选地,上述图6所示装置可进一步包括尺寸调整单元605,用于将比 对处理单元602处理的至少两个候选文字区域图像调整到相同尺寸,之后由 比对处理单元602进行比对处理。
上述图6所示装置中,比对处理单元602可包括参量值计算单元6021, 差值计算单元6022;其中,
参量值计算单元6021,用于利用预设算法,计算比对处理单元602处理 的至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的 值;所述图像特征参量被预先设置;
差值计算单元6022,用于根据参量值计算单元5021的计算结果,计算每 两个图像特征参量的值之间的差值。
上述筛选单元603可包括判决单元6031和判决结果处理单元6032,其
中,
判决单元6031,用于根据比对处理单元602的比对结果,判断至少两个 候选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;
判决结果处理单元6032,用于根据判决单元6031的判断结果,判断所述 至少两个候选文字区域图像中是否包含文字内容。参见图7,图7是本发明的一个实施例中判决结果处理单元6032的结构示
意图,该实施例中,判决结果处理单元6032包括结果获取单元701和确定 单元702;
结果获取单元701,用于获取判决单元6031的判断结果;
确定单元702,用于在结果获取单元701获取到的判断结果为肯定时,确
定被比对的至少两个候选文字区域图像中包含文字内容。
参见图8,图8是本发明的另一个实施例中判决结果处理单元6032的结构
示意图,该实施例中,判决结果处理单元6032包括结果获取单元801、搜索
单元802和结果处理单元803;
结果获取单元801,用于获取判决单元6031的判断结果;
搜索单元802,用于在结果获取单元801获取到的判断结果为肯定时,从
搜索未参与所述文字检测的一帧目标图像中,搜索出与所述至少两个候选文字
区域图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜
索区域;
结果处理单元803,用于在结果获取单元801获取到的判断结果为肯定, 以及在搜索单元802搜索到搜索区域时,确定被比对的至少两个候选文字区域 图像中和/或搜索区域对应的图像中包含文字内容。
图8中,搜索单元802包括定位单元8021、参量值计算单元8022、差值 计算单元8023和选择单元8024,其中,
定位单元8021,用于指定未参与所述文字检测的目标图像中的多个指定区
域;
参量值计算单元8022,用于计算定位单元8021定位出的各个指定区域的 图像特征参量的值,以及被比对的一个候选文字区域图像的图像特征参量的值;
差值计算单元8023,用于根据参量值计算单元8022的计算结果,计算每 个指定区域的图像特征参量的值与被比对的一个候选文字区域图像的图像特征 参量的值之间的差值;
选择单元8024,用于根据差值计算单元8023的计算结果,选择用作文字区域图像的搜索区域。
参见图9,图9是本发明的一个实施例中文字识别系统的结构示意图,该
系统可包括存储器901、文字区域图像的获取装置902、文字识别器903和输 出单元卯4;
存储器901,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像; 文字区域图像的获取装置902可参见上文描述;
文字识别器903,用于根据文字区域图像的获取装置902获取到的文字区 域图像,识别出文字内容;
输出单元904,用于将文字识别器识别出的文字内容输出。
上述文字识別系统中可进一步包括图像优化处理单元,对文字区域图像的 获取装置902获取到的文字区域图像进行优化处理后,在由文字识别器903针 对经过优化处理的图像,进行文字识别处理。
综上所述,本发明的具体实施中,通过对文字检测结果作进一步验证处理, 即比较文字检测得出的候选文字区域图像之间的差异程度,在比对出差异程度 较小后,可确定至少两个候选文字区域图像中的内容较相似,并且基于候选文 字区域图像是文字检测得出的,因此,可得到确定包含文字内容的文字区域图 像,从而通过对文字检测结果的验证,降低文字检测的误检几率。
权利要求
1、一种文字区域图像的获取方法,其特征在于,包括对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;获取所述文字区域图像。
2、 根据权利要求1所述的方法,其特征在于,所述比对处理之前,该方法 包括将所述至少两个候选文字区域图像调整到相同尺寸。
3、 根据权利要求1或2所述的方法,其特征在于,进行比对处理包括 利用预设算法,计算所述至少两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述图像特征参量被预设; 计算每两个图像特征参量的值之间的差值。
4、 根据权利要求3所述的方法,其特征在于,确定所述至少两个候选文字 区域图像属于所述文字区域图像包括所述至少两个候选文字区域图像中,两两图像特征参量的值之间的差值在 所述预设范围之内。
5、 根据权利要求1或2所述的方法,其特征在于,获取所述文字区域图像 包括从所述至少两个候选文字区域图像中选择一个或多个候选文字区域图像用 作所述文字区域图像。
6、 根据权利要求1或2项所述的方法,其特征在于,确定所述至少两个候 选文字区域图像属于所述文字区域图像之前,该方法进一步包括从未参与所述文字检测的 一帧目标图像中,搜索出与所述至少两个候选文 字区域图像中的任意一个候选文字区域图像所存差异最小的区域,用作搜索区域。
7、 根据权利要求6所述的方法,其特征在于,所述未参与所述文字检测的 一帧目标图像为所述一个候选文字区域图像所在目标图像的下一帧。
8、 根据权利要求6所述的方法,其特征在于,搜索出所述区域,用作搜索 区域包括利用预设算法,计算未参与所述文字检测的目标图像中,多个指定区域的 图像特征参量的值;所述图像特征参量被预设;计算每个指定区域的图像特征参量的值与所述一个候选文字区域图像的图 像特征参量的值之间的差值;选出与所述一个候选文字区域图像的图像特征参量的值之间的差值最小的 指定区域,用作所述搜索区域。
9、 根据权利要求8所述的方法,其特征在于,计算所述多个指定区域的图 像特征参量的值包括预设大小小于或等于所述未参与所述文字检测的目标图像的大小的搜索 窗,且所述搜索窗在该目标图像内;分别计算所述搜索窗内,与所述一个候选文字区域图像大小相同的各个指 定区域的图像特征参量的值。
10、 根据权利要求6所述的方法,其特征在于,获取所述文字区域图像包括选择所述搜索区域用作所述文字区域图像。
11、 一种文字区域图像的获取装置,其特征在于,包括文字检测单元、 比对处理单元、筛选单元和获取单元;其中,所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目 标图像上的候选文字区域图像;所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候 选文字区域图像进行比对处理;所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个 候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字 区域图像属于包含文字内容的文字区域图像;所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像。
12、 根据权利要求11所述的装置,其特征在于,所述装置进一步包括尺 寸调整单元,用于将比对处理单元处理的至少两个候选文字区域图像调整到相 同尺寸。
13、 根据权利要求11或12所述的装置,其特征在于,所述比对处理单元 包括参量值计算单元,差值计算单元;其中,所述参量值计算单元,用于利用预设算法,计算比对处理单元处理的至少 两个候选文字区域图像中,每个候选文字区域图像的图像特征参量的值;所述 图像特征参量被预先设置;所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每两 个图像特征参量的值之间的差值。
14、 根据权利要求11或12所述的装置,其特征在于,所述筛选单元包括 判决单元和判决结果处理单元,其中,所述判决单元,用于根据所述比对处理单元的比对结果,判断至少两个候 选文字区域图像之间的差异,是否在所述预设范围内,得到判断结果;所述判决结果处理单元,用于根据所述判决单元的判断结果,判断所述至 少两个候选文字区域图像中是否包含文字内容。
15、 根据权利要求14所述的装置,其特征在于,所述判决结果处理单元包 括结果获取单元和确定单元;所述结果获取单元,用于获取所述判决单元的判断结果;所述确定单元,用于在结果获取单元获取到的判断结果为肯定时,确定所述至少两个候选文字区域图像中包含文字内容。
16、 根据权利要求14所述的装置,其特征在于,所述判决结果处理单元包 括结果获取单元、搜索单元和结果处理单元;所述结果获取单元,用于获取所述判决单元的判断结果; 所述搜索单元,用于在结果获取单元获取到的判断结果为肯定时,从搜索 未参与所述文字检测的 一帧目标图像中,搜索出与所述至少两个候选文字区域 图像中的任意一个候选文字区域图像之间所存的差异最小的区域,用作搜索区域;所述结果处理单元,用于在结果获取单元获取到的判断结果为肯定以及在 所述搜索单元搜索到所述搜索区域时,确定所述至少两个候选文字区域图像中 和/或所述搜索区域对应的图像中包含文字内容。
17、 根据权利要求16所述的方法,其特征在于,所述搜索单元包括定位 单元、参量值计算单元、差值计算单元和选择单元,其中,所述定位单元,用于指定未参与所述文字检测的目标图像中的多个指定区域;所述参量值计算单元,用于计算所述定位单元定位出的各个指定区域的图 像特征参量的值,以及所述一个候选文字区域图像的图像特征参量的值;所述差值计算单元,用于根据所述参量值计算单元的计算结果,计算每个 指定区域的图像特征参量的值与所述一个候选文字区域图像的图像特征参量的 值之间的差值;所述选择单元,用于根据所述差值计算单元的计算结果,选择所述搜索区 域用作所述文字区域图像。
18、 一种文字识别系统,其特征在于,包括存储器、文字区域图像的获 取装置、文字识别器和输出单元;所述存储器,用于存储外部输入的针对拍摄对象拍摄出的N帧目标图像; 所述文字区域图像的获取装置,包括文字检测单元、比对处理单元、筛 选单元和获取单元;其中,所述文字检测单元,用于对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;所述比对处理单元,用于根据文字检测单元的检测结果,将其中一帧目标 图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;所述筛选单元,用于根据比对处理单元的处理结果,若被比对的至少两个 候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字 区域图像属于包含文字内容的文字区域图像;所述获取单元,用于根据所述筛选单元的筛选结果,获取所述文字区域图像;所述文字识别器,用于根据所述文字区域图像的获取装置获取到的所述文 字区域图像,识别出所述文字内容;所述输出单元,用于将所述文字识别器识别出的文字内容输出。
全文摘要
本发明提供一种文字区域图像的获取方法,包括对至少两帧目标图像进行文字检测,得出每帧目标图像上的候选文字区域图像;将其中一帧目标图像上的候选文字区域图像,与其他帧目标图像上可能包含相同文字内容的候选文字区域图像进行比对处理;若被比对的至少两个候选文字区域图像之间的差异在预设范围之内,则确定所述至少两个候选文字区域图像属于包含文字内容的文字区域图像;获取所述文字区域图像。本发明还提供一种文字区域图像的获取装置及文字识别系统。本发明的实施例提供的技术方案通过对文字检测结果的验证,降低文字检测的误检几率。
文档编号G06K9/68GK101299239SQ20081011447
公开日2008年11月5日 申请日期2008年6月6日 优先权日2008年6月6日
发明者磊 王, 邓亚峰, 英 黄 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1