一种字符识别方法、装置、电子设备及存储介质与流程

文档序号:33643328发布日期:2023-03-29 02:44阅读:57来源:国知局
一种字符识别方法、装置、电子设备及存储介质与流程

1.本技术涉及计算机检测技术领域,尤其涉及一种字符识别方法、装置、电子设备及存储介质。


背景技术:

2.随着光学字符识别(英文:optical character recognition,ocr)等人工智能技术在生产生活中的应用的逐渐发展普及,与传统人工录入相比,利用ocr技术的应用可以有效提升工作效率,并降低工作成本,基于此,图像中的字符识别技术也得到了发展,该技术主要是包括字符检测技术和字符识别技术,目的是输出图像中文本框、文本内容和置信度。
3.现有技术中字符识别方法和装置的字符识别准确性较低。


技术实现要素:

4.有鉴于此,本技术实施例提供了一种字符识别方法、装置、电子设备及存储介质,旨在提高字符识别的准确性。
5.第一方面,本技术实施例提供了一种字符识别方法,所述方法包括:
6.获取待检测图像中的字符区域;
7.将所述字符区域输入到预设角度判别模型进行角度判别,获得所述字符区域的角度类别;
8.根据所述角度类别对应的旋转角度对所述字符区域进行旋转校正,获得旋转校正后的字符区域;
9.对所述旋转校正后的字符区域进行字符识别,获得所述字符区域中的字符。
10.可选地,所述获取待检测图像中的字符区域,具体包括:
11.将所述待检测图像输入到预设模型进行检测,获得所述字符区域和所述字符区域的第一置信度;
12.所述将所述字符区域输入到预设角度判别模型进行判别,获得所述字符区域的角度类别,包括:
13.将所述第一置信度大于第一预设阈值的字符区域输入到所述角度判别模型进行角度判别,获得所述字符区域角度类别。
14.可选地,所述将所述待检测图像输入到预设模型进行检测,获得所述字符区域和所述字符区域的第一置信度,还包括:
15.将待检测图像输入至预设目标检测模型中进行目标检测,获得初步字符区域和属于字符区域的初步置信度;
16.在所述初步置信度小于第二预设阈值时,将所述初步字符区域输入至预设分类检测模型中进行分类检测,获得所述初步字符区域属于字符区域的第一置信度。
17.可选地,所述方法还包括:
18.将旋转校正后的所述字符区域输入到预设重建模型进行图像重建,获得图像重建
后的字符区域;
19.对所述旋转校正后的字符区域进行字符识别,获得所述字符区域中的字符,具体为:
20.对图像重建后的所述字符区域进行字符识别,获得所述字符区域中的字符。
21.可选地,所述对所述旋转校正后的字符区域进行字符识别,获得所述字符区域中的字符,包括:
22.在所述字符区域的所述第一置信度大于第三预设阈值时,对旋转校正后的所述字符区域进行字符识别,获得所述字符区域中的字符,其中,所述第三预设阈值大于所述第一预设阈值;
23.若所述字符区域的所述第一置信度在所述第一预设阈值和所述第三预设阈值之间时,将所述字符区域输入到所述重建模型进行图像重建,获得所述图像重建后的字符区域;
24.对图像重建后的所述字符区域进行字符识别,获得所述字符区域中的字符。
25.可选地,所述预设角度判别模型包括第一判别模型和第二判别模型,所述将所述字符区域输入到预设角度判别模型进行角度判别,获得所述字符区域的角度类别,包括:
26.将所述字符区域输入到所述第一判别模型进行方向判别,获得所述字符区域的方向类别;
27.基于所述字符区域的方向类别进行方向校正,获得校正为正向的所述字符区域;
28.将正向的所述字符区域输入到所述第二判别模型进行角度判别,获得所述角度类别,其中,所述第二判别模型用于判别所述字符区域属于0度到180度范围内多个角度一一对应的多个预设角度类别中的具体类别。
29.可选地,所述角度判别模型为第三判别模型,所述将所述字符区域输入到角度判别模型进行判别,获得所述字符区域的角度类别,具体包括:
30.将所述字符区域输入到所述第三判别模型进行角度判别,获得所述角度类别,所述第三判别模型用于判别所述字符区域属于0度至360度范围内多个角度一一对应的多个预设角度类别中的具体类别。
31.可选地,所述方法还包括:
32.将所述待检测图像中所述第一置信度大于所述第一预设阈值的所述字符区域和标准图像的字符区域模板进行匹配,获得字符区域匹配结果;
33.累计所述待检测图像中多个所述字符区域匹配结果;
34.根据累计的所述字符区域匹配结果和第一报警阈值进行报警。
35.可选地,所述方法还包括:
36.将所述字符区域识别出的所述字符和字符库中的预设字符模板进行匹配,获得字符匹配结果;
37.累计所述字符区域中多个所述字符匹配结果;
38.根据累计的所述字符匹配结果和第二报警阈值进行报警。
39.第二方面,本技术实施例提供了一种字符识别装置,所述装置包括:
40.获取模块,用于获取待检测图像中的字符区域;
41.判别模块,用于将所述字符区域输入到预设角度判别模型进行角度判别,获得所
述字符区域的角度类别;
42.校正模块,用于根据所述角度类别对应的旋转角度对所述字符区域进行旋转校正,获得旋转校正后的字符区域;
43.识别模块,用于对所述旋转校正后的字符区域进行字符识别,获得所述字符区域中的字符。
44.第三方面,本技术实施例提供了一种电子设备,所述设备包括:
45.存储器,用于存储计算机程序;
46.处理器,用于执行所述计算机程序,以使所述设备执行前述第一方面任一项所述字符识别方法。
47.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现前述第一方面所述字符识别方法。
48.从以上技术方案可以看出,本技术实施例具有以下优点:
49.本技术提供了一种字符识别方法、装置、电子设备及存储介质,首先,获取待检测图像中的字符区域,其次,通过预设角度判别模型对字符区域进行角度判别,获得字符区域的角度类别。然后,按照角度类别对应的旋转角度旋转校正字符区域,获得旋转校正后的字符区域。最后,对旋转校正后的字符区域进行字符识别,获得字符区域中的字符。可见,该方法将待检测图像的字符区域输入到角度判别模型中进行判别,能够获得字符区域的角度类别,根据角度类别对字符区域进行对应角度的旋转校正,能够得到旋转校正后的字符区域,然后根据旋转校正后的字符区域进行字符识别能够得到字符区域中的字符,通过这种方式实现了以字符区域作为单位进行角度校正,提高了字符区域的检测率,进而提高了图像中的字符识别准确性。
附图说明
50.为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
51.图1为本技术实施例中一种应用场景所涉及的系统框架示意图;
52.图2为本技术实施例提供的一种字符识别方法的方法流程图;
53.图3为本技术实施例提供的另一种字符识别方法的方法流程图;
54.图4为本技术实施例提供的一种字符识别装置的结构示意图。
具体实施方式
55.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
56.基于此,为了解决现有的字符识别方法的识别准确度低的问题,在本技术实施例
中,首先,获取待检测图像中的字符区域,其次,通过预设角度判别模型对字符区域进行角度判别,获得字符区域的角度类别。然后,按照角度类别对应的旋转角度旋转校正字符区域,获得旋转校正后的字符区域。最后,对旋转校正后的字符区域进行字符识别,获得字符区域中的字符。
57.可见,该方法将待检测图像的字符区域输入到角度判别模型中进行判别,能够获得字符区域的角度类别,根据角度类别对字符区域进行对应角度的旋转校正,能够得到旋转校正后的字符区域,然后根据旋转校正后的字符区域进行字符识别能够得到字符区域中的字符,通过这种方式实现了以字符区域作为单位进行角度校正,提高了字符区域的检测率,进而提高了图像中的字符识别准确性。
58.举例来说,本技术实施例的场景之一,可以是应用到如图1所示的场景中。该场景包括摄像机101和服务器102,其中,摄像机101获取待检测图像发送至服务器102,服务器102采用本技术实施例提供的实施方式实现字符识别方法。
59.首先,在上述应用场景中,虽然将本技术实施例提供的实施方式的动作描述由服务器102执行;但是,本技术实施例在执行主体方面不受限制,只要执行了本技术实施例提供的实施方式所公开的动作即可。
60.其次,上述场景仅是本技术实施例提供的一个场景示例,本技术实施例并不限于此场景。
61.下面结合附图,通过实施例来详细说明本技术实施例中字符识别方法及装置的具体实现方式。
62.图2为本技术实施例提供的一种字符识别方法的方法流程图。结合图2所示,本技术实施例提供的字符识别方法,可以包括:
63.s201:获取待检测图像中的字符区域。
64.待检测图像可以是工业应用场景中的图像,可以将从工业场景中的待检测图像输入到目标检测模型中进行检测,能够获得待检测图像中的字符区域。其中,目标检测模型可以通过以下训练步骤来获得,首先,采集工业应用场景中的图像数据,这里的图像数据是正常能够看到字符的图像数据,对图像数据进行人工标注,标注出字符区域矩形框,然后,将标注好的图像数据作为字符区域检测的训练数据,其中,字符区域最小的矩形框可以是一段英文单词或者是一行中文。最后将字符区域检测的训练数据输入到旋转目标检测模型中进行训练,直到模型收敛至最优,获得目标检测模型。
65.优选地,目标检测模型可以采用旋转目标检测模型,旋转目标检测模型的训练数据需要标注出字符区域最小外接矩形框和对应的角度,采用旋转目标检测模型可以确定出字符的最小外接矩形,对后续的字符识别有帮助。其中,旋转目标检测模型可以是现有的旋转目标检测器r3det,也可以是场景文字检测east算法等。当然,本技术实施例不具体限定目标检测模型的训练方法,并不影响本技术是实施例的实现。
66.在一种可能的实施方式中,将待检测图像输入到预设模型中,可以是将待检测图像输入到目标检测模型中进行目标检测,能够获得初步字符区域和属于字符区域的初步置信度,其中置信度是指待检测图像中是字符区域的概率。
67.s202:将字符区域输入到预设角度判别模型进行角度判别,获得字符区域的角度类别。
68.将通过s201步骤得到的字符区域输入到预设角度判别模型中进行角度判别,能够得到字符区域的角度类别。其中,在本实施例中,具体地,角度判别模型包括第一判别模型和第二判别模型,将字符区域输入到角度判别模型中先输入到第一判别模型中进行方向判别,能够得到字符区域的方向类别,来判断字符区域的方向,基于字符区域的方向类别进行方向校正,如果字符区域的方向是正向则不需要校正,如果字符区域的方向是反向,将字符区域的方向校正为正向,然后将方向为正向的字符区域输入到第二判别模型中进行角度判别,能够得到字符区域的角度类别,其中,第二判别模型是用来判别字符区域属于0度到180度范围内多个角度一一对应的多个预设角度类别中的具体类别,第一判别模型为方向判别模型,第二判别模型为第一角度判别模型。
69.第一判别模型和第二判别模型可以通过以下训练步骤来获得:首先,将用于训练目标检测模型的训练数据进行旋转校正,获得旋转校正至正向的训练数据,将正向的训练数据旋转(0
°
,15
°
,30
°
,45
°
,60
°
,75
°
,90
°
,105
°
,120
°
,135
°
,150
°
,165
°
)得到上述12种数据,标注角度类别标签分别为(0,1,2,3,4,5,6,7,8,9,10,11),将标注角度类别的数据作为第一角度判别模型(即,第二判别模型)的训练数据集。然后将上述12种角度类别的训练数据进行180度反转,获得反转后的数据,将反转前后的这两组数据进行组合,组合之后的数据集作为方向判别模型(即,第一判别模型)的训练数据集,其中,上述反转前的12种角度数据的训练方向标签为0,指的是0
°
到180
°
范围内的训练数据,方向为正向,反转后的数据的训练方向标签为1,指的是180
°
到360
°
范围内的训练数据,方向为反向。最后,根据方向判别的训练数据集和第一角度判别的训练数据集使用分类算法进行图像多分类训练,能够得到方向判别模型和第一角度判别模型。方向判别模型能够判断字符区域的方向,第一角度判别模型能够判别字符区域为正时的具体角度类别,根据角度类别判别字符区域的具体角度。其中,分类算法可以是现有的神经网络算法(英文:residual neural network,resnet),也可以是卷积神经网络resnext算法。当然,本技术不具体限定角度判别模型的训练方法,并不影响本技术实施例的实现。
70.在一种可能的实施方式中,角度判别模型为第三判别模型,将字符区域输入到第三判别模型进行角度判别,获得字符区域的角度类别,第三判别模型用于判别字符区域属于0度至360度范围内多个角度一一对应的多个预设角度类别中的具体类别,第三判别模型为第二角度判别模型。
71.第二角度判别模型可以通过以下训练步骤来获得,首先,将用于训练目标检测模型的训练数据进行旋转校正,获得旋转校正至正向的训练数据,将正向的训练数据旋转(0
°
,30
°
,60
°
,90
°
,120
°
,150
°
,180
°
,210
°
,240
°
,370
°
)得到上述10种数据,标注角度类别标签分别为(0,1,2,3,4,5,6,7,8,9),将标注角度类别的数据作为第二角度判别的训练数据集,最后,根据第二角度判别的训练数据集使用分类算法进行图像多分类训练,能够得到第二角度判别模型。第二角度判别模型能够判别字符区域的具体角度类别,根据角度类别判别字符区域的具体角度。其中,分类算法可以是现有的神经网络算法(英文:residual neural network,resnet),也可以是卷积神经网络resnext算法。当然,本技术不具体限定第二角度判别模型的训练方法,并不影响本技术实施例的实现。
72.在一种可能的实施方式中,在将字符区域输入到角度判别模型前需要进行判断,如果初步置信度小于第二预设阈值时,将初步字符区域输入到预设分类检测模型中进行分
类检测,获得初步字符区域属于字符区域的第一置信度,如果第一置信度大于第一预设阈值,将字符区域输入到角度判别模型中进行角度判别,获得字符区域的角度类别。作为一种示例,第一预设阈值可以是0.3,当第一置信度小于0.3时,输入的字符区域被判别为背景区域,当第一置信度大于0.3时,才会被判别为字符区域,然后将字符区域输入到角度判别模型中进行判别。
73.其中,分类检测模型能够判断输入的字符区域是否为置信度较高的字符区域,能够对由目标检测模型获取到的初步字符区域进行复判,当目标检测模型输出的属于字符区域的初步置信度小于第二预设阈值时,将初步字符区域输入到分类检测模型中,能够获得初步字符区域属于字符区域的第一置信度。
74.分类检测模型可以通过以下训练步骤来获得:首先根据用于训练目标检测模型的训练数据,裁剪出字符区域图像,然后根据字符区域图像的尺寸从字符区域检测的训练数据中裁剪出背景区域,将裁剪出的字符区域和背景区域作为区域判别的训练数据。最后根据区域判别的训练数据使用分类算法进行图像二分类,判断输入的图像为字符区域还是背景区域。其中,分类算法可以是现有的神经网络算法(英文:residual neural network,resnet),也可以是卷积神经网络resnext算法。当然,本技术不具体限定分类检测模型的训练方法,并不影响本技术实施例的实现。作为一种示例,在字符缺失和字符模糊的场景下,目标检测模型输出的字符区域的第一置信度可能较低,那么将第一置信度较低的字符区域输入到分类检测模型中,字符区域的第二置信度比第一置信度更高,因此,该分类检测模型具有实际意义。
75.在一种可能的实施方式中,将待检测图像中第一置信度大于第一预设阈值的字符区域和标准图像的字符区域模板进行匹配,获得字符区域匹配结果。累计待检测图像中多个字符区域匹配结果,根据累计的字符区域匹配结果和第一报警阈值进行报警。其中,字符区域匹配结果可以通过字符区域匹配矩阵的形式来表示,根据累计的字符区域匹配结果和第一报警阈值进行报警可以输出第一报警信息。作为一种示例,字符区域匹配矩阵可以是(0,1,1),表示字符区域和字符区域模板中第一个字符区域不匹配,第二个和第三个字符区域与字符区域模板匹配成功,当字符区域匹配矩阵中不符合的字符区域数量超过第一报警阈值时,发出第一报警信息,第一报警信息的内容可以是字符区域的印刷模板错误,需要检查印刷模板。
76.s203:根据角度类别对应的旋转角度对字符区域进行旋转校正,获得旋转校正后的字符区域。
77.根据通过s202步骤得到的字符区域的角度类别对应的角度,对字符区域进行旋转校正,能够得到旋转校正后的字符区域。
78.s204:对旋转校正后的字符区域进行字符识别,获得字符区域中的字符。
79.将旋转校正后的字符区域输入到现有的字符识别模型进行字符识别,能够得到字符区域中的字符。
80.在一种可能的实施方式中,将通过字符区域识别出的字符和字符库中的预设字符模板进行匹配,获得字符匹配结果,累计字符区域中多个字符匹配结果,根据累计的字符匹配结果和第二报警阈值进行报警。其中,字符匹配结果可以通过字符匹配矩阵的形式来表示,根据累计的字符匹配结果和第二报警阈值进行报警可以输出第二报警信息。作为一种
示例,字符匹配矩阵可以是(1,0,0),表示字符和字符模板库中的预设字符模板中第一个字符匹配成功,第二个和第三个字符与字符模板库中的预设字符模板不匹配,当字符匹配矩阵中不符合的字符数量超过第二报警阈值时,发出第二报警信息,第二报警信息的内容可以是印刷字符模糊,需要对印刷字符进行检查。
81.作为一种可能的实施方式,统计字符区域匹配结果和字符匹配结果,获得全局匹配结果,根据全局匹配结果和第三报警阈值进行报警,当全局匹配矩阵超过第三报警阈值时,输出第三报警信息,输出的报警信息可以是字符识别失败,需要重新进行识别。
82.以上为本技术实施例提供的一种字符识别方法,首先,获取待检测图像中的字符区域,其次,通过预设角度判别模型对字符区域进行角度判别,获得字符区域的角度类别。然后,按照角度类别对应的旋转角度旋转校正字符区域,获得旋转校正后的字符区域。最后,对旋转校正后的字符区域进行字符识别,获得字符区域中的字符。可见,该方法将待检测图像的字符区域输入到角度判别模型中进行判别,能够获得字符区域的角度类别,根据角度类别对字符区域进行对应角度的旋转校正,能够得到旋转校正后的字符区域,然后根据旋转校正后的字符区域进行字符识别能够得到字符区域中的字符,通过这种方式实现了以字符区域作为单位进行角度校正,提高了字符区域的检测率,进而提高了图像中的字符识别准确性。
83.在本技术实施例中,存在字符区域图像置信度低无法被字符识别模型进行识别的情况,为了解决字符区域图像置信度低无法被识别的问题,在获得第二置信度后,对字符区域进行了角度判别,然后对进行角度判别后的字符区域进行图像重建,重建出破损和缺失的字符区域,下面结合实施例和附图,对另一种字符识别方法进行描述。
84.图3为本技术实施例提供的另一种字符识别方法的方法流程图。结合图3所示,本技术实施例提供的字符识别方法,可以包括:
85.s301:获取待检测图像中的字符区域。
86.s302:将字符区域输入到预设角度判别模型进行角度判别,获得字符区域的角度类别。
87.s303:根据角度类别对应的旋转角度对字符区域进行旋转校正,获得旋转校正后的字符区域。
88.s304:将旋转校正后的字符区域输入到预设重建模型进行图像重建,获得图像重建后的字符区域。
89.预设图像重建模型可以通过以下训练步骤来获得,首先,根据区域判别的训练数据使用随机遮挡mask,遮挡部分字符区域,并旋转预设角度,其中预设角度可以是15
°
,然后利用被遮挡的字符区域作为训练数据训练图像重建模型,直至模型收敛到最优,得到训练好的图像重建模型。其中未训练的图像重建模型可以是现有的,可以是卷积神经网络(英文:convolutional neural networks,cnn),自编码器auto_encoder,也可以是变分自动编码器(英文:variational auto encoder)。当然,本技术不具体限定图像重建模型的训练方法,并不影响本技术实施例的实现。
90.作为一种可能的实施方式,在将旋转校正后的字符区域输入到重建模型进行图像重建之前进行判断,在字符区域的第一置信度大于第三预设阈值时,对旋转校正后的字符区域进行字符识别,获得字符区域中的字符,其中,第三预设阈值大于第一预设阈值;如果
字符区域的第一置信度在第一预设阈值和第三预设阈值之间时,将字符区域输入到重建模型进行图像重建,获得图像重建后的字符区域。作为一种示例,第三预设阈值可以是0.7,当第一置信度大于0.7时,输入的字符区域被判别为清晰字符区域,不需要进行图像重建,当第一置信度大于0.3,小于0.7时,输入的字符区域被判别为模糊字符区域,需要进行图像重建,将旋转校正后的字符区域输入到图像重建模型进行图像重建。
91.s305:对图像重建后的字符区域进行字符识别,获得字符区域中的字符。
92.本技术实施例中,s305与上述实施例中s204类似,仅仅是将s204中的旋转校正后的字符区域替换为图像重建后的字符区域,s301-s303与上述实施例中s201-s203相同;因此,s301-s302的具体实现方式可参考s201-s202的具体实现方式,在此不再赘述。
93.以上为本技术实施例提供的另一种字符识别方法,首先,获取待检测图像中的字符区域,其次,通过预设角度判别模型对字符区域进行角度判别,获得字符区域的角度类别。然后,按照角度类别对应的旋转角度旋转校正字符区域,获得旋转校正后的字符区域,对旋转校正后的字符区域进行图像重建,获得图像重建后的字符区域。最后,对图像重建后的字符区域进行字符识别,获得字符区域中的字符。可见,将旋转校正后的字符区域输入到重建模型进行图像重建,图像重建能够将置信度低的字符区域重建为清晰的字符区域,得到的字符区域质量更高,对更高质量的字符区域进行字符识别,得到的字符也更加的清晰完整,提高了字符区域的检测率,进而提高了图像中的字符识别准确性。
94.以上为本技术实施例提供字符识别方法的一些具体实现方式,基于此,本技术还提供了对应的装置。下面将从功能模块化的角度对本技术实施例提供的装置进行介绍。
95.参见图4所示的字符识别装置400的结构示意图,该装置400包括获取模块401、判别模块402、校正模块403和识别模块404。
96.获取模块401,用于获取待检测图像中的字符区域;
97.判别模块402,用于将字符区域输入到预设角度判别模型进行角度判别,获得字符区域的角度类别;
98.校正模块403,用于根据角度类别对应的旋转角度对字符区域进行旋转校正,获得旋转校正后的字符区域;
99.识别模块404,用于对旋转校正后的字符区域进行字符识别,获得字符区域中的字符。
100.在本技术实施例中,通过获取模块401、判别模块402、校正模块403和识别模块404的配合,待检测图像的字符区域输入到角度判别模型中进行判别,能够获得字符区域的角度类别,根据角度类别对字符区域进行对应角度的旋转校正,能够得到旋转校正后的字符区域,然后根据旋转校正后的字符区域进行字符识别能够得到待检测图像中的字符,通过这种方式实现了以字符区域作为单位进行角度校正,提高了字符区域的检测率,进而提高了图像中的字符识别准确性。
101.作为一种实施方式,获取模块401,具体包括:
102.检测单元,用于将待检测图像输入到预设模型进行检测,获得字符区域和字符区域的第一置信度;
103.判别单元,用于将第一置信度大于第一预设阈值的字符区域输入到角度判别模型进行角度判别,获得字符区域角度类别。
104.作为一种实施方式,字符识别装置400还包括:
105.目标检测单元,用于将待检测图像输入至预设目标检测模型中进行目标检测,获得初步字符区域和属于字符区域的初步置信度;
106.分类检测单元,用于在初步置信度小于第二预设阈值时,将初步字符区域输入至预设分类检测模型中进行分类检测,获得初步字符区域属于字符区域的第一置信度。
107.作为一种实施方式,字符识别装置400还包括:
108.重建单元,用于将旋转校正后的字符区域输入到预设重建模型进行图像重建,获得图像重建后的字符区域;
109.识别单元,用于对图像重建后的字符区域进行字符识别,获得字符区域中的字符。
110.作为一种实施方式,识别模块404,具体用于:
111.在字符区域的第一置信度大于第三预设阈值时,对旋转校正后的字符区域进行字符识别,获得字符区域中的字符,其中,第三预设阈值大于第一预设阈值;
112.若字符区域的第一置信度在第一预设阈值和第三预设阈值之间时,将字符区域输入到重建模型进行图像重建,获得图像重建后的字符区域;
113.对图像重建后的字符区域进行字符识别,获得字符区域中的字符。
114.作为一种实施方式,角度判别模型包括第一判别模型和第二判别模型,判别模块402,具体用于:
115.将字符区域输入到第一判别模型进行方向判别,获得字符区域的方向类别;
116.基于字符区域的方向类别进行方向校正,获得校正为正向的字符区域;
117.将正向的字符区域输入到第二判别模型进行角度判别,获得角度类别,其中,第二判别模型用于判别字符区域属于0度到180度范围内多个角度一一对应的多个预设角度类别中的具体类别。
118.作为一种实施方式,角度判别模型为第三判别模型,判别模块402,具体用于:
119.将字符区域输入到第三判别模型进行角度判别,获得角度类别,第三判别模型用于判别字符区域属于0度至360度范围内多个角度一一对应的多个预设角度类别中的具体类别。
120.作为一种实施方式,字符识别装置400还包括:
121.第一匹配单元,用于将待检测图像中第一置信度大于第一预设阈值的字符区域和标准图像的字符区域模板进行匹配,获得字符区域匹配结果;
122.第一累计单元,用于累计待检测图像中多个字符区域匹配结果;
123.第一报警单元,用于根据累计的字符区域匹配结果和第一报警阈值进行报警。
124.作为一种实施方式,字符识别装置400还包括:
125.第二匹配单元,用于将字符区域识别出的字符和字符库中的预设字符模板进行匹配,获得字符匹配结果;
126.第二累计单元,用于累计字符区域中多个字符匹配结果;
127.第二报警单元,用于根据累计的字符匹配结果和第二报警阈值进行报警。
128.本技术实施例还提供了对应的设备以及计算机可读存储介质,用于实现本技术实施例提供的方案。
129.其中,所述设备包括存储器和处理器,所述存储器用于存储计算机程序,所述处理
器用于执行所述计算机程序,以使所述设备执行本技术任一实施例所述的字符识别方法。
130.所述计算机可读存储介质中存储有计算机程序,当所述计算机程序被运行时,运行所述计算机程序的设备实现本技术任一实施例所述的字符识别方法。
131.本技术实施例中提到的“第一”、“第二”(若存在)等名称中的“第一”、“第二”只是用来做名字标识,并不代表顺序上的第一、第二。
132.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如只读存储器(英文:read-only memory,rom)/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如路由器等网络通信设备)执行本技术各个实施例或者实施例的某些部分所述的方法。
133.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
134.以上所述仅是本技术示例性的实施方式,并非用于限定本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1