一种编组方式确定方法及装置与流程

文档序号:16934303发布日期:2019-02-22 20:33阅读:202来源:国知局
一种编组方式确定方法及装置与流程

本发明涉及图像识别技术领域,特别是涉及一种编组方式确定方法及装置。



背景技术:

在识别图像中所包含的数字、字母等字符时,往往需要先确定包含字符的图像区域,再从上述区域中逐一确定单个字符所在的区域,然后逐一进行识别。其中,从图像区域中逐一确定单个字符所在的区域时,一般先确定图像区域中字符的编组方式,然后基于所确定的编组方式从图像区域中逐一确定单个字符所在的区域。上述字符的编组方式是指多个字符之中,连续排列在一起的字符的数量和不连续排列的字符被隔开的情况。

以银行卡图像为例,在现有技术中,从银行卡的图像中识别银行卡号时,可以先确定银行卡号所在的区域,再确定银行卡号的编组方式,并基于银行卡号的编组方式从上述区域中逐一确定卡号中的每一个数字所在的区域,然后对每一个数字进行识别,得到银行卡号的识别结果。

发明人在实现本发明的过程中发现,现有技术至少存在如下问题:

对于中国银联的银行卡,卡号位数有16位、18位、19位三种情况,不同位数的卡号,其数字在银行卡卡面上的编组方式不同,而对于卡号位数相同的银行卡,卡号数字的编组方式也不都相同。不同编组方式的银行卡号,数字的位置存在差别,所以对于不同编组方式的银行卡号,确定出的卡号中的每一个数字所在的区域不同。现有技术中,确定银行卡号的编组方式时,一般采用人工方式确定卡号数字的编组方式,这样虽然能够准确确定出编组方式,但是导致确定编组方式的效率低、工作人员的工作量大。



技术实现要素:

本发明实施例的目的在于提供一种编组方式确定方法及装置,以提高编组方式的确定效率,减轻工作人员确定编组方式时的工作量。具体技术方案如下:

本发明实施例提供一种编组方式确定方法,包括:

确定待识别图像中包含字符的图像区域,作为第一图像区域;

对所述第一图像区域进行形态学梯度化计算,得到第一梯度图;

分别将所述第一梯度图的每一个像素行输入至第一检测模型中检测每一像素行中像素点所属字符的数量,得到每一个像素行对应的检测结果,其中,所述第一检测模型为:预先使用第一样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注数量对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所属字符的数量的神经网络模型,所述第一样本梯度图为:对第一样本图像进行形态学梯度化计算得到的梯度图;

基于所得到的检测结果,获得所述待识别图像中字符的字符数量;

基于所获得的字符数量确定所述待识别图像中字符的编组方式。

本发明的一种实现方式中,每一像素行对应的检测结果中包括:该像素行中像素点所属字符的数量为各字符数量的概率;

所述基于所得到的检测结果,获得所述待识别图像中字符的字符数量,包括:

针对每一字符数量,计算所述第一梯度图的各个像素行中像素点所属字符的数量为该字符数量的概率和值;

将最大和值对应的字符数量确定为所述待识别图像中字符的字符数量。

本发明的一种实现方式中,采用以下方式训练得到所述第一检测模型:

获取第一样本图像;

对所述第一样本图像进行形态学梯度化计算,得到第一样本梯度图;

根据所述第一样本梯度图中每一像素行在所述第一样本图像对应的像素行中像素点所属字符的数量,获得所述第一样本梯度图中每一像素行中像素点所属字符的标注数量;

采用所述第一样本梯度图中的每一像素行以及每一像素行对应的标注数量,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符数量的神经网络模型,作为所述第一检测模型。

本发明的一种实现方式中,所述基于所获得的字符数量确定所述待识别图像中字符的编组方式,包括:

确定与所获得的字符数量相对应的、用于检测图像中字符编组方式的第二检测模型,其中,所述第二检测模型为:预先使用第二样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注编组方式对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所述字符的编组方式的神经网络模型,所述第二样本梯度图为:对第二样本图像进行形态学梯度化计算得到的梯度图;

分别将所述第一梯度图的每一个像素行输入至所述第二检测模型中检测每一像素行中像素点所属字符的编组方式,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率;

针对每一编组方式,计算所述第一梯度图的各个像素行中像素点所属字符的编组方式为预设编组方式的概率和值;

将最大和值对应的编组方式确定为所述待识别图像中字符的编组方式。

本发明的一种实现方式中,采用以下方式训练得到所述第二检测模型:

获取第二样本图像;

对所述第二样本图像进行形态学梯度化计算,得到第二样本梯度图;

根据所述第二样本梯度图中每一像素行在所述第二样本图像对应的像素行中像素点所属字符的编组方式,获得所述第二样本梯度图中每一像素行中像素点所属字符的标注编组方式;

采用所述第二样本梯度图中的每一像素行以及每一像素行对应的标注编组方式,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符的编组方式的神经网络模型,作为所述第二检测模型。

本发明实施例还提供一种编组方式确定装置,包括:

区域确定模块,用于确定待识别图像中包含字符的图像区域,作为第一图像区域;

图获得模块,用于对所述第一图像区域进行形态学梯度化计算,得到第一梯度图;

结果获得模块,用于分别将所述第一梯度图的每一个像素行输入至第一检测模型中检测每一像素行中像素点所属字符的数量,得到每一个像素行对应的检测结果,其中,所述第一检测模型为:预先使用第一样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注数量对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所属字符的数量的神经网络模型,所述第一样本梯度图为:对第一样本图像进行形态学梯度化计算得到的梯度图;

数量获得模块,用于基于所得到的检测结果,获得所述待识别图像中字符的字符数量;

方式确定模块,用于基于所获得的字符数量确定所述待识别图像中字符的编组方式。

本发明的一种实现方式中,每一像素行对应的检测结果中包括:该像素行中像素点所属字符的数量为各字符数量的概率;

所述数量获得模块,包括:

第一和值计算子模块,用于针对每一字符数量,计算所述第一梯度图的各个像素行中像素点所属字符的数量为该字符数量的概率和值;

数量确定子模块,用于将最大和值对应的字符数量确定为所述待识别图像中字符的字符数量。

本发明的一种实现方式中,所述结果获得模块包括以下子模块,用于训练得到所述第一检测模型:

图像获取子模块,用于获取第一样本图像;

梯度图获得子模块,用于对所述第一样本图像进行形态学梯度化计算,得到第一样本梯度图;

数量获得子模块,用于根据所述第一样本梯度图中每一像素行在所述第一样本图像对应的像素行中像素点所属字符的数量,获得所述第一样本梯度图中每一像素行中像素点所属字符的标注数量;

模型获得子模块,用于采用所述第一样本梯度图中的每一像素行以及每一像素行对应的标注数量,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符数量的神经网络模型,作为所述第一检测模型。

本发明的一种实现方式中,所述方式确定模块,包括:

模型确定子模块,用于确定与所获得的字符数量相对应的、用于检测图像中字符编组方式的第二检测模型,其中,所述第二检测模型为:预先使用第二样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注编组方式对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所述字符的编组方式的神经网络模型,所述第二样本梯度图为:对第二样本图像进行形态学梯度化计算得到的梯度图;

概率获得子模块,用于分别将所述第一梯度图的每一个像素行输入至所述第二检测模型中检测每一像素行中像素点所属字符的编组方式,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率;

第二和值计算子模块,用于针对每一编组方式,计算所述第一梯度图的各个像素行中像素点所属字符的编组方式为预设编组方式的概率和值;

方式确定子模块,用于将最大和值对应的编组方式确定为所述待识别图像中字符的编组方式。

本发明的一种实现方式中,所述概率获得子模块包括以下单元,用于训练得到所述第二检测模型:

图像获取单元,用于获取第二样本图像;

梯度图获得单元,用于对所述第二样本图像进行形态学梯度化计算,得到第二样本梯度图;

方式获得单元,用于根据所述第二样本梯度图中每一像素行在所述第二样本图像对应的像素行中像素点所属字符的编组方式,获得所述第二样本梯度图中每一像素行中像素点所属字符的标注编组方式;

模型获得单元,用于采用所述第二样本梯度图中的每一像素行以及每一像素行对应的标注编组方式,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符的编组方式的神经网络模型,作为所述第二检测模型。

本发明实施例还提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的编组方式确定方法的步骤。

在本发明实施的又一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的编组方式确定方法的步骤。

在本发明实施的又一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的编组方式确定方法。

本发明实施例提供的编组方式确定方法及装置,可以先对待识别图像的包含字符的图像区域进行形态学梯度化计算,再将所得图像的像素行输入到预先训练得到的神经网络模型中,基于神经网络模型的输出得到待识别图像中字符的字符数量,然后基于字符数量确定字符的编组方式。可见,本发明实施例提供的方案中,不再采用人工方式确定字符的编组方式,而是利用设备进行识别,从而能够提高编组方式的确定效率,减轻工作人员确定编组方式时的工作量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的编组方式确定方法的一种流程示意图;

图2为本发明实施例提供的编组方式确定方法的另一种流程示意图;

图3为本发明实施例提供的第一检测模型训练方法的一种流程示意图;

图4为本发明实施例提供的第二检测模型训练方法的一种流程示意图;

图5为本发明实施例提供的编组方式确定装置的一种结构示意图;

图6为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。

本发明实施例提供了一种编组方式确定方法及装置,下面先对本发明实施例中涉及的概念进行说明。

形态学梯度化计算是指按照以下步骤对图像进行处理得到差值图像的过程:

分别对图像进行膨胀和腐蚀的形态学处理,然后用膨胀后的图像减去腐蚀后的图像,得到差值图像。

在对图像进行膨胀和腐蚀的形态学处理时,可以选用3×3的卷积核作为特征检测器。

神经网络模型:由大量的、简单的处理单元广泛地互相连接而形成的复杂网络系统。

编组方式:对于多个字符,连续排列在一起的字符的数量和不连续排列的字符被隔开的情况。

以银行卡的卡号为例,假设,银行卡的卡号包含16个字符,则其编组方式可以为:4-4-4-4,每4个字符连续排列在一起,连续排列的字符串被1个字符的宽度隔开,具体表现为:6200000000000000;假设银行卡的卡号包含19个字符,则其编组方式可以为:6-13,每4个字符连续排列在一起,连续排列的字符串被1个字符的宽度隔开,具体表现为:6200000000000000000。

下面通过具体实施例,对本发明实施例提供的编组方式确定方法进行详细说明。

参见图1,图1为本发明实施例提供的编组方式确定方法的一种流程图,包括如下步骤:

步骤s101、确定待识别图像中包含字符的图像区域,作为第一图像区域。

包含字符的图像区域中包括字符部分和与字符同行的无字符的部分。确定上述图像区域时,可以采用基于二值化的水平投影算法,具体步骤可以包括:对上述银行卡图像进行二值化处理,得到黑白两色的二值图像;统计上述二值图像的每一像素行中颜色为白色或黑色的像素点分布;根据统计结果,确定上述图像区域。

如果待识别图像全部为包含字符的图像区域,那么整个待识别图像均为第一图像区域。当然,包含字符的图像区域也可以是待识别图像中的部分区域,这种情况下,上述第一图像区域为待识别图像的部分区域。

例如,上述待识别图像可以为银行卡图像,那么包含字符的图像区域可以为图像中的银行卡的卡号区域。

步骤s102、对第一图像区域进行形态学梯度化计算,得到第一梯度图。

待识别图像可以为灰度图像,也可以为彩色图像。如果待识别图像为灰度图像时,可以直接对第一图像区域进行形态学梯度化计算,得到第一梯度图;如果待识别图像为彩色图像时,可以先获得第一图像区域的灰度图,再对该灰度图进行形态学梯度化计算,得到第一梯度图。

本发明实施例仅仅以上述得到第一梯度图的方式为例进行说明,并不对本发明构成限定。

步骤s103、分别将第一梯度图的每一个像素行输入至第一检测模型中检测每一像素行中像素点所属字符的数量,得到每一个像素行对应的检测结果。

第一检测模型为:预先使用第一样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注数量对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所属字符的数量的神经网络模型。

第一样本梯度图为:对第一样本图像进行形态学梯度化计算得到的梯度图。

第一梯度图为第一图像区域进行形态学梯度化计算得到的,所以第一梯度图中的像素与第一图像区域中的像素有对应关系,又因为第一梯度图的第一图像区域包含由像素点构成的字符,所以第一梯度图中的像素行中的像素点所属的字符,为第一梯度图中的像素行中的像素点所对应的第一图像区域中的像素点所属的字符。

输入至第一检测模型的像素行可以由第一预设数量个像素点组成,第一预设数量可以取值为240或300等数值。如果第一梯度图的像素行,其像素点数量大于第一预设数量,可以对第一梯度图进行缩小处理,使得第一梯度图的宽度为第一预设数量个像素点;如果第一梯度图的像素行,其像素点数量小于第三预设数量,可以使用像素点将像素行补全,补全所用的像素点的像素值为:所表示的梯度值小于预设阈值的像素值。如果在第一梯度图中,从白色到黑色所表示的梯度值依次由大到小,那么在第一梯度图的像素行的像素点数量小于第一预设数量时,可以使用像素值表示为黑色的像素点将该像素行补全成像素点数量为第一预设数量的像素行。

上述检测结果可以为字符数量的具体数字,例如:“18”;也可以为第二预设数量个可能的具体的字符数量及各个字符数量所对应的概率,例如:“17:0.10,18:0.70,19:0.20”;还可以为字符数量为预设的一个或多个字符数量的概率,例如:“16:0.05,18:0.75,19:0.20”。

步骤s104、基于所得到的检测结果,获得待识别图像中字符的字符数量。

如果检测结果为字符数量的具体数字,直接从检测结果中获得每一像素行对应的待识别图像中字符的字符数量,可以将多数像素行的检测结果中的字符数量作为待识别图像中字符的字符数量,例如,将检测结果中出现次数最大的字符数量作为待识别图像中字符的字符数量。

如果检测结果为第二预设数量个可能的具体的字符数量及各个字符数量所对应的概率,可以对检测结果进行统计,针对每一所得到的字符数量,计算检测结果中该字符数量的概率值的和值,将概率值和值最大的字符数量作为待识别图像中字符的字符数量。

如果检测结果为预设的字符数量的概率,可以计算检测结果中的、对应每个预设字符数量的概率值的和值,将概率值和值最大的字符数量作为待识别图像中字符的字符数量。

步骤s105、基于所获得的字符数量确定待识别图像中字符的编组方式。

在一些应用场景中,字符的编组方式是固定的,因此对于这样的应用场景的图像,确定了字符数量后,就可以根据该图像中包含的字符的设定确定出该图像中字符的编组方式。

例如:待识别图像为中国银联银行卡的图像,并且包含字符的图像区域为银行卡的卡号区域。当确定出银行卡号的数字数量为16时,可以根据中国银联银行卡号的规律,直接确定银行卡号的编组方式为4-4-4-4,每4个数字连续排列在一起,连续排列的数字串被1个数字的宽度隔开。当确定出银行卡号的数字数量为18时,可以根据中国银联银行卡号的规律,直接确定银行卡号的编组方式为6-6-6,每6个数字连续排列在一起,连续排列的数字串被1个数字的宽度隔开。

对于存在相同字符数量的多种编组方式的情况,确定了字符数量后,还需要基于该字符数量确定编组方式,如何基于字符数量确定编组方式,在后续实施例中详述,这里暂不赘述。

本实施例提供的编组方式确定方法,可以先对待识别图像的包含字符的图像区域进行形态学梯度化计算,再将所得图像的像素行输入到预先训练得到的神经网络模型中,基于神经网络模型的输出得到待识别图像中字符的字符数量,然后基于字符数量确定字符的编组方式。可见,本实施例提供的方案中,不再采用人工方式确定字符的编组方式,而是利用设备进行识别,从而能够提高编组方式的确定效率,减轻工作人员确定编组方式时的工作量。

本发明的一种实现方式中,每一像素行对应的检测结果中可以包括:该像素行中像素点所属字符的数量为各字符数量的概率,上述步骤s104中基于所得到的检测结果,获得待识别图像中字符的字符数量时,可以先针对每一字符数量,计算第一梯度图的各个像素行中像素点所属字符的数量为该字符数量的概率和值,再将最大和值对应的字符数量确定为待识别图像中字符的字符数量。

上述概率的取值可以为0到1之间的数值,上述字符数量可以是预先设定好的,也可以是第一检测模型检测得到的。

如果对应的和值同为最大和值的不同字符数量有两个或两个以上,可以将其中最小的或者最大的字符数量,确定为待识别图像中字符的字符数量,也可以比较上述两个或两个以上的不同字符数量所对应的进行求和计算的概率,将其中概率数值最大的概率所对应的字符数量确定为待识别图像中字符的字符数量。

本实现方式中,计算第一梯度图中像素行对应的字符数量的概率的和值,将最大的和值对应的字符数量确定为字符数量。这样确定字符数量,可以综合多个像素行的检测结果得到第一梯度图的检测结果,并且所需计算量不大。

图2所示为本发明实施例提供的编组方式确定方法的另一种流程示意图,具体可以包括如下步骤:

步骤s201、确定待识别图像中包含字符的图像区域,作为第一图像区域。

步骤s202、对第一图像区域进行形态学梯度化计算,得到第一梯度图。

步骤s203、分别将第一梯度图的每一个像素行输入至第一检测模型中检测每一像素行中像素点所属字符的数量,得到每一个像素行对应的检测结果。

步骤s204、基于所得到的检测结果,获得待识别图像中字符的字符数量。

上述步骤s201-s204与图1所示实施例中s101-s104相同,这里不再赘述。

步骤s205、确定与所获得的字符数量相对应的、用于检测图像中字符编组方式的第二检测模型。

第二检测模型为:预先使用第二样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注编组方式对预设的神经网络模型进行训练得到的、用于检测像素行中像素点字符的编组方式的神经网络模型。

第二样本梯度图为:对第二样本图像进行形态学梯度化计算得到的梯度图。

不同的字符数量可以对应不同的第二检测模型,第二检测模型可以是使用其中包含的字符数量为特定预设字符数量的样本图像训练得到的。

步骤s206、分别将第一梯度图的每一个像素行输入至第二检测模型中检测每一像素行中像素点所属字符的编组方式,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率。

输入至第二检测模型的像素行可以由第一预设数量个像素点组成,第一预设数量可以取值为240或300等数值。如果第一梯度图的像素行,其像素点数量大于第一预设数量,可以对第一梯度图进行缩小处理,使得第一梯度图的宽度为第一预设数量个像素点;如果第一梯度图的像素行,其像素点数量小于第三预设数量,可以使用像素点将像素行补全,补全所用的像素点的像素值为:所表示的梯度值小于预设阈值的像素值。如果在第一梯度图中,从白色到黑色所表示的梯度值依次由大到小,那么在第一梯度图的像素行的像素点数量小于第一预设数量时,可以使用像素值表示为黑色的像素点将该像素行补全成像素点数量为第一预设数量的像素行。

上述概率的取值可以为0到1之间的数值。

步骤s207、针对每一编组方式,计算第一梯度图的各个像素行中像素点所属字符的编组方式为预设编组方式的概率和值。

步骤s208、将最大和值对应的编组方式确定为待识别图像中字符的编组方式。

如果对应的和值同为最大和值的不同编组方式有两个或两个以上,可以比较上述两个或两个以上的不同编组方式所对应的进行求和计算的概率,将其中概率数值最大的概率所对应的编组方式确定为待识别图像中字符的编组方式。

本实施例提供的方案中,先根据字符数量确定相对应的第二检测模型,再将第一梯度图的像素行输入到预先训练得到的神经网络模型中,得到每个像素行对应的编组方式为预设编组方式的概率,然后计算概率和值,将最大和值对应的预设编组方式确定为编组方式。本实施例提供的方案中,使用经过大量样本训练过的神经网络模型,对字符数量确定后的第一梯度图进行检测。预设的不同编组方式的差别特征作为样本对神经网络进行训练,使得模型能够有效的区分不同编组方式,能够应对相同字符数量具有不同编组方式的情况,并且可以准确的确定编组方式。

图3所示为本发明实施例提供的第一检测模型训练方法的一种流程示意图,应用上述第一检测模型可以得到和待识别图像中字符数量相关的检测结果,其训练方法具体包括如下步骤:

步骤s301、获取第一样本图像。

上述第一样本图像可以为灰度图像,也可以为彩色图像。第一样本图像为包含字符的图像。

步骤s302、对第一样本图像进行形态学梯度化计算,得到第一样本梯度图。

处理第一样本图像得到第一样本梯度图的方式可以与步骤s102处理待识别图像得到第一梯度图的方式相同。

步骤s303、根据第一样本梯度图中每一像素行在第一样本图像对应的像素行中像素点所属字符的数量,获得第一样本梯度图中每一像素行中像素点所属字符的标注数量。

在第一样本梯度图中,对于一梯度图的像素行,其标注数量与进行形态学梯度化计算得到该梯度图的一第一样本图像的字符数量相同。例如,第一样本图像为银行卡卡号区域的图像,那么对于图像中的银行卡卡号为16位的第一样本图像,上述标注数量为16;对于图像中的银行卡卡号为18位的第一样本图像,上述标注数量为18。

步骤s304、采用第一样本梯度图中的每一像素行以及每一像素行对应的标注数量,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符数量的神经网络模型,作为第一检测模型。

采用第一样本梯度图中的每一像素行以及每一像素行对应的标注数量,对预设的神经网络模型进行训练时,可以将第一样本梯度图中的每一像素行输入至上述预设的神经网络模型,该神经网络模型对每一像素行进行检测,得到每一像素行的像素点所属字符数量,然后将得到的每一像素行的像素点所属字符数量与该像素行的标注数量进行对比,根据对比结果调整神经网络模型的模型参数,使得调整参数后的神经网络模型检测出的每一像素行的像素点所属字符数量向每一像素行的标注数量靠拢。

本发明的一种实现方式中,上述预设的神经网络模型可以是采用caffe(convolutionarchitectureforfastfeatureembedding,快速特征嵌入的卷积架构)构建的模型。

为了检测第一梯度图的像素行中像素点所属字符的数量,本发明实施例提供了一种神经网络模型的训练方法,可以将第一梯度图的像素行输入至训练得到的模型中,得到每一个像素行对应的检测结果。使用标注了字符数量的样本图像训练过的神经网络模型来检测,能够有效的识别第一梯度图的像素行中像素点所属字符的数量。

图4所示为本发明实施例提供的第二检测模型训练方法的一种流程示意图,应用上述第二检测模型可以得到第一梯度图的每一个像素行中像素点所属字符的编组方式为预设编组方式的概率,其训练方法具体包括如下步骤:

步骤s401、获取第二样本图像。

上述第二样本图像可以为灰度图像,也可以为彩色图像。第二样本图像为包含字符的图像,第二样本图像中的每一图像所包含的字符的数量是确定的。由于第二检测模型与该模型所检测的像素行中像素点所属字符的字符数量相对应,所以第二样本图像中每一图像所包含的字符的数量为第二检测模型所对应的字符数量。例如:识别银行卡号时,为了得到检测19位卡号编组方式的第二检测模型,选用银行卡卡号区域的图像作为第二样本图像,并且第二样本图像中的每一图像所包含的银行卡号数字的数量为19。

步骤s402、对第二样本图像进行形态学梯度化计算,得到第二样本梯度图。

处理第二样本图像得到第二样本梯度图的方式可以与步骤s102处理待识别图像得到第一梯度图的方式相同。

步骤s403、根据第二样本梯度图中每一像素行在第二样本图像对应的像素行中像素点所属字符的编组方式,获得第二样本梯度图中每一像素行中像素点所属字符的标注编组方式。

在第二样本梯度图中,对于一梯度图的像素行,其标注编组方式与进行形态学梯度化计算得到该梯度图的一第二样本图像中字符的编组方式相同。例如:第二样本图像为银行卡卡号区域的图像,并且第二样本图像中的每一图像所包含的银行卡号数字的数量为19。那么对于19个数字全部连续的编组方式的第二样本图像,上述编组方式的标注可以记为0;对于将6-13的编组方式的第二样本图像,上述编组方式的标注可以记为1;对于4-4-4-7的编组方式的第二样本图像,上述编组方式的标注可以记为2;对于4-4-4-4-3的编组方式的第二样本图像,上述编组方式的标注可以记为3。训练过程中,可以使用0、1、2、3这些数字作为编组方式的标注。

步骤s404、采用第二样本梯度图中的每一像素行以及每一像素行对应的标注编组方式,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符的编组方式的神经网络模型,作为第二检测模型。

本发明的一种实现方式中,上述预设的神经网络模型可以是采用caffe构建的模型。

为了检测第一梯度图的像素行中像素点所属字符的编组方式,本发明实施例提供了一种神经网络模型的训练方法,可以将第一梯度图的像素行输入至训练得到的模型中,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率。使用标注了编组方式的样本图像训练过的神经网络模型来检测,能够有效的区分第一梯度图的像素行中像素点所属字符的不同编组方式。

基于同一发明构思,根据本发明上述实施例提供的编组方式确定方法,相应地,本发明实施例还提供了一种编组方式确定装置,其结构示意图如图5所示,具体包括:

区域确定模块501,用于确定待识别图像中包含字符的图像区域,作为第一图像区域;

图获得模块502,用于对所述第一图像区域进行形态学梯度化计算,得到第一梯度图;

结果获得模块503,用于分别将所述第一梯度图的每一个像素行输入至第一检测模型中检测每一像素行中像素点所属字符的数量,得到每一个像素行对应的检测结果,其中,所述第一检测模型为:预先使用第一样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注数量对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所属字符的数量的神经网络模型,所述第一样本梯度图为:对第一样本图像进行形态学梯度化计算得到的梯度图;

数量获得模块504,用于基于所得到的检测结果,获得所述待识别图像中字符的字符数量;

方式确定模块505,用于基于所获得的字符数量确定所述待识别图像中字符的编组方式。

本实施例提供的编组方式确定装置,可以先对待识别图像的包含字符的图像区域进行形态学梯度化计算,再将所得图像的像素行输入到预先训练得到的神经网络模型中,基于神经网络模型的输出得到待识别图像中字符的字符数量,然后基于字符数量确定字符的编组方式。可见,本实施例提供的方案中,不再采用人工方式确定字符的编组方式,而是利用设备进行识别,从而能够提高编组方式的确定效率,减轻工作人员确定编组方式时的工作量。

本发明的一种实现方式中,每一像素行对应的检测结果中包括:

该像素行中像素点所属字符的数量为各字符数量的概率;

所述数量获得模块504,包括:

第一和值计算子模块,用于针对每一字符数量,计算所述第一梯度图的各个像素行中像素点所属字符的数量为该字符数量的概率和值;

数量确定子模块,用于将最大和值对应的字符数量确定为所述待识别图像中字符的字符数量。

本实现方式中,计算第一梯度图中像素行对应的字符数量的概率的和值,将最大的和值对应的字符数量确定为字符数量。这样确定字符数量,可以简洁明了的综合多个像素行的检测结果得到第一梯度图的检测结果,并且所需计算量不大。

本发明的一种实现方式中,所述结果获得模块503包括以下子模块,用于训练得到所述第一检测模型:

图像获取子模块,用于获取第一样本图像;

梯度图获得子模块,用于对所述第一样本图像进行形态学梯度化计算,得到第一样本梯度图;

数量获得子模块,用于根据所述第一样本梯度图中每一像素行在所述第一样本图像对应的像素行中像素点所属字符的数量,获得所述第一样本梯度图中每一像素行中像素点所属字符的标注数量;

模型获得子模块,用于采用所述第一样本梯度图中的每一像素行以及每一像素行对应的标注数量,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符数量的神经网络模型,作为所述第一检测模型。

为了检测第一梯度图的像素行中像素点所属字符的数量,本发明实施例提供了一种神经网络模型的训练方法,可以将第一梯度图的像素行输入至训练得到的模型中,得到每一个像素行对应的检测结果。使用标注了字符数量的样本图像训练过的神经网络模型来检测,能够有效的识别第一梯度图的像素行中像素点所属字符的数量。

本发明的一种实现方式中,所述方式确定模块505,包括:

模型确定子模块,用于确定与所获得的字符数量相对应的、用于检测图像中字符编组方式的第二检测模型,其中,所述第二检测模型为:预先使用第二样本梯度图中的各个像素行和各个像素行中像素点所属字符的标注编组方式对预设的神经网络模型进行训练得到的、用于检测像素行中像素点所述字符的编组方式的神经网络模型,所述第二样本梯度图为:对第二样本图像进行形态学梯度化计算得到的梯度图;

概率获得子模块,用于分别将所述第一梯度图的每一个像素行输入至所述第二检测模型中检测每一像素行中像素点所属字符的编组方式,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率;

第二和值计算子模块,用于针对每一编组方式,计算所述第一梯度图的各个像素行中像素点所属字符的编组方式为预设编组方式的概率和值;

方式确定子模块,用于将最大和值对应的编组方式确定为所述待识别图像中字符的编组方式。

本实现方式中,先根据字符数量确定相对应的第二检测模型,再将第一梯度图的像素行输入到预先训练得到的神经网络模型中,得到每个像素行对应的编组方式为预设编组方式的概率,然后计算概率和值,将最大和值对应的预设编组方式确定为编组方式。本实现方式中,使用经过大量样本训练过的神经网络模型,对字符数量确定后的第一梯度图进行检测。预设的不同编组方式的差别特征作为样本对神经网络进行训练,使得模型能够有效的区分不同编组方式,能够应对相同字符数量具有不同编组方式的情况,并且可以准确的确定编组方式。

本发明的一种实现方式中,所述概率获得子模块包括以下单元,用于训练得到所述第二检测模型:

图像获取单元,用于获取第二样本图像;

梯度图获得单元,用于对所述第二样本图像进行形态学梯度化计算,得到第二样本梯度图;

方式获得单元,用于根据所述第二样本梯度图中每一像素行在所述第二样本图像对应的像素行中像素点所属字符的编组方式,获得所述第二样本梯度图中每一像素行中像素点所属字符的标注编组方式;

模型获得单元,用于采用所述第二样本梯度图中的每一像素行以及每一像素行对应的标注编组方式,对预设的神经网络模型进行训练,得到用于检测图像中每一像素行的像素点所属字符的编组方式的神经网络模型,作为所述第二检测模型。

为了检测第一梯度图的像素行中像素点所属字符的编组方式,本发明实施例提供了一种神经网络模型的训练方法,可以将第一梯度图的像素行输入至训练得到的模型中,得到每一个像素行中像素点所属字符的编组方式为预设编组方式的概率。使用标注了编组方式的样本图像训练过的神经网络模型来检测,能够有效的区分第一梯度图的像素行中像素点所属字符的不同编组方式。

基于同一发明构思,根据本发明上述实施例提供的编组方式确定方法,相应地,本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,

存储器603,用于存放计算机程序;

处理器601,用于执行存储器603上所存放的程序时,实现上述实施例中任一编组方式确定方法的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本实施例提供的编组方式确定电子设备,可以先对待识别图像的包含字符的图像区域进行形态学梯度化计算,再将所得图像的像素行输入到预先训练得到的神经网络模型中,基于神经网络模型的输出得到待识别图像中字符的字符数量,然后基于字符数量确定字符的编组方式。可见,本实施例提供的方案中,不再采用人工方式确定字符的编组方式,而是利用设备进行识别,从而能够提高编组方式的确定效率,减轻工作人员确定编组方式时的工作量。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一编组方式确定方法的步骤。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一编组方式确定方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质和计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1