[0001]
本申请涉及人工智能技术领域,尤其涉及一种证件信息的识别方法、装置、终端设备及计算机可读存储介质。
背景技术:[0002]
为了保证社会活动的正常有序,对进入特定场所或区域的用户进行用户信息采集和实名登记,例如进入酒店、金融大厦和住宅小区等。目前的信息登记主要包括人工手动登记和采用光学字符识别(optical character recognition,ocr)技术进行信息提取和信息录入。
[0003]
在相关技术中,由于每个人的身份证件上的用户信息具有较大差异,以及身份证件采用汉字记载用户信息,而汉字的结构复杂和形近字多,所以当前ocr技术在识别部分字段过程中,不仅需要消耗较长的时间,而且识别准确度不高。可见,当前ocr技术存在识别效率低的问题。
技术实现要素:[0004]
有鉴于此,本申请实施例提供了一种证件信息的识别方法、装置、终端设备及计算机可读存储介质,以解决现有技术中ocr技术存在识别效率低的问题。
[0005]
本申请实施例的第一方面提供了一种证件信息的识别方法,包括:
[0006]
对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征;
[0007]
利用预先构建好的第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用预先构建好的第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数;
[0008]
将第一信息和第二信息作为证件图像的证件信息。
[0009]
本申请实施例提供的一种证件信息的识别方法,通过对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征,例如数字和字母为小字符集,汉字为大字符集,从而能够针对不同大小的字符集提取字符特征,进而能够对不同字符类型的证件信息进行识别;由于小字符集的字符较少,大字符集的字符较多,而同一网络无法兼顾第二特征和第一特征的识别速度和识别准确度,这样就无法使得网络的识别性能达到最优,所以本申请利用第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数,并将第一信息和第二信息作为证件图像的证件信息,从而充分考虑各字符识别任务的难易程度,选择复杂程度不同的网络结构对字符特征进行识别,以能够保证识别精度和减小识别耗时,进而提高识别效率。
[0010]
本申请实施例的第二方面提供了一种证件信息的识别装置,包括:
[0011]
提取模块,用于对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征;
[0012]
识别模块,用于利用预先构建好的第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用预先构建好的第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数;
[0013]
作为模块,用于将第一信息和第二信息作为证件图像的证件信息。
[0014]
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在终端设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方案提供的证件信息的识别方法的各步骤。
[0015]
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提供的证件信息的识别方法的各步骤。
附图说明
[0016]
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]
图1是本申请实施例提供的一种证件信息的识别方法的实现流程图;
[0018]
图2是本申请一实施例提供的一种证件信息的识别方法中步骤s101的具体实现流程图;
[0019]
图3是本申请另一实施例提供的一种证件信息的识别方法的实现流程图;
[0020]
图4是本申请实施例提供的一种证件信息的识别装置的结构框图;
[0021]
图5是本申请实施例提供的一种终端设备的结构框图。
具体实施方式
[0022]
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0023]
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0024]
在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0025]
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、
“
在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0026]
如背景技术相关记载,由于每个人的身份证件上的用户信息具有较大差异,以及身份证件采用汉字记载用户信息,而汉字的结构复杂和形近字多,所以当前ocr技术在识别部分字段过程中,不仅需要消耗较长的时间,而且识别准确度不高。可见,当前ocr技术存在识别效率低的问题。
[0027]
有鉴于此,本申请实施例提供的一种证件信息的识别方法,通过对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征,例如数字和字母为小字符集,汉字为大字符集,从而能够针对不同大小的字符集提取字符特征,进而能够对不同字符类型的证件信息进行识别;由于小字符集的字符较少,大字符集的字符较多,而同一网络无法兼顾第二特征和第一特征的识别速度和识别准确度,这样就无法使得网络的识别性能达到最优,所以本申请利用第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数,并将第一信息和第二信息作为证件图像的证件信息,从而充分考虑各字符识别任务的难易程度,选择复杂程度不同的网络结构对字符特征进行识别,以能够保证识别精度和减小识别耗时,进而提高识别效率。
[0028]
请参阅图1,图1示出了本申请实施例提供的一种证件信息的识别方法的实现流程图。本申请实施例提供的证件信息的识别方法的执行主体为终端设备,终端设备包括但不限于智能手机、平板电脑、桌上型计算机、超级计算机、个人数字助理等终端。如图1所示的证件信息的识别方法包括步骤s101至s103,详述如下。
[0029]
s101,对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征。
[0030]
在本实施例中,终端设备预先获取证件图像。证件图像为证件的二维图像,证件图像可以包括证件正面图像,还可以包括证件背面图像,证件包括但不限于身份证、军官证、护照、驾照、港澳通行证和台胞回乡证等携带身份标识的身份证件。可以理解的是,证件图像可以由终端设备上的摄像组件或扫描组件采集得到,也可以由其他终端设备上的摄像组件或扫描组件采集后移植至本终端设备。目标文本区域为证件上显示的证件信息所在的区域,证件信息为目标文本区域内所显示的文本,该文本可以是汉字、英文字母、数字等。一般而言,证件上显示的证件信息包括姓名、性别、住址、证件编号和证件有效期等,且每个证件信息在不同行或不同列。因此可以根据不同证件信息在不同行或不同列,将证件图像划分为多个目标文本区域。
[0031]
字符特征为目标文本区域内每个字符的图形特征,如字符的轮廓特征、特征点的坐标位置等。根据目标文本区域中文本的字符类型,将每个目标文本区域内的字符特征划分为第二特征或第一特征。字符类型包括汉字、字母、数字等,其中数字只有10个,英文字母只有52个,所以将数字和英文字母作为小字符集;而汉字中常用的第一级汉字有3755个,并且汉字结构复杂,形近字多,所以将汉字作为大字符集。示例性地,证件以身份证为例,身份证上的身份证号码与证件有效期是都是数字或字母,而身份证上每个身份信息的位置是固
定的,所以将身份证号码与证件有效期对应的目标文本区域所提取的字符特征作为第一特征,将姓名与住址等包含汉字的目标文本区域所提取的字符特征作为第二特征。
[0032]
终端设备对证件图像中的目标文本区域进行特征提取,为对目标文本区域的文本图像进行向量化的过程。示例性,终端设备识别目标文本区域中的字符轮廓,并根据字符轮廓确定每个字符的轮廓特征点,以及基于预设坐标系,确定每个轮廓特征点的坐标位置;根据轮廓特征点的坐标位置,对每个字符轮廓的轮廓特征点进行向量化,得到字符特征。可以理解的是,针对数字、字母和汉字,均可采用上述示例提取第一特征和第二特征,其中由于汉字结构复杂且形近字多,所以汉字的轮廓特征点相对于数字和字母通常会更多,第二特征相对于第一特征更加复杂,因而第二特征的识别难道更大。因此,本实施例针对不同大小的字符集提取字符特征,进而能够对不同字符类型的证件信息进行识别,以有针对性的不同证件信息进行准确识别。
[0033]
s102,利用预先构建好的第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用预先构建好的第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数。
[0034]
在本实施例中,终端设备预先存储有第一轻量级卷积神经网络和第二轻量级卷积神经网络。第一轻量级卷积神经网络和第二轻量级卷积神经网络均是使用机器学习算法,对证件图像样本进行训练得到的。可以理解的是,该第一轻量级卷积神经网络或第二轻量级卷积神经网络均可以由终端预先训练好,也可以由其他设备预先训练好后将该第一轻量级卷积神经网络或第二轻量级卷积神经网络对应的文件移植至本终端中。也就是说,训练该第一轻量级卷积神经网络或第二轻量级卷积神经网络的执行主体与使用该第一轻量级卷积神经网络或第二轻量级卷积神经网络的执行主体可以是相同的,也可以是不同的。
[0035]
由于小字符集的字符较少,大字符集的字符较多,而同一网络无法兼顾第二特征和第一特征的识别速度和识别准确度,这样就无法使得网络的识别性能达到最优。所以为了减少第一特征的识别耗时以及提高识别准确度,采用轻量化的第一轻量级卷积神经网络对第一特征进行识别,为了既提升计算性能又能保证网络能充分提取图像的特征,采用比第一轻量级卷积神经网络的网络层更多的第二轻量级卷积神经网络对大字符即特征进行识别。
[0036]
第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数,所以第二轻量级卷积神经网络具有更加宽广的视野,对复杂特征的提取能力更强,所以采用第二轻量级卷积神经网络对第二特征进行识别,能够更加充分提取字符特征,提高第二特征的识别准确度。而第一轻量级卷积神经网络的网络层相对于第二轻量级卷积神经网络更少,所以采用第一轻量级卷积神经网络对第一特征进行识别,能够降低识别过程的计算量和识别耗时,提高第一特征的识别效率。
[0037]
本实施例通过将适用于第一特征识别过程的第一轻量级卷积神经网络和适用于第二特征的第二轻量级卷积神经网络引入证件信息识别系统中,从而充分考虑各字符识别任务的难易程度,选择复杂程度不同的网络结构对字符特征进行识别,以能够保证识别精度和减小识别耗时,进而提高识别效率。可以理解,由于两者均是轻量级网络,所以后续也可在此基础上进一步优化,作为移动端的底层识别算法。
[0038]
在一实施例中,第一轻量级卷积神经网络的构建过程,包括:基于mobilenet网络和ctc算法构建第一预设网络层数的第一卷积神经网络,第一卷积神经网络采用反转残差结构对第一卷积神经网络的卷积层进行通道扩张;利用预设的第一特征样本,对第一卷积神经网络进行训练,直至第一卷积神经网络达到第一预设收敛条件,得到第一轻量级卷积神经网络。
[0039]
在本实施例中,mobilenet网络是专注于移动端或者嵌入式设备中的轻量级卷积神经网络,其能够实现深度可分离卷积。深度可分离卷积将传统卷积的两步进行分离开来,分别是depthwise和pointwise,其通过改变depthwise卷积层或pointwise卷积层的通道数,以达到降低卷积过程的计算量的目的。具体地,本实施例采用反转残差结构对depthwise卷积层的通道数进行扩张,再对利用通道扩张后depthwise卷积层对第一特征进行深度卷积操作,最后再利用pointwise卷积层将通道进行压缩,从而使得卷积前后的通道数一致。可以理解的是,反转残差结构是“通道扩张-卷积-通道压缩”的过程。示例性,采用mobilenet v2网络中的反转残差结构bneck对大小为1*1的depthwise卷积层进行通道扩张,然后使用大小为3*3的depthwise卷积层对第一特征进行深度卷积,得到第一特征对应的深度卷积结果,最后使用大小为1*1的pointwise卷积将深度卷积结果的通道数压缩为原始大小,从而降低第一特征的识别耗时,以及对通道扩张能够提高第一特征的识别准确度。
[0040]
ctc(connectionist temporal classification)算法是序列标注问题中的一种损失函数,其能够用来解决时序类数据的分类问题。也就是说,当原始证件图片样本中的内容为字符串形式时,即原始证件图片样本中包含多个字符时,通过ctc算法能够根据原始证件图片样本中字符串的特征分类,将不同字符的字符特征从中划分出来,并根据各字符特征判定各个特征最大概率时对应的字符内容。
[0041]
第一特征样本为数字和字母组成的样本图像,预设收敛条件为表示网络训练完成的条件,例如损失函数得到的损失值小于预设损失阈值,则表示收敛。示例性地,将样本图像输入第一卷积神经网络中进行处理,得到该样本图像对应的数字和/或字母;计算输入的样本图像与数字和/或字母之间的损失值,当该损失值大于或等于预设损失阈值时,调整第一卷积神经网络中的网络参数,并返回执行将样本图像输入第一卷积神经网络中进行处理,得到该样本图片对应的数字和/或字母的步骤;当该损失值小于预设损失阈值时,表示第一卷积神经网络训练完成,得到训练好的第一轻量级卷积神经网络。可以通俗理解为,损失值越小表示该神经网络提取到的特征向量越准确,这样才能根据提取到的特征向量还原到最接近样本图片的数字和/或字母。
[0042]
可选地,第一卷积神经网络包括浅层卷积网络和深层卷积网络,浅层卷积网络为网络层位置在第一卷积神经网络中的预设网络层位置之前的卷积层,浅层卷积网络采用relu6函数作为激活函数,深层卷积网络为网络层位置在预设网络层位置或者在预设网络层位置之后的卷积层,深层卷积网络采用hard-swish函数作为激活函数。
[0043]
在本实施例中,为了减少计算延时,浅层网络采用relu6作为激活函数,为了减少深层网络对计算资源的消耗以及提高网络的整体精度,在深层网络采用hard-swish激活函数代替relu6激活函数作为新的激活函数。hard-swish激活函数的计算公式为可以理解的是,在网络训练阶段,采用以上molibenet网络和ctc
算法对身份证号码识别模型和有效期去识别模型进行训练,其中身份证号码识别模型的输入大小可以为480*32,有效期识别模型的输入大小可以为416*32。
[0044]
在一实施例中,第二轻量级卷积神经网络的构建过程,包括:基于mobilenet网络和ctc算法构建第二预设网络层数的第二卷积神经网络,第二卷积神经网络采用残差结构对第二卷积神经网络的卷积层进行通道压缩;利用预设的第二特征样本,对第二卷积神经网络进行训练,直至第二卷积神经网络达到第二预设收敛条件,得到第二轻量级卷积神经网络。
[0045]
在本实施例中,第二轻量级卷积神经网络的构建过程可参照第一轻量级卷积神经网络的构建过程,在此不再赘述。需要说明的是,第二卷积神经网络采用残差结构对第二卷积神经网络的卷积层进行通道压缩,残差结构是与反转残差结构相反的结构,其可以为residual。残差结构是对depthwise卷积层的通道数进行压缩,再对利用通道压缩后depthwise卷积层对第二特征进行深度卷积操作,得到第二特征对应的深度卷积结果,最后再利用pointwise卷积层对深度卷积结果的通道进行扩张,从而使得卷积前后的通道数一致,也就是说,反转残差结构是“通道压缩-卷积-通道扩张”的过程。由于第二特征相对于第一特征更为复杂,所以为了减少识别过程的计算量,将第二特征进行通道压缩,以提高识别效率。可以理解的是,在网络训练阶段,采用上述molibenet网络和ctc算法训练姓名(地址)识别模型、民族识别模型,其中姓名(地址)输入大小可以为256*32,民族识别模型输入大小可以为160*32。
[0046]
s103,将第一信息和第二信息作为证件图像的证件信息。
[0047]
在本实施例中,将基于证件图像上不同大小的字符特征识别得到的第一信息和第二信息作为证件图像的证件信息,反馈给用户。
[0048]
请参阅图2,图2是本申请一实施例提供的一种证件信息的识别方法中步骤s101的实现流程图。相对于图1对应的实施例,本实施例提供的证件信息的识别方法中步骤s101具体包括步骤s201至s202。详述如下:
[0049]
s201,将证件图像与预设证件模板图像进行匹配,确定出证件图像中的目标文本区域,目标文本区域包括第一文本区域和第二文本区域。
[0050]
在本实施例中,由于大部分的证件是刚体,各字段关键字(如蓝色姓名、性别等汉字)的位置固定的,所以可以根据关键字的位置信息找到需要识别的文字的位置(如具体的身份证号码区域)。可选地,利用模板匹配算法(如基于opencv的matchtemplate函数)将证件图像与预设证件模板图像进行匹配,确定出证件图像中的姓名、性别、民族住址、身份证号码的目标文本区域。
[0051]
s202,对第一文本区域和第二文本区域进行特征提取,得到第一特征和第二特征。
[0052]
在本实施例中,从证件图像中分检出的文字图像,由计算机将其图形、图像转变成文字的标准代码,是让计算机“认字”的关键。本实施例针对图像中的文字图像,识别出文字的轮廓以及每个特征点的坐标位置,并通过向量化生成连续性特征,从而提取出文字的笔画、特征点、投影信息、点的区域分布等特征。
[0053]
在一实施例中,对第一文本区域和第二文本区域进行特征提取,得到第一特征和第二特征,包括:对第一文本区域和第二文本区域分别进行字符轮廓识别,分别得到第一文本区域和第二文本区域的字符轮廓;提取每个字符轮廓的轮廓特征点,得到每个轮廓特征
点的坐标位置;根据轮廓特征点的坐标位置,对每个字符轮廓的轮廓特征点进行向量化,得到第一特征和第二特征。因此,本实施例针对不同大小的字符集提取字符特征,进而能够对不同字符类型的证件信息进行识别,以有针对性的不同证件信息进行准确识别。
[0054]
请参阅图3,图3是本申请另一实施例提供的一种证件信息的识别方法的实现流程图。相对于图1对应的实施例,本实施例提供的证件信息的识别方法在步骤s101之前还包括步骤s301至步骤s303。详述如下:
[0055]
s301,获取原始证件图像,并基于局部特征点检测算法,检测目标证件在原始证件图像中的位置。
[0056]
在本实施例中,由于拍摄证件图像是无法保证摄像设备的摄像方向完全垂直于证件,拍照出来的图片不可避免的产生倾斜,因此需要文字识别软件进行校正。示例性地,利用基于sift特征的算法进行特征点匹配,sift特征点检测算法是一种检测局部特征的算法,它是通过求一幅图中的特征点及其有关尺度和方向的描述子得到特征并进行图像特征点匹配,找到输入的拍摄图片中证件的位置。
[0057]
s302,根据目标证件在原始证件图像中的位置,截取原始证件图像中的目标证件,得到目标证件图像。
[0058]
在本实施例中,将拍摄图片中的证件图像从中截取出来,以去除其他不必要的图像因素,以便于证件信息的快速识别。
[0059]
s303,根据预设证件尺寸,对目标证件图像进行仿射变换,得到符合预设证件尺寸的证件图像。
[0060]
在本实施例中,利用仿射变换原理将目标证件图像进行矫正,得到统一形状和大小的证件图像。可以理解的是,仿射变换过程包括但不限于缩放、旋转、镜像和放大等。进一步地,针对证件图像的预处理还可以包括二值化,噪声去除等。具体地,摄像头拍摄的图片大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,可以简单的分为前景与背景,为了让计算机更快的更好的识别文字,需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,以得到二值化图像。由于原始图像周围可能有其他背景信息存在,所以通过去掉原始图像中的显见噪声(干扰)。
[0061]
请参阅图4,图4是本申请实施例提供的一种证件信息的识别装置的结构框图。本实施例中该装置包括的各模块用于执行图1至图3对应的实施例中的各步骤。具体请参阅图1至图3以及图1至图3所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图4,证件信息的识别装置包括:
[0062]
提取模块401,用于对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二特征;
[0063]
识别模块402,用于利用第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数;
[0064]
作为模块403,用于将第一信息和第二信息作为证件图像的证件信息。
[0065]
本申请实施例提供的一种证件信息的识别装置,通过提取模块401对证件图像中的目标文本区域进行特征提取,得到证件图像的字符特征,字符特征包括第一特征和第二
特征,例如数字和字母为小字符集,汉字为大字符集,从而能够针对不同大小的字符集提取字符特征,进而能够对不同字符类型的证件信息进行识别;由于小字符集的字符较少,大字符集的字符较多,而同一网络无法兼顾第二特征和第一特征的识别速度和识别准确度,这样就无法使得网络的识别性能达到最优,所以本申请通过识别模块402利用第一轻量级卷积神经网络根据第一特征对证件图像进行信息识别,得到第一信息,以及利用第二轻量级卷积神经网络根据第二特征对证件图像进行信息识别,得到第二信息,其中第二轻量级卷积神经网络的网络层数大于第一轻量级卷积神经网络的网络层数,并通过作为模块403将第一信息和第二信息作为证件图像的证件信息,从而充分考虑各字符识别任务的难易程度,选择复杂程度不同的网络结构对字符特征进行识别,以能够保证识别精度和减小识别耗时,进而提高识别效率。
[0066]
作为本申请一实施例,提取模块401还用于:
[0067]
将证件图像与预设证件模板图像进行匹配,确定出证件图像中的目标文本区域,目标文本区域包括第一文本区域和第二文本区域;
[0068]
对第一文本区域和第二文本区域进行特征提取,得到第一特征和第二特征。
[0069]
作为本申请一实施例,提取模块401还用于:
[0070]
对第一文本区域和第二文本区域分别进行字符轮廓识别,分别得到第一文本区域和第二文本区域的字符轮廓;
[0071]
提取每个字符轮廓的轮廓特征点,得到每个轮廓特征点的坐标位置;
[0072]
根据轮廓特征点的坐标位置,对每个字符轮廓的轮廓特征点进行向量化,得到第一特征和第二特征。
[0073]
作为本申请一实施例,证件信息的识别装置还包括:
[0074]
获取模块,用于获取原始证件图像,并基于局部特征点检测算法,检测目标证件在原始证件图像中的位置;
[0075]
截取模块,用于根据目标证件在原始证件图像中的位置,截取原始证件图像中的目标证件,得到目标证件图像;
[0076]
变换模块,用于根据预设证件尺寸,对目标证件图像进行仿射变换,得到符合预设证件尺寸的证件图像。
[0077]
作为本申请一实施例,证件信息的识别装置还包括第一构建模块,用于:
[0078]
基于mobilenet网络和ctc算法构建第一预设网络层数的第一卷积神经网络,第一卷积神经网络采用反转残差结构对第一卷积神经网络的卷积层进行通道扩张;
[0079]
利用预设的第一特征样本,对第一卷积神经网络进行训练,直至第一卷积神经网络达到第一预设收敛条件,得到第一轻量级卷积神经网络。
[0080]
作为本申请一实施例,第一卷积神经网络包括浅层卷积网络和深层卷积网络,浅层卷积网络为网络层位置在第一卷积神经网络中的预设网络层位置之前的卷积层,浅层卷积网络采用relu6函数作为激活函数,深层卷积网络为网络层位置在预设网络层位置或者在预设网络层位置之后的卷积层,深层卷积网络采用hard-swish函数作为激活函数。
[0081]
作为本申请一实施例,证件信息的识别装置还包括第二构建模块,用于:
[0082]
基于mobilenet网络和ctc算法构建第二预设网络层数的第二卷积神经网络,第二卷积神经网络采用残差结构对第二卷积神经网络的卷积层进行通道压缩;
[0083]
利用预设的第二特征样本,对第二卷积神经网络进行训练,直至第二卷积神经网络达到第二预设收敛条件,得到第二轻量级卷积神经网络。
[0084]
应当理解的是,图4示出的证件信息的识别装置的结构框图中,各模块用于执行图1至图3对应的实施例中的各步骤,而对于图1至图3对应的实施例中的各步骤已在上述实施例中进行详细解释,具体请参阅图1至图3以及图1至图3所对应的实施例中的相关描述,此处不再赘述。
[0085]
图5是本申请一实施例提供的一种终端设备的结构框图。如图5所示,该实施例的终端设备50包括:处理器51、存储器52以及存储在存储器52中并可在处理器51上运行的计算机程序53,例如证件信息的识别方法的程序。处理器51执行计算机程序53时实现上述各个证件信息的识别方法各实施例中的步骤,例如图1所示的s101至s103,或者图2和图3所示的s201至s202以及s301至s303。或者,处理器51执行计算机程序53时实现上述图4对应的实施例中各模块的功能,例如,图4所示的模块401至403的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
[0086]
示例性的,计算机程序53可以被分割成一个或多个单模块,一个或者多个模块被存储在存储器52中,并由处理器51执行,以完成本申请证件信息的识别的步骤。一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序53在终端设备50中的执行过程。例如,计算机程序53可以被分割成提取模块、识别模块以及作为模块,各模块具体功能如上。
[0087]
本领域技术人员可以理解,图5仅仅是终端设备50的示例,并不构成对终端设备50的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备50还可以包括输入输出设备、网络接入设备、总线等。
[0088]
处理器51可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0089]
存储器52可以是终端设备50的内部存储单元,例如终端设备50的硬盘或内存。存储器52也可以是终端设备50的外部存储设备,例如终端设备50上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器52还可以既包括终端设备50的内部存储单元也包括外部存储设备。存储器52用于存储计算机程序以及终端设备所需的其他程序和数据。存储器52还可以用于暂时地存储已经输出或者将要输出的数据。
[0090]
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。