一种用于财务报表的日期检测与识别方法及装置与流程

文档序号:15348641发布日期:2018-09-04 23:03阅读:153来源:国知局

本发明涉及金融服务的人工智能检测与识别技术领域,特别涉及一种用于财务报表的日期检测与识别方法及装置。



背景技术:

当前财务报表的数据分析基本上都是基于人工来审阅来完成,不仅增加人力负担,而且效率比较低下,长时间工作也会导致错误率提高,在一定程度上已经减缓了银行、信审的工作效率和业务开展。如何在节约人工成本的前提下,提高日期检测识别的准确率,从而有效地为银行、审计、税务提供自动化服务是急需解决的技术问题。



技术实现要素:

本发明的目的是:提出一种用于财务报表的日期检测与识别方法及装置,自动审核报表上的日期与服务器存档内容一致,以满足如今对银行财务报表审批工作效率、准确度的需求。

本发明解决其技术问题所采用的技术方案是:

一种用于财务报表的日期检测与识别方法,包括如下步骤:

s1、从服务器下载报表图像;

s2、对所述报表图像进行图片校正处理,使其水平;

s3、采用基于深度学习的日期目标检测模型,检测所述报表图像中的日期区域,判断日期区域是否存在,若存在则记录此条标志为0,提取日期区域;若不存在则记录此条标志为1,并保存相关图片,进入识别流程;

s4、采用基于深度学习的字符分割识别模型,对已检测到的日期区域内的字符进行检测识别,并输出识别结果;

s5、校验所述识别结果中的日期合法性,所述日期合法性包括长度合法性和数值合法性;

s6、若日期校验结果合法,则以字符串的形式输出识别结果。

进一步,所述图片校正处理的步骤如下:

s21、将所述报表图像的尺寸调整至规定尺寸;

s22、将调整后的所述报表图像由三通道彩色图像转化为灰度图像,并对其进行噪声消除操作;

s23、对消除噪声后的所述报表图像进行边缘检测,对检测后的所述报表图像进行形态学处理,消除毛刺和修复断线。

s24、采用霍夫直线法提取所述报表图像中的直线;

s25、统计所得直线的角度,其角度最多的直线,即为图片偏转的角度;

s26、用所得角度对所述报表图像进行校正,使其水平。

进一步,所述日期目标检测模型的获取步骤如下:

s31、准备一批标准的财务报表图像;

s32、按照一定的宽高比截取带有日期区域的图像区域作为样本图像;

s33、采用矩形框在所述样本图像中标注日期所在的位置;

s34、使用标注好的数据训练目标检测深度神经网络模型,获得日期目标检测模型。

进一步,所述字符分割识别模型的获取步骤如下:

s41、基于s32用矩形框标记的日期区域,作为标注样本;

s42、采用矩形框在日期图像上标记日期中的所有字符的位置和类别;

s43、根据s42中标注的位置和类别,计算出水印日期图像上每个像素点所属的类别,生成一幅和标注日期图像尺寸相同的标签图像;

s44、使用所述水印日期图像和标签图像构成的数据集,训练场景分割深度神经网络模型,获得字符分割识别模型。

进一步,所述日期的校验方法为:

s51、根据两个分隔符“-”的位置,将识别结果分成年、月、日三个字段;

s52、判断年、月、日字段的字符长度是否分别为4、2、2,且年、月、日数值必须在自然年、月、日的数值范围内。

一种用于财务报表的日期检测与识别装置,包括目标检测模块和字符识别模块;所述目标检测模块包括图像校正单元、候选区域获取单元和日期检测单元;所述字符识别模块包括字符分割单元、字符识别单元和日期校验单元;

所述图像校正单元,用于对所述报表图像进行校正处理,使其水平,并将校正后的报表图像传给所述候选区域获取单元;

所述候选区域获取单元,用于将所述报表图像进行旋转,并选择1/5宽度的区域作为候选区域;

所述日期检测单元,用于采用基于深度学习的日期检测模型对所述候选区域进行检测,提取日期区域;

所述字符分割单元,用于将标注出所述日期区域中的所有字符位置和类别;

所述字符识别单元,用于利用已标注好的字符位置和类别,计算出日期图像上每个像素点所属的类别;

所述日期校验单元,用于校验识别结果中日期信息的合法性,并以字符串形式输出识别结果。

本发明的有益效果是:本发明主要应用财务报表中的日期字符识别,其实现了自动检测财务报表中的日期区域及准确识别日期字符。既节约了人力,又保证了校验工作的公正、公开。

附图说明

图1是本发明的日期检测与识别方法的基本流程图。

图2是目标检测模块的结构示意图。

图3是字符识别模块的结构示意图。

具体实施方式

以下结合附图,对本发明做进一步说明。

本发明的方法的实施流程如图1所示,一种用于财务报表的日期检测与识别方法,包括如下步骤:

s1、从服务器下载报表图像;

s2、对所述报表图像进行图片校正处理,使其水平;

其中,图片校正处理的步骤如下:

s21、将所述报表图像的尺寸调整至规定尺寸;

s22、将调整后的所述报表图像由三通道彩色图像转化为灰度图像,并对其进行噪声消除操作;

s23、对消除噪声后的所述报表图像进行边缘检测,对检测后的所述报表图像进行形态学处理,消除毛刺和修复断线。

s24、采用霍夫直线法提取所述报表图像中的直线;

s25、统计所得直线的角度,其角度最多的直线,即为图片偏转的角度;

s26、用所得角度对所述报表图像进行校正,使其水平;

s3、采用基于深度学习的日期目标检测模型,检测所述报表图像中的日期区域,判断日期区域是否存在,若存在则记录此条标志为0,提取日期区域;若不存在则记录此条标志为1,并保存相关图片,进入识别流程;

其中,日期目标检测模型的获取步骤如下:

s31、准备一批标准的财务报表图像;

s32、按照一定的宽高比截取带有日期区域的图像区域作为样本图像;

s33、采用矩形框在所述样本图像中标注日期所在的位置;

s34、使用标注好的数据训练目标检测深度神经网络模型,获得日期目标检测模型;

s4、采用基于深度学习的字符分割识别模型,对已检测到的日期区域内的字符进行检测识别,并输出识别结果;

其中,字符分割识别模型的获取步骤如下:

s41、基于s32用矩形框标记的日期区域,作为标注样本;

s42、采用矩形框在日期图像上标记日期中的所有字符的位置和类别;

s43、根据s42中标注的位置和类别,计算出水印日期图像上每个像素点所属的类别,生成一幅和标注日期图像尺寸相同的标签图像;

s44、使用所述水印日期图像和标签图像构成的数据集,训练场景分割深度神经网络模型,获得字符分割识别模型;

s5、校验所述识别结果中的日期合法性,所述日期合法性包括长度合法性和数值合法性;

其中,所述日期的校验方法为:

s51、根据两个分隔符“-”的位置,将识别结果分成年、月、日三个字段;

s52、判断年、月、日字段的字符长度是否分别为4、2、2,且年、月、日数值必须在自然年、月、日的数值范围内;

s6、若日期校验结果合法,则以字符串的形式输出识别结果。

本发明的一种用于财务报表的日期检测与识别装置,包括目标检测模块和字符识别模块。

其中,目标检测模块的结构如图2所示,包括图像校正单元、候选区域获取单元和日期检测单元。

其中,字符识别模块的结构如图3所示,包括字符分割单元、字符识别单元和日期校验单元。

具体的讲,本装置的工作方法如下:

首先利用图像校正单元对报表图像进行校正处理,使其水平;然后,利用候选区域获取单元将报表图像进行旋转,并选择1/5宽度的区域作为候选区域,利用日期检测单元在候选区域中使用基于深度学习的日期检测模型进行检测,提取日期区域,这样可以提高检测速度和效率。利用字符分割单元将标注出所述日期区域中的所有字符位置和类别;利用字符识别单元,在已标注好的字符位置和类别上,计算出日期图像上每个像素点所属的类别;利用日期校验单元校验识别结果中日期信息的合法性,并以字符串形式输出识别结果。

目标检测模块首先将候选区域图像输入区域检测模型,首先得到n个一维数组[class,x,y,width,height],数组第一个元素代表对象类别,是日期区域则为1,不是则为0,数组后四个元素表征目标对象所在矩形区域,x,y代表矩形左上角点坐标,width代表矩形宽度,height代表矩形高度。每个数组均对应一个区域,利用区域矩形框面积大小构建区域远近信息,以矩形框面积最大的数组作为检测模块输出,然后通过矩形框位置信息从图像中提取日期区域。此方法可有效地剔出背景中其它干扰区域。

其中,基于深度学习网络的日期目标检测模型的获取方法如下:

准备一批标准的财务报表图像,图像的整洁性能够在一定程度上反映图像检测的效果,尽量选择实际使用时的图像,覆盖面越广效果会越好。然后按照一定的宽高比截取带有日期区域的图像区域作为样本。采用矩形框在样本图像中标注日期所在的位置,标注的位置尽可能比较全的覆盖日期所在的区域。使用标注好的数据训练目标检测深度神经网络模型,获得日期目标检测模型(公式常识,兹不赘述)。

采用基于深度学习网络的字符分割识别模型识别检测到的日期图像中的日期信息。识别模型的输出结果可表示为和日期图像尺寸相同的灰度图像。灰度图中,每一个点的灰度值只有n+1种可能的取值,其中n表示字符的类别数,此外,背景类也占有一种灰度值。本方案中,字符的类别包括“0”到“9”十个数字以及符号“-”,故n的取值为11,则灰度图中每个点的取值有12种可能,对应训练字符分割识别模型的12个标签,灰度值为0表示该点属于背景,灰度值1至10分别表示该点属于字符“0”到“9”,灰度值11表示符号“-”。至此预测出每个像素点的类别,再根据像素点的分布关系,即可预测出字符的位置和类别。具体操作如下,首先对字符分割识别模型输出的灰度图分别用上述11种灰度值过滤,得到11张二值掩码图,例如过滤灰度值为3,则将灰度值为3的点的掩码值置为255,其余的点都置为0。再对二值掩码图做形态学膨胀,膨胀操作核选择矩形核,其长宽均设置为掩码图宽度的百分之一。根据8邻域的连通性,将掩码值为255的点分成若干个互不相连的点集,计算点集内点的个数及其外接矩形,并记录对应的灰度值标签。按照点集内点的个数从大到小排序,前十个点集对应的外接矩形即水印日期字符的位置,其灰度值标签即识别出的字符类别。

其中,基于深度学习网络的字符分割识别模型的获取方法如下:

基于用矩形标注的日期位置,得到日期图像,作为标注样本。采用矩形框在日期图像上标记日期中的所有字符的位置和类别。注意,标注的矩形框应完整包含日期字符的内容,但标注时相邻字符的矩形框不应有任何重叠。对于字符类别的标注,日期内容中共含有“0”到“9”以及“-”等11个中不同的字符,对应的标签依次标记为1到11。根据已标注好字符位置和类别,计算出日期图像上每个像素点所属的类别,其中,矩形框内的像素点都标记为所属字符的类别标签,即1到11之中的值。矩形框外的像素点为背景,标签为0。如此生成一幅和日期图像尺寸相同的标签图像。使用上述日期图像和标签图像构成的数据集,训练场景分割深度神经网络模型,获得字符分割识别模型(公知常识,兹不赘述)。

校验识别结果中年月日信息的合法性,包括长度合法性和数值合法性。基于s4输出的10个字符的位置和类别,首先根据两个分隔符“-”的位置,将识别结果分成年、月、日三个字段。合法的年、月、日字段必须分别为4、2、2个字符长度,且年、月、日数值必须在自然年、月、日的数值范围内。

若识别的年月日信息合法,则以字符串形式输出识别结果。

以上显示和描述了本方案的基本原理、主要特征和本方案的优点。本行业的技术人员应该了解,本方案不受上述实施例的限制,上述实施例和说明书中描述的只是说明本方案的原理,在不脱离本方案精神和范围的前提下,本方案还会有各种变化和改进,这些变化和改进都落入要求保护的本方案范围内。本方案要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1