移动端原始凭证电子化智能填单系统及方法
【技术领域】
[0001]本发明属于智能识别系统领域,具体涉及一种移动端原始凭证电子化智能填单系统及方法。
【背景技术】
[0002]在网上报销时,需要将原始凭证中的信息录入到财务信息系统中。传统的电子化模式采用手工录入的方式来实现,报销人员通过对话框、下拉框或直接输入的方式逐条录入原始凭证的各项信息,不仅过程繁琐,而且正确性也得不到保证,在传统的数据录入方式下审批人无法看到纸质凭证的图像,因此有必要通过扫描仪、摄像头等终端设备将纸质的原始凭证数字化,然后作为电子报销单的附件以备审批人调阅。同时报销系统根据预先配置的流程信息,将电子凭证和原始凭证图像一起提交给审批人进行审批。目前主流财务软件对于原始凭证采集一般都是以附件的形式存在,一张报销单关联很多张经过采集的原始凭证数字化图像。这些数字图像一般按采集的时间先后顺序排列,原始凭证上的相关内容并没有进行识别整理,调阅时无法按照金额大小、内容、日期等进行排序选择,这在一定程度上降低了网上审批的效率。
[0003]目前对凭证智能识别技术应用得最广泛的是银行的凭证影像行业,成熟系统有全国支票影像交换系统、全集中电子验印系统和凭证提回集中处理系统。其中全国支票影像交换系统运用影像技术将实物支票转换为影像和电子清算信息,通过计算机及网络将支票影像和电子清算信息传递至出票人开户银行提示付款;全集中电子验印系统主要用于银行网点柜台的凭证印鉴核对业务,采用图像处理和模式识别技术,通过将用图像采集设备(扫描仪、清分机)采集到的凭证印鉴影像与预留的印鉴影像进行自动核对,实现印鉴核对的自动化处理;凭证提回集中处理系统利用清分机、高速扫描仪等图像采集设备批量获取凭证影像,利用影像处理和识别技术以流水作业方式完成凭证业务集中办理;此外,目前凭证识别系统的图像采集方式为扫描仪,体积庞大、不易携带,无法作为移动端的采集方式。因此,有必要在移动端开发一个原始凭证自动识别录入系统,不仅能给报销人员提供自动化服务,提升用户体验度,还能给审批人员提供凭证图像,作为网络审核依据,更保证了凭证图像与网上报销流程中每笔业务的关联性。
【发明内容】
[0004]本发明的主要目的是提供一种移动端原始凭证电子化智能填单方法。
[0005]本发明的另一目的是提供一种移动端原始凭证电子化智能填单系统。
[0006]为实现上述的主要目的,本发明提供的移动端原始凭证电子化智能填单方法包括,数字图像采集步骤:把原始凭证转换为数字图像;图像识别处理步骤:对待识别图像进行图像识别处理;结果输出步骤:将图像识别结果导出至财务信息化系统;其中,图像识别处理的步骤依次包括对图像预处理步骤、凭证种类分类步骤、凭证版面分析步骤、字符识别步骤以及识别结果核查步骤;凭证种类分类步骤中采用基于决策树的凭证分类器;凭证版面分析步骤中采用基于假设树的弹性模板;识别结果核查步骤中采用基于规则的识别结果核查。
[0007]由上述方案可见,经过对数字图像采集设备采集的电子凭证图像的识别处理后,自动获取凭证单据图像中的凭证数据,并转换为需要录入到业务系统中对应的业务数据,帮助使用者提高业务数据录入工作。
[0008]—个优选的方案是,数字图像采集步骤通过自带摄像头的移动终端进行图像采集。
[0009]由上可见,利用自带摄像头的移动终端做图像采集,从而使图像采集设备容易获取并且携带方便,有利于移动办公。
[0010]一个优选的方案是,图像预处理步骤中包括使用Hough变换校正透视失真算法或者同态滤波算法对图形进行图像识别处理。
[0011]由上可见,由于移动设备采集的图像质量相比扫描仪、快拍仪有所降低,因此需要采取预处理手段予以优化。除了传统的票据图像预处理如去框线、纠偏、去噪、二值化之外,还加入了 Hough变换校正透视失真算法或者同态滤波算法,以改善图像质量。
[0012]—个优选的方案是,识别结果核查步骤中包括分组核查、字典核查或者基于上下文的核查。
[0013]由上可见,识别结果核查步骤中采用基于规则的核查,其中基于规则的核查主要包括分组核查、字典核查或者基于上下文的核查,在系统识别出单个字符后,需要通过后处理,利用上下文信息、语法以及逻辑对识别结果进行进一步的修正,从而改善和提高系统的整体性能。举例来说,对支票进行金额识别时,由于通常情况下存在支票的大、小写金额相互对应,那么在分别识别大、小写金额后,就可以通过将这两部分识别结果进行比较,相互修正结果。
[0014]为了实现本发明的另一个目的,本发明提供的移动端原始凭证电子化智能填单系统包括,数字图像采集模块,用于把原始凭证转换为数字图像;图像识别处理模块,用于把待识别的图像进行图像识别处理;结果输出模块,用于将图像识别处理模块输出的结果导出至财务信息化系统;图像识别处理模块包括图像预处理模块、凭证种类分类模块、凭证版面分析模块、字符识别模块以及识别结果核查模块;凭证种类分类模块中采用基于决策树的凭证分类器;凭证版面分析模块中采用基于假设树的弹性模板;识别结果核查模块中采用基于规则的识别结果核查。
[0015]由上述方案可见,以基于数字图像处理、凭证种类分类、凭证版面分析、OCR光学字符识别以及模式识别等技术,帮助企业业务系统自动处理凭证单据数据,达到从批量原始凭证信息数据中自动获取业务系统相应的业务数据,提高原始凭证单据录入的工作效率。
【附图说明】
[0016]图1是本发明移动端原始凭证电子化智能填单系统实施例的分布式结构框图。
[0017]图2是本发明移动端原始凭证电子化智能填单系统实施例的业务模型图。
[0018]图3是本发明移动端原始凭证电子化智能填单方法实施例的服务端处理流程图。
[0019]图4是本发明移动端原始凭证电子化智能填单方法实施例的调用识别服务流程图。
[0020]图5是本发明移动端原始凭证电子化智能填单方法实施例的操作阶段流程图。
[0021]图6是本发明移动端原始凭证电子化智能填单方法实施例的凭证种类分类的方法流程图。
[0022]以下结合附图及实施例对本发明作进一步说明。
【具体实施方式】
[0023]参见图1,在实际应用中,针对多用户的大量图像数据,需要采用分布式的处理方式,这具体体现在分布式图像采集和分布式识别两个方面:多用户通过财务信息化系统I发起凭证识别请求,并上传用手机采集和预处理的凭证图像。通过负载均衡器2把网络请求分发到一个服务器集群3中的可用服务器上去,并将图像再上传到OCR光学字符识别系统4。OCR光学字符识别系统4将图像文件保存在服务器的文件系统上,并将识别结果反馈给财务信息化系统I,用户审核、确认识别结果,最终完成数据的自动录入。
[0024]参见图2,图2为移动端凭证电子化智能填单的业务模型图,具体的业务过程为:报销人启用移动终端应用,首先执行步骤Al通过财务信息化平台前端请求原始凭证智能识另IJ,再执行步骤A2系统显示凭证模板供报销人对准凭证图像然后执行步骤A3进行图像处理,接着执行步骤A4对原始凭证图像进行预处理、压缩后上传图像信息保存至财务信息化系统服务