一种签核文件模板生成方法及装置与流程

文档序号:12272680阅读:399来源:国知局
一种签核文件模板生成方法及装置与流程

本发明涉及互联网通信领域,具体而言,涉及一种签核文件模板生成方法及装置。



背景技术:

企业中,经常会有诸多事务需要多级审批,需要使用签核文件。比如“物品申购”、“借款单”、“差旅费申报”等。需要申请人填写申请单据,然后通过单据各级审批人进行审批,单据审批完毕,出纳人员将单据打印出来,申请人在打印出来的单据上签字、报销,再交由出纳人员将手工签字的单据和实际发票订在一起,保留一份原始凭证,同时在系统上保留一份电子化的单据,方便以后查询、汇总。电子化的单据有时候需要特定的格式,但是用户上传的单据的格式不尽相同,不能统一进行统计,不利于后期的管理和查询,且用户在上传单据时操作较为复杂,体验感差。



技术实现要素:

有鉴于此,本发明实施例的目的在于提供一种签核文件模板生成方法及装置,以改善上述的问题。

为了达到上述的目的,本发明实施例采用的技术方案如下所述:

第一方面,本发明实施例提供的一种签核文件模板生成方法,所述方法应用于与客户端通信连接的服务端,所述签核文件模板生成方法包括:

按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息;

根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板;

对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词;

将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将所述关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词;

将签核文件模板以及对应的代表关键词发送至客户端,以便于客户端响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。

进一步地,所述历史签核文件为图像,所述按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息的步骤包括:

滤除所述图像中在预设的色调值范围外的区域;

对剩下的图像区域进行边缘分析,得到所述图像中的文字信息。

进一步地,所述按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息的步骤还包括:消除剩下的图像中的噪声。

进一步地,所述历史签核文件为图像,所述按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息的步骤包括:

对所述图像进行二值化处理,将图像中的文字部分与背景部分通过颜色进行区分;

对所述图像的文字部分进行特征提取,将提取出的特征与预存的特征库进行校对,将匹配的特征对应的文字确定为识别出的文字信息。

进一步地,所述按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息的步骤还包括:对所述图像进行矫正处理。

第二方面,本发明实施例提供了一种签核文件模板生成装置,所述装置应用于与客户端通信连接的服务端,所述签核文件模板生成装置包括:

识别模块,用于按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息;

排版模块,用于根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板;

归类模块,用于对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词;

对比模块,用于将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将所述关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词;

发送模块,用于将签核文件模板以及对应的代表关键词发送至客户端,以便于客户端响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。

进一步地,所述历史签核文件为图像,所述识别模块用于滤除所述图像中在预设的色调值范围外的区域,对剩下的图像区域进行边缘分析,得到所述图像中的文字信息。

进一步地,所述识别模块还用于消除剩下的图像中的噪声。

进一步地,所述历史签核文件为图像,所述识别模块用于对所述图像进行二值化处理,将图像中的文字部分与背景部分通过颜色进行区分,对所述图像的文字部分进行特征提取,将提取出的特征与预存的特征库进行校对,将匹配的特征对应的文字确定为识别出的文字信息。

进一步地,所述识别模块还用于对所述图像进行矫正处理。

本发明提供了一种签核文件模板生成方法及装置,该签核文件模板生成方法包括:按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息;根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板;对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词;将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将所述关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词;将签核文件模板以及对应的代表关键词发送至客户端,以便于客户端响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。本发明通过对历史签核文件进行识别分析,得到能够代表各种类型的签核文件的代表关键词以及签核文件模板,代表关键词对应签核文件模板,方便后期用户通过选择代表关键词调用签核文件模板,便于后期签核文件的统一管理,同时提高用户上传签核文件的体验感。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1是本发明较佳实施例提供的服务端与客户端进行交互的示意图。

图2是本发明较佳实施例提供的服务端的方框示意图。

图3是本发明软装置的功能模块示意图。

图4是本发明较佳实施例提供的签核文件模板生成方法的流程图。

图5是本发明较佳实施例提供的签核文件模板生成方法中子步骤的流程图。

图6是本发明较佳实施例提供的签核文件模板生成方法中另一子步骤的流程图。

图标:服务端100、签核文件模板生成装置110、识别模块111、排版模块112、归类模块113、对比模块114、发送模块115、存储器130、处理器150、通信单元170、客户端200、网络300、应用程序400。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

本发明实施例提供的签核文件模板生成方法及装置应用于与多个客户端相互通信的服务端。如图1所示,是本发明较佳实施例提供的服务端100与至少一客户端200通信的交互示意图。所述服务端100可通过网络300与所述客户端200进行通信,以实现服务端100与客户端200之间的数据通信或交互。所述服务端100可以提供至少一个适用于各种操作系统的应用程序(Application,APP)400的安装包供所述客户端200下载。所述客户端200通过所述网络300访问所述服务端100后,可通过所述网络300从服务端100下载适用于该客户端200的操作系统的应用程序400的安装包,以将所述应用程序400安装到所述客户端200中。

本实施例中,所述服务端100可以是,但不限于,web(网站)服务器、ftp(file transfer protocol,文件传输协议)服务器等。所述客户端200可以是,但不限于,智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)等。所述网络300可以是,但不限于,有线网络或无线网络。所述客户端200的操作系统可以是,但不限于,安卓(Android)系统、IOS(iPhone operating system)系统、Windows phone系统、Windows系统等。所述应用程序400可以是服务端100提供的任何可供客户端200自定义下载并安装的应用程序。

请参照图2,是图1所示的服务端100的方框示意图。所述服务端100包括签核文件模板生成装置110、存储器130、处理器150和通信单元170。

所述存储器130、处理器150以及通信单元170各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述签核文件模板生成装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器130中或固化在所述服务端100的操作系统(operating system,OS)中的软件功能模块。所述处理器150用于执行所述存储器130中存储的可执行模块,例如所述签核文件模板生成装置110所包括的软件功能模块及计算机程序等。

其中,所述存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理器150在接收到执行指令后,执行所述程序。所述通信单元170用于通过所述网络300建立所述服务端100与客户端200之间的通信连接,并用于通过所述网络300收发数据。

请参照图3,是本发明较佳实施例提供的应用于图1所示的服务端100的签核文件模板生成装置110的功能模块架构示意图。所述签核文件模板生成装置110包括识别模块111、排版模块112、归类模块113、对比模块114和发送模块115。

其中,所述识别模块111用于按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息。该预定的时间周期根据用户上传签核文件的频率而设定,或者根据历史签核文件的累积数量而定,比如可以设置每隔一个月对历史签核文件识别一次。在本实施例中,历史签核文件为图像,易于理解的,该图像为拍摄纸质签核文件的图像,识别模块111在对图像进行识别时,作为一种实施方式,签核文件模板生成装置110预先存储有一色调值范围,该色调值范围内的颜色为色彩较深的颜色,比如黑色。色调值为RGB颜色模式下红色、绿色、蓝色所占的比重,例如黑色的色调值为0,0,0,。由于一般的签核文件的字体为黑色的字体,故而预设的色调值范围为深色对应的色调值范围。识别模块111在对图像进行文字的识别时,先将图像中在预设的色调值范围外的区域滤除,然后对剩下的图像区域进行边缘分析,由于一般的签核文件为白纸黑字,滤除之后,剩下的图像区域为文字部分,对文字部分进行边缘分析,即可得到该文字的信息。由于边缘分析技术已经较为成熟,此处不再赘述。在某些情况下,图像上会有明显的污点或者其他无关的笔画,为了不影响识别模块111对文字的识别,在对文字部分进行识别之前,识别模块111还要对剩下的图像进行去噪处理,去除明显的噪声。

作为另一种实施方式,签核文件模板生成装置110预先存储有特征库,特征库包括各种文字的笔画特征,识别模块111对图像中的文字进行识别,通过对图像进行二值化处理,根据图像上的色彩信息将图像黑白化,将图像中的文字部分与背景部分通过颜色进行区分,使图像上的文字和背景区分得更加明显。然后对所述图像的文字部分进行特征提取,将提取出的特征与预存的特征库进行校对,将匹配的特征对应的文字确定为识别出的文字信息。由于在某些情况下,客户在拍摄图片的时候,摄像头的角度没有摆正,导致摆设出的图像为倾斜的图像,使得图像上的文字为变形的文字,不利于特征提取和校对,在本实施例中,识别模块111还用于对图像进行矫正处理,使倾斜的图像变为正常的图像。

识别模块111识别出图像中的文字信息后,排版模块112根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板。比如签核文件的抬头设置的位置、正文格式、结尾设置位置等,识别模块111识别出来的文字根据文字自身的设置格式,或者文字的关键字等规则被放置在不同的版面。需要说明的是,本实施例所述的排版不是直接将图像上的文字直接挪到签核文件中,而是在识别出文字信息之后,生成该文字信息相同的文字,并排版到特定的版面中。

同时,归类模块113对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词。在本实施例中,归类模块113的归类可以根据签核文件中的抬头、项目、数量、姓名、单位等进行归类,比如对于物品申购签核文件,可以对物品、型号、单位、数量、单价、用途等进行归类统计。归类出结果后,对比模块114将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将该关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词。例如,从A文件中得到的文字信息包括申购、单价、数量、类别,在B文件中得到的文字信息包括报销、单价、数量、类别,则A与B互相没有交集的关键词分别是“申购”和“报销”,则“申购”作为A文件对应的签核文件模板的代表关键词,“报销”作为B文件对应的签核文件模板的代表关键词。

发送模块115将签核文件模板以及对应的代表关键词发送至客户端200,以便于客户端200响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。用户输入的代表关键词可以是通过键盘、屏幕输入的代表关键词,也可以是通过麦克风输入的语音。用户通过输入代表关键词后,客户端200则将对应的签核文件模板调取出来,作为签核文件上传至服务端100,方便快捷,且格式统一,用户体验感高。

请参照图4,是本发明实施例提供的应用于图1所示的服务端100的签核文件模板生成方法的流程图,该签核文件模板生成方法包括以下步骤:

步骤S110,按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息。

请参照图5,作为一种实施方式,该步骤S110还可以包括以下子步骤:

步骤S111,滤除所述图像中在预设的色调值范围外的区域。

步骤S112,消除剩下的图像中的噪声。

步骤S113,对剩下的图像区域进行边缘分析,得到所述图像中的文字信息。

请参照图6,作为另一种实施方式,该步骤S110还可以包括以下子步骤:

步骤S114,对所述图像进行二值化处理,将图像中的文字部分与背景部分通过颜色进行区分。

步骤S115,对所述图像的文字部分进行特征提取。

步骤S116,将提取出的特征与预存的特征库进行校对。

步骤S117,将匹配的特征对应的文字确定为识别出的文字信息。

在本实施例中,该步骤S110、步骤S111~S113、步骤S114~S117可以通过识别模块111执行。

步骤S120,根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板。

在本实施例中,步骤S120可以通过排版模块112执行。

步骤S130,对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词。

在本实施例中,步骤S130可以通过归类模块113执行。

步骤S140,将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将所述关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词。

在本实施例中,该步骤S140可以通过对比模块114执行。

步骤S150,将签核文件模板以及对应的代表关键词发送至客户端,以便于客户端响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。

在本实施例中,步骤S150可以通过发送模块115执行。

综上所述,本发明实施例提供了一种签核文件模板生成方法及装置。该签核文件模板生成方法包括:按照预定的时间周期对历史签核文件进行识别,识别出每份历史签核文件的文字信息;根据预先存储的排版规则,对每份历史签核文件识别出的文字信息进行排版,生成与该历史签核文件对应的签核文件模板;对每份历史签核文件文字信息进行归类分析,得到每份历史签核文件的关键词;将每份历史签核文件的关键词进行对比,识别出各份历史签核文件与其他历史签核文件均没有重复的关键词,将所述关键词作为与该历史签核文件对应的签核文件模板对应的代表关键词;将签核文件模板以及对应的代表关键词发送至客户端,以便于客户端响应用户输入的代表关键词,调取该代表关键词对应的签核文件模板进行显示。本发明通过对历史签核文件进行识别分析,得到能够代表各种类型的签核文件的代表关键词以及签核文件模板,代表关键词对应签核文件模板,方便后期用户通过选择代表关键词调用签核文件模板,便于后期签核文件的统一管理,同时提高用户上传签核文件的体验感。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1