本技术涉及证书信息管理,尤其涉及一种基于文字识别的证书信息管理方法、系统、设备及介质。
背景技术:
1、资产清查指的是通过融合自然资源调查监测、确权登记、分等定级、基准地价等成果,查清全民所有自然资源资产实物量,核算价值量,摸清资产底数;在地籍调查和不动产登记等成果基础上,逐步理清使用权状况,形成包含实物量图层、价值量图层、产权图层等共同构成的资产“一张图”,按需协同管理各类底图底数。
2、证书信息管理属于资产清查过程的一环,现有的证书信息管理方法对数据来源溯源方法欠缺。例如,在国有企业专项清查中需要填入宗地对应的证书信息,会存在将证书中“建筑面积”填入“宗地面积”中等情况,因为填写信息的个体对所填信息的理解不同而导致的错填现象。可见,现有的证书信息管理方法无法实现快速数据溯源,数据溯源核对工作量大。
技术实现思路
1、本技术提供了一种基于文字识别的证书信息管理方法、系统、设备及介质,通过将两个信息进行匹配核对,降低了信息数据的错误率,并明确信息来源,并构建了信息溯源的存储结构,对溯源信息进行展示,从而能有效追踪并验证数据的来源及准确性,提升数据核对效率,解决了现有的证书信息管理方法无法实现数据溯源的问题。
2、第一方面,本技术提供了一种基于文字识别的证书信息管理方法,包括:
3、基于获取到的证书扫描件进行字符识别,得到关键识别信息,并获取目标对象针对所述关键识别信息输入的输入信息,所述关键识别信息包括文字识别信息和位置信息;
4、依据所述关键识别信息和所述输入信息进行信息匹配和信息核对处理,得到信息匹配结果、目标存储信息以及数据源标记信息;
5、在所述信息匹配结果为目标匹配结果时,基于所述目标存储信息、所述数据源标记信息和所述位置信息,生成溯源信息,所述溯源信息用于形成数据库和溯源核对;
6、根据所述溯源信息,构建用于信息管理和溯源核对的信息字典,所述信息字典包含字典信息和所述字典信息的源定位信息;
7、依据所述信息字典和待核对信息进行二次溯源核对和信息管理更新。
8、可选的,基于获取到的证书扫描件进行字符识别,得到关键识别信息,包括:
9、获取目标对象通过信息提交页面上传的证书扫描件;
10、采用光学字符识别对所述证书扫描件进行文字识别,得到文字识别信息;
11、将所述文字识别信息与所述证书扫描件进行关联,并基于所述证书扫描件识别所述文字识别信息的对应位置,得到位置信息;
12、其中,所述位置信息包含页码和坐标。
13、可选的,采用光学字符识别对所述证书扫描件进行文字识别,得到文字识别信息,包括:
14、基于所述证书扫描件进行预处理,得到预处理扫描件;
15、根据所述预处理扫描件进行文字识别,得到文字识别信息。
16、可选的,依据所述关键识别信息和所述输入信息进行信息匹配和信息核对处理,得到信息匹配结果、目标存储信息以及数据源标记信息,包括:
17、按照预设的匹配算法,基于所述关键识别信息和所述输入信息进行信息匹配和信息核对判断,得到信息匹配结果;
18、在所述信息匹配结果为目标匹配结果时,基于所述关键识别信息和所述输入信息,生成目标存储信息,并根据所述目标存储信息的数据来源,得到数据源标记信息。
19、可选的,按照预设的匹配算法,基于所述关键识别信息和所述输入信息进行信息匹配和信息核对判断,得到信息匹配结果,包括:
20、采用字符串匹配算法,基于所述关键识别信息和所述输入信息进行信息匹配,得到匹配度;
21、基于所述匹配度进行信息核对判断,得到信息匹配结果。
22、可选的,根据所述溯源信息,构建用于信息管理和溯源核对的信息字典,包括:
23、按照预设的数据库结构,利用所述溯源信息进行关系数据库构建,得到数据库文件,并对所述数据库文件进行索引和优化;
24、基于所述证书扫描件进行整理,得到标准格式文件;
25、根据所述数据库文件和所述标准格式文件,构建信息字典。
26、可选的,依据所述信息字典和待核对信息进行二次溯源核对和信息管理更新,包括:
27、所述信息字典依据预设的相似度算法,确定待核对信息和字典信息之间的信息相似度;
28、从待核对信息中筛选信息相似度低于预设相似度阈值的目标核对信息,所述目标核对信息包含属性信息;
29、通过展示界面展示所述目标核对信息,并获取目标对象针对所述目标核对信息进行二次溯源核对时的核对操作数据,所述核对操作数据包含处理核对操作和所述处理核对操作对应的更新数据;
30、基于所述核对操作数据进行信息管理更新。
31、第二方面,本技术提供了一种基于文字识别的证书信息管理系统,包括:
32、字符识别模块,用于基于获取到的证书扫描件进行字符识别,得到关键识别信息,所述关键识别信息包括文字识别信息和位置信息;
33、输入信息获取模块,用于获取目标对象针对所述关键识别信息输入的输入信息;
34、信息匹配核对模块,用于依据所述关键识别信息和所述输入信息进行信息匹配和信息核对处理,得到信息匹配结果、目标存储信息以及数据源标记信息;
35、溯源信息生成模块,用于在所述信息匹配结果为目标匹配结果时,基于所述目标存储信息、所述数据源标记信息和所述位置信息,生成溯源信息,所述溯源信息用于形成数据库和溯源核对;
36、信息字典构建模块,用于根据所述溯源信息,构建用于信息管理和溯源核对的信息字典,所述信息字典包含字典信息和所述字典信息的源定位信息;
37、管理模块,用于依据所述信息字典和待核对信息进行二次溯源核对和信息管理更新。
38、第三方面,本技术提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
39、存储器,用于存放计算机程序;
40、处理器,用于执行存储器上所存放的程序时,实现如第一方面任一项实施例所述的基于文字识别的证书信息管理方法的步骤。
41、第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的基于文字识别的证书信息管理方法的步骤。
42、综上,本技术实施例利用获取到的证书扫描件进行字符识别,得到包含文字识别信息和位置信息的关键识别信息,并获取目标对象的输入信息,然后将关键识别信息和输入信息进行信息匹配和信息核对处理,得到信息匹配结果、目标存储信息以及数据源标记信息,以在信息匹配结果为目标匹配结果时,基于目标存储信息、数据源标记信息和位置信息,生成用于形成数据库和溯源核对的溯源信息,然后根据溯源信息,构建用于信息管理和溯源核对的信息字典,以利用信息字典和待核对信息进行二次溯源核对和信息管理更新。可见,本技术实施例通过信息匹配核对,有效降低了信息错填、漏填等,进而降低了信息的错误率,在明确信息来源的基础上,构建信息溯源的存储结构,以进行信息溯源,从而提升数据核对效率,减少数据溯源的工作量,提升工作效率,解决了现有的证书信息管理方法无法实现数据溯源的问题。