本发明涉及票据数据处理,尤其涉及一种用于票据识别的数据处理方法、系统及存储介质。
背景技术:
1、在票据识别过程中,票据的多样性和复杂性是一个显著的技术挑战。票据的种类繁多,包括但不限于支票、发票、收据等,它们在格式、字体、纸张质量等方面存在巨大差异。这些差异导致了在票据识别过程中,算法需要具备极高的适应性和鲁棒性。然而,现有的票据识别系统往往在面对非标准票据或者票据上的特殊标记时,识别准确率会显著下降,这对于需要高准确度的金融交易和税务审计等领域来说,是一个不容忽视的问题。其次,票据识别技术在处理模糊或损坏票据时也面临着挑战。在实际应用中,票据会因为长时间的保存、不当的存储条件或者运输过程中的损坏而变得模糊不清。此外,一些票据由于打印质量不佳,本身就存在模糊的问题。现有的票据识别技术在处理这些模糊或损坏的票据时,往往无法准确识别出票据上的关键信息,导致识别结果的不准确。
技术实现思路
1、基于此,本发明有必要提供一种用于票据识别的数据处理方法、系统及存储介质,以解决至少一个上述技术问题。
2、为实现上述目的,一种用于票据识别的数据处理方法,包括以下步骤:
3、步骤s1:对票据进行多光谱图像采集,得到票据多光谱图像集;对票据多光谱图像集进行跨谱段配准,得到对齐票据图像集;对对齐票据图像集进行权重特征融合,得到增强票据特征图;
4、步骤s2:对增强票据特征图进行拓扑变换特征提取,得到票据几何特征映射数据;基于票据几何特征映射数据对增强票据特征图进行局部语义解耦,得到票据拓扑特征点集;
5、步骤s3:对票据拓扑特征点集进行信息熵分析,得到票据信息熵梯度分布图;根据票据信息熵梯度分布图进行自适应编码映射表构建,得到票据动态编码序列;
6、步骤s4:对票据动态编码序列进行语义关联性评估,得到语义一致性重构映射数据;根据语义一致性重构映射数据对票据动态编码序列进行语义修正,得到高置信度票据特征表示数据;
7、步骤s5:对高置信度票据特征表示数据进行先验知识图谱匹配,得到票据候选识别结果集;对票据候选识别结果集进行语义推理,得到票据语义验证数据;根据票据语义验证数据对票据候选识别结果集进行智能纠错,得到最终票据识别输出数据。
8、本发明通过多光谱图像采集和跨谱段配准,显著提高了对票据多样性和复杂性的适应性和鲁棒性,有效应对不同格式、字体和纸张质量的票据。通过权重特征融合和拓扑变换特征提取增强了对非标准票据和特殊标记的识别准确率,同时改善了模糊或损坏票据的识别效果,保持了高准确度。通过信息熵分析和自适应编码映射表的构建进一步提升了信息提取的准确性,即使在信息部分丢失或不完整的情况下。通过语义关联性评估和语义修正增强了识别结果的语义一致性,得到高置信度的票据特征表示数据。通过结合先验知识图谱匹配和语义推理的智能纠错机制,提升了识别精确度,特别是在金融交易和税务审计等高准确度需求领域。
9、优选地,本发明还提供了一种用于票据识别的数据处理系统,用于执行如上所述的用于票据识别的数据处理方法,该用于票据识别的数据处理系统包括:
10、图像采集模块,用于对票据进行多光谱图像采集,得到票据多光谱图像集;对票据多光谱图像集进行跨谱段配准,得到对齐票据图像集;对对齐票据图像集进行权重特征融合,得到增强票据特征图;
11、拓扑特征提取模块,用于对增强票据特征图进行拓扑变换特征提取,得到票据几何特征映射数据;基于票据几何特征映射数据对增强票据特征图进行局部语义解耦,得到票据拓扑特征点集;
12、信息熵编码模块,用于对票据拓扑特征点集进行信息熵分析,得到票据信息熵梯度分布图;根据票据信息熵梯度分布图进行自适应编码映射表构建,得到票据动态编码序列;
13、语义评估模块,用于对票据动态编码序列进行语义关联性评估,得到语义一致性重构映射数据;根据语义一致性重构映射数据对票据动态编码序列进行语义修正,得到高置信度票据特征表示数据;
14、知识匹配模块,用于对高置信度票据特征表示数据进行先验知识图谱匹配,得到票据候选识别结果集;对票据候选识别结果集进行语义推理,得到票据语义验证数据;根据票据语义验证数据对票据候选识别结果集进行智能纠错,得到最终票据识别输出数据。
15、本发明通过图像采集模块的多光谱图像采集和跨谱段配准能力,使得系统能够捕捉到更多票据细节,增强了图像处理能力。通过拓扑特征提取模块深入挖掘票据特征,提供了丰富的几何和拓扑特征信息,而信息熵编码模块则通过信息熵分析和自适应编码技术,实现了票据特征点集的精确编码,增强了编码的准确性和可靠性。通过语义评估模块在语义层面进行优化,通过语义关联性评估和修正,提升了识别结果的语义一致性和置信度。通过知识匹配模块的智能纠错机制,结合先验知识图谱匹配和语义推理,进一步提高了识别精确度。
16、优选地,一种计算机可读存储介质,存储有能够被处理器加载并执行如上所述的一种用于票据识别的数据处理方法。
1.一种用于票据识别的数据处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的用于票据识别的数据处理方法,其特征在于,步骤s1包括以下步骤:
3.根据权利要求1所述的用于票据识别的数据处理方法,其特征在于,步骤s2包括以下步骤:
4.根据权利要求3所述的用于票据识别的数据处理方法,其特征在于,步骤s26包括以下步骤:
5.根据权利要求1所述的用于票据识别的数据处理方法,其特征在于,步骤s3包括以下步骤:
6.根据权利要求5所述的用于票据识别的数据处理方法,其特征在于,步骤s35包括以下步骤:
7.根据权利要求1所述的用于票据识别的数据处理方法,其特征在于,步骤s4包括以下步骤:
8.根据权利要求1所述的用于票据识别的数据处理方法,其特征在于,步骤s5包括以下步骤:
9.一种用于票据识别的数据处理系统,其特征在于,用于执行如权利要求1所述的用于票据识别的数据处理方法,该用于票据识别的数据处理系统包括:
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至8任一项所述的用于票据识别的数据处理方法。