一种自动定位财务主表的方法、装置及电子设备与流程

文档序号:32807643发布日期:2023-01-04 01:15阅读:来源:国知局

技术特征:
1.一种自动定位财务主表的方法,其特征在于,包括:获取预定格式的财务报告;识别所述财务报告中各页面上的文字信息和表格要素信息;对各表格执行以下匹配操作,并根据匹配结果确定表格对应的主表类型:将当前表格中各单元格内的文字信息与财务科目库进行匹配,得到当前表格内各科目所对应的主表类型;和/或,将当前表格外预定范围内的文字信息与各主表类型的名称进行正则匹配,得到匹配的主表类型;统计所述财务报告中各页面的页码、各页面上的表格所对应的主表类型;将页面上表格对应有主表类型的多个连续页面的统计结果进行聚合;根据聚合结果,确定所述财务主表所在的页码范围。2.根据权利要求1所述的方法,其特征在于,在对各表格执行匹配操作,并根据匹配结果确定表格对应的主表类型之前,还包括:确定各页面上的表格个数;确定表格个数大于3的页面上没有财务主表。3.根据权利要求1所述的方法,其特征在于,将当前表格中各单元格内的文字信息与财务科目库进行匹配,得到当前表格内各科目所对应的主表类型,包括:对当前表格中包含文字信息的各单元格,执行如下操作:将当前单元格的文字信息与财务科目库进行匹配,确定财务科目库中是否存在目标科目与当前单元格的文字信息一致;在存在的情况下,确定在财务科目库中所述目标科目对应的主表类型;将所述目标科目对应的主表类型作为当前单元格内的文字信息所对应的主表类型;统计各主表类型所对应的单元格的个数;将对应的单元格个数大于或等于预定阈值的主表类型作为当前表格所对应的主表类型。4.根据权利要求1所述的方法,其特征在于,在对各表格执行各匹配操作,均无法根据匹配结果确定表格对应的主表类型之后,还包括:确定表格是否为当前页面第一个表格;若是,则查找上一页面的底部是否为表格;若是,则确定上一页面底部的表格所对应的主表类型作为当前页面顶部的表格所对应的主表类型。5.根据权利要求4所述的方法,其特征在于,还包括:在上一页面底部的表格所对应的主表类型无法确定的情况下,将上一页面底部的表格与当前页面顶部的表格合并为一个表格,并将合并表中各单元格内的文字信息与财务科目库进行匹配,得到合并表中各科目所对应的主表类型,根据匹配结果确定合并表对应的主表类型。6.根据权利要求4所述的方法,其特征在于,还包括:若上一页面的底部不是表格,将上一页面底部的文字信息与各主表类型的名称进行正则匹配;将匹配到的主表类型作为当前页面顶部的表格所对应的主表类型。7.根据权利要求1所述的方法,其特征在于,在根据聚合结果,在根据聚合结果,确定所
述财务主表所在的页码范围之前,还包括:对聚合结果中各页码范围执行如下操作:判断当前页码范围所对应的第一个主表的类型是否为预定类型;若不是,则确定当前页码范围不是财务主表所在的页码范围。8.根据权利要求1所述的方法,其特征在于,根据聚合结果,确定所述财务主表所在的页码范围,包括:确定聚合结果中的各页码范围中对应主表类型最多的目标页码范围;将目标页码范围作为财务主表所在的页面范围。9.一种自动定位财务主表的装置,其特征在于,包括:获取单元,用于获取预定格式的财务报告;识别单元,用于识别所述财务报告中各页面上的文字信息和表格要素信息;第一匹配单元,用于对各表格执行以下匹配操作,并根据匹配结果确定表格对应的主表类型:将当前表格中各单元格内的文字信息与财务科目库进行匹配,得到当前表格内各科目所对应的主表类型;和/或,将当前表格外预定范围内的文字信息与各主表类型的名称进行正则匹配,得到匹配的主表类型;统计单元,用于统计所述财务报告中各页面的页码、各页面上的表格所对应的主表类型;聚合单元,用于将页面上表格对应有主表类型的多个连续页面的统计结果进行聚合;第一确定单元,用于根据聚合结果,确定所述财务主表所在的页码范围。10.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器和所述存储器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而实现权利要求1至8任一项所述方法的步骤。11.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被处理器执行时实现权利要求1至8任一项所述方法的步骤。12.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述方法的步骤。

技术总结
本说明书提供一种自动定位财务主表的方法、装置及电子设备,该方法包括:识别各页面上的文字信息和表格要素信息;对各表格执行以下匹配操作,并根据匹配结果确定表格对应的主表类型:将当前表格中各单元格内的文字信息与财务科目库进行匹配,得到当前表格内各科目所对应的主表类型;和/或,将当前表格外预定范围内的文字信息与各主表类型的名称进行正则匹配,得到匹配的主表类型;统计财务报告中各页面的页码、各页面上的表格所对应的主表类型;将页面上表格对应有主表类型的多个连续页面的统计结果进行聚合;根据聚合结果,确定财务主表所在的页码范围。本方案能够自动定位财务主表的位置,计算量较小,且定位速度快、定位的准确性较高。性较高。性较高。


技术研发人员:冯程 熊博颖 谢小容 车越云 吴昀蓁 郑邦东
受保护的技术使用者:建信金融科技有限责任公司
技术研发日:2022.10.17
技术公布日:2023/1/3
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1