地址处理方法及相关设备与流程

文档序号:34361438发布日期:2023-06-04 17:18阅读:31来源:国知局
地址处理方法及相关设备与流程

本申请涉及数据处理,尤其涉及到一种地址处理方法及相关设备。


背景技术:

1、在日常生活中,有很多地方会涉及到地址文本,譬如:身份证光学字符识别(ocr)、购物网站、快递单等。但这些地址文本会存在一定的误识别,或者地址填写错误的情况。从而需要对地址文本进行判别,如果是人来判别,会耗费大量人力资源。

2、目前,常用的一种方法,是通过地址匹配,即在数据库中进行地址比对,查找与待匹配地址匹配的地址,得到匹配的地址。然而,通过这种方式,原本错误的地址分词较容易匹配出与原本错误地址分词一样的地址,得到的匹配地址仍然是错误的,从而导致得到的地址准确性较低。


技术实现思路

1、本申请实施例提供一种地址处理方法及相关设备,有利于提高地址处理得到的目标地址的准确率和可靠性。

2、为了解决上述技术问题,本申请是这样实现的:

3、第一方面,本申请实施例提供了一种地址处理方法,包括:

4、获取待处理地址,所述待处理地址包括n个字符,n为正整数;

5、获取所述待处理地址的语义特征向量以及所述n个字符中每个字符的字符特征向量,所述语义特征向量用于表征所述待处理地址的全局语义信息,所述字符特征向量用于表征字符语义信息;

6、基于所述n个字符的字符特征向量对所述n个字符进行地址等级分类,得到所述n个字符中每个字符的地址等级分类结果,所述字符的地址等级分类用于表示所述字符所属的地址等级,所述地址等级为根据行政区划确定的至少一个地址等级中的一个地址等级;

7、基于所述n个字符的地址等级分类结果、所述n个字符的字符特征向量以及所述语义特征向量,对所述待处理地址进行纠正处理,得到目标地址。

8、第二方面,本申请实施例还提供一种地址处理装置,包括:

9、第一获取模块,用于获取待处理地址,所述待处理地址包括n个字符,n为正整数;

10、第二获取模块,用于获取所述待处理地址的语义特征向量以及所述n个字符中每个字符的字符特征向量,所述语义特征向量用于表征所述待处理地址的全局语义信息,所述字符特征向量用于表征字符语义信息;

11、等级分类模块,用于基于所述n个字符的字符特征向量对所述n个字符进行地址等级分类,得到所述n个字符中每个字符的地址等级分类结果,所述字符的地址等级分类用于表示所述字符所属的地址等级,所述地址等级为根据行政区划确定的至少一个地址等级中的一个地址等级;

12、纠正处理模块,用于基于所述n个字符的地址等级分类结果、所述n个字符的字符特征向量以及所述语义特征向量,对所述待处理地址进行纠正处理,得到目标地址。

13、第三方面,本申请实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述地址处理方法中的步骤。

14、第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述地址处理方法中的步骤。

15、可以看出,本实施例中,在对待处理地址进行纠正处理得到目标地址过程中,考虑了待处理地址的语义特征向量,而且还考虑了待处理地址中n个字符的字符特征向量以及n个字符的地址等级分类结果,使用了较多的特征信息,由于语义特征向量用于表示待处理地址的全局语义信息,n个字符的字符特征向量用于表示字符语义信息,n个字符的地址等级分类结果用于表示字符所属的地址等级,因此,在对地址处理纠正处理得到目标地址的过程中,结合了待处理地址的全局语义信息、字符语义信息以及字符所属的地址等级,可以实现对待处理地址更好的效果,如此,有利于提高地址纠正的准确性和可靠性,从而可提高得到的目标地址的准确性和可靠性。



技术特征:

1.一种地址处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述n个字符的地址等级分类结果包括m类地址等级,m为正整数;所述基于所述n个字符的地址等级分类结果、所述n个字符的字符特征向量以及所述语义特征向量,对所述待处理地址进行纠正处理,得到目标地址,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述m个目标特征向量对所述待处理地址进行纠正处理,得到所述目标地址,包括:

4.根据权利要求3所述的方法,其特征在于,所述目标地址识别模型包括目标双向长短词记忆模块和目标分类模块;

5.根据权利要求3所述的方法,其特征在于,所述m类地址等级的等级高低不同,所述对所述m个目标特征向量的子地址进行合并,得到所述目标地址,包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述n个字符的字符特征向量进行地址等级分类,得到所述n个字符中每个字符的地址等级分类结果,包括:

7.根据权利要求1-6中任一项所述的方法,其特征在于,所述获取待处理地址,包括:

8.一种地址处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的地址处理方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的地址处理方法中的步骤。


技术总结
本申请提供一种地址处理方法及相关设备,地址处理方法包括:获取待处理地址,待处理地址包括N个字符,N为正整数;获取待处理地址的语义特征向量以及N个字符中每个字符的字符特征向量;基于N个字符的字符特征向量进行地址等级分类,得到N个字符中每个字符的地址等级分类结果;基于N个字符的地址等级分类结果、N个字符的字符特征向量以及语义特征向量,对待处理地址进行纠正处理得到目标地址。由于在对待处理地址进行纠正处理得到目标地址过程中,考虑了待处理地址的语义特征信息,还考虑了N个字符的字符特征向量以及N个字符的地址等级分类结果,使用了较多的特征信息,从而提高了目标地址的准确性。

技术研发人员:罗奇帅,肖冰,曹磊,李长林
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1