地址处理方法、装置及计算机可读存储介质与流程

文档序号:37017500发布日期:2024-02-09 13:09阅读:16来源:国知局
地址处理方法、装置及计算机可读存储介质与流程

本技术实施例涉及大数据,特别是涉及一种地址处理方法、装置及计算机可读存储介质。


背景技术:

1、随着物流产业的不断发展,物流服务越来越趋向于专业化与精细化;与此同时,物流快递企业虽然也在快速成长中,但由于其可配送范围日益扩张,致使物流服务人员面对的地址审核工作越来越多,因此,物流快递业务的快速发展也为送货地址的审核工作带来了极大挑战。

2、对此,市面上陆续出现了很多地址分析产品,用于判断用户输入的地址信息是否正确,但这类型产品也只能判断地址信息是否录入正确,对于错误地址信息的矫正缺乏合理策略,如用户经常会把“某某路的东段”表述成“某某东路”,从而导致物流快件不能及时有效地分配至各个网点,严重影响物流效率。

3、因此,现有的地址分析技术存在着错误地址矫正精度不高的技术问题。


技术实现思路

1、本技术的目的在于提供一种地址处理方法、装置及计算机可读存储介质,用以提高错误地址信息的矫正精准度,进而提升物流效率,节省人力成本。

2、第一方面,本技术提供一种地址处理方法,包括:

3、获取待处理地址的分词内容;

4、基于预设的地址真值库,对分词内容进行精确匹配,得到匹配结果;

5、若匹配结果为匹配失败,则基于预设的干预处理策略,对分词内容进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功;其中,干预处理包括以下至少一种:方位词添加、单词合并、后缀补充、交汇词信息删除、数字转换;

6、将精确匹配成功的待处理地址作为目标地址,以从地址真值库中提取出目标地址的地址坐标进行反馈。

7、在本技术一些实施例中,分词内容包括地址单词和词级标签,若匹配结果为匹配失败,则基于预设的干预处理策略,对分词内容进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:若匹配结果为匹配失败,则筛选出地址单词中的目标地址单词;其中,目标地址单词是根据预设的干预处理策略确定的;基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功;其中,干预处理策略包括第一干预处理策略、第二干预处理策略、第三干预处理策略、第四干预处理策略、第五干预处理策略以及第六干预处理策略中的任意一个。

8、在本技术一些实施例中,词级标签包括道路标签,目标地址单词包括词级标签为道路标签的地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:若目标地址单词中存在预设的方位词信息,则基于第一干预处理策略,对目标地址单词进行方位词删除干预处理,直至干预处理后的分词内容被判定为精确匹配成功;若目标地址单词中不存在方位词信息,则基于第一干预处理策略,对目标地址单词进行方位词添加干预处理,直至干预处理后的分词内容被判定为精确匹配成功;方位词添加干预处理是针对目标地址单词添加预设方位词的处理方式。

9、在本技术一些实施例中,词级标签包括兴趣点标签、社区标签以及支路标签,目标地址单词包括词级标签为兴趣点标签和/或社区标签的地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:确定目标地址单词的下级地址单词;若下级地址单词的词级标签为支路标签,则基于第二干预处理策略,将目标地址单词和下级地址单词进行合并干预处理,直至干预处理后的分词内容被判定为精确匹配成功。

10、在本技术一些实施例中,词级标签包括兴趣点标签、地址描述标签、门牌号标签、支门牌号标签以及楼栋号标签,目标地址单词包括词级标签为兴趣点标签和/或地址描述标签的地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:确定目标地址单词的下级地址单词;若下级地址单词的词级标签为门牌号标签、支门牌号标签、楼栋号标签中的任意一个,则基于第三干预处理策略,对目标地址单词进行后缀补充干预处理,直至干预处理后的分词内容被判定为精确匹配成功;后缀补充干预处理是针对目标地址单词补充预设后缀信息的处理方式。

11、在本技术一些实施例中,词级标签包括道路标签,目标地址单词包括词级标签为道路标签的地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:确定目标地址单词的下级地址单词;若下级地址单词为预设的交汇词信息,且存在至少一个目标地址单词的匹配结果为匹配成功,且存在至少一个目标地址单词的匹配结果为匹配失败,则确定匹配失败的至少一个目标地址单词为待处理地址单词;基于第四干预处理策略,对待处理地址单词进行后缀补充干预处理,直至干预处理后的分词内容被判定为精确匹配成功;后缀补充干预处理是针对待处理地址单词补充预设后缀信息的处理方式。

12、在本技术一些实施例中,词级标签包括道路标签,道路标签包括支路标签,目标地址单词包括词级标签为道路标签的地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:确定目标地址单词的下级地址单词;若下级地址单词为预设的交汇词信息,且存在至少一个目标地址单词的匹配结果为匹配成功,且匹配成功的至少一个目标地址单词包含预设的后缀信息,且存在至少一个目标地址单词的匹配结果为匹配失败,且匹配失败的至少一个目标地址单词的词级标签为支路标签,则基于第五干预处理策略,对交汇词信息进行删除干预处理,并对匹配成功的至少一个目标地址单词的后缀信息进行删除干预处理,直至干预处理后的分词内容被判定为精确匹配成功。

13、在本技术一些实施例中,词级标签包括主路标签、支路标签以及门牌号标签,目标地址单词包括词级标签为主路标签的第一目标地址单词,以及词级标签为支路标签的第二目标地址单词;其中,基于预设的干预处理策略,对目标地址单词进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,包括:若第一目标地址单词的匹配结果为匹配成功,且第二目标地址单词包含预设的后缀信息,且第二目标地址单词的匹配结果为匹配失败,则确定第二目标地址单词的下级地址单词;若下级地址单词的词级标签非门牌号标签,则基于第六干预处理策略,对目标地址单词进行数字转换干预处理,直至干预处理后的分词内容被判定为精确匹配成功;数字转换干预处理是针对阿拉伯数字与中文汉字之间进行相互转换的处理方式。

14、在本技术一些实施例中,获取待处理地址的分词内容,包括:获取待处理地址的各个地址单词;其中,各地址单词是通过对待处理地址进行规范化处理和分词处理得到的;通过预设的多级地址分级模型,对各地址单词进行分级处理,得到与各地址单词关联的词级标签;确定各地址单词和各词级标签,作为分词内容。

15、在本技术一些实施例中,分词内容包括地址单词和词级标签,基于预设的地址真值库,对分词内容进行精确匹配,得到匹配结果,包括:提取出分词内容中的地址单词和词级标签;其中,地址单词和词级标签是通过对待处理地址进行规范化处理和分词处理得到的;基于预设的地址真值库,确定与各地址单词相匹配的目标地址真值,得到与各目标地址真值关联的真值词级标签;其中,目标地址真值是指与地址单词的文字内容和文字顺序相匹配的地址真值;确定真值词级标签为城市级别的目标地址真值的第一城市编码,并确定词级标签为城市级别的地址单词的第二城市编码;根据第一城市编码和第二城市编码,对分词内容进行精确匹配,得到匹配结果。

16、在本技术一些实施例中,根据第一城市编码和第二城市编码,对分词内容进行精确匹配,得到匹配结果,包括:若第一城市编码与第二城市编码匹配一致,则提取词级标签为道路标签的地址单词作为目标地址单词,以判断与目标地址单词文字内容和文字顺序相匹配的目标地址真值的真值词级标签,是否与目标地址单词的词级标签匹配一致;若是,则对照词级标签和真值词级标签,判断各目标地址真值的上级地址真值与各目标地址单词的上级地址单词是否相匹配;若是,则判定分词内容的匹配结果为匹配成功。

17、第二方面,本技术提供一种地址处理装置,包括:

18、地址获取模块,用于获取待处理地址的分词内容;

19、精确匹配模块,用于基于预设的地址真值库,对分词内容进行精确匹配,得到匹配结果;

20、干预处理模块,用于若匹配结果为匹配失败,则基于预设的干预处理策略,对分词内容进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功;其中,干预处理包括以下至少一种:方位词添加、单词合并、后缀补充、交汇词信息删除、数字转换;

21、坐标提取模块,用于将精确匹配成功的待处理地址作为目标地址,以从地址真值库中提取出目标地址的地址坐标进行反馈。

22、第三方面,本技术还提供一种计算机设备,包括:

23、一个或多个处理器;

24、存储器;以及一个或多个应用程序,其中的一个或多个应用程序被存储于存储器中,并配置为由处理器执行以实现上述地址处理方法。

25、第四方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器进行加载,以执行地址处理方法中的步骤。

26、第五方面,本技术实施例提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面提供的方法。

27、上述地址处理方法、装置、计算机设备及存储介质,服务器通过获取待处理地址的分词内容,并基于预设的地址真值库,对分词内容进行精确匹配,即可得到匹配结果,进而响应于匹配结果为匹配失败,基于预设的干预处理策略,对分词内容进行干预处理,直至干预处理后的分词内容被判定为精确匹配成功,最后将精确匹配成功的待处理地址作为目标地址,以从地址真值库中提取出目标地址的地址坐标进行反馈。如此,即可解决现有技术无法矫正用户所输地址可能出现的错误或主观描述的问题,提升错误地址信息的矫正精准度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1