地址处理方法及装置、电子设备、存储介质与流程

文档序号:27434853发布日期:2021-11-17 22:45阅读:127来源:国知局
地址处理方法及装置、电子设备、存储介质与流程

1.本发明涉及大数据领域,具体而言,涉及一种地址处理方法及装置、电子设备、存储介质。


背景技术:

2.当今社会是一个信息化的社会,服务器需要处理的外界信息也越来越多,其中就包含了大量的与地址相关的短文本信息;但是这些地址短文本很多都是片段地址,例如,用户登记用户信息时仅填写片段地址,或者在地址数据挖取过程出现丢失或存储出错等原因,导致片段地址涵盖的地址信息不全面,无法做到精准的定位,进而导致地址利用率很低,因此,需要对片段地址进行还原,以获取片段地址的补全地址。
3.相关技术中,对片段地址的还原方法严重依赖于地址字典,现有的字典树由于汇总的时间较早,且地址信息冗杂,所覆盖的范围较小,准确度较低,因此,现有的字典树无法做到实时更新以及地址字典涵盖的地址信息不全面,导致对片段地址还原的准确率低等问题。
4.针对上述相关技术中存在的技术问题,目前没有提出有效的解决方案。


技术实现要素:

5.鉴于上述问题,本发明提出了一种地址处理方法及装置、电子设备、存储介质,以至少解决相关技术中还原片段地址存在准确率低的技术问题。
6.第一方面,本发明提供了一种地址处理方法,包括:通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全,得到第一地址;若所述地址文本中含有所述预设字典树未匹配到的子地址文本,则利用地址关键词库对所述子地址文本进行模糊匹配,得到第二地址;将所述第一地址和所述第二地址进行融合,得到所述地址文本补全后的目标地址。
7.可选的,所述通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全包括:将所述地址文本输入到由所述地址标准化api调用的预设字典树中,其中,所述预设字典树是由预设级别的行政区划信息和地理兴趣点信息构建的;采用动态规划的方式在所述预设字典树中查找与所述地址文本匹配的最短规划路径;基于所述最短规划路径输出所述第一地址。
8.可选的,所述利用地址关键词库对所述子地址文本进行模糊匹配包括:提取所述子地址文本中的关键字;通过模糊匹配模型在所述地址关键词库中查找与所述关键字关联的地址关键词,其中,所述地址关键词库包括地址的各个地址级别对应的地址关键词;将所述地址关键词作为所述子地址文本的第二地址。
9.可选的,所述将所述第一地址和所述第二地址进行融合得到所述地址文本补全后的目标地址包括:基于所述预设字典树判断是否保留所述第二地址中各个地址级别对应的子地址;将所述第二地址中保留下来的子地址和所述第一地址进行融合,得到所述目标地
址。
10.可选的,所述基于所述预设字典树判断是否保留所述第二地址中各个地址级别对应的子地址包括以下至少之一:若所述第一地址中任一地址级别对应的第一子地址与所述第二地址中任一地址级别对应的第二子地址属于同一地址级别,则保留所述第一子地址并删除所述第二子地址;若所述第二地址中没有与所述第一子地址属于相同地址级别的地址,则保留所述第一子地址;若所述第一地址中没有与所述第二子地址属于相同地址级别的地址,则保留所述第二子地址。
11.可选的,若所述目标地址包括多个目标地址,所述方法还包括:选定所述多个目标地址中任一目标地址作为第三地址,判断所述第三地址是否存在地址范围限定表中;若所述第三地址存在所述地址范围限定表中,则将所述第三地址作为所述地址文本补全后的目标地址;否则,删除所述第三地址。
12.可选的,在得到所述第一地址之后,若所述地址文本均被所述预设字典树匹配到,且所述第一地址包括多个第一地址,所述方法还包括:选定所述多个第一地址中的任一第一地址作为第四地址,判断所述第四地址是否存在地址范围限定表中;若所述第四地址存在所述地址范围限定表中,则将所述第四地址作为所述地址文本补全后的目标地址;否则,删除所述第四地址。
13.第二方面,本发明提供了一种地址处理装置,包括:补全模块,用于通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全,得到第一地址;匹配模块,用于当所述地址文本中含有所述预设字典树未匹配到的子地址文本时,利用地址关键词库对所述子地址文本进行模糊匹配,得到第二地址;融合模块,用于将所述第一地址和所述第二地址进行融合,得到所述地址文本补全后的目标地址。
14.可选的,所述补全模块包括:输入单元,用于将所述地址文本输入到由所述地址标准化api调用的预设字典树中,其中,所述预设字典树是由预设级别的行政区划信息和地理兴趣点信息构建的;第一查找单元,用于采用动态规划的方式在所述预设字典树中查找与所述地址文本匹配的最短规划路径;输出单元,用于基于所述最短规划路径输出所述第一地址。
15.可选的,所述匹配模块包括:提取单元,用于提取所述子地址文本中的关键字;第二查找单元,用于通过模糊匹配模型在所述地址关键词库中查找与所述关键字关联的地址关键词,其中,所述地址关键词库包括地址的各个地址级别对应的地址关键词;确定单元,用于将所述地址关键词作为所述子地址文本的第二地址。
16.可选的,所述融合模块包括:处理单元,用于基于所述预设字典树判断是否保留所述第二地址中各个地址级别对应的子地址;融合单元,用于将所述第二地址中保留下来的子地址和所述第一地址进行融合,得到所述目标地址。
17.可选的,所述处理单元包括以下至少之一:第一处理子单元,用于当所述第一地址中任一地址级别对应的第一子地址与所述第二地址中任一地址级别对应的第二子地址属于同一地址级别时,保留所述第一子地址并删除所述第二子地址;第二处理子单元,用于当所述第二地址中没有与所述第一子地址属于相同地址级别的地址时,保留所述第一子地址;第三处理子单元,用于当所述第一地址中没有与所述第二子地址属于相同地址级别的地址时,保留所述第二子地址。
18.可选的,所述装置还包括:第一判断模块,用于当所述目标地址包括多个目标地址时,选定所述多个目标地址中任一目标地址作为第三地址,判断所述第三地址是否存在地址范围限定表中;第一确定模块,用于当所述第三地址存在所述地址范围限定表中时,将所述第三地址作为所述地址文本补全后的目标地址;否则,删除所述第三地址。
19.可选的,所述装置还包括:第二判断模块,用于在得到所述第一地址之后,当所述地址文本均被所述预设字典树匹配到时,且所述第一地址包括多个第一地址,选定所述多个第一地址中的任一第一地址作为第四地址,判断所述第四地址是否存在地址范围限定表中;第二确定模块,用于当所述第四地址存在所述地址范围限定表中时,将所述第四地址作为所述地址文本补全后的目标地址;否则,删除所述第四地址。
20.第三方面,本发明还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
21.第四方面,本发明还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项装置实施例中的步骤。
22.本发明实施例提供的地址处理方法,通过地址标准化api函数调用预设字典树对输入的地址文本进行一次地址补全,可以提高利用字典树对地址文本清洗的效率;接着,如果输入的地址文本中含有预设字典树未匹配到的子地址,则利用地址关键词库对该子地址进行模糊匹配,以对该子地址进行二次地址补全,补充了现有的依赖字典树对片段地址还原存在的未覆盖到的地址信息;然后对两次地址补全结果进行地址融合,得到地址文本的最终补全地址,使得最终还原的片段地址更加准确、更完整,从而解决了相关技术中还原片段地址存在准确率低的技术问题,进而提高了对片段地址的利用率。
附图说明
23.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍。
24.图1是本发明实施例提供的一种地址处理方法应用于计算机终端的硬件结构框图;
25.图2是根据本发明实施例提供的一种地址处理方法的流程图;
26.图3是根据本发明实施例提供的另一种地址处理方法的流程图;
27.图4是根据本发明实施例提供的一种地址处理装置的结构框图;
28.图5是根据本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
29.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
30.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用
在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。
31.本发明实施例所提供的方法实施例可以在移动终端、服务器、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例提供的一种地址处理方法应用于计算机终端的硬件结构框图。如图1所示,计算机终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述计算机终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述计算机终端的结构造成限定。例如,计算机终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
32.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的地址处理方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器,也可以包括易失性存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
33.传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
34.本发明实施例提供了一种地址处理方法。下面以具体地实施例对本发明的技术方案以及本发明的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
35.图2是根据本发明实施例提供的一种地址处理方法的流程图,如图2所示,该流程包括如下步骤:
36.步骤s202,通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全,得到第一地址;
37.在本实施例中,地址标准化应用程序接口api,简称地址标准化api,指代事先写好的、可以直接使用预设字典树的调用函数,对输入的片段地址(即上述地址文本)进行地址清洗,以实现片段地址的补全。
38.步骤s204,若地址文本中含有预设字典树未匹配到的子地址文本,则利用地址关键词库对子地址文本进行模糊匹配,得到第二地址;
39.在本实施例中,如果地址文本中的某一地址级别对应的子地址文本未出现在预设字典树中,则进一步地利用地址关键词库对该子地址文本进行二次地址补全,其中,地址关键词库中涵盖了各个地址级别的地址信息,从而补充了预设字典树未覆盖到的地址信息。
40.步骤s206,将第一地址和第二地址进行融合,得到地址文本补全后的目标地址。
41.本发明实施例提供的地址处理方法,通过地址标准化api函数调用预设字典树对输入的地址文本进行一次地址补全,可以提高利用字典树对地址文本清洗的效率;接着,如果输入的地址文本中含有预设字典树未匹配到的子地址,则利用地址关键词库对该子地址进行模糊匹配,以对该子地址进行二次地址补全,补充了现有的依赖字典树对片段地址还原存在的未覆盖到的地址信息;然后对两次地址补全结果进行地址融合,得到地址文本的最终补全地址,使得最终还原的片段地址更加准确、更完整,从而解决了相关技术中还原片段地址存在准确率低的技术问题,进而提高了对片段地址的利用率。
42.本发明实施例中提供了一种可能的实现方式,通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全包括:将地址文本输入到由地址标准化api调用的预设字典树中,其中,预设字典树是由预设级别的行政区划信息和地理兴趣点信息构建的;采用动态规划的方式在预设字典树中查找与地址文本匹配的最短规划路径;基于最短规划路径输出第一地址。
43.在本实施例中,在进行地址清洗之前,先构建预设字典树,其中,预设字典树中的映射地址至少包括以下地址信息:1)来自国家统计局的前五级地址(省、市、区、乡县、社区)(即上述行政区划信息),例如,浙江省/杭州市/拱墅区/祥符街道/吉如社区为一条地址信息,由前五级行政区划信息组成了预设字典树的第一部分;2)全国范围内的地理兴趣点poi(全称为point of interest)信息,与区对应映射,由poi数据形成了预设字典树的第二部分,例如xx小区对应拱墅区。
44.当地址文本输入预设字典树后,通过动态规划算法在预设字典树中查找与之匹配的最短路径,然后输出最短路径对应的地址(即上述第一地址),例如,若匹配到前五级地址数据中的某一级,则输出该级及以上的地址。通过调用地址标准化api查找最短路径能够加快匹配到最优地址的速度。
45.下面结合若干具体示例对上述实施例做进一步的说明:
46.地址片段1(即上述输入的地址文本):杭行路199号。仅从该地址片段无法得知该路在哪个省份/城市/区等,若通过地址标准化api在地址字典树中匹配到杭行路对应的区为拱墅区,则还原地址结果为:浙江省杭州市拱墅区杭行路199号(即上述第一地址);其中,杭行路属于poi数据。
47.地址片段2(即上述输入的地址文本):xx小区。同样的道理,若匹配出xx小区在预设字典树中对应的是拱墅区,则通过地址标准化api还原地址为:浙江省杭州市拱墅区xx小区(即上述第一地址);其中,xx小区属于poi数据。
48.地址片段3(即上述输入的地址文本):吉如社区。社区在预设字典树中属于第五级地址(国内官方确定有行政代码等级的地址只精确到社区),通过预设字典树匹配到吉如社区对应的是浙江省/杭州市/拱墅区/祥符街道,则还原地址为:浙江省杭州市拱墅区祥符街道吉如社区(即上述第一地址);其中,吉如社区属于第五级地址数据。
49.地址片段4(即上述输入的地址文本):拱墅区。同理,还原地址为浙江省杭州市拱墅区(即上述第一地址);其中,拱墅区属于第三级地址数据。
50.地址片段5(即上述输入的地址文本):浙江省杭州市xx小区。该地址本身相对较完整,通过预设字典树匹配后还原的地址为:浙江省杭州市拱墅区xx小区(即上述第一地址)。
51.本实施例提供的poi数据包括了小区/大厦/村/写字楼/商场等全国范围的地址信息,且能够实时更新,使得地址字典树的覆盖范围广、还原准确度高,直接调用地址标准化api提高了地址清洗效率,利用更全/更准的地址字典树可以给地址还原提供强有力的支持。
52.在本案的一个可选的实施例中,利用地址关键词库对子地址文本进行模糊匹配包括:提取子地址文本中的关键字;通过模糊匹配模型在地址关键词库中查找与关键字关联的地址关键词,其中,地址关键词库包括地址的各个地址级别对应的地址关键词;将地址关键词作为子地址文本的第二地址。
53.在本实施例中,地址关键词库是通过对批量处理的地址数据的关键字汇总,涵盖了各个地址级别的地址信息;具体地,地址关键词库至少包括以下内容:a、第一级省份多以xx省结尾;b、第二级城市多以xx市/自治州/地区/盟等结尾;c、第三级多以xx区/市(县级市)等结尾;d、第四级多以xx镇/乡/街道等结尾;e、第五级多以xx村(行政村)/社区等结尾;f、第六级多以xx路/街/弄/巷等结尾;g、第七级poi多以村(非行政村)/小区/大厦以及其他特殊名字的小区等结尾;h、第八级包括小区/村内的以街/路/巷结尾的路名;i、楼栋/单元号/户室信息。
54.进一步地,提取上述地址文本中未被匹配到的子地址的关键字,然后利用关键字匹配的模糊算法进行地址补全。比如地址片段:杭州市xx小区。其中,xx小区并未出现在预设字典树中,则通过地址标准化api清洗后的地址只能还原出浙江省杭州市,即仅补充了行政区划信息,却遗漏了具体的xx小区;进一步地,对剩下的地址片段(即未被预设字典树匹配到的子地址)通过小区关键字进行模糊匹配。
55.在一个具体示例中,对于片段地址:杭州市滨江区钱龙大厦16楼1602室。假如预设字典树中没有匹配到钱龙大厦,则清洗后返回浙江省杭州市滨江区(即上述第一地址),并返回未匹配到的短文本钱龙大厦16楼1602室;然后通过关键字“大厦”可以匹配到钱龙大厦,通过关键字“楼”可以匹配到16楼,通过关键字“室”匹配到1602室,最后返回的地址结果为:浙江省杭州市滨江区钱龙大厦16楼1602室(即上述第二地址)。
56.在本案的一个可选的实施例中,将第一地址和第二地址进行融合得到地址文本补全后的目标地址包括:基于预设字典树判断是否保留第二地址中各个地址级别对应的子地址;将第二地址中保留下来的子地址和第一地址进行融合,得到目标地址。在本实施例中,对于补全后的第一地址和第二地址,针对每一级地址,若预设字典树已经匹配到的,则优先使用预设字典树匹配出的地址;若预设字典树未匹配到,则使用通过地址关键词库匹配到的地址。
57.根据上述实施例,基于预设字典树判断是否保留第二地址中各个地址级别对应的子地址包括以下至少之一:若第一地址中任一地址级别对应的第一子地址与第二地址中任一地址级别对应的第二子地址属于同一地址级别,则保留第一子地址并删除第二子地址;若第二地址中没有与第一子地址属于相同地址级别的地址,则保留第一子地址;若第一地址中没有与第二子地址属于相同地址级别的地址,则保留第二子地址。
58.在一个示例中,片段地址:杭州市滨江区钱龙大厦16楼1602室。输入预设字典树后匹配得到的第一地址为浙江省杭州市滨江区,利用地址关键词库得到的第二地址为:钱龙大厦(即上述第二子地址);则保留钱龙大厦。
59.在本案的一个可选的实施例中,若目标地址包括多个目标地址,还包括:选定多个目标地址中任一目标地址作为第三地址,判断第三地址是否存在地址范围限定表中;若第三地址存在地址范围限定表中,则将第三地址作为地址文本补全后的目标地址;否则,删除第三地址。
60.在本实施例中,地址范围限定表是表示对输入的地址文本的特定范围圈定,即为每个地址片段(即上述地址文本)提供一个潜在的或可能的地址(准确到区);可选地,可将地址文本的数据来源作为该地址文本的一个潜在的或可能的地址;进一步地,若融合会后的目标地址存在多个,利用地址范围限定表对融合后的地址进行筛选;若融合后的地址在地址范围限定表中,则保留;否则,删除。
61.在一个示例中,短文本地址:万达广场。由于全国范围内有很多个万达广场,可能是杭州的万达广场,也有可能是上海的万达广场,这种情况会增加还原地址的困难度;本实施例中通过地址范围限定表对该短文本地址作了条件限制,若该地址出现的可能地点为杭州市拱墅区范围,即对融合地址增加了一个筛选条件;若地址范围限定表中指定的是杭州市拱墅区范围内的万达广场,在这前提下,还原地址为浙江省杭州市拱墅区万达广场(即上述第三地址)。
62.可选的,在得到第一地址之后,若地址文本均被预设字典树匹配到,且第一地址包括多个第一地址,还包括:选定多个第一地址中的任一第一地址作为第四地址,判断第四地址是否存在地址范围限定表中;若第四地址存在地址范围限定表中,则将第四地址作为地址文本补全后的目标地址;否则,删除第四地址。
63.在本实施例中,如果输入的地址文本在预设字典树中都能匹配到,但是通过预设字典树中查找到有多条最短路径,则会输出多个第一地址,则同样可通过利用地址范围限定表来增加筛选条件。例如,片段地址:万达广场。通过预设字典树进行地址清洗后,匹配出两条数据:1)上海市浦东区万达广场;2)浙江省杭州市拱墅区万达广场。进一步地,与地址范围限定表对比,表中只有杭州市拱墅区,则最后输出的还原地址为浙江省杭州市拱墅区万达广场(即上述第四地址)。
64.下面结合一具体实施例提供的另一地址处理流程对本发明做进一步地说明:
65.图3是根据本发明实施例提供的另一种地址处理方法的流程图,如图3所示,该具体实施例包括的流程步骤如下:
66.步骤s301,输入地址片段(即上述地址文本)。
67.步骤s302,地址字典api清洗。本实施例中,通过地址标准化api调用预设字典树对输入的地址片段进行地址补全,得到第一地址;其中,预设字典树中涵盖了前五级的行政区划信息和地理兴趣点信息。
68.步骤s303,地址规则抽取。在本实施例中,如果上述第一地址中含有未被地址字典api清洗的子地址,则提取子地址中的关键字;然后利用地址关键词库对关键字进行模糊匹配,得到第二地址;其中,地址关键词库涵盖了各个地址级别的地址信息。
69.步骤s304,判断是否与地址字典矛盾。在本实施例中,判断上述第一地址和第二地址是否与预设字典树冲突;由于第一地址是从预设字典树中匹配得到的,即默认第一地址与预设字典树不冲突,则执行步骤s305,优选保留地址字典;如果第二地址中的某一地址级别对应子地址未出现在预设字典树中,即是通过地址关键词库匹配得到的,保留第二地址
中的子地址,该情况也与预设字典树不冲突,则执行步骤s306,对各级地址融合。
70.步骤s307,对融合后的地址或者优选地保留的地址,判断是否在地址范围限定表内;如果存在,则执行步骤s308,保留该地址;否则,执行步骤s309删除该地址。
71.通过上述实施步骤,本发明实施例通过运用地址标准化api和地址关键词库来完善片段地址,包括该地址片段所在的省、市、区(县)、乡镇、社区、街路、poi等,补充了地址字典未覆盖到的地址信息(比如户室/poi/街路/社区/乡县等),并且支持模糊匹配,来实现对地址片段完整还原,大大地增加了片段地址还原的完整性以及覆盖率。
72.基于上文各个实施例提供的地址处理方法,基于同一发明构思,在本实施例中还提供了一种地址处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
73.图4是根据本发明实施例提供的一种地址处理装置的结构框图,如图4所示,该装置包括:补全模块40,用于通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全,得到第一地址;匹配模块42,连接至上述补全模块40,用于当地址文本中含有预设字典树未匹配到的子地址文本时,利用地址关键词库对子地址文本进行模糊匹配,得到第二地址;融合模块44,连接至上述匹配模块42,用于将第一地址和第二地址进行融合,得到地址文本补全后的目标地址。
74.可选的,补全模块40包括:输入单元,用于将地址文本输入到由地址标准化api调用的预设字典树中,其中,预设字典树是由预设级别的行政区划信息和地理兴趣点信息构建的;第一查找单元,用于采用动态规划的方式在预设字典树中查找与地址文本匹配的最短规划路径;输出单元,用于基于最短规划路径输出第一地址。
75.可选的,匹配模块42包括:提取单元,用于提取子地址文本中的关键字;第二查找单元,用于通过模糊匹配模型在地址关键词库中查找与关键字关联的地址关键词,其中,地址关键词库包括地址的各个地址级别对应的地址关键词;确定单元,用于将地址关键词作为子地址文本的第二地址。
76.可选的,融合模块44包括:处理单元,用于基于预设字典树判断是否保留第二地址中各个地址级别对应的子地址;融合单元,用于将第二地址中保留下来的子地址和第一地址进行融合,得到目标地址。
77.可选的,处理单元包括以下至少之一:第一处理子单元,用于当第一地址中任一地址级别对应的第一子地址与第二地址中任一地址级别对应的第二子地址属于同一地址级别时,保留第一子地址并删除第二子地址;第二处理子单元,用于当第二地址中没有与第一子地址属于相同地址级别的地址时,保留第一子地址;第三处理子单元,用于当第一地址中没有与第二子地址属于相同地址级别的地址时,保留第二子地址。
78.可选的,上述装置还包括:第一判断模块,用于当目标地址包括多个目标地址时,选定多个目标地址中任一目标地址作为第三地址,判断第三地址是否存在地址范围限定表中;第一确定模块,用于当第三地址存在地址范围限定表中时,将第三地址作为地址文本补全后的目标地址;否则,删除第三地址。
79.可选的,上述装置还包括:第二判断模块,用于在得到第一地址之后,当地址文本
均被预设字典树匹配到时,且第一地址包括多个第一地址,选定多个第一地址中的任一第一地址作为第四地址,判断第四地址是否存在地址范围限定表中;第二确定模块,用于当第四地址存在地址范围限定表中时,将第四地址作为地址文本补全后的目标地址;否则,删除第四地址。
80.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
81.基于上文各个实施例提供的地址处理方法,基于同一发明构思,在本实施例中还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
82.可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
83.s1,通过地址标准化应用程序接口api调用预设字典树对输入的地址文本进行地址补全,得到第一地址;
84.s2,若所述地址文本中含有所述预设字典树未匹配到的子地址文本,则利用地址关键词库对所述子地址文本进行模糊匹配,得到第二地址;
85.s3,将所述第一地址和所述第二地址进行融合,得到所述地址文本补全后的目标地址。
86.可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read

only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
87.基于上述图2所示方法和图4所示装置的实施例,为了实现上述目的,本发明实施例还提供了一种电子设备,如图5所示,包括存储器52和处理器51,其中存储器52和处理器51均设置在总线53上存储器52存储有计算机程序,处理器51执行计算机程序时实现图2所示的地址处理方法。
88.基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个存储器(可以是cd

rom,u盘,移动硬盘等)中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施场景所述的方法。
89.可选地,该设备还可以连接用户接口、网络接口、摄像头、射频(radio frequency,rf)电路,传感器、音频电路、wi

fi模块等等。用户接口可以包括显示屏(display)、输入单元比如键盘(keyboard)等,可选用户接口还可以包括usb接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、wi

fi接口)等。
90.本领域技术人员可以理解,本实施例提供的一种电子设备的结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
91.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
92.显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成
的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
93.以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1