一种空间推理的地址反算定位方法与流程

文档序号:32058695发布日期:2022-11-04 22:27阅读:84来源:国知局
一种空间推理的地址反算定位方法与流程

1.本发明涉及地址处理技术领域,特别涉及一种空间推理的地址反算定位方法。


背景技术:

2.地名是指地理实体的专有名称,地址是指具有地名的某一特定空间位置上自然或人文地理实体位置的结构化描述。地名地址信息作为智慧城市建设最基础的信息,在各行各业均有广泛的应用,但是由于现有地名地址数据应用存在数据不标准、不准确、来源不一致等问题,导致地名地址复用性大大降低,不同部门的政务信息空间化困难,难以汇聚至统一的地理位置,无法开展多数据源的数据挖掘分析与综合利用。


技术实现要素:

3.本发明所要解决的技术问题是针对上述现有技术提供一种地址定位准确率更高的空间推理的地址反算定位方法。
4.本发明解决上述技术问题所采用的技术方案为:一种空间推理的地址反算定位方法,其特征在于:包括如下步骤:
5.步骤1、在标准地址库中增加poi数据和地理实体数据,构建成复合地址词典;
6.步骤2、将复合地址词典中的地址按照行政区划分层级先后顺序建立成树形结构的地址层级树,并在地址层级树中对行政区划分后存在至少两种索引的行政层级相应地增加限定区域索引;
7.步骤3、将复合地址词典中的每个地址按照上述步骤2中的地址层次树进行建树,得到每个地址所对应的地址树,并将所有地址树构建成数据库;
8.步骤4、获取待匹配地址,并对待匹配地址依次进行预处理和分词处理,获得待匹配地址分词后的各层级地址要素;
9.步骤5、对待匹配地址分词后的各层级地址要素按照步骤2中的地址层次树进行建树,构建成待匹配地址的地址树;
10.步骤6、分别将待匹配地址分词后的各等级地址要素与数据库中的地址树进行查找,并判断待匹配地址的各等级地址要素均是否能在数据库的地址树中找到对应的节点,如是,则将每一个等级的地址要素对应查找到的地址树节点组成一个节点名称的集合,然后验证各节点之间的层次关系,得到一条与待匹配地址匹配的地址路径,结束;如否,则转入到步骤7;
11.步骤7、在步骤3的所有地址树对应的第n个层级地址中检索与待匹配地址的第n 个层级地址要素最邻近的地址,其中n为行政区划分的总层级;
12.并判断检索到地址树中最邻近的地址与待匹配地址的第n个层级地址要素之间的距离lc是否小于等于预设值,如是,则以检索到的地址树中最邻近的地址坐标位置作为待匹配地址的定位结果;如否,则在所有地址树所对应的预设行政区划单元中检索出待匹配地址的地址要素所处的位置,并将检索出的地址树的坐标位置作为待匹配地址的定位结
果。
13.本方案中,所述步骤1中的标准数据库为由民政部门编制的标准地址组成。
14.为进一步提高地址定位的准确率,所述步骤1中复合地址词典构建时还包括如下操作:在标准地址库中增加由本地化特色的俗语、简称或地名生僻字词组成的通名词典。
15.优选地,所述步骤2中标准地址按照行政区划分层级分成六级,按照先后顺序依次为:
16.第一层级:省;
17.第二层级:市;
18.第三层级:区或县;
19.第四层级:镇、乡或街道;
20.第五层级:村、小区或道路;
21.第六层级:门牌号、幢号或单位号。
22.为根据地址之间的关系,以最大程度提高位置定位的准确性,优选地,将地址层级树的第四层级增加村社区和基层网格作为限定区域索引。
23.对待匹配地址进行预处理的方式有很多种,其中优选地为,所述步骤4中对待匹配地址进行的预处理操作至少包括:去除字母、去除特殊字符、补充行政层级中的一种或多种。
24.为防止地址定位出错,所述步骤4和步骤5之间还包括如下步骤:
25.根据地址层级树矫正待匹配地址分词后的各层级地址要素关系错误情况和处理重名节点之间错误的上下层级关系。
26.为提高地址定位的精度,所述步骤7中,当在所有地址树所对应的预设行政区划单元中检索出待匹配地址的地址要素所处的位置后,还包括步骤8:
27.步骤8、计算在所有地址树中检索出的坐标位置与待匹配地址之间的地名相似度,并判断地名相似度是否大于等于s,其中s为预设的地名相似度阈值,如是,则将在所有地址树中检索出的坐标位置作为待匹配地址的定位结果;如否,则未找到待匹配地址的定位结果。
28.优选地,所述步骤7中预设行政区划单位为:基层网格、村社区或街道。
29.与现有技术相比,本发明的优点在于:通过对在标准地址库中增加poi数据和地理实体数据,构建成复合地址词典,从而提高地址定位的精准度;另外通过对地址进行分词和建树,以形成地址树,能够提高匹配效率。因此本方法能够有效提升匹配率和定位精度,适用于不同区域、类别、来源、质量的地名地址数据,满足智慧城市建设各类地名地址文本信息空间化需求。
附图说明
30.图1为本发明实施例中地址反算定位方法的流程框图;
31.图2为本发明实施例中地址层级树的框图。
具体实施方式
32.以下结合附图实施例对本发明作进一步详细描述。
33.如图1所示,本实施例中的空间推理的地址反算定位方法包括如下步骤:
34.步骤1、在标准地址库中增加poi数据和地理实体数据,构建成复合地址词典;
35.其中,该步骤中的标准数据库为由民政部门编制的标准地址组成,该标准地址为市、区民政局地名办根据《地名管理条例》编制的门牌地址,即为法定的、标准的门牌地址数据;对民政编制的门牌地址数据经分词后得到的分词库作为标准词典,主要为行政区划词典库,包括市、区县、乡镇街道、村社区、道路(街、路、巷)、小区等分词;为进一步提高地址反算定位的准确率,该步骤中复合地址词典构建时还包括如下操作:在标准地址库中增加由本地化特色的俗语、简称或地名生僻字词组成的通名词典;此外通过在标准地址库中增加poi数据(即:兴趣点)和地理实体数据,以对标准地址库进行补充,进一步丰富词典分词量,提高后续地址分词的准确度和匹配率;
36.其中,poi数据按照类别分成:购物、餐饮、生活服务、交通设施、旅游景点、休闲娱乐、体育健身、教育培训、文化传媒、医疗、金融、地产、公司企业、政府机构等类别,其中,购物分为购物中心、百货商场、超市、便利店、集市等;其中购物又分为购物中心、超市、商铺等,这poi数据中有些地物的知名度不足,因此当用知名度不足的poi点时用户并不清楚该poi点的具体位置,则该poi点的参考意义不大,所以需要提前对poi点进行筛选,提高指示性;地理实体数据指水库、湖泊等天然水体,景点景区以及水工设施、建筑等具有代表性的实体数据;
37.步骤2、将复合地址词典中的地址按照行政区划分层级先后顺序建立成树形结构的地址层级树,并在地址层级树中对行政区划分后存在至少两种索引的行政层级相应地增加限定区域索引;
38.其中,标准地址按照行政区划分层级分成六级,按照先后顺序依次为:
39.第一层级:省;
40.第二层级:市;
41.第三层级:区或县;
42.第四层级:镇、乡或街道;
43.第五层级:村、小区或道路;
44.第六层级:门牌号、幢号或单位号;
45.行政区划要素部分包括了省、市、区县、乡镇街道、村,在空间化结构里以面状形式出现,且存在层层包含关系,但行政区划关系里存在多样性问题,比如城市内部道路出现跨区、跨街道现象,道路和行政区划不构成严格的从属关系,故本方法将对区县、乡镇一级不作严格限定,增加基本区域限定层,除了乡镇街道以外,补充了村社区和基层网格尺度,作为第四层级的限定区域索引;具体关系如图2所示;
46.步骤3、将复合地址词典中的每个地址按照上述步骤2中的地址层次树进行建树,得到每个地址所对应的地址树,并将所有地址树构建成数据库;
47.步骤4、获取待匹配地址,并对待匹配地址依次进行预处理和分词处理,获得待匹配地址分词后的各层级地址要素;
48.其中对待匹配地址进行的预处理操作至少包括:去除字母、去除特殊字符、补充行政层级中的一种或多种;当然为了提高待匹配地址的定位准确率,在获得待匹配地址分词后的各层级地址要素后还包括如下步骤:根据地址层级树矫正待匹配地址分词后的各层级
地址要素关系错误情况和处理重名节点之间错误的上下层级关系;
49.步骤5、对待匹配地址分词后的各层级地址要素按照步骤2中的地址层次树进行建树,构建成待匹配地址的地址树;
50.本实施例中将待匹配地址构建成地址树的形式,能清楚的看到地址的行政区划分层级,便于将每个行政区划分层级进行对比,提高了待匹配地址中每个行政区划分层级的搜索效率;
51.步骤6、分别将待匹配地址分词后的各等级地址要素与数据库中的地址树进行查找,并判断待匹配地址的各等级地址要素均是否能在数据库的地址树中找到对应的节点,如是,则将每一个等级的地址要素对应查找到的地址树节点组成一个节点名称的集合,然后验证各节点之间的层次关系,得到一条与待匹配地址匹配的地址路径,结束;如否,则转入到步骤7;
52.步骤7、在步骤3的所有地址树对应的第n个层级地址中检索与待匹配地址的第n 个层级地址要素最邻近的地址,其中n为行政区划分的总层级;
53.并判断检索到地址树中最邻近的地址与待匹配地址的第n个层级地址要素之间的距离lc是否小于等于预设值,如是,则以检索到的地址树中最邻近的地址坐标位置作为待匹配地址的定位结果;如否,则在所有地址树所对应的预设行政区划单元中检索出待匹配地址的地址要素所处的位置,并将检索出的地址树的坐标位置作为待匹配地址的定位结果。
54.本实施例中,预设行政区划单元为乡镇街道、村社区或基层网格;
55.其中,当在所有地址树所对应的预设行政区划单元中检索出待匹配地址的地址要素所处的位置后,还包括步骤8:
56.步骤8、计算在所有地址树中检索出的坐标位置与待匹配地址之间的地名相似度,并判断地名相似度是否大于等于s,其中s为预设的地名相似度阈值,如是,则将在所有地址树中检索出的坐标位置作为待匹配地址的定位结果;如否,则未找到待匹配地址的定位结果。
57.为便于理解本发明中反算定位方法,本实施例中以某个具体待匹配地址为例进行说明,例如:待匹配地址为a省b市c区d街道e路110号,其中a、b、c、d、e均为真实地址的代称;待匹配地址的定位过程如下:
58.若在所有地址树的地址中检索到“a省b市c区d街道e路110号”的记录时,则待匹配地址的定位结果为“a省b市c区d街道e路110号”;
59.若在所有地址树的地址中未检索到“a省b市c区d街道e路110号”的记录时,则检索出与“a省b市c区d街道e路110号”相邻近的地址,如检索到:“a省b市 c区d街道e路105号”和“a省b市c区d街道e路120号”时,计算得到“110 号”与“105号”之间的距离为间隔5号,“110号”与“120号”之间的距离为间隔10 号,假设相邻两门牌号之间的距离相同,故“a省b市c区d街道e路105号”是与“a省b市c区d街道e路110号”最接近的位置;
60.一、当“a省b市c区d街道e路105号”与“a省b市c区d街道e路110 号”之间的距离小于等于预设值时,则“a省b市c区d街道e路105号”是待匹配地址的定位结果;
61.二、当“a省b市c区d街道e路105号”与“a省b市c区d街道e路110 号”之间的距离大于预设值时,则先定位“a省b市c区d街道e路110号”所属的基层网格,判断是否有定位到待
匹配地址所属的基层网格,如是,则最终确定出待匹配地址“a省b市c区d街道e路105号”的定位结果为:“a省b市c区f基层网格”;如否,则定位“a省b市c区d街道e路110号”所属的村社区或街道;故最终确定出待匹配地址“a省b市c区d街道e路105号”的定位结果为:“a省b市c区f 基层网络/村社区/乡镇街道”。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1