电子地图解析地址的方法、装置及存储介质与流程

文档序号:17722215发布日期:2019-05-22 02:15阅读:179来源:国知局
电子地图解析地址的方法、装置及存储介质与流程

本发明涉及大数据技术领域,尤其涉及一种电子地图解析地址的方法、装置及存储介质。



背景技术:

目前,电子地图提供的微服务包括:在电子地图上开放区域划分以及地址解析功能,针对特定地址(例如,某客户的家庭地址)可以在电子地图上直接标示,其目的是直观展示特定地址在各个区域的分布情况,以供业务使用。

现有的地址解析方法为调用第三方地址分析接口解析该特定地址,例如,调用百度地图接口或高德地图接口来解析,解析后得到经纬度信息,在电子地图上标示该特定地址。该方法的缺陷在于:第三方地址分析接口解析得到的信息不全面及直观,对于某些地址的标志性的建筑物的别称及简写等是不能标识的,因此电子地图的微服务功能有待提高。



技术实现要素:

本发明的目的在于提供一种电子地图解析地址的方法、装置及存储介质,旨在使得电子地图的地址解析更加全面、直观,优化了电子地图的微服务功能。

为实现上述目的,本发明提供一种电子地图解析地址的方法,所述电子地图解析地址的方法包括:

对于按照预定的区域划分方式划分的每一区域,从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语;

若有实际地点的位置与一待分析词语对应的实际位置相同,且该待分析词语在同一类型的数据源中与该实际地点一同出现的次数大于等于预设的次数,则确定该待分析词语为该实际地点的可替换地点词语,将该实际地点与该可替换地点词语关联后存储至预设的地址字词库中;

若接收到针对一客户地址的解析请求,则分析该客户地址是否为实际地点;

若是,则在电子地图上标注该客户地址;

若否,则在该地址字词库中查询是否有可替换地点词语与该客户地址相同,并在该地址字词库中有可替换地点词语与该客户地址相同时,将该可替换地点词语及关联的实际地点作为解析结果返回,以在电子地图上标注。

优选地,所述预定类型的数据源包括搜索引擎的文档库及网页内容。

优选地,若所述预定类型的数据源为搜索引擎的文档库,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

分别将该区域中的各个地点的地点词语作为搜索词输入至该搜索引擎中,通过该搜索引擎的文档库得到该搜索词对应的关键词,将该搜索词及该关键词作为对应地点相关的待分析词语。

优选地,若所述预定类型的数据源为网页内容,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

将每一网页内容与预设的词库中各个地点的建筑名称进行模式匹配,得到含有建筑名称的待分析语句;

按预设类型标点符号对该待分析语句进行短句拆分,对拆分的每一个短句,采用长词优先原则进行分词;

对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语。

优选地,所述对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语的步骤,具体包括:

根据通用字词典库中字和词分别与词性的映射关系确定该分词结果中的各分词对应的词性,及/或,根据预设的字和词分别与词性的映射关系确定该分词结果中各分词对应的词性,并进行标注,其中,预设的字和词分别与词性的映射关系的词性标注优先级高于通用字词典库中字和词分别与词性的映射关系的词性标注优先级。

为实现上述目的,本发明还提供一种电子地图解析地址的装置,所述电子地图解析地址的装置包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:

对于按照预定的区域划分方式划分的每一区域,从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语;

若有实际地点的位置与一待分析词语对应的实际位置相同,且该待分析词语在同一类型的数据源中与该实际地点一同出现的次数大于等于预设的次数,则确定该待分析词语为该实际地点的可替换地点词语,将该实际地点与该可替换地点词语关联后存储至预设的地址字词库中;

若接收到针对一客户地址的解析请求,则分析该客户地址是否为实际地点;

若是,则在电子地图上标注该客户地址;

若否,则在该地址字词库中查询是否有可替换地点词语与该客户地址相同,并在该地址字词库中有可替换地点词语与该客户地址相同时,将该可替换地点词语及关联的实际地点作为解析结果返回,以在电子地图上标注。

优选地,所述预定类型的数据源包括搜索引擎的文档库及网页内容。

优选地,若所述预定类型的数据源为搜索引擎的文档库,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

分别将该区域中的各个地点的地点词语作为搜索词输入至该搜索引擎中,通过该搜索引擎的文档库得到该搜索词对应的关键词,将该搜索词及该关键词作为对应地点相关的待分析词语。

优选地,若所述预定类型的数据源为网页内容,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

将每一网页内容与预设的词库中各个地点的建筑名称进行模式匹配,得到含有建筑名称的待分析语句;

按预设类型标点符号对该待分析语句进行短句拆分,对拆分的每一个短句,采用长词优先原则进行分词;

对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的电子地图解析地址的方法的步骤。

本发明的有益效果是:本发明针对实际地点,通过从不同类型的数据源并利用大数据分析的方法收集该实际地点的可替换地点词语,可替换地点词语可以是该实际地点的简称、别称等,将实际地点与该可替换地点词语关联后存储至预设的地址字词库中,在接收到针对某一客户地址的解析请求时,如果该客户地址不是实际地点,且在地址字词库中查询到有可替换地点词语与该客户地址相同时,可以将该可替换地点词语及关联的实际地点作为解析结果返回给电子地图,并进行标注,本发明电子地图的地址解析方式优于第三方接口解析的方式,更加全面、直观,优化了电子地图的微服务功能。

附图说明

图1为本发明各个实施例一可选的应用环境示意图;

图2是图1中电子地图解析地址的装置一实施例的硬件架构的示意图;

图3为本发明电子地图解析地址的方法一实施例的流程示意图;

图4为图3中所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤的细化流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。

参阅图1所示,是本发明电子地图解析地址的方法的较佳实施例的应用环境示意图。该应用环境示意图包括电子地图解析地址的装置1及终端设备2。电子地图解析地址的装置1可以通过网络、近场通信技术等适合的技术与终端设备2进行数据交互,通过终端设备2接收客户地址的解析请求,并将该客户地址的解析请求发送给电子地图解析地址的装置1。

所述终端设备2包括,但不限于,任何一种可与用户通过键盘、鼠标、遥控器、触摸板或者声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personaldigitalassistant,pda)、游戏机、交互式网络电视(internetprotocoltelevision,iptv)、智能式穿戴式设备、导航装置等等的可移动设备,或者诸如数字tv、台式计算机、笔记本、服务器等等的固定终端。

所述电子地图解析地址的装置1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或信息处理的设备。所述电子地图解析地址的装置1可以是计算机、也可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。

在本实施例中,如图2所示,电子地图解析地址的装置1可包括,但不仅限于,可通过系统总线相互通信连接的存储器11、处理器12、网络接口13,存储器11存储有可在处理器12上运行的处理系统。需要指出的是,图2仅示出了具有组件11-13的电子地图解析地址的装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。

其中,存储器11包括内存及至少一种类型的可读存储介质。内存为电子地图解析地址的装置1的运行提供缓存;可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等的非易失性存储介质。在一些实施例中,可读存储介质可以是电子地图解析地址的装置1的内部存储单元,例如该电子地图解析地址的装置1的硬盘;在另一些实施例中,该非易失性存储介质也可以是电子地图解析地址的装置1的外部存储设备,例如电子地图解析地址的装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。本实施例中,存储器11的可读存储介质通常用于存储安装于电子地图解析地址的装置1的操作系统和各类应用软件,例如存储本发明一实施例中的处理系统的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子地图解析地址的装置1的总体操作,例如执行与所述终端设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行处理系统等。

所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述电子地图解析地址的装置1与其他电子设备之间建立通信连接。本实施例中,网络接口13主要用于将电子地图解析地址的装置1与一个或多个终端设备2相连,在电子地图解析地址的装置1与一个或多个终端设备2之间建立数据传输通道和通信连接。

所述处理系统存储在存储器11中,包括至少一个存储在存储器11中的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实施例的方法;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被划为不同的逻辑模块。

在一实施例中,上述处理系统被所述处理器12执行时实现如下步骤:

若有实际地点的位置与一待分析词语对应的实际位置相同,且该待分析词语在同一类型的数据源中与该实际地点一同出现的次数大于等于预设的次数,则确定该待分析词语为该实际地点的可替换地点词语,将该实际地点与该可替换地点词语关联后存储至预设的地址字词库中;

若接收到针对一客户地址的解析请求,则分析该客户地址是否为实际地点;

若是,则在电子地图上标注该客户地址;

若否,则在该地址字词库中查询是否有可替换地点词语与该客户地址相同,并在该地址字词库中有可替换地点词语与该客户地址相同时,将该可替换地点词语及关联的实际地点作为解析结果返回,以在电子地图上标注。

进一步地,所述预定类型的数据源包括搜索引擎的文档库及网页内容。

进一步地,若所述预定类型的数据源为搜索引擎的文档库,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

分别将该区域中的各个地点的地点词语作为搜索词输入至该搜索引擎中,通过该搜索引擎的文档库得到该搜索词对应的关键词,将该搜索词及该关键词作为对应地点相关的待分析词语。

进一步地,若所述预定类型的数据源为网页内容,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:

将每一网页内容与预设的词库中各个地点的建筑名称进行模式匹配,得到含有建筑名称的待分析语句;

按预设类型标点符号对该待分析语句进行短句拆分,对拆分的每一个短句,采用长词优先原则进行分词;

对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语。

进一步地,所述对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语的步骤,具体包括:

根据通用字词典库中字和词分别与词性的映射关系确定该分词结果中的各分词对应的词性,及/或,根据预设的字和词分别与词性的映射关系确定该分词结果中各分词对应的词性,并进行标注,其中,预设的字和词分别与词性的映射关系的词性标注优先级高于通用字词典库中字和词分别与词性的映射关系的词性标注优先级。

如图3所示,图3为本发明电子地图解析地址的方法一实施例的流程示意图,该电子地图解析地址的方法包括以下步骤:

步骤s1,对于按照预定的区域划分方式划分的每一区域,从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语;

其中,预定的区域划分方式可以是按照行政区域的划分方式,也可以是其他自定义的其他区域划分方式,例如,将某一大区域划分为多个相同面积的小区域等。

其中,预定类型的数据源包括搜索引擎的文档库及网页内容。

在一实施例中,若所述预定类型的数据源为搜索引擎的文档库,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:分别将该区域中的各个地点的地点词语作为搜索词输入至该搜索引擎中,通过该搜索引擎的文档库得到该搜索词对应的关键词,将该搜索词及该关键词作为对应地点相关的待分析词语。

其中,搜索引擎例如为百度、谷歌等搜索引擎。将各个区域中的各个地点的地点词语分别作为搜索词输入至该搜索引擎中,该地点词语可以是“**区**路**大厦”、“**地铁站a出口”、“东经**及北纬**”等。例如,以某一区域内的地点词语“**金融中心”为例,将“**金融中心”作为搜索词输入至搜索引擎中,通过该搜索引擎的文档库得到“**金融中心”对应的关键词包括“**新地标”、“**最高楼”、“**大厦”、“pafc”等等,将搜索词“**金融中心”及关键词“**新地标”、“**最高楼”、“**大厦”、“pafc”都作为该地点的待分析词语,待分析词语可以是建筑物的简称、别称,或者地点的简称、别称等等,以作下一步处理。

在另一实施例中,若所述预定类型的数据源为网页内容,则所述从预定类型的数据源中获取与该区域中的各个地点相关的待分析词语的步骤,具体包括:将每一网页内容与预设的词库中各个地点的建筑名称进行模式匹配,得到含有建筑名称的待分析语句;按预设类型标点符号对该待分析语句进行短句拆分,对拆分的每一个短句,采用长词优先原则进行分词;对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语。

其中,对于海量的网页内容,将每一网页内容与预设的词库中各个地点的建筑名称进行模式匹配,得到含有建筑名称的待分析语句,包括:预先收集大量的建筑名称等至词库中,通过将网页内容与词库中的建筑名称进行匹配,得出含有建筑名称的待分析语句。例如,某网页内容中的语句含有建筑名称“**大厦”,则以该词语“**大厦”为中间位置,向前找到最近的一个完整语句的标点符号(例如,“。”、“!”、“?”、“……”),并向后找到最近的一个完整语句的标点符号,这两个完整语句的标点符号之间的语句为待分析语句。

其中,按预设类型标点符号(例如,“,”、“、”等)对该待分析语句进行短句拆分,例如,从该待分析语句起始位置至第一个预设类型标点符号之间的信息为一个短句,从第一个预设类型标点符号至第二个预设类型标点符号之间的信息为一个短句,以此类推。对拆分的每一个短句,采用长词优先原则继续进行分词。例如,长词优先原则指的是:对于一个需要分词的短句t1,先从第一个字a开始,从预建的词库找出一个由a起始的最长词语x1,然后从t1中剔除x1剩下t2,再对t2采用相同的切分原理,切分后的结果为“x1/x2/……”,例如,待分析语句为“**金融中心是**集团打造的,是**的新地标”,其短句拆分后得到“**金融中心是**集团打造的/是**的新地标”,其分词的结果为“**金融中心”/“是”/“**集团”/“打造”/“的”,“是”/“**的新地标”。

其中,对分词结果进行词性标注,并提取预设词性的分词作为所述待分析词语,包括:根据通用字词典库中字和词分别与词性的映射关系,确定该分词结果中的各分词对应的词性,及/或,根据预设的字和词分别与词性的映射关系,确定该分词结果中各分词对应的词性,并进行标注,其中,预设的字和词分别与词性的映射关系的词性标注优先级高于通用字词典库中字和词分别与词性的映射关系的词性标注优先级。为各个分词标注对应的词性,例如,对于分词“了”、“来”、“着”、“过”、“地”、“得”、“似的”、“所”等等,标注其词性为助词;对于“最高的”、“最长的”、“周期长”等,标注其词性为形容词;对于标注词性后的分词,提炼其中的形容词及名词,将其他词性的分词过滤掉。例如,将其他词性的分词过滤掉后,剩下的分词为“**金融中心”、“**集团”、“**的新地标”,这些为待分析词语,待分析词语可以是建筑物的简称、别称,或者地点的简称、别称等等。

步骤s2,若有实际地点的位置与一待分析词语对应的实际位置相同,且该待分析词语在同一类型的数据源中与该实际地点一同出现的次数大于等于预设的次数,则确定该待分析词语为该实际地点的可替换地点词语,将该实际地点与该可替换地点词语关联后存储至预设的地址字词库中;

其中,实际地点的位置可以是“**区**路**大厦”、“**地铁站a出口”、“东经**及北纬**”等,如果有实际地点的位置与一待分析词语对应的实际位置相同,例如“**区**路**大厦”的位置与“**的新地标”、“pafc”对应的实际位置相同,并且“**的新地标”、“pafc”在同一类型的数据源中与“**区**路**大厦”一同出现的次数大于等于预设的次数(例如,100次),则“**区**路**大厦”的可替换地点词语为“**的新地标”、“pafc”。当数据源为网页内容,在同一类型的数据源中出现指的是在同一网页内容出现,或者在同一网页标题中出现等。

步骤s3,若接收到针对一客户地址的解析请求,则分析该客户地址是否为实际地点;

步骤s4,若是,则在电子地图上标注该客户地址;

步骤s5,若否,则在该地址字词库中查询是否有可替换地点词语与该客户地址相同,并在该地址字词库中有可替换地点词语与该客户地址相同时,将该可替换地点词语及关联的实际地点作为解析结果返回,以在电子地图上标注。

其中,电子地图作为app安装在终端设备上,可以在电子地图上提供输入框,当在输入框中输入客户地址后,将该解析请求发送给电子地图解析地址的装置,然后针对该解析请求对该客户地址进行解析。

其中,分析该客户地址是否为实际地点,包括:分析该客户地址是否为该电子地图所使用的标准地址,例如为:“**区**路**大厦”。如果是电子地图所使用的标准地址,则直接在电子地图上标注该客户地址;如果不是电子地图所使用的标准地址,则在地址字词库中查询是否有可替换地点词语与该客户地址相同,若有,将该可替换地点词语及关联的实际地点作为解析结果返回,例如,该客户地址为“pafc”,那么地址字词库中也存在“pafc”,则将“pafc”、“**区**路**大厦”及“**的新地标”作为解析结果返回,并在电子地图上标注该解析结果。

其中,当有业务需求时,例如,对某一客户的地址进行定位以便提供其他服务时,可以通过本实施例的电子地图得到更加全面、直观的地址标注。

与现有技术相比,本发明针对实际地点,通过从不同类型的数据源并利用大数据分析的方法收集该实际地点的可替换地点词语,可替换地点词语可以是该实际地点的简称、别称等,将实际地点与该可替换地点词语关联后存储至预设的地址字词库中,在接收到针对某一客户地址的解析请求时,如果该客户地址不是实际地点,且在地址字词库中查询到有可替换地点词语与该客户地址相同时,可以将该可替换地点词语及关联的实际地点作为解析结果返回给电子地图,并进行标注,本发明电子地图的地址解析方式优于第三方接口解析的方式,更加全面、直观,优化了电子地图的微服务功能。

本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的电子地图解析地址的方法的步骤。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1