地理信息校验方法、相关装置及相应的数据库的制作方法
【专利摘要】本发明公开了一种地理信息校验方法、相关装置及相应的数据库,其中,所述方法包括:根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,所述数据库保存有所述待校验POI的电话号码前缀与地理区域的对应关系,所述地理校验信息包含所述待校验POI的电话号码前缀所对应的地理区域;根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确。采用本发明,能根据电话号码与地理区域的对应关系对POI的地理信息进行校验,在降低成本且提高校验效率的同时,保证校验结果的可靠性。
【专利说明】地理信息校验方法、相关装置及相应的数据库
【技术领域】
[0001]本发明涉及数据校验领域,更为具体而言,涉及一种地理信息校验方法、相关装置及相应的数据库。
【背景技术】
[0002]目前校验POI (Point of Interest)空间位置的方法主要是两种,一种方法是通过人工扫街的方式对空间位置进行检测和修正;另一种是根据用户反馈的纠正信息进行修正。其中,第一种方法需要消耗大量人力,人工成本高并且难以应对数据量日渐变大的趋势;第二种方法受限于用户反馈信息的意识,难以得到较全面的数据量。
【发明内容】
[0003]为了解决现有地理信息校验技术所存在的缺陷,本发明实施方式提供一种地理信息校验方法、相关装置及相应的数据库,能够在降低成本且提高校验效率的同时,保证校验结果的可靠性。
[0004]第一方面,本发明实施方式提供了一种地理信息校验方法,包括:
[0005]根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,所述数据库保存有所述待校验POI的电话号码前缀与地理区域的对应关系,所述地理校验信息包含所述待校验POI的电话号码前缀所对应的地理区域;
[0006]根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确。
[0007]可选地,在本发明实施例的一种实现方式中,所述待校验POI的电话号码前缀为至少一种;所述地理校验信息包含至少一个分组,各分组分别包含所述待校验POI的不同电话号码前缀所对应的地理区域。
[0008]可选地,在本发明实施例的另一种实现方式中,根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确,包括:判断各分组中的地理区域是否与所述待校验POI的地理信息一致;如果在所述地理校验信息中,地理区域与所述待校验POI的地理信息一致的分组达到预设条件,则确定所述待校验POI的地理信息准确,否则确定所述待校验POI的地理信息错误。
[0009]可选地,在本发明实施例的再一种实现方式中,所述方法还包括:
[0010]根据已知的POI的电话号码和地理信息进行聚类处理,确定在预设电话号码前缀下能够聚类到同一地理区域的POI的数目是否达到阈值;如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
[0011]第二方面,本发明实施方式提供了一种地理信息校验装置,包括:
[0012]信息获取模块,用于根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,所述数据库保存有所述待校验POI的电话号码前缀与地理区域的对应关系,所述地理校验信息包含所述待校验POI的电话号码前缀所对应的地理区域;
[0013]校验模块,用于根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确。
[0014]可选地,在本发明实施例的一种实现方式中,所述待校验POI的电话号码前缀为至少一种;所述地理校验信息包含至少一个分组,各分组分别包含所述待校验POI的不同电话号码前缀所对应的地理区域。
[0015]可选地,在本发明实施例的另一种实现方式中,所述校验模块具体用于:判断各分组中的地理区域是否与所述待校验POI的地理信息一致,如果在所述地理校验信息中,地理区域与所述待校验POI的地理信息一致的分组达到预设条件,则确定所述待校验POI的地理信息准确,否则确定所述待校验POI的地理信息错误。
[0016]可选地,在本发明实施例的再一种实现方式中,所述装置还包括:
[0017]聚类模块,用于根据已知的POI的电话号码和地理信息进行聚类处理;
[0018]数据处理模块,用于根据所述聚类处理的结果判断在预设电话号码前缀下聚类到同一地理区域内的POI的数目是否达到阈值,如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
[0019]第三方面,本发明实施例提供一种建立数据库的方法,包括:根据已知的POI的电话号码和地理信息进行聚类处理,确定在预设电话号码前缀下能够聚类到同一地理区域内的POI的数目是否达到阈值;
[0020]如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
[0021]第四方面,本发明实施例提供一种用于建立数据库的装置,包括:
[0022]聚类模块,用于根据已知的POI的电话号码和地理信息进行聚类处理;
[0023]数据处理模块,用于根据所述聚类处理的结果判断在预设电话号码前缀下聚类到同一地理区域内的POI的数目是否达到阈值,如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理信息,并将这种对应关系保存至所述数据库中。
[0024]第五方面,本发明实施例提供一种采用根据第三方面的方法建立的数据库。
[0025]采用本发明的各种实施例具有以下有益效果:
[0026]能够根据电话号码与地理区域的对应关系对POI的地理信息进行校验,无需采用人工上街的检测方式,也不受限于用户主动上传纠正信息的意识或数据量,在降低成本且提高校验效率的同时,基于电话号码与地理区域的对应关系进行的校验也能保证校验结果的可靠性。
【专利附图】
【附图说明】
[0027]图1是根据本发明实施例的一种地理信息校验方法的流程示意图;
[0028]图2是根据本发明实施例的一种建立数据库的方法的流程示意图;
[0029]图3是根据本发明实施例的一种地理信息校验装置的方块示意图;
[0030]图4是根据本发明实施例的一种用于建立数据库的装置的方块示意图。
【具体实施方式】
[0031]以下结合附图和【具体实施方式】对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或步骤可以按各种不同配置进行组合和设计。
[0032]图1是根据本发明实施例的一种地理信息校验方法的流程示意图,参照图1,所述方法包括:
[0033]100:根据待校验POI的电话号码查询数据库,获取地理校验信息。其中,数据库保存有待校验POI的电话号码前缀与地理区域的对应关系,地理校验信息包含待校验POI的电话号码前缀所对应的地理区域。
[0034]本领域技术人员应当理解,每一个POI (Point OF Interest)均包含一系列信息,例如:地理信息(例如,坐标)、电话号码、文案信息等。在对现有POI的地理信息进行校验时,当前被校验的POI即所述待校验POI。
[0035]在本发明中,电话号码前缀是指由电话号码的前k(k为正整数)位组成的用于表不集合概念的号码。例如,8位电话号码的首位为6,则6表不电话号码的一个前缀,其含义是所有以6开头的电话号码;再例如,11位电话号码(含区号)的前5位为010-61,则010-61表示电话号码的一个前缀,其含义是所有以010-61开头的电话号码。
[0036]102:根据地理校验信息对待校验POI的地理信息进行校验,确定待校验POI的地理息是否准确。
[0037]采用本发明实施例提供的方法,能够根据电话号码与地理区域的对应关系对POI的地理信息进行校验,无需采用人工上街的检测方式,也不受限于用户主动上传数据的意识或数据量,在提高校验效率的同时,基于电话号码与地理区域的对应关系进行的校验也能保证校验结果的可靠性。
[0038]可选地,在本实施例的一种实现方式中,POI的电话号码前缀为至少一种,例如,以010-62785678(在其它实现方式中,也可以不考虑区号)这一电话号码为例,其可以包括以下前缀中的任意一种或多种前缀:010、010-6,010-62,010-627,010-6278,010-62785,010-627856,010-6278567。优选地,可以根据运营商配置电话号码的规则(例如,按局配置)确定电话号码前缀。可选地,在本实现方式中,待校验POI的电话号码前缀有几种,数据库中相应地包含几个分组,并且各分组分别包含待校验POI的不同电话号码前缀所对应的地理区域,也就是说,分组和电话号码前缀一一对应,并保存相应电话号码前缀的地理区域。
[0039]可选地,在本实施例的一种实现方式中,102可以通过以下方式实现:
[0040]判断地理校验信息的各分组中的地理区域是否与待校验POI的地理信息一致,如果在地理校验信息中,地理区域与待校验POI的地理信息一致的分组达到预设条件,则确定待校验POI的地理信息准确,否则确定待校验POI的地理信息错误。
[0041]在本实现方式中,分组所包含的地理区域是区域概念,例如,南京市、海淀区、清华大学、学院路或自定义的一片区域等。而待校验POI的地理信息则用于表示具体的地理位置,例如经纬度、坐标等。如果待校验POI的地理信息显示该POI位于分组所对应的地理位置内,则二者一致,否则不一致。
[0042]在本实现方式中提及的预设条件可以是基于数目的预设条件,例如,如果地理区域与待校验POI的地理信息一致的分组的数目达到了设定值,则认为待校验POI的地理信息准确。或者,预设条件可以是基于权重的预设条件,例如,为每一个分组设置不同的权重,如果对于与待校验POI的地理信息保持一致的分组,如果对其权重以设定的算法(例如,累加)计算后得到的值达到设定值,则认为待校验POI的地理信息准确。当然,以上仅是对预设条件的简单举例,本发明并不限制具体采用怎样的预设条件进行判断,只要基于本发明中的地理校验信息进行校验,均落在本发明的保护范围内。
[0043]在本实施例的一种更具体的实现方式中,例如,010-6278前缀对应的地理区域是清华大学,如果待校验POI的电话号码包含该前缀,则验证待校验POI的坐标是否在清华大学内,如果不在,则认为待校验POI的地理信息是错误数据。当然,换个角度,也可以据此认为待校验POI的电话号码有误。
[0044]图2是根据本发明实施例的一种建立(或更新)数据库的方法的流程示意图,所述数据库是专用于图1所示实施例中数据库。参照图2,所述方法包括:
[0045]200:根据已知的POI的电话号码和地理信息进行聚类处理,确定在预设电话号码前缀下能够聚类到同一地理区域内的POI的数目是否达到阈值。
[0046]202:如果达到阈值,则将所述同一地理区域作为与预设电话号码前缀对应的地理信息,并将这种对应关系保存至数据库中。
[0047]在200中,预设电话号码前缀可以根据运营商现有的电话号码配置规则确定,也可以根据需要灵活地设置。一种示例性的预设电话号码前缀如下:以电话号码的第一位作为I级前缀,以电话号码的前k(k为大于I的正整数)位作为k级前缀。
[0048]在本实施例中,举例而言,假设某I级前缀下,POI的数目为Al,采用现有的k-menus聚类算法对这些POI的电话号码和坐标进行聚类,如果有A2个POI能够聚类到同一地理区域(例如,POI的密集程度达到预设条件的区域)内,判断A2/A1的值是否达到设定阈值,如果达到设定阈值,则将所述同一地理区域作为与该I级前缀对应的地理区域,并保存这种对应关系至数据库中;如果未达到设定阈值,则不保存该I级前缀。对于其它前缀,也可以采用同样的方式进行聚类和判断。当然,聚类算法并不限于k-menus算法,本发明对聚类算法不做具体限制。
[0049]采用本实施例提供的方法,能够基于电话号码和地理信息(例如,基于POI数据库中保存的电话号码和地理信息)建立或更新专门的数据库,以便执行图1所示实施例或其实现方式所提供的方法。当然,在本发明的其它实施例中也可以基于电话号码前缀与地理区域的已知对应关系建立数据库,而无需进行前文所述的聚类和判断。
[0050]当然,采用本实施例提供的方法而建立的数据库,同样落在本发明的保护范围内。此外,需要强调的是,在本发明中提及的阈值、预设条件等均可以根据机器学习或人工经验进行调整,因此,本发明并不对其做具体限制。
[0051]图3是根据本发明实施例的一种地理信息校验装置的方块示意图,参照图3,地理信息校验装置3包括信息获取模块31和校验模块32,下面分别进行说明。
[0052]信息获取模块31,用于根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,数据库保存有待校验POI的电话号码前缀与地理区域的对应关系,地理校验信息包含待校验POI的电话号码前缀所对应的地理区域。
[0053]校验模块32,用于根据地理校验信息对待校验POI的地理信息进行校验,确定待校验POI的地理信息是否准确。
[0054]可选地,在本实施例的一种实现方式中,校验模块32具体用于执行以下处理:判断各分组中的地理区域是否与待校验POI的地理信息一致,如果在地理校验信息中,地理区域与待校验POI的地理信息一致的分组达到预设条件,则确定待校验POI的地理信息准确,否则确定待校验POI的地理信息错误。
[0055]关于本实施例中各模块所执行的处理、相关术语/名词的详细解释,请参见方法实施例中的相应说明,此处不再赘述。
[0056]采用本发明实施例提供的地理位置3,相比现有技术而言,能够以较少的成本、较高的效率实现对POI的地理信息的校验,并且校验结果具有较高的可靠性。
[0057]图4是根据本发明实施例的一种用于建立数据库的装置的方块示意图,参照图4,装置4包括聚类模块41和数据处理模块42,下面分别进行说明。
[0058]聚类模块41,用于根据已知的POI的电话号码和地理信息进行聚类处理;
[0059]数据处理模块42,用于根据聚类处理的结果判断在预设电话号码前缀下聚类到同一地理区域内的POI的数目是否达到阈值,如果达到阈值,则将所述同一地理区域作为与预设电话号码前缀对应的地理信息,并将这种对应关系保存至数据库中。
[0060]关于本实施例中各模块所执行的处理、相关术语/名词的详细解释,请参见方法实施例中的相应说明,此处不再赘述。
[0061]采用本发明实施例,能够基于电话号码与地理信息的对应关系建立专门的数据库以便基于该数据库进行地理信息校验。
[0062]在本发明的其它实施例中,图3所示的信息校验装置3可以具有图4所示的装置4的功能或模块,从而实现从建立数据库到完成校验的整个处理过程。
[0063]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对【背景技术】做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
[0064]本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。
【权利要求】
1.一种地理信息校验方法,其特征在于,所述方法包括: 根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,所述数据库保存有所述待校验POI的电话号码前缀与地理区域的对应关系,所述地理校验信息包含所述待校验POI的电话号码前缀所对应的地理区域; 根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确。
2.如权利要求1所述的方法,其特征在于, 所述待校验POI的电话号码前缀为至少一种; 所述地理校验信息包含至少一个分组,各分组分别包含所述待校验POI的不同电话号码前缀所对应的地理区域。
3.如权利要求2所述的方法,其特征在于,根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确,包括: 判断各分组中的地理区域是否与所述待校验POI的地理信息一致; 如果在所述地理校验信息中,地理区域与所述待校验POI的地理信息一致的分组达到预设条件,则确定所述待校验POI的地理信息准确,否则确定所述待校验POI的地理信息错误。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括: 根据已知的POI的电话号码和地理信息进行聚类处理,确定在预设电话号码前缀下能够聚类到同一地理区域的POI的数目是否达到阈值; 如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
5.一种地理信息校验装置,其特征在于,所述装置包括: 信息获取模块,用于根据待校验POI的电话号码查询数据库,获取地理校验信息,其中,所述数据库保存有所述待校验POI的电话号码前缀与地理区域的对应关系,所述地理校验信息包含所述待校验POI的电话号码前缀所对应的地理区域; 校验模块,用于根据所述地理校验信息对所述待校验POI的地理信息进行校验,确定所述待校验POI的地理信息是否准确。
6.如权利要求5所述的装置,其特征在于, 所述待校验POI的电话号码前缀为至少一种; 所述地理校验信息包含至少一个分组,各分组分别包含所述待校验POI的不同电话号码前缀所对应的地理区域。
7.如权利要求5所述的装置,其特征在于, 所述校验模块具体用于:判断各分组中的地理区域是否与所述待校验POI的地理信息一致,如果在所述地理校验信息中,地理区域与所述待校验POI的地理信息一致的分组达到预设条件,则确定所述待校验POI的地理信息准确,否则确定所述待校验POI的地理信息错误。
8.如权利要求5-7中任一项所述的装置,其特征在于,所述装置还包括: 聚类模块,用于根据已知的POI的电话号码和地理信息进行聚类处理; 数据处理模块,用于根据所述聚类处理的结果判断在预设电话号码前缀下聚类到同一地理区域内的POI的数目是否达到阈值,如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
9.一种建立权利要求1中的数据库的方法,其特征在于,所述方法包括: 根据已知的POI的电话号码和地理信息进行聚类处理,确定在预设电话号码前缀下能够聚类到同一地理区域内的POI的数目是否达到阈值; 如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理区域,并将这种对应关系保存至所述数据库中。
10.一种用于建立权利要求1中的数据库的装置,其特征在于,所述装置包括: 聚类模块,用于根据已知的POI的电话号码和地理信息进行聚类处理; 数据处理模块,用于根据所述聚类处理的结果判断在预设电话号码前缀下聚类到同一地理区域内的POI的数目是否达到阈值,如果达到阈值,则将所述同一地理区域作为与所述预设电话号码前缀对应的地理信息,并将这种对应关系保存至所述数据库中。
11.一种采用如权利要求9所述的方法建立的数据库。
【文档编号】G06F17/30GK104346467SQ201410646084
【公开日】2015年2月11日 申请日期:2014年11月14日 优先权日:2014年11月14日
【发明者】孙彬, 刘燕云, 李国强 申请人:北京百度网讯科技有限公司