可信IP信息的判定方法、IP信息库的更新方法及装置与流程

文档序号:11628734阅读:198来源:国知局
可信IP信息的判定方法、IP信息库的更新方法及装置与流程

本申请涉及计算机技术,特别涉及一种可信ip信息的判定方法、ip信息库的更新方法及装置。



背景技术:

ip地址(internetprotocoladdress,网际协议地址)是互联网中的每一个网络设备所分配的逻辑地址,互联网中的每一个网络设备都对应一个地理位置信息(如:经纬度信息),通过采集互联网中的各网络设备的ip地址信息及与之对应的地理位置信息,即可以形成包括相映射的ip地址信息和地理位置信息的ip地理信息库。上述ip地理信息库可以应用于多种场景中,如:根据网络设备的ip地址确定该网络设备所处的地理位置。

通常,采集到的互联网中ip地址信息及与之对应的地理位置信息并不是全部正确的。例如:采集到的设备a的ip地址信息是:192.201.30.45,与该ip地址信息:192.201.30.45对应的地理位置信息是:北京某超市b,而在实际情况中,与该ip地址信息:192.201.30.45对应的地理位置信息应该是:北京某超市c,这样,上述数据便是不可信的。

一方面,现有技术中,在采集到互联网中的ip地址信息及与之对应的地理位置信息后,还没有能够判定所采集到的ip地址信息及与之对应的地理位置信息是否可信的技术。

另一方面,现有技术中,由于互联网中为各个网络设备分配的ip地址和与该ip地址对应的地理位置信息是不断变化的,在形成上述ip地理信息库之后,一般可以适时地采集互联网中的ip地址信息及与之对应的地理位置信息,并利用采集到的信息对该ip地理信息库进行更新,以确保数据准确性。显然, 现有技术中,若无法判定所采集到的ip地址信息及与之对应的地理位置信息是否可信,则无法确保更新后的ip地理信息库中数据的准确性。



技术实现要素:

本申请实施例的目的是提供一种可信ip信息的判定方法、ip信息库的更新方法及装置,以解决现有技术中的上述问题之一。

为解决上述技术问题,本申请实施例提供的可信ip信息的判定方法、ip信息库的更新方法及装置。是这样实现的:

一种可信ip信息的判定方法,包括:

采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

在所述第一信息集合中,确定与上述待判定的ip地址信息在预设ip地址字段的值相同的,并且处于所述预设地理区域的ip地址信息的数量;

判断所述数量是否大于或等于预设数量阈值;

若是,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

一种可信ip信息的判定方法,包括:

采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

在所述第一信息集合中,分别确定处于每个预设地理区域的并且与待判定的ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;其中,所述第二信息集合包括若干ip地址信息以及与每个ip地址信息对应的地理位置信息;

确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

判断与上述确定的预设地理区域对应的所述数量是否大于与其它预设地 理区域对应的所述数量;

若是,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

一种ip信息库的更新方法,包括:

采集网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

若所述第一信息集合中包含的ip地址信息存在于待更新的第二信息集合中,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致;

若不一致,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并统计在所述第一信息集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

判断所述数量是否大于或等于预设数量阈值;

若所述数量大于或等于预设数量阈值,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

一种ip信息库的更新方法,包括:

采集网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

将所述第一信息集合按照所述地理位置信息所处的预设地理区域进行分组,得到与各预设地理区域对应的分组集合;

若所述第一信息集合中包含的ip地址信息存在于待更新的第二信息集合中,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致;

若不一致,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并确定与该预设地理区域对应的分组集合;

判断在确定的该分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量是否超过在其余分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

若超过,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

一种可信ip信息的判定装置,包括:

采集单元,用于采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

第一确定单元,用于确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

第二确定单元,用于在所述第一信息集合中,确定与上述待判定的ip地址信息在预设ip地址字段的值相同的,并且处于所述预设地理区域的ip地址信息的数量;

第一判断单元,用于判断所述数量是否大于或等于预设数量阈值;

判定单元,用于在所述数量大于或等于预设数量阈值时,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

一种可信ip信息的判定装置,包括:

采集单元,用于采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

第一确定单元,用于在所述第一信息集合中,分别确定处于每个预设地理区域的并且与待判定的ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

第二确定单元,用于确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

第一判断单元,用于判断与上述确定的预设地理区域对应的所述数量是否大于与其它预设地理区域对应的所述数量;

判定单元,用于在与上述确定的预设地理区域对应的所述数量大于与其它预设地理区域对应的所述数量时,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

一种ip信息库的更新装置,包括:

采集单元,用于采集网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

第一判断单元,用于在所述第一信息集合中包含的ip地址信息存在于待更新的第二信息集合中时,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致;

第一确定单元,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并统计在所述第一信息集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

第二判断单元,用于判断所述数量是否大于或等于预设数量阈值;

替换单元,用于在所述数量大于或等于预设数量阈值时,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

一种ip信息库的更新装置,包括:

采集单元,用于采集网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

分组单元,用于将所述第一信息集合按照所述地理位置信息所处的预设地理区域进行分组,得到与各预设地理区域对应的分组集合;

第一判断单元,用于在所述第一信息集合中包含的ip地址信息存在于待更新的第二信息集合中时,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致

第一确定单元,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并确定与该预设地理区域对应的分组集合;

第二判断单元,用于判断在确定的该分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量是否超过在其余分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

替换单元,用于在所述数量大于或等于预设数量阈值时,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

由以上本申请各实施例提供的技术方案可见,在采集网络设备的ip地址信息和地理位置信息后,需要衡量该ip地址信息和地理位置信息是否可信。通过研究发现,对于采集到的某ip地址信息和与之对应的地理位置信息,若在该地理位置信息对应的预设地理区域内存在的、且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量越多,则表明该ip地址信息和与之对应的地理位置信息的可信度越高。基于这一原理,本申请实施例通过确定在上述预设地理区域内的并且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量,并根据该数量来判定所述待判定的ip地址信息对应的地理位置信息是否为该ip地址信息的可信地理位置信息。

另外,在利用采集到的ip地址信息和与之对应的地理位置信息,对预先生成的第二信息集合进行更新的过程中,同样可以根据上述原理判定某个ip 地址信息和与之对应的地理位置信息是否可信,若可信,则将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息,从而完成上述第二信息集合的更新,进而确保待更新的第二信息集合中数据的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的可信ip地理位置信息的判定方法的流程图;

图2示出了本申请实施例中确定某个ip地址信息及与之对应的地理位置信息是否可信的过程;

图3为本申请另一实施例提供的可信ip地理位置信息的判定方法的流程图;

图4为本申请一实施例提供的ip信息库的更新方法的流程图;

图5示出了本申请实施例中利用采集得到的第一信息集合对第二信息集合进行更新的过程;

图6为本申请另一实施例提供的ip信息库的更新方法的流程图;

图7为在图6所示的实施例的基础上提供的ip信息库的更新方法中的流程图;

图8为本申请一实施例提供的可信ip信息的判定装置的模块示意图;

图9为本申请一实施例提供的ip信息库的更新装置的模块示意图;

图10为本申请另一实施例提供的ip信息库的更新装置的模块示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

图1为本申请一实施例提供的可信ip地理位置信息的判定方法的流程,配合参照图1和图2,该方法包括如下步骤:

s101:采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合。

本实施例可以通过定期或不定期地采集互联网中的网络设备的ip地址信息及地理位置信息,得到包含采集到的上述ip地址信息和地理位置信息的第一信息集合20。其中,上述网络设备可以包括个人计算机(pc)、手机、打印机、服务器等各类可以连入互联网环境中的并且被分配唯一ip地址的设备。上述地理位置信息可以是以经纬度、或地理名称等形式进行表示。上述采集工作可以由预设的信息采集平台来完成,该信息平台具备采集信息、存储信息并对大量数据进行计算的条件。上述ip地址对应的互联网协议可以包括ipv4(internetprotocolversion4,互联网协议的版本4)、ipv6(internetprotocolversion6,互联网协议的版本6)。

s102:确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域。

本申请实施例中,可以判定上述第一信息集合20中的任意一个ip地址及与之对应的地理位置信息是否可信。如图2所示,例如:在与待判定是否可信的ip地址:189.234.102.109对应的数据210中,显示与该ip地址:189.234.102.109对应的地理位置信息是:北京某商场a(可以是以经纬度来表示)。为了判定ip地址信息及与之对应的地理位置信息的可信度,可以预先将地理位置按照一定距离范围划分为若干个预设地理区域,例如,划分后的每个 预设地理区域是边长为10公里的矩形区域、或方圆10公里的圆形区域等。这样,对于任意一个地理位置信息,可以确定一个与之对应的预设地理区域。如图2所示,通过查找,可以确定与地理位置信息:北京某商场a对应的预设地理区域r。

s103:在上述第一信息集合20中,确定与待判定的ip地址信息在预设ip地址字段的值相同的,并且处于所述预设地理区域的ip地址信息的数量。

本实施例中,如果一个ip地址信息和另一个ip地址信息在预设ip地址字段的值是相同的,则可以定义这两个ip地址信息是互为相似的ip地址信息。对于ipv4的ip地址,以十进制数或相应的32位二进制数进行表示,例如:十进制的ip地址:100.4.5.6,与之对应的32位二进制的ip地址是:01100100.00000100.00000101.00000110(分4段,每段8位)。其中,对于ipv4的ip地址,若是以十进制数进行表示,则上述预设ip地址字段可以是以“.”划分的前3个字段:100.4.5,若是以32位二进制数进行表示,则上述预设ip地址字段可以是前24位(前3段,每段8位):01100100.00000100.00000101。同理,对于ipv6的ip地址,以十进制数或相应的128位二进制数进行表示,则上述预设ip地址字段则需要相应的进行调整。总之,对于不同类型的ip地址,与之对应的上述预设ip地址字段也可以相应作调整。

本实施例中可以基于第一信息集合20中包含的数据,逐一查找到处于上述预设地理区域r中的,并且与ip地址信息:189.234.102.109在预设ip地址字段的值相同的ip地址信息的数量m。继续沿用上述例子,对于待判定是否可信的ip地址信息:189.234.102.109,与之相似的ip地址信息可以是189.234.102.x,其中x可以是0~255中的任意一个数,对于该ip地址信息:189.234.102.x,若在第一信息集合20中与之对应的地理位置信息是:北京某商城b,并且“北京某商城b”是位于所述预设地理区域r中的,则可以认定上述ip地址信息:189.234.102.x与上述ip地址信息:189.234.102.109在预设ip地址字段的值相同的并且处于同一个预设地理区域中。通过上述过程,可以将 最终确定的上述189.234.102.x的总数确定为上述m。。

s104:判断所述数量m是否大于或等于预设数量阈值m0;若是,进入步骤s105。

s105:判定与待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

举例而言,假设设定的预设数量阈值m0是10(可以是个经验值),则如果得到的数量m≥10,表明上述第一信息集合20中与该ip地址信息:189.234.102.109对应的地理位置信息:“北京某商城a”是可信的(或可信度是较高的)。

基于以上实施例中,在采集网络设备的ip地址信息和地理位置信息后,需要衡量该ip地址信息和地理位置信息是否可信。通过研究发现,对于采集到的某ip地址信息和与之对应的地理位置信息,若在该地理位置信息对应的预设地理区域内存在的、且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量越多,则表明该ip地址信息和与之对应的地理位置信息的可信度越高。基于这一原理,本申请实施例通过确定在上述预设地理区域内的并且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量,并根据所述数量的大小来判定所述待判定的ip地址信息对应的地理位置信息是否为该ip地址信息的可信地理位置信息,实现对ip位置信息的可靠性的验证。

图3为本申请另一实施例提供的可信ip地理位置信息的判定方法的流程,配合参照图3和图2,该方法包括如下步骤:

s201:采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合。该步骤可参照上述步骤s101的内容,不再予以赘述。

s202:在上述第一信息集合中,分别确定处于每个预设地理区域的并且与待判定的ip地址信息在预设ip地址字段的值相同的ip地址信息的数量。

如前所述,对于与待判定的ip地址信息在预设ip地址字段的值相同的其 他ip地址信息,这些其他的ip地址信息可能分布一个或多个预设地理区域中。若分别于多个预设地理区域中,则需要分别统计在每个预设地理区域内的与待判定的ip地址信息在预设ip地址字段的值相同的ip地址信息的数量。例如:存在分布情况的预设地理区域包括:预设地理区域r、预设地理区域s、预设地理区域h,通过统计,得到在预设地理区域r内分布的数量是20,在预设地理区域s内分布的数量是3,在预设地理区域h内分布的数量是1。

s203:确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域。

在图2的例子中,与ip地址信息:189.234.102.109对应的地理位置信息:北京某商场a所处的预设地理区域是:预设地理区域r。

s204:判断与上述确定的预设地理区域对应的所述数量是否大于与其它预设地理区域对应的所述数量;若是,则进入步骤s205。

在上述例子中,按照数量m从大到小排序:预设地理区域r>预设地理区域s>预设地理区域h。也就是说,在预设地理区域r内分布的相似ip地址信息的数量是最多的,表明与待判定的ip地址信息:189.234.102.109对应的上述地理位置信息:北京某商场a的可信度是最高的。

s205:判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

同样地,本申请实施例通过确定在上述预设地理区域内的并且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量,并根据所述数量的大小来判定所述待判定的ip地址信息对应的地理位置信息是否为该ip地址信息的可信地理位置信息,实现对ip位置信息的可靠性的验证。

上述判定采集到的ip地址信息和与之对应的地理位置信息是否可信的方法,可以用于对预先生成的ip信息库内的数据进行更新的方法中,以确保ip信息库中的数据的准确性,接下来将对该ip信息库的更新方法进行叙述。

图4为本申请一实施例提供的ip信息库的更新方法的流程,配合参照图4 和图5,该方法包括如下步骤:

s301:采集互联网中的网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合20。

如图5所示,在建立第二信息集合(也可称为ip地理信息库)10之后,本实施例可以通过定期或不定期地采集互联网中各网络设备的ip地址信息及地理位置信息,得到包含采集到的上述ip地址信息和地理位置信息的第一信息集合20,并最终利用该第一信息集合20对已经建立的第二信息集合10进行更新,从而确保该第二信息集合10中的数据的准确性。其中,对于采集得到的大量ip地址信息及与之对应的地理位置信息,可以预先将不符合要求的数据进行过滤,如过滤掉ip地址及地理位置信息不规范的数据,再将过滤后得到的大量数据放入第一信息集合20中。值得提及的是,根据实际需求,上述采集平台还可以采集互联网中的各个网络设备的mac地址(medium/mediaaccesscontrol,物理地址)等其他信息。

s303:若第一信息集合20中包含的某ip地址信息存在于待更新的第二信息集合10中,判断在第一信息集合20中与该ip地址信息对应的地理位置信息和在第二信息集合10中与该ip地址信息对应的地理位置信息是否一致。若不一致,进入步骤s304。

通过上述步骤s303,将第一信息集合20中的数据与第二信息集合10中的数据进行比对,若发现同一个ip地址在第一信息集合20和第二信息集合10中所分别对应的地理位置信息是不一致的,则表明与该ip地址信息对应的地理位置信息存在争议,意味着原先存储于上述第二信息集合10内的地理位置信息可能是不准确的或在当前时刻已经变更。例如:在第一信息集合20中与ip地址:189.234.102.109对应的数据210中,显示与该ip地址:189.234.102.109对应的地理位置信息是:北京某商场a(可以是以经纬度来表示);而在第二信息集合10中与上述ip地址:189.234.102.109对应的数据110中,显示与该ip 地址:189.234.102.109对应的地理位置信息是:北京某超市b。显然,此时针对同一ip地址信息,其对应的地理位置信息存在争议,需要进一步验证哪一个地理位置信息可信度更高。

s304:确定在第一信息集合20中与该ip地址信息对应的地理位置信息所处的预设地理区域,并统计在第一信息集合20中处于该预设地理区域的且与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量。

关于互为相似的ip地址(在预设ip地址字段的值相同)的定义可参上文内容。一般地,若在预设地理区域内,与某ip地址在预设ip地址字段的值相同的其他ip地址的数量越多,即表明与该ip地址对应的地理位置信息的可信度越高。

沿用上述例子,在第一信息集合20中与ip地址:189.234.102.109对应的数据210中,显示与该ip地址:189.234.102.109对应的地理位置信息是:北京某商场a,通过查找,可以确定与该北京某商场a对应的预设地理区域例如是:以“东经20°、北纬30°”为中心的方圆10公里。假设通过查找,得到在第一信息集合20中处于上述预设地理区域(以“东经20°、北纬30°”为中心的方圆10公里)的且与该ip地址信息在预设ip地址字段的值相同的ip地址信息包括:

ip地址:189.234.102.101,对应的地理位置信息:北京某商场a;

ip地址:189.234.102.102,对应的地理位置信息:北京某商场a;

ip地址:189.234.102.104,对应的地理位置信息:北京某商场a;

……

ip地址:189.234.102.18,对应的地理位置信息:北京某商场b(也处于上述预设地理区域内);

ip地址:189.234.102.10,对应的地理位置信息:北京某商场b(也处于上述预设地理区域内)

……

通过统计在同一预设地理区域内的并且与ip地址信息:189.234.102.109在预设ip地址字段的值相同的ip地址信息,可以得到在预设ip地址字段的值相同的ip地址信息的数量m。

s305:判断所述数量是否大于或等于预设数量阈值。若所述数量大于或等于预设数量阈值,进入步骤s306。

举例而言,假设设定的预设数量阈值是10(可以是个经验值),则如果得到的数量m≥10,表明上述第一信息集合20中与该ip地址信息:189.234.102.109对应的地理位置信息的可信度是较高的,而在第二信息集合10中与该ip地址信息:189.234.102.109对应的地理位置信息的可信度是较低的。

s306:将在所述第二信息集合10中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合20中与该ip地址信息对应的地理位置信息,从而完成对ip信息库的更新。在上述例子中,将地理位置信息:北京某超市b替换为北京某商城a。

本实施例中,可以循环执行上述步骤s303~s306的过程,从而逐一将第一信息集合20中的数据与第二信息集合10中的数据进行比对,并在与同一个ip地址信息对应的地理位置信息不一致时,验证第一信息集合20中的地理位置信息的可信度,并在可信度较高时,将上述第二信息集合10中的地理位置信息替换为上述第一信息集合20中的地理位置信息,实现对第二信息集合的数据更新,并且确保更新数据的准确性。

本申请实施例中,在上述步骤s303之后,在上述步骤s306之前,所述方法还包括如下步骤:

s307:若在第一信息集合20中与该ip地址信息对应的地理位置信息和在第二信息集合10中与该ip地址信息对应的地理位置信息不一致,则确定在所述第一信息集合20中与该ip地址信息对应的地理位置信息和在所述第二信息集合10中与该ip地址信息对应的地理位置信息之间的第一距离。

继续沿用上述例子,假设第一信息集合20中与ip地址:189.234.102.109 对应的地理位置信息是:北京某商场a;而在第二信息集合10中与上述ip地址:189.234.102.109对应的地理位置信息是:北京某超市b,通过计算,假设得出北京某商场a和北京某超市b之间的第一距离是9公里。

s308:判断所述第一距离是否小于或等于预设距离阈值。

假设预设距离阈值是10公里,则在上述例子中,北京某商场a和北京某超市b之间的第一距离(9公里)小于该预设距离阈值。

本实施例中,在该步骤s308的判断结果为:“是”,并且上述步骤s305的判断结果为:“是”时,进入上述步骤s306。本实施例通过增加上述步骤s307和s308,可以进一步使得第一信息集合中的地理位置信息的可信度验证过程的精确性(需同时满足相似ip的预设数量阈值及预设距离阈值的要求),从而提升ip地理位置更新的准确性。

图6为本申请另一实施例提供的ip信息库的更新方法的流程,配合参照图6和图5所示,该方法包括如下步骤:

s401:采集互联网中的网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的信息集20。该步骤s401可以参照上述步骤s301的内容,本文不再予以赘述。

s402:将第一信息集合20按照所述地理位置信息所处的预设地理区域进行分组,得到与各预设地理区域对应的分组集合。

如图5所示,在采集得到第一信息集合20后,可以将该第一信息集合20按照预先划分的预设地理区域进行分组,得到多个与各预设地理区域对应的分组集合,分别是:第1个分组集合21~第k个分组集合2k,其中k≥2,k为自然数。举例而言,假设预先将地理位置按照一定的距离范围划分为1000个预设地理区域,则相应的有1000个与每个预设地理区域对应的分组集合,每一个分组集合中存放的ip地址所对应的地理位置信息需处于该分组集合对应的预设地理区域内。

s404:若第一信息集合20中包含的ip地址信息存在于待更新的第二信息 集合10中,判断在第一信息集合20中与该ip地址信息对应的地理位置信息和在所述第二信息集合10中与该ip地址信息对应的地理位置信息是否一致;若不一致,进入步骤s405。

s405:确定在第一信息集合20中与该ip地址信息对应的地理位置信息所处的预设地理区域,并确定与该预设地理区域对应的分组集合。

继续举例来说,假设第一信息集合20中与ip地址:189.234.102.109对应的地理位置信息是:北京某商场a;通过匹配,确定与该地理位置信息:北京某商场a对应的预设地理区域是:以“东经20°、北纬30°”为中心的方圆10公里,进一步地,也可以确定与该预设地理区域:以“东经20°、北纬30°”为中心的方圆10公里对应的分组集合是第s个分组集合2s,其中,1≤s≤k。

s406:判断在确定的该分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量是否超过在其余分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量。若超过,进入步骤s407。

在本实施例中,与上述ip地址信息在预设ip地址字段的值相同的ip地址信息可能分布于一个或多个分组集合中,若分布于至少两个分组集合中,则可以分别统计每个分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量,并进行排序,得到每个分组集合对应的数量排名。例如,假设第一信息集合20中与ip地址:189.234.102.109对应的地理位置信息是:北京某商场a,通过统计,发现该ip地址在预设ip地址字段的值相同的其余ip地址分布于三个分组集合中,分别是:第1个分组集合21,第2个分组集合22,第s个分组集合2s,其中,与该地理位置信息:北京某商场a对应的分组集合为第s个分组集合2s。通过统计,得出在上述第1个分组集合21内的与ip地址:189.234.102.109在预设ip地址字段的值相同的ip地址数量是10,在上述第2个分组集合22内的与ip地址:189.234.102.109在预设ip地址字段的值相同的ip地址数量是20,在上述第s个分组集合2s内的与ip地址:189.234.102.109在预设ip地址字段的值相同的ip地址数量是30,则最终,判 定上述第s个分组集合2s内的相似ip地址的数量大于其余分组集合(上述第1个分组集合21、上述第2个分组集合22)中的相似ip地址的数量。

s407:将在第二信息集合10中与该ip地址信息对应的地理位置信息替换为在第一信息集合20中与该ip地址信息对应的地理位置信息。

在上述例子中,由于在第一信息集合20中与ip地址:189.234.102.109对应的地理位置信息是:北京某商场a,并且在与该地理位置信息是:北京某商场a对应的分组集合(上述第s个分组集合2s)中与该ip地址信息:189.234.102.109在预设ip地址字段的值相同的ip地址信息(即189.234.102.x,x表示0~255中的任意一个自然数)的数量大于在其余分组集合(上述第1个分组集合21、上述第2个分组集合22)的与该ip地址信息:189.234.102.109在预设ip地址字段的值相同的ip地址信息。上述第s个分组集合2s中相似ip数量最多,也就是表明该地理位置信息北京某商场a与该ip地址信息:189.234.102.109的契合度最高(可信度最高)。此时,可以将第二信息集合10中与该ip地址信息:189.234.102.109对应的地理位置信息:“北京某超市b”替换成“北京某商场a”。

通过循环执行上述步骤s404~s407的过程,可以实现对第二信息集合的数据更新,并且确保更新数据的准确性。

本申请实施例中,在上述步骤s404之后,在上述步骤s407之前,该方法还可以包括如下步骤:

s408:确定在第一信息集合20中与该ip地址信息对应的地理位置信息和在第二信息集合10中与该ip地址信息对应的地理位置信息之间的第一距离。

s409:判断第一距离是否小于或等于预设距离阈值。

上述步骤s408和步骤s409可以参照上述步骤s307和步骤s308的内容,本实施例通过增加上述步骤s408和s409,可以进一步使得第一信息集合中的地理位置信息的可信度验证过程的精确性(需同时满足相似ip的预设数量阈值及预设距离阈值的要求),从而提升ip地理位置更新的准确性。

为进一步优化数据更新流程,在本申请实施例中,可以预先定义一个无争议信息库q1和一个争议信息库q2,在确定上述第一信息集合中与某个ip地址信息对应的地理位置信息可信度较高时,可以不立即执行上述步骤s306或上述步骤s407,而是将该可信度较高的ip地址信息、及与该ip地址信息对应的地理位置信息放入上述无争议信息库q1,最终,在该无争议信息库q1内的数据是不需要进行验证的,而有一些数据无法确定其可信度是最高的,但是也不能将其直接舍弃,则可以将这些数据放入上述争议信息库q2内,以待进一步验证可信度。最终,可以将第一信息集合20中的若干数据划分到上述无争议信息库q1和争议信息库q2中,并且,针对同一个ip地址的数据,如果其同时存在于上述无争议信息库q1和争议信息库q2中,则可以将该ip地址在争议信息库q2中的数据予以删除。

接下来,将介绍如何对争议信息库q2的数据进行可信度验证的过程。

图7为在图6所示的实施例的基础上提供的ip信息库的更新方法中的流程,包括:

s410:分别确定在各分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量。其中,在执行完上述步骤s404之后,进入该步骤s410。

s412:将各分组集合对应的数量按照从大到小进行排序,得到与各分组集合对应的数量排名。

继续沿用上述例子,假设第一信息集合20中与ip地址:189.234.102.109对应的地理位置信息是:北京某商场a,通过统计,发现该ip地址在预设ip地址字段的值相同的其余ip地址分布于三个分组集合中,分别是:第1个分组集合21,第2个分组集合22,第s个分组集合2s,其中,与该地理位置信息:北京某商场a对应的分组集合为第s个分组集合2s。通过统计,得出在上述第1个分组集合21内的与ip地址:189.234.102.109在预设ip地址字段的值相同的ip地址数量是10,在上述第2个分组集合22内的与ip地址: 189.234.102.109在预设ip地址字段的值相同的ip地址数量是20,在上述第s个分组集合2s内的与ip地址:189.234.102.109在预设ip地址字段的值相同的ip地址数量是30,则最终,通过将各分组集合对应的数量按照从大到小进行排序,得到:

第s个分组集合2s>第2个分组集合22>第1个分组集合21。

s414:判断当前确定的分组集合对应的数量排名是否为1到n中的任意一个,其中,在步骤s405执行完之后,进入该步骤s414。

其中,若上述步骤s414的判断结果为“是”,并且上述步骤s409的判断结果为“否”,则进入步骤s416。

在上述例子中,假设步骤s405中确定的与预设地理区域:“以“东经20°、北纬30°”为中心的方圆10公里”对应的分组集合是:第s个分组集合2s,若与该第s个分组集合2s对应的上述数量排名是1,并且在第一信息集合20中与该ip地址:“189.234.102.109”对应的地理位置信息:“北京某商场a”和第二信息集合10中与该ip地址:“189.234.102.109”对应的地理位置信息:“北京某超市b”之间的第一距离(如9公里)小于预设距离阈值(如10公里),则毫无争议地可以认定在第一信息集合中与上述ip地址:189.234.102.109对应的该地理位置信息:北京某商场a是可信度较高的,进而将其放入q1。

反之,若发现在第一信息集合20中与该ip地址:“189.234.102.109”对应的地理位置信息:“北京某商场a”和第二信息集合10中与该ip地址:“189.234.102.109”对应的地理位置信息:“北京某超市b”之间的第一距离(如11公里)大于或等于预设距离阈值(如10公里),并且上述第s个分组集合2s对应的上述数量排名是1~n(其中,2≤n,n为自然数)中的任意一个,则可以进入步骤s416。

s416:将该ip地址信息确定为争议ip地址信息,并将该争议ip地址信息及在上述第一信息集合中与该争议ip地址信息对应的地理位置信息放入争议信息库q2中。

通过步骤s418、s420、s422来验证上述争议信息库q2中的数据的可信度,若可信度满足更新的条件,则进入步骤s424。其中,关于步骤s418、s420、s422将在下文予以详细叙述。

s424:将在第二信息集合10中与该争议ip地址信息对应的地理位置信息替换为在争议信息库q2中与该争议ip地址信息对应的地理位置信息。

本申请实施例中,上述步骤s418可以具体包括:

s4181:确定与该争议ip地址信息相邻的至少一个相邻ip地址信息,并确定在所述第二信息集合10中与上述相邻ip地址信息对应的地理位置信息和在所述第一信息集合10中与该争议ip地址信息对应的地理位置信息之间的第二距离。

其中,若一个ip地址和另外一个ip地址在末位上的数值是相邻的,则定义这两个ip地址为互为相邻的ip地址。举例而言,对于ip地址:“189.234.102.109”,与之相邻的ip地址是:“189.234.102.108”、“189.234.102.110”。假设在第二信息集合10与上述ip地址:“189.234.102.108”对应的地理位置信息是:北京某商场b,在第二信息集合10与上述ip地址:“189.234.102.110”对应的地理位置信息是:北京某超市c,在所述第一信息集合10(即上述争议信息库q2)中与该争议ip地址信息:“189.234.102.109”对应的地理位置信息是:北京某商场a,最终分别得出:

“北京某商场b”与“北京某商场a”的第二距离是5公里;

“北京某超市c”与“北京某商场a”的第二距离是7公里;

s4182:判断所述第二距离是否大于或等于所述预设距离阈值。若所述第二距离小于所述预设距离阈值,进入上述步骤s424。

在上述例子中,若设定的预设距离阈值是10公里,则上述“北京某商场b”与“北京某商场a”的第二距离、“北京某超市c”与“北京某商场a”的第二距离均小于该10公里。通过上述步骤s418的过程中,可以验证上述争议信息库q2内的数据的可信度。

本申请实施例中,上述步骤s420可以具体包括:

s4201:分别确定在上述争议信息库q2中、上述ip地理信息10库中与某争议ip地址信息在预设ip地址字段的值相同的ip地址信息的第一数量、第二数量。

继续沿用上述例子,对于该争议ip地址信息:“189.234.102.109”,在上述争议信息库q2中与该争议ip地址信息:“189.234.102.109”在预设ip地址字段的值相同的ip地址信息的第一数量为100,在上述ip地理信息10中与该争议ip地址信息:“189.234.102.109”在预设ip地址字段的值相同的ip地址信息的第一数量为80。

s4202:判断所述第一数量是否大于所述第二数量的m倍;其中,1≤m。

例如,该m=1.1,也就是判断上述第一数量是否大于所述第二数量的1.1倍。若是,则进入步骤s4203。

s4203:判断所述第一数量、第二数量是否均大于基础阈值。若所述第一数量、第二数量均大于基础阈值,则进入上述步骤s424。

在实际情况中,可能会出现虽然第一数量大于第二数量的m倍,但是第一数量和第二数量均太小(例如第一数量是2,第二数量是1),则这种情况也无法验证争议ip地址信息的可信度。为提高验证的准确性,设定基础阈值,例如:10。可见上述第一数量:100大于上述第二数量:80的1.1倍,并且均大于10,则可以确定在上述争议信息库q2中与该争议ip地址信息对应的数据的可信度较高的,可以放入无争议信息库q1,并最终利用无争议信息库q1内的数据对第二信息集合10进行更新。

本申请实施例中,上述步骤s422可以具体包括:

s4221:分别确定在上述争议信息库中、上述第二信息集合中与某争议ip地址信息在预设ip地址字段的值相同的ip地址信息的第一数量、第二数量。该步骤s4221可以参照上述步骤s4201的内容。

s4222:判断第一数量是否大于所述第二数量及所述第一数量是否均大于 基础阈值;该步骤s4222可以参照上述步骤s4203的内容。

若所述第一数量小于所述第二数量且所述第一数量大于基础阈值,则进入步骤s4223。

s4223:确定在所述争议信息库q2中与该争议ip地址信息在预设ip地址字段的值相同的各ip地址信息的地理位置信息的第一方差,确定在所述第二信息集合10中与该争议ip地址信息在预设ip地址字段的值相同的各ip地址信息的地理位置信息的第二方差;

例如:对于争议ip地址信息:189.234.102.109,在争议信息库q2中与其在预设ip地址字段的值相同的ip地址信息包括:189.234.102.107(对应的地理位置信息是x1)、189.234.102.108(对应的地理位置信息是x2),189.234.102.166(对应的地理位置信息是x3);在第二信息集合10中与其在预设ip地址字段的值相同的ip地址信息包括:189.234.102.155(对应的地理位置信息是y1)、189.234.102.10(对应的地理位置信息是y2),189.234.102.177(对应的地理位置信息是y3)。

利用方差计算公式,可以得出:

第一方差其中,是x1、x2、x3的均值(可以是经纬度的均值)。

第二方差其中,是y1、y2、y3的均值(可以是经纬度的均值)。

s4224:判断所述第一方差是否小于所述第二方差若是,进入上述步骤s424。

本申请实施例通过上述步骤s418、s420、s422中的任意一个或多个过程,将得到的争议信息库q2中的数据进行逐一验证,并将可信度满足要求(可信度较高)的ip地址信息和与之对应的地理位置信息放入到无争议信息库q1中,最终利用无争议信息库q1中的数据对第二信息集合10进行更新。

与上述方法流程对应的,本申请的实施例还提供了一种可信ip信息的判定装置及ip信息库的更新装置。上述装置可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为逻辑意义上的装置,是通过服务器的中央处理器(centralprocessunit,cpu)将对应的计算机程序指令读取到内存中运行形成的。

图8为本申请一实施例提供的可信ip信息的判定装置的模块示意图。其中,该装置中包含的各个单元所实现的功能与上述方法中包含的各个步骤所实现的功能相同,故该装置可以参照上述方法中的具体细节,本文不再予以赘述。本申请一实施例中,可信ip信息的判定装置包括:

采集单元101,用于采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

第一确定单元102,用于确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

第二确定单元103,用于在所述第一信息集合中,确定与上述待判定的ip地址信息在预设ip地址字段的值相同的,并且处于所述预设地理区域的ip地址信息的数量;

第一判断单元104,用于判断所述数量是否大于或等于预设数量阈值;

判定单元105,用于在所述数量大于或等于预设数量阈值时,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

本申请实施例中,所述装置还包括:

查找单元,用于基于预先生成的第二信息集合,查找在该第二信息集合中与待判定的ip地址信息对应的地理位置信息;

第三确定单元,用于确定采集到的与待判定的ip地址信息对应的地理位置信息,与在上述第二信息集合中与所述待判定的ip地址信息对应的地理位置信息之间的第一距离;其中,所述第二信息集合包括若干ip地址信息和与 每个ip地址信息对应的地理位置信息。

第二判断单元,用于判断所述第一距离是否小于或等于预设距离阈值;

相应地,所述判定单元105具体用于:

若所述数量大于或等于预设数量阈值且所述第一距离小于或等于预设距离阈值,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

在本申请另一种实施例中,上述可信ip信息的判定装置包括:

采集单元101,用于采集网络设备的ip地址信息及与该ip地址信息对应的地理位置信息以形成第一信息集合;

第一确定单元102,用于在所述第一信息集合中,分别确定处于每个预设地理区域的并且与待判定的ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

第二确定单元103,用于确定待判定的ip地址信息对应的地理位置信息所处的预设地理区域;

第一判断单元104,用于判断与上述确定的预设地理区域对应的所述数量是否大于与其它预设地理区域对应的所述数量;

判定单元105,用于在与上述确定的预设地理区域对应的所述数量大于与其它预设地理区域对应的所述数量时,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

本申请实施例中,所述装置还包括:

查找单元,用于基于预先生成的第二信息集合,查找在该第二信息集合中与待判定的ip地址信息对应的地理位置信息;其中,所述第二信息集合包括若干ip地址信息和与每个ip地址信息对应的地理位置信息。

第三确定单元,用于确定采集到的与待判定的ip地址信息对应的地理位置信息,与在上述第二信息集合中与待判定的ip地址信息对应的地理位置信息之间的第一距离;

第二判断单元,用于判断所述第一距离是否小于或等于预设距离阈值;

相应地,所述判定单元105具体用于:若与上述确定的预设地理区域对应的所述数量大于与其它预设地理区域对应的所述数量,且所述第一距离小于或等于预设距离阈值,判定与所述待判定的ip地址信息对应的地理位置信息为该ip地址信息的可信地理位置信息。

综上内容,本申请实施例提供的可信ip信息的判定装置,可以通过确定在上述预设地理区域内的并且与上述待判定的ip地址信息在预设ip地址字段的值相同的的ip地址信息的数量,并根据该数量的大小来判定所述待判定的ip地址信息对应的地理位置信息是否为该ip地址信息的可信地理位置信息,实现对ip地理信息的可靠性的验证。

图9为本申请一实施例提供的ip信息库的更新装置的模块示意图。其中,该装置中包含的各个单元所实现的功能与上述方法中包含的各个步骤所实现的功能相同,故该装置可以参照上述方法中的具体细节,本文不再予以赘述。该装置包括:

采集单元201,用于采集互联网中的各网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

第一判断单元203,用于在所述第一信息集合中包含的ip地址信息存在于待更新的第二信息集合中时,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致;

第一确定单元204,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并统计在所述第一信息集合中处于该预设地理区域的且与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

第二判断单元205,用于判断所述数量是否大于或等于预设数量阈值;

替换单元206,用于在所述数量大于或等于预设数量阈值时,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

本装置可以利用第一信息集合中的数据对第二信息集合中的数据进行更新,确保更新数据的准确性。

本申请实施例中,所述装置还包括:

第二确定单元207,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息之间的第一距离;

第三判断单元208,用于判断所述第一距离是否小于或等于预设距离阈值;

相应地,所述替换单元206具体用于:

若所述数量大于或等于预设数量阈值且所述第一距离小于或等于预设距离阈值,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

图10为本申请另一实施例提供的ip信息库的更新装置的模块示意图。其中,该装置中包含的各个单元所实现的功能与上述方法中包含的各个步骤所实现的功能相同,故该装置可以参照上述方法中的具体细节,本文不再予以赘述。该装置包括:

采集单元301,用于采集互联网中的各网络设备的ip地址信息及与所述ip地址信息对应的地理位置信息,得到包含采集到的ip地址信息和地理位置信息的第一信息集合;

分组单元302,用于将所述第一信息集合按照所述地理位置信息所处的预设地理区域进行分组,得到与各预设地理区域对应的分组集合;

第一判断单元304,用于在所述第一信息集合中包含的ip地址信息存在于 待更新的第二信息集合中时,判断在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息是否一致;

第一确定单元305,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息所处的预设地理区域,并确定与该预设地理区域对应的分组集合;

第二判断单元306,用于判断在确定的该分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量是否超过在其余分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

替换单元307,用于在所述数量大于或等于预设数量阈值时,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息。

本装置可以利用第一信息集合中的数据对第二信息集合中的数据进行更新,确保更新数据的准确性。

本申请实施例中,所述装置还包括:

第二确定单元308,用于在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息不一致时,确定在所述第一信息集合中与该ip地址信息对应的地理位置信息和在所述第二信息集合中与该ip地址信息对应的地理位置信息之间的第一距离;

第三判断单元309,用于判断所述第一距离是否小于或等于预设距离阈值;

相应地,所述替换单元307具体用于:

若在确定的该分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量超过在其余分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量、且所述第一距离小于或等于预设距离阈值,将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述 第一信息集合中与该ip地址信息对应的地理位置信息。

本申请实施例中,所述装置还包括:

第三确定单元,用于分别确定在各分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

排序单元,用于将各分组集合对应的数量按照从大到小进行排序,得到与各分组集合对应的数量排名;

第四确定单元,用于在所述第一距离大于预设距离阈值且与当前确定的分组集合对应的数量排名为1到n中的任意一个时,将该ip地址信息确定为争议ip地址信息;其中,2≤n,n为自然数;

第五确定单元,用于确定与该争议ip地址信息相邻的至少一个相邻ip地址信息,并确定在所述第二信息集合中与上述相邻ip地址信息对应的地理位置信息和在所述第一信息集合中与该争议ip地址信息对应的地理位置信息之间的第二距离;

第四判断单元,用于判断所述第二距离是否大于或等于所述预设距离阈值;

相应地,所述替换单元307具体用于:

若所述第二距离小于所述预设距离阈值,将在所述第二信息集合中与该争议ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该争议ip地址信息对应的地理位置信息。

本申请实施例中,所述装置还包括:

第三确定单元,用于分别确定在各分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

排序单元,用于将各分组集合对应的数量按照从大到小进行排序,得到与各分组集合对应的数量排名;

第四确定单元,用于在所述第一距离大于预设距离阈值且与当前确定的分组集合对应的数量排名为1到n中的任意一个时,将该ip地址信息确定为争 议ip地址信息,并将该争议ip地址信息及在上述第一信息集合中与该争议ip地址信息对应的地理位置信息放入争议信息库中;其中,2≤n,n为自然数;

第五确定单元,用于分别确定在上述争议信息库中、上述第二信息集合中与某争议ip地址信息在预设ip地址字段的值相同的ip地址信息的第一数量、第二数量;

第四判断单元,用于判断所述第一数量是否大于所述第二数量的m倍;其中,1≤m;

第五判断单元,用于在所述第一数量大于所述第二数量的m倍,判断所述第一数量、第二数量是否均大于基础阈值;

相应地,所述替换单元307具体用于:

若所述第一数量、第二数量均大于基础阈值,将在所述第二信息集合中与该争议ip地址信息对应的地理位置信息替换为在所述争议信息库中与该争议ip地址信息对应的地理位置信息。

本申请实施例中,所述装置还包括:

第三确定单元,用于分别确定在各分组集合中与该ip地址信息在预设ip地址字段的值相同的ip地址信息的数量;

排序单元,用于将各分组集合对应的数量按照从大到小进行排序,得到与各分组集合对应的数量排名;

第四确定单元,用于在所述第一距离大于预设距离阈值且与当前确定的分组集合对应的数量排名为1到n中的任意一个时,将该ip地址信息确定为争议ip地址信息,并将该争议ip地址信息及在上述第一信息集合中与该争议ip地址信息对应的地理位置信息放入争议信息库中;其中,2≤n,n为自然数;

第五确定单元,用于分别确定在上述争议信息库中、上述第二信息集合中与某争议ip地址信息在预设ip地址字段的值相同的ip地址信息的第一数量、第二数量;

第四判断单元,用于判断所述第一数量是否大于所述第二数量及所述第一 数量是否均大于基础阈值;

第六确定单元,用于在所述第一数量小于所述第二数量且所述第一数量大于基础阈值时,确定在所述争议信息库中与该争议ip地址信息在预设ip地址字段的值相同的各ip地址信息的地理位置信息的第一方差,确定在所述第二信息集合中与该争议ip地址信息在预设ip地址字段的值相同的各ip地址信息的地理位置信息的第二方差;

第五判断单元,用于判断所述第一方差是否小于所述第二方差;

相应地,所述替换单元307具体用于:

若所述第一方差小于所述第二方差,将在所述第二信息集合中与该争议ip地址信息对应的地理位置信息替换为在所述争议信息库中与该争议ip地址信息对应的地理位置信息。

综上所述,在上述ip信息库的更新装置中,可以根据上述原理判定某个ip地址信息和与之对应的地理位置信息是否可信,若可信,则将在所述第二信息集合中与该ip地址信息对应的地理位置信息替换为在所述第一信息集合中与该ip地址信息对应的地理位置信息,从而完成上述第二信息集合的更新,进而确保第二信息集合中数据的准确性。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本 申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同在预设ip地址字段的值相同的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1