本发明属于大数据技术领域,尤其涉及一种指纹库的更新方法、装置、设备及计算机存储介质。
背景技术:
随着科学技术的发展和计算能力的提高,基于用户终端的位置服务在广告、推销、紧急救援等领域发挥着越来越重要的作用。位置服务又称定位服务,是无线运营商为用户提供的一种与位置有关的服务。运营商具有用户终端与基站之间交互的指令信息,可以用作终端的定位。为了更加精确地对用户终端进行定位,目前比较常用的方法包括基于测量报告(measurmentreport,mr)的定位方法。测量报告是指基站所获取的信号强度测量报告,无线接入网向用户终端发送测量控制信息,用户终端接受控制信息测量,并向无线接入网发送测量报告。通过数据解析可以得到mr数据。mr数据记录了移动用户终端在业务保持过程中的服务小区/邻区id、信号接收功率(referencesignalreceivingpower,rsrp)、信号接收质量(referencesignalreceivingquality,rsrq)、到达角(angle-of-arrival,aoa)、发射功率余量(powerheadroomreport,phr)等无线测量信息。
通常,基于mr数据的定位用户终端的方法包括测距定位和指纹定位。其中,指纹定位是将包含位置信息的mr数据训练为指纹数据库,将没有位置信息的mr数据根据特征进行指纹匹配,生成位置信息。指纹定位的精确度依赖于指纹数据库中的指纹数据的代表性和准确性。如果指纹库中的指纹数据存在准确性不高的问题,将影响待定位mr数据的匹配运算的准确性,进而将影响指纹定位结果的精确性。
因此,如何提高指纹库中的指纹数据的精细度,以建立具有更好的精准度的指纹库,是目前亟待解决的问题。
技术实现要素:
本发明实施例提供一种指纹库的更新方法、装置、设备及计算机存储介质,能够提高指纹库中的指纹数据的精准性,进而可以提升指纹库的精准度。
第一方面,本发明实施例提供一种指纹库的更新方法,方法包括:
获取目标指纹库中的测量报告mr样本数据,所述mr样本数据包括预设时间周期内的至少一个mr样本数据;每个所述mr样本数据包括终端位置数据;
分别判断每个所述终端位置数据与第一室内位置数据集合中的至少一个位置数据是否满足预设关系,得到判断结果,其中,所述第一室内位置数据集合由预先关联的所述mr样本数据和预设的第一室内位置特征信息确定;
根据所述判断结果,为每个所述mr样本数据的终端位置数据添加室内外标识,得到对应的mr目标数据;
根据至少一个所述mr目标数据,更新所述目标指纹库。
可选地,在所述分别判断每个所述终端位置数据与第一室内位置数据集合中的至少一个位置数据是否满足预设关系之前,还包括:
关联所述mr样本数据和预设的第一室内位置特征信息,确定所述第一室内位置数据集合;
所述关联所述mr样本数据和预设的第一室内位置特征信息,确定所述第一室内位置数据集合,具体包括:
对每个所述mr样本数据的终端类型数据和终端位置数据进行预处理,得到每个终端对应的第一位置数据集合;
根据每个所述终端类型数据和第一室内位置特征信息,调用地图接口,分别确定每个终端对应的第二室内位置数据集合;所述预设的室内位置特征信息包括第一室内位置特征信息和第二室内位置特征信息;
根据每个所述mr样本数据的基站位置数据和所述第二室内位置特征信息,调用地图接口,分别确定每个基站对应的第三室内位置数据集合;
将每个终端的所述第一位置数据集合的第一位置数据分别与对应的第二室内位置数据集合的第二位置数据、第三室内位置数据集合的第三位置数据以及其他终端的第二室内位置数据集合的第四位置数据进行匹配,得到满足预设关系的多个第五位置数据;
根据多个所述第五位置数据,确定所述第一室内位置数据集合。
可选地,所述将每个终端的所述第一位置数据集合的第一位置数据分别与对应的第二室内位置数据集合的第二位置数据、第三室内位置数据集合的第三位置数据以及其他终端的第二室内位置数据集合的第四位置数据进行匹配,得到满足预设关系的多个第五位置数据,包括:
分别判断每个终端的每个所述第一位置数据与至少一个所述第二位置数据是否一致;
当所述第一位置数据与至少一个所述第二位置数据一致时,则将所述第一位置数据作为第五位置数据;否则,判断所述第一位置数据与至少一个所述第三位置数据是否一致;
当所述第一位置数据与至少一个所述第三位置数据一致时,则将所述第一位置数据作为第五位置数据;否则,判断所述第一位置数据与至少一个所述第四位置数据是否一致;
当所述第一位置数据与至少一个所述第四位置数据一致时,则将所述第一位置数据作为第五位置数据。
可选地,所述对每个mr样本数据的终端类型数据和终端位置数据进行预处理,得到每个终端对应的第一位置数据集合,包括:
根据每个所述mr样本数据的终端类型数据和终端位置数据,得到每个终端对应的多个第一位置数据;
针对每个终端对应的多个所述第一位置数据,判断多个所述第一位置数据之间是否满足所述预设关系,得到每个所述终端对应的多个第一位置数据子集合;
根据每个所述第一位置数据子集合中的第一位置数据的数量值的大小,对多个所述第一位置数据子集合进行排序,得到排序结果;
根据所述排序结果,提取所述第一位置数据的数量值到达预设阈值的至少一个所述第一位置数据子集合;
根据每个终端提取的至少一个所述第一位置数据子集合,确定所述每个终端对应的第一位置数据集合。
可选地,所述根据判断结果,为每个所述mr样本数据的终端位置数据添加室内外标识,得到对应的mr目标数据,包括:
当所述mr样本数据的终端位置数据与第一室内位置数据集合中的至少一个位置数据一致时,则为所述终端位置数据添加室内标识,得到对应的mr目标数据;
当所述mr样本数据的终端位置数据与第一室内位置数据集合中的全部位置数据不一致时,则为所述终端位置数据添加室外标识,得到对应的mr目标数据。
可选地,所述根据每个终端类型数据和第一室内位置特征信息,调用地图接口,分别确定每个终端对应的第二室内位置数据集合,包括:
根据每个所述终端类型数据,获取每个所述终端对应的第一室内位置特征信息;
根据获取的每个所述第一室内位置特征信息,调用地图接口,分别确定每个终端对应的第一室内位置数据集合。
可选地,所述根据每个mr样本数据的基站位置数据和所述第二室内位置特征信息,调用地图接口,分别确定每个基站对应的第三室内位置数据集合,包括:
根据每个所述基站位置数据,获取每个所述基站对应的第二室内位置特征信息;
根据获取的每个所述第二室内位置特征信息,调用地图接口,分别确定每个基站对应的第二室内位置数据集合。
第二方面,本发明实施例提供了一种指纹库的更新装置,装置包括:
获取模块,用于获取目标指纹库中的测量报告mr样本数据,所述mr样本数据包括预设时间周期内的至少一个mr样本数据;每个所述mr样本数据包括终端位置数据;
判断模块,用于分别判断每个所述终端位置数据与第一室内位置数据集合中的至少一个位置数据是否满足预设关系,得到判断结果,其中,所述第一室内位置数据集合由预先关联的所述mr样本数据和预设的第一室内位置特征信息确定;
添加模块,用于根据所述第一判断结果,为每个所述mr样本数据的终端位置数据添加室内外标识,得到对应的mr目标数据;
更新模块,用于根据至少一个所述mr目标数据,更新所述目标指纹库。
第三方面,本发明实施例提供了一种指纹库的更新设备,设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求第一方面以及第一方面可选地所述的指纹库的更新方法。
第四方面,本发明实施例提供了一种计算机存储介质,
所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如第一方面以及第一方面可选地所述的指纹库的更新方法。
本发明实施例的指纹库的更新方法、装置、设备及计算机存储介质,能够通过获取预设时间周期内的多个mr样本数据,判别每个mr样本数据的终端位置数据和预设的室内位置数据集合的关联一致性。根据判别结果,对每个mr样本数据的终端位置数据的进行室内外标记,将原指纹库中的mr样本数据进行了优化,得到目标指纹库,该目标指纹库中的mr数据的终端定位信息细化到室内外的级别,该mr数据即为指纹库的指纹数据。由此,可以提高指纹库中的指纹数据的精准性,进而可以得到具有较高精准度的指纹库。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的指纹库的更新方法的流程示意图;
图2是本发明一个实施例提供的确定第一室内位置数据集合的流程示意图;
图3是本发明一个实施例提供的确定终端k的第一位置数据集合的过程示意图;
图4是本发明一个实施例提供的确定终端k的第二室内位置数据集合的过程示意图;
图5是本发明一个实施例提供的确定终端k的第三室内位置数据集合的过程示意图;
图6是本发明一个实施例提供的确定第一室内位置数据集合的过程示意图;
图7是本发明另一个实施例提供的指纹库的更新装置的结构示意图;
图8是本发明另一个实施例提供的实际应用中一种指纹库的更新装置的应用流程示意图;
图9示出了本发明实施例提供的指纹库的更新设备的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决现有技术问题,本发明实施例提供了一种指纹库的更新方法、装置、设备及计算机存储介质。下面首先对本发明实施例所提供的指纹库的更新方法进行介绍。
图1是本发明一个实施例提供的指纹库的更新方法的流程示意图。如图1所示,在本发明实施例中,该指纹库的更新方法,可以包括如下步骤:
s101:获取目标指纹库中的测量报告mr样本数据。
这里,获取的该mr样本数据包括预设时间周期内的至少一个mr样本数据,每个mr样本数据可以包括终端位置数据。
具体地,该mr样本数据可以包括但不限于mr特征数据、终端位置数据、待标记的室内室外标注值以及涉及基站位置数据。该mr样本数据可以是通过深度解析技术解析过的数据。
s102:分别判断每个所述终端位置数据与第一室内位置数据集合中的至少一个位置数据是否满足预设关系,得到判断结果。
具体地,判断上述两种位置数据是否满足预设关系,可以是判断两种位置数据的经纬度是否一致。其中,关于是否一致的判断可以使用后验置信区间进行判断。即对于两种位置数据的经纬度,两种经度是否相等,并且纬度是否相等。具体地,当两种位置数据的经纬度值分别相等的满足置信度为95%概率时,可以确定两种位置数据是一致的。
这里,该第一室内位置数据集合由预先关联的每个mr样本数据和预设的第一室内位置特征信息确定。该第一室内位置数据集合可以包括室内位置数据的坐标经纬度数据的集合。
s103:根据所述判断结果,为每个所述mr样本数据的终端位置数据添加室内外标识,得到对应的mr目标数据。
具体地,该判断结果包括:mr样本数据的终端位置数据与第一室内位置数据集合中的至少一个位置数据一致、或者mr样本数据的终端位置数据与第一室内位置数据集合中的全部位置数据不一致。
当mr样本数据的终端位置数据与第一室内位置数据集合中的至少一个位置数据一致时,则为该终端位置数据添加室内标识,即给该终端位置数据的室内外标识值赋值,标记为室内,得到对应的mr目标数据。
当mr样本数据的终端位置数据与第一室内位置数据集合中的全部位置数据不一致时,则为所述终端位置数据添加室外标识,即给该终端位置数据的室内外标识值赋值,标记为室外,得到对应的mr目标数据。
s104:根据至少一个所述mr目标数据,更新所述目标指纹库。
这里,将每个mr样本数据进行比较判断后,可以获得多个具有室内外标识信息的mr目标数据。即每个mr样本数据的信息进行了更新,得到了更新后的目标指纹库,该指纹库包括了具有室内外标识信息的指纹数据。
综上,本发明实施例中,该指纹库的更新方法,能够通过获取预设时间周期内的多个mr样本数据,判别每个mr样本数据的终端位置数据和预设的室内位置数据集合的关联一致性。根据判别结果,对每个mr样本数据的终端位置数据的进行室内外标记,将原指纹库中的mr样本数据进行了优化,得到目标指纹库,该目标指纹库中的mr数据的终端定位信息细化到室内外的级别,该mr数据即为指纹库的指纹数据。由此,可以提高指纹库中的指纹数据的精准性,进而可以提升指纹库的精准度,得到具有较高精准度的指纹库。
在本发明一个实施中,在上述实施例中的s102之前,该指纹库的更新方法还包括:关联mr样本数据和预设的第一室内位置特征信息,确定所述第一室内位置数据集合。请参见图2,图2是本发明一个实施例提供的确定第一室内位置数据集合的流程示意图。具体实施为如下步骤:
s201:对每个所述mr样本数据的终端类型数据和终端位置数据进行预处理,得到每个终端对应的第一位置数据集合。
这里,获取的每个mr样本数据还可以包括终端类型数据,该终端类型数据可以包括国际移动设备识别码(internationalmobileequipmentidentity,imei),即通常所说的手机序列号和或移动台国际用户识别码(mobilesubscriberinternationalisdnnumber,msisdn),即通常所说的手机号码。由此,可以确定每个mr样本数据中的用户终端以及该用户终端对应的终端位置数据。该第一位置数据,即终端位置数据。
具体地,每个mr样本数据的终端类型数据和终端位置数据进行预处理可以包括对终端位置数据进行归类和排序,提取终端活动的高中频位置的数据,可以具体实施为如下步骤:
s2011:根据每个mr样本数据的终端类型数据和终端位置数据,得到每个终端对应的多个第一位置数据。
具体地,该用户终端的终端类型数据包括imei和或msisdn等数据。根据终端类型数据可以得到多个终端,并可以确定,每个终端对应的多个第一位置数据。
s2012:针对每个终端对应的多个所述第一位置数据,判断多个所述第一位置数据之间是否满足所述预设关系,得到每个所述终端对应的多个第一位置数据子集合。
这里,每个终端对应多个第一位置数据,多个第一位置数据可以包括不同位置区域的第一位置数据,第一位置数据具体可以是位置坐标的经纬度数据。可以根据第一位置数据的相似度和一致性,对终端的多个第一位置数据进行归类,其中,对于多个第一位置数据,判断这些第一位置数据,即位置坐标的经纬度数据之间可以满足预设关系。该预设关系可以是指每个位置坐标的经度相等和纬度相等达到预设的置信度,该置信度可以为95%,满足预设关系的多个第一位置数据即可以认为是具有一致性关系。可以将这些具有一致性关系的第一位置数据看作同一位置区域的第一位置数据,由此,得到多个第一位置数据子集合。每个第一位置数据子集合中的第一位置数据均具有一致性关系的。一个第一位置数据子集合可以代表一个位置区域,并且,其中的第一位置数据具有相同位置坐标的经纬度数据。
s2013:根据每个所述第一位置数据子集合中的第一位置数据的数量值的大小,对多个所述第一位置数据子集合进行排序,得到排序结果。
这里,第一位置数据子集合可以包括多个第一位置数据,根据第一位置数据子集合中的第一位置数据的数量值的大小,对多个第一位置数据子集合进行排序,排序方式可以包括降序排序或者升序排序。可以理解的是,具体地排序方式可以根据实际需求而确定。
s2014:根据所述排序结果,提取所述第一位置数据的数量值到达预设阈值的至少一个所述第一位置数据子集合。
这里,预设阈值可以根据实际需求确定,比如,可以选取降序排序后的前20个第一位置数据子集合。可以理解的是,每个第一位置数据子集合都可以看做是该终端的活动位置,而具有较大第一位置数据的数量值的第一位置数据子集合可以看作该终端的集中活动位置,即高频活动位置;具有较小第一位置数据的数量值的第一位置数据子集合可以看作该终端的非集中活动位置,即低频活动位置。这里选取的多个第一位置数据子集合可以是终端的多个高中频活动位置。
s2015:根据每个终端提取的至少一个所述第一位置数据子集合,确定所述每个终端对应的第一位置数据集合。
这里,第一位置数据子集合中的多个第一位置数据,可以具有同一个位置坐标的经纬度数据,可以提取每个第一位置数据子集合的位置坐标的经纬度数据,最后,根据提取到的多个位置坐标的经纬度数据,确定第一位置数据集合。
可以理解的是,通过执行s2011至s2015,最终可以得到第一位置数据集合,其中,第一位置数据子集合中的第一位置数据均可以看作对应终端的高中频活动位置。该第一室内位置数据集合可以是每个终端对应的高中频的活动位置的位置数据的汇总。
s202:根据每个所述终端类型数据和第一室内位置特征信息,调用地图接口,分别确定每个终端对应的第二室内位置数据集合。
具体地,预设的室内位置特征信息包括第一室内位置特征信息。这里,第一室内位置特征信息包括多个第一地址元素的位置特征信息,第一地址元素的位置特征信息具体可以是常用的室内位置的地址,包括:省市区镇路等信息。第一室内位置特征信息可以从运营商的经营分析域后台数据库中获取。此外,从后台数据库获取到第一室内位置特征信息后,还可以包括对第一室内位置特征信息进行预处理,将地址按照省市区镇路等信息进行标准化整理。
首先,根据每个终端类型数据,获取每个终端对应的第一室内位置特征信息,然后根据获取的每个第一室内位置特征信息,调用地图接口,将上述第一室内位置特征信息输入现有的电子地图应用,分别确定每个终端对应的第一室内位置数据集合。地图接口可以为地图应用程序接口(applicationprogramminginterface,api)。
s203:根据每个所述mr样本数据的基站位置数据和所述第二室内位置特征信息,调用地图接口,分别确定每个基站对应的第三室内位置数据集合。
这里,预设的室内位置特征信息还包括第二室内位置特征信息。第二室内位置特征信息包括多个第二地址元素的位置特征信息。第二地址元素的位置特征信息具体可以是公共服务位置。公共服务位置包括但不限于如下位置:商场、商城、电影院、酒店、超市等大众活动位置区域。
具体地,根据每个所述基站位置数据,获取每个所述基站对应的第二室内位置特征信息。在根据获取的每个第二室内位置特征信息,调用地图接口,将上述第二室内位置特征信息输入现有的电子地图应用,分别确定每个基站对应的第二室内位置数据集合。地图接口可以为地图api。
s204:将每个终端的所述第一位置数据集合的第一位置数据分别与对应的第二室内位置数据集合的第二位置数据、第三室内位置数据集合的第三位置数据以及其他终端的第二室内位置数据集合的第四位置数据进行匹配,得到满足预设关系的多个第五位置数据。
具体地,该预设关系可以是指进行比较的位置数据是否一致,即位置数据的经纬度值是否一致,可以是指位置数据的经纬度值分别相等的置信度确定是否一致。即对于进行比较的位置数据的经纬度,经度是否相等,并且纬度是否相等。具体地,当位置数据的经纬度值分别相等的满足置信度为95%概率时,可以确定位置数据是一致的。
可选地,分别判断每个终端的每个第一位置数据与至少一个第二位置数据是否一致;当第一位置数据与至少一个所述第二位置数据一致时,则将第一位置数据作为第五位置数据;否则,判断第一位置数据与至少一个第三位置数据是否一致;
当第一位置数据与至少一个所述第三位置数据一致时,则将所述第一位置数据作为第五位置数据;否则,判断第一位置数据与至少一个第四位置数据是否一致;
当第一位置数据与至少一个第四位置数据一致时,则述第一位置数据作为第五位置数据。
由此,通过上述判断过程,可以得到多个第五位置数据。
s205:根据多个所述第五位置数据,确定所述第一室内位置数据集合。
综上,在本发明实施中,通过已有的mr样本数据,确定每个终端对应的第一位置数据集合,该第一室内位置数据集合可以是每个终端的高中频的活动位置的位置数据集合。将该第一位置数据集合分别和不同类型的室内位置集合比较,获取到具有一致关系的位置数据,以形成了第一室内位置数据集合。利用该第一室内位置数据集合,便可以判别每个mr样本数据的终端位置数据和第一室内位置数据集合的关联一致性,如果具有关联一致性就说明该根据mr样本数据的终端位置为室内。由此,根据判别结果,对每个mr样本数据的终端位置数据的进行室内外标记,将原指纹库中的mr样本数据进行了优化,得到目标指纹库,提升了该目标指纹库中的指纹数据的精准性,进而得到具有较高精准度的指纹库。
为了可以更好的理解本发明的方法,现结合应用实例,详细说明该指纹库的更新方法。
在本发明一个实施例中,具体地,原指纹库中包括多个mr样本数据,mr样本数据可以包括但不限于mr特征数据、终端位置经纬度,即终端位置数据、待标记的室内室外标注值、终端类型数据以及涉及基站位置经纬度,即基站位置数据。例如,获取时间周期为t的多个mr样本数据,其中,对于任意一个mr样本数据mr特征数据记为f,终端位置数据记为loc,待标记的室内室外标注值记为zi,第i个mr样本数据特征定位标注序列项记为{fi,loci(longi,lati),zi},i∈[1,n],其中,n表示终端位置经纬度的总个数,longii,latn分别表示该终端位置数据对应的经度和纬度。如果涉及基站位置数据,任意一个基站p对应的位置数据记为sp(longp,latp),longp,latp分别表示该基站位置数据对应的经度和纬度。终端类型数据包括imei和或msisdn等数据。
本方法在判断两个经纬度是否一致的时候,统一使用后验置信区间进行判断,即对于loci(longi,lati)与locj(longj,latj),若同时满足以下式条件(1)(2),则loci与locj一致,否则视为不一致,其中,α和β分别表示形成经度和纬度值分别相等的置信度大于95%的区间长度的一半,实际过程可通过抽样统计计算得出。可以理解的是,下面的α1和β1,α2和β2与这里的α和β表示的意义是一样的,仅是作为表述用的符号区分。
|longi-longj|<α(1)
|lati-latj|<β(2)
可选地,以任意一个终端k为例,首先,根据mr样本数据中的终端k的终端类型数据,确定该用户终端k的对应的多个第一位置数据,即终端位置经纬度。
对于终端k对应的多个第一位置数据,即终端位置经纬度,其中,多个第一位置数据可以包括不同位置的位置数据,可以根据每个第一位置数据的是否一致,对终端k的多个第一位置数据进行归类,得到不同位置对应的一个总位置类别集合。具体地,对于k一定,遍历n∈[1,nk],记第k终端对应的总位置类别集合taddrk,第x类位置总个数记为countkx,当n=n1时,taddrk目前共有x类,若lockn1(longkn1,latkn1)与taddrk中元素均不一致,则lockn1(longkn1,latkn1)为taddrk的新增元素、即位置类别,x=x+1,taddrkx=lockn1(longkn1,latkn1),遍历countkx=1,l+=1;否则记lockn1(longkn1,latkn1)与taddrk中第y类一致,则countky+=l,l+=1,循环遍历直至n=nk+1停止;在判断两个终端位置经纬度是否一致时,两个终端位置经纬度是否同时满足以下公式(3),(4)的条件,如果满足则视为一致,否则不一致。α1和β1与上述的参数α和β表示的意义是一样的。
|longknx-longkx|<α1(3)
|latknx-latkx|<β1(4)
按照总位置类别集合taddrk中的不同位置降序排列,形成集合addrk形成。将第k终端对应的总位置类别集合taddrk按照countkx(x∈[1,x],x为第k终端的总位置类别数)的大小进行降序排序,并由前m个形成集合addrk,并将第r大的类别记为addrkr,其中r∈[1,m],m∈(1,nk),如r=t时,countkt最大,则addrkt=taddrkt。由此,提取到终端活动的高中频位置数据的集合addrkt,即终端k的第一位置数据集合。如图3所示,图3是本发明一个实施例提供的确定终端k的第一位置数据集合的过程示意图。终端k的对应的多个位置数据:(longkn1,latkn1),(longkn2,latkn2)、(longkn3,latkn3),……,(longknn,latknn),根据位置经纬度值是否一致的判断进行归类,得到总位置类别集合taddrk:(longkx1,latkx1)countkx1,(longkx2,latkx2)countkx2,(longkx3,latkx3)countkx3,……,(longkxx,latkxx)countkx4,提取countk最大的m个位置数据,最后,可以得到终端k对应的第一位置数据集合addrk:
(longkr1,latkr1),(longkr2,latkr2),(longkr3,latkr3),……,(longkrm,latkrm)。
其次,获取终端k的常用位置集合hddrk,即第二室内位置数据集合和公共服务位置经纬度集合cddr,即第三室内位置数据集合:
通过终端k的imei、msisdn关联,获取第k个常用位置hreck,具体地,可以从经营分析域后台数据库获取,其中,hreck是字符串组合,在存储前需要先进行预处理,按照使用习惯、按照省市区镇路等顺序进行数据补齐。若hreck地址元素个数为u,则第u个记为hrecku。将hreck元素输入到地图api接口,即可获取hrecku对应的经纬度记录hddrku(longku,latku),该经纬度表示终端k出现第u个地址对应的经纬度。如图4所示,图4是本发明一个实施例提供的确定终端k的第二室内位置数据集合的过程示意图。
通过地图api服务,形成公共服务位置经纬度集合cddr,即第三室内位置数据集合。具体地,将公共服务位置常用关键字集合输入到地图api服务,获取第p个基站位置数据集合sddrp周围的公共服务区位置经纬度集合,记为cddrp,并记第j个公共服务地址为cddrpj。其中,公共服务位置的常用关键字集合,包括:商场、商城、电影院、酒店、超市等大众位置区域。一个基站p对应的cddrp集合中可以包括多个地址元素的经纬度值。例如,若第p个基站sddrp输入到地图api搜索关键字集合共获取wp个经纬度值,则cddrp共有wp个地址元素,其中第j个公共服务地址记录为cddrpj,j∈[1,w],且cddr由cddrp组成,p∈[1,p]。如图5所示,图5是本发明一个实施例提供的确定终端k的第三室内位置数据集合的过程示意图。
再次,将终端k的第一位置数据集合addrk与第二室内位置数据集合hddrk进行对比,判断是否存在一致的位置数据,将一致的第一位置数据作为第一室内位置数据集合faddrk的位置数据。具体地,对于每一个addrkr(longkr,latkr),r∈[1,m],即若记其中一个为addrkd(longkd,latkd),判断hddrku(longku,latku),u∈[1,u]中任意一个是否满足以下关系:
|longkd-longku|<α2,u∈[1,u](5)
|latkd-latku|<β2,u∈[1,u](6)
若存在hddrkt(longkt,latkt)满足要求,则faddrkr(longfkr,latfkr)=addrkr(longkr,latkr),否则,faddrkr(longfkr,latfkr)=(0,0)。执行下面步骤
将第终端k的第一位置数据集合addrk,与第三室内位置数据集合cddr的对比是否一致,进行对比,判断是否存在一致的位置数据,将一致的第一位置数据作为第一室内位置数据集合faddrk的位置数据。
遍历faddrkr(longfkr,latfkr),r∈[1,m],若存在faddrkr(longfkr,latfkr)=(0,0),则对于每一个addrkr(longkr,latkr),即若记其中一个为addrkd(longkd,latkd),判断cddrpj(longpj,latpj),p∈[1,p],j∈[1,wr]中任意一个是否满足以下关系:
|longkd-longpj|<α2,p∈[1,p],j∈[1,wr](7)
|latkd-latpj|<β2,p∈[1,p],j∈[1,wr](8)
若存在hddrkt(longkt,latkt)满足要求,则faddrkr(longfkr,latfkr)=addrkd(longkd,latkd)。
如经过上述比较后,还没找到终端k的第一位置数据对应的室内位置数据,即若faddrk存在为(0,0)情况,使用终端k的第一位置数据集合addrk关联其他终端k1的第二室内位置数据集合hddrk1,k1∈[1,n]且k1≠k,更新faddrk
遍历faddrkr(longfkr,latfkr),r∈[1,m],若存在faddrkr(longfkr,latfkr)=(0,0),则对于每一个addrkr(longkr,latkr),即若记其中一个为addrkd(longkd,latkd),判断hddrk1u(longk1u,latk1u),k1∈[1,n]且k1≠k中任意一个是否满足以下关系:
|longkd-longpk1u|<α2,u∈[1,u],k1∈[1,n],k1≠k(9)
|latkd-latpk1u|<β2,u∈[1,u],k1∈[1,n],k1≠k(10)
若存在hddrk’u(longk’u,latk’u),u∈[1,u]满足要求,则faddrkr(longfkr,latfkr)=hddrk’t(longk’u,latk’u)。
为了更清晰第说明本过程,现以终端k的有4个第一位置数据为例,则addrk集合与faddrk集合关系详细如图6。图6是本发明一个实施例提供的确定第一室内位置数据集合的过程示意图。如图6所示,其中,相同字号大小的经纬度组合表示该组合以参数α2和β2对比一致:
addrk包括:(longkr1,latkr1),(longkr2,latkr2),(longkr3,latkr3),(longkrn,latkrn);
hddrk:(longku1,latku1),(longku2,latku2),...,(longkuu,latkuu);
cddr包括:
cddr1:{(long11,lat11),(long12,lat12),…,(long1w1,lat1w1)},
cddr2:{(long21,lat21),(long22,lat22),…,(long2w2,lat2w2)},
...,cddrp:{(longp1,latp1)(longp2,latp2),…,(longpwp,latpwp)};
其他终端的第二室内位置数据集合包括:
hddre:(longeu1,lateu1),(longeu2,lateu2),...,(longeuu,lateuu)
hddrg:(longgu1,latgu1),(longgu2,latgu2),...,(longguu,latguu)
hddrn:(longnu1,latnu1),(longnu2,latnu2),...,(longnuu,latnuu)
faddrk:(longkr1,latkr1)=(longku2,latku2),(longkr2,latkr2)=(long12,lat12)
(longkr3,latkr3)=(longnu2,latnu2),(longkrn,latkrn)=(longp1,latp1)。由此,确定第一室内位置数据集合faddrk。
最后,利用第一室内位置数据集合faddrk,完成标注和mr指纹库更新。
具体地,遍历每个终端,对于终端k的数据集合lockn(longkn,latkn),n∈[1,n],n表示终端位置经纬度的总个数,判断lockl(longkl,latkl)与addrkr(longkr,latkr),r∈[1,m]中任意一个是否满足以下关系:
|longkl-longkr|<α1,r∈[1,m](11)
|latkl-latkr|<β1,r∈[1,m](12)
若存在lockn1(longkn1,latkn1)与addrkd(longkd,latkd)满足一致关系,则longkn1=longfkd,latkl1=latfkd,其中(longfkd,latfkd)表示经纬集合faddrkd与addrkd相同序号d对应的经纬度,并且将第k个终端第n1行mr样本数据的待标记的室内室外标注值标记为室内0,否则标记为室外1。由此,可以得到目标指纹数据库。
综上,本发明实施例中,该指纹库的更新方法,能够通过获取预设时间周期内的多个mr样本数据,判别每个mr样本数据的终端位置数据和预设的室内位置数据集合的关联一致性。根据判别结果,对每个mr样本数据的终端位置数据的进行室内外标记,将原指纹库中的mr样本数据进行了优化,得到目标指纹库,该目标指纹库中的mr数据的终端定位信息细化到室内外的级别,该mr数据即为指纹库的指纹数据。由此,可以提高指纹库中的指纹数据的精准性,进而可以提升指纹库的精准度,得到具有较高精准度的指纹库。
基于上述实施例提供的指纹库的更新方法,相应地,本发明还提供了指纹库的更新装置的具体实现方式。请参见以下实施例。
在本发明一实施例中,如图7所示,图7是本发明另一个实施例提供的指纹库的更新装置的结构示意图,该指纹库的更新装置,包括:
获取模块701,用于获取目标指纹库中的测量报告mr样本数据,所述mr样本数据包括预设时间周期内的至少一个mr样本数据;每个所述mr样本数据包括终端位置数据;
判断模块702,用于分别判断每个所述终端位置数据与第一室内位置数据集合中的至少一个位置数据是否满足预设关系,得到判断结果,其中,所述第一室内位置数据集合由预先关联的所述mr样本数据和预设的第一室内位置特征信息确定;
添加模块703,用于根据所述第一判断结果,为每个所述mr样本数据的终端位置数据添加室内外标识,得到对应的mr目标数据;
更新模块704,用于根据至少一个所述mr目标数据,更新所述目标指纹库。
综上,本发明实施例中,该指纹库的更新装置可以实施上述实施例中的指纹库的更新方法,能够通过将更新指纹库中的指纹数据,将其中的mr数据的终端定位信息细化到室内外的级别,得到目标指纹库。由此,可以提高指纹库中的指纹数据的精准性,进而可以提升指纹库的精准度,得到具有较高精准度的指纹库。
在本发明一实施例中,如图8所示,图8是本发明另一个实施例提供的实际应用中一种指纹库的更新装置的应用流程示意图,该指纹库的更新装置,包括:
一致性判断模块801用于样本集判断经纬度值对是否分别满足绝对值差值域范围;样本统计模块802用于统计经纬度集合各类别出现总次数;样本排序模块803用于将经纬度集合各类别按照出现总次数进行排序;字符串关联模块808用于imei与msisdn进行关联获取字符串;字符串处理模块809用于将对关联获取得到的字符串进行预处理;经纬度集合获取模块810用于将字符串集合与地图api进行连接访问获取对应的经纬度集合;一致性循环判断模块804用于循环遍历标志经纬度集合并且进行一致性判断;标志集合赋值模块805用于标志经纬度集合的赋值;基站统计模块811用于统计基站经纬度;一致性选择判断模块806用于标志经纬度集合值的遍历判断和选择性处理;赋值标注模块807用于对经纬度集合的赋值和室内外标注。该指纹库的更新装置可以实施上述实施例中的指纹库的更新方法,能够将指纹库的mr数据的终端定位信息细化到室内外的级别,得到优化后的目标指纹库。由此,可以提高指纹库中的指纹数据的精准性,进而得到具有较高精准度的指纹库。
基于上述实施例提供的指纹库的更新方法,相应地,本发明还提供了指纹库的更新设备的具体实现方式。请参见以下实施例。
图9示出了本发明实施例提供的指纹库的更新设备的硬件结构示意图。
指纹库的更新设备可以包括处理器901以及存储有计算机程序指令的存储器902。
具体地,上述处理器901可以包括中央处理器(cpu),或者特定集成电路(applicationspecificintegratedcircuit,asic),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器902可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器902可包括硬盘驱动器(harddiskdrive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universalserialbus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器902可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器902可在综合网关容灾设备的内部或外部。在特定实施例中,存储器902是非易失性固态存储器。在特定实施例中,存储器902包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。
处理器901通过读取并执行存储器902中存储的计算机程序指令,以实现上述实施例中的任意一种指纹库的更新方法。
在一个示例中,指纹库的更新设备还可包括通信接口903和总线910。其中,如图9所示,处理器901、存储器902、通信接口903通过总线910连接并完成相互间的通信。
通信接口903,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线910包括硬件、软件或两者,将指纹库的更新设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线910可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该指纹库的更新设备可以执行本发明实施例中的指纹库的更新方法,从而实现结合图1和图2描述的指纹库的更新方法。
另外,结合上述实施例中的指纹库的更新方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种指纹库的更新方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。