基于接收信号强度信号ZCA白化的接入点k-means聚类方法
【专利摘要】本发明公开了一种基于接收信号强度信号ZCA白化的接入点k-means聚类方法,将RM中的每个位置指纹用相应参考点上的接收信号强度向量均值表示,并将均值归一化;然后通过白化接收信号强度均值,去掉相关性;k-means聚类在整个RM中选取k个指纹作为初始聚类中心;对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;不断重复步骤三和四,直到k个聚类中心不再发生变化,终止迭代。本发明充分减小了接收信号强度信号之间的相关性,提高了聚类的准确度,从而进一步提高系统的定位精度。
【专利说明】基于接收信号强度信号ZCA白化的接入点k-means聚类方法
【技术领域】
[0001]本发明属于室内定位区域聚类【技术领域】,尤其涉及一种用于室内定位的基于接收信号强度信号ZCA白化的接入点k-means聚类方法。
【背景技术】
[0002]对于较大定位目标区域,接收信号强度(RSS)的统计特性变化大,对于基于学习型定位算法来说,若对整个定位区域进行学习,将增加算法复杂度,建立的定位模型不是最优的,从而不利于提高系统的定位精度。因此需要对定位区域进行聚类分块,将较大的定位区域分成若干个小的定位区域,并分别建模,以达到降低计算复杂度、提高定位精度的目的。已有的聚类算法都没有考虑接收信号强度(RSS)信号之间的相关性问题,从而导致分类精度不够高、限制了位置解算的精度。
[0003]关于定位区域聚类主要有以下几种方法:
[0004]DYoussef等人提出的显式聚类算法。该算法将RM的位置指纹分成不同的簇,每一簇共享同一个可接收到的接入点(AP)集合,并将此集合称为该簇的键值。该方法适合定位目标区域不大,接入点(AP)数量不多的情况下,对于大的定位目标区域和较多的接入点(AP)存在情况下,往往存在在某些参考点上感测不到某些接入点(AP)的情况,这对于在线定位阶段会使移动终端因为找不到正确的簇而错误或无法解算位置信息。
[0005]2)Borenovic等人提出的区域分割算法。该算法需要人为地将定位区域划分为面积相当的若干个定位子区域。该算法不足之处是采用人为的方法将定位区域分割成大小一致的子区域,很难顾及到室内架构及布局的差异以及信号的相似性等特性,算法应用受限。
[0006]3) Chen等人提出的k均值(k-means)算法。其技术不足之处就是没有考虑接收信号强度(RSS)信号之间的相关性问题,限制了聚类的准确度。
【发明内容】
[0007]本发明实施例的目的在于提供一种基于接收信号强度信号ZCA白化的接入点k-means聚类方法,旨在解决由于接收信号强度信号之间相关性,聚类的准确度不够高,限制定位精度问题。
[0008]本发明实施例是这样实现的,一种基于接收信号强度信号ZCA白化的接入点k-means聚类方法,该基于接收信号强度信号ZCA白化的接入点k-means聚类方法包括:
[0009]步骤一,将RM中的每个位置指纹用相应参考点上的接收信号强度向量均值表示,并将均值归一化;然后通过白化接收信号强度均值,去掉相关性;
[0010]步骤二,k-means聚类在整个RM中选取k个指纹作为初始聚类中心;
[0011]步骤三,对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;
[0012]步骤四,执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;
[0013]步骤五,不断重复步骤三和四,直到k个聚类中心不再发生变化,终止迭代。
[0014]进一步,聚类结束,每个位置指纹都被收敛至与之最近的聚类中心,就将每个聚类视为一个定位子区域;离线阶段,每个聚类和对应的位置指纹数据构成一个独立的子指纹数据库;在线定位阶段,新测得的接收信号强度首先通过计算与聚类中心的欧式距离,得到最近聚类中心,然后由这个聚类中心对应的定位函数得出用户的定位子区域。
[0015]本发明提供的基于接收信号强度信号ZCA白化的接入点k-means聚类方法,将接收信号强度(RSS)信号先进行白化,然后再结合k-means聚类,可充分减小接收信号强度(RSS)信号之间的相关性,提高聚类的准确度,从而进一步提高系统的定位精度。本发明的方法简单,操作方便,较好地解决了由于接收信号强度信号之间相关性,导致的聚类的准确度低,定位精度低的问题。
【专利附图】
【附图说明】
[0016]图1是本发明实施例提供的基于接收信号强度信号ZCA白化的接入点k-means聚类方法的流程图;
[0017]图2是本发明实施例提供的基于接收信号强度信号ZCA白化的接入点k-means聚类方法的实施例1的流程图;
[0018]图3WLAN室内定位环境结构图;
[0019]图4显示了聚类中心数目k从I到8变化时,RSS信号白化前后的k-means聚类算法的聚类精度比较图;
[0020]图5为k取不同值时系统定位精度概率累积分布图;
[0021]图6为k = 4时k-means聚类算法在RSS信号有无白化前后对定位精度的比较的示意图;
[0022]图7为RSS信号白化前后系统定位误差的最大、最小、平均误差,以及定位误差标准方差统计图。
【具体实施方式】
[0023]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0024]下面结合附图及具体实施例对本发明的应用原理作进一步描述。
[0025]如图1所示,本发明实施例的基于接收信号强度信号ZCA白化的接入点k-means聚类方法包括以下步骤:
[0026]SlOl:将RM中的每个位置指纹用相应参考点上的接收信号强度向量均值表示,并将均值归一化。然后通过白化接收信号强度均值,去掉相关性;
[0027]S102:k-means聚类在整个RM中选取k个指纹作为初始聚类中心;
[0028]S103:对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类;
[0029]S104:执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心;
[0030]S105:不断重复步骤S103和S104,直到k个聚类中心不再发生变化,终止迭代。
[0031]本发明的具体步骤为:
[0032]I)将RM中的每个位置指纹用相应参考点上的接收信号强度(RSS)向量均值表示,并将均值归一化。然后通过白化接收信号强度(RSS)均值,去掉相关性。
[0033]2) k-means聚类在整个RM中选取k个指纹作为初始聚类中心(为了避免随机选择的初始聚类中心造成聚类的过度集中或分散情况,尽量在定位子区域均匀地选取k个初始聚类中心,以尽可能实现按照物理位置空间的一致性进行聚类)。
[0034]3)对于除k个聚类中心之外的其它所有接收信号强度(RSS)均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类。
[0035]4)执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心。
[0036]5)不断重复步骤(3)和(4)。直到k个聚类中心不再发生变化,终止迭代。
[0037]聚类结束,每个位置指纹都被收敛至与之最近的聚类中心,就将每个聚类视为一个定位子区域。离线阶段,每个聚类和对应的位置指纹数据构成一个独立的子指纹数据库。在线定位阶段,新测得的接收信号强度(RSS)首先通过与聚类中心的欧式距离计算得到最近聚类中心,然后由这个聚类中心对应的定位函数得出用户的定位子区域。
[0038]本发明的实施例:
[0039]本发明的实验环境是在一幢5层的典型的办公大楼完成,砖块墙体,金属窗户,玻璃和木门。此大楼被802.11无线局域网所覆盖,最多可见46个接入点。具体实验区域为大楼的第4层,面积大概400平方米。整个楼层有计算机机房实验室、走廊、一个大厅、一个小休息吧和一个厕所,以及若干间办公室。在此实验中,共布设68个参考点(RP)和35个随机测试点(TestPoint,TP)。在每个RP大概接收40个RSS样本,而每个TP则接收大概5?20个RSS测量值。所有的数据采集都在同一个工作日完成。在线阶段的定位算法采用WKNN(K = 3)。实验环境如图3所示,其中的红色“ + ”为RP位置。
[0040]图4显示了聚类中心数目k从I到8变化时,,RSS信号白化前后的k-means聚类算法的聚类精度比较图。
[0041]从图4中可以看出首先RSS白化后的k-means算法在聚类准确度方面要好于白化之前的效果。尤其是随着聚类中心k值的增加,这种提高愈加明显,这是因为,在定位目标区域一定的情况下,聚类中心值越大,说明被划分的定位子区域越多,则相应的邻域之间信号强度之间的相关性就越大,通过白化去除信号相关性带来的冗余,从而可以使白化前后的聚类分块准确度有较大的提升。其次,本次实验中,当k的值取4的时候,聚类的准确度可以达到97%,当然,在k小于4的时候聚类的准确率更高,但当k值过小的时候,容易出现类内信息相似度不高,不利于降低计算复杂度和提高定位精度。另外,从图中还可以看出,随着聚类数目的增加,所有白化前后的k-means聚类算法的分块精度都在快速下降,如当k值大于等于5以后,由于过多的分块,使得每个定位子区域范围减小,导致类之间相似度增力口,不仅降低了分块准确度,同时也会降低定位精度。
[0042]如图5所示是当k的值由I取到8时对应的系统定位误差概率累积分布。
[0043]从图5可以看出,当k的取值为4时,系统的定位精度整体上优于k取其它值的情况,虽然在小于等于3米处的累积概率不是最高的,但这并不影响其整体的定位性能优势。事实上,此处k = 4时的累积概率是77.1 %,而此处的最大值为80 % (k = 5),虽然当k取值为5时可以实现定位精度3米以内80%的置信概率,但由于此时的聚类精度只有93.9%,明显低于k取4时候的97%,并且聚类中心值为5时在2米以内和4米以内的定位精度并不高,所以综合考虑聚类分块准确度和定位精度两方面的表现,我们认为聚类中心数为4时最有利于系统的定位可靠性。从图5我们还可以看出,聚类有利于提高定位精度,例如当聚类中心个数分别取2、3、4、5时,系统定位精度的累积概率分布都好于无聚类(k= I)的情况。但同时也看到,当k的取值为6、7和8的时候,这种聚类的良好表现又消失了,也就是说在定位精度的置信概率方面要低于无聚类情况。
[0044]上述分析表明,聚类中心的数值对于系统的性能优劣有着直接的关系,所以为了既能缩小定位指纹空间,提高定位精度,又能有效划分定位子区间,保证较高的聚类准确性,避免因聚类误差带给定位精度的不良影响,本文将取聚类中心k值取为4。当取k值为4的时候,我们比较了 k-means聚类算法在RSS有无白化前后对定位精度的比较,如图6所
/Jn ο
[0045]图6最优聚类情况下,信号白化对定位精度的影响
[0046]从图6可以看出,对信号白化后再进行聚类,可明显提高系统的定位精度。白化后的聚类定位精度在2米内的概率为60%,较RSS无白化的聚类定位提高了 39.7% ;在3米内的定位精度概率为77.1%,比无白化的聚类定位提高了 12.4%。另外,在I米内的定位精度概率也有较为明显的增加。为了更清楚地说明白化的作用,图7对比了白化前后系统定位误差的最大、最小、平均误差,以及定位误差标准方差。从图7中可以看出,白化后的系统定位平均误差为2.21米,而无白化的定位平均误差为2.74米,提高了 24% ;而最大定位误差也由无白化的7.91米降到6.27米,下降了 1.64米;另外,定位误差的标准方差也比无白化的2.85米变为1.67米,这说明各个测试点上的误差偏离平均定位误差的程度在降低,从定位误差范围的变化也能说明这一点,白化前的误差范围为0.93?7.91米,白化的聚类定位误差范围为0.61?6.27米。因为定位范围越小,说明误差偏离均值的程度就越小,所以标准方差才会变小。
[0047]实施例1:
[0048]如图2所示,本发明的实施例具体包括以下步骤:
[0049]第一步,确定聚类个数k,计算来自所有参考点的RSS均值并归一化;
[0050]第二步,白化归一化数据;
[0051]第三步,初始化k个聚类中心;
[0052]第四步,计算RP对应的归一化RSS均值与k个聚类中心的距离;
[0053]第五步,将参考点划分到最近的聚类中心所在的类,抑制更新各个聚类中心;
[0054]第六步,聚类中心是否固定不变,否,则返回第四步,是,则执行下一步;
[0055]第七步,输出k个聚类中心和对应RP集合。
[0056]本发明将接收信号强度(RSS)信号先进行白化,然后再结合k-means聚类,可充分减小接收信号强度(RSS)信号之间的相关性,提高聚类的准确度,从而进一步提高系统的定位精度。
[0057]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种基于接收信号强度信号ZCA白化的接入点k-means聚类方法,其特征在于,该基于接收信号强度信号ZCA白化的接入点k-means聚类方法包括: 步骤一,将RM中的每个位置指纹用相应参考点上的接收信号强度向量均值表示,并将均值归一化;然后通过白化接收信号强度均值,去掉相关性; 步骤二,k-means聚类在整个RM中选取k个指纹作为初始聚类中心; 步骤三,对于除k个聚类中心之外的其它所有接收信号强度均值,则根据它们与这些聚类中心的欧式距离,分别将它们分配给与其欧式距离最近的聚类; 步骤四,执行完所有的指纹后,获得新的聚类,将新聚类的所有指纹的平均值作为新的聚类中心; 步骤五,不断重复步骤三和四,直到k个聚类中心不再发生变化,终止迭代。
2.如权利要求1所述的基于接收信号强度信号ZCA白化的接入点k-means聚类方法,其特征在于,聚类结束,每个位置指纹都被收敛至与之最近的聚类中心,就将每个聚类视为一个定位子区域;离线阶段,每个聚类和对应的位置指纹数据构成一个独立的子指纹数据库;在线定位阶段,新测得的接收信号强度首先通过与聚类中心的欧式距离计算得到最近聚类中心,然后由这个聚类中心对应定位函数得出用户的定位子区域。
【文档编号】H04W64/00GK103987118SQ201410212396
【公开日】2014年8月13日 申请日期:2014年5月19日 优先权日:2014年5月19日
【发明者】陈丽娜, 苗春雨, 赵建民 申请人:浙江师范大学