一种基于手机mac进行家庭住户分析方法与流程

文档序号:20765846发布日期:2020-05-15 18:54阅读:110来源:国知局
一种基于手机mac进行家庭住户分析方法与流程
本发明属于无线通信行业
技术领域
,尤其是涉及一种基于手机mac进行家庭住户分析方法。
背景技术
:近年来,随着改革的持续深化、城市人口规模的扩大,公安部门对人口管理工作规范性的逐渐增强,社区人口信息管理工作业务急剧增大。因为社区的户数非常多,传统的人工统计家庭人口,以及判断家庭性质类型的方法已经远远不能满足当前人口管理的要求,随着社会的发展和科技的进步,人们对安防的需求越来越高,同时公安对小区住户情况以及家庭人员的活动情况需要实时掌握,这样就为公安加强社区治安的工作带来了更多的困难,切实加强社区的治安和综合治理水平,提高出租屋管理水平和流动人口管理水平,同时提高安全防范能力,降低发案率,增强破案手段;且同时随着物联网的发展以及智能手机的普及,通过物联网技术,wifi探针对手机mac的采集,将为公安掌握家庭人员数量以及家庭类型提供了巨大的便捷。技术实现要素:本发明要解决的技术问题是,提供一种基于手机mac进行家庭住户分析方法,实现社区常住/非常住人口/上班族/非上班族住户等等情况的分析。为了解决上述技术问题,本发明采用的技术方案是:该基于手机mac进行家庭住户分析方法,包括以下步骤:(1)设备部署:基于小区场景的布点和楼栋场景的布点原则进行设备部署;(2)数据采集:通过有线或者无线方式的连接所述步骤(1)中的设备,进行小区内实体数据的采集;(3)数据处理:基于python语言进行数据处理,以保证数据的稳定性、可扩展性、容错性;(4)数据分析:基于已经采集的数据内容,对那些手机mac地址不断变化而影响判断家庭住户人口数的数据和手机mac地址不变化的数据进行手机mac数据分析,输出最终的手机mac数量以及小区住户类型;(5)应用分析:基于mac数据进行可视化应用分析,并对手机产生很多伴随mac进行处理,基于某户mac数据源对该户人口以及住户类型进行分析。采用上述技术方案,基于某户mac数据源对改户人口以及住户类型进行分析,其主要包括:短期驻留分析、上班族住户分析、群居住户分析等等,以实时掌握小区住户类型和家庭人口数掌握,提高小区治安的综合化治理水平;设备的布点原则是:根据小区楼栋之间的实际距离与设备(wifi探针)的覆盖范围,在每两栋之间部署设备(wifi探针),使得设备(wifi探针)全覆盖两楼的所有住户;设备(wifi探针)是针对终端mac的无线侦测设备,它通过对空中的无线信号的截取和处理,实现对覆盖区域手机的采集、与mac地址的上报,同时也包括对应手机mac连接的路由器名称与地址以及所上报的时间信息精确到秒。作为本发明的优选技术方案,所述步骤(1)中的设备为wifi探针/wifi热点;所述步骤(1)的设备部署具体为:基于小区场景的布点,在小区每两栋之间安装wifi探针,用于抓取每家路由器地址以及该路由器下下挂的mac数据。作为本发明的优选技术方案,在所述步骤(2)中,根据wifi探针所覆盖的范围,定时的向该wifi探针四周发送beacon帧,手机设备不停的发送着probe帧,去寻找附近可用的ap,probe帧中包含着手机的mac地址,该wifi探针持续不断的获取在范围内家庭路由器下挂的手机mac;该wifi探针是以秒的速度不断获取周围手机mac地址,不进行数据的去重,若某手机一直使用无线网络,该wifi探针将不断地上报该手机mac数据;wifi探针每五分钟重新获取下一轮采集的手机mac数据,同时将上五分钟采集的数据通过网络设备远程连接公安系统的服务器,将数据不断地传输到服务器上存储,wifi探针把数据传输到服务器上后,将清空上五分钟存储的数据,留给下一轮五分钟数据的存储。作为本发明的优选技术方案,在所述步骤(4)中,首先通过频次筛法选将手机mac在一段时间内上报次数较少的去除,然后通过连续性与同一性进行判断,前六位相同的十六进制mac是否为同一部手机发出的。作为本发明的优选技术方案,在所述步骤(4)中,应用直方图来微观显示在时间序列上的手机mac在时间段内上报的次数以及时间上的连续性与前六位十六进制相同的手机mac在同一性上的分析;将第一次上报的mac对应的时间为起始时间,使用一个星期的数据,以2小时,即7200秒作为时间横轴的单位时间段。作为本发明的优选技术方案,在所述步骤(4)中,在分析前六位十六进制相同的mac数据时,应用统计与概率学理论,在连续性、同一性上进行分析判断,在连续性上设置阈值,将大于等于某个阈值的保留,继续同一性的判断,小于等于阈值的将判断为随机mac数据。作为本发明的优选技术方案,在所述步骤(5)中,对前述步骤分析下来的mac数据进行家庭住户分析,根据每户家庭路由器下挂的mac数量来断定该户的家庭人口数,通过这些mac上报的时间规律来预测住户是否为常住人口、非常住人口、上班族、群居人口以及独居住户等等。作为本发明的优选技术方案,所述步骤(1)中的设备为wifi探针,所述wifi探针是针对终端mac的无线侦测设备,通过对空中的无线信号的截取和处理,实现对覆盖区域手机的采集、与mac地址的上报。作为本发明的优选技术方案,所述wifi探针安装在两幢楼之间,同时每5分钟上报采集的mac数据信息,包括时间与该手机mac连接的路由器地址。附图说明下面结合附图进一步描述本发明的技术方案:图1是本发明基于手机mac进行家庭住户分析方法,基于手机mac数据进行分析每户家庭使用的手机数量,以此判断分析每户家庭的人员数具体步骤流程图;图2是该户家庭部分手机mac的直方图;图3是前六位相同的手机mac数据直方图;图4是最终的筛选结果;图5是本发明基于手机mac进行家庭住户分析方法实施例手机mac处理后的数据,通过制定住户规则来断定住户类型显示图;具体实施方式为了加深对本发明的理解,下面将结合附图和实施例对本发明做进一步详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。实施例:如图1-5所示,该基于手机mac进行家庭住户分析方法,包括以下步骤:(1)设备部署:基于小区场景的布点和楼栋场景的布点原则进行设备部署;根据小区楼栋之间的实际距离与wifi探针(本实施例中设备为wifi探针,wifi探针是针对终端mac的无线侦测设备,通过对空中的无线信号的截取和处理,实现对覆盖区域手机的采集、与mac地址的上报)的覆盖范围,在每两栋之间部署wifi探针,使得wifi全覆盖两楼的所有住户;所述的wifi探针是针对终端mac的无线侦测设备;它通过对空中的无线信号的截取和处理,实现对覆盖区域手机的采集、与mac地址的上报,同时也包括对应手机mac连接的路由器名称与地址以及所上报的时间信息精确到秒;设备为wifi探针/wifi热点;所述步骤(1)的设备部署具体为:基于小区场景的布点,在小区每两栋之间安装wifi探针,用于抓取每家路由器地址以及该路由器下下挂的mac数据;wifi探针安装在两幢楼之间,同时每5分钟上报采集的mac数据信息,包括时间与该手机mac连接的路由器地址;(2)数据采集:通过有线或者无线方式的连接所述步骤(1)中的设备,进行小区内实体数据的采集;根据wifi探针所覆盖的范围,定时的向该wifi探针四周发送beacon帧,手机设备不停的发送着probe帧,去寻找附近可用的ap,probe帧中包含着手机的mac地址,该wifi探针持续不断的获取在范围内家庭路由器下挂的手机mac;该wifi探针是以秒的速度不断获取周围手机mac地址,不进行数据的去重,若某手机一直使用无线网络,该wifi探针将不断地上报该手机mac数据;wifi探针每五分钟重新获取下一轮采集的手机mac数据,同时将上五分钟采集的数据通过网络设备远程连接公安系统的服务器,将数据不断地传输到服务器上存储,wifi探针把数据传输到服务器上后,将清空上五分钟存储的数据,留给下一轮五分钟数据的存储;如下表1所示,是某户家庭一个星期内所有手机mac上报数:(3)数据处理:基于python语言进行数据处理,以保证数据的稳定性、可扩展性、容错性;(4)数据分析:基于已经采集的数据内容,对那些手机mac地址不断变化而影响判断家庭住户人口数的数据和手机mac地址不变化的数据进行手机mac数据分析,输出最终的手机mac数量以及小区住户类型;所述步骤(4)的数据分析具体包括以下步骤:s41:将每户人家采集到的一个星期的手机mac数据进行频次筛选法,例如:某户人家的路由器下挂的mac数据信息为:{b8bc1b**f***,900},{b8bc1b**e***,1000},{b8bc1b***fe*,30},{cfdc4b***b**,15},经过python语言建立的统计模型,分别得到每个mac的上报次数为:900,1000,30,15。设置一定的阈值k,将小于k值的mac数据去除,因为一个星期上报次数小于k值的手机mac可以看作为临时性的mac,包括亲戚朋友短期的连接,或者其他的陌生人员的连接,正常的家庭人员连接wifi路由器并不断上报的次数远远大于阈值k(假定k大于15小于30),因此cfdc4b***b**的手机mac被排除,具体步骤如下:s41-1:对s41步骤进行总结为:首先对数量进行限制,根据一个星期数据的收集情况,根据前六位不同,确定是否是同一家厂商出产的收集来断定手机的不同种类,如果有a个前六位不同,b个前六位相同,分别统计这几个mac上报的次数,选取一定的阈值p,大于等于p的mac将保留,小于p的将去除;s42:根据步骤s41,排除了外人连接这家路由器的情形,同时也排除了这家人里面有些人手机产生固定mac(一般认为,有的手机产生的手机mac数据不变化的为固定mac)的同时,伴随着数量少的随机mac(有的手机在产生固定mac的同时,会产生随机mac数据),但是有些手机在产生固定mac的同时,产生一些随机mac数量不低,步骤s41无法将其排去。根据这时间图发现,这种现象的大多数连续性不好,因此,可以依据连续性的计算将这些连续性不好的随机mac去除掉,所谓连续性,就是在其出现的时候,很长时间都被路由器采集到,断断续续的现象少,说明连续性好,具体步骤如下:s42-1:根据步骤s42,画直方图,x轴为时间,y轴为数量,分别绘制前六位相同的mac在时间上的上报次数;s42-2:连续性的分析,以它在某个时刻出现开始,连续上报为多长时间,在这里设置时间戳t为连续性的阈值,上报时间大于等于t的为一次连续,小于t的为不连续,以出现的次数记为k,连续性次数记为f,则连续性判断的公式为:其中,l为其连续性在出现的总次数里面的概率,当l大于等于某值0.6(根据实际现场情况设置,这里设置0.6)的时候,保留下来,说明连续性好,当l小于0.6的时候,说明连续性不好,将去除,说明是随机伴随的mac;s43:由以s41和s42两个步骤可以排除同一手机大量的随机伴随mac,但是,还有一种现象就是伴随的随机mac符合步骤s41、步骤s42两种情况,同时这些前六位相同的手机mac的同时性好,因此也认为这种属于同一手机下产生的,也需要排除,在这里,我们需要用概率学的思想去解决问题,具体包括以下步骤:s43-1:将前六位相同的mac聚集起来,以这家首次采到某个mac的时间为起始时间,将时间转化为时间戳,将各个mac出现在某些时间戳上,按照时间戳的大小,依次画出,以一星期为图分析时间段,以两小时作为时间小段分隔,进行绘制,如图3所示;s43-2:根据图上显示的数据,可以得到类似于这样的列表,如result1=[1,0,1,0,0,0,1,1,0,1,0,……],result2=[1,0,0,1,0,1,1,0,……],result3=……,result4=……,这样就将前六位相同的mac出现的情况在时间上轴上很好的显示,其中列表中1代表某段时间这个mac出现了,0代表这段时间没有出现,以一周为分析时间段,每两小时作为x轴的小间隔,可以得到85个小间隔,这些小间隔正好能很好的显示一周内某个mac的情况;s43-3:根据步骤(2)的绘制,利用条件概率,所谓条件概率,就是当a出现的情况下,b出现的概率为多大,这里,我们将转换思路,因为在同时性判断中,说明mac连续性好,出现的时间多,因此,讨论在a不出现的情况下,b也不出现的概率为多大,公式如下:例如result1=[1,0,0,1,0,1,0,0,1],result2=[0,0,0,1,1,0,0,1,1],当result1不出现的时候的索引为1、2、4、6、7,result2在对应这些索引上的情况为0、0、1、0、1,可以得到在这里,当条件概率大于0.5的时候,说明其同一性好,判断为同一个手机发出的,小于等于0.5的时候,说明同一性不好,判断为两个手机,将前六位相同的mac分别进行迭代判断,可得出最终的结果,最后根据mac数判断这家大概为多少人,其准确性将大大提升;如下表2所示,是频次筛选过后的手机mac数据:所有手机mac地址上报的次数7047e9a6****2859b8bc1b9e****214b8bc1ba6****189b8bc1b7e****165b8bc1b9ed***162经过上述步骤,可以较为精确的判断每户家庭使用的手机数,间接的判断家庭人员数,为公安部门实时掌握小区住户的日常活动,家庭住户类型分析提供了基础。传统方法需要登门拜访统计,极大的影响社区的家庭的正常生活,同时登门拜访统计不会实时断定家庭人员的日常活动习惯以及给社区居民带来不好的影响。(5)应用分析:基于mac数据进行可视化应用分析,并对手机产生很多伴随mac进行处理,基于某户mac数据源对该户人口以及住户类型进行分析。具体步骤如下:s51:对手机mac数据处理后,基本断定每户人家有多少人使用手机,以此来断定家庭人员数,在得知家庭人员数目后,根据手机mac上报的时间规律和手机使用的个数来断定家庭住户类型,具体情况如下:s51-1:上班族住户(2人):住户下的路由器ap下方的mac连接数为2个或者3个,且在9:00-17:00无连接、18:00-7:00有连接且连接时间不低于8小时。一周起码大于等于4天为这个规律。s51-2:独居住户(非老人):住户下的路由器ap下方有1个或者2个连接数,若有两个mac号但2个mac号连接时间几乎相同,9:00-17:00有多次连接或者出现连续性连接情况,且在21:00-24:00连接持续性高,24:00-6:00存在间断性连接,在一周有≥4天为该规律。s51-3:独居老人:住户下的路由器ap下方的连接数为1个或者2个mac,在5:00-21:00有连接且连接次数≤6小时,21:00-5:00无连接,一周为≥5天为这个规律。s51-4:家庭住户(三代同堂):住户下的路由器ap连接数为4个或者5个,且18:00-24:00的连接数是9:00-17:00的连接次数一倍,一周时间有≥4天为这个规律。s51-4:群租住户:住户下的路由器ap下连接数大于等于5,且在9:00-17:00无连接,17:00-8:00有连接,连接次数不低于5个mac数,一周时间有≥4天为该规律。经过上述步骤,可以在不惊动居民的情况下判断住户类型,如图5所示,为公安部门智能化的掌握社区家庭住户类型提供了便利,同时也为相关部门在打击犯罪,维护社区安全、保障社区人员财产以及生命安全奠定了坚实的基础。在所述步骤(4)中,首先通过频次筛法选将手机mac在一段时间内上报次数较少的去除,然后通过连续性与同一性进行判断,前六位相同的十六进制mac是否为同一部手机发出的;应用直方图来微观显示在时间序列上的手机mac在时间段内上报的次数以及时间上的连续性与前六位十六进制相同的手机mac在同一性上的分析;将第一次上报的mac对应的时间为起始时间,使用一个星期的数据,以2小时,即7200秒作为时间横轴的单位时间段。此外,在所述步骤(4)中,在分析前六位十六进制相同的mac数据时,应用统计与概率学理论,在连续性、同一性上进行分析判断,在连续性上设置阈值,将大于等于某个阈值的保留,继续同一性的判断,小于等于阈值的将判断为随机mac数据。在所述步骤(5)中,对前述步骤分析下来的mac数据进行家庭住户分析,根据每户家庭路由器下挂的mac数量来断定该户的家庭人口数,通过这些mac上报的时间规律来预测住户是否为常住人口、非常住人口、上班族、群居人口以及独居住户等等。对于本领域的普通技术人员而言,具体实施例只是对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1