本发明实施例涉及通信技术领域,尤其涉及一种常驻物理小区识别方法和装置。
背景技术:
用户信令数据记载了人们出行信息,包括用户一天的位置,在某地驻留时间等。对于运营商来说,如何通过用户信令数据挖掘出用户常驻地信息,从而有针对性、有目的地开展营销工作,对于宽带业务、手机入网等都是非常有益的。
在实际的工程应用中,基于用户信令数据进行空间聚类,可以识别得到用户的常驻基站小区,当一个基站包含多个物理小区时,上述方法无法准确定位用户实际居住的物理小区,可能会因此导致对驻点营销和用户归属物理小区资源是否到达产生误判,例如因用户所在小区宽带资源是否覆盖判断不准,导致无法对宽带潜在客户展开外呼营销,对运营商的驻点营销带来了不便。
技术实现要素:
本发明实施例提供一种常驻物理小区识别方法和装置,用以解决现有的识别方法无法准确定位用户实际居住的物理小区的问题。
第一方面,本发明实施例提供一种常驻物理小区识别方法,包括:
基于用户信令数据获取用户常驻基站;
基于所述用户常驻基站,获取预设数量个临近基站;所述临近基站是基于所述用户信令数据获取的距离所述用户常驻基站最近的基站;
基于所述用户常驻基站对应的每一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,从所述每一物理小区中选取常驻物理小区;所述临近基站的全天驻留数据是基于所述用户信令数据获取的。
第二方面,本发明实施例提供一种常驻物理小区识别装置,包括:
驻留基站获取单元,用于基于用户信令数据获取用户常驻基站;
临近基站获取单元,用于基于所述用户常驻基站,获取预设数量个临近基站;所述临近基站是基于所述用户信令数据获取的距离所述用户常驻基站最近的基站;
物理小区识别单元,用于基于所述用户常驻基站对应的每一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,从所述每一物理小区中选取常驻物理小区;所述临近基站的全天驻留数据是基于所述用户信令数据获取的。
第三方面,本发明实施例提供一种电子设备,包括处理器、通信接口、存储器和总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信,处理器可以调用存储器中的逻辑指令,以执行如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的一种常驻物理小区识别方法和装置,基于用户常驻基站对应的每一物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,选取常驻物理小区,有效提高了用户物理小区居住地的定位准确率,降低了用户常驻基站小区与常驻物理小区映射识别的难度,进一步提升了客户营销的精准度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的常驻物理小区识别方法的流程示意图;
图2为本发明实施例提供的常驻物理小区识别装置的结构示意图;
图3为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当前的小区识别方法,仅能够识别得到用户的常驻基站小区,当一个基站包含多个物理小区时,无法准确定位用户实际居住的物理小区,对运营商的驻点营销带来了不便。针对上述问题,本发明实施例提供一种常驻物理小区识别方法。图1为本发明实施例提供的常驻物理小区识别方法的流程示意图,如图1所示,该方法包括:
110,基于用户信令数据获取用户常驻基站。
此处,用户信令数据是需要执行常驻物理小区识别的用户的信令数据,信令数据可以来自智能手机,还可以来自智能手表等通信工具。用户信令数据可以通过提取移动核心网和无线侧的信令数据得到,例如通过a(abis)接口和s1-mme(mobilitymanagemententity,移动性管理实体)接口获取用户信令数据。用户常驻基站为基于用户信令数据获取的用户的常驻基站,此处,基于用户信令数据获取用户常驻基站的方法有多种,例如通过空间聚类的方法获取用户常驻基站,又例如基于预设规则统计用户活动的停留小区信息,从而识别用户常驻基站。
120,基于用户常驻基站,获取预设数量个临近基站;临近基站是基于用户信令数据获取的距离用户常驻基站最近的基站。
具体地,在得到用户常驻基站后,基于用户常驻基站与用户信令数据中出现的用户常驻基站周边每一基站之间的距离,从每一基站中选取预设数量个距离最近的基站作为临近基站。此处,预设数量为预先设定的临近基站的数量,例如预设数量为3,则从用户信令数据中出现的每一基站中选取距离用户常驻基站最近的前三个基站作为临近基站。
130,基于用户常驻基站对应的每一物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,从每一物理小区中选取常驻物理小区;临近基站的全天驻留数据是基于用户信令数据获取的。
具体地,临近基站的全天驻留数据是基于用户信令获取的预设时期内用户全天出现在临近基站的数据。用户常驻基站对应的物理小区是指用户常驻基站小区覆盖范围内的物理小区,可以通过计算用户常驻基站与物理小区中心点之间的距离,与用户常驻基站的覆盖半径进行比较,判断任一物理小区是否为用户常驻基站对应的物理小区。用户常驻基站对应的物理小区可能有多个。
在得到用户常驻基站对应的物理小区和临近基站后,计算每一物理小区与临近基站之间的距离。随后,基于物理小区与临近基站之间的距离,以及临近基站的全天驻留数据,从用户常驻基站对应的全部物理小区中选取一个物理小区作为常驻物理小区。例如,将物理小区与临近基站之间的距离,以及临近基站的全天驻留数据输入预先训练好的模型中,获取模型输出的常驻物理小区,又例如根据物理小区与临近基站之间的距离,以及临近基站的全天驻留数据计算每一物理小区的得分,根据得分选取常驻物理小区。
本发明实施例提供的方法,基于用户常驻基站对应的每一物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,选取常驻物理小区,有效提高了用户物理小区居住地的定位准确率,降低了用户常驻基站小区与常驻物理小区映射识别的难度,进一步提升了客户营销的精准度。
基于上述实施例,步骤110具体包括:
111,基于用户信令数据,获取预设日期内每一基站的夜间驻留数据;夜间驻留数据包括夜间驻留时长和/或夜间驻留次数。
具体地,夜间驻留数据是基于用户信令获取的预设时期内用户夜间出现在基站的数据。夜间驻留时长是预设时间内用户夜间出现在基站的时长,夜间驻留此处为预设时间内用户夜间出现在基站的次数。例如,预设时期为一个月内每一奇数天,夜间设定为00:00至06:00,将一天分为24个时间段,则任一基站的夜间驻留时长为一个月内每一奇数天的00:00至06:00用户在该基站驻留的累计时间长度,任一基站的夜间驻留次数为一个月内每一奇数天的00:00至06:00用户在该基站驻留的累计小时数。
任一基站的夜间驻留时长和夜间驻留次数如下:
式中,thi和tdi分别为第i个基站的夜间驻留时长和夜间驻留次数,thijk为第k天第j时间段第i个基站的驻留时长,tdijk为第k天第j时间段第i个基站的驻留次数,j为夜间时段,k为预设时期。
112,基于任一基站的夜间驻留数据,获取该基站的夜间驻留评分。
此处,可以通过预先设置的表格得到夜间驻留数据对应的夜间驻留评分,还可以通过预先设置的计算规则基于夜间驻留数据计算得到夜间驻留评分,本发明实施例对此不作具体限定。
113,从每一基站中选取夜间驻留评分最高的基站作为用户常驻基站。
本发明实施例提供的方法,通过获取每一基站的夜间驻留评分选取用户常驻基站,利用多数用户的生活作息规律提高用户常驻基站的定位精度。
基于上述任一实施例,步骤112具体包括:对每一基站的夜间驻留时长进行归一化,得到每一基站的夜间归一化时长;对每一基站的夜间驻留次数进行归一化,得到每一基站的夜间归一化次数;将任一基站的夜间归一化时长与夜间归一化次数相乘,得到该基站的夜间驻留评分。
具体地,根据下式得到任一基站的夜间归一化时长:
式中,
根据下式得到任一基站的夜间归一化次数:
式中,
根据下式得到任一基站的夜间驻留评分si:
基于上述任一实施例,步骤130之前还包括:基于用户信令数据,获取预设日期内每一临近基站的全天驻留数据;全天驻留数据包括全天驻留时长和/或全天驻留次数。
具体地,全天驻留数据是基于用户信令获取的预设时期内用户全天出现在基站的数据。全天驻留时长是预设时间内用户全天出现在基站的时长,全天驻留此处为预设时间内用户全天出现在基站的次数。例如,预设时期为一个月内每一奇数天,将一天分为24个时间段,则任一临近基站的全天驻留时长为一个月内每一奇数天用户在该基站驻留的累计时间长度,任一临近基站的全天驻留次数为一个月内每一奇数天用户在该基站驻留的累计小时数。
任一临近基站的全天驻留时长和全天驻留次数如下:
式中,thi'和tdi'分别为第i个临近基站的全天驻留时长和全天驻留次数,thijk'为第k天第j时间段第i个临近基站的驻留时长,tdijk'为第k天第j时间段第i个临近基站的驻留次数,j为全天时段,k为预设时期。
基于上述任一实施例,步骤130具体包括:
131,针对任一物理小区,基于该物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,获取该物理小区的影响因子。
132,从每一物理小区中选取影响因子最大的物理小区作为常驻物理小区。
此处,影响因子用于表征物理小区为常驻物理小区的可能性,影响因子越大则对应的物理小区为常驻物理小区的可能性越高。
进一步地,步骤131具体包括:对每一临近基站的全天驻留时长进行归一化,得到每一临近基站的全天归一化时长;对每一临近基站的全天驻留次数进行归一化,得到每一临近基站的全天归一化次数;对每一物理小区与每一临近基站之间的距离进行归一化,得到每一物理小区与每一临近基站之间的归一化距离;基于任一物理小区与每一临近基站之间的归一化距离,以及每一临近基站的全天归一化时长和全天归一化次数,获取该物理小区的影响因子。
具体地,根据下式得到任一临近基站的全天归一化时长:
式中,
根据下式得到任一临近基站的全天归一化次数:
式中,
根据下式得到任一物理小区与任一临近基站之间的归一化距离:
式中,
在得到每一临近基站的全天归一化时长和全天归一化次数,以及每一物理小区与每一临近小区之间的归一化距离后,针对任一物理小区,基于该物理小区与每一临近基站之间的归一化距离,以及每一临近基站的全天归一化时长和全天归一化次数,求取该物理小区的影响因子。
进一步地,物理小区的影响因子通过下式获取:
式中,affn为第n个物理小区的影响因子,
此处,上式中的时长权重、次数权重和距离权重是预先设定的。例如,上述权重可以基于逻辑回归算法,根据抽样获得的样本数据进行调整,获得对影响因子最佳的逼近,进而确定最终的时长权重、次数权重和距离权重。
基于上述任一实施例,一种常驻物理小区识别方法,包括如下步骤:
首先,基于a接口和s1-mme接口获取的用户信令数据,获取用户在各个时间段(将每天划分为24个时间段)中出现基站的时长thijk和次数tdijk,其中i为基站编号,i=1,2,…,n,n为基站的总数量;j为时间段,j=0,1,2,…,23;k为预设日期,用于指示具体的日期。
其次,统计前一个月中选定天数的第i个基站的夜间驻留时长thi和夜间驻留次数tdi。为了反映一般性,在上中下旬中各选取5天,共15天作为采样点,并将夜间设定为00:00至06:00,则:
式中,thi和tdi分别为第i个基站的夜间驻留时长和夜间驻留次数,thijk为第k天第j时间段第i个基站的驻留时长,tdijk为第k天第j时间段第i个基站的驻留次数,j为夜间时段,k为选定的15个日期。
随后,对每一基站的夜间驻留时长和夜间驻留次数进行归一化,得到每一基站的夜间归一化时长和夜间归一化次数如下:
式中,
基于任一基站的夜间归一化时长与夜间归一化次数相乘,得到该基站的夜间驻留评分
随后,从每一基站中选取夜间驻留评分最高的基站作为用户常驻基站。
接着,基于用户信令数据,从中选取预设数量个距离用户常驻基站最近的基站作为临近基站。此处,预设数量为3。统计前一个月中选定天数的每一临近基站的全天驻留时长thi'和全天驻留次数tdi'。同样地在上中下旬中各选取5天,共15天作为采样点,则:
式中,thi'和tdi'分别为第i个临近基站的全天驻留时长和全天驻留次数,thijk'为第k天第j时间段第i个临近基站的驻留时长,tdijk'为第k天第j时间段第i个临近基站的驻留次数,j为全天时段,k为预设时期。
此外,通过爬虫获取用户常驻基站对应的物理小区。具体地,建立用户常驻基站小区与物理小区的映射关系,计算用户常驻基站小区与物理小区中心点的距离,如果这个距离少于用户常驻基站覆盖的半径,则该物理小区归属用户常驻基站小区。
随后,计算每一用户常驻基站对应的物理小区与每一临近基站之间的距离,并分别对每一临近基站的全天驻留时长、全天驻留次数,以及每一物理小区与每一临近基站之间的距离进行归一化,得到每一临近基站的全天归一化时长、全天归一化次数,以及每一物理小区与每一临近基站之间的归一化距离如下:
式中,
然后,针对任一物理小区,基于该物理小区与每一临近基站之间的归一化距离,以及每一临近基站的全天归一化时长和全天归一化次数,通过下式获取该物理小区的影响因子:
式中,affn为第n个物理小区的影响因子,
最后,从每一物理小区中选取影响因子最大的物理小区作为常驻物理小区。
本发明实施例提供的方法,基于用户常驻基站对应的每一物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,选取常驻物理小区,有效提高了用户物理小区居住地的定位准确率,降低了用户常驻基站小区与常驻物理小区映射识别的难度,进一步提升了客户营销的精准度。
基于上述任一实施例,图2为本发明实施例提供的常驻物理小区识别装置的结构示意图,如图2所示,常驻物理小区识别装置包括驻留基站获取单元210、临近基站获取单元220和物理小区识别单元230;
其中,驻留基站获取单元210用于基于用户信令数据获取用户常驻基站;
临近基站获取单元220用于基于所述用户常驻基站,获取预设数量个临近基站;所述临近基站是基于所述用户信令数据获取的距离所述用户常驻基站最近的基站;
物理小区识别单元230用于基于所述用户常驻基站对应的每一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,从所述每一物理小区中选取常驻物理小区;所述临近基站的全天驻留数据是基于所述用户信令数据获取的。
本发明实施例提供的装置,基于用户常驻基站对应的每一物理小区与每一临近基站之间的距离,以及每一临近基站的全天驻留数据,选取常驻物理小区,有效提高了用户物理小区居住地的定位准确率,降低了用户常驻基站小区与常驻物理小区映射识别的难度,进一步提升了客户营销的精准度。
基于上述任一实施例,驻留基站获取单元210具体包括夜间数据获取子单元、夜间评分子单元和夜间选取子单元;
其中,夜间数据获取子单元用于基于所述用户信令数据,获取预设日期内每一基站的夜间驻留数据;所述夜间驻留数据包括夜间驻留时长和/或夜间驻留次数;
夜间评分子单元用于基于任一所述基站的所述夜间驻留数据,获取所述任一基站的夜间驻留评分;
夜间选取子单元用于从所述每一基站中选取所述夜间驻留评分最高的基站作为所述用户常驻基站。
基于上述任一实施例,夜间评分子单元具体用于:
对每一所述基站的所述夜间驻留时长进行归一化,得到每一所述基站的夜间归一化时长;
对每一所述基站的所述夜间驻留次数进行归一化,得到每一所述基站的夜间归一化次数;
将任一所述基站的所述夜间归一化时长与所述夜间归一化次数相乘,得到所述任一基站的所述夜间驻留评分。
基于上述任一实施例,常驻物理小区识别装置还包括临近基站数据获取单元;
临近基站数据获取单元用于基于所述用户信令数据,获取预设日期内每一所述临近基站的全天驻留数据;所述全天驻留数据包括全天驻留时长和/或全天驻留次数。
基于上述任一实施例,物理小区识别单元230包括影响因子子单元和小区识别子单元;
其中,影响因子子单元用于针对任一所述物理小区,基于所述任一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,获取所述任一物理小区的影响因子;
小区识别子单元用于从所述每一物理小区中选取所述影响因子最大的物理小区作为所述常驻物理小区。
基于上述任一实施例,影响因子子单元包括归一化模块和计算模块;
其中,归一化模块用于对每一所述临近基站的所述全天驻留时长进行归一化,得到每一所述临近基站的全天归一化时长;对每一所述临近基站的所述全天驻留次数进行归一化,得到每一所述临近基站的全天归一化次数;对每一所述物理小区与每一所述临近基站之间的距离进行归一化,得到每一所述物理小区与每一所述临近基站之间的归一化距离;
计算模块用于基于所述任一物理小区与每一所述临近基站之间的归一化距离,以及每一所述临近基站的所述全天归一化时长和所述全天归一化次数,获取所述任一物理小区的影响因子。
基于上述任一实施例,计算模块具体用于:通过下式获取任一所述物理小区的影响因子:
式中,affn为第n个物理小区的影响因子,
图3为本发明实施例提供的电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(communicationsinterface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储在存储器303上并可在处理器301上运行的计算机程序,以执行上述各实施例提供的常驻物理小区识别方法,例如包括:基于用户信令数据获取用户常驻基站;基于所述用户常驻基站,获取预设数量个临近基站;所述临近基站是基于所述用户信令数据获取的距离所述用户常驻基站最近的基站;基于所述用户常驻基站对应的每一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,从所述每一物理小区中选取常驻物理小区;所述临近基站的全天驻留数据是基于所述用户信令数据获取的。
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的常驻物理小区识别方法,例如包括:基于用户信令数据获取用户常驻基站;基于所述用户常驻基站,获取预设数量个临近基站;所述临近基站是基于所述用户信令数据获取的距离所述用户常驻基站最近的基站;基于所述用户常驻基站对应的每一物理小区与每一所述临近基站之间的距离,以及每一所述临近基站的全天驻留数据,从所述每一物理小区中选取常驻物理小区;所述临近基站的全天驻留数据是基于所述用户信令数据获取的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。