一种终端用户流失预警方法与装置制造方法
【专利摘要】本发明提供一种终端用户流失预警方法及装置,该方法包括:获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值;若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。通过对历史流失数据进行分析,确定与用户流失强相关的用户属性,从而事先进行用户流失预警。
【专利说明】一种终端用户流失预警方法与装置
【技术领域】
[0001]本发明涉及计算机领域中的数据挖掘技术,尤其涉及一种终端用户流失预警方法
与装置。
【背景技术】
[0002]随着移动通信产品的丰富多样化,终端用户流失成为运营商面对的严峻问题,现有技术中的用户流失预警机制建设主要依靠聚到信息支撑和后台信息支撑来完成。其中渠道信息支撑是指在客户咨询过程中,根据对客户的满意度调查,实现用户流失的预警。后台信息支撑是指各类用户信息记录,记录用户在入网、缴费、投诉咨询和离网过程中的信息,提供给营业和服务前端,然后依靠熟悉业务知识、具有丰富经验和综合分析能力的人员,根据已掌握的历史资料和直观材料,运用个人的经验和分析判断能力,做出用户流失预警。
[0003]现有技术主要依靠人工经验判断,易受人的知识、经验和能力的多少大小的束缚和限制,缺乏可量化的精确描述。
【发明内容】
[0004]针对传统技术的上述缺陷,本发明实施例提供一种终端用户流失预警方法与装置。
[0005]本发明实施例提供一种终端用户流失预警方法,包括:
[0006]获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
[0007]计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值;
[0008]若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
[0009]本发明实施例提供一种终端用户流失预警装置,包括:
[0010]获取模块,用于获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
[0011]第一处理模块,用于计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性;
[0012]第二处理模块,用于根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
[0013]在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样 数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
【专利附图】
【附图说明】
[0014]图1为本发明终端用户流失预警方法第一实施例的流程图;
[0015]图2为本发明终端用户流失预警方法第二实施例的流程图;
[0016]图3为本发明终端用户流失预警方法第三实施例的流程图;
[0017]图4为本发明终端用户流失预警装置第一实施例的结构示意图;
[0018]图5为本发明终端用户流失预警装置第二实施例的结构示意图;
[0019]图6为本发明终端用户流失预警装置第三实施例的结构示意图。
【具体实施方式】
[0020]图1为本发明终端用户流失预警方法第一实施例的流程图,如图1所示,本发明实施例提供的终端用户流失预警方法由终端用户流失预警装置执行,该终端用户流失预警装置设置于网络侧的服务器上,与GB接口通信连接。
[0021]终端用户流失预警装置可以采用软件和/或硬件的形式来实现,该方法包括:
[0022]步骤S100,获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数;
[0023]步骤S102,计算所述多维度用户信息中每个用户属性的信息增益;
[0024]步骤S106,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则进入步骤S108 ;
[0025]步骤S108,将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
[0026]具体地,终端用户流失预警装置与GB接口通信连接,通过GB接口获取多维度用户信息和采样数据。
[0027]其中多维度用户信息包括用户背景信息,如用户的性别,年龄,主资费品牌,地市,区县,网龄,VIP等级等;用户消费信息,如月份,总流量,总消费,语音消费,数据消费等;用户位置信息,如用户常驻小区,农村/城市,学校/住宅区/工业区等;用户终端信息,如终端品牌,型号,制式,操作系统等。采样数据为全网数据,包括全网每个月的离网用户数总数、在网用户总数以及具有每个用户属性的离网用户数和在网用户数。例如,全网每个月的离网用户数为988856,在网用户数为52554784,月消费200元以上的离网用户数为1256,在网用户数为456852。
[0028]计算多维度用户信息中每个用户属性的信息增益,信息增益用户表示每个用户属性和用户流失的相关性,信息增益越大,表明该用户属性的和用户流失的相关性越高。
[0029]根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若小于预设相关性能阀值则说明该用户属性为弱相关用户属性,删除该用户属性;若高于所述预设相关性能阀值,则将用户信息作为强相关用户属性,计算每个强相关用户属性的用户流失概率。
[0030]在本实施例的技术方案中,终端用户流失预警装置通过与GB接口通信连接,获取多维度用户信息和采样数据。计算多维度信息中每个用户属性的信息增益,并判断每个用户属性的信息增益是否大于预设相关性能阀值,保留大于预设相关性能阀值的用户属性作为强相关用户属性,然后计算每个强相关用户属性的用户流失概率。根据历史的采样数据可以判断现网中哪些用户属性属于和用户流失强相关的信息,从而针对具有这些用户属性的用户进行预警,提高了用户流失预警的精准度。
[0031]图2为本发明终端用户流失预警方法第二实施例的流程图,如图2所示,该方法由终端用户流失预警装置执行,终端用户流失预警装置可以采用软件和/或硬件的形式来实现,该方法包括:
[0032]步骤S200,采集GB接口信令数据、IMEI终端数据以及经分数据;
[0033]终端用户流失预警装置与GB接口通信连接,通过GB接口采集GB接口信令数据、国际移动设备身份码(International Mobile Equipment Identity,简称IMEI)终端数据以及经分数据。其中GB接口信令数据是指与用户上网行为和感知相关的GB接口信令,主要包括以下数据:1、体现客户终端感受的信令数据,例如客户终端等级、GPRS连接平均时间、GPRS连接成功率、客户接入性能(PDP激活)成功率,首页显示时间、网页登陆成功率;2、体现客户移动性能的信令数据,例如路由更新成功率、路由更新时长、小区重选时长、客户数据业务传递性能下载速率、下载成功率、数据包重传率、数据包丢包率、数据包乱序率、无线网络时延、网络侧发起的去激活数、网络侧(SGSN发起)发起的去激活数等;3、用户位置信息,例如行政区域,城镇/农村,区域属性,如学校/商业区等。
[0034]MEI终端数据是指用户终端识别信息,通过此信息可以识别出终端的品牌型号、制式(如 GSM、TD_SCDMA、WCDNMA 等)、上网功能(如支持 GPRS, EDGE、HSDPA, WIFI 等)、操作系统(如安卓、10S、WP8、塞班等)等。
[0035]经分数据是指由经分系统输出的相关数据,如用户使用数据业务的流量、价值、每用户平均收入等。
[0036]步骤S202,根据所述GB接口信令数据、頂EI终端数据以及经分数据提取所述多维度用户信息和所述采样数据;
[0037]通过对GB接口信令数据、頂EI终端数据以及经分数据进行数据归纳,提取出多维度用户信息和采样数据。其中多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性;采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数。
[0038]步骤S204,根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期
謝目息;
[0039]步骤S206,根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子;
[0040]步骤S208,根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子;
[0041]根据所述 离网用户总数和所述在网用户总数,计算所述采样数据的期望信息。例如:sl, S2…Sm为米样的样本,I (SI, S2…Sm)为该米样样本分类的期望信息。本次用户流失相关性分析在里,m= 2,I (SI,S2…..Sm) = I (SI,S2) ;S1为离网用户数;S2为在网用户数。期望信息的计算方法为:
【权利要求】
1.一种终端用户流失预警方法,其特征在于,包括: 获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数; 计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益 是否低于所述预设相关性能阀值; 若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
2.根据权利要求1所述的终端用户流失预警方法,其特征在于,所述获取多维度用户信息和采样数据,包括: 采集GB接口信令数据、IMEI终端数据以及经分数据; 根据所述GB接口信令数据、MEI终端数据以及经分数据提取所述多维度用户信息和所述采样数据。
3.根据权利要求1所述的终端用户流失预警方法,其特征在于,所述计算所述多维度用户信息中每个用户属性的信息增益,包括: 根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息; 根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子; 根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子。
4.根据权利要求3所述的终端用户流失预警方法,其特征在于,每个所述用户属性的客户流失因子等于每个搜书用户属性的熵。
5.根据权利要求1所述的终端用户流失预警方法,其特征在于,所述根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率,包括: 根据所述离网用户总数计算用户离网概率; 根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率; 根据每个强相关用户属性的离网用户数计算满足所述强相关用户属性的离网用户概率; 根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概率。
6.一种终端用户流失预警装置,其特征在于,包括: 获取模块,用于获取多维度用户信息和采样数据,所述多维度用户信息中包括用户背景属性、用户消费属性、用户位置属性以及用户终端属性,所述采样数据中包括离网用户数总数、在网用户总数以及每个用户属性的离网用户数和在网用户数; 第一处理模块,用于计算所述多维度用户信息中每个用户属性的信息增益,根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性; 第二处理模块,用于根据所述强相关用户属性,计算每个所述强相关用户属性的用户流失概率。
7.根据权利要求6所述的终端用户流失预警装置,其特征在于,所述获取模块包括: 采集单元,用于采集GB接口信令数据、IMEI终端数据以及经分数据; 提取单元,根据所述GB接口信令数据、頂EI终端数据以及经分数据提取所述多维度用户信息和所述采样数据。
8.根据权利要求6所述的终端用户流失预警装置,其特征在于,所述第一处理模块包括: 期望信息计算单元,用于根据所述离网用户总数和所述在网用户总数,计算所述采样数据的期望信息; 客户流失因子计算单元,用于根据每个所述用户属性的离网用户数和在网用户数,计算每个所述用户属性的客户流失因子; 信息增益计算单元,用于根据所述采样数据的期望信息和每个所述用户属性的客户流失因子,计算每个用户属性的信息增益,所述信息增益等于所述期望信息约减所述客户流失因子; 信息增益判断单元,用于根据预设相关性能阀值,判断每个所述用户属性的信息增益是否低于所述预设相关性能阀值,若高于所述预设相关性能阀值,则将所述用户属性作为强相关用户属性。
9.根据权利要求8所述的终端用户流失预警装置,其特征在于,每个所述用户属性的客户流失因子等于每个搜书用户属性的熵。
10.根据权利要求6所述的终端用户流失预警装置,其特征在于,所述第二处理模块包括: 用户离网概率计算单元,用于根据所述离网用户总数计算用户离网概率; 强相关用户属性的用户概率计算单元,用于根据每个所述强相关用户属性的离网用户数和在网用户数,计算满足所述强相关用户属性的用户概率; 强相关用户属性的离网用户概率计算单元,用于根据每个强相关用户属性的离网用户数计算满足所述强相关用户属性的离网用户概率; 强相关用户属性的用户流失概率计算单元,用于根据所述用户离网概率、所述强相关用户属性的用户概率和所述强相关用户属性的离网用户概率,通过贝叶斯算法计算每个所述强相关属性的用户流失概 率。
【文档编号】G06Q30/00GK103905229SQ201210578628
【公开日】2014年7月2日 申请日期:2012年12月27日 优先权日:2012年12月27日
【发明者】谭卫, 郑伯勋, 曾为民, 杨荒, 杨霞, 马国军, 谈澄秋, 何清, 许杰, 叶锐, 曾昂, 黄云飞, 徐泗洪 申请人:中国移动通信集团四川有限公司