基于层级聚类的传媒客户价值模型建立方法与流程

文档序号:19286063发布日期:2019-11-29 23:34阅读:284来源:国知局
基于层级聚类的传媒客户价值模型建立方法与流程

本发明属于数据分析技术领域,具体涉及一种基于层级聚类的传媒客户价值模型建立方法。



背景技术:

2001年开始,互联网真正走向了一个新的里程碑,进入“大数据时代”。很多企业经过几十年的发展,已经沉淀下来了庞大的客户数据,其中包括基本属性数据、业务数据以及一系列的行为数据,如何在企业中利用大数据技术对客户价值进行充分挖掘提供了充足的基础数据,如何构建客户价值模型成为关键一步。

基于传媒行业特性,客户价值模型有着不同的构建方法,现有的客户价值体系构建方法通过着眼企业与客户之间的关系进行洞察、归纳、推理,提炼出不同维度的价值评估。通常情况下,客户价值模型的一级维度分为当前价值和潜在价值,每个维度又由不同指标通过一系列的数据挖掘技术组合得出,由此形成客户价值体系。以上模型分析存在如下缺点:(1)模型对于客户价值的评价不够全面;(2)制定二级指标权重依靠专家打分,再根据层次分析法制定相应的权重。



技术实现要素:

鉴于以上存在的技术问题,本发明用于提供一种基于层级聚类的传媒客户价值模型建立方法。

为解决上述技术问题,本发明采用如下的技术方案:

一种基于层级聚类的传媒客户价值模型建立方法,包括以下步骤:

s10,建立模型体系:根据已有的客户的基本信息数据、业务数据以及行为喜好数据构建客户价值模型,客户价值模型自上而下定义为四级;

s20,基础指标数据标准化处理,进一步包括:数据清洗,用于基于客户属性的相似度算法为缺失行为数据的客户寻找相似客户,并估算其相应的行为数据;为客户名下的多个用户制定权重,进而转化为客户相关的基础标签;数据归一化;

s30,假设每层有pi个指标,其中i表示自上而下的层数,则每个上层指标ulk(k=1,2,...pk)挑选出相关性最大的基础指标集利用层级聚类算法对客户进行聚类,将m个客户样本最终划分为100类classifer={cf1,cf2,...,cf100};

s40,为每个类打上分数s={s1,s2,...,s100}si∈(0,100)(i=1,2,...,100),将所属各个集合的客户总创收进行排序,以此确定每个集合的分值,创收越高分值越高。

优选地,客户的基础指标集从包括客户每月出账表,产品订购表,直播、点播、回放的日志详单表,宽带流量表,受理信息表,用户全量表、呼叫中心日志表、参与活动相关的信息表以及反馈表的一系列与客户相关的数据表按照特定规则得出。

优选地,s20中,权重规则如下:

时间越近的行为权重越大;

平均活跃周期的越大的用户权重越大;

在线越长的用户权重越大。

优选地,s20中,数据归一化过程如下:

利用二八定律将客户群划分为重要客户pu以及次要客户su两部分客户群;

继续利用二八定律将pu和su划分两部分客户群,依次将客户划分成四个不同等级的群体;

为不同等级的群体制定不同的转换公式,分为线性y=ax+b和非线性y=a+bec(x+d),将基础指标归一到0到100的数值。

优选地,s30中,分级聚类算法步骤如下:

s301,将客户样本集u={u1,u2,...,um}中每个客户归为一类,共得到m类,每类仅包含一个客户,类与类之间的距离,即使用如下欧式距离计算各类之间的距离,所包含的客户之间指标li={li,1,li,2,...,li,p}(i=1,2,...,m)和lj={lj,1,lj,2,...,lj,p}(j=1,2,...,m)的距离,得到一个m×m维的距离矩阵d(0)(i=1,2,...,mj=1,2,....m),其中di,j表示第i个客户和第j个客户之间的距离;

s302,找到最接近的两个类即min(di,j),合并成一类,则总的类数少了一个,变为m-1个类;

s303,重新计算新的类与所有旧类之间的距离,得到新的(m-1)×(m-1)维的距离矩阵d(1)

s304,重复s302和s303,直到最后合并成为100类:classifer={cf1,cf2,...,cf100}。

采用本发明具有如下的有益效果:

(1)多层次全方面客户价值体系的构建;

(2)基于客户属性的相似度算法,填补了缺失的客户数据;

(3)数据的归一化处理方法,基于大数据分布特征将客户数据标准化;

(4)聚类算法分群让每层的上层指标价值评估最终只依赖于基础指标数据,并不像传统加权线性计算方式会受主观意识的营销。

附图说明

图1为本发明实施例的基于层级聚类的传媒客户价值模型建立方法的步骤流程图;

图2为本发明实施例的基于层级聚类的传媒客户价值模型建立方法的客户价值体系的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参照图1,所示为本发明公开的一种基于层级聚类的传媒客户价值评价模型建立方法的步骤流程图,其包括以下步骤:

s10,建立模型体系:根据已有的客户的基本信息数据、业务数据以及行为喜好数据构建客户价值模型,客户价值模型自上而下定义为四级;

具体应用实例中,参见图2,客户价值模型自上而下定义为四级具体包括:

第一级:客户价值;

第二级:当前价值、潜在价值、成长潜力;

第三级:当前价值包括收入和活跃度;潜在价值包括信用度、忠诚度、满意度和接触度;成长潜力包括基础业务收入增长率、新业务收入占比和业务黏连度;

第四级:收入包括数字基础、付费频道、互动点播、增值业务和宽带业务;活跃度包括在线时长、平均活跃周期、近度和月开机频次;信用度包括余额和缴费方式;忠诚度包括入网账龄、续费返充剩余返充月份、主动暂停时长、终端数和产品期数;满意度包括呼叫中心投诉次数、营业厅投诉次数、在线订购次数、在线退订次数、故障次数、维修次数和换机次数;接触度包括签到次数、积分兑换次数、客服咨询次数、营业厅咨询次数、客服咨询次数、营业厅咨询次数、购买次数和购买时间;成长潜力包括基础业务收入增长率、新业务收入占比和业务黏连度。

s20,基础指标数据标准化处理,进一步包括:数据清洗,用于基于客户属性的相似度算法为缺失行为数据的客户寻找相似客户,并估算其相应的行为数据;为客户名下的多个用户制定权重,进而转化为客户相关的基础标签;数据归一化;

基于客户属性的相似度算法步骤如下:

按照所办业务细分,对办理每种业务的客户建立各自的关联度模型;

在同种业务中,选取n个具有显著特征的属性,第m个特征值表示为:

度量属性的相似度,使用表示,scui(i=1,2,...)和scuj(j=1,2,...)两个客户第m个属性的相似度

scui(i=1,2,...)和scuj(j=1,2,...)的相似度表示为其中k表示第m个特征的权重;

对相似度进行排序,形成相似度矩阵

选取相似度最高的客户进行数据补充。

为客户名下的多个用户制定权重,进而转化为客户相关的基础标签,权重规则如下:时间越近的行为权重越大;平均活跃周期的越大的用户权重越大;在线越长的用户权重越大。

其中,具体应用实例中,数据归一化过程如下:利用二八定律将客户群划分为重要客户pu以及次要客户su两部分客户群;继续利用二八定律将pu和su划分两部分客户群,依次将客户划分成四个不同等级的群体;为不同等级的群体制定不同的转换公式,分为线性y=ax+b和非线性y=a+bec(x+d),将基础指标归一到0到100的数值。其中二八定律是19世纪末20世纪初意大利经济学家帕累托发现的。他认为,在任何一组东西中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的,因此又称二八定律。现实意义是20%的客户会给公司带来了80%的收益,这部分的客户为高价值的客户,而剩下80%的客户只带来了20%的收益。

s30,假设每层有pi个指标,其中i表示自上而下的层数,则每个上层指标ulk(k=1,2,...pk)挑选出相关性最大的基础指标集利用层级聚类算法对客户进行聚类,将m个客户样本最终划分为100类classifer={cf1,cf2,...,cf100};

具体应用实例中,s30中,分级聚类算法步骤如下:

s301,将客户样本集u={u1,u2,...,um}中每个客户归为一类,共得到m类,每类仅包含一个客户,类与类之间的距离,即使用如下欧式距离计算各类之间的距离,所包含的客户之间指标li={li,1,li,2,...,li,p}(i=1,2,...,m)和山={lj,1,lj,2,...,lj,p}(j=1,2,...,m)的距离,得到一个m×m维的距离矩阵d(0)(i=1,2,...mj=1,2,...m),其中di,j表示第i个客户和第j个客户之间的距离;

s302,找到最接近的两个类即min(di,j),合并成一类,则总的类数少了一个,变为m-1个类;

s303,重新计算新的类与所有旧类之间的距离,得到新的(m-1)×(m-1)维的距离矩阵d(1)

s304,重复s302和s303,直到最后合并成为100类:classifer={cf1,cf2,...,cf100}。

s40,为每个类打上分数s={s1,s2,...,s100}si∈(0,100)(i=1,2,...,100),将所属各个集合的客户总创收进行排序,以此确定每个集合的分值,创收越高分值越高。

以上技术方案中,客户基础指标集l={l1,l2,...,ln},客户样本集u={u1,u2,...,um}。客户的基础指标集主要从客户每月出账表,产品订购表,直播、点播、回放的日志详单表,宽带流量表,受理信息表,用户全量表、呼叫中心日志表、参与活动相关的信息表以及反馈表等一系列与客户相关的数据表按照特定规则得出。

通过以上技术方案,针对现有技术中模型对于客户价值的评价不够全面的问题,本发明实施例不仅关注客户对于企业所创下的利润价值,更是从信用度、满意度、接触度以及忠诚度等方面研究客户未来的潜力价值。针对现有技术中制定二级指标权重依靠专家打分,再根据层次分析法制定相应的权重的问题,本发明实施例直接将下层标签的数据表现进行聚类划分,再根据客户创收的收益进行评估,使得数据的准确度更高,能给客户挖掘带来更有益的价值。

应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1