流量精细化营销参数的选取方法
【技术领域】
[0001] 本发明涉及流量精细化的技术领域,尤其涉及流量精细化营销参数的选取方法。
【背景技术】
[0002] 目前,GX联通在流量包推广过程中使用传统方法对客户进行细分,简单的细分变 量如月消费额、月流量消耗、套餐类型已经无法适应互联网时代的流量经营,发现用户潜在 的流量需求。这种模糊的细分结果无法及时地捕捉到客户的消费需求,也无法及时地提供 相应的服务满足需求,为公司提高收益。同时由于前期模糊的客户定位,企业无法挖掘出真 正的潜在客户,所以企业只能凭借经验采用"暴力营销"方式,这方法投入成本高,客户响应 率低,甚至还会引起客户的反感,进而引发客户投诉,最终还大大地降低了推广流量包的成 功率。
[0003] AdaBoosting是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类 器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。 目前,对AdaBoosting算法的研宄以及应用大多集中于分类问题,同时近年也出现了一些 在回归问题上的应用。AdaBoosting算法主要解决了:两类问题、多类单标签问题、多类多 标签问题、大类单标签问题,回归问题等。该算法其实是一个简单的弱分类算法提升过程, 这个过程通过不断的训练,可以提高对数据的分类能力。
[0004] Adaboosting算法是将很多个分类器的的意见有效的结合起来以达到更好的分类 效果。该算法的大致流程为:首先依据分类效果的差异从众多的单特征弱分类器中筛选出 分类性能最好的分类器,并赋予相应的权值;然后依据分类的结果对各训练样本的权值进 行更新,更新的原则是:误分类样本被赋予更高的权值。最后依照权值大小,将各分类器有 效结合起来,并据此对测试样本进行分类。
[0005] 目前,还没有将Adaboosting算法运用于流量包推广的技术方案。
【发明内容】
[0006] 为了解决上述问题,本发明提供流量精细化营销参数的选取方法,能够有效捕捉 用户消费需求,实现根据客户潜在需求精准推广流量包。
[0007] 本发明所要解决的技术问题是针对上述【背景技术】的不足,提供了流量精细化营销 参数的选取方法,解决现有技术中模糊细分客户无法及时捕捉到客户消费需求的技术问 题。
[0008] 本发明为实现上述发明目的采用如下技术方案:
[0009] 本发明提供了流量精细化营销参数的选取方法,包括如下步骤:
[0010] 由细分目的选择数据变量后细分用户群;
[0011] 从数据集中抽取各用户群的数据样本集;
[0012] 以各用户群的数据样本集为AdaBoosting模型的训练样本确定影响AdaBoosting 模型分类精度的参数。
[0013] 作为所述流量精细化营销参数的选取方法的进一步优化方案,数据变量包括基本 属性变量和行为特征变量。
[0014] 作为所述流量精细化营销参数的选取方法的进一步优化方案,基本属性变量包 括:开户时间、用户类型、基本套餐、套餐类型、终端类型、固定时间区间内的消耗流量、固定 时间区间内的费用消耗。
[0015] 进一步的,所述流量精细化营销参数的选取方法中,行为特征变量包括:流量包订 购情况、用户安装app的数量、大流量app安装数、大流量app使用次数、app使用次数、用 户闲时登陆的次数、闲时登陆消耗的流量。
[0016] 进一步的,所述流量精细化营销参数的选取方法中,从数据集中抽取各用户群的 数据样本集这一步骤的具体方法为:
[0017] 预处理各用户群的数据样本集;
[0018] 格式转换预处理后的各用户群的数据样本集;
[0019] 对格式化后的数据样本集抽样各用户群的观测样本。
[0020] 进一步的,所述流量精细化营销参数的选取方法中,预处理各用户群的数据样本 集,具体为:删除异常值和极端值,为无序多分类数据变量设置哑变量。
[0021] 进一步的,所述流量精细化营销参数的选取方法中,从数据集中抽取各用户群的 数据样本集这一步骤的具体方法为:由用户群数据样本集生成衍变量。
[0022] 进一步的,所述流量精细化营销参数的选取方法中,衍变量包括:闲时流量消耗 比、均使用流量。
[0023] 更进一步的,所述流量精细化营销参数的选取方法中,以各用户群的数据样本集 为AdaBoosting模型的训练样本确定影响AdaBoosting模型分类精度的参数这一步骤具体 包括以下子步骤:
[0024] (1)以各用户群的观测样本为AdaBoosting模型的训练样本,初始化样本权重
[0025] (2)开始迭代过程确定影响分类精度的数据变量:
[0026] A.归一化权重,
[0027] B.计算以各数据变量为特征的弱分类器的加权错误概率,
[0028] C.选出最小加权错误概率的弱分类器,
[0029] D.调整样本权重后返回A重复迭代过程直至达到最大迭代次数。
[0030] (3)将迭代筛选出的多个最小加权错误概率弱分类器组成一个强分类器,所述强 分类器对应为流量精细化营销参数的集合。
[0031] 进一步的,所述流量精细化营销参数的选取方法的子步骤D中,以赋予误分类样 本高权值,不改变正确分类样本权值的原则调整样本权重。
[0032] 由上述本发明的实施例提供的技术方案可以看出,本方案设计的实现云计算资源 混合调度的方法和系统具有以下有益效果:考虑用户的行为特征细分目标用户群,以预处 理后的用户群样本数据为AdaBoosting模型的训练样本确定影响AdaBoosting模型分类精 度的参数,提高了 AdaBoosting模型的分类精度,精确捕捉到用户的消费需求,提高了流量 包推广的成功率。
[0033] 本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0034] 为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用 的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本 领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他 的附图。
[0035] 图1为本发明的流程图。
[0036] 图2为AdaBoosting算法的流程图。
【具体实施方式】
[0037] 下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始 至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参 考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0038] 本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式"一"、"一 个"、"所述"和"该"也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措 辞"包括"是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加 一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元 件被"连接"或"耦接"到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在 中间元件。此外,这里使用的"连接"或"耦接"可以包括无线连接或耦接。这里使用的措 辞"和/或"