一种基于熵值法的用户价值评分计算方法及系统与流程

文档序号:12471766阅读:827来源:国知局
一种基于熵值法的用户价值评分计算方法及系统与流程



背景技术:

随着网络直播行业的飞速发展,网络直播平台的业务范围日益扩大,而且提供的内容也更加丰富多彩,用户规模随之呈现飞速增长趋势。用户在平台上的各种消费行为,如赠送虚拟礼物和充值信息等,给平台带来了较好的经济效益,对平台的进一步发展具有良好的推动作用。因此,如何确定不同用户的用户价值评分,并依据该用户价值评分区分用户,方便营销人员针对不同用户,策划相应的营销方案和维系挽留策略,是一个迫切需要解决的问题。现有对用户区分的方法是通过层次分析法来评价用户的价值得分,但是,层次分析法是一种模拟人脑的决策方法,带有很强的主观性,因此得出的用户的价值得分的准确性较低。



技术实现要素:

针对现有技术中存在的缺陷,本发明的主要目的在于提供一种基于熵值法的用户价值评分计算方法,本发明的另一目的在于提供一种基于熵值法的用户价值评分系统,通过选取部分用户的行为信息指标构建指标体系,使用该指标体系,并基于熵值法来计算用户价值评分,因此,行为信息指标的权重具有很强的客观性,以此方法可以定量地得到用户价值评分,而且获得的用户价值评分的准确性较好,对于营销业务具有很强的针对性。

本发明提供一种基于熵值法的用户价值评分计算方法,包括以下步骤:

S1.从服务器采集用户的行为信息指标;

S2.选取部分行为信息指标构建指标体系,所述指标体系用于计算用户价值评分,并对所述部分行为信息指标的数据进行标准化处理;

S3.对于所述指标体系中的任一个行为信息指标,计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度;

S4.对于所述指标体系中的任一个行为信息指标,计算所述行为信息指标的权重;

S5.对于任一个用户,依据所有所述行为信息指标的权重和该用户的所有所述行为信息指标的贡献度,计算该用户的用户价值评分。

在上述技术方案的基础上,

所述部分行为信息指标包括活跃度、消费能力和充值能力;

所述活跃度包括观看时长、观看天数、观看房间数量和发送弹幕数量;

所述消费能力包括赠送虚拟礼物数量和赠送虚拟礼物房间数量;

所述充值能力包括充值金额、平均每次充值金额和充值天数。

在上述技术方案的基础上,所述指标体系为初始化矩阵A=(Xij)n×m,其中,Xij为所述指标体系中第i个用户的第j个行为信息指标的数据,其中i=1,2,…,n,j=1,2,…,m,n和m均为正整数。

在上述技术方案的基础上,步骤S2具体包括:

将所述指标体系中的行为信息指标划分为正向指标和负向指标,所述正向指标的数据越大,用户价值评分越高;所述负向指标的数据越小,用户价值评分越低;

分别对所述正向指标和负向指标进行归一化处理,

对于正向指标:

<mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

对于负向指标:

<mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <mfrac> <mrow> <mi>max</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,min(X1j,X2j,...,Xnj)为所述指标体系中的第j个行为信息指标的所有数据的最小值,max(X1j,X2j,...,Xnj)为所述指标体系中的第j个行为信息指标的所有数据的最大值。

在上述技术方案的基础上,步骤S3中,任一个用户的行为信息指标对所有用户的行为信息指标的贡献度Pij为:

<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> </mrow> </mfrac> <mo>.</mo> </mrow>

在上述技术方案的基础上,步骤S4具体包括:

S4.1计算第j个行为信息指标的熵值ej

<mrow> <msub> <mi>e</mi> <mi>j</mi> </msub> <mo>=</mo> <mo>-</mo> <mi>k</mi> <mo>*</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

其中,k=1/ln(n),k>0,ln为自然对数,ej≥0;

S4.2计算所述行为信息指标的差异系数gj

gj=1-ej

S4.3计算所述行为信息指标的权重Wj

<mrow> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>=</mo> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>/</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>.</mo> </mrow>

在上述技术方案的基础上,步骤S5中,对于第i个用户,计算该用户的用户价值评分Si,依据公式:

在上述技术方案的基础上,所述方法还包括:

S6.根据所述用户价值评分对任一个用户进行价值等级划分,其具体步骤包括:

S6.1对所有用户的所述用户价值评分按照数据大小进行排序,并存入一数据集合;

S6.2在所述数据集合的最大值和最小值之间,通过设定y个区分点,将所述数据集合划分为y+1个区间,任一个所述区间对应一个价值等级,y为正整数;

S6.3依据任一个用户价值评分所在的区间,将该用户划分为所述区间对应的价值等级。

本发明还提供一种基于熵值法的用户价值评分计算系统,包括:

数据采集模块,用于从服务器采集用户的行为信息指标;

指标体系构建模块,用于选取部分行为信息指标,并用选取的部分行为信息指标构建用于计算用户价值评分的指标体系,并对所述部分行为信息指标的数据进行标准化处理;

计算模块,用于对于所述指标体系中的任一个行为信息指标,计算任一个用户的所述行为信息指标对所有用户的所述行为信息指标的贡献度,并计算所述行为信息指标的权重;以及,对于任一个用户,依据所有所述行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分;

价值等级划分模块,用于根据所述用户价值评分对任一个用户进行价值等级划分。

在上述技术方案的基础上,

所述部分行为信息指标包括活跃度、消费能力和充值能力;

所述活跃度包括观看时长、观看天数、观看房间数量和发送弹幕数量;

所述消费能力包括赠送虚拟礼物数量和赠送虚拟礼物房间数量;

所述充值能力包括充值金额、平均每次充值金额和充值天数。

与现有技术相比,本发明的优点如下:

(1)本发明选取部分用户的行为信息指标构建指标体系,使用该指标体系,通过熵值法来计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度和所有行为信息指标的权重,对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。由于熵值法是一种客观赋权法,其根据各项行为信息指标的数据所提供的信息大小来确定行为信息指标的权重,因此,计算获得的行为信息指标的权重具有很强的客观性,以此方法可以定量地得到用户价值评分,而且获得的用户价值评分的准确性较好,对于营销业务具有很强的针对性。

(2)本发明选取部分用户的行为信息指标构建指标体系,选取的部分行为信息指标包括用户的活跃度、消费能力和充值能力,这些行为信息指标能够充分反映用户在平台上的各种消费行为,使用这些行为信息指标计算获得的用户价值评分具有很强的针对性,为营销人员针对不同用户策划相应的营销方案提供了方便。

(3)本发明依据计算获得的用户价值评分所在的区间,将该用户划分为该区间对应的价值等级,划分方式客观、简单,并可以灵活调整区间,以适应平台实际业务情况。

附图说明

图1是本发明的一个实施例基于熵值法的用户价值评分计算方法的流程图;

图2是本发明的另一个实施例基于熵值法的用户价值评分计算方法的流程图;

图3是本发明实施例基于熵值法的用户价值评分计算系统的模块图。

附图标记:

数据采集模块1,指标体系构建模块2,计算模块3,价值等级划分模块4。

具体实施方式

下面结合附图及具体实施例对本发明作进一步的详细描述。

参见图1所示,本发明的一个实施例提供一种基于熵值法的用户价值评分计算方法,包括以下步骤:

S1.从服务器采集用户的行为信息指标。

例如,从服务器采集设定时间段内用户的行为信息指标,设定时间段可以为最近的一个月。

S2.选取部分行为信息指标构建指标体系,该指标体系用于计算用户价值评分,并对部分行为信息指标的数据进行标准化处理。

部分行为信息指标包括活跃度、消费能力和充值能力。

活跃度包括观看时长、观看天数、观看房间数量和发送弹幕数量,消费能力包括赠送虚拟礼物数量和赠送虚拟礼物房间数量,充值能力包括充值金额、平均每次充值金额和充值天数。

本发明选取部分用户的行为信息指标构建指标体系,选取的部分行为信息指标包括用户的活跃度、消费能力和充值能力,这些行为信息指标能够充分反映用户在平台上的各种消费行为,使用这些行为信息指标计算获得的用户价值评分具有很强的针对性,为营销人员针对不同用户策划相应的营销方案提供了方便。

指标体系为初始化矩阵A=(Xij)n×m,其中,Xij为初始化矩阵A的第i行第j列元素,并且,Xij为指标体系中第i个用户的第j个行为信息指标的数据,其中i=1,2,…,n,j=1,2,…,m,n和m均为正整数。

步骤S2具体包括:

将指标体系中的行为信息指标划分为正向指标和负向指标,正向指标的数据越大,用户价值评分越高;负向指标的数据越小,用户价值评分越低。

例如,观看时长、观看天数、观看房间数量、发送弹幕数量、赠送虚拟礼物数量、赠送虚拟礼物房间数量、充值金额、平均每次充值金额和充值天数均为正向指标。

由于选取的各行为信息指标的量纲不一致,因此在计算用户价值评分前,需要对行为信息指标进行归一化处理。由于正向指标和负向指标的数据代表的含义不同,正向指标的数据越大或者负向指标的数据越小,用户价值评分越高,因此,需要采用不同的算法进行标准化处理。

分别对正向指标和负向指标进行归一化处理,

对于正向指标:

<mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

对于负向指标:

<mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <mfrac> <mrow> <mi>max</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,min(X1j,X2j,...,Xnj)为指标体系中的第j个行为信息指标的所有数据的最小值,max(X1j,X2j,...,Xnj)为指标体系中的第j个行为信息指标的所有数据的最大值。

S3.对于指标体系中的任一个行为信息指标,计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度。

步骤S3中,任一个用户的行为信息指标对所有用户的行为信息指标的贡献度Pij为:

<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> </mrow> </mfrac> <mo>.</mo> </mrow>

S4.对于指标体系中的任一个行为信息指标,计算该行为信息指标的权重。

步骤S4具体包括:

S4.1计算第j个行为信息指标的熵值ej

<mrow> <msub> <mi>e</mi> <mi>j</mi> </msub> <mo>=</mo> <mo>-</mo> <mi>k</mi> <mo>*</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

其中,k=1/ln(n),k>0,ln为自然对数,ej≥0。

S4.2计算行为信息指标的差异系数gj

gj=1-ej

S4.3计算行为信息指标的权重Wj

<mrow> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>=</mo> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>/</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>.</mo> </mrow>

对于第j个行为信息指标,其所有数据的差异越大,熵值ej就越小,差异系数gj越大,则该行为信息指标Xij的权重Wj越大,即表示该行为信息指标Xij越重要。

S5.对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。

步骤S5中,对于第i个用户,计算该用户的用户价值评分Si,依据公式:

本发明选取部分用户的行为信息指标构建指标体系,使用该指标体系,通过熵值法来计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度和所有行为信息指标的权重,对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。由于熵值法是一种客观赋权法,其根据各项行为信息指标的数据所提供的信息大小来确定行为信息指标的权重,因此,计算获得的行为信息指标的权重具有很强的客观性,以此方法获得的用户价值评分的准确性较好。

参见图2所示,本发明的另一个实施例提供一种基于熵值法的用户价值评分计算方法,包括以下步骤:

S1.从服务器采集用户的行为信息指标。

例如,从服务器采集设定时间段内用户的行为信息指标,设定时间段可以为最近的一个月。

S2.选取部分行为信息指标构建指标体系,该指标体系用于计算用户价值评分,并对部分行为信息指标的数据进行标准化处理。

部分行为信息指标包括活跃度、消费能力和充值能力。

活跃度包括观看时长、观看天数、观看房间数量和发送弹幕数量,消费能力包括赠送虚拟礼物数量和赠送虚拟礼物房间数量,充值能力包括充值金额、平均每次充值金额和充值天数。

本发明选取部分用户的行为信息指标构建指标体系,选取的部分行为信息指标包括用户的活跃度、消费能力和充值能力,这些行为信息指标能够充分反映用户在平台上的各种消费行为,使用这些行为信息指标计算获得的用户价值评分具有很强的针对性,为营销人员针对不同用户策划相应的营销方案提供了方便。

指标体系为初始化矩阵A=(Xij)n×m,其中,Xij为初始化矩阵A的第i行第j列元素,并且,Xij为指标体系中第i个用户的第j个行为信息指标的数据,其中i=1,2,…,n,j=1,2,…,m,n和m均为正整数。

步骤S2具体包括:

将指标体系中的行为信息指标划分为正向指标和负向指标,正向指标的数据越大,用户价值评分越高;负向指标的数据越小,用户价值评分越低。

例如,观看时长、观看天数、观看房间数量、发送弹幕数量、赠送虚拟礼物数量、赠送虚拟礼物房间数量、充值金额、平均每次充值金额和充值天数均为正向指标。

由于选取的各行为信息指标的量纲不一致,因此在计算用户价值评分前,需要对行为信息指标进行归一化处理。由于正向指标和负向指标的数据代表的含义不同,正向指标的数据越大或者负向指标的数据越小,用户价值评分越高,因此,需要采用不同的算法进行标准化处理。

分别对正向指标和负向指标进行归一化处理,

对于正向指标:

<mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

对于负向指标:

<mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mo>=</mo> <mfrac> <mrow> <mi>max</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mrow> <mn>1</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mn>2</mn> <mi>j</mi> </mrow> </msub> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>X</mi> <mrow> <mi>n</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,min(X1j,X2j,...,Xnj)为指标体系中的第j个行为信息指标的所有数据的最小值,max(X1j,X2j,...,Xnj)为指标体系中的第j个行为信息指标的所有数据的最大值。

S3.对于指标体系中的任一个行为信息指标,计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度。

步骤S3中,任一个用户的行为信息指标对所有用户的行为信息指标的贡献度Pij为:

<mrow> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> <mrow> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mo>&prime;</mo> </msubsup> </mrow> </mfrac> <mo>.</mo> </mrow>

S4.对于指标体系中的任一个行为信息指标,计算该行为信息指标的权重。

步骤S4具体包括:

S4.1计算第j个行为信息指标的熵值ej

<mrow> <msub> <mi>e</mi> <mi>j</mi> </msub> <mo>=</mo> <mo>-</mo> <mi>k</mi> <mo>*</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>l</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>P</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

其中,k=1/ln(n),k>0,ln为自然对数,ej≥0。

S4.2计算第j个行为信息指标的差异系数gj

gj=1-ej

S4.3计算第j个行为信息指标的权重Wj

<mrow> <msub> <mi>W</mi> <mi>j</mi> </msub> <mo>=</mo> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>/</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </munderover> <msub> <mi>g</mi> <mi>j</mi> </msub> <mo>.</mo> </mrow>

对于第j个行为信息指标,其所有数据的差异越大,熵值ej就越小,差异系数gj越大,则该行为信息指标Xij的权重Wj越大,即表示该行为信息指标Xij越重要。

S5.对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。

步骤S5中,对于第i个用户,计算该用户的用户价值评分Si,依据公式:

S6.根据用户价值评分对任一个用户进行价值等级划分,其具体步骤包括:

S6.1对所有用户的用户价值评分按照数据大小进行排序,并存入一数据集合。

S6.2在数据集合的最大值和最小值之间,通过设定y个区分点,将数据集合划分为y+1个区间,任一个区间对应一个价值等级,y为正整数。

例如,设定y=2,则将数据集合划分为3个区间,这3个区间按照数据大小分别为高、中和低价值等级。

S6.3依据任一个用户价值评分所在的区间,将该用户划分为该区间对应的价值等级。

本发明依据计算获得的用户价值评分所在的区间,将该用户划分为该区间对应的价值等级,划分方式客观、简单,并可以灵活调整区间,以适应平台实际业务情况。

本发明选取部分用户的行为信息指标构建指标体系,使用该指标体系,通过熵值法来计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度和所有行为信息指标的权重,对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。由于熵值法是一种客观赋权法,其根据各项行为信息指标的数据所提供的信息大小来确定行为信息指标的权重,因此,计算获得的行为信息指标的权重具有很强的客观性,以此方法获得的用户价值评分的准确性较好。

参见图3所示,本发明还提供一种基于熵值法的用户价值评分计算系统,包括数据采集模块1、指标体系构建模块2、计算模块3和价值等级划分模块4。

数据采集模块1,用于从服务器采集用户的行为信息指标。

指标体系构建模块2,用于选取部分行为信息指标,并用选取的部分行为信息指标构建用于计算用户价值评分的指标体系,并对部分行为信息指标的数据进行标准化处理。

部分行为信息指标包括活跃度、消费能力和充值能力。

活跃度包括观看时长、观看天数、观看房间数量和发送弹幕数量,消费能力包括赠送虚拟礼物数量和赠送虚拟礼物房间数量,充值能力包括充值金额、平均每次充值金额和充值天数。

本发明选取部分用户的行为信息指标构建指标体系,选取的部分行为信息指标包括用户的活跃度、消费能力和充值能力,这些行为信息指标能够充分反映用户在平台上的各种消费行为,使用这些行为信息指标计算获得的用户价值评分具有很强的针对性,为营销人员针对不同用户策划相应的营销方案提供了方便。

计算模块3,用于对于指标体系中的任一个行为信息指标,计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度,并计算行为信息指标的权重;以及,对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。

本发明选取部分用户的行为信息指标构建指标体系,使用该指标体系,通过熵值法来计算任一个用户的行为信息指标对所有用户的行为信息指标的贡献度和所有行为信息指标的权重,对于任一个用户,依据所有行为信息指标的权重和该用户的所有行为信息指标的贡献度,计算该用户的用户价值评分。由于熵值法是一种客观赋权法,其根据各项行为信息指标的数据所提供的信息大小来确定行为信息指标的权重,因此,计算获得的行为信息指标的权重具有很强的客观性,以此方法获得的用户价值评分的准确性较好。

价值等级划分模块4,用于根据用户价值评分对任一个用户进行价值等级划分。

本发明依据计算获得的用户价值评分,将用户划分为不同的价值等级,划分方式客观、简单和灵活,以适应平台实际业务情况。

本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1