一种针对阶梯模型的数据处理方法、装置以及电子设备与流程

文档序号：13557947阅读：387来源：国知局

本说明书涉及计算机软件技术领域，尤其涉及一种针对阶梯模型的数据处理方法、装置以及电子设备。

背景技术：

随着计算机和互联网技术的迅速发展，很多业务可以在网上进行，给用户带来了便利。为了更好地服务于用户，业务提供方经常需要进行活动运营，一般通过向用户投放权益，以求实现对用户的拉新、留存、促活或者召回流失(为了便于描述，可以统称为：用户转化)，该权益比如可以是话费、购物优惠券、现金红包、游戏虚拟物品等。

以拉新为例，若某用户由于自己被投放的权益，成为了进行拉新的投放方的新用户，则认为该用户被转化，反之则认为该用户未被转化。在一定的成本预算下，使尽量多的用户被转化即是投放方的主要目标。

在现有技术中，会训练得到多个单权益模型，单权益模型用于根据用户特征计算该用户对于单个权益的接受度，一般地，接受度越高表示该用户在被投放该单个权益的情况下越有可能被转化；进一步地，在实际应用中，多个单权益模型分别对应的权益可能具有包含关系(比如，某三种权益可能分别是2元话费、5元话费、10元话费，则10话费是包含2元话费、5元话费的，5元话费又是包含2元话费的)，这些权益不会同时向同一用户投放，越高的权益越有可能促成用户转化，但相应的成本也越高，针对这种情况，会对待投放权益的用户集合中的至少部分用户进行随机的在线投放测试，并根据在线投放测试结果，确定权益投放方案。

基于现有技术，需要能够更有效地转化用户的权益投放方案。

技术实现要素：

本说明书实施例提供一种针对阶梯模型的数据处理方法、装置以及电子设备，用以解决如下技术问题：需要能够更有效地转化用户的权益投放方案。

为解决上述技术问题，本说明书实施例是这样实现的：

本说明书实施例提供的一种针对阶梯模型的数据处理方法，包括：

获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

本说明书实施例提供的一种针对阶梯模型的数据处理装置，包括：

获取模块，获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建模块，构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

近似求解模块，根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

本说明书实施例提供的一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：由于可以基于预先训练得到的多个单权益模型及其分别对应的离线的训练数据，对阶梯模型中待定的圈定比例进行近似求解，进而可以基于求解结果得到能够更有效转化用户的权益投放方案。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书的方案在一种实际应用场景下涉及的一种整体架构示意图；

图2为本说明书实施例提供的一种针对阶梯模型的数据处理方法的流程示意图；

图3为本说明书实施例提供的一种实际应用场景下的阶梯模型原理图；

图4为本说明书实施例提供的对应于图3的基于离线的训练数据近似求解用户圈定比例的原理示意图；

图5为本说明书实施例提供的对应于图2的一种针对阶梯模型的数据处理装置的结构示意图。

具体实施方式

本说明书实施例提供一种针对阶梯模型的数据处理方法、装置以及电子设备。

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

图1为本说明书的方案在一种实际应用场景下涉及的一种整体架构示意图。该整体架构中，主要涉及两部分：各单权益模型及其对应的离线的训练数据所在设备、阶梯模型所在设备。

单权益模型用于计算用户对于单个权益的接受度；阶梯模型是基于各单权益模型构建的一种多分类模型，阶梯模型表示各单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户(也即，基于阶梯模型对用户集合中的用户进行分类，每个单权益模型分别对应分出的一类)，以便于向被圈定的用户投放对应的权益。

通过本说明书的方案，可以根据各单权益模型对应的离线的训练数据，对每个单权益模型的用户圈定比例进行近似求解，实际运营或者在线投放测试时可以基于该求解结果进行，不仅可以降低在线投放测试成本，也有利于更有效地转化用户。

其中，所述转化可以指：用户从当前状态向投放方投放权益所期望达到的状态转化。

基于以上整体架构，下面对本说明书的方案进行详细说明。

图2为本说明书实施例提供的一种针对阶梯模型的数据处理方法的流程示意图。该流程可能的执行主体包括但不限于可作为服务器或者终端的以下设备：个人计算机、中型计算机、计算机集群、手机、平板电脑、智能可穿戴设备、车机等。

图2中的流程可以包括以下步骤：

s202：获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度。

在本说明书实施例中，所述多个单权益模型分别对应的单个权益之间可以具有包含关系。从统计学的角度而言，若用户从一个权益获得的利益普遍高于从另一个权益获得的利益，而可以认为所述一个权益包含所述另一个权益。具有包含关系的两种权益优选地可以是同一类权益(比如，均是话费，或者均是现金红包等)，所述两种权益的区别一般在于权益的数值大小。

例如，假定所述多个单权益模型具体为：模型a、模型b、模型c。模型a对应的权益为2元话费，模型b对应的权益为5元话费，模型c对应的权益为10元话费。该例中所述包含关系具体指：10元话费包含5元话费，5元话费包含2元话费。

假定计划要向用户投放2元话费、5元话费、10元话费中的一种。对于用户而言，从10元话费获得的利益要高于5元话费，从5元话费获得的利益要高于2元话费，相应地，在用户转化效果方面，10元话费一般要优于5元话费，5元话费一般要优于2元话费。

为了便于描述，以下某些实施例会沿用该例进行说明。

在说明书实施例中，训练数据由多个训练样本构成，每个训练样本一般分别对应于一个用户。各单权益模型分别有自己的离线的训练数据，这里的离线主要是指这样一种状态：不受服务器在线服务用户所带来的数据变化的影响。单权益模型可以是基于其对应的离线的训练数据预先训练得到的，采用的训练方式通常是有监督训练方式。

进一步地，在训练前，离线的训练数据可以是预先通过一定的方案(比如，随机选择用户投放权益等)，向部分用户投放对应的权益后采集得到的。

在说明书实施例中，离线的训练数据具体可以包括：用于输入对应的单权益模型的用户特征，以及对该单权益模型的目标输出。所述目标输出可以表示：该用户特征所属的用户在被投放该单权益模型对应的权益后，被转化还是未被转化。

例如，训练好的单权益模型可以是一个二分类的预测模型，其接收输入的用户特征进行处理，计算出该用户对于该单权益模型对应的权益的接受度，再将该接受度分类至“被转化”类或者“未转化类”类。一般地，当该接受度高于一定阈值时，被分类至“被转化”类，则相应的预测结果为：若该用户被投放该权益，有较大可能被转化；反之，当该接受度不高于该阈值时，被分类至“未被转化”类，则相应的预测结果为：若该用户被投放该权益，有较大可能不会被转化。为了便于理解，可以近似地认为：接受度越低，则用户转化率越低。

需要说明的是，接受度也可能只是预测用户是否会被转化的依据之一，而未必是唯一依据。

s204：构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户。

在本说明书实施例中，被包含的权益对应的单权益模型的模型优先级高于包含该权益的权益对应的单权益模型的模型优先级。

进一步地，单权益模型可以计算各用户的接受度，并可以优先圈定的接受度高的用户，原因在于接受度高的用户相对容易被转化。

图3为本说明书实施例提供的一种实际应用场景下的阶梯模型原理图。

在图3中，阶梯模型包含上述的模型a、模型b、模型c，各模型会按照箭头所示的优先级顺序圈定用户，用户圈定比例依次表示为：aseg、bseg、cseg。颜色越深表示接受度越高，可以看到，接受度的用户会被优先圈定。

优先级相对高的单权益模型的用户圈定比例越高，则成本相对越低，但是用户转化率也会相对越低。对于权益投放方而言，在总成本预算一定的情况下，往往会追求最大的用户转化率，因此，如何确定阶梯模型对应的各单权益模型的用户圈定比例成为主要的问题。

为了便于理解，用如下数学公式进行说明：

argmax{p1x1+p2x2+...+pnxn},s.t.(公式一)

xi≥0，i＝1,2,...,n；(1)

x1+x2+...+xn＝c1；(2)

m1x1+m2x2+...+mnxn≤c2；(3)

其中，n表示单权益模型的数量，xi表示第i个单权益模型从待投放权益的用户集合中圈定用户的数量，mi为第i个单权益模型对应的权益投放运营活动的人均成本(主要包括第i个单权益模型对应的权益)，c1为待投放权益的用户集合中的用户总数量，c2为权益投放运营活动的总成本预算，pi为xi对应的用户转化率，优化的目标是使权益投放运营活动的用户转化量最大化。

在实际应用中，n、c1、c2、mi均为固定值，如果p也为固定值的话，问题会转化为一个典型的线性规划问题，可以在可行域当中找到一个最优解。然而，p是一个随用户圈定比例变化而变化的密度函数，不易精确求得，为此，本说明书实施例通过近似处理对p进行局部求解，进而基于局部求解，实现对用户圈定比例的近似求解，后面会具体进行说明。

s206：根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

在本说明书实施例中，可以不依赖在线投放测试的结果，而是利用已有的离线的训练数据，对用户圈定比例进行近似求解。如此有利于降低测试成本，快速获取更合理的权益投放方案。

这里的近似可以有两层含义：第一，用离线的训练数据的数据分布来近似待投放权益的用户集合的数据分布；第二，用离线的训练数据对应的离散的接受度来近似连续的接受度，以便于计算用户转化率的密度。

实际运营可以基于该求解结果进行，或者，若求解结果有多种，可以在通过在线投放测试对各求解结果进一步地验证，以选择相对更优的求解结果。

在向用户投放权益时，具体可以将单权益模型对应的权益，向该单权益模型按照近似求解的用户圈定比例在待投放权益的用户集合中圈定的用户投放。

通过图2的方法，由于可以基于预先训练得到的多个单权益模型及其分别对应的离线的训练数据，对阶梯模型中待定的圈定比例进行近似求解，进而可以基于求解结果得到能够更有效转化用户的权益投放方案。

基于图2的方法，本说明书实施例还提供了该方法的一些具体实施方案，以及扩展方案，下面进行说明。

在本说明书实施例中，对于步骤s206，所述根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体可以包括：

根据所述多个单权益模型中的每个单权益模型对应的离线的训练数据，计算该训练数据对应的用户对于该单权益模型对应的权益的接受度；

分别针对所述每个单权益模型计算的所述接受度进行排序，以及根据排序结果划分出设定数量个接受度取值区间；

根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解。

这里划分接受度取值区间的目的主要在于：根据属于该接受度取值区间的训练数据对应的用户转化与否情况，近似地度量该接受度取值区间的区间内用户转化率，进一步地可以用多个接受度取值区间的区间内用户转化率，近似地度量每个单权益模型圈定的全部用户对应的用户转化率(也即，上述的对p进行局部求解)。

例如，对于每个单权益模型，可以将该单权益模型针对其对应的训练数据计算出的接受度进行排序，确定包含被排序的接受度的一个特定取值区间，将该特定取值区间等值地划分为多个接受度取值区间；该特定取值区间的两个端点比如分别可以是：被排序的最小接受度、被排序的最大接受度。

在实际应用中，更粗略地，也可以不划分接受度取值区间，而是直接度量每个单权益模型圈定的全部用户对应的用户转化率，比如，用该全部用户中被转化的用户数除以该全部用户，得到该用户转化率。

前面还提到了步骤s206中的近似可以有的其中一层含义：用离线的训练数据的数据分布来近似待投放权益的用户集合的数据分布。结合图4进行说明。

图4为本说明书实施例提供的对应于图3的基于离线的训练数据近似求解用户圈定比例的原理示意图。

在图4中，圈人投放桶里包含的是待投放权益的用户集合，离线随机a桶里包含的是模型a对应的离线的训练数据，离线随机b桶里包含的是模型b对应的离线的训练数据，离线随机c桶里包含的是模型c对应的离线的训练数据。用渐变色表示用户转化率的密度的变化，颜色越深表示该密度越大。

理论上，要获取该密度比如可以这样做：以离线随机a桶为例，先用模型a计算桶内训练数据对应的接受度并排序，圈定aseg比例的训练数据(也即，训练数据块a1)，再用模型b计算桶内剩余的训练数据对应的接受度并排序，圈定bseg比例的训练数据；再用模型c计算桶内剩余的训练数据对应的接受度并排序，圈定cseg比例的训练数据；再分别估计圈定出的每个训练数据块的用户转化率，进而可以近似求解该密度。需要说明的是，这里是比例都是针对离线随机a桶原有的全部训练数据而言的。

进一步地，从概率学的角度来讲，当离线的训练数据以及待投放权益的用户的数量足够多的时候，a1对应的块内用户转化率往往与线上圈人投放桶内模型a的圈定部分的用户转化率通常具有相同或者接近的分布，因此，可以用a1对应的块内用户转化率的密度来近似线上圈人投放桶内模型a的圈定部分的用户转化率的密度。

更进一步地，在实际应用中，训练出的各单权益模型往往具有相似的分布，因此，以离线随机a桶为例，可以用模型a计算桶内训练数据对应的接受度并排序，直接按照比例[aseg:bseg:cseg]划分而不再用模型b和模型c重新排序以及圈定，可以用划分出的a1对应的块内用户转化率的密度近似线上圈人投放桶内模型a的圈定部分的用户转化率的密度，从而有利于简化计算过程。

类似地，可以用b2对应的块内用户转化率的密度来近似线上圈人投放桶内模型b的圈定部分的用户转化率的密度，可以用c3的用户转化率的密度来近似线上圈人投放桶内模型c的圈定部分的用户转化率的密度。

在本说明书实施例中，所述离线的训练数据可以包括用于输入所述单权益模型的用户特征，以及对该单权益模型的目标输出，所述目标输出表示：该用户特征所属的用户在被投放该单权益模型对应的权益后，被转化还是未被转化；

所述根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体可以包括：

根据每个所述接受度取值区间及其对应的离线的训练数据，计算该接受度取值区间的区间内用户转化率；

基于特定条件，枚举多种用户圈定比例方案，并根据所述区间内用户转化率、预定的待投放权益总量和用户转化目标，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案，作为对所述单权益模型针对所述用户集合的用户圈定比例的近似求解结果；

所述特定条件为：其中，k为所述单权益模型的数量，q等于所述设定数量，segi为非负整数，为第i个所述单权益模型针对所述用户集合的用户圈定比例。

以图3、图4为例。k等于3，该特定条件具体为其中，aseg、bseg、cseg为非负整数，每种用户圈定比例方案至少定义了比例[aseg:bseg:cseg]的一种具体取值。

前面提到，接受度取值区间比如可以是等值划分的，在这种情况下，在圈定用户时，可以使圈定线落在q对应的接受度等值线上，进而，有利于暴力枚举符合该条件的部分甚至全部的用户圈定比例方案，进而根据预定的待投放权益总量(通常为：权益投放运营活动的总成本预算)和用户转化目标(通常为：实现尽量大的用户转化量)，近似求解出较优的用户圈定比例方案。

根据上面结合例子的分析进一步地进行归纳。

在本说明书实施例中，所述根据所述区间内用户转化率、预定的待投放权益总量和用户转化目标，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案，具体可以包括：

分别针对所述多种用户圈定比例方案中的每种用户圈定比例方案，执行：

确定所述多个单权益模型中的每个单权益模型对应的离线的训练数据；

分别针对所述每个单权益模型对应的离线的训练数据，根据该单权益模型对应计算出的接受度进行排序，并在排序后的训练数据中按照该用户圈定比例方案，圈定出各所述单权益模型对应圈定比例的训练数据块；以图3、图4为例，针对模型a对应的离线的训练数据圈定出的训练数据块为a1、a2、a3，针对模型b对应的离线的训练数据圈定出的训练数据块为b1、b2、b3，针对模型c对应的离线的训练数据圈定出的训练数据块为c1、c2、c3；需要说明的是，在同一个单权益模型对应的离线的训练数据中，按照优先级越高的单权益模型对应比例圈定出的训练数据块的接受度越高。

根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率；在实际应用中，未必要计算所有训练数据块的块内用户转化率，以图3、图4为例，计算a1、b2、c3的块内用户转化率即可；

按照该用户圈定比例方案，利用所述多个单权益模型分别从所述用户集合中圈定部分用户，并根据所述块内用户转化率，估计圈定后的所述用户集合的用户转化量；

根据预定的待投放权益总量和用户转化目标，以及分别对所述每种用户圈定比例方案估计的所述用户转化量，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案。

在本说明书实施例中，前面已经提到，可以用划分出的a1对应的块内用户转化率的密度近似线上圈人投放桶内模型a的圈定部分的用户转化率的密度。但是，在实际计算时，依然要随着用户圈定比例的变化多次重新求解，计算效率较低，针对这个问题，可以采用等值切割的数值近似方法，基于区间内用户转化率计算块内用户转化率。

具体地，接受度取值区间优选地可以是等值划分的，所述根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率，具体可以包括：

分别在所述每个单权益模型对应的各所述训练数据块中，确定对应于该单权益模型对应圈定比例的训练数据块；

分别在所述每个单权益模型对应的各所述接受度取值区间中，确定对应于该单权益模型对应圈定比例的训练数据块所属的接受度取值区间，以及计算所述确定的各接受度取值区间的区间内用户转化率的均值，作为对应于该单权益模型对应圈定比例的训练数据块的块内用户转化率。

需要说明的是，上一段中的均值是示例性的，比如，也可以针对确定的各接受度取值区间中包含的训练数据较多的部分接受度取值区间的区间内用户转化率，进行加权求和后作为对应的块内用户转化率。

在本说明书实施例中，所述按照该用户圈定比例方案，利用所述多个单权益模型分别从所述用户集合中圈定部分用户，并根据所述块内用户转化率，估计圈定后的所述用户集合的用户转化量，具体可以包括：

按照所述模型优先级和该用户圈定比例方案，分别采用所述多个单权益模型中的每个单权益模型，在所述用户集合中圈定符合该用户圈定比例方案的用户子集，其中，每次圈定前排除已被圈定的用户，以及利用当前要圈定的单权益模型对所述排除后剩余的用户计算所述接受度并排序，在圈定时优先圈定接受度高的用户；

对于圈定所述用户子集的单权益模型，将该单权益模型对应圈定比例的训练数据块的块内用户转化率作为：该用户子集的子集内用户转化率；

根据各所述用户子集的子集内用户转化率，估计圈定后的所述用户集合的用户转化量。

进一步地，在不超过预定的待投放权益总量的条件下，可以优先选择用户转化量相对大的用户圈定比例方案。

基于同样的思路，本说明书实施例还提供了对应于图2的装置，如图5所示。

图5为本说明书实施例提供的对应于图2的一种针对阶梯模型的数据处理装置的结构示意图，该装置可以位于图2中流程的执行主体上，包括：

获取模块501，获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建模块502，构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

近似求解模块503，根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

可选地，所述近似求解模块503根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体包括：

所述近似求解模块503根据所述多个单权益模型中的每个单权益模型对应的离线的训练数据，计算该训练数据对应的用户对于该单权益模型对应的权益的接受度；

分别针对所述每个单权益模型计算的所述接受度进行排序，以及根据排序结果划分出设定数量个接受度取值区间；

根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解。

可选地，所述离线的训练数据包括用于输入所述单权益模型的用户特征，以及对该单权益模型的目标输出，所述目标输出表示：该用户特征所属的用户在被投放该单权益模型对应的权益后，被转化还是未被转化；

所述近似求解模块503根据所述接受度取值区间，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，具体包括：

所述近似求解模块503根据每个所述接受度取值区间及其对应的离线的训练数据，计算该接受度取值区间的区间内用户转化率；

所述特定条件为：其中，k为所述单权益模型的数量，q等于所述设定数量，segi为非负整数，为第i个所述单权益模型针对所述用户集合的用户圈定比例。

可选地，所述多个单权益模型分别对应的单个权益之间具有包含关系；

被包含的权益对应的单权益模型的模型优先级高于包含该权益的权益对应的单权益模型的模型优先级。

可选地，所述近似求解模块503根据所述区间内用户转化率、预定的待投放权益总量和用户转化目标，从所述多种用户圈定比例方案中选择至少一种用户圈定比例方案，具体包括：

所述近似求解模块503分别针对所述多种用户圈定比例方案中的每种用户圈定比例方案，执行：

确定所述多个单权益模型中的每个单权益模型对应的离线的训练数据；

分别针对所述每个单权益模型对应的离线的训练数据，根据该单权益模型对应计算出的接受度进行排序，并在排序后的训练数据中按照该用户圈定比例方案，圈定出各所述单权益模型对应圈定比例的训练数据块；

根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率；

可选地，所述近似求解模块503根据所述区间内用户转化率，计算所述训练数据块的块内用户转化率，具体包括：

所述近似求解模块503分别在所述每个单权益模型对应的各所述训练数据块中，确定对应于该单权益模型对应圈定比例的训练数据块；

可选地，所述近似求解模块503按照该用户圈定比例方案，利用所述多个单权益模型分别从所述用户集合中圈定部分用户，并根据所述块内用户转化率，估计圈定后的所述用户集合的用户转化量，具体包括：

所述近似求解模块503按照所述模型优先级和该用户圈定比例方案，分别采用所述多个单权益模型中的每个单权益模型，在所述用户集合中圈定符合该用户圈定比例方案的用户子集，其中，每次圈定前排除已被圈定的用户，以及利用当前要圈定的单权益模型对所述排除后剩余的用户计算所述接受度并排序，在圈定时优先圈定接受度高的用户；

对于圈定所述用户子集的单权益模型，将该单权益模型对应圈定比例的训练数据块的块内用户转化率作为：该用户子集的子集内用户转化率；

根据各所述用户子集的子集内用户转化率，估计圈定后的所述用户集合的用户转化量。

基于同样的思路，本说明书实施例还提供了对应的一种电子设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

基于同样的思路，本说明书实施例还提供了对应的一种非易失性计算机存储介质，存储有计算机可执行指令，所述计算机可执行指令设置为：

获取预先训练得到的多个单权益模型及其分别对应的离线的训练数据，所述单权益模型用于计算用户对于单个权益的接受度；

构建阶梯模型，所述阶梯模型表示所述多个单权益模型将按照一定的模型优先级顺序和所述接受度，分别从待投放权益的用户集合中圈定部分用户；

根据所述离线的训练数据，对所述单权益模型针对所述用户集合的用户圈定比例进行近似求解，以便于基于所述阶梯模型向用户投放权益。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书实施例提供的装置、电子设备、非易失性计算机存储介质与方法是对应的，因此，装置、电子设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果，由于上面已经对方法的有益技术效果进行了详细说明，因此，这里不再赘述对应装置、电子设备、非易失性计算机存储介质的有益技术效果。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardwaredescriptionlanguage，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等，目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit，asic)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书实施例可提供为方法、系统、或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：方文静;王力;周俊;高艳艳
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种钻石产品价格信息实时展示系统及方法与流程
上一篇：一种自吸式漩涡泵的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。