用户预测方法、装置、计算设备及计算机存储介质与流程

文档序号:32808594发布日期:2023-01-04 01:30阅读:24来源:国知局
用户预测方法、装置、计算设备及计算机存储介质与流程

1.本技术涉及计算机技术领域,具体涉及一种用户预测方法、装置、计算设备及计算机存储介质。


背景技术:

2.目前,各大网站均推出了付费会员模式,一方面,可以提升平台自身的收益,另一方面,用户购买会员服务后,也能享受更佳的观看体验等。以视频或游戏为例,用户在看视频或者玩游戏时,可能会存在广告,而广告的出现会影响用户的观看体验。各大网站会向用户提供付费免广告等服务,如果能够准确预测潜在的目标用户,便能够有针对性地进行促销信息推送,提高促销成功率。因此,如何准确地挖掘出潜在的目标用户是亟待解决的问题。


技术实现要素:

3.本技术的目的是提供一种用户预测方法、装置、计算设备及计算机存储介质,以解决现有技术存在的潜在目标用户预测不准确等问题。
4.根据本技术实施例的一个方面,提供了一种用户预测方法,包括:
5.获取待预测用户的用户特征数据,用户特征数据包含类别型用户特征数据及连续型用户特征数据;
6.利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一预测处理,得到第一输出结果;
7.利用用户预测模型中的第二模型对连续型用户特征数据进行第一预设处理,生成第一稀疏特征;对类别型用户特征数据进行第二预设处理,生成第二稀疏特征;对第一稀疏特征及第二稀疏特征进行第二预测处理,得到第二输出结果;
8.根据第一输出结果和第二输出结果的组合确定待预测用户是否为目标用户。
9.可选地,根据第一输出结果和第二输出结果的组合确定待预测用户是否为目标用户进一步包括:
10.将第一输出结果和第二输出结果合并后的目标输出结果输入至用户预测模的输出层;
11.输出层根据目标输出结果确定待预测用户对应的预测概率;
12.根据预测概率确定待预测用户是否为目标用户。
13.可选地,根据预测概率确定待预测用户是否为目标用户进一步包括:
14.判断预测概率是否大于或等于预设阈值;
15.若是,则确定待预测用户为目标用户;
16.若否,则确定待预测用户为非目标用户。
17.可选地,对连续型用户特征数据进行第一预设处理,生成第一稀疏特征进一步包括:
18.对连续型用户特征数据进行离散化处理,得到离散化用户特征数据;
19.对离散化用户特征数据进行独热编码处理,生成第一稀疏特征。
20.可选地,对类别型用户特征数据进行第二预设处理,生成第二稀疏特征进一步包括:
21.对类别型用户特征数据进行独热编码处理,生成第二稀疏特征。
22.可选地,用户预测模型训练过程包括:
23.获取样本用户特征数据及对应的标签信息;
24.根据样本用户特征数据及标签信息对第一模型、第二模型进行训练,得到用户预测模型。
25.可选地,根据样本用户特征数据及标签信息对第一模型、第二模型进行训练,得到用户预测模型进一步包括:
26.构建第一模型的决策树,通过决策树将样本用户特征数据按照预设分裂路径进行分裂,得到对应的分裂结果;
27.将分裂增益最大的分裂结果确定为第一输出结果;
28.根据样本用户特征数据对第二模型进行训练,得到第二输出结果;
29.对第一输出结果和第二输出结果的组合进行处理,得到处理结果;
30.计算处理结果与标签信息之间的损失,得到模型损失函数,根据模型损失函数更新第一模型的模型参数及第二模型的模型参数;
31.迭代执行上述步骤,直至迭代次数达到预设迭代次数,和/或,模型损失函数的输出值小于预设阈值,得到用户预测模型。
32.可选地,第二输出结果是经过第二模型嵌入处理后转换得到的稠密向量。
33.根据本技术实施例的另一方面,提供了一种用户预测装置,包括:
34.获取模块,适于获取待预测用户的用户特征数据,用户特征数据包含类别型用户特征数据及连续型用户特征数据;
35.处理模块,适于利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一预测处理,得到第一输出结果;利用用户预测模型中的第二模型对连续型用户特征数据进行第一预设处理,生成第一稀疏特征;对类别型用户特征数据进行第二预设处理,生成第二稀疏特征;对第一稀疏特征及第二稀疏特征进行第二预测处理,得到第二输出结果;
36.确定模块,适于根据第一输出结果和第二输出结果的组合确定待预测用户是否为目标用户。
37.根据本技术实施例的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
38.存储器用于存放至少一可执行指令,可执行指令使处理器执行上述用户预测方法对应的操作。
39.根据本技术实施例的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述用户预测方法对应的操作。
40.根据本技术实施例提供的方案,是利用所有的用户特征数据来进行用户的预测,数据更为丰富,由此可以大大提升预测的准确性;另外,是利用两个模型来进行处理,最终将两个模型的输出结果合并到一起来预测某个用户是否为目标用户,由此预测的结果更为
准确,相比于现有技术中其他预测方式,准确率可以提高8%。
41.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
42.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
43.图1示出了根据本技术中的一个实施例的用户预测方法的流程示意图;
44.图2a示出了根据本技术中的另一个实施例的用户预测方法的流程示意图;
45.图2b为第一模型中样本用户特征数据分裂的示意图;
46.图3示出了根据本技术中的一个实施例的用户预测装置的结构示意图;
47.图4示出了根据本技术中的一个实施例的计算设备的结构示意图。
具体实施方式
48.下面将参照附图更详细地描述本技术的示例性实施例。虽然附图中显示了本技术的示例性实施例,然而应当理解,可以以各种形式实现本技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本技术,并且能够将本技术的范围完整的传达给本领域的技术人员。
49.首先,对本技术一个或多个实施例涉及的名词术语进行解释。
50.gbdt:即梯度提升树,是一种被广泛使用的集成算法模型。
51.神经网络:由神经元组成的一种网络结构,广泛应用于深度算法建模。
52.图1示出了根据本技术中的一个实施例的用户预测方法的流程示意图。
53.如图1所示,该方法包括以下步骤:
54.步骤s101,获取待预测用户的用户特征数据,用户特征数据包含类别型用户特征数据及连续型用户特征数据。
55.具体地,可以利用本实施例提供的用户预测方法来预测任一用户是否为目标用户,目标用户指会发生目标行为的用户,例如,付费行为等。这里将需要进行预测的用户称为待预测用户,针对待预测用户,获取该用户对应的用户特征数据,其中,用户特征数据是用于表征用户特征的数据,例如,可以是表征用户基础信息的数据,表征用户行为的数据等。
56.用户特征数据包含类别型用户特征数据及连续型用户特征数据,类别型用户特征数据是离散化的特征数据,其包含有限的类别数;连续型用户特征数据是指取值可以是连续的特征数据,是在任意两个值之间具有无限个值的数值类数据。例如,类别型用户特征数据包括:性别、居住地、用户兴趣信息、是否为前目标用户;连续型用户特征数据包括:年龄、收入,类别型用户特征数据及连续型用户特征数据还可以包含其他数据,这里仅是举例说明,不具有任何限定作用。
57.步骤s102,利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一
预测处理,得到第一输出结果。
58.本实施例在进行用户预测时,是利用预先训练的用户预测模型来进行处理的,该用户预测模型包括第一模型和第二模型,为了能够提升预测的准确性,这里是利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一预测处理,第一模型会将待预测用户的用户特征数据分到树的叶子节点上,基于用户被分到的叶子节点的位置生成一个向量,即,第一输出结果。第一输出结果可以是对用户特征数据进行处理后的稠密向量。相比于现有技术中第一模型仅能对连续型用户特征数据进行处理,这里所使用的用户特征数据更为丰富,从而使得预测结果的准确性也更高。
59.步骤s103,利用用户预测模型中的第二模型对连续型用户特征数据进行第一预设处理,生成第一稀疏特征;对类别型用户特征数据进行第二预设处理,生成第二稀疏特征;对第一稀疏特征及第二稀疏特征进行第二预测处理,得到第二输出结果。
60.具体地,用户预测模型中的第二模型的输入类型是稀疏特征,而用户特征数据中包含了连续型用户特征数据,连续型用户特征数据同样影响着预测的准确性,因此,为了能够提升预测的准确性,这里是对用户特征数据中的两类数据分别进行了不同的处理,具体地,对连续型用户特征数据进行第一预设处理,生成第一稀疏特征,对类别型用户特征数据进行第二预设处理,生成第二稀疏特征。在经过上述第一预设处理及第二预设处理之后,所有的用户特征数据均转换为稀疏特征,第二模型对第一稀疏特征及第二稀疏特征来进行第二预测处理,通过预测处理来得到针对待预测用户的第二输出结果,第二输出结果可以用向量来表示。
61.步骤s104,根据第一输出结果和第二输出结果的组合确定待预测用户是否为目标用户。
62.在确定了第一输出结果和第二输出结果之后,将第一输出结果和第二输出结果合并,利用合并后的结果来确定待预测用户是否为目标用户。
63.本技术提供的方案,是利用所有的用户特征数据来进行用户的预测,数据更为丰富,由此可以大大提升预测的准确性;另外,用户预测模型由两个模型组成,利用两个模型所组成的用户预测模型来进行处理,最终将两个模型的输出结果合并到一起来预测某个用户是否为目标用户,由此预测的结果更为准确,相比于现有技术中其他预测方式,准确率可以提高8%。
64.图2a示出了根据本技术中的另一个实施例的用户预测方法的流程示意图。如图2a所示,该方法包括以下步骤:
65.步骤s201,获取待预测用户的用户特征数据,用户特征数据包含类别型用户特征数据及连续型用户特征数据。
66.具体地,可以利用本实施例提供的用户预测方法来预测任一用户是否为目标用户,目标用户指会发生目标行为的用户,其中,目标行为可以是付费行为等。这里将需要进行预测的用户称为待预测用户,针对待预测用户,获取该用户对应的用户特征数据,其中,用户特征数据是用于表征用户特征的数据,例如,可以是表征用户基础信息的数据,表征用户行为的数据等。
67.用户特征数据包含类别型用户特征数据及连续型用户特征数据,类别型用户特征数据是离散化的特征数据,其包含有限的类别数;连续型用户特征数据是指取值可以是连
续的特征数据,是在任意两个值之间具有无限个值的数值类数据。例如,类别型用户特征数据包括:性别、居住地、用户兴趣信息、是否为前付费用户;连续型用户特征数据包括:年龄、收入,其中,类别型用户特征数据及连续型用户特征数据还可以包含其他数据,这里仅是举例说明,不具有任何限定作用。
68.步骤s202,利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一预测处理,得到第一输出结果。
69.本实施例在进行用户预测时,是利用预先训练的用户预测模型来进行处理的,该用户预测模型包括第一模型和第二模型,为了能够提升预测的准确性,这里是利用预先训练的用户预测模型中的第一模型对原始的用户特征数据进行第一预测处理,通过处理得到第一输出结果,第一输出结果可以用向量来表示,例如,第一输出结果可以是对用户特征数据进行处理后的稠密向量,其中,第一模型可以是lightgbm模型。相比于现有技术仅能对连续型用户特征数据进行处理,这里所使用的用户特征数据更为丰富,从而使得预测结果的准确性也更高。
70.在本技术一种可选实施方式中,用户预测模型训练过程包括:
71.获取样本用户特征数据及对应的标签信息,其中,标签信息用于标注某个用户是目标用户或非目标用户,例如,可以用1表示目标用户,用0表示非目标用户;样本用户特征数据是已知的目标用户和已知的非目标用户所对应的用户特征数据,作为模型训练数据,需要获取大量的样本用户特征数据,然后,根据样本用户特征数据及标签信息对第一模型、第二模型进行训练,得到用户预测模型。其中,第一模型为lightgbm模型,该模型不仅支持连续型用户特征数据,还支持类别型用户特征数据,使用场景更广,第二模型是神经网络。
72.其中,根据样本用户特征数据及标签信息对第一模型、第二模型进行训练,得到用户预测模型进一步可以通过如下方法来实现:
73.构建第一模型的决策树,通过决策树将样本用户特征数据按照预设分裂路径进行分裂,得到对应的分裂结果;
74.将分裂增益最大的分裂结果确定为第一输出结果;
75.根据样本用户特征数据对第二模型进行训练,得到第二输出结果;
76.对第一输出结果和第二输出结果的组合进行处理,得到处理结果;
77.计算处理结果与标签信息之间的损失,得到模型损失函数,根据模型损失函数更新第一模型的模型参数及第二模型的模型参数;
78.迭代执行上述步骤,直至迭代次数达到预设迭代次数,和/或,模型损失函数的输出值小于预设阈值,得到用户预测模型。
79.具体地,在获取到样本用户特征数据之后,构建第一模型的决策树,模型在每次分裂样本用户特征数据时,会基于最大化分裂增益的原则,计算每个分裂特征和分裂点的增益值并选择最优分裂特征和最优分裂点,直到分裂结束。第一模型通过最大化分裂增益,学习到最优分裂特征和最优分裂点。这些最优分裂特征和最优分裂点组成的树结构就是学习到的数据规律。这就等价于分裂路径对整体样本进行了抽取。如图2b所示,经过是否是男性,是否在18~25岁,是否是前付费用户,可以得到一个分裂增益最大的集合,而这个三个条件的交集就是第一输出结果,即,叶子节点的位置处的用户特征数据所生成的向量即为第一输出结果。
80.样本用户特征数据包含连续型样本用户特征数据和类别型样本用户特征数据,对连续型样本用户特征数据进行第一预设处理,例如,对连续型样本用户特征数据先进行离散化处理,再进行独热编码处理,生成第一稀疏特征;对类别型样本用户特征数据进行第二预设处理,例如,对类别型样本用户特征数据进行独热编码处理生成第二稀疏特征,利用第一稀疏特征及第二稀疏特征对第二模型进行训练,得到第二输出结果。
81.其中,激活函数可以为relu函数,通过relu函数将第一输出结果和第二输出结果的组合转换成在0和1之间的某个数值,该数值为样本用户转换为目标用户的处理结果,即,样本用户进行付费的概率是多少。当然,激活函数还可以是其他函数,这里不做具体限定。在具体实现时,可以是将第一稀疏特征、第二稀疏特征、第一输出结果输入至第二模型进行训练,第二模型对第一输出结果不做处理,而是对第一稀疏特征、第二稀疏特征进行处理,处理后的结果与第一输出结果进行组合输入至输出层,输出层通过激活函数进行处理,得到相应的处理结果。这里是基于反向传播更新第二模型的参数并基于评估指标调优第二模型以及第一模型的参数直到达到预期。
82.然后,计算处理结果与标签信息之间的损失,得到模型损失函数,根据模型损失函数更新第一模型的模型参数及第二模型的模型参数;迭代执行上述步骤,直至迭代次数达到预设迭代次数,和/或,模型损失函数的输出值小于预设阈值,得到用户预测模型。
83.由于lightgbm模型是gbdt类算法,对数据有很强的拟合能力,可以有效记忆数据的相关模式规律,但是这也会导致模型过拟合的风险。对样本进行过度拟合会影响整体模型的泛化能力。
84.以用户付费场景为例,用户是否付费的影响因素很多,具有一定的随机性,波动性,使用gbdt类算法很容易造成过拟合,学习到的内容不是用户本身的付费规律而是噪声。
85.为了解决上述问题,在lightgbm模型训练阶段,对模型加入了正则,降低模型的复杂度,提升模型的鲁棒性。
86.这里主要控制lightgbm模型中决策树的个数以及叶子节点个数,树深,lambda_l1(一个浮点数,表示l1正则化系数,默认为0),lambda_l2(一个浮点数,表示l2正则化系数,默认为0),min_gain_to_split,min_data_to_leaf,min_sum_hessian_in_leaf(一个浮点数,表示一个叶子节点上的最小hessian之和,(也就是叶节点样本权重之和的最小值)默认为1e-3)等参数。这些参数可以有效调整模型的复杂度,改变模型过拟合的风险。
87.首先,确定决策树的个数以及叶子节点个数,例如树的个数为10,叶子节点个数为20。这里认为树的个数和叶子节点个数是最影响整体模型性能的因素,所以使用相较于默认值较小的数值,避免过拟合。
88.然后,其余参数使用网格搜索的方式基于lightgbm在预测集上的表现确定,这里使用auc作为评估指标。
89.最后,lightgbm输出的向量结合第二模型获得整体模型最终效果指标,基于最终指标,可以逐步增加第一步的参数数值直到达到预期。
90.步骤s203,利用用户预测模型中的第二模型对连续型用户特征数据进行离散化处理,得到离散化用户特征数据。
91.具体地,连续型用户特征数据是数值型的,为了能够便于第二模型进行处理,需要先对连续型用户特征数据进行离散化处理,离散化是指将连续特征转化为离散值的方法,
例如,可以采用等频离散或等距离散等方法来对连续型用户特征数据进行离散化处理,具体地离散化处理过程这里不再赘述,通过离散化处理得到离散化用户特征数据。
92.离散化处理具有如下优点:1、稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展;2、离散化后的特征对异常数据有很强的鲁棒性:比如一个特征是年龄》30是1,否则0。如果特征没有离散化,一个异常数据“年龄300岁”会给模型造成很大的干扰;3、特征离散化后,模型会更稳定。
93.可选地,还可以对连续型用户特征数据进行归一化处理,归一化处理主要是将数据映射到0~1范围之内来处理,归一化处理相当于对数据进行缩放,能够提升模型学习效率和性能,例如,可以利用min-max标准化方法或z-score标准化方法来进行归一化处理。
94.步骤s204,对离散化用户特征数据进行独热编码处理,生成第一稀疏特征。
95.在根据步骤s203完成离散化处理后,对离散化用户特征数据进行独热编码处理,即,one-hot编码,又称为一位有效编码,one-hot编码是将数据用二进制向量来表示,首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1。通过独热编码处理,可以生成第一稀疏特征。
96.步骤s205,对类别型用户特征数据进行独热编码处理,生成第二稀疏特征。
97.其中,类别型用户特征数据是一种分类变量,这里是利用one-hot编码对类别型用户特征数据进行独热编码处理,通过独热编码处理生成第二稀疏特征。举例说明,以性别为例,男性经过独热编码处理后表示为10,女性表示为01,这里仅是举例说明,不具有任何限定作用。
98.步骤s206,第二模型对第一稀疏特征及第二稀疏特征进行第二预测处理,得到第二输出结果。
99.通过步骤s205处理之后,所有的用户特征数据均转换为稀疏特征,这里是利用第二模型对第一稀疏特征及第二稀疏特征进行相应的处理,这里是利用第二模型做目标用户的预测,通过处理得到第二输出结果,第二输出结果可以用向量来表示。第二输出结果是经过第二模型嵌入处理后转换得到的稠密向量。
100.第二模型包含嵌入层、隐藏层、全连接层等,嵌入层能够把稀疏特征经过嵌入处理转换成稠密向量,全连接层对转换后的稠密向量进行高阶处理,得到第二输出结果。
101.步骤s207,将第一输出结果和第二输出结果合并后的目标输出结果输入至用户预测模的输出层。
102.在得到第一输出结果和第二输出结果之后,将第一输出结果与第二输出结果进行合并,第一输出结果和第二输出结果是用向量的形式表示,这里是将两个向量组合成一个,得到目标输出结果,用户预测模型包含一输出层,合并后的目标结果被输入至用户预测模型的输出层中。
103.步骤s208,输出层根据目标输出结果确定待预测用户对应的预测概率。
104.其中,输出层中的激活函数根据目标输出结果确定待预测用户对应的预测概率,激活函数可以为relu函数或sigmoid函数,通过激活函数将目标输出结果转换成在0和1之间的某个数值,该数值为待预测用户转换为目标用户的概率,即,待预测用户是目标用户的概率是多少。当然,激活函数还可以是其他函数,这里不做具体限定。
105.步骤s209,根据预测概率确定待预测用户是否为目标用户。
106.在计算得到预测概率后,可以根据预测概率确定待预测用户是否为目标用户,例如,将预测概率与预设阈值进行比较,预设阈值规定了目标用户所对应的最小概率,若预测概率大于或等于预设阈值,则确定待预测用户为目标用户;若预测概率小于预设阈值,则确定待预测用户为非目标用户。
107.本技术提供的方案,是利用lightgbm模型与神经网络组合的方式来进行用户预测,lightgbm模型支持类别型用户特征数据,从而具有更广的使用场景,另外,lightgbm模型相较于其他模型具有更强的记忆能力,在模型训练时能够快速处理并记忆大量历史用户特征数据,而针对神经网络,这里是将连续型用户特征数据及类别型用户特征数据转换成稀疏特征,利用神经网络来对转换得到的稀疏特征进行处理,利用所有的用户特征数据来进行用户的预测,数据更为丰富,由此大大提升了预测的准确性;另外,在预测时,是将lightgbm模型的输出结果与神经网络的输出结果合并到一起来预测某个用户是否为目标用户,由此预测的结果更为准确,相比于现有技术中其他预测方式,准确率可以提高8%。
108.图3示出了根据本技术中的一个实施例的用户预测装置的结构示意图。
109.如图3所示,该装置包括:
110.获取模块301,适于获取待预测用户的用户特征数据,用户特征数据包含类别型用户特征数据及连续型用户特征数据;
111.处理模块302,适于利用预先训练的用户预测模型中的第一模型对用户特征数据进行第一预测处理,得到第一输出结果;利用用户预测模型中的第二模型对连续型用户特征数据进行第一预设处理,生成第一稀疏特征;对类别型用户特征数据进行第二预设处理,生成第二稀疏特征;对第一稀疏特征及第二稀疏特征进行第二预测处理,得到第二输出结果;
112.确定模块303,适于根据第一输出结果和第二输出结果的组合确定待预测用户是否为目标用户。
113.可选地,确定模块进一步适于:将第一输出结果和第二输出结果合并后的目标输出结果输入至用户预测模的输出层;
114.输出层根据目标输出结果确定待预测用户对应的预测概率;
115.根据预测概率确定待预测用户是否为目标用户。
116.可选地,确定模块进一步适于:判断预测概率是否大于或等于预设阈值;
117.若是,则确定待预测用户为目标用户;
118.若否,则确定待预测用户为非目标用户。
119.可选地,处理模块进一步适于:对连续型用户特征数据进行离散化处理,得到离散化用户特征数据;
120.对离散化用户特征数据进行独热编码处理,生成第一稀疏特征。
121.可选地,处理模块进一步适于:对类别型用户特征数据进行独热编码处理,生成第二稀疏特征。
122.可选地,装置还包括:用户预测模型训练模块,适于获取样本用户特征数据及对应的标签信息;
123.根据样本用户特征数据及标签信息对第一模型、第二模型进行训练,得到用户预测模型。
124.可选地,用户预测模型训练模块进一步适于:构建第一模型的决策树,通过决策树将样本用户特征数据按照预设分裂路径进行分裂,得到对应的分裂结果;
125.将分裂增益最大的分裂结果确定为第一输出结果;
126.根据样本用户特征数据对第二模型进行训练,得到第二输出结果;
127.对第一输出结果和第二输出结果的组合进行处理,得到处理结果;
128.计算处理结果与标签信息之间的损失,得到模型损失函数,根据模型损失函数更新第一模型的模型参数及第二模型的模型参数;
129.迭代执行上述步骤,直至迭代次数达到预设迭代次数,和/或,模型损失函数的输出值小于预设阈值,得到用户预测模型。
130.可选地,第二输出结果是经过第二模型嵌入处理后转换得到的稠密向量。
131.本技术提供的方案,是利用所有的用户特征数据来进行用户的预测,数据更为丰富,由此可以大大提升预测的准确性;另外,用户预测模型由两个模型组成,利用两个模型所组成的用户预测模型来进行处理,最终将两个模型的输出结果合并到一起来预测某个用户是否为目标用户,由此预测的结果更为准确,相比于现有技术中其他预测方式,准确率可以提高8%。
132.本技术实施例还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的用户预测方法。
133.图4示出了根据本技术中的一个实施例的计算设备的结构示意图,本技术具体实施例并不对计算设备的具体实现做限定。
134.如图4所示,该计算设备可以包括:处理器(processor)402、通信接口(communications interface)404、存储器(memory)406、以及通信总线408。
135.其中:处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
136.通信接口404,用于与其它设备比如客户端或其它服务器等的网元通信。
137.处理器402,用于执行程序410,具体可以执行上述用户预测方法实施例中的相关步骤。
138.具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
139.处理器402可能是中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本技术实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
140.存储器406,用于存放程序410。存储器406可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
141.程序410具体可以用于使得处理器402执行上述任意方法实施例中的用户预测方法。程序410中各步骤的具体实现可以参见上述用户预测实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
142.在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本技术实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本技术的内容,并且上面对特定语言所做的描述是为了披露本技术的最佳实施方式。
143.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本技术的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
144.类似地,应当理解,为了精简本技术并帮助理解各个发明方面中的一个或多个,在上面对本技术的示例性实施例的描述中,本技术实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本技术要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本技术的单独实施例。
145.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
146.此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本技术的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
147.本技术的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本技术实施例的一些或者全部部件的一些或者全部功能。本技术还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本技术的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
148.应该注意的是上述实施例对本技术进行说明而不是对本技术进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本技术可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实
现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1