预测方法、训练方法、装置、服务器及介质与流程

文档序号:21273938发布日期:2020-06-26 23:07阅读:181来源:国知局
预测方法、训练方法、装置、服务器及介质与流程

本说明书实施例涉及计算机技术领域,尤其涉及一种预测方法、训练方法、装置、服务器及介质。



背景技术:

随着互联网技术的不断发展,在互联网络的应用场景中,每天都会产生大量的数据,为了能够对这些数量庞大的数据进行分析,机器学习作为一种分析手段被广泛应用。集成学习,作为机器学习的一种,能够通过集成多个不同的子模型,来构建一个更好更全面的整体模型,以提升模型整体的泛化性能。



技术实现要素:

本说明书实施例提供一种预测方法、训练方法、装置、服务器及介质。

第一方面,本说明书实施例提供一种样本预测方法,包括:

获取目标业务下的待预测业务样本;

利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;

利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;

根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本的目标业务预测结果。

第二方面,本说明书实施例提供一种预测模型训练方法,包括:

获取目标业务下的预测子模型训练样本集合以及权重子模型训练样本集合;

构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;

基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到多个预测子模型,并基于所述权重子模型训练样本集合以及所述多个预测子模型,对所述初始模型权重子模型进行训练,得到模型权重子模型,以完成预测模型的训练。

第三方面,本说明书实施例提供一种样本预测装置,包括:

特征获取模块,用于获取目标业务下的待预测业务样本;

第一处理模块,用于利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;

第二处理模块,用于利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;

预测模块,用于根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本的目标业务预测结果。

第四方面,本说明书实施例提供一种预测模型训练装置,包括:

数据获取模块,用于获取目标业务下的预测子模型训练样本集合以及权重子模型训练样本集合;

模型构建模块,用于构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;

模型训练模块,用于基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到多个预测子模型,并基于所述权重子模型训练样本集合以及所述多个预测子模型,对所述初始模型权重子模型进行训练,得到模型权重子模型,以完成预测模型的训练。

第五方面,本说明书实施例提供一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行上述任一项所述方法的步骤。

第六方面,本说明书实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。

本说明书实施例有益效果如下:

在本说明书实施例提供的样本预测方法中,将获取的目标业务下的待预测业务样本输入到预测模型中,预测模型中包含有多个预测子模型以及模型权重子模型,其中,利用每个预测子模型对待预测业务样本进行预测,得到每个预测子模型输出的业务预测结果,利用模型权重子模型对待预测业务样本进行处理,输出每个预测子模型对待预测业务样本进行预测时所占的权重,基于每个预测子模型的业务预测结果以及每个预测子模型对待预测业务样本进行预测时所占的权重,确定出待预测业务样本的目标业务预测结果。

上述方案中,通过预测模型对待预测业务样本进行预测时,预测模型中的模型权重子模型能够输出与待预测业务样本相适应的各个预测子模型的权重。对于不同的待预测业务样本,样本的特征也存在差别,本说明书实施例中的方案能够考虑待预测业务样本本身的特征,通过模型权重子模型自适应的调整每个预测子模型的权重,进而使得最终的业务预测结果更加准确可靠。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本说明书的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1为本说明书实施例第一方面提供的一种样本预测方法的流程图;

图2为本说明书实施例第二方面提供的一种预测模型训练方法的流程图;

图3为本说明书实施例第三方面提供的样本预测装置的示意图;

图4为本说明书实施例第四方面提供的预测模型训练装置的示意图;

图5为本说明书实施例第五方面提供的服务器的示意图。

具体实施方式

为了更好的理解上述技术方案,下面通过附图以及具体实施例对本说明书实施例的技术方案做详细的说明,应当理解本说明书实施例以及实施例中的具体特征是对本说明书实施例技术方案的详细的说明,而不是对本说明书技术方案的限定,在不冲突的情况下,本说明书实施例以及实施例中的技术特征可以相互组合。

本说明书实施例提供的样本预测方法,是基于集成学习来进行的,需要说明的是,现有技术在使用集成学习对样本进行预测时,通常是将各个预测子模型的输出进行平均或加权处理,以得到最终的样本预测结果。但现有技术中在进行加权处理时,加权的权重是预先设置好的,即各个预测子模型在最终预测结果中所占的权重是固定的,并不会基于样本本身的特点而改变,这就有可能导致最终的预测结果并不准确。

举例来讲,预测模型中包含有预测子模型a和预测子模型b,通过预测模型分别对不同的样本x和y进行预测。对于样本x来说,预测子模型a的预测结果更加准确,对于样本y来说,预测子模型b的预测结果更加准确。如果对不同样本进行预测时,各个预测子模型在最终预测时所占的权重是固定不变的,则难以做到对不同样本进行可靠的预测,即,对于现有的集成学习的预测模型来说,其预测效果并不理想。

第一方面,本说明书实施例提供一种样本预测方法,可以应用于终端设备中,例如用户的手机、平板电脑等电子设备中,也可以应用于网络侧的服务器中。如图1所示,为本说明书实施例提供的一种样本预测方法的流程图,该方法包括以下步骤:

步骤s12:获取目标业务下的待预测业务样本;

步骤s14:利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;

步骤s16:利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;

步骤s18:根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本在所述预测模型中的目标业务预测结果。

本说明书实施例提供的样本预测方法中,目标业务可以根据实际需要进行选择,例如,目标业务为推荐业务、风险控制业务、信用评估业务等,下面,以支付应用a的目标业务为例,来对本说明书实施例中涉及到的各个业务进行说明。

在目标业务为推荐业务时,可以向应用a的用户推荐权益、广告等资源,例如,应用a可以向其用户推荐备用金、抵用券等权益,有些用户可能会点击领取这些权益,有些用户则不会点击这些权益,因此,可以通过本说明书实施例提供的样本预测方法,预测当前用户是否会点击发放的权益,或者预测当前用户点击权益的概率。再如,应用a可以向用户投放广告,有些用户可能会点击投放的广告,有些用户不会点击投放的广告,通过本说明书实施例的方法预测当前用户是否会点击显示在用户设备上的广告。此时,待预测业务样本可以为应用a的用户,待预测业务样本的特征数据可以包括用户的基本属性、用户历史操作数据、推荐对象的相关数据等。

在目标业务为风险控制业务时,可以通过本说明书实施例的方法预测应用a的用户是否为风险用户,或者预测用户的风险等级,此时,待预测业务样本可以为应用a的用户,待预测业务样本的特征数据可以包括用户基本属性、交易风险数据等。

在目标业务为信用评估业务时,可以通过本说明书实施例的方法预测用户的信用好坏,或者预测用户的信用等级,此时,待预测业务样本可以为应用a的用户,待预测业务样本的特征数据可以包括用户的基本属性、用户信用数据、交易数据等。

当然,本说明书实施例提供的方法还可以应用于其他业务中,例如图像分类预测业务等,这里就不一一举例了。

在得到待预测业务样本之后,将待预测业务样本输入至预测模型中,其中,预测模型是通过集成学习方法构建的模型,预测模型中包含有多个预测子模型以及模型权重子模型。预测子模型的类型可以根据实际需要进行设定,例如,多个预测子模型可以包括神经网络模型、树模型、逻辑回归模型等。模型权重子模型用于根据待预测业务样本,确定出各个预测子模型在最终预测中所占的权重。

在具体实施过程中,将待预测业务样本分别输入到每个预测子模型中,得到每个预测子模型的输出结果,即待预测业务样本在每个预测子模型中的业务预测结果。将待预测业务样本输入到模型权重子模型中,输出与待预测业务样本相对应的每个预测子模型的权重。根据每个预测子模型输出的预测结果,以及每个预测子模型的权重,得到待预测业务样本的最终预测结果,即目标业务预测结果。

由于对于不同的样本,各个预测子模型的预测结果的可靠性也是不同的,例如,有的样本较为稀疏,那么基于神经网络模型的预测结果可能更为可靠,而有的样本较为稠密,基于树模型的预测结果可能更为可靠。本说明书实施例提供的方法,能够充分考虑待预测业务样本的自身特征,通过模型权重子模型确定出与样本特征相适应的一组预测子模型的权重,从而使得最终的业务预测结果更加准确可靠。

本说明书实施例中,预测模型可以通过以下方法进行训练:获取预测子模型训练样本集合以及权重子模型训练样本集合;构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到所述多个预测子模型;基于权重子模型训练样本集合以及所述多个预测子模型,对所述初始模型权重子模型进行训练,得到所述模型权重子模型。

本说明书实施例中,所述预测子模型训练样本集合以及所述权重子模型训练样本集合中的每个样本均包含有目标业务中预设维度下的特征数据以及该样本是否为正样本的标签信息。

具体来讲,预设维度可以是与目标业务相关联的维度,对于不同的目标业务,预设维度可以相同、部分相同或不同,这里不做限定。本说明书实施例中,预设维度可以包括静态特征维度以及动态特征维度,以支付应用a的权益推荐业务为例,应用a的用户数据作为样本。其中,静态特征维度可以包括用户的性别、年龄、职业、产品使用信息(例如是否使用了应用a提供的其他服务等),动态特征可以包括预设时间段内的交易特征、使用某项产品的次数等。

针对预测子模型训练样本集合以及权重子模型训练样本集合中的每个样本,均包含有预设维度下的特征数据以及标签信息,例如,预设维度为d维,则样本的特征数据可以表示为x,其中,x为d×1的向量。

为了更好的理解预测子模型训练样本集合和权重子模型训练样本集合,以目标业务为支付应用a的权益推荐业务为例,可以在应用a的用户中筛选出一定数量的用户,针对每个用户,获得该用户在上述d个维度下的特征数据,以及该样本的标签信息。其中,d个维度可以根据实际需要进行设定,标签信息可以为该用户是否点击了推荐的权益,将点击权益的样本作为正样本,将未点击权益的样本作为负样本。进一步的,将获取到的正样本和负样本按照一定比例划分出预测子模型训练样本集合以及权重子模型训练样本集合。

本说明书实施例中,初始预测模型包括多个初始预测子模型以及初始模型权重子模型,例如,初始预测模型中包含有n个预测子模型,分别表示为m1、m2、…、mn,每个预测子模型的类型可以根据需要进行设置,例如,m1为逻辑回归模型,m2为神经网络模型,mn为树模型。

预测模型的训练过程可以分为两个部分:对多个预测子模型的训练过程以及对权重子模型的训练过程。

对于多个预测子模型的训练过程,可以基于预测子模型训练样本集合对多个初始预测子模型进行训练。具体的,可以根据预测子模型训练样本集合单独对每个初始预测子模型进行训练,也可以根据预测子模型训练样本集合对多个初始预测子模型进行整体训练,这里不做限定。

接下来,通过权重子模型训练样本集合对模型权重子模型进行训练,具体的训练过程可以通过以下步骤实现:

针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到所述每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;

确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;

所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;

其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。

具体来讲,在得到多个训练好的预测子模型之后,针对每个训练好的预测子模型mi,将权重子模型训练样本集合中每个样本的特征数据作为该预测子模型的输入,得到该预测子模型在权重子模型训练样本集合上的预测结果pi,其中,pi为m×1的向量,m为权重子模型训练样本集合中包含的样本总数,pi中的每一位表示该预测子模型对对应位置样本的预测结果。进一步的,将所有预测子模型在权重子模型训练样本集合上的预测结果进行整合,得到矩阵p,其中,p=[p1,p2,…,pn],p为m×n的矩阵,p中的每一列对应一个预测子模型,每一行对应权重子模型训练样本集合中的一个样本,表示预测子模型mi对样本特征数据的预测结果。

在对初始模型权重子模型进行训练时,首先获取初始模型参数,该初始模型参数中的各个参数值可以是随机生成的,或按照默认值设置好的。接下来,执行模型参数调整步骤。具体来讲,在每一轮模型参数调整过程中,针对所述权重子模型训练样本集合中的每个样本,根据该样本在所述预设维度下的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,所述当前模型参数用于将样本的特征数据转换转化成各个预测子模型的模型权重。

应理解的是,当前模型参数所包含的参数个数可以根据实际需要进行设置。由于模型权重子模型的作用为根据不同样本的特征数据,得到与样本相适应的每个预测子模型的权重。因此,本说明书实施例中,当前模型参数可以为一参数矩阵,参数矩阵的行数由多个预测子模型的个数确定,参数矩阵的列数由预设维度的维度数确定。举例来讲,在样本的特征数据为d维向量,预测子模型的个数为n时,可以将当前模型参数表示为n×d的参数矩阵u,并通过多轮迭代训练出最终的参数矩阵u。

本说明书实施例中,将初始模型参数作为当前模型参数,进行多轮模型参数调整,在每轮模型参数调整中,确定出该轮训练中各个预测子模型的权重,并根据各个预测子模型的权重确定出该轮的预测结果,基于预测结果与标签信息之间的误差来调整当前模型参数,并基于调整后的当前模型参数进行下一轮的模型参数调整。

在具体实施过程中,可以通过以下方式获得各个预测子模型的权重:

针对权重子模型训练样本集合中的每个样本,将当前模型参数与该样本的特征数据相乘,得到目标向量,其中,目标向量中的每个元素用于表征对应的预测子模型在该样本的预测过程中所占的重要程度;对目标向量中的每个元素进行平滑处理,得到每个预测子模型对该样本进行预测时的当前模型权重。

具体来讲,针对权重子模型训练样本集合中的样本特征数据,可以根据公式(1)得到与对应的目标向量,以及根据公式(2)得到每个预测子模型对进行预测时的模型权重,公式(1)(2)如下:

(1)

(2)

其中,为d×1的特征数据,u为n×d的参数矩阵,n为预测子模型的个数、d为特征数据的维度数,为n×1的目标向量,中的每个元素用来表示,表示预测子模型mi在的当前预测结果中所占的重要程度。

由于预测子模型的权重需要满足以下条件:每个预测子模型的权重为0~1之间的值,且所有预测子模型的权重之和为1,因此,通过公式(2)来对进行平滑处理,以得到满足上述条件的,其中,i的取值为1~n,表示预测子模型mi在对进行预测时的当前模型权重。

接下来,根据所述每个预测子模型针对该样本的当前模型权重,对所述每个预测子模型针对该样本的预测结果进行加权处理,得到该样本在本轮训练的当前预测结果。在具体实施过程中,可以根据公式(3)计算的当前预测结果

(3)

在得到当前预测结果后,将当前预测结果与对应的标签信息进行比对,获得二者之间的误差,在误差不满足预设误差范围时,可以根据误差对当前的参数矩阵u进行调整,并基于调整后的u再一次重复上述步骤,直到计算得到的当前预测结果与真实的标签信息之间的误差满足预设误差范围时,完成模型权重子模型的训练过程,并将最终调整后的参数矩阵u作为目标模型参数,应用到对待预测业务样本的预测任务中。

进一步的,通过上述步骤训练好预测模型之后,通过预测模型对待预测业务样本进行预测,即,基于所述模型权重子模型的目标模型参数,对所述待预测业务样本在所述预设维度下的特征数据处理,得到所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,其中,所述目标模型参数用于将输入样本的特征数据转化成各个预测子模型的权重。

具体来讲,将待预测业务样本输入到预测模型后,通过每个预测子模型分别输出对待预测业务样本的业务预测结果;并通过模型权重子模型,采用上述公式(1)、(2)对待预测业务样本的特征数据进行处理,得到每个预测子模型的权重。再根据得到的各个预测子模型的权重,对上述每个预测子模型对待预测业务样本的预测结果进行加权处理,得到最终的目标业务预测结果。

为了更好的理解本说明书实施例中的样本预测方法,下面以支付应用a的备用金发放业务为例,来对本方法进行详细说明。

在该实施例中,待预测业务样本的预设维度包括用户的静态特征维度(性别、年龄、职业、会员等级、产品使用信息)、以及用户的动态特征维度(预设时间段内的交易特征、使用某项产品的次数)。

在应用a的用户数据中筛选出一定数量的满足预设条件的数据构成预测子模型训练样本集合以及权重子模型训练样本集合。例如,将会员等级大于预设等级且预设时间段内没有不良交易的用户筛选出来,获取每个用户在预设维度下的特征值构成每个用户的特征数据,同时统计每个用户点击备用金的情况,作为每个用户的标签信息,将点击备用金的用户作为正样本,将没有点击备用金的用户作为负样本。

预测模型中的每个预测子模型的任务均为二分类任务,即确定输入样本是否会点击备用金,每个预测子模型输出的业务预测结果为输入样本为正样本的概率,即,业务预测结果为用户点击备用金的概率,概率越大,用户点击备用金的可能性越大。

基于预测子模型训练样本集合对预测模型中的各个初始预测子模型进行训练,得到训练好的各个预测子模型。然后针对每个训练好的预测子模型,将权重子模型训练样本集合中的每个样本作为输入,得到每个预测子模型在权重子模型训练样本集合上的预测结果pi,进一步获得整合后的矩阵p。接下来进行模型权重子模型的训练,即根据公式(1)(2)(3),经过多轮训练得到模型权重子模型的目标模型参数u。

进一步的,基于训练好的预测模型,将待预测业务样本输入到预测模型中,基于预测模型中的各个预测子模型得到各个预测子模型的业务预测结果,并基于模型权重子模型得到各个预测子模型的权重,然后根据得到的各个预测子模型的权重对各个预测子模型的预测结果进行加权,最终输出待预测业务样本的目标业务预测结果。

另外,为了更好的理解本说明书实施例提供的方法,下面以资源发放业务为例来进行说明。在进行资源发放时,可以包括以下步骤:

获取目标用户的待预测业务样本;

利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的预测结果;

利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;

根据所述待预测业务样本在每个预测子模型中的预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本在所述预测模型中的目标预测结果,所述目标预测结果用于表征所述目标用户是否会领取目标资源;

若所述目标预测结果表明所述目标用户会领取目标资源,向所述目标用户发放所述目标资源。

在该实施例中,目标资源可以是权益、广告等资源,也可以是其他资源,这里不做限定。为了提高资源发放的准确率,在进行目标资源发放时,可以先通过预测模型预测待预测的目标用户是否会领取目标资源,在目标用户会领取目标资源时,才向目标用户发放目标资源,若目标预测结果表明目标用户不会领取目标资源时,则无需向目标用户发放目标资源。

其中,目标预测结果可以为目标用户领取目标资源的概率,若领取概率满足预设概率范围,则表明目标用户会领取目标资源,否则表明目标用户不会领取目标资源。预设概率范围可以根据实际需要进行设定,例如大于85%、大于90%等。

综上所述,本说明书实施例中的样本预测方法,充分考虑到样本本身的特性,根据不同的样本,自适应的调整各个预测子模型在最终业务预测结果中的权重,使得各个预测子模型的权重与样本的特征数据相关联,进而使得最终的业务预测结果更加准确可靠。

第二方面,基于同一发明构思,本说明书实施例提供一种预测模型训练方法,如图2所示,该方法包括以下步骤:

步骤s22:获取目标业务下的预测子模型训练样本集合以及权重子模型训练样本集合;

步骤s24:构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;

步骤s26:基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到多个预测子模型,并基于所述权重子模型训练样本集合,对所述初始模型权重子模型进行训练,得到模型权重子模型,以完成预测模型的训练。

在一种可选实现方式中,所述预测子模型训练样本集合以及所述权重子模型训练样本集合中的每个样本均包含有预设维度下的特征数据以及该样本是否为正样本的标签信息。

在一种可选实现方式中,所述基于所述权重子模型训练样本集合,对所述初始模型权重子模型进行训练,得到模型权重子模型,包括:

针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到所述每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;

确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;

所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;

其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。

在一种可选实现方式中,所述针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果,包括:

针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,所述当前模型参数用于将样本的特征数据转换转化成各个预测子模型的模型权重;

根据所述每个预测子模型针对该样本的当前模型权重,对所述每个预测子模型针对该样本的预测结果进行加权处理,得到该样本的所述当前预测结果。

在一种可选实现方式中,所述当前模型参数为参数矩阵,所述参数矩阵的行数由所述多个预测子模型的个数确定,所述参数矩阵的列数由所述预设维度的维度数确定,所述针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,包括:

针对所述权重子模型训练样本集合中的每个样本,将当前模型参数与该样本的特征数据相乘,得到目标向量,其中,所述目标向量中的每个元素用于表征对应的预测子模型在该样本的预测过程中所占的重要程度;

对所述目标向量中的每个元素进行平滑处理,得到所述每个预测子模型对该样本进行预测时的当前模型。

关于上述方法,其中各个步骤的具体实现已经在本说明书实施例提供的样本预测方法的实施例中进行了详细描述,此处将不做详细阐述说明。

第三方面,基于同一发明构思,本说明书实施例提供一种样本预测装置,请参考图3,该装置包括:

特征获取模块41,用于获取目标业务下的待预测业务样本;

第一处理模块42,用于利用预测模型中的多个预测子模型对所述待预测业务样本进行预测,获得所述待预测业务样本在每个预测子模型中的业务预测结果;

第二处理模块43,用于利用所述预测模型中的模型权重子模型对所述待预测业务样本进行处理,获得所述每个预测子模型对所述待预测业务样本进行预测时所占的权重;

预测模块44,用于根据所述待预测业务样本在每个预测子模型中的业务预测结果,以及所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,确定所述待预测业务样本的目标业务预测结果。

在一种可选实现方式中,所述装置包括:模型训练模块,用于:

根据权重子模型训练样本集合以及所述多个预测子模型,对初始模型权重子模型进行训练,得到所述模型权重子模型。

在一种可选实现方式中,所述训练样本集合以及所述权重子模型训练样本集合中的每个样本均包含有所述目标业务中预设维度下的特征数据以及该样本是否为正样本的标签信息。

在一种可选实现方式中,所述模型训练模块,用于:

针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到所述每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;

确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;

所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;

其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。

在一种可选实现方式中,所述模型训练模块,用于:

针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,所述当前模型参数用于将样本的特征数据转换转化成各个预测子模型的模型权重;

根据所述每个预测子模型针对该样本的当前模型权重,对所述每个预测子模型针对该样本的预测结果进行加权处理,得到该样本的所述当前预测结果。

在一种可选实现方式中,所述当前模型参数为参数矩阵,所述参数矩阵的行数由所述多个预测子模型的个数确定,所述参数矩阵的列数由所述预设维度的维度数确定,所述模型训练模块,用于:

针对所述权重子模型训练样本集合中的每个样本,将当前模型参数与该样本的特征数据相乘,得到目标向量,其中,所述目标向量中的每个元素用于表征对应的预测子模型在该样本的预测过程中所占的重要程度;

对所述目标向量中的每个元素进行平滑处理,得到所述每个预测子模型对该样本进行预测时的当前模型权重。

在一种可选实现方式中,第二处理模块43,用于:

基于所述模型权重子模型的目标模型参数,对所述待预测业务样本在所述预设维度下的特征数据处理,得到所述每个预测子模型对所述待预测业务样本进行预测时所占的权重,其中,所述目标模型参数用于将输入样本的特征数据转化成各个预测子模型的权重。

在一种可选实现方式中,所述多个预测子模型的类型包括以下模型中的一者或多者:神经网络模型、树模型以及逻辑回归模型。

关于上述装置,其中各个模块的具体功能已经在本说明书实施例提供的样本预测方法的实施例中进行了详细描述,此处将不做详细阐述说明。

第四方面,基于同一发明构思,本说明书实施例提供一种预测模型训练装置,请参考图4,该装置包括:

数据获取模块51,用于获取目标业务下的预测子模型训练样本集合以及权重子模型训练样本集合;

模型构建模块52,用于构建初始预测模型,所述初始预测模型包括多个初始预测子模型,以及初始模型权重子模型;

模型训练模块53,用于基于所述预测子模型训练样本集合,对每个初始预测子模型分别进行训练,得到多个预测子模型,并基于所述权重子模型训练样本集合以及所述多个预测子模型,对所述初始模型权重子模型进行训练,得到模型权重子模型,以完成预测模型的训练。

在一种可选实现方式中,所述预测子模型训练样本集合以及所述权重子模型训练样本集合中的每个样本均包含有预设维度下的特征数据以及该样本是否为正样本的标签信息。

在一种可选实现方式中,模型训练模块53,用于:

针对所述权重子模型训练样本集合中的每个样本,将该样本的特征数据分别输入到所述每个预测子模型中进行预测,得到所述每个预测子模型对该样本的预测结果;

确定与所述初始模型权重子模型对应的初始模型参数,将所述初始模型参数作为当前模型参数,并执行模型参数调整步骤;

所述模型参数调整步骤包括:针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据、所述每个预测子模型对该样本的预测结果、以及所述当前模型参数,得到该样本的当前预测结果;在所述当前预测结果与该样本的标签信息之间的误差不满足预设误差范围时,对所述当前模型参数进行调整;将调整后的模型参数作为所述当前模型参数,重复执行所述模型参数调整步骤;

其中,在所述当前预测结果与该样本的标签信息之间的误差满足所述预设误差范围时,将所述当前模型参数作为目标模型参数,以得到所述模型权重子模型。

在一种可选实现方式中,模型训练模块53,用于:

针对所述权重子模型训练样本集合中的每个样本,根据该样本的特征数据,以及所述当前模型参数,得到所述每个预测子模型针对该样本的当前模型权重,所述当前模型参数用于将样本的特征数据转换转化成各个预测子模型的模型权重;

根据所述每个预测子模型针对该样本的当前模型权重,对所述每个预测子模型针对该样本的预测结果进行加权处理,得到该样本的所述当前预测结果。

在一种可选实现方式中,所述当前模型参数为参数矩阵,所述参数矩阵的行数由所述多个预测子模型的个数确定,所述参数矩阵的列数由所述预设维度的维度数确定,模型训练模块53,用于:

针对所述权重子模型训练样本集合中的每个样本,将当前模型参数与该样本的特征数据相乘,得到目标向量,其中,所述目标向量中的每个元素用于表征对应的预测子模型在该样本的预测过程中所占的重要程度;

对所述目标向量中的每个元素进行平滑处理,得到所述每个预测子模型对该样本进行预测时的当前模型。

在一种可选实现方式中,所述多个预测子模型的类型包括以下模型中的一者或多者:神经网络模型、树模型以及逻辑回归模型。

关于上述装置,其中各个模块的具体功能已经在本说明书实施例提供的样本预测方法的实施例中进行了详细描述,此处将不做详细阐述说明。

第五方面,基于与前述实施例中样本预测方法、预测模型训练方法同样的发明构思,本说明书实施例还提供一种服务器,如图5所示,包括存储器404、处理器402及存储在存储器404上并可在处理器402上运行的计算机程序,所述处理器402执行所述程序时实现前文所述样本预测方法、预测模型训练方法中任一方法的步骤。

其中,在图5中,总线架构(用总线400来代表),总线400可以包括任意数量的互联的总线和桥,总线400将包括由处理器402代表的一个或多个处理器和存储器404代表的存储器的各种电路链接在一起。总线400还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口406在总线400和接收器401和发送器403之间提供接口。接收器401和发送器403可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器402负责管理总线400和通常的处理,而存储器404可以被用于存储处理器402在执行操作时所使用的数据。

第六方面,基于与前述实施例中基于样本预测方法、预测模型训练方法的发明构思,本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述样本预测方法、预测模型训练方法中任一方法的步骤。

本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的设备。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令设备的制造品,该指令设备实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本说明书的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本说明书范围的所有变更和修改。

显然,本领域的技术人员可以对本说明书进行各种改动和变型而不脱离本说明书的精神和范围。这样,倘若本说明书的这些修改和变型属于本说明书权利要求及其等同技术的范围之内,则本说明书也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1