行为预测系统的更新方法及装置与流程

文档序号:21878081发布日期:2020-08-18 16:19阅读:202来源:国知局
行为预测系统的更新方法及装置与流程

本说明书实施例涉及计算机技术领域,尤其涉及一种行为预测系统的更新方法及装置。



背景技术:

当今,人们越来越频繁地使用服务平台向用户提供的多种多样的服务,相应地,为了提高用户的服务体验,服务平台可以利用机器学习模型对用户在使用服务时的相关行为进行预测,进而根据预测结果为用户定制服务方案。例如,新闻资讯网站可以通过预测某用户针对各类新闻板块的点击概率,确定向该用户推送的新闻资讯页面中所包括新闻板块的类别和排序。又例如,购物网站可以通过预测某用户针对某一商品的喜好程度,确定是否向该用户推荐该商品。

显然,希望针对用户行为的预测结果越准确越好。然而,目前预测用户行为的方式较为单一,得到的预测结果准确度也十分有限。因此,需要提出一种合理的方案,可以有效提高用户行为预测结果的准确性。



技术实现要素:

在本说明书描述的行为预测系统的更新方法及装置中,基于新设计的行为预测系统,引入丰富、全面的相关数据作为系统输入,从而有效提高预测结果的准确性。

根据第一方面,提供一种行为预测系统的更新方法,上述行为预测系统包括第一预测模型、第二预测模型和注意力模型,上述方法包括:

获取训练样本,上述训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;上述大众偏好特征基于针对上述业务对象采集的历史行为数据而确定,上述历史行为数据由多个用户在第一历史时刻之前产生;上述训练样本中还包括样本标签,指示上述第一用户在上述第一历史时刻之后,是否对上述业务对象做出特定行为。将上述用户特征和上述对象特征,输入上述第一预测模型中,得到第一预测概率。将上述大众偏好特征输入上述第二预测模型中,得到第二预测概率。将上述业务方标识输入上述注意力模型中,得到第一权重。利用第一权重和第二权重,对上述第一预测概率和第二预测概率进行加权求和,得到综合预测概率;其中第二权重与第一权重的和值为预定数值。利用上述综合预测概率和上述样本标签,更新上述行为预测系统中的模型参数。

在一个实施例中,上述用户特征包括用户属性特征和用户行为特征;上述用户属性特征包括以下中的至少一项:性别、年龄、职业、地址、兴趣爱好;上述用户行为特征基于上述第一历史时刻之前采集的用户行为数据而确定,上述用户行为特征包括以下中的至少一项:第一用户做出上述特定行为所对应的若干业务对象、活跃度、消费特征。

在一个实施例中,上述业务对象属于以下中的任一种:内容信息、业务登录界面、商品、服务、用户;其中内容信息的形式包括以下中的至少一种:图片、文本、视频。

在一个实施例中,上述业务对象为第一图片,上述对象特征包括以下中的至少一项:上述第一图片对应的多个像素值,其中各个像素值所对应的像素块个数,上述第一图片中包含的文字内容。

在一个实施例中,上述特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。

在一个实施例中,上述大众偏好特征包括预设时长内上述业务对象所触达的用户中,对上述业务对象做出上述特定行为的用户的占比。

在一个实施例中,上述用户特征和对象特征共同对应若干离散特征值和若干连续特征值;其中,将上述用户特征和对象特征,输入上述第一预测模型中,得到第一预测概率,包括:

对于上述若干离散特征值中任意的第一离散特征值,对其进行独热编码,得到第一独热向量;将得到的对应于上述若干离散特征值的若干独热向量,以及上述若干连续特征值输入上述第一预测模型中,得到第一预测概率。

在一个具体的实施例中,上述第一预测模型为交叉特征网络dcn模型,其中包括嵌入堆叠层、深度交叉网络、深度网络和输出层;其中,将上述若干离散特征值的若干独热向量,以及上述若干连续特征值输入上述第一预测模型中,得到第一预测概率,包括:

在上述嵌入堆叠层中,利用第一降维矩阵,对上述第一独热向量进行降维处理,得到第一降维向量,从而得到对应于上述若干独热向量的若干降维向量,并且,将上述若干降维向量和上述若干连续特征值进行顺序拼接,得到嵌入堆叠向量。在上述交叉网络中,对上述嵌入堆叠向量进行逐层交叉处理,得到交叉表征向量。在上述深度网络中,对上述嵌入堆叠向量进行逐层前向处理,得到深度表征向量。在上述输出层中,对将上述交叉表征向量和深度表征向量进行拼接得到的拼接向量进行处理,得到上述第一预测概率。

在一个实施例中,上述第二预测模型为深度神经网络dnn模型、卷积神经网络cnn模型或逻辑回归lr模型。

在一个实施例中,将上述业务方标识输入上述注意力模型中,得到第一权重,包括:对上述业务方的业务方标识进行独热编码,得到标识独热向量;将上述标识独热向量输入上述注意力模型中,得到上述第一权重。

在一个具体的实施例中,将上述标识独热向量输入上述注意力模型中,得到上述第一权重:在上述注意力模型中,利用嵌入矩阵对上述标识独热向量进行嵌入处理,得到标识嵌入向量;利用学习向量与上述标识嵌入向量进行点积,得到点积值;利用预定函数对上述点积值进行归一化映射处理,得到上述第一权重。

在一个具体的实施例中,上述预定函数为sigmoid函数。

在一个实施例中,利用第一权重和第二权重,对上述第一预测概率和第二预测概率进行加权求和,得到综合预测概率,包括:

将上述第一权重和第一预测概率的乘积,以及上述第二权重和第二预测概率的乘积之间的和值,确定为上述综合预测概率;或者,将上述第一权重和第二预测概率的乘积,以及上述第二权重和第一预测概率的乘积之间的和值,确定为上述综合预测概率。

根据第二方面,提供一种行为预测系统的更新方法,上述行为预测系统包括第一预测模型、第二预测模型和注意力模型,上述方法包括:

获取训练样本,上述训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;上述大众偏好特征基于针对上述业务对象采集的历史行为数据而确定,上述历史行为数据由多个用户在第一历史时刻之前产生;上述训练样本中还包括样本标签,指示上述第一用户在上述第一历史时刻之后,是否对上述业务对象做出特定行为。将上述用户特征和上述对象特征,输入上述第一预测模型中,得到第一预测概率。将上述大众偏好特征输入上述第二预测模型中,得到第二预测概率。将上述业务方标识输入上述注意力模型中,得到第一权重。基于上述第一预测概率和上述样本标签,确定第一预测损失。基于上述第二预测概率和上述样本标签,确定第二预测损失。利用第一权重和第二权重,对上述第一预测损失和第二预测损失进行加权求和,得到综合预测损失;其中第二权重与第一权重的和值为预定数值。利用上述综合预测损失,更新上述行为预测系统中的模型参数。

根据第三方面,提供一种行为预测系统的更新装置,上述行为预测系统包括第一预测模型、第二预测模型和注意力模型,上述装置包括:

样本获取单元,配置为获取训练样本,上述训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;上述大众偏好特征基于针对上述业务对象采集的历史行为数据而确定,上述历史行为数据由多个用户在第一历史时刻之前产生;上述训练样本中还包括样本标签,指示上述第一用户在上述第一历史时刻之后,是否对上述业务对象做出特定行为。第一概率预测单元,配置为将上述用户特征和上述对象特征,输入上述第一预测模型中,得到第一预测概率。第二概率预测单元,配置为将上述大众偏好特征输入上述第二预测模型中,得到第二预测概率。权重预测单元,配置为将上述业务方标识输入上述注意力模型中,得到第一权重。综合概率确定单元,配置为利用第一权重和第二权重,对上述第一预测概率和第二预测概率进行加权求和,得到综合预测概率;其中第二权重与第一权重的和值为预定数值。训练单元,配置为利用上述综合预测概率和上述样本标签,更新上述行为预测系统中的模型参数。

根据第四方面,提供一种行为预测系统的更新装置,上述行为预测系统包括第一预测模型、第二预测模型和注意力模型,上述装置包括:

样本获取单元,配置为获取训练样本,上述训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;上述大众偏好特征基于针对上述业务对象采集的历史行为数据而确定,上述历史行为数据由多个用户在第一历史时刻之前产生;上述训练样本中还包括样本标签,指示上述第一用户在上述第一历史时刻之后,是否对上述业务对象做出特定行为。第一概率预测单元,配置为将上述用户特征和上述对象特征,输入上述第一预测模型中,得到第一预测概率。第二概率预测单元,配置为将上述大众偏好特征输入上述第二预测模型中,得到第二预测概率。权重预测单元,配置为将上述业务方标识输入上述注意力模型中,得到第一权重。第一损失确定单元,配置为基于上述第一预测概率和上述样本标签,确定第一预测损失。第二损失确定单元,配置为基于上述第二预测概率和上述样本标签,确定第二预测损失。综合损失确定单元,配置为利用第一权重和第二权重,对上述第一预测损失和第二预测损失进行加权求和,得到综合预测损失;其中第二权重与第一权重的和值为预定数值。训练单元,配置为利用上述综合预测损失,更新上述行为预测系统中的模型参数。

根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面所描述的方法。

根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面所描述的方法。

在本说明书实施例披露的行为预测系统的更新方法中,通过采用丰富全面的用户个人数据、业务对象信息和大众偏好数据,对新设计的包括第一预测模型、第二预测模型和注意力模型的行为预测系统进行调参,可以得到更新后的行为预测系统,用于预测目标用户是否会对目标业务对象做出特定行为,或者做出特定行为的概率,从而实现对目标用户的精准业务推荐,进而有效提高用户体验。

附图说明

为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1示出根据一个实施例的行为预测系统的系统架构示意图;

图2示出根据一个实施例的行为预测系统的更新方法流程图;

图3示出根据一个示例的预测系统的系统架构示意图;

图4示出根据一个实施例的行为预测系统的更新装置结构图;

图5示出根据另一个实施例的行为预测系统的更新装置结构图。

具体实施方式

下面结合附图,对本说明书披露的多个实施例进行描述。

本说明书实施例披露一种行为预测系统的更新方法,基于此方法进行多次迭代更新后得到的行为预测系统,可以用于预测目标用户是否会对目标业务对象(如广告图片或商品)做出特定行为(如点击行为或购买行为)。

下面先对上述更新方法的发明构思进行介绍。具体地,为了提高用户体验,服务平台需要尽可能向用户推荐符合其需求的业务对象。在一种实施方式中,可以采集大量用户对多个业务对象的历史行为数据,从而通过历史行为数据分析出大量用户对其中各个业务对象的普遍偏好程度,进而之后将普遍偏好程度最高的业务对象推荐给目标用户。然而,在这种实施方式中,因未考虑到目标用户的个性化偏好,因此推荐效果欠佳。

在另一种实施方式中,可以利用机器学习模型预测目标用户是否会对候选业务对象做出特定行为,或者,预测目标用户对该候选业务对象做出特定行为的概率,从而根据预测结果,确定是否向该某个用户推荐该候选业务对象,从而实现向用户推荐符合其需求的业务对象。然而,这种实施方式得到的预测结果的准确度有限,使得推荐效果一般。

基于以上观察和分析,发明人想到,上述预测结果对应的第一预测概率作为反映目标用户个性化偏好,而普遍偏好程度可以反映大量用户的集体偏好(或称大众偏好),由此,可以利用机器学习模型确定反映普遍偏好程度的第二预测概率,进而与第一预测概率进行融合,得到更加贴合目标用户实际需求的综合预测概率。进一步地,在一个实施例中,可以将第一预测概率和第二预测概率直接进行平均,并将得到的平均值作为上述综合预测概率。

但是,发明人还考虑到,通常存在不同的业务对象属于不同业务方的情况,而不同业务方向用户推荐其拥有的业务对象时,推荐力度不一,如推广渠道或流量有多有少,从而导致采集的历史行为数据所反映出的普遍偏好程度是有偏的(如偏高或偏低),尤其是在某些业务对象只在小范围人群内进行推广的情况下,偏颇愈发严重。因此,发明人提出引入注意力机制,结合业务方的标识,对上述第一预测概率和第二预测概率进行打分,进而利用打分权重对两个概率进行加权求和,并将加权求和的概率作为综合预测概率,用于精准反映目标用户是否会对候选业务对象做出上述特定行为,进而实现对目标用户的精准推荐。

在以上对发明构思的介绍中,提及第一预测概率,第二预测概率和打分权重,在本说明书实施例中,这三个方面的数值分别是通过第一预测模型、第二预测模型和注意力模型确定的,这三个模型是上述行为预测系统的主要组成部分。

为便于直观了解,图1示出根据一个实施例的行为预测系统的系统架构示意图。如图1所示,行为预测系统中包括第一预测模型、第二预测模型和注意力模型,在预测用户行为的过程中,一方面,可以将目标用户的用户特征(如性别、兴趣爱好等)和候选业务对象(如广告图片)的对象特征(如图片像素、图片中文字内容等)输入第一预测模型中,得到上述第一预测概率p1;另一方面,可以将基于大量用户的历史行为数据确定出的针对候选业务对象的大众偏好特征(如过去3h内的用户点击率、讨论发帖数量等),输入第二预测模型中,得到上述第二预测概率p2;还一方面,可以将提供候选业务对象的业务方的标识,输入注意力模型中,得到第一权重(如0.3),进而得到第二权重(如0.7),然后利用这两个权重对第一预测概率和第二预测概率进行加权求和,得到上述综合预测概率p,作为对应的预测结果。如此,可以针对同一用户,确定出多个候选业务对象对应的多个综合预测概率,并从中选出最大综合预测概率所对应的候选业务对象,作为目标业务对象推荐给目标用户。如此,可以将广大用户中的各个用户分别作为目标用户,进行精准推荐,使得推荐结果贴合用户实际需求,极大提高用户体验。

需要说明,上述行为预测系统的更新方法和使用方法类似,主要区别在于更新方法中需要将样本标签与预测结果进行比对,进而调整系统中的模型参数,而使用方法中使用的模型参数是调整后的,可以直接输出指导实际应用的预测结果。因此,本说明书实施例择一进行主要说明,具体地,以下主要对更新方法进行说明,使用方法可参照执行。

具体地,图2示出根据一个实施例的行为预测系统的更新方法流程图,其中行为预测系统包括第一预测模型、第二预测模型和注意力模型,所述更新方法的执行主体可以为任何具有计算、处理能力的计算平台、服务器或设备集群。如图2所示,所述方法包括以下步骤:

步骤s210,获取训练样本,该训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;该大众偏好特征基于针对该业务对象采集的历史行为数据而确定,该历史行为数据由多个用户在第一历史时刻之前产生;该训练样本中还包括样本标签,指示该第一用户在该第一历史时刻之后,是否对该业务对象做出特定行为;步骤s220,将该用户特征和该对象特征,输入该第一预测模型中,得到第一预测概率;步骤s230,将该大众偏好特征输入该第二预测模型中,得到第二预测概率;步骤s240,将该业务方标识输入所述注意力模型中,得到第一权重;步骤s250,利用第一权重和第二权重,对上述第一预测概率和第二预测概率进行加权求和,得到综合预测概率;其中第二权重与第一权重的和值为预定数值;步骤s260,利用该综合预测概率和该样本标签,更新该行为预测系统中的模型参数。

针对以上步骤,首先需要说明的是,上述“第一用户”、“第一历史时刻”、“第一预测概率”等中的“第一”,以及“第二预测概率”等中的“第二”,均是为了描述地清楚简洁,用于区分同类事物,不具有其他限定作用。

以上步骤具体如下:

首先,在步骤s210,获取训练样本。需要理解,在单次迭代训练中,获取的训练样本可以为一个或多个。以下基于其中任意一个训练样本,进行示例性描述。

具体地,训练样本中可以包括业务对象的对象特征、该业务对象所属的业务方的标识、大众偏好特征,对应用户(文中或称为第一用户)的用户特征和行为类别标签。

在一个实施例中,上述业务对象可以属于以下中的任一种:内容信息、业务登录界面、业务注册界面、商品、服务、用户。在一个具体的实施例中,其中内容信息的形式包括以下中的至少一种:图片、文本、视频。在一些具体的例子中,业务对象可以是超链接文本(如链接到目标页面的广告文本)、超链接图片(如连接到目标页面的广告图片)、公众号的文章、支付宝登录和注册界面、服装、书籍(电子书或纸质书)、线上生活缴费服务、平台推荐关注的个人用户、公众号或内容领域。需要说明,某个业务对象可以是某一篇文章、某一张广告图片、某一个商品等等,训练样本中的业务对象是指单个业务对象。

在一个实施例中,业务对象的对象特征可以包括业务对象的介绍文本(可以是从网络中爬取或由工作人员输入的)、业务对象id(identity,标识)(例如,可以是系统分配得到的)、其所属的业务类别(如视频播放类、交友类、游戏类等)、其所针对的目标人群(如青年、学生、在职人员等)。在一个具体的实施例中,若业务对象属于内容信息,则其对象特征还可以包括基于所对应的内容信息确定的特征。在一个例子中,业务对象为一篇内容资讯,则其对象特征还可以包括该篇内容资讯的关键词或摘要文本。在另一个例子中,业务对象为某张图片(或称第一图片),该第一图片中包括多个像素,共同对应多个不同的像素值,相应地,该第一图片的对象特征还可以包括多个不同的像素值,以及其中各个像素值所对应的像素块个数。

需要说明,上述业务对象通常由业务方提供给用户,使得用户能够对该业务对象做出上述特定行为。一方面,其中业务方可以是公司、机构、公司品牌、个人自媒体等,上述业务方标识用于唯一标识对应的业务方,业务方标识的组成成分可以包括:汉字字符、英文字母、数字、符号等。在一些具体的示例中,业务标识可以为业务方名称、业务方品牌名称(如饿了么、优酷、蚂蚁聚宝等)、系统为业务方分配的编号等。另一方面,其中特定行为可以包括:点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。其中特定行为可以由工作人员根据业务对象和实际经验进行设定。例如,若业务对象为广告图片,则特定行为可以被设定为点击行为。又例如,若业务对象为商品,则特定行为可以被设定为购买行为。再例如,若业务对象为新闻资讯,则特定行为可以被设定为浏览时长达到预设时长(如5min)。还例如,若业务对象为公众号,则特定行为可以被设定为关注行为。再又例如,若业务对象为应用app,则特定行为可以被设定为登录行为或下载行为或注册行为。

关于上述第一用户的用户特征,在一个实施例中,其中可以包括用户属性特征,如性别、年龄、职业、地址(公司地址、常住地址、物流收货地址、实时位置等)、兴趣爱好(如运动、画画等)。在另一个实施例中,其中可以包括用户行为特征,其基于第一历史时刻之前采集的第一用户的用户行为数据而确定。需要理解,我们可以利用用户过去已做出的行为,预测用户未来的行为,而对于训练样本,其中包含的均为过去的数据,所以用第一历史时刻对特征数据和标签数据进行数据产生时间上的分隔。在一个具体的实施例中,采集的用户行为数据可以包括第一用户在相关业务场景下的数据,例如,第一用户曾经做出上述特定行为所对应的若干业务对象,业务方系统日志中记录的第一用户的登录数据,第一用户的消费数据。相应地,确定出的用户行为特征可以包括上述若干业务对象(如,其中各个业务对象对应的业务对象id、业务方id等),活跃度(如1天之内的平均登录次数等),消费特征(如消费金额、消费品类等)。

关于上述大众偏好特征,其基于针对所述业务对象采集的历史行为数据而确定,所述历史行为数据由多个用户在第一历史时刻之前产生。在一个实施例中,其中历史行为数据可以包括该业务对象所触达用户的第一数量,以及触达用户中对该业务对象做出上述特定行为的第二数量。相应地,该大众偏好特征中可以包括第二数量和第一数量的比值。在一个具体的实施例中,该业务对象为广告图片,其中触达用户可以是终端界面中广告图片得到展示的用户,对应的特定行为可以为点击行为,大众偏好特征可以为点击率(如0.3)。在一个实施例中,历史行为数据中还可以包括大量用户对业务对象做出特定行为以外的其他行为的数据。比如,若特定行为是点击行为,则其他行为可以是关注行为(例如,对业务方或业务方品牌的关注行为),发帖讨论行为(如在论坛或社交平台参与讨论的行为),相应地,大众偏好特征还可以包括具有关注行为的用户的数量,发帖讨论的用户数量或帖子数量。

以上,对训练样本中包含的特征,如业务对象的对象特征、业务对象所述业务方的标识、第一用户的用户特征及大众偏好特征进行介绍。此外,训练样本中还包括样本标签,指示该第一用户在该第一历史时刻之后,是否对该业务对象做出特定行为。在一个实施例中,其中样本标签可以为1或0,其中1表示做出特定行为,0表示未做出特定行为。需要理解,样本标签的内容可以根据实际需要设定,具体不作限定。

以上对获取的训练样本进行介绍。接着,一方面,可以在步骤s220,将上述用户特征和对象特征,输入第一预测模型中,得到第一预测概率。具体地,可以根据上述用户特征和对象特征确定初始特征向量,再将该初始特征向量输入第一预测模型中。

需要理解,上述用户特征和对象特征共同对应若干离散特征和/或若干连续特征,也就会对应若干离散特征值和若干连续特征值。在一个实施例中,对于用户特征中包括的用户性别、职业、住址,以及用户曾做出特定行为的若干业务对象的业务对象id和业务方id,这些特征的取值均可以是离散的,对于用户特征中包括的活跃度,消费金额,这些特征的取值可以是连续的。在一个实施例中,用户特征和对象特征的取值还可以根据实际需要被设定为离散的或连续的,在一个具体的实施例中,假定用户特征中包括交易金额,则交易金额的取值可以是连续的,例如,将交易金额的金额本身(如100元)作为交易金额的取值(如100),或者,交易金额的取值可是离散的,例如,预先建立交易金额的金额本身与备选离散值之间的映射关系,如此可以根据金额本身(如100元)确定出交易金额对应的离散特征值(如4)。

对于上述若干离散特征值中任意的第一离散特征值,可以对其进行独热编码(one-hotendoding),得到第一独热向量;然后,对上述得到的对应于所述若干离散特征值的若干独热向量,以及所述若干连续特征值进行拼接(按照预定顺序),并将拼接后的向量作为上述初始特征向量,输入上述第一预测模型中。

由此,上述第一预测模型可以对输入其中的初始特征向量进行处理,从而输出上述第一预测概率。在一个实施例中,上述第一预测模型为图3中示出交叉特征网络(deep&crossnetwork,简称dcn)模型310,其中包括嵌入堆叠层(embeddingandstackinglayer)311、交叉网络(crossnetwork)312、深度网络(deepnetwork)313和输出层314。首先需要说明,初始特征向量包括上述若干独热向量和若干连续特征值组成,嵌入堆叠层311可以从其中选择一组或单个数值进行处理,为便于直观理解,以下沿用上述第一独热向量和连续特征值的概念进行描述。具体地,dcn模型310对初始特征向量的处理可以包括:

首先在嵌入堆叠层311中,利用第一降维矩阵对上述第一独热向量进行降维处理,得到第一降维向量。需要说明,不同独热向量的维数可能相同也可能不同,但不同独热向量对应的降维矩阵通常是不同的。不妨用表示第i个离散特征的独热向量,用标识第i个降维矩阵,则第i个降维向量可以表示为也就是本层对第i个离散特征的嵌入表征。

如此,可以得到对应于上述若干独热向量的若干降维向量,进一步地,将该若干降维向量和上述若干连续特征值拼接起来,得到嵌入堆叠向量作为嵌入堆叠层311的输出,其中k表示上述若干离散特征的总数,对应上述若干连续特征值组成的向量。

然后,一方面,在交叉网络312中对上述嵌入堆叠向量进行逐层交叉处理,得到交叉表征向量。具体地,交叉网络312提供一个自动学习交叉特征重要性的方式,由多个交叉层组成,每个交叉层之间的关系满足下列公式:

(1)

公式(1)中,表示第个交叉层,表示上述嵌入堆叠向量,分别表示第个交叉层的输入向量和输出向量,表示第个交叉层中的偏置向量,

如此,可以得到最后一个交叉层输出的向量,作为交叉网络312输出的交叉表征向量。

另一方面,在深度网络313中,对上述嵌入堆叠向量进行逐层前向处理,得到深度表征向量。具体地,深度网络313可以是一个全连接的神经网络,每层满足下列公式:

(2)

公式(2)中,其中表示第个隐层,表示relu激活函数,表示第个隐层的权重矩阵,表示第个隐层中的偏置向量,分别表示第个隐层的输入向量和输出向量。

如此,可以得到最后一个隐层输出的向量,作为深度网络313输出的深度表征向量。

进一步地,在输出层314中,可以将上述交叉表征向量和深度表征向量进行拼接得到的拼接向量进行处理,得到上述第一预测概率。具体地,可以通过sigmoid函数计算出第一预测概率,即:

(3)

其中,表示输出层中的权重向量,表示sigmoid函数。

如此,可以通过将上述第一预测模型实现为上述dcn模型,得到上述第一预测概率p1。

在另一个实施例中,上述第一预测模型还可以实现为深度神经网络(deepneuralnetworks,简称dnn)模型,或卷积神经网络(convolutionalneuralnetworks,简称cnn)模型等。

由上,在步骤s220中,通过将训练样本中的用户特征和对象特征,输入第一预测模型中,得到第一预测概率。在一种可能的实施方式中,也可以将大众偏好特征与用户特征和对象特征共同输入第一预测模型中。需要理解,第一预测概率主要是从用户的个人偏好角度,推测第一用户会对上述业务对象做出特定行为的可能性。

另一方面,在步骤s230,将上述训练样本中的大众偏好特征输入第二预测模型中,得到第二预测概率。其中,大众偏好特征可以是一个数值,或者,通常是一个多维向量。在一个示例中,大众偏好特征可以包括根据大量用户的历史行为数据统计出的点击率。进一步地,其中点击率可以是分时段统计的,例如,最近3小时以内,3小时以前6小时以内、6小时以前9小时以内,进而将这些时段的点击率组成多维向量。需要说明,对大众偏好特征的描述还可以参见前文,不作赘述。

在一个实施例中,其中第二预测模型可以是dnn模型、cnn模型或逻辑回归(logisticsregression,简称lr)模型。在一个具体的实施例中,第二预测模型可以是图3中示出的dnn模型320,其中输出层对在前的隐层输出的表征向量进行处理,得到第二预测概率p2。具体地,可以通过sigmoid函数计算出第二预测概率p2,即:

(4)

其中,表示dnn模型320包含的输出层中的权重向量,表示sigmoid函数。

如此,可以得到第二预测概率。需要理解,第二预测概率是从大众或广大用户的角度,分析第一用户可能会对上述业务对象做出特定行为的可能性。

再一方面,可以通过注意力模型,计算分配给上述第一预测概率和第二预测概率的权重。具体地,在步骤s240,将所述业务方标识输入所述注意力模型中,得到第一权重。

在一个实施例中,本步骤中可以包括:对业务方标识进行独热编码,得到对应的标识独热向量,再将标识独热向量输入注意力模型中,得到第一权重。需要理解,注意力模型是指该机器学习模型借鉴了注意力机制的思想。在一个实施例中,注意力模型可以通过dnn网络、cnn网络等实现。在一个具体的实施例中,注意力模型330中包括图3中示出的嵌入层331和输出层332。在嵌入层331中,利用嵌入矩阵对标识独热向量进行嵌入表征:

(5)

公式(5)中,表示标识独热向量,具体可以是业务方标识对应的独热编码向量;表示标识嵌入向量。

然后,在输出层332,利用该层的学习向量与标识嵌入向量进行点乘(或称点积);或者,学习向量是列向量,标识嵌入向量是行向量,二者可以通过矩阵乘法直接相乘。进而利用预定函数对乘积结果对应的数值进行归一化映射处理,并将处理得到的数值作为第一权重。可以理解,其中归一化映射处理是指把一个数值映射为区间[0,1]中的一个数值。在一个实施例中,其中预定函数可以取值区间在[0,1]内的分段函数。在另一个实施例中,其中预定函数可以是取值区间在[0,1]内的单调函数,如可以是sigmoid函数。在一个具体的实施例中,输出层332对标识嵌入向量的处理可以表示为以下公式:

(6)

公式(5)中,表示输出层332中的权重向量;表示标识嵌入向量,表示第一权重,表示sigmoid函数。

在另一个实施例中,本步骤中可以包括:通过查阅映射表,确定业务标识对应的标识嵌入向量,再将标识嵌入向量输入注意力模型中。具体地,其中查阅的映射表中可以包括多个业务方标识中各个业务方标识对应的嵌入向量,此表格可以是预先训练得到的,其训练过程与词嵌入向量的确定过程类似,具体地,可以通过预先采集一些包括各个业务方标识的训练语料,并将其中各个业务方标识(如业务方名称)作为各个词语,再采用词嵌入训练的方式,确定出对应的词嵌入向量,也就得到与各个业务方标识对应的标识嵌入向量。如此,可以将具有丰富语义的标识嵌入向量输入注意力模型中,得到准确性和可用性较高的第一权重。

以上可以确定出第一权重。进一步地,可以在步骤s250,利用第一权重和第二权重,对上述第一预测概率和第二预测概率进行加权求和,得到综合预测概率;其中第二权重与第一权重的和值为预定数值。其中预定数值可以是任意数值,通常会设定为正数,例如,1。

在一个实施例中,本步骤中可以包括:将上述第一权重和第一预测概率的乘积,以及上述第二权重和第二预测概率的乘积之间的和值,确定为上述综合预测概率。具体可以用如下公式表示:

p=w1p1+w2p2(7)

公式(7)中,p表示综合预测概率,w1和w2分别表示第一权重和第二权重,p1和p2分别表示第一预测概率和第二预测概率。

根据一个具体的例子,假定第一权重为0.6,预定数值为1,第一预测概率和第二预测概率分别为0.5和0.6,此时,可以求出综合预测概率为0.54。

在另一个实施例中,本步骤中可以包括:将上述第一权重和第二预测概率的乘积,以及上述第二权重和第一预测概率的乘积之间的和值,确定为上述综合预测概率。

由上,可以确定出综合预测概率,然后可以在步骤s260,根据该综合预测概率和上述样本标签,更新该业务系统中的模型参数。在一个实施例中,可以根据该综合预测概率和样本标签,确定预测损失,再根据预测损失调整业务系统中三个模型的模型参数,例如,可以采用反向传播法进行调整。在一个具体的实施例中,可以采用铰链损失函数或交叉熵损失函数,计算上述预测损失。在一个例子中,具体可采用以下公式计算预测损失:

(8)

公式(8)中,loss表示预测损失,n表示一次训练中使用的样本数量(batch_size),i表示样本编号,yi表示第i个样本的样本标签。

基于确定出的预测损失,可以实现对第一预测模型、第二预测模型和业务预测模型的调参。

由上,通过执行步骤s210至步骤s260,可以实现对上述行为预测系统的参数更新。如此,通过重复执行上述流程,可以实现对行为预测系统的多次迭代,直到迭代至预定次数或模型收敛(例如,预设的模型性能指标达到预设标准),进而可以将最后一次迭代得到行为预测系统,作为最终使用的行为预测系统,用于预测目标用户是否会对目标业务对象做出特定行为,或者做出特定行为的概率。

综上,在本说明书实施例披露的行为预测系统的更新方法中,通过采用丰富全面的用户个人数据、业务对象信息和大众偏好数据,对新设计的包括第一预测模型、第二预测模型和注意力模型的行为预测系统进行调参,可以得到更新后的行为预测系统,用于预测目标用户是否会对目标业务对象做出特定行为,或者做出特定行为的概率,从而实现对目标用户的精准业务推荐,进而有效提高用户体验。

根据另一方面的实施例,在上述步骤s240之后,上述步骤s250和260可以被替换为:先基于上述第一预测概率和样本标签,确定第一预测损失,并且,基于上述第二预测概率和样本标签,确定第二预测损失;再利用第一权重和第二权重,对该第一预测损失和第二预测损失进行加权求和,得到综合预测损失,其中第二权重与第一权重的和值为预定数值;进一步地,利用该综合预测损失,更新所述行为预测系统中的模型参数。

首先需要说明,其中对第二权重和预定数值,以及对利用综合预测损失对系统进行调参的介绍,可以参见前述实施例中的相关描述。

在一个实施例中,其中第一预测损失和第二预测损失,可以基于铰链损失函数或交叉熵损失函数计算得到。在一个具体的实施例中,第一预测模型和第二预测模型分别为dcn模型和dnn模型,并且,第一预测损失和第二预测损失分别采用以下公式(9)和(10)计算得到:

公式(9)中,表示第一预测模型(实现为dcn模型)的第一预测损失,表示样本编号,表示第个样本对应的第一预测概率,表示第个样本的样本标签,表示网络层数,表示dcn模型中第层网络的网络参数;表示正则系数,为超参,例如可以设定为0.002。

公式(10)中,表示第二预测模型(实现为dnn模型)的第二预测损失,表示样本编号,表示第个样本对应的第二预测概率,表示第个样本的样本标签,表示网络层数,表示dnn模型中第层网络的网络参数;表示正则系数,为超参,例如可以设定为0.001。

进一步地,利用第一权重和第二权重,对该第一预测损失和第二预测损失进行加权求和,得到综合预测损失。具体地,第一权重被分配给第一预测损失,第二权重被分配给第二预测损失,反之亦可。需要理解,若第一权重被分配给第一预测损失,则在行为预测系统的使用阶段,第一权重被对应分配给第一预测概率。

在一个具体的实施例中,承接上述公式(9)和(10),可以利用以下公式(11)计算综合预测损失:

(11)

公式(11)中,loss表示综合预测损失,n表示一次训练中使用的样本数量(batch_size),其余符号可以参见对公式(9)和(10)的描述。

如此,可以确定出综合预测损失,进而利用该综合预测损失,更新上述行为预测系统中的模型参数。

综上,在本说明书实施例披露的行为预测系统的更新方法中,通过采用丰富全面的用户个人数据、业务对象信息和大众偏好数据,对新设计的包括第一预测模型、第二预测模型和注意力模型的行为预测系统进行调参,可以得到更新后的行为预测系统,用于预测目标用户是否会对目标业务对象做出特定行为,或者做出特定行为的概率,从而实现对目标用户的精准业务推荐,进而有效提高用户体验。

与上述更新方法相对应的,本说明书实施例还披露一种更新装置。具体如下:

图4示出根据一个实施例的行为预测系统的更新装置结构图,其中行为预测系统包括第一预测模型、第二预测模型和注意力模型。如图4所示,装置400中包括:

样本获取单元410,配置为获取训练样本,该训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;该大众偏好特征基于针对该业务对象采集的历史行为数据而确定,该历史行为数据由多个用户在第一历史时刻之前产生;该训练样本中还包括样本标签,指示该第一用户在该第一历史时刻之后,是否对该业务对象做出特定行为。第一概率预测单元420,配置为将该用户特征和该对象特征,输入该第一预测模型中,得到第一预测概率。第二概率预测单元430,配置为将该大众偏好特征输入该第二预测模型中,得到第二预测概率。权重预测单元440,配置为将该业务方标识输入该注意力模型中,得到第一权重。综合概率确定单元450,配置为利用第一权重和第二权重,对该第一预测概率和第二预测概率进行加权求和,得到综合预测概率;其中第二权重与第一权重的和值为预定数值。训练单元460,配置为利用该综合预测概率和该样本标签,更新该行为预测系统中的模型参数。

在一个实施例中,该用户特征包括用户属性特征和用户行为特征;该用户属性特征包括以下中的至少一项:性别、年龄、职业、地址、兴趣爱好;该用户行为特征基于该第一历史时刻之前采集的用户行为数据而确定,该用户行为特征包括以下中的至少一项:第一用户做出该特定行为所对应的若干业务对象、活跃度、消费特征。

在一个实施例中,该业务对象属于以下中的任一种:内容信息、业务登录界面、商品、服务、用户;其中内容信息的形式包括以下中的至少一种:图片、文本、视频。

在一个实施例中,该业务对象为第一图片,该对象特征包括以下中的至少一项:该第一图片对应的多个像素值,其中各个像素值所对应的像素块个数,该第一图片中包含的文字内容。

在一个实施例中,该特定行为包括点击行为、浏览达到预设时长的行为、注册行为、登录行为、购买行为和关注行为。

在一个实施例中,该大众偏好特征包括预设时长内该业务对象所触达的用户中,对该业务对象做出该特定行为的用户的占比。

在一个实施例中,该用户特征和对象特征共同对应若干离散特征值和若干连续特征值;其中第一概率预测单元420包括:特征独热编码模块421,配置为对于该若干离散特征值中任意的第一离散特征值,对其进行独热编码,得到第一独热向量;概率预测模块422,配置为将得到的对应于该若干离散特征值的若干独热向量,以及该若干连续特征值输入该第一预测模型中,得到第一预测概率。

在一个具体的实施例中,该第一预测模型为交叉特征网络dcn模型,其中包括嵌入堆叠层、深度交叉网络、深度网络和输出层;其中概率预测模块422具体配置为:

在该嵌入堆叠层中,利用第一降维矩阵,对该第一独热向量进行降维处理,得到第一降维向量,从而得到对应于该若干独热向量的若干降维向量,并且,将该若干降维向量和该若干连续特征值进行顺序拼接,得到嵌入堆叠向量。在该交叉网络中,对该嵌入堆叠向量进行逐层交叉处理,得到交叉表征向量。在该深度网络中,对该嵌入堆叠向量进行逐层前向处理,得到深度表征向量。在该输出层中,对将该交叉表征向量和深度表征向量进行拼接得到的拼接向量进行处理,得到该第一预测概率。

在一个实施例中,该第二预测模型为深度神经网络dnn模型、卷积神经网络cnn模型或逻辑回归lr模型。

在一个实施例中,该权重预测单元440包括:标识独热编码模块441,配置为对该业务方的业务方标识进行独热编码,得到标识独热向量;权重预测模块442,配置为将该标识独热向量输入该注意力模型中,得到该第一权重。

在一个具体的实施例中,该权重预测模块442具体配置为:在该注意力模型中,利用嵌入矩阵对该标识独热向量进行嵌入处理,得到标识嵌入向量;利用学习向量与该标识嵌入向量进行点积,得到点积值;利用预定函数对该点积值进行归一化映射处理,得到该第一权重。

在一个实施例中,该预定函数为sigmoid函数。

在一个实施例中,综合概率确定单元450具体配置为:将该第一权重和第一预测概率的乘积,以及该第二权重和第二预测概率的乘积之间的和值,确定为该综合预测概率;或者,将该第一权重和第二预测概率的乘积,以及该第二权重和第一预测概率的乘积之间的和值,确定为该综合预测概率。

图5示出根据另一个实施例的行为预测系统的更新装置结构图,其中行为预测系统包括第一预测模型、第二预测模型和注意力模型。如图5所示,所述装置500包括:

样本获取单元510,配置为获取训练样本,该训练样本中包括第一用户的用户特征,大众偏好特征,业务对象的对象特征及其所属业务方的业务方标识;该大众偏好特征基于针对该业务对象采集的历史行为数据而确定,该历史行为数据由多个用户在第一历史时刻之前产生;该训练样本中还包括样本标签,指示该第一用户在该第一历史时刻之后,是否对该业务对象做出特定行为。第一概率预测单元520,配置为将该用户特征和该对象特征,输入该第一预测模型中,得到第一预测概率。第二概率预测单元530,配置为将该大众偏好特征输入该第二预测模型中,得到第二预测概率。权重预测单元540,配置为将该业务方标识输入该注意力模型中,得到第一权重。第一损失确定单元550,配置为基于该第一预测概率和该样本标签,确定第一预测损失。第二损失确定单元560,配置为基于该第二预测概率和该样本标签,确定第二预测损失。综合损失确定单元570,配置为利用第一权重和第二权重,对该第一预测损失和第二预测损失进行加权求和,得到综合预测损失;其中第二权重与第一权重的和值为预定数值。训练单元580,配置为利用该综合预测损失,更新该行为预测系统中的模型参数。

如上,根据又一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。

根据又一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1