数据处理方法、电子设备及存储介质与流程

文档序号：31457806发布日期：2022-09-07 15:06阅读：59来源：国知局

1.本技术涉及机器学习技术领域，尤其涉及一种数据处理方法、电子设备及存储介质。

背景技术：

2.在推荐任务中，主要目的旨在预测出用户感兴趣的待推荐资源并推送至用户终端，以提高推荐任务的有效推荐率。例如，预测用户感兴趣的短视频并对该短视频进行推荐，从而提高用户对短视频的点击率和观看率。现有预测方式通常是构建预测模型以对用户相关属性和待推荐资源相关属性进行联合预测。然而，该方式下，仅通过前述两种属性直接进行预测，使得参与预测过程的特征较少，导致推荐预测效率和准确率不高。因此，如何提高对待推荐资源的推荐预测效率和准确率成为一个亟待解决的问题。

技术实现要素：

3.本技术实施例提供了一种数据处理方法、电子设备及存储介质，可以有效地提高对待推荐资源的推荐预测效率和准确率。
4.一方面，本技术实施例提供了一种数据处理方法，该方法包括：
5.获取推荐信息集合；该推荐信息集合包括目标对象的对象属性信息和对象行为信息、待推荐资源的资源属性信息和资源行为信息；
6.根据推荐信息集合生成推荐特征集合；该推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征以及资源行为信息的资源行为特征；
7.根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子；
8.根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征；
9.根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。
10.一方面，本技术实施例提供了一种数据处理装置，该装置包括：
11.获取模块，用于获取推荐信息集合；该推荐信息集合包括目标对象的对象属性信息和对象行为信息、待推荐资源的资源属性信息和资源行为信息；
12.处理模块，用于根据推荐信息集合生成推荐特征集合；该推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征以及资源行为信息的资源行为特征；
13.确定模块，用于根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子；
14.确定模块，还用于根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征；
15.确定模块，还用于根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。
16.一方面，本技术实施例提供了一种电子设备，该电子设备包括处理器和存储器，其中，存储器用于存储计算机程序，该计算机程序包括程序指令，处理器被配置用于调用该程序指令，执行上述方法中的部分或全部步骤。
17.一方面，本技术实施例提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序包括程序指令，该程序指令被处理器执行时，用于执行上述方法中的部分或全部步骤。
18.相应地，根据本技术的一个方面，提供了一种计算机程序产品或者计算机程序，该计算机程序产品或计算机程序包括程序指令，该程序指令被处理器执行时实现上述方法中的部分或全部步骤。
19.本技术实施例中，可以根据推荐信息集合生成推荐特征集合，根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子，根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征，根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至对象终端。通过上述方法，不仅可以结合更多的特征信息确定目标概率，还可以通过影响因子对对象行为特征和资源行为特征进行特征选择以确定在预测过程中更适配的目标行为特征，因此可以提高对待推荐资源的推荐预测效率和准确率，进而有利于提升后续基于目标概率进行推荐的效果。
附图说明
20.为了更清楚地说明本技术实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
21.图1为本技术实施例提供的一种应用架构示意图；
22.图2为本技术实施例提供的一种数据处理方法的流程示意图；
23.图3a为本技术实施例提供的一种待推荐资源的示意图；
24.图3b为本技术实施例提供的一种待推荐资源的示意图；
25.图3c为本技术实施例提供的一种待推荐资源的示意图；
26.图4为本技术实施例提供的一种数据处理方法的流程示意图；
27.图5a为本技术实施例提供的一种确定推荐特征集合的场景示意图；
28.图5b为本技术实施例提供的一种确定推荐特征集合的场景示意图；
29.图5c为本技术实施例提供的一种确定推荐特征集合的场景示意图；
30.图6a为本技术实施例提供的一种基于目标预测模型的特征提取场景示例图；
31.图6b为本技术实施例提供的一种基于目标预测模型的特征提取场景示例图；
32.图6c为本技术实施例提供的一种基于目标预测模型的特征提取场景示例图；
33.图7为本技术实施例提供的一种基于目标预测模型的待推荐资源的推送场景示意图；
34.图8为本技术实施例提供的一种数据处理方法的流程示意图；
35.图9a为本技术实施例提供的一种模型训练的场景示意图；
36.图9b为本技术实施例提供的一种预测模型的示意图；
37.图10为本技术实施例提供的一种数据处理装置的结构示意图；
38.图11为本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
39.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述。
40.本技术实施例提出的数据处理方法实现于电子设备，该电子设备可以是服务器，也可以是终端。其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表智能语音交互设备、智能家电、车载终端、飞行器等，但并不局限于此。
41.在一些实施例中，请参见图1，图1为本技术实施例提供的一种应用架构示意图，可以通过该应用架构执行本技术所提出的数据处理方法。如图1所示，可以包括电子设备、目标对象的对象终端；其中，目标对象可以是目标应用的使用者(如用户)；电子设备可以根据目标对象和待推荐资源获取推荐信息集合并生成推荐特征集合，该推荐特征集合包括目标对象的相关推荐特征(比如可以为对象属性特征和对象行为特征)以及待推荐资源的相关推荐特征(比如可以为资源属性特征和资源行为特征)，根据推荐特征集合进行特征选择以确定目标推荐特征集合，比如可以是根据对象属性特征和资源属性特征对对象行为特征和资源行为特征进行特征选择以确定目标对象行为特征和目标资源行为特征，该目标推荐特征集合包括了对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征，并根据目标推荐特征集合确定目标对象对待推荐资源响应推荐行为的目标概率；后续可以按照该目标概率确定对待推荐资源的推荐策略，并基于推荐策略进行推送。可选地，上述过程还可以通过目标预测模型执行，比如电子设备中可以部署目标预测模型，在该目标预测模型中通过推荐信息集合生成推荐特征集合，并根据该推荐特征集合得到目标概率。
42.可以理解的是，图1只是示例性地表征本技术技术方案的可能存在的应用架构，并不对本技术技术方案的具体架构进行限定，即本技术技术方案还可以提供其他形式的应用架构。
43.可选地，在一些实施例中，电子设备可根据实际的业务需求，执行该数据处理方法以提高对待推荐资源的预测效率和准确率。即电子设备可以根据目标对象和待推荐资源获取对应的推荐信息集合以生成推荐特征集合，根据该推荐特征集合中的属性特征(对象属性特征和资源属性特征)对行为特征(对象行为特征和资源行为特征)进行特征选择，得到
在预测过程中较为合适的目标行为特征，并根据属性特征和目标行为特征确定出目标概率，可以按照该目标概率将待推荐资源进行推荐，从而可以实现精准推送以及提高推荐效果。
44.其中，该待推荐资源可以为目标应用中可以进行推荐的产品，一个目标应用中可以具有多种类型的待推荐资源，该不同类型的待推荐资源可以属于不同域，且该不同类型的待推荐资源具有不同的产品场景。因此本技术技术方案可以实现多种待推荐资源的联合推荐(又称跨域推荐)。例如，待推荐资源可以是目标应用中可以进行推荐的短视频，该产品场景可以是短视频推荐频道的展示页；又如，待推荐资源可以是该目标应用中可以进行推荐的直播间，该产品场景可以是目标应用的应用首页等等。
45.由此，本技术技术方案可以应用于任意推荐任务中。例如，可以应用于社交应用的推荐任务中，此时的待推荐资源可以为在线主播的直播间、已经发布的短视频等等，目标对象可以为使用社交应用的用户，电子设备可以基于本技术技术方案确定用户针对产品(直播间或短视频等)的目标概率，并基于目标概率将产品推送至用户的用户终端，以提高用户对所推荐的产品的点击率或观看时长等。又如，还可以应用于购物应用的推荐任务中，此时的待推荐资源可以为商品、线上用户发布的商品使用笔记等等，目标对象可以为使用购物应用的用户，电子设备可以基于本技术技术方案确定用户针对产品(商品或商品使用笔记)的目标概率，并基于目标概率将产品推送至用户的用户终端，以提高用户对所推荐的产品的点击率和购买率等。
46.可选地，本技术涉及的数据如推荐信息集合等，可以存储于数据库中，或者可以存储于区块链中，如通过区块链分布式系统存储，本技术不做限定。
47.可以理解，上述场景仅是作为示例，并不构成对于本技术实施例提供的技术方案的应用场景的限定，本技术的技术方案还可应用于其他场景。例如，本领域普通技术人员可知，随着系统架构的演变和新业务场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
48.基于上述的描述，本技术实施例提出了一种数据处理方法，该方法可以由上述提及的电子设备来执行。请参见图2，图2为本技术实施例提供的一种数据处理方法的流程示意图。如图2所示，本技术实施例的数据处理方法的流程可以包括如下：
49.s201、获取推荐信息集合。
50.其中，推荐信息集合可以包括目标对象的对象属性信息和对象行为信息、待推荐资源的资源属性信息和资源行为信息。
51.在一些实施例中，目标对象可以为需要进行推荐预测的用户，对象属性信息可以包括一种或多种用户属性，可用于表征该用户的相关用户信息。例如，对象属性信息可以为目标对象的基础画像属性，如用户的年龄、性别和学历等。对象行为特征可以包括一种或多种在目标对象维度下针对待推荐资源所产生的行为信息。例如，待推荐资源为短视频产品，因此对象行为特征可以包括用户针对短视频观看的统计行为，如用户一天内或三天内短视频观看的总时长、用户三天内或一周内的短视频点赞序列、用户三天内或一周内的短视频收藏序列，等等；其中，上述任意序列可以基于对短视频标识确定，即每个发布的短视频的标识可以按照生成规则并根据类型、发布时间等生成，由此获取用户关联的短视频(如用户点赞的短视频或收藏的短视频)的标识以生成相关序列。该生成规则可以由相关业务人员
根据经验值设置。不同的待推荐资源所对应推荐信息集合中若包含序列，则可以有不同的生成方式，具体可以由相关业务人员设置，在此不做限定。
52.在一些实施例中，待推荐资源可以为目标应用中的推荐产品，如短视频、主播的直播间等。资源属性信息可以包括一种或多种资源属性，可用于表征该资源或资源所属对象的相关对象信息。例如，待推荐资源为直播间(或视频)，所属对象为对应主播(或对应发布者；在不同产品场景下，同一主播又可为发布者)，资源属性信息可以为该主播(或发布者)的基础画像属性，如主播(或发布者)的年龄、性别和学历等；又如，待推荐资源为商品(或商品使用笔记)，资源属性信息可以为该商品(或商品使用笔记所指示的商品；在不同产品场景下，同一商品又可以为商品使用笔记中所指示的商品)的基础画像属性，如商品的类型、商品所属店铺的好评率等。资源行为特征可以包括一种或多种在待推荐资源维度下针对待推荐资源所产生的行为信息。例如，待推荐资源为短视频产品，因此资源行为特征可以包括短视频针对用户的统计行为，如一天内或三天内该短视频被用户点赞的总次数、三天内或一周内该短视频的用户点赞序列、三天内或一周内该短视频的用户收藏序列，等等。上述推荐信息集合中具体包含的信息类型可以由相关业务人员根据实际应用的推荐任务设置，此处不作限制。其中，该生成序列的相关描述可以参见上述描述。
53.需要说明的是，在本技术的具体实施方式中，涉及到用户信息如用户年龄等相关的数据，或任意的需要获取数据场景等情况下的相关数据，当本技术以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
54.在一些实施例中，待推荐资源属于对象终端中的目标应用，待推荐资源可以是目标应用中可以进行推荐的任意类型产品。不同待推荐资源所处的产品场景可以相同或不同，该产品场景可以是指目标应用中的应用界面。一个应用界面中可以仅推荐一种待推荐资源也可以同时推荐多种待推荐资源。以及，同一待推荐资源所处的产品场景可以有一种或多种，即目标应用中可以存在多种应用界面可以推荐相同的待推荐资源；针对同一待推荐资源，若处于不同产品场景时，均可使用本技术所提出的推荐预测方法。
55.因此，本技术可以将目标应用中不同产品进行联合推荐，在联合推荐时使用的预测资源(如参与该过程的相关参数等)可以是部分为共享部分为独有，使得本技术技术方案在推荐预测时可以结合更多的特征信息，相较于对每种待推荐资源单独建模进行推荐预测，此可以联合多种待推荐资源的推荐预测所具有的共性特征和差异特征以提高推荐预测的效果。电子设备可以是目标应用所属的后台设备，对象终端在检测到目标应用显示可进行产品推荐的应用界面时，生成推荐指令并发送给电子设备，电子设备在接收到推荐指令时，可以根据该应用界面所表征的产品场景确定待推荐资源的资源类型，并获取目标对象和待推荐资源对应的推荐信息集合。
56.其中，电子设备获取到的待推荐资源可以是一个或多个。当为多个待推荐资源时，电子设备可以分别为每个待推荐资源及该目标对象构建一个推荐信息集合，每个推荐信息集合均包括该目标对象的对象属性信息和对象行为信息、一个待推荐资源的资源属性信息和资源行为信息。以及待推荐资源为多个时，该多个待推荐资源的资源类型可以不同，该不同类型的待推荐资源属于不同的推荐任务，推荐预测的结果可以相互独立。每个推荐信息集合的推荐预测的过程和原理相同，下述在描述预测过程时则以一个推荐信息集合为例说
明。
57.例如，如图3a-图3c所示，图3a-图3c为本技术实施例提供的一种待推荐资源的示意图；其中，待推荐资源可以为目标应用中的直播间，此时待推荐资源于目标应用所处的产品场景可以是目标应用的应用首页，该应用首页包括直播间推荐专栏，此时直播间表示为直播标签，并于该直播间推荐专栏上进行缩略显示，如图3a所示；所处的产品场景还可以是目标应用的直播推荐页面，该直播推荐页面上直接显示直播间详情画面，目标对象可以通过上下滑动进入所推荐的不同直播间，如图3b所示，一次滑动表示推荐一次直播间；
58.又如，待推荐资源可以为该目标应用中的短视频，此时待推荐资源于目标应用所处的产品场景可以是目标应用的应用首页，该应用首页包括短视频推荐专栏，此时短视频表示为短视频标签，并于该短视频推荐专栏上进行缩略显示，如图3a所示；所处的产品场景还可以是目标应用的短视频推荐页面，该短视频推荐页面上直接显示短视频详情画面，目标对象可以通过上下滑动进入所推荐的不同短视频，如图3c所示，一次滑动表示推荐一次短视频；
59.其中，上述图3a所指示的产品场景可以同时推荐直播间和短视频两种不同的待推荐资源，即表示待推荐资源存在相同的产品场景；此时所获取到的待推荐资源为不同资源类型的产品(如可以包括多个直播间及多个短视频)，且对应于针对直播间的推荐任务和针对短视频的推荐任务，该两种推荐任务可以同时进行，且推荐结果相互独立。
60.可以理解的是，本技术技术方案可以应用于任意应用的推荐任务中，根据推荐任务的不同，目标对象和待推荐资源均可相应不同，此处不作限制。
61.s202、根据推荐信息集合生成推荐特征集合。
62.其中，推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征、资源行为信息的资源行为特征。
63.在一个可能的实施方式中，推荐特征集合中的每种推荐特征的生成过程和原理相同。具体可以是，按照匹配的编码规则对推荐信息进行特征编码，得到编码特征向量，并将该编码特征向量作为对应的推荐特征。不同的推荐信息对应的编码规则可以不同，可由相关业务人员根据经验值设置。
64.在一些实施例中，以对象属性信息中的年龄属性为例，生成对应的对象属性特征具体可以是，将年龄属性划分为多个属性类别，并按照编码规则根据该多个属性类别进行编码。例如，将该年龄属性划分为了[＜18,19-30,31-40，41-50,51-60，＞60]多种属性类别，若该目标对象的年龄为24，则表示划分到的目标属性类别为[19-30]，因此按照编码规则进行特征编码所得到的编码特征向量可以表示为[0,1,0,0,0,0]。其中，推荐信息集合中除为序列类型以外的推荐信息均可按照前述所描述过程和原理生成对应的推荐特征。
[0065]
在一些实施例中，推荐信息中可以包括类型为序列的推荐信息。以对象行为信息中的短视频点赞序列为例，生成对应的对象行为特征具体可以是，将短视频划分为多个属性类别，并按照编码规则根据该多个属性类别进行编码。例如，按照短视频的发布者将短视频划分为了多个属性类别：用户a发布的短视频编码为1、用户b发布的短视频编码为2.....；若该短视频点赞序列为：[短视频a标识、短视频b标识、短视频c标识、....]，且设短视频a为用户a发布的、短视频b为用户b发布的、短视频c为用户b发布的，则按照编码规则进行特征编码所得到的编码特征向量可以表示为[1,2,2,...]。进一步的，当序列为数值型
时，还可以直接将该序列作为对应的推荐特征。其中，推荐信息集合中为序列类型的推荐信息均可按照前述所描述过程和原理生成对应的推荐特征。
[0066]
其中，在不同推荐任务中，针对同一推荐信息的属性类别划分方式可以不同。例如，在针对直播间的推荐任务中，可以将年龄属性划分为[＜18,19-30,31-40，41-50,51-60，＞60]，在针对短视频的推荐任务中，可以将年龄属性划分为[＜20,21-40,41-45，46-50,51-60，＞60]等等。该划分方式可由相关业务人员设置。
[0067]
因此可以由对象属性信息包含的一种或多种属性/对象行为信息包含的一种或多种行为信息/资源属性信息包含的一种或多种属性/资源行为信息包含的一种或多种行为信息，分别生成对应的编码特征向量，该对象属性特征/对象行为特征/资源属性特征/资源行为特征，可以由该一种或多种编码特征向量组成。电子设备生成资源属性特征和资源行为特征的具体方式可以同生成对象属性特征和对象行为特征的具体方式，此处不再赘述。
[0068]
在一些实施例中，电子设备在得到推荐信息集合中每个推荐信息对应的编码特征向量时，还可以对该编码特征向量进行特征嵌入处理，得到每个推荐信息对应的嵌入特征向量，并将该嵌入特征向量作为对应的推荐特征，以得到推荐特征集合。其中，前述具体执行过程可以参见下述实施例的相关描述。
[0069]
s203、根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子。
[0070]
在一个可能的实施方式中，影响因子可以通过目标预测模型得到。该目标预测模型可以实现跨域推荐任务的联合预测。目标预测模型中可以包括影响因子预测网络，在该影响因子预测网络中，根据前述两种属性特征的拼接特征分别生成每个行为特征的影响因子。其中，在对每个推荐特征集合进行影响因子预测时，影响因子预测网络这部分模型参数为每个推荐特征集合中的公共特征共享的预测资源，因此可以实现将在不同域学习到的信息均迁移到公共特征关联的影响因子预测网络中，由此可以实现利用影响因子预测网络生成每个差异特征的影响因子，以及也可以实现在域a中学习到的信息可以作用于域b下的推荐预测，可以使得在域b所指示推荐任务中对用户进行推荐预测时，若能够参与预测的信息较少(如用户对域b所指示的待推荐资源产生的行为信息)时，可以结合域a所指示推荐任务中传递过来的信息共同预测。该目标预测模型为基于下述实施例中步骤s801-s804所描述过程训练得到的。
[0071]
在一些实施例中，影响因子预测网络可以由全连接层和门控网络所构成，全连接层的数量可以由相关业务人员根据经验值设置。影响因子可以由门控网络采用激活函数的思想，通过如下公式得到：
[0072][0073]
其中，xi为由对象属性特征和资源属性特征经由全连接层所输出的向量的第i个元素值，f(xi)表示行为特征(对象行为特征和资源行为特征)中的第i个行为特征的影响因子。
[0074]
在一个可能的实施方式中，由于上述对象属性特征为表征需要推荐的用户的特征，该用户可以在不同产品场景下针对不同的待推荐资源进行推荐预测。例如，电子设备在对用户进行直播间推荐时，会获取该用户的指定对象属性信息以生成针对直播间这一待推
荐资源的对象属性特征，在对用户进行短视频推荐时，同样会获取这部分指定对象属性信息以生成针对短视频这一待推荐资源的对象属性特征，因此该对象属性特征可以作为对多个待推荐资源进行联合推荐下的公共特征。以及该资源属性特征为表征待推荐资源或待推荐资源所属对象的特征，在不同产品场景下不同待推荐资源或待推荐资源所属对象可以重叠。
[0075]
例如，在进行直播间推荐时，会获取直播间a对应的主播a的指定属性信息以生成针对直播间这一待推荐资源的资源属性特征，在进行短视频推荐时，会获取短视频a对应的发布者a的指定属性信息以生成针对短视频这一待推荐资源的资源属性特征；若主播a和发布者a为同一对象时，则获取到的指定属性信息相同，因此该资源属性特征可以作为对多个待推荐资源进行联合推荐下的公共特征，并可以将其余的推荐特征作为对多个待推荐资源进行联合推荐下的差异特征。因此本技术技术方案可以适用于联合多种存在重叠推荐资源(即存在公共特征，如对象属性信息和资源属性信息)的跨域推荐任务。
[0076]
在一些实施例中，电子设备可以根据公共特征(对象属性特征和资源属性特征)对差异特征(对象行为特征和资源行为特征)进行特征选择，以确定从差异特征中所要提取到的特征信息，该提取到的特征信息即为参与对待推荐资源的预测过程中更合适的行为特征。因此，电子设备可以根据前述两种属性特征确定对象行为特征的影响因子和资源行为特征的影响因子以实现根据公共特征对差异特征进行特征选择。该影响因子可以用于衡量在前述两种属性特征维度下对应行为特征在预测目标概率时所起的作用。影响因子越大，所起的作用越大，从对应行为特征中提取的特征信息就越多；反之，影响因子越小，所起的作用越小，从对应行为特征中提取的特征信息就越少。从而可以实现对参与预测的特征的校正，使得预测时可以更关注重要的特征信息，提高预测准确性。
[0077]
例如，对象行为特征为在短视频上总的观看时长，该影响因子为0.7；资源行为特征为短视频a的点赞总数，该影响因子为0.3，则表示在预测目标概率时，对象行为特征的结果对于预测结果的影响较大，则可以从该对象行为特征中提取更多的特征信息；资源行为特征的结果对于预测结果的影响较小，则可以从该资源行为特征中提取较少的特征信息。
[0078]
s204、根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征。
[0079]
在一些实施例中，根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征可以是，将影响因子与对象行为特征的乘积作为目标对象行为特征。该目标对象行为特征表示从对象行为特征中提取到的适配特征信息。
[0080]
在一些实施例中，根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征可以是，将影响因子与资源行为特征的乘积作为目标资源行为特征。该目标资源行为特征表示从资源行为特征中提取到的适配特征信息。
[0081]
s205、根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。
[0082]
在一些实施例中，电子设备可以通过上述目标预测模型确定目标概率。目标预测模型可以包括针对目标概率的概率预测网络。可以由该概率预测网络基于对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征进行预测得到目标概率。该目标概
率表示目标对象对待推荐资源响应推荐行为的概率。其中，推荐行为的具体类型可以根据待推荐资源的不同以及待推荐资源当前所处的产品场景不同而不同。该推荐行为可以表示目标对象对于待推荐资源产生了一次有效推荐。
[0083]
例如，待推荐资源为直播间，且处于如图3a所示的产品场景中，此时的推荐行为可以是对直播间的点击行为，此时的目标概率可以表示目标对象对所推荐直播间的预测点击率；又如，待推荐资源为直播间，且处于如图3b所示的产品场景中，此时的推荐行为可以是对直播间的观看行为，设观看当前推荐的直播间的播放画面满3s则表示一次有效推荐，此时的目标概率可以表示目标对象对所推荐直播间的预测观看率。
[0084]
在一些实施例中，目标概率表示目标对象对待推荐资源的兴趣程度。因此可以基于该目标概率确定待推荐资源的推荐策略，并按照该推荐策略将待推荐资源进行推送至对象终端。该推荐策略可由相关业务人员设置。例如，推荐策略可以是按照目标概率从大到小的顺序依次推送至对象终端；又如，推荐策略可以是将目标概率大于或等于预设概率阈值的待推荐资源依次进行推送；等等。
[0085]
本技术实施例中，可以获取推荐信息集合，根据推荐信息集合生成推荐特征集合，根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子，根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征，根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。通过上述方法，不仅可以结合更多的特征信息确定目标概率，还可以通过影响因子对对象行为特征和资源行为特征进行特征选择以确定在预测过程中更适配的目标行为特征，因此可以提高对待推荐资源的推荐预测效率和准确率，进而有利于提升后续基于目标概率进行推荐的效果。
[0086]
请参见图4，图4为本技术实施例提供的一种数据处理方法的流程示意图，该方法可以由上述提及的电子设备执行。如图4所示，本技术实施例中数据处理方法的流程可以包括如下：
[0087]
s401、获取推荐信息集合。其中，步骤s401的具体实施方式可以参见上述实施例的相关描述，此处不再赘述。
[0088]
s402、根据推荐信息集合生成推荐特征集合。
[0089]
其中，推荐特征集合包括对象属性特征、对象行为特征、资源属性特征以及资源行为特征。
[0090]
在一个可能的实施方式中，推荐特征集合中的每种推荐特征的生成过程和原理相同。具体可以是，按照匹配的编码规则对推荐信息进行特征编码，得到编码特征向量，获取推荐信息对应的嵌入特征矩阵，根据编码特征向量和嵌入特征矩阵确定每种推荐信息对应的嵌入特征向量，将该嵌入特征向量作为对应的推荐特征。其中，进行特征编码的具体方式可以参见上述实施例的相关描述。
[0091]
在一些实施例中，根据编码特征向量和嵌入特征矩阵确定对应的嵌入特征向量具体可以是，将编码特征向量依次与嵌入特征矩阵的每列相乘并求和得到每列对应的计算结果，并将该每列对应的计算结果拼接得到的向量作为嵌入特征向量。例如，编码特征向量为[1,2,3]，嵌入特征矩阵的每列元素值依次为[(1,2,3)、(2,3,1)、(3,4,5)]，因此每列对应
的计算结果依次为：1*1+2*2+3*3＝14、1*2+2*3+3*1＝9、1*3+2*4+3*5＝26；因此拼接得到的向量为[14,9,26]。
[0092]
以及，在一个推荐任务中，每种推荐信息对应的嵌入特征矩阵可以相同也可以不同。在不同推荐任务之间，相同的推荐信息对应的嵌入特征矩阵可以全部或部分相同也可以全部不同。
[0093]
例如，如图5a-图5c所示，图5a-图5c为本技术实施例提供的一种确定推荐特征集合的场景示意图；其中，设推荐任务1为针对直播间的推荐任务，推荐任务1对应的推荐信息集合1包括对象属性信息(包括属性a、属性b)、对象行为信息(包括行为a、行为b)、资源属性信息(包括属性c、属性d)、资源行为信息(包括行为c、行为d)；设推荐任务2为针对短视频的推荐任务，推荐任务2对应的推荐信息集合2包括对象属性信息(包括属性a、属性b)、对象行为信息(包括行为a、行为b)、资源属性信息(包括属性c、属性d)、资源行为信息(包括行为c、行为d)；
[0094]
如图5a，推荐任务1中的每种推荐信息对应的嵌入特征矩阵相同，即推荐信息集合1基于矩阵1得到对应的推荐特征集合1；若推荐任务1和推荐任务2之间所使用的嵌入特征矩阵相同，则推荐信息集合2也基于矩阵1得到对应的推荐特征集合；或者，若推荐任务1和推荐任务2之间所使用的嵌入特征矩阵不相同，则推荐信息集合2可以基于矩阵2得到对应的推荐特征集合2；
[0095]
如图5b，推荐任务1中的每种推荐信息对应的嵌入特征矩阵不同，即推荐信息集合1基于矩阵1-8得到对应的推荐特征集合1；若推荐任务1和推荐任务2之间所使用的嵌入特征矩阵全部相同，则推荐信息集合2也可基于矩阵1-8得到对应的推荐特征集合2；或者，若推荐任务1和推荐任务2之间所使用的嵌入特征矩阵全部不同，则推荐信息集合2可基于矩阵9-16得到对应的推荐特征集合；
[0096]
如图5c，推荐信息集合1基于矩阵1-8得到对应的推荐特征集合1；若推荐任务1和推荐任务2之间所使用的嵌入特征矩阵部分相同，如设使用相同嵌入特征矩阵的推荐信息为对象属性信息和资源属性信息(即跨域推荐任务间的公共特征)，则推荐信息集合2中的属性a、属性b、属性c和属性d与推荐信息集合1使用相同的嵌入特征矩阵(矩阵1-4)，推荐信息集合2中的行为a、行为b、行为c和行为d使用矩阵9-12；其中，若多个推荐任务之间使用相同的嵌入特征矩阵，则在得到每种推荐信息对应的嵌入特征矩阵时，需要对推荐信息进行对齐，即可将推荐信息集合1中的属性a和推荐信息集合2中的属性a对齐、将推荐信息集合1中的属性b和推荐信息集合2中的属性b对齐、将推荐信息集合1中的属性c和推荐信息集合2中的属性c对齐、将推荐信息集合1中的属性d和推荐信息集合2中的属性d对齐。
[0097]
在一些实施例中，上述嵌入特征矩阵可由相关业务人员根据经验值设置，若不同推荐任务间存在对齐的推荐信息，则为该对齐的推荐信息设置相同的嵌入特征矩阵；也可以作为目标预测模型的模型参数由训练得到，若不同推荐任务间存在对齐的推荐信息，则所对齐的推荐信息训练得到的是同一个嵌入特征矩阵。即上述过程可以通过目标预测模型得到，该目标预测模型可以包括特征生成层，由特征生成层根据推荐信息集合生成推荐特征集合，该嵌入特征矩阵可以作为目标预测模型中的模型参数。此时所输入的推荐信息集合可包括待推荐资源对应的资源类型标识(如图5a所示的推荐信息集合)，目标预测模型可基于该资源类型标识为推荐信息集合选取对应的嵌入特征矩阵以生成推荐特征集合。目标
预测模型为基于下述实施例中步骤s801-s804所描述过程训练得到。
[0098]
s403、根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子。
[0099]
在一个可能的实施方式中，电子设备可以根据对象属性特征和资源属性特征对对象行为特征和资源行为特征进行特征选择，得到影响因子，并通过该影响因子提取出合适的特征信息以进行后续的目标概率预测。
[0100]
在一些实施例中，上述目标预测模型可包括影响因子预测网络。可以通过该影响因子预测网络进行影响因子的预测。根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子具体可以是，对对象属性特征和资源属性特征进行特征融合得到融合属性特征，由影响因子预测网络根据融合属性特征生成对象行为特征的影响因子和资源行为特征的影响因子。
[0101]
在一些实施例中，对对象属性特征和资源属性特征进行特征融合得到融合属性特征具体可以是，将对象属性特征和资源属性特征作为特征集合，并对特征集合中每两个特征进行特征交叉(如可以是计算每两个向量的内积)，得到每两个特征对应的交叉特征值，并将每两个特征对应的交叉特征值进行依序拼接得到融合属性特征。即进行特征交叉可以表示为：
[0102]
《vi,vj》1≤i≤n,1≤j≤n
[0103]
其中，《》表示向量内积，vi,vj表示特征集合中第i个特征和第j个特征，i可以等于j，n表示特征集合中的特征数量。
[0104]
可以理解的是，该融合属性特征可以包含由对象属性特征内部之间、资源属性特征内部之间、对象属性特征和资源属性特征之间的特征关联信息，表现了多种特征之间的进行特征交互而得到特征之间的关系，进而使得融合属性特征中可以更深层次结合两两特征之间的关系，丰富特征表示。
[0105]
其中，特征融合还可以有其他方式，在此不做限定。以及由影响因子预测网络根据融合属性特征生成对象行为特征的影响因子和资源行为特征的影响因子的具体过程可以同上述实施例中由影响因子预测网络根据对象属性特征和资源属性特征生成影响因子的具体过程。
[0106]
s404、对对象行为特征进行特征提取，得到对象行为特征的对象提取特征，并对资源行为特征进行特征提取，得到资源行为特征的资源提取特征。
[0107]
在一个可能的实施方式中，对象行为特征的数量可以为n，n为大于1的正整数。电子设备对对象行为特征进行特征提取，得到对象行为特征的对象提取特征可以是，根据n个对象行为特征对第i个对象行为特征进行特征提取，得到第i个对象行为特征的对象提取特征。第i个对象行为特征为n个对象行为特征中的任一个，i为小于或等于n的正整数。该每种对象行为特征分别对应的对象提取特征基于该对应的对象行为特征及其余的对象行为特征共同作用得到，可以使得对象提取特征可以涵盖更多的特征信息。同理，资源行为特征的数量可以为q，q为大于1的正整数。电子设备对资源行为特征进行特征提取，得到资源行为特征的资源提取特征可以是，根据q个资源行为特征对第q个资源行为特征进行特征提取，得到第q个资源行为特征的资源提取特征。第q个资源行为特征为q个资源行为特征中的任一个，q为小于或等于q的正整数。该每种资源行为特征分别对应的资源提取特征基于该对
应的资源行为特征及其余的资源行为特征共同作用得到，可以使得资源提取特征涵盖更多的特征信息。
[0108]
在一个可能的实施方式中，对每个对象行为特征或每个资源行为特征进行特征提取的过程和原理相同。此处以第i个对象行为特征的特征提取过程为例说明。电子设备可以通过目标预测模型实现，该目标预测模型可以包括特征提取层，可以通过该特征提取层对n个对象行为特征进行特征提取，得到每个对象行为特征对应的对象提取特征。其中，通过特征提取层进行特征提取具体可以是，在特征提取层中确定每个对象行为特征的过渡行为特征，基于过渡行为特征确定第i个对象行为特征分别与每个对象行为特征的相关程度，并根据该相关程度和过渡行为特征确定在第i个对象行为特征下从每个对象行为特征中提取的特征信息，根据该提取的特征信息确定第i个对象行为特征的对象提取特征。
[0109]
在一些实施例中，该特征提取层可以是采用变形器(transformer)实现，其中可以包括三个注意力矩阵(设表示为第一矩阵wq、第二矩阵wk、第三矩阵wv)，通过该三个注意力矩阵可以用于增加目标预测模型的复杂度，增强目标预测模型的表达能力，使得对象提取特征可以包含更多特征信息。
[0110]
在一些实施例中，利用该特征提取层对n个对象行为特征进行特征提取具体可以是，将每个对象行为特征分别与三个注意力矩阵相乘，得到每个对象行为特征对应的三种过渡行为特征；可以表示为如下公式：
[0111]
qi＝hi*wq[0112]ki
＝hi*wk[0113]
vi＝hi*wv[0114]
上述qi、ki、vi表示第i个对象行为特征(hi)分别对应的三种过渡行为特征，表示由对象行为特征基于不同注意力矩阵做映射而得到的向量表示；每个对象属性信息均按照上述方式得到对应的过渡行为特征；第j个对象行为特征(hj)分别对应的三种过渡行为特征表示为qj、kj、vj。
[0115]
在一些实施例中，基于过渡行为特征确定第i个对象行为特征分别与n个对象行为特征的相关程度。具体可以通过如下公式得到：
[0116][0117]
上述i
ij
表示第i个对象行为特征与第j个对象行为特征的相关程度；j为1至n的整数，j可等于i；qi.kj表示qi与kj点乘；表示kj的维度数量的平方根。
[0118]
在一些实施例中，基于相关程度确定在第i个对象行为特征下从n个对象行为特征中要提取的特征信息。具体可以通过如下公式得到：
[0119]
l
ij
＝i
ij
*vj[0120]
上述l
ij
表示在第i个对象行为特征下从第j个对象行为特征中提取的特征信息。
[0121]
在一些实施例中，电子设备可以将在第i个对象行为特征下从n个对象行为特征中要提取的特征信息之和确定为第i种对象行为特征对应的对象提取特征；或者可以是，将特征信息之和输入特征提取层所连接的全连接层，并将经由全连接层的输出确定为最终的对象提取特征。
[0122]
在一个可能的实施方式中，目标预测模型中的特征提取层的层数可以为多层，每
层均包括三个注意力矩阵，该每层的注意力矩阵相互独立，每层特征提取层之后均可接全连接层。可以通过该多层特征提取层对n个对象行为特征进行多次特征提取，前一层的特征提取层的输出为后一层的特征提取层的输入。
[0123]
在一些实施例中，资源行为特征对应的特征提取层可以与对象行为特征对应的特征提取层相同，也可以不同；以及该对应的特征提取层所连接的全连接层可以是同一个，也可以是不同且互相独立的。
[0124]
例如，如图6a-图6c所示，图6a-图6c为本技术实施例提供的一种基于目标预测模型的特征提取场景示例图；其中：
[0125]
如图6a所示，设对象行为特征和资源行为特征对应的特征提取层相同，且特征提取层的层数为一，则n个对象行为特征通过该特征提取层中的注意力矩阵1-3并经由全连接层得到每个对象行为特征的对象提取特征，以及q个资源行为特征通过该特征提取层中的注意力矩阵1-3并经由全连接层得到每个资源行为特征的资源提取特征；
[0126]
以n个对象行为特征(设表示为h1、h2)为例，基于注意力矩阵1-3(wq、wk、wv)确定h1的过渡行为特征(q1、k1、v1)和h2的过渡行为特征(q2、k2、v2)；基于过渡行为特征确定h1与h1的相关程度i
11
和与h2的相关程度i
12
，以及确定h2与h1的相关程度i
21
和与h2的相关程度i
22
；根据i
11
确定在h1下从h1提取的特征信息l
11
和根据i
12
确定从h2提取的特征信息l
12
，根据i
21
确定在h2下从h1提取的特征信息l
21
和根据i
22
确定从h2提取的特征信息l
22
；将l
11
和l
12
之和并经由全连接层的输出确定为h1的对象提取特征z1，将l
21
和l
22
之和并经由全连接层的输出确定为h2的对象提取特征z2；
[0127]
如图6b所示，设对象行为特征和资源行为特征对应的特征提取层不同，且特征提取层的层数为一，则n个对象行为特征通过该特征提取层1中的注意力矩阵1-3并经由全连接层得到每个对象行为特征的对象提取特征，以及q个资源行为特征通过特征提取层2中的注意力矩阵4-6并经由全连接层得到每个资源行为特征的资源提取特征；
[0128]
如图6c所示，设对象行为特征和资源行为特征对应的特征提取层不同，且特征提取层的层数为3，则n个对象行为特征通过该特征提取层1.1-1.3中的注意力矩阵1-9并经由全连接层1-3得到每个对象行为特征的对象提取特征，以及q个资源行为特征通过特征提取层2.1-2.3中的注意力矩阵10-18并经由全连接层1-3得到每个资源行为特征的资源提取特征；
[0129]
以n个对象行为特征(设表示为h
10
、h
20
)在特征提取层1.1-1.2为例，h1、h2通过特征提取层1.1中的注意力矩阵1-3进行特征提取并经由全连接层1输出初始对象提取特征(设表示为h
11
、h
21
)，并将该h
11
、h
21
输入特征提取层1.2继续进行特征提取，从而得到最终输出的对象提取特征。
[0130]
s405、根据对象行为特征的影响因子和对象提取特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源提取特征确定目标资源行为特征。
[0131]
在一些实施例中，电子设备可以根据第i个对象行为特征的影响因子和第i个对象行为特征的对象提取特征确定第i个对象行为特征对应的目标对象行为特征。其具体可以是将影响因子与对象行为特征的乘积作为目标对象行为特征。同理，电子设备可以根据第q个资源行为特征的影响因子和第q个资源行为特征的资源提取特征确定第q个资源行为特征对应的目标资源行为特征。其具体可以是将影响因子与资源行为特征的乘积作为目标资
源行为特征。
[0132]
s406、根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率。
[0133]
在一些实施例中，电子设备可以通过目标预测模型得到目标概率。该目标预测模型可以包括每种待推荐资源对应的概率预测网络。可以在目标预测模型中，根据推荐信息集合中携带的资源类型标识确定对应的概率预测网络，并由概率预测网络根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定该目标概率。
[0134]
s407、按照目标概率将待推荐资源推送至目标对象的对象终端。
[0135]
在一些实施例中，电子设备可以基于目标概率确定出目标对象最可能感兴趣的待推荐资源，从而提高有效推荐率。因此按照目标概率对待推荐资源进行推送。在此对推送方式不做限定。或者，在预测出大量目标对象对不同待推荐资源的目标概率之后，还可以基于目标概率对待推荐资源进行群体划分，比如可以是对目标对象进行划分得到多个目标群体，根据目标概率确定该不同目标群体中适合推荐的待推荐资源。后续有新的目标对象要进行推荐时，可以无需再预测对应的目标概率，而是可以确定该新的目标对象的所属目标群体，并将该目标群体适合推荐的待推荐资源推送给新的目标对象的所属目标群体。
[0136]
例如，如图7所示，图7为本技术实施例提供的一种基于目标预测模型的待推荐资源的推送场景示意图；以应用于针对直播间的推荐任务为例，其他推荐任务的推荐原理同该针对直播间的推荐任务；其中：
[0137]
当用户终端中的目标应用显示可以推荐直播间的产品场景时，电子设备获取当前正在直播的多个直播间(i1、i2、i3、......、in)，并将目标用户(u)分别和每个直播间组成预测对([u,i1]、[u,i2]、[u,i3]、......、[u,in])，并基于多个预测对从属性存储平台(如可以为数据库)提取目标用户的用户属性信息、用户针对直播间的行为信息、每个直播间的直播间属性信息和直播间行为信息，以将前述多种信息及直播间对应的类型标识(s1、...、sn)组成信息对([u,i1,s1]、[u,i2,s2]、[u,i3,s3]、......、[u,in,sn])，并将每个信息对依次输入目标预测模型；在目标预测模型中根据类型标识并按照直播间这一推荐任务所定义的特征生成方式生成每个信息对对应的特征对，并根据每个预测对所对应的特征对得到每个预测对下的目标概率；可以按照每个预测对下的目标概率对每个直播间进行排序，得到排序后的直播间，并将排序后的直播间或目标数量个排序后的直播间依次推送至该目标用户的用户终端。
[0138]
本技术实施例中，可以获取推荐信息集合，根据推荐信息集合生成推荐特征集合，根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子，对对象行为特征进行特征提取，得到对象行为特征的对象提取特征，并对资源行为特征进行特征提取，得到资源行为特征的资源提取特征，根据对象行为特征的影响因子和对象提取特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源提取特征确定目标资源行为特征，根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。通过上述方法，不仅可以结合更多的特征信息确定目标概率，还可以通过影响因子对对象行为特征和资源行为特征进行特征选择以确定在预测过程中更适配的目标行为特征，因此可以提高对待推荐资源的推荐预测效率和准确率，进而有利
于提升后续基于目标概率进行推荐的效果。
[0139]
请参见图8，图8为本技术实施例提供的一种数据处理方法的流程示意图，该方法可以由上述提及的电子设备执行。如图8所示，本技术实施例中数据处理方法的流程可以包括如下：
[0140]
s801、获取m个样本信息集合。
[0141]
其中，一个样本信息集合包括一个样本对象的样本对象属性信息和样本对象行为信息、一个样本推荐资源的样本资源属性信息和样本资源行为信息。
[0142]
在一些实施例中，要实现跨域推荐任务的联合推荐，每个样本信息集合均具有概率标签和资源类型标签。m个样本信息集合具有r种资源类型标签，一种资源类型标签对应一种推荐任务。m为大于1的正整数，r为大于1且小于或等于m的正整数。m个样本信息集合中的样本对象、样本推荐资源均可不同。
[0143]
在一些实施例中，上述目标概率可以由目标预测模型生成。因此电子设备可以将该m个样本信息集合作为对初始预测模型进行批量训练中的一轮样本数据，基于多轮m个样本信息集合的训练直至收敛得到最终的目标预测模型。每轮的m可以相同也可以不同。每轮的m个样本信息集合中，同一种资源类型标签的样本信息集合数量可以指定也可以随机生成。该每轮训练的过程和原理相同，此处以第k轮的m个样本信息集合的训练为例进行说明。其中，该m个样本信息集合所包含样本数据的相关描述可以参见上述实施例所描述的应用过程中所使用数据的描述。
[0144]
s802、将每个样本信息集合输入初始预测模型，基于初始预测模型生成每个样本信息集合对应的样本概率。
[0145]
在一个可能的实施方式中，m个样本信息集合中任一个样本信息集合表示为第j个样本信息集合，j为小于或等于m的正整数。电子设备基于初始预测模型生成每个样本信息集合对应的样本概率具体可以是，基于初始预测模型生成第j个样本信息集合对应的样本特征集合，该样本特征集合包括第j个样本信息集合中样本对象属性信息的样本对象属性特征、样本对象行为信息的样本对象行为特征、样本资源属性信息的样本资源属性特征、样本资源行为特征的样本资源行为特征；根据样本对象属性特征和样本资源属性特征生成样本对象行为特征的样本影响因子和样本资源行为特征的样本影响因子，根据样本对象行为特征的样本影响因子和样本对象行为特征确定目标样本对象行为特征，并根据样本资源行为特征的样本影响因子和样本资源行为特征确定目标样本资源行为特征，根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率。其中，样本特征集合还可以包括针对资源类型标签所生成的样本特征，生成方式可以同其他样本特征的生成方式，以及后续在输入初始概率预测网络时，也可以是将该针对资源类型标签所生成的样本特征连通样本特征集合一并输入以预测样本概率。
[0146]
在一些实施例中，初始预测模型可以包括待训练的特征生成层，该特征生成层中的模型参数可以包括嵌入特征矩阵，可由模型训练得到。电子设备可以将每个样本信息集合依次输入初始预测模型，基于初始预测模型中的特征生成层并按照匹配的编码规则对每个样本信息集合进行特征编码得到编码特征向量，并根据编码特征向量和嵌入特征矩阵得到对应的样本特征集合；该具体生成样本特征集合的过程和原理可以参见上述实施例的相关描述。其中，不同样本信息集合所匹配的编码规则可能不同，在编码时可以都按照各自匹
配的编码规则进行特征编码，也可以是按照统一的编码规则进行特征编码。例如，都按照针对直播间的推荐任务中所匹配的编码规则进行特征编码。此时，该统一的编码规则所对应的推荐任务也可以表示为跨域推荐任务中所设定的主推荐任务(主域)，即可以理解为是以该主推荐任务为关注重点进行训练。进一步的，在以主推荐任务训练完成初始预测模型之后，还可以将其他推荐任务作为主推荐任务继续训练该模型以得到最终的模型。
[0147]
在一些实施例中，在训练过程中，可以对不同推荐任务中的公共特征进行特征对齐，该对齐的特征所对应的嵌入特征矩阵相同。通过对齐公共特征可以使得训练中跨域推荐任务中的特征信息更多地传递到公共特征中，从而可以实现通过公共特征对不同推荐任务下的行为信息做特征选择。相较于选择基于各个推荐任务的交集用户所得到的样本数据进行训练，本技术技术方案为直接基于各个推荐任务中的全部样本数据进行训练的，可以提高训练效率；通过对该公共特征进行特征对齐可以建立多个推荐任务之间的关联关系，无需样本筛选且可以学习到更多的特征信息以增强模型效果。以及，在应用过程中，若用户在当前推荐任务中的行为信息不足时，由于该公共特征也传递了其他推荐任务下的特征信息，可以实现间接使用其他推荐任务中的行为信息对当前推荐任务的信息弥补，可以很好地缓解冷启动问题，也使得对当前推荐任务中的新用户的推荐效果有了更进一步的提升。
[0148]
在一些实施例中，初始预测模型可以包括待训练的影响因子预测网络。电子设备根据样本对象属性特征和样本资源属性特征生成样本对象行为特征的样本影响因子和样本资源行为特征的样本影响因子可以是，将样本对象属性特征和样本资源属性特征进行拼接输入该影响因子预测网络以得到样本影响因子；或者还可以是将样本对象属性特征和样本资源属性特征进行特征融合，得到样本融合属性特征，并将该样本融合属性特征输入该影响因子预测网络以得到样本影响因子。该特征融合的具体过程可以参见上述实施例的相关描述。
[0149]
在一些实施例中，确定目标样本对象行为特征和确定目标样本资源行为特征的过程和原理相同，此处以确定目标样本对象行为特征为例说明。根据样本对象行为特征的样本影响因子和样本对象行为特征确定目标样本对象行为特征可以是，将样本影响因子与样本对象行为特征的乘积作为目标样本对象行为特征；或者还可以是，初始预测模型包括特征提取层(或还包括全连接层)，根据特征提取层(或还包括全连接层)对样本对象行为特征进行特征提取得到样本提取行为特征，将样本影响因子与样本提取行为特征的乘积作为目标样本对象行为特征。该进行特征提取的具体过程可以参见上述实施例的相关描述。
[0150]
在一些实施例中，初始预测模型可以包括r个初始概率预测网络，一种资源类型标签对应一个初始概率预测网络。电子设备根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率可以是，在第j个初始概率预测网络中，根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征生成第j个样本信息集合对应的样本概率。其中，第j个初始概率预测网络为r个初始概率预测网络中第j个资源类型标签对应的初始概率预测网络，第j个资源类型标签为第j个样本信息集合在r种资源类型标签中所具有的资源类型标签。即样本信息集合利用对应的初始概率预测网络进行预测得到对应的样本概率。
[0151]
s803、根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数。
[0152]
在一个可能的实施方式中，在对跨域推荐任务进行联合训练时，可以将从跨域推
荐任务中确定主推荐任务，可以表示以该主推荐任务为重点进行训练或平衡该主推荐任务的训练过程，使得目标预测模型可以更好地学习到主推荐任务自身的特征信息以及其他推荐任务对其贡献的特征信息。该主推荐任务可由相关业务人员设置的任一推荐任务，也可以是满足预设条件的推荐任务。该预测条件例如可以是指样本数量最少的推荐任务；如推荐任务1的样本信息集合的数量为1000、推荐任务2的样本信息集合的数量为100，因此目标预测模型基于推荐任务2学习到的信息较少，为了平衡两个推荐任务的训练过程，因此可以将该推荐任务2设置为主推荐任务。进一步地，在模型训练过程中，也可以轮流替换主推荐任务进行训练，从而使得目标预测模型对于所有推荐任务都能有很好的推荐效果。
[0153]
在一些实施例中，r种资源类型标签关联r个初始损失函数；根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数具体可以是，获取r个初始概率预测网络中的目标概率预测网络，根据目标概率预测网络对应的资源类型标签的数量确定目标概率预测网络对应的资源类型标签所关联的目标初始损失函数的训练权重，根据目标初始损失函数的训练权重和r个初始损失函数确定目标损失函数。该目标概率预测网络即为主推荐任务对应的初始概率预测网络。该方式可以实现在每轮模型训练过程中，根据资源类型标签的数量动态调整目标损失函数，以使得目标损失函数的确定更灵活以及更加适配具体的训练场景。
[0154]
在一些实施例中，目标损失函数loss可以表示为如下公式：
[0155]
loss＝loss1+......+f(batch,curr)lossr[0156]
其中，loss1、......、lossr表示r个初始损失函数，lossr表示主推荐任务对应的目标初始损失函数，f(x1,x2)表示训练权重的确定函数，batch表示m的数量，curr表示主推荐任务在m个样本信息集合中对应资源类型标签的数量。
[0157]
在一些实施例中，训练权重的确定函数f(x1,x2)可以表示为：
[0158]
f(x1,x2)＝log(x1/x2)
[0159]
或者，还可以表示为：
[0160]
可以理解的是，在不同推荐任务中，所具有的样本数量通常会存在比较大的差异，若直接将多个推荐任务的初始损失函数联合以训练模型，可能会存在样本数量较少的推荐任务中的特征信息被稀释而不利于模型的整体训练，因此可以将该样本数量较少的推荐任务作为主推荐任务，并基于上述方法对主推荐任务对应的初始损失函数进行加权，保证主推荐任务的特征信息利用率。
[0161]
在一个可能的实施方式中，若每个推荐任务的样本数量不同，目标预测模型针对每个推荐任务的训练效果不同。因此为了平衡每个推荐任务的训练效果，根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数具体还可以是，根据每种资源类型标签的数量确定每个初始损失函数的训练权重，根据每个初始损失函数的训练权重对r个初始损失函数加权求和，得到目标损失函数。该目标损失函数loss可以表示为如下公式：
[0162]
loss＝f(batch,curr1)loss1+......+f(batch,currr)lossr[0163]
其中，loss1、......、lossr表示r个初始损失函数，f(x1,x2)表示训练权重的确定函数，batch表示m的数量，curr1、......、currr表示每个推荐任务在m个样本信息集合中对应资源类型标签的数量。
[0164]
在一些实施例中，训练权重的确定函数f(x1,x2)可以表示为如下公式：
[0165]
f(x1,x2)＝log(x1/x2)
[0166]
s804、根据目标损失函数、每个样本信息集合对应的样本概率和对应的概率标签训练初始预测模型，得到目标预测模型。
[0167]
在一些实施例中，可以根据目标损失函数、每个样本信息集合对应的样本概率和对应的概率标签得到针对m个样本信息集合的损失值，并利用该损失值修改初始预测模型的模型参数，以训练该初始预测模型得到目标预测模型。
[0168]
例如，如图9a所示，图9a为本技术实施例提供的一种模型训练的场景示意图；初始预测模型可以包括特征生成层、影响因子预测网络、概率预测层，该概率预测层包括多个初始概率预测网络；该影响因子预测网络和初始概率预测网络均可由一个或多个全连接层构成，不同预测网络的全连接层的数量可以不同，可由相关业务人员根据经验值设置；其中：
[0169]
设跨域推荐任务为推荐任务a和推荐任务b，该推荐任务a为主推荐任务；当获取到m个样本信息集合(设集合1、集合2和集合3)时，确定推荐任务a在m个样本信息集合中所对应的资源类型标签的数量；设集合1和集合2的资源类型标签对应推荐任务a，集合3的资源类型标签对应推荐任务b；
[0170]
在特征生成层生成每个样本信息集合对应的样本特征集合，该样本特征集合包括公共特征对应的第一样本特征(如对象属性特征、资源属性特征)和非公共特征对应的第二样本特征(如对象行为特征、资源行为特征)；
[0171]
在影响因子预测网络(由全连接层构成)中根据第一样本特征对第二样本特征进行特征选择，得到每个第二样本特征的影响因子，并根据影响因子和第二样本特征确定目标第二样本特征；
[0172]
在m个样本信息集合各自对应的初始概率预测网络(由全连接层构成)中，根据第一样本特征和目标第二样本特征确定每个样本信息集合对应的样本概率；该集合1和集合2对应初始概率预测网络1，集合3对应初始概率预测网络2；
[0173]
根据推荐任务a对应的资源类型标签的数量确定针对推荐任务a的初始损失函数的训练权重(可表示为f(3,2))，并根据该训练权重以及每个推荐任务a的初始损失函数确定目标损失函数，根据目标损失函数对初始预测模型进行参数修正，得到目标预测模型。
[0174]
可以理解的是，上述初始预测模型的模型结构仅为示例，还可以有其他形式。例如，初始预测网络可以包括特征提取层，通过该特征提取层对对象行为特征(资源行为特征)进行特征提取得到对应的对象提取特征(资源提取特征)，并通过该对象提取特征和影响因子确定输入初始概率预测网络的目标对象行为特征(目标资源行为特征)，如图9b所示，图9b为本技术实施例提供的一种预测模型的示意图。
[0175]
通过上述过程，可以实现跨域推荐任务的模型预测，实现跨域训练的特征自适应。该跨域推荐任务可以利用从当前域和其他域中学习到的特征信息共同作用于当前域的推荐预测中。此外，在以主推荐任务模式进行模型训练时，可以强化主推荐任务的训练效果，并且通过多种样本数据联合训练和损失函数的动态调整可以高效地将其他域所贡献的特征信息传递到主域中。
[0176]
经过对上述训练得到的目标预测模型进行大量测试发现该目标预测模型的预测准确率和效率相对于现有技术均有较大的提升，且通过该方式，目标应用中的各个推荐任务(设包括针对短视频的推荐任务1、针对歌房的推荐任务2、针对直播间的推荐任务3)在观
看时长上均有大幅度提升。如参见下述表1：
[0177]
数据集曝光量观看时长短视频161844万32368万歌房59762万11952万直播7451万1490万
[0178]
表1
[0179]
其中，利用数据集对该目标预测模型进行测试得知，针对短视频的推送曝光量约161844万次，有效观看时长约32368万次；针对歌房的推送曝光量约59762万次，有效观看时长为11952万次；针对直播的推送曝光量约7451万次，有效观看时长为1490万次
[0180]
以及通过与现有基于直接将交集用户的样本数据进行整合而得到的预测模型进行对比，发现本技术技术方案所提出的目标预测模型的模型评估指标auc(area under the curve，曲线下面积)也有较大的提升。auc越大表示模型的训练效果越好、预测准确率越高。如参见下述表2：
[0181]
模型auc现有预测模型0.8259目标预测模型0.8346
[0182]
表2
[0183]
以及，选取线上10％的用户进行比对，发现在应用本技术技术方案所提出的目标预测模型时所得到的人均观看时长和总观看时长均优于应用上述现有预测模型。如参见下述表3：
[0184][0185]
表3
[0186]
其中，应用目标预测模型时的人均观看时长高于应用现有预测模型时的人均观看时长约2.02％；应用目标预测模型时的总观看时长高于应用现有预测模型时的总观看时长约2.36％。
[0187]
以及，在对当前域行为行为不足的新用户进行推荐预测时，本技术技术方案所提出的目标预测模型在人均观看时长和总观看时长同样优于应用上述现有预测模型。如参见下述表4：
[0188][0189]
表4
[0190]
其中，应用目标预测模型时新用户的人均观看时长高于应用现有预测模型时新用户的人均观看时长约3.59％；应用目标预测模型时新用户的总观看时长高于应用现有预测模型时新用户的总观看时长约3.48％。
[0191]
本技术实施例中，可以获取m个样本信息集合，将每个样本信息集合输入初始预测模型，基于初始预测模型生成每个样本信息集合对应的样本概率，根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数，根据目标损失函数、每个样本信息集合对应的样本概率和对应的概率标签训练初始预测模型，得到目标预测模型。通过上述方法，利用多个包含不同类型的样本推荐资源进行联合训练可以使得目标预测模型可以对多种待推荐资源联合推荐，以及在训练时可以动态调整目标损失函数，从而提高模型的训练效果。
[0192]
请参见图10，图10为本技术提供的一种数据处理装置的结构示意图；该数据处理装置可以用于是运行于电子设备中的一个计算机程序(包括程序代码)，例如该数据处理装置可以是电子设备中的应用程序(如可以进行数据处理的程序)。需要说明的是，图10所示的数据处理装置，用于执行本技术图2、图4和图8所示实施例的方法中的部分或全部步骤。该数据处理装置1000可包括：获取模块1001、处理模块1002、确定模块1003。其中：
[0193]
获取模块1001，用于获取推荐信息集合；该推荐信息集合包括目标对象的对象属性信息和对象行为信息、待推荐资源的资源属性信息和资源行为信息；
[0194]
处理模块1002，用于根据推荐信息集合生成推荐特征集合；该推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征以及资源行为信息的资源行为特征；
[0195]
确定模块1003，用于根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子；
[0196]
确定模块1003，还用于根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征；
[0197]
确定模块1003，还用于根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。
[0198]
在一个可能的实施方式中，上述目标概率由目标预测模型生成；处理模块1002还用于：
[0199]
获取m个样本信息集合；一个样本信息集合包括一个样本对象的样本对象属性信息和样本对象行为信息、一个样本推荐资源的样本资源属性信息和样本资源行为信息；每个样本信息集合均具有概率标签和资源类型标签，m个样本信息集合具有r种资源类型标签，m为大于1的正整数，r为大于1且小于或等于m的正整数；
[0200]
将每个样本信息集合输入初始预测模型，基于初始预测模型生成每个样本信息集合对应的样本概率；任一个样本概率表示对应样本信息集合中的样本对象对该样本信息集合中的样本推荐资源响应推荐行为的概率；
[0201]
根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数；
[0202]
根据目标损失函数、每个样本信息集合对应的样本概率和对应的概率标签训练初始预测模型，得到目标预测模型。
[0203]
在一个可能的实施方式中，处理模块1002在用于基于初始预测模型生成每个样本信息集合对应的样本概率时，具体用于：
[0204]
基于初始预测模型生成第j个样本信息集合对应的样本特征集合；该样本特征集
合包括第j个样本信息集合中样本对象属性信息的样本对象属性特征、样本对象行为信息的样本对象行为特征、样本资源属性信息的样本资源属性特征、样本资源行为信息的样本资源行为特征；第j个样本信息集合为m个样本信息集合中任一个样本信息集合，j为小于或等于m的正整数；
[0205]
根据样本对象属性特征和样本资源属性特征生成样本对象行为特征的样本影响因子和样本资源行为特征的样本影响因子；
[0206]
根据样本对象行为特征的样本影响因子确定目标样本对象行为特征，并根据样本资源行为特征的样本影响因子确定目标样本资源行为特征；
[0207]
根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率。
[0208]
在一个可能的实施方式中，初始预测模型包括r个初始概率预测网络，一种资源类型标签对应一个初始概率预测网络；
[0209]
处理模块1002在用于根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率时，具体用于：
[0210]
在第j个初始概率预测网络中，根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征生成第j个样本信息集合对应的样本概率；
[0211]
其中，第j个初始概率预测网络为r个初始概率预测网络中第j个资源类型标签对应的初始概率预测网络，第j个资源类型标签为第j个样本信息集合在r种资源类型标签中所具有的资源类型标签。
[0212]
在一个可能的实施方式中，上述初始预测模型包括r个初始概率预测网络，所述r种资源类型标签关联r个初始损失函数；处理模块1002在用于根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数时，具体用于：
[0213]
获取r个初始概率预测网络中的目标概率预测网络；
[0214]
根据目标概率预测网络对应的资源类型标签的数量确定目标概率预测网络对应的资源类型标签所对应的目标初始损失函数的训练权重；
[0215]
根据目标初始损失函数的训练权重和r个初始损失函数确定目标损失函数。
[0216]
在一个可能的实施方式中，r种资源类型标签关联r个初始损失函数；处理模块1002在用于根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数时，具体用于：
[0217]
根据每种资源类型标签的数量确定每个初始损失函数的训练权重；
[0218]
根据每个初始损失函数的训练权重对r个初始损失函数加权求和，得到目标损失函数。
[0219]
在一个可能的实施方式中，确定模块1003在用于根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子时，具体用于：
[0220]
对对象属性特征和资源属性特征进行特征融合，得到融合属性特征；
[0221]
根据融合属性特征生成对象行为特征的影响因子和资源行为特征的影响因子。
[0222]
在一个可能的实施方式中，上述对象行为特征的数量为n，n为大于1的正整数，n个对象行为特征中的任一个表示为第i个对象行为特征，i为小于或等于n的正整数；
[0223]
确定模块1003在用于根据对象行为特征的影响因子和对象行为特征确定目标对
象行为特征时，具体用于：
[0224]
根据n个对象行为特征对第i个对象行为特征进行特征提取，得到第i个对象行为特征的对象提取特征；
[0225]
根据第i个对象行为特征的对象提取特征和第i个对象行为特征的影响因子确定第i个对象行为特征对应的目标对象行为特征。
[0226]
根据本技术的一个实施例，图10所示的数据处理装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本技术的实施例的技术效果的实现。上述单元是基于逻辑功能划分的，在实际应用中，一个单元的功能也可以由多个单元来实现，或者多个单元的功能由一个单元实现。
[0227]
在本技术的其它实施例中，该数据处理装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。根据本技术的另一个实施例，可以通过在包括中央处理单元(cpu)、随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2、图4和图8所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图10中所示的数据处理装置，以及来实现本技术实施例的数据处理方法。计算机程序可以记载于例如计算机可读记录介质上，并通过计算机可读记录介质装载于上述电子设备中，并在其中运行。
[0228]
本技术实施例中，获取模块获取推荐信息集合；处理模块根据推荐信息集合生成推荐特征集合；该推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征以及资源行为信息的资源行为特征；确定模块根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子；确定模块根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征；确定模块根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。通过上述装置，不仅可以结合更多的特征信息确定目标概率，还可以通过影响因子对对象行为特征和资源行为特征进行特征选择以确定在预测过程中更适配的目标行为特征，因此可以提高对待推荐资源的推荐预测效率和准确率，进而有利于提升后续基于目标概率进行推荐的效果。
[0229]
在本技术各个实施例中的各功能模块可以集成在一个模块中，也可以是各个模块单独物理存在，也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现，本技术不做限定。
[0230]
请参见图11，图11为本技术实施例提供的一种电子设备的结构示意图。如图11所示，该电子设备1100包括：处理器1101、通信接口1102以及计算机可读存储介质1103。其中，处理器1101、通信接口1102以及计算机可读存储介质1103可通过总线或者其它方式连接。其中，通信接口1102用于接收和发送数据。计算机可读存储介质1103可以存储在电子设备的存储器中，计算机可读存储介质1103用于存储计算机程序，计算机程序包括程序指令，处理器1101用于执行计算机可读存储介质1103存储的程序指令。处理器1101(或称cpu
(central processing unit，中央处理器))是电子设备的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。
[0231]
本技术实施例还提供了一种计算机可读存储介质(memory)，计算机可读存储介质是电子设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机可读存储介质既可以包括电子设备中的内置存储介质，当然也可以包括电子设备所支持的扩展存储介质。计算机可读存储介质提供存储空间，该存储空间存储了电子设备的处理系统。并且，在该存储空间中还存放了适于被处理器1101加载并执行的一条或多条的指令，这些指令可以是一个或多个的计算机程序(包括程序代码)。需要说明的是，此处的计算机可读存储介质可以是高速ram存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器；可选地，还可以是至少一个位于远离前述处理器的计算机可读存储介质。
[0232]
在一个实施例中，该计算机可读存储介质中存储有一条或多条指令；由处理器1101加载并执行计算机可读存储介质中存放的一条或多条指令，以实现上述文档处理方法实施例中的相应步骤；具体实现中，计算机可读存储介质中的一条或多条指令由处理器1101加载并执行如下步骤：
[0233]
获取推荐信息集合；该推荐信息集合包括目标对象的对象属性信息和对象行为信息、待推荐资源的资源属性信息和资源行为信息；
[0234]
根据推荐信息集合生成推荐特征集合；该推荐特征集合包括对象属性信息的对象属性特征、对象行为信息的对象行为特征、资源属性信息的资源属性特征以及资源行为信息的资源行为特征；
[0235]
根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子；
[0236]
根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征，并根据资源行为特征的影响因子和资源行为特征确定目标资源行为特征；
[0237]
根据对象属性特征、资源属性特征、目标对象行为特征和目标资源行为特征确定目标对象对待推荐资源响应推荐行为的目标概率，并按照目标概率将待推荐资源推送至目标对象的对象终端。
[0238]
在一个可能的实施方式中，上述目标概率由目标预测模型生成；处理器1101还用于：
[0239]
获取m个样本信息集合；一个样本信息集合包括一个样本对象的样本对象属性信息和样本对象行为信息、一个样本推荐资源的样本资源属性信息和样本资源行为信息；每个样本信息集合均具有概率标签和资源类型标签，m个样本信息集合具有r种资源类型标签，m为大于1的正整数，r为大于1且小于或等于m的正整数；
[0240]
将每个样本信息集合输入初始预测模型，基于初始预测模型生成每个样本信息集合对应的样本概率；任一个样本概率表示对应样本信息集合中的样本对象对该样本信息集合中的样本推荐资源响应推荐行为的概率；
[0241]
根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数；
[0242]
根据目标损失函数、每个样本信息集合对应的样本概率和对应的概率标签训练初始预测模型，得到目标预测模型。
[0243]
在一个可能的实施方式中，处理器1101在用于基于初始预测模型生成每个样本信息集合对应的样本概率时，具体用于：
[0244]
基于初始预测模型生成第j个样本信息集合对应的样本特征集合；该样本特征集合包括第j个样本信息集合中样本对象属性信息的样本对象属性特征、样本对象行为信息的样本对象行为特征、样本资源属性信息的样本资源属性特征、样本资源行为信息的样本资源行为特征；第j个样本信息集合为m个样本信息集合中任一个样本信息集合，j为小于或等于m的正整数；
[0245]
根据样本对象属性特征和样本资源属性特征生成样本对象行为特征的样本影响因子和样本资源行为特征的样本影响因子；
[0246]
根据样本对象行为特征的样本影响因子确定目标样本对象行为特征，并根据样本资源行为特征的样本影响因子确定目标样本资源行为特征；
[0247]
根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率。
[0248]
在一个可能的实施方式中，初始预测模型包括r个初始概率预测网络，一种资源类型标签对应一个初始概率预测网络；
[0249]
处理器1101在用于根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征确定第j个样本信息集合对应的样本概率时，具体用于：
[0250]
在第j个初始概率预测网络中，根据对象属性特征、资源属性特征、目标样本对象行为特征和目标样本资源行为特征生成第j个样本信息集合对应的样本概率；
[0251]
其中，第j个初始概率预测网络为r个初始概率预测网络中第j个资源类型标签对应的初始概率预测网络，第j个资源类型标签为第j个样本信息集合在r种资源类型标签中所具有的资源类型标签。
[0252]
在一个可能的实施方式中，上述初始预测模型包括r个初始概率预测网络，所述r种资源类型标签关联r个初始损失函数；处理器1101在用于根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数时，具体用于：
[0253]
获取r个初始概率预测网络中的目标概率预测网络；
[0254]
根据目标概率预测网络对应的资源类型标签的数量确定目标概率预测网络对应的资源类型标签所对应的目标初始损失函数的训练权重；
[0255]
根据目标初始损失函数的训练权重和r个初始损失函数确定目标损失函数。
[0256]
在一个可能的实施方式中，r种资源类型标签关联r个初始损失函数；处理器1101在用于根据每种资源类型标签的数量确定针对m个样本信息集合的目标损失函数时，具体用于：
[0257]
根据每种资源类型标签的数量确定每个初始损失函数的训练权重；
[0258]
根据每个初始损失函数的训练权重对r个初始损失函数加权求和，得到目标损失函数。
[0259]
在一个可能的实施方式中，处理器1101在用于根据对象属性特征和资源属性特征确定对象行为特征的影响因子和资源行为特征的影响因子时，具体用于：
[0260]
对对象属性特征和资源属性特征进行特征融合，得到融合属性特征；
[0261]
根据融合属性特征生成对象行为特征的影响因子和资源行为特征的影响因子。
[0262]
在一个可能的实施方式中，上述对象行为特征的数量为n，n为大于1的正整数，n个对象行为特征中的任一个表示为第i个对象行为特征，i为小于或等于n的正整数；
[0263]
处理器1101在用于根据对象行为特征的影响因子和对象行为特征确定目标对象行为特征时，具体用于：
[0264]
根据n个对象行为特征对第i个对象行为特征进行特征提取，得到第i个对象行为特征的对象提取特征；
[0265]
根据第i个对象行为特征的对象提取特征和第i个对象行为特征的影响因子确定第i个对象行为特征对应的目标对象行为特征。
[0266]
具体实现中，上述所描述的装置、处理器、存储器等可执行上述方法实施例所描述的实现方式，也可执行本技术实施例所描述的实现方式，在此不再赘述。
[0267]
本领域普通技术人员可以意识到，结合本技术中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用，使用不同方法来实现所描述的功能，但是这种实现不应认为超出本技术的范围。
[0268]
本技术实施例还提供了一种计算机程序产品，该计算机程序产品包括程序指令，该程序指令被处理器执行时可实现上述方法中的部分或全部步骤。比如可以是将程序指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序指令，处理器执行该程序指令，使得该计算机设备执行上述方法中的部分或全部步骤。
[0269]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程设备。计算机指令可以存储在计算机可读存储介质中，或者通过计算机可读存储介质进行传输。计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如，同轴电缆、光纤、数字对象线(dsl))或无线(例如，红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如，固态硬盘(solid state disk，ssd))等。
[0270]
以上所述，仅为本技术的具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王国瑞
技术所有人：腾讯音乐娱乐科技（深圳）有限公司
我是此专利的发明人

上一篇：一种水族箱底部砂石固化的制作工艺的制作方法
上一篇：双洗机的水路控制方法、电器及双洗机与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。