本申请涉及数据处理,尤其涉及一种数据处理方法、电子设备及存储介质。
背景技术:
1、在推荐任务中,主要目的旨在准确预测出对象针对多个推荐数据的推荐度,并基于该推荐度将对象可能感兴趣的推荐数据推送至对象终端,以提高推荐效果。例如,推荐数据为笔记,可以通过确定对象的对象特征和笔记的笔记特征之间的特征相似度来确定对象针对笔记的推荐度。现有预测方式通常是构建包含对象特征和推荐数据特征的特征对,以利用特征对进行初始模型的训练。比如,通过每个特征对中对象特征和推荐数据特征之间的特征相似度训练初始模型。然而,该方式下,仅通过对象特征和推荐数据特征之间的特征相似度进行训练,使得模型能够学习到的信息不够充足,训练得到的模型的准确率不高,导致针对推荐数据的推荐效果差。
技术实现思路
1、本申请实施例提供了一种数据处理方法、电子设备及存储介质,可以提高针对推荐数据的推荐效果。
2、一方面,本申请实施例提供了一种数据处理方法,该方法包括:
3、获取n个推荐样本集;一个推荐样本集包括一个样本对象的对象特征和一个推荐样本的推荐特征集,一个推荐特征集包括多种推荐特征下的特征信息;多种推荐特征基于任两种推荐特征之间的特征相关度被划分至第一特征集中和第二特征集中;一个推荐样本集包括的推荐特征集基于第一特征集和第二特征集被划分至一个第一推荐子集中和一个第二推荐子集中;n为正整数;
4、基于每个推荐样本集对应的第一推荐子集及对应的第二推荐子集构建每个推荐样本集关联的正样本特征集和关联的n-1个负样本特征集;
5、将n个推荐样本集、每个推荐样本集关联的正样本特征集及关联的n-1个负样本特征集输入初始模型,分别得到每个推荐样本集对应的第一特征相似度、每个推荐样本集关联的正样本特征集对应的第二特征相似度及关联的n-1个负样本特征集对应的第三特征相似度;
6、基于每个推荐样本集分别对应的第一特征相似度、对应的第二特征相似度和对应的第三特征相似度训练初始模型,得到目标模型;
7、获取目标对象的目标对象特征和推荐数据的目标特征集,基于目标模型确定目标对象特征和目标特征集之间的目标特征相似度,并基于目标特征相似度确定目标对象针对推荐数据的推荐度。
8、一方面,本申请实施例提供了一种数据处理装置,该装置包括:
9、获取模块,用于获取n个推荐样本集;一个推荐样本集包括一个样本对象的对象特征和一个推荐样本的推荐特征集,一个推荐特征集包括多种推荐特征下的特征信息;多种推荐特征基于任两种推荐特征之间的特征相关度被划分至第一特征集中和第二特征集中;一个推荐样本集包括的推荐特征集基于第一特征集和第二特征集被划分至一个第一推荐子集中和一个第二推荐子集中;n为正整数;
10、处理模块,用于基于每个推荐样本集对应的第一推荐子集及对应的第二推荐子集构建每个推荐样本集关联的正样本特征集和关联的n-1个负样本特征集;
11、处理模块,还用于将n个推荐样本集、每个推荐样本集关联的正样本特征集及关联的n-1个负样本特征集输入初始模型,分别得到每个推荐样本集对应的第一特征相似度、每个推荐样本集关联的正样本特征集对应的第二特征相似度及关联的n-1个负样本特征集对应的第三特征相似度;
12、处理模块,还用于基于每个推荐样本集分别对应的第一特征相似度、对应的第二特征相似度和对应的第三特征相似度训练初始模型,得到目标模型;
13、确定模块,用于获取目标对象的目标对象特征和推荐数据的目标特征集,基于目标模型确定目标对象特征和目标特征集之间的目标特征相似度,并基于目标特征相似度确定目标对象针对推荐数据的推荐度。
14、一方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,执行上述方法中的部分或全部步骤。
15、一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
16、相应地,根据本申请的一个方面,提供了一种计算机程序产品或者计算机程序,该计算机程序产品或计算机程序包括程序指令,该程序指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该计算机设备执行上述方法中的部分或全部步骤。
17、本申请实施例中,可以获取n个推荐样本集,基于每个推荐样本集对应的第一推荐子集及第二推荐子集构建每个推荐样本集关联的正样本特征集和负样本特征集,该每个正样本特征集和每个负样本特征集均包括两种特征(比如两种推荐子集,如包括同一个推荐样本集对应的第一推荐子集和第二推荐子集或不同推荐样本集对应的第一推荐子集和第二推荐子集);将n个推荐样本集、每个推荐样本集关联的正样本特征集及负样本特征集输入初始模型,得到每个推荐样本集对应的第一特征相似度、第二特征相似度及第三特征相似度,基于分别对应的第一特征相似度、第二特征相似度和第三特征相似度训练初始模型得到目标模型,获取目标对象的目标对象特征和推荐数据的目标特征集,基于目标模型确定目标对象特征和目标特征集之间的目标特征相似度,基于目标特征相似度确定目标对象针对推荐数据的推荐度。通过上述方法,不仅可以结合推荐样本集的第一特征相似度(比如为对象特征和推荐特征集之间的特征相似度)训练初始模型,还可以结合每个推荐样本集关联的正样本特征集的第二特征相关度(比如为正样本特征集包括的两种特征之间的特征相似度)以及负样本特征集的第三特征相似度(比如为负样本特征集中包括的两种特征之间的特征相似度),使得初始模型在训练过程中可以基于前述多种特征相似度学习到更多信息,以使训练出的目标模型的预测更准确,从而提高针对推荐数据的推荐效果。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述多种推荐特征包括第一推荐特征、第二推荐特征和第三推荐特征,所述第一推荐特征和所述第二推荐特征之间的特征相关度大于相关度阈值;
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,所述多种推荐特征包括第一推荐特征和第二推荐特征,所述第一推荐特征包括多种第一特征信息,所述第二推荐特征包括多种第二特征信息;所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,所述n个推荐样本集中的第i个推荐样本集关联的正样本特征集包括:所述第i个推荐样本集对应的第一推荐子集及对应的第二推荐子集;
6.根据权利要求5所述的方法,其特征在于,所述第i个推荐样本集对应的第一特征相似度为所述第i个推荐样本集包括的对象特征及其推荐特征集之间的特征相似度;
7.根据权利要求1所述的方法,其特征在于,所述基于所述第一特征相似度、所述第二特征相似度和所述第三特征相似度训练所述初始模型,得到目标模型,包括:
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
9.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。