本技术涉及数据,尤其涉及行为数据预测模型的训练方法、对象表示方法及相关产品。
背景技术:
1、近年来,推荐系统中常见的一种建模方式为基于对象的行为数据构建预测模型,以便推荐系统可以根据该模型预测出的行为数据对对象推荐其感兴趣的内容。然而已有的行为数据预测模型大多都是在单域数据下训练的,也即在相关技术中收集对象在每个领域产生的行为数据,并根据对象在每个域产生的行为数据来构建对象在每个领域下对应的行为数据预测模型,以在不同的领域下使用不同的行为数据预测模型来预测对象的行为数据,如此导致模型的训练成本非常高。
2、由此,如何降低模型的训练成本,已经成为当前领域亟待解决的技术问题。
技术实现思路
1、本技术实施例提供了行为数据预测模型的训练方法、对象表示方法及相关产品,旨在降低模型的训练成本。
2、本技术第一方面提供了一种行为数据预测模型的训练方法,包括:
3、获取对象的行为数据序列,所述行为数据序列包括所述对象在多个领域下执行预设行为后产生的多个第一行为数据,所述多个领域用于表示支持所述对象执行预设行为的场景;
4、将所述多个第一行为数据中的部分第一行为数据标记为实际行为数据,并遮挡所述部分第一行为数据获得目标行为数据序列中的目标行为数据,所述目标行为数据序列包括所述目标行为数据和所述多个第一行为数据中未标记为实际行为数据的其余行为数据;其中,将所述目标行为数据作为待训练行为数据预测模型的待预测行为数据;
5、通过处理所述目标行为数据序列中的目标行为数据和其余行为数据,获得多个行为数据向量、多个行为数据位置向量和多个行为数据域向量,所述域向量对应于所述多个领域中的一个领域;
6、将经过处理后得到的多个行为数据向量、多个行为数据位置向量和多个行为数据域向量进行拼接,获得行为数据向量序列;
7、将所述行为数据向量序列输入至待训练行为数据预测模型中,通过所述待训练行为数据预测模型对所述待预测行为数据进行预测,获得预测行为数据;
8、根据所述实际行为数据和所述预测行为数据之间的差异,调整所述待训练行为数据预测模型的参数,当调整后的模型满足训练截止条件时,完成训练获得行为数据预测模型。
9、本技术第二方面提供了一种对象表示方法,包括:
10、获取目标对象的行为数据序列,所述目标对象的行为数据序列包括所述目标对象在多个领域下执行预设行为后产生的多个第一行为数据,所述多个领域用于表示支持所述目标对象执行预设行为的场景;
11、对所述目标对象的行为数据序列中的多个第一行为数据进行处理,获得所述目标对象的行为数据序列中的多个第一行为数据对应的第一行为数据向量、第一行为数据位置向量和第一行为数据域向量;
12、将多个第一行为数据对应的第一行为数据向量、第一行为数据位置向量和第一行为数据域向量进行拼接,获得所述目标对象的行为数据向量序列;
13、将所述目标对象的行为数据向量序列输入至行为数据预测模型中,通过所述行为数据预测模型对所述多个第一行为数据进行预测,获得所述多个第一行为数据分别对应的向量;所述行为数据预测模型为根据权利要求1-8任一项所述的方法训练得到的模型;
14、将所述向量进行平均化处理,获得所述目标对象的对象特征向量。
15、本技术第三方面提供了一种行为数据预测模型的训练装置,包括:
16、第一行为数据序列获取单元,用于获取对象的行为数据序列,所述行为数据序列包括所述对象在多个领域下执行预设行为后产生的多个第一行为数据,所述多个领域用于表示支持所述对象执行预设行为的场景;
17、目标行为数据获得单元,用于将所述多个第一行为数据中的部分第一行为数据标记为实际行为数据,并遮挡所述部分第一行为数据获得目标行为数据序列中的目标行为数据,所述目标行为数据序列包括所述目标行为数据和所述多个第一行为数据中未标记为实际行为数据的其余行为数据;其中,将所述目标行为数据作为待训练行为数据预测模型的待预测行为数据;
18、目标行为数据序列处理单元,用于通过处理所述目标行为数据序列中的目标行为数据和其余行为数据,获得多个行为数据向量、多个行为数据位置向量和多个行为数据域向量,所述域向量对应于所述多个领域中的一个领域;
19、行为数据向量序列获得单元,用于将经过处理后得到的多个行为数据向量、多个行为数据位置向量和多个行为数据域向量进行拼接,获得行为数据向量序列;
20、预测行为数据获得单元,用于将所述行为数据向量序列输入至待训练行为数据预测模型中,通过所述待训练行为数据预测模型对所述待预测行为数据进行预测,获得预测行为数据;
21、行为数据预测模型获得单元,用于根据所述实际行为数据和所述预测行为数据之间的差异,调整所述待训练行为数据预测模型的参数,当调整后的模型满足训练截止条件时,完成训练获得行为数据预测模型。
22、本技术第四方面提供了一种对象表示装置,包括:
23、第二行为数据序列获取单元,用于获取目标对象的行为数据序列,所述目标对象的行为数据序列包括所述目标对象在多个领域下执行预设行为后产生的多个第一行为数据,所述多个领域用于表示支持所述目标对象执行预设行为的场景;
24、多个第一行为数据处理单元,用于对所述目标对象的行为数据序列中的多个第一行为数据进行处理,获得所述目标对象的行为数据序列中的多个第一行为数据对应的第一行为数据向量、第一行为数据位置向量和第一行为数据域向量;
25、行为数据向量拼接单元,用于将多个第一行为数据对应的第一行为数据向量、第一行为数据位置向量和第一行为数据域向量进行拼接,获得所述目标对象的行为数据向量序列;
26、行为数据向量获得单元,用于与将所述目标对象的行为数据向量序列输入至行为数据预测模型中,通过所述行为数据预测模型对所述多个第一行为数据进行预测,获得所述多个第一行为数据分别对应的向量;
27、对象特征向量获得单元,用于将所述向量进行平均化处理,获得所述目标对象的对象特征向量。
28、本技术第五方面提供了一种计算机设备,所述设备包括处理器以及存储器:
29、所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
30、所述处理器用于根据所述计算机程序中的指令执行第一方面提供的行为数据预测模型的训练方法的步骤,或者第二方面提供的对象表示方法的步骤。
31、本技术第六方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被计算机设备执行时实现第一方面提供的行为数据预测模型的训练方法的步骤,或者第二方面提供的对象表示方法的步骤。
32、本技术第七方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被计算机设备执行时实现第一方面提供的行为数据预测模型的训练方法的步骤,或者第二方面提供的对象表示方法的步骤。
33、从以上技术方案可以看出,本技术实施例具有以下优点:
34、本技术技术方案中在模型训练之初,首先获取对象的行为数据序列,其中行为数据序列包括对象在多个领域下执行预设行为后产生的多个第一行为数据,多个领域用于表示支持对象执行预设行为的场景;然后将多个第一行为数据中的部分第一行为数据标记为实际行为数据,并遮挡部分第一行为数据获得目标行为数据序列中的目标行为数据,目标行为数据序列包括目标行为数据和多个第一行为数据中未标记为实际行为数据的其余行为数据,其中将目标行为数据作为待训练行为数据预测模型的待预测行为数据;在此阶段,通过处理目标行为数据序列中的目标行为数据和其余行为数据,获得多个行为数据向量、多个行为数据位置向量和多个行为数据域向量,其中域向量对应于多个领域中的一个领域,并将经过处理后得到的多个行为数据向量、多个行为数据位置向量和多个行为数据域向量进行拼接,获得行为数据向量序列;在模型训练阶段,将行为数据向量序列输入至待训练行为数据预测模型中,通过待训练行为数据预测模型对待预测行为数据进行预测,获得预测行为数据;最后根据实际行为数据和预测行为数据之间的差异,调整待训练行为数据预测模型的参数,当调整后的模型满足训练截止条件时,完成训练获得行为数据预测模型。结合上述模型训练过程可知,在本技术中通过获取对象在不同领域产生的行为数据来训练多域模型,如此解决了每个领域都需要训练模型导致的训练成本高的问题。并且对每个领域设计行为数据域向量以及对行为数据采用遮挡策略,进一步提高了模型训练的鲁棒性和预测行为数据的准确性。