本公开涉及推荐系统,尤其是一种用于向用户推荐内容的推荐模型的训练方法和装置。
背景技术:
1、随着技术的飞速发展,数据量也与日俱增,人们越来越感觉在海量数据面前束手无策,由此出现了推荐系统。推荐系统能够通过分析、挖掘用户行为,发现用户的个性化需求与兴趣特点,将用户可能感兴趣的信息或商品推荐给用户。推荐系统的应用有利于解决信息过载的问题,也有利于提高用户的使用体验。
2、推荐系统的关键在于推荐模型,好的推荐模型能够有效提升推荐系统的能力。要想实现推荐模型的最佳效果,需要对推荐模型进行训练,以便调试出最佳的模型参数。
技术实现思路
1、本公开一个或多个实施例的目的之一是提供用于向用户推荐内容的推荐模型的训练方法、装置及计算机可读存储介质。
2、根据本公开实施例的第一方面,提供一种用于向用户推荐内容的推荐模型的训练方法,由服务端执行,包括:响应于接收到客户端发送的所述用户对页面的请求,发送响应到所述客户端,所述响应携带与所述请求相关联的请求时刻、以及基于所述推荐模型生成的与所述页面相关联的多个内容;接收所述客户端响应于所述用户针对与所述页面相关联的多个内容中的一个或多个内容的用户行为而发送的埋点数据,其中埋点数据携带所述请求时刻;响应于当前时刻相对于所述请求时刻经过第一时间段,基于与携带所述请求时刻的当前已接收的所有埋点数据相关联的数据样本对所述推荐模型进行第一训练;并且响应于当前时刻相对于所述请求时刻经过大于第一时间段的第二时间段,基于与携带所述请求时刻的当前已接收的所有埋点数据相关联的数据样本对所述推荐模型进行第二训练。
3、在一些实施例中,第一时间段等于单位时长,第二时间段大于或等于三倍的单位时长。
4、在一些实施例中,第二时间段大于第一时间段的程度是基于所述内容的特性预先确定的。
5、在一些实施例中,单位时长为1小时。
6、在一些实施例中,单位时长是基于所述内容的特性预先确定的。
7、在一些实施例中,响应于所述内容所需的观看时长大于或等于预设值,第二时间段比第一时间段大第一预设时长;响应于所述内容所需的观看时长小于预设值,第二时间段比第一时间段大第二预设时长;所述第一预设时长大于所述第二预设时长。
8、在一些实施例中,所述响应还携带用于标识所述请求的事件标识符和用于标识与所述页面相关联的多个内容中的每个内容的内容标识符;所述埋点数据还携带所述事件标识符和所述埋点数据对应的用户行为所针对的内容的所述内容标识符;与埋点数据相关联的数据样本是根据所述埋点数据中携带的对应的用户行为的参数、所述事件标识符和所述内容标识符生成的。
9、在一些实施例中,与埋点数据相关联的数据样本还根据所述用户特征生成,所述用户特征包括年龄、性别和所在地中的一个或多个。
10、在一些实施例中,所述用户特征由所述服务端预先存储,所述服务端根据埋点数据中携带的所述事件标识符来获取与所述请求对应的所述用户的所述用户特征。
11、在一些实施例中,所述用户行为包括展示内容、点击内容或观看内容。
12、在一些实施例中,所述方法还包括:在存储器中创建多个存储分区,每个存储分区对应一个特定时间段,将接收到的埋点数据按照其携带的所述请求时刻所属的时间段存储在对应的存储分区中。
13、在一些实施例中,所述请求时刻为所述服务端接收到所述请求的时刻。
14、根据本公开实施例的第二方面,提供一种用于推荐系统的操作方法,所述推荐系统包括基于推荐模型向用户推荐内容的服务端,所述方法由所述服务端执行,所述方法包括:接收来自各客户端的埋点数据,埋点数据中的特定埋点数据与特定用户针对特定页面中的特定内容的用户行为相关联,每个埋点数据携带针对所对应的特定页面的请求的请求时刻;以第一时间间隔周期性地基于第一样本集对所述推荐模型进行第一训练以更新模型参数,第一样本集基于当前已接收的所有第一埋点数据生成,第一埋点数据携带的请求时刻与当前时刻的间隔小于第一时间间隔;以及以第二时间间隔周期性地基于第二样本集对所述推荐模型进行第二训练以更新模型参数,第二样本集基于当前已接收的所有第二埋点数据生成,第二埋点数据携带的请求时刻与当前时刻的间隔大于第二时间间隔并且小于两倍的第二时间间隔,其中,第一时间间隔等于单位时长,第二时间间隔大于或等于三倍的单位时长。
15、在一些实施例中,所述方法还包括:在存储器中创建多个存储分区,所述多个存储分区分别对应连续的多个时间段,每个时间段的时长等于单位时长;将接收到的埋点数据按照其携带的请求时刻所属的时间段存储在对应的存储分区中。
16、在一些实施例中,所述方法还包括:以第一时间间隔周期性地、基于与当前时刻最临近的一个时间段所对应的存储分区中的所有埋点数据生成第一样本集。
17、在一些实施例中,所述方法还包括:以第二时间间隔周期性地、基于与当前时刻间隔大于第二时间间隔并且小于两倍的第二时间间隔的多个时间段所对应的多个存储分区中的所有埋点数据生成第二样本集。
18、在一些实施例中,所述方法还包括:以第一时间间隔周期性地、基于与当前时刻间隔在预设范围的一个时间段所对应的存储分区中的所有埋点数据生成第二样本集的一个特定子集;在进行第二训练之前,将第二样本集的多个特定子集合成为第二样本集,其中所述预设范围包括大于第二时间间隔并且小于第一时间间隔与第二时间间隔之和、或者包括大于第二时间间隔与第一时间间隔之差并且小于第二时间间隔。
19、在一些实施例中,第一时间间隔为1小时,第二时间间隔为24小时。
20、在一些实施例中,每个埋点数据还携带由服务器指定的指示对应的特定页面的事件标识符和指示对应的特定内容的内容标识符,其中,基于埋点数据生成样本集包括:关联具有相同内容标识符的一个或多个用户行为、以及关联与事件标识符对应的特定页面的请求用户的用户特征,以生成样本。
21、在一些实施例中,所述请求时刻为所述服务端接收到所述请求的时刻。
22、根据本公开实施例的第三方面,提供一种用于向用户推荐内容的推荐模型的训练装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行上述任意一个实施例所述的方法。
23、根据本公开实施例的第四方面,提供一种计算机可读存储介质,包括计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述任意一个实施例所述的方法。
24、根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一个实施例所述的方法。
25、下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
1.一种用于向用户推荐内容的推荐模型的训练方法,由服务端执行,包括:
2.根据权利要求1所述的方法,其中,
3.根据权利要求1所述的方法,其中,
4.根据权利要求3所述的方法,其中,
5.根据权利要求1所述的方法,还包括:
6.根据权利要求1所述的方法,其中,所述请求时刻为所述服务端接收到所述请求的时刻。
7.一种用于推荐系统的操作方法,所述推荐系统包括基于推荐模型向用户推荐内容的服务端,所述方法由所述服务端执行,所述方法包括:
8.根据权利要求7所述的方法,还包括:
9.根据权利要求8所述的方法,还包括:
10.根据权利要求8所述的方法,还包括: