本发明涉及视频推荐技术领域,特别是涉及一种推荐视频的确定方法、装置、电子设备及存储介质。
背景技术:
目前在网络平台中,为了使用户能够看到自己喜欢的视频,需要针对用户的喜好向用户推荐视频。视频可以分为多个种类,例如,美食、搞笑、游戏等,用户对每种视频的喜爱程度往往不同吗,也就形成了用户的兴趣分布,在视频推荐的场景中,可以根据用户的兴趣分布情况对视频进行推荐。
为了方便确定所要推荐的视频,可以为每个备选视频设定标签。假设视频的标签集合t={t1,t2,t3,…},举例而言t可以为{美食,搞笑,游戏…}。在确定推荐视频的过程中,可以根据用户的兴趣分布,对标签进行采样,然后根据采样得到标签确定推荐视频。
例如,一个用户的兴趣分布为{t1:0.4,t2:0.4,t3:0.2},假设要推荐10个视频,可以确定一个长度wl=w1+w2+w3=0.4+0.4+0.2=1的线段,其中权重w1、w2、w3将该线段分为三个区域。然后随机生成一个介于0-1的随机数,这个随机数位于哪个权重区域,该权重对应的标签就被采到。例如,采样后获得的标签列表为[t1,t2,t2,t1,t2,t3,t2,t1,t1,t2],那么根据每个标签的种类,从备选视频中确定对应的视频,即为推荐视频。
在上述确定推荐视频的过程中,在每次对标签采样时,都需要从头开始遍历上述权重构成的线段,并判断随机数是否处于当前区域内,在对标签的采样过程中,假设标签种类为n,推荐视频的数量为m,那么需要从头开始遍历上述权重构成的线段10次,需要时间复杂度可以记为o(nm),确定推荐视频的复杂度高,效率较低。
技术实现要素:
本发明实施例的目的在于提供一种推荐视频的确定方法、装置、电子设备及存储介质,以降低确定推荐视频的复杂度,提高效率。具体技术方案如下:
第一方面,本发明实施例提供了一种推荐视频的确定方法,所述方法包括:
获取备选视频及其对应的种类以及每个种类对应的推荐权重;
基于所述推荐权重构建权重模型,其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同;
基于待推荐视频的数量及所述推荐权重构建采样模型,其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同;
从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点;
从所述权重模型中确定所述采样点对应的权重点;
确定每个所述权重点所在权重区间对应的目标种类;
从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可选的,所述基于所述推荐权重构建权重模型的步骤,包括:
构建权重线段,其中,所述权重线段的长度为所述推荐权重的和;
根据所述推荐权重将所述权重线段划分为多个权重区间;
所述基于待推荐视频的数量及所述推荐权重构建采样模型的步骤,包括:
构建采样线段,其中,所述采样线段的长度为所述推荐权重的和;
根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
可选的,所述从所述权重模型中确定所述采样点对应的权重点的步骤,包括:
将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
可选的,所述确定每个所述权重点所在权重区间对应的目标种类的步骤,包括:
依次确定每个所述权重点所在的权重区间;
将所确定的权重区间对应的视频的种类确定为目标种类;
确定每个所述权重点所在的权重区间的方式,包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间;
针对非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间,其中,所述目标位置为所述非第一个权重点对应的采样点所在的采样区间的结尾所对应的所述权重线段中的位置。
可选的,所述从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点的步骤,包括:
从第一个所述采样区间中随机采集一个采样点r1;
根据公式rm=m×wl/m–r1确定其他采样区间的采样点,其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
可选的,在所述获取备选视频及其对应的种类以及每种种类对应的推荐权重的步骤之前,所述方法还包括:
获取用户的视频历史观看记录,其中,所述视频历史观看记录包括视频的种类及观看次数;
基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
可选的,所述方法还包括:
将所述推荐视频推荐给用户。
第二方面,本发明实施例提供了一种推荐视频的确定装置,所述装置包括:
备选视频获取模块,用于获取备选视频及其对应的种类以及每个种类对应的推荐权重;
权重模型构建模块,用于基于所述推荐权重构建权重模型,其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同;
采样模型构建模块,用于基于待推荐视频的数量及所述推荐权重构建采样模型,其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同;
采样点确定模块,用于从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点;
权重点确定模块,用于从所述权重模型中确定所述采样点对应的权重点;
目标种类确定模块,用于确定每个所述权重点所在权重区间对应的目标种类;
推荐视频确定模块,用于从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可选的,所述权重模型构建模块包括:
权重线段构建单元,用于构建权重线段,其中,所述权重线段的长度为所述推荐权重的和;
权重线段划分单元,用于根据所述推荐权重将所述权重线段划分为多个权重区间;
所述采样模型构建模块包括:
采样线段构建单元,用于模块构建采样线段,其中,所述采样线段的长度为所述推荐权重的和;
采样线段划分单元,用于根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
可选的,所述权重点确定模块包括:
权重点确定单元,用于将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
可选的,所述目标种类确定模块包括:
权重区间确定单元,用于依次确定每个所述权重点所在的权重区间;
目标种类确定单元,用于将所确定的权重区间对应的视频的种类确定为目标种类;
所述权重区间确定单元确定每个所述权重点所在的权重区间的方式,包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间;
针对非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间,其中,所述目标位置为所述非第一个权重点对应的采样点所在的采样区间的结尾所对应的所述权重线段中的位置。
可选的,所述采样点确定模块包括:
第一采样点确定单元,用于从第一个所述采样区间中随机采集一个采样点r1;
第二采样点确定单元,用于根据公式rm=m×wl/m–r1确定其他采样区间的采样点,其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
可选的,所述装置还包括:
观看记录获取模块,用于在所述获取备选视频及其对应的种类以及每种种类对应的推荐权重之前,获取用户的视频历史观看记录,其中,所述视频历史观看记录包括视频的种类及观看次数;
推荐权重确定模块,用于基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
可选的,所述装置还包括:
视频推荐模块,用于将所述推荐视频推荐给用户。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的推荐视频的确定方法步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的推荐视频的确定方法步骤。
本发明实施例所提供的方案中,电子设备可以获取备选视频及其对应的种类以及每个种类对应的推荐权重,基于荐权重构建权重模型,并基于待推荐视频的数量及推荐权重构建采样模型,然后一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点,从权重模型中确定采样点对应的权重点,进而确定每个权重点所在权重区间对应的目标种类,最后从备选视频中获取每个目标种类对应的视频,作为推荐视频。由于采样模型包括多个采样区间,多个采样区间的长度相同且总长度为推荐权重的和,采样区间的数量与待推荐视频的数量相同,这样,在确定每个权重点所在权重区间对应的目标种类时,无需均从权重模型的头部开始遍历,可以降低确定推荐视频的复杂度,提高确定推荐视频的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的一种推荐视频的确定方法的流程图;
图2为本发明实施例所提供的一种权重线段及采样线段的示意图;
图3为本发明实施例所提供的一种权重点的确定方式的示意图;
图4为本发明实施例所提供的一种推荐视频的确定装置的结构示意图;
图5为本发明实施例所提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了降低确定推荐视频的复杂度,提高效率,本发明实施例提供了一种推荐视频的确定方法、装置、电子设备及计算机可读存储介质。
下面首先对本发明实施例所提供的一种推荐视频的确定方法进行介绍。
本发明实施例所提供的一种推荐视频的确定方法可以应用于任意需要确定推荐视频的电子设备,例如,可以为服务器、终端等电子设备,在此不做具体限定,为了描述方便,后续简称电子设备。
如图1所示,一种推荐视频的确定方法,所述方法包括:
s101,获取备选视频及其对应的种类以及每个种类对应的推荐权重;
s102,基于所述推荐权重构建权重模型;
其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同。
s103,基于待推荐视频的数量及所述推荐权重构建采样模型;
其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同。
s104,从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点;
s105,从所述权重模型中确定所述采样点对应的权重点;
s106,确定每个所述权重点所在权重区间对应的目标种类;
s107,从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可见,本发明实施例所提供的方案中,电子设备可以获取备选视频及其对应的种类以及每个种类对应的推荐权重,基于荐权重构建权重模型,并基于待推荐视频的数量及推荐权重构建采样模型,然后从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点,从权重模型中确定采样点对应的权重点,进而确定每个权重点所在权重区间对应的目标种类,最后从备选视频中获取每个目标种类对应的视频,作为推荐视频。由于采样模型包括多个采样区间,多个采样区间的长度相同且总长度为推荐权重的和,采样区间的数量与待推荐视频的数量相同,这样,在确定每个权重点所在权重区间对应的目标种类时,无需均从权重模型的头部开始遍历,可以降低确定推荐视频的复杂度,提高确定推荐视频的效率。
在上述步骤s101中,电子设备可以获取备选视频及其对应的种类以及每个种类对应的推荐权重。其中,备选视频为可以作为推荐视频的备选的视频。备选视频一般可以分为多个种类,例如,搞笑、游戏、温馨、旅游等,在此不做具体限定。电子设备获取备选视频的同时可以获取其种类,以便于后续确定推荐视频。
由于不同用户对不同种类的视频的喜好不同,例如,有的人喜欢搞笑类型的视频,有的人喜欢旅游类型的视频等。所以为了有针对性地为用户推荐其喜欢的视频,可以获取每个种类的视频的推荐权重。其中,推荐权重为根据用户对各个种类的视频的感兴趣统计数据确定的,一般推荐权重越高,表明用户越喜欢其对应的种类的视频;推荐权重越低,表明用户越不喜欢其对应的种类的视频。
接下来,电子设备便可以基于所获取的推荐权重构建权重模型。该权重模型可以包括多个权重区间,权重区间的长度可以分别与推荐权重相同。由于一般备选视频包括多个种类,那么每个种类对应有一个推荐权重,推荐权重即为多个。在该权重模型中便可以包括多个权重区间,权重区间的数量与推荐权重的数量相同,权重区间的长度分别与推荐权重相同。
例如,备选视频的种类为美食、搞笑及游戏,对应的推荐权重分别为0.2、0.3及0.5,那么权重模型即可以包括三个权重区间,该三个权重区间的长度分别为0.2、0.3及0.5。
获取上述待推荐视频的数量及推荐权重后,电子设备便可以执行上述步骤s103,即基于待推荐视频的数量及推荐权重构建采样模型。其中,采样模型可以包括多个采样区间,多个采样区间的总长度为推荐权重的和,每个采样区间的长度相同,采样区间的数量与待推荐视频的数量相同。
也就是说,采样模型的总长度为推荐权重的和,将采样模型平均分为待推荐视频的数量个区间,即得到多个采样区间。例如,备选视频的种类为美食、搞笑及游戏,对应的推荐权重分别为0.2、0.3及0.5,待推荐视频的数量为10,那么采样模型的总长度为0.2+0.3+0.5=1,每个采样区间的长度为1/10=0.1。
确定了上述权重模型及采样模型后,电子设备可以从一个采样区间中确定一个采样点,并根据该采样点确定其他采样区间的采样点,也就是执行上述步骤s104。例如,以上述每个采样区间的长度为1/10=0.1,采样区间的数量为10为例,那么电子设备便可以在该10个采样区间中的一个采样区间确定一个采样点。
作为一种实施方式,电子设备可以从一个采样区间中随机采集一个采样点,也就是可以采用均匀采样方式在从一个采样区间中随机采集一个采样点。然后电子设备可以根据该采样点确定其他采样区间的采样点。具体来说,可以根据该采样点所在采样区间与其他采样区间的关系,确定其他采样区间的采样点。
例如,采样区间为4个,每个采样区间的长度为0.25,那么如果电子设备从第二个采样区间中随机采集一个采样点0.4,那么第一个采样区间的采样点可以为0.4-0.25=0.15,第三个采样区间的采样点可以为0.4+0.25=0.65,第四个采样区间的采样点可以为0.4+2×0.25=0.9。
进而,电子设备可以从上述权重模型中确定这些采样点对应的权重点。在一种实施方式中,电子设备可以根据采样点的位置以及权重模型与采样模型的对应关系,采用遍历权重模型的方式确定采样点对应的权重点。
例如,备选视频的种类为美食、搞笑及游戏,对应的推荐权重分别为0.2、0.3及0.5。权重模型包括三个权重区间,即第一权重区间、第二权重区间及第三权重区间,该三个权重区间的长度分别为0.2、0.3及0.5。每个采样区间的长度0.1,采样区间的数量为10。
那么如果第一个采样点为0.03,那么电子设备便可以从头开始遍历权重模型,进而确定第一个采样点0.03对应的权重点为第一权重区间中的点0.03。如果第二个采样点为0.67,由于采样点是分别从不同的采样区间确定的,所以第二个采样点不可能位于0-0.1之间,那么电子设备便可以从第一权重区间的点0.1之后开时遍历权重模型,二不是从头开始,进而减少所需的时间复杂度,提高遍历效率。接下来第三个至第十个采样点对应的权重点的确定方式与第二个采样点对应的权重点的确定方式相同,可以理解的是,每次需要遍历的权重模型的部分都在减少。
确定了采样点对应的权重点后,电子设备便可以确定每个权重点所在权重区间对应的目标种类。例如,权重模型包括三个权重区间,即第一权重区间、第二权重区间及第三权重区间,该三个权重区间的长度分别为0.2、0.3及0.5,对应的视频的种类分别为美食、搞笑及游戏。那么如果10个权重点中有2个所在权重区间为第一权重区间,那么该2个权重点所在权重区间对应的目标种类即为美食。
进而,电子设备便可以执行上述步骤s107,即从上述备选视频中获取每个目标种类对应的视频,作为推荐视频。由于每个采样点对应一个权重点,每个权重点对应一个目标种类,所以目标种类的数量与待推荐视频的数量相同。进而,从上述备选视频中获取每个目标种类对应的视频也就可以获取所需的推荐视频。
例如,在步骤s106中确定的目标种类为10个,分别为2个美食、2个搞笑及4个游戏,那么电子设备便可以从备选视频中获取2个种类为美食的备选视频、2个种类为搞笑的备选视频以及4个种类为游戏的备选视频,该10个备选视频即为推荐视频。
在一种实施方式中,为了保证每个备选视频均有可能被选为推荐视频,可在每种备选视频中选取视频时,可以采用随机采样的方式,随机从中选取视频作为推荐视频。
作为本发明实施例的一种实施方式,上述基于所述推荐权重构建权重模型的步骤,可以包括:
构建权重线段;根据所述推荐权重将所述权重线段划分为多个权重区间。
电子设备可以都建一个权重线段,其中,该权重线段的长度为上述推荐权重的和。例如,推荐权重分别为0.1、0.2、0.4及0.3,那么权重线段的长度为0.1+0.2+0.4+0.3=1。
构建权重线段后,电子设备可以根据推荐权重将该权重线段划分为多个权重区间,使得权重区间的长度分别与推荐权重相同。例如,如图2所示的权重线段210的示意图,权重线段的长度为推荐权重w1、w2…wn的和。权重区间的长度分别与推荐权重w1、w2…wn相同,其中,w1、w2…wn表示权重区间。
相应的,上述基于待推荐视频的数量及所述推荐权重构建采样模型的步骤,可以包括:
构建采样线段;根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
电子设备可以都建一个采样线段,其中,该采样线段的长度为上述推荐权重的和,也就是与上述权重线段的长度相同。例如,推荐权重分别为0.1、0.2、0.4及0.3,那么采样线段的长度为0.1+0.2+0.4+0.3=1。
构建采样线段后,电子设备可以根据待推荐视频的数量将采样线段划分为多个采样区间,使得每个采样区间的长度相同。例如,如图2所示的采样线段220的示意图,采样线段的长度为推荐权重w1、w2…wn的和。每个采样区间的长度相同,采样区间的数量为待推荐视频的数量m,其中,a1、a2…am表示采样区间。
可见,在本实施例中,电子设备可以构建权重线段,根据推荐权重将权重线段划分为多个权重区间,并构建采样线段,根据待推荐视频的数量将采样线段划分为多个采样区间。采用线段的形式表示权重模型及采样模型,可以简洁快速地构建权重模型及采样模型。
针对上述权重模型为权重线段,采样模型为采样线段的情况而言,作为本发明实施例的一种实施方式,上述从所述权重模型中确定所述采样点对应的权重点的步骤,可以包括:
将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
电子设备在从每个采样区间中确定一个采样点后,可以将采样点垂直映射至权重线段,这样也就得到采样点对应的点。其中,垂直映射即为将采样点映射至权重线段中与其位置对应的位置上。由于采样线段与权重线段的长度相同,电子设备可以将采样线段与权重线段对齐,以方便进行垂直映射。
例如,如图3所示,在采样线段320中确定了采样区间a2的采样点c2后,便可以将其垂直映射至权重线段310中,得到采样点c2对应的权重点d2。
可见,在本实施例中,电子设备可以将上述采样点垂直映射至权重线段,进而便可以得到每个采样点对应的权重点。这样,电子设备可以快速准确地确定每个采样点对应的权重点。
针对上述权重模型为权重线段,采样模型为采样线段的情况而言,作为本发明实施例的一种实施方式,上述确定每个所述权重点所在权重区间对应的目标种类的步骤,可以包括:
依次确定每个所述权重点所在的权重区间;将所确定的权重区间对应的视频的种类确定为目标种类;
由于采样点一般为多个,权重点也就为多个,并且在确定每个权重点所在的权重区间时,权重点之间时有影响的,所以电子设备可以依次确定每个权重点所在的权重区间,进而将所确定的权重区间对应的视频的种类确定为目标种类。
对于权重点来说,可以分为两类,一类为第一个权重点,一类为非第一个权重点,也就是除了第一权重点之外的其他权重点。其中,第一个权重点即为第一采样点对应的权重点,第一采样点即为从第一个采样区间中确定的采样点。
例如,如图3所示,采样区间a1为第一个采样区间,从采样区间a1中确定的采样点即为第一个采样点,其对应的权重点也就是第一个权重点。
根据上述两类权重点,作为一种实施方式,确定每个权重点所在的权重区间的方式,可以包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间。
对于第一类权重点,也就是第一个权重点,由于其为第一个权重点,在其之间没有其他权重点与之关联,并且由于第一个权重点是第一个采样点对应的,所以其所在权重区间位于权重线段头部,所以可以从头开始遍历权重线段。
在遍历权重线段的同时,电子设备可以判断第一个权重点是否处于当前遍历的权重区间。由于已经通过垂直映射得到了权重点,所以在遍历权重线段时,如果便利到了第一个权重点,那么便可以停止遍历,并将当前遍历的权重区间确定为第一个权重点所在的权重区间。
例如,如图3所示,在采样线段320中确定了采样区间a1的采样点c1后,将其垂直映射至权重线段310中,得到采样点c1对应的权重点d1。电子设备便可以从头开始遍历权重线段310,并判断权重点d1是否处于当前遍历的权重区间,直到遍历至权重点d1,停止遍历,当前遍历的权重区间w1即为第一个权重点d1所在的权重区间。
对于第二类权重点,也就是非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间。
其中,目标位置为该非第一个权重点对应的采样点所在的采样区间的结尾所对应的权重线段中的位置。由于在每个采样区间只采集一个采样点,所以当前权重点对应的采样点所在的采样区间之前的采样区间所对应的权重线段中不可能出现当前权重点。那么电子设备便可以从目标位置开始遍历权重线段,不需要从头开始遍历权重线段。
例如,如图3所示,在采样线段320中确定了采样区间a2的采样点c2后,将其垂直映射至权重线段310中,得到采样点c2对应的权重点d2,在确定权重点d2所在的权重区间时,便可以从采样区间a1的结尾对应的权重线段中的位置d0处开始遍历权重线段310。
在从目标位置开始遍历权重线段310的同时,电子设备可以判断非第一个权重点是否处于当前遍历的权重区间,如果是,则停止遍历,将当前遍历的权重区间确定为该非第一个权重点所在的权重区间。
例如,如图3所示,电子设备可以从d0处开始遍历权重线段310,直到遍历至权重点d2所处位置时,确定权重点d2处于当前遍历的权重区间,则将当前遍历的权重区间w2确定为第一个权重点d2所在的权重区间。
可见,在本实施例中,在确定每个权重点所在的权重区间时,可以针对第一个权重点和非第一个权重点进行权重线段的遍历,而在遍历非第一个权重点时,不需要从头开始遍历权重线段,这样,降低确定推荐视频的复杂度,提高确定推荐视频的效率。
作为本发明实施例的一种实施方式,上述从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点的步骤,可以包括:
从第一个所述采样区间中随机采集一个采样点r1;根据公式rm=m×wl/m–r1确定其他采样区间的采样点。
其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
电子设备可以从第一个采样区间中随机采集一个采样点r1,进而利用公式rm=m×wl/m–r1确定其他采样区间的采样点。例如,采样线段包括的每个采样区间的长度0.1,采样区间的数量为10,那么电子设备可以先从第一个采样区间中随机采集一个采样点r1,也就是从0-0.1的采样区间中随机采集一个采样点r1。
假设r1为0.04,那么第二个采样区间的采样点即为r2=2×1/10–0.04=0.16,第三个采样区间的采样点即为r3=3×1/10–0.04=0.26,以此类推,便可以得到10个采样区间的采样点。
可见,在本实施例中,电子设备可以从第一个所述采样区间中随机采集一个采样点r1,并根据公式rm=m×wl/m–r1确定其他采样区间的采样点,在此过程中,只需生成一个随机的采样点,其他采样点可以根据该采样点确定,进一步降低确定推荐视频的复杂度。
在采样过程中,假设总体的数量为n,采样的数量为n,对于每个层h,其对应的总体数量为nh,对应的采样数量为nh,则可以定义每个层的样本的抽样权重weight_h=(nh/n)/(nh/n)=(nh/nh)/(n/n)=f/fh,其中,f=n/n为总体样本的采样率,fh=nh/nh为层h内样本的采样率。因此可以获得:当fh>f时,weight_h<1,此时层h内的样本出现了过采样;当fh=f时,weight_h=1,此时层h内样本的采样率与总体采样率相等;当fh<f时,weight_h>1,此时层h内的样本出现了欠采样。
而在本发明实施例提供的推荐视频的确定方法中,总体的数量为n=wl=推荐权重的和,采样数量为n=m=待推荐视频的数量,对于每个采样区间,其对应的总体数量均为nh=wl/n,对应的采样点数量均为nh=1,代入上述公式得到:weight_h=(nh/n)/(nh/n)=((wl/m)/wl)/(1/m)=1。因此在本发明实施例提供的推荐视频的确定方法中,所有采样区间内采样点的权重均为1,所以采样获得的采样点分布与总体分布近似,得到的结果是合理的。
作为本发明实施例的一种实施方式,在上述获取备选视频及其对应的种类以及每种种类对应的推荐权重的步骤之前,上述方法还可以包括:
获取用户的视频历史观看记录;基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
其中,视频历史观看记录可以包括视频的种类及观看次数。电子设备可以从视频平台等渠道获取用户的视频历史观看记录,进而根据视频的种类以及其对应的观看次数确定用户对不同种类的视频的喜好程度,该喜好程度可以通过推荐权重表示。
例如,用户a的视频历史观看记录为:搞笑种类的视频的观看次数为25次;体育种类的视频的观看次数为55次;温情种类的视频的观看次数为5次;游戏种类的视频的观看次数为15次。那么电子设备便可以确定对于用户a来说,搞笑种类的视频的推荐权重为25/(25+55+5+15)=0.25;体育种类的视频的推荐权重为55/(25+55+5+15)=0.55;温情种类的视频的推荐权重为5/(25+55+5+15)=0.05;游戏种类的视频的推荐权重为15/(25+55+5+15)=0.15。
可见,在本实施例中,在获取备选视频及其对应的种类以及每种种类对应的推荐权重之前,电子设备可以获取用户的视频历史观看记录,并基于视频的种类及观看次数,确定每个种类的视频的推荐权重。进而,可以针对不同的用户有针对性的获取不同种类的视频的推荐权重,使得后续确定的推荐视频更加符合用户的喜好,提高用户体验。
作为本发明实施例的一种实施方式,上述方法还可以包括:
将所述推荐视频推荐给用户。
电子设备确定上述推荐视频后,可以将推荐视频推荐给用户。在一种实施方式中,电子设备可以在视频推荐界面中显示推荐视频的视频列表,以使用户可以通过点击视频列表中推荐视频信息观看相应的推荐视频。当然,电子设备也可以通过其他方式将推荐视频推荐给用户,在此不做具体限定。
相应于上述推荐视频的确定方法,本发明实施例还提供了一种推荐视频的确定装置。
下面对本发明实施例所提供的一种推荐视频的确定装置进行介绍。
如图4所示,一种推荐视频的确定装置,所述装置包括:
备选视频获取模块410,用于获取备选视频及其对应的种类以及每个种类对应的推荐权重;
权重模型构建模块420,用于基于所述推荐权重构建权重模型;
其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同。
采样模型构建模块430,用于基于待推荐视频的数量及所述推荐权重构建采样模型;
其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同。
采样点确定模块440,用于从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点;
权重点确定模块450,用于从所述权重模型中确定所述采样点对应的权重点;
目标种类确定模块460,用于确定每个所述权重点所在权重区间对应的目标种类;
推荐视频确定模块470,用于从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可见,本发明实施例所提供的方案中,电子设备可以获取备选视频及其对应的种类以及每个种类对应的推荐权重,基于荐权重构建权重模型,并基于待推荐视频的数量及推荐权重构建采样模型,然后从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点,从权重模型中确定采样点对应的权重点,进而确定每个权重点所在权重区间对应的目标种类,最后从备选视频中获取每个目标种类对应的视频,作为推荐视频。由于采样模型包括多个采样区间,多个采样区间的长度相同且总长度为推荐权重的和,采样区间的数量与待推荐视频的数量相同,这样,在确定每个权重点所在权重区间对应的目标种类时,无需均从权重模型的头部开始遍历,可以降低确定推荐视频的复杂度,提高确定推荐视频的效率。
作为本发明实施例的一种实施方式,上述权重模型构建模块420可以包括:
权重线段构建单元(图4中未示出),用于构建权重线段,其中,所述权重线段的长度为所述推荐权重的和;
权重线段划分单元(图4中未示出),用于根据所述推荐权重将所述权重线段划分为多个权重区间;
上述采样模型构建模块430可以包括:
采样线段构建单元(图4中未示出),用于模块构建采样线段,其中,所述采样线段的长度为所述推荐权重的和;
采样线段划分单元(图4中未示出),用于根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
作为本发明实施例的一种实施方式,上述权重点确定模块450可以包括:
权重点确定单元(图4中未示出),用于将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
作为本发明实施例的一种实施方式,上述目标种类确定模块460可以包括:
权重区间确定单元(图4中未示出),用于依次确定每个所述权重点所在的权重区间;
目标种类确定单元(图4中未示出),用于将所确定的权重区间对应的视频的种类确定为目标种类;
上述权重区间确定单元确定每个所述权重点所在的权重区间的方式,可以包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间;
针对非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间,其中,所述目标位置为所述非第一个权重点对应的采样点所在的采样区间的结尾所对应的所述权重线段中的位置。
作为本发明实施例的一种实施方式,上述采样点确定模块440可以包括:
第一采样点确定单元(图4中未示出),用于从第一个所述采样区间中随机采集一个采样点r1;
第二采样点确定单元(图4中未示出),用于根据公式rm=m×wl/m–r1确定其他采样区间的采样点,其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
作为本发明实施例的一种实施方式,上述装置还可以包括:
观看记录获取模块(图4中未示出),用于在所述获取备选视频及其对应的种类以及每种种类对应的推荐权重之前,获取用户的视频历史观看记录,其中,所述视频历史观看记录包括视频的种类及观看次数;
推荐权重确定模块(图4中未示出),用于基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
作为本发明实施例的一种实施方式,上述装置还可以包括:
视频推荐模块(图4中未示出),用于将所述推荐视频推荐给用户。
本发明实施例还提供了一种电子设备,如图5所示,电子设备可以包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
获取备选视频及其对应的种类以及每个种类对应的推荐权重;
基于所述推荐权重构建权重模型;
其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同。
基于待推荐视频的数量及所述推荐权重构建采样模型;
其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同。
从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点;
从所述权重模型中确定所述采样点对应的权重点;
确定每个所述权重点所在权重区间对应的目标种类;
从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可见,本发明实施例所提供的方案中,电子设备可以获取备选视频及其对应的种类以及每个种类对应的推荐权重,基于荐权重构建权重模型,并基于待推荐视频的数量及推荐权重构建采样模型,然后从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点,从权重模型中确定采样点对应的权重点,进而确定每个权重点所在权重区间对应的目标种类,最后从备选视频中获取每个目标种类对应的视频,作为推荐视频。由于采样模型包括多个采样区间,多个采样区间的长度相同且总长度为推荐权重的和,采样区间的数量与待推荐视频的数量相同,这样,在确定每个权重点所在权重区间对应的目标种类时,无需均从权重模型的头部开始遍历,可以降低确定推荐视频的复杂度,提高确定推荐视频的效率。
上述电子设备提到的通信总线可以是外设部件互连标准(peripheralcomponentinterconnect,pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
其中,上述基于所述推荐权重构建权重模型的步骤,可以包括:
构建权重线段,其中,所述权重线段的长度为所述推荐权重的和;
根据所述推荐权重将所述权重线段划分为多个权重区间;
上述基于待推荐视频的数量及所述推荐权重构建采样模型的步骤,可以包括:
构建采样线段,其中,所述采样线段的长度为所述推荐权重的和;
根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
其中,上述从所述权重模型中确定所述采样点对应的权重点的步骤,可以包括:
将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
其中,上述确定每个所述权重点所在权重区间对应的目标种类的步骤,可以包括:
依次确定每个所述权重点所在的权重区间;
将所确定的权重区间对应的视频的种类确定为目标种类;
确定每个所述权重点所在的权重区间的方式,可以包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间;
针对非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间,其中,所述目标位置为所述非第一个权重点对应的采样点所在的采样区间的结尾所对应的所述权重线段中的位置。
其中,上述从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点的步骤,可以包括:
从第一个所述采样区间中随机采集一个采样点r1;
根据公式rm=m×wl/m–r1确定其他采样区间的采样点,其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
其中,在上述获取备选视频及其对应的种类以及每种种类对应的推荐权重的步骤之前,上述方法还可以包括:
获取用户的视频历史观看记录,其中,所述视频历史观看记录包括视频的种类及观看次数;
基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
其中,上述方法还可以包括:
将所述推荐视频推荐给用户。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取备选视频及其对应的种类以及每个种类对应的推荐权重;
基于所述推荐权重构建权重模型;
其中,所述权重模型包括多个权重区间,所述权重区间的长度分别与所述推荐权重相同。
基于待推荐视频的数量及所述推荐权重构建采样模型;
其中,所述采样模型包括多个采样区间,所述多个采样区间的总长度为所述推荐权重的和,每个所述采样区间的长度相同,所述采样区间的数量与所述待推荐视频的数量相同。
从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点;
从所述权重模型中确定所述采样点对应的权重点;
确定每个所述权重点所在权重区间对应的目标种类;
从所述备选视频中获取每个所述目标种类对应的视频,作为推荐视频。
可见,本发明实施例所提供的方案中,计算机程序被处理器执行时,可以获取备选视频及其对应的种类以及每个种类对应的推荐权重,基于荐权重构建权重模型,并基于待推荐视频的数量及推荐权重构建采样模型,然后从一个采样区间中随机采集一个采样点,并根据采样点确定其他采样区间的采样点,从权重模型中确定采样点对应的权重点,进而确定每个权重点所在权重区间对应的目标种类,最后从备选视频中获取每个目标种类对应的视频,作为推荐视频。由于采样模型包括多个采样区间,多个采样区间的长度相同且总长度为推荐权重的和,采样区间的数量与待推荐视频的数量相同,这样,在确定每个权重点所在权重区间对应的目标种类时,无需均从权重模型的头部开始遍历,可以降低确定推荐视频的复杂度,提高确定推荐视频的效率。
其中,上述基于所述推荐权重构建权重模型的步骤,可以包括:
构建权重线段,其中,所述权重线段的长度为所述推荐权重的和;
根据所述推荐权重将所述权重线段划分为多个权重区间;
上述基于待推荐视频的数量及所述推荐权重构建采样模型的步骤,可以包括:
构建采样线段,其中,所述采样线段的长度为所述推荐权重的和;
根据所述待推荐视频的数量将所述采样线段划分为多个采样区间。
其中,上述从所述权重模型中确定所述采样点对应的权重点的步骤,可以包括:
将所述采样点垂直映射至所述权重线段,得到所述采样点对应的权重点。
其中,上述确定每个所述权重点所在权重区间对应的目标种类的步骤,可以包括:
依次确定每个所述权重点所在的权重区间;
将所确定的权重区间对应的视频的种类确定为目标种类;
确定每个所述权重点所在的权重区间的方式,可以包括:
针对第一个权重点,从头开始遍历所述权重线段,并判断所述第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述第一个权重点所在的权重区间;
针对非第一个权重点,从目标位置开始遍历所述权重线段,并判断所述非第一个权重点是否处于当前遍历的权重区间,如果是,停止遍历,将当前遍历的权重区间确定为所述非第一个权重点所在的权重区间,其中,所述目标位置为所述非第一个权重点对应的采样点所在的采样区间的结尾所对应的所述权重线段中的位置。
其中,上述从一个所述采样区间中随机采集一个采样点,并根据所述采样点确定其他采样区间的采样点的步骤,可以包括:
从第一个所述采样区间中随机采集一个采样点r1;
根据公式rm=m×wl/m–r1确定其他采样区间的采样点,其中,rm为第m个采样区间的采样点,m=1,2…m,m为所述待推荐视频的数量,wl为所述推荐权重的和。
其中,在上述获取备选视频及其对应的种类以及每种种类对应的推荐权重的步骤之前,上述方法还可以包括:
获取用户的视频历史观看记录,其中,所述视频历史观看记录包括视频的种类及观看次数;
基于所述视频的种类及所述观看次数,确定每个种类的视频的推荐权重。
其中,上述方法还可以包括:
将所述推荐视频推荐给用户。
需要说明的是,对于上述装置、电子设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
进一步需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。