推荐节目的方法和设备的制作方法

文档序号:7800768阅读:135来源:国知局
推荐节目的方法和设备的制作方法
【专利摘要】本发明公开了一种推荐节目的方法和设备,方法包括以下步骤:(a)收集用户的历史观看记录;(b)得出每个已观看的节目的第一关联度、属性值的第二关联度、预定属性的第三关联度;(c)得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式;(d)根据函数式得出节目数据库中的每个节目的第一关联度;(e)将节目数据库中的节目按第一关联度进行排序并按排序顺序推荐给用户。本发明通过建立节目的第一关联度与节目属性的第三关联度之间的函数式来对节目数据库中的节目进行排序推荐,推荐结果更加准确。
【专利说明】推荐节目的方法和设备
【技术领域】
[0001]本发明涉及通讯【技术领域】,更具体地讲,涉及一种推荐节目的方法和设备。
【背景技术】
[0002]随着智能播放设备的发展,各种节目的数量也得到极大的丰富,用户面临信息过载的问题,如何从海量节目里挑选感兴趣的节目成为困扰用户的问题。要解决这个问题,就需要通过研究用户的观看行为,实现节目的个性化推荐。现有的节目推荐算法多采用传统的统计模式识别方法,传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。这种方法一般只能获得局部最优解,预测能力较差。

【发明内容】

[0003]本发明的目的在于提供一种推荐节目的方法和设备,其能够提高推荐节目的准确性。
[0004]本发明的一方面提供了一种推荐节目的方法,包括以下步骤:(a)收集用户的历史观看记录;(b)根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值;(C)根据步骤b中获得的每个节目的第一关联度与每个节目包括的预定属性的第三关联度得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式;(d)获取节目数据库中的节目包括的预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度;(e)将节目数据库中的节目按步骤d中获得的第一关联度进行排序并按排序顺序推荐给用户。
[0005]优选地,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看的节目的用户观看时长,步骤b包括步骤bl:根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。
[0006]优选地,步骤b还包括步骤b2:根据所述节目的第一关联度得出所述属性值的第二关联度,第二关联度等于包括该属性值的已观看的节目的第一关联度的加权平均值,力口权系数为预定值。
[0007]优选地,步骤b还包括步骤b3,根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或者该预定属性包括的属性值的第二关联度的平均值。
[0008]优选地,步骤d中获取节目数据库中的节目包括的预定属性的第三关联度的步骤包括,获取节目数据库中的节目的预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值作为节目数据库中的节目的预定属性的第三关联度。[0009]优选地,步骤c中的函数式通过将步骤b中获得的已观看的节目的第一关联度以及已观看的节目包括的预定属性的第三关联度作为样本,利用支持向量机算法训练得到。
[0010]本发明的另一方面还提供了一种推荐节目的设备,包括:收集单元,用于收集用户的历史观看记录;关联度获取单元,用于根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值;函数式求取单元,用于关联度获取单元获得的每个节目的第一关联度与每个节目包括的预定属性的第三关联度得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式;预测单元,用于获取节目数据库中的节目包括的预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度;推荐单元,用于将节目数据库中的节目按预测单元获得的第一关联度进行排序并按排序顺序推荐给用户。
[0011]优选地,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看节目的用户观看时长,关联度获取单元包括第一关联度获取单元,所述第一关联度获取单元用于根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。
[0012]优选地,关联度获取单元包括第二关联度获取单元,所述第二关联度获取单元用于根据所述节目的第一关联度得出所述属性值的第二关联度,第二关联度等于包括该属性值的已观看的节目的第一关联度的加权平均值,加权系数为预定值。
[0013]优选地,关联度获取单元包括第三关联度获取单元,所述第三关联度获取单元用于根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或者该预定属性包括的属性值的第二关联度的平均值。
[0014]优选地,预测单元还用于,获取节目数据库中的节目的预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值作为该预定属性的第三关联度。
[0015]优选地,函数式求取单元还用于,通过将关联度获取单元获得的已观看的节目的第一关联度以及已观看的节目包括的预定属性的第三关联度作为样本,利用支持向量机算法训练得到所述函数式。
[0016]根据本发明的推荐节目的方法和设备,通过建立节目的第一关联度与节目属性的第三关联度之间的函数式来对节目数据库中的节目进行排序推荐,推荐结果更加准确。
【专利附图】

【附图说明】
[0017]通过下面结合附图进行的详细描述,本发明的上述和其它目的、特点和优点将会变得更加清楚,其中:
[0018]图1示出根据本发明的实施例的推荐节目的方法的流程图;
[0019]图2示出根据本发明的实施例的推荐节目的设备的框图。【具体实施方式】
[0020]现在,将参照附图更充分地描述不同的示例实施例,其中,一些示例性实施例在附图中示出。
[0021] 图1示出根据本发明的实施例的推荐节目的方法的流程图。
[0022]如图1所示,在步骤101,收集用户的历史观看记录。
[0023]在步骤102,根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值。
[0024]所述节目的属性是反映节目特征的信息,如节目类型、导演、演员、发行年份、产地等,预定属性为上述节目的属性中的预定的一个或一个以上的属性,属性的属性值反映属性特征的信息,如属性类别为节目类型的属性值可以是古装剧、革命剧、谍战剧、爱情剧等,如属性类别为演员的属性值可以是孙俪、章子怡、范冰冰、黄晓明等。一个节目的一个属性的属性值可能有几个,如一个节目可能属于古装剧和爱情剧两种节目类型,一个节目包括几个演员。几个节目可能都包括同一个属性值,如几个节目的节目类型都是爱情剧,几个节目都包括了同一个演员。
[0025]第一关联度表示用户的观看行为与节目的关联程度,以下称为节目的第一关联度,第二关联度表示用户的观看行为与属性值的关联程度,以下称为属性值的第二关联度,第三关联度表示用户的观看行为与属性的关联程度,以下简称属性的第三关联度。第一关联度、第二关联度和第三关联度可以根据历史观看记录里面的信息进行计算,如观看节目的时间长短、次数、观看时间点等。优选地,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看的节目的用户观看时长,在此情况下,步骤102包括:根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。例如,可根据第i个节目的用户观看时长与第i个节目的节目总时长之比得出第i个节目的第一关联度Ii, i表示已观看的节目的编号,i e [1,t],t为已观看的节目的数量。
[0026]在一个示例中,可根据已观看的节目的第一关联度得出所述属性值的第二关联度。任意属性值的第二关联度等于具有该属性值的已观看的节目的第一关联度的加权平均值,加权系数为预定值。预定值可以在系统内预先进行设置。优选地,预定值通过下面的式
(I)计算获得所示:
[0027]
(Ι-a)關Zi+aZ (1-a)(dk)Zk,Cl)

k=\
[0028]其中,a为预设的自学习系数,O < a < I,d为具有该属性值的已观看的节目的数量,k为具有该属性值的已观看的节目的序号,k e [1,d],Zk表示d个具有该属性值的已观看的节目中的第k个节目的第一关联度。这里,序号k可以随机地分配,优选地,所述序号k按节目的观看顺序进行分配。
[0029]在一个示例中,对于为了获得一个节目的一个预定属性的第三关联度,步骤102还包括步骤,根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值。例如,可获取第i个已观看节目的第j个属性包括的所有属性值的第二关联度Wun中最大的第二关联度,或者所有Wun的平均值,作为第i已观看节目的第j个属性的第三关联度Vu,其中,i表示已观看的节目的编号,i e [l,t],t为已观看的节目的数量;j为节目的预定属性的编号,j e [l,m],m为预定属性的个数;n为预定属性的属性值的编号,n e [I, SiJ],Sij是第i个节目的第j个预定属性的属性值的个数。
[0030]在步骤103,根据步骤102中的已观看的节目的第一关联度以及已观看的节目包括的m个预定属性的第三关联度得出节目的第一关联度和该节目包括的m个预定属性的第三关联度组成的向量之间的函数式。
[0031]在已经获得了作为变量的第一关联度和第三关联度的样本的基础上,可以根据各种算法得出所述函数式。
[0032]在一个优选实施例中,可利用支持向量机(SVM)算法来获得所述函数式。所述函数式可被表示为下面的回归函数式(2):
[0033]y=wTx+b,(2)
[0034]其中,y为节目的第一关联度,X为节目包括的m个预定属性的第三关联度组成的向量,w和b是维数为节目的预定属性的个数m的向量,τ为转置符号。
[0035]在上述回归函数式中,w和b是已知量。为了确定这两个已知量,通过将在步骤102获得的已观看的节目的第一关联度yji e [l,t])以及已观看的节目包括的m个预定属性的第三关联度组成的向量Vi= Cvi,1; ν,2)…Vi,m)作为样本,利用SVM算法训练得到w和b。
[0036]为此,可以将在步骤102获得的第一关联度和第三关联度代入以下SVM算法中的式(3)和(4)计算获得w和b:1 2
[0037]min1/2||w|| ;U)
[0038]Yi [wvj+b] ≥0。(4)
[0039]式(3)是寻求全局最优解的目标表达式,式(4)是约束条件。由于SVM算法的使用已经非常广泛,在此不详细描述。
[0040]在步骤104,获取节目数据库中的节目包括的m个预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度。
[0041]优选地,步骤104中获取节目数据库中的节目包括的m个预定属性的第三关联度的步骤包括,获取用户节目数据库中的节目的预定属性包括的属性值的第二关联度中最大的第二关联度或者该预定属性包括的属性值的第二关联度的平均值作为用户与该预定属性的第三关联度。其中,所述节目数据库中的节目的预定属性包括的属性值的第二关联度与步骤102中已观看的节目的相同的预定属性包括的相同的属性值的第二关联度相同。当节目数据库中的节目的预定属性包括的属性值为步骤102中不存在的属性值时,其第二关联度设为零。
[0042]在步骤105,将节目数据库中的节目按步骤104中获得的第一关联度进行排序并按排序顺序推荐给用户。[0043]图2示出根据本发明的实施例的推荐节目的设备的框图。
[0044]如图2所示,根据本发明的实施例的推荐节目的设备包括:收集单元201、关联度获取单元202、函数式求取单元203、预测单元204、推荐单元205。
[0045]收集单元201用于收集用户的历史观看记录。
[0046]关联度获取单元202,用于根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值。
[0047]所述节目的属性是反映节目特征的信息,如节目类型、导演、演员、发行年份、产地等,预定属性为上述节目的属性中的预定的一个或一个以上的属性,属性的属性值反映属性特征的信息,如属性类别为节目类型的属性值可以是古装剧、革命剧、谍战剧、爱情剧等,如属性类别为演员的属性值可以是孙俪、章子怡、范冰冰、黄晓明等。一个节目的一个属性的属性值可能有几个,如一个节目可能属于古装剧和爱情剧两种节目类型,一个节目包括几个演员。几个节目可能都包括同一个属性值,如几个节目的节目类型都是爱情剧,几个节目都包括了同一个演员。
[0048]第一关联度表示用户的观看行为与节目的关联程度,以下称为节目的第一关联度,第二关联度表示用户的观看行为与属性值的关联程度,以下称为属性值的第二关联度,第三关联度表示用户的观看行为与属性的关联程度,以下简称属性的第三关联度。第一关联度、第二关联度和第三关联度可以根据历史观看记录里面的信息进行计算,如观看节目的时间长短、次数、观看时间点等。优选地,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看的节目的用户观看时长,在此情况下,关联度获取单元202包括第一关联度获取单元,所述第一关联度获取单元用于根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。例如,可根据第i个节目的用户观看时长与第i个节目的节目总时长之比得出第i个节目的第一关联度Ii, i表示已观看的节目的编号,i e [1,t],t为已观看的节目的数量。
[0049]在一个示例中,关联度获取单元202包括第二关联度获取单元,所述第二关联度获取单元用于根据已观看的节目的第一关联度得出所述属性值的第二关联度。任意属性值的第二关联度等于具有该属性值的已观看的节目的第一关联度的加权平均值,加权系数为预定值。预定值可以在系统内预先进行设置。优选地,预定值通过上述的式(I)计算获得。
[0050]在一个示例中,对于为了获得一个节目的一个预定属性的第三关联度,关联度获取单元202包括第三关联度获取单元,所述第三关联度获取单元用于根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值。例如,可获取第i个已观看节目的第j个属性包括的所有属性值的第二关联度Wi,,n中最大的第二关联度,或者所有Wyn的平均值,作为第i已观看节目的第j个属性的第三关联度其中,i表示已观看的节目的编号,i e [l,t],t为已观看的节目的数量;j为节目的预定属性的编号,j e [l,m],m为预定属性的个数;η为预定属性的属性值的编号,n e [1,SiJ],Sij是第i个节目的第j个预定属性的属性值的个数。
[0051]函数式求取单元203用于根据关联度获取单元202获得的每个节目的第一关联度与每个节目包括的预定属性的第三关联度得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式。
[0052]在已经获得了作为变量的第一关联度和第三关联度的样本的基础上,可以根据各种算法得出所述函数式。
[0053]在一个优选实施例中,可利用SVM算法来获得所述函数式。所述函数式可被表示为上述的回归函数式(2)。
[0054]在上述回归函数式中(2), w和b是已知量。为了确定这两个已知量,通过将关联度获取单元202获得的已观看的节目的第一关联度yi (i e [l,t])以及已观看的节目包括的m个预定属性的第三关联度组成的向量Vi= ('Pt2,…Vi,m)作为样本,利用SVM算法训练得到w和b。
[0055]为此,可以将关联度获取单元202获得的第一关联度和第三关联度代入上述的SVM算法中的式(3)和(4)计算获得w和b。[0056]预测单元204用于获取节目数据库中的节目包括的预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度。
[0057]优选地,预测单元204还用于获取节目数据库中的节目的预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值作为该预定属性的第三关联度。其中,所述节目数据库中的节目的预定属性包括的属性值的第二关联度与关联度获取单元202中获取的已观看的节目的相同的预定属性包括的相同的属性值的第二关联度相同。当节目数据库中的节目的预定属性包括的属性值为已观看的节目中不存在的属性值时,其第二关联度设为零。
[0058]推荐单元205用于将节目数据库中的节目按预测单元204获得的第一关联度进行排序并按排序顺序推荐给用户。
[0059]应该理解,尽管在这里可使用术语第一、第二等来描述不同的组件,但是这些组件不应被这些术语所限制。这些术语仅用于区分一个组件与另一组件。例如,在不脱离示例实施例的范围的情况下,第一组件可被称为第二组件,类似地,第二组件可被称为第一组件。
[0060]此外,根据本发明的示例性实施例的方法可以被实现为计算机程序。
[0061]此外,根据本发明的示例性实施例的设备中的各个单元可被实现硬件组件。本领域技术人员根据限定的各个单元所执行的处理,可以例如使用现场可编程门阵列(FPGA)或专用集成电路(ASIC)来实现各个单元。
[0062]根据本发明的推荐节目的方法和设备,通过建立节目的第一关联度与节目属性的第三关联度之间的函数式来对节目数据库中的节目进行排序推荐,推荐结果更加准确。
[0063]尽管已经参照其示例性实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离权利要求所限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。
【权利要求】
1.一种推荐节目的方法,其特征在于,包括以下步骤: (a)收集用户的历史观看记录; (b)根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值; (C)根据步骤b中获得的每个节目的第一关联度与每个节目包括的预定属性的第三关联度得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式; (d)获取节目数据 库中的节目包括的预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度; (e)将节目数据库中的节目按步骤d中获得的第一关联度进行排序并按排序顺序推荐给用户。
2.根据权利要求1所述的推荐节目的方法,其中,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看的节目的用户观看时长,步骤b包括步骤bl:根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。
3.根据权利要求2所述的推荐节目的方法,其中,步骤b还包括步骤b2:根据所述节目的第一关联度得出所述属性值的第二关联度,第二关联度等于包括该属性值的已观看的节目的第一关联度的加权平均值,加权系数为预定值。
4.根据权利要求3所述的推荐节目的方法,其中,步骤b还包括步骤b3,根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或者该预定属性包括的属性值的第二关联度的平均值。
5.根据权利要求1所述的推荐节目的方法,其中,步骤d中获取节目数据库中的节目包括的预定属性的第三关联度的步骤包括,获取节目数据库中的节目的预定属性包括的属性值的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值作为节目数据库中的节目的预定属性的第三关联度。
6.根据权利要求1所述的推荐节目的方法,其中,步骤c中的函数式通过将步骤b中获得的已观看的节目的第一关联度以及已观看的节目包括的预定属性的第三关联度作为样本,利用支持向量机算法训练得到。
7.一种推荐节目的设备,其特征在于,包括: 收集单元,用于收集用户的历史观看记录; 关联度获取单元,用于根据用户的历史观看记录得出每个已观看的节目的第一关联度、每个已观看的节目包括的预定属性的属性值的第二关联度、以及每个已观看的节目包括的预定属性的第三 关联度,其中,历史观看记录包括用户已观看的节目以及节目包括的属性的属性值,一个节目的一个属性包括至少一个属性值; 函数式求取单元,用于关联度获取单元获得的每个节目的第一关联度与每个节目包括的预定属性的第三关联度得出节目的第一关联度和节目包括的预定属性的第三关联度之间的函数式; 预测单元,用于获取节目数据库中的节目包括的预定属性的第三关联度,并将所述节目数据库中的节目包括的预定属性的第三关联度代入所述函数式得出节目数据库中的每个节目的第一关联度; 推荐单元,用于将节目数据库中的节目按预测单元获得的第一关联度进行排序并按排序顺序推荐给用户。
8.根据权利要求7所述的设备,其中,所述历史观看记录还包括用户每个已观看的节目的节目总时长和每个已观看节目的用户观看时长,关联度获取单元包括第一关联度获取单元,所述第一关联度获取单元用于根据每个已观看的节目的用户观看时长与每个已观看的节目的节目总时长之比得出每个已观看的节目的第一关联度。
9.根据权利要求8所述的设备,其中,关联度获取单元包括第二关联度获取单元,所述第二关联度获取单元用于根据所述节目的第一关联度得出所述属性值的第二关联度,第二关联度等于包括该属性值的已观看的节目的第一关联度的加权平均值,加权系数为预定值。
10.根据权利要求9所述的设备,其中,关联度获取单元包括第三关联度获取单元,所述第三关联度获取单元用于根据已观看节目的预定属性的属性值的第二关联度得出该预定属性的第三关联度,第三关联度等于该预定属性包括的属性值的第二关联度中最大的第二关联度或者该预定属性包括的属性值的第二关联度的平均值。
11.根据权利要求7所述的设备,其中,预测单元还用于,获取节目数据库中的节目的预定属性包括的属性值 的第二关联度中最大的第二关联度或该预定属性包括的属性值的第二关联度的平均值作为该预定属性的第三关联度。
12.根据权利要求7所述的设备,其中,函数式求取单元还用于,通过将关联度获取单元获得的已观看的节目的第一关联度以及已观看的节目包括的预定属性的第三关联度作为样本,利用支持向量机算法训练得到所述函数式。
【文档编号】H04N21/466GK103957434SQ201410134511
【公开日】2014年7月30日 申请日期:2014年4月3日 优先权日:2014年4月3日
【发明者】曹志强, 徐旭彬 申请人:三星电子(中国)研发中心, 三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1