基于流行度和社交网络的个性化用户原创视频预取方法及系统的制作方法

文档序号:7804395阅读:154来源:国知局
基于流行度和社交网络的个性化用户原创视频预取方法及系统的制作方法
【专利摘要】本发明公开了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。该方法先收集视频流行度信息,用户之间社交关系,视频之间关联关系以及用户历史行为信息;基于流行度信息,将用户原创视频分为热门视频和长尾视频;计算用户对热门视频的偏好度并排序,生成热门视频预取列表;构建图模型,实现用户和视频的相关度测量,为用户生成长尾视频预取列表;加权线性融合热门视频预取列表和长尾视频预取列表,构建个性化的混合预取模型;在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排名靠前的一部或多部视频。本系统提高了用户原创视频预取的命中率和准确度,提升了用户原创视频服务的质量,改进了用户的观看体验。
【专利说明】基于流行度和社交网络的个性化用户原创视频预取方法及系统
【技术领域】
[0001]本发明涉及一种基于流行度和社交网络的个性化用户原创视频预取方法及系统,属于视频预取的【技术领域】。
【背景技术】
[0002]随着Web2.0时代的到来,用户不再是单纯的信息接收者,而是同时成为了 了信息的发布者,以优酷网和土豆网为代表,基于用户原创内容的视频网站受到广大用户的高度追捧,但是多组研究结果都表明用户的观看体验不能让人满意,播放产生的时延占视频时长的比重较高。减少视频播放时延的相关方法包括:提高服务器的软硬件性能,增加网络带宽,基于网络代理和基于内容分发网络,然而这些方法都有相应的劣势,相比之下视频预取技术能够很好的降低用户可感受时延,同时产生较小的开销。
[0003]但是由于基于用户原创内容的视频服务在用户行为和视频内容上具有很多区别于传统视频服务的特点,例如视频数量很多,视频长度较短,内容数据较少,极快的内容产生速度,不同的流行度分布以及社会网络的存在。因此传统的视频预取算法并不能够很好的适用于用户原创内容视频服务。
[0004]用户原创视频的流行度分布表现出极端的不平衡,一部分视频有着很高的流行度,选择观看这部分视频时,用户通常考虑视频的流行度以及是否符合自己的兴趣。另一部分视频虽然流行度不高,却通过不同的传播途径,被感兴趣的用户观看,主要的传播途径包括用户之间的社交关系以及视频之间的关联关系。
[0005]因此,有必要提出一种能够综合考虑不同流行度视频,充分利用用户社交关系,视频关联关系,视频流行度信息以及用户历史行为数据的,适用于用户原创视频的视频预取方法和系统,以有效的提高视频预取的命中率和准确度,提升用户原创视频服务的质量,改进用户的观看体验。

【发明内容】

[0006]本发明所要解决的技术问题是提供一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。该方法及系统提高了视频预取的命中率和准确度,提升用户原创视频服务的质量,改进了用户的观看体验。
[0007]为了达到上述目的,根据本发明的一方面,本发明提供了一种基于流行度和社交网络的用户原创视频预取方法,包括如下步骤:
[0008]I)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及原创视频的流行度信息;
[0009]2)视频分类:基于用户原创视频的流行度信息,将视频分为热门视频和长尾视频两类;
[0010]3)热门视频预取列表生成:基于原创视频的流行度信息以及用户历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表;
[0011]4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或边拥有与实际物理类型一致的节点或关系类型,每一条边拥有与实际关系强度一致的边权值;
[0012]5)长尾视频预取列表生成:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表;
[0013]6)混合预取模型生成:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;
[0014]7)生成预取视频列表:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频推荐。
[0015]在上述用户原创视频预取方法中,所述信息获取步骤包括:若在应用系统中存在用户与用户之间的社交关系或者视频与视频之间的关联关系,则获取这些信息,若无,则无需获取;用户对视频的历史行为信息包括用户对视频的观看,分享,上传或收藏行为。
[0016]在上述用户原创视频预取方法中,在所述热门视频预取列表生成步骤之前还包括:对用户历史行为数据进行预处理步骤,具体为:只保留用户对视频肯定的信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。
[0017]在上述用户原创视频预取方法中,其所述视频分类步骤具体为:首先,利用视频观看次数衡量视频流行度,按照视频流行度从高到低排序;其次,累计观看次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占总观看次数80% ;最后,排除所有热门视频,剩余视频为长尾视频。
[0018]在上述用户原创视频预取方法中,其所述热门视频预取列表生成步骤中,偏好度计算的具体过程为:首先,利用视频观看次数计算视频流行度;其次,利用用户历史行为信息计算用户对视频的兴趣因子;最后,结合流行度和兴趣因子,计算用户的视频的偏好度。
[0019]在上述用户原创视频预取方法中,其所述图模型构建步骤具体为:首先,将用户实体及视频实体映射为图中相应的节点,并且用实体的类型作为相应节点的类型;其次,若用户之间存在社交关系,则在对应的节点之间添加边,边的权值代表社交关系强度,若视频之间存在关联关系,则在对应的节点之间添加边,边的权值代表关联关系强度;最后,若用户对视频有肯定行为信息,则在用户与该视频间添加边,边的权值代表肯定行为的强度。
[0020]在上述用户原创视频预取方法中,其所述长尾视频预取列表生成步骤中,相关度计算的具体过程为:首先,计算得到节点之间的最短路径,若节点之间不存在路径,相关度为O ;其次,计算单条最短路径的权值;最后,采用最短路径的权值之和作为节点之间的相关度。
[0021]在上述用户原创视频预取方法中,其所述混合预取模型生成步骤具体为:利用用户历史行为信息,分别计算用户对热门视频及长尾视频的行为数量占总行为数量的比例,将计算结果作为热门视频预取列表和长尾视频预取列表的权值,对热门视频预取列表和长尾视频预取列表进行加权线性融合。
[0022]此外,本发明提供了一种基于流行度和社交属性的个性化用户原创视频预取系统,包括:信息获取模块,用于获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及视频自身的流行度信息;预处理模块,用于保留肯定的信息;视频分类模块,用于基于用户原创视频的流行度信息,将视频分为热门视频和长尾视频两类;热门视频预取列表生成模块,用于基于视频流行度和用户历史行为信息,计算用户对热门视频的偏好度,生成热门视频预取列表;图模型构建模块,用于基于用户对视频的历史行为信息,用户之间的社交关系以及视频之间关联关系构建含有节点类型以及边权值的图模型;长尾视频预取列表生成模块,用于基于图模型,利用基于最短路径权值的相关度测量方法,计算用户和长尾视频的相关度,生成长尾视频预取列表;混合预取模型生成模块,用于基于用户历史行为信息,计算热门视频预取权值及长尾视频预取权值,加权线性融合热门视频预取列表和长尾视频预取列表,生成个性化混合预取模型;视频预取模块,用于在保证用户当前观看视频流畅的情况下,基于个性化混合模型,为用户预取排在最靠前的一个或多个视频。
[0023] 本发明提出了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。第一次基于用户原创视频流行度的分布将视频分为热门视频和长尾视频两类,根据用户观看这两类视频的不同特点,充分利用用户社交关系,视频关联关系,视频流行度信息以及用户历史行为数据,挖掘了用户对未观看视频的偏好程度,对两类视频分别生成视频预取列表,通过混合预取模型加权线性融合这两类视频预取列表。因此有效的提高了视频预取的命中率和准确度,提升了用户原创视频服务的质量,改进了用户的观看体验。
【专利附图】

【附图说明】
[0024]图1为本发明基于流行度和社交网络的个性化用户原创视频预取方法的步骤流程图;
[0025]图2为本发明实施例的场景描述示意图;
[0026]图3为本发明实施例的图模型示意图;
[0027]图4为本发明实施例的视频预取示意图;
[0028]图5为本发明基于流行度和社交网络的个性化用户原创视频预取系统的结构示意图。
【具体实施方式】
[0029]本发明提供了一种基于流行度和社交网络的个性化用户原创视频预取方法及系统。下面结合附图进行详细说明。
[0030]参照图1,图1为本发明基于流行度和社交属性的个性化用户原创视频预取方法的步骤流程图,包括如下步骤:
[0031]信息获取步骤101:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及视频自身的流行度?目息;
[0032]视频分类步骤102:基于用户原创视频的流行度信息,将用户原创视频分为热门视频和长尾视频两类;
[0033]热门视频预取列表生成步骤103:基于视频流行度以及用户对视频的历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表;
[0034]图模型构建步骤104:基于用户对视频的历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或边拥有与实际物理类型一致的节点或关系类型,每一条边拥有与实际关系强度一致的边权值;
[0035]长尾视频预取列表生成步骤105:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表;
[0036]生成混合预取模型步骤106:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型;
[0037]视频预取步骤107:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频推荐。
[0038]实际中一种优选的处理方式是,在热门视频预取列表生成步骤之前还包括预处理步骤,对用户历史行为信息进行处理,只保留用户对视频肯定的信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。
[0039]下面结合一个用户原创视频服务平台的例子,详细描述本方法的【具体实施方式】。参照图2,图2是本实施例的场景描述图,本实施例描述了一个用户原创视频服务平台,视频有自身的内容信息;用户之间可以建立社交关系;用户可以观看、收藏、上传、分享视频;视频之间存在关联关系,由用户在上传视频时添加。
[0040]根据用户对视频的行为,可以构建用户-视频关系矩阵R,如果用户i对视频j有过观看、收藏、上传或者分享行为,Ru为1,否则Ru为O。R是一个mXn维的矩阵,m为系统中用户数量,η为系统中视频数量。
[0041]根据流行度分布对视频进行分类:首先,利用视频观看次数衡量视频流行度,具体如公式(I),其中Pk表示视频k的流行度,Mk表示视频k被观看的次数。其次,按照视频流行度从高到低排序,累计观看次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占总观看次数80% ;最后,排除所有热门视频,剩
余视频为长尾视频。)#表示热门视频集合,i表示长尾视频集合。
[0042]Pk = log(Mk+l) (I)
[0043]下面介绍生成热门视频预取列表过程中用户对热门视频的偏好度计算方法。首先,利用公式(I)计算视频k的流行度Pk;其次,计算用户i对视频k的兴趣因子IiGO,具
体如公式(2),其中F /(i)表示用户i有过肯定行为视频的集合,表示和视频k最相
似的N部视频的集合,Sim(k, j)表示视频k和视频j的相似度。
[0044]
【权利要求】
1.一种基于流行度和社交网络的个性化用户原创视频预取方法,其特征在于,包括以下步骤: 1)信息获取:获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及原创视频的流行度信息; 2)视频分类:基于获取的原创视频的流行度信息,将视频分为热门视频和长尾视频两类; 3)生成热门视频预取列表:基于获取的原创视频的流行度信息及用户历史行为信息,计算用户对热门视频的偏好度,根据偏好度降序排序,为用户生成热门视频预取列表; 4)图模型构建:基于获取的用户历史行为信息,用户之间的社交关系以及视频之间的关联关系构建图模型,其中的每一个节点或每一条边拥有与实际物理类型一致的节点类型或关系类型,每一条边拥有与实际关系强度一致的边权值; 5)生成长尾视频预取列表:基于图模型,利用基于最短路径权值的相关度测量方法,测量用户和视频的相关度,根据相关度降序排序,为用户生成长尾视频预取列表; 6)构建个性化混合预取模型:基于获取的用户的历史行为信息,对热门视频预取列表和长尾视频预取列表进行加权线性融合,构建个性化的混合预取模型; 7)视频预取:在保证用户当前观看视频流畅的情况下,基于个性化混合预取模型,为用户预取排在最靠前的一部或多部视频。
2.根据权利要求1所述的个性化用户原创视频预取方法,其特征在于,步骤I)的信息获取过程中,对于用户与用户之间的社会关系以及视频与视频之间的关联关系,若在应用系统中存在,则获取这些信息;若没有,则无需获取。
3.根据权利要求1或2所述的个性化用户原创视频预取方法,其特征在于,在所述步骤3)热门视频预取列表生成之前,还包括对用户历史行为信息进行预处理的步骤,具体为:只保留用户对视频肯定的信息;在非评分系统中,包括用户对视频的观看、分享、收藏以及上传信息。
4.根据权利要求1、2或3中所述的个性化用户原创视频预取方法,其特征在于,所述步骤2)视频分类的具体过程为: . 2.1)根据用户对视频的行为,构建用户-视频关系矩阵R,如果用户i对视频j有过观看、收藏、上传或者分享行为,Rij为1,否则Ru为O,R是一个mXn维的矩阵,m为系统中用户数量,η为系统中视频数量;. 2.2)根据流行度分布对视频进行分类:首先,利用视频观看次数衡量视频流行度,具体如公式(I),
Pk = log(Mk+l) (I) 其中Pk表示视频k的流行度,Mk表示视频k被观看的次数; 其次,按照视频 流行度从高到低排序,累计观看次数占总观看次数80%,流行度排名前10%的视频为热门视频,若流行度排名前10%的视频累计观看次数不足总观看次数的80%,根据流行度排名向后扩展热门视频,直至满足累计观看次数占总观看次数80% ;最后,排除所有热门视频,剩余视频为长尾视频,&表示热门视频集合表示长尾视频集口 ο
5.根据权利要求4中所述的个性化用户原创视频预取方法,其特征在于,步骤3)热门视频预取列表生成中,所述偏好度计算的具体过程为: 3.1)根据视频k的流行度Pk,计算用户i对视频k的兴趣因子Ii (k),具体如公式(2),
6.根据权利要求5所述的个性化用户原创视频预取方法,其特征在于,步骤4)图模型构建的具体过程为: 首先,将用户实体及视频实体映射为图中相应的节点,并且用实体的类型作为相应节点的类型;其次,若用户之间存在社交关系,则在对应的节点之间添加边,边的权值代表社交关系强度,若视频之间存在关联关系,则在对应的节点之间添加边,边的权值代表关联关系强度;最后,若用户对视频有肯定行为信息,则在用户与该视频间添加边,边的权值代表肯定行为的强度。
7.根据权利要求6所述的个性化用户原创视频预取方法,其特征在于,该图模型是一个边带权值的无向图G(U,V,E,R,W;0),其中U代表用户集合,包括所有的用户节点…代表视频集合,包括所有的视频节点;E代表图中边的集合,包括社交网络中节点之间所有的关系以及所有的用户肯定行为;R代表关系类型集合,包括所有的关系类型;Φ:Ε —R,代表关系类型的映射函数;W代表图G中边的权值,衡量了某种关系的强度;E中所有的边e,都属于一种关系类型,Φ (e) e R ;e(u, v) e Ε, u, v e U | V,代表节点u和节点ν之间存在某种类型的关系;而w(e)代表e这一条边的权值;其中|R| > I,当|R| = I的时候,G退化为一个用户-物品二分图。
8.根据权利要求7所述的个性化用户原创视频预取方法,其特征在于,步骤5)长尾视频预取列表生成中,所述相关度计算的具体过程为: 首先,计算得到节点之间的最短路径,若节点之间不存在路径,相关度为O ;其次,计算单条最短路径的权值;最后,采用最短路径的权值之和作为节点之间的相关度。
9.根据权利要求8所述的个性化用户原创视频预取方法,其特征在于,步骤6)混合预取模型生成的具体过程为: 基于用户历史行为信息,分别计算用户对热门视频及长尾视频的行为数量占总行为数量的比例,将计算结果作为热门视频预取列表和长尾视频预取列表的权值,加权线性融合热门视频预取列表和长尾视频预取列表。
10.根据权利要求9所述的个性化用户原创视频预取方法,其特征在于,步骤7)视频预取的具体过程为: 1)将视频缓存被分为两个部分,播放缓存及预取缓存,播放缓存用于缓存当前正在观看视频内容的数据块,预取缓存用于缓存预取视频内容的片头数据块; 2)从服务器处接受个性化混合预取模型,在之后的播放过程中利用这个混合预取模型预测用户未来可能观看的视频内容; 3)数据调度策略包括两个阶段,在每个调度周期内,先利用下载带宽下载紧急数据块到播放缓存,以保证用户当前正在观看的视频能够流畅的播放,紧急数据块是指按照视频的播放顺序,播放时间临近当前播放时间的数据块;如果下载完紧急数据块之后仍有富余的下载带宽,基于混合预取模型预测用户未来可能观看的视频,并使用剩余的下载带宽将视频的片头内容,预取到预取缓存中。
11.一种基于流行度和社交网络的个性化用户原创视频预取系统,其特征在于,所述系统包括: 信息获取模块,用于获取用户对视频的历史行为信息,用户与用户之间的社交关系,视频与视频之间的关联关系以及视频自身的流行度信息; 视频分类模块,用于基于用户原创视频的流行度信息,将视频分为热门视频和长尾视频两类; 预处理模块,用于对用户历史行为信息进行过滤,保留肯定信息。 热门视频预取列表生成模块,用于基于视频流行度和用户历史行为信息,计算用户对热门视频的偏好度,生成热门视频预取列表。 图模型构建模块,用于基于用户对视频的历史行为信息,用户之间的社交关系以及视频之间关联关系构建含有节点类型以及边权值的图模型; 长尾视频预取列表生成模块,用于基于图模型,利用基于最短路径权值的相关度测量方法,计算用户和长尾视频的相关度,生成长尾视频预取列表。 混合预取模型生成模块,用于基于用户历史行为信息,计算热门视频预取列表权值及长尾视频预取列表权值,加权线性融合热门视频预取列表和长尾视频预取列表,生成个性化混合预取模型; 视频预取模块,用于在保证用户当前观看视频流畅的情况下,基于个性化混合模型,为用户预取排在最靠前的一个或多个视频。
【文档编号】H04N21/258GK103974097SQ201410219254
【公开日】2014年8月6日 申请日期:2014年5月22日 优先权日:2014年5月22日
【发明者】叶保留, 徐轩绚, 陆桑璐 申请人:南京大学镇江高新技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1