视频推荐方法及装置与流程

文档序号:14129799阅读:171来源:国知局

本发明涉及信息技术领域,尤其涉及一种视频推荐方法及装置。



背景技术:

随着web2.0技术的迅速发展和在线社交网络的迅速普及,在线社交网络已经成为人们维系社会关系、传播信息与创新知识的重要载体。移动互联网的普及让信息的产生和发布变得非常的便捷,用户可以随时随地的分享视频。视频平台不但是一个内容分享平台,同时也是一个社交平台。用户可以在平台上分享自己拍摄或者感兴趣的视频,同时也可以和平台上的其他用户进行互动。因此,结合视频内容和用户的互动关系构建推荐系统是受到业界广泛关注的研究方向。

现有技术中通常是用户主动选择喜欢的视频类别,然后根据用户选择的记录来推荐相同类别的视频;还有就是根据用户的观看历史记录,来推荐与用户观看过的视频相同类别的其他视频。在社交网络发达的今天,却没有完全利用社交网络的社交特来预测用户可能喜欢的潜在的视频类别。因此现有的视频推荐准确度不高,用户体验差。



技术实现要素:

鉴于此,本发明实施例提供一种视频推荐方法及装置,所述视频推荐方法及装置通过找出一部分具有高影响力的人,并将合适的视频优先推荐给他们,等他们在视频上有一些互动后,我们再将视频推荐给他们的好友。在给定推荐总数量的情况下,通过这种投放方式,我们将获得更多用户对视频的评论或者点赞,让视频给用户留下更深刻的印象,提升用户体验和交互频率、提高用户留存率。

本发明实施例提供的一种视频推荐方法,包括以下步骤:在预定时间内收集多个用户行为数据,建立用户行为数据样本;存储所述用户行为数据样本;采用聚类算法对所述用户行为数据样本的视频内容进行聚类,得到至少一个兴趣相似的用户集群;统计所述兴趣相似的用户集群用户观看过的视频;抽取所述视频每一帧图像并提取特征;采用聚类算法对所述视频每一帧图像的特征进行聚类,得到至少一个视频聚类;分析所述视频聚类中所述用户集群中各用户之间的交互关系,根据所述分析结果得到所述用户集群的影响力;根据所述用户集群的影响力的排名进行推荐。

可选地,所述聚类算法为k-means算法。

可选地,抽取所述视频每一帧图像并提取特征可通过尺度不变特征转换算法(scale-invariantfeaturetransform,sift)、灰度共生矩阵法、傅里叶功率谱法及深度学习模型中的一种方法实现。

可选地,分析所述视频聚类中所述用户集群中各用户之间的交互关系具体为:根据用户之间的交互关系构成一个庞大的网络g,v={u1,u2,…,un},n为用户个数,,根据用户在视频上的互动信息,计算影响力转移矩阵w∈rn×n

其中,cij为用户j对用户i所发布的视频的评论和/或点赞次数,为用户j在用户i评论或点赞了某个视频后继续评论或点赞的次数,k∈n(uj)为用户j的所有邻居好友即关注好友。α、β分别为不同互动的重要性权重值,w(i,j)描述的是用户i对用户j的影响力。

可选地,根据所述分析结果得到所述用户集群的影响力具体为:it+1=bwit+(1-b)i0其中,it∈r1×n为t时刻所有用户的影响力值;t=0时,i0的每一个元素值等于1/n;b为可调节参数。

可选地,根据所述分析结果得到所述用户集群的影响力具体为:判断it和it+1的差别是否满足收敛条件,如满足则输出it。

可选地,所述收敛条件为设定的阈值或阈值范围。

本发明实施例提供的一种视频推荐装置,所述视频推荐装置包括获取单元,用于在预定时间内收集多个用户行为数据;存储单元,用于存储所述用户行为数据样本;第一聚类单元,用于采用聚类算法对所述用户行为数据样本的视频内容进行聚类,得到至少一个兴趣相似的用户集群;统计单元,用于统计所述兴趣相似的用户集群用户观看过的视频;图像单元,用于抽取所述视频每一帧图像并提取特征;第二聚类单元,采用聚类算法对所述视频每一帧图像的特征进行聚类,得到至少一个视频聚类;分析单元,用于分析所述视频聚类中所述用户集群中各用户之间的交互关系,根据所述分析结果得到所述用户集群的影响力;推荐单元,用于根据所述用户集群的影响力的排名进行推荐。

可选地,所述第一聚类单元及第二聚类单元采用的所述聚类算法为k-means算法。

可选地,所述图像单元抽取所述视频每一帧图像并提取特征,可通过尺度不变特征转换算法(scale-invariantfeaturetransform,sift)、灰度共生矩阵法、傅里叶功率谱法及深度学习模型中的一种方法实现。

本发明实施例提供一种视频推荐方法及装置,通过据用户行为和视频内容聚类结果以及用户影响力结果进行视频推荐,可以给用户找到符合用户兴趣的、高质量的视频,提高视频产品的用户体验、用户黏性、用户留存率和活跃度。

附图说明

图1是本发明第一实施例的视频推荐方法的流程示意图;

图2是本发明一实施例的视频推荐方法的应用示意图;

图3是本发明一实施例的视频推荐方法的用户互动示意图;

图4是本发明第一实施例的视频推荐装置模块组成示意图;

具体实施方式

本发明实施例提供一种图1是本发明一实施例的视频推荐方法的流程示意图,所述视频推荐方法及装置通过找出一部分具有高影响力的人,并将合适的视频优先推荐给他们,等他们在视频上有一些互动后,我们再将视频推荐给他们的好友。在给定推荐总数量的情况下,通过这种投放方式,我们将获得更多用户对视频的评论或者点赞,让视频给用户留下更深刻的印象,提升用户体验和交互频率、提高用户留存率。所述方法包括以下步骤:

s101,在预定时间内收集多个用户行为数据,建立用户行为数据样本;

s103,存储所述用户行为数据样本;

在一些实施例中,首先在预定的时间内获取用户的原始行为数据,然后根据预先建立的数据规范、格式化整理所述原始行为数据,形成新的符合规范的用户行为数据样本,最后为这些完整的、符合规范的用户行为数据样本建立数据存储标签和分类目录,并将用户行为数据样本数据存储。

s105,采用聚类算法对所述用户行为数据样本的视频内容进行聚类,得到至少一个兴趣相似的用户集群;

在一些实施例中,所述聚类算法为k-means算法。举例说明,在短视频平台上,我们可以收集用户近期观看视频的记录。这些记录反映了用户对视频的偏好。例如在视频平台上,假设我们有四个短视频,三个用户,用户1观看了视频1、2和3,用户2观看了短视频4,用户3观看了视频1、2,我们可以用表1来表示用户的历史行为记录。其中数字1表示用户观看了该视频,0表示没有任何行为。如果我们用向量来数值化用户在所有视频上的记录,则用户1、2、3可以分别表示为x1=[1110]、x2=[0001]和x3=[1100]。

基于向量化的用户行为记录,我们可以计算用户之间的相似度,然后用聚类算法找出兴趣爱好相似的用户。相似度的函数有很多种选择,譬如向量间的cosine相似度,pearson相关系数等。通过聚类算法,例如k-means,根据计算方法可挖掘出用户1和用户3是属于同一个类型的用户,用户2是另外一个类型的用户。

k-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。k-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量v最优分类,使得评价指标j最小。算法采用误差平方和准则函数作为聚类准则函数。

s107,统计所述兴趣相似的用户集群用户观看过的视频;

s109,抽取所述视频每一帧图像并提取特征;

在一些实施例中,抽取所述视频每一帧图像并提取特征可通过尺度不变特征转换算法(scale-invariantfeaturetransform,sift)、灰度共生矩阵法、傅里叶功率谱法及深度学习模型中的一种方法实现。

s111,采用聚类算法对所述视频每一帧图像的特征进行聚类,得到至少一个视频聚类;

s113,分析所述视频聚类中所述用户集群中各用户之间的交互关系,根据所述分析结果得到所述用户集群的影响力;

在一些实施例中,分析所述视频聚类中所述用户集群中各用户之间的交互关系具体为:根据用户之间的交互关系构成一个庞大的网络g,v={u1,u2,…,un},n为用户个数,,根据用户在视频上的互动信息,计算影响力转移矩阵w∈rn×n

其中,cij为用户j对用户i所发布的视频的评论和/或点赞次数,为用户j在用户i评论或点赞了某个视频后继续评论或点赞的次数,k∈n(uj)为用户j的所有邻居好友即关注好友。α、β分别为不同互动的重要性权重值,w(i,j)描述的是用户i对用户j的影响力。

根据所述分析结果得到所述用户集群的影响力具体为:it+1=bwit+(1-b)i0,其中it∈r1×n为t时刻所有用户的影响力值;t=0时,i0的每一个元素值等于1/n;b为可调节参数。

根据所述分析结果得到所述用户集群的影响力具体为:判断it和it+1的差别是否满足收敛条件,如满足则输出it。所述收敛条件为设定的阈值或阈值范围。

请一并参阅图2,假设短视频互动网络由4个用户构成,他们之间的互动情况如图1所示,节点u1,…,u4表示4个用户,有向边表示用户之间的互动。例如有向边u4->u1表示用户u4对用户u1的行为,边上的两个数字分别表示用户u4对用户u1发布的短视频有2次点赞,对用户u1评论的短视频有1次跟进的评论。设置α=0.5,β=0.5,然后根据公式(1)计算影响力转移矩阵:

随后初始化i0=(0.25,0.25,0.25,0.25),设置b=0.85。将w,i0,b代入t轮迭代运算,可以获得每个用户的最后的影响力值it=(1.29,1.33,0.87,1.13)。可以看出用户u2的影响力最大,u3的影响力最小。

s115,根据所述用户集群的影响力的排名进行推荐。

在一些实施例中,请一并参阅图3,举例首先根据用户观看行为进行聚类,找出兴趣相似的用户集群,例如对体育类用户集群及娱乐类用户集群,再次对体育类用户集群用户看过的视频根据内容进行聚类,例如找出和足球相关的视频。最后根据用户在每类视频上的互动行为找出影响力较大的用户的子集。最后在进行推荐时,我们优先给用户推送高影响力用户给予好评和赞赏的视频。

请参阅图4,本发明第一实施例的视频推荐装置模块组成示意图,所述视频推荐装置10可以为手机、pda(personaldigitalassistant,个人数字助理或平板电脑)、便携式通信装置、电脑、智能电视等任何具有显示功能的终端,还可以为智能手环等可穿戴设备以及嵌入于衣服、首饰等服饰配件中的穿戴式设备。所述视频推荐装置包括:

获取单元101,在预定时间内收集多个用户行为数据,建立用户行为数据样本;

存储单元103,用于存储所述用户行为数据样本;

在一些实施例中,首先获取用户的原始行为数据,然后根据预先建立的数据规范、格式化整理所述原始行为数据,形成新的符合规范的用户行为数据样本,最后为这些完整的、符合规范的用户行为数据样本建立数据存储标签和分类目录,并将用户行为数据样本数据存储。

在一些实施例中,所述存储单元103为具有闪存类型、硬盘类型、微型多媒体卡类型、卡式存储器(例如,sd或xd存储器等)、ram和rom(eeprom等)中的任何一种类型的存储介质。

第一聚类单元105,用于采用聚类算法对所述用户行为数据样本的视频内容进行聚类,得到至少一个兴趣相似的用户集群;

在一些实施例中,所述聚类算法为k-means算法。

统计单元107,用于统计所述兴趣相似的用户集群用户观看过的视频;

在一些实施例中,统计单元107基于向量化的用户行为记录,我们可以计算用户之间的相似度,然后用聚类算法找出兴趣爱好相似的用户。相似度的函数有很多种选择,譬如向量间的cosine相似度,pearson相关系数等。

图像单元109,用于抽取所述视频每一帧图像并提取特征;

在一些实施例中,所述图像单元109抽取所述视频每一帧图像并提取特征可通过尺度不变特征转换算法(scale-invariantfeaturetransform,sift)、灰度共生矩阵法、傅里叶功率谱法及深度学习模型中的一种方法实现。

第二聚类单元111,采用聚类算法对所述视频每一帧图像的特征进行聚类,得到至少一个视频聚类;

分析单元113,用于分析所述视频聚类中所述用户集群中各用户之间的交互关系,根据所述分析结果得到所述用户集群的影响力;

在一些实施例中,所述分析单元113分析所述视频聚类中所述用户集群中各用户之间的交互关系具体为:根据用户之间的交互关系构成一个庞大的网络g,v={u1,u2,…,un},n为用户个数,,根据用户在视频上的互动信息,计算影响力转移矩阵w∈rn×n

其中,cij为用户j对用户i所发布的视频的评论和/或点赞次数,为用户j在用户i评论或点赞了某个视频后继续评论或点赞的次数,k∈n(uj)为用户j的所有邻居好友即关注好友。α、β分别为不同互动的重要性权重值,w(i,j)描述的是用户i对用户j的影响力。

根据所述分析结果得到所述用户集群的影响力具体为:it+1=bwit+(1-b)i0,其中it∈r1×n为t时刻所有用户的影响力值;t=0时,i0的每一个元素值等于1/n;b为可调节参数。

根据所述分析结果得到所述用户集群的影响力具体为:判断it和it+1的差别是否满足收敛条件,如满足则输出it。所述收敛条件为设定的阈值或阈值范围。

请一并参阅图2,假设短视频互动网络由4个用户构成,他们之间的互动情况如图1所示,节点u1,…,u4表示4个用户,有向边表示用户之间的互动。例如有向边u4->u1表示用户u4对用户u1的行为,边上的两个数字分别表示用户u4对用户u1发布的短视频有2次点赞,对用户u1评论的短视频有1次跟进的评论。设置α=0.5,β=0.5,然后根据公式(1)计算影响力转移矩阵:

后初始化i0=(0.25,0.25,0.25,0.25),设置b=0.85。我们将w,i0,b代入t轮迭代运算,可以获得每个用户的最后的影响力值it=(1.29,1.33,0.87,1.13)。可以看出用户u2的影响力最大,u3的影响力最小。

推荐单元115,用于根据所述用户集群的影响力的排名进行推荐。

请一并参阅图3,举例首先根据用户观看行为进行聚类,找出兴趣相似的用户集群,例如对娱乐类用户集群及娱乐类用户集群,再次对体育类用户集群用户看过的视频根据内容进行聚类,例如分为国内或欧美相关的娱乐视频。最后根据用户在每类视频上的互动行为找出影响力较大的用户的子集。最后在进行推荐时,我们优先给用户推送高影响力用户给予好评和赞赏的视频。

本实施例的上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中,即,本发明实施例可以以软件产品的形式体现出来,其包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

在此基础上,以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,例如各实施例之间技术特征的相互结合,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1