一种视频推荐方法及装置的制造方法_2

文档序号:9751005阅读:来源:国知局
标签2所属类别,…,视频标 签η对应视频标签η所属类别。视频标签所属类别不包括关键词类别。
[0030] 列表2的存储格式为:{视频标识:"XXX,关键词1,关键词2,…,关键词m}。关键词 1,关键词2,…,关键词m属于关键词类别。
[0031] 优选的,在步骤101中,可以设置一个更新周期,更新周期的长短可以根据视频数 据的数据库更新情况进行设定,例如,可以设为一个月,一周或一天,本发明对此不进行限 制,在每个更新周期内获取所述每个更新周期内的视频数据的属性信息并进行更新。本实 施例下述各步骤均以当前周期为例进行说明。
[0032] 102、视频推荐装置根据所述视频属性信息及预设的视频标签所属类别权重,计算 目标视频与其他视频之间的权重得分,其中,视频标签所属类别权重反映视频标签所属类 别的优先级。
[0033] 具体地,所述视频标签所属类别权重为二进制权重,视频标签所属类别优先级高, 则设置的二进制权重大。
[0034] 示例性的,影视类视频标签所属类别题材的优先级可以高于年代的优先级高于国 家高于关键词优先级,教育类视频标签所属类别设置可以适用人群的优先级高于适用年级 的优先级高于科目的优先级高于版本的优先级高于关键词的优先级。
[0035] 视频标签所属类别要严格体现出优先级,那么设置的权重也要恰当。
[0036] 所述根据所述视频属性信息及预设的视频标签所属类别权重,获取目标视频与其 他视频之间的权重得分具体为:将目标视频中的每项视频标签与其他视频中的每项视频标 签进行匹配,匹配成功,则值为1,匹配失败,则值为〇,将获得的每项视频标签匹配值乘以预 设的视频标签所属类别权重,求和即为该两视频之间的权重得分。
[0037] 示例性的,教育视频的视频标签所属类别可以为适用人群、适用年级、科目、版本 四个类别。适用人群的优先级高于适用年级的优先级高于科目的优先级高于版本的优先 级。对目标视频中的每项视频标签与其他视频中的每项视频标签进行匹配,匹配成功,值为 1,匹配失败,值为〇,将获得的每项视频标签匹配值乘以预设的视频标签所属类别权重,求 和即为该两视频之间的权重得分。
[0038] 可以用目标视频与其他视频之间的权重得分计算公式计算:
匕:表示两视频的视频标签是否匹配,匹配成功,则为1,匹配失败,则为〇, d!.r _ __ ??:2、.. ??3、…:? :分别表不各视频标签所属类别权重。
[0039] 假设所设置的视频标签所属类别权重由低到高的顺序为:%丨%、…,,最终 的相似度计算公式为各个视频标签匹配成功的视频标签所属类别权重的累加,即:
(1) 心:表示两视频的视频标签是否匹配,匹配成功,则为1,匹配失败,则为〇。
[0040] 假设有两个视频分别和目标视频进行匹配,计算这两个视频与目标视频的权重得 分,按照公式计算结果如下:
其中,m e …力,m为自然数,η为视频标签个数。[0041] 假设这两个视频当中有某些视频标签和目标视频的视频标签不匹配,在这些不匹 (2) (3) 配的视频标签中,优先级最高的视频标签所属类别对应的权重为《",且第二个视频中, 对应的视频标签与目标视频的视频标签不匹配,^::= 0。因为在与目标视频的视频标签不 匹配的视频标签中&对应的视频标签优先级最高,而在进行视频推荐的时候,优先级比较 高的视频标签所属类别与用户的需求相关度比较大,在第一个视频与第二个视频的视频标 签m+1项到η项均与目标视频标签的m+1到η项匹配的前提下,第一个视频对应的视频标签 与目标视频的视频标签匹配,则第一个视频与目标视频最相关,那么。
[0042]为了满足这一结果,最苛刻的条件就是在汝中,心匕…中除了仏为1外,其 他的都是〇,在没中,¥ ¥,…中除了^=0:外,其他的都是1。所以!〇,>^:;:^2转 化为:
其中式*为大于零的某个常数,在公式中作为一个辅助变量。[0043]根据公式(5)可以演变得到以下公式: (4) (5)
(6) 公式(6 )与公式(?5)相Μ,得剞以下公式:
(7) 综上,视频标签所属类别权重设置需满足公式(7)。
[0044] 满足该公式的解决方案可能有很多种,考虑到最终还要涉及到权重得分的归一化 问题,权重之间的大小变化尽量小,取一种最可行和方便的一种,即取4+1-< = 〇,那么, ,则%为公比为二的等比数列。
[0045] 所以最终的公式变成了:
[0046] 二进制权重的特点在于:当优先级高的视频标签所属类别对应的视频标签没有匹 配成功的时候,即使剩下的优先级级别比它低的视频标签所属类别中的视频标签全部匹配 成功,得到权重得分也不会大于该优先级高的视频标签所属类别中的视频标签匹配成功时 的权重,这样,所计算出的视频间的权重得分就可以体现出优先级的特点,在为用户推荐 时,首先推荐优先级比较高的视频,同时也更倾向于是用户喜欢的视频。
[0047] 另外,为了避免根据视频标签所属类别中视频标签匹配计算视频间权重得分,出 现目标视频与其他两个视频之间的权重得分相同的情况,所以,视频标签所属类别增加关 键词属性。相应的,目标视频与其他视频之间的权重得分计算公式变为如下:
其中,h为关键词类别中的视频标签匹配的个数,',f为预设视频的关键词类 别中视频标签个数,1表示目标视频与其他视频中对应项视频标签是否匹配成功,匹配成 功,值为1,匹配失败,值为0,k、m、n为自然数,2M取满足大于/ * #的最小值。
[0048] 该公式不仅体现出了标签的优先级的属性(基于二进制的特性),还体现出了关键 词匹配的个数的属性。这样,假设两个视频与目标视频中除去关键词之外的视频标签所属 类别匹配值相等,则还可以根据关键词属性进行区分,从而可以更加精确地将相关视频选 取出来,推荐给用户。
[0049] 需要注意的是:此公式中,参数k、m需满足关系,如果预设视频关键词 类别中视频标签个数为5,则5*2^ <2M,考虑后面的归一化处理,为了尽量使得到的权重得 分差距小一些,k取最小值0,则m最小为3。
[0050] 需要说明的是:k和m的数值根据f的值的不同相应调整,调整的原则是在关键词类 别中视频标签全部匹配和与关键词类别高一优先级的视频标签所属类别中的视频标签匹 配的前提下,尽量使关键词类别所占的权重与比它高一优先级的视频标签所属类别所占的 权重差距小一些。这样的目的是:在目标视频与其他两个视频除去关键词类别属性,其余视 频标签所属类别中的视频标签全部匹配的前提下,如果关键词类别属性所占的权重与比它 高一优先级的视频标签所属类别所占的权重差距不大的话,则对得到的权重得分归一化 后,关键词类别属性在整个权重得分所占的比重可以区分开来,这样目标视频与这两个视 频中的哪个视频比较类似就可以根据归一化后的值挑选出来。反之,如果关键词类别属性 所占的权重与比它高一优先级的视频标签所属类别所占的权重差距大的话,那么在进行归 一化后,目标视频与其他两个视频的相似度很可能会出现因为小数点位置取舍导致相同的 情况,这样,就无法区分目标视频与这两个视频中的哪个视频比较相似。
[0051] 下面以教育视频推荐作为实施例进行详细描述: 在教育视频中,首先获取教育视频的属性信息,属性信息包括教育视频标识、教育视频 标签及教育视频标签所属类别,并将所有教育视频标识及教育视频标签、教育视频标签所 属类别以数据表的格式存储到数据库中。
[0052] 本实施例将教育视频标签所属类别划分为5类,分别为适用人群、适用年级、科目、 版本、关键词。
[0053] 其中,适用人群可以分为:幼儿园、小学、中学、大学、研究生等;适用年级可以为: 小班、中班、大班、一年级、初一、高二、大一、研二等;科目可以分为:语文、数学、英语、哲学 等;版本可以分为:人教版、苏教版;关键词可以为:童话、奥数、诗词、作文、立体几何等。 [0054]按照用户的实际需求,在推荐的时候,适用人
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1