专利名称:获取视频信息的方法和装置的制作方法
技术领域:
本发明涉及互联网领域,特别涉及一种获取视频信息的方法和装置。
背景技术:
目前有很多视频网站,为用户提供多元化的视频服务。做为网站,希望用户停留的时间更长一些,为了留住用户,各个网站都推出了 “相关视频”服务,即视频推荐,就是在所观看视频的旁边,显示了其他相关视频推荐给用户,希望用户观看完所看视频后,能点击旁边的相关视频,以此使用户在网站的停留时间加长。现有技术中,当用户登录视频网站输入所要观看的视频信息时,该视频网站会根据用户输入的视频信息,来搜索与该视频信息相关联的视频,提供给用户选择。在对现有技术进行分析后,发明人发现现有技术至少具有如下缺点现有技术中都是根据用户观看某个视频时输入的该视频信息来搜索相关联的视频以提供给用户,但是提供给用户的不一定是用户喜欢观看的视频信息,因此也不能保证用户的停留时间。
发明内容
为了能够提供给用户喜欢的视频,以延长用户在该网站的停留时间,本发明实施例提供了一种获取视频信息的方法和装置。所述技术方案如下一方面,提供了一种获取视频信息的方法,所述方法包括构建视频间的拉动矩阵;获取特定用户的观看历史信息;根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。所述构建视频拉动矩阵,包括将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;根据所述用户对视频所持有的观看态度,分别统计视频信息平台上用户同时对任意两个视频i和视频j所持有的观看态度的用户数量;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户
数量;根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率iiu(l,1),喜欢所述视频j但不喜欢所述视频i的用户的概率^^ (-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率^^(1,-1),不喜欢所述视频」同时也不喜欢所述视频i的用户的概率au(-l,_l);将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率组成nXn的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素%是一个包含4个值 Bij(Ll), BijMa), ^.(1, -1),Bij (-1, -1)的结构体,所述i不等于所述j,且所述i和j 为小于等于η的自然数,η为所述视频信息平台上视频的数量。所述根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息,包括根据所述特定用户的观看历史信息,构建一个由。组成的η维向量f,其中fj代表所述用户对第j个视频的态度;根据所述η维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。所述将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,包括获取用户对视频的观看时间;判断所述观看时间是否小于预设时长;如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。所述根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量,包括对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。所述获取所述特定用户喜欢的视频信息,之后还包括判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;如果是,则继续执行步骤,否则,丢弃所述视频信息。另一方面,提供了一种获取视频信息的装置,所述装置包括构建模块,用于构建视频间的拉动矩阵;获取模块,用于获取特定用户的观看历史信息;提供模块,用于根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。所述构建模块,包括第一获取单元,用于将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;统计单元,用于根据所述用户对视频所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量其中包括,喜欢j视频同时喜欢i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j 但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;
第一计算单元,用于根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率% ;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率%(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率iiu(-l,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率 “1,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率 atJ (-1, -1);第一构建单元,用于将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率组成ηXη的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素^^是一个包含4个值 ^(1,1),Bij (-1,1),Bij (1, -1),Bij (-1, -1)的结构体,所述i不等于所述j, 且所述i和j为小于等于η的自然数,η为所述视频信息平台上视频的数量。所述提供模块,包括第二构建单元,用于根据所述特定用户的观看历史信息,构建一个由。组成的η 维向量f,其中。代表所述用户对第j个视频的态度;第二计算单元,用于根据所述η维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;第二获取单元,用于根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;提供单元,用于根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。所述第一获取单元,具体用于获取用户对视频的观看时间;判断所述观看时间是否小于预设时长;如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。所述第二获取单元,具体用于对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所述所有视频的综合向量。所述提供单元,还用于在获取所述特定用户喜欢的视频信息之后,判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;如果是,则继续执行步骤,否则,丢弃所述视频信息。本发明实施例提供的技术方案的有益效果是通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵, 分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例1提供的一种获取视频信息的方法的流程图;图2是本发明实施例2提供的一种获取视频信息的方法的流程图;图3是本发明实施例3提供的一种获取视频信息的装置的示意图;图4是本发明实施例3提供的一种获取视频信息的装置的示意图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。实施例1参见1,本实施例提供了一种获取视频信息的方法,包括步骤101 构建视频间的拉动矩阵;步骤102 获取特定用户的观看历史信息;步骤103 根据视频间的拉动矩阵和特定用户的观看历史信息,提供特定用户喜欢的视频信息。本发明实施例提供的技术方案的有益效果是通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵, 分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。买施例2参见图2,本实施例提供了一种获取视频信息的方法,包括步骤201 将历史数据进行预处理,获得每个用户对视频信息平台上视频持有的观看态度。本实施例中,视频信息平台,指任何可以提供视频信息的平台,可以是专门视频网站,也可以是包含视频信息的网站,本实施例对此不做具体限定。其中,本实施例中以视频网站为例进行说明。本实施例中,以用户的观看历史为输入数据,每条记录包含以下信息(userld,vediold,观看时长与视频时长之比);对历史观看数据进行预处理,获得每个用户对视频信息平台上视频持有的观看态度,具体包括获取用户对视频的观看时间,判断该用户的观看时长是否小于预设的时长, 如果是,则将用户对该视频的观看态度记为不喜欢;否则将用户对该视频的观看态度记为喜欢。其中,可以将用户对视频的观看态度转换为用户观看列表,如下形式,userld (vedio_l, 1), (vedio_4, _1)......其中,用户观看列表中每个元素包含两个字段,第一个为用户点击过的视频,第二个为对该视频的态度,1代表喜欢,-1代表不喜欢。本实施例中,预设时长为用户观看视频最少的时间,可以为视频时长的15 %,20 %,30 %等,本实施例对此不做具体限定。步骤202 根据用户对视频所持有的观看态度,分别统计视频网站上的用户中同时对视频i和视频j所持有的态度的用户数量、(*,*)。其中,将喜欢j视频同时喜欢i视频的用户数记为bu(l,1),喜欢视频j但不喜欢视频i的用户数记为(-1,1),不喜欢视频j但喜欢视频i的用户数记为(1,-1),不喜欢视频j同时也不喜欢视频i的用户数记为bu(-l,-1),其中i不等于j,且i和j为小于等于η的自然数。步骤203 根据统计出的用户同时对视频i和视频j所持有的态度的用户数量,计算出用户中同时对视频i和视频j所持有的态度的概率。其中,将喜欢视频j同时喜欢视频i的概率记为 ^.α,1),喜欢视频j但不喜欢视频i的概率记为Aj (-1,1),不喜欢视频j但是喜欢视频i的概率记为Aj (1,-1),不喜欢视频j同时也不喜欢视频i的概率记为%(-1,-1)。本实施例中,根据统计出的bu(*,*),计算屮“*,*),有以下两种情况如果、(*,1)有一个不为0,贝IJ
权利要求
1.一种获取视频信息的方法,其特征在于,所述方法包括构建视频间的拉动矩阵;获取特定用户的观看历史信息;根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
2.根据权利要求1所述的方法,其特征在于,所述构建视频拉动矩阵,包括将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;根据所述用户对视频所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量、;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率;其中包括, 喜欢所述视频j同时喜欢所述视频i的用户的概率iiu(l,l),喜欢所述视频j但不喜欢所述视频i的用户的概率iiu(-l,l),不喜欢所述视频j但是喜欢所述视频i的用户的概率 BiJd, -1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率%(_1,-1);将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率^^组成ηΧη的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素%是一个包含4个值 ^(1,1), Bij (-1,1),Bij (1,-1),Bij (-1,-1)的结构体,所述i不等于所述j,且所述i和j为小于等于 η的自然数,η为所述视频信息平台上视频的数量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息,包括根据所述特定用户的观看历史信息,构建一个由。组成的η维向量f,其中。代表所述用户对第j个视频的态度;根据所述η维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
4.根据权利要求2所述的方法,其特征在于,所述将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,包括获取用户对视频的观看时间;判断所述观看时间是否小于预设时长;如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
5.根据权利要求3所述的方法,其特征在于,所述根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量,包括对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。
6.根据权利要求3所述的方法,其特征在于,所述获取所述特定用户喜欢的视频信息, 之后还包括判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息; 如果是,则继续执行步骤,否则,丢弃所述视频信息。
7.一种获取视频信息的装置,其特征在于,所述装置包括 构建模块,用于构建视频间的拉动矩阵;获取模块,用于获取特定用户的观看历史信息;提供模块,用于根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。
8.根据权利要求7所述的装置,其特征在于,所述构建模块,包括第一获取单元,用于将历史观看数据进行预处理,获得每个用户对视频持有的观看态度,所述观看态度包括喜欢和不喜欢;统计单元,用于根据所述用户所持有的观看态度,分别统计所述用户同时对任意两个视频i和视频j所持有的观看态度的用户数量1^.;其中包括,喜欢所述j视频同时喜欢所述i视频的用户数量,喜欢所述视频j但不喜欢所述视频i的用户数量,不喜欢所述视频j 但喜欢所述视频i的用户数量,不喜欢所述视频j同时也不喜欢所述视频i的用户数量;第一计算单元,用于根据所述统计出的用户同时对任意两个视频i和视频j所持有的态度的用户数量,计算出所述用户中同时对所述任意两个视频i和视频j所持有的态度的概率;其中包括,喜欢所述视频j同时喜欢所述视频i的用户的概率 ^(1,1),喜欢所述视频j但不喜欢所述视频i的用户的概率(-1,1),不喜欢所述视频j但是喜欢所述视频i的用户的概率iiu(l,-1),不喜欢所述视频j同时也不喜欢所述视频i的用户的概率 atJ (-1, -1);第一构建单元,用于将所述用户同时对所述任意两个视频i和视频j所持有的态度的概率组成nXn的矩阵,得到视频间的拉动矩阵;其中,所述矩阵的每个元素%是一个包含4个值 ^(1,1),Bij (-1,1),Bij (1, -1),Bij (-1, -1)的结构体,所述i不等于所述j,且所述i和j为小于等于η的自然数,η为所述视频信息平台上视频的数量。
9.根据权利要求7所述的装置,其特征在于,所述提供模块,包括第二构建单元,用于根据所述特定用户的观看历史信息,构建一个由。组成的n维向量f,其中。代表所述用户对第j个视频的态度;第二计算单元,用于根据所述η维向量f和所述视频间的拉动矩阵,计算得到所述特定用户喜欢的列表向量和不喜欢的列表向量;第二获取单元,用于根据所述特定用户喜欢的列表向量和不喜欢的列表向量,得到所述特定用户对所有视频的综合向量;提供单元,用于根据所述得到的所述特定用户对所述所有视频的综合向量,获取所述特定用户喜欢的视频信息,并将所述特定用户喜欢的视频信息返回给所述特定用户。
10.根据权利要求8所述的装置,其特征在于,所述第一获取单元,具体用于 获取用户对视频的观看时间;判断所述观看时间是否小于预设时长;如果是,则得到所述用户对所述视频的观看态度为不喜欢;否则得到所述用户对所述视频的观看态度为喜欢。
11.根据权利要求9所述的装置,其特征在于,所述第二获取单元,具体用于对所述用户喜欢的列表向量和不喜欢的列表向量均做归一化处理,得到新的所述用户喜欢的列表向量和不喜欢的列表向量;根据所述新的所述用户喜欢的列表向量和不喜欢的列表向量,得到所述用户对所有视频的综合向量。
12.根据权利要求9所述的装置,其特征在于,所述提供单元,还用于在获取所述特定用户喜欢的视频信息之后,判断所述特定用户喜欢的视频信息是否为所述特定用户未观看过的视频信息;如果是,则继续执行步骤,否则,丢弃所述视频信息。
全文摘要
本发明公开了一种获取视频信息的方法和装置,属于互联网领域。所述方法包括构建视频间的拉动矩阵;获取特定用户的观看历史信息;根据所述视频间的拉动矩阵和所述特定用户的观看历史信息,提供所述特定用户喜欢的视频信息。所述装置包括构建模块,获取模块,提供模块。本发明实施例通过所有用户的历史观看信息,得到各个视频之间的拉动关系,再根据特定用户的观看历史信息,结合构建的视频拉动矩阵,分析出该特定用户的习惯和偏好,推荐其可能喜欢的视频,从而保证用户的停留时间。
文档编号G06F17/30GK102486796SQ20101058226
公开日2012年6月6日 申请日期2010年12月3日 优先权日2010年12月3日
发明者丘正元, 廖海波, 易文晟, 盛馥钟, 陈培炫 申请人:腾讯科技(深圳)有限公司