一种视频搜索方法及装置的制造方法
【技术领域】
[0001] 本发明涉及搜索技术领域,特别涉及一种视频搜索方法及装置。
【背景技术】
[0002] 随着互联网技术的快速发展,互联网的业务不断增加,互联网中的数据类型也不 断增加,互联网中的数据类型除文字之外还包括视频。
[0003] 现有技术中,视频搜索是基于视频标题、导演名称或简介中的描述文字来进行搜 索的。多数用户可以通过输入视频标题、导演名称或简介的方式搜索到相应的视频,但是有 时候用户只记得一段视频台词,此时,现有技术不能够基于输入的视频台词搜索到相应的 视频。
【发明内容】
[0004] 为了解决上述问题,本发明实施例公开了一种视频搜索方法及装置,具体技术方 案如下:
[0005] 本发明提供的一种视频搜索方法,所述方法包括:
[0006] 接收用户输入的视频搜索请求,所述视频搜索请求中,携带用户期望的视频台词 文本;
[0007] 使用预设的分词规则,对所述台词文本进行分词处理,获得至少一个分词单元;
[0008] 根据预设的倒排索引信息,判断所获得的所有分词单元是否出现在相同视频中的 相同时间位置,如果是,则将所述视频确定为包含所述台词文本的视频;
[0009] 利用所确定的视频响应所述视频搜索请求;
[0010] 其中,所述倒排索引信息中包括至少一条索引数据,每条索引数据i对应一个分 词单元i,且每条索引数据i中,至少包括以下信息:
[0011] 包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息,i =1,2,......No
[0012] 根据本发明提供的一种【具体实施方式】,所述所确定的视频包含:多个视频;
[0013] 所述利用所确定的视频响应所述视频搜索请求,包括:
[0014] 针对所确定的视频生成多条搜索结果,每条搜索结果对应一个视频;
[0015] 根据所述预设的倒排索引信息,确定所述台词文本在所确定的各个视频中出现的 次数;
[0016] 按照出现次数由高到低的顺序,对所生成的搜索结果进行显示。
[0017] 根据本发明提供的一种【具体实施方式】,所述所确定的视频包含:多个视频;
[0018] 所述利用所确定的视频响应所述视频搜索请求,包括:
[0019] 针对所确定的视频生成多条搜索结果,每条搜索结果对应一个视频;
[0020] 获取所确定的各个视频的用户点击量;
[0021] 按照用户点击量由高到低的顺序,对所生成的搜索结果进行显示。
[0022] 根据本发明提供的一种【具体实施方式】,所述每条搜索结果中,包括:所述台词文本 出现在该条搜索结果所对应的视频中的时间位置信息。
[0023] 根据本发明提供的一种【具体实施方式】,所述利用所确定的视频响应所述视频搜索 请求,包括:
[0024] 针对所确定的视频生成至少一条搜索结果,并显示;其中,每条搜索结果对应一个 视频,每条搜索结果中,包括用于触发该搜索结果所对应的视频播放的操作标识;
[0025] 所述方法还包括:
[0026] 在接收到用户针对操作标识的选择操作后,确定出用户选择播放的视频;
[0027] 根据所述预设的倒排索引信息,得到所述台词文本在所述用户选择播放的视频中 出现的时间位置信息;
[0028] 根据所得到的时间位置信息及预设的定位规则,定位所述用户选择播放的视频的 播放时间点,从所定位的时间点开始播放该视频。
[0029] 本发明提供的一种视频搜索装置,所述装置包括:
[0030] 请求接收模块,用于接收用户输入的视频搜索请求,所述视频搜索请求中,携带用 户期望的视频台词文本;
[0031] 分词模块,用于使用预设的分词规则,对所述请求接收模块接收到的视频搜索请 求中携带的用户期望的视频台词文本进行分词处理,获得至少一个分词单元;
[0032] 第一视频确定模块,用于根据预设的倒排索引信息,判断所述分词模块分词处理 获得的所有分词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定 为包含所述台词文本的视频;
[0033] 请求响应模块,用于利用所述第一视频确定模块确定出的视频响应所述视频搜索 请求;
[0034] 其中,所述倒排索引信息中包括至少一条索引数据,每条索引数据i对应一个分 词单元i,且每条索引数据i中,至少包括以下信息:
[0035] 包含该分词单元i的视频的标识、该分词单元i在视频中所处的时间位置信息,i =1,2,......No
[0036] 根据本发明提供的一种【具体实施方式】,所述第一视频确定模块确定出的视频包 含:多个视频;所述请求响应模块,具体用于:
[0037] 针对所述第一视频确定模块确定出的视频生成多条搜索结果,每条搜索结果对应 一个视频;
[0038] 根据所述预设的倒排索引信息,确定所述台词文本在所述第一视频确定模块确定 出的各个视频中出现的次数;
[0039] 按照出现次数由高到低的顺序,对所生成的搜索结果进行显示。
[0040] 根据本发明提供的一种【具体实施方式】,所述第一视频确定模块确定出的视频包 含:多个视频;所述请求响应模块,具体用于:
[0041] 针对所述第一视频确定模块确定出的视频生成多条搜索结果,每条搜索结果对应 一个视频;
[0042] 获取所述第一视频确定模块确定出的各个视频的用户点击量;
[0043] 按照用户点击量由高到低的顺序,对所生成的搜索结果进行显示。
[0044] 根据本发明提供的一种【具体实施方式】,所述每条搜索结果中,包括:所述台词文本 出现在该条搜索结果所对应的视频中的时间位置信息。
[0045] 根据本发明提供的一种【具体实施方式】,所述请求响应模块,具体用于:
[0046] 针对所述第一视频确定模块确定出的视频生成至少一条搜索结果,并显示;其中, 每条搜索结果对应一个视频,每条搜索结果中,包括用于触发该搜索结果所对应的视频播 放的操作标识;
[0047] 所述装置还包括:
[0048] 第二视频确定模块,用于在接收到用户针对操作标识的选择操作后,确定出用户 选择播放的视频;
[0049] 时间位置信息获得模块,用于根据所述预设的倒排索引信息,得到所述台词文本 在所述第二视频确定模块确定出的用户选择播放的视频中出现的时间位置信息;
[0050] 视频播放模块,用于根据所得到的时间位置信息及预设的定位规则,定位所述第 二视频确定模块确定出的用户选择播放的视频的播放时间点,从所定位的时间点开始播放 该视频。
[0051] 应用上述技术方案,本发明提供的视频搜索方法及装置,在接收用户输入的、携带 有用户期望的视频台词文本的视频搜索请求后,可以使用预设的分词规则,对所述台词文 本进行分词处理,获得至少一个分词单元;根据预设的倒排索引信息,判断所获得的所有分 词单元是否出现在相同视频中的相同时间位置,如果是,则将所述视频确定为包含所述台 词文本的视频;利用所确定的视频响应所述视频搜索请求。
[0052] 与现有技术相比,本发明可以充分地利用视频的字幕信息,将用户期望搜索的视 频的台词文本与视频的字幕信息中的字幕文本进行内容匹配,在台词文本与字幕文本内容 完全相同的情况下,将该字幕文本所属的视频确定为用户期望搜索的视频,从而实现了基 于台词文本的视频搜索。
【附图说明】
[0053] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0054] 图1为本发明实施例提供的一种视频搜索方法的流程图;
[0055] 图2为本发明实施提供的图1中S104的一种实施方式流程图;
[0056] 图3为本发明实施提供的图1中S104的另一种实施方式流程图;
[0057] 图4为本发明实施例提供的另一种视频搜索方法的流程图;
[0058] 图5为本发明实施例提供的一种视频搜索装置的结构示意图;
[0059] 图6为本发明实施例提供的另一种视频搜索装置的结构示意图。
【具体实施方式】
[0060] 为了使本领域技术人员更好地理解本发明中的技术方案,下面将结合本发明实施 例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例 仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通 技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范 围。
[0061] 在现在的电视节目和视频中,字幕(或称为台词)已经成为电视、视频网站等传媒 系统中不可缺少的一个组成部分,它与电视节目、视频的图像、声音、特技等一起组成了一 种共时间共空间的多方位多信息渠道的传播手段,它不仅能够提高单位时间内信息传播的 速度和质量,还能够从视、听两个方面强化重要信息,增强信息的准确性、明晰性,降低听觉 误差。更为重要的是,它还可以作为电视画面构成的一部分参与到电视画面的构图中,除了 对某些视觉部分气到有效的强调作用外,还能带给人们视觉上的美感。有时候,仅仅字幕本 身就能达到表意的作用;而更多的时候,字幕则是与相应的声音、图像一起来完成表情达意 的功能。
[0062] 现有的视频搜索是基于视频标题、导演名称及简介中的描述文字实现的,多数情 况下,用户可以准确地记住期望搜索的视频的标题、导演名称、简介信息,通过现有的视频 搜索技术搜索到期望的视频;但是,有时候用户可能仅记得视频中一段经典台词,此时,通 过现有的视频搜索技术并不能够搜索到期望的视频。
[0063] 此外,区别于以图片的形式被镶嵌到了视频图像中的图像格式字幕