播放多媒体文件的方法及装置的制造方法
【专利摘要】本发明公开了一种播放多媒体文件的方法及装置。方法包括:获取用户输入的检索信息;根据检索信息查询多媒体信息数据库,获取候选多媒体信息记录,候选多媒体信息记录包括多媒体信息数据库中与检索信息相匹配的多媒体信息记录;输出候选多媒体信息记录;接收用户针对候选多媒体信息记录的选择指令,其中,该选择指令用于指示用户从候选多媒体信息记录中选出的目标多媒体信息记录;根据目标多媒体信息记录中的时段信息,播放目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。由此,可以节省用户在搜索多媒体文件的过程中的决策时间,提高多媒体文件检索的工作效率。
【专利说明】
播放多媒体文件的方法及装置
技术领域
[0001]本发明涉及视频搜索播放领域,具体地,涉及一种播放多媒体文件的方法及装置。 【背景技术】
[0002]视频素材的管理和检索是好多拥有视频素材厂商的痛点。不同于文本检索可以通过输入关键字的匹配进行查找,视频文件的检索通常都是由人工方法将视频中讲述的“内容”以手工的方式标记出来,比如一个视频中含有小明出席了同学聚会,手工人员会将小明、同学聚会等关键词记录下来并与视频文件捆绑。检索视频时可以通过输入小明或同学聚会的关键字找到该视频。但是,如果使用者想要了解在该视频文件中何时出现了小明或同学聚会,则检索到结果后,使用者还需要对全片视频文件进行预览才能得到想要的结果, 这就导致费时费力,检索效率低下。
【发明内容】
[0003]本发明的目的是提供一种播放多媒体文件的方法及装置,以节省用户在搜索多媒体文件的过程中的决策时间,提高多媒体文件检索的工作效率。
[0004]为了实现上述目的,本发明提供一种播放多媒体文件的方法,所述方法包括:获取用户输入的检索信息;根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;输出所述候选多媒体信息记录;接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
[0005]可选地,所述根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,包括:将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
[0006]可选地,在输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
[0007]可选地,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及所述输出所述候选多媒体信息记录,包括:显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。
[0008]可选地,所述多媒体信息数据库通过以下方式来建立:从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
[0009]可选地,所述对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识另IJ,得到与所述时段信息相对应的多媒体内容的文本信息,包括:对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
[0010]本发明还提供一种播放多媒体文件的装置,所述装置包括:检索信息获取模块,被配置为获取用户输入的检索信息;查询模块,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;输出模块,被配置为输出所述候选多媒体信息记录;选择指令接收模块,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;播放模块,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
[0011]可选地,所述查询模块包括:匹配子模块,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;第一获取子模块,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
[0012]可选地,在所述输出模块输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
[0013]可选地,所述多媒体内容的标识信息为所述多媒体内容的文本信息;以及所述输出模块包括:显示子模块,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。 [〇〇14]可选地,所述多媒体信息数据库通过多媒体信息数据库建立模块来建立,并且所述多媒体信息数据库建立模块包括:第二获取子模块,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;时间戳添加子模块,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;识别子模块,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;存储子模块,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。
[0015]可选地,所述识别子模块包括:第一识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;第二识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及文本信息确定单元,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
[0016]在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材,因此,节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。
[0017]本发明的其他特征和优点将在随后的【具体实施方式】部分予以详细说明。【附图说明】
[0018]附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的【具体实施方式】一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0019]图1是根据本发明的实施方式的建立多媒体信息数据库的方法的流程图;
[0020]图2是一示例多媒体文件分割并添加时间戳的示意图;[0021 ]图3是一示例多媒体信息数据库的示意图;
[0022]图4是根据本发明的实施方式的播放多媒体文件的方法的流程图;
[0023]图5A至图5C示出了根据本发明的实施方式的播放多媒体文件的装置的框图。
[0024]图6A至图6B示出了根据本发明的实施方式的多媒体信息数据库建立模块的框图。【具体实施方式】
[0025]以下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0026]在本发明中,多媒体文件可以包括但不限于视频文件、音频文件等。[〇〇27]在详细描述本发明提供的播放多媒体文件的方法之前,先描述一下如何建立多媒体信息数据库的方法,以为后续多媒体文件检索建立基础。
[0028]图1示出了根据本发明的实施方式的建立多媒体信息数据库的方法的流程图。如图1所示,该方法可以包括:[〇〇29]在步骤101中,从多媒体资源库获取多媒体文件和与该多媒体文件相对应的多媒体文件标识信息。
[0030]在多媒体资源库中存储有大量的多媒体文件,可以首先获取其中一个多媒体文件及该多媒体文件相对应的多媒体文件标识信息,并针对该多媒体文件进行以下处理。之后,再一一遍历该多媒体资源库中包含的其他多媒体文件,利用同样的方法进行处理,从而完成多媒体信息数据库的建立。
[0031]在本发明中,多媒体文件标识信息可以用于唯一地表示所对应的多媒体文件。其中,该多媒体文件标识信息可以例如为所对应的多媒体文件的编号、名称等等。
[0032]在步骤102中,按照预设的时间间隔为多媒体文件添加时间戳,其中,相邻两个时间戳用于限定该多媒体文件的时段信息。
[0033]预设的时间间隔可以视实际需求来设定,通常设定得相对较短,例如,5秒。也就是说,从该多媒体文件的起始处开始,每隔5秒为该多媒体文件添加时间戳。通过这一步骤,可以将一个完整的多媒体文件分割成多个多媒体文件片段,并且每个多媒体文件片段对应一个时段信息。
[0034]例如,如图2所示,假设一个完整的多媒体文件(其相对应的多媒体文件标识为 “001”)的总时长为1分钟,那么按照每隔5秒添加时间戳,则该多媒体文件可以总共被分割成12个多媒体文件片段S1?S12。相邻两个时间戳可以限定一个时段信息,这样,每个多媒体文件片段就可以对应一个时段信息。例如,如图2所示,S1所对应的时段信息可以为“00: 00-00:05”,S2所对应的时段信息可以为“00:05-00:10”,S3所对应的时段信息可以为“00: 10-00:15”,依次类推。
[0035]在步骤103中,针对每个时段信息,对多媒体文件中与该时段信息相对应的多媒体内容进行识别,得到与该时段信息相对应的多媒体内容的文本信息,其中,该文本信息作为多媒体文件中与该时段信息相对应的多媒体内容的标识信息。
[0036]例如,假设针对图2所示的多媒体文件,针对“00:05-00:10”这一时段信息,可以针对与该时段信息相对应的多媒体内容(即,多媒体文件片段S2中包含的多媒体内容)进行识另IJ,得到关于该多媒体内容的文本信息。
[0037]在进行识别时,可以采用文字识别技术或语音识别技术进行识别。例如,在一个实施方式中,针对有字幕的视频文件,可以利用文字识别技术(例如,0CR(0ptical Character Recognit1n)光学字符识别技术)来识别出字幕部分对应的文本信息,并将该文本信息作为相对应的多媒体内容的标识信息。或者,在另一个实施方式中,针对无字幕的视频文件, 可以利用语音识别技术(ASR,Auto Speech Recognize)来识别出语音部分对应的文本信息,并将该文本信息作为相对应的多媒体内容的标识信息。
[0038]在步骤104中,针对每个时段信息,将该多媒体文件标识信息、该时段信息、以及该多媒体文件中与该时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在多媒体信息数据库中。[〇〇39]例如,假设针对图2所示的多媒体文件,经过步骤102至步骤104,能够得到12条多媒体信息记录,如图3所示,这12条多媒体信息记录被存储在多媒体信息数据库中。
[0040]针对多媒体资源库中的每一个多媒体文件,都可以按照上述方法处理,由此,完成多媒体信息数据库的建立。另外,一旦多媒体资源库中有更新,则可以按照上述方法同步更新多媒体信息数据库。
[0041]如上所述,在进行识别时,可以采用文字识别技术或语音识别技术进行识别。不过,OCR技术在识别一些特定内容时精度不高,例如,字母、数字等。因此,为了提高文本信息的识别准确率,在本发明的一个可选的实施方式中,采用这两种技术共同进行识别,如下所述。
[0042]在执行步骤103时,首先,可以对多媒体文件中与该时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果。[〇〇43]接下来,对多媒体文件中与该时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果。
[0044]最后,根据字幕识别结果和语音识别结果,得到与该时段信息相对应的多媒体内容的文本信息。
[0045]具体地,首先,字幕识别结果中可能包括多个字符,该多个字符中可能包括汉字、 外语单词、字母、数字或者符号中的一种或者多种,因此可以先将字幕识别结果进行分词, 用于将所述字幕识别结果划分为多个字符集合,每个字符集合中包括一个或多个字符,BP 每个字符集合可能是一个字、词、句,也可能是一个字母、一个单词、一个或一组数字。例如, 假设字幕为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章”,在通过OCR对字幕进行识别后,假设得到的字幕识别结果为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章”。在对该字幕识别结果进行分词后,示例地,假设得到的分词结果为:“最早,对,印刷体,汉字识别,进行研究的,是,1BM,公司,的,Casey和Nagy,1966,年, 他们,发表了,第一篇,关于,汉字识别,的文章”。
[0046]接下来,将上述分词得到的多个字符集合分别与预定义的关键词进行对比,在所有的字符集合中查找与预定义的关键词匹配的字符集合,与预定义的关键词匹配的字符集合就是需要找到的目标字符。示例地,预定义的关键词可以包括两类,一类为代表数字的关键词,例如:年、月、日,时、分、秒等时间单位,以及重量,体积,价钱等度量单位;另一类为代表字母的关键词,例如:品牌,公司,地名等名词形式的词语。从而,根据这里的关键词,可以确定上述分词得到的多个字符集合“最早,对,印刷体,汉字识别,进行研究的,是,1BM,公司,的,Casey和Nagy,1966,年,他们,发表了,第一篇,关于,汉字识别,的文章”中与预定义的关键词匹配的为“公司”和“年”,从而字幕识别结果中的目标字符就是“公司”和“年”。
[0047]当查找到目标字符时,确定目标字符所匹配的关键词所属的分类,分类包括代表数字的关键词,或代表字母的关键词。以上述示例为例,“公司”为代表字母的关键词,“年” 为代表数字的关键词。
[0048]当目标字符所匹配的关键词属于代表数字的关键词时,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为数字的字符。
[0049]在本实施例中,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为数字的字符可以理解为,将目标字符之前的,或者目标字符之后的,或者目标字符前后的确定为字符属性为数字的字符,而实际需要采用上述三种情况中的哪一种可以根据目标字符所匹配的关键词,以及与该关键词对应的判定策略来确定。示例地,由于年、月、 日,时、分、秒等时间单位,以及重量,体积,价钱等度量单位之前的字符为数字的可能性大于为字母的可能性,因此其对应的判定策略可以为:将目标字符之前的字符确定为字符属性为数字的字符。[〇〇5〇]因此,由于在上面得到的分词结果中,在目标字符“年”之前的字符集合为“1966”, 从而结合之前确定出的“年”为代表数字的关键词,以及上述的判定策略,可以将目标字符“年”之前的字符集合“1966”确定为字符属性为数字的字符。[0051 ]相类似地,当目标字符所匹配的关键词属于代表字母的关键词时,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为字母的字符。
[0052]其中,将目标字符之前和/或目标字符之后的一个或多个字符确定为字符属性为字母的字符可以理解为,将目标字符之前的,或者目标字符之后的,或者目标字符前后的确定为字符属性为字母的字符,而实际需要采用上述三种情况中的哪一种可以根据目标字符所匹配的关键词,以及与该关键词对应的判定策略来确定。示例地,由于品牌,公司,地名等名词形式的词语之前的字符为字母的可能性大于为数字的可能性,因此其对应的判定策略可以为:将目标字符之前的字符确定为字符属性为字母的字符。[〇〇53]因此,由于在上面得到的分词结果中,在目标字符“公司”之前的字符集合为 “IBM”,从而结合之前确定出的“公司”为代表字母的关键词,以及上述的判定策略,可以将目标字符“公司”之前的字符集合“IBM”确定为字符属性为字母的字符。
[0054]接下来,将字符属性为字母的字符标记为字母,将字符属性为数字的字符标记为数字。
[0055]示例地,字符集合“1966”为字符属性为数字的字符,字符集合“IBM”为字符属性为字母的字符,因此,将字符集合“1966”中的字符标记为数字,将字符集合“IBM”中的字符标记为字母。
[0056]针对字幕识别结果中被标记为数字和字母的字符集合,可以利用语音识别结果来对其进行验证,并在验证有误时利用语音识别结果对其进行校正。
[0057]示例地,如上所述,字幕识别结果为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和Nagy,1966年他们发表了第一篇关于汉字识别的文章”,按照以上方式,能够确定出“1966”为数字,“IBM”为字母。随后,通过结合语音识别结果对其进行验证,发现OCR进行字幕识别的结果中将“1966”错误地识别为“1966”,以及将“IBM”错误地识别为“IBM”。这时,通过语音识别结果对其进行校正,利用语音识别结果中的“1966”和“IBM”这两个内容分别替换字幕识别结果中的相应内容,即“1966”和“IBM”。这样,就能够得到与时段信息相对应的多媒体内容的文本信息为“最早对印刷体汉字识别进行研究的是IBM公司的Casey和 Nagy,1966年他们发表了第一篇关于汉字识别的文章”。[〇〇58]通过结合OCR和ASR技术得到多媒体内容的文本信息,可以提高识别准确率,两种技术所得结果之间可以进行交叉校验,从而确保获取到正确的文本信息,为后续的检索提供准确的数据支持。[〇〇59]图4示出了根据本发明的实施方式的播放多媒体文件的方法的流程图。其中,该方法可以应用于各种类型的电子设备,例如,服务器、终端(包括个人计算机、智能手机、平板电脑等)等等。如图4所示,该方法可以包括以下步骤:
[0060]在步骤401中,获取用户输入的检索信息。
[0061]用户可以通过各种类型的信息输入设备来输入该检索信息,其中,所述信息输入设备可以例如包括键盘、触摸屏等等。另外,该检索信息可以包括至少一个关键词,或者也可以为一句话、一段话。[〇〇62]在步骤402中,根据检索信息查询多媒体信息数据库,获取候选多媒体信息记录, 其中,该候选多媒体信息记录包括多媒体信息数据库中与检索信息相匹配的多媒体信息记录。并且,如上所述,多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录可以包括以下:多媒体文件标识信息,时段信息,以及在多媒体文件标识信息所表示的多媒体文件中、与该时段信息相对应的多媒体内容的标识信息,其中,该多媒体内容的标识信息用于与检索信息进行匹配。
[0063]示例地,当检索信息包括一个或多个关键词时,可以直接利用所包括的关键词查询多媒体信息数据库。当检索信息包括一句话或者一段话时,在查询多媒体信息数据库之前,可以首先对检索信息进行分词处理,之后,利用所得到的分词查询多媒体信息数据库。
[0064]在获取与检索信息相匹配的多媒体信息记录时,可以首先将检索信息与多媒体信息数据库中的多媒体内容的标识信息进行匹配,例如,如图3所示,将检索信息与多媒体信息数据库中的“多媒体内容的标识信息”这一列字段中的内容进行匹配。示例地,判断检索信息与某个多媒体内容的标识信息是否匹配可以基于以下准则:该多媒体内容的标识信息是否包含检索信息中的内容。当满足上述准则时,确定检索信息与该多媒体内容的标识信息相匹配,否则,确定检索信息与该多媒体内容的标识信息不匹配。
[0065]接下来,将与检索信息相匹配的多媒体内容的标识信息所在的多媒体信息记录获取为是与检索信息相匹配的多媒体信息记录,即,上述候选多媒体信息记录。例如,假设用户输入的检索信息为“天津爆炸”,则通过查询如图3所示的多媒体信息数据库,可以确定与该检索信息相匹配的多媒体信息记录为第1条多媒体信息记录,获取该条多媒体信息记录作为候选多媒体信息记录。[0〇66]在步骤403中,输出候选多媒体信息记录。
[0067]在输出候选多媒体信息记录时,可以例如通过显示的方式将获取到的候选多媒体信息记录显示出来,呈现方式可以例如采用列表的方式。另外,如上所述,多媒体内容的标识信息为该多媒体内容的文本信息。这样,在显示候选多媒体信息记录时,还可以将该候选多媒体信息记录中包括的多媒体内容的标识信息中、与检索信息相一致的部分突出显示, 其中,突出显示的方式包括但不限于以下中的至少一者:放大、标红、加粗、加下划线、变斜体等。例如,假设检索信息为“天津爆炸”,那么在显示图3中的第1条多媒体信息记录时,可以将该多媒体信息记录中包括的多媒体内容的标识信息中的“天津”和“爆炸”字样突出显示,以便于用户更方便且清晰地查看和判断检索到的多媒体信息记录是否符合预期,从而便于用户快速了解多媒体文件的概要内容。
[0068]在步骤404中,接收用户针对候选多媒体信息记录的选择指令,其中,该选择指令用于指示用户从候选多媒体信息记录中选出的目标多媒体信息记录。
[0069]输出候选多媒体信息记录的目的在于向用户反馈检索结果。当满足用户检测条件的结果反馈给用户时,用户可以根据自身需求来从中选择哪个或哪些多媒体信息记录为目标多媒体信息记录,即,用户期望的多媒体信息记录。
[0070]在用户选择目标多媒体信息记录时,在一种实施方式中,用户可以任意选取其中的一个或一些多媒体信息记录作为目标多媒体信息记录。或者,在另一种实施方式中,在输出的候选多媒体信息记录中,多媒体内容的标识信息用于用户选择目标多媒体信息记录。 也就是说,用户可以通过阅读候选多媒体信息记录中的多媒体内容的标识信息,来快速了解相应多媒体内容的概要,并选取其中感兴趣的多媒体信息记录作为目标多媒体信息记录。
[0071]当用户做出选择时,通过步骤404,执行该方法的电子设备可以接收到选择指令, 并且在该选择指令中指示了用户期望的多媒体信息记录,即,目标多媒体信息记录。
[0072]在步骤405中,根据目标多媒体信息记录中的时段信息,播放目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。
[0073]当接收到选择指令之后,可以确定出目标多媒体信息记录是哪条。在执行该方法的电子设备中可以配置有播放模块,在这种情况下,播放模块可以首先根据该目标多媒体信息记录中的多媒体文件标识信息确定要播放哪个多媒体文件,之后,再根据该目标多媒体信息记录中的时段信息确定要播放该多媒体文件中的哪部分多媒体内容。在一个实施方式中,播放模块可以只播放该多媒体文件中与该时段信息相对应的多媒体内容。或者,在另一个实施方式中,播放模块可以将该时段信息作为播放起始点,从该多媒体文件中与该时段信息对应的多媒体内容开始向后播放。
[0074]通过根据时段信息来播放多媒体文件,可以实现定位播放。
[0075]综上所述,在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材。例如,针对一个30分钟的视频文件,用户不用全部浏览,使用该方法后只需要5分钟就能了解视频是否是想要的素材。因此,有效节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。[〇〇76]图5A至图5C示出了根据本发明的实施方式的播放多媒体文件的装置500的框图。 其中,该装置500可以配置于各种类型的电子设备,例如,服务器、终端(包括个人计算机、智能手机、平板电脑等)等等。如图5A所示,该装置500可以包括:
[0077]检索信息获取模块510,被配置为获取用户输入的检索信息;
[0078]查询模块520,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息用于与所述检索信息进行匹配;
[0079]输出模块530,被配置为输出所述候选多媒体信息记录;
[0080]选择指令接收模块540,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记录;[0081 ]播放模块550,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。
[0082]综上所述,在上述技术方案中,由于反馈给用户的与其检索信息相匹配的多媒体信息记录中包含有时段信息,因此,当用户选定某个多媒体信息记录作为目标多媒体信息记录时,可以直接根据该目标多媒体信息记录中的时段信息,来播放该目标多媒体信息记录中的多媒体文件标识信息所表示的多媒体文件。这样,用户无需全部浏览完整的多媒体文件,只需要花费较短时间就能了解该多媒体文件是否是想要的素材。例如,针对一个30分钟的视频文件,用户不用全部浏览,使用该方法后只需要5分钟就能了解视频是否是想要的素材。因此,有效节省了用户在搜索多媒体文件的过程中的决策时间,提升了多媒体文件检索的工作效率。[〇〇83] 可选地,如图5B所示,所述查询模块520可以包括:
[0084]匹配子模块521,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;
[0085]第一获取子模块522,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取为是所述候选多媒体信息记录。
[0086]可选地,在所述输出模块530输出的所述候选多媒体信息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。
[0087]可选地,如上所述,多媒体内容的标识信息为该多媒体内容的文本信息。这样,如图5C所示,所述输出模块530可以包括:[〇〇88]显示子模块531,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。 [〇〇89]可选地,所述多媒体信息数据库通过多媒体信息数据库建立模块来建立,其中,该多媒体信息数据库建立模块可以配置于上述播放多媒体文件的装置500中,或者可以与上述播放多媒体文件的装置500相独立。图6A至图6B示出了根据本发明的实施方式的多媒体信息数据库建立模块600的框图。如图6A所示,所述多媒体信息数据库建立模块600可以包括:
[0090]第二获取子模块610,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;
[0091]时间戳添加子模块620,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定所述多媒体文件的时段信息;
[0092]识别子模块630,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;[〇〇93]存储子模块640,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、 所述时段信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在所述多媒体信息数据库中。[〇〇94] 可选地,如图6B所示,所述识别子模块630可以包括:
[0095]第一识别单元631,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别,得到字幕识别结果;
[0096]第二识别单元632,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别,得到语音识别结果;以及
[0097]文本信息确定单元633,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内容的文本信息。
[0098]关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
[0099]以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
[0100]另外需要说明的是,在上述【具体实施方式】中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
[0101]此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。
【主权项】
1.一种播放多媒体文件的方法,其特征在于,所述方法包括:获取用户输入的检索信息;根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息记录,所述候选多媒 体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多媒体信息记录,其 中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒体信息记录包括 以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所表示的多媒体文 件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体内容的标识信息 用于与所述检索信息进行匹配;输出所述候选多媒体信息记录;接收用户针对所述候选多媒体信息记录的选择指令,其中,所述选择指令用于指示用 户从所述候选多媒体信息记录中选出的目标多媒体信息记录;根据所述目标多媒体信息记录中的所述时段信息,播放所述目标多媒体信息记录中的 所述多媒体文件标识信息所表示的多媒体文件。2.根据权利要求1所述的方法,其特征在于,所述根据所述检索信息查询多媒体信息数 据库,获取候选多媒体信息记录,包括:将所述检索信息与所述多媒体信息数据库中的所述多媒体内容的标识信息进行匹配;将与所述检索信息相匹配的所述多媒体内容的标识信息所在的多媒体信息记录获取 为是所述候选多媒体信息记录。3.根据权利要求1所述的方法,其特征在于,在输出的所述候选多媒体信息记录中,所 述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。4.根据权利要求1所述的方法,其特征在于,所述多媒体内容的标识信息为所述多媒体 内容的文本信息;以及所述输出所述候选多媒体信息记录,包括:显示所述候选多媒体信息记录,并将所述候选多媒体信息记录中包括的所述多媒体内 容的标识信息中、与所述检索信息相一致的部分突出显示。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述多媒体信息数据库通过以 下方式来建立:从多媒体资源库获取多媒体文件和与所述多媒体文件相对应的多媒体文件标识信息;按照预设的时间间隔为所述多媒体文件添加时间戳,其中,相邻两个时间戳用于限定 所述多媒体文件的时段信息;针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进 行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其中,所述文本信息作为所 述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息;针对每个所述时段信息,将所述多媒体文件标识信息、所述时段信息、以及所述多媒体 文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多媒体信息记录存储在 所述多媒体信息数据库中。6.根据权利要求5所述的方法,其特征在于,所述对所述多媒体文件中与所述时段信息 相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,包 括:对所述多媒体文件中与所述时段信息相对应的多媒体内容的字幕部分进行文字识别, 得到字幕识别结果;对所述多媒体文件中与所述时段信息相对应的多媒体内容的语音部分进行语音识别, 得到语音识别结果;以及根据所述字幕识别结果和所述语音识别结果,得到与所述时段信息相对应的多媒体内 容的文本信息。7.—种播放多媒体文件的装置,其特征在于,所述装置包括:检索信息获取模块,被配置为获取用户输入的检索信息;查询模块,被配置为根据所述检索信息查询多媒体信息数据库,获取候选多媒体信息 记录,所述候选多媒体信息记录包括所述多媒体信息数据库中与所述检索信息相匹配的多 媒体信息记录,其中,所述多媒体信息数据库中预置有至少一条多媒体信息记录,每条多媒 体信息记录包括以下:多媒体文件标识信息,时段信息,以及在所述多媒体文件标识信息所 表示的多媒体文件中、与所述时段信息相对应的多媒体内容的标识信息,其中,所述多媒体 内容的标识信息用于与所述检索信息进行匹配;输出模块,被配置为输出所述候选多媒体信息记录;选择指令接收模块,被配置为接收用户针对所述候选多媒体信息记录的选择指令,其 中,所述选择指令用于指示用户从所述候选多媒体信息记录中选出的目标多媒体信息记 录;播放模块,被配置为根据所述目标多媒体信息记录中的所述时段信息,播放所述目标 多媒体信息记录中的所述多媒体文件标识信息所表示的多媒体文件。8.根据权利要求7所述的装置,其特征在于,所述查询模块包括:匹配子模块,被配置为将所述检索信息与所述多媒体信息数据库中的所述多媒体内容 的标识信息进行匹配;第一获取子模块,被配置为将与所述检索信息相匹配的所述多媒体内容的标识信息所 在的多媒体信息记录获取为是所述候选多媒体信息记录。9.根据权利要求7所述的装置,其特征在于,在所述输出模块输出的所述候选多媒体信 息记录中,所述多媒体内容的标识信息用于用户选择所述目标多媒体信息记录。10.根据权利要求7所述的装置,其特征在于,所述多媒体内容的标识信息为所述多媒 体内容的文本信息;以及所述输出模块包括:显示子模块,被配置为显示所述候选多媒体信息记录,并将所述候选多媒体信息记录 中包括的所述多媒体内容的标识信息中、与所述检索信息相一致的部分突出显示。11.根据权利要求7-10中任一项所述的装置,其特征在于,所述多媒体信息数据库通过 多媒体信息数据库建立模块来建立,并且所述多媒体信息数据库建立模块包括:第二获取子模块,被配置为从多媒体资源库获取多媒体文件和与所述多媒体文件相对 应的多媒体文件标识信息;时间戳添加子模块,被配置为按照预设的时间间隔为所述多媒体文件添加时间戳,其 中,相邻两个时间戳用于限定所述多媒体文件的时段信息;识别子模块,被配置为针对每个所述时段信息,对所述多媒体文件中与所述时段信息相对应的多媒体内容进行识别,得到与所述时段信息相对应的多媒体内容的文本信息,其 中,所述文本信息作为所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信 息;存储子模块,被配置为针对每个所述时段信息,将所述多媒体文件标识信息、所述时段 信息、以及所述多媒体文件中与所述时段信息相对应的多媒体内容的标识信息作为一条多 媒体信息记录存储在所述多媒体信息数据库中。12.根据权利要求11所述的装置,其特征在于,所述识别子模块包括:第一识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的 字幕部分进行文字识别,得到字幕识别结果;第二识别单元,被配置为对所述多媒体文件中与所述时段信息相对应的多媒体内容的 语音部分进行语音识别,得到语音识别结果;以及文本信息确定单元,被配置为根据所述字幕识别结果和所述语音识别结果,得到与所 述时段信息相对应的多媒体内容的文本信息。
【文档编号】G06F17/30GK106021368SQ201610307489
【公开日】2016年10月12日
【申请日】2016年5月10日
【发明人】王磊, 麦涛, 张旭, 白杨, 孔畅
【申请人】东软集团股份有限公司