一种在多媒体文件中查询多媒体数据的方法及电子设备的制作方法
【专利摘要】一种在多媒体文件中查询多媒体数据的方法及电子设备;所述多媒体文件具有一个或多个多媒体数据,所述方法包括:获取第一类型数据信息;根据第一预设规则将第一类型数据信息转换为第二类型数据信息;根据第一预设规则将第二类型数据信息与所述多媒体数据进行匹配;如果匹配成功,输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。本申请能够克服现有媒体播放器存在的搜索方式单一且操作不便的缺陷。
【专利说明】一种在多媒体文件中查询多媒体数据的方法及电子设备
【技术领域】
[0001]本发明涉及多媒体领域,尤其涉及一种在多媒体文件中查询多媒体数据的方法及电子设备。
【背景技术】
[0002]现今的多媒体播放器大多具备播放的快进、快退功能,以便于用户寻找感兴趣的内容。但目前,用户在视频文件中搜索感兴趣的对象时,例如,用户需要在视频中查找某句精彩台词,或者想要定位到某句歌词时,无法根据文本信息来定位到视频中的内容置,而只能通过拖动播放光标轴或者单一的快进键/后退键实现,这样,往往需要反复的快进和后退操作才能找到查询目标,尤其当视频文件比较大时,若要从中寻找某一段内容就非常不方便,并且浪费时间,因而给用户的带来了不好的操作体验。
[0003]本发明的发明人在实现本发明的过程中,发现现有技术至少存在如下技术缺陷:
[0004]现有技术中,也存在一些依据事先储存的控制设定,如设置多个标签或标记等,来提升播放器的操作便利性的实现方案,但这些方案均无法针对视频文件的数据内容进行识另IJ,因而无法真正满足用户需求。例如,用户想要通过查找《大话西游》中only you部分视频位置,但目前的多媒体播放器上不具有此功能。
【发明内容】
[0005]本发明所要解决的技术问题是克服现有媒体播放器存在的搜索方式单一且操作不便的缺陷。
[0006]为了解决上述技术问题,本发明提供了一种在多媒体文件中查询多媒体数据的方法,所述多媒体文件具有一个或多个多媒体数据,所述方法包括:
[0007]获取第一类型数据信息;
[0008]根据第一预设规则,将第一类型数据信息转换为第二类型数据信息;
[0009]根据第二预设规则,将第二类型数据信息与所述多媒体数据进行匹配;
[0010]如果匹配成功,输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
[0011]可选地,所述第一类型数据信息为文本信息;
[0012]所述第二类型数据信息为音频或视频信息。
[0013]可选地,所述第一类型数据信息为图像信息;
[0014]所述第二类型数据信息为图像中各像素点的信息。
[0015]可选地,所述输出匹配结果,包括:
[0016]将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
[0017]可选地,将第二类型数据信息与所述多媒体数据匹配,具体包括:
[0018]获取所述多媒体数据中与第二类型数据信息类型相同的信息;
[0019]将所获取的信息与所述第二类型数据信息进行比对;
[0020]如果所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功;
[0021]将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
[0022]可选地,所述第二类型数据信息为音频信息;
[0023]根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤包括:
[0024]获取所述多媒体数据中的音频信息;
[0025]根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对;
[0026]如果波形的相似程度超过第一预定阈值,则匹配成功。
[0027]可选地,所述第二类型数据信息为图像信息;
[0028]根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤包括:
[0029]获取所述多媒体数据中的图像帧;
[0030]根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对;
[0031]如果相似程度超过第一预定阈值,则匹配成功。
[0032]本发明还提供了一种电子设备,包括:
[0033]获取单元,用于获取第一类型数据信息;
[0034]转换单元,用于根据第一预设规则将第一类型数据信息转换为第二类型数据信息;
[0035]匹配单元,用于根据第二预设规则将第二类型数据信息与多媒体文件中的多媒体数据进行匹配;所述多媒体文件具有一个或多个多媒体数据;
[0036]输出单元,用于当匹配成功时输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
[0037]可选地,所述第一类型数据信息为文本信息;
[0038]所述第二类型数据信息为音频或视频信息。
[0039]可选地,所述第一类型数据信息为图像信息;
[0040]所述第二类型数据信息为像素点的信息。
[0041]可选地,所述输出单元输出匹配结果是指:
[0042]所述输出单元将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
[0043]可选地,所述匹配单元将第二类型数据信息与所述多媒体数据匹配是指:
[0044]所述匹配单元获取所述多媒体数据中与第二类型数据信息类型相同的信息;将所获取的信息与所述第二类型数据信息进行比对;如果存在所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功;将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
[0045]可选地,所述第二类型数据信息为音频信息;
[0046]所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:
[0047]所述匹配单元获取所述多媒体数据中的音频信息;根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对;如果波形的相似程度超过第一预定阈值,则匹配成功。
[0048]可选地,所述第二类型数据信息为图像信息;
[0049]所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:
[0050]所述匹配单元获取所述多媒体数据中的图像帧;根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对;如果相似程度超过第一预定阈值,则匹配成功。
[0051]与现有技术相比,本申请的至少一个实施例能够快速有效地定位到目标内容;本申请的又一个实施例可以针对不同的搜索数据相应进行匹配。
[0052]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【专利附图】
【附图说明】
[0053]附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
[0054]图1是本发明实施例的定位视频数据的方法的流程示意图;
[0055]图2是本发明另一实施例的定位视频数据的方法的流程示意图;
[0056]图3是本发明又一实施例的定位视频数据的方法的流程示意图;
[0057]图4是本发明实施例的定位视频数据的装置的示意框图;
【具体实施方式】
[0058]为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0059]在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0060]实施例一、一种在多媒体文件中查询多媒体数据的方法,所述多媒体文件具有一个或多个多媒体数据,如图1所示,所述方法包括:
[0061]获取第一类型数据信息;
[0062]根据第一预设规则,将第一类型数据信息转换为第二类型数据信息;
[0063]根据第二预设规则,将第二类型数据信息与所述多媒体数据进行匹配;
[0064]如果匹配成功,输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
[0065]本实施例中,所述多媒体数据可以但不限于为视频码流、音频码流等;用户可以选择一个或多个多媒体数据共同作为多媒体文件,在所选择的一个或多个多媒体数据中进行查询。
[0066]所述第一、第二类型数据信息包括文本、音频、图像、视频等。其中,所述第一类型数据信息可以由用户输入,或由用户在已有信息中进行选取,或以预定的规则选取,比如将特定聊天工具中联系人发过来的图片作为第一类型数据信息;所述第二类型数据信息可以为默认或预设的类型,也可以由用户临时指定。
[0067]本实施例能够不局限于单一的查询形式,而是可以根据各种数据类型进行查询,且可以指定查询的数据类型,非常灵活方便。
[0068]本实施例的一种实施方式中,所述输出匹配结果的步骤具体可以包括:
[0069]将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
[0070]列表中每条记录可以显示第一类型数据信息及匹配成功的多媒体数据的位置(可以但不限于以时间点表示);所述多媒体数据出现的时间的表现形式可以为一超链接,用户通过点击此记录,能直接跳到该对应的多媒体数据的位置。
[0071]本实施例的一种实施方式中,所述将第二类型数据信息与所述多媒体数据匹配的步骤具体可以包括:
[0072]获取所述多媒体数据中与第二类型数据信息类型相同的信息;
[0073]将所获取的信息与所述第二类型数据信息进行比对;
[0074]如果所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功;
[0075]将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
[0076]在一个备选方案中,所述第一类型数据信息可以为文本信息;所述第二类型数据信息可以为音频或视频信息;匹配时是与多媒体数据中的音频或视频数据进行比对。
[0077]在另一个备选方案中,所述第一类型数据信息可以为图像信息;所述第二类型数据信息可以为图像中各像素点的信息;匹配时是与多媒体数据中的图像帧的信息进行比对。
[0078]在一个例子中,所述第二类型数据信息为音频信息;
[0079]根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤具体可以包括:
[0080]获取所述多媒体数据中的音频信息;
[0081]根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对;
[0082]如果波形的相似程度超过第一预定阈值,则匹配成功。
[0083]比如假设第二类型数据信息是一段长度为7秒的音频信息,则匹配时可以用多媒体数据中每连续7秒的音频信息分别与第二类型数据信息进行比对,即第I秒?第7秒的音频信息、第2秒?第8秒的音频信息、第3秒?第9秒的音频信息......以此类推;假设某段音频信息与第二类型数据信息的比对结果是有90%相同,而第一预定阈值为85%,则判断该段音频信息匹配成功。
[0084]该例子的具体流程如图2所示,包括步骤201?204。
[0085]201、输入要查找的文本信息;
[0086]202、将所述文本信息转换为音频信息;
[0087]203、将所述转换得到的音频信息与视频码流中的音频信息进行匹配;
[0088]204、匹配成功后,输出匹配成功的音频信息在多媒体文件中出现的时间。
[0089]该例子中,用户通过输入要查找的音频的文本信息,就可以在多媒体文件中查找到目标音频。
[0090]另一个例子中,第二类型数据信息为视频信息,可以但不限于包括:显示在视频中的字幕、以视频显示的文字资料等。匹配的具体过程与前一个例子类似,这里不再赘述。
[0091]该例子的具体流程如图3所示,包括步骤301?304。
[0092]301、输入要查找的文本信息;
[0093]302、将文本信息转换为显示的字幕;
[0094]303、将转换成的字幕与多媒体文数据中的字幕进行匹配;
[0095]304、匹配成功后,输出具有相应字幕的视频在多媒体文件中的位置。
[0096]该例子中,用户输入要查找的文本信息,通过该文本信息可以定位多媒体文件中的目标内容。
[0097]又一个例子中,所述第二类型数据信息为图像信息;
[0098]根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤具体可以包括:
[0099]获取所述多媒体数据中的图像帧;
[0100]根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对;
[0101]如果相似程度超过第一预定阈值,则匹配成功。
[0102]比如假设第二类型数据信息是1024个像素点的信息,匹配时用多媒体数据中每个图像帧的像素点的信息与第二类型数据信息进行比对;假设某个图像帧的像素点的信息与第二类型数据信息有90%相同,而第一预定阈值为85%,则判断该图像帧匹配成功。
[0103]该例子的具体流程如图4所示,包括步骤401?404。
[0104]401、输入要查找的图像信息;
[0105]402、将所述图像信息转换为各像素点的信息;
[0106]403、将所述要查找的图像与所述多媒体数据中图像帧的像素点的信息进行匹配;
[0107]404、匹配成功后,输出图像帧在多媒体文件中的相应位置。
[0108]该例子中,用户输入要查找的图像(例如根据截屏保存的图像),通过将该图像与多媒体数据中的图像帧相比较,查找到该图像在多媒体文件中出现的位置。
[0109]实施例二、一种电子设备,包括:
[0110]获取单元,用于获取第一类型数据信息;
[0111]转换单元,用于根据第一预设规则将第一类型数据信息转换为第二类型数据信息;
[0112]匹配单元,用于根据第二预设规则将第二类型数据信息与多媒体文件中的多媒体数据进行匹配;所述多媒体文件具有一个或多个多媒体数据;
[0113]输出单元,用于当匹配成功时输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
[0114]本实施例中,所述多媒体数据可以但不限于为视频码流、音频码流等;用户可以选择一个或多个多媒体数据共同作为多媒体文件,在所选择的一个或多个多媒体数据中进行查询。
[0115]本实施例中,所述电子设备可以但不限于包括:手机、平板、个人电脑、专用的多媒体数据查询设备等。
[0116]所述第一、第二类型数据信息包括文本、音频、图像、视频等。其中,所述第一类型数据信息可以由用户输入该电子设备,或由用户在该电子设备已有的信息中进行选取,或由该电子设备以预定的规则选取,比如将特定聊天工具中联系人发过来的图片作为第一类型数据信息;所述第二类型数据信息可以为默认或预设在电子设备中的类型,也可以由用户临时指定。
[0117]本实施例能够不局限于单一的查询形式,而是可以根据各种数据类型进行查询,且可以指定查询的数据类型,非常灵活方便。
[0118]本实施例的一种实施方式中,所述输出单元输出匹配结果具体可以是指:
[0119]所述输出单元将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
[0120]本实施例的一种实施方式中,所述匹配单元将第二类型数据信息与所述多媒体数据匹配具体可以是指:
[0121]所述匹配单元获取所述多媒体数据中与第二类型数据信息类型相同的信息;将所获取的信息与所述第二类型数据信息进行比对;如果存在所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功;将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
[0122]在一个备选方案中,所述第一类型数据信息可以为文本信息;所述第二类型数据信息可以为音频或视频信息;所述匹配单元匹配时是与多媒体数据中的音频或视频数据进行比对。
[0123]一个例子中,所述第二类型数据信息为音频信息;
[0124]所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:
[0125]所述匹配单元获取所述多媒体数据中的音频信息;根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对;如果波形的相似程度超过第一预定阈值,则匹配成功。
[0126]所述第二预设规则可以但不限于是音频之间的对比算法。比如假设第二类型数据信息是一段长度为7秒的音频,则所述匹配单元匹配时可以用多媒体数据中每连续7秒的音频数据分别与第二类型数据信息进行比对,即第I秒?第7秒的音频数据、第2秒?第8
秒的音频数据、第3秒?第9秒的音频数据......以此类推;假设某段音频数据与第二类型数据信息的比对结果是有90%相同,而第一预定阈值为85%,则所述匹配单元判断该段音频数据匹配成功。
[0127]在另一个备选方案中,所述第一类型数据信息可以为图像信息;所述第二类型数据信息可以为图像中各像素点的信息;所述匹配单元匹配时是与多媒体数据中的图像帧的信息进行比对。
[0128]一个例子中,所述第二类型数据信息为图像信息;
[0129]所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:
[0130]所述匹配单元获取所述多媒体数据中的图像帧;根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对;如果相似程度超过第一预定阈值,则匹配成功。
[0131]所述第二预设规则可以但不限于是图像帧的对比算法。
[0132]比如假设第二类型数据信息是1024个像素点的信息,所述匹配单元匹配时用多媒体数据中每个图像帧的像素点的信息与第二类型数据信息进行比对;假设某个图像帧的像素点的信息与第二类型数据信息有90%相同,而第一预定阈值为85%,则所述匹配单元判断该图像帧匹配成功。
[0133]本领域的技术人员应该明白,上述的本申请实施例所提供的装置和/或系统的各组成部分,以及方法中的各步骤,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上。可选地,它们可以用计算装置可执行的程序代码来实现。从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0134]虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
【权利要求】
1.一种在多媒体文件中查询多媒体数据的方法,所述多媒体文件具有一个或多个多媒体数据,其特征在于,所述方法包括: 获取第一类型数据信息; 根据第一预设规则,将第一类型数据信息转换为第二类型数据信息; 根据第二预设规则,将第二类型数据信息与所述多媒体数据进行匹配; 如果匹配成功,输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
2.如权利要求1所述的方法,其特征在于: 所述第一类型数据信息为文本信息; 所述第二类型数据信息为音频或视频信息。
3.如权利要求1所述的方法,其特征在于: 所述第一类型数据信息为图像信息; 所述第二类型数据信息为图像中各像素点的信息。
4.如权利要求1所述的方法,其特征在于,所述输出匹配结果,包括: 将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
5.如权利要求1?4中任一项所述的方法,其特征在于,将第二类型数据信息与所述多媒体数据匹配,具体包括: 获取所述多媒体数据中与第二类型数据信息类型相同的信息; 将所获取的信息与所述第二类型数据信息进行比对; 如果所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功; 将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
6.如权利要求1所述的方法,其特征在于: 所述第二类型数据信息为音频信息; 根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤包括: 获取所述多媒体数据中的音频信息; 根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对; 如果波形的相似程度超过第一预定阈值,则匹配成功。
7.如权利要求1所述的方法,其特征在于: 所述第二类型数据信息为图像信息; 根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配的步骤包括: 获取所述多媒体数据中的图像帧; 根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对; 如果相似程度超过第一预定阈值,则匹配成功。
8.—种电子设备,其特征在于,包括: 获取单元,用于获取第一类型数据信息; 转换单元,用于根据第一预设规则将第一类型数据信息转换为第二类型数据信息; 匹配单元,用于根据第二预设规则将第二类型数据信息与多媒体文件中的多媒体数据进行匹配;所述多媒体文件具有一个或多个多媒体数据; 输出单元,用于当匹配成功时输出匹配结果,所述匹配结果用来表征所述第一类型数据信息在所述多媒体文件中出现的时间。
9.如权利要求8所述的电子设备,其特征在于: 所述第一类型数据信息为文本信息; 所述第二类型数据信息为音频或视频信息。
10.如权利要求8所述的电子设备,其特征在于: 所述第一类型数据信息为图像信息; 所述第二类型数据信息为像素点的信息。
11.如权利要求8所述的电子设备,其特征在于,所述输出单元输出匹配结果是指: 所述输出单元将所述第二类型数据信息匹配成功的所有多媒体数据在所述多媒体文件中出现的时间,以列表形式输出。
12.如权利要求8?11中任一项所述的电子设备,其特征在于,所述匹配单元将第二类型数据信息与所述多媒体数据匹配是指: 所述匹配单元获取所述多媒体数据中与第二类型数据信息类型相同的信息;将所获取的信息与所述第二类型数据信息进行比对;如果存在所获取的信息中至少一个与所述第二类型数据信息的相似程度超过第一预定阈值,则匹配成功;将相似程度超过所述第一预定阈值的信息在所述多媒体文件中的时间作为比对结果。
13.如权利要求8所述的电子设备,其特征在于: 所述第二类型数据信息为音频信息; 所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:所述匹配单元获取所述多媒体数据中的音频信息;根据第二预设规则,将所获取的音频信息与转换得到的音频信息的波形进行比对;如果波形的相似程度超过第一预定阈值,则匹配成功。
14.如权利要求8所述的设备,其特征在于: 所述第二类型数据信息为图像信息; 所述匹配单元根据第二预设规则,将第二类型数据信息与所述多媒体数据匹配是指:所述匹配单元获取所述多媒体数据中的图像帧;根据第二预设规则,将所获取的图像帧与转换得到的像素点信息进行比对;如果相似程度超过第一预定阈值,则匹配成功。
【文档编号】G06F17/30GK104424228SQ201310376088
【公开日】2015年3月18日 申请日期:2013年8月26日 优先权日:2013年8月26日
【发明者】康志洪, 朱义国 申请人:联想(北京)有限公司