使用动态向量的视频搜寻方法及其装置的制作方法

文档序号:6605479阅读:301来源:国知局
专利名称:使用动态向量的视频搜寻方法及其装置的制作方法
技术领域
本发明涉及一种视频搜寻方法及其装置,且特别涉及一种以视频内容作为搜寻输 入条件来进行视频搜寻的搜寻方法及其装置。
背景技术
目前网络上的搜寻目前网络上的搜寻技术,全都以文字(Text)为主的技术,例如 Google.Yahoo.Youtube或是国内的无名小站等等搜寻引擎,都是以文字搜寻为主。虽然各 搜寻引擎都希望能突破文字的限制,例如在相同关键字下,可搜寻繁体中文或是简体中文、 甚至其他语言的内容,但毕竟还是受到文字关键字的限制。例如,如果希望能搜寻相关的多 媒体数据,包括声音文件或是图像文件,常常因为没有足够的文字内容可作为搜寻的依据, 或是各国家采用不同的翻译名称,造成徒有关键字却无法找出正确或者更多相关的数据。搜寻引擎Google在2009年4月份推出以照片找照片的服务,是全世界第一个以 照片内容(Content)找具有相关内容(Content)数据的服务。例如,请参照图1A,当在输 入框120输入“apple”关键字110时,会出现跟“apple”有关的相关数据,但此时包括以 苹果造型所有的图像,以及商标“Apple ”的相关产品手机“iPhone”。此时,如果再进一步 点选时,就可以排除许多不适用数据。例如图1B,使用者选取与苹果造型相关的图像后,搜 寻引擎进一步显示与此类水果(苹果)相关的图像。而又例如图1C,使用者选取与商标 “Apple ”相关产品手机“iPhone”图像后,则显示与此产品相关的其他图像,更精确地找出 使用者所要搜寻的照片。但此技术很显然是用图像(Image)内容来搜寻图像(Image),但仅 限于相关照片图档的搜寻,对于多媒体文件,并没有任何方法可以搜寻。为突破此限制,在活动图像专业人员组织(Motion Picture Expert Group,以下 简称MPEG)制定的技术协议MPEP-7中,提出一种具有对内容提供补充信息的标准,特别 是针对多媒体数字内容。在此MPEP-7标准中,对于多媒体可以提供相关对应的内容描述 (Multimedia Content Description),而且可以独立于其他的MPEP标准,而此数字内容描 述甚至可以附加在模拟的电影文件中。如图2所示,对于每一个视听内容(Audio-visual Content,如图式的“AV Content”),都可赋予对应的内容描述(Content Description),此 内容描述主要是提出此视听内容的相关特征值。而其文件编排的方式,则是例如图示的AV+Descript+AV+Descript+AV+Descript+...此“AV”即代表视听内容(Audio-visual Content),而“Descript”则是代表对应 WftWifflii (Content Description)。但这样的架构过于复杂,必须对于所有的多媒体文件进行重新编排,不适合既有 的文件与架构。另外,虽然可以经由特征值,通过类似关键字的搜寻,而找出相关的多媒体 文件,但是,却无法跳脱以文字搜寻造成不同语言之间的隔阂。此外,随着网络与TV的结合日渐普及,在电视上要进行视频搜寻将不可避免会碰 到关键字输入的问题。一般人看电视手头上所握的都是一个遥控器,以遥控的大小与功能 是无法取代键盘作为文字输入的装置,因此在网络TV上利用遥控器来控制视频搜寻是未来此类应用的一个问题点所在。

发明内容
在一实施范例中,提出一种视频搜寻方法,包括对一输入检索视频文件与多个欲 进行检索的视频文件的比特流进行剖析,而取出对应的多个移动向量。根据所述移动向量 在时间轴上建立多个对应的移动向量地图。根据所述检索视频文件的移动向量地图与所述 视频文件的移动向量地图,得到相关(Correlation)程度,藉以根据此相关程度得到视频 搜寻的结果。在一实施范例中,提出一种视频搜寻装置,包括一串流剖析器、一 3D移动向量地 图产生器与一 3D移动向量地图比较器。此串流剖析器用以对一个视频文件的比特流进 行剖析(Parsing),并且根据不同比例取出位元流中的移动向量(MV)数据。此3D移动向 量地图产生器,用以根据所述移动向量建构具有时间轴数据的一 3D移动向量地图(3D-MV Map)。而3D移动向量地图比较器用以根据所述3-D移动向量地图进行运算,根据运算结果 而找出视频文件的相关(Correlation)程度,藉以根据相关程度得到视频搜寻的结果。在一实施范例中,提出一种视频播放装置,具有一主机与一控制器。此主机具有一 种视频搜寻装置,此视频装置包括一串流剖析器、一 3D移动向量地图产生器与一 3D移动向 量地图比较器。此控制器具有一功能控制装置,其中功能控制装置用以使用者选择主机播 放的视频数据中的其中一段,作为视频搜寻装置的一检索视频文件。为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详 细说明如下。


图IA 图IC是已知的一种以名称找图像的检索方法示意图。图2是显示MPEP-7标准中对于视听内容(AV Content)与内容描述(Content Description)的相关示意图。图3是说明本发明一实施范例的针对网络上进行视频搜寻的方法流程图。图4是说明本发明另一实施范例的针对网络上进行视频搜寻的方法流程图。图5A是说明本发明一实施范例的电路实施方块示意图。图5B是说明本发明一实施范例中选取检索影片片段的应用方法示意图。图6A是说明在一图框中所具有的移动向量(MV)示意图。图6B则是在视频文件中,根据时间轴而有一系列连续的画框,以及其移动向量的 示意图。图6C则是显示微区块MB的移动向量所属的不同区块尺寸(Block Size)示意图。图7A与图7B是分别说明相同电影而不同解析度的片段与显示的连续图框示意 图。图8A是分别找出不同影片,包括影片A(QCIF格式)、影片A(CIF格式)与影片 B(CIF格式)的示意图。图8B则是说明如图8A中的三种不同影片经过本实施所提出针对网络上进行视频 搜寻的方法计算后,得到的差值示意图。
图8C、图8D与图8E,分别为图8A的影片A (QCIF格式)、影片A (CIF格式)与影片 B (CIF格式)所得到的3D-MV地图分布示意图。主要元件符号说明
530串流剖析器(Stream Parser)
540:3-D移动向量(3D-MV)地图产生器
5503-D移动向量(3D-MV)地图比较器
552网络
554数据库
560显不器
610、620、622、624、626 与 628 图框
710、730:影片片段
720、722、724、726、728 图框
740、742、744、746、748 图框
810影片A(QCIF格式)
820影片A (CIF格式)
830影片B (CIF格式)
812影片A(QCIF)的差值分布
822影片A(CIF)的差值分布
832影片B(CIF)的差值分布
具体实施例方式本发明实施范例提出一种新的视频搜寻技术,突破目前以文字为主的搜寻技术, 建立一个以视频内容作为搜寻条件的技术,达到以视频找视频的搜寻结果。在本发明实施范例其中之一,是选择其中一段视频文件作为检索信息(Query Message),此选择方式不论是通过使用者选择任一时间长度的视频文件,或是经由使用者 接口自动选取其中一段固定或特定期间的视频文件等等方式皆可运用在此范例中。上述的使用者选择方式,在一实施例中,可内建于控制影片播放的遥控器中,例如 电视或是DVD的播放器等等。或是内建于触控显示器或屏幕上的使用者接口,能让使用者 方便且简单的方式停住一端时间的影片作为检索信息即属本发明的应用。针对选择作为检索条件的视频文件,由于其名称或是影片格式,甚至画面大小与 品质可能有所不同,但若为同一部影片,其剧情是相同的,但其动态向量(Motion Vector, MV)分布会相同或类似,如图7A或7B所示,稍后介绍。,所以,只要针对所选择的视频文件, 建立检索索引(Searchlndex),即可找出相同或是相似剧情的影片。例如对作为检索条件的 视频文件以及欲进行检索的所有其他视频文件,可先经由格式转换而转换为具有相同格式 的视频文件。由于本实施例加入了时间轴(Time Domain)的特征,因此,可在所欲进行检索 的所有其他视频文件中找出相同时间轴区段的对应视频文件,而后,经由运算转换为具有 相同格式的视频文件。在一实施例中,所有欲进行检索的其他视频文件可以是存在区域网 络的主机、搜寻引擎的主机数据库、或是云端数据库等等。而此格式转换的运算,可在个人 主机、在区域网络的系统服务器、搜寻引擎的主机或是云端运算系统等进行皆可。
在此实施范例中,转换为相同格式的用意在于取得作为检索条件的视频文件,以 及欲进行检索的所有其他视频文件的移动向量(Motion Vector,底下简称MV)。也就是说, 对所有压缩的视频文件的多个图框取出其移动向量(MV),据以建立检索索引。在一实施 例中,可采用串流剖析器(StreamParser),对所有压缩的视频文件的数据比特流进行剖析 (Parsing),并且取出其移动向量(MV)。而对于不同解析度的移动向量,在本实施例中,提 出一种对移动向量(MV)的统计方法,例如以图像群组(Group of Pictures,GOP)为基本单 位,针对其所有图框的区块(Macro Block, MB),其移动向量所属的区块大小(Block Size) 所占的比率,以例如一临限值(Threshold)决定采用哪一种移动向量(MV)进行建立检索索 引。针对不同的视频文件,虽然其名称或是影片格式,甚至画面大小与品质有所不同, 如果为同一部影片,其剧情是相同的,所以其动态向量(MV)分布会相同或类似,如图7A或 7B所示,也就是在时间轴上图框的变化不大。因此,可以选择性的以一定比例(例如1 2、 1 4、1 N, N为整数)取得对应画框(Frame)的移动向量(MV)值。因此,所建立的3-D 移动向量地图可以达到一定精确程度即可。而后,在本发明实施范例其中之一,根据所述3-D移动向量地图进行判断,而找出 相关的视频文件。并且根据相关的程度而显示搜寻的成果。在一实施例中,可以将所选 择的视频文件(也就是检索标的)的3-D移动向量地图中所有微方块(Micro Block, MB) 的MV值,与所有欲进行检索的视频文件的3-D移动向量地图中所对应的微方块(Micro Block, MB)的MV值进行差值运算,其分布情况进行比对,并根据比对的结果得到相关 (Correlation)的程度,作为显示结果的依据。在本发明所提出一种针对新的视频搜寻的方法,在实施范例其中之一,请参照图3 的流程图,建立一个以视频内容作为搜寻条件的技术,达到以视频找视频的搜寻结果。首先,步骤310中,开始进行以视频找视频的操作。在步骤320,选择其中一段视频 文件作为检索信息(Query Message) 0此选择方式不论是通过使用者通过视频播放软件播 放时,选择其中一时间长度的视频文件(从正在播放中的影片中使用遥控器或其他方式停 住一端时间的影片作为检索信息),或是经由一使用者接口,在使用者点选其中一个功能按 钮后,自动选取其中一段固定或特定期间的视频文件,或是其他可达到选择其中一时段视 频文件的方式,皆在此范例可运用的范围中。在选择作为检索条件的视频文件后,如步骤330,由于其名称或是影片格式,甚至 画面大小与品质有所不同,因此,例如对作为检索条件的视频文件以及欲进行检索的所有 视频文件,可选择性地经由格式转换而转换为具有相同格式的视频文件,但此步骤若是在 视频文件格式相同的条件下,是不需要进行。由于本实施例加入了时间轴(Time Domain) 的特征,因此,可在所欲进行检索的所有视频文件中找出相同时间轴区段的对应视频文件, 而后,经由运算转换为具有相同格式的视频文件。在一实施例中,所有欲进行检索的视频文 件可以是存在区域网络的主机、搜寻引擎的主机数据库、或是云端数据库等等。而此格式转 换的运算,可在个人主机、在区域网络的系统服务器、搜寻引擎的主机或是云端运算系统进 行皆可。在步骤340中,对所有视频文件,通常为已经过压缩的数据,其比特流 (Bitstream)进行剖析(Parsing),可以选择性的以一定比例(例如1 2、1 4、1 N,N为画框的数目)取得对应画框的移动向量(MV)值,其目的是为了弹性调整时间轴的采样 率。本实施例将所有视频文件(包括作为检索条件的视频文件)转换为相同格式的用意, 在于所有视频文件内图框的移动向量。也就是说,对所有压缩的视频文件取出其移动向量, 据以建立检索索引。而对于不同解析度的移动向量,在本实施例中,可以利用上采样(Up-Sampling) 或是下采样(Down-Sampling)的方式进行改变。例如,一般视频文件是由很多依照时间轴 顺序连续排列的画框(Frame)所组成,而每个画框是由很多个微区块(MicroBlock,MB)编 码而成,而每个微区块MB为例如是16 X 16为单位,而对于每个微区块MB具有的移动向量, 有可能一个,也可能具有16个(一个MB可再切割成16块4*4的子方块),因此不同格式 的影片光一个MB中可能就有1 16个MV值在其中,对于后面的MV差值运算会造成无法 对应运算;所以为了统一解析度,则必须将每个微区块MB所具有的移动向量数量调整成一 致,在一实施例中,如果是要将η个移动向量调整成一个,可以采用例如平均法,将η个移动 向量的值做一平均数的计算。另外,如果是要将仅有1个移动向量转为具有η个移动向量的作法,可以将1个移 动向量转为η个相同值的移动向量。另外,针对如何决定微区块MB所具有的移动向量是一个转η个或是η个转一个的 方式,可采用统计法完成。例如针对MPEP的视频编码格式,通常在架构上会定义画面群组 (Group of Pictures,G0P),例如在MPEP-4协议处理连续动态图像时,为达到比较好的压缩 效果,会定义此画面群组(GOP),可以获得图像数据内的随机存取动作,例如在MPEP-4协议 是包括九张画面(一个I画面、两个向前预测的P画面与六个双向预测的B画面)。因此, 如果欲知道采用那个移动向量数量比较适合,则在一例子中,可以画面群组(GOP)为基本 单位,针对其微区块MB的移动向量所属的区块大小(Block Size)所占的比率,以例如一临 限值(Threshold)来决定采用那个数量的移动向量进行建立检索索引。接着请参照步骤350,根据由移动向量(MV)所建构的3D移动向量地图(3D-MV Map),经过运算后即可得到相关值,而根据相关值排列即可找出相关视频的文件,并且依照 相关程度显示其结果。在选择作为检索条件的视频文件后,由于其名称或是影片格式,甚至画面大小与 品质有所不同,但若为同一部影片,其剧情是相同的,所以其动态向量(MV)分布会相同 或类似,如图7A或7B所示。所以,只要针对所选择的视频文件,建立检索索引(Search Index),即可找出相同或是相似剧情的影片。在实施范例其中之一,对于检索索引(Search Index)建立的方式,可以根据所取得的移动向量(MV),存入一运算矩阵中,而得到一个2-D 移动向量地图(2D-MV Map)。而根据所选择的视频文件的时间区间,例如是30秒或是一分 钟,而根据连续显示的画框(Frame)产生不同的2_D移动向量地图,此考虑时间轴的关系, 即可建立一个称为3-D移动向量地图(3D-MVMap)的数据。但由于在一时间区间内的画框 相当多,例如一秒达30张画面,而一分钟可达1800张画框。因此,如果是将其对应的移动 向量填入,将会需要大量的计算,可能会延迟处理的时间。针对不同的视频文件,虽然其名称或是影片格式,甚至画面大小与品质有所不同, 但若为同一部影片,其剧情是相同的,所以其动态向量(MV)分布会相同或类似,如图7A或 7B所示。也就是在时间轴上画面的变化不大。因此,可以选择性的以一定比例(例如1 2、1 4、1 N, N为整数)取得对应画框(Frame)的移动向量(MV)值。因此,所建立的3-D 移动向量地图可以达到一定精确程度即可。而后,在本发明实施范例其中之一,根据所述3-D移动向量地图进行判断,而找出 相关的视频文件。并且根据相关的程度而显示搜寻的成果。在一实施例中,可以将所选择的 视频文件(也就是检索标的)的3-D移动向量地图中所有微方块(Micro Block,MB)的MV 值,与所有欲进行检索的视频文件的3-D移动向量地图中所对应的微方块(Micro Block, MB)的MV值进行差值运算,而后依照运算差值分布情况进行比对,并根据比对的结果得到 相关(Correlation)的程度,作为显示结果的依据。例如,在一实施例中,可以根据两个进 行比较的视频文件,其第N个画框(Frame)的移动向量值,以及另一个的视频文件第N个画 框的移动向量值进行例如均方根(Root-Mean-Square,RMS)计算或是差值绝对值的计算, 而取得差值(Distance),根据这些差值的分布作为相关(Correlation)程度的结果,并显 示得到的结果。在本发明所提出新的视频搜寻的方法,在另一实施范例中,请参照图4的流程图, 用以详细说明如何建立一个以视频内容作为搜寻条件的技术,达到以视频找视频的搜寻结果。首先,步骤410中,开始进行以视频找视频的操作。在步骤420,选择其中一段视频 文件作为检索信息(Query Message) 0此选择方式不论是通过使用者通过视频播放软件播 放时停住一段时间的影片,选择其中一时间长度的视频文件,或是经由一使用者接口,在使 用者点选其中一个功能按钮后,自动选取其中一段固定或特定期间的视频文件,或是其他 可达到选择其中一时段视频文件的方式,皆在此范例可运用的范围中。在选择作为检索条件的视频文件后,如步骤430,由于其名称或是影片格式,甚至 画面大小与品质有所不同,因此,例如对作为检索条件的视频文件以及欲进行检索的所有 视频文件,可选择性地经由格式转换而转换为具有相同格式的视频文件,但此步骤若是在 视频文件格式相同的条件下,是不需要进行。由于本实施例加入了时间轴(Time Domain)的特征,因此,可在所欲进行检索的所 有视频文件中找出相同时间轴区段的对应视频文件,而后,经由运算转换为具有相同格式 的视频文件。而此相同格式,是可以经由事先预定的格式,例如所有使用此方法中统一运用 的格式,或是系统业者所预定的格式皆可,以能够最佳化搜寻效率与结果为设计上主要的考量。在此实施例中,所有欲进行检索的视频文件可以是存在数据库432中,例如可以 是区域网络的主机、搜寻引擎的主机数据库、或是云端数据库等等。而此格式转换的运算, 可在个人主机、在区域网络的系统服务器、搜寻引擎的主机或是云端运算系统进行皆可。在步骤440中,对所有或部分视频文件,通常为已经过压缩的数据,其比特流 (Bitstream)进行剖析(Parsing),并且可以选择性的以一定比例(例如1 2、1 4或是 1 N,其中N为画框的数目)取得对应画框(Frame)的移动向量(MV)值,其目的是为了弹 性调整时间轴的采样率。本实施例将所有视频文件(包括作为检索条件的视频文件)转换 为相同格式的用意,在于所有视频文件的移动向量。也就是说,对所有压缩的视频文件取出 其移动向量,据以建立检索索引。而对于不同检索条件下的解析度,也就是不同解析度的移动向量,在本实施例中,可以利用上采样(Up-Sampling)或是下采样(Down-Sampling)的方式进行改变。例如,一 般视频文件是由很多连续的画框所组成,而每个画框(Frame)是由很多个微区块(MB)编码 而成,而每个微区块MB为例如是16 X 16为单位,而对于每个微区块MB具有的移动向量,有 可能一个,也可能具有16个,对于不同的格式有不同的移动向量数量。而若是为了统一解 析度,则必须将每个微区块MB所具有的移动向量数量调整成一致,在一实施例中,如果是η 个移动向量调整成一个,可以采用例如平均法,将η个移动向量的值做一平均数的计算,例 如
权利要求
1.一种视频搜寻方法,包括选择具有一时间长度的视频文件,作为一检索视频文件,对该检索视频文件与多个欲 进行检索的视频文件的比特流进行剖析,而取出对应的多个移动向量;根据这些移动向量在时间轴上依序建立多个对应的移动向量地图;以及根据该检索视频文件的移动向量地图,与这些视频文件的移动向量地图,得到相关程 度,藉以根据这些相关程度得到视频搜寻的结果。
2.如权利要求1所述的视频搜寻方法,其中该检索视频文件为使用者选择一时间长度 的视频文件。
3.如权利要求1所述的视频搜寻方法,其中该检索视频文件为经由一使用者接口连结 选择一时间长度的视频文件。
4.如权利要求1所述的视频搜寻方法,其中该检索视频文件与这些欲进行检索的视频 文件在时间轴上同步。
5.如权利要求1所述的视频搜寻方法,其中该检索视频文件与这些欲进行检索的视频 文件在取出这些移动向量前先经由转换运算而转换为具有相同格式的视频文件。
6.如权利要求5所述的视频搜寻方法,其中该相同格式为该检索视频文件与这些欲进 行检索的视频文件对应其移动向量的数量相同。
7.如权利要求5所述的视频搜寻方法,其中该转换运算为针对该检索视频文件与这些 欲进行检索的视频文件内的多个图框中,具有不同数量的这些移动向量,利用上采样或是 下采样的方式进行改变为一致。
8.如权利要求7所述的视频搜寻方法,其中该转换运算对这些图框选择调整为一定数 量的这些移动向量方式,为对以一画面群组G0P为基本单位,找出在该画面群组中的所有 这些图框的所有这些移动向量的数量,如果超过一临界值的数量则作为调整的依据。
9.如权利要求1所述的视频搜寻方法,其中这些欲进行检索的视频文件存储在区域网 络的主机、搜寻引擎的主机数据库、或是云端数据库。
10.如权利要求1所述的视频搜寻方法,其中根据这些移动向量在时间轴上建立多个 对应的移动向量地图,是以一定比例在该时间轴上挑选在该检索视频文件与这些欲进行检 索的视频文件内的图框,而针对所挑选的这些图框的这些移动向量产生该移动向量地图。
11.如权利要求10所述的视频搜寻方法,其中该一定比例为在该时间轴上挑选在该检 索视频文件与这些欲进行检索的视频文件内每隔N张的这些图框,其中N为整数,且N大于等于一 。
12.如权利要求11所述的视频搜寻方法,其中这些移动向量地图为挑选的这些图框填 入一运算矩阵而得到一 2-D移动向量地图,而加上这些图框是依照该时间轴挑选,则可建 立一 3-D移动向量地图。
13.如权利要求1所述的视频搜寻方法,其中根据该检索视频文件的移动向量地图与 这些视频文件的移动向量地图得到相关程度,是比较根据该检索视频文件的移动向量地图 内每两相邻图框移动向量的运算差值,与每一这些视频文件的移动向量地图内每两相邻图 框移动向量的运算差值,依照其分布进行比对,并根据比对的结果得到相关程度。
14.如权利要求13所述的视频搜寻方法,其中每两相邻图框移动向量的运算差值为根 据均方根运算或是差值绝对值运算。
15.一种视频搜寻装置,包括一串流剖析器,用以对多个视频文件的比特流进行剖析,并且取出多个移动向量数据;一 3D移动向量地图产生器,用以根据这些移动向量建构具有时间轴数据的一 3D移动向量地图;以及一 3D移动向量地图比较器,用以根据这些3-D移动向量地图进行判断,而找出这些视 频文件的相关程度,藉以根据这些相关程度得到视频搜寻的结果。
16.如权利要求15所述的视频搜寻装置,还包括一视频格式转换器,用以选择性地对 一检索视频文件与多个欲进行检索的视频文件转换为这些视频文件,输出至该串流剖析器 进行剖析。
17.如权利要求16所述的视频搜寻装置,其中该检索视频文件为使用者选择一时间长 度的视频文件。
18.如权利要求16所述的视频搜寻装置,其中该检索视频文件为经由一使用者接口连 结选择一时间长度的视频文件。
19.如权利要求16所述的视频搜寻装置,其中该检索视频文件与这些欲进行检索的视 频文件在时间轴上同步。
20.如权利要求16所述的视频搜寻装置,其中这些欲进行检索的视频文件存储在区域 网络的主机、搜寻引擎的主机数据库、或是云端数据库。
21.如权利要求16所述的视频搜寻装置,其中该串流剖析器对这些视频文件内的多个 图框中,具有不同数量的这些移动向量,利用上采样或是下采样的方式进行改变为一致。
22.如权利要求21所述的视频搜寻装置,其中该串流剖析器对这些图框选择调整为一 定数量的这些移动向量方式,为对以一画面群组G0P为基本单位,找出在该画面群组中的 所有这些图框的所有这些移动向量的数量,如果超过一临界值的数量则作为调整的依据。
23.如权利要求15所述的视频搜寻装置,其中该3D移动向量地图产生器根据这些移动 向量在时间轴上建立多个对应的移动向量地图,是以一定比例在该时间轴上挑选在这些视 频文件内的这些图框,而针对所挑选的这些图框的这些移动向量产生该移动向量地图。
24.如权利要求23所述的视频搜寻装置,其中该一定比例为在该时间轴上挑选在该检 索视频文件与这些欲进行检索的视频文件内每隔N张的这些图框,其中N为整数,且N大于等于。
25.如权利要求23所述的视频搜寻装置,其中该3D移动向量地图产生器将挑选的这些 图框填入一运算矩阵而得到一 2-D移动向量地图,而加上这些图框是依照该时间轴挑选, 则可建立一 3-D移动向量地图。
26.如权利要求15所述的视频搜寻装置,其中该3D移动向量地图比较器是根据这些视 频文件的移动向量地图,比较根据该检索视频文件的移动向量地图内每两相邻图框移动向 量的运算差值,依照其分布进行比对,并根据比对的结果得到相关程度。
27.如权利要求26所述的视频搜寻装置,其中每两相邻图框移动向量的运算差值为根 据均方根运算或是差值绝对值运算。
28.一种视频播放装置,具有一主机与一控制器,其中该主机具有如权利要求15所述 的视频搜寻装置,该控制器具有一功能控制装置,其中该功能控制装置用以让使用者选择该主机播放的视频数据中的其中一段,作为该视频搜寻装置的一检索视频文件。
29.如权利要求28所述的视频播放装置,其中该主机为一电视机,而该控制器为一无 线遥控器,用以无线方式控制该电视机。
30.如权利要求28所述的视频播放装置,其中该主机为一计算机主机,而该控制器为 鼠标。
全文摘要
一种使用动态向量的视频搜寻方法及其装置。在此视频搜寻方法中,包括对一输入检索视频文件与多个欲进行检索的视频文件的比特流进行剖析,而取出对应的多个移动向量。根据所述移动向量在时间轴上建立多个对应的移动向量地图。根据所述检索视频文件的移动向量地图与所述视频文件的移动向量地图,得到相关(Correlation)程度,藉以根据此相关程度得到视频搜寻的结果。
文档编号G06F17/30GK101996229SQ20101022046
公开日2011年3月30日 申请日期2010年6月29日 优先权日2009年8月18日
发明者涂日升, 高荣扬 申请人:财团法人工业技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1