专利名称:传输矢量的方法和装置的制作方法
技术领域:
本发明涉及用于传输矢量的一种方法和一种装置。
从[1]或[2]中公开了这种方法,并在那里在处理多媒体信息时得到了采用。
在往年已规定了用于编码多媒体信息,譬如视频信息或音频信息的不同的标准。
譬如图像编码标准MPEG4[3]是一种这样的标准。
这些共同的标准已导至越来越多的多媒体信息可供支配。为了使这些信息可供使用者支配,有必要将这些多媒体信息加索引指数。
通常由说明多媒体信息特征的描述符来实现这种加索引指数。这样的特征譬如是数字化图像所具有的彩色分布或亮度分布。
这些描述符常常基于直方图,即求出要说明特征的值的频度。
从[1]或[2]中在说明数字化图像的彩色分布范围中公开了这种直方图。用该直方图、也即一个彩色直方图说明一个频度,某个色值或某个彩色范围以该频度作为图像中的像素来出现。
由于这种直方图通常具有许多记录项,这种直方图的比较是费事的。此外相邻的记录项还常常具有相似的值。
从[1]或[2]中公开了,在该情况中在采用哈尔(Haar)子波变换的条件下变换直方图。
图2示意地展示哈尔子波变换(200)在一维4库(Bin)直方图上的,即具有四个频度记录项的直方图上的应用,正如它从[1]或[2]中所公开的那样。
通过这种由所给定计算操作组合的,即加(201)和减(202)的变换(200),按图2在四个哈尔子波系数上,即在一个哈尔系数指数0(250)、一个哈尔系数指数1(260)、一个哈尔系数指数2(270)、一个哈尔系数指数3(280)上,投影4-库-直方图的四个记录项,即一个值库0(210)、一个值库1(220)、一个值库2(230)、一个值库3(240)。
正如同样从[1]或[2]中公开的那样,随后量化、二进制化这些哈尔子波系数,即将每个量化的哈尔子波系数变换成由二进制数字0和1组成的,分别具有可给定的固定位长度的相应的二进制数字或数字序列,并随后编码成一个位数据流。向接收器传输该位数据流。在那里将该位数据流与一个比较位数据流进行比较,该比较位数据流已经以相应的方式被编码,并同样说明一个直方图。
通过这种进行方式在采用从属于它们的位数据流的条件下,可以对两个直方图进行比较,而不必将所述的位数据流又反变换成所属的直方图。
图3中示意地示出了在按[1]或[2]的这种编码时的进行方式。
图3展示四个二进制化的,量化的哈尔子波系数(301至304)的位平面示图(300),该位平面示图按图3具有七个位平面(310至316)。
在也已从[4]中公开的编码(320)中,在位数据流(350)中相继地,分别按所属二进制数字的下降的位平面价来存放所述的四个哈尔子波系数(301至304)。
这如下来实现,在所述哈尔子波系数(301至304)的编码(320)时,分别首先将所属最高价的位平面的二进制数字,即一个所谓的最高有效位(MSB)(331)存放到所述的位数据流(350)中。作为各自要编码的哈尔子波系数(301至304)的最后要编码的位,将最低价的位平面(0位平面(310))的二进制数字,即一个所谓的最低有效位(LSB)332存放到所述的位数据流(350)中。
这导致在所述的位数据流(350)中,一个所编码的哈尔子波系数(361至367)的二进制数字与随后所编码的哈尔子波系数(371至374)的那些二进制数字分开地被存放。
此外从[1]或[2]中公开了,向接收器传输这种位数据流,并在那里将它与另一个代表要比较的直方图的,同样编码的位数据流进行比较。
这种公知的进行方式却具有以下的缺点,即在位数据流中如下来传输编码的信息,使得对于两个直方图的粗略比较所不需要的信息必须在位数据流中随同传输。这导致在这种比较时不能减少所使用的传输带宽。
因而本发明所基于的问题在于说明一种方法和一种装置,用该方法和该装置可以相对于所述的公知的方法改善和更有效地传输说明频度的编码信息。
通过具有各自独立权利要求特征的方法以及装置来解决所述的问题。
在所述用于传输具有至少两个分别说明一个频度的矢量分量的矢量的方法中,利用给定数量的位平面将每个矢量分量表示为位数字。随后优先按位平面的价来编码和传输所述的位数字。
所述用于传输具有至少两个分别说明一个频度的矢量分量的矢量的装置,具有一个处理机,该处理机是如此设置的,使得可以执行以下的步骤-利用给定数量的位平面将每个矢量分量表示为位数字,以及-优先按位平面的价来编码和传输所述的位数字。
本发明的一个特别的优点在于位数据流中二进制数字的存储结构。在所述的位数据流中如下来存放所述的二进制数字,使得位数据流中的第一批二进制数字已经可以被用来进行两个直方图的粗略比较。因此可以更迅速和更有效地实施这种比较。此外可以减小在传输位数据流时所使用的带宽。
本发明此外还实现了矢量表示的迅速的伸缩。二进制数字的存储结构实现了,通过消除最后的二进制数字来从一种精细的矢量表示中,即从低价位平面的二进制数字中生成一种粗略的矢量表示,而不重新分类二进制数字。由于这是在传输时和比较直方图时的一种经常的运算,这个优点具有重大意义。
除此之外本发明实现了矢量的快速比较。在每个位平面的开始时已编码了矢量的重要分量的二进制数字,并可以直接被读出。
所述的装置特别适合于执行本发明的方法,或执行这些方法的以下所阐述的改进方案中的一个。
从属的权利要求说明了本发明的优选的改进方案。
以下所述的改进方案既涉及所述的方法,也涉及所述的装置。
譬如在采用专门的电路条件下可以既在软件中,也在硬件中实现本发明和以下所述的改进方案。
此外,通过一种可由计算机读取的存储媒体可以实现本发明或一个以下所述的改进方案,在该存储媒体上存储了实施本发明或改进方案的计算机程序。
通过具有存储媒体的计算机程序产品可以实现本发明或以下所述的每个改进方案,在该存储媒体上存储了实施本发明或改进方案的计算机程序。
在一个扩展方案中所述的矢量是一个具有在采用一种变换、譬如哈尔子波变换条件下已求出的系数的系数矢量。
在所述的矢量分量二进制化之前也可以量化所述的矢量。
在一个改进方案中所述的矢量表示一个直方图。这种直方图一般包括分别说明频度的直方图记录项。
所述的直方图优选经受哈尔变换,因为能够以此无信息损失地来减少数据。如果量化所变换的直方图,则达到了数据的进一步的减少。
在编码数字化图像时所应用方法的一个改进方案中,所述的直方图说明一个频率分布,譬如数字化图像所基于的一个彩色或亮度分布。
优选按一种给定的顺序来分类所述的矢量分量。因此可以从要编码或要传输的数据中进行选择,并因此提高编码效率或传输效率。
如下来达到所述编码效率的进一步改善,即仅编码给定数量的位平面。此时,编码较高价的位平面是有利的。在这样的位平面中比在较低价位平面中存储了更重要的编码信息。
如果以位平面的下降的价来编码所述的位数字,则达到所述编码效率的进一步改善。
在附图中示出了本发明的一个以下将详述的实施例。
图1展示了一个简图,该简图说明在按实施例编码和传输信息时的方法步骤;图2展示了一个简图,该简图示意地说明哈尔子波变换;图3展示了一个简图,该说明按现有技术编码哈尔子波系数;图4展示了一个简图,该简图示意地说明按实施例的哈尔子波变换;图5展示了一个简图,该简图说明按实施例编码哈尔子波系数;图6展示了一个简图,该简图说明按对实施例的第一替代方案的编码,其中改变了二进制数字的顺序;图7展示了一个简图,该简图说明按对实施例的第二替代方案的编码,其中仅编码所选出的位平面。
实施例彩色直方图的编码和传输以下所说明的实施例涉及彩色直方图的一种编码和传输。
在附图1中示意地示出了在编码和传输彩色直方图时所执行的方法步骤。
以下给出了随后将阐述的方法步骤的概要在第一方法步骤101中求出所述的彩色直方图。在第二方法步骤102中将哈尔子波变换应用到所述的彩色直方图上。随后在第三方法步骤103中量化所述哈尔变换的直方图。在第四方法步骤104中如下地将哈尔变换的和量化的直方图的值二进制化,使得每个二进制的值具有给定数量的位平面。随后在第五方法步骤105中优先按位平面的价将所述的二进制数字编码成位数据流。在第六方法步骤106中传输所述的位数据流。
附图4中示出了所述的彩色直方图,即一个具有四个直方图记录项401至404的一维4-库-直方图401,该4-库-直方图说明数字化彩色图像的彩色分布。
用该彩色直方图400说明一个频度,在所述数字化的彩色图像中作为像素将某个彩色范围以该频度来出现。
此时,某个彩色范围的所述频度相当于所述彩色直方图400中的所属的记录项471,472,473或474。
此外,附图4示意地展示哈尔子波变换410在所述彩色直方图400上的应用,正如它在[1]或[2]中所说明的那样。
通过由给定计算操作,即由加411和减412所组合的这个哈尔子波变换401,在四个哈尔子波系数上,即一个哈尔系数指数0 420、一个哈尔系数指数1 421、一个哈尔系数指数2 422、一个哈尔系数指数3 423上,投影所述彩色直方图的四个记录项,即一个值库0401、一个值库1 402、一个值库2 403、一个值库3 404。
正如同样在[1]或[2]中所说明的那样,量化和随后二进制化这些哈尔子波系数420至423,即将每个量化的哈尔子波系数变换成一个相应的二进制数字或数字序列,该二进制数字序列由分别具有可给定的固定位长度的二进制数字0和1所组成。
附图5中在位平面示图中示意地示出了二进制数字序列501至504。
第一数字序列501呈现一个具有7位的位长度;第二数字序列502呈现一个具有4位的位长度;第三数字序列503呈现一个具有6位的位长度;第四数字序列呈现一个具有3位的位长度。
在示图上所采用位平面的数量是以所有数字序列的最大位长度为准的。因此在附图5中按照第一数字序列501的位长度示出了七个位平面510至516。所述的位平面510至516是按它们的价彼此叠起地布置的,即位平面511位于位平面510上、所述的位平面512位于位平面511上,以此类推。
因此按照各自的位长度由第一数字序列501占据所有七个位平面510至516、由第二数字序列502占据所述的四个位平面510至513、由第三数字序列占据所述的六个位平面510至515、和由第四数字序列504占据所述的位平面510至512。
在将所述的二进制数字序列501至504编码530到所述的位数据流540中时,首先将最上方位平面的,在本情况下是第七位平面516的数字存放到所述的位数据流540中。
由于在本情况下只有第一数字序列501具有一个属于第七位平面516的数字550,所以仅将该数字550存放到位数据流540中。
随后将属于下一个较低位平面的,即位平面515的数字551和552存放到位数据流540中。
以此方式处理分别具有下降价的余下的位平面514,513,512,511和510。将位平面510作为最后要运算的位平面来处理。
以所属二进制数字的顺序,在本情况下以顺序501,502,503和504将属于一个相同位平面的数字存放到位数据流540中。
因而优先按要编码数字所属的位平面的价来进行将数字序列501至504编码530到所述的位数据流中。在本情况下仅仅按等级的排序特征是二进制数字的顺序。
最后将所述的位数据流540传输给接收器。
以下说明第一实施例的替代方案。
第一替代方案在所述的编码之前重新分类二进制数字或数字序列附图6中示出了对第一实施例的第一替代方案。
在该第一替代方案中,在编码630到位数据流640中之前通过重新分类来改变二进制数字或数字序列601至604的顺序。
二进制数字或数字序列的新的顺序为601先于603先于602先于604。
二进制数字或数字序列601至604的重新分类的顺序考虑了,在有关数字化彩色图像的彩色范围的直方图中的频度变化的频率,这些频度变化通过二进制数字或数字序列601至604来表示。
新的第一数字序列601表示具有最低频率的频率范围。由新的第二数字序列603表示下一个较高的频率范围。新的第三数字序列602和新的第四数字序列604表示具有最高频率的频率范围。
要说明的是,所述的新顺序不表示限制重新分类。可以实现数字序列的任意的顺序。
按第一实施例进行将新分类的数字序列601至604编码630到位数据流640中。
在本情况下也优先按要编码数字所属的位平面的价来进行将数字序列601至604编码630到位数据流中。也在本情况下,仅仅按等级的排序特征是二进制数字或数字序列601至604的新的重新分类顺序。
第二替代方案仅编码所选出的位平面附图7中示出了对第一实施例的第二替代方案。
在该第二替代方案中进行要编码位平面的选择。在该第二替代方案中仅仅将上面的四个位平面716,715,714和713的数字编码到位数据流740中。
这种选择不应看作为对选择要编码位平面的限制。要说明的是,可以采取要编码位平面的任意选择。
按第一实施例进行所选出位平面716,715,714和713的数字的编码730。
在本情况下也优先按要编码数字所属位平面的价来进行将数字序列701至704编码730到位数据流中。也在本情况下,仅仅按等级的排序特征是二进制数字或数字序列701至704的顺序。
要说明的是,附加于要编码位平面的选择,还可以按第一替代方案来重新分类二进制数字(第一替代方案与第二替代方案的组合)。
在本文件中引用了以下的文献[1]Jens-Rainer Ohm,Bela Makai著,在可伸缩地表示彩色直方图方面的CE CT5的成果,ISO/IEC JTC1/SC29/WG11 M6031,2000年五月,日内瓦;[2]Jens-Rainer Ohm,Bela Makai,Aljoscha Smolic著,在可伸缩地表示彩色直方图方面的CE CT5的成果,ISO/IECJTC1/SC29/WG11 M6285,2000年七月,北京;[3]MPEG-4应用,在2000年10月04日在网址http://www.cselt.it/mpeg/public/mpeg-4_applications.zip之下可获得;[4]Jens-Rainer Ohm著,数字式图像编码,284-285页,Springer出版社,1995年,柏林。
权利要求
1.用于传输一个具有至少两个矢量分量的矢量的方法,这些矢量分量中的每一个说明一个频度,-其中,利用一个给定数量的位平面将每个矢量分量表示为位数字,以及-其中,优先按所述位平面的价来编码和传输所述的位数字。
2.按权利要求1的方法,其中,所述的矢量是一个具有在采用变换条件下已求出的系数的系数矢量。
3.按权利要求2的方法,其中,量化所述的系数矢量。
4.按权利要求1至3之一的方法,其中,所述的矢量表示一个直方图。
5.按权利要求4的方法,其中,所述的直方图说明一个数字化图像所基于的频率分布或彩色分布或亮度分布。
6.按权利要求1至5之一的方法,其中,按一个给定的顺序分类所述的矢量分量。
7.按权利要求1至6之一的方法,其中,仅仅编码一个给定数量的位平面。
8.按权利要求1至7之一的方法,其中,以所述位平面的下降的价来编码所述的位数字。
9.用于传输一个具有至少两个分别说明一个频度的矢量分量的矢量的装置,具有一个如下设置的处理机,使得可以执行以下的步骤-利用一个给定数量的位平面将每个矢量分量表示为位数字,以及-优先按所述位平面的价来编码和传输所述的位数字。
全文摘要
本发明涉及一种具有至少两个分别说明一个频度的矢量分量的矢量的传输。利用一个给定数量的位平面将每个矢量分量表示为位数字,并随后优先按所述位平面的价来编码和传输所述的位数字。
文档编号H04N7/24GK1631039SQ01816868
公开日2005年6月22日 申请日期2001年10月5日 优先权日2000年10月6日
发明者J·霍伊尔, A·考普 申请人:西门子公司