专利名称:图像和视频的预测无损编码的制作方法
技术领域:
本发明涉及图像和视频的无损编码。
背景技术:
无损图像编码具有大量的各种各样的重要应用,包括高质量的数码摄影、电影、图形等等。它也可应用于专业级视频编码,用于在最高可能质量设置上(即无损地)编码视频的帧。这些应用程序的图像可具有不同的特征,从而显示了对设计在这些应用上可一般应用的图像编/解码器的困难挑战。例如,图形中的图像具有明显的边缘或在色彩上的明显转变(例如,在文本色和背景色之间、以及在相邻形状的边缘上),而摄影图像通常是连续色调的(即图像上的色彩是连续变化的(例如梯度))。
由于图像特征中的差异,大多数通用图像编/解码器都被设计用以压缩摄影(例如JPEG)或图形图像(GIF)。摄影图像压缩通常使用如像DCT或小波的去相关的变换,而图形图像压缩通常使用诸如LZ77或LZ78的基于字符串编/解码器。一般而言,摄影编/解码器对图形作用不佳,因为对作为转换方法基础的局部平滑度或DC偏置的假设在图形中通常会不成立。相反,图形编/解码器则在摄影图像上表现较差,因为符号集太大难以建立好的字典。结果,现有的用于摄影图像的图像编/解码器没有为与图像和视频编/解码器的简便互操作性而设计,它们也不能有效处理图形内容。
例如,CALIC[如X.Wu,N.Memon和K.Sayood,“用于连续色调图像的基于上下文的适应性无损/接近无损的编码方案”(“A Context-Based Adaptive Lossless/Nearly-Lossless Coding Scheme For Continuous-Tone Images,”)ISO,1995所述],JPEG-LS[如M.J.Weinberger和G.Seroussi,“LOCO-I无损图像压缩算法JPEG-LS的原理和标准化”(“The LOCO-I Lossless Image Compression AlgorithmPrinciples and Standardization into JPEG-LS,”)IEEE Trans.Image Processing,卷9,1309-1324页,2000年8月所述]以及SPIHT[如Said和W.A.Pearlman,“基于层次结构树上集合划分的新的快速有效的图像编/解码器”(“A New Fast And EfficientImage Codec Based On Set Partitioning In Hierarchical Trees,”)IEEE Trans.OnCircuits and Systems for Video Technology,卷6,第6,243-250页,1996年6月]是当前用于摄影图像的先进技术水平无损图像编/解码器。然而,它们没有为与图像和视频编/解码器的简便互操作性而设计,也不能有效处理图形内容。另一方面,GIF是当前先进技术水平的无损图形编/解码器。但是,它也不能处理摄影图像内容,也不易集成到视频编/解码器中。PTC[如H.S.Malvar,“无小波的快速逐次浮现式图像编码”(“Fast Progressive Image Coding Without Wavelets,”)243-252页,DCC2000所述]是可简便集成到图像和/或视频编/解码器中的基于宏块的编/解码器。然而,对于图形内容它的作用也不是很好。另外,BTPC[如J.A.Robinson,“具有二叉树预测编码的有效通用图像压缩”(“Efficient General-Purpose Image CompressionWith Binary Tree Predictive Coding,”)IEEE Transactions on Image Processing,卷6,第4,1997年4月所述]以统一和速度优化的设计用来处理摄影图像和图形图像,但其压缩是远不够充分的。
发明内容
预测无损编码(PLC)解决了上述提供可一般应用于各种各样图像和视频的无损图像压缩的问题。在此所示的PLC实现提供对各种各样图像内容(象图像、视频、图形)的无损图形压缩,其具有与现有无损图形编/解码器可比的压缩效率,并以比大多数无损图像编/解码器更快的运行时复杂性执行。
在此所述的各种预测无损编码通过以下至少某些点的组合来获取这些结果1在YcoCg色彩空间上操作。该色彩空间改进了摄影图像和图形图像内容的编码效率,并还可使用快速、全整数的过程来执行色彩空间到/从流行RGB(红绿蓝)色彩表示的转换。
2在宏块上操作。这确保预测无损编码能简便地集成到现有的图像和视频编/解码器中,并有益于在硬件和软件中的规模可变的空间/时间实现,例如使用片。
3在宏块级上使用一个局部的差分脉冲码调制(DPCM)预测的大集合。这些被设计用以优化地对来自摄影图像以及图形源的图形数据去相关,而不求助于图像的不规则采样或重新扫描(比较J.A.Robinson,“具有二叉树预测编码的有效通用图像压缩”(“Efficient General-Purpose Image Compression With Binary TreePredictive Coding,”)IEEE Transactions on Image Processing,卷6,第4,1997年4月;以及X.Wu,N.Memon和K.Sayood,“用于连续色调图像的基于上下文的适应性无损/接近无损的编码方案”(“A Context-Based Adaptive Lossless/Nearly-Lossless Coding Scheme For Continuous-Tone Images,”)ISO,1995)。DPCM也被设计用以产生具有零偏差、双边拉普拉斯分布的残差,尽管这些由游程长度GolombRice(RLGR)熵编码方法进行最佳编码。
4使用游程长度Golomb Rice(RLGR)熵编码方法来熵编码各种符号分布。
在一采用这些点组合的实现中,预测无损编码提供所有图像内容(象图像、视频和图形)的无损压缩,该无损压缩不仅与CALIC相等并大于包括JPEG-LS、PTC、BTPC等的其它现有格式,而且导致对大多数图像内容与这些摄影图像类型编/解码器相比两倍或两倍以上的压缩,预测无损编码还提供比大多数先进技术的摄影图像类型编/解码器快两倍或两倍以上的运行时复杂性。
参照附图阅读诸实施例的以下详细描述,本发明的附加特征和优点将变得显然。
图1是利用预测无损编码的图像编码器的框图。
图2是示出在图1编码器中利用的预测无损编码的宏块和片结构的示图。
图3是示出图1编码器中DPCM预测所基于的宏块中象素邻域的示图。
图4是示出在图1编码器中利用的预测无损编码中所采用的DPCM预测模式的示图。
图5是列出在图1编码器中利用的预测无损编码的编码过程的伪码列表。
图6是利用预测无损编码的图像解码器的框图。
图7是用于实现图1和图6PLC编/解码器的适当计算环境的框图。
具体实施例方式
以下描述涉及预测无损编码的实现,该预测无损编码组合某些或全部游程长度Golomb Rice(RLGR)熵编码的混合、多个DPCM模式、YCoCg色彩空间和宏块(MB)编码结构,以提供可应用于包括摄影图像(连续色调)、图形、以及视频的各种各样图像内容中的一种有效和快速编/解码器。
1.PLC编码器现在参看图1,基于预测无损编码(PLC)的图像编码器100的一说明性示例执行图像数据105的编码或压缩。输入到PLC编码器的该图像数据可以是任意的各种未经压缩的图像数据格式。例如,由所示图像编码器处理的一般格式是红绿蓝(RGB)图像数据,诸如摄影图像或图形图像、视频的帧等等。通常该RGB图像数据被构成为图片元素(象素)的两维数组,其中每个象素被表示为该图像的红绿蓝(RGB)色彩样本。图像编码器的可选实现可使用其它输入图像数据格式。还应理解,可使用预测无损编码将该编码器结合到视频编码器中,用于编码视频序列中的帧。
PLC图像编码器100通过一组处理器来处理该图像数据,包括色彩空间转换器110、宏块拆分器120、DPCM调制器130、以及RLGR熵编码器140。色彩空间转换器110将输入图像数据的象素从可显示色彩空间表示转换成YcoCg色彩空间,这改进了编码效率。为了与基于宏块和片的图像和视频编/解码器兼容,宏块拆分器120把图像拆分成宏块。DPCM编码器130选择可用DPCM预测模式集之一并将其应用于每个独立宏块,这些宏块产生具有适于RLGR熵编码的分布的预测残差。然后RLGR熵编码器140对宏块的预测残差进行编码。这产生了图像数据的PLC编码表示。
1.1 YcoCg色彩空间转换器更具体地,色彩空间转换器110把输入图像数据的色彩格式转换成YCoCg色彩空间。输入图像数据的象素通常以可容易显示的色彩空间格式来表示,诸如红绿蓝(RGB)色彩空间。YCoCg色彩空间更适于空间有效图像编码。已经发现YCoCg对摄影图像和图形图像效果都较好,且根据编码增益它比其它色彩变换好。更具体地,YCoCg无损色彩空间与PLC编码中的RGB色彩空间相比,有约15%的改善。
在RGB格式输入图像数据的任何编码之前,完成RGB到YCoCg色彩空间的转换。在PLC编码器100的所示实现中,色彩空间转换器110使用了在H.S.Malvar和G.J.Sullivan.“YCoCg-RA Color Space With RGB Reversibility and Low DynamicRange,”(“YCoCg-R带有RGB可逆转性和低动态范围的色彩空间”)Joint VideoTeam of ISO/IEC MPEG & ITU-T VCEG Doc.JVT-1014,2003年7月的文章中更详细描述的RGB到YCoCg转换过程,它提供了一种无损地去相关RGB成为YCoCg色彩空间的方法。通过以下等式(1)中定义的向前转换可影响RGB到YCoCg色彩空间的转换。
YC0Cg=141214120-12-1412-14RGB...(1)]]>解码器600(图6)可包括返回RGB色彩空间的转换。该转换使用等式(2)中定义的逆操作。
RGB=11-11011-1-1YC0Cg...(2)]]>提升步骤被用以获取向前和向后的转换,导致快速全整数转换过程。向前方向的提升步骤由以下给出Co=R-B;x=B+(Co/2);Cg=G-x;Y=x+(Cg/2);而相反方向的则由以下给出x=Y-(Cg/2);G=x+Cg;B=x-(Co/2);R=Co+B;由此可见,这些提升步骤都可用非常快速的全整数加法、减法和比特移位来实现。
1.2宏块编码宏块拆分器120将图像拆分成宏块(MB),如图2所示。在图像编码器100的一实现中,每个MB的尺寸是16×16象素。其它可任选的实现可使用其它宏块尺寸。该宏块结构使得把基于PLC的图像编码器插入常用的图像和视频编/解码器可行并简便。它还使硬件和软件实现能够简便使用片编码,其中经编码比特流被分组成片。通常这些片是某个整数行的MB。这造就了灵活的存储器覆盖区,也轻松促成了空间/时间的可收缩性(例如通过使用并行或多线程的执行单元)。
宏块拆分器把YCoCg色彩空间的每个平面都拆分成MB,并单独对其编码。对于每个单独的MB,PLC图形编码器100编码以下的语法元素DPCM模式、MB模式、以及DPCM残差。
DPCM模式元素标识由DPCM调制器130选择的DPCM模式,以去相关该MB中的数据。在该实现中,DPCM调制器可从8个可能DPCM模式中进行选择,尽管在其它可任选的PLC编码器实现中可使用更多或更少的DPCM模式。宏块拆分器使用单独的RLGR环境来编码用于MB的DPCM模式。
对于MB模式元素,宏块拆分器使用两个符号表,带有独立的专用RLGR编码环境。该MB模式对以下两个事件之一发出信号a)该MB编码DPCM值;或者b)该MB是“平”的,因此被跳过。在后面情形中,该事件被视为是从把MB的象素编码/解码为DPCM残差中的提前推出,因为DPCM模式元素足以重新产生所有的象素值。该平直(flat)宏块模式编码如下进行更详细描述。
最后,如果未跳过该MB,DPCM残差在PLC编码输出流的MB分段中进行编码。
1.3 DPCM模式DPCM调制器130选择更优地去相关MB的DPCM模式,并将其应用于当前MB以产生用RLGR熵编码可更好压缩的DPCM残差。RLGR熵编码在其输入值为零偏移的双边拉普拉斯分布时获得其最佳编码性能。例如,所示基于PLC编码器中的DPCM调制器130可在8种不同DPCM模式之间切换以去相关每个MB。其它可任选的实现可包括更少或更多的DPCM模式。这些各种不同DPCM模式被设计成用以对各种不同MB象素模式产生具有这种优化分布的残差。这使得落入MB内的不同主导边缘方向能够有效地进行编码。
参看图3,各种DPCM模式指定使用哪个象素领域300来预测该象素的值。更具体地,宏块每个象素310的值由一个或多个邻象素320-323的某些组合来预测。由象素的真实值减去其预测值获取的差值是该象素的DPCM残差。所示DPCM调制器130中的8种DPCM模式基于相邻左象素320、左上象素321、上象素322、以及右上象素323的组合使用预测。这使得DPCM模式能通过MB应用于单独、单向的通过或扫描中(即从上到下地扫描MB的行,从左到右地扫描每一行象素)。
图4陈述用于所示DPCM调制器130的8种DPCM预测模式。这些模式被设计用以解除各种通用象素模式的相互联系而成为具有更适于RLGR熵编码的符号分布的残差集。更具体地,这些DPCM预测模式如下模式0这是“原始”或非DPCM模式,其中单个象素不经任何减法直接进行编码。该模式对于不具MB上一致的好预测器的随机或“斑点”类型MB有用。
模式1在此DPCM模式中,在编码之前从其左边的紧邻象素减去象素值。当主边缘是水平走向时,该模式是有效的。
模式2在此DPCM模式中,从其上面的紧邻象素减去象素值。当主边缘是垂直走向时,该模式是有效的。
模式3在此DPCM模式中,从其左边和上面的邻象素的最小值,或者从从其左边和上面的邻象素的最大值减去象素值。该模式对穿过当前象素位置的斜对角边缘有用。
模式4在此DPCM模式中,从其上面和右上角的邻象素的平均值减去象素值。该模式对具有不同方向的斜对角边缘有用。
模式5在此DPCM模式中,从其左上角的邻象素减去象素值。该模式对例如图形内容中的对角带有用。
模式6在此DPCM模式中,调制器130从其左边的邻象素减去其上面和左上邻象素的差值的同一值。该模式对带状水平斜坡有用。
模式7在此DPCM模式中,调制器130减去左边和上面邻象素的平均值。它对在MB中占主导的对角边缘也有用。
DPCM调制器测试DPCM预测模式1到7的每一种(即除了非DPCM模式-模式0)从而可选择产生更多可压缩DPCM残差的那种DPCM模式。DPCM调制器应用相应的DPCM模式,并检查结果残差的符号分布。然后DPCM调制器检查哪一种预测模式产生了具有与RLGR熵编码的理想分布最接近分布的残差。DPCM调制器还检查该最接近分布是否与理想的零偏差、双边拉普拉斯分布充分接近。DPCM调制器选择带有宏块最接近理想分布的DPCM预测模式,除非它未符合充分阈值。否则,如果带有宏块最接近理想分布的DPCM预测模式不符合充分阈值,则该DPCM调制器选择非DPCM模式为缺省模式。
1.4平直MB模式编码如上所述,基于PLC编码器100还可用平直MB模式来编码MB。当DPCM模式应用于MB所导致的DPCM残差都为零时,使用平直MB模式。当测试DPCM模式以选择在MB上使用的DPCM模式时,DPCM调制器还检查当前所测试的DPCM模式是否产生MB的所有零DPCM残差。当确定DPCM模式产生了MB的所有零DPCM残差时,基于PLC的编码器100则用平直MB模式来编码MB-无需进一步测试DPCM模式。当用平直MB模式编码时,基于PLC的编码器100可仅以MB模式和DPCM模式(即跳过编码DPCM残差)来编码输出比特流中的MB。输出比特流中MB的平直MB模式和DPCM模式编码足以解码MB象素的值。因为未编码DPCM残差,平直MB模式产生用于编码MB的更大压缩效率。
1.5多种游程长度Golomb Rice(RLGR)并联环境再参看图1,使用RLGR熵编码器140中的RLGR编码对MB模式、DPCM模式、以及由DPCM调制器130所产生的DPCM残差进行熵编码。所示基于PLC编码器100中的RLGR熵编码器使用在H.Malvar,“Fast Progressive wavelet coding,”(“快速逐次浮现小波编码”)Proc.IEEE Data Compression Conference,Snowbird,UT,336-343页,1999年3-4月的文章中所述的游程长度Golomb Rice编码过程。该RLGR编码过程不是真正的一般熵编码器,诸如自适应算术编码器。RLGR作出假设大多数可能符号是零。因此,如果带有大多数可能符号不为零的数字串被提供给RLGR,RLGR编码将具较差的编码性能。如果该输入来自具有接近于拉普拉斯符号分布的源,则RLGR编码过程将很好地(很接近熵地)编码该数据,且在许多情形中它比自适应算术编码表现更好。在基于PLC的编码器100中,DPCM预测模式被设计用以产生RLGR效果最好的普通摄影和图形图像内容的带符号整数(对摄影和图形图像)的零偏差双边拉普拉斯分布。
所示基于PLC编码器中的RLGR熵编码器140对以下的每一个使用单独的RLGR关联环境a)MB模式(平直或非平直);b)DPCM模式;c)DPCM残差值(整数的零偏差双边拉普拉斯分布)。在每一个这些环境中,RLGR熵编码器执行二进制字符串的自适应游程长度/Golomb-Rice二进制编码,该二进制字符串由来自通过例如用于DPCM残差值关联环境的DPCM残差的独立关联环境所编码的符号的有效比特形成。对编码不同符号分布的多种RLGR关联环境的使用改进了熵编码性能。这是因为适应每一种单个分布及其特有的偏斜度是非常重要的。作为示例,MB模式更可能不都是平直的。相应地,其分布也可能偏斜于平直情形。但是,如果内容是图形而不是摄影图像,则会不同。提供特定的RLGR关联环境使基于PLC编码器100中的RLGR熵编码器能以更高效率适应这种单峰分布。在基于PLC编码器的可选实现中,可使用更多或更少的RLGR关联环境。在这种实现中使用编码DPCM残差的附加单独RLGR关联环境可提供更大的熵编码增益并防止关联环境变弱,但是在所示实现中三种单独关联环境可因其实用性而使用。
当由RLGR熵编码器进行熵编码之后,比特流多路复用器150将MB的RLGR编码数据组合成输出比特流195。在使用片编码的实现中,比特流多路复用器将经编码的MB组装或打包成片。
1.6伪码列表上述基于PLC编码器100中执行的PLC编码在图5所示的伪码列表500中归纳。在该伪码列表中,“ImageBand”输入参数表示来自色彩空间诸坐标之一(即Y、Co、或Cg)的图像数据。在图像到YcoCg色彩空间的色彩空间转换之后,调用该PLC编码过程。
2.PLC解码器现在参看图6,基于预测无损编码(PLC)的图像解码器600执行由基于PLC图像编码器100的PLC编码所产生的输出比特流195的解码。在该基于PLC图像解码器600中,比特流多路分解器610首先在比特流中分离出单个经编码MB、和该MB的经编码MB模式、DPCM模式、以及DPCM残差。比特流多路分解器向RLGR解码器620提供该分离数据。
RLGR解码器620解码每个MB的经RLGR编码的MB模式、DPCM模式、以及DPCM残差。该RLGR解码器620使用在H.Malvar,“Fast Progressive waveletcoding,”(“快速逐次浮现小波编码”)Proc.IEEE Data Compression Conference,Snowbird,UT,336-343页,1999年3-4月的文章中所述的RLGR解码过程。然后RLGR解码器620向DPCM解调器630提供经解码数据。
DPCM解调器630在用于该MB的DPCM预测模式的DPCM残差上执行逆过程,因而恢复了MB数据。对于以平直MB模式编码的MB而言,该DPCM解调器630对经解码DPCM预测模式的所有零残差执行逆过程。
在应用了逆向DPCM预测后,图像重建器640重新组合MB以重建该图像。然后色彩空间转换器650执行YCoCg色彩空间的逆转换,以将该图像数据转换回RGB图像。在某些实现中,可略去该转换,而图像则仍为YCoCg色彩空间格式。
3.计算环境所述基于PLC编码器100和/或解码器600(PLC编/解码器)可在任意各种图像和视频处理装置和计算装置上实现,包括各种构成要素的计算机(个人、工作站、服务器、手持式、膝上型、笔记本、或其它可移动计算机)、分布式计算网络和Web服务、以及图像和视频记录器/播放器/接收器/查看器,作为一些一般示例。基于PLC编/解码器可在硬件电路中实现,也可在计算机或其它计算环境中执行的编/解码器软件780中实现,如图7所示。
图7示出了所述技术可在其中实现的计算环境700(例如计算机)中适当图像/视频处理装置的一般化示例。该环境700并非旨在提出对本发明使用或功能性范围的任何限制,因为本发明可在不同的通用或专用图像/视频处理环境中实现。
参照图7,计算环境700包括至少有关处理单元710和存储器720。在图7中,最基本配置730包括在虚线中。处理单元710执行计算机可执行指令,并可以是真实或虚拟的处理器。在多处理系统中,多处理单元执行计算机可执行指令以增加处理功效。存储器720可以是易失性存储器(例如寄存器、高速缓存、RAM)、非易失性存储器(例如ROM、EEPROM、闪存等等)、或者两者的某些组合。存储器720存储实现基于PLC编/解码器的软件780。
计算环境可具有附加特征。例如,计算环境700包括存储740、一个或多个输入设备750、一个或多个输出设备760、以及一个或多个通信连接770。诸如总线、控制器、或网络的相互连接机制(未示出)把计算环境700的组件相互连接起来。通常,操作系统软件(未示出)为在计算环境700中执行的其它软件提供操作环境,并协调计算环境700组件的动作。
存储740可以是可移动或不可移动的,并包括磁盘、磁带或磁卡、CD-ROM、CD-RW、DVD、或可用以存储信息并可在计算环境700中访问的任何其它介质。存储740存储基于PLC的编/解码器软件780的指令。
输入设备750(例如作为设备连接结构100中控制点操作的设备)可以是诸如键盘、鼠标、笔、或跟踪球、语音输入设备、扫描设备的触摸式输入装置,或是向计算环境700提供输入的另一设备。对于音频,输入装置750可以是声卡或以模拟或数字形式接收音频输入的类似装置,或者是向计算环境提供音频样本的CD-ROM读取器。输出设备760可以是显示器、打印机、扬声器、CD刻录机、或者向计算环境700提供输出的另一设备。
通信连接770使能经通信介质与另一计算实体的通信。通信介质传信息,诸如计算机可执行指令、音频/视频或其它介质信息、或已调制数据信号的其它数据。已调制数据信号是一个或多个其特征以在信号中编码信息的方式设定或改变的信号。作为示例,而非限制,通信介质包括用电子、光学、RF、红外、声学或其它载体实现的有线或无线技术。
宏扩展处理和显示技术可在计算机可读介质的一般环境中进行描述。计算机可读介质是在计算环境中可访问的任意可用介质。作为示例,而非限制,对于计算环境700,计算机可读介质包括存储器270、存储740、通信介质、以及以上的任意组合。
在这里诸技术可在计算机可执行指令的一般环境中进行描述,诸如那些包括在程序模块中,在真实或虚拟目标处理器上计算环境中执行的指令。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、库、对象、类、组件、数据结构等等。程序模块的功能性可按各种实施例所需在程序模块之间进行组合或拆分。程序模块的计算机可执行指令可在本地或分布式计算环境中执行。
为了进行表达,详细说明书使用类似“确定”、“产生”、“调整”、以及“应用”来描述计算环境中的计算机操作。这些术语是对计算机所执行操作的高度抽象,且不应与人所执行的动作相混肴。对应于这些术语的真正计算机操作可取决于实现而变化。
由于本发明原理可应用的许多可能实施例,我们声明本发明所有实施例可出自以下权利要求书和等效方案的范围和精神。
权利要求
1.一种用于图像和视频介质的无损编码的方法,其特征在于,包括把输入图像数据拆分成块部分;对于单个所述块部分,选择多种可用差分脉冲码调制(DPCM)预测模式之一以应用于所述块部分,从而由于所述可用DPCM预测模式产生更接近于熵编码器的优化符号分布。将所述选定DPCM预测模式应用于所述块部分;以及熵编码所述块部分的DPCM残差。
2.如权利要求1所述的方法,其特征在于,还包括将所述输入图像数据转换成YCoCg色彩空间格式。
3.如权利要求1所述的方法,其特征在于,所述熵编码是游程长度GolombRice编码。
4.如权利要求1所述的方法,其特征在于,还包括使用游程长度Golomb Rice编码对为所述块部分选定的DPCM预测模式进行编码。
5.如权利要求1所述的方法,其特征在于,还包括用单独的游程长度GolombRice编码关联环境来编码所述DPCM预测模式和DPCM残差。
6.如权利要求1所述的方法,其特征在于,还包括确定所述选定DPCM预测模式对所述块部分的应用是否产生全零值的DPCM残差;以及编码所述块部分是平直的指示,而不是熵编码所述块部分的DPCM残差。
7.如权利要求1所述的方法,其特征在于,选择所述DPCM预测模式包括确定产生更接近于熵编码最优符号分布的所述DPCM预测模式是否充分接近于所述熵编码的最优符号分布;以及如果不够充分接近,在所述熵编码之前将非DPCM应用于所述宏块。
8.如权利要求1所述的方法,其特征在于,所述DPCM预测模式包括被设计用以产生块部分熵编码的最优分布的模式,所述块部分的图像内容主要是水平主边缘、垂直主边缘、斜对角边缘、带、以及带状水平斜坡。
9.如权利要求1所述的方法,其特征在于,所述DPCM预测模式包括第一模式,其中从其左边相邻象素减去一象素值;第二模式,其中从其上面相邻象素减去一象素值;第三模式,其中从其左边或上面相邻象素的最小或最大值减去一象素值;第四模式,其中从其上面或右上相邻象素的平均值减去一象素值;第五模式,其中从其左上相邻象素减去一象素值;第六模式,其中从其左边相邻象素减去象素的左边和左上相邻象素之间的差值;第七模式,其中从其左边和上面相邻象素的平均值减去象素值。
10.一种提供图像或视频介质内容的预测无损编码的介质系统,其特征在于,所述系统包括一宏块拆分过程,用于把输入图像数据分割成宏块;一多模式差分脉冲码调制(DPCM)过程,其在所述输入图像数据的单个宏块部分上操作,以选择产生所述宏块的更接近于最优游程长度Golomb Rice熵编码分布的多种DPCM预测模式之一,并将所述选择的DPCM预测模式应用于所述宏块;以及一熵编码过程,其用于执行所述宏块的DPCM残差的游程长度Golomb-Rice编码。
11.如权利要求10所述的介质系统,其特征在于,还包括一色彩空间转换过程,其用于在编码之前将所述输入图像数据转换成YCoCg色彩空间。
12.如权利要求10所述的介质系统,其特征在于,所述DPCM预测模式包括被设计用以产生接近于宏块的最优RLGR熵编码分布的模式,所述图像内容主要是水平主边缘、垂直主边缘、斜对角边缘、带、以及带状水平斜坡。
13.如权利要求10所述的介质系统,其特征在于,所述DPCM预测模式包括第一模式,其中从其左边相邻象素减去一象素值;第二模式,其中从其上面相邻象素减去一象素值;第三模式,其中从其左边或上面相邻象素的最小或最大值减去一象素值;第四模式,其中从其上面和右上相邻象素的平均值减去一象素值;第五模式,其中从其左上相邻象素减去一象素值;第六模式,其中从其左边相邻象素减去象素的左边和左上相邻象素之间的差值;第七模式,其中从其左边和上面相邻象素的平均值减去一象素值。
14.一种具有存储其上的计算机可执行程序指令的计算机可读存储介质,所述指令在计算机介质处理系统中的执行上可操作以执行编码图像或视频数据的方法,其特征在于,所述方法包括把图像数据转换成YCoCg色彩空间格式;把所述图像数据拆分成宏块;对于所述数据图像的宏块,从可用的DPCM预测模式组中确定哪种模式产生最接近于RLGR编码最优分布的残差;如果这种经确定DPCM预测模式产生了其分布充分接近所述最优分布的残差,将所述DPCM预测模式应用于所述宏块;以及对所述宏块的残差进行RLGR熵编码。
15.如权利要求14所述的计算机可读存储介质,其特征在于,所述方法还包括确定所述经确定DPCM预测模式在宏块中的应用是否产生了平直残差;以及如果是,则不对这种宏块的所述残差进行RLGR熵编码,而按平直宏块模式指示来编码所述宏块。
16.如权利要求15所述的计算机可读存储介质,其特征在于,所述方法还包括使用与RLGR熵编码所述残差分离的RLGR编码关联环境,来RLGR熵编码所述宏块模式指示。
17.如权利要求15所述的计算机可读存储介质,其特征在于,所述方法还包括确定产生最接近于所述最优符号分布的残差分布的所述DPCM预测模式是否充分接近于所述最优分布;以及如果不够充分接近,不将所述DPCM预测模式应用于所述宏块,对所述宏块进行RLGR熵编码。
18.一种用于解码图像或视频的预测无损编码数据的方法,其特征在于,包括对于使用单独RLGR编码关联环境的多个宏块的每一个,对宏块模式、DPCM预测模式以及DPCM残差进行RLGR熵解码;当一个宏块的所述宏块模式是平直宏块模式时,使用DPCM解调来解码所述宏块的象素,所述DPCM解调是全零残差的所述经RLGR解码的DPCM预测模式的逆;否则,当所述宏块的DPCM预测模式是非DPCM预测模式时,不经DPCM解调来解码所述宏块的象素;否则,使用DPCM解调来解调所述经RLGR解码的DPCM残差,所述DPCM解调是所述经RLGR解码的DPCM预测模式的逆;以及组装所述宏块以形成经解码的图像数据。
19.如权利要求18所述的方法,其特征在于,包括将所述经解码图像数据从YCoCg色彩空间转换成可显示的色彩空间格式。
20.一种预测-无损经编码图像或视频的解码器,其特征在于,包括一游程长度Golomb-Rice(RLGR)熵解码器,其操作用以解码宏块的经RLGR编码的DPCM残差和DPCM预测模式;一DPCM解调器,其用于将所述DPCM预测模式的逆应用于所述DPCM残差;以及一宏块重组器,其用于把所述宏块和其它经解码宏块组合起来以形成经重建图像的数据。
21.如权利要求20所述的预测-无损经编码图像或视频解码器,其特征在于,包括一逆向YCoCg转换器,其用于把所述重建图像从YCoCg色彩空间转换成适于显示所述图像的色彩空间。
全文摘要
预测无损编码提供对图像和视频数据中摄影图像和图形内容的有效无损压缩。为了现有图像和视频编/解码器的兼容性,预测无损编码可在宏块基础上操作。预测无损编码选择多种可用差分脉冲码调制(DPCM)模式之一并将其应用于每个独立宏块,以产生具有更接近于游程长度Golomb Rice RLGR熵编码的最优分布的DPCM残差。即使有摄影图像和图形图像内容的差异特征,它还是允许进行有效的无损熵编码。
文档编号G06T1/00GK1684495SQ20051006663
公开日2005年10月19日 申请日期2005年4月15日 优先权日2004年4月15日
发明者K·慕克吉 申请人:微软公司