专利名称:图像压缩的制作方法
技术领域:
本发明涉及图像压缩技术。在此整个申请中使用的术语〃图像〃是指与运动图像相对的静止画面。而且,一般说来,图像压缩技术专业的普通技术人员可将在此公开的该图像压缩技术用于压缩包含在与发送、处理、编辑、维护或任何其它用途的图像数据库中的图像。在此连接方式中,本申请的实用性不局限于任何特定的应用,并且本发明不局限于任何特定的应用。
通常,当一组图像被压缩时,使用一个无损或有损压缩方案单独地压缩每一分别的图像。像JPEG标准规定的一个图像压缩方案那样,使用利用较少的比特表示一个图像,以便从而实现压缩。
本发明的一个目的是提供对一组图像的进一步的压缩。为此目的,本发明提供一个用于压缩的方法与装置、一个发射机、一个编码数据流、一个存储介质、一个用于解压缩的方法与装置和在独立权利要求中定义的显示装置。从属权利要求中定义了有益的实施例。
概括地,本发明包含用于压缩一组图像或子图像的一个方法,包括步骤在图像或子图像组中指定至少一代表性的图像或子图像,在该图像或子图像组之内的全部其它图像或子图像都被指定为非代表性的图像或子图像;独立地编码该代表性的图像或子图像,并且使用该代表性的图像或子图像作为一个基准图像或子图像而预测编码该非代表性的图像或子图像的每一个。
当前没有已知的图像压缩技术尝试相对于另一图像而预测编码一图像,以便利用在图像中的冗余度,从而实现高水平的图像压缩。虽然通过参照其它画面而预测编码某些画面的运动编码被通常采用在对运动图像的压缩中,以便实现一个高水平的压缩,但是没有一个相似的技术应用到图像压缩。
根据上述的原因,当前图像压缩技术领域中存在的需要是不仅尝试利用在一个给定图像中的空间相关,而且利用不同图像之间的空间相关,以便实现显著的高水平的图像压缩。本发明通过使用基于内容的相似性(在一个图像数据库中使用类似图像的搜索与检索)以便有效率地压缩一个给定图像组,因此满足本专业对此的需要。
本发明进一步包含用于压缩一组图像的方法,包括步骤以图像相似性为基础、根据至少一图像相似性度量而把图像形成两个集群,在每一个集群中标识至少一代表性的图像,在每一个集群中的全部其它图像被标识为非代表性的图像,使用例如有损(例如JPEG)或无损编码算法独立地编码每一个集群的该代表性的图像;并且,使用来自该集群的该代表性的图像作为一个基准图像预测编码每一集群的每一个非代表性的图像。在最佳实施例,该图像相似性度量包括一个彩色相似性度量。但是,该图像相似性度量能够是任何适当的图像相似性度量或其组合例如彩色相似性度量、构造相似性度量、形状相似性度量、几何相似性度量和/或内容相似性度量。
本发明还包含用于压缩一组图像的方法,包括步骤把每一图像细分成两个或更多的分区;以图像相似性为基础、根据至少一相似性度量把对应于具有在其各自的图像中的对应位置的分区形成至少两个集群,以便从而产生针对对应于该分区的每一组的一个集群组;针对每一分区集群标识至少一个代表性的图像,在每一个集群之内的所有的其它图像被标识作为非代表性的图像;针对每一个集群在该代表性的图像中独立地编码一个参考分区;并且,使用在针对该集群的该代表性图像中的基准分区作为一个基准分区预测编码每一集群的非代表性的图像中的每一个分区。
在一个实施例中,本方法进一步包括细分步骤,针对每一集群,把每一非代表性图像细分成多个小目标数据块,并且把该代表性图像细分成具有与该目标数据块相同尺寸的多个较小的基准数据块,在其中针对每一集群执行该预测编码步骤针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与在该基准分区中的每一个相同尺寸的基准数据块的像素比较,并且产生针对每一作出的比较的误差度量值;针对每一个目标数据块确定所产生的误差度量值的任何值是否小于一个规定的最大门限值,并且如果是,标识构成对于该目标数据块的最佳匹配的相同尺寸基准数据块之一,和如果否,独立地编码该目标数据块。
在另一个实施例中,该预测编码是通过针对每一集群对在每一非代表性分区和针对该集群的基准分区之间的一个差值进行编码执行的。
本发明还包含用于压缩一组图像或子图像的一个方法,包括步骤在图像或子图像组中指定至少一代表性的图像或子图像,在该图像或子图像组之内的全部其它图像或子图像都被指定为非代表性的图像或子图像;独立地编码代表性子图像;并且,使用该代表性子图像作为一个基准子图像预测编码每一个非代表性的子图像。
本发明还包含用于压缩一组图像的方法,包括步骤把每一图像细分成两个或更多的分区;根据至少一个相似性度量,以图像相似性为基础把该分区形成至少两个集群;针对每一分区集群标识至少一个代表性的分区,在每一个集群之内的所有的其它分区被标识作为非代表性的分区;针对每一个集群独立地编码该代表性分区;并且,使用针对该集群的该代表性分区作为一个基准分区,预测编码每一集群的每一个非代表性的分区。在一个实施例中,本方法进一步包括细分步骤,针对每一集群,把每一非代表性分区细分成多个小目标数据块,并且把该基准分区细分成具有与该目标数据块相同尺寸的多个较小的基准数据块,在其中针对每一集群执行该预测编码步骤针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与在该基准分区中的每一个相同尺寸的基准数据块的像素比较,并且产生针对每一作出的比较的误差度量值;针对每一个目标数据块确定所产生的误差度量值的任何值是否小于一个规定的最大门限值,并且如果是,标识构成对于该目标数据块的最佳匹配的相同尺寸基准数据块之一,和如果否,独立地编码该目标数据块。
在另一个实施例中,该预测编码是通过针对每一集群对在每一非代表性分区和针对该集群的基准分区之间的一个差值进行编码执行的。
根据本发明的另一可选的方面,当一个特定目标图像或分区具有在其集群中的一个以上的基准图像或分区时,则最相似或至少最可能是最相似的该基准图像或分区之一,例如在用于该结点的集群树中的共用最接近共同上级结点的基准图像或分区之一被选择作为用于该特定目标图像或分区的基准图像或分区。
在一个当前最佳实施例中,本方法进一步包括步骤预先把每一个图像分区成多个彩色比较数据块;针对每一个图像的每一个彩色比较数据块计算一个标准直方图;并且在执行该分组和识别步骤中使用该计算的标准直方图。
在一个最佳实施例中,通过把该非代表性图像或子图像分区成多个像素的目标数据块,参考一个选择的基准图像或子图像而编码每一非代表性图像或子图像;针对每一个目标数据块,根据规定的搜索度量把该目标数据块的像素与在该基准图像或子图像中的每一个相同尺寸的基准数据块的像素比较,并且产生针对每一作出的比较的误差度量值;和,针对每一个目标数据块确定所产生的误差度量值的任何值是否小于一个规定的最大门限值,并且如果是,标识构成对于该目标数据块的最佳匹配的相同尺寸基准数据块之一,和如果否,独立地编码该目标数据块。
该编码数据的数据流还可以包括这样的编码数据,标识构成没有被独立编码的非代表图像每一个的分别目标数据块的最佳匹配的基准图像的基准数据块、标识每一个图像的非代表性的目标数据块的哪一个被独立地编码,以及进一步标识该图像组合的图像的哪一个是基准图像,以及哪一个是非代表性图像。另外,该预测编码步骤能够包括子步骤针对每一个没有独立编码的目标数据块,计算在构成其最佳匹配的目标数据块和基准数据块之间的一个差值,以便产生用于该没有独立编码的每一个目标数据块的余值,其中表示该计算余值的编码数据还可以被插入到该编码数据的数据流中。
本发明还包括实现本发明方法的一个装置。
从下面结合附图的详细描述,将容易地理解本发明的其它方面、特点和优点,其中
图1是示出结合本发明最佳实施例的图像压缩技术使用的分级集群算法构思的示意图;图2是示出根据本发明图像压缩技术的当前最佳实施例的从基准图像预测编码一个目标图像的的构思的示意图;图3示出根据本发明的一个发射机的实施例;
图4示出根据本发明一个存储装置的实施例,和图5示出根据本发明的一个显示装置的实施例。
根据彩色相似性形成图像的一个分级集群算法在序列号为09/102,474的未公开美国专利申请09/102,474(对应于PCT/IB99/01008,申请人的案号PHN 16.961)中被描述,其标题是“图像检索系统”。假定一组图像输入,此分级集群算法产生输出一组集群。在每一集群之内的图像相对于所在其中的空间分布彼此类似。在上述引用的专利申请中,此技术被使用在图像检索系统中用于在一个图像数据库中搜索与检索相似的图像,查找〃看上去〃类似的一个查询图像。此分级集群算法还用于从每一集群中选择代表性的图像。
一般说来,上述分级群集算法的工人是通过把每一个图像成多个彩色比较分区、然后计算针对每一图像的彩色比较分区的一个标准直方图实现的。如此计算的标准直方图被随后用于把图像形成最佳集群,并且然后针对每一集群选择一个或者多个代表性图像。本发明的最佳实施例采用的分级群集算法的细节可以参考上述的专利申请了解。但是,应该清楚地理解在广义上本发明不局限于这种情况,以便使用任何图像分组或集群方案。
图1描述了在上述参考的申请PCT/IB99/01008中公开的分级群集技术相对于编号1到8的一组八个图像情况的工作情况。首先针对每一图像计算彩色直方图。其次,使用该彩色直方图计算全部图像的相似性。第三,具有最接近相似性的图像被分组,例如图像2和4被分组以便形成一个集群树的结点10。重复此过程直到达到该集群树的根节点。在图1描述的情况中,在此分级群集处理的最终,八个图像被集群成两个组,一个组具有五个图像(图像编号1-5),而另一组具有三个图像(图像编号6-8)。对于第一集群,代表性图像是2和5,而对于第二集群,代表性图像是7。这些代表性的图像在图1中被阴影示出。由于集群处理的特性,每一集群具有一个相关的集群树。不同于示出的情况,该代表性图像的数目通常是大约集群中的图像总数的10-20%。
从集群的理论能够推知,在一个集群内部的图像彼此类似。因此,不尝试独立地压缩这些图像,而是谨慎地利用在图像之间的相似性以便改进图像压缩效率。更具体地说,根据本发明最佳实施例的图像压缩方案包括下列步骤
1.根据其彩色内容相似性把一套给定图像组成集群,并且针对每一集群标识/指定至少一个代表性的图像,在每一集群中的所有的其余图像被指定为非代表性的图像。
2.在每一集群中,使用具有很高逼真度的一个少损图像编码技术或有损编码技术压缩该代表图像。例如此过程可以利用对于有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
3.在每一集群中,使用该代表性的图像作为基准图像编码剩余部分的图像(即非代表性图像)。为了编码一个给定的非代表性图像(在下文称之为〃目标图像〃),首先把该目标图像分解成许多目标数据块。例如,该目标数据块可以是8×8或16×16的像素数据块。针对在该目标图像中的每一目标数据块,在该基准图像中搜索一个相似数据块。一旦发现这种基准数据块,仅编码在基准图像中的基准数据块和目标图像中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准图像中不存在相似的基准数据块,则以非预测(即与任何基准图像无关的独立方式)编码该目标数据块。
一般说来,如本专业技术人员熟知的那样,目标图像中的每一目标数据块能够与该基准图像之内对应位置的当前目标数据块的规定的水平和垂直搜索范围之内定位的一个基准图像的全部可能的相同尺寸基准数据块比较,以便根据一个指定的搜索度量(即匹配准则)确定在构成该最佳匹配的规定的水平和纵向搜索范围之内哪个是该相同尺寸的基准数据块。执行这种搜索的硬件和/或软件被通常称为〃搜索引擎〃,并且存在若干用于确定该匹配质量的熟知判据(即用于每一比较的误差度量)。
在这些判据(即搜索度量)当中最熟知的是最小绝对误差(MAE),其中的搜索度量包括在目标数据块中的每一个像素与在基准数据块中的对应像素的差值的绝对值的取和;以及最小平方误差(MSE),其中该搜索度量包括上述像素差值的平方的取和。不论那种状况,具有该对应取和的最小值的匹配被选择作为在规定搜索范围之内的最佳匹配,并且其相对于该当前目标数据块的水平和垂直位置因此构成一个最佳匹配矢量,能够使用DCT或其它适当的编码技术被编码,以便实现更进一步的图像压缩。然而如果该产生的最小取和(即误差度量)被认为太大,则能够作出判定说明没有针对当前目标数据块的适当匹配,并且在此情况中的目标数据块能够被与在该基准图像中的任何基准数据块无关地编码。为本发明的目的,可用上述两个判据的任一个或任何其它适当的判据。
继续参考图1,根据本发明第一可选实施例的图像压缩方案包括下面步骤1.把在给定图像组之内的每一图像细分成两个或更多的分区(即〃子图像〃),例如256×256像素图像能够被细分为十六个64×64像素分区。
2.根据分区的彩色内容的相似性(例如根据该分区的彩色直方图该相似性)把对应分区组成不同的集群,例如以细分为16个不同分区的图像获得16个不同的集群组合(并且每一集群组合可以包含两个或更多的集群)。例如,如果该分区从图像的左上方到右下方地1至16进行编号,然后编号为1的全部分区被组成一个或者多个集群,然后然后编号为2的全部分区被组成一个或者多个集群,等等。一般说来,编号n的全部分区(在下文称作分区〃n〃,其中n=1至16)被组成集群产生总数为n的集群组合,其中每一集群的组合能够包含两个或多个集群。
3.针对每一分区,标识/指定至少一个代表性的图像,在每一个分区集群中的所有的其它图像被指定为非代表性的图像。
4.把每一图像的每一分区细分成多个较小的数据块(例如8×8或16×16像素数据块)以便促进该预测编码处理。在每一分区集群中,使用具有很高逼真度的无损图像编码技术或有损编码技术,针对该集群的代表性图像中的基准分区被独立地码(压缩)。例如此过程可以利用针对有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
5.在每一分区集群中,针对在一个非代表性图像中的每一目标数据块,在针对该集群的该代表性图像的对应(基准)分区中搜索一个相似的数据块。一旦发现这种基准数据块,仅编码在基准分区中的基准数据块和目标分区中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准图像的对应该基准分区中不存在相似的基准数据块,则以非预测(即与任何基准分区无关的独立方式)编码该目标数据块。例如参考图1,假定图像5被选择作为用于包含图像2的分区1的集群的代表性图像,并且图像4被选择作为用于包含图像2的分区2的集群的代表性图像。则针对图像2的分区1中的目标数据块,从代表性图像5的分区1中选择该基准数据块,以及针对图像2的分区2中的目标数据块,从代表性图像4的分区2中选择该基准数据块。
一般说来,如本专业技术人员熟知的那样,目标分区中的每一目标数据块能够与该基准分区之内对应位置的当前目标数据块的规定的水平和垂直搜索范围之内定位的一个基准分区的全部可能的相同尺寸基准数据块比较,以便根据一个指定的搜索度量(即匹配准则)确定在构成该最佳匹配的规定的水平和纵向搜索范围之内哪个是该相同尺寸的基准数据块。
继续参考图1,根据本发明的第二可选实施例的图像压缩方案包括下面步骤1.把在给定图像组之内的每一图像细分成两个或更多的分区(即〃子图像〃),例如256×256像素图像能够被细分为十六个64×64像素分区。
2.与在分别图像之内的位置无关,根据彩色内容的相似性(例如根据该分区的彩色直方图的相似性)把全部分区组成不同的集群。因此,与第一可选实施例的获得对应分区的每一组组合的集群的不同组合相反,仅获得分区的不同集群。
3.针对分区的每一集群标识/指定至少一个代表性的分区,在分区的每一个集群中的所有的其它分区被指定作为非代表性分区。
4.把每一图像的每一分区细分成多个较小的数据块(例如8×8或16×16像素数据块)以便促进该预测编码处理。在每一分区集群中,使用具有很高逼真度的无损图像编码技术或有损编码技术,针对该集群的基准分区被独立地码(压缩)。例如此过程可以利用针对有损情况的一个JPEG编码方案实现。但是,该采用的特定的编码方案不限制本发明。
5.在每一分区集群中,针对在一个非代表性分区中的每一目标数据块,在针对该集群的基准分区中搜索一个相似的数据块。一旦发现这种基准数据块,仅编码在基准分区中的基准数据块和目标分区中的目标数据块之间的差值。使用熟知的DCT(离散余弦变换)和VLC(可变长度码)编码技术编码该剩余部分(在目标数据块和基准数据块之间的差值)。针对一个给定的目标数据块,如果在该基准分区中不存在相似的基准数据块,则非预测地(即与任何基准分区无关的独立方式)编码该目标数据块。
根据本发明的再另一可选实施例,步骤(4)(即,细分每一分区的步骤成多个将)封根据本发明另一可选实施例,上述第一和第二可选实施例的每一个中的步骤(4)(即把每一分区细分成多个数据块的步骤)能够被删除,从而能够通过直接编码在目标和基准分区之间的差,而不是逐个数据块地搜索最佳匹配而执行步骤(5)(即预测编码步骤)。当然,该技术要求在该集群过程中的该图像的更细的分区,以便实现一个给定的图像压缩质量,这将需要在前端承担附加计算的额外开销;但是,由删除在后端针对一个最佳匹配的逐个数据块的搜索的必要性,删除与此处理相关的计算的额外开销。根据特定应用的不同,计算的额外开销、图像压缩质量、费用、复杂性等取舍将随之改变,例如,在其它考虑和因素当中,根据象该图像的类型以及相似程度的图像数据库的特性以及数据库的尺寸改变。
相对于上述本发明的任何实施例之一,当在一个特定目标图像或分区具有在其集群中的一个以上基准图像或分区时,则能够以任何适当的方式针对特定的目标图像或分区选择该基准图像或单个分区之一。例如,参考图1能够使用的益处是由于集群处理的特性,每一集群将具有一个集群树,从而提供一个便利方式,识别在该集群之内的哪个基准图像或分区最类似于或统计地最类似于(即可能最相似)该特定的非代表性(目标)图像或分区。
为了更具体地说明该要点,考虑图1中的编码图像4的情况,因此必须针对图像4中的每一目标数据块找到〃最佳匹配〃基准数据块。从用于图像4所属的集群的集群树,能够推知图像2和4彼此之间要比图像4和5更类似,因为它们共用一个其同的先节点(结点10),它是比图像4和5共用的共同先节点(结点14)更接近的结点(它是在图像5接合在该集群之前,该图像2和4被集群在一起的确切原因)。因此,根据本发明的附加可选方面,在该预测编码处理过程中,图像2能够被选择作为用于图像4的单个基准图像。一般说来,根据本发明的附加可选方面,当一个特定目标图像或分区具有在其集群中的一个以上的基准图像或分区时,则最相似或至少最可能是最相似的该基准图像或分区之一,例如在用于该结点的集群树中的共用最接近共同上级结点的基准图像或分区之一被选择作为用于该特定目标图像或分区的基准图像或分区。
图2示意地描述本发明图像压缩方法的当前最佳实施例,其中使用来自基准图像2的基准数据块RB2编码预测在目标图像4中的第一目标数据块TB1,并且使用来自基准图像5的基准数据块RB5编码预测在目标图像4中的第一目标数据块TB2。
因此,本发明的图像压缩/编码方案不仅通过使用DCT编码技术利用在一个给定图像中的空间冗余度,而且通过根据彩色相似性把图像组成集群然后使用预测编码技术而利用在图像当中的冗余度,以便进一步压缩图像数据。因为其考虑了图像之间的相似性,所以此方案将提供一个高压缩比率(在全部图像上的平均)用于满足要求的SNR或视觉质量。
用于解码根据本发明当前最佳实施例的上述图像压缩方法编码的图像的过程对于基准和非基准图像来说是不同的。通过执行该基准图像的单独数据块的可变长度解码和反向DCT直接地解码一个基准图像。一个非基准图像以两个步骤解码。为了解码在非基准图像中的每一个数据块,首先解码该基准图像之一中的对应基准数据块,随后解码在该目标数据块中的余值。把基准数据块的值和解码的余值相加在一起,以便给出该目标数据块的实际值。
图3示出根据本发明的一个发射机10的实施例,包括用于获得一组静止图像1,…,8的装置11,例如一摄像机或某些接收装置。发射机10还包括用于压缩该组静止图像的装置12。该装置包括装置13,用于标识如上所述方式中的一个代表性图像或图像分区。标识装置13最好把图像组化分成集群组合,同时标识用于每一集群的一个代表性图像。该代表图像被在一个独立编码装置15中编码。其它图像被标识作为非代表性图像。利用代表图像作为基准图像,该非代表图像被在预测编码装置14中预测编码。该基准图像也可以是该独立编码的代表性图像的一个重建,而不是该非编码的代表性图像。进一步,可以使用一个独立编码的代表图像作为一个基准图像而在另一域(例如频域)中执行预测编码。参考使用在图1实例中的编号,通过该装置压缩一组静止图像1,…,8。在标识装置13中,图像被分组为集群,并且图像2、5和7被标识为代表性图像。图像2,5,7被独立地编码。其它图像1,3,4,6,8被标识为非代表性图像并且被预测编码,从而图像1,3,4以图像2和5作为基准图像而被编码,并且图像6和8通过使用图像7为基准图像而被编码。产生的压缩代表性图像2*,5*,7*以及压缩非代表性图像1*,3*,4*,6*,8*在一个多路复用器16中被多路复用,以便构成一组压缩图像1*,…,8*,作为一个编码数据的数据流{1*,…,8*}被发送出去。
图4示出类似于图3的一个实施例20,被设计用于在一个存储介质17上存储表示一组压缩静止图像{1*,…,8*}’。多路复用器16’已经被应用来实现对存储介质17的适当的格式化。
图5示出根据本发明的一个显示装置30的实施例,包括装置31,用于接收一组压缩的静止图像1*,…8*,例如存在于编码数据的数据流{1*,…,8*}中的一组压缩静止图像,由如图3所示的发射机10发送,或从如图4所示存储介质17获得该压缩静止图像。显示装置还包括用于解压缩该组合的压缩图像1*,…8*的装置32和显示单元33。该解压缩装置32包括用于标识该压缩静止图像1*,…8*的组合中的代表性图像*,7*(或图像分区)的装置34。该代表图像2*,5*,7*被在解码装置36中独立地解码以便获得解压缩静止图像2,5,7。解码的代表性图像2,5,7最好被使用作为基准图像,在预测解码装置35中获得解压缩的非代表性图像1,3,4,6,8。解压缩的图像1……8在用于组合的装置37中组合,以便显示在显示单元33上。该静止图像1,…,8可以显示成一个组合画面或可以执行选择。
虽然在此之前已经详细描述了本发明的最佳和可选实施例,但是应该清楚地理解,本专业的技术人员在所附的权利要求书定义的本发明基本构思指教的范围中能够进行许多变化和/或修改。
例如,虽然上述本发明的实施例的每一个都采用使用一种彩色相似性度量的一个聚类算法,以便测量在不同图像之间的相似性,并且把该图像(或分区/子图像)分组成集群,但是本领域技术人员将理解,任何其它的适当图像或子图像分组或聚类算法和/或图像相似性度量都可以选择或附加使用在任何适当的组合中。
例如,该图像相似性度量能够是任何适当的图像相似性度量或其组合例如彩色相似性度量、构造相似性度量、形状相似性度量、几何相似性度量和/或内容相似性度量,都是相关专业中熟知的。而且,应该认识到,虽然上述本发明的实施例的每一个都采用一个聚类算法以便把图像或子图像分组成不同集群,并且随后选择在每一集群之内的一个代表图像或子图像用于预测编码目的,但是本发明在广义而言不要求任何这种图像或子图像的分组或集群,即使在许多应用中这种技术将实现改进图像压缩效率。
概括地,本发明包含用于压缩一组图像或子图像的一个方法,包括步骤在图像或子图像组中指定至少一代表性的图像或子图像,在该图像或子图像组之内的全部其它图像或子图像都被指定为非代表性的图像或子图像;独立地编码代表图像或子图像;并且,使用该代表性图像或子图像作为一个基准图像或子图像预测编码每一个非代表性的图像或子图像。就此而言,在广义上说,图像或子图像被组织、分组、排列或集群的方式、以及该代表性图像或子图像的选择方式不受本发明的限制。
在权利要求书中,在圆括号之间的任何标号不应解释为对该权利要求的限制。单词〃包括〃不排除在权利要求中所列出之外的另一单元或步骤的存在。本发明能够利用若干不同的单元硬件实现以及利用适当的程序控制计算机实现。在装置权利要求列举的若干装置中,若干这些装置能够由同一个硬件项实现。
权利要求
1.一种压缩(12)一组静止图像(1,…8)的方法,该方法包括步骤在静止图像组(1,…,8)中标识(13)至少一个代表性图像(2,5,7),把该组静止图像之内的其它静止图像(1,3,4,6,8)标识为非代表性图像;独立地编码(15)该至少一个代表性图像(2,5,7);以及使用至少一个代表性图像(2,5,7)作为基准图像,预测编码(14)每一个非代表性的图像(1,3,4,6,8)。
2.如权利要求1的方法,还包括步骤根据至少一个相似性度量,以图像相似性为基础,把静止图像(1,…,8)分组(13)成至少两个集群;该标识(13)步骤包括标识在每一个集群中的至少一个代表性图像(2,5,7);并且该独立编码(15)步骤包括独立地编码来自每一个集群的代表性图像(2,5,7);并且,该预测编码(14)的步骤包括使用来自集群的各代表性图像(2,5,7)作为一个基准图像预测对来自每一集群的每一个非代表性的图像(1,3,4,6,8)编码。
3.如权利要求1的方法,其中在该预测编码步骤(14)通过下列步骤参考一个选择的基准图像(2,5,7)编码每一个非代表性图像(1,3,4,6,8)把非代表图像分区成多个像素的目标数据块(TB1,TB2);针对每一个目标数据块(TB1,TB2),根据规定的搜索度量把该目标数据块(TB1,TB2)的像素与在基准图像中的每一个相同尺寸的基准数据块(RB2,RB5)的像素比较,并且产生针对每一作出的比较的误差度量值;针对每一个目标数据块(TB1,TB2)确定所产生的误差度量值的任何值是否小于一个规定的最大门限值;并且如果是,则该相同尺寸基准数据块(RB2,RB5)的哪一个构成针对该目标数据块(TB1,TB2),并且如果否,独立地编码该目标数据块(TB1,TB2)。
4.如权利要求3的方法,其中该预测编码步骤(14)进一步包括步骤产生标识基准图像(2,5,7)的基准数据块(RB2,RB5)的一个编码数据的数据流({1*,…,8*}),该基准图像(2,5,7)构成用于非独立编码的非代表图像(1,3,4,6,8)每一个的各目标数据块(TB1,TB2)的最佳匹配,标识每一个非代表性的图像(1,3,4,6,8)的目标数据块(TB1,TB2)的哪个被独立编码,以及进一步标识图像(1,…,8)的组合的图像的哪一个是基准图像(2,5,7),以及哪一个是非代表性图像(1,3,4,6,8)。
5.如权利要求3的方法,其中该预测编码子步骤(14)进一步包括子步骤针对没被独立编码的目标数据块(TB1,TB2)的每一个,计算在目标数据块(TB1,TB2)与构成其最佳匹配的基准数据块(RB2,RB5)之间的一个差值,以便产生针对每一个没被独立编码的目标数据块(TB1,TB2)的一个余值;以及编码在该计算步骤中产生的余值,以便产生表示该计算余值的一个编码数据的数据流({1*,…,8*})。
6.如权利要求2的方法,其中该相似性度量包括从一组相似性度量中选择的至少一个相似性度量,该相似性度量组包括彩色相似性度量、构造相似性度量、形状相似性度量、几何相似性度量以及内容相似性度量。
7.如权利要求2的方法,还包括步骤把每一个静止图像(1,…8)分区成多个彩色比较数据块;针对每一个图像的每一个彩色比较数据块计算一个标准直方图;并且在执行该分组和识别步骤中使用该计算的标准直方图。
8.如权利要求2的方法,还包括步骤把每一静止图像(1,…,8)细分成至少两个分区;该分组的步骤(13)包括,以图像相似性为基础、根据至少一相似性度量把对应于具有在其分别的图像中的对应位置的分区形成至少两个集群,以便从而产生针对对应于该分区的每一组的一个集群组;该标识(13)步骤包括,针对每一分区的集群标识至少一个代表性图像(2,5,7),在每一个集群之内的图像(1,3,4,6,8)被标识为非代表性图像;独立编码(15)的步骤包括,针对每一个集群对在至少一个代表性图像中的一个基准分区编码;以及预测编码(14)的步骤包括,使用在针对该集群的该代表性图像中的基准分区作为一个基准分区,对在该非代表性的图像(1,3,4,6,8)中的每一个分区编码。
9.如权利要求1的方法,还包括步骤把每一图像(1,…,8)细分(13)成至少两个分区;本方法压缩(12)该分区而不是压缩该静止图像(1,…,8)组合。
10.一种用于压缩一组静止图像(1,…,8)的装置(12),该装置包括装置(13),用于在静止图像组(1,…,8)中标识至少一个代表性图像(2,5,7),把该组静止图像之内的其它静止图像(1,3,4,6,8)标识为非代表性图像;装置(15),用于独立地对该至少一个代表性图像(2,5,7)编码;以及装置(14),使用至少一个代表性图像(2,5,7)作为基准图像,用于对每一个非代表性的图像(1,3,4,6,8)预测编码。
11.一个发射机(10)包括装置(12),用于压缩权利要求10中所要求的一组静止图像;以及装置(16),用于发射该压缩的静止图像组(1*,…,8*)。
12.一种表示一组压缩静止图像(1*,…,8*)的编码数据的数据流({1*,…,8*}),其中至少一个代表静止图像(2,5,7)已经独立地编码(15),并且一个非代表图像(1,3,4,6,8)已经以该至少一个代表图像(2,5,7)作为基准图像而预测编码(14)。
13.一个存储介质(17)其上存储有权利要求12要求的一组压缩静止图像(1*,…,8*)。
14.一种对一组压缩的静止图像(1*,…,8*)解压缩(32)的方法,该方法包括步骤在该组压缩的静止图像(1*,…,8*)中标识(34)至少一个代表性图像(2*,5*,7*),把该组压缩静止图像之内的全部其它静止图像(1*,3*,4*,6*,8*)标识为非代表性图像;独立地对该至少一个代表性图像(2*,5*,7*)解码(36);以及使用来至少一个代表性图像(2,5,7)作为基准图像,对每一个压缩的非代表性的图像(1*,3*,4*,6*,8*)预测解码(35)。
15.一种用于对一组压缩静止图像(1*,…,8*)解压缩的装置(32),该装置包括装置(34),用于在该组压缩的静止图像(1*,…,8*)中标识(34)至少一个代表性图像(2*,5*,7*),把该组压缩静止图像之内的全部其它静止图像(1*,3*,4*,6*,8*)标识为非代表性图像;装置(36),用于独立地对该至少一个代表性图像(2*,5*,7*)解码;并且装置(35),使用至少一个代表性图像(2,5,7)作为基准图像,以便对每一个压缩的非代表性的图像(1*,3*,4*,6*,8*)预测解码。
16.显示装置(30),包括如权利要求15中所要求的装置(32),用于对一组压缩的静止图像(1*,…,8*)解压缩;以及,一个显示单元(33),用于显示解压缩的静止图像(1,…,8)。
全文摘要
用于压缩一组静止图像的方法,包括步骤:以图像彩色内容相似性为基础、根据至少一图像相似性度量而把图像形成两个集群,在每一个集群中标识至少一代表性的图像,在每一个集群中的全部其它图像被标识为非代表性的图像,使用例如有损(例如JPEG)或无损编码算法独立地编码每一个集群的该代表性的图像;并且,使用来自该集群的该代表性的图像作为一个基准图像对每一集群的每一个非代表性的图像预测编码。
文档编号H04N7/26GK1310913SQ00800959
公开日2001年8月29日 申请日期2000年3月9日 优先权日1999年3月30日
发明者S·克里斯纳马查里 申请人:皇家菲利浦电子有限公司