图像编码方法及装置、图像解码方法及装置、程序的制作方法

文档序号：7761614阅读：264来源：国知局

专利名称：图像编码方法及装置、图像解码方法及装置、程序的制作方法
技术领域：
本发明涉及用来将图像数据高效率地削减并编码的图像编码方法及装置、图像解码方法及装置、以及程序。
背景技术：
以往，作为用于图像压缩的技术，已知有以MPEG(Moving PictureExperts Group/ 运动图片专家组)为代表的国际标准编码规格。并且，为了进一步削减图像数据，已知有通过同时采用编码装置的将在局部解码图像彼此间进行运动探索处理而生成的图像作为预测图像或解码图像使用的技术和已有的编码技术、使压缩率提高的技术(例如专利文献1)。更具体地讲，在专利文献1中，将通过已有的编码规格生成的预测图像、与在局部解码图像彼此中进行运动探索处理而生成的图像按照像素块切换而编码，由此使压缩效率提尚ο
[专利文献1]日本特开2008-1M015号公報
[非专利文献1]「改訂三版H.264/AVC教科書」、2009年1月1日発行、l· ^ R&D，第125《一夕(ζ今夕/卜夕口口y夕)
但是，在专利文献1所示那样的方法、即将通过已有的编码规格生成的预测图像与在解码图像彼此中进行运动探索处理而新生成的图像以块单位切换编码的方法中，除了已有的标志信息以外，新需要使用哪个图像的判断信息(标志信息)。因而，根据输入影像，由来于该判断信息的符号量变多，用专利文献1的方法压缩的情况与通过以往规格压缩的情况相比，压缩效率有可能下降。发明内容
本发明是鉴于这样的状况而做出的，目的是提供一种用来不需要新的判断信息而改善压缩效率的技术。
为了解决上述问题，本发明基于作为H. 264/AVC的编码信息(标志)已经规定的跳过模式(跳过的宏块)，选择通过已有的方法生成的已有预测图像(帧内或帧间预测图像)及通过插值预测生成的插值预测图像的某一方作为预测图像。
即，在本发明中，在将图像编码并传送时，首先生成对于编码对象图像的预测图像与编码对象图像的差分数据。并且，将差分数据编码，生成编码图像数据并输出。此外，在生成预测图像时，基于与编码对象图像建立了关联的跳过模式信息，将帧内或帧间预测图像与在局部解码图像彼此中执行运动探索而生成的插值预测图像的某一方作为预测图像输出。另外，当生成预测图像时，仅对编码对象图像是B图片、该B图片的跳过模式为有效的编码对象区域控制处理，以将上述插值预测图像作为上述预测图像输出。此外，在编码对象图像是P图片的情况下，控制处理，以将帧内或帧间预测图像作为预测图像输出。
另一方面，在将编码图像数据解码而生成解码图像数据的情况下，首先将编码图像数据进行句法解析，至少分离为解码对象的编码图像数据、和包括跳过模式信息的、解码所需要的编码信息。并且，将解码对象的编码图像数据解码，生成预测误差数据。进而，将预测误差数据与预测图像相加而生成解码图像。此外，在生成预测图像时，基于跳过模式信息，将帧内或帧间预测图像和在已有的解码图像彼此中执行运动探索而生成的插值预测图像的某一方作为预测图像输出。
本发明的其他特征通过以下用来实施本发明的实施方式及附图会变得清楚。
根据本发明，能够用比以往方式少的符号量记录并传送影像信号。

图1是表示本发明的实施方式的图像编码装置的概略结构的图。
图2是表示本发明的第1实施方式的编码部的详细结构的图。
图3是表示编码对象帧与前后的帧的关系的图。
图4是表示插值预测图像与已有预测图像混杂的情况的帧例的图。
图5是表示本发明的实施方式的解码装置的概略结构的图。
图6是用来说明解码处理的详细情况的流程图。
图7是用来说明作为变形例的解码处理的详细情况的流程图。
图8是表示本发明的第2实施方式的编码部的详细结构的图。
附图标记说明
101影像输入部
102区域分割部
103编码部
104可变长编码部
201、801减法器
202、802频率变换-量化部
203,503,803逆量化-逆频率变换部
204,504,804 加法器
205、505、805解码图像存储部
206、806帧内预测部
207,807帧间预测部
208,808帧内/帧间预测图像选择部
209、809、508解码图像运动探索部
210、509插值预测图像生成部
211、507插值预测图像决定部
501可变长解码部
502句法解析部
506预测图像生成部
510影像显示装置具体实施方式
本发明是关于不传送表示预测图像生成方式(将已有(帧内/帧间)预测图像和插值预测图像的哪个作为预测图像)的标志(判断信息)而实现编码的图像编码装置、以及将不使用该标志而编码的图像解码的图像解码装置的。特别是，本发明适合于依据例如 H. 264/AVC规格的编码及解码。
以下，参照附图对本发明的实施方式进行说明。但是，需要注意的是，本实施方式只不过是用来实现本发明的一例，并不限定本发明的技术范围。此外，在各图中对于共通的结构赋予相同的标号。
(1)第1实施方式
<图像编码装置的整体结构>
图1是表示本发明的实施方式的图像编码装置的概略结构的图。101是存储输入图像的影像输入部。102是将输入图像分割为编码对象区域(例如宏块单位或片单位)的区域分割部。103是将由区域分割部分割后的输入图像数据以编码单位进行编码、局部解码的编码部。104是将由编码部103编码后的数据进行可变长编码的可变长编码部。以下，对本实施方式的各处理部的详细情况进行叙述。
影像输入部101将输入图像以编码的顺序重新排列。顺序的重新排列根据图片是帧内预测图片(I图片)、单向预测图片(P图片)或双向预测图片(B图片)的某个来执行，由此将图像群(例如G0P)从显示顺序重新排列为编码顺序。
接着，区域分割部102将编码对象帧分割为编码对象区域。分割的区域的形状既可以是正方形、长方形区域那样的块单位(例如宏块单位或片单位)、也可以是watershed 法那样的方法提取的对象单位。此外，分割的区域的大小也可以是从16X16像素那样的在已有编码规格中采用的大小到64X64像素那样的较大的尺寸。将由区域分割部102分割后的图像发送给编码部103。
〈编码部的详细结构〉
图2是表示编码部103的更详细的结构的图。201是计算由区域分割部102分割后的图像与由插值预测图像决定部211决定的图像(是局部解码图像、对象编码区域的预测图像图像内/图像间预测图像及插值预测图像的某个)的差分、输出残差(预测误差数据)的差分器。
202是将差分器201输出的差分数据进行频率变换、将频率变换后的数据量化的频率变换-量化部。203是将频率变换-量化部202输出的数据逆量化之后，进行逆频率变换的逆量化-逆频率变换部。
204是将逆量化-逆频率变换部203输出的数据与由插值预测图像决定部211决定的图像相加、输出解码图像的加法器。205是将加法器204输出的数据(解码图像)存储的解码图像存储部。
209是在存储在解码图像存储部中的解码图像彼此中检测最近似的区域、输出运动信息的解码图像运动探索部。
206是根据与编码对象区域同一个帧内、该区域的周边像素生成预测图像的帧内预测部。207是从与编码对象区域属于的帧不同的帧内的区域检测接近于编码对象区域的图像的图像、使用由解码图像运动探索部209得到的运动信息执行运动补偿、生成预测图像的帧间预测部。208是选择帧内预测图像或帧间预测图像的中的编码效率较高者(例如选择符号量较少的预测方式)、将所选择的预测图像作为已有预测图像输出的、帧内/帧间预测图像选择部。
210是基于由解码图像运动探索部检测到的运动信息生成插值图像的插值预测图像生成部。211是决定使用由插值预测图像生成部210生成的图像(插值预测图像)或由帧内/帧间预测图像选择部208生成的预测图像(已有预测图像)的哪个的插值预测图像决定部。选择插值预测图像的是编码对象图像为B图片、编码对象区域的跳过模式为有效的情况。即，插值预测图像决定部211基于跳过模式信息，决定将已有预测图像及插值预测图像的哪个选择为应取与编码对象图像的差分的图像。
接着，对编码部103的各处理部的详细情况进行说明。频率变换-量化部202将编码对象图像与生成的预测图像的差分图像使用例如DCT(Discrete Cosine Transform) 或小波变换等进行频率变换，将频率变换后的系数量化。将量化后的数据发送给可变长编码部104及逆频率变换-逆量化部203。
逆量化-逆频率变换部203进行频率变换-量化部202进行的处理的逆处理。即，将输入到那里的数据进行逆量化，将逆量化后的数据通过逆DCT或逆小波变换等进行逆频率变换，生成相当于上述差分图像(预测误差数据)的图像。
此外，加法器204将相当于从逆量化-逆频率变换部203输出的差分图像的图像、与由插值预测图像决定部211决定的预测图像相加而生成局部解码图像。将生成的局部解码图像存储到解码图像存储部205中。
帧内预测部206使用存储在解码图像存储部205中的已解码的编码对象区域的周边像素生成预测图像。此外，帧间预测部207通过匹配处理检测输入的编码对象区域的图像数据与存储在解码图像存储部205中的已解码帧内的图像区域的图像数据最近似的区域，将该检测到的区域作为预测图像。
将存储在解码图像存储部205中的解码图像也发送给解码图像运动探索部209。解码图像运动探索部209执行以下的处理。
首先，如图3所示，使用编码对象帧η (η是表示编码顺序的自然数)的前后的帧内的像素fy (x-dx, y-dy)及fn+1 (x+dx, y+dy)，求出式(1)所示的预测误差绝对值和SADn(X， y)。这里，R是运动探索时的区域尺寸，m是用来提高运动探索的精度的偏移量。
式 权利要求
1.一种图像编码方法，将图像数据编码并输出编码图像数据，其特征在于，具备生成对于编码对象图像的预测图像与上述编码对象图像的差分数据的步骤；将上述差分数据编码而生成编码图像数据并输出的步骤；将上述编码图像数据解码并生成局部解码图像的步骤；以及使用上述局部解码图像生成上述预测图像的步骤，即基于与上述编码对象图像建立了关联的跳过模式信息，将帧内或帧间预测图像和在上述局部解码图像彼此中进行运动探索而生成的插值预测图像的一方作为上述预测图像而输出的步骤。
2.如权利要求1所述的图像编码方法，其特征在于，在生成上述预测图像的步骤中，仅对上述编码对象图像是B图片、并且该B图片的上述跳过模式为有效的编码对象区域，将上述插值预测图像作为上述预测图像输出。
3.如权利要求2所述的图像编码方法，其特征在于，在生成上述预测图像的步骤中，在上述编码对象图像是P图片的情况下，将上述帧内或帧间预测图像作为上述预测图像输出。
4.一种图像解码方法，将传送来的编码图像数据解码并输出解码图像数据，其特征在于，具备将上述编码图像数据进行句法解析、至少分离为解码对象的编码图像数据和包括跳过模式信息的、解码所需要的编码信息的步骤；将上述解码对象的编码图像数据解码并生成预测误差数据的步骤；将上述预测误差数据和预测图像相加而生成解码图像并输出的步骤；以及使用已有的解码图像生成上述预测图像的步骤，即基于上述跳过模式信息，将帧内或帧间预测图像和在上述已有的解码图像彼此中执行运动探索而生成的插值预测图像的一方作为上述预测图像而输出的步骤。
5.如权利要求4所述的图像解码方法，其特征在于，在生成上述预测图像的步骤中，仅对上述解码对象的编码图像数据是B图片、并且该 B图片的上述跳过模式为有效的解码对象区域，将上述插值预测图像作为上述预测图像输出ο
6.如权利要求5所述的图像解码方法，其特征在于，在生成上述预测图像的步骤中，在上述解码对象的编码图像数据是P图片的情况下，将上述帧内或帧间预测图像作为上述预测图像输出。
7.一种图像解码装置，将传送来的编码图像数据解码，输出解码图像数据，其特征在于，具备句法解析部，对上述编码图像数据进行句法解析，至少分离为解码对象的编码图像数据和包括跳过模式信息的、解码所需要的编码信息；解码处理部，将上述解码对象的编码图像数据解码，生成预测误差数据；解码图像生成部，将上述预测误差数据与预测图像相加，生成解码图像并输出；以及预测图像生成部，使用已有的解码图像生成上述预测图像；上述预测图像生成部基于上述跳过模式信息，将帧内或帧间预测图像和在上述已有的解码图像彼此中执行运动探索而生成的插值预测图像的一方作为上述预测图像输出。
8. 一种程序，其特征在于，用来使计算机作为权利要求7所述的图像解码装置发挥功能。
全文摘要
本发明提供一种图像编码方法及装置、图像解码方法及装置、程序。尤其提供一种用来不需要新的判断信息(编码标志信息)而改善压缩效率的技术。在按照解決手段编码对象区域的压缩中，基于跳过模式(不将编码对象区域的信息压缩而将以前的编码对象区域的信息复制的处理)，决定是使用通过已有的编码规格生成的已有预测图像、还是在解码图像彼此中进行运动探索处理而新生成的插值预测图像。
文档编号H04N7/26GK102036068SQ20101050180
公开日2011年4月27日申请日期2010年9月30日优先权日2009年10月2日
发明者中村克行, 小松佑人, 斋藤升平, 村上智一, 横山彻申请人:日立民用电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：小松佑人;横山彻;村上智一;斋藤升平;中村克行
技术所有人：日立民用电子株式会社
我是此专利的发明人

上一篇：多媒体广播组播业务状态报告的发送方法及系统的制作方法
上一篇：一种视频流分析方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。