编码/解码帧内预测模式的方法及装置与流程

文档序号：13169447阅读：249来源：国知局

相关申请的交叉应用本申请的权利要求范围要求如下申请的优先权：2011年6月28日递交的序列号为61/502,104，标题为「intramodecodingwithindependentdcandplanar」的美国临时案；2011年7月20日递交的序列号为61/509,901，标题为「intramodecodingforfixednumberofmostprobablemodes」的美国临时案；本发明也关于2011年8月4日递交的序列号为13/198,697，标题为「methodandapparatusofimprovedintralumapredictionmodecoding」的美国非临时案。在此合并参考该些临时案和非临时申请案的全部内容。本发明有关于编解码帧内预测模式的方法，更具体地，本发明有关于编码/解码帧内预测模式的方法及装置。
背景技术：
：运动补偿帧间编解码已广泛采用各种编码标准，例如mpeg-1/2/4和h.261/h.263/h.264/avc。尽管运动补偿帧间编解码可有效减少用于压缩视频的比特率，但仍然需要帧内模式(intramode)编解码来处理初始图像或周期性地插入i图像(intra-codedpicture,i-picture)(即帧内编解码图像)，周期性地插入i图像以允许对压缩视频数据的快速存取或减轻错误传播(propagation)。帧内预测采用图像帧内或图像区域帧内的空间关联性(spatialcorrelation)。为了进一步改进编码效率，开发的高效视频编解码标准(high-efficiencyvideocoding，hevc)标准广泛采用基于区块的空间预测。在hevc中，使用多个帧内预测模式以利用空间特性，且帧内预测模式的数量依赖于预测单元(predictionunit，pu)的区块大小。用于帧内预测的pu的大小可为64x64,32x32,16x16,8x8,或4x4。帧内预测模式的数量可多达35。选择用于每个区块的帧内预测模式需要被传输至解码器端以用于适当的解码。相应于帧内预测模式的端信息(sideinformation)是重要的，因此现已揭露多种预测编解码机制以改进编解码帧内模式的效率。相邻区块之间的帧内预测模式可能高度相关。因此，已被重构的来自相邻区块的帧内预测模式可用作用于当前区块的预测项(predictor)，其中，将当前区块的帧内预测模式与从当前区块的相邻区块的帧内模式中推导的一或两个最可能模式(mostprobablemode,mpm)进行比较。如果当前区块的帧内预测模式与一个最可能预测模式相同，传输单一位(single-bit)标志(flag)以指示该情形。当两个最可能模式可用时，传输索引(index)标志以指示使用哪个最可能模式。否则，传输单一位标志以及信息，其中，该信息指示剩余模式中的哪一个对应当前帧内模式。当一或两个最可能模式的使用已有助于改进编解码效率时，可通过使用更多最可能模式进一步改进编解码效率。在hm-3.0中，将上下文自适应(context-adaptive)熵(entropy)编解码机制运用于帧内编解码模式。而且，在帧内编解码模式中，将平面(planar)映射为模式索引2。因此，在最可能模式传送和剩余模式编解码方面，直流(dc)和平面模式共享一个模式索引(即2)、上下文自适应可变长编解码(contextadaptivevariable-lengthcoding,cavlc)中的一个码字(codeword)以及上下文自适应二进制算术编解码(contextadaptivebinaryarithmeticcoding,cabac)中的一个二进制表示(binarizedrepresentation)。传输一个附加标志以区分dc模式和平面模式。然而，dc和平面模式的依赖性编解码可能降低编解码性能。技术实现要素：本发明揭示一种区块的编码和解码帧内预测模式的方法及装置。在根据本发明的一个实施例中，该区块的编解码帧内预测模式的方法及装置包括接收对应于当前区块的当前帧内预测模式，并将当前帧内预测模式映射为索引，其中，dc和平面模式具有不同模式索引，以使在最可能模式信令和剩余模式编码期间区别对待dc和平面模式。然后，根据当前帧内预测模式和一个或多个最可能模式确定标志，其中一或多个最可能模式是从当前区块的相邻区块的帧内预测模式中推导的。如果当前帧内预测模式等于所述最可能模式中的任何一个，则该标志被设置。如果该标志没有被设置，使用变长编解码或算术编解码对当前帧内预测模式进行编码。本发明也揭露了对应的解码方法和装置。在根据本发明的另一个实施例中，该区块的编码帧内预测模式的方法及装置包括接收对应于当前区块的当前帧内预测模式，并根据当前帧内预测模式和两个或多个最可能模式确定标志。如果当前帧内预测模式等于该两个或多个最可能模式中的任何一个，则该标志被设置。如果该标志没有被设置，使用变长编解码对当前帧内预测模式进行编码。变长码的推导包括确定剩余模式结合，其中该剩余模式集合由不等于该两个或多个最可能模式中任何一个的模式集合的多个帧内预测模式组成。基于该剩余模式集合的排列顺序、统计或分布模型设计用于剩余模式集合的变长码。本发明提供的编码/解码帧内预测模式的方法可更有效地改进编码编码/解码性能。附图说明图1为考量用于hevc的帧内预测模式，包括各种角度模式、dc模式及平面模式。图2为两个相邻区块的示范示意图。图3为根据本发明一个实施例的对应于帧内预测模式编码的流程图。图4为根据本发明一个实施例的对应于帧内预测模式解码的流程图。图5为根据本发明另一个实施例的对应于帧内预测模式编码的流程图。图6为根据本发明另一个实施例的对应于帧内预测模式解码的流程图。具体实施方式帧内预测采用图像帧内或图像区域帧内的空间关联性。为了进一步改进编解码效率，开发的hevc标准广泛采用基于区块的空间预测。在hevc中，使用多个帧内预测模式以利用空间特性，且帧内预测模式的数量依赖于预测单元(predictionunit，pu)的区块大小。例如，发展中的hevc测量模式版本3.0(hm-3.0)允许的区块的帧内预测大小为64x64,32x32,16x16,8x8,以及4x4。对于每个区块大小，使用如表格1所示的多种帧内预测模式。对于32x32,16x16和8x8的区块大小，存在包括33种方向预测模式(如图1所示)、dc模式及平面模式的35种模式。对于4x4的区块大小，使用35种预测模式的子集合。在此揭露书中，帧内预测模式也简称为帧内模式，且将用于给定区块大小的可用帧内预测的集合称为预测模式集合或模式集合。相应地，用于32×32,16×16及8×8的区块大小的预测模式集合都包括35种帧内预测模式，且用于4x4的区块大小的预测模式集合包括18种帧内预测模式。在hm-3.0中，上下文自适应熵编解码分配一个模式索引，其中，将模式索引通过变长编解码编码为一个码字或通过算术编解码编码为一个二进制值表示，且其中，dc和平面共享最可能模式信令和剩余模式编解码。相应地，如表格1所示，存在用于32×32,16×16及8×8的区块大小的34种待编解码模式，用于4x4的区块大小的17种待编解码模式，以及用于64x64的区块大小的3种待编解码模式。表格1区块大小模式数目待编解码的模式64x644332x32353416x1635348x835344x41817根据本发明的一个实施例为dc模式和平面模式分配各自的索引(indice)、码字以及二进制表示。例如，dc(2),平面(34)，垂直(vertical)(0)以及水平(horizontal)(1)模式可分别映射为索引{0,1,2,3}。根据hm-3.0，相应于每个帧内预测模式的括号中的数字表示在帧内预测期间的模式数字分配。可将剩余模式映射为通过将hm-3.0中的各个模式数字加1得到的索引。因此，根据上述示范的模式索引映射可概括在表格2中。也可使用其他索引映射。例如，dc(2)，平面(34)，垂直(0)以及水平(1)模式可分别映射为索引{3,0,1,2}。根据本发明的一个实施例可将索引dc(2)，平面(34)，垂直(0)以及水平(1)映射为由0,1,2和3组成的模式索引组(group)的任意排列。可将剩余模式映射为通过将hm-3.0中的各个模式数字加1得到的索引。因此，根据上述示范的模式索引映射可概括在表格3中。表格2帧内模式映射索引dc(2)0平面(34)1垂直(0)2水平(1)3其他模式(3,…,33)其他模式+1(4,…,34)表格3帧内模式映射索引平面(34)0垂直(0)1水平(1)2dc(2)3其他模式(3,…,33)其他模式+1(4,…,34)相邻区块之间的帧内预测模式可能高度相关。因此，来自相邻区块的帧内预测模式可用作用于当前区块的预测项。在hevc(例如hm-3.0)中，考量用于帧内预测模式的编解码机制，其中，将当前区块的帧内预测模式与对应于两个相邻区块的帧内预测模式进行比较。两个相邻区块的配置如图2所示，其中，区块a在当前区块的左侧且区块b在当前区块的上方。一位标志，mostprobablemodeflag用于指示是否当前帧内预测模式可由两个相邻区块的其中一个来预测。如果当前帧内预测模式可由对应于相邻区块的帧内预测模式的其中一个来预测，若两个相邻区块具有相同的帧内预测模式，无需附加信息来确定当前模式。否则，需要一位信息以识别使用的是两个相邻区块中的哪一个对应的帧内预测模式。如果当前预测模式不能由相邻帧内预测模式中的任何一个来预测，发送语法元素rempremode以指示剩余模式中的哪个对应于当前帧内预测模式。在hm-3.0中，使用两个cavlc表格来编码剩余帧内预测模式，其中，编解码表格1用于当两个相邻区块具有相同帧内预测模式时，而编解码表格2用于当两个相邻区块具有不同帧内预测模式时。具有本发明实施例的示范cavlc如表格4所示，其中，表格包括用于dc模式和平面模式的独立项。表格4为cavlc表格的一个示范，其中，码字以用于4x4pu的码字值和码字长度的项目形式列出，且一个码字项用于mostprobablemodeflag。在表格4中，具有值0和长度4的码字等于可变长度码“0000”。类似地，具有码字值0和码字长度5的码字等于可变长度码“01101”。存在18种用于4x4区块的帧内预测模式。如果当前帧内预测不等于相应于区块a和区块b的相邻帧内预测模式中的任何一个，当前预测模式将是剩余17种帧内预测模式(区块a和区块b具有相同帧内预测模式)或剩余16种帧内预测模式(区块a和区块b具有不同帧内预测模式)中的一种。修改用于剩余预测模式的索引以使剩余帧内预测模式具有从0至16或0至15的连续索引。将剩余帧内预测模式的索引修改为连续索引的示范方法在2011年8月4日递交的序列号为13/198,697的美国非临时申请案中有所描述。表格5为cavlc表格的一个示范，其中，码字以用于4x4pu的码字值和码字长度的项目形式列出，其中，mostprobablemodeflag被单独编解码并不包括在此表格中。表格4表格5表格6为cavlc表格的一个示范，其中，码字以用于32x32、16x16以及8x8的区块大小的码字值和码字长度的项目形式列出，且一个码字项用于mostprobablemodeflag。表格7为cavlc表格的一个示范，其中，码字以用于32x32、16x16以及8x8的区块大小的码字值和码字长度的项目形式列出，且mostprobablemodeflag被单独编解码并不包括在此表格中。表格6表格7将包括本发明实施例的编码系统与hm-3.0的性能进行比较。包括本发明实施例的编解码系统使用如表格2中所示的帧内预测模式索引映射以及图表格4和6中所示的cavlc表格。以bd率(bd-rate)项目对性能进行评估。，其中负值指示在相同失真(distortion)水平上需要较少的比特率。换言之，负值意味着性能改进。包括本发明实施例的编解码系统的性能高对比hm-3.0的性能图表格8所示。使用不同测试序列(testsequence)(从级别a至级别e)将bd率用y,u和v分量显示。根据测试结果可观察到适量的改进(约0.2％)。而在编码时间或解码时间上并没有明显差异。相应地，包括本发明实施例的编解码系统显示出适当的性能改进而在执行时间(即复杂度)上并无迟滞。表格8图3为包括本发明一个实施例的视频编码系统的编码帧内预测模式的示范流程图。在步骤310中接收待编码的当前帧内预测模式。当前帧内预测模式属于模式集合(modeset)且模式集合包括dc模式和平面模式。在步骤320中，当前帧内预测模式如前述映射为模式索引，其中，dc模式和平面模式具有各自的索引。如步骤330中所示，根据当前帧内预测模式和一或多个最可能模式确定标志。如果当前帧内预测模式等于所述最可能模式中的任何一个，则设置该标志。在步骤340中，检查标志以确定其是否被设置。如果不设置标志，其意味着当前帧内预测模式不等于最可能模式中的任何一个。在此情形中，如步骤350中所示使用变长码或算术编解码对当前帧内预测模式进行编码。如果设置了标志，其意味着当前帧内预测模式等于最可能模式的其中一个。依据是否可用最可能模式的数目大于1，可能需要附加指示以识别最可能模式中的哪一个与当前预测模式相同。用于设置标志的情形的当前预测模式的编码流程可与hm-3.0使用的相同，且图3的流程图中省略了已设置标志的编码流程。图4为包括本发明一个实施例的视频解码系统解码帧内预测模式的示范流程图。在步骤410中，接收视频比特流中的标志。其中，如果当前帧内预测模式等于最可能模式中的任何一个，则设置该标志。在步骤420中，对标志进行检查以确定是否设置标志。如果不设置标志，其意味着当前帧内预测模式是使用变长码或算术编解码来编码的。在此情形中，在步骤430中，相应地对当前帧内预测模式进行解码以存储/恢复用于当前帧内模式的模式索引。在步骤440中，输出从模式索引中推导的当前帧内预测模式，其中，dc模式和平面模式具有不同索引。用于设置标志情形的当前预测模式的解码流程可与hm-3.0所使用的相同，且图4的流程图中省略了已设置标志的解码流程。在hm-3.0中，使用一或两个最可能模式，其中，最可能模式是从两个相邻区块的帧内预测模式中推导的。如果当前帧内模式等于最可能模式的其中一个，将一位标志mostprobablemodeflag设置为1；否则不设置mostprobablemodeflag(即具有值0)。如果存在两个可用的最可能模式，使用一位指示mostprobablemodeindex以指示两个最可能模式中的哪个用于预测当前帧内预测模式。如果当前帧内预测模式不等于两个最可能模式中的任何一个，不设置mostprobablemodeflag(即具有值0)，且如前所述发送rempremode以指示剩余模式中的哪个对应于当前帧内预测模式。因此，编码对于当前帧内模式等于最可能模式的情形而言是是否高效的。相应地，在本发明的另一个实施例中，使用更多个最可能模式以改进编码效率。例如，可总是使用两个最可能模式。两个最可能模式可从如图2中所示的上方区块和左侧区块而确定。如果用于两个区块的帧内预测模式不同，可将两个帧内预测模式用作两个最可能模式。如果两个帧内模式相同，可基于发生概率最高的模式集合中的帧内预测模式的其中一个选择其他最可能剩余模式。也可使用选择两个最可能模式的其他方法以实现本发明。存在18种用于4x4区块(即4x4pu)的帧内预测模式。当使用两个最可能模式时，存在16种剩余模式。如果将mostprobablemodeflag包括为cavlc中的一项以用于编码剩余模式，表格将具有17项；否则，表格具有16项。表格9为用于两个最可能模式情形的cavlc表格的示范，其中，码字以用于4x4pu的码字值和码字长度的项目形式列出，且一个码字项用于mostprobablemodeflag。表格10为用于两个最可能模式的cavlc表格的示范，其中，码字以用于4x4pu的码字值和码字长度的项目形式列出，且mostprobablemodeflag被单独编码并不包括在此表格中。在表格9和表格10中，根据剩余帧内预测模式的排列顺序列出码字。表格13显示了用于4x4区块的剩余帧内预测模式的示范排列顺序。表格9表格10当两个最可能模式用于32x32、16x16以及8x8的区块大小时，存在33种剩余模式。如果将mostprobablemodeflag包括为cavlc中的一项以用于编码剩余模式，表格将具有34项；否则，表格具有33项。表格9为用于两个最可能模式情形的cavlc表格的示范，其中，码字以用于32x32、16x16以及8x8的区块大小的码字值和码字长度的项目形式列出，且一个码字项用于mostprobablemodeflag。表格12为用于两个最可能模式的cavlc表格的示范，其中，码字以用于32x32、16x16以及8x8的区块大小的码字值和码字长度的项目形式列出，且mostprobablemodeflag被单独编码并不包括在此表格中。在表格11和表格12中，根据剩余帧内预测模式的排列顺序列出码字。表格14显示了用于32x32、16x16以及8x8的区块大小的剩余帧内预测模式的示范排列顺序。表格11表格12表格13用于4x4pu的剩余模式排列顺序00132231548511617108794101411912613514131512表格14如另一个示例，使用四个最可能模式。可使用相邻区块的帧内预测模式及/或预设帧内预测模式以确定四个最可能模式。也可使用选择四个最可能模式的其他方法以实现本发明。存在18种用于4x4区块(即4x4pu)的帧内模式。当使用四个最可能模式时，存在14种剩余模式。如果将mostprobablemodeflag包括为cavlc中的一项以用于编码剩余模式，表格将具有15项；否则，表格具有14项。表格15为用于四个最可能模式情形的cavlc表格的示例，其中，码字以用于4x4pu的码字值和码字长度的项目形式列出，且mostprobablemodeflag被单独编码并不包括在此表格中。表格16为用于四个最可能模式情形的cavlc表格的示例，其中，码字以用于32x32、16x16以及8x8的区块大小的码字值和码字长度的项目形式列出，且mostprobablemodeflag被单独编码并不包括在此表格中。在表格15和表格16中，根据剩余帧内预测模式的排列顺序列出码字。表格18显示了用于32x32、16x16以及8x8的区块大小的剩余帧内预测模式的示例排列顺序。表格15表格16表格17用于4x4pu的剩余模式排列顺序021127364350657138498109111012121311表格18图5为包括本发明一个实施例的视频编码系统编码帧内预测模式的示例流程图。在步骤510中，接收待编码的当前帧内预测模式。在步骤520中，根据当前帧内预测模式和两个或多个最可能模式确定标志。如果当前帧内预测模式等于所述两个或多个最可能模式中的任何一个，则设置该标志。步骤540中，检查标志以确定其是否被设置。如果不设置标志，其意味着当前帧内预测模式不等于两个或多个最可能模式中的任何一个。在此情形中，如步骤540至550中所示使用变长码对当前帧内预测模式进行编码。在步骤540中，确定剩余模式集合，其中剩余模式集合由不等于所述两个或多个最可能模式中任何一个的模式集合的帧内预测模式组成。在步骤550中，基于剩余模式集合的排列顺序、统计或分布模型对当前帧内预测模式进行编码，其中，使用设计用于剩余模式集合的变长码对当前帧内预测模式进行编码。如果设置了标志，其意味着当前帧内预测模式等于两个或多个最可能模式的其中一个。需要附加指示一识别所述两个或多个最可能模式中的哪一个与当前预测模式相同。图5的流程图中省略了用于已设置了标志情形的当前预测模式的编码流程。图6为包括本发明一个实施例的视频解码系统解码帧内预测模式的示例流程图。在步骤610中，接收视频比特流中的标志。其中，如果当前帧内预测模式等于两个或多个最可能模式中的任何一个，则设置该标志。在步骤620中，对标志进行检查以确定是否设置标志。如果不设置标志(即具有值0)，其意味着当前帧内预测模式是使用变长码编码的。在此情形中，在步骤630至650中，使用变长编码对当前帧内预测模式进行解码。在步骤630中，确定剩余模式集合，其中剩余模式集合由不等于所述两个或多个最可能模式中任何一个的模式集合的帧内预测模式组成。在步骤640中，基于剩余模式集合的排列顺序、统计或分布模型，根据设计用于剩余模式集合的变长码对视频比特流中的码字进行解码。其中，该排列顺序为固定的或可自适应更新。在步骤650中，输出当前帧内预测模式。图6的流程图中省略了用于已设置了标志情形的当前预测模式的解码流程。包括根据本发明的帧内预测模式的编码或解码的视频系统的实施例可在不同硬件、软件代码或二者的组合中实施。例如，本发明的一个实施例可为集成在视频压缩芯片中的电路或集成在视频压缩软件中的程序代码以执行实施例中所述的处理。本发明的一个实施例也可为数字信号处理机(digitalsignalprocessor，dsp)上执行的程序代码以执行实施例中所述的处理。本发明也关于由计算机处理器、dsp、微处理器或场可编码门阵列(fieldprogrammablegatearray，fpga)执行的多个功能。根据本发明，通过执行定义本发明所包括的特定方法的机器可读软件代码或固件代码，可配置这些处理器执行特定任务。可在不同程序语言和不同格式或风格中开发软件代码或固件代码。也可对不同目标平台编译软件代码。然而，根据本发明不同编码格式、风格和软件代码语言以及为执行任务的配置代码的其他方式都不得脱离本发明的精神与范围。在不脱离本发明的精神或基本特征本发明的前提下，本发明可以实现为其他形式。所述的示范仅用于说明性质的从各方面考量而并非用于限制本发明。因此，本发明的范围由后续的权利要求表示，而并非由前面的描述限定。在与权利要求项等同的意义和范围内的任何改变都包含在本发明的范围内。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：国玫;郭峋;雷少民
技术所有人：寰发股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。