一种变换基自适应的变换编码方法

文档序号：7745849阅读：272来源：国知局

专利名称：一种变换基自适应的变换编码方法
技术领域：
本发明属于计算机领域，涉及一种变换基自适应的变换编码方法。涉及的技术领域包括各种标准图像和视频压缩编码技术。本发明是通过变换基自适应来提高图像和视频压缩编码领域中变换编码的效率，从而提高编码器的整体性能。
背景技术：
在此处键入技术领域描述段落。
背景技术：
变换编码在图像和视频压缩编码中得到了非常广泛的应用，其功能是将图像/视频数据通过变换到频域达到把分散冗余信息集中起来，大大有利于量化数据从而获得高效压缩编码的目的。在图像/视频编码中经常使用的变换是离散余弦变换(DCT)，DCT使用的实数变换矩阵存在缺点。整数余弦变换(ICT)用整数数值的矩阵来近似DCT的实数矩阵，解决了两个问题一是正反变换都是整数，不存在运算精度误差问题；二是整数矩阵乘法可以用加法和移位运算实现，极大地降低了计算复杂度。视频压缩编码标准H. 264、AVS等使用ICT作为编码器的变换方法，将时域的残差数据变换到频域，使得只剩很少的非零数据。ICT是从离散余弦变换(DCT)演化而来，用整数近似替代DCT中的实数，将其变为适于计算机处理的矩阵操作。对一个MXM的ICT矩阵可由M/2个整数组成的基来生成。分析ICT的原理，整数变换矩阵应满足以下几个特性(a)能归一化成正交矩阵；(b)变换运算可全部用移位运算实现；(c)归一化后的正交矩阵同原始的DCT矩阵系数相近；(d)整数变换矩阵系数不是很大，变换运算能用16位精度表示。在这4个约束条件和正交性约束条件下我们可以通过一些搜索算法寻找到很多符合条件的变换基。例如:H. 264中8X8和4X4的整数变换矩阵分别由=[12，10，6，3]和
(W) =[2，1]变换基生成，而AVS中8X8和4X4的整数变换矩阵分别由(与為為Λ) =[10，9，6，2]和(‘4) =[3，1]变换基生成。同理，我们可以用相同的方法搜索一组生成
16X16 ICT的变换基，并在能量集中效率，去相关性能和计算的简单性等约束条件的指导下选择变换性能最优的变换基。由于所有的整数变换矩阵都是离散余弦变换中实数矩阵的一种近似。所以不可能在任意的条件下对所有内容的图像或视频应用都表现出最优的性能，往往会受视频序列的特性和量化步长等影响。作为生成整数变换矩阵的变换基往往通过计算机搜索得到，迄今为止有大量搜索得到的变换基。由于变换基繁多和视频序列测试工作的繁琐，它们中的大多数并未被系统测试过或只经过在理想情况下的数学模拟，所以它们的真实性能未明。例如最初为了获得较高的变换效率，选用了 ^取值较大的变换基，而k很大时导到过高的变换复杂度，之后
又选用了其它变换基。但由于视频序列特性和实际编码参数的不同，对固定变换基生成的变换矩阵不能取得最优的编码性能。不同的变换基会产生不同的变换性能，在判断这些变换编码最优的变换基时，需要一个衡量变换基变换性能的准则，本发明采用H. 264和AVS中已有的Lagrangian率失真优化技术(RDO)来评估变换基的性能。其定义如下
(ι)
式中D{MB,c) mR(MB,o)分别表示在一个编码参数集O上某一确定参数编码的宏块产生的失真和码率，i称为Lagrangian权值因子，在参数i和量化参数Q选定后，编码器通过最小化Lagrangian代价函数+ M(MB,ο)实现对每一个宏块的编码模式的选择。能量集中能力概念评估变换在于去除元素之间相关性的性能，使得变换后的能量能集中在较少的几个系数上，就是将元素由空域变换到频域，且变换后只有较少的几个非零系数。本发明采用式(2)作为能量集中能力的评估指标。
式中Cov(F)是变换后系数的协方差的乘积，由数学均值不等式的性质可知，能量分布越平均，元素能量的乘积越大，P值越大；能量分布越集中，能量的乘积越小J值越小。因此计算变换基的9值能反应其对各种视频图像的能量集中能力。另外，本发明还采用去相关能力评估指标来搜索性能优异的变换基，如式(3 )。
式中4是归一化的為。用4对ζ作变换，得F = 协方差矩阵为 Cov(J) = 4. Cov(X). 4r, cbv(Z)(jJ> = 4 =拟)-^2 = s(4)。变换基的计算复杂度的高低直接关系到编码器速度，在硬件条件不变的情况下，总希望降低变换复杂度以换得更快的编码速度，在ICT中只存在加法和移位运算，本发明采用变换基的加法次数和移位次数的总和M来评估变换基的计算复杂度性能。变换基的动态范围同样关系到占用硬件资源的高低，更小的动态范围有助于节省存储空间，本发明采用多少比特K的数据结构能够进行该部分的全部运算来衡量变换基生成数据动态范围性能指标。

发明内容
本发明的目的是提供一种变换基自适应的变换编码方法，对比于固定变换基方法，它可以大大提高编码器的整体性能，同时不增加编码器的复杂度，可以实现实时应用。为达到上述目的，本发明采用下述技术方案
一种变换基自适应的变换编码方法，在H. 264、AVS等视频压缩编码标准中，用来变换编码的变换矩阵采用自适应选择的方法，其特征在于对预测的残差数据分别用所有的有限个变换基生成的变换矩阵进行变换后量化，利用(1)式选择一个变换基作为命中的最优变换基进行变换编码。变换基自适应选择步骤如下
a)根据实际视频序列的特性和不同的量化步长，通过计算机搜索，选定变换编码效率较高的有限个变换基N。变换效率的评估指标是去相关能力#和能量集中能力C，N的取值是27。b)从编码器端传送有限个变换基到解码器端，可通过事先约定的方式确定或者随码流传送，用于解码器端作整数余弦反变换使用。c)对于每一个宏块的残差数据用全部候选的变换基进行ICT后，编码器根据RDO 选定一组最优的编码参数，确定了最优的变换基。d)对每个宏块所命中的最优变换基随码流传送给解码器端，可选择直接传送变换基本身，或者选择传送变换基索引号。e)解码器解码一个宏块时，根据选定的该宏块变换效率最优的变换基作反变换，解码出原始视频序列。本发明综合利用上述方法进行自适应变换基的选择。测试结果显示，可以大大提高编码器的整体性能，且保证编码器的整体复杂度基本不变，可以应用于实时编解码场合。

图1是本发明的一个实施例的视频压缩编码框图；图2是本发明有限个变换基的选择流程图3是本发明自适应选择变换基的流程图；图4是本发明有限个变换基的流通示意图；图5是本发明被选中的最优变换基的传输示意图；图6是本发明评估8X8 ICT的各种变换基的平均能量集中能力；图7是本发明评估8X8 ICT的各种变换基的平均去相关效率。
具体实施例方式以下结合附图描述本发明变换基自适应选择的变换编码方法的一个实施例。在校验模型JM12. 1编码器上，测试条件，步长0. 05 ；统计结果& = 2 ,在5个。与的平均效率。
其中编码参数设置如表1所示。表1编码参数的设置和测试序列
参见图2、图6和图7，首先，对8X8和4X4的ICT具有较高变换性能的有限个变换基通过计算机搜索得到，即8X8 ICT的可选变换基为[25，21，14，5]、[24，21，15，4]、 [19，15，9，3] 、[15，15，10，3]、[15，12，8，3]、[14，12，9，2]、[12，10，6，3]、[10，9，6，2]、 [9，8，4，3]、[7，4，3，1]、[6，6，3，2]、[5，3，2，1]、[3，2，1，1]、[9，10，5，3]、[8，9，7，1]、 [7,9, 5, 2], [6，7，5，1]、[5，6，4，1]和[4，5，3，1]，4X4 的 ICT可选变换基为[3，1]、[7， 3]、[2，1]、[5，2]、[1，2]、[9，4]、[3，2]和[8，3]。参见图1，对原始视频序列进行帧间(包括运动估计1和运动补偿4)和帧内(5)预测编码，帧间预测需要参考存放在缓存(2)中的前一帧或若干帧，用所有有限个变换基(7) 对每一个宏块的残差数据进行ICT和量化(6)，量化后的数据经过反量化和逆ICT (9)后用于本地解码，环路滤波(3)用于消除块效应和虚假的边缘，最终残差数据和运动矢量(MVs) 经过熵编码(8)生成压缩的比特流。通过最小化Lagrangian代价函数实现对每一个宏块的变换基的选定，参见图3。由于变换和量化在基于预测的视频编码方案中，计算量很少，因此这部分不会占太大计算时间。如图4所示。有限个变换基N从编码器端(A)到达解码器端(B )有两种可选方式，可以通过随压缩码流传送通道(30)传送给解码器，也可以通过事先约定的方式让解码器在候选的变换基中进行定位。参见图5，被命中的宏块级整体性能最优的变换基从A端到达B端有两种可选方式，可以通过随压缩码流直接传输变换基本身，也可以传输变换基的索引号的方式实现。测试表1中运动及纹理复杂程度不同的标准视频序列表明，自适应变换基方法比固定变换基方法的重建视频的主观质量有很大提高，客观质量PSNR也大大提高，而码率下降。本发明的第二个实施例是在参考模型RM5. 2上，同样采用上述的变换基自适应选择方法，仍然测试表1中的序列。测试结果表明本发明的变换基自适应选择方法相比固定变换基方法，重建视频的主观质量大大提高，在相同的PSNR时压缩后码率降低，在相同码率的情况PSNR也得到了提高，同时总体编码速度基本保持不变。
权利要求
一种变换基自适应的变换编码方法，在H.264或AVS编码器中，变换编码时采用变换基自适应的选择方法，其特征在于对预测的残差数据用全部有限个参数进行ICT后，再对量化的数据进行编码性能的评估，选择一个整体性能最优的变换基进行实际的变换编码。
2.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，ICT的整数变换矩阵由有限个整数唯一决定，这有限个整数称为变换基，通过计算机搜索等方式可以得到许多变换基。
3.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，ICT由有限个变换基来决定，即变换基！^”丨力，〗，…，N , N是个有限值。
4.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，这有限个变换基的选择由通道(10)决定，(10)的输入参数为能量集中能力(100)、计算复杂度(200)和变换结果的动态范围(300)，输出参数为变换基为有限个变换基N。
5.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，有限个变换基 N 为 27，分别是[25，21，14，5]、[24，21，15，4] [19，15，9，3]、[15，15，10，3]、[15，12，8，3]、 [14，12，9，2]、[12，10，6，3]、[10，9，6，2]、[9，8，4，3]、[7，4，3，1]、[6，6，3，2]、[5，3，2，1]、 [3，2，1，1]、[9，10，5，3]、[8，9，7，1]、[7，9，5，2]、[6，7，5，1]、[5，6，4，1]、[4，5，3，1]、[3， 1]、[7，3]、[2，1]、[5，2]、[1，2]、[9，4]、[3，2]禾口 [8，3]，用于 8X8 和 4X4 的 ICT 矩阵的生成。
6.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，自适应变换基的选择是基于宏块的，一个宏块是由16X16个像素组成的矩形空间，对每一个宏块的编码都通过自适应选择一个性能最优的变换基进行编码。
7.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，根据通道(20) 在有限个变换基N中命中一个整体性能最优的变换基进行ICT。
8.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，有限个变换基从编码器端(A)到达解码器端(B)可以通过随码流传送通道(30)或事先约定的方式传送通道(31)来决定。
9.根据权利要求1所述的变换基自适应的变换编码方法，其特征在于，被命中的整体性能最优的变换基从A端到达B端，可以通过直接传输变换基通道(40)或传输变换基的索引号通道(41)的方式实现。
全文摘要
一种变换基自适应的变换编码方法，属于计算机领域，涉及的技术领域包括各种标准图像和视频压缩编码技术，涉及一种变换基自适应的整数余弦变换(ICT)方法。在图像和视频压缩编码A端，由通道(10)确定有限个变换基Ｎ，由通道(20)在有限个变换基Ｎ中自适应命中一个变换性能最优的变换基进行ICT。在解码器Ｂ端，可以通过通道(30)或(31)来获得这有限个变换基Ｎ，被命中的变换基由通道(40)或(41)传输给解码器作反变换使用。由于根据实际的视频序列特性和编码参数自适应选择了变换效率最好的变换基，因而能大大提高整体编码器的性能。
文档编号H04N7/30GK101931817SQ201010144549
公开日2010年12月29日申请日期2010年4月12日优先权日2010年4月12日
发明者梁凡, 王员根, 陈伟, 雷延强申请人:中山大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：梁凡;王员根;雷延强;陈伟
技术所有人：中山大学
我是此专利的发明人

上一篇：一种基于层间协作的家庭网络QoS保障方法
上一篇：摄像模块的组装方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。