一种视频内容自适应的运动搜索方法

文档序号：8480546阅读：384来源：国知局

一种视频内容自适应的运动搜索方法
【技术领域】
[0001] 本发明设及一种视频内容自适应的运动捜索方法。
【背景技术】
[0002] 视频编码标准H. 264 W其高效的压缩效率、良好的网络亲和性W及优越的稳健性等优点得到了广泛的应用。然而，随着终端处理能力W及人们对多媒体体验要求的不断提高，高清、超高清、无线移动已经成为目前视频应用的主流趋势。而H. 264编码标准的压缩效率不能满足高清、超高清视频应用，需要更高效的编码压缩方案。因此，由ISO/IEC Moving Pierre Experts Group (MPEG)和；[TU-T Video Coding Experts Group (VCEG)联合成立的Joint Coll油orative Team on Video Coding(JCT-VC)制定了高效率的下一代视频编码标准肥VC (化曲Efficiency Video Coding)，肥VC不仅提升了图像质量，同时也能达到H. 264/MPEG-4AVC压缩效率的两倍，等同于同样画面质量下比特率减少了50%，可支持4K甚至到8k视频。
[0003] 肥VC依然沿用W往视频编码标准所采用的预测、变换、量化、滴编码的混合编码框架。
[0004] 为了提高视频的编码效率，肥VC采用了更加灵活的大尺寸四叉树编码结构来提高压缩效率，如图1所示，其定义了 3种不同的结构单元，包括编码单元CU(Coding化it)、预测单元PU(Prediction化it)、变换单元TU(Transform化it)来描述整个编码过程。其中最大的CU称为CTB，每个CU可W继续分为4个更小的CU。PU、TU都是基于CU进行划分的，其中TU可W跨越不同PU。采用较大的CU可W更好地压缩平坦区域，而采用较小的CU可W 更好压缩细节较多的区域。
[0005] 肥VC中引进运动估计融合和高精度运动补偿等技术来提高帖间运动估计的准确性。运动估计的目的是为了在参考帖图像中寻找当前预测单元的最佳匹配块，即在指定的捜索范围内寻找最匹配的运动矢量。肥VC中除了整像素捜索外，还有采用插值方法的亚像素运动捜索，该是由于自然界物体运动具有连续性，因此相邻两帖图像之间物体的运动不一定是W整像素为基本单位的，而有可能是半个像素、四分之一个像素甚至是八分之一个像素为单位的，如图2所示肥VC中运动捜索流程图。若仅使用整像素运动估计会出现匹配不准确的问题，导致运动补偿残差幅度过大，影响编码效率。此时，应将运动估计的精度提升到亚像素级别，该可W通过对参考图像的像素进行插值来实现。
[0006] 在运动补偿和亚像素捜索中，插值滤波器起着关键的作用。目前，肥VC编码标准中，为像素每个位置的插值都设计了单独的插值滤波器，直接对所需位置的像素进行插值，而非像H. 264/AVC中先进行维纳滤波，而后再做双向滤波。由于只需进行一次滤波计算，插值过程简单高效。肥VC在进行图像的亮度插值滤波时，其DCT的插值滤波器采用8个抽头的滤波器，如表1所示。
[0007] 表1亮度1/4和色度1/8插值滤波系数 [000引
【主权项】
1. 一种视频内容自适应的运动搜索方法，其特征在于，包括以下步骤： 1) 计算当前图像内所有像素点的梯度的平均值，并根据所述平均值设定两个阈值； 2) 根据上述阈值确定当前CU的区域类型； 3) 利用空域、时域上运动向量的相关性，为当前TO建立候选预测MV列表，从所述MV 列表中选择率失真代价最小的MV作为预测MV，并用所述预测MV所指向的位置作为搜索起占. 4) 根据HEVC选定的运动搜索方法，在编码预设的搜索范围内进行搜索，选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点； 5) 如果当前CU为平坦区域，则将步骤4)得到的最佳匹配点作为最终结果；如果当前 CU为纹理区域，以步骤4)得到的最佳匹配点作为1/2像素运动搜索的起始点，在编码预设的搜索范围进行搜索，选择率失真代价最小的点作为1/2像素运动搜索的最佳搜索点，并且将该最佳搜索点作为最终结果；如果当前CU为边缘区域，以步骤4)得到的最佳匹配点作为1/4像素运动搜索的起始点，在一定的范围内进行搜索，选择率失真代价最小的点作为 1/4像素运动搜索的最佳搜索点，并且将该点作为最终结果； 6) 结束。
2. 根据权利要求1所述的视频内容自适应的运动搜索方法，其特征在于，两个阈值的设定过程如下： 1) 将当前帧图像中位置为（x，y)的像素点的梯度标记为&,7，&,7计算公式如下： Gx,y| = |Gx| + |Gy 其中，Gx、Gy分别代表水平、垂直方向边缘检测得到的梯度值：
其中，A表示原始图像，?:为卷积符号； 2) 计算当前图像内所有像素点的梯度的平均值Ga:
其中，w、h分别为当前图像的宽和高； 3) 根据Ga设定两个阈值TT2，计算公式如下： Ti= 〇XGa T2= 0XGa 其中，a、0取值分别为〇.l、〇. 05。
3. 根据权利要求2所述的视频内容自适应的运动搜索方法，其特征在于，确定当前CU 的区域类型方法步骤如下： 1)计算当前CU单元内所有像素点的梯度值的平均值，记为G^G。。计算公式如下：
其中，"N"表示当前⑶大小为NXN，Gy为当前⑶中位置为（i，j)像素点的梯度； 2)判断是否满足条件Gra<T2，若满足，当前CU被划分为平坦区域；否则，判断是否满足条件Gra<Ti，若满足，当前CU被划分为纹理区域；否则，当前CU被划分为边缘区域。
【专利摘要】本发明公开了视频内容自适应的运动搜索方法，包括：计算当前图像内所有像素点的梯度的平均值，并根据平均值设定两个阈值；根据阈值确定当前CU的区域类型；为当前PU建立候选预测MV列表，选择率失真代价最小的MV作为预测MV，并用预测MV所指向的位置作为搜索起点；在给定的搜索范围内进行搜索，选出率失真代价最小的点作为整数像素运动搜索下的最佳匹配点；根据CU类型确定最终结果。本发明的运动搜索自适应选择算法不改变码流结构，生成的码流可兼容任意标准解码，应用方便。
【IPC分类】H04N19-523, H04N19-567, H04N19-80
【公开号】CN104811728
【申请号】CN201510196486
【发明人】贺庆, 汤热忱, 胡友盼, 杨威棣, 官冠
【申请人】湖南大目信息科技有限公司
【公开日】2015年7月29日
【申请日】2015年4月23日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贺庆;汤热忱;胡友盼;杨威棣;官冠;
技术所有人：湖南大目信息科技有限公司;
我是此专利的发明人

上一篇：一种视频多参考帧编码方法
上一篇：帧率转换中运动估计的候选运动矢量选择方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。