专利名称::H.264到avs视频码流转换装置的制作方法
技术领域:
:本实用新型属于多媒体通信与视频传输
技术领域:
,特别是涉及H.264格式到AVS格式之间的视频格式转换的装置。
背景技术:
:H.264是ITU-T的VCEG(视频编码专家组)和IS0/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:JOINTVIDEOTEAM)开发的新一代视频编码标准,它既是ITU-T的H.264,又是IS0/IEC的MPEG-4的第10部分。1998年开始征集草案,2003年正式成为国际标准。H,264当中采用了多项新技术,如统一的VLC符号编码,高精度、多模式的位移估计,基于4X4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很高的编码效率,在相同的重建图像质量下,相对于H.263或MPEG-2视频压縮比提高1倍,或节约50%的码率。分别定义了VLC和NAL层,因此对网络,特别是IP和无线网络具有良好的亲和性。H.264定义了基本档次、主档次和扩展档次三个档次的视频编码,每个档次支持特定的编码功能,并且规定了对相应编解码器的要求。由于历史的原因,视频编解码算法标准一直以来都掌握在少数的国外厂商手里,如目前数字遥视系统中采用最多的11.264视频编解码算法,就是以欧美、日韩为代表的专利厂商所掌握,这些专利厂商通过收取髙昂的专利费用来达到限制中国视频技术发展的目的。为推动中国音视频民族产业的发展,2002年在北京成立了中国数字音视频编解码技术标准工作组,简称AVS,其工作范围是面向我国的信息产业需求,联合国内企业和科研机构,制(修)订数字音视频的压縮、解压縮、处理和表示等共性技术标准,为数字音视频设备与系统提供高效经济的编解码技术,服务于髙分辨率数字广播、高密度激光数字存储媒体、无线宽带多媒体通讯、互联网宽带流媒体等重大信息产业应用。AVS是"数字音视频编解码技术标准工作组"(简称AVS工作组)制定的中国国家信源编码标准,目前已被国际认可。AVS以li264为起点,同时因针对应用定制标准,克服了11.264冗余的缺点,达到了复杂度与编码效率间很好的折衷。'AVS是一套适应面十分广阔的技术标准,优势表现在以下几个方面(l)AVS是基于我国自主创新技术和国际公开技术所构建的自主标准,妥善解决了知识产权问题;(2)编码效率高,比MPEG-2国际标准高2-3倍(高清晰度电视可达3倍或更多);(3)计算复杂度低,硬件实现成本较低(4)AVS可节省一半以上的无线频谱和有线信道资源,显著降低传输、存储设备与系统的经济投入。在技术上AVS采用了H.264类似的技术。编码效率是MPEG-2视频的2-3倍(根据视频画面尺寸不同有所不同),超过了国际上的MPEG-4AVC/H.264标准,而且方案简洁,实现复杂度比MPEG-4AVC低。中国AVS工作组的基本思路是在基本层采用与最新国际标准ISOMPEG-4/AVC和H.264类似的技术框架,有利于芯片同时支持国际和中国标准;在MP(MainProfile)层采用自主技术,有效避免国际厂商对MP层的专利收费在技术方案上精简掉国际标准中因非技术原因而加入的一些不必要的模块,从而使该技术的性价比更高。2006年3月,正式批准了AVS-P2作为视频编解码技术的国家标准。为规避未来MPEG-4和H.264标准的巨额专利费困扰,信息产业部和科技部内部出台政策,建议音视频应用采用国产AVS标准。随着AVS的推广实施,新的视频装置将采用AVS视频国家标准进行压縮和传输。而现有视频装置大部分基于11.264视频压縮标准,为了节约成本、充分利旧,产生了从H,264格式到AVS格式码流转换的要求。提供高质量的H.264格式到AVS格式视频快速转换方案,成为本
技术领域:
亟待解决的重要技术问题。
实用新型内容为解决上述技术问题,避免转码算法中大计算量的复杂运算,提供髙质量、易实现、实时性好的图像传输效果,本实用新型提供了H.264格式到AVS格式视频码流转换的装置。—种1264到4¥3视频码流转换装置,包括H.264解码器,用于对H.264码流进行解压缩操作得到中间码流数据;基于像素域的快速级联转.码器,用于对中间码流数据的高层语法结构进行基于像素域的快速级联转码处理,输出AVS码流的高层语法结构;I帧压縮域转码器,用于对中间码流数据中的I帧进行压缩域转码处理,并通过I帧序列输出模块输出AVS码流的I帧序列;P帧帧内压縮域转码器,用于对中间码流数据中P帧中采用帧内编码的宏块进行压縮域转码处理,P帧帧间压縮域转码器,用于对中间码流数据中P帧中采用帧间编码的宏块进行压縮域转码处理,并通过P帧序列输出模块输出AVS码流的P帧序列;B帧帧内压缩域转码器,用于对中间码流数据中B帧中采用帧内编码的宏块进行压縮域转码处理,B帧帧间压缩域转码器,用于对中间码流数据中B帧中采用帧间编码的宏块进行压縮域转码处理,并通过B帧序列输出模块输出AVS码流的B帧序列;整体快速转码器,用于对上述转换后的码流数据进行整体快速转码处理,最后通过AVS码流输出模块输出转换后的AVS码流。一种11.264到八¥5视频码流转换装置,包括H.264多路解码器,用于对多路H.264码流进行并行解压縮操作得到多路中间码流数据;基于像素域的快速级联多路转码器,用于对多路中间码流数据高层语法结构进行基于像素域的并行快速级联转码处理,输出多路AVS码流的高层语法结构;I帧压縮域多路转码器,用于对多路中间码流数据中的I帧进行并行压缩域转码处理,并通过I帧序列多路输出模块输出AVS码流的I帧序列;P帧帧内压縮域多路转码器用于对多路中间码流数据中P帧中采用帧内编码的宏块进行并行压縮域转码处理,P帧帧间压縮域多路转码器对多路中间码流数据中P帧中采用帧间编码的宏块进行并行压缩域转码处理,并通过P帧序列多路输出模块输出AVS多路码流的P帧序列;B帧帧内压缩域多路转码器用于对多路中间码流数据中B帧中采用帧内编码的宏块进行并行压縮域转4码处理,B帧帧间压縮域多路转码器对多路中间码流数据中B帧中采用帧间编码的宏块进行并行压缩域转码处理,并通过B帧序列多路输出模块输出AVS多路码流的B帧序列;整体快速多路转码器用于对上述转换后的多路码流数据进行并行整体快速转码处理,最后通过多路AVS输出模块输出多路AVS码流。由上可知,本实用新型所述的是11.264格式到4乂3格式视频码流转换的装置,通过釆用基于像素域的快速级联转码体系结构、运动矢量重用,运动残差重用,DCT/IDCT序列重排,视频序列头信息重用,宏块编码模式信息重用等关键技术,避免了复杂的运算,充分利用了11.264原始码流的图像和结构信息,从而实现了H.264格式到AVS格式视频码流的快速转换。图1是本实用新型采用的基于像素域的快速级联转码器结构图;图2是本实用新型H.264到AVS视频码流转换装置工作流程图;图3是本实用新型H.264到AVS视频码流转换装置结构示意图。图4是本实用新型H.264到AVS视频码流转换装置多路处理结构示意图具体实施方式下面结合本实用新型的具体实施例详细说明本实用新型的技术方案。H.264和AVS都是基于块的变换和预测混合编码算法,两种编码器的基本结构相似,其技术特性对比见表l。表l<table>tableseeoriginaldocumentpage5</column></row><table>熵编码上下文自适应2D-VLC,Exp-Golomb码降低计算及存储复杂性CAVLC:与周围块相关性高,实现较复杂CABAC:硬件实现特别复杂环路滤波基于8X8块边缘进行,简单的滤波强度分类,滤波较少的像素基于4X4块边缘进行,滤波强度分类繁多,滤波边缘多容错编码简单的条带划分机制足以满足广博应用中的错误隐藏、恢复需求数据分割、复杂的FM0/AS0等宏块、条带组织机制、强制Intra块刷新编码、约束性帧内预测等实现特别复杂11.264的技术特征支持加权预测;支持任意分辨率图像编码(QCIFD1);帧内编码支持16X16、8X8、4X4等宏块类型和所有的预测模式;帧间编码支持16X16到4X4各种宏块划分方法;码率控制方面支持常数量化参数,支持单通道和多通道ABR;支持自定义量化表;支持多条带并行编码。不支持隔行扫描的图像;不支持场模式相关的PAFF和MBAFF。AVS的技术特征支持任意分辨率图像编码(QCIFSD/D1);帧内编码支持5种8X8亮度块模式和4种8X8色度块模式;帧间编码支持16X16、16X8、8X16和8X8四种宏块划分类型;支持3种B帧预测模式;B帧数目最多2帧;支持RDO:支持FME;不支持隔行扫描的图像。AVS中视频解码过程的基本处理单元是宏块,一个宏块包括一个16X16的亮度块和对应的色度块。宏块可进一步划分到最小8X8的块来进行预测。变化的单元是8X8的块。变换系数进行标量量化。除此之外,AVS不限定编码器中变换和量化的处理方法。在AVS的运动预测中,一个宏块可以按照图2被划分为不同的子块,形成4种不同模式的块尺寸。在这种方式下,在每个宏块中包含有1、2或4个运动向量。图2中矩形里的数字表示宏块划分后运动向量和参考索引在码流中的顺序。本实用新型提供的H.264格式到AVS格式视频码流转换方法,在转码前后视频的空间分辨率和帧速率都不改变,只是编码标准发生了改变以及数据传输率随之改变。大大降低了转换运算的复杂度。本实用新型主要采用的视频码流转换方法是压縮域转码,即只利用输入的H.264码流中已压縮的信息,如视频序列头信息、宏块编码模式信息、运动矢量信息和量化后的DCT系数等,直接生成转换后的AVS码流。本实用新型提供的H.264到AVS视频码流转换装置中的基于像素域的快速级联转码器结构如下,(1)重用H.264输入码流中的运动矢量,对其精化只需局部范围内搜索而不重新进行全局运动估算的模块;(2)通过对来自H.264码流中的预测残差作运动补偿得到AVS的预测残差的模块;(3)通过重新排列DCT/IDCT的运动顺序来减少一些DCT/IDCT的操作的模块。本实用新型提供的H.264到AVS视频码流转换装置中对H.264码流进行基于像素域的快速级联转码器6(如图l),保持转码后AVS视频码流的高层语法结构不变,即序列头的位置不变,GOP的位置不变和结构不变,帧的预测类型不变,即I帧转码后仍为I帧,P帧转码后仍为P帧,B帧转码后仍为B帧,保持帧的扫描类型不变,并重新划分slice(默认为每一帧只划分为1个slice)。采用这种方式除了计算量小以外,还避免了帧重排序延迟。本实用新型提供的H.264到AVS视频码流转换的装置中的I帧压縮域转码器对H.264输入码流中的I帧进行压縮域转码,先部分解码后重编码为AVS码流并通过I帧序列输出模块输出,对I帧的每一个宏块都采用AVS的帧内编码算法重新编码,在编码时参考H.264输入码流中对应宏块的编码信息,重用H.264输入流量化参数。本实用新型提供的H.264到AVS视频码流转换的装置中的P帧帧内转码器和B帧帧内转码器分别对P帧和B帧中采用帧内编码的宏块的压縮域转码,转码时重新进行宏块编码模式选择和运动补偿,重用输入流中的运动矢量而不重新进行全局运动估算,通过对来自11.264输入流中的预测残差作运动补偿来得到转码后的AVS运动残差,重用H.264输入流量化参数。本实用新型提供的H.264到AVS视频码流转换的装置中的P帧帧间转码器和B帧帧间转码器分别对P帧和B帧中采用帧间编码的宏块的压縮域转码,对预测块尺寸进行处理,对于AVS不支持的宏块级别进行小块合并。对参考帧进行映射。对于H.264中的双向B帧预测,只保留H.264中的前向运动矢量,并映射到AVS中的对称模式。重用H.264输入流量化参数。本实用新型提供的H.264到AVS视频码流转换的装置中帧间预测主要包含以下部分A:处理像素精度预测的模块,H.264和AVS-P2都支持1/4像素(亮度)和1/8像素(色度)精度的运动矢量,在精度不做处理。B:处理分块尺寸预测的模块,由于在11.264中的分块模式有7种,而在AVS—P2中只有4种,所以作了以下处理,(l)对H.264中的16X16、16X8、8X16和8*8四种分块模式,可以直接利用H.264中得到的MV。为求进一步精确,以此MV预测的位置上下左右4个点作搜索,再用SAD为匹配准则找到最佳点;(2)对于AVS不支持的宏块级别,进行小块合并,再根据转码前的MV进行初步预测,再在此预测位置附近的较小的搜索范围内找到较好的匹配点。C:处理参考帧的选择模块,凡264在帧间预测中使用的参考帧较多,而且B帧也可以作为参考帧使用,而AVS-P2中对P帧使用其前面已解码的连续的两帧作参考,对B帧使用其前后各一帧作为参考,因此我们设计时在参考帧上作了一个参考帧映射。D:处理B帧预测的模块,对11.264中的双向8帧预测,因为AVS-P2中只有对称模式中支持前向运动矢量,所以只保留了H,264中的前向运动矢量,并映射到AVS-P2中的对称模式。本实用新型提供的H.264到AVS视频码流转换的装置中对于H.264输入流量化参数(QP)的重用部分如下重用H.264中的量化参数前,将H.264的量化参数映射到AVS的量化参数上,这样才能使得转码过程中可以在理论上保证最小的数据失真。因为H.264和AVS的量化原理相同(量化步长都为指数分布),并且QP范围也相同(063),因此这个映射是比较容易完成的。用H.264的量化步长在AVS-P2中去找到该量化步长对应的量化参数,如果没有相同的,则取其同其它量化步长的差值的绝对值最小的对应的量化参数,完成映射。为减少査表时间,利用AVS-P2中,QP每增加8,量化步长增加l倍的特性,先以8为单位搜索量化参数对应的量化步长,找到差值的绝对值最小的,然后再在此8个量化步长中作进一步的细化搜索。本实用新型中的QP映射包含内容如下采用的AVS量化步长计算公式Qst印avs^(2(QPavs〃8))*QP2QSTEPavs[QPavs%8](1)釆用的H,264/AVC计算公式Qst印264(2(QP264〃6)+QP2QSTEP264[QP264船](2)所有的AVS和H.264/AVC步长都可以根据公式(1),公式(2)被计算出来.为了用同样的比率从H.264/AVC转码到AVS,我们能够选择QP使得AVS和H.264的Qst印差最小.本实用新型中的Mode映射包含内容如下因为SD或HD视频的分辨率是相对来说很大,去掉8*4,4*8,4*4块的帧间预测模式能够以较小的损失来降低复杂度,如果QSt印avs^Qst印264,那么AVS和H.264之间的量化误差几乎一样,所以Ravs^R264在码率distortion理论是合理的,尽管在现实中并不总是一样的,但是实验结果显示重用模式所引起的编码效率损失能够被忽略.本实用新型包含的运动矢量映射内容如下整数像素运动向量能够被重用,那么1/2和1/4像素的运动向量也能够被重用.AVS用于计算1/2像素位置的公式如下Favs=(-1,5,5,-1)/8(3)相应的H.264的是F264=(1,—5,20,20,—5,1)/32(4)通过公式(3)和公式(4),我们能够直接计算出AVS和H.264/AVC之间像素值的差值.例如bavs=(-F+5*G+5*H-I)/8(5)H.264/AVC的半像素是b264:(E-5*F+20*G+20*H-5*I+J)/32(6)两者的差值是0=bavs-b264=(-E+F+I-J)/32(7)很明显,如果-E+F+I-J小于32,e将要等于0,当图像特别平滑是,这种情况是会存在的,最坏的情况导致差16,但这种情况并不经常发生,所依编码性能将不会损失很多.类似的,我们可以推理1/4像素的情况,也是一样的.通过本实用新型采用的重用模式和运动向量映射,H.264到AVS视频转换计算的复杂度能够极人的降低。如图2所示为H.264格式到AVS格式视频码流转换装置的整体工作流程。如图3所示,H.264格式到AVS格式视频码流转换装置包括H.264解码器、基于像素域的快速级联转码器、I帧压縮域转码器、I帧序列输出模块、P帧帧内压縮域转码器、P帧帧间压縮域转码器、P帧序列输出模块、B帧帧内压縮域转码器、B帧帧间压縮域转码器、B帧序列输出模块、整体快速转码器、AVS码流输出模块。其中H.264解码器,用于对H.264输入码流解码,并产生H.264输出码流,在H.264解码器中解码符合H.264解码器中的解码规范,具体细节可参考ITU-TRec.H.2641IS0/IECInternationalStandard11496-10.AdvancedVideoCodingforgenericaudiovisualservices.2005(E)中的第8部分。基于像素域的快速级联转码器用于对H.264码流数据高层语法结构进行基于像素域的快速级联转码处理,得到AVS输出码流的高层语法结构框架;I帧压缩域转码器于对H.264码流数据中的I帧进行压縮域转码处理,并将码流数据通过I帧序列输出模块输出后得到AVS输出码流的I帧序列;P帧帧内压縮域转码器用于对H.264码流数据中P帧中采用帧内编码的宏块进行压縮域转码处理,P帧帧间压縮域转码器用于对H.264码流数据中P帧中采用帧间编码的宏块进行压缩域转码处理,并通过P帧序列输出模块输出后得到AVS输出码流的P帧序列;B帧帧内转码器用于对H.264码流数据中B帧中采用帧内编码的宏块进行压缩域转码处理,B帧帧间压縮域转码器用于对H.264码流数据中B帧中采用帧间编码的宏块进行压縮域转码处理,并通过B帧序列输出模块输出后得到AVS输出码流的B帧序列的;整体快速转码器用于对H.264码流数据进行整体快速转码处理,并通过AVS码流输出模块输出后得到AVS输出码流。本实用新型提出的一种11.264到八¥5视频码流转换装置,如图4所示,包括11.264多路解码器、基于像素域的快速级联多路转码器、I帧压縮域多路转码器、I帧序列多路输出模块、P帧帧内压缩域多路转码器、P帧帧间压缩域多路转码器、P帧序列多路输出模块、B帧帧内压缩域多路转码器、B帧帧间压缩域多路转码器、B帧序列多路输出模块、整体快速多路转码器、AVS码流多路输出模块H.264多路解码器用于对多路H.264码流进行并行解压缩操作得到多路H.264码流数据;基于像素域的快速级联多路转码器用于对多路H.264码流数据高层语法结构进行基于像素域的并行快9速级联转码处理,得到多路AVS输出码流的高层语法结构框架,并保持转码后多路AVS视频码流的高层语法结构不变,即序列头的位置不变,GOP的位置不变和结构不变,帧的预测类型不变,即I帧转码后仍为I帧,P帧转码后仍为P帧,B帧转码后仍为B帧,保持帧的扫描类型不变,并重新划分slice(默认为每一帧只划分为l个slice)。采用这种方式除了计算量小以外,还避免了帧重排序延迟。;I帧压縮域多路转码器用于对多路H.264码流数据中的I帧进行并行压縮域转码处理,并通过I帧序列多路输出模块输出多路AVS码流的I帧序列;P帧帧内压縮域多路转码器用于对多路H.264码流数据中P帧中采用帧内编码的宏块进行并行压缩域转码处理,P帧帧间压縮域多路转码器用于对多路H.264码流数据中P帧中采用帧间编码的宏块进行并行压縮域转码处理,并通过P帧序列多路输出模块输出多路AVS码流的P帧序列;B帧帧内压縮域多路转码器用于对多路H.264码流数据中B帧中采用帧内编码的宏块进行并行压缩域转码处理,B帧帧间压縮域多路转码器用于对多路H.264码流数据中B帧中采用帧间编码的宏块进行并行压縮域转码处理,并通过B帧序列多路输出模块输出多路AVS码流数据的B帧序列;整体快速多路转码器用于对多路H.264码流数据进行并行整体快速转码处理,并通过AVS码流多路输出模块输出多路AVS码流数据。综上所述,本实用新型提供的H.264到AVS视频码流转换装置,充分利用H.264与AVS结构相似的特征,充分利用H,264原始码流的图像和结构信息,采用基于像素域的快速转码体系、图像信息重用模式、QP映射以及运动向量映射,避免了大运算量的复杂计算和转换,实现了H.264到AVS视频码流的快速转换。显然,本领域的技术人员可以对本实用新型中的实施例进行各种改动和变型而不脱离本实用新型的精神和范围。这样,倘若本实用新型实施例中的这些修改和变型属于本实用新型权利要求及其等同技术的范围之内,则本实用新型中的实施例也意图包含这些改动和变型在内。10权利要求1、一种H.264到AVS视频码流转换装置,其特征在于,包括对H.264码流进行解压缩操作得到中间码流数据的H.264解码器;对中间码流数据的高层语法结构进行基于像素域的快速级联转码处理,输出AVS码流的高层语法结构的基于像素域的快速级联转码器;对中间码流数据中的I帧进行压缩域转码处理,并通过I帧序列输出模块输出AVS码流的I帧序列的I帧压缩域转码器;对中间码流数据中P帧中采用帧内编码的宏块进行压缩域转码处理的P帧帧内压缩域转码器;对中间码流数据中P帧中采用帧间编码的宏块进行压缩域转码处理,并通过P帧序列输出模块输出AVS码流的P帧序列的P帧帧间压缩域转码器;对中间码流数据中B帧中采用帧内编码的宏块进行压缩域转码处理的B帧帧内压缩域转码器;对中间码流数据中B帧中采用帧间编码的宏块进行压缩域转码处理,并通过B帧序列输出模块输出AVS码流的B帧序列的B帧帧间压缩域转码器;对上述转码器转换后的码流数据进行整体快速转码处理,最后通过AVS码流输出模块输出转换后的AVS码流的整体快速转码器。2、一种H.264到AVS视频码流转换装置,其特征在于,包括对多路H.264码流进行并行解压縮操作得到多路中间码流数据的H.264多路解码器;对多路中间码流数据高层语法结构进行基于像素域的并行快速级联转码处理,输出多路AVS码流的高层语法结构的基于像素域的快速级联多路转码器;对多路中间码流数据中的I帧进行并行压縮域转码处理,并通过I帧序列多路输出模块输出AVS码流的I帧序列的I帧压縮域多路转码器;对多路中间码流数据中P帧中采用帧内编码的宏块进行并行压縮域转码处理的P帧帧内压縮域多路转码器;对多路中间码流数据中P帧中采用帧间编码的宏块进行并行压縮域转码处理,并通过P帧序列多路输出模块输出AVS多路码流的P帧序列的P帧帧间压縮域多路转码器;对多路中间码流数据中B帧中采用帧内编码的宏块进行并行压縮域转码处理的B帧帧内压缩域多路转码器;对多路中间码流数据中B帧中采用帧间编码的宏块进行并行压縮域转码处理,并通过B帧序列多路输出模块输出AVS多路码流的B帧序列的B帧帧间压縮域多路转码器;对上述多路转码器转换后的多路码流数据进行并行整体快速转码处理,最后通过多路AVS输出模块输出多路AVS码流的整体快速多路转码器。专利摘要本实用新型公开了H.264到AVS的视频码流转换装置,其特征在于包含如下模块,H.264解码器、基于像素域的快速级联转码器、I帧压缩域转码器、I帧序列输出模块、P帧帧内压缩域转码器、P帧帧间压缩域转码器、P帧序列输出模块、B帧帧内压缩域转码器、B帧帧间压缩域转码器、B帧序列输出模块、整体快速转码器、AVS码流输出模块。本实用新型基于像素域的快速级联H.264到AVS转码策略、图像信息重用模式、QP映射方法以及运动向量映射,避免了大运算量的复杂计算,能够适用于高清晰、实时转码的视频应用需求。文档编号H04N7/26GK201282535SQ200820146470公开日2009年7月29日申请日期2008年8月18日优先权日2008年8月18日发明者张德雷,曾庆好申请人:深圳市铁越电气有限公司