一种量化噪声线性拟合方法、编码装置及编码方法与流程

文档序号:17483247发布日期:2019-04-20 06:35阅读:345来源:国知局
一种量化噪声线性拟合方法、编码装置及编码方法与流程

本发明涉及视频编码和处理领域,具体涉及一种量化噪声线性拟合方法、编码装置及编码方法。



背景技术:

目前市场上的各类型视频编码器模型,主要是针对消费类的应用场景,具体体现为码率较高,然而针对类似视频监控,大数据存储,存储网络传输等低码率/极低码率应用却没有太多针对性的策略。

这个情况主要体现在两个方面:

1,标准模型的定位:为消费类应用定制,而未对低码率应用进行算法优化;

2,基于目前标准模型的编码方法,在极低码率条件下存在某些技术缺陷。

编码器作为一种有损压缩处理单元,编解码的损失主要来自于量化损失,而作为目前主流的视频编码方法(jpeg,mpeg,avc,hevc),都采用频域量化的方法,而频域量化为确保时域能量的均衡,都采用均匀量化的方式实现,其实质旨在滤除频域高频分量,提升算数编码的压缩效率,但为追求高压缩率,低码率所采用的均匀强量化在滤除高频分量的同时势必会将部分的低频和dc分量也一并滤除,造成很强的量化损失,本发明基于前面的解释,对编码器建立一种全新的认识:既是一种去噪处理单元(高频滤波,滤除高频随机噪声),又是一种噪声产生单元(量化损失产生的量化噪声)。

目前在视频图像处理领域,从环境噪声,视频采集sensor,电路系统,传输信道噪声等都会引入各种噪声,因此必须要有去噪处理单元,而去噪的方法也会针对不同的噪声类型和噪声强度有所区别,例如噪声的分类,去噪方法作用的色彩空间,频域或时域/空域的作用等等。然而针对编码器的去噪应用,特别是低码率的视频编码器应用,又有其特殊性;进入到编码器的视频源一般不会是sensor采集的raw源,而是已经经过很多级前处理单元(3a等)预处理的视频源,肯定也包括2d/3d等去噪处理,对各类噪声都有一定程度的抑制作用,所以进入视频编码器的视频源会随着各级前处理单元,特别是去噪方法,去噪的强度,锐化的强度等不同的影响而呈现不同的视频风格,导致完全不同的编码效率。

因此,亟须提出一种量化噪声线性拟合方法、编码装置及编码方法以解决上述问题。



技术实现要素:

本发明的目的在于提供一种量化噪声线性拟合方法,改善主观质量的同时,确保客观数据的稳定;

本发明的又一目的在于提供一种编码装置及编码方法,可以有效嵌入到基于块处理的编码过程中,具有更快的处理速度和执行效率。

为了达到上述目的,本发明一方面提供了一种量化噪声线性拟合方法,包括:

获取一文件的原始像素值y及重构像素值r;

通过一m×i的时域窗对所述原始像素值y进行卷积运算,获取所述原始像素值y的均值uy及所述原始像素值y的方差所述m及i均为正整数;

获取线性拟合值x与原始像素值y及其均值uy的线性关系;

根据结构相似度的计算方法,获取所述线性关系的线性拟合系数值;

其中,y=r+n,所述n为量化噪声值,所述uy=ey,所述线性关系表示为:

x=(1-k)uy+ky,k∈[0,1],其中ex=ux,k为线性拟合系数。

可选的,在上述量化噪声线性拟合方法中,所述根据结构相似度的计算方法,获取所述线性关系的线性拟合系数值的步骤包括根据公式:

不相关条件:

获取结构相似度值与线性拟合系数值的关系,获取所述线性关系的线性拟合系数值;

其中,ssim表示结构相似度值,ux为x的均值,为x的方差,δxy为x及y的协方差,c1及c2均为常数,

可选的,在上述量化噪声线性拟合方法中,所述结构相似度值与线性拟合系数值的关系表示为:

当ssim为1时,获取最优线性拟合系数:

为达到上述目的,本发明又一方面提出一种编码装置,包括当前帧获取单元、滤波单元及编码器;所述当前帧获取单元获取一文件的第一个i帧,通过所述滤波单元根据结构相似度准则,在时域内对所述第一个i帧的量化噪声进行线性拟合,获取所述第一个i帧的滤波参数,对任一p帧或b帧中的当前帧进行滤波处理,输入所述编码器进行编码。

可选的,在上述编码装置中,所述编码装置还包括一结构相似度评价单元,用于根据所述编码器的输出获取滤波前后的当前帧的失真度度量。

为达到上述目的,本发明又一方面提出一种使用如上所述的任一编码装置进行编码的方法,包括:

当前帧获取单元获取一文件的第一个i帧;

滤波单元获取所述第一个i帧的原始像素值y及重构像素值r;

通过一m×i的时域窗对所述y进行卷积运算,获取所述原始像素值y的均值uy及所述原始像素值y的方差所述m及i均为正整数;

获取线性拟合值x与uy和y的线性关系;

根据结构相似度的计算方法,获取所述线性关系的线性拟合系数值k;

根据所述k获取所述第一个i帧的滤波参数,对所述文件的任一p帧或b帧中的当前帧进行滤波处理,输入所述编码器进行编码。

可选的,在上述编码方法中,所述线性拟合值x与uy和y的线性关系表示为:x=(1-k)uy+ky,k∈[0,1],其中ex=ux。

可选的,在上述编码方法中,获取所述线性关系的线性拟合系数值k的步骤包括,根据公式:

不相关条件:

获取结构相似度值与线性拟合系数值的关系,获取所述线性关系的线性拟合系数值k;

其中,ssim表示结构相似度值,ux为x的均值,为x的方差,δxy为x及y的协方差,c1及c2均为常数,

可选的,在上述编码方法中,所述结构相似度值与线性拟合系数值的关系表示为:

当ssim为1时,k为最优线性拟合系数,表示为:

综上所述,本发明提出的量化噪声线性拟合方法,先在时域内对一文件的原始像素值进行处理,提前滤除量化噪声,从而规避由于量化噪声过大导致的各类编码过程预测和量化问题;进一步的,获得线性拟合值与原始像素值的线性关系,然后采用基于ssim算法作为拟合的准则,获取线性拟合系数值,确保了客观数据的稳定性;更进一步的,本发明提出的编码装置及编码方法,可以有效的嵌入到基于块处理的编码过程中,根据结构相似度准则,获取量化噪声强度参数;再进一步的,本发明提出的编码装置直接由当前帧获取,不存在时域上的依赖和耦合,所以滤波处理过程可以依据编码器设计的特点,既可以进行帧级的处理,也可以把滤波处理嵌入到编码器逐块编码的处理过程中完成。

附图说明

图1为本发明一实施例中的编码装置示意图;

图2为本发明又一实施例中的编码装置示意图;

图3为使用图1中的编码装置进行编码的流程示意图。

具体实施方式

下面将结合示意图对本发明的具体实施方式进行更详细的描述。根据下列描述和权利要求书,本发明的优点和特征将更清楚。需说明的是,附图均采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施例的目的。

量化噪声由编码器量化过程产生,量化过程作用于预测残差的频域空间,编码器量化过程中,主要是为了滤除高频ac分量,因此可以认为dc系数是无损的,而且,量化系数仅与量化步长相关,而与当前和预测像素无关,因此,我们可以将编码量化噪声也看作是一种随机噪声模型,但这是一种比较理想的模型,因为量化噪声的产生,与预测的准确度,包括预测块的大小,当前块与参考块的匹配程度,还有图像纹理细节的不同等等因素相关,因此他不是严格的不相关,其不相关主要体现在全局统计特性上,而在局部主要体现为量化噪声方差分布的不均衡,因此,可以把编码量化过程的损失作为某种随机噪声进行处理。因此,本发明提出了一种量化噪声线性拟合方法,包括:

获取一文件的原始像素值y及重构像素值r;

通过一m×i的时域窗对所述原始像素值y进行卷积运算,获取所述原始像素值y的均值uy及所述原始像素值y的方差所述m及i均为正整数;

获取线性拟合值x与uy和y的线性关系;

根据结构相似度的计算方法,获取所述线性关系的线性拟合系数值;

其中,y=r+n,n为量化噪声值,所述uy=ey,所述线性关系表示为:

x=(1-k)uy+ky,k∈[0,1],其中ex=ux,k为线性拟合系数。

具体的,通过m×n的时域窗对原始像素值y进行卷积运算,并获得:

uy=ey

由于编码量化对dc系数无损(近似无损),因此可以认为u等于编码后的滤波均值,即重构像素值r的均值,获得y=r+n,其中n即为量化噪声值。

所述线性拟合值x与uy和y的线性关系可以表示为x=(1-k)uy+ky,k∈[0,1],其中ex=ux。

下述步骤为k的推导步骤,根据结构相似度(ssim)的计算方法,

假定线性拟合值x同样满足不相关条件:

y=x+e

uy=ux

综合上式,可得

其中,

得到ssim的判决公式,

其中k∈[0,1]。

可选的,在上式中,ssim的值可取任一整数值,本发明此不作任何限制,优选的,当ssim=1时,

所述k为最优线性拟合系数。

本发明中的量化噪声线性拟合方法使用结构相似度准则,确保了客观数据的稳定性,增加了执行效率,具有实用性。

参考图1,本发明一实施例中的编码装置,包括当前帧获取单元、滤波单元及编码器。所述当前帧获取单元获取一文件的第一个i帧,通过所述滤波单元根据结构相似度准则,在时域内对所述第一个i帧的量化噪声进行线性拟合,获取所述第一个i帧的滤波参数,对任一p帧或b帧中的当前帧进行滤波处理,输入所述编码器进行编码。

可选的,参考图2,所述编码装置还包括一结构相似度评价单元,用于根据所述编码器的输出获取滤波前后的当前帧的失真度度量。

基于编码序列采用的rdo策略,在相同的qp条件下,保证了编码逐帧图像psnr的连续和稳定,因此,可以认为逐帧的量化损失在稳定在某个水平上。因此,在实际编码装置中,由于第一个i帧(帧内预测编码)的存在,所以,本实施例对第一个i帧并不进行滤波操作,只是进行ssim评价的计算,获取量化噪声强度的参数,依据本发明提供量化噪声的线性拟合方法获取k,从而获取第一帧的滤波系数,由于量化噪声强度逐帧平稳的特点,可以取第一帧的k值直接作为第二帧的滤波参数,然后直接对第二个帧的当前帧进行滤波处理。

具体的,参考图3,使用上述编码装置对一文件进行编码的编码方法包括:

步骤s1:当前帧获取单元获取一文件的第一个i帧;

步骤s2:滤波单元获取所述第一个i帧的原始像素值y及重构像素值r;

通过一m×i的时域窗对所述y进行卷积运算,获取所述原始像素值y的均值uy及所述原始像素值y的方差所述m及i均为正整数;

获取线性拟合值x与uy和y的线性关系;

根据结构相似度的计算方法,获取所述线性关系的线性拟合系数值k;

步骤s3:根据所述k获取所述第一个i帧的滤波参数,对所述文件的任一p帧或b帧中的当前帧进行滤波处理,输入所述编码器进行编码。

具体的,所述线性拟合值x与uy和y的线性关系及结构相似度的计算方法如式1,2,3以及4获得,不作赘述。

由于本发明提供的编码方法直接由当前帧获取,在时域内进行处理能够,提升一定能够的误码性能,同时可以有效的嵌入到基于块处理的编码过程中,具有实用性。

综上所述,本发明提出的量化噪声线性拟合方法,先在时域内对一文件的原始像素值进行处理,提前滤除量化噪声,从而规避由于量化噪声过大导致的各类编码过程预测和量化问题;进一步的,获得线性拟合值与原始像素值的线性关系,然后采用基于ssim算法作为拟合的准则,获取线性拟合系数值,确保了客观数据的稳定性;更进一步的,本发明提出的编码装置及编码方法,可以有效的嵌入到基于块处理的编码过程中,根据结构相似度准则,获取量化噪声强度参数;再进一步的,本发明提出的编码装置直接由当前帧获取,不存在时域上的依赖和耦合,所以滤波处理过程可以依据编码器设计的特点,既可以进行帧级的处理,也可以把滤波处理嵌入到编码装置逐块编码的处理过程中完成。

上述仅为本发明的优选实施例而已,并不对本发明起到任何限制作用。任何所属技术领域的技术人员,在不脱离本发明的技术方案的范围内,对本发明揭露的技术方案和技术内容做任何形式的等同替换或修改等变动,均属未脱离本发明的技术方案的内容,仍属于本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1