图像预去噪的方法

文档序号:7620889阅读:289来源:国知局
专利名称:图像预去噪的方法
技术领域
本发明涉及多媒体技术中的图像通信领域,特别是涉及发送端图像预去噪的方法。
视频图像包含的数据量一般很大,不便于直接进行视频图像通讯(如会议电视、可视电话、远程教学等)与存储(如多媒体数据库、VCD、DVD等),特别是对视讯业务系统来说,除了视频外,还包括音频、T.120中的数据、控制信息等内容,并且对实时性、交互性和图像质量要求很高,故一般要对视频图像数据进行较大比率的压缩,以便获得满意的视频效果。现有的视频图像压缩国际标准有国际电信联盟ITU-T制定的H.261、H.263和国际标准化组织ISO制定的MPEG1、MPEG2、MPEG4,它们分别包含了当今的一些重要压缩技术,其中有许多共同的地方,如都采用CIF(公共中间格式)格式、都采用运动补偿和DCT(离散余弦变换)混合模式等。
在根据例如以上的这些标准实现具体的视频系统时,由于所获取的视频图像中一般都不可避免地包含了一些不需要的噪声,如高频脉冲噪声(图像小区域内亮度分量和色度分量的突然大幅度变化值)和随机噪声(如模/数转换所引起的噪声、信号采样时的量化噪声),如果不在压缩编码前进行去噪处理,图像的压缩效率将会受到很大影响。因此,为了得到较好的压缩效率和图像质量,一般都要进行必要的前处理和后处理,以去掉或减小夹杂在图像中的噪声。
已有的去噪方法很多,一般都是采用适当的滤波方法,可在空间域或频率域进行,按是否线性可分为线性滤波,如1-D FIR(一维有限脉冲响应)滤波、2-D FIR(二维有限脉冲响应)滤波等;非线性滤波,如中值滤波、阈值滤波等。
参考文件[1],即US5787203“Method and system for filteringcompressed video images”,中公开的方法,在空间城内进行滤波处理,采用非线性滤波器方法在DCT前对运动估计后的差值图像进行两次滤波,首先通过阈值滤波器可减小或消除随机噪声,然后通过十字形中值滤波器可消除高频脉冲噪声,可以使总码字数减小10%-20%。参考文件[2],即US5325125“Intra-framefilter for video compression systems”,中公开的方法,在压缩前直接对图像帧本身进行线性滤波处理,采用2-D滤波器消除图像对角线方向的高频分量和高频脉冲噪声,从而减小编码码字数,提高压缩效率。
为有效地去掉噪声,现有的去噪方法一般要在原处理流程中增加一个1-D或2-D去噪滤波处理过程,而滤波计算一般耗时较多,从而增加了计算负担,对于实时性、交互性要求很高的会议电视系统而言,需要计算耗时较少的去噪方法,并且要尽量地保护图像内容。现有技术中的阈值滤波法就是一种计算量较小的图像预去噪的方法,其基本原理是在发送端CIF格式图像的图像块DCT系数量化中,依照一定顺序依次处理各个DCT系数,如果本次处理的DCT系数值小于或等于一个预先设定的阈值,则令该DCT系数值为0,如果本次处理的DCT系数值大于该预先设定的阈值,则该DCT系数值保持原值不变。这种图像预去噪方法本质上是一种固定阈值滤波的方法,其缺点在于阈值的选取非常的矛盾,如果阈值选的较小则可以达到较高的图像质量,但会由于DCT系数的0值过少而导致达不到满意的图像压缩效率;如果阈值选的较大则可以达到满意的图像压缩效率,但会由于DCT系数的0值过多而导致达不到较高的图像质量。
本发明的目的在于提供一种图像预去噪的方法,其本质上结合了一种自适应阈值滤波的方法,相比较于现有技术中的固定阈值滤波的方法,可以在不降低图像质量的前提下进一步提高图像压缩效率。
本发明的目的是这样实现的一种图像预去噪的方法,其特征在于至少包含在发送端CIF格式图像的图像块DCT系数量化中,依照一定顺序依次处理各个DCT系数,如果本次处理的DCT系数值小于或等于一个对应于本次处理的阈值,则令该DCT系数值为0,且令该阈值增大后作为对应于下一次DCT系数处理的阈值,如果增大后的阈值大于预先设定的一个阈值上限则令其等于该阈值上限;如果本次处理的DCT系数值大于对应于本次处理的阈值,则令该阈值恢复为预先设定的一个初始阈值后作为对应于下一次DCT系数处理的阈值。
较佳地,本发明的图像预去噪方法进一步包含在发送端将视频图像从CCIR601(CCIR是国际无线电通信咨询委员会的缩写,CCIR601是CCIR提出的601标准,定义了对应于525行和625行电视系统的电视演播的数字视频标准)格式转换为CIF格式时,采用截止频率小于0.5π的低通FIR滤波器,分别在水平和垂直方向对亮度分量、色度分量进行滤波处理。
较佳地,所述的低通FIR滤波器是一维低通FIR滤波器。
较佳地,所述的低通FIR滤波器的截止频率可以在0.25π至0.4π之间。
较佳地,本发明的图像预去噪方法进一步包含在采用截止频率小于0.5π的低通FIR滤波器,分别在水平和垂直方向对亮度分量、色度分量进行滤波处理后,进一步采用一个二维中值滤波器对图像进行滤波处理。
较佳地,在本次处理的DCT系数值小于或等于对应于本次处理的阈值的情况下,则令该DCT系数值为0,且令该阈值加1后作为对应于下一次DCT系数处理的阈值。
较佳地,所述依次处理各个DCT系数的顺序为从DCT系数表的左上角开始的之字型。
较佳地,所述的初始阈值和所述的阈值上限可以这样预先设定初始阈值等于kQ,阈值上限等于1.5kQ,其中Q为量化级,k为根据信道带宽的大小确定的取值范围在0至1之间的一个常数。
本发明提供的图像预去噪的方法,可以理解为是结合了一种自适应阈值滤波的方法,相较于现有技术中的固定阈值滤波的方法,可以在不降低图像质量的前提下更有效地滤除噪声,从而进一步提高图像压缩编码效率。当然,进行上述非线性阈值滤波处理后,在滤除噪声的同时图像的部分边缘信息也将丢失,但根据人眼对图像中低频分量的敏感性大大高于高频分量的视觉特性,只要在人的视觉感知允许范围内,采用上述自适应阈值处理,可以获得较好的图像质量。自适应阈值滤波的另一个优点是计算量相对较小,非常适合对于实时性、交互性要求很高的视讯业务系统。
为使本发明的目的、技术方案和优点更加清楚明白,以下举实施例,并结合附图,对本发明进一步详细说明。所应理解的是,其仅用于对本发明的阐述说明而非限制。其中

图1示出了H.26X(即H.261、H.263等)格式的8×8图像块的DCT系数分布;图2示出了依照本发明的一个较佳实施例的图像预去噪方法的基本架构;图3示出了图2的较佳实施例中的自适应阈值滤波的处理流程。
图4示出了依照本发明的另一个较佳实施例的图像预去噪方法的基本架构。
图2示出了依照本发明的一个较佳实施例的图像预去噪方法的基本架构,也即滤波处理在H.26X视频压缩过程中所处的位置。如图2所示,本实施例采用了两个滤波器一维低通FIR滤波器和自适应阈值滤波器,其中一维低通FIR滤波器作为线性的高频脉冲噪声滤波器,自适应阈值滤波器作为非线性的随机噪声滤波器,分别在空间域和频率域进行滤波处理。以下将对本实施例中的一维低通FIR滤波器和自适应阈值滤波器分别进行说明。
如图2所示,在将视频图像从CCIR 601格式转换为CIF格式时,采用一维低通FIR(有限脉冲响应)滤波器作为高频脉冲噪声滤波器,分别在水平和垂直方向对亮度分量、色度分量进行滤波处理,在进行图像格式转换的同时,将图像中所包含的高频脉冲噪声去掉。当然,图像中的相应高频部分也将被滤掉,但是,根据人眼对图像中低频分量的敏感性大大高于高频分量的视觉特性,只要在人的视觉感知允许范围内,采用适当截止频率的低通滤波器,可以获得较好的图像质量。
针对本实施例中一维FIR低通滤波器的截止频率的选取,可以将图像看成一维信号进行频谱分析,通过对H.26X压缩前图像和重构图像的频谱的拟合曲线进行对比,可以看出两者差别较大,而经过较小截止频率(<0.5π)的滤波器滤波后的图像和重构图像的频谱的拟合曲线之间却相差甚小,根据前者差值情况可以帮助我们确定截止频率的范围,一般可取为0.25π至0.4π。以七阶滤波器为例,本实施例中的低通FIR滤波器可以是截止频率为0.4π的滤波器h={-2/256,12/256,66/256,104/256,66/256,12/256,-2/256}。
经一维低通FIR滤波后,图像经过H.26X压缩后的码字数可减小10%-20%,如在相同量化级时图像质量基本上没有什么差别,但在实际的H.26X系统中,一般的控制策略都会在缓冲区占用量减小时降低量化级,从而可以提高图像质量。
以下针对本实施例中的自适应阈值滤波进行说明。图1示出了H.26X格式的8×8图像块的DCT系数分布。如图1所示,8×8图像块差值信号经过DCT变换(离散余弦变换)后,低频分量位于左上部,高频分量则位于右下部。低频分量对应于图像的细节内容,而高频分量则对应于图像的边缘信息和夹杂于图像中的噪声,例如随机噪声和高频脉冲噪声。由于经过高频脉冲噪声滤波后已经滤除了大部分高频脉冲噪声,因此,在这里主要是要滤除随机噪声。
本实施例中的自适应阈值滤波器,按照之字型(Zig-zag)扫描顺序,依次处理64个DCT系数。其详细处理流程如图3所示,其中,*DCT_Coeff为指向DCT系数的指针,DCT系数的阈值Thresh与量化级Q值相关,与固定阈值相比,更适应于图像内容的变化和有利于图像重要内容的保护。Thresh_Max为设定的阈值上限,Thresh_Max取为1.5kQ,初始阈值取为kQ,其中k值的取值范围为0.0至1.0,其值根据信道带宽的大小来确定,信道带宽小时取较大的k值,例如低于384kbps时可取为1.0,信道带宽大时取较小的k值,例如2Mbps时可取为0.4。如果系数值小于或等于阈值Thresh,则将系数值取为0,并将阈值加1,这样处理有利于尽量多地出现连零的情况,从而减小编码码字数,提高压缩效率。当阈值Thresh增加到大于阈值上限Thresh_Max时,则取为Thresh_Max值。如果系数值大于阈值Thresh,则将阈值Thresh恢复为初始阈值kQ,这样处理有利于保护图像中重要的边缘信息。
当然,进行上述非线性阈值滤波处理后,在滤除噪声的同时图像的部分边缘信息也将丢失,但根据人眼对图像中低频分量的敏感性大大高于高频分量的视觉特性,只要在人的视觉感知允许范围内,采用上述自适应阈值处理,可以获得较好的图像质量。
本实施例是一种线性滤波和非线性滤波相结合、空间域滤波和频率域滤波相结合、以去掉视频图像噪声的高效的去噪方法。其分别采用一个线性滤波器和一个非线性滤波器,可以以较小的计算代价减小或消除视频图像中存在的高频脉冲噪声和随机噪声。具有使用方便、计算负担小等优点。第一次去噪只是选用了一个截止频率较低的滤波器以进行格式转换,并不增加任何计算负担。第二次去噪在DCT量化时使用自适应域值滤波器,由图3可知,需要增加的计算量非常小。本实施例的去噪方法可以使码字数减小10%到30%,从而提高视频压缩效率和图像质量。
图4示出了依照本发明的另一个较佳实施例的图像预去噪方法的基本架构。该较佳实施例是在前一实施例的基础上再增加一个3X3二维中值滤波器,设置在转换为CIF格式图像之前。考虑到运算量较大,该中值滤波器宜采用硬件实现方式或DSP软件实现方式。由于中值滤波器具有较好地去掉脉冲噪声和保持图像边缘的特点,再结合后面的自适应阈值滤波处理,这样就可以得到很好的图像去噪效果。
以上实施例仅用以说明本发明而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围,其均应涵盖在本发明的权利要求范围当中。
权利要求
1.一种图像预去噪的方法,其特征在于至少包含在发送端CIF格式图像的图像块DCT系数量化中,依照一定顺序依次处理各个DCT系数如果本次处理的DCT系数值小于或等于一个对应于本次处理的阈值,则令该DCT系数值为0,且令该阈值增大后作为对应于下一次DCT系数处理的阈值,如果增大后的阈值大于预先设定的一个阈值上限则令其等于该阈值上限;如果本次处理的DCT系数值大于对应于本次处理的阈值,则令该阈值恢复为预先设定的一个初始阈值后作为对应于下一次DCT系数处理的阈值。
2.如权利要求1所述的图像预去噪的方法,其特征在于进一步包含在发送端将视频图像从CCIR601格式转换为CIF格式时,采用截止频率小于0.5π的低通FIR滤波器,分别在水平和垂直方向对亮度分量、色度分量进行滤波处理。
3.如权利要求2所述的图像预去噪的方法,其特征在于,所述的低通FIR滤波器是一维低通FIR滤波器。
4.如权利要求2所述的图像预去噪的方法,其特征在于,所述的低通FIR滤波器的截止频率可以在0.25π至0.4π之间。
5.如权利要求2所述的图像预去噪的方法,其特征在于进一步包含在采用截止频率小于0.5π的低通FIR滤波器,分别在水平和垂直方向对亮度分量、色度分量进行滤波处理后,进一步采用一个二维中值滤波器对图像进行滤波处理。
6.如权利要求1所述的图像预去噪的方法,其特征在于,在本次处理的DCT系数值小于或等于对应于本次处理的阈值的情况下,则令该DCT系数值为0,且令该阈值加1后作为对应于下一次DCT系数处理的阈值。
7.如权利要求1所述的图像预去噪的方法,其特征在于,所述依次处理各个DCT系数的顺序为从DCT系数表的左上角开始的之字型。
8.如权利要求1所述的图像预去噪的方法,其特征在于,所述的初始阈值和所述的阈值上限可以这样预先设定初始阈值等于kQ,阈值上限等于1.5kQ,其中Q为量化级,k为根据信道带宽的大小确定的取值范围在0至1之间的一个常数。
全文摘要
一种图像预去噪的方法,至少包含:在发送端CIF格式图像的图像块DCT系数量化中,依照一定顺序依次处理各个DCT系数:如果本次处理的DCT系数值小于或等于一个对应于本次处理的阈值,则令该DCT系数值为0,且令该阈值增大后作为对应于下一次DCT系数处理的阈值,如果增大后的阈值大于预先设定的一个阈值上限则令其等于该阈值上限;如果本次处理的DCT系数值大于对应于本次处理的阈值,则令该阈值恢复为预先设定的一个初始阈值后作为对应于下一次DCT系数处理的阈值。
文档编号H04N7/50GK1372224SQ0110902
公开日2002年10月2日 申请日期2001年2月27日 优先权日2001年2月27日
发明者熊联欢, 王静, 陈震, 汪洪源 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1