一种基于人眼视觉特性的图像编码方法

文档序号:7946520阅读:109来源:国知局
专利名称:一种基于人眼视觉特性的图像编码方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于人眼视觉特性的图像编码方法。
背景技术
随着通信信道及计算机容量和速度的提高,图像信息已经成为计算机系统处理的 一个重要的处理对象。与文字信息不同,图像信息需要大的存储容量和宽的传输信道,对图 像数据的压縮就成为了迫切需求。图像压縮是指以较少的比特表示原来的像素矩阵的技 术,也称图像编码。图像数据之所以能被压縮,就是因为数据中存在着冗余。图像数据的冗 余主要表现为图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在 相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压縮的目 的就是通过去除这些数据冗余来减少表示数据所需的比特数。 对于一副给定数字图像,它的原始表示一般是空间像素阵列,这是它的空间域表 示。在空间域表示中,由于相邻像素之间很大的相关性,冗余信息分布在较大范围的空间 像素集中,直接处理比较困难。最常用的处理方法是通过一种变换,将图像从空间与映射 到变换域中,在变换域中进行简捷有效的处理。小波变换是20世纪80年代中期出现的新 的时/频域信号分析工具,1989年Mallat将小波变换用于信号处理,提出了多分辨率分析 的概念,并将小波分析首次应用于图像编码中。之后小波变换以其良好的时频局部特性和 去相关能力以及具有与人眼视觉特性相符的多分辨分析能力,在图像压縮编码领域逐渐得 到广泛应用,并取得了很好的效果。1993年Shapiro根据小波零树的概念提出了嵌入式零 树小波编码(EZW)算法,该算法以其高效的编码效率和良好的图像还原质量被认为是编码 效率最好的图像压縮算法之一。在EZW算法基础上Said和Pearlman提出了分层树的集划 分(SPIHT)图像编码算法,它是对EZW算法的一种更一般化的表示,它吸取了零树的许多思 想,其目的也是通过方向树最为有效的表示有效值映射,通过对树的划分,将尽可能多的无 效值系数汇集在一个子集中,用一个单位符号表示。随后不少EZW的改进算法也被相继推 出,但是经典EZW算法以及这些改进算法没有充分考虑人眼视觉特性,影响了图像复原质 量。若能在图像编码过程中充分利用人眼的视觉特性,则根据Shannon率失真理论可以采 用更低的编码比特率使得图像的主观质量保持不变。 研究表明,人眼对图像边缘区信息的失真很敏感,对图像平滑区信息的失真比较 敏感,而对图像纹理区信息的失真不敏感。本方法在经典EZW算法的基础上,对图像边缘和 极平滑区小波系数分配更多的比特数使之量化更精细。由于更加注重图像边缘和极平滑区 的信息,重构恢复的图像具有更佳的主观视觉效果。

发明内容
本发明的目的是提供一种基于人眼视觉特性的图像编码方法,提高有损压縮重建 图像的主观视觉质量,使得原始图像在进行高压縮率的有损压縮编码后所恢复的图像具有更佳的视觉观测效果。
本发明的目的通过下述方法和步骤实现 首先对原始图像进行小波分解,然后对小波系数根据熵值和方差进行分类,划分 出视觉重要系数和普通系数,据此根据划分结果利用算术编码将两类系数分类量化编码得 到最终码流。
以下对本发明的内容作进一步阐述 1、对原始图像进行小波分解,并对小波变换后系数根据熵和方差进行分类,划分 出视觉重要系数和普通系数 小波变换以其良好的时频局部特性和去相关能力以及具有与人眼视觉特性相符 的多分辨分析能力,在图像压縮编码领域逐渐得到广泛应用。小波变换将图像分解成小波 基函数加权和的形式,保持原图像在各种分辨率下的精细结构。图像经过小波变换后被分 割成4个频带水平、垂直、对角线和低频,低频部分还可以继续分解。图像经过小波变换后 生成的小波图像的数据总量与原图像的数据总量相等,但由于生成的小波图像具有与原图 像不同的特性,即图像能量主要集中在低频部分,水平、垂直和对角线部分的能量则很少。 水平、垂直和对角线高频子带表征了原始图像在水平、垂直和对角线方向的边缘、轮廓和纹 理信息,低频子带是对原始图像的逼近。由于将大多数重要的可视信息压縮到少量的系数 中,则剩下的系数可以被粗略地量化或截取为O,而图像几乎没有失真。如图l为Lena图像 三级小波分解效果图。由于人眼对图像边缘区信息的失真很敏感,对图像平滑区信息的失 真比较敏感,而对图像纹理区信息的失真不敏感,据此将小波分解后的系数分为边缘系数, 平滑区系数以及纹理区系数。由于图像平滑区的熵值较小,而熵值较大的区域则属于图像 边缘区或纹理区,同时纹理区对应的方差较小,而边缘区对应的方差较大,所以可以选择合 适的熵阈值和方差阈值来确定图像不同区域。通过计算小波系数的四个子节点的熵值和方 差的大小来反映该小波系数是否属于边缘系数,平滑系数还是纹理系数。若某小波系数X 的4个子节点系数为XI, X2, X3和X4,该四个子节点系数的熵值定义为
<formula>formula see original document page 4</formula>其中<formula>formula see original document page 4</formula>
同时定义四个子节点系数的方差为<formula>formula see original document page 4</formula>
其中<formula>formula see original document page 4</formula>
当子节点系数的熵值小于某个阈值S (取值较小)时,则父节点系数为极平滑区 系数,(简称为平滑区系数),否则为边缘或纹理区系数,而同时当子节点系数方差大于某 个阈值A时,则父节点系数为边缘区系数,否则为纹理区系数。而对于最高频系数,则以其 父节点系数的性质来判定,即父节点系数为边缘区系数,则其为边缘区系数。本方法将边缘 区系数和极平滑区系数视为视觉重要系数,纹理区系数则视为普通系数。
2、用算术编码将两类系数分类量化编码 根据上面的小波系数分类结果,定义6种符号零树根T、孤立零值Z、正重要系数 P,负重要系数N,正视觉重要系数R和负视觉重要系数S。通过逐次逼近量化完成嵌入式编码。也即设置普通阈值序列T。, 1\,…,V工来决定重要系数,其中Ti二Ti—乂2且初始阈值 T。 = 2M,M= 1og2[Max(abs(Xi))],Xi是小波系数。同时设置视觉阈值系列DT。, Dl\,…, DTN—!来决定视觉重要系数,其中Dl\ = DT卜乂2,而Dl\ = T乂2。这样在某一量化级1\,对于 相同大小的小波系数,视觉重要系数由于量化更精细而具有更小的量化误差(普通小波系 数最大量化误差为Ti/4,而边缘和平滑区系数为DT乂4 = T乂8),同时更小一级的视觉重要 系数(因为视觉重要系数量化级DTi = T乂2)也被同时量化。显然当设定某一特定比特率 后,视觉重要系数(边缘和极平滑区系数)分配了更多的比特率。 本发明所提出的基于人眼视觉特性的图像编码方法,有效地提高了有损压縮重建 图像的主观视觉质量,使得在满足一定图像质量条件下,用尽可能少的比特数来表示原始 图像,以提高图像传输的效率和减少图像存储的容量。


图1是小波系数树状结构。 图2是Lena图像三级小波分解效果图。 图3是本发明与EZW算法直观重构图像比较,其中(a)、 (b)分别为Man标准灰度 图像在比特率0. 25b卯下的EZW算法的重构图像和本发明的重构图像。
具体实施方案 以下结合具体的实施例,对本发明做进一步的阐述。实施例仅用于对本发明做说
明而不是对本发明的限制。
实施例1 本实施例以512X512X8bit的标准Man灰度图像为例,介绍整个图像编码过程,
并在最后用表格及图像形式表示编码结果和重建图像的主观视觉质量效果。 1、对小波变换后的系数进行主扫描 选取标准Man灰度图像(原始图像)作为编码对象,采用D (9, 7)双正交小波进行
小波变换,扫描每一个小波系数以产生系数符号。
(1)如果系数幅度大于阈值T且为正数,输出符号P ; (2)如果系数幅度大于阈值T且为负数,,输出符号N ; (3)如果系数幅度小于阈值T但大于阈值T/2且为正数,而树枝中的4个孩子节点 系数熵值小于阈值S或者方差大于阈值A,输出符号R; (4)如果系数幅度小于阈值T但大于阈值T/2且为负数,而树枝中的4个孩子节点 系数熵值小于阈值S或者方差大于阈值A,输出符号S; (5)如果系数不满足上面四者之一,而树枝中有子节点系数值大于阈值T,则用符 号Z表示; (6)如果系数及其所有节点系数均小于T,而且该系数又不满足边缘平滑区系数 条件,则该系数为零树根,输出T。 2、对小波系数辅扫描,量化带符号P、 N、 R和S的系数并进行编码 (l)对于P和N的量化。在量化系数之前要构造量化器。量化器的输入间隔为 (2)对于符号R和S,由于它们对应了图像边缘或平滑区,量化器的输入间隔为 在完成主扫描和辅扫描之后输出是符号集{P,N,R,S,T,Z,0,1}中的一系列符号。
最后采用Huffman编码可得到最终的可传输编码码流。 3、结果分析 由于PSNR对评价图像的主观视觉效果具有一定的局限性,本方法采用更接近主 观视觉评价质量的MSSIM值以及VIF值作为图像质量评价指标来衡量重构图像的实际主观 视觉质量,其中MSSIM和VIF值越大,表明恢复图像的主观质量越好。图3中的(a)和(b) 分别是Man标准灰度图像在比特率O. 25b卯下的EZW算法的恢复图像和本发明的恢复图 像。图(b)的边缘比图(a)的边缘更加清晰,如手表,手背,帽子,头发,衣服花纹等边缘区 更清晰,具有更好的视觉效果。表1是不同码率下重构图像的MSSIM和VIF值比较。由表l 可以看出对于平滑图像和边缘丰富图像本方法相对于经典EZW算法,重构图像具有更好的 主观视觉质量。而对于纹理丰富图像在低比特率下本方法同样可以得到更好视觉质量的重 构图像。 表1、本发明所述的方法与EZW算法的编码结果(即MSSIM/VIF值)比较
比特率 /bppLena图像Man图像Mandrill图像EZW本方法EZW本方法EZW本方法
0.1000.758/0.160.761/0.160.621/0.110.631/0.120.382/0.060.419/0.07
90219
0.2000.816/0.250.824/0.260.704/0.190.719/0.210.493/0.110.512/0.13
814991
0.2500.840/0.310.853/0.310.726/0.230.744/0.240.546/0.140.554/0.14
184880
0.5000.890/0.480.901/0.500.817/0.360.831/0.400.636/0.210.659/0.22
33了489
l細0.927/0.660.935/0.680.904/0.570.卯5/0.580.791/0.350.783/0.32
639864 实验结果表明,本发明能很好地提高有损压縮重建图像的主观视觉质量,使得原 始图像在进行高压縮率的有损压縮编码后所恢复的图像具有更佳的视觉观测效果。
权利要求
一种基于人眼视觉特性的图像编码方法,其特征在于首先对原始图像进行小波分解,然后对小波系数根据熵值和方差进行分类,划分出视觉重要系数和普通系数,据此根据划分结果利用算术编码将两类系数分类量化编码得到最终码流。
2. 根据权利要求1所述的基于人眼视觉特性的图像编码方法,其特征在于对原始图像 小波分解后的小波系数进行分类特征如下原始图像经过小波变换后被分割成水平、垂直、对角线和低频4个频带,小波系数的分 布呈树状形式分布,水平、垂直和对角线高频子带表征了原始图像在水平、垂直和对角线方 向的边缘、轮廓和纹理信息,低频子带是对原始图像的逼近,将大多数重要的可视信息压縮 到少量的系数中,剩下的系数被粗略地量化或截取为0 ;将小波分解后的系数分为边缘系数,平滑区系数以及纹理区系数,图像平滑区的熵值 较小,熵值较大的区域则属于图像边缘区或纹理区,同时纹理区对应的方差较小,边缘区对 应的方差较大;通过计算小波系数的四个子节点的熵值和方差的大小来反映该小波系数是 否属于边缘系数,平滑系数还是纹理系数;若某小波系数X的4个子节点系数为XI, X2, X3 和X4,该四个子节点系数的熵值定义为 <formula>formula see original document page 2</formula>其中 I(i) = -1og2(probs(Xi))同时定义四个子节点系数的方差为 D(X)= J]("-柳)2i=U,3,4其中<formula>formula see original document page 2</formula>当子节点系数的熵值小于某个阈值s (取值较小)时,则父节点系数为极平滑区系数, 否则为边缘或纹理区系数,而同时当子节点系数方差大于某个阈值A时,则父节点系数为 边缘区系数,否则为纹理区系数;对于最高频系数,则以其父节点系数的性质来判定,即父 节点系数为边缘区系数,则其为边缘区系数;边缘区系数和极平滑区系数为视觉重要系数, 纹理区系数视为普通系数。
3. 根据权利要求1所述的基于人眼视觉特性的图像编码方法,其特征在于利用算术编 码将两类系数分类量化编码,根据小波系数分类结果,定义6种符号零树根T、孤立零值Z、 正重要系数P,负重要系数N,正视觉重要系数R和负视觉重要系数S,通过逐次逼近量化完 成嵌入式编码,设置普通阈值序列T。, 1\,…,TN—工来决定重要系数,其中1\ = T卜乂2且初始阈 值T。 = 2M,M= 1og2[Max(abs關],Xi是小波系数,同时设置视觉阈值系列DT。,Dl\,…, DTN—i来决定视觉重要系数,其中Dl\ = DT卜乂2,而DTi = T乂2 ;在某一量化级1\,对于相同大 小的小波系数,视觉重要系数由于量化更精细而具有更小的量化误差,更小一级的视觉重 要系数也被同时量化。
全文摘要
本发明属于图像处理技术领域,涉及一种基于人眼视觉特性的图像编码方法。本发明根据人眼对图像边缘和平滑区信息的失真要比纹理区失真更敏感这一视觉特性,首先对原始图像进行小波分解,然后将小波变换后的系数利用熵值和方差进行分类为视觉重要系数和普通系数,最后采用算术编码将不同系数分类编码得到最终码流。本发明提高了有损压缩重建图像的主观视觉质量,使得原始图像在进行高压缩率的有损压缩编码后所恢复的图像具有更佳的视觉观测效果,因此在大规模图像存储及图像数据传输上具有较强的可行性。
文档编号H04N7/26GK101783939SQ20091004549
公开日2010年7月21日 申请日期2009年1月16日 优先权日2009年1月16日
发明者付伟, 顾晓东, 马成才 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1