一种基于三维自组织映射的立体图像编码方法
【专利摘要】本发明公开了一种基于三维自组织映射的立体图像编码方法,用3DSOM算法对左右图像,获得最优的量化码书;将左图作为输入矢量,进行量化编码,由左图和量化码矢获得量化误差,并对其进行DCT变换、量化和霍夫曼编码;解码端用重建左图、视差估计误差和视差矢量重建右图,实现对立体图像的有效编码。还引用了一个距离不等式作判据,同时引入了一个频率敏感因子,对三维自组织映射算法进行了改进,降低了失真测度计算复杂度,提高了码书性能,接着本发明将改进的三维自组织映射算法应用到了立体图像编码中,有效的提高了左图像的编码效率,降低了重建右图的方块效应。
【专利说明】一种基于三维自组织映射的立体图像编码方法
【技术领域】
[0001] 本发明涉及图像处理领域,具体为一种基于三维自组织映射的立体图像编码方 法。
【背景技术】
[0002] 立体图像增加了景物的深度信息,具有强烈的临场感和真实感,因此正越来越受 到人们的追捧,立体图像目前应用最广泛的是双目视图方案,利用双目视差原理产生立体 感,但与二维平面图像相比,立体图像数据量成倍的增加了,因此,需要对立体图像进行压 缩编码,以便能有效地传输和存储。
[0003] 为了解决上述问题,目前主要的立体图像编码方法有基于小波法、与MPEG(Moving PicturesExpertsGroup,动态图像专家组)标准结合基于块的方法以及基于模式识别的 编码方法。
[0004] 方法1 :基于小波的立体图像编码方法对参考图像和估计的视差图都采用小波变 换编码,而视差估计则采用简化的块图像匹配方法,该方法虽然大大降低计算复杂度,但当 压缩比较高时,重建图像的质量较差。
[0005] 方法2:与MPEG标准结合的算法是当前在实际中使用较多的方案,该方案使用 JPEG(JointPhotographicExpertsGroup,联合图像专家组)标准对左图像进行编码,利 用视差估计技术从重建左图像获取预测右图像,预测误差也使用类似于JPEG标准的方法 进行编码,该方案虽考虑到了左右图像之间的相关性,但压缩效率仍较低,且重建图像存在 明显的块效应。
[0006] 方法3 :基于模式识别的立体图像编码方法是一种新的图像编码方法,该方法对 右图像采用DE(DisparityEstimation,视差估计)补偿技术编码,对左图像则使用基于 SOM(Self-organizingMap,自组织映射)算法的矢量量化编码来取代传统的JPEG方法,矢 量量化与视差估计的残差均使用DCT(DiscreteCosineTransform,离散余弦变换)+霍夫 曼进行编码,该方法能较好的克服变换编码适应性不足的缺点且压缩效率较高,但计算复 杂度高,同时也存在一定的方块效应。
【发明内容】
[0007] 针对现有技术的不足,本发明提供一种基于三维自组织映射的立体图像编码方 法,该方法降低了算法计算复杂度,提高了左图像的编码效率同时明显降低了重建右图的 方块效应。
[0008] 实现本发明目的的技术方案是:
[0009] 一种基于三维自组织映射的立体图像编码方法,包括如下步骤:
[0010] 1)米用 3DS0M(Three-dimensionalSelf-organizingMap,三维自组织映射)算 法对左右图像进行分块学习训练,获得最优的矢量量化码书;
[0011] 2)将左图作为输入矢量,进行基于3DS0M的矢量量化编码,由左图和矢量量化码 矢获得矢量量化误差,并对其进行DCT变换、量化和霍夫曼编码;
[0012] 3)对编码后的码流进行解码,由解码后的矢量量化误差和矢量量化码矢对左图进 行重建,即将解码后得到的矢量量化误差和矢量量化码矢进行求和匹配运算,得到重建左 图;
[0013] 4)将立体图像对中的右图进行分块,利用重建左图,使用固定块视差估计补偿技 术获得右图的预测图像及视差矢量;
[0014] 5)由右图的预测图像和右图进行做差运算得到视差估计误差,对视差估计误差图 像分块进DCT变换、量化和霍夫曼编码;
[0015] 6)在解码端由重建左图、视差估计误差和视差矢量对右图进行重建,从而实现了 对立体图像的有效编码。
[0016] 步骤1中,设置自组织神经网络大小为(N,M),其中N为码书大小,即输出层输出 神经元的个数,M为输入训练矢量的大小,训练矢量集为S= (X1,Xf,XM},网络输入节点为 k(等于矢量维数),各输入节点到各输出节点的权值为Wji,I=l,2?,k,j= 1,2···,Ν,失 真测度为d(Xi,%),一般采用均方误差准则。
[0017] 采用频率敏感函数对失真测度进行修正,即
[0018] d(xi,Wj)=f(cj) Σ'ι=ι[Χ-- - wn(t)]2 , I < ; < iV (I)
[0019] 式中,ffc) =c/,s为频率敏感参数,Cj为响应计数器,每响应一次Cj加i,t为迭 代次数。通过引入频率敏感函数降低了获胜码矢再次成为响应码矢的可能,使码书中每个 码矢都能得到充分利用,从而获得最优的矢量量化码书。
[0020] 使用一个距离不等式判据准则,降低失真测度的计算复杂度,定义一个输入矢量 的和值为3&,1 = 1,2",,码字1的和值为5^,即5)^=2111邱,5%=1111% 1,输入训练 矢量与码书中各码矢间的失真为d(xi,Wj) = 容易证明:
【权利要求】
1. 一种基于三维自组织映射的立体图像编码方法,其特征是,包括如下步骤: 1) 米用 3DS0M(Three-dimensional Self-organizing Map,三维自组织映射)算法对 左右图像进行分块学习训练,获得最优的矢量量化码书; 2) 将左图作为输入矢量,进行基于3DS0M的矢量量化编码,由左图和矢量量化码矢获 得矢量量化误差,并对其进行DCT变换、量化和霍夫曼编码; 3) 对编码后的码流进行解码,由解码后的矢量量化误差和矢量量化码矢对左图进行重 建,即将解码后得到的矢量量化误差和矢量量化码矢进行求和匹配运算,得到重建左图; 4) 将立体图像对中的右图进行分块,利用重建左图,使用固定块视差估计补偿技术获 得右图的预测图像及视差矢量; 5) 由右图的预测图像和右图进行做差运算得到视差估计误差,对视差估计误差图像分 块进DCT变换、量化和霍夫曼编码; 6) 在解码端由重建左图、视差估计误差和视差矢量对右图进行重建,从而实现了对立 体图像的有效编码。
2. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法,其特征是,步骤1 中,设置自组织神经网络大小为(N,M),其中N为码书大小,即输出层输出神经元的个数,M 为输入训练矢量的大小,训练矢量集为S = (X1, X2. ..,XJ,网络输入节点为k (等于矢量维 数),各输入节点到各输出节点的权值为Wpl = 1,2. ..,k,j = 1,2. ..,N, 采用频率敏感函数对失真测度进行修正,即 d(xj, Wj) = f(cj)- Wji(t)]2 , I < j < N Cl) 降低了获胜码矢再次成为响应码矢的可能,使码书中每个码矢都能得到充分利用,使 用一个距离不等式判据准则,有效降低计算复杂度,定义一个输入矢量的和值为SXi,i = 1,2. . .M,码字Wj的和值为SWi,即SXi = Xji1Xil, SWj = ,输入训练矢量与码书中各 码矢间的失真为d(xi,wj) = SlULXii _ Wj丨⑴]2,容易证明: d(xi,Wj) = El^iL^ii - Wj,(t)]2 > (sXj - Sw.) /k (2) 若引入频域敏感因子则有d(Xj,Wj) = f(Ci) SlUxil - Wj1(X)]2,K j S N,由于 f (Cj)彡I所以⑵式仍然满足, 设当前的最小失真为dmin,并令MD = kdmin,若2 MD (3)则根据 式(2)可得 d (Xi,Wj) > dmin (4) 因此可以在每次搜索获胜神经元前,预先计算N个码字的和值5%,并保存在码书中, 同时在搜索获胜神经元的过程中预先计算MD,然后判断码字%的和值是否满足(3) 式,若满足,则码字Wj可以排除。
3. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法,其特征是,步骤 4中,视差估计实质上就是寻找同一空间点在左右图像对上投影点之间的匹配关系,视差 矢量就是两个对应点之间的位置差异,它代表了左右图像在空间上的冗余信息,本发明中 使用固定8 X 8块进行视差估计,视差补偿与视频压缩中的运动补偿技术相似,在视差补偿 中,通过参考图像得到目标图像的预测图像,对预测图像和目标图像做差,得到残差图像。
4. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法,其特征是,步骤 5中,由右图的预测图像和右图进行做差运算得到视差估计误差,对视差估计误差进行类似 于JPEG标准的方法进行编码。
5. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法,其特征是,步骤6 中,在解码端由重建左图、视差估计误差和视差矢量对右图进行重建,从而实现了对立体图 像的有效编码。
6. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法,其特征是,所述 的 3DS0M 算法,包括如下步骤: a) 初始化码书Iffj1(O) =Wjl, 1 = 1,2,…k, j = 1,2,…N},用各训练矢量的方差把 训练矢量集分成低频和高频两个部分,然后分别从低频和高频部分中抽出一定数量的矢量 构成初始码书,并将码矢排列成A*B*C的三维立体结构; b) 计算当前码书中各码矢^"。的和值Sur同时计算输入训练矢量Xi的和值Jxp Xi以并行方式输入到每一个神经元; c) 根据(3)式提出的不等式判据以及引入频率敏感因子后(1)式失真测度的表达式, 搜索具有最小失真的码矢jM乍为响应码矢,即 d(xi,Wj) = f(cj) Y1lI=Axa ~ wn(t)]2, 1<j < N 式中,f(^) = c/,S为频率敏感参数,选择具有最小失真的模式矢量j%即 = Tnind^xi, wj), j = I, 2, ---JV (5); d) 调整响应码矢f及f的拓扑邻域NE范围内的码矢
【文档编号】H04N19/597GK104363460SQ201410734545
【公开日】2015年2月18日 申请日期:2014年12月5日 优先权日:2014年12月5日
【发明者】徐晓宁, 覃远年, 朱辉 申请人:桂林电子科技大学