一种基于三维自组织映射的立体图像编码方法

文档序号：7821956阅读：385来源：国知局

一种基于三维自组织映射的立体图像编码方法
【专利摘要】本发明公开了一种基于三维自组织映射的立体图像编码方法,用3DSOM算法对左右图像，获得最优的量化码书；将左图作为输入矢量，进行量化编码，由左图和量化码矢获得量化误差，并对其进行DCT变换、量化和霍夫曼编码；解码端用重建左图、视差估计误差和视差矢量重建右图，实现对立体图像的有效编码。还引用了一个距离不等式作判据,同时引入了一个频率敏感因子,对三维自组织映射算法进行了改进，降低了失真测度计算复杂度，提高了码书性能，接着本发明将改进的三维自组织映射算法应用到了立体图像编码中，有效的提高了左图像的编码效率，降低了重建右图的方块效应。
【专利说明】一种基于三维自组织映射的立体图像编码方法

【技术领域】
[0001] 本发明涉及图像处理领域，具体为一种基于三维自组织映射的立体图像编码方法。

【背景技术】
[0002] 立体图像增加了景物的深度信息，具有强烈的临场感和真实感，因此正越来越受到人们的追捧，立体图像目前应用最广泛的是双目视图方案，利用双目视差原理产生立体感，但与二维平面图像相比，立体图像数据量成倍的增加了，因此，需要对立体图像进行压缩编码，以便能有效地传输和存储。
[0003] 为了解决上述问题，目前主要的立体图像编码方法有基于小波法、与MPEG(Moving PicturesExpertsGroup,动态图像专家组）标准结合基于块的方法以及基于模式识别的编码方法。
[0004] 方法1 :基于小波的立体图像编码方法对参考图像和估计的视差图都采用小波变换编码，而视差估计则采用简化的块图像匹配方法，该方法虽然大大降低计算复杂度，但当压缩比较高时，重建图像的质量较差。
[0005] 方法2:与MPEG标准结合的算法是当前在实际中使用较多的方案，该方案使用 JPEG(JointPhotographicExpertsGroup,联合图像专家组）标准对左图像进行编码，利用视差估计技术从重建左图像获取预测右图像，预测误差也使用类似于JPEG标准的方法进行编码，该方案虽考虑到了左右图像之间的相关性，但压缩效率仍较低，且重建图像存在明显的块效应。
[0006] 方法3 :基于模式识别的立体图像编码方法是一种新的图像编码方法，该方法对右图像采用DE(DisparityEstimation,视差估计）补偿技术编码，对左图像则使用基于 SOM(Self-organizingMap，自组织映射）算法的矢量量化编码来取代传统的JPEG方法，矢量量化与视差估计的残差均使用DCT(DiscreteCosineTransform,离散余弦变换）+霍夫曼进行编码，该方法能较好的克服变换编码适应性不足的缺点且压缩效率较高，但计算复杂度高，同时也存在一定的方块效应。

【发明内容】

[0007] 针对现有技术的不足，本发明提供一种基于三维自组织映射的立体图像编码方法，该方法降低了算法计算复杂度，提高了左图像的编码效率同时明显降低了重建右图的方块效应。
[0008] 实现本发明目的的技术方案是：
[0009] 一种基于三维自组织映射的立体图像编码方法，包括如下步骤：
[0010] 1)米用 3DS0M(Three-dimensionalSelf-organizingMap，三维自组织映射）算法对左右图像进行分块学习训练，获得最优的矢量量化码书；
[0011] 2)将左图作为输入矢量，进行基于3DS0M的矢量量化编码，由左图和矢量量化码矢获得矢量量化误差，并对其进行DCT变换、量化和霍夫曼编码；
[0012] 3)对编码后的码流进行解码，由解码后的矢量量化误差和矢量量化码矢对左图进行重建，即将解码后得到的矢量量化误差和矢量量化码矢进行求和匹配运算，得到重建左图；
[0013] 4)将立体图像对中的右图进行分块，利用重建左图，使用固定块视差估计补偿技术获得右图的预测图像及视差矢量；
[0014] 5)由右图的预测图像和右图进行做差运算得到视差估计误差，对视差估计误差图像分块进DCT变换、量化和霍夫曼编码；
[0015] 6)在解码端由重建左图、视差估计误差和视差矢量对右图进行重建，从而实现了对立体图像的有效编码。
[0016] 步骤1中，设置自组织神经网络大小为（N，M)，其中N为码书大小，即输出层输出神经元的个数，M为输入训练矢量的大小,训练矢量集为S= (X1,Xf,XM},网络输入节点为 k(等于矢量维数），各输入节点到各输出节点的权值为Wji,I=l，2?，k，j= 1，2···，Ν，失真测度为d(Xi，％)，一般采用均方误差准则。
[0017] 采用频率敏感函数对失真测度进行修正，即
[0018] d(xi，Wj)=f(cj) Σ'ι=ι[Χ-- - wn(t)]2 , I < ; < iV (I)
[0019] 式中，ffc) =c/，s为频率敏感参数，Cj为响应计数器，每响应一次Cj加i，t为迭代次数。通过引入频率敏感函数降低了获胜码矢再次成为响应码矢的可能，使码书中每个码矢都能得到充分利用，从而获得最优的矢量量化码书。
[0020] 使用一个距离不等式判据准则，降低失真测度的计算复杂度，定义一个输入矢量的和值为3&，1 = 1，2"，，码字1的和值为5^，即5)^=2111邱，5%=1111% 1，输入训练矢量与码书中各码矢间的失真为d(xi，Wj) = 容易证明：

【权利要求】
1. 一种基于三维自组织映射的立体图像编码方法，其特征是，包括如下步骤： 1) 米用 3DS0M(Three-dimensional Self-organizing Map，三维自组织映射）算法对左右图像进行分块学习训练，获得最优的矢量量化码书； 2) 将左图作为输入矢量，进行基于3DS0M的矢量量化编码，由左图和矢量量化码矢获得矢量量化误差，并对其进行DCT变换、量化和霍夫曼编码； 3) 对编码后的码流进行解码，由解码后的矢量量化误差和矢量量化码矢对左图进行重建，即将解码后得到的矢量量化误差和矢量量化码矢进行求和匹配运算，得到重建左图； 4) 将立体图像对中的右图进行分块，利用重建左图，使用固定块视差估计补偿技术获得右图的预测图像及视差矢量； 5) 由右图的预测图像和右图进行做差运算得到视差估计误差，对视差估计误差图像分块进DCT变换、量化和霍夫曼编码； 6) 在解码端由重建左图、视差估计误差和视差矢量对右图进行重建，从而实现了对立体图像的有效编码。
2. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法，其特征是，步骤1 中，设置自组织神经网络大小为（N，M)，其中N为码书大小，即输出层输出神经元的个数，M 为输入训练矢量的大小，训练矢量集为S = (X1, X2. ..，XJ，网络输入节点为k (等于矢量维数），各输入节点到各输出节点的权值为Wpl = 1，2. ..，k，j = 1，2. ..，N，采用频率敏感函数对失真测度进行修正，即 d(xj, Wj) = f(cj)- Wji(t)]2 , I < j < N Cl) 降低了获胜码矢再次成为响应码矢的可能，使码书中每个码矢都能得到充分利用，使用一个距离不等式判据准则，有效降低计算复杂度，定义一个输入矢量的和值为SXi，i = 1，2. . .M，码字Wj的和值为SWi，即SXi = Xji1Xil, SWj = ，输入训练矢量与码书中各码矢间的失真为d(xi，wj) = SlULXii _ Wj丨⑴]2,容易证明： d(xi，Wj) = El^iL^ii - Wj,(t)]2 > (sXj - Sw.) /k (2) 若引入频域敏感因子则有d(Xj，Wj) = f(Ci) SlUxil - Wj1(X)]2，K j S N，由于 f (Cj)彡I所以⑵式仍然满足，设当前的最小失真为dmin，并令MD = kdmin，若2 MD (3)则根据式（2)可得 d (Xi，Wj) > dmin (4) 因此可以在每次搜索获胜神经元前，预先计算N个码字的和值5%，并保存在码书中，同时在搜索获胜神经元的过程中预先计算MD，然后判断码字％的和值是否满足（3) 式，若满足，则码字Wj可以排除。
3. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法，其特征是，步骤 4中，视差估计实质上就是寻找同一空间点在左右图像对上投影点之间的匹配关系，视差矢量就是两个对应点之间的位置差异，它代表了左右图像在空间上的冗余信息，本发明中使用固定8 X 8块进行视差估计，视差补偿与视频压缩中的运动补偿技术相似，在视差补偿中，通过参考图像得到目标图像的预测图像，对预测图像和目标图像做差，得到残差图像。
4. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法，其特征是，步骤 5中，由右图的预测图像和右图进行做差运算得到视差估计误差，对视差估计误差进行类似于JPEG标准的方法进行编码。
5. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法，其特征是，步骤6 中，在解码端由重建左图、视差估计误差和视差矢量对右图进行重建，从而实现了对立体图像的有效编码。
6. 根据权利要求1所述的基于三维自组织映射的立体图像编码方法，其特征是，所述的 3DS0M 算法，包括如下步骤： a) 初始化码书Iffj1(O) =Wjl, 1 = 1,2,…k, j = 1,2,…N},用各训练矢量的方差把训练矢量集分成低频和高频两个部分，然后分别从低频和高频部分中抽出一定数量的矢量构成初始码书，并将码矢排列成A*B*C的三维立体结构； b) 计算当前码书中各码矢^"。的和值Sur同时计算输入训练矢量Xi的和值Jxp Xi以并行方式输入到每一个神经元； c) 根据（3)式提出的不等式判据以及引入频率敏感因子后（1)式失真测度的表达式，搜索具有最小失真的码矢jM乍为响应码矢，即 d(xi，Wj) = f(cj) Y1lI=Axa ~ wn(t)]2, 1<j < N 式中，f(^) = c/，S为频率敏感参数，选择具有最小失真的模式矢量j%即 = Tnind^xi, wj), j = I, 2, ---JV (5)； d) 调整响应码矢f及f的拓扑邻域NE范围内的码矢
【文档编号】H04N19/597GK104363460SQ201410734545
【公开日】2015年2月18日申请日期:2014年12月5日优先权日:2014年12月5日
【发明者】徐晓宁, 覃远年, 朱辉申请人:桂林电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐晓宁;覃远年;朱辉;
技术所有人：桂林电子科技大学;
我是此专利的发明人

上一篇：移动互联网云计算、大数据、安全系统的制作方法
上一篇：一种智能调整远程教学视频互动模式的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。