基于新的邻域函数的三维自组织映射图像编码方法

文档序号：10661354阅读：498来源：国知局

基于新的邻域函数的三维自组织映射图像编码方法
【专利摘要】本发明公开一种基于新的邻域函数的三维自组织映射图像编码方法，首先，对图像样本进行不断学习训练，得到最佳匹配模式库；其次，对待编码的图像进行分块处理，并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配，编码每个块在模式库中的匹配模式的索引。本发明具有模式库调整速度快，模式库训练效率高的特点。
【专利说明】
基于新的邻域函数的三维自组织映射图像编码方法
技术领域
[0001]本发明涉及图像编码技术领域，具体涉及一种基于新的邻域函数的三维自组织映射图像编码方法。
【背景技术】
[0002] 图像编码也称图像压缩，是指在满足一定质量(信噪比的要求或主观评价得分)的条件下，以较少比特数表示图像或图像中所包含信息的技术。基于神经网络的图像编码是近年来出现的一种新的图像编码方法。人工神经网络在图像压缩中的应用是通过初步模拟人体神经系统的局部初级功能，根据图像本身的特点，自主的对其进行压缩编码。自组织神经网络在图像编码邻域有广泛的应用。
[0003] 自组织映射（361卜0找3]1丨2；[1^]\^1。，简称30]\0算法是1(〇11〇11611从人脑神经元的组织原理上受到启发而提出的一种具有自组织特性的人工神经网络算法。该算法模拟了人脑神经系统对某一图形或某一频率特定兴奋的特征，同时考虑了可以人工实现的条件，在数据挖掘和图像模式识别等领域得到了深入的研究和应用，是一种高效的数据聚类方法。S0M 网络采用双层网络结构，分为输入层和映射层，输入层用于感知输入模式，每个输入神经元通过权值与每个映射层神经元连接，映射层输出结果，映射层的神经元互相连接。传统S0M 网络一般采用一维输入层和二维映射层，它能有效地处理一维和二维信号。近年来，三维图像和视频等三维信号的处理日益引起了关注，然而传统S0M算法并不能直接用于三维信号的处理。三维S0M算法很好地解决了这一问题，能有效地将二维输入映射为三维输出，实现了三维信号的非线性映射。
[0004] 邻域函数是S0M算法的重要组成部分，为了保证收敛，需满足随迭代时间逐渐减小的原则。在训练的初始阶段，邻域半径较大，随着训练次数的增加，网络逐渐趋于稳定，只需对获胜节点进行较细微的权值调整，因而邻域半径不断缩小。邻域函数通常取线性函数或指数函数。然而，这些邻域函数存在一定问题，如模式库调整速度慢，模式库训练效率低等，影响了三维S0M算法的性能。

【发明内容】

[0005] 本发明所要解决的技术问题是现有S0M算法的模式库调整速度慢和训练效率低的问题，提供一种基于新的邻域函数的三维自组织映射图像编码方法。
[0006] 为解决上述问题，本发明是通过以下技术方案实现的：
[0007] 基于新的邻域函数的三维自组织映射图像编码方法，包括如下步骤：
[0008] 步骤1、对图像样本进行不断学习训练，得到最佳匹配模式库；
[0009] 步骤1.1、对图像样本进行分块，每个图像块为一个训练矢量，共得到含L个训练矢量的训练矢量集；
[0010] 步骤1.2、从训练矢量集中选择N个训练矢量来构成初始化模式库，该初始模式库中的训练矢量称为模式矢量，且初始模式库中的模式矢量排列成三维立体结构;上述N< < L；
[0011]步骤1.3、设定邻域函数
[0013] 其中，Bo为最小邻域，为最大邻域，Q为邻域衰减常数、C2为训练次数；j = 0， 1，…，N-1，N为设定的三维自组织映射网络的大小；t = 0，1，…，L-1，L为训练矢量集中训练矢量的个数；
[0014] 步骤1.4、输入一个训练矢量，并分别计算该训练矢量与初始模式库中的各个模式矢量的失真，从中选择出与训练矢量失真最小的模式矢量作为获胜模式矢量；
[0015] 步骤1.5、调整获胜模式矢量及其三维邻域范围内的模式矢量；
[0016] 步骤1.6、返回步骤1.4重新选择一个训练矢量，直到输入完所有的训练矢量，得到最佳匹配模式库；
[0017] 步骤2、对待编码的图像进行分块处理，并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配，编码每个块在模式库中的匹配模式的索引。
[0018] 上述步骤1.2中，采用随机法从训练矢量集中选择N个训练矢量来构成初始模式库。
[0019] 上述步骤1.4中，采用下式计算训练矢量与模式矢量的失真山(t);
[0020] dj(t)=||X(t)-Wj⑴ ||2
[0021] 其中，Wj (t)为模式矢量，X (t)为训练矢量;j = 0，1，…，N-1，N为设定的三维自组织映射网络的大小;t = 0,1，…，L-l，L为训练矢量集中训练矢量的个数。
[0022] 上述步骤1.5中，根据下式调整获胜模式矢量及其三维邻域范围内的模式矢量
[0024]其中，Wj(t+1)为第t+Ι次训练时的模式矢量，Wj(t)为第t次训练时的模式矢量，X (t)为训练矢量，f为获胜模式矢量，为获胜模式矢量f在第t次训练时的邻域函数，α (t)为第t次训练时的学习速度函数;j = 0，1，…，N-1，Ν为设定的三维自组织映射网络的大小;t = 0，1，…，L-l，L为训练矢量集中训练矢量的个数。
[0025] 上述步骤2具体为：
[0026]步骤2.1、将待编码的图像分块，其中待编码的图像分块大小与图像样本的分块大小相一致；
[0027] 步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真，并编码具有最小失真的模式矢量在模式库中的索引；
[0028] 步骤2.3、对待编码的所有图像进行步骤2.2的处理，得到待编码的图像的码流。
[0029] 与现有技术相比，本发明具有如下特点:模式库调整速度快，模式库训练效率高。
【附图说明】
[0030] 图1为模式库的训练过程。
[0031] 图2为三维自组织映射图像编码过程。
【具体实施方式】
[0032]下面结合实施例，对本
【发明内容】
作进一步地详细说明，但本发明的实施方式不限于此。
[0033] 一种基于新的邻域函数的三维自组织映射图像编码方法，包括如下步骤：
[0034]步骤1)对图像样本进行不断训练，得到最佳匹配的模式库。参见图1。
[0035]步骤1.1)设定3DS0M网络大小为(N，M)，其中N、M分别为模式库的大小、模式库中模式矢量的大小。
[0036]步骤1.2)对图像样本分块，块的大小一般取8X8。每个图像块为一个训练矢量，共得到含L个训练矢量的训练矢量集{X(t);t = 0，l，…，L-1}。用随机法从训练矢量集中选择N (N< <L)个训练矢量来构成初始化模式库{Wj (0); j = 0，1，…，N-1}，并将初始模式库中的模式矢量排列成三维立体结构。
[0037]步骤1 · 3)将初始化邻域设定为Nj(0)，j = 0，1，…，N-1。
[0038] 步骤1.4)输入一个训练矢量集中的训练矢量X = (XI，X2，…，xm)t。
[0039] 步骤1.5)选择均方误差失真准则，均方误差为山（t)=| |X(t)-Wj(t)| I2,分别计算该训练矢量与模式库中各模式矢量的失真山（t);并选择具有最小失真的模式矢量为获胜模式矢量f。
[0040] 步骤1.6)按下式调整获胜模式矢量.f及其三维邻域A、(t)范围内的模式矢量，
[0042]其中，~⑴为邻域函数，通常选用单调递减函数
分别为获胜模式矢量f的最小邻域和最大邻域，&为邻域衰减常数，C2为训练次数。在训练的初始阶段，邻域半径较大，随着训练次数的增加，网络逐渐趋于稳定，只需对获胜节点进行较细微的权值调整，因而邻域半径不断缩小。a(t)为学习速度函数，它反映了模式矢量调整的幅度大小，一般选用单调递减函数《(〇=4e^，式中Ai为训练开始时的最大学习速度，Ti为学习衰减常数。
[0043]步骤1.7)返回步骤步骤1.4)，直到输入完训练矢量集中所有的训练矢量，即得到最佳匹配模式库。
[0044] 步骤2)对待编码图像进行图像模式识别，编码每个块在模式库中的匹配模式的索弓丨。参见图2。
[0045] 步骤2.1、将待编码图像分块，其中待编码图像分块大小与图像样本的分块大小一致；
[0046] 步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真，并选择具有最小失真的模式矢量作为该图像块的匹配模式，对该图像块编码时只编码其匹配模式在模式库中的索引；
[0047] 采用均方误差准则即下式来计算待编码图像块与最佳匹配模式库中各模式矢量的失真bW);
[0048] ^(^)=1 |Y(t7 ) I I2
[0049] 其中，Wj (V )为模式矢量，Y(V )为待编码图像块;j = 0，1，…，N-l，N为设定的三维自组织映射网络的大小;V =0，1，…，K-1，K为待编码图像块的个数。
[0050] 步骤2.3、对待编码图像每一个子图像块进行步骤2.2的处理，完成了对图像的编码。
[0051] 具体地，为了说明本方法的性能，做了大量的仿真实验，实验图像选择分辨率为 512父512\81^的标准亮度测试图像1^1^、？叩?從 8，用于模式库训练和图像编码。重建图像品质的客观评价采用峰值信噪比式中Emse为原始图像与重建图像之
，. 间的均方误差。图像压缩比为
式中Μ为模式矢量的维数，Β〇为原始图像的每像素比特数，为模式矢量地址比特数。
[0052]实验分别用基于指数邻域函数的三维S0M算法和基于本专利新的邻域函数的三维 S0M算法设计图像模式识别模式库，并通过编码后重建图像的质量来比较基于这两种邻域函数的三维S0M算法的性能，其中训练矢量数为40960,模式库大小为1024。表1为选取不同实验图像时，基于指数邻域函数的三维S0M算法和基于本专利新的邻域函数的三维S0M算法用于图像模式识别编码的重建图像的峰值信噪比(PSNR)。
[0053] 表1重建图像的PSNR
[0054]
[0055] 由表1可以看出，基于本专利新的邻域函数的三维S0M算法的性能比基于指数邻域函数的三维S0M算法提高了0.0909-0.3013dB。
【主权项】
1. 基于新的邻域函数的三维自组织映射图像编码方法，其特征是，包括如下步骤：步骤1、对图像样本进行不断学习训练，得到最佳匹配模式库；步骤1.1、对图像样本进行分块，每个图像块为一个训练矢量，共得到含L个训练矢量的训练矢量集；步骤1.2、从训练矢量集中选择N个训练矢量来构成初始化模式库，该初始模式库中的训练矢量称为模式矢量，且初始模式库中的模式矢量排列成三维立体结构;上述N< <L; 步骤1.3、设定邻域函数其中，Bo为最小邻域，B1为最大邻域，C1为邻域衰减常数、C2为训练次数;j = O，1，…，N-I， N为设定的三维自组织映射网络的大小；t = 0，1，…，L-I，L为训练矢量集中训练矢量的个数；步骤1.4、输入一个训练矢量，并分别计算该训练矢量与初始模式库中的各个模式矢量的失真，从中选择出与训练矢量失真最小的模式矢量作为获胜模式矢量；步骤1.5、调整获胜模式矢量及其三维邻域范围内的模式矢量；步骤1.6、返回步骤1.4重新选择一个训练矢量，直到输入完所有的训练矢量，得到最佳匹配模式库；步骤2、对待编码的图像进行分块处理，并将这些待编码图像块与最佳匹配模式库中的模式矢量进行图像模式匹配，编码每个块在模式库中的匹配模式的索引。2. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1.2中，采用随机法从训练矢量集中选择N个训练矢量来构成初始模式库。3. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1.4中，采用下式计算训练矢量与模式矢量的失真山(t); dj(t)= I |x(t)-ffj(t) 112 其中，Wj(t)为模式矢量，X(t)为训练矢量；j = 0，I，…，N-I，N为设定的三维自组织映射网络的大小;t = 0,1，…，L_1，L为训练矢量集中训练矢量的个数。4. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤1 .5中，枏抿下忒调整莊胖樽忒玍量及其=維郃域茹闱内的樽忒玍量共中，WjU+l)73弟t+Ι次训练时的悮式天重，WjU)为弟t次训练时的模式矢量，X(t)为训练矢量，f为获胜模式矢量，'· W为获胜模式矢量f在第t次训练时的邻域函数，a(t)为第t次训练时的学习速度函数;j = 0，1，…，N_1，N为设定的三维自组织映射网络的大小;t = O，1，…，L-I，L为训练矢量集中训练矢量的个数。5. 根据权利要求1所述基于新的邻域函数的三维自组织映射图像编码方法，其特征是，步骤2具体为：步骤2.1、将待编码的图像分块，其中待编码的图像分块大小与图像样本的分块大小相一致；步骤2.2、分别计算每一个待编码图像块与最佳匹配模式库中各模式矢量的失真，并编码具有最小失真的模式矢量在模式库中的索引；步骤2.3、对待编码的所有图像进行步骤2.2的处理，得到待编码的图像的码流。
【文档编号】H04N19/597GK106028043SQ201610316588
【公开日】2016年10月12日
【申请日】2016年5月13日
【发明人】黎洪松, 程福林
【申请人】桂林电子科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黎洪松;程福林;
技术所有人：桂林电子科技大学;
我是此专利的发明人

上一篇：用于多视点深度视频编码的拉格朗日乘子修正方法
上一篇：处理设备及其控制方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。