一种基于感知损失引导的深度注意力编解码单图像超分辨率算法的制作方法

文档序号:21443360发布日期:2020-07-10 17:32阅读:550来源:国知局
一种基于感知损失引导的深度注意力编解码单图像超分辨率算法的制作方法

本发明属于图像信息处理技术领域,具体涉及一种基于感知损失引导的深度注意力编解码单图像超分辨率算法。



背景技术:

图像超分辨率就是将低分辨率的图像通过一定的算法转提升到高分辨率。高分辨率图像具有更高的像素密度,更多的细节信息,更细腻的画质。要获得高分辨率图像,最直接的办法是采用高分辨率的相机,然而,在实际应用过程中,由于制作工艺和工程成本的考虑,很多场合都不会采用高分辨率、超分辨率的相机来进行图像信号的采集。

超分辨率技术的概念和方法最早是由harris和goodman于60年代提出。随后有许多人对其进行了研究,并相继提出了许多复原方法。自2012年以来,深度学习模拟人脑的学习过程,通过多层抽象机制对数据进行抽象表达,能够自主学习数据中的关系模式,受到学术界与产业界的广受关注。但是大多深度学习方法属于监督学习的方式,这些方法需要大量的图像对,由lr图像和相应的hr图像组成,对网络参数进行预训练,限制了这些方法在实际场景中的适用性。在一些实际问题中,很难收集到真实的hr图像,甚至存在无法获取的情况。



技术实现要素:

本发明的目的在于针对上述现有技术中不足,提供了一种基于感知损失引导的深度注意力编解码单图像超分辨率算法,包括以下步骤:

s1:构建感知损失引导的深度注意力编解码网络模型;

s2:根据网络模型,设计用于优化网络模型参数的感知损失目标函数,促使网络能够重建感知质量高的高分辨图像;

s3:预设网络模型超参数,根据感知损失目标函数,采用反向传播算法训练网络模型;

s4:若网络模型收敛,则输出期望的高分辨率图像,否则返回执行s3,直至网络模型收敛。

为优化上述技术方案,采取的具体措施还包括:

进一步地,s1具体为:构建引入了残差空间注意力机制的网络模型,网络主要由一个编码器和一个解码器串联组成,输入经由编码器之后再经过解码器输出得到目标图像,相同级层的编解码器之间还带有残差连接用于传递信息,所述解码器的每一层中都设置有空间注意力单元,以捕获并重建出更多的低频信息,所述网络模型为x=minθlp(xl-dfθ(z)),

其中:其中θ为网络参数,lp为感知损失,xl为低分辨率图像,d为下采样,fθ(z)为网络重建图像,z为输入的随机噪声。

进一步地,s2具体为:根据网络模型参数θ,建立感知损失目标函数lp(x),感知损失目标函数的公式为:

lp=αlmae(x)+(1-α)lssim(x)

lssim(x)=1-ssim(x)

其中,α为感知损失中两个不同损失项的比例权重,lmae为平均绝对误差,lssim为图像评价指标的结构相似性。

进一步地,s3具体为:

s301:预设网络模型训练超参数,包括训练时的模型学习率1r,迭代次数n,不同损失项的比例权重α,网络的深度与层数,激活函数的类别;

s302:将和高分辨率图像一样大小的随机噪声z作为网络模型的输入;

s303:通过反向传播算法,计算目标损失函数ln,然后利用adam优化算法更新网络参数θ,并进行n次迭代;

θn=θn-1+adam(θn-1,l)

s304:每次迭代后生成的高分辨率图像作为下一次迭代中网络的输入,重复s303步骤。

进一步地,s4具体为:

s401、在网络训练迭代过程中,当目标损失函数ln减小,判定网络为收敛;

s402、判断网络模型收敛后,网络模型输出重建图像;

s403、若此次迭代训练不收敛,则返回执行步骤s3,重新预设网络模型训练超参数,再次训练网络,直至网络模型收敛。

本发明的有益效果:

本发明一种基于感知损失引导的深度注意力编解码单图像超分辨率算法,利用超分辨率理论,网络模型引入了残差空间注意力机制,通过输入随机噪声,不断迭代优化网络参数,使得生成的高分辨率图片经过下采样后能够与给定的任务所依赖的低分辨率图像高度匹配。同时,使用了感知损失作为网络的损失函数,使得网络可以更多地关注视觉敏感区域,以保存视觉信息结构,从而提高重建图像的质量,使得重建图像有着优秀的视觉效果,并且该网络的重建效率极高。

附图说明

图1是本发明的流程示意图;

图2是本发明所构建的网络详图;

图3是本发明网络中引入的残差注意力模块图;

图4是各算法4倍重建图像与原图的对比图;

图5是各算法8倍重建图像与原图的对比图;

图6是各算法4倍重建图像情况下的psnr/ssim指标对比图;

图7是各算法8倍重建图像情况下的psnr/ssim指标对比图。

具体实施方式

为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

参考图1,本实施例提供一种基于感知损失引导的深度注意力编解码单图像超分辨率算法,包括:

s1:构建感知损失引导的深度注意力编解码网络模型;

具体为:构建引入了残差空间注意力机制的网络模型,网络主要由一个编码器和一个解码器组成,编解码器呈串联的形式,输入经由编码器之后再经过解码器输出得到目标图像,相同级层的编解码器之间还带有残差连接,所述解码器的每一层中都设置有空间注意力单元,以捕获并重建出更多的低频信息,所述网络模型为x=minθlp(xl-dfθ(z)),其中:其中θ为网络参数,lp为感知损失,xl为低分辨率图像,d为下采样,fθ(z)为网络重建图像,z为输入的随机噪声。

s2:根据网络模型,设计用于优化网络模型参数的感知损失目标函数,促使网络能够重建感知质量高的高分辨图像;

具体为:根据网络模型参数θ,建立感知损失目标函数lp(x),感知损失目标函数的公式为:

lp=almae(x)+(1-α)lssim(x)

其中,α为感知损失中两个不同损失项的比例权重,lmae为平均绝对误差(mae),lssim为图像评价指标的结构相似性,由于ssim指标是越大越好,因此lssim(x)=1-ssim(x)。

s3:预设网络模型超参数,根据感知损失目标函数,采用反向传播算法训练网络模型;

具体为:

s301:预设网络模型训练超参数,包括训练时的模型学习率1r,迭代次数n,不同损失项的比例权重α,网络的深度与层数,激活函数的类别;

s302:将和高分辨率图像一样大小的随机噪声z作为网络模型的输入;

s303:通过反向传播算法,计算目标损失函数ln,然后利用adam优化算法更新网络参数θ,并进行n次迭代:

θn=θn-1+adam(θn-1,l),

s304:每次迭代后生成的高分辨率图像作为下一次迭代中网络的输入,重复s303步骤。

s4:若网络模型收敛,则输出期望的高分辨率图像,否则返回执行s3,直至网络模型收敛。

具体为:

s401、在网络训练迭代过程中,当目标损失函数ln减小,判定网络为收敛;

s402、判断网络模型收敛后,网络模型输出重建图像;

s403、若此次迭代训练不收敛,则返回执行步骤s3,重新预设网络模型训练超参数,再次训练网络,直至网络模型收敛。

为验证本发明的效果,对本发明进行实验,输入的噪声大小与期望高分辨率图像一样,通道数为32,在数据集上训练模型,设置相关参数:lr=0.001,n=2000,α=0.16,网络中引入的残差空间注意力机制模块如图2所示。

实验的评价使用定量分析方法;

图4显示出了本发明和bicubic、dip两种同样不需要预训练的算法和lapsrn需要预训练的算法分别在4倍重建时的图像重建效果对比。

图5显示出了本发明和bicubic、dip两种同样不需要预训练的算法和lapsrn需要预训练的算法分别在4倍重建时的图像重建效果对比。从图5可以看出,对于同样的图像,本发明的重建效果明显优于其他算法。

结合图4和图5可以看出,其中gt为原图,pl-dan为本发明的方法,通过图片可以直观的看出pl-dan相对于其他三种现有的算法得到的清晰度最高,且和原图最接近对于同样的图像,由此可见,本发明的重建效果明显优于其他算法。

关于定量分析比较,使用psnr和ssim来进行评判图像质量。其中,psnr为峰值信噪比,ssim为结构相似性,其计算分别如下:

其中,range表示图像像素值的动态范围,μ为均值,σ为方差,c1=(k1l)2,c1=(k1l)2是用来维持稳定的常数,l是像素值的动态范围,k1=0.01,k2=0.03。

作定量比较时,我们对set14、set5数据集上所有图片都进行了测试,通过网络模型计算输出重建图像,将重建图像与对应原图像对比,计算出对应的psnr和ssim值。图6给了本发明算法和bicubic、dip、srcnn、lapsrn这四种算法在数据集上4倍重建图像的psnr和ssim值。图7给出了本发明算法和bicubic、dip、lapsrn这三种算法在数据集上8倍重建图像的psnr和ssim值。

综上可知,相对于有监督深度学习超分辨率算法需要大量数据支撑,需要进行大量预训练而浪费时间和空间资源的问题。本发明利用无监督深度学习,建立一种基于感知损失引导的深度注意力编解码单图像超分辨率算法,将随机噪声输入网络中,通过迭代不断优化网络参数,使得生成的hr图片经过下采样后能够与给定的任务所依赖的lr图像尽可能匹配。我们在网络中加入了残差空间注意力单元用于捕获并重建出更多的低频信息,并且使用平均绝对误差(mae)和结构相似度(ssim)损失组成的感知损失作为损失函数来优化网络参数,使得网络可以更多地关注视觉敏感区域,以保存视觉信息结构,从而提高重建图像的质量,使得重建图像有着优秀的视觉效果,并且该网络的重建效率极高。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1