本申请总体涉及图像处理领域,尤其涉及一种降低有损压缩图像的压缩失真的方法及装置。
背景技术:
有损压缩是采用不精确近似或部分数据丢弃来表示已经被编码的内容的一类数据编码方法。这种压缩技术用于减少那些需要存储、处理和/或发送所表示的内容的数据量。有损图像压缩格式有多种,例如jpeg、webp、jpegxr和hevc-msp。jpeg格式仍然是各种可选方式中最为广泛采用的格式。
有损压缩引入压缩失真,特别是在其被用于低比特率/量化级中时。例如,jpeg压缩失真是包括块效应、振铃效应和模糊的不同特定失真的复杂组合。当对每个块进行编码,而没有考虑与相邻块的关联性时,导致边界处的不连续性时,产生块效应。因高频分量的粗量化发生边缘的振铃效应。因高频分量的丢失发生模糊。
用于消除失真的现有算法可被分为基于去块效应的方法和基于复原的方法。基于去块效应的方法着重于去除块效应和振铃效应。然而,大多数基于去块效应的方法无法重现锐利的边缘,并且趋于对纹理区域过度地进行平滑。基于复原的方法将压缩操作视为失真,并提出复原算法。由于基于复原的方法倾向于直接重构原始图像,因此锐化输出通常伴随着边缘的振铃效应和平滑区域的突兀过渡。
技术实现要素:
以下给出本公开的简要概述,以提供一种本公开一些方面的降低有损压缩图像的压缩失真的装置。本概述不是本公开的扩展概述。它并不旨在识别本公开的关键或重要元素,也不旨在描述本公开特定实施例的任何范围或权利要求的任何范围。其唯一目的是以简化的形式呈现本公开的一些概念,作为后文呈现的更加详细的描述的前序。
根据本申请的实施例,公开了一种降低有损压缩图像的压缩失真的装置。装置可以包括:特征提取设备,包括第一组滤波器,第一组滤波器被配置为从有损压缩图像提取块,并将提取的块映射为第一组高维特征向量;以及,特征增强设备,其与特征提取设备执行电通信,并且包括第二组滤波器,第二组滤波器被配置为对第一组中的每个高维特征向量进行去噪,并将去噪的高维特征向量映射为第二组高维特征向量。该装置还包括:映射设备,其与特征增强设备电耦合,并且包括第三组滤波器,第三组滤波器被配置为将第二组中的每个高维特征向量非线性地映射为复原的分块表示;以及,聚合设备,其与映射设备执行电通信,并且被配置为对由第二组中的所有高维特征向量映射的分块表示进行聚合,以生成复原的清晰图像。
在一方面,第一组滤波器可以被配置为从有损压缩图像提取块,并将每个提取的块非线性地映射为高维特征向量,所有块的映射向量形成所述第一组高维特征向量。
在另一方面,第二组滤波器可以被配置为对第一组中的每个高维特征向量进行去噪,并且将去噪的高维特征向量非线性地映射为第二组高维特征向量。
在一方面,第一组滤波器、第二组滤波器和第三组滤波器和聚合设备可分别基于预定的第一参数、第二参数和第三参数映射向量,或者可以基于第四参数对分块表示进行聚合。
在另一方面,装置还包括比较设备,其可以耦合到聚合设备,并且被配置为从预定训练集采样得到与有损压缩图像相应的真实未压缩图像,并且比较由聚合设备接收的经过聚合复原得到的清晰图像与相应的真实未压缩图像之间的不相似度,以生成重构误差,其中,重构误差被反向传输,以优化第一参数、第二参数和第三参数。
根据本申请的实施例,装置还可以包括电耦合到比较设备的训练集准备设备,其中,所述训练集准备设备还包括:裁剪器,其被配置为从随机选择的训练图像随机地裁剪出多个子图像,以生成一组真实未压缩子图像;和有损压缩子图像生成器,其与裁剪器执行电通信,并且被配置为基于从裁剪器接收的一组真实未压缩子图像,生成一组有损压缩子图像;此外,所述训练集准备设备还包括配对设备,其与裁剪器和有损压缩子图像生成器执行电通信,并且被配置为,对真实未压缩子图像与相应的有损压缩子图像进行配对;和收集器,其与配对设备执行电通信,并且被配置为收集配成对的真实未压缩子图像和有损压缩子图像以生成预定训练集。
在一方面,所述有损压缩子图像生成器还包括压缩设备,其与裁剪器执行电通信,并且被配置为,通过压缩编码器和解码器来编码和解码真实未压缩子图像,以生成有损压缩子图像。
在一方面,所述重构误差包括均方误差。
根据本申请的一种实施例,公开了一种降低有损压缩图像的压缩失真的方法,所述方法可以包括:通过包括第一组滤波器的特征提取设备,从有损压缩图像提取块,并将提取的块映射为第一组高维特征向量;通过与特征提取设备执行电通信并包括第二组滤波器的特征增强设备,对第一组中的每个高维特征向量进行去噪,并将去噪的高维特征向量映射为第二组高维特征向量;通过电耦合到特征增强设备并包括第三组滤波器的映射设备,将第二组中的每个高维特征向量非线性地映射为复原的分块表示;和通过与映射设备执行电通信的聚合设备,对由第二组中的所有高维特征向量映射的分块表示进行聚合,以生成复原的清晰图像。
根据本申请的一种实施例,公开了一种降低有损压缩图像的压缩失真的装置,该装置可以包括:重构单元,其被配置为基于预定参数将有损压缩图像重构为复原的清晰图像,以及训练单元,其被配置为使用预定训练集来训练卷积神经网络系统,以便确定重构单元使用的参数。重构单元可以包括:特征提取设备,包括第一组滤波器,其被配置为从有损压缩图像提取块,并将提取的块映射为第一组高维特征向量;特征增强设备,其与特征提取设备执行电通信,并且包括第二组滤波器,第二组滤波器被配置为对第一组中的每个高维特征向量进行去噪,并将去噪的高维特征向量映射为第二组高维特征向量;映射设备,其电耦合到特征增强设备,并且包括第三组滤波器,第三组滤波器被配置为将第二组中的每个高维向量非线性地映射为复原的分块表示;和聚合设备,其与映射设备执行电通信,其被配置为对由第二组中的所有高维向量映射的分块表示进行聚合,以生成复原的清晰图像;特征提取设备、特征增强设备、映射设备和聚合设备分别包括至少一个卷积层,并且卷积层依次相互连接以形成卷积神经网络系统。
根据本申请的一种实施例,公开了一种降低有损压缩图像的压缩失真的系统。该系统可以包括用于存储可执行组件的存储器;和处理器,用于执行可执行组件,以执行系统的操作;可执行组件包括:特征提取组件,被配置为从有损压缩图像提取块,并将提取的块映射为第一组高维特征向量;特征增强组件,被配置为对第一组中的每个高维特征向量进行去噪,并且将去噪的高维特征向量映射为第二组高维特征向量;映射组件,被配置为将第二组中的每个高维向量非线性地映射为复原的分块表示;和聚合组件,被配置为对由第二组中的所有高维向量映射的分块表示进行聚合,以生成复原的清晰图像。
以下描述和附图阐明了本公开的某些示意性方面。然而,这些方面仅指示可运用本发明的原理的各种方式中的一些方式。当结合附图考虑本发明的以下详细描述时,本发明的其他方面将变得显而易见。
附图说明
下面参照附图描述本发明的示例性非限制性实施例。附图是说明性的,通常未按照精确尺寸绘制。不同图上的相同或相似的元素用相同的附图标记表示。
图1是示出与本申请的实施例一致的用于降低有损压缩图像的压缩失真的装置的示意图。
图2是示出与本申请的另一实施例一致的用于降低有损压缩图像的压缩失真的装置的示意图。
图3是示出与公开的一些实施例一致的卷积神经网络系统的示意图。
图4是示出与公开的一些实施例一致的装置的训练单元的示意图。
图5是示出与公开的一些实施例一致的训练单元的训练集准备设备的示意图。
图6是示出与公开的一些实施例一致的用于降低有损压缩图像的压缩失真的方法的示意性流程图。
图7是示出与公开的一些实施例一致的用于训练用于降低有损压缩图像的压缩失真的卷积神经网络系统的方法的示意性流程图。
图8是示出与本申请的实施例一致的用于降低有损压缩图像的压缩失真的系统的示意图。
具体实施方式
现在将详细参考本发明的一些具体实施例,包括发明人为实现本发明而设想的最佳模式。在附图中示出了这些具体实施例的示例。尽管结合这些具体实施例描述了本发明,但是应当理解,本发明并不旨在将本发明限制于所描述的实施例。相反,旨在覆盖在由所附权利要求限定的本发明的精神和范围内可包括的替代、修改和等同物。在下面的描述中,为了提供对本发明的充分理解,阐述了许多具体细节。可以在没有这些具体细节中的一些或全部的情况下实施本发明。在其他情况下,为了避免不必要地模糊本发明,未详细描述公知的处理操作。
本文使用的术语仅用于描述特定实施例的目的,而不旨在限制本发明。如本文所使用的,单数形式“一个”、“一种”和“这个”也旨在包括复数形式,除非上下文另有明确指示。可以进一步理解,当在本说明书中被使用时,术语“包括”和/或“包含”表明所述特征、整体、步骤、操作、元件和/或部件的存在,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、部件和/或其组合。
参见图1,装置1000可以包括特征提取设备100、特征增强设备200、映射设备300和聚合设备400。在下文中,将对特征提取设备100、特征增强设备200、映射设备300和聚合设备400进行详细描述。为了便于描述,以y表示有损压缩图像,以f(y)表示复原的清晰图像,复原的清晰图像与真实未压缩的图像x尽可能地相似。
根据一个实施例,特征提取设备100包括第一组滤波器。第一组滤波器被配置为,从有损压缩图像提取块(patch),并将提取的块映射为第一组高维特征向量。例如,第一组滤波器通过函数f'(第一参数)将提取的块映射为第一组高维特征向量,其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且由与有损压缩图像相关联的预定参数确定第一参数。
在一个实施例中,这些第一组高维特征向量可以包括一组特征图,特征图的数量等于向量的维数。图像复原的流行策略是,密集地提取块,然后通过一组预先训练的基础来表示这些块,前述的基础例如,pca(主成分分析)、dct(离散余弦变换)、haar等。
根据一个实施例,特征提取设备100的操作可以被公式化为:
f1(y)=f’(w1*y+b1)(1)
其中,w1和b1分别代表滤波器和误差,f'(x)是非线性函数(例如,max(0,x)、1/(1+exp(-x))或tanh(x))。这里,w1的大小为c×f1×f1×n1,其中,c是输入图像的通道数,f1是滤波器的空域大小,n1是滤波器的数量。直观地,w1对图像应用n1个卷积,并且每个卷积具有c×f1×f1大小的核。输出由n1个特征图组成。b1是n1维向量,其每个元素与滤波器相关联。
特征增强设备200可以与特征提取设备100执行电通信,并且可以包括第二组滤波器,第二组滤波器被配置为对第一组中的每个高维特征向量进行去噪,并且将去噪的高维特征向量映射为第二组高维特征向量,例如,一组相对更干净的特征向量。
根据一个实施例,特征增强设备200被配置为对第一组中的每个高维特征向量进行去噪,并且通过函数f'(第二参数)将去噪的高维特征向量映射为第二组高维特征向量,其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且第二参数由与第一组高维特征向量相关联的预定参数确定。
在该实施例中,特征提取设备100为每个块提取n1维特征。第二组滤波器将这些n1维向量映射成一组n2维向量。每个经映射的向量在概念上是相对更干净的特征向量。这些向量包括另一组特征图。
根据一个实施例,特征增强可以被公式化为:
f2(y)=f’(w2*y+b2)(2)
其中,w2的大小为n1×f2×f2×n2,b2是n2维向量。
如图所示,装置1000还可包括映射设备300。映射设备300可耦合到特征增强设备200,并且包括第三组滤波器,其被配置为将第二组中的每个高维向量非线性地映射为复原的分块表示。
根据一个实施例,映射设备300被配置为通过函数f'(第三参数)将每个高维向量非线性地映射为分块表示,其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),并且第三参数由与第二组高维特征向量(即更干净的高维特征向量)相关联的预定参数确定。
在一个实施例中,特征增强设备200生成一组n2维特征向量。映射设备300将这些n2维向量中的每个映射成n3维向量。每个经映射的向量在概念上是一个复原的块的表示。这些向量包括另一组特征图。
根据一个实施例,映射可被公式化为:
f3(y)=f’(w3*f2(y)+b3)(3)
其中,w3的大小为n2×f3×f3×n3,b3为一个n3维向量。输出的n3维向量中的每个在概念上是将用于重构的复原的块的表示。
如图所示,装置1000还可包括聚合设备400。聚合设备400可与映射设备300执行电通信,并且被配置为对分块表示进行聚合,以生成复原的清晰图像。
聚合设备400对复原的分块表示进行聚合,以生成复原的清晰图像。聚合可被公式化为:
f(y)=w4*f3(y)+b4(4)
其中,w4的大小为n3×f4×f4×c,b4是c维向量。
根据该实施例,装置1000还可包括比较设备(未示出),其被耦合到聚合设备400,并且被配置为,从预定训练集采样得到与有损压缩子图像相应的真实未压缩子图像,并且比较从聚合设备400接收的聚合复原的清晰子图像与采样得到的真实未压缩子图像之间的不相似度,以生成重构误差。例如,重构误差包括均方误差。将重构误差反向传输,以确定例如w1、w2、w3、w4、b1、b2、b3和b4等参数。
图2是示出与本申请的另一实施例一致的用于降低有损压缩图像的压缩失真的装置1000'的示意图。如图2所示,装置1000'可包括重构单元100'和训练单元200'。重构单元100'被配置为,基于预定参数将有损压缩图像重构为复原的清晰图像。
根据图2所示的实施例,重构单元100'还可包括特征提取设备110'、特征增强设备120'、映射设备130'和聚合设备140'。在一个实施例中,特征提取设备110'、特征增强设备120'、映射设备130'和聚合设备140'可分别包括至少一个卷积层,并且卷积层依次相互连接,以形成卷积神经网络系统。
图3示出了数学模拟模型中卷积神经网络系统的层结构。在一个实施例中,特征提取设备110'、特征增强设备120'、映射设备130'和聚合设备140'中的每个可分别被模拟为至少一个卷积层。分别在不同的卷积层进行不同的操作。
在该实施例中,特征提取设备110'被配置为,从有损压缩图像提取块,并将提取的块映射为第一组高维特征向量。这相当于通过如上所述的滤波器组对图像进行卷积。
特征增强设备120'被配置为,与特征提取设备110'执行电通信,并且对第一组中的每个高维特征向量去噪,并且将去噪的高维特征向量映射为第二组高维特征向量,例如,一组相对更干净的特征向量。这相当于应用如上所述的第二组滤波器。
映射设备130'被配置为耦合到特征增强设备120',并且将第二组中的每个高维向量非线性地映射为复原的分块表示。这相当于应用如上所述的第三组滤波器。
聚合设备140'被配置为,与映射设备130'执行电通信,并且对由第二组中的所有高维向量映射的分块表示进行聚合,以生成复原的清晰图像。
在一个实施例中,特征提取设备110'、特征增强设备120'、映射设备130'和聚合设备140'分别包括至少一个卷积层,并且卷积层依次相互连接,以形成卷积神经网络系统。卷积神经网络系统可追溯到数十年前,最近显示出爆炸性的流行态势,部分原因在于其在图像分类上的成功。卷积神经网络系统通常用于自然图像去噪和去除噪声模式(污物/雨)。
可替代地,可添加更多的卷积层以增加非线性。然而,这会显著增加卷积神经网络系统的复杂度,从而需要更多的训练数据和时间。
训练单元200'被配置为,使用预定训练集训练卷积神经网络系统,以便优化重构单元所使用的参数,例如w1、w2、w3、w4、b1、b2、b3和b4等。根据图4所示的实施例,训练单元200'还可包括采样设备210'、比较设备220'和反向传输设备230'。
采样设备210'可被配置为,对预定训练集进行采样,得到有损压缩子图像及其相应的真实未压缩子图像,并将有损压缩子图像输入到卷积神经网络系统。此处,“子图像”指这些样本被视为小的“图像”而不是“块”,在某种意义上,多个“块”是重叠的,需要一些取平均后处理,而“子图像”不需要该后处理。
比较设备220'可被配置为,比较由卷积神经网络系统基于输入的有损压缩子图像得到的重构清晰子图像与相应的真实未压缩子图像之间的不相似度,以生成重构误差。例如,重构误差可包括均方误差,并且通过使用标准反向传输的随机梯度下降来将误差最小化。
反向传输设备230'被配置为,通过卷积神经网络系统反向传输重构误差,以便调整卷积神经网络系统的神经元之间的连接的权重。
应当注意,如果只有重构误差是可推导的,则卷积神经网络系统不排除使用其他种类的重构误差。如果在训练期间更好的感知激励度量被给定,则卷积神经网络系统能灵活地适应该度量。
在一个实施例中,装置1000和1000'还可包括耦合到比较设备的训练集准备设备,并且该训练集准备设备被配置为,准备用于训练卷积神经网络系统的预定训练集。图5是示出了训练集准备设备的示意图。如图所示,训练集准备设备可包括裁剪器241'、有损压缩子图像生成器242'、配对设备243'和收集器244'。
裁剪器241'可被配置为,从随机选择的训练图像中随机裁剪出多个子图像,以生成一组真实未压缩的子图像。例如,裁剪器241'可裁剪出n个像素为m×m的子图像。有损压缩子图像生成器242'可与裁剪器241'执行电通信,并且被配置为,基于从裁剪器241'接收到的真实未压缩子图像来生成一组有损压缩子图像。配对设备243'可与裁剪器241'和有损压缩子图像生成器242'执行电通信,并且被配置为,将每个真实未压缩子图像与相应的有损压缩子图像进行配对。收集器244'可与配对设备243'执行电通信,并且被配置为,收集所有配对子图像,以形成预定训练集。
根据一个实施例,有损压缩子图像生成器242'可包括压缩设备,其与裁剪器241'执行电通信,并且被配置为,通过压缩编码器和解码器对真实子图像进行编码和解码,以生成一组有损压缩子图像。
图6是示出了与公开的一些实施例一致的用于降低有损压缩图像的压缩失真的方法2000的示意性流程图。以下可结合图6对方法2000进行详细描述。
在步骤s210,通过包括第一组滤波器的特征提取设备,从有损压缩图像提取块,并将每个提取的块映射为高维特征向量,以形成第一组高维特征向量。在一个实施例中,这些向量包括一组特征图,特征图的数量等于向量的维数。图像复原的流行策略,是密集地提取块,然后通过一组预先训练的基础来表示这些块,前述的基础例如,pca,dct,haar等。
在步骤s220,通过与特征提取设备执行电通信并且包括第二组滤波器的特征增强设备,对第一组中的每个高维特征向量进行去噪,并将去噪的高维特征向量映射为第二组高维特征向量中。在本实施例中,特征提取设备为每个块提取n1维特征。第二组滤波器将这些n1维向量映射成一组n2维向量。每个经映射的向量在概念上是相对更干净的特征向量。这些向量包括另一组特征图。
在步骤s230,通过耦合到特征增强设备并且包括第三组滤波器的映射设备,将第二组中的每个高维向量非线性地映射为复原的分块表示。在该实施例中,特征增强设备生成一组n2维特征向量。映射设备将这些n2维向量中的每个映射成n3维向量。每个经映射的向量在概念上是复原的分块表示。这些向量包括另一组特征图。
在步骤s240,通过与映射设备执行电通信的聚合设备,将由第二组中的所有高维向量映射得到的分块表示进行聚合,以生成复原的清晰图像。在一个实施例中,这些步骤s210-s230可通过上述公式(1)-(3)进行模拟。
根据一个实施例,可从有损压缩图像提取块,并通过函数f'(第一参数)将每个提取的块映射为高维特征向量。其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第一参数由与有损压缩图像相关联的预定参数确定得到。
根据一个实施例,第一组高维特征向量可被去噪,并且去噪的高维特征向量可通过函数f'(第二参数)非线性地映射为第二组高维特征向量,即一组相对更干净的特征向量。其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第二参数由与第一组高维特征向量相关联的预定参数确定得到。
根据一个实施例,通过函数f'(第三参数)可将第二组中的每个高维向量非线性地映射为复原的分块表示。其中,f'(x)是非线性函数(例如,max(0,x),1/(1+exp(-x))或tanh(x)),第三参数由与第二组高维向量相关联的预定参数确定得到。
根据一个实施例,在对分块表示进行聚合以生成复原的清除图像之后,方法2000还可包括从预定训练集中采样得到与有损压缩子图像相应的真实未压缩子图像的步骤、比较经过聚合后复原的清晰子图像与相应的真实未压缩子图像之间的不相似度,以生成重构误差的步骤。将重构误差反向传输以优化参数,例如,w1、w2、w3、w4、b1、b2、b3和b4。
根据一个实施例,在从预定训练集进行采样得到与有损压缩子图像相应的真实未压缩子图像之前,方法2000还包括准备预定训练集的步骤。具体地,首先从随机选择的训练图像中裁剪出多个子图像,以生成一组真实未压缩子图像。例如,可裁剪出n个m×m像素的子图像。接下来,基于一组真实未压缩子图像生成一组有损压缩子图像。然后,将每个真实未压缩子图像与相应的有损压缩子图像进行配对。之后,收集所有的配对子图像,以形成预定训练集。
根据一个实施例,示出了用于训练用于降低有损压缩图像的压缩失真的卷积神经网络系统的方法3000。以下可结合图7对训练方法3000进行详细描述。
如图7所示,在步骤s310,从预定训练集中采样得到有损压缩子图像及其相应的真实未压缩子图像。在步骤s320,通过卷积神经网络系统将有损压缩子图像重构为复原的清晰子图像。在步骤s330,通过比较重构的清晰子图像和真实未压缩子图像之间的不相似度,生成重构误差。在步骤s340,将重构误差反向传输给卷积神经网络系统,以调整卷积神经网络系统的神经元之间连接的权重。重复步骤s310-s340,直到重构误差的平均值低于预定阈值为止,例如,预定阈值为预定训练集中的有损压缩子图像和真实未压缩子图像之间的均方误差的一半。
参考图8,示出了系统4000。系统4000包括存储可执行组件的存储器402和耦合到存储器402的处理器404,处理器404执行可执行组件,以执行系统4000的操作。可执行组件可包括:特征提取组件410,被配置为从有损压缩图像提取块,并将所提取的块映射为第一组高维特征向量;特征增强组件420,被配置为对第一组中的每个高维特征向量进行去噪,并且将去噪的高维特征向量映射为第二组高维特征向量。此外,可执行组件还可包括:映射组件430,被配置为将第二组中的每个高维向量非线性地映射为复原的分块表示;以及聚合组件440,被配置为对由第二组中的所有高维向量映射的分块表示进行聚合,以生成复原的清晰图像。
在一方面,特征提取组件410被配置为,从有损压缩图像提取块,并将提取的块中的每个非线性地映射为高维特征向量,并且经过映射的所有块的向量形成所述第一组高维特征向量。
在一个实施例中,特征增强组件420被配置为,对第一组中的每个高维特征向量进行去噪,并将去噪的高维特征向量非线性地映射为第二组高维特征向量。
在一个实施例中,特征提取组件410、特征增强组件420和映射组件430分别基于预定的第一参数、第二参数和第三参数映射向量。
根据另一个实施例,可执行组件还包括比较组件,其耦合到聚合组件,并且被配置为,从预定训练集采样获得与有损压缩子图像相应的真实未压缩图像,并且比较从聚合组件接收到的聚合复原的干净图像与相应的真实未压缩图像之间的不相似度,以生成重构误差,其中,重构误差被反向传输以优化第一参数、第二参数和第三参数。
在一个实施例中,可执行组件还包括耦合到比较组件的训练集准备组件。所述训练集准备组件还包括:裁剪器,被配置为从随机选择的训练图像随机裁剪出多个子图像,以生成一组真实未压缩子图像;有损压缩子图像生成器,与裁剪器执行电通信,并且被配置为,基于从裁剪器接收的真实未压缩子图像生成一组有损压缩子图像;配对模块,与裁剪器和生成器执行电通信,并且被配置为,将每个真实未压缩子图像与相应的有损压缩子图像进行配对;以及收集器,与配对模块执行电通信,并且被配置为,收集配成对的真实未压缩子图像和有损压缩子图像,以形成预定训练集。
在一个实施例中,有损压缩子图像生成器还包括压缩模块,其与裁剪器和生成器执行电通信,并且被配置为,通过压缩编码器和解码器对真实子图像进行编码和解码,以生成有损压缩子图像组。
与现有方法相反,本申请的方法并不明确地学习用于块域建模的字典或流形,这些是通过卷积层内部实现的。此外,特征提取、特征增强和聚合也被形成为卷积层,因此在优化中被涉及。本申请的方法和装置揭示了不同种类的压缩失真,并且提供了对不同图像区域中的各种压缩失真的有效降低。在本申请的方法和装置中,整个卷积神经网络完全通过训练获得,无需经过预处理/后处理。由于采用轻质结构,本申请的装置和方法较现有技术实现了更优越的性能。
本发明范围内的实施例可在数字电子电路中实现,或在计算机硬件、固件、软件或其组合中实现。在本发明范围内的装置可在有形地体现在机器可读存储设备中的用于由可编程处理器执行的计算机程序产品中实现;并且,本发明范围内的方法步骤可由执行指令程序的可编程处理器执行,以通过对输入数据进行操作并产生输出来执行本发明的功能。
可通过在可编程系统上执行一个或多个计算机程序来有益地实现本发明范围内的实施例,该可编程系统包括至少一个可编程处理器以及至少一个输入设备和至少一个输出设备,可编程处理器被耦合以从数据存储系统接收数据和指令,并将数据和指令传送到数据存储系统。每个计算机程序可通过高级过程语言或面向对象的编程语言来实现,或者如果需要,以汇编语言或机器语言来实现;在任何情况下,该语言可以是编译或解释语言。合适的处理器包括例如通用和专用的微处理器。通常,处理器将从只读存储器和/或随机存取存储器接收指令和数据。通常,计算机将包括一个或多个用于存储数据文件的大容量存储设备。
在本发明的范围内的实施例包括用于携带或存储有计算机可执行指令、计算机可读指令或数据结构的计算机可读介质。这样的计算机可读介质可以是可由通用或专用计算机系统访问的任何可用介质。计算机可读介质的示例可以包括物理存储介质,例如ram、rom、eprom、cd-rom或其他光盘存储器、磁盘存储器或其他磁存储设备,或可用于携带或存储期望的程序代码的任何其他介质,程序代码以计算机可执行指令、计算机可读指令或数据结构的形式表示,并且可由通用或专用计算机系统访问。任何上述内容可以由asic(专用集成电路)补充或并入asic中。虽然已经示出和描述了本发明的特定实施例,但是在不脱离本发明的真实范围的情况下,可以对这些实施例进行改变和修改。
虽然已经描述了本发明的优选实施例,但是本领域技术人员在获知基本的发明构思时,可以对这些实施例进行变形或修改。所附权利要求旨在被认为包括优选实施例,并且所有有变形或修改均落入本发明的范围内。
显然,在不脱离本发明的精神和范围的情况下,本领域技术人员可以对本发明进行变形或修改。因此,如果这些变形或修改属于权利要求和等同技术的范围,它们也可落入本发明的范围内。