本发明涉及图像处理技术领域,具体涉及一种网络训练方法、装置、计算设备及计算机存储介质。
背景技术:
利用图像风格化处理技术,能够将风格图像上的风格转移到日常拍摄的图像上,使得图像能够获得更好的视觉效果。在现有技术中,是将一个给定的风格图像直接输入至一个神经网络(neuralnetwork)中,然后利用大量的内容图像作为样本图像,经过多次迭代训练得到与给定的风格图像对应的图像转换网络,利用该图像转换网络实现输入内容图像的风格转换。
现有技术中,对于任意给定的风格图像,都需要进行成千上万次的迭代运算对神经网络进行训练,得到该风格对应的图像转换网络。在图像转换网络的训练过程中,成千上万次的迭代运算造成计算量巨大,这将会需要很长的训练时间,导致图像风格化处理效率低下。
技术实现要素:
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的网络训练方法、装置、计算设备及计算机存储介质。
根据本发明的一方面,提供了一种网络训练方法,该方法通过多次迭代完成;
其中一次迭代过程的训练步骤包括:
提取第一样本图像和第二样本图像;
根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络;
利用第二网络,生成与第二样本图像对应的第三样本图像;
根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数;
该方法包括:迭代执行上述训练步骤,直至满足预定收敛条件。
进一步地,提取第一样本图像和第二样本图像进一步包括:
从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。
进一步地,在多次迭代过程中,固定提取一个第一样本图像,替换地提取至少一个第二样本图像;当内容图像库中的第二样本图像提取完毕后,替换下一个第一样本图像,再替换地提取至少一个第二样本图像。
进一步地,根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络进一步包括:
将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络。
进一步地,将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络进一步包括:
从第一样本图像中提取风格纹理特征;
将风格纹理特征输入至第一网络中,得到与风格纹理特征对应的第二网络。
进一步地,根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数进一步包括:
根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失,得到第一网络损失函数,利用第一网络损失函数更新第一网络的权重参数。
进一步地,预定收敛条件包括:迭代次数达到预设迭代次数;和/或,第一网络损失函数的输出值小于预设阈值;和/或,与第二样本图像对应的第三样本图像的视觉效果参数达到预设视觉效果参数。
进一步地,第一网络为对神经网络进行训练得到的元网络,第二网络为图像转换网络。
进一步地,该方法由终端或服务器执行。
根据本发明的另一方面,提供了一种网络训练装置,该装置通过多次迭代完成;该装置包括:
提取模块,适于提取第一样本图像和第二样本图像;
生成模块,适于根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络;
样本处理模块,适于利用第二网络,生成与第二样本图像对应的第三样本图像;
更新模块,适于根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数;
该网络训练装置迭代运行,直至满足预定收敛条件。
进一步地,提取模块进一步适于:
从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。
进一步地,该装置进一步适于:在多次迭代过程中,固定提取一个第一样本图像,替换地提取至少一个第二样本图像;当内容图像库中的第二样本图像提取完毕后,替换下一个第一样本图像,再替换地提取至少一个第二样本图像。
进一步地,生成模块进一步适于:
将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络。
进一步地,生成模块进一步适于:
从第一样本图像中提取风格纹理特征;
将风格纹理特征输入至第一网络中,得到与风格纹理特征对应的第二网络。
进一步地,更新模块进一步适于:
根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失,得到第一网络损失函数,利用第一网络损失函数更新第一网络的权重参数。
进一步地,预定收敛条件包括:迭代次数达到预设迭代次数;和/或,第一网络损失函数的输出值小于预设阈值;和/或,与第二样本图像对应的第三样本图像的视觉效果参数达到预设视觉效果参数。
进一步地,第一网络为对神经网络进行训练得到的元网络,第二网络为图像转换网络。
根据本发明的另一方面,提供了一种终端,包括上述的网络训练装置。
根据本发明的另一方面,提供了一种服务器,包括上述的网络训练装置。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述网络训练方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述网络训练方法对应的操作。
根据本发明提供的技术方案,提取第一样本图像和第二样本图像,根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络,接着利用第二网络,生成与第二样本图像对应的第三样本图像,然后根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数,迭代执行训练步骤,直至满足预定收敛条件。本发明提供的技术方案,能够训练得到适用于任意风格图像和任意内容图像的第一网络,而且利用第一网络有助于快速地得到对应的图像转换网络,提高图像风格化处理的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的图像风格化处理方法的流程示意图;
图2a示出了第一图像的示例图;
图2b示出了第二图像的示例图;
图2c示出了第三图像的示例图;
图3a示出了根据本发明一个实施例的网络训练方法的流程示意图;
图3b示出了根据本发明另一个实施例的网络训练方法的流程示意图;
图4示出了根据本发明另一个实施例的图像风格化处理方法的流程示意图;
图5示出了根据本发明一个实施例的图像风格化处理装置的结构框图;
图6示出了根据本发明另一个实施例的图像风格化处理装置的结构框图;
图7示出了根据本发明另一个实施例的网络训练装置的结构框图;
图8示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的图像风格化处理方法的流程示意图,该方法可由终端或服务器执行,该方法基于经过训练的第一网络而执行,如图1所示,该方法包括如下步骤:
步骤s100,获取一第一图像。
其中,第一图像可以是具有任意风格的风格图像,并不限于具有某些特定风格的风格图像。当用户想要将图像处理成与某一个第一图像具有一致风格的图像时,可在步骤s100中获取该第一图像。为了与第一图像进行区分,在本发明中将用户想要处理的图像称为待处理的第二图像。
步骤s101,将第一图像输入至第一网络中,得到与第一图像的风格对应的第二网络。
第一网络是经过训练的,具体地,第一网络训练所用的样本图像包含:风格图像库存储的多个第一样本图像和内容图像库存储的多个第二样本图像。其中,第一样本图像为风格样本图像,第二样本图像为内容样本图像。经训练得到的第一网络能够很好地适用于任意风格图像和任意内容图像,所以在步骤s101中将步骤s100所获取的第一图像输入至第一网络中后,无需再针对该第一图像进行训练,就能够快速地映射得到与该第一图像的风格对应的第二网络。
其中,第一网络的训练过程通过多次迭代完成。可选地,在一次迭代过程中,从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像,利用一个第一样本图像和至少一个第二样本图像对第一网络进行训练。
可选地,一次迭代过程包括:利用与第一样本图像的风格对应的第二网络,生成与第二样本图像对应的第三样本图像;根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失,得到第一网络损失函数,根据第一网络损失函数更新第一网络的权重参数。
在本发明具体实施例中,第一网络为对神经网络进行训练得到的元网络(metanetwork),第二网络即为图像转换网络。在现有技术中,是直接利用神经网络经长时间训练得到对应的图像转换网络,而在本发明中是对神经网络进行训练,由于经训练得到的元网络能够很好地适用于任意风格图像和任意内容图像,那么利用元网络就能够快速地映射得到对应的图像转换网络,而并不是直接利用神经网络训练得到图像转换网络,因此与现有技术相比,极大地了提高了获得图像转换网络的速度。
步骤s102,利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。
在得到了与第一图像的风格对应的第二网络之后,利用第二网络对待处理的第二图像进行风格化处理,经风格化处理后所得到的第三图像即为与第二图像对应的风格迁移图像,该风格迁移图像具有与第一图像一致的风格。图2a和图2b分别示出了第一图像和第二图像的示例图,利用与图2a所示的第一图像的风格对应的第二网络对图2b所示的第二图像进行风格化处理,所得到的对应的第三图像如图2c所示。如图2c所示,该第三图像已具有了图2a所示的第一图像的风格。
根据本发明实施例提供的图像风格化处理方法,获取一第一图像,接着将第一图像输入至第一网络中,得到与第一图像的风格对应的第二网络,然后利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。与现有技术中的图像风格化处理方式相比,本发明提供的技术方案利用经过训练的第一网络能够快速地得到对应的图像转换网络,有效地提高了图像风格化处理的效率,优化了图像风格化处理方式。
图3a示出了根据本发明一个实施例的网络训练方法的流程示意图,该方法可由终端或服务器执行,该方法通过多次迭代完成,如图3a所示,一次迭代过程的训练步骤包括:
步骤s200,提取第一样本图像和第二样本图像。
为了对第一网络进行训练,在步骤s200中,需要提取第一样本图像和第二样本图像。其中,第一样本图像为风格图像,第二样本图像为内容图像。本领域技术人员可根据实际需要设置所提取的第一样本图像和第二样本图像的数量,此处不做限定。
步骤s201,根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络。
在本发明的一个具体实施例中,第一网络为对神经网络进行训练得到的元网络。在提取了第一样本图像之后,就可根据神经网络和所提取的第一样本图像,得到与第一样本图像的风格对应的第二网络,第二网络即为图像转换网络。
步骤s202,利用第二网络,生成与第二样本图像对应的第三样本图像。
在得到了与第一样本图像的风格对应的第二网络之后,就可利用该第二网络,生成与第二样本图像对应的第三样本图像,第三样本图像即为风格迁移图像,风格迁移图像具有与第一样本图像一致的风格。
步骤s203,根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数。
具体地,可根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失来更新第一网络的权重参数。
步骤s204,迭代执行训练步骤,直至满足预定收敛条件。
本领域技术人员可根据实际需要设置预定收敛条件,此处不做限定。迭代执行上述训练步骤,直至满足预定收敛条件,从而得到经过训练的第一网络。经过训练的第一网络能够适用于任意风格图像和任意内容图像,那么利用第一网络就能够快速地映射得到对应的图像转换网络,而并不是直接利用第一网络训练得到图像转换网络,因此与现有技术相比,极大地了提高了获得图像转换网络的速度。
根据本发明实施例提供的网络训练方法,能够训练得到适用于任意风格图像和任意内容图像的第一网络,而且利用第一网络有助于快速地得到对应的图像转换网络,提高图像风格化处理的效率。
图3b示出了根据本发明另一个实施例的网络训练方法的流程示意图,该方法可由终端或服务器执行,该方法通过多次迭代完成,如图3b所示,一次迭代过程的训练步骤包括:
步骤s300,从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。
在具体训练过程中,风格图像库存储了10万个第一样本图像,内容图像库存储了10万个第二样本图像,其中,第一样本图像为风格图像,第二样本图像为内容图像。在步骤s300中,从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。本领域技术人员可根据实际需要设置第二样本图像的数量,此处不做限定。
步骤s301,将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络。
在本发明的一个具体实施例中,第一网络为对神经网络进行训练得到的元网络。例如,神经网络可为vgg-16卷积神经网络(convolutionalneuralnetwork)。具体地,在步骤s301中,从第一样本图像中提取风格纹理特征,然后将所提取的风格纹理特征输入至第一网络中,在第一网络中进行前向传播(forwardpropagation)运算,得到与风格纹理特征对应的第二网络。
步骤s302,利用与第一样本图像的风格对应的第二网络,分别针对至少一个第二样本图像生成对应的第三样本图像。
在得到了与第一样本图像的风格对应的第二网络之后,就可利用与第一样本图像的风格对应的第二网络,分别针对至少一个第二样本图像生成对应的第三样本图像,第三样本图像即为与第二样本图像对应的风格迁移图像,风格迁移图像具有与第一样本图像一致的风格。当在步骤s300中提取了8个第二样本图像,那么在步骤s302中,分别针对8个第二样本图像生成对应的第三样本图像,即针对每一个第二样本图像生成了一个对应的第三样本图像。
步骤s303,根据至少一个第三样本图像与第一样本图像之间的风格损失以及至少一个第三样本图像与对应的第二样本图像之间的内容损失,得到第一网络损失函数,根据第一网络损失函数更新第一网络的权重参数。
其中,本领域技术人员可根据实际需要设置第一网络损失函数的具体内容,此处不做限定。在一个具体实施例中,第一网络损失函数可以为:
其中,ic为第二样本图像,is为第一样本图像,i为第三样本图像,cp为用于感知内容差别的感知函数,sp为用于感知风格差别的感知函数,
在一个具体的训练过程中,第一网络为对神经网络进行训练得到的元网络,第二网络为图像转换网络。利用随机梯度下降(stochasticgradientdescent)算法训练第一网络。具体地训练过程包括:
1.设置一个第一样本图像的迭代次数k和第二样本图像ic的个数m。例如,可将迭代次数k设置为20,将第二样本图像ic的个数m设置为8,表示在元网络的训练过程中,针对一个第一样本图像需要迭代20次,每次迭代需要从内容图像库中提取8个第二样本图像ic。
2.从风格图像库中固定提取一个第一样本图像is。
3.将第一样本图像is输入至第一网络n(·;θ)中,在第一网络n(·;θ)中进行前馈传播(feed-forwardpropagation)运算,得到与第一样本图像is的风格对应的第二网络w。其中,第二网络w与第一网络n(·;θ)的映射公式为:w←n(is;θ)。
4.输入m个第二样本图像ic。其中,m个第二样本图像ic可用
5.利用第二网络w,分别针对每一个第二样本图像ic生成对应的第三样本图像i。
6.根据第一网络损失函数更新第一网络的权重参数θ。
其中,第一网络损失函数具体为:
在第一网络损失函数中,λc为预设内容损失权重,λs为预设风格损失权重。
步骤s304,迭代执行训练步骤,直至满足预定收敛条件。
其中,本领域技术人员可根据实际需要设置预定收敛条件,此处不做限定。例如,预定收敛条件可包括:迭代次数达到预设迭代次数;和/或,第一网络损失函数的输出值小于预设阈值;和/或,与第二样本图像对应的第三样本图像的视觉效果参数达到预设视觉效果参数。具体地,可以通过判断迭代次数是否达到预设迭代次数来判断是否满足预定收敛条件,也可以根据第一网络损失函数的输出值是否小于预设阈值来判断是否满足预定收敛条件,还可以通过判断与第二样本图像对应的第三样本图像的视觉效果参数是否达到预设视觉效果参数来判断是否满足预定收敛条件。在步骤s304中,迭代执行上述训练步骤,直至满足预定收敛条件,从而得到经过训练的第一网络。
值得注意的是,为了提升训练过程中第一网络的稳定性,本发明在多次迭代过程中,固定提取一个第一样本图像,替换地提取至少一个第二样本图像;当内容图像库中的第二样本图像提取完毕后,替换下一个第一样本图像,再替换地提取至少一个第二样本图像。
通过先固定第一样本图像并不断替换第二样本图像的方式,能够高效地训练得到适用于该第一样本图像和任意第二样本图像的第一网络,接着再替换下一个第一样本图像并不断替换第二样本图像,从而训练得到适用于上述两个第一样本图像和任意第二样本图像的第一网络。重复上述过程直至风格图像库中的第一样本图像和内容图像库中的第二样本图像均提取完毕,就能够训练得到适用于任意第一样本图像和任意第二样本图像的第一网络,相当于训练得到了适用于任意风格图像和任意内容图像的第一网络,从而有效地缩减了训练第一网络所需的时间,提高了第一网络的训练效率。
根据本发明实施例提供的网络训练方法,不仅能够训练得到适用于任意风格图像和任意内容图像的第一网络,而且有效地缩减了网络训练所需的时间,提高了网络训练效率;另外,利用第一网络有助于快速地得到对应的图像转换网络,提高图像风格化处理的效率。
图4示出了根据本发明另一个实施例的图像风格化处理方法的流程示意图,该方法可由终端或服务器执行,该方法基于经过训练的第一网络而执行,如图4所示,该方法包括如下步骤:
步骤s400,获取一第一图像。
其中,第一图像可以是具有任意风格的风格图像,并不限于具有某些特定风格的风格图像。具体地,第一图像可以是网站中的风格图像,也可以是其他用户分享的风格图像。当用户想要将待处理的第二图像处理成与某一个第一图像具有一致风格的图像时,可在步骤s400中获取该第一图像。
步骤s401,将第一图像输入至第一网络中,在第一网络中进行一次前向传播运算,得到与第一图像的风格对应的第二网络。
由于第一网络是经过训练的,该第一网络能够很好地适用于任意风格图像和任意内容图像,所以将第一图像输入至第一网络中后,无需再针对该第一图像进行训练,只需在第一网络中进行一次前向传播运算,就能够快速地映射得到与该第一图像的风格对应的第二网络。在具体应用中,将第一图像输入至第一网络中后,只需0.02s就能够得到与该第一图像的风格对应的第二网络,第二网络即为图像转换网络,与现有技术相比,有效地提高了获得图像转换网络的速度。
步骤s402,利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。
在得到了与第一图像的风格对应的第二网络之后,利用第二网络对待处理的第二图像进行风格化处理,可方便地得到与第二图像对应的第三图像。第三图像即为与第二图像对应的风格迁移图像。
下面通过与现有技术中的两种图像风格化处理方法进行对比说明本发明提供的图像风格化处理方法所具有的优势。其中,表1示出了本方法与现有技术中的两种图像风格化处理方法的比较结果。
表1
如表1所示,盖提斯等人于提交了论文《一种艺术风格的神经算法》,该论文中所提出的方法无法得到图像转换网络,但能够适用于任何风格,需耗时9.52s才能得到对应的风格迁移图像。
约翰逊等人于2016年在欧洲计算机视觉会议中发表了论文《实时风格转换和超分辨率的感知损失》,该论文中所提出的方法需耗时4h才得到相应的图像转换网络,且只能适用于一种风格,但只需耗时0.015s得到对应的风格迁移图像。
而本发明提供的图像风格化处理方法与上述两种方法相比,不仅能够适用于任何风格,而且仅需耗时0.022s得到相应的图像转换网络,并只需耗时0.015s得到对应的风格迁移图像,有效地提高了获得图像转换网络的速度和获得风格迁移图像的效率。
根据本发明实施例提供的图像风格化处理方法,获取一第一图像,接着将第一图像输入至第一网络中,在第一网络中进行一次前向传播运算,得到与第一图像的风格对应的第二网络,然后利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。与现有技术中的图像风格化处理方式相比,本发明提供的技术方案在经过训练的第一网络中进行一次前向传播运算,就能够快速地映射得到对应的图像转换网络,有效地提高了获得图像转换网络的速度,提高了图像风格化处理的效率,优化了图像风格化处理方式;另外,利用所得到的图像转换网络能够方便、快速地对图像进行风格化处理。
图5示出了根据本发明一个实施例的图像风格化处理装置的结构框图,该装置基于经过训练的第一网络而运行,如图5所示,该装置包括:获取模块510、映射模块520和处理模块530。
获取模块510适于:获取一第一图像。
其中,第一图像可以是具有任意风格的风格图像,并不限于具有某些特定风格的风格图像。当用户想要将待处理的第二图像处理成与某一个第一图像具有一致风格的图像时,获取模块510需要获取该第一图像。
映射模块520适于:将第一图像输入至第一网络中,得到与第一图像的风格对应的第二网络。
具体地,第一网络训练所用的样本图像包含:风格图像库存储的多个第一样本图像和内容图像库存储的多个第二样本图像。映射模块520将获取模块510所获取的第一图像输入至第一网络中后,无需针对该第一图像进行训练,就能够快速地映射得到与第一图像的风格对应的第二网络。
处理模块530适于:利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。
处理模块530利用映射模块520得到的第二网络对待处理的第二图像进行风格化处理,方便地得到与第二图像对应的第三图像,该第三图像具有与第一图像一致的风格。
根据本发明实施例提供的图像风格化处理装置,获取模块获取一第一图像,映射模块将第一图像输入至第一网络中,得到与第一图像的风格对应的第二网络,处理模块利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。与现有技术中的图像风格化处理方式相比,本发明提供的技术方案利用经过训练的第一网络能够快速地得到对应的图像转换网络,有效地提高了图像风格化处理的效率,优化了图像风格化处理方式。
图6示出了根据本发明另一个实施例的图像风格化处理装置的结构框图,如图6所示,该装置包括:获取模块610、第一网络训练模块620、映射模块630和处理模块640。
获取模块610适于:获取一第一图像。
其中,第一网络的训练过程通过多次迭代完成。第一网络训练模块620适于:在一次迭代过程中,从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像,利用一个第一样本图像和至少一个第二样本图像对第一网络进行训练。
可选地,第一网络训练模块620适于:在一次迭代过程中,利用与第一样本图像的风格对应的第二网络,生成与第二样本图像对应的第三样本图像;根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失,得到第一网络损失函数,根据第一网络损失函数更新第一网络的权重参数。
在一个具体实施例中,第一网络训练模块620可包括:提取单元621、生成单元622、处理单元623和更新单元624。
具体地,提取单元621适于:从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。
生成单元622适于:将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络。
在本发明的一个具体实施例中,第一网络为对神经网络进行训练得到的元网络,第二网络为图像转换网络。生成单元622进一步适于:从第一样本图像中提取风格纹理特征;将风格纹理特征输入至第一网络中,得到与风格纹理特征对应的第二网络。
处理单元623适于:利用与第一样本图像的风格对应的第二网络,分别针对至少一个第二样本图像生成对应的第三样本图像。
更新单元624适于:根据至少一个第三样本图像与第一样本图像之间的风格损失以及至少一个第三样本图像与对应的第二样本图像之间的内容损失,得到第一网络损失函数,根据第一网络损失函数更新第一网络的权重参数。其中,本领域技术人员可根据实际需要设置第一网络损失函数的具体内容,此处不做限定。在一个具体实施例中,第一网络损失函数可以为:
其中,ic为第二样本图像,is为第一样本图像,i为第三样本图像,cp为用于感知内容差别的感知函数,sp为用于感知风格差别的感知函数,
第一网络训练模块620迭代运行,直至满足预定收敛条件。第一网络训练模块620进一步适于:固定提取一个第一样本图像,替换地提取至少一个第二样本图像;当内容图像库中的第二样本图像提取完毕后,替换下一个第一样本图像,再替换地提取至少一个第二样本图像。通过上述方式,能够高效地训练得到适用于任意风格图像和任意内容图像的第一网络,从而有效地缩减了训练第一网络所需的时间,提高了第一网络的训练效率。
映射模块630适于:将第一图像输入至第一网络中,在第一网络中进行一次前向传播运算,得到与第一图像的风格对应的第二网络。
由于第一网络是经过第一网络训练模块620训练的,该第一网络能够很好地适用于任意风格图像和任意内容图像,所以映射模块630将获取模块610所获取的第一图像输入至第一网络训练模块620训练得到的第一网络中,无需再针对该第一图像进行训练,只需在第一网络中进行一次前向传播运算,就能够快速地映射得到与该第一图像的风格对应的第二网络。
处理模块640适于:利用第二网络对待处理的第二图像进行风格化处理,得到与第二图像对应的第三图像。
根据本发明实施例提供的图像风格化处理装置,获取模块获取一第一图像,第一网络训练模块对第一网络进行训练,映射模块将第一图像输入至第一网络中,在第一网络中进行一次前向传播运算,得到与第一图像的风格对应的第二网络,处理模块利用第二网络对第二图像进行风格化处理,得到与第二图像对应的第三图像。与现有技术中的图像风格化处理方式相比,本发明提供的技术方案在经过训练的第一网络中进行一次前向传播运算,就能够快速地映射得到对应的图像转换网络,有效地提高了获得图像转换网络的速度,提高了图像风格化处理的效率,优化了图像风格化处理方式;另外,利用所得到的图像转换网络能够方便、快速地对图像进行风格化处理。
图7示出了根据本发明另一个实施例的网络训练装置的结构框图,该装置通过多次迭代完成,如图7所示,该装置包括:提取模块710、生成模块720、样本处理模块730和更新模块740。
提取模块710适于:提取第一样本图像和第二样本图像。
提取模块710进一步适于:从风格图像库中提取一个第一样本图像,从内容图像库中提取至少一个第二样本图像。
生成模块720适于:根据第一网络和第一样本图像,得到与第一样本图像的风格对应的第二网络。
生成模块720进一步适于:将第一样本图像输入至第一网络中,得到与第一样本图像的风格对应的第二网络。具体地,生成模块720进一步适于:从第一样本图像中提取风格纹理特征;将风格纹理特征输入至第一网络中,得到与风格纹理特征对应的第二网络。
样本处理模块730适于:利用第二网络,生成与第二样本图像对应的第三样本图像。
更新模块740适于:根据第三样本图像与第一样本图像、第二样本图像之间的损失更新第一网络的权重参数。
更新模块740进一步适于:根据第三样本图像与第一样本图像之间的风格损失以及第三样本图像与第二样本图像之间的内容损失,得到第一网络损失函数,利用第一网络损失函数更新第一网络的权重参数。
其中,本领域技术人员可根据实际需要设置第一网络损失函数的具体内容,此处不做限定。在一个具体实施例中,第一网络损失函数可以为:
其中,ic为第二样本图像,is为第一样本图像,i为第三样本图像,cp为用于感知内容差别的感知函数,sp为用于感知风格差别的感知函数,
该网络训练装置迭代运行,直至满足预定收敛条件。其中,预定收敛条件包括:迭代次数达到预设迭代次数;和/或,第一网络损失函数的输出值小于预设阈值;和/或,与第二样本图像对应的第三样本图像的视觉效果参数达到预设视觉效果参数。
该网络训练装置进一步适于:在多次迭代过程中,固定提取一个第一样本图像,不断替换地提取至少一个第二样本图像;当内容图像库中的第二样本图像提取完毕后,替换下一个第一样本图像,再不断替换地提取至少一个第二样本图像。该网络训练装置有效地缩减了训练第一网络所需的时间,提高了第一网络的训练效率。
本发明还提供了一种终端,该终端包括上述的网络训练装置。其中,终端可为手机、pad、电脑、摄像设备等。
本发明还提供了一种服务器,该服务器包括上述的网络训练装置。
本发明还提供了一种非易失性计算机存储介质,计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的网络训练方法。其中,计算机存储介质可为手机的存储卡、pad的存储卡、电脑的磁盘、摄像设备的存储卡等。
图8示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。其中,计算设备可为手机、pad、电脑、摄像设备、服务器等。
如图8所示,该计算设备可以包括:处理器(processor)802、通信接口(communicationsinterface)804、存储器(memory)806、以及通信总线808。
其中:
处理器802、通信接口804、以及存储器806通过通信总线808完成相互间的通信。
通信接口804,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器802,用于执行程序810,具体可以执行上述网络训练方法实施例中的相关步骤。
具体地,程序810可以包括程序代码,该程序代码包括计算机操作指令。
处理器802可能是中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。
存储器806,用于存放程序810。存储器806可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
程序810具体可以用于使得处理器802执行上述任意方法实施例中的网络训练方法。程序810中各步骤的具体实现可以参见上述网络训练实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例提供的方案,能够训练得到适用于任意风格图像和任意内容图像的第一网络,而且利用第一网络有助于快速地得到对应的图像转换网络,提高图像风格化处理的效率。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。