本技术实施例涉及人工智能(artificial intelligence,ai),尤其涉及一种图像处理方法及其相关设备。
背景技术:
1、高动态范围(high dynamic range,hdr)成像作为计算机视觉应用中的关键问题,受到了越来越广泛的关注。随着ai技术的快速发展,越来越多的设备厂商在设备中内置ai技术中的神经网络模型,以通过模型来获取高质量的hdr图像。
2、在相关技术中,可先利用不同的多个曝光率对某个场景中的目标对象进行拍摄,从而采集到目标对象的多个低动态范围(low dynamic range,ldr)图像。然后,可将这多个ldr图像输入神经网络模型,以通过神经网络模型对这多个ldr图像进行融合,从而得到目标对象的hdr图像。
3、上述过程中,在拍摄多个ldr图像的过程中,目标对象在场景中可能发生移动,导致拍摄得到的多个ldr图像所呈现的内容之间存在差异,故直接基于这多个ldr图像融合后所得到的hdr图像,容易存在伪影。
技术实现思路
1、本技术实施例提供了一种图像处理方法及其相关设备,可以令多个ldr图像实现更加优质的融合,从而使得最终得到的hdr图像不存在伪影。
2、本技术实施例的第一方面提供了一种图像处理方法,该方法可通过目标模型实现,该方法包括:
3、当需要获取目标对象的hdr图像时,可使用不同曝光率对目标对象进行拍摄,从而采集得到目标对象的第一ldr图像以及目标对象的第二ldr图像。需要说明的是,拍摄第二ldr图像所使用的曝光率既可以大于拍摄第一ldr图像所使用的曝光率,也可以小于拍摄第一ldr图像所使用的曝光率。
4、得到目标对象的第一ldr图像以及目标对象的第二ldr图像后,可将目标对象的第一ldr图像以及目标对象的第二ldr图像输入至目标模型。接收到目标对象的第一ldr图像以及目标对象的第二ldr图像后,目标模型可对目标对象的第一ldr图像的多个第一图像块以及目标对象的第二ldr图像的多个第二图像块进行图像块匹配,从而构建多个第一图像块与多个第二图像块之间的一一对应关系。
5、得到多个第一图像块与多个第二图像块之间的一一对应关系后,目标模型可利用多个第一图像块与多个第二图像块之间的一一对应关系,对第一ldr图像和第二ldr图像进行融合,从而得到并对外输出目标对象的hdr图像。
6、从上述方法可以看出:当需要获取目标对象的hdr图像时,可先采集目标对象的第一ldr图像以及目标对象的第二ldr图像,并将第一ldr图像和第二ldr图像输入至目标模型中。那么,目标模型可对第一ldr图像和第二ldr图像进行图像块匹配,从而得到第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一ldr图像和第二ldr图像进行融合,从而得到并输出目标对象的hdr图像。前述过程中,在获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系的过程中,相当于将第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块在内容上进行了一一对齐。那么,以此对应关系作为引导来实现第一ldr图像与第二ldr图像之间的融合,可实现更加优质的融合,从而使得最终得到的目标对象的hdr图像不存在伪影。
7、在一种可能实现的方式中,基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的对应关系包括:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。前述实现方式中,接收到目标对象的第一ldr图像以及目标对象的第二ldr图像后,目标模型可对第一ldr图像和第二ldr图像进行一系列的处理,从而得到第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度。得到多个第一图像块和多个第二图像块之间的相似度后,目标模型可利用多个第一图像块和多个第二图像块之间的相似度,准确地构建出多个第一图像块与多个第二图像块之间的一一对应关系。
8、在一种可能实现的方式中,基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度包括:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第一特征,以及第二ldr图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。前述实现方式中,接收到目标对象的第一ldr图像以及目标对象的第二ldr图像后,目标模型对第一ldr图像和第二ldr图像分别进行特征提取,从而相应得到第一ldr图像的多个第一图像块的第一特征,以及第二ldr图像的多个第二图像块的第二特征。得到多个第一图像块的第一特征和多个第二图像块的第二特征后,目标模型还可对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,以准确得到多个第一图像块与多个第二图像块之间的相似度。
9、在一种可能实现的方式中,多个第一图像块包含第三图像块,基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系包括:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。前述实现方式中,对于多个第一图像块的任意一个第一图像块(即前述的第三图像块)而言,目标模型可基于该第一图像块与多个第二图像块之间的相似度,在多个第二图像块中,选出相似度最大的第二图像块,作为与该第一图像块最相似的第二图像块(即前述的第四图像块)。然后,目标模型可构建该第一图像块以及与该第一图像块最相似的第二图像块之间的对应关系。此外,目标模型还可对多个第一图像块中除该第一图像块之外的其余第一图像块,执行如同对该第一图像块所执行的操作,故最终可得到多个第一图像块与多个第二图像块之间的一一对应关系。
10、在一种可能实现的方式中,基于对应关系,对第一ldr图像和第二ldr图像进行融合,得到目标对象的高动态范围hdr图像包括:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第三特征,以及第二ldr图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。前述实现方式中,接收到第一ldr图像和第二ldr图像后,目标模型还可对第一ldr图像和第二ldr图像进行特征提取,从而得到第一ldr图像的多个第一图像块的第三特征,以及第二ldr图像的多个第二图像块的第四特征。得到多个第二图像块的第四特征后以及多个第一图像块与多个第二图像块之间的一一对应关系后,由于该对应关系指示这多个第二图像块的第四特征的新排序,故目标模型可基于该对应关系,对多个第二图像块的第四特征的排序进行调整,从而得到调整排序后的多个第二图像块的第四特征。那么,得到多个第一图像块的第三特征以及调整排序后的多个第二图像块的第四特征后,目标模型可对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行一些列的处理,从而最终得到并对外输出目标对象的hdr图像。
11、在一种可能实现的方式中,对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像包括:对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。前述实现方式中,得到多个第一图像块的第三特征、多个第二图像块的第四特征以及调整排序后的多个第二图像块的第四特征后,目标模型可对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行一些列的处理,从而最终得到并对外输出目标对象的hdr图像。
12、在一种可能实现的方式中,前述的处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。前述实现方式中,目标模型可基于自注意力机制和交互注意力机制,来实现针对第一ldr图像和第二ldr图像的融合。在该融合过程中,可以有效考虑到第一ldr图像和第二ldr图像自身的细节信息,从而使得最终得到的hdr图像既保持较好的细节,且不存在伪影。
13、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
14、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
15、本技术实施例的第二方面提供了一种模型训练方法,其特征在于,该方法包括:获取目标对象的第一ldr图像以及目标对象的第二ldr图像,第一ldr图像以及第二ldr图像为基于不同曝光度对目标对象进行拍摄得到的图像;通过待训练模型对第一ldr图像和第二ldr图像进行处理,得到目标对象的高动态范围hdr图像,其中,待训练模型用于:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系;基于对应关系,对第一ldr图像和第二ldr图像进行融合,得到目标对象的hdr图像;基于hdr图像,对待训练模型进行训练,得到目标模型。
16、上述方法训练得到的目标模型,具备图像处理功能(例如,将多个ldr图像融合成hdr图像的功能等等)。具体地,当需要获取目标对象的hdr图像时,可先采集目标对象的第一ldr图像以及目标对象的第二ldr图像,并将第一ldr图像和第二ldr图像输入至目标模型中。那么,目标模型可对第一ldr图像和第二ldr图像进行图像块匹配,从而得到第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一ldr图像和第二ldr图像进行融合,从而得到并输出目标对象的hdr图像。前述过程中,在获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系的过程中,相当于将第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块在内容上进行了一一对齐。那么,以此对应关系作为引导来实现第一ldr图像与第二ldr图像之间的融合,可实现更加优质的融合,从而使得最终得到的目标对象的hdr图像不存在伪影。
17、在一种可能实现的方式中,待训练模型,用于:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
18、在一种可能实现的方式中,待训练模型,用于:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第一特征,以及第二ldr图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
19、在一种可能实现的方式中,多个第一图像块包含第三图像块,待训练模型,用于:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
20、在一种可能实现的方式中,待训练模型,用于:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第三特征,以及第二ldr图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
21、在一种可能实现的方式中,待训练模型,用于:对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
22、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
23、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
24、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
25、本技术实施例的第三方面提供了一种图像处理方法,该方法包括:获取目标对象的第一带噪图像以及目标对象的第二带噪图像,第一带噪图像以及第二带噪图像为基于不同曝光度对目标对象进行拍摄得到的图像;基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块与第二带噪图像的多个第二图像块之间的一一对应关系;基于对应关系,对第一带噪图像和第二带噪图像进行融合,得到目标对象的去噪图像。
26、在一种可能实现的方式中,基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块与第二带噪图像的多个第二图像块之间的对应关系包括:基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块和第二带噪图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
27、在一种可能实现的方式中,基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块和第二带噪图像的多个第二图像块之间的相似度包括:对第一带噪图像和第二带噪图像进行特征提取,得到第一带噪图像的多个第一图像块的第一特征,以及第二带噪图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
28、在一种可能实现的方式中,多个第一图像块包含第三图像块,基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系包括:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
29、在一种可能实现的方式中,基于对应关系,对第一带噪图像和第二带噪图像进行融合,得到目标对象的高动态范围去噪图像包括:对第一带噪图像和第二带噪图像进行特征提取,得到第一带噪图像的多个第一图像块的第三特征,以及第二带噪图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的去噪图像。
30、在一种可能实现的方式中,对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的去噪图像包括:对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的去噪图像。
31、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
32、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
33、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
34、本技术实施例的第四方面提供了一种图像处理方法,该方法包括:获取目标对象的第一低分辨率图像以及目标对象的第二低分辨率图像,第一低分辨率图像以及第二低分辨率图像为基于不同曝光度对目标对象进行拍摄得到的图像;基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块与第二低分辨率图像的多个第二图像块之间的一一对应关系;基于对应关系,对第一低分辨率图像和第二低分辨率图像进行融合,得到目标对象的高分辨率图像。
35、在一种可能实现的方式中,基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块与第二低分辨率图像的多个第二图像块之间的对应关系包括:基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块和第二低分辨率图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
36、在一种可能实现的方式中,基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块和第二低分辨率图像的多个第二图像块之间的相似度包括:对第一低分辨率图像和第二低分辨率图像进行特征提取,得到第一低分辨率图像的多个第一图像块的第一特征,以及第二低分辨率图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
37、在一种可能实现的方式中,多个第一图像块包含第三图像块,基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系包括:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
38、在一种可能实现的方式中,基于对应关系,对第一低分辨率图像和第二低分辨率图像进行融合,得到目标对象的高动态范围高分辨率图像包括:对第一低分辨率图像和第二低分辨率图像进行特征提取,得到第一低分辨率图像的多个第一图像块的第三特征,以及第二低分辨率图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的高分辨率图像。
39、在一种可能实现的方式中,对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的高分辨率图像包括:对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的高分辨率图像。
40、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
41、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
42、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
43、本技术实施例的第五方面提供了一种图像处理装置,该装置包含目标模型,该装置包括:第一获取模块,用于获取目标对象的第一ldr图像以及目标对象的第二ldr图像,第一ldr图像以及第二ldr图像为基于不同曝光度对目标对象进行拍摄得到的图像;第二获取模块,用于基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系;融合模块,用于基于对应关系,对第一ldr图像和第二ldr图像进行融合,得到目标对象的hdr图像。
44、从上述装置可以看出:当需要获取目标对象的hdr图像时,可先采集目标对象的第一ldr图像以及目标对象的第二ldr图像,并将第一ldr图像和第二ldr图像输入至目标模型中。那么,目标模型可对第一ldr图像和第二ldr图像进行图像块匹配,从而得到第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一ldr图像和第二ldr图像进行融合,从而得到并输出目标对象的hdr图像。前述过程中,在获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系的过程中,相当于将第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块在内容上进行了一一对齐。那么,以此对应关系作为引导来实现第一ldr图像与第二ldr图像之间的融合,可实现更加优质的融合,从而使得最终得到的目标对象的hdr图像不存在伪影。
45、在一种可能实现的方式中,第二获取模块,用于:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
46、在一种可能实现的方式中,第二获取模块,用于:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第一特征,以及第二ldr图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
47、在一种可能实现的方式中,多个第一图像块包含第三图像块,第二获取模块,用于:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
48、在一种可能实现的方式中,融合模块,用于对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第三特征,以及第二ldr图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
49、在一种可能实现的方式中,融合模块,用于对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
50、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
51、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
52、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
53、本技术实施例的第六方面提供了一种模型训练装置,该装置包括:获取模块,用于获取目标对象的第一ldr图像以及目标对象的第二ldr图像,第一ldr图像以及第二ldr图像为基于不同曝光度对目标对象进行拍摄得到的图像;处理模块,用于通过待训练模型对第一ldr图像和第二ldr图像进行处理,得到目标对象的高动态范围hdr图像,其中,待训练模型用于:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系;基于对应关系,对第一ldr图像和第二ldr图像进行融合,得到目标对象的hdr图像;训练模块,用于基于hdr图像,对待训练模型进行训练,得到目标模型。
54、上述装置训练得到的目标模型,具备图像处理功能(例如,将多个ldr图像融合成hdr图像的功能等等)。具体地,当需要获取目标对象的hdr图像时,可先采集目标对象的第一ldr图像以及目标对象的第二ldr图像,并将第一ldr图像和第二ldr图像输入至目标模型中。那么,目标模型可对第一ldr图像和第二ldr图像进行图像块匹配,从而得到第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一ldr图像和第二ldr图像进行融合,从而得到并输出目标对象的hdr图像。前述过程中,在获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系的过程中,相当于将第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块在内容上进行了一一对齐。那么,以此对应关系作为引导来实现第一ldr图像与第二ldr图像之间的融合,可实现更加优质的融合,从而使得最终得到的目标对象的hdr图像不存在伪影。
55、在一种可能实现的方式中,待训练模型,用于:基于第一ldr图像和第二ldr图像,获取第一ldr图像的多个第一图像块和第二ldr图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
56、在一种可能实现的方式中,待训练模型,用于:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第一特征,以及第二ldr图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
57、在一种可能实现的方式中,多个第一图像块包含第三图像块,待训练模型,用于:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
58、在一种可能实现的方式中,待训练模型,用于:对第一ldr图像和第二ldr图像进行特征提取,得到第一ldr图像的多个第一图像块的第三特征,以及第二ldr图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
59、在一种可能实现的方式中,待训练模型,用于对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的hdr图像。
60、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
61、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
62、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
63、本技术实施例的第七方面提供了一种图像处理装置,该装置包含目标模型,该装置包括:第一获取模块,用于获取目标对象的第一带噪图像以及目标对象的第二带噪图像,第一带噪图像以及第二带噪图像为基于不同曝光度对目标对象进行拍摄得到的图像;第二获取模块,用于基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块与第二带噪图像的多个第二图像块之间的一一对应关系;融合模块,用于基于对应关系,对第一带噪图像和第二带噪图像进行融合,得到目标对象的去噪图像。
64、在一种可能实现的方式中,第二获取模块,用于:基于第一带噪图像和第二带噪图像,获取第一带噪图像的多个第一图像块和第二带噪图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
65、在一种可能实现的方式中,第二获取模块,用于:对第一带噪图像和第二带噪图像进行特征提取,得到第一带噪图像的多个第一图像块的第一特征,以及第二带噪图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
66、在一种可能实现的方式中,多个第一图像块包含第三图像块,第二获取模块,用于:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
67、在一种可能实现的方式中,融合模块,用于对第一带噪图像和第二带噪图像进行特征提取,得到第一带噪图像的多个第一图像块的第三特征,以及第二带噪图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的去噪图像。
68、在一种可能实现的方式中,融合模块,用于对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的去噪图像。
69、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
70、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
71、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
72、本技术实施例的第八方面提供了一种图像处理装置,该装置包含目标模型,该装置包括:第一获取模块,用于获取目标对象的第一低分辨率图像以及目标对象的第二低分辨率图像,第一低分辨率图像以及第二低分辨率图像为基于不同曝光度对目标对象进行拍摄得到的图像;第二获取模块,用于基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块与第二低分辨率图像的多个第二图像块之间的一一对应关系;融合模块,用于基于对应关系,对第一低分辨率图像和第二低分辨率图像进行融合,得到目标对象的高分辨率图像。
73、在一种可能实现的方式中,第二获取模块,用于:基于第一低分辨率图像和第二低分辨率图像,获取第一低分辨率图像的多个第一图像块和第二低分辨率图像的多个第二图像块之间的相似度;基于相似度,获取多个第一图像块与多个第二图像块之间的一一对应关系。
74、在一种可能实现的方式中,第二获取模块,用于:对第一低分辨率图像和第二低分辨率图像进行特征提取,得到第一低分辨率图像的多个第一图像块的第一特征,以及第二低分辨率图像的多个第二图像块的第二特征;对多个第一图像块的第一特征和多个第二图像块的第二特征进行计算,得到多个第一图像块与多个第二图像块之间的相似度。
75、在一种可能实现的方式中,多个第一图像块包含第三图像块,第二获取模块,用于:基于第三图像块与多个第二图像块之间的相似度,在多个第二图像块中,将相似度最大的第二图像块确定为第四图像块;构建第三图像块与第四图像块之间的对应关系。
76、在一种可能实现的方式中,融合模块,用于对第一低分辨率图像和第二低分辨率图像进行特征提取,得到第一低分辨率图像的多个第一图像块的第三特征,以及第二低分辨率图像的多个第二图像块的第四特征;基于对应关系,对多个第二图像块的第四特征的排序进行调整,得到调整排序后的多个第二图像块的第四特征;对多个第一图像块的第三特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的高分辨率图像。
77、在一种可能实现的方式中,融合模块,用于对多个第一图像块的第三特征、多个第二图像块的第四特征和调整排序后的多个第二图像块的第四特征进行处理,得到目标对象的高分辨率图像。
78、在一种可能实现的方式中,处理包含以下至少一种:基于自注意力机制的处理、基于交互注意力机制的处理、拼接处理、卷积处理、基于transformer网络的处理、相加处理以及激活处理。
79、在一种可能实现的方式中,基于自注意力机制的处理或基于交互注意力机制的处理包括以下至少一项:归一化处理、基于多头注意力机制的处理、相加处理以及基于多层感知机的处理。
80、在一种可能实现的方式中,基于transformer网络的处理包括以下至少一项:基于多头自注意力机制的处理以及基于多层感知机的处理。
81、本技术实施例的第九方面提供了一种图像处理装置,该装置包括存储器和处理器;存储器存储有代码,处理器被配置为执行代码,当代码被执行时,图像处理装置执行如第一方面、第一方面中任意一种可能的实现方式、第三方面、第三方面中任意一种可能的实现方式、第四方面或第四方面中任意一种可能的实现方式所述的方法。
82、本技术实施例的第十方面提供了一种模型训练装置,该装置包括存储器和处理器;存储器存储有代码,处理器被配置为执行代码,当代码被执行时,模型训练装置执行如第二方面或第二方面中任意一种可能的实现方式所述的方法。
83、本技术实施例的第十一方面提供了一种电路系统,该电路系统包括处理电路,该处理电路配置为执行如第一方面、第一方面中的任意一种可能的实现方式、第二方面、第二方面中任意一种可能的实现方式、第三方面、第三方面中任意一种可能的实现方式、第四方面或第四方面中任意一种可能的实现方式所述的方法。
84、本技术实施例的第十二方面提供了一种芯片系统,该芯片系统包括处理器,用于调用存储器中存储的计算机程序或计算机指令,以使得该处理器执行如第一方面、第一方面中的任意一种可能的实现方式、第二方面、第二方面中任意一种可能的实现方式、第三方面、第三方面中任意一种可能的实现方式、第四方面或第四方面中任意一种可能的实现方式所述的方法。
85、在一种可能的实现方式中,该处理器通过接口与存储器耦合。
86、在一种可能的实现方式中,该芯片系统还包括存储器,该存储器中存储有计算机程序或计算机指令。
87、本技术实施例的第十三方面提供了一种计算机存储介质,该计算机存储介质存储有计算机程序,该程序在由计算机执行时,使得计算机实施如第一方面、第一方面中的任意一种可能的实现方式、第二方面、第二方面中任意一种可能的实现方式、第三方面、第三方面中任意一种可能的实现方式、第四方面或第四方面中任意一种可能的实现方式所述的方法。
88、本技术实施例的第十四方面提供了一种计算机程序产品,该计算机程序产品存储有指令,该指令在由计算机执行时,使得计算机实施如第一方面、第一方面中的任意一种可能的实现方式、第二方面、第二方面中任意一种可能的实现方式、第三方面、第三方面中任意一种可能的实现方式、第四方面或第四方面中任意一种可能的实现方式所述的方法。
89、本技术实施例中,当需要获取目标对象的hdr图像时,可先采集目标对象的第一ldr图像以及目标对象的第二ldr图像,并将第一ldr图像和第二ldr图像输入至目标模型中。那么,目标模型可对第一ldr图像和第二ldr图像进行图像块匹配,从而得到第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系。然后,目标模型可利用该对应关系对第一ldr图像和第二ldr图像进行融合,从而得到并输出目标对象的hdr图像。前述过程中,在获取第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块之间的一一对应关系的过程中,相当于将第一ldr图像的多个第一图像块与第二ldr图像的多个第二图像块在内容上进行了一一对齐。那么,以此对应关系作为引导来实现第一ldr图像与第二ldr图像之间的融合,可实现更加优质的融合,从而使得最终得到的目标对象的hdr图像不存在伪影。