图像语义分割方法、装置、电子设备及非易失性存储介质与流程

文档序号:40238534发布日期:2024-12-06 17:02阅读:28来源:国知局
图像语义分割方法、装置、电子设备及非易失性存储介质与流程

本技术涉及图像处理领域,具体而言,涉及一种图像语义分割方法、装置、电子设备及非易失性存储介质。


背景技术:

1、目前相关技术中的图像语义分割方法通常都是基于深度卷积神经网络模型来实现的,但是通过神经网络结构虽然可以实现图像语义分割,但是对设备的配置要求高,对于实际应用场景中的手机、无人机等小型且配置受限的设备中,由于算力不足,导致无法直接在常见设备中使用基于深度卷积神经网络模型来完成图像语义分割。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种图像语义分割方法、装置、电子设备及非易失性存储介质,以至少解决由于相关技术中在进行图像语义分割时对硬件设备的配置要求过高造成的无法在小型移动设备中实现图像语义分割方法的技术问题。

2、根据本技术实施例的一个方面,提供了一种图像语义分割方法,包括:重复执行第一预设数量次通过第一预设卷积网络中的第一分支和第二分支提取第一待处理图像的特征图的步骤,得到特征图集合,其中,首次通过第一预设卷积网络提取特征图的第一待处理图像为原始图像,非首次通过第一预设卷积网络提取特征图的第一待处理特征图为对上一次通过第一预设卷积网络提取的特征图进行下采样后得到的图像,第一分支包括串联的第一卷积核和第二卷积核,第二分支包括多个空洞卷积核,特征图集合中包括每次通过第一预设卷积网络提取的特征图;重复执行第二预设数量次对第二待处理图像上采样并与第二待处理图像的上文特征图融合的步骤,并在每次融合后,通过第二预设卷积网络中的第三分支和第四分支提取融合得到的融合特征图的特征图,从而得到目标特征图,其中,首次上采样的第二待处理图像为特征图集合中分辨率最小的特征图,非首次上采样的第二待处理图像为上一次上采样后通过第二预设卷积网络提取的特征图,目标特征图为最后一次上采样后通过第二预设卷积网络提取的特征图,第三分支包括串联的第三卷积核和第四卷积核,第四分支包括多个空洞卷积核;依据目标特征图确定原始图像的语义分割结果。

3、可选地,第一预设卷积网络中还包括第五卷积核,通过第一预设卷积网络中的第一分支和第二分支提取第一待处理图像的特征图的步骤包括:通过第五卷积核对第一待处理图像进行降维卷积处理,得到第一中间特征图;通过第一分支中的第一卷积核和第二卷积核对第一中间特征图连续卷积,得到第一卷积结果;通过第二分支中的多个空洞卷积核对第一中间特征图进行多次空洞卷积,得到第二卷积结果;融合第一待处理图像,第一卷积结果和第二卷积结果,得到下采样后得到的图像对应的特征图。

4、可选地,第二分支中包括第一空洞卷积核,第二空洞卷积核和第三空洞卷积核;通过第二分支中的多个空洞卷积核对下采样后得到的图像进行多次空洞卷积,得到第二卷积结果的步骤包括:采用第一空洞卷积核对第一中间特征图进行第一次空洞卷积处理,得到第一空洞卷积结果;采用第二空洞卷积核对第一中间特征图进行卷积处理,并合并第一空洞卷积结果,得到第二空洞卷积结果;采用第三空洞卷积核对第一中间特征图进行卷积处理,并合并第二卷积结果,得到第三空洞卷积结果,其中,第二卷积结果中包括第一空洞卷积结果,第二空洞卷积结果和第三空洞卷积结果。

5、可选地,融合第一待处理图像,第一卷积结果和第二卷积结果,得到下采样后得到的图像对应的特征图的步骤包括:对第一卷积结果和第二卷积结果进行通道拼接处理,得到第二中间特征图;确定第二中间特征图中的各个通道之间的依赖关系,并依据依赖关系调整各个通道的特征响应值;融合调整特征响应值后的第二中间特征图和第一待处理图像,得到第一待处理图像对应的特征图。

6、可选地,对第二待处理图像上采样并与第二待处理图像的上文特征图融合包括:通过空间注意力网络确定上文特征图中的感兴趣区域;依据上文特征图中的感兴趣区域,调整上文特征图中的各个通道的融合权重。

7、可选地,第二预设卷积网络中还包括第六卷积核,通过第二预设卷积网络中的第三分支和第四分支提取融合得到的融合特征图的特征图的步骤包括:通过第六卷积核对融合特征图进行降维卷积处理,得到第三中间特征图;通过第三分支中的第二卷积核和第三卷积核对第三中间特征图连续卷积,得到第三卷积结果;通过第四分支中的多个空洞卷积核对第三中间特征图进行多次空洞卷积,得到第四卷积结果;合并融合特征图,第三卷积结果和第四卷积结果,得到融合特征图对应的特征图。

8、可选地,第四分支中包括第四空洞卷积核,第五空洞卷积核和第六空洞卷积核;通过第四分支中的多个空洞卷积核对下采样后得到的图像进行多次空洞卷积,得到第四卷积结果的步骤包括:采用第四空洞卷积核对第三中间特征图进行第一次空洞卷积处理,得到第四空洞卷积结果;采用第五空洞卷积核对第三中间特征图进行卷积处理,并合并第四空洞卷积结果,得到第五空洞卷积结果;采用第六空洞卷积核对第三中间特征图进行卷积处理,并合并第五空洞卷积结果,得到第六空洞卷积结果,其中,第四卷积结果中包括第四空洞卷积结果,第五空洞卷积结果和第六空洞卷积结果。

9、可选地,合并融合特征图、第三卷积结果和第四卷积结果,得到融合特征图对应的特征图的步骤包括:对第三卷积结果和第四卷积结果进行通道拼接处理,得到第四中间特征图;确定第四中间特征图中的各个通道之间的依赖关系,并依据依赖关系调整各个通道的特征响应值;融合调整特征响应值后的第四中间特征图和融合特征图,得到融合特征图对应的特征图。

10、可选地,特征图集合中包括浅层特征图,中层特征图,深层特征图和底层特征图,其中,浅层特征图的分辨率等于待处理图像的分辨率,中层特征图的分辨率小于待处理图像的分辨率,深层特征图的分辨率小于中层特征图的分辨率,底层特征图的分辨率小于深层特征图的分辨率。

11、根据本技术实施例的另一方面,还提供了一种图像语义分割模型训练方法,包括:获取训练数据集,训练数据集中包括样本图像和样本图像对应的标签信息;将训练数据集输入到待训练图像语义分割模型中,并获取待训练图像语义分割模型输出的预测分割结果,其中,待训练图像语义分割模型中包括编码模块和解码模块,编码模块中包括多个第一预设卷积网络,解码模块中包括多个第二预设卷积网络,第一预设卷积网络中包括第一分支和第二分支,第一分支包括串联的第一卷积核和第二卷积核,第二分支包括多个空洞卷积核,第二预设卷积网络包括第三分支和第四分支,第三分支包括串联的第三卷积核和第四卷积核,第二分支包括多个空洞卷积核;在每次获取预测分割结果后,比较预测分割结果和标签信息,并依据比较结果调整待训练图像语义分割模型的模型参数,直到比较结果符合预设要求;确定最后一次调整参数的待训练图像语义分割模型为训练完成的图像语义分割模型。

12、可选地,待训练图像语义分割模型还包括空间注意力模块,特征融合模块,上采样模块,下采样模块,其中,空间注意力模块,用于确定输入空间注意力模块的图像中的感兴趣区域,并依据感兴趣区域调整输入空间注意力模块的图像中的通道的融合权重;特征融合模块,用于融合输入到特征融合模块的图像;上采样模块,用于对输入到上采样模块的图像进行上采样处理;下采样模块,用于对输入到下采样模块的图像进行下采样处理。

13、可选地,第一预设卷积网络中还包括第一降维卷积核和第一拼接模块,第二卷积网络中还包括第二降维卷积核和第二拼接模块,其中,第一降维卷积核,用于对输入到第一卷积网络中的图像进行降维卷积处理;第二降维卷积核,用于对输入到第二卷积网络中的图像进行降维卷积处理;第一拼接模块,用于融合第一分支输出的结果,第二分支中的各个空洞分支输出的结果,以及输入第一预设卷积网络的图像,得到第一预设卷积网络输出的特征图;第二拼接模块,用于融合第三分支输出的结果,第四分支中的各个空洞分支输出的结果,以及输入到第二预设卷积网络的图像,得到第二预设卷积网络输出的特征图。

14、可选地,第一拼接模块和第二拼接模块中还包括通道注意力模块,用于依据输入通道注意力模块的图像中的通道间的依赖关系,调整输入通道注意力模块的图像中的通道的响应特征值。

15、可选地,第二分支,包括第一空洞分支,第二空洞分支,第三空洞卷分支,其中,第一空洞分支用于对第一降维卷积核输出的图像进行空洞卷积处理并输出,第二空洞分支用于对第一降维卷积核输出的图像进行空洞卷积处理,并将处理后的图像与第一空洞分支的输出结果融合后输出,第三空洞分支用于对第一降维卷积核输出的图像进行空洞卷积处理,并将处理后的图像与第二空洞分支的输出结果融合后输出;第四分支,包括第四空洞分支,第五空洞分支,第六空洞卷分支,其中,第四空洞分支用于对第二降维卷积核输出的图像进行空洞卷积处理并输出,第五空洞分支用于对第二降维卷积核输出的图像进行空洞卷积处理,并将处理后的图像与第四空洞分支的输出结果融合后输出,第六空洞分支用于对第二降维卷积核输出的图像进行空洞卷积处理,并将处理后的图像与第五空洞分支的输出结果融合后输出。

16、根据本技术实施例的另一方面,还提供了一种图像语义分割方法,包括:获取原始图像;重复执行第一预设数量次通过第一预设卷积网络中的第一分支和第二分支提取第一待处理图像的特征图的步骤,得到特征图集合,其中,首次通过第一预设卷积网络提取特征图的第一待处理图像为原始图像,非首次通过第一预设卷积网络提取特征图的第一待处理图像为对上一次通过预设卷积网络提取的特征图进行下采样后得到的图像,第一分支包括串联的第一卷积核和第二卷积核,第二分支包括多个空洞卷积核,特征图集合中包括每次通过第一预设卷积网络提取的特征图;重复执行第二预设数量次对第二待处理图像上采样并与第二待处理图像的上文特征图融合的步骤,并在每次融合后,通过第二预设卷积网络中的第三分支和第四分支提取融合得到的融合特征图的特征图,从而得到目标特征图,其中,首次上采样的第二待处理图像为特征图集合中分辨率最小的特征图,非首次上采样的第二待处理图像为上一次上采样过程中通过第二预设卷积网络提取的特征图,目标特征图为最后一次上采样后通过第二预设卷积网络提取的特征图,第三分支包括串联的第一卷积核和第二卷积核,第四分支包括多个空洞卷积核;依据目标特征图确定原始图像的语义分割结果。

17、根据本技术实施例的另一方面,还提供了一种图像语义分割装置,包括:第一处理模块,用于重复执行第一预设数量次通过第一预设卷积网络中的第一分支和第二分支提取第一待处理图像的特征图的步骤,得到特征图集合,其中,首次通过第一预设卷积网络提取特征图的第一待处理图像为原始图像,非首次通过第一预设卷积网络提取特征图的第一待处理特征图为对上一次通过第一预设卷积网络提取的特征图进行下采样后得到的图像,第一分支包括串联的第一卷积核和第二卷积核,第二分支包括多个空洞卷积核,特征图集合中包括每次通过第一预设卷积网络提取的特征图;第二处理模块,用于重复执行第二预设数量次对第二待处理图像上采样并与第二待处理图像的上文特征图融合的步骤,并在每次融合后,通过第二预设卷积网络中的第三分支和第四分支提取融合得到的融合特征图的特征图,从而得到目标特征图,其中,首次上采样的第二待处理图像为特征图集合中分辨率最小的特征图,非首次上采样的第二待处理图像为上一次上采样后通过第二预设卷积网络提取的特征图,目标特征图为最后一次上采样后通过第二预设卷积网络提取的特征图,第三分支包括串联的第三卷积核和第四卷积核,第四分支包括多个空洞卷积核;第三处理模块,用于依据目标特征图确定原始图像的语义分割结果。

18、根据本技术实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行图像语义分割方法或图像语义分割模型训练方法。

19、根据本技术实施例的另一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行图像语义分割方法和图像语义分割模型训练方法。

20、在本技术实施例中,采用重复执行第一预设数量次通过第一预设卷积网络中的第一分支和第二分支提取第一待处理图像的特征图的步骤,得到特征图集合,其中,首次通过第一预设卷积网络提取特征图的第一待处理图像为原始图像,非首次通过第一预设卷积网络提取特征图的第一待处理特征图为对上一次通过第一预设卷积网络提取的特征图进行下采样后得到的图像,第一分支包括串联的第一卷积核和第二卷积核,第二分支包括多个空洞卷积核,特征图集合中包括每次通过第一预设卷积网络提取的特征图;重复执行第二预设数量次对第二待处理图像上采样并与第二待处理图像的上文特征图融合的步骤,并在每次融合后,通过第二预设卷积网络中的第三分支和第四分支提取融合得到的融合特征图的特征图,从而得到目标特征图,其中,首次上采样的第二待处理图像为特征图集合中分辨率最小的特征图,非首次上采样的第二待处理图像为上一次上采样后通过第二预设卷积网络提取的特征图,目标特征图为最后一次上采样后通过第二预设卷积网络提取的特征图,第三分支包括串联的第三卷积核和第四卷积核,第四分支包括多个空洞卷积核;依据目标特征图确定原始图像的语义分割结果的方式,通过在特征提取和特征融合的步骤中采用空洞深度可分离卷积的方式,达到了降低卷积过程的计算量的目的,进而解决了由于相关技术中在进行图像语义分割时对硬件设备的配置要求过高造成的无法在小型移动设备中实现图像语义分割方法技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
专利分类正在加载中....