基于语义分割的图像像素级伪标签确定方法及系统

文档序号:25057841发布日期:2021-05-14 14:16阅读:来源:国知局

技术特征:
1.一种基于语义分割的图像像素级伪标签确定方法,其特征在于,包括:获取初始图像并对所述初始图像进行预处理,得到第一图像;利用特征提取器对所述第一图像进行特征提取,得到第一特征图;将所述第一特征图输入空洞卷积像素关系模型,得到第二特征图和多个第三特征图;对所述第二特征图和每一个第三特征图分别进行矩阵乘积运算,对应得到多个第一像素关系测量矩阵;对所述多个第一像素关系测量矩阵进行平均融合得到第二像素关系测量矩阵;对所述第二特征图和第二像素关系测量矩阵进行矩阵乘积运算,得到第四特征图;将所述第四特征图输入全局平均池化层,得到张量矩阵;将所述张量矩阵输入softmax分类层进行分类,得到所述张量矩阵与图像输出概率的函数关系;根据所述函数关系对应的损失函数训练分类网络,得到训练后的分类网络;根据所述训练后的分类网络和第四特征图得到目标位置图和背景目标图;获取语义分割网络模型;根据所述第一图像、目标位置图和背景目标图对所述语义分割网络模型进行训练,得到训练后的语义分割网络模型;将待测图像输入所述训练后的语义分割网络模型得到图像像素级伪标签。2.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,对初始图像以[321,481]范围随机缩放,然后将图片裁剪到尺寸为321*321,得到第一图像。3.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述特征提取器为去除vgg

16模型结构中最后两个池化层的改进型vgg

16网络模型。4.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述张量矩阵与图像输出概率的函数关系为其中,表示对于类n,f
c
的权重参数,p
n
表示类n的图像输出概率,f
c
表示张量矩阵。5.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述语义分割网络模型为deeplab

aspp网络模型。6.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述初始图像采用pascal voc 2012数据集。7.根据权利要求1所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,在将所述第一特征图输入空洞卷积像素关系模型,得到第二特征图和多个第三特征图步骤之后,对所述第二特征图和每一个第三特征图分别进行矩阵乘积运算,对应得到多个第一像素关系测量矩阵步骤之前,还包括:对所述第二特征图和多个第三特征图进行尺寸重塑。8.根据权利要求3所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述第一特征图是通过改进型vgg

16网络模型的conv5_3层获得。9.根据权利要求1或8所述的基于语义分割的图像像素级伪标签确定方法,其特征在于,所述第一特征图尺寸为c*h*w,其中c为通道数量,w,h分别为特征图尺寸。
10.一种基于语义分割的图像像素级伪标签确定系统,其特征在于,包括:预处理模块,用于获取初始图像并对所述初始图像进行预处理,得到第一图像;特征提取模块,用于利用特征提取器对所述第一图像进行特征提取,得到第一特征图;第一输入模块,用于将所述第一特征图输入空洞卷积像素关系模型,得到第二特征图和多个第三特征图;第一矩阵乘积运算模块,用于对所述第二特征图和每一个第三特征图分别进行矩阵乘积运算,对应得到多个第一像素关系测量矩阵;矩阵融合模块,用于对所述多个第一像素关系测量矩阵进行平均融合得到第二像素关系测量矩阵;第二矩阵乘积运算模块,用于对所述第二特征图和第二像素关系测量矩阵进行矩阵乘积运算,得到第四特征图;第二输入模块,用于将所述第四特征图输入全局平均池化层,得到张量矩阵;分类模块,用于将所述张量矩阵输入softmax分类层进行分类,得到所述张量矩阵与图像输出概率的函数关系;第一网络训练模块,用于根据所述函数关系对应的损失函数训练分类网络,得到训练后的分类网络;目标位置图和背景目标图确定模块,用于根据所述训练后的分类网络和第四特征图得到目标位置图和背景目标图;模型获取模块,用于获取语义分割网络模型;第二网络训练模块,用于根据所述第一图像、目标位置图和背景目标图对所述语义分割网络模型进行训练,得到训练后的语义分割网络模型;伪标签确定模块,用于将待测图像输入所述训练后的语义分割网络模型得到图像像素级伪标签。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1