一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法与流程

文档序号:18972776发布日期:2019-10-29 03:02阅读:2973来源:国知局
一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法与流程

本发明属于深度学习领域,特别涉及一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法。



背景技术:

空洞卷积空间金字塔池化模型通过并联多个不同扩张率的空洞卷积提取多尺度上下文信息,然后利用1×1卷积对各个通道进行线性融合。然而,由于多尺度上下文信息通常存在于非线性流形中,单单利用线性函数不足以刻画多尺度上下文信息之间的非线性关系,导致空洞卷积空间金字塔池化模型无法有效提取多尺度上下文信息。



技术实现要素:

为了克服上述空洞卷积空间金字塔池化模型难以表征不同通道非线性关系的问题,本发明提供一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法。

本发明的一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法属于深度学习领域,其特征在于包含:空洞卷积空间金字塔池化模型和注意力模型,所述空洞卷积空间金字塔池化模型由多条带有不同扩张率的空洞卷积通路并联组成,用于提取多尺度上下文信息,所述注意力模型通过非线性函数表征不同通道上下文信息之间的关系,进而对多尺度上下文信息分配权重,增加空洞卷积空间金字塔池化模型的多尺度上下文信息学习能力。

所述空洞卷积空间金字塔池化模型,其特征在于所述空洞卷积空间金字塔池化模型的单条通路可形式化为:

其中p是卷积核中心对应的像素点的位置索引,c是输入的通道索引,d是所述扩张率,wc,(i,j)是指定通道与位置的卷积核权重,xc,p+d·(i,j)是指定通道与位置的像素值,g是采样网格,b是偏差项。输入特征图x经过所述空洞卷积空间金字塔池化模型处理形成多尺度特征图其中为所述扩张率为dn的通路所对应的输出,所述多尺度特征图通过拼接形成注意力模型的输入xaspp

所述注意力模型的输入经过全局池化以及两次全连接和激活函数后得到不同通道的权重z

z=δ2(w2δ1(w1y))

其中是注意力模型输入xaspp在通道c,位置(h,w)所对应的值,yc为通道c对应的全局池化值,y为各通道池化值拼接后得到的张量,δ1和δ2为激活函数,w1和w2为全连接层的权重。所述注意力模型的输入xaspp通过与所述权重z相乘得到多尺度上下文特征图x

附图说明

图1是本发明一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法示意图

具体实施方式

下面采用附图和实施例对本发明做进一步说明,此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。

一种基于注意力机制的空洞卷积空间金字塔池化上下文学习方法示意图见附图1,其特征在于包含:空洞卷积空间金字塔池化模型和注意力模型,所述空洞卷积空间金字塔池化模型由多条带有不同扩张率的空洞卷积通路并联组成,用于提取多尺度上下文信息,所述注意力模型通过非线性函数表征不同通道上下文信息之间的关系,进而对多尺度上下文信息分配权重,增加空洞卷积空间金字塔池化模型的多尺度上下文信息学习能力。

所述空洞卷积空间金字塔池化模型,其特征在于所述空洞卷积空间金字塔池化模型的单条通路可形式化为:

其中p是卷积核中心对应的像素点的位置索引,c是输入的通道索引,d是所述扩张率,wc,(i,j)是指定通道与位置的卷积核权重,xc,p+d·(i,j)是指定通道与位置的像素值,g是采样网格,b是偏差项。输入特征图x经过所述空洞卷积空间金字塔池化模型处理形成多尺度特征图其中为所述扩张率为dn的通路所对应的输出,所述多尺度特征图通过拼接形成注意力模型的输入xaspp

所述注意力模型的输入经过全局池化以及两次全连接和激活函数后得到不同通道的权重z

z=δ2(w2δ1(w1y))

其中是注意力模型输入xaspp在通道c,位置(h,w)所对应的值,yc为通道c对应的全局池化值,y为各通道池化值拼接后得到的张量,δ1和δ2为激活函数,w1和w2为全连接层的权重。所述注意力模型的输入xaspp通过与所述权重z相乘得到多尺度上下文特征图x

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1