一种基于特征知识的卷积核重利用剪枝方法与流程

文档序号:32132791发布日期:2022-11-09 10:52阅读:来源:国知局

技术特征:
1.一种基于特征知识的卷积核重利用剪枝方法,其特征在于,该方法利用神经网络剪枝中被丢弃的卷积核的特征知识,对剪枝后的网络结构进行重参数化并微调。2.根据权利要求1所述的一种基于特征知识的卷积核重利用剪枝方法,其特征在于,该方法包括:通过熵度量卷积核之间的相似度,通过互信息将被移除卷积核与保留卷积核进行配对,再利用熵建模自适应加权公式,将配对卷积核进行重参数化,以重利用被移除卷积核的特征信息。3.根据权利要求2所述的一种基于特征知识的卷积核重利用剪枝方法,其特征在于,该方法还包括:通过掩码和预留网络参数,在剪枝的过程中模拟压缩后架构推理过程,并且在微调的过程中利用预留网络参数和反向传播对剪枝剪去的滤波器进行更新。4.根据权利要求1所述的一种基于特征知识的卷积核重利用剪枝方法,其特征在于,该方法包括以下步骤:步骤1):对于给定的待压缩神经网络m,设定网络剪枝率v;步骤2):依据卷积核级别的神经网络剪枝算法,将网络m中卷积层进行重要性排序;步骤3):当步骤2)得到c个排序后的卷积核后,按照剪枝率v将卷积核分为被移除卷积核组w
d
和保留的卷积核组w
l
;步骤4):在步骤3)中的得到两个卷积核组,计算w
d
和w
l
中两两之间的互信息量,选择互信息量最大的k个卷积核对group;步骤5):对步骤4)中的group,基于卷积核之间的熵信息计算自适应参数α;具体的自适应参数公式为:其中β和γ以及b是固定超参数,用于控制公式的缩放力度和偏移量;步骤6):将步骤4)中的α带入重参数化公式中,具体的重参数化公式为:w
l

=αw
l
+(1-α)w
d
其中w
l

为重参数化后的卷积核,w
d
和w
l
为步骤3)中得到的卷积核组;以此得到重参数化后的w
l

,并替换w
l
;步骤7):神经网络参数乘以掩码数组mask,将选定的被移除卷积核参数至0,其余参数不变,以实现模拟剪枝的效果;步骤8):将步骤7)中得到的网络,进行重训练,得到微调后的网络m1;通过网络参数与反向传播将w
d
更新为非零,由此完成一轮算法得到结果网络。

技术总结
本发明提供了一种基于特征知识的卷积核重利用剪枝方法。该方法通过熵度量了卷积核之间的相似度,通过互信息将被移除卷积核与保留卷积核进行配对,再利用熵建模了自适应加权公式,将配对卷积核进行重参数化,以重利用被移除卷积核的特征信息,能够在神经网络剪枝的前提下起到精度回升作用。接着使用一种维护性能的剪枝微调方法。该方法通过掩码和预留网络参数,在剪枝的过程中实现模拟压缩后架构推理过程的同时能够保留原模型的结构,并且在微调过程中利用预留网络参数和反向传播对剪枝剪去的滤波器进行更新,完善了维护性能的剪枝微调方法,不断更新被移除滤波器的特征信息。本发明在训练的精度及压缩率上,都达到了最优,具有突出的技术优势。有突出的技术优势。


技术研发人员:林志勇 谢启明 黄剑男 钟冲 魏聪 王致远
受保护的技术使用者:厦门路桥信息股份有限公司
技术研发日:2022.08.01
技术公布日:2022/11/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1