基于4比特量化的模型压缩方法、装置、设备及存储介质与流程

文档序号:33794446发布日期:2023-04-19 09:45阅读:来源:国知局

技术特征:

1.基于4比特量化的模型压缩方法,其特征在于,包括:

2.根据权利要求1所述的基于4比特量化的模型压缩方法,其特征在于,所述对scrfd人脸口罩模型进行4比特量化感知训练,以获得4比特模型map,包括:

3.根据权利要求2所述的基于4比特量化的模型压缩方法,其特征在于,所述对训练数据进行预处理,以得到预处理后的数据,包括:

4.根据权利要求1所述的基于4比特量化的模型压缩方法,其特征在于,所述若不满足精度要求,则修改量化感知训练配置文件使scrfd人脸口罩模型中的部分层使用8比特量化感知训练,直至符合人脸口罩检测精度要求,包括:

5.基于4比特量化的模型压缩装置,其特征在于,包括量化感知训练单元、判断单元、修改单元以及设定单元;

6.根据权利要求5所述的基于4比特量化的模型压缩装置,其特征在于,所述量化感知训练单元包括预处理模块、第一生成模块、第二生成模块、处理模块、对比模块以及后处理模块;

7.根据权利要求6所述的基于4比特量化的模型压缩装置,其特征在于,所述预处理模块包括统一化处理子模块以及封装子模块;

8.根据权利要求1所述的基于4比特量化的模型压缩装置,其特征在于,所述修改单元包括自定义模块、筛选模块以及8比特量化模块;

9.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1~4中任意一项所述的基于4比特量化的模型压缩方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使得所述处理器执行如权利要求1~4任意一项所述的基于4比特量化的模型压缩方法。


技术总结
本发明实施例公开了一种基于4比特量化的模型压缩方法、装置、设备及存储介质,其中方法包括:对SCRFD人脸口罩模型进行4比特量化感知训练,以获得4比特模型mAP;根据4比特模型mAP判断是否满足人脸口罩检测精度要求;若不满足精度要求,则修改量化感知训练配置文件使SCRFD人脸口罩模型中的部分网络层使用8比特进行量化感知训练,直至符合人脸口罩检测精度要求;将符合人脸口罩检测精度要求的量化感知训练后的深度神经网络模型作为最终的人脸口罩检测模型。通过选用人脸口罩检测的SCRFD人脸口罩模型作为基础网络,并结合INT4量化感知训练的方式,而非直接量化,从而能够保持模型一定精度的同时,缩小了模型的运算处理的时间和需要的存储空间。

技术研发人员:曹堃,陈志宇,龙晓华
受保护的技术使用者:深圳市同为数码科技股份有限公司
技术研发日:
技术公布日:2024/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1