图像检测模型训练方法及装置、可读存储介质与流程

文档序号:32203892发布日期:2022-11-16 04:01阅读:38来源:国知局
图像检测模型训练方法及装置、可读存储介质与流程

1.本发明属于图像检测技术领域,特别涉及一种图像检测模型训练方法及装置、可读存储介质。


背景技术:

2.随着图像检测技术的发展,图像检测模型对边缘计算端的低比特化要求越来越高。但是,随着低比特量化的普及,对现实的场景图像进行检测处理时,图像检测模型精度损失大的问题愈发突出。因此,现有的图像检测模型训练方法所得到的模型往往存在图像检测效果不好的问题,同时,对规模小的模型直接进行训练时,也会出现难以收敛、不精确的问题。


技术实现要素:

3.本发明实施例解决的是图像检测模型的精度和速度不高的技术问题。
4.为解决上述技术问题,本发明实施例提供一种图像检测模型训练方法,所述图像检测模型训练方法包括:获取预设的图像检测模型;对所述预设的图像检测模型进行量化感知训练,得到教师模型;对所述教师模型进行特征蒸馏,得到学生模型;所述学生模型的数据特征分布与所述教师模型的数据特征分布一致;对所述学生模型进行动态离线量化,得到训练好的图像检测模型。
5.可选的,所述获取预设的图像检测模型,包括:获取标注好的场景图像数据;根据所述标注好的场景图像数据,进行浮点模型训练,得到所述图像检测模型。
6.可选的,所述对所述预设的图像检测模型进行量化感知训练,得到教师模型包括:对所述预设的图像检测模型进行量化,得到量化之后的权重、每个通道输入输出数据的量化表和权重的量化表;将所述量化之后的权重、所述每个通道输入输出数据的量化表和所述权重的量化表作为所述教师模型的输入,搭建得到所述教师模型。
7.可选的,所述对所述教师模型进行特征蒸馏,得到学生模型包括:根据所述教师模型的隐藏层输出,对所述学生模型的引导层进行训练,得到所述学生模型的训练好的引导层参数;将所述学生模型的训练好的引导层参数作为所述学生模型的初始化参数,对所述学生模型进行目标蒸馏训练,得到所述学生模型所有层的参数。
8.可选的,所述对所述学生模型进行动态离线量化,得到训练好的图像检测模型包括:根据所述学生模型的数据特征分布以及权重分布,进行动态离线量化,得到所述训练好的图像检测模型。
9.为解决上述技术问题,本发明实施例还公开了一种图像检测模型训练装置,包括:获取单元,用于获取预设的图像检测模型;第一量化单元,用于对所述预设的图像检测模型进行量化感知训练,得到教师模型;蒸馏单元,用于对所述教师模型进行特征蒸馏,得到学生模型;所述学生模型的数据特征分布与所述教师模型的数据特征分布一致;第二量化单元,用于对所述学生模型进行动态离线量化,得到训练好的图像检测模型。
10.可选的,所述获取单元,用于:获取标注好的场景图像数据;根据所述标注好的场景图像数据,进行浮点模型训练,得到所述图像检测模型。
11.可选的,所述第一量化单元,用于:对所述预设的图像检测模型进行量化,得到量化之后的权重、每个通道输入输出数据的量化表和权重的量化表;将所述量化之后的权重、所述每个通道输入输出数据的量化表和所述权重的量化表作为所述教师模型的输入,搭建得到所述教师模型。
12.可选的,所述蒸馏单元,用于:根据所述教师模型的隐藏层输出,对所述学生模型的引导层进行训练,得到所述学生模型的训练好的引导层参数;将所述学生模型的训练好的引导层参数作为所述学生模型的初始化参数,对所述学生模型进行目标蒸馏训练,得到所述学生模型所有层的参数。
13.可选的,所述第二量化单元,用于:根据所述学生模型的数据特征分布以及权重分布,进行动态离线量化,得到所述训练好的图像检测模型。
14.本发明实施例还公开了一种可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,所述计算机指令运行时执行上述任一种所述的图像检测模型训练方法。
15.本发明实施例还提供了一种图像检测模型训练装置,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行上述任一种所述的图像检测模型训练方法。
16.与现有技术相比,本发明实施例的技术方案具有以下有益效果:
17.对所述预设的图像检测模型进行量化感知训练,得到教师模型;对所述教师模型进行特征蒸馏,得到学生模型;所述学生模型的数据特征分布与所述教师模型的数据特征分布一致;对所述学生模型进行动态离线量化,得到训练好的图像检测模型。经过量化感知训练的教师模型可以达到较好的精度和收敛效果,再通过特征蒸馏的方式获得和教师模型数据特征分布相一致的学生模型,结合动态离线量化减少了图像检测模型的训练工作量,同时,解决了小规模的模型在训练时难以收敛的问题。
附图说明
18.图1是本发明实施例一种图像检测模型训练方法的流程图;
19.图2是本发明实施例一种图像检测模型训练装置的结构示意图。
具体实施方式
20.现有技术中,随着图像检测技术的发展,图像检测模型对边缘计算端的低比特化要求越来越高。但是,随着低比特量化的普及,对现实的场景图像进行检测处理时,图像检测模型精度损失大的问题愈发突出。因此,现有的图像检测模型训练方法所得到的模型往往存在图像检测效果不好的问题,同时,对规模小的模型直接进行训练时,也会出现难以收敛、不精确的问题。
21.本发明实施例中,对所述预设的图像检测模型进行量化感知训练,得到教师模型;对所述教师模型进行特征蒸馏,得到学生模型;所述学生模型的数据特征分布与所述教师模型的数据特征分布一致;对所述学生模型进行动态离线量化,得到训练好的图像检测模
型。经过量化感知训练的教师模型可以达到较好的精度和收敛效果,再通过特征蒸馏的方式获得和教师模型数据特征分布相一致的学生模型,结合动态离线量化减少了图像检测模型的训练工作量,同时,解决了小规模的模型在训练时难以收敛的问题。
22.为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
23.本发明实施例提供了一种图像检测模型训练方法,参照图1,以下通过具体步骤进行详细说明。
24.步骤s101,获取预设的图像检测模型。
25.在具体实施中,可以先获取标注好的场景图像数据;再根据标注好的场景图像数据,进行浮点模型训练,得到预设的图像检测模型。
26.在实际应用中,可以采集图片再进行处理作为场景图像数据,也可以将视频中的关键帧抽取出来再进行处理作为场景图像数据,本发明实施例不限定图像的具体格式。
27.在本发明一实施例中,获取智能驾驶场景的视频数据,再抽取视频中的关键帧并进行数据标注,得到标注好的场景图像数据;根据标注好的场景图像数据训练得到图像检测模型,通过解析图像检测模型,得到对应的浮点模型作为后续训练的数据。
28.步骤s102,对所述预设的图像检测模型进行量化感知训练,得到教师模型。
29.在实际应用中,模型量化是一种将浮点计算转成低比特定点计算的技术,现有的模型量化技术可以有效的降低模型计算强度、参数大小和内存消耗,同时也会带来精度损失。
30.在具体实施中,可以对预设的图像检测模型进行量化,得到量化之后的模型权重、每个通道输入输出数据的量化表和权重的量化表;再将所述量化之后的权重、所述每个通道输入输出数据的量化表和所述权重的量化表作为所述教师模型的输入,搭建得到所述教师模型。
31.在本发明一实施例中,获取预设的图像检测模型的原始浮点权重和网络,进行量化感知训练,得到量化感知结果作为教师模型的初始化值,搭建教师模型作为后续的特征蒸馏框架。
32.步骤s103,对所述教师模型进行特征蒸馏,得到学生模型。
33.在具体实施中,所述学生模型的数据特征分布与所述教师模型的数据特征分布一致,可以在后续的动态离线量化过程中减少学生模型的精度损失。
34.在具体实施中,可以根据所述教师模型的隐藏(hint)层输出,对所述学生模型的引导(guided)层进行训练,得到所述学生模型的训练好的引导层参数;将所述学生模型的训练好的引导层参数作为所述学生模型的初始化参数,对所述学生模型进行目标蒸馏训练,得到所述学生模型所有层的参数。
35.在本发明一实施例中,首先选取教师模型的隐藏层和学生模型的引导层进行特征蒸馏,具体包括:根据教师模型的隐藏特征层训练学生模型的引导层,使得学生模型可以学习教师模型的隐藏层的特征。在训练完成后,得到学生模型引导层的参数,该参数包括引导层的权重。其次,将训练后获得的学生模型的引导层参数作为初始化参数进行目标蒸馏,具体包括:选取预设的蒸馏温度减少负标签的干扰,使得学生模型可以学习到教师模型的特征。同时,降低学生模型的规模以提升速度。在训练完成后,得到所述学生模型所有层的参
数。
36.步骤s104,对所述学生模型进行动态离线量化,得到训练好的图像检测模型。
37.在实际应用中,在学生模型经过知识蒸馏后,再将学生模型进行动态离线量化从而得到训练好的图像检测模型,不仅降低了现有技术中动态离线量化带来的精度误差,也降低了图像检测模型的计算量,达到提升图像检测模型的精度和速度的目的。
38.在具体实施中,可以根据所述学生模型的数据特征分布以及权重分布,进行动态离线量化,得到所述训练好的图像检测模型,有效提升了图像检测模型的精度和速度。
39.综上,对所述预设的图像检测模型进行量化感知训练,得到教师模型;对所述教师模型进行特征蒸馏,得到学生模型;所述学生模型的数据特征分布与所述教师模型的数据特征分布一致;对所述学生模型进行动态离线量化,得到训练好的图像检测模型。经过量化感知训练的教师模型可以达到较好的精度和收敛效果,再通过特征蒸馏的方式获得和教师模型数据特征分布相一致的学生模型,结合动态离线量化减少了图像检测模型的训练工作量,同时,解决了小规模的模型在训练时难以收敛的问题。
40.参照图2,本发明实施例还提供了一种图像检测模型训练装置20,包括:获取单元201、第一量化单元202、蒸馏单元203、第二量化单元204:
41.其中,所述获取单元201,用于获取预设的图像检测模型;
42.所述第一量化单元202,用于对所述预设的图像检测模型进行量化感知训练,得到教师模型;
43.所述蒸馏单元203,用于对所述教师模型进行特征蒸馏,得到学生模型;
44.所述第二量化单元204,用于对所述学生模型进行动态离线量化,得到训练好的图像检测模型。
45.在具体实施中,所述学生模型的数据特征分布与所述教师模型的数据特征分布一致。
46.在具体实施中,所述获取单元201可以用于:获取标注好的场景图像数据;根据所述标注好的场景图像数据,进行浮点模型训练,得到所述图像检测模型。
47.在具体实施中,所述第一量化单元202可以用于:对所述预设的图像检测模型进行量化,得到量化之后的权重、每个通道输入输出数据的量化表和权重的量化表;将所述量化之后的权重、所述每个通道输入输出数据的量化表和所述权重的量化表作为所述教师模型的输入,搭建得到所述教师模型。
48.在具体实施中,所述蒸馏单元203可以用于:根据所述教师模型的隐藏层输出,对所述学生模型的引导层进行训练,得到所述学生模型的训练好的引导层参数;将所述学生模型的训练好的引导层参数作为所述学生模型的初始化参数,对所述学生模型进行目标蒸馏训练,得到所述学生模型所有层的参数。
49.在具体实施中,第二量化单元204可以用于:根据所述学生模型的数据特征分布以及权重分布,进行动态离线量化,得到所述训练好的图像检测模型。
50.本发明实施例还提供了一种可读存储介质,计算机可读存储介质为非易失性存储介质或非瞬态存储介质,其上存储有计算机指令,所述计算机指令运行时执行本发明上述实施例中提供的图像检测模型训练方法。
51.本发明实施例还提供了一种图像检测模型训练装置,包括存储器和处理器,所述
存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所示计算机指令时,执行本发明上述实施例中提供的图像检测模型训练方法。
52.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于任一计算机可读存储介质中,存储介质可以包括:rom、ram、磁盘或光盘等。
53.虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1