本公开涉及人工智能,尤其涉及计算机视觉和深度学习,可应用于智慧城市场景下。更具体地,本公开提供了一种分割模型的训练方法、图像分割方法、装置、电子设备和存储介质。
背景技术:
1、随着人工智能技术的发展,深度学习模型的应用场景不断增加。可以基于模型蒸馏技术,提升图像分割模型性能。
技术实现思路
1、本公开提供了一种分割模型的训练方法、图像分割方法、装置、设备以及存储介质。
2、根据本公开的一方面,提供了一种分割模型的训练方法,该方法包括:将第一样本图像输入第一分割模型,得到第一分割模型的第一中间网络的梯度信息;根据第一中间网络的梯度信息和第一中间网络输出的至少一个第一中间特征,得到与第一中间网络对应的至少一个第一中间掩码特征;根据至少一个第二中间掩码特征和至少一个第一中间掩码特征,确定第一蒸馏损失,其中,至少一个第二中间掩码特征与第二分割模型的第二中间网络对应,至少一个第二中间掩码特征是根据第二中间网络的梯度信息和第二中间网络输出的至少一个第二中间特征得到的,第二中间网络的梯度信息是将第二样本图像输入第二分割模型得到的,第二分割模型的参数量大于第一分割模型的参数量;以及根据第一蒸馏损失,训练第一分割模型。
3、根据本公开的另一方面,提供了一种图像分割方法,该方法包括:将目标图像输入第一分割模型,得到目标分割结果,其中,目标分割结果包括目标图像中目标实例的目标掩码以及目标实例的类别,第一分割模型是利用本公开提供的方法训练的
4、根据本公开的另一方面,提供了一种分割模型的训练装置,该装置包括:第一获得模块,用于将第一样本图像输入第一分割模型,得到第一分割模型的第一中间网络的梯度信息;第二获得模块,用于根据第一中间网络的梯度信息和第一中间网络输出的至少一个第一中间特征,得到与第一中间网络对应的至少一个第一中间掩码特征;第一确定模块,用于根据至少一个第二中间掩码特征和至少一个第一中间掩码特征,确定第一蒸馏损失,其中,至少一个第二中间掩码特征与第二分割模型的第二中间网络对应,至少一个第二中间掩码特征是根据第二中间网络的梯度信息和第二中间网络输出的至少一个第二中间特征得到的,第二中间网络的梯度信息是将第二样本图像输入第二分割模型得到的,第二分割模型的参数量大于第一分割模型的参数量;以及训练模块,用于根据第一蒸馏损失,训练第一分割模型。
5、根据本公开的另一方面,提供了一种图像分割装置,该装置包括:第三获得模块,用于将目标图像输入第一分割模型,得到目标分割结果,其中,目标分割结果包括目标图像中目标实例的目标掩码以及目标实例的类别,第一分割模型是利用本公开提供的装置训练的。
6、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
7、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
8、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开提供的方法。
9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
1.一种分割模型的训练方法,包括:
2.根据权利要求1所述的方法,其中,所述第一中间网络的梯度信息包括至少一个所述第一中间特征的梯度信息,所述第一中间特征的梯度信息包括所述第一中间特征的多个第一中间特征值各自的梯度,
3.根据权利要求2所述的方法,其中,所述根据预设梯度阈值和所述第一中间特征的多个第一中间特征值各自的梯度,得到第一中间掩码特征包括:
4.根据权利要求1所述的方法,其中,所述第二中间网络的梯度信息包括至少一个所述第二中间特征的梯度信息,所述第二中间特征的梯度信息包括所述第二中间特征的多个第二中间特征值各自的梯度,
5.根据权利要求1所述的方法,其中,所述根据所述第一蒸馏损失,训练所述第一分割模型包括:
6.根据权利要求1所述的方法,其中,所述根据所述第一蒸馏损失,训练所述第一分割模型包括:
7.根据权利要求1所述的方法,其中,所述第一分割模型还包括第一输出网络,
8.根据权利要求6所述的方法,其中,所述第二分割模型还包括第二输出网络,
9.根据权利要求1所述的方法,其中,所述第一分割模型还包括第一输出网络,
10.根据权利要求8所述的方法,其中,所述根据第一蒸馏损失,训练所述第一分割模型包括:
11.根据权利要求1所述的方法,其中,所述根据第一蒸馏损失,训练所述第一分割模型包括:
12.根据权利要求1所述的方法,其中,所述第一分割模型为第一实例分割模型,所述第二分割模型为第二实例分割模型。
13.一种图像分割方法,包括:
14.一种分割模型的训练装置,包括:
15.根据权利要求14所述的装置,其中,所述第一中间网络的梯度信息包括至少一个所述第一中间特征的梯度信息,所述第一中间特征的梯度信息包括所述第一中间特征的多个第一中间特征值各自的梯度,
16.根据权利要求15所述的装置,其中,所述第一获得子模块包括:
17.根据权利要求14所述的装置,其中,所述第二中间网络的梯度信息包括至少一个所述第二中间特征的梯度信息,所述第二中间特征的梯度信息包括所述第二中间特征的多个第二中间特征值各自的梯度,
18.根据权利要求14所述的装置,其中,所述训练模块包括:
19.根据权利要求14所述的装置,其中,所述训练模块包括:
20.根据权利要求14所述的装置,其中,所述第一分割模型还包括第一输出网络,
21.根据权利要求20所述的装置,其中,所述第二分割模型还包括第二输出网络,
22.根据权利要求14所述的装置,其中,所述第一分割模型还包括第一输出网络,
23.根据权利要求22所述的装置,其中,所述训练模块包括:
24.根据权利要求14所述的装置,其中,所述训练模块包括:
25.根据权利要求14所述的装置,其中,所述第一分割模型为第一实例分割模型,所述第二分割模型为第二实例分割模型。
26.一种图像分割装置,包括:
27.一种电子设备,包括:
28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至13中任一项所述的方法。
29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至13中任一项所述的方法。