本说明书涉及图像处理,尤其涉及一种识别模型的训练方法、装置、存储介质及电子设备。
背景技术:
1、目前,随着计算机技术的发展和业务融合的需要,使用模型来实现对细胞图像中的各细胞进行识别,已经成为机器学习技术在图像处理领域较为常见的应用场景之一。
2、现有技术中,通常可获取细胞图像,并将细胞图像输入预先训练完成的识别模型中,得到识别模型识别出的该细胞图像中包含的各细胞,作为识别结果,并根据该识别结果进行数据处理。
3、但是,该识别模型需要大量带标注的样本细胞图像才可训练得到,而针对每个样本细胞图像,该样本细胞图像的标注为该样本细胞图像中的各细胞,且该标注通常需由人工确定。人工标注耗时长、成本高的特点以及样本细胞图像中需进行标注的细胞过多的特点,使得现有技术中的训练效率较低。
4、基于此,本说明书提供一种识别模型的训练方法。
技术实现思路
1、本说明书提供一种识别模型的训练方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供一种识别模型的训练方法,所述方法包括:
4、确定带标注的细胞图像,作为第一训练样本,并确定未标注的细胞图像,作为第二训练样本,以及确定基于所述第一训练样本预训练得到的识别模型;
5、通过所述识别模型,得到所述第二训练样本的识别结果,并根据所述识别结果,确定所述第二训练样本的标注;
6、根据所述第一训练样本的标注中各样本细胞的特征,以及所述第二训练样本的识别结果中各样本细胞的特征,对所述第二训练样本进行调整;
7、根据所述第一训练样本及其标注,以及调整后的所述第二训练样本及其标注,对所述识别模型进行训练。
8、可选地,根据所述第一训练样本的标注中各样本细胞的特征,以及所述第二训练样本的识别结果中各样本细胞的特征,对所述第二训练样本进行调整,包括:
9、根据所述第一训练样本的标注中各样本细胞分别对应的尺寸,确定参考细胞尺寸,作为所述第一训练样本的标注中各样本细胞的特征;
10、根据所述第二训练样本的识别结果,确定待调细胞尺寸,作为所述第二训练样本的识别结果中各样本细胞的特征;
11、根据所述参考细胞尺寸和所述待调细胞尺寸,对所述第二训练样本的尺寸进行调整。
12、可选地,所述识别模型通过多次迭代训练得到;
13、根据所述识别结果,确定所述第二训练样本的标注,包括:
14、在当前迭代过程对应的迭代次数到达预设的次数阈值时,根据当前迭代过程中确定出的所述第二训练样本的识别结果,对所述第二训练样本的标注进行调整。
15、可选地,根据当前迭代过程中确定出的所述第二训练样本的识别结果,对所述第二训练样本的标注进行调整,包括:
16、将当前迭代过程中确定出的所述第二训练样本的识别结果,作为第一识别结果;
17、将所述第二训练样本的标注,作为第二识别结果;
18、根据所述第一识别结果及其权重,以及所述第二识别结果及其权重,确定目标识别结果,并将所述目标识别结果作为所述第二识别结果重新确定出的标注。
19、可选地,根据所述第一训练样本及其标注,以及调整后的所述第二训练样本及其标注,对所述识别模型进行训练,包括:
20、对调整后的所述第二训练样本进行数据增强,确定增强样本,并根据数据增强的方式和调整后的所述第二训练样本的标注,确定所述增强样本的标注;
21、根据所述第一训练样本及其标注,以及所述增强样本及其标注,对所述识别模型进行训练。
22、可选地,根据所述第一训练样本的标注中各样本细胞分别对应的尺寸,确定参考细胞尺寸,包括:
23、针对所述第一训练样本中包含的每个样本细胞,根据所述第一训练样本的标注,确定该样本细胞的细胞直径,作为该样本细胞的细胞尺寸;
24、确定所述第一训练样本中各样本细胞的细胞尺寸的均值,作为参考细胞尺寸;
25、根据所述第二训练样本的识别结果,确定待调细胞尺寸,包括:
26、针对所述第二训练样本中的每个样本细胞,根据所述第二训练样本的识别结果,确定该样本细胞的细胞直径,作为该样本细胞的细胞尺寸;
27、确定所述第二训练样本中各样本细胞的细胞尺寸的均值,作为待调细胞尺寸。
28、可选地,所述第一训练样本和所述第二训练样本为双通道的细胞图像,所述双通道包含用于传输细胞质图像的通道和用于传输细胞核图像的通道;
29、通过所述识别模型,得到所述第二训练样本的识别结果,包括:
30、对所述第二训练样本进行特征提取,确定所述第二训练样本对应的细胞质特征和细胞核特征;
31、将所述细胞质特征和所述细胞核特征输入所述识别模型中,得到所述识别模型输出的所述第二训练样本的识别结果。
32、可选地,确定所述第二训练样本对应的细胞核特征,包括:
33、当所述第一训练样本中用于传输细胞核图像的通道为空时,确定所述第二训练样本对应的细胞核特征为全零特征;
34、当所述第一训练样本中用于传输细胞核图像的通道不为空时,根据所述细胞核图像,确定所述第二训练样本的细胞核特征。
35、可选地,所述方法还包括:
36、确定预先训练完成的所述识别模型对应的特定细胞特征,所述特定细胞特征根据第一训练样本的标注以及所述第二训练样本的标注确定;
37、响应于识别请求,确定所述识别请求中携带的目标细胞图像;
38、通过训练完成的所述识别模型,确定所述目标细胞图像的初始识别结果;
39、根据所述初始识别结果,确定所述目标细胞图像的特征,并根据所述目标细胞图像的特征以及所述特定细胞特征,调整所述目标细胞图像;
40、将调整后的所述目标细胞图像输入训练完成的所述识别模型中,得到所述识别模型输出的目标识别结果,并返回。
41、可选地,所述目标细胞图像为双通道的细胞图像,所述双通道包含用于传输细胞质图像的通道和传输细胞核图像的通道;
42、通过训练完成的所述识别模型,确定所述目标细胞图像的初始识别结果,包括:
43、对所述目标细胞图像进行特征提取,确定所述目标细胞图像的细胞质特征和细胞核特征;
44、将所述目标细胞图像的细胞质特征和细胞核特征输入所述识别模型中,得到所述识别模型输出的所述目标细胞图像的初始识别结果。
45、本说明书提供一种识别模型的训练装置,所述装置包括:
46、样本确定模块,用于确定带标注的细胞图像,作为第一训练样本,并确定未标注的细胞图像,作为第二训练样本,以及确定基于所述第一训练样本预训练得到的识别模型;
47、第一确定模块,用于通过所述识别模型,得到所述第二训练样本的识别结果,并根据所述识别结果,确定所述第二训练样本的标注;
48、第二确定模块,用于根据所述第一训练样本的标注中各样本细胞的特征,以及所述第二训练样本的识别结果中各样本细胞的特征,对所述第二训练样本进行调整;
49、训练模块,用于根据所述第一训练样本及其标注,以及调整后的所述第二训练样本及其标注,对所述识别模型进行训练本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述识别模型的训练方法。
50、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述识别模型的训练方法。
51、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
52、通过确定带标注的细胞图像作为第一训练样本,以及确定无标注的细胞图像作为第二训练样本,通过基于第一训练样本预训练得到的识别模型,确定第二训练样本的标注,再根据第一训练样本的标注中各样本细胞的特征和第二训练样本的识别结果中各样本细胞的特征,对该第二训练样本进行调整,最后根据第一训练样本和调整后的第二训练样本对该识别模型进行训练。
53、基于本说明书中的该识别模型的训练方法,在不需要对大量的细胞图像进行标注的情况下,也可对识别模型进行训练。