本发明涉及数据分类,尤其是涉及一种样本标签分类方法、系统及电子设备。
背景技术:
1、随着人工智能的发展,相关的卷积神经网络模型在工业缺陷识别的场景中也得到广泛普及。将工业场景中获取的待识别图像输入至相关模型中,通过模型的识别即可得到该场景中包含的缺陷数据。模型的识别精度依赖于样本数据的训练效果,训练时主要针对的是缺陷数据。具体实施过程中需要将训练用的缺陷数据按照标签进行分类,同时对其缺陷进行精准定义,以此来保证训练精度。
2、实际场景中,根据缺陷在图像中的呈现颜色、形态、位置进行标签的分类与缺陷定义,当缺陷数据的形态颜色相似时就无法准确区分。具体的,在模型训练时不同标签形态相似的缺陷之间存在混检,缺陷与缺陷之间、缺陷与非缺陷之间都存在易混淆、特征差距不明显的情况。对于基于深度学习的缺陷检测方式而言,如果同类标签中的数据差别比较大,会导致以下问题。
3、训练困难:同一类别的缺陷数据差别过大,会导致缺陷检测模型难以捕捉到缺陷的共性特征。这可能会使模型训练困难,导致模型的准确性较低;
4、过拟合:如果同一类别的缺陷数据差别过大,模型可能会过度拟合部分数据,而无法准确地泛化到其他数据。这可能会导致模型在训练集上表现很好,但在测试集上表现很差;
5、特征学习不充分:同一类别的缺陷数据差别过大,可能会导致模型无法充分学习该类别的特征,从而影响缺陷检测的准确性。
6、对于此类基于深度学习的缺陷检测来说,如果同一类别的缺陷数据尽量的做到相似,那么模型的训练效果和检测准确性就会得到提升,但现有技术对模型训练所用的样本标签分类过程中还存在着分类效果差的问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种样本标签分类方法、系统及电子设备,该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分,并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息,特征向量根据注意力权重加权以聚合图像中的信息。该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类,从特征提取聚类的角度进行缺陷数据集的标签分类与定义,将特征表现相似的数据集合并成为一个标签,达到同一个缺陷类别的特征相似,从而提高标签的分类效果。
2、本发明实施例带来了至少以下有益效果:
3、本发明提供了一种样本标签分类方法、系统及电子设备,该方法首先执行初始化步骤:获取待分类的样本标签图像,并按照预设的分块策略对样本标签图像进行分块处理,得到样本标签图像的块图;然后执行特征向量获取步骤:对块图进行向量化处理得到样本标签图像的特征向量;随后聚类结果生成步骤:基于特征向量的概率分布结果对特征向量进行聚类处理,得到特征向量的聚类结果;最后执行分类执行步骤:根据特征向量的聚类结果确定样本标签图像的聚类标签,并利用聚类标签对样本标签图像进行分类,得到样本标签图像的分类结果。该方法将缺陷图像进行特征提取后通过聚类的方式进行数据样本标签的划分,并通过注意力层计算每个块与其他块之间的注意力权重以捕获图像中的全局信息,特征向量根据注意力权重加权以聚合图像中的信息,因此该方法对数据进行特征提取并对提取后的特征向量进行概率分布聚类,从特征提取聚类的角度进行缺陷数据集的标签分类与定义,将特征表现相似的数据集合并成为一个标签,达到同一个缺陷类别的特征相似,从而提高标签的分类效果。
1.一种样本标签分类方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的样本标签分类方法,其特征在于,所述初始化步骤,包括:
3.根据权利要求1所述的样本标签分类方法,其特征在于,所述特征向量获取步骤,包括:
4.根据权利要求1所述的样本标签分类方法,其特征在于,所述聚类结果生成步骤,包括:
5.根据权利要求4所述的样本标签分类方法,其特征在于,根据所述概率分布结果确定所述特征向量与所述聚类中心向量的极值关系,通过最小化目标函数来实现;
6.根据权利要求4所述的样本标签分类方法,其特征在于,利用softmax函数计算所述分布距离对应的概率分布,通过以下算式实现:
7.根据权利要求5所述的样本标签分类方法,其特征在于,利用所述极值关系确定所述特征向量的聚类结果,包括:
8.根据权利要求7所述的样本标签分类方法,其特征在于,所述分类执行步骤,包括:
9.一种样本标签分类系统,其特征在于,所述系统包括以下单元:
10.一种电子设备,其特征在于,包括:处理器和存储装置;所述存储装置上存储有计算机程序,所述计算机程序在被所述处理器运行时实现上述权利要求1至8任一项所述的样本标签分类方法的步骤。