本申请涉及图像处理,具体而言,涉及一种标签图像的处理方法、装置、设备和存储介质。
背景技术:
1、现阶段,在钢材的出入库和仓库监管业务中,需要获取钢材标签信息并进行标签信息的结构化处理。
2、相对于传统的通过人工手动录入信息的方式,市场上大多通过ocr(opticalcharacter recognition,光学字符识别)技术来实现信息的识别和提取。ocr技术对标签取样拍摄要求较高,而在仓库中钢材通常是多层堆放,存在遮挡和无法按照特定角度平面化拍摄取样等问题,因而对最终的识别效果产生较大的影响,无法实现工业场景下的实际应用。
技术实现思路
1、根据本申请的一方面,提供一种标签图像的处理方法,包括:获取待识别图像中目标标签的坐标信息,以进行目标标签的图像分割;生成经过图像分割的目标标签的四边形边界框;对目标标签的四边形边界框进行平面化处理,以生成目标标签对应的矩形标签图像;提取矩形标签图像中的文本信息。
2、根据一些实施例,获取待识别图像中目标标签的坐标信息,以进行目标标签的图像分割,包括:通过预设的标签检测模型获取目标标签的坐标信息;基于目标标签的坐标信息,通过预设的图像分割模型对目标标签进行实例分割;获取分割后的目标标签对应的掩码图像。
3、根据一些实施例,生成经过图像分割的目标标签的四边形边界框,包括:基于掩码图像,生成目标标签对应的多边形凸包轮廓;对多边形凸包轮廓进行顶点位置优化,以生成多个候选四边形边界框;在多个候选四边形边界框中确定目标标签的四边形边界框。
4、根据一些实施例,基于掩码图像,生成目标标签对应的多边形凸包轮廓,包括:获取掩码图像中的非零像素点;基于非零像素点构建目标标签对应的初始凸包轮廓;对初始凸包轮廓进行边界简化优化,以获得多边形凸包轮廓。
5、根据一些实施例,在多个候选四边形边界框中确定目标标签的四边形边界框,包括:计算多个候选四边形边界框各自的差值损失;根据差值损失确定多个候选四边形边界框各自的矩形拟合度;根据矩形拟合度确定目标标签的四边形边界框。
6、根据一些实施例,对目标标签的四边形边界框进行平面化处理,以生成目标标签对应的矩形标签图像,包括:计算目标标签的四边形边界框的平面化输出尺寸;基于平面化输出尺寸构建透视变换矩阵;通过透视变换矩阵进行目标标签的四边形边界框的平面化,以生成矩形标签图像。
7、根据一些实施例,提取矩形标签图像中的文本信息,包括:通过预设的字符识别模型获取矩形标签图像中的文本信息;将文本信息转换为预设输出格式。
8、根据本申请的一方面,提供一种标签图像的处理装置,包括:图像分割模块,用于获取待识别图像中目标标签的坐标信息,以进行目标标签的图像分割;边界优化模块,用于生成经过图像分割的目标标签的四边形边界框;矩形校正模块,用于对目标标签的四边形边界框进行平面化处理,以生成目标标签对应的矩形标签图像;信息提取模块,用于提取矩形标签图像中的文本信息。
9、根据本申请的一方面,提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如前述的方法。
10、根据本申请的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现如前述的方法。
11、根据本申请的实施例,可通过基于深度学习技术的模型进行图像分割,并通过多重优化和校正方法生成目标的矩形标签图像,以进行信息的提取,解决了现有技术中对图像拍摄角度和拍摄质量要求较高、存在背景干扰、对小角度纠正精度不够和图像标签多个缺角情况下无法实现透视变换的问题,提升了图像识别精度。
12、应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
1.一种标签图像的处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取待识别图像中目标标签的坐标信息,以进行所述目标标签的图像分割,包括:
3.根据权利要求2所述的方法,其特征在于,生成经过图像分割的目标标签的四边形边界框,包括:
4.根据权利要求3所述的方法,其特征在于,基于所述掩码图像,生成所述目标标签对应的多边形凸包轮廓,包括:
5.根据权利要求3所述的方法,其特征在于,在所述多个候选四边形边界框中确定所述目标标签的四边形边界框,包括:
6.根据权利要求1所述的方法,其特征在于,对所述目标标签的四边形边界框进行平面化处理,以生成所述目标标签对应的矩形标签图像,包括:
7.根据权利要求1所述的方法,其特征在于,提取所述矩形标签图像中的文本信息,包括:
8.一种标签图像的处理装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。