本发明涉及电机,具体为一种训练深度神经网络的尿液试纸数据生成方法。
背景技术:
1、在深度学习领域,训练有效的神经网络模型依赖于大量高质量的数据。然而,在某些特定领域,数据的收集可能会面临诸多挑战。例如,在医学影像分析或生物传感器数据分析中,数据的获取不仅需要昂贵的设备,还需要专业人员的操作和解释。这种情况下,数据的不足成为训练高性能模型的主要瓶颈。在尿液试纸的检测和分析中,传统的方法主要依赖于人工目测或简单的仪器读取。然而,这些方法往往存在主观性强、误差大和效率低等问题。基于深度学习的自动化分析方法可以显著提升检测的准确性和效率,但同样面临着数据不足的问题。
2、为了解决这一问题,基于某些方法扩增数据集则成为了关键步骤:
3、1)数据增强:通过旋转、翻转、裁剪、噪声添加等操作对现有数据进行扩展。这种方法可以在不增加数据收集成本的情况下扩充训练数据集。
4、2)迁移学习:使用在大型数据集上预训练的模型,然后对目标领域的小数据集进行微调。这种方法能够有效利用其他领域的知识,提升模型在小数据集上的性能。
5、3)生成对抗网络(gans):通过生成对抗网络生成新的数据样本。这种方法能够生成高质量、具有多样性的数据。
6、4)领域知识结合:将领域知识与数据生成方法结合,通过规则或模拟生成合成数据。这种方法能够生成符合领域特征的数据,提升模型的表现。
7、现有尿液试纸数据增强技术缺点:
8、1)数据增强:仅能在现有数据的基础上进行变换,无法生成全新的数据样本,且变换的多样性有限。
9、2)迁移学习:现有预训练模型多为自然图像,无尿液试纸数据预训练图像,也即目标领域的数据特征与预训练数据差异较大,最终会导致迁移效果有限。
10、3)生成对抗网络:训练复杂,生成的数据质量受生成网络的性能限制,且可能需要大量数据来训练生成模型。而且试纸属于形状固定的物体,色块分布间距以及位置非常严格,生成对抗网络难以处理此类空间位置关系固定的情况。
11、4)领域知识结合:设计和实现复杂,需依赖领域专家的知识。
技术实现思路
1、本发明的目的在于提供一种训练深度神经网络的尿液试纸数据生成方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种训练深度神经网络的尿液试纸数据生成方法,该训练深度神经网络的尿液试纸数据生成方法的具体步骤如下:
3、步骤1)背景图片准备:为了生成逼真且多样化的尿液试纸图像数据,首先需要准备丰富的背景图片库,这些背景图片涵盖试纸在不同环境下出现的各种场景,包括居家和医院环境;
4、步骤2)试纸参考图少量标注:在准备了背景图片之后,接下来需要对少量的尿液试纸图像进行标注,这些标注图像将作为参考,用于后续的背景替换和色块随机化过程;
5、步骤3)背景替换:在完成试纸参考图的标注后,进入背景替换步骤,通过图像处理技术,将试纸图像中的原始背景替换为准备好的背景图片库中的各种背景;
6、背景替换的具体操作包括以下流程:首先,使用图像分割技术将试纸图像与其原始背景分离,然后将分离出的试纸图像叠加到新的背景图像上,在背景替换过程中,还需考虑光照和阴影效果,以确保生成的图像在视觉上具有一致性和真实性;
7、步骤4)色块颜色随机化:尿液试纸的色块在使用前后会发生明显的颜色变化,初始状态为白色或淡黄色,使用后则变为其他鲜艳的颜色,基于色块位置的标注信息,使用颜色变换处理对色块颜色进行随机化处理;
8、步骤5)基于白平衡的色调与光照随机化:基于白平衡调整,模拟不同光源条件下图像的色调变化,还需对图像的整体光照进行随机化处理,通过这些处理,生成的图像不仅在色调上更加多样化,而且在光照效果上更加接近实际使用场景。
9、优选的,所述步骤1)中,背景图片包括不同材质和颜色的瓷砖、不锈钢表面、木板、桌面,在收集背景图片时,考虑光照条件的变化,在不同时间段以及不同光源下的光照效果,不同时间段包括早晨、中午、傍晚,不同光源包括自然光、日光灯、荧光灯,以确保生成的图像能够真实反映实际使用环境中的多样性。
10、优选的,所述步骤2)中,标注内容包括试试纸主体、色块位置,这些标注内容能够准确定位试纸和色块的位置,确保在背景替换和色块随机化过程中保持图像的真实性和一致性。
11、优选的,所述尿液试纸图像标注过程中,需要专业人员的参与,以确保标注的准确性和可靠性。
12、优选的,所述步骤4)中,在颜色随机化过程中,生成的颜色符合实际使用中可能出现的颜色范围和分布,需考虑色块间的颜色关联性,确保生成的颜色组合在视觉上具有一致性和合理性,即对于色块局部图像,使用三个值在0到255之间的随机整数替换该图像rgb三通道的非零像素,已达到随机改变颜色的效果。
13、优选的,步骤5)中,在日光灯下图像偏蓝、在白炽灯下图像偏黄,通过对白平衡的调整,可以生成在不同光源条件下的试纸图像。
14、优选的,所述光照随机化处理包括亮度、对比度、阴影的调整,以模拟不同光照强度和方向对图像的影响。
15、优选的,白平衡调整通过改变图像的颜色温度来实现,以模拟不同光源下的色调变化,颜色温度的调整用以下公式表示:
16、iwb(x,y)=i(x,y)×toriginalttarget
17、其中,iwb(x,y)是经过白平衡调整后的图像像素值,i(x,y)是原始图像的像素值,ttarget是目标颜色温度,torriginal是原始颜色温度,通过调整ttarget和ttarget的比例,可以生成在不同光源条件下的图像。
18、优选的,光照的随机化处理包括对图像亮度、对比度和阴影参数的调整,亮度调整通过以下公式实现:
19、ibrightness(x,y)=i(x,y)+δb
20、其中,δb是亮度的随机增量,对比度调整可以表示为:
21、icontrast(x,y)=(i(x,y)-μ)×c+μ
22、其中,μ是图像的平均亮度,c是对比度调整系数,阴影的模拟通过对图像的局部区域进行亮度减小来实现:
23、ishadow(x,y)=i(x,y)×(1-s(x,y))
24、其中,s(x,y)是阴影遮罩函数,其值在[0,1]之间,表示阴影的强度;
25、综合上述调整,得到一个整体的光照随机化处理公式:
26、ifinal(x,y)
27、=((i(x,y)×toriginalttarget)+δb)×((i(x,y)-μ)×c+μ)×(1-s(x,y))
28、通过上述公式,对图像进行全面的色调与光照调整,生成在不同光源和光照条件下的多样化图像,这些调整不仅增加了图像的多样性,还提高了图像的真实性,使其更接近实际使用场景。
29、与现有技术相比,本发明的有益效果是:
30、针对现有技术中的数据不足问题,通过考虑多种因素生成逼真且多样化的尿液试纸图像数据。综合考虑了光照因素(包括室内外不同灯源、早中晚自然光变化)、背景因素(试纸在居家及医院场景中可能的不同背景材质,如瓷砖、不锈钢、木板等),以及试纸色块在使用前后颜色的变化(初始状态为白色或淡黄色,使用后为鲜艳彩色)。针对这些条件,对试纸照片的背景、试纸主体及色块分别进行了增强,模拟生成了大量符合实际情况的试纸图像数据。这些合成数据可用于训练深度学习模型,显著提高模型的检测精度和鲁棒性,有效解决了现有技术中的数据不足问题。