[0001]
本说明书一个或多个实施例涉及图像处理技术领域,尤其涉及生成训练样本的方法和装置。
背景技术:[0002]
图片识别是指利用计算机对图像进行分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术目前已被应用于遥感图像识别、通讯、图片档案修复等领域,为人们的生活提供便利。
[0003]
目前,用于图片识别的模型通常是经过训练样本训练后得到的。而训练样本的获取方式通常是,通过人工从来自不同渠道的图片中筛选出包含用户的个人信息的图片。然后再通过人工对筛选出的图片中的个人信息进行标注。
[0004]
但是,训练模型需要大量的训练样本,通过人工标注每一张图片上的个人信息需要耗费大量的人力、物力,从而增加了获取训练样本的成本。
技术实现要素:[0005]
本说明书一个或多个实施例描述了生成训练样本的方法和装置,能够降低获取训练样本的成本。
[0006]
根据第一方面,提供了生成训练样本的方法,包括:
[0007]
获取第一数量的隐私数据图片;
[0008]
获取第二数量的背景图片,其中,所述背景图片中未包括隐私数据,且第二数量大于第一数量;
[0009]
针对每一张所述隐私数据图片,均执行:
[0010]
将该隐私数据图片与至少两张背景图片分别进行合并,得到至少两张合并后图片;在合并后图片中,隐私数据图片的至少部分区域与背景图片的至少部分区域相邻接;
[0011]
对该隐私数据图片在合并后图片中的位置进行标注;
[0012]
将标注后的各合并后图片作为训练样本。
[0013]
在一个实施例中,其中,所述将该隐私数据图片与至少两张背景图片分别进行合并,包括:
[0014]
确定与该隐私数据图片合并的背景图片;
[0015]
针对确定出的每一张所述背景图片,均执行:
[0016]
当该隐私数据图片的尺寸小于该背景图片的尺寸时,从该背景图片中确定出目标区域,其中,该背景图片中除该目标区域之外的区域能够容纳该隐私数据图片;
[0017]
从该目标区域和该隐私数据图片中分别确定合并像素点;
[0018]
将该隐私数据图片中的像素点加入该背景图片中,其中,该隐私数据图片中的合并像素点在被加入到该背景图片中时,该隐私数据图片中的合并像素点的坐标与该目标区域中的合并像素点的坐标重合,该隐私数据图片中的其他像素点在被加入到该背景图片中
时,该其他像素点与坐标重合后的合并像素点之间的相对坐标位置满足:该相对坐标位置与在所述隐私数据图片中该其他像素点与合并像素点之间的相对坐标位置相同。
[0019]
在一个实施例中,其中,
[0020]
所述对该隐私数据图片在合并后图片中的位置进行标注,包括:
[0021]
确定该隐私数据图片中的目标点在合并后图片中的坐标值;
[0022]
根据所述坐标值和该隐私数据图片的尺寸,生成用于表征该隐私数据图片在合并后图片中的位置的信息。
[0023]
在一个实施例中,其中,在所述将该隐私数据图片与至少两张背景图片分别进行合并之后,进一步包括:
[0024]
在各所述合并后图片中分别增加干扰项。
[0025]
在一个实施例中,其中,所述干扰项包括高斯噪声和/或椒盐噪声。
[0026]
在一个实施例中,其中,在所述将该隐私数据图片与至少两张背景图片分别进行合并之后,进一步包括:
[0027]
设置滤波模板;
[0028]
根据所述滤波模板,对所述合并后图片中的每一个像素点进行均值滤波处理。
[0029]
在一个实施例中,其中,在所述将该隐私数据图片与至少两张背景图片分别进行合并之后,进一步包括:
[0030]
针对每一张所述合并后图片中的每一个像素点,均执行:
[0031]
确定该像素点的第一像素值;
[0032]
将该第一像素值与第一调节值相加,得到第二像素值,其中,所述第一调节值用于调节该像素点的明亮程度;
[0033]
将该像素点的像素值更新为所述第二像素值。
[0034]
在一个实施例中,其中,在所述将该隐私数据图片与至少两张背景图片分别进行合并之后,进一步包括:
[0035]
针对每一张所述合并后图片中的每一个像素点,均执行:
[0036]
确定该像素点的第三像素值;
[0037]
将该第三像素值与预设的第二调节值相乘,得到第四像素值,其中,所述第二调节值用于改变该像素点与该合并后图片中除该像素点之外的像素点之间的对比程度;
[0038]
将该像素点的像素值更新为所述第四像素值。
[0039]
在一个实施例中,其中,在所述获取第一数量的隐私数据图片之后,在所述获取第二数量的背景图片之前,进一步包括:
[0040]
从各隐私数据图片中,筛选出大尺寸隐私数据图片,其中,所述大尺寸隐私数据图片的尺寸大于除该大尺寸隐私数据图片之外的所述隐私数据图片的尺寸;
[0041]
所述获取第二数量的背景图片,包括:
[0042]
从数据源中获取第二数量的背景图片;
[0043]
针对获取到的每一张所述背景图片,当该背景图片的尺寸小于所述大尺寸隐私数据图片时,对该背景图片进行放大处理,得到尺寸大于所述大尺寸隐私数据图片的尺寸的背景图片。
[0044]
在一个实施例中,其中,在所述获取第二数量的背景图片之后,在所述将该隐私数
据图片与至少两张背景图片分别进行合并之前,进一步包括:
[0045]
从各所述背景图片中,筛选出小尺寸背景图片,其中,所述小尺寸背景图片的尺寸小于除该小尺寸背景图片之外的所述背景图片;
[0046]
针对获取的每一张所述隐私数据图片,当该隐私数据图片的尺寸大于所述小尺寸背景图片的尺寸时,对该隐私数据图片进行缩小处理,得到尺寸小于所述小尺寸背景图片的尺寸的隐私数据图片。
[0047]
根据第二方面,提供了生成训练样本的装置,包括:
[0048]
图片获取模块,配置为获取第一数量的隐私数据图片;获取第二数量的背景图片,其中,所述背景图片中未包括隐私数据,且第二数量大于第一数量;
[0049]
图片合并模块,配置为针对所述图片获取模块获取的每一张所述隐私数据图片,均执行:将该隐私数据图片与至少两张背景图片分别进行合并,得到至少两张合并后图片;在合并后图片中,隐私数据图片的至少部分区域与背景图片的至少部分区域相邻接;
[0050]
图片标注模块,配置为对该隐私数据图片在所述图片合并模块合并处理后的合并后图片中的位置进行标注;将标注后的各合并后图片作为训练样本。
[0051]
在一个实施例中,其中,所述图片合并模块,包括:
[0052]
图片确定单元,配置为确定与该隐私数据图片合并的背景图片;
[0053]
合并处理单元,配置为针对确定出的每一张所述背景图片,均执行:
[0054]
当该隐私数据图片的尺寸小于该背景图片的尺寸时,从该背景图片中确定出目标区域,其中,该背景图片中除该目标区域之外的区域能够容纳该隐私数据图片;
[0055]
从该目标区域和该隐私数据图片中分别确定合并像素点;
[0056]
将该隐私数据图片中的像素点加入该背景图片中,其中,该隐私数据图片中的合并像素点在被加入到该背景图片中时,该隐私数据图片中的合并像素点的坐标与该目标区域中的合并像素点的坐标重合,该隐私数据图片中的其他像素点在被加入到该背景图片中时,该其他像素点与坐标重合后的合并像素点之间的相对坐标位置满足:该相对坐标位置与在所述隐私数据图片中该其他像素点与合并像素点之间的相对坐标位置相同。
[0057]
在一个实施例中,其中,
[0058]
所述图片标注模块,配置为确定该隐私数据图片中的目标点在合并后图片中的坐标值;根据所述坐标值和该隐私数据图片的尺寸,生成用于表征该隐私数据图片在合并后图片中的位置的信息。
[0059]
在一个实施例中,其中,所述图片合并模块,配置为在各所述合并后图片中分别增加干扰项。
[0060]
在一个实施例中,其中,所述干扰项包括高斯噪声和/或椒盐噪声。
[0061]
在一个实施例中,其中,所述图片合并模块,配置为设置滤波模板;根据所述滤波模板,对所述合并后图片中的每一个像素点进行均值滤波处理。
[0062]
在一个实施例中,其中,所述图片合并模块,配置为针对每一张所述合并后图片中的每一个像素点,均执行:确定该像素点的第一像素值;将该第一像素值与第一调节值相加,得到第二像素值,其中,所述第一调节值用于调节该像素点的明亮程度;将该像素点的像素值更新为所述第二像素值。
[0063]
在一个实施例中,其中,所述图片合并模块,配置为针对每一张所述合并后图片中
的每一个像素点,均执行:确定该像素点的第三像素值;将该第三像素值与预设的第二调节值相乘,得到第四像素值,其中,所述第二调节值用于改变该像素点与该合并后图片中除该像素点之外的像素点之间的对比程度;将该像素点的像素值更新为所述第四像素值。
[0064]
在一个实施例中,其中,所述图片获取模块,包括:
[0065]
图片筛选单元,配置为从各隐私数据图片中,筛选出大尺寸隐私数据图片,其中,所述大尺寸隐私数据图片的尺寸大于除该大尺寸隐私数据图片之外的所述隐私数据图片的尺寸;
[0066]
图片缩放单元,配置为从数据源中获取第二数量的背景图片;针对获取到的每一张所述背景图片,当该背景图片的尺寸小于所述大尺寸隐私数据图片时,对该背景图片进行放大处理,得到尺寸大于所述大尺寸隐私数据图片的尺寸的背景图片。
[0067]
在一个实施例中,其中,所述图片获取模块,包括:
[0068]
图片筛选单元,配置为从各所述背景图片中,筛选出小尺寸背景图片,其中,所述小尺寸背景图片的尺寸小于除该小尺寸背景图片之外的所述背景图片;
[0069]
图片缩放单元,配置为针对获取的每一张所述隐私数据图片,当该隐私数据图片的尺寸大于所述小尺寸背景图片的尺寸时,对该隐私数据图片进行缩小处理,得到尺寸小于所述小尺寸背景图片的尺寸的隐私数据图片。
[0070]
根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面中任一项所述的方法。
[0071]
根据第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面中任一项所述的方法。
[0072]
根据说明书实施例提供的方法和装置,可先获取少量的隐私数据图片以及大量的背景图片。由于隐私数据图片中不包括除隐私数据之外的数据,因此,将每张隐私数据图片分别于背景图片进行合并,可以模拟用户在任一背景下拍摄隐私数据的场景。由于合并后图片中已知隐私数据图片相对于背景图片所在的位置,因此,可以准确地对合并后图片中的隐私数据图片的位置进行标注,以模拟人工标注的场景,得到用于训练模型的训练样本。既可以减少人工干预,又可以降低获取训练样本的成本。
附图说明
[0073]
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0074]
图1是本说明书一个实施例提供的生成训练样本的方法的流程图;
[0075]
图2是本说明书另一个实施例提供的生成训练样本的方法的示意图;
[0076]
图3是本说明书一个实施例提供的训练样本的示意图;
[0077]
图4是本说明书另一个实施例提供的训练样本的示意图;
[0078]
图5是本说明书又一个实施例提供的生成训练样本的装置的示意图。
具体实施方式
[0079]
首先,本说明书各实施例描述的过程中出现的部分名词或术语适用于如下解释:
[0080]
隐私数据图片:是指携带有用户、企业等对象的隐私数据的图片,即,隐私数据图片中的数据属于较敏感且不便对公众公开的数据。例如,带有身份证信息、银行卡信息以及企业收支信息的图片等,但不限于此。
[0081]
背景图片:是指带有除了隐私数据之外的信息的图片。比如,带有树木、草地、河流、建筑以及动画人物的图片等,但不限于此。
[0082]
如前所述,以带有身份证信息的身份证图片为隐私数据图片为例。由于身份证图片中携带有针对某对象的身份证信息,因此,通常无法通过非法渠道获取。而现有获取身份证图片通常有如下两种方式:
[0083]
第一种方式为:通过人工从网络上收集图片。
[0084]
第二种方式为:通过合法渠道购买图片。
[0085]
针对第一种方式,由于身份证图片分布在不同的网页上,因此,通过人工收集图片,需要耗费大量的时间,这样会增加获取训练数据的时长,从而降低获取样本数据的效率。
[0086]
针对第二种方式,由于训练模型需要大量的身份证图片,而通过合法聚到购买图片需要花费大量的资金,这样会增加获取样本数据的成本。
[0087]
并且,通过上述两种方式获取到用于训练模型的身份证图片后,还需要通过人工对大量的身份证图片中的身份证信息进行标记,这会进一步增加获取样本数据的时间和成本。
[0088]
为此,考虑到机器标注方式具有的强大的海量数据处理能力,本说明书实施例先通过合法渠道获取少量的隐私数据图片,比如,每种类型的隐私数据图片各一张,然后将各隐私数据图片分别与大量的背景图片进行合并,即可得到大量带有隐私数据的图片,以模拟用户在不同背景下拍摄隐私数据的场景。然后再对合并后的图片中的隐私数据图片所在的位置进行标注,以模仿人工对图片中的隐私数据所在位置进行标注,既可以得到数量多且准确性高的样本数据,又可以减少人工干预,实现降低获取样本数据的成本的目的。
[0089]
下面介绍本说明书实施例构思的实现方式。如图1所示,本说明书实施例提供了生成训练样本的方法,具体可以包括以下步骤:
[0090]
步骤101:获取第一数量的隐私数据图片;
[0091]
步骤103:获取第二数量的背景图片,其中,所述背景图片中未包括隐私数据,且第二数量大于第一数量;
[0092]
步骤105:针对每一张所述隐私数据图片,均执行:将该隐私数据图片与至少两张背景图片分别进行合并,得到至少两张合并后图片;在合并后图片中,隐私数据图片的至少部分区域与背景图片的至少部分区域相邻接;
[0093]
步骤107:对该隐私数据图片在合并后图片中的位置进行标注;
[0094]
步骤109:将标注后的各合并后图片作为训练样本。
[0095]
在本实施例中,可先获取少量的隐私数据图片以及大量的背景图片。由于隐私数据图片中不包括除隐私数据之外的数据,因此,将每张隐私数据图片分别于背景图片进行合并,可以模拟用户在任一背景下拍摄隐私数据的场景。由于合并后图片中已知隐私数据
图片相对于背景图片所在的位置,因此,可以准确地对合并后图片中的隐私数据图片的位置进行标注,以模拟人工标注的场景,得到用于训练模型的训练样本。既可以减少人工干预,又可以降低获取训练样本的成本。
[0096]
在本说明书另一个实施例中,步骤105中的将该隐私数据图片与至少两张背景图片分别进行合并,包括:
[0097]
获取到隐私数据图片可设置在第一集合中,获取到的背景图片可设置在第二集合中。针对第一集合中的每一张隐私数据图片,在将该隐私数据图片与背景图片合并之前,可先从第二集合中确定出需要与隐私数据图片进行合并的背景图片。由于获取背景图片和隐私数据图片时未按照图片大小进行筛选,因此,当确定出的背景图片的尺寸大于该隐私数据图片时,则表征背景图片中能够容纳该隐私数据图片,所以可先从背景图片中确定出目标区域,在背景图片中除目标区域外的区域能够容纳该数据隐私图片。然后从目标区域和隐私数据图片中分别确定出用于将背景图片和隐私数据图片合并时的基准点,该基准点在背景图片和隐私数据图片中分别对应的像素点即为合并像素点。从隐私数据图片中提取出像素点,然后将提取出的像素点中的合并像素点与背景图片中的合并像素点对齐合并,使得提取出的像素点加入到背景图片中。为了防止合并后图片中的隐私数据图片的像素点之间的相对位置发生变化,导致隐私数据图片变形,将隐私数据图片中的像素点加入到背景图片中时,需要保持隐私数据图片中除合并像素点之外的其他像素点与隐私数据图片中的合并像素点之间的相对位置保持不变。
[0098]
具体地,当确定出的背景图片的尺寸小于隐私数据图片的尺寸时,可对隐私数据图片进行缩小处理,或者,对背景图片进行放大处理,以使背景图图片中能够容纳下隐私数据图片,以模拟用户在任一背景下拍摄隐私数据的场景。
[0099]
在本说明书另一个实施例中,为了明确隐私数据图片在合并后图片中的位置,步骤107,包括:首先从隐私数据图片中确定目标点,比如,以隐私数据图片的左上角为目标点。然后在合并后图片中构建坐标系,基于左上角在坐标系中的位置,确定该隐私数据图片的左上角在合并后图片中的坐标值。由于隐私数据图片的尺寸已知,因此,基于隐私数据图片的左上角的坐标值和隐私数据图片的尺寸,可以生成隐私数据图片在合并后图片中的位置的信息,比如,(左上角横坐标x,左上角纵坐标y,隐私数据图片的宽度值w,隐私数据图片的高度值h)。
[0100]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤105之后,进一步包括:
[0101]
在各合并后图片中分别增加干扰项。该干扰项包括高斯噪声和/或椒盐噪声。以模拟电子产品在采集隐私数据时因外界因素产生抖动,或者受到光电干扰的情况。
[0102]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤105之后,进一步包括:
[0103]
设置滤波模板。该滤波模板的尺寸3*3、5*5、7*5、9*9以及11*11中的任意一个。举例来说,尺寸3*3表征该滤波模板能够对连续3行3列的9个像素点进行滤波处理。其他尺寸与尺寸3*3所表征的意义相似,此处不再赘述。通过该滤波模板对合并后图片中的像素点进行滤波处理,可以使得合并后图片更加逼真。
[0104]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤105之后,进一
步包括:
[0105]
将合并后图片中的每一个像素点当前的第一像素值,分别与用于调节像素点明亮程度的第一调节值相加,以改变合并后图片的亮度,使得合并后图片更加逼真。
[0106]
具体地,第一调节值的范围为[-20,20],避免调节后的合并后图片过亮或过暗。
[0107]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤105之后,进一步包括:
[0108]
将合并后图片中的每一个像素点当前的第三像素值,分别与用于调节像素点之间对比程度的第三调节值相乘,以改变合并后图片的对比度,使得合并后图片更加逼真。
[0109]
具体地,第三调节值的取值范围为[0.9,1.1],避免调节后的合并后图片中最亮的白和最暗的黑之间差异过大或过小。
[0110]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤101之后,在步骤103之前,进一步包括:
[0111]
确定获取的隐私数据图片的尺寸,基于确定出的尺寸,从各隐私数据图片中确定出尺寸最大的隐私数据图片作为大尺寸隐私数据图片。然后针对从数据源中获取的每一张背景图片,如果该背景图片的尺寸小于大尺寸隐私数据图片的尺寸,则对该背景图片进行放大处理,以使得到放大后的背景图片的尺寸大于大尺寸隐私数据图片的尺寸,以便于该背景图片中能够容纳大尺寸隐私数据图片。
[0112]
在本说明书另一个实施例中,为了提高训练样本的真实性,在步骤103之后,在步骤105之前,进一步包括:
[0113]
在获取到隐私数据图片和背景图片后,先确定各个背景图片的尺寸,从中确定出尺寸最小的小尺寸背景图片。针对每一张隐私数据图片,确定该隐私数据图片的尺寸,再与小尺寸背景图片的尺寸进行比对,若该隐私数据图片的尺寸大于小尺寸隐私数据图片的尺寸,则可对该隐私数据图片进行缩小处理,以得到尺寸小于小尺寸背景图片的隐私数据图片,以便背景图片和调节后的隐私数据图片合并。
[0114]
为了更加清楚地说明本实施例的技术方案及优点,下面对本实施例提供的技术方案进行详细说明,具体包括以下步骤:
[0115]
步骤201:获取第一数量的隐私数据图片以及第二数量的背景图片,其中,背景图片中未包括隐私数据,且第二数量大于第一数量。
[0116]
具体地,为了降低获取训练样本的成本,可通过合法渠道购买几张不同类型的隐私数据图片,比如,带有身份证信息的图片以及带有银行卡信息的图片等。
[0117]
在获取到隐私数据图片后,可通过如下两种方式获取背景图片:
[0118]
第一种方式为:筛选出尺寸最大的大尺寸隐私数据图片,然后基于大尺寸隐私数据图片获取背景图片。
[0119]
第二种方式为:获取任意尺寸的背景图片,基于尺寸最小的小尺寸背景图片对隐私数据图片的尺寸进行调节。
[0120]
针对第一种方式,当获取到3张隐私数据图片后,先确定隐私数据图片a、隐私数据图片b和隐私数据图片c的尺寸分别为6cm*8cm、5cm*6cm以及6cm*4cm,基于图片尺寸的大小,可以确定隐私数据图片a的尺寸比其他两张隐私数据图片的尺寸大,那么,隐私数据图片a则为大尺寸隐私数据图片。针对从数据源中获取的每张背景图片,若该的背景图片的尺
寸小于隐私数据图片a的尺寸,则删除该背景图片,反之则进行存储。
[0121]
针对第二种方式,可从互联网或其他渠道获取任意尺寸的背景图片d、背景图片e和背景图片f,然后确定背景图片d、背景图片e和背景图片f的尺寸分别为10cm*12cm、15cm*20cm、18cm*20cm,将尺寸分别进行比对,可以确定背景图片d为小尺寸背景图片。然后再确定每一张隐私数据图片的尺寸,将隐私数据图片的尺寸与小尺寸背景图片的尺寸进行比对,若隐私数据图片的尺寸大于小尺寸背景图片,则对该隐私数据图片进行缩小处理,得到尺寸小于该小尺寸背景图片的隐私数据图片。
[0122]
具体地,背景图片可以包括带有汽车、家居物品、树木、湖泊以及人物的背景图片。
[0123]
步骤203:针对每一张隐私数据图片,确定与该隐私数据图片合并的背景图片。
[0124]
具体地,获取到的隐私数据图片可放置在第一图片集合中,将背景图片设置在第二图片集合中。针对从第一图片集合中确定出的每张隐私数据图片,可从第二图片集合中分别确定出与该隐私数据图片进行合并的背景图片,并对确定出的背景图片进行标记,直至第二图片集合中的背景图片均被标记,或者与该隐私数据图片合并的背景图片的数量达到预设数量时,可删除第二图片集合中背景图片上的标记,以便确定下一张隐私数据图片对应的背景图片。
[0125]
步骤205:针对确定出的每一张背景图片,当该隐私数据图片的尺寸小于该背景图片的尺寸时,从该背景图片中确定出目标区域,其中,该背景图片中除该目标区域之外的区域能够容纳该隐私数据图片。
[0126]
步骤207:从该目标区域和该隐私数据图片中分别确定合并像素点。
[0127]
具体地,若隐私数据图片的尺寸小于确定出的背景图片的尺寸,则表征该背景图片中能够容纳隐私数据图片。因此,可先从该背景图片中确定出目标区域,在背景图片中除目标区域之外的区域能够容纳隐私数据图片。也就是说,从该目标区域中确定一个与隐私数据图片对准的基准点,即可将隐私数据图片设置在背景图片中。因此,可先分别从目标区域和隐私数据图片中确定出基准点,将基准点在目标区域和隐私数据图片中分别对应的像素点作为合并像素点。
[0128]
步骤209:将该隐私数据图片中的像素点加入该背景图片的目标区域中。
[0129]
具体地,在将隐私数据图片与背景图片合并时,可先从隐私数据图片中提取出像素点,保持提取出的像素点中的合并像素点与除合并像素点之外的其他像素点之间的相对坐标位置,以避免隐私数据发生形变。然后将提取出的像素点中的合并像素点与目标区域中的合并像素点的坐标重合,即,提取出的合并像素点的x轴与目标区域中的合并像素点的x轴重合,并且,提取出的合并像素点的y轴与目标区域中的合并像素点的y轴重合。保持提取出的像素点中的其他像素点与合并像素点之间的坐标位置相对不变,将提取出的其他像素点加入到目标区域中。
[0130]
具体地,为了模拟用户在任意场景下拍摄隐私数据,如图3和图4所示,在合并后图片中,隐私数据图片的至少部分区域与背景图片的至少部分区域相邻接。也就是说,隐私数据图片有部分区域需要在背景图片中。
[0131]
其中,图3中包括背景图片31、隐私数据图片32以及合并后片33;图4中的背景图片41、隐私数据图片42以及合并后片43。
[0132]
步骤211:根据设置的滤波模板,对合并后图片中的每一个像素点进行均值滤波处
理。
[0133]
具体地,为了使得合并后图片看起来更加逼真,可利用核的长度为3、5、7、9或11的滤波模板对合并后图片进行滤波处理。
[0134]
步骤213:针对每一张合并后图片中的每一个像素点均执行:确定该像素点的像素值n,将该像素值n与第一调节值相加,得到像素值m,将该像素点的像素值更新为像素值m。
[0135]
具体地,合并后图片中的每一个像素点均存在当前的像素值n,通过将每一个像素点的像素值n与用于调节合并后图片亮度的第一调节值相加,可以完成对合并后图片的亮度调节操作。
[0136]
步骤215:将该像素点的像素值m与预设的第二调节值相乘,得到像素值p,将该像素点的像素值更新为像素值p。
[0137]
具体地,由于合并后图片中的像素点在调节完亮度后的像素值为m,因此,可将每个像素点的像素值m与用于像素点之间对比程度的第二调节值相乘,完成合并后图片对比度的调节。
[0138]
步骤217:在各合并后图片中分别增加干扰项。
[0139]
具体地,为了模拟图片采集设备在受到外界干扰发生抖动,或者受到光电干扰的情况下采集隐私数据,可对合并后图片增加高斯噪声和/或椒盐噪声。
[0140]
步骤219:确定该隐私数据图片中的目标点在合并后图片中的坐标值。
[0141]
步骤221:根据坐标值和该隐私数据图片的尺寸,生成用于表征该隐私数据图片在合并后图片中的位置的信息,将标注后的合并后图片作为训练样本。
[0142]
具体地,由于隐私数据图片的尺寸是已知的,且隐私数据图片在合并后图片中的位置也是已知的,因此,可以确定隐私数据图片在合并后图片中的坐标值。基于隐私数据图片的宽度、高度以及在坐标值可以生成表征隐私数据图片在合并后图片中位置的信息。由于对隐私数据图片的标注不需要人工干预,因此,可以减少人工操作,降低人工工作量。
[0143]
可以理解的是,隐私数据图片在合并后图片中的坐标值,可以通过如下方式获得,现在合并后图片中构建坐标系,然后从隐私数据图片中确定目标点,该目标点可以是隐私数据图片的角点,例如,左上角、左下角、右上角或者右下角的点,然后确定目标点在该坐标系中的坐标值。
[0144]
本说明书一个实施例提供了生成训练样本的装置,如图5所示,包括:
[0145]
图片获取模块51,配置为获取第一数量的隐私数据图片;获取第二数量的背景图片,其中,所述背景图片中未包括隐私数据,且第二数量大于第一数量;
[0146]
图片合并模块52,配置为针对所述图片获取模块51获取的每一张所述隐私数据图片,均执行:将该隐私数据图片与至少两张背景图片分别进行合并,得到至少两张合并后图片;在合并后图片中,隐私数据图片的至少部分区域与背景图片的至少部分区域相邻接;
[0147]
图片标注模块53,配置为对该隐私数据图片在所述图片合并模块52合并处理后的合并后图片中的位置进行标注;将标注后的各合并后图片作为训练样本。
[0148]
在本说明书另一个实施例中,其中,所述图片合并模块52,包括:
[0149]
图片确定单元,配置为确定与该隐私数据图片合并的背景图片;
[0150]
合并处理单元,配置为针对确定出的每一张所述背景图片,均执行:
[0151]
当该隐私数据图片的尺寸小于该背景图片的尺寸时,从该背景图片中确定出目标
区域,其中,该背景图片中除该目标区域之外的区域能够容纳该隐私数据图片;
[0152]
从该目标区域和该隐私数据图片中分别确定合并像素点;
[0153]
将该隐私数据图片中的像素点加入该背景图片中,其中,该隐私数据图片中的合并像素点在被加入到该背景图片中时,该隐私数据图片中的合并像素点的坐标与该目标区域中的合并像素点的坐标重合,该隐私数据图片中的其他像素点在被加入到该背景图片中时,该其他像素点与坐标重合后的合并像素点之间的相对坐标位置满足:该相对坐标位置与在所述隐私数据图片中该其他像素点与合并像素点之间的相对坐标位置相同。
[0154]
在本说明书另一个实施例中,其中,
[0155]
所述图片标注模块53,配置为确定该隐私数据图片中的目标点在合并后图片中的坐标值;根据所述坐标值和该隐私数据图片的尺寸,生成用于表征该隐私数据图片在合并后图片中的位置的信息。
[0156]
在本说明书另一个实施例中,其中,所述图片合并模块52,配置为在各所述合并后图片中分别增加干扰项。
[0157]
在本说明书另一个实施例中,其中,所述干扰项包括高斯噪声和/或椒盐噪声。
[0158]
在本说明书另一个实施例中,其中,所述图片合并模块52,配置为设置滤波模板;根据所述滤波模板,对所述合并后图片中的每一个像素点进行均值滤波处理。
[0159]
在本说明书另一个实施例中,其中,所述图片合并模块52,配置为针对每一张所述合并后图片中的每一个像素点,均执行:确定该像素点的第一像素值;将该第一像素值与第一调节值相加,得到第二像素值,其中,所述第一调节值用于调节该像素点的明亮程度;将该像素点的像素值更新为所述第二像素值。
[0160]
在本说明书另一个实施例中,其中,所述图片合并模块52,配置为针对每一张所述合并后图片中的每一个像素点,均执行:确定该像素点的第三像素值;将该第三像素值与预设的第二调节值相乘,得到第四像素值,其中,所述第二调节值用于改变该像素点与该合并后图片中除该像素点之外的像素点之间的对比程度;将该像素点的像素值更新为所述第四像素值。
[0161]
在本说明书另一个实施例中,其中,所述图片获取模块51,包括:
[0162]
图片筛选单元,配置为从各隐私数据图片中,筛选出大尺寸隐私数据图片,其中,所述大尺寸隐私数据图片的尺寸大于除该大尺寸隐私数据图片之外的所述隐私数据图片的尺寸;
[0163]
图片缩放单元,配置为从数据源中获取第二数量的背景图片;针对获取到的每一张所述背景图片,当该背景图片的尺寸小于所述大尺寸隐私数据图片时,对该背景图片进行放大处理,得到尺寸大于所述大尺寸隐私数据图片的尺寸的背景图片。
[0164]
在本说明书另一个实施例中,其中,所述图片获取模块51,包括:
[0165]
图片筛选单元,配置为从各所述背景图片中,筛选出小尺寸背景图片,其中,所述小尺寸背景图片的尺寸小于除该小尺寸背景图片之外的所述背景图片;
[0166]
图片缩放单元,配置为针对获取的每一张所述隐私数据图片,当该隐私数据图片的尺寸大于所述小尺寸背景图片的尺寸时,对该隐私数据图片进行缩小处理,得到尺寸小于所述小尺寸背景图片的尺寸的隐私数据图片。
[0167]
本说明书还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计
算机程序在计算机中执行时,令计算机执行说明书中任一个实施例中的方法。
[0168]
本说明书还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现说明书中任一个实施例中的方法。
[0169]
可以理解的是,本说明书实施例示意的结构并不构成对生成训练样本的装置的具体限定。在说明书的另一些实施例中,生成训练样本的装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
[0170]
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本说明书方法实施例基于同一构思,具体内容可参见本说明书方法实施例中的叙述,此处不再赘述。
[0171]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、挂件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
[0172]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。