图片处理方法和装置与流程

文档序号:21549112发布日期:2020-07-21 10:43阅读:136来源:国知局
图片处理方法和装置与流程

本发明涉及数据处理领域,具体而言,涉及一种图片处理方法和装置。



背景技术:

在使用照相机等图像采集装置拍摄图片时,由于分辨率会使图片出现长方形或正方形两种不同的形状,在进行算法处理时长方形的图片处理复杂,需要转换为正方形的图片进行处理。目前可以利用机器学习训练好的模型对图片进行处理,将长方形的图片的短边进行填充,为了能够得到模型,需要海量的图片进行机器学习,但是,由于图片的尺寸不一致,学习效率较低。

针对上述问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种图片处理方法和装置,以至少解决现有技术中需要海量的图片用于机器学习,由于图片的尺寸不一致,导致图像学习效率低的技术问题。

根据本发明实施例的一个方面,提供了一种图片处理方法,包括:获取具有第一形状的图片,并获取图片的图片信息,其中,图片信息至少包括;图片的像素信息;使用卷积神经网络模型分析图片信息,获取填充参数;基于填充参数,将图片从第一形状填充至第二形状。

进一步地,使用卷积神经网络模型分析图片信息,获取填充参数,包括:卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,其中,填充参数为用于填充图片的像素信息。

进一步地,卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,包括:卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数,其中,特征参数包括如下至少之一:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息;基于特征参数从多个子区域中确定用于提取填充参数的第一子区域;将第一子区域的像素信息作为填充参数。

进一步地,上述方法还包括:将位于图片的边缘位置的子区域作为第一子区域;或,将图片中位于预定方向上的边缘位置的子区域作为第一子区域;或,将图片中平均像素值最大的子区域作为第一子区域;或,将图片中平均像素值最小的子区域作为第一子区域;或将图片中与待填充的区域相邻的子区域作为第一子区域。

进一步地,上述方法还包括:将第一子区域背景的像素信息或第一子区域中对象的像素信息,作为填充参数;或,将第一子区域的平均像素值作为填充参数;或,将第一子区域边缘位置的像素信息作为填充参数。

进一步地,在卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数之后,上述方法还包括:通过卷积神经网络模型的池化层将每个子区域的特征参数进行池化处理,得到压缩后的图片和减少后的特征参数;将池化处理后的图片在卷积神经网络模型的全连接层进行映射,使得压缩后的图片的像素点位置信息与图片的像素点位置信息相对应。

进一步地,在获取具有第一形状的图片之后,上述方法还包括:判断图片的第一形状是否为第二形状;如果是,则直接输出图片;如果不是,则执行将图片从第一形状转换成第二形状的步骤,其中,将图片从第一形状转换成第二形状的步骤至少包括:使用卷积神经网络模型分析图片信息获取填充参数,并基于填充参数将图片从第一形状填充至第二形状。

进一步地,判断图片的第一形状是否为第二形状,包括:读取图片的尺寸,其中,尺寸包括:图片的长宽比;基于图片的尺寸,判断图片的第一形状是否为第二形状。

根据本发明实施例的另一方面,还提供了一种图片处理装置,包括:第一获取模块,用于获取具有第一形状的图片,并获取图片的图片信息,其中,图片信息至少包括;图片的像素信息;第二获取模块,用于使用卷积神经网络模型分析图片信息,获取填充参数;填充模块,用于基于填充参数,将图片从第一形状填充至第二形状。

进一步地,第二获取模块包括:分析子模块,用于卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,其中,填充参数为用于填充图片的像素信息。

进一步地,分析子模块包括:提取单元,卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数,其中,特征参数包括如下至少之一:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息;确定单元,用于基于特征参数从多个子区域中确定用于提取填充参数的第一子区域;处理单元,用于将第一子区域的像素信息作为填充参数。

进一步地,上述装置还包括:第一处理模块,用于将位于图片的边缘位置的子区域作为第一子区域;或,将图片中位于预定方向上的边缘位置的子区域作为第一子区域;或,将图片中平均像素值最大的子区域作为第一子区域;或,将图片中平均像素值最小的子区域作为第一子区域;或将图片中与待填充的区域相邻的子区域作为第一子区域。

进一步地,上述装置还包括:第二处理模块,用于将第一子区域背景的像素信息或第一子区域中对象的像素信息,作为填充参数;或,将第一子区域的平均像素值作为填充参数;或,将第一子区域边缘位置的像素信息作为填充参数。

进一步地,上述装置还包括:池化处理模块,用于通过卷积神经网络模型的池化层将每个子区域的特征参数进行池化处理,得到压缩后的图片和减少后的特征参数;映射模块,用于将池化处理后的图片在卷积神经网络模型的全连接层进行映射,使得压缩后的图片的像素点位置信息与图片的像素点位置信息相对应。

进一步地,上述装置还包括:判断模块,用于判断图片的第一形状是否为第二形状;第三处理模块,用于如果是,则直接输出图片;如果不是,则执行将图片从第一形状转换成第二形状的步骤,其中,将图片从第一形状转换成第二形状的步骤至少包括:使用卷积神经网络模型分析图片信息获取填充参数,并基于填充参数将图片从第一形状填充至第二形状。

进一步地,判断模块包括:读取子模块,用于读取图片的尺寸,其中,尺寸包括:图片的长宽比;判断子模块,用于基于图片的尺寸,判断图片的第一形状是否为第二形状。

根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的图片处理方法。

根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的图片处理方法。

在本发明实施例中,在获取到具有第一形状的图片之后,可以进一步获取图片的图片信息,使用卷积神经网络模型分析图片信息,可以得到填充参数,从而基于填充参数可以将图片从第一形状填充至第二形状,以方便后续处理。通过卷积神经网络模型将长方形的图片进行填充,将图片填充为正方形,同时不影响和破坏图片的原有信息,实现统一将图片处理为正方形进行后续分析的功能,进而解决了现有技术中需要海量的图片用于机器学习,由于图片的尺寸不一致,导致图像学习效率低技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种图片处理方法的流程图;

图2是根据本发明实施例的一种可选的卷积神经网络模型的结果示意图;

图3是根据本发明实施例的一种可选的图片处理方法的流程图;以及

图4是根据本发明实施例的一种图片处理装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例,提供了一种图片处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种图片处理方法的流程图,如图1所示,该方法包括如下步骤:

步骤s102,获取具有第一形状的图片,并获取图片的图片信息,其中,图片信息至少包括;图片的像素信息。

具体地,上述的第一形状可以是非正方形的形状,例如,可以是长方形,但不仅限于此。图片可以由大量的像素点组成,图片的像素信息可以是每个像素点的信息,例如,可以包括像素点的像素值,但不仅限于此。

步骤s104,使用卷积神经网络模型分析图片信息,获取填充参数。

具体地,上述的卷积神经网络模型可以是预先利用多组训练数据通过机器学习训练得到的,多组训练数据中的每组训练数据可以包括:非正方形的图片,以及对应的填充后的正方形的图片。

通过卷积神经网络模型可以给出一个合适的填充方案,该方案中包含有相应的填充参数。

步骤s106,基于填充参数,将图片从第一形状填充至第二形状。

在一种可选的方案中,通过判定传入的图片是否为正方形,若有非正方形的图片,则可以读取图片的像素信息,并通过卷积神经网络cnn(convolutionalneuralnetworks)模型对图片的像素信息进行分析,从而得出填充参数,并控制程序对图片进行合理的填充,得到正方形的图片。

通过本发明上述实施例,在获取到具有第一形状的图片之后,可以进一步获取图片的图片信息,使用卷积神经网络模型分析图片信息,可以得到填充参数,从而基于填充参数可以将图片从第一形状填充至第二形状,以方便后续处理。通过卷积神经网络模型将长方形的图片进行填充,将图片填充为正方形,同时不影响和破坏图片的原有信息,实现统一将图片处理为正方形进行后续分析的功能,进而解决了现有技术中需要海量的图片用于机器学习,由于图片的尺寸不一致,导致图像学习效率低技术问题。

可选地,在本发明上述实施例中,使用卷积神经网络模型分析图片信息,获取填充参数,包括:卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,其中,填充参数为用于填充图片的像素信息。

具体地,上述的每个子区域可以是图片中的每个小图像。

在一种可选的方案中,可以通过卷积神经网络模型将图片分割为若干小图像,并进行特征参数提取,在不影响图片质量的情况下,压缩图片并减少参数,最后将每个小图像中像素点的位置信息与原图相对应,得到最终的填充参数。

可选地,在本发明上述实施例中,卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,包括:卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数,其中,特征参数包括如下至少之一:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息;基于特征参数从多个子区域中确定用于提取填充参数的第一子区域;将第一子区域的像素信息作为填充参数。

具体地,在电饭煲煮饭的应用场景中,获取到的图片可以是包含大米的图片,也即,上述子区域中对象可以是大米,但不仅限于此。通过卷积神经网络模型可以实现依照边缘像素的方式,或者读取边缘像素点进行均值计算的方式,对长方形图片进行填充。上述的第一子区域可以是既不会影响和破坏图片原有信息的同时,又能够简单填充图片的子区域,该子区域的像素信息可以作为填充参数对长方形的图片进行填充。

在一种可选的方案中,cnn模型可以由输入图像端、卷积层和输出端构成。在获取到长方形图片的详细信息并处理完整之后,通过输入图像端将图片送入卷积层进行卷积计算,每张图片在卷积层中被分割为若干小图像进行特征参数提取,提取出小图像的位置信息、背景中的像素值、对象的轮廓和该对象的像素值等,进一步根据需要选择出第一子区域,并输出至输出端,从而可以根据第一子区域的像素信息得到最终的填充参数。

可选地,在本发明上述实施例中,该方法还包括:将位于图片的边缘位置的子区域作为第一子区域;或,将图片中位于预定方向上的边缘位置的子区域作为第一子区域;或,将图片中平均像素值最大的子区域作为第一子区域;或,将图片中平均像素值最小的子区域作为第一子区域;或将图片中与待填充的区域相邻的子区域作为第一子区域。

在一种可选的方案中,可以根据实际图片的像素信息,以及填充方式,选择第一子区域,并将第一子区域的像素信息作为填充参数。卷积神经网络可以依照边缘像素的方式进行填充,因此,可以将图片的边缘位置上的子区域作为第一子区域。为了将长方形图片转换为正方形图片,可以将图片的短边依照边缘像素的方式进行填充,因此,可以将图片中短边的边缘位置上的子区域作为第一子区域。

同理,由于图片中包含有对象,例如,大米图片中包含有大米,为了不影响和破坏图片原有信息,可以将平均像素值最大的子区域作为第一子区域,该子区域可以是包含有对象的子区域,或者将平均像素值最小的子区域作为第一区域,该子区域可以是未包含有对象的子区域。

另外,图片中相邻两个子区域中每个像素点的像素值变化不大,因此,可以将图片中与待填充的区域相邻的子区域作为第一子区域。

可选地,在本发明上述实施例中,该方法还包括:将第一子区域背景的像素信息或第一子区域中对象的像素信息,作为填充参数;或,将第一子区域的平均像素值作为填充参数;或,将第一子区域边缘位置的像素信息作为填充参数。

在一种可选的方案中,在确定第一子区域之后,可以根据实际图片的像素信息,以及填充方式,选择填充参数。由于第一子区域的特征参数可以包括:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息等,因此,填充参数可以是第一子区域的背景像素值,也可以是对象的像素值,还可以是所有像素点的平均像素值,又可以是边缘位置的像素值。

可选地,在本发明上述实施例中,在卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数之后,该方法还包括:通过卷积神经网络模型的池化层将每个子区域的特征参数进行池化处理,得到压缩后的图片和减少后的特征参数;将池化处理后的图片在卷积神经网络模型的全连接层进行映射,使得压缩后的图片的像素点位置信息与图片的像素点位置信息相对应。

在一种可选的方案中,如图2所示,cnn模型可以由输入图像端、卷积层、最大池化层、全链接层和输出端构成,其中,最大池化层的主要目的是通过降采样的方式,在不影响图片质量的情况下,压缩图片并减少参数。在获取到长方形图片的详细信息并处理完整之后,通过输入图像端将图片送入卷积层进行卷积计算,每张图片在卷积层中被分割为若干小图像进行特征参数提取。经过卷积层提取特征参数后,经由最大池化层进行处理,最后再经过一个全链接层将图片中像素点的位置信息与原图相对应,并输出至输出端,从而可以得到最终的填充参数。

可选地,在本发明上述实施例中,在获取具有第一形状的图片之后,该方法还包括:判断图片的第一形状是否为第二形状;如果是,则直接输出图片;如果不是,则执行将图片从第一形状转换成第二形状的步骤,其中,将图片从第一形状转换成第二形状的步骤至少包括:使用卷积神经网络模型分析图片信息获取填充参数,并基于填充参数将图片从第一形状填充至第二形状。

具体地,上述的第二形状可以是正方形的形状,但不仅限于此。

在一种可选的方案中,在获取到需要处理的图片之后,可以首先判断图片是否为正方形,如果是,则直接输出进行后续程序;如若否,则可以读取图片的像素信息并通过卷积神经网络模型对这些信息进行分析,从而根据得到的填充参数将非正方形图片填充为正方形图片。

可选地,在本发明上述实施例中,判断图片的第一形状是否为第二形状,包括:读取图片的尺寸,其中,尺寸包括:图片的长宽比;基于图片的尺寸,判断图片的第一形状是否为第二形状。

在一种可选的方案中,在获取到需要处理的图片之后,可以对图片进行预处理,包括获取图片的长宽比等,从而根据图片的长宽比可以确定出图片是否为正方形,如果长宽比是1,则可以确定图片是正方形,否则可以确定图片是非正方形。

图3是根据本发明实施例的一种可选的图片处理方法的流程图,下面结合图3对本发明一种优选的实施例进行详细说明,该方法可以适用于电饭煲烹饪场景,在该场景中,图片可以是拍摄到的大米图片,进一步对该图片进行处理,可以实现电饭煲的自动烹饪,达到较好的烹饪效果。

可以通过图片分析模块、cnn模型模块和填充处理模块实现上述图片处理方法,其中,图片分析模块可以使用开源的图像处理框架opencv库。该方法的主要工作流程如图3所示:

程序开始时,首先会传入一张需要处理的图片,通过使用开源的图像处理框架opencv库对图片进行预处理,包括获取图片长宽比等,判断图片是否为正方形,若为正方形直接输出进入后续程序;若为长方形需要进行进一步的处理。

程序会再次使用opencv库获取图片更多更详细的信息,即图片的像素信息,这些信息整理后将会送到cnn模型模块,该模块利用卷积神经网络模型进行分析,根据整个图片的像素信息进行分析,得到一种既不会影响和破坏图片原有信息的同时,又能够简单填充图片短边的像素信息,作为填充参数,当图片被填充为正方形后可以被后续程序识别,且不影响后续程序的分析结果。

通过cnn模型模块,可以得出一个合适的填充方案,并将该方案的相关参数传入填充处理模块,填充处理模块根据填充参数,会再次调用图像处理框架opencv库对图片进行填充处理。最终填充完成后会得到一张正方形的图片,供后续程序分析使用。

通过上述方案,提供了一种基于卷积神经网络的图片处理方式,分别包括图片分析模块、cnn模型模块和填充处理模块,可以通过卷积神经网络模型将长方形图片的短边依照边缘像素的方式进行扩充,将图片填充为正方形,同时不影响和破坏屏的缘由信息,实现统一将图片处理为正方形进行后续分析的功能。

需要说明的是,本发明上述实施例提供的图片处理方法,可以应用于烹饪器具的自动化控制中,通过利用处理后的正方形的图片对识别模型进行训练,进一步通过训练好的识别模型识别大米图像,可以提高识别结果的准确率。并且,通过识别模型大米图像,可以确定大米的种类、留胚率、垩白度,进一步确定烹饪器具的烹饪参数,从而提高烹饪器具的烹饪效果。

实施例2

根据本发明实施例,提供了一种图片处理装置的实施例。

图4是根据本发明实施例的一种图片处理装置的示意图,如图4所示,该装置包括:

第一获取模块42,用于获取具有第一形状的图片,并获取图片的图片信息,其中,图片信息至少包括;图片的像素信息。

具体地,上述的第一形状可以是非正方形的形状,例如,可以是长方形,但不仅限于此。图片可以由大量的像素点组成,图片的像素信息可以是每个像素点的信息,例如,可以包括像素点的像素值,但不仅限于此。

第二获取模块44,用于使用卷积神经网络模型分析图片信息,获取填充参数。

具体地,上述的卷积神经网络模型可以是预先利用多组训练数据通过机器学习训练得到的,多组训练数据中的每组训练数据可以包括:非正方形的图片,以及对应的填充后的正方形的图片。

通过卷积神经网络模型可以给出一个合适的填充方案,该方案中包含有相应的填充参数。

填充模块46,用于基于填充参数,将图片从第一形状填充至第二形状。

在一种可选的方案中,通过判定传入的图片是否为正方形,若有非正方形的图片,则可以读取图片的像素信息,并通过卷积神经网络cnn模型对图片的像素信息进行分析,从而得出填充参数,并控制程序对图片进行合理的填充,得到正方形的图片。

通过本发明上述实施例,在获取到具有第一形状的图片之后,可以进一步获取图片的图片信息,使用卷积神经网络模型分析图片信息,可以得到填充参数,从而基于填充参数可以将图片从第一形状填充至第二形状,以方便后续处理。通过卷积神经网络模型将长方形的图片进行填充,将图片填充为正方形,同时不影响和破坏图片的原有信息,实现统一将图片处理为正方形进行后续分析的功能,进而解决了现有技术中需要海量的图片用于机器学习,由于图片的尺寸不一致,导致图像学习效率低技术问题。

可选地,在本发明上述实施例中,第二获取模块包括:分析子模块,用于卷积神经网络模型扫描图片的每个子区域,分析每个子区域的像素信息,获取填充参数,其中,填充参数为用于填充图片的像素信息。

具体地,上述的每个子区域可以是图片中的每个小图像。

在一种可选的方案中,可以通过卷积神经网络模型将图片分割为若干小图像,并进行特征参数提取,在不影响图片质量的情况下,压缩图片并减少参数,最后将每个小图像中像素点的位置信息与原图相对应,得到最终的填充参数。

可选地,在本发明上述实施例中,分析子模块包括:提取单元,用于通过卷积神经网络模型的卷积层扫描图片的每个子区域,提取每个子区域的特征参数,其中,特征参数包括如下至少之一:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息;确定单元,用于基于特征参数从多个子区域中确定用于提取填充参数的第一子区域;处理单元,用于将第一子区域的像素信息作为填充参数。

具体地,在电饭煲煮饭的应用场景中,获取到的图片可以是包含大米的图片,也即,上述子区域中对象可以是大米,但不仅限于此。通过卷积神经网络模型可以实现依照边缘像素的方式,或者读取边缘像素点进行均值计算的方式,对长方形图片进行填充。上述的第一子区域可以是既不会影响和破坏图片原有信息的同时,又能够简单填充图片的子区域,该子区域的像素信息可以作为填充参数对长方形的图片进行填充。

在一种可选的方案中,cnn模型可以由输入图像端、卷积层和输出端构成。在获取到长方形图片的详细信息并处理完整之后,通过输入图像端将图片送入卷积层进行卷积计算,每张图片在卷积层中被分割为若干小图像进行特征参数提取,提取出小图像的位置信息、背景中的像素值、对象的轮廓和该对象的像素值等,进一步根据需要选择出第一子区域,并输出至输出端,从而可以根据第一子区域的像素信息得到最终的填充参数。

可选地,在本发明上述实施例中,该装置还包括:第一处理模块,用于将位于图片的边缘位置的子区域作为第一子区域;或,将图片中位于预定方向上的边缘位置的子区域作为第一子区域;或,将图片中平均像素值最大的子区域作为第一子区域;或,将图片中平均像素值最小的子区域作为第一子区域;或将图片中与待填充的区域相邻的子区域作为第一子区域。

在一种可选的方案中,可以根据实际图片的像素信息,以及填充方式,选择第一子区域,并将第一子区域的像素信息作为填充参数。卷积神经网络可以依照边缘像素的方式进行填充,因此,可以将图片的边缘位置上的子区域作为第一子区域。为了将长方形图片转换为正方形图片,可以将图片的短边依照边缘像素的方式进行填充,因此,可以将图片中短边的边缘位置上的子区域作为第一子区域。

同理,由于图片中包含有对象,例如,大米图片中包含有大米,为了不影响和破坏图片原有信息,可以将平均像素值最大的子区域作为第一子区域,该子区域可以是包含有对象的子区域,或者将平均像素值最小的子区域作为第一区域,该子区域可以是未包含有对象的子区域。

另外,图片中相邻两个子区域中每个像素点的像素值变化不大,因此,可以将图片中与待填充的区域相邻的子区域作为第一子区域。

可选地,在本发明上述实施例中,该装置还包括:第二处理模块,用于将第一子区域背景的像素信息或第一子区域中对象的像素信息,作为填充参数;或,将第一子区域的平均像素值作为填充参数;或,将第一子区域边缘位置的像素信息作为填充参数。

在一种可选的方案中,在确定第一子区域之后,可以根据实际图片的像素信息,以及填充方式,选择填充参数。由于第一子区域的特征参数可以包括:子区域在图片中的位置、子区域中背景的像素信息、子区域中对象的轮廓和对象的像素信息等,因此,填充参数可以是第一子区域的背景像素值,也可以是对象的像素值,还可以是所有像素点的平均像素值,又可以是边缘位置的像素值。

可选地,在本发明上述实施例中,该装置还包括:池化处理模块,用于通过卷积神经网络模型的池化层将每个子区域的特征参数进行池化处理,得到压缩后的图片和减少后的特征参数;映射模块,用于将池化处理后的图片在卷积神经网络模型的全连接层进行映射,使得压缩后的图片的像素点位置信息与图片的像素点位置信息相对应。

在一种可选的方案中,如图2所示,cnn模型可以由输入图像端、卷积层、最大池化层、全链接层和输出端构成,其中,最大池化层的主要目的是通过降采样的方式,在不影响图片质量的情况下,压缩图片并减少参数。在获取到长方形图片的详细信息并处理完整之后,通过输入图像端将图片送入卷积层进行卷积计算,每张图片在卷积层中被分割为若干小图像进行特征参数提取。经过卷积层提取特征参数后,经由最大池化层进行处理,最后再经过一个全链接层将图片中像素点的位置信息与原图相对应,并输出至输出端,从而可以得到最终的填充参数。

可选地,在本发明上述实施例中,该装置还包括:判断模块,用于判断图片的第一形状是否为第二形状;第三处理模块,用于如果是,则直接输出图片;如果不是,则执行将图片从第一形状转换成第二形状的步骤,其中,将图片从第一形状转换成第二形状的步骤至少包括:使用卷积神经网络模型分析图片信息获取填充参数,并基于填充参数将图片从第一形状填充至第二形状。

具体地,上述的第二形状可以是正方形的形状,但不仅限于此。

在一种可选的方案中,在获取到需要处理的图片之后,可以首先判断图片是否为正方形,如果是,则直接输出进行后续程序;如若否,则可以读取图片的像素信息并通过卷积神经网络模型对这些信息进行分析,从而根据得到的填充参数将非正方形图片填充为正方形图片。

可选地,在本发明上述实施例中,判断模块包括:读取子模块,用于读取图片的尺寸,其中,尺寸包括:图片的长宽比;判断子模块,用于基于图片的尺寸,判断图片的第一形状是否为第二形状。

在一种可选的方案中,在获取到需要处理的图片之后,可以对图片进行预处理,包括获取图片的长宽比等,从而根据图片的长宽比可以确定出图片是否为正方形,如果长宽比是1,则可以确定图片是正方形,否则可以确定图片是非正方形。

实施例3

根据本发明实施例,提供了一种存储介质的实施例,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1中的图片处理方法。

实施例4

根据本发明实施例,提供了一种处理器的实施例,处理器用于运行程序,其中,程序运行时执行上述实施例1中的图片处理方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1