图像处理方法、装置、设备及计算机可读存储介质与流程

文档序号:14610247发布日期:2018-06-05 20:41阅读:272来源:国知局
图像处理方法、装置、设备及计算机可读存储介质与流程

本发明涉及图像处理领域,尤其涉及一种图像处理方法、装置、设备及计算机可读存储介质。



背景技术:

随着移动设备的普及,便携、功能齐全的特性使其在企业生产环境中承担着越来越重要的职责。其中通过移动设备采集图像也是企业一个比较旺盛的需求。通过移动设备的摄像功能拍摄的图像分辨率和清晰度都很高,但空间占比很大,上传时对移动网络带宽和服务器存储空间都有很高的要求。因此,在实际的应用过程中,往往会提前对图像进行压缩处理,以减少图像的大小,降低存储空间以及网络带宽的需求,而且服务端对上传后的图像处理也会有存储需求上的要求。现有技术中,在拍摄或上传图像时,对图像进行分辨率或者画质方面的压缩,使其符合上传时设定的数据传输阈值。由于压缩处理后的图像在一定程度上会损失清晰度,若图像的主体元素过小,就会导致主体元素的清晰度不佳,甚至会出现人工识别上的困难。



技术实现要素:

本发明实施例提供一种图像处理方法、装置、设备及计算机可读存储介质,以至少解决现有技术中的以上技术问题。

第一方面,本发明实施例提供了一种图像处理方法,包括:

获取初始图像;

从所述初始图像中获取多个物体元素;

从所述多个物体元素中识别主体元素;

将所述主体元素作为裁剪区域对所述初始图像进行裁剪,获得裁剪图像。

结合第一方面,本发明在第一方面的第一种实施方式中,在所述获得裁剪图像的步骤之后,所述方法还包括:

接收第一用户指令,并根据所述第一用户指令将所述裁剪图像作为待上传图像;或者

接收第二用户指令,并根据所述第二用户指令将所述初始图像作为待上传图像;或者

接收第三用户指令,并根据所述第三用户指令重新获取初始图像。

结合第一方面的第一种实施方式,本发明在第一方面的第二种实施方式中,在所述接收第一用户指令的步骤之后,所述方法还包括:

当所述待上传图像符合上传要求时,将所述待上传图像上传至服务器;以及

当所述待上传图像不符合上传要求时,将所述待上传图像的压缩图像上传至所述服务器。

结合第一方面,本发明在第一方面的第三种实施方式中,所述从所述初始图像中获取多个物体元素的步骤包括:

将所述初始图像划分为多个像素区域;

计算每两个相邻像素区域之间的相似度值,并将所述相似度值添加到相似度集合中;

从所述相似度集合中获取最大相似度值;

合并所述最大相似度值所对应的像素区域;

从所述相似度集合中剔除所述最大相似度值;

计算合并后的像素区域以及与所述合并后的像素区域相邻的像素区域之间的相似度值,并将所述合并后的像素区域以及与所述合并后的像素区域相邻的像素区域之间的相似度值添加到所述相似度集合中;以及

判断所述相似度集合中的最大相似度值是否小于阈值,若是,则停止合并,以获得所述多个物体元素;若否,则返回所述合并所述最大相似度值所对应的像素区域的步骤。

结合第一方面,本发明在第一方面的第四种实施方式中,所述从所述多个物体元素中识别主体元素的步骤包括:

根据标注样本库进行特征提取训练,识别所述主体元素。

结合第一方面,本发明在第一方面的第五种实施方式中,在所述获得裁剪图像的步骤之后,所述方法还包括:

接收第四用户指令,并根据所述第四用户指令存储所述裁剪图像;或者

接收第五用户指令,并根据所述第五用户指令存储所述初始图像。

第二方面,本发明实施例提供了一种图像处理装置,包括:

初始图像获取模块,用于获取初始图像;

物体元素获取模块,用于从所述初始图像中获取多个物体元素;

主体元素识别模块,用于从所述多个物体元素中识别主体元素;

裁剪图像获得模块,用于将所述主体元素作为裁剪区域对所述初始图像进行裁剪,获得裁剪图像。

结合第二方面,本发明在第二方面的第一种实施方式中,所述图像处理装置还包括用户指令接收模块,用于:

接收第一用户指令,并根据所述第一用户指令将所述裁剪图像作为待上传图像;或者

接收第二用户指令,并根据所述第二用户指令将所述初始图像作为待上传图像;或者

接收第三用户指令,并根据所述第三用户指令重新获取初始图像。

结合第二方面的第一种实施方式,本发明在第二方面的第二种实施方式中,所述图像处理装置还包括判断上传模块,用于:

当所述待上传图像符合上传要求时,将所述待上传图像上传至服务器;以及

当所述待上传图像不符合上传要求时,将所述待上传图像的压缩图像上传至所述服务器。

结合第二方面,本发明在第二方面的第三种实施方式中,所述物体元素获取模块包括:

划分单元,用于将所述初始图像划分为多个像素区域;

第一计算添加单元,用于计算每两个相邻像素区域之间的相似度值,并将所述相似度值添加到相似度集合中;

最大相似度值获取单元,用于从所述相似度集合中获取最大相似度值;

合并单元,用于合并所述最大相似度值所对应的像素区域;

剔除单元,用于从所述相似度集合中剔除所述最大相似度值;

第二计算添加单元,用于计算合并后的像素区域以及与所述合并后的像素区域相邻的像素区域之间的相似度值,并将所述合并后的像素区域以及与所述合并后的像素区域相邻的像素区域之间的相似度值添加到所述相似度集合中;以及

判断单元,用于判断所述相似度集合中的最大相似度值是否小于阈值,若是,则停止合并,以获得所述多个物体元素;若否,则返回所述合并所述最大相似度值所对应的像素区域的步骤。

所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,图像处理设备的结构中包括处理器和存储器,所述存储器用于存储支持图像处理设备执行上述第一方面中图像处理方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述图像处理设备还可以包括通信接口,用于图像处理设备与其他设备或通信网络通信。

第三方面,本发明实施例提供了一种计算机可读存储介质,用于存储图像处理装置所用的计算机软件指令,其包括用于执行上述第一方面中图像处理方法为图像处理装置所涉及的程序。

上述技术方案中的一个技术方案具有如下优点或有益效果:可以在不损失图像主体元素清晰度的前提下减小图像大小。

上述技术方案中的另一个技术方案具有如下优点或有益效果:可以提高上传效率。

上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。

图1为实施例一的图像处理方法的流程图。

图2为实施例一的获取多个物体元素的方法的流程图。

图3为实施例二的图像处理方法的流程图。

图4为实施例三的图像处理方法的流程图。

图5为实施例四的图像处理装置的结构示意图。

图6为实施例四的物体元素获取模块的结构示意图。

图7为实施例五的图像处理装置的结构示意图。

图8为实施例六的图像处理设备的结构示意图。

具体实施方式

在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

本发明实施例旨在解决现有技术中的图像处理方法将图像直接压缩后存储或上传至服务器,因图像中的主体元素占比过小,导致压缩后的图像清晰度小或识别度低的问题。本发明实施例主要通过物体检测算法以获取初始图像中的主体元素,并通过对主体元素进行边缘检测以获得主体元素的边框位置,然后将主体元素的边框位置作为裁剪区域对初始图像进行裁剪,获得裁剪图像,从而可以在不损失图像主体元素清晰度的前提下减小图像大小,进而减小占用存储空间,提高上传效率。

实施例一

请参阅图1,本实施例提供了一种图像处理方法,所述方法包括:

S110,获取初始图像。

具体地,在本实施例中,获取初始图像可以由移动终端的摄像头拍摄初始图像,移动终端包括但不限定于手机、平板电脑、数码相机等配备有摄像头的设备,优选为智能手机;也可以从云服务器或移动终端的存储介质中获取初始图像。例如,获取的初始图像为票据图像。

S120,从初始图像中获取多个物体元素。

请参阅图2,从初始图像中获取多个物体元素具体包括:

S121,将初始图像划分为多个像素区域R1、R2、R3……RN;

S122,计算每两个相邻像素区域的相似度值S1、S2、S3……Smax,并将计算得到的相似度值S1、S2、S3……Smax添加到相似度集合中;

S123,从相似度集合中获取最大相似度值Smax,并找到该最大相似度值Smax所对应的两个像素区域,例如为R3和R4;

S124,合并该最大相似度值Smax所对应的像素区域,即合并R3和R4,得到合并后的像素区域Rnew;

S125,从相似度集合中剔除该最大相似度值Smax;

S126,计算合并后的像素区域Rnew与其相邻像素区域的相似度值Snew,并将重新计算后的相似度值Snew添加到相似度集合中;

S127,判断相似度集合中的最大相似度值是否小于阈值,若是,则停止合并像素区域,以获得多个物体元素,若否,则返回步骤S124。

具体地,在步骤S127中,要重复步骤S123至步骤S126,不断合并像素区域,直到相似度集合中的每一个相似度值都小于阈值时,停止合并像素区域,最终获得的每个像素区域即为一个物体元素。阈值通常为根据图像类型或者应用场景而设定。

以票据图像为例,获取的物体元素包括票据元素和背景元素,若票据图像中的背景很繁杂,例如背景中还包括建筑物和人物时,获得的物体元素可能为票据元素、建筑物元素和人物元素。

请继续参阅图1,接下来,步骤S130,从多个物体元素中识别主体元素。

主体元素一般是初始图像中的显著性区域,以票据图像为例,票据元素作为主体元素,在图像中所占区域比例在40%以上,而且其他元素所占比例不会超过票据元素,但仍有60%的区域中的元素与票据元素没有直接关系,可以进行裁剪去掉,仅保留主体元素。

可以通过R-CNN(Region Convolutional Neural Network,简称R-CNN,区域卷积神经网络)算法和标注样本库进行特征提取训练,从多个物体元素中识别主体元素。具体地,基于R-CNN算法,对每个物体元素使用深度网络提取特征,并将特征送入标准样本库中的每一类分类器,判断是否属于主体元素的类,从而识别主体元素。

步骤S140,将主体元素作为裁剪区域对所述初始图像进行裁剪,获得裁剪图像。

具体地,在步骤S120中,以不断合并像素区域的方法获取物体元素的同时,也会得到物体元素的边框位置,在步骤S130中,识别主体元素的同时也会获得主体元素的边框位置,将主体元素的边框作为裁剪区域的边框对初始图像进行裁剪,获得裁剪图像,该裁剪图像仅包括了主体元素,而与主体元素相关度不高的其他元素会被裁剪掉。

采用本实施例的图像处理方法,可以通过检测图像的主体元素,将主体元素作为裁剪对象,从而可以在不损失图像清晰度的前提下,减小图像大小。

实施例二

请参阅图3,本实施例的方法相比实施例一,在步骤S140之后还包括:

步骤S151,接收第一用户指令,并根据第一用户指令将裁剪图像作为待上传图像;或者步骤S152,接收第二用户指令,并根据第二用户指令将所述初始图像作为待上传图像;或者步骤S153,接收第三用户指令,并根据第三用户指令重新获取初始图像。

具体的,在获得裁剪图像以后,用户可以根据裁剪后的图像是否符合要求,发出用户指令。如果裁剪图像的效果符合当前图像要求,用户可以发出第一用户指令,本实施例的方法可以根据第一用户指令,将裁剪图像作为待上传图像。如果裁剪图像的效果不符合当前的要求,用户可以发出第二用户指令,本实施例的方法可以根据第二用户指令,将初始图像作为待上传图像;如果无法识别主体元素,或者裁剪图像中没有主体元素,用户可以发出第三用户指令,本实施例的方法可以根据第三用户指令,重新获取初始图像。

步骤S160,当待上传图像符合上传要求时,将待上传图像上传至服务器;以及当待上传图像不符合上传要求时,将待上传图像的压缩图像上传至所述服务器。

裁剪图像可根据初始图像中的主体元素所占的比例,使初始图像减少10%-50%的大小。但在上传至服务器时,仍要考虑待上传图像是否符合上传要求,即待上传图像的大小是否符合传输阈值。以裁剪图像作为待上传图像为例,当裁剪图像符合上传要求时,则不需要经过压缩处理,将裁剪图像直接上传,这样可以极大地保存主体元素的清晰度。当裁剪图像不符合上传要求,则仍需要将裁剪图像进行压缩处理,将压缩后的裁剪图像上传至服务器。

实施例三

请参阅图4,本实施例的方法相比实施例一,在步骤S140之后还包括:

步骤S251,接收第四用户指令,并根据第四用户指令存储裁剪图像;或者步骤S252,接收第五用户指令,并根据第五用户指令存储初始图像。

在获得裁剪图像以后,用户可以根据裁剪后的图像是否符合要求,发出用户指令。如果裁剪图像的效果符合当前图像要求,用户可以发出第四用户指令,本实施例的方法可以根据第四用户指令,直接存储裁剪图像,这样可以极大地保存主体元素的清晰度,又可以缩小图像占用空间。如果裁剪图像的效果不符合当前的要求,用户可以发出第五用户指令,本实施例的方法可以根据第五用户指令,存储初始图像。

实施例四

本实施例提供了一种图像处理装置,对应于实施例一的图像处理方法。

请参阅图5,本实施例的图像处理装置包括:初始图像获取模块110、物体元素获取模块120、主体元素识别模块130和裁剪图像获得模块140。

初始图像获取模块110,用于获取初始图像;

物体元素获取模块120,用于从所述初始图像中获取多个物体元素;

主体元素识别模块130,用于从所述多个物体元素中识别主体元素;

裁剪图像获得模块140,用于将所述主体元素作为裁剪区域对所述初始图像进行裁剪,获得裁剪图像。

进一步地,物体元素获取模块120包括划分单元121、第一计算添加单元122、最大相似度获取单元123、合并单元124、剔除单元125、第二计算添加单元126和判断单元127,如图6所示。

划分单元121用于将所述初始图像划分为多个像素区域;第一计算添加单元122用于计算每两个相邻像素区域之间的相似度值,并将所述相似度值添加到相似度集合中;最大相似度值获取单元123用于从相似度集合中获取最大相似度值;合并单元124用于合并最大相似度值所对应的像素区域;剔除单元125用于从相似度集合中剔除所述最大相似度值;第二计算添加单元126用于计算合并后的像素区域以及与合并后的像素区域相邻的像素区域之间的相似度值,并将合并后的像素区域以及与合并后的像素区域相邻的像素区域之间的相似度值添加到所述相似度集合中;判断单元127用于判断相似度集合中的最大相似度值是否小于阈值,若是,则停止合并,以获得多个物体元素;若否,则返回实施例一中的步骤S124。

本发明实施例所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块或单元。

实施例五

本实施例提供了一种图像处理装置,对应于实施例二的图像处理方法。请参阅图7,与实施例四相比,本实施例的图像处理装置还包括用户指令接收模块150和判断上传模块160。

用户指令接收模块150用于接收第一用户指令,并根据所述第一用户指令将所述裁剪图像作为待上传图像;或者接收第二用户指令,并根据所述第二用户指令将所述初始图像作为待上传图像;或者接收第三用户指令,并根据所述第三用户指令重新获取初始图像。

判断上传模块160用于当所述待上传图像符合上传要求时,将所述待上传图像上传至服务器;以及当所述待上传图像不符合上传要求时,将所述待上传图像的压缩图像上传至所述服务器。

本发明实施例所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块或单元。

实施例六

本实施例提供一种图像处理设备,如图8所示,该设备包括:存储装置31和处理器32,存储装置31内存储有可在处理器32上运行的计算机程序。处理器32执行所述计算机程序时实现上述实施例中的拍照方法。存储装置31和处理器32的数量可以为一个或多个。

该设备还包括:通信接口33,用于与外界设备进行通信,进行数据交互传输。

存储装置31可能包含高速RAM存储装置,也可能还包括非易失性存储装置(non-volatile memory),例如至少一个磁盘存储装置。

如果存储装置31、处理器32和通信接口33独立实现,则存储装置31、处理器32和通信接口33可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储装置31、处理器32及通信接口33集成在一块芯片上,则存储装置31、处理器32及通信接口33可以通过内部接口完成相互间的通信。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1