一种图像形状的编码方法与流程

文档序号:17223424发布日期:2019-03-27 12:16阅读:1165来源:国知局
一种图像形状的编码方法与流程

本发明涉及图像处理中的图像编码,特别涉及图像形状的编码方法。



背景技术:

卷积神经网络(convolutionalneuralnetwork,cnn)是一种高效的智能图像识别方法,已经在许多领域的实际应用中取得了优异的成果。但有研究表明,目前常用的cnn通常只能学习到图像的中低层特征(边缘、纹理)而没能获得描述图像的全局结构的高级语义特征(形状、结构),这使得cnn在进行图像识别时会出现错识(将两张不同的图像识别为相同的对象)、漏识(将两张相似的图像识别为不同的对象)的问题,限制了cnn所能达到的最高识别准确率。因此,若能将形状特征引入cnn的学习中,必将令cnn的识别准确率有所提高,进一步地,将有效促进图像识别相关工作的发展。



技术实现要素:

本发明的目的是提供一种对图像形状进行编码的方法,将编码后的图像交予cnn进行学习可克服其在一般情况下无法获取图像高级语义特征的问题。

为实现上述目的,对图像形状进行编码的方法包括步骤:

步骤1)、使用中央周边差算子对原图像进行卷积,获得显著特征图;

步骤2)、对步骤1)中得到的显著特征图进行二值化操作,得到由取零值的非显著点和取非零值的显著点组成的二值特征图;

步骤3)、构造一个二维矩阵,亦即形状编码图统计步骤2)中得到的二值特征图中的显著点对的出现频率。

本发明的形状编码方法应用于cnn的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升cnn的图像识别能力。

附图说明

图1为通过用中央周边差算子对原图像进行卷积,获得显著特征图的示意图;

图2为对显著特征图进行二值化操作的示意图;

图3为将原始的人脸图像转换为二值特征图的示例图;

图4为构建形状编码图、统计二值特征图中显著点对的出现频度的示意图;

图5为对二值特征图进行形状编码的示例图;

图6为将图3中的二值特征图转换为相应的形状编码图的示例图。

具体实施方式

下面结合附图和具体实施方式对本发明做进一步说明。

一种图像形状的编码方法,包括:

步骤1)、提取图像显著特征;

步骤2)、将显著特征图像转换为二值特征图像;

步骤3)、对二值特征图像进行形状编码。

在所述的步骤1)中,使用中央周边差算子对原图像进行卷积,从而得到显著特征图像。

在所述的步骤2)中,指定一个阈值,将图像中像素点值小于该阈值的像素点的值置零,令显著特征图像转换为只包含零值和非零值像素点的二值特征图像。

在所述的步骤3)中,统计二值特征图中的各类显著点对的出现频度并在一个二维矩阵亦即形状编码图中进行记录。

统计显著点对时只将第二个显著点在纵轴方向上坐标值大于或等于第一个显著点对的显著点对,即△y≥0的显著点对。

形状编码图的宽度为二值特征图的宽度,长度为2倍的二值特征图的长度减一。

显著点对是记录方式是以形状编码图第一行中间列的像素点为原点建立直角坐标系,然后将空间关系为(△x,△y)的显著点对的数量作为在直角坐标系中位于坐标为(△x,△y)处的像素点的值。

参见图1的示意图,假设有一幅大小为5×5的输入图像i如图1(a)所示,首先使用如图1(b)所示的大小为3×3的中央周边差算子作为卷积核对i进行卷积。这一卷积操作的目的在于提取出原图像i的显著特征,得到包含有原图像显著特征的如图1(c)所示的显著特征图。

然后如图2所示,对前一步中得到的显著特征图进行二值化操作,得到如图2(b)所示的由显著点(非零值的像素点)和非显著点(零值的像素点)组成的二值特征图。

参见图3的示例图,图3中的(a)为一张192×168的人脸图像,通过上述运算依次提取其显著特征并进行二值化后的结果是如图3中的(b)所示的二值特征图。从图3中的(b)可以看出,通过上述运算得到的二值特征图保留了原始人脸图像中的面部轮廓特征。尽管如此,这样的特征图中仍然只具有原图像的低层特征,为了能获得原图像的高层特征,还需要对其做进一步的变换。

对二值特征图进行形状编码是本发明的方法的核心。设有一个包含9个像素点的3×3的图像,其中有2个像素点是显著点(黑点),其余7个点为非显著点。参见图4的示意图,在图4中的(a)中以位于图像第一行第一列的像素点为坐标原点建立直角坐标系,则在此直角坐标系中,两个显著点在x轴和y轴方向上的距离分别为-1和2,即△x=-1,△y=2。然后统计这样的有着相同空间关系(△x,△y)的显著点对,并记录在一个新的二维矩阵亦即形状编码图中,其宽度与原图像相等,长度则为2倍的原图像长度减1。

以形状编码图第一行中间列的像素点为原点建立直角坐标系,在这个直角坐标系中进行上述记录工作。例如,对于在原图像中距离为△x=-1,△y=2的显著点对,在形状编码图的第二列第三行将这类显著点对的数量记录为1,如图4中的(b)所示。

参见图5的示意图,在形状编码的过程中,只取二值特征图像中在y轴方向上距离为非负数(即△y≥0)的显著点对。这是因为在统计显著点对的过程中,需要对二值特征图像中的每一个显著点进行遍历,统计其与其它所有显著点所构成的点对,而后者在y轴方向上的坐标值通常大于或等于前者。如对于如图4中的(a)中的两个显著点,在统计时只记录为一组距离为△x=-1,△y=2的点对,而不记录△x=1,△y=-2的点对,这样可以在形状编码时减少冗余特征、避免数据维度无意义地扩大。

参见图6的示例图,通过对图3中的二值特征图进行形状编码所得到的结果即为图6(b)的形状编码图。该图像中颜色越明亮(如图像中部)表示对应的显著点对的出现频度越高,相对地,颜色越暗淡(如图像右下角处)则表示对应的显著点对的出现频度越低。



技术特征:

技术总结
本发明公开了一种图像形状编码方法,包括步骤:1)提取原图像显著特征,获得显著特征图;2)对显著特征图二值化,获得二值特征图;3)对二值特征图形状编码,获得形状编码图。本发明的图像形状编码方法应用于CNN的学习后在实验中所能取得的最高识别准确率,普遍高于不使用该方法时所能取得的最高识别准确率。因此,本发明有助于提升CNN的图像识别能力。

技术研发人员:苗军;许少武;卿来云;乔元华;邹柏贤
受保护的技术使用者:北京信息科技大学
技术研发日:2018.09.29
技术公布日:2019.03.26
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1