本发明涉及计算机视觉、数学图像处理和模型识别领域,尤其涉及一种基于深度空间域网络的图像识别方法。
背景技术:
生物测量学是模型识别和计算机视觉一个重要的分支。图像识别技术是生物测量学最核心技术之一和它已经被广泛地应用于公安侦查、航天探险与门禁系统。
然而,图像识别技术仍然面临一些挑战,以人脸识别技术为例,这些技术在变化灯光、遮挡和表情变化时,识别效果都会降低。因此,如何更好地表示图像称为研究的热点。
整体表示法是最早被提出用于图像识别,它主要提取特征点来代表整体,如对于一幅人脸图像,用眼睛、眉毛、鼻子和嘴信息来代替整张脸,该方法失去特定点之间关系,很快被大家所丢弃。之后降维方法很快被普及,主成分分析法(pca)是最典型的降维方法,它将图像利用向量表示,然后求出每组向量的平均值和协方差,利用协方差特征来表示原始图像,该方法在图像识别上取得很好效果。但该方法忽然向量间的关系,丢失关键的信息。之后为了解决此方法2维主成分分析方法被提出,该方法时利用矩阵来表示图像,然后求出矩阵的协方差,把协方差的特征作为图像的特征,这有效降低图像的维度,同时在图像识别上获得很好的性能。但是该方法具有高的复杂度。为了降低复杂度,稀疏方法被提出。尤其在解决小样本数据集上获得良好的性能,具体为:利用所有的训练样本来表示给定的测试样本,并求出稀疏系数,利用稀疏系数和每类训练样本重构与所有的测试样本进行分类,该方法被称为1范数稀疏方法,该方法使用1范数求解稀疏解具有高的复杂度。为了解决此问题,2范数稀疏方法被提出,该方法无论在图像识别的性能,还是效率上都获得好评。但是该方法只能处理特定场景的图像,如:医学图像。这大大限制它的应用。
本发明提出一种基于深度空间域网络的图像识别方法及装置用于图像识别,该方法通过多层空间域学习特征来获得鲁棒的特征并使用softmax来进行高校分类。该方法能有效地处理包括特定图像识别在内的一般的图像识别任务。
技术实现要素:
本发明提出一种基于深度空间域的图像识别方法,该方法能有效地处理传统的机器学习方法对复杂环境下图像识别的不足,同时也能识别医学、遥感等特定环境下的图像。
本发明提出的解决方法如下:
1.本发明的整体流程图,参见附图1一种基于深度空间域网络的图像识别方法的流程图。
2.将图像分类训练集与测试集,具体为将每一类图像的一半为训练集,剩余的图像为测试集。本发明采用的数据集为yale,gt,ar和coil。
3.本发明将训练图像进行旋转90°,180°,270°进行图像扩充,这样一一幅训练图像就扩展变为4幅训练的图像。
4.把训练图像和测试图像分别经过fft提取空间域。空间域能更好反应出图像的分布。本发明设计的网络有三层,每层都是有fft组成。
5.把训练图像经过fft图像作为第一层网络的输入,得到的特征记为f1;
6把f1经过由fft组成的第二层网络,提取到的特征记为f2;
7.f2经过有fft组成的第三层网络,提取到的特征记为f3;
8.4,5,6,7中所涉及的fft算法的具体实现公式如下:
其中,
9.f3和类别经过softmax和目标函数进行训练模型;其中softmax函数的实现如下:
在公式(2)中,
10.函数为最小平方差mse;这里迭代训练次数为50次;mse的实现如公式(3)所示:
在公式(3)中,如果n代表数据个数,r代表组数,
11.待7中训练模型完成后,用测试数据测试本发明提出模型的性能;
12.本发明能用于医学图像诊病、人脸检测和车牌号检测等图像检测任务。
举例说明
本发明提出一个深度空间域网络的图像识别方法,该方法能处理复杂环境下的图像识别,为了更清晰展示本发明所提出方法,举例说明。
1.本发明将数据库的每一类一半分为训练集和测试集,如coil100数据
集,一共有100类,每类有355张图像,前177张图像为训练,后178张
图像为测试图像。一共训练集有17700张图像,测试集有17800图像。
2.本发明将每张训练图像进行90°,180°,270°图像旋转来增强训练集,参见附图2中图原始图像图,旋转90°图像,旋转180°图像,旋转270°图像。
3.我们将训练图像和测试图像都利用fft方法转化为空间域特征图像;
参见附图3原始训练图像1,原始训练图像2,原始测试图像1,原始测试图像2;
参见附图4转换为fft训练图像1,转换fft测试图像2,转换fft测试图像1;
参见附图5训练图像1经过第一层得到f1图像,测试f1图像2,测试图像f1图像1;
参见附图6f1图像作为第二层输入,经过第二层得到f2图像1测试f2图像2测试f2图像1;
参见附图7f2图像作为第三层的输入,经过第三层得到f3图像1测试f3图像2f3图像2测试f3图像1。
4.经过mse用来更新参数,本发明知道训练与给定类别进行配对,和哪
个进行就更新哪个参数确定好模型。
5.本发明用4中训练好模型来验证效果,等测试1与测试2进入模型是,
网络经过softmax算上来2个概率,假设这个概率为0.2和0.8,概率大就是这个测试图像的类别,就是测试2属于第二类。从上图3中得到图也知道测试2的类别。
附图说明
下面结合附图对本发明的具体实施方式作进一步说明:
图1一种基于深度空间域网络的图像识别方法的流程图;
图2是原始图像图,旋转90°图像,旋转180°图像,旋转270°图像;
图3是原始训练图像1,原始训练图像2,原始测试图像1,原始测试图像2;
图4是转换为fft训练图像1,转换fft测试图像2,转换fft测试图像1;
图5是训练图像1经过第一层得到f1图像,测试f1图像2,测试图像f1图像1;
图6是f1图像作为第二层输入,经过第二层得到f2图像1测试f2图像2测试f2图像1;
图7是f2图像作为第三层的输入,经过第三层得到f3图像1测试f3图像2f3图像2测试f3图像1。