专利名称:一种邻域自适应的局部保持投影方法
一种邻域自适应的局部保持投影方法
技术领域:
本发明涉及特征提取的方法,具体涉及一种邻域自适应的局部保持投影方法。背景技术:
在模式识别、信息融合、文本分类、计算视觉和数据挖掘等应用领域,常常会碰到许多高维数据,处理高维数据需要很长的时间和非常大的存储空间,因此,在进行诸如分类、聚类任务前,需要对高维数据进行降维预处理,常见的两种降维方法是特征选择和特征提取。目前,己出现了多种特征选择方法,如主成分分析、线性鉴别分析等,主成分分析是一种无监督的降维方法,其目的是找出一组正交基,并在该组正交基空间下捕获数据的全局信息;线性鉴别分析是一种监督的降维方法,其目的通过最大类问散布矩阵和最小类内散布矩阵获得数据的一个变换子空间。另外,基于流行学习方法,提出了 IS0MAP、拉普拉斯特征映射、局部线性嵌入和局部保持投影等降维方法,ISOMAP和拉普拉斯特征映射属于非线性算法,而局部线性嵌入和局部保持投影是属于线性算法。一般来说,基于流行学习的降维方法的核心思想是通过局部不变性来检测数据潜在的流行结构以便获得数据的低维表示,另外,这种局部不变性通常使用一个近邻图来保证,但什么样的近邻图是合适的、多大才算是局部成为了难题,具体来说,如何选择合适的近邻大小来构建近邻图以便匹配流行的局部几何结构成为有效降维的关键。
发明内容本发明的目的是解决邻域大小自动选择的问题,并集成到局部保持投影算法中,使局部保持投影算法能够自动根据数据集的分布构建近邻图,实现有效降维。为实现上述目的,本发明提出了一种邻域自适应的局部保持投影方法,包含如下步骤A)计算每个样本点Xi的最近邻点Zi或最近邻域ε i ;B)找出每个样本点Xi的最近邻点N(Xi);C)计算近邻图的权矩阵w ;D)计算对角矩阵D = Σ'λ I和拉普拉斯矩阵L = D-w;Ε)计算特征问题XLXtV = λ XDXtV的特征值和特征向量,其中Χ = [*1(ΛF)根据E)步骤中所得的特征值的大小,依次输出d个最小特征值对应的特征向量V = [V1, A , vd];G)根据F)步骤中所得的特征向量V对每个样本点进行降维,获得低维数据Y =VTX,其中 Y = IylA ,y] e 'Jtrfxiv Q作为优选,所述A)步骤中所计算的是每个样本点Xi的最近邻点Zi,
权利要求
1.一种邻域自适应的局部保持投影方法,其特征在于包含如下步骤 A)计算每个样本点Xi的最近邻点Zi或最近邻域εi ; B)找出每个样本点Xi的最近邻点N(Xi); C)计算近邻图的权矩阵W,采用0-1权计算近邻图的权矩阵W即
2.如权利要求1所述的一种邻域自适应的局部保持投影方法,其特征在于所述A)步骤中所计算的是每个样本点Xi的最近邻点Zi,
3.如权利要求2所述的一种邻域自适应的局部保持投影方法,其特征在于所述 ka(n)Μχ. )=所述MXi,Xj)是带宽为σ的核函数。 V. X,
4.如权利要求2所述的一种邻域自适应的局部保持投影方法,其特征在于所述满足I X1-Xj I ( I Ix1-Zi I的所有样本点均为Xi的最近邻点。
5.如权利要求1所述的一种邻域自适应的局部保持投影方法,其特征在于所述Α)步骤中所计算的是每个样本点Xi的最近邻域ε y
6.如权利要求5所述的一种邻域自适应的局部保持投影方法,其特征在于所述满足X1-Xj I2^ 的所有样本点均为Xi的最近邻点。
7.如权利要求1至6中任一项所述的一种邻域自适应的局部保持投影方法,其特征在于若所得出的最近邻点个数不足规定的最小最近邻点个数kmin,则通过欧式距离找出其他近邻点直至kmin个。
全文摘要
本发明公开了一种邻域自适应的局部保持投影方法,主要包括计算每个样本点xi的最近邻点zi或最近邻域εi,找出每个样本点xi的最近邻点N(xi),计算近邻图的权矩阵W,计算对角矩阵和拉普拉斯矩阵L=D-W等步骤。本发明主要以局部保持投影作为研究对象,在此基础上通过估计样本点的最近邻点或最近邻域,进而发明了邻域自适应的局部保持投影方法,即LPPANS方法。本发明不需要设置一个合适的近邻大小,而只要设置样本点的最小最近邻点个数kmin,局部保持投影就会自动匹配数据潜在流行的局部几何结构,使局部保持投影算法能够自动根据数据集的分布构建近邻图,从而更加有效地实现降维。
文档编号G06K9/62GK103034869SQ201210518220
公开日2013年4月10日 申请日期2012年12月5日 优先权日2012年12月5日
发明者蒋云良, 胡文军, 成新民, 王娟 申请人:湖州师范学院