专利名称:一种基于流形距离分析的视觉对象识别方法和装置的制作方法
技术领域:
本发明涉及视觉对象识别领域,特别是涉及一种基于流形距离分析的视觉 对象识别方法和装置。
背景技术:
模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础 上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图 形自动完成识别的过程。视觉对象识别作为模式识别的主要应用领域之一,在 诸如人脸识别、身份识别等方面正发挥着越来越重要的作用。
在^L觉对象识别领域,通常关注的对象都^皮从少量的样本中进行训练。随 着视频摄像头及大容量多媒体数据存储技术的快速发展,用于对象模式识别的 数据量也在不断增长,从而用于训练的对象的图像数量也变得很大。在这种情 况下,视觉对象识别已经发展成基于一个对象图片集合的训练及在一个图像库 中进行寻找的状况。媒体数据的巨大以及不同图像数据之间的关系的复杂性增 加了视觉对象识别的难度,从而对视觉对象识别技术提出了新的挑战。近年来 很多方法关注于应用流形对视觉对象集合进行建模,通过对流形之间的距离比 较分析进行视觉对象识别。
流形是指抽象的弯曲空间中的一个超曲面,它在局部具有欧氏几何结构。 流形中的一个点可以用可变参数的一组特定值来表示,而所有的这些点的全体 构成流形本身,可变参数称为流形的坐标。通常,流形是由高维数据组成的高 维空间中的图形,将高维的流形降低维数得到的低维数据称作流形的子空间, 流形中的点就是高维空间中的点。如果把单个图像样本看作流形中的一个点, 那么流形的子空间就是由流形的部分样本组成的具有局部线性特征的部分。在 视觉对象识别中,识别的勤出是视觉对象的相似度, 一种简单的相似度可用区 域特征空间中的距离来定义。具体到流形,就是用流形之间的距离来定义相似
度,流形之间的距离越小,相似度就越高;距离越大,相似度越低。将被检索
的对象图片集合看作一个流形,将用于检索的对象图片集合视为另外的流形, 则视觉对象识别可被认为是找出多个流形之间相似度最高的目标对象的过程。
美国电气及电子工程师学会计算机视觉及模式识别国际会议2008年会论 文集(In Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition 2008 )中的名为"流形距离在基于图像集的人脸识别中的应 用"(Manifold-Manifold Distance With Application to Face Recognition based on Image Set)的论文公布了一种最新的流形距离分析方法,该方法通过定义流形 中点和点的距离,点和子空间之间的距离,子空间和子空间之间的距离以及点 和流形之间的距离,从而得到流形和流形之间的距离,最后基于流形距离分析 识别视觉对象。该方法对媒体数据具有较高的敏感性,可以有效处理大量、复 杂的视觉对象媒体数据。但是,该方法提供的流形距离分析方法只关注两个流 形之间最相近部分的距离,且将其做为通用的流形距离。这样做虽然简化了流 形距离计算,但因为,流形之间最相近部分的距离往往对噪声数据非常敏感, 当两个流形中由于噪声数据的影响使得其具有较近的子空间时,则流形距离计 算分析容易产生错误的结果,从而导致视觉对象的误识别。
总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够有效 降低流形距离分析过程中对噪声数据的敏感程度,提高视觉对象识别率。
发明内容
本发明所要解决的技术问题是提供一种基于流形距离分析的视觉对象识 别方法和装置,能够有效降低流形距离分析过程中对噪声数据的敏感程度,提 高一见觉对象识别率。
为了解决上述问题,本发明实施例提供了一种基于流形距离分析的视觉对 象识别方法,包括
依据待识别视觉对象数据构造一个非线性的待识别对象流形,以及,依据 已知视觉对象数据构造一个或多个非线性的已知对象流形;
将所述待识别对象流形和已知对象流形从高维降维到低维的子空间;
提取所述待识别对象流形每一个子空间的特征数据,以及,所述已知对象
流形每一个子空间的特征数据;
计算所述待识别对象流形每一个子空间与已知对象流形每一个子空间的 距离,进而获得所述待识别对象流形和已知对象流形的距离;
当所述待识别对象流形和已知对象流形的距离满足识别条件时,则将所述 已知对象流形对应的对象确定为待视别视觉对象。
优选的,所述将流形从高维降维到低维的子空间为通过应用局部线性嵌入 方法进行降维。
优选的,所述每一个子空间的特征数据为每一个子空间的标准正交基。 优选的,所述待识别对象流形每一个子空间与已知对象流形每一个子空间
的距离为所述子空间的标准正交基之间的距离。
优选的,所述待识别对象流形和已知对象流形的距离为基于子空间的距离
的豪斯多夫距离。
相应的,本发明实施例还提供了一种基于流形距离分析的视觉对象识别装 置,包括
流形构造模块,用于依据待识别视觉对象数据构造一个非线性的待识别对 象流形,以及,依据已知视觉对象数据构造一个或多个非线性的已知对象流形;
子空间构造模块,用于将所述待识别对象流形和已知对象流形从高维降维 到低维的子空间;
特征数据提取模块,用于提取所述待识别对象流形每一个子空间的特征数 据,以及,所述已知对象流形每一个子空间的特征数据;
距离计算模块,用于计算所述待识别对象流形每一个子空间与已知对象流 形每一个子空间的距离,进而获得所述待识别对象流形和已知对象流形的距
离;
识别条件判断模块,用于判断所述待识别对象流形和已知对象流形的距离
是否满足识别条件;
对象识别模块,用于当识别条件判断模块的结果为是时,则将所述已知对
象流形对应的对象确定为待视别视觉对象。优选的,所述距离计算模块进一步包括子空间距离计算子模块,用于计算所述待识别对象流形每一个子空间与已 知对象流形每一个子空间的距离;流形距离计算子模块,用于依据子空间距离计算子模块获得的子空间距 离,计算待识别对象流形和已知对象流形的距离。优选的,所述将流形从高维降维到低维的子空间为通过应用局部线性嵌入 方法进行降维。优选的,所述每一个子空间的特征数据为每一个子空间的标准正交基。 优选的,所述待识别对象流形每一个子空间与已知对象流形每一个子空间的距离为所述子空间的标准正交基之间的距离。优选的,所述待识别对象流形和已知对象流形的距离为基于子空间的距离的豪斯多夫距离。与现有技术相比,本发明具有以下优点首先,本发明对待识别对象流形和已知对象流形的所有子空间的距离进行 了比较分析,综合考虑了流形之间的整体位置关系,因此对噪声数据不敏感, 在存在一定噪声的情况下仍能获得较好的效果,而且对流形之间距离的比较分 析更加有效。其次,本发明通过计算每一个子空间的标准正交基提取该子空间的特征数 据,进而计算子空间之间的距离,与其它子空间距离计算方法相比,如主成分 角(Principal angels)法只适用于两个子空间维数相同情况下的距离计算,该 方法即使两个子空间维数不相等,仍然可以有效计算子空间之间的距离,且使 用标准正交基提取子空间的特征数据计算方法简便,计算复杂度低,设计简单, 易于实现。
图l是本发明的一种基于流形距离分析的视觉对象识别方法实施例1的步
骤流程图;图2是本发明的一种基于流形距离分析的视觉对象识别方法实施例2的步 骤流程图;图3是本发明的一种基于流形距离分析的视觉对象识别装置实施例的结 构框图;图4是本发明应用图2所示的装置实施例进行一见觉对象识别的步骤流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。本发明实施例的核心构思之一在于,通过对待识别对象流形和已知对象流 形的所有子空间的距离进行比较分析,综合考虑流形之间的整体位置关系,使 视觉对象识别过程对噪声数据不敏感,取得较好的识别效果。参考图1,示出了本发明一种基于流形距离分析的视觉对象识别方法实施 例l的步骤流程图,具体可以包括以下步骤步骤101:依据待识别视觉对象数据构造一个非线性的待识别对象流形, 依据已知视觉对象数据构造一个或多个非线性的已知对象流形;流形是现代数学的概念,在实际应用中,流形可以视为近看起来像欧氏空 间或其他相对简单的空间的物体。例如人们曾经以为地球是平坦的,因为我 们相对于地^M艮小,这是一个可以理解的,支象。所以, 一个理想的数学上的J求 在足够小的区域也象一个线性的平面,这使它成为 一个局部线性的流形。在视觉对象识别中,通常一个对象的一组相关图像被^L为一个流形。这是 因为,同一个对象在不同距离、不同方向或不同姿态和光照强度下,能够形成 多种不同的图像。 一个对象所有图像的集合可以看做是以位置、尺度、姿态、 光照等为参数的一个高维空间流形,且这组图像因为都是关于同 一个对象的因 而具有较强的相关性。如果每一个像素均对应于空间中的一维,那么一幅图像 就可以看做高维图像抽象空间中的 一个点, 一个对象在不同方向上所有图像的
集合就是图像空间中的一个连续流形。因此,在本实施例中,可以以一组同一待识别视觉对象的相关图像构造待识别对象流形;而以可供用来识别的其他一组或多组已知视觉对象的相关图像构造一个或多个非线性的已知对象流形。需要说明的是, 一个流形可以以不同方式构造,如图集、贴补、函数的零 点集等,在应用时,本领域技术人员可根据需要选择合适的方法,本发明无须 对此作出限制。步骤102:将所述待识别对象流形和已知对象流形从高维降维到低维的子 空间;在视觉对象识别过程中,往往面临庞大的高维数据量。这些高维数据一方 面提供了有关描述对象的极其丰富、详细的信息,但另一方面,这些数据通常 包含许多冗余。在通常情况下,首先将数据的维数降低到一个合理的大小,同 时尽可能多的保留原始的信息,然后再对降维后的数据进行处理是一个行之有 效的方法。但要在保证数据信息足够完整的条件下合理地约简数据集,是一个 严峻的挑战。以往大多使用线性方法(如维数约简中的线性主成分分析(PCA) 等),通过特征的线性组合来降维,其本质是把数据投影到线性子空间,这种 方法相对筒单且容易计算。但是,由于视觉对象识别中的流形是非线性的,因 此线性方法不能有效地处理庞大的高维非线性流形的数据。局部线性嵌入法 (Locally Linear Embedding, LLE )是多种非线性降维方法中的一种,该方法 主要利用局部的线性来逼近全局的非线性,保持局部的几何结构不变,通过相 互重叠的局部邻域来提供整体的信息,从而保持整体的几何性质。LLE方法采 用由N个D维向量组成的矩阵XoxN作为输入,输出则是一个由N个d维向量 (cK〈D)组成的矩阵YdxN。矩阵Y的第k列对应的是矩阵X中的第k列。因为LLE算法能够计算出较好的低维线性子空间,本实施例使用此方法 将所述待识别对象流形和已知对象流形从高维降维到低维的子空间。当然,本 领域技术人员也可以采用其它的非线性降维方法如保距映射法、拉普拉斯特征 映射法等对高维流形进行降维,本发明无须对此作出限制。步骤103:提取所述待识别对象流形每一个子空间的特征数据,以及所述已知对象流形每一个子空间的特征数据;一个子空间的特征数据较好地反映了 一个子空间的特征,可以作为这个子 空间的代表性数据。本实施例通过计算每一个子空间的标准正交基的方式提取 所述待识别对象流形每一个子空间的特征数据和已知对象流形每一个子空间 的特征数据。当然,本领域技术人员也可以根据需要采用其它适用的方式。步骤104:计算所述待识别对象流形每一个子空间与已知对象流形每一个 子空间的距离;本实施例依据步骤103中得到的每一个子空间的标准正交基计算子空间 的距离。以待识别对象流形的一个子空间和一个已知对象流形的一个子空间为 例,4叚设待识别对象流形M,和已知对象流形M2的两个子空间分别为t/和r , 其中C/为9^中的m维子空间,r为f中的n维子空间,f/的标准正交基为 A,"2,...,^ , r的标准正交基为v,,v^...,、,则子空间和f之间的距离为它们的 标准正交基之间的距离,其计算方法为若已知对象流形为多个,可采用相同方法计算待识别对象流形和不同已知 对象流形子空间之间的距离。需要说明的是,本领域技术人员可采用其它方法计算子空间之间的距离, 如核方法,本发明无须对此作出限制。步骤105:依据所述待识别对象流形每一个子空间与已知对象流形每一个 子空间的距离,获得待识别对象流形和已知对象流形的距离;本步骤以d(C/p, ^ )表示由步骤104计算出的待识别对象流形的子空间与 已知对象流形m2的子空间的距离,其中和&分别是来自所述m,和m2两个 流型的第;?个和第《个子空间,应用豪斯多夫(Hausdorff)距离分析方法对流 型M^口M2进行距离计算。Hausdorff距离是一种定义于两个点集上的最大最小(max-min)距离,给定 有限的两个点集A和B, A和B之间的Hausdorff距离定义为
式中,<formula>formula see original document page 11</formula>h(A,B)称有向Hausdorff距离。如果/^,"=^,则每一个」中的点离5中 至少一个点的距离不大于A而且对于X中某些(至少一个)点来说,这个距 离恰好是d,这些点就是"最不匹配点"。所以Hausdorff距离表征了两个点集 之间的最不相似程度,把它作为相似性度量必须使它最小化。本实施例使用Hausdorff距离分析方法,以子空间距离取代点集距离,计 算所述M,和M2两个流型的距离,具体方法如下D(M, , M,) = max min 4"丄)待识别对象流形M,和其它已知对象流形M,的距离计算可依照上述方法进 行。其中,t的取值范围为从2到n+l, n为已知对象流形的个数。本领域技术人员也可根据其熟悉的其它方法计算流形之间的距离,本发明 无须对此作出限制。步骤106:判断所述待识别对象流形和已知对象流形的距离是否满足识别 条件,若是,则将满足条件的已知对象流形对应的对象确定为待识别视觉对象; 若否,则已知对象流形对应的对象不为待识别视觉对象。本实施例以流形之间的距离作为度量流形相似度的标准,两个流形之间距 离越小则相似度越高;反之,距离越大,相似度越低。当相似度满足一定的条 件,即流形之间的距离符合一定的识别条件时,则认为已知对象流形与待识别 对象流形相似,已知对象流形对应的对象为待识别视觉对象;若否,则已知对 象流形对应的对象不为待识别视觉对象。其中,识别条件可根据实际需要情况 由本领域技术人员合理设置,本发明无须对此作出限制。需要说明的是,本方法实施例为了简单描述,将其表述为一系列的动 作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序 的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其 次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实 施例,所涉及的动作和模块并不 一 定是本发明所必须的。
参考图2,示出了本发明的一种基于流形距离分析的视觉对象识别方法实施例2的步骤流程图,该实施例将本发明的视觉对象识别方法应用于CMU Mobo数据库进行人脸识别。CMU(Carnegie Mellon University)的MoBo( Motion of Body)数据库是CMU大学机器人研究所提供的用于人脸识别研究的数据 库,该数据库包含了 24个对象的96段一见频序列,每个视频序列包含300帧图 像。每个人脸图像的大小均为30x30。对于每个人脸对象,应用其中一个作为 检索对象,其他的所有数据作为测试数据。
本实施例具体可以包括以下步骤
步骤201:将与待识别人脸的有关的一组相关图像数据构造成一个非线性 的待识别人脸流形,其它每组相关人脸数据构造成多个非线性的已知人脸流 形;
步骤202:使用LLE方法将所述待识别人脸流形和已知人脸流形从高维降 维到低维的子空间;
步骤203:计算所述待识别人脸流形每一个子空间的标准正交基,以及所 述已知人脸流形每一个子空间的标准正交基;
本步骤通过计算每一个子空间的标准正交基提取它的特征数据。
步骤204:计算待识别人脸流形每一个子空间与已知人脸流形每一个子空 间的标准正交基之间的距离;
计算方法为<formula>formula see original document page 12</formula>
其中d(Up, Vq)表示待识别人脸流形的子空间与某个已知人脸流形的子空 间的距离,其中Up和Vq分别是来自所述待识别人脸流形和已知人脸流型的第p 个和第q个子空间,Up为W中的m维子空间,Vq为9^中的n维子空间,Up的 标准正交基为u1,u2,...,um , Vq的标准正交基为v1,V2,…,vn 。步骤205:依据所述待识别人脸流形每一个子空间与已知人脸流形每一个 子空间的距离,获得待识别人脸流形和已知人脸流形的Hausdorff距离;
应用Hausdorf距离分析方法,以子空间的距离取代点集距离,计算流型之间的Hausdorff距离,具体方法如下D(M"M,—max-min4"",K) , H2,…,n+1)其中,t的取值范围为从2到n+l, n为已知对象流形的个数。 步骤206:判断所述待识别人脸流形和已知人脸流形的Hausdorff距离是 否满足识别条件,若是,则将满足条件的已知人脸流形对应的人脸确定为待识 别人脸对象;若否,则已知人脸流形对应的人脸不为待识别人脸对象。本实施例应用于CMU MoBo数据库人脸识别试验的结果及与传统人脸识 别算法的比较如下表所示本发明的方法EigenfaceFisherface识别率89.3%80.5%86.7%可以看出,本实施例在人脸识别的平均识别率上,与传统方法相比,能取 得更好的效果。需要说明的是,本实施例描述的是实施例1的视觉对象识别方法在CMU MoBo数据库中的具体应用,因此描述较为筒略,相关部分参见实施例1即可。参考图3,示出了本发明的一种基于流形距离分析的视觉对象识别装置 实施例的结构框图,可以包括流形构造模块301,用于依据待识别视觉对象数据构造一个非线性的待识 别对象流形,以及,依据已知视觉对象数据构造一个或多个非线性的已知对象 流形;子空间构造模块302,用于将所述待识别对象流形和已知对象流形从高维 降维到^[氐维的子空间;优选的,本实施例通过应用局部线性嵌入方法对流形进行降维。 特征数据提取模块303,用于提取所述待识别对象流形每一个子空间的特 征数据,以及,所述已知对象流形每一个子空间的特征数据;优选的,所述每一个子空间的特征数据为每一个子空间的标准正交基。 距离计算模块304,用于计算所述待识别对象流形每一个子空间与已知对
象流形每一个子空间的距离,并获得所述待识别对象流形和已知对象流形的距离;优选的,所述待识别对象流形每一个子空间与已知对象流形每一个子空间 的距离为所述子空间的标准正交基之间的距离。优选的,所述待识别对象流形和已知对象流形的距离为基于子空间的距离 的豪斯多夫距离。识别条件判断模块305,用于判断所述待识别对象流形和已知对象流形的距离是否满足识别条件;对象识别模块306,用于如果识别条件判断模块的结果为是,则将所述已 知对象流形对应的对象确定为纟寺一见别纟见觉对象。优选的,距离计算模块304还可以进一步包括子空间距离计算子模块3041,用于计算所述待识别对象流形每一个子空 间与已知对象流形每一个子空间的距离;流形距离计算子模块3042,用于依据子空间距离计算子模块获得的子空 间距离,计算待识别对象流形和已知对象流形的距离。参考图4,示出了本发明应用图3所示的装置实施例进行视觉对象识别 的步骤流程图,具体可以包括以下步骤步骤401:流形构造模块依据待识别视觉对象数据构造一个非线性的待识 别对象流形,依据已知视觉对象数据构造一个或多个非线性的已知对象流形;流形构造模块依据不同对象的相关图像构造不同的流形。步骤402:子空间构造模块将所述待识别对象流形和已知对象流形从高维 降维到低维的子空间;本实施例中,子空间构造^t块应用局部线性嵌入方法对流形进^f亍降维,将 流形从高维降维到低维的子空间。本领域技术人员也可根据实际需要采用其它 的降维方法,本发明无须对此作出限制。步骤403:特征数据提取模块提取所述待识别对象流形每一个子空间的特 征数据,以及已知对象流形每一个子空间的特征数据;
本实施例的特征数据提取模块通过计算每一个子空间的标准正交基提取 子空间的特征数据,本领域技术人员也可根据情况使用其它方法提取子空间的 特征数据。步骤404:距离计算模块的子空间距离计算子模块计算所述待识别对象流 形每一个子空间与已知对象流形每一个子空间的距离;子空间距离计算子模块依据特征数据提取模块计算得到的子空间的标准 正交基计算所述待识别对象流形每一个子空间与已知对象流形每一个子空间 的的距离,并交给流形距离计算子模块处理,具体计算方式可以为其中,d(t/p,^)表示待识别对象流形的子空间与某一 已知对象流形的子空 间的距离,其中C/p和^;分别是来自所述待识别对象流形和已知对象流型的第p 个和第《个子空间, 为5^中的m维子空间,^为9^中的n维子空间,^的 标准正交基为"1,"2,…,"m ,^的标准正叉基为V"V2,…,V"。步骤405:距离计算模块的流形距离计算子模块依据子空间距离计算子模 块获得的子空间距离,计算待识别对象流形和已知对象流形的距离;本实施例中,流形距离计算子才莫块应用Hausdorf距离分析方法,以子空 间距离取代点集距离,计算流型之间的距离,具体方法如下其中,t的取值范围为从2到n+l, n为已知对象流形的个数,d(^,f;)为 子空间之间的距离。步骤406:识别条件判断^t块判断所述待识别对象流形和已知对象流形的 距离是否满足识别条件;识别条件判断模块判断流形距离计算子模块的计算结果D(M,,M,)是否满 足识别条件。步骤407:当识别条件判断模块的结果为是时,对象识别模块将满足条件 的已知对象流形对应的对象识别为待识别视觉对象;当识别条件判断;f莫块的结Z)(MpM,卜"力电,、),f(2,…,n. 果为否时,对象识别模块识别已知对象流形对应的对象不为待识别视觉对象。由于图4所示的实施例都可以对应适用于前述的;f见觉对象识别方法实 施例中,所以描述專交为简略,未详尽之处可以参见本说明书前面相应部分 的描述。以上对本发明所提供的一种基于流形距离分析的视觉对象识别方法和装 置进行了详细介绍,文中应用了具体个例对本发明的核心思想及实施方式进行 了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同 时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用 范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1、一种基于流形距离分析的视觉对象识别方法,其特征在于,包括以下步骤依据待识别视觉对象数据构造一个非线性的待识别对象流形,以及,依据已知视觉对象数据构造一个或多个非线性的已知对象流形;将所述待识别对象流形和已知对象流形从高维降维到低维的子空间;提取所述待识别对象流形每一个子空间的特征数据,以及,所述已知对象流形每一个子空间的特征数据;计算所述待识别对象流形每一个子空间与已知对象流形每一个子空间的距离,进而获得所述待识别对象流形和已知对象流形的距离;当所述待识别对象流形和已知对象流形的距离满足识别条件时,则将所述已知对象流形对应的对象确定为待视别视觉对象。
2、 根据权利要求1所述的方法,其特征在于,所述将流形从高维降维到 低维的子空间为通过应用局部线性嵌入方法进行降维。
3、 根据权利要求1或2所述的方法,其特征在于,所述每一个子空间的 特征数据为每一个子空间的标准正交基。
4、 根据权利要求3所述的方法,其特征在于,所述待识别对象流形每一 个子空间与已知对象流形每一个子空间的距离为所述子空间的标准正交基之 间的距离。
5、 根据权利要求4所述的方法,其特征在于,所述待识别对象流形和已 知对象流形的距离为基于子空间的距离的豪斯多夫距离。
6、 一种基于流形距离分析的视觉对象识别装置,其特征在于,包括 流形构造模块,用于依据待识别视觉对象数据构造一个非线性的待识别对象流形,以及,依据已知视觉对象数据构造一个或多个非线性的已知对象流形; 子空间构造模块,用于将所述待识别对象流形和已知对象流形从高维降维 到低维的子空间;特征数据提取模块,用于提取所述待识别对象流形每一个子空间的特征数 据,以及,所述已知对象流形每一个子空间的特征数据;距离计算模块,用于计算所述待识别对象流形每一个子空间与已知对象流 形每一个子空间的距离,进而获得所述待识别对象流形和已知对象流形的距离;识別条件判断模块,用于判断所述待识别对象流形和已知对象流形的距离是否满足识别条件;对象识别模块,用于当识别条件判断模块的结果为是时,则将所述已知对 象流形对应的对象确定为待视别视觉对象。
7、 根据权利要求6所述的装置,其特征在于,所述距离计算模块进一步 包括子空间距离计算子模块,用于计算所述待识别对象流形每一个子空间与已 知对象流形每一个子空间的距离;流形距离计算子模块,用于依据子空间距离计算子模块获得的子空间距 离,计算待识别对象流形和已知对象流形的距离。
8、 根据权利要求6或7所述的装置,其特征在于,所述将流形从高维降 维到低维的子空间为通过应用局部线性嵌入方法进行降维。
9、 根据权利要求6或7所述的装置,其特征在于,所述每一个子空间的 特征数据为每一个子空间的标准正交基。
10、 根据权利要求6或7所述的装置,其特征在于,所述待识别对象流形 每一个子空间与已知对象流形每一个子空间的距离为所述子空间的标准正交 基之间的距离。
11、 根据权利要求6或7所述的装置,其特征在于,所述待识别对象流形 和已知对象流形的距离为基于子空间的距离的豪斯多夫距离。
全文摘要
本发明提供了一种基于流形距离分析的视觉对象识别方法,包括依据待识别视觉对象数据构造待识别对象流形,依据已知视觉对象数据构造已知对象流形;将所述待识别对象流形和已知对象流形降维到子空间;提取待识别对象流形和已知对象流形每一个子空间的特征数据;计算子空间之间的距离,进而获得待识别对象流形和已知对象流形的距离;当所述待识别对象流形和已知对象流形的距离满足识别条件时,则将所述已知对象流形对应的对象确定为待识别视觉对象。本发明对待识别对象流形和已知对象流形的所有子空间的距离进行了比较分析,综合考虑了流形之间的整体位置关系,因此对噪声数据不敏感,有较好的视觉对象识别效果。
文档编号G06K9/00GK101393608SQ20081022552
公开日2009年3月25日 申请日期2008年11月4日 优先权日2008年11月4日
发明者戴琼海, 谢旭东, 跃 高 申请人:清华大学