一种基于语义特征提取与匹配的物体识别方法
【专利摘要】本发明提供了一种基于语义特征提取与匹配的物体识别方法,属于信息检索领域。本发明包括语义特征提取和语义特征匹配两部分,语义特征提取部分首先提取一类物体训练图片的SIFT特征点,通过k-均值聚类对SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点,最后利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,便最终提取出可描述一类物体语义特征的视觉词汇表;语义特征匹配部分首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述,然后利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类,最后统计待测物体的视觉词汇表直方图,确定待测物体类别。
【专利说明】一种基于语义特征提取与匹配的物体识别方法
【技术领域】
[0001]本发明属于信息检索领域,具体涉及一种基于语义特征提取与匹配的物体识别方法。
【背景技术】
[0002]物体识别的本质就是建立一个能够识别出图像中感兴趣物体类别的计算系统,在现实生活中有着广泛的应用需求,具有相当高的应用价值和研究意义。近年来,随着模式分类技术的不断成熟以及人工智能的持续发展,基于语义特征提取的物体识别技术逐渐被广大学者所青睐。物体的语义特征就是通过提取一类物体的局部特征,然后按照一定的处理准则将局部特征转化为描述一类物体的语义信息,形成一类物体的语义特征模型,实现可行有效的物体分类识别效果。
[0003]在目前的物体识别领域,Bag of Words算法是最具有代表性的物体识别算法之一。算法认为一幅图像由若干个具有语义信息的视觉单词组成。提取图片中的若干局部特征并将其转化为视觉单词,根据视觉单词与视觉词汇表的关系生成一幅图片的视觉单词直方图,视觉单词直方图表述一幅图片的特征,可以有效的实现物体的识别分类。
[0004]Bag of Words算法中视觉词汇表是将局部描述符进行k_均值聚类之后的聚类中心表示的。将一类物体所有图片的特征点聚类,聚类的个数就是视觉单词词汇表的词汇量,词汇表的视觉单词就是每类的聚类中心。但是,仅仅利用聚类中心单个特征点作为一类特征点的描述,没有充分利用局部特征,也没有充分利用经过聚类之后产生的语义信息。单个聚类中心丧失了大量语义信息,不适合作为一个有效的视觉单词。
【发明内容】
[0005]本发明的目的在于解决上述现有技术中存在的难题,提供了一种基于核函数决策的语义特征提取方法,在语义特征提取阶段,通过核函数决策,选取每个空间类别内的若干有效点作为视觉单词,提取出类别稳定且信息丰富语义特征信息。
[0006]本发明是通过以下技术方案实现的:
一种在物体识别过程中对物体语义特征提取与匹配的方法,其特征在于,所述方法包
括:
(I)语义特征提取部分:首先选取一类物体的若干图片作为训练库,提取所有图片的SIFT特征点;通过k-均值聚类算法对所有SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点;利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,便最终提取出可描述一类物体语义特征的视觉词汇表;选取多类物体的训练图片,提取每类物体的视觉词汇表,形成多类物体的视觉词汇表。
[0007](2)语义特征匹配部分:首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述;利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类;统计待测物体的视觉词汇表直方图,确定待测物体类别。
[0008]其中,所述语义特征提取部分包括以下步骤:
(1)选取一类物体的F幅训练图片,提取每幅图片的SIFT特征点;
(2)将该类物体的所有的特征点X聚类为个空间类别,提取各空间类别的聚类中心
(3)按照基于核函数的决策机制,对尤类中的每个特征点进行决策,得到每个特征点的决策值/(64 ;
(4)设置支持向量机类别训练数据标识。选取单个空间类别内的若干有效特征点为本类别训练点;选取所有其它空间类别的若干有效点作为其它类别的特征训练点;
(5)针对于(4)标识的训练数据,利用SVM分类器学习训练,训练得到一类物体的^个视觉单词,即该类物体的视觉词汇表;
(6)选取多类物体的训练图片,提取每个类别的视觉词汇表,形成多类物体的视觉词汇表。
[0009]所述步骤(3)的计算公式如下:
【权利要求】
1.一种基于语义特征提取与匹配的物体识别方法,其特征在于,所述方法包括: (1)语义特征提取部分:首先选取一类物体的若干图片作为训练库,提取所有图片的SIFT特征点;通过k-均值聚类算法对所有SIFT特征点进行空间聚类,然后利用基于核函数的决策机制,决策出每个空间类别内的若干有效点;利用支持向量机分类器训练每个空间类别内的有效点,每个空间类别训练出一个具有语义特征的视觉单词,最终提取出可描述一类物体语义特征的视觉词汇表;选取多类物体的训练图片,提取每类物体的视觉词汇表,形成多类物体的视觉词汇表; (2)语义特征匹配部分:首先提取一幅待测物体图片的SIFT特征点,作为待测物体的语义描述;利用支持向量机分类器,将待测物体的语义描述与多类物体的视觉词汇表匹配分类;统计待测物体的视觉词汇表直方图,确定待测物体类别。
2.根据权利要求1所述的方法,其特征在于,所述语义特征提取部分包括以下:(1)选取一类物体的幅训练图片,提取每幅图片的SIFT特征点; (2)将该类物体的所有的特征点Z聚类为K个空间类别,提取各空间类别的聚类中心 (3)按照基于核函数的决策机制,对类中的每个特征点进行决策,得到每个特征点的决策值/(^ ; (4)设置支持向量机类别训练数据标识Y,选取单个空间类别内的若干有效特征点为本类别训练点;选取所 有其它空间类别的若干有效点作为其它类别的特征训练点; (5)针对于(4)标识的训练数据,利用SVM分类器学习训练,训练得到一类物体的^个视觉单词,即该类物体的视觉词汇表; (6)选取多类物体的训练图片,提取每个类别的视觉词汇表,形成多类物体的视觉词汇表。
3.根据权利要求1所述的方法,其特征在于,所述语义特征匹配部分包括以下步骤: (1)针对于待识别物体图片,对其进行SIFT变换,检测局部特征点,提取该图片的《个SIFT描述符Z ; (2)将局部描述符与多类物体视觉词汇表匹配,统计每个描述符所对应的视觉单词vZ所在的物体类别; (3)统计《个测试描述符与每个物体类别的视觉词汇表的匹配个数,形成未知物体的视觉单词直方图,确定待测物体的类别。
4.根据权利要求2所述的方法,其特征在于,所述步骤(3)的计算公式如下:f(rO = ^j:KJD(x,n))
? Cf其中,D(XtFi)表示待测点;?与聚类中心η的欧氏距离。
5.根据权利要求2所述的方法,其特征在于,所述步骤(4)中类别标识为乃={+1-1},在训练一个视觉单词的过程中,设训练样本=1,2,...,《,则训练样本类别标识的确定方法为:
6.根据权利要求3所述的方法,其特征在于,所述步骤(2)的计算公式如下:
【文档编号】G06F17/30GK104008095SQ201210556032
【公开日】2014年8月27日 申请日期:2013年2月25日 优先权日:2013年2月25日
【发明者】艾浩军, 艾雄军, 艾晓敏 申请人:武汉三际物联网络科技有限公司