1.一种基于视觉词典的图像分类方法,其特征在于,包括:
视觉词典生成步骤,包括:从训练图像集中抽取局部特征点作为训练特征点,对所述训练特征点进行训练得到包括多个词典单词的视觉词典,每个所述词典单词与一个编码相关;
待分类特征点抽取步骤,包括:从待分类图像中抽取局部特征点作为待分类特征点;
待分类特征点编码步骤,包括:对每个待分类特征点,根据待分类特征点相邻的词典单词和其他的待分类特征点的约束确定所述待分类特征点的编码;
图像分类步骤,包括:根据待分类特征点的编码,对所述待分类图像进行分类。
2.根据权利要求1所述的基于视觉词典的图像分类方法,其特征在于,所述待分类特征点编码步骤,具体包括:
对每个待分类特征点,采用如下方式确定编码:
将进行编码的待分类特征点作为待编码特征点,其他待分类特征点作为邻近特征点;
根据待编码特征点与词典单词的距离,确定待编码特征点关于每个词典单词的权重系数;
根据待编码特征点与邻近特征点的距离、以及近邻特征点关于每个词典单词的权重系数,修正待编码特征点关于每个词典单词的权重系数;
采用修正后的待编码特征点关于每个词典单词的权重系数以及每个词典单词的编码确定待编码特征点的编码。
3.根据权利要求2所述的基于视觉词典的图像分类方法,其特征在于,邻近特征点与待编码特征点的距离越近,对所述待编码特征点关于每个词典单词的权重系数的修正影响越大。
4.根据权利要求3所述的基于视觉词典的图像分类方法,其特征在于,每个待分类特征点,采用如下公式确定编码:
其中dij=||xj-xi||2,X=[x1,x2,…,xN]∈RD×N为待分类特征点的集合,xi为第i个待分类特征点在视觉词典中的位置,B=[b1,b2,…,bK]∈RD×K为视觉词典,bi为第i个词典单词在视觉词典中的位置,Z∈RD×N为待分类特征点与词典单词的编码系数,λ1、λ2为标量的调整因子,dist(xi,B)为第i个待分类特征点到视觉词典中所有视觉单词的欧式距离,σ为调整系数。
5.根据权利要求4所述的基于视觉词典的图像分类方法,其特征在于,所述待分类特征点与词典单词的编码系数通过双重局部性约束线形编码算法求解得到。
6.一种基于视觉词典的图像分类系统,其特征在于,包括:
视觉词典生成模块,用于:从训练图像集中抽取局部特征点作为训练特征点,对所述训练特征点进行训练得到包括多个词典单词的视觉词典,每个所述词典单词与一个编码相关;
待分类特征点抽取模块,用于:从待分类图像中抽取局部特征点作为待分类特征点;
待分类特征点编码模块,用于:对每个待分类特征点,根据待分类特征点相邻的词典单词和其他的待分类特征点的约束确定所述待分类特征点的编码;
图像分类模块,用于:根据待分类特征点的编码,对所述待分类图像进行分类。
7.根据权利要求6所述的基于视觉词典的图像分类系统,其特征在于,所述待分类特征点编码模块,具体用于:
对每个待分类特征点,采用如下方式确定编码:
将进行编码的待分类特征点作为待编码特征点,其他待分类特征点作为邻近特征点;
根据待编码特征点与词典单词的距离,确定待编码特征点关于每个词典单词的权重系数;
根据待编码特征点与邻近特征点的距离、以及近邻特征点关于每个词典单词的权重系数,修正待编码特征点关于每个词典单词的权重系数;
采用修正后的待编码特征点关于每个词典单词的权重系数以及每个词典单词的编码确定待编码特征点的编码。
8.根据权利要求7所述的基于视觉词典的图像分类系统,其特征在于,邻近特征点与待编码特征点的距离越近,对所述待编码特征点关于每个词典单词的权重系数的修正影响越大。
9.根据权利要求8所述的基于视觉词典的图像分类系统,其特征在于,每个待分类特征点,采用如下公式确定编码:
其中dij=||xj-xi||2,X=[x1,x2,…,xN]∈RD×N为待分类特征点的集合,xi为第i个待分类特征点在视觉词典中的位置,B=[b1,b2,…,bK]∈RD×K为视觉词典,bi为第i个词典单词在视觉词典中的位置,Z∈RD×N为待分类特征点与词典单词的编码系数,λ1、λ2为标量的调整因子,dist(xi,B)为第i个待分类特征点到视觉词典中所有视觉单词的欧式距离,σ为调整系数。
10.根据权利要求9所述的基于视觉词典的图像分类系统,其特征在于,所述待分类特征点与词典单词的编码系数通过双重局部性约束线形编码算法求解得到。