一种结合视觉显著性与短语的图像检索方法
【技术领域】
[0001]本发明图像处理领域,具体涉及一种结合视觉显著性与短语的图像检索方法。
【背景技术】
[0002]随着计算机、网络以及多媒体技术的迅速发展和应用,数字图像的数量正以惊人的速度增长,如何快速高效地从海量数字图像集合中找到人们需要的图像成为一个亟待解决的问题。为此,图像检索技术应运而生并取得了很大的发展,从最早基于图像人工标注的检索,发展到现在基于图像内容的检索,图像检索的精度和效率也都有显著提高,但仍无法满足人们的需求。其问题的关键在于目前还没有一种方法能够使计算机完全像人一样的理解图像语义。如果能够进一步挖掘图像的真实含义,并在计算机中准确表达,势必会提升图像检索的效果。
【发明内容】
[0003]为解决上述问题,本发明提供了一种结合视觉显著性与短语的图像检索方法。
[0004]为实现上述目的,本发明采取的技术方案为:
[0005]一种结合视觉显著性与短语的图像检索方法,包括如下步骤:
[0006]S1、输入查询图像,将图像解码为YUV色彩空间,并通过对YUV色彩空间的像素进行K均值聚类从而将图像分割为若干超像素单元;
[0007]S2、对分割后图像的各个超像素单元进行测度计算,得到该查询图像不同参数的测度值,测度计算包括对颜色独立性测度、颜色空间分布测度、运动独立性测度以及运动空间分布测度的计算;
[0008]S3、将步骤S2所得各参数的测度线性归一化至[0,I]范围之内;对各个超像素单元进行四种测度的融合,得到超像素精度的显著性图;
[0009]S4、对步骤S3所得超像素精度的显著性图进行双边高斯滤波,得到像素精度的图像显著性图;
[0010]S5、根据最大类间方差法,对步骤S4所得的图像显著性图进行自适应阈值分割,得到具有突出显著的目标部分的二值图;
[0011]S6、利用SIFT算法从查询图库中不同类别的图像中提取SIFT特征点,将所有特征点向量集合到一块,利用K-Means聚类算法合并相似的SIFT特征点,构造一个包含若干个词汇的词典;
[0012]S7、提取图像显著性区域的视觉词,统计图像显著性图内视觉词的个数,构造视觉短语,生成图像的图像描述;
[0013]S8、计算查询图像与图库中每幅图像的图像相似度,根据相似度值对图库中的所有图像进行排序,并按要求返回相关图像作为查询结果。
[0014]其中,所述判断阈值的取值范围为0.15?0.35。
[0015]本发明具有以下有益效果:
[0016]能够更加准确地反映查询图像中的显著性区域,将视觉显著性与短语很好的结合起来,具有良好的检索效果。
【附图说明】
[0017]图1为本发明实施例一种结合视觉显著性与短语的图像检索方法的流程图。
【具体实施方式】
[0018]为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0019]如图1所示,本发明实施例提供了一种结合视觉显著性与短语的图像检索方法,包括如下步骤:
[0020]S1、输入查询图像,将图像解码为YUV色彩空间,并通过对YUV色彩空间的像素进行K均值聚类从而将查询图像分割为若干超像素单元;
[0021]S2、对分割后图像的各个超像素单元进行测度计算,得到该查询图像不同参数的测度值,测度计算包括对颜色独立性测度、颜色空间分布测度、运动独立性测度以及运动空间分布测度的计算;
[0022]S3、将步骤S2所得各参数的测度线性归一化至[0,I]范围之内;对各个超像素单元进行四种测度的融合,得到超像素精度的显著性图;
[0023]S4、对步骤S3所得超像素精度的显著性图进行双边高斯滤波,得到像素精度的图像显著性图;
[0024]S5、根据最大类间方差法,对步骤S4所得的图像显著性图进行自适应阈值分割,得到具有突出显著的目标部分的二值图;
[0025]S6、利用SIFT算法从查询图库中不同类别的图像中提取SIFT特征点,将所有特征点向量集合到一块,利用K-Means聚类算法合并相似的SIFT特征点,构造一个包含若干个词汇的词典;
[0026]S7、提取图像显著性区域的视觉词,统计图像显著性图内视觉词的个数,构造视觉短语,生成图像的图像描述;
[0027]S8、计算查询图像与图库中每幅图像的图像相似度,根据相似度值对图库中的所有图像进行排序,并按要求返回相关图像作为查询结果。
[0028]所述判断阈值的取值范围为0.15?0.35。
[0029]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种结合视觉显著性与短语的图像检索方法,其特征在于,包括如下步骤: 51、输入查询图像,将图像解码为YUV色彩空间,并通过对YUV色彩空间的像素进行K均值聚类从而将查询图像分割为若干超像素单元; 52、对分割后图像的各个超像素单元进行测度计算,得到该查询图像不同参数的测度值,测度计算包括对颜色独立性测度、颜色空间分布测度、运动独立性测度以及运动空间分布测度的计算; 53、将步骤S2所得各参数的测度线性归一化至[O,I]范围之内;对各个超像素单元进行四种测度的融合,得到超像素精度的显著性图; 54、对步骤S3所得超像素精度的显著性图进行双边高斯滤波,得到像素精度的图像显著性图; 55、根据最大类间方差法,对步骤S4所得的图像显著性图进行自适应阈值分割,得到具有突出显著的目标部分的二值图; 56、利用SIFT算法从查询图库中不同类别的图像中提取SIFT特征点,将所有特征点向量集合到一块,利用K-Means聚类算法合并相似的SIFT特征点,构造一个包含若干个词汇的词典; 57、提取图像显著性区域的视觉词,统计图像显著性图内视觉词的个数,构造视觉短语,生成图像的图像描述; 58、计算查询图像与图库中每幅图像的图像相似度,根据相似度值对图库中的所有图像进行排序,并按要求返回相关图像作为查询结果。
2.根据权利要求1所述的一种结合视觉显著性与短语的图像检索方法,其特征在于,所述判断阈值的取值范围为0.15?0.35。
【专利摘要】本发明公开了一种结合视觉显著性与短语的图像检索方法,包括如下步骤:输入查询图像,将图像解码为YUV色彩空间,并通过对YUV色彩空间的像素进行K均值聚类从而将图像分割为若干超像素单元;对分割后图像的各个超像素单元进行测度计算,并将所得四种测度进行融合,得到超像素精度的显著性图;进行双边高斯滤波,得到像素精度的图像显著性图;对图像显著性图进行自适应阈值分割,得到具有突出显著的目标部分的二值图;构建词典,提取图像显著性区域的视觉词,生成图像的图像描述;计算查询图像与图库中每幅图像的图像相似度。本发明能够更加准确地反映查询图像中的显著性区域,将视觉显著性与短语很好的结合起来,具有良好的检索效果。
【IPC分类】G06F17-30
【公开号】CN104794210
【申请号】CN201510202152
【发明人】乔小燕, 宫召华, 孔凡秋, 于永胜, 刘重阳
【申请人】山东工商学院
【公开日】2015年7月22日
【申请日】2015年4月23日