专利名称:用频域中的伽柏滤波器的纹理描述方法和基于纹理的图像检索方法
技术领域:
本发明涉及图像的纹理描述方法,并且更具体地,涉及一种用于将时间域的图像变换成频率域中的图像并通过伽柏(Gabor)滤波器提取纹理特征的纹理描述方法。并且,本发明涉及检索由该纹理描述方法索引的图像的基于纹理的方法。
背景技术:
很长时间来,已经研究了作为图像的重要视觉特征的指示的纹理信息及其应用。图像的纹理特征用做低层描述符,用于基于内容的索引及提炼图像或视频数据。而且,图像的纹理信息在检索数字相册的具体相片中、或在标题或纹理数据库中基于内容的检索中是很重要的。
目前,在时间域或频率域中计算特征值以提取图像的纹理特征。具体地,都知道频率域中的纹理特征提取的方法是适合于描述各种形式的图像的纹理特征的。
关于该方法的一篇论文,是B.S.Manjunath和W.Y.Ma发表在1996年8月的“IEEE图案分析和人工智能期刊(Transaction on Pattern Analysis andMachine Intelligence)”卷18第8册上的,题目为“浏览和检索图像数据的纹理特征(Texture Features of Browsing and Retrieval of imageData)”,其中描述了一种用于计算通过从在频率域中的伽柏滤波之后获得的图像中提取的特征矢量的方法,每一通道的均值和偏差值作为图像的纹理的特征值。
但是,使用传统的伽柏滤波的图像纹理描述方法存在问题。首先,它需要很长时间来执行信号域中图像的伽柏滤波的计算。其次,由于正交频率域的使用导致的伽柏滤波器在低频域中具有较窄的通频带,在使用这样的伽柏滤波器提取纹理信息时,图像的频率采样密度是很低的,所以很难获得足够的信息。第三,由于图像亮度值的均值和偏差值都被用做图像的纹理特征,所以描述特征所需的数据量是巨大的。
发明的公开为了解决上述问题,本发明的一个目的在于提供一种其中在频率域而不是信号域中使用伽柏滤波以便减少滤波计算时间的纹理描述方法和一种基于纹理的图像检索方法。
本发明的另一个目的在于提供一种纹理描述方法以及一种基于纹理的图像检索方法,使用频率域中的伽柏滤波器以通过增加频率的采样密度提取低频域中图像的足够的纹理信息,并通过降低高频域中频率的采样密度,通过使用极坐标系统执行伽柏滤波,而不管具有宽的通频带的伽柏滤波,来提取足够的纹理信息。
本发明的另一个目的在于提供一种频率域中的纹理描述方法和基于纹理的图像检索方法,用于使用图像的平均亮度值、图像的亮度值的偏差值、能量以及用于图像纹理特征描述符的能量的偏差值来提高检索率。
本发明的另一个目的在于提供,一种考虑了人类的视觉特征的、使用频率域中的伽柏滤波器的纹理描述方法和基于纹理的图像检索方法,通过设计将低频域的频率通带变窄以及当频率域变得更高时将高频域的频率通带变宽。这里,当设计伽柏滤波器时,应该考虑的是对图像的低频分量的改变敏感而对图像的高频分量的改变不敏感的人类视觉系统。
本发明的另一个目的在于提供一种纹理描述方法以及一种基于纹理的图像检索方法,使用频率域中的伽柏滤波器,通过伽柏滤波容易地检索少量改变的图像,从而如果图像被旋转、放大或缩小一小部分时不改变图像纹理描述符的值。
为实现本发明的上述目的,提供一种使用频率域中的伽柏滤波器的纹理描述方法,包括第一步骤,将时间域的图像变换成频率域的图像;第二步骤,使用具有N×M滤波器区的伽柏滤波器滤波所变换的频率域,其中N和M是预定的正整数;第三步骤,在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道中,提取伽柏滤波的图像的纹理特征值。
第四步骤,根据图像的纹理特征值确定图像的纹理描述符。
最好,在第一步骤中,时间域的图像被傅立叶变换成正交坐标系统频率域的图像,或者时间域的图像被进行拉东变换(Radon-transform),接着被一维傅立叶变换成极坐标系统频率域的图像。
而且,提供一种记录介质,其中存储有可被计算机读取的用于在频率域中使用伽柏滤波器执行纹理描述方法的程序。
而且,提供一种使用在频率域中的伽柏滤波器的基于纹理的图像检索方法,包括第一步骤,通过使用伽柏滤波器滤波数据图像来提取数据纹理描述符,并将提取的数据纹理描述符存储在数据库中;第二步骤,当使用伽柏滤波器输入查询图像时,提取和存储一查询图像的查询纹理描述符,即对图像的搜索;第三步骤,匹配数据纹理描述符和查询纹理描述符,并测量两个纹理描述符的距离;以及第四步骤,根据两个纹理描述符间的距离确定两个图像的相似性。
最好,在第一和第二步骤中,提取数据纹理描述符和查询纹理描述符的步骤包括第一子步骤,将视觉域的图像变换成频率域的图像;第二子步骤,使用具有N×M滤波器区域的伽柏滤波器滤波频率域的图像,其中N和M是预定的正整数;第三子步骤,提取在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道内伽柏滤波的图像的纹理特征值;以及第四子步骤,使用图像的纹理特征值描述图像纹理描述符。
并且,提供一种记录介质,其上记录有能被计算机读取的用于使用频率域中的伽柏滤波器执行基于纹理的图像检索方法的程序。
实施本发明的最佳方式此后,将参考附图详细描述根据本发明优选实施例的“使用频率域中的伽柏滤波器的纹理描述方法和基于纹理的图像检索方法”。
图1是说明根据本发明使用伽柏滤波器的频率域中的纹理描述方法的流程图。
纹理描述方法,一种用于通过处理输入图像产生纹理描述符的方法被用于基于纹理信息索引和基于纹理信息检索图像。即,当输入将被在数据库中索引和存储的图像时,根据图1的纹理描述方法产生数据纹理描述符,并且所产生的纹理描述符被存储在数据库中。并且,当输入查询图像时,根据图1的纹理描述方法产生查询图像的纹理描述符,并且通过将所产生的纹理描述符与存储在数据库中的数据图像进行比较执行检索。
参考图1,将更详细地描述根据本发明的纹理描述方法。
首先,输入指定的图像(S11),并且将输入图像傅立叶变换(S12)为正交坐标系统或极坐标系统频率域的图像。这里输入图像可以是如上所述的查询图像或数据图像。对输入图像进行二维傅立叶变换成正交坐标系统频率域中的数据。此外,对输入图像进行拉东变换,并接着对所变换的数据进行一维傅立叶变换成极坐标系统频率域中的数据。
下面描述将输入图像变换成极坐标系统频率域的处理。首先,对输入图像进行拉东变换,其中拉东变换是关于角度线性积分(1ine-integrating)二维图像或多维多媒体数据以获得一维投影数据的处理。即,对象的形状根据不同的视角而改变,并且从所有的角度看得见对象,这使得能够估计对象的轮廓。拉东变换使用这个原理。
用于变换二维图像的拉东变换公式由式1表示。Pθ(R)=∫L(R,θ)f(x,y)dl=∫-∞∞∫-∞∞f(x,y)δ(xcosθ+ysinθ-s)dxdy---(1)]]>这里f(x,y)是正交坐标系统时间域的图像函数,pθ(R)是通过关于与正x轴成θ角、并穿过正交坐标系统原点的轴的线性积分获得的第一投影函数。即,第一拉东变换函数。δ(x)是当x为0时变为1的函数。二维图像具有在正交坐标系统中-∞<x,y<∞的区域,以及拉东坐标系统的0<s<∞以及0<θ<π区域。当xcos0+ysin0=s时,δ(xcos0+ysin0-s)=1。
这样,通过从0度到180度旋转θ获得的第一拉东变换函数pθ(R)的交点(concurrence)被称作signogram。接着对signogram进行傅立叶变换以给出诸如式2所示的与在正交坐标系统时间域中的二维傅立叶变换后的图像函数f(x,y)的关系。P(ω,θ)=F(ωcosθ,ωsinθ)=F(ωx,ωy)|ωx=ωcosθ,ωy=ωsinθ---(2)]]>这里,P(ω,θ)是拉东变换函数pθ(R)的傅立叶变换函数。此外,ω是 ,并且θ是tan-1(ωy/ωx)。
根据中心分割理论(Central Slice theory),signogram的傅立叶变换是通过切除关于每一θ轴的二维原始图像的傅立叶变换函数获得的一维函数值。如果对该图像进行拉东变换并接着进行傅立叶变换,则该图像被变换成极坐标系统频率域中的图像。
下面,在步骤S13中,使用图2所述的频率域分区分布执行滤波以便提取各个通道的纹理描述符。在图3中,以更实用的形式描述了图2的频率域分区分布。可以理解在步骤S13中用于滤波的伽柏滤波器可以根据图3所说明的分割的特征通道来设计。即,在优选实施例中,使用根据被分成的角度方向的6个区域和径向的5个区域的5×6特征通道空间设计的伽柏滤波器执行伽柏滤波。这里,如图2所示的各个分割的频率域相应于特征通道。
伽柏滤波器的响应特征由式3表示以便说明如上所述设计的伽柏滤波器的操作。GPs,r(ω,θ)=As,rexp[-(ω-ωs)22σρs2]·exp[-(θ-θr)22σθr2]---(3)]]>这里,As,r是常数, 指示着相应于第s径向以及第r角度方向的特征通道的滤波器的响应特征,s指示在径向的作为{0,1,2,3,4}中的一个整数的位置,以及r指示在角度方向的作为{0,1,2,3,4,5}中的一个整数的位置。并且, 和 分别是s向中的ρ坐标以及r向中的θ坐标的特征通道的标准偏差值,并相应于径向和角度方向的特征通道的宽度。
在具有如优选实施例的5×6滤波器的伽柏滤波器中,在表1和2中,特征通道的示范标准偏差被制成表格。径向的伽柏滤波器变化值被制成表1,并且在角度方向的伽柏滤波器的变化值被制成表2。
表1 表2 下面,在步骤S15,在正交坐标系统频率域或在极坐标系统频率域中伽柏滤波的图像的纹理特征被提取。这里,根据图2中说明的人类视觉系统(HVS)分割正交坐标系统频率域或极坐标系统频率域,并且每一个分割的频率域被称为特征通道。特征通道由Ci指示,其中i=6×s+r+1,并且C0指示着DC特征通道。
极坐标系统频率域分区分布根据HVS分割频率域。伽柏滤波器的-3db的通带频率特征被设计放在频率域中以适应HVS。伽柏滤波器的频率域分区方法和设计原理类似地适用于正交坐标系统。即,HVS的特征是对低频分量敏感对高频分量不敏感的,并且使用这些特征决定频率分区的分布。此后,将更详细地描述这一点。
在本发明中,伽柏滤波后的频率域的能量平均值和能量变化值被用做图像的纹理特征。
图2说明了根据HVS用于提取能量的平均值的极坐标频率域分区分布。
如图2所示,极坐标频率域被在径向和角度方向进行分割。在径向上从原点开始以倍频程间隔对极坐标频率域进行分割,并且在角度方向中,θ被分割成180/P(这里,P是θ的分区分解力(division resolving power)。如果在极坐标频率分布中象这样分割极坐标频率域,以提取能量的平均值,则低频域被密密地分割,而高频域被稀疏地分割。分割的频率域是特征通道(Ci),并且阴影部分是特征通道5。
这里,能够看到本发明的重要特点。通过本发明的拉东变换使低频域被密密地分割,而高频域被稀疏地分割,并且当根据HVS分割他们时,低频域被密密地分割,而高频域被稀疏地分割。各个分割的频率域,即从各个通道提取的特征值准确地反映了纹理特征。
当获得各个通道的能量平均值和能量变化值时,在步骤S15中计算用于描述来自特征值的图像纹理的图像纹理描述符,即特征矢量。下面将描述用于获得能量平均值和能量变化值的方法。
纹理描述符如式4所示。
F=[fSTD,fDC,e(1),...,e(30),d(1),..,d(30)]…(4)这里,e(i)是图2的频率分布中的第i个伽柏滤波通道的能量平均值,并且d(i)是图2的频率分布中的第i个伽柏滤波通道的能量变化值。这里,特别地,fDC指示DC通道的能量,并且fSTD指示图像的所有像素值的变化。可以首先根据通道的优选顺序描述式4的各个特征值,并且根据通道的重要程度去除具有低重要性的通道的特征值,因此能够减小数据的总量。并且,纹理描述符特征矢量能够仅使用作为根据特征的重要性的特征值的各个通道的能量或使用能量和能量变化来形成。
形成描述的特征矢量的能量平均值(e(i))和能量变化值(d(i))由式6和8获得,并且在这样做的过程中,在式5的傅立叶变换之后使用伽柏滤波的函数(GPs,r(ω,θ)·P(ω,θ))获得值p(i)。如果将p(i)应用到式6,可以获得能量平均值。在式7中,使用傅立叶变换的第一拉东变换的函数和在式5中获得的p(i)获得值q(i)。如果将q(i)应用到式8,则能够得到能量变化值(d(i)。
e(i)=log[1+p(i)]…(6) d(i)=log[1+q(i)]…(8)在这种方法中,获得了由各个通道的能量平均值和能量变化值形成的纹理描述符。
对所有的输入图像重复执行步骤S11或S16,并且在数据库中存储各个数据纹理描述符。
存储在数据库中的纹理描述符被与从查询图像中获得的查询纹理描述符进行匹配,并被用于检索与查询图像相似的图像。此后,将描述根据本发明优选实施例的基于纹理的检索方法。
假设,使用数据纹理描述符(F)索引数据库。接下来,根据图1的其中描述了查询图像(q)的纹理描述方法提取查询纹理描述符(Fq)。并且通过在数据库中计算任意图像数据的纹理描述符(Fd)和查询纹理描述符(Fq)之间的相似性来测量一致性。
该相似性反比于通过式9获得的两个纹理描述符之间的距离(Dm)。d(q,d)=distance(Fq,Fd)=Σk|ω(k)(fq(k)-fd(k))α(k)|---(9)]]>这里,F={f(k),k=1,K}和ω(k)指示每一通道的加权系数。在这种方法中,通过将每一通道的平均值与变化值相比较,获得数据纹理描述符和查询纹理描述符之间的距离。
傅立叶变换所旋转的图像的结果与在旋转前傅立叶变换该图像期间在频率域旋转该图像的结果是相同的。因此,当比较两个图像并进行检索时,如果比较在频率域中的旋转期间的图像,则能够发现具有不同旋转角度的两个相似的图像。旋转的不变性如式10所示。
d(q,d,mφ)=distance(Fq(k)|mφ,Fd(k))…(10)这里,=30°。
在通过旋转频率域中的查询图像和比较查询图像与数据图像获得两个图像之间的距离之后,距离的最小值用于指示两个最终图像之间的非相似性的总量。这如式11所示。
d(q,d)=minimum of{d(q,d,mφ)|m=1至6}…(11)
并且,成比例的图像的傅立叶变换的结果与在频率域中原始图像的傅立叶变换的结果成比例。当比较两个图像时,如果比较在频率域中的图像的缩放(scaling)的图像时,则可以得到具有不同大小的两个相似图像。比例不变性如式12所示。
d(q,d,n)=distance(Fq(k)|n,Fd(k))…(12)这里,n是查询图像的比例变化的可能的数字。根据本发明的优选实施例,基于纹理的图像检索方法包括步骤在频率域中以预定比例缩放查询图像;对每个比例提取纹理描述符;计算数据图像的纹理描述符与这些纹理描述符之间的距离;以及获得作为两个图像之间的距离的最小距离。获得最小距离的步骤可以如式13所示。
d(q,d)=minimum of{d(q,d,n)|n=1至N}…(13)这里,N是成比例图像的实数。
尽管已经根据优选实施例描述了本发明,优选实施例仅用于说明本发明而不是限制本发明。显然本领域的那些技术人员在不背离本发明的精神和范围下能够进行各种改变、修改或控制。因此,将仅通过所附的权利要求来限定本发明,而且必须理解上述的改变、修改或控制的例子是包含在本发明中的。
工业上的可应用性根据本发明,不仅能够更准确地描述图像的纹理,而且使用频率域中的伽柏滤波器、适于提取各个特征值的极坐标系统频率域分区分布、用于提取各个频率域中的特征值的方法、以及用于给予各个频率通道重要性和优先顺序的技术,使有效地索引和检索成为可能。
当在用于军事目的的雷达图像和巨大的空中摄影中搜索一个具有特定特征的图像时,通过纹理描述方法提取的图像纹理描述符对图像检索是很有用的。
权利要求
1.一种使用频率域中的伽柏滤波器描述图像的纹理信息的纹理描述方法,包括第一步骤,转换图像,其中将时间域的图像变换成频率域的图像;第二步骤,使用具有N×M滤波器区的伽柏滤波器滤波所变换的频率域的图像,其中N和M是预定的正整数;第三步骤,在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道中,提取伽柏滤波器图像的特征值;第四步骤,使用图像的纹理特征值描述图像纹理描述符。
2.如权利要求1的方法,其中第一步骤中,时间域的图像被二维傅立叶变换成正交坐标系统频率域的图像。
3.如权利要求1的方法,其中第一步骤中,时间域的图像被拉东变换(Radon-transform),并且被一维傅立叶变换成极坐标系统频率域的图像。
4.如权利要求1至3的方法,其中第三步骤的频率域分区分布是根据人类视觉系统(HVS)产生的。
5.如权利要求4的方法,其中通过以倍频程间隔在径向上从原点开始对频率域进行分割来产生频率域分区频率分布,并且在角度方向以“180/分区分解力”间隔来分割频率域。
6.如权利要求4的方法,其中对频率域分区分布的各个通道给予重要性或优先顺序。
7.如权利要求4的方法,其中,在第三步骤中,在频率域分区分布的各个通道中的能量平均值和能量变化值中的一个被提取作为特征值。
8.如权利要求7的方法,其中,纹理描述符包括从各个通道获得的DC通道的能量、图像的所有像素值的变化、能量平均值和/或从各个通道获得的能量变化值。
9.一种能够被计算机读取的记录介质,其中记录了用于执行下列步骤的程序第一步骤,转换图像,其中将时间域的图像变换成频率域的图像;第二步骤,使用具有N×M滤波器区的伽柏滤波器滤波频率域,其中N和M分别是预定的正整数;第三步骤,提取在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道中伽柏滤波的图像的纹理特征值;第四步骤,使用图像的纹理特征值描述图像纹理描述符。
10.一种使用在频率域中的伽柏滤波器的基于纹理的图像检索方法,用于基于纹理地检索与查询图像相似的数据图像,包括第一步骤,通过使用伽柏滤波器滤波数据图像来提取数据纹理描述符,并将提取的数据纹理描述符存储在数据库中;第二步骤,当输入查询图像时,使用伽柏滤波器提取查询图像的查询纹理描述符并存储所提取的查询纹理描述符;第三步骤,匹配数据纹理描述符和查询纹理描述符,并测量两个纹理描述符间的距离;以及第四步骤,根据两个纹理描述符间的距离确定两个图像的相似性。
11.如权利要求10的方法,其中在第一和第二步骤中,提取数据纹理描述符和查询纹理描述符的步骤包括第一子步骤,将时间域的图像变换成频率域的图像;第二子步骤,使用具有N×M滤波器区的伽柏滤波器滤波频率域的图像,其中N和M分别是预定的正整数;第三子步骤,提取在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道内伽柏滤波的图像的纹理特征值;以及第四子步骤,使用图像的纹理特征描述图像纹理描述符。
12.如权利要求11的方法,其中,在第一子步骤中,时间域的图像被二维傅立叶变换成正交坐标系统频率域的图像。
13.如权利要求11的方法,其中,在第一子步骤中,时间域的图像被拉东变换,并且接着被一维傅立叶变换成极坐标系统频率域的图像。
14.如权利要求11至13的方法,其中第三子步骤的频率域分区分布是根据人类视觉系统(HVS)产生的。
15.如权利要求14的方法,其中通过以倍频程间隔在径向上从原点开始对频率域进行分割来产生频率域分区频率分布,并且在角度方向以“180/分区分解力”间隔来分割频率域。
16.如权利要求14的方法,其中对频率域分区分布的各个通道给予重要性或优先顺序。
17.如权利要求14的方法,其中,在第三子步骤中,在频率域分区分布的各个通道中的能量平均值和能量变化值中的至少一个值被提取作为特征值。
18.如权利要求17的方法,其中,纹理描述符包括从各个通道获得的DC通道的能量、图像的所有像素值的变化、能量平均值和/或从各个通道获得的能量变化值。
19.如权利要求17的方法,其中,在第三子步骤中,通过分别比较从各个通道提取的特征值来测量两个纹理描述符间的距离。
20.如权利要求19的方法,其中通过在频率域中以预定角度旋转查询图像来测量查询图像和数据图像间的距离,并且最小距离被确定为两个图像间的距离。
21.如权利要求19的方法,其中通过在频率域中大小变换(size-transform)查询图像来测量查询图像和数据图像间的距离,并且最小距离被确定为两个图像间的距离。
22.一种能够被计算机读取的记录介质,其中记录了用于执行下列步骤的程序第一步骤,通过使用伽柏滤波器滤波数据图像来提取数据纹理描述符,并将提取的数据纹理描述符存储在数据库中;第二步骤,当输入查询图像时,通过将查询图像转换成频率域的图像来提取特征值,并伽柏滤波该变换的图像,并接着决定所提取的特征值为查询纹理描述符;第三步骤,匹配数据纹理描述符和查询纹理描述符,并测量两个纹理描述符间的距离;以及第四步骤,根据两个纹理描述符间的距离确定两个图像的相似性。
全文摘要
提供一种用于通过将输入图像变换和伽柏滤波成频率域的图像来提取纹理特征的频率域中的纹理描述方法,以及纹理描述方法的一种基于纹理的检索方法。频率域中的纹理描述方法包括:第一步骤,将时间域的图像变换成频率域的图像;第二步骤,使用具有N×M滤波器区的伽柏滤波器滤波所变换的图像,其中N和M分别是预定正整数;第三步骤,在相应于伽柏滤波器的N×M滤波器区的频率域分区分布的各个通道中,提取已经伽柏滤波的图像的特征值以及第四步骤,根据图像的特征值决定图像的纹理描述符。
文档编号G06T7/00GK1342300SQ00804430
公开日2002年3月27日 申请日期2000年11月30日 优先权日1999年12月3日
发明者金纹哲, 金镇雄, B·S·曼朱纳思, 卢勇满, 申铉枓, 崔良林 申请人:三星电子株式会社, 韩国电子通信研究院, 现代电子产业株式会社, 海因里希-赫兹-学院, 加利福尼亚大学董事会, 学校法人韩国情报通信学园