专利名称:水印数据的嵌入和提取的制作方法
技术领域:
本发明涉及一种从主信号中提取数据的方法和设备。本发明也涉及一种向主信号中嵌入数据的方法和设备,并涉及一种具有嵌入的数据的信号。
背景技术:
盲水印添加(Blind watermarking)是在多媒体主信号中嵌入消息、并在不对原始的非加水印的主信号进行访问的情况下对所述消息解码的技术。在2001年5月、于IEEE Transactions on Information Theory的第47卷、第4号中公开的、由B.Chen和G.W.Wornell撰写的“Quantization Index ModulationA Class of Provably GoodMethods for Digital Watermarking and Information Embedding”中公开了这样一个水印添加方案的范例。已知的水印添加方案是基于量化的水印添加方案。使用量化步长、通过对主信号的量化来将消息嵌入主信号中,所述量化步长将输入采样映射为一个输出采样,该输出采样唯一地标识被嵌入该输出采样中的消息符号。
已经在文献中知道,盲水印添加同样抵抗加性高斯白噪声(AWGN)攻击,就好像解码器可访问原始主信号一样。然而,在实际的水印添加应用中,攻击并不只限于AWGN攻击。一个格外让人注意的攻击类别是振幅修改。这类攻击包括对加水印的信号进行缩放,例如降低图像数据的对比度,或者添加恒定的DC值。与通常被认为是经受得住这样的攻击而没有显著损失的扩展频谱水印添加方案不同,基于量化的水印添加方案易于受到振幅修改的攻击。这一问题在还使用抖动(dither)的基于量化的水印添加方案中格外显著。抖动是对加水印的信号的不同采样分配不同的偏移量,以避免通过简单地观察加水印的信号的结构就能够检测出嵌入数据的过程。抖动值的数列(“抖动向量”)是为接收器所知的保密密钥。在未获知抖动向量的情况下,不可能以可靠的方式提取出该消息。
发明目的和概要本发明的一个目的是提供一种方法和设备,其即使在加水印的信号的振幅已经被修改的情况下,也能够提取数据。
按照本发明,这是通过根据所选取的具有预定范围的抖动值的信号采样的直方图来计算所接收的媒体信号的量化器步长来实现的。本发明利用了这一知识在振幅缩放攻击的情况下,由水印嵌入算法使用的量化器步长已由同一因子缩放。本发明实现的是能够按照由解码器计算的步长相对嵌入器使用的步长的比率,来计算(或者至少是估计)振幅缩放因子。这允许所接收的水印信号被重新缩放,并且允许由常规解码器从所述重新缩放的信号中提取嵌入的消息。解码器的一个实施例是基于计算出的量化器步长来提取嵌入的消息,即使原始的量化器步长(以及由此的缩放因子)是未知的。
在最佳实施例中,所选择的信号采样是已经嵌入了预定数据符号的预定信号采样。这一实施例要求已经在其中嵌入了预定数据符号的采样的知识。为此目的,根据本发明的嵌入器在主信号的预定采样中嵌入所述预定数据符号。
附图的简短说明
图1示出包括数据嵌入器、信道和数据检测器的系统,图2和3示出用于举例说明使用了抖动量化索引调制的概念的数据嵌入的图表,图4和5分别示出数据嵌入器和提取器的示意图,图6、7A和7B示出用于举例说明数据提取的图表,图8示出用于举例说明图1所示系统中的数据提取的图表,图9示出用于举例说明根据本发明的数据提取器的一个实施例的操作的图表,图10示出用于举例说明根据本发明的数据提取器的进一步实施例的操作的图表,图11示出包括根据本发明的数据嵌入器和数据解码器的系统的示意图,图12示出包括根据本发明的数据嵌入器以及数据解码器的进一步的实施例的系统的示意图,
图13示出用于举例说明图11和12中所示的直方图分析电路的一个实施例说明我们将数字水印添加作为通信问题来考虑。水印消息被编码为水印字母或符号dn的序列。所述元素dn属于一个大小为D的D元字母表{0,1,...,D-1}。在许多实际情况中,将使用二元的水印符号(D=2)。
图1示出一个包括水印嵌入器(或者编码器)71和检测器(或者解码器)73的系统的一般示意图。水印编码器根据编码的水印消息d和主数据x而导出适当的水印序列w,该水印序列w被添加给所述主数据,以便产生加水印的数据s。选择水印w,以便使x和s之间的失真是可以忽略的。解码器73必须能够从接收的数据r中检测出该水印消息。图1示出“盲”水印添加方案。这意味着解码器73不可获得主数据x。由水印编码器和解码器使用的密码本被根据安全密钥k而随机化,以便实现水印通信的保密。信号x、w、s、r和k是具有等同长度的向量。图1中的索引n指的是它们的相应的第n个元素(或者采样)。
在实践中,加水印的信号已经经受了信号处理,已经经由通信信道传递,和/或它已经是攻击的主题。这在图1中被表示为嵌入器71和检测器73之间的攻击信道72。攻击使用因子g(通常g<1)来缩放加水印的信号s的振幅,并且添加噪声v。该信道可能还在受攻击信号r中引入了额外的偏移量roffset。接收器能够通过将受攻击信号r除以g以产生s+v/g,,来对缩放进行补偿。因此,水印编码器71和检测器73的设计能够被转化为仅仅需要抵抗噪声的系统的设计,条件是缩放因子g为接收器所知。
通常,水印编码器71和解码器72涉及两端均可获得的随机密码本。在编码器71中,密码本将输入采样xn映射到输出采样sn,输出采样值取决于消息符号dn和密钥kn。解码器73使用同一密码本来根据采样sn重建消息符号dn。该系统的次佳、但是更实际的形式是基于抖动的均匀标量量化(uniform scalar quantization),正如将在下文中说明的。
在标量量化的最简单的形式中,通过将信号采样xn(所有采样或者选取的多个采样)量化为多组离散电平中的被选取的一组,而将消息数据嵌入媒体信号中,所选择的组是由待嵌入的数据符号所确定的。在图2中图示出了这种最简单形式的水印嵌入。在该图中,可以假定左边纵轴表示媒体信号x的信号采样xn的一系列的值。待嵌入该媒体信号中的消息被编码为数据元素dn的序列,所述数据元素dn属于D元字母表D∈{0,1,..D-1}。在图2中,作为一般范例,举例说明了三元字母表(D=3)。在实际的系统中,往往使用D=2。信号媒体采样xn(其中的一个是由图中左边纵轴上的符号X标明)被舍入(round)为最接近的(Dm+dn)×δ的倍数,其中δ是给定的量化步,而m=...,-2,-1,0,1,2,...。商数xn/δ,也就是通常所说的量化索引,被使用待嵌入的数据调制。一种公知的数据嵌入技术—低比特调制是一个特殊的例子。低比特调制器简单地将数字信号采样xn的最低有效位替换为数据比特dn。
可以通过观察离散信号值sn,而容易地检测出加水印的信号中容纳的数据。在低比特调制方案中,甚至观察sn的最低有效位便足够了。如果它是0,则dn=0。如果它是“1”,则dn=1。为了提供消息的安全传输,不同的偏移量被分配给不同的输出信号采样sn。这被称为抖动。在图2中,偏移量被表示为vnδ,其中vn是乘法因子。被用于在信号采样xn序列中嵌入数据的抖动值vn的集合构成一个安全抖动向量,在下文中也被称为保密密钥。在没有该密钥的知识的情况下,在采样sn中看不到任何结构,并且不可能检测出该数据消息。
抖动的均匀标量量化嵌入过程的数学表达式可以如下导出。输出信号sn可以被写作sn=(Dm+dn)×δ+vnδ(1)该值sn必须尽可能接近输入值xn,其可以表示为xn≅sn]]>xn≅(Dm+dn)×δ+vnδ]]>m≅xn-(dn+vn)×δDδ]]>如果m=round{xn-(dn+vn)×δDδ}---(2)]]>则满足这一条件。
将(2)代入(1)得到
sn=Dδ×round{xn-(dn+vn)×δDδ}+(dn+vn)×δ---(3)]]>可以通过引入Δ=Dδ和kn=vnD]]>获取替代的表达式,并且通过运算符QΔ{·}表示操作Δ×round{•Δ}.]]>后一运算符表示使用步长Δ的常规标量均匀量化,这一实际的嵌入方案由此得名。数据嵌入过程现在可以表示为sn=QΔ{xn-Δ(dnD+kn)}+Δ(dnD+kn)---(4)]]>数据嵌入过程甚至可以被进一步归纳。将xn投影到sn轴的离散点上并不是必需的。如在图3中已经示出的,数据符号dn同样可以由值sn的不同范围表示。可以由该图容易地导出,输出信号sn现在可以被描述为sn=xn+α(zn-xn)其中zn表示根据上面等式(4)定义的离散点。因此sn=xn+α×(QΔ{xn-Δ(dnD+kn)}+Δ(dnD+kn)-xn)---(5)]]>图4示出根据等式(5)的嵌入器71的示意图。此处,附图标记30表示具有步长Δ=Dδ的标量均匀量化器。
图5示出用于从信号采样sn中提取数据消息比特dn的检测器73的示意图。在该图中,附图标记40表示与图4中的量化器30一样的具有步长Δ的标量均匀量化器。该检测器根据下列数学运算而生成中间信号ynyn=QΔ{sn-knΔ}-(sn-knΔ)(6)正如图6所示出的,这一运算令采样sn被移转到范围-Δ2<yn<+Δ2]]>图7A示出以D=3的传输符号dn为条件的中间信号采样yn的概率密度函数(PDF)。更具体来讲,实线60表示以加水即的符号dn=0为条件的加水印的元素的PDF p(yn|dn=0),虚线61表示p(yn|dn=1),而点-虚线62表示p(yn|dn=2)。为了比较和完整性,图7B示出D=2的yn的PDF,其更可能被用于实际系统中。此处,数字60和61分别表示dn=0和dn=1时的PDF。
图7A和7B示出可以容易地通过适当的限幅和解码电路、来根据yn重构数据符号dn。后一电路在图5中被表示为41。对于D=3,这一电路校验yn是否充分地接近于0,+Δ/3或者-Δ/3(参见图7A)。对于D=2,它校验yn是否充分地接近于0,或者±Δ/2(参见图7B)。
应被注意的是,图4和5中所示的嵌入器和检测器的示意图分别是数学等式(5)和(6)的物理实现。其他的实际实施例也是可能的。例如,检测器可以被设计来实现下列等式d=mod(round{sn-vnδδ},D)---(7)]]>如果考虑到,m=round{sn-vnδδ}]]>是步长δ满足sn-vnδ(参见图1)以及dn=mod(m,D)的次数、,则可以理解等式(7)。
在任何情况下,可靠的检测均要求除安全密钥kn(或者vn)之外,步长Δ(或者δ)也是已知的。然而,如图1中已经示出的那样,可能已经对加水印的信号施加了攻击72。图8示出了在具有加性高斯白噪声(AWGN)v和缩放因子g的攻击的情况中,检测器的中间信号yn对于D=2的PDF(见等式7)。按照与图7B中类似的方式,实线80表示条件为加水印的符号dn=0的PDF p(yn|dn=0),并且虚线81表示条件为加水印的符号dn=1时的p(yn|dn=1)。阴影区域89表示错误概率(在dn=0被嵌入时检测到dn=1)。已经选择了嵌入器系统的参数α和Δ,以致实现对于噪声v的给定噪声方差σv2的期望错误概率。发明人已经发现由下式给出了良好的近似Δopt=12(σw2+2.71σv2)]]>和αopt=σw2σw2+2.71σv2]]>其中σw2表示嵌入失真。
这里应重新回顾一下,中间信号yn的产生要求量化器步长和安全密钥kn的知识。由于通过因子g缩放而导致的、现在是Δr=gΔ的受攻击信号r的量化器步长不得不根据所接收的数据r来估计。注意,当Δ是已知的时候,估计Δr相当于估计g。这里,采用了更一般的观点,并且考虑Δr的估计。
Δr的估计(以及偏移量roffset的估计,如果有的话)可以通过分析接收的采样rn的直方图来获取。然而,如在前面提及的,已经施加了抖动,来避免通过简单地观察信号采样就能够容易地检测出嵌入数据。由于该抖动,所以在接收的采样中没有结构。接收的采样的直方图在实践中大体上是连续的图形。图9以举例的方式示出了这样一种直方图90。
重新回顾一下,已经通过对采样sn分配偏移量knΔ(或者vnδ)而创建了抖动。由于通过因子g进行了缩放,所以已接收采样rn的偏移量是knΔr(或者vnδr)。这些偏移量在接收器端是未知的,因为g是未知的。然而密钥kn是已知的。因此,根据本发明的一个方面,直方图仅仅是根据这样一些采样导出的,即所述采样具有分配给其的给出的预定密钥值kn。图9中的附图标记91是采样的直方图的范例,其中kn=0。直方图的局部极大值之间的相对距离是步长δr=Δr/D。该图还图示出了分别具有嵌入的数据符号d=0和d=1的采样的各直方图92和93,它们合起来构成直方图(这里假定D=2;与信号采样r相关联的数据符号d被显示在图9的顶部)。直方图的“脉冲宽度”取决于嵌入器的参数α(其在输出值范围内散布一个输入值)和攻击信道的噪声方差σv2。
仅仅根据那些具有分配给其的给出预定密钥kn的采样来创建统计上可靠的直方图,会要求收集大量的具有该密钥的采样。这可能花费太长时间。这一缺点在一个实施例中得到缓和,在该实施例中,为具有在以下范围内的密钥kn的信号采样创建了一个或多个直方图mM≤kn<m+1M,]]>对于m∈{0,1,...,M-1}并且M>1(8)由此获得的该直方图(或者多个直方图)将表现出带有相对距离δr的更宽的峰值。此外,因为偏移量范围是正的,所以峰值右移。
在进一步的实施例中,直方图是根据具有嵌入其中的预定数据符号dn的采样rn而创建的。这样一种实施例有下列好处,即峰值将具有更大的相对距离Δr(是前一实施例的距离δr的D倍),并且具有更大的最大值-最小值比。这一实施例允许更精确地计算步长Δr。为了使得有可能让接收器能够选择具有预定数据符号的采样,嵌入器被设置为在信号中嵌入所述数据符号的“引导”序列。该预定的引导符号(进一步被称为dpllot)是可用数据符号{0,1,..D-1}中的一个,例如dpilot=0。类似于常规信号采样那样去抖动该引导序列,并由此而安全地嵌入该引导序列。在没有获知该安全密钥k的情况下,加水印的信号中的任何结构均不可见。
能够在该信号中容纳该引导序列,尤其是通过在输入信号的每第k个采样中嵌入引导符号dpilot来进行,或者通过(优选的是,重复地)在被嵌入的消息中插入定长的引导符号系列来进行。与本发明有关的仅仅是接收器知道采样rn具有嵌入的引导符号。就涉及到直方图分析而言,在下文中仅仅考虑具有嵌入的引导符号的采样rn。
再一次,直方图是根据那些具有给出的预定密钥值kn(例如,kn=0)或者密钥值的预定范围的采样生成的,正如由等式(8)所定义的。图10示出对于D=2、dpilot=0、以及范围索引m=0(即,0≤kn<0.33)的引导序列的直方图100。现在,峰值具有相对距离Δr。注意,局部极大值与图9中的直方图91相比右移了,因为已经考虑到正偏移量knΔr的范围。必定已经以偏移量rOffSet的形式、由攻击信道引入了可能不同的位移。因此也能根据直方图100计算所述偏移量。
直方图100是根据引导采样的三分之一(M=3)导出的。可以对于m=1(0.33≤kn<0.67)和m=2(0.67≤kn<1)导出类似的直方图,以便为该直方图分析考虑该引导序列的所有采样。它们在图10中被表示为101和102。注意,直方图100、101和102的总和是引导序列中的所有采样的直方图,而与它们的密钥值kn无关。这一总的直方图在图10中被表示为103。
图11示出一个包括根据如上所述实施例的嵌入器和接收器的系统的图表。完全相同的附图标记被用于表示与图1中相同的元件和功能。现在接收器包括直方图分析电路74,其接收信号采样rn,并且计算偏移量roffset(如果有的话)和步长Δr。偏移量roffset对所有采样都是相同的,并且被减法器75从采样中减去。计算出的步长Δr被直接应用于检测器73,检测器73根据等式(6)和(7)以及图5来重构该嵌入的数据符号dn。检测器73中的符号Δr表示等式(6)和(7)以及图5中的步长Δ要被Δr代替。
如果使用了引导序列,则选择信号S被施加给直方图分析电路,以便识别具有嵌入的引导符号dpilot的信号采样rn。在发送端,由同一选择信号S控制的开关76被用于将消息符号m或者引导符号dpilot施加于嵌入器71。
图12中所示系统包括接收器的另一实施例。在这一实施例中,加水印的信号通过与g-1=Δ/Δr相乘而在相乘级76被重新缩放,其中Δ是由检测器73采用的步长。此实施例的优越性在于能够为所有的振幅缩放因子g使用相同的检测器73。步长Δ不一定是嵌入器所使用的原始的步长。
现在将说明直方图分析电路的实际实施例,以应用在使用引导序列的实施例中。它可以是以硬件或者软件实现的。首先,采样值rmin≤rn≤rmax的整个范围被划分为Lbin个仓(bin)。对于每一个仓,计算直方图pr,m(b),其中b∈{0,1,...,Lbin-1}是仓索引,并且m∈{0,1,...,M-1}指示密钥值kn的考虑范围。对于M=3,这将为每一个仓产生3个“条件”直方图,它们类似于图10中所示的直方图100、101和102。对于每一个仓,还计算了“总的”直方图pr(b)(参见图10中的103)。空的仓和仅仅包含几个采样的仓被分配一个均匀的非零直方图。随后所述条件直方图pr,m(b)被归一化,并且根据下式计算每一个归一化直方图的离散傅里叶频谱Am(f)Am(f)=DFT{pr,m(b)pr(b)-1}]]>对于高斯分布的rn、并且也对于其他的典型信号分布,空的以及几乎空的仓主要发生在直方图的尾部。因此,使用对尾部给出不同权重的窗口函数W(b)对该归一化的直方图进行加权也是很有用处的。在那种情况下,傅里叶频谱是根据下式计算的Am(f)=DFT{pr,m(b)-pr(b)pr(b)W(b)}]]>可以以雅洁(elegant)的方式组合所有的M个频谱,因为众所周知,不同的条件直方图中的极大值彼此移位了Δr/M。这个移位对应于傅里叶域中乘以 以便能够按照下式得到整体频谱A(f)=Σm=0M-1Am(f)e-j2πMm]]>图13示出使用1024长度的离散傅里叶变换的频谱的模|A(f)|的示例。f0处的主导峰值清楚可见。步长Δr是根据下式得出的Δr=LDFTf0rmax-rminLbin]]>其中LDFT是离散傅里叶变换的长度。偏移量roffset能够根据复数傅里叶频谱的幅角arg{A(f0)}得到。
所公开的是一种方法和设备,用于使用抖动量化索引调制(71)在主信号(xn)中嵌入数据(dn),并从加水印的信号中提取所述数据。这种嵌入方案(71)的问题是加水印的信号(sn)的振幅可能已经被无意地(由通信信道)或者有意地(由黑客)缩放(72)过。这使得接收信号(rn)的量化步长(Δr)对于提取器(73)将是未知的,而所述量化步长对于可靠的数据提取是必要的。本发明提供了制作那些基本上具有相同抖动量的信号采样的直方图(74),并且分析所述直方图,以便从其中导出步长(Δr)的估计。在一个最佳实施例中,在主信号的选取(S)采样中嵌入(76)预定数据符号(dpilot)的引导序列。
权利要求
1.一种从媒体信号(rn)中提取数据符号(dn)的方法,通过使用量化步长(δ)量化主信号(xn)和根据抖动向量(kn)抖动所述量化的信号(sn)而将所述数据符号嵌入到所述媒体信号中,其特征在于,所述方法包括以下步骤根据具有预定范围抖动值的被选择的信号采样的直方图来估计所接收的媒体信号(rn)的量化器步长(δr)、并且使用所述估计的步长从所述媒体信号中提取该数据符号。
2.如权利要求1所述的方法,其中所述抖动值的范围是适用的抖动值的范围中的预定部份。
3.如权利要求1所述的方法,其中所述被选择的信号采样(rn)是其中已经被嵌入预定数据符号(dpilot)的预定信号采样。
4.如权利要求1所述的方法,其中所述量化器步长是使用所述直方图的傅里叶变换来计算的。
5.一种在主信号中嵌入数据符号的方法,所述嵌入是通过使用量化步长(δ)来量化所述主信号(xn)、并且根据抖动向量(kn)来抖动所述量化的信号而进行的,其特征在于,所述方法包括在主信号的预定采样中嵌入预定的数据符号(dpilot)。
6.一种从煤体信号(rn)中提取数据符号(dn)的设备,通过使用量化步长(δ)量化主信号(xn)、使用所述数据符号调制量化索引、和根据抖动向量(kn)抖动所述量化的信号,而将所述数据符号嵌入到所述媒体信号中,其特征在于,所述设备包括用于制作具有预定范围抖动值的被选择信号采样的直方图的装置(74),所述装置还根据所述直方图来计算所接收的媒体信号(rn)的量化器步长(δr)。
7.如权利要求1中所要求的设备,其中所述被选择的信号采样(rn)是其中已经被嵌入预定数据符号(dpilot)的预定信号采样。
8.一种用于在主信号中嵌入数据符号的设备,所述嵌入是通过使用量化步长(δ)量化所述主信号(xn)、使用数据符号调制量化索引、并且根据抖动向量(kn)抖动该量化的信号来进行的,其特征在于,所述设备包括用于在所述主信号的预定采样中嵌入预定数据符号(dpilot)的装置(76)。
9.一种具有嵌入的数据符号的信号(sn),包括通过使用量化步长(δ)量化主信号(xn)、使用数据符号调制量化索引以及根据抖动向量(kn)抖动量化信号而获得的信号采样,其特征在于,所述信号包括在主信号的预定采样中嵌入的预定数据符号(dpilot)。
全文摘要
公开了一种方法和设备,用于使用抖动量化索引调制(71)而在主信号(x
文档编号H04N1/387GK1602502SQ02824865
公开日2005年3月30日 申请日期2002年11月20日 优先权日2001年12月14日
发明者J·J·埃格斯, R·贝伊姆尔 申请人:皇家飞利浦电子股份有限公司