专利名称:一种数码相机jpeg图像的真伪鉴别方法
技术领域:
本发明属于多媒体信息安全领域,具体涉及一种数码相机JPEG图像的真伪鉴别方法。
背景技术:
高分辨率的数码相机,功能强大的个人电脑及各种图像处理软件的普及与应用,使得一般的用户都能很容易地实现对数字图像的篡改而不留下明显的痕迹。如今,眼见并不为实,如果虚假的相片被滥用,必将带来一些问题,如涉及到法律证据的真实性,数字媒体的版权,个人的隐私保护等,检测图像数据的真实性有着十分重要的意义。
传统上,我们可以利用数字水印技术对媒体数据进行认证,但基于水印技术的一个很大制约在与水印信息必需在媒体数据建立的同时被嵌入,这将极大影响到它在实际当中的应用。而且在现实中的数字图像的篡改者往往就是数据的创建者本身,他们是不会留下任何的水印信息以供分析者检测所用。
发明内容
本发明的目的是提供一种数码相机JPEG图像的真伪鉴别方法,能够根据待测的JPEG图像和拍摄该图像的数码相机,判断图像是否经过篡改,从而确认图像数据的真伪性。
本发明方法所采用的技术方案如下该方法包括以下步骤1)提取原始JPEG图像的噪声模式;2)利用相关性度量得到图像的特征,并利用SVM技术构造分类器;3)根据步骤2)得到的分类器对待测图像的真伪性作判断。
所述步骤1)提取原始JPEG图像的噪声模式的方法如下首先用给定的数码相机C拍摄与待检测图像同样尺寸的JPEG图像50幅,用于相机C原始JPEG噪声模式PC的提取,对于每幅拍摄的图像Yi(i=1...50),利用再次JPEG压缩方法提出图像Yi的噪声NiNi=double(Yi)-double(Re_JPEG(Yi)) (1)其中Re_JPEG(Y)表示对图像Ti以同样的量化表作JPEG压缩,用于提出其图像的主要成分,相减后得到图像Yi的噪声,PC由以下的公式得到PC=Σi=150Ni/50]]>所述步骤2)中分类器的构造方法如下a)构造认证图像集利用相机C拍摄与待检测图像同样尺寸的JPEG图像50幅,此50幅图像是没有被篡改的原始图像,设为Original(i)(i=1...50);b)构造篡改图像集对于每幅原始JPEG图像Original(i),模拟一般的篡改过程,进行篡改处理,可按如下的方法构造篡改图像集i).随机地从网络中下载或从别的图像库中得到一些图像作为篡改的原材料。
ii).对每一幅原始图像Original(i)(i=1...50),随机地改动某一个区域,改动的方法可利用i)中随机地挑选图像块作合成操作,或利用其他的一些篡改技术如Region-Duplication,Inpainting等。其区域改动的大小为原始图像大小的1/10000到1/10。
iii)对经过步骤ii)篡改后的图像作不同量化表的二次JPEG压缩,在实际操作中,我们可以根据具体不同型号相机所兼容的量化表进行压缩。在实验中我们可以以Original(i)量化表,质量因子是100,95,85,75和一个质量因子在[50,75]随机选择的量化表分别作压缩。这样对于每个原始JPEG图像,可以得到6幅篡改图像与之对应。设为Tampered(i)(j)(i=1...50,j=1...6)c)特征的提取与SVM分类训练,对于每一幅的由步骤a)、b)得到的图像Y,利用相关性度量公式ρC=corr(NY,PC)=(NY-E[NY])(PC-E[PC])||NY-E[NY]||||PC-E[PC]||---(2)]]>其中NY是图像Y利用公式(1)提取出的噪声,分别计算图像Y的噪声在红、绿、蓝三个通道与PC的相关性,作为图像Y的特征向量,最后利用LibSVM对提取的特征向量作分类训练,得到能辨别JPEG真伪性的分类器。
所述步骤3)中判断对待测图像的真伪性方法如下给定待测的JPEG图像I,首先检测I头文件信息,如果超出了给定的相机C的设置范围,则可判断该图像是被改动过;若与相机设置相符合,则先利用公式(1)和(2)提取出该图像的噪声特征,再利用步骤2)中得到的分类器对其真伪性做出判别。
本发明是一种“盲认证”技术,它不需要人为地给图像数据加入任何的水印或签名信息,仅仅利用图像数据本身的统计特性就可以实现认证的功能,更具有实用价值,尤其是在法庭数字图像证据的真伪性的判别上。
图1是一般的图像篡改过程流程图;图2是维纳滤波器(Wiener)、高斯滤波器(Caussian)、均值滤波器(Mean)和中值滤波器(Median)分别对测试集图像作相关性检测,得到R、G、B三个颜色通道的相关系数分布图;图3是利用六种不同的重压滤波器提取图像特征后的系数分布图;图4是100幅原始图像(Original)与100幅篡改图像(Tampered)的三个颜色通道相关系数均值随提取噪声模式的图像个数变化趋势图;图5是一般数码相机内部处理的原理示意图;图6是篡改前后的图像比较。
具体实施例方式
下面结合附图对本发明作进一步说明。
如图1所示,一般的图像篡改过程流程是从数码相机照出的原始JPEG图像(Original),首先解压到空域f(D),再对其局部信息D1作修改,最后重压缩为与相机设置相兼容JPEG图像(Tampered)。
假设要辨别真伪的JPEG图像是I,拍摄该图像的数码相机是C。如果不确定I是否出自于C,可以利用一些现有的方法进行判别。
1.M.Kharrazi,H.T.Sencar,and N.Memon.Blind source cameraidentification.Proc.ICIP,Singapore,October 24-27 2004.
2.J.Lukas,J.Fridrich,and M.Goljan.Digital bullet scratchesfor images.Proc.ICIP,pp.II-65-8,Genova,Italy,september 2005.
3.J.Lukas,J.Fridrich,and M.Goljan.Determining digitalimage ori gin us ing sensor imperfect ions.Image and VideoCommunica tions and Processing 2005 5685(1),pp.249-260,SPIE,2005.
4.Z.J.Geradts,J.Bijhold,M.Kieft,K.Kurosawa,K.Kuroki,and N.Saitoh.Methods for identification of images acquired withdigital cameras.Enabling Technologies for Law Enforcement andSecurity4232(1),pp.505-512,SPIE,2001.
本发明假设已经知道I出自于C,目的是判断I是否被改动过。一些相关的实验结果及参数设置如下a)滤波器的选择问题。
滤波器对噪声的提取,及最后判别的效率有着至关重要的影响。在实验中,我们比较了十种不同的滤波器JPEG再压缩滤波器,包括同样的量化表压缩,质量因子是100,95,85,75及自定义的量化表(如表1所示)压缩;表1
一般的滤波器,包括维纳滤波器(wiener)、高斯滤波器(Caussian)、均值滤波器(Mean)和中值滤波器(Median)。利用上述十种滤波器进行噪声的提取,然后对Sony DSC-P150相机测试集中的1400个图像(200原始图像、1200个篡改图像)作相关性检测,得到R、G、B三个颜色通道的相关系数分布图。图2中(a)Wiener、(b)Caussian、(c)Mean、(d)Median图分别是采用维纳滤波器(Wiener)、高斯滤波器(Caussian)、均值滤波器(Mean)和中值滤波器(Median)得到的R、G、B三个颜色通道系数的分布图,其中提取噪声模型的图像个数为50。图3(a)Self、(b)QF100、(c)QF95、(d)QF85、(e)QF75和(f)Custom图分别是利用重压滤波器Self、QF100、QF95、QF85、QF75和Custom对图像提取特征后的系数分布图。
表2是两款相机利用各种滤波器进行滤波后的分类效果表2
从图2、3和表格2可以看到以同样的量化表作为滤波器提取图像的噪声模型,具有最较优的分类效果。所以本发明推荐采用的是以同样量化表进行压缩提取图像噪声的重压滤波器。
b)用于相机噪声模型提取的图像数量问题。
在原始JPEG图像特征的提取步骤中,需要对多幅图像的噪声进行平均,以此作为数码相机的噪声模型。利用不同数量的图像,对最后分类的效率都会带来一定的影响,图4(a)Sony和(b)Canon分别是Sony相机和Canon相机选取不同数量原始JPEG图像提取噪声模式与200幅图像(100原始的、100篡改后的)在三个颜色通道相关系数变化趋势图。从图中可以看到,选择的图像数量越多,原始JPEG图像与篡改图像的特征区分度就越大,因此我们建议用于提取图像噪声模式的原始JPEG图像数量应不少于50个。
我们对10款数码相机进行实验(选定以同样的量化表压缩作为提取噪声的滤波器,提取噪声所用的图像个数为50。)选择的相机如下表3所示
表3
每款相机照300幅同样大小的JPEG图像,50幅用于提取相机噪声模型,50幅用于训练分类器,200幅用于构造测试样本。分类的正确率如表4所示。
表4
从表中数据可以看到本发明分类效果很好。所有的分类正确率均高于97.93%,同时在实际的应用中有一些简单有效的方法能进一步提高检测的效率,如增加提取噪声的图像个数。按着所要检测的图像参数如量化表、光照条件等进行图像数据采集。这些都是十分有效的方法。
图5所示是本发明方法的一个应用实例。篡改前后的图例。原始的JPEG图像图5(a)是由Sony DSC-F717拍摄,篡改图把左上角的灰色鸽子去掉,然后以同样的量化表作压缩,得到图像图5(b)。篡改前后的图像量化表是一致的,人眼很难区分其差异,利用本方法则可很简单地实现区分。
权利要求
1.一种数码相机JPEG图像的真伪鉴别方法,其特征是该方法包括以下步骤1)提取原始JPEG图像的噪声模式;2)利用相关性度量得到图像的特征,并利用SVM技术构造分类器;3)根据步骤2)得到的分类器对待测图像的真伪性作判断。
2.根据权利要求书1所述的JPEG图像的真伪鉴别方法,其特征是所述步骤1)提取原始JPEG图像的噪声模式的方法如下首先用给定的数码相机C拍摄与待检测图像同样尺寸的JPEG图像50幅,用于相机C原始JPEG噪声模式PC的提取,对于每幅拍摄的图像Yi(i=1...50),利用再次JPEG压缩方法提出图像Yi的噪声NiNi=double(Yi)-double(Re_JPEG(Yi)) (1)其中Re_JPEG(Y)表示对图像Yi以同样的量化表作JPEG压缩,用于提出其图像的主要成分,相减后得到图像Yi的噪声,PC由以下的公式得到PC=Σi=150Ni/50.]]>
3.根据权利要求书1所述的JPEG图像的真伪鉴别方法,其特征是所述步骤2)中分类器的构造方法如下a)构造认证图像集利用相机C拍摄与待检测图像同样尺寸的JPEG图像50幅,此50幅图像是没有被篡改的原始图像,设为Original(i)(i=1...50);b)篡改图像集的构造,对于每幅原始JPEG图像Original(i),模拟一般的篡改过程,随机地篡改图像的局部信息(设改动的区域是图像大小的1/10000到1/10),篡改后再压缩为JPEG图像(压缩量化表包括Original(i)的量化表,质量因子是100,95,85,75和一个在[50,75]随机选择的量化因子),这样对于每幅原始图像,产生6幅篡改图像,设为Tampered(i)(j)(i=1...50,j=1...6);c)特征的提取与SVM分类训练,对于所有的由步骤a)、b)得到的图像Y,利用相关性度量公式ρC=corr(NY,PC)=(NY-E[NY])(PC-E[PC])||NY-E[NY]||||PC-E[PC]||---(2)]]>其中NY是图像Y利用公式(1)提取出的噪声,分别计算图像Y的噪声在红、绿、蓝三个通道与PC的相关性,作为图像Y的特征向量,最后利用LibSVM对提取的特征向量作分类训练,得到能辨别JPEG真伪性的分类器。
4.根据权利要求书1所述的JPEG图像的真伪鉴别方法,其特征是所述步骤3)中判断待测图像的真伪性方法如下设待测的JPEG图像为I,首先检测I的头文件信息,如果超出了与给定的相机C的设置范围,则可判断该图像是被改动过(可能是头文件信息的修改或是图像内容的修改);若与相机设置相符合,则先利用公式(1)和(2)提出该图像的特征,再利用步骤2)中得到的分类器对其真伪性做出判别。
全文摘要
本发明公开一种用于鉴别数码相机JPEG图像真伪的方法,是基于给定的数码相机噪声及JPEG压缩过程产生的误差而提出的统计判别技术。该方法包括以下步骤1)提取原始JPEG图像的噪声模式;2)利用相关性度量得到图像的特征,并利用SVM技术构造分类器;3)根据步骤2)得到的分类器对待测图像的真伪性作判断。本发明利用了数码相机的内部处理会对输出的JPEG图像产生某种模式的噪声,以及该噪声在一般的篡改操作后会发生改变的特点。对于给定的JPEG图像与拍摄该图像的数码相机,提出了一种能有效地判别图像真伪性的方法。本方法仅需图像本身的性质就可实现认证的效果,这对媒体版权保护、个人隐私及法庭上的取证尤为重要。
文档编号G06T1/00GK1925546SQ20061003660
公开日2007年3月7日 申请日期2006年7月20日 优先权日2006年7月20日
发明者骆伟祺, 黄继武 申请人:中山大学