一种对数字图像jpeg压缩的识别方法

文档序号:7715742阅读:278来源:国知局

专利名称::一种对数字图像jpeg压缩的识别方法
技术领域
:本发明属于数字图像的信息安全和信息取证领域。具体涉及到一种能快速、有效地判别给定图像是否经过JPEG压縮的方法。
背景技术
:JPEG是一种应用广泛的数字图像格式,如各类数码相机的输出大多为JPEG格式,常用的图像处理软件(如Photoshop,GMP等)都支持JPEG压縮处理。因此,研究这类图像的统计特性有助于分析图像的真伪性、完整性、来源性等图像认证问题。然而,在某些情况下,数字图像常会以BMP格式进行处理或保存。此时将无法从图像的头文件中得知其是否经过了JPEG压縮。现有的JPEG图像识别技术主要是基于检测JPEG图像的分块效应(BlockingArtifacts)。然而,这种方法的检测效率往往依赖于图像内容、图像大小及压縮时所采用的量化表。一般而言,对于纹理相对复杂、或面积小于32X32、又或是经过较高压縮因子(如QF>95)压縮后的图像,其检测效率较差。故而需要研发一种简单有效的方法用于判别图像是否经过JPEG压縮处理,这对于某些隐写分析算法、图像篡改定位算法等都是十分关键的第一步。
发明内容本发明的目的在于针对现有JPEG图像检测算法的检测效率不佳等缺陷,提供了一种简单有效地对数字图像JPEG压縮的识别方法。为实现上述发明目的,采用的技术方案如下(1)将图像进行分块处理,并计算图像中非饱和分块的DCT系数;(2)统计步骤(l)AC系数在区域Ri=(-1,+1)及区域<formula>formulaseeoriginaldocumentpage3</formula>的个数,记为巧,r2;(3)以s=r2/ri作为图像的特征,并以阈值T对该特征进行判别,若s小于等于阈值T,则判别为图像经过了JPEG压縮处理,否则判别图像没有经过JPEG压縮处理。本发明主要分析了JPEG压縮过程中的量化误差、舍入误差及截断误差的关系,以及这些误差对AC系数直方图的影响。通过大量的实验统计得到如下结论对于原始的、没有经过JPEG压縮的图像其AC系数会呈现以0为中心的广义高斯分布;而经过JPEG压縮后的图像其系数在区域(-l,l)的数量会增多,在区域(-2,-l)U(+l,+2)上的系数则会明显减少。可以理论上证明当量化步长大于等于2的时候,该结论是正确的。本发明正是基于该结论作为识别的依据。上述技术方案中,所述步骤(1)计算非饱和分块的DCT系数的具体方法是首先将给定的大小为MXN的图像无重叠地分解为8X8的小分块,对于每一个分块,判断它内部是否存在数值为0或255的像素,若不存在则作为非饱和分块,并计算该分块的DCT系数。所述步骤(2)统计步骤(1)AC系数在区域I^及区域R2的个数的具体方法是将从步骤(1)中得到的DCT系数分类,对AC系数落在区域(-1,+1)及(-2,-1)U(+1,+2)分别进行统计得到其个数iViv所述步骤(3)计算图像的特征s,并判别图像是否经过JPEG压縮的具体方法是将步骤(2)中得到的数值a和r2相除得到图像特征s=r2/ri,并将该特征与预先训练得到的阈值T做比较,s>T则认为图像没有经过JPEG压縮,否则判别图像之前经过了JPEG压縮处理。其中,阈值T的选取方法具体如下首先选取一定数量的大小与待测图像一致的无JPEG压縮的原始图像,并以压縮因子QF对原始图像进行JPEG压縮得到JPEG图像,然后采用步骤(1)和步骤(2)对原始图像及JPEG图像在区域I^和区域&中AC系数的个数iviV并分别计算每个图像的特征s=iV^,最后利用极大似然估计方法对得到的所有图像特征进行训练,从中选取阈值T使得训练集中数据的分类效果达到最优。利用本发明能够简单有效地判别出给定的图像是否经过了JPEG压縮。与现有的基于检测图像分块效应的方法相比,本发明方法的检测效果有质的提高。图1为本发明的流程示意图;图2为图像无重复分块示意图;图3为实施例采用的Lena测试图像;图4为无压縮Lena图像DCT系数在(1,1)频率分量上的直方图;图5为Lena图像以质量因子为85JPEG压縮后其DCT系数在(1,1)频率分量上的直方图;图6为5000幅大小为32X32图像在不同JPEG压縮情况下(质量因子分别为98,95和85)及无压縮时特征s的分布示意图;图7为5000幅大小为32X32图像在JPEG压縮(质量因子在5098选取)前后特征s的直方图;图8为5000幅大小为32X32图像在JPEG压縮(质量因子在5098选取)前后分块效应特征K的直方图。具体实施例方式下面结合附图对本发明作进一步说明。本发明的流程图如附图l所示,包括步骤(l)计算图像非饱和分块的DCT系数;(2)统计AC系数在区域I^=(-1,+1)和区域r2=(-2,-1)U(+1,+2)的个数;(3)计算图像特征并判别图像是否经过JPEG压縮。每个步骤具体如下步骤(1)、计算非饱和分块的DCT系数假设待测的图像为I,其大小为MXN。如附图2所示,首先将I分解为无重叠区域的BzXBz(设定Bz=8)图像块,记为Blk(j),j=1,2,..[M/Bz][N/Bz]。对每一个图像小分块Blk(j),判断块中是否存在0和255的像素,若存在则处理下一个图像分块,否则计算该分块的DCT系数。步骤(2)、统计AC系数在区域&=(-1,+1)和区域R2=(-2,_1)U(+1,+2)的个数,具体为统计步骤(1)得到的DCT系数,分别记录落在区域&及区域R2的AC系数个数ri,r2。步骤(3)计算图像特征并判别图像是否经过JPEG压縮,本发明的图像特征为s=iV巧,根据该特征与一个训练得到的阈值T进行比较,当s《T时,判别图像I为经过JPEG压縮后的图像。其中阈值选取的方式如下随机选取大量原始的没有经过JPEG压縮的图像,要求其大小于待测图像一致。然后对图像进行JPEG压縮,其质量因子可设为固定值或根据实际情况在考察区域里随机选取。分别抽取所有原始图像及JPEG图像的图像特征s,利用极大似然估计方法对这些图像特征进行训练,确定阈值T使得训练集中数据的分类效果达到最优。下面通过具体的测试例子对本发明做进一步的说明。测试l:附图3是无压縮的Lena图像,图4是其DCT系数在(l,l)频率分量上的直方图;附图5是图像经过质量因子为85的JPEG压縮后图像在对应位置上的直方图。可以明显看到经过JPEG后的图像其系数在区域(-l,l)的数量会增多,而在区域(-2,-l)U(+1,+2)上的系数会减少。测试2:附图6所示的是5000幅大小为32X32图像在不同压縮情况下(质量因子分别为98,95和85)及无压縮时图像特征s分布情况,可以看出即使经过较轻微的压縮,如质量因子大于95,本发明的特征仍然有较好的区分能力。测试3:附图7所示为5000幅大小为32X32图像在JPEG压縮(质量因子在5098选取)前后特征r的直方图;附图8所示为5000幅大小为32X32图像压縮(质量因子在5098选取)前后分块效应特征K的直方图。可以看到利用本发明特征能有较好的区分能力。测试4:从5个不同图像库中各随机地挑选1000幅无经过JPEG压縮的原始图像,从中剪切出大小不同的分块作测试,分别为8X8,16X16,32X32,64X64和128X128。对于不同大小的图像库,分别进行JPEG压縮得到对应的JPEG图像库。然后分别提取原始图像及其JPEG图像的特征s,并随机将这些图像特征分为两组,一组作为训练集,另外一组作为测试集。利用极大似然估计算法对训练集中的图像特征做训练得到最优的T,该阈值T对测试集中的图像进行分类,如此重复10次计算平均检测结果。根据质量因子的选取不同,本发明与现有的基于分块效应检测算法做了如下的对比测试质量因子为98,95,85,75和50,利用本发明与现有方法相比,在不同大小图像库下的平均检测结果如下表所示(%):<table>tableseeoriginaldocumentpage6</column></row><table>质量因子在区域[50,98]中随机选取,利用本发明与现有方法相比,在不同大小图像库下的平均检测结果如下表所示(%):<table>tableseeoriginaldocumentpage6</column></row><table>从以上的对比数据可以明显看到本发明在绝大多数情况下的检测效果均优于现有的基于检测分块效应的方法。即使图像大小为8X8,压縮因子大于95仍能准确检测出来JPEG图像。权利要求一种对数字图像JPEG压缩的识别方法,其特征在于包括如下步骤(1)将图像进行分块处理,并计算图像中非饱和分块的DCT系数;(2)统计步骤(1)AC系数在区域R1=(-1,+1)及区域R2=(-2,-1)∪(+1,+2)的个数,记为r1,r2;(3)以s=r2/r1作为图像的特征,并以阈值T对该特征进行判别,若s小于等于阈值T,则判别为图像经过了JPEG压缩处理,否则判别图像没有经过JPEG压缩处理。2.根据权利要求l所述的对数字图像JPEG压縮的识别方法,其特征在于所述步骤(1)中对图像进行分块处理的方法为把图像无重复地分解为8x8大小的块。3.根据权利要求1或2所述的对数字图像JPEG压縮的识别方法,其特征在于所述非饱和分块为不存在取值为0和255的像素的分块。4.根据权利要求l所述的对数字图像JPEG压縮的识别方法,其特征在于所述步骤(3)中阈值T的确定方法为首先选取一定数量的大小与待测图像一致的无JPEG压縮的原始图像,并以压縮因子QF对原始图像进行JPEG压縮得到相应的JPEG图像,然后采用步骤(1)和步骤(2)计算出所有原始图像及JPEG图像在区域&,R2中AC系数的个数巧,r2,并分别计算出每个图像的特征s=iv^,最后利用极大似然估计方法对这些图像特征进行训练,得到阈值T使得这些图像特征分类效果达到最优。全文摘要本发明提供一种对数字图像JPEG压缩的识别方法,包括步骤(1)将图像进行分块处理,并计算图像中非饱和分块的DCT系数;(2)统计步骤(1)AC系数在区域R1=(-1,+1)及区域R2=(-2,-1)∪(+1,+2)的个数,记为r1,r2;(3)以s=r2/r1作为图像的特征,并以阈值T对该特征进行判别,若s小于等于阈值T,则判别为图像经过了JPEG压缩处理,否则判别图像没有经过JPEG压缩处理。利用本发明能够快速、有效识别出图像之前是否经过了JPEG压缩。与现有方法相比,本发明的识别效率有质的提高,能有效判别出小至8×8大小的图像块及压缩因子高于95的JPEG图像。文档编号H04N7/26GK101710989SQ200910193718公开日2010年5月19日申请日期2009年11月6日优先权日2009年11月6日发明者骆伟祺,黄继武申请人:中山大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1