专利名称:一种在文本文档中嵌入及检测数字水印的方法和装置的制作方法
技术领域:
本发明属于数字水印技术领域,具体涉及一种在文本文档中嵌入及检测数字水印的方法和装置。
背景技术:
文本文档不仅以数字格式存在电脑中,它还会通过打印、扫描、复印等方法以纸张的形式传播。实际上许多纸张文档(如契约、票据等)比那些音频、视频或者图像之类的多媒体更有价值。而随着计算机、打印机和扫描仪等设备的应用和普及,使得拷贝和复制技术变得相对比较容易,因而重要文本文档的保密工作显得尤为迫切。
一方面不经过保护的文本文档经过复制后很难追踪其来源。例如办公自动化辅助设备中值得引起特别注意和重视的复印机,它是办公自动化设备中最不可缺少的辅助设备。现代的复印机无论在功能上还是在印刷质量上,都达到了很高的水平。有的具有智能编辑能力,还可以实现多台复印机连接相互传送信息。一些更高级的复印机甚至还能实现彩色复印,印出的钞票可达到乱真的程度。复印机的这种能力使它能高效高质地印刷各种文件资料,大大地减轻了办公人员的抄写劳动量,提高了办公效率,受到办公人员的极大欢迎。但同时,它也使保密防范面临新的问题,涉密文件资料在传递过程中很容易被复印而造成失控,复印机成为了泄、窃密的方便工具。从近年海关截获带出境的涉密文件资料绝大多数是复印件,而通过这些复印件却审查不出文件泄密的出处,无法依法追究相关犯罪分子的刑事责任。如果通过纸介质的文档可以检测出一些重要信息,比如打印者的名字、打印机的名字、打印时间、计算机的物理地址等,便能够很容易地追溯到文件非法传播的源头。
另一方面在打印文档时需要一定数量的额外附加信息,而这些信息又不便出现文档的正文中。比如银行帐单上关于储蓄客户的信用额度、存款数量、家庭地址等重要的隐私,而必要的时候又需要重新输入这些数据。这样就需要在打印文档中事先隐藏一定数量的信息,这些信息不为人眼所能识别,而需要时又能通过相应的扫描设备或专门读取工具方便地获得,从而可以避免大量的重复输入工作,在一定程度上节省了很多的人力、物力和时间。
上述两个方面的问题在本质上是一样的,都是以文本文档作为载体隐藏一定数量的水印信息。如果这类文档被非法复印、传播而产生严重的后果时,这些信息可以作为证据追溯犯罪的源头;如果这类文档被肆意纂改后,这些信息可以作为非法侵犯起诉的证据等。
为此出现了利用数字图像作为载体的数字水印进行信息隐藏的技术,这样需要在文档中选取一幅图像,比如人物头像、公司Log图、背景图案等。对该图像进行特殊处理嵌入事先输入的信息串,再通过高精度的打印机或者印刷设备进行输出。由于打印、扫描、复印等处理对原始文档添加了不可估计的随即噪声,对此类噪声还没有准确描述的数学模型,而且它还与打印机、扫描仪、复印机等设备自身的性能有关。并且数字水印通常遇到的各类攻击,比如旋转、二值化、过度偏移、明显扭曲、几何变换等引起的失真,对于印刷图像来讲变得更为突出。虽然可以对扫描后的图像做一定的预处理工作,信息误识别的概率很高,尤其对于经过多次复印后的文本文档处理时,检测结果更难接受。有人也尝试根据文本文档自身的空间特征来设计水印方案,通过对高级格式化的文件版面信息(如字移或行移)或格式编排的变化嵌入水印信息。这种方法也存在很大的弊端,首先需在前端文本编辑和排版软件进行特殊的处理,并且处理的过程非常复杂;为了不影响正常文档的阅读效果,字移或行移的幅度不能太大,而扫描后的图像同样存在上述噪声的严重影响,一般情况下水印信息很难检测;又由于文档中的行数数量通常是一定,所以隐藏的信息量相对较少;并且对于多页文档的信息隐藏来说,该方法变得相对繁琐,操作很不方便。
另外利用这种方法隐藏水印信息依赖于文档内容,如果文档中没有图像,水印信息就失去了载体;即使存在可以文档中存在相应的载体数据,隐藏水印信息时还需要在将图片从文档中拷出,进行另外特殊的数字图像处理,重新排版后才能打印输出。再加上该方法的打印输出需要很高的硬件设备和打印精度,所以上述的方法不适合于办公文档的打印输出。
并且上述的检测方法以及相应装置的工作过程是这样的首先扫描待检测文档及原始文档,得到相应的图像,随后进行额外的图像预处理,以补偿衰减、平移、缩放、模糊等因素带来的影响,尤其盐椒噪声和偏斜必须剔除,然后根据嵌入方法的不同提取图像中的隐藏信息。这个检测方法要求比较严格,预处理的工作量比较大,并且预处理的准确度也直接影响了检测效果;并且该方法中还需要原始图像的参与,使得检测过程变得相对比较繁琐;由于条件的苛刻,通常的识别率不是很高,尤其对于缩放或者复印后的文档检测。
发明内容
本发明的目的是针对现有技术的缺陷,提出一种在文本文档中嵌入及检测数字水印的方法和装置。该方法及装置能够在正常文档的底部嵌入了一层用来记录大量水印信息的底纹,即使嵌入数字水印后的文档被弄脏、被折叠或者缩放复印后,仍能以高精度检测出其中隐藏的水印信息。
为达到以上目的,本发明采用的技术方案是一种在文本文档中嵌入数字水印的方法,包括以下步骤(1)准备原始点阵图像,所述原始点阵图像由网点组成,其中用作编码点的网点的位置变化代表了水印信息;(2)获取水印信息,并对信息做预处理;(3)在原始点阵图像中埋入预处理后的水印信息;(4)将埋入水印信息的点阵图像数据与正常文档数据打印输出。
进一步来说,步骤(1)中,原始点阵图像为调幅挂网、调频挂网、调频调幅混合挂网或由自主设计的网点组成。
更进一步,步骤(1)中,原始点阵图像事先设计好或根据一定规则动态生成。步骤(1)中,网点表现的灰度值区间为3%~15%。
更进一步,步骤(1)中,原始点阵图像中的网点类型分为三类A编码点,这些网点的位置变化代表了水印信息,每个编码点与周围其他网点之间的距离为2~5个网点大小;B不动点,在信息隐藏的过程中,这些网点的位置不发生变化;C扰动点,为了防止编码方式被破解,并调整点阵图像的视觉效果,这些网点在编码过程中作随机方向的偏移。
进一步,步骤(2)中获取水印信息并对信息做预处理包括以下步骤a.获取要隐藏的字符即要嵌入的水印;b.将字符串转化成二进制的位串信息流;c.对位串信息流进行加密,并得到密文位串信息流;d.根据步骤c所得到的密文位串信息流计算数据检测校验码,并将它追加到原始的密文位串信息流的后面。
更进一步,步骤a中,隐藏的字符即要嵌入的水印是当前用户名、用户密码、网卡的MAC即介质访问控制地址、计算机的IP地址、文档打印时间、打印日期、作业名称、作业ID信息、自定义的字符串或者从文本文件中输入的文本信息。
步骤(2)中,在转化后的位串信息流的前面插入字节流,用于记录每个子字符串的长度。
步骤(3)中,点阵图像中的网点向八个不同的方向偏移,通过位置的不同变化来埋入密文位串信息流。
步骤(4)中将埋入水印信息的点阵图像数据与正常文档数据打印输出时,将嵌入水印信息后的点阵图像进行拼接,拼接时先根据点阵图像的外接矩形框大小,将版面区域进行合理随机分割;然后将每个点阵图像随机旋转90、180或270度;最后再将每个分割后的单元数据用单位点阵图像数据代替,拼接完成后得到完整页面的背景底纹。
步骤(4)中,首先通过打印驱动截获处理后的正常文档的数据,保存在内存中,当接收到拼接处理后的背景底纹数据时,从内存中读取事先存储的正常文档数据,将它们追加到背景底纹数据的后面,并把结合的数据重新用页面描述语言解释后输出到相应的页面描述文件中,最后把数据文件传送给打印控制器进行打印输出。
一种在文本文档中嵌入数字水印的装置,包括以下部分a.隐藏信息获取和处理装置该装置获取要处理的计算机数据,从内存中得到相应的数据代码,转化为一个完整的位串信息流,然后对位串信息流进行加密处理后得到一个新的密文位串信息流,并送到信息埋入装置;b.信息埋入装置该装置将密文位串信息流按位分解成一定数目的子串,通过网点的位置变化把每个子串代表的水印信息隐藏在选定的原始点阵图像;e.底纹生成装置该装置将嵌入水印信息后的点阵图像进行拼接,组成完整页面的背景底纹,然后送到打印输出模块装置;f.打印输出装置该装置将正常文档数据和含有隐藏信息的背景底纹数据合并成一个页面描述文件,然后一并进行打印输出。
进一步,所述的隐藏信息获取和处理装置获取和处理的计算机数据是各种文字、数字、字符和字母,以及包括视频、音频在内的可数字化的信息。
所述的底纹生成装置中还备有在拼接后的背景底纹点阵对象上隐藏警示文字信息的生成装置。
一种在文本文档中检测数字水印的方法,包括以下步骤(1)对含有水印信息的文档进行扫描或摄取,得到文本数字化后的图像数据;(2)扫描获取的数字图像数据,并获得加密后的位串信息流;(3)使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
进一步来说,步骤(2)中,通过识别隐藏水印信息的图像块的定位点,计算扫描图像的旋转角度和缩放比例。
步骤(2)中,根据图像的旋转角度和缩放比例,扫描每个编码点,并计算其位移变化,从而得到每个子位串,顺序将其组合为一个完整的位串信息流。
步骤(2)中,扫描多个图像块的定位点,通过一个图像块中的编码点位移信息,来补偿另外一个图像块中相同编码点由于被前景内容或干扰因素影响而带来的信息丢失。
步骤(3)中,取出密文位串信息流的前面用于存储校验数据的字节流,并使用数据校验算法对密文位串信息流进行正确性校验。
步骤(3)中,使用特殊密钥对去除校验数据的密文位串信息流解密,并取出解密后的明文位串信息流中插入的各字段长度信息,然后顺序解码出各字段的字符串信息。
一种在文本文档中检测数字水印的装置,包括以下部分(a)文本数字化装置该装置对含有底纹的文档进行扫描,得到文本数字化后的图像数据;(b)图像识别装置该装置对文本数字化模块扫获取的数字图像数据进行扫描检测,并获得加密后的位串信息流;(c)信息解码装置该装置使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
进一步,图像识别装置中包含有特定图像区域的采样装置和图像预处理装置;所述的采样装置是在图像中部选取条状区域和计算象素点的灰度值区间和网点半径的处理装置;所述的预处理装置是计算图像的旋转角度和缩放比例的处理装置。
本发明的效果在于采用本发明所述的方法及装置,可以增大在文档的底纹中藏入的水印信息量,底纹中嵌入的水印信息将随着文档一起传播,必要时可以通过扫描仪将文档数字化后进行检测。因为本发明在底纹生成过程中采用了纠错编码技术,所以即使文档被弄脏、被折叠或者缩放复印后,仍能以高精度检测出其中隐藏的水印信息。因此,本发明可以广泛应用于文档加密、追踪、控制文档非法传播以及版权的技术保护。
图1是信息获取和处理过程示意2是信息埋入过程示意3是原始点阵图像示意4是网点移位编码示意5是嵌入信息的文档示意6是图5局部放大后的示意7是水印信息嵌入过程示意8是水印信息嵌入装置构成示意9是水印信息检测过程示意10是水印信息检测装置构成示意图具体实施方式
下面结合附图对本发明的具体实施方式
做进一步的描述。
如图7所示,一种在文本文档中嵌入数字水印的方法,包括以下步骤(1)准备原始点阵图像,所述原始点阵图像由网点组成,其中用作编码点的网点的位置变化代表了水印信息;本发明所述的原始点阵图像的网点类型可为调幅挂网、调频挂网、调频调幅混合挂网或由自主设计的网点,并且该点阵图像可以事先设计好或者根据一定的规则自动生成。本实施例中选择了一组事先设计好的调频挂网后的圆形网点图,表现的灰度级为6%(一般说来,网点的灰度级在3%-15%的效果都比较好),局部放大后的示意图如图3所示。所有的网点类型分为三类编码点、固定点和扰动点。其中101编码点的位置变化代表要嵌入的水印信息;102固定点的位置在信息嵌入的过程中不发生任何变化;103扰动点作随机地位置偏移,它的位置变化不代表实际的水印信息,其作用主要一方面是为了改善编码点移动后带来的视觉效果,另一方面也很好地打破了编码后点阵图像的规律性,即使每次嵌入相同的水印信息,编码移动后的点阵图像都不会完全相同,在加上调频网点本身固有的随机性,很难分析出水印信息编码点的运动规律,从而在一定程度起到提高安全性的作用。
(2)获取水印信息,并对信息做预处理;如图1所示,通过打印机驱动程序读取计算机的用户名、网卡的MAC即介质访问控制地址、计算机的IP地址、文档的打印时间、打印日期、作业名称、作业ID信息中的全部或部分信息,以及在驱动程序GUI用户界面上获得用户输入的密码、自定义输入的字符串或者从其它任何文本文档中读取的文本信息。比如在本实施例中获取要嵌入的字符串信息如下(1)用户名称为“SuperMan”;(2)MAC地址为“00-0F-1F-CC-15-D7”;(3)计算机的IP地址为“172.16.8.102”;(4)打印时间为“2005-10-24”;(5)作业名称为“机密文档.doc”;(6)用户自定义的字符串为“本文档所记录的信息是不能随便向外界透漏,否则后果自负”。
将上述所有的字符串组合在一起得到一个新的字符串,然后读取每个字符在计算机内存中的数据代码,转化为一个用二进制(0或1)表示的位串信息流。为了能够方便地进行解码,转化后的位串信息流的前面插入一定数目的字节流,用于记录上述每个子字符串的长度;为了安全性考虑,对组合后的位串信息流进行加密处理,密钥作为明码插入到密文字节流的前面。在进行检测时,需要用户身份认证过程,其中比较读取的明码密钥信息和用户输入的密钥是否相同。身份认证通过后,检测程序用密钥对读取的密文位串信息流进行解密,还原出原始的明文位串信息流;否则即使拿到文档和检测程序也不能识别出密文字节流信息。然后使用通用的数据校验算法对加密处理后的密文字节流处理,计算校验数据。此处选择循环冗余校验(CRC)码计算得到16位的校验码,并将校验码信息追加到密文位串信息流的前面,得到最终要隐藏的位串信息流,其中的校验码部分主要是用来检测时进行数据正确性校验。实际上该密文字节流的前面含有另外的两串明码字节流信息,分别为密钥信息和数据校验码。
(3)在原始点阵图像中埋入预处理后的水印信息;在图2所示的信息埋入模块流程示意图中,先将密文字节流位串信息流按位进行分解成一定数目的子串。由图4可以看出,在本发明采用的编码方法中,每个网点的位置偏移代表3bits的信息量,也就是说一个字节的编码信息量需要3个网点的位移变化来表示。而3个网点的位置变化表示了9bits的信息量,其中最后的1bit的空间是富裕的,此时选择作为奇偶校验位。当然根据编码方法的需要,该位可以代表其他的信息。在本实施例中把整个密文位串信息流按字节进行划分,其中每个字节的信息需要三个编码点作为载体。其中前两个编码点代表字节的前6位信息,第三个编码点代表的3bits信息中的前两位是字节后两位信息,最后的一位被选择作为奇偶校验的信息位进行补充。
根据分解后的子串的个数选择相应数量的编码点,对于每个编码点按照如图4所示的编码规则进行移位。所有的子串所代表的信息对应了编码点的位移变化。所有的编码点全部完成移位操作后得到一幅新的点阵图像,该图像作为底纹的一个基本组成单元,已经藏入了事先获取到的字符串信息。
(4)将埋入水印信息的点阵图像数据与正常文档数据打印输出。
将步骤(3)得到的单位点阵图像拼接成大的背景底纹,而底纹数据的大小由正常数据的页面信息来决定,本实施例中选择较为常用的A4幅面的文档大小。拼接时可以根据打印驱动的具体要求选择不同的拼接方式,最为简单的处理方法就是将单位的点阵图像数据复制多份,直接进行矩阵式拼接。这种平铺式拼接方法最大的问题就是规律性较大,为了解决这个问题,本方法处理的方法如下先根据点阵图像的外接矩形框大小,将版面区域进行合理随机分割;将每个点阵图像随机旋转90、180或270度;再将每个分割后的单元数据用单位点阵图像数据代替。如此处理后的底纹规律性明显减小,拼接后的背景底纹数据进行打印输出。
打印输出时,首先通过打印驱动截获处理后的正常文档的数据,保存在内存中。当接收到拼接处理后的背景底纹数据时,从内存中读取事先存储的正常文档数据,将它们追加到背景底纹数据的后面,并把结合的数据重新用页面描述语言解释后输出到相应的页面描述文件中。最后把数据文件传送给打印控制器进行打印输出。经过上述过程的打印效果如图5所示,其局部放大示意图如图6所示。因为经过拼接后的图像点阵多处隐藏了水印信息,即使文档底纹的某个局部被弄脏或者被前景文字影响,可以通过其他数据块的信息补偿得到一个完整的信息块。
上述方法步骤实现的一种在文本文档中嵌入数字水印的装置包括隐藏信息获取和处理装置、信息埋入装置、底纹生成装置和打印输出装置,其构成示意图如图8所示。
a.隐藏信息获取和处理装置该装置获取要处理的计算机数据,从内存中得到相应的数据代码,转化为一个完整的位串信息流,然后对位串信息流进行加密处理后得到一个新的密文位串信息流,并送到信息埋入装置;b.信息埋入装置该装置将密文位串信息流按位分解成一定数目的子串,通过网点的位置变化把每个子串代表的水印信息隐藏在选定的原始点阵图像;g.底纹生成装置该装置将嵌入水印信息后的点阵图像进行拼接,组成完整页面的背景底纹,然后送到打印输出模块装置;h.打印输出装置该装置将正常文档数据和还有隐藏信息的背景底纹数据合并成一个页面描述文件,然后一并进行打印输出。
其中隐藏信息获取和处理装置能够获取和处理的计算机数据范围比较广,包括文字、数字、字符和字母,以及视频和音频在内的任何可数字化的信息;底纹生成装置还备有在拼接后的底纹背景点阵对象上叠加隐藏警示文字信息的生成装置,该装置生成的点阵图像经过打印后,底纹背景中隐藏的警示文字信息用肉眼不易识别,而进行复印后便可以清晰地显现出来,从而很好地起到了禁止非法复印的效果。
如图9所示,一种在文本文档中检测数字水印的方法,包括以下步骤(1)对含有水印信息的文档进行扫描或摄取,得到文本数字化后的图像数据;在检测文档底纹中隐藏的数字水印信息时,通过图像输入或摄取设备(扫描仪或数码相机)将文本文档进行数字化操作,此时得到的数字图像中包含有加密的数字水印信息。
(2)扫描获取的数字图像数据,并获得加密后的位串信息流;主要是通过运行在计算机上的一个独立的应用程序,该程序将扫描后得到的数字图像作为处理对象。程序输入图像后要求用户输入密钥信息,该密钥信息暂时保存在内存中。由于主观或者客观原因,在扫描或复印过程中,文档常常会有不同程度的倾斜和缩放,同时文档还有可能经过多次复印导致的网点扩展和变形,这些都会对埋入水印信息的检测带来一定的影响。为了能够精确的识别出隐藏信息,我们必须先通过识别隐藏水印信息的图像块的定位点,检测出扫描图像的旋转角度和放缩比例,对扫描结果进行一定程度的补偿,然后检测程序开始执行对整个图像的扫描过程。,如果识别出了作为单位点阵图像块的起始点的网点对象时,标志着某个信息块或者部分信息块被检测到。因为在信息埋入的过程中所有的编码网点都做了位移,在本图像块中固定的位置寻找编码网点时,会发现理论位置处是空白区域,进而在其周围区域寻找网点所在的位置,通过与理论网点位置处的比较判断出该编码点所代表的位串信息。遍历所有的编码点便可以得到一个位串流,通过移位操作将它转化为一个字节流。在该字节流的前部取出定长的明码密钥,并根据字节流的尾部的数据校验码,对整个的密文字节流进行数据正确性检验。通过数据校验后,再比较用户输入的密钥和从字节流中提取的密钥信息。如果通过身份验证,用密钥把密文字节流解密,从而识别出全部的隐藏信息。
由于文档正常的前景内容影响,很多情况下,即使扫描全部文档图像后,也不能找出一个包含所有水印信息的图像块。此时就需要扫描多个图像块的定位点,通过一个图像块中的编码点位移信息,来补偿由于另外一个图像块中相同的编码点被前景内容的干扰而带来的信息丢失,从而进一步提高了信息的识别率。
(3)使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
在进行解密操作前,先从密文位串信息流的前面字节中取出校验数据的信息,使用数据校验算法对密文位串信息流进行数据正确性校验。接着使用特殊的密钥对去除校验数据的密文位串信息流进行解密,并取出解密后的明文位串信息流中插入的各字段内容的长度信息,然后顺序解码出各字段的字符信息。
上述方法步骤实现的一种在文本文档中检测数字水印的装置包括文本数字化装置、图像识别装置和信息解码装置。其工作流程如下(a)文本数字化装置该装置对含有底纹的文档进行扫描或摄取,得到文本数字化后的图像数据;(b)图像识别装置该装置对文本数字化模块扫获取的数字图像数据进行扫描检测,并获得加密后的位串信息流;(c)信息解码装置该装置使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
上述的图像识别装置中包含有特定区域内的图像采样装置和图像预处理装置,其中采样装置是选取图像中部的条状区域,并计算各采样象素点的灰度值区间和相应的网点半径;图像预处理装置则是根据采样结果,计算图像的旋转角度和缩放比例。
通过本发明所述的点阵图像藏埋入的信息量较大,抗复印的能力强,同一个文档经过五次复印后,仍能高精度地检测出水印信息;由于本发明不是基于象素的信息嵌入,而是通过网点级别的编码方法,缩放一定比例后,水印信息同样可以被检测出,所以最能体现本方法优势的地方就在于隐藏在底纹中的水印可以抵抗缩放复印的攻击。
上述实施例只是本发明一个优选的实施方式。本领域技术人员不难得出其他的实施方法而不违背本发明的总体思想。
其中,可以选取其他的点阵图像作为原始的点阵输入,比如经过调幅挂网、或者自行设计的任何规则、不规则由网点组成的点阵图像;其中,可以采用其他的信息编码方法,比如使用网点的位置大小的比例关系的不同代表不同的位串信息,并且位串的分解的粒度可以增大或者减少,比如根据一定的规则代表“0”或者“1”信息。
其中,可以隐藏任意的字符串信息,包括任何从其他文本格式文件读取的字符流,比如*.doc,*.txt等。
其中,可以采用其他的位串信息流的正确性检测方法,比如奇偶校验或者其他循环码的校验方法。
权利要求
1.一种在文本文档中嵌入数字水印的方法,包括以下步骤(1)准备原始点阵图像,所述原始点阵图像由网点组成,其中用作编码点的网点的位置变化代表了水印信息;(2)获取水印信息,并对信息做预处理;(3)在原始点阵图像中埋入预处理后的水印信息;(4)将埋入水印信息的点阵图像数据与正常文档数据打印输出。
2.如权利要求1所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(1)中,原始点阵图像为调幅挂网、调频挂网、调频调幅混合挂网或由自主设计的网点组成。
3.如权利要求1所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(1)中,原始点阵图像事先设计好或根据一定规则动态生成。
4.如权利要求1所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(1)中,网点表现的灰度值区间为3%~15%。
5.如权利要求1、2、3或4所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(1)中,原始点阵图像中的网点类型分为三类A编码点,这些网点的位置变化代表了水印信息,每个编码点与周围其他网点之间的距离为2~5个网点大小;B不动点,在信息隐藏的过程中,这些网点的位置不发生变化;C扰动点,为了防止编码方式被破解,并调整点阵图像的视觉效果,这些网点在编码过程中作随机方向的偏移。
6.如权利要求1、2、3或4所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(2)中获取水印信息并对信息做预处理包括以下步骤a.获取要隐藏的字符即要嵌入的水印信息;b.将字符串转化成二进制的位串信息流;c.对位串信息流进行加密,并得到密文位串信息流。
7.如权利要求5所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(2)中获取水印信息并对信息做预处理包括以下步骤a.获取要隐藏的字符;b.将字符串转化成二进制的位串信息流;c.对位串信息流进行加密,并得到密文位串信息流。
8.如权利要求7所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤a中,隐藏的字符即要嵌入的水印是当前用户名、用户密码、网卡的MAC即介质访问控制地址、计算机的IP地址、文档打印时间、打印日期、作业名称、作业ID信息、自定义的字符串或者从文本文件中输入的文本信息。
9.如权利要求8述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(2)中获取水印信息并对信息做预处理还包括以下步骤d.根据步骤c所得到的密文位串信息流计算数据检测校验码,并将它追加到原始的密文位串信息流的前面。
10.如权利要求9所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(2)中,在转化后的位串信息流的前面插入字节流,用于记录每个子字符串的长度。
11.如权利要求10所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(3)中,点阵图像中的网点向八个不同的方向偏移,通过位置的不同变化来埋入密文位串信息流。
12.如权利要求1、2、3或4所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(4)中将埋入水印信息的点阵图像数据与正常文档数据打印输出时,将嵌入水印信息后的点阵图像进行拼接,拼接时先根据点阵图像的外接矩形框大小,将版面区域进行合理随机分割;然后将每个点阵图像随机旋转90、180或270度;最后再将每个分割后的单元数据用单位点阵图像数据代替,拼接完成后得到完整页面的背景底纹。
13.如权利要求12所述的一种在文本文档中嵌入数字水印的方法,其特征是步骤(4)中,首先通过打印驱动截获处理后的正常文档的数据,保存在内存中,当接收到拼接处理后的背景底纹数据时,从内存中读取事先存储的正常文档数据,将它们追加到背景底纹数据的后面,并把结合的数据重新用页面描述语言解释后输出到相应的页面描述文件中,最后把数据文件传送给打印控制器进行打印输出。
14.一种在文本文档中嵌入数字水印的装置,包括以下部分a.隐藏信息获取和处理装置该装置获取要处理的计算机数据,从内存中得到相应的数据代码,转化为一个完整的位串信息流,然后对位串信息流进行加密处理后得到一个新的密文位串信息流,并送到信息埋入装置;b.信息埋入装置该装置将密文位串信息流按位分解成一定数目的子串,通过网点的位置变化把每个子串代表的水印信息隐藏在选定的原始点阵图像;c.底纹生成装置该装置将嵌入水印信息后的点阵图像进行拼接,组成完整页面的背景底纹,然后送到打印输出模块装置;d.打印输出装置该装置将正常文档数据和含有隐藏信息的背景底纹数据合并成一个页面描述文件,然后一并进行打印输出。
15.如权利要求14所述的一种在文本文档中嵌入数字水印的装置,其特征是隐藏信息获取和处理装置获取和处理的计算机数据是各种文字、数字、字符和字母,以及包括视频、音频在内的可数字化的信息。
16.如权利要求14或15所述的一种在文本文档中嵌入数字水印的装置,其特征是底纹生成装置中还备有在拼接后的背景底纹点阵对象上隐藏警示文字信息的生成装置。
17.一种在文本文档中检测数字水印的方法,包括以下步骤(1)对含有水印信息的文档进行扫描或摄取,得到文本数字化后的图像数据;(2)扫描获取的数字图像数据,并获得加密后的位串信息流;(3)使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
18.如权利要求17所述的一种在文本文档中检测数字水印的方法,其特征是步骤(2)中,通过识别隐藏水印信息的图像块的定位点,计算扫描图像的旋转角度和缩放比例。
19.如权利要求17所述的一种在文本文档中检测数字水印的方法,其特征是步骤(2)中,根据图像的旋转角度和缩放比例,扫描每个编码点,并计算其位移变化,从而得到每个子位串,顺序将其组合为一个完整的位串信息流。
20.如权利要求18或19所述的一种在文本文档中检测数字水印的方法,其特征是步骤(2)中,扫描多个图像块的定位点,通过一个图像块中的编码点位移信息,来补偿另外一个图像块中相同编码点由于被前景内容或干扰因素影响而带来的信息丢失。
21.如权利要求17所述的一种在文本文档中检测数字水印的方法,其特征是步骤(3)中,取出密文位串信息流的前面用于存储校验数据的字节流,并使用数据校验算法对密文位串信息流进行正确性校验。
22.如权利要求21所述的一种在文本文档中检测数字水印的方法,其特征是步骤(3)中,使用特殊密钥对去除校验数据的密文位串信息流解密,并取出解密后的明文位串信息流中插入的各字段长度信息,然后顺序解码出各字段的字符串信息。
23.一种在文本文档中检测数字水印的装置,包括以下部分(a)文本数字化装置该装置对含有底纹的文档进行扫描,得到文本数字化后的图像数据;(b)图像识别装置该装置对文本数字化模块扫获取的数字图像数据进行扫描检测,并获得加密后的位串信息流;(c)信息解码装置该装置使用特殊的密钥对密文位串信息流解密,然后解码出原始的字符串信息。
24.如权利要求23所述的一种在文本文档中检测数字水印的装置,其特征是图像识别装置中包含有特定图像区域的采样装置和图像预处理装置;所述的采样装置是在图像中部选取条状区域和计算象素点的灰度值区间和网点半径的处理装置;所述的预处理装置是计算图像的旋转角度和缩放比例的处理装置。
全文摘要
本发明涉及一种在文本文档中嵌入及检测数字水印的方法和装置,属于文档保护技术领域。现有技术中,埋入的水印信息识别率较低,不能适应文档复印和缩放的攻击,藏入的信息量较少。本发明所述的方法及装置通过正常文档的底部额外叠加打印一层用来记录大量水印信息的底纹,该底纹是由按照一定规则排列的网点组成,网点的位置变化记录了水印信息流中的每个位串。采用本发明所述的方法及装置,藏入信息量增大,底纹中嵌入的水印信息将随着文档一起传播,必要时可以通过扫描仪将文档数字化后进行检测。即使文档被弄脏、被折叠或者缩放复印后,仍能以高精度检测出其中隐藏的水印信息。因此,本发明可以广泛应用于文档加密、追踪、控制文档非法传播以及版权的技术保护。
文档编号G06F1/00GK1790420SQ20051012572
公开日2006年6月21日 申请日期2005年12月1日 优先权日2005年12月1日
发明者杨斌, 史文哲, 亓文法, 程盛远, 王立东 申请人:北京北大方正电子有限公司, 北京大学