多媒体数据盗版追踪方法

文档序号：6459964阅读：320来源：国知局

专利名称：多媒体数据盗版追踪方法
技术领域：
本发明属于数字版权保护技术领域，，特别涉及一种多媒体数据盗版追踪方法。

背景技术：
对于多媒体服务提供商，一般会将多媒体内容分发给广大用户。其中某些不良用户会非法地将内容散布到如互联网等公用网络中去，这将损害多媒体内容和服务提供商的利益。
对于多媒体相关服务，需要内容检索和版权保护相关技术支持。内容检索是指在内容数据库中找到某个内容，而版权保护是指对所有权的保护、版权泄漏者的身份追踪等。现有的专利和文献中均是独立地实现了两部分的功能。例如，专利[P1]中的内容检索方法用于基于图像特征提取和匹配的图像检索目的。此方法中，图像的某些特征被提取，并和存在数据库中图像所提取的特征进行比较，或者直接和存放在数据库中的特征进行比较，能找到一个或多个匹配的图像。内容检索系统很少考虑版权保护应用。对于版权保护，数字水印方法会经常用到将版权信息透明地嵌入到多媒体内容中来实现版权认证。专利[P2]声明的数字水印保护方法中，在分发媒体内容之前会先嵌入所有者信息。给定内容和同时存放的相应的关键词，能够实现对内容数据库中的内容搜索。然后通过检测内容中是否含有水印信息，来判断内容的合法性。然而，该系统由于同时存放内容和关键词，耗费太多的存储空间。其次，对于互联网上的内容，存储和检索关键词是很困难的事情。另外，内容所有权信息并不能指认非法的内容散布者。
[P1]GILLES SEBASTIEN；WINTER ALEXANDRE；POIRIER NATHALIE.Image oraudiovisual sequence extraction method for extraction of an image oraudiovisual sequence from an image flux，wherein images are analyzed togenerate a reference index and this is compares with the current index.FR2843212.2003. [P2]FUJII TAKEYA.SYSTEM FOR SEARCHING ILLEGITIMATE USE OF CONTENTS.JP2004112318.2004.

发明内容
本发明目的在于针对现有技术的不足，提出一种高效率的多媒体数据盗版追踪方法，能够方便地在大信息容量的网络中追踪给定媒体内容的非法拷贝及相应的非法传播用户。
本发明的技术方案为首先进行媒体侦探搜索，从网络搜集获取媒体内容资源；然后通过分层过滤实现追踪，包括有以下三个步骤，步骤1.1，第一层过滤，用于根据近似信息过滤媒体内容资源，得到与给定媒体内容具有相似性的媒体内容集合；步骤1.2，第二层过滤，用于根据精确信息过滤媒体内容集合，得到与给定媒体内容相符的拷贝媒体内容；步骤1.3，第三层过滤，用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息，然后参照预存在用户码数据库中的用户码，追踪到非法的拷贝媒体内容和非法传播用户。
而且，所述媒体侦探搜索的实现方式包括以下步骤，步骤2.1，获取给定媒体内容的媒体类型信息；步骤2.2，以所得媒体类型信息为关键词，从网络中收集与给定媒体内容类型相同的媒体内容，作为媒体内容资源。
而且，给定媒体内容的媒体类型信息从给定媒体内容的头信息中提取。
而且，从网络中收集与给定媒体内容类型相同的媒体内容后，存储到多媒体数据库中，以便作为媒体内容资源提供。
而且，步骤1.1中，根据近似信息过滤媒体内容资源的具体实现方式为对媒体内容资源中的待判断媒体内容逐一处理，处理过程包括以下步骤，步骤5.1，从给定媒体内容M中获取近似信息A，从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’；步骤5.2，根据近似信息A和近似信息A’获取平均近似值|A′-A|；步骤5.3，将平均近似值和预设近似阈值T0比较，如果|A′-A|≤T0，判定待判断媒体内容M’与给定媒体内容M具有相似性，加入媒体内容集合，否则过滤掉待判断媒体内容M’。
而且，所述获取近似信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块的DC系数提取出来，所获取的信息量L即提取DC系数的个数，得到标志近似信息的序列a(i)＝a(0)，a(1)，…，a(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，近似信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0是大于零的整数，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；获取近似信息A＝a1(i)和近似信息A’＝a2(i)后，求取平均近似值而且，步骤1.2中，根据精确信息过滤媒体内容资源的具体实现方式为对媒体内容集合中的任一待判断媒体内容逐一处理，处理过程包括以下步骤，步骤7.1，从给定媒体内容M中获取精确信息B，从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’；步骤7.2，根据精确信息B和精确信息B’获取平均精确值|B′-B|；步骤7.3，将平均精确值|B′-B|和预设精确阈值T1比较，如果|B′-B|≤T1，判定待判断媒体内容M’与给定媒体内容M相符，将其认定为拷贝媒体内容，否则过滤掉待判断媒体内容M’。
而且，所述获取精确信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块中的头5个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志精确信息的序列b(i)＝b(0)，b(1)，…，b(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0是大于零的整数，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；获取精确信息B＝b1(i)和精确信息B’＝b2(i)后，求取平均精确值而且，步骤1.3的具体实现方式包括以下步骤，步骤9.1，从给定媒体内容M中获取身份识别信息C，从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’；步骤9.2，参照预存在用户码数据库中的第j个用户码Fj(j＝0，1，…，S-1)，其中S是用户码的个数，获取第j个身份识别信息值<C′-C，Fj>；步骤9.3，比较第j个身份识别信息值<C′-C，Fj>和预设身份识别阈值T2，如果<C′-C，Fj>≥T2，判定第j个用户为非法传播用户，否则调整j值并返回执行步骤9.2和9.3，直到找到非法传播用户。
而且，所述获取身份识别信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块中的第6～15个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志身份识别信息的序列c(i)＝c(0)，c(1)，…，c(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0、q1是大于零的整数，且q0＞q1，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；获取身份识别信息C＝c1(i)和身份识别信息C’＝c2(i)后，求取第j个身份识别信息值本发明提供了一种适应在互联网等公用网络环境中有效跟踪非法拷贝和追踪非法传播用户的技术方案。网络中包含的媒体内容是海量数据，本发明首先按照与给定媒体内容相同类型的标准搜索，然后按照具有相似性的标准根据近似信息初步过滤，最后根据精确信息过滤确定出与给定媒体内容相符的拷贝媒体内容，即可按照身份识别信息追索出非法传播用户。通过分层过滤实现追踪可以有效降低处理信息量，因此具有高效率性。本发明还提供了近似信息、精确信息和身份识别信息的提取方案，进一步提高了追踪准确性。

图1为本发明实施例原理示意图；图2为本发明实施例媒体侦探搜索示意图。
图3为本发明实施例分层过滤追踪示意图。

具体实施例方式 以下结合附图详细说明本发明的技术方案参见附图1，本发明的技术方案是首先进行媒体侦探搜索，从网络搜集获取媒体内容资源，然后通过分层过滤实现追踪。实施时，可以从网络中收集与给定媒体内容类型相同的媒体内容后，存储到多媒体数据库中，以便作为媒体内容资源提供。本发明实施例是从互联网中进行多媒体侦探，搜索出所有多媒体构成多媒体库源，即是媒体内容资源。参见附图2，本发明实施例的媒体侦探搜索分为两步骤获取给定媒体内容的媒体类型信息；以所得媒体类型信息为关键词，从网络中收集与给定媒体内容类型相同的媒体内容，作为媒体内容资源。给定媒体内容的类型可由头文件信息决定。按照先行多媒体格式标准，互联网中每一媒体对象都应包含说明媒体类型的头文件信息，因此实现非常方便。具体实施时也可考虑通过媒体内容长度等信息进行搜索。
媒体内容可以分割为几个部分，包括近似信息、精确信息、身份识别信息等互相独立从最有意义到最无意义的排序的信息。意义表明对媒体内容质量的重要性。因此本发明利用这些信息进行分层过滤第一层过滤，用于根据近似信息过滤媒体内容资源，得到与给定媒体内容具有相似性的媒体内容集合，可简称为媒体集合。第二层过滤，用于根据精确信息过滤媒体内容集合，得到与给定媒体内容相符的拷贝媒体内容，由于往往不止搜索出一份拷贝媒体内容，也简称为拷贝集合。媒体集合和拷贝集合表达了整体的含义，具体实施时，可以将集合内容整体收集存储后进行下一层过滤，也可以采用更高效的实时处理做法，直接将本层过滤得到属于相应集合中的待判断媒体内容M’送入下层过滤。第三层过滤，用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息，然后参照预存在用户码数据库中的用户码，追踪到非法的拷贝媒体内容和非法传播用户。
具体实施时，提取身份识别信息的方式与媒体内容在分发给用户之前加入数字指纹的方式有关。简要的说，就是用户码F嵌入到媒体内容X，就会得到X’传送到用户端。本发明将每个用户相应的用户码预存在用户码数据库中，就可供过滤时进行比对。现有技术有多种编码嵌入方法在媒体内容中嵌入用户码，例如参考文献[1][2][3]，本发明实施例采取最常用的加性嵌入方法[4]。提取身份识别信息是追踪到非法传播用户的关键，具体实施时提取近似信息、精确信息的方式可以参考身份识别信息的提取情况。
[1]I.J.Cox，J.Kilian，T.Leighton and T.ShamoonSecure SpreadSpectrum Watermarking for Multimedia.IEEE Trans.on Image Processing，Vol.6，No.12.(1997)1673-1687. [2]Qiang Cheng and Thomas S.HuangOptimum Detection and Decoding ofMultiplicative Watermarks in DFT Domain.Proceedings of IEEEInternational Conference on Acoustics，Speech and Processing，Vol.4.(2002)3477-3480. [3]P.Bas，J.-M.Chassery and B.MacqGeometrically InvariantWatermarking Using Feature Points.IEEE Trans.Image Processing，Vol.11，No.9.(2002)1014-1028. [4]Q.Cheng，T.S.Huang.An Additive Approach to Transform-DomainInformation Hiding and Optimum Detection Structure.IEEE Transactionson Multimedia，Vol.3，No.3，pp.273-284，2001. 本发明提供了进一步方案，通过近似信息、精确信息、身份识别信息计算出一个平均数值，然后与预设阀值比较，从而实现过滤。参见附图3，本发明实施例的分层过滤方式如下第一层过滤从给定媒体内容M中获取近似信息A，从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’；根据近似信息A和近似信息A’获取平均近似值|A′-A|；将平均近似值和预设近似阈值T0比较，如果|A′-A|≤T0，判定待判断媒体内容M’与给定媒体内容M具有相似性，加入媒体内容集合，否则过滤掉待判断媒体内容M’。本发明实施例还提供了获取近似信息的方式。方式一为将图像m分割为块，每块进行DCT变换，然后将每块的DC系数提取出来，所获取的信息量L即提取DC系数的个数，得到标志近似信息的序列a(i)＝a(0)，a(1)，…，a(L-1)。方式二为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，近似信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0是大于零的整数，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数。获取近似信息A＝a1(i)和近似信息A’＝a2(i)，平均近似值第二层过滤从给定媒体内容M中获取精确信息B，从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’；根据精确信息B和精确信息B’获取平均精确值|B′-B|；将平均精确值|B′-B|和预设精确阈值T1比较，如果|B′-B|≤T1，判定待判断媒体内容M’与给定媒体内容M相符，将其认定为拷贝媒体内容，否则过滤掉待判断媒体内容M’。本发明实施例还提供了获取精确信息的方式。方式一为将图像m分割为块，每块进行DCT变换，然后将每块中的头5个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志精确信息的序列b(i)＝b(0)，b(1)，…，b(L-1)。方式二为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0是大于零的整数，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数。获取精确信息B＝b1(i)和精确信息B’＝b2(i)，平均精确值第三层过滤从给定媒体内容M中获取身份识别信息C，从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’；参照预存在用户码数据库中的第j个用户码Fj(j＝0，1，…，S-1)，其中S是用户码的个数，获取第j个身份识别信息值<C′-C，Fj>；比较第j个身份识别信息值<C′-C，Fj>和预设身份识别阈值T2，如果<C′-C，Fj>≥T2，判定第j个用户为非法传播用户，否则调整j值并返回从上步骤开始执行，直到找到非法传播用户。本发明实施例还提供了获取身份识别信息的方式。方式一为获取身份识别信息的方式为，将图像m分割为块，每块进行DCT变换，然后将每块中的第6～15个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志身份识别信息的序列c(i)＝c(0)，c(1)，…，c(L-1)。方式二为，图像m的像素是m(i)，i＝0，1，…，W×H-1，其中W×H为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式

i＝0，1，…，W×H-1，其中，q0、q1是大于零的整数，且q0＞q1，符号

表示小于等于x的整数，所获取的信息量L即为提取所得像素个数。获取身份识别信息C＝c1(i)和身份识别信息C’＝c2(i)，第j个身份识别信息值实施时，预设近似阈值T0、预设精确阈值T1、预设身份识别阈值T2是比零大的阈值即可，可以根据过滤精度需要设定。根据实施时用户码嵌入方式具体情况，可以对系数选取数目进行选择，或者对计算公式进行相应调整。
权利要求
1.一种多媒体数据盗版追踪方法，其特征在于首先进行媒体侦探搜索，从网络搜集获取媒体内容资源；然后通过分层过滤实现追踪，包括有以下三个步骤，
步骤1.1，第一层过滤，用于根据近似信息过滤媒体内容资源，得到与给定媒体内容具有相似性的媒体内容集合；
步骤1.2，第二层过滤，用于根据精确信息过滤媒体内容集合，得到与给定媒体内容相符的拷贝媒体内容；
步骤1.3，第三层过滤，用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息，然后参照预存在用户码数据库中的用户码，追踪到非法的拷贝媒体内容和非法传播用户。
2.根据权利要求1所述的多媒体数据盗版追踪方法，其特征在于所述媒体侦探搜索的实现方式包括以下步骤，
步骤2.1，获取给定媒体内容的媒体类型信息；
步骤2.2，以所得媒体类型信息为关键词，从网络中收集与给定媒体内容类型相同的媒体内容，作为媒体内容资源。
3.根据权利要求2所述的多媒体数据盗版追踪方法，其特征在于给定媒体内容的媒体类型信息从给定媒体内容的头信息中提取。
4.根据权利要求2所述的多媒体数据盗版追踪方法，其特征在于从网络中收集与给定媒体内容类型相同的媒体内容后，存储到多媒体数据库中，以便作为媒体内容资源提供。
5.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法，其特征在于
在步骤1.1中，根据近似信息过滤媒体内容资源的具体实现方式为对媒体内容资源中的待判断媒体内容逐一处理，处理过程包括以下步骤，
步骤5.1，从给定媒体内容M中获取近似信息A，从媒体内容资源中任一待判断媒体内容M’中获取近似信息A’；
步骤5.2，根据近似信息A和近似信息A’获取平均近似值|A′-A|；
步骤5.3，将平均近似值和预设近似阈值T0比较，如果|A′-A|≤T0，判定待判断媒体内容M’与给定媒体内容M具有相似性，加入媒体内容集合，否则过滤掉待判断媒体内容M’。
6.根据权利要求5所述的多媒体数据盗版追踪方法，其特征在于所述获取近似信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块的DC系数提取出来，所获取的信息量L即提取DC系数的个数，得到标志近似信息的序列a(i)＝a(0)，a(1)，…，a(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，WxH-1，其中WxH为图像m的尺寸，近似信息由分开的像素构成，提取分开的像素采用计算公式
i＝0，1，…，WxH-1，其中，q0是大于零的整数，符号
表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；获取近似信息A＝a1(i)和近似信息A’＝a2(i)后，求取平均近似值
7.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法，其特征在于在步骤1.2中，根据精确信息过滤媒体内容资源的具体实现方式为对媒体内容集合中的任一待判断媒体内容逐一处理，处理过程包括以下步骤，
步骤7.1，从给定媒体内容M中获取精确信息B，从媒体内容集合中的中任一待判断媒体内容M’中获取精确信息B’；
步骤7.2，根据精确信息B和精确信息B’获取平均精确值|B′-B|；
步骤7.3，将平均精确值|B′-B|和预设精确阈值T1比较，如果|B′-B|≤T1，判定待判断媒体内容M’与给定媒体内容M相符，将其认定为拷贝媒体内容，否则过滤掉待判断媒体内容M’。
8.根据权利要求7所述的多媒体数据盗版追踪方法，其特征在于所述获取精确信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块中的头5个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志精确信息的序列b(i)＝b(0)，b(1)，…，b(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，WxH-1，其中WxH为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式
i＝0，1，…，WxH-1，其中，q0是大于零的整数，符号
表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；
获取精确信息B＝b1(i)和精确信息B’＝b2(i)后，求取平均精确值
9.根据权利要求1或2或3或4所述的多媒体数据盗版追踪方法，其特征在于
步骤1.3的具体实现方式包括以下步骤，
步骤9.1，从给定媒体内容M中获取身份识别信息C，从任一已判断为拷贝媒体内容的待判断媒体内容M’中获取身份识别信息C’；
步骤9.2，参照预存在用户码数据库中的第j个用户码Fj(j＝0，1，…，S-1)，其中S是用户码的个数，获取第j个身份识别信息值<C′-C，Fj>；
步骤9.3，比较第j个身份识别信息值<C′-C，Fj>和预设身份识别阈值T2，如果<C′-C，Fj>≥T2，判定第j个用户为非法传播用户，否则调整j值并返回执行步骤9.2和9.3，直到找到非法传播用户。
10.根据权利要求9所述的多媒体数据盗版追踪方法，其特征在于所述获取身份识别信息，方式为将图像m分割为块，每块进行DCT变换，然后将每块中的第6～15个AC系数提取出来，所获取的信息量L即提取AC系数的总数，得到标志身份识别信息的序列c(i)＝c(0)，c(1)，…，c(L-1)；或者方式为，图像m的像素是m(i)，i＝0，1，…，WxH-1，其中WxH为图像m的尺寸，精确信息由分开的像素构成，提取分开的像素采用计算公式
i＝0，1，…，WxH-1，其中，q0、q1是大于零的整数，且q0＞q1，符号
表示小于等于x的整数，所获取的信息量L即为提取所得像素个数；
获取身份识别信息C＝c1(i)和身份识别信息C’＝c2(i)后，求取第j个身份识别信息值
全文摘要
本发明涉及一种多媒体数据盗版追踪方法，首先进行媒体侦探搜索，从网络搜集获取媒体内容资源；然后通过分层过滤实现追踪，包括有第一层过滤，用于根据近似信息过滤媒体内容资源，得到与给定媒体内容具有相似性的媒体内容集合；第二层过滤，用于根据精确信息过滤媒体内容集合，得到与给定媒体内容相符的拷贝媒体内容；第三层过滤，用于从给定媒体内容和拷贝媒体内容中分别提取身份识别信息，然后参照预存在用户码数据库中的用户码，追踪到非法的拷贝媒体内容和非法传播用户。本发明提供了一种适应在互联网等公用网络环境中有效跟踪非法拷贝和追踪非法传播用户的技术方案，通过分层过滤技术实现追踪，因此具有高效率性和准确性。
文档编号G06F21/00GK101645116SQ20081004870
公开日2010年2月10日申请日期2008年8月6日优先权日2008年8月6日
发明者叶登攀, 廉士国, 王丽娜申请人:武汉大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶登攀;廉士国;王丽娜
技术所有人：武汉大学
我是此专利的发明人

上一篇：一种媒体发布网络中的发布内容控制方法
上一篇：基于影像的数据库受损评估方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。