多媒体网站的拆分及重现方法

文档序号:7963706阅读:366来源:国知局
专利名称:多媒体网站的拆分及重现方法
技术领域
本发明属于计算机网络技术领域,尤其涉及互联网的有效应用和网上资源的保护。
背景技术
随着网络时代的来临,人们越来越多地享受到网络给人们带来的便利。互联网的魅力之一就在于各个网站将丰富的多媒体素材通过网页的形式组织,供人们浏览使用,这也是互联网在全球兴起的重要原因之一。
传统网站的多媒体素材放在网站的服务器上,当用户浏览网站的网页时,用户计算机的互联网浏览器先把存放在服务器中的网页HTML文档下载到用户计算机中,按照此HTML文档显示;如果此网页内嵌有图像等多媒体素材,则将这些多媒体素材一一从服务器下载到用户计算机中并显示;如果网页含有多媒体链接,则当用户点击该链接时,首先将链接的多媒体素材从服务器下载到用户计算机里,然后互联网浏览器选择适当的工具将该多媒体素材再现出来。
目前,几乎所有的网站提供者都是采用这种形式的技术对用户提供多媒体素材服务,即简单地在服务器中以HTML文档标准组织各种网页和多媒体素材,使用户得以浏览、使用这些网页和多媒体素材。但是,这种技术存在着两个主要的不足第一,用户欲浏览使用的所有HTML文档和多媒体素材都需要通过互联网下载。其中,HTML文档通常较小,于是大量的网络带宽被用于下载数据量很大的多媒体素材部分。如果用户的网络连接带宽小,则要耗费大量时间。
第二,多数互联网浏览器提供了将网页内嵌的多媒体素材和多媒体链接素材原样下载到用户计算机中的功能,使用户可以在不上网的情况下使用这些多媒体素材,但网站提供者并不希望用户能够不受限制地使用,甚至修改、出售这些多媒体素材。因此,这种互联网浏览器提供的功能显然不符合知识产权保护的需要,网站提供者只能无奈地在网页上注明所拥有的知识产权,并希望用户能够自觉地遵守相关的法律。但事实上,由于目前人们的法律意识不强,这种寄希望于用户自觉保护的方式远远不能从根本上达到保护知识产权的目的。

发明内容
本发明的目的是提供一种多媒体网站的拆分及重现方法,一方面使用户浏览网上多媒体素材时极少占用网络带宽,另一方面使用户无法将网站提供的仅供浏览使用的多媒体素材随意使用。
本发明的原理是将现有网站中的多媒体素材从网站中分离出来,经过加密压缩后作为客户方部分(例如放入光盘中),并对网站中原有的HTML文档作相应修改,使其能够正确引用已加密压缩并作为客户方部分的多媒体素材。这样,原网站的内容被拆分为客户方部分和服务器中的资料两部分。用户在装有客户方部分的计算机上浏览网站时,由从网站服务器下载的解密解压缩程序将客户方部分中的加密压缩过的素材解密解压缩,然后重现网页。用这种方法,客户方部分中的加密压缩素材本身无法直接使用,同时用户也无法将在互联网浏览器中显示的解密解压缩过的多媒体素材另存起来,单独使用。在这个过程中,用户计算机上必须装有客户方部分,同时还需上网访问提供客户方部分的网站,才能浏览到此网站提供的含有丰富多媒体素材的完整网页。考虑到无论是网站提供者还是浏览该网站的用户,他们的计算机都可能是基于不同平台的,为使本发明的方法更能够普遍适用,我们的发明基于各平台通用的Java技术。
本发明的具体技术方案是多媒体网站的拆分及重现方法,包括拆分和重现。拆分是遍历整个网站,对其内容进行分析,将网站拆分为两部分一部分是客户方(例如光盘)中的文件,它们是本身无法直接使用的加密压缩多媒体素材,另一部分是服务器端的经过对网站中原HTML文档修改后能够正确引用客户方部分加密压缩多媒体素材的伪网页;重现是用户在装有上述第一部分内容的计算机上浏览含有上述第二部分内容的网站时,相关的伪网页被自动处理,生成正式网页文档,再由嵌入其中的解密解压缩程序将客户方多媒体素材读出并解密解压缩,结合生成的本地HTML文档重现网页,这种方法使用户无法将在互联网浏览器中显示的解密解压缩过的多媒体素材保存在用户计算机中。
所述拆分过程中,当处理某一文件时,分为三种情况处理
(1)如果这个文件是多媒体素材文件,则将其加密、压缩并作为客户方部分,其中经过加密压缩处理后的多媒体素材文件本身无法直接被使用;(2)如果这个文件是原网站中的HTML文档,则将其进行修改,使其能够正确引用已加密压缩并作为客户方部分的多媒体素材,并将用户客户方部分的路径由Unknowndirectory标示,这样的HTML文档不是真正意义上的网页,而是一个网页模板,我们称之为伪网页;(3)如果这个文件是其他种类的文件,则不作处理。
上述将原网站中的HTML文档修改成伪网页的方法如下(1)首先对原HTML文档作词法分析,得到HTML标签;(2)分析该标签的性质,如果是对欲处理的多媒体素材的引用,则将该标签规格化,并提取其中的各个属性,这些属性用于构造Applet参数,生成Applet引用;如果不在处理范围内,则原标签不做改动;(3)生成伪网页。
所述重现网页内容具体方法如下(1)处理伪网页用户登录网站时由一个嵌入页面中的可信任签名小程序Signed Java Applet从用户本地的安全策略文件中得到用户客户方部分的路径(如光盘路径,或用户将客户方部分安装到本地硬盘后的路径等),再处理伪网页,用Signed Java Applet得到的客户方部分的路径替换伪网页中的Unknowndirectory,得到正式网页文档;(2)由嵌入网页中的Signed Java Applet实时解密解压缩用户客户方部分的相应加密压缩多媒体素材,并按原始网页的表现形式进行重现。
本发明的优点和积极效果采用上述技术方案后,互联网网站的内容被拆分为客户方部分和服务器中的资料两部分。持有客户方部分的用户浏览网站时,由从网站服务器下载的解密解压缩程序将客户方部分中的加密压缩过的素材解密解压缩,然后重现网页,用户不必耗费大量时间从网站服务器下载多媒体素材,从而使用户浏览含有多媒体素材网页的速度大大加快,节省大量的网络带宽。发明人曾经做过一个试验,在拨号上网的时候(用56Kbps的Modem),浏览一个包含较多图片的网页(650KB),需用时2分钟;采用本发明的技术方案处理后,只需要15秒,而显示效果没有任何改变,速度是原来的8倍。浏览的网页中所含多媒体数据越多,效果越明显。
其次,用户客户方部分中的加密压缩素材本身无法直接使用,在互联网浏览器中显示的多媒体素材无法直接保存到用户计算机中,从而起到了保护知识产权的作用。
另外值得一提的是,目前很多多媒体光盘就是用HTML形式组织的,这样做的好处之一是可以使光盘与网站的形式一致,可以更方便地制作光盘内容。这里面当然不存在网络带宽问题,但用户可以直接使用光盘中的原始多媒体素材,甚至对其复制、扩散等。采用本发明的技术方案,也可以对这种光盘进行处理,可以使用户无法直接使用客户方部分中的多媒体素材,以达到保护的作用。


图1为本发明的多媒体网站的拆分方法流程图。图中,1-定位网站中的一个文件;2-判定文件的类型是否为多媒体素材文件;3-将多媒体素材文件加密压缩;4-判定文件的类型是否为HTML文档;5-修改HTML文档中的HTML标签生成伪网页;6-判定网站中的文件是否遍历完;7-将加密、压缩后的多媒体素材作为客户方部分;图2为本发明的多媒体网站的重现方法流程图。图中,8-处理伪网页,以用户客户方部分的路径替换伪网页中的Unknowndirectory,得到正式网页,传回浏览器;9-嵌入页面中的小程序解密、解压缩用户客户方部分的多媒体素材;10-重现网页实施例如附图1和附图2所示,本实施例包括两部分一是网站的拆分和多媒体素材的加密压缩;二是多媒体素材的解密解压缩和网页的重现。本实施例基于各平台通用的Java技术。
一、网站的拆分和多媒体素材的加密压缩如附图1所示,遍历整个网站,对其内容进行分析,将网站拆分为服务器端的伪网页和客户方部分的加密压缩过的多媒体素材两部分。
当处理某一文件时,分为三种情况1.如果这个文件是多媒体素材文件,则将其加密、压缩并作为客户方部分;客户方部分中的加密压缩素材本身无法直接使用;同时用户也无法将在互联网浏览器中显示的解密解压缩过的多媒体素材另存起来,单独使用;2.如果这个文件是原网站中的HTML文档,需要对其进行修改,使其能够正确引用已加密压缩并作为客户方部分的多媒体素材。由于在重现网页时需要针对不同的用户确定客户方部分的路径,因此在网站拆分时将用户客户方部分的路径由Unknowndirectory标示,这样的HTML文档不是真正意义上的网页,而是一个网页模板,我们称之为伪网页。因此我们要将HTML文档修改为相应的伪网页。修改方法如下(1)首先对原HTML文档作词法分析,得到HTML标签;(2)分析该标签的性质,如果是对欲处理的多媒体素材的引用,则将该标签规格化,并提取其中的各个属性,这些属性用于构造Applet参数,生成Applet引用;如果不在处理范围内,则原标签不做改动;(3)生成伪网页。
3.如果这个文件是其他种类的文件,则不作处理。
二、网页的重现如附图2所示传统的将远程服务器资料和用户计算机中的素材相结合显示网页的技术一般是通过file协议对用户计算机中的素材进行引用。这种方法中,用户计算机中的素材必须是原始素材,而不能是加密压缩过的素材,这样无利于知识产权的保护。同时,这种对客户方素材的引用是固定写在网页文档中的,不符合人们创建网站的基本习惯,而且要求用户将素材文件放在一个固定的目录位置,从而会引起不便。本发明要对放在用户计算机中的加密、压缩过的素材进行处理,然后重现网页,而且要求完成此功能的程序和用户计算机平台无关。
由上述要求,不同于file协议,我们使用嵌入页面中的签名Java小应用程序(Signed Java Applet)完成远程服务器资料和用户客户方部分中的加密、压缩过的素材相结合以重现网页。1.处理伪网页用户登录网站时由一个嵌入页面中的可信任签名小程序SignedJava Applet从用户本地的安全策略文件中得到用户客户方部分的路径,再处理伪网页,用Signed Java Applet得到的用户客户方部分的路径替换伪网页中的Unknowndirectory,得到正式网页文档;2.由Signed Java Applet解密解压缩用户客户方部分中的加密、压缩过的多媒体素材首先,需要使Java Applet能够读取用户客户方部分中的文件。但是Java的安全结构对Applet的行为有一定限制,一般Applet是无法读取用户计算机中的文件的。在Java 2中,运行系统的安全行为由安全策略指定,即可以通过在安全策略中指定某些经过数字签名的代码,使其具有访问某种系统资源的权限,这里可以指定访问用户计算机文件的权限。这些安全策略在用户计算机中的策略文件中指定。因此,为了使Applet能够读取本地文件,首先需要在用户计算机中部署并生成策略文件。这些工作在用户安装客户方部分时完成。
3.重现网页本发明改变了网页中部分对多媒体素材的引用方式,对于其他没有经过改动的部分,当然应该能够被用户的互联网浏览器正确显示。重现网页的关键是使处理前后对多媒体素材引用的表现一致。
本发明用嵌入页面中的Signed Java Applet对客户方的加密压缩素材进行处理,并将解密解压缩后的数据作为多媒体素材重现。下面举例说明三种情况的引用方法(a)img src=Picture-URL形式的引用采用Applet代替原网页中的图片,该Applet将用户客户方部分中的加密压缩素材解密解压缩并显示,将这种引用称为本地Applet引用;(b)href=Picture-URL形式的引用互联网浏览器对此种形式引用的表现是打开一个新浏览窗口,在这个新窗口内显示链接路径为Picture-URL的图片。因此,对于这种情况,将原链接改为链接到本发明生成的一个服务器端的伪网页,这个伪网页的内容是对链接路径为Picture-URL的图片进行的本地Applet引用;(c)href=Audio-URL/Vedio-URL形式的引用由于Java对音频和视频文件没有全面而一致的支持,因此播放音频或视频文件不宜由Java Applet完成。当互联网浏览器发现链接文件的类型是音频或视频文件时,就寻找用户系统中的播放工具播放该文件。我们也用这种方法处理,将寻找播放工具的任务交给浏览器完成。因此,先由Applet将用户客户方部分中的加密压缩素材解密解压缩,生成临时文件,然后告知浏览器对这个临时文件进行播放,播放后再由Applet删除该文件。
这里的问题是如何告知浏览器播放该临时文件。如果直接将链接位置改为相应的临时文件位置,当用户点击这个链接时,就会出现是否下载或打开该文件的选择,这样用户就可得知该临时文件的位置并可以选择“下载”复制这个已经经过解密解压缩后的临时文件,这样就不能起到保护的作用。本发明的策略是通过HTML文档来进行引用。在HTML文档中,将播放工具作为标准对象引用,浏览器寻找播放工具;同时在HTML文档中指定临时文件的位置。这样用户无法直接找到临时文件的位置,就可以起到保护的作用。该HTML文档是在解密解压缩用户客户方部分的素材完成后生成的,这样才能得知临时文件的位置,因此这是本地HTML文档。
对于由Applet打开该HTML文档,这里还有一个问题,如果是在新的窗口中打开该HTML文档,就会多出一个Applet窗口,使用户感到奇怪;而如果是在同一窗口中打开,则是由该HTML文档代替Applet,这样Applet的运行即结束,无法在退出时删除临时文件。
考虑到HTML中的Frame技术可以将两个窗口合成在一个窗口中显示,本发明就利用Frame来进行工作。因此对这种形式引用多媒体素材的处理方法是在服务器端生成一个HTML文档,其中包含2个Frame一个Frame的宽为0,这个Frame包含一个Signed Java Applet;另一个Frame指定Frame_Name;SignedJava Applet将本地加密压缩素材解密解压缩到临时文件并且生成本地HTML文档,在该本地HTML文档引用播放工具对象播放该临时文件;Signed Java Applet在名为Frame_Name的Frame中打开该本地HTML文档,当用户离开该窗口时将临时文件删除。
以上是如何结合服务器端HTML文档、本地HTML文档、客户方部分的多媒体素材和处理本地加密压缩素材的Applet来重现网页。
下面结合源代码进一步地举例说明拆分时如何将原网站中的HTML文档修改成为伪网页。如网页中的如下一段源代码
<pre listing-type="program-listing"><![CDATA[<td width=″20%″align=center><img src=″john.jpg″width=″118″height=″180″alt=″John.jpg″></td>]]></pre>拆分时经过分析,其中有内嵌图片的标签,因此对此部分修改为<pre listing-type="program-listing"><![CDATA[<td width=″20%″align=center><OBJECT classid=″clsid8AD9C840-044E-11D1-B3E9-00805F499D93″ width=″118″height=″180″alt=″John.jpg″codebase= ″http//java.sun.com/products/plugin/1.3/Jinstall-13- win32.cab#version=1,3,1,0″><PARAM NAME=CODE VALUE=decodel.class><PARAM NAME=ARCHIVE VALUE=″/signedDecode.jar″><PARAM NAME=″type″VALUE=″application/x-java-applet;version=1.3″><PARAM NAME=″stufile″ VALUE=″Unknowndirectory/pppsource/students/john.jtt″><COMMENT><EMBED type=″application/x-java-applet;version=1.3″ java_CODE=decodel.class archive=″/signedDecode.jar″ width=″118″height=″180″alt=″John.jpg″ stufile=″Unknowndirectory/pppsource/students/john.jtt″pluginspage=″http//java.sun.com/products/plugin/1.3/plugin-install.html″><NOEMBED></COMMENT></NOEMBED></EMBED></OBJECT></td>]]></pre>
权利要求
1.多媒体网站的拆分及重现方法,其特征在于,拆分是遍历整个网站,对其内容进行分析,将网站拆分为两部分一部分是客户方中的文件,它们是本身无法直接使用的加密压缩多媒体素材,另一部分是服务器端的经过对网站中原HTML文档修改后能够正确引用客户方加密压缩多媒体素材的伪网页;重现是用户在装有上述第一部分内容的计算机上浏览含有上述第二部分内容的网站时,相关的服务器端伪网页被自动处理,生成正式网页文档,再由嵌入其中的解密解压缩程序将客户方多媒体素材读出并解密解压缩,结合生成的本地HTML文档重现网页,这种方法使用户无法将在互联网浏览器中显示的解密解压缩过的多媒体素材保存在用户计算机中。
2.一种如权利要求1所述的多媒体网站的拆分及重现方法,其特征在于拆分过程中,当处理某一文件时,分为三种情况处理(1)如果这个文件是多媒体素材文件,则将其加密、压缩并作为客户方部分,其中经过加密压缩处理后的多媒体素材文件本身无法直接被使用;(2)如果这个文件是原网站中的HTML文档,则将其进行修改,使其能够正确引用已加密压缩并作为客户方部分的多媒体素材,并将客户方部分的路径由Unknowndirectory标示,这样的HTML文档不是真正意义上的网页,而是一个网页模板,我们称之为伪网页;(3)如果这个文件是其他种类的文件,则不作处理。
3.一种如权利要求2所述的多媒体网站的拆分及重现方法,其特征在于将原网站中的HTML文档修改成伪网页的方法如下(1)首先对原HTML文档作词法分析,得到HTML标签;(2)分析该标签的性质,如果是对欲处理的多媒体素材的引用,则将该标签规格化,并提取其中的各个属性,这些属性用于构造Applet参数,生成Applet引用;如果不在处理范围内,则原标签不做改动;(3)生成伪网页。
4.一种如权利要求1所述的多媒体网站的拆分及重现方法,其特征在于重现网页内容方法如下(1)处理伪网页用户登录网站时由一个嵌入页面中的可信任签名小程序Signed Java Applet从用户本地的安全策略文件中得到客户方部分的路径,再处理伪网页,用Signed Java Applet得到的客户方部分的路径替换伪网页中的Unknowndirectory得到正式网页文档;(2)由嵌入网页中的Signed Java Applet实时解密解压缩客户方相应的加密压缩过的多媒体素材,并按原始网页的表现形式进行重现。
全文摘要
本发明公开了一种多媒体网站拆分及重现方法。拆分是指:遍历网站的所有文件,进行相关处理,将结果分为两部分,一部分是放在客户方的文件,它们是本身无法被直接浏览的加密压缩多媒体素材,另一部分是保留在服务器端的对网站中原HTML网页文档修改后得到的伪网页。重现是指:当用户在安装有上述第一部分内容的计算机上访问含上述第二部分内容的网站时,相关的伪网页被自动处理,生成正式网页文档,再由嵌入其中的解密解压缩程序将客户方多媒体素材读出并解密解压缩,一起生成在客户端浏览器能正确浏览的、行为与原始网页一致的完整网页。采用本发明的方法,用户浏览含大量多媒体素材的网站时可极少占用网络带宽,且无法将仅供浏览使用的多媒体素材下载并随意使用。
文档编号H04L29/06GK1337808SQ01141419
公开日2002年2月27日 申请日期2001年9月24日 优先权日2001年9月24日
发明者李晓明, 王冲, 王韬 申请人:北京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1