Web前端服务器及其网页访问请求响应方法
【专利摘要】本发明公开了一种Web前端服务器及其网页访问请求响应方法,所述方法包括:Web前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据;并根据确定出的网页数据,计算出该网页数据的特征值后,查找压缩数据表中是否记录有该特征值;若是,则将与该特征值相对应的压缩结果进行返回;否则,将确定出的网页数据压缩后进行返回。应用本发明,可很好地满足用户对网页数据的实时性显示的要求;同时与对网页数据进行压缩运算得到压缩结果相比,计算特征值的运算简单且快捷,结合压缩结果的存储,可大大提高效率,减少网页响应时间,提升用户体验;而且本发明不采用专用硬件进行网页数据压缩,成本较低。
【专利说明】Web前端服务器及其网页访问请求响应方法
【技术领域】
[0001]本发明涉及互联网领域,尤其涉及一种Web前端服务器及其网页访问请求响应方法。
【背景技术】
[0002]目前大流量的Web(网络)站点通常使用GZIP压缩技术来让用户感受更快的网页浏览速度并节约服务器带宽以节约成本。具体地,当用户访问Web前端服务器中的网页并声明支持压缩时,Web前端服务器将用户所访问的网页数据(原始数据流)进行压缩,将压缩后的网页数据传输到用户的浏览器中显示出来。对于纯文本内容,采用GZIP压缩技术一般可以将其压缩到原始大小的40%。因此,这种将网页数据压缩后进行传输的方式,可以有效地节约网络带宽,提升用户体验。
[0003]目前,基于GZIP压缩技术,Web前端服务器响应网页访问请求的方式有两种。一种方式是针对用户的每一次访问,Web前端服务器均使用专门的压缩软件对用户所访问的网页数据进行压缩后返回给用户,但这种针对一次访问便进行一次网页数据压缩运算的方式,数据压缩效率较低,在访问量巨大时效率不高,用户体验欠佳。另一种方式是针对用户的每一次访问,Web前端服务器均使用专用硬件对用户所访问的网页数据进行压缩后返回给用户,与使用压缩软件进行压缩的方式相比,该方式压缩速度较快,用户体验较佳,但该方式需要专用硬件的支持,成本较高且部署和升级困难。
[0004]为节约网络带宽,提升用户体验,现有技术中还有一种设置缓存服务器的方式:缓存服务器对用户频繁访问的网页数据的压缩结果进行缓存,压缩结果也就是压缩后的网页数据;用户访问网页时,向缓存服务器请求网页数据,若缓存服务器缓存有该网页数据的压缩结果,则将其返回给用户,否则,向Web前端服务器请求该网页数据,由Web前端服务器将该网页数据的压缩结果向用户返回。然而,在缓存服务器缓存的网页数据的过期时间到达之前,缓存服务器无法感知Web前端服务器中的网页数据变化,用户访问网页所得到的网页数据均相同。例如,若在第33秒时,缓存服务器对某网页的网页数据进行了缓存,过期时间为第38秒,则在第33秒到第38秒之间,用户访问该网页所得到的均为第33秒时的网页数据。而对于实时性显示要求较高的网页数据,比如竞价、股票行情等数据,在第33秒到第38秒之间这些网页数据可能已经更新过多次,用户无法实时获取这些网页数据的最新数据。由此可知,设置缓存服务器的方式并不能满足用户对一些网页数据的实时性显示的要求。
[0005]因此,有必要提供一种既能满足用户对一些网页数据的实时性显示的要求,又能更好地提升用户体验,且成本较低的Web前端服务器的网页访问请求响应方法。
【发明内容】
[0006]针对上述现有技术存在的缺陷,本发明提供了一种Web前端服务器及其网页访问请求响应方法,用以满足网页数据的实时性显示的要求,并在较低成本下,更好地提升用户体验。
[0007]根据本发明的一个方面,提供了一种Web前端服务器的网页访问请求响应方法,包括:
[0008]Web前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出所述网页访问请求所请求的网页数据;并
[0009]对所述网页数据运用设定的特征值算法,计算出所述网页数据的特征值后,查找压缩数据表中是否记录有所述特征值;若是,则将与所述特征值相对应的压缩结果进行返回;否则,将所述网页数据压缩后进行返回。
[0010]其中,所述压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址;以及将与所述特征值相对应的压缩结果进行返回,具体为:
[0011]根据所述压缩数据表中记录的、与所述特征值相对应的存储地址,获取该存储地址下存储的网页数据的压缩结果,作为与所述特征值相对应的压缩结果进行返回。
[0012]进一步,所述将所述网页数据压缩后进行返回后,还包括:
[0013]查找计数表中是否记录有所述特征值;
[0014]若否,则将一个初始值为I的计数值与所述特征值对应记录到所述计数表中;
[0015]若是,则将所述计数表中与所述特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值,则将所述网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与所述特征值对应记录到所述压缩数据表中;以及
[0016]在所述将与所述特征值相对应的压缩结果进行返回后,所述方法还包括:
[0017]将所述计数表中与所述特征值对应记录的计数值加I。
[0018]较佳地,所述压缩数据表由所述Web前端服务器进行周期性维护,具体包括:
[0019]在每次维护周期到达时,所述Web前端服务器对于所述计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将所述计数表中小于O的计数值置为O ;
[0020]进而对于所述计数表中每个为O的计数值所对应的特征值,若确定所述压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从所述压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。
[0021]较佳地,所述根据所述网页数据计算出该网页数据的特征值,具体为:
[0022]对所述网页数据运用哈希HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值;或者,对所述网页数据运用循环冗余校验码CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
[0023]根据本发明的另一个方面,还提供了一种Web前端服务器,包括:
[0024]网页数据确定模块,用于接收到网页访问请求后,根据从中解析出的网页地址,确定出所述网页访问请求所请求的网页数据;
[0025]特征值计算模块,用于对所述网页数据运用设定的特征值算法计算出所述网页数据的特征值;
[0026]压缩结果返回模块,用于查找压缩数据表中是否记录有所述特征值;若是,则将与所述特征值相对应的压缩结果进行返回;否则,将所述网页数据压缩后进行返回。
[0027]较佳地,所述压缩结果返回模块具体包括:
[0028]数据表查找单元,用于查找所述压缩数据表中是否记录有所述特征值;若是,则将所述压缩数据表中与所述特征值对应记录的存储地址携带于数据返回通知中进行发送,所述压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址;否贝U,发送数据压缩通知;
[0029]压缩单元,用于接收到所述数据返回通知后,根据所述数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回;以及接收到所述数据压缩通知后,将所述网页数据压缩后进行返回。
[0030]进一步,所述压缩结果返回模块还包括:计数单元;以及
[0031]所述压缩单元,还用于在根据所述数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回后,发送第一计数通知;以及在将所述网页数据压缩后进行返回后,发送第二计数通知;
[0032]计数单元,用于接收到第一计数通知后,将计数表中与所述特征值对应记录的计数值加I ;以及接收到第二计数通知后,查找所述计数表中是否记录有所述特征值;若否,则将一个初始值为I的计数值与所述特征值对应记录到所述计数表中;若是,则将所述计数表中与所述特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值,则将所述网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与所述特征值对应记录到所述压缩数据表中。
[0033]进一步,所述Web前端服务器,还包括:
[0034]数据表维护模块,用于对所述压缩数据表进行周期性维护:在每次维护周期到达时,对于所述计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将所述计数表中小于O的计数值置为O ;进而对于所述计数表中每个为O的计数值所对应的特征值,若确定所述压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从所述压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。
[0035]较佳地,所述特征值计算模块具体用于对所述网页数据运用哈希HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值;或者,对所述网页数据运用循环冗余校验码CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
[0036]本发明的技术方案中,Web前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据,其中,确定出的网页数据为相关网页的最新数据。Web前端服务器计算出确定出的网页数据的特征值后,查找压缩数据表中是否记录有计算出的特征值;若是,则将与计算出的特征值相对应的压缩结果进行返回;否则,将确定出的网页数据压缩后进行返回。由于无论是否存储有用户所访问网页的网页数据的压缩结果,向用户返回的均是相关网页的最新数据,满足了网页数据的实时性显示要求。同时,对于已经压缩存储的网页数据不再进行压缩,而直接将存储的该网页数据的压缩结果返回,由于计算特征值并根据特征值进行查表的时间,远远少于对网页数据进行压缩运算的时间,从而可大大缩短网页响应时间,提升了用户体验,并而且节省了 Web前端服务器进行压缩运算所占用的大量的系统资源,相应提高了 Web前端服务器的性能。而且本发明可不采用专用硬件而是基于现有硬件进行网页数据压缩,保护了已有投资的同时,降低了成本。【专利附图】
【附图说明】
[0037]图1为本发明实施例的Web前端服务器的网页访问请求响应方法的流程图。
[0038]图2为本发明实施例的Web前端服务器的内部结构框图;
[0039]图3为本发明实施例的压缩结果返回模块的内部结构框图。
【具体实施方式】
[0040]以下将结合附图对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。
[0041]本申请使用的“模块”、“系统”等术语旨在包括与计算机相关的实体,例如但不限于硬件、固件、软硬件组合、软件或者执行中的软件。例如,模块可以是,但并不仅限于:处理器上运行的进程、处理器、对象、可执行程序、执行的线程、程序和/或计算机。举例来说,计算设备上运行的应用程序和此计算设备都可以是模块。一个或多个模块可以位于执行中的一个进程和/或线程内,一个模块也可以位于一台计算机上和/或分布于两台或更多台计算机之间。
[0042]本发明的发明人考虑到,可以在网页数据的实时性显示要求较高而不设置缓存服务器的情况下,由Web前端服务器将一些网页的网页数据的压缩结果(即对该网页数据进行压缩后得到的结果)存储起来。Web前端服务器在接收到用户通过浏览器发送的网页访问请求后,先根据从中解析出的网页地址,确定出用户所访问网页的网页数据。在此确定出的网页数据为用户所访问网页的最新数据。之后,Web服务器再确定是否存储有该网页数据的压缩结果,若是,则直接将该网页数据的压缩结果返回给用户,否则,将该网页数据进行压缩后返回给用户。这样,无论是否存储有用户所访问网页的网页数据的压缩结果,用户所访问到的网页数据均为最新数据,满足了用户对网页数据的实时性显示的要求。同时,对于已经压缩存储的网页数据,不再进行压缩,而是直接将存储的该网页数据的压缩结果返回,可显著提高效率,并减少网页响应时间,提升用户体验,尤其对于一些用户访问频率较高(或者访问量较大)的网页,提升用户体验的效果将更为明显,并可节省网页数据压缩所占用的系统资源,从而提高Web前端服务器的性能。而且,本发明不采用专用硬件进行网页数据压缩,可基于现有硬件来实现,保护了已有投资,成本较低。
[0043]基于此,本发明的发明人进一步考虑到,对于一个网页,若其网页数据进行了更新,则更新后的网页数据的特征值(哈希值或CRC32校验值)将与更新前的网页数据的特征值不同。Web前端服务器可将用户所访问网页的网页数据的压缩结果与该网页数据的特征值对应存储起来,也就是保存网页数据的压缩结果与原始未压缩的网页数据的对应关系,而与网页访问请求无关。之后,Web前端服务器根据网页访问请求确定出用户所访问的网页数据后,计算出该网页数据的特征值,并根据计算出的特征值确定是否存储有该网页数据的压缩结果,这种方式可以很好地避免网页数据更新后将之前存储的过时网页数据的压缩结果返回给用户。
[0044]下面结合附图详细说明本发明的技术方案。本发明实施例提供的Web前端服务器的网页访问请求响应方法的流程图如图1所示,具体包括如下步骤:[0045]SlOl:ffeb前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据。
[0046]具体地,用户可通过客户端的浏览器向Web前端服务器发送网页访问请求。Web前端服务器接收到浏览器发送的网页访问请求后,解析出其中携带的网页地址,并根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据,也就是根据用户的网页访问请求,确定出待向用户返回的网页数据。其中,确定出的网页数据是未压缩的数据,且是用户所访问网页的最新数据(即最近更新后的数据)。
[0047]S102 =Web前端服务器根据确定出的网页数据,计算该网页数据的特征值。
[0048]具体地,网页数据的特征值具体可以是网页数据的HASH(散列,音译为“哈希”)值。这样,在本步骤中,Web前端服务器对确定出的网页数据运用HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值。其中,HASH算法可以将任意长度的数据映射为固定长度的较小数据,即HASH值。HASH值是一段数据唯一且极其紧凑的数值表示形式。若散列一段明文,哪怕只更改该段落的一个字母,散列后都将产生不同的值。
[0049]或者,网页数据特征值还可以是网页数据的CRC32(Cyclic Redundancy Check,循环冗余校验码)校验值。这样,在本步骤中,Web前端服务器对确定出的网页数据运用CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
[0050]其中,HASH算法、或CRC32算法均为本领域技术人员所熟知的算法,此处不再赘述。
[0051]S103 =Web前端服务器根据计算出的特征值,查找压缩数据表中是否记录有计算出的特征值;若是,则执行步骤S104 ;否则,执行步骤S105。
[0052]其中,压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址,具体以Key-Value形式记录网页数据的特征值和该网页数据的压缩结果的存储地址,即对于压缩数据表中记录的一个网页数据的特征值,该特征值为Key (关键字),与该特征值相对应的存储地址为Value (数据值)。其中,与一个特征值相对应的存储地址指的是,对计算出该特征值的网页数据进行压缩后得到的压缩结果的存储地址。
[0053]其中,特征值为HASH值时,压缩数据表可以为HASH表,可采用现有的一些方法对冲突进行处理,这些方法为本领域技术人员所熟知,此处不再赘述。而且,若采用长HASH值(如64Bit或更长),可以降低冲突率。
[0054]在实际应用中,还可建立一个计数表,对网页被用户访问的频率进行统计。具体地,对于一个网页,将该网页的网页数据的特征值与一个计数值对应记录在计数表中。在该网页的网页数据被更新之前,Web服务器每接收到一次对该网页的网页访问请求,便将与该网页的网页数据的特征值相对应的计数值加I。在计数值大于等于设定阈值时,便将该网页的网页数据的特征值与对该网页数据进行压缩后得到的压缩结果的存储地址对应存储到压缩缓存表中。
[0055]S104 =Web前端服务器将与计算出的特征值相对应的压缩结果进行返回。
[0056]具体地,若查找压缩数据表中记录有计算出的特征值,则表明Web前端服务器存储了确定出的网页数据的压缩结果,Web前端服务器可根据压缩数据表中记录的、与计算出的特征值相对应的存储地址,获取该存储地址下存储的网页数据的压缩结果,作为与该特征值相对应的压缩结果进行返回,由浏览器将网页数据呈现给用户。[0057]本发明接收到用户的网页访问请求后,计算网页数据的特征值,并将与该特征值相对应的压缩结果进行返回,这与现有技术接收到用户的网页访问请求后,临时对网页数据进行压缩运算得到压缩结果进行返回相比,本发明计算特征值并根据特征值进行查表的时间,远远少于对网页数据进行压缩运算的时间,从而可大大缩短网页响应时间,提升了用户体验,并而且节省了 Web前端服务器进行压缩运算所占用的大量的系统资源,相应提高了 Web前端服务器的性能。
[0058]进一步,Web前端服务器将与计算出的特征值相对应的压缩结果进行返回后,还可将计数表中与该特征值对应记录的计数值加I。
[0059]S105 =Web前端服务器将确定出的网页数据压缩后进行返回。
[0060]具体地,若压缩数据表中未记录有计算出的特征值,则表明用户所访问网页的网页数据已被更新或者未被压缩存储,Web前端服务器可采用压缩软件对确定出的网页数据进行压缩,将压缩后得到的压缩结果(即确定出的网页数据的压缩结果)返回给浏览器。本发明实现过程中,并不会过分依赖压缩数据表,在未存储网页数据的压缩结果时,Web前端服务器对网页数据进行压缩后返回。而且,本发明不使用专有硬件,而是基于现有硬件采用压缩软件进行网页数据压缩,可保护已有投资,降低成本。
[0061]进一步,Web前端服务器在将确定出的网页数据的压缩结果进行返回后,还可查找计数表中是否记录有计算出的特征值;若否,则将一个初始值为I的计数值与该特征值对应记录到计数表中;若是,则将计数表中与该特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值(例如5、或10),则将确定出的网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与该特征值对应记录到压缩数据表中。也就是,将该特征值作为Key,将该压缩结果的存储地址作为Value,以Key-Value形式对应记录到压缩数据表中。从而,可以使得用户访问频率较高的网页的网页数据被压缩存储,进而Web前端服务器在后续接收到网页访问请求后可直接将压缩存储的压缩结果向用户返回,以提升用户体验。
[0062]此外,压缩数据表还可由Web前端服务器进行周期性维护,具体包括如下:在每次维护周期到达时,对于计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将计数表中小于O的计数值置为O ;进而对于计数表中每个为O的计数值所对应的特征值,若确定压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。这样,压缩数据表可在后续存入新的特征值及与之相对应的存储地址,并保证Web前端服务器有剩余的存储空间以备存入新的压缩结果。其中,维护周期、设定数值具体由本领域技术人员根据实际情况进行设定。
[0063]基于上述的Web服务器的网页访问请求响应方法,本发明还提供了一种Web前端服务器,其内部结构框图如图2所示,具体包括:网页数据确定模块201、特征值计算模块202、压缩结果返回模块203。
[0064]网页数据确定模块201用于接收到网页访问请求后,根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据。
[0065]特征值计算模块202用于根据网页数据确定模块201确定出的网页数据,计算出该网页数据的特征值。具体地,特征值计算模块202对网页数据确定模块201确定出的网页数据运用哈希HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值;或者,特征值计算模块202对网页数据确定模块201确定出的网页数据运用循环冗余校验码CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
[0066]压缩结果返回模块203用于查找压缩数据表中是否记录有特征值计算模块202计算出的特征值;若是,则将与该特征值相对应的压缩结果进行返回;否则,将网页数据确定模块201确定出的网页数据压缩后进行返回。
[0067]具体地,上述的压缩结果返回模块203的内部结构框图如图3所示,具体包括:数据表查找单元301和压缩单元302。
[0068]数据表查找单元301用于查找压缩数据表中是否记录有特征值计算模块202计算出的特征值;若是,则将压缩数据表中与该特征值对应记录的存储地址携带于数据返回通知中向压缩单元302发送,所述压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址;否则,向压缩单元302发送数据压缩通知。
[0069]压缩单元302用于接收到数据表查找单元301发送的数据返回通知后,根据数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回;以及接收到数据表查找单元301发送的数据压缩通知后,将网页数据确定模块201确定出的网页数据压缩后进行返回。
[0070]进一步,压缩结果返回模块203还可包括:计数单元303。
[0071]相应地,压缩单元302还可用于在根据数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回后,向计数单元303发送第一计数通知;以及在将网页数据确定模块201确定出的网页数据压缩后进行返回后,向计数单元303发送第二计数通知。
[0072]计数单元303用于接收到压缩单元302发送的第一计数通知后,将计数表中与特征值计算模块202计算出的特征值对应记录的计数值加I ;以及接收到压缩单元302发送的第二计数通知后,查找计数表中是否记录有该特征值;若否,则将一个初始值为I的计数值与该特征值对应记录到计数表中;若是,则将计数表中与该特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值,则将网页数据确定模块201确定出的网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与该特征值对应记录到压缩数据表中。
[0073]进一步,上述的Web前端服务器还可包括:数据表维护模块204。
[0074]数据表维护模块204用于对压缩数据表进行周期性维护:在每次维护周期到达时,对于计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将计数表中小于O的计数值置为O ;进而对于计数表中每个为O的计数值所对应的特征值,若确定压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。
[0075]本发明的技术方案中,Web前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出网页访问请求所请求的网页数据,其中,确定出的网页数据为相关网页的最新数据。Web前端服务器计算出确定出的网页数据的特征值后,查找压缩数据表中是否记录有计算出的特征值;若是,则将与计算出的特征值相对应的压缩结果进行返回;否则,将确定出的网页数据压缩后进行返回。由于无论是否存储有用户所访问网页的网页数据的压缩结果,向用户返回的均是相关网页的最新数据,满足了网页数据的实时性显示要求。同时,对于已经压缩存储的网页数据不再进行压缩,而直接将存储的该网页数据的压缩结果返回,由于计算特征值并根据特征值进行查表的时间,远远少于对网页数据进行压缩运算的时间,从而可大大缩短网页响应时间,提升了用户体验,并而且节省了 Web前端服务器进行压缩运算所占用的大量的系统资源,相应提高了 Web前端服务器的性能。而且本发明可不采用专用硬件而是基于现有硬件进行网页数据压缩,保护了已有投资的同时,降低了成本。
[0076]以上所述仅是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【权利要求】
1.一种Web前端服务器的网页访问请求响应方法,其特征在于,包括: Web前端服务器接收到网页访问请求后,根据从中解析出的网页地址,确定出所述网页访问请求所请求的网页数据;并 根据所述网页数据计算出该网页数据的特征值后,查找压缩数据表中是否记录有所述特征值;若是,则将与所述特征值相对应的压缩结果进行返回;否则,将所述网页数据压缩后进行返回。
2.如权利要求1所述的方法,其特征在于,所述压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址;以及将与所述特征值相对应的压缩结果进行返回,具体为: 根据所述压缩数据表中记录的、与所述特征值相对应的存储地址,获取该存储地址下存储的网页数据的压缩结果,作为与所述特征值相对应的压缩结果进行返回。
3.如权利要求2所述的方法,其特征在于,在所述将所述网页数据压缩后进行返回后,还包括: 查找计数表中是否记录有所述特征值; 若否,则将一个初始值为I的计数值与所述特征值对应记录到所述计数表中; 若是,则将所述计数表中与所述特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值,则将所述网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与所述特征值对应记录到所述压缩数据表中;以及 在所述将与所述特征值相对应的压缩结果进行返回后,所述方法还包括: 将所述计数表中与所述特征值对应记录的计数值加I。
4.如权利要求3所述的方法,其特征在于,所述压缩数据表由所述Web前端服务器进行周期性维护,具体包括: 在每次维护周期到达时,所述Web前端服务器对于所述计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将所述计数表中小于O的计数值置为O ; 进而对于所述计数表中每个为O的计数值所对应的特征值,若确定所述压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从所述压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。
5.如权利要求3或4所述的方法,其特征在于,所述根据所述网页数据计算出该网页数据的特征值,具体为: 对所述网页数据运用哈希HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值;或者,对所述网页数据运用循环冗余校验码CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
6.—种Web前端服务器,其特征在于,包括: 网页数据确定模块,用于接收到网页访问请求后,根据从中解析出的网页地址,确定出所述网页访问请求所请求的网页数据; 特征值计算模块,用于根据所述网页数据计算出该网页数据的特征值; 压缩结果返回模块,用于查找压缩数据表中是否记录有所述特征值;若是,则将与所述特征值相对应的压缩结果进行返回;否则,将所述网页数据压缩后进行返回。
7.如权利要求6所述的服务器,其特征在于,所述压缩结果返回模块具体包括:数据表查找单元,用于查找所述压缩数据表中是否记录有所述特征值;若是,则将所述压缩数据表中与所述特征值对应记录的存储地址携带于数据返回通知中进行发送,所述压缩数据表中对应记录有网页数据的特征值和该网页数据的压缩结果的存储地址;否则,发送数据压缩通知; 压缩单元,用于接收到所述数据返回通知后,根据所述数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回;以及接收到所述数据压缩通知后,将所述网页数据压缩后进行返回。
8.如权利要求7所述的服务器,其特征在于,所述压缩结果返回模块还包括:计数单元;以及 所述压缩单元,还用于在根据所述数据返回通知中携带的存储地址获取与所述特征值相对应的压缩结果进行返回后,发送第一计数通知;以及在将所述网页数据压缩后进行返回后,发送第二计数通知; 计数单元,用于接收到第一计数通知后,将计数表中与所述特征值对应记录的计数值加I ;以及接收到第二计数通知后,查找所述计数表中是否记录有所述特征值;若否,则将一个初始值为I的计数值与所述特征值对应记录到所述计数表中;若是,则将所述计数表中与所述特征值对应记录的计数值加I后,若判定该计数值大于等于设定阈值,则将所述网页数据压缩后得到的压缩结果进行存储,并将该压缩结果的存储地址与所述特征值对应记录到所述压缩数据表中。
9.如权利要求 8所述的服务器,其特征在于,还包括: 数据表维护模块,用于对所述压缩数据表进行周期性维护:在每次维护周期到达时,对于所述计数表中每个不为O的计数值,将该计数值减少设定数值;之后,将所述计数表中小于O的计数值置为O ;进而对于所述计数表中每个为O的计数值所对应的特征值,若确定所述压缩数据表中记录有该特征值,则根据与该特征值相对应的存储地址,将该特征值所对应的压缩结果进行删除;并从所述压缩数据表中删除该特征值、以及与该特征值相对应的存储地址。
10.如权利要求8或9所述的服务器,其特征在于, 所述特征值计算模块具体用于对所述网页数据运用哈希HASH算法,计算出该网页数据的HASH值作为该网页数据的特征值;或者,对所述网页数据运用循环冗余校验码CRC32算法,计算出该网页数据的CRC32校验值作为该网页数据的特征值。
【文档编号】H04L29/06GK103905432SQ201410092732
【公开日】2014年7月2日 申请日期:2014年3月13日 优先权日:2014年3月13日
【发明者】黄旭 申请人:新浪网技术(中国)有限公司