专利名称:统一资源定位器地址过滤方法及中间传输设备的制作方法
技术领域:
本发明涉及一种统一资源定位器地址过滤方法及中间传输设备,尤其 是一种能够对重定向后的统一资源定位器地址进行过滤的方法及设备。
背景技术:
如图l所示,为终端个人计算机(Personal Computer,以下简称PC ) 访问统一资源定位器(uniform resource locator,以下简称url)地址 的流程图。终端PC机打开web浏览器,其传输层协议为超文本传输协议 (hypertext transfer protocol,以下简称http), 发送url地址访问 请求;中间传输设备完成url地址过滤,如果所请求的url地址是不合法 的,中间传输设备过滤掉该ur 1地址,即阻断该ur 1地址访问请求,如果 该url地址是合法的,中间传输设备将该url地址发送至目的服务器;目 的服务器判断该url地址是否需要重定向,并向中间传输设备发送该url 地址访问请求的应答,如果不需要重定向,则显示所请求的url地址相应 的页面,如果需要重定向,中间传输设备将重定向应答发送给终端PC机, 终端PC机就会再次发送一携带有重定向后的url地址的重定向url地址 访问请求,至中间传输设备;中间传输设备对这个新的重定向后的url地 址再进行合法性判断,重复上述过程,完成用户的url地址访问。如图2所示,为现有中间传输设备进行ur 1地址过滤流程图。中间传 输设备接收一 url地址,中间传输设备根据url地址表确定其接收的这一 url地址的类别,再根据url过滤规则进行过滤。如,url地址表中设置 一些url地址是暴力性的, 一些url地址是反动性的,过滤规则一是禁止 暴力性的url地址,即暴力性的url地址是不合法的应该过滤,过滤规则
二是禁止反动性的url地址,即反动性的url地址是不合法的,应当过滤; 当中间传输设备接收到一 url地址,先根据url地址表确定其所属类别, 假设为暴力性的,再根据过滤规则,过滤规则一是禁止暴力性的url地址, 即该url地址是不合法的,因此中间传输设备将阻断该url地址访问请求; 若根据url地址表确定出中间传输设备接收的url地址属于反动性的,则 根据过滤规则二,该url地址也是不合法的,中间传输设备也将阻断该 url地址访问请求;若中间传输设备接收的url地址不在禁止的url地址 表和过滤规则内,即该url地址是合法的,则中间传输设备将该url地址 发送至目的服务器。现有技术的缺点在于当前的网络设备中,上述url地址表和过滤规 则是通过手工输入的方法预先设置的,设置之后是固定不变的,当一个 url地址访问请求的url地址发生了跳变或者重定向时,将会因为无法找 到匹配的规则而被误判,比如,一 url地址http: 〃sina. com/被目的服 务器判断为需要重定向至http://sina-1. com/,重定向后,PC机将发送 新的地址http: //sina-1. com/至中间传输设备,由于预先设置的url地址 表和过滤头见贝'J中只有http://sina. com/, ^L有http://sina—l. com/,所以 中间传输设备无法判断是否阻断该url地址http: 〃sina-l. com/, /人而可 能会发生误判。发明内容本发明通过一些实施例提供一种url地址过滤方法及中间传输设备,用 以解决url地址重定向后出现的url地址过滤误判问题,实现动态地更新url 地址表,进而正确判断重定向后的url地址的过滤规则,从而对重定向后的 url地址正确过滤。 .本发明第一方面url地址过滤方法通过一些实施例提供了如下的技术方案
一种url;也址过滤方法,包4舌中间传输设备接收终端用户发送的统一资源定位器地址访问请求,并 记录所述统一 资源定位器地址访问请求的特征信息;中间传输设备根据统一资源定位器地址表和过滤规则,判断所述统一 资源定位器地址访问请求中携带的初始统 一 资源定位器地址是否合法,若 合法,则将所述统一资源定位器地址访问请求发送至目的服务器;目的服务器判断所述初始统一资源定位器地址是否需要重定向,若需 要重定向,则发送重定向应答至中间传输设备;当中间传输设备接收到重定向应答后,根据重定向应答中携带的重定 向后的统一资源定位器地址和所述特征信息更新统一资源定位器地址表, 使所述重定向后的统一资源定位器地址与所述初始统一资源定位器地址 具有相同的地址类别。本发明第二方面中间传输设备通过一些实施例提供了如下的技术方案一种中间传输设备,包括第一单元,用于接收统一资源定位器地址访问请求;第二单元,用于记录第一单元接收的统一资源定位器地址访问请求的特征信息; .第三单元,用于根据统一资源定位器地址表和过滤规则过滤第一单元 接收的所述统 一 资源定位器地址访问请求中携带的初始统 一 资源定位器 地址或重定向后的统 一 资源定位器地址;第四单元,用于接收目的服务器发送的所述统一资源定位器地址访问 请求的应答,若所述应答为重定向应答时,将所述重定向应答发送至第五 单元,并将所述重定向应答发送至终端用户;第五单元,用于当接收到第四单元输出的重定向应答后,根据第二单 元记录的特征信息,及所述重定向应答中携带的重定向后的统一资源定位 器地址,更新初始统一资源定位器地址表。本发明实施例,通过记录url地址访问请求的特征信息,使重定向后的 url地址与初始url地址,即重定向前的url地址对应,并采用与重定向前 的url地址相同的过滤规则对重定向后的url地址进行过滤,进而实现动态 地更新url地址表,实现对重定向后的url地址正确过滤。 下面结合附图和具体实施例进一步说明本发明的技术方案。
图1为现有终端个人计算机访问url地址的流程图; 图2为现有中间传输设备进行ur 1地址过滤的流程图; 图3为本发明第一方面url地址过滤方法实施例一流程图; 图4为本发明第一方面url地址过滤方法实施例二流程图; 图5为本发明第二方面中间传输设备实施例一结构示意图; 图6为本发明第二方面中间传输设备实施例二结构示意图。
具体实施方式
如图3所示,为本发明第一方面url地址过滤方法实施例一流程图,包括步骤11:中间传输设备接收终端用户发送的初始ur 1地址访问请求; 步骤12:中间传输设备记录该初始url地址访问请求的特征信息,并根据url地址表和过滤规则,判断该初始url地址是否合法,若不合法,则阻断该初始url地址访问请求,即中间传输设备直接将该url地址访问请求丟弃;若合法,则执行步骤13;步骤13:将该初始url地址访问请求发送至目的服务器;步骤14:目的服务器判断所述初始url地址是否需要重定向,并将应答发送至中间传输设备; 步骤15:中间传输设备是否接收到重定向应答,若是,则执行步骤16; 否则,显示该初始url地址指向的页面;步骤16:根据重定向应答中携带的重定向后的url地址和记录的特征 信息更新u r 1地址表,使重定向后的u r 1地址与初始u r 1地址具有相同的地 址类别,并将重定向应答发送至终端用户;步骤17:终端用户将携带有重定向后的url地址的重定向url地址访问 请求发送至中间传输设备;步骤18:中间传输设备接收重定向url地址访问请求,并根据过滤规 则和更新后的url地址表过滤重定向后的url地址。本实施例中通过记录ur 1地址访问请求的特征信息,使重定向后的ur 1 地址与重定向前的url地址,即初始url地址具有相同的地址类别,并更新 url地址表,实现重定向后的url地址包含在更新后的url地址表中,并与 重定向前的url地址具有相同的地址类别,进而有相同的过滤〗见则,能够 对重定向的u r 1地址进行正确过滤。如图4所示,为本发明第一方面url地址过滤方法实施例二流程图,包括步骤201:中间传输设备接收初始ur 1地址访问请求; 步骤202:判断该初始url地址访问请求是否为http请求,若是,执行 步骤203,若否,结束过滤操作;步骤203:记录该初始url地址访问请求的特征信息,具体为 中间传输设备中设置一个由多条流组成的流平台,该流平台是运行在中 间传输设备中的功能模块,相当于一张很大的hash表。每条流对应记录一条 url地址访问请求携带的五元组,该五元组包括发送该url地址访问请求的 源服务器互联网协议(internet protocol,以下简称IP)地址、源服务 器端口号,该初始url地址访问请求发送至的目的服务器的IP地址、目的 服务器端口号,传输该初始url地址访问请求的传输层协议号,每条流中 还包括一私有数据空间,用来确定与该流对应的初始ur 1地址的过滤规则 下面给出简单的流的各个元素的定义Struct flow—element (Unsigned int s_ipj Unsigned int d_ip; Unsigned int s—port; Unsigned int d—port; Unsigned short protocol; Unsigned char private [126];〃该条流的源服务器IP地址 〃该条流的目的服务器IP地址 〃该条流的源服务器端口号 〃该条流的目的服务器端口号 〃该条流的传输层协议号 〃该条流的私有数据空间中间传输设备在初始的url地址表中,找到其接收的url地址所属的地址 类别,上述的流中的元素private中可以记录该地址类别,因此通过private 中记录的内容,可以确定中间传输设备接收的url地址的过滤规则,即该url 地址的合法性。通过记录,实现当重定向发生时,可以找到与重定向后的url 地址相应的重定向前的url地址,进而得到其地址类别及过滤规则;同时,可 替代的是该私有数据空间内也可以记录属于该流的所有会话数据或仅记录会 话数据中包含的初始url地址。步骤204:根据预先设置的初始url地址表和过滤规则对该初始url地址进 行合法性判断,若合法,发送该初始url地址至目的服务器;若不合法,阻断 i亥净刀始u r 1 i也iiB方问;青,扎;步骤205:目的服务器判断该初始url地址是否需要重定向,并发送应答 至中间传输设备;步骤206:中间传输设备接收该初始url地址访问请求的应答,若该应答 是重定向应答,发送该重定向应答至终端PC机,并且执行步骤207,否则,显 示该ur l地址请求的页面。 具体为一个url地址访问请求的典型格式——格式一,如下所示 HTTP/1. 0 200 OKDate: Saturday, 19-Aug-95 20:23:52 GMTServer: NCSA/1. 3Host: http://www.sina.com/MIME-version: 1. 0Content-type: image/gifLast-modified: Monday, 13-Mar-95 01:47:51 GMT Content-length: 2859一个url地址访问请求的重定向应答的典型格式——格式二,如下所示HTTP/1. G 302 FoundDate: Wed, 18 Oct 1995 16:37:23 GMTServer: NCSA/1.4Location: http://www. sina-1. com/ //重定向后的地址 Content-type: text/html当中间传输设备接收的url地址访问请求(格式一所示)中的初始url 地址http: 〃www. sina. com/是合法的,中间传输设备会将这一地址 http: 〃www. sina. com/发送至目的服务器,目的服务器进行该url地址 http: 〃www. sina. com/是否需要重定向的判断,并发送应答给中间传输设 备及终端PC机,当重定向发生时,其应答的格式如格式二所示,重定向 应答的才各式(格式二)中包含有重定向后的地址http: 〃w丽.sina-1. com/, 当重定向应答发生后,终端PC机会再向中间传输设备发送新的url地址访问 请求,该url地址访问请求中包含的url地址是重定向后的地址 http://www. sina-1. com/ , 即格式一 中的http://www.sina.com/被 http: //www. sina-1. com/替换。步骤207:中间传输设备根据重定向后的url地址和特征信息,获得与重 定向后的url地址对应的初始url地址(重定向前)的;也址类别,具体为中间传输设备将重定向应答中的内容,与记录在流平台内的流比较,确 定重定向后的url地址对应的流,该流记录与重定向后的url地址对应的重定 向前的url地址访问请求的特征信息。如,中间传输设备中的一条流A记录的 是一重定向前地址为http: //www. sina. com的url地址访问^青求的内容,包括 该url地址访问请求的源/目的服务器IP地址、源/目的服务器端口号、传输协 议号组成的五元组及一私有数据空间,若一重定向应答的五元组,目的/源服 务器IP地址、目的/源服务器端口号、传输协议号,与上述五元组一一对应相 同,那么该重定向应答中携带的重定向后的url地址,设重定向后的url地址 为http: 〃w丽.sina-l. com,也属于该流A。中间传输设备才艮据流A的私有数据 空间记录的;也址类别确定与重定向后的url地址http: 〃www. sina-1. com对应 的重定向前的url地址http: 〃www. sina. com的地址类别,即通过私有数据空 间中记录的地址类别确定重定向前的url地址的地址类别为该记录的地址类 别;若私有数据空间中记录的是初始url地址,则先找到流,然后从流中确定 与重定向后的ur 1地址对应的重定向前的ur 1地址,再才艮据初始ur 1地址表确定 该重定向前的urli也址的地址类别。步骤208:将重定向后的url地址设置为与其对应的重定向前的url地址相 同的地址类别,并添加进初始url地址表中,具体为中间传输设备将重定向后的地址http: 〃丽w. sina-l. com添力。进初始ur 1 地址表中,并与重定向前的url地址http://www. sina. com,具有相同的地址 类别,即重定向后的url地址的地址类别为步骤207所获得的地址类别,因此 重定向后的url地址与重定向前的url地址具有相同的地址类别,进而有相同 的过滤规则,因此两者采用相同的过滤规则进行过滤处理。步骤209:当终端PC机接收到重定向应答后,发送一新的包含有重定向后
的url地址的重定向url地址访问请求至中间传输设备,中间传输设备接收该 重定向u r 1地址访问请求;步骤210:中间传输设备根据更新后的url地址表和预先设置的过滤规 则,对该重定向url地址访问请求中携带的重定向后的url地址进行过滤,具 体为中间传输设备根据更新后的ur 1地址表,确定其接收的重定向后的u r 1 地址的地址类别;根据过滤规则对该地址类别进行合法性判断,若不合法,则阻断该重 定向后的url地址访问请求,若合法,发送该重定向url地址访问请求至目 的服务器。由于更新后的url地址表中存在了重定向后的url地址, 一旦重定向发生 时,包含有重定向后的ur 1地址的重定向ur 1地址访问请求可以在ur 1地址表和 过滤规则中找到匹配的地址类别和过滤规则,即对重定向后的ur l地址采取与 重定向前的ur 1地址相同的过滤处理策略。本实施例通过记录初始ur 1地址访 问请求的相应内容,可以将重定向后的url地址的过滤规则与重定向前(初始) 的url地址的过滤规则对应起来,解决了现有技术由于没有记录初始url地址 的特征信息造成的不能将重定向后的url地址与重定向前的url地址对应,不 能确定重定向后的url地址所属的过滤规则的问题,实现了对重定向后的url 地址采用与重定向前的url地址相同的过滤规则处理,有效且正确地过滤重定 向后的url地址。本实施例中更新ur l地址表和过滤规则是通过在中间传输设备中添加流 平台自动实现的,可替代的是,如果管理员知道重定向后的url地址,也可以 通过手工添加的方式,将重定向后的url地址和过滤规则添加进相应的url地 址表和过滤规则内。同时,上述的更新可以是一次或者多次,即可以将更新后的url地址表作 为其下次更新的初始url地址表,将重定向后的url地址作为其下次更新的初 始url地址,循环上述过程,实现多次更新。如图5所示,为本发明第二方面中间传输设备实施例一结构示意图。该中 间传输设备包括第一单元31、第二单元32、第三单元33、第四单元34、第五 单元35;第一单元31,用于接收终端用户发送的初始url地址访问请求及重 定向url地址访问请求;第二单元32,用于记录第一单元31接收的初始ur 1 地址访问请求的特征信息;第三单元33,用于根据url地址表和过滤规则 过滤第一单元31接收的初始url地址访问请求中携带初始url地址,或者重 定向url地址访问请求中携带重定向后的url地址,当第一单元31接收的初 始url地址访问请求合法时,发送该初始url地址访问请求至目的服务器, 若不合法,则阻断该初始url地址访问请求;第四单元34,用于接收目的 服务器发送的初始url地址访问请求的应答,若所述应答为重定向应答, 向第五单元35输出该重定向应答,并将该重定向应答发送至终端用户;第 五单元35,用于根据第二单元32记录的特征信息,及其接收的重定向应答 中携带的重定向后的url地址,更新url地址表,作为第三单元33过滤重定 向后的url地址的依据。如图6所示,为本发明第二方面中间传输设备实施例二结构示意图。相比 于图5所示的实施例一,本实施例的第二单元32具体包括第三模块321,第 四模块322;第三模块321,用于接收并判断第一单元31接收的初始url地 址访问请求是否为http请求,若是,输出该初始url地址访问请求至第四 模块322,否则,结束过滤操作;第四模块322,用于记录该初始url地址 访问请求的特征信息,并作为第五单元更新url地址表的依据。本实施例 中第五单元35具体包括第一模块351,第二模块352;第一模块351,用于 接收第四单元34发送的重定向应答,并根据该重定向应答中携带的第二五 元组,获得与第二五元组对应的第四模块322记录的特征信息中的第一五 元组,并根据第一五元组获得与该第一五元组相关联的初始url地址的地 址类別;第二模块352,用于将重定向后的url地址的地址类别设置为第一模 块351获得的地址类别,并添加进url地址表中,得到更新后的url地址表,作 为第三单元33对重定向后的url地址进行过滤的依据。通过上述实施例,中间传输设备能够记录其接收的u r 1地址访问请求 的地址信息,当该url地址发生重定向后,才艮据记录的地址信息可以确定 出与重定向后的url地址对应的重定向前的url地址, -使重定向后的url地 址具有与重定向前的url地址相同的过滤规则,实现正确过滤重定向的url 地址。最后应说明的是以上实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解其依然可以对前述各实施例所记载的技术方案进行修 改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,-并不 使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
权利要求
1、一种统一资源定位器地址过滤方法,其特征在于,包括中间传输设备接收终端用户发送的统一资源定位器地址访问请求,并记录所述统一资源定位器地址访问请求的特征信息;中间传输设备根据统一资源定位器地址表和过滤规则,判断所述统一资源定位器地址访问请求中携带的初始统一资源定位器地址是否合法,若合法,则将所述统一资源定位器地址访问请求发送至目的服务器;目的服务器判断所述初始统一资源定位器地址是否需要重定向,若需要重定向,则发送重定向应答至中间传输设备;当中间传输设备接收到重定向应答后,根据重定向应答中携带的重定向后的统一资源定位器地址和所述特征信息更新统一资源定位器地址表,使所述重定向后的统一资源定位器地址与所述初始统一资源定位器地址具有相同的地址类别。
2、 根据权利要求l所述的统一资源定位器地址过滤方法,其特;f正在于, 所述根据重定向应答中携带的重定向后的统一资源定位器地址和所述特 征信息更新统一资源定位器地址表之后还包括中间传输设备将重定向应答发送至终端用户;终端用户将携带有重定向后的统一资源定位器地址的统一资源定位 器地址访问请求发送至中间传输设备;中间传输设备接收所述携带有重定向后的统一资源定位器地址的统 一资源定位器地址访问请求,并根据过滤规则和更新后的统一资源定位器 地址表过滤所述重定向后的统 一 资源定位器地址。
3、 根据权利要求l所述的统一资源定位器地址过滤方法,其特征在于, 所述记录所述统一资源定位器地址访问请求的特征信息包括中间传输设备记录所述统一资源定位器地址访问请求中携带的第 一五元 组,所述五元组包括源服务器互联网协议地址、目的服务器互联网协议地址、 源服务器端口号、目的服务器端口号、传输层协议号;根据统一资源定位器地址表获得所述初始统一资源定位器地址的地址类别;记录所述地址类别,并使所述第一五元组和所述地址类别相关联。
4、 根据权利要求3所述的统一资源定位器地址过滤方法,其特征在于, 所述根据重定向应答中携带的重定向后的统一资源定位器地址和所述特 征信息更新统一资源定位器地址表包括中间传输设备根据所述重定向应答中携带的第二五元组,获得与所述 第二五元组对应的,中间传输设备中记录的特征信息中的第 一五元组; 根据所述第一五元组,获得与所述第一五元组相关联的地址类别; 将重定向后的统一资源定位器地址设置为所述地址类别,并添加进统一 资源定位器地址表中,得到更新后的统一资源定位器地址表。
5、 根据权利要求l所述的统一资源定位器地址过滤方法,其特征在于, 所述并记录所述统一资源定位器地址访问请求的特征信息包括中间传输设备记录所述统一资源定位器地址访问请求中携带的第一五元 组,所述五元组包括源服务器互联网协议地址、目的服务器互联网协议地址、 源服务器端口号、目的服务器端口号、传输层协议号;记录所述初始统一资源定位器地址,使得所述第一五元组和初始统一资 源定位器地址相关联。
6、 根据权利要求5所述的统一资源定位器地址过滤方法,其特征在于, 所述根据重定向应答中携带的重定向后的统一资源定位器地址和所述特 征信息更新统 一 资源定位器地址表包括中间传输设备根据所述重定向应答中携带的第二五元组,获得与所述 第二五元组对应的,中间传输设备中记录的特征信息中的第 一五元组;根据所述第一五元组,获得与所述第一五元组相关联的初始统一资源 定位器地址; 根据统 一 资源定位器地址表获得所述初始统 一 资源定位器地址的地址类别;将重定向后的统一资源定位器地址设置为所述地址类别,并添加进统一 资源定位器地址表中,得到更新后的统一资源定位器地址表。
7、 根据权利要求l所述的统一资源定位器地址过滤方法,其特征在于, 所述中间传输设备接收终端用户发送的统一资源定位器地址访问请求,并 记录所述统 一 资源定位器地址访问请求的特征信息包括中间传输设备判断所述统一资源定位器地址访问请求是否为超文本传输协议请求,若是,则记录所述统一资源定位器地址访问请求的特征信 台
8、 根据权利要求2所述的统一资源定位器地址过滤方法,其特征在于, 所述根据过滤规则和更新后的统一资源定位器地址表过滤重定向后的统 一资源定位器地址包括中间传输设备根据更新后的统一资源定位器地址表,确定所述重定向 后的统 一 资源定位器地址的地址类另'J;根据过滤规则对所述地址类别进行合法性判断,若不合法,则阻断所 述重定向统一资源定位器地址访问请求,若合法,则发送所述重定向统一 资源定位器地址访问请求至目的服务器。
9、 一种中间传输设备,其特征在于,包括 第一单元,用于接收统一资源定位器地址访问请求;第二单元,用于记录第一单元接收的统一资源定位器地址访问请求的特征信息; '第三单元,用于根据统一资源定位器地址表和过滤规则过滤第一单元接收的所述统 一 资源定位器地址访问请求中携带的初始统 一 资源定位器地址或重定向后的统一 资源定位器地址;第四单元,用于接收目的服务器发送的所述统一资源定位器地址访问请求的应答,若所述应答为重定向应答时,将所述重定向应答发送至第五单元;第五单元,用于当接收到第四单元输出的重定向应答后,根据第二单 元记录的特征信息,及所述重定向应答中携带的重定向后的统一资源定位 器地址,更新统一资源定位器地址表。
10、 根据权利要求9所述的中间传输设备,其特征在于,所述第五单元包括第一模块,用于接收重定向应答,并根据所述重定向应答中携带的第 二五元组,获得与所述第二五元组对应的第二单元记录的特征信息中的第 一五元组,并根据所述第一五元组获得与所述第一五元组相关联的初始统 一资源定位器地址的地址类别;第二模块,用于将重定向后的统一资源定位器地址的地址类别设置为第 一模块获得的地址类别,并添加进统一资源定位器地址表中。
11、 根据权利要求9所述的中间传输设备,其特征在于,所述第二单元 包括第三模块,用于接收并判断第 一单元接收的统一资源定位器地址访问 请求是否为超文本传输协议请求,若是,将所述统一资源定位器地址访问 请求输出至第四模块;第四模块,用于记录所述统一资源定位器地址访问请求的特征信息。
全文摘要
本发明涉及一种url地址过滤方法及中间传输设备。该url地址过滤方法包括记录url地址访问请求的特征信息,当重定向发生时,根据该特征信息和重定向后的url地址,更新初始url地址表,使重定向后的url地址与重定向前的url地址的地址类别一致,根据更新后的url地址表和预先设置的过滤规则过滤重定向后的url地址;该中间传输设备包括记录初始url地址访问请求特征信息的单元、根据重定向后的url地址及记录的特征信息,更新初始url地址表的单元。通过本发明的url地址过滤方法及中间传输设备,可以动态地更新url地址表,实现对重定向后的url地址的正确过滤。
文档编号H04L29/08GK101163161SQ20071017694
公开日2008年4月16日 申请日期2007年11月7日 优先权日2007年11月7日
发明者彬 陈 申请人:福建星网锐捷网络有限公司