专利名称:一种针对https加密网站访问的网址过滤方法
技术领域:
本发明涉及计算机技术领域,尤其涉及一种针对HTTPS加密网站访问的网址过滤方法。
背景技术:
应用网络化是未来互联网发展的一个主要趋势,同时一些新生的互联网黑色产 业,如钓鱼、挂马,涉黄、涉赌、涉毒的网站比比皆是,通过对用户访问的网址进行过滤鉴别, 对访问行为进行过滤和审计,通过专业的URL库匹配URL所属的分类,对在访问规则允许之 外的URL进行过滤与阻断,对网络应用提供安全保护机制。传统的数据传输是采取明文的方式,一般通过将数据包逐层剥离的方式提取URL 信息,并加以判断过滤。HTTPS是一种基于身份认证的安全访问协议,通过HTTPS安全加密 传输协议传输的数据在传输层对网络连接进行加密,从而使得传输的内容不能轻易的被获 取和破解。网络应用的安全问题得到了保障,但这同时也给URL的提取带来了很大的难度。本发明方案主要解决目前对加密网站不能过滤的问题,通过本发明方案,可以有 效的对HTTPS加密网站的网址进行过滤。
发明内容
本发明的目的在于提出一种针对HTTPS加密网站访问的网址过滤方法,克服了 HTTPS加密传输的网址信息提取困难的缺点,不对网络造成干扰,实现对用户访问HTTPS网 站过滤的效果。为达此目的,本发明采用以下技术方案A、用户发起连接,并产生数据包;B、抓取用户访问互联网数据包;C、判断识别所抓取数据包属于某个网络连接。如果能,转至步骤E,如果不能,转至 步骤D ;D、退出。E、通过数据包所在端口,判断所抓取的数据包是否属于HTTPS协议下的数据包。 如果是,转至步骤F,如果不是,转至步骤D。F、判断数据包是否连接发起时的交互认证数据包,如果是,转至步骤G,如果不是, 转至步骤D。G、获取认证数据包中的网站证书信息。H、解析网站证书内容。I、获取证书中内嵌的URL域信息,如果顺利获取,转至步骤J,如果没有,转至步骤 D0J、通过比对网站证书中的URL和浏览器输入的URL,验证URL信息是否正确,如果 正确,转至步骤K,如果不一致,转至步骤D。
3
K、提取URL条目。L、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。M、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动 作,并同时进行记录。还包括以下步骤通过寻找对应连接、判断数据包是否属于HTTPS流、数据包是否属于认证报文等 条件,过滤抓取到的数据包,提取网站证书。通过扫描数据包的内容,如连续出现特定URL域标示字符串,提取该字节序列后 的URL,然后将网站证书中的URL信息和浏览器输入的URL进行比对,从而判断URL信息的 正确性。采用了本发明的技术方案,解决目前对加密网站提取URL困难、不能过滤的问题, 通过本发明的技术方案,在不对网络造成影响的前提下,可以有效的对HTTPS加密网站的 网址进行过滤。
下图是本发明具体实施方式
中针对HTTPS加密网站访问的过滤方法的控制流程 图。
具体实施例方式下面结合附图并通过具体实施方式
来进一步说明本发明的技术方案。本发明技术方案的主要思想是通过抓取用户对网站访问所产生数据包,选择证书 交互数据包并解析证书内容,验证后提取URL信息,并通过预定URL库对所提取的信息进行 分类过滤,根据预先设定的规则进行后续处理。下图是本发明具体实施方式
中访问HTTPS加密网站过程中网址过滤的流程图。如 下图所示,该过滤流程包括以下步骤步骤1、用户发起HTTPS连接,并产生数据包。步骤2、抓取用户访问互联网数据包。步骤3、判断识别所抓取数据包属于某个网络连接。通过确认该数据包所属数据流,检查该数据包是否超过系统对数据流扫描包数目 的限制,从而判断识别所抓取的数据包属于具体某个连接所产生的数据包。如果所抓取的 数据包在不超过系统对数据流扫描包数目的限制之内成功识别出所属连接,转至步骤5,如 果所抓取的数据包没有在系统对数据流扫描包数目的限制之内识别出所属连接,转至步骤 4。步骤4、退出。步骤5、判断所抓取的数据包是否属于HTTPS协议下的数据包。通过抓取的数据包所在端口,从而判断数据包是否属于HTTPS协议下的数据包。 如果所抓取的数据包属于HTTPS协议,转至步骤6,如果所抓取数据包不属于HTTPS协议,转 至步骤4。步骤6、判断数据包是否属于HTTPS协议下的交互认证数据包,此数据包中包括网站证书等信息。如果该数据包是交互认证数据包,转至步骤7,如果该数据包不是交互认证 数据包,转至步骤4。步骤7、获取认证数据包中的网站证书信息。步骤8、解析网站证书内容。扫描此数据包的内容,如果数据包里连续出现某特定 URL域标示字符串,为URL域的标示,该标示后即为URL域名。步骤9、获取证书中内嵌的URL域信息,如果顺利获取到URL信息,转至步骤10,如 果没有获取到URL信息,转至步骤4。步骤10、验证URL信息是否正确,通过比对解析出的认证报文网站证书中的URL和 浏览器输入的URL是否一致,如果比对一致说明证书中的URL信息就是浏览器中的URL,在 证书提取中的URL是正确的URL。如果URL信息验证一致,转至步骤11,如果URL信息不一 致,转至步骤4。步骤11、提取URL条目。步骤12、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。步骤13、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断 等动作,并同时进行记录。以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不局限于此, 任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖 在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
权利要求
一种针对HTTPS加密网站访问的网址过滤方法,其特征在于,包括以下步骤A、用户发起HTTPS连接,并产生数据包;B、抓取用户访问互联网数据包;C、判断识别所抓取的数据包属于某个网络连接。如果能识别,转至步骤E,如果不能,转至步骤D;D、退出。E、通过数据包所在端口,判断所抓取的数据包是否属于HTTPS协议下的数据包。如果是,转至步骤F,如果不是,转至步骤D。F、判断数据包是否属于HTTPS协议交互中的认证数据包,如果是,转至步骤G,如果不是,转至步骤D。G、获取认证数据包中的网站证书信息。H、解析网站证书内容。I、获取证书中内嵌的URL域信息,如果顺利获取,转至步骤J,如果没有,转至步骤D。J、通过验证解析出的认证数据包中的URL和浏览器输入的URL是否一致,如果一致,转至步骤K,如果不一致,转至步骤D。K、提取URL条目。L、URL信息分析,通过预定的URL库和提取到的URL信息进行对比。M、获取URL的分析结果,进行后续处理,根据网址过滤规则进行放行或阻断等动作,并同时进行记录。
2.根据权利要求1所述的一种针对HTTPS加密网站访问的网址过滤方法,其特征在于, 通过寻找对应连接、判断数据包是否属于HTTPS流、数据包是否属于认证报文等条件,过滤 抓取到的数据包,提取网站证书。
3.根据权利要求1所述的一种针对HTTPS加密网站访问的网址过滤方法,其特征在于, 通过扫描数据包的内容,如连续出现特定URL域标示字符串,提取该字节序列后的URL,然 后将网站证书中的URL信息和浏览器输入的URL进行比对,从而判断URL信息的正确性。
全文摘要
本发明公开了一种针对HTTPS加密网站访问的网址过滤方法,HTTPS是一种基于身份认证的安全访问协议,本方法中首先通过抓取数据包进行解析的方法识别HTTPS协议流,并获取协议流中的认证报文。其次对认证报文中的网站证书进行解析,提取URL信息,即网页地址,最后对用户访问的URL进行鉴别,通过专业的URL库匹配URL所属的分类,对在访问规则允许之外的URL进行过滤与阻断。采用了本发明的技术方案对网络应用提供安全保护机制,克服了HTTPS传输加密,URL不能轻易获取的难题,能够做到对用户访问HTTPS网站的全面过滤。
文档编号H04L29/08GK101977235SQ20101052987
公开日2011年2月16日 申请日期2010年11月3日 优先权日2010年11月3日
发明者林皓, 程志远, 高曦 申请人:北京北信源软件股份有限公司