一种基于频繁算法的异常流量的识别方法及装置的制造方法
【专利说明】一种基于频繁算法的异常流量的识别方法及装置
[0001]
技术领域
[0002]本发明涉及一种基于频繁算法的异常流量的识别方法及装置。
[0003]
【背景技术】
[0004]网络对我们来说必不可少,但是任何事情都有不利的一面,在使用网络的时候同样会产生很多障碍,而最难避免的就是网络的异常流量,异常流量等同于黑客攻击,它针对某一特定端口发起如洪水般的非正常流量导致网络瘫痪,并且给我们带来巨大的损失,客户无法通讯,商务无法进行,进而保证网络流量的稳定性就起到了至关重要的作用。
[0005]针对相关技术中的问题,目前尚未提出有效的解决方案。
[0006]
【发明内容】
[0007]本发明的目的是提供一种基于频繁算法的异常流量的识别方法及装置,以克服目前现有技术存在的上述不足。
[0008]本发明的目的是通过以下技术方案来实现:
一种基于频繁算法的异常流量的识别方法,包括如下步骤:
抓取网络流量,并且生成网络流量数据;
对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类;
根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度;
根据频繁集产生的关联规则进而生成频繁集;
通过频繁集和阀值的比较进而判断流量是否发生异常。
[0009]进一步的,抓取的网络流量信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。
[0010]进一步的,提取的频繁项包括用户在同一时间段内的频繁项,以及应用的频繁项。
[0011]—种基于频繁算法的异常流量的识别装置,包括流量抓取装置、流量值分类装置、频繁项提取装置、频繁集生成装置以及异常流量判断装置;其中
流量抓取装置:用于抓取网络流量,并且生成网络流量数据;
流量值分类装置:用于对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类;
频繁项提取装置:用于根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度;
频繁集生成装置:用于根据频繁集产生的关联规则进而生成频繁集; 异常流量判断装置:用于通过频繁集和阀值的比较进而判断流量是否发生异常。
[0012]进一步的,所述流量抓取装置抓取的信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。
[0013]本发明的有益效果:通过流量特征提取、频繁项提取,频繁集和阀值比较进而判断异常流量达到了良好的实时性,能够应用于多种场合,同时,通过信息积累,能进一步发现更多的异常流量。
[0014]
【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是根据本发明实施例的基于频繁算法异常流量的识别方法的流程图。
[0017]
【具体实施方式】
[0018]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0019]如图1所示,根据本发明的实施例所述的一种基于频繁算法的异常流量的识别方法,包括如下步骤:
抓取网络流量,并且生成网络流量数据;
对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类;
根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度;
根据频繁集产生的关联规则进而生成频繁集;
通过频繁集和阀值的比较进而判断流量是否发生异常。
[0020]进一步的,抓取的网络流量信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。
[0021]进一步的,提取的频繁项包括用户在同一时间段内的频繁项,以及应用的频繁项。
[0022]—种基于频繁算法的异常流量的识别装置,包括流量抓取装置、流量值分类装置、频繁项提取装置、频繁集生成装置以及异常流量判断装置;其中
流量抓取装置:用于抓取网络流量,并且生成网络流量数据;
流量值分类装置:用于对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类;
频繁项提取装置:用于根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度; 频繁集生成装置:用于根据频繁集产生的关联规则进而生成频繁集;
异常流量判断装置:用于通过频繁集和阀值的比较进而判断流量是否发生异常。
[0023]进一步的,所述流量抓取装置抓取的信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。
[0024]综上所述,借助于本发明的上述技术方案,通过流量特征提取、频繁项提取,频繁集和阀值比较进而判断异常流量达到了良好的实时性,能够应用于多种场合,同时,通过信息积累,能进一步发现更多的异常流量。
[0025]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于频繁算法的异常流量的识别方法,其特征在于,包括如下步骤: 抓取网络流量,并且生成网络流量数据; 对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类; 根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度; 根据频繁集产生的关联规则进而生成频繁集; 通过频繁集和阀值的比较进而判断流量是否发生异常。2.根据权利要求1所述的基于频繁算法的异常流量的识别方法,其特征在于,抓取的网络流量信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。3.根据权利要求1所述的基于频繁算法的的异常流量识别方法,其特征在于,提取的频繁项包括用户在同一时间段内的频繁项,以及应用的频繁项。4.一种基于频繁算法的异常流量的识别装置,其特征在于,包括流量抓取装置、流量值分类装置、频繁项提取装置、频繁集生成装置以及异常流量判断装置;其中 流量抓取装置:用于抓取网络流量,并且生成网络流量数据; 流量值分类装置:用于对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类; 频繁项提取装置:用于根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度; 频繁集生成装置:用于根据频繁集产生的关联规则进而生成频繁集; 异常流量判断装置:用于通过频繁集和阀值的比较进而判断流量是否发生异常。5.根据权利要求4所述的基于频繁算法的异常流量的识别装置,其特征在于,所述流量抓取装置抓取的信息包括源ip,目的ip,源端口,目的端口,应用协议,方向。
【专利摘要】本发明公开了一种基于频繁算法的异常流量的识别方法,包括如下步骤:抓取网络流量,并且生成网络流量数据;对抓取的数据流量进行离散化处理,并且按照数据流量值的大小进行分类;根据关联规则算法对离散化处理后的数据流量进行频繁项提取,并且将频繁项设置支持度和置信度;根据频繁集产生的关联规则进而生成频繁集;通过频繁集和阀值的比较进而判断流量是否发生异常。本发明的有益效果为:通过流量特征提取、频繁项提取,频繁集和阀值比较进而判断异常流量达到了良好的实时性,能够应用于多种场合,同时,通过信息积累,能进一步发现更多的异常流量。
【IPC分类】H04L29/06
【公开号】CN105376247
【申请号】CN201510856189
【发明人】沈能辉
【申请人】睿峰网云(北京)科技股份有限公司
【公开日】2016年3月2日
【申请日】2015年11月30日