一种基于网络流量的数据分级方法、系统及存储介质

文档序号:39726766发布日期:2024-10-22 13:27阅读:42来源:国知局
一种基于网络流量的数据分级方法、系统及存储介质

本发明涉及网络安全,尤其涉及一种基于网络流量的数据分级方法、系统及存储介质。


背景技术:

1、随着信息技术的快速发展,网络安全问题日益突出。大量的网络流量中包含着各种类型的数据,这些数据在传输过程中可能遭受各种安全威胁。为了有效地保护数据的安全,需要对数据进行合理的分级,以便制定针对性的安全策略。

2、目前,数据安全分级是一种传统的人工与系统相结合的方式进行,在这一流程中,系统首先自动梳理和整合各个业务系统中的数据,对于未梳理完全的数据再进行人工补充,随后业务人员根据自己的专业知识和对业务的理解,对这些数据进行分级设置。基于手动设定规则或者简单的统计特征,无法满足复杂多变的网络安全需求。此外,对多业务系统、大数据平台和数据资产进行分级时,数据类型多且来源杂,数据变动也频繁。处理海量数据集时,工作量大,迭代耗时耗力。加之人工分级依赖业务能力和对标准的理解,人员专业能力差异导致分级结果不统一。


技术实现思路

1、基于此,有必要针对上述问题,提出了一种基于网络流量的数据分级方法、系统及存储介质。

2、一种基于网络流量的数据分级方法,所述方法包括:

3、获取单位节点产生的网络流量数据,结合识别函数,建立网络数据协议识别模型,筛选出可使用协议的网络流量数据。

4、对所述可使用协议的网络流量数据进行预处理获取标准化网络流量数据。

5、将所述标准化网络流量数据中的每个数据包作为图节点,根据数据包之间的特定关系构建边,并量化图节点之间的相似度,获取图结构。

6、根据所述图结构构建图卷积网络模型,并通过反向传播更新模型参数,获取最优图卷积网络模型。

7、将网络中的镜像流量数据输入到所述最优图卷积网络模型中,利用所述最优图卷积网络模型的输出网络流量数据的分类结果,根据所述网络流量数据的分类结果划分数据级别。

8、其中,所述对所述可使用协议的网络流量数据进行预处理获取标准化网络流量数据,具体包括:

9、根据时间戳对所述可使用协议的网络流量数据中的数据包进行排序。

10、从排序后的数据包中提取五元组信息,即源互联网协议地址、目的互联网协议地址、源端口、目的端口和协议类型。

11、根据所述五元组信息识别并重建网络会话。

12、将所述重建网络会话后的数据进行标准化和归一化处理,并处理缺失值和异常值,获取标准化网络流量数据。

13、其中,所述将所述重建网络会话后的数据进行标准化和归一化处理,并处理缺失值和异常值,获取标准化网络流量数据,具体包括:

14、对所述重建网络会话后的数据进行比例缩放,调整数据尺度,对所述重建网络会话后的数据中缺失的特征值采用众数方法进行填充,并利用统计方法检测并处理数据中的异常值,获取标准化网络流量数据。

15、其中,所述将所述标准化网络流量数据中的每个数据包作为图节点,根据数据包之间的特定关系构建边,并量化图节点之间的相似度,获取图结构,具体包括:

16、将所述标准化网络流量数据中的每个数据包作为图节点。

17、根据余弦相似度算法量化所述图节点之间的相似度。

18、根据数据包之间的特定关系构建边,并确定所述相似度大于相似度阈值,则添加新的边,获取图结构。

19、对所述图结构进行归一化处理,消除自环和多重边。

20、其中,所述根据余弦相似度算法量化所述图节点之间的相似度,具体包括:

21、根据量化所述图节点之间的相似度,其中,a和b分别代表两个不同的图节点。

22、其中,所述根据所述图结构构建图卷积网络模型,并通过反向传播更新模型参数,获取最优图卷积网络模型,具体包括:

23、获取所述图结构中节点特征和邻接矩阵。

24、结合relu激活函数,根据所述节点特征和邻接矩阵非线性更新每个节点的节点特征。

25、基于更新后的所述节点特征,使用log softmax激活函数,输出每个类别的对数概率,构建图卷积网络模型。

26、获取所述图结构中的训练数据,将所述训练数据转换为张量。

27、对所述张量执行前向传播和反向传播,确定损失函数,并计算所述损失函数对所述模型参数的梯度。

28、根据所述梯度的一阶矩估计和二阶矩估计修正学习率。

29、根据所述学习率进行模型参数更新,获取最优图卷积网络模型。

30、其中,所述根据所述学习率进行模型参数更新,获取最优图卷积网络模型,具体包括:

31、根据进行模型参数更新,获取最优图卷积网络模型,其中,θ是模型参数,η是学习率,j(θ)是损失函数

32、其中,所述获取单位节点产生的网络流量数据,结合识别函数,建立网络数据协议识别模型,筛选出可使用协议的网络流量数据之后,还具体包括:

33、所述可使用协议的网络流量数一部分通过反序列化工具进行进一步处理,另一部分生成元数据文件进行保存。

34、一种基于网络流量的数据分级系统,所述系统包括:

35、可使用协议的网络流量数据筛选模块,用于获取单位节点产生的网络流量数据,结合识别函数,建立网络数据协议识别模型,筛选出可使用协议的网络流量数据。

36、预处理模块,用于对所述可使用协议的网络流量数据进行预处理获取标准化网络流量数据。

37、图结构获取模块,用于将所述标准化网络流量数据中的每个数据包作为图节点,根据数据包之间的特定关系构建边,并量化图节点之间的相似度,获取图结构。

38、最优图卷积网络模型获取模块,用于根据所述图结构构建图卷积网络模型,并通过反向传播和优化算法更新模型参数,获取最优图卷积网络模型。

39、数据级别划分模块,用于将网络中的镜像流量数据输入到所述最优图卷积网络模型中,利用所述最优图卷积网络模型的输出网络流量数据的分类结果,根据所述网络流量数据的分类结果划分数据级别。

40、一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述方法的步骤。

41、采用本发明实施例,具有如下有益效果:

42、本发明通过结合识别函数,建立网络数据协议识别模型,实现对不同网络协议的准确识别,筛选出可使用协议的网络流量数据为后续的数据分析提供了更精确的数据集,提高了数据分析的准确性和效率。通过对可使用协议的网络流量数据进行标准化处理,可以消除数据中的噪声和异常值,提高数据的可靠性和一致性,标准化后的网络流量数据更易于后续模型的学习和分析,提高了模型的准确性和泛化能力。进一步地,将网络流量数据转化为图结构,可以更好地表达数据包之间的关系和特征。基于图结构构建图卷积网络模型,并通过反向传播和优化算法更新模型参数,获取最优图卷积网络模型,通过最优图卷积网络模型输出网络流量数据的分类结果,根据网络流量数据的分类结果划分数据级别,能够更精确地识别复杂流量模式,提高数据安全分级的准确性。同时,模型具备自学习能力,能够根据环境变化自动更新,提升对新型网络威胁的识别能力。整个分级过程从数据收集到结果输出全程自动化,减少人为干预,提高工作效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1