一种基于机器学习的网络数据泄漏预警系统及其方法与流程

文档序号:37982672发布日期:2024-05-13 12:43阅读:12来源:国知局
一种基于机器学习的网络数据泄漏预警系统及其方法与流程

本发明涉及网络数据泄漏处理,具体为一种基于机器学习的网络数据泄漏预警系统及其方法。


背景技术:

1、传统的网络数据泄露预警方法通常缺乏对网络流量数据进行细致分类的能力,这导致其在处理网络安全威胁时效率低下,反应迟缓。这些方法倾向于采用一种"一刀切"的安全策略,不区分网络流量的通信模式和敏感度,从而将所有的网络流量一视同仁地进行处理。这不仅会消耗大量的计算资源,还可能导致重要的敏感数据未能获得足够的保护,同时还会使得一些低风险或不敏感的数据被过度保护,造成资源浪费。

2、传统的网络数据泄露预警方法还无法对数据进行精准的风险评估,这意味着无法实现对数据保护等级的动态调整。这种不精细的处理方式无法满足日益复杂的网络安全需求,特别是在面对高度动态和多变的网络攻击手段时,这种方法显得力不从心。例如,对于需要实时保护的高敏感数据,传统方法由于缺乏精确的风险评估,可能无法在数据泄露发生之前提供足够的保护措施,从而使得敏感信息面临更大的泄露风险。


技术实现思路

1、本发明的目的在于提供基于一种基于机器学习的网络数据泄漏预警系统及其方法,以解决上述背景技术中提出的问题。

2、为实现上述目的,本发明提供如下技术方案:一种基于机器学习的网络数据泄漏预警方法,其方法步骤包括:

3、一种基于机器学习的网络数据泄漏预警方法,其特征在于,其方法步骤如下:

4、s1、利用旁路镜像方式收集网络流量数据,利用深度包分析算法通过对网络流量数据的头部信息检测,识别网络流量数据的通信模式,通信模式包括单向通信和双向通信,并利用内容检测算法通过对网络流量数据中的文本信息进行检测,识别网络流量数据的敏感度,敏感度包括高敏感和低敏感,将网络流量数据按通信模式和敏感度进行分类;

5、s2、利用梯度提升树算法对分类后网络流量数据进行风险预测,通过添加多种决策树来构建用梯度提升树算法模型,其中决策树算法通过选择数据中信息增益最大的特征作为根节点,逐步划分子节点直到样本同属一类,以学习特征间关联,梯度提升树算法处理网络流量数据的优先级根据网络流量数据的通信模式和敏感度来确定,并将预测结果为高风险的网络流量数据进行高风险标记;

6、s3、对高风险标记的网络流量数据进行保护,并根据通信模式和敏感度的不同,采取对应的保护措施,具体包括:

7、对低敏感双向通信利用赫尔曼动态加密进行保护;

8、对低敏感单向通信流量利用简化对称加密进行保护;

9、对高敏感网络流量数据,结合赫尔曼动态加密和访问权限控制进行保护。

10、作为本技术方案的进一步改进,所述利用旁路镜像方式收集网络流量数据,镜像过程中,所有经过网络设备的数据都会被复制到一个或多个指定的监控端口上,根据该端口接收到一份复制的网络流量数据。

11、作为本技术方案的进一步改进,所述利用深度包分析算法分析网络流量数据的通信模式,通过对网络流量数据的头部信息检测,来识别通信模式,将未收到响应的网络流量数据作为单向通信,将请求-响应模式的网络流量数据作为双向通信,通过对通信模式的差异点进行持续监控,将网络流量数据按单向通信和双向通信的通信模式进行分类。

12、作为本技术方案的进一步改进,所述利用内容检测算法分析网络流量数据的敏感度,对网络流量数据进行扫描,通过实施词汇频率统计,自然语言处理,以及与敏感词库进行比对来确定数据的敏感度,解析网络流量数据中包含的文本信息,并根据预定义的敏感度规则库,得出敏感度的高低。

13、作为本技术方案的进一步改进,所述梯度提升树算法对分类后网络流量数据进行风险预测,结合多个决策树模型形成一个强预测模型,在每一次迭代中,梯度提升树添加一个新的决策树来纠正前一轮迭代模型的预测误差,并利用梯度下降的方法找到误差最小化的方向;

14、通过构建树形结构学习特征间的关联,通过选择数据中信息增益最大的一个特征作为根节点,对于根节点下的每个子节点再根据信息增益的大小继续划分,不停迭代,直到节点达到中的样本属于同一类别,则停止生长;其中信息增益是在决策树中用来衡量一个特征对于分类任务的指标;

15、决策树从根节点开始,根据数据特征值的取值,根据判定条件选择相应的分支;进入下一节点后,根据当前节点的判定条件和数据特征值的取值,选择相应的分支进入下一个节点;从根节点到叶节点,根据数据特征值的取值一直进行分支选择,直到达到叶节点,叶节点对应风险预测结果。

16、作为本技术方案的进一步改进,所述梯度提升树算法处理网络流量数据的优先级根据网络流量数据的通信模式和敏感度来确定,其中优先级为:高敏感双向通信>高敏感单向通信>低敏感双向通信>低敏感单向通信。

17、作为本技术方案的进一步改进,对于高敏感度网络流量数据的保护,通过赫尔曼动态加密技术在每次通讯开始时根据时间戳和其他动态上下文因素计算出独特的会话密钥,并作用于传输数据上,确保同一信息在不同会话中具有不同的密文,同时配合访问权限控制技术,对网络流量数据进行紧密的安全审查和监控。

18、本发明目的之二在于,提供了基于机器学习的网络数据泄漏预警的系统法,包括数据收集与分类模块、数据风险预测模块和数据保护模块,其中:

19、所述数据收集与分类模块利用旁路镜像方式收集网络流量数据,利用深度包分析算法通过对网络流量数据的头部信息检测,识别网络流量数据的通信模式,通信模式包括单向通信和双向通信,并利用内容检测算法通过对网络流量数据中的文本信息进行检测,识别网络流量数据的敏感度,敏感度包括高敏感和低敏感,将网络流量数据按通信模式和敏感度进行分类;

20、所述数据风险预测模块利用梯度提升树算法对分类后网络流量数据进行风险预测,通过添加多种决策树来构建用梯度提升树算法模型,其中决策树算法通过选择数据中信息增益最大的特征作为根节点,逐步划分子节点直到样本同属一类,以学习特征间关联,梯度提升树算法处理网络流量数据的优先级根据网络流量数据的通信模式和敏感度来确定,并将预测结果为高风险的网络流量数据进行高风险标记;

21、所述数据保护模块对高风险标记的网络流量数据进行保护,并根据通信模式和敏感度的不同,采取对应的保护措施,具体包括:

22、对低敏感双向通信利用赫尔曼动态加密进行保护;

23、对低敏感单向通信流量利用简化对称加密进行保护;

24、对高敏感网络流量数据,结合赫尔曼动态加密和访问权限控制进行保护。

25、与现有技术相比,本发明的有益效果是:

26、1、该一种基于机器学习的网络数据泄漏预警系统及其方法主要体现在其能够实现对网络流量数据的精细分类,既包括通信模式(单向或双向通信)也包括敏感度(高敏感或低敏感),这种分类方法允许系统针对不同类型的网络流量实施更有针对性的保护措施,对于被标记为高风险的敏感数据,系统可以自动实施赫尔曼动态加密技术和多因素访问控制,从而极大增加数据被非法获取和解读的难度;对于被识别为低敏感度的数据,系统能采用更为经济高效的简化加密手段,这不仅确保了数据传输的基础安全,还有效节约了计算资源;通过这种动态调整保护策略的做法,既提升了网络安全防护的精确度,也优化了资源的分配和利用,最终达到既保护了敏感数据,又避免了不必要的资源浪费。

27、2、该一种基于机器学习的网络数据泄漏预警系统及其方法通过引入梯度提升树算法,能够对网络流量数据进行深入的风险预测,梯度提升树算法能够有效识别和预测不同网络流量数据的潜在风险等级,确保高风险数据得到足够的关注和保护,这种方法不仅强化了对数据的安全防护,减少了敏感信息的泄露风险,同时也能更快速地应对各种网络攻击,提高企业整体的网络防御能力和风险管理效率,与传统方法相比,这种基于机器学习的先进方法在保护效率、资源利用和风险应对等方面都展现了无可比拟的优势,提升网络数据泄漏预警的能力和效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1