本发明涉及计算机,特别是涉及一种基于深度学习的信息安全保密方法和装置。
背景技术:
1、网络信息传输是现代化市场中信息传递与资源流通的主要方式之一,也是各单位数据信息交互的核心渠道。但是,网络的开放性较强,导致网络信息在传输数据与资源时存在一定的安全风险。为了降低此种风险对信息安全造成的影响,现有技术提出了多种针对数据传输安全的处理算法;但是传统算法综合使用性能较差,导致数据处理过程存在一定的漏洞。因此,为实现对网络传输数据信息的安全处理,保证交互终端中信息的稳定性和隐私性,需要实现传输数据的有效加密,全面保障数据的传输安全。
2、随着深度学习在图像识别、文本翻译以及自动驾驶等领域取得的巨大成功,越来越多的研究者尝试将深度学习的模型和方法应用到信息加密领域。所以,如何利用深度学习来进行信息加密,是当前信息加密领域面临的一个大难题。
技术实现思路
1、鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于深度学习的信息安全保密方法和装置,用于解决中无法利用深度学习进行信息加密的技术问题。
2、为实现上述目的及其他相关目的,本发明提供一种基于深度学习的信息安全保密方法,包括以下步骤:
3、获取传输样本信息以及与所述传输样本信息关联的流量数据;
4、对所述流量数据进行格式转换,并根据预设五元组信息对完成格式转换后的流量数据进行会话划分,得到所述传输样本信息的会话流量;其中,所述预设五元组信息包括:源ip地址、源端口、目的ip地址、目的端口、网络协议;
5、对所述会话流量进行过滤,并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征;其中,所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔;所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征;载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息;
6、基于所述传统时序特征和所述头文本特征形成文本时序特征,以及基于所述载荷文本特征形成空间特征;
7、将所述文本时序特征和空间特征输入至神经网络中进行深度学习,并计算深度学习过程中的训练损失值;
8、当所述训练损失值满足预设范围时,输出信息加密模型,并利用所述信息加密模型对待传输信息进行加密。
9、可选地,从过滤后的会话流量中提取传统时序特征的过程包括:
10、将所述会话流量中对应会话的第一个数据包的方向作为对应会话的正方向;
11、判断后续数据包的方向是否与所述正方向相同,并将与正方向相同的数据包的特征设置为+1,与正方向相反的数据包的特征设置为-1;
12、对单个会话流量的数据包的特征进行正则化,并按照发送时间间隔将每个会话流量的数据包的方向特征值与数据包长度进行相乘,得到每个会话流量的传统时序特征;
13、其中,当某个会话流量中的数据包的个数小于第一预设值时,将对应位置的传统时序特征用零填充。
14、可选地,从过滤后的会话流量中提取头文本特征的过程包括:
15、基于结构统一性和特征稳定性,从单个会话流量中提取通信协议结构网络层头部和传输层头部中前k个数据包头部所携带的文本特征;并在提取所述文本特征时,将所述网络层头部中的源ip地址和目的ip地址全部进行匿名化设置;
16、将传输层中协议为用户数据报协议udp的数据包作为头文本数据包,并在用户数据报协议udp头部结尾进行字节填充,以及在完成填充后,将每个数据包从ip包头的第一个字节开始,提取长度为第二预设值的信息作为数据包头特征;
17、对每个字节的信息将其转换为区间为[0,255]的十进制整数,并对转换后的整数进行归一化处理,得到每个会话流量的头文本特征。
18、可选地,从过滤后的会话流量中提取载荷文本特征的过程包括:
19、获取所述会话流量中对应会话的所有数据包的传输层载荷总长度,并在所述总长度小于m个字节时,记录对应会话所有传输层载荷后进行字节填充,直至会话长度大于或等于m个字节;
20、截取所述会话流量中对应会话传输层载荷部分前m个字节的信息,对每个字节的信息将其转换为区间为[0,255]的十进制整数,并对转换后的整数进行归一化处理,得到每个会话流量的载荷文本特征。
21、可选地,将所述文本时序特征和空间特征输入至神经网络中进行深度学习,并计算深度学习过程中的训练损失值的过程包括:
22、将所述文本时序特征和空间特征进行两两组合,得到多个特征集;
23、对所述多个特征集进行排序编号,并将排序编号后的特征集作为训练样本;
24、从所述训练样本中随机选择一个特征集作为基准点,并基于所述基准点按照随机间隔选择特征集作为私钥;
25、将所述私钥输入至神经网络中进行深度学习,并将同一个私钥筛选出的特征集合并成簇;
26、对每个簇进行卷积,并计算簇间的相似距离,以及将所述相似距离作为深度学习过程中的训练损失值。
27、可选地,在计算出训练损失值后,所述方法还包括:
28、将所述训练损失值分别与预设范围的最大值和最小值进行比对,判断所述训练损失值是否大于或等于预设范围的最小值,且小于或等于预设范围的最大值;
29、如果所述训练损失值大于或等于预设范围的最小值,且小于或等于预设范围的最大值,则输出此时的信息加密模型;
30、如果所述训练损失值小于预设范围的最小值,或者打于预设范围的最大值,则进行簇间合并,并计算簇间合并后的相似距离,以及将对应的相似距离作为新的训练损失值。
31、可选地,利用所述信息加密模型对待传输信息进行加密的过程还包括:
32、将所述信息加密模型作为基础加密模型,并对所述基础加密模型进行增量识别,并计算增量识别加密模型的交叉熵损失;
33、当所述交叉熵损失满足预设范围时,将此时的信息加密模型作为增强识别信息加密模型,并利用所述增强识别信息加密模型对待传输信息进行加密。
34、可选地,所述神经网络包括以下至少之一:卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。
35、本技术还提供一种基于深度学习的信息安全保密装置,该装置包括有:
36、数据采集模块,用于获取传输样本信息以及与所述传输样本信息关联的流量数据;
37、会话划分模块,用于对所述流量数据进行格式转换,并根据预设五元组信息对完成格式转换后的流量数据进行会话划分,得到所述传输样本信息的会话流量;其中,所述预设五元组信息包括:源ip地址、源端口、目的ip地址、目的端口、网络协议;
38、特征提取模块,用于对所述会话流量进行过滤,并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征;以及,基于所述传统时序特征和所述头文本特征形成文本时序特征,以及基于所述载荷文本特征形成空间特征;其中,所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔;所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征;载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息;
39、深度学习模块,用于将所述文本时序特征和空间特征输入至神经网络中进行深度学习,并计算深度学习过程中的训练损失值;
40、加密模块,用于在所述训练损失值满足预设范围时,输出信息加密模型,并利用所述信息加密模型对待传输信息进行加密。
41、可选地,所述神经网络包括以下至少之一:卷积神经网络、循环神经网络、深度信任网络、自编码网络、生成对抗网络。
42、如上所述,本发明提供一种基于深度学习的信息安全保密方法和装置,具有以下有益效果:本技术首先获取传输样本信息以及与所述传输样本信息关联的流量数据,然后对所述流量数据进行格式转换,并根据预设五元组信息对完成格式转换后的流量数据进行会话划分,得到所述传输样本信息的会话流量;其中,所述预设五元组信息包括:源ip地址、源端口、目的ip地址、目的端口、网络协议;再对所述会话流量进行过滤,并从过滤后的会话流量中提取传统时序特征、头文本特征和载荷文本特征;其中,所述传统时序特征至少包括所述会话流量中对应会话的前k个数据包的长度、传输方向和发送时间间隔;所述头文本特征至少包括所述会话流量中对应会话的前k个数据包头部所携带的文本特征;载荷文本特征至少包括所述会话流量中对应会话传输层载荷部分前m个字节的信息;再然后基于所述传统时序特征和所述头文本特征形成文本时序特征,以及基于所述载荷文本特征形成空间特征;最后将所述文本时序特征和空间特征输入至神经网络中进行深度学习,并计算深度学习过程中的训练损失值;当所述训练损失值满足预设范围时,输出信息加密模型,并利用所述信息加密模型对待传输信息进行加密。由此可知,本技术通过以会话流量为基础识别单位,提取会话流量的传统时序特征和数据包头文本特征构成文本时序特征,也即加密流量时序特征,同时提取会话流量的载荷文本特征作为空间特征。再对加密流量时序特征和空间特征进行预训练,取各自的全连接网络中间层输出作为加密流量的新时序特征和新空间特征,拼接在一起得到会话流量的混合特征用于加密流量应用类型的识别和分类,从而能够根据不同环境下的加密流量数据情况,动态调整学习和特征提取的重心,始终保持极高的识别准确率。所以,本技术通过引入深度学习来进行信息加密,不仅能够丰富信息加密的业务能力,而且能够保证信息加密的准确性。