本发明涉及互联网,具体而言,涉及一种基于流量分析的终端设备分类方法及系统。
背景技术:
1、在在当前的网络环境中,终端设备的多样性日益增加,从传统的个人电脑到智能手机、平板电脑、物联网设备等,每种设备都有其独特的网络行为特征。传统的设备识别方法主要依赖于设备的物理标识或用户手动配置,这些方法在动态变化的网络环境中显得笨重且不灵活。此外,随着网络攻击手段的不断演变,准确识别和分类终端设备对于网络安全管理变得至关重要。
2、现有的自动识别技术,如基于mac地址或ip地址的识别方法,虽然简单易行,但易受网络配置变更或地址欺骗的影响,无法提供持续准确的设备识别。因此,开发一种能够自动、准确识别终端设备类型的方法,尤其是在无需额外硬件支持的情况下,成为当前网络管理领域的一个重要研究方向。
技术实现思路
1、本发明的目的在于提供了一种基于流量分析的终端设备分类方法及系统,用以解决现有技术中存在的上述问题。
2、本发明实施例提供了一种基于流量分析的终端设备分类方法,所述方法包括:
3、获得待测设备的网络流量数据;
4、将网络流量数据输入预先训练好的设备预测网络中,设备预测网络对网络流量数据特征提取,获得网络流量特征;基于网络流量特征获得预测概率向量,预测概率向量包括多个预测概率值,每个预测概率值对应一个设备类型;
5、将网络流量特征转化成模糊值;
6、对模糊值进行模糊推理,获得推理概率向量,推理概率向量包括多个推理概率值,每个推理概率值对应一个设备类型;
7、基于预测概率向量和推理概率向量获得注意力权重向量;基于注意力权重向量调整预测概率向量,获得设备分类概率向量;设备分类概率向量包括多个分类概率值,每个分类概率值对应一个设备类型;
8、以设备分类概率向量中最大的分类概率值对应的设备类型作为待测设备的类型。
9、可选的,设备预测网络的训练方法包括:
10、设备预测网络包括输入层、多个卷积层、多个池化层、全连接层和输出层,多个卷积层和多个池化层交叉设置;
11、获得训练集,训练集包括多个训练设备的网络流量数据;多个训练设备中存在设备类型不同的训练设备,每个训练设备被预先标记了设备类型;每个设备类型对应一个设备标记值;多个训练设备的设备标记值构成训练类型向量;
12、通过输入层对训练集进行数据对齐处理,获得对齐训练数据;
13、通过卷积层对齐训练数据进行卷积操作,获得卷积特征;
14、通过池化层对卷积数据进行池化操作,获得池化数特征;
15、通过全连接层将池化数特征转化成训练预测向量,通过输出层输出训练预测向量;练预测向量包括多个训练概率,每个训练概率对应一个设备类型;训练预测向量与训练设备一一对应;
16、将池化数据特征转化成训练模糊值;
17、对训练模糊值进行模糊推理,获得训练推理向量;训练推理向量包括多个训练概率值,每个训练概率值对应一个设备类型;训练推理向量与训练设备一一对应;
18、基于练预测向量和训练推理向量获得训练注意力权重向量;基于训练注意力权重向量调整训练预测概率向量,获得训练设备分类概率向量;训练设备分类概率向量包括多个训练分类概率值,每个训练分类概率值对应一个设备类型;训练设备分类概率向量与训练设备一一对应;
19、基于训练设备分类概率向量获得模型损失函数;
20、若模型损失函数收敛,确定设备预测网络训练结束。
21、可选的,基于训练设备分类概率向量获得模型损失函数,包括:
22、多个训练设备对应获得多个训练设备分类概率向量;以多个训练设备分类概率向量作为训练预测概率矩阵的列,构成训练预测概率矩阵;
23、获得训练类型向量与训练预测概率矩阵的相关指数;
24、以相关指数作为损失函数。
25、可选的,获得训练类型向量与训练预测概率矩阵的相关指数,包括:
26、获得训练类型向量与训练预测概率矩阵的每一列的信息熵,训练预测概率矩阵的每一列对应获得一个信息熵;训练预测概率矩阵有多行对应获得多个信息熵;
27、以多个信息熵的均值作为相关指数。
28、可选的,基于练预测向量和训练推理向量获得训练注意力权重向量,包括:
29、获得练预测向量与训练推理向量的点积相似度:s(i,j)=pi·ij,其中pi表示训练预测向量的第i个元素,ij表示训练推理向量的第j个元素,i和j的取值为正整数;s(i,j)表示训练预测向量的第i个元素与训练推理向量的第j个元素的点积相似度;基于点积相似度获得注意力分数:a(i,j)=f(s(i,j)),其中a(i,j)是训练预测向量的第i个元素与训练推理向量的第j个元素的注意力分数;f(s(i,j))是relu函数;
30、归一化权重:其中,αj是训练推理向量的第j个元素ij的注意力权重,k的取值为1,2,......,n,n为训练推理向量的元素的数量;n为正整数;
31、以多个归一化权重作为训练注意力权重向量的元素构成训练注意力权重向量。
32、可选的,基于训练注意力权重向量调整训练预测概率向量,获得训练设备分类概率向量,包括:
33、对训练注意力权重向量和训练预测概率向量进行叉乘运算,获得训练设备分类概率向量。
34、本发明实施例还提供了一种基于流量分析的终端设备分类系统,所述系统包括:
35、获得模块,用于获得待测设备的网络流量数据;
36、预测模块,用于将网络流量数据输入预先训练好的设备预测网络中,设备预测网络对网络流量数据特征提取,获得网络流量特征;基于网络流量特征获得预测概率向量,预测概率向量包括多个预测概率值,每个预测概率值对应一个设备类型;
37、分类模块,用于将网络流量特征转化成模糊值;对模糊值进行模糊推理,获得推理概率向量,推理概率向量包括多个推理概率值,每个推理概率值对应一个设备类型;基于预测概率向量和推理概率向量获得注意力权重向量;基于注意力权重向量调整预测概率向量,获得设备分类概率向量;设备分类概率向量包括多个分类概率值,每个分类概率值对应一个设备类型;以设备分类概率向量中最大的分类概率值对应的设备类型作为待测设备的类型。
38、可选的,在基于流量分析的终端设备分类系统中,设备预测网络的训练方法包括:
39、设备预测网络包括输入层、多个卷积层、多个池化层、全连接层和输出层,多个卷积层和多个池化层交叉设置;
40、获得训练集,训练集包括多个训练设备的网络流量数据;多个训练设备中存在设备类型不同的训练设备,每个训练设备被预先标记了设备类型;每个设备类型对应一个设备标记值;多个训练设备的设备标记值构成训练类型向量;
41、通过输入层对训练集进行数据对齐处理,获得对齐训练数据;
42、通过卷积层对齐训练数据进行卷积操作,获得卷积特征;
43、通过池化层对卷积数据进行池化操作,获得池化数特征;
44、通过全连接层将池化数特征转化成训练预测向量,通过输出层输出训练预测向量;练预测向量包括多个训练概率,每个训练概率对应一个设备类型;训练预测向量与训练设备一一对应;
45、将池化数据特征转化成训练模糊值;
46、对训练模糊值进行模糊推理,获得训练推理向量;训练推理向量包括多个训练概率值,每个训练概率值对应一个设备类型;训练推理向量与训练设备一一对应;
47、基于练预测向量和训练推理向量获得训练注意力权重向量;基于训练注意力权重向量调整训练预测概率向量,获得训练设备分类概率向量;训练设备分类概率向量包括多个训练分类概率值,每个训练分类概率值对应一个设备类型;训练设备分类概率向量与训练设备一一对应;
48、基于训练设备分类概率向量获得模型损失函数;
49、若模型损失函数收敛,确定设备预测网络训练结束。
50、可选的,在基于流量分析的终端设备分类系统中,基于训练设备分类概率向量获得模型损失函数,包括:
51、多个训练设备对应获得多个训练设备分类概率向量;以多个训练设备分类概率向量作为训练预测概率矩阵的列,构成训练预测概率矩阵;
52、获得训练类型向量与训练预测概率矩阵的相关指数;
53、以相关指数作为损失函数。
54、可选的,在基于流量分析的终端设备分类系统中,获得训练类型向量与训练预测概率矩阵的相关指数,包括:
55、获得训练类型向量与训练预测概率矩阵的每一列的信息熵,训练预测概率矩阵的每一列对应获得一个信息熵;训练预测概率矩阵有多行对应获得多个信息熵;
56、以多个信息熵的均值作为相关指数。
57、相较于现有技术,本发明实施例达到了以下有益效果:
58、本发明实施例提供了一种基于流量分析的终端设备分类方法机系统,所述方法包括:通过将cnn的特征提取能力、模糊决策的鲁棒性和注意力机制的聚焦能力相结合,基于网络流量数据对待测设备进行分类,提高了待测设备分类的准确性,具体的:获得待测设备的网络流量数据;将网络流量数据输入预先训练好的设备预测网络中,设备预测网络对网络流量数据特征提取,获得网络流量特征;基于网络流量特征获得预测概率向量,预测概率向量包括多个预测概率值,每个预测概率值对应一个设备类型;将网络流量特征转化成模糊值;对模糊值进行模糊推理,获得推理概率向量,推理概率向量包括多个推理概率值,每个推理概率值对应一个设备类型;基于预测概率向量和推理概率向量获得注意力权重向量;基于注意力权重向量调整预测概率向量,获得设备分类概率向量;设备分类概率向量包括多个分类概率值,每个分类概率值对应一个设备类型;以设备分类概率向量中最大的分类概率值对应的设备类型作为待测设备的类型。其不仅提升了分类的准确性和鲁棒性,还增强了模型的解释性和适应性,优化了计算效率,并改善了用户体验。通过这种综合性的方法,终端设备分类技术能够更好地应对日益复杂的应用需求,为未来的智能系统发展奠定坚实基础。