基于双通道图注意力网络的车联网异常数据检测方法

文档序号:36828257发布日期:2024-01-26 16:41阅读:21来源:国知局
基于双通道图注意力网络的车联网异常数据检测方法

本发明属于车联网,更为具体地讲,涉及一种基于双通道图注意力网络的车联网异常数据检测方法。


背景技术:

1、在信息化的时代背景下,现代车联网用户的规模已经达到几亿级别的水平。车联网是物联网产业和智能汽车产业相互结合的产物,是物联网在智慧城市交通领域中的具体应用。通过车辆网络动态地收集、分发和处理数据,利用无线通信方式共享信息,实现车与车、车与人、车与路、车和其他基础设施之间的信息交互,使汽车与城市网络相互连接,为智能交通终端的信息传递和交互提供了实现平台,对提高交通效率以及安全性具有极其重要的意义。

2、在基于车联网的异常数据检测方法中,研究技术主要分为两类。一类是基于规则的检测,该方法依赖于已知攻击规则知识库,通过与知识库对比判断车辆是否具有异常行为。基于规则的检测方法只能检测已知的攻击,无法检测未知的攻击方式。另一类是基于异常的检测的方法,该方法通过构建模型来判断车辆行为是否属于异常。例如,当前有部分学者使用信誉机制或者博弈论对车辆节点评分,通过评分来判断其是否为异常节点;也有一些学者将机器学习、深度学习应用到了车联网的领域中,通过训练模型的方式来判断车辆节点是否为异常节点。

3、现有车联网中车辆数据异常检测方法虽然在计算消耗、计算复杂度和适应性方面存在着优势,但是却忽略了车辆节点的拓扑结构特征,特征提取不充分,导致异常检测的准确率不高。因此,在对车联网数据进行异常检测时,不仅需要考虑车辆节点的行为特征,还需要考虑节点的网络拓扑特征,并考虑特征之间的重要性关系,以有效地检测车联网中的异常数据。


技术实现思路

1、本发明目的在于克服现有技术的不足,针对现有车联网异常数据检测方法特征提取不充分、忽略节点网络拓扑特征而导致准确率不高的问题,提供一种基于双通道图注意力网络的车联网异常数据检测方法,以更好的检测车联网中的异常数据。

2、为了实现上述发明目的,本发明提供一种基于双通道图注意力网络的车联网异常数据检测方法,包括以下步骤:

3、s1:采集车联网中车辆节点数据,提取车辆节点的行为特征和网络拓扑结构特征,并进行归一化处理;

4、s2:构建双通道图注意力网络模型,用于对行为特征和网络拓扑结构特征进行深度学习;

5、s3:对双通道图注意力网络进行模型的训练、调优,并保存训练完成的网络模型;

6、s4:利用训练完成的网络模型对输入的测试样本进行车联网数据异常检测。

7、作为本发明的进一步优化方案,步骤s1中提取车辆节点的行为特征,具体过程如下:

8、将车联网构造成一个无向图g(v,e),其中v是由车辆节点构成的集合,v={v1,...,vi,...,vn},vi为id为i的车辆节点,n为车联网中车辆节点的数量;e为v中节点所构成边的集合,e={(vi,vj)|1≤i≤n,1≤j≤n,i≠j};若两个车辆节点之间存在着发送和接收数据的行为,则这两个节点之间存在着边;否则,这两个节点之间不存在着边;

9、采集车联网中车辆节点的数据,提取每个车辆节点在一段时间内原始行为特征,一段时间可以是一分钟,十分钟,也可以是一个小时等;原始行为特征包括:车辆节点vi对车辆节点vj发送的数据包总数发送数据包总时间发送总数据量车辆节点vi的行驶速度加速度车辆节点vj收到车辆节点vi的数据包总数车辆节点vi与车辆节点vj之间的初始地理位置的欧式距离1≤i≤n,1≤j≤n,i≠j,vj是节点vi的邻居节点;

10、对每个原始行为特征分别进行最大最小归一化处理,归一化方法如下:

11、

12、其中f*表示原始行为特值征,即1≤i≤n,1≤j≤n,且i≠j,表示每个原始行为特征的最小值,表示每个原始行为特征的最大值,f表示每个原始行为特征经过归一化处理后的行为特征值,即1≤i≤n,1≤j≤n,且i≠j,α是偏置值,一般取值为0.0001。

13、作为本发明的进一步优化方案,步骤s1中提取网络拓扑结构特征,具体过程如下:

14、根据车辆节点行为特征,提取每个车辆节点的网络拓扑结构特征,网络拓扑结构特征包括:与邻居节点的直接信任值、与邻居节点的间接信任值、通信关系强度值、通信影响范围值和中介中心性值;具体计算方法如下:

15、(1)计算车辆节点与邻居节点的直接信任值

16、车辆节点vi与邻居节点vj的直接信任值用dti,j表示,计算方法如下:

17、

18、其中,分别表示车辆节点vi对车辆节点vj的发送的数据包总数发送总数据量发送数据包总时间分别表示车辆节点vj对车辆节点vi发送数据包总数发送总数据量发送数据包总时间

19、

20、(2)计算车辆节点与邻居节点的间接信任值

21、建立车辆节点vi与邻居节点vj之间的交互行为关系路径路径中相邻节点存在着边,即…和属于集合e;1≤ι≤l,l表示节点vi与节点vj之间存在的交互行为关系路径数量;τι表示节点vi与节点vj之间第ι条路径中节点的数量;

22、车辆节点vi与车辆节点vj之间第ι条路径的间接信任值计算方法如下:

23、

24、其中,表示节点vi与节点之间的直接信任值;

25、车辆节点vi与邻居节点vj之间间接信任值idti,j,计算方法如下:

26、

27、(3)计算通信关系强度特征值

28、车辆节点vi的通信关系强度特征值pi,通过vi的邻居信息和聚集系数进行度量,计算方法如下:

29、

30、其中di为车辆节点vi与邻居节点的度之和,其中k(i)表示车辆节点vi的度,γ(i)表示车辆节点vi的邻居节点的集合;gi计算方法为:

31、

32、其中ci为车辆节点vi的集聚系数,计算方法如下:

33、

34、其中bi表示车辆节点vi的邻居节点之间实际存在的边数;

35、(4)计算通信影响范围值

36、车辆节点vi的通信影响范围值si,由与vi进行交互的车辆节点数量以及交互节点之间的初始距离ds进行度量,计算方法为:

37、

38、其中表示以车辆节点vi为发包车辆时发包车辆与所有收包车辆之间的距离的最大值;

39、(5)计算中介中心性值

40、车辆节点vi的中介中心性值ci,计算方式如下:

41、

42、其中σ(i)为无向图g(v,e)中任意两个不同于节点vi、且经过节点vi的节点之间的最短路径的数量。

43、作为本发明的进一步优化方案,步骤s2的具体过程如下:

44、双通道图注意力网络中的第一部分为特征提取网络,由两个相互独立的图注意力网络构成,分别由输入层、图注意力层、输出层组成;双通道图注意力网络中的第二部分包括网络权重层、串接层、全连接层和分类层组成;双通道图注意力网络的具体结构如下:

45、(1)特征提取网络的第一层为输入层,包含两个通道:第一个通道用于输入车辆节点的行为特征张量[batchsize,node_num,7],第二个通道用于输入车辆节点的网络拓扑结构特征张量[batchsize,node_num,5];其中batchsize为训练批次,node_num为节点数量,7和5分别代表节点行为特征和网络拓扑结构特征的维度;

46、(2)特征提取网络的第二层为图注意力层,使用注意力机制计算节点之间的重要性,具体计算方法如下:

47、计算第t个网络通道中任意车辆节点vi和车辆节点vj之间的注意力系数eti,j,计算方法为:

48、

49、其中wt为第t个网络通道的、可训练的、大小为f′×f权重矩阵,f′表示输出节点的特征的维度,f表示输入节点特征的维度;表示第t个网络通道的注意力机制的权重向量,大小为2f′×1;与分别表示第t个网络通道的、节点vi对节点vj进行通信,或节点vj对节点vi进行通信时的特征向量,特征向量由行为特征或网络拓扑特征构成;t表示转置操作;σ表示非线性激活函数leakyrelu,||表示串接操作;γ(i)表示节点vi的邻居节点的集合;t取值为1和2,分别对应第一个网络通道和第二个网络通道;

50、利用softmax函数对注意力系数进行标准化处理,计算方法如下:

51、

52、其中表示第t个网络通道中节点vi和节点vj之间的标准注意力系数,即节点之间的重要性;

53、(3)特征提取网络的第三层为输出层,两个通道的输出表示如下:

54、通过聚合节点的邻接节点的特征来更新节点的特征,对于节点vi,更新后的节点特征的计算方法如下:

55、

56、其中k表示多头注意力机制的头数;k表示多头注意力机制中第k组注意力机制;表示第t个网络通道的、大小为f′×f权重矩阵;表示第t个网络通道输出更新后的节点特征向量,大小为1×f;

57、(4)第二部分的网络权重层,计算方法如下:

58、

59、其中βt表示第t个网络通道的权重参数;表示第t个网络通道的重要性,计算方法为:

60、

61、n表示网络节点的数量;表示第t个网络通道的注意力机制的权重向量,tanh表示激活函数;表示聚合邻居节点特征后更新的特征向量;bt是第t个网络通道的偏置向量,通过训练得到;

62、(5)第二部分的串接层,将双通道网络的输出进行串接,得到新的特征,表示如下:

63、

64、其中fi表示节点vi经过两个网络通道输出串接后的特征,大小为1×12;

65、(6)第二部分的全连接层,将串接层输出的特征fi通过非线性激励函数relu,映射得到特征向量x;采用dropout方法控制隐层中节点的工作方式;

66、(7)第二部分的分类层,采用softmax回归分类器,将全连接层输出的特征全部连接到两个输出节点,两个输出节点分别对应正常节点和异常节点,经过softmax处理后得到一个2维的特征向量,特征向量中每一个维度的值表示为输入样本属于该类别的概率。

67、作为本发明的进一步优化方案,步骤s2中,非线性激励函数leakyrelu和relu的表达式分别为leakyrelu(x)=max(κx,x)和relu=max(0,x),其中κ为常数,通常取0.01~0.03。

68、作为本发明的进一步优化方案,其特征在于,分类层中softmax分类函数为:

69、

70、其中,m表示车联网节点的类别的数量,m=1,2,分别表示正常节点和异常节点;ωm为分类器对于第m类节点的权重矩阵,x为全连接层输出的特征向量;h(x)m表示输入样本属于第m类节点类型的概率;

71、输入数据最终所属类别判断方法为:在两个概率中寻找最大值,最大的h(x)m所对应的m即为输入样本的分类结果,用category(x)表示:

72、

73、作为本发明的进一步优化方案,步骤s3中,对网络进行训练、调优,具体步骤如下:

74、(1)将双通道图注意力网络的权值初始化为0、方差为常数的高斯分布,偏置参数设置为0;

75、(2)将行为特征作为第一个通道的输入,网络拓扑结构特征作为第二个通道的输入,计算双通道图注意力网络输出类型与相应的实际类型的误差,按极小化的方法反向传播,调整权重矩阵;其中,训练过程中两个分支网络独立更新自己的参数;

76、(3)重复迭代训练,softmax分类器的损失函数值趋于稳定时结束训练,保存此时训练好的网络模型。

77、作为本发明的进一步优化方案,分类层中softmax分类器的损失函数定义为:

78、

79、其中,yi,m和分别表示车辆节点vi属于m类的真实概率和模型预测属于第m类的概率,其中真实概率是指车辆节点的真实类别的概率分布,预测概率是指softmax模型输出车辆节点类型的概率分布。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1