一种电力系统网络威胁知识图谱构建方法与流程

文档序号:37645784发布日期:2024-04-18 18:12阅读:23来源:国知局
一种电力系统网络威胁知识图谱构建方法与流程

本发明涉及自然语言处理,具体为一种电力系统网络威胁知识图谱构建方法。


背景技术:

1、在现实中,通常需要多个电力系统网络协作以实现高效生产和控制。例如,国家电网公司的业务和设施遍布各省、市,需要在各省公司、市公司建立多级工业互联网,以提高电网运行效率和故障定位能力。然而,分布式的结构在给电力系统网络带来高效计算、通信、远程控制等方面好处的同时,也引入了安全风险,大量的控制数据在各级网络汇聚、转发,使得这些网络成为攻击者的重要目标。电力系统网络中另一个值得考虑的是入侵检测方法选取问题,基于特征的入侵检测方法仅限于检测出已建立模式的入侵行为,无法检测未知攻击,因为它依赖于已知特征,需要频繁更新特征库以适应新攻击;基于异常的入侵检测可能产生较高的误报率,因为正常行为也可能发生变化,难以准确定义正常模型,需要大量训练数据;基于深度学习的入侵检测需要大量的训练数据和计算资源,可能对解释性较差,容易受到对抗性攻击。基于知识图谱的入侵检测结合了知识图谱和网络安全领域的专业知识,以帮助识别和防止网络入侵。

2、然而现有方法通常建立在大量复杂数据的基础上,需要极强的专业知识,同时性能不佳,导致现有的方法不能真正有效的建立电力网络威胁知识图谱。


技术实现思路

1、为解决上述背景技术中提出的问题,本发明提供一种电力系统网络威胁知识图谱构建方法,以解决现有技术通常建立在大量复杂数据的基础上,需要极强的专业知识,同时性能不佳的问题。

2、本发明的技术方案如下:

3、一方面,本发明提出一种电力系统网络威胁知识图谱构建方法,包括以下步骤:

4、基于电力系统设备的基本信息构建初始向量集合z;

5、将初始向量集合z输入特征编码器中进行编码,输出初始向量集合z的最终表示mk;

6、将最终表示mk输入解码器作为多标签分类任务进行计算,得到最终嵌入rj;

7、构建联合提取模块用于实现三元组抽取,联合提取模块选取两个实体作为目标实体对,并为不同实体分配不同的语义关系,再结合最终嵌入rj输出标记序列;

8、构建联合训练模块用于结合上述输出的标记序列优化联合提取模块和联合训练模块的本地损失以及全局损失;

9、输出训练完成的电力系统网络威胁知识图谱。

10、作为优选实施方式,所述电力系统设备的基本信息包括系统配置信息、漏洞信息以及网络拓扑信息。

11、作为优选实施方式,所述特征编码器包括共享编码层、深度编码层和相关系数计算层。

12、作为优选实施方式,所述共享编码层包括bert预训练模型和bilstm模型。

13、作为优选实施方式,所述将初始向量集合z输入特征编码器中进行编码,输出初始向量集合z的最终表示mk步骤具体为:

14、所述初始向量z具体为z={z1,z2,...,zn},初始向量z输入到特征编码器中的共享编码层进行编码,得到初始向量z的初始任务共享表示

15、所述深度编码层包括多层扩展卷积和最大池化max-pooling;

16、在所述多层扩展卷积中生成x的特征表示m,具体公式如下:

17、

18、式中,t表示m集合中的第一个特征,n表示集合中的特征数;

19、所述最大池化max-pooling用于捕获特征表示m的句子级特征所述特征δ用于获取m的上下文语义信息,特征δ具体表达为:

20、

21、式中,norm表示归一化操作,h表示所生成的文本;

22、由于不同特征在一个向量中有不同的权重,相关系数计算层中的相关系数应用了门控操作机制,具体计算过程如下:

23、eki=tanh(whmi+wsm+wkrk+battn)

24、

25、

26、gk=σ([(w1m+b1);(w2ck+b2)])

27、uk=gk⊙tanh(w3ck+b3)

28、式中,eki表示隐藏层的嵌入;wh,ws,wk,w1,w2,battn,b1,b2均为可学习的参数;mi表示第i个特征的隐藏状态向量;rk表示第k个关系可训练嵌入;αt,i表示相关系数,用于衡量每个特征对表达式的重要性;ck代表特征的具体上下文信息;⊙代表点乘,σ表示sigmoid()激活函数;uk表示保留的关系特征;

29、初始向量中z中电力系统设备的基本信息的最终表示mk通过连接mi和uk获取,具体计算公式如下:

30、

31、因此,初始向量最终表示为

32、作为优选实施方式,所述将最终表示mk输入解码器作为多标签分类任务进行计算,得到最终嵌入rj步骤具体为:

33、将初始向量最终表示为mk输入到解码器的关系预测层中,作为一个多标签分类任务,具体计算过程如下:

34、计算特征嵌入ρ,具体公式如下:

35、ρ=relu(maxp(conv(norm([g;mk]))))

36、式中,maxp代表最大池算子,conv表示卷积算子,g表示改进的bilstm的全局嵌入;

37、定义第j个关系类型的二元分类器,具体公式如下:

38、

39、

40、式中,rj代表第j个关系类型的最终关系嵌入,表示特征是否包含第j个关系的概率分布,和是科学系的参数;

41、将最终嵌入tj的关系将被馈送到所述联合提取模块中。

42、作为优选实施方式,所述步骤构建联合提取模块用于实现三元组抽取中的三元组抽取过程的具体计算公式如下:

43、

44、

45、式中,表示加权的值;wr,wd和wp均代表科学系的参数,oci表示科学系的第i个关系的嵌入表示;gt-1代表第t-1步时实体预测生成的全局嵌入;表示与第i个关系相关的标记序列;表示在时间步长t的输入向量。

46、作为优选实施方式,所述构建联合训练模块用于结合上述输出的标记序列优化联合提取模块和联合训练模块的本地损失以及全局损失步骤的具体计算公式如下:

47、

48、llocal=λlrel+(1-λ)lent

49、

50、式中,ε和分别表示真实标记序列和预测标记序列,表示联合概率,λ表示平衡联合提取模块以及联合训练模块的超参数,表示在输出的子集φ(s)上的再归一化,q分布的锐度受超参数αmr调节,u用来衡量q的相关性,表示一个交叉熵损失函数。

51、另一方面,本发明提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明任一实施例所述的一种电力系统网络威胁知识图谱构建方法。

52、另一方面,本发明提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任一实施例所述的一种电力系统网络威胁知识图谱构建方法。

53、本发明具有如下有益效果:

54、1、本发明与传统的电力系统网络威胁知识图谱构建方法相比所需要的数据要求大大降低,即使在资源有限的情况下,也能够进行威胁检测和分析,提高了电力系统的安全性。

55、2、本发明通过减少数据处理和分析的复杂性,可以更快速地识别潜在的威胁和异常行为,从而降低了响应时间,有助于迅速应对威胁。

56、3、本发明通过构建电力系统网络威胁知识图谱,可以更好地了解电力系统中的威胁和潜在漏洞。这有助于提前发现并采取措施来应对威胁,降低了电力系统遭受攻击的风险。

57、4、本发明通过可以学习的联合提取模块和联合训练模块,可以更容易地适应不断变化的电力系统网络和威胁环境,因此更具未来发展潜力。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1