一种用于测试评价智能电网可用性的虚假数据注入方法

文档序号:33392394发布日期:2023-03-08 11:37阅读:70来源:国知局
一种用于测试评价智能电网可用性的虚假数据注入方法

1.本发明涉及智能电网安全分析领域,具体说是一种用于测试评价智能电网可用性的虚假数据注入方法。


背景技术:

2.近年来,随着工业化生产和信息化技术的深度融合,电力网络系统逐渐向复杂化、智能化的方向上发展。虽然计算机网络高度融合的智能电网能够更加高效、便捷地运行,但是这也使其存在面临网络入侵的风险。针对智能电网的攻击逐渐引起人们对于智能电网安全性和可用性的重视。
3.为了保障数据安全,大量智能电网采用scada系统(supervisory control and data acquisition,工业数据采集和控制系统)来进行状态估计和异常检测。scada系统通过提供测量数据的冗余度来提高数据正确率,自动排查出随机干扰所引起的虚假数据,估计或预报智能电网的运行状态。这些措施对智能电网中的虚假数据具有过滤作用,降低了虚假数据对于智能电网正常运行的干扰。
4.在scada系统被广泛采用之后,一些研究者也在研究智能电网中新的网络威胁形式。在众多技术手段中,使用较为广泛的是虚假数据注入(false data injection,fdi),且对智能电网的破坏性较为显著。对手在研究电网拓扑结构的基础上,通过干预电表测量值,混淆传统的虚假数据检测策略,进而导致错误的系统调用,造成经济损失甚至于智能电网的瘫痪或崩溃,引发重大系统安全问题。因此,对于fdi方法的研究,可以增强智能电网检测和防御以fdi为代表的网络威胁的能力,进而保障智能电网安全性和可用性。
5.现有的fdi设计已经取得了一定的成果,但仍有以下两种缺陷:
6.(1)现有的成果主要侧重于全节点的干预,而弱化了真实条件下影响智能电网局部区域的可能性和强度;
7.(2)现有的成果强调针对智能电网静态信息特征的干预,而忽视虚假数据中时序信息特征的隐蔽性,所以可通过基于时序分析的检测策略(简称时序检测)识别。
8.因此有必要研究一种能够避开时序检测识别的fdi方法,构建针对时序检测隐蔽性较强的虚假数据,为该检测策略针对智能电网虚假数据检测和防御能力的提升提供数据支撑。


技术实现要素:

9.针对现有技术中存在的缺陷,本发明的目的在于提供一种用于测试评价智能电网可用性的虚假数据注入方法,生成时序信息特征隐蔽性较强的虚假数据。
10.为达到以上目的,本发明采取的技术方案是:
11.一种用于测试评价智能电网可用性的虚假数据注入方法,包括如下步骤:
12.s1、获取智能电网的历史功率负载数据,通过timegan迭代对抗训练,得到虚假数据构造模型和待干预区域;
13.s2、获取智能电网的实时功率负载数据,在待干预区域中利用虚假数据构造模型注入虚假数据;
14.其中,所述虚假数据包括静态信息和时序信息。
15.进一步地,步骤s1具体包括以下步骤:
16.s1-1、获取智能电网的scada系统中的历史功率负载数据,并对所述历史功率负载数据进行序列编号;
17.s1-2、对所述历史功率负载数据通过timegan训练生成虚假数据,对所述虚假数据进行相对范数值和残差检验值计算,选择最优虚假数据数量;
18.s1-3、在所述历史功率负载数据中,随机选取所述最优虚假数据数量的数据,作为所述待干预区域,并对所述待干预区域内的数据进行timegan训练,得到所述虚假数据构造模型,其中,本步骤中的timegan训练与步骤s1-2中的timegan训练相比,学习率低,迭代周期长。
19.进一步地,步骤s2具体包括以下步骤:
20.s2-1、获取智能电网的实时功率负载数据,并对所述实时功率负载数据进行序列编码;
21.s2-2、按照所述待干预区域选择实时功率负载数据中对应的数据,再将所选数据输入虚假数据构造模型中,生成虚假数据;
22.s2-3、根据序列编码,用所述虚假数据替代实时功率负载数据,再将混入虚假数据的实时功率负载数据传输回智能电网的控制中心,完成注入虚假数据。
23.进一步地,步骤s1-2中所述相对范数值按照式(1)计算:
[0024][0025]
式中,n为步骤s1-1获取数据在干预前的范数值,为步骤s1-1获取数据在干预后的范数值,n
ex
为相对范数值;
[0026]
步骤s1-2中所述残差检验值按式(2)和式(3)计算:
[0027][0028]
式中,为输入虚假数据向量,是智能电网中状态向量的最优交流状态估计值,的非线性映射函数;
[0029][0030]
式中,ri∈residual,为残差的二范数值,即残差检验值;
[0031]
步骤s1-2中所述选择最优虚假数据数量,通过对比相对范数值n
ex
和残差检验值选出相对范数值和残差检验值变化趋势的交接点的虚假数据数量作为最优虚假数据数量。
[0032]
进一步地,所述timegan训练过程包括:
[0033]
将智能电网功率负载数据分别输入至嵌入函数和生成器中,嵌入函数对数据进行隐编码,得到信息特征,生成器将数据打乱并进行隐编码,构造虚假数据信息特征;
[0034]
判别器将生成器构造的虚假数据信息特征和嵌入函数中未被打乱的信息特征进
行静态信息特征和时序信息特征比较,并返回损失值以改进生成器;
[0035]
以最小化原始数据分布和虚假数据分布的相对熵为目标函数进行多轮迭代优化。
[0036]
本发明所述的一种用于测试评价智能电网可用性的虚假数据注入方法,具有以下有益效果:
[0037]
与传统主要针对智能电网静态信息特征的虚假数据注入方法相比,本发明所述方法对智能电网负载数据的时序关系进行虚假数据构造,从而在智能电网可用性分析的时序检测中有较强的隐蔽性。
[0038]
本发明所述方法既构造具有与原电网数据相似时序信息特征的虚假数据,同时也保证虚假数据的静态信息特征满足智能电网的拓扑关系和各区域之间的物理关系。
[0039]
本发明采用timegan识别了数据的时序信息特征和静态信息特征,使得数据能够在静态和时序两个特征维度保持隐蔽性,难以被传统的虚假数据检测策略识别。
附图说明
[0040]
本发明有如下附图:
[0041]
图1本发明的模型训练阶段流程图;
[0042]
图2本发明的模型实施阶段流程图;
[0043]
图3本发明模型训练实施合成流程图;
[0044]
图4本发明采用的时序生成对抗网络的训练过程示意图;
[0045]
图5本发明的相对范数值、残差检验值随虚假数据量的变化图;
[0046]
图6使用gan模型和使用timegan模型进行虚假数据注入的漏检率对比图;
[0047]
图7样例未被本发明所述方法干预和被本发明所述方法干预时选取的数据功率负载变化趋势图;
[0048]
图8样例未被传统方法干预和被传统方法干预时选取的数据功率负载变化趋势图。
具体实施方式
[0049]
本发明针对现有fdi设计思路中全节点实施的不足,以及忽视虚假数据中时序信息特征隐蔽性等缺陷,基于时序生成对抗网络(time-series generative adversarial networks,timegan),提出一种用于测试评价智能电网可用性的虚假数据注入方法,该方法通过timegan多轮对抗训练,生成时序信息特征隐蔽性较强的虚假数据。本发明面向智能电网的可用性分析需求,旨在提出避开现有时序检测的fdi方法。在此基础上,为时序检测提供更全面的设计思路,从而进一步完善智能电网防御网络威胁的能力,为智能电网可用性评估和防御能力检测提供数据支撑。
[0050]
以下结合附图对本发明作进一步详细说明。
[0051]
如图3所示,本发明所述的一种用于测试评价智能电网可用性的虚假数据注入方法,包括如下步骤:
[0052]
步骤1,获取智能电网的历史功率负载数据,通过timegan迭代对抗训练,得到虚假数据构造模型,以及待干预区域;
[0053]
步骤2,获取智能电网的实时功率负载数据,并在待干预区域中利用虚假数据构造
模型注入虚假数据。
[0054]
进一步,如图1所示,步骤1具体包括如下步骤:
[0055]
步骤1-1,获取智能电网的scada系统中的历史功率负载数据,并对其进行序列编号;
[0056]
步骤1-2,对历史功率负载数据通过timegan小规模快速训练生成虚假数据,对虚假数据进行相对范数值和残差检验值计算,对比并选出最优虚假数据数量;
[0057]
小规模快速训练的学习率较高,迭代周期较短,训练速度较快,训练结果较为粗略;
[0058]
本步骤旨在研究局部区域fdi实施方法,弥补现有fdi方法的设计思路中全节点实施的不足,更加真实地模拟智能电网实际面临的风险;
[0059]
步骤1-3,在历史功率负载数据中,随机选取属于最优虚假数据数量的数据,作为待干预区域,并对所述待干预区域内的数据进行timegan深入模型训练,得到虚假数据构造模型;
[0060]
深入模型训练的学习率较低,迭代周期较长,训练速度较慢,训练结果较为精细。
[0061]
进一步,如图2所示,步骤2具体包括如下步骤:
[0062]
步骤2-1,获取智能电网的实时功率负载数据,并对其进行序列编码;
[0063]
步骤2-2,按照待干预区域选择实时功率负载数据中对应的数据,再将所选数据输入虚假数据构造模型中,生成虚假数据;
[0064]
步骤2-3,根据序列编码,用虚假数据替代原实时功率负载数据,再将混入虚假数据的实时功率负载数据传输回智能电网的控制中心,完成注入虚假数据。
[0065]
所述虚假数据包括虚假数据的静态信息和时序信息,分别代表静态信息特征和时序信息特征对应的数据信息。
[0066]
进一步,所述的历史功率负载数据的组成为:某一预设时刻之前的,流入智能电网各区域的历史有功功率和无功功率;即:历史有功功率负载数据和历史无功功率负载数据合起来构成历史功率负载数据;所述的实时功率负载数据的组成为:从当前时刻开始,流入智能电网各区域的实时有功功率和无功功率;即:实时有功功率负载数据和实时无功功率负载数据合起来构成实时功率负载数据。
[0067]
进一步,步骤1-2中具体包括如下步骤:
[0068]
步骤1-2-1,按照式(1)计算上述步骤1-1获取的数据干预前后数据的范数值,n和计算数据的相对范数值n
ex

[0069][0070]
步骤1-2-2,输入虚假数据向量按照式(2)计算残差:
[0071][0072]
式中是智能电网中状态向量的最优交流状态估计值,是的非线性映射函数。在训练过程中,实际为虚假数据向量的拟合函数,因此不需要输入状态向量。
[0073]
步骤1-2-3,设变量ri∈residual,按照式(3)计算残差的二范数值即残差检验
值:
[0074][0075]
步骤1-2-4,将步骤1-2-1和步骤1-2-3得到的相对范数值n
ex
和残差检验值检验对比,选出最优虚假数据数量。上述相对范数值n
ex
和残差检验值为数据的静态信息特征指标。
[0076]
进一步,步骤1-2-4所述的对比过程为:平衡虚假数据破坏性和针对不良数据检测器隐蔽性的过程。当破坏性较大时,数据的残差检验值也会随之增大,进而导致虚假数据以较高的概率被不良数据检测器检测出,成功率降低;若追求过高的隐蔽性,则数据的相对范数值会处于较高水平,破坏性较小且效果减弱。最优虚假数据数量是产生该数量的虚假数据时,相对范数和残差值一个是不断的增大,一个是不断减小,然而只有两者都是越小越好的,因此最后选取的是选取两者变化趋势的交接点,如图5所示,在此交接点上,数据的相对范数和残差检验值均处于较低水平,破坏性和隐蔽性较强,干预效果最优。该对比保障了虚假数据构造模型能够生成破坏性较高、隐蔽性较强的数据。通过此分析,为网络协同制造平台衡量虚假数据破坏性等各项指标有着指导作用。
[0077]
进一步,如图4所示,所述的timegan训练过程为:
[0078]
将智能电网功率负载数据分别输入至嵌入函数和生成器中,嵌入函数对数据进行隐编码,得到信息特征,生成器将数据打乱并进行隐编码,构造虚假数据信息特征;
[0079]
判别器将生成器构造的虚假数据信息特征和嵌入函数中未被打乱的信息特征进行静态信息特征和时序信息特征比较,并返回损失值以改进生成器;
[0080]
多轮迭代上述训练过程,实现式(4)的优化过程,最终得到能够构造时序信息特征接近原数据的虚假数据:
[0081][0082]
其中s和t分别为功率负载数据的静态信息特征和时序信息特征,d(p||q)为两个概率的kl距离,或称作相对熵。此过程可以实现虚假数据分布和原数据分布p(s,t)之间的信息差达到最小,从而实现两种数据在分布上的相似性,进而达到混淆智能电网中虚假数据检测策略的目的。最终,得到能够构造时序信息特征接近原数据的虚假数据构造模型。
[0083]
训练完成后,恢复函数可以将模型中的信息特征解码,得到虚假数据。其中,静态信息特征为智能电网的拓扑关系,和数据区域间遵守的物理关系,时序信息特征为功率负载数据随时间产生的变化。
[0084]
这个训练过程主要构造了时序信息特征隐蔽性较强的虚假数据,但是因为网络中的嵌入函数保存了数据中的静态信息特征,所以训练得到的虚假数据构造模型依然较好地保持数据的拓扑关系和物理关系。智能电网传统的虚假数据检测策略主要检测步骤1-2-3所述的数据残差检验值,即表明数据静态信息特征的统计量,因此上述特点保证本发明所述注入方法构造的虚假数据难以被传统的虚假数据检测策略识别。
[0085]
步骤1-2和1-3中所述的timegan小规模快速训练和深入模型训练,两者的差异在于生成器、判别器的学习率和训练中使用的迭代周期数。本发明所提出的小规模快速训练的学习率较高,迭代周期较短,训练速度较快,训练结果较为粗略;深入模型训练的学习率
较低,迭代周期较长,训练速度较慢,训练结果较为精细。
[0086]
表1为本发明所述注入方法与传统fdi方法预期效果对比表,效果指标包括虚假数据的数据真实性(对智能电网实际面临网络威胁的模拟程度)、静态信息特征隐蔽性、时序信息特征隐蔽性、躲避传统虚假数据检测策略成功率、躲避时序检测的成功率等,对比本发明所述注入方法与传统fdi方法的优劣势。从表1中可以看到,在保持传统fdi方法针对现有的虚假数据检测策略隐蔽性较强优势的同时,本发明所述注入方法在虚假数据时序信息特征隐蔽性、躲避时序检测的成功率等也具有较为明显优势。
[0087]
表1
[0088][0089]
如图6所示,使用gan模型和本发明使用timegan模型进行虚假数据注入的漏检率对比图,timegan模型学习了时序特征信息,使用其对智能电网进行虚假数据注入,造成的漏检率明显高于gan模型。
[0090]
从图7、图8可以看出,本发明所述注入方法能够以较高的成功率躲避时序检测。与传统主要针对智能电网静态信息特征的虚假数据注入方法相比,本发明所述注入方法主要针对智能电网负载数据的时序关系进行虚假数据构造,从而在智能电网可用性分析的时序检测中有较强的隐蔽性。
[0091]
本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1