1.本发明涉及信号处理技术领域,具体涉及一种基于编辑距离的电力一二次设备融合处理方法、系统、设备及存储介质。
背景技术:2.目前,电力二次设备作为构建各类电力自动化系统的基础,其应用和地位越来越重要。由于电力一次设备与电力二次设备是一对多关系,即一套电力一次设备有着多套电力二次设备,同时各区域电网采用不同厂家、不同类型的电力二次设备,各种电力二次设备产生的调控信号格式和命名方式种类繁多且数量巨大,因此,电气设备运行监控信号数据具有海量化、多样化、复杂化的特点。这给各类以信号为基础的电力系统应用和信息系统集成造成很大困难,包括电网状态估计、情景决策和仿真培训等实际需求。
3.其中,直接用于生产和使用电能、比控制回路(二次设备)电压高的电气设备称为电力一次设备,主要包括发电机、电动机、变压器、断路器、隔离开关、自动开关、接触器、刀开关、母线、输电线路、电力电缆、电抗器等。对电力一次设备进行监视、测量、控制、调节与辅助的具有行为能力的机械部件及其附属装置称为电力二次设备,主要包括继电保护和自动装置、rtu(远程测控终端)等远端测量监视装置和直流电源设备等。
4.当电网发生故障之后,保护设备会迅速启动,并将调控信号传输至调度台。调度员通过对调控信号的观察,判断故障性质。现阶段模拟仿真系统中,当故障发生之后,报出的信号往往是仿真系统内置的调控信号,与现场信号差异极大,无法真实还原故障情景。
5.现有技术:对现有的作为模型的电网调度系统中的所有设备、故障、监控信号进行数据化处理,形成与故障和监控信号本身一一对应的故障数据单元和监控信号数据单元。再对故障数据单元、监控数据单元进行统计、整理、分类,分别形成故障数据、资源库和未标签化监控信号数据资源。对故障数据单元到监控信号数据单元初步的对应关系进行甄选和校对,对于模糊匹配中存在实际的故障与监控信号对应关系不一致的情况,进行人工干预和修正,使所有的故障数据单元到监控信号数据单元的对应关系均符合实际情况,每个监控信号数据单元中的触发标签中记载了根据监控信号数据单元所对应的故障数据单元中的设备信息、故障信息、故障内容信息,打上触发标签的每个监控信号数据单元形成标签化监控信号数据资源库,将上述标签化监控信号数据资源库加载到电力调度仿真培训系统的计算机程序中,完成建模。
6.现有技术中通过对全网模型处理,形成了故障和监控信号的一一对应关系,在故障数据单元和监控信号数据单元的匹配中,采用了模糊匹配加人工干预的方式。随着云平台的建设,云中心负责全网模型数据汇集处理,该方法在处理大量数据的时候会遇到瓶颈,每个地区对于同一套监控信号命名都不一样,会极大增加人工干预工作量。同时对于相同故障,该现有技术未考虑到多级电网内故障与监控信号是一对多的关系。
技术实现要素:7.本发明针对数据清洗和多级电网汇集的监控信号,提出一种电力一二次设备融合处理方法、系统、设备及存储介质,考虑一二次设备融合中一次设备与二次设备的多对应关系,解决了监控信号匹配过程中准确率低、人工干预过多的问题,同时还解决了大量监控信号下一二次设备融合困难的问题。
8.为达到上述目的,本发明采用如下技术方案:电力一二次设备融合处理方法,所述方法包括:对获取的电力二次设备监控信号进行规范预处理;对规范预处理后的电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果,所述分词结果包括分词信号及继电保护信号;根据所述分词信号获取电力一次设备和电力二次设备的对应关系;根据所述词频,利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值;将编辑距离值最小时的继电保护信号与标准保护信号匹配,并依据所述电力一次设备和电力二次设备的对应关系,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系。
9.进一步地,所述的对获取的电力二次设备监控信号进行规范预处理,包括:将电力二次设备监控信号中不规则的相别命名统一为规则相别命名;将电力二次设备监控信号中不规则的保护区间命名统一为规则的保护区间命名;将电力二次设备监控信号中不规则的线别命名统一为规则线别命名;将电力二次设备监控信号中不规则的保护时限命名统一为规则的保护时限命名;将电力二次设备监控信号中不规则的保护套数命名统一为规则的保护套数命名。
10.进一步地,所述对规范预处理后的电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果,具体为:通过电力领域专用分词词典对电力二次设备监控信号进行分词,统计各词出现的词频以及每一条电力二次设备监控信号的分词结果。
11.进一步地,所述的根据分词信号获取电力一次设备和电力二次设备的对应关系,具体为:从分词信号中提取电力一次设备名称、电力二次设备名称和电力二次设备的套数,依据电力一次设备名称、电力二次设备名称和电力二次设备的套数获得电力一次设备和电力二次设备的对应关系。
12.进一步地,所述的利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值的公式如下所示:其中,n表示继电保护信号的字符串长度,m表示标准保护信号的字符串长度,ed
[i,j]表示继电保护信号中第i个字符和标准保护信号中第j个字符之间的编辑距离值,i表示继电保护信号字符串中的第i个位置,j表示标准保护信号字符串的第j个位置,f
i
表示第i个字符的词频,,k表示修正系数,修正系数的值小于0。
[0013]
电力一二次设备融合处理系统,包括:规范预处理模块、分词及词频统计模块、对应关系获取模块、编辑距离计算模块以及匹配模块;其中:规范预处理模块:用于对获取的电力二次设备监控信号进行规范预处理;分词及词频统计模块:用于对规范预处理后的电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果,所述分词结果包括分词信号及继电保护信号;对应关系获取模块:用于根据所述分词信号获取电力一次设备和电力二次设备的对应关系;编辑距离计算模块:用于根据所述词频,利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值;匹配模块:用于将编辑距离值最小时的继电保护信号与标准保护信号匹配,并依据所述电力一次设备和电力二次设备的对应关系,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系,用于进行电力一次设备和电力二次设备融合处理。
[0014]
进一步地,所述规范预处理模块包括相处理模块、段处理模块、线处理模块、时限处理模块以及套处理模块,其中:相处理模块:用于将电力二次设备监控信号中不规则的相别命名统一为规则相别命名;段处理模块:用于将电力二次设备监控信号中不规则的保护区间命名统一为规则的保护区间命名;线处理模块:用于将电力二次设备监控信号中不规则的线别命名统一为规则线别命名;时限处理模块:用于将电力二次设备监控信号中不规则的保护时限命名统一为规则的保护时限命名;套处理模块:用于将电力二次设备监控信号中不规则的保护套数命名统一为规则的保护套数命名。
[0015]
进一步地,所述编辑距离计算模块中利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值的公式如下所示:
其中,n表示继电保护信号的字符串长度,m表示标准保护信号的字符串长度,ed[i,j]表示继电保护信号中第i个字符和标准保护信号中第j个字符之间的编辑距离值,i表示继电保护信号字符串中的第i个位置,j表示标准保护信号字符串的第j个位置,f
i
表示第i个字符的词频,,k表示修正系数,修正系数的值小于0。
[0016]
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述电力一二次设备融合处理方法的步骤。
[0017]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述电力一二次设备融合处理方法的步骤。
[0018]
与现有技术相比,本发明具有以下有益的技术效果:本发明通过对海量的电力二次设备监控信号进行规范化预处理,然后进行分词和词频统计,进而获得每一条电力二次设备监控信号的分词信号及继电保护信号,依据分词信号获取电力一次设备和电力二次设备的对应关系;利用基于词频的编辑距离算法计算电力二次设备监控信号对应的继电保护信号与标准保护信号之间编辑距离值,根据编辑距离值越小,相似度越高的原则,将编辑距离值最小时的继电保护信号与标准保护信号匹配,依据电力一次设备和电力二次设备的对应关系,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系,用于电力一次设备和电力二次设备融合处理,有效解决了在实际应用中电力一次设备和电力二次设备需要通过人工配置导致效率低下、匹配率不高的问题,同时满足了电网调控人员对监控信号逼真性的需求。
[0019]
本发明提出使用电力领域专用分词词典处理监控信号的方法,解决了普通分词软件分词错误率高的问题;本发明提出的利用词频的编辑距离算法,提高了继电保护信号与标准保护信号的匹配精度。
[0020]
本发明的推广能够有效解决由于各区域电网采用不同厂家、不同类型的电力二次设备,各种电力二次设备产生的监控信号格式和命名方式种类繁多且数量巨大,导致的各类以监控信号为基础的电力系统应用和信息系统集成的困难,为实现多级电网信息融合和开展跨区域应用的开发提供技术支持,为保障电网安全稳定运行和发展共享经济、数字经
济奠定了重要基础,具有显著的经济和社会效益。
附图说明
[0021]
说明书附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
[0022]
图1为本发明电力一二次设备融合处理方法流程图。
[0023]
图2为本发明电力一二次设备融合处理系统结构图。
具体实施方式
[0024]
以下结合附图及具体实施例对本发明进行进一步详细说明。
[0025]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0026]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0027]
本发明提供基于编辑距离的一二次设备融合处理方法,首先对获取的所有电力二次设备监控信号进行规范预处理;然后对规范预处理后的所有电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果,所述分词结果包括分词信号及继电保护信号;依据分词信号获取电力一次设备和电力二次设备的对应关系;根据词频,利用编辑距离算法计算电力二次设备监控信号对应的继电保护信号与标准保护信号之间编辑距离值;将编辑距离值最小时的继电保护信号与标准保护信号匹配,依据电力一次设备和相应套数的电力二次设备的对应关系,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系,用于进行电力一次设备和电力二次设备融合处理。
[0028]
其中,编辑距离是对两个字符串之间进行转换所需要的最小的代价,即至少需要多少次的处理才能将一个字符串变成另一个字符串。对于转换可能的操作有插入、删除、替换。两个字符串的编辑距离越大,表示其差异越大,即越不相似,两个字符串的编辑距离越小,表示其差异越小,即越相似。
[0029]
参见图1,本发明方法具体包括以下步骤:(1)获取的所有电力二次设备监控信号,并对所有电力二次设备监控信号进行规范预处理;具体地,以省级调控中心为例,电力二次设备监控信号量巨大,达到百万级别,通过消息总线汇集于关系数据库,使用时,从关系数据库中获取所有电力二次设备监控信号。
[0030]
由于各区域在运维监控信号过程中的表述方法不同,会出现编码、命名不规范问题,需要对这类影响后续步骤计算值的数据进行规范预处理,规范预处理包括以下步骤:1)相处理,包括abc三相等,比如:将“a相”、“1相”、“α相”统一处理为“a相”;2)段处理,包括i段、ii段、iii段、iv段、v段等,比如:将“iii段”、“三段”、“3段”、“叁段”、“iⅱ段”、
“ⅱ
i段”、“保护ⅲ段”统一处理为
“ⅲ
段”;3)线处理,包括i路、ii路、iii路、iv路、v路等,比如:“iv线”、“4线”、“四线”、“肆线”统一处理为
“ⅳ
线”;4)时限处理,包括1时限、2时限、3时限等,比如:将
“ⅱ
_2出口”、
“ⅱ
_2动作”、
“ⅱ
2出口”统一处理为
“ⅱ
段2时限”;5)套处理,包括第1套、第2套、第3套等,比如:将“a套”、“第一套”、“第壹套”统一处理为“第1套”。
[0031]
其中,相处理、段处理、线处理、时限处理以及套处理可以同时进行,也可以先后进行,且先后顺序不限。
[0032]
(2)使用电力领域专用分词词典分词,对规范预处理后的所有电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果;具体地,通过导入电力领域专用分词词典,将规范预处理后的所有电力二次设备监控信号进行分词,统计各词出现的词频,形成词与词频对应关系。
[0033]
其中w1、w2…
w
n
表示分词得到的分词结果,n1、n2…
n
n
表示分词结果出现的次数,f1、f2…
f
n
表示分词结果出现的词频,且。
[0034]
(3)每一条电力二次设备监控信号的分词结果包括分词信号及继电保护信号,从分词信号中提取电力一次设备名称、电力二次设备名称和电力二次设备的套数,依据电力一次设备名称、电力二次设备名称和电力二次设备的套数获得电力一次设备和电力二次设备的对应关系;具体地,每一条电力二次设备监控信号的分词结果包括分词信号和继电保护信号,分词信号包括地区名称、运维区域名称、变电站名称、电压等级、电力一次设备名称、电力二次设备名称以及电力二次设备套数,再根据各个地区的电力一次设备、电力二次设备命名规则,从分词信号中提取电力一次设备名称、电力二次设备名称和电力二次设备的套数,进而得到电力一次设备和相应套数的电力二次设备的对应关系。由于已从监控信号中获得电力一次设备和相应套数的电力二次设备的对应关系,在进行下一步匹配的时候,将已属于冗余信息、会减慢清洗速度、增加错误匹配率的信息剔除,只保留继电保护信号。
[0035]
(4)根据词频,利用编辑距离算法计算电力二次设备监控信号对应的继电保护信号与标准保护信号之间编辑距离值。
[0036]
上述步骤(3)和步骤(4)可以同时进行,也可以先后进行,且先后顺序不限。
[0037]
(5)将编辑距离值最小时的继电保护信号与标准保护信号匹配,进而得到与标准保护信号关系最近的继电保护信号,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系,根据电力一次设备、电力二次设备以及监控信号之间的匹配关系获得电力一次设备和电力二次设备融合处理结果。
[0038]
具体地,从步骤(3)所获取的继电保护信号与标准保护信号之间的相似度,是决定电力一次设备和电力二次设备融合准确率的关键因素。字符串之间的编辑距离能用于度量以字符串形式表示的对象之间的相似度,字符串编辑距离是建立在一系列编辑操作的基础之上的,包括插入、删除和替换,字符串之间的编辑距离可以通过动态规划的方法来计算,对于两个字符串x和y,其中x=x1……
x
n
;y= x1……
x
m
;其编辑距离ed(x,y)利用下面的递归公式,通过计算一个有[(n+1)*(m+1)]个元素的二维编辑矩阵d(i,j)得到。
[0039]
其中c(s)表示执行操作s的代价,ε表示空字符,x
→
y表示替换操作,x
→
ε表示删除操作,ε
→
y表示插入操作,如果ed(x,y)小于等于预先定义的误差水平k,则表明两个字符串x和y是匹配的。
[0040]
尽管编辑操作的代价是[0,1]之间的非负实数,但一般情况下,会将操作代价c(s)仅取0和1两个值。在电力一次设备和电力二次设备融合中,由于继电保护信息中的字符具有其一定特性,即出现次数越多的字符,表示其在这次监控信号中是名词或者是名词的缩写,要将其距离减小,不能用1来代替,因此可将编辑距离算法修正成如下公式:其中,n表示继电保护信号的字符串长度,m表示标准保护信号的字符串长度,ed[i,j]表示继电保护信号中第i个字符和标准保护信号中第j个字符之间的编辑距离值,i表示继电保护信号字符串中的第i个位置,j表示标准保护信号字符串的第j个位置,f
i
表示第
i个字符的词频,,k表示修正系数,修正系数的值小于0。
[0041]
通过对编辑距离的计算,可得到与标准保护信号最接近的继电保护信号。在对多地区监控信号清洗过程中,可根据(3)形成的电力一次设备和相应套数的电力二次设备的对应关系,形成电力一次设备、电力二次设备以及监控信号之间的匹配关系,根据电力一次设备、电力二次设备以及监控信号之间的匹配关系即可获得电力一次设备和电力二次设备融合处理结果。
[0042]
本发明中所述的清洗指的是发现并纠正数据中可识别的错误,同时获取数据中有用信息。
[0043]
本发明还提供一种电力一二次设备融合处理系统,如图2所示,包括规范预处理模块:用于对获取的所有电力二次设备监控信号进行规范预处理;分词及词频统计模块:用于对规范预处理后的所有电力二次设备监控信号进行分词,得到词频和每一条电力二次设备监控信号的分词结果,所述分词结果包括分词信号及继电保护信号;对应关系获取模块:用于根据所述分词信号获取电力一次设备和电力二次设备的对应关系;编辑距离计算模块:用于根据所述词频,利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值;匹配模块:用于将编辑距离值最小时的继电保护信号与标准保护信号匹配,并依据所述电力一次设备和电力二次设备的对应关系,得到电力一次设备、电力二次设备以及监控信号之间的匹配关系,用于进行电力一次设备和电力二次设备融合处理。
[0044]
所述规范预处理模块包括相处理模块、段处理模块、线处理模块、时限处理模块以及套处理模块,其中:相处理模块:用于将所有电力二次设备监控信号中不规则的相别命名统一为规则相别命名;段处理模块:用于将所有电力二次设备监控信号中不规则的保护区间命名统一为规则的保护区间命名;线处理模块:用于将所有电力二次设备监控信号中不规则的线别命名统一为规则线别命名;时限处理模块:用于将所有电力二次设备监控信号中不规则的保护时限命名统一为规则的保护时限命名;套处理模块:用于将所有电力二次设备监控信号中不规则的保护套数命名统一为规则的保护套数命名。
[0045]
所述编辑距离计算模块中利用编辑距离算法计算所述继电保护信号与标准保护信号之间编辑距离值的公式如下所示:
其中,n表示继电保护信号的字符串长度,m表示标准保护信号的字符串长度,ed[i,j]表示继电保护信号中第i个字符和标准保护信号中第j个字符之间的编辑距离值,i表示继电保护信号字符串中的第i个位置,j表示标准保护信号字符串的第j个位置,f
i
表示第i个字符的词频,,k表示修正系数,修正系数的值小于0。
[0046]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd
‑
rom、光学存储器等)上实施的计算机程序产品的形式。
[0047]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0048]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0049]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0050]
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本发明后依然可对发明的具体实施方式进行种种变更、修改或
者等同替换,但这些变更、修改或者等同替换,均在发明待批的权利要求保护范围之内。