一种电能质量数据中心构建方法及其系统与流程

文档序号:25051004发布日期:2021-05-14 13:12阅读:92来源:国知局
一种电能质量数据中心构建方法及其系统与流程

1.本发明涉及电力系统技术领域,尤其涉及一种电能质量数据中心构建方法及其系统、计算机终端设备以及可读存储介质。


背景技术:

2.近年来,随着高压直流输电技术、分布式微网等技术快速发展使得电网形态发生巨大改变,这些新技术所引发的电网电能质量机理越发复杂,且向超高压和配网延伸,因此可以认为现代电力系统各个环节都存在电能质量问题。
3.相比之下,电网公司已安装的电能质量监测装置非常、非常少,且主要覆盖10kv及以上母线。随着电网的发展,以含有电能质量数据的同步相量测量单元等装置构建的电网生产系统,使得获取覆盖全网的电能质量数据成为可能。
4.鉴于电能质量数据的复杂性和海量性,如何合理的设计和建立电能质量数据中心,对整个监测系统来说至关重要。由于电能质量业界一直以来缺乏统一的数据格式和规范,而很多电力公司和企业都能生产监测设备,各个生产厂家生产的监测设备和分析工具各具特色,监测数据侧重点也不尽相同,数据格式更是千差万别、互不兼容。这非常不利于电力公司内部各应用程序之间以及各电力公司之间的信息共享和应用集成。


技术实现要素:

5.本发明目的在于,提供一种电能质量数据中心构建方法,根据电网共性提出符合行业的融合框架和台账数据特性设计的融合算法不仅提高了单字的匹配正确性,同时可解决不等长的台账融合实现,提高了台账数据的融合效率。
6.为实现上述目的,本发明实施例提供一种电能质量数据中心的构建方法,包括:
7.根据属性特征将系统的数据拆分为台账数据和生产数据;
8.根据bhattacharyya距离和dtw算法判断各系统中所述台账数据是否相同,以进行所述台账数据的整合;
9.将所述生产数据挂载于整合后的所述台账数据中。
10.在某一个实施例中,所述系统包括生产管理系统、调度自动化系统、配网自动化系统、计量自动化系统、营销系统、gis系统、电压系统和电能质量系统。
11.在某一个实施例中,所述根据bhattacharyya距离和dtw算法判断各系统所述台账数据是否相同之前,还包括,将所述台账数据按照管理单位进行子集划分。
12.在某一个实施例中,所述根据bhattacharyya距离和dtw算法判断各系统所述台账数据是否相同,包括:
13.根据bhattacharyya距离求取所述台账数据中单字bhattacharyya系数;
14.根据dtw算法,依次累加所经过所有点bhattacharyya系数,遍历所述台账数据中台账数据q
a
和台账数据c
g
中汉字,即可得到累积距离γ(a,g),a表示台账q
a
中台账名称的字数,g表示台账q
g
中台账名称的字数;计算公式如下:
15.γ(a,g)=b(q
a
,c
g
)+max{γ(a

1,g

1),γ(a

1,g),γ(a,g

1)}
16.其中,b(q
a
,c
g
)表示所述台账数据q
a
中汉字q
a
和所述台账数据c
g
中汉字c
g
的bhattacharyya系数;
17.判断两个台账数据是否相同,判断公式如下:
[0018][0019]
其中r为γ(a,g)的有效匹配次数,τ为预设阈值。
[0020]
本发明实施例提供还提供一种一种电能质量数据中心的构建系统,应用于上述任一实施例中的一种电能质量数据中心的构建方法。包括:
[0021]
系统数据拆分模块,用于根据属性特征将系统数据拆分为台账数据和生产数据;
[0022]
台账数据整合模块,用于根据bhattacharyya距离和dtw算法判断各系统所述台账数据的是否相同,以进行所述台账数据的整合;
[0023]
生产数据挂载模块,用于将所述生产数据挂载于整合后的所述台账数据中。
[0024]
在某一个实施例中,还包括台账数据子集划分模块,所述台账数据子集划分模块用于将所述台账数据按照管理单位进行子集划分。
[0025]
在某一个实施例中,所述台账数据整合模块包括:
[0026]
台账数据单字相似性计算单元,用于根据bhattacharyya距离求取所述台账数据中单字bhattacharyya系数;
[0027]
台账数据累积距离计算单元,用于根据dtw算法,依次累加所经过所有点bhattacharyya系数,遍历所述台账数据中台账数据q
a
和台账数据c
g
中汉字,即可得到累积距离γ(a,g),a表示台账q
a
中台账名称的字数,g表示台账q
g
中台账名称的字数;计算公式如下:
[0028]
γ(a,g)=b(q
a
,c
g
)+max{γ(a

1,g

1),γ(a

1,g),γ(a,g

1)}
[0029]
其中,b(q
a
,c
g
)表示所述台账数据q
a
中汉字q
a
和所述台账数据c
g
中汉字c
g
的bhattacharyya系数;
[0030]
台账数据相同性判断单元,用于判断两个台账数据是否相同,判断公式如下:
[0031][0032]
其中r为γ(a,g)的有效匹配次数,τ为预设阈值。
[0033]
本发明实施例还提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的电能质量数据中心构建方法。
[0034]
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一实施例所述的电能质量数据中心构建方法。
[0035]
本发明实施例的电能质量数据中心构建方法及其系统,从电网系统特点出发,根据电网共性提出符合行业的融合框架和台账数据特性设计的融合算法不仅提高了单字的匹配正确性,同时可解决不等长的台账融合实现,提高了台账数据的融合效率。
附图说明
[0036]
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]
图1是本发明某一实施例提供的电能质量数据中心构建方法的流程示意图;
[0038]
图2是本发明某一实施例提供的电能质量数据中心构建方法的框架图;
[0039]
图3是本发明某一实施例提供的电能质量数据中心构建方法中子集划分的流程示意图;
[0040]
图4是本发明某一实施例提供的电能质量数据中心构建方法中全拼概率计算的结果示意图;
[0041]
图5是本发明某一实施例提供的计算机终端设备的结构示意图。
具体实施方式
[0042]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0043]
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
[0044]
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0045]
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0046]
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0047]
请参阅图1,本发明实施例提供一种电能质量数据中心的构建方法,包括:
[0048]
s10、根据属性特征将系统的数据拆分为台账数据和生产数据;
[0049]
s20、根据bhattacharyya距离和dtw算法判断各系统中所述台账数据是否相同,以进行所述台账数据的整合;
[0050]
s30、将所述生产数据挂载于整合后的所述台账数据中。
[0051]
请参阅图2,在本实施例中,将系统数据(生产管理系统、调度自动化系统、配网自动化系统、计量自动化系统、营销系统、gis系统、电压系统及电能质量系统)拆分为台账数据和生产数据,其中所述台账数据是表征电力对象的档案信息,由多个子属性组成,通常各属性值固定不变,例如,变压器的台账数据通常包括变压器名称、型号、容量、所在系统分配的id等,而生产数据是可变的,所述生产数据表征电力对象动态运行数据,通常与时间相关,例如:变压器运行数据包含各时序的电压、电流、用功、无功等,因而生产数据依赖台账数据存储。
[0052]
找出各系统所述台账数据的共性是实现数据整合的关键。将所述台账数据利用
bhattacharyya距离求取汉字全拼的相似度,再利用改进的dtw(dynamic time warping)动态时间归整求取台账相似性,然后进行相同性判断。最后再将生产数据挂载于整合后的台账数据中,完成整个电能质量数据中心的构建。根据电网共性提出符合行业的融合框架,根据台账数据特性设计的融合算法不仅提高了单字的匹配正确性。
[0053]
在某一个实施例中,所述系统包括生产管理系统、调度自动化系统、配网自动化系统、计量自动化系统、营销系统、gis系统、电压系统和电能质量系统。
[0054]
在某一个实施例中,所述根据bhattacharyya距离和dtw算法判断各系统所述台账数据是否相同之前,还包括,将所述台账数据按照管理单位进行子集划分。
[0055]
请参阅图3,在本实施例中,台账整合实现模块中,首先按照管理单位进行字集划分,从而减少台账重复并提高融合效率。台账名称是电力系统对象的命名,但各系统间或同一系统中可能重复,例如:电压监测系统的中山供电局和珠海供电局均发现台账名称为市公安局专变的配变名称。为此,借用电网公司管理关系,将台账名称所属的管理单位自上而下进行判断,直至找到直接负责该台账的单位。以整合省级系统为例,其下一级是供电局,供电局的下级为分县局,分县局下级为供电所或变电站,依次向下查找。该处理是一个分类过程,可提高多系统台账整合效率。
[0056]
在某一个实施例中,所述根据bhattacharyya距离和dtw算法判断各系统所述台账数据是否相同,包括:
[0057]
根据bhattacharyya距离求取所述台账数据中单字bhattacharyya系数;
[0058]
根据dtw算法,依次累加所经过所有点bhattacharyya系数,遍历所述台账数据中台账数据q
a
和台账数据c
g
中汉字,即可得到累积距离γ(a,g),a表示台账q
a
中台账名称的字数,g表示台账q
g
中台账名称的字数;计算公式如下:
[0059]
γ(a,g)=b(q
a
,c
g
)+max{γ(a

1,g

1),γ(a

1,g),γ(a,g

1)}
[0060]
其中,b(q
a
,c
g
)表示所述台账数据q
a
中汉字q
a
和所述台账数据c
g
中汉字c
g
的bhattacharyya系数;
[0061]
判断两个台账数据是否相同,判断公式如下:
[0062][0063]
其中r为γ(a,g)的有效匹配次数,τ为预设阈值。
[0064]
在本实施例中,根据bhattacharyya距离求取汉字全拼相似度。bhattacharyya距离用于测量两个离散或连续概率的相似性,其定义为:在同一个定义域x中,两个离散概率分布p和q的巴氏距离定义如下:
[0065]
d
b
(p,q)=

ln(b
c
(p,q))
ꢀꢀ
(1)
[0066][0067]
将汉字全拼转换为概率直方图,利用式(1)和式(2)求取任意两个汉字相似度,相似度越高则bc越接近1,反之bc越接近0。
[0068]
先将汉字进行概率转换,其过程为:对任意汉字y,其全拼为序列h,h=[h1,h2..h
r
.,h
t
],h
r
为y全拼的第r个字母,t表示全拼长度。按字母表依次编号,将编号作为直方图横坐标;统计汉字y的拼音字母总数a及各字母的数量n
r
,按式(3)计算每个字母的占比p
(h
i
)并作为直方图的值。
[0069][0070]
然后dtw(dynamic time warping)动态时间归整求取台账相似性。各系统中相同对象名称长度大多不等,另一方面电力系统台账名称根据供电关系命名,可以认为具有时序性,因此dtw适合于求取台账名称相似性。
[0071]
请参阅图4,对于任意两个台账名称q
a
和c
g
,下标表示汉字数量,a和g可以不等。通过求取累加距离γ:从(0,0)开始搜索,使用bhattacharyya距离求取q
a
和c
g
的两个汉字相似度,例如q
a
包含汉字“唐”,而cg中包含汉字“框”,利用公式(3)分别求得全拼概率。通过式(2)算得“唐”和“框”的bhattacharyya系数为0.67,依次累加所经过所有点bhattacharyya系数,到达终点(a,g)后,即可得累积距离γ,求解公式为式(4),
[0072]
公式(4)是现有dtw一个变体,其改动在于:使用bhattacharyya系数b()替代常见的欧式距离,搜索过程求取的最大值,而非传统的求解最小值,这是bhattacharyya系数特性决定的,计算公式如下:
[0073]
γ(i,j)=b(q
i
,c
j
)+max{γ(i

1,j

1),γ(i

1,j),γ(i,j

1)}
ꢀꢀ
(4)
[0074]
q
i
表示q
a
的第i个汉字,c
j
表示c
g
的第j个汉字,而b(q
i
,c
j
)则表示计算汉字q
i
和c
j
的bhattacharyya系数,
[0075]
最后到达重终点(a,g)后,求得累积距离γ(a,g),公式如下:
[0076]
γ(a,g)=b(q
a
,c
g
)+max{γ(a

1,g

1),γ(a

1,g),γ(a,g

1)}
[0077]
其中,b(q
a
,c
g
)表示所述台账数据q
a
中汉字q
a
和所述台账数据c
g
中汉字c
g
的bhattacharyya系数;
[0078]
最后通过公式(5)判断两个台账数据是否相同,公式如下
[0079][0080]
r为γ(i,j)的有效匹配次数,τ为预设阈值,当公式(5)成立时,则判断两个台账数据相同,若公式(5)不成立时,则判断两个台账数据不相同。
[0081]
本发明实施例提供还提供一种电能质量数据中心的构建系统,应用于上述任一实施例中的电能质量数据中心的构建方法。包括:
[0082]
系统数据拆分模块,用于根据属性特征将系统数据拆分为台账数据和生产数据;
[0083]
台账数据整合模块,用于根据bhattacharyya距离和dtw算法判断各系统所述台账数据的是否相同,以进行所述台账数据的整合;
[0084]
生产数据挂载模块,用于将所述生产数据挂载于整合后的所述台账数据中。
[0085]
在某一个实施例中,还包括台账数据子集划分模块,所述台账数据子集划分模块用于将所述台账数据按照管理单位进行子集划分。
[0086]
在某一个实施例中,所述台账数据整合模块包括:
[0087]
台账数据单字相似性计算单元,用于根据bhattacharyya距离求取所述台账数据中单字bhattacharyya系数;
[0088]
台账数据累积距离计算单元,用于根据dtw算法,依次累加所经过所有点bhattacharyya系数,遍历所述台账数据中台账数据q
a
和台账数据c
g
中汉字,即可得到累积
距离γ(a,g),a表示台账q
a
中台账名称的字数,g表示台账q
g
中台账名称的字数;计算公式如下:
[0089]
γ(a,g)=b(q
a
,c
g
)+max{γ(a

1,g

1),γ(a

1,g),γ(a,g

1)}
[0090]
其中,b(q
a
,c
g
)表示所述台账数据q
a
中汉字q
a
和所述台账数据c
g
中汉字c
g
的bhattacharyya系数;
[0091]
台账数据相同性判断单元,用于判断两个台账数据是否相同,判断公式如下:
[0092][0093]
其中r为γ(a,g)的有效匹配次数,τ为预设阈值。
[0094]
关于电能质量数据中心的构建系统的具体限定可以参见上文中对于电能质量数据中心的构建方法的限定,在此不再赘述。上述电能质量数据中心的构建系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0095]
请参阅图5,本发明实施例提供一种计算机终端设备,包括一个或多个处理器和存储器。存储器与所述处理器耦接,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施例中的电能质量数据中心的构建方法。
[0096]
处理器用于控制该计算机终端设备的整体操作,以完成上述的电能质量数据中心的构建方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(static random access memory,简称sram),电可擦除可编程只读存储器(electrically erasable programmable read

only memory,简称eeprom),可擦除可编程只读存储器(erasable programmable read

only memory,简称eprom),可编程只读存储器(programmable read

only memory,简称prom),只读存储器(read

only memory,简称rom),磁存储器,快闪存储器,磁盘或光盘。
[0097]
在一示例性实施例中,计算机终端设备可以被一个或多个应用专用集成电路(application specific 1ntegrated circuit,简称as1c)、数字信号处理器(digital signal processor,简称dsp)、数字信号处理设备(digital signal processing device,简称dspd)、可编程逻辑器件(programmable logic device,简称pld)、现场可编程门阵列(field programmable gate array,简称fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的电能质量数据中心的构建方法,并达到如上述方法一致的技术效果。
[0098]
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述任意一个实施例中的电能质量数据中心的构建方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的电能质量数据中心的构建方法,并达到如上述方法一致的技术效果。
[0099]
本发明的电能质量数据中心构建方法及其系统,从电网系统特点出发,根据电网共性提出符合行业的融合框架和台账数据特性设计的融合算法不仅提高了单字的匹配正确性,同时可解决不等长的台账融合实现,提高了台账数据的融合效率。
[0100]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1