一种区域表计断数据识别方法及装置与流程

文档序号:22428785发布日期:2020-10-02 10:06阅读:131来源:国知局
一种区域表计断数据识别方法及装置与流程

本发明涉及数据处理技术领域,尤其是涉及一种区域表计断数据识别方法及装置。



背景技术:

随着社会经济突飞猛进的发展势态,我国越来越重视各个领域中的节能减排工作。高能耗的生产型企业通过准确计算区域能效,并根据区域能效进行有效的节能降耗举措,有利于提高企业的发展质量和效益。而在采集表计读数的过程中,经常会出现由于采集器故障、停电导致的采集器和表计停止工作,没有数据采集上来表计出现断数据时会影响能耗计算的准确性,因此对表计断数据的识别显得尤为重要。

目前,现有的表计断数据识别方法依赖于人工检测,导致人工识别的工作量大,且无法及时准确识别表计断数据,造成表计断数据的识别效率不佳。



技术实现要素:

本发明提供一种区域表计断数据识别方法及装置,能够解决现有技术无法及时准确识别表计断数据,造成表计断数据识别效率不佳的技术问题,实现对表计断数据的识别。

本发明的第一实施例提供了一种区域表计断数据识别方法,包括:

获取目标区域所有表计的原始数据;

将每一所述表计的原始数据以小时为单位进行分组,得到若干个数据组;

计算每一所述数据组的表计能耗值,并根据所述表计能耗值得到表计能耗矩阵;

识别所述目标区域的所有表计在所述表计能耗矩阵中是否有对应的表计能耗值,若否,则所述表计出现断数据。

进一步地,所述获取目标区域所有表计的原始数据,具体包括:

通过物联网设备采集目标区域的所有表计的原始数据,将所述原始数据发送至数据仓库中进行存储。

进一步地,在将每一所述表计的原始数据以小时为单位进行分组,得到若干个数据组之后,还包括:

根据数据清洗方法对每一所述数据组进行数据清洗。

进一步地,计算每一所述数据组的表计能耗值,具体包括:

将每一所述数据组的结束值与开始值的差值作为所述数据组对应的表计在当前小时维度的能耗值;其中所述当前小时维度为所述数据组对应的小时维度。

进一步地,识别所述目标区域的所有表计在所述表计能耗矩阵中是否有对应的表计能耗值,若否,则所述表计出现断数据,具体包括:

识别所述目标区域的能耗计算公式出现的表计,将所述表计进行拆解得到所述目标区域的所有表计,若识别到所述表计在所述表计能耗矩阵中没有对应的表计能耗值,则所述表计出现断数据。

本发明的第二实施例提供了一种区域表计数断数据识别装置,包括获取模块、分组模块、计算模块和识别模块;

所述获取模块,用于获取目标区域所有表计的原始数据;

所述分组模块,用于将每一所述表计的原始数据以小时为单位进行分组,得到若干个数据组;

所述计算模块,用于计算每一所述数据组的表计能耗值,并根据所述表计能耗值得到表计能耗矩阵;

所述识别模块,用于识别所述目标区域的所有表计在所述表计能耗矩阵中是否有对应的表计能耗值,若否,则所述表计出现断数据。

进一步地,所述获取模块,包括用于:

通过物联网设备采集目标区域的所有表计的原始数据,将所述原始数据发送至数据仓库中进行存储。

进一步地,所述识别装置还包括数据清洗模块,所述数据清洗模块具体用于:根据数据清洗方法对每一所述数据组进行数据清洗。

进一步地,所述计算模块,包括用于:

将每一所述数据组的结束值与开始值的差值作为所述数据组对应的表计在当前小时维度的能耗值;其中所述当前小时维度为所述数据组对应的小时维度。

进一步地,所述识别模块,包括用于:

识别所述目标区域的能耗计算公式出现的表计,将所述表计进行拆解得到所述目标区域的所有表计,若识别到所述表计在所述表计能耗矩阵中没有对应的表计能耗值,则所述表计出现断数据。

本发明提供一种区域表计断数据识别方法及装置,通过获取目标区域所有表计的原始数据,并将每一表计的原始数据以小时为单位进行分组,得到若干个数据组,通过识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,以实现表计是否出现断数据,本发明实施例通过数据分析的方法识别表计断数据,能够有效减少表计断数据的识别工作量,且能够有效提高表计断数据识别的全面性和效率。

附图说明

图1是本发明实施例提供的区域表计断数据识别方法的流程示意图;

图2是本发明实施例提供的区域表计断数据识别装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。

在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。

请参阅图1,在本发明的第一实施例中,本发明实施例提供了如图1所示的一种区域表计断数据识别方法,包括:

s1、获取目标区域所有表计的原始数据;

在本发明实施例中,通过物联网设备分散获取目标区域所有表计的原始数据,并将采集到的原始数据存储在云端数据仓库中,以后续实现区域表计断数据的识别。

s2、将每一表计的原始数据以小时为单位进行分组,得到若干个数据组;

s3、计算每一数据组的表计能耗值,并根据表计能耗值得到表计能耗矩阵;

s4、识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,若否,则表计出现断数据。

本发明实施例获取目标区域所有表计的原始数据,并在接收到所有表计的原始数据后,将每一表计的原始数据以小时为单位进行分组,得到若干个数据组,通过识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,以实现表计是否出现断数据,通过数据分析的方法识别表计断数据,能够有效减少表计断数据的识别工作量,且能够有效提高表计断数据识别的全面性和效率。

作为本发明的一种具体实施方式,获取目标区域所有表计的原始数据,具体包括:

通过物联网设备采集目标区域的所有表计的原始数据,将原始数据发送至数据仓库中进行存储。

作为本发明的一种具体实施方式,在将每一表计的原始数据以小时为单位进行分组,得到若干个数据组之后,还包括:

根据数据清洗方法对每一数据组进行数据清洗。

在本发明实施例中,通过数据清洗方法对分组后的每一组数据组进行数据修正,能够有效避免数据由于存在电磁波的影响导致失真的情况,使得每一数据组中的能耗值更加可靠,有利于提高本实施例对区域表计数据识别的准确性。

作为可选地,本发明实施例中对每一数据组进行数据清洗,具体包括:

在一组数据组中,获取该组数据组的原始数据,并生成原始数据曲线,判断原始数据曲线中第n个原始数据点是否为拟合数据曲线的第n-1个拟合数据点的增量,且增量的值在第一预设阈值范围内;判断第n+1个原始数据点是否为第n个原始数据点的增量;其中,n为大于等于1的正整数;若是,则将第n个原始数据点进行描绘至拟合数据曲线,作为拟合数据曲线的第n个拟合数据点;若否,判断第n个原始数据点是否为原始数据曲线中的n-1个原始数据点的增量,且增量的值在第二预设阈值范围内;判断第n+1个原始数据点与第n个原始数据点相比是否为超过第三预设阈值的增量或减量;若是,则计算第n个数据点与第n-1个原始数据点的增量值,并将增量值与拟合数据曲线第n-1个拟合数据点的值进行累加,得到拟合数据曲线的第n个拟合数据点的值,并将第n个拟合数据点描绘至拟合数据曲线中;若否,将拟合数据曲线的第n-1个拟合数据点的值作为第n个拟合数据点的值,并将第n个拟合数据点描绘至拟合数据曲线中;根据所有拟合数据点得到完整的拟合数据曲线,根据完整的拟合数据曲线实现原始数据的清洗。

作为本发明的一种具体实施方式,计算每一数据组的表计能耗值,具体包括:

将每一数据组的结束值与开始值的差值作为数据组对应的表计在当前小时维度的能耗值;其中当前小时维度为数据组对应的小时维度。

作为可选地,在本发明实施例中,采用数据格式[区域id,表计id,采集时间,能耗值]来表示每一数据组的表计能耗值,如表计id为test1,采集时间为2020年4月20日,数据清洗后数据组的开始值为34000,结束值为35000,该数据组对应的表计能耗值为[test1,20200420,1000],其中,1000为结束值减去开始值得到的差值。将多个数据组对应的表计能耗值叠加在一起,得到区域表计能耗矩阵,表示格式为:[test1,20200420,1000],[test2,20200420,1100],[test3,20200420,1200],[test4,20200420,1300]。

作为本发明的一种具体实施方式,识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,若否,则表计出现断数据,具体包括:

识别目标区域的能耗计算公式出现的表计,将表计进行拆解得到目标区域的所有表计,若识别到表计在表计能耗矩阵中没有对应的表计能耗值,则表计出现断数据。

在本发明实施例中,通过将目标区域的能耗计算公式出现的表计进行拆解,得到准确得到目标区域的所有表计,有效地提高目标区域表计断数据识别的准确性。作为可选地,当目标区域test_eara的能耗计算公式是b1+b2+b3*(b4/(b4+b5)-b6+b7*b1时。获取能耗计算公式的b1、b2、b3、b4、b5、b6、b7七个表计,从而得到形成的表计数组是{[test_eara],[b1,b2,b3,b4,b5,b6,b7]}。

将表计数组出现的表计依次在表计能耗矩阵中进行查询,若识别到某一表计在表计能耗矩阵中没有对应的表计能耗值,则识别该表计出现断数据。

实施本发明实施例,具有以下有益效果:

本发明实施例获取目标区域所有表计的原始数据,并将每一表计的原始数据以小时为单位进行分组,得到若干个数据组,通过识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,以实现表计是否出现断数据,通过数据分析的方法识别表计断数据,能够有效减少表计断数据的识别工作量,且能够有效提高表计断数据识别的全面性,提高表计断数据识别的准确性。

进一步地,本发明实施例通过对目标区域能耗计算公式的表计进行识别以及拆解,能够准确获得属于目标区域的所有表计,有利于提高表计断数据识别的准确性。

请参阅图2,本发明第二实施例提供了一种区域表计数断数据识别装置,包括获取模块10、分组模块20、计算模块30和识别模块40;

获取模块10,用于获取目标区域所有表计的原始数据;

在本发明实施例中,通过物联网设备分散获取目标区域所有表计的原始数据,并将采集到的原始数据存储在云端数据仓库中,以后续实现区域表计断数据的识别。

分组模块20,用于将每一表计的原始数据以小时为单位进行分组,得到若干个数据组;

计算模块30,用于计算每一数据组的表计能耗值,并根据表计能耗值得到表计能耗矩阵;

识别模块40,用于识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,若否,则表计出现断数据。

本发明实施例获取目标区域所有表计的原始数据,并将每一表计的原始数据以小时为单位进行分组,得到若干个数据组,通过识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,以实现表计是否出现断数据,通过数据分析的方法识别表计断数据,能够有效减少表计断数据的识别工作量,且能够有效提高表计断数据识别的全面性,提高表计断数据识别的准确性。

作为本发明的一种具体实施方式,获取模块10,包括用于:

通过物联网设备采集目标区域的所有表计的原始数据,将原始数据发送至数据仓库中进行存储。

作为本发明的一种具体实施方式,还包括数据清洗模块,数据清洗模块具体用于:根据数据清洗方法对每一数据组进行数据清洗。

在本发明实施例中,通过数据清洗方法对分组后的每一组数据组进行数据修正,能够有效避免数据由于存在电磁波的影响导致失真的情况,使得每一数据组中的能耗值更加可靠,有利于提高本实施例对区域表计数据识别的准确性。

作为可选地,本发明实施例中对每一数据组进行数据清洗,具体包括:

在一组数据组中,获取该组数据组的原始数据,并生成原始数据曲线,判断原始数据曲线中第n个原始数据点是否为拟合数据曲线的第n-1个拟合数据点的增量,且增量的值在第一预设阈值范围内;判断第n+1个原始数据点是否为第n个原始数据点的增量;其中,n为大于等于1的正整数;若是,则将第n个原始数据点进行描绘至拟合数据曲线,作为拟合数据曲线的第n个拟合数据点;若否,判断第n个原始数据点是否为原始数据曲线中的n-1个原始数据点的增量,且增量的值在第二预设阈值范围内;判断第n+1个原始数据点与第n个原始数据点相比是否为超过第三预设阈值的增量或减量;若是,则计算第n个数据点与第n-1个原始数据点的增量值,并将增量值与拟合数据曲线第n-1个拟合数据点的值进行累加,得到拟合数据曲线的第n个拟合数据点的值,并将第n个拟合数据点描绘至拟合数据曲线中;若否,将拟合数据曲线的第n-1个拟合数据点的值作为第n个拟合数据点的值,并将第n个拟合数据点描绘至拟合数据曲线中;根据所有拟合数据点得到完整的拟合数据曲线,根据完整的拟合数据曲线实现原始数据的清洗。

作为本发明的一种具体实施方式,计算模块30,包括用于:

将每一数据组的结束值与开始值的差值作为数据组对应的表计在当前小时维度的能耗值;其中当前小时维度为数据组对应的小时维度。

作为可选地,在本发明实施例中,采用数据格式[区域id,表计id,采集时间,能耗值]来表示每一数据组的表计能耗值,如表计id为test1,采集时间为2020年4月20日,数据清洗后数据组的开始值为34000,结束值为35000,该数据组对应的表计能耗值为[test1,20200420,1000],其中,1000为结束值减去开始值得到的差值。将多个数据组对应的表计能耗值叠加在一起,得到区域表计能耗矩阵,表示格式为:[test1,20200420,1000],[test2,20200420,1100],[test3,20200420,1200],[test4,20200420,1300]。

作为本发明的一种具体实施方式,识别模块40,包括用于:

识别目标区域的能耗计算公式出现的表计,将表计进行拆解得到目标区域的所有表计,若识别到表计在表计能耗矩阵中没有对应的表计能耗值,则表计出现断数据。

在本发明实施例中,通过将目标区域的能耗计算公式出现的表计进行拆解,得到准确得到目标区域的所有表计,有效地提高目标区域表计断数据识别的准确性。作为可选地,当目标区域test_eara的能耗计算公式是b1+b2+b3*(b4/(b4+b5)-b6+b7*b1时。获取能耗计算公式的b1、b2、b3、b4、b5、b6、b7七个表计,从而得到形成的表计数组是{[test_eara],[b1,b2,b3,b4,b5,b6,b7]}。

将表计数组出现的表计依次在表计能耗矩阵中进行查询,若识别到某一表计在表计能耗矩阵中没有对应的表计能耗值,则识别该表计出现断数据。

实施本发明实施例,具有以下有益效果:

本发明实施例获取目标区域所有表计的原始数据,并将每一表计的原始数据以小时为单位进行分组,得到若干个数据组,通过识别目标区域的所有表计在表计能耗矩阵中是否有对应的表计能耗值,以实现表计是否出现断数据,通过数据分析的方法识别表计断数据,能够有效减少表计断数据的识别工作量,且能够有效提高表计断数据识别的全面性,提高表计断数据识别的准确性。

进一步地,本发明实施例通过对目标区域能耗计算公式的表计进行识别以及拆解,能够准确获得属于目标区域的所有表计,有利于提高表计断数据识别的准确性。

以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1