本申请涉及大数据,特别是涉及一种数据修复方法、装置、设备及介质。
背景技术:
1、在工业互联网应用场景中执行设备数据采集时,会存在因网络异常、设备参数异常、设备故障等原因导致采集测点异常,进而使得通过采集测点获取的采集数据也同样异常的状况。例如,光伏场景中的发电站测点异常时,通过发电站采集到的累计发电量数据也同样为异常数据。进一步的,由累计发电量计算得到的每日发电量、发电收益等数据也会计算出异常值。
2、相关技术中,针对上述异常数据进行数据修复的方法是,若异常数据为正常数据异常减小后的数据,则直接丢弃该异常数据,若异常数据为正常数据异常增大后的数据,则继续沿用该异常数据。
3、然而,直接丢弃异常数据会造成采集数据的样本量不足,可能会改变采集数据的原有分布,进而,基于采集数据进行后续分析时,也会造成分析结果的不准确;并且,若继续沿用异常数据,同样也会造成分析结果的不准确。
技术实现思路
1、本申请提供了一种数据修复方法、装置、设备及介质,能够对异常数据进行数据修复,进而提升数据分析的准确性。
2、本申请公开了如下技术方案:
3、第一方面,本申请提供了一种数据修复方法,所述方法包括:响应于接收到的原始数据,设定基准值;
4、根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,所述第二原始数据是在所述原始数据中的所述第一原始数据的下一个数据,所述第一原始数据为正常数据;
5、若所述第二原始数据异常,则对所述第二原始数据进行数据修复。
6、可选的,所述对所述第二原始数据进行数据修复,包括:
7、将所述第二原始数据的值修复为所述第一原始数据的值。
8、可选的,所述根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,包括:
9、若第二原始数据与第一原始数据的第一差值大于所述基准值的第一预设倍数,则所述第二原始数据异常,所述第一预设倍数为正数。
10、可选的,所述根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,包括:
11、若第二原始数据与第一原始数据的第一差值小于所述基准值的第二预设倍数,则所述第二原始数据异常,所述第二预设倍数为负数。
12、可选的,所述方法还包括:
13、将第三原始数据的值修复为所述第一原始数据与第二差值的和,所述第三原始数据为所述原始数据中的所述第二原始数据的下一个数据,所述第二差值为所述第一原始数据和第四原始数据的差值,所述第四原始数据为所述原始数据中的所述第一原始数据的上一个数据。
14、可选的,所述方法还包括:
15、将第三原始数据的值修复为所述第一原始数据与第三差值的和,所述第三原始数据为所述原始数据中的所述第二原始数据的下一个数据,所述第三差值为所述第三原始数据与所述第二原始数据的差值。
16、可选的,所述方法还包括:
17、根据数据修复完成后的修正数据,建立修正数据表。
18、第二方面,本申请提供了一种数据修复装置,所述装置包括:设定模块、判断模块和第一修复模块;
19、所述设定模块,用于响应于接收到的原始数据,设定基准值;
20、所述判断模块,用于根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,所述第二原始数据是在所述原始数据中的所述第一原始数据的下一个数据,所述第一原始数据为正常数据;
21、所述第一修复模块,用于若所述第二原始数据异常,则对所述第二原始数据进行数据修复。
22、可选的,所述第一修复模块具体用于:将所述第二原始数据的值修复为所述第一原始数据的值。
23、可选的,所述判断模块具体用于:若第二原始数据与第一原始数据的第一差值大于所述基准值的第一预设倍数,则所述第二原始数据异常,所述第一预设倍数为正数。
24、可选的,所述判断模块具体用于:若第二原始数据与第一原始数据的第一差值小于所述基准值的第二预设倍数,则所述第二原始数据异常,所述第二预设倍数为负数。
25、可选的,所述装置还包括第二修复模块。所述第二修复模块用于:将第三原始数据的值修复为所述第一原始数据与第二差值的和,所述第三原始数据为所述原始数据中的所述第二原始数据的下一个数据,所述第二差值为所述第一原始数据和第四原始数据的差值,所述第四原始数据为所述原始数据中的所述第一原始数据的上一个数据。
26、可选的,所述装置还包括第三修复模块。所述第三修复模块用于:将第三原始数据的值修复为所述第一原始数据与第三差值的和,所述第三原始数据为所述原始数据中的所述第二原始数据的下一个数据,所述第三差值为所述第三原始数据与所述第二原始数据的差值。
27、可选的,所述装置还包括建立模块。所述建立模块用于:根据数据修复完成后的修正数据,建立修正数据表。
28、第三方面,本申请提供了一种数据修复设备,包括:存储器和处理器;
29、所述存储器,用于存储程序;
30、所述处理器,用于执行所述计算机程序时实现上述数据修复方法的步骤。
31、第四方面,本申请提供了一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现上述数据修复方法的步骤。
32、相较于现有技术,本申请具有以下有益效果:
33、本申请提供一种数据修复方法、装置、设备及介质,该数据修复方法包括:响应于接收到的原始数据,设定基准值;根据第一原始数据、第二原始数据和基准值的大小,判断第二原始数据是否异常,该第二原始数据是在原始数据中的第一原始数据的下一个数据,第一原始数据为正常数据;若第二原始数据异常,则对第二原始数据进行数据修复。由此,不论异常数据是正常数据异常增大后的数据,还是正常数据异常减小后的数据,只要异常均可进行数据的修复,从而不会出现因为丢弃异常数据或沿用异常数据导致的分析结果不准确的问题,进而提升了数据分析的准确性。
1.一种数据修复方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述第二原始数据进行数据修复,包括:
3.根据权利要求1所述的方法,其特征在于,所述根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据第一原始数据、第二原始数据和所述基准值的大小,判断所述第二原始数据是否异常,包括:
5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
6.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.一种数据修复装置,其特征在于,所述装置包括:设定模块、判断模块和第一修复模块;
9.一种数据修复测试设备,其特征在于,包括:存储器和处理器;
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的方法的各个步骤。