本申请涉及设备运行状态监测领域,特别是涉及一种设备异常值剔除方法、系统、装置以及介质。
背景技术:
1、随着大数据和智能传感技术的发展,基于数据驱动的数据重构方法在设备运行状态监测中使用的愈发广泛,但数据重构方法对状态矩阵严重依赖,状态矩阵的构建质量直接影响数据重构方法的估计精度,设备状态矩阵的构建过程中须将异常参数剔除,仅保留正常运行状态下的设备运行参数。
2、目前主要采用的方法为人工剔除或设定固定阈值,但人工剔除需要工程师对设备运行参数逐条进行分析,根据自身经验将异常值剔除,该方法的过程相当耗时耗力;而通过给状态矩阵中各个特征数据设定阈值限制,对不满足阈值限制的数据进行剔除,该方法容易造成误识别,尤其对于长周期性数据,选取合适的阈值难度较大,会有造成过多正常值被剔除和异常值被保留的情况。
3、鉴于上述问题,寻求一种解决上述技术问题的方法是本领域技术人员亟待解决的问题。
技术实现思路
1、本申请的目的是提供一种设备异常值剔除方法、系统、装置以及介质,用于通过获取多个测点的设备的历史运行数据,并对历史运行数据进行滑动加窗处理,对各滑动窗口内各测点的特征值进行计算获取到对应的特征频数,根据特征频数确定要删除的数据,重复操作至状态矩阵中无异常数据为止。通过上述方法,进行无监督异常检测,无需人工或仅需少量人工参与,大大解放了劳动力,并极大提高了识别与剔除效率;且通过此方法能够全面综合考虑设备运行数据的分布状况,更好的摆脱了由于设定固定剔除阈值而造成的过多正常值被剔除和异常值被保留的问题。
2、为解决上述技术问题,本申请提供一种设备异常值剔除方法,包括:
3、获取多个测点的设备的历史运行数据;
4、对历史运行数据进行滑动加窗处理,并计算各滑动窗口内各测点的特征值;
5、获取各特征值对应的特征频数;
6、根据特征频数确定需要剔除的历史运行数据。
7、优选地,根据特征频数确定需要剔除的历史运行数据包括:
8、根据特征频数计算特征频数得分;
9、将特征频数得分按照从小到大的顺序依次排序,并标记前β个特征频数得分的窗口区间为剔除区间;
10、删除剔除区间中的历史运行数据。
11、优选地,获取多个测点下的设备的历史运行数据之后,对历史运行数据进行滑动加窗处理,并计算各窗口内各测点的特征值之前还包括:
12、对各测点的历史运行数据进行归一化处理。
13、优选地,获取多个测点的设备的历史运行数据之后还包括:
14、对各测点的历史运行数据通过相关性分析算法进行定量化描述;
15、将各测点的历史运行数据在时间坐标上对齐并组成设备原始状态矩阵;
16、其中,历史运行数据包括设备的真实测点数据、测试数据、模型计算数据,设备原始状态矩阵中横坐标为时间坐标,纵坐标为对应选取的测点。
17、优选地,对历史运行数据进行滑动加窗处理,并计算各滑动窗口内各测点的特征值,包括:
18、获取各所述滑动窗口内的测点对应的所述历史运行数据;
19、根据各所述滑动窗口内的所述历史运行数据确定对应的特征数据;
20、预先获取各所述特征数据对应的置信参数;
21、根据各所述特征数据对应的初始特征值和置信参数确定各所述特征数据对应的置信区间;
22、根据各所述滑动窗口内的各所述特征数据以及对应的所述置信区间确定各所述滑动窗口内的置信区间之间的重合区间;
23、将所述重合区间对应的各所述滑动窗口内的初始特征值设定为相同,且为对应的各所述测点的特征值。
24、优选地,根据特征频数计算特征频数得分包括:
25、根据预设公式计算特征频数得分;
26、其中,预设公式为:
27、
28、其中,r为特征频数得分,n为选取特征的数量,mi为某一特征的特征值,f(mi)为特征值mi出现的频数。
29、优选地,根据特征频数确定需要剔除的历史运行数据之后还包括:
30、判断设备原始状态矩阵中是否存在异常数据;
31、若存在,则返回对历史运行数据进行滑动加窗处理,并计算各滑动窗口内各测点的特征值这一步骤。
32、为解决上述技术问题,本申请还提供一种设备异常值剔除系统,包括:
33、获取模块,用于获取多个测点的设备的历史运行数据;
34、处理模块,用于对历史运行数据进行滑动加窗处理,并计算各滑动窗口内各测点的特征值;
35、计算模块,用于获取各特征值对应的特征频数;
36、确定模块,用于根据特征频数确定需要剔除的历史运行数据。
37、为解决上述技术问题,本申请还提供一种设备异常值剔除装置,包括存储器,用于存储计算机程序;
38、处理器,用于执行计算机程序时实现如上述的设备异常值剔除方法的步骤。
39、为解决上述技术问题,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的设备异常值剔除方法的步骤。
40、本申请所提供的设备异常值剔除方法,通过获取多个测点的设备的历史运行数据,并对历史运行数据进行滑动加窗处理,对各滑动窗口内各测点的特征值进行计算获取到对应的特征频数,根据特征频数确定要删除的数据,重复操作至状态矩阵中无异常数据为止。通过上述方法,进行无监督异常检测,无需人工或仅需少量人工参与,大大解放了劳动力,并极大提高了识别与剔除效率;且通过此方法能够全面综合考虑设备运行数据的分布状况,更好的摆脱了由于设定固定剔除阈值而造成的过多正常值被剔除和异常值被保留的问题。
41、本申请提供的设备异常值剔除系统、装置以及存储介质具有与上述设备异常值剔除方法相同的有益效果。
1.一种设备异常值剔除方法,其特征在于,该方法包括:
2.根据权利要求1所述的设备异常值剔除方法,其特征在于,所述根据所述特征频数确定需要剔除的所述历史运行数据包括:
3.根据权利要求2所述的设备异常值剔除方法,其特征在于,所述获取多个测点下的设备的历史运行数据之后,所述对所述历史运行数据进行滑动加窗处理,并计算各窗口内各所述测点的特征值之前还包括:
4.根据权利要求3所述的设备异常值剔除方法,其特征在于,所述获取多个测点的设备的历史运行数据之后还包括:
5.根据权利要求4所述的设备异常值剔除方法,其特征在于,所述对所述历史运行数据进行滑动加窗处理,并计算各滑动窗口内各所述测点的特征值,包括:
6.根据权利要求5所述的设备异常值剔除方法,其特征在于,所述根据所述特征频数计算特征频数得分包括:
7.根据权利要求1至6任一项所述的设备异常值剔除方法,其特征在于,所述根据所述特征频数确定需要剔除的所述历史运行数据之后还包括:
8.一种设备异常值剔除系统,其特征在于,该系统包括:
9.一种设备异常值剔除装置,其特征在于,包括存储器,用于存储计算机程序;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的设备异常值剔除方法的步骤。