基于大数据的工业设备运行异常状态识别方法与流程

文档序号:33547032发布日期:2023-03-22 10:04阅读:55来源:国知局
基于大数据的工业设备运行异常状态识别方法与流程

1.本发明涉及电数字数据处理技术领域,具体涉及一种基于大数据的工业设备运行异常状态识别方法。


背景技术:

2.近年来,随着工业4.0的推进,工业设备的智能化和复杂程度大大上升,传统的基于简单模型获取工业设备的运行状态已然不能满足对工业设备健康评估的要求;即当工业设备的性能发生微小的变化时,传统的简单模型很难检测到微小的变化,只能判定该工业设备运行正常,进而造成重大的生产率损失。因此,工业设备的异常检测具有很大的科学和工程价值。
3.为了达到对工业设备的检测需求,目前采用压电传感器或手持式数据采集工具等采集工业设备的频率、加速度或压力等数据对工业设备进行检测,这两种方式一方面需要人力配合,另一方面采集到的数据无法直观的反应工业设备是否发生异常,需要进一步地对数据进行分析才能得到检测结果,且大多数都是利用单一数据去分析工业设备的异常状况,存在数据片面、单源单结构数据检测精度较低的问题。


技术实现要素:

4.为了解决上述技术问题,本发明的目的在于提供一种基于大数据的工业设备运行异常状态识别方法,所采用的技术方案具体如下:获取工业设备的若干个检测参数在历史时段内对应的数据,得到各检测参数对应的数据序列,基于所述数据序列,计算任意两个检测参数之间的关联性;基于所述关联性构建关联性矩阵;根据关联性矩阵从若干个检测参数中筛选出多个关键检测参数;获取关键检测参数在设定时段内各检测时刻对应的数据,构建关键检测参数矩阵并对其进行降维,得到重构数据矩阵;在重构数据矩阵中随机选取一个元素,计算该元素与所有元素的差值绝对值,根据差值绝对值与差异阈值,计算该元素的第一分布指标;在以该元素为中心的窗口区域内获取第一分布指标大于该元素的第一分布指标对应的元素,计算该元素与获取的所有元素对应的差值绝对值,并将差值绝对值的最小值作为该元素的第二分布指标;所述窗口区域的尺寸为n
×
n,n大于等于3;根据各元素对应的第一分布指标与第二分布指标,计算各元素对应的状态指标;根据重构数据矩阵中元素的最大值与最小值和标准重构数据矩阵中元素的最大值与最小值,计算数据综合指标;设置状态阈值,获取小于状态阈值对应的状态指标,计算所有小于状态阈值对应的状态指标的倒数的累加和,将累加和与数据综合指标的乘积作为运行状态指标,根据运行状态指标判断工业设备是否异常。
5.优选的,所述检测参数包括工业设备对应的振动频率、功率、轴承温度、电机旋转速度以及进给速度。
6.优选的,所述关联性的计算方法为:获取任意两检测参数在历史时段内同时出现故障的频次,对各个数据序列进行直线拟合,得到各个数据序列对应直线的斜率;计算各个数据序列对应的离散系数,计算任意两个数据序列的皮尔逊相关系数;根据所述频次、斜率、离散系数以及皮尔逊相关系数,计算任意两个检测参数之间的关联性;所述关联性为:其中,为第i个检测参数与第j个检测参数之间的关联性;为第i个检测参数与第j个检测参数在历史时段内同时出现异常的频次,为第i个检测参数对应的数据序列与第j个检测参数对应的数据序列之间的皮尔逊相关系数;为第i个检测参数的数据序列对应直线的斜率,为第j个检测参数的数据序列对应直线的斜率,为第i个检测参数的数据序列对应的离散系数,为第j个检测参数的数据序列对应的离散系数,为由第i个检测参数的数据序列构成的向量,为由第j个检测参数的数据序列构成的向量,为与的内积,、分别为权值参数,为模型参数,为自然常数。
7.优选的,所述关联性矩阵中第i行的元素为第i个检测参数与剩余其他检测参数之间的关联性归一化后的值;所述根据关联性矩阵从若干个检测参数中筛选出多个关键检测参数的方法具体为:获取关联性矩阵中每一行元素的最大值,记为最大关联性;当最大关联性大于关联性阈值时,则从最大关联性对应的两个检测参数中随机选取一个检测参数作为关键检测参数,当最大关联性小于关联性阈值,则最大关联性对应的两个检测参数均为关键检测参数。
8.优选的,所述第一分布指标为:其中,为重构数据矩阵中的元素z对应的第一分布指标,为差异阈值,为重构数据矩阵中元素z与元素s的差值绝对值,为重构数据矩阵中元素的数量。
9.优选的,所述状态指标为:其中,为重构数据矩阵中的元素z对应的状态指标,为重构数据矩阵中的元素z对应的第一分布指标,为重构数据矩阵中所有元素对应的第一分布指标的最大值,为重构数据矩阵中的元素z对应的第二分布指标;为重构数据矩阵中所有元素对应的第二分布指标的最大值,,分别为调节参数。
10.优选的,所述数据综合指标为:
其中,为数据综合指标,为重构数据矩阵中元素的最大值,为标准重构数据矩阵中元素的最大值,为重构数据矩阵中元素的最小值,为标准重构数据矩阵中元素的最小值,为以e为底的指数函数。
11.优选的,所述根据运行状态指标判断工业设备是否异常的方法具体为:设置指标阈值,比较运行状态指标与所述指标阈值的大小,当运行状态指标大于指标阈值时,则工业设备的运行状态为异常;当运行状态指标小于指标阈值时,则工业设备的运行状态为正常。
12.本发明实施例至少具有如下有益效果:本发明通过获取工业设备的若干个检测参数对应的数据,计算任意两个检测参数之间的关联性;根据关联性从若干个检测参数中筛选出多个关键检测参数;降低了计算量,避免了由于人为选取各个检测参数具有主观性过强、冗余度高的问题,与此同时,若对关联性较大的检测参数均进行分析将会造成数据量增加、检测效率低下的问题,因此,本发明基于对各个检测参数之间的关联性分析,提取出多个关键检测参数,避免关联性过高的检测参数之间的重复分析,提高数据分析精度,进而提高了对工业设备运行状态的检测效率。同时,本发明根据第一分布指标与第二分布指标计算重构数据矩阵中各元素对应的状态指标,第一分布指标为整体的分析结果,第二分布指标为局部的分析结果,状态指标的计算对整体与局部的分析结果进行了融合,能够更加精确的表征重构数据矩阵中各元素为异常元素的可能性;进而准确判断工业设备的运行状态是否异常,解决了传统的检测方法存在数据片面、检测精度低的问题。本发明通过运行状态指标判断工业设备是否异常,不再人为参与工业设备的检测,具有自动化的优点。
附图说明
13.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
14.图1为本发明的一种基于大数据的工业设备运行异常状态识别方法实施例的步骤流程图。
具体实施方式
15.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的方案,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
16.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
17.请参阅图1,其示出了本发明一个实施例提供的一种基于大数据的工业设备运行
异常状态识别方法的步骤流程图,该方法包括以下步骤:步骤1,获取工业设备的若干个检测参数在历史时段内对应的数据,得到各检测参数对应的数据序列,基于数据序列,计算任意两个检测参数之间的关联性。
18.工业设备指的是工业生产设备和各类机床,比如车床、铣床、磨床、刨床等机器,本实施以车床为例,判断其运行状态是否异常。
19.具体地,获取车床的若干个检测参数在历史时段内对应的数据,得到各检测参数对应的数据序列,其中检测参数包括车床的振动频率、功率、轴承温度、电机旋转速度以及进给速度;实施者可根据具体的工业设备对检测参数进行调整。
20.本实施例中,振动频率通过振动检测仪获取,振动检测仪设置在车床侧面位置处,实施者根据实际情况自行设置振动检测仪的位置;功率通过电压电流设备对车床工作的电压电流进行数据采集,根据采集到的电压电流数据计算功率;电机旋转速度与进给速度通过霍尔传感器进行采集;轴承温度通过设置在轴承上的贴片式温度传感器进行采集。
21.优选的,对于每个检测参数,获取该检测参数在历史时段内对应的数据,本实施例中的历史时段为半年,则各个检测参数在历史时段内对应的数据是海量的,为了减少计算量,从各个检测参数在历史时段内对应的数据中随机选取各个检测参数的m个数据,构成各个检测参数对应的数据序列,即数据序列的长度为m。其中,在实际操作过程中,实施者可根据具体情况调整历史时段的取值,比如将历史时段设置为一年或三个月等。
22.然后根据数据序列计算任意两个检测参数之间的关联性;关联性的计算方法为:获取任意两个检测参数在历史时段内同时出现故障的频次,对各个数据序列进行直线拟合,得到各个数据序列对应直线的斜率;计算各个数据序列对应的离散系数,计算任意两个数据序列的皮尔逊相关系数;根据频次、斜率、离散系数以及皮尔逊相关系数,计算任意两个检测参数之间的关联性。
23.关联性的计算公式具体为:其中,为第i个检测参数与第j个检测参数之间的关联性;为第i个检测参数与第j个检测参数在历史时段内同时出现异常的频次,为第i个检测参数对应的数据序列与第j个检测参数对应的数据序列之间的皮尔逊相关系数;为第i个检测参数的数据序列对应直线的斜率,为第j个检测参数的数据序列对应直线的斜率,为第i个检测参数的数据序列对应的离散系数,为第j个检测参数的数据序列对应的离散系数,为由第i个检测参数的数据序列构成的向量,为由第j个检测参数的数据序列构成的向量,为与的内积,、分别为权值参数,为模型参数,为自然常数。其中,模型参数大于1,权值参数大于0小于1,且两个权值参数的和为1;本实施例中模型参数,权值参数,权值参数,实施者可根据实际情况调整权值参数与模型参数的取值。
24.关联性表征两个检测参数之间的相似程度,关联性越大,则对应两个检测参数之
间的相似程度越高。
25.为第i个检测参数与第j个检测参数在历史时段内同时出现异常的频次,同时出现异常的频次越多,表明第i个检测参数与第j个检测参数的相似程度越高。
26.为第i个检测参数对应的数据序列与第j个检测参数对应的数据序列之间的皮尔逊相关系数,皮尔逊相关系数是用来衡量对应两数据序列之间的相关性的,皮尔逊相关系数越大,两个数据序列之间的相关性越高,即两个数据序列对应的两个检测参数之间的相似程度越高。
27.为第i个检测参数与第j个检测参数对应的数据序列对应直线的斜率差值的绝对值,越大,表征对应两直线的走势越不相同,则两直线对应的数据序列之间的差异越大,即与对应的第i个检测参数与第j个检测参数之间的相似程度越低。
28.为第i个检测参数与第j个检测参数对应的数据序列的离散系数之间的差值绝对值,离散系数表征数据序列中数据的集中性,离散系数越大,则数据序列中的数据越不集中,越离散;离散系数越小,则数据序列中的数据越集中,离散程度越低;越大,说明第i个检测参数与第j个检测参数对应的两个数据序列中,其中一个数据序列的离散系数较大,另一个数据序列的离散系数较小,则两个数据序列之间的差异越大,即与对应的第i个检测参数与第j个检测参数之间的相似程度越低。
29.为由第i个检测参数的数据序列构成的向量与由第j个检测参数的数据序列构成的向量之间的内积,越大,表征两个向量之间的夹角越小,这两个向量越相似,即与对应的第i个检测参数与第j个检测参数之间的相似程度越高。
30.基于上述分析可知,、以及的值越大,对应两个检测参数之间的相似程度越大,即、以及的大小与对应两个检测参数之间的相似程度呈现正相关关系,因此、以及的大小与对应两个检测参数之间的关联性呈现正相关关系;与的值越大,对应两个检测参数之间的相似程度越小,即与的大小与对应两检测参数之间的相似程度呈现负相关关系,因此与的大小与对应两个检测参数之间的关联性呈现负相关关系;基于此,本实施例通过数学建模的方法获得关联性的计算公式,满足各因素与关联性的正相关关系与负相关关系。
31.其中需要说明的是,离散系数与皮尔逊相关系数的计算方法均为公知技术,不在本发明的保护范围内,不再赘述;对于由数据序列构成的向量而言,数据序列的长度就是对应向量的维度,即在本实施例中,数据序列的长度为m,则向量的维度为m维。
32.步骤2,基于关联性构建关联性矩阵;根据关联性矩阵从若干个检测参数中筛选出多个关键检测参数。
33.进一步地,将关联性进行归一化,得到关联性归一化后的值,关联性归一化后的值处于0-1之间,然后基于关联性归一化后的值构建关联性矩阵。
34.关联性矩阵为,其中,为第1个检测参数与第2个检测参数之间的关联性归一化后的值,为第1个检测参数与第q个检测参数之间的关联性归一化后的值,为第2个检测参数与第1个检测参数之间的关联性归一化后的值,且';'为第2个检测参数与第q个检测参数之间的关联性归一化后的值,'为第q个检测参数与第1个检测参数之间的关联性归一化后的值,且;为第q个检测参数与第q-1个检测参数之间的关联性归一化后的值;q为检测参数的数量,本实施例中检测参数的数量为5,即q=5,对应振动频率、功率、轴承温度、电机旋转速度以及进给速度这5个检测参数,在实际操作过程中,实施者可以根据实际情况调整检测参数的数量。
35.在关联性矩阵中,,'与'均表示第i个检测参数与第j个检测参数之间的关联性归一化后的值,且关联性矩阵中第i行的元素为第i个检测参数与剩余其他检测参数之间的关联性归一化后的值;即关联性矩阵中第1行的元素为第1个检测参数与剩余其他检测参数之间的关联性归一化后的值。
36.上述中根据关联性矩阵从若干个检测参数中筛选出多个关键检测参数的方法具体为:获取关联性矩阵中每一行元素的最大值,记为最大关联性;当最大关联性大于关联性阈值时,则从最大关联性对应的两个检测参数中随机选取一个检测参数作为关键检测参数,当最大关联性小于关联性阈值,则最大关联性对应的两个检测参数均为关键检测参数。例如,若第一行对应的最大关联性为,当大于关联性阈值时,则将对应的第1个检测参数或第2个检测参数作为关键检测参数;当小于关联性阈值时,则将对应的第1个检测参数和第2个检测参数均作为关键检测参数。其中,关联性阈值为0.95,实施者在实际操作过程中可根据实际情况自行设置。
37.需要说明的是,从若干个检测参数中筛选出多个检测参数是为了降低计算量,考虑到人为选取各个检测参数具有主观性过强、冗余度高等问题,同时,若对关联性较大的检测参数均进行分析将会造成数据量增加、检测效率低下的问题,因此,基于对各个检测参数之间的关联性分析,提取工业设备运行状况检测识别的关键检测参数,避免关联性过高的检测参数之间的重复分析,提高数据分析精度。
38.步骤3,获取关键检测参数在设定时段内各检测时刻对应的数据,构建关键检测参数矩阵并对其进行降维,得到重构数据矩阵,在重构数据矩阵中随机选取一个元素,计算该元素与所有元素的差值绝对值,根据差值绝对值与差异阈值,计算该元素的第一分布指标。
39.考虑到工业设备在运行的过程中,关键检测参数对应的数据大多是连续的,不便于对数据进行分析,因此,本实施例对数据进行离散化,具体为,对于每个关键检测参数,获取该关键检测参数在设定时段内各检测时刻对应的数据,基于设定时段内的数据对工业设备在该设定时段内的运行状态进行分析,即每隔一段时间(相邻两设定时段的时间间隔)进行一次工业设备运行状况的检测识别。
40.本实施例以一个设定时段为例,基于设定时段内的数据对工业设备在该设定时段内的运行状态进行分析的过程进行说明。其中,设定时段内相邻两检测时刻之间的时间间隔为1s,设定时段为1分钟,相邻两设定时段的时间间隔为5分钟,实施者可根据具体情况设置相邻两检测时刻之间的时间间隔与相邻两设定时段之间的时间间隔。
41.上述中的关键检测参数矩阵为:,其中,为第m个关键检测参数在设定时段内的第t个检测时刻对应的数据;m为关键检测参数的数量,且,q为检测参数的数量;t为设定时段内检测时刻的数量,本实施例中t=60。
42.进一步地,为避免各个关键检测参数对应的数据之间不同量纲的影响,对关键检测参数数据矩阵进行归一化处理,保证关键检测参数矩阵中的每一个值处于0-1之间。
43.其次为了降低数据处理的复杂度,提高工业设备在设定时段内运行状态的检测速度,本实施例通过主成分分析算法对归一化后的关键检测参数矩阵进行降维,并将降维后的矩阵记为重构数据矩阵,进一步地,对重构数据矩阵进行归一化处理,保证重构数据矩阵中的每一个值处于0-1之间。其中,通过主成分分析算法对矩阵进行降维为公知技术,不在本发明的保护范围内,具体过程不再赘述。
44.然后在重构数据矩阵中随机选取一个元素,计算该元素与所有元素的差值绝对值,根据差值绝对值与差异阈值,计算该元素的第一分布指标;第一分布指标为:其中,为重构数据矩阵中的元素z对应的第一分布指标,为差异阈值,为重构数据矩阵中元素z与元素s的差值绝对值,为重构数据矩阵中元素的数量。本实施例中差异阈值为0.3,在具体操作过程中,实施者可根据实际情况对差异阈值进行调整。
45.表征重构数据矩阵中元素z与元素s的相似程度较高,因此,表征重构数据矩阵中元素z与元素s的相似程度较低,因此0;第一分布指标表征该元素与重构数据矩阵中剩余其他元素的相似程度,
相似程度越大,则该元素为孤立元素的可能性越小,即该元素越不可能为异常元素;若在重构数据矩阵中,所有元素对应的第一分布指标均较大,则所有元素越不可能为异常元素,说明工业设备在该设定时段内出现异常的可能性越低。第一分布指标表达的是从整体分析重构数据矩阵中的各元素得到的分析结果。
46.步骤4,在重构数据矩阵中随机选取一个元素,在以该元素为中心的窗口区域内获取第一分布指标大于该元素的第一分布指标对应的元素,计算该元素与获取的所有元素对应的差值绝对值,并将差值绝对值的最小值作为该元素的第二分布指标;窗口区域的尺寸为n
×
n,n大于等于3。
47.第二分布指标表征的是在重构数据矩阵以任意一元素为中心的窗口区域中元素的分布状况,第二分布指标越大,则认为窗口区域中心的元素与窗口区域其他元素的差异程度越高,则窗口区域中的元素越有可能是异常元素。即第二分布指标表达的是从局部分析重构数据矩阵中的各元素得到的分析结果。
48.本实施例中窗口区域的尺寸为7
×
7,实施者可根据实际情况对其进行调整。
49.步骤5,根据各元素对应的第一分布指标与第二分布指标,计算各元素对应的状态指标。
50.所述状态指标为:其中,为重构数据矩阵中的元素z对应的状态指标,为重构数据矩阵中的元素z对应的第一分布指标,为重构数据矩阵中所有元素对应的第一分布指标的最大值,为重构数据矩阵中的元素z对应的第二分布指标;为重构数据矩阵中所有元素对应的第二分布指标的最大值,,分别为调节参数,调节参数大于0;本实施例中,,实施者可对调节参数进行调整,满足调节参数大于0即可。
51.状态指标的计算结合了第一分步指标与第二分布指标,对整体与局部的分析结果进行了融合,能够更加精确的表征重构数据矩阵中各元素为异常元素的可能性;状态指标越小,则认为对应元素为异常元素的置信度越高,即对应元素越有可能为异常元素。
52.进一步地,为了方便后续计算,进而更准确的判断工业设备的运行状态,对重构数据矩阵中所有元素对应的状态指标进行归一化处理,保证每一个状态指标的取值在0-1之间。
53.步骤6,根据重构数据矩阵中元素的最大值与最小值和标准重构数据矩阵中元素的最大值与最小值,计算数据综合指标。
54.具体地,数据综合指标为:其中,为数据综合指标,为重构数据矩阵中元素的最大值,为标准重构数据矩阵中元素的最大值,为重构数据矩阵中元素的最小值,为标准重构数据中元素的最小值,为以e为底的指数函数。
55.数据综合指标表征的是重构数据矩阵与标准重构数据矩阵的差异,该差异越大,则认为工业设备的运行越不稳定,即工业设备的运行状况为异常的可能性越高。因此,数据综合指标越大,则工业设备的运行状况为异常的可能性越高。
56.上述中的标准重构数据矩阵是工业设备在设定时段内运行状态为正常时所对应的重构数据矩阵。
57.步骤7,设置状态阈值,获取小于状态阈值对应的状态指标,计算所有小于状态阈值对应的状态指标的倒数的累加和,将累加和与数据综合指标的乘积作为运行状态指标,根据运行状态指标判断工业设备是否异常。
58.具体地,状态阈值为0.5,实施者可根据实际情况自行设置状态阈值的取值,然后获取小于状态阈值对应的状态指标,计算所有小于状态阈值对应的状态指标的倒数的累加和,将累加和与数据综合指标的乘积作为运行状态指标。
59.运行状态指标的公式具体为:其中,为运行状态指标,为数据综合指标,为重构数据矩阵中第x个小于状态阈值的状态指标,为小于状态阈值的状态指标的数量。
60.将小于状态阈值对应的状态指标筛选出来,只对那些为异常元素的可能性较大的元素对应的状态指标进行分析,减少了计算量;根据步骤5的分析可知,状态指标越小,则认为元素为异常元素的置信度越高,元素越有可能为异常元素,则越大,认为元素越有可能为异常元素,工业设备的运行状态越有可能异常;数据综合指标越大,则工业设备的运行状况为异常的可能性越高;因此,运行状态指标越大,则工业设备的运行状况为异常的可能性越高。
61.进一步地,对运行状态指标进行归一化处理,使得运行状态指标的取值在0-1之间。
62.然后根据运行状态指标判断工业设备是否异常的方法具体为:设置指标阈值,判断运行状态指标与所述指标阈值的大小,当运行状态指标大于指标阈值时,则工业设备的运行状态为异常;当运行状态指标小于指标阈值时,则工业设备的运行状态为正常;本实施例中的指标阈值为0.45,实施者可根据实际需求调整指标阈值的取值。
63.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1