本申请涉及数据处理领域,具体涉及基于多源数据的白酒仓储异常预警系统。
背景技术:
1、白酒在仓储存储的过程中需要控制温度、湿度等环境在最佳范围内,但是仓储环境不断在变化,如果不及时发现,导致各种环境因素超出最佳范围就会对白酒的品质造成破坏,影响白酒的品质。因此,需要在无人监管的仓储设置传感器系统,观察传感器系统产生的数据信息,对数据信息识别其中的异常状态,并对异常状态进行预警。
2、传统的预警系统在基于统计量的异常检测算法sos的基础上,将白酒仓储过程中对环境监测的各行数据作为输入矩阵,完成异常数据点的评价。但是这种方法对于想要监测高维数据时具有较高的算法复杂度,会造成维数灾难;同时在对环境中的多行数据进行计算时,并没有结合每行数据自身对白酒仓储异常的影响程度,从而导致异常监测预警结果误差较大。
3、综上所述,本发明提出基于多源数据的白酒仓储异常预警系统,采用传感器系统采集白酒仓储的环境特征数据,结合各环境特征数据序列中疑似点的分布特征及特征数据本身的特点,进行sos异常检测,完成白酒仓储异常预警。
技术实现思路
1、为了解决上述技术问题,本发明提供基于多源数据的白酒仓储异常预警系统,所述系统包括:
2、数据采集模块:根据传感器系统采集白酒仓储过程中的环境特征数据序列;
3、数据处理模块:将每行特征数据序列构成环境特征矩阵;对环境特征矩阵的每行特征数据分别求导函数得到环境特征斜率矩阵,统计环境特征斜率矩阵中的疑似点;根据每行特征数据疑似点出现的频次及位置分布得到各疑似点的密切约束度;根据每行特征数据各疑似点之间的密切约束度得到每行特征数据的各个集合;根据每行特征数据各集合中数据点的位置信息得到各集合的跨度系数;根据每行特征数据各集合中每个密切约束度及各集合的跨度系数得到各集合的密切组合系数;
4、根据每行特征数据各集合的密切组合系数得到每行特征数据的特征影响系数;根据每行特征数据的特征影响系数得到特征权重系数;
5、异常监测模块:根据每行特征数据的特征权重系数得到每个数据点的加权特征参数;使用sos异常检测算法将加权特征参数作为输入矩阵,输出得到各数据点的离群值概率;根据各数据点的离群值概率及离群阈值得到各异常数据点,结合各异常数据点完成对白酒仓储异常预警。
6、优选的,统计环境特征斜率矩阵中的疑似点的具体步骤为:
7、将环境特征斜率矩阵中数值为0的环境特征矩阵对应的数据点记作第一疑似点;
8、将环境特征斜率矩阵中为最值的环境特征矩阵对应的数据点记作第二疑似点;
9、将第一疑似点和第二疑似点记作疑似点。
10、优选的,根据每行特征数据疑似点出现的频次及位置分布得到各疑似点的密切约束度的表达式为:
11、
12、式中,、分别为第个疑似点在第行特征数据空间分布的横坐标、纵坐标,、分别为第个疑似点在第行特征数据空间分布的横坐标、纵坐标,为第个疑似点在每行特征数据中出现的频次,为第个疑似点在每行特征数据中出现的频次,为第行特征数据中第个疑似点与剩余疑似点中的第个疑似点的密切约束度。
13、优选的,根据每行特征数据各疑似点之间的密切约束度得到每行特征数据的各个集合的具体步骤为:
14、在每行特征数据中,对任意一个疑似点,将与剩余疑似点计算得到的最大密切约束度的疑似点组成一个小集合;
15、将所有存在交集的小集合求并集,得到每行特征数据的各个集合。
16、优选的,根据每行特征数据各集合中数据点的位置信息得到各集合的跨度系数的具体步骤为:
17、
18、式中,为第行特征数据中第个集合中的最左边疑似点在特征数据空间分布中的横坐标,为第行特征数据中第个集合中最右边疑似点在特征数据空间分布中的横坐标,为第行特征数据中第个集合在纵轴方向的最大纵向跨度距离,为第行特征数据中第个集合左右两侧最近两个峰谷之间在纵轴方向的最大纵向跨度距离,为第行特征数据中第个集合的跨度系数。
19、优选的,根据每行特征数据各集合中每个密切约束度及各集合的跨度系数得到各集合的密切组合系数的表达式为:
20、
21、式中,为第行特征数据中第个集合的跨度系数,为第行特征数据中第个集合的疑似点数量,为第行特征数据中第个集合中的第个密切约束度,为第行特征数据中第个集合的密切组合系数。
22、优选的,根据每行特征数据各集合的密切组合系数得到每行特征数据的特征影响系数的表达式为:
23、
24、式中,为修正系数,为归一化函数,为第行特征数据中集合的数量,为第行特征数据中第个集合的密切组合系数,为第行特征数据中第个集合的疑似点数量,为第行特征数据的特征影响系数。
25、优选的,根据每行特征数据的特征影响系数得到特征权重系数的具体步骤为:
26、将每行特征数据的特征影响系数求和作为分母;
27、将每行特征数据的特征影响系数与分母做比值,得到相对应行特征数据的特征权重系数。
28、优选的,根据每行特征数据的特征权重系数得到每个数据点的加权特征参数的具体步骤为:
29、将每行特征数据的特征权重系数对环境特征矩阵中每列对应的各数据点进行加权求和,得到每列时刻点对应的加权特征参数。
30、优选的,根据各数据点的离群值概率及离群阈值得到各异常数据点的具体步骤为:
31、获取各数据点的离群值概率,并设置离群阈值,将离群值概率大于离群阈值的数据点作为异常数据点。
32、本发明至少具有如下有益效果:
33、本发明方法可实现对白酒仓储过程中的异常情况的监测预警,相比于传统的sos异常检测算法,本发明根据白酒仓储得到各环境参数计算疑似点,结合各疑似点在每行环境参数数据序列中的不同分布,有助于将白酒仓储过程中的环境特征数据序列中的异常数据区间监测出来,提高数据监测精度;
34、同时,再结合每行特征数据序列自身对白酒仓储异常的影响程度,得到每行数据的特征影响系数,可以有效地将高维数据在不同的权重下融合为一组数据,避免了维数灾难,降低算法的时间复杂度,减小白酒仓储异常预警结果的误差。
1.基于多源数据的白酒仓储异常预警系统,其特征在于,所述系统包括:
2.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述统计环境特征斜率矩阵中的疑似点的具体步骤为:
3.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据疑似点出现的频次及位置分布得到各疑似点的密切约束度的表达式为:
4.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据各疑似点之间的密切约束度得到每行特征数据的各个集合的具体步骤为:
5.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据各集合中数据点的位置信息得到各集合的跨度系数的具体步骤为:
6.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据各集合中每个密切约束度及各集合的跨度系数得到各集合的密切组合系数的表达式为:
7.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据各集合的密切组合系数得到每行特征数据的特征影响系数的表达式为:
8.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据的特征影响系数得到特征权重系数的具体步骤为:
9.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据每行特征数据的特征权重系数得到每个数据点的加权特征参数的具体步骤为:
10.如权利要求1所述的基于多源数据的白酒仓储异常预警系统,其特征在于,所述根据各数据点的离群值概率及离群阈值得到各异常数据点的具体步骤为: