本发明涉及数据安全管理领域,具体涉及一种物联网数据的安全管理系统及方法。
背景技术:
1、智能工厂通常会利用各种物联网设备采集物联网数据,并通过对物联网数据的分析对智能工厂的生产环境进行监测,其中的温度数据对智能工厂的生产尤为重要,由于智能工厂中的温度数据通常会包含异常数据,对异常数据的分析能够检测出智能工厂实时的温度数据是否出现异常,对温度数据的安全管理具有重要意义。
2、首先需要检测出温度数据中的异常数据,相关技术中通常利用孤立森林算法对异常数据进行检测,然后基于检测出的异常数据对温度数据进行安全管理。但是现有的孤立森林算法仅仅是根据数据在孤立树中高度的平均值检测出异常数据,容易将正常数据误认为是异常数据,降低对异常数据检测的准确性,进而导致无法对温度数据进行有效的安全管理。
技术实现思路
1、为了解决现有技术容易将正常数据误认为是异常数据,降低对异常数据检测的准确性,进而导致无法对温度数据进行有效的安全管理的技术问题,本发明的目的在于提供一种物联网数据的安全管理系统及方法,所采用的技术方案具体如下:
2、本发明提出了一种物联网数据的安全管理系统,所述安全管理系统包括:
3、数据采集模块,用于获取智能工厂在预设时间段内的温度数据;基于孤立森林算法,对温度数据构建不同的孤立树;
4、孤立树分析模块,用于统计每个孤立树中相同温度数据的数量,获得频率值;根据所有相同温度数据的频率值的变化,获得每个孤立树的疑似正常数据;根据所有疑似正常数据的频率值获得每个孤立树的正常程度;根据孤立树中所有的温度数据、每个温度数据在孤立树中的位置分布以及对应温度数据在孤立树中的高度,获得每个温度数据的真实程度;
5、异常检测模块,用于根据每个温度数据的所述真实程度和每个孤立树的所述正常程度,获得温度数据在每个孤立树的权重系数;根据所述权重系数对温度数据在孤立树中的高度进行调整,获得每个温度数据的异常得分;根据所述异常得分检测温度数据中的异常数据;
6、安全管理模块,用于将除所述异常数据之外的温度数据作为正常数据,对所有所述正常数据进行压缩,获得压缩数据;对所述压缩数据进行存储。
7、进一步地,所述根据所有相同温度数据的频率值的变化,获得每个孤立树的疑似正常数据包括:
8、将所有相同温度数据的频率值按从大到小的顺序进行排序,获得有序频率值序列;
9、将有序频率值序列中除去第一个和最后一个频率值之外的所有频率值作为目标频率值;
10、将每个所述目标频率值与前一个频率值的差值的绝对值,作为第一频率值差异;将每个所述目标频率值与后一个频率值的差值的绝对值,作为第二频率值差异;
11、获取每个目标频率值的突变程度,所述突变程度与所述第一频率值差异呈正相关,所述突变程度与所述第二频率值差异呈负相关;
12、将所述突变程度的最大值对应的目标频率值,作为分界频率值;
13、将所述有序频率值序列中所有大于所述分界频率值的频率值所对应的温度数据,作为每个孤立树的疑似正常数据。
14、进一步地,所述根据所有疑似正常数据的频率值获得每个孤立树的正常程度包括:
15、对每个孤立树中所有疑似正常数据的频率值进行累加,获得每个孤立树的正常程度。
16、进一步地,所述根据孤立树中所有的温度数据、每个温度数据在孤立树中的位置分布以及对应温度数据在孤立树中的高度,获得每个温度数据的真实程度包括:
17、将每个孤立树中所有温度数据的平均值,作为每个孤立树的整体数据值;
18、若每个温度数据位于孤立树根结点的左子树的位置,则将对应孤立树作为对应温度数据的第一孤立树,若每个温度数据位于孤立树根结点的右子树的位置,则将对应孤立树作为对应温度数据的第二孤立树;
19、将每个第一孤立树的所述整体数据值的平方和温度数据在对应第一孤立树中的高度的比值,作为温度数据在每个第一孤立树的第一系数;将温度数据在所有第一孤立树的所述第一系数的累加值,作为对应温度数据的第一路径真实度;
20、将所有第一孤立树的整体数据值的平均值作为温度数据均值;将每个第二孤立树与所述温度数据均值的平方差的绝对值作为差异参数;将所述差异参数与温度数据在对应第二孤立树中的高度的比值,作为温度数据在每个第二孤立树的第二系数;将温度数据在所有第二孤立树的所述第二系数的累加值,作为对应温度数据的第二路径真实度;
21、根据温度数据的所述第一路径真实度、所述第二路径真实度、第一孤立树的数量以及第二孤立树的数量,获得每个温度数据的真实程度。
22、进一步地,所述根据温度数据的所述第一路径真实度、所述第二路径真实度、第一孤立树的数量以及第二孤立树的数量,获得每个温度数据的真实程度包括:
23、对第一孤立树的数量进行负相关映射获得第一数量参数,对第二孤立树的数量进行负相关映射获得第二数量参数;
24、将所述第一数量参数与所述第一路径真实度的乘积值作为每个温度数据的第一真实参数;将所述第二数量参数与所述第二路径真实度的乘积值作为每个温度数据的第二真实参数;
25、将所述第一真实参数与所述第二真实参数的差值的绝对值,作为每个温度数据的真实程度。
26、进一步地,所述根据每个温度数据的所述真实程度和每个孤立树的所述正常程度,获得温度数据在每个孤立树的权重系数包括:
27、对每个温度数据的所述真实程度进行负相关映射,获得每个温度数据的调整价值;
28、对所述调整价值与所述正常程度的乘积值进行归一化处理,获得对应温度数据在每个孤立树的权重系数。
29、进一步地,所述根据所述权重系数对温度数据在孤立树中的高度进行调整,获得每个温度数据的异常得分包括:
30、将所述权重系数作为每个温度数据在对应孤立树中的高度的权值,对每个温度数据在所有孤立树中的高度进行加权求和,获得每个温度数据的调整高度;
31、基于孤立森林算法中的异常得分计算公式,根据所述调整高度获得每个温度数据的异常得分。
32、进一步地,所述根据所述异常得分检测温度数据中的异常数据包括:
33、将异常得分大于预设异常阈值的温度数据作为异常数据。
34、进一步地,所述统计每个孤立树中相同温度数据的数量,获得频率值包括:
35、将每个孤立树中每种相同温度数据的数量与对应孤立树中所有温度数据的数量的比值,作为每种相同温度数据的频率值。
36、本发明还提出了一种物联网数据的安全管理方法,所述安全管理方法包括:
37、获取智能工厂在预设时间段内的温度数据;基于孤立森林算法,对温度数据构建不同的孤立树;
38、统计每个孤立树中相同温度数据的数量,获得频率值;根据所有相同温度数据的频率值的变化,获得每个孤立树的疑似正常数据;根据所有疑似正常数据的频率值获得每个孤立树的正常程度;根据孤立树中所有的温度数据、每个温度数据在孤立树中的位置分布以及对应温度数据在孤立树中的高度,获得每个温度数据的真实程度;
39、根据每个温度数据的所述真实程度和每个孤立树的所述正常程度,获得温度数据在每个孤立树的权重系数;根据所述权重系数对温度数据在孤立树中的高度进行调整,获得每个温度数据的异常得分;根据所述异常得分检测温度数据中的异常数据;
40、将除所述异常数据之外的温度数据作为正常数据,对所有所述正常数据进行压缩,获得压缩数据;对所述压缩数据进行存储。
41、本发明具有如下有益效果:
42、本发明考虑到现有的孤立森林算法仅仅是根据数据在孤立树中高度均值检测出异常数据,容易造成对异常数据的误判,无法对异常数据进行有效的安全管理;因此本发明将温度数据在不同孤立树中的高度进行加权调整,提高对异常数据检测的准确性;由于孤立树的构建是通过随机选取温度数据进行的,不同孤立树中包含的异常数据的数量不同,因此统计每个孤立树中相同温度数据的数量,并通过获取的正常程度反映孤立树中存在正常数据的可能性,考虑到同一温度数据可能出现在不同孤立树的不同位置处,导致对该数据异常分析不准确,因此对温度数据在孤立树根的位置和高度进行分析,并结合正常程度和真实程度得到温度数据在不同孤立树的权重系数,基于权重系数对温度数据在不同孤立树中的高度进行调整,提高后续对异常数据检测的准确性,进而对正常数据进行压缩,并对得到的压缩数据进行存储,从而可实现对温度数据进行有效的安全管理。