本发明涉及计算机领域,具体是涉及一种用于工业数据全生命周期流转的编码识别方法及系统。
背景技术:
1、数据生命周期是指某一类数据从产生到销毁的过程。工业数据全生命周期分为:数据采集、数据存储、数据处理、数据更新、数据传输和数据销毁这几个阶段。数据采集是指从各种传感器、设备或系统中收集数据,这些数据可以是温度、压力、湿度、振动等各种传感器数据,也可以是生产线状态、设备运行时间等;数据传输是指将采集到的数据传输到数据存储或处理系统;数据存储是指安全地保存数据,并使其能够被后续访问和分析;数据处理是指对数据进行各种分析和挖掘操作,以从数据中提取洞察和知识;数据更新是指对依据工业数据的动态变换,对存储中的数据进行更新和迭代;数据销毁是指通过对数据及数据的存储介质通过相应的操作手段,使数据彻底消失并且无法通过任何手段恢复的过程。
2、工业数据在进行全生命周期流转的过程中,由于工业数据量大,复杂度高,会出现数据格式不统一、存储设备容量不足、敏感信息泄露等问题,因此亟需一种改进技术和方法,以适应工业数据的特点和需求。
技术实现思路
1、为解决上述技术问题,提供一种用于工业数据全生命周期流转的编码识别方法,本技术方案解决了上述背景技术中提出的由于工业数据量大,复杂度高,会出现数据格式不统一、存储设备容量不足、敏感信息泄露等问题。
2、为达到以上目的,本发明采用的技术方案为:
3、一种用于工业数据全生命周期流转的编码识别方法,包括:
4、在工业数据采集阶段,对工业数据进行分维度和分级,对不同维度不同级别的工业数据按照预设规则对所采集的数据维度和级别进行独热编码,形成标签码,对所采集的数据的具体内容进行json编码,生成核心编码;
5、在工业数据传输阶段,对工业数据使用非对称加密算法进行加密,并对需要访问的用户使用同样算法生成私钥,对级别高的工业数据,创建多重签名方案,需要指定用户签名数量的授权才能访问;
6、在工业数据存储阶段,对工业数据的标签码进行识别,根据识别内容,将工业数据进行分类存储;
7、在工业数据更新阶段,对更新的工业数据进行更新时间编码,附加更新时间戳;
8、在工业数据销毁阶段,发出灭活指令,对所需销毁的工业数据的标签码、核心编码、公钥私钥和时间戳进行删除。
9、优选的,所述对工业数据进行分维度和分级包括:工业数据分类维度基于研发数据域、生产数据域、运维数据域、管理数据域和外部数据域五个已定的一类维度,根据工业数据的特征继续分成若干个维度,工业数据分类级别根据遭篡改、破坏、泄露或非法利用后,对工业生产、经济效益等带来的影响程度从小到大进行分级。
10、优选的,所述对不同维度不同级别的工业数据按照预设规则对所采集的数据的维度和级别进行独热编码包括:
11、基于工业数据的分类维度和分类级别,创建数据集,导入编码库中;
12、获取所采集的工业数据的维度和级别,对所采集的工业数据的维度和级别进行独热编码,得到若干个维度码和一个级别码;
13、所述维度码和级别码按照预设规则进行排列,构成所采集的工业数据的标签码。
14、优选的,所述对工业数据使用非对称加密算法进行加密,并对所需要访问的用户使用同样算法生成私钥具体包括:
15、对工业数据使用非对称加密算法进行加密,生成一个公钥和私钥参数;
16、将公钥分发给每个需要访问的用户和实体;
17、基于私钥参数,对每一个需要访问的用户使用所述非对称加密算法生成一个私钥。
18、优选的,所述对级别高的工业数据,创建多重签名方法,需要指定用户签名数量的授权才能访问具体包括:
19、预设级别划分规则,定义每个级别的工业数据的访问方法;
20、所述访问方法包括但不限于根据级别从低到高,所加密的工业数据的签名授权数量从无到多进行演变;
21、所述签名授权是指具有所述非对称加密算法生成的私钥的用户对需要进行访问验证的工业数据使用所述私钥进行授权。
22、优选的,所述根据识别内容,将工业数据进行分类存储还包括:
23、所述工业数据存储采用数据库与分布式文件系统组合的方式;
24、对所需存储的工业数据进行识别,判断是否为结构化数据,对结构化数据和半结构化数据使用数据库进行存储,对非结构化数据使用分布式文件系统进行存储;
25、识别所需存储的工业数据的标签码,将所述工业数据存储到对应的数据库或分布式文件系统的节点上。
26、优选的,所述对更新的工业数据进行更新时间编码,附加更新时间戳包括:
27、使用编程语言的时间函数,获取当前工业数据更新的unix时间戳;
28、保留每次更新的unix时间戳,根据时间先后顺序进行排列。
29、进一步的,提出一种用于工业数据全生命周期流转的编码识别系统,用于实现上述用于工业数据全生命周期流转的编码识别系统,其特征在于,包括:
30、数据拦截模块,所述数据拦截模块用于实时拦截正在进行生命周期流转的工业数据;
31、数据分类模块,数据分类模块与所述数据拦截模块电性连接,所述数据分类模块用于对工业数据进行分维度和分级;
32、数据编码模块,数据编码模块与所述数据拦截模块、数据分类模块电性连接,所述数据编码模块用于在不同的环境和条件下,使用不同的算法对工业数据进行编码;
33、数据识别模块,数据识别模块与所述数据编码模块电性连接,所述数据识别模块用于读取标签码、核心编码和时间戳;
34、数据加密模块,数据加密模块与所述数据编码模块、数据识别模块、数据拦截模块电性连接,所述数据加密模块与所述用于对不同级别的工业数据进行加密;
35、数据定位模块,数据定位模块与所述数据拦截模块、数据识别模块电性连接,所述数据定位模块用于对数据库和分布式文件系统进行定位;
36、数据销毁模块,数据销毁模块与所述数据拦截模块电性连接,所述数据销毁模块用于生成灭活指令,对所需销毁的工业数据的标签码、核心编码、公钥私钥和时间戳进行删除。
37、可选的,所述数据分类模块包括:
38、用已知维度和级别的数据进行训练,得到训练好的决策树;
39、根据训练好的决策树,对所采集的工业数据进行分类。
40、可选的,所述数据编码模块包括:
41、标签编码单元,所述标签编码单元内含独热编码算法,用于获取数据分类模块的分类结果,对分类结果进行编码,生成标签码;
42、核心编码单元,所述核心编码单元内含json编码算法,用于获取所采集的工业数据的具体数据内容,对所述具体数据内容进行编码,生成核心编码内容;
43、时间编码单元,所述时间编码单元内含时间函数,用于获取所需更新的工业数据的更新时间,生成unix时间戳。
44、与现有技术相比,本发明的有益效果在于:
45、本方案通过对工业数据进行标签编码,将工业数据进行分类存储,提高了数据的访问效率;通过对工业数据进行核心内容编码,降低了存储成本;通过对工业数据进行时间编码,提供了数据一致性、追溯性、排序和过滤的能力,同时也有助于缓存和性能优化;本方案还对级别高的工业数据,提供一种加密方法,防止敏感信息遭到泄露。