1.本技术涉及数据分析技术领域,更具体地,涉及一种基于工业控制底层数据的数据分析方法、装置及系统。
背景技术:2.工业现场数据的数据质量是工业企业数据分析的基础和保障,它对于数据分析和挖掘非常重要。
3.当前,卷烟加工的精细化、精益化、精准化的要求不断提高,按照卷烟制造上水平的要求,对产品过程控制的过程能力指数cpk、过程性能指数ppk、西格玛(sigma)水平要求不断提高。现阶段的卷烟自动化设备,更多地是实现对稳态的指标控制,在自动化控制层,上位系统以视窗控制中心(windows control center,wincc)为主,其采样频率为6s/个,底层的plc的采样时间200ms/个,两者的对应存在数量级的差异,个别卷烟厂在面对上级检查时,为了避免“被考核”,通常技术人员会在plc层级采取“平滑”的处理方式,致使wincc采到的数据为“处理”后的数据,存在数据“失真”的风险,虽显示的指标较为优异,但因为存在数据失真,实际数据与真实数据差异较大,导致产品存在质量差异,对企业带来的损失将是巨大的。
技术实现要素:4.本技术提供一种基于工业控制底层数据的数据分析方法、装置及系统,跳过视窗控制中心,直接对底层采集数据进行分析,实时还原数据本质,真实反应实际生产情况,通过数据质量的反馈,为生产企业提质降耗、降本增效提供了真实的基础数据支撑。
5.本技术提供了一种基于工业控制底层数据的数据分析方法,包括:
6.调用工业控制现场的控制设备存储的底层数据,底层数据来自与控制设备通信的工业现场检测设备;
7.对底层数据进行数据分析,数据分析包括对底层数据进行真实性分析;
8.输出数据分析结果。
9.优选地,数据分析还包括对底层数据进行完整性分析。
10.优选地,数据分析还包括对底层数据进行及时性分析。
11.优选地,通过拟合分布对底层数据进行真实性分析。
12.优选地,对底层数据进行完整性分析,具体包括:
13.依据历史数据获得工业现场检测设备上每个检测元件对应的数采样本置信区间,数采样本置信区间上的数采样本数量为第一数采样本数量;
14.依据检测元件的实时数采数据获得第二数采样本数量;
15.若第二数采样本数量小于第一数采样本数量,则实时数采数据不满足完整性要求。
16.本技术还提供一种基于工业控制底层数据的数据分析装置,包括调用模块、分析
模块和输出模块;
17.调用模块用于调用工业控制现场的控制设备存储的底层数据,底层数据来自与控制设备通信的工业现场检测设备;
18.分析模块包括真实性分析模块,真实性分析模块用于对底层数据进行真实性分析;
19.输出模块用于输出数据分析结果。
20.优选地,分析模块还包括完整性分析模块,完整性分析模块用于对底层数据进行完整性分析。
21.优选地,分析模块还包括及时性分析模块,及时性分析模块用于对底层数据进行及时性分析。
22.优选地,完整性分析模块包括置信区间获得模块、实时数据处理模块以及判断模块;
23.置信区间获得模块用于依据历史数据获得工业现场检测设备上每个检测元件对应的数采样本置信区间,数采样本置信区间上的数采样本数量为第一数采样本数量;
24.实时数据处理模块用于依据检测元件的实时数采数据获得第二数采样本数量;
25.实时判断模块用于判断实时数采数据是否满足完整性要求。
26.本技术还提供一种基于工业控制底层数据的数据分析系统,包括工业控制现场的控制设备、工业现场检测设备以及上述的数据分析装置,控制设备分别与工业现场检测设备和数据分析装置通信连接;
27.工业现场检测设备包括多个检测单元,控制设备包括数据存储单元,数据存储单元存储检测单元采集的底层数据,数据分析装置调用数据存储单元内的底层数据并对底层数据进行数据分析并输出质量分析结果。
28.通过以下参照附图对本技术的示例性实施例的详细描述,本技术的其它特征及其优点将会变得清楚。
附图说明
29.被结合在说明书中并构成说明书的一部分的附图示出了本技术的实施例,并且连同其说明一起用于解释本技术的原理。
30.图1为本技术提供的基于工业控制底层数据的数据分析系统的结构示意图;
31.图2为图1的一个实例;
32.图3为本技术提供的基于工业控制底层数据的数据分析方法的流程图;
33.图4为本技术提供的对底层数据进行完整性分析的流程图;
34.图5为本技术提供的基于工业控制底层数据的数据分析装置的结构示意图。
具体实施方式
35.现在将参照附图来详细描述本技术的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本技术的范围。
36.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本技术
及其应用或使用的任何限制。
37.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
38.在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
39.本技术提供一种基于工业控制底层数据的数据分析方法、装置及系统,跳过视窗控制中心,直接对底层采集数据进行分析,实时还原数据本质,真实反应实际生产情况,通过数据质量的反馈,为生产企业提质降耗、降本增效提供了真实的基础数据支撑。
40.如图1所示,本技术提供的基于工业控制底层数据的数据分析系统包括工业控制现场的控制设备110、工业现场检测设备120以及数据分析装置130,控制设备110分别与工业现场检测设备120和数据分析装置130通信连接。
41.工业现场检测设备120包括多个检测单元,检测单元采集的数据形成底层数据。
42.作为一个实例,如图2所示,在卷烟生产线上,工业现场检测设备120主要包括db控制型电子秤、rb计量型电子秤、e+h流量计、mp150红外测温仪、tm710e水分检测仪等设备,用于采集卷烟加工过程的物料重量数据、物料流量数据、香料重量数据、香料流量数据、温度数据、含水率数据等。
43.可以理解地,在其他生产线上,可以根据需要安装其他的检测单元,例如压力检测器等。
44.控制设备110包括数据存储单元1101。控制设备110与各个检测单元通信,其接收各个检测单元采集的底层数据并存储在其数据存储单元1101中。
45.作为一个实施例,控制设备110为s7-300、400系列的plc控制器。如图2所示,各个检测单元以工业互联网的方式,通过rs232、rs485、profinet、profibus、profibus-dp等通讯协议与s7-317-2pn/dp型号plc控制器的各个数据块(db)通信。
46.数据分析装置130调用数据存储单元1101内的底层数据并对底层数据进行数据分析并输出质量分析结果。
47.作为一个实施例,数据分析包括真实性分析。优选地,数据还包括完整性分析和/或及时性分析。在图2所示的实例中,对底层数据做了真实性分析(对应真实性分析模块)、完整性分析(对应完整性分析模块)和及时性分析(对应及时性分析模块)。
48.基于上述数据分析系统,本技术还提供了一种基于工业控制底层数据的数据分析方法,其适用于上述的数据分析装置。如图3所示,数据分析方法包括:
49.s310:调用工业控制现场的控制设备存储的底层数据,底层数据来自与控制设备通信的工业现场检测设备。
50.s320:对底层数据进行数据分析。
51.作为一个实施例,数据分析包括对底层数据进行真实性分析。
52.作为一个实施例,通过拟合分布对底层数据进行真实性分析。具体地,通过每个检测单元的底层数据的拟合分布情况进行建模,获得每个检测单元的历史底层数据的日常分布状态。进行数据真实性判断时,对每个检测单元的实时底层数据进行拟合分布检验。若待测的实时底层数据的分布与日常分布状态存在差异(例如服从的分布类型不同),则判定待测的实时底层数据的真实性存疑。
53.作为一个实例,通过拟合优度检验发现烘丝出口水分的历史底层数据特性满足johnson变换的正态分布。对于某批次的烘丝出口水分进行拟合优度检验发现其满足威布尔(weibull)分布,与历史底层数据的分布(johnson变换的正态分布)不同,则判定该批次的烘丝出口水分数据存在失真问题。
54.优选地,数据分析还包括对底层数据进行完整性分析。作为一个实施例,通过自适应增强(adaptive boosting,adaboost)算法实现完整性分析。
55.具体地,如图4所示,对底层数据进行完整性分析,具体包括:
56.s3301:依据历史数据获得工业现场检测设备上每个检测元件对应的数采样本置信区间,数采样本置信区间上的数采样本数量为第一数采样本数量。
57.s3302:依据检测元件的实时数采数据获得第二数采样本数量。
58.s3303:依据第二数采样本数量判断实时数采数据的完整性。具体地,若第二数采样本数量小于第一数采样本数量,则判定实时数采数据不满足完整性要求。否则,判定实时数采数据满足完整性要求。
59.作为一个实例,在烟丝生产线上,来料重量为6500kg时,第一数采样本数量为[652,655]。某批次来料的电子秤重量信号为6500kg时,其实际数采点(即第二数采样本数量)为613,显然其数采点不满足[651,655]的置信区间,因此其不满足完整性要求。
[0060]
优选地,数据分析还包括对底层数据进行及时性分析。作为一个实施例,通过判断底层数据的延迟有效性来实现及时性分析。具体地,依据历史底层数据获得不同检测单元的标准数采延迟时间(t-pre)。进行数据及时性判断时,若检测单元所在数采点的实际底层数据的实际延迟时间(t-ods)超过标准数采延迟时间(t-pre)存在较大差异,则判定该底层数据不满足及时性要求。
[0061]
作为一个实例,制丝a线二次加料的标准数采延迟时间为10s,b线二次加料的标准数采延迟时间为8s,梗线加料的标准数采延迟时间为6s,d线的二次加料标准数采延迟时间为9s。若制丝a线上某批次的二次加料实际延迟时间为11s,其大于标准数采延迟时间10s,则其不满足及时性要求。
[0062]
s330:输出数据分析结果。
[0063]
基于上述数据分析方法,结合图2和图5所示,本技术提供的数据分析装置130包括调用模块1301、分析模块1302和输出模块1303。
[0064]
调用模块1301用于调用工业控制现场的控制设备存储的底层数据,底层数据来自与控制设备通信的工业现场检测设备。
[0065]
分析模块1302包括真实性分析模块13021,真实性分析模块13021用于对底层数据进行真实性分析。
[0066]
输出模块1303用于输出数据分析结果。
[0067]
优选地,分析模块1302还包括完整性分析模块13022,完整性分析模块13022用于对底层数据进行完整性分析。
[0068]
作为一个实施例,完整性分析模块13022包括置信区间获得模块、实时数据处理模块以及判断模块。
[0069]
置信区间获得模块用于依据历史数据获得工业现场检测设备上每个检测元件对应的数采样本置信区间,数采样本置信区间上的数采样本数量为第一数采样本数量。
[0070]
实时数据处理模块用于依据检测元件的实时数采数据获得第二数采样本数量。
[0071]
实时判断模块用于判断实时数采数据是否满足完整性要求。
[0072]
优选地,分析模块1302还包括及时性分析模块13023,及时性分析模块13023用于对底层数据进行及时性分析。
[0073]
本技术首次实现了工业控制底层级别的数据质量分析,通过直接访问控制设备内与各检测单元对应的数据块,对检测单元的底层数据进行数据质量分析,获得真实性、完整性和/或及时性的分析结果,此过程自动完成,无需人员参与,可真实反馈卷烟厂实际加工的数据质量情况,解决了数据失真带来的风险,为企业带来更大的效益打下了坚实基础。
[0074]
虽然已经通过例子对本技术的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本技术的范围。本领域的技术人员应该理解,可在不脱离本技术的范围和精神的情况下,对以上实施例进行修改。本技术的范围由所附权利要求来限定。