本申请涉及计算机领域,尤其涉及一种评估废水监测数据质量的方法及设备。
背景技术:
目前的工业园区,大多由多个分散的企业组成,而每个企业都会产生各种工业废水,则会存在不同的企业排出的废水中含有的污染因子是不同的。再者,工业废水主要含有两个来源:一是集成电路器件电镀产生的电镀废水,包括电镀废液及电镀清洗废水,污染物指标主要体现在酸碱和金属铜离子;二是集成电路器件电镀工序前处理和电镀工序废气处理,污染物体现在酸碱和磷酸盐。这些污染必须经过投加化学反应药剂,与废水进行混凝反应,将废水中的污染物从废水中分离出来,达到净化目的,最后进入到排污管道。
为了保证通过排污管道排除的水符合规定,故需要对排除的废水进行取样监测,通常在排污管道的排污口前加装废水取样装置进行实时废水采样,并对实时取样的废水进行污染物分析,得到废水监测数据。由于大多数企业为了避免对废水进行净化处理,故会对本来没有净化合格的废水进行人为干预或者采用智能机器干预,使得监测到排出废水的废水监测数据能够符合规定,导致真正具有污染因子的达不到标准排除的废水会被排除,对生态环境造成污染,故如何监测出企业的废水监测数据是否作假为业界研究的主要课题。
技术实现要素:
本申请的一个目的是提供一种评估废水监测数据质量的方法及设备,以解决现有技术中的企业废水中的废水监测数据存在作假或监测仪器故障而导致的数据不真实性的问题。
根据本申请的一个方面,提供了一种评估废水监测数据质量的方法,该方法包括:
预置废水监测数据的至少一个质量评估特征,其中,所述质量评估特征包括监测频次特征、稳定性特征、陡峰值特征、日内监测值变动频次特征、日间监测值变动频次特征、随机数特征、视频监控流量特征及视频监控入侵特征;
获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,并对所述废水监测数据的各质量评估特征对应的特征值进行计算,得到所述废水监测数据的各质量评估特征的权重;
基于所述废水监测数据的各质量评估特征对应的特征值和权重,得到所述废水监测数据的质量评估值。
进一步地,上述方法中,所述获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,包括:
选取一个目标月,并在所述目标月内获取企业工作时产生的企业废水每日对应的废水监测数据和监测天数;
分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值;
基于所述监测天数和每日对应的废水监测数据的各质量评估特征对应的特征值,得到所述目标月对应的废水监测数据的各质量评估特征对应的特征值;
将所述目标月对应的所述废水监测数据的各质量评估特征对应的特征值,确定为所述废水监测数据的各质量评估特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的质量评估特征对应的特征值,包括:
获取每日对应的废水监测数据的日监测频次;
将每日对应的废水监测数据的日监测频次与对应的预设的日监测频次阈值进行比对,得到每日对应的废水监测数据的监测频次特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的质量评估特征对应的特征值,包括:获取每日对应的废水监测数据的监测值;
将每日对应的废水监测数据的监测值与对应的预设的监测值阈值进行比对,得到每日对应的废水监测数据的稳定性特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:
基于离群点算法对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据中的离群点的个数;
基于所述离群点的个数确定每日对应的废水监测数据的陡峰值特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:
按照预设的时间间隔获取每日内的废水监测数据的监测值,计算相邻两个所述预设的时间间隔获取的所述监测值的差值,并确定所述差值的个数及所述差值为零的个数;
基于所述差值的个数及所述差值为零的个数,得到每日对应的废水监测数据的日内监测值变动频次特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:按照预设的时间间隔获取每日内的废水监测数据的监测值,对所述监测值取平均得到每日内的废水监测数据的监测平均值,并确定每日内的废水监测数据的监测最大值;
将每日内的废水监测数据的监测最大值与监测平均值的比值作为每日内的废水监测数据的标准化最大值;
将相邻两天的所述标准化最大值进行比较,得到比较结果;
计算所述比较结果与所述相邻两天中的第一天对应的所述标准化最大值之间的变化率比值;
基于所述变化率比值和对应的预设的变化率阈值,确定每日对应的废水监测数据的日间监测值变动频次特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:选取所述目标月中的目标周,在所述目标周内按照所述预设的时间间隔获取每日内的废水监测数据的监测值;
基于随机数检测算法对所述目标周内获取的所有所述监测值进行随机数检测,得到随机数检测结果;
基于所述随机数检测结果确定所述目标周内的每日对应的废水监测数据的随机数特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:
获取企业废水的排口处每日的排污监测视频,对所述排污监测视频进行分析得到视频分析结果,并按照时间顺序将视频分析结果与对应的所述废水监测数据进行匹配,得到匹配结果;
基于所述匹配结果得到每日对应的废水监测数据的视频监控流量特征对应的特征值。
进一步地,上述方法中,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:获取企业废水的排口处每日的排污监测视频,重复如下步骤,直至得到每日对应的废水监测数据的视频监控入侵特征对应的特征值:
遍历判断所述排污监测视频中是否有人员进入;
若是,则所述排污监测视频对应的目标日内确定所述人员进入时的时间点;
在所述目标日内,计算所述时间点之前的废水监测数据的第一监测均值和所述时间点之后的废水监测数据的第二监测均值;
若所述第一监测均值和所述第二监测均值满足预设的确定条件,则确定所述目标日对应的废水监测数据的视频监控入侵特征对应的特征值,其中,所述预设的确定条件包括:
mean1-mean2)/mean1>=a,且0≤a≤1;
其中,所述mean1为所述第一监测均值,所述mean2为所述第二监测均值,所述a为监测均值波动阈值。
进一步地,上述方法中,所述质量评估特征还包括:相关性特征,则所述获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,包括:
获取企业的每种能耗量数据对应的月耗量向量及对应的所述废水监测数据的月监测数据向量;
分别两两计算每种所述月耗量向量与对应的所述废水监测数据的月监测数据向量的相关性,得到所述企业的每种能耗量数据与所述废水监测数据之间的相关系数;
从所有所述相关系数中选出最大值,并将最大值对应的相关系数确定为所述废水监测数据的相关性特征对应的特征值。
根据本申请的另一方面,还提供了一种评估废水监测数据质量的设备,其中,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如上述方法的操作。
与现有技术相比,本申请通过在对企业废水对应的废水监测数据进行质量进行评估之前,预置废水监测数据的至少一个质量评估特征及其对应的权重;获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值;基于所述废水监测数据的各质量评估特征对应的特征值和权重,得到所述废水监测数据的质量评估值,实现了对企业废水的废水监测数据进行质量评估,以便监管人员可以通过计算得到的废水监测数据的质量评估值,来判断该企业排出的企业废水的废水监测数据是否真实有效,进而能够监督企业将排出的废水进行排污标准处理才排放,避免作假的废水监测数据对应的企业废水被排放出去,进而影响生态环境。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出本申请一个方面的一种评估废水监测数据质量的方法流程示意图;
图2示出根据本申请一个方面的一种评估废水监测数据质量的方法的一实施例中的企业f最近一年的每种能耗量数据与对应的所述废水监测数据之间的相关系数矩阵corxy;
图3示出根据本申请一个方面的一种评估废水监测数据质量的方法的计算流程。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
图1示出本申请一个方面的一种评估废水监测数据质量的方法,该方法应用于政府或废水排放监管部门或监管人员中的网络设备端,其中,该方法包括:步骤s11、步骤s12和步骤s13,具体步骤如下:
当需要对企业废水的废水监测数据进行真实性的质量评估之前,所述步骤s11预置废水监测数据的至少一个质量评估特征;所述步骤s12获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,并对所述废水监测数据的各质量评估特征对应的特征值进行计算,得到所述废水监测数据的各质量评估特征的权重;所述步骤s13基于所述废水监测数据的各质量评估特征对应的特征值和权重,得到所述废水监测数据的质量评估值,实现了对企业废水的废水监测数据进行质量评估,以便监管人员可以通过计算得到的废水监测数据的质量评估值,来判断该企业排出的企业废水的废水监测数据是否具真实有效,进而能够监督企业将排出的废水进行排污标准处理才排放,避免作假的废水监测数据对应的企业废水被排放出去,进而影响生态环境。
在此,所述废水监测数据可以是包括但不限于包括:废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等,其中,所述废水污染因子浓度可以包括cod(chemicaloxygendemand,化学耗氧量)、氨氮、总磷及硫化物等。
本申请一实施例中,需要对至少一个企业的废水排放的废水监测数据进行真实性的判断,则首先需要构建废水监测数据的质量评估模型,其中所述质量评估模型中需要构建的参数为废水监测数据对应的质量评估特征,所述质量评估特征可以包括:监测频次特征、稳定性特征、陡峰值特征、日内监测值变动频次特征、日间监测值变动频次特征、随机数特征、视频监控流量特征、视频监控入侵特征及相关性特征。为了对至少一个企业的废水排放的废水监测数据进行归一化比较,故先预置废水监测数据的至少一个质量评估特征,并从至少一个质量评估特征的维度来对所有企业的废水监测数据进行质量评估。
接着本申请的上述实施例,所述步骤s12若获取企业f的企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,分别为监测频次特征对应的特征值为c1、稳定性特征对应的特征值为c2、陡峰值特征对应的特征值为c3、日内监测值变动频次特征对应的特征值为c4、日间监测值变动频次特征对应的特征值为c5、随机数特征对应的特征值为c6、视频监控流量特征对应的特征值为c7、视频监控入侵特征对应的特征值c8为及相关性特征对应的特征值为c9,实现对所述废水监测数据的各质量评估特征的特征值的计算。
在得到企业的废水监测数据对应的各质量评估特征对应的特征值之后,所述步骤s12采用熵权法来对一个或多个企业的废水监测数据对应的各质量评估特征对应的特征值进行分析,计算得到预置的各质量评估特征的权重(weight),例如,通过熵权法计算得到的监测频次特征的权重为w1、稳定性特征的权重为w2、陡峰值特征的权重为w3、日内监测值变动频次特征的权重为w4、日间监测值变动频次特征的权重为w5、随机数特征的权重为w6、视频监控流量特征的权重为w7、视频监控入侵特征的权重为w8及相关性特征的权重为w9。其中,w1+w2+w3+w4+w5+w6+w7+w8+w9=1,实现了通过熵权法来确定质量评估特征对应的权重,以根据该归一化的权重来计算得到各个企业的废水监测数据的质量评估值。
接着所述步骤s13根据各个特征值及其对应的权重计算该企业f的企业废水的废水监测数据的质量评估值vf如下式:vf=c1*w1+c2*w2+c3*w3+c4*w4+c5*w5+c6*w6+c7*w7+c8*w8+c9*w9;
通过上述质量评估值vf的计算公式可以得出企业f的企业废水的废水监测数据的质量评估值,实现了对企业废水的废水监测数据进行质量评估。若该企业f对应的质量评估值vf越高,则越说明获取的企业f的企业废水对应的废水监测数据越接近于实际的废水监测数据,越说明该企业f的废水监测数据被人为干预的几率越低,更具有真实性,进而能够保证真实的废水监测数据对应的企业废水达到排污标准,没有进行人为作假。若该企业f对应的质量评估值vf越低,则说明人为干预或者机器干预了企业f的企业废水的监测,使得废水监测数据不真实,影响政府或监管部分及监管人员对企业f的企业废水的真实性监测。
进一步地,所述步骤s12获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,包括:
选取一个目标月,并在所述目标月内获取企业工作时产生的企业废水每日对应的废水监测数据和监测天数;
分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值;
基于所述监测天数和每日对应的废水监测数据的各质量评估特征对应的特征值,得到所述目标月对应的废水监测数据的各质量评估特征对应的特征值;
将所述目标月对应的所述废水监测数据的各质量评估特征对应的特征值,确定为所述废水监测数据的各质量评估特征对应的特征值。
接着本申请的上述实施例,所述步骤s12中,若需要对企业f中的某一个月的废水监测数据进行分析,则确定选取的目标月m,并在该目标月m内获取企业f工作时产生的企业废水每日对应的废水监测数据和监测天数;若在目标月m中企业工作了20天,则企业废水的监测天数d为20,且还获取了企业工作时的每日对应的废水监测数据,即分别有20天的废水监测数据,例如企业工作的第一日的废水监测数据为data1(包含废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等),企业工作的第二日的废水监测数据为data2,……,企业工作的第二十日的废水监测数据为data20。
接着,分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,其中,每日对应的废水监测数据的各质量评估特征对应的特征值为二进制值,分别为0或1;例如若是对企业工作的第二日的废水监测数据为data2进行质量评估,则得到企业工作的第二日对应的废水监测数据的监测频次特征对应的特征值为d2c1=1、稳定性特征对应的特征值为d2c2=1、陡峰值特征对应的特征值为d2c3=0、日内监测值变动频次特征对应的特征值为d2c4=1、日间监测值变动频次特征对应的特征值为d2c5=1、随机数特征对应的特征值为d2c6=1、视频监控流量特征对应的特征值为d2c7=0、视频监控入侵特征对应的特征值d2c8=1,在此企业工作的20日内的其他日的废水监测数据的质量评估特征对应的特征值的质量评估方式和特征值的二进制形式与企业工作第二日的过程一致,在此不再赘述。
在计算得到企业f工作20日内的每日对应的废水监测数据的质量评估特征对应的特征值,则可以计算得到该目标月m对应的废水监测数据的质量评估特征对应的特征值,例如在企业m工作的20日内,若需要得到该目标月m对应的废水监测数据的监测频次特征对应的特征值mc1,则首先统计企业m工作的20日内每日对应的废水监测数据的监测频次特征对应的特征值,依次分别为d1c1、d2c1、……、d20c1,并统计所有的特征值中的特征值为1的个数d,则该目标月m对应的废水监测数据的监测频次特征对应的特征值mc1为:mc1=d/d;其中,d=20,若d=18,则该目标月m对应的废水监测数据的监测频次特征对应的特征值mc1为18/20=0.9;之后,所述步骤s12将所述目标月m对应的所述废水监测数据的监测频次特征对应的特征值mc1,确定为企业f的所述废水监测数据的监测频次特征对应的特征值,即企业f的废水监测数据的监测频次特征对应的特征值为mc1;在此,分别计算企业f的废水监测数据对应的稳定性特征、陡峰值特征、日内监测值变动频次特征、日间监测值变动频次特征、随机数特征、视频监控流量特征及视频监控入侵特征分别对应的特征值mc2、mc3、mc4、mc5、mc6、mc7及mc8的计算方法,与计算该企业f的废水监测数据的监测频次特征对应的特征值为mc1的计算方法一致,在此不再赘述;进而实现了通过对企业f的工作日内的每日对应的废水监测数据进行质量评估,进而得到企业f的所述废水监测数据的各质量评估特征对应的特征值。
接着本申请的上述实施例,所述步骤s12通过以下三个方面对企业废水的废水监测数据进行质量评估,分别为:合规性质量评估、时间序列分析、大数据校验。下面分别从合规性质量评估、时间序列分析、大数据校验三个方面对所述步骤s12进行举例说明。
一方面,考虑到国家规定的对企业废水的排放标准,需要对企业废水的废水监测数据进行评估,以监测企业对企业废水的废水排放情况、废水监测方式及企业废水中的废水污染因子浓度量等是否符合国家有关废水排放规范,故所述步骤s12中的分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的各质量评估特征对应的特征值,包括:
分别对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据的监测频次特征、稳定性特征及陡峰值特征分别对应的特征值。可见,分别对企业f的企业废水的监测过程中获取的每日对应的废水监测数据进行合规性质量评估从三个维度进行质量评估,这三个维度分别为监测频次评估、稳定性评估及陡峰值评估,即对企业f在监测过程中获取的企业每日对应的废水监测数据进行上述三个维度的合规性评估之后,可以分别得到每日对应的废水监测数据的监测频次特征、稳定性特征及陡峰值特征分别对应的特征值,以便监管人员通过该特征值能够了解到企业f的企业废水的废水监测数据是否符合国家有关废水排放规范且是否符合真实性,以监督企业对废水监测数据的如实上报至政府、监管部门及监管人员。
接着本申请的上述实施例,在国家有关废水排放规范中,企业的工作生产周期在8小时以内的,需要至少1-2小时采样一次企业废水,并记录每次的废水监测数据;若工作生产周期大于8小时的,需至少每2-4小时采样一次企业废水,并记录每次的废水监测数据,由于现实中的一些企业不遵守国家对废水排放的采样周期的规定,为了节省成本,减少了监测频次,故本申请在所述步骤s12中的分别对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据的监测频次特征对应的特征值,包括:
获取每日对应的废水监测数据的日监测频次;
将每日对应的废水监测数据的日监测频次与对应的预设的日监测频次阈值进行比对,得到每日对应的废水监测数据的监测频次特征对应的特征值。
例如,所述企业f每日对应的废水监测数据对应的预设的日监测频次阈值可以是正整数,其中,本申请优选该正整数为6,在企业f工作的时候,统计企业f工作时的每天对应的废水监测数据(包含废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等)的监测频次,若每日对应的废水监测数据的日监测频次小于等于对应的预设的日监测频次阈值,则说明企业f没有达到国际按规定的对废水进行监测的频次;例如,若废水污染因子浓度每日的监测频次为8,由于废水污染因子浓度每日的监测频次为8大于对应的预设的日监测频次阈值6,则说明监测频次为8对应的当日对废水的监测符合规定,则采样的当日标记为1,进而得到每日对应的废水监测数据的监测频次特征对应的特征值为1;当然,若废水污染因子浓度每日的监测频次为4小于对应的预设的日监测频次阈值6的话,则说明对废水的监测不符合规定,则将采样的当日标记为0,进而得到每日对应的废水监测数据的监测频次特征对应的特征值为0,实现对企业f工作的每一天的废水进行废水监测数据进行的监测频次评估。
接着本申请的上述实施例,在国家有关废水排放规范中,当企业不停产的情况下,监测仪器必须24小时开机并回传废水监测数据,为了保证为企业废水的实时监测,故在企业不停产的情况下不允许监测仪器出现宕机,当监测仪器不运转时,表现为回传的废水监测数据为零,故为了保证对企业的废水监测数据进行真实性评估,故所述步骤s12中的分别对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据的稳定性特征对应的特征值,包括:
获取每日对应的废水监测数据的监测值;
将每日对应的废水监测数据的监测值与对应的预设的监测值阈值进行比对,得到每日对应的废水监测数据的稳定性特征对应的特征值。
例如,由于企业在不停产的情况下,企业产生的废水不会为零,进而对企业废水进行监测的废水监测数据不存在零,故将每日对应的废水监测数据的预设的监测值阈值优选为0,将每日对应的废水监测数据的监测值与对应的预设的监测值阈值0进行比对,若每日对应的废水监测数据的监测值出现零值的话,则说明人为或机器对废水监测数据进行干预,则将出现零值对应的采样日标记为0,即出现零值对应的采样日对应的废水监测数据的稳定性特征对应的特征值为0;若每日对应的废水监测数据的监测值不是零值的话,则说明废水监测数据具有真实性,则将不是零值对应的采样日标记为1,即不是零值对应的采样日对应的废水监测数据的稳定性特征对应的特征值为1,以通过标记的0或1来表征每日对应的废水监测数据的稳定性特征对应的特征值,实现对废水监测数据的稳定性评估。
接着本申请的上述实施例,在国家有关废水排放规范中,根据废水性质,例如废水污染因子浓度等不应该出现陡峰情况,废水指标应该是渐变的。如果出现峰值,很有可能是企业人员发现排放的企业废水超标,立刻对废水监测数据进行人为干预以降低污染因子浓度等的废水监测数据。为了避免上述人为干预的情况,故需对废水监测数据进行陡峰值评估,则所述步骤s12中的分别对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据的陡峰值特征对应的特征值,包括:
基于离群点算法对每日对应的废水监测数据进行合规性质量评估,得到每日对应的废水监测数据中的离群点的个数;
基于所述离群点的个数确定每日对应的废水监测数据的陡峰值特征对应的特征值。
在此,所述离群点算法可以是包括但不限于包括正态分布的一元离群点监测算法,其他离群点算法如可适用于本申请,则应含在本申请内。例如通过优选的离群点算法:正态分布的一元离群点监测算法对每日对应的废水监测数据进行合规性质量评估,监测出每日对应的废水监测数据中的离群点,进而得到每日对应的废水监测数据中的离群点的个数,若所述离群点的个数唯一且超出废水监测数据的废水超标状态数据,则将具有所述离群点的个数唯一时对应的采样日标记为0,否则标记为1,即若所述离群点的个数唯一且超出废水监测数据的废水超标状态数据,则具有所述离群点的个数唯一时对应的采样日对应的废水监测数据的陡峰值特征对应的特征值为0,依此类推,进而得到每日对应的废水监测数据的陡峰值特征对应的特征值,实现对企业的废水监测数据进行陡峰值评估,以保证获取的废水监测数据符合国家有关废水排放规定。
另一方面,由于企业的企业废水中,废水监测数据(包含废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等)中的废水污染因子浓度是一列随时间变化而变化的数据,统计上称之为时间序列。通过一系列时间序列分析,我们可以判断出废水污染因子浓度有没有人为作假或机器故障的情况发生。废水监测中经常会出现仪器故障或由于人为干预,导致测量得到的废水污染因子浓度长时间不变或在某一值附近随机波动,再或者人为设定量程上限,让测量得到的废水污染因子浓度永远在某一范围内波动,故所述步骤s12中的分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的质量评估特征对应的特征值,包括:分别对每日对应的废水监测数据进行时间序列评估,得到每日对应的废水监测数据的日内监测值变动频次特征、日间监测值变动频次特征、随机数特征分别对应的特征值,以实现对企业中每日产生的企业废水的废水监测数据进行时间序列评估,以辨别获取的废水监测数据的真实性,避免了仪器故障或由于人为干预,导致测量得到的废水监测数据的失真。
接着本申请的上述实施例,由于对企业废水的测量中经常会出现废水污染因子浓度长时间不变,原因有可能是测量仪器出现故障,所以一直回传最后获取的废水污染因子浓度这一条数据,为了避免该种情况,上述步骤s12中的分别对每日对应的废水监测数据进行时间序列评估,得到每日对应的废水监测数据的日内监测值变动频次特征对应的特征值,包括:
按照预设的时间间隔获取每日内的废水监测数据的监测值,计算相邻两个所述预设的时间间隔获取的所述监测值的差值,并确定所述差值的个数及所述差值为零的个数;
基于所述差值的个数及所述差值为零的个数,得到每日对应的废水监测数据的日内监测值变动频次特征对应的特征值。
例如,所述步骤s12按照预设的时间间隔(例如该事件间隔可以是0-24小时的任何时间间隔,本申请的实施例优选时间间隔为1小时)获取每日内的每小时对应的废水监测数据(包含废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等)的监测值,当废水流量数据不为零的时候,计算出相邻两个所述预设的时间间隔(例如时间间隔为1小时)获取的所述监测值的差值,即计算出相邻两小时的废水监测数据(例如废水污染因子浓度等)的监测值的差值,并统计每日内的该差值的个数,并确定出每日内的该差值为零的个数;接着基于每日内的该差值的个数及该差值为零的个数,得到每日对应的废水监测数据的日内监测值变动频次特征对应的特征值,例如当每日内的该差值为零的个数与该差值的个数之比大于等于预设的差值阈值(例如,该预设的差值阈值可以为0-1中的任何小数,本申请优选为0.9),则将采样当日的日内监测值变动频次特征对应的特征值标记为0,若当每日内的该差值为零的个数与该差值的个数之比小于预设的差值阈值,则将采样当日的日内监测值变动频次特征对应的特征值标记为1,实现对按照预设的时间间隔获取每日内的废水监测数据的监测值进行日内监测值变动频次的评估。
接着本申请的上述实施例,由于对企业废水的测量中有些企业给废水污染因子浓度设定量程,使其一直在某一范围内浮动,以保证永远不超标,为了避免此种人为或机器的干预,所述步骤s12中的分别对每日对应的废水监测数据进行时间序列评估,得到每日对应的废水监测数据的日间监测值变动频次特征对应的特征值,包括:
按照预设的时间间隔获取每日内的废水监测数据的监测值,对所述监测值取平均得到每日内的废水监测数据的监测平均值,并确定每日内的废水监测数据的监测最大值;
将每日内的废水监测数据的监测最大值与监测平均值的比值作为每日内的废水监测数据的标准化最大值;
将相邻两天的所述标准化最大值进行比较,得到比较结果;
计算所述比较结果与所述相邻两天中的第一天对应的所述标准化最大值之间的变化率比值;
基于所述变化率比值和对应的预设的变化率阈值,确定每日对应的废水监测数据的日间监测值变动频次特征对应的特征值。
例如,所述步骤s12按照预设的时间间隔(例如时间间隔为1小时)获取每日内的废水监测数据的监测值,对所述监测值取平均得到每日内的废水监测数据(例如废水污染因子浓度等)的监测平均值meant,其中t代表按照时间顺序的工作日,即工作的第t日,并从每日的所有的监测值中选择出废水监测数据(例如废水污染因子浓度等)的监测最大值maxt,接着将每日内的废水监测数据的监测最大值maxt与监测平均值maxt的比值作为每日内的废水监测数据的标准化最大值smaxt=maxt/meant,并将相邻两天的标准化最大值进行比较,例如将标准化最大值smaxt和前一天的smaxt-1相比较,得到比较结果|smaxt-smaxt-1|/smaxt-1,接着将比较结果与对应的预设的变化率阈值(可以包括0-1之间的任何小数,本申请的实施例中优选为0.01)进行判断,如果|smaxt-smaxt-1|/smaxt-1≤0.01,则采样日t对应的废水监测数据的日间监测值变动频次特征对应的特征值被标记为0,否则特征值被标记为1,实现对企业日与日之间的测量值变动率的评估。
接着本申请的上述实施例,由于对企业废水的测量中有些企业用机器随机生成的随机数替代实际测量值,为了避免此种情况,所述步骤s12中的分别对每日对应的废水监测数据进行时间序列评估,得到每日对应的废水监测数据的随机数特征对应的特征值,包括:
选取所述目标月中的目标周,在所述目标周内按照所述预设的时间间隔获取每日内的废水监测数据的监测值;
基于随机数检测算法对所述目标周内获取的所有所述监测值进行随机数检测,得到随机数检测结果;
基于所述随机数检测结果确定所述目标周内的每日对应的废水监测数据的随机数特征对应的特征值。
例如,选取所述目标月m中的目标周week,在所述目标周week内按照所述预设的时间间隔(例如时间间隔为五分钟、半小时及实时获取等)的时间序列获取每日内的废水监测数据(例如废水污染因子浓度等)的监测值,并基于随机数检测算法(可以包括但不限于是box-ljungtest随机数据数检测算法等)对所述目标周内获取的所有所述监测值进行随机数检测,得到随机数检测结果,分别为是或者否,若所述随机数检测结果为是,则所述目标周week内的每日对应的废水监测数据的随机数特征对应的特征值均确定为0,若所述随机数检测结果为否,则所述目标周week内的每日对应的废水监测数据的随机数特征对应的特征值均确定为1,以排除获取的企业废水的废水监测数据(例如废水污染因子浓度等)为随机数的可能性。
接着本申请的上述实施例,由于对企业废水的测量中某些企业会人为地干预企业废水的废水监测数据的实际测量值,为了避免此种情况,所述步骤s12中的分别对每日对应的废水监测数据进行质量评估,得到每日对应的废水监测数据的质量评估特征对应的特征值,包括:
分别对每日对应的废水监测数据进行大数据校验,得到每日对应的废水监测数据的视频监控流量特征和视频监控入侵特征分别对应的特征值。
例如,所述步骤s12利用多维度多种类的大数据对企业每日对应的废水监测数据(可以包含废水流量数据、废水超标状态数据、废水超标上限数据及废水污染因子浓度等)进行交叉大数据校验,得到每日对应的废水监测数据的两个维度的特征值,分别为视频监控流量特征和视频监控入侵特征分别对应的特征值,进而通过该特征值能够判断出该废水监测数据是否人为造假,以防止实际对企业废水进行监测的废水监测数据的人为数据造假。
接着本申请的上述实施例,从视频监控流量出发,所述步骤s12中的分别对每日对应的废水监测数据进行大数据校验,得到每日对应的废水监测数据的视频监控流量特征对应的特征值,包括:
获取企业废水的排口处每日的排污监测视频,对所述排污监测视频进行分析得到视频分析结果,并按照时间顺序将视频分析结果与对应的所述废水监测数据进行匹配,得到匹配结果;
基于所述匹配结果得到每日对应的废水监测数据的视频监控流量特征对应的特征值。
例如,获取企业废水的排口处的每日的排污监测视频,并利用视频分析技术对所述排污监测视频进行分析得到视频的分析结果(例如,排污监测视频中的各个时间点对应的废水流量数据等),之后按照时间顺序将视频分析结果与对应的废水监测数据(例如废水流量数据等)进行匹配(例如将排污监测视频中的时间点t分析出的废水流量数据与实际监测仪器在时间点t采样的废水流量数据进行匹配),得到匹配结果;其中所述匹配结果为完全匹配或不匹配;若所述匹配结果完全匹配,则说明实际采样的废水监测数据与排污监测视频分析出的废水监测数据比对一致,则采样日对应的废水监测数据例如废水流量数据等)的视频监控流量特征对应的特征值为1,若匹配结果为不匹配,则说明实际采样的废水监测数据与排污监测视频分析出的废水监测数据比对不一致,则采样日对应的废水监测数据的视频监控流量特征对应的特征值为0,实现对企业废水的监测过程中的排污监测视频与对应的废水监测数据的交叉数据分析,以判断出获取的废水监测数据例如废水流量数据等)的真实性。
接着本申请的上述实施例,从是否存在人为入侵企业废水的排口处的视频监控出发,所述步骤s12中的分别对每日对应的废水监测数据进行大数据校验,得到每日对应的废水监测数据的视频监控入侵特征对应的特征值,包括:
获取企业废水的排口处每日的排污监测视频,重复如下步骤,直至得到每日对应的废水监测数据的视频监控入侵特征对应的特征值:
遍历判断所述排污监测视频中是否有人员进入;
若是,则在所述排污监测视频对应的目标日内确定所述人员进入时的时间点;
在所述目标日内,计算所述时间点之前的废水监测数据的第一监测均值和所述时间点之后的废水监测数据的第二监测均值;
若所述第一监测均值和所述第二监测均值满足预设的确定条件,则确定所述目标日对应的废水监测数据的视频监控入侵特征对应的特征值。
例如,遍历判断获取的目标月m内的排污监测视频中是否有人员进入;若有的话,则在有人员进入的所述排污监测视频对应的目标日内确定人员进入时的时间点t入,在所述目标日内,计算所述时间点t入(例如14:25)之前的废水监测数据的第一监测均值mean1(即计算目标日内的0:00-14:25之间的废水监测数据的监测均值)和所述时间点t入之后的废水监测数据的第二监测均值mean2(即计算目标日内的14:25-24:00之间的废水监测数据的监测均值);若所述目标日内的所述第一监测均值mean1和所述第二监测均值mean2满足预设的确定条件,则确定所述目标日对应的废水监测数据的视频监控入侵特征对应的特征值,实现对存在人为干预的所述废水监测数据的排查。
进一步地,所述步骤s12中的所述预设的确定条件包括:
(mean1-mean2)/mean1>=a,且0≤a≤1;
其中,所述mean1为所述第一监测均值,所述mean2为所述第二监测均值,所述a为监测均值波动阈值。
在此,所述监测均值波动阈值a可以是0-1之间的任意小数,本申请的实施例中优选所述监测均值波动阈值a为0.15,所述监测均值波动阈值a越小越说明该日的废水监测数据月接近于实际采样,若所述第一监测均值mean1和所述第二监测均值mean2满足(mean1-mean2)/mean1>=0.15,则确定所述目标日对应的废水监测数据的视频监控入侵特征对应的特征值为0;若所述第一监测均值mean1和所述第二监测均值mean2不满足(mean1-mean1)/mean2>=0.15,则确定所述目标日对应的废水监测数据的视频监控入侵特征对应的特征值为1,重复上述步骤,直至得到每日对应的废水监测数据的视频监控入侵特征对应的特征值,通过对排污监测视频及其对应的废水监测数据实现对人为干预的判断。
另一方面,为了综合从多维度来辨别获取的所述废水监测数据的真实性,本申请的实施例中的所述质量评估特征还包括:相关性特征。对所述相关性特征的分析,所述步骤s12中的获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的质量评估特征对应的特征值,包括:
获取企业废水对应的废水监测数据,并对所述废水监测数据进行相关性评估,得到所述废水监测数据的相关性特征对应的特征值。进一步地,所述步骤s12获取企业的每种能耗量数据对应的月耗量向量及对应的所述废水监测数据的月监测数据向量;分别两两计算每种所述月耗量向量与对应的所述废水监测数据的月监测数据向量的相关性,得到所述企业的每种能耗量数据与所述废水监测数据之间的相关系数;从所有所述相关系数中选出最大值,并将最大值对应的相关系数确定为所述废水监测数据的相关性特征对应的特征值。
例如,所述能耗量数据包括但不限于是企业f的月用水量、月用电量、月用煤量及月用石油量等,为了综合考虑获取的废水监测数据的真实性,故需要在所述能耗量数据与所述废水监测数据之间进行多维数据相关性分析评估。例如企业f能耗使用为水、电量、煤及石油,会产生含有cod和氨氮的企业废水,为了保证计算得到的相关性特征的准确度,取企业f最近一年的月度废水监测数据,并得到该企业f的每种能耗量数据对应的月耗量向量,分别为:月度用水量向量vwateri:vwater1,vwater2…vwater12、月度用电量向量veleci、月度用煤量向量vcoali及月度用石油量向量voili,并对应的计算废水监测数据(例如废水流量数据和废水污染因子浓度等,其中优选所述废水污染因子浓度为cod浓度和氨氮浓度)的月监测数据向量,分别为:月平均cod向量vcodi、月平均氨氮向量vnhi及月累计废水流量向量vfluxi,其中,所述月平均cod向量vcodi由实时获取的cod浓度按月份求平均数获得,所述月累计废水流量向量vfluxi由实时废水流量数据按月份加总获得;其中i用于指示企业f最近一年的每个月份数,即i=1、2、3、4、5、6、7、8、9、10、11和12;接着所述步骤s12分别两两计算每种所述月耗量向量与对应的所述废水监测数据的月监测数据向量的相关性,得到所述企业的每种能耗量数据与对应的所述废水监测数据之间的相关系数矩阵corxy如图2所示,其中,x=1、2和3,y=1、2、3和4,进而根据相关系数矩阵corxy中的相关系数得到所述企业的每种能耗量数据与所述废水监测数据之间的相关系数;例如相关系数cor23用于指示企业f这一年中的用煤量与产生企业废水中的氨氮浓度之间的相关性;接着从所述相关系数中选出最大值,并将最大值对应的相关系数确定为所述废水监测数据的相关性特征对应的特征值,若相关系数cor21为最大值maxcor,则所述最大值对应的相关系数maxcor=cor21确定为所述废水监测数据的相关性特征对应的特征值maxcor,实现对能耗量数据与对应的废水监测数据之间的相关性分析。
如图3所示,所述步骤s12计算得到所述监测频次特征、稳定性特征、陡峰值特征、日内监测值变动频次特征、日间监测值变动频次特征、随机数特征、视频监控流量特征、视频监控入侵特征及相关性特征之后,通过废水监测数据的质量评估值va如下式:
va=c1*w1+c2*w2+c3*w3+c4*w4+c5*w5+c6*w6+c7*w7+c8*w8+c9*w9;得到企业f的每个排水口处的废水监测数据的质量评估值vap,其中所述p为企业f的排水口处的个数。为了加强对废水监测数据的真实性监测和防止对生态环境造成伤害,故将每个排水口处的废水监测数据的质量评估值vap进行比较,并将最差的排水口处的废水监测数据得到的质量评估值minvap作为该企业f的所述废水监测数据的质量评估值va=minvap,实现了对企业废水的废水监测数据进行质量评估,以便监管人员可以通过计算得到的废水监测数据的质量评估值,来判断该企业排出的企业废水的废水监测数据是否具有真实性,监管人员可以选择得分低的企业进行现场检查,极大的提高了监管的准确性,进而能够监督企业将排出的废水进行排污标准处理才排放,避免作假的废水监测数据对应的企业废水被排放出去,进而影响生态环境。
此外,本申请实施例还提供了一种评估废水监测数据质量的设备,该设备包括:
一个或多个处理器;以及
存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行前述方法的操作。
例如,计算机可读指令在被执行时使所述一个或多个处理器:在对企业废水对应的废水监测数据进行质量进行评估之前,预置废水监测数据的至少一个质量评估特征;获取企业废水对应的废水监测数据,并对所述废水监测数据进行质量评估,得到所述废水监测数据的各质量评估特征对应的特征值,并对所述废水监测数据的各质量评估特征对应的特征值进行计算,得到所述废水监测数据的各质量评估特征的权重;基于所述废水监测数据的各质量评估特征对应的特征值和权重,得到所述废水监测数据的质量评估值,实现了对企业废水的废水监测数据进行质量评估,以便监管人员可以通过计算得到的废水监测数据的质量评估值,来判断该企业排出的企业废水的废水监测数据是否具有真实性,监管人员可以选择得分低的企业进行现场检查,极大的提高了监管的准确性,进而够监督企业将排出的废水进行排污标准处理才排放,避免作假的废水监测数据对应的企业废水被排放出去,进而影响生态环境。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本申请的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。