本发明涉及水污染溯源,尤其涉及一种快速低成本的三维荧光识别污染水体溯源方法。
背景技术:
1、近年来,随着经济的快速发展,我国开始加强水污染防治工作,通过加强城市排水管网的建设,实现了城市管网的雨污分流,有效地改善了城市水环境的质量。然而,在许多工业园区附近的水体质量依旧不容乐观,其主要原因有排水系统雨天溢流排放,企业的偷排漏排,生活污水的直排等,造成附近河道有机物污染事件频发。因此,如何对污染源特征的识别并快速、准确诊断污染来源,已成为环境执法以及污染应急处置的首要任务,也是亟待解决的难点。
2、传统的水质检测方法包括电化学方法、物理方法和生物传感方法。这些方法存在操作流程复杂、测量周期较长和二次污染等问题。又如常规有机物监测指标如高锰酸盐指数、总有机碳等只反映总量,无法反映有机物的毒性和给出污染源信息,难以为污染源的监管或应急处置溯源提供关键可操作的信息。
3、在工业园区中,印染、皮革鞣制加工、造纸、金属表面加工是典型的高耗水、高耗能和高污染行业。印染、造纸废水色度大、有机物含量高、成分复杂,尤其所含的致畸、致癌物较多,属于难生物降解的有毒废水。其中,印染废水根据其所使用的染料助剂、加工的工艺又分为化纤织造及印染精加工、毛纺织及染整精加工。皮革鞣制加工、造纸、金属表面加工也均为重大涉水行业,其所含的重金属、氰化物、油类、腐蚀性溶剂、表面活性剂、光亮剂、脱墨的化学药剂、纤维素等多种有害物质。除此之外最容易被我们忽视的是生活污水的直排,虽然其产生的危害不如以上的工业废水严重,但是在溯源过程中发现它是引起水污染的最常见的污染来源,尤其是在一些老旧工业园区存在雨污混流现象。
4、因此,化纤织造及印染精加工、毛纺织及染整精加工、造纸、生活、皮革鞣制加工、金属表面加工这些污染源成了监管的重中之重。
5、三维荧光光谱技术具有灵敏度高、环境友好的特性,具有“指纹”的功能,可作为污染源的识别依据。传统的三维荧光识别方法主要是从峰位置,峰个数和峰形态等特征来判别可能的污染来源,存在主观性较强,难以挖掘潜在的荧光信息的问题。对此,现阶段有学者利用机器学习挖掘三维荧光图谱特征信息从而识别出水体中污染物的来源,但仍存在三维荧光全图谱扫描时间过长,存在大量干扰噪声和荧光重叠信息,识别效率过低且三维荧光仪器成本过高,体积过大。
6、因此,探究出一种高效的图谱扫描和特征提取范围,对今后实现雨水口晴天排污低成本,快速溯源和开发便携式水污染快速溯源仪有一定的指导意义。
技术实现思路
1、本发明提供了一种快速低成本的三维荧光识别污染水体溯源方法,该方法能够精准提供用于区别不同污染源类型的最佳特征波长,并通过模型训练得到用于不同污染源类型污废水的溯源模型,可以在快速且低成本地溯源基础上,保证非常高的准确性。
2、具体技术方案如下:
3、本发明提供了一种快速低成本的三维荧光识别污染水体溯源方法,包括以下步骤:
4、(1)采集不同污染源类型的污废水样本,进行三维荧光扫描,得到各污废水样本的三维荧光光谱数据;
5、(2)将步骤(1)的三维荧光光谱数据进行预处理,再从预处理后的三维荧光光谱数据中,选出特征激发波长以及该特征激发波长下的荧光光谱特征数据;
6、(3)对特征激发波长进行精简后,得到最佳特征激发波长以及该最佳特征激发波长下的荧光光谱特征数据;
7、(4)将最佳特征激发波长下的荧光光谱特征数据和对应的污染源类型结果输入至支持向量机模型中进行训练,得到用于划分不同污染源类型的污染源三维荧光识别模型;
8、(5)采集待测的污废水样本,根据步骤(3)的最佳特征激发波长,获取该样本在最佳特征激发波长下所有发射波长所对应的荧光光谱特征数据,并输入至污染源三维荧光识别模型中,获得污染源类型结果。
9、进一步地,步骤(1)中,所述不同污染源类型的污废水,包括:化纤织造及印染精加工废水,毛纺织及印染整精加工废水,皮革鞣制加工废水,造纸废水,金属表面加工废水和生活污水。
10、其中,所述的化纤织造及印染精加工废水和毛纺织及印染精加工废水执行纺织染整工业水污染物排放标准gb4287-2012;所排放废水来源于对纺织材料(纤维、纱、线和织物)进行染色、印花、整理为主的处理工艺过程,包括预处理(不含洗毛、麻脱胶、煮茧和化纤等纺织用原料的生产工艺)、染色、印花和整理;主要污染物的种类为苯胺类、硫化物、可吸附有机卤素、未降解的分散染料以及未降解完全产生的芳香族化合物等。
11、所述皮革鞣制加工废水执行制革及毛皮加工工业水污染物排放标准gb30486-2013,所排放废水来源于生皮脱脂、浸灰脱毛、浸酸铬鞣、染色涂饰等皮革生产工序;主要污染物的种类为动植物油、硫化物、氯离子、总铬等。
12、所述造纸废水执行制浆造纸工业水污染物排放标准gb3544-2008,所排放废水来源于制浆产生的蒸煮废液、洗浆漂白过程中产生的中段水及抄纸工序中产生的白水;主要污染物的种类为淀粉、碳水化合物、木质素衍生物、蛋白质和表面活性剂的降解产物、二恶英等。
13、所述金属表面加工废水执行电镀污染物排放标准gb21900-2008,所排放废水来源于电镀前镀件所经过的抛光、脱脂、除锈、酸洗等多项预处理和后处理中的漂洗、抛光工序产生的废水;主要污染物为重金属、氰化物、油类、脱脂溶剂、表面活性剂、光亮剂等。
14、所述生活污水执行污水排入城镇下水道水质标准gb/t31962-2015,所排放的污水来源于居民的洗漱用水、排泄用水、厨房用水;主要的污染物的种类为蛋白质、脂质、糖和挥发性脂肪酸等。
15、为了确保本发明方法的准确性,三维荧光的扫描参数条件也需要做一定的要求。进一步地,步骤(1)中,所述三维荧光扫描的参数为:ex/em扫描范围为220-450/260-600nm,ex/em扫描带宽为5nm/5nm,ex/em扫描间隔为5nm/1nm,扫描速度为2400nm/min,狭缝宽度为5nm。
16、为了避免错误数据的干扰,影响特征波长的筛选和模型的准确运行,进一步地,步骤(2)中,所述预处理的方法为:先对三维荧光光谱数据进行修正,再做归一化处理,得到归一化的矩阵样本数据;
17、所述修正的方法为:
18、(2-1)对超纯水进行三维荧光扫描,获得超纯水的三维荧光光谱数据;
19、(2-2)利用公式(1)计算超纯水的拉曼峰积分值arp,计算公式如下:
20、
21、式(1)中,为特定λex下对应某一λem范围内的拉曼积分值;λex表示激发波长;λem表示发射波长;arp为超纯水的拉曼峰的积分值,d表示积分公式,为在λex下,λem处测得的拉曼光谱荧光强度;与为积分区间的起点和终点;
22、(2-3)将每批污染源样本所有的荧光信号强度均除以该批次的超纯水的arp,使得污水样本荧光信号强度由任意单位(a.u.)校准为拉曼单位(r.u.);公式如下:
23、
24、式(2)中,为任意λex、λem下对应的校正后的数据,即以拉曼(r.u.)为单位的荧光强度;为校正前任意λex、λem下对应的的荧光强度;arp为超纯水的拉曼峰的积分值。进一步地,步骤(2-2)中,超纯水的拉曼峰的积分值arp是在λex=350nm下λem=371~428处获得;公式(1)中,λex取350nm;λm的区间[371,428]nm。
25、(2-4)利用dreem工具箱中的cutdata函数将em<ex±20nm和em>2ex±10nm的拉曼瑞丽散射区域去除;
26、所述归一化处理的方法为:先对修正后的三维荧光光谱数据进行数据平铺,再用mapminmax函数进行归一化处理,得到归一化的矩阵样本数据。
27、进一步地,步骤(2)中,选出特征激发波长的方法为:
28、(2-a)采用核一致诊断法或拟合残差分析法对不同污染源的污废水样本中的荧光物质组成成分进行解析,得到不同污染源的荧光物质组分类型及数量;
29、(2-b)采用平行因子分析法对预处理后的三维荧光光谱数据进行分解,得到每个荧光物质组分类型下所对应的发射矩阵b和激发矩阵c,并收集在两个矩阵中荧光强度值最大的组分类型所对应的激发波长,将该激发波长作为特征激发波长,得到不同污染源所对应的特征激发波长。
30、进一步地,步骤(3)中,所述精简的方法为:剔除各污染源之间相同的特征激发波长以及激发波长数值接近的激发波长。
31、进一步地,步骤(3)中,所述最佳特征激发波长为225nm、240nm、250nm、280nm、310nm、350nm和360nm。
32、进一步地,步骤(4)中,训练支持向量机模型的样本不少于20个,预测样本不少于5个;所述支持向量机模型采用xlsread函数读取输入数据,libsvm工具箱进行模型训练,采用svmcgforclass函数对惩罚参数c和核函数参数g进行优化。
33、与现有技术相比,本发明具有以下有益效果:
34、本发明提供了一个六类污废水的荧光光谱特征数据扫描和提取区域(λex=225、240、250、280、310、350、360nm,λem=260~600nm),通过利用荧光分光光度计在最佳激发波长下扫描各类污染源和待测水体得到激发波长下的荧光光谱特征数据;并结合支持向量机建立的六类污废水的溯源模型,可以有效地识别区分不同污染源;相较于现有全图谱扫描(λex=240~450nm,λem=260~600nm)所使用的激发—发射光谱同步扫描技术,本发明提出的六类污废水的荧光光谱特征数据扫描和提取区域所采取的扫描方式即激发波长固定,发射波长扫描,所使用的荧光分光光度计的造价更低,扫描时间更快;在将各污染源的荧光光谱数据输入至模型中识别溯源,本发明所提供荧光光谱特征数据,在所用时间更短的情况下仍能保持非常高的准确性。