本发明属于芳香烃类生态风险评价领域,尤其涉及一种芳香烃及其衍生物环境安全阈值的预测方法及系统。
背景技术:
1、芳香烃及其衍生物是石油石化行业中的典型污染物,石油开采、炼制、输运、储藏等过程中均会不可避免造成石油的倾洒或渗漏,导致多种芳烃类污染物被释放到环境中,芳香烃及其衍生物具有高生物毒性、严重的生物毒性效应和在环境中强持久性。基于此,准确、快速地评价芳香烃及其衍生物的生态风险十分必要。确定适宜的安全阈值对评价芳香烃及其衍生物生态风险具有重要意义,物种敏感性分布模型中得出的hc5(5%物种的危险浓度)经常被用来表征污染物允许的安全阈值,以保护群落中95%的物种免受污染物的重大影响,是对环境污染物开展生态风险评价的重要参数之一。然而,芳香烃及其污染物种类及数目多、结构复杂,常规开展生态风险评价方法获取hc5的步骤繁琐、耗时、费力,因此非常有必要研发快速有效的新方法与新技术用于芳香烃及其衍生物的环境安全阈值的预测,对评价芳香烃及其衍生物生态风险评价具有重要意义。
2、通过上述分析,现有技术存在的问题及缺陷为:
3、(1)由于芳香烃及其衍生物种类繁多且结构复杂,获取足够多样和全面的毒性数据和环境影响数据非常困难,这限制了传统风险评估方法的准确性和全面性。
4、(2)传统的生态风险评价方法通常需要进行大量的实验测试和数据分析,这一过程不仅耗时长、工作量大,而且需要大量的资源和人力投入。
5、(3)现有技术难以有效应对芳香烃及其衍生物在环境中的复杂性和多样性,特别是对于新出现的或少见的化合物,缺乏足够的数据和评估模型。
技术实现思路
1、针对现有技术存在的问题,本发明提供了一种芳香烃及其衍生物环境安全阈值的预测方法。
2、首先,拟采用芳香烃及衍生物分子结构参数与环境安全阈值的定量构效关系模型,进行安全阈值的预测,所述定量构效关系模型,具体为:
3、loghc5=12.19-24.65ω+0.02vm-0.07atsc2i-6.39aatsc2s+2.43gats2c-10.68gats2m+0.33vr3_dzs-0.01zagreb。
4、本发明是这样实现的,一种芳香烃及其衍生物环境安全阈值预测方法,该方法包括以下步骤:
5、建立所述芳香烃及其衍生物分子结构与环境安全阈值hc5的定量构效关系回归模型,包括以下步骤:
6、筛选多种符合要求的芳香烃及其衍生物的急性毒性数据,所筛选毒性数据要求数据集应涵盖三个营养级的八个分类群组且收集标准毒性测试物种的毒性数据,所获得的毒性数据基于三个原则:适当性、可靠性和准确性进行筛选。对于符合条件的芳香烃及其衍生物的毒性数据,不同分布和多种拟合方法用于拟合得出概率分布模型,即物种敏感度分布曲线(ssd)用于确定安全阈值,选择有害浓度hc5(5%物种的危险浓度)作为芳香烃及其衍生物的环境安全阈值;
7、计算所述多种芳香烃及其衍生物的分子结构描述符,对此先获得化合物的3d结构,对分子结构进行能量最小优化,然后将优化后分子3d结构导入dragon6.0中获得所需分子结构描述符;
8、以所述多种芳香烃及衍生物的分子结构描述符和计算环境安全阈值hc5的值,进行多元线性回归及主成分分析,分别通过模型的内部验证,以评估模型的内部稳健性;当所述回归模型符合建模要求时,得到芳香烃及其衍生物分子结构与环境安全阈值hc5间定量构效关系回归模型,即使用所述回归模型对待测芳香烃类污染物环境安全阈值hc5进行预测。根据所述回归模型各分子结构参数的标准化系数,确定所述回归模型中每个分子结构参数对芳香烃及其衍生物环境安全阈值hc5影响程度的权重。测能力。相对现有的预测模型,该模型的应用域更广,涵盖了多种类型的化合物。这些描述符可以用dragon描述计算获得,不依赖于实验数据,且算法透明,便于模型的应用推广。
9、通过h=3(1+k)/n确定警戒值,h表示警戒值,k表示所述回归模型方程中芳香烃及其衍生物的分子结构描述符数量,n表示所述回归模型训练集中化合物数量;当待测芳香烃类污染物的hi在所述警戒值内时,说明芳香烃衍生物在定量构效关系模型的应用域内,可用该模型预测芳香烃及衍生物的环境安全阈值。
10、进一步,确定所述待测芳香烃类污染物的帽子值和标准化残差,包括以下步骤:
11、根据所述回归模型训练集的n种芳香烃及其衍生物对应模型中k种分子结构描述符,构造n行k列矩阵x,其中,行表示所述回归模型训练集中芳香烃及其衍生物种类,第1至k列表示物质分子结构描述符;
12、待测芳香烃类污染物的帽子值通过下式确定:
13、h=xi(xtx)-1xt (2)
14、其中,i表示芳香烃类污染物的种类,xi表示对应的分子结构描述符组成1行k列矩阵;
15、标准化残差δ根据以下公式确定:
16、
17、其中,y为芳香烃及其衍生物的hc5实验值,ypred为芳香烃及其衍生物的hc5预测值。
18、本发明还提供了一种用于预测芳香烃及其衍生物环境安全阈值的系统,该系统包括:
19、数据输入模块,用于接收芳香烃及衍生物的分子结构参数;
20、定量构效关系模型模块,内置有根据权利要求1所述的预测方法所建立的定量构效关系模型,用于根据输入的分子结构参数计算环境安全阈值;
21、数据输出模块,用于输出计算得到的环境安全阈值。
22、其中,该系统还包括:
23、数据预处理模块,用于对输入的芳香烃及衍生物的分子结构参数进行预处理,以得到符合定量构效关系模型要求的输入格式;
24、模型验证模块,用于对定量构效关系模型进行验证,包括内部验证和外部验证,以确保模型的准确性和可靠性。
25、其中,该系统还包括:
26、毒性数据收集模块,用于收集多种符合要求的芳香烃及其衍生物的急性毒性数据;
27、数据评估与筛选模块,用于对收集的毒性数据进行可靠性评估和筛选,以得到用于建立定量构效关系模型的有效数据。
28、其中,该系统还包括:
29、用户界面模块,用于提供用户与系统进行交互的界面,包括数据输入界面、模型参数设置界面、结果展示界面等;
30、报告生成模块,用于根据用户的需求生成包含预测结果和分析的报告。
31、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
32、第一、对应芳香烃及其衍生物环境安全阈值预测方法,根据环境安全阈值hc5和分子结构描述符的定量构效关系,通过芳香烃及其衍生物分子结构与环境安全阈值定量构效关系回归模型,对芳香烃及其衍生物的化合物的环境安全阈值进行预测,相比常规方法推导污染物hc5,易于操作,节约时间,成本低,并且预测准确,能够实现对芳香烃及其衍生物环境安全阈值hc5的快速预测。可为高效、精准地指导石油石化行业芳香烃类污染防治提供重要的工具,对于保障石油行业的可持续发展意义重大。
33、第二,本发明提供的芳香烃及其衍生物环境安全阈值预测方法具有以下特点和优势:
34、易于操作:该方法经过精心设计,使其操作简单易懂,无需深入的专业知识即可操作。用户只需提供相关的化学结构信息,即可快速进行预测。
35、节约时间:传统的环境安全阈值预测方法往往需要复杂的实验和大量的时间来收集数据并进行分析。而本发明利用准确的计算模型和明确简便算法,能够在短时间内完成预测,大大节约了时间成本。
36、成本低:采用本发明的方法进行预测无需大规模的实验设备和实验材料,节约了实验成本。同时,由于预测结果准确可靠,减少了后续实验的需求,进一步降低了成本。
37、预测准确:本发明利用历史数据和环境参数进行训练和模型优化,提高了预测的准确性。该方法经过多次验证和验证,具有较高的预测可靠性。
38、快速预测:本发明能够实现对芳香烃及其衍生物环境安全阈值hc5的快速预测。用户提供相关分子结构信息,即可快速获得预测结果,提高了决策的效率。
39、总之,本发明提供的芳香烃及其衍生物环境安全阈值预测方法在环境保护和风险评估方面具有重要的应用价值。它的易操作性、时间和成本的节约以及预测准确性,使其成为环境管理和相关行业的有力工具。
40、第三,本发明的技术方案具有广泛的应用前景和商业价值。预期收益包括但不限于以下方面:芳香烃及其衍生物在工业生产和化学品使用中广泛存在,预测其环境安全阈值能够帮助评估和管理其潜在风险,从而有效保护环境。准确预测芳香烃及其衍生物的环境安全阈值有助于制定更合理的环境保护政策和监管标准,提高环境管理的科学性和有效性。
41、本发明的技术方案填补了国内外业内技术空白:在国内外,对于芳香烃及其衍生物环境安全阈值的快速预测方法方面,存在着技术空白。传统的实验方法耗时耗力,并且成本较高。而本发明通过引入准确的计算模型和算法,填补了这一技术空白,提供了一种快速、准确、低成本的预测方法。
42、本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:在环境保护和化学品安全领域,准确预测芳香烃及其衍生物的环境安全阈值一直是人们渴望解决的技术难题。以往的方法存在实验周期长、成本高、准确性不高等问题。而本发明通过创新性地引入数据收集和模型构建,成功解决了这一难题,实现了快速且准确的预测。
43、本发明的技术方案克服了技术偏见:在过去的研究中,芳香烃及其衍生物的环境安全阈值预测往往依赖于大量的实验数据和经验模型,容易受到实验条件和个体差异等因素的影响,存在技术偏见。而本发明基于数据和算法,通过对广泛的数据进行分析和建模,减少了主观性和个体差异的影响,提高了预测结果的客观性和可靠性。
44、第四,本发明在构建预测芳香烃及其衍生物环境安全阈值的模型方面取得了显著的技术进步。通过构建三个不同的预测模型,即模型(1)、模型(2)和模型(3),并成功应用这些模型,实现了对芳香烃及其衍生物环境安全阈值的高效、准确预测。
45、这些模型基于不同的分子描述符和参数,如亲电指数、分子体积、多种自相关指数、矩阵指数以及其他化学特性参数,通过回归分析等方法建立了模型方程。这些方程能够有效地关联芳香烃及其衍生物的分子结构参数与环境安全阈值之间的关系。
46、模型(1)的方程涉及多个分子描述符和参数,包括logkow、atsc2i、aatsc0m等,通过综合考虑这些参数对环境安全阈值的影响,实现了对芳香烃及其衍生物环境安全阈值的准确预测。
47、模型(2)的方程基于elumo、ω、qzz等参数,这些参数反映了分子的电子结构和化学性质,通过与环境安全阈值建立关联,提供了另一种有效的预测方法。
48、模型(3)的方程与模型(1)和模型(2)不同,它采用了不同的分子描述符和参数组合,如ω、vm、atsc2i等,通过回归分析建立了与环境安全阈值之间的线性关系。这个模型在预测过程中也取得了显著的成功。
49、本发明通过构建三个不同的预测模型,并成功应用这些模型进行芳香烃及其衍生物环境安全阈值的预测,取得了显著的技术进步。这些模型提供了多种选择,可以根据实际情况和需要选择合适的模型进行预测,提高了预测的准确性和可靠性,为相关领域的研究和应用提供了重要的工具和参考。