本发明涉及高通量计算筛选与分子模拟计算领域,具体涉及到一种基于机器学习预测有害气体的共吸附性能的方法及系统。
背景技术:
1、近年来,金属有机框架(mof)以其具有高孔隙率、结构多样性和具有定制功能的特点在对环境修复应用中显示出巨大的前景。它是一种可以进行功能化的修饰来提高吸附性和吸附选择性,从而表现出优良的稳定性、可回收适用性及再生性等优势的多孔材料,由金属团簇和有机链接组成,因而被广泛应用于气体吸附与分离、药物缓解、催化反应、传感器等领域中。
2、由于金属有机框架在金属节点、有机链接和拓扑结构上组合的方式多种多样,所以由实验或者是计算合成的mof数量越来越多。针对如此庞大的mof数据库,仅仅通过实验来获取具有相应目标高效性能的mof具有很大的挑战,不仅需要人力、物力,同时需要大量的时间成本。因此,高通量计算筛选的出现是不可避免的,但是在高通量计算的过程中,大量无效的计算会降低效率,并且浪费计算资源。所以,如何设计出一种能快速筛选出高效地吸附有害气体的方法是该领域技术人员有待解决的问题。
技术实现思路
1、鉴于现如今对于吸附酸性有害气体的技术缺陷,本发明提供一种基于机器学习预测有害气体的共吸附性能的方法,利用机器学习模型针对mof的吸附性能进行筛选,对于现如今越来越庞大的数据库可以快速高效地筛选出高性能的材料应用于相应目标体系,节约了经济以及时间成本,以解决上述问题。
2、本发明还提供一种实施上述方法来共吸附分离水煤气中二氧化硫和二氧化碳的系统。
3、为实现上述目的,本发明提供的技术方案是:
4、一方面,本发明提供一种基于机器学习预测有害气体的共吸附性能的方法,其特征在于,包括以下:
5、s1、采集所使用mof的结构参数以及mof对于有害气体的吸附分离性能参数,构成数据集;
6、s2、通过机器学习模型,将数据集划分为训练集和测试集进行回归预测;
7、s3、评估不同机器学习模型对性能回归效果预测的结果,同时进行特征重要性的计算得到对于共吸附能力相对重要的特征;
8、s4、根据评估结果对mof进行筛选。
9、进一步的,所述s1中,结构参数包括材料的最大孔腔孔径、最小直径、孔隙率、体积比表面积、密度、亨利系数和吸附热,吸附分离性能参数包括吸附量、选择性和综合权衡变量。
10、更进一步的,所述性能参数中权衡吸附量和选择性之间关系的综合权衡变量tsn,计算公式如下:
11、
12、其中,表示二氧化硫和二氧化碳的吸附量,表示二氧化硫和二氧化碳或氮气的选择性。
13、进一步的,所述s2中,机器学习算法包括梯度提升回归树、极端梯度增强算法和多层感知机。
14、进一步的,所述将数据集划分为训练集和测试集,包括先对数据集进行数据预处理,数据预处理包括处理数据缺失值以及对数据进行规范化处理;在数据预处理完成后,将处理好的数据按照预设好的比例随机抽取划分为训练集和测试集。
15、更进一步的,所述s3中,评估回归预测结果的准确性指标包括决定系数r2、均方根误差rmse和平均绝对误差mae。
16、进一步的,所述s3中,对比不同的机器学习模型对于吸附性能的回归预测效果,筛选出最优的机器学习模型。
17、进一步的,所述s4中,先对比最优机器学习模型的回归预测结果的三种准确性指标,然后通过权衡值tsn进行排序,接着根据tsn的高低筛选出排名在前10的mof用于有害气体的吸附分离。
18、另一方面,本发明还提供一种实施上述方法来共吸附分离水煤气中二氧化硫和二氧化碳的系统,包括:
19、数据建立模块,用于采集mof的结构参数以及mof对于水煤气中二氧化硫和二氧化碳吸附分离性能参数,构建数据库样本;
20、机器学习模块,用于选择机器学习模型,对性能指标进行回归预测;
21、效果预测模块,用于对不同的机器学习模型的回归预测结果和机器学习模型进行评估,同时根据特征重要性计算结果得到针对吸附分离水煤气中二氧化硫和二氧化碳相对重要的特征;
22、数据筛选模块,用于根据最优机器学习模型的回归预测结果,通过对综合权衡变量tsn的高低排序筛选出排名在前10的mof用于水煤气中二氧化硫和二氧化碳的吸附分离。
23、本发明提供的基于机器学习预测有害气体的共吸附性能的方法及系统,与现有技术相比具有如下的优点与效果:
24、(1)本发明提供的基于机器学习预测有害气体的共吸附性能的方法,该方法基于机器学习能够对目标材料的性能进行预测并且在大规模的数据库中筛选出目标性能的mofs材料。
25、(2)本发明针对二氧化硫和二氧化碳属于酸性气体,利用高通量计算筛选出的优异mof不仅可以节约经济和时间成本,同时操作便利减少实验了对人体的伤害。
26、(3)该方法能够准确地评估材料的结构-性能之间的关系,为后续mofs的定量描述提供了依据。
27、(4)针对使用的机器学习模型具有可转移性的性能,应用于其他体系时也具有一定的指导作用。
1.一种基于机器学习预测有害气体的共吸附性能的方法,其特征在于,包括以下:
2.根据权利要求1所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s1中,结构参数包括材料的最大孔腔孔径、最小直径、孔隙率、体积比表面积、密度、亨利系数和吸附热,吸附分离性能参数包括吸附量、选择性和综合权衡变量。
3.根据权利要求2所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述性能参数的综合权衡变量是吸附量和选择性的权衡值tsn,计算公式如下:
4.根据权利要求1所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s2中,机器学习算法包括梯度提升回归树、极端梯度增强算法和多层感知机。
5.根据权利要求1所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s2中,所述将数据集划分为训练集和测试集,包括先对数据集进行数据预处理,数据预处理包括处理数据缺失值以及对数据进行规范化处理;在数据预处理完成后,将处理好的数据按照预设好的比例随机抽取划分为训练集和测试集。
6.根据权利要求3所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s3中,评估回归预测结果的准确性指标包括决定系数r2、均方根误差rmse和平均绝对误差mae。
7.根据权利要求1所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s3中,对比不同的机器学习模型对于吸附性能的回归预测效果,筛选出最优的机器学习模型。
8.根据权利要求7所述的基于机器学习预测有害气体的共吸附性能的方法,其特征在于,所述s4中,先对比最优机器学习模型的回归预测结果的三种准确性指标,然后通过权衡值tsn进行排序,接着根据tsn的高低筛选出排名在前10的mof用于有害气体的吸附分离。
9.一种用于实现权利要求1-8任一项方法的水煤气中二氧化硫和二氧化碳吸附分离系统,其特征在于,包括: