本发明涉及光谱建模分析领域,尤其涉及一种光谱预测分析模型自主构建方法和系统。
背景技术:
1、以物质光谱表征为基础的光谱分析技术已在石化、医药、农林和食品等领域得到了广泛应用,并在原材料属性检测、生产过程指标监测、违禁物品和食品质量分析等环节发挥着重要作用。通过采集分析物质的光谱数据和性质数据,并结合化学计量学方法建立定性或定量预测模型可实现对应指标的快速、准确分析。在光谱分析过程中,随着高分辨率光谱仪器的广泛应用和实际生产过程采样条件的限制,采集的光谱数据通常具有小样本高维特征,导致现有方法难以建立可靠的光谱预测分析模型。此外,普遍存在的模型结构固化问题进一步降低了模型性能。
技术实现思路
1、以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
2、本发明的目的在于解决上述问题,提供了一种光谱预测分析模型自主构建方法和系统,通过自主选择建模变量并探索不同模型结构的同时,采用剪枝策略剔除冗余模型分支,有效提高了模型泛化性能。
3、本发明的技术方案为:本发明揭示了一种光谱预测分析模型自主构建方法,方法包括:
4、步骤s1、构建分析数据集并随机划分为训练集和测试集;
5、步骤s2、利用训练集数据建立偏最小二乘模型,根据回归系数重要性选择初始变量,并根据初始变量个数自适应调整最大树深度;
6、步骤s3、根据树状网络的函数集合和终端集合随机生成初始种群;
7、步骤s4、计算树状网络子树误差降低率并进行剪枝,计算剪枝后树状个体的适应度;
8、步骤s5、根据种群个体适应度和预设参数对个体进行选择、交叉和变异操作,重新进行个体适应度评价并更新最优个体;
9、步骤s6、应用步骤s5获得的最优个体构成光谱预测分析模型并对测试集样本进行预测。
10、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s1中,分析数据集由样品的光谱数据和物理化学性质属性数据组成,其中样品光谱数据可以来源于以下任意一种:紫外-可见光谱、近红外光谱、中红外光谱、拉曼光谱与荧光光谱。
11、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s2中,利用训练集数据建立偏最小二乘模型,根据回归系数重要性选择初始变量,并根据初始变量个数自适应调整最大树深度,进一步包括以下步骤:
12、步骤s21、以训练集的光谱数据为输入、物理化学属性数据为输出构建偏最小二乘模型;
13、步骤s22、根据偏最小二乘模型回归系数的绝对值大小对光谱波长排序并选择指定数目波长作为树状网络的初始变量;
14、步骤s23、根据初始变量个数自适应调整最大树深度。
15、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s3中,树状网络的函数集合为线性参数多项式模型的线性项和非线性项,终端集合为初始变量集合。
16、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s4中,计算树状网络子树的光谱预测分析误差降低率并进行剪枝,计算剪枝后树状个体的适应度,进一步包括以下步骤:
17、步骤s41、将树状网络分解为子树;
18、步骤s42、计算各子树的光谱预测分析误差降低率,并根据预设剪枝阈值移除光谱预测分析误差降低率于剪枝阈值的子树;
19、步骤s43、计算剪枝后树状个体的适应度。
20、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s5中,根据种群个体在光谱预测分析中的适应度和预设参数对个体进行选择、交叉和变异操作,基于新个体组成的光谱预测分析模型性能重新进行个体适应度评价并更新最优个体,进一步包括以下步骤:
21、步骤s51、结合适应度和代际间隔从初始种群中选出优秀个体组成精英个体集合;
22、步骤s52、结合光谱预测分析模型的适应度和交叉、变异概率,从初始种群中选出父代个体组成集合;
23、步骤s53、对父代个体集合进行交叉、变异操作产生子代种群;
24、步骤s54、对子代种群进行基于光谱预测分析模型的适应度评价,并与精英集合合并组成新的初始种群;
25、步骤s55、在最大迭代次数范围内,循环s51-s54并确定最终光谱预测分析模型。
26、根据本发明的光谱预测分析模型自主构建方法的一实施例,步骤s6中,应用步骤s5获得的最优个体构成光谱预测分析模型并对测试集样本,进行预测进一步包括以下步骤:
27、步骤s61、根据步骤s5获得最佳个体及树状网络确定最终光谱预测分析模型;
28、步骤s62、利用最终光谱预测分析模型对测试集样本进行预测分析。
29、本发明还揭示了一种光谱预测分析模型自主构建系统,系统包括:
30、数据集划分模块,构建分析数据集并随机划分为训练集和测试集;
31、模型建立模块,利用训练集数据建立偏最小二乘模型,根据回归系数重要性选择初始变量,并根据初始变量个数自适应调整最大树深度;
32、种群生成模块,根据树状网络的函数集合和终端集合随机生成初始种群;
33、剪枝计算模块,计算树状网络子树的光谱预测分析误差降低率并进行剪枝,计算剪枝后树状个体的适应度;
34、个体操作模块,根据种群个体在光谱预测分析中的适应度和预设参数对个体进行选择、交叉和变异操作,基于新个体组成的光谱预测分析模型性能重新进行个体适应度评价并更新最优个体;
35、预测模块,应用个体操作模块获得的最优个体构成光谱预测分析模型并对测试集样本进行预测。
36、本发明还揭示了一种计算机可读存储介质,其存储有可供处理器执行的程序指令,以实现如上所述的光谱预测分析模型自主构建方法的步骤。
37、本发明还揭示了一种计算机设备,其包括存储器、处理器和存储在存储器中可供处理器运行的程序指令,其中所述处理器执行所述程序指令以实现如上所述的光谱预测分析模型自主构建方法的步骤。
38、本发明对比现有技术有如下的有益效果:本发明基于遗传编程建立树状网络模型,在构造线性子树的基础上引入非线性子树,从而有效提高了模型结构的多样性。此外,本发明通过自适应调整最大树深度探索不同模型结构,并结合剪枝策略避免冗余结构,有效提高了模型的泛化性能。与现有的固定参数的光谱预测分析模型相比,本发明通过变量筛选、遗传编程和剪枝操作建立更加灵活的模型结构,有效提高了光谱分析模型的预测精度和模型多样性。
1.一种光谱预测分析模型自主构建方法,其特征在于,方法包括:
2.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s1中,分析数据集由样品的光谱数据和物理化学性质属性数据组成,其中样品光谱数据可以来源于以下任意一种:紫外-可见光谱、近红外光谱、中红外光谱、拉曼光谱与荧光光谱。
3.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s2中,利用训练集数据建立偏最小二乘模型,根据回归系数重要性选择初始变量,并根据初始变量个数自适应调整最大树深度,进一步包括以下步骤:
4.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s3中,树状网络的函数集合为线性参数多项式模型的线性项和非线性项,终端集合为初始变量集合。
5.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s4中,计算树状网络子树的光谱预测分析误差降低率并进行剪枝,计算剪枝后树状个体的适应度,进一步包括以下步骤:
6.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s5中,根据种群个体在光谱预测分析中的适应度和预设参数对个体进行选择、交叉和变异操作,基于新个体组成的光谱预测分析模型性能重新进行个体适应度评价并更新最优个体,进一步包括以下步骤:
7.根据权利要求1所述的光谱预测分析模型自主构建方法,其特征在于,步骤s6中,应用步骤s5获得的最优个体构成光谱预测分析模型并对测试集样本进行预测,进一步包括以下步骤:
8.一种光谱预测分析模型自主构建系统,其特征在于,系统包括:
9.一种计算机可读存储介质,其存储有可供处理器执行的程序指令,以实现如权利要求1至7中任一项所述的光谱预测分析模型自主构建方法的步骤。
10.一种计算机设备,其包括存储器、处理器和存储在存储器中可供处理器运行的程序指令,其中所述处理器执行所述程序指令以实现如权利要求1至7中任一项所述的光谱预测分析模型自主构建方法的步骤。