本发明属于酒龄检测领域和技术优化领域,涉及一种基于pls-lsboost梯度提升树的辐照酒生产工艺优化方法。
背景技术:
1、白酒是以粮谷为主要原料,以大曲、小曲或麸曲及酒母等为糖化发酵剂,经蒸煮、糖化、发酵、蒸馏而制成的饮料酒。陈酿是白酒生产过程中的重要工序,在这一过程中,酒体发生许多物理变化和化学变化,导致白酒成分的改变,刚蒸馏出白酒的辛辣味、异杂味和刺激性气味减轻,口感变得醇厚,质量明显提高。γ射线辐照能够加速白酒的老熟,节约白酒生产成本和周期。大量研究表明,经γ射线辐照后的白酒安全可食用,且具有工艺简单、能源消耗少、无环境污染和化学药物残留、可带包装加工等优势。
2、然而,白酒的辐照参数优化缺乏高效准确的方法,目前主要通过正交实验结合感官品评的方法实现。辐照酒所用辐照技术的优化离不开酒样陈化效果的研究。感官品评结果受主观因素、环境条件等的影响,也存在一定的模糊性和不确定性。此外,探究最佳工艺条件所用的正交实验方法对因素水平和相互作用有一定的限制,不可避免地会损失一些信息,不能获得在多因素连续区域中的最优方案。用数学模型的方法可以得到连续范围内的最优解,从而可以标定酒样中风味化合物相对含量与辐照参数之间的关系,确定达到目标陈酿效果所需的辐照参数组合。
3、目前,已有许多关于白酒酒龄预测方法的研究,多使用气相色谱、高效液相色谱、质谱等技术结合化学计量学方法进行分析。白酒储存时间与辐照参数的不同组合对白酒风味品质有类似的影响,但相比陈酿时间这一单一变量,辐照参数会对结果造成影响,因此辐照催陈更为复杂。传统的化学计量学方法如偏最小二乘回归和多元线性回归过于简单,应用于辐照催陈系统时拟合能力略显不足。人工神经网络方法有高度非线性运算的能力、较强的容错能力和复杂的结构,也常被用于工艺优化,但其为“黑箱”模型,不能对模型和预测特征的贡献进行很好地解释。
4、lsboost是一种以mse为损失函数的梯度提升树,以决策树为单元,通过梯度下降法不断拟合误差,使模型逼近真实值,与上述方法相比,既能解决预测变量数目远大于数据集中样本数目的难题,又可以对模型进行解释,以便确定贡献较大的标志物。
技术实现思路
1、本发明目的在于克服现有技术的不足,提供一种基于pls-lsboost梯度提升树的辐照白酒生产工艺优化方法。本发明首先依据不同辐照参数组合下生产的辐照白酒酒样建立一个挥发性成分含量数据与各个辐照参数之间的lsboost和pls-lsboost模型,通过bayesian优化算法和变量选择方法对模型的参数进行优化,再对比pls-lsboost和lsboost的泛化能力,选择出适用于数据集,且具有最佳预测能力的模型类型和模型参数。将自然陈酿酒样的信息输入最优模型,评估获得特定陈化效果所需要的最佳辐照催陈工艺参数组合,达到工艺优化的目的。
2、一种基于pls-lsboost梯度提升树的辐照白酒生产工艺优化方法,包括以下步骤
3、1)获得辐照剂量、储存温度、超声时间三个参数组合的辐照白酒酒样和不同年份的自然陈酿白酒酒样,采用直接进样气相色谱-质谱(gc-ms)联用和静态项空气相色谱-质谱(hs-gc-ms)联用分析技术对酒样的挥发性风味成分进行测定;利用als算法补全缺失值后,通过偏最小二乘(pls)将挥发性风味成分数据进行降维处理,提取出辐照白酒样品在主成分上的得分;
4、2)分别以辐照剂量、储存温度、超声时间为响应变量,以挥发性风味成分原始数据或pls主成分得分为预测变量,建立经bayesian算法优化的lsboost模型和pls-lsboost模型;
5、3)计算lsboost模型和pls-lsboost模型的预测变量重要性得分,对模型的预测变量进行筛选,提高模型预测能力;
6、4)计算lsboost模型和pls-lsboost模型的化合物重要性得分,筛选白酒体系中与辐照相关的特征化合物;
7、5)将自然陈酿白酒的挥发性成分输入最佳模型,输出得到辐照参数值的组合,即为获得特定陈化效果所需要的最佳辐照催陈工艺参数组合,达到工艺优化的目的。
8、所述的步骤1)中辐照白酒酒样处理参数为辐照源60co多个辐照剂量、不同储存温度、超声时间的正交组合;采用als算法进行矩阵分解,补充缺失值;采用z-score方法对数据进行标准化。
9、所述的步骤1),使用pls提取正交主成分,主成分中变量的载荷为xl,计算辐照白酒样品在主成分上的得分xs=x0*xl,作为训练pls-lsboost模型的输入变量。计算自然陈酿白酒样品在主成分上的得分xsp=xp*xl,作为使用pls-lsboost模型进行预测时的输入变量。
10、所述的步骤2),lsboost模型的训练过程为,每轮增加一个学习器,拟合上一轮中的误差,通过最小化mse:
11、
12、
13、
14、其中,为初始函数,即输出数据集的平均值,是回归树的集合,v为学习速率,bm为第m个回归树,αm={α1,α2,…}为bm的参数集;采用bayesian优化算法,以交叉验证的mse为目标函数,对模型的学习速率、最大分割数、学习循环数3个参数进行更新,寻找最佳模型参数组合,使得目标函数达到最小。
15、所述的步骤3),lsboost模型或pls-lsboost模型的预测变量重要性得分为,
16、
17、
18、其中,vilsbj为第j个变量的重要性得分,分别为化合物或主成分xj在提升树集合中和在单个树中的相对重要性得分;m是树的个数,j是树t的叶子节点个数;vt是在节点t上的分割变量,是因分割产生的平方误差的减小量。
19、所述的步骤3),依次过滤重要性得分小的预测变量,得到交叉验证的mse随着预测变量个数减少而变化的学习曲线,确定使交叉验证的mse最小的最优预测变量组合。所述的步骤4),lsboost模型的化合物重要性得分同5,pls-lsboost模型的化合物重要性得分为,
20、
21、
22、
23、其中,vipls-lsbj为第j个变量的重要性得分,vilsbb为第b个主成分在lsboost中的相对重要性,wbj为化合物xb在第b个主成分上的权重。
24、所述的步骤4),选择在最佳模型中重要性得分大于0的化合物,和在非最佳模型中重要性得分大于0且与预测变量显著相关的化合物,作为辐照过程中的标志化合物。
25、所述的步骤5),对比交叉验证mse与r2,确定最佳模型类型、模型参数和预测变量组合;将自然陈酿白酒样品在主成分上的得分代入pls-lsboost模型,将原始数据代入lsboost模型,进行工艺参数预测。
26、本发明相对于现有技术而言,具有以下有益效果:辐照过程中条件参数的选择直接影响着辐照酒最终的风味,在实际应用过程中,需要繁琐的实验和感官品评来确定,效率较低。传统的化学计量学方法如偏最小二乘回归和多元线性回归过于简单,拟合能力较差,不足以应用于复杂的辐照催陈系统。而与传统的预测模型如bp神经网络相比,pls-lsboost模型和lsboost模型适用于不同的数据集,能够提供直观的数学方程,有助于深入理解预测结果和数据背后的机理;可以显示因素的重要性,筛选标志性化合物。使用pls-lsboost建立辐照工艺参数的预测模型,解决辐照酒工艺优化的技术难题,有利于提高辐照酒生产效率,降低技术成本,带来经济效益,也有利于推进辐照酒的标准化、规范化生产。