酒类产品鉴别的方法与流程

文档序号:15254614发布日期:2018-08-24 20:24阅读:523来源:国知局

本发明涉及一种酒类产品鉴别的方法,该方法可以用于酒类产品的品类、品牌、品系、品质、香型、产地、年份的鉴定,也可用于酒类产品的真伪鉴别,属于酒类鉴别技术领域。



背景技术:

食品的质量和安全性是消费者最关心的问题。食品检测检验技术是保障食品安全和质量的技术保障。传统的食品检测主要对食品中某几种特征成分进行鉴定。然而食品是一种十分复杂的化合物体系,即使是一种来源简单的食品,其包含的化合物也有成千上万种。这种依赖特征组分分析的方法不能全面分析食品的组分,时常会导致食品检测结果的不准确。而且,在利益的驱使之下这种特征组分依赖的方法,常常被造假者利用。为了有效控制食品的质量和安全,特别是在当前造假手段越来越技术化的趋势下,一种可靠、简便特征组分非依赖的食品检测分析方法是食品检验领域的迫切需求。

在复杂的食品分类中,酒类是其中价格较高的一类产品,造假制假现象也较为严重。酒类种类也十分繁多,并且酒的价格在很大程度上和品牌年份的相关度较高,使用传统的方法基本上无法进行品牌和年份的识别,这也为酒类的检测识别提出了更高的要求。除此之外,当前制造业高度发展的趋势下,商品的定制化趋势十分显著,各大品牌的都在争相推出定制酒,如何对这些定制酒进行品质控制,也是当前面临的重要问题。当前的技术条件下,上述这些问题还无法使用仪器分析来解决,还要严重的依赖于人的感官评定。这极大的限制了酒类产业的发展,也为品质和安全监管带来了困难。

在酒类产品中,白酒在我国具有独特的地位和悠久的历史,其独特的风味受到广大老百姓的喜爱。由于其特殊的原材料和多样化的酿造工艺,形成了不同的香型白酒。按照主体风味物质,香味特点等原则,目前白酒香型可以确立为浓香型,清香型,酱香型,凤香,特香,兼香型等11种香型。即使是相同香型的白酒,由于生产原料来源和原料配比的不同,地理条件和气候的差异也会造成白酒中微量物质和物质之间的量比关系发生变化,而造成白酒风味的差异,从而形成不同的酒体风格,不同的白酒品牌。然而白酒同时也属于酒类中附加值较高的种类,品牌年份的区分又没有很好的仪器分析方法,白酒造假在酒类造假中所占的比例较高。这不但侵犯了白酒企业的知识产权,也侵害了消费者的权益,更加损害了食品安全相关部门的权威性。因此,开发全可靠又稳定的酒类(特别是白酒)的分类鉴别方法,对于企业、消费者、政府监管部门来说需求都十分迫切。

关于白酒的鉴别和检测研究国内外都已经开展了多年的研究,开发了多种不同的方法,目前这些方法,主要依赖于传统的检测技术,检测到的化合物数量也非常有限,比如气相色谱-质谱联用技术、气相色谱闻香技术、电子鼻检测和荧光光谱法等,这些方法能检测到的化合物数量最多上百种。这些方法对于复杂的食品来说,遗漏了太多重要的化合物组成信息,鉴别能力有限。往往仅能鉴别几种白酒,而且一种方法只能实现一种鉴别目的,耗时、费力,使用成本较高。从分析方法上来说,现有的分析方法,主要着眼于特征组分的分析,比如对质谱数据来说,主要是简单地针对某种特征化合物或质谱进行研究,但是,有时某些特征化合物或质谱不足以代表全部的质谱信息,这就造成了一些信息量的丢失。



技术实现要素:

本发明所要解决的技术问题是:提供一种酒类产品鉴别的方法,能够对酒类产品品牌和香型进行鉴别,操作简单,检测灵敏度高,结果客观可靠。

为解决上述技术问题本发明所采用的技术方案是:酒类产品鉴别的方法,包括如下步骤:

一、样品制备:

a、取样:抽取一定数目的酒类产品,并从中抽取一定量的液体用于后续步骤b的制样;

b、制样:使用液液萃取或者顶空固相微萃取或者两者结合的方法对样品进行抽提、浓缩处理;

c、保存:上述制样步骤得到的样品如果不立刻测试,置于低温保存;

二、数据采集:

d、进样:抽取上述制备好的样品0.5μl~5μl,进样到色谱仪中,进行仪器分析;

e、跑样:进样后,控制一定条件进行色谱和质谱分析,并进行实时数据采集;

f、数据导出:上述供试样品由全二维气相色谱/飞行时间质谱得到的色谱图经lecochromatoftm软件数据处理并对齐,设置自动导出三维数据,从而获得不同品牌或香型酒类产品的酒样质荷比m/z20~400范围内的离子丰度值数据,得到离子丰度质谱图;

三、数据分析:

g、数据预处理:采取归一法对数据进行预处理,区间是(-1,+1);

h、模型建立:将步骤g得到的离子丰度数据作为支持向量机的输入,酒类产品的品牌或香型预设值作为分类类别,导入matlab软件,构建不同品牌、不同香型酒类产品的品牌预测模型;使用训练集数据对模型进行训练,用k-cv交叉验证和网格搜索寻找最优惩罚因子c和σ核函数参数,在最佳参数下,建立不同品牌、不同香型酒类产品的预测模型;

i、识别分析:将步骤g中预处理后的测试样品数据,作为输入,使用步骤h中建立的模型进行运算,实现酒类的识别。

进一步的是:步骤a中的取样量,对于液液萃取来说体积为10ml~200ml,对于顶空固相微萃取来说体积为0.1ml~10ml。

进一步的是:步骤b中顶空固相微萃取使用的萃取纤维是75-μmcar/pdms、85-μmpa、65-μmpdms/dvb、50/30-μmdvb/car-pdms中的一种。

进一步的是:步骤b中顶空固相微萃取的步骤为:首先加入去离子水稀释成30%~33%vol,然后按摩尔比1mol/l加入氯化钠,搅拌使其完全溶解,取处理后的样品至螺纹顶空瓶中;条件是:样品首先在40℃-45℃,最佳为42.5℃,孵育30min-35min,最佳为32.5min,然后在相同温度下使用固相微萃取纤维萃取35min-40min,最佳为37.5min,搅拌速度为100rpm。

进一步的是:步骤b的液液萃取中,所用的溶剂为正戊烷、乙醚或者其他性质类似或相同的有机溶剂;具体操作为,样品取40ml,分别加入2g氯化钠,搅拌使其完全溶解;向溶液中加入10ml的饱和氯化钠溶液,将其移入分液漏斗中,分别使用40ml,40ml,30ml,20ml萃取剂进行萃取,将萃取所获得的有机相混合收集,再置于分液漏斗中,分别使用饱和氯化钠溶液和去离子水各洗涤两次,收集洗涤后的有机相溶液,加入10g无水硫酸钠干燥12个小时;干燥后的溶液使用漏斗过滤,随后在旋转蒸发仪中进行初步浓缩,最后用氮气浓缩至0.5ml。

进一步的是:步骤c中的低温是指-80℃~4℃。

进一步的是:步骤e中,气相色谱升温程序是:初始温度60℃,保持1分钟,然后以1℃/min~10℃/min的速度升温至165℃,再以20℃/min~30℃/min的速度升温至280℃,保持14分钟;检测器温度:280℃。

进一步的是:步骤e中,质谱条件是:扫描范围为20到400u,采集速率为100spectra/s,电压70ev,离子源温度220℃,传输线路温度250℃,检测器电压1700v,试管内部压力10-7托。

进一步的是:步骤h中,模型建立时,采用酒样质荷比m/z20~200范围内的离子丰度值数据。进一步的是:步骤h中,机器学习算法中的支持向量机的核函数为径向基函数,具体表达式为:

式中,αi为拉格朗日因子,b为偏差,xi为输入向量,σ核函数参数,c为惩罚因子。

本发明的有益效果是:本发明结合使用顶空固相微萃取、液液萃取、全二维气相色谱/飞行时间质谱和机器学习算法,以白酒作为模式酒,建立了不依赖特征组分分析的酒类识别方法,并用这一方法分析不同品牌酒类产品的酒样,可以不用解析图谱中的单个化合物,通过软件导出三维数据,获得不同酒样的三维质谱数据。最后对不同的机器学习算法进行了测试,建立了机器学习的数据库、模型、算法。该方法能够紧紧依靠仪器分析获得的原始数据和识别算法模型对酒类的品牌、香型、品质等实现精准的识别,相比于传统方法不需要经过繁琐的数据预处理,不依赖于人的经验,更客观可靠,速度更快,而且随着样本库的增加将可以实现更加精准的识别。本发明是一种全新的酒类产品质量控制和品牌鉴别技术,操作简单,检测灵敏度高,结果客观可靠。

附图说明

图1为酒类产品鉴别流程示意图;

图2为34种不同品牌白酒的质谱图;

图3为22种浓香型白酒m/z20-400的品牌真实值和预测值;

图4为22种浓香型白酒m/z20-200的品牌真实值和预测值;

图5为34种不同香型白酒m/z20-400的品牌真实值和预测值;

图6为34种不同香型白酒m/z20-200的品牌真实值和预测值;

图7为10种相同产地不同品牌白酒m/z20-400的品牌真实值和预测值;

图8位10种相同产地不同品牌白酒m/z20-200的品牌真实值和预测值;

图9为34种不同品牌白酒m/z20-400的香型真实值和预测值;

图10为34种不同品牌白酒m/z20-200的香型真实值和预测值。

具体实施方式

下面结合附图对本发明作进一步说明。

如图1所示,本发明包括如下步骤:

一、样品制备:

a、取样:抽取一定数目的酒类产品,并从中抽取一定量的液体用于后续步骤b的制样。

b、制样:使用液液萃取(lle)或者顶空固相微萃取(hs-spme)或者两者结合的方法对样品进行抽提、浓缩处理;步骤a中的取样量,对于液液萃取来说体积为10ml~200ml,优选为40ml,对于顶空固相微萃取来说体积为0.1ml~10ml,优选为1ml。

顶空固相微萃取使用的萃取纤维是75-μmcar/pdms、85-μmpa、65-μmpdms/dvb、50/30-μmdvb/car-pdms或其他类似的产品。

顶空固相微萃取的步骤为:首先加入去离子水稀释成30%~33%vol,然后按摩尔比1mol/l加入氯化钠,搅拌使其完全溶解,取处理后的样品至螺纹顶空瓶中;条件是:

样品首先在40℃-45℃,最佳为42.5℃,孵育30min-35min,最佳为32.5min,然后在相同温度下使用固相微萃取纤维萃取35min-40min,最佳为37.5min,搅拌速度为100rpm。

液液萃取中,所用的溶剂为正戊烷、乙醚或者其他性质类似或相同的有机溶剂;具体操作为,样品取40ml,分别加入2g氯化钠,搅拌使其完全溶解;向溶液中加入10ml的饱和氯化钠溶液,将其移入分液漏斗中,分别使用40ml,40ml,30ml,20ml萃取剂进行萃取,将萃取所获得的有机相混合收集,再置于分液漏斗中,分别使用饱和氯化钠溶液和去离子水各洗涤两次,收集洗涤后的有机相溶液,加入10g无水硫酸钠干燥12个小时;干燥后的溶液使用漏斗过滤,随后在旋转蒸发仪中进行初步浓缩,最后用氮气浓缩至0.5ml。

c、保存:上述制样步骤得到的样品如果不立刻测试,置于低温保存;低温是指-80℃~4℃。

二、数据采集:

d、进样:抽取上述制备好的样品0.5μl~5μl,优选为1μl,进样到色谱仪中,进行仪器分析;

e、跑样:进样后,控制一定条件进行色谱和质谱分析,并进行实时数据采集。

步骤e中气相色谱升温程序是:初始温度60℃,保持1分钟,然后以1℃/min~10℃/min的速度升温至165℃,该步骤优选为以5℃/min的速度升温;再以20℃/min~30℃/min的速度升温至280℃,该步骤优选为以25℃/min的速度升温,保持14分钟;检测器温度:280℃。

质谱条件是:扫描范围为20到400u,采集速率为100spectra/s,电压70ev,离子源温度220℃,传输线路温度250℃,检测器电压1700v,试管内部压力10-7托。

f、数据导出:上述供试样品由全二维气相色谱/飞行时间质谱得到的色谱图经lecochromatoftm软件数据处理并对齐,设置自动导出三维数据,从而获得不同品牌或香型酒类产品的酒样质荷比m/z20~400范围内的离子丰度值数据,得到离子丰度质谱图。

三、数据分析:

g、数据预处理:由于离子丰度值存在明显的数量级差异,因此,需要对原始数据进行合适的变换处理来消除数量级对结果的影响。本发明中采取归一法对数据进行预处理,区间是(-1,+1);

h、模型建立:将步骤g得到的离子丰度数据作为支持向量机(supportvectormachine,svm)的输入,酒类产品的品牌或香型预设值作为分类类别,导入matlab软件,构建不同品牌、不同香型酒类产品的品牌或香型预测模型;使用训练集数据对模型进行训练,用k-cv交叉验证和网格搜索寻找最优惩罚因子c和σ核函数参数,在最佳参数下,建立不同品牌、不同香型酒类产品的预测模型;支持向量机的核函数为径向基函数,具体表达式为:

式中,αi为拉格朗日因子,b为偏差,xi为输入向量,σ核函数参数,c为惩罚因子。

步骤h中,模型建立时,优选采用酒样质荷比m/z20~200范围内的离子丰度值数据。

i、识别分析:将步骤g中预处理后的测试集样品数据,作为输入,使用步骤h中建立的模型进行运算,实现酒类的识别。

实施案例1:浓香型白酒的品牌鉴别1。

一、样品制备:

a、取样:采集253个酒样,34种品牌,6种香型。具体白酒信息见表1。取白酒酒样1ml。

b、制样:加入去离子水稀释成31%vol,然后按摩尔比1mol/l加入氯化钠,搅拌使其完全溶解,取10ml处理后的样品至20ml规格的螺纹顶空瓶中;顶空固相微萃取(hs-spme)条件:样品首先在42.5℃孵育32.5min,然后在相同温度下使用固相微萃取纤维(75-μmcar/pdms)萃取37.5min,搅拌速度为100rpm。

c、保存:上述制样步骤得到的样品如不立刻测试,置于-20℃保存备用。

表1白酒样品信息

二、数据采集:

d、进样:抽取上述制备好的样品1μl进行仪器分析。

e、跑样:所用仪器,全自动全二维气相色谱-飞行时间质谱仪(美国leco公司);气相色谱升温程序:初始温度60℃,保持1分钟,然后以5℃/min的速度升温至165℃,再以25℃/min的速度升温至280℃,保持14分钟。检测器温度:280℃。

质谱条件:扫描范围为20到400u,采集速率为100spectra/s,电压70ev,离子源温度220℃,传输线路温度250℃,检测器电压1700v,试管内部压力10-7托。

f、数据导出:上述供试的白酒样品经全二维气相色谱/飞行时间质谱得到的色谱图,首先用lecochromatoftm软件数据处理并对齐:一维峰宽和二维峰宽分别设置为24和0.2,基线位移值设置为1,信噪比设置为50,然后用mainlib、replib和nist质谱库分析,设置自动导出三维数据,从而获得不同品牌白酒酒样质荷比m/z20-400范围内的离子丰度值数据,最后用origin软件画出离子丰度质谱图,253个酒样离子丰度质谱图见图2。

三、数据分析:

g、数据预处理:由于离子丰度值存在明显的数量级差异,因此,需要对原始数据进行合适的变换处理来消除数量级对结果的影响。本发明中采取归一法对数据进行预处理,区间是(-1,+1);

h、模型建立:步骤g中所述的离子丰度数据作为支持向量机(supportvectormachine,svm)的输入,白酒的品牌预设值作为分类类别,导入matlabr2016b(themathworksinc.,natick,ma)软件,构建浓香型白酒的品牌预测模型,使用训练集数据对模型进行训练,确定相关参数,主要包括用k-cv交叉验证和网格搜索寻找最优惩罚因子c和σ核函数参数。将训练集的120个样品分为10组,将每一组的数据分别做一次验证集,其余的9组数据作为训练集,这样就得到10个模型的最终验证集分类准确率,求其平均,作为模型的准确率。得到的每种不同质谱范围对应的最佳参数如表2所示。在最佳参数下,建立不同香型白酒品牌的预测模型:由以上参数构建的svm模型对52个测试集样本进行预测,得到在最佳参数下测试集的准确率,结果如表2,图3和图4所示。

i、识别分析:将步骤g中所述的预处理后测试集数据,作为输入,使用步骤h中建立的模型进行运算,实现酒类的识别。从表2中可以看出选用m/z20-200数据建立的模型,得到的模型准确率最高,为96.15%。如果选用m/z20-400的数据,预测样本有6个样本被错误分类,错误率相对于选用m/z20-200数据建立的模型要更高。

表2svm模型最佳参数与准确率

实施案例2:浓香型白酒的品牌鉴别2。

一、样品制备:

a、取样:与实施例1相同;

b、制样:与实施例1相同;

c、保存:保存温度为4℃。

二、数据采集:

d、进样:抽取上述制备好的样品2μl进行仪器分析;

e、跑样:所用仪器,全自动全二维气相色谱-飞行时间质谱仪(美国leco公司);气相色谱升温程序:初始温度60℃,保持1分钟,然后以1℃/min的速度升温至165℃,再以20℃/min的速度升温至280℃,保持14分钟。检测器温度:280℃。

质谱条件:扫描范围为20到400u,采集速率为100spectra/s,电压70ev,离子源温度220℃,传输线路温度250℃,检测器电压1700v,试管内部压力10-7托。

f、数据导出:与实施例1相同。

(三)、数据分析

g、数据预处理:与实施例1相同。

h、模型建立:与实施例1相同。

i、数据分析:数据分析方法与实施例1相同;分析得到的结果为对同种香型不同品牌的鉴别准确率为90.60%。

实施案例3:浓香型白酒的品牌鉴别3。

一、样品制备:

a、取样:与实施例1相同;

b、制样:与实施例1相同;

c、保存:保存温度为0℃。

二、数据采集:

d、进样:抽取上述制备好的样品2μl进行仪器分析;

e、跑样:所用仪器,全自动全二维气相色谱-飞行时间质谱仪(美国leco公司);气相色谱升温程序:初始温度60℃,保持1分钟,然后以10℃/min的速度升温至165℃,再以30℃/min的速度升温至280℃,保持14分钟。检测器温度:280℃。

质谱条件:扫描范围为20到400u,采集速率为100spectra/s,电压70ev,离子源温度220℃,传输线路温度250℃,检测器电压1700v,试管内部压力10-7托。

f、数据导出:与实施例1相同。

三、数据分析:

g、数据预处理:与实施例1相同。

h、模型建立:与实施例1相同。

i、数据分析:数据分析方法与上述事实例1相同;分析得到的结果为对同种香型不同品牌的鉴别准确率为95.5%。

实施案例4:不同香型白酒的品牌鉴别。

一、样品制备:

步骤a~步骤c与实施例1相同。

二、数据采集:

步骤d~步骤f与实施例1相同。

三、数据分析:

g、数据预处理:由于离子丰度值存在明显的数量级差异,因此,需要对原始数据进行合适的变换处理来消除数量级对结果的影响。本发明中采取归一法对数据进行预处理,区间是(-1,+1)。

h、模型建立:用k-cv交叉验证和网格搜索寻找最优惩罚因子c和σ核函数参数;为了得到比较理想的分类预测模型,需要优化支持向量机相关的惩罚参数c和核函数参数σ。选择k-cv方法对参数进行寻优,将训练集的170个样品分为10组,将每一组的数据分别做一次验证集,其余的9组数据作为训练集,这样就得到10个模型的最终验证集分类准确率,求其平均,作为模型的准确率。得到的每种不同质谱范围对应的最佳参数如表3所示。在最佳参数下,建立不同香型白酒品牌的预测模型。

i、数据分析:由以上参数构建的svm模型对83个测试集样本进行预测,得到在最佳参数下测试集的准确率,结果如表3,图5和图6所示。从表3中可以看出选用m/z20-200数据建立的模型,得到的模型准确率最高,为91.57%。如果选用m/z20-400的数据,预测样本有14个样本被错误分类,错误率相对于选用m/z20-200数据建立的模型要更高。

表3svm模型最佳参数与准确率

实施案例5:相同产地的白酒品牌鉴别。

一、样品制备:

a、取样:所选择的样品及其信息见表4,取样量同实施例1。

表4相同产地白酒信息

b、制样:与实施例1相同;

c、保存:与实施例1相同。

二、数据采集:

步骤d~步骤f与实施例1相同。

三、数据分析:

g、数据预处理:与实施例1相同。

h、模型建立:为了得到比较理想的分类预测模型,需要优化支持向量机相关的惩罚参数c和核函数参数σ。选择k-cv方法对参数进行寻优,将训练集的35个样品分为5组,将每一组的数据分别做一次验证集,其余的4组数据作为训练集,这样就得到5个模型的最终验证集分类准确率,求其平均,作为模型的准确率。得到的每种不同质谱范围对应的最佳参数如表5所示。

i、由以上参数构建的svm模型对16个测试集样本进行预测,得到在最佳参数下测试集的准确率,结果如表5,图7和图8所示。从表6中可以看出选用m/z20-200数据建立的模型,得到的模型准确率最高,为93.75%。如果选用m/z20-400的数据,预测样本有3个样本被错误分类,错误率相对于选用m/z20-200数据建立的模型要更高。

表5svm模型最佳参数与准确率

实施案例6:相同产地的白酒品牌鉴别。

一、样品制备:

a、取样:与上述实施例5相同。

b、制样:与实施例2相同。

c、保存:与实施例3相同。

二、数据采集:

d、进样:与实施例1相同;

e、与实施例2相同。

f、与实施例2相同。

三、数据分析:

g、数据预处理:与实施例1相同。

h、模型建立:与实施例5相同

i、由以上参数构建的svm模型对16个测试集样本进行预测,得到在最佳参数下测试集的准确率。选用m/z20-200数据建立的模型,得到的模型准确率最高,为91.65%。如果选用m/z20-400的数据,预测样本有3个样本被错误分类,错误率相对于选用m/z20-200数据建立的模型要更高。

实施案例7:不同品牌白酒的香型鉴别。

一、样品制备:

步骤a~步骤c与实施例1相同。

二、数据采集:

步骤d~步骤f与实施例1相同。

三、数据分析:

g、数据预处理:与实施例1相同。

h、模型建立:本实施例中的将训练集的170个样品分为10组,将每一组的数据分别做一次验证集,其余的9组数据作为训练集,这样就得到10个模型的最终验证集分类准确率,求其平均,作为模型的准确率。为了得到比较理想的分类预测模型,需要优化支持向量机相关的惩罚参数c和核函数参数σ。选择k-cv方法对参数进行寻优得到的每种不同质谱范围对应的最佳参数如表6所示。

i、由以上参数构建的svm模型对83个测试集样本进行预测,得到在最佳参数下测试集的准确率,结果如表6,图9和图10所示。从表6中可以看出选用m/z20-200数据建立的模型,得到的模型准确率最高,为98.80%。如果选用m/z20-400的数据,预测样本有2个样本被错误分类,错误率相对于选用m/z20-200数据建立的模型要更高。

表6svm模型最佳参数与准确率

实施案例8:不同品种酒的鉴别。

一、样品制备:

a、取样:本实施例中选择的样品包括白酒、黄酒、葡萄酒三种酒类具体种类为:五种白酒,分别为竹叶青、孔府家酒、口子酒、茅台迎宾酒、五粮醇;三种黄酒,分别为古越龙山(特醇)、古越龙山(三年醇)、石库门;三种红酒,分别为张裕、长城干红(窖醇)、长城干红(三年醇);取样量为40ml。

b、制样:本实施例中采用液液萃取进行样品制备。

c、与实施例1相同。

二、数据采集:

步骤d~步骤f与实施例1相同。

三、数据分析:

g、数据预处理:根据全二维气相色谱-飞行时间质谱仪的数据,将峰面积小于平均值的物质删去,保留峰面积大于平均值的物质,选取一维出峰时间作为特征量。由于每个样品的特征量不同,选特征量最多的一个样品对齐其它的样本,不齐的特征量用0补齐。将特征值数据归一化至(-1,+1)范围内。

h、模型建立:五种白酒(竹叶青、孔府家酒、口子酒、茅台迎宾酒、五粮醇)、三种红酒(张裕、长城干红窖醇、长城干红三年醇)、三种黄酒(古越龙山特醇、古越龙山三年醇、石库门),通过步骤g的数据处理,每个样品提取144个特征值。用这些特征值进行分类训练得到模型。

i、数据分析:用上述模型对不同种类酒进行分类,经过交叉验证和参数调整,svm的分类准确率为98.4%。并且特征值个数的减少可以提高分类准确率,因此每个样品只取峰面积最大的前十个出峰时间作为特征值,经过交叉验证和参数调整,svm模型的分类准确率达到了100%。对五种白酒的样品(竹叶青、孔府家酒、口子酒、茅台迎宾酒、五粮醇)进行分类分析的结果表明,经过交叉验证和参数调整,svm的分类准确率为46.7%。样本量较少,变量较多会增加分析问题的复杂性和不重要变量对模型准确率的干扰,因此重新调整特征值数量,只取峰面积最大的前十个出峰时间作为一个样品的特征值,重新进行交叉验证和参数调整,svm的分类准确率提高到60%。通过上述两种不同方法建立的svm模型,发现不同品类的酒(第一种方法)建立的svm模型准确率较高,而相同品类的酒(第二种方法)建立模型的准确率偏低。据此,我们推测,相同品类酒的成分、含量相近或相似,少量样本不足以区分,因此样本数量的多少是准确率提高的限制性因素。为证实猜想,我们进行如下尝试:用固相微萃取提取的120个泸州老窖白酒样品,通过数据处理,每个样品提取了241个特征值。分别用12个、20个、40个、60个、120个样品,经过交叉验证和参数调整,svm给出的分类准确率呈上升趋势。这个结果表明,样本数量的增加可以显著地提高模型的准确率,因此相同品类的白酒需要通过提高样本数量来提高预测结果的可靠性和准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1