原料牛奶保存时间的快速鉴定方法

文档序号:26491336发布日期:2021-08-31 17:45阅读:205来源:国知局
本发明属于奶品分析
技术领域
:,具体涉及一种原料牛奶保存时间的快速鉴定技术。本发明的领域与中红外光谱领域相关。
背景技术
::牛奶含有蛋白质、脂肪、乳糖和各种维生素及矿物质等一百多种人体需要的营养元素,是一种营养丰富而全面的理想食品。原料牛奶(原料奶)可以制成种类众多的乳制品,包括液体乳类、乳粉类、炼乳类、乳脂肪类、乳冰淇淋类、干酪类、其它乳制品类,乳制品销售额大,涉及生活方方面面,是一种重要的国民食品来源。原料奶位于奶业产业链的最上游,其质量安全将直接影响到乳品的质量与安全,这就要求进行奶制品生产加工的原料奶必须来自健康奶牛,且感官正常,营养成分均衡,微生物指数低,无抗生素、药物残留,不掺假。原料奶在4℃条件下,随着保存时间延长,其酸度上升,ph值下降,乳糖含量下降,当保存时间超过3天时,酸度大于18°t,不符合国家原料奶标准[1]。原料奶的品质监控一直是企业生产环节中的重要一环,传统方法一般通过感官评价、测定酸度或者菌落总数[2]等进行原料奶品质监控,这些方法费时废力,又或需要专业人士来操作。李亮等人通过将近红外光谱技术结合进原料牛奶的酸度、ph、乳糖含量的检测中,用这些指标来判断原料奶的腐败程度[1]。中红外光谱(mir)分析是近年来快速发展起来的一种快速、无损、无公害、可多组分同时分析的现代技术,且广泛应用于乳用动物,特别是奶牛的生产性能测定,全国有30多家dhi中心,均应用中红外光谱技术进行检测。目前中红外技术已经应用在生鲜奶的酸度[3]、ph值[4]等保存天数变化相关指标的检测中,具备了直接用中红外测定奶样保存天数的条件,故而可以利用中红外光谱建立原料牛奶保存时间的快速鉴定技术。技术实现要素:本发明的目的在于克服现有技术存在的缺陷,提供一种基于中红外光谱分析的原料牛奶保存时间的快速鉴定方法。为了确定最佳的预处理和建模算法组合,本发明对光谱数据使用了包括不处理在内的5种预处理方法,结合2种建模方法,共建立了10个原料牛奶保存时间鉴定模型。并且通过对光谱数据进行pearson相关性检验和相关性的显著性分析筛选出建模使用的特征光谱。所建立的模型在测试集上的准确率为1.00,在验证集上的准确率为0.90。本发明的技术方案如下所述:一种基于中红外光谱分析的原料牛奶保存天数的快速鉴定方法,所述的方法包括以下步骤:1)选取奶样:分别采集不同保存天数的原料牛奶作为检测样本;2)采集中红外光谱:利用乳成分检测仪对步骤1)的检测样本进行扫描,通过与其相连的计算机输出样本对应的透光率,得到样本光谱图;3)对采集的原始中红外光谱数据进行预处理,将光谱数据由透射率(t)转换成吸光度(a),去除异常值;4)数据集的划分:将数据集分为训练集和测试集;5)建模波段的选择:筛选两种牛奶样本的显著差异波段,并去除水的吸收区域;6)模型的建立与筛选:以训练集奶样的中红外光谱作为输入值,以原料牛奶不同保存天数的类别作为输出值,使用不同光谱预处理方法和不同建模算法在训练集上构建模型,遵循准确性、特异性、灵敏度和auc等指标较高的原则对模型进行评估及筛选,选择最优的数据预处理和建模算法组合构建模型;7)最优模型的验证与应用:另取不同保存天数的原料牛奶样本,使用筛选出的最优模型对样本进行鉴别,评估其应用性能;其中:步骤2)中采集中红外光谱时,将不同保存天数的原料牛奶样本分别倒入直径3.5cm,高9cm的圆柱形采样管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测;步骤3)中根据a=log10(1/t)将透射率(t)转换为吸光度(a),使用马氏距离和乳脂乳蛋白的百分含量去除异常值,其中,保留光谱马氏距离≤3、乳脂和乳蛋白百分含量在平均值±3.5个标准差范围内的数据;步骤5)中使用的筛选差异波段的方法为pearson相关性检验和相关性的显著性检验,去除的水吸收区域为3587.94-2970.66cm-1和1716.81-1543.2cm-1,选择的建模波段是1769.075-1946.327cm-1和2254.591-2817.172cm-1两个波段;步骤6)中使用的光谱预处理方法为一阶微分(diff)、标准正态变量变换(snv)、多元散射校正(msc)和savitzky-golag卷积平滑(简称sg卷积平滑),使用的建模算法为随机森林(rf)和支持向量机(svm)。与现有技术相比,本发明有益效果如下所述:本发明的发明点在于:选择建模波段是1769.075-1946.327cm-1和2254.591-2817.172cm-1两个波段,预处理方法为一阶微分,建模方法为支持向量机。本发明实用性强,比近红外检测技术适用性更广。本发明操作方便、快捷、省时,可以快速得到检测结果,相较菌落总数计数等方法,本发明可以节约大量时间,符合生鲜奶在生产环节上要求及时和迅速的特点。附图说明图1:本发明建模波段的平均光谱。即二类原料牛奶在建模波段的平均吸光度图。附图标记说明:图1中横坐标为光谱波数,纵坐标为吸光度;图标实线0类表示保存时间一天的原料牛奶,虚线1类表示保存时间超过一天牛奶;图1(a)为建模波段的全部平均光谱图,图1(b)、1(c)分别为放大的局部光谱图,其中图1(b)的波段范围是3587.94-2970.66cm-1,图1(c)的波段范围是1716.81-1543.2cm-1。图2:本发明测试集的混淆矩阵。附图标记说明:roc曲线可以衡量模型在测试集的性能,横坐标为假阳性率,纵坐标为真阳性率,auc为roc曲线下与坐标轴围成的面积,取值范围在0.5和1之间,若auc越接近1.0,表明本发明的方法的真实性越高。图3:本发明测试集分类概率。附图标记说明:横坐标为预测概率,纵坐标为预测的类别,例如图中左下方圆点表示此样本被分为0类的概率为0.615,即判定为正确分类;图中的所有样本均被正确分类,且大部分概率为0.840-1.000。具体实施方式下面结合附图和实施例对本发明作进一步说明。本发明的实施方式所举的实施例中未注明具体条件的试验方法,按照常规方法和条件进行,或按照制造厂商所建议的条件操作(如产品使用说明书)。实施例1:模型的建立仪器与设备:选用delta公司生产的lactoscopetmft-b多功能乳品成分分析仪(按产品使用说明书操作)。具体步骤如下:(1)采集奶样和测定中红外光谱从奶牛场采集原料牛奶样本30个,共获得120个检测样本,所有原料牛奶储存在4℃条件下,连续4天测定对所有原料牛奶的中红外光谱(mir)。将奶样分别倒入直径3.5cm,高9cm的圆柱形样本管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测,通过其软件得到检测样本的透光率。(2)数据预处理对所有原料牛奶样本的中红外光谱计算出马氏距离保留光谱马氏距离≤3,乳脂和乳蛋白百分含量在3.5个标准差范围内的数据,表1为此过程的样本量变化统计,无异常样本,得到保存时间1天原料牛奶样本30个和保存时间2-4天原料牛奶样本90个,将其按分层抽样法分为训练集(n=88:保存时间1天原料牛奶21个、保存时间2-4天原料牛奶67个)和测试集(n=22:保存时间1天原料牛奶5个、保存时间2-4天原料牛奶17个)。在建模过程中,0代表保存时间1天原料牛奶类,1代表保存时间2-4天原料牛奶类。表2为两类原料牛奶常规乳成分的描述性统计,由表中可得,两类原料牛奶脂肪、蛋白、乳糖和总固形物等常规乳成分均没有显著差异(p>0.05)。结果见表1和表2。表1剔除异常值时的样本量变化表2两类原料牛奶常规乳成分的描述性统计说明:每个参数数值皆用平均值±平均值的标准差表示。其中a,b:在不同的原料牛奶类型中,相同的乳成分中具有不同上标的均值存在显著差异(p<0.05)。(3)鉴定模型的建立将光谱数据由透光率(t)转化为吸光度(a),并去除水的吸收区域,对光谱数据进行pearson相关性检验[5],并对相关性进行显著性分析,最终选择1769.075-1946.327cm-1和2254.591-2817.172cm-1两个波段进行建模。图1为建模波段的光谱。(4)模型的建立将数据集分为训练集(n=88)、测试集(n=22)和验证集(n=10)。分别采用一阶微分(diff)[6]、标准正态变量变换(snv)[7]、多元散射校正(msc)[8]和sg卷积平滑[9]对光谱数据进行预处理,同时也与不使用预处理的数据进行比较。使用随机森林(rf)[10]和支持向量机(svm)[11]算法利用训练集数据建立分类模型,并对测试集中的样本进行预测。在不同预处理下,rf和svm算法的建模结果如下表所示。表3不同预处理下rf和svm的建模结果(5)最优模型的筛选和确定在此鉴别模型中,准确率为正确判断占所有判断的概率,其值越接近1越好;灵敏度表示二分类中某一类被正确分类的比例,其值越接近1越好;特异性表示二分类中另一类被正确分类的概率,其值越接近1越好;auc是roc曲线下的面积,其直观地反映了roc曲线表达的分类能力,auc=1代表此分类器为完美分类器,0.5<auc<1代表此分类器优于随即分类器,0<auc<0.5则代表此分类器差于随即分类器。由表3可知,只有一阶微分预处理和用支持向量机建模的方法的各项指标达到最优,因此选择一阶微分与支持向量机的组合建立的模型为最优模型。利用选择的最优分类模型,预测测试集的22个检测样本。以roc曲线衡量模型在测试集的性能,以假阳性率为横坐标,真阳性率为纵坐标,得到的roc曲线如图2所示。auc为roc曲线下与坐标轴围成的面积,其取值范围在0.5和1之间,auc越接近1.0,表明方法的真实性越高。由图2可知,本实施例中测试集的auc为1,说明模型在测试集上的分类效果很好。图3为测试集中类别分类的概率,例如图3中左下方的绿点表示此样本被分为0类的概率为0.615,且为正确分类。由图3可知,测试集中的所有样本均被正确分类,且大部分概率为0.840-1.000。实施例2:本发明模型的应用采用实施例1的测定光谱、数据预处理等技术,对10个不同保存天数原料牛奶样本进行测定中红外光谱和处理,结果如表4所示。表4模型应用结果本发明利用筛选出的最优模型对原料牛奶保存天数进行快速鉴定,结果错判样本为1个,即将1类生奶判定到0类中,准确率达到0.90。本发明检测时间短(只需两分钟),所需样本量少(20ml),并且可以同时大批量检测原料牛奶,判断出原料牛奶是否保存时间超过1天。主要参考文献[1]李亮,近红外光谱技术在原料奶掺假快速检测及新鲜度检测中的应用研究[d].西北农林科技大学,2010;[2]卜海峰.生鲜牛乳微生物的检测与分析[j].农村科技,2011(01):59-60;[3]calamaril,gobbil,banip.improvingthepredictionabilityofft-mirspectroscopytoassesstitratableacidityincow'smilk.foodchem.2016feb1;192:477-84.doi:10.1016/j.foodchem.2015.06.103.epub2015jun30.pmid:26304375;[4]marchimd,fagancc,o'donnellcp,etal.predictionofcoagulationproperties,titratableacidity,andphofbovinemilkusingmid-infraredspectroscopy.[j].journalofdairyscience,2009,92(1):423-432;[5]pearsonk.determinationofthecoefficientofcorrelation[j].science,1909,30(757):23-25;[6]张浩等,基于近红外光谱结合机器学习算法检测食用明胶品种溯源的研究[j/ol].河南农业大学学报:1-10[2021-04-29];[7]吕美蓉等,光谱数据预处理对潮间带沉积物氮lssvm模型的影响研究[j].光谱学与光谱分析,2020,40(08):2409-2414;[8]张浩等,基于近红外光谱结合机器学习算法检测食用明胶品种溯源的研究[j/ol].河南农业大学学报:1-10[2021-04-29];[9]马云强等,基于高光谱成像的不同花期薇甘菊特征分析及监测模型研究[j].云南大学学报(自然科学版),2021,43(02):290-298;[10]韩兆迎等,基于svm与rf的苹果树冠lai高光谱估测[j].光谱学与光谱分析,2016,36(03):800-805;[11]陈书媛等,基于高光谱成像技术的白茶储藏年份判别[j/ol].食品工业科技:1-13[2021-04-29]。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1