一种苋菜红色素浓度检测方法、装置及存储介质

文档序号:26949165发布日期:2021-10-16 00:29阅读:81来源:国知局
一种苋菜红色素浓度检测方法、装置及存储介质

1.本发明主要涉及数据检测技术领域,具体涉及一种苋菜红色素浓度检测方法、装置及存储介质。


背景技术:

2.随着对烘焙食品需求的增加,人造奶油市场发展迅速。人造奶油成本低,色泽口味与奶油一样。人工合成色素是人造奶油中常见的食品添加剂。国家列入卫生使用标准的8种人工色素有:胭脂红、苋菜红、日落黄、赤藓红、柠檬黄、新红、靛蓝、亮蓝。人工合成色素如果添加在国家食品安全规定范围内,是不会对人体造成危害的。过量使用人工色素会降低生育能力,影响儿童智力,甚至致癌。目前人工色素的检测方法有薄层色谱法、高效液相色谱法、极谱法、分光光度法、毛细管电脉法等,但这些方法均需要消耗大量人力并且需要检测人员具备专业知识才能进行检测,因此,如何解决传统的人工色素检测方法中需要消耗大量人力并且需要检测人员具备专业知识才能进行检测的问题,对消费者和整个市场而言都是一个急需解决的问题。


技术实现要素:

3.本发明所要解决的技术问题是针对现有技术的不足,提供一种苋菜红色素浓度检测方法、装置及存储介质。
4.本发明解决上述技术问题的技术方案如下:一种苋菜红色素浓度检测方法,包括如下步骤:
5.从傅里叶红外光谱仪中导出待检测光谱数据以及多个原始光谱数据;
6.集合所有所述原始光谱数据得到原始光谱数据集,并对所述原始光谱数据集进行预处理,得到目标光谱数据集;
7.构建近红外估测模型,对所述目标光谱数据集和所述近红外估测模型进行模型优化,得到检测模型;
8.通过所述检测模型对所述待检测光谱数据进行检测,得到检测结果。
9.本发明解决上述技术问题的另一技术方案如下:一种苋菜红色素浓度检测装置,包括:
10.光谱数据获得模块,用于从傅里叶红外光谱仪中导出待检测光谱数据以及多个原始光谱数据;
11.数据预处理模块,用于集合所有所述原始光谱数据得到原始光谱数据集,并对所述原始光谱数据集进行预处理,得到目标光谱数据集;
12.模型优化模块,用于构建近红外估测模型,对所述目标光谱数据集和所述近红外估测模型进行模型优化,得到检测模型;
13.检测结果获得模块,用于通过所述检测模型对所述待检测光谱数据进行检测,得到检测结果。
14.本发明解决上述技术问题的另一技术方案如下:一种苋菜红色素浓度检测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的苋菜红色素浓度检测方法。
15.本发明解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的苋菜红色素浓度检测方法。
16.本发明的有益效果是:通过对原始光谱数据集的预处理得到目标光谱数据集,便于获得预测准确率更高的模型,通过目标光谱数据集对近红外估测模型的模型优化得到检测模型,有效地提高了对人工色素浓度预测的可靠性和稳定性,通过检测模型对待检测光谱数据的检测得到检测结果,代替了传统人工色素的检测方法,不需要将样品溶解、稀释或溶解在特殊的溶剂中,节省了人力物力,解决了传统的人工色素检测方法中需要消耗大量人力并且需要检测人员具备专业知识才能进行检测的问题,不会对周围环境造成任何污染,且检测时间短,实验数据处理简单,检测成本低,检测效率高以及检测的稳定性强且准确率高,同时检测的方法简单,适合于普遍推广。
附图说明
17.图1为本发明实施例提供的苋菜红色素浓度检测方法的流程示意图;
18.图2为本发明实施例提供的苋菜红色素浓度检测装置的模块框图。
具体实施方式
19.以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
20.图1为本发明实施例提供的苋菜红色素浓度检测方法的流程示意图。
21.如图1所示,一种苋菜红色素浓度检测方法,包括如下步骤:
22.从傅里叶红外光谱仪中导出待检测光谱数据以及多个原始光谱数据;
23.集合所有所述原始光谱数据得到原始光谱数据集,并对所述原始光谱数据集进行预处理,得到目标光谱数据集;
24.构建近红外估测模型,对所述目标光谱数据集和所述近红外估测模型进行模型优化,得到检测模型;
25.通过所述检测模型对所述待检测光谱数据进行检测,得到检测结果。
26.应理解地,首先要进行需求分析,即根据用户提出的需求出发,挖掘用户内心的真实意图,得到产品需求,并根据产品需求获取实验数据(即所述原始光谱数据)。
27.应理解地,应用所述检测模型得到数据分析结果与结论,通过部署应用至生产系统中。
28.具体地,从傅里叶红外光谱仪中导出待检测光谱数据以及多个原始光谱数据的步骤如下:
29.步骤1:采用电子湿温度计保证在整个样品制作、扫描过程中,室温保持在20

25℃下进行。采用sartorius cp224s电子天平称量符合国家食品安全标准的色素浓度,精确至0.0001g,记录,加入打发好的奶油,称量,记录,搅拌均匀,装进40cm^3与仪器配套的样本容
器中,得到150个苋菜红奶油样本。
30.步骤2:将样本放入红外光谱仪中扫描,反射光谱扫描范围在760

1150 nm,每个样本扫描3次光谱,然后进行光谱平均,作为该样品最终光谱,得到原始光谱数据或者待检测光谱数据。
31.上述获得待检测光谱数据以及多个原始光谱数据的步骤与传统方法相比,不需要将样品溶解、稀释或溶解在特殊的溶剂中,不会对周围环境造成任何污染。且检测时间短,实验数据处理简单,检测成本低,可以很好的满足快速检测的要求。
32.上述实施例中,通过对原始光谱数据集的预处理得到目标光谱数据集,便于获得预测准确率更高的模型,通过目标光谱数据集对近红外估测模型的模型优化得到检测模型,有效地提高了对人工色素浓度预测的可靠性和稳定性,通过检测模型对待检测光谱数据的检测得到检测结果,代替了传统人工色素的检测方法,不需要将样品溶解、稀释或溶解在特殊的溶剂中,节省了人力物力,解决了传统的人工色素检测方法中需要消耗大量人力并且需要检测人员具备专业知识才能进行检测的问题,不会对周围环境造成任何污染,且检测时间短,实验数据处理简单,检测成本低,检测效率高以及检测的稳定性强且准确率高,同时检测的方法简单,适合于普遍推广。
33.可选地,作为本发明的一个实施例,所述对所述原始光谱数据集进行预处理,得到目标光谱数据集的过程包括:
34.通过堆叠合并算法对所述原始光谱数据集中的原始光谱数据进行第一次数据合并;
35.通过主键合并算法对第一次合并后的数据进行第二次数据合并,根据第二次合并后的数据得到光谱数据表;
36.对所述光谱数据表进行数据清洗,得到多个待处理光谱数据;
37.根据离差标准化算法分别对各个所述待处理光谱数据进行归一化处理,得到与各个所述待处理光谱数据对应的目标光谱数据,并集合所有的所述目标光谱数据得到目标光谱数据集。
38.应理解地,利用数据预处理方法有效去除所述原始光谱数据中夹杂的大量噪声信息,提高了光谱信噪比。
39.应理解地,所述原始光谱数据集通过堆叠合并和主键合并的方式,将关联的数据信息合并在一张数据表中,得到完整光谱数据表的结果(即所述光谱数据表)。
40.应理解地,所述原始光谱数据集先使用堆叠合并做行对齐,将行标签一致的后表数据添加到前表列的末尾;再使用主键合并对堆叠合并后的数据集以样本遍号列为基准匹配其他列进行合并,得到光谱数据表。
41.应理解地,堆叠合并是根据行、列索引进行数据表的拼接,可以调用 concat函数实现。
42.应理解地,数据清洗是指对完整光谱数据表(即所述光谱数据表)使用重复值、缺失值查询的方式进行处理。
43.应理解地,使用离差标准化方法(即所述离差标准化算法)对数据(即所述待处理光谱数据)进行归一化处理,将所有的数据(即所述待处理光谱数据)映射到统一尺度。
44.具体地,离差标准化方法(即所述离差标准化算法)进行归一化是对原始数据进行
线性变换,将原始数据的数值映射到[0,1]区间,转化公式为
[0045]
其中,max为样本数据的最大值,min为样本数据最小值,max

min为极差。
[0046]
具体地,由于数据中的异常值会使模型准确度大大减低,因此对数据进行预处理,消除了数据重复所导致数据分布偏差,以及数据缺失导致的样本信息减少等问题。数据预处理让数据分析工作继续往前推进,对后续构建更精确的模型起到重要的作用。
[0047]
上述实施例中,对原始光谱数据集的预处理得到目标光谱数据集,消除了数据重复所导致数据分布偏差,以及数据缺失导致的样本信息减少等问题,对后续构建更精确的模型起到了重要的作用。
[0048]
可选地,作为本发明的一个实施例,所述构建近红外估测模型,对所述目标光谱数据集和所述近红外估测模型进行模型优化,得到检测模型的过程包括:
[0049]
按照预设比例将所述目标光谱数据集内的多个目标光谱数据进行划分,得到训练集和测试集;
[0050]
基于支持向量机回归算法构建近红外估测模型;
[0051]
根据预设迭代训练次数将所述训练集输入至所述近红外估测模型中,对所述近红外估测模型进行模型训练,得到初步的检测模型;
[0052]
根据所述测试集对所述初步的检测模型进行预测分析,得到检测模型。
[0053]
优选地,所述预设比例可以为4:1。
[0054]
应理解地,基于支持向量机回归构建人造奶油色素浓度的近红外估测模型。
[0055]
应理解地,将目标光谱训练集(即所述训练集)输入支持向量机回归估测模型(即所述近红外估测模型)中,根据预设的迭代训练次数进行训练,得到初步的检测模型。
[0056]
具体地,支持向量机回归(svr)提供了一种使用核函数进行映射的方法,借助核函数将数据从低维空间映射到高维空间,从而解决了在原始空间中,光谱数据线性不可分的问题。
[0057]
具体地,通过构建回归模型可以预测人造奶油中的色素浓度,经过训练和预测两个步骤,训练是利用训练样本数据进行拟合,得到回归方程;预测是将测试数据(即所述测试集)代入方程中求出预测值。其中,使用支持向量机回归方法可以弥补最小二乘估计法和逐步回归局部最优估计的不足,在解决小样本、非线性的高维度问题上,有着特有的优势。
[0058]
上述实施例中,通过预设迭代训练次数将训练集输入至近红外估测模型中,对近红外估测模型的模型训练得到初步的检测模型,通过测试集对初步的检测模型的预测分析得到检测模型,解决了解决小样本、非线性的高维度问题,有效地提高了对人造奶油色素浓度预测的可靠性和稳定性。
[0059]
可选地,作为本发明的一个实施例,所述测试集包括多个光谱测试数据和与所述光谱测试数据对应的真实值,所述根据所述测试集对所述训练模型进行预测分析,得到检测模型的过程包括:
[0060]
s1:通过所述训练模型分别对各个所述光谱测试数据进行预测,得到与各个所述光谱测试数据对应的预测值;
[0061]
s2:对所有的所述预测值以及所有的所述真实值进行预测均方根误差的计算,得到预测均方根误差;
[0062]
s3:判断所述预测均方根误差是否小于预设预期值,若是,则将所述训练模型作为检测模型;若否,则对所述训练模型进行参数优化,得到所述检测模型。
[0063]
应理解地,将目标光谱预测集(即所述测试集)输入所述训练模型中,得到预测值。
[0064]
应理解地,若所述预测均方根误差小于预期值(即所述预设预期值),则将此模型作为最终回归模型(即所述检测模型),否则对模型进行优化。
[0065]
具体地,回归模型的预测结果和真值连续的,具有一套独立的评价指标,本发明选择均方误差rmsep来评价模型性能的优劣,通过训练使得rmsep值逐步接近于0,得到性能最好、精确度最高的回归预测模型。
[0066]
上述实施例中,通过测试集对训练模型的预测分析得到检测模型,有效地提高了对人工色素浓度预测的可靠性和稳定性。
[0067]
可选地,作为本发明的一个实施例,所述步骤s2的过程包括:
[0068]
通过第一式对所有的所述预测值以及所有的所述真实值进行预测均方根误差的计算,得到预测均方根误差,所述第一式为:
[0069][0070]
其中,rmsep为预测均方根误差,为预测值,y
i
为真实值,n为预测值总数。
[0071]
应理解地,将所述预测值与测试集中的所述真实值进行做差,求平方和并且与样本数相除以后开方,得到预测均方根误差(rmsep)。
[0072]
具体地,预测均方根误差(rmsep)是观测值与真值偏差的平方和与观测次数n比值的平方根,用来衡量观测值同真值之间的偏差,可以评价数据的变化程度,rmsep的值越小,说明预测模型描述实验数据具有更好的精确度。
[0073]
上述实施例中,通过第一式对所有的预测值以及所有的真实值的预测均方根误差计算得到预测均方根误差,构建了性能好且精确度高的模型,有效地提高了对人造奶油色素浓度预测的可靠性和稳定性。
[0074]
可选地,作为本发明的一个实施例,所述步骤s3中,对所述训练模型进行参数优化,得到所述检测模型的过程包括:
[0075]
s31:根据网格搜索算法对所述训练模型进行初次参数寻优得到第一最优参数;
[0076]
s32:根据所述第一最优参数对所述训练模型进行初次参数优化,并将经初次优化后的训练模型作为训练模型,并重新执行步骤s1至步骤s2,从而得到优化后的预测均方根误差,执行步骤s33;
[0077]
s33:判断所述优化后的预测均方根误差是否小于所述预设预期值,若是,则将所述初次优化后的训练模型作为所述检测模型;若否,则执行步骤 s34;
[0078]
s34:根据预设参数搜索步长对所述训练模型进行再次参数寻优,得到第二最优参数,并将所述第二最优参数作为所述第一最优参数,并重新执行步骤s32,直至所述优化后的预测均方根误差小于所述预设预期值,则将所述经初次优化后的训练模型作为所述检测模型。
[0079]
应理解地,所述初次参数优化和所述再次参数优化区别在与使用的最优参数不
同,但其参数优化的步骤相同;所述初次参数寻优和所述再次参数寻优区别在与使用的搜索步长不同,但其参数寻优的步骤相同。
[0080]
应理解地,模型的参数寻优使用网格搜索算法进行,通过对一定范围内的参数组合进行逐一验证,从其中选择出预测均方根误差最小的组合作为最优参数。
[0081]
应理解地,如果所得到的参数组合的训练模型依然达不到要求,则减小参数搜索步长重新进行搜索,直至找到最优的参数组合值(即所述最优参数)。
[0082]
具体地,网格搜索法(grid search)(即所述网格搜索算法)实质上是一种穷举法,其对所有的参数组合进行训练,可以通过设置参数的搜索步长来调整参数组合的范围,然后计算该参数组合下的支持向量机的模型的预测均方误差,选取误差值最小的参数组合。
[0083]
具体地,对回归模型使用了网格搜索算法进行参数优化,保证得到最好的参数组合。该算法作为支持向量机参数寻优当中应用的最为广泛的一种方法,具有可行性高、实施简单且效果好的优点。进行了优化后的模型误差值大大降低,能进一步确保最终回归模型(即所述检测模型)对色素浓度预测的准确率,精准地检测出奶油中苋菜红色素的浓度数据,保障色素的添加浓度在国家食品安全规定的范围内。
[0084]
上述实施例中,对训练模型的参数优化得到所述检测模型,大大地降低了模型误差值,能进一步确保模型对色素浓度预测的准确率,精准地检测出奶油中苋菜红色素的浓度数据,保障了色素的添加浓度在国家食品安全规定的范围内,具有可行性高、实施简单且效果好的优点。
[0085]
图2为本发明实施例提供的苋菜红色素浓度检测装置的模块框图。
[0086]
可选地,作为本发明的另一个实施例,如图2所示,一种苋菜红色素浓度检测装置,包括:
[0087]
光谱数据获得模块,用于从傅里叶红外光谱仪中导出待检测光谱数据以及多个原始光谱数据;
[0088]
数据预处理模块,用于集合所有所述原始光谱数据得到原始光谱数据集,并对所述原始光谱数据集进行预处理,得到目标光谱数据集;
[0089]
模型优化模块,用于构建近红外估测模型,对所述目标光谱数据集和所述近红外估测模型进行模型优化,得到检测模型;
[0090]
检测结果获得模块,用于通过所述检测模型对所述待检测光谱数据进行检测,得到检测结果。
[0091]
可选地,作为本发明的一个实施例,所述数据预处理模块具体用于:
[0092]
通过堆叠合并算法对所述原始光谱数据集中的原始光谱数据进行第一次数据合并;
[0093]
通过主键合并算法对第一次合并后的数据进行第二次数据合并,根据第二次合并后的数据得到光谱数据表;
[0094]
对所述光谱数据表进行数据清洗,得到多个待处理光谱数据;
[0095]
根据离差标准化算法分别对各个所述待处理光谱数据进行归一化处理,得到与各个所述待处理光谱数据对应的目标光谱数据,并集合所有的所述目标光谱数据得到目标光谱数据集。
[0096]
可选地,本发明的另一个实施例提供一种苋菜红色素浓度检测装置,包括存储器、
处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,当所述处理器执行所述计算机程序时,实现如上所述的苋菜红色素浓度检测方法。该装置可为计算机等装置。
[0097]
可选地,本发明的另一个实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的苋菜红色素浓度检测方法。
[0098]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
[0099]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0100]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
[0101]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
[0102]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0103]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

onlymemory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0104]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1