1.本发明涉及牛肉状态鉴别技术领域,具体涉及一种基于高光谱特征加权的新鲜和冻融牛肉鉴别方法。
背景技术:2.牛肉因为营养价值高,尤其是蛋白质含量高,受到大多数消费者的欢迎。冷冻/解冻方法被用作保存牛肉中营养成分的有效手段,但在此过程中形成的冰晶会从物理和化学上破坏肉类,会导致部分的营养物质的损失。新鲜牛肉和冻融的牛肉的标签错误可能有意或无意地发生,导致生产者、零售商和消费者的经济收益或损失。因此,实现对新鲜和冻融的牛肉的准确、非破坏性和快速鉴别非常重要。
3.目前对于新鲜的牛肉和冻融的牛肉的鉴别方法大多数是光谱技术。光谱技术相比于很多传统的检测方法具有准确、快速和无损等优势,光谱数据也有了较为成熟的处理流程。由于光谱的波长过多,会含有较多的冗余信息,人们往往会利用特征选择的手段对光谱数据进行降维处理以实现更高的建模效果。目前光谱领域较为常用的特征选择方法较多且取得了一定的效果,但是利用单一的特征选择方法对光谱波段进行特征波长的提取具有片面性,并且不同的特征提取方法基于的原理都不相同,因此基于不同原理的特征选择方法综合评价方法更加具有优势。
4.方差过滤法作为一种仅仅基于特征的特征选择方法,通过删除低方差特征进而排除无显著性差异的特征实现特征的选择,并未考虑与目标值之间的关系;肯德尔相关系数法作为一种一个无参数假设检验,使用计算而得的相关系数去检验两个随机变量的统计依赖性,通过删除与目标标签之间的相关性小的特征实现特征选择;随机森林法作为一种基于模型的特征选择方法,主要通过计算各个特征的信息熵,删除信息熵较小的特征进而实现特征的选择。往往仅仅使用某一种方法提取的特征具有片面性,将多种特征选择综合评价得出的特征更具有代表性。虽然也有研究报道利用多种特征选择方法对光谱进行特征提取,但是其往往是顺序进行的,靠前的特征选择方法往往会占据一定的主导地位,具有一定的主观性,并没有真正意义上实现多种特征选择方式的融合。
技术实现要素:5.本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于高光谱特征加权的新鲜和冻融牛肉鉴别方法。本发明通过加权方式将不同的特征选择方法同时运用,全面地选出了最佳的特征波长子集,并结合卷积神将网络进行二次特征提取实现了新鲜和冻融牛肉的准确识别。
6.本发明的目的可以通过采取如下技术方案达到:
7.一种基于高光谱特征加权的新鲜和冻融牛肉鉴别方法,所述鉴别方法包括如下步骤:
8.s1、分别采集新鲜牛肉和冻融牛肉的高光谱图像,对高光谱图像进行黑白板校正,
提取平均光谱;
9.s2、分别利用方差过滤法、肯德尔相关系数法和随机森林法对同一批样本的平均光谱进行特征选择,分别获得方差值、肯德尔相关系数和信息熵由大到小排序前n个波长,即可总共获得n*3个波长,其中,n取值区间为[15,25];
[0010]
s3、分别计算前n个波长方差值的归一化值、前n个波长肯德尔相关系数的归一化值和前n个波长信息熵的归一化值;
[0011]
s4、将获得的n*3个波长的归一化值混合并从大到小重新排序,取前n个波长作为最优的特征波长;
[0012]
s5、将步骤s4中的前n个特征波长代入卷积神经网络cnn中进行二次特征提取,实现新鲜和冻融牛肉的鉴别。
[0013]
进一步地,所述冻融牛肉包括一次冻融牛肉和/或二次冻融牛肉。包括一次冻融和两次冻融的冻融牛肉既符合实际生活情况,也丰富了数据集,可以使得建立的模型具有更强的普适性。
[0014]
进一步地,所述步骤s1中黑白板校正的公式如下:
[0015][0016]
式中,r为经黑白板校正的高光谱图像,i为原始的高光谱图像,b为黑板的高光谱图像,w为白板的高光谱图像。黑白板校正可以有效地减小光照不均和暗电流等客观因素的影响。
[0017]
进一步地,所述步骤s2中方差值s2的计算公式如下:
[0018][0019]
式中,s2为某一个波长的方差值,n为光谱样本个数,i为光谱样本编号,xi为相应样本编号的光谱反射率,为某一个波长下的光谱平均反射率;
[0020]
所述步骤s2中肯德尔相关系数τ的计算公式如下:
[0021][0022]
式中,τ表示某一个波长的肯德尔相关系数,n表示光谱样本个数,nc表示拥有一致性的元素对数,nd表示拥有不一致性的元素对数;
[0023]
所述步骤s2中信息熵h的计算公式如下:
[0024][0025]
式中,h表示某一个波长的信息熵,m为牛肉类别编号,m=1表示新鲜牛肉,m=2表示一次冻融牛肉,m=3表示二次冻融牛肉,pm为相应牛肉类别编号的概率。
[0026]
为了选择更加有代表性的特征,分别选择非监督的方差过滤法、监督的线性的肯
德尔相关系数法和监督的非线性的随机森林法。
[0027]
进一步地,所述步骤s3中归一化值wj的计算公式如下:
[0028][0029]
式中,wj表示某一特征选择方法前n个波长的归一化值,j=1,2,3,j的不同取值对应不同的特征选择方法,j=1对应方差过滤法,j=2对应肯德尔相关系数法,j=3对应随机森林法,n为波长个数,t为波长的编号,t=1,2,3,
…
,n,为j对应的特征选择方法相应第t个波长的归一化值。
[0030]
分别对前n个波长的方差值、肯德尔相关系数和信息熵归一化处理去除量纲的影响,即可将前n个波长方差值的归一化值、前n个波长肯德尔相关系数的归一化值和前n个波长信息熵的归一化值混合排序。
[0031]
进一步地,所述步骤s4中前n个最优的特征波长的选择方法,如下所示:
[0032]
band=max
1~n
(w1,w2,w3)
[0033]
式中,max
1~n
为由大到小排序取前n个归一化值,w1,w2,w3分别为前n个波长方差值的归一化值、前n个波长肯德尔相关系数的归一化值和前n个波长信息熵的归一化值。
[0034]
将前n个波长方差值的归一化值、前n个波长肯德尔相关系数的归一化值和前n个波长信息熵的归一化值混合排序,取前n个特征波长作为最后的特征波长,真正意义上实现了多种原理特征选择方法的综合使用。
[0035]
进一步地,所述步骤s5中卷积神经网络cnn的主干网络具体结构如下:
[0036]
从输入层至输出层依次连接为:卷积层conv1、relu层conv1_relu、池化层max_pooling1、卷积层conv2、relu层conv2_relu、池化层max_pooling2、展平层flatten、全连接层dense1、relu层dense1_relu、dropout层dense1_dropout、全连接层dense2、relu层dense2_relu、dropout层dense2_dropout。
[0037]
为了提升卷积神经网络的鲁棒性,在每个卷积层和全连接层之后引入非线性的relu层,为了防止模型过拟合,在每个卷积层之后加入池化层和每个全连接层之后加入dropout层。
[0038]
进一步地,使用softmax将结果输出,并用平均准确率来评估模型的性能。
[0039]
本发明相对于现有技术具有如下的优点及效果:
[0040]
1)本发明在不破坏牛肉样品的前提下,实现了新鲜牛肉和冻融牛肉的准确鉴别。
[0041]
2)本发明通过不同原理的特征选择方法的归一化值利用加权的思想实现了多种的特征选择方法的并联应用,选择出了最具有代表性的特征波长。
[0042]
3)本发明将线性的特征选择方法和非线性的特征选择方法综合应用,增强了多种的特征选择方法的并联应用的普适性。
[0043]
4)本发明利用卷积神经网络实现了光谱数据的二次特征提取,进一步提取了更为抽象和高层的特征,建立了优异的新鲜牛肉和冻融牛肉的鉴别模型。
附图说明
[0044]
此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发
明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0045]
图1是本发明实施例中公开的一种基于高光谱特征加权的新鲜和冻融牛肉的鉴别方法的的流程图;
[0046]
图2是本发明实施例中基于不同特征提取方法获得的特征波长子集示意图,其中,图2(a)是基于方差过滤法获得的特征波长子集示意图,图2(b)是基于肯德尔相关系数法获得的特征波长子集示意图,图2(c)是基于随机森林法获得的特征波长子集示意图,图2(d)是基于方差过滤法、肯德尔相关系数法和随机森林法的归一化值获得的特征波长子集示意图;
[0047]
图3是本发明实施例中卷积神经网络的结构参数图;
[0048]
图4是本发明实施例中基于特征加权方式和卷积神经网络新鲜和冻融牛肉的识别准确度示意图。
具体实施方式
[0049]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0050]
实施例1
[0051]
本实施例公开了一种基于高光谱特征加权方式新鲜和冻融牛肉的鉴别方法如图1所示,主要包括以下步骤:
[0052]
s1、采集新鲜牛肉和冻融牛肉的高光谱图像,黑白板校正,提取平均光谱。
[0053]
s1.1、切取144个2 cm
×
3 cm
×
2 cm(长
×
宽
×
高)的牛肉样品,采集144张高光谱图像作为新鲜牛肉样品的数据;将144个样品置于-18℃的环境下冷冻24小时,将其中72个样品置于25℃环境下解冻2小时,采集高光谱图像数据,将另外72个样品置于4℃环境下解冻10小时,采集高光谱图像数据,将72张25℃解冻的高光谱图像数据和72张4℃解冻的高光谱图像数据均作为一次解冻的数据;将一次解冻完的样品再次置于-18℃环境下冷冻24小时,再将25℃一次解冻的样品置于25℃环境下二次解冻,采集高光谱图像数据,依此类推,即可获得36张25℃一次解冻25℃二次解冻的高光谱图像数据、36张25℃一次解冻4℃二次解冻的高光谱图像数据、36张4℃一次解冻25℃二次解冻的高光谱图像数据和36张4℃一次解冻4℃二次解冻的高光谱图像数据,均作为二次解冻的数据,总共可获得432张高光谱图像。
[0054]
利用以下公式对步骤s1.1中的图像数据进行校正,使得每张高光谱图像的反射率均处于0~1之间。
[0055][0056]
式中,r为经黑白板校正的高光谱图像,i为原始的高光谱图像,b为黑板的高光谱图像,w为白板的高光谱图像。
[0057]
s1.2、将每张高光谱图像的每个波长下的灰度图的反射率取平均值作为此波长的反射率,即可获取每张高光谱图像的平均光谱数据(本实施例专利用的特征波长范围为500
~950nm)。
[0058]
s2、分别利用方差过滤法、肯德尔相关系数法和随机森林法对平均光谱数据进行特征选择,分别获得方差值、肯德尔相关系数和信息熵由大到小排序前20的波长。
[0059]
s2.1、利用以下公式分别计算各个波长的方差值,取方差值从大到小排序前20个波长,结果如图2(a)所示。
[0060]
方差值s2的计算公式如下:
[0061]
式中,s2为某一个波长的方差值,n为光谱样本个数,i为光谱样本编号,xi为相应样本编号的光谱反射率,为某一个波长下的光谱平均反射率;
[0062]
从图中可以看出,特征波长的范围均在620~690 nm之间,由于方差仅仅是从每个样本偏离某一个波长下的平均值的角度来对相应的特征波长进行评估选择,并没有考虑特征波长与目标值之间的关系,具有一定的片面性。
[0063]
s2.2、利用以下公式分别计算各个波长的肯德尔相关系数,取肯德尔相关系数的绝对值从大到小排序前20个波长,结果如图2(b)所示。
[0064]
肯德尔相关系数τ的计算公式如下:
[0065]
式中,τ表示某一个波长的肯德尔相关系数,n表示光谱样本个数,nc表示拥有一致性的元素对数,nd表示拥有不一致性的元素对数;
[0066]
从图中可以看出,肯德尔相关系数既有正值也有负值,表明波长与牛肉的状态类别既有正相关性也有负相关性;但是肯德尔相关系数法是一种无参数的假设检验,具有一定的统计依赖性,并没有深层地挖掘数据之间的关系。
[0067]
s2.3、利用以下公式分别计算各个波长的信息熵,取信息熵从大到小排序的前20个波长,结果如图2(c)所示
[0068]
信息熵h的计算公式如下:
[0069]
式中,h表示某一个波长的信息熵,m为牛肉类别编号,m=1表示新鲜牛肉,m=2表示一次冻融牛肉,m=3表示二次冻融牛肉,pm为相应编号类别的概率。
[0070]
从图中可以看出,作为一种非线性的特征选择方法,其具有一定的普适性,特征选择的波长范围较为广泛,但是其出现了较为极端的现象,前面2个的特征所占比例较大。
[0071]
s3、利用以下公式分别计算前20个波长的方差值、肯德尔相关系数和信息熵的归一化值。
[0072]
归一化值wj的计算公式如下:
[0073]
式中,wj表示某一特征选择方法前n个波长的归一化值,j=1,2,3,j的不同取值对应不同的特征选择方法,j=1对应方差过滤法,j=2对应肯德尔相关系数法,j=3对应随机森林法,n为波长个数,t为波长的编号,t=1,2,3,
…
,n,为j对应的特征选择方法相应第t个波长的归一化值。
[0074]
s4、利用以下方法取组合三种方法的归一化值从大到小排序前20个波长作为最优的特征波长,如图2(d)所示。
[0075]
band=max
1~20
(w1,w2,w3)
[0076]
式中,max
1~n
为由大到小排序取前n个归一化值,w1,w2,w3分别为前n个波长方差值的归一化值,前n个波长肯德尔相关系数的归一化值,前n个波长信息熵的归一化值。本实施例中n=20。
[0077]
从图中可以看出,有部分波长在多种特征提取方法均有体现(如630nm),只需将其在多种方法中的归一化值相加作为最终的归一化值即可,综合评价之后的特征既包含基于不同原理提取的特征波长,也有一定的波长宽泛性,其更加具有代表性。
[0078]
s5、将步骤s4中的20个特征波长代入卷积神经网络cnn中进行二次特征提取,实现新鲜牛肉和冻融牛肉的鉴别。
[0079]
s5.1、本发明的卷积神经网络结构如图3所示,主要包含2个卷积层(尺寸=3,步长=2)用于提取特征,2个最大池化层(大小=2,步长=2)用于防止过拟合,一个展平层和两个全连接层,卷积层和全连接层均加入relu函数作为激活函数以引入非线性结构,dropout层(失活概率=0.5)加入在全连接层之后,用于防止模型过拟合,模型的优化器是adam,损失函数是分类交叉熵,最终使用softmax函数实现新鲜牛肉和冻融牛肉的分类。
[0080]
s5.2、先将432个牛肉样品按照3:1划分为训练集和测试集,拟合cnn模型时每次输入模型的小批次样本数为64,迭代次数为500。
[0081]
s5.3、将三种特征选择方法选择的20个波长分别采用5中的卷积神经网络进行分类建模。
[0082]
s5.4、基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比结果(n=20)如表1所示。表中结果表明,特征加权方法建立的卷积神经网络鉴别模型的准确率为93.33%,相比于单独使用其他三种特征选择方法建立的卷积神经网络鉴别模型,大大提高了模型的准确率。图4展示了基于卷积神经网络利用特征加权方式对新鲜和冻融牛肉的识别准确度的详细鉴别效果,可见新鲜的牛肉和冻融的牛肉可以十分准确的鉴别,一次冻融牛肉和二次冻融牛肉之间的鉴别效果略差。
[0083]
表1.基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比表(n=20)
[0084][0085]
实施例2
[0086]
本实施例公开了一种基于高光谱特征加权方式新鲜和冻融牛肉的鉴别方法如图1所示,主要包括以下步骤:
[0087]
s1、采集新鲜牛肉和冻融牛肉的高光谱图像,黑白板校正,提取平均光谱,详细的步骤可以参照实施例1中步骤s1.1和步骤s1.2。
[0088]
s2、分别利用方差过滤法、肯德尔相关系数法和随机森林法对平均光谱数据进行特征选择,分别获得方差值、肯德尔相关系数和信息熵由大到小排序前15的波长,详细的步
骤可以参照实施例1中步骤s2.1、步骤s2.2和步骤s2.3。
[0089]
s3、利用以下公式分别计算前15个波长的方差值、肯德尔相关系数和信息熵的归一化值,详细的步骤可以参照实施例1中步骤s3。
[0090]
s4、利用以下方法取组合三种方法的归一化值从大到小排序前15个波长作为最优的特征波长,本实施例中n=15。详细的步骤可以参照实施例1中步骤s4。
[0091]
s5、将步骤s4中的15个特征波长代入卷积神经网络cnn中进行二次特征提取,实现新鲜牛肉和冻融牛肉的鉴别,详细的步骤可以参照实施例1中步骤s5.1、步骤s5.2和步骤s5.3。
[0092]
s5.4、基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比结果(n=15)如表2所示。表中结果表明,特征加权方法建立的卷积神经网络鉴别模型的准确率为92.56%,相比于单独使用三种特征选择方法建立的卷积神经网络鉴别模型,大大提高了模型的准确率。对比于实施例1,基于三种单独的特征选择方法的模型的准确度均有一定程度上的下降,这是由于特征数目的减小造成了一定信息的损失,基于特征加权法的模型的准确度也有一定程度的下降,但是其下降的程度小于三种单独的特征选择方法,表明特征加权法具有一定程度上的可调节性,可以一定程度上保证信息的有效性。
[0093]
表2.基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比表(n=15)
[0094][0095]
实施例3
[0096]
本实施例公开了一种基于高光谱特征加权方式新鲜和冻融牛肉的鉴别方法如图1所示,主要包括以下步骤:
[0097]
s1、采集新鲜牛肉和冻融牛肉的高光谱图像,黑白板校正,提取平均光谱,详细的步骤可以参照实施例1中步骤s1.1和步骤s1.2。
[0098]
s2、分别利用方差过滤法、肯德尔相关系数法和随机森林法对平均光谱数据进行特征选择,分别获得方差值、肯德尔相关系数和信息熵由大到小排序前25的波长,详细的步骤可以参照实施例1中s2.1、s2.2和s2.3。
[0099]
s3、利用以下公式分别计算前25个波长的方差值、肯德尔相关系数和信息熵的归一化值,本实施例中n=25,详细的步骤可以参照实施例1中步骤s3。
[0100]
s4、利用以下方法取组合三种方法的归一化值从大到小排序前25个波长作为最优的特征波长,详细的步骤可以参照实施例1中步骤s4。
[0101]
s5、将步骤s4中的25个特征波长代入卷积神经网络cnn中进行二次特征提取,实现新鲜牛肉和冻融牛肉的鉴别,详细的步骤可以参照实施例1中步骤s5.1、步骤s5.2和步骤s5.3。
[0102]
s5.4、基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比结果(n=25)如
表3所示。表中结果表明,特征加权方法建立的卷积神经网络鉴别模型的准确率为93.89%,相比于单独使用三种特征选择方法建立的卷积神经网络鉴别模型,大大提高了模型的准确率。对比于实施例1,基于三种单独的特征选择方法的模型的准确度均有一定程度上的上升,这是由于特征数目的增加提供了模型更多的信息,基于特征加权法的模型的准确度也有一定程度的上升,但是其上升的程度小于三种单独的特征选择方法,表明基于三个单独的特征选择方法特征个数的增加提供的有效信息具有重复部分,而特征加权法有效地将其中的重复部分的信息进行了有效地剔除。总的来说,适当的特征个数才能既在保证高的模型的准确率的同时,又能够节约建模的时间和资源。
[0103]
表3.基于cnn不同特征提取方式新鲜和冻融牛肉的鉴别效果对比表(n=25)
[0104][0105]
综上各个实施例,当n=20时为最佳的特征个数。
[0106]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。