一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法

文档序号:29803386发布日期:2022-04-23 20:53阅读:165来源:国知局
一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法

1.本发明涉及模式识别和人工智能领域,具体涉及一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法,应用于黄山毛峰等级鉴定。


背景技术:

2.黄山毛峰是中国十大名茶之一。黄山毛峰富含咖啡因、多酚、多糖和维生素,具有抗菌、抗炎、减肥和清热等作用,常饮茶有益于人的身体健康。不同等级的黄山毛峰在外观、颜色、气味相似,市场上存在着茶叶以次充好现象,普通人难以准确判断出各等级的黄山毛峰茶叶。因此,研究一种简单、快速、准确的黄山毛峰等级鉴定方法具有重要意义。
3.近红外光谱是指在780nm到2500nm范围内的电磁波。近红外光谱检测技术是利用物质对光的吸收、散射、反射和透射等特性来确定其成分含量的一种非破坏性检测技术。因为它符合准确、可靠、快速、无损等特点而被广泛用于农副产品的检测。对于不同等级的黄山毛峰其反射的近红外光谱是有区别的,利用该原理,可实现对不同等级的黄山毛峰的鉴定。
4.模糊线性判别转换是在模糊理论基础上,利用模糊类内散射矩阵和模糊总体散射矩阵改进了线性判别转换(lda)方法,模糊线性判别转换可以对样本的模糊鉴别特征进行有效提取。不过,对于不满足高斯分布的光谱数据,模糊线性判别转换的模糊鉴别特征信息提取能力会有所降低。


技术实现要素:

5.本发明是为了提升模糊线性判别转换对不满足高斯分布的光谱数据进行鉴别信息提取时的不足而设计的一种光谱数据鉴别信息提取方法,相比现有的模糊线性判别转换方法,本发明利用高斯核函数对模糊总体散射矩阵中的期望进行全局加权,再利用相应的改进约束条件计算获得最优鉴别向量,该加权方式可以降低异常数据点对鉴别信息提取的影响。本发明具有快速、准确、简单,成本低等优点。
6.一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法,具体包括以下步骤:
7.s1,采集黄山毛峰样本的近红外光谱:用傅里叶近红外光谱仪对黄山毛峰样本进行扫描,将采集到的黄山毛峰的近红外光谱数据存储在计算机中。
8.s2,使用标准正态变量(snv)对黄山毛峰近红外光谱进行预处理。
9.s3,对黄山毛峰的近红外光谱数据进行维度压缩。使用主成分分析(pca)对s2中经过预处理后的黄山毛峰近红外光谱数据进行维度缩减。
10.s4,黄山毛峰茶叶近红外光谱的特征信息提取:采用一种模糊加权方法对s3中维度缩减后的光谱数据进行特征信息的提取。实现步骤如下:
11.s4.1,初始化参数:黄山毛峰的训练样本数为n,预测样本数为n1,模糊权重指数m,类别数为c,其中m>1。
12.s4.2,计算第k(1≤k≤n)个训练样本xk(xk为第t(1≤t≤c)类训练样本)隶属于第i
(1≤i≤c)类的模糊隶属度μ
ik

[0013][0014]
其中d
ik
和d
ij
表示样本xk和xj到类中心ci的欧式距离。
[0015]
s4.3,计算数据的每一类的中心ci:
[0016][0017]
s4.4,计算模糊类间散射矩阵s
fb
、模糊总体散射矩阵s
ft
和模糊加权全局模糊总体散射矩阵s
wt

[0018][0019][0020][0021]
这里,是训练样本的均值,为加权后的训练样本均值,α
kj
是一个n
×
n的近邻关系矩阵,||x
j-xk||表示样本xj和样本xk的欧式距离,σ2为训练样本的方差。
[0022]
s4.5,计算模糊总体散射矩阵s
fb
的逆矩阵s
ft-1
与模糊类间散射矩阵s
fb
的乘积矩阵的特征值λ和特征向量
[0023][0024]
其中,λ是的特征值,是相应的特征向量。
[0025]
把计算获得的特征值λ按从大到小排列,取前c-1的特征值为{λ1,λ2,

λ
c-1
},所对应的特征向量是把最大的特征值λ1对应的特征向量作为鉴别向量矩阵的第一个列向量。
[0026]
s4.6,使用拉格朗日数乘法并结合约束条件和对特征方程进一步计算得:
[0027][0028]
其中,β为的特征值,是相应的特征向量;i是单位矩阵,d是鉴别向量矩阵。
[0029]
s5,将预测样本n1投影至s4.6中的鉴别向量矩阵d的鉴别向量上,获得经过特征提取后的预测样本n2,使用k近邻分类算法对预测样本n2进行分类。
[0030]
本发明的有益效果为:
[0031]
1、本发明的一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法,在茶叶近红外数据数据不满足高斯分布时的分类表现要优于传统的模糊鉴别转换方法,且具有计算速度快的优点。
[0032]
2、本发明的一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法,引入加权思想,相比于线性判别分析(lda)等判别转换算法,在对离群数据的处理上可以获得更多的鉴别信息,从而实现茶叶等级的准确鉴别。
附图说明
[0033]
图1为本发明的总流程图;
[0034]
图2为黄山毛峰的近红外光谱图;
[0035]
图3为经过标准正态变量处理后的黄山毛峰近红外光谱图;
[0036]
图4为黄山毛峰的模糊隶属度值;
[0037]
图5为经过一种模糊加权鉴别信息提取方法处理后得到的黄山毛峰测试样本图。
具体实施方式
[0038]
下面结合附图和实施例对本发明作进一步说明。
[0039]
如图1所示,一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法,包含以下步骤:
[0040]
s1,采集黄山毛峰样本的近红外光谱:用傅里叶近红外光谱仪对黄山毛峰样本进行扫描,将采集到的黄山毛峰的近红外光谱数据存储在计算机中。
[0041]
根据中国国家标准gb/t 19460-2008,黄山毛峰茶可分为特级一等、特级二等、特级三等、一级、二级、三级共六个等级。每个等级黄山毛峰各采集60个,共有360个样品。用电子天平称量各等级茶叶约3.0克,然后将称量好的茶叶放入200毫升烧杯中,将100℃的水倒入烧杯中。待茶汤冷却至室温后,过滤掉茶渣,使用移液枪将少量茶汤滤液放入石英盘中,然后通过antaris ii近红外仪进行测量。antaris ii近红外光谱仪开机预热1小时。设置光谱仪波长范围为10000~4000cm-1
。光谱仪的采样模式设置为透射模式,光谱仪的采样频率、扫描间隔和采样次数分别设置为4cm-1
、3.857cm-1
和32。采集的光谱数据为1557维数据。每个样品采样3次,取平均值作为后续的实验光谱。黄山毛峰的近红外光谱图如图2所示。
[0042]
s2,使用标准正态变量(snv)对黄山毛峰近红外光谱进行预处理。
[0043]
经过预处理后的近红外光谱图如图3所示。
[0044]
s3,对黄山毛峰的近红外光谱数据进行维度压缩。使用主成分分析(pca)对s2中经过预处理后的黄山毛峰近红外光谱数据进行维度缩减。
[0045]
将s2中预处理后的光谱用主成分分析法计算特征以及特征向量,将获得前6个最大特征值对应的特征向量作为光谱数据的投影降维向量,从而将1557维的黄山毛峰光谱数据降维至6维。对降维后的数据进行训练集和预测集划分,每种等级的黄山毛峰取70%(42个)作为训练集,剩余的每个等级的30%(18个)作为预测集。
[0046]
s4,黄山毛峰茶叶近红外光谱的特征信息提取:采用一种模糊加权方法对s3中维度缩减后的光谱数据进行特征信息的提取。实现步骤如下:
[0047]
s4.1,初始化参数:黄山毛峰的训练样本数为n=252,即每个等级42个训练样本,
预测样本数为n1=108,即每个等级18个预测样本,模糊权重指数m=2,类别数为c=6。
[0048]
s4.2,计算第k(1≤k≤252)个训练样本xk(xk为第t(1≤t≤6)类训练样本)隶属于第i(1≤i≤6)类的模糊隶属度μ
ik

[0049][0050]
其中d
ik
和d
ij
表示样本xk和xj到类中心ci的欧式距离,图4为黄山毛峰训练集的模糊隶属度值。
[0051][0052]
s4.3,计算数据的每一类的中心ci:
[0053][0054]
计算得:
[0055]
s4.4,计算模糊类间散射矩阵s
fb
、模糊总体散射矩阵s
ft
和模糊加权全局模糊总体散射矩阵s
wt

[0056][0057][0058][0059]
这里,是训练样本的均值,为加权后的训练样本均值,α
kj
是一个n
×
n的近邻关系矩阵,||x
j-xk||表示样本xj和样本xk的欧式距离,σ2为训练样本的方差。
[0060]
计算得:
[0061][0062][0063]
s4.5,计算模糊总体散射矩阵s
fb
的逆矩阵s
ft-1
与模糊类间散射矩阵s
fb
的乘积矩阵的特征值λ和特征向量
[0064][0065]
其中,λ是的特征值,是相应的特征向量。
[0066]
把计算获得的特征值λ按从大到小排列,取前c-1=5的特征值为{λ1=1.0465,λ2=0.9903,λ3=0.8753,λ4=0.6075,λ5=0.4115},所对应的特征向量是把最大的特征值λ1对应的特征向量作为鉴别向量矩阵的第一个列向量。
[0067]
s4.6,使用拉格朗日数乘法并结合约束条件和对特征方程进一步计算得:
[0068][0069]
其中,β为的特征值,是相应的特征向量;q为一个中间矩阵,i是6
×
6的单位矩阵,d是鉴别向量矩阵。
[0070]
计算得:
[0071]
s5,将s4.1的预测样本投影至s4.6中的鉴别向量矩阵d的鉴别向量上,获得经过特征提取后的预测样本,再使用k近邻分类算法对预测样本进行分类。投影至鉴别向量矩阵d前三个鉴别向量上的黄山毛峰预测集如图5所示。
[0072]
经过k近邻分类后的预测集的茶叶等级鉴定准确率为95.37%。
[0073]
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技术所创的等效方式或变更均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1