陈皮产地预测方法和装置、存储介质

文档序号:32165804发布日期:2022-11-12 04:29阅读:95来源:国知局
陈皮产地预测方法和装置、存储介质

1.本发明涉及陈皮鉴定技术领域,特别是涉及一种陈皮产地预测方法及其装置、存储介质


背景技术:

2.目前市场上,对来自不同产地的陈皮,其定价往往也存在高低之分,其中,以新会陈皮定价最高,由此,出现不少商家将来自其它产地的陈皮伪装成新会陈皮以高价出售,获取更高利润,而这一行为,极大地损害了消费者的权益。
3.目前大多数消费通过陈皮的色泽、气味等要素去判断陈皮产地,这种判断方法及其依赖消费者的主观经验,同时,这种判断方法有较高的随机性和不确定性;同时,也有一部分人通过化学计量学方法,通过测定陈皮中含有的挥发性有机酸的含量对陈皮产地进行判断,然而这种方法操作繁琐,样品预处理复杂,同时通过化学计量学方法对陈皮产地进行判断时,其选取的陈皮样本一般来自不同省份,可区分度较大,该方法应用于产地接近,区分度较小的陈皮产地判断时,准确率较低。基于此,目前缺乏客观性强,能以高准确率区分产地接近的陈皮的方法。


技术实现要素:

4.本发明实施例的主要目的在于提出一种陈皮产地预测方法和装置、电子设备、计算机可读存储介质,能够高精度地鉴别陈皮产地。
5.为实现上述目的,本发明实施例的第一方面提出一种陈皮产地预测方法,所述方法包括:一种陈皮产地预测方法,方法包括:获取多个陈皮样本的红外光谱图;对多个红外光谱图进行预处理;通过梯度提升树算法根据预处理后的多个红外光谱图构建陈皮产地预测模型;通过陈皮产地预测模型对陈皮进行产地预测。
6.在一些实施例中,对多个红外光谱图进行预处理,包括:
7.对多个红外光谱图进行基线矫正处理和平滑处理;
8.对进行基线矫正处理和平滑处理后的多个红外光谱图进行一阶求导处理和二阶求导处理。
9.在一些实施例中,通过梯度提升树算法根据预处理后的红外光谱图构建陈皮产地预测模型,包括:
10.根据多个红外光谱图构建数据集;
11.将数据集随机划分为建模集和测试集;
12.从建模集和测试集中提取特征信息;
13.根据梯度提升树算法确定特征信息与陈皮产地之间的对应关系;
14.根据对应关系构建陈皮产地预测模型。
15.在一些实施例中,根据梯度提升树算法确定特征信息与陈皮产地之间的对应关系,包括:
16.利用梯度提升树算法对建模集和测试集进行预测,以确定预测值。
17.在一些实施例中,获取多个陈皮样本的红外光谱图,包括:
18.获取多个陈皮样本,其中,多个陈皮样本包括多个不同产地、不同年份的陈皮样本;
19.对多个陈皮样本进行预处理,得到多个样本薄片;
20.对多个样本薄片进行红外光谱测定,得到多个红外光谱图。
21.在一些实施例中,对多个陈皮样本进行预处理,得到多个样本薄片,包括:
22.将陈皮样本粉碎,得到陈皮粉末;
23.将陈皮粉末与溴化钾混合,得到样本粉末;
24.将样本粉末进行压片,得到样本薄片。
25.在一些实施例中,陈皮粉末与溴化钾混合质量比为1:100。
26.在一些实施例中,红外光谱测定的实验条件为:测定范围为600cm-1
至4000cm-1
,分辨率为4cm-1
,扫描次数为16次。
27.本发明实施例第二方面还公开一种陈皮产地预测装置,包括:
28.获取模块,用于获取多个陈皮的红外光谱图;
29.预处理模块,用于对多个红外光谱图进行预处理;
30.建模模块,用于通过梯度提升树算法根据预处理后的红外光谱图构建陈皮产地预测模型;
31.预测模块,用于通过陈皮产地预测模型对陈皮进行产地预测。
32.本发明实施例第三方面还公开一种计算机可读存储介质,其特征在于,计算机可读存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器运行,以实现如上第一方面任一项的陈皮产地预测方法。
33.本发明实施例包括:获取多个陈皮样本的红外光谱图;对多个红外光谱图进行预处理;通过梯度提升树算法根据预处理后的多个红外光谱图构建陈皮产地预测模型;通过陈皮产地预测模型对陈皮进行产地预测。基于此,通过梯度提升树算法,根据陈皮的红外光谱图预测陈皮产地。将梯度提升树算法应用于陈皮产地预测中,提供了一种客观性强,能以高准确率区分产地接近的陈皮的方法。
附图说明
34.图1是本发明实施例提供的陈皮产地预测方法的步骤图;
35.图2是一种gbdt算法的原理图;
36.图3是本发明实施例的陈皮产地预测方法的流程图;
37.图4是本发明一个实施例提供的陈皮产地预测装置的结构示意图。
38.附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
具体实施方式
39.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不
用于限定本技术。
40.需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序运行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
41.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
42.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
43.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
44.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序运行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际运行的顺序有可能根据实际情况改变。
45.参照图1,本发明实施例第一方面提出一种陈皮产地预测方法,包括但不限于如下步骤:
46.步骤s100,获取多个陈皮样本的红外光谱图;
47.步骤s200,对多个红外光谱图进行预处理;
48.步骤s300,通过梯度提升树算法根据预处理后的多个红外光谱图构建陈皮产地预测模型;
49.步骤s400,通过陈皮产地预测模型对陈皮进行产地预测。
50.可以理解的是,在一些实施例中,步骤s100包括:获取多个陈皮样本,其中,多个陈皮样本包括多个不同产地、不同年份的陈皮样本;对多个陈皮样本进行预处理,得到多个样本薄片;对多个样本薄片进行红外光谱测定,得到多个红外光谱图。具体的,获取来自同一省域范围内的8个不同产地,各个产地的四个年份的陈皮样本,获取陈皮样本后,对不同产地的陈皮样本分别进行粉碎,再将陈皮粉末与溴化钾以质量比1:100进行混合,得到样本粉末,再取适量的样本粉末于压片模具中并加压,由此制得透明的样本薄片。通过与溴化钾混合可以稀释样本,同时溴化钾在红外扫描过程中不会被吸收,不会对样本信号造成干扰。基于此,再通过傅里叶红外变换光谱仪扫描样本薄片,得到陈皮样本的红外光谱图。其中,傅立叶红外变换光谱仪的扫描参数为:测定范围600cm-1
至4000cm-1
,分辨率为4cm-1
,扫描次数为16次。
51.可以理解的是,对红外光谱图进行预处理可以包括:对多个红外光谱图进行基线矫正处理和平滑处理;对进行基线矫正处理和平滑处理后的多个红外光谱图进行一阶求导处理和二阶求导处理。其中,进行平滑处理可以减小仪器噪声对红外光谱图的影响,由此提
高信噪比,将含有噪声的“毛刺”信号去除,从而获得平滑的真实曲线信号。同时,由于红外变换光谱仪扫描所得的红外光谱数据成分复杂,除了基本的特征变量之外,还有背景基线、噪声等信号,通过基线矫正可以消除这部分信号带来的基线漂移。通过对红外光谱图进行一阶求导可以去除光谱图的常数基线,进行二阶求导可以进一步消除一阶函数基线。基于此,通过对红外光谱图进行预处理,可以消除其中无用的噪声信号以及信号漂移,方便后续进行分析。
52.可以理解的是,对红外光谱图进行预处理后,提取其吸收峰峰值,并根据吸收峰峰值与陈皮产地建立模型,具体的,以吸收峰峰值为x,陈皮产地为y,在x与y之间建立产地预测模型,并通过gbdt算法进行求解,确定各陈皮样本的吸收峰峰值与陈皮产地之间的关系,以优化产地预测模型。
53.gbdt算法,即梯度提升树算法是一种通过采用加法模型,以及不断减小训练过程产生的残差来达到数据分类或者回归的算法,其原理图如图2所示,该算法每次迭代过程不是用于调整样本参数,而是使新的学习器针对前一个学习器的残差进行拟合,其预测方式是将所有学习器的预测结果进行相加,gbdt算法中使用的决策树是cart回归树,首先计算残差,通过拟合残差学习一个回归树,在第m轮基础模型中,利用损失函数的负梯度值作为该轮基础模型损失值的近似,并利用这个近似值构建下一轮基础模型。利用损失函数的负梯度值近似残差的计算就是梯度提升算法在提升算法上的扩展,这样的扩展使得目标函数的求解更为方便。
54.参照图3,以下结合附图和具体实施例对本发明实施例进行说明。
55.本发明实施例包括step1至step5。
56.首先选取来自8个产地的陈皮样本,分别为南坦、天马、双水、三江、古井、银湖湾、小冈、茶坑,并根据产地依次赋予序号1至8作为产地标签,如下表所示。
57.序号产地1南坦2天马3双水4三江5古井6银湖湾7小冈8茶坑
58.再将陈皮样本进行粉碎、与溴化钾混合、压片等步骤制得样本薄片,再通过傅里叶红外变换光谱仪扫描样本薄片,得到多个陈皮样本的红外光谱图。
59.step1:对红外光谱图进行预处理,具体的,对红外光谱图进行基线校正处理、平滑处理、一阶求导处理和二阶求导处理。
60.step2:根据预处理后的红外光谱图构建数据集。
61.step3:从数据集中随机选取建模集和测试集。
62.step4:根据建模集建立产地预测模型,具体的,将红外光谱图的吸收峰峰值作为x,将产地标签作为y,通过gbdt算法进行分类预测。
63.step5:通过gbdt算法根据预测集中红外光谱图对陈皮样本进行产地预测,预测结果如下表所示:
64.实际产地预测产地实际产地预测产地6666226688226622886622888866666688884422664444448822886622668822886466664422882244448844446622664444448866222266442222
ꢀꢀ
65.如上表所示,通过gbdt算法进行陈皮产地预测时,59个陈皮样本的陈皮产地预测结果中,仅1个陈皮样本的产地预测结果错误,其预测准确率高达98.3%。
66.本发明实施例还提供一种陈皮产地预测装置400,如图4所示,陈皮产地预测装置包括:获取模块410,用于获取多个陈皮的红外光谱图;预处理模块420,用于对多个红外光谱图进行预处理;建模模块430,用于通过梯度提升树算法根据预处理后的红外光谱图构建陈皮产地预测模型;预测模块440,用于通过陈皮产地预测模型对陈皮进行产地预测。
67.可以理解是,本发明实施例通过梯度提升树算法在陈皮样本的红外光谱图与陈皮产地之间建立产地预测模型,基于此判断陈皮产地,将梯度提升书算法应用于判断陈皮产地其预测精度高达98.3%,需要指出的是,在本发明实施例中的陈皮样本均来自同一县域内,具有产地接近,区分度小的特点。基于此,本发明实施例实现高精度地分辨区分度小的陈皮样本的产地。
68.本发明实施例的陈皮产地预测装置用于执行上述实施例中的陈皮产地预测方法,其具体处理过程与上述实施例中的陈皮产地预测方法相同,此处不再一一赘述。
69.本发明实施例还提供一种计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如上述本发明实施例中的陈皮产地预测方法。处理器通过运行存储在存储器中的非暂态软件程序以及程序,从而实现上述本发明实施例中的陈皮产地预测方法。
70.本发明实施例描述的实施例是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。
71.以上参照附图说明了本发明实施例的优选实施例,并非因此局限本发明实施例的权利范围。本领域技术人员不脱离本发明实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本发明实施例的权利范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1