本发明涉及琥珀检测的,特别是涉及一种琥珀产地的自动识别方法、装置、设备及存储介质。
背景技术:
1、琥珀的产地众多,全世界已知的就有一百多个。目前市场上常见的琥珀品种主要产自三大产区:欧洲、美洲和亚洲,最为著名的五大产地分别为波罗的海沿岸、多米尼加共和国、墨西哥、缅甸和中国抚顺。琥珀产地是流通领域中影响琥珀价值的重要因素之一,如何准确做到通过科学手段判别溯源琥珀产地对维护琥珀消费信心以及琥珀市场有序发展十分重要。
2、目前市场流通领域多根据琥珀体色、透明度、荧光等外观判别琥珀产地,存在很大主观因素同时受经验影响明显,实验室中对琥珀产地判别主要通过光谱分析和化学成分分析等手段对不同区域琥珀的鉴定特征进行区分。现有基于光谱特征的鉴定方法,多针对三大产区之间琥珀的区分,通过对一些特殊波段的吸收峰形与峰位的标定来进行判断,难以实现对六大产区之间琥珀的区分,更难以实现对同一产区内不同细分产地琥珀的区分。
3、现有中先通过紫外可见光谱、拉曼光谱、荧光光谱对比等琥珀产地区分方法进行区分,再进行人为的判断具有一定的意义。但是由于人为观察操作还有很大的主观性,很难将其进行量化。无法满足目前珠宝检测实验室对信息化、数字化的需求。
技术实现思路
1、本发明要解决的技术问题是:提供一种琥珀产地的自动识别方法、装置、设备及存储介质,根据红外光谱特征对不同琥珀产地的琥珀样品进行识别,提高识别的准确性。
2、为了解决上述技术问题,本发明提供了一种琥珀产地的自动识别方法,包括:
3、选取多个琥珀产地的琥珀样品,生成标准样品集,并采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据;
4、根据所述多个琥珀产地,对每个样品红外光谱数据设置对应的数据标签,整合所有样品红外光谱数据,得到红外光谱数据集;
5、获取待测试琥珀样品的待测红外光谱数据,并将所述待测红外光谱数据拼接到所述红外光谱数据集中,得到拼接琥珀数据集;
6、对所述拼接琥珀数据集进行数据处理,得到标准数据集,并对所述标准数据集进行降维处理,得到降维矩阵,并基于所述数据标签,对所述降维矩阵进行分类,得到所述多个琥珀产地对应的红外光谱数据中心值;
7、根据所述降维矩阵和所述红外光谱数据中心值,计算每个红外光谱数据中心值对应的第一类距离,获取所述第一类距离的最小值,并将所述最小值对应的琥珀产地作为所述待测试琥珀样品的第一预测产地;
8、计算所述待测红外光谱数据与所述标准样品集中每个样品红外光谱数据之间的第二类距离,并基于所述第二类距离,结合knn非参数分类监督算法获取所述标准样品集中每个琥珀样品对应的产地属性数据,得到所述待测试琥珀样品的产地属性分类数据;
9、根据所述第一预测产地和所述产地属性分类数据,对所述待测试琥珀样品进行产地判别,得到所述待测试琥珀样品的琥珀产地。
10、在一种可能的实现方式中,对所述拼接琥珀数据集进行数据处理,得到标准数据集,具体包括:
11、基于预设的平均光谱数据计算公式,计算所述拼接琥珀数据集中所有琥珀产地对应的红外光谱数据的平均光谱数据,并将所述平均光谱数据作为琥珀标准光谱;
12、对所述琥珀标准光谱和所述拼接琥珀数据集进行线性回归处理,得到截距和线性回归系数,并基于所述截距,得到每个琥珀红外光谱数据的偏移量;
13、根据所述线性回归系数和所述偏移量,对所述拼接琥珀数据集中的每个红外光谱数据进行多元散射校正处理,得到校正红外光谱数据;
14、对所述校正红外光谱数据进行差分运算,得到标准红外光谱数据,整合所述所有标准红外光谱数据,得到标准数据集。
15、在一种可能的实现方式中,对所述标准数据集进行降维处理,得到降维矩阵,具体包括:
16、获取所述标准数据集中每个琥珀产地对应的红外光谱数据波数强度集,求取每个红外光谱数据波数强度集的波数强度平均值;
17、将所述红外光谱数据波数强度集中的每个红外光谱数据波数强度值减去所述波数强度平均值,得到第一红外光谱数据波数强度集;
18、同时获取所述第一红外光谱数据波数强度集的第一协方差矩阵,计算所述第一协方差矩阵的特征值和特征向量;
19、根据所述特征值和所述特征向量,对所述第一红外光谱数据波数强度集进行降维处理,得到降维矩阵。
20、在一种可能的实现方式中,根据所述降维矩阵和所述红外光谱数据中心值,计算每个红外光谱数据中心值对应的第一类距离,具体包括:
21、获取所述降维矩阵的第二协方差矩阵,并计算所述第二协方差矩阵的逆矩阵;
22、根据所述降维矩阵、所述红外光谱数据中心值和所述逆矩阵,计算每个红外光谱数据中心值对应的第一类距离。
23、在一种可能的实现方式中,基于所述第二类距离,结合knn非参数分类监督算法获取所述标准样品集中每个琥珀样品对应的产地属性数据,得到所述待测试琥珀样品的产地属性分类数据,具体包括:
24、将不同琥珀产地的红外光谱数据进行波段划分,得到多个波段分段,并计算所述多个波段分段对应的第二类距离;
25、获取所有第二类距离,对所述所有第二类距离按从大到小的排序,选取距离最小的多个第二类距离;
26、获取所述多个第二类距离对应的产地属性数据,统计出现次数最多的第一产地属性数据,并将所述第一产地属性数据作为所述待测试琥珀样品的第一产地属性分类数据;
27、基于knn非参数分类监督算法,在不同波段分段内分别将所述第一产地属性分类数据与各个琥珀产地对应的标准产地属性分类数据进行临近属性值计算,得到所述待测试琥珀样品在每个波段分段对应的第二产地属性分类数据,统计出现次数最多的第二产地属性数据,得到所述待测试琥珀样品的产地属性分类数据。
28、在一种可能的实现方式中,根据所述第一预测产地和所述产地属性分类数据,对所述待测试琥珀样品进行产地判别,得到所述待测试琥珀样品的琥珀产地,具体包括:
29、对所述第一预测产地设置第一权重值,对所述产地属性分类数据设置第二权重值,判断所述第一权重值和所述第二权重值是否相同,若是,则将所述第一预测产地与所述产地属性分类数据设置为所述待测试琥珀样品的琥珀产地;若否,则根据所述第一预测产地与所述产地属性分类数据对所述第一权重值和所述第二权重值进行权重调整,并基于调整后的权重,重新对所述待测试琥珀样品进行产地判别,得到所述待测试琥珀样品的琥珀产地。
30、在一种可能的实现方式中,采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据,具体包括:
31、基于显微红外光谱仪金刚石压池附件,采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据,其中,采集条件为低温检测器、图谱范围600cm-1-4000cm-1、分辨率4cm-1、扫描次数128次。
32、本发明还提供了一种琥珀产地的自动识别装置,包括:红外光谱数据采集模块、数据标签设置模块、红外光谱数据拼接模块、拼接琥珀数据处理模块、第一预测产地获取模块、产地属性获取模块和琥珀产地获取模块;
33、其中,所述红外光谱数据采集模块,用于选取多个琥珀产地的琥珀样品,生成标准样品集,并采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据;
34、所述数据标签设置模块,用于根据所述多个琥珀产地,对每个样品红外光谱数据设置对应的数据标签,整合所有样品红外光谱数据,得到红外光谱数据集;
35、所述红外光谱数据拼接模块,用于获取待测试琥珀样品的待测红外光谱数据,并将所述待测红外光谱数据拼接到所述红外光谱数据集中,得到拼接琥珀数据集;
36、所述拼接琥珀数据处理模块,用于对所述拼接琥珀数据集进行数据处理,得到标准数据集,并对所述标准数据集进行降维处理,得到降维矩阵,并基于所述数据标签,对所述降维矩阵进行分类,得到所述多个琥珀产地对应的红外光谱数据中心值;
37、所述第一预测产地获取模块,用于根据所述降维矩阵和所述红外光谱数据中心值,计算每个红外光谱数据中心值对应的第一类距离,获取所述第一类距离的最小值,并将所述最小值对应的琥珀产地作为所述待测试琥珀样品的第一预测产地;
38、所述产地属性获取模块,用于计算所述待测红外光谱数据与所述标准样品集中每个样品红外光谱数据之间的第二类距离,并基于所述第二类距离,结合knn非参数分类监督算法获取所述标准样品集中每个琥珀样品对应的产地属性数据,得到所述待测试琥珀样品的产地属性分类数据;
39、所述琥珀产地获取模块,用于根据所述第一预测产地和所述产地属性分类数据,对所述待测试琥珀样品进行产地,得到所述待测试琥珀样品的琥珀产地。
40、在一种可能的实现方式中,所述拼接琥珀数据处理模块,用于对所述拼接琥珀数据集进行数据处理,得到标准数据集,具体包括:
41、基于预设的平均光谱数据计算公式,计算所述拼接琥珀数据集中所有琥珀产地对应的红外光谱数据的平均光谱数据,并将所述平均光谱数据作为琥珀标准光谱;
42、对所述琥珀标准光谱和所述拼接琥珀数据集进行线性回归处理,得到截距和线性回归系数,并基于所述截距,得到每个琥珀红外光谱数据的偏移量;
43、根据所述线性回归系数和所述偏移量,对所述拼接琥珀数据集中的每个红外光谱数据进行多元散射校正处理,得到校正红外光谱数据;
44、对所述校正红外光谱数据进行差分运算,得到标准红外光谱数据,整合所述所有标准红外光谱数据,得到标准数据集。
45、在一种可能的实现方式中,所述拼接琥珀数据处理模块,用于对所述标准数据集进行降维处理,得到降维矩阵,具体包括:
46、获取所述标准数据集中每个琥珀产地对应的红外光谱数据波数强度集,求取每个红外光谱数据波数强度集的波数强度平均值;
47、将所述红外光谱数据波数强度集中的每个红外光谱数据波数强度值减去所述波数强度平均值,得到第一红外光谱数据波数强度集;
48、同时获取所述第一红外光谱数据波数强度集的第一协方差矩阵,计算所述第一协方差矩阵的特征值和特征向量;
49、根据所述特征值和所述特征向量,对所述第一红外光谱数据波数强度集进行降维处理,得到降维矩阵。
50、在一种可能的实现方式中,所述第一预测产地获取模块,用于根据所述降维矩阵和所述红外光谱数据中心值,计算每个红外光谱数据中心值对应的第一类距离,具体包括:
51、获取所述降维矩阵的第二协方差矩阵,并计算所述第二协方差矩阵的逆矩阵;
52、根据所述降维矩阵、所述红外光谱数据中心值和所述逆矩阵,计算每个红外光谱数据中心值对应的第一类距离。
53、在一种可能的实现方式中,所述产地属性获取模块,用于基于所述第二类距离,结合knn非参数分类监督算法获取所述标准样品集中每个琥珀样品对应的产地属性数据,得到所述待测试琥珀样品的产地属性分类数据,具体包括:
54、将不同琥珀产地的红外光谱数据进行波段划分,得到多个波段分段,并计算所述多个波段分段对应的所述待测红外光谱数据与所述标准样品集中每个样品红外光谱数据之间的第二类距离;
55、获取所有第二类距离,对所述所有欧式距离按从大到小的排序,选取距离最小的多个第二类距离;
56、获取所述多个第二类距离最小值对应的产地属性数据,统计出现次数最多的第一产地属性数据,并将所述第一产地属性数据作为所述待测试琥珀样品的第一产地属性分类数据;
57、基于knn非参数分类监督算法,在不同波段分段内分别将所述第一产地属性分类数据与各个琥珀产地对应的标准产地属性分类数据进行临近属性值计算,得到所述待测试琥珀样品在每个波段分段对应的第二产地属性分类数据,统计出现次数最多的第二产地属性数据,得到所述待测试琥珀样品的产地属性分类数据。
58、在一种可能的实现方式中,所述琥珀产地获取模块,用于根据所述第一预测产地和所述产地属性分类数据,对所述待测试琥珀样品进行产地判别,得到所述待测试琥珀样品的琥珀产地,具体包括:
59、对所述第一预测产地设置第一权重值,对所述产地属性分类数据设置第二权重值,判断所述第一权重值和所述第二权重值是否相同,若是,则将所述第一预测产地与所述产地属性分类数据设置为所述待测试琥珀样品的琥珀产地;若否,则根据所述第一预测产地与所述产地属性分类数据对所述第一权重值和所述第二权重值进行权重调整,并基于调整后的权重,重新对所述待测试琥珀样品进行产地判别,得到所述待测试琥珀样品的琥珀产地。
60、在一种可能的实现方式中,述红外光谱数据采集模块,用于采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据,具体包括:
61、基于显微红外光谱仪金刚石压池附件,采集所述标准样品集中的每个琥珀样品对应的样品红外光谱数据,其中,采集条件为低温检测器、图谱范围600cm-1-4000cm-1、分辨率4cm-1、扫描次数128次。
62、本发明还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的琥珀产地的自动识别方法。
63、本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任意一项所述的琥珀产地的自动识别方法。
64、本发明实施例一种琥珀产地的自动识别方法、装置、设备及存储介质,与现有技术相比,具有如下有益效果:
65、通过获取多个琥珀产地的琥珀样品对应的样品红外光谱数据,形成红外光谱数据集;将待测试琥珀样品的待测红外光谱数据拼接到红外光谱数据集中,得到并对拼接琥珀数据集进行数据处理,得到多个琥珀产地对应的红外光谱数据中心值;计算并基于每个红外光谱数据中心值对应的第一类距离,获取待测试琥珀样品的第一预测产地,再计算待测红外光谱数据与每个样品红外光谱数据的第二类距离,得到待测试琥珀样品的产地属性分类数据;根据第一预测产地和产地属性分类数据,对待测试琥珀样品进行产地判别,得到琥珀产地。与现有技术相比,本发明能够根据红外光谱特征对不同琥珀产地的琥珀样品进行自动识别,识别准确性高,而且不仅能够实现六大产区的琥珀样品的精确识别,还能够实现对同一大产区内不同细分产地琥珀的精确识别。