本发明涉及人工智能,尤其是一种中草药分类模型的训练方法、识别方法、系统、设备。
背景技术:
1、中草药作为传统药物的一部分,在中医药领域具有重要地位。准确识别和分类中草药对于确保药材质量、研究中药药效、探索新药物等都至关重要。但由于中草药的种类众多,每种中草药均有其独特的形态特征;以及,由于生长环境、处理方式等因素的影响下,同种中草药的形态特征会具有较大的差异。
2、目前,传统的中草药识别方式主要是通过大量的标记数据赖训练较为复杂的深度学习模型,以此实现对中草药的识别,该种方式所需的训练数据量较大,模型复杂性较高,所需的计算资源较多。另外,在中草药分类任务中,不同种类的中草药的样本数量存在数据不平衡现象,该种方式训练得出的模型容易忽略罕见类别,对少见的中草药的分类准确性不高。
3、因此,现有技术存在的问题还亟需解决和优化。
技术实现思路
1、本发明的目的在于至少一定程度上解决相关技术中存在的技术问题之一。
2、为此,本发明实施例的第一个目的在于提供一种中草药分类模型的训练方法,该训练方法可以有效降低模型训练所需的数据量及计算资源,降低模型复杂度和模型,有效提高模型对中草药的分类准确度。
3、本技术实施例的第二个目的在于提供一种中草药分类模型的识别方法。
4、本技术实施例的第三个目的在于提供一种中草药分类模型的训练系统。
5、为了达到上述技术目的,本技术实施例所采取的技术方案包括:
6、第一方面,本技术实施例提供了一种中草药分类模型的训练方法,包括:
7、获取原始的图像数据集;
8、对所述图像数据集进行预处理,得到训练图像集;
9、对所述训练图像集进行特征提取处理,得到第一数据集,所述第一数据集包括多个第一数据,每个所述第一数据包括特征输出结果,以及与所述特征输出结果对应的特征输入补丁;
10、对所述第一数据集进行通道提取处理,得到第二数据集,所述第二数据集用于表征整合不同通道的特征重要性后的第一数据集;
11、将所述第二数据集更新为所述训练图像集,返回对所述训练图像集进行特征提取处理,得到第一数据集这一步骤,直至返回次数大于等于预设的第一阈值;
12、根据所述第二数据集,对初始化的中草药分类模型进行参数更新,得到训练好的中草药分类模型。
13、另外,根据本技术上述实施例的训练方法,还可以具有以下附加的技术特征:
14、进一步地,在本技术的一个实施例中,所述对所述图像数据集进行预处理,得到训练图像集,包括:
15、对所述图像数据集进行尺度统一处理,得到尺度图像集;
16、对所述尺度图像集进行随机翻转处理,得到翻转图像集;
17、对所述翻转图像集进行二维变换处理,得到所述训练图像集。
18、进一步地,在本技术的一个实施例中,述对所述训练图像集进行特征提取处理,得到第一数据集,包括:
19、对所述训练图像集进行第一线性处理,得到线性数据集,其中,所述线性数据集用于表征所述特征输入补丁的集合;
20、对所述线性数据集进行特征堆叠处理,得到所述第一数据集。
21、进一步地,在本技术的一个实施例中,所述对所述线性数据集进行特征堆叠处理,得到所述第一数据集,包括:
22、对所述线性数据集进行第一仿射变换处理,得到第一仿射数据集;
23、根据所述线性数据集,对所述第一仿射数据集进行整合处理,得到所述第一数据集。
24、进一步地,在本技术的一个实施例中,所述对所述第一数据集进行通道提取处理,得到第二数据集,包括:
25、对所述第一数据集进行通道拆分处理,得到通道拆分后的第一数据集;
26、对所述通道拆分后的第一数据集进行全局通道提取处理,得到所述第二数据集。
27、进一步地,在本技术的一个实施例中,所述对所述通道拆分后的第一数据集进行全局通道提取处理,得到所述第二数据集,包括:
28、对所述通道拆分后的第一数据集进行第二仿射变换处理,得到第二仿射数据集;
29、对所述第二仿射数据集进行全局归一化处理,得到全局数据集,其中,所述全局数据集用于表征对应通道的特征重要性;
30、对所述全局数据集进行通道整合处理,得到所述第二数据集。
31、第二方面,本技术实施例提供了一种中草药分类模型的识别方法,包括:
32、获取待识别的中草药图像数据;
33、将所述待识别的中草药图像数据输入到如上述第一方面任一项所述的中草药分类模型的训练方法所得到的中草药分类模型中,得到识别结果。第三方面,本技术实施例提供了一种中草药分类模型的训练系统,包括:
34、获取模块,用于获取原始的图像数据集;
35、第一处理模块,用于对所述图像数据集进行预处理,得到训练图像集;
36、第二处理模块,用于对所述训练图像集进行特征提取处理,得到第一数据集,所述第一数据集包括多个第一数据,每个所述第一数据包括特征输出结果,以及与所述特征输出结果对应的特征输入补丁;
37、第三处理模块,用于对所述第一数据集进行通道提取处理,得到第二数据集,所述第二数据集用于表征整合不同通道的特征重要性后的第一数据集;
38、返回模块,用于将所述第二数据集更新为所述训练图像集,返回对所述训练图像集进行特征提取处理,得到第一数据集这一步骤,直至返回次数大于等于预设的第一阈值;
39、更新模块,用于根据所述第二数据集,对初始化的中草药分类模型进行参数更新,得到训练好的中草药分类模型。
40、第四方面,本技术实施例还提供了一种计算机设备,包括:
41、至少一个处理器;
42、至少一个存储器,用于存储至少一个程序;
43、当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述的方法。
44、第五方面,本技术实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现上述的方法。
45、本技术的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到:
46、本技术实施例所公开的一种中草药分类模型的训练方法、识别方法、系统、设备。其中,所述训练方法通过获取原始的图像数据集;对所述图像数据集进行预处理,得到训练图像集;对所述训练图像集进行特征提取处理,得到第一数据集,所述第一数据集包括多个第一数据,每个所述第一数据包括特征输出结果,以及与所述特征输出结果对应的特征输入补丁;对所述第一数据集进行通道提取处理,得到第二数据集,所述第二数据集用于表征整合不同通道的特征重要性后的第一数据集;将所述第二数据集更新为所述训练图像集,返回对所述训练图像集进行特征提取处理,得到第一数据集这一步骤,直至返回次数大于等于预设的第一阈值;根据所述第二数据集,对初始化的中草药分类模型进行参数更新,得到训练好的中草药分类模型。该训练方法可以有效降低模型训练所需的数据量及计算资源,降低模型复杂度和模型,有效提高模型对中草药的分类准确度。