本发明涉及图像识别,具体涉及一种林业森林单株分割模型。
背景技术:
1、森林单株分割技术是一种在森林生态学、地理信息系统(gis)、遥感技术和图像处理等领域中应用的技术。这项技术的发展和应用背景涉及到以下几个方面:
2、1)生态学研究: 森林是地球上最重要的生态系统之一,对于了解森林的结构、物种组成、生长状况以及生态系统的功能具有重要意义。通过对森林单株的分割和识别,可以获取树木的个体信息,为森林生态学的研究提供详细的数据支持。
3、2)资源管理:对于森林资源的合理管理和保护,需要了解森林中各个树木的分布、数量和健康状况。森林单株分割技术可以帮助制定更有效的森林资源管理策略,监测植被的动态变化,以及评估森林的健康状况。
4、3)环境监测:森林单株分割技术也可以用于环境监测,例如监测森林火灾的扩散情况、评估森林覆盖度的变化等。这对于采取及时的环境保护措施和灾害预警具有重要意义。
5、4)地理信息系统(gis): gis 是整合、分析、展示地理空间信息的系统,而森林单株分割技术为gis提供了高分辨率的地理信息数据,有助于制作精确的地图和进行地理信息分析。
6、5)遥感技术应用: 利用卫星、航拍和无人机等遥感技术获取的图像,通过森林单株分割技术可以更精确地提取森林信息。这对于大范围的森林监测和调查提供了高效的手段。
7、随着机器学习和深度学习技术的不断发展,森林单株分割技术也得到了更先进的算法和模型支持。这些技术的发展使得对大规模图像数据进行高效处理和分析成为可能。
8、森林单株分割的一般步骤和方法为:
9、第一步:图像获取和预处理:使用航拍图、卫星图或者无人机图像等获取森林的图像数据。在预处理阶段,可能需要进行图像去噪、色彩校正和尺度标定等操作。
10、第二步:分割算法选择:选择适当的图像分割算法,以将图像中的森林区域与其他区域分隔开。常用的分割算法包括基于区域的分割(region-based segmentation)、基于边缘的分割(edge-based segmentation)和基于像素的分割(pixel-based segmentation)等。
11、第三步:特征提取:对于每个分割的区域,提取相关的特征,例如颜色、纹理、形状等。这些特征有助于后续的树木分类和识别。
12、第四步:树木分类:利用机器学习或深度学习技术,建立树木分类模型。该模型可以根据提取的特征对每个分割区域进行分类,判断其是否属于树木。
13、第五步:后处理:进行后处理操作,例如去除误分类的区域、填充漏掉的树木等。这有助于提高分割和识别的准确性。
14、单类分类模型是一种机器学习模型,也称为单类别分类或异常检测模型。这些模型主要用于解决只有单一类别数据(正常样本)的情况下进行分类或异常检测的问题,核心思想是从已知的正常样本中学习,构建一个描述正常样本的模型,然后利用该模型来区分新样本是否属于这个已知的单一类别。这样的模型通常是在训练过程中只接触到正常样本,不考虑其他异常或多类别数据。常见的两个单类分类模型svdd(support vector datadescription)和ocsvm(one-class support vector machine)已被广泛应用于各种应用中。
15、 svdd 是建立在支持向量机的基础上的,但不同于传统的分类任务,它在训练集中仅包含正常样本的情况下,建立一个边界,将正常样本聚集在边界内,从而识别出新的、不同于正常模式的异常样本。svdd 的目标是找到一个球形或椭球形的超球体,使得包含正常样本的这个超球体的半径最小,同时尽量排斥异常样本。优化的过程可以通过求解一个凸优化问题来完成。
16、 ocsvm 主要用于单类别分类问题,即只有一种类型的数据(正常样本)可用于训练模型。目标是学习正常样本的特征,从而能够识别出与这些正常样本差异较大的异常样本。与传统的 svm 类似,ocsvm 试图在特征空间中找到一个超平面,将正常样本与其余空间分隔开来。不同的是,ocsvm 更关注于边缘样本(距离超平面最近的正常样本),而忽略了训练集中的大部分样本。
17、这些模型在许多领域,如异常检测、欺诈检测、故障诊断等方面有着广泛的应用。它们的目标是针对单一类别数据建模,从而能够在面对新数据时识别出与已知类别不同的异常或罕见情况。但目前的模型仍然存在以下几个问题:1)缺乏鲁棒性:对于复杂多变的数据,模型可能表现出相对较低的稳健性,导致其在面对新的、稍有不同的场景时性能下降;2)解的非稀疏性:一些模型可能生成非常复杂的决策边界或描述边界的超球体,这使得模型的解释和理解变得更为困难。非稀疏性的解可能使模型更难以泛化到未见过的数据,而且可能对异常样本的识别产生不必要的困扰;3)在高精度实时检测任务中的局限性:在高精度实时检测任务中,一些单类分类模型也存在局限性。实时性要求模型在处理大规模数据时能够迅速做出决策,但某些模型可能因复杂的计算过程而导致响应时间延迟。这在需要快速准确识别异常的应用场景中可能限制了模型的实际应用。
18、现有的单类模型并不能很好地解决以下几个方面的问题:
19、1)高精度和实时性:例如,在森林火灾视频监测中,检测/识别有望达到像素精度,并在帧中执行。像素精度的目标很容易实现,例如,通过使用像素分类技术,其中每个像素都被视为一个样本,即像素模式的表示。但由于l2范数解的非稀疏性,无法达到实时性,它们通常需要存储如此多的支持向量,然后用于目标像素检测。如果使用它们进行基于帧的检测,结果将是内存不足或检测时间过长。
20、2)训练时间长:在面临一个大规模的训练任务时,虽然图像和视频很容易获得,但数据的标签通常是不可用的。然而,样本标记并不容易,它是一项费时费力的任务,在现有的注释方法中,用户与计算机交互,只需要画一个曲线/多边形感兴趣的区域对象(roi),然后roi像素可以自动提取形成一个训练集。
21、3)训练数据纯度不确定:为了提高期望对象的代表性,作为训练样本的像素需要从整个对象或子对象中提取,例如从整个云或树冠中提取。这样做会产生两个负面影响。其中一个影响是,如果在用户提供的roi中有太多的像素,则会进行大规模的训练任务;另一个影响是训练数据的纯度,这也是上述的第三个方面。这意味着用户提供的数据可能是纯的;它可能是不纯的,但用户认为它是纯粹的,因为人类的视觉不能精确到像素的水平。例如,有可能会有很少的非冠层像素混合在提取的冠层像素中,这些非冠层像素来自其他地标对象,可以从俯视图的叶隙中看到,通常被视为冠层的异常值。
22、因此,有必要发明一种新的林业森林单株分割模型,以解决上述问题。
技术实现思路
1、本发明的目的在于提供一种林业森林单株分割模型,该模型使用基于l1范数的新型ocsvm用于单类目标检测,充分利用l1范数的特性,以满足实时目标检测/识别的要求,从而实现森林树木的单株分割,在训练时间、检测精度率、错误预警率和实时能力方面具有显著的优越性。
2、为达到上述目的,本发明提供如下技术方案:
3、一种林业森林单株分割模型,所述单株分割模型的建立过程包括如下步骤:
4、s1、数据采集与数据集制作:使用无人机对目标森林区域进行采样,对于采集到的遥感图像进行预处理和样本标注,将标注好的样本分为训练数据集、验证数据集和测试数据集,以确保模型的泛化性能;
5、s2、特征提取:使用卷积神经网络cnn,端到端的学习图像的颜色特征并进行树木分割,在cnn中,通过卷积层和池化层来提取图像的颜色特征,从而实现对树木的准确分割;
6、s3、分割算法:将图像中的每个像素分类为林木或非林木,使用基于l1范数的单类支持向量机l1-ocsvm来训练分类器,并利用图像中的像素特征进行分类;
7、s4、分割结果后处理:对分割得到的结果进行后处理以提高分割结果的准确性和完整性,所述后处理包括去除小的噪声区域、填补断裂的林木边缘、及合并相邻的分割区域;
8、s5、评估和验证:使用所述测试数据集对经过后处理的分割结果进行评估和验证,以确保分割结果符合预期要求。
9、进一步地,所述步骤s2还包括:在输入图像上应用卷积核,将卷积核与图像的每个位置进行逐元素相乘,然后将结果相加以生成输出特征图;重复此过程以在整个图像上移动卷积核,从而生成完整的特征图;将所述特征图划分为不重叠的区域,对于每个区域选择最大值作为该区域的输出值,将所有最大值组成的新特征图作为池化层的输出。
10、进一步地,所述步骤s3还包括:
11、定义基于l1范数的单类支持向量机l1-ocsvm,定义为特征空间中超平面的权值,w为输入空间中的权值,所述单株分割模型的模型公式为:
12、
13、
14、
15、l1-ocsvm中的距离重定义:将l1-ocsvm中任意点x0到一个超平面的l∞范数距离重写为最小化形式,即;
16、以矩阵形式重写模型,模型公式为:
17、
18、
19、
20、求解重写后的模型公式:从验证数据集中进一步分离得到调优数据集,将参数从所述调优数据集中选出来,所述参数包括所选的核函数、参数和正则化因子,通过模型对所述参数进行优化,基于解的等价性重写模型:
21、
22、为了避免当趋近于0,也趋近于0时出现零解的情况,我们在上述模型中添加一个约束,这样所得到的问题仍然是线性的,可以用lp方法来解决;
23、加速策略:通过nlp l1-ocsvm和gn l1- ocsvm两种加速策略提高收敛速度,通过gn l1- ocsvm 将上述约束组合并,重新表述为一个无约束最小化问题,以减少内存的存储过载,使用nlp l1-ocsvm解决转换后的lp问题。
24、进一步地,其特征在于,所述步骤s4还包括:
25、定义一个面积阈值,将分割结果中面积小于阈值的区域视为噪声并去除,使用像素连接算法,将断裂的边缘连接起来,利用林木的形状特征,通过形状先验知识来修正分割结果。
26、本发明的有益效果在于:
27、本发明提供了一个基于l1范数的单类支持向量机l1-ocsvm用于单类目标检测,充分利用l1范数的特性,以满足实时目标检测/识别的要求,从而实现森林树木的单株分割;通过引入无穷大的边距项来代替传统的l2范数以设计l1-ocsvm,保持了结构性风险最小化原则;通过一个等价的优化方法来求解非线性的l1-ocsvm,以解决l1范数的不可微性和非线性情况下的问题;通过对组合系数的l1范数进行直接最小化,所得到的解比l2范数解更有可能具有高度稀疏性,从而减少计算的复杂性;通过两种加速度算法来提高训练速度。与现有的sota等方法相比,本发明所提出的方法在训练时间、检测精度率、错误预警率和实时能力方面具有显著的优越性。
28、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。