专利名称:一种基于改进AdaBoost算法的地基云图识别方法
技术领域:
本发明公开了一种基于改进AdaBoost算法的地基云图识别方法,涉及数字图像处理技术在气象观测领域的应用。
背景技术:
云在大气辐射传输中扮演着重要的角色,云的形态、分布、数量及其变化标志着大气运动的状况。不同的云具有不同的辐射特征和分布情况,因而对预报天气、飞行保障等服务行业都具有重要意义。目前,一般气象要素基本都实现了自动化观测,但地基云图的观测尚不能完全实现自动化,依然依赖于人工观测。由于地基云观测范围相对较小,所包含的纹理信息相对丰富,且对短时、小范围天气预报具有很强的实用意义。然而面临着的实际情况是地基云图云状种类繁多,按照气象观测标准,云分为10属29种,主要依赖于人工进行观测具有一定程度上的主观性,且效率较低,难免漏掉许多有用信息,容易产生错判误判。此夕卜,在实际观测中,易出现多种云混合等现象,这也为云自动化观测提出了挑战。因此,解决云图的多类分类,并保证一定的分类精度,成为地基云图分类的一个核心问题。目前较为常用的分类器有贝叶斯分类器、神经网络、支持向量机等。其中贝叶斯法则需要已知各类别的先验概率等因素,而在实际情况中,先验概率等条件往往难以获取;神经网络法则存在训练速度慢,当样本类别较多时分类准确率较低等缺点;支持向量机虽然成为小样本学习问题的典范,但存在一定的缺点,如对大规模训练样本难以实施,解决多分类问题存在困难等。
发明内容
本发明旨在实现地基云图的自动识别,提升气象台站云观测的自动化能力,同时提高云观测的效率和准确性。将模式识别中的AdaBoost、SVM等算法进行结合、改进,应用于地基云图的识别,从 而达到较高的云图分类准确率。本发明为解决上述技术问题采用以下技术方案,一种基于改进AdaBoost算法的地基云图识别方法,包含以下步骤:步骤1、使用成像设备采集云片,用于分类器训练以及目标识别;步骤2、对采集到的云片进行预处理;步骤3、利用聚类分析,将预处理后的云片前景与背景进行分离;步骤4、计算云图特征;步骤5、使用已知类别的云图特征数据样本,采用SVM学习算法训练分类器;并采用AdaBoost集成算法进行迭代,对训练出的分类器进行加权得到最终的分类器,具体如下:(501)给定已知类别的云图训练样本Kx1J1), (x2,y2),...,(xn, yn)}和SVM学习算法h,其中Xi为第i个训练样本的输入,yi为第i个云图样本的类别,yi ee η,η是训练样本的个数;
(502)初始化第i个样本的权重D1⑴=I/η ;(503)初始化SVM学习算法h的参数值,σ表示SVM学习算法参数值,σ ini表示σ的初始化值,Oniin表示σ的最小阈值,Ostep表示σ每次迭代的步长;如果σ > Oniin成立,则循环执行下述步骤:步骤a.调用SVM学习算法h训练出一个分类器hm,并计算该分类器的错误率
权利要求
1.一种基于改进AdaBoost算法的地基云图识别方法,其特征在于,包含以下步骤: 步骤1、使用成像设备采集云片,用于分类器训练以及目标识别; 步骤2、对采集到的云片进行预处理; 步骤3、利用聚类分析,将预处理后的云片前景与背景进行分离; 步骤4、计算云图特征; 步骤5、使用已知类别的云图特征数据样本,采用SVM学习算法训练分类器;并采用AdaBoost集成算法进行迭代,对训练出的分类器进行加权得到最终的分类器,具体如下: (501)给定已知类别的云图训练样本Kx1,yi),(x2,y2),...,(xn, yn)}和SVM学习算法h,其中Xi为第i个训练样本的输入,Yi为第i个云图样本的类别,Yi e {-1, +1}, i e η,η是训练样本的个数; (502)初始化第i个样本的权重D1Q)= I/η ; (503)初始化SVM学习算法h的参数值,σ表示SVM学习算法参数值,σini表示σ的初始化值,Oniin表示σ的最小阈值,Ostep表示σ每次迭代的步长;如果σ > Oniin成立,则循环执行下述步骤: 步骤a.调用SVM学习算法h训练出一个分类器hm,并计算该分类器的错误率
2.如权利要求1所述的一种基于改进AdaBoost算法的地基云图识别方法,其特征在于:步骤四中所述的云图特征采用基于灰度共生矩阵的图像特征,具体包括二阶矩、对比度、相关性、熵、逆差距,其计算过程如下: (401)根据步骤3的结果,计算云图的归一化灰度共生矩阵P(li,lj),其中li,Ij表示图像的灰度级别,Ng表示灰度级别数量; (402)利用公式
全文摘要
本发明公开了一种基于改进AdaBoost算法的地基云图识别方法,使用聚类算法将云目标与背景分离,仅对云目标进行特征提取,计算特征值用于云的识别,从而提高了识别的准确率;使用AdaBoost集成算法将SVM学习算法训练出的多个单个分类器进行集成,在训练数据过程中对SVM算法中的参数进行合理的调整,使得训练出的分类器具有多样性,不仅提高了云图识别的准确率,而且使得泛化性能得到很大的改善。由于使用了集成算法,对单个分类器设计的要求并不高,这有效的降低了单个分类器设计难度;本发明结构简单,利用现有的图形采集设备和普通计算机即可进行实现,提高了实用性和适用性。
文档编号G06K9/62GK103235954SQ201310147108
公开日2013年8月7日 申请日期2013年4月23日 优先权日2013年4月23日
发明者李涛, 鲁高宇, 李娟 , 王丽娜, 夏德群 申请人:南京信息工程大学