一种基于遗传算法的风场特征统计分布模型建立方法
【专利摘要】一种基于遗传算法的风场特征统计分布模型建立方法,实施流程如下:A.处理原始的风速风向数据;B.估计风速概率密度函数中的参数;C.估计风向概率密度函数中的参数;D.估计相关系数概率密度函数中的参数;E.风速风向联合分布函数。
【专利说明】
-种基于遗传算法的风场特征统计分布模型建立方法
技术领域
[0001] 本发明设及结构健康监测、结构风工程、统计数学建模等领域,具体为基于遗传算 法进行风速风向联合分布参数估计和概率分布模型建立。
【背景技术】
[0002] 随着桥梁不断向更大跨径方向发展,考虑风对桥梁的作用已变得越来越重要。研 究在桥址处各种可能的风场条件下,桥梁结构的静力效应和动力响应,可W为新建桥梁的 设计、施工提供抗风方案。在研究风对桥梁的作用时,需要从桥梁的结构特性、风特性和风 与结构相互作用Ξ个方面着手进行考虑,而其中对近地自然风特性的分析是非常基础且重 要的环节。桥梁所在地的近地风特性是进行桥梁抗风设计与验算的基本依据。在研究风对 工程结构物的作用时,我们通常将本质上是随机的自然风分为两种成分:W平均速度表示 的平均风和均值为零的脉动风。
[0003] 其中,平均风的风速是描述风荷载的主要参数,但是风速是随机变量,需要用概率 论的方法进行统计,即风速概率模型,风速的概率分布对结构分析与设计密切相关。迄今为 止,已有大量概率模型用于近似风速的分布,主要有Gumbel分布、Weibull分布、Gamma分布、 对数正态分布等。上述概率分布均属于单峰模型,但实际风速的分布颇为复杂,采用单一的 分布形式无法充分描述风速的多模态统计特性。有限混合分布函数是由一系列具有不同统 计特性的分布函数加权叠加组成,通过估计有限混合分布函数中的未知分布参数能够模拟 由不同统计特性组成的分布函数。
[0004] 除风速外,风向亦是描述风荷载的重要参数。同一地点不同方向上的平均风速基 本是不均匀的,而大型结构物在不同方向上的尺度往往又有着明显的差异,特别是桥梁结 构在沿桥梁轴线方向和垂直轴线方向上的尺度和刚度、振动性能等差别很大,因而有必要 引进风向运个要素来研究风速风向的联合分布。然而,相对于风速而言,对于风向的研究目 前十分缺乏,其困难主要源于W下两方面:一、气象台的风向记录多采用方位法而无具体数 值;二、风向角是周期性变量。对于风向分布,可W使用Ξ角函数拟合风向频度直方图建立 风向角的连续概率密度函数。但是此方法并不能给出固定的概率分布模型。目前,最为常用 的风向概率密度模型是Von Mises分布和基于Von Mises分布的混合模型。
[0005] 为了更好的研究风荷载的特征,需要同时考虑风速和风向运两个因素。而风速和 风向的联合分布属于角度线性分布,可W把其建模方法大致分为W下两类:间接法和直接 法。间接法是先得出其他变量的联合分布,然后再间接的获得风速风向的联合分布。如假设 顺风向和横风向风速为相互独立的正态变量且两者标准差相等,将运两个变量的概率密度 函数相乘,然后通过顺风向和横风向运两个方向上的风速与总风速风向的关系推导出联合 分布。直接法是直接由风速和风向的边缘概率密度函数构造两者的联合分布,其中最简单 方法的就是假定两变量相互独立,角度变量服从Von Mises分布、风速变量服从正态分布的 联合分布模型。然而,风速和风向并不是相互独立的,简单的相乘不能正确的得出风速风向 的联合分布函数,那么风速风向联合分布可表示为两变量的边缘分布函数和两个变量相关 系数分布函数的乘积。
【发明内容】
[0006] 本发明要克服传统风速风向分布建模方法的不足,运用直接法提出一种基于遗传 算法的风场特征统计分布建模方法。
[0007] 本发明所述的一种基于遗传算法的风场特征统计分布模型建立方法,由W下Ξ部 分组成:
[000引一、风速风向联合分布模型
[0009] 本发明使用直接法来构建风速风向联合分布模型,风速风向联合分布概率密度函 数可W表示为fv,0(v,目)= 23ig(r)fV(v)f0(0)。该函数是由风速和风向的边缘概率密度函 数W及它们的相关系数函数组成,如下所示:
[0010] (1)风速的概率密度函数fv(v)服从有限混合威尔布分布,其概率密度函数可W表 示为:
[0011]
[001^ 其中,N为组分个数,1为每个组分的标号,V为平均风的风速,βι为范围参数,α功外 形参数,W1为各组分混合权重,且满足:
[0013]
iwi>0
[0014] (2)风向的概率密度函数扣(0)服从Von Mises分布,其概率密度函数可W表示为:
[0017]其中,N为组分个数,j为每个组分的标号,Θ是平均风风速相对应的风向,kj为集中 参数,为平均风向,lo(kj)是0阶修正的第一类Bessel函数,Wj为各组分混合权重,且满 足:
[001 引
[0019] (3)相关函数g(丫)是相关系数丫的概率密度函数,其中丫可W表示为:
[0020]
[00別]若丫 <0,则丫 =化+ 丫
[0022] 相关系数的概率密度函数g(丫)也服从Von Mises分布,其概率密度函数可W表示 为
[0023]
[0024]
[0025] 其中,N为组分个数,j为每个组分的标号,丫是平均风风速风向的相关系数,kj为 集中参数,为相关系数的平均值,1〇化J)是0阶修正的第一类Bessel函数,为各组分混 合权重,且满足:
[0026]
[0027] 二、参数估计算法
[0028] 由于风速是随机变量,只有采用有限混合分布函数才能充分描述风速的多模态统 计特性。为了估计有限混合分布函数中的参数,近年来提出了多种方法,包括回归分析法、 作图法、最小二乘法、矩估计法、极大似然估计法等。算法是建立在极大似然估计法基础 之上的一种新型算法,该算法通过引入一些隐藏变量,使得参数的极大似然估计变得容易。 ΕΜ算法是目前最为常用的参数估计方法,ΕΜ算法思路清晰,计算简单,但由于其数学理论基 础的严格性,仅适用于一维随机变量分布函数的参数估计。而且传统的优化算法是基于目 标函数的梯度或高阶导数,利用最速梯度法得到,容易导致优化过程陷入局部最优。
[0029] 随着仿生学的巨大进展,近年来发展起来了一种有效的优化工具一遗传算法。遗 传算法就是模拟生物进化和发展进程的一种算法。在使用遗传算法时,首先对待优化个体 进行编码并生成初始种群,通过选择算子从种群中选择较优个体,采用交叉、变异等操作从 而产生新一代种群参加下一轮的编码计算。通过反复迭代,直到满足收敛条件为止,此时种 群中最优个体即被认为是全局最优解。遗传算法具有一定的平行性,它的捜索是多到多的 过程,而传统捜索方法一般是点到点的捜索过程,故遗传算法可W在较大的设计空间内迅 速寻优,而且W种群规模进行寻优,一些个体陷入局部最优并不影响整个进化进程,有较强 的全局性。由于该算法具有捜索速度快,避免陷入局部最优等优点,本发明采用遗传算法可 W快速精确的估计模型中的参数。
[0030] Ξ、数据处理
[0031] 本发明的数据来源为桥梁健康监测系统。桥面上的风速风向仪一共有两种:超声 式风速风向仪和机械式风速风向仪。从桥梁健康监测系统的采集设备中可W得到大量的原 始数据,数量和精度上都要优于气象站的数据。但是桥梁健康监测系统里采集到的原始数 据为风速和风向的实时数据,需要对原始数据进行处理,得到风场特征分析所需的平均风 的风速和风向。我国规定平均风的时距一般取为10分钟,因此需要将10分钟的风速和风向 的数据求平均,统计出平均风的风速和风向数据。
[0032] 本发明要解决W下几个方面的问题:
[0033] -、解决传统方法中风速风向数据量少,不全面的问题。传统方法处理的数据是从 当地气象站得到,一般获得的是日最大平均分速,风向也是按方位记录的并无具体数值。本 方法采用的风速风向数据是由桥梁健康监测系统提供,不仅仅可W获得实时的数据,而且 风向数据是按角度记录,为风速风向联合分布模型参数估计提供了很好的基础。
[0034] 二、解决传统方法无法得到一个固定的概率分布模型的问题。传统的方法对风速 风向进行研究时,通常是分别对某一个方向的风速进行研究,然后将各个方向的风速模型 分别表示出来,无法给出固定的概率分布模型。而本发明在建模时,同时考虑风速和风向运 两个因素,并可w用一个固定的概率密度函数来表示风速风向的联合分布函数。
[0035] Ξ、解决传统方法不能保证得出的解是全局最优点的问题。传统统计分析方法是 一种爬山算法,通过不停迭代使得其似然函数值不断上升,运使得算法成为一种局部捜索 算法,只能找到局部最优值。遗传算法W种群规模进行寻优,一些个体陷入局部最优并不影 响整个进化进程,是一种全局优化算法。而且传统统计分析方法的收敛速度和收敛点对初 始值的选取较为敏感。通常初始值是在其取值范围内随机生成,当初始值确定后将沿着固 定的路线寻找最优解。因此,初始值的选取直接影响到最优解的位置。而本发明采用的遗传 算法对目标函数无连续性、可导性要求或严格的数学理论基础,因此具有更广的适用性。
[0036] 本发明所述的一种基于遗传算法的风场特征统计分布模型建立方法,具体实施流 程如下:
[0037] A.处理原始风速风向数据;
[0038] A1.W10分钟为一时距,求出十分钟内的风速和风向数据的平均值;
[0039] A2.将风速和风向数据储存在excel或matlab文件中,风速存放在一列中,风向存 放在一列中,并且同一时距内的风速和风向数据--对应存在同一行;
[0040] B.估计风速概率密度函数中的参数;
[0041] B1.风速的范围在Om/s到20m/s之间。取一区间为[0,20],其下限比最小数据稍小, 其上限比最大数据稍大,将运一区间分为200个小区间Rv,每个区间的间隔为0.1。那么样本 落在区间Rv的频率可表示为
,其中Κν为落入区间Rv的样本数量,K为 样本总量,ξ为区间Rv的面巧
为风速概率密度函数,XV为区 间Rv中屯、点的X坐标,β为范围参数,α为外形参数,W1为各组分混合权重;
[0042] Β2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的 捜索结果作为最终参数估计值。其适应度函数可W表示为
[0043]
[0044] 其中^义巾^,日,0)为风速概率密度函数。当9,越接近^义,|巧,日,0^时,适应度函数 的值越大。使适应度函数的值达到最大的范围参数0,外形参数a,W及各组分混合权重W为 参数的最优解;
[0045] B3.利用所得的参数估计值计算不同组分个数下的AIC值和Δ。^确定最佳组分个 数,其中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。
[0046] 赤池信息准则AIC是一个基于似然函数值的模型选择准则,表示为
[0047] AIC = 2M-21n 化)
[0048] 其中Μ为分布模型中未知参数的个数,表示增加参数的折扣,ln(L)为极大对数似 然函数,用于衡量模型的拟合优度。
[0049] 距离测度Δ。是从拟合优度假设检验衍生。Δ。值可表示为
[(K)加 ]
[0051] 其中Τ为区间划分个数,qv为拟合分布在区间Rv内的频率,hv为样本落入区间Rv内 的概率。选择AIC值和Δ C最小值对应的组分个数,确立最优的拟合模型;
[0052] C.估计风向概率密度函数中的参数;
[(K)对 C1.风向角度范围在惦I帕之间。取区间为[0前],将运一区间分为200个小区间防,每 个区间的间隔为0.1 n。那么样本落在区间Rv的频率可表示夫
,其中Κν 为落入区间Rv的样本数量,Κ为样本总量,ξ为区间Rv的面积,
为风向概率密度函数,xe为区间R冲屯、点的X坐标,kj为集中参数,μ功平均风向,W功各组分 混合权重;
[0054] C2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的 捜索结果作为最终参数估计值。其适应度函数可W表示为
[0化5]
[0056] 其中f(xe|w,k,y)为风向概率密度函数。当qv越接近f(xe|w,k,yH时,适应度函数 的值越大。使适应度函数的值达到最大的集中参数k,平均风向μ,Κ及各组分混合权重W为 参数的最优解;
[0057] C3.利用所得的参数估计值计算不同组分个数下的AIC值和Δ。^确定最佳组分个 数,其中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。
[005引赤池信息准则AIC是一个基于似然函数值的模型选择准则,表示为
[0059] AIC = 2M-21n 化)
[0060] 其中Μ为分布模型中未知参数的个数,表示增加参数的折扣,ln(L)为极大对数似 然函数,用于衡量模型的拟合优度。
[0061 ]距离测度Δ。是从拟合优度假设检验衍生。Δ。值可表示为
[0062]
[0063] 其中T为区间划分个数,qv为拟合分布在区间Rv内的频率,hv为样本落入区间Rv内 的概率。选择AIC值和Δ。最小值对应的组分个数,确立最优的拟合模型;
[0064] D.估计相关系数概率密度函数中的参数;
[0065] D1.通过B和C两个步骤已经得出了风速和风向的概率密度函数,然后使用
可W计算出每一个风速风向数据所对应的相关系数;
[0066] D2.进行C1,C2,C3运个步骤对相关系数数据进行处理;
[0067] D3.得到相关系数概率密度函数中的最优的集中参数k,平均相关系数μ,Κ及各组 分混合权重W;
[0068] Ε.风速风向联合分布函数;
[0069] E1.W上已经通过遗传算法计算出风速,风向,相关系数的概率密度函数,即可W 得到风速风向概率密度函数fv,0(v,目)= 23ig( γ )fv(v)f0(0)。
[0070] 与现有的方法相比,本方法有W下几个优点:
[0071] 1、本发明所使用的数据是由桥梁健康监测系统提供,在各个方面都要优于传统方 法中所处理的数据。桥梁健康监测系统所记录的数据是每时每刻的风速和风向数据,而且 风速和风向数据分别精确到米每秒和度,具有良好的精度;
[0072] 2、桥梁健康监测系统中的风速风向仪安装在桥面上,记录下来的数据可W很好的 表现出桥梁所在地的近地风特性,可W为桥梁抗风设计与验算提供基本的依据;
[0073] 3、桥梁健康监测系统中风速风向仪记录了大量的原始数据,可W通过处理运些原 始数据得到研究所需的指定数据。运相比于气象站所记录的数据,更加能满足分析的需要;
[0074] 4、解决了传统统计分析方法中未充分考虑到方向对风速影响的问题,因为在不同 的方向上风速是不同的,而且不同的方向的风对桥梁结构的影响也是不同的,不能只考虑 风速运一个因素。本发明充分的考虑到了风向运个重要因素;
[0075] 5、解决了传统统计分析方法未考虑到风速和风向之间相互关联的问题。风速和风 向的边缘概率密度函数是相关的,传统的处理方法只是简单的将它们两个的边缘概率密度 函数相乘,得出的模型没有足够的精确度。本发明在建立风速风向联合密度函数时,考虑到 了两者边缘概率密度函数之间的相关性;
[0076] 6、解决了传统统计分析方法未能提出一个固定的建模方法来分析风速风向的联 合分布的问题。本发明提出了一个固定的风速风向联合分布函数fv,0(v,0);
[0077] 7、解决了传统统计分析方法只能找到局部最优值的问题。本发明采用的遗传算法 W种群规模进行寻优,一些个体陷入局部最优并不影响整个进化进程,是一种全局优化算 法;
[0078] 8、相较于传统统计分析方法,遗传算法具有捜索速度快,避免陷入局部最优,适用 性高,结果精度高等优点。
【附图说明】
[0079] 图1是本发明的参数估计流程图;
[0080] 图2是本发明的遗传算法流程图。
【具体实施方式】
[0081] 下面参照附图,进一步说明本发明的技术方案。
[0082] 本发明所述的一种基于遗传算法的风场特征统计分布模型建立方法,包括如下步 骤:
[0083] A.处理原始风速风向数据;
[0084] A1.W10分钟为一时距,求出十分钟内的风速和风向数据的平均值;
[0085] A2.将风速和风向数据储存在excel或matlab文件中,风速存放在一列中,风向存 放在一列中,并且同一时距内的风速和风向数据--对应存在同一行;
[0086] B.估计风速概率密度函数中的参数;
[0087] B1.风速在Om八到20m/s之间。取一区间为[0,20],其下限比最小数据稍小,其上限 比最大数据稍大,将运一区间分为200个小区间Rv,每个区间的间隔为0.1。那么样本落在区 间Rv的频率可表示为?/,, =^.>/(.、.|Η.',α,/〇晏。 /\
[0088] Β2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的 捜索结果作为最终参数估计值。其适应度函数可W表示为
[0089]
[0090] Β3.利用所得的参数估计值计算不同组分个数下的AIC值和Δ。^确定最佳组分个 数,其中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。
[0091] 赤池信息准则AIC是一个基于似然函数值的模型选择准则,可表示为
[0092] AIC = 2M-21n 化)
[0093] 距离测度Δ。是从拟合优度假设检验衍生,Δ。值可表示为
[0094]
[00M]选择AIC值和Δ。最小值对应的组分个数,确立最优的拟合模型;
[0096] C.估计风向概率密度函数中的参数;
[0097] C1.风速在0到如之间。取一区间为[0,231],将运一区间分为200个小区间Rv,每个 区间的间隔为0.1 n。那么样本落在区间Rv的频率可表示为
[0098] C2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的 捜索结果作为最终参数估计值。其适应度函数可W表示为
[0099]
[0100] C3.利用所得的参数估计值计算不同组分个数下的AIC值和Δ。^确定最佳组分个 数,其中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。
[0101] 赤池信息准则AIC是一个基于似然函数值的模型选择准则,可表示为
[0102] AIC = 2M-21n 化)
[0103] 距离测度Δ。是从拟合优度假设检验衍生。Δ。值可表示为
[0104]
[0105] 选择AIC值和Δ。最小值对应的组分个数,确立最优的拟合模型;
[0106] D.估计相关系数概率密度函数中的参数;
[0107] D1 .通过B和C两个步骤已经得出了风速和风向的概率密度函数,然后使用
可W计算出每一个风速风向数据所对应的相关系数;
[0108] D2.进行C1,C2,C3运个步骤对相关系数数据进行处理;
[0109] D3.得到相关系数概率密度函数中的最优的集中参数k,平均相关系数μ,Κ及各组 分混合权重W;
[0110] E.风速风向联合分布函数;
[0111] E1.W上已经通过遗传算法计算出风速,风向,相关系数的概率密度函数,即可W 得到风速风向概率密度函数fv,0(v,目)= 23ig( γ )fv(v)f0(0)。
[0112] 本说明书实施案例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保 护范围不应当被视为仅限于实施案例所陈述的具体形式,本发明的保护范围也及于本领域 技术人员根据本发明构思所能够想到的等同技术手段。
【主权项】
1. 一种基于遗传算法的风场特征统计分布模型建立方法,具体实施流程如下: A. 处理原始风速风向数据; A1.以10分钟为一时距,求出十分钟内的风速和风向数据的平均值; A2.将风速和风向数据储存在excel或matlab文件中,风速存放在一列中,风向存放在 一列中,并且同一时距内的风速和风向数据一一对应存在同一行; B. 估计风速概率密度函数中的参数; B1.风速的范围在Om/s到20m/s之间。取一区间为[0,20],其下限比最小数据稍小,其上 限比最大数据稍大,将这一区间分为200个小区间Rv,每个区间的间隔为0.1。那么样本落在 区间Rv的频率可表示,其中Kv为落入区间Rv的样本数量,K为样本 总量,ξ为区间Rv的面积,为风速概率密度函数,Xv为区间Rv 中心点的X坐标,β为范围参数,α为外形参数,wi为各组分混合权重; Β2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的搜索 结果作为最终参数估计值。其适应度函数可以表示为其中汽~|?,€[,0)为风速概率密度函数。当办越接近汽心|?,€[,0)|时,适应度函数的值 越大。使适应度函数的值达到最大的范围参数β,外形参数α,以及各组分混合权重w为参数 的最优解; Β3.利用所得的参数估计值计算不同组分个数下的AIC值和△。以确定最佳组分个数,其 中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。 赤池信息准则AIC是一个基于似然函数值的模型选择准则,表示为 AIC = 2M-21n(L) 其中Μ为分布模型中未知参数的个数,表示增加参数的折扣,ln(L)为极大对数似然函 数,用于衡量模型的拟合优度。 距离测度A。是从拟合优度假设检验衍生。△。值可表示为其中T为区间划分个数,qv为拟合分布在区间Rv内的频率,hv为样本落入区间R v内的概 率。选择AIC值和△ c最小值对应的组分个数,确立最优的拟合模型; C. 估计风向概率密度函数中的参数; C1.风向角度范围在0到2π之间。取区间为[〇,2π ],将这一区间分为200个小区间Rv,每个区 间的间隔为〇. 1心那么样本落在区间Rv的频率可表示为,其中Κν为落入区间Rv的样本数量,K为样本总量,ξ为区间Rv的面积, 向概率密度函数,Χθ为区间RV中心点的χ坐标,k伪集中参数,μ伪平均风向,w沩各组分混合 权重; C2.种群规模取为200,最大进化代数为5000,共进行10次试验,取适应度值最大的搜索 结果作为最终参数估计值。其适应度函数可以表示为其中f (χθ | w,k,y)为风向概率密度函数。当qv越接近f (χθ | w,k,yH时,适应度函数的值 越大。使适应度函数的值达到最大的集中参数k,平均风向μ,以及各组分混合权重w为参数 的最优解; C3.利用所得的参数估计值计算不同组分个数下的AIC值和△。以确定最佳组分个数,其 中的组分个数从1开始直到AIC值与Δ。不再显著变化为止。 赤池信息准则AIC是一个基于似然函数值的模型选择准则,表示为 AIC = 2M-21n(L) 其中Μ为分布模型中未知参数的个数,表示增加参数的折扣,ln(L)为极大对数似然函 数,用于衡量模型的拟合优度。 距离测度A。是从拟合优度假设检验衍生。△。值可表示为其中T为区间划分个数,qv为拟合分布在区间Rv内的频率,hv为样本落入区间R v内的概 率。选择AIC值和△。最小值对应的组分个数,确立最优的拟合模型; D.估计相关系数概率密度函数中的参数; D1.通过B和C两个步骤已经得出了风速和风向的概率密度函数,然后使用可以计算出每一个风速风向数据所对应的相关系数; D2.进行Cl,C2,C3这三个步骤对相关系数数据进行处理; D3.得到相关系数概率密度函数中的最优的集中参数k,平均相关系数μ,以及各组分混 合权重w; Ε.风速风向联合分布函数; Ε1.以上已经通过遗传算法计算出风速,风向,相关系数的概率密度函数,即可以得到 风速风向概率密度函数fv,0(v,0) = 23Tg( γ )fv(v)f0(0)。
【文档编号】G06F17/50GK105824987SQ201610132682
【公开日】2016年8月3日
【申请日】2016年3月9日
【发明人】叶肖伟, 奚培森, 苏有华
【申请人】浙江大学