铁塔钢材指标预测模型的训练方法、装置及可读存储介质与流程

文档序号:26914767发布日期:2021-10-09 15:51阅读:110来源:国知局
铁塔钢材指标预测模型的训练方法、装置及可读存储介质与流程

1.本发明涉及特高压直流线路工程领域,尤其涉及一种铁塔钢材指标预测模型的训练方法、装置及可读存储介质。


背景技术:

2.铁塔钢材的投资在特高压直流线路工程的本体投资中占比达到30%以上,因而铁塔钢材指标的预测结果对特高压直流线路工程的投资决策具有重大意义。然而,目前并没有有效的手段和方法来对特高压直流线路工程的铁塔钢材指标进行预测,只能通过人员的经验进行评估得到,因而导致铁塔钢材指标的预测结果准确性低。


技术实现要素:

3.本发明实施例提供了一种铁塔钢材指标预测模型的训练方法、装置及可读存储介质,以解决现有技术中通过人员的经验进行铁塔钢材指标的评估,导致铁塔钢材指标的预测结果准确性低的问题。
4.第一方面,本发明实施例提供了一种铁塔钢材指标预测模型的训练方法,该方法包括:
5.获取初始样本数据,所述初始样本数据包括所述铁塔钢材指标的目标设计变量和所述目标设计变量在不同取值时对应的指标实际值;
6.利用所述初始样本数据对初始模型进行训练,获得中间模型;
7.利用所述中间模型对所述铁塔钢材指标进行预测,获得所述目标设计变量在不同取值时对应的指标预测值;
8.根据所述指标预测值和所述指标实际值,确定所述中间模型的评估结果;
9.在所述评估结果小于或等于预设阈值的情况下,将所述中间模型确定为所述铁塔钢材指标预测模型。
10.可选的,所述初始模型包括元学习器和m个基学习器,m为大于1的整数;所述利用所述初始样本数据对初始模型进行训练,获得中间模型,包括:
11.将初始训练集划分成k个训练子集,所述初始训练集包含于所述初始样本数据,k为大于1的整数;
12.利用所述k个训练子集对所述m个基学习器进行k次训练和k次测试,获取m个中间训练集,其中,每个所述中间训练集均包括k个第一预测结果;
13.将所述m个中间预测结果作为所述元学习器的输入数据进行训练;
14.将训练后的m个基学习器和训练后的元学习器,确定为所述中间模型。
15.可选的,所述利用所述k个训练子集对所述m个基学习器进行k次训练和k次测试,获取m个中间训练集,包括:
16.对所述k个训练子集进行k次划分,获取k个第一训练集和k个第二训练集,其中,所述第一训练集为所述k个训练子集中的k

1个训练子集的集合,所述第二训练集为所述k个
训练子集中除所述第一训练集外的其他训练子集的集合;
17.将所述k个第一训练集输入至第一基学习器中进行k次训练,得到k个训练后的第一基学习器,所述第一基学习器为所述m个基学习器中的任一基学习器;
18.将所述k个第二训练集输入至所述k个训练后的第一基学习器中进行测试,得到中间训练集,其中,所述中间训练集包括k个第一预测结果,每个所述第一预测结果的数量与每次参与测试的第二训练集中的样本数量相同。
19.可选的,所述利用所述中间模型对所述铁塔钢材指标进行预测,获得所述目标设计变量在不同取值时对应的指标预测值,包括:
20.将初始测试集输入至所述k个训练后的第一基学习器中进行测试,获得中间测试集,其中,所述初始测试集为所述初始样本数据中除所述初始训练集外的其他样本数据,所述中间测试集为k个第二预测结果的均值,每个所述第二预测结果的数量与所述初始测试集的样本数量相同;
21.将所述m个基学习器对应的所述中间测试集输入训练后的元学习器进行预测,获得所述目标设计变量在不同取值时对应的指标预测值。
22.可选的,所述m个基学习器包括梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络子模型,所述元学习器包括stacking集成学习子模型。
23.可选的,所述获取初始样本数据,包括:
24.获取铁塔钢材指标的历史数据中的设计变量类型;
25.基于预设的随机森林算法,从所述设计变量类型中确定出目标设计变量,所述目标设计变量包括风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高和耐张塔平均呼高中的至少一项;
26.以所述目标设计变量为维度对所述目标设计变量的取值和所述指标实际值进行统计,得到初始样本数据。
27.可选的,在所述根据所述指标预测值和所述指标实际值,确定所述中间模型的评估结果之后,所述方法还包括:
28.在所述评估结果大于所述预设阈值的情况下,对所述中间模型的参数值进行调整,获得新的中间模型;
29.将所述新的中间模型作为所述初始模型,并执行利用所述初始样本数据对初始模型进行训练,获得中间模型的步骤。
30.第二方面,本发明实施例还提供了一种铁塔钢材指标预测模型的训练装置,所述装置包括:
31.第一获取模块,用于获取初始样本数据,所述初始样本数据包括所述铁塔钢材指标的目标设计变量和所述目标设计变量在不同取值时对应的指标实际值;
32.训练模块,用于利用所述初始样本数据对初始模型进行训练,获得中间模型;
33.预测模块,用于利用所述中间模型对所述铁塔钢材指标进行预测,获得所述目标设计变量在不同取值时对应的指标预测值;
34.第一确定模块,用于根据所述指标预测值和所述指标实际值,确定所述中间模型的评估结果;
35.第二确定模块,用于在所述评估结果小于或等于预设阈值的情况下,将所述中间
模型确定为所述铁塔钢材指标预测模型。
36.第三方面,本发明实施例还提供了一种电子设备,该电子设备包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的铁塔钢材指标预测模型的训练方法的步骤。
37.第四方面,本发明实施例还提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的铁塔钢材指标预测模型的训练方法的步骤。
38.在本发明实施例中,通过获取初始样本数据,所述初始样本数据包括所述铁塔钢材指标的目标设计变量和所述目标设计变量在不同取值时对应的指标实际值;利用所述初始样本数据对初始模型进行训练,获得中间模型;利用所述中间模型对所述铁塔钢材指标进行预测,获得所述目标设计变量在不同取值时对应的指标预测值;根据所述指标预测值和所述指标实际值,确定所述中间模型的评估结果;在所述评估结果小于或等于预设阈值的情况下,将所述中间模型确定为所述铁塔钢材指标预测模型。通过这种方式,可以利用初始样本数据对初始模型进行训练,并根据训练后的中间模型预测得到指标预测值,进而根据指标预测值和指标实际值对中间模型进行评估,这样,可以根据评估结果对中间模型进行优化,最终得到优化后的铁塔钢材指标预测模型。因此,可以通过训练好的铁塔钢材指标预测模型直接对铁塔钢材指标进行预测,相比现有技术中通过人员的经验进行铁塔钢材指标的评估,预测结果准确性更高。
附图说明
39.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。
40.图1为本发明实施例提供的铁塔钢材指标预测模型的训练方法的流程图;
41.图2为本发明实施例提供的初始模型的结构示意图之一;
42.图3为本发明实施例提供的初始模型的结构示意图之二;
43.图4为本发明实施例提供的铁塔钢材指标预测模型的训练装置的结构示意图;
44.图5为本发明实施例提供的电子设备的结构示意图。
具体实施方式
45.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。
46.除非另作定义,本发明中使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本发明中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“一个”或者“一”等类似词语也不表示数量限制,而是表示存在至少一个。“连接”或者“相连”等类似的
词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也相应地改变。
47.参见图1,图1为本发明实施例提供的铁塔钢材指标预测模型的训练方法的流程图。如图1所示,该铁塔钢材指标预测模型的训练方法包括:
48.步骤101、获取初始样本数据,初始样本数据包括铁塔钢材指标的目标设计变量和目标设计变量在不同取值时对应的指标实际值。
49.在该步骤中,可以通过获取已有的特高压直流线路工程的数据信息,从该数据信息中提取出与铁塔钢材指标有关的设计变量,并根据各个设计变量对铁塔钢材指标的重要程度,确定出一个或者多个目标设计变量,并以该目标设计变量为维度获取各目标设计变量的取值和目标设计变量在不同取值时对应的指标实际值,作为模型训练的初始样本数据。
50.具体地,可以根据国内已建的15条特高压直流线路工程的数据建立数据库,其中,国内已建的15条特高压直流线路工程如表一所示。
51.[0052][0053]
表一
[0054]
通过采用预设算法如随机森林算法,或者人为经验等方式,从数据库中选取出影响铁塔钢材指标较大的目标设计变量。此处的铁塔钢材指标是指在特高压直流线路工程中单公里所需的钢材重量,目标设计变量是指在特高压直流线路工程中对铁塔钢材指标影响较为明显的设计变量,如风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高、耐张塔平均呼高等。
[0055]
步骤102、利用初始样本数据对初始模型进行训练,获得中间模型。
[0056]
具体地,上述初始模型可以为单独的迭代决策树(gradient boosting decision tree,简称gbdt)模型、支持向量机(support vector machine,简称svm)模型或反向传播神经网络(back propagationneural network)模型等,也可以为采用集成算法如adaboost算法、bagging算法、stacking算法等集成至少两种模型得到的融合模型等,本技术不做具体限定。
[0057]
上述中间模型与上述初始模型为相同的模型,两者的区别在于:初始模型的模型参数为设定的初始值,中间模型的模型参数为经过初始样本数据训练后的模型参数。
[0058]
在本步骤中,可以将初始样本数据按照预设比例划分为初始训练集和初始测试集,分别用于对初始模型进行训练和测试。具体而言,当初始模型为单独的迭代决策树(gradient boosting decision tree,简称gbdt)模型、支持向量机(support vector machine,简称svm)模型或反向传播神经网络(back propagationneural network)模型时,
可以直接将初始训练集输入至该初始模型进行训练,得到中间模型。当初始模型为集成多个基学习器和一个元学习器的模型时,则可以将初始训练集采用k折交叉验证的方式对初始模型中的各个基学习器进行训练,并利用训练后的基学习器得到中间训练集,由此在将中间训练集作为元学习器的训练数据,最终得到训练后的中间模型。
[0059]
步骤103、利用中间模型对铁塔钢材指标进行预测,获得目标设计变量在不同取值时对应的指标预测值。
[0060]
在获取到步骤102中的中间模型后,可以将初始测试集输入至中间模型,对铁塔钢材指标进行预测,由此获取到目标设计变量在不同取值时对应的指标预测值。
[0061]
步骤104、根据指标预测值和指标实际值,确定中间模型的评估结果。
[0062]
具体地,可以根据目标设计变量在同一取值条件下的指标预测值和指标实际值,来评估模型的优劣。例如,可以先计算目标设计变量在同一取值条件下的指标预测值和指标实际值之间的差值,再计算各个差值的平均值、方差等,将最终计算结果作为中间模型的评价结果。
[0063]
步骤105、在评估结果小于或等于预设阈值的情况下,将中间模型确定为铁塔钢材指标预测模型。
[0064]
具体地,上述预设阈值可以根据实际需要具体设置,本技术不做限定。当评估结果小于或等于预设阈值时,表示铁塔钢材指标的指标预测值接近指标实际值,可以对铁塔钢材指标实现精确预测,因而可以将该中间模型作为铁塔钢材指标预测模型,运用到实际的铁塔钢材指标预测中。
[0065]
在本实施例中,可以利用初始样本数据对初始模型进行训练,并根据训练后的中间模型预测得到指标预测值,进而根据指标预测值和指标实际值对中间模型进行评估,这样,可以根据评估结果对中间模型进行优化,最终得到优化后的铁塔钢材指标预测模型。因此,可以通过训练好的铁塔钢材指标预测模型直接对铁塔钢材指标进行预测,相比现有技术中通过人员的经验进行铁塔钢材指标的评估,预测结果准确性更高。
[0066]
进一步地,初始模型包括元学习器和m个基学习器,m为大于1的整数;上述步骤102、利用初始样本数据对初始模型进行训练,获得中间模型,包括:
[0067]
将初始训练集划分成k个训练子集,初始训练集包含于初始样本数据,k为大于1的整数;
[0068]
利用k个训练子集对m个基学习器进行k次训练和k次测试,获取m个中间训练集,其中,每个中间训练集均包括k个第一预测结果;
[0069]
将m个中间预测结果作为元学习器的输入数据进行训练;
[0070]
将训练后的m个基学习器和训练后的元学习器,确定为中间模型。
[0071]
具体地,参见图2,图2为本发明实施例提供的初始模型的结构示意图之一。如图2所示,该初始模型包括m个基学习器和一个元学习器,m个基学习器的输出结果作为元学习器的输入数据,通过元学习器可以对m个基学习器的输出结果进行泛化,以获得整体预测精度的提升。在该初始模型中,可以将初始训练集作为m个基学习器的输入数据,分别输入至每个基学习器中对每个基学习器进行训练和测试,每个基学习器均可输出对应的输出结果,再将每个输出结果作为中间训练集,输入至元学习器中,对元学习器进行训练。这样,经过训练过的m个基学习器和元学习器就构成了中间模型。
[0072]
在一实施例中,在将初始训练集输入至m个基学习器中之前,可以将初始训练集划分成k个等份,形成k个训练子集,其中,k可以为2、3、4、5等任意大于1的正整数,本技术不做具体限定。为方便说明,后续实施例均以5个训练子集为了进行说明。
[0073]
在利用k个训练子集对m个基学习器进行k次训练和k次测试时,可以每次从k个训练子集中选取相同等份的训练子集作为m个基学习器的训练数据,对m个基学习器进行k次训练,并每次选取剩余的训练子集作为m个基学习器的测试数据,对m个基学习器进行k次测试。例如,在5个训练子集s1、s2、s3、s4和s5中,可以选取s1、s2和s3作为m个基学习器的第一次训练数据,选取s4和s5作为m个基学习器的第一次测试数据;选取s1、s2和s4作为m个基学习器的第二次训练数据,选取s3和s5作为m个基学习器的第二次测试数据;选取s1、s2和s5作为m个基学习器的第三次训练数据,选取s3和s4作为m个基学习器的第三次测试数据;选取s2、s3和s4作为m个基学习器的第四次训练数据,选取s1和s5作为m个基学习器的第四次测试数据;选取s2、s3和s5作为m个基学习器的第五次训练数据,选取s1和s4作为m个基学习器的第五次测试数据。这样,即可完成对m个基学习器进行五次训练和五次测试。当然,上述仅是举例说明,在实际应用时,可以从k个训练子集中选取其他数量的训练子集,如选取2个或4个训练子集,作为每次m个基学习器的训练数据,再将剩余的训练子集作为每次m个基学习器的测试数据,本实施例不做具体限定。
[0074]
需要说明的是,上述中间训练集是指每个基学习器经过k次训练和k次测试,最终得到的k个第一预测结果的集合。例如,某基学习器在第一次测试后输出得到第一预测结果d1,在第二次测试后输出得到第一预测结果d2,在第三次测试后输出得到第一预测结果d3,在第四次测试后输出得到第一预测结果d4,在第五次测试后输出得到第五输出结果d5,那么该d1、d2、d3、d4和d5合并后得到一个中间训练集zk。这样,m个基学习器一共可以输出m个中间训练集z1,z2,...,z
m
,每个中间训练集与每个基学习器一一对应。
[0075]
根据获得到的m个中间训练集确定元学习器的训练数据s
new
={(y
n
,z
1n
,z
2n
,...,z
mn
),n=1,...,n},其中,n表示初始训练集的总数量,m表示基学习器的总数量,y
n
表示第n个初始样本的指标实际值,z
1n
,z
2n
,...,z
mn
分别表示各基学习器输出的中间训练集。基于s
new
对元学习器进行训练,由此可以将训练后的m个基学习器和训练后的元学习器,确定为中间模型。
[0076]
在本实施例中,可以将初始样本数据拆分成k个训练子集,对每个基学习器进行k次训练和k次测试,由此得到不同的基学习器的中间训练集,并将这些中间训练集作为元学习器的训练数据,再次对元学习器进行训练。这样,元学习器就可以对m个基学习器的输出结果再次进行优化,使得最终得到的指标预测值与指标实际值更加的接近,达到较好的预测效果。
[0077]
进一步地,上述步骤、利用k个训练子集对m个基学习器进行k次训练和k次测试,获取m个中间训练集,包括:
[0078]
对k个训练子集进行k次划分,获取k个第一训练集和k个第二训练集,其中,第一训练集为k个训练子集中的k

1个训练子集的集合,第二训练集为k个训练子集中除第一训练集外的其他训练子集的集合;
[0079]
将k个第一训练集输入至第一基学习器中进行k次训练,得到k个训练后的第一基学习器,第一基学习器为m个基学习器中的任一基学习器;
[0080]
将k个第二训练集输入至k个训练后的第一基学习器中进行测试,得到中间训练集,其中,中间训练集包括k个第一预测结果,每个第一预测结果的数量与每次参与测试的第二训练集中的样本数量相同。
[0081]
在一实施例中,可以选取k个训练子集中的k

1个训练子集作为第一训练集,并将剩余的一个训练子集作为第二训练集,将第一训练集输入m个基学习器中对m个基学习器进行训练,再将第二训练集输入至训练后的第一基学习器进行测试,得到第一预测结果。由于从k个训练子集中选取第一训练集的方式存在k种,因而可以获取k个第一训练集和k个第二训练集。
[0082]
例如,假设初始样本数据为600条,将其中的500条作为初始训练集,将剩余100条作为初始测试集。其中,每条初始样本数据可以用s
n
={(y
n
,x
n
),n=1,...,n}表示,此处的n表示初始训练集的总数量,y
n
表示第n个初始样本的指标实际值,x
n
表示第n个初始样本的特征向量,即每个目标设计参数对应的向量值。此时,将上述500条初始训练集随机拆分成具有相同初始样本数量的s1、s2、s3、s4和s5,这样s1、s2、s3、s4和s5均包括100条初始样本。
[0083]
在对第一基学习器进行第一次训练时,可以选取s1、s2、s3和s4作为第一训练集对其进行训练,得到训练后的第一基学习器,再选取s5作为第二训练集,对训练后的第一基学习器进行测试,输出第一预测结果d1。其中d1为包含100条预测结果的数据。在对第一基学习器进行第二次训练时,可以选取s1、s2、s3和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再选取s4作为第二训练集,对训练后的第一基学习器进行测试,输出第一预测结果d2。其中d2也为包含100条预测结果的数据。在对第一基学习器进行第三次训练时,可以选取s1、s2、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再选取s3作为第二训练集,对训练后的第一基学习器进行测试,输出第一预测结果d3。其中d3也为包含100条预测结果的数据。在对第一基学习器进行第四次训练时,可以选取s1、s3、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再选取s2作为第二训练集,对训练后的第一基学习器进行测试,输出第一预测结果d4。其中d4也为包含100条预测结果的数据。在对第一基学习器进行第五次训练时,可以选取s2、s3、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再选取s1作为第二训练集,对训练后的第一基学习器进行测试,输出第一预测结果d5。其中d5也为包含100条预测结果的数据。最终,第一基学习器可以依次得到d1、d2、d3、d4和d5这5个第一预设结果,由此得到第一基学习器对应的中间训练集。需要说明的是,此处的第一基学习器为m个基学习器中的任意一个基学习器,m个基学习器中的每个基学习器均可采用上述方式获取到对应的中间训练集。这样,可以基于m个基学习器对应的m个中间训练集对元学习器进行训练,得到中间模型。
[0084]
在本实施例中,可以将初始训练集进行k次拆分,基于每次拆分得到的第一训练集和第二训练集对m个基学习器进行训练和测试,由此可以在初始训练集数量较少的情况下,利用初始训练集对基学习器进行充分训练,使得训练后的基学习器的预测结果能够更加准确。
[0085]
进一步地,基于图1所示的实施例,上述步骤103、利用中间模型对铁塔钢材指标进行预测,获得目标设计变量在不同取值时对应的指标预测值,包括:
[0086]
将初始测试集输入至k个训练后的第一基学习器中进行测试,获得中间测试集,其
中,初始测试集为初始样本数据中除初始训练集外的其他样本数据,中间测试集为k个第二预测结果的均值,每个第二预测结果的数量与初始测试集的样本数量相同;
[0087]
将m个基学习器对应的中间测试集输入训练后的元学习器进行预测,获得目标设计变量在不同取值时对应的指标预测值。
[0088]
在一实施例中,在利用中间模型获取中间训练集的同时,可以同样利用中间模型获取中间测试集。两者区别在于,中间训练集是将第二训练集作为输入数据,输入至基于第一训练集训练后的基学习器中测试得到,而中间测试集是将初始测试集作为输入数据,输入至基于第一训练集训练后的基学习器中测试得到。
[0089]
继续基于上述举例进行说明,在对第一基学习器进行第一次训练时,可以选取s1、s2、s3和s4作为第一训练集对其进行训练,得到训练后的第一基学习器,再将具有100条样本数据的初始测试集输入至训练后的第一基学习器进行测试,输出第二预测结果td1。其中td1为包含100条预测结果的数据。在对第一基学习器进行第二次训练时,可以选取s1、s2、s3和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再将具有100条样本数据的初始测试集输入至训练后的第一基学习器进行测试,输出第二预测结果td2。其中td2也为包含100条预测结果的数据。在对第一基学习器进行第三次训练时,可以选取s1、s2、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再将具有100条样本数据的初始测试集输入至训练后的第一基学习器进行测试,输出第二预测结果td3。其中td3也为包含100条预测结果的数据。在对第一基学习器进行第四次训练时,可以选取s1、s3、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再将具有100条样本数据的初始测试集输入至训练后的第一基学习器进行测试,输出第二预测结果td4。其中td4也为包含100条预测结果的数据。在对第一基学习器进行第五次训练时,可以选取s2、s3、s4和s5作为第一训练集对第一基学习器进行训练,得到训练后的第一基学习器,再将具有100条样本数据的初始测试集输入至训练后的第一基学习器进行测试,输出第二预测结果td5。其中td5也为包含100条预测结果的数据。最终,第一基学习器可以依次得到td1、td2、td3、td4和td5这5个第二预设结果,并对这5个第二预设结果相加求平均,由此得到第一基学习器对应的中间测试集。需要说明的是,此处的第一基学习器为m个基学习器中的任意一个基学习器,m个基学习器中的每个基学习器均可采用上述方式获取到对应的中间测试集。这样,可以将m个基学习器对应的m个中间测试集输入训练后的元学习器进行预测,获得目标设计变量在不同取值时对应的指标预测值。
[0090]
在本实施例中,可以将初始测试集分别输入至k次训练后的基学习器中,以得到中间测试集,并通过训练后的元学习器对m个中间测试集进行测试,得到指标预测值。由此可以在初始测试集数据较少的情况下,利用初始测试集在基学习器进行充分测试,使得得到的指标预测值更加准确。
[0091]
进一步地,参见图3,图3为本发明实施例提供的初始模型的结构示意图之二。如图3所示,m个基学习器包括梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络子模型,元学习器包括stacking集成学习子模型。
[0092]
在一实施例中,基学习器的数量可以为3个,3个基学习器分别为梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络子模型。元学习器包括stacking集成学习子模型,用于将梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络
子模型集成得到的融合模型。如图3所示,可以获取铁塔钢材指标的历史数据,并根据获取到的铁塔钢材指标的历史数据,获取初始样本数据,在将初始样本数据划分为初始训练集和初始测试集。然后将初始训练集和初始测试集输入至上述梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络子模型中。利用初始训练集对梯度提升迭代决策树子模型进行k次训练,并通过k次训练后的梯度提升迭代决策树子模型对初始测试集进行预测,输出中间测试集1和中间训练集1;利用初始训练集对支持向量机子模型进行k次训练,并通过k次训练后的支持向量机子模型对初始测试集进行预测,输出中间测试集2和中间训练集2;利用初始训练集对反向传播神经网络子模型进行k次训练,并通过k次训练后的反向传播神经网络子模型对初始测试集进行预测,输出中间测试集3和中间训练集3。然后利用中间训练集1、中间训练集2和中间训练集3对stacking集成学习子模型进行训练,得到训练后的stacking集成学习子模型。最后将中间测试集1、中间测试集2、中间测试集3输入至训练后的stacking集成学习子模型进行预测,得到指标预测值。
[0093]
在本实施例中,由于这3个基学习器使用的学习算法不同,因而在对这3个基学习器进行k次训练和测试后,可以得到不同结果的中间测试集和中间训练集,进而通过stacking集成学习子模型对这3个基学习器输出的中间训练集和中间测试集进行训练和测试,使得第1层基学习器的训练结果能够充分用于第2层元学习器的归纳过程当中,第2层元学习器能够发现并且纠正第1层基学习器中的预测误差,以提升模型的精度。
[0094]
进一步地,基于图1所示的实施例,上述步骤101、获取初始样本数据,包括:
[0095]
获取铁塔钢材指标的历史数据中的设计变量类型;
[0096]
基于预设的随机森林算法,从设计变量类型中确定出目标设计变量,目标设计变量包括风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高和耐张塔平均呼高中的至少一项;
[0097]
以目标设计变量为维度对目标设计变量的取值和指标实际值进行统计,得到初始样本数据。
[0098]
具体地,上述铁塔钢材指标的历史数据可以为根据国内已建的15条特高压直流线路工程的数据而建立的数据库,其中,国内已建的15条特高压直流线路工程如上述表一所示。
[0099]
在一实施例中,可以通过采用随机森林算法从数据库中选取出影响铁塔钢材指标较大的目标设计变量。此处的目标设计变量可以为风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高和耐张塔平均呼高中的任意一项或者多项的组合,本技术不做具体限定。在一实施例中,为了使得铁搭钢材指标的预测结果更加准确,可以选择风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高和耐张塔平均呼高8个设计变量作为目标设计变量。这样,在获取初始样本数据时,就可以以这8个目标设计变量为维度进行数据提取,并对提取的数值进行向量化。例如,假设风速用向量表示,覆冰程度用向量表示,导线型号用向量表示,地形比例用向量表示,耐张塔比例用向量表示,单公里杆塔数量用向量表示,直线塔平均呼高用向量表示,耐张塔平均呼高用向量表示,那么每个初始样本数据s
n
={(y
n
,x
n
),n=1,...,n},其中,n表示初始训练集的总数量,y
n
表示第n个初始样本的指标实际值,x
n
表示第
n个初始样本的特征向量,每个特征向量为
[0100]
需要说明的是,在提取目标设计变量的数据时,需要对提取的数据进行预处理,如对缺失值进行补充,对异常值进行修改等。
[0101]
在本实施例中,可以依据目标设计变量来获取初始样本数据,并通过该初始样本数据对铁塔钢材指标预测模型进行训练,使得最终的铁塔钢材指标预测模型的预测结果能够接近指标实际值。
[0102]
进一步地,在上述步骤104、根据指标预测值和指标实际值,确定中间模型的评估结果之后,方法还包括:
[0103]
在评估结果大于预设阈值的情况下,对中间模型的参数值进行调整,获得新的中间模型;
[0104]
将新的中间模型作为初始模型,并执行利用初始样本数据对初始模型进行训练,获得中间模型的步骤。
[0105]
具体地,上述预设阈值可以根据实际需要具体设置,本技术不做限定。当评估结果大于预设阈值时,表示铁塔钢材指标的指标预测值与指标实际值之间存在较大的差距,目前的中间模型还有待进一步优化,因而可以对m个基学习器的模型参数和元学习器的模型参数进行调整,得到新的中间模型,并将新的中间模型作为初始模型,不断循环执行上述步骤102至步骤104,直到评估结果小于或等于预设阈值,停止模型训练,并将最新的中间模型确定为铁塔钢材指标预测模型。
[0106]
在本实施例中,可以将初始测试集带入中间模型中,并通过评估结果对模型预测性能进行检验,根据评估结果的大小不断对模型进行评估和优化,使得最终得到的预测模型的性能更佳。
[0107]
除此之外,本发明实施例还提供一种铁塔钢材指标预测模型的训练装置。参见图4,图4为本发明实施例提供的铁塔钢材指标预测模型的训练装置的结构示意图。如图4所示,该装置400包括:
[0108]
获取模块401,用于获取初始样本数据,初始样本数据包括铁塔钢材指标的目标设计变量和目标设计变量在不同取值时对应的指标实际值;
[0109]
训练模块402,用于利用初始样本数据对初始模型进行训练,获得中间模型;
[0110]
预测模块403,用于利用中间模型对铁塔钢材指标进行预测,获得目标设计变量在不同取值时对应的指标预测值;
[0111]
第一确定模块404,用于根据指标预测值和指标实际值,确定中间模型的评估结果;
[0112]
第二确定模块405,用于在评估结果小于或等于预设阈值的情况下,将中间模型确定为铁塔钢材指标预测模型。
[0113]
可选地,初始模型包括元学习器和m个基学习器,m为大于1的整数;训练模块402包括:
[0114]
划分子模块,用于将初始训练集划分成k个训练子集,初始训练集包含于初始样本数据,k为大于1的整数;
[0115]
处理子模块,用于利用k个训练子集对m个基学习器进行k次训练和k次测试,获取m
个中间训练集,其中,每个中间训练集均包括k个第一预测结果;
[0116]
训练子模块,用于将m个中间预测结果作为元学习器的输入数据进行训练;
[0117]
第一确定子模块,用于将训练后的m个基学习器和训练后的元学习器,确定为中间模型。
[0118]
可选地,处理子模块包括:
[0119]
划分单元,用于对k个训练子集进行k次划分,获取k个第一训练集和k个第二训练集,其中,第一训练集为k个训练子集中的k

1个训练子集的集合,第二训练集为k个训练子集中除第一训练集外的其他训练子集的集合;
[0120]
训练单元,用于将k个第一训练集输入至第一基学习器中进行k次训练,得到k个训练后的第一基学习器,第一基学习器为m个基学习器中的任一基学习器;
[0121]
测试单元,用于将k个第二训练集输入至k个训练后的第一基学习器中进行测试,得到中间训练集,其中,中间训练集包括k个第一预测结果,每个第一预测结果的数量与每次参与测试的第二训练集中的样本数量相同。
[0122]
可选地,预测模块403包括:
[0123]
测试子模块,用于将初始测试集输入至k个训练后的第一基学习器中进行测试,获得中间测试集,其中,初始测试集为初始样本数据中除初始训练集外的其他样本数据,中间测试集为k个第二预测结果的均值,每个第二预测结果的数量与初始测试集的样本数量相同;
[0124]
预测子模块,用于将m个基学习器对应的中间测试集输入训练后的元学习器进行预测,获得目标设计变量在不同取值时对应的指标预测值。
[0125]
可选地,m个基学习器包括梯度提升迭代决策树子模型、支持向量机子模型和反向传播神经网络子模型,元学习器包括stacking集成学习子模型。
[0126]
可选地,获取模块401包括:
[0127]
获取子模块,用于获取铁塔钢材指标的历史数据中的设计变量类型;
[0128]
第二确定子模块,用于基于预设的随机森林算法,从设计变量类型中确定出目标设计变量,目标设计变量包括风速、覆冰程度、导线型号、地形比例、耐张塔比例、单公里杆塔数量、直线塔平均呼高和耐张塔平均呼高中的至少一项;
[0129]
统计子模块,用于以目标设计变量为维度对目标设计变量的取值和指标实际值进行统计,得到初始样本数据。
[0130]
可选地,该装置400还包括:
[0131]
调整模块,用于在评估结果大于预设阈值的情况下,对中间模型的参数值进行调整,获得新的中间模型;
[0132]
处理模块,用于将新的中间模型作为初始模型,并执行利用初始样本数据对初始模型进行训练,获得中间模型的步骤。
[0133]
该铁塔钢材指标预测模型的训练装置400能够实现本发明实施例中图1方法实施例的各个过程,以及达到相同的有益效果,为避免重复,这里不再赘述。
[0134]
参见图5,图5为本发明实施例提供的电子设备的结构示意图。如图5所示,该电子设备500包括处理器501,存储器502及存储在存储器502上并可在处理器501上运行的程序或指令,程序或指令被处理器501执行时实现如下步骤:
[0135]
获取初始样本数据,初始样本数据包括铁塔钢材指标的目标设计变量和目标设计变量在不同取值时对应的指标实际值;
[0136]
利用初始样本数据对初始模型进行训练,获得中间模型;
[0137]
利用中间模型对铁塔钢材指标进行预测,获得目标设计变量在不同取值时对应的指标预测值;
[0138]
根据指标预测值和指标实际值,确定中间模型的评估结果;
[0139]
在评估结果小于或等于预设阈值的情况下,将中间模型确定为铁塔钢材指标预测模型。
[0140]
该电子设备500能够实现本发明实施例中图1方法实施例的各个过程,以及达到相同的有益效果,为避免重复,这里不再赘述。
[0141]
本发明实施例还提供一种可读存储介质,可读存储介质上存储程序或指令,程序或指令被处理器执行时实现上述铁塔钢材指标预测模型的训练方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,的计算机可读存储介质,如只读存储器(read

only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0142]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0143]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
[0144]
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1