本发明涉及一种电网工程技术经济数据的智能提取方法及装置,属于电网数据处理。
背景技术:
1、随着我国电网建设的迅速发展,对电网工程的技术经济指标进行了大量的统计分析工作,这不仅有助于指导电网工程建设,同时也为后续运行提供了重要的参考依据。
2、当前电网工程的技术经济指标主要通过各专业专工人工提取,依靠工作经验从可研资料、初设资料、施工图资料、竣工图资料(文件格式包括word、excel、pdf)中找到相应的工程技术经济指标数据后记录统计。但是,组织专工进行数据提取工作量大、效率低;依据专家经验进行工程技术经济指标提取,缺乏统一标准,统计结果的精准性难以保证。
3、因此,亟需一种新的、更高效、更准确的电网工程主要技术经济指标提取方案。
技术实现思路
1、为了解决上述问题,本发明提出了一种电网工程技术经济数据的智能提取方法及装置,能够更高效、更准确的提取电网工程主要技术经济指标。
2、本发明为解决其技术问题所采取的技术方案是:
3、第一方面,本发明实施例提供的一种电网工程技术经济数据的智能提取方法,包括如下步骤:
4、步骤s1,梳理电网工程技术经济指标的抽取规则,并按照抽取规则提取电网工程技术经济指标数据;
5、步骤s2,对提取的电网工程技术经济指标数据进行数据预处理,将预处理后数据随机划分为训练集和测试集;
6、步骤s3,基于dbn-dnn网络建立技术经济数据提取模型;
7、步骤s4,利用训练集对技术经济数据提取模型进行训练,获取最优的技术经济数据提取模型;
8、步骤s5,利用最优的技术经济数据提取模型对测试集的数据提取电网工程技术经济数据。
9、作为本实施例一种可能的实现方式,在步骤s1中,根据需要统计的电网工程技术经济参数项,对历史数据文件进行电网工程技术经济指标抽取规则进行梳理;
10、所述电网工程技术经济指标涉及电网工程可研(工程可行性研究报告)、初设(工程初步设计方案)、施工图(工程施工设计方案)和竣工图各阶段的技术经济指标。
11、作为本实施例一种可能的实现方式,在步骤s1中,电网工程技术经济指标的抽取规则的梳理条件包括设计单位、工程阶段、参与专业。
12、作为本实施例一种可能的实现方式,所述步骤s2,对提取的电网工程技术经济指标数据进行数据预处理,包括:
13、采用隐马尔科夫模型对提取的电网工程技术经济指标数据文本进行初始分词;
14、对初始分词后的电网工程技术经济指标数据进行去停用词处理,删去其中的停用词;
15、对去停用词处理后的电网工程技术经济指标数据进行词频统计;
16、对词频统计结果进行文本向量化处理。
17、作为本实施例一种可能的实现方式,所述对词频统计结果进行文本向量化处理,包括:
18、从词频统计结果的副词中筛选出程度副词,根据语言学的研究标定程度副词的分类,再引入表示准否定和否定意义的分类,得到程度副词分类图并将程度副词转化为数字标记;
19、确定程度副词修饰的形容词或动词:
20、对于除程度副词以外的其他词采用one-hot编码,程度副词表征的向量维在其修饰的形容词和动词旁。
21、作为本实施例一种可能的实现方式,所述dbn-dnn网络包含有2个rbm单元和1个输出层,其中每个rbm单元均由可见层和隐藏层构成,且前一个rbm单元的输出层作为后一个rbm单元的输入层。
22、作为本实施例一种可能的实现方式,所述利用训练集对技术经济数据提取模型进行训练,包括:
23、采用rbm模型对dbn-dnn网络进行无监督的预训练;
24、利用前向传播算法基于技术经济数据提取模型的输入计算得到相应的输出值,然后再利用后向传播算法更新dbn-dnn网络的权重值和偏置值。
25、第二方面,本发明实施例提供的一种电网工程技术经济数据的智能提取装置,包括:
26、数据采集模块,用于梳理电网工程技术经济指标的抽取规则,并按照抽取规则提取电网工程技术经济指标数据;
27、数据预处理模块,用于对提取的电网工程技术经济指标数据进行数据预处理,将预处理后数据随机划分为训练集和测试集;
28、提取模型建立模块,用于基于dbn-dnn网络建立技术经济数据提取模型;
29、模型训练模块,用于利用训练集对技术经济数据提取模型进行训练,获取最优的技术经济数据提取模型;
30、数据提取模块,用于利用最优的技术经济数据提取模型对测试集的数据提取电网工程技术经济数据。
31、第三方面,本发明实施例提供的一种计算机设备,包括处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述任意电网工程技术经济数据的智能提取方法的步骤。
32、第四方面,本发明实施例提供的一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述任意电网工程技术经济数据的智能提取方法的步骤。
33、本发明实施例的技术方案所产生的有益效果如下:
34、本发明实施例的技术方案的一种电网工程技术经济数据的智能提取方法,包括如下步骤:步骤s1,梳理电网工程技术经济指标的抽取规则,并按照抽取规则提取电网工程技术经济指标数据;步骤s2,对提取的电网工程技术经济指标数据进行数据预处理,将预处理后数据随机划分为训练集和测试集;步骤s3,基于dbn-dnn网络建立技术经济数据提取模型;步骤s4,利用训练集对技术经济数据提取模型进行训练,获取最优的技术经济数据提取模型;步骤s5,利用最优的技术经济数据提取模型对测试集的数据提取电网工程技术经济数据。本发明实现了对电网工程主要技术经济数据智能提取,覆盖可研、初设、施工图、竣工图各阶段审定资料,一项工程的数据提取时间从2到3天缩短到20-40分钟,提高了工作效率和准确率。本发明更高效、更准确的提取电网工程主要技术经济指标,不仅提高了准确率,也提高了工作开展的效率。
35、本发明实施例的技术方案的一种电网工程技术经济数据的智能提取装置,与本发明实施例的技术方案的一种电网工程技术经济数据的智能提取方法具有相同的有益效果。
1.一种电网工程技术经济数据的智能提取方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的电网工程技术经济数据的智能提取方法,其特征在于,在步骤s1中,根据需要统计的电网工程技术经济参数项,对历史数据文件进行电网工程技术经济指标抽取规则进行梳理;
3.根据权利要求1所述的电网工程技术经济数据的智能提取方法,其特征在于,在步骤s1中,电网工程技术经济指标的抽取规则的梳理条件包括设计单位、工程阶段、参与专业。
4.根据权利要求1所述的电网工程技术经济数据的智能提取方法,其特征在于,所述步骤s2,对提取的电网工程技术经济指标数据进行数据预处理,包括:
5.根据权利要求4所述的电网工程技术经济数据的智能提取方法,其特征在于,所述对词频统计结果进行文本向量化处理,包括:
6.根据权利要求1所述的电网工程技术经济数据的智能提取方法,其特征在于,所述dbn-dnn网络包含有2个rbm单元和1个输出层,其中每个rbm单元均由可见层和隐藏层构成,且前一个rbm单元的输出层作为后一个rbm单元的输入层。
7.根据权利要求1-6任意一项所述的电网工程技术经济数据的智能提取方法,其特征在于,所述利用训练集对技术经济数据提取模型进行训练,包括:
8.一种电网工程技术经济数据的智能提取装置,其特征在于,包括:
9.一种计算机设备,其特征在于,包括处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1-7任一所述的电网工程技术经济数据的智能提取方法的步骤。
10.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1-7任一所述的电网工程技术经济数据的智能提取方法的步骤。