本发明涉及数据插补方法,更具体地说是指沟渠管涵造价数据插补预测方法、装置及计算机设备。
背景技术:
1、沟渠管涵工程的造价是一个相对冷门的领域。在进行工程造价分析时,通常需要参考和整理历史数据。然而,这些历史数据有时会出现缺失或不完整的情况,可能是由于记录不规范、遗失、漏记或错记等原因造成的。针对数据缺失问题,可以使用数据插补方法来填补缺失数据。影响沟渠管涵工程造价的因素主要包括沟渠的现状、整治方案、整治后的截面(如渠道底部宽度、顶部宽度和深度)、以及拆除道路的情况等。由于不同地区和不同整治方案的造价差异,必须详细分析这些因素与造价之间的关系,以建立一个适用于沟渠管涵工程造价数据插补的模型。
2、传统的数据插补方法包括最近邻插补和平均值插补等,无法充分捕捉数据的复杂变化和多样性,导致插补结果的准确性受限,最近邻插补仅基于邻近数据点,而平均值插补忽略了数据的变化趋势和其他潜在因素。
3、因此,有必要设计一种新的方法,实现捕捉数据的复杂变化和多样性,以填补缺失的数据,提高缺失数据插补的精度。
技术实现思路
1、本发明的目的在于克服现有技术的缺陷,提供沟渠管涵造价数据插补预测方法、装置及计算机设备。
2、为实现上述目的,本发明采用以下技术方案:沟渠管涵造价数据插补预测方法,包括:
3、获取有缺失值的沟渠管涵造价数据,以得到待插补数据;
4、将所述待插补数据输入至插补预测模型中进行数据插补,以得到插补结果;
5、输出所述插补结果;
6、其中,所述插补预测模型是通过利用历史沟渠管涵造价数据和外部特定条件信息构造训练数据集,采用ddpm训练深度学习网络所得的模型。
7、其进一步技术方案为:所述插补预测模型是通过利用历史沟渠管涵造价数据和外部特定条件信息构造训练数据集,采用ddpm训练深度学习网络所得的模型,包括:
8、获取历史沟渠管涵造价数据以及外部特定条件信息;
9、根据所述历史沟渠管涵造价数据以及外部特定条件信息构建训练数据集;
10、根据所述训练数据集采用ddpm训练深度学习网络,以得到插补预测模型。
11、其进一步技术方案为:所述根据所述历史沟渠管涵造价数据以及外部特定条件信息构建训练数据集,包括:
12、将所述历史沟渠管涵造价数据中的影响沟渠管涵工程造价的历史特征信息转化为特征向量;
13、将所述外部特定条件信息进行编码,以得到条件特征向量;
14、采用所述特征向量将所述历史沟渠管涵造价数据转换为时间序列数据,以得到历史时序数据;
15、随机选择所述历史时序数据中一部分数据,以得到训练目标,并将所述历史时序数据中剩余的数据作为条件数据;
16、将所述训练目标以及所述条件数据结合所述条件特征向量组合形成训练数据集。
17、其进一步技术方案为:所述外部特定条件信息包括地区信息、材料价格、人工费用。
18、其进一步技术方案为:所述根据所述训练数据集采用ddpm训练深度学习网络,以得到插补预测模型,包括:
19、设定扩散步数,并根据所述训练数据集构建输入数据;
20、构建噪声生成网络;
21、采用条件向量特征修改所述噪声生成网络,并生成目标损失函数;
22、根据输入数据,通过逐步反向添加噪声,从一个随机噪声开始,依次计算每一步的预测数据,利用ddpm算法中的参数和所述噪声生成网络进行数据调整,以得到输出结果;
23、根据输出结果结合目标损失函数以及所述噪声生成网络,确定插补预测模型。
24、其进一步技术方案为:所述输入数据为其中,是常数项,xmiss为训练数据集中的训练目标;为输入数据;所述目标损失函数为其中,xobv为条件数据;为输入数据;c为条件特征向量。
25、其进一步技术方案为:所述采用条件向量特征修改所述噪声生成网络,并生成目标损失函数,包括:
26、将所述条件向量特征替换所述噪声生成网络中的自注意力模块输入,并生成目标损失函数。
27、其进一步技术方案为:所述根据输入数据,通过逐步反向添加噪声,从一个随机噪声开始,依次计算每一步的预测数据,利用ddpm算法中的参数和所述噪声生成网络进行数据调整,以得到输出结果,包括:
28、根据输入数据,通过逐步反向添加噪声,从一个随机噪声开始,采用依次计算每一步的预测数据,利用ddpm算法中的参数和所述噪声生成网络进行数据调整,以得到输出结果;其中,是ddpm算法中βk+1,是ddpm算法的αk+1,∈θ为修改后的噪声生成网络,z为标准正态分布,σθ为相应的扰动噪声生成的网络训练权重,表示生成网络在当前网络权重参数θ下根据网络输入条件生成的预测数据,xobv为条件数据;为输入数据;c为条件特征向量。
29、本发明还提供了沟渠管涵造价数据插补预测装置,包括:
30、数据获取单元,用于获取有缺失值的沟渠管涵造价数据,以得到待插补数据;
31、插补单元,用于将所述待插补数据输入至插补预测模型中进行数据插补,以得到插补结果;
32、输出单元,用于输出所述插补结果;
33、其中,所述插补预测模型是通过利用历史沟渠管涵造价数据和外部特定条件信息构造训练数据集,采用ddpm训练深度学习网络所得的模型。
34、本发明还提供一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
35、本发明与现有技术相比的有益效果是:本发明通过获取有缺失值的沟渠管涵造价数据并准备待插补数据;将待插补数据输入插补预测模型,模型基于历史数据和外部条件信息进行插补;输出插补结果,模型通过历史沟渠管涵造价数据和外部特定条件信息结合ddpm训练的深度学习网络生成,利用模型模拟数据的扩散过程来掌握数据变化的规律,然后利用预测传播的方法来填补缺失的数据,融合多种外部因素,实现捕捉数据的复杂变化和多样性,以填补缺失的数据,提高缺失数据插补的精度。
36、下面结合附图和具体实施例对本发明作进一步描述。
1.沟渠管涵造价数据插补预测方法,其特征在于,包括:
2.根据权利要求1所述的沟渠管涵造价数据插补预测方法,其特征在于,所述插补预测模型是通过利用历史沟渠管涵造价数据和外部特定条件信息构造训练数据集,采用ddpm训练深度学习网络所得的模型,包括:
3.根据权利要求2所述的沟渠管涵造价数据插补预测方法,其特征在于,所述根据所述历史沟渠管涵造价数据以及外部特定条件信息构建训练数据集,包括:
4.根据权利要求3所述的沟渠管涵造价数据插补预测方法,其特征在于,所述外部特定条件信息包括地区信息、材料价格、人工费用。
5.根据权利要求3所述的沟渠管涵造价数据插补预测方法,其特征在于,所述根据所述训练数据集采用ddpm训练深度学习网络,以得到插补预测模型,包括:
6.根据权利要求5所述的沟渠管涵造价数据插补预测方法,其特征在于,所述输入数据为其中,是常数项,xmiss为训练数据集中的训练目标;为输入数据;所述目标损失函数为其中,xobv为条件数据;为输入数据;c为条件特征向量。
7.根据权利要求6所述的沟渠管涵造价数据插补预测方法,其特征在于,所述采用条件向量特征修改所述噪声生成网络,并生成目标损失函数,包括:
8.根据权利要求7所述的沟渠管涵造价数据插补预测方法,其特征在于,所述根据输入数据,通过逐步反向添加噪声,从一个随机噪声开始,依次计算每一步的预测数据,利用ddpm算法中的参数和所述噪声生成网络进行数据调整,以得到输出结果,包括:
9.沟渠管涵造价数据插补预测装置,其特征在于,包括:
10.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的方法。