本发明涉及工程造价,尤其涉及一种城轨工程投资估算指标智能处理方法及系统。
背景技术:
1、随着城市化进程的发展,城市轨道交通已成为城市的重点发展方向。在城市轨道交通工程投资估算过程中,需要综合考虑多种因素,包括工程规模、技术难度以及运营成本等。因此,如何准确、高效地估算城市轨道交通工程的投资成本,对于城市轨道交通工程的建设和运营都具有重要意义。
2、目前,城市轨道交通工程投资估算系统的应用已经比较广泛。这些系统通常包括材料成本、设备成本以及运营成本等多个方面的指标数据,基于上述指标数据能够较为准确地估算城市轨道交通工程的造价成本。但是,在传统的实践中,城市轨道交通工程的投资估算往往依赖于专家经验和部分数据的手工计算,存在主观性强、精度较低等问题。此外,工程造价清单在录入系统时多采用手工录入的方式,需要将表单中的数据逐一输入到投资估算系统中。面对较大的数据量,手工录入的方式存在效率低下和数据不准等问题,最终导致估算结果不够准确。
3、因此,亟需一种城轨工程投资估算指标智能处理方法及系统,能够提升筛选异常数据的准确率,提高各类造价指标估算的时效性和准确性。
技术实现思路
1、为了解决上述技术问题,本发明提供了一种城轨工程投资估算指标智能处理方法及系统,能够提升筛选异常数据的准确率,提高各类造价指标估算的时效性和准确性。
2、本发明提供了一种城轨工程投资估算指标智能处理方法,包括如下步骤:
3、s1、创建预设模板;
4、s2、上传估算指标文件,将估算指标文件中的指标数据依次遍历插入到预设模板中的对应位置,构建估算指标表格;
5、s3、通过改进聚类算法对样本数据集进行训练,构建指标对比模型;其中,样本数据集由历史基准价格构成;
6、s3具体包括:
7、s31、采用knuth算法对样本数据集中的n个样本数据进行初始化操作,使n个样本数据被选中的概率均为1/n;
8、s32、采用最大最小距离原则选取k个初始质心,并得到相应的族群;
9、s33、通过k-means算法对所有样本数据进行迭代计算,直至计算得到的k个质心与选取的k个初始质心一致或达到最大迭代次数,完成对样本数据集的训练,得到最终的k个质心及k个族群作为指标对比模型;
10、s4、将指标数据输入指标对比模型,筛选出异常数据并对异常数据进行标识处理;
11、s5、输出经过处理的估算指标表格。
12、进一步的,s32,采用最大最小距离原则选取k个初始质心,并得到相应的族群包括:
13、s321、在样本数据集中随机选取一个样本数据作为第一初始质心;
14、s322、选取与第一初始质心距离最大的样本数据作为第二初始质心;
15、s323、分别计算所有剩余的样本数据与各质心的直线距离作为距离集合;
16、s324、在距离集合中选取一个最大值,将最大值对应的样本数据作为新的初始质心;
17、s325、重复执行s323-s324直至选取的初始质心个数达到预设个数k,进入s326;
18、s326、将样本数据集分为k个族群,根据剩余的样本数据与k个初始质心的距离,将剩余的样本数据归置于相应的族群中。
19、进一步的,s326,将样本数据集分为k个族群,根据剩余的样本数据与k个初始质心的距离,将剩余的样本数据归置于相应的族群中包括:
20、s3261、分别计算剩余的样本数据与k个初始质心的距离,距离计算公式如下:
21、;
22、其中,xi表示第i个数据样本,i=1,2,...,n,xj表示第j个数据样本,j=1,2,...,k,μj表示第j个质心,j=1,2,...,k;
23、s3262、根据k个距离结果,分别将每个剩余的样本数据归置于相应的族群中,归置公式如下:
24、;
25、其中,cj表示第j个族群,j=1,2,...,k。
26、进一步的,s1,创建预设模板,预设模板包括:各类指标数据表格的标题和描述信息;其中,描述信息包括表名、日期,各类指标数据表格的标题与估算指标文件中各分页表的表名一一对应。
27、进一步的,s2,上传估算指标文件,将估算指标文件中的指标数据依次遍历插入到预设模板中的对应位置,构建估算指标表格包括:
28、s21、上传估算指标文件,并对估算指标文件进行形式审查;若存在空值和/或值缺失,则提示错误位置并要求重新上传估算指标文件;若形式审查通过,则进入s22;
29、s22、读取估算指标文件,根据估算指标文件中各分页表的表名定位估算指标文件中的指标数据在预设模板中的位置;
30、s23、将指标数据依次遍历插入到预设模板中的对应位置,构建估算指标表格。
31、进一步的,s23,将指标数据依次遍历插入到预设模板中的对应位置,构建估算指标表格包括:
32、在数据插入时,对指标数据的数据类型进行判断,若为double和/或float数据,则先将指标数据转为字符串类型,再使用bigdecimal方法将其转为bigdecimal对象。
33、进一步的,s4,将指标数据输入指标对比模型,筛选出异常数据并对异常数据进行标识处理包括:
34、通过指标对比模型判断插入的指标数据是否在正常区间内;若插入的指标数据在正常区间内则不做处理;若插入的指标数据不在正常区间内则对该指标数据进行标识处理。
35、本发明还提供了一种城轨工程投资估算指标智能处理系统,用于执行上述任一项的一种城轨工程投资估算指标智能处理方法,包括以下模块:
36、表格构建模块,用于创建预设模板;以及上传估算指标文件,将估算指标文件中的指标数据依次遍历插入到预设模板中的对应位置,构建估算指标表格;
37、指标对比模型构建模块,与表格构建模块连接,用于通过改进聚类算法对样本数据集进行训练,构建指标对比模型;其中,样本数据集由历史基准价格构成;具体包括:采用knuth算法对样本数据集中的n个样本数据进行初始化操作,使n个样本数据被选中的概率均为1/n;采用最大最小距离原则选取k个初始质心,并得到相应的族群;通过k-means算法对所有样本数据进行迭代计算,直至计算得到的k个质心与选取的k个初始质心一致或达到最大迭代次数,完成对样本数据集的训练,得到最终的k个质心及k个族群作为指标对比模型;
38、异常数据筛选模块,与指标对比模型构建模块连接,用于将指标数据输入指标对比模型,筛选出异常数据并对异常数据进行标识处理;
39、输出模块,与异常数据筛选模块连接,用于输出经过处理的估算指标表格。
40、本发明实施例具有以下技术效果:
41、1、本技术方案中,通过对不同地区、不同历史时期的造价指标数据进行汇编和整合,并作为构建对比模型的基本数据集,且能够按照需求随时、及时更新数据集,以应对各类指标数据的变化,大幅提高各类造价指标估算的时效性和准确性;
42、2、本技术方案中,使用的对比模型构建基于经典的聚类算法k-means实现,通过对k-means进行改进,提升数据的聚合效果,进而提升了筛选不符合正常区间的指标数据的准确率;
43、3、本技术方案中,以智能化为导向,针对人工输入大量数据的缺陷,设计并实现了将海量数据直接插入汇总报告,极大地提高了数据在录入过程中的效率和准确率;
44、4、本技术方案中,最终导出的成果汇总报告能够准确、直观地反应出城市轨道交通工程投资的估算结果,提高最终的决策的科学性和时效性。