一种基于建筑工程造价的预测数据分析系统和方法与流程

文档序号:33036789发布日期:2023-01-24 20:12阅读:35来源:国知局
一种基于建筑工程造价的预测数据分析系统和方法与流程

1.本发明涉及大数据分析领域,具体涉及一种基于建筑工程造价的预测数据分析系统和方法。


背景技术:

2.随着全球经济一体化的发展,建筑行业正在面向信息化、智能化、专业化的方向发展。由于建设规模和建设成本的不断增加,相应的工程造价统计分析所需要处理的数据量必然急剧增大。在这种大数据的环境下,无疑给造价管理带来了更大的数据处理压力。建筑企业对于建筑工程造价海量数据统计分析、数据挖掘、决策支撑的需求也与日俱增。
3.传统的建筑企业各部门之间缺少实现数字化、电子化资料传递和较高的信息化管理水平,因此工程造价的历史数据及定额数据较难及时跟进,使得建筑工程费用控制难度增大,实现工程成本有效管控,形成流程化、规范化、规格化的工程造价管控模式已经成为目前建筑企业亟需解决的重要问题。而且造价管理体系的适应能力有待进一步加强。尽管现有的造价预测分析系统为建筑工程造价管理提供了一定的支持,但仍然难以自动实时进行指标计算。由于造价分析指标的计算量越来越大,目前造价分析软件中的工作效率仍然较低,工作重复现象较为严重。


技术实现要素:

4.为了解决现有技术中所存在的问题,本发明提供一种基于建筑工程造价的预测数据分析系统,包括:数据存储子系统,用于采用云平台和建筑工程信息数据库从多个外部数据源进行建筑工程大数据快速采集、整理和归档,所述云平台用于提供造价预测应用接口;数据加工子系统,用于采用并行算法分析处理所采集的建筑工程大数据,对数据进行抽取和集成,从中提取出实体和关系并进行关联和聚合,得到待处理的基础数据,并采用统一的存储结构进行持久化存储;智能分析引擎,用于利用基于神经网络的多种数据统计分析模型对建筑工程基础数据进行预测、分析和挖掘。
5.优选地,所述云平台提供造价预测应用接口,基于微服务架构,将造价预测数据与模型算法进行模块化封装,向租户端的各种业务功能提供微服务。
6.优选地,所述数据存储子系统进一步用于:建立数据转换规则,建立不同外部业务软件系统的数据映射,将不同类型的工程数据信息按照标准格式导入所述建筑工程信息数据库。
7.优选地,所述数据存储子系统进一步用于:对人工、材料及机械价格信息进行分类采集,通过对不同要素制定特定编码,将要素名称转换成代码。
8.优选地,所述数据存储子系统进一步用于:
对于非结构化的原始工程数据信息,导入不同类型的工程量清单信息,使用实体命名识别方法进行工程描述特征实体词提取,抽取实体词,以及实体词对应的词性和词频;基于实体词内容、词性、描述、词频字段来将结构化数据库进行初始化。
9.优选地,所述数据加工子系统进一步用于:利用智能数据接口导入bim设计模型,采集工程模型的几何和空间物理属性的关联关系,通过加载计算规则来构建工程量;通过数字图形处理引擎进行智能清单列项,抽取bim设计模型中的构件信息,将建筑工程信息数据库与三维建筑模型构件清单项进行智能匹配,实现计量单位选择、工程量计算和工程特征描述,以及智能化和规格化的清单编制。
10.优选地,所述智能分析引擎进一步用于:利用数据统计分析模型对造价数据的每个影响因素进行定量分析,将自变量设为各个可能的影响因素,将因变量设为静态成本;使用各个自变量与因变量之间的相关系数筛选出这些因素中的主要影响因素,对非主要影响因素进行移除,再使用得到的主要影响因素来度量工程造价并进行预测。
11.优选地,所述数据统计分析模型包括pca、关联分析、模式识别、时间序列预测、智能分类、决策树、粗糙集。
12.优选地,所述智能分析引擎进一步用于:结合建筑模型数据库,将不同阶段的三维建筑模型与工程计价依据和工程造价大数据集成,进行智能算量组价;在组价过程中,从数据库中查找与工程量清单描述相匹配的信息,选择需要组价的单位项目和组价策略,预先设置组价方式,并匹配市场最优报价信息完成选材定价,并定位到当前清单项内容进行组价调整。
13.根据本发明的另一方面,还提供了一种利用上述基于建筑工程造价的预测数据分析系统进行造价预测的方法,包括:采用云平台和建筑工程信息数据库从多个外部数据源进行建筑工程大数据快速采集、整理和归档,所述云平台用于提供造价预测应用接口。
14.采用并行算法分析处理所采集的建筑工程大数据,对数据进行抽取和集成,从中提取出实体和关系并进行关联和聚合,得到待处理的基础数据,并采用统一的存储结构进行持久化存储。
15.利用基于神经网络的多种数据统计分析模型对建筑工程基础数据进行预测、分析和挖掘。
16.与现有技术相比,本发明的有益效果为:本发明提供的一种基于建筑工程造价的预测数据分析系统,包括数据存储子系统,采用云平台和建筑工程信息数据库从外部数据源进行建筑工程大数据采集、整理和归档,云平台提供造价预测应用接口;数据加工子系统,采用并行算法分析处理所采集的建筑工程大数据,对数据进行抽取和集成,提取实体和关系并进行关联和聚合,得到待处理的基础数据,并采用统一结构进行持久化存储;智能分析引擎,利用多种数据统计分析模型对建筑工程基础数据进行预测、分析和挖掘。本发明的基于建筑工程造价的预测数据分析系统通过对大规模造价数据的高效整理和分类,能够支持不同样式信息数据的存储,实现跨平台的造价预测应用。在大数据分析中建立对应的预测模型处理数据,通过神经网络得出模型预测的结果,进而自动预测工程造价,增强了工程造价预测的精确率,并且提高了计算效
率,节省了针对特定工程的造价评估预测时间。
附图说明
17.图1为本发明的基于建筑工程造价的预测数据分析系统框图。
18.图2为本发明的基于建筑工程造价的预测数据分析方法的流程图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显而易见的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
20.本发明的基于建筑工程造价的预测数据分析系统在对工程造价数据信息采集、整理的基础上,对工程造价数据信息进行存储分析,基于大数据的平台的架构,将数据挖掘模型与大数据的架构相结合,在多维度影响因素分析的基础上,依据历史工程造价数据信息、工程技术和设计指标信息、专家经验等数据信息,通过大数据系统平台提供的预测方法模型,针对工程造价数据进行预测,以提高数据处理效率,充分挖掘工程造价数据信息价值。
21.为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。
22.本发明的基于建筑工程造价的预测数据分析系统以虚拟化云计算系统为体系架构,对外提供统一的云服务接口,包括信息存储、发布、查询,负载管理的基础设施服务。通过云平台提供造价预测应用,基于微服务架构,将造价预测数据与模型算法进行模块化封装,向租户端的各种业务功能提供微服务。租户端可以调用多种微服务应用,无需对软件进行维护。云平台根据租户端的身份及其所需的服务,为租户定制服务使用策略。针对不同企业内部建立的造价信息管理平台,进一步提供统一服务注册管理和安全管理,用于保证云服务的灵活性和可用性。
23.图1为本发明的基于建筑工程造价的预测数据分析系统框图。如图1所示,本发明的基于建筑工程造价的预测数据分析系统主要包括数据存储子系统、数据加工子系统和智能分析引擎。
24.所述数据存储子系统采用云平台和建筑工程信息数据库来完成建筑工程造价大数据采集与存储,实现从多个外部数据源的大数据快速采集、整理和归档,为后续的数据分析提供基础。所述建筑工程信息数据库包括具有建筑工程研究、施工、竣工阶段的工程数据、建筑设备和建筑材料的价格、用量、建筑技术标准、编制策略等数据的造价数据库、具有建筑工程设备、材料的市场价格、相关地区劳动力价格以及物价指数等信息的市场数据库。以及具有相关技术标准、通用设计以及国家政策、行业规章、地方法规等信息的规则数据库,以及工程造价企业与人员信息库等。
25.在进行大数据采集时,所述数据存储子系统首先建立数据转换规则,建立不同外部业务软件系统的数据映射,将不同类型的工程数据信息按照标准格式导入建筑工程信息数据库。具体地,在建筑工程信息采集时,接收供应商用户发布的要素价格、发布地区等信息,提交给数据存储子系统进行自动审核。对人工、材料及机械等价格信息进行分类采集,
通过对不同要素制定特定编码,将要素名称转换成代码,实现快速智能查询与分析。此外,在建筑工程全过程中实时采集工程资源信息、工程设计信息,项目文件信息、人员和设备信息、原材料供应保管记录、监理资料等内容。
26.所述数据存储子系统实现实时监测与收集功能,通过网络资源订阅、推送、过滤,将经过整合的建筑行业信息导入数据库,并通过web端、移动端进行网络资源的共享发布和推送。
27.对于非结构化的原始工程数据信息,可以导入不同类型的工程量清单信息,使用实体命名识别方法进行工程描述特征实体词提取,抽取实体词,以及实体词对应的词性和词频。基于实体词内容、词性、描述、词频等字段来将结构化数据库进行初始化。按照预设的字段排列顺序,将所述词性和词频建立标注信息和训练矩阵;通过预训练的深度学习模型来自动识别训练矩阵中的造价数据信息,并抽取造价信息并输入结构化的造价数据库。
28.所述数据加工子系统在大数据挖掘计算之前对采集到的数据进行预处理。首先对所述数据存储子系统采集和归档的数据进行抽取和集成,从中提取出实体和关系,经过关联和聚合之后采用统一的存储结构来存储这些数据,并在数据集成和提取时对数据进行清洗,保证数据质量及可靠性。具体地,所述数据加工子系统对数据存储子系统所存储的数据进行归类和整理,将数据分成建筑工程的概况、造价经济指标、费用构成情况、人力、材料、机械指标信息的不同维度的基础数据,由此实现数据统计和挖掘。通过分类统计处理,针对大量的建筑工程造价数据进行有效的样本筛选和类别划分,通过工程分类统计,提高准确定位重点分析数据的效率。
29.为实现造价数据信息的提取、整理、分析、复用,所述数据加工子系统采用并行算法分析处理海量数据,并将多个数据源的分布式工程数据扩展到云集群中。通过物联网接收web端和移动端的多入口接入。所述数据加工子系统利用智能数据接口导入bim设计模型,快速采集工程模型的几何和空间物理属性的关联关系,通过加载计算规则实现快速构建工程量。通过数字图形处理引擎进行智能清单列项,抽取bim设计模型中的构件信息,将建筑工程信息数据库与三维建筑模型构件清单项进行智能匹配,实现计量单位选择、工程量计算和工程特征描述,以及智能化和规格化的清单编制,为造价数据预测提供数字化基础。
30.所述智能分析引擎将整理后的基础数据进行汇总和筛选,对数据进行分析和预测,采用对比分析、比率分析、环比分析等多种分析方法完成造价数据分析。不同的影响因素对工程造价结果影响是不同的。所述智能分析引擎通过建筑工程造价大数据异常值处理、智能统计、pca、关联分析、模式识别、时间序列预测、智能分类、决策树、粗糙集等数据统计分析模型,实现建筑工程造价原始数据、基础数据的预测、统计、分析以及挖掘。首先对造价数据的每个影响因素进行定量分析,将自变量设为各个可能的影响因素,将因变量设为静态成本。使用各个自变量与因变量之间的相关系数筛选出这些因素中的主要影响因素,对非主要影响因素进行移除,再使用得到的主要影响因素来度量工程造价并进行预测,以提高实时计算效率。
31.例如,在关联分析算法中,首先对影响因素进行识别,并获取样本数据。为消除不同量纲的影响,在预处理阶段对样本数据进行规格化转换。
32.其中,为原始采集的工程样本数据;为规格化转换后的数据;与分别为该类工程样本数据的最大值和最小值。
33.然后,对历史建筑工程数据进行聚类。对每个聚类的元素,采用机器学习算法获得造价预测结果与建筑工程数据之间的关联,完成神经网络模型的训练。聚类过程具体包括以下步骤:(1)在基础工程数据集中随机选取个数据样本作为初始聚类核。
34.(2)分别计算各数据集中样本到各聚类核之间的距离,并进行距离比较,将每一个样本归类到距离最短的聚类核。
35.其中,n=1,2,...,n;λ=1,2,...,。
36.为第n个样本,为第n个样本的第ε维数据值。为第λ个聚类核,为第λ个聚类核第ε维数据值,σ为聚类核的数量。ε=1,2,...,σ。
[0037] (3)以每个聚类数据集的所有样本的均值作为新的聚类核。
[0038]
其中,为更新后的第λ个聚类核,为第λ个聚类核所包含的样本数量,为第j个聚类核中样本值。
[0039]
接下来,为提取数据样本之间的内在关联性,在预定义的统计拟合规则下估计模型中的各个参数,得到回归方程。对已经识别到的影响因素进行相关性分析,根据因素之间的相关程度判断其是否能够进行关联分析。将多个具有相关性的影响因素进行线性组合,转换为多个主因素。通过分析关联矩阵,得到每个影响因素在主因素上的映射,即每个因素的影响程度。对所述回归方程的回归系数进行检验,然后对检验结果进行分析。
[0040]
结合工程全寿命周期的管理,所述智能分析引擎通过对研究、施工、竣工等不同阶段的数据进行预测和分析,制定相应的比对标准。同时规范工程造价管理流程,为提高造价管理精细化水平提供支撑。根据实际业务,快速生成满足不同要求的造价分析基础数据表。通过不同维度的智能决策、智能预测,规避工程造价管理风险,提升造价管控水平,为管理人员提供决策的依据。
[0041]
具体地,所述智能分析引擎贯穿决策、设计、招标、投标、施工、结算多个阶段。结合建筑模型数据库,将不同阶段的三维建筑模型与工程计价依据和工程造价大数据集成,进行智能算量组价。在组价过程中,从数据库中查找与工程量清单描述相匹配的信息,选择需
要组价的单位项目和组价策略等,预先设置组价方式,并匹配市场最优报价信息,快速选材定价,并快速定位到当前清单项内容进行组价调整,完成分析计算。
[0042]
所述智能分析引擎对数据库中存储的完整造价要素信息进行模型化和指标化操作,对估算、概算、预算、结算以及决算过程进行指标分析、优选和决策。建立了不同时间节点的数据关联,从而实现全过程、实时、动态对比分析和预警,实现工程造价由事后分析向事中或事前控制、由超预算、超概算、超估算到主动管控的改进。
[0043]
所述智能分析引擎针对不同的构件实现设计信息的提取和计算以获得预定义的工程量。针对计算获得的工程量,获取相应的计价信息以实现bim算量和计价的一体化。例如获得土石方体积工程量和模板工程量,需要将土石方消耗量和价格信息映射到bim构件内,并将土石方消耗量和价格信息与土石方体积相对应、将模板消耗量和价格信息与土石方模板工程量相对应。将三维建筑模型数据进行分块,以并行地进行独立的设计和计算,使得设计用户端能够在分块存储的三维建筑模型数据中查找最适合设计工程的建筑模型数据模块。可选地,所述智能分析引擎进一步对历史建筑模型数据进行提取、参数修改、三维建筑模型调整等设计提资。当设计用户端从bim基础数据库选择合适的历史工程模型数据后,所述智能分析引擎对提取的建筑模型数据模块进行设计调整生成提资模型。在设计不能满足工程量计算条件下,可以通过利用历史工程数据来提高前期工程造价的准确度。利用基于建筑工程基础数据库中的历史数据,执行设计提资生成包含造价信息的建筑工程模型。对生成建筑工程模型进行造价运算处理,生成工程估算或概算结果。
[0044]
当所述设计用户端在施工图阶段完成三维模型设计后,将上述算量规则、定额与价格信息添加到三维设计模型中,形成包含算量规则和定额与价格信息的建筑模型。然后对模型中所包含的算量规则、定额和价格等信息进行加工计算,根据预设的计价模式输出造价数据结果。在具体工程完成后,将工程三维建筑模型按照预设的方法归档到基于bim的工程基础数据库中。对建筑模型数据进行分解和分类、进行数据结构化、最后按预定义的格式存储到工程数据库内,形成多层次、结构化的建筑模型数据,移动客户端可以根据需要查询和提取需要层次的建筑模型数据。
[0045]
建筑工程造价数据具有高维样本特征。维度高、容量小的样本在造价预测过程中容易出现过拟合。根据本发明的另一方面,为实现精准造价监测,采用以下过程对原始工程造价数据进行特征过滤。
[0046]
(1)采用模糊均值聚类算法对原始工程造价数据样本的特征进行聚类筛选,形成φ个特征聚类,将特征与之间的关联距离d
ij
描述为:其中,、是特征集σi、σj的均值向量,、分别表示第i、j个聚类核的第r维特征。其中,计算如下(同理可得):
xi为特征集σi的特征向量。
[0047]
(2)获得m组训练样本集以及测试集。在此基础上,对所有特征进行随机置换。将重采样训练集和随机置换的训练集分别采用模糊集算法进行精确率学习,分别得到精确率和。然后计算特征权重::::其中,为模糊集算法计算的原始训练集与随机置换训练集的精确率偏移量,为各特征偏移量的均值,n为所取得的特征数量,s2为特征偏移方差。利用下式计算特征贡献值ctrb:其中,ctrb(σi)代表特征集σi的特征贡献值,表示某一特征聚类中各特征的重要程度。
[0048]
(3)在完成建筑工程造价数据特征聚类后,当特征聚类数量φ大于第一阈值p时,或者当特征聚类数量φ小于p但特征贡献值最低特征聚类中特征数量大于第二阈值q时,则过滤掉特征贡献值最低的特征聚类中的关联距离d大于预设距离d0的特征。当特征聚类数量φ小于p时,并且当特征贡献值最低的特征聚类中的特征数量小于q时,则不进行特征过滤,直接构成新的样本特征子集。输出为最终特征子集。
[0049]
采用上述特征过滤过程,能够实现对高维造价数据的降维处理,同时有效扩充工程样本数量,进而避免由工程造价数据的高维小样本特性对分类学习造成的过拟合现象。
[0050]
通过本发明提供的基于建筑工程造价的预测数据分析系统,通过对大规模造价数据的高效整理和分类,能够支持不同样式信息数据的存储,实现跨平台的造价预测应用。在大数据分析中建立对应的预测模型处理数据,通过神经网络得出模型预测的结果,进而自动预测工程造价,增强了工程造价预测的精确率,并且提高了计算效率,节省了针对特定工程的造价评估预测时间。
[0051]
实施例2:如图2所示,基于上述系统,本发明进一步提供了一种基于建筑工程造价的预测数
据分析方法,包括:s1、采用云平台和建筑工程信息数据库从多个外部数据源进行建筑工程大数据快速采集、整理和归档,所述云平台用于提供造价预测应用接口。
[0052]
s2、采用并行算法分析处理所采集的建筑工程大数据,对数据进行抽取和集成,从中提取出实体和关系并进行关联和聚合,得到待处理的基础数据,并采用统一的存储结构进行持久化存储。
[0053]
s3、利用基于神经网络的多种数据统计分析模型对建筑工程基础数据进行预测、分析和挖掘。
[0054]
实施例3:本发明还提供了一种移动终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上所述系统和方法。
[0055]
实施例4:本发明还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上所述系统和方法。
[0056]
显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0057]
本领域内的技术人员应当理解,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0058]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据挖掘设备的处理器以产生一个机器,使得通过计算机或其他可编程数据挖掘设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0059]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据挖掘设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0060]
这些计算机程序指令也可装载到计算机或其他可编程数据挖掘设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0061]
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1