建筑工程清单数据处理方法及其系统与流程

文档序号:36325852发布日期:2023-12-09 13:53阅读:68来源:国知局
建筑工程清单数据处理方法及其系统与流程

申请涉及工程建筑,特别是涉及建筑工程清单数据处理方法及其系统。


背景技术:

1、随着科技的飞速发展和人们生活水平的提高,建筑工程的数量也在随之增加。

2、建筑工程项目的建设需要依据建筑工程清单中的数据来实现,现有技术中,针对建筑工程的建设需要对建筑工程清单进行整体分析,并利用整体分析结果决定对应的工程量,利用工程量和相关参数计算出该工程所需要的数据。以建筑工程的计价为例,工程量计价是根据工程清单描述的具体工程内容来决定定额组,选定的定额组带有工程量价格,最终定额组的工程量价格总和决定整个工程的计价。

3、现有技术中,建筑工程清单的处理方法都是人工利用历史清单数据和当前清单数据进行匹配,将匹配出的清单数据按照预设要求进行分配,人工判断该分配结果是否符合预设要求,然而,绝大多数的数据均未经过特殊处理以及格式优化,导致人工处理时需要消耗大量的时间进行数据比对,并且人工对比还存在误差,影响工作效率的同时还会影响最终的匹配率。


技术实现思路

1、本技术实施例提供了一种建筑工程清单数据处理方法及其系统,以至少解决上述相关技术中的不足。

2、第一方面,本技术实施例提供了一种建筑工程清单数据处理方法,以下步骤:

3、步骤一:获取多个建筑工程文件,并对所述建筑工程文件进行格式转换,以得到对应的文本文件;

4、步骤二:利用词条数据库对所述文本文件进行词条化处理,以得到所述文本文件所对应的序列模型数据;

5、步骤三:通过词袋模型对所述序列模型数据依次进行词频计算和反向词频计算,以计算出所述序列模型数据中各特征数据的词频以及反向词频;

6、步骤四:基于所述词频和所述反向词频计算出各所述特征数据的词嵌入向量,根据所述词嵌入向量和建筑工程模板构建数据处理模型;

7、步骤五:获取待处理的建筑工程清单,并利用所述数据处理模型对所述待处理的建筑工程清单进行数据处理,以得到对应的数据处理结果。

8、进一步的,所述步骤一包括:

9、获取多个建筑工程文件,并根据不同的工程阶段将各所述建筑工程文件划分为结构化文件和非结构化文件;

10、对所述结构化文件进行格式转换,以得到对应的文本文件。

11、进一步的,所述步骤二包括:

12、利用词条数据库对所述文本文件进行数据清洗,以过滤所述文本文件中的异常字符数据,并将数据清洗后的文本文件进行字符串切分,以得到文字字符数和非文字字符数据;

13、通过建筑工程专业词典对所述文字字符数据进行词汇编排以及停用词去除操作,以得到对应的专业字符数据;

14、将所述专业字符数据和所述非文字字符数据进行数据组合,并对数据组合后的数据进行文本转化,以得到所述文本文件所对应的序列模型数据。

15、进一步的,所述步骤四包括:

16、定义权重矩阵,并利用所述权重矩阵构建权重模型;

17、将所述词频与所述反向词频输入至所述权重模型中,以得到各所述特征数据的词嵌入向量;

18、获取专业平台所发布的建筑工程标准文件,并对所述建筑工程标准文件进行模板解析,以得到对应的建筑工程模板;

19、利用所述词嵌入向量和所述建筑工程模板构建所述特征数据的数据处理模型。

20、进一步的,所述方法还包括:

21、获取历史建筑工程清单,并利用所述数据处理模型对所述历史建筑工程清单进行数据预处理,以得到对应的建筑工程数据列表;

22、将所述建筑工程数据列表与所述历史建筑工程清单进行特征对比,若所述特征对比不符合预设要求,则利用所述建筑工程数据列表对所述数据处理模型进行优化,以得到数据处理优化模型;

23、利用所述据处理优化模型对所述待处理的建筑工程清单进行数据处理,以得到对应的数据优化结果。

24、第二方面,本技术实施例提供了一种建筑工程清单数据处理系统,包括:

25、格式转换模块,用于获取多个建筑工程文件,并对所述建筑工程文件进行格式转换,以得到对应的文本文件;

26、词条化处理模块,用于利用词条数据库对所述文本文件进行词条化处理,以得到所述文本文件所对应的序列模型数据;

27、词袋处理模块,用于通过词袋模型对所述序列模型数据依次进行词频计算和反向词频计算,以计算出所述序列模型数据中各特征数据的词频以及反向词频;

28、模型构建模块,用于基于所述词频和所述反向词频计算出各所述特征数据的词嵌入向量,根据所述词嵌入向量和建筑工程模板构建数据处理模型;

29、数据处理模块,用于获取待处理的建筑工程清单,并利用所述数据处理模型对所述待处理的建筑工程清单进行数据处理,以得到对应的数据处理结果。

30、进一步的,所述格式转换模块包括:

31、文件获取单元,用于获取多个建筑工程文件,并根据不同的工程阶段将各所述建筑工程文件划分为结构化文件和非结构化文件;

32、格式转换单元,拥有对所述结构化文件进行格式转换,以得到对应的文本文件。

33、进一步的,所述词条化处理模块包括:

34、数据清洗单元,用于利用词条数据库对所述文本文件进行数据清洗,以过滤所述文本文件中的异常字符数据,并将数据清洗后的文本文件进行字符串切分,以得到文字字符数和非文字字符数据;

35、字符处理单元,用于通过建筑工程专业词典对所述文字字符数据进行词汇编排以及停用词去除操作,以得到对应的专业字符数据;

36、文本转化单元,用于将所述专业字符数据和所述非文字字符数据进行数据组合,并对数据组合后的数据进行文本转化,以得到所述文本文件所对应的序列模型数据。

37、进一步的,所述模型构建模块包括:

38、矩阵定义单元,用于定义权重矩阵,并利用所述权重矩阵构建权重模型;

39、向量计算单元,用于将所述词频与所述反向词频输入至所述权重模型中,以得到各所述特征数据的词嵌入向量;

40、模板解析单元,用于获取专业平台所发布的建筑工程标准文件,并对所述建筑工程标准文件进行模板解析,以得到对应的建筑工程模板;

41、模型构建单元,用于利用所述词嵌入向量和所述建筑工程模板构建所述特征数据的数据处理模型。

42、进一步的,所述系统还包括:

43、历史数据获取模块,用于获取历史建筑工程清单,并利用所述数据处理模型对所述历史建筑工程清单进行数据预处理,以得到对应的建筑工程数据列表;

44、模型优化模块,用于将所述建筑工程数据列表与所述历史建筑工程清单进行特征对比,若所述特征对比不符合预设要求,则利用所述建筑工程数据列表对所述数据处理模型进行优化,以得到数据处理优化模型;

45、数据优化模块,用于利用所述据处理优化模型对所述待处理的建筑工程清单进行数据处理,以得到对应的数据优化结果。

46、相比于相关技术,本技术实施例提供的建筑工程清单数据处理方法及其系统,通过对建筑工程文件进行格式转换,并对格式转换后得到的文本文件进行词条化处理,以实现建筑工程文件的内容和类型识别,达到快速分类、归纳的效果;利用词袋模型对序列模型数据进行词频计算和反向词频计算,基于词频和反向词频计算出各特征数据的词嵌入向量,根据词嵌入向量和建筑工程模板构建数据处理模型,通过构建数据处理模型的方式自动分析待处理的建筑工程清单,进一步提升清单数据的分析效率以及工作效率。

47、本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1