一种标准造价物资价格库的构建方法及系统与流程

文档序号:36637618发布日期:2024-01-06 23:23阅读:29来源:国知局
一种标准造价物资价格库的构建方法及系统与流程

本发明属于电网,具体涉及一种标准造价物资价格库的构建方法及系统。


背景技术:

1、传统造价编制模式中,技经人员对照设备材料清册,人工方式逐一查找相应物资的预算价和市场价,预算价是定额总站在定额发布时候同时配套发布,在定额有效期内一直生效,且不更新。市场价由南方电网公司和地方部门发布信息价,定期更新。由于设备材料清册、预算价、信息价中物资型号命名不一致,需要造价人员根据经验判断物资类型,才能去查找匹配。该方式耗时长、准确性不高,且依赖造价人员经验能力。为了实现造价编制自动化,必须要实现物资价格的自动套取,因此采用了设计物资价格库的思路来解决该问题。

2、物资库设计过程中最大的问题是设备材料清册、预算价、信息价中物资型号命名不一致,由于预算价和信息价是官方发布,不能更改,设备材料清册由设计单位的设计人员提供,具有不规范性,如何设置一个标准的物资名称和型号,是一个重点和难点。


技术实现思路

1、鉴于上述存在的问题,提出了本发明。

2、因此,本发明解决的技术问题是:解决传统造价编制模式中,由于设备材料清册、预算价、信息价中物资型号命名不一致,造成造价人员需要人工方式逐一查找相应物资的预算价和市场价,耗时长、准确性不高的问题。

3、为解决上述技术问题,本发明提供如下技术方案:一种标准造价物资价格库的构建方法,包括:获取主网架空输电线路工程文件,基于最新物资品类优化目录进行数据整合和处理;对物资名称和型号进行词向量转换,构建lstm模型进行匹配,输出匹配结果;基于余弦相似度计算,进行人工审核和修正;建立物资价格库,并定期迭代更新。

4、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述主网架空输电线路工程文件包括电网最新物资品类优化目录、电网历史信息价物资清册、工程图纸设备材料清册;

5、参考最新物资品类优化目录,制定统一的物资命名和型号标准,使用pandas库进行数据去重和格式统一;

6、所述制定统一的物资命名和型号标准包括以最新物资品类优化目录为基础,结合电网物资系统物资命名设置、工程图纸设备材料清册命名方式、电网历史信息价物资命名方式、预算价命名方式,补充地材和设计常用但品类优化目录没有的物资。

7、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述对物资名称和型号进行词向量转换包括,使用预训练的中文词嵌入将物资名称和型号转化为向量。

8、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述使用lstm模型进行匹配,输出匹配结果包括,

9、输入层接收长度为n,维度为d的向量序列x1,x2,...,xn,其中n是物资名称或型号的最大单词数,d是词嵌入的维度;

10、lstm层使用一个隐藏状态维度为h的lstm单元处理输入序列,并输出最后一个隐藏状态hn作为序列的表示,lstm单元表示为:

11、it=σ(wixt+uiht-1+bi)

12、ft=σ(wfxt+ufht-1+bf)

13、ot=σ(woxt+uoht-1+bo)

14、

15、

16、ht=ot⊙tanh(ct)

17、其中,it,ft,ot分别是输入门、遗忘门和输出门,ct分别是候选记忆细胞和记忆细胞,ht是隐藏状态,σ是sigmoid函数,⊙是逐元素乘法,wi,wf,wo,wc,ui,uf,uo,uc是权重矩阵,bi,bf,bo,bc是偏置向量;

18、全连接层使用一个全连接层将hn映射到一个维度为m的向量z,其中m是输出层的维度,表示为:

19、z=whhn+bh

20、其中,wh是权重矩阵,bh是偏置向量;

21、输出层根据任务的不同,使用不同的激活函数和损失函数;

22、若任务是预测价格,则使用恒等函数作为激活函数,使用均方误差作为损失函数;

23、若任务是预测类别,则使用softmax函数作为激活函数,使用交叉熵作为损失函数;

24、输出层表示为:

25、y=g(z)

26、l(y,t)=f(y,t)

27、其中,y是模型的输出,t是真实的标签,g是激活函数,l是损失函数,f是损失函数。

28、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述基于余弦相似度计算,进行人工审核和修正包括,

29、使用scikit-learn的cosine_similarity工具,计算向量间的余弦相似度,表示为:

30、

31、其中,θ是两向量之间的夹角,·是点积运算,|·|是范数运算;

32、若余弦相似度大于等于0.98,视为物资名称和物资型号与数据库中的记录完全匹配,无需人工审核和修正,直接采用电网物资品类优化目录的数据,所述目录是电网最新发布的物资分类和标准化的参考;

33、若余弦相似度介于0.92与0.98之间,物资名称和物资型号被认为是高度相似的,视为版本更新,直接记录并标记版本更新,在物资名称或型号后加上vx表示不同的版本号;

34、若余弦相似度介于0.85与0.92之间,人工介入判断,提示物资为子型号,并建议根据物资的功能、性能进行分类;

35、若余弦相似度小于0.85,提示需人工介入,提供低相似度和全新物资两项标记,低相似度表示由于数据质量低、命名不规范、型号不明确原因造成的,需要人工审核和修正;

36、应当说明的是,选择0.98、0.92和0.85作为阈值主要考虑以下几点:

37、1.灵活性与准确性的平衡:

38、0.98的阈值确保了几乎完全匹配的物资名称或型号可以被自动识别,从而减少了不必要的人工审核,这大大提高了工作效率。

39、0.92和0.85的阈值则为那些不完全匹配但仍然相似的物资名称或型号提供了处理机会,确保了准确性。

40、2.减少误报和漏报:

41、设置0.98作为最高阈值可以有效减少误报,因为只有高度相似的物资名称或型号才会被认为是完全匹配。

42、0.85作为最低阈值则减少了漏报,确保了具有一定相似性的物资名称或型号不会被忽略。

43、3.人工审核的优化:

44、通过在0.92和0.85之间设置一个区间,本发明为人工审核提供了明确的指导。这确保了人工审核的时间和精力都集中在那些真正需要人工判断的物资名称或型号上,从而提高了审核的效率和质量。

45、4.适应性:

46、这些阈值是基于大量的实际数据和多次试验得出的,确保了它们在实际应用中的适应性和有效性。

47、总之,选择这些具体的阈值确保了本发明在自动匹配物资名称或型号时的高效性和准确性,同时也为人工审核提供了明确的指导,从而最大化地提高了造价编制的整体效率。

48、所述全新物资表示物资是市场上刚出现的新品,数据库中没有相关的记录,直接由技术人员决定是否录入。

49、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述标建立物资价格库包括使用mysql数据库,建立物资价格库,所述物资价格库包括物资名称、型号、计量单位、不含税预算价、含税预算价、不含税市场价、含税市场价。

50、作为本发明所述的一种标准造价物资价格库的构建方法的一种优选方案,其中:所述迭代与更新包括定期收集市场上的物资价格信息,更新物资价格库中的不含税市场价和含税市场价;

51、定期优化数据的命名和型号标准,提高数据的质量和一致性。

52、本发明的另外一个目的是提供一种标准造价物资价格库的构建系统,其能通过自动化的数据整合、智能匹配和人工审核技术,解决了传统造价编制中由于物资型号命名不一致导致的人工查找耗时和准确性不高的问题。

53、为解决上述技术问题,本发明提供如下技术方案:一种标准造价物资价格库的构建系统,包括:包括数据获取模块、数据预处理模块、词向量转换模块、匹配模块、相似度计算模块、人工审核模块、数据库模块和迭代更新模块;

54、所述数据获取模块用于从不同的数据源获取文件和数据;

55、所述数据预处理模块用于进行数据整合、格式统一和去重;

56、所述词向量转换模块用于将物资名称和型号通过预训练的中文词嵌入转化为向量;

57、所述匹配模块用于使用lstm模型进行数据匹配,将物资名称和型号的向量输入到lstm模型中,并输出匹配结果;

58、所述相似度计算模块用于使用余弦相似度计算进行初步的物资名称和型号匹配评估;

59、所述人工审核模块用于基于余弦相似度的结果,进行人工审核和修正;

60、所述数据库模块用于使用mysql数据库存储物资价格库,包括物资名称、型号、计量单位、不含税预算价、含税预算价、不含税市场价和含税市场价信息;

61、所述迭代更新模块用于定期收集市场上的物资价格信息,以及优化数据的命名和型号标准。

62、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现一种标准造价物资价格库的构建方法的步骤。

63、一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现一种标准造价物资价格库的构建方法的步骤。

64、本发明的有益效果:本发明给出了一种标准造价物资价格库的构建方法,本发明在减少了造价工作人员的重复劳动的同时,显著提高了造价编制的效率和准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1