数字建筑清单计价中快速组价的方法及系统与流程

文档序号：21456986发布日期：2020-07-10 17:52阅读：577来源：国知局

本发明属于计算机信息技术领域，主要针对建筑业招投标环节的招标工程量清单、招标控制价及投标报价相关工程的编制，尤其涉及一种在计价软件清单计价工程中快速、精准组价的方法及系统。

背景技术：

在招投标计价工程的编制中，清单计价是目前通用的一种编制方法，通过计价软件，在工程量清单下套用各地区住建委会定期发布的定额，并设置相关含量、工程量和价格的方式完成计价工程的编制。随着时间的推移，造价行业各企业或个人参与编制的清单计价工程越来越多，所遇到的相似清单也越来越多，在编制工程的时候总是会遇到一些似曾相识的清单，但却找不到自己在哪做过。编制人员需要去自己的电脑、u盘和网盘等地方逐个文件查找并打开工程，然后逐条清单对比项目特征，找出自己印象中的那条清单并通过复制粘贴或批量导入的方式进行定额组价复用。操作过程十分繁琐，并且成功率极低，编制人员大部分情况还是自己重新进行套用定额进行组价。

现有的产品针对历史定额组价数据复用，更多是在找到了历史工程的基础上，通过导入工程，针对清单编码、名称和项目特征进行简单的模糊匹配，将匹配上的定额组价进行复用，详细流程如图1所示。

现有的历史工程定额组价数据复用仍存在着诸多的缺点。

1、数据来源单一，只能对历史工程的数据进行复用，无法对数据进行统一的管理维护；

2、历史工程没有统一管理，存储分散，查找起来难度很大；

3、清单匹配规则简单，准确率低；

4、操作流程复杂，效率低下。

技术实现要素：

针对背景技术的不足，本发明要解决的问题是如何实现智能快速提取表格。

为了达到上述发明目的，本发明提供了一种数字建筑清单计价中快速组价的方法，处理多种来源数据，包括数据收集与数据应用，其中，

数据收集包括数据分析入库和建立索引，建立工程项目，分配存储空间后上传数据，对多种格式数据进行解析后进行大数据分析并建立索引库；

数据应用包括单条推荐和批量自动套取，根据清单信息匹配组价数据，保存数据应用之后的结果会进行保存，根据结果进行过滤和逐条检查。

优选的，上述数据收集根据来源不同分为线上收集与线下收集。

优选的，上述数据收集具体包括：

步骤1.1、建立工程项目并配置存储区域；

步骤1.2、处理和上传存储数据；

步骤1.3、对多源多格式数据进行解析；

步骤1.4、利用机器学习进行大数据分析；

步骤1.5、对数据进行标引和建立索引库。

优选的，上述数据应用包括：

步骤2.1、选择数据来源进行单条推荐；

步骤2.2、对清单组价方案进行匹配和批量自动套取；

步骤2.3、建立搜索系统，实现索引检索查询。

优选的，上述步骤2.1获取结果之后，呈现匹配上的清单名称、特征、子目基本信息、工料机基本信息、标签、数据来源及其他信息。

优选的，上述步骤2.2每次选择匹配度最高的清单组价方案，保存每次组价结果信息，提供后续检查接口，并根据组价结果信息进行数据过滤。

优选的，上述每次组价结果信息包括数据来源、匹配程度，匹配程度分为准、似、空。

优选的，上述步骤2.3使用机器学习算法基于知识库对上传的清单名称和项目特征信息进行规范化处理，对名称和项目特征进行分词，根据分词结果在倒排索引中搜索，输出匹配度最高的结果。

一种数字建筑清单计价中快速组价的系统，处理多种来源数，包括：

数据收集单元，用于数据分析入库和建立索引，建立工程项目，分配存储空间后上传数据，对多种格式数据进行解析后进行大数据分析并建立索引库；

数据应用单元，用于单条推荐和批量自动套取，根据清单信息匹配组价数据，保存数据应用之后的结果会进行保存，根据结果进行过滤和逐条检查。

优选的，上述数据收集单元根据来源不同分为线上收集与线下收集，包括：

项目建立和存储模块，用于建立工程项目并配置存储区域；

数据处理和上传模块，用于处理和上传存储数据；

多元数据解析模块，用于对多源多格式数据进行解析；

大数据分析模块，用于利用机器学习进行大数据分析；

数据标引和索引模块，用于对数据进行标引和建立索引库。

优选的，上述数据应用单元包括：

单条推荐模块，用于选择数据来源进行单条推荐；

匹配套取模块，用于对清单组价方案进行匹配和批量自动套取；

搜索查询模块，用于建立搜索系统，实现索引检索查询。

优选的，上述单条推荐模块获取结果之后，呈现匹配上的清单名称、特征、子目基本信息、工料机基本信息、标签、数据来源及其他信息。

优选的，上述匹配套取模块每次选择匹配度最高的清单组价方案，保存每次组价结果信息，提供后续检查接口，并根据组价结果信息进行数据过滤。

优选的，上述搜索查询模块使用机器学习算法基于知识库对上传的清单名称和项目特征信息进行规范化处理，对名称和项目特征进行分词，根据分词结果在倒排索引中搜索，输出匹配度最高的结果。

与现有技术相比，本发明具有以下优势：

1、多种数据来源结合试用，用户可以根据需求方便的进行快速套价；

2、基于大数据+机器学习+知识库的数据分析，能够保证行业数据和专家数据的质量，为用户提供最优质的数据；

3、基于搜索引擎+中文分词+分词库的数据匹配，保证用户能够高效快速的找到最为匹配的数据，提高组价效率；

4、提供单条推荐和批量自动套取的方式，并且能够自主选择数据来源，用户可以在多种不同场景中使用到推荐的组价数据；

5、提供结果反查功能，能够多维度对结果清单进行过滤，提高查漏补缺的效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了现有技术流程示意图；

图2示出了本发明提供的数字建筑清单计价中快速组价方法的流程示意图；

图3示出了本发明数据收集流程示意图；

图4示出了本发明数据应用流程示意图。

具体实施方式

下面将详细描述本发明的各个方面的特征和示例性实施例，为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细描述。应理解，此处所描述的具体实施例仅被配置为解释本发明，并不被配置为限定本发明。对于本领域技术人员来说，本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

如图2所示，本实施例提供一种数字建筑清单计价中快速组价的方法，处理多种来源数据，包括数据收集与数据应用，其中，

在一些实施例中，数据收集包括数据分析入库和建立索引，建立工程项目，分配存储空间后上传数据，对多种格式数据进行解析后进行大数据分析并建立索引库；

在一些实施例中，数据应用包括单条推荐和批量自动套取，根据清单信息匹配组价数据，保存数据应用之后的结果会进行保存，根据结果进行过滤和逐条检查。

在一些实施例中，数据收集根据来源不同分为线上收集与线下收集。

在一些实施例中，数据收集具体包括：

步骤1.1、建立工程项目并配置存储区域；

步骤1.2、处理和上传存储数据；

步骤1.3、对多源多格式数据进行解析；

步骤1.4、利用机器学习进行大数据分析；

步骤1.5、对数据进行标引和建立索引库。

在一些实施例中，如图3所示，数据收集详细流程具体包括：

1、保存工程：可选择当前用户在云端的个人空间或者所属企业的企业空间，上传采用分片上传技术，可进行断点续传。

2、数据存档：数据信息在客户端打包成json格式进行上传到云端大数据存储系统中，大数据分析系统解析json文件生成详细的组价数据，将相关数据写入结果数据库中。

3、行业/专家数据分析：原始数据支持多种格式，包括但不限于excel、xml和工程文件等。原始数据上传到云端大数据存储系统中，分析过程中使用大数据分析系统进行分析，将原始数据解析成json格式的数据包，然后将数据包解析成详细组价数据写入对应的关系数据库中。json数据包的解析与上一步共用同一套逻辑，只是目标数据库不一样。

4、大数据分析：在分析过程中最主要的一个逻辑就是对组价数据进行去重，在这个过程中，引入机器学习的技术，基于积累的知识库对清单名称和项目特征进行特征抽提，行成一个规范化的特征描述，在一个规范的特征描述基础上进行去重将会更会准确。

5、建立索引：从工程或者数据库中抽取出编码、名称、单位、项目特征等清单基本信息，使用全文检索技术，将这些信息进行分词并建立倒排索引写入全文检索系统(即搜索引擎)中，索引分别指向工程中组价数据的详细位置或结果数据库中组价数据的主键id；其中分词技术使用的是ikanalyer中文分词器，分词库为内部专家总结出的业务词库，参与分词的信息为名称和项目特征。

如图4所示，在一些实施例中，数据应用包括：

步骤2.1、选择数据来源进行单条推荐；

步骤2.2、对清单组价方案进行匹配和批量自动套取；

步骤2.3、建立搜索系统，实现索引检索查询。

在一些实施例中，数据应用分为单条推荐和批量自动套取，主要流程为根据清单信息找到最为匹配的组价数据，数据应用之后的结果(数据来源、标签信息和匹配程度)会进行保存，后期可以根据结果进行过滤和逐条检查。

在一些实施例中，步骤2.1获取结果之后，呈现匹配上的清单名称、特征、子目基本信息、工料机基本信息、标签、数据来源及其他信息。

在一些实施例中，步骤2.2每次选择匹配度最高的清单组价方案，保存每次组价结果信息，提供后续检查接口，并根据组价结果信息进行数据过滤。

在一些实施例中，每次组价结果信息包括数据来源、匹配程度，匹配程度分为准、似、空。

在一些实施例中，步骤2.3使用机器学习算法基于知识库对上传的清单名称和项目特征信息进行规范化处理，对名称和项目特征进行分词，根据分词结果在倒排索引中搜索，输出匹配度最高的结果。

本发明还提供了一种数字建筑清单计价中快速组价的系统的实施例，处理多种来源数，系统包括：

数据收集单元，用于数据分析入库和建立索引，建立工程项目，分配存储空间后上传数据，对多种格式数据进行解析后进行大数据分析并建立索引库；

数据应用单元，用于单条推荐和批量自动套取，根据清单信息匹配组价数据，保存数据应用之后的结果会进行保存，根据结果进行过滤和逐条检查。

在一些实施例中，数据收集单元根据来源不同分为线上收集与线下收集，包括：

项目建立和存储模块，用于建立工程项目并配置存储区域；

数据处理和上传模块，用于处理和上传存储数据；

多元数据解析模块，用于对多源多格式数据进行解析；

大数据分析模块，用于利用机器学习进行大数据分析；

数据标引和索引模块，用于对数据进行标引和建立索引库。

在一些实施例中，数据应用单元包括：

单条推荐模块，用于选择数据来源进行单条推荐；

匹配套取模块，用于对清单组价方案进行匹配和批量自动套取；

搜索查询模块，用于建立搜索系统，实现索引检索查询。

在一些实施例中，单条推荐模块获取结果之后，呈现匹配上的清单名称、特征、子目基本信息、工料机基本信息、标签、数据来源及其他信息。

在一些实施例中，匹配套取模块每次选择匹配度最高的清单组价方案，保存每次组价结果信息，提供后续检查接口，并根据组价结果信息进行数据过滤。

在一些实施例中，搜索查询模块使用机器学习算法基于知识库对上传的清单名称和项目特征信息进行规范化处理，对名称和项目特征进行分词，根据分词结果在倒排索引中搜索，输出匹配度最高的结果。

在一些实施例中，数据来源丰富：用户可自主选择使用多种来源的数据，按照匹配准确率进行排序选择。

a)历史工程：以云端存储的方式管理历史工程，各个用户和企业在云端有专属的空间，只要工程存到云端空中，不需要再到处搜索工程，可以直接对空间中工程数据进行复用。

b)存档数据：用户针对一些精品的经验定额组价数据进行云端存储，随时随地可进行复用。

c)提供行业大数据：引入大数据+机器学习的方式，为用户提供专业数据。

d)提供造价协会专家数据：与部分造价协会合作，将组织内专家的一些推荐使用方式转化为定额组价数据，推荐给用户使用。

在一些实施例中，匹配规则更科学准确：引入搜索引擎技术和专业分词技术，通过大数据+云计算技术建立搜索索引，能够更精准的找到最为相似的清单。

在一些实施例中，数据来源不局限于单一来源：第一条中的四种来源匹配度更高者优先，用户亦可自主选择部分数据来源进行数据复用。

在一些实施例中，交互更简单易用：提供针对单条清单推荐组价和批量复用的使用场景，云端根据清单信息自动匹配，使用简单高效。

在一些实施例中，组价复用结果可视化：记录每条清单的组价信息(来源、准确度、标签、工程路径等)并进行可视化显示，用户可根据这些信息进行过滤界面清单进行分类检查。

此外，还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述方法的步骤。

此外，还可以提供一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

与现有技术相比，本发明具有以下优势：

1、用户可自主选择使用多种来源的数据，按照匹配准确率进行排序选择；

2、匹配规则更科学准确，引入搜索引擎技术、专业分词技术和分词库，通过大数据技术进行数据分析建立搜索索引，能够更精准的找到最为相似的清单；

3、数据来源不局限于单一来源：第一条中的四种来源匹配度更高者优先，用户亦可自主选择部分数据来源进行数据复用；

4、交互更简单易用：提供针对单条清单推荐组价和批量自动复用的使用场景，云端根据清单信息自动匹配，使用简单高效；

5、组价复用结果可视化，记录每条清单的组价结果信息(来源、准确度、标签、工程路径等)并进行可视化显示，用户可根据这些信息过滤界面清单进行分类检查。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：武峰林;陈静
技术所有人：广联达科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。