投标文件智能生成方法、系统、计算机装置和存储介质与流程

文档序号:33402011发布日期:2023-03-08 18:00阅读:172来源:国知局
投标文件智能生成方法、系统、计算机装置和存储介质与流程

1.本技术涉及工程投标领域,尤其是涉及投标文件智能生成方法、系统、计算机装置和存储介质。


背景技术:

2.招投标是一种重要的市场竞争方式。其最大的优势是充分体现“公开、公正、公平”的市场竞争原则。众多投标人通过招标采购,公平竞争,以相对较低的价格,获得最好的货物、工程或服务;以提高经济效益和社会效益,提高招标项目质量,提高国有资金使用效率,推进投融资管理体制和行业管理制度改革。
3.尤其是在建筑施工行业,由于项目体量大,周期长,资质要求高,涉及到物料、人员、技术等多个方面,因此通过招投标无疑是最有效、最经济的手段,在各个建设主体(建设方、施工方、监理方等)日常业务开展中发挥了日益重要的作用。
4.但是,现有的招投标流程中,投标文件(或者叫投标书)大多仍然采用传统线下方式制作,或者采用线上填报的方式。无论是传统线下制作,还是线上填报,都需要投标人对投标文件进行投标信息的手动填报,由于填报内容较多,因此十分耗时费力,且容易出错或遗漏,影响投标文件的撰写效率和质量。尤其对于投标需求较为频繁的企业,亟待提供一种可快速、准确制作投标文件的方案。


技术实现要素:

5.为了改善当前投标文件制作方式存在撰写效率低、质量差的问题,本技术提供了投标文件智能生成方法、系统、计算机装置和存储介质。
6.第一方面,本技术提供的投标文件智能生成方法,采用如下的技术方案:获取待处理招标文件;提取所述待处理招标文件的经营要素特征,生成所述待处理招标文件的要素向量;分别计算所述待处理招标文件与各历史招标文件之间的要素向量相似度;根据所述要素向量相似度的计算结果,筛选出计算结果满足预设要求的目标历史招标文件;获取与所述目标历史招标文件关联的历史中标文件;提取所述历史中标文件中预设要素类型的目标经营要素;将所述目标经营要素导入设定投标模板,自动生成与所述待处理招标文件对应的电子投标文件。
7.通过采用上述技术方案:通过对待处理招标文件与历史招投标文件进行关联性分析,确定关联的历史中标文件;基于历史中标文件提取出目标经营要素,实现对设定投标模板中相关投标信息的自动导入填报;从而实现电子投标文件的自动生成。因此,提高了招标文件的撰写效率,避免了手动填报存在信息错误或遗漏问题;为投标人确定最终投标文件
提供了有效的参考决策依据。本方案具有较高的实际使用价值,可广泛推广使用。
8.可选的,所述各历史招标文件的要素向量,通过如下方式预处理得到:获取若干历史招标文件以及对应的历史投标文件,形成招投标历史数据库;提取招投标历史数据库中的经营要素,形成招投标经营要素数据库;计算各所述历史招标文件中,与所述招投标经营要素数据库对应的经营要素的词频;基于所述词频构建得到所述历史招标文件的要素向量。
9.通过采用上述技术方案,提供了基于历史招投标文件生成经营要素数据库,然后以历史招标文件的词频,构建历史招标文件的要素向量,为待处理招标文件与历史招标文件的关联性分析提供了数据关联性依据。
10.可选的,所述基于所述词频构建得到所述历史招标文件的要素向量包括:将所述历史招标文件中经营要素的词频,作为该经营要素的向量值,构建得到所述历史招标文件对应的所述要素向量;从而根据所述招投标历史数据库中所有历史招标文件,得到所述各历史招标文件的要素向量。
11.通过采用上述技术方案,将历史招标文件词频,作为该经营要素的向量值,实现对历史招投标文件要素向量的构建。
12.可选的,在所述提取招投标历史数据库中的经营要素之后,在形成招投标经营要素数据库之前,还包括:利用聚类算法对所述经营要素进行聚类处理;根据聚类结果剔除异常经营要素,以将正常经营要素用于构建形成所述招投标经营要素数据库。
13.通过采用上述技术方案,可降低由于提取算法缺陷,导致提取出的经营要素中存在相关性不大的异常数据,对招投标经营要素数据库的数据质量的影响。
14.可选的,所述利用聚类算法对所述经营要素进行聚类处理;根据聚类结果剔除异常经营要素包括:利用基于密度的聚类算法;针对所述经营要素,将满足设定密度大小的区域的所有经营要素,划分为同一个簇;在划分完成后,将不属于簇内的经营要素,判定为异常经营要素;并将所述异常经营要素进行剔除。
15.通过采用上述技术方案,利用基于密度的聚类算法实现了对异常数据的剔除。
16.可选的,所述获取若干历史招标文件以及对应的历史投标文件包括:利用网络抓取爬虫技术,获取网络公开的所述若干历史招标文件以及对应的历史投标文件。
17.通过采用上述技术方案,实现了对历史招投标数据的有效获取。
18.可选的,所述经营要素的类型包括商务资信、施工技术、报价成本;所述预设要素类型包括报价成本。
19.通过采用上述技术方案,有利于更有效地获取相关类型的经营要素,可更好地适用于建筑施工领域。
20.第二方面,本技术提供的投标文件智能生成系统,采用如下的技术方案:
投标文件智能生成系统,包括:第一获取模块,用于获取待处理招标文件;处理模块,用于提取所述待处理招标文件的经营要素特征,生成所述待处理招标文件的要素向量;计算模块,用于分别计算所述待处理招标文件与各历史招标文件之间的要素向量相似度;筛选模块,用于根据所述要素向量相似度的计算结果,筛选出计算结果满足预设要求的目标历史招投标文件;第二获取模块,用于获取与所述目标历史招标文件关联的历史中标文件;提取模块,用于提取所述历史中标文件中预设要素类型的目标经营要素;文件生成模块,用于将所述目标经营要素导入设定投标模板,自动生成与所述待处理招标文件对应的电子投标文件。
21.通过采用上述技术方案,提供了能执行实现上述投标文件智能生成方法的功能模块系统。
22.第三方面,本技术提供的计算机装置,采用如下的技术方案:计算机装置,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述投标文件智能生成方法。
23.通过采用上述技术方案,提供了能执行实现上述投标文件智能生成方法的计算机装置。
24.第四方面,本技术提供的计算机可读存储介质,采用如下的技术方案:计算机可读存储介质,所述计算机存储介质存储有计算机程序;所述计算机程序被处理器执行时实现上述投标文件智能生成方法。
25.通过采用上述技术方案,提供了投标文件智能生成方法的计算机程序的载体。
26.综上所述,本技术包括以下至少有益技术效果:提高了招标文件的撰写效率,避免了手动填报存在信息错误或遗漏问题;为投标人确定最终投标文件提供了有效的参考决策依据。本方案具有较高的实际使用价值,可广泛推广使用。
附图说明
27.图1是本技术实施例中投标文件智能生成方法的流程框图;图2是本技术实施例中分析模型构建方法流程框体;图3是本技术实施例中投标文件智能生成系统结构框体;图4是本技术实施例中计算机装置结构框体;附图标记说明:31、第一获取模块;32、处理模块;33、计算模块;34、筛选模块;35、第二获取模块;36、提取模块;37、文件生成模块;41、存储器;42处理器;43、通信总线。
具体实施方式
28.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图1-4及实施
例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
29.本技术实施例公开投标文件智能生成方法。
30.参考图1,投标文件智能生成方法,包括以下步骤:s110:获取待处理招标文件。
31.本技术实施例提供的投标文件智能生成方法,可通过相应的软件系统(例如投标文件智能生成系统)实施,软件系统可部署于服务器/计算机设备上,供投标用户使用。
32.在本技术可选实施例中,投标用户主要包括建筑施工方、承建方或其他可提供建筑施工服务的主体。
33.软件系统可通过现有任意方式获取待处理招标文件。
34.例如,软件系统可利用网络爬虫技术,监测相关招投标网站发布的招标信息,并在监测到相关招标公告后,及时爬取相关招标文件,发送给投标用户端,供投标用户确认是否对此进行投标。若确认存在投标需求,则进行后续智能生成投标文件的处理;若确定没有投标需求,则丢弃。
35.应当理解的是,待处理招标文件,可以是处于投标有效期等待投标的招标文件。待处理招标文件可以是用户自主筛选的招标文件,也可以是软件系统主动推送符合预设需求的招标文件。
36.具体的,投标用户可根据实际需求预设感兴趣主体(例如关注的建设方),或预设感兴趣领域;软件系统根据预设需求,对公开的招标信息进行监测;若该招标信息是预设感兴趣主体发布的,或者是符合投标方预设感兴趣领域的,则将该招标信息实时推送给投标方进行确认。以更好的满足投标用户的个性化需求。保证在招标公告发布的第一时间,发送给有相应需求的投标用户,给投标用户更多的考虑时间或准备投标文件,提高中标率;同时避免由于投标用户未及时获知招标公告,错过重要招标的重大问题。
37.s120:提取待处理招标文件的经营要素特征,生成待处理招标文件的要素向量。
38.本技术实施例中,经营要素的类型包括商务资信、施工技术、报价成本。
39.本技术实施例中,经营要素特征指的是经营要素词汇在对应招投标文件中的词频(term frequency)。根据待处理招标文件中相关经营要素的词频,生成待处理招标文件的要素向量。
40.其中,对于待处理招标文件具体所要提取的相关经营要素,可根据分析模型中各历史招投标文件的要素向量所涉及的经营要素对应确定。
41.例如,分析模型中各历史招投标文件的要素向量形式为(a11,a12,a13,

,a1n),其中n>3,表示经营要素的个数;a1j(j∈[1,n])表示经营要素kj在第1个历史招投标文件中的词频。也即是历史招投标文件的要素向量涉及的经营要素包括k1、k2、k3、

、kn,从而确定待处理招标文件需要提取的相关经营要素也为k1、k2、k3、

、kn,进而分别统计各个经营要素k1、k2、k3、

、kn在待处理招标文件中的词频,以生成待处理招标文件的要素向量。
[0042]
s130:分别计算待处理招标文件与各历史招标文件之间的要素向量相似度。
[0043]
根据待处理招标文件的要素向量,以及分析模型中各历史招投标文件的要素向量,即可根据相似度计算方法,计算两者的要素向量相似度。
[0044]
其中,相似度计算方法可采用欧式距离、余弦相似度等。对此不做限制。
[0045]
参考图2,各历史招投标文件的要素向量,可通过如下方式预先处理得到:s210、利用网络抓取爬虫技术,获取网络公开的若干历史招标文件以及对应的历史投标文件,形成招投标历史数据库。
[0046]
本技术实施例中,与历史招标文件对应的历史投标文件包括历史中标文件。
[0047]
s220、提取招投标历史数据库中各文件的经营要素,形成招投标经营要素数据库。
[0048]
本技术实施例中,经营要素的提取可以先基于对历史招投标文件的分段识别,针对每段中的文本内容进行分词处理,可采用现有任意分词工具,从而得到若干与相应类型经营要素相关的词汇。
[0049]
其中,对历史招投标文件的分段识别,可利用文件的分段符以及每一段/每一部分的目录标识进行识别。
[0050]
例如,商务资信、施工技术、报价成本通常会作为招投标文件的3个目录或者子目录,每个目录或子目录,通常会作为一个目录行进行分段。在当前目录行之后,在后一目录行之前的内容,一般属于当前目录行对应的内容;通过对该部分内容进行分词处理,即可得到对应经营要素相关的词汇。
[0051]
当然,在本技术可选实施例中,完全可采用其他可实现经营要素相关词汇提取的任意方式,对此不做限制。
[0052]
招投标经营要素数据库中,存储有若干经营要素词汇,各个经营要素词汇可按照一定顺序依次排序。
[0053]
在本技术可选实施例中,为了提高招投标经营要素数据库的数据质量,可利用聚类算法对招投标经营要素数据库的经营要素进行聚类处理;根据聚类结果,剔除异常经营要素,以将正常经营要素用于构建形成招投标经营要素数据库。由此,可降低由于提取算法缺陷,导致提取出的经营要素中存在相关性不大的异常数据,对招投标经营要素数据库的数据质量的影响。
[0054]
其中,异常数据的剔除,可根据所选取的聚类算法以及聚类结果进行处理。
[0055]
具体的,可利用基于密度的聚类算法,实现对异常数据的剔除:针对招投标经营要素数据库的经营要素,将满足设定密度大小的区域的所有经营要素,划分为同一个簇;在划分完成后,确定不属于簇内(未被划分到簇内)的经营要素,表明该经营要素与其他经营要素之间的关联性较小,从而判定为异常经营要素;并将该异常经营要素进行剔除。
[0056]
或者,采用k均值(例如k-means)聚类,实现对异常数据的剔除:1)针对招投标经营要素数据库的经营要素,从每一个经营要素类型中随机挑选1个样本(一个经营要素词汇代表一个样本)作为原始的簇中心(即存在多少个经营要素类型,则设置多少个簇中心,提高聚类效率);2)计算剩余样本与簇中心的距离,并把各样本标记为离k个簇中心最近的类别;3)重新计算各簇中样本点的均值,并以均值作为新的k个簇中心;4)不断重复2)和3),直到簇中心的变化趋于稳定,形成最终的k个簇。
[0057]
基于聚类的结果,计算簇内每个点到簇中心的距离;将距离大于设定距离阈值的样本作为异常样本,即异常经营要素;距离小于等于设定距离阈值的样本作为正常样本,即正常经营要素。
[0058]
s230、计算各历史招标文件中,与招投标经营要素数据库对应的经营要素的词频。
[0059]
假设,招投标经营要素数据库对应的经营要素包括k1、k2、k3三个,则分别统计k1、k2、k3在某历史招标文件中的词频,从而得到该历史招标文件的要素向量。
[0060]
s240、基于词频构建得到历史招投标文件的要素向量。
[0061]
在本技术实施例中,基于历史招标文件中经营要素的词频,作为该经营要素的向量值,构建得到该历史招标文件对应的要素向量;从而根据招投标历史数据库中所有历史招标文件,得到各历史招标文件的要素向量。
[0062]
在本技术可选实施例中,还可对获取到的所有历史招投标文件,按照省份/省级进行分类,针对每个省份的历史招投标文件分别进行处理,以生成对应省份历史招投标文件的要素向量。实现以省为单位的分析模型,以智能生成相应的电子投标文件;从而适用于某些投标用户的特定范围使用需求,同时降低分析模型构建的数据处理量。
[0063]
s140:根据要素向量相似度的计算结果,筛选出计算结果满足预设要求的目标历史招投标文件。
[0064]
以欧式距离计算待处理招标文件和历史招投标文件的要素向量相似度为例,欧式距离越大,表明两者相似度越小;通过设置欧式距离阈值,作为预设要求;当计算结果大于所设置的欧式距离阈值时,则判定不满足预设要求;相反,若计算结果在所设置的欧式距离阈值以内,则判定满足预设要求;将满足预设要求的历史招投标文件作为该目标历史招投标文件,不满足预设要求的历史招投标文件则丢弃不做处理。通过采用上述筛选方式,可保证筛选得到的目标历史招投标文件具有参考价值,保证所生成的电子投标文件具有有效性。
[0065]
在本技术可选实施例中,当采用上述筛选方式得到多个目标历史招投标文件时,可选取欧式距离最小的一个目标历史招投标文件。
[0066]
s150:获取与目标历史招标文件关联的历史中标文件。
[0067]
应当理解,目标历史招标文件为已经完成招标的项目,因此通常存在相应的中标文件。
[0068]
s160:提取历史中标文件中预设要素类型的目标经营要素。
[0069]
本技术实施例中,预设要素类型包括报价成本。具体提取方式可采用上述提取经营要素的方式,或者现有任意提取方式,在此不再赘述。
[0070]
本技术实施例中,报价成本包括但不限于人材机信息价、投标成本等具体内容。
[0071]
s170:将目标经营要素导入设定投标模板,自动生成与待处理招标文件对应的电子投标文件。
[0072]
将历史中标文件中的报价成本关联的目标经营要素导入设定投标模板,这里设定投标模板可以采用历史中标文件的模板,以方便实现目标经营要素的快速、准确导入。
[0073]
对于设定投标模板中还需填报的其他经营要素信息,例如商务资信和施工技术,可通过预设投标用户的相关信息实现自动导入。
[0074]
例如,预先将投标用户的企业资质(例如包括资质证书、公司营业执照等)、人员资质(例如包括人员信息以及各种资格证、执业证等)、业绩资料(例如包括相关的业绩情况、已经竣工验收的项目资料等)、获奖资料(例如包括相关机构、企业颁发的证书等)、财务报告(例如与财务有关的各种报表)、投标备案(例如包含备案情况等)等商务资信信息,预先填报到相关资信模板;当需要生成电子投标文件时,直接调用该预先填报好的资信模板,作
为设定投标模板的商务资信部分,实现对该部分内容的自动填报。
[0075]
同理,预先将投标用户的施工技术(例如施工组织方案、施工设计方案、工法、新工艺等资料)填报到相关施工技术模板;当需要生成电子投标文件时,直接调用该预先填报好的施工技术模板,作为设定投标模板的施工技术部分,实现对该部分内容的自动填报。从而实现对整个设定投标模板各部分经营要素内容的自动填报,以自动生成电子投标文件。
[0076]
本技术实施例,通过对待处理招标文件与历史招投标文件进行关联性分析,确定关联的历史中标文件;基于历史中标文件提取出目标经营要素,实现对设定投标模板中相关投标信息的自动导入填报;从而实现电子投标文件的自动生成。因此,提高了招标文件的撰写效率,避免了手动填报存在信息错误或遗漏问题;同时,通过对历史招投标文件的分析,对待处理招标文件实现对报价成本的智能分析与自动填报,为投标人确定最终投标文件提供了有效的参考决策依据。本方案具有较高的实际使用价值,可广泛推广使用。
[0077]
基于同一设计构思,本实施例还公开投标文件智能生成系统。
[0078]
参考图3,投标文件智能生成系统,包括:第一获取模块31,用于获取待处理招标文件;处理模块32,用于提取待处理招标文件的经营要素,生成待处理招标文件的要素向量;计算模块33,用于分别计算待处理招标文件与各历史招投标文件之间的要素向量相似度;筛选模块34,用于根据要素向量相似度的计算结果,筛选出计算结果满足预设要求的目标历史招投标文件;第二获取模块35,用于获取与目标历史招标文件关联的历史中标文件;提取模块36,用于提取历史中标文件中预设要素类型的目标经营要素;文件生成模块37,用于将目标经营要素导入设定投标模板,自动生成与待处理招标文件对应的电子投标文件。
[0079]
本技术实施例中,第一获取模块31和第二获取模块35,可通过网络抓取爬虫技术实现数据获取。处理模块32、计算模块33、筛选模块34、提取模块36以及文件生成模块37等,用于实现数据处理、计算、筛选、要素提取以及文成生成等过程,可通过处理器(例如cpu)等模块实现。
[0080]
本技术可选实施例中,投标文件智能生成系统包含但不限于上述模块,可根据实际情况灵活增加、合并相应模块。但可实现上述投标文件智能生成方法的至少部分或全部步骤,具体请参见上述投标文件智能生成方法的描述,在此不再赘述。
[0081]
本技术还提供一种计算机可读存储介质,存储有能够被处理器加载执行时实现上述步骤。
[0082]
所述计算机可读存储介质例如包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0083]
参考图4,基于同一发明构思,本技术实施例提供一种计算机装置,包括存储器41和处理器42,以及用于实现存储器41和处理器42之间通信连接的通信总线43,存储器41上存储有能够被处理器42加载并执行上述方法的计算机程序;处理器42执行计算机程序时,
可控实现上述的投标文件智能生成方法至少部分或全部步骤,具体请参见上述投标文件智能生成方法的描述,在此不再赘述。
[0084]
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0085]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0086]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0087]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0088]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
[0089]
以上所述,以上实施例仅用以对本技术的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本技术的方法及其核心思想,不应理解为对本技术的限制。本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1