结合RPA及AI的招投标信息校正方法、装置及存储介质与流程

文档序号:30307636发布日期:2022-06-05 07:29阅读:120来源:国知局
结合RPA及AI的招投标信息校正方法、装置及存储介质与流程
结合rpa及ai的招投标信息校正方法、装置及存储介质
技术领域
1.本技术涉及计算机技术领域,尤其涉及一种结合rpa及ai的招投标信息校正方法、装置及存储介质。


背景技术:

2.机器人流程自动化(robotic process automation)简称rpa,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
3.人工智能(artificial intelligence,ai)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
4.智能文档处理(intelligent document processing,idp)是基于光学字符识别(optical character recognition,ocr)、计算机视觉(computer vision,cv)、自然语言处理(natural language processing,nlp)、知识图谱(knowledge graph,kg)等人工智能技术,对各类文档进行识别、分类、抽取、校验等处理,帮助企业实现文档处理工作的智能化和自动化的新一代自动化技术。
5.招投标是一种国际惯例,是商品经济高度发展的产物,是应用技术、经济的方法和市场经济的竞争机制的作用,有组织开展的一种择优成交的方式。企业进行招投标时,需要从对应的招投标文档中获取需要的招投标信息。为了提高获取的招投标信息的准确性,需要对获取到的招投标信息进行校正。但是,随着科学技术的发展,招投标文档中会不断的出现新的格式、新的领域词汇、新的表达方式等等,这种情况下,终端对招投标信息进行校正时的准确性低,进而影响用户的使用体验。


技术实现要素:

6.本技术实施例提供一种结合rpa及ai的招投标信息校正方法、装置及存储介质,以解决相关技术存在的问题,技术方案如下:
7.第一方面,本技术实施例提供了一种结合rpa及ai的招投标信息校正方法,包括:
8.通过机器人流程自动化rpa系统,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;
9.获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;
10.基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
11.在一种实施方式中,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,包括:
12.通过第一nlp模型获取招投标信息集合中的任一招投标信息对应的置信度;
13.若任一招投标信息对应的置信度低于置信度阈值,则将招投标信息添加至招投标信息子集。
14.在一种实施方式中,获取招投标信息集合中不满足信息条件的至少一个招投标信
息,得到招投标信息子集,包括:
15.获取招投标信息集合对应的筛选条件集合;
16.在招投标信息集合获取不满足筛选条件集合中任一筛选条件的至少一个招投标信息,得到招投标信息子集。
17.在一种实施方式中,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,包括:
18.对招投标信息集合进行抽检,获取抽检后的招投标信息集合;
19.获取针对抽检后的招投标信息集合中任一招投标信息所输入的抽检结果信息;
20.若抽检结果信息指示任一招投标信息不满足信息条件,则将任一招投标信息添加至招投标信息子集。
21.在一种实施方式中,方法还包括:
22.基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型。
23.在一种实施方式中,基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型,包括:
24.获取招投标校正集合中至少一个招投标信息的信息数量;
25.若信息数量大于信息数量阈值,则对第一nlp模型进行增量训练,得到第二nlp模型,并清空招投标校正集合。
26.在一种实施方式中,在获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集之前,还包括:
27.获取无标注训练样本集合;
28.利用无标注训练样本集合对第三nlp模型进行训练,得到第四nlp模型;
29.获取标注训练样本集合;
30.利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型。
31.第二方面,本技术实施例提供了一种结合rpa及ai的招投标信息校正装置,包括:
32.子集获取单元,用于通过机器人流程自动化rpa系统,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;
33.信息获取单元,用于获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;
34.信息校正单元,用于基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
35.在一种实施方式中,子集获取单元包括置信度获取子单元和信息添加子单元,子集获取单元用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
36.置信度获取子单元,用于通过第一nlp模型获取招投标信息集合中的任一招投标信息对应的置信度;
37.信息添加子单元,用于若任一招投标信息对应的置信度低于置信度阈值,则将招投标信息添加至招投标信息子集。
38.在一种实施方式中,子集获取单元还包括集合获取子单元和信息筛选子单元,子
集获取单元用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
39.集合获取子单元,用于获取招投标信息集合对应的筛选条件集合;
40.信息筛选子单元,用于在招投标信息集合获取不满足筛选条件集合中任一筛选条件的至少一个招投标信息,得到招投标信息子集。
41.在一种实施方式中,子集获取单元还包括集合抽检子单元、结果获取子单元和条件判断子单元,子集获取单元用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
42.集合抽检子单元,用于对招投标信息集合进行抽检,获取抽检后的招投标信息集合;
43.结果获取子单元,用于获取针对抽检后的招投标信息集合中任一招投标信息所输入的抽检结果信息;
44.条件判断子单元,用于若抽检结果信息指示任一招投标信息不满足信息条件,则将任一招投标信息添加至招投标信息子集。
45.在一种实施方式中,招投标信息校正装置还包括:
46.模型迭代单元,用于基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型。
47.在一种实施方式中,模型迭代单元包括数量获取子单元和模型训练子单元,模型迭代单元用于基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型时:
48.数量获取子单元,用于获取招投标校正集合中至少一个招投标信息的信息数量;
49.模型训练子单元,用于若信息数量大于信息数量阈值,则对第一nlp模型进行增量训练,得到第二nlp模型,并清空招投标校正集合。
50.在一种实施方式中,招投标信息校正装置还包括样本获取单元、模型获取单元、标注样本获取单元和模型调整单元,用于在获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集之前:
51.样本获取单元,用于获取无标注训练样本集合;
52.模型获取单元,用于利用无标注训练样本集合对第三nlp模型进行训练,得到第四nlp模型;
53.标注样本获取单元,用于获取标注训练样本集合;
54.模型调整单元,用于利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型。
55.第三方面,本技术实施例提供了一种结合rpa及ai的终端,该终端包括:存储器和处理器。其中,该存储器和该处理器通过内部连接通路互相通信,该存储器用于存储指令,该处理器用于执行该存储器存储的指令,并且当该处理器执行该存储器存储的指令时,使得该处理器执行上述各方面任一种实施方式中的方法。
56.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机程序,当计算机程序在计算机上运行时,上述各方面任一种实施方式中的方法被执行。
57.上述技术方案中的优点或有益效果至少包括:
58.在一个或者相关的实施例中,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。因此,通过获取不满足信息条件的招投标信息,并对招投标信息进行校正,可以减少不满足信息条件的招投标信息的获取情况,可以减少仅基于nlp模型和/或筛选条件集合获取的信息不准确的情况,可以针对nlp模型和/或筛选条件集合获取的信息进行调整,可以提高招投标信息校正的准确性,进而可以提高用户的使用体验。
59.上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本技术进一步的方面、实施方式和特征将会是容易明白的。
附图说明
60.在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本技术的一些实施方式,而不应将其视为是对本技术范围的限制。
61.图1示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的背景示意图;
62.图2示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的背景架构示意图;
63.图3示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的流程图;
64.图4示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的流程图;
65.图5示出本技术一个实施例的一种第一nlp模型的获取流程图;
66.图6示出本技术一个实施例的一种招投标信息子集的获取流程图;
67.图7示出本技术一个实施例的一种信息校正界面的展示示意图;
68.图8示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
69.图9示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
70.图10示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
71.图11示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
72.图12示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
73.图13示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图;
74.图14示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示
意图;
75.图15示出根据本技术一实施例的一种终端的结构框图。
具体实施方式
76.下面详细描述本技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能理解为对本技术的限制。
77.在本技术的描述中,术语“多个”指两个或两个以上。
78.在本技术的描述中,术语“rpa”是指通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
79.在本技术的描述中,术语“idp”是指智能文档处理(intelligent document processing),具体是指基于光学字符识别(optical character recognition,ocr)、计算机视觉(computer vision,cv)、自然语言处理(natural language processing,nlp)、知识图谱(knowledge graph,kg)等人工智能技术,对各类文档进行识别、分类、抽取、校验等处理,帮助企业实现文档处理工作的智能化和自动化的新一代自动化技术。本技术的描述中介绍了idp的一个典型应用场景,即利用智能文档处理对大量的招投标文档进行自动抓取、分析和匹配。
80.智能文档理解平台基于ocr、nlp前沿算法,提供丰富的预训练模型及自学习功能,拥有处理多类复杂文档的能力,实现端到端的文档处理自动化。
81.在本技术的描述中,术语“nlp”是指自然语言处理(natural language processing),是计算机科学领域与人工智能领域中的一个重要方向。具体是以语言为对象,利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括自然语言理解(natural language understanding,nlu)和自然语言生成(natural language generation,nlg)两部分。nlp是典型边缘交叉学科,涉及到语言科学、计算机科学、数学、认知学、逻辑学等,其研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。用计算机处理自然语言的过程在不同时期或侧重点不同时又分别称为自然语言理解(natural language understanding,nlu)、人类语言技术(human language technology,hlt)、计算语言学(computational linguistics,hl)、计量语言学(quantitative linguistics)、数理语言学(mathematical linguistics)。
82.在本技术的描述中,术语“招投标文档”包括招标文档和投标文档。其中,招标文档指的是招标人向潜在投标人发出并告知项目需求、招标投标活动规则和合同条件等信息的要约邀请文档,是项目招标投标活动的主要依据。投标文档指的是投标人应招标文档要求编制的响应性文档。
83.在本技术的描述中,术语“招投标信息”指的是终端通过nlp模型对招投标文档进行文档理解时获取到的信息。该招投标信息包括但不限于项目名称信息、公司信息、资金来源信息、项目规模信息、合同估算价信息、项目地理位置信息、工期信息、招标范围信息、资质要求信息、截止日期信息等等。
84.在本技术的描述中,术语“增量训练”指的是一个模型能不断地从新样本中学习新
的知识,并能保存大部分以前已经学习到的知识的过程。增量学习涉及到两点:在上一次训练结束的时候保存需要持久化的参数,在下一次训练开始的时候加载上一次保存的持久化参数。
85.在本技术的描述中,术语“模型参数”指的是模型内部的配置变量。模型参数可以用数据估计或数据学习得到。进行模型预测时需要模型参数。模型参数值可以定义模型功能。模型参数通常作为学习模型的一部分保存。可以使用优化算法估计模型参数,优化算法是对参数的可能值进行的一种有效搜索。
86.随着科学技术的发展,终端技术的日益成熟,提高了用户生产生活的便利性。终端应用场景中,用户可以通过信息获取应用程序获取招投标文档中需要用到的招投标信息。
87.根据一些实施例,图1示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的背景示意图。如图1所示,用户可以点击终端的招投标信息校正应用程序,当终端检测到用户点击招投标信息校正应用程序时,终端可以展示招投标信息校正界面。用户可以基于招投标信息校正界面,输入需要校正的招投标信息集合,并点击“校正”按键。当终端检查到用户点击“校正”按键时,终端可以对招投标信息集合中的招投标信息进行信息校正。
88.根据一些实施例,图2示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的背景架构示意图。如图2所示,终端11可以通过网络12将用户发出的校正指令上传至服务器13。当服务器13接收到校正指令时,服务器13可以通过nlp模型对招投标信息集合中的招投标信息进行信息校正。服务器13可以通过网络12将校正后的招投标信息发送至终端11。
89.在一些实施例中,由于需要校正的招投标信息集合对应的招投标文档不断的出现新的格式、新的领域词汇、新的表达方式等等,因此,深度学习模型对招投标文档进行招投标信息校正时准确度不高,进而影响用户的使用体验。
90.易于理解的是,该终端包括但不限于:可穿戴设备、手持设备、个人电脑、平板电脑、车载设备、智能手机、计算设备或连接到无线调制解调器的其它处理设备等。在不同的网络中终端设备可以叫做不同的名称,例如:用户设备、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置、蜂窝电话、无绳电话、个人数字处理(personal digital assistant,pda)、第五代移动通信技术(5th generation mobile networks,5g)网络或未来演进网络中的终端设备等。该终端上可以安装操作系统,该操作系统是指可以运行在终端中的操作系统,是管理和控制终端硬件和终端应用的程序,是终端中不可或缺的系统应用。该操作系统包括但不限于安卓android系统、ios系统、windows phone(wp)系统和ubuntu移动版操作系统等。
91.根据一些实施例,该终端11可以通过网络12和服务器13连接。网络12用以在终端11和服务器13之间提供通信链路。网络12可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。应该理解,图2中的终端11、网络12和服务器13的数目仅仅是示意性的。根据现实需要,可以具有任意数目的终端、网络和服务器。比如服务器13可以是多个服务器组成的服务器集群等。用户可以使用终端11通过网络12与服务器13交互,以进行招投标信息校正等。
92.参照下面的描述和附图,将清楚本技术的实施例的这些和其他方面。在这些描述
和附图中,具体申请了本技术的实施例中的一些特定实施方式,来表示实施本技术的实施例的原理的一些方式,但是应当理解,本技术的实施例的范围不受此限制。相反,本技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
93.以下结合附图描述根据本技术实施例的结合rpa及ai的招投标信息校正方法。
94.图3示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的流程图,如图3所示,该方法可包括以下步骤:
95.步骤s101:通过机器人流程自动化rpa系统,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集;
96.根据一些实施例,招投标信息集合指的是由至少一个招投标信息汇聚而成的集合。该招投标信息集合并不特指某一固定集合。例如,当招投标信息的内容发生变化时,该招投标信息集合也可以相应变化。当招投标信息的数量发生变化时,该招投标信息集合也可以相应变化。
97.根据一些实施例,信息条件指的是终端用于判断获取的招投标信息是否准确的条件。该信息条件并不特指某一固定条件。该信息条件包括但不限于第一自然语言处理nlp模型和/或筛选条件集合。当终端获取到针对信息条件的条件修改指令时,该信息条件会发生相应变化。
98.在一些实施例中,第一nlp模型指的是判断获取的招投标信息是否准确时采用的nlp模型。该第一nlp模型并不特指某一固定模型。例如,当终端获取到针对第一nlp模型的模型修改指令时,该第一nlp模型会发生相应变化。当信息条件发生变化时,该第一nlp模型会发生相应变化。
99.在一些实施例中,筛选条件指的是用户预设的判断获取的招投标信息是否准确时采用的条件。该筛选条件并不特指某一固定条件。该筛选条件包括但不限于存在招标金额信息、存在招标截止时间等等。
100.在一些实施例中,筛选条件集合中指的是由至少一个筛选条件汇聚而成的集合。该筛选条件集合并不特指某一固定集合。例如,当筛选条件的数量发生变化时,该筛选条件集合也可以相应变化。当筛选条件的内容发生变化时,该筛选条件集合也可以相应变化。
101.根据一些实施例,招投标信息子集指的是由招投标信息集合中不满足信息条件的至少一个招投标信息汇聚而成的集合。该招投标信息子集并不特指某一固定子集。例如,当招投标信息集合发生变化时,该招投标信息子集也可以相应变化。当信息条件发生变化时,该招投标信息子集也可以相应变化。
102.易于理解的是,当用户需要获取招投标文档中的招投标信息时,用户可以通过终端获取招投标文档对应的招投标信息集合。当终端获取到招投标信息集合时,终端可以获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集。
103.步骤s102:获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;
104.根据一些实施例,校正信息指的是用户获取到招投标信息子集时,对招投标信息子集中至少一个招投标信息进行校正时输入的信息。该校正信息并不特指某一固定信息。例如,当招投标信息子集发生变化时,该校正信息也可以发生变化。当输入校正信息的用户发生变化时,该校正信息也可以发生变化。
105.例如,当终端获取到“招标截止日期”对应的招投标信息为“8月”时,则针对该招投
标信息进行校正时输入的校正信息为招投标文档中招标截止日期对应的具体日期“8月24日”。或者,当终端获取到“招标金额信息”对应的招投标信息为“不存在”时,则针对该招投标信息进行校正时输入的校正信息为招投标文档中招标金额信息对应的具体金额“¥20,000”。
106.易于理解的是,当终端获取到招投标信息子集时,终端可以获取针对招投标信息子集中至少一个招投标信息所输入的校正信息。
107.步骤s103:基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
108.根据一些实施例,招投标校正集合指的是终端基于校正信息,对招投标信息子集中至少一个招投标信息进行校正时获取的校正后的至少一个招投标信息汇聚而成的集合。该招投标校正集合并不特指某一固定集合。例如,当招投标信息子集发生变化时,该招投标校正集合也可以发生变化。当校正信息发生变化时,该招投标校正集合也可以发生变化。
109.易于理解的是,当终端获取到针对招投标信息子集中至少一个招投标信息所输入的校正信息时,终端可以基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
110.在一个或者相关的实施例中,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。因此,通过获取不满足信息条件的招投标信息,并对招投标信息进行校正,可以减少不满足信息条件的招投标信息的获取情况,可以减少仅基于nlp模型和/或筛选条件集合获取的信息不准确的情况,可以针对nlp模型和/或筛选条件集合获取的信息进行调整,可以提高招投标信息校正的准确性,进而可以提高用户的使用体验。
111.图4示出本技术一个实施例的一种结合rpa及ai的招投标信息校正方法的流程图,如图4所示,该方法可包括以下步骤:
112.步骤s201:获取无标注训练样本集合;
113.根据一些实施例,无标注训练样本集合指的是由至少一个无标注训练样本汇聚而成的集合。该无标注训练样本集合并不特指某一固定集合。例如,当无标注训练样本的数量发生变化时,该无标注训练样本集合可以发生变化。当无标注训练样本的内容发生变化时,该无标注训练样本集合可以发生变化。
114.易于理解的是,当用户需要获取招投标文档中的招投标信息时,用户可以通过终端对招投标文档进行招投标信息校正。当终端对招投标文档进行招投标信息校正时,终端可以获取无标注训练样本集合。
115.步骤s202:利用无标注样本集合对第三nlp模型进行训练,得到第四nlp模型;
116.根据一些实施例,第三nlp模型指的是未经过训练的nlp模型。该第三nlp模型并不特指某一固定模型。例如,当第三nlp模型的模型参数发生变化时,该第三nlp模型也可以发生变化。当第三nlp模型的模型结构发生变化时,该第三nlp模型也可以发生变化。
117.在一些实施例中,第四nlp模型指的是利用无标注样本集合对第三nlp模型进行训练时得到的nlp模型。该第四nlp模型并不特指某一固定模型。例如,当第三nlp模型发生变化时,该第四nlp模型也可以发生变化。当无标注样本集合发生变化时,该第四nlp模型也可
以发生变化。
118.易于理解的是,当终端获取到无标注训练样本集合时,终端可以利用无标注训练样本集合对第三nlp模型进行训练,得到第四nlp模型。
119.步骤s203:获取标注训练样本集合;
120.根据一些实施例,标注训练样本集合指的是由至少一个标注训练样本汇聚而成的集合。该标注训练样本集合并不特指某一固定集合。例如,当标注训练样本的数量发生变化时,该标注训练样本集合可以发生变化。当标注训练样本的内容发生变化时,该标注训练样本集合可以发生变化。
121.易于理解的是,当终端获取到第四nlp模型时,终端可以获取标注训练样本集合。
122.步骤s204:利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型;
123.具体过程如上所述,此处不再赘述。
124.根据一些实施例,图5示出本技术一个实施例的一种第一nlp模型的获取流程图。如图5所示,利用无标注样本集合对第三nlp模型进行训练,可以令第三nlp模型学习无标注样本集合中的共性,得到第四nlp模型。之后,再使用标注训练样本集合对第四nlp模型的模型参数进行调整。这种情况下,模型只需要从无标注样本集合中的共性出发,去学习标注训练样本集合即可。因此可以提高模型训练的效率,可以提高第一nlp模型进行招投标信息校正时的准确性。
125.易于理解的是,当终端获取到标注训练样本集合时,终端可以利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型。
126.步骤s205:通过机器人流程自动化rpa系统,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集;
127.具体过程如上所述,此处不再赘述。
128.根据一些实施例,当终端获取招投标信息子集时,终端获取招投标信息集合中不满足信息条件的至少一个招投标信息的方式例如可以为通过第一nlp模型的方式、通过筛选条件集合的方式、通过抽检的方式。
129.在一些实施例中,当终端通过第一nlp模型的方式获取招投标信息子集时,终端可以通过第一nlp模型获取招投标信息集合中的任一招投标信息对应的置信度;若任一招投标信息对应的置信度低于置信度阈值,则将招投标信息添加至招投标信息子集。因此终端可以通过判断置信度与置信度阈值大小的方式判断招投标信息是否满足信息条件,因此可以提高招投标信息子集获取的准确性。
130.在一些实施例中,置信度指的是抽取信息对应的可信程度。该置信度并不特指某一固定置信度。例如,当招投标信息发生变化时,该置信度也可以发生变化。当第一nlp模型发生变化时,该置信度也可以发生变化。
131.在一些实施例中,终端可以根据下式获取任一招投标信息对应的置信度:
[0132][0133]
其中,si为招投标信息i对应的置信度,ei为招投标信息i对应的实际评分,∑
jej

招投标信息i对应的标准评分。
[0134]
例如,当终端通过第一nlp模型的方式获取招投标信息子集时,终端可以获取到招投标信息集合中招投标信息a的置信度为a1,若a1小于置信度阈值,则将招投标信息a添加至招投标信息子集;终端还可以获取到招投标信息集合中招投标信息b的置信度为b1,若b1不小于置信度阈值,则不将招投标信息b添加至招投标信息子集。
[0135]
在一些实施例中,当终端通过筛选条件集合的方式获取招投标信息子集时,终端可以获取招投标信息集合对应的筛选条件集合;在招投标信息集合获取不满足筛选条件集合中任一筛选条件的至少一个招投标信息,得到招投标信息子集。因此可以提高招投标信息子集获取的准确性。
[0136]
例如,当筛选条件集合包括存在招标金额信息、存在招标截止时间时,若终端获取到招投标信息集合中不存在“招标金额信息”对应的招投标信息时,则终端可以将“招标金额信息”添加至招投标信息子集。或者,当终端获取到招投标信息集合中的“招标截止时间”对应的招投标信息不完整,例如,仅有日期信息、仅有分钟信息、仅有小时信息等等,则终端可以将该招投标信息添加至招投标信息子集。在一些实施例中,终端可以同时通过第一nlp模型和筛选条件集合的方式获取招投标信息子集,如图6所示。只有招投标信息集合中的任一招投标信息对应的置信度不小于置信度阈值,以及同时满足筛选条件集合中所有筛选条件时,终端才不将该任一招投标信息添加至招投标信息子集。因此可以提高招投标信息子集获取的准确性。
[0137]
例如,若终端获取到招投标信息集合中招投标信息c的置信度为c1,c1不小于置信度阈值,但是招投标信息c不满足筛选条件集合中的筛选条件c2,则终端将招投标信息c添加至招投标信息子集。若终端获取到招投标信息集合中的招投标信息d满足筛选条件集合中的所有筛选条件,但是招投标信息d的置信度为d1小于置信度阈值,则终端将招投标信息d添加至招投标信息子集。
[0138]
在一些实施例中,当终端通过抽检的方式获取招投标信息子集时,终端可以对招投标信息集合进行抽检,获取抽检后的招投标信息集合;获取针对抽检后的招投标信息集合中任一招投标信息所输入的抽检结果信息;若抽检结果信息指示任一招投标信息不满足信息条件,则将任一招投标信息添加至招投标信息子集。因此可以提高招投标信息子集获取的准确性。
[0139]
在一些实施例中,当终端对招投标信息集合进行抽检时,抽检的方式包括但不限于周期检查、不定周期检查、固定数量检查等等。
[0140]
例如,终端可以每隔3天对招投标信息集合进行抽检,获取抽检后的招投标信息集合;终端还可以每隔随机天数对招投标信息集合进行抽检,获取抽检后的招投标信息集合;终端还可以每当招投标信息集合中的招投标信息的数量达到预设数量阈值时,对招投标信息集合进行抽检,获取抽检后的招投标信息集合。
[0141]
易于理解的是,当用户需要获取招投标文档中的招投标信息时,用户可以通过终端获取招投标文档对应的招投标信息集合。当终端获取到招投标信息集合时,终端可以获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集。
[0142]
步骤s206:获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;
[0143]
具体过程如上所述,此处不再赘述。
[0144]
根据一些实施例,当终端获取到招投标信息子集时,终端可以在信息校正界面展示招投标信息子集中至少一个招投标信息。当用户打开校正界面时,用户可以在任一招投标信息对应的校正窗口输入该任一招投标信息对应的校正信息,如图7所示。
[0145]
易于理解的是,当终端获取到招投标信息子集时,终端可以获取针对招投标信息子集中至少一个招投标信息所输入的校正信息。
[0146]
步骤s207:基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合;
[0147]
具体过程如上所述,此处不再赘述。
[0148]
例如,当终端获取到招投标信息e1对应的校正信息e2时,终端可以基于校正信息e2对招投标信息e1进行校正,并将校正后的招投标信息e2放入招投标校正集合。当终端获取到招投标信息f1对应的校正信息f2时,终端可以基于校正信息f2对招投标信息f1进行校正,并将校正后的招投标信息f2放入招投标校正集合。
[0149]
易于理解的是,当终端获取到针对招投标信息子集中至少一个招投标信息所输入的校正信息时,终端可以基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
[0150]
步骤s208:基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型;
[0151]
根据一些实施例,第二nlp模型指的是对第一nlp模型进行迭代后得到的nlp模型。该第二nlp模型并不特指某一固定模型。例如,当第一nlp模型发生变化时,该第二nlp模型也可以发生变化。当对第一nlp模型的迭代方式发生变化时,该第二nlp模型也可以发生变化。
[0152]
根据一些实施例,当终端获取到招投标校正集合时,终端可以获取招投标校正集合中至少一个招投标信息的信息数量。若终端获取到的信息数量大于信息数量阈值,则对第一nlp模型进行增量训练,得到第二nlp模型,并清空招投标校正集合。因此,终端可以采用第二nlp模型进行招投标信息校正,可以提高招投标信息校正的准确性。
[0153]
例如,当终端设置的信息数量阈值为50时,若终端获取到的招投标校正集合的信息数量为50时,终端可以对第一nlp模型进行增量训练,得到第二nlp模型,并清空招投标校正集合。
[0154]
在一些实施例中,当终端对第一nlp模型进行增量训练时,终端可以将招投标校正集合作为训练样本集合;基于训练样本集合,对第一nlp模型的模型参数进行调整,得到第二nlp模型。因此可以通过参数调整的方式对第一nlp模型进行增量训练,可以提高第二nlp模型获取的准确性。
[0155]
易于理解的是,当终端获取到招投标校正集合时,终端可以基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型。
[0156]
在本技术实施例中,通过获取无标注训练样本集合;利用无标注训练样本集合对第三nlp模型进行训练,得到第四nlp模型;获取标注训练样本集合;利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型;因此可以提高模型训练的效率,可以提高第一nlp模型进行招投标信息校正时的准确性。获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集;获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;基于校正信息对至少一个招投标信息进行校正,获取
招投标校正集合;因此可以提高招投标信息校正的准确性。基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型;因此终端可以通过第二nlp模型进行招投标信息校正,可以减少不满足信息条件的招投标信息的获取情况,可以减少仅基于nlp模型和/或筛选条件集合获取的信息不准确的情况,可以针对nlp模型和/或筛选条件集合获取的信息进行调整,可以提高针对出现新的格式、新的领域词汇、新的表达方式的信息资源进行招投标信息校正时,获取的信息的准确性,进而提高用户的使用体验。
[0157]
下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
[0158]
请参见图8,其是本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。该结合rpa及ai的招投标信息校正装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该结合rpa及ai的招投标信息校正装置800包括子集获取单元801、招投标信息校正单元802和信息校正单元803,其中:
[0159]
子集获取单元801,用于通过机器人流程自动化rpa系统,获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;
[0160]
招投标信息校正单元802,用于获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;
[0161]
信息校正单元803,用于基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。
[0162]
根据一些实施例,图9示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图9所示,子集获取单元801包括置信度获取子单元811和信息添加子单元821,子集获取单元801用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
[0163]
置信度获取子单元811,用于通过第一nlp模型获取招投标信息集合中的任一招投标信息对应的置信度;
[0164]
信息添加子单元821,用于若任一招投标信息对应的置信度低于置信度阈值,则将招投标信息添加至招投标信息子集。
[0165]
根据一些实施例,图10示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图10所示,子集获取单元801还包括集合获取子单元831和信息筛选子单元841,子集获取单元801用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
[0166]
集合获取子单元831,用于获取招投标信息集合对应的筛选条件集合;
[0167]
信息筛选子单元841,用于在招投标信息集合获取不满足筛选条件集合中任一筛选条件的至少一个招投标信息,得到招投标信息子集。
[0168]
根据一些实施例,图11示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图11所示,子集获取单元801还包括集合抽检子单元851、结果获取子单元861和条件判断子单元871,子集获取单元801用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集时:
[0169]
集合抽检子单元851,用于对招投标信息集合进行抽检,获取抽检后的招投标信息
集合;
[0170]
结果获取子单元861,用于获取针对抽检后的招投标信息集合中任一招投标信息所输入的抽检结果信息;
[0171]
条件判断子单元871,用于若抽检结果信息指示任一招投标信息不满足信息条件,则将任一招投标信息添加至招投标信息子集。
[0172]
根据一些实施例,图12示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图12所示,招投标信息校正装置800还包括:
[0173]
模型迭代单元804,用于基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型。
[0174]
根据一些实施例,图13示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图13所示,模型迭代单元804包括数量获取子单元814和模型训练子单元824,模型迭代单元804用于基于招投标校正集合对第一自然语言处理nlp模型进行迭代,得到第二nlp模型时:
[0175]
数量获取子单元814,用于获取招投标校正集合中至少一个招投标信息的信息数量;
[0176]
模型训练子单元824,用于若信息数量大于信息数量阈值,则对第一nlp模型进行增量训练,得到第二nlp模型,并清空招投标校正集合。
[0177]
根据一些实施例,图14示出本技术一个实施例的一种结合rpa及ai的招投标信息校正装置的结构示意图。如图14所示,招投标信息校正装置800还包括样本获取单元805、模型获取单元806、标注样本获取单元807和模型调整单元808,用于在获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集之前:
[0178]
样本获取单元805,用于获取无标注训练样本集合;
[0179]
模型获取单元806,用于利用无标注训练样本集合对第三nlp模型进行训练,得到第四nlp模型;
[0180]
标注样本获取单元807,用于获取标注训练样本集合;
[0181]
模型调整单元808,用于利用标注训练样本集合,对第四nlp模型的模型参数进行调整,得到第一nlp模型。
[0182]
本技术实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
[0183]
在本技术实施例中,通过子集获取单元,用于获取招投标信息集合中不满足信息条件的至少一个招投标信息,得到招投标信息子集,信息条件包括第一自然语言处理nlp模型和/或筛选条件集合;信息获取单元,用于获取针对招投标信息子集中至少一个招投标信息所输入的校正信息;信息校正单元,用于基于校正信息对至少一个招投标信息进行校正,获取招投标校正集合。因此,通过获取不满足信息条件的招投标信息,并对招投标信息进行校正,可以提高针对出现新的格式、新的领域词汇、新的表达方式的信息资源进行招投标信息校正时,获取的信息的准确性,进而提高用户的使用体验。
[0184]
图15示出根据本技术一实施例的一种终端的结构框图。如图15所示,该终端包括:存储器1510和处理器1520,存储器1510内存储有可在处理器1520上运行的计算机程序。处理器1520执行该计算机程序时实现上述实施例中的结合rpa及ai的招投标信息校正方法。
存储器1510和处理器1520的数量可以为一个或多个。
[0185]
该终端还包括:
[0186]
通信接口1530,用于与外界设备进行通信,进行数据交互传输。
[0187]
如果存储器1510、处理器1520和通信接口1530独立实现,则存储器1510、处理器1520和通信接口1530可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(industry standard architecture,isa)总线、外部设备互连(peripheral component interconnect,pci)总线或扩展工业标准体系结构(extended industry standard architecture,eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图15中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0188]
可选的,在具体实现上,如果存储器1510、处理器1520及通信接口1530集成在一块芯片上,则存储器1510、处理器1520及通信接口1530可以通过内部接口完成相互间的通信。
[0189]
本技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本技术实施例中提供的方法。
[0190]
本技术实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本技术实施例提供的方法。
[0191]
本技术实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
[0192]
应理解的是,上述处理器可以是中央处理器(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processing,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(fieldprogrammablegate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced risc machines,arm)架构的处理器。
[0193]
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以包括随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用。例如,静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic random access memory,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data date sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。
[0194]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品
包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本技术的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
[0195]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本技术的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0196]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0197]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
[0198]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
[0199]
应理解的是,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0200]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
[0201]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1