本发明涉及互联网数据信息处理,具体为一种招投标信息抽取结果筛选系统及方法。
背景技术:
1、当前,随着互联网技术的发展,越来越多企业和单位开始利用互联网发布招投标信息。随着信息量的急剧增长,投标人越来越依赖招投标检索、推送服务来获得相关的招投标信息。
2、但是现有的招投标信息检索在数据准确性、精准匹配等方面存在着很多不足之处。一般通过网络爬虫采集到的招投标数据,抽取的过程可能会匹配到多个疑似结果,很难选出较为准确且合理的结果。
3、目前常见的选取方案有:
4、1)首个确定原则:匹配到的第一个结果,作为最终结果;
5、2)随机原则:对于多个匹配的结果,随机选择一个作为最终结果。这两种办法很类似,均存在很大不确定因素,选取的最终结果,不一定是最佳。
6、为此提出了一种招投标信息抽取结果筛选系统及方法。
技术实现思路
1、针对现有技术的不足,本发明提供一种招投标信息抽取结果筛选系统及方法,提高招投标信息检索的准确性。
2、为实现上述目的,本发明提供如下技术方案:一种招投标信息抽取结果筛选系统,包括参数模块、录入模块、数据库、对比模块、评分模块和输出模块,其中:
3、参数模块:用于设定招投标信息的相应参数;
4、录入模块:用于根据参数模块设定的相应参数,将对应招投标信息录入数据库中;
5、数据库:用于储存招投标信息数据,并对储存的招投标信息进行不同信息的分类;
6、对比模块:用于根据参数模块设定的相应参数,基于数据库中分类的招投标信息,进行分类对比;
7、评分模块:用于对招投标信息的分类信息与参数模块设定的相应参数差值,进行分类评分;
8、输出模块:用于提取数据库中招投标信息评分最优的单项分类信息,并将信息汇总作为最终的抽取结果。
9、优选地,参数模块设定的参数包括招投标信息的区域、时间范围和类型。
10、优选地,数据库包括储存模块,储存模块用于储存历史招投标数据,并提取其中招投标的区域信息、时间范围信息和类型信息。
11、优选地,对比模块通过字符长度、正/负面词、数值范围、段落索引和字段标签参数模块设定的相应参数和数据库中分类的储存招投标信息进行对比。
12、优选地,评分模块根据参数模块设定的相应参数,基于相应参数中的字符长度、正/负面词、数值范围、段落索引和字段标签与数据库中的招投标信息分类后的区域信息、时间范围信息和类型信息对比差值范围进行评分。
13、优选地,输出模块将数据库中评分最优单项分类招投标信息输出至excel表格展示。
14、优选地,对比模块基于参数模块输入的相应参数的类型与储存模块中对应类型的历史招投标数据对比并基于评分模块获得评分最优历史招投标数据,评分最优历史招投标数据基于输出模块输出至excel表格并与评分最优单项分类招投标信息对比。
15、一种招投标信息抽取结果筛选方法,包括以下步骤:
16、s1:基于计算机将用户需要的招投标信息相应参数输入参数模块;
17、s2:基于相应参数录入模块将相应信息通过网页进行爬取输入数据库;
18、s3:数据库基于参数模块设定的参数对储存和输入的招投标信息进行不同信息的分类;
19、s4:对比模块基于参数模块输入的相应参数对数据库中分类的招投标信息进行对比;
20、s5:评分模块根据对比模块对数据库中分类的招投标信息和历史招投标数与参数模块设定的相应参数对比信息差值进行评分,评分高低基于对比信息的差值。
21、s6:输出模块将数据库中评分最优的单项分类招投标信息和评分最优历史招投标数据输出至excel表格展示并对比,基于评分最优历史招投标数据和最优的单项分类招投标信息对比获得输入参数调整差值,基于输入参数调整差值调整参数模块设定的相应参数,并基于输出模块展示出修改后的最优的单项分类招投标信息,展示的信息为最终抽取结果。
22、与现有技术对比,本发明具备以下有益效果:
23、本发明通过设置参数模块、录入模块、数据库、对比模块、评分模块和输出模块,可根据用户需要,将对应的招投标信息进行抓取并进行分类对比,再根据需要将对比结果进行评分,最终将最优单项招投标信息分类的结果输出,获得最优的招投标信息,筛选自由度高,范围广,能自动抽取最优结果,提高招投标信息检索的准确性。
24、本发明通过设置对比模块基于相应参数中的字符长度、正/负面词、数值范围、段落索引和字段标签与数据库中的招投标信息分类后的区域信息、时间范围信息和类型信息对比,可将用户需要的招投标信息准确的抽取出,减少筛选误差,提高准确性。
25、本发明完全无需人工筛选,大大减少了人工核对的工作量,有利于在保证质量的前提下提高工作效率。
26、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
1.一种招投标信息抽取结果筛选系统,其特征在于,包括参数模块、录入模块、数据库、对比模块、评分模块和输出模块,其中:
2.根据权利要求1所述的一种招投标信息抽取结果筛选系统,其特征在于,参数模块设定的参数包括招投标信息的区域、时间范围和类型。
3.根据权利要求2所述的一种招投标信息抽取结果筛选系统,其特征在于,数据库包括储存模块,储存模块用于储存历史招投标数据,并提取其中招投标的区域信息、时间范围信息和类型信息。
4.根据权利要求3所述的一种招投标信息抽取结果筛选系统,其特征在于,对比模块通过字符长度、正/负面词、数值范围、段落索引和字段标签参数模块设定的相应参数和数据库中分类的储存招投标信息进行对比。
5.根据权利要求4所述的一种招投标信息抽取结果筛选系统,其特征在于,评分模块根据参数模块设定的相应参数,基于相应参数中的字符长度、正/负面词、数值范围、段落索引和字段标签与数据库中的招投标信息分类后的区域信息、时间范围信息和类型信息对比差值范围进行评分。
6.根据权利要求5所述的一种招投标信息抽取结果筛选系统,其特征在于,输出模块将数据库中评分最优单项分类招投标信息输出至excel表格展示。
7.根据权利要求6所述的一种招投标信息抽取结果筛选系统,其特征在于,对比模块基于参数模块输入的相应参数的类型与储存模块中对应类型的历史招投标数据对比并基于评分模块获得评分最优历史招投标数据,评分最优历史招投标数据基于输出模块输出至excel表格并与评分最优单项分类招投标信息对比。
8.一种招投标信息抽取结果筛选方法,其特征在于,包括以下步骤: