本发明属于文件处理,具体涉及一种基于区块链的招标文件生成方法。
背景技术:
1、区块链技术在近些年持续发展,其本质是一个共享的数据库,存储数据信息或交易记录,具有可追溯、不可篡改、公开透明等特点,因此可以用于保存招标文件。招标文件需要包括招标的项目的具体情况、要求以及中标后合同格式等等,并提供统一格式,以利于投标。并且招标文件的内容需要合法合规,然而现有招标文件生成方法多采用人工撰写及检查,容易出现纰漏。
技术实现思路
1、本发明为了解决以上问题,提出了一种基于区块链的招标文件生成方法。
2、本发明的技术方案是:一种基于区块链的招标文件生成方法包括以下步骤:
3、s1、获取若干个历史招标文件的存储信息,并根据若干个历史招标文件的存储信息确定内容敏感阈值;
4、s2、获取空白招标文档模板以及待处理招标内容;
5、s3、对待处理招标内容进行拆分,生成待处理文本内容和待处理图像内容;
6、s4、根据内容敏感阈值,对待处理文本内容进行预处理,生成标准文本内容;对待处理图像内容进行去噪处理,生成标准图像内容;
7、s5、将标准文本内容和标准图像内容填入空白招标文档模板中,生成标准招标文档;
8、s6、为标准招标文档生成特征信息,并将标准招标文档和特征信息打包为文件交易区块,将文件交易区块加入区块链进行广播发布。
9、进一步地,s1中,历史招标文件的存储信息包括项目名称、项目内容以及项目内容中已剔除的单词。
10、进一步地,s1包括以下子步骤:
11、s11、提取各个历史招标文件的项目内容中所有关键词,为各个历史招标文件生成项目关键词集合;
12、s12、根据各个历史招标文件的项目关键词集合以及项目名称,计算各个历史招标文件的项目内容匹配度,生成项目内容匹配度集合;
13、s13、根据项目内容匹配度集合以及各个历史招标文件的项目内容中已剔除的单词,计算内容敏感阈值。
14、上述进一步方案的有益效果是:在本发明中,根据历史招标文件的项目名称与项目关键词集合,确定可以表征项目名称与项目关键词集合关联度的参数,即项目内容匹配度,再将项目内容匹配度与生成历史招标文件过程中已删除的敏感词汇做运算,确定内容敏感阈值,其可以用于筛选敏感词汇,保证生成的招标文件的合规性。
15、进一步地,s12中,历史招标文件的项目内容匹配度p的计算公式为:;式中,m表示历史招标文件的项目关键词个数,n表示项目名称与项目关键词集合中相同单词的个数,ε表示极小值,m表示项目内容的单词个数,c表示常数。
16、进一步地,s13中,内容敏感阈值ω的计算公式为:;式中,pk表示第k个历史招标文件的项目内容匹配度,max(·)表示最大值运算,k表示历史招标文件的个数,rk表示第k个历史招标文件的项目内容中已剔除的单词个数,mk表示第k个历史招标文件的项目内容的单词个数,log(·)表示对数函数。
17、进一步地,s4包括以下子步骤:
18、s41、提取待处理文本内容中所有关键词,生成文本关键词集合;
19、s42、根据文本关键词集合以及所有历史招标文件的项目关键词集合,计算待处理文本内容的单词关键权重;
20、s43、根据待处理文本内容的单词关键权重,计算待处理文本内容中各个单词的敏感权重;
21、s44、将大于内容敏感阈值的敏感权重对应的单词删除,完成对待处理文本内容的预处理,生成标准文本内容;
22、s45、对待处理图像内容进行去噪处理,生成标准图像内容。
23、上述进一步方案的有益效果是:在本发明中,利用待处理文本内容的关键词来确定整个文本内容的单词关键权重,利用整个文本内容的单词关键权重来确定各个单词的敏感权重,再与之前确定的内容敏感阈值做大小比较,即可剔除敏感权重不正常的单词,保证标准文本内容中尽可能少的包含敏感词汇。
24、进一步地,s42中,待处理文本内容的单词关键权重σ的计算公式为:;式中,x表示文本关键词集合,y表示所有历史招标文件的项目关键词集合,a表示待处理文本内容的单词个数,b表示文本关键词集合的关键词个数,fb表示待处理文本内容中第b个关键词的逆文档频率。
25、进一步地,s43中,待处理文本内容中第a个单词的敏感权重λa的计算公式为:;式中,fa表示待处理文本内容中第a个单词的词频,a表示待处理文本内容的单词个数,σ表示待处理文本内容的单词关键权重。
26、进一步地,s6中,标准招标文档的特征信息包括标准招标文档的所有关键词以及各个关键词的词频。
27、本发明的有益效果是:本发明公开了一种基于区块链的招标文件生成方法,利用历史招标文件的敏感词汇以及内容确定一个可以帮助筛选不符合要求单词的内容敏感阈值,通过内容敏感阈值与待处理招标内容中各个单词的敏感权重之间进行大小比较并进行剔除处理,就可以生成符合要求的标准招标文档;另外,本发明还对招标文件的图片进行预处理,保证招标文件中图片的清晰度;经过上述过程生成的招标文件清楚明了地展示项目内容,符合规范。
1.一种基于区块链的招标文件生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述s1中,历史招标文件的存储信息包括项目名称、项目内容以及项目内容中已剔除的单词。
3.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述s1包括以下子步骤:
4.根据权利要求3所述的基于区块链的招标文件生成方法,其特征在于,所述s12中,历史招标文件的项目内容匹配度p的计算公式为:;式中,m表示历史招标文件的项目关键词个数,n表示项目名称与项目关键词集合中相同单词的个数,ε表示极小值,m表示项目内容的单词个数,c表示常数。
5.根据权利要求3所述的基于区块链的招标文件生成方法,其特征在于,所述s13中,内容敏感阈值ω的计算公式为:;式中,pk表示第k个历史招标文件的项目内容匹配度,max(·)表示最大值运算,k表示历史招标文件的个数,rk表示第k个历史招标文件的项目内容中已剔除的单词个数,mk表示第k个历史招标文件的项目内容的单词个数,log(·)表示对数函数。
6.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述s4包括以下子步骤:
7.根据权利要求6所述的基于区块链的招标文件生成方法,其特征在于,所述s42中,待处理文本内容的单词关键权重σ的计算公式为:;式中,x表示文本关键词集合,y表示所有历史招标文件的项目关键词集合,a表示待处理文本内容的单词个数,b表示文本关键词集合的关键词个数,fb表示待处理文本内容中第b个关键词的逆文档频率。
8.根据权利要求6所述的基于区块链的招标文件生成方法,其特征在于,所述s43中,待处理文本内容中第a个单词的敏感权重λa的计算公式为:;式中,fa表示待处理文本内容中第a个单词的词频,a表示待处理文本内容的单词个数,σ表示待处理文本内容的单词关键权重。
9.根据权利要求1所述的基于区块链的招标文件生成方法,其特征在于,所述s6中,标准招标文档的特征信息包括标准招标文档的所有关键词以及各个关键词的词频。