基于公开信息执行项目数据处理方法及系统与流程

文档序号:31855571发布日期:2022-10-19 02:42阅读:82来源:国知局
基于公开信息执行项目数据处理方法及系统与流程

1.本发明涉及大数据领域,具体涉及一种基于公开信息执行项目数据处理方法及系统。


背景技术:

2.信息公开是指国家行政机关和法律、法规以及规章授权和委托的组织,在行使国家行政管理职权的过程中,通过法定形式和程序。因此很多项目信息均需要进行公开,例如招标数据,现有的方法无法通过公开信息来执行项目数据的管理,进而影响项目的招标,降低用户的体验度。


技术实现要素:

3.本发明实施例提供了一种基于公开信息执行项目数据处理方法及系统,可以通过公开信息执行项目数据的管理,提高了用户体验度。
4.第一方面,本发明实施例提供一种基于公开信息执行项目数据处理方法,所述方法包括如下步骤:终端搜索在设定时间区间的海量公开信息,对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;终端从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;终端将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。
5.第二方面,提供一种基于公开信息执行项目数据处理系统,所述系统包括:搜索单元,用于搜索在设定时间区间的海量公开信息;处理单元,用于对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。
6.第三方面,提供一种计算机可读存储介质,其存储用于电子数据交换的程序,其中,所述程序使得终端执行第一方面提供的方法。
7.实施本发明实施例,具有如下有益效果:可以看出,本技术提供的技术方案终端搜索在设定时间区间的海量公开信息,对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;终端从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;终端将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分
别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。因此本技术的技术方案能够通过分类、关键字等等对公开信息进行项目信息(招标信息)的分类存储管理,提高用户体验度,便于后续的分类推荐,提高用户体验度。
附图说明
8.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
9.图1是一种终端的结构示意图;图2是一种基于公开信息执行项目数据处理方法的流程示意图;图3是一种基于公开信息执行项目数据处理系统的结构示意图。
具体实施方式
10.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
11.本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
12.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
13.参阅图1,图1提供了一种终端,该终端可以为ios、安卓等系统的终端,当然也可以为其他系统的终端,例如鸿蒙等等,本技术并不限制上述具体的系统,如图1所示,上述终端设备具体可以包括:处理器、存储器、显示屏、通信电路和音频组件(可选的),上述部件可以通过总线连接,也可以通过其他方式连接,本技术并不限制上述连接的具体方式。
14.上述终端可以通过网络设备连接互联网,进而通过互联网来获取对应的公开信息。
15.上述网络设备可以是用于与终端通信的设备,该网络设备可以是lte系统中的演进型基站(evoled nodeb),还可以是云无线接入网络(cloud radio access network,cran)场景下的无线控制器,或者该网络设备可以为中继设备、接入点、车载设备、可穿戴设备以及未来5g网络中的网络设备或者未来演进的plmn网络中的网络设备,5g系统中的基站的一个或一组(包括多个天线面板)天线面板,或者,还可以为构成gnb或传输点的网络节点,如基带单元(baseband unit,bbu),或,分布式单元(distributed unit,du)等,本技术
实施例并不限定。
16.无线通信系统可以是:全球移动通讯(globalsystemof mobilecommunication,gsm)系统、码分多址(codedivisionmultipleaccess,cdma)系统、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)系统、通用分组无线业务(generalpacketradioservice,gprs)、长期演进(longtermevolution,lte)系统、先进的长期演进(advancedlongtermevolution,lte-a)系统、新空口(newradio,nr)系统、nr系统的演进系统、免授权频谱上的lte系统(lte-basedaccesstounlicensed spectrum,lte-u)、免授权频谱上的nr系统、通用移动通信系统(universalmobiletelecommunicationsystem,umts)、下一代通信系统或其他通信系统等。
17.参阅图2,图2提供了一种基于公开信息执行项目数据处理方法,该方法如图2所示,该方法可以在通信系统中完成,该通信系统可以包括:终端和网络设备,也可以为数据中心,终端与网络设备通过无线方式连接;该无线方式具体可以为无线通信系统,上述终端可以为手机、计算机、服务器等等设备。
18.上述方法如图2所示,具体可以包括:步骤s201、终端搜索在设定时间区间的海量公开信息,对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;示例的,上述分词处理可以通过通用的分词处理方法来处理,这里不再赘述。
19.步骤s202、终端从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;上述终端从海量的关键字中筛选出具有项目信息的多个关键字具体可以包括:终端从海量的关键字中提取属于项目信息列表中的关键字确定为该多个关键字。
20.上述项目信息列表具体可以包括:属于项目信息的预设的关键字,可以由各个厂家自行维护。
21.步骤s203、终端将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。
22.本技术提供的技术方案终端搜索在设定时间区间的海量公开信息,对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;终端从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;终端将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。因此本技术的技术方案能够通过分类、关键字等等对公开信息进行项目信息(招标信息)的分类存储管理,提高用户体验度,便于后续的分类推荐,提高用户体验度。
23.示例的,上述终端将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息具体可以包括:终端将n个公开信息分别输入到支持向量机中进行分类识别确定属于招标类型的公开信息,然后对属于招标类型的公开信息执行招标项目名称的提取得到多个招标项目名称,将多个招标项目名称中相同的招标项目仅保留一个得到m个招标项目,确定该m个招标项目对应的公开信息为该m个公开信息。
24.例如,海量招标信息中包含,招标项目名称“北京地铁20号线招标”,该北京地铁20号线的关键字为北京地铁20号线,若具有3个公开信息均出现了该招标项目名称,则只需要将3个公开信息中保留一个公开信息即可。
25.示例的,上述将多个招标项目名称中相同的招标项目仅保留一个得到m个招标项目具体可以包括:获取相同的招标项目的公开信息的多个公开单位,对多个公开单位中查找与该招标项目的开标单位匹配的1个公开单位对应的招标项目保留,遍历多个招标项目名称直至得到不相同的m个招标项目。
26.示例的,上述对多个公开单位中查找与该招标项目名称的开标单位匹配的1个公开单位的实现方法具体可以包括:查询多个公开单位的网址,对该网址进行识别确定该公开单位的性质,若该性质与该招标项目名称匹配则确定性质匹配的单位为匹配的1个公开单位。
27.例如网址后缀为gov即可以确定为政府单位,上述性质具体可以包括:上市公司、普通公司、政府单位、咨询公司。
28.例如,招标项目名称“北京地铁20号线招标”,具有3个单位,3个单位分别为:政府单位、咨询公司、咨询公司,则确定该政府单位为该1个公开单位。
29.示例的,上述方法还可以包括:终端将该m个公开信息按多个行业推荐给与多个行业匹配的公司。
30.示例的,上述多个招标项目名称中相同的招标项目名称具体可以包括:提取多个招标项目中的任意二个招标项目名称对应的第一公开信息和第二公开信息,提取第一公开信息的多个关键信息对应的多个权重值,将多个权重值组成权重向量,将该权重向量与预设的向量执行向量乘积运算得到第一乘积结果,提取第二公开信息的多个关键信息对应的多个权重值;将多个权重值组成权重向量,将该权重向量与预设的向量执行向量乘积运算得到第二乘积结果,计算第一乘积结果与第二乘积结果之间的差值,若差值小于第一阈值,且该第一公开信息和第二公开信息的招标项目名称也相同,确定该任意二个招标项目相同,若差值大于第一阈值,确定该任意二个招标项目不相同,遍历多个招标项目得到多个招标项目名称中相同的招标项目。
31.此技术方案避免了招标项目名称相同,但是实质内容不同,例如地铁20号线招标,其名称都是相同的,但是其实际内容可能不同,例如可以是地铁20号线的盾构项目的招标,也可以是地铁20号线的轨道的招标,也可以是其他的分项的招标。
32.参阅图3,图3提供一种基于公开信息执行项目数据处理系统的结构示意图,所述系统包括:搜索单元301,用于搜索在设定时间区间的海量公开信息;处理单元302,用于对该海量公开信息分别进行分词处理得到该海量公开信息对应的海量的关键字;从海量的关键字中筛选出具有项目信息的多个关键字,提取该多个关键字对应的n个公开信息;将n个公开信息分别进行分类识别确定属于招标类型的m个公开信息,对m个公开信息分别执行项目类型识别确定m个公开信息对应的多个行业,依据该多个行业将该m个公开信息分类存储。
33.示例的,
所述处理单元,具体用于将n个公开信息分别输入到支持向量机中进行分类识别确定属于招标类型的公开信息,然后对属于招标类型的公开信息执行招标项目名称的提取得到多个招标项目名称,将多个招标项目名称中相同的招标项目仅保留一个得到m个招标项目,确定该m个招标项目对应的公开信息为该m个公开信息。
34.示例的,所述处理单元,具体用于获取相同的招标项目的公开信息的多个公开单位,对多个公开单位中查找与该招标项目的开标单位匹配的1个公开单位对应的招标项目保留,遍历多个招标项目名称直至得到不相同的m个招标项目。
35.示例的,所述处理单元,具体用于查询多个公开单位的网址,对该网址进行识别确定该公开单位的性质,若该性质与该招标项目名称匹配则确定性质匹配的单位为匹配的1个公开单位。
36.示例的,所述处理单元,具体用于提取多个招标项目中的任意二个招标项目名称对应的第一公开信息和第二公开信息,提取第一公开信息的多个关键信息对应的多个权重值,将多个权重值组成权重向量,将该权重向量与预设的向量执行向量乘积运算得到第一乘积结果,提取第二公开信息的多个关键信息对应的多个权重值;将多个权重值组成权重向量,将该权重向量与预设的向量执行向量乘积运算得到第二乘积结果,计算第一乘积结果与第二乘积结果之间的差值,若差值小于第一阈值,且该第一公开信息和第二公开信息的招标项目名称也相同,确定该任意二个招标项目相同,若差值大于第一阈值,确定该任意二个招标项目不相同,遍历多个招标项目得到多个招标项目名称中相同的招标项目。
37.示例的,本技术实施例中的处理单元还可以用于执行如图2所示实施例的细化方案、可选方案等,这里不再赘述。
38.本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种基于公开信息执行项目数据处理方法的部分或全部步骤。
39.本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种基于公开信息执行项目数据处理方法的部分或全部步骤。
40.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以接收其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选 实施例,所涉及的动作和模块并不一定是本发明所必须的。
41.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
42.在本技术所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可
以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
43.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-only memory ,简称:rom)、随机存取器(英文:random access memory,简称:ram)、磁盘或光盘等。
44.以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1