一种基于互联网数据库的政策数据信息搜索系统的制作方法

文档序号:28922439发布日期:2022-02-16 13:33阅读:134来源:国知局
一种基于互联网数据库的政策数据信息搜索系统的制作方法

1.本发明涉及数据处理技术领域,尤其涉及一种基于互联网数据库的政策数据信息搜索系统。


背景技术:

2.近几年,为增强企业自主创新能力,提高科技创新水平,国家、省、市区政府先后出台了一系列支持企业科技创新、成果转化、创新创业的政策。为打破政府部门之间存在的信息孤岛和数据分割的局面,方便用户快速了解最新的、所有的政策通知,国内一些科技政策服务平台把这些分布在各区域政府网站上的政策采集整理到一个平台上,并按区域、文件类型进行分类展示,这样可以省去用户到不同网站查看政策的麻烦,节省不少时间。随着互联网普及率的提升,各大商家的广告也是层出不穷,用户在查找有效的信息时较为困难,无法便捷的搜索到有用的政策信息,由于政策的特殊性,需辨识其真实性,否则会出现不必要的信息隐患。
3.经检索,中国专利申请号为cn201910708022.6的专利,公开了智能的政策信息采集和查询方法,包括网络爬虫工具抓取全国各地政府网站上与科技政策有关的网页内容和附件,并将抓取到的网页内容和附件存储到高企云政策库中;政策定时调度模块从高企云政策库获取网页内容和附件并存放到elasticsearch服务器;文件内容提取模块将elasticsearch服务器的网页内容和附件进行分析和提取。
4.上述专利中的智能的政策信息采集和查询方法存在以下不足:同等信息嘈乱,无法快速辨识及查找到所需政策信息,易出现被误导的情况。


技术实现要素:

5.本发明的目的是为了解决现有技术中存在的缺点,而提出的一种基于互联网数据库的政策数据信息搜索系统。
6.为了实现上述目的,本发明采用了如下技术方案:
7.一种基于互联网数据库的政策数据信息搜索系统,包括服务器、用于存储政策数据信息的数据库、用于收集各方政策数据信息的前处理单元、用于对收集的政策数据信息进行自动处理的后处理单元和用于向前台推送政策数据信息的推送单元,所述前处理单元和后处理单元通信连接;所述服务器和推送单元、后处理单元、数据库通信连接;
8.所述前处理单元包括利用网络爬虫技术收集全国政策数据信息的信息采集模块、用于按照统一标准归整采集的政策数据信息的整合模块和用于对归整的政策数据信息进行过滤的信息筛选过滤模块。
9.优选地:所述信息采集模块的采集来源包括国家政府部门或地方政府部门、协会组织通过公共网络渠道发布的政策信息数据;所述公共网络渠道包括官网、微信公众号、官方微博、电视新闻。
10.优选地:所述信息筛选过滤模块包括用于对归整的重复政策数据信息进行删减的
去重组和用于对采集的政策数据信息进行去杂的减负组。
11.优选地:所述后处理单元包括用于按照归一化标准对初步处理好的政策数据信息进行解构分析的信息整理模块、用于对解构分析后的政策数据信息划分类别的信息分类模块和用于展示处理好的政策数据信息的展示模块。
12.优选地:所述信息分类模块包括政策数据信息发布层级、政策数据信息发布部门和政策数据信息发布类别,所述政策数据信息发布层级包括国家级、省级、市级、区级、县级、科技园区级;所述政策数据信息发布部门包括人才、科技、教育、工信、发改;所述政策数据信息发布类别包括人才、资金扶持项目、科技研发项目、奖励、资质。
13.优选地:所述展示模块包括用于按照时间轨迹呈递进式记录相同政策数据信息演变道路的发展块、用于按照涉及人群/行业呈分支树状图记录相同政策数据信息影响范围大小的区域块和用于按照发布地区对政策数据信息进行分类整合展示的地区块;所述发展块的前台展示方法包括文字说明、曲线图演示、ppt说明。
14.优选地:所述推送单元包括用于根据客户检索内容推出查找的政策数据信息的被动推送模块和用于循环推送当时段/日的热点政策数据信息的主动推送模块。
15.优选地:所述热点政策数据信息的比重大小计算方法为:单条政策信息热点占比=(浏览阅读次数+搜索次数)/h。
16.优选地:所述推送单元还包括用于根据客户检索内容,自主在数据库内查找相关政策数据信息的智能关联模块和用于比对相关政策数据信息与目标政策数据信息或客户需求信息的关联性权重大小,并按序推送的关联推送模块。
17.优选地:所述智能关联模块用于查找相关政策数据信息的方法,包括以下内容:
18.a1:使用自然语言语义分析;
19.a2:深度学习和知识图谱技术。
20.本发明的有益效果为:
21.1.本发明采集官方发布政策信息,确保消息的真实有效性;通过信息整理模块对初步处理好的政策数据信息,按照归一化标准进行依次解构分析后,通过信息分类模块实现政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,后期通过展示模块中的多种类型进行前台展示,便于用户快速且清晰的了解每一政策信息的发展演变道路、涉及人群/行业及发布地区等内容。
22.2.本发明实现将不同层级、不同部门及不同类别的政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,提升数据质量,为用户提供政策信息的一站式服务,使用便捷,节省查找时间。
23.3.本发明用户在前台检索某政策信息时,被动推送模块推送客户所要查找的目标政策数据信息内容,主动推送模块实时自动计算现时段/日的热点政策信息,并向前台推送,减少部分用户检索时间,增加系统的功能性。
24.4.本发明用户在前台检索某政策信息时,智能关联模块根据目标政策数据信息内容自动查找相关政策数据信息,并经关联推送模块计算权重后按照先后顺序排比推出,设计更为人性化,实现海量政策的检索与查找、精准推送,加深用户对该政策信息内容更为深刻的理解。
附图说明
25.图1为本发明提出的一种基于互联网数据库的政策数据信息搜索系统的流程示意图。
具体实施方式
26.下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
27.下面详细描述本专利的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利,而不能理解为对本专利的限制。
28.实施例1:
29.一种基于互联网数据库的政策数据信息搜索系统,如图1所示,包括服务器、用于存储政策数据信息的数据库、用于收集各方政策数据信息的前处理单元、用于对收集的政策数据信息进行自动处理的后处理单元和用于向前台推送政策数据信息的推送单元,所述前处理单元和后处理单元通信连接;所述服务器和推送单元、后处理单元、数据库通信连接;通过前处理单元进行政策数据信息的采集,后处理单元对采集的政策数据信息进行多重处理、筛查后发送至数据库存储,用户进入系统查询所需政策信息时,服务器控制推送单元输出相关内容,为用户提供一站式政策查询服务,可以更便捷的查找真实有效的全国政策。
30.所述前处理单元包括利用网络爬虫等技术收集全国政策数据信息的信息采集模块、用于按照统一标准归整采集的政策数据信息的整合模块和用于对归整的政策数据信息进行过滤的信息筛选过滤模块。
31.进一步的,所述信息采集模块的采集来源包括但不限于国家政府部门或地方政府部门、协会组织等通过公共网络渠道发布的政策信息数据;
32.优选的,所述公共网络渠道包括官网、微信公众号、官方微博、电视新闻等,采集官方发布政策信息,确保消息的真实有效性。
33.再进一步的,所述信息筛选过滤模块包括用于对归整的重复政策数据信息进行删减的去重组和用于对采集的政策数据信息进行去杂(如附带广告)的减负组。
34.所述后处理单元包括用于按照归一化标准对初步处理好的政策数据信息进行解构分析的信息整理模块、用于对解构分析后的政策数据信息划分类别的信息分类模块和用于展示处理好的政策数据信息的展示模块。
35.优选的,所述归一化标准包括政策数据信息的行业/主题类型、政策数据信息的发布日期、政策数据信息的公文种类、政策数据信息的简要内容及发布地区等。
36.进一步的,所述信息分类模块包括但不限于政策数据信息发布层级、政策数据信息发布部门和政策数据信息发布类别等多种类型,所述政策数据信息发布层级包括国家级、省级、市级、区级、县级、科技园区级等;所述政策数据信息发布部门包括人才、科技、教育、工信、发改等;所述政策数据信息发布类别包括人才、资金扶持项目、科技研发项目、奖励、资质等,实现将不同层级、不同部门及不同类别的政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,提升数据质量,为用户提供政策信息的一站式服务,使用便捷,节省查找时间。
37.进一步的,所述展示模块包括用于按照时间轨迹呈递进式记录相同政策数据信息演变道路的发展块、用于按照涉及人群/行业呈分支树状图记录相同政策数据信息影响范围大小的区域块和用于按照发布地区对政策数据信息进行分类整合展示的地区块。通过信息整理模块对初步处理好的政策数据信息,按照归一化标准进行依次解构分析后,通过信息分类模块实现将不同层级、不同部门及不同类别的政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,后期通过展示模块中的多种类型进行前台展示,便于用户了解每一政策信息的发展演变道路、涉及人群/行业及发布地区等内容。
38.优选的,所述发展块的前台展示方法包括但不限于文字说明、曲线图演示、ppt说明等。
39.所述推送单元包括用于根据客户检索内容推出查找的政策数据信息的被动推送模块和用于循环推送当时段/日的热点政策数据信息的主动推送模块;
40.优选的,所述热点政策数据信息的比重大小计算方法为:单条政策信息热点占比=(浏览阅读次数+搜索次数)/h,用户在前台检索某政策信息时,被动推送模块推送客户所要查找的目标政策数据信息内容,主动推送模块实时自动计算现时段/日的热点政策信息,并向前台推送,减少部分用户检索时间,增加系统的功能性。
41.本实施例在使用时,通过前处理单元进行政策数据信息的采集,后处理单元对采集的政策数据信息进行多重处理、筛查后发送至数据库存储,具体操作为:通过信息整理模块对初步处理好的政策数据信息,按照归一化标准进行依次解构分析后,通过信息分类模块实现将不同层级、不同部门及不同类别的政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,后期通过展示模块中的多种类型进行前台展示,便于用户了解每一政策信息的发展演变道路、涉及人群/行业及发布地区等内容;用户进入系统查询所需政策信息时,服务器控制推送单元输出相关内容,具体为被动推送模块推送客户所要查找的目标政策数据信息内容,主动推送模块实时自动计算现时段/日的热点政策信息,并向前台推送,减少部分用户检索时间,增加系统的功能性,为用户提供一站式政策查询服务,可以更便捷的查找真实有效的全国政策。
42.实施例2:
43.一种基于互联网数据库的政策数据信息搜索系统,如图1所示,为了推送搜索内容的关联政策信息;本实施例在实施例1的基础上作出以下改进:所述推送单元还包括用于根据客户检索内容,自主在数据库内查找相关政策数据信息的智能关联模块和用于比对相关政策数据信息与目标政策数据信息或客户需求信息的关联性权重大小,并按序推送的关联推送模块;
44.优选的,所述智能关联模块用于查找相关政策数据信息的方法,包括以下内容:
45.a1:使用自然语言语义分析:自动化分析提取数据库中与客户需求相关的要素及相互关系;
46.a2:深度学习和知识图谱技术:采用知识图谱技术构建政策知识图谱,与客户信息和需求进行自动化匹配,实现高精度直观推送。用户在前台检索某政策信息时,被动推送模块推送客户所要查找的目标政策数据信息内容,智能关联模块根据目标政策数据信息内容自动查找相关政策数据信息,并经关联推送模块计算权重后按照先后顺序排比推出,设计更为人性化,实现海量政策的检索与查找、精准推送,加深用户对该政策信息内容更为深刻
的理解。
47.本实施例在使用时,通过前处理单元进行政策数据信息的采集,后处理单元对采集的政策数据信息进行多重处理、筛查后发送至数据库存储,具体操作为:通过信息整理模块对初步处理好的政策数据信息,按照归一化标准进行依次解构分析后,通过信息分类模块实现将不同层级、不同部门及不同类别的政策数据信息进行有效分类,完成收集的所有政策数据信息的融合,后期通过展示模块中的多种类型进行前台展示,便于用户了解每一政策信息的发展演变道路、涉及人群/行业及发布地区等内容;用户进入系统查询所需政策信息时,服务器控制推送单元输出相关内容,具体为被动推送模块推送客户所要查找的目标政策数据信息内容,智能关联模块根据目标政策数据信息内容自动查找相关政策数据信息,并经关联推送模块计算权重后按照先后顺序排比推出,为用户提供一站式政策查询服务,可以更便捷的查找真实有效的全国政策。
48.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1