本发明涉及大数据云平台,更具体地说,它涉及一种用于环境影响评价的大数据云平台。
背景技术:
1、环评报告,即环境影响评价报告,是新建、扩建、改建项目对环境造成的影响的预见性评定。根据对项目所在地的地下水、土壤的监测,对项目所用原材料、可能产生的废弃物、项目的环保设施的设计的评价,从而评估项目建成对环境的影响;
2、现有技术中的环境影响评价的数据来源基本上是从待评价项目数据库和测量数据中获得,数据来源单一,环境影响评价的可靠性较低。
技术实现思路
1、本发明提供一种用于环境影响评价的大数据云平台,解决相关技术中环境影响评价的数据来源基本上是从待评价项目数据库和测量数据中获得,数据来源单一,环境影响评价的可靠性较低的技术问题。
2、根据本发明的一个方面,提供了一种用于环境影响评价的大数据云平台,包括数据处理单元以及与数据处理单元连接的数据库组,数据库组包括项目数据库、报告数据库和搜索数据库,其中项目数据库用于存储待评价的项目的相关数据,报告数据库用于存储用于生成环境影响评价报告的相关数据;搜索数据库用于存储搜索引擎的搜索记录数据;
3、其中项目数据库连接数据获取单元,数据获取单元基于待评价项目的基本信息来获取待评价项目的相关数据;
4、数据处理单元包括搜索词关联单元,其用于基于待评价项目的关键词来从搜索数据库中提取相似度大于第一阈值的搜索词;
5、搜索量查询单元,其用于计算搜索词关联单元所提取的搜索词的搜索量;
6、从数据库中提取某一时间段内的搜索词的搜索次数来计算搜索频率,搜索频率=搜索次数/时间;
7、环境影响类别搜索量计算单元,其用于计算环境影响类别的搜索量,计算环境影响类别的搜索量是基于搜索词的搜索量来计算的;
8、环境影响类别搜索量计算单元首先计算搜索词与一个环境影响类别的相似度,将相似度大于第二阈值的搜索词归于该环境影响类别之下,然后通过归于该环境影响类别之下的搜索词的搜索量来计算环境影响类别的搜索量;
9、环境影响结果计算单元,其用于计算待评价的项目的环境影响总量,计算待评价的项目的环境影响总量是基于项目的环境影响类别和项目的环境影响类别的评分来进行计算的;
10、基于环境影响类别的搜索量对环境影响类别赋予权重;
11、在赋予权重之后,项目的环境影响总量x的计算公式如下:
12、
13、其中,ki表示第i个环境影响类别的权重,pi表示第i个环境影响类别的评分。
14、所述待评价项目的基本信息至少包括项目名称、项目地址、建设单位、项目负责人、项目开始时间、联系人。
15、所述数据获取单元获取待评价项目的相关数据包括两种方式:
16、一、直接从待评价项目所述单位的单位数据库内获取;
17、二、基于网络从搜索网站爬取。
18、所述爬取的方法可以是利用现有的爬虫工具。
19、所述待评价项目的相关数据包括土地性质、建设性质、行业类型及代码、占地面积、绿化面积、总投资、环保投资、环保投资占总投资比例、原辅材料清单、敏感点、环境质量现状、达标排放数据监测。
20、所述报告数据库存储的用于生成环境影响评价报告的相关数据包括报告书模板数据、报告表模板数据、登记表模板数据。
21、所述搜索词与一个环境影响类别的相似度的计算是计算搜索词与环境影响类别的语义相似度。
22、基于环境影响类别的搜索量对环境影响类别赋予权重,
23、
24、ki表示第i个环境影响类别的权重,sj表示归于第i个环境影响类别表示的第j个搜索词的搜索量。
25、所述数据处理单元还包括报告生成单元,报告生成单元从报告数据库提取报告书模板数据、报告表模板数据、登记表模板数据,并将数据处理单元获得的待评价项目的相关数据、环境影响类别和项目的环境影响总量填充到报告书模板、报告表模板、登记表模板中生成报告书、报告表和登记表。
26、根据本发明的一个方面,提供了一种用于环境影响评价的大数据云平台的环境影响评价方法,包括以下步骤:
27、步骤s1,收集待评价项目的基本信息;
28、步骤s2,基于收集的待评价项目的基本信息获取待评价项目的相关数据;
29、步骤s3,其用于基于待评价项目的关键词来从搜索数据库中提取相似度大于第一阈值的搜索词;
30、步骤s4,基于搜索词的搜索量来计算环境影响类别的搜索量;
31、步骤s5,基于环境影响类别的搜索量对环境影响类别赋予权重,并计算项目的环境影响总量;
32、步骤s6,基于待评价项目的相关数据、环境影响类别和项目的环境影响总量生成环境影响评价报告。
33、本发明的有益效果在于:
34、本发明通过爬取的数据、待评价项目数据库和测量数据综合的作为数据来源,并且基于搜索量来赋予环境影响类别赋予权重,提高环境影响评价的可靠性。
1.一种用于环境影响评价的大数据云平台,其特征在于,包括数据处理单元以及与数据处理单元连接的数据库组,数据库组包括项目数据库、报告数据库和搜索数据库,其中项目数据库用于存储待评价的项目的相关数据,报告数据库用于存储用于生成环境影响评价报告的相关数据;搜索数据库用于存储搜索引擎的搜索记录数据;
2.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述待评价项目的基本信息至少包括项目名称、项目地址、建设单位、项目负责人、项目开始时间、联系人。
3.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述数据获取单元获取待评价项目的相关数据包括两种方式:
4.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述爬取的方法可以是利用现有的爬虫工具。
5.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述待评价项目的相关数据包括土地性质、建设性质、行业类型及代码、占地面积、绿化面积、总投资、环保投资、环保投资占总投资比例、原辅材料清单、敏感点、环境质量现状、达标排放数据监测。
6.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述报告数据库存储的用于生成环境影响评价报告的相关数据包括报告书模板数据、报告表模板数据、登记表模板数据。
7.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述搜索词与一个环境影响类别的相似度的计算是计算搜索词与环境影响类别的语义相似度。
8.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,基于环境影响类别的搜索量对环境影响类别赋予权重,
9.根据权利要求1所述的一种用于环境影响评价的大数据云平台,其特征在于,所述数据处理单元还包括报告生成单元,报告生成单元从报告数据库提取报告书模板数据、报告表模板数据、登记表模板数据,并将数据处理单元获得的待评价项目的相关数据、环境影响类别和项目的环境影响总量填充到报告书模板、报告表模板、登记表模板中生成报告书、报告表和登记表。
10.根据权利要求8所述的一种用于环境影响评价的大数据云平台的环境影响评价方法,其特征在于,包括以下步骤: