本发明涉及化学信息学,尤其涉及一种农业污染数据库的构建方法、装置、电子设备及存储介质。
背景技术:
1、农业污染对人体健康和生态环境的影响越来越凸显,目前越来越多的研究聚焦于新污染物,因此有必要全面梳理新污染物在环境链条中的迁移转化信息及规律,建立完善其在典型环境系统中与生物及环境密切相关的医疗保健信息学。
2、现有的方法中,农业污染信息,尤其是对于新的农业污染信息,一般分散存在于文献库中的不同文献中,尤其是对于新的农业污染,信息较为杂乱,如何实现对农业污染信息的高效提取与分析的需求是目前业界亟待解决的重要课题。
技术实现思路
1、本发明提供一种农业污染数据库的构建方法、装置、电子设备及存储介质,用以实现对农业污染信息的高效提取与分析。
2、本发明提供一种农业污染数据库的构建方法,包括:
3、获取农业污染的多个污染物类别以及各污染物类别对应的传递介质信息,并基于所述各污染物类别及其对应的传递介质信息,构建所述各污染物类别的污染物关键词;
4、基于词频-逆文本指数tf-idf算法,确定文献库中各文献的词频信息;
5、基于所述污染物关键词以及所述词频信息,对文献库中的文献进行筛选,得到多个第一目标文献;
6、在各第一目标文献中提取所述污染物关键词对应的污染物数据,并基于所述污染物数据构建农业污染数据库。
7、根据本发明提供的一种农业污染数据库的构建方法,基于所述污染物关键词以及所述词频信息,对文献库中的文献进行筛选,得到多个第一目标文献,包括:
8、基于所述词频信息,确定文献中各文献关键词的评分,并将所述评分大于预设评分阈值的关键词,作为文献的目标关键词;
9、将所述污染物关键词与所述目标关键词进行比对,基于对比结果对文献库中的文献进行筛选,得到多个第一目标文献。
10、根据本发明提供的一种农业污染数据库的构建方法,在各第一目标文献中提取所述污染物关键词对应的污染物数据,包括:
11、基于所述污染物关键词,在所述各第一目标文献中进行实体识别,确定所述污染物关键词处于所述各第一目标文献中的位置信息;
12、基于所述位置信息,对所述各第一目标文献中所述污染物关键词对应的污染物数据进行提取。
13、根据本发明提供的一种农业污染数据库的构建方法,基于所述污染物数据构建农业污染数据库之后,还包括:
14、从所述多个第一目标文献中,确定包含目标污染物类别及其对应的所有传递介质信息的多个第二目标文献,所述目标污染物类别为所述多个污染物类别中的任一污染物类别;
15、从所述多个第二目标文献中提取所述目标污染物类别的目标污染物数据,并基于所述目标污染物数据,确定所述目标污染物类别的迁移转化信息,并将所述迁移转化信息添加至所述农业污染数据库中。
16、根据本发明提供的一种农业污染数据库的构建方法,基于所述污染物数据构建农业污染数据库之后,还包括:
17、确定各文献中的污染物关键词出现的次数,并基于所述次数,生成各污染物关键词的文字云图,并在所述农业污染数据库的前端界面中显示所述文字云图。
18、根据本发明提供的一种农业污染数据库的构建方法,基于所述污染物数据构建农业污染数据库之后,还包括:
19、将所述污染物数据输入一级暴露模型,得到所述污染物数据在对应传递介质中的污染物浓度以及所述污染物数据在对应传递介质中的污染物分布;
20、基于风险商法,对所述污染物浓度以及污染物分布进行风险分析,确定所述各污染物类别的风险等级信息,并将所述风险等级信息添加至所述农业污染数据库中。
21、根据本发明提供的一种农业污染数据库的构建方法,传递介质信息包括覆盖人群信息以及环境信息。
22、本发明还提供一种农业污染数据库的构建装置,包括:
23、关键词构建模块,用于获取农业污染的多个污染物类别以及各污染物类别对应的传递介质信息,并基于所述各污染物类别及其对应的传递介质信息,构建所述各污染物类别的污染物关键词;
24、词频信息确定模块,用于基于词频-逆文本指数tf-idf算法,确定文献库中各文献的词频信息;
25、文献筛选模块,用于基于所述污染物关键词以及所述词频信息,对文献库中的文献进行筛选,得到多个第一目标文献;
26、数据库构建模块,用于在各第一目标文献中提取所述污染物关键词对应的污染物数据,并基于所述污染物数据构建农业污染数据库。
27、本发明还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述农业污染数据库的构建方法。
28、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述农业污染数据库的构建方法。
29、本发明提供的农业污染数据库的构建方法、装置、电子设备及存储介质,通过确定污染物关键词以及文献库中文献词频信息,对文献库中的文献进行筛选,得到多个用于提取污染物数据的第一目标文献,并基于提取的污染物数据,构建农业污染数据库,在实现对农业污染数据库的构建的同时,实现了对农业污染信息的高效提取与分析。
1.一种农业污染数据库的构建方法,其特征在于,所述方法包括:
2.根据权利要求1所述的农业污染数据库的构建方法,其特征在于,所述基于所述污染物关键词以及所述词频信息,对文献库中的文献进行筛选,得到多个第一目标文献,包括:
3.根据权利要求1所述的农业污染数据库的构建方法,其特征在于,所述在各第一目标文献中提取所述污染物关键词对应的污染物数据,包括:
4.根据权利要求1所述的农业污染数据库的构建方法,其特征在于,所述基于所述污染物数据构建农业污染数据库之后,还包括:
5.根据权利要求1所述的农业污染数据库的构建方法,其特征在于,所述基于所述污染物数据构建农业污染数据库之后,还包括:
6.根据权利要求1所述的农业污染数据库的构建方法,其特征在于,所述基于所述污染物数据构建农业污染数据库之后,还包括:
7.根据权利要求1-6任一项所述的农业污染数据库的构建方法,其特征在于,所述传递介质信息包括覆盖人群信息以及环境信息。
8.一种农业污染数据库的构建装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述农业污染数据库的构建方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述农业污染数据库的构建方法。