植物入侵风险评估方法、装置、设备、存储介质和产品与流程

文档序号:30696122发布日期:2022-07-09 17:17阅读:206来源:国知局
植物入侵风险评估方法、装置、设备、存储介质和产品与流程

1.本发明涉及外来植物风险评估领域,尤其涉及一种植物入侵风险评估方法、装置、设备、存储介质和产品。


背景技术:

2.有害生物风险分析(pest risk analysis,pra)是世界贸易组织(world trade organization,wto)规范植物检疫行为《实施卫生与植物卫生措施协定》(sps协定)中明确要求的,为了使检疫行为对贸易的影响降到最低而规定各国(地区)制定实施的植物检疫措施。有害生物风险分析的核心内容是风险评估和风险管理。其中,有害生物风险评估是指:“确定有害生物是否为检疫性有害生物并评价其传入的可能性。”检疫性有害生物,是指有害生物中为害重大,且我国暂无分布,或局部分布的植物。
3.目前在对一些入侵植物进行风险评估时,大多采用决策树模型、定性评价、ahp等方法进行评估,然而由于杂草与入侵植物具有一系列遗传、生理、形态和生活史特征,其中某些特征经适应和选择性进化促进了生物入侵,因此采用决策树模型、定性评价、ahp等方法进行植物入侵评估的结果与实际入侵结果偏差太大,进而不利于预警、提前部署防控工作。


技术实现要素:

4.本发明提供一种植物入侵风险评估方法、装置、设备、存储介质和产品,用以解决现有技术中对入侵植物风险评估不准确的缺陷,实现更加有效、精准筛选高风险入侵植物。
5.本发明提供一种植物入侵风险评估方法,包括:
6.确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;
7.获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;
8.将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适生区预测结果;
9.根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
10.根据本发明提供的一种植物入侵风险评估方法,所述确定待评估植物的its序列与目标样本its序列之间的遗传距离,具体包括:
11.将所述待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果,所述预设样本its序列库是基于与所述待评估植物同科的植物its序列中选取得到的;
12.根据所述碱基比对结果,构建its序列拓扑树;
13.基于所述its序列拓扑树,确定所述待评估植物的its序列与目标样本its序列之
间的遗传距离。
14.根据本发明提供的一种植物入侵风险评估方法,所述基于所述its序列拓扑树,确定所述待评估植物的its序列与目标样本its序列之间的遗传距离,具体包括:
15.基于所述its序列拓扑树,确定所述its序列拓扑树中各同属入侵植物的its序列与所述待评估植物的its序列之间的同属植物遗传距离,所述预设样本its序列库中包括所述目标样本its序列;
16.将同属植物遗传距离最小的同属入侵植物的its序列作为目标样本its序列,并确定所述待评估植物的its序列与目标样本its序列之间的遗传距离。
17.根据本发明提供的一种植物入侵风险评估方法,所述获取所述待评估植物的目标气候因子,具体包括:
18.从全球生物多样性信息平台中获取所述待评估植物的地理分布地区;
19.从世界气候数据库中获取所述待评估植物的地理分布地区的气候因子数据集;
20.确定待评估地点的气候因子,并计算出所述气候因子数据集中各气候因子与所述待评估地点的气候因子之间的相似度;
21.基于所述相似度从所述气候因子数据集中选取目标气候因子。
22.根据本发明提供的一种植物入侵风险评估方法,所述根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险,具体包括:
23.在所述遗传距离小于预设遗传距离,所述潜在适生区预测结果为适生区的适生性大于预设适生性的情况下,确定所述待评估植物存在入侵性风险。
24.根据本发明提供的一种植物入侵风险评估方法,所述确定待评估植物的its序列与目标样本its序列之间的遗传距离之前,包括:
25.以待评估植物的dna为模板,依次加入正向引物、反向引物及dna聚合酶预混液进行pcr扩增反应,得到待评估植物的its序列。
26.本发明还提供一种植物入侵风险评估装置,包括:
27.确定单元,用于确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;
28.获取单元,用于获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;
29.预测单元,用于将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适生区预测结果;
30.评估单元,用于根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
31.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述植物入侵风险评估方法。
32.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述植物入侵风险评估方法。
33.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述植物入侵风险评估方法。
34.本发明提供的一种植物入侵风险评估方法、装置、设备、存储介质和产品,通过确定待评估植物的its序列与目标样本its序列之间的遗传距离,获取待评估植物的目标气候因子,接着将待评估植物的目标气候因子输入至最大信息熵模型中,获取最大信息熵模型输出的待评估植物在待评估地点的潜在适生区预测结果,最后根据遗传距离和潜在适生区预测结果确定待评估植物的入侵性风险,由于生物入侵涉及生物本身和生物所处的环境,两个要素相辅相成,而杂草与入侵植物具有一系列遗传、生理、形态和生活史特征,其中某些特征经适应和选择性进化促进了生物入侵,因此本发明中,目标样本its序列是基于与待评估植物同属的植物its序列中选取得到的,而目标气候因子是基于待评估地点的气候因子选取得到的。由此通过与待评估地点的气候因子相关的目标气候因子作为模型输入参数,减小了模型输出的潜在适生区预测结果与真实结果之间的误差,且通过与待评估植物同属的植物its序列中选取目标样本its序列来计算遗传距离,实现了更加有效筛选高风险入侵植物,进而达到精准筛选高风险入侵植物的目的。
附图说明
35.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明提供的植物入侵风险评估方法的流程示意图之一;
37.图2是本发明提供的植物入侵风险评估方法的流程示意图之二;
38.图3是本发明提供的植物入侵风险评估方法的流程示意图之三
39.图4是本发明提供的植物入侵风险评估装置的结构示意图;
40.图5是本发明提供的电子设备的结构示意图。
具体实施方式
41.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
42.下面结合图1-图3描述本发明的植物入侵风险评估方法。
43.图1为本发明提供的植物入侵风险评估方法的流程示意图之一,如图1所示,该方法包括:
44.步骤100,确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;
45.具体地,在rdna基因中,5.8s核糖体rna基因(5.8srdna)和28s核糖体rna基因(28srdna)基因间隔序列称为its,而遗传距离指不同的种群或种之间的基因差异的程度,并且以某种数值进行度量,通常由基因频率的某个函数所确定。需要说明的是,杂草与入侵植物具有一系列遗传、生理、形态和生活史特征,其中某些特征经适应和选择性进化促进了生物入侵,而本发明中,以与待评估植物同属的植物为参考,基于植物分类和系统进化亲缘
分析,根据相似性原则,分析待评估植物的入侵性风险。
46.在实际应用中,本发明中可以基于先植物数据库或全球生物多样性信息平台对待评估植物进行识别分析,确定出待评估植物的名称、类别及its序列信息,接着基于待评估植物的类别在植物数据库或全球生物多样性信息平台中查询与该待评估植物同属的样本植物,并将该样本植物的its序列作为目标样本its序列,以便后续进行风险评估。
47.需要说明的是,为了便于区分不同的植物及其相关特性,以亲缘关系远近为依据,通常以界、门、纲、目、科、属、种对植物进行分类,且该分类层层递进,即同界植物可以继续以门划分,同门植物可以继续以纲划分,同纲植物可以继续以目划分,以此类推,在此不再赘述。
48.本发明中为了提高入侵风险评估的精准性,直接以同属的植物为参考,进行遗传分析。进一步地,为了便于后续更加快速筛选入侵植物,在查询到与该待评估植物同属的样本植物之后,继续对样本植物中的各样本植物的入侵性进行分析,例如该样本植物是否为入侵植物,或者该样本植物是否对待评估地点存在入侵危险,在进行入侵性分析之后,将入侵植物或者对待评估地点存在入侵危险的样本植物的its序列作为目标样本its序列。
49.在实际应用中,在获取待评估植物的its序列与目标样本its序列之后,可以采用maga 5.1软件中的kimura-2-parameter模型进行计算出待评估植物的its序列与目标样本its序列之间的遗传距离,在使用maga 5.1软件中的kimura-2-parameter模型输出遗传距离之前,需要先设定分析的起始位点、终止位点、碱基读取顺序等,接着将meg格式的its序列数据输入至maga 5.1软件中的kimura-2-parameter模型中,获取并整理kimura-2-parameter模型输出的结果,由此得到遗传距离。另外需要说明的是,上述基于maga5.1软件中的kimura-2-parameter模型得出遗传距离仅是本发明的其中一个实施例,本发明中还可以根据其他分析方法得出遗传距离,例如clustal x2软件、dispan软件、ntsyspc2.1等软件等,在此不再赘述。
50.在另一实施例中,当从公开数据库中查询不到,例如从ncbi(national center for biotechnology information)中查询不到待评估植物的its序列时,可以根据its序列提取实验从已知待评估植物的dna中提取出待评估植物的its序列,具体地,所述确定待评估植物的its序列与目标样本its序列之间的遗传距离之前,包括
51.以待评估植物的dna为模板,依次加入正向引物、反向引物及dna聚合酶预混液进行pcr扩增反应,得到待评估植物的its序列。
52.容易理解地,当从公开数据库中查询不到待评估植物的its序列时,则需要通过pcr扩增反应从已知待评估植物的dna中提取出待评估植物的its序列,由此完成后续植物入侵风险评估。
53.具体地,正向引物指代处于dna双链上游的引物,其主要功能是沿着负链进行不间断延长,而反向引物指代处于dna双链下游的引物,其主要功能是沿着正链进行不间断延长,由此通过正向引物沿着模板dna的负链进行不间断延长,通过负向引物沿着模板dna的正链进行不间断延长,进而完成pcr扩增。
54.在实际应用中,为了保证pcr扩增反应顺利完成,还需要向反应体系中加入dna聚合酶预混液,其中,dna聚合酶预混液中包含taq dna聚合酶和dntps。dntps是pcr扩增反应的原料,当浓度过高是,会导致dna聚合酶错误的掺入,从而使碱基配对错误,而taq dna聚
合酶的用量是影响pcr扩增反应的一个重要因素,当taq dna聚合酶浓度过低则无法进行扩增,而浓度过高又会引起非特异性扩增,因此本发明为了选取5u/μl的dna聚合酶预混液25μl参与反应,来保证pcr扩增反应顺利完成。
55.另外,除了dna聚合酶预混液影响pcr扩增反应之外,模板dna的含量及引物的含量退火温度等均会影响pcr扩增反应,例如,当模板dna含量过少时,会导致扩增产物少,而当模板dna含量多时,又会抑制pcr扩增反应,从而使扩增产物少。而在pcr扩增反应中,当引物的浓度过低时,引物与模板dna结合率低,而当引物浓度过高时,则又会增加费特异性结合的机率,导致产物不纯。因此本发明中在实际应用中,pcr扩增反应体系以50μl,具体包括:1μl的模板dna,各2μl的10pmol/μl正向引物和反向引物,25μl的5u/μl dna聚合酶预混液,余量则为水。进一步地,在得到50μl的pcr扩增反应体系之后,调整好反应程序,将上述pcr扩增反应体系稍加离心,立即置pcr仪上,执行扩增,具体地在98℃预变性3分钟,接着进入循环扩增阶段,即98℃下扩增10秒,退火冷却至54℃并维持10s,接着再升温至72℃并维持10s,此过程循环38次,最后在72℃保温5分钟,结束反应得到pcr产物,并将pcr产物放置于4℃环境下保存。之后对pcr产物进行提取,来获得待评估植物的its序列,在实际应用中,由于its序列没有保守的引物,其稳定性差,因此通常在进行pcr扩增时会扩增至16s-23s全序列,在扩增至16s-23s全序列之后,提出待评估植物的its序列。
56.步骤200,获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;
57.需要说明的是,在实际应用中,通常为研究某一个植物对某一个国家或者某一个地区是否存在入侵威胁,因此本发明中是根据待评估地点的气候因子去对当前待评估植物在世界各地中的分布状况的各分布地区的气候因子进行相似气候评估选取得到的,换句话说,本发明中的目标气候因子与待评估地点的气候因子之间的相似度处于预先设定的相似范围之内,由此基于与待评估地点的气候因子相似的目标气候因子,可以保证更加有效地对待评估植物的入侵性风险进行评估。
58.具体地,可以先从获取待评估植物的地理分布地区,接着获取各地理分布地区中的气候因子,最后再从各地理分布地区中的气候因子中选取出与待评估地点的气候因子之间的相似度处于预先设定的相似范围之内的目标气候因子。
59.步骤300,将所述待评估植物的地理分布地区信息和目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适生区预测结果;
60.具体地,最大信息熵模型主要原理是通过找出植物概率分布的最大熵,预测植物存在的相对概率。本发明中,为了确保最大信息熵模型输出结果的准确度,在基于最大信息熵模型获取待评估植物在待评估地点的潜在适生区预测结果之前,还可以对最大信息熵模型进行优化,以使得其预测结果更加贴近于真实结果,具体地在实际应用中,可以从从全球生物多样性信息平台中获取已知植物的地理分布地区信息,例如水葫芦的地理分布数据,接着再从世界气候数据库中获取目前水葫芦分布的地区内各地的气候因子,此外为了避免由于气候因子数量过多而导致模型过度拟合,本发明中可以从70%的训练数据对应的各地的气候因子中选取出19个气候因子作为模型训练的训练参数,具体地,将水葫芦的地理分布数据随机分成70%的训练数据和30%的测试数据,将70%的训练数据对应的19个气候因
子输入至最大信息熵模型中,基于其输出的预测结果与70%的训练数据对应的真实结果对最大信息熵模型的参数进行更新调整,直到最大信息熵模型训练完成。之后再基于30%的测试数据对最大信息熵模型进行校验。
61.需要说明的是,最大信息熵模型输出的所有网格单元的概率分布,也即最大信息熵模型输出的是待评估植物在该目标气候因子下所有的潜在适生区及各潜在适生区的适生概率。本发明中在获取到最大信息熵模型输出的预测结果之后,从预测结果中获取待评估植物在待评估地点的潜在适生区以及潜在适生区的适生概率。
62.步骤400,根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
63.需要说明的是,在时间的向度上来考察生态系统,不难发现构成生态系统的两大部分:生物与环境,都随时间而改变,但这种改变又不是孤立地发生的。在自然界中,生植物是生态系统中的功能单位,任何植物都处于一定的生态系统的构架之中,自然界中不存在脱离生态系统的孤立植物,也不存在孤立的植物进化。生态系统内生物之间、生物与其环境之间的复杂关系构成了植物进化的背景,某一植物的进化受生态系统内其他植物和环境因素的制约,因此,植物在生态系统内的进化,表现为该植物与其他相关植物及环境的协进化,因此为了便于后续更加有效地评估植物入侵风险性,本发明中除了以同属的植物为参考,进行遗传距离分析,还基于待评估植物在待评估地点的潜在适生区以及潜在适生区的适生概率对待评估植物的入侵性风险进行评估,使得风险评估手段更加有效。
64.具体地,本发明中在根据遗传距离和潜在适生区预测结果确定待评估植物的入侵性风险时,具体包括:
65.在所述遗传距离小于预设遗传距离,所述潜在适生区预测结果为适生区的适生性大于预设适生性的情况下,确定所述待评估植物存在入侵性风险。
66.需要说明的是,适生性即指代在潜在适生区的适生概率,在实际应用中,预测遗传距离可以是0.0500,适生性可以是0.5900。换句话说,当待评估植物的遗传距离在0~0.0500之间,且其适生性在0.5900~1.0000之间时,判定待评估植物在待评估地点具备入侵性。进一步地,当遗传距离越接近于0,适生性越接近1时,其入侵性则越大,即对待评估地点所造成的入侵威胁越大。
67.本发明提出的植物入侵风险评估方法,通过确定待评估植物的its序列与目标样本its序列之间的遗传距离,获取待评估植物的目标气候因子,接着将待评估植物的目标气候因子输入至最大信息熵模型中,获取最大信息熵模型输出的待评估植物在待评估地点的潜在适生区预测结果,最后根据遗传距离和潜在适生区预测结果确定待评估植物的入侵性风险,由于生物入侵涉及生物本身和生物所处的环境,两个要素相辅相成,而杂草与入侵植物具有一系列遗传、生理、形态和生活史特征,其中某些特征经适应和选择性进化促进了生物入侵,因此本发明中,目标样本its序列是基于与待评估植物同属的植物its序列中选取得到的,而目标气候因子是基于待评估地点的气候因子选取得到的。由此通过与待评估地点的气候因子相关的目标气候因子作为模型输入参数,减小了模型输出的潜在适生区预测结果与真实结果之间的误差,且通过与待评估植物同属的植物its序列中选取目标样本its序列来计算遗传距离,实现了更加有效筛选高风险入侵植物,进而达到精准筛选高风险入侵植物的目的。
68.可选地,在本发明公开的另一种实施例中,参考图2,图2为本发明提供的植物入侵风险评估方法的流程示意图之二,如图2所示:所述确定待评估植物的its序列与目标样本its序列之间的遗传距离,具体包括:
69.步骤1001,将所述待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果,所述预设样本its序列库是基于与所述待评估植物同科的植物its序列中选取得到的,所述预设样本its序列库中包括所述目标样本its序列;
70.步骤1002,根据所述碱基比对结果,构建its序列拓扑树;
71.步骤1003,基于所述its序列拓扑树,确定所述待评估植物的its序列与目标样本its序列之间的遗传距离。
72.具体地,预设样本its序列库中的各样本均与待评估植物属于同科植物,而目标样本又属于预设样本its序列库中与待评估植物属于同属植物。而its序列拓扑树其主要功能是用于表明各植物之间的亲属关系,its序列拓扑树从植物根源出发,其分支从大分支到下分支依次为同科、接着同科继续划分为同属、同属下面继续划分为同种,由此可以从its序列拓扑树中清晰的表现出个物种之间的亲缘关系远近,另外its序列拓扑树的分支长度刻画了进化距离的大小,即物种之间的遗传距离。
73.在实际应用中,在计算its序列之间的遗传距离时,实际是比对its序列之间的碱基差异,具体地,碱基比对结果包括比对的覆盖度与比对序列的相似性。其中。覆盖度指代测序时被测到的碱基总数占该its序列长度的百分比,由此基于碱基比对结果构建its序列拓扑树,本发明中,可以根据clustal omega软件对待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果。
74.需要说明的是,遗传距离指不同的种群或种之间的基因差异的程度,而基于植物分类和系统进化亲缘分析,植物之间的遗传距离越近,则其之间的基因差异越小,因此其传入、定殖、扩散行为的特性更加接近,因此本发明在基于所述its序列拓扑树,确定所述待评估植物的its序列与目标样本its序列之间的遗传距离时,具体包括:
75.基于所述its序列拓扑树,确定所述its序列拓扑树中各同属入侵植物的its序列与所述待评估植物的its序列之间的同属植物遗传距离;
76.将同属植物遗传距离最小的同属入侵植物的its序列作为目标样本its序列,并确定所述待评估植物的its序列与目标样本its序列之间的遗传距离。
77.容易理解地,由于its序列拓扑树是基于与待评估植物属于同科植物构建得到的,而为了便于区分不同的植物及其相关特性,以亲缘关系远近为依据,通常以界、门、纲、目、科、属、种对植物进行分类,且该分类层层递进,即同科植物可以继续以同属划分,因此为了确保入侵性风险评判依据的有效性及快速性,本发明从与待评估植物同属的植物中确定遗传距离。此外容易理解地,与待评估植物同属的植物可能不只一个,因此为了简化后续评估步骤,快速得出评估结果,将同属植物遗传距离最小的同属入侵植物的its序列作为目标样本its序列,也即将同属植物遗传距离最小的同属入侵植物的its序列与待评估植物的its序列之间的遗传距离作为评判待评估植物的入侵性风险的依据。
78.本发明中,通过将待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果,接着根据碱基比对结果,构建its序列拓扑树,最后基于its序列拓扑树,确定待评估植物的its序列与目标样本its序列之间的遗传距离,由此层
层递进,将同属植物遗传距离最小的同属入侵植物的its序列与待评估植物的its序列之间的遗传距离作为评判待评估植物的入侵性风险的依据,从而更加快速、有效地得出待评估植物的入侵性风险。
79.可选地,在本发明公开的另一种实施例中,参考图3,图3为本发明提供的植物入侵风险评估方法的流程示意图之三,如图3所示:所述获取所述待评估植物的目标气候因子,具体包括:
80.步骤2001,从全球生物多样性信息平台中获取所述待评估植物的地理分布地区;
81.步骤2002,从世界气候数据库中获取所述待评估植物的地理分布地区的气候因子数据集;
82.步骤2003,确定待评估地点的气候因子,并计算出所述气候因子数据集中各气候因子与所述待评估地点的气候因子之间的相似度;
83.步骤2004,基于所述相似度从所述气候因子数据集中选取目标气候因子。
84.具体地,待评估植物的地理分布地区指代当前待评估植物在世界各地中的分布状况,在实际应用中,获取待评估植物的地理分布地区信息时,具体精确到待评估植物所处地的经纬度信息,当无法精准获取经纬度信息时,还可以通过卫星系统精确到待评估植物所处地的地名的坐标,另外为了避免数据重复太多出现模型过度拟合,本发明中还可以在2km的环境格网数据内只保留一个分布数据,例如当发现在2km的环境格网数据内存在10个分布数据,则可将10个分布数据中位于中心处的分布数据代表该10个分布数据。
85.在另一种应用场景中,当气候因子的数量过多时,反而会影响模型预测结果的精准度,因此本发明中需要先计算出气候因子数据集中各气候因子与待评估地点的气候因子之间的相似度,最后基于相似度对气候因子数据集中各气候因子进行从大到小排序,最后选取出排序名次位于前预设名次的气候因子作为目标气候因子,例如当需要19个气候因子进行模型预测时,则将气候因子数据集中排名处于前19位的气候因子作为目标气候因子。
86.本发明中,通过从全球生物多样性信息平台中获取待评估植物的地理分布地区,从世界气候数据库中获取待评估植物的地理分布地区的气候因子数据集,接着确定待评估地点的气候因子,并计算出气候因子数据集中各气候因子与待评估地点的气候因子之间的相似度,最后基于相似度从气候因子数据集中选取目标气候因子,由此使得模型预测结果的精准度更高,且仅将排序名次位于前预设名次的目标气候因子输入至模型中,简化了模型输入参数,进一步地提高了模型预测速度,进而确保可以更加快速精准评估待评估植物的入侵性风险。
87.下面对本发明提供的植物入侵风险评估装置进行描述,下文描述的植物入侵风险评估装置与上文描述的植物入侵风险评估方法可相互对应参照。
88.参考图4,图4是本发明提供的植物入侵风险评估装置的结构示意图,如图4所示,所述植物入侵风险评估装置包括:确定单元410、获取单元420、预测单元430和评估单元440。其中,确定单元410,用于确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;获取单元420,用于获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;预测单元430,用于将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适
生区预测结果;评估单元440,用于根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
89.本发明提出的植物入侵风险评估装置,通过确定待评估植物的its序列与目标样本its序列之间的遗传距离,获取待评估植物的目标气候因子,接着将待评估植物的目标气候因子输入至最大信息熵模型中,获取最大信息熵模型输出的待评估植物在待评估地点的潜在适生区预测结果,最后根据遗传距离和潜在适生区预测结果确定待评估植物的入侵性风险,由于生物入侵涉及生物本身和生物所处的环境,两个要素相辅相成,而杂草与入侵植物具有一系列遗传、生理、形态和生活史特征,其中某些特征经适应和选择性进化促进了生物入侵,因此本发明中,目标样本its序列是基于与待评估植物同属的植物its序列中选取得到的,而目标气候因子是基于待评估地点的气候因子选取得到的。由此通过与待评估地点的气候因子相关的目标气候因子作为模型输入参数,减小了模型输出的潜在适生区预测结果与真实结果之间的误差,且通过与待评估植物同属的植物its序列中选取目标样本its序列来计算遗传距离,实现了更加有效筛选高风险入侵植物,进而达到精准筛选高风险入侵植物的目的。
90.根据本发明提供的一种植物入侵风险评估装置,所述确定单元410,还用于将所述待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果,所述预设样本its序列库是基于与所述待评估植物同科的植物its序列中选取得到的;根据所述碱基比对结果,构建its序列拓扑树;基于所述its序列拓扑树,确定所述待评估植物的its序列与目标样本its序列之间的遗传距离。所述确定单元410,还用于基于所述its序列拓扑树,确定所述its序列拓扑树中各同属入侵植物的its序列与所述待评估植物的its序列之间的同属植物遗传距离,所述预设样本its序列库中包括所述目标样本its序列;将同属植物遗传距离最小的同属入侵植物的its序列作为目标样本its序列,并确定所述待评估植物的its序列与目标样本its序列之间的遗传距离。进一步地,所述预测单元430,还用于在所述遗传距离小于预设遗传距离,所述潜在适生区预测结果为适生区的适生性大于预设适生性的情况下,确定所述待评估植物存在入侵性风险。所述确定单元410,还用于以待评估植物的dna为模板,依次加入正向引物、反向引物及dna聚合酶预混液进行pcr扩增反应,得到待评估植物的its序列。
91.本发明提出的植物入侵风险评估装置,通过将待评估植物的its序列与预设样本its序列库中的各样本its序列进行碱基比对,得到碱基比对结果,接着根据碱基比对结果,构建its序列拓扑树,最后基于its序列拓扑树,确定待评估植物的its序列与目标样本its序列之间的遗传距离,由此层层递进,将同属植物遗传距离最小的同属入侵植物的its序列与待评估植物的its序列之间的遗传距离作为评判待评估植物的入侵性风险的依据,从而更加快速、有效地得出待评估植物的入侵性风险。
92.根据本发明提供的一种植物入侵风险评估装置,所述获取单元420,还用于从全球生物多样性信息平台中获取所述待评估植物的地理分布地区;从世界气候数据库中获取所述待评估植物的地理分布地区的气候因子数据集;确定待评估地点的气候因子,并计算出所述气候因子数据集中各气候因子与所述待评估地点的气候因子之间的相似度;基于所述相似度从所述气候因子数据集中选取目标气候因子。
93.本发明提出的植物入侵风险评估装置,通过从全球生物多样性信息平台中获取待
评估植物的地理分布地区,从世界气候数据库中获取待评估植物的地理分布地区的气候因子数据集,接着确定待评估地点的气候因子,并计算出气候因子数据集中各气候因子与待评估地点的气候因子之间的相似度,最后基于相似度从气候因子数据集中选取目标气候因子,由此使得模型预测结果的精准度更高,且仅将排序名次位于前预设名次的目标气候因子输入至模型中,简化了模型输入参数,进一步地提高了模型预测速度,进而确保可以更加快速精准评估待评估植物的入侵性风险。
94.图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(communications interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行植物入侵风险评估方法,该方法包括:确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适生区预测结果;根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
95.此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
96.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的植物入侵风险评估方法,该方法包括:确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所述待评估植物在待评估地点的潜在适生区预测结果;根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
97.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的植物入侵风险评估方法,该方法包括:确定待评估植物的its序列与目标样本its序列之间的遗传距离,所述目标样本its序列是基于与所述待评估植物同属的植物its序列中选取得到的;获取所述待评估植物的目标气候因子,所述目标气候因子是基于待评估地点的气候因子选取得到的;将所述待评估植物的目标气候因子输入至最大信息熵模型中,获取所述最大信息熵模型输出的所
述待评估植物在待评估地点的潜在适生区预测结果;根据所述遗传距离和所述潜在适生区预测结果确定所述待评估植物的入侵性风险。
98.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
99.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
100.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1