本发明属于作物培育预测,具体涉及一种基于作物生育期表型及其区域适应性的定量预测方法、系统及装置。
背景技术:
1、生育期不仅是作物温光反应的重要表型性状,还是影响产量最大化的重要因素。适宜的抽穗时间对作物充分利用光温资源提高产量潜力和避免关键生育期霜冻、高温和干旱等非生物胁迫发生至关重要。传统作物育种中,生育期等表型性状获取主要依赖人工观测,费时费力,已无法满足现代育种中对高通量作物表型的迫切需求。因此,实现不依赖人工观测的多基因型作物生育期表型的精确预测,对评价作物的生态适应性、选育生育期适宜品种及制定合理的栽培管理措施具有重要的指导意义。
2、作物生长模拟模型可以综合定量基因型(g)、环境效应(e)、管理技术(m)及其互作对作物生长发育和生产力形成相关表型性状的影响,进而为不同品种、环境和管理措施下作物表型信息的准确预测提供了量化工具。其中,生育期子模型是作物生长模拟模型的重要组成部分之一,广泛用于不同品种、气候和管理措施下的作物生育期。然而,传统的作物生长模型一般通过一组品种参数(遗传参数)来表征作物品种的遗传特性,而品种参数获取较为困难,一般要依据多年多点的田间试验数据进行参数调试间接获得。同时,尽管品种参数在设置过程中一般具有一定的遗传基础,如作物生育期模型中通常使用的光周期敏感性、春化敏感性等,但现有的作物生长模型中的品种参数组合与实际遗传信息之间仍存在较大差异。因此,已有的作物生长模型还难以直接用于不同基因型作物表型在不同生态区域的精确预测。
技术实现思路
1、本发明所要解决的技术问题是:提供一种基于作物生育期表型及其区域适应性的定量预测方法、系统及装置,能够实现不依赖人工观测的多基因型作物生育期表型的精确预测。
2、本发明是这样实现的:一种基于作物生育期表型及其区域适应性的定量预测方法,包括如下步骤:
3、s1、获取与待测作物相关的数据,所述数据包括多个不同种植环境下记录的作物品种信息、生育期观测数据、气象数据、管理措施数据及qtn标记位点数据;
4、s2、根据所述数据和作物模型确定品种参数校正值;
5、s3、根据所述qtn标记位点数据、品种参数校正值和全基因组关联分析算法确定满足要求的qtn标记位点数据和品种参数校正值;
6、s4、根据所述满足要求的qtn标记位点数据和品种参数校正值计算品种参数模拟值;
7、s5、根据所述气象数据、管理措施数据、品种参数模拟值和所述作物模型计算生育期模拟数据。
8、进一步地,所述s2包括如下步骤:
9、s21、根据气象数据和生育期观测数据将所述数据分为训练集和测试集;
10、s22、利用所述训练集校正所述作物模型;
11、s23、利用所述测试集验证所述作物模型,若验证通过则转向s25,否则转向s24;
12、s24、将所述数据重新划分为训练集和测试集后转向s22;
13、s25、将作物模型的品种参数作为校正品种参数。
14、进一步地,所述s3包括如下步骤:
15、s31、分别采用不同的全基因组关联分析算法对所述qtn标记位点数据和所述品种参数校正值进行分析,得到分析结果;
16、s32、根据显著性标记标准对所述分析结果进行筛选,得到筛选结果;
17、s33、根据匹配数量对所述筛选结果进行选择,得到满足要求的qtn标记位点数据和品种参数校正值。
18、进一步地,所述s4包括如下步骤:
19、s41、将所述满足要求的qtn标记位点数据进行序数值转换得到转换数据;
20、s42、将所述转换数据划分为训练集和测试集;
21、s43、基于s42中的训练集,利用机器学习的岭回归算法构建qtn-品种参数关系模型;
22、s44、将s42中的测试集代入所述qtn-品种参数关系模型中得到品种参数模拟值;
23、s45、根据所述品种参数模拟值和品种参数校正值计算决定系数r2,并输出决定系数r2取最大值时对应的品种参数模拟值。
24、进一步地,还包括如下步骤:
25、s6、对比所述生育期模拟数据与所述生育期观测数据。
26、本发明还提供一种基于作物生育期表型及其区域适应性的定量预测系统,包括:
27、获取模块,用于获取与待测作物相关的数据,所述数据包括多个不同种植环境下记录的作物品种信息、生育期观测数据、气象数据、管理措施数据及qtn标记位点数据;
28、品种参数校正模块,用于根据所述数据和作物模型确定品种参数校正值;
29、关联分析模块,用于根据所述qtn标记位点数据、品种参数校正值和全基因组关联分析算法确定满足要求的qtn标记位点数据和品种参数校正值;
30、品种参数模拟模块,用于根据所述满足要求的qtn标记位点数据和品种参数校正值计算品种参数模拟值;
31、生育期模拟模块,用于根据所述气象数据、管理措施数据、品种参数模拟值和所述作物模型计算生育期模拟数据。
32、进一步地,还包括:
33、对比模块,用于对比所述生育期模拟数据与所述生育期观测数据。
34、进一步地,所述品种参数校正模块包括:
35、初始划分子模块,用于根据气象数据和生育期观测数据将所述数据分为训练集和测试集;
36、校正子模块,用于利用所述训练集校正所述作物模型;
37、验证子模块,用于利用所述测试集验证所述作物模型,若验证通过则执行输出子模块,否则执行重新划分子模块;
38、重新划分子模块,用于将所述数据重新划分为训练集和测试集后执行校正子模块;
39、输出子模块,用于将作物模型的品种参数作为校正品种参数。
40、进一步地,所述关联分析模块包括:
41、关联分析子模块,用于分别采用不同的全基因组关联分析算法对所述qtn标记位点数据和所述品种参数校正值进行分析,得到分析结果;
42、筛选子模块,用于根据显著性标记标准对所述分析结果进行筛选,得到筛选结果;
43、位点匹配模块,用于根据匹配数量对所述筛选结果进行选择,得到满足要求的qtn标记位点数据和品种参数校正值。
44、进一步地,所述品种参数模拟模块包括:
45、序数值转换子模块,用于将所述满足要求的qtn标记位点数据进行序数值转换得到转换数据;
46、划分子模块,用于将所述转换数据划分为训练集和测试集;
47、模型构建子模块,用于基于所述划分子模块中的训练集,利用机器学习的岭回归算法构建qtn-品种参数关系模型;
48、品种参数模拟子模块,用于将所述划分子模块中的测试集代入所述qtn-品种参数关系模型中得到品种参数模拟值;
49、品种参数模拟值验证子模块,用于根据所述品种参数模拟值和品种参数校正值计算决定系数r2,并输出决定系数r2取最大值时对应的品种参数模拟值。
50、本发明还提供了一种基于作物生育期表型及其区域适应性的定量预测装置,包括:处理器和存储器,所述存储器用于存储有计算机程序,所述处理器用于执行所述计算机程序以实现上述方法的步骤。
51、本发明带来的有益效果是:
52、1、本发明能够实现通过基因信息来预测小麦生长模型的生育期相关品种遗传参数的目的,有效降低了传统方法获取生育期相关品种遗传参数时需要开展作物田间观测试验的时间和人力成本,降低了模型生育期相关品种遗传参数校正的不确定性,显著增强了作物生长模型生育期相关品种遗传参数的遗传可解释性。
53、2、本发明能够基于机器学习算法实现基因效应和作物生长模拟模型的融合,为基于基因型环境互作效应的作物表性定量模拟模型构建提供了可行性方案,对促进学科交叉和智慧育种奠定基础。
54、3、本发明能够实现基于基因信息定量预测某一基因型小麦在不同生态区域的生育期表型,为定量评估不同基因型品种的生态适应性奠定了良好基础,同时也为进一步基于生长模型实现作物生长发育其他表型和生产力的预测预警提供了数字化支撑,对推动智慧育种、提升种业水平和保障国家粮食安全等具有极其重要的意义。