1.一种构建异交物种高密度基因型图谱的方法,其特征在于,所述方法包括下述步骤:
步骤1、对目标植物的亲本材料进行高覆盖测序,对目标植物的子代群体材料进行低覆盖测序,获得相应测序结果;
步骤2:将亲子代群体测序获得的序列比对到目标植物的现有基因组上,并得到变异文件,所述变异文件中包含每个被测序材料测得的变异位点信息;
步骤3:基于亲本材料的测序结果,对所有亲子代测序比对结果中的snp位点进行筛选,将筛选出的snp位点进行区段划分,并基于划分后各区段内基因片段的亲缘关系进行基因型分类;
步骤4:对各个区段中每个材料的基因型进行单倍体类型统一和缺失基因型填充。
2.根据权利要求1所述的方法,其特征在于,
所述步骤3包括:
步骤3.1:基于亲本材料的测序结果,从目标植物测得的基因序列中,挑选至少一个亲本是杂合的snp位点;
步骤3.2:从所挑选出的位点中,过滤掉子代缺失严重的位点和低质量的变异位点;
步骤3.3:以预定序列长度作为窗口对所有材料的测序结果进行分区,所述窗口设置使得每个窗口内的标记数目不小于预定值且不小于预定的局部基因组区域长度,并计算每个窗口内两两材料之间的亲缘关系,用作相关系数;
步骤3.4:每个区段内根据材料之间的相关系数对各区段内的材料进行聚类。
3.根据权利要求1所述的方法,其特征在于,
所述步骤4包括:将每个窗口内不同测序材料的聚类结果进行比对,将相同材料的分类结果进行统一,并根据缺失位点的上下游类型填充缺失位点的基因型。
4.根据权利要求1所述的方法,其特征在于,
对于双交种群体植物,将其位点分为两类,第一类为在四种单倍型中基因型分离比为3:1的变异位点,第二类为2:2的变异位点。
5.根据权利要求1所述的方法,其特征在于,
对于同源多倍体植物,所述步骤3还包括:
步骤3.1、筛选两个亲本中至少一个亲本的六个单倍型是1:5的snp位点,即单一型单核苷酸多态性simplexsnp或双单一单核苷酸多态性double-simplexsnp位点;
步骤3.2、根据每种材料基因序列中标记的数目和预定序列长度作为窗口对其基因序列进行分区段。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括基于异交植物的类型分别为每种植物选择不同的分区段窗口。
7.根据权利要求1所述的方法,其特征在于,基因填充的步骤包括:
如果缺失的位点在整条基因序列的头部则将缺失基因型与其最近的已知基因型设置为一致,如果缺失的位点在整条基因序列尾部则将缺失基因型与其最近的已知基因型设置为一致,如果缺失部位上端已知基因型与缺失部位下端已知基因型一致,则将缺失部分填充为该基因型;
如果缺失部位上端已知基因型与缺失部位下端已知基因型不一致,则缺失部分上半部分填充上端已知基因型,缺失部分下半部分填充下端已知基因型。
8.根据权利要求1所述的方法,其特征在于,所述筛选包括基于亲本是否为杂合位点进行筛选。