一种基于混合线性模型的种子数量性状位点定位方法
【专利摘要】本发明公开了一种基于混合线性模型的种子数量性状位点定位方法,包括:建立统计遗传模型;在全基因组范围内搜索所有可能存在QTL的候选标记区间:将所述的候选标记区间作为协变量,在全基因组范围内搜索显著的QTL位点和二互作标记区间;以所述的QTL位点和二互作标记区间作为协变量,在显著的互作标记区间内搜索显著的二互作上位性的位点;通过所述QTL位点和二互作上位性的位点,获得统计遗传模型中各种效应的系数,然后通过统计遗传模型,计算这些位点的效应以及估算每个位点的遗传率。本发明将种子性状分成二倍体种子和三倍体种子,考虑了上位性效应及基因与环境互作的效应,可快速无偏的估计种子数量性状位点的位置及各种效应。
【专利说明】一种基于混合线性模型的种子数量性状位点定位方法
【技术领域】
[0001]本发明涉及种子数量性状位点定位领域,具体涉及一种基于混合线性模型种子数量性状位点定位方法。
技术背景
[0002]作物种子是人类食物,动物饲料以及工业原料的主要来源。胚或胚乳是种子中的主要成分。胚乳作为储藏营养物质的主要器官,比如碳水化合物,蛋白质和矿物质等,它同时也会胚的发育提供营养。胚乳在有些物种成熟时会消失,比如拟南芥。无论胚乳消失与否,它都将会对胚的发育产生影响。此外,种子是长在母体植株中,因此母体植株对种子的发育也会产生影响。种子数量性状位点定位的研究已经成为数量遗传领域的研究热点之
一 O
[0003]近年来,种子数量性状位点的定位尤其是对农作物品质性状的研究方面的应用十分广泛。
[0004]早在1994年,莫惠栋(Mo HD.Genetic analysis for qualitative-quantitativetraits II1.Endosperm character under triploid genetic control.Acta agronomicaSinica,1994,20 (5):513-519)提出了一个统计遗传模型,可以把种子性状的表型方差分解为各种各样的遗传和环境因子。1994年,朱军和Bruce Weir (Zhu J, Weir.BSAnalysisof Cytoplasmic and Maternal Effects.2.Genetic Models for Triploid Endosperms.Theor Appl Genet,1994,89 (2-3): 160-166)进一步提出了混合线性模型方法,利用双列杂交试验分析了母体效应,胚,胚乳和细胞质效应,以及各种效应与环境的互作。以上这些方法都只能把种子性状的遗传变异分解为各种各样的方差分量,把控制性状的所有基因当做一个整体来分析,而不能得到单个基因水平上的更详细的信息,比如数量性状位点的位置以及存在的各种效应。
[0005]随着分子标记技术的发展,数量性状位点定位的方法被提出和运用到作物种子性状的定位研究中。但是种子中的主要成分胚乳是三倍体,因此不能用一般的定位方法。基于这个遗传背景,Kao (Kao CH.Multiple-1nterval Mapping for Quantitative Trait LociControlling Endosperm Traits.Genetics, 2004, 167 (4): 1987-2002)在 2004 年提出运用多区间作图方法,同时充分考虑到三倍体胚乳的性质。这种方法可以分析胚乳的各种效应。然而,种子一个很重要的特征是,它长在母体植株上,因此种子的发育也会受到母体植株的影响。鉴于此,Hu 和 Xu(Hu ZQ, Xu Cff.A New Statistical Method for Mapping QTLsunderlying Endosperm Traits.Chinese Sci Bull, 2005, 50 (14): 1470-1476)提出了一个统计遗传模型,他们把母体基因组和后代基因组整合在同一个模型中,使模型更加接近种子性状发育的遗传机制。
[0006]据我们所知,上位性,即一个基因的表达依赖于另外一个基因,在数量性状的发育和进化中起着重要的作用。大量的研究已经表明,上位性对性状的遗传变异也产生了不可忽略的贡献。通常所说的上位性,指的是来自同一基因组的两个基因之间的互作;然而在种子性状中,存在着两个不同的基因组,因此上位性的两个基因可能是来自不同的基因组。随着人们对上位性的重要性的深入了解,大量的遗传模型已经被提出来。在种子性状的研究中,Cui (Cui Y, Wu R.Mapping Genome-genome Epistasis: A High-dimensional Model.Bioinformatics, 2005, 21 (10):2447-2455)提出了一种统计方法和框架去探索母体和后代的基因组之间的互作关系。
[0007]然而,迄今为止,尚未见有报道环境效应以及基因与环境的互作效应,也没有把上位性和基因与环境互作效应整合在一个模型中的方法。
【发明内容】
[0008]本发明提供了一种基于混合线性模型种子数量性状位点定位方法,充分考虑到种子性状的遗传机制,把种子性状分成主要以胚控制的二倍体种子和主要以胚乳控制的三倍体种子。在本发明中,把母体基因组和后代基因组整合在同一个遗传模型中,同时把同一基因组和不同基因组之间的上位性效应以及基因与环境互作的效应加入到模型中,能够快速无偏的估计种子数量性状位点的位置以及各种效应,提高了育种学家进行分子辅助育种的效率和精确性。
[0009]一种基于混合线性模型的三倍体种子数量性状位点定位方法,包括:
[0010]( 1)统计遗传模型的建立:
[0011]对一衍生于两个纯合亲本(Pl,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL (Ql,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhiJ)可用下面的混合线性模型(I)表示:
【权利要求】
1.一种基于混合线性模型的三倍体种子数量性状位点定位方法,其特征在于,包括: (1)统计遗传模型的建立: 对一衍生于两个纯合亲本(Pl,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL (Q1,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhij)可用下面的混合线性模型(I)表示:
2.如权利要求1所述的基于混合线性模型的三倍体种子数量性状位点定位方法,其特征在于,步骤(6)中,通过模型(1),计算得到这些位点的效应以及估算每个位点的遗传率时,首先给每个未知的参数一个初始值,随机效应的方差估计通过最小范数二阶无偏估计法获得,固定效应的估计通过最小二乘法获得,随机效应通过调整的无偏预测法预测,然后把这些得到的值作为后验值通过吉布斯抽样放入马尔科夫链蒙特卡洛循环链中,通过归纳吉布斯的所有样本的结果,最终得到每个效应的估计值以及估算每个位点的遗传率。
3.一种基于混合线性模型的二倍体种子数量性状位点定位方法,其特征在于,包括: (I)统计遗传模型的建立 对一衍生于两个纯合亲本(Pl,P2)的交配作图群体,假设在t个不同的环境下进行遗传实验,每个环境设置b个区组,某一种子数量性状的变异受s个QTL (Q1,Q2,……,Qs)和t个上位性的调控,则环境h中第j个区组内第i个株系后代种子性状表型观测值(yhij)可用下面的混合线性模型表示:
4.如权利要求3所述的基于混合线性模型的二倍体种子数量性状位点定位方法,其特征在于,步骤(6)中,通过模型(6),计算得到这些位点的效应以及估算每个位点的遗传率时,首先给每个未知的参数一个初始值,随机效应的方差估计通过最小范数二阶无偏估计法获得,固定效应的估计通过最小二乘法获得,随机效应通过调整的无偏预测法预测,然后把这些得到的值作为后验值通过吉布斯抽样放入马尔科夫链蒙特卡洛循环链中,通过归纳吉布斯的所有样本的结果,最终得到每个效应的估计值以及估算每个位点的遗传率。
【文档编号】G06F19/12GK103632067SQ201310549029
【公开日】2014年3月12日 申请日期:2013年11月7日 优先权日:2013年11月7日
【发明者】徐海明, 祁婷, 曹玉杰, 祝水金, 楼向阳 申请人:浙江大学