陆地棉snp标记及其应用
【技术领域】
[0001] 本发明涉及SNP标记,尤其涉及陆地棉SNP标记,本发明还涉及所述陆地棉SNP标 记在陆地棉遗传多样性分析和种质资源鉴定中的应用,属于陆地棉SNP标记的开发领域。
【背景技术】
[0002] 单核苷酸多态性(简称SNPs)标记在基因组中具有数量多、分布密度高的特点,而 且在基因分型过程中不需要根据片段大小判断,可以大规模的自动化的完成。与微卫星标 记等重复序列多态(SSR)标记相比,SNPs具有很高的遗传稳定性,尤其是处在编码区中的 SNPs,工作效率更高,更适合进行大样本量检测分析,因此现在的生物学家认为SNP标记是 很有应用前景的分子标记技术(王建康,盖钧锰.利用杂种F2世代鉴定数量性状主基因一 多基因混合遗传模型并估计其遗传效应.遗传学报,1997, 24(5) :432-440.)。
[0003] 随着棉花基因组研究的深入,二倍体雷蒙徳氏棉、亚洲棉和四倍体陆地棉基因 组测序相继完成(Wang,Κ·,Ζ·Wang,F.Li,W.Ye,J.Wangetal.,2012Thedraftgenome ofadiploidcottonGossypiumraimondii.Nat.Genet.44:1098 - 1103 10.1038/ ng. 2371 ;Li,F.G. ,G.Y.Fan,K.B.Wang,F.M.Sun,Y.L.Yuanetal. , 2014Genomesequence ofthecultivatedcottonGossypiumarboreum.Nat.Genet. 46:567 - 572 10.1038/ Ng. 2987 ;Li,F.G. ,G.Y.Fan,C.R.Lu,G.H.Xiao,C.S.Zhouetal. , 2015Genomesequence ofcultivatedUplandcotton(GossypiumhirsutumTM-1)providesinsightsinto genomeevolution.NATUREBIOTECHNOLOGY,doi: 10. 1038/nbt. 3208),研究者在此基础 上开发了大量的SNP标记,进一步利用这些SNP标记合成了一个63K的棉花SNP芯片 (Hulse-KempA.Μ. ,LemmJ,PlieskeJ,etal.Developmentofa63KSNPArrayfor CottonandHigh-DensityMappingofIntraspecificandInterspecificPopulations ofGossypiumspp.G3(Bethesda)5:1187_1209)〇
[0004] 然而,上述SNP标记在开发的过程中仅仅根据几个棉花种间的序列差异进行标记 开发,并没有考虑棉花基因组的异源多倍性。因此,目前已有的棉花SNP标记及其棉花SNP 芯片并没有对标记的拷贝数进行分析,导致大部分标记在陆地棉基因组中存在多个拷贝, 在进行遗传多样性分析、品种鉴定、群体遗传结构分析及关联分析时的效率比较低。例如, 本发明对目前的63K棉花SNP芯片上的63, 058个SNP进行分析,发现只有21171个标记在 陆地棉中具有多态性,筛选效率仅为33. 57%。在水稻中,目前已经开发出了用于水稻品种 鉴定的SNP芯片(中国专利CN104328507A),然而该发明在开发过程中,尽管考虑了SNP标 记间的连锁不平衡(LD),但是并没有分析具体的连锁不平衡衰退距离。因为处于LD衰退距 离之内的SNP标记往往表现出共分离,这些SNP标记在进行遗传多样性分析、指纹图谱鉴定 时很容易给出错误的信息。
[0005] 因此,开发陆地棉基因组单拷贝SNP标记,并进一步对这些单拷贝SNP标记进行连 锁不平衡分析,获得适于陆地棉遗传多样性分析的SNP标记,对于陆地棉种质资源遗传分 析和发掘优异基因资源具有重要意义。
【发明内容】
[0006] 本发明所要解决的技术问题是提供陆地棉SNP标记,能够用于陆地棉遗传多样性 分析、群体结构分析或种质鉴定等,且分析效率高。
[0007] 为解决上述技术问题,本发明所采取的技术方案是:
[0008] 本发明通过利用芯片杂交和同源序列比对的方法开发出陆地棉基因组单拷贝SNP 标记,进一步通过连锁不平衡分析剔除掉位于连锁不平衡衰退距离内的SNP标记,从而获 得本发明陆地棉SNP标记。
[0009] 本发明所述陆地棉SNP标记所在染色体、SNP位点的物理位置以及核苷酸类型的 具体信息见说明书表2。本发明所述SNP标记的位点的物理位置是基于陆地棉(TM-1)基 因组测序序列确定的;其中,所述陆地棉(TM-1)基因组测序序列的版本号为:G〇SSypium_ hirsutumvl. 0〇
[0010] 利用本发明的SNP标记对120份陆地棉材料进行遗传多样性分析时,全部的4074 个SNP标记在120份材料间均检测到多态性,检测效率达到100%,平均每个SNP标记可以 检测到2个等位基因,检测到的等位基因频率围在0. 5~0. 95,平均为0. 75 ;检测到的基因 多样性范围在0. 1~0. 5,平均为0. 34 ;检测到的PIC值范围为0. 09~0. 38,平均为0. 27。 聚类分析可以明显地将这120份材料按照遗传距离的远近分成不同类群,群体结构分析表 明这120份材料存在明显的群体结构。
[0011] 利用本发明的SNP标记对不同种质材料进行指纹图谱鉴定时,通过筛选针对不同 种质材料鉴定的特征SNP基因型标记,可以实现利用1个SNP标记对特定种质材料进行鉴 定的目的。具体的,所述SNP标记为i00326Gh、i03099Gh、i02807Gh、i03003Gh、i00827Gh、 i03528Gh、i04354Gh、i03143Gh、i00950Gh、i00546Gh、i01389Gh、i01439Gh、i01985Gh或 i03302Gh中的任意一种或多种。
[0012] 本发明进一步公开了用于检测所述陆地棉SNP标记的引物对。根据本发明所述陆 地棉SNP位点对应序列即可设计正向引物和反向引物。引物设计原则为本领域技术人员所 熟知。
[0013] 本发明所述的陆地棉SNP标记能够应用于陆地棉的遗传多样性分析或群体结构 分析中,包括以下步骤:(1)提取待测陆地棉的基因组DNA; (2)利用检测所述陆地棉SNP标 记的引物对,以步骤(1)提取的基因组DNA为模板,进行PCR扩增,得到PCR扩增产物;(3) 对所述PCR扩增产物进行测序,获得测序结果;(4)根据测序结果,确定待测陆地棉在所述 SNP标记的位点的基因型;然后利用相关软件进行陆地棉的遗传多样性分析或群体结构分 析。
[0014] 本发明所述的陆地棉SNP标记能够应用于陆地棉的种质鉴定中,包括以下步骤: ⑴提取待测陆地棉的基因组DNA; (2)利用检测所述陆地棉SNP标记的引物对,以步骤(1) 提取的基因组DNA为模板,进行PCR扩增,得到PCR扩增产物;(3)对所述PCR扩增产物进 行测序,获得测序结果;(4)根据测序结果,确定待测陆地棉在所述SNP标记的基因型;(5) 如果待测陆地棉在所述SNP标记的基因型与本发明所述陆地棉SNP标记的基因型相同,则 鉴定为同一陆地棉品种;反之,则鉴定为不同陆地棉品种。
[0015] 本发明还公开了一种陆地棉SNP芯片,包括:本发明所述的陆地棉SNP标记。本发 明所述的陆地棉SNP芯片能够应用于陆地棉的遗传多样性分析、群体结构分析或种质鉴定 中。
[0016] 本发明技术方案与现有技术相比,具有以下有益效果:
[0017] 本发明开发出了陆地棉基因组单拷贝SNP标记,进一步通过连锁不平衡分析剔除 掉位于连锁不平衡衰退距离内的SNP标记,从而获得适于陆地棉遗传多样性分析、指纹鉴 定或群体结构分析的SNP标记。本发明的SNP位点为单拷贝并且标记间不存在显著的连锁 不平衡,因此在进行杂交检测、测序及PCR荧光扩增检测时不会存在同源序列的干扰,同时 在进行遗传多样性分析、指纹鉴定和群体结构分析时的检测效率大大提高,工作效率更高。
【附图说明】
[0018] 图1为部分染色体上SNP标记的连锁不平衡分布图;其中,(A)、(B)、(C)、⑶分 别表示染色体LG13、LG16、LG22、LG25 ;图中红色部分为高度连锁不平衡区域;
[0019] 图2为是利用本发明的标记进行种质材料聚类分析的NJTREE;
[0020] 图3为是利用本发明的标记进行群体结构分析的deltak的变化图;
[0021] 图4为是利用本发明的标记获得的种质群体的群体结构。
【具体实施方式】
[0022] 下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而 更为清楚。但是应理解所述实施例仅是范例性的,不对本发明的范围构成任何限制。本领 域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节 和形式进行修改或替换,但这些修改或替换均落入本发明的保护范围。
[0023] 实施例1陆地棉SNP标记的开发与应用
[0024] 1、实验方法
[0025] 1. 1供试材料
[0026] 选自120份陆地棉优异种质材料(表1)的嫩绿叶片,提取其总DNA。
[0027] 表1从嫩绿叶片提取其总DNA进行分析的棉花品系和材料
[0028]
[0029]
[0030]
[0031]
[0032] 1· 2总DNA提取方法
[0033]利用DNA提取试剂盒(TaKaRaMiniBESTPlantGenomicDNAExtractionKit, CodeNo. 9768)提取各材料幼苗的DNA,DNA质量要求为:DNA浓度大于50ng/ul;DNA样品 体积大于20ul,DNA总量大于lug,DNA的吸光度260/280比值在1. 7-2. 0之间。
[0034] 1. 3芯片实验
[0035] 使用illumina棉花全基因组SNP芯片(商业途径获得)对样品进行SNP位点的 检测,具体流程参考Infinium芯片实验流程,芯片杂交实验委托北京怡美通德科技发展有 限公司进行操作,使用illuminaGenomestudio(v2011),Gentrain2. 0算法,自动聚类对样 本进行分型。根据分型结果,筛选MAF&