对转基因边界的高通量分析的制作方法
【专利摘要】本发明是鉴定在已知DNA序列侧翼的未知DNA序列的方法。本发明改善了测定在已知DNA序列侧翼的未知DNA序列的准确性、灵敏性、和再现性。此要求保护的方法可以作为高通量方法配置以快速且有效鉴定在转基因侧翼的植物基因组染色体序列。可以使用对这些未知序列的进一步分析来表征转基因插入位点,从而鉴定源自转基因整合的重排、插入和缺失。另外,可以使用对染色体侧翼序列的分析来鉴定转基因在染色体上的位置。
【专利说明】对转基因边界的高通量分析
发明领域
[0001] 一般而言,本发明涉及植物分子生物学和生物化学领域。本发明关注用于分析转基因边界及测定在转基因侧翼的染色体序列的改良的聚合酶链式反应(PCR)方法。
[0002]发明背景
[0003]测定与插入转基因相邻的染色体侧翼序列和基因组位置在技术上是挑战性的。已经开发出多种方法来克服鉴定在已知DNA序列侧翼的未知DNA序列的限制。然而,这些用于鉴定在已知转基因侧翼的基因组染色体序列的传统PCR方法诸如LM-PCR(又称为基因组步移(Genome Walking))和其它方法(包括:反向PCR(1-PCR)、热不对称交错PCR(TAIL-PCR)、锚式 PCR(a-PCR)和随机引发(randomly primed)PCR(rm-PCR))由于制备过程中的DNA损失而受到低检测灵敏性(需要大量模板DNA)或低特异性阻碍。
[0004]聚合酶链式反应(PCR)是一种通常采用的分子生物学方法。该方法如下实施:使双链模板DNA变性,将寡核苷酸引物与DNA模板退火,并经由DNA聚合酶延伸DNA链。寡核苷酸引物设计为与DNA的相反链退火,并且定位为使得由DNA聚合酶生成的DNA链充当另一引物的模板链。重复每个循环,导致DNA片段的指数扩增。(Mullis等,美国专利N0.4,683,195,4,683,202,及4,800,159)。本领域技术人员使用PCR对于扩增和分离DNA片段以进行后续分析是基本的。
[0005]经由聚合酶链式反应(PCR)分离和分析DNA模板要求侧翼DNA序列的知识。不幸的是,此要求限制对已知DNA序列区域的PCR扩增。使用PCR方法鉴定转基因位置在基因组内的位置受到转基因对生物体基因组内未知染色体位置的随机插入阻碍。鉴定与已知DNA序列相邻定位的未知DNA序列的方法对于鉴定生物体染色体内的转基因位置是必要的。另外,可以使用此类方法鉴定新颖的基因序列,从而鉴定新性状,测定已经插入生物体的基因组中的转座子或病毒序列的基因组位置,或者鉴定经由插入诱变插入基因组中的多核苷酸序列的染色体位置。
[0006]已经开发出多种方法来克服在已知DNA序列侧翼的未知DNA序列的限制。连接介导的PCR(LM PCR)方法(其中生成基因组文库,并将衔接头与DNA片段退火以进行 PCR 扩增)以 GENOME WALKER UNIVERSAL KITTM (参见美国专利 N0.5,565,340,及美国专利N0.5,759,822)销售。常用的另一种方法是反向PCR反应(参见Silver andKeerikatte (1989),J.Virol.,63:1924-1928),其中将DNA用限制酶消化,并自身连接,生成连续环。使用结合已知序列的寡核苷酸引物的PCR扩增导致未知侧翼序列的扩增和阐明。不幸的是,这些方法是效率低的且费时的。这些和其它传统PCR法(包括热不对称交错PCR[TAIL-PCR]、锚式PCR[a_PCR]和随机引发PCR[rm_PCR])由于制备过程中的DNA损失而受到低检测灵敏性(需要大量模板DNA)或低特异性阻碍。
[0007]可以通过纯化含有已知的和未知的DNA序列两者的染色体DNA片段来改善检测灵敏性的方法的开发可以产生用于检测和表征与已知DNA序列相邻定位的未知DNA区的灵敏方法。线性扩增介导的聚合酶链式反应(LAMPCR)方法的开发实现这些目的。参见美国专利No6,514,706。LAM PCR法特别适合于扩增和分析其序列仅部分已知的DNA片段。[0008]可以通过纯化含有已知的和未知的DNA序列两者的染色体DNA片段来改善检测灵敏性的方法的开发可以产生用于检测和表征与已知DNA序列相邻定位的未知DNA区的灵敏方法。LAM PCR法的开发实现这些目的。LAMPCR是一种用于分析与已知DNA序列相邻定位的未知染色体侧翼序列的改良PCR方法。可以使用LAM PCR法来将在已知DNA或RNA区侧翼的未知DNA或RNA序列鉴定和/或测序。
[0009]LAM PCR方法由下列步骤组成。使用染色体DNA作为模板和结合染色体DNA内的已知DNA序列的寡核苷酸引物实施引物延伸反应。寡核苷酸引物与长末端重复(LTR)序列(其是逆转录病毒特征性序列)互补,并将其在寡核苷酸引物末端用生物素标记。将线性PCR的单链DNA产物结合到具有固定化的链霉抗生物素蛋白的磁珠。此步骤用以分离含有源自染色体的已知LTR序列和未知序列的单链扩增DNA片段。通过合成互补链将单链DNA转化成双链DNA。用识别序列并在该序列处切割双链DNA的限制酶切割双链DNA。将称作接头盒的双链DNA与末端连接。使用如此获得的连接产物作为模板以及与LTR互补的引物和与接头盒互补的引物进行后续的PCR反应。扩增DNA片段,其含有LTR和与LTR相邻的染色体DNA侧翼序列。因此,可以测定先前未知的逆转录病毒整合位点。
[0010]目前认为LAM PCR法是一种用于分析与已知DNA序列相邻的未知DNA序列的有效系统。本领域中已经描述了对LAM PCR法的修改和改善。参见美国专利申请US2007/0037139 及 Harkey 等,(2007) Stem Cells Dev.,June; 16 (3): 381-392。
[0011]在美国专利申请US2007/0037139中修改LAM PCR法以改善具有在多个位点处整合的逆转录病毒的生物学样品的检测。传统LAM PCR法的反应条件产生的结果没有反应样品细胞群中存在的克隆的实际状态。开发一种修改,其中在不偏向自特定克隆扩增的片段的情况下PCR扩增更多的整合片段。对LAM PCR法的修改容许研究人员测定群体中具有整合基因的细胞的程度以及测定群体中特定细胞的比率。
[0012]另外,Harkey等(2007)描述了一种经优化的、多臂、高通量LAM PCR法修改,其中检测能力在穷尽取样的情况下改善90%。修改的方案促进总集合大小的准确评估,如此提供用于产生载体整合的优选基因组位置的较大插入位点数据的快速的、成本有效的办法。
[0013]本发明描述了一种进一步重要的修改,并且解决几种传统的LAM-PCR问题,其通过消除如下的步骤实现:生成双链DNA片段,然后消化双链DNA片段,并使双链DNA片段变性。
[0014]发明概述
[0015]本发明提供了一种用于在分离的植物DNA中寻找与已知的多核苷酸序列相邻的未知多核苷酸序列的方法,其包括用一种或多种合适的限制酶消化含有部分或整个的所述已知多核苷酸序列和相邻的未知多核苷酸序列的所述分离的植物DNA以生成多个经消化的多核苷酸限制性片段;使用寡核苷酸引物序列合成所述经消化的多核苷酸限制性片段的互补链,所述寡核苷酸引物序列具有与所述寡核苷酸引物序列的5’端结合的附接化学;通过将所述附接化学与合适的分离基质结合,然后使所述互补链变性从所述经消化的多核苷酸限制性片段分离所述互补链;将单链衔接头与结合到所述分离基质的分离的互补链连接以生成连接的分离的互补链;使用第一 PCR引物和第二 PCR引物对所述连接的分离的互补链实施第一 PCR扩增以生成第一 PCR扩增子,所述第一 PCR引物设计为结合已知的多核苷酸序列,所述第二 PCR引物设计为结合所述单链衔接头;对所述第一 PCR扩增子实施第二PCR扩增以生成第二 PCR扩增子,其中所述第二 PCR扩增扩增所述第一 PCR扩增子的内部序列;并对所述第二 PCR扩增子测序以确认所述未知多核苷酸序列的序列。
[0016]本文中公开的本发明的一个实施方案是用于分离和鉴定转基因边界序列的方法。本发明的一个实施方案是容易可适用于高通量应用以测定转基因拷贝数和基因组插入位点的染色体位置的方法。另外,本发明可以用于在一个反应内同时检测多个插入位点。本发明公开了在检测在已知多核苷酸片段侧翼的未知多核苷酸片段方面具有改善的灵敏性和特异性的方法。此外,本发明可以配置以检测与任何靶序列相邻定位的未知DNA序列,所述靶序列包括病毒序列和通过转座子诱变或经由T链整合产生的诱变创建的插入诱变位点。
[0017]本发明的一个实施方案部分涉及使用此类侧翼、接合、和插入物序列的转基因事件鉴定。依照本发明,使用跨越插入转基因DNA及其边界的扩增子的修改的PCR分析和DNA测序分析法可以用于检测或鉴定源自专有转基因植物系的商业化转基因植物品种或品系。
[0018]本发明的转基因边界和相邻染色体侧翼序列可以诊断转基因事件。基于这些序列,可以通过分析染色体侧翼和转基因序列在不同植物基因型中鉴定转基因植物系。如此,本发明的一个实施方案描述了可以用于鉴定转基因植物系的方法。
[0019]本发明的染色体侧翼序列与植物育种结合特别可用于为了在后代中赋予一种或多种额外的感兴趣性状,在将包含感兴趣事件的亲本植物与另一种植物系杂交后,测定哪些后代植物包含给定的事件。本发明的一个实施方案是测定染色体侧翼/接合序列以有益于育种程序及质量控制,尤其是对于商业化的转基因植物系。
[0020]此外,染色体侧翼序列的鉴定可以用于特异性鉴定每个转基因插入物的基因组位置。可以使用此信息开发对每个事件特异性的分子标志物系统。这些分子标志物系统可以用于加速的育种策略及建 立连锁数据。本发明的一个实施方案是分子标志物系统。
[0021]更进一步,可以使用染色体侧翼序列信息来研究和表征转基因整合过程、基因组整合位点特征、事件分选、转基因及其侧翼序列的稳定性、和基因表达(尤其涉及基因沉默、转基因甲基化样式、位置效应、和潜在的表达相关元件诸如MARS (基质附着区),等等)。
[0022]可以使用本发明的方法来获得并确认来自转基因生物体的未知多核苷酸的序列。在本发明的任何方法中,样品可以是基因组DNA,而转基因生物体可以是转基因植物。通过本发明的任何方法分析的转基因植物可以下组植物:大麦、玉米、燕麦、高粱、草地草(turfgrass)、甘鹿、小麦、苜猜、香蕉、花莖甘蓝(broccoli)、豆、甘蓝(cabbage)、芸苔(canola)、胡萝卜、木薯、花椰菜(cauliflower)、疗菜(celery)、柑橘(citrus)、棉、葫芦、桉树、亚麻、大蒜、葡萄、洋葱、莴苣、豌豆、花生、胡椒、马铃薯、杨树(poplar)、松(pine)、黑麦、稻、向日葵、红花(safflower)、大豆、草莓、甜菜、甘薯(sweet potato)、烟草、番爺、观赏植物、灌木、坚果、黍(millet)、和牧草(pasture grass)。
[0023]可以使用本发明的方法来获得并确认来自非转基因生物体的未知多核苷酸的序列。在本发明的任何方法中,样品可以是基因组DNA,而非转基因生物体可以是植物。通过本发明的任何方法分析的植物可以下组植物:大麦、玉米、燕麦、高粱、草地草(turf grass)、甘鹿、小麦、苜猜、香蕉、花莖甘蓝(broccoli)、豆、甘蓝(cabbage)、芸苔(canola)、胡萝卜、木薯、花椰菜(cauliflower)、疗菜(celery)、柑橘(citrus)、棉、葫芦、桉树、亚麻、大蒜、葡萄、洋葱、莴苣、豌豆、花生、胡椒、马铃薯、杨树(poplar)、松(pine)、黑麦、稻、向日葵、红花(safflower)、大豆、草莓、甜菜、甘薯(sweet potato)、烟草、番爺、观赏植物、灌木、坚果、黍(millet)、和牧草(pasture grass)。在本发明的任何方法中,与已知多核苷酸序列相邻的未知多核苷酸序列可以是农艺学目的的天然多核苷酸。
[0024]序列简述
[0025]SEQ ID NO:1描述了 5’生物素化的引物,标记为4468-3PA01_2Btn。
[0026]SEQ ID NO:2描述了 5’磷酸化的衔接头,标记为ZC-Adp-Ol。
[0027]SEQ ID NO:3 描述了标记为 PAT-1nvPriF 的引物。
[0028]SEQ ID NO:4 描述了标记为 Zn_Adt_PCR_01 的引物。
[0029]如本文中使用的,术语“包括”、“包括”、“具有”、“含有”或其任何其它变型意图是非排他的或开口的。例如,包含一批要素的组合物、混合物、过程、方法、物品、或装置不必仅限于那些要素,而是可以包含其它没有明确列出或所述组合物、混合物、过程、方法、物品、或装置固有的其它要素。此外,除非明确相反叙述,“或”指包含的或而非排他的或。例如,下列任一项满足条件A或B:A是正确的(或存在的)且B是错误的(或不存在的),A是错误的(或不存在的)且B是正确的(或存在的),以及A和B两者是正确的(或存在的)。
[0030]还有,在本发明的要素或组分前的不定冠词“一个”和“一种”就例子的数目,即要素或组分的出现而言是非限制性的。因此,“一个”或“一种”应当解读为包括一个/种或至少一个/种,并且要素或组分的单数词语形式还包括复数的,除非数字明显意味着是单数的。
[0031]术语“核酸”、“多核苷酸”、“多核苷酸序列”和“核苷酸序列”用于指核苷酸(A、C、T、U、G,等等或天然存在的或人工的核苷酸类似物)的聚合物,例如DNA或RNA,或其表示,例如字符串,等等,这取决于相关背景。术语“核酸”和“多核苷酸”在本文中可互换使用;这些术语提及DNA、RNA、或本发明的其它新颖的核酸分子使用,除非上下文另有叙述或明显矛盾。可以从任何规定的核苷酸序列确定给定的多核苷酸或互补多核苷酸。核酸可以为单或双链形式。
[0032]术语“分离的”指如下的材料,诸如核酸或蛋白质,其⑴基本上或实质性不含通常伴随其天然存在环境中找到的材料或与该材料相互作用的组分,或者(2)若材料在其天然环境中,则该材料已经通过对组成的有意人为干预而改变和/或置于细胞中与该材料天然位置不同的位置处。
[0033]术语“植物”包括植物和植物部分,包括但不限于植物细胞和植物组织,诸如叶、茎、根、花、花粉、和种子。一般地,可以在本发明中使用的植物类别与适合于诱变的高等和低等植物类别,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类和多细胞藻类一样宽。
[0034]术语“启动子”通常指指导结构基因转录以生成RNA的DNA序列。通常,启动子位于基因上游500个碱基对、在转录起始位点附近的区域中。若启动子是诱导型启动子,则转录速率响应外源或内源诱导剂而升高或降低。比较而言,若启动子是组成性启动子,则转录速率在较小程度上受到诱导剂调节。
[0035]术语“转基因植物”指源自经转化的植物细胞或原生质体的植物或其后代,其中植物DNA含有最初不存在于其天然的、非转基因植物中的导入的外源DNA分子。
[0036]如本文中使用的,术语“载体”指可以为了转化,即将异源DNA导入宿主细胞中使用的任何重组多核苷酸构建体。[0037]术语“互补链”描述了核酸序列或分子,其中一个分子中的每个碱基与另一条链中的其互补碱基配对,以形成稳定的螺旋双链分子。个别链称作互补链。
[0038]术语“寡核苷酸引物”是与要扩增的5’或3’的核苷酸序列互补的长度为约10至约50个核苷酸的线性寡核苷酸的序列。可以使用一对寡核苷酸引物来扩增多核苷酸序列,其中引物之一与要扩增的多核苷酸片段5’的核苷酸序列互补,而该对的另一种引物与位于要扩增的多核苷酸片段3’的核苷酸序列互补。本领域技术人员理解一对寡核苷酸引物意味着与核酸相反链互补且在要扩增的多核苷酸序列侧翼的两个寡核苷酸。
[0039]术语“衔接头”描述了一种可以在平端或粘端与多核苷酸分子连接的短的寡核苷酸多核苷酸段。衔接头可以含有多核苷酸片段内的限制酶识别位点。衔接头的大小可以从长度约10变化至约150个核苷酸。衔接头可以是单链或双链的。
[0040]术语“连接的分离的互补链”指包含经由连接反应与含有部分或整个的已知多核苷酸序列和相邻的未知多核苷酸序列的第二 DNA片段连接的衔接头的多核苷酸片段。“连接的分离的互补链”侧翼有一端的衔接头和另一端的已知多核苷酸序列。
[0041] 连接反应通过一般称为连接酶的酶完成,所述连接酶催化DNA中相邻的3’ -OH和5’ -P端之间的磷酸二酯键的形成。
[0042]可以通过本领域中已知的方法实现植物DNA的分离。一般地,植物DNA的分离导致获得纯化的植物DNA,其不含脂质、蛋白质和其它细胞碎片。优选的植物DNA分离方法包括:裂解、加热、醇沉淀、盐沉淀、有机提取、固相提取、硅胶膜提取、CsCl提取纯化、和其任何组合。更优选的植物DNA分离方法是以DNeasy试剂盒(Qiagen, Valencia, CA)销售的娃胶膜技术或溴化十六烷基三甲铵(CTAB)DNA分离方案。
[0043]限制酶消化,又称为限制性内切核酸酶消化在使用酶核酸酶切割多核苷酸序列时实施。存在有本领域技术人员可用的许多限制酶。如在WWW.neb.com/nebecomm/tech_reference/restriction_enzymes/overview.asp描述的,使用四种分类来表征限制酶。基于亚基组成、切割位置、序列特异性和辅因子要求做出这些分类。
[0044]I型酶在离识别/结合序列一段距离(远离大于1,OOObp)的位置处随机切割DNA。I型酶结合的识别位点是不对称的。因此,这些酶不用于基因克隆,因为这些酶不生成离散的限制性片段或独特的凝胶显带样式。I型酶是多功能性的,并且构成I型限制酶的不同亚基负责不同活性(即,亚基HsdR编码限制,亚基HsdM编码DNA的甲基化,而亚基HsdS编码识别序列的特异性)。
[0045]II型酶在位于识别序列的紧密接近性内的位置处消化DNA。这些酶发挥二聚体功能,其中亚基结合有义链,而亚基的第二个拷贝在回文顺序处结合反义链,所述回文顺序的长度通常是4-8个核苷酸。结合DNA的II型二聚体可以是结合对称DNA序列的同二聚体,或结合不对称DNA序列的异二聚体。所述酶可以识别连续序列或不连续序列。II型酶是商品化的,并且通常用于DNA分析和基因克隆。这些酶的普遍使用是生成并且可以在琼脂糖凝胶上解析的独特限制性片段的结果。
[0046]II型酶是在氨基酸序列相似性方面高度趋异的无关蛋白质的集合。II型酶已经分成亚类,其使用字母后缀标记。IIB型限制酶是含有超过一个亚基的多聚体。这些酶切割识别序列的两侧,由此导致识别序列的除去。IIE型和IIF型限制酶在与其识别序列的两个拷贝相互作用后切割DNA。IIG型限制酶由单个亚基构成。该酶的N端部分拥有DNA切割域和DNA修饰域。该酶的C端部分拥有DNA序列结合域。这些酶在其识别序列外部切割。IIM型限制酶识别并切割甲基化的DNA。IIS型限制酶发挥二聚体功能,并且在非回文不对称识别位点外部的位置处切割DNA。这些酶由两个独特的域构成,一个用于DNA结合,而另一个用于DNA切割。
[0047]III型酶是组合限制和修饰酶。这些酶识别两个分开的非回文序列,并且在其识别序列外部切割。III型酶需要同一 DNA分子内相反取向的两个识别序列来实现切割。
[0048]IV型酶识别甲基化的DNA。例子包括大肠杆菌(E.coli)的McrBC和Mrr系统。
[0049]用于切割多核苷酸的其它方法是本领域中已知的,并且可以替换用限制酶消化多核苷酸使用,即下组任一项:裂解、序列特异性切割剂、非序列特异性切割剂、超声处理、剪切压(shear-stress)、French压、UV福射、电离福射、和DNA酶。在上文所描述的限制酶外,可以使用归巢内切核酸酶或Flap内切核酸酶或这些酶的任何组合来消化分离的DNA。用于消化分离的植物DNA的优选方法是使用II型限制酶,已知该II型限制酶在转化入植物中的转基因序列外部切割。另一种用于消化分离的植物DNA的优选方法是使用II型限制酶,已知该II型限制酶在紧密接近转基因序列末端的位点处切割。
[0050]使用引物延伸反应来生成含有已知多核苷酸序列和未知相邻多核苷酸序列的DNA或RNA链。引物延伸方法导致含有未知多核苷酸序列的DNA或RNA的互补链的生成。DNA或RNA的互补链由聚合酶生成,所述聚合酶在与已经结合DNA或RNA的已知模板链的寡核苷酸引物复合后沿着DNA或RNA模板链延伸。寡核苷酸引物设计为特异性结合DNA或RNA模板链内的已知DNA或RNA序列。许多类型的用于延伸反应的聚合酶是商品化的;T4聚合酶、TAQ聚合酶、PFU聚合酶、或逆转录酶是常用的聚合酶的几种非限制性例子。每种聚合酶具有特殊的缓冲液要求,并且对于最佳的反应条件,于特定温度发挥功能。优选的引物延伸反应是使用以Platinum Taq试剂盒销售的TAQ聚合酶。
[0051]使用附接于分离 基质诸如基于磁珠的系统的附接化学来分离通过引物延伸反应生成的单链DNA。可以经由链霉抗生物素蛋白-生物素相互作用从基因组DNA纯化通过引物扩增反应生成的DNA链。生物素化广泛用于实现生物分子的分离、分开、浓缩及进一步的下游加工和分析(例如记载于美国专利N0.5,948,624,美国专利N0.5,972,693,及美国专利N0.5,512,439的方法)。存在有多种靶向不同官能团,如伯胺、氢硫基、羧基、碳水化合物、酪氨酸和组氨酸侧链及花青素(cyianidine)和胞嘧啶碱基的商品化生物素化试剂。使用用生物素(或等同物,例如洋地黄毒苷)功能化的短的、序列特异性寡核苷酸引物和磁珠从基因组分开特定的DNA序列以供后续分析具有多种用途。使用基于珠的方法的分离容许富集特定序列的DNA群,容许实施如下的后续分析,其不能在存在DNA的整个基因组互补物的情况中完成。此类基于珠的方法适合于高通量自动化。
[0052]虽然生物素-链霉抗生物素蛋白相互作用是描述得最好的结合对,但是彼此具有强亲和力的其它分子是已知的。可以纳入寡核苷酸引物中的附接化学包括:ACRYDITETM,SP一种基于丙烯酸亚磷酰胺的附接化学,所述丙烯酸亚磷酰胺可以以5’ -修饰添加到寡核苷酸,并且与经硫醇修饰的表面起共价反应;炔修饰,其与经叠氮化物标记的官能团起反应以经由叠氮化物炔Huisgen环加成反应(又称为Click反应)形成稳定的键;和硫醇修饰,其可以以针对相应的配体或表面(诸如金表面)的高亲和力偶联及相互作用。这些分子可以用于纯化或富集DNA序列。其中,引物用第一分子标记,并且第二分子结合到可以固定化第一分子的基质(例如,磁珠)。可以通过在柱上运行DNA分离自用第一分子标记的引物生成的DNA链,所述柱含有用第二分子标记的固定化基质(例如磁珠)。由于针对第二分子的亲和力,分离含有用第一分子标记的引物的扩增DNA序列。优选的附接化学包括丙烯酸-硫醇相互作用、炔-叠氮化物相互作用、和硫醇-配体相互作用。更优选的附接化学是链霉抗生物素蛋白-生物素相互作用。
[0053]如本文中所使用的,术语分离基质指可以附接有任何种类的分子的表面。优选地,分离基质是不溶性材料,其可以附接于分子,从而所述分子可以容易地与反应中的其它成分分开。优选的反应基质可以包括但不限于滤器、层析树脂、珠、磁性颗粒、或包含玻璃、塑料、金属、一种或多种聚合物及其组合的组合物。更优选的分离基质是基于磁珠的系统。
[0054]可以经由单链连接酶将衔接头与固定化的单链DNA连接。传统上,商品化的连接酶仅可用于连接双链DNA片段。最近,已经显示了可以使用RNA连接酶连接单链DNA片段(Zhang and Chiang(1995)Nucleic Acids Research, 24(5) ;990-991)。优选的单链连接酶是商品化的,并且以 CIRCLIGASE?(Epicentre Biotechnologies, Madison, WI)、T4RNA 连接酶 I 和 T4RNA 连接酶 2(New England Biolabs, Ipswich, MA)、和单链 DNA 连接酶(Wako Chemicals, Richmond, VA)销售。更优选的单链DNA连接酶是来自EpicentreBiotechnologies (Madison, WI)的热稳定性 RNA 连接酶(TRL)。
[0055]如由Brautigma等,2010描述的,可以使用DNA序列分析测定分离的且扩增的片段的核苷酸序列。可以将扩增片段分离并亚克隆入载体中,并使用链终止剂方法(又称为Sanger测序)或染料终止剂测序来测序。另外,可以用下一代测序(Next GenerationSequencing)对扩增子测序。NGS技术不需要亚克隆步骤,并且可以在单一反应中完成多次测序阅读。三种NGS平台是商品化的,即来自454Life Sciences?Roche的基因组测序仪FLX、来自Solexa的Illumina基因组分析仪和Applied Biosystems的SOLiD (首字母简略词代表:“通过寡聚物连接和检测的测序”)。另外,存在有两种目前开发中的单一分子测序方法。这些包括来自Helicos B ioscience的真正单分子测序(true Single MoleculeSequencing, tSMS)和来自 Pacific Biosciences 的单分子实时测序(SMRT)。
[0056]由454Life Sciences/Roche销售的基因组测序仪FLX是一种长阅读NGS,其使用乳剂PCR和焦磷酸测序(pyrosequencing)来产生测序阅读。可以使用300_800bp的DNA片段或含有3-20kbp片段的文库。反应每次运行可以产生超过100万个约250至400个碱基的阅读,总产量是250至400兆碱基。此技术产生最长的阅读,但是每次运行的总序列输出与其它NGS技术相比较低。
[0057]由Solexa销售的Illumina基因组分析仪是一种短阅读NGS,其使用通过用经突光染料标记的可逆终止剂核苷酸的合成办法的测序,并且基于固相桥式PCR。可以使用含有多至IOkb的DNA片段的成对末端测序文库的构建。反应产生超过I亿个长度为35-76个碱基的短阅读。此数据每次运行可以产生3-6千兆碱基。
[0058]由Applied Biosystems销售的通过寡聚物连接和检测的测序(SOLiD)系统是一种短阅读技术。此NGS技术使用长度长至IOkbp的片段化双链DNA。该系统使用通过连接经染料标记的寡核苷酸引物的测序和乳剂PCR来产生10亿个短阅读,其导致每次运行多至30千兆碱基的总序列输出。
[0059]Helicos Bioscience 的 tSMS和 Pacif ic Biosciences 的 SMRT应用不同办法,其使用单一DNA分子进行序列反应。tSMS Helic0s系统产生多至8亿个短阅读,其每次运行产生21千兆碱基。使用经突光染料标记的虚终止剂核苷酸(virtual terminator nucleotide)完成这些反应,其称为“通过合成测序”的方法。
[0060]由Pacific Biosciences销售的SMRT下一代测序系统使用通过合成的实时测序。此技术由于不限可逆终止剂限制而可以产生长度长至IOOObp的阅读。使用此技术每天可
以产生与二倍体人类基因组的一倍覆盖等同的原始阅读通量。
[0061]以下实施例描述了开发用于分离和鉴定转基因插入物的基因组侧翼序列的方法。另外,该方法可以用于对转基因事件测定转基因拷贝数和转基因的基因组位置。
[0062]本发明的实施方案在以下实施例中进一步限定。应当理解,这些实施例仅作为例示给出。通过上述讨论和这些实施例,本领域技术人员可以确定本发明的本质特征,并且在不背离其精神和范围的前提下,可以对本发明的实施方案做出各种改变和修改以使其适合于各种用途和条件。如此,在本文中显示和描述的那些实施方案外,本发明的实施方案的各种修改从前述说明书看对于本领域技术人员会是显而易见的。此类修改也意图落入所附权利要求书的范围内。本文中所列的每篇参考文献的公开内容通过提及完整并入本文。
[0063]实施例1
[0064]经由Biorad 基因枪使用质粒转化玉蜀黍(Zea mays)栽培种H1-ΙΙ植物组织,所述质粒含有感兴趣基因表达盒和选择标志物基因表达盒。(Production oftransgenic maize from bombarded Type 11 callus: effect of gold particlesize and callus morphology on transformation efficiency.1n Vitro Cell.Dev.Biol-Plant.36:21-29)。修改方案:优化培养基组分、选择剂和时机以改善转化方法的效率。使用质粒的经Fsp I线性化的片段进行转化。所得的转化生成转基因玉米植物,其含有与植物选择标志物基因表达盒连接的感兴趣基因表达盒。
[0065]实施例2
[0066]从三种不同玉米事件(3)_001、(3)_008、和(3)-009及未转化的玉米对照分离基因组DNA。采用几种方法来分离gDNA,诸如DNeasy试剂盒(Qiagen, Valencia, CA)或传统的 CTAB DNA 分离方案。使用 Nanodrop (Thermo Scientif ic, Wilmington, DE)测定 DNA浓度。用TaqI限制酶消化总共250ng gDNA。使用MinElute Reaction Cleanup试剂盒(Qiagen, Valencia, CA)进一步纯化消化反应。
[0067]实施例3
[0068]使用分离的且纯化的gDNA完成引物延伸反应。双重生物素标记的引物由Integrated DNA Technologies Inc.(Coralville, IA)合成,并且用于反应(SEQ IDNO:1 (4468-3PA01-2Btn) 5’ _\ 双重生物素 \-GGACAGAGCCACAAACACCACAAGA_3’)。使用Platinum Taq试剂盒(Invitrogen, Carlsbad, CA)经由引物延伸来合成DNA链。在管中混合下列试剂:2 μ L, IOX Patinum TAQ 缓冲液;1.25 μ L, 50mM MgCl2 ;0.8 μ L, IOmMdNTP ;0.1 μ L, 10 μ M4468-3PA01-2Btn ;0.1 μ L Patinum TAQ; 14.75 μ L H2O ; I μ L gDNA。使用以下反应条件完成扩增:1)94° C3分钟;2)98° ClO秒;3)63° Cl分钟;4)72° C5分钟;5)重复步骤2-415分钟;6)72° C3分钟;7)4° C保持。实施例4
[0069]用2.5 μ L Dynabeads Μ_280 链霉抗生物素蛋白磁珠(Invitrogen, Carlsbad, CA)完成捕捉反应。将珠在磁体上用PBST缓冲液(磷酸盐缓冲盐水和TWeen20)清洗一次并用PBS缓冲液(磷酸盐缓冲盐水)清洗两次。在从磁体除去上清液后,将20 μ L PBS添加到珠,并将珠混合并重悬。将此溶液以1:1浓度添加到单一引物延伸反应,将20 μ L珠与20 μ L引物延伸反应混合。将所得的溶液于室温在温和移液的情况下温育I小时。然后,将珠在磁体上用PBST清洗两次,用PBS清洗两次,并用H2O清洗一次。从珠除去所有清洗溶液。
[0070]实施例5
[0071]将单链衔接头与捕获的来自事件(3)-001,(3)-008,和(3)-009的单链靶gDNA连接。用来自Epicentre Technologies (Madison, WI)的热稳定性RNA连接酶(TRL)连接单链衔接头(SEQ ID NO: 2 (ZC-Adp-Ol) 5’ -/5Phos/ATTGGATTCTCTGACGGTCGGACGC/36_FAM/-3’ )(其在Integrated DNA Technologies (Coralville, IA)合成)。使用以下反应来连接衔接头与单链 DNA:0.125 μ LlOOuM ZC-Adp-Ol; 5.0 μ L50%PEG8000 (H2O 中的 W/V) ;1.0μ L DMSO ;和1.875 μ L H2O0将混合物混合,并在热循环仪中于94° C变性5分钟,然后冷却至室温。然后,将I μ LlOX TRL缓冲液、0.5 μ LlmM ATP、和0.5 μ L TRL添加并混合入溶液中。将所得的溶液添加到来自捕捉反应的清洗过的珠,并在热循环仪上于60° C温育I小时,然后于4° C温育。将珠在磁体上用0.1X TE缓冲液清洗几次,并且从珠除去所有液体。
[0072]实施例6
[0073]使用Takara LA TAQ HS PCR 试剂盒(Millipore, Billerica, Ma)完成 PCR 反应。使用下列引物来扩增事件和侧翼序列:转基因特异性引物SEQ ID NO: 3 (PAT-1nvPriF)5’ -CGCTTACGATTGGACAGTTGAGAGTACTG-3’ )和衔接头引物 SEQ ID NO: 4 (Zn_Adt_PCR_01)5’-GTCCGACCGTCAGAGAATCCAAT-3’)。在 PCR 反应中使用下列试剂:5 μ L, 10X LA TAQ HS缓冲液;8yL,2.5mM dNTP, I μ L, 10 μ M转基因特异性引物;I μ L,10 μ M衔接头特异性引物;0.5yL LA Taq HS聚合酶;和34.5yL,H20。将混合物添加到来自连接反应的清洗过的珠,并使用表1中的下列条件 扩增。
[0074]表1:
[0075]PCR扩增条件
I个循环 94°C,2分钟
2个循环 98 0C, IO秒
66 °C, I分钟
__68 °C, 5分钟
[0076]28个循环 98 °C, IO秒
64 0C, 30秒
__68 °C,2.5 分钟
I个循环 72 0C, 4分钟
I个猶环 4 °C, op_
[0077]实施例7
[0078]将大于约850bp的大小的所得PCR产物克隆入质粒pCR2.1 (Invitrogen, Carlsbad, CA)中。将克隆分离,并且pCR2.1质粒确认为含有PCR扩增子。使用M13正向和M13反向引物对载体测序。预期测序结果含有在自质粒存在的遗传元件外的玉米3’基因组侧翼序列的核苷酸序列。使用上文所描述的技术将来自事件(3)-001克隆#4, (3)-008克隆#10, (3)-008克隆#13,和(3)-009的3,转基因插入物和玉米基因组侧翼序列分离并鉴定。
[0079]基因组插入的表征指示事件(3)-001含有多个拷贝的转基因。在此事件中鉴定几种独特的插入物。事件(3)-001克隆#4拥有独特的侧翼序列,另外,分离重排的第二和第三插入物的侧翼序列(数据未公开)。独特的侧翼区指示插入玉蜀黍基因组的独特位置中的三个拷贝的转基因。
[0080]事件(3) -008含有两个拷贝的转基因。事件(3) -008克隆#10和(3) -008克隆#13的侧翼序列是独特的且不相似的,由此指示插入玉蜀黍基因组的独特位置中的两个拷贝的
转基因。
[0081]事件(3)-009仅含有一个拷贝的转基因。使用分离的侧翼区来鉴定玉蜀黍基因组内的转基因插入物的染色体位置。
[0082]将鉴定的玉米基因组侧翼序列针对玉米基因组测序联盟(The MaizeGenome Sequencing Consortium),玉蜀黍 B73 基因组数据库(Arizona GenomicsInstitute, University of Arizona)进行BLAST以鉴定转基因插入物的染色体位置。将事件(3)-008克隆#13的侧翼序列定位至染色体#5。将事件(3)-009的侧翼序列定位至染色体#3。
【权利要求】
1.一种用于在分离的DNA中寻找与已知的多核苷酸序列相邻的未知多核苷酸序列的方法,其包括: a)用一种或多种合适的限制酶消化含有部分或整个的所述已知多核苷酸序列和相邻的未知多核苷酸序列的所述分离的DNA以生成多个经消化的多核苷酸限制性片段; b)使用寡核苷酸引物序列合成所述经消化的多核苷酸限制性片段的互补链,所述寡核苷酸引物序列具有与所述寡核苷酸引物序列的5’端结合的附接化学; c)通过将所述附接化学与合适的分离基质结合,然后使所述互补链变性从所述经消化的多核苷酸限制性片段分离所述互补链; d)将单链衔接头与结合到所述分离基质的分离的互补链连接以生成连接的分离的互补链; e)使用第一PCR引物和第二 PCR引物对所述连接的分离的互补链实施第一 PCR扩增以生成第一 PCR扩增子,所述第一 PCR引物设计为结合已知的多核苷酸序列,所述第二 PCR引物设计为结合所述单链衔接头; f)对所述第一PCR扩增子实施第二PCR扩增以生成第二PCR扩增子,其中所述第二PCR扩增扩增所述第一 PCR扩增子的内部序列;并 g)对所述第二PCR扩增子测序以确认所述未知多核苷酸序列的序列。
2.权利要求1的方法,其中所述分离的DNA是植物基因组DNA。
3.权利要求1的方法,其中所述未知多核苷酸序列是转基因边界序列。
4.权利要求1的方法,其 中所述未知多核苷酸序列是在已知多核苷酸序列侧翼的染色体序列。
5.权利要求1的方法,其中所述未知多核苷酸序列是编码性状的天然基因序列。
6.权利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸病毒序列。
7.权利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸转基因序列。
8.权利要求1的方法,其中所述已知多核苷酸序列是已知多核苷酸转座子序列。
9.权利要求1的方法,其中所述已知多核苷酸序列是编码性状的基因序列。
10.权利要求1的方法,其中使用所述方法鉴定经由插入诱变插入分离的植物DNA中的已知多核苷酸序列的染色体位置。
11.权利要求10的方法,其中所述插入诱变选自下组:转座子诱变、或T链整合诱变。
12.权利要求1的方法,其中使用所述方法表征由在已知多核苷酸序列侧翼的染色体序列组成的未知多核苷酸序列。
13.权利要求12的方法,其中对转基因插入位点的所述表征鉴定由在由染色体序列组成的所述未知多核苷酸序列内的重排、插入、缺失、或倒位组成的多核苷酸序列。
14.权利要求1的方法,其中使用所述方法测定转基因拷贝数。
15.权利要求1的方法,其中使用所述方法鉴定转基因植物系。
16.权利要求1的方法,其中使用所述方法开发分子标志物系统。
17.权利要求17的分子标志物系统,其用于加速育种策略。
【文档编号】C12P19/34GK103476950SQ201280015927
【公开日】2013年12月25日 申请日期:2012年3月30日 优先权日:2011年4月5日
【发明者】曹泽晖, S.诺瓦克, 周宁 申请人:陶氏益农公司