专利名称:转录水平沉默的植物基因的制作方法
本案为分案申请,母案申请号为00812946.0(国际申请号PCT/EP00/08994),申请日2000年9月14日,发明名称“转录水平沉默的植物基因”。
本发明涉及植物基因表达领域,尤其是关于基因沉默,这种植物基因组整合入转基因后经常观察到的现象。比较两种拟南芥属品系的转录基因表达,其中一种以多拷贝的形式带有一种沉默的转基因,另一种则是其突变体衍生物mom1,它在使该转基因沉默方面受到损害。比较发现有两个cDNA克隆在突变的植株中进行表达,而在其亲本和野生型植株中都没有表达。这两个克隆都来自于同一个转录物家族,被称作TSI(转录水平沉默信息,Transcriptionally Silent Information)。已公开的编码TSI的基因组模板在多种生态型中都是主要位于中心粒附近,并且组织保守的重复元件。它们也被称作TSI。在上述突变体中,基因组TSI模板的转录水平沉默被特异的解除了。该模板的沉默还在已知影响基因转录水平沉默的其它基因型中进一步解除了。因此,TSI的转录可被用来作为鉴定植物中缺陷型沉默途径的标志。
对于任何活细胞而言,遗传信息的活化和沉默之间正确的平衡是至关重要的。基因表达的严谨型控制对于适应环境因素、调节生理需求、分化、特化细胞类型在多细胞有机体中的发育,都是必需的。例如,分化过程中涉及可通过有丝分裂遗传的基因表达的改变,其中基因活性所处的状态具有一定的稳定性。这种稳定性可能来自对基因活化子的严格控制,对转录物稳定性的调节,或者经稳定沉默选定而调控遗传信息自身的转录可利用性遗传位点。在许多实验体系中,基因沉默经常伴随着抑制转基因的表达而出现。
在植物中,转基因座位的沉默限制了用转基因的方式来提高品质性状的可靠性。已引起注意的是,带有转基因多拷贝重排的复杂插入片段特别容易产生基因沉默。现已发现了两种使转基因不能表达的不同机制。一种阻止转录(称为转录水平基因沉默或者TGS),另一种靶向选定的转录物使之迅速降解(称为转录后基因沉默或者PTGS)。两种过程的引发机制看起来相似,因为两种类型的沉默,其产生都与遗传信息的冗余相关,即与TGS相对应的是DNA重复片段,与PTGS相对应的是RNA的过量产生。TGS可减数分裂遗传,与DNA模板的修饰有关,表现为被沉默基因的启动子高度甲基化,或染色质结构的局部改变。相比之下,PTGS不能通过减数分裂传递,需要在每一个有性世代中进行重建。PTGS无需DNA模板的修饰,但是,在被沉默基因的蛋白质编码区也观察到了DNA甲基化水平的提高。
在植物系统中,对基因沉默的研究主要涉及转基因的沉默。只有很少的一些关于基因沉默的例子不涉及转基因座位。遗传信息对TGS敏感性的标准还了解的非常少,并且正常野生型植物中转录水平沉默的天然目标也还未知。推测TGS是一种防御系统,用来抵御如转座因子这类的入侵DNA,但是这一假说还缺乏实验证据。
在本发明文中,提及基因时被认为是指包含调控序列的DNA编码序列,该调控序列可以使编码序列转录为RNA,如mRNA、rRNA、tRNA、snRNA、正义RNA或反义RNA。调节序列例如是启动子序列、5’和3’非翻译序列、内含子,以及终止序列。
启动子被认为是用来起动与之相联的DNA转录的一段DNA序列,它可能还包括一些调节基因表达的元件,如活化子、增强子或者抑制子。
基因的表达指的是基因在活细胞中转录成RNA,或者是转录并随后翻译为蛋白质。
特异核苷酸或氨基酸序列的任何部分或片段都被认为是组分序列。
本发明的目的是要提供编码遗传信息的核酸分子,它们在野生型植物中是不表达的,即沉默的,但是在转录水平基因沉默缺失的植物中能够表达。这些分子能用式RA-RB-RC限定,其中-RA、RB和RC代表由核苷酸残基组成的组分序列,这些残基独立地分别选自G、A、T、C组,或G、A、U、C组,其中G是鸟苷酸,A是腺苷酸,T是胸苷酸,
U是尿苷酸,C是胞苷酸,-RA和RC分别由0~6000个核苷酸残基组成;-RB由至少50个核苷酸残基组成;并且-组分序列RB与以下比对组分序列之一至少有80%的同一性SEQ IDNO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
在本发明的一个优选实施方案中,RB由至少100个核苷酸残基组成,与以下比对组分序列之一有至少85%的同一性SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
在另一个优选实施方案中,RB由至少200个核苷酸残基组成,与以下比对组分序列有至少90%的同一性SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ IDNO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
RB的具体例子是SEQ ID NO7、SEQ ID NO9和SEQ ID NO27的序列。
另外,RA或RC可能包含一个或多个组分序列,其长度至少为50个核苷酸残基,并与以下比对组分序列具有至少90%的同一性SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
根据本发明所述的核酸分子,可以是DNA或RNA。优选的实施方案是基因组DNA、cDNA、质粒DNA或由它们转录出的RNA。
SEQ ID NO1第437-2383位核苷酸被认为可能是一编码648个氨基酸的开放阅读框(SEQ ID NO10),其中被一跨越1631-1633的终止密码子所打断。本发明一个更为优选的实施方案是编码包含有至少200个氨基酸、并与SEQ ID NO10的比对组分序列有至少85%同一性的组分序列的蛋白质的核酸。
根据本发明的核酸代表转录水平沉默系统的内源性目标。实施例1描述了本发明从拟南芥属中克隆具体实施方案。优选转录RNA的长度在1000~6000个核苷酸之间,特别是转录物为大约1250、2500、4700和5000个核苷酸,可以是被或未被多聚腺苷酸化。据发现,野生型植株基因组中存在的转录水平沉默信息,仅仅在某些转录水平沉默的维持受到影响的突变体中得到表达。重要的是,不仅因基因组范围内DNA甲基化水平的改变而影响了转录水平沉默的株系,而且甲基化水平维持不变、没有明显表型变化的沉默突变体均能激活TSI,这表明解除内源性模板的沉默并不需要去甲基化。
最初克隆了两个代表只在沉默突变体中才被特异表达的RNA的独立克隆。预测在野生型植株中,可能有更多的DNA模板被沉默系统所抑制,值得注意的是,在这两个克隆所得到的cDNA中,有些部分彼此紧密相关,很有可能它们是同一转录物的部分。三个主要的TSI转录物,分别具有5000、2500以及1250个核苷酸。它们都含有一中间元件,称为TSI-A(SEQID NO5)。5000nt和2500nt的转录物还包含另一分离元件TSI-B(SEQID NO6),同TSI-A一样,TSI-B也不具有编码蛋白质的能力。5000个核苷酸长的转录物还包含一段5’端延伸区(SEQ ID NO1,它与SEQ IDNO2类似),可能编码一段648个氨基酸的开放阅读框(SEQ ID NO10)。TSI-A的两个3’端延伸区克隆(SEQ ID NO3和SEQ ID NO4)含有一段可与SEQ ID NO6的1-569位核苷酸比对的区域(SEQ ID NO3的第808-1397位核苷酸和SEQ ID NO4的819-1365位核苷酸),与TSI-B紧密相关(具有77%的同一性)。
5000nt和2500nt转录物都是多聚腺苷酸化的,而丰度最高的1250nt转录物却不具有mom1RNA的多聚腺苷酸化部分,因此它可以被滞留在核中。
所有的RNA都来自于单向转录,但却不能确定它们是来自不同启动子调节的独立转录单元,还是同一大转录物的加工产物。对TSI表达模式的精密分析是复杂的,不仅因为潜在染色体模板的多样性,还因为它们主要分布在中心粒旁区域。
根据与其它编码蛋白质或RNA的序列的相似性,并未揭示出新型TSI序列有任何可能的功能。唯一发现的广泛相似性是与推测的退化逆转座子Athila 3’部分之间(Pelissier等人,1995)。Athila与TSI模板区域直接相邻的其它部分,在沉默的突变体中不被重活化。这说明,总体而言,在拟南芥属中后生转录水平的沉默并不直接针对逆转座子,尽管其目标最初可能来自于转位事件。这一点被其它拟南芥属逆转录元件缺乏转录重活化所进一步证明,例如Ta超家族(Konieczny等人,1991)。因此,似乎只有特异的中心粒旁重复序列受到遗传外控制,同理,只有一部分转基因位点对沉默敏感。存在转座子残余的原因可能应归结为它们在染色体上的位置,而不是它们的序列特异性,因为在真菌和植物的中心粒区域不断发现有退化的逆转录元件。
在粟酒裂殖酵母(Schizosaccharomyces pombe)和更高等真核生物中,有一个特征被认为是保证中心粒功能的先决条件,那就是作为异染色质的中心粒及中心粒旁区域的晚复制。如果对于拟南芥属的中心粒来说也是如此,那么在有丝分裂时,不适当的解开压缩的染色质引起TSI的表达,可能会导致混乱,产生严重的表型。然而,mom突变体植株并没有出现暗示存在有丝分裂紊乱的异常。因此,如本文所述,一些通常沉默的中心粒旁重复序列的转录重激活,并不会损害它们的潜在功能。或者,它们在特定的、仍未确定的情况下,或者是更长的时间范围内保持沉默,可能是很重要的。
最后,在长期悬浮培养的细胞中观察到了TSI的表达。在野生型拟南芥属植株的任何组织,包括新鲜引发的愈伤组织培养物,都没有发现TSI沉默的解除。这说明逃脱沉默控制的首要原因并不是去分化,而可能是对迅速生长的去分化细胞长期选择的结果。在延长培养时沉默控制丧失可能会导致体细胞克隆变异积累,情况类似于活跃增殖的癌细胞。
据本发明所述之核酸对于筛选下述植株非常有用,这些植株相对于所有可供利用的生态型拟南芥属中的野生型植株而言,在转录性基因沉默上受到了损害。筛选这种植株的方法包括
a)分别制备一系列植株的RNA;b)用本发明的核酸探测上述RNA制品;并且c)鉴定其RNA与所述核酸杂交的植株。
在一个优选的实施方案中,探测步骤是在通过凝胶电泳对RNA制品进行大小分离后进行的。为便于检测,探针可以放射性标记,或用其它化学修饰法标记。
在该方法的另一个优选实施方案中,探测步骤包括用寡核苷酸引物与RNA进行杂交,再通过逆转录延伸引物,随后对产生的DNA用特异于SEQ ID NO1、SEQ ID NO5、SEQ ID NO7、SEQ ID NO8、SEQID NO9或SEQ ID NO27的引物进行PCR扩增。扩增到以这些寡核苷酸引物为侧翼的DNA片段的植株,被鉴定为其RNA能与本发明所述的核酸相杂交的植株。
获得在野生型植物中不表达,即转录水平沉默的基因组区域的核苷酸序列信息后,就可以制备至少代表使这段基因组区域保持沉默所必需基因的至少部分的DNA。优选制备完整的基因。相应的制备方法包括(a)通过在其基因组中随机插入一段已知序列的DNA标签,对野生型细胞或者植株进行诱变;(b)鉴定表达在野生型细胞或植株中不表达的RNA的植株细胞或植株突变体;(c)对围绕或接近DNA标签插入位点的基因组DNA进行克隆;(d)用(c)步得到的基因组DNA片段或其部分对野生型细胞或植株的基因组文库进行筛选;(e)鉴定至少包含有受到DNA标签插入影响的基因一部分的克隆;并且(f)用重组DNA技术对在(e)步得到的克隆进一步处理。
在植物细胞和植物中,优选根据Martine-Zapater和Salinas于1998年编辑的有关拟南芥属的操作方案,采用T-DNA插入诱变(Dilkes和Feldmann,1998),或者使用En/l(Pereira和Aarts,1998)或Ac/Ds体系(Long和Coupland,1998)进行的转座子标记,由此实现诱变。其它已知的物理或化学诱变方法,如快速中子照射或EMS诱变(Feldmann等人,1994)可能需要对前述方法进行改动,但也可以用于制备参与维持沉默的等价DNA。
鉴定只在突变的细胞或植株中表达,而不在野生型细胞或植株中表达的RNA的一种便利的方法是逆转录该RNA,再将产生的DNA用特异于它的寡核苷酸引物PCR扩增(RT-PCR)。这种方法能够富集多达1000个突变体的RNA,这很大程度地提高了鉴定的速度。
上述方法能够被进一步精炼,并发展成为试剂盒,用于鉴定转录性基因沉默受损的植株。该试剂盒必须包括a)本发明所述核酸,其已便利地被标记,用作杂交探针;或者b)用于逆转录RNA的寡核苷酸引物和特异于本发明核酸的寡核苷酸引物。
用于逆转录的寡核苷酸引物可以是多聚T引物,或者是特异于本发明核酸的寡核苷酸引物。特异于本发明核酸的引物被设计成可用来PCR扩增特征在于具有本发明公开的核苷酸序列的DNA模板。
实施例实施例1拟南芥属TSI序列的差异mRNA筛选和克隆根据Goodall等人(1990)的方法,从两克鲜重的两周龄幼苗中分离出突变系mom1(Amedeo等人,2000)及其亲本系A的总RNA。
用Dynabeads寡聚(dT)25(Dynal)获得多聚腺苷酸化的RNA。使用PCR选择性cDNA扣除试剂盒(PCR-Slect cDNA subtraction kit)(Clontech),按其使用说明操作,用两微克poly(A)RNA进行了抑制扣除杂交(SSH,Diatchenko等人,1996)。来自突变系mom1的cDNA用作检测器,而来自亲本系A的cDNA用作驱动cDNA群。扣除文库被克隆到pCR2.1(Invitrogen)载体上。根据PCR选择性差异筛选试剂盒(Clontech)手册,从这个文库培养500个菌落独立培养物。为了减少假阳性克隆数,首先用反转RNA印迹技术,按von Stein等人(1997)所述对文库进行筛选。在首先筛选的500个cDNA克隆中,有12个表现出与带标记的mom1cDNA杂交时丰度有所增加。以此12个cDNA为探针,直接用Northern印迹分析来比较野生型和突变系的总RNA,发现其中有两个存在明显的基因型依赖性差异表达。用PE Applied Biosystems的常规罗丹明或dRhodamine终止子染料,以及Perkin-Elmer GeneAmp PCR系统2400、9600或9700热循环仪,对所述克隆测序。序列反应使用ABI PRISM 377DNA测序仪分析。有两个cDNA克隆被命名为TSI-A(903bp,SEQ ID NO5)和TSI-B(614bp,SEQ ID NO6),二者都富含于mom1RNA中,但是在野生型和A系拟南芥中却检测不到。对另外10种cDNA克隆,在野生型和突变型之间没有观察到一致的差异表达。
5’和3’延伸反应是使用Clontech公司的Marathon试剂盒,按照制造商的指南进行的。序列特异性引物为3’延伸反应引物TA-F15′-TGGTTCACCAGATAAGCTCAGTGCCCTC-3′(SEQ ID NO11)和TA-F25′-CTTCAGACTGGATAGGACTAGGTGGGCG-3′(SEQ ID NO12,嵌套引物)5’延伸反应引物TA-R15′-CGCCCACCTAGTCCTATCCAGTCTGAAG-3′(SEQ ID NO13)和TA-R25′-CGCATCAAACAACTAACAACGAGGGCAC-3′(SEQ ID NO14,嵌套引物)PCR扩增引物被克隆到载体pCR2.1(Invitrogen)中。培养单个细菌培养物,并按Clontech公司PCR选择性差异筛选试剂盒手册所述操作,与引发延伸反应的引物混合物(Marathon Adapter引物Ap1(Clonetech公司)与TA-R2或TA-F2(分别进行5’或3’端延伸反应混合)一起进行集落PCR(colony PCR)。为筛选阳性TSI-A延伸克隆,将PCR产物印迹并与TSI-A杂交分析。克隆过程中的所有PCR反应所使用的聚合酶都具有校正活性(Advantage cDNA PCR试剂盒,Clontech)。
因为在mom1植株的多聚腺苷酸化RNA组分中只检测到了两种转录物,这类RNA被用于开始于TSI-A序列的5’和3’端延伸反应。两克隆都在核苷酸序列水平上分析。5’端延伸产生2512bp(克隆a,SEQ ID NO1)和1997bp(克隆b,SEQ ID NO2)的插入物,经过比对后,发现它们之间彼此有97%的同一性。3’端延伸的克隆长度为1682bp(克隆c,SEQ ID NO3)和1652bp(克隆d,SEQ ID NO4),具有94%的同一性。有趣的是,TSI-A的两个3’端延伸克隆都具有一段569bp的区域与TSI-B紧密相关(具有77%的同一性)。这可以解释为什么用TSI-A和TSI-B作探针进行RNA印迹时会检测到相似的RNA种类,以及为什么它们与相同的YAC和BAC克隆杂交,同时还说明TSI-A和TSI-B是mom1突变体内表达的同一多聚腺苷酸化转录物的一部分。为了确证TSI-A的5’端延伸物其实就是TSI转录物的一部分,用靠近该延伸物5’端的cDNA片段作探针(探针ORF对应于SEQ ID NO1的943-1334位核苷酸),进行mom1的RNA印迹分析。有趣的是,在多聚腺苷酸化组分中只有大约5000nt的长转录物与探针杂交。因为这类的转录物与TSI-A和TSI-B杂交,因此,5000nt转录物可能是由以特定顺序包含三种序列元件的模板产生的。
实施例2RNA和DNA印迹分析以及文库的筛选总RNA的提取根据Goodall等人(1990)描述的方法,或使用RNeasy植物微型试剂盒(Rneasy Plant Mini Kit)(Qiagen),按照其使用说明操作进行。在进行RNA印迹分析时,按照标准流程,经过乙二醛变性,将RNA在1.5%的琼脂糖凝胶、pH7的磷酸缓冲液中电泳分离,然后印迹到尼龙膜(Hybond N,Amersham)上。用Boehringer分子量标记l作为衡量分子大小的标准。DNA印迹分析时,按照Dellaporta等人(1983)的方法分离基因组DNA,用内切核酸酶降解之后,经电泳分离,再将DNA片段转移到尼龙膜(Hybond N,Amersham)上。RNA和DNA印迹,以及含YAC文库的滤膜的杂交和洗涤,按照Church和Gilbert的方法(1984)进行。通过随机引发DNA合成(Feinberg和Vogelstein,1983),用[α-32P]-dATP标记探针,并用对X射线敏感的胶片(Kodak X-OMAT AR)曝光。
用从两周龄幼苗中制备的总RNA的Northern印迹与mom1的TSI-A进行杂交,显现有四个主要的转录物,大小分别为5000、4700、2500和1250个核苷酸左右。TSI-B探针则检测到5000nt和2500nt的两个主要转录物。有趣的是,mom1RNA的多聚腺苷酸化组分只含有5000nt和2500nt的转录物与两种cDNA探针(TSI-A和TSI-B)都能进行杂交。从检测到的TSI转录物的大小来看,很显然,两种TSI克隆都只是部分的cDNA。TSI的表达是可以减数分裂遗传的,并且可以以相同的转录物模式保持mom1的六个自生代。
为了检测已知影响基因沉默的其它基因型中TSI的表达,用TSI-A探测几种已知基因沉默受到影响的拟南芥属突变型和转基因系的总RNA。Mittelsten Scheid等人(1998)报道的som突变体的所有类型,从som1到som8,在转录水平沉默的维持方面受损情况与mom1相似,都表现出高水平的TSI-A表达。突变型ddm1最初确认为DNA甲基化降低(Vongs等人,1993),后来发现其从不同位点解除了转录性基因沉默(MittelstenScheid等人1998;Jeddeloh等人,1998),也表现出高水平的TSI-A表达。TSI-A也在Finnegan等人(1996)报道的显示因DNA甲基转移酶反义mRNA过表达而DNA甲基化降低的转基因系中表达,在DNA甲基转移酶基因受到影响的拟南芥属进一步突变型(这类突变型被称作ddm2,已由Eric Richards提供)中也有TSI-A的表达。除此以外,发生沉默的突变型hog1和sil1,表达出能与TSI-A杂交的序列,但Furner等人(1998)报道的sil2并不如此。重要的是,影响到转录后基因沉默的突变,如Elmayan等人(1998)描述的sgs1和sgs2,以及Dehio和Schell(1994)描述的egs1,并不表达可与TSI-A杂交的RNA。
比较不同基因型中TSI-A的表达模式,揭示出不同种类RNA在化学计量上的基因型特异差异。mom1植株相对于som1植株有不同的TSI-A和TSI-B表达模式。这些结果表明,转录水平沉默系统中特异的遗传缺陷导致不同而又特异的TSI模板激活方式。然而,我们在不同来源的植株材料之间,以及不同的RNA制备品之间,也观察到了这些活化模式的变化。因此,也许TSI表达模式具有更大的灵活性,并且可能还受一些在突变体背景下起作用的未知因素的控制,或者转录物群体不同稳定性的影响。
TSI-A和TSI-B被用作DNA印迹的探针,用来确定TSI转录物的来源和它们模板的构成。印迹结果表明拟南芥属基因组中存在TSI-A和TSI-B同源序列的多拷贝。通过重组实验估算,TSI-A大约有130-300个拷贝。
为了评估TSI排列在进化上的保守程度,通过Southern印迹分析和与TSI-A探针的杂交比较五种拟南芥属生态型(Zurih,Columbia,landsberg erecta,Wassilevskija,C24)的DNA。用在TSI-A内只有一个识别位点的DraI和不在TSI-A内切割的SspI消化基因组DNA,发现不同生态型间TSI-A模式存在重要保守现象,有4kb和1.3kb两个主要DraI重复片段,11kb和4kb两个主要SspI片段。还存在特异于某特殊生态型的一些较小的差异,表明TSI-A有有限的遗传多态性。同一印迹膜换用TSI-B作探针,则揭示出各生态型间彼此差异的复杂成带模式,这也许说明TSI-B具有较低的保守性,虽然TSI-A与TSI-B DNA印迹模式的不同也可解释成TSI-A处于一更长的重复元件的内部,而TSI-B则接近重复元件与单拷贝DNA可变区之间的侧翼。
将TSI-A和TSI-B与覆盖4个基因组相当物以及拟南芥属基因组的92%的CIC YAC文库杂交。在1152个CIC克隆中有62个能与TSI-A探针杂交。在这些克隆中有26个还包含有中心粒旁的180bp重复序列,有7个包含有已知位于中心粒附近的5S RNA基因,还有16个克隆也包含有在图谱上靠近中心粒的其它标记。只有4个克隆在图谱上位于中心粒区域以外。TSI-B有相似的作图结果,因此能与所有TSI-A阳性CIC克隆杂交,另外还有7个克隆仅能与TSI-B杂交。因此,两种TSI重复序列都集中在拟南芥染色体的中心粒旁区域。
将TSI-A和TSI-B与用mom1突变体植株的RNA制备的cDNA文库杂交后,对22个杂交克隆作了进一步的序列分析。RNA是根据Goodall等人(1990)的方法,从mom1突变体植株的两周龄幼苗中分离的。cDNA文库使用Uni-ZAP XR文库构建试剂盒(Stratagene),按制造商的操作流程制备。大于500bp的cDNA片段用Gibco公司的cDNA大小分级分离柱选择。7个克隆含有SEQ ID NO7(TSI-A-15),5个克隆含有SEQ ID NO8(TSI-A-2),其一部分与SEQ ID NO4一致。
实施例3数据库搜索序列分析使用GCG软件(威斯康星软件包10.0版,遗传学计算机小组(GCG),麦的森,威斯康星)来完成。为进行同一性检索,使用了GenEMBL,拟南芥数据库(http//genome-www3.stanford.edu/)、拟南芥属开放站点Kazusa(KAOS;http//zearth.Kazusa.or.jp/arabi/)以及Swissprot。肽序列通过GeneQuiz(http//columba.ebi.ac.uk8765/gqsrv/submit)或Expasy(http//www.expasy.ch/)分析。
在基因组序列数据库GenEMBL、拟南芥数据库以及KAOS内搜索,证实存在与TSI-A和TSI-B有关的多拷贝序列,这些序列分布于拟南芥的所有5条染色体。重要的是,常常在单一的BAC克隆内包含有与该两个cDNA克隆都同源的序列。有些情况下,在同一个BAC克隆上不止一次发现与TSI-A和TSI-B都相关的序列,这表明TSI-A和TSI-B属于成簇重复元件。
cDNA类群与TSI-A 5’和3’端延伸重复间重要的序列异质性表明它们来源于不同的活化重复区。为了便于数据库检索而在众多的相关拷贝中搜索5000nt转录物可能的基因组模板,将相互重叠的cDNA组合起来,形成一个连续的4860bp的“虚拟”cDNA序列(SEQ ID NO9),用于搜索拟南芥属基因组序列数据库。一特殊的BAC克隆(TAMU BAC T6C20,录入号AC005898)与该拼接的cDNA序列有91%的同一性。另外,搜索还发现一段染色体DNA序列(BAC F7N22,录入号AFO58825)与实施例2中的高丰度cDNA A-15(SEQ ID NO7)具有99%的同一性。由SEQ ID NO7限定的区域5’端的转录区域的基因组序列包含于SEQ ID NO27中。它与BAC F7N22的65081-68202位核苷酸序列一致。两序列都位于第5号染色体的中心粒旁区域。由BAC F7N22第65080-70370位核苷酸所限定的TSI序列与被名为Athila的逆转座子样重复序列有54%的同一性。该序列被认为是逆转座子的根据是围绕异染色质区的拟南芥属基因组序列,其以180bp卫星重复序列的存在为标志。Athila 10.5Kb的序列具有一些逆转录元件的特征,如长末端重复序列,多聚嘌呤串(PPT),以及逆转录酶tRNA引发的引物结合位点(PBS),但是它的开放阅读框与已知参与转座的蛋白质不具有同源性。
TSI作图到Athila 3’端部分。TSI-A覆盖该假定逆转座子3’端非编码区域的一部分。TSI-B则对应于PPT和部分3’LTR。TSI-A的5’端延伸序列编码一段具648个氨基酸长度的可能开放阅读框(SEQ ID NO10),与推断的具604个氨基酸的Athila开放阅读框2有51%的同一性。编码此阅读框的序列也存在于TUMU BAC T6C20中,然而,由克隆a(SEQID NO1)和克隆b(SEQ ID NO2)两cDNA以及BAC编码的开放阅读框则分别在第398(克隆a),83(克隆b),和46、465、496、499、549(BAC T6C20)位氨基酸处被翻译终止密码子打断。BAC F7N22上的开放阅读框2序列则被5个2-31bp的缺失和5个3-10bp的插入严重打乱。这进一步支持了这种假设,即该序列是来自于一可能的,但已退化的逆转座子。用数据库搜索与该阅读框可能的648位氨基酸产物相似的蛋白质,没有发现与通常由逆转录元件编码的蛋白质和任何其它已知多肽明显相似的多肽。
实施例4RNA酶保护分析RNA酶保护分析根据Goodall等人(1990)的方法,加以少量修改完成。为了分析TSI的转录方向,将插入有TSI-A的基于pCR2.1的质粒用EcoR1酶切,产生781bp的片段,将其再连接到载体pGEM-7Zf(+)(Promega)上。为制作5’端转录起始区的图谱,扩增BAC F7N22中64929-65567位之间的区域,再将产物插入pGEM-7Zf(+)载体(Promega),制成探针。标记探针通过在[α-32P]-UPT存在的情况下,用T7聚合酶(Promega)或Sp6聚合酶(Boehringer),体外转录线性化的质粒合成,并通过电泳纯化(Goodall等人,1990)。单链RNA用4微克RNA酶A和0.6单位的RNA酶T1(RNA酶A/T分析)或者20单位的RNA酶T1(RNA酶T分析)切割。被保护的片段用6%的变性聚丙烯酰胺凝胶电泳分离。干胶曝光于PhosphorImager增感屏(Molecular Dynamics)和X射线感光胶片。
为确定TSI转录的极性,用相反极性的TSI-A探针进行RNA酶T和RNA酶A/T保护分析。用TSI-A序列做探针,因为TSI-A存在于所有RNA印迹分析发现的转录物中。没有迹象表明对对应于正义链的探针有保护作用。这说明不存在任何TSI反义RNA,并且TSI模板以单向转录。有趣的是,在TSI-A反义探针存在下进行RNA酶消化后,会产生受TSI-A保护的条带的复杂带型。这说明有许多不同但又相关的RAN与探针杂交。因观察到预期被完整的TSI-A探针保护的781nt的片段,因此可以得出结论TSI-A是整个SSH程序中活化转录物的一部分,而不是模板转换而造成的人为产物。另外,一些被保护的TSI-A片段明显比另一些具有明显更高的丰度,暗示相关RNA内一些特定TSI-A区存在结构保守,或者某些转录物亚种具有更高的丰度。
BAC F7N22的序列信息被用来确定最长的TSI转录物的转录起始位置。制备好用于RNA酶A/T保护分析的反义RNA探针,其跨越64929-65567位之间的638个核苷酸。将探针与ddm1、som7和mom1的总RNA进行杂交。在所有的RNA制备品中,都有一大约480nt(±10nt)的片段被保护,因此不同的突变体中将TSI在BAC F7N22上的转录起始位置定位至65087(±10nt)。
实施例5逆转录PCR(RT PCR)逆转录反应用1微克mom1的总RNA,在存在1mM dNTP、4-20单位RNA酶抑制剂(Promega)、1×AM逆转录酶缓冲液(Boehringer),以及25单位AM逆转录酶(Boehringer)时,在37℃进行一小时,然后加热灭活反应混合物。PCR的模板可取50纳克以基因特异性的反义引物(BA-R1、BA-R2、AT-R1和TA-R1,见下)引发的逆转录RNA,或者使用100纳克基因组DNA或100纳克cDNA。PCR开始为94℃变性3分钟,接下来是30个扩增循环(94℃/30秒变性,62℃/30秒退火,72℃/30秒延伸),反应体系中有0.2mM dNTP、0.4μM正向和反向引物、1×Taq DNA聚合酶缓冲液(Boehringer)和0.25单位Taq DNA聚合酶(Boehringer)。
用于RT-PCR的引物的核苷酸序列为AT-F15′-CGATAACATCGACCGTATTGCTCGCC-3′(SEQ ID NO15)AT-R15′-AACTAGCTCCCATCCGTCTTCGACATCC-3′(SEQ ID NO16)AT-F25′-TGCATCACACCGGATTGGATTGAC-3′(SEQ ID NO17)AT-R25′-TGTTCCCCTGAACCATAGCAATGAGACC-3′(SEQ ID NO18)BA-F15′-CAAACAGACAGAGTGTGGCCCACCACC-3′(SEQ ID NO19)
BA-R15′-AAGAGAGGGAGAAGGCAGTGGCGTGAG-3′(SEQ ID NO20)BA-F25′-TGCAAACCCACAGGACCAAGTCTACCC-3′(SEQ ID NO21)BA-R25′-ACAGATGGTGATAGCGTGAGCGGTGGC-3′(SEQ ID NO22)F7-F15′-TCAACCTTTTGCCCCAACAACCACTC-3′(SEQ ID NO23)F7-R15′-TCTCCATCCACGCTTTCCTGAATGTCC-3′(SEQ ID NO24)GS-F15′-GGAGAAGGAAGCTGAAAATCATATTGTGG-3′(SEQ ID NO25)GS-R15′-ATGATGATCCTAAGTCTACCCTTTTGCAC-3′(SEQ ID NO26)TA-F1和TA-R1引物用作PCR反应的阳性对照。拟南芥Ty1/copia样逆转座子家族pol基因的逆转录酶区域按照Konieczny(1991)描述的方法(1991)扩增,操作没有实质性修改。
因为TSI转录物TSI-A和TSI-B的核苷酸序列与逆转座子样元件Athila 3’端部分的核苷酸序列相关,包括第2开放阅读框和3,端长末端重复序列。通过RT-PCR检测mom1植株中Athila 5’端部分(包括第1开放阅读框)的转录是否被激活。根据有关Athila以及BAC T6C20和BAC F7N22相关部分的序列信息,选择了5对引物(BA-F1/BA-R1;BA-F2/BA-R1;AT-F1/AT-R1;AT-F2/AT-R2;F7-F1/F7-R1)。由基因组DNA模板,所有的引物组合都扩增到了预期的产物,但是以mom1RNA为模板却没有获得PCR产物,不管cDNA合成起始于特异于Athila或BAC的反向引物,还是起始于多聚T引发的cDNA(数据没有显示)。因此,TSI的活化仅限于与Athila 3’端部分相关的序列。
分离到的两类cDNA与Athila只有约50%的同一性。为了直接回答Athila是否表达这一问题,以Athlia特异引物(GS-F1,GS-R1)在TSI同源区内进行RT-PCR实验。但是,从mom1幼苗的RNA中不能扩增到相应的片段,说明在突变背景下,只是Athila样序列的一亚群、而不是Athila元件本身被再激活了。
为了研究在mom1中是否别的逆转录元件被转录激活了,用来克隆并描述拟南芥逆转座子Ta超家族(Konieczny等人,1991)的逆转录酶基因保守区内的简并引物被用来研究是否Ta家族的成员在突变背景下被转录。虽然从基因组DNA中能扩增到预期的268bp的片段,但是以mom1RNA为模板的RT-PCR却扩增不到任何产物。这表明,尽管TSI与逆转座子同源,但这些元件在mom1突变型中没有被普遍激活。
实施例6应激情况下TSI的表达(盐度,UV-C,病原体)UV-C对TSI的诱导由RNA印迹分析检测,RNA样品来自1周龄的幼苗,这些幼苗受到1KJ/m2或5KJ/m2的UV-C处理,并在1小时内的不同时间点取样(Revenkova等人,1999)。渗透压的影响由RNA印迹分析检测,RNA样品来自1周龄的幼苗,这些幼苗被转移到NaCl浓度分别为0、0.04、0.08和0.12M的介质中维持24小时(Albinsky等人,1998)。为测试在病原体应激下TSI的表达,将来自受到模拟处理或Peronospora感染的3周龄幼苗的RNA经Northern印迹分析。为了证实适当的病原体反应,用PR1探针对印迹膜进行再次探测,以监测PR1表达的诱导。
在幼苗(两周龄)和成熟野生型植株的不同组织(根、茎、叶、花、果)中,都不能检测到TSI的表达。各种应激处理的施加,即提高盐浓度、UV-C或病原体感染,并未激活野生型植株中的TSI。在新鲜愈伤组织培养物中也没有发现TSI表达,甚至在经过几次体内传代的体内愈伤组织中,TSI的转录抑制也是稳定的。然而,迄今为止唯一的例外是长时间悬浮培养的野生型拟南芥(Literature)细胞。这些细胞表达TSI-A,说明在这种情况下解除了TSI的沉默。
参考文献·Albinsky et al,Plant J.1773-82,1999·Amedeo et al,Nature 405203-206,2000·Church and Gilbert,Proc Natl Acad Sci USA 811991-1995,1984·Dehio and Schell,Proc Natl Acad Sci USA 915538-5542,1994·Dellaporta et al,Plant Mol Biol Rep.119-21,1983·Diatchenko et al,Proc Natl Acad Sci USA 936025-6030,1996·Dilkes and Feldmann,in Arabidopsis protocols,Methods in Molecular Biology 82(Ed.Martinez-Zapater and Salinas),Humana Press,Totowa,New Jersey,pp 339-351,1998·Elmayan et al,Plant Cell 101747-1757,1998·Feinberg et al,Anal Biochem.1326-13,1983·Feldmann et al,in Arabidopsis(Ed.Sommerville and Meyerowitz),CSHL Press,NewYork,pp 137-172,1994·Finnegan et al,Proc Natl Acad Sci USA 938449-8454,1996·Furner et al,Genetics 149651-662,1998·Goodall et al,Methods Enzymol.181148-161,1990·Jeddeloh et al,Genes Dev.121714-1725,1998·Konieczny et al,Genetics 127801-809,1991·Long and Coupland in Arabidopsis protocols,Methods in Molecular Biology 82(Ed.Martinez-Zapater and Salinas),Humana Press,Totowa,New Jersey,pp 315-328,1998·Mittelsten Scheid et al,Proc Natl Acad Sci USA.95632-637,1998·Pellisier et al,Plant Mol Biol.29441-452,1995·Pereira and Aarts,in Arabidopsis protocols,Methods in Molecular Biology 82(Ed.Martinez-Zapater and Salinas),Humana Press,Totowa,New Jersey,pp 329-338,1998·Revenkova et al,EMBO J.18490-499,1999·von Stein et al,Nucleic Acids Res.252598-2602,1997·Vongs et al,Science.2601926-1928,1993
序列表<110>Novartis AGNovartis研究基金<120>转录沉默的植物基因<130>S-31147A<140>
<141>
<150>GB 9921964.4<151>1999-09-16<160>26<170>专利版本号2.1<210>1<211>2512<212>DNA<213>拟南芥(Arabidopsis thaliana)<400>1tcgccgttcc agcttcgcat actctctcac cgtctctcgt ttcactcgac cacttcacac 60ttcgcctcaa catcttcgcc ggagtttctc gccattgtcc gtgcttccgt catctccgtt 120cactcgacca ccggaccggc ttcaccatct ctcaactatc caccattcac tcgacctcgc 180cattcactgc gcctccattc gtctctttac tcgactgctc ctcaaaccgc caccgtcttc 240tctaaattcg ccgtttactc gaccacactg ttacgtctct cattcgtgta cagtcgaccg 300ctatacccga agccacaata tcactctact cgaccgtttc actcgatcgc gtacttgact 360ggtttagtgt gtgtgtttat ttgaactaac atattgatat ttggttttga gttacattct 420ttttcaggga atcaatatga gcaactacag tggcgaatcc tccatggatg cggattacaa 480cgtcgatgaa gctgaatctt ggtcaactag accagagaga gagcaacagg cttatgagag 540cttcagagcc gagacccaac gctcagtagc tcgacgcaat gaaaggagag ctgagattgc 600tagaggaaag agagcgatga ccagcagata tgagttgatc gacgaagata ttgacgtcga 660gtatgagcct gagtcatggc acagagaaac aaaactgttg aacaagcctg atgaagttac 720agtggaagag tacatcagac ttttcgagct gaacgacttc tggggagcga ggtacccctg 780ttatgagact ctagcccagc ttaggctact ggaggacgta cagcacttat tcgagaagtg 840ccatcttgag acgctgatgt cttacccgta cgtcgcttac aagaaggaaa caatagagtt 900tctctccact ctgcaagtgg agttgtatca gggacttact gcagatgaac tggagagtga 960agggttggga ttcttgactt tttcagttaa cgagcagcgt taccagctat ctatcaagag 1020cttggaagga ttatttggtt ttcccagtgg aaagggaact aaacccaagt tcgaaaggga 1080agagttgaag gatttgtggt taaccattgg gaacgatttg gcgctcaact ctgcaaggtc 1140taagagcaac cagattcgaa gccctgtgat ccgctactat cagcgctcag tagcgaatgt 1200tctgtacccc agggaatcta caggcaccgt gtctaacaca gacatggaga tgattgattc 1260tgcactcaag ggtattctcc ggagaacaaa ggggaagaag gtcctaaagg gcgaccttaa 1320tgatacacca ccggtcatgc ttctgttgat ccatatgtgt ggatacagga agtgggcgca 1380caccaacggg aggaagaagg tgcgaggagc cctttgtgtg ggtggcgttg tgacaccgat 1440tctgattgca tgtggtgtac ctctcacgtc tccagggttt gatccgagga tgatggattt 1500agatcacttg cgtcgttgtg agtttctgga gtacgacatg gttggcgatt tctatcgcta 1560caaattcgag cactccctga cccgaacagc caacattttg cttccctgca tcgaggccac 1620aaccatactt tagggtgaga acattgactt cagacctgcg cgtgattacc tctactttga 1680gagcactcca ccgactgatg acaatgtccc tacgacggaa gctacagagg atgattttgc 1740tgagacggat gaggataggg aggaggagta tgatacgagc atgtatcatt tcagtgagca 1800cgtacctcca gcgcaggaga gcaagagctt gagtgaagct cacagaaaca acagtaagtt 1860
gcagaggtgg tgcaagaaac aagataggtt acttatcaag tgcttcaagg ccatcacgtt 1920tctaacggac aagataagtt gcttctcttc taccacagct attccgcagg gagagcgtcc 1980tcaggacatg ccttcgaaga gatatgacgc gccagggcca agtcatcaca ggcctgagcc 2040aagtcaccac aggcctgagc ctagtgaccg agtagtacca ccagtccctg caaggcattc 2100atcattcgag cctcgggagc tcgggagaaa gaagaaggct gcactcgcta ggtctggcag 2160caggagtaga cgacttctcc agtcccgtag cttacgcgac cgcggtgctg gccgcagcag 2220aagaagagag gtcgagtatc atcagagcgg tgctggccgc ggcgaaggag cagaggtcga 2280gtacccccag ggggaagctg agacacaaca gggagattct tcgatggcct gggagcaatc 2340acaggcagct attgacgacc aactccgctc cttcctccac tgaggtatgc acctcactcc 2400accattgtaa tataccatct cttgtttttt attttgtttt tgtgatgtgt tttgtcctga 2460gtactctctt ccaaatttgg tcacacagtg gactgtgtga tttaagtttg gg 2512<210>2<211>1997<212>DNA<213>拟南芥<400>2ccgggcaggt caacaggctt atgagagctt tagagctgag acccaacgct cagtagctcg 60acgcaatgaa aggagagctg agattgctag aggaaagaga gcaatgacca gcagatatga 120gttgatcgac gaagatattg acgtcgagta tgaacctgaa tcatggcaca gagaaacgaa 180gctgttgaac aagcccgatg aagttacagt agaggagtac atcagacttt tcgagctgaa 240cgacttctag ggaacgaggt acccctgtta tgagacttta gcccagctgg ggctactgga 300ggacgtacat cacttattcg agaagtgcca tctggagacg ctgatgtctt acccgtacgt 360cgcttacaag aaggaaacaa tagagtttct ctccactctg caagtggaga tgtatcaggg 420acttactgca gatgagctgg agagtgaagg gttggggttc ttgacttttt cagttaacga 480gcagcgttac cagctatcta tcaagagctt ggaaggatta tttggttttc caagtggaaa 540gggaactaaa cccaagttcg agagggaaga gttgaaagat ttgtggttaa ccattgggaa 600cgatttggca ctcaactctg caaggtctaa gagcaaccag attcgaagcc ctgtgatccg 660ctactatcag cgctcagtag cgaatgttct gtaccccagg gaatctacag gcatcgtgtc 720taacacagac atggagatga ttgatgttgc actcaagggc attctccgga gaacaaaggg 780gaagaaggtc ctaaagggcg accttaatga tacaccaccg gttatgcttc tgttgatcca 840cctgtgtgga tacaggaagt gggcgcacac caacgagaag aagaaggtgc gaggagccct 900ttgtgtaggt ggcgttgtga caccgattct gattgcatgt ggtgtacctc tcacgtctcc 960agggtttgat ccgaggatga tggatttaga tcacttgcgt cgttgtgagt ttctagagta 1020cgacatggtt ggcgatttct atcgctacaa attcgagcac tccctgaccc gaacagccaa 1080cattttgctt ccctgcatcg aggccacaac catacttcag ggtgagaaca ttgacttcag 1140acctgcgcgt gattacctct actttgagag cgctccaccg actgatgaca atgtccctac 1200gacggaagtt acagaggatg atattgctga gacggatgag gatagggagg aggagtatga 1260tacgagcatg tatcatttca gtgagcacgt acctccagcg cgggagagca agagcttgag 1320tgaagctcac agaaacaaca gtaagttgca gaggtggtgc aagaaacaag ataggctact 1380tatcaagtgc ttcaaagcca tcacgtttct gacggacaag ataagctgct tctcttctac 1440cacagctatt ccgcagggag agcatcctca ggacatgcct tcaaggagat atgacgcgcc 1500agcgccaagt catcacaggc ctgagccaag tcaccacagg cctgagccta gtgaccgagt 1560agtcccacca gtccctgcaa ggcattcatc attcgagcct cgggagctcg ggagaaagaa 1620gaaggctgca ctcgctcggt ctggcagcag gagtacacga cttctacagt cccgtagctt 1680acgcgaccgt ggtgctggcc gcagcagaag aagagaggtc gagtatcatc agagcggtgc 1740tggccgcgac gaaggagcag aggtcgagta ccccacgggg aagctgagac acaacaggga 1800gattcttcga tggcctggga gcaatcacat gcagctattg acgaccaact ccgctccttc 1860ttccactgag gtatgcacct cactccacca ttgtaatata ccatctcttg tttttatttt 1920gtttttgtga tgtgttttgt cctgagtact ctcttccaaa tttggtcaca cagtggactg 1980tgtgatttaa gtttggg1997<210>3
<211>1682<212>DNA<213>拟南芥<400>3cttatattat gggttgggat gtgtttaaag aaaaggggga attcattgtt gataaggaaa 60gggaaagaat tctaggggaa gtaagctaaa gaagttagaa aaaatctagt aaaggttttg 120ggaatgttaa agaaaagaat gaggttcttg ttagctaaag aataagggtt aaaagccttt 180ggttttaaag attaaaaaaa aaacaggaac cttagttgtt aaagaaatcc aaacccgcta 240gatgtatcaa gagcgttgag aaagcttctc ctagagttaa gagaaaagaa aagaatgata 300tgaaaaagag tttgaaagat tcatgagtgc aaagggtaga gttaagttgg gacaggagtt 360ggttttacca ttagaacttc attgttatac tctgggtaga tgggatctta tctctgtatg 420cataatttgg gacttacctt tagcattcta ctaaagctca atcattcttg agggatcccc 480tgttacttaa gcctattcta taagggacca tctttgtctc ttgaccttca ccttggccga 540atgagttcat tgatgatgca ttgcttgatt cgcgttccag aactaatgaa tgttaaaggg 600attggtagat ttgaaagcat gtgtaggtcg agtataagag acggattgat tgaaaacaag 660gcatggctaa cgtttttgag tagaattcaa tcatatcgca tcttagaact accaacttgg 720acattgattt tatttgctct atcatatgct ttggttttga gtccccgcct tcactcctct 780ccttcaacta tgtcttctta tttgcttgag ggcaagcaaa gactaagttt gagggagttg 840atatgtctat aatttgcatg ttttcagtgt ccattcatca tcgttttgag tccagtttcg 900tatcattcat cactgtttta tatcatttct catcattctt gcatactttg catgattagg 960ataactttgc atacatattg catttctgag ttgttttcag gtgatttgga gctgtttgca 1020agcaaattgg aagaaatgag ccagaaccag aagacatact cgacccctag gtcgagtgac 1080tttggggcca ttcttcccac atactcggcc cccaggtcga gtgactttgg agccattctt 1140cccatccact cgaccaccgg gtcgagtaac cttagctcag gccactcgat gacactactc 1200gaccccaggt cgagtatcac ttcgccacac cacctgacaa cactcgacca atcactctac 1260caagttactc gaccccctgg tcgagtatca tcactcacca ccatcagcat cactcgaccg 1320gacactcgat cacgtcttca cagtctactc aaatccgcag tcaaccagac aagctgagca 1380caaggaagag aagaggagaa gacaaagtgc ttggaagcgg cctggacctc catcggatca 1440cgaagcccat ctcggcccat tatctctcta tgggccgagc gattaggtta ttggcccgtc 1500tactatcatt ttatttcgtt ttgtataaat agatgtctta gggttttgtc ctgagacatc 1560tagtcgacat tgagtttttt ttgcttcagt tttattttct gttctactct gctgcgccgc 1620ttttgcttct gcaacctgta attcgagatt tttccaagtt attcagattc cgcatttgat 1680tt1682<210>4<211>1652<212>DNA<213>拟南芥<400>4cttatatcat gggtttggat cagtttaaaa aaaaaaaagg gtgaattcat tgttgataag 60gaaagggaaa gaattctagg ggaagtaagc taaagaagtt agaaaaaaaa aaatctagta 120aaggttttgg gaatgttaaa gaaaagaatg aggttcttgt tagctaaaga agaagggtta 180aaagcctttt gttttaaaga ttaaaaacag gaaccttagt tgttaaagaa atccaaatac 240gctagatgta tcagagtgtt gagaaagctt ctcctagagt taagagaaaa gaaaagaatg 300atatgaaaaa gagtttgaaa gattcatgag tgcaaagggt agagttaagt tcttgtattg 360ggactggagt tgggattacc attagagctt cattgttata ctatgggtag atgggatttt 420atctctgtat gcataacttg ggacttacct ttagcattct actaaagctc aatcattctt 480gagagatccc ctgttactta agcctattct gtaagggacc atctttgtct cttgaccttc 540accttagcca aatgagttca ttgatgatgc attgtttgat tcacgttcca gaactaatga 600atgttaaagg gattggtaga tttgaaagca tgtgtaggtc gagtataaga gacggattga 660ttgataacaa ggcatggcta acgttttcga gtaaaattca atcatatcgc atcttagaac 720taccaacttg gacattgatt ttatttgctc tatcagatgc tttggttctg agtccccacc 780ttcaaacctc tccttcaact atgtcttctt atttgcttga gggcaagcaa agactaagtt 840
tgggggagtt gatatgtcta taatttgcat gttttcagtg tccattcatc atcgttttga 900gtccagtttc gtatcattca tcactgtttt atatcatttc tcatcattct tgcatacttt 960gcatgattag gatagctttg tatacatatt gcatttctga gttgttttta ggtgatttgg 1020agctgtttgc gagcaaattg gaagaaacga gccagaacaa gaagccatac tcgaccccct 1080ggtcgagtga ctttggagcc attcttccca tctactcgac ccgggggtcg agtaacctca 1140gctcaggcca ctcgatgacg ccactcgtcc cccctggtcg agtatcactt cgccacacca 1200cctgaccaca ctcggccgtt cactctacca cgttactcga ccccctggtc gagtatcatc 1260actcaccacc aacaccatca ctcgaccggg cactcgatca catcttcata gtctactcaa 1320atccgcactc aaccagacaa gctgagcaca aggaagagaa gaggagaaga caaagtgttt 1380ggaagcggcc tggacctcca tcggatcacg aagaagccca tctcggccca ttatcattct 1440atgggccggg cgattaggtt attggcccgt ctactatcat tttatttcgt tatgtataaa 1500tagatgtctt agggttctgt accaggacat ctagtcgaca ttgagttttt ttgcttcagt 1560tttattttct gttttctctg ctgcgccgct tttgtttctg caacctgtaa ttcgagattt 1620ttccaagtta ctcagattcc gcatttgatt tc 1652<210>5<211>903<212>DNA<213>拟南芥<400>5tactctcttc caaatttggt cacacagtgg actgtgtgat ttaagtttgg gggagggctc 60aggaagtgtg tgttgcattg tataatcttg agtttgcatt catctaaggc atagaaaaac 120caaaaaaatt gaaaaattcc agaaaatgat ttcacaaaaa tagagtgttc atgtagttgc 180attgcattta ggatcgagtt tagagtgttt cgtttaggat tgttgcatat gcatagggga 240taataatgag atagccttgt aagcattttg gttcaccaga taagctcagt gccctcgttg 300ttagttgttt gatgcgttgt cattgaaatt gaagtaagaa ctgcacgatg cctagattgc 360tctactcgac cacactgtta ggatctgata tcattcccta tcaatttgaa cttgaatctg 420atttagaatt atcatgtctt ggcatcgaat ttgaactcat ggatacccta aaatacttgg 480attttcttac tcattttaac cactcttgtt gatccaagta gctgactctc cttattagag 540cagttaaccc atacccaaac ctgaactttc tttcaagccc tatatcactt gtgagtgttt 600gtgaggtctt atttcgattg agcttggtag aaagtgttag gttcgtaacg acagagatag 660tgtctcatgt agttctagtt tgcgttcttc agactggata ggactaggtg ggcgcttata 720tcatgggttg ggatgtgttt aaaagaaaag agggaatcta ttgttgatga ggaaagggaa 780agaattccag gggaagtaag ctaaagaagt tagaaaaaaa atctagtaaa ggttttggga 840atgttaaaga aaagaatgag gttcttgtta gctaaagaag aagggttaaa agcctttggt 900ttt 903<210>6<211>614<212>DNA<213>拟南芥<400>6gagggcaagc aaagactaag tttgggggag ttgataagtg tgtattttgc atgttttgag 60catccatttg tcatcacttt agcatcatat catcactgtt ttataccatt tcacatcatt 120tgtcatcact ttgcatgttt aggatagttt tgcatgcatg ttgcatattt gcgttgattt 180caggtgattt ggagctgttg acgagctatc tggaagaagc agacctgatc atgacaaacc 240actcgaccca gaggtcgagt aggagcttca agatctcaag agactactcg acaaccaggt 300cgagtagagc acatcaccac ttcacctcac cactcgaccc cgaggtcgag tgccatcatc 360tccatcacca gacggtcact cgatcacttc actcgacctt gaggtcgagt gtcttcacct 420ccatcatcag acaaccactc gacctcctca ctccacctag aggtcgagta tctccatctt 480accactcgac tgcatactcg atgacaagct tcagagcctt cttaattccg cactcaacca 540gacactcgag cacaaggaag aaaagaagac tccagctatt cactcgagct ctcactcgac 600
cacgtgggtc gagt614<210>7<211>1956<212>DNA<213>拟南芥<400>7ttttggttca ccggattaac tcagtgctct cgttgctagt tgtgtgttgc gtagtgaatg 60aatttgaaag aaaactgaac catgcctaga ttgctctact cgaccacact gtcatgatct 120gataccattc cctatcaatt tgaacctgaa tttgatcttt aattatcatg tctgcatcaa 180atttgaactc atggataccc taaaatactt ggattttctt attcattttg atcactcttg 240ttaatccaag tagctgactc tccttattag agcagttaac ccgaacccaa acctagactt 300tttttcaagc cttatatcac tcgtgagggt ttgtgaggtc ttattccgat tcagcttggt 360agaaagtgtt aggttcgtaa cgacagagat agtgnctcat gtagttctag ttcgcatttt 420ttggactaga taggactggg tgggcgctta tactttaggt tgggatgngt ttaaaagaaa 480aaaaaagggg ttgattcatt gatgagaaaa ggtaaaagac tctaggtgaa gtaagataaa 540gaagcagaaa aggtctagta aaggttttgg gatttgtaaa aaaaagaaag agttcttgtt 600agctattgaa gatgggcaaa agccctcggt tttaaaatgt taaaaacagg aaccttagtt 660gttaaagaaa tccaaatccg ctagatgtat caaagtgttg agaaagcttt tcctagagtt 720aagagaaaag aaaagaatga ttagaaaaag ggcttaaagg attcatgaat gcaaagggta 780gaggtaagtt cttatactgg gattggagat gggattacca ttagagcttc atctgatata 840ctctaggtag atgggatctt atctctgcat gcatagtttg ggacttacct ttagcattct 900actaaagctt aatcattttt tgagagatcc cctgttactg aagcctattc tgtaagggac 960catctttgtc tcttgacctt ttaccttagc caaatgagtt cattgatgat gcattgcttg 1020attcacgttc cagaactaat gaatgttaaa gggattggta gatttgaaaa catgtgtagg 1080tcgagcatat gagtcggatt gattgatagt aaggcatggc taaagttttt cagtagaatt 1140cgatcatatc gcagcttaga actatcaact tggacattga tttcatttgg tttatctagt 1200gctttggctc tgagtccccg atttcaaacc tcacctctag cttgttctta attgtttgct 1260tgagggcaag caaagactaa gtttggggga gttgataagt gtgtattttg catgttttga 1320gcatccattt gtcatcactt tagcaccata tcatcactat tttataccat ttctcatcat 1380ttgtcatcac tttgcatgtt taggatagtt ttgcatgcat gtggcatatt tgtgttgttt 1440tcaagtgatt cggagctgtt gaagaactaa ttggaagaag cggacctgat catgccaaac 1500cactcgacct caggtcgagt agacgcttca cgacctcaac acaccactcg accacctggt 1560cgagtgtagg acttcaccac ttcacctcat cactcgaccc cctggccgag taccccacga 1620gagtcactcg atcacttcac tcgaccccca ggtcgagtgt cttcacctcc accacctgac 1680catcactcga tcacacgact ctacctggaa gtcgagtatc accatcacca ccactcgact 1740acatacttga tgtcgagctt cagagtcttc tccattccgc actcaaccag acactcgagc 1800acaaggaaaa aaagaagatt ctagcttatc actcgacctc tcactcgacc acctgggtcg 1860agtacagttc ttaatccgtc tcaatactgc gtcgttttga gtattagggt ttcggaatat 1920ttttgctata agtagcacgt actttacatt ttcgag 1956<210>8<211>2105<212>DNA<213>拟南芥<400>8ttagcatttt ggttcactag ataaactcag tgccctcgtt gttagttgtc tgatgcatac 60tcaatgaaat tgaagtaaaa ctgcaccatg cctagattgc tctactcgac cacactgtta 120ggatctgata ccattcccta tcaatttgaa cttgaatctg atttagaatt atcatgtctt 180gccatcgaat ttgaactcat ggatacccta aaatacttgg attttcttac tcattttaac 240cactcttgtt aatccaagta gctgactctc cttattagag cagttaaccc gaatccaaac 300ctaatctttc tttcgagccc tatatcactt gtgagtgttt gtgaggtctt atttcaattg 360
agcttggtag aaagtgttag gttcgtaacg acagagatag tgtctcatgt agttctagtt 420cgcgtttttt ggactggata ggactaggtg ggcgcttata tcatgggttt ggatcagttt 480aaaaaaaaaa aagggtgaat tcattgttga taaggaaagg gaaagaattc taggggaagt 540aagctaaaga agttagaaaa aaaaaaatct agtaaaggtt ttgggaatgt taaagaaaag 600aatgaggttc ttgttagcta aagaagaagg gttaaaagcc ttttgtttta aagattaaaa 660acaggaacct tagttgttaa agaaatccaa atacgctaga tgtatcagag tgttgagaaa 720gcttctccta gagttaagag aaaagaaaag aatgatatga aaaagagttt gaaagattca 780tgagtgcaaa gggtagagtt aagttcttgt attgggactg gagttgggat taccattaga 840gcttcattgt tatactatgg gtagatggga ttttatctct gtatgcataa cttgggactt 900acctttagca ttctactaaa gctcaatcat tcttgagaga tcccctgtta cttaagccta 960ttctgtaagg gaccatcttt gtctcttgcc ttcaccttag ccaaatgagt tcattgatga 1020tgcattgttt gattcacgtt ccagaactaa tgaatgttaa agggattggt agatttgaaa 1080gcatgtgtag gtcgagtata agagacggat tgattgataa caaggcatgg ctaacgtttt 1140cgagtaaaat tcaatcatat cgcatcttag aactaccaac ttggacattg attttatttg 1200ctctatcaga tgctttggtt ctgagtcccc accttcaaac ctctccttca actatgtctt 1260cttatttgct tgagggcaag caaagactaa gtttggggga gttgatatgt ctataatttg 1320catgttttca gtgtccattc atcatcgttt tgagtccagt ttcgtatcat tcatcactgt 1380tttatatcat ttctcatcat tcttgcatac tttgcatgat taggatagct ttgtatacat 1440attgcatttc tgagttgttt ttaggtgatt tggagctgtt tgcgagcaaa ttggaagaaa 1500cgagccagaa caagaagcca tactcgaccc cctggtcgag tgactttgga gccattcttc 1560ccatctactc gacccggggg tcgagtaacc tcagctcagg ccactcgatg acgccactcg 1620tcccccctgg tcgagtatca cttcgccaca ccacctgacc acactcggcc gttcactcta 1680ccacgttact cgaccccctg gtcgagtatc atcactcacc accaacacca tcactcgacc 1740gggcactcga tcacatcttc atagtctact caaatccgca ctcaaccaga caagctgagc 1800acaaggaaga gaagaggaga agacaaagtg tttggaagcg gcctggacct ccatcggatc 1860acgaagaagc ccatctcggc ccattatcat tctatgggcc gggcgattag gttattggcc 1920cgtctactat cattttattt cgttatgtat aaatagatgt cttagggttc tgtaccagga 1980catctagtcg acattgagtt tttttgcttc agttttattt tctgttttct ctgctgcgcc 2040gcttttgttt ctgcaacctg taattcgaga tttttccaag ttattcagat tccgcatttg 2100atttc 2105<210>9<211>4860<212>DNA<213>人工序列<220>
<223>人工序列描述虚拟TSI<400>9tcgccgttcc agcttcgcat actctctcac cgtctctcgt ttcactcgac cacttcacac 60ttcgcctcaa catcttcgcc ggagtttctc gccattgtcc gtgcttccgt catctccgtt 120cactcgacca ccggaccggc ttcaccatct ctcaactatc caccattcac tcgacctcgc 180cattcactgc gcctccattc gtctctttac tcgactgctc ctcaaaccgc caccgtcttc 240tctaaattcg ccgtttactc gaccacactg ttacgtctct cattcgtgta cagtcgaccg 300ctatacccga agccacaata tcactctact cgaccgtttc actcgatcgc gtacttgact 360ggtttagtgt gtgtgtttat ttgaactaac atattgatat ttggttttga gttacattct 420ttttcaggga atcaatatga gcaactacag tggcgaatcc tccatggatg cggattacaa 480cgtcgatgaa gctgaatctt ggtcaactag accagagaga gagcaacagg cttatgagag 540cttcagagcc gagacccaac gctcagtagc tcgacgcaat gaaaggagag ctgagattgc 600tagaggaaag agagcgatga ccagcagata tgagttgatc gacgaagata ttgacgtcga 660gtatgagcct gagtcatggc acagagaaac aaaactgttg aacaagcctg atgaagttac 720agtggaagag tacatcagac ttttcgagct gaacgacttc tggggagcga ggtacccctg 780ttatgagact ctagcccagc ttaggctact ggaggacgta cagcacttat tcgagaagtg 840ccatcttgag acgctgatgt cttacccgta cgtcgcttac aagaaggaaa caatagagtt 900
tctctccact ctgcaagtgg agttgtatca gggacttact gcagatgaac tggagagtga 960agggttggga ttcttgactt tttcagttaa cgagcagcgt taccagctat ctatcaagag 1020cttggaagga ttatttggtt ttcccagtgg aaagggaact aaacccaagt tcgaaaggga 1080agagttgaag gatttgtggt taaccattgg gaacgatttg gcgctcaact ctgcaaggtc 1140taagagcaac cagattcgaa gccctgtgat ccgctactat cagcgctcag tagcgaatgt 1200tctgtacccc agggaatcta caggcaccgt gtctaacaca gacatggaga tgattgattc 1260tgcactcaag ggtattctcc ggagaacaaa ggggaagaag gtcctaaagg gcgaccttaa 1320tgatacacca ccggtcatgc ttctgttgat ccatatgtgt ggatacagga agtgggcgca 1380caccaacggg aggaagaagg tgcgaggagc cctttgtgtg ggtggcgttg tgacaccgat 1440tctgattgca tgtggtgtac ctctcacgtc tccagggttt gatccgagga tgatggattt 1500agatcacttg cgtcgttgtg agtttctgga gtacgacatg gttggcgatt tctatcgcta 1560caaattcgag cactccctga cccgaacagc caacattttg cttccctgca tcgaggccac 1620aaccatactt tagggtgaga acattgactt cagacctgcg cgtgattacc tctactttga 1680gagcactcca ccgactgatg acaatgtccc tacgacggaa gctacagagg atgattttgc 1740tgagacggat gaggataggg aggaggagta tgatacgagc atgtatcatt tcagtgagca 1800cgtacctcca gcgcaggaga gcaagagctt gagtgaagct cacagaaaca acagtaagtt 1860gcagaggtgg tgcaagaaac aagataggtt acttatcaag tgcttcaagg ccatcacgtt 1920tctaacggac aagataagtt gcttctcttc taccacagct attccgcagg gagagcgtcc 1980tcaggacatg ccttcgaaga gatatgacgc gccagggcca agtcatcaca ggcctgagcc 2040aagtcaccac aggcctgagc ctagtgaccg agtagtacca ccagtccctg caaggcattc 2100atcattcgag cctcgggagc tcgggagaaa gaagaaggct gcactcgcta ggtctggcag 2160caggagtaga cgacttctcc agtcccgtag cttacgcgac cgcggtgctg gccgcagcag 2220aagaagagag gtcgagtatc atcagagcgg tgctggccgc ggcgaaggag cagaggtcga 2280gtacccccag ggggaagctg agacacaaca gggagattct tcgatggcct gggagcaatc 2340acaggcagct attgacgacc aactccgctc cttcttccac tgaggtatgc acctcactcc 2400accattgtaa tataccatct cttgtttttt attttgtttt tgtgatgtgt tttgtcctga 2460gtactctctt ccaaatttgg tcacacagtg gactgtgtga tttaagtttg ggggagggct 2520caggaagtgt gtgttgcatt gtataatctt gagtttgcat tcatctaagg catagaaaaa 2580ccaaaaaaat tgaaaaattc cagaaaatga tttcacaaaa atagagtgtt catgtagttg 2640cattgcattt aggatcgagt ttagagtgtt tcgtttagga ttgttgcata tgcatagggg 2700ataataatga gatagccttg taagcatttt ggttcaccag ataagctcag tgccctcgtt 2760gttagttgtt tgatgcgttg tcattgaaat tgaagtaaga actgcacgat gcctagattg 2820ctctactcga ccacactgtt aggatctgat atcattccct atcaatttga acttgaatct 2880gatttagaat tatcatgtct tggcatcgaa tttgaactca tggataccct aaaatacttg 2940gattttctta ctcattttaa ccactcttgt tgatccaagt agctgactct ccttattaga 3000gcagttaacc catacccaaa cctgaacttt ctttcaagcc ctatatcact tgtgagtgtt 3060tgtgaggtct tatttcgatt gagcttggta gaaagtgtta ggttcgtaac gacagagata 3120gtgtctcatg tagttctagt ttgcgttctt cagactggat aggactaggt gggcgcttat 3180atcatgggtt gggatgtgtt taaaagaaaa gagggaatct attgttgatg aggaaaggga 3240aagaattcca ggggaagtaa gctaaagaag ttagaaaaaa aatctagtaa aggttttggg 3300aatgttaaag aaaagaatga ggttcttgtt agctaaagaa gaagggttaa aagcctttgg 3360ttttaaagat taaaaaaaaa acaggaacct tagttgttaa agaaatccaa acccgctaga 3420tgtatcaaga gcgttgagaa agcttctcct agagttaaga gaaaagaaaa gaatgatatg 3480aaaaagagtt tgaaagattc atgagtgcaa agggtagagt taagttggga caggagttgg 3540ttttaccatt agaacttcat tgttatactc tgggtagatg ggatcttatc tctgtatgca 3600taatttggga cttaccttta gcattctact aaagctcaat cattcttgag ggatcccctg 3660ttacttaagc ctattctata agggaccatc tttgtctctt gaccttcacc ttggccgaat 3720gagttcattg atgatgcatt gcttgattcg cgttccagaa ctaatgaatg ttaaagggat 3780tggtagattt gaaagcatgt gtaggtcgag tataagagac ggattgattg aaaacaaggc 3840atggctaacg tttttgagta gaattcaatc atatcgcatc ttagaactac caacttggac 3900attgatttta tttgctctat catatgcttt ggttttgagt ccccgccttc actcctctcc 3960ttcaactatg tcttcttatt tgcttgaggg caagcaaaga ctaagtttga gggagttgat 4020atgtctataa tttgcatgtt ttcagtgtcc attcatcatc gttttgagtc cagtttcgta 4080tcattcatca ctgttttata tcatttctca tcattcttgc atactttgca tgattaggat 4140aactttgcat acatattgca tttctgagtt gttttcaggt gatttggagc tgtttgcaag 4200caaattggaa gaaatgagcc agaaccagaa gacatactcg acccctaggt cgagtgactt 4260
tggggccatt cttcccacat actcggcccc caggtcgagt gactttggag ccattcttcc 4320catccactcg accaccgggt cgagtaacct tagctcaggc cactcgatga cactactcga 4380ccccaggtcg agtatcactt cgccacacca cctgacaaca ctcgaccaat cactctacca 4440agttactcga ccccctggtc gagtatcatc actcaccacc atcagcatca ctcgaccgga 4500cactcgatca cgtcttcaca gtctactcaa atccgcagtc aaccagacaa gctgagcaca 4560aggaagagaa gaggagaaga caaagtgctt ggaagcggcc tggacctcca tcggatcacg 4620aagcccatct cggcccatta tctctctatg ggccgagcga ttaggttatt ggcccgtcta 4680ctatcatttt atttcgtttt gtataaatag atgtcttagg gttttgtcct gagacatcta 4740gtcgacattg agtttttttt gcttcagttt tattttctgt tctactctgc tgcgccgcct 4800ttgcttctgc aacctgtaat tcgagatttt tccaagttat tcagattccg catttgattt 4860<210>10<211>648<212>PRT<213>拟南芥<400>10Met Ser Asn Tyr Ser Gly Glu Ser Ser Met Asp Ala Asp Tyr Asn Val1 5 10 15Asp Glu Ala Glu Ser Trp Ser Thr Arg Pro Glu Arg Glu Gln Gln Ala20 25 30Tyr Glu Ser Phe Arg Ala Glu Thr Gln Arg Ser Val Ala Arg Arg Asn35 40 45Glu Arg Arg Ala Glu Ile Ala Arg Gly Lys Arg Ala Met Thr Ser Arg50 55 60Tyr Glu Leu Ile Asp Glu Asp Ile Asp Val Glu Tyr Glu Pro Glu Ser65 70 75 80Trp His Arg Glu Thr Lys Leu Leu Asn Lys Pro Asp Glu Val Thr Val85 90 95Glu Glu Tyr Ile Arg Leu Phe Glu Leu Asn Asp Phe Trp Gly Ala Arg100 105 110Tyr Pro Cys Tyr Glu Thr Leu Ala Gln Leu Arg Leu Leu Glu Asp Val115 120 125Gln His Leu Phe Glu Lys Cys His Leu Glu Thr Leu Met Ser Tyr Pro130 135 140Tyr Val Ala Tyr Lys Lys Glu Thr Ile Glu Phe Leu Ser Thr Leu Gln145 150 155 160Val Glu Leu Tyr Gln Gly Leu Thr Ala Asp Glu Leu Glu Ser Glu Gly165 170 175Leu Gly Phe Leu Thr Phe Ser Val Asn Glu Gln Arg Tyr Gln Leu Ser180 185 190Ile Lys Ser Leu Glu Gly Leu Phe Gly Phe Pro Ser Gly Lys Gly Thr195 200 205
Lys Pro Lys Phe Glu Arg Glu Glu Leu Lys Asp Leu Trp Leu Thr Ile210 215 220Gly Asn Asp Leu Ala Leu Asn Ser Ala Arg Ser Lys Ser Asn Gln Ile225 230 235 240Arg Ser Pro Val Ile Arg Tyr Tyr Gln Arg Ser Val Ala Asn Val Leu245 250 255Tyr Pro Arg Glu Ser Thr Gly Thr Val Ser Asn Thr Asp Met Glu Met260 265 270Ile Asp Ser Ala Leu Lys Gly Ile Leu Arg Arg Thr Lys Gly Lys Lys275 280 285Val Leu Lys Gly Asp Leu Asn Asp Thr Pro Pro Val Met Leu Leu Leu290 295 300Ile His Met Cys Gly Tyr Arg Lys Trp Ala His Thr Asn Gly Arg Lys305 310 315 320Lys Val Arg Gly Ala Leu Cys Val Gly Gly Val Val Thr Pro Ile Leu325 330 335Ile Ala Cys Gly Val Pro Leu Thr Ser Pro Gly Phe Asp Pro Arg Met340 345 350Met Asp Leu Asp His Leu Arg Arg Cys Glu Phe Leu Glu Tyr Asp Met355 360 365Val Gly Asp Phe Tyr Arg Tyr Lys Phe Glu His Ser Leu Thr Arg Thr370 375 380Ala Asn Ile Leu Leu Pro Cys Ile Glu Ala Thr Thr Ile Leu Xaa Gly385 390 395 400Glu Asn Ile Asp Phe Arg Pro Ala Arg Asp Tyr Leu Tyr Phe Glu Ser405 410 415Thr Pro Pro Thr Asp Asp Asn Val Pro Thr Thr Glu Ala Thr Glu Asp420 425 430Asp Phe Ala Glu Thr Asp Glu Asp Arg Glu Glu Glu Tyr Asp Thr Ser435 440 445Met Tyr His Phe Ser Glu His Val Pro Pro Ala Gln Glu Ser Lys Ser450 455 460Leu Ser Glu Ala His Arg Asn Asn Ser Lys Leu Gln Arg Trp Cys Lys465 470 475 480Lys Gln Asp Arg Leu Leu Ile Lys Cys Phe Lys Ala Ile Thr Phe Leu485 490 495Thr Asp Lys Ile Ser Cys Phe Ser Ser Thr Thr Ala Ile Pro Gln Gly
500 505 510Glu Arg Pro Gln Asp Met Pro Ser Lys Arg Tyr Asp Ala Pro Gly Pro515 520 525Ser His His Arg Pro Glu Pro Ser His His Arg Pro Glu Pro Ser Asp530 535 540Arg Val Val Pro Pro Val Pro Ala Arg His Ser Ser Phe Glu Pro Arg545 550 555 560Glu Leu Gly Arg Lys Lys Lys Ala Ala Leu Ala Arg Ser Gly Ser Arg565 570 575Ser Arg Arg Leu Leu Gln Ser Arg Ser Leu Arg Asp Arg Gly Ala Gly580 585 590Arg Ser Arg Arg Arg Glu Val Glu Tyr His Gln Ser Gly Ala Gly Arg595 600 605Gly Glu Gly Ala Glu Val Glu Tyr Pro Gln Gly Glu Ala Glu Thr Gln610 615 620Gln Gly Asp Ser Ser Met Ala Trp Glu Gln Ser Gln Ala Ala Ile Asp625 630 635 640Asp Gln Leu Arg Ser Phe Phe His645<210>11<211>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>11tggttcacca gataagctca gtgccctc 28<210>12<211>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>12cttcagactg gataggacta ggtgggcg 28
<210>13<211>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>13cgcccaccta gtcctatcca gtctgaag 28<210>14<211>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>14cgcatcaaac aactaacaac gagggcac 28<210>15<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>15cgataacatc gaccgtattg ctcgcc26<210>16<2ll>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>16aactagctcc catccgtctt cgacatcc 28<210>17<211>24<212>DNA
<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>17tgcatcacac cggattggat tgac 24<210>18<211>28<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>18tgttcccctg aaccatagca atgagacc 28<210>19<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>19caaacagaca gagtgtggcc caccacc 27<210>20<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>20caaacagaca gagtgtggcc caccacc 27<210>21<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列
<400>21tgcaaaccca caggaccaag tctaccc 27<210>22<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>22acagatggtg atagcgtgag cggtggc 27<210>23<211>26<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>23tcaacctttt gccccaacaa ccactc26<210>24<211>27<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>24tctccatcca cgctttcctg aatgtcc 27<210>25<211>29<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>25ggagaaggaa gctgaaaatc atattgtgg 29
<210>26<211>29<212>DNA<213>人工序列<220>
<223>人工序列描述寡核苷酸序列<400>26atgatgatcc taagtctacc cttttgcac 29<210>27<211>3122<212>DNA<213>拟南芥<400>27ttcatatatt cgacctcttc ttctcattct tgcatccaaa agacacaaca agccgccatc 60gctttccctc acaactctca ctcgaccacc gcccgctctc tcacttactc ggcttcatcg 120ctctcatcgc catctctcaa catactcgac ctcgcgatat cactcgagct cgccgcttct 180caccgcctct ccatcgtcac cgcctgctcc ctctctccaa ggaaacaact cgagctctcc 240atttcactca ctcgacctct accaccaagc cggcttcacc acttctagct cttaaccact 300cgaccacctt caccatcaac caatcaaatc gttttctcct ccattaaagc ttgacatact 360cgaccgctga acacttatca ccttcaagct cctcatctct tcatcgtttc caacaccgct 420gctctcatcc cccacgaaag cttgtcatca cctctcactc atcaccagtt cactcgattc 480agcaaccaaa ctcgacctcg tctctcttgc cactcatagt cactcgatct ctcctcacca 540tcttcatcat ctcccttact cgaccaccgt gcgtctcgct ccaccattgc catttaaaag 600ctcactcgat tgtcaaagag aagaagagtg aagctcaacc accgccactc gaccgcgttt 660ccctctacac attcaacact cgaccacggt gctaccatct ccacacccgc tcttgttcac 720catacactcg accaacaact ctcaaagtaa aaaaaaaaag aaaaaaaaag tcaaaaccga 780cagtttcact caaccggttt actcgaccgg tacgctggtt tagattgtgt ttttggtttt 840gctattacta acatattaac gtttatcttt gagtttcgtc tgtttttagg tttcatcatg 900agtaactaca gtggaaaatc ctctatggac cctgattata atgtggatga agctaagtcc 960tggtccacta gaccggagtg agagcaacat gtttacgaga gctataggga tgaatttgaa 1020cgctctgcag ctcgacgtaa tcaaagaaga gctgaaatcg ctagaggaaa gagggcgatg 1080tcgagtagat atgagctgat tgatgaggat atcaaaactg agtatgagcc agagtcatgg 1140cgcaaggaga cgaagctact gaacaaatcc gacgaggtta cagtggagga gtatatcaga 1200ttctttgaga tgaatgactt ctggggaacg aggtatccct gatatgagac tttagcccag 1260ttggggttac tggaggacgt gcagcatctg ttcgagaagt gtcatctgat aaggaggaga 1320caatcgagtt tctttccaca ctgcaagtgg aaatgtatga gggactcaca gactttgagc 1380tggataccat ggggttaggc ttcttgacgt tcttagtgga tgaacagcgg taccagattt 1440agatcaagaa attggaagaa ctgtttggtt tccctagtgg aaagggaacc aaccccaggt 1500ttgacaggga agagcttaag gatttgtggg ctactattgg gaacaatcta ccgctaaact 1560cgacgcggtc caagagcaac caaatccgga gtcctgtgat tcgctacttt cagcgctcgg 1620ttgccaatgt tttttactcc agggagtcta caggcaccgt gtctaacaca gacatgaaga 1680tgatagattc agcgcttata gggattctcc gccttacaaa aggaaagaat gtcctgagag 1740gagatcttaa cgactcacca ccagtaatgc ctctgttgat ccatctgtgt gggtacatga 1800agtgggcgct gacaaacggc aagaagaagg taagaggagc actatgcgtg ggtggcgttg 1860tgacgccaat tctgaaagtt tgtggagttc cgctcaagga agtagggtta gcaccgagaa 1920tgatggactt ggatcacttg cgccgatgtg agttctctga gtttgacatg gttggcgact 1980ttcaccgcta caggttcgag cattcatcga ttagaatcgc caacattctt ttcccctgca 2040tttacgctac taggattctc gagggcagga acattgactt caagcctgcg cttgaagatc 2100
tttatttcga gggcagtccg ccaactgagg agattagtca caccgaagga gctacaatag 2160aagatgttga tgagacatat gatatagatg aggcggagtt tgacacgagc atgtatcatt 2220tcagtgagca tatacctcca gcgaggaaaa gcaagagttt gagcgaagct cacaggaaca 2280acagcaagct gcagaagtgg tgcaagaaac aggataagtt actcgccaag tgcctcaggg 2340ctatcaagtt tctgaaggac aagatcagct gctcctcttc cactacaact attccgcaat 2400gacagctccc tcaggacatg ccttcgagga gatatgacgc gcccgagcct agagagcaga 2460agattctgca tgtccctgcg aggcattcat cattcgagcc tcgtgaatct aggaagaata 2520ggagaacgac actcactcga tctagcagca ggagcagacg acttctgcag tctcgtagtt 2580tacgcgaccg cggtgctggc cgcaatagaa gaagagaggt cgagtatcct cagagcggtg 2640ctggccgcca cagagctgat gagatcgagt acccacatgc tggagctgat acggaacatg 2700gcggttcgtc tatggcttgg gagcaatcac aggcagccat tgactaccaa cttcgttcat 2760tattcgactg aggtaagcgc ctcacttcac cattatatta tatcatctct tgtgatttgt 2820tctttatttt gtttcagtga ttggatttgt cctgagtact ctcttccaag tttattcaca 2880cagtggactg tgtgatttaa gtttggggga gggctcagga agtatgttgc attgtatata 2940tttttaagtc tgcattcatc taaggcatag aaaaaccaaa aaaaaattaa aaatttcaga 3000aaatgatttc acaaaaaaag agtgttcatg tagttgcatt acatttagga tcaagtctag 3060agtgtttcat ttaggattgt tgcatatgca taggggataa tgatgagata gccttgtaag 3120ca312权利要求
1.选择相比于野生型植物而言其转录水平基因沉默受损的植物的方法,该方法包括(a)分别制备一系列植物的RNA;(b)用核酸探测这些RNA制品,该核酸由至少50个核苷酸残基的序列组成,所述序列与选自以下的序列比对时具有至少80%的同一性SEQID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27;并且(c)鉴定其RNA与所述核酸杂交的植物。
2.权利要求1的方法,其中所述核酸由至少100个核苷酸残基的序列组成,所述序列与选自以下的序列比对时具有至少85%的同一性SEQID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
3.权利要求1或2的方法,其中所述核酸由至少200个核苷酸残基的序列组成,所述序列与选自以下的序列比对时具有至少90%的同一性SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ IDNO5、SEQ ID NO6、SEQ ID NO7、SEQ ID NO8、SEQ ID NO9或SEQ ID NO27。
4.权利要求1-3任一的方法,其中所述核酸由SEQ ID NO7、SEQID NO9或SEQ ID NO27构成。
5.权利要求1的方法,其中方法的步骤b)和c)包括用特异于SEQ IDNO1、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9或SEQ ID NO27的寡核苷酸引物,对所述RNA进行逆转录,并随后对所产生的DNA进行扩增。
6.用于鉴定转录水平基因沉默受损的植物的试剂盒,其包括核酸,后者由至少50个核苷酸残基的序列组成,所述序列与选自以下的序列比对时具有至少80%的同一性SEQ ID NO1、SEQ ID NO2、SEQ ID NO3、SEQ ID NO4、SEQ ID NO5、SEQ ID NO6、SEQ ID NO7、SEQID NO8、SEQ ID NO9或SEQ ID NO27,该核酸被便利的标记以用作杂交探针。
全文摘要
本发明涉及转基因整合到植物基因组中后所观察到的基因沉默。比较两种拟南芥属品系转录水平基因表达,其中一种以多拷贝的形式带有沉默的转基因,另一种则是其突变体衍生物moml,它在使该转基因处于沉默上受到损害。经比较发现有两个cDNA克隆在突变的植株中表达,而在其亲本和野生型植株中都没有表达。这两个克隆都来自于同一个转录物家族,被称作TSI(转录水平沉默信息)。编码TSI的基因组模板在多种生态型中都是主要位于中心粒旁、组成保守的重复元件。在上述突变体中,TSI基因组模板的转录水平沉默被特异的解除了。TSI的转录可被用来作为鉴定植物中缺陷型沉默途径的标志。
文档编号C12Q1/68GK1766118SQ20051010696
公开日2006年5月3日 申请日期2000年9月14日 优先权日1999年9月16日
发明者A·斯泰默, O·米特尔斯坦谢德, J·帕兹科斯基 申请人:辛根塔参与股份公司