专利名称:具有迟发性种子散布的特性的种子植物的制作方法
技术领域:
本发明是在全国科学基金DCB9018749提供的政府资助下进行的。政府在本发明中拥有一定的权利。本发明的背景本发明的领域本发明主要涉及植物分子生物学和遗传工程,尤其涉及经遗传改良、其天然的熟裂过程被延迟了的种子植物。
背景信息油菜籽是仅次于大豆和棉籽的最为重要的油籽作物,在1990年它占世界油籽生产的10%。油菜籽含有40%的油,从种子中榨取,剩下的高蛋白的种子粉可用作动物饲料和氮肥。菜籽油,也称作canola油,它是一种很有价值的产品,是世界第四大普通贸易植物油。
油料种子的产品,油菜籽的种子粉和油,作为食物和饲料粮食,在过去的30年中,主要由于栽培面积的扩大而持续增加。大部分的北欧国家生产油菜籽作为其主要的食用油作物。到2000年,中国预计是最大的生产国,生产9.2吨(Mt;26%);其后是印度,7.8Mt(22%);欧共体(12国),7.6Mt(21%);加拿大,3.8Mt(11%)和东欧,2.6Mt(7%)。
遗憾的是,油菜籽和相关植物中种子的产生受到果荚熟裂的限制,这是发生在果实发育后期的一个过程,果荚打开,包裹的种子释放出来。沿着分隔果荚的两半的分离的细胞层,称作“熟裂区域”的细胞壁降解并分离,使得两半果荚分开并释放出内含的种子。种子“散落”,因而在收获作物之前,种子过早地熟裂而散去,这是商业种子生产者所要面对的一个重要的问题,它意味着产业收入的损失。不利的气候条件会恶化熟裂过程,导致50%以上的种子产量的损失。
在过去的20年中,对于解决此问题的尝试曾集中于培育抗散落的变异体。但是,植物杂种通常是不育的,而且必须回交以重新获得丧失的优良特性,这些都是费时费力的。其他缓解果荚散落的策略包括使用化学药物诸如果荚密封剂,或者机械技术,诸如铺草来降低风刺激的散落。而到目前为止,还未见有文献描述一种简单的方法,能够产生经过遗传学改良而不会提前打开释放出种子的种子植物。
因此,有必要鉴定调控熟裂过程的基因,并开发出经过遗传学改良、其天然的种子散布过程被延迟了的种子植物变种。本发明正满足于这种需要并且还提供了相关的优势。
本发明的小结本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性。这种AGL-8类的基因产物可以基本上具有,例如,AGL8定向进化同源物诸如拟南芥属的AGL8(SEQ ID NO2)的氨基酸序列。本发明中尤其有用的、具有了迟发性种子散布的特性的种子植物包括十字花科的成员,诸如油菜籽,以及豆科(Fabaceae)成员如大豆、花生、扁豆和菜豆。
在一个具体实施方案中,本发明提供了由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性的转基因种子植物。在本发明的转基因种子植物中,编码AGL-8类的基因产物的核酸分子可以与外源性调控因子可操纵相连。有用的外源性调控因子包括组成型调控因子和熟裂区域选择性调控因子。尤其是,外源性调控因子可以是AGL1调控因子和AGL5调控因子的熟裂区域选择性调控因子。
在另一个具体实施方案中,本发明提供了一种非天然存在的种子植物,由于该种子植物中AGL-1和AGL-5表达的抑制因而具有了迟发性种子散布的特性。这种非天然存在的、具有了迟发性种子散布的特性的种子植物可以是,例如,agl1 agl5双突变体。
本发明进一步还提供了一种来自本发明的非天然存在的种子植物的组织。在一个具体实施方案中,本发明提供了一种来自本发明的非天然存在的种子植物的组织,该种子植物具有异位表达的编码AGL-8类的基因产物的核酸分子,并具有迟发性种子散布的特性。在另一个具体实施方案中,本发明提供了一种来自非天然存在的种子植物的组织,该种子植物中AGL1的表达和AGL5的表达都被抑制,从而该种子植物具有迟发性种子散布的特性。
本文还提供了生产非天然存在的、具有迟发性种子散布的特性的种子植物的方法。该方法使得编码AGL-8类的基因产物的核酸分子在种子植物中异位表达,从而由于该核酸分子的异位表达而推迟种子的散布。
本发明还提供了一种基本纯化的熟裂区域选择性调控因子,包括能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的核苷酸序列,条件是该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703位核苷酸所构成的核苷酸序列,该熟裂区域选择性调控因子可以是,例如,AGL1调控因子或者AGL5调控因子。
本发明还进一步提供了一种植物表达载体,它含有能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的熟裂区域选择性调控因子,条件是该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703位核苷酸所构成的核苷酸序列。如果需要,植物表达载体除了含有熟裂区域选择性调控因子之外,还含有编码AGL-8类的基因产物的核酸分子。
本发明还提供了用以生产具有迟发性种子散布的特性的转基因种子植物的试剂盒,该试剂盒含有熟裂区域选择性调控因子,能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达,条件是该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703位核苷酸所构成的核苷酸序列。在本发明的试剂盒中,该熟裂区域选择性调控因子可以,如果需要,与一个编码AGL-8类的基因产物的核酸分子可操纵相连。
附图的简要描述
图1显示的是授粉时拟南芥属的雌蕊的扫描电镜图,显示出多种具有明显区别的细胞类型,包括顶端柱头、花柱和子房。标出的子房壁,或壳瓣,沿着其全部长度被一个所谓“胎座框”的小的接缝所分开。还标出了熟裂区域,一个具有一至三个细胞宽度的沿着壳瓣/胎座框接界的狭窄的细胞条带。
图2显示一个果荚刚刚破裂的野生型拟南芥属的果实。种子以及胎座框都清晰可见。
图3显示野生型拟南芥属和一个代表性的35S∷AGL8转基因株系的扫描电镜图。在野生型中可以见到熟裂区域。相反,在35S∷AGL8转基因株系中,外部胎座框的细胞转变成壳瓣细胞,而熟裂区域不存在了。
图4表示agl5和agl1基因组区域和agl5或agl1突变体中AGL5或AGL1表达的丧失。图4A表示AGL5基因的基因组结构,方框表示外显子的位置,细线表示内含子的位置。通过定位分裂和同源重组产生的agl5突变等位基因带有一个卡那霉素抗性盒,以一个黄色的阴影框表示,位于MADS盒的区域内。图4B表示AGL1基因的基因组结构,箭头表示在agl1-1位点的大内含子中的大约17kb T-DNA插入的位置。方框表示外显子的位置,细线表示内含子的位置。阴影框表示MADS盒的区域。图4C表示对AGL5基因的互补cDNA的3′端特异的探针,用以检测野生型中具有的而在agl5的敲除突变体中不具有的AGL5的转录。图4D表示对AGL1基因的互补DNA(cDNA)的3′端特异的探针,用以检测在野生型中具有而在T-DNA插入产生的agl1的突变体中不具有的AGL1的转录。
图5表示野生型拟南芥属和agl1 agl5双突变体的扫描电镜图。在熟裂过程中,野生型拟南芥属果实上壳瓣正与胎座框分开。在相同的发育时期,agl1 agl5双突变体则保持着与胎座框相连。
图6表示拟南芥属AGL8的核苷酸(SEQ ID NO1)和氨基酸(SEQID NO2)序列。
图7表示拟南芥属AGL1基因(SEQ ID NO3)。标出了外显子和翻译起始位点。
图8表示拟南芥属AGL5基因(SEQ ID NO4)。标出了外显子和翻译起始位点。
本发明的详细描述本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性。这种AGL-8类的基因产物可以基本上具有例如AGL8定向进化同源物诸如拟南芥属的AGL8(SEQ ID NO2)的氨基酸序列。
果实,是开花植物才有的一种复杂的结构,介导种子的成熟与散布。大多数开花植物的果实由子房壁发育而来的心皮以及由受精胚珠发育而来的种子组成。拟南芥属,属于典型的十字花科,有3000多个种,它产生的果实中两个心皮壳瓣(子房壁)与胎座框相连,胎座框是分开两个心皮的一个可见的接缝。在图1中显示了授粉时期的拟南芥属的雌蕊的结构,包括心皮壳瓣和胎座框。
果荚熟裂或散落发生在许多种重要的作物例如油籽油菜(Brassicanapus L.)果实发育的后期,具有经济上的重要性,它能导致种子产量的显著损失。在油籽油菜中,熟裂涉及细胞壁材料的分解,这发生在所谓“熟裂区域”的不连续的细胞层上,这是一至三个细胞宽度的沿着壳瓣/胎座框接界全长的区域(Meakin和Roberts,实验植物学杂志,41995-1002(1990))。当熟裂区域的细胞彼此分开后,壳瓣与胎座框分开,使种子散布出来(见图2)。
植物激素乙烯由发育中的种子产生,它看来是一种重要的熟裂过程的调节因素。支持乙烯在熟裂中的调节作用的证据来自对果实成熟的研究,即,果实的熟裂是一个涉及细胞壁材料的分解的过程。在果实成熟中,乙烯的作用在某种程度上是激活细胞壁的降解酶,如聚半乳糖醛酸酶(Theologis等,发育遗传学,14282-295(1993))。而且,在遗传改良的番茄植物中,乙烯应答被抑制了,诸如表达反义聚半乳糖醛酸酶的转基因番茄植物,果实成熟的过程被显著地延迟了(Lanahan等,植物细胞,6521-530(1994);Smith等,自然,334724-726(1988))。
在熟裂过程中,熟裂区域细胞壁的中间层的降解所发生的超结构变化,使得油菜籽果荚弱化,最终导致果荚散落。在果实成熟过程中,水解酶包括聚半乳糖醛酸酶在这个程序化分解过程中起作用。例如,油籽油菜中,特异的内-聚半乳糖醛酸酶,RDPG1,被正向调节,并在果荚发育后期的熟裂区域被唯一表达(Petersen等,植物分子生物学,31517-527(1996),在此提及可供参考)。在果实成熟中,乙烯可以调节与熟裂过程相关的水解酶(Meakin和Roberts,实验植物学杂志,411003-1011(1990),在此提及可供参考)。迄今为止,调控熟裂过程的蛋白质,诸如那些能调节相关的水解酶的,还未被鉴定出来。
本发明得出了令人惊奇的发现AGL8转录因子可调节熟裂过程。如本文所公开的,转化了在35S花椰菜花叶病毒(CaMV)组成型启动子调控下的AGL8 cDNA的拟南芥属植物,在整个转化植物中AGL8被异位表达。尤其是,正常情况下在心皮壳瓣表达的AGL8,也在胎座框表达,胎座框是成熟果实中分隔两个壳瓣的细胞小带。这样异位表达的结果,果实的胎座框不存在了,外部胎座框的细胞被具有与壳瓣相同特性的细胞所替代,这表明,在此范围内,AGL8的表达足以确定壳瓣细胞的命运。而且,AGL8 cDNA的异位表达产生的转基因植物,其熟裂区域无法正常发育,导致迟发性种子散布(见实施例I)。野生型拟南芥属所产果实在大约授粉后第14天打开并释放种子,而转化的AGL8异位表达的拟南芥属所产果实的种子散布被延迟了,或者种子永不释放,除非被人工打开(见图3)。因此,本文首次将种子植物经遗传改良而延迟了它的天然熟裂过程。
本发明还涉及令人惊奇的发现agl1 agl5双突变体种子植物具有与AGL8功能获得表型显著相似的迟发性种子散布的表型。如本文所述,由分裂性T-DNA插入以及同源重组产生了AGL1和AGL5基因的功能丧失的突变(见实施例II)。得到的agl1 agl5双突变体植物中,熟裂区域无法正常发育,成熟的果实不能进行熟裂(见图5)。因而,AGL1和AGL5基因是熟裂区域发育所需要的。这些结果表明,AGL1、AGL5和AGL8调控果荚熟裂,对AGL1、AGL5和AGL8表达的操纵可以使得果荚散落得以受到控制。
因此,本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性。这种AGL-8类的基因产物可以基本上具有例如AGL8定向进化同源物诸如拟南芥属的AGL8(SEQ ID NO2)的氨基酸序列。
本文中对于种子植物所用的术语“非天然存在的”是指,被人遗传改良的种子植物。本发明的转基因种子植物,例如,就是一种非天然存在的、含有外源的编码AGL-8类的基因产物核酸分子,从而被人遗传改良的种子植物。此外含有,例如,由于有目的地暴露于诱变剂,诸如化学诱变剂,或者“插入诱变剂”,诸如转座子,而导致在外源的编码AGL-8类的基因产物调控因子或者编码序列上的突变,也被认为是非天然存在的种子植物,因为它也被人遗传改良了。相反,含有自发的或天然存在的突变的种子植物不是本文所定义的“非天然存在的种子植物”,因而也就不包括在本发明中。本领域的熟练技术人员知道,虽然非天然存在的种子植物一般与天然存在的种子植物相比,具有改变了的核苷酸序列,但是,非天然存在的种子植物也可以并不改变其核苷酸序列而被人遗传改良,例如,通过修饰其甲基化类型。
本文中对于编码AGL-8类的基因产物的核酸分子所用的术语“异位表达”是指,不同于野生型种子植物中的表达类型。因此,本领域的熟练技术人员知道,编码AGL-8类的基因产物的核酸分子的异位表达可以指,在一种不是该核酸分子正常表达所在的细胞类型中表达,或者在不是该核酸分子正常表达所在的时间表达,或者以不是该核酸分子正常表达所具有的水平表达。在野生型拟南芥属中,例如,AGL8的表达只是限制在花发育的后期的心皮壳瓣上,而在胎座框中无表达。然而,在组成型启动子诸如5S花椰菜花叶病毒启动子的调控下,AGL8在胎座框中表达,并且以一种比在其他组织诸如在壳瓣边缘中表达水平更高的水平表达,因而这是异位表达。
对于本发明的非天然存在的种子植物产生的果实中种子熟裂的时间,本文中所用的术语“迟发性”是指,相比于没有编码AGL-8类的基因产物的核酸分子的异位表达的相应的种子植物种子正常散布的时间,种子散布的时间显著推迟了。因而,术语“迟发性”的广泛使用范围包含与相应的种子植物相比,种子散布被显著推迟了,还包括种子散布被完全阻止了,因而果实不再释放其种子,除非受到人为的或其他的干涉。
应当认识到的是,在一个种子植物的品种中种子散布的时间存在着天然的变化。然而,对本发明的非天然存在的种子植物的种子散布的“延迟”的鉴定,可以方便地通过对非天然存在的种子植物群体的抽样,并确定种子散布时间的正常分布,在平均水平上,显著地迟于相应的不含有异位表达的AGL-8类的基因产物的核酸分子的种子植物品种群体中种子散布的时间。本发明的非天然存在的种子植物提供了一种方法,分析群体的种子散布时间的正常分布的不对称性,因而种子散布在平均水平上比相应的不含有异位表达的AGL-8类的基因产物的核酸分子的种子植物品种,至少延迟了约1%,2%,5%,10%,30%,50%或100%。
种子散布的仅仅一至两天的延迟就对于提高从种子植物中成功地收获种子的产量很有价值。在canola油菜籽中,例如,熟裂正常发生于大约授粉后第8周。在非天然存在的、异位表达AGL-8类的基因产物的canola油菜籽中,熟裂可以比野生型品种推迟发生一至两天,而减少了无控制种子散布的损失,使得收获的该种子作物产量显著增加。
本发明涉及应用编码特定的“AGAMOUS类”或称“AGL”基因产物的核酸分子。AGAMOUS(AG)是花器官的特性基因,是转录因子相关家族中的一员。这些转录因子以各种组合规定了花器官的特性花瓣、萼片、雄蕊和心皮(Bowman等,发育,1121-20(1991);Weigel和Meyerowitz,细胞,78203-209(1994);Yanofsky,植物生理分子生物学年鉴,46167-188(1995))。AGAMOUS基因产物是描述心皮和雄蕊特性所不可缺少的(Bowman等,植物细胞,137-52(1989);Yanofsky等,自然,34635-39(1990)。相关基因最近被鉴定并命名为“AGAMOUS”或“AGL”基因(Ma等,基因发育,5484-495(1991);Mandel和Yanofsky,植物细胞,71763-1771(1995),在此提及可供参考)。
AGL8,如同AGAMOUS和其他的AGL基因一样,从某些特性上看,是植物MADS盒基因。植物MADS盒基因通常编码大约260个氨基酸的蛋白,其中包括约56个氨基酸的高度保守的MADS结构域(Riechmann和Meyerowitz,生物化学,3781079-1101(1997),在此提及可供参考)。MADS结构域,首先鉴定于拟南芥属的AGAMOUS基因和Antirrhimum majus的DEFICINES基因,它在人(血浆应答因子;SRF)和酵母(MCM1;Norman等,细胞,55989-1003(1988);Passmore等,分子生物学杂志,20459-606(1988))中发现的转录因子中是保守的,而且是MADS结构域蛋白中最为高度保守的区域。MADS结构域是序列特异性DNA结合活性的主要决定物,并能完成二聚作用和其它附属功能(Huang等,植物细胞,881-94(1996))。MADS结构域常常位于N末端,尽管某些蛋白在MADS结构域的N末端还含有其他附加的残基。
“间插结构域”和“I-结构域”,紧靠MADS结构域的C末端,它是具有约30个氨基酸的可变长度的弱保守结构域(Purugganan等,遗传学,140345-356(1995))。在某些蛋白中,I-结构域在DNA结合二聚体的形成过程中起作用。存在于植物MADS结构域蛋白中的第三个结构域是中度保守的70个氨基酸的区域,被称作“角蛋白类结构域”或“K-结构域”。由于它与角蛋白分子区域相类似而被命名,K-结构域的结构看来可以形成兼性螺旋并可以介导蛋白-蛋白之间的相互作用(Ma等,基因发育,5484-495(1991))。在序列上和长度上最具变化的结构域是MADS结构域蛋白的羧基端或“C-结构域”。由于在某些MADS结构域蛋白中它对于DNA结合和蛋白二聚作用不是必需的,所以C-结构域的功能尚未清楚。
拟南芥属AGL8是242个氨基酸的MADS盒蛋白(见图6;SEQID NO2;Mandel和Yanofsky,同上,1995)。AGL8 MADS结构域位于SEQ ID NO2的第2位至第56位氨基酸。AGL8的K-结构域位于SEQ ID NO2的第92位至第158位氨基酸。
在野生型拟南芥属中,AGL8 RNA在两个不同的阶段中累积,第一个阶段发生在茎和茎生叶的开花发育期,第二个阶段发生在花的发育晚期(Mandel和Yanofsky,同上,1995)。尤其是,当植物从营养期转向繁殖发育期时,AGL8 RNA即在开花分生组织中被最先检测出。随着开花茎的延伸,AGL8 RNA在开花分生组织和茎中累积。其次,虽然AGL8在花发育的最初阶段(1和2)未能检测出。但是AGL8的表达在大约第3期的花顶中心相应于第四(心皮)花轮的区域中恢复。在其他所有的原基和花梗中都没有AGL8的表达。在第四心皮轮中AGL8表达的时间通常相当于该组织的确定基因APETALA3,PISTILLATA和AGAMOUS开始表达的时间(Yanlfsky等,自然,34635-39(1990);Drews等,细胞,65991-1002(1991);Jack等,细胞,68683-697(1992);Goto和Meyerowitz,基因发育,81548-1560(1994))。在后期,AGL8的表达定位于心皮壁,位于构成子房壳瓣的区域,在几乎所有其它的心皮细胞类型中没有表达。在胚珠、眼点组织或者分隔子房的隔膜中没有检测出AGL8RNA的表达。因此,天然情况下,在花的发育晚期AGL8的表达指限制于心皮的壳瓣和花柱的细胞中。
本文所用的“AGL-8类的基因产物”是指,与拟南芥属AGL8具有相同或相似功能的基因产物,因而当它在种子植物中异位表达时,熟裂区域的正常发育被改变,种子散布被延迟。AGL-8类的基因产物可以具有,例如,将外胎座框细胞转变为壳瓣细胞的能力。拟南芥属AGL8(SEQ ID NO2)正是本文所定义的AGL-8类的基因产物的一个例子。正如在实施例I中所公开的,在串联的CaMV 35S启动子控制下,内在的启动子被复制,拟南芥属AGL8(SEQ ID NO2)的异位表达改变了熟裂区域的形成,从而导致果实完全丧失了种子散布的特性。AGL-8类的基因产物在某种程度上也可以通过它与AGL1作用的能力,以及还可以通过它与AGL5作用的能力来鉴定。
AGL-8类的基因产物通常,在某种程度上,可以通过其含有的氨基酸序列有至少约50%的氨基酸相同于拟南芥属AGL8(SEQ IDNO2)的氨基酸序列来鉴定。AGL-8类的基因产物可以具有,例如,大于65%的相同于拟南芥属AGL8(SEQ ID NO2)的氨基酸序列,优选地大于75%的相同于拟南芥属AGL8(SEQ ID NO2)的氨基酸序列,更为优选地大于85%的相同于拟南芥属AGL8(SEQ ID NO2)的氨基酸序列,以及可以具有大于90%,95%或97%的相同于拟南芥属AGL8(SEQ ID NO2)的氨基酸序列。
优选地,AGL-8类的基因产物定向进化同源于其异位表达所在的种子植物品种。编码拟南芥属AGL8(SEQ ID NO2)的核酸分子,例如,可以在拟南芥属植物中异位表达以产生非天然存在的具有迟发性种子散布特性的拟南芥属变异体。类似地,编码canola AGL8的核酸分子可以在canola植物中异位表达以产生非天然存在的具有迟发性种子散布特性的canola变异体。
编码AGL-8类的基因产物的核酸分子也可以在异源的种子植物中异位表达产生非天然存在的具有迟发性种子散布特性的种子植物。AGAMOUS-类的基因产物在整个植物王国中是广泛保守的;例如,AGAMOUS在番茄(TAG1)和玉米(ZAG1)中是保守的,这表明AGAMOUS-类的基因的定向进化同源物存在于大多数,如果不是全部的话,被子植物中(Pnueli等,植物细胞,6163-173(1994);Schmidt等,植物细胞,5729-737(1993))。AGL-8类的基因产物诸如AGL8的定向进化同源物也可以是保守的并且可以跨种作用而延迟种子散布。因此,在异源的十字花科种子植物,诸如Brassica napusL.(油菜籽),或者豆科,诸如Glycine(大豆)中编码拟南芥属AGL8(SEQ ID NO2)的核酸分子的异位表达,可以改变熟裂区域的正常发育,从而导致迟发性种子散布。而且,编码拟南芥属AGL8(SEQ IDNO2)的核酸分子,例如,可以在更为远源相关的异源种子植物,包括熟裂种子植物以及其他的双子叶和单子叶的被子植物和裸子植物中异位表达,并且由于其异位表达,它可以在异源种子植物中改变熟裂区域的正常发育并延迟种子散布。
本文所用的术语“AGL-8类的基因产物”包括,它是AGL-8类的基因产物的一个多肽部分,当其异位表达时,可改变熟裂区域的正常发育并延迟种子散布。活性片段可以是,例如,拟南芥属AGL8(SEQ ID NO2)的氨基端、中间或者羧基端片段,当其异位表达时,可改变熟裂区域的正常发育并延迟种子散布。活性片段可以包括,例如,MADS结构域,并且能够特异结合DNA。熟练的技术人员能够认识到,编码AGL-8类的基因产物的活性片段的核酸分子可以用于生产出本发明的具有迟发性种子散布特性的种子植物,并可用于本发明下文中进一步阐述的相关的方法和试剂盒中。
AGL-8类的基因产物的活性片段可以用实施例I中所述的方法或者其他的常规方法来鉴定。简单地说,将种子植物诸如拟南芥属用在组成型调控因子诸如串联的CaMV 35S启动子控制下的核酸分子转化。对该种子植物的进行表型分析,查明异位表达了特定的多肽部分得此种种子植物是否具有迟发性种子散布特性。对种子散布被延迟了的转基因植物作进一步的分析,以确定其熟裂区域的正常发育被改变。为了分析大量的AGL-8类的基因产物的多肽部分,可以将编码该多肽部分的核酸分子以库的形式分析,具有活性的库进一步细分以确定出有活性的核苷酸分子。
在一个具体实施方案中,本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性,该基因产物基本上具有AGL8定向进化同源物的氨基酸序列。本文所用的术语“AGL8定向进化同源物”是指拟南芥属的AGL8(SEQ ID NO2)的定向进化同源物,并且,在特定的种子植物品种种,是指具有与拟南芥属的AGL8(SEQ IDNO2)最高百分比同源性的AGL-8类的基因产物。AGL8定向进化同源物可以是,例如,Brassica的AGL8定向进化同源物,如Brassicanapus L.的AGL8定向进化同源物,或者Fabacea的AGL8定向进化同源物,如大豆、豌豆、扁豆、或菜豆的AGL8定向进化同源物。远期植物Sinapis alba的AGL8定向进化同源物,记作SaMADS B,已有描述(Menzel等,植物杂志,9399-408(1996),在此提及可供参考)。新的AGL8定向进化同源物的cDNA可以通过以一个核苷酸序列作为探针,利用分子生物学领域所熟知的方法,从其他的种子植物品种中分离出来(Glick和Thompson(eds.),植物分子生物学于生物技术方法,Boca Raton,FLCRC Press(1993);Sambrook等(eds.),分子克隆实验室手册(第二版),Plainview,NYCold SpringHarbor Laboratory Press(1989),在此提及可供参考)。
本文中对于AGL8定向进化同源物所用的术语“基本上具有的氨基酸序列”是指,具有相同的氨基酸序列的多肽或多肽片段,或者具有相似而不相同的、可被本领域熟练的技术人员能认为在功能上相当的氨基酸序列的多肽或多肽片段。例如,基本上具有拟南芥属AGL8定向进化同源物的氨基酸序列的AGL-8类的基因产物,可以具有图6所示的拟南芥属的AGL8序列(SEQ ID NO2)相同的氨基酸序列,或者相似而不相同的在功能上相当的序列。尤其是,基本上具有AGL8的氨基酸序列的一个氨基酸序列可以具有一个或多个修饰,诸如对所示的AGL8氨基酸序列(SEQ ID NO2)进行的氨基酸添加、缺失或者替换,前提是经修饰的多肽基本上保持了在种子植物异位表达时可改变熟裂区域的正常发育并延迟种子散布的能力。对序列基本相似性的比较可以在任何长度的两个序列间进行,通常是在大约6至1200个残基间,优选地在大约10至100个残基间,更为优选地在大约25至35个残基间的序列间进行。这种对基本相似性的比较可利用本领域常规的方法进行。
应当明白的是,一级氨基酸序列的最小修饰可以产生与其所来自的AGL8定向进化同源物相比,具有基本相当的或增强功能的AGL-8类的基因产物。而且,可以将多种分子与AGL8定向进化同源物或其活性片段相连,例如,其他多肽、抗原性或其他小肽标记、糖类、脂类、或化学半族。这种修饰包括在本文所定义的AGL8定向进化同源物范围之内。
利用例如定点诱变(见Wu(Ed.),酶学方法,Vol.217,San DiegoAcademic Press(1993);Innis等,PCR方法,San DiegoAcademic Press(1993)中的Higuchi,“重组PCR”,在此提及可供参考)。可将一个或多个点突变引入编码AGL8定向进化同源物的核酸分子中,以产生经修饰的核酸分子。此中诱变可以用于诱导特定的所需的氨基酸插入、缺失或替换;也可以合成在预定位点上具有随机核苷酸的核酸序列以产生随机的氨基酸替换。筛选诱变也可以用于产生经修饰的基本上编码AGL8定向进化同源物的氨基酸序列的核酸分子。
对于经修饰的核酸分子可以常规地测验其改变熟裂区域的正常发育并延迟种子散布的能力。在如实施例I和III中所描述的相同方式下,例如,利用组成型调控因子诸如CaMV 35S启动子或者利用熟裂区域选择调控因子诸如AGL1启动子,基本上编码AGL8定向进化同源物的氨基酸序列的核酸分子可以异位表达。如果这种异位表达导致种子植物的熟裂区域无法发育且种子散布被延迟,那么该修饰的多肽或片段就是一个本文所定义的“AGL8定向进化同源物”。
本发明的非天然存在的、具有了迟发性种子散布的特性的种子植物可以是各种种子植物中的一种,诸如熟裂种子植物或其他的双子叶和单子叶的被子植物和裸子植物。本发明中可用的种子植物可以是熟裂种子植物,尤其可用的种子植物可以是十字花科的成员,诸如油菜籽,以及豆科(Fabaceae)的成员,诸如大豆、花生、扁豆和菜豆植物。
本文所用的术语“种子植物”是指被子植物或裸子植物。被子植物是种子载于成熟的子房(果实)中的带籽植物。被子植物一般是开花植物。根据其子叶的数量被子植物分为两大类,子叶是种子的叶,通常用以储藏和吸收食物。因此,单子叶植物是具有单个子叶的被子植物,而双子叶植物是具有两个子叶的被子植物。各种已知的被子植物包括,例如,含油种子植物,豆科植物,带果植物,观赏花,谷类植物和硬木树,这些总的分类并非是完全排他性的。本领域的熟练技术人员应当认识到,本发明的方法可以根据需要应用于这些或者其他的被子植物。裸子植物是种子不包含在子房中的带籽植物。
在一个具体实施方案中,本发明提供了一种非天然存在的熟裂种子植物,它由于编码AGL-8类的基因产物的核酸分子的在该熟裂种子植物的异位表达而具有了迟发性种子散布的特性。本文所用的术语“熟裂种子植物”是指,种子植物产生干的熟裂果实,它具有可打开而从中释放所含种子的果实壁。熟裂果实一般含有多个种子,包括已知果实有例如豆荚果、蒴果和长角果。
在一个具体实施方案中,本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达而具有了迟发性种子散布的特性,其中该种子植物是十字花科的成员。十字花科,如通常所知的芸苔,有各种在世界范围内具有很大经济价值的作物(见,例如,Williams和Hill,科学,2321385-1389(1996),在此提及可供参考)。十字花科生产的种子油可以用于人造黄油,色拉油,烹调油,塑料和工业用途;调味品芥末;多叶的,储备的,加工的和盐渍的蔬菜;动物饲料以及土壤更生所需的绿色肥料。尤其有用的本发明的非天然存在的芸苔种子植物是含油种子植物canola。
有六种具有经济意义的主要芸苔品种,各种都含有一系列植物类型。Brassica napus包括诸如油籽油菜和芜菁甘蓝。Brassica oleracea是油菜作物诸如圆白菜、花椰菜、羽衣甘蓝、大头菜和芽甘蓝。Brassicacampestris(Brassica rapa)包括诸如大白菜、芜菁和白菜。Brassicajuncea包括各种芥末;Brassica nigra是黑色芥末;Brassica carinata是埃塞俄比亚芥末。熟练的技术人员知道,任何十字花科的成员都可以进行如本文所公开的修饰,以产生非天然存在的、具有迟发性种子散布的特性芸苔植物。
在第二个具体实施方案中,本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达而具有了迟发性种子散布的特性,其中该种子植物是豆科的成员。豆科,如通常所知的豌豆科,是能够产特征性的干性熟裂果实如所知的荚果的种子植物。荚果衍生自单个心皮,沿着心皮边缘的接缝并沿着中心纹路熟裂。谷物荚果包括,例如,大豆(glycine),豌豆,鹰嘴豆,蛾豆,蚕豆、菜豆、利马豆、小扁豆、豇豆、干豆和花生。饲料荚果包括紫花苜蓿、三叶苜蓿、牛角花、三叶草、Stylosanthes种、lotononis bainessii和红豆草。熟练的技术人员应当知道,任何豆科的成员都可以进行如本文所公开的修饰,以产生非天然存在的、具有迟发性种子散布的特性豆科植物。
本发明的非天然存在的、具有迟发性种子散布特性的种子植物也可以是Cuphea属植物的成员(千屈菜科)。Cuphea种子植物尤其具有价值,因为Cuphea的含油种子含有具有工业价值和营养价值的中链脂肪酸,尤其是目前只能由椰子和棕榈仁提供的月桂酸。
本发明的非天然存在的种子植物也可以是,例如,单子叶草本科植物中的一种,它可生产世界上许多种有价值的小型谷物禾谷作物。在本发明的非天然存在的小型谷物禾谷作物中,谷物仍保持在种子植物中,并且,编码AGL-8类的基因产物的核酸分子的异位表达,或者如下文所述AGL1和AGL5的表达被抑制,由此可以产生出非天然存在的、具有迟发性种子散布的特性的小型谷物禾谷植物,诸如大麦、小麦、燕麦、果园草本、guinea草本、高粱或草皮草本植物。
本发明还提供了一种转基因种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达而具有了迟发性种子散布的特性。在本发明的转基因种子植物中,异位表达的编码AGL-8类的基因产物的核酸分子可以与一个外源调节因子可操纵相连。本发明提供了,例如,一种具有迟发性种子散布特性的转基因种子植物,它具有与外源组成型调节因子可操纵相连的、异位表达的编码AGL-8类的基因产物的核酸分子。在一个具体实施方案中,本发明提供了一种由于与花椰菜花叶病毒35S启动子可操纵相连的、基本上编码AGL-8定向进化同源物的氨基酸序列的外源核酸分子的异位表达,从而具有迟发性种子散布特性的转基因种子植物。
本发明还提供了一种转基因种子植物,它由于与熟裂区域调控因子可操纵相连的、编码AGL-8类的基因产物的核酸分子的异位表达而具有了迟发性种子散布的特性。这种熟裂区域调控因子可以是,例如,AGL1调控因子或AGL5调控因子。AGL1调控因子可以来自如本文SEQ ID NO3所公开的拟南芥属的AGL1序列并且可以是,例如,5′调控序列或者内部调控序列。相似地,AGL5调控因子可以来自如本文SEQ ID NO4所公开的拟南芥属的AGL5序列并且可以是,例如,5′调控序列或者内部调控序列。
在一个具体实施方案中,本发明的转基因种子植物所具有的异位表达的基本上编码AGL-8定向进化同源物的氨基酸序列的外源核酸分子,与之可操纵相连的熟裂区域调控因子是AGL1调控因子,该调控因子具有SEQ ID NO3中第1至第2599位核苷酸;SEQ ID NO3中第2833至第4128位核苷酸;SEQ ID NO3中第4211至第4363位核苷酸;SEQ ID NO3中第4426至第4554位核苷酸;SEQ ID NO3中第4796至第4878位核苷酸;SEQ ID NO3中第4921至第5028位核苷酸;或者SEQ ID NO3中第5421至第5682位核苷酸中的至少15个连续的核苷酸。
在另一个具体实施方案中,本发明的转基因种子植物所具有的异位表达的基本上编码AGL-8定向进化同源物的氨基酸序列的外源核酸分子,与之可操纵相连的熟裂区域调控因子是AGL5调控因子,该调控因子具有SEQ ID NO4中第1至第1890位核苷酸;SEQ ID NO4中第2536至第2683位核苷酸;SEQ ID NO4中第2928至第5002位核苷酸;SEQ ID NO4中第5085至第5204位核苷酸;SEQ ID NO4中第5645至第5734位核苷酸;或者SEQ ID NO4中第6062至6138第位核苷酸中的至少15个连续的核苷酸。
本文中所用的术语“转基因的”是指,含有外源核酸分子的种子植物,该外源核酸分子可以来自同一种种子植物品种或者异源的种子植物品种。
本文中对于一个核酸分子和一个转基因种子植物所用的术语“外源的”是指,核酸分子是从该种子植物以外来源的。外源的核酸分子可以是,例如,编码AGL-8类的基因产物的核酸分子或者外源的调控因子诸如下文进一步描述的组成型调节因子或熟裂区域调控因子。外源的核酸分子可以具有天然存在的或者非天然存在的核苷酸序列,并且,可以是来自不同于被引入该核酸分子的种子植物品种的其他种子植物品种的异源核苷酸分子,或者可以是来自与被引入该核酸分子的种子植物品种相同的种子植物品种的核苷酸分子。
对于一个调控因子一个核酸分子所用的术语“可操纵相连的”是指,该调控因子能够调控可操纵相连的核酸分子的表达。因此,对于外源的调控因子诸如熟裂区域调控因子和编码AGL-8类的基因产物的核酸分子,术语“可操纵相连的”是指,该熟裂区域调控因子与编码AGL-8类的基因产物的核酸分子相连,因而该熟裂区域调控因子的表达类型能够作用于编码AGL-8类的基因产物的核酸分子。应当认识到的是,调控因子和可操纵相连的核酸分子具有,在最低程度上,所有转录所必需的因子,包括,例如,TATA盒。
本文所用的术语“组成型调控因子”是指,在其表达时,能够使可操纵相连的核酸分子独立于细胞或组织类型而以一定的水平表达的调控因子。在种子植物中表达的组成型调控因子通常可以广泛地在多种细胞和组织类型中表达。
各种可用于在转基因种子植物中异位表达的组成型调控因子是本领域所熟知的。花椰菜花叶病毒35S启动子(CaMV 35S),例如,就是一种已详细了解的组成型启动子元件,它能够在所有植物组织中产生高水平表达(Odell等,自然,313810-812(1985))。由于它在大量的不同的种子植物品种中的活性,CaMV 35S启动子尤为有用(Benfey和Chua,科学,250959-966(1990);Futterer等,植物生理,79154(1990);Odell等,同上,1985)。串联的35S启动子,其内在的启动子已被复制,与未经修饰的35S启动子相比能够产生更高的表达水平(Kay等,科学,2361299(1987))。其他的可以用于在本发明的转基因种子植物中异位表达编码AGL-8类的基因产物的核酸分子的组成型调控因子包括,例如,椰菜花叶病毒19S启动子;胭脂碱合成酶(nos)基因启动子(Siger等,植物分子生物学,14433(1990);An,植物生理学,8186(1986))。
其他的包括那些有效地用于单子叶植物中异位表达的组成型调控因子也是本领域所熟知的,例如,pEmu启动子和基于水稻Actin-1 5′区域的启动子(Last等,理论引用遗传学,81581(1991);Mcelroy等,分子普通遗传学,231150(1991);Mcelroy等,植物细胞,2163(1990))。嵌合调控因子,联合了来自不同基因的元件,也可用于编码AGL-8类的基因产物的核酸分子的异位表达(Comai等,植物分子生物学,15373(1990))。本领域熟练的技术人员应当明白,对于特定的组成型调控因子,在某种程度上,是根据编码AGL-8类的基因产物的核酸分子的异位表达所在的种子植物的品种以及所需要的表达水平来选择。
可用于本发明转基因种子植物的外源调控因子也可以是一种诱导型的调控因子,它能够使可操纵相连的核酸分子有条件地表达,当存在某种诱导剂或刺激物时,比不存在该诱导剂或刺激物时,该可操纵相连的核酸分子的表达量增加了。尤其有用的诱导型调控因子包括铜-诱导调控因子(Mett等,美国科学院研究进展,904567-4571(1993);Furst等,细胞,55705-717(1988));四环素和氯四环素诱导型调控因子(Gatz等,植物杂志,2397-404(1992);Roder等,分子普通遗传学,24332-38(1992);Gatz,细胞生物学方法,50411-424(1995));蜕皮激素诱导型调控因子(Christopherson等,美国科学院研究进展,896314-6318(1992);Kreutzweiser等,生态环境安全,2814-24(1994));热刺激诱导型调控因子(Takahashi等,植物生理,99383-390(1992);Yabe等,植物细胞生理学,351207-1219(1994);Ueda等,分子普通遗传学,250533-539(1996));和lac操纵子元件,它可联合使用一个组成型表达的lac应答子而用于,例如,IPTG诱导的表达。(Wilde等,EMBO杂志,111251-1259(1992))。
可用于本发明转基因种子植物的诱导型调控因子也可以是,例如,来自菠菜硝酸盐还原酶基因的硝酸盐诱导型启动子(Back等,植物分子生物学,179(1991))或者光诱导型启动子,诸如,与RuBP羧基化酶小亚基或者LHCP基因家族相关的启动子(Feinbaum等,分子普通遗传学,226449(1991);Lam和Chua,科学248471(1990))。其他的诱导型调控因子包括水杨酸诱导型调控因子(Uknes等,植物细胞,5159-169(1993);Bi等,植物杂志,8235-245(1995));植物激素诱导型调控因子(Yamaguchi-Shinozaki等,植物分子生物学,15905(1990);Kares等,植物分子生物学,15225(1990));人激素诱导型调控因子诸如人糖皮质激素应答因子(Schena等,美国科学院研究进展,8810421(1991))。
应当认识到的是,本发明的非天然存在的、含有异位表达的编码AGL-8类的基因产物的核酸分子的种子植物,也可以含有能够调节种子散布迟发性的一种或多种其他的修饰,包括天然的或者非天然的修饰。例如,植物激素乙烯可以促使果实熟裂,可以在本发明的种子植物中引入乙烯应答的正向或负向调控子从而获得经修饰的表达或活性(见,一般性的,Meakin和Roberts,实验植物学,411003-1011(1990);Ecker,科学268667-675(1995);Chao等,细胞,891133-1144(1997))。
乙烯应答的正向调控子的突变表现出对外源乙烯应答性的降低或丧失。拟南芥属乙烯应答的正向调控子的突变包括在etr的突变,它使组氨酸激酶乙烯应答受体失活(Bleeker等,科学,2411086-1089(1988);Schaller和Bleeker,科学,2701809-1811(1995));ers(Hua等,科学2691712-1714(1995));ein2(Guzman和Ecker,植物细胞,2513(1990));ein3(Rothenberg和Echker,Sem发育生物学植物发育遗传学,43-13(1993);Kieber和Echker,遗传学趋势,9356-362(1993));ain1(van der Straeten等,植物生理学,102401-408(1993));eti(Harpham等,植物学年鉴6855(1991)和ein4,ein5,ein6,和ein7(Roman等,遗传学,1391393-1409(1995))。类似的遗传学功能在其他的种子植物品种中也有发现;例如,相应于etr的never-ripe突变使得在番茄中产生乙烯的不敏感性(Lanahan等,植物细胞,6521-530(1994);Wilkinson等,科学,2701807-1809(1995))。本发明的种子植物可以引入一个能够导致任何此类乙烯应答正向调控子的表达发生改变的修饰。可以将正向调控子引入本发明的种子植物,调节该种子植物的种子散布的迟发性,例如,进一步地推迟种子散布的迟发性。
乙烯应答的负向调控子的突变在没有外源乙烯时表现出乙烯应答性。这些突变包括那些与乙烯过量生产相关的,例如,eto1,eto2,和eto3突变体,和那些与乙烯信号途径的组成型活化作用相关的,例如,CTR1的突变,它是具有蛋白激酶Raf家族相似序列的负向调控子(Kieber等,细胞,72427-441(1993),在此提及可供参考)。本发明的种子植物可以包括一个能够导致任何此类乙烯应答负向调控子的表达或活性发生改变的修饰。可以将能够导致在不存在外源乙烯时具有乙烯应答性的突变引入本发明的非天然存在的种子植物,从而可以调节,例如减小,种子散布的迟发性。
还可以将果实的形态突变引入本发明的种子植物。此类突变包括那些心皮特定基因诸如AGAMOUS(Bowman等,同上,1989;Yanofsky等,同上,1990)和正常果实发育所需的基因诸如ETTIN,CRABS CLAW,SPAULA,AGL8和TOUSLED(Sessions等,发育,1211519-1532(1995)Alvarez和Smyth,开花通讯,2312-17(1997);和Roe等,细胞,75939-950(1993))。因此,应当明白的是,本发明的具有异位表达编码AGL-8类的基因产物的核酸分子的种子植物,可以引入能够减小或增强种子散布迟发性的一个或多个其他的遗传学修饰。
本发明还提供了产生非天然存在的、具有迟发性种子散布特性的种子植物的方法。本发明的方法要求在种子植物中异位表达编码AGL-8类的基因产物的核酸分子,由于该核酸分子的异位表达,种子散布被延迟了。
如上所述,术语“异位地”是指,编码AGL-8类的基因产物的核酸分子在一种细胞类型中表达,而此细胞类型不是该核酸分子正常表达所在的细胞类型,在一个时间上表达,而此时间不是该核酸分子正常表达所处的时间,或者以一种表达水平表达,而此表达水平不是该核酸分子正常表达水平。例如在野生型拟南芥属中,AGL8的表达限制在花发育的后期的心皮壳瓣上,而在胎座框中无表达。在本发明的方法中,尤为有用的编码AGL-8类的基因产物的核酸分子的异位表达所涉及是在作为熟裂区域起源的外胎座框细胞中的表达。
实际上编码AGL-8类的基因产物的核酸分子的异位表达基于多种因素。异位表达可以是贯穿大多数或整个植物组织的广范围的表达,或者可以是限制在一小部分植物组织表达,它可以通过各种常规技术来完成。诱变,包括种子或花粉诱变可以用于产生非天然存在的、编码AGL-8类的基因产物的核酸分子被异位表达的种子植物。乙基甲磺酸(EMS)诱变,转座子介导的诱变或者T-DNA介导的诱变也可以用于异位表达编码AGL-8类的基因产物的核酸分子,以产生具有迟发性种子散布特性的种子植物(见,一般性地,Glick和Thompson,同上,1993)。由于不希望束缚于任何一种特定的机制,可以将一种或多种AGL8的负向调控子失活而获得在诱变植物中的异位表达,例如,将AGL1和AGL5联合失活。
AGL-8类的基因产物的异位表达还可以通过在异源调控因子或者经修饰的它本身的启动子的变异体控制下表达编码AGL-8类的基因产物的核酸分子而完成。异源调控因子包括组成型调控因子,它可以使AGL-8类的基因产物在外胎座框以及在各种其他细胞类型中表达,还包括熟裂区域选择性调控因子,它可以在限定的一些细胞类型中包括壳瓣边缘或熟裂区域中获得AGL-8类的基因产物的选择性表达。
AGL-8类的基因产物的异位表达可以通过利用内源的或者外源的编码AGL-8类的基因产物的核酸分子来完成。重组内源性核酸分子可以含有异源的调控因子与编码AGL-8类的基因产物的核酸分子可操纵相连的异源的调控因子。产生所需的在一个异源的调控因子控制下的重组核酸分子,从而产生本发明的非天然存在的种子植物的方法是本领域所熟知的(见,一般性地,Sambrook等,同时,1989;Glick和Thompson,同上,1993)。
可以利用多种转化方法包括农杆菌介导的转化以及直接基因转入法如电转导和显微注射介导的转化,将外源性的核酸分子引入种子植物以获得异位表达(见,一般性地,Wang等(eds),植物和土壤微生物的转化,Cambridge,UKUniversity Press(1995),在此提及可供参考)。基于土壤细菌根癌农杆菌的转化方法对于将外源核酸分子引入种子植物尤为有用。野生型的农杆菌含有Ti(肿瘤诱发)质粒,它可导致发生宿主植物的根瘤生长。在植物基因组中转入Ti质粒的肿瘤诱发T-DNA区域需要Ti质粒编码的毒性基因以及T-DNA边缘区,它是一组指导性的DNA重复序列用以表明转移的区域。农杆菌基础的载体是一种Ti质粒修饰形式,其中的肿瘤诱发功能区被需要引入植物宿主中去的核酸序列所替代。
农杆菌介导的转化通常使用共合体载体或者,优选地,双载体系统,其中的Ti质粒的成分被分开置于辅助质粒和穿梭质粒上,前者永久存在于宿主中并携带着毒性基因,后者含有两侧以T-DNA为边缘区的所需的基因。各种双在体系统是本领域所熟知的,并可以,例如,从Clontech(Palo Alto,CA)商业购得。利用培养的植物细胞或者受伤组织诸如叶组织、根的外植体、下胚轴、干的小片或块茎来培养农杆菌的方法,也是本领域所熟知的(Glick和Thompson,同上,1993)。受农杆菌感染的植物组织上的损伤细胞在适当的条件下培养可以重新发育出器官;得到的转基因芽条最终长出异位表达编码AGL-8类的基因产物的核酸分子的转基因植物。农杆菌还可以用于整个种子植物的转化,(见Bechtold等,C.R.Acad.Sci.Paris,LifeSci.3161194-1199(1993),在此提及可供参考)。农杆菌介导的转化可以用于产生各种转基因种子植物(Wang等,同上,1995)包括十字花科家族的转基因植物,诸如油菜籽,Arbidopsis,芥末、亚麻、以及豆科家族的转基因植物,诸如大豆、豌豆、扁豆和菜豆。
显微注射介导的转化也可以用以产生异位表达AGL-8类的基因产物的转基因种子植物。此方法最早由Klein等描述(自然,32770-73(1987),在此提及可供参考),它是基于显微注射包被了经氯化钙、亚精胺或PEG沉淀的所需的核酸分子的金或者钨。利用仪器诸如BIOLISTIC PD-1000(Biorad;Hercules CA)将显微注射颗粒高速加速射入被子植物的组织中。
显微注射介导的转运或“颗粒轰击”尤其适合于转化那些用其他方法难于转化或再生的种子植物。显微注射介导已经用来产生了多种转基因植物品种,例如,包括棉花、土豆、玉米、杂交白杨和番木瓜(见,Glick和Thompson,同上,1993),以及谷类作物诸如小麦、燕麦、大麦、高粱和水稻(Duan等,自然生物技术,14494-498(1996);Shimamoto,生物技术现代评论,5158-162(1994),在此提及可供参考)。从上述可以看出,熟练的技术人员应能认识到,农杆菌介导的或者显微注射介导的转化,如本文所公开的,或者其他的本领域所熟知的方法都可以用于将编码AGL-8类的基因产物的核酸分子引入种子植物以异位表达。
在另一个具体实施方案中,本发明提供了一种非天然存在的种子植物,它由于该种子植物中AGL1的表达和AGL5的表达的抑制而具有迟发性种子散布的特性。这种非天然存在的、具有了迟发性种子散布的特性的种子植物可以是,例如,agl1 agl5双突变体。
正如本文所公开的,通过联合利用同源重组合插入性T-DNA的插入(见实施例II)产生了AGL1和AGL5基因的功能丧失突变。在得到的,agl1 agl5双突变体中AGL1和AGL5的RNA都不表达,而且扫描电子图表明突变体种子植物中熟裂区域无法正常发育。而且,成熟的果实无法进行熟裂,如图5所示。这些结果表明AGL1和AGL5基因的表达对于熟裂区域的正常发育是必须的,而在种子植物中AGL1的表达和AGL5的表达的联合抑制可以延迟熟裂,使得果荚散落的过程受到控制。
拟南芥属的AGL1和AGL5基因编码的MADS盒蛋白在氨基酸水平具有85%的相同性(将表1和2)。AGL1和AGL5的RNA表达类型也具有惊人的相似性。尤其是,两种RNA都在花中特异表达,他们都聚积在发育的心皮中。尤其是,在沿着壳瓣/胎座框边界的外胎座框中观察到这些基因的强烈表达(Ma等,同上,1991Savidge等,植物细胞,7721-723(1995);Flanagan等,植物杂志,10343-353(1996),在此提及可供参考)。因此,AGL1和AGL5在壳瓣边缘,至少在外胎座框的细胞中表达。
表2AGAMOUS,AGL1和AGL5的I-结构域和C-结构域中的氨基酸相同性AGAMOUSAGL1AGL5ICICICAGAMOUS------------AGL171%39%--------AGL565%37%95%72%----
本文所用的术语“AGL1”是指,拟南芥属的AGL1(SEQ ID NO6)或者拟南芥属的AGL1(SEQ ID NO6)的定向进化同源物。AGL1的定向进化同源物是,至少在某种程度上,在种子植物壳瓣边缘表达的MADS盒基因,并且具有与拟南芥属的AGL1(SEQ ID NO6)的氨基酸序列的同源性。AGL1和AGL1的定向进化同源物可以,在某种程度上,通过与AGL-8类的基因产物形成复合物而具有功能。AGL1的定向进化同源物通常所具有的氨基酸序列具有与拟南芥属AGL1(SEQ ID NO6)至少63%的氨基酸相同性,并且,所含有的多肽具有与AGL1(SEQ ID NO6)大于约70%,75%,85%,或90%的氨基酸相同性。考虑到AGL1和AGL5产物的高度相关性,本领域的熟练技术人员应能认识到,根据它与拟南芥属的AGL1(SEQ IDNO6)的相关性比它与拟南芥属的AGL5(SEQ ID NO8)的相关性更为接近,AGL1的定向进化同源物可以与AGL5的定向进化同源物相区别开。AGL1的定向进化同源物在野生型植物中可以具有像拟南芥属AGL1一样的功能,将AGL-8类的基因产物的表达区域限制在花发育的后期的心皮壳瓣上。
本文所用的术语“AGL5”是指,拟南芥属的AGL5(SEQ ID NO8)或者拟南芥属的AGL5(SEQ ID NO8)的定向进化同源物。AGL5的定向进化同源物是,至少在某种程度上,在种子植物壳瓣边缘表达的MADS盒基因,并且具有与拟南芥属的AGL5(SEQ ID NO8)的氨基酸的同源性。AGL5和AGL5的定向进化同源物可以,在某种程度上,通过与AGL-8类的基因产物形成复合物而具有功能。AGL5的定向进化同源物通常所具有的氨基酸序列具有与拟南芥属AGL5(SEQ ID NO8)至少60%的氨基酸相同性,并且,所含有的多肽具有与AGL5(SEQ ID NO8)大于约65%,70%,75%,85%,或95%的氨基酸相同性。考虑到AGL1和AGL5基因产物的高度相关性,本领域的熟练技术人员应能认识到,根据它与拟南芥属的AGL5(SEQID NO8)的相关性比它与拟南芥属的AGL1(SEQ ID NO6)的相关性更为接近,AGL5的定向进化同源物可以与AGL1的定向进化同源物相区别开。AGL1的定向进化同源物在野生型子物中可以具有像拟南芥属AGL5一样的功能,将AGL-8类的基因产物的表达区域限制在花发育的后期的心皮壳瓣上。
本文对于AGL1的表达所用的术语“被抑制”是指,与相应的野生型种子植物中的功能性AGL1蛋白相比,种子植物中的功能性AGL1蛋白数量被降低了。类似地,对于AGL5的表达所用的术语“被抑制”是指,与相应的野生型种子植物中的功能性AGL5蛋白相比,种子植物中的功能性AGL5蛋白数量被降低了。因此,本文所用的术语“被抑制”包括种子植物中不存在AGL1和AGL5蛋白,以及存在蛋白表达但是与在野生型种子植物中的AGL1和AGL5蛋白的表达水平相比被降低了。而且,所用的术语“被抑制”是指AGL1或AGL5的蛋白表达在整个AGL1或AGL5的蛋白表达区域被降低了,或者是指在某些AGL1或AGL5的蛋白表达区域被降低了,前提是得到的种子植物具有迟发性种子散布的特性。
本文所用的术语“被抑制”还包括AGL1和AGL5蛋白量相当于野生型AGL5和AGL5的表达量,但是AGL1和AGL5蛋白具有的活性被降低了。如上所述,AGL1和AGL5都含有保守的MADS结构域;在MADS结构域中,降低AGL1和AGL5的DNA结合活性的点突变和严重的缺失,可以降低或破坏AGL1和AGL5的活性,从而,如本文所定义的,“抑制”了AGL1和AGL5表达。本领域的熟练技术人员应能认识到,优选地,在种子植物的壳瓣边缘AGL1基本上没有表达或者AGL1基本上是非功能性的,相类似地,优选地,在种子植物的壳瓣边缘AGL5基本上没有表达或者AGL1基本上是非功能性的。
多种方法可以用于抑制种子植物中AGL1和AGL5的表达。抑制可以通过直接修饰AGL1和AGL5的基因组位点来进行,例如,通过修饰AGL1和AGL5的调控序列从而降低AGL1和AGL5位点的转录和翻译,或者通过修饰AGL1和AGL5的编码序列从而产生非功能性的AGL1和AGL5蛋白。种子植物中AGL1和AGL5表达的抑制可以直接完成,例如,通过修饰能够调节AGL1和AGL5表达的蛋白的表达或活性。由于增强抑制种子植物中AGL1和AGL5表达的方法包括,例如,同源重组、化学和转座子介导的诱变、共抑制和反义技术以及显性失活方法。
可以利用AGL1和AGL5的同源重组来抑制种子植物中AGL1和AGL5的表达(Kempin等,自然,389802-803(基因组序列1997),在此提及可供参考)。利用同源重组可以,例如,用两侧至少1kb的AGL5序列的卡那霉素抗性基因的一个结构来替换野生型的AGL5基因组序列。同源重组抑制AGL5的表达的应用在实施例II中有所描述。
也可以利用Ds转座子或Stm转座子进行转座子介导的插入诱变,通过产生功能丧失的突变体来完成对AGL1和AGL5表达的抑制(见,例如,Sundaresan等,基因发育,91797-1810(1995),在此提及可供参考)。转座子在AGL1和AGL5靶基因中的插入可以通过例如限制性图谱来确定,可以确定出该基因的启动子或编码区域中插入的存在,从而功能性基因的表达被抑制。转座子的插入可以通过检测壳瓣边缘中靶基因mRNA的消失或基因产物的消失来确定。也可以利用T-DNA介导的插入诱变,通过产生功能丧失的突变体来完成对AGL1和AGL5表达的抑制(见,Krysan等,美国科学院研究进展,938145-8150(1996))。应用T-DNA介导的插入诱变来抑制AGL1的表达在实施例II中有所描述。
也可以利用共抑制来完成对种子植物中AGL1和AGL5表达的抑制,这是一种周知的方法,它是通过一个核酸分子在有义方向上的表达而产生被诱导的核酸分子和同源的内源基因协同抑制(见,例如,Flavell,美国科学院研究进展,913490-3496(1994);Kooter和Mol,现代生物学评论,4166-171(1993),在此提及可供参考)。共抑制可以通过大量的转基因拷贝或者过表达的转基因RNA而被强烈地诱导,并可以由于转基因的修饰而无法翻译得到增强。
还可以利用编码AGL1和AGL5基因产物或其片段的反义核酸分子来抑制对种子植物中AGL1和AGL5的表达。反义核酸分子降低mRNA的翻译或者增加mRNA的降解,从而抑制基因表达(见,例如,Kooter和Mol,同上,1993;Pnueli等,植物细胞,6175-186(1994),在此提及可供参考)。
为了产生本发明的非天然存在的、AGL1和AGL5的表达都被抑制的种子植物,可以在一个,至少某种程度上在种子植物的壳瓣边缘中表达的,强调控因子的控制下,表达一种或多种有义或反义核酸分子。例如,组成型CaMV 35S启动子(Odell等,同上,1985)或其他的组成型启动子可以用于本发明的此种方法。熟裂区域选择性启动子也可用于表达一种或多种有义或反义核酸分子以抑制种子植物的AGL1和AGL5的表达。
本领域的熟练技术人员应能认识到,内源性AGL1和AGL5表达的有效抑制是基于一种或多种被诱导的核酸分子与相应的内源性基因位点具有高度百分比的同源性。本文提供了编码拟南芥属的AGL1(SEQ ID NO5)和AGL5(SEQ ID NO7)的核酸分子(也见,Ma等,同上,1991)。编码拟南芥属的AGL1和AGL5的核酸分子可以用于本发明的方法或者用于分离定向进化同源的AGL1和AGL5序列。
利用同源重组、共抑制或反义方法产生有效抑制所要求的同源性可以根据经验确定。通常,有效抑制AGL1和AGL5的表达要求最少大约80-90%的核酸序列相同性。因此,来自被引入核酸分子的种子植物品种的同科或同属的编码基因定向进化同源物的核酸分子,可以优选地用于通过同源重组、共抑制或反义技术产生本发明的非天然存在的种子植物。更为优选地,可将来自同种种子植物品种的编码基因定向进化同源物的核酸分子用于在本发明的种子植物中抑制AGL1和AGL5的表达。例如,编码canola AGL1和AGL5的核酸分子可优选地用于抑制canola植物中AGL1和AGL5的表达。
尽管本发明的方法中优选地利用高度同源的核酸分子,但是用于同源重组、共抑制或反义抑制的核酸分子不需要全部地含有要被抑制的AGL1和AGL5序列。因此,只编码部分的拟南芥属的AGL1(SEQID NO5)的有义或反义核酸分子,例如,或者只编码部分的拟南芥属的AGL5(SEQ ID NO7)的有义或反义核酸分子,就可以用于产生本发明的非天然存在的、的表达都被抑制的种子植物。
与AGL1和AGL5位点同源重组的部分核酸分子通常含有至少大约1kb的与靶基因同源的序列,优选地含有至少大约2kb,更为优选地含有至少大约3kb和含有至少大约5kb的与靶基因同源的序列。可用于共抑制或反义抑制的编码AGL1和AGL5的部分核酸分子通常含有编码AGL1和AGL5定向进化同源物的核酸分子全长的至少大约50个碱基对。与本文所定义的活性片段相反,用于同源重组、共抑制或反义抑制的部分核酸分子不需要编码基因产物的功能性部分。
还可以利用显性失活结构来抑制种子植物中AGL1和AGL5的表达。可用于本发明的显性失活结构通常含有完整的AGL1和AGL5的编码序列部分,它足以形成,例如,DNA结合或蛋白质-蛋白质相互作用,诸如同源二聚化或者异源二聚化的蛋白质-蛋白质相互作用,但是不含有野生型蛋白的转录活性。例如,将AGAMOUS羧基端缺失突变体用作显性失活结构来抑制MADS盒基因AGAMOUS的表达(Mizukami等,植物细胞,8831-844(1996),在此提及可供参考)。本领域的熟练技术人员应当知道是,相类似地,显性失活AGL1和AGL5结构也可以用于抑制种子植物中AGL1和AGL5的表达。可使用的显性失活结构可以是缺失突变,它编码,例如,单独的MADS盒结构域(“M”);MADS盒结构域和“插入”区域(“MI”);MADS盒、“插入”区域和“K”结构域(“MIK”);或者“插入”“K”和羧基端结构域(“IKC”)。
在一个优选的具体实施方案中,本发明的非天然存在的种子植物是agl1 agl5双突变体。agl1 agl5双突变体是一种尤其有用的非天然存在的、具有迟发性种子散布特性的种子植物。
本文所用的术语“agl1 agl5双突变体”是指,具有在AGL1位点的功能丧失型突变而且在AGL5位点的功能丧失型突变的种子植物。功能丧失型突变包括点突变,包括替换、缺失和插入,以及在AGL1和AGL5位点上严重的修饰,它可以发生在编码或者非编码序列上。本领域的熟练技术人员应当知道是,任何这种在AGL1位点上的功能丧失型突变与任何这种在AGL5位点上的功能丧失型突变相结合,可以产生本发明的agl1 agl5双突变体。实例性的芸苔种子植物拟南芥属的agl1 agl5双突变体产物公开在实施例II中。
AGL1和AGL5是密切相关的最近才区分开的基因。由于不希望被其他所束缚,所以某些植物可抑制含有AGL1或只含有AGL5,或只含有单个的与AGL1和AGL5相关的祖先基因。在这种植物中,具有迟发性种子散布特性的种子植物可以通过只抑制AGL1表达,或者只抑制AGL5表达,或者只抑制与AGL1和AGL5相关的祖先基因表达来产生。因此,本发明提供了一种非天然存在的、具有迟发性种子散布特性的种子植物,其中AGL1表达被抑制了。这种非天然存在的、具有迟发性种子散布特性的种子植物可以是,例如,agl1单突变体。本发明还提供了一种非天然存在的、具有迟发性种子散布特性的种子植物,其中AGL5表达被抑制了。这种非天然存在的、具有迟发性种子散布特性的种子植物可以是,例如,agl5单突变体。
本发明进而还提供了来自本发明的非天然存在的种子植物的组织。在一个具体实施方案中,本发明进提供了来自本发明的非天然存在的、异位表达编码AGL-8类的基因产物的核酸分子并且具有迟发性种子散布特性的种子植物的组织。在另一个具体实施方案中,本发明进提供了来自本发明的非天然存在的、AGL1和AGL5的表达都被抑制且具有迟发性种子散布特性的种子植物的组织。
本文所用的术语“组织”是指,组成在一个结构和功能单位中的种子植物的细胞和细胞间的材料的集合。本发明的尤为有用的组织是能够无性地或者非无性地繁殖的组织,因而该组织所来源的种子植物可以被繁殖。本发明的组织可以是,例如,种子、叶、根、或其部分。
本文所用的术语“种子”是指,种子植物的胚珠经受精后发育成熟所形成的结构。这种种子可以方便地从本发明的非天然存在的、具有迟发性种子散布特性的种子植物中收获得到。
具有增强性的种子散布特性的种子植物也可以通过操作AGL-8类的基因产物或者AGL1和AGL5的表达而产生。在种子植物中抑制AGL-8类的基因产物的表达,例如,抑制AGL-8类的基因产物在壳瓣组织的表达,可以用于产生具有增强性的种子散布特性的种子植物。在种子植物中AGL1或AGL5,或者两者同时的异位表达,例如,AGL1或AGL5的早熟表达,也可以用于产生具有增强性的种子散布特性的种子植物。熟练的技术人员清楚的是,这些或者其他操作AGL8、AGL1或AGL5的表达策略用于产生非天然存在的、具有增强性的种子散布特性的种子植物。
本发明还提供了一种基本纯化的熟裂区域选择性调控因子,包括能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的核苷酸序列,即便该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703个核苷酸所构成的核苷酸序列。
本文所用的术语“熟裂区域选择性调控因子”是指,一个核酸序列,当它与一个核酸分子可操纵相连时,能使与其可操纵相连的核酸分子在限定的植物组织中,包括壳瓣边缘或熟裂区域,选择性地表达。如上所述,壳瓣边缘是熟裂区域的未来位置,包括外胎座框的边缘以及与外胎座框相邻的壳瓣细胞。在壳瓣边缘区域中发育的熟裂区域是指,在熟裂过程中分离开的一组细胞,它使得壳瓣与胎座框分开并释放出内含的种子。因此,熟裂区域选择性调控因子,如本文中所定义的,能够在成熟的熟裂区域中发生选择性表达,或者在作为熟裂区域的未来位置的壳瓣边缘中发生选择性表达。
熟裂区域选择性调控因子能够仅仅在壳瓣边缘或熟裂区域的细胞中产生特异的表达,或者能够只在有限数量的植物细胞类型中包括壳瓣边缘或熟裂区域的细胞中产生选择性地表达。AGL5调控因子,例如,能够在胚珠和胎座以及熟裂区域中产生选择性表达,它就是本文所定义的一种熟裂区域选择性调控因子。熟裂区域选择性调控因子与其他调控因子的区别在于,它能够在壳瓣边缘或熟裂区域产生选择性表达而不能够在整个相邻的心皮壳瓣中产生表达。
图7显示了拟南芥属AGL1基因(SEQ ID NO3),标出了内含子-外显子边界。图8显示了拟南芥属AGL5基因(SEQ ID NO4),标出了内含子-外显子边界。AGL1和AGL5调控因子,诸如5调控因子或内部调控因子,能够在壳瓣边缘或熟裂区域产生选择性表达,因而它们是本文所定义的熟裂区域选择性调控因子。AGL5基因,例如,在熟裂区域、胎座和胚珠中选择性地表达,而AGL5调控因子能够使可操纵相连的核酸分子在熟裂区域、胎座和胚珠中选择性地表达。
本发明提供了作为AGL1和AGL5调控因子的熟裂区域选择性调控因子。这种熟裂区域选择性调控因子可以是,例如,AGL1调控因子。AGL1调控因子可以具有,例如,SEQ ID NO3所列的拟南芥属AGL1基因组序列。熟裂区域选择性调控因子也可以是,例如,AGL5调控因子。AGL5调控因子可以具有,例如,SEQ ID NO4所列的拟南芥属AGL5基因组序列,只要该选择性调控因子不具有SEQ ID NO4中的第1889至2703个核苷酸所构成的核苷酸序列。
本文所用的术语“基本上具有的核苷酸序列”,当用于AGL1和AGL5调控因子时是指,具有相同序列的核苷酸序列,或者具有相似但不相同的序列、可被本领域熟练技术人员认为是功能上相当的序列的核苷酸序列。例如,是AGL1调控因子的熟裂区域选择性调控因子可以具有,例如,与具有图7所示SEQ ID NO3中的第1至2599个核苷酸的拟南芥属AGL1序列相同的核苷酸序列,或者相似但不相同的、功能上相当的序列。熟裂区域选择性调控因子可以具有,例如,一个或多个修饰,诸如在图8所示序列上涉及的核苷酸添加、缺失或置换,前提是经修饰的核苷酸序列保持了能够使可操纵相连的核酸分子在壳瓣边缘或熟裂区域产生选择性表达的能力。
应当明白的是,可以不破坏AGL1和AGL5调控因子的生物功能而进行限定的修饰,这种限定的修饰可以获得与野生型AGL1和AGL5调控因子相比,具有基本上相当的或者增强功能的熟裂区域选择性调控因子。这些修饰可以通过例如定点诱变而有意制造,或者通过例如含有该调控因子的宿主的突变而随机产生。所有这些经修饰的核苷酸序列都包括在对熟裂区域选择性调控因子的定义中,只要它们能够在壳瓣边缘或熟裂区域产生选择性表达的能力被基本保持了。
熟裂区域选择性调控因子可以来自拟南芥属AGL1或AGL5的定向进化同源物的基因,该基因在种子植物的壳瓣边缘或熟裂区域选择性表达。熟裂区域选择性调控因子可以来自十字花科AGL1或AGL5的定向进化同源物,如Brassica napus、Brassica oleracea、Brassicacampestris、Brassica juncea、Brassica nigra、Brassica carinata的AGL1或AGL5的定向进化同源物。熟裂区域选择性调控因子可以来自,例如,canola的AGL1或AGL5的定向进化同源物。熟裂区域选择性调控因子可以来自,例如,豆科的AGL1或AGL5的定向进化同源物,诸如大豆、豌豆、鹰嘴豆、蛾豆,蚕豆、菜豆、利马豆、小扁豆、豇豆、干豆、花生、紫花苜蓿、三叶苜蓿、牛角花、三叶草、Stylosanthes、lotononis bainessii或红豆草的AGL1或AGL5的定向进化同源物。
熟裂区域选择性调控因子可以来自各种其他的能够在种子植物的壳瓣边缘或熟裂区域选择性表达的基因。例如,油菜籽基因RDPG1可以在熟裂区域选择性表达的基因(Petersen等,植物分子生物学,31517-527(1996),在此提及可供参考)。因此RDPG1的启动子或其或性片段可以是本文所定义的熟裂区域选择性调控因子。其他的基因如油菜籽SAC51也已知是在熟裂区域选择性表达的;SAC51的启动子或其或性片段也可以是本发明的熟裂区域选择性调控因子(Coupe等,植物分子生物学,231223-1232(1993),在此提及可供参考)。而且,在熟裂区域选择性表达的基因还包括能够在拟南芥属转座子品系GT140中产生选择性GUS表达的基因(Sundaresan等,基因发育,91797-1810),在此提及可供参考)。熟练的技术人员能够明白的是,任何此类在壳瓣边缘或熟裂区域选择性表达的基因的调控因子都可以是本发明所定义的熟裂区域选择性调控因子。
其他的熟裂区域选择性调控因子可以利用常规的方法确定和分离。例如,利用来自熟裂区域的RNA和来自相邻的果荚材料中的RNA而进行的差异扫描法,可以用于分离在熟裂区域的细胞中选择性表达的cDNA(Coupe等,同上,1993);然后,用该cDNA作为探针分离出相应的基因。
增强子陷阱或基因陷阱也可以用于确定和分离本发明的熟裂区域选择性调控因子(Sundaresan等,同上,1995;Koncz等,美国科学院研究进展,868467-8471(1989);Kertbundit等,美国科学院研究进展,885212-5216(1991);Toppin等,发育,1121009-1019(1991),在此提及可供参考)。增强子陷阱的元件包括一个带有弱启动子的报告基因如GUS,由于增强子陷阱的元件缺少启动子序列,依靠附近的染色体基因的转录来进行报告基因的表达。转座因子包括在诱导与内源位点融合的结构中;在壳瓣边缘或熟裂区域选择性表达的结构通过它们的表达类型而确定。以插入因子为标签,利用反向聚合酶链反应将侧旁的熟裂区域选择性调控因子克隆(见,例如,Aarts等,自然,363715-717(1993);还可见,Ochman等,“利用反向对侧旁序列的扩增”在Innis等,同上,1990)。Ac/Ds转座系统(Sundaresan等,同上,1995)在鉴定和分离本发明的熟裂区域选择性调控因子上尤为有用。
熟裂区域选择性调控因子的分离还可以通过,在无启动子的报告基因前插入随机基因组DNA片段的文库,并对用该文库转化的转基因种子植物扫描,确定熟裂区域选择性报告基因的表达。无启动子载体pROA97,含有都在最小35S启动子控制下的npt基因盒GUS基因,它可以用于此种扫描。基因组文库可以是,例如,来自Arabidopsisthliana基因组DNA的Sau3A片段,或者来自其他感兴趣的十字花科的基因组DNA的Sau3A片段(Ott等,分子Gen.遗传学,223169-179(1990);Claes等,植物杂志,115-26(1991),在此提及可供参考)。
本发明的调控因子在熟裂区域选择性的表达可以通过常规的方法来显示和确定,例如,利用报告基因和原位表达分析。GUS和萤火虫的莹光素酶报告子尤其有用于植物基因表达的原位定位(Jefferson等,EMBO,63901(1987);Ow等,科学,334856(1986)在此提及可供参考),含有GUS表达盒的无启动子载体可以商业购得,例如,从Clontech公司(PaloAlto,CA)为了鉴定所研究的熟裂区域选择性调控因子如AGL1和AGL5调控因子,可以利用酶学或PCR的方法产生一个或多个AGL1和AGL5基因核苷酸部分(Glick和Thompson,同上,1993;Innis等,同上,1990);将得到的片段与一个报告基因如GUS融合,进行上述的分析。
本发明提供了一种基本纯化的熟裂区域选择性调控因子,它能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达,其中该因子是具有下列核苷酸序列中至少15个连续的核苷酸的AGL1调控因子SEQ ID NO3中第1至第2599位核苷酸;SEQID NO3中第2833至第4128位核苷酸;SEQ ID NO3中第4211至第4363位核苷酸;SEQ ID NO3中第4426至第4554位核苷酸;SEQID NO3中第4655至第4753位核苷酸;SEQ ID NO3中第4796至第4878位核苷酸;或者SEQ ID NO3中第4921至第5028位核苷酸;基本纯化的熟裂区域选择性调控因子是可具有,例如,上述SEQ IDNO3中各部分之一中的至少16,18,20,25,30,40,50,100或500个连续的核苷酸的AGL1调控因子。
本发明还提供了一种基本纯化的熟裂区域选择性调控因子,它能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达,其中该因子是具有下列核苷酸序列中至少15个连续的核苷酸的AGL5调控因子SEQ ID NO4中第1至第1888位核苷酸;SEQ ID NO4中第2928至第5002位核苷酸;SEQ ID NO4中第5085至第5204位核苷酸;SEQ ID NO4中第5367至第5453位核苷酸;SEQ ID NO4中第5496至第5602位核苷酸;SEQ ID NO4中第5645至第5734位核苷酸;或者SEQ ID NO4中第6062至第6138位核苷酸基本纯化的熟裂区域选择性调控因子是可具有,例如,上述SEQ IDNO4中各部分之一中的至少16,18,20,25,30,40,50,100或500个连续的核苷酸的AGL5调控因子。
拟南芥属AGL5启动子的临近片段已有描述(Savdge等,植物细胞,7721-733(1995))。但是,该片段(如图8中第1889至2703个核苷酸所示)缺少许多本文所公开的拟南芥属AGL5基因组序列(SEQ ID NO4)中所含的远端调控因子。本发明提供了大约2.7kb的拟南芥属AGL5 5′侧翼序列,包括其中所含的多个调控因子。该公开的拟南芥属AGL5 5′侧翼序列含有大量的涉及调控内源性AGL5基因体内表达的调控因子,因而,尤为可以用于熟裂区域选择性表达。
含有拟南芥属AGL5启动子的临近区域(SEQ ID NO4的第1889至2703个核苷酸)的核苷酸序列显然不在本发明的熟裂区域选择性调控因子之内。但是,熟裂区域选择性调控因子可以包括SEQ ID NO4的第1889至2703个核苷酸,连同SEQ ID NO4的第1至1888个核苷酸序列中的一个或多个连续的核苷酸。熟裂区域选择性调控因子可以具有,例如,至少15个连续的SEQ ID NO4的核苷酸,包括SEQID NO4的第1至1888位所示的核苷酸序列中至少1,2,4,6,10,20或30个或更多个连续的核苷酸。
考虑到熟裂区域选择性调控因子的定义,应当认识到的是,例如,只具有图8(SEQ ID NO4)中第1889至第2703位核苷酸的拟南芥属AGL5基因的部分,不是本文所定义的熟裂区域选择性调控因子。但是,如果该因子能使与其可操纵相连的核酸分子在限定的植物组织中,包括在壳瓣边缘或熟裂区域中选择性表达,只具有SEQ ID NO4中第1889至第2703位核苷酸的拟南芥属AGL5基因的部分也可以被视为熟裂区域选择性调控因子。显类似地,具有拟南芥属AGL5启动子的临近区域亚部分的拟南芥属AGL5基因的部分也可以被视为熟裂区域选择性调控因子,只要该亚部分能使与其可操纵相连的核酸分子在限定的植物组织中,包括在种子植物的壳瓣边缘或熟裂区域中选择性表达。因此,例如,具有第1889至第2000位核苷酸序列的调控因子可以是本发明的熟裂区域选择性调控因子,只要因子能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达。
本发明还提供了重组核酸分子,它包括与一个编码细胞毒素基因产物的核酸分子可操纵相连的熟裂区域选择性调控因子。进而本文提供了一种非天然存在的种子植物,它由于具有与一个编码细胞毒素基因产物的核酸分子可操纵相连的熟裂区域选择性调控因子的重组核酸分子的表达,而具有了迟发性种子散布的特性。
细胞毒素基因产物是一种可以导致细胞因其表达而死亡的基因产物,优选地,它不会导致不在其中表达的细胞的死亡,除非它在其中表达。因此,熟裂区域选择性调控因子作用下的细胞毒素基因产物的表达可以用于消除熟裂区域而不打扰相邻的胎座或壳瓣细胞。各种可用于种子植物的细胞毒素基因产物是本领域所周知的,包括例如白喉毒素A链多肽;RNase T1;芽孢杆菌RNase;篦麻毒素A链多肽;单纯疱疹病毒腺苷激酶(tk)基因产物。虽然白喉毒素A链多肽;RNase T1;芽孢杆菌Rnase是优选的细胞毒素基因产物,熟练的技术人员能够认识到,这些或者其他的细胞毒素基因产物可以与熟裂区域选择性调控因子一起用于产生非天然存在的、具有了迟发性种子散布的特性种子植物。
白喉毒素是天然存在的Cornebacterium diphtheriae的毒素,它能催化延长因子2的ADP-糖基化,导致蛋白质合成的起始从而导致细胞死亡(Collier,细菌学评论,3954-85(1975))。一个完全活性的毒素分子足以杀死一个细胞(Yamaizumi等,细胞,15245-250(1978))。白喉毒素有两个亚基白喉毒素B链作用是通过特异的膜受体进入大多数的真核细胞,而A链编码毒性催化结构域。催化的DT-A链不含有信号肽而不能分泌。而且,任何从死亡细胞中释放出来的DT-A缺少白喉毒素B链而不能附着细胞。因此,DT-A是细胞自主性的并且只能够杀死自己表达的细胞而对相邻的细胞没有损害。Palmiter等的DT-A表达盒含有193个A链残基,接上了合成的ATG并去除了天然的引导序列,它尤为有用于本发明的种子植物(Palmiter等,细胞,50435-443(1987);Greenfiled等,美国科学院研究进展,806853-6857(1983),在此提及可供参考)。
米曲霉的RNase T1和解淀粉芽孢杆菌的芽孢杆菌Rnase也是可以用于本发明的种子植物的细胞毒素基因产物(Thorsness和Nasrallah,细胞生物学方法,50439-448(1995))。芽孢杆菌Rnase比RNase T1是更为常用的植物毒素,因而也就在本发明的方法中更为优选。
篦麻毒素是蓖麻子产生的核糖体失活蛋白,也是可以用于本发明的非天然存在的种子植物的细胞毒素基因产物。篦麻毒素A链多肽可以用于产生细胞特异的溶解,如Moffat等,发育,114681-687(1992)中所描述的。植物的核糖体对于植物来源的篦麻毒素具有不同的易感性。熟练的技术人员能够明白的是,篦麻毒素的毒性是不同的,需要对所研究的种子植物进行评估(见Olsnes和Pihl,毒素和病毒的分子作用,第51-105页,AmsterdamElsewier BiomedicalPress(1982))。
本文进而提供了含有熟裂区域选择性调控因子的植物表达载体。植物表达载体可以包括,如果需要的话,编码AGL-8类的基因产物的核酸分子以及熟裂区域选择性调控因子。
本文所用的术语“植物表达载体”是指一种自我复制的核酸分子,它能够提供一种手段将外源的核酸分子转运到种子植物宿主细胞中并在其中表达该分子。植物表达载体包括适于农杆菌介导的转化的载体,包括二元和共整合载体,以及用于物理转化的载体。
植物表达载体可以用于短暂表达外源的核酸分子,或者可以整合并稳定表达外源序列。本领域的熟练的技术人员能够明白的是,植物表达载体可以含有所有的转运和表达外源核酸分子所需的功能;或者,可以将一种或几种功能以反式形式提供,如用于农杆菌介导的转化的二元载体系统。
除了熟裂区域选择性调控因子,本发明的植物表达载体还可以含有,如果需要的话,其他的元件。用于农杆菌介导的转化的二元载体系统含有一个或所有两个T-DNA边界重复,并且还可以含有,例如,一个或多个下列元件广泛的宿主范围的复制子,用于有效地从E.coli到农杆菌转运的ori T,细菌选择性标记如氨苄青霉素和多克隆位点。
用于物理转化的植物表达载体可以具有,例如,植物选择性标记以及熟裂区域选择性调控因子,它们位于诸如pBR322,pUC,pGEM和M13载体上,这些载体是可以商业购得的,例如从Pharmacia(Piscataway,NJ)或Promega(Madison,WI)。在用于种子植物物理转化的植物表达载体上,可选择地含有T-DNA边界或ori T区域,但它们不起作用。
本发明还提供了用于产生具有迟发性种子散布特性的转基因植物的试剂盒。本发明的试剂盒含有熟裂区域选择性调控因子。如果需要的话,该熟裂区域选择性调控因子可以与编码AGL-8类的基因产物的核酸分子可操纵相连。
下列的实施例用于对本发明的解释而非对本发明的限制。
实施例I表现出完全丧失熟裂的35S-AGL8转基因拟南芥属植物的产生本实施例描述了产生由于结构中AGL8的表达而丧失了正常的熟裂的转基因拟南芥属植物的方法。
利用引物AGL8 5-γ(SEQ ID NO9;5′-CCGTCGACGATGGGAAGAGGTAGGGTT-3′)和引物OAM14(SEQ ID NO10;5′-AATCATTACCAAGATATGAA-3′),通过聚合酶链反应制备全长的AGL8,并将其克隆到表达载体pBIN-JIT的SalI和BamHI位点,该载体是从pBIN19修饰而来的,含有串联的CaMV 35S启动子,多克隆位点和CaMV polyA信号。基本上按照Bechtold等所描述的(C.R.Acad.Sci.Paris,3161194-1199(1993),在此提及可供参考),农杆菌介导的转化,利用in planta法进行拟南芥属的转化。利用对35S启动子特异的引物和对AGL8 cDNA特异的引物进行PCR,分析卡那霉素抗性品系中35S-AGL8结构的存在,在35S-AGL8转基因植物中产生了850和550bp的两个片段。这些片段在未转化有35S-AGL8结构的植物中不存在。
分析了大约35个35∷AGL8品系的表型。在35个品系中,7个表现出全丧失熟裂。在这些品系中,成熟的果实不释放它们的种子,除非人工操作。几个保持35S∷AGL8的品系表现出迟发性熟裂,其种子的释放比野生型拟南芥属植物至少晚一周。
实施例II表现出完全丧失熟裂的拟南芥属agl1 agl5双突变体的产生本实施例描述了表现出完全丧失熟裂的拟南芥属agl1 agl5双突变体的产生A.通过同源重组产生agl1 agl5双突变体利用PCR法检测转基因植物以确定AGL5上的定位插入,如Kempin等所描述的(自然,389802-803(1997),在此提及可供参考)。将含有卡那霉素抗性盒的靶结构插入到分别处于AGL5基因的5′和3′端区域的3kb和2kb片段之间。成功的定点插入在AGL5基因上产生1.6kb的缺失,因而,靶基因只编码246个氨基酸残基的前26个,并只编码含有DNA结合MADS结构域的56个氨基酸中的26个。重组的结果还导致在AGL5编码序列中插入了2.5kb的卡那霉素抗性盒。
750个卡那霉素抗性转基因品系通过农杆菌介导的转化产生,按下文所述的PCR检测来分析转化子,确定这些初级转化子是否产生了所需的AGL5定位插入。确定出一个品系含有预期的插入,使该品系白花授粉以便在其后代中作进一步分析。对来自该同源突变体植物的基因组DNA,通过四种以上的限制酶以及几次独立的PCR扩增进行分析,所有数据都与所设计的定点诱变相符合。对AGL5基因侧翼的区域也进行了分析,确认在AGL5之外的序列中没有可检测到的缺失或重排。
AGL5靶结构内的卡那霉素抗性盒含有确定转录终止的序列,因而在同源重组突变的植物中几乎没有或完全没有AGL5 mRNA。利用对AGL5 cDNA 3′部分特异的探针,在野生型中检测到AGL5基因的转录,而在agl5突变植物中没有检测出。这些数据表明这种AGL5基因定位干扰产生了一种功能丧失的等位基因。
agl5品系的鉴定表明该转基因的表型与野生型拟南芥属没有不同。
在载体pZM104A上制备了AGL5的敲除(KO)结构,该载体带有侧翼为多克隆位点的卡那霉素抗性盒(Miao和Lam植物杂志,7359-365(1995),在此提及可供参考)。在载体pZM104A还含有编码β-葡糖苷酸酶(GUS),它用以区分非同源的和同源的整合情况。利用引物SEQ ID NO11(5′-CGGATAGCTCGAATATCG-3′)和引物SEQID NO12(5′-AACCATTGCGTCGTTTGC-3′)进行PCR扩增获得AGL55′部分的3kb区域。将得到的片段克隆入载体pCRII(Invitrogen),并将切下的EcoRI片段克隆入pZM104A的EcoRI位点。将3′部分的AGL5从位于在pCIT30(Ma等,基因,117161-167(1992),在此提及可供参考)中的基因组克隆用XbaI切下,并插入到pZM104A的XbaI位点。将得到的质粒,记作AGL5 KO,用于对Columbia生态型的野生型拟南芥属植物进行农杆菌介导的渗透。敲除结构来自Landsberg erecta基因组DNA。
对AGL5位点上含有同源重组的植物作如下的鉴定。选取大于750个初级(T1)卡那霉素抗性的转化子,10个植物一组,分别从叶子中抽提DNA,如Edward等所述(核酸研究,191349(1991),在此提及可供参考)。为了确定出含有候选的定点破坏的一组,利用作为AGL5位基因组的序列但不处于AGL5 KO结构中的引物SEQ IDNO13(5′-GTAATTACCAGGCAAGGACTCTCC-3′),和对卡那霉素盒特异的引物SEQ ID NO14(5′-GTCATCGGCGGGGGTCATAACGTG-3′),对分离的DNA进行PCR扩增。扩增产物在琼脂糖凝胶上组份分离,并用探针1进行标准的DNA斑点杂交试验。含有10个植物的一组在正确位置显现出预期的杂交条带,将该组进而分开为单个植物。最后确定出单个一株(T1)植物表现出含有预期的重组,使该植物自花授粉以便进一步对其后代进行分析。该T1植物显示出含有GUS报告基因,这表明除了假定的同源整合之外,还有发生了独立的非同源事件。在其后代中的繁殖隔离确定出不再含有GUS报告基因的植物,并将这种品系用于进一步的分析。利用引物SEQ IDNO15(5′-GAGGATAGAGAACACTACGAATCG-3′)和引物SEQ IDNO16(5′-CAGGTCAAGTCAATAGATTC-3′)进行PCR扩增,以确定出重组破坏的纯合子植物,扩增在野生型植物中产生一个1.5kb的产物,而在突变体中产生一个2.6kb的产物。通过用引物SEQ IDNO17(5′-CAGAATTTAGTGAATAATATTG-3′)和引物SEQ ID NO14进行PCR扩增,在突变体中获得了预期的扩增产物而在野生型中没有产物,进一步对含有所需的重组破坏的植物进行了确定。
为了证实发生了所需重组破坏,分析了一系列的野生型和突变(T4代)植物的基因组杂交印渍。探针1可与预期的3.9kb的野生型和突变植物的XbaI片段杂交,但是只有在野生型中才存在1.3kb的XbaI片段。同样的探针可与野生型中的6kb的EcoRI片段以及预期的突变型中的4.1和2.8kb的EcoRI片段杂交。另外用BglII和HindII的酶解也可以确定突变体中含有所需的靶序列。为了确定在靶区域范围之外没有可检测的缺失或重组,进一步分析了野生型和纯合子突变植物的基因组杂交印迹。探针2可与野生型和突变型DNA的预期的2.9kb的XmnI片段,1.5kb和0.4kb的HincII片段,以及0.6kb的HindIII片段杂交。探针3可与野生型和突变型DNA的预期的9kb的ScaI片段,3.9kb的XbaI片段,以及1.8kb的NdeI片段杂交。ScaI酶解物中的微弱杂交带表示的是跨越插入位点的片段,并且,如所期望的,在野生型和agl5突变型植物中大小不同。
RNA杂交分子如下进行。利用Dynbeads(Dynal)从野生型和agl5突变型花序中纯化出大约6μg的polyA+RNA,按照标准的程序进行组份分离和杂交(Crawford等,美国科学院研究进展,838073-8076(1986),在此提及可供参考),使用了一个来自pCIT2242(Ma等,同上,1991)的经过凝胶纯化的450bp的HindII-EcoRI片段,它是对AGL5 cDNA的3′端特异的。然后将同一滤膜剥下并与微管蛋白特异的探针(Marks等,植物分子生物学,1091-104(1987),在此提及可供参考)再次杂交。与微管蛋白特异的探针的杂交可以确定各个泳道中存在大致相同数量的RNA。B.agl1突变体的产生基本上按照Krysan等,同上,1996所述的,利用PCR法扫描来确定AGL1基因中T-DNA的插入。
RNA杂交分析表明AGL1 RNA没有表达。agl1突变体基本上显示为野生型表型。C.agl1 agl5双突变体的产生和鉴定
agl1 agl5双突变体通过agl1和agl5单一突变体的杂交产生。如上文所描述的,进行agl1 agl5双突变体的RNA杂交实验。结果表明agl1和agl5 RNA在agl1 agl5双突变体中都没有表达。
与基本上是野生型表型的agl1和agl5单一突变体相反,通过扫描电子显微镜对agl1 agl5双突变体的分析表明其熟裂区域无法正常发育。而且,agl1 agl5双突变体的成熟果实无法熟裂。这种迟发性种子散布的表型与35S-AGL8转基因植物中的AGL8功能获得型表型相似。这些结果表明AGL1和AGL5基因是功能上多余的,并且它们编码的基因产物调控果荚的熟裂。35S∷AGL8和agl1 agl5双突变表型的相似性,以及下文中所描述的酵母双杂交的结果表明,AGL1和AGL8或者AGL5和AGL8可以相互作用来调控熟裂过程。D.各种条件下对熟裂表型的分析利用透射电子显微镜对Brassica napus L.的果荚熟裂进行的研究表明,在熟裂中,熟裂区域细胞的中间的薄层降解,使得壳瓣与胎座框分离(Petersen等,同上,1996)。在agl1 agl5双突变体中以及在野生型拟南芥属和agl1和agl5单一突变型中也进行了类似的分析。
先前的研究表明,当温度更高和相对湿度更低时果荚熟裂更强烈。上述的agl1 agl5双突变体熟裂表型是将植物置于连续光照、25℃下获得的。为了确定agl1 agl5双突变体是否对环境条件敏感,上述的分析在不同的环境条件下,包括变化温度、变化湿度和短日照的连续光照条件下进行了重复。
实施例III在AGL1启动子控制下表达AGL8的转基因拟南芥属植物的产生本实施例表明在熟裂区域选择性启动子控制下表达AGL8的转基因植物具有迟发性种子散布的特性。AGL1∷AGL8转基因植物在35S启动子控制下AGL8的异位表达因熟裂区域无法正常发育而防止了果荚的散落。但是,35S启动子产生的组成型AGL8的表达也可以导致其他的变化,包括过早开花。为了特异地控制熟裂,AGL8的表达由熟裂区域选择性调控因子控制,诸如来自通常表达于壳瓣区域的调控启动子,如下文所述。
在熟裂区域选择性2.5kb的AGL1启动子片段控制下的AGL8表达结构和第一个AGL1内部序列,按照如下方法制备。利用引物AGL1pds(SEQ ID NO18;5′-GCCAGAGATAATGCTATTCC-3′)和引物AGL1pus(SEQ ID NO19;5′-CATTGATCCATATATGACATCAC-3′)进行PCR扩增出2.5kb的AGL1启动子片段,利用寡聚片段AGL8eds(SEQ ID NO20;5′-GTGATGTCATATATGGATCAATGGGAAGAGGTAGGGTTCAG-3′)和寡聚片段AGL8eus(SEQ ID NO21;5′-CAAGAGTCGGTGGAATATTCG-3′)进行PCR扩增出AGL8内的第一个编码外显子。另外,利用寡聚片段AGL1ids(SEQ ID NO22;5′-CGAATATTCCACCGACTCTTGGTACGCTTCTCCTACTCTAT-3′)和寡聚片段AGL1iup(SEQ ID NO23;5′-CTAATAAGTAAGATCGCGGAA-3′)进行PCR扩增出含有调控因子的AGL1的第一个内含子。利用寡聚片段AGL8rds(SEQ ID NO24;5′-TTCCGCGATCTTACTTATTAGCATGGAGAGGATACTTGAAC-3′)和寡聚片段OAM14(SEQ IDNO10)进行PCR扩增出其余的AGL8编码区域。利用引物AGL1pds(SEQ ID NO18)和寡聚片段OAM14(SEQ ID NO10)进行PCR,将四个片段按照下列顺序连接起来AGL1启动子,AGL8的第一个外显子,AGL1的第一个内含子和其余的AGL8编码序列。将得到的4.6kb的片段克隆入pCFM83载体,该载体是以pBIN19位基础的,它经修饰含有BASTA抗性基因和3′NOS终止序列。
只在熟裂区域选择性2.5kb的AGL1启动子片段控制下的第二个AGL8表达结构,按照如下方法制备。利用引物AGL1pds(SEQ IDNO18)和引物AGL1pus(SEQ ID NO19)进行PCR扩增出2.5kb的AGL1启动子片段,利用寡聚片段AGL8eds(SEQ ID NO20)和OAM14(SEQ ID NO10)进行PCR扩增出AGL8编码区域。利用引物AGL1pds(SEQ ID NO18)和OAM14(SEQ ID NO10)进行PCR,将3.5kb的片段克隆入pCFM83载体。
用上述的这两种AGL1-AGL8结构转化拟南芥属植物。筛选出带有或者不带有AGL1内含子的含有AGL1∷AGL8转基因的BASTA抗性植物。表性分析表明,含有任何这些结构的转化植物具有迟发熟裂的特性。但是,AGL1∷AGL8转基因植物不同于35S∷AGL8转基因植物,总体上未发现增大的果实和过早开花表型。
这些结果表明,在AGL1熟裂区域选择性调控因子控制下表达AGL8的转基因种子植物具有迟发性种子散布的特性。
实施例IV酵母中AGL8与AGL5的相互作用本实施例表明,在酵母双杂交系统中,AGL8基因产物与AGL5的相互作用。
Finley和Brent的“相互作用陷阱”(基因探针实用方法(1994);也可见,Gyurs等,细胞,75791-803(1993))是Fields和Song的酵母双杂交系统(自然,340245-246(1989)的一种变化形式。该系统中,第一个蛋白与DNA结合结构域融合,而第二个蛋白与转录激活结构域融合。拟南芥属AGL5和AGL8基因产物之间的相互作用通过1acZ报告基因的激活来检测。
“诱饵”和“猎物”结构制备于单拷贝着丝点质粒pBI-880和pBI-771中,它们分别含有组成型ADH1启动子,且基本上如Chevray和Nathans所述(美国科学院研究进展,895789-5793(1992)。诱饵结构含有与全长的AGL8编码序列融合的GAL4 DNA结合结构域(第1至147位氨基酸)。猎物结构含有与GAL4转录激活结构域相融合的全长的AGL5编码序列,后跟有核定位序列。将诱饵和猎物结构在S.cerevisiae的YPB2菌种中检测,该菌种缺损GAL4和GAL80而含有整合的在GAL1启动子元件控制下的lacZ报告基因(Feilotter等,核酸研究,221502-1530(1994))。
通过在含有X-gal的培养基上的蓝色菌落的显色,AGL8的“诱饵”和AGL5“猎物”间的相互作用在YPB2菌种中表现出来。对照“诱饵”-“猎物”的结合,包括单独的GAL4(1-147)DNA结合结构域和GAL4转录激活结构域都只产生白色菌落。这些结果显示AGL8可以和AGL5在酵母中相互作用,并且表明AGL8和AGL5的植物MADS盒基因产物在种子植物中也可以相互作用。
上文中,以圆括号或其他形式提供的所有的杂志文章、参考文献、和专利引用,无论是否在前文中加以说明,它们在本文中被提及并可以参考。
尽管本发明以上述的实施例为参考进行了描述,但是应当明白的是,不背离本发明的精神可以进行各种修改。因此,本发明只限制于下列的权利要求。
序列表(1)一般信息(i)申请人加利福尼亚大学董事会(ii)发明名称具有迟发性种子散布的特性的种子植物(iii)序列数24(iv)通信地址(A)收信人Campbell & Flores LLP(B)街道4370 La Jolla Village Drive,Suite 700(C)城市San Diego(D)州加利福尼亚(E)国家美国(F)邮政编码92122(v)计算机阅读格式(A)介质类型软盘(B)计算机IBMPC兼容(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0 Version#1.25(vi)当前申请数据(A)申请号(B)申请日(C)分类(vii)在先申请数据(A)申请号US 60/051,030(B)申请日1997年6月27日(A)申请号US 60/067,800(B)申请日1998年4月28日(viii)律师/代理人信息(A)姓名Campbell,Cathryn A.
(B)注册号31,815(C)参考/文档号FP-UD 3188(ix)电讯信息(A)电话(619)535-9001(B)电传(619)535-8984(2)SEQ ID NO1的信息(i)序列特征
(A)长度1062个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(ii)分子类型cDNA(ix)特性(A)名称/要点CDS(B)位置101..827(ix)特性(A)名称/要点misc_feature(B)位置1062(D)其他信息/注=″末端有poly(A)尾″(ix)特性(A)名称/要点misc_feature(B)位置1..1062(D)其他信息/注=″AGL8 cDNA克隆的核苷酸和推导的氨基酸序列″(xi)序列描述SEQ ID NO1CCCAGAGAGA CATAAGAAAG AAAGAGAGAG AGAGATACTT TGGTCATTTC AGGGTTGTCG 60TTTCTCTCTC TTGTTCTTGA GATTTTGAAG AGAGAGAGAT ATG GGA AGA GGT AGG115Met Gly Arg Gly Arg1 5GTT CAG CTG AAG AGG ATA GAG AAC AAG ATC AAT AGG CAA GTT ACT TTC163Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn Arg Gln Val Thr Phe10 15 20TCA AAG AGA AGG TCT GGT TTG CTC AAG AAA GCT CAT GAG ATC TCT GTT211Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala His Glu Ile Ser Val25 30 35CTC TGC GAT GCT GAG GTT GCT CTC ATC GTC TTC TCT TCC AAA GGC AAA259Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe Ser Ser Lys Gly Lys40 45 50CTC TTC GAA TAT TCC ACC GAC TCT TGC ATG GAG AGG ATA CTT GAA CGC307Leu Phe Glu Tyr Ser Thr Asp Ser Cys Met Glu Arg Ile Leu Glu Arg55 60 65TAT GAT CGC TAT TTA TAT TCA GAC AAA CAA CTT GTT GGC CGA GAC GTT355Tyr Asp Arg Tyr Leu Tyr Ser Asp Lys Gln Leu Val Gly Arg Asp Val70 75 80 85TCA CAA AGT GAA AAT TGG GTT CTA GAA CAT GCT AAG CTC AAG GCA AGA403Ser Gln Ser Glu Asn Trp Val Leu Glu His Ala Lys Leu Lys Ala Arg90 95 100GTT GAG GTA CTT GAG AAG AAC AAA AGG AAT TTT ATG GGG GAA GAT CTT451Val Glu Val Leu Glu Lys Asn Lys Arg Asn Phe Met Gly Glu Asp Leu105 110 115GAT TCG TTG AGC TTG AAG GAG CTC CAA AGC TTG GAG CAT CAG CTC GAT499Asp Ser Leu Ser Leu Lys Glu Leu Gln Ser Leu Glu His Gln Leu Asp120 125 130GCA GCT ATC AAG AGC ATT AGG TCA AGA AAG AAC CAA GCT ATG TTC GAA547Ala Ala Ile Lys Ser Ile Arg Ser Arg Lys Asn Gln Ala Met Phe Glu135 140 145TCC ATA TCT GCG CTC CAG AAG AAG GAT AAA GCC TTG CAA GAT CAC AAC595Ser Ile Ser Ala Leu Gln Lys Lys Asp Lys Ala Leu Gln Asp His Asn150 155 160 165AAT TCG CTT CTC AAA AAG ATT AAG GAG AGG GAG AAG AAA ACG GGT CAG643Asn Ser Leu Leu Lys Lys Ile Lys Glu Arg Glu Lys Lys Thr Gly Gln170 175 180CAA GAA GGA CAA TTA GTC CAA TGC TCC AAC TCT TCT TCA GTT CTT CTG691Gln Glu Gly Gln Leu Val Gln Cys Ser Asn Ser Ser Ser Val Leu Leu185 190 195CCT CAA TAC TGC GTA ACC TCC TCC AGA GAT GGC TTT GTG GAG AGA GTT739Pro Gln Tyr Cys Val Thr Ser Ser Arg Asp Gly Phe Val Glu Arg Val200 205 210GGG GGA GAG AAC GGT GGT GCA TCG TCG TTG ACG GAA CCA AAC TCT CTG787Gly Gly Glu Asn Gly Gly Ala Ser Ser Leu Thr Glu Pro Asn Ser Leu215 220 225CTT CCG GCT TGG ATG TTA CGT CCT ACC ACT ACG AAC GAG T AGAACTATCT 837Leu Pro Ala Trp Met Leu Arg Pro Thr Thr Thr Asn Glu230 235 240CACTCTTTAT AATATAATGA TAATATAATT AATGTTTAAT ATTTTCATAA CATTCAGCAT 897TTTTTTGGTG ACTTATACTC ATTATTAATA CCGATATGTT TTAGCTAGTC ATATTATATG 957TATGATGGAA CTCCGTTGTC GAGACGTATG TACGTAAGCT ATCATTAGAT TCACTGCGTC 1017TTAAGAACAA AGATTCATAT CTTGGTAATG ATTTCTCATG AAATA 1062(2)SEQ ID NO2的信息(i)序列特征(A)长度242个氨基酸(B)类型氨基酸(D)拓扑线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Gly Arg Gly Arg Val Gln Leu Lys Arg Ile Glu Asn Lys Ile Asn1 5 10 15Arg Gln Val Thr Phe Ser Lys Arg Arg Ser Gly Leu Leu Lys Lys Ala20 25 30His Glu Ile Ser Val Leu Cys Asp Ala Glu Val Ala Leu Ile Val Phe35 40 45Ser Ser Lys Gly Lys Leu Phe Glu Tyr Ser Thr Asp Ser Cys Mer Glu50 55 60Arg Ile Leu Glu Arg Tyr Asp Arg Tyr Leu Tyr Ser Asp Lys Gln Leu65 70 75 80Val Gly Arg Asp Val Ser Gln Ser Glu Asn Trp Val Leu Glu His Ala85 90 95Lys Leu Lys Ala Arg Val Glu Val Leu Glu Lys Asn Lys Arg Asn Phe100 105 110Met Gly Glu Asp Leu Asp Ser Leu Ser Leu Lys Glu Leu Gln Ser Leu115 120 125Glu His Gln Leu Asp Ala Ala Ile Lys Ser Ile Arg Ser Arg Lys Asn130 135 140Gln Ala Met Phe Glu Ser Ile Ser Ala Leu Gln Lys Lys Asp Lys Ala145 150 155 160Leu Gln Asp His Asn Asn Ser Leu Leu Lys Lys Ile Lys Glu Arg Glu165 170 175Lys Lys Thr Gly Gln Gln Glu Gly Gln Leu Val Gln Cys Ser Asn Ser180 185 190Ser Ser Val Leu Leu Pro Gln Tyr Cys Val Thr Ser Ser Arg Asp Gly195 200 205Phe Val Glu Arg Val Gly Gly Glu Asn Gly Gly Ala Ser Ser Leu Thr210 215 220Glu Pro Asn Ser Leu Leu Pro Ala Trp Met Leu Arg Pro Thr Thr Thr225 230 235 240Asn Glu(2)SEQ ID NO3的信息(i)序列特征(A)长度5622个碱基对(B)类型核酸(C)链性未知(D)拓扑未知(ix)特性(A)名称/要点misc_feature(B)位置1..5622(D)其他信息/标记=″AGL1启动子″/注=″AGL1启动子的核苷酸序列″(xi)序列描述SEQ ID NO3AGATCTGCAA CAGTGAAAAG AGAAAACAAA ATGGACTTGA AGAGGTTTTG ACAATGCCAG60AGATAATGCT TATTCCCTAA TATGTTGCCA GCCAAGTGTC AAATTGGCTT TTTAAATATG 120GATTTCTGTA TCAGTGGTCA TATTTGTGGA TCCAACGTAT TCATCATCAA GTTCTCAAGT 180TTGCTTTCAG TGCAATTCTA ATTCACACGT TTAACTTTAA CATGCATGTC ATTATAATTA 240CTTCTTCACT AAGACACAAT ACGGCAAACC TTTCAGATTA TATTAATCTC CATAAATGAA 300ATAATTAACC TCATAATCAA GATTCAATGT TTCTAAATAT ATATGGACAA AATTTACACG 360GAAGATTAGA TACGTATATT AGTAGATTTA GTCTTTCGTT TGTGCGATAA GATTAACCAC 420CTCATAGATA GTAATATCAT TGTCAAATTC CTCTCGGTTT AGTCGCTAAA TTGTATCTTT 480TTTAAGCCTA AAAGTAGTGT ATTCGCATAT GACTTATCGT CCTAACTTTT TTTTTAATTA 540ACAAAAAAAT CGAAAAGAAA ATAATCTGTT AAATATTTTT TAAGTACTCC ATTAAGTTTA 600GTTTCTATTT AAAAAATGCT TGAAATTTGA CAGTTATGTT CAACAATTTT GAATCATGAG 660CGATGTCTAG ATACTCAGAA TTTAATCAAG ATGTCTTATC AAATTTGTTG TCACTCGAGG 720ACCCACGCAA AAGAAAAGAC TAATATGATT TTTATTTGGT CTGGATATTT TTGTAGAGGA 780TGAAACTAAG AGAGTGAAAG ATTCGAAATC CACAATGTTC AAGAGAGCTC AAAGCAAAAA 840GAAAAATGAA GATGAAGGAC TAAAGAACAA TAAGCAACTA CTTATACCCT ATTTCCATAA 900AGGATTCAGG TACTAGGAGA AGTTGAGGCA AGTTNNNNNN NATTGATTCA AATTTTCATT 960TATTTTTACA ATTTAATTCA CCTAAGTTAT TATGCATTTC TcATcATTGG TACATTTTCT 1020GTATAGCGTA TTTACATATA TGAAATAAAT TAAATATGTC CTCACGTTGC AAGTAGTTAA 1080TGAATGTCCC CACGCAAAAA AAAATCCCTC CAAATATGTC CACCTTTTCT TTTCTTTTTA 1140ATTCCAAAAT TACCATAAAC TTTTGGTTTA CAAAAGATTT CTAGAAATTG AGGAAGATAT 1200CCTAAATGAT TCATGAATCC TTCAATAATC TGAAGTTTGC GATATTTTCG ATTTTCTTCA 1260AGAGTTGCGA TATTTGTAAT TTGGTGACCT TAAACTTTTT TTGATAAAGA GTAAACGTTT1320TTTCTTAAAA GTAAAACTTG ATTTTATGTT TTAGGGTTCT AGCTCAACTT TGTATTATAT1380TTCTTGCAAA AAGAGTTCGT TAACTGCATT CTTCAACACT ATAAAGTGAT TATCAAAAAC1440ATCTTCATGA ACATTAAGAA AAACAATATT TGGTTTCGGT TAGAGCTTGG TTTTGCTTGG1500CTTGATTCAC ATACCCATTC TAGACTTTGG CATAAATTTG ATACGATAGA GAGTATCTAA1560TGGTAATGCA GAAGGGTAAA AAAAGGAAGA GAGAAAAGGT GAGAAAGATT ACCAAAAATA1620AGGAGTTTCA AAAGATGGTT CTGATGAGAA ACAGAGCCCA TCCCTCTCCT TTTCCCCTTC1680CCATGAAAGA AATCGGATGG TCCTCCTTCA ATGTCCTCCA CCTACTCTTC TCTTCTTTCT1740TTTTTTCTTT CTTATTATTA ACCATTTAAT TAATTTCCCC TTCAATTTCA GTTTCTAGTT1800CTGTAAAAAG AAAATACACA TCTCACTTAT AGATATCCAT ATCTATTTAT ATGCATGTAT1860AGAGAATAAA AAAGTGTGAG TTTCTAGGTA TGTTGAGTAT GTGCTGTTTG GACAATTGTT1920AGATGATCTG TCCATTTTTT TCTTTTTTCT TCTGTGTATA AATATATTTG AGCACAAAGA1980AAAACTAATA ACCTTCTGTT TTCAGCAACT AGGGTCTTAT AACCTTCAAA GAAATATTCC2040TTCAATTGAA AACCCATAAA CCAAAATAGA TATTACAAAA GGAAAGAGAG ATATTTTCAA2100GAACAACATA ATTAGAAAAG CAGAAGCAGC AGTTAAGTGG TACTGAGATA AATGATATAG2160TTTCTCTTCA AGAACAGTTT CTCATTACCC ACCTTCTCCT TTTTGCTGAT CTATCGTAAT2220CTTGAGAACT CAGGTAAGGT TGTGAATATT ATGCACCATT CATTAACCCT AAAAATAAGA2280GATTTAAAAT AAATGTTTCT TCTTTCTCTG ATTCTTGTGT AACCAATTCA TGGGTTTGAT2340ATGTTTCTTG GTTATTGCTT ATCAACAAAG AGATTTGATC ATTATAAAGT AGATTAATAA2400CTCTTAAACA CACAAAGTTT CTTTATTTTT TAGTTACATC CCTAATTCTA GACCAGAACA2460TGGATTTGAT CTATTTCTTG GTTATGTATC TTGATCAGGA AAAGGGATTT GATCATCAAG2520ATTAGCCTTC TCTCTCTCTC TCTAGATATC TTTCTTGAAT TTAGAAATCT TTATTTAATT2580ATTTGGTGAT GTCATATATG GATCAATGGA GGAAGGTGGG AGTAGTCACG ACGCAGAGAG2640TAGCAAGAAA CTAGGGAGAG GGAAAATAGA GATAAAGAGG ATAGAGAACA CAACAAATCG2700TCAAGTTACT TTCTGCAAAC GACGCAATGG TCTTCTCAAG AAAGCTTATG AACTCTCTGT2760CTTGTGTGAT GCCGAAGTTG CCCTCGTCAT CTTCTCCACT CGTGGCCGTC TCTATGAGTA2820CGCCAACAAC AGGTACGCTT CTCCTACTCT ATTTCTTGAT CTTGTTTTCT TAATTTTAAC2880TAAACAAGAT CCTAGTTCAA ATGATAACAA AGTGGGGATT GAGAGCCAAG ATTAGGGTTT2940GGTTAATTTA GAAAACCAGA TTTCACTTGT TGATACATTT AATATCTCTC TAGCTAGATT3000TAGTACTCTC TCCTCTATAT ATGTGTGGGT GTGTGTGTAA GTGTGTATAT GTATGCAAAT3060GCAAGAAGAA GAAGAAAAAG TTATCTTGTC TTCTCAAATT CTGATCAGCT TTGACCTTAG3120TTTCACTCTT TTTTCTGCAA ATCATTTGAA CCTGATGCAT GTCAGTTTCT ACAATACACT 3180TTTAATTTTG ACGGCCCATC AAATTTCCTA GGGTTTACTT CAGTGAACAA AATTGGGTTC 3240TTGACACGAT TTAGCATGTA TATATAAAAA TAGGGGATGA TCAAGACTTA TGTAACCTCT 3300GTCTGGTGAA ACTAGGGACA AAGTCTACTG ATGAGTTGTC ACTAGGGATC CATTTGATCA 3360TTTAATCCCA ACAAAAATGA AACAAAATTT TGAGAATTTA TATGCTGAAG TTTTTCAACC 3420CTCTTTTTTA AATAACTTTA TATTATGTAG ATTTGTATTT AGGGTAATTT GTCCAACTAG 3480AAGTCCTAAA AATCAATAAA CACACGGATG ACTTTGTCTA ACATTGTATC AGTCATCAAA 3540TGTAAAATTG TACAAATAAT GAAATTAAAG ATTTAGTCTC TTTTATTTTT TTTGTTTAGG 3600GTGTATATAT ATATATATAT GTATATTTGT TGCATTGATA TATCAATGAG AGGGAGAGAA 3660CTCAGAGAAG TGTCGGAAAT TAAAATGGTA CGAGCCAATT GGAATCTCTG GCATTCTGAG 3720CTTCATTTGT TTGTTATTAG AAAAAAAAAA AAAAAATCCT TTAAAGATAC CTTCATGATG 3780ACATTGAATC ATGTAATATA CACGATACAT GGTCTAATTC CTCCTCAAAC CCTAATTACC 3840AATTTCGAAA CCATAATATT TACTAGTATG TTTATATATC CTTACTTTAA GACATTGTTT 3900GTTTATAATA CCTTGTGAAT TAAGAAAAAA AAAAAAAAAC TTGTGGATCT ATTCAAGCCA 3960TGTGTTAGAA TAAATTTATA AATTTTCTCC TCGTACTGGT CAGATATTGG TCCAAACTCC 4020AAAGCCTTCC CTTTTCAGGA AAAAAAACAT TTCGAAATTA ACTCTAATTA ATCAAGAATT 4080TCCTACAATG TATACATCTA ATGTTTTTTC CGCGATCTTA CTTATTAGTG TGAGGGGTAC 4140AATTGAAAGG TACAAGAAAG CTTGTTCCGA TGCCGTCAAC CCTCCTTCCG TCACCGAAGC 4200TAATACTCAG GTACCAATTT ATATTGTTTG ATTCTCTTTG TTTTATCTTC TTCTTTTTCAT 4260TATATATATG ATCAACAAAA AATATAACCT ACAAAAAGAG AGAGTTCAAG GAAATGCATT 4320GAAACGGTTT CGTTATGGTG TTTGAATACA TGGATTTTTG AAGTACTATC AGCAAGAAGC 4380CTCTAAGCTT CGGAGGCAGA TTCGAGATAT TCAGAATTCA AATAGGTAAT TCATTAACTT 4440TTCATGAACT CTTCGATTTG GTATTAGGTC ACTTAATTTG GTGTCGGTCC AAAAGTCCGC 4500TTGTAGTTTT CTTTAGAAGT TGTTTTGTTT AATGTTCATG TTTACAAATT GAAGGCATAT 4560TGTTGGGGAA TCACTTGGTT CCTTGAACTT CAAGGAACTC AAAAACCTAG AAGGACGTCT 4620TGAAAAAGGA ATCAGCCGTG TCCGCTCCAA AAAGGTAAAA TCTACGTTGC TCTCTCTCTG 4680TGTCTCTGTC TCTCTCTCTA TATATAGTCC CTTAGTTTAT ATAGTTCATC ACCCTTTTGT 4740GAGAATTTTG CAGAATGAGC TGTTAGTGGC AGAGATAGAG TATATGCAGA AGAGGGTAAG 4800AACGTTTCTC CCATTCCAAG TAATTAGATC TTTCTTCGTC TTTGTGAGGG TTTGAGTTTT 4860CCCATAAATC ATGTGTAGGA AATGGAGTTG CAACACAATA ACATGTACCT GCGAGCAAAG 4920GTTAGCCACG TTCTGTTCCA AATCTTAATC TCAATATCTA CTCTTTTCTT CATTGTATAA 4980CTAAGATAAC GTGAATAACA AGAAAACTTT TGTTTTTGGG TTTAATAGAT AGCCGAAGGC 5040GCCAGATTGA ATCCGGACCA GCAGGAATCG AGTGTGATAC AAGGGACGAC AGTTTACGAA 5100TCCGGTGTAT CTTCTCATGA CCAGTCGCAG CATTATAATC GGAACTATAT TCCGGTGAAC 5160CTTCTTGAAC CGAATCAGCA ATTCTCCGGC CAAGACCAAC CTCCTCTTCA ACTTGTGTAA 5220CTCAAAACAT GATAACTTGT TTCTTCCCCT CATAACGATT AAGAGAGAGA CGAGAGAGTT 5280CATTTTATAT TTATAACGCG ACTGTGTATT CATAGTTTAG GTTCTAATAA TGATAATAAC 5340AAAACTGTTG TTTCTTTGCT TAATTACATC AACATTTAAA TCCAAAGTTC TAAAACACGT 5400CGAGATCCAA AGTTTGTCAT ACAAGATTAG ACGCATACAC GATCAGTTAA TAGATTTTAA 5460GTGCCTTTTA ATATTTACAT ATAGTTGCAG CTTCGATTAG ATCATGTCCA CCAAACACTC 5520ACAATTAGAG ACAAGCAAAA CTATAAACAT TGATCATAAA ATGATTACAA CATGTCCATA 5580AATTAATTAT GGATTACAAA AATAAAAACT TACAAAAGAT CT5622(2)SEQ ID NO4的信息(i)序列特征(A)长度6138个碱基对(B)类型核酸(C)链性未知(D)拓扑未知(ix)特性(A)名称/要点misc_feature(B)位置1..6138(D)其他信息/标记=″AGL5_启动子″/注=″AGL5启动子的核苷酸序列″(xi)序列描述SEQ ID NO4GAATTCGTAA CAGAATTTAG TGAATAATAT TGTAATTACC AGGCAAGGAC TCTCCAAACG 60GATAGCTCGA ATATCGTTAT TAAAGAGTAA ATGATCCAAT ATGTAAGCCA TTGTTGATCA 120TCTAACATTG TTGGACTCTC TATTGCTCGA AATGATGCAT ACCTAATCAT TTATTCAGTT 180AACTATCAAG TTGCATTTGT AAAAACCAAA CATTTAAATT CAGATTTGAT ATCACTTACA 240GAGGATAGAG AAGCATGACT CCAGGCCTGC ATGCAACAAG AAAAAGGAAG AAAATAATGT 300TAAAAATTTG ACAAATATAG TGTTTATTTT TATTATATGA GACAGAATTT GAATAAAATC 360CTACCCAACT AGAGCATCAA AACGTTTTGC AATCGCAATA ATGAAACCCA TTTTCTTTTT 420GAGTTTTTAC TCTTCTTTCA ACAGAAACTT TCTCAAACGT CTTTAGCACT GTGACGTTAG 480ATATATACAC AAAAGCTTGA AATTTCTTCA AGCAAAAGAA TCTTTGTGGG AGTTAAGGCA 540ACAAGCCAGG TAAAGAATCT CCAACGCATT GTTACGTTTT CATGAACCTA TTTATTATAT 600GTTCTAAGAA AGAAAAAAAT ATCTCAAAGT AAACGTTGGA AATTTTCTGA TGAAGGGAAA 660TCCAAAGTCT TGGGTTTAGT ATCCCTATGA ATGGTATTTG GAATATGTTT TCGTCAAAAC 720AAAAGATTCT TTTCTTTTTC ACAAGAGTTA GTGATCAATA ACTTATGCAC TAATTAATGA 780GATTGGACGT ATACACAATT TGATTATGAT ACTTGAGTAA AAATCACCTG TCCTTTAATT 840TGGAAATCTC TCTTTCTTAC CCATTTATAT ACTACTTCTT TTCATTAAAA TTAAATTTCA 900ATTATCAATC ATCGTTCAAT TTGATAAAGA TTTAACATTT TTTGTCACAG GGCTAGTAAA 960AGCAATCTTT ACATAATTCA TCTTTCTTAC ATATATATAT TACCTTTTTC TTCATTAGTA1020TTCTATTTGA TTATGATTAT TTTGTCATAA AGCTAGTAAA TTAAACACTC GATATGAGAA1080TTATATTACT TCACGCTAAT TAACTCTTAA CACAACAAGA ACTAGTGCAT ATTCAACTTT1140CAAAGCATAT ACTATATATT GAGAATATAG ACCACGAAAG TCAATCAAAA GACCTACCAG1200CTCTCATCAA GTTCTTTCTT GAAATGATTT TGCAGAATTT CCAACTTAAT TAATTCGACA1260TGAATGTGAA AATGTGTGTT GCTCGTTAAG AAAATTGAAT AGAAGTACAA TGAAAATGAT1320GAGGAATGGG CAAAACACAA AAGAGTTTCC TTTCGTAACT ACAATTAATT AATGCAAATC1380TGAGAAAGGG TTCATGGATA ATGACTACAC ACATGATTAG TCATTCCCCG TGGGCTCTCT1440GCTTTCATTT ACTTTATTAG TTTCATCTTC TCTAATTATA TTGTCGCATA TATGATGCAG1500TTCTTTTGTC TAAATTACGT AATATGATGT AATTAATTAT CAAAATAAAT ATTCAAATTG1560CCGTTGGACT AACCTAATGT CCAAGATTAA GACTTGAACA TAAGAATTTT GGAAAAACTA1620AACCAGTTAT AATATATACT CTTAAATTGC CATTTCTGAA CACAACCAAA TAATAATATA1680TACTATTTAC AGTTTTTTTT AATTGGCAAG AACACTGAAA TCTTATTCAT TGTCTCGCTT1740GGTAGTTGAC AAGTTATAAC ACTCATATTC ATATAACCCC ATTCTAACGT TGACGACGAA1800CACTCATATA AACCACCCAA ATTCTTAGCA TATTAGCTAA ATATTGGTTT AATTGGAAAT1860ATTTTTTTTA TATATAAAAT GCCAGGTAAA TATTAACGAC ATGCAATGTA TATAGGAGTA1920GGGCAATAAA AAGAAAAGGA GAATAAAAAG GGATTACCAA AAAAGGAAAG TTTCCAAAAG1980GTGATTCTGA TGAGAAACAG AGCCCATACC TCTCTTTTTT CCTCTAAACA TGAAAGAAAA2040ATTGGATGGT CCTCCTTCAA TGCTCTCTCC CCACCCAATC CAAACCCAAC TGTCTTCTTT2100CTTTCTTTTT TCTTCTTTCT AATTTGATAT TTTCTACCAC TTAATTCCAA TCAATTTCAA2160ATTTCAATCT AAATGTATGC ATATAGAATT TAATTAAAAG AATTAGGTGT GTGATATTTG2220AGAAAATGTT AGAAGTAATG GTCCATGTTC TTTCTTTCTT TTTCCTTCTA TAACACTTCA2280GTTTGAAAAA AAACTACCAA ACCTTCTGTT TTCTGCAAAT GGGTTTTTAA ATACTTCCAA 2340AGAAATATTC CTCTAAAAGA AATTATAAAC CAAAACAGAA ACCAAAAACA AAAAATAAAG 2400TTGAAGCAGC AGTTAAGTGG TACTGAGATA ATAAGAATAG TATCTTTAGG CCAATGAACA 2460AATTAACTCT CTCATAATTC ATCTTCCCAT CCTCACTTCT CTTTCTTTCT GATATAATTA 2520ATCTTGCTAA GCCAGGTATG GTTATTGATG ATTTACACTT TTTTTTAAAA GTTTCTTCCT 2580TTTCTCCAAT CAAATTCTTC AGTTAATCCT TATAAACCAT TTCTTTAATC CAAGGTGTTT 2640GAGTGCAAAA GGATTTGATC TATTTCTCTT GTGTTTATAC TTCAGCTAGG GCTTATAGAA 2700ATGGAGGGTG GTGCGAGTAA TGAAGTAGCA GAGAGCAGCA AGAAGATAGG GAGAGGGAAG 2760ATAGAGATAA AGAGGATAGA GAACACTACG AATCGTCAAG TCACTTTCTG CAAACGACGC 2820AATGGTTTAC TCAAGAAAGC TTATGAGCTC TCTGTCTTGT GTGACGCTGA GGTTGCTCTT 2880GTCATCTTCT CCACTCGAGG CCGTCTCTAC GAGTACGCCA ACAACAGGTA CACATCTTTT 2940AGCTAGATCT TGATTTTGTT GAATTTTTTT TCTAGAATAA AGTTTCGACT CTTCTGGTGG 3000GTTTTTCAAT CTTTATGGTC TCTTTATAGT TTTTTTCCTT AGTTTCTCTG AAGCTCAAAT 3060CTCTTTAAAA ATCCCCAAAA TTAGGGTTTG TTTAAAACTA GGGAACCCTA CTTTAACTTC 3120TTTCTCTTAG TAAAAAAGCA GTGAGGGTCT TCTCTGATCA TTAATTAGCA TCCCCCATAC 3180CTTGTTCCAG TCACTTTTTC TCCACAAATC CTTATAACAG TATCTATATA TGTATCTATT 3240TATGTCAGTT TGTACAAGAC ACTTCGATCA ATTTGATGAC CCATCAAGTT TTATTTCTGC 3300AGATTGATCA TTAGGTTTCC ATCATAGTAA TGAAAAAGTA GGGTTcTTGA TAAAATTATA 3360ATAATATATA TTATTTGGCT ATATAAAAAA GCTATGTAGA TTCCTTAAAA ATTGATTCAC 3420TAGGGAGAGA CTAGTAGGTG TTTGTCTTCT GACACTTCTC TAATCTTTTG GTGAATCCTT 3480TTGTTAAATC AAGAAAATGA ATCAGGGACA AAGCTTATTG TTGAGTCACT TAATTAATCA 3540TCCGATCCAT CAATCAAGAA AAATAACGAA ACAGAAAATT TTGATTTTTG ATTGTTATTT 3600TCTCCACTTC AAGTTGGGGA CTTGTCATTT CCGTTTTTCT ATACGTTTCC AGCTATTAAC 3660AGCTCATGTT CATTTCACCA TTTTGATTAT TTGTCTGCTT TTTAAAGATA AATGTTTTCA 3720AAAATATTGT TTTTATTTGC TTGGCTAGTT AATACTATAA TTGAGGTTGA TGTATGACTA 3780TAATCTATAA GTCAAGTCTC ATATCATGGA TCTAAGTTAA AACTAGTAAA TTTGTAGTTT 3840CAATGTGAAC TTTCACAACG ACTAAAGAAC TGATCTGAAG TTTATAATGG ACATGACTAA 3900TTTGATTAAC AAAAGAGGAA TGCATTATGT ATGTAGAAAC ATGTGATATA TATATGTTTC 3960TATTATCAAA AGTGTAGTTA ACTTTCTTAT TTCAAACACC CTCATGCTTT AGTAGTATCT 4020TACTTTTGAC ATTTCTCAAC TTCAGCTTTC CATTATACAA CAGCACAATG TAAATTACTT 4080GTATATGAAT ATGAAAGCAT AACGTTATGC AAAGATTTCT AGCTTTTCTT TTTCTGTTTT 4140GCAAAAGATT TACAAATATC ATGTTCTTGG TAAAAACATA CTTGCCTCAG CCACATATGC 4200ATGTAAATGT AATGTTCAAA TATTAATTCA GGAAAAACAA AGAAGAAGCA AAATTAGCTT4260CTAGAGTAGG GAATCTATTG ACTTGACCTG AAAATCACTT CTTTTTCTTA AAGCCTAGTA4320GTGAATTTTT TAATCTAATT AGGCCAAAAT ATATACTAGC CTAAAATATA ATTTGGATTT4380TGTGTCGTAC ATAAATTGGG ACCAATTCCA ATTAACTAAG AGCATATGCA ATTCAAATTC4440TTTTTATTTT CTTCTCCGAT TTGCTACTTC TTTCTTTTGT ATGTTTTCAA ATTAGGATTA4500CACTTTTTTG GGGAAGTACA CATTAGGGTC TTCTCGAACT TTGATTATAC ATATATATAT4560ATATATATAT ATATAACTTT GTGAGATGTC ACTGTTAATA GATAATAGGC AATAACAATA4620ATATCCAAAA AAGAAGGCGC AAACAAATCA TATACTATAT GGTACTGGTC CATTCACTAT4680TTTGTCGGTT GAATTTAAGG TTTGGCGTAC AAACTTTGTT TCAAACCTTT ATTATTCCGT4740CTTTCTGTGT GTTTTGTATA TCCAGAAGAT AAAAATATCA ATTTCTTTAA CGACTTCATA4800TATATATATA TATATATATA TATATATATT TTTCTCTTCT GGTTTTAGTG TTTGAATCCA4860ACAGTTATAG TTTCGTGTGT CTTTGTTTTA CTTGTGGTGG TTTAAGTTTG AGATTTTCAC4920CGATTGCATC TATTTACATA TATAGCTACC ACAAAAAAGA TTGCATTTTA AAATCTTTTC4980CTTTGTGTGA ATGTTGATGA AGTGTGAGAG GAACAATAGA AAGGTACAAG AAAGCTTGCT5040CCGACGCCGT TAACCCTCCG ACCATCACCG AAGCTAATAC TCAGGTTAGC TTTTAATTAA5100TACACCTAGC TAGCTAGTTC GTTAATTACT TAATTTCTTC TTCTTTTAGT TATCTGACCT5160TTTTTTCACC TCTTGTAACA ATGATGGGAT CGAAATTGAT GAAGTACTAT CAGCAAGAGG5220CGTCTAAACT CCGGAGACAG ATTCGGGACA TTCAGAATTT GAACAGACAC ATTCTTGGTG5280AATCTCTTGG TTCCTTGAAC TTTAAGGAAC TCAAGAAcCT TGAAAGTAGG CTTGAGAAAG5340GAATCAGTCG TGTCCGATcc AAGAAGGTAC ATCACTAACT CTCCATCAAT CTCCTTATCA5400TTGAATATAT ATCCATCTGA TTCTTGCCCG TTATATTTGG TTTTTCTCTC CAGCACGAGA5460TGTTAGTTGC AGAGATTGAA TACATGCAAA AAAGGGTAAA AGTAAAACCT ATCTTCCTTC5520ACAATGAACT ACCCCTACTT TATTAGCAAC TTCTCTTTCT GATGATCATC TTTTTTATTT5580TCTGTTGTCG CTTGCATTGT AGGAAATCGA GCTGCAAAAC GATAACATGT ATCTCCGCTC5640CAAGGTTTTA TACATAACTC TTTTTGGCAT TTTTGATCAT CATTTTTTTC CGGTAGACAA5700TCTCTTGATG TGCAAATTCT AAATATCTCT GCAGATTACT GAAAGAACAG GTCTACAGCA5760ACAAGAATCG AGTGTGATAC ATCAAGGGAC AGTTTACGAG TCGGGTGTTA CTTCTTCTCA5820CCAGTCGGGG CAGTATAACC GGAATTATAT TGCGGTTAAC CTTCTTGAAC CGAATCAGAA5880TTCCTCCAAC CAAGACCAAC CACCTCTGCA ACTTGTTTGA TTCAGTCTAA CATAAGCTTC5940TTTCCTCAGC CTGAGATCGA TCTATAGTGT CACCTAAATG CGGCCGCGTC CCTCAACATC6000TAGTCGCAAG CTGAGGGGAA CCACTAGTGT CATACGAACC TCCAAGAGAC GGTTACACAA6060ACGGGTACAT TGTTGATGTC ATGTATGACA ATCGCCCAAG TAAGTATCCA GCTGTGTTCA6120GAACGTACGT CCGAATTC 6138(2)SEQ ID NO5的信息(i)序列特征(A)长度896个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(ii)分子类型cDNA(ix)特性(A)名称/要点CDS(B)位置7..753(ix)特性(A)名称/要点misc_feature(B)位置896(D)其他信息/注=″cDNA序列的末端有poly(A)尾″(ix)特性(A)名称/要点misc_feature(B)位置1..896(D)其他信息/注=″AGL1 cDNA的核苷酸和推导的蛋白质序列″(xi)序列描述SEQ ID NO5GGATCA ATG GAG GAA GGT GGG AGT AGT CAC GAC GCA GAG AGT AGC AAG 48Met Glu Glu Gly Gly Ser Ser His Asp Ala Glu Ser Ser Lys1 5 10AAA CTA GGG AGA GGG AAA ATA GAG ATA AAG AGG ATA GAG AAC ACA ACA 96Lys Leu Gly Arg Gly Lys Ile Glu Ile Lys Arg Ile Glu Asn Thr Thr15 20 25 30AAT CGT CAA GTT ACT TTC TGC AAA CGA CGC AAT GGT CTT CTC AAG AAA 144Asn Arg Gln Val Thr Phe Cys Lys Arg Arg Asn Gly Leu Leu Lys Lys35 40 45GCT TAT GAA CTC TCT GTC TTG TGT GAT GCC GAA GTT GCC CTC GTC ATC 192Ala Tyr Glu Leu Ser Val Leu Cys Asp Ala Glu Val Ala Leu Val Ile50 55 60TTC TCC ACT CGT GGC CGT CTC TAT GAG TAC GCC AAC AAC AGT GTG AGG 240Phe Ser Thr Arg Gly Arg Leu Tyr Glu Tyr Ala Asn Asn Ser Val Arg65 70 75GGT ACA ATT GAA AGG TAC AAG AAA GCT TGT TCC GAT GCC GTC AAC CCT 288Gly Thr Ile Glu Arg Tyr Lys Lys Ala Cys Ser Asp Ala Val Asn Pro80 85 90CCT TCC GTC ACC GAA GCT AAT ACT CAG TAC TAT CAG CAA GAA GCC TCT 336Pro Ser Val Thr Glu Ala Asn Thr Gln Tyr Tyr Gln Gln Glu Ala Ser95 100 105 110AAG CTT CGG AGG CAG ATT CGA GAT ATT CAG AAT TCA AAT AGG CAT ATT384Lys Leu Arg Arg Gln Ile Arg Asp Ile Gln Asn Ser Asn Arg His Ile115 120 125GTT GGG GAA TCA CTT GGT TCC TTG AAC TTC AAG GAA CTC AAA AAC CTA432Val Gly Glu Ser Leu Gly Ser Leu Asn Phe Lys Glu Leu Lys Asn Leu130 135 140GAA GGA CGT CTT GAA AAA GGA ATC AGC CGT GTC CGC TCC AAA AAG AAT480Glu Gly Arg Leu Glu Lys Gly Ile Ser Arg Val Arg Ser Lys Lys Asn145 150 155GAG CTG TTA GTG GCA GAG ATA GAG TAT ATG CAG AAG AGG GAA ATG GAG528Glu Leu Leu Val Ala Glu Ile Glu Tyr Met Gln Lys Arg Glu Met Glu160 165 170TTG CAA CAC AAT AAC ATG TAC CTG CGA GCA AAG ATA GCC GAA GGC GCC576Leu Gln His Asn Asn Met Tyr Leu Arg Ala Lys Ile Ala Glu Gly Ala175 180 185 190AGA TTG AAT CCG GAC CAG CAG GAA TCG AGT GTG ATA CAA GGG ACG ACA624Arg Leu Asn Pro Asp Gln Gln Glu Ser Ser Val Ile Gln Gly Thr Thr195 200 205GTT TAC GAA TCC GGT GTA TCT TCT CAT GAC CAG TCG CAG CAT TAT AAT672Val Tyr Glu Ser Gly Val Ser Ser His Asp Gln Ser Gln His Tyr Asn210 215 220CGG AAC TAT ATT CCG GTG AAC CTT CTT GAA CCG AAT CAG CAA TTC TCC720Arg Asn Tyr Ile Pro Val Asn Leu Leu Glu Pro Asn Gln Gln Phe Ser225 230 235GGC CAA GAC CAA CCT CCT CTT CAA CTT GTG TAACTCAAAA CATGATAACT 770Gly Gln Asp Gln Pro Pro Leu Gln Leu Val240 245TGTTTCTTCC CCTCATAACG ATTAAGAGAG AGACGAGAGA GTTCATTTTA TATTTATAAC 830GCGACTGTGT ATTCATAGTT TAGGTTCTAA TAATGATAAT AACAAAACTG TTGTTTCTTT 890GCTTCA 896(2)SEQ ID NO6的信息(i)序列特征(A)长度248个氨基酸(B)类型氨基酸(D)拓扑线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO6Met Glu Glu Gly Gly Ser Ser His Asp Ala Glu Ser Ser Lys Lys Leu1 5 10 15Gly Arg Gly Lys Ile Glu Ile Lys Arg Ile Glu Asn Thr Thr Asn Arg20 25 30Gln Val Thr Phe Cys Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala Tyr35 40 45Glu Leu Ser Val Leu Cys Asp Ala Glu Val Ala Leu Val Ile Phe Ser50 55 60Thr Arg Gly Arg Leu Tyr Glu Tyr Ala Asn Asn Ser Val Arg Gly Thr65 70 75 80Ile Glu Arg Tyr Lys Lys Ala Cys Ser Asp Ala Val Asn Pro Pro Ser85 90 95Val Thr Glu Ala Asn Thr Gln Tyr Tyr Gln Gln Glu Ala Ser Lys Leu100 105 110Arg Arg Gln Ile Arg Asp Ile Gln Asn Ser Asn Arg His Ile Val Gly115 120 125Glu Ser Leu Gly Ser Leu Asn Phe Lys Glu Leu Lys Asn Leu Glu Gly130 135 140Arg Leu Glu Lys Gly Ile Ser Arg Val Arg Ser Lys Lys Asn Glu Leu145 150 155 160Leu Val Ala Glu Ile Glu Tyr Met Gln Lys Arg Glu Met Glu Leu Gln165 170 175His Asn Asn Met Tyr Leu Arg Ala Lys Ile Ala Glu Gly Ala Arg Leu180 185 190Asn Pro Asp Gln Gln Glu Ser Ser Val Ile Gln Gly Thr Thr Val Tyr195 200 205Glu Ser Gly Val Ser Ser His Asp Gln Ser Gln His Tyr Asn Arg Asn210 215 220Tyr Ile Pro Val Asn Leu Leu Glu Pro Asn Gln Gln Phe Ser Gly Gln225 230 235 240Asp Gln Pro Pro Leu Gln Leu Val245(2)SEQ ID NO7的信息(i)序列特征(A)长度959个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(ii)分子类型cDNA(ix)特性(A)名称/要点CDS(B)位置78..818(ix)特性(A)名称/要点misc_feature(B)位置1..959(D)其他信息/注=″AGL5 cDNA的核苷酸和推导的蛋白质序列″(xi)序列描述SEQ ID NO7GAATTCATCT TCCCATCCTC ACTTCTCTTT CTTTCTGATC ATAATTAATC TTGCTAAGCC 60AGCTAGGGCT TATAGAA ATG GAG GGT GGT GCG AGT AAT GAA GTA GCA GAG 110Met Glu Gly Gly Ala Ser Asn Glu Val Ala Glu1 5 10AGC AGC AAG AAG ATA GGG AGA GGG AAG ATA GAG ATA AAG AGG ATA GAG158Ser Ser Lys Lys Ile Gly Arg Gly Lys Ile Glu Ile Lys Arg Ile Glu15 20 25AAC ACT ACG AAT CGT CAA GTC ACT TTC TGC AAA CGA CGC AAT GGT TTA206Asn Thr Thr Asn Arg Gln Val Thr Phe Cys Lys Arg Arg Asn Gly Leu30 35 40CTC AAG AAA GCT TAT GAG CTC TCT GTC TTG TGT GAC GCT GAG GTT GCT254Leu Lys Lys Ala Tyr Glu Leu Ser Val Leu Cys Asp Ala Glu Val Ala45 50 55CTT GTC ATC TTC TCC ACT CGA GGC CGT CTC TAC GAG TAC GCC AAC AAC302Leu Val Ile Phe Ser Thr Arg Gly Arg Leu Tyr Glu Tyr Ala Asn Asn60 65 70 75AGT GTG AGA GGA ACA ATA GAA AGG TAC AAG AAA GCT TGC TCC GAC GCC350Ser Val Arg Gly Thr Ile Glu Arg Tyr Lys Lys Ala Cys Ser Asp Ala80 85 90GTT AAC CCT CCG ACC ATC ACC GAA GCT AAT ACT CAG TAC TAT CAG CAA398Val Asn Pro Pro Thr Ile Thr Glu Ala Asn Thr Gln Tyr Tyr Gln Gln95 100 105GAG GCG TCT AAA CTC CGG AGA CAG ATT CGG GAC ATT CAG AAT TTG AAC446Glu Ala Ser Lys Leu Arg Arg Gln Ile Arg Asp Ile Gln Asn Leu Asn110 115 120AGA CAC ATT CTT GGT GAA TCT CTT GGT TCC TTG AAC TTT AAG GAA CTC494Arg His Ile Leu Gly Glu Ser Leu Gly Ser Leu Asn Phe Lys Glu Leu125 130 135AAG AAC CTT GAA AGT AGG CTT GAG AAA GGA ATC AGT CGT GTC CGA TCC542Lys Asn Leu Glu Ser Arg Leu Glu Lys Gly Ile Ser Arg Val Arg Ser140 145 150 155AAG AAG CAC GAG ATG TTA GTT GCA GAG ATT GAA TAC ATG CAA AAA AGG590Lys Lys His Glu Met Leu Val Ala Glu Ile Glu Tyr Met Gln Lys Arg160 165 170GAA ATC GAG CTG CAA AAC GAT AAC ATG TAT CTC CGC TCC AAG ATT ACT638Glu Ile Glu Leu Gln Asn Asp Asn Met Tyr Leu Arg Ser Lys Ile Thr175 180 185GAA AGA ACA GGT CTA CAG CAA CAA GAA TCG AGT GTG ATA CAT CAA GGG686Glu Arg Thr Gly Leu Gln Gln Gln Glu Ser Ser Val Ile His Gln Gly190 195 200ACA GTT TAC GAG TCG GGT GTT ACT TCT TCT CAC CAG TCG GGG CAG TAT734Thr Val Tyr Glu Ser Gly Val Thr Ser Ser His Gln Ser Gly Gln Tyr205 210 215AAC CGG AAT TAT ATT GCG GTT AAC CTT CTT GAA CCG AAT CAG AAT TCC782Asn Arg Asn Tyr Ile Ala Val Asn Leu Leu Glu Pro Asn Gln Asn Ser220 225 230 235TCC AAC CAA GAC CAA CCA CCT CTG CAA CTT GTT TGATTCAGTC TAACATAAGC 835Ser Asn Gln Asp Gln Pro Pro Leu Gln Leu Val240 245TTCTTTCCTC AGCCTGAGAT CGATCTATAG TGTCACCTAA ATGCGGCCGC GTCCCTCAAC 895ATCTAGTCGC AAGCTGAGGG GAACCACTAG TGTCATACGA ACCTCCAAGA GACGGTTACA 955CAAA 959(2)SEQ ID NO8的信息(i)序列特征(A)长度246个氨基酸(B)类型氨基酸(D)拓扑线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO8Met Glu Gly Gly Ala Ser Asn Glu Val Ala Glu Ser Ser Lys Lys Ile1 5 10 15Gly Arg Gly Lys Ile Glu Ile Lys Arg Ile Glu Asn Thr Thr Asn Arg20 25 30Gln Val Thr Phe Cys Lys Arg Arg Asn Gly Leu Leu Lys Lys Ala Tyr35 40 45Glu Leu Ser Val Leu Cys Asp Ala Glu Val Ala Leu Val Ile Phe Ser50 55 60Thr Arg Gly Arg Leu Tyr Glu Tyr Ala Asn Asn Ser Val Arg Gly Thr65 70 75 80Ile Glu Arg Tyr Lys Lys Ala Cys Ser Asp Ala Val Asn Pro Pro Thr85 90 95Ile Thr Glu Ala Asn Thr Gln Tyr Tyr Gln Gln Glu Ala Ser Lys Leu100 105 110Arg Arg Gln Ile Arg Asp Ile Gln Asn Leu Asn Arg His Ile Leu Gly115 120 125Glu Ser Leu Gly Ser Leu Asn Phe Lys Glu Leu Lys Asn Leu Glu Ger130 135 140Arg Leu Glu Lys Gly Ile Ser Arg Val Arg Ser Lys Lys His Glu Met145 150 155 160Leu Val Ala Glu Ile Glu Tyr Met Gln Lys Arg Glu Ile Glu Leu Gln165 170 175Asn Asp Asn Met Tyr Leu Arg Ser Lys Ile Thr Glu Arg Thr Gly Leu180 185 190Gln Gln Gln Glu Ser Ser Val Ile His Gln Gly Thr Val Tyr Glu Ser195 200 205Gly Val Thr Ser Ser His Gln Ser Gly Gln Tyr Asn Arg Asn Tyr Ile210 215 220Ala Val Asn Leu Leu Glu Pro Asn Gln Asn Ser Ser Asn Gln Asp Gln225 230 235 240Pro Pro Leu Gln Leu Val245(2)SEQ ID NO9的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(ix)特性(A)名称/要点misc_feature(B)位置1..27(D)其他信息/注=″引物AGL8 5-4″(xi)序列描述SEQ ID NO9CCGTCGACGA TGGGAAGAGG TAGGGTT 27(2)SEQ ID NO10的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链性单链
(D)拓扑线性(ix)特性(A)名称/要点misc_feature(B)位置1..20(D)其他信息/注=″引物OAM14″(xi)序列描述SEQ ID NO10AATCATTACC AAGATATGAA 20(2)SEQ ID NO11的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO11CGGATAGCTC GAATATCG18(2)SEQ ID NO12的信息(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO12AACATTGCGT CGTTTGC 17(2)SEQ ID NO13的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO13GTAATTACCA GGCAAGGACT CTCC 24(2)SEQ ID NO14的信息(i)序列特征(A)长度24个碱基对(B)类型核酸
(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO14GTCATCGGCG GGGGTCATAA CGTG 24(2)SEQ ID NO15的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO15GAGGATAGAG AACACTACGA ATCG 24(2)SEQ ID NO16的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO16CAGGTCAAGT CAATAGATTC 20(2)SEQ ID NO17的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO17CAGAATTTAG TGAATAATAT TG 22(2)SEQ ID NO18的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO18GCCAGAGATA ATGCTATTCC 20(2)SEQ ID NO19的信息(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO23CATTGATCCA TATATGACAT CAC 23(2)SEQ ID NO20的信息(i)序列特征(A)长度41个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO20GTGATGTCAT ATATGGATCA ATGGGAAGAG GTAGGGTTCA G 41(2)SEQ ID NO21的信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO21CAAGAGTCGG TGGAATATTC G21(2)SEQ ID NO22的信息(i)序列特征(A)长度41个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO22CGAATATTCC ACCGACTCTT GGTACGCTTC TCCTACTCTA T 41(2)SEQ ID NO23的信息(i)序列特征
(A)长度21个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO23CTAATAAGTA AGATCGCGGA A21(2)SEQ ID NO24的信息(i)序列特征(A)长度41个碱基对(B)类型核酸(C)链性单链(D)拓扑线性(xi)序列描述SEQ ID NO24TTCCGCGATC TTACTTATTA GCATGGAGAG GATACTTGAA C 4权利要求
1.一种非天然存在的、含有异位表达的编码AGL-8类的基因产物的核酸分子的种子植物,所述的种子植物具有迟发性种子散布的特性。
2.如权利要求1所述的非天然存在的种子植物,其中所述的AGL-8类的基因产物基本上具有AGL8定向进化同源物的氨基酸序列。
3.如权利要求2所述的非天然存在的种子植物,其中所述的AGL-8类的基因产物具有拟南芥属AGL8的氨基酸序列(SEQ IDNO2)。
4.如权利要求3所述的非天然存在的种子植物,其是转基因种子植物。
5.如权利要求4所述的转基因种子植物,其中所述的异位表达的编码AGL-8类的基因产物的核酸分子与一个外源调控因子可操纵相连。
6.如权利要求5所述的转基因种子植物,其中所述的外源调控因子是组成型调控因子。
7.如权利要求6所述的转基因种子植物,其中所述的核酸分子包括与花椰菜花叶病毒35S启动子可操纵相连的基本上编码AGL8定向进化同源物的氨基酸序列的外源核酸分子。
8.如权利要求5所述的转基因种子植物,其中所述的外源调控因子是熟裂区域选择性调控因子。
9.如权利要求8所述的转基因种子植物,其中所述的熟裂区域选择性调控因子选自AGL1调控因子和AGL5调控因子。
10.如权利要求9所述的转基因种子植物,其中所述的编码AGL-8类的基因产物的核酸分子是基本上编码AGL8定向进化同源物的氨基酸序列的外源核酸分子。
11.如权利要求10所述的转基因种子植物,其中所述的AGL-8类的基因产物具有拟南芥属AGL8的氨基酸序列(SEQ ID NO2)。
12.如权利要求9所述的转基因种子植物,其中所述的熟裂区域选择性调控因子是含有选自如下一组的核苷酸序列的至少15个连续核苷酸的AGL1调控因子SEQ ID NO3中第1至第2599位核苷酸;SEQ ID NO3中第2833至第4128位核苷酸;SEQ ID NO3中第4211至第4363位核苷酸;SEQ ID NO3中第4426至第4554位核苷酸;SEQ ID NO3中第4655至第4753位核苷酸;SEQ ID NO3中第4796至第4878位核苷酸;SEQ ID NO3中第4921至第5028位核苷酸;和SEQ ID NO3中第5421至第5682位核苷酸
13.如权利要求9所述的转基因种子植物,其中所述的熟裂区域选择性调控因子是含有选自如下一组的核苷酸序列的至少15个连续核苷酸的AGL5调控因子SEQ ID NO4中第1至第1888位核苷酸;SEQ ID NO4中第2928至第5002位核苷酸;SEQ ID NO4中第5085至第5204位核苷酸;SEQ ID NO4中第5367至第5453位核苷酸;SEQ ID NO4中第5496至第5602位核苷酸;SEQ ID NO4中第5645至第5734位核苷酸;和SEQ ID NO4中第6062至第6138位核苷酸
14.如权利要求1所述的非天然存在的种子植物,其是熟裂型的种子植物。
15.如权利要求14所述的非天然存在的种子植物,其是十字花科的成员。
16.如权利要求14所述的非天然存在的种子植物,其是豆科成员。
17.一种非天然存在的、AGL1的表达和AGL5的表达都被抑制的种子植物,所述的种子植物具有迟发性种子散布的特性。
18.如权利要求17所述的非天然存在的种子植物,其是agl1agl5双突变体。
19.来自非天然存在的种子植物的组织,所述的种子植物含有异位表达的编码AGL-8类的基因产物的核酸分子并具有迟发性种子散布的特性。
20.如权利要求19所述的组织,其是种子。
21.来自非天然存在的种子植物的组织,所述的种子植物中AGL1的表达和AGL5的表达都被抑制,所述的种子植物具有迟发性种子散布的特性。
22.如权利要求21所述的组织,其是种子。
23.产生非天然存在的具有迟发性种子散布的特性的种子植物的方法,包括在所述的种子植物中异位表达编码AGL-8类的基因产物的核酸分子,因而由于所述的核酸分子的异位表达种子散布被延迟。
24.一种基本纯化的熟裂区域选择性调控因子,含有能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的核苷酸序列,条件是该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703位核苷酸所构成的核苷酸序列。
25.如权利要求24所述的基本纯化的熟裂区域选择性调控因子,选自AGL1调控因子和AGL5调控因子。
26.如权利要求25所述的基本纯化的熟裂区域选择性调控因子,其中AGL1调控因子含有选自下列一组的核苷酸序列的至少15个连续核苷酸SEQ ID NO3中第1至第2599位核苷酸;SEQ ID NO3中第2833至第4128位核苷酸;SEQ ID NO3中第4211至第4363位核苷酸;SEQ ID NO3中第4426至第4554位核苷酸;SEQ ID NO3中第4655至第4753位核苷酸;SEQ ID NO3中第4796至第4878位核苷酸;SEQ ID NO3中第4921至第5028位核苷酸;和SEQ ID NO3中第5361至第5622位核苷酸
27.如权利要求25所述的基本纯化的熟裂区域选择性调控因子,其中AGL5调控因子含有选自下列一组的核苷酸序列的至少15个连续核苷酸SEQ ID NO4中第1至第1888位核苷酸;SEQ ID NO4中第2928至第5002位核苷酸;SEQ ID NO4中第5085至第5204位核苷酸;SEQ ID NO4中第5367至第5453位核苷酸;SEQ ID NO4中第5496至第5602位核苷酸;SEQ ID NO4中第5645至第5734位核苷酸;和SEQ ID NO4中第6062至第6138位核苷酸
28.一种含有熟裂区域选择性调控因子的植物表达载体。
29.产生具有迟发性种子散布的特性的转基因种子植物的试剂盒,其包括熟裂区域选择性调控因子,该调控因子具有能使与其可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的核苷酸序列,条件是该熟裂区域选择性调控因子不具有SEQ ID NO4中的第1889至2703位核苷酸所构成的核苷酸序列。
30.如权利要求29所述的试剂盒,其中所述的熟裂区域选择性调控因子与编码AGL-8类的基因产物的核酸分子可操纵相连。
全文摘要
本发明提供了一种非天然存在的种子植物,它由于编码AGL-8类的基因产物的核酸分子的异位表达因而具有了迟发性种子散布的特性。本文还提供了一种非天然存在的种子植物,诸如agl1 agl5双突变化,由于该种子植物中AGL-1和AGL-5表达的抑制因而它具有了迟发性种子散布的特性。本发明还提供了一种基本纯化的熟裂区域选择性调控因子,它包括能使与之可操纵相连的核酸分子在种子植物的壳瓣边缘或熟裂区域中选择性表达的核苷酸序列。本发明还提供了用以生产具有迟发性种子散布的特性的转基因种子植物的试剂盒,该试剂盒含有熟裂区域选择性调控因子。
文档编号C12N15/29GK1271388SQ98808448
公开日2000年10月25日 申请日期1998年6月25日 优先权日1997年6月27日
发明者马丁·F·亚诺夫斯基, 克里斯蒂娜·费兰迪斯 申请人:加利福尼亚大学董事会