专利名称:调节作物中高水平组织优选表达的多核苷酸的制作方法
专利说明调节作物中高水平组织优选表达的多核苷酸 发明领域 本发明涉及农业生物技术领域。本文公开了能够指导作物中高水平组织优选表达的分离的核酸,以及包含这样的核酸的表达载体,和由其产生的植物。
背景技术:
在农学重要的谷类作物中,种子形成是植物发育的最终目标。将种子收获用于食品、饲料及工业产品。这些种子的用途和价值由种子中所含有的蛋白质、油和淀粉的数量和品质决定。于是,所产生的种子的品质和数量可能在受精前至种子成熟的任何时点上受环境条件影响。尤其,在受精时刻及其附近的胁迫可以明显地影响种子发育。包括谷类谷粒(cereal grain)在内的禾本科(Poaceae)成员产生干的单种子果实。严格地说,这种类型的果实是颖果,但通常叫做核(kernel)或谷粒(grain)。核或谷粒包括种子和它的种皮(coat)或果皮。种子包括胚或胚芽,由珠心表皮包被的胚乳,以及种皮。胚是下一代的微型祖先,包括用于新植株的根和苗生长的细胞。这也是油和蛋白质在核中的贮存组织。胚乳更多是作为营养组织起作用,并以所需的贮存淀粉、蛋白质和油的形式为胚发芽及最初的生长提供所需的能量。
考虑到高等植物中核生长过程中发生的复杂调控,而且谷物是动物和人类共同的主要营养来源,用以改进这样的营养来源所需的关键的工具包括基因启动子,其可以驱动提高营养的基因的表达。另一方面,核对胁迫很敏感。针对植物的胁迫可以由生物介质和非生物介质引起。例如,胁迫的生物原因包括病原体感染、昆虫采食及被另一种植物(如槲寄生)寄生以及反刍动物啃食。非生物性胁迫例如包括过量或不充分的可用水、不充分的光照、极端温度、人工化学品(如除草剂)、大风、土壤极端pH、受限的营养获得性和空气污染。然而,利用多种内部机制及外部机制以躲避或耐受胁迫,植物存活下来并且经常枝繁叶茂,甚至在不利条件下也是如此。植物对胁迫的生理应答反映在基因表达方面的改变。
尽管操作胁迫诱导型基因可能在改善植物的胁迫耐受性方面发挥重要作用,然而已经证实当胁迫不存在时,胁迫诱导型基因的组成型表达严重不利地影响植物生长和发育。因此,本领域需要驱动具有时间和/或空间差异性地表达的启动子,旨在提供在重要时间处控制并指导在特定细胞或组织中基因表达的工具,尤其旨在提供胁迫耐受性或躲避。尤其,玉米的干旱胁迫和/或密度胁迫经常导致减产。为稳定在不利环境下的植物发育及谷粒产量,调节种子萌发期间对核的激素和营养供应是有意义的。因此,需要在正常或非生物胁迫条件下驱动胚乳、胚或核中基因表达的转录调节元件。
描述了在种子或谷粒成熟期间赋予表达增强的启动子,如大麦(barley)的大麦醇溶蛋白启动子;见美国专利申请20040088754。在双子叶植物中指导胚特异性或种子特异性表达的启动子(例如大豆(soybean)伴大豆球蛋白启动子;Chen 1988;油菜籽蛋白启动子,Kridl 1991)通常不能在单子叶植物中指导相似的表达。不幸地是,相当少的启动子被鉴定为特异性指导此方面的生理学(见例如US 20040163144)。
所描述的种子特异性或谷粒特异性启动子包括与编码植物种子贮藏蛋白的基因(如编码大麦的大麦醇溶蛋白、稻(rice)的稻谷蛋白、水稻素、谷醇溶蛋白或球蛋白;小麦(wheat)的麦醇溶蛋白或麦谷蛋白;玉米(maize)的玉米醇溶蛋白或谷蛋白;燕麦(oat)的谷蛋白;高粱(sorghum)的高粱醇溶蛋白;黍(millet)pennisetins或黑麦(rye)的裸麦醇溶蛋白的基因)相关的那些启动子。然而,这些启动子的表达往往是渗漏的,或是低表达水平的。此外,用多个转基因(“堆积”)改良作物植物的兴趣正在增长。例如,单个玉米杂交体可以包含不仅赋予昆虫抗性,也赋予特定除草剂抗性的重组DNA。然而,当用同一的调控序列来驱动多基因表达时,常常会观察到基因沉默的现象。作物的代谢工程可能需要多个新的DNA调控序列,其驱动同一植物中不同转基因以组织或时间上特异形式的表达。
因此,本领域迫切需要鉴定可以用于经济重要的植物中表达所选择的转基因的新序列。本领域还需要在早期种子发育期间允许在胚乳或核中表达的转录调节序列。因此,本发明的一个目的是提供用于胚乳优选或核优选表达的新颖和备选的调控序列。该目的由本发明实现。
发明概述 本发明涉及农业生物技术领域。本文公开了能够指导作物中高水平组织优选表达的分离的核酸,以及包含这样的核酸的表达载体,和其产生的植物。
因此,本发明的第一个实施方案中涉及分离的植物转录调控元件,其包含的多核苷酸选自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有这样的片段的多核苷酸,该片段具有如SEQ IDNO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸;d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及e)与a)至d)中的任何多核苷酸互补的多核苷酸。
在一个实施方案中,该植物转录调控元件调节植物或者植物细胞中目的基因的胚乳优选表达。在另一实施方案中,该植物或植物细胞是单子叶植物或双子叶植物。本领域内技术人员能认识到这种植物或植物细胞可以是,但不局限于,玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、黑麦草、豌豆、苜蓿、大豆、胡萝卜、芹菜、番茄、马铃薯、棉花、烟草、胡椒、油菜、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥(Arabidopsis thaliana)。此外,本领域内技术人员能认识到,植物转录调控元件可有效地与一个或多个核酸连接。
而另一个实施方案涉及,用分离的植物转录调控元件转化植物,该植物转录调控元件包括的多核苷酸选自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸; d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及 e)与a)至d)中的任何多核苷酸互补的多核苷酸。
在一个实施方案中,该植物转录调控元件有效地与一个或多个异源核酸连接。这些异源核酸编码的多肽使植物具有这样的特征或者特性,该特征或者特性选自增加产量、胁迫条件下增强抗性、增加营养品质、增加或改变淀粉含量、和/或增加或改变种子或芽的含油量。该增加的营养品质和/或含油量可能包括增加至少一种化合物的含量,该化合物选自维生素、类胡萝卜素、抗氧化剂、不饱和脂防酸、多不饱和脂防酸或其氨基酸含量改变的蛋白质。同样优选的是,该表达载体中功能性连接的核酸的转录导致了蛋白质的表达或功能性核苷酸的表达,该表达能够影响靶植物中至少一个基因的功能。该功能RNA至少包括反义RNA、有义RNA、双链RNA(dsRNA)、微RNA、小干扰RNA(siRNA)或其组合。
在另一实施方案中,该有效连接的异源核酸所表达的调控RNA选自dsRNA、siRNA和微RNA(miRNA)。在又一个实施方案中,该转录调控元件调节一个或多个有效地连接的核酸的胚乳优选表达。在另一实施方案中,该植物是单子叶植物或双子叶植物。本领域内技术人员能认识到,该植物可以是,但不局限于,玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、黑麦草、豌豆、苜蓿、大豆、胡萝卜、芹菜、西红柿、马铃薯、棉花、烟草、胡椒、油菜、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥。
本发明的其他实施方案涉及核酸构建体或表达载体,其包括有效地与一个或多个异源核酸连接的植物转录调控序列。
本发明的一个实施方案提供了由转基因植物生产的种子,该转基因植物用有效地与一个或多个核酸连接的转录调控元件转化。该通过转基因植物产生的种子表达的蛋白质或功能RNA能够影响靶植物中至少一个基因的功能。其中该种子或植物具有在胁迫条件下增强的抗性、和/或增加的产量、和/或增加的营养品质、和/或增加或改变的淀粉含量、和/或增加或改变的种子或芽的油含量。在另一实施方案中,该种子或植物是单子叶植物或双子叶植物。在又一实施方案中,该种子或植物选自玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、和黑麦草。
本发明的另一实施方案涉及一种方法,其用于使植物增加产量、增加胁迫耐性、增加营养品质、提高营养价值、增加或改变淀粉含量、和/或增加或改变种子或芽的含油量,其中该方法包括这些步骤 1)向植物细胞或植物中引入表达载体,该载体包括 A)植物转录调控元件,其选自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸; d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及 e)与a)至d)中的任何多核苷酸互补的多核苷酸; 该植物转录调控元件有效地与一个或多个异源核酸连接; B)其中该有效地连接的核酸编码的多肽或RNA能够使植物增加产量、增加胁迫耐性、增加营养品质、提高营养价值、增加或改变淀粉或者增加或改变植物的油含量; 2)筛选转基因植物,其中该植物相对于野生型或无效分离子(nullsegregant)植物具有增加的产量,胁迫条件下增强的抗性、增加的营养品质、增加的营养价值、增加或改变的淀粉含量,或者增加或改变该植物的种子或芽的含油量。
用来获得产量和/或胁迫抗性的各种核酸是本领域内技术人员已知。该核酸可以包括但不局限于编码多肽的多核苷酸,该多肽参与生物合成植物激素、植物激素调节、细胞周期调控、或碳水化合物的代谢。营养品质、营养价值、淀粉含量和含油量的定义如下。
本发明的另一实施方案涉及分离的植物转录终止元件,其包括的多核苷酸选自 a.具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸; b.与SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸有70%的序列同一性的多核苷酸; c.具有这样的片段的多核苷酸,该片段具有如SEQ ID NO4或者SEQID NO5所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸; d.多核苷酸,其在严格地条件下与包括具有如SEQ ID NO4或者SEQID NO5所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及 e)与a)至d)中的任何多核苷酸互补的多核苷酸。
附图概述
图1展示了玉米SSI启动子区(pEXS1033)(SEQ ID NO1)。
图2展示了质粒pEXS1032中的玉米SSI启动子(mutNcoINdeI)区(SEQ ID NO2)。
图3展示了OsSSI启动子(pEXS1031)(SEQ ID NO3)。
图4展示了质粒RLM661中的OsSSI终止子(t-OSSSI-3)(SEQ IDNO4)。
图5展示了质粒RLM662中的OsSSI终止子(t-OSSSI-5)(SEQ IDNO5)。
图6a和6b展示了SEQ ID NO1和SEQ ID NO2的序列比对。该项分析是利用Fast运算法则用Vector NTI软件包执行(缺口开口15,缺口延伸6.66和缺口分离8,矩阵是swgapdnamt)。
发明详述 除非另有说明,本文所使用的术语应按照相关领域内的普通技术人员的常规用法理解。分子生物学中常用术语的定义,可以在该领域内技术人员已知的许多参考资料中找到,包括但不局限于,Rieger等,1991 Glossaryof geneticsclassical and molecular,第5版,BerlinSpringer-Verlag;和Current Protocols in Molecular Biology,F.M.Ausubel等合编,CurrentProtocols,Greene Publishing Associates出版公司和John Wiley & Sons出版公司的短期合伙,(1998年增刊)。
必须注意的是,在本文和所附的权利要求书中使用时,除非上下文另有明确规定,单数形式“一个/种”或“该”包括复数。
如本文中所用,词语“或”意指特定列举的任一成员并且也包括所列举成员的任意组合。
术语“约”在本文中用来意指大约地、粗略地、左右或在……范围内。当术语“约”与数字范围相连使用时,该术语通过延伸边界值高于和低于所述值而修饰这个范围。通常,术语“约”在本文中用来以高于和低于一个数字值的10%以上或以下(之上或之下)的变异修饰所述值。
在本文使用的术语“核酸”、“核苷酸”或“多核苷酸”旨在包括DNA分子(例如cDNA或基因组DNA)、RNA分子(例如mRNA)、天然存在、突变、合成的DNA或RNA分子、以及使用核苷酸类似物产生的DNA或RNA的类似物。可以是单链或者双链。这种核酸或多核苷酸包括但不限于结构基因的编码序列、反义序列、不编码mRNA或蛋白质产物的非编码调控序列。多核苷酸可以编码有价值的农艺性状或表型特性。
术语“基因”广泛用于指任何与生物功能相关的核酸片段。因此,基因包括基因组序列中的内含子和外显子,或者就是cDNA中的编码序列和/或其表达所需的调控序列。例如,基因是指表达mRNA或功能RNA、或者编码特定蛋白质的核酸片段,且包括调控序列。
本文可互换使用的术语“多肽”和“蛋白质”指的是连续氨基酸残基的聚合物。
本文所使用的术语“转基因”是指通过实验操作引入到细胞基因组中的任何多核苷酸。转基因可以是“内源DNA”、或“异源DNA”。“内源DNA”是指在所导入的细胞中天然存在的多核苷酸,只要其相对于自然存在的多核苷酸不包含任何的修饰。“异源DNA”是指多核苷酸,其与这样的多核苷酸连接,该多核苷酸在自然中不与之相连,或者该多核苷酸在自然中在不同位置与之相连。外源DNA并不是在其引入的细胞中内生的,而从另一个细胞中获得。异源DNA可以包括包含了一些修饰的内源DNA。
本文所使用的“细胞”或“植物细胞”是指单个细胞,也包括细胞群体。该群可以是包含一种类型细胞的纯的种群。同样,该群体可以包含一种以上的细胞类型。本发明所指的植物细胞可以是分离的(例如悬浮培养物),或包括在任何发展阶段的植物组织、植物器官或植物中。
本文所用的术语“有效地连接”或“功能上连接”是指在核酸序列之间相连接,使一个序列的功能受另一个的影响。例如,如果两个DNA的定位使得调控DNA影响编码DNA的表达,则称调控DNA与表达RNA或编码多肽的DNA“有效地连接”。
本文使用的术语“特异”或“优选”是指基因产物的表达仅限于一种或几种植物组织(特别限制)和/或一个或几个植物发育阶段(暂时限制)。已知几乎没有真正的特异性存在启动子似乎优选在一些组织中启动,而在其它组织可以没有或只有很少的活性。这种现象也可以被称为不同“遗漏”水平的遗漏表达。在植物其他部位的一个或者几个具有较低水平的组成性表达的植物组织中,遗漏也可以显示为优选表达。
“5’非编码区”或“5’-非翻译区”或“5’UTR”指位于编码序列5’(上游)的核苷酸序列。这种核苷酸序列存在于充分加工的mRNA的起始密码子上游并且可以影响初级转录物的加工、mRNA稳定性或翻译效率。
“3’非编码区”或“3’-非翻译区”或“3’UTR”指位于编码序列3’(下游)的核苷酸序列并且包括聚腺苷酸化信号序列和其他序列,其中所述的其他序列编码能够影响mRNA加工过程或基因表达的调节信号。聚腺苷酸化信号通常以影响聚腺苷酸添加至mRNA前体的3’末端为特点。
本文使用的术语“转录调控元件”是指多核苷酸,其能够调控有效连接的多核苷酸的转录。包括但不限于启动子、增强子、内含子、5’UTR和3’UTR。
本文使用的“RNAi”或“RNA干扰”是指由双链RNA(dsRNA)介导的、序列特异性的转录后基因沉默的过程。本文所使用的“dsRNA”是指部分或完全双链的RNA。双链RNA也称为小或短干扰RNA(siRNA)、短干扰核酸(siNA)、短干扰RNA、微RNA(miRNA)等。在RNA干扰过程中,将dsRNA引入寄主细胞,所述dsRNA包括与一部分靶基因基本上相同的第一链、和与第一链互补的第二链。引入之后,靶基因特异性dsRNA被处理成相对小的片段(siRNA),并且随后能够分布于宿主细胞各处,导致功能丧失突变,其在一代期间的表型可能与靶基因全部或部分缺失而产生的表型非常相似。可选地,靶基因特异性dsRNA被含有RNAi处理机制的植物细胞处理成相对小的约19-24bp的片段。
本文所使用的“细胞”或“植物细胞”是指单个细胞,也包括细胞群体。该群可以是包含一种类型细胞的纯的种群。同样,该群体可以包含一种以上的细胞类型。本发明所指的植物细胞可以是分离的(例如悬浮培养物),或包括在任何发展阶段的植物组织、植物器官或植物中。
就植物而言,术语“组织”(或“植物组织”)意思是许多植物细胞的排列,包括分化和未分化的植物组织。植物组织可以构成植物器官的一部分(例如植物叶的表皮),但也可以构成肿瘤组织(例如愈伤组织)和不同类型的培养中的细胞(例如单细胞、原生质体、胚、愈伤组织、类原球茎(protocorm-like body)等)。植物组织可在植物、器官培养物、组织培养物或细胞培养物中。
就植物而言,术语“器官”(或“植物组织”)意思是植物的一部分,可以包括但不限于例如根、果实、苗、茎、叶、下胚轴、子叶、花药、萼片、花瓣、花粉、种子等。
本文所使用的术语“植物”根据上下文可以理解为指整个植株、植物细胞、植物器官、芽、植物种子及其后代。用语“植物”亦指任何植物,特别是种子植物,可以包括但不限于作物植物。植物种类基本上与可用转化技术处理的高等和低等植物的种类同样广泛,包括被子植物(单子叶和双子叶植物)、裸子植物、蕨类植物、木贼(horsetail)、裸蕨植物、苔藓植物和多细胞藻类。植物的属可选自苜蓿属(Medicago)、番茄属(Lycopersicon)、芸苔属(Brassica)、黄瓜属(Cucumis)、茄属(Solanum)、核桃属(Juglans)、棉属(Gossypium)、苹果属(Malus)、葡萄属(Vitis)、金鱼草属(Antirrhinum)、杨属(Populus),草莓属(Fragaria)、拟南芥属、云杉属(Picea)、辣椒属(Capsicum)、藜属(Chenopodium)、菊属(Dendranthema)、牵牛属(Pharbitis)、松属(Pinus)、豌豆属(Pisum)、稻属(Oryza)、玉蜀黍属(Zea)、小麦属(Triticum)、小黑麦(Triticale)、黑麦属(Secale)、黑麦草属(Lolium)、大麦属(Hordeum)、大豆属(Glycine)、黄杉属(Pseudotsuga)、伽蓝菜属(Kalanchoe)、甜菜属(Beta)、向日葵属(Helianthus)、烟草属(Nicotiana)、南瓜属(Cucurbita)、蔷薇属(Rosa)、草莓属、百脉根属(Lotus)、苜蓿属、驴食草属(Onobrychis)、车轴草属(trifolium)、胡卢巴属(Trigonella)、豇豆属(Vigna)、橘属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡芦巴属(Daucus)、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、曼陀罗属(Datura)、天仙子属(Hyoscyamus)、烟草属、碧冬茄属(Petunia)、毛地黄属(Digitalis)、Majorana、菊苣属(Ciahorium)、莴苣属(Lactuca)、雀麦属(Bromus)、天门冬属(Asparagus)、金鱼草属、萱草属(Heterocallis)、水仙属(Nemesis)、天竺葵属(Pelargonium)、稷属(Panieum)、狼尾草属(Pennisetum)、毛莨属(Ranunculus)、千里光属(Senecio)、喇叭舌属(Salpiglossis)、蓝英花属(Browaalia)、菜豆属(Phaseolus)、燕麦属(Avena)和葱属(Allium)。
本文所使用的术语“植物”可以是单子叶作物,例如,谷类植物,包括小麦、大麦、高粱、黑麦、黑小麦、玉米、稻、甘蔗和树木,所述树木包括苹果、梨、温柏(quince)、李、樱桃、桃、油桃、杏、番木瓜、芒果、杨、松、红杉(sequoia)、雪松和橡树。本文所使用的术语“植物”可以是双子叶作植物,例如豌豆、苜蓿、大豆、胡萝卜、芹菜、番茄、马铃薯、棉花、烟草、胡椒、油菜(oilseed rape)、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥(Arabidopsis thaliana)。
本文所使用的术语“转基因”意指细胞和/或植物,其含有转基因或其基因组已由于引入转基因而改变,或已整合外源基因或多核苷酸。可以用若干方法产生转基因细胞、组织、器官和植物,包括通过人工干涉将包含多核苷酸(通常是DNA)的“转基因”引入靶细胞或将转基因整合到靶细胞的染色体的方法,如本文所述的方法。
本文所使用的术语“纯种”是指对于某一特定性状的许多植物,其对该性状的遗传纯合达到这样的程度,当纯种的品种自花授粉,后代中观察不到该性状显著量的独立分离。
本文所使用的术语“无效分离子”是指由于孟德尔分离法则而不含有转基因的转基因植物的后代(或基于该后代的株系)。
本文使用“野生型”是指植物细胞、种子、植物成分、植物组织、植物器官或整个植物,其未经基因修饰或者实验处理。
本文使用的“对照植物”是指植物细胞、外植体、种子、植物成分、植物组织、植物器官或整个植物,其用于和转基因或基因修饰的植物进行对照,目的是鉴定转基因或基因修饰植物中的增强表型或期望性状。“对照植物”在一些情况下可以是转基因植物株系,其包含空载体或标记基因,但不包含存在于所评价的转基因或基因改造植物中的目的重组多核苷酸。对照植物可以与所测试的转基因或基因改造植物是同一株系或者品种,或可以是另一株系或品种,如已知具有特定的表型、特征或已知基因型的植物。本文中适当的对照植物包括用来产生转基因植物、基因上未被改变或非转基因的亲本株系的植物。
本文所使用的术语“性状”是指植物或者特定植物材料或细胞的生理的、形态的、生化的、或物理的特性。在一些情况下,这种特点是肉眼可见的,如种子或植物的大小,或者可以通过生化技术来测量,如检测种子或者叶中蛋白质、淀粉、或油的含量,或者观察代谢或生理过程(例如通过测量对缺水或特定浓度的盐或糖的耐性),或者观察一个基因或多基因表达水平(例如通过采用Northern分析、RT-PCT、微阵列基因表达测定),或者农艺观察如渗透胁迫耐性或产量。可以使用任何技术测量转基因植物中任何选定的化学化合物或的高分子的数量、相对水平、或差异。
通过参考以下本发明优选的实施方案的详细说明以及其中的实施例,将更容易理解本发明。然而,应该了解的是,本发明不局限于特定的核酸、特定的多肽、特定的细胞类型、特定的宿主细胞、特定的条件、或特定的方法等,因为这些当然可能会有变化,并且其中的许多修饰和变化对于该领域的技术人员是显而易见的。还应该了解的是,本文所使用的术语仅仅是为了描述具体实施方案,且并无意限制。
用于克隆、DNA和RNA分离、扩增和纯化的标准技术,涉及DNA连接酶、DNA聚合酶、限制性内切酶等的酶反应的标准技术,以及各种分离技术是本领域的技术人员已知和常用的。许多标准技术于Sambrook和Russell,2001 Molecular Cloning,第三版,Cold Spring Harbor Laboratory,Plainview,New York;Sambrook等,1989 Molecular Cloning,第二版,Cold Spring Harbor Laboratory,Plainview,New York;Maniatis等,1982Molecular Cloning,Cold Spring Harbor Laboratory,Plainview,New York;Wu(编)1993 Meth.Enzymol.218,第I部分;Wu(编)1979 MethEnzymol.68;Wu等,(合编)1983 Meth.Enzymol.100和101;Grossman和Moldave(合编)1980 Meth.Enzymol.65;Miller(编)1972Experiments in Molecular Genetics,Cold Spring Harbor Laboratory,ColdSpring Harbor,New York;Old和Primrose,1981Principles of GeneManipulation,University of California Press,Berkeley;Schleif和Wensink,1982 Practical Methods in Molecular Biology;Glover(编)1985 DNACloning卷I和II,IRL Press,Oxford,UK;Hames和Higgins(合编)1985Nucleic Acid Hybridization,IRL Press,Oxford,UK;和Setlow和Hollaender 1979 Genetic EngineeringPrinciples and Methods,卷1-4,Plenum Press,New York中有所描述。所用的缩写和名称为本领域内标准和专业期刊(如本文引用的)中常用的。
本发明首次描述了淀粉合成酶基因上游的调控元件。因此,本发明的一个实施方案涉及分离的植物转录调控元件,其包括的多核苷酸选自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸; d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及 e)与a)至d)中的任何多核苷酸互补的多核苷酸。
本发明也包括了分离的植物转录调控元件,该元件包括的多核苷酸序列,与SEQ ID NO1、SEQ ID NO2、或SEQ ID NO3、或其一部分所示的核苷酸序列,至少有约50-60%、或至少约60-70%、或至少约70-80%、80-85%、85-90%或90-95%、或者至少约95%、96%、97%、98%、99%或更多同一或相似。核酸序列比对长度至少为50个连续核苷酸、或至少为100个连续核苷酸、或至少为200个连续核苷酸。序列同一性和序列相似性定义如下。
在另一实施方案中,本发明的分离的核酸在严格的条件下与SEQ IDNO1、SEQ ID NO2、或SEQ ID NO3、或其一部分所示的多核苷酸杂交。在另一实施方案中,分离的核酸在严格的条件下与这样的多核苷酸杂交,该多核苷酸包括SEQ ID NO1、2、或3、或者其一部分所示序列的多核苷酸中,至少50个连续核苷酸、或至少100个连续核苷酸、或至少200个连续核苷酸。本文所使用的术语“在严格的条件下杂交”意在描述杂交和冲洗的条件,在该条件下序列彼此之间至少有60%相似或相同的核苷酸通常保持彼此杂交。在另一实施方案中,该条件是彼此之间至少约65%,或者至少约70%,或至少约75%,或至少约80%或更多相似或相同的序列通常保持彼此杂交。这种严格的条件为本领域内技术人员已知并描述如下。严格条件的优选的非限制性例子是在6倍氯化钠/柠檬酸钠(SSC)中,于约45℃杂交,随后在50-65℃用0.2倍SSC,0.1%的SDS洗涤一次或多次。
“杂交”,可以用来指示两个核酸分子间相似或者同一性的水平,也可以在Southern或Northern分析中用来检测同一或相似的核酸分子的存在。两个DNA分子的杂交,取决于杂交程序和冲洗条件两者的参数。“严格的杂交条件”和“严格的杂交冲洗条件”是序列依赖性的并且在不同环境参数下是不同的。杂交的稳定性表示为解链温度Tm,Tm是50%的靶序列与完全匹配的探针杂交的温度。特异性通常是杂交后洗涤的函数,关键因素是终末洗液的离子强度和温度。对于DNA-DNA杂交,该Tm可以近似地由下面的等式(Sambrook等,1989)得到 a)Tm=81.5℃+16.6(log10[Na+]+0.41(%G+C)-0.61(%甲酰胺)-(600/L) 其中Na+=单价钠阳离子的摩尔浓度 G+C=DNA中鸟嘌呤和胞嘧啶核苷酸的百分比 L=杂交碱基对的长度 对于两个异源序列间的杂交,同源性每减少1%,杂交双链的Tm随之减少约1℃(Sambrook等,1989)。因此,可以调节Tm、杂交条件和/或洗涤条件以便与具有目的同一性的序列杂交。通常,选择的严格条件是在定义的离子强度和pH处低于具体序列的Tm约5℃。然而,极严格的条件可以使用比Tm低1、2、3或4℃时杂交和/或冲洗;中等严格的条件可以使用比Tm低6、7、8、9或10℃时杂交和/或冲洗;低严格的条件可以使用比Tm低11、12、13、14、15或20℃时杂交和/或冲洗。使用该等式、杂交和洗涤组合物以及想要的T,技术人员将理解杂交溶液和/或洗涤溶液严格性的变化是内在描述的。严格的杂交条件优选的非限制例子如上所述。
“反义”多核苷酸包括核苷酸序列,其与编码蛋白质的“有义”核酸互补,例如与mRNA序列互补。因此,反义核酸可以通过氢键与有义核酸结合。
反义核酸可与整个靶基因或部分靶基因互补。反义核酸分子通常施用于细胞或原位产生,从而与细胞mRNA和/或基因组DNA杂交或结合。杂交可以在如上所述的严格的条件下进行。
而在另一个实施方案中,分离的核酸互补于SEQ ID NO1或SEQ IDNO2中所示的多核苷酸,或者互补于与SEQ ID NO1或SEQ ID NO2中所示的多核苷酸有70%的序列同一性的多核苷酸,或互补于与SEQ IDNO1中所示的多核苷酸杂交的多核苷酸。本文所使用的“互补”多核苷酸是指那些能够根据标准的Watson-Crick互补规则进行碱基配对的多核苷酸。具体来说,嘌呤将与嘧啶碱基配对形成组合,该组合是鸟嘌呤与胞嘧啶配对(G:C),在DNA的情况下腺嘌呤或与胸腺嘧啶配对(A:T),或在RNA的情况下腺嘌呤与胸尿嘧啶配对(A:U)。
本发明还包括玉米或稻中得到的淀粉酶上游的调控元件,其能够调节作物中有效连接的异源核酸的组织特异性表达。因此,发明的另一实施方案涉及分离的植物转录调控元件,其包括的多核苷酸选自a)具有如SEQID NO1、2或3所示序列的多核苷酸;b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸;d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及e)与a)至d)中的任何多核苷酸互补的多核苷酸;并且其中的植物转录调节元件调节植物或者植物细胞中异源目的核酸的胚乳特异表达。
在一个实施方案中,任何转录调控元件中如a)、b)、c)、d)和e)所述的分离的核酸均能够修饰植物中的转录,优选地,其能调节植物中的胚乳优选表达。在另一项实施方案中,本发明分离的核酸所包括的核苷酸序列与SEQ ID NO1、2或3或其一部分所示的核苷酸序列,至少有约50-60%、或至少约60-70%、或至少约70-80%、80-85%、85-90%或90-95%、或者至少约95%、96%、97%、98%、99%或更多同一或相似。核酸序列比对长度至少为50个连续核苷酸、或至少为100个连续核苷酸、或至少为200个连续核苷酸。在另一实施方案中,本发明的分离的核酸互补于SEQID NO1、2或3中所示的多核苷酸,或互补于与SEQ ID NO1、2或3中所示的多核苷酸有70%序列同一性的多核苷酸,或互补于在严格的条件下与SEQ ID NO1、2或3中所示的多核苷酸杂交的多核苷酸。
在另一实施方案中,该特定转录调控元件的同源物可以包括但不限于这样的多核苷酸,其包括核苷酸片段缺失、单个或多个点突变、在特定限制性酶位点处改变、功能元件的增加或重排、或其他分子修饰手段。该修饰可能会也可能不会增强或改变所述核酸的转录调节活性。例如,本领域技术人员可以限定所述序列中的功能性元件并且删除任意非必需元件。功能元件可以因任何特定的应用,而被修饰、合并或重排,以提高本发明的多核苷酸的效用或表达。在不删除必需序列的情况下,也可通过移除或删除非必需的序列,获得本发明的转录调节性核苷酸序列的功能性等效片段。可以通过体外试误法(trial-and-error)缺失突变或在计算机(in silico)中使用启动子元件搜索常用程序,而实现将转录调节性核苷酸序列缩减至其必需和介导转录的元件。启动子活性必需的区域经常显示某些已知启动子元件的簇集。此类分析可以使用可获得的计算机算法如PLACE(“植物顺式作用调节性DNA元件(Plant Cis-acting Regulatory DNA Elements)”;Higo1999,BIOBASE数据库“Transfac”(Biologische Datenbanken GmbH,Braunschweig;Wingender 2001)或数据库PlantCARE(Lescot 2002)进行。转录调控核苷酸序列的等同片段也可以通过删除编码mRNA 5’非翻译区的区域而获得,从而只提供(非转录)启动子区域。可以通过本领域已知的方法(例如5’-RACE分析)方便地确定5’非翻译区。因此,本发明的转录调控核苷酸序列中的一些,与其他序列是等同片段。
本发明预期,除了SEQ ID NO1、2或3中所示的特定多核苷酸之外,还可以使用SEQ ID NO1、2或3中所示的多核苷酸中的特定元件和同源物。此处所使用的术语“类似物”是指具有同一的或者相似的功能,但是在不相关的生物体中分别进化的基因。本文所使用的术语“同源物”是指一个基因与另一基因由于两者是从共同的祖先DNA序列得到的后代而相关。术语“同源物”可适用于由于物种形成而分离的基因之间的关系(例如直向同源物),或由于基因复制而分离的基因之间的关系(例如旁系同源物)。本文所使用的术语“直向同源物”是指基因源于不同物种,但由共同的祖先基因通过物种形成进化而来。直向同源物在进化的过程中保留了相同的功能。直向同源物编码的蛋白质具有相同或相似的功能。本文所使用的术语“旁系同源物”是指通过基因组内的复制而相关的基因。旁系同源物通常具有不同的功能或新的功能,但这些功能可能是相关的。
本文所使用的术语“等位基因变体”是指具有多态性的多核苷酸,该多态性导致该核苷酸所编码蛋白质的氨基酸序列改变,且该多态性存在于天然群体(例如植物物种或种类)。这种天然等位基因变体通常可以导致编码蛋白质的多核苷酸1-5%的差异。等位基因变体可以通过许多不同植物中目的核酸的测序鉴定,这可以容易地通过利用例如杂交探针进行,以鉴定这些植物中相同基因的遗传基因座。由天然的等位基因变体而得、并且不改变所编码蛋白质的功能活性的本发明的核酸中,任何及所有这样的核酸的变体以及由此产生的氨基酸多态性或变体,均在本发明所涵盖的范围内。
本文所使用的术语“序列比对”是指一种方法,这种方法排列DNA、RNA或蛋白质的主要的序列,来识别这些区域之间由功能、结构或者进化关系而导致的相似区域。序列比对的计算方法一般分为两类全局比对和局部比对。全局比对是一种整体优化的形式,其使比对贯穿所有查询序列的全部长度。局部比对识别常常在整体上有很大程度不同的长序列中的相似区域。
本文所使用的术语“保守区”或“保守区域”是指异源的多核苷酸或多肽序列中的区域,其中在不同的序列之间存在相对较高程度的序列同一性。“保守区域”可以通过例如使用Clustal W算法进行多序列比对来鉴定。如本文中所用,“序列同一性”或“同一性”在两个核酸序列或多肽序列的情况中意指在指定比较窗口范围内为最大对应进行比对时,这两个序列中相同的残基,例如作为全局比对中的全部序列或局部比对中的相似区域。当序列同一性百分数用于蛋白质时,认识到不相同的残基位置经常因保守性氨基酸置换而不同,其中氨基酸残基被替换为具有相似化学特性(例如电荷或疏水性)的其他氨基酸残基并且因而并不改变该分子的功能特性。当序列因保守性置换而不同时,序列同一性百分数可以上调以校正置换的保守性本质。因此类保守性置换而不同的序列称作具有“序列相似性”或“相似性”。本领域技术人员熟知开展这种调整的方法。通常,这种方法包括将一个保守性置换评定为部分错配而非完全错配,因而提高序列同一性百分数。
本文使用的“序列同一性的百分比”或“序列同一性百分比意指通过比较一个比较窗口内两个最佳比对序列所确定的值,其中,比较窗口中的一部分序列可能会包括这两个序列最佳比对的缺口。原则上,通过这种方式计算该百分数,即通过确定其中相同核酸碱基或相同氨基酸残基在两个序列内均存在的位置数目以产生匹配位置数,将匹配位置数除以比较窗口中的位置总数,并且结果乘以100以产生所述序列同一性百分数。蛋白质序列的“序列相似性百分比”可以使用相同的原则计算,其中,保守取代算作部分而非完全错配。因此,例如当给予相同氨基酸的分数是1,给予非保守取代的分数为0,则给予保守取代的分数在0和1之间。保守取代的得分可由本领域已知的氨基酸矩阵获得,例如Blosum或PAM矩阵。
用于比较的序列比对方法是本领域内众所周知的。可以通过利用数学算法确定两个序列之间的同一性百分比或者相似性百分比(对于蛋白质)。这种数学算法优选的非限制的例子是Myers和Miller算法(Bioinformatics,4(1)11-17,1988)、Needleman-Wunsch全局比对法(J.MoI.Biol.,48(3)443-53,1970)、Smith-Waterman局部比对法(J.MoI.Biol.,147195-197,1981)、Pearson和Lipman的相似性搜索法(PNAS,85(8)2444-2448,1988)、Karlin和Altschul算法(Altschul等人,J.MoI.Biol.,215(3)403-410,1990;PNAS,905873-5877,1993)。
可以利用计算机实现这些数学算法,用于序列比较,以确定序列同一性或鉴定同源物。这样的实现包括但不限于下述程序。
BLAST(Basic Local Alignment Search Tool)程序的设计是为了快速找到高评分的局部比对。BLAST采用启发式算法(heuristic algorithm)寻找局部的,而不是全局的比对,因此能够检测仅仅共有分离的相似性区域的序列之间的关系(Altschul等,1990和1993)。BLAST程序包含几个单独的程序BLASTN以核苷酸序列数据库为对照比较核苷酸查询序列,BLASTP以蛋白质序列数据库为对照比较蛋白质查询序列,BLASTX以蛋白质序列数据库为对照比较核苷酸查询序列(双链)中六框的概念翻译产物(six-frame conceptual translation product),TBLASTN取一蛋白质序列,并以核苷酸序列数据库为对照而比较,该核苷酸数据库已于所有6个阅读框中翻译,TBLASTX在所有6个阅读框中将核苷酸查询序列转换成蛋白质序列,然后将其与核苷酸数据库比较,该核苷酸数据库已于在所有六个阅读框上翻译。Gapped BLAST可以被利用于获得以比对为目的的缺口比对(Nucleic Acids Research,25(17)3389-3402,1997)。可选地,PSI-BLAST可被用于开展可检测分子之间远缘关系的多重搜索。执行BLAST分析的软件可通过国家生物技术信息中心(National Centerfor Biotechnology Information)网站公开获得。
除了计算序列同一性百分比或者序列相似性百分比,BLAST运算法则还执行两个序列之间相似性的统计分析(Altschul等,1993)。由BLAST算法提供的一种相似性测量是最小总和概率(P(N)),也被称为P值,这种统计分析提供了两个核苷酸序列或氨基酸序列之间的匹配会因偶然发生匹配的概率的指示。另一项测量是预期值(E值),它代表了在整个数据库的搜索中,预期此匹配或更好的匹配纯粹出于偶然所出现的次数。因此,E值越低,输入序列与匹配序列之间的相似越高。
FASTA是基于Pearson和Lipman运算法开发的DNA和蛋白质序列比对软件包。该FASTA软件包包含蛋白质蛋白质、DNADNA、蛋白质翻译的DNA(移码的)、及有序的或无序的肽搜索。该FASTA包可通过University of Virginia的网站获得。
多重比对(例如,两个以上的DNA或蛋白质序列之间)可以通过使用ClustalW运算法则(Thompson等Nucleic Acids Res.224673-4680,1994)用例如,Vector NTI包(Invitrogen,1600 Faraday Ave.,Carlsbad,CA92008)实行。
领域内熟知,原始序列中一个或多个氨基酸可以被另一个(些)电荷和极性与原始氨基酸相似的氨基酸取代,即保守的氨基酸取代。对原始多肽序列中氨基酸的保守取代,可以选自,天然存在的氨基酸所属的种类中的其他成员。氨基酸可分为以下四类(1)酸性氨基酸、(2)碱性氨基酸、(3)中性极性氨基酸、(4)中性非极性氨基酸。这些不同组中代表性的氨基酸包括但不限于(1)酸性(带负电)氨基酸,如天门冬氨酸和谷氨酸;(2)碱性(带正电)氨基酸,如精氨酸、组氨酸和赖氨酸;(3)中性极性氨基酸,如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺,及(4)中性非极性(疏水性)氨基酸,如丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸。
利用本文所提供的资料,以及生物技术领域内技术人员所熟知的技术,本发明的转录调控元件可以从除了玉米或稻以外的植物中分离。例如,可以从植物组织cDNA文库中分离出编码淀粉合成酶的多核苷酸,其中,该植物可以选自小麦、大麦、高粱、黑麦、黑小麦、玉米、稻、甘蔗、豌豆、苜蓿、大豆、胡萝卜、芹菜、番茄、马铃薯、棉花、烟草、胡椒、油菜、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥。聚合酶链式扩增反应的合成的寡核苷酸引物,可以在上述编码淀粉合成酶的多核苷酸序列的基础上设计。在PCR中利用相应的植物基因组DNA为模板,可以分离多核苷上游、或多核苷酸下游、或内含子区域的转录调控元件。可选地,可以从植物组织基因组DNA库分离来自植物的多核苷酸,该多核苷酸在严格的条件下与SEQ ID NO1、2或3所示序列的多核苷酸杂交,或该多核苷酸与SEQID NO1、2或3所示序列的多核苷酸至少有70-80%、80-85%、85-90%或90-95%,或者至少约95%、96%、97%、98%、99%或更多的同一或相似。可以用任何数量的标准方法,例如如上所述的PCR分离源自所述多核苷酸的转录调控元件。依此分离的转录调控元件可以被克隆到合适的载体上,并用DNA序列分析表征。
在另一实施方案中,转录调控核苷酸的同源物的转录调控活性,与本文中明确公开的转录调控核苷酸实质上相同(或等同),也就是说该表达依上述的胚乳优选方式进行调节。除了这一点,同源物的转录调控活性可能会与其亲本多核苷酸有所不同,特别是表达水平方面。该表达水平可能高于或低于其亲本多核苷酸的表达水平。取决于待表达的目的核酸,这两种衍生物都可能是有利的。优选的是这样的功能上等同的多核苷酸,相对于其亲本核苷酸,其表达水平与所述亲本多核苷酸表达水平的偏离不会超过50%、或25%、或10%。相对于其亲本多核苷酸显示出增强表达的等同多核苷酸也是优选的,其增强为至少50%、或者至少是100%、或至少增强500%。该表达水平可通过mRNA表达或蛋白质表达而判断。蛋白质表达谱可以利用与所述转录调控多核苷酸有效地连接的报告基因显示。上下文中优选的报告基因(Schenborn 1999)是绿色荧光蛋白(GFP)(Chui1996;Leffel 1997)、氯霉素转移酶、荧光素酶(Millar 1992)、β-葡萄糖醛酸糖苷酶、β-半乳糖苷酶(Jefferson 1987)。测定转录调控的方法为本领域熟知,包括Northern印迹和RT-PCR。
本发明的另一实施方案涉及分离的植物转录终止元件,其包括的多核苷酸选自a)具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸;b)与SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸;d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO4或者SEQ ID NO5所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及e)与a)至d)中的任何多核苷酸互补的多核苷酸。
在另一实施方案中,本发明的分离的植物转录终止元件包括的核苷酸序列,与SEQ ID NO4或者SEQ ID NO5或其一部分所示的核苷酸序列至少有约50-60%、或至少约60-70%、或至少约70-80%、80-85%、85-90%或90-95%、或者至少约95%、96%、97%、98%、99%或更多相同或相似。核酸序列比较长度为至少50个连续核苷酸、或至少100个连续核苷酸、或至少200个连续核苷酸。在另一实施方案中,本发明的分离的核酸与SEQ ID NO4或5所示的多核苷酸互补,或互补于与SEQ ID NO4或5所示序列的多核苷酸有70%的序列同一性的多核苷酸,或者互补于在严格的条件下与SEQ ID NO4或5所示序列的多核苷酸杂交的多核苷酸。
在另一实施方案中,分离的核酸在严格的条件下与多核苷酸杂交,该多核苷酸包括SEQ ID NO4或5或其一部分所示序列的多核苷酸中至少50个连续核苷酸、或至少100个连续核苷酸、或至少200个连续核苷酸。在另一实施方案中,其条件使彼此至少约60%、或者至少约65%、或至少约70%、或至少大约75%或更多相似或同一的序列通常保持彼此杂交。这种严格的条件是本领域技术人员已知和如上所描述的。严格条件的优选的非限制性例子是在6倍氯化钠/柠檬酸钠(SSC)中,于约45℃杂交,随后在50-65℃用0.2倍SSC,0.1%的SDS洗涤一次或多次。
本发明的另一实施方案涉及用分离的植物转录调控元件的转化的植物,其中,该转录调控元件包括的多核苷酸选自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸;d)多核苷酸,其在严格的条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及e)与a)至d)中的任何多核苷酸互补的多核苷酸。
本发明的另一实施方案涉及用植物转录调控元件转化的植物,该植物转录调控元件包含有效地连接于一个或多个异源核酸的多核苷酸,其中包括多核苷酸的所述植物转录调控元件选自a)具有如SEQ ID NO1、2或3所示序列的多核苷酸;b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸;c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸;d)多核苷酸,其在严格的条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及e)与a)至d)中的任何多核苷酸互补的多核苷酸。
在一个实施方案中,该转化植物可以是选自单子叶植物和双子叶植物的植物。该植物的属可以选自于玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、黑麦草。该植物的属可以选自豌豆、苜蓿、大豆、胡萝卜、芹菜、番茄、马铃薯、棉花、烟草、胡椒、油菜、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥。在另一实施方案中,该转化植物表达了农艺相关性状或特性。这些特性包括但不限于含油量和油质量、蛋白质的质量和数量、氨基酸组成、含淀粉的质量和数量、增加的饲料含量和价值、增加的食物含量和价值、增加产量、增加的胁迫耐性或抗性,例如对干旱、高温、低温、冷冻、过多的水分、盐、氧化胁迫和氮胁迫的耐性或抗性、除草剂抗性或耐性、昆虫抗性和耐性、疾病抗性和耐性、外观、雄性不育、雌性不育等等。
本发明还提供转化的单子叶植物或双子叶植物、来自该植物的种子和部分,以及源自这样的植物的后代植株,包括杂种或纯种。发明的另一实施方案提供了转基因植物产生的种子,该转基因植物用包含本发明的植物转录调控元件的表达载体转化。该种子是植物转录调控元件的纯种,其中,该转录调控元件调控外源性或内源性基因的胚乳特异性表达。本发明还提供了植物育种方法,例如,制备杂交能育的转基因植株。该方法包括,将含有本发明特定表达载体的能育的转基因植物与其自身杂交或者另一植物(例如缺乏该特定表达载体的植物)杂交,以制备包括该特定表达载体的杂交能育的转基因植株的种子。然后种植该种子而获得杂交能育的转基因植株。该植株可以是单子叶植物或双子叶植物。杂交能育转基因植株可以通过继承母本或父本而拥有该表达载体。另一种植物可以是近交植物。该杂交能育转基因植物可以是杂交体。任何这些杂交能育转基因植物的种子也包含在本发明的范围内。
经济上最相关的特性之一是增加了植物的营养价值。因此,本发明的另一实施方案涉及使植物种子或芽增加营养价值、提高营养品质、增加或改变淀粉含量、增加或改变含油量的方法,所述方法包括以下步骤 1)向植物细胞或植物中引入表达载体,该载体包括 A)植物转录调控元件,其选自 a)具有如SEQ ID NO1、2或3所示序列的多核苷酸; b)与SEQ ID NO1、2或3所示序列的多核苷酸有70%的序列同一性的多核苷酸; c)具有这样的片段的多核苷酸,该片段具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸; d)多核苷酸,其在严格地条件下与包括具有如SEQ ID NO1、2或3所示序列的多核苷酸中至少50个连续核苷酸,或至少100个连续核苷酸,或至少200个连续核苷酸的多核苷酸杂交;以及 e)与a)至d)中的任何多核苷酸互补的多核苷酸; 该植物转录调控元件有效地与一个或多个异源核酸连接,其中有效地连接的核酸编码的多肽能够使植物提高营养价值和/或增加或改变植物的淀粉含量; B)筛选转基因植物,其中该植物相对于野生型或无效分离子,植物的种子或芽具有增加的营养价值、增加的营养品质、增加或改变的淀粉含量,或者增加或改变的含油量。
该营养价值可以包括蛋白质的质量和数量、含油质量和数量、氨基酸组成、淀粉质量和数量、饲料成份和价值、食品成份和价值,并且至少含有一种选自维生素、类胡萝卜素、抗氧化剂、不饱和脂肪酸和多聚不饱和脂肪酸的化合物成分。本文对营养价值和相应的待表达的核酸定义如下。优选的植物转录调控元件如上文所述。本发明的方法应用的植物可以选自玉米、小麦、稻、大麦、燕麦、黑麦、高粱、香蕉、黑麦草、豌豆、苜蓿、大豆、胡萝卜、芹菜、番茄、马铃薯、棉花、烟草、胡椒、油菜、甜菜、甘蓝、花椰菜、椰菜、莴苣和拟南芥。
该增加的营养价值可以,例如,导致一个或多个下列性质修改的植物的脂肪酸组成、氨基酸含量、植物代谢物浓度增加。根据谷粒的最终具体用途,可以预见种类广泛的以这种方式产生的新颖转基因植物。
例如,玉米谷粒的最大用途是饲料或食品。导入改变谷粒成分的基因可以明显增强饲料价值或食品价值。玉米谷粒的主要成分是淀粉、蛋白质和油。玉米谷粒的这些主要成分中的每一种可以通过改变其水平或组成加以改良。可以提及数个用于说明目的的实例,但是无论如何不是提供对可能性的穷举。
就饲料和食品目的而言,多种谷类谷粒的蛋白质是次优的,尤其用于猪、家禽和人食用时。蛋白质在这些物种的饮食中的数种必需氨基酸上有缺陷,需要向谷粒添加补充物。这些必需氨基酸可以包括赖氨酸、甲硫氨酸、色氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。某些氨基酸仅在谷粒以用于饲料配合的其它输入物补充后才变成受限的。例如,当时谷粒用豆粕补充以满足赖氨酸要求时,甲硫氨酸变成受限的。种子和谷粒内这些必需氨基酸的水平可以通过如此机制提高,所述的机制包括,但不限于导入增加氨基酸生物合成的基因、减少氨基酸降解、增加蛋白质中氨基酸的贮藏或增加氨基酸转运至种子或谷粒内。
用于增加氨基酸生物合成的一个机制是导入解除氨基酸生物合成途径中受控制的基因以至于植物不再能够充分控制氨基酸的产生水平。这可以通过解除控制氨基酸生物合成途径中通常受途径内氨基酸终产物水平调节的步骤或绕过所述步骤而完成。实例包括导入编码用于增加赖氨酸和苏氨酸产生的解除控制形式的天冬氨酸激酶或二氢吡啶二羧酸(DHDP)合酶和用于增加色氨酸产生的邻氨基苯甲酸合酶的基因。减少氨基酸的代谢可以通过导入减少或消除编码酶的基因表达的DNA序列完成,其中所述的酶催化分解代谢途径中的步骤,如赖氨酸-酮戊二酸还原酶。
谷粒的蛋白质组成可以用多种方式加以改变以改善氨基酸的平衡,所述方式包括提高天然蛋白质的表达、降低那些具有不良组成的天然蛋白质的表达、改变天然蛋白质的组成或导入编码具有优异组成的全新蛋白质的基因。可以导入降低玉米中的贮藏蛋白中玉米醇溶蛋白家族成员表达的DNA。这种DNA可以编码旨在破坏玉米醇溶蛋白表达或破坏玉米醇溶蛋白表达的调节物(如不透明-2基因产物)表达的核酶或反义序列。谷粒的蛋白质组成可以通过共抑制(即通过表达经转化作用导入的相同结构性基因或基因片段而抑制内源基因的表达)进行修饰(Goring 1991)。此外,导入的DNA可以编码降解玉米醇溶蛋白的酶。所实现的玉米醇溶蛋白表达降低可以伴随增加具有更希望的氨基酸组成的蛋白质以及增加种子其它主要成分如淀粉。或者,可以导入嵌合基因,其中该嵌合基因包含具有适当氨基酸组成的天然蛋白质(如玉米中球蛋白的一种或10kD玉米醇溶蛋白)的编码列以及设计旨在提高所述蛋白质表达的启动子或其它调节序列。所述基因的编码序列可以包括必需氨基酸的额外密码子或替换密码子。此外,可以使用从其它物种中获得的编码序列,或编码完全独特的肽序列的部分或完全合成的序列,其中所述肽序列的设计目的旨在增强种子的氨基酸组成。
导入改变谷粒油含量的基因可以是有价值的。油含量增加可以导致增加用于饲料和食品中的种子的可代谢能量含量及期望的密度。导入的基因可以编码移除或减弱脂肪酸或脂类生物合成中限速步骤或受调节步骤的酶。此类基因可以包括,但不限于编码乙酰CoA羧化酶、ACP-酰基转移酶、β-酮酰基-ACP合酶和其它众所周知的涉及脂肪酸生物合成活性的蛋白质的那些基因。其它可能基因是编码无酶活性的蛋白质如酰基载体蛋白的基因。额外的实例包括2-乙酰基转移酶、油质蛋白丙酮酸脱氢酶复合体、乙酰CoA合成酶、ATP柠檬酸裂合酶、ADP-葡萄糖焦磷酸化酶和涉及肉碱CoA-乙酰-CoA穿梭的基因。可以导入改变存在于油中的脂肪酸平衡的基因,提供更有益健康或更有营养的饲料原料。导入的DNA还可以编码这样的序列,该序列阻遏参与脂肪酸生物合成的酶的表达,从而如下所述改变存在于谷粒中的脂肪酸的比例。
除了改变谷粒的主要成分之外,可以导入影响饲料或食品用谷粒的多种其它养分方面、加工步骤方面或其它品质方面的基因。例如,可以增加或减少谷粒的色素形成。某些动物饲料中黄色色素形成的增强和稳定性是受到欢迎的并可以通过导入这样的基因而实现,其中所述的基因通过消除叶黄素及胡萝卜素产生中的限速步骤而导致增强产生叶黄素和胡萝卜素。此类基因可以编码改变形式的八氢番茄红素合酶、八氢番茄红素去饱和酶或番茄红素合酶。或者,无色素的白色玉米是众多食品产品产生所需要的并且可以通过导入阻遏或消除色素产生途径中的步骤的DNA而产生。
包含一些谷类谷粒的饲料或食品具有不充分量的维生素并且必须进行补足以提供合适的营养价值。可以设想导入增强种子中维生素生物合成的基因,包括例如维生素A、E、B12、胆碱等。例如,玉米谷粒也不具有用于最佳营养价值的充分矿物质含量。影响含磷、硫、钙、锰、锌和铁等的化合物累积或可用性的基因是有价值的。实例可以是导入减少植酸生产或编码植酸酶的基因,这增强植酸分解。这些基因将增加食物中的可用磷酸盐水平,减少用矿物磷酸盐作补充的需要。
除了指导改良饲料价值或食品价值外,还可以导入这样的基因,该基因改善谷粒加工并改善从加工中所产生产品的价值。加工某些谷粒如玉米的主要方法是湿磨法。玉米可以通过新基因的表达受到改良,其中所述的新基因提高加工效率并降低加工成本(如通过减少浸泡时间)。
改善湿磨法产物的价值可以包括改变淀粉、油、玉米面筋粉的数量或品质或玉米淀粉渣的成分。可以如此实现淀粉的升高,即通过鉴定并消除淀粉生物合成中的限速步骤或通过降低谷粒其它成分水平,从而导致成比例地增加淀粉。前者的实例可以是导入这样的基因,该基因编码具有改变的调节活性或在更高水平上表达的ADP-葡萄糖焦磷酸化酶。后者的实例可以包括在谷粒发育晚期期间表达的例如蛋白质生物合成或油生物合成的选择性抑制物。
油是玉米和其它谷物的另一种湿磨法产物,其价值可以通过导入并表达基因加以改善。能够通过湿磨法提取的油量可以通过如以上对饲料和食品所述的方法加以提高。也可以改变油的特性以改善油在食用油、起酥油、润滑油或其它的油衍生性产物的生产和使用中的性能或改善其在用于食品相关性应用中的健康特性。还可以合成可在提取后充当化学合成原材料的新脂肪酸。油特性的改变可以通过改变存在于油中的脂肪酸的类型、水平或脂类排列而实现。这又可以通过添加编码酶的基因(其中所述的酶催化新脂肪酸合成)或通过提高天然脂肪酸的水平,与此同时可能降低前体的水平而完成。或者,可以导入这样的核酸,其延缓或阻断脂肪酸生物合成中的步骤,导致前体脂肪酸中间体增加。可以添加的基因包括去饱和酶、环氧酶、水合酶、脱水酶和催化涉及脂肪酸中间体的反应的其它酶。可以被阻断的催化步骤的代表性实例包括从硬脂酸至油酸和从油酸至亚麻酸的去饱和步骤,阻断所述步骤导致相应地累积硬脂酸酸和油酸。
也可以通过导入用来获得新植物的基因实现改良其它的谷物湿磨法产物、面筋粉和玉米淀粉渣。代表性的可能方式包括但不限于以上对改善食品价值和饲料价值所述的那些方式。
此外,还可以考虑应当使用植物来产生或制造植物中先前根本不产生或不以这个水平产生的有用生物化合物。可能通过转化方法导入并表达基因而制备产生这些化合物的新植物。有可能包括,但不限于目前通过任何生物所产生的任一生物化合物,如蛋白质、核酸、初级代谢物和中间代谢物、糖类聚合物等。化合物可以由植物产生、在收获和/或加工后提取并且用于任何目前认识到的有用目的,如药物、香料、工业用酶,不一而足。
可以结合本发明的转录调控元件,并提供改善的终产物的特性的有用的核酸,包括但不限于这样的核酸,其编码种子贮藏蛋白质、脂肪酸途径酶(fatty acid pathway enzyme)、维生素E生物合成酶、氨基酸生物合成酶、核酸合成酶和淀粉分支酶。用于植物显型改良的示例性基因的论述可以在,例如,US专利号6,194,636、6,207,879、6,232,526、6,426,446、6,429,357、6,433,252、6,437,217、6,515,201和6,583,338以及在WO02/057471中找到,所述每篇文献具体地在本文中完整引用作为参考。所述性状包括但不限于 -用于食品和饲料领域内的代谢酶(如植酸酶和纤维素酶)的表达。尤其优选核酸,如编码微生物植酸酶的人工cDNA(GenBank登录号A19451)或其功能等同物。
-引起精细化学品如生育酚、生育三烯酚或类胡萝卜素累积的基因的表达。可以提到的实例是八氢番茄红素去饱和酶。优选编码黄水仙(Narcissus pseudonarcissus)八氢番茄红素去饱和酶的核酸(GenBank登录号X78815)或其功能等同物。优选的生育酚生物合成酶包括tyrA、slr1736、ATPT2、dxs、dxr、GGPPS、HPPD、GMT、MT1、tMT2、AANT1、slr1737和用于尿黑酸双加氧酶的反义构建体(Kridl等(1991);Keegstra(1989);Nawrath等(1994);Xia等(1992);Lois等(1998);Takahashi等(1998);Norris等(1998);Bartley和Scolnik(1994);Smith等(1997);WO 00/32757;WO 00/10380;Saint Guily等(1992);Sato等(2000)),全部文献在本文中引用作为参考。
-淀粉生产(US专利号5,750,876和6,476,295)、高量蛋白质生产(US6,380,466)、果实成熟(US 5,512,466)、增强的动物及人营养(US专利号5,985,605和6,171,640)、生物聚合物(US 5,958,745和US专利
发明者C·卡费尔, H·关 申请人:巴斯福植物科学有限公司