专利名称:具有增强的产量相关性状的植物和用于制备该植物的方法
具有增强的产量相关性状的植物和用于制备该植物的方法本发明总体上涉及分子生物学领域并涉及用于通过调节植物中编码D0F-C2(具 有一个指状物的结合DNA的,亚组C2)结构域转录因子多肽或MYB结构域蛋白(MYB7)的核 酸的表达而增强产量相关性状或改善多种植物生长特征的方法。本发明还涉及具有编码 D0F-C2结构域转录因子多肽或MYB7的核酸的受调节表达的植物,所述植物相对于对应的 野生型植物或其他对照植物具有增强的产量相关性状。本发明也提供了在本发明方法中有用的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。 常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。然而,此 类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经 常含有可能并不总导致受欢迎性状从亲代植物传递下去的异源遗传组分。分子生物学进展 已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一 般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种 经济学、农学或园艺学改良性状的作物或植物的能力。具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的 可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例 如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入、 胁迫耐受性和早期生长势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因 而可以有助于提高作物产量。种子产量是特别重要的性状,因为许多植物的种子对人和动物营养是重要的。作 物如谷物、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费 种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用 许多类型代谢物的来源。种子含有胚(新苗和新根的来源)和胚乳(萌发期间和籽苗早期 生长期间用于胚生长的养分来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转 移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮 藏大分子以灌满籽粒。对于许多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计 划在温带和热带稻品种方面的重要目标。长根对于水栽稻中正确土壤固定是重要的。在稻 直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与 生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对良好出苗是重要的。将早期 生长势人工改造到植物内的能力在农业中将是极重要的。例如,不良的早期生长势已经限 制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.) 杂种。又一个重要性状是改进的非生物性胁迫耐受性。非生物性胁迫是世界范围作 物损失的主要原因,对于大多数主要作物植物而言平均产量降低超过50% (Wang等人, Planta(2003) 218 :1_14)。非生物性胁迫可以由干旱、盐度、极端温度、化学毒性和氧化胁迫 引起。改善植物的非生物性胁迫耐受性能力将在世界范围对农民是巨大的经济优势并且将允许在不利条件期间及在本来不可能栽培作物的陆地上栽培作物。因而可以通过优化前述因素之一提高作物产量。取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应 用如面粉、淀粉或油生产而言,种子参数提高可能是特别希望的。即便在种子参数当中,某 些参数可以更优先于其它参数,这取决于用途。多种机制可以有助于提高种子产量,无论其 形式为提高的种子尺寸或提高的种子数目。提高植物中产量(种子产量和/或生物量)的一种方法可以是通过调节植物的内 在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。现在已经发现可以在植物中通过调节植物中编码植物中D0F-C2结构域转录因子 多肽或MYB7的核酸的表达改善产量相关性状或各种生长特征。Dof结构域蛋白(包含Dof结构域的蛋白质)是植物特异性转录因子,其具有带 单个C2-C2锌指的高度保守的DNA结合结构域。在过去十年期间,已经在包括玉米、大麦、 小麦、稻、烟草、拟南芥属植物、南瓜、马铃薯及豌豆的单子叶植物和双子叶植物中鉴定到许 多Dof结构域蛋白。已经显示Dof结构域蛋白作为转录激活物或阻遏物在多样的植物特异 性生物学过程中发挥作用。系统发育研究表明Dof结构域蛋白在被子植物的多样化之前趋 异,因而在长时间增殖后,明显不同的Dof结构域蛋白可能已经进化以在植物生理学中发 挥不同的作用。然而,Dof结构域的高度保守序列可以赋予Dof结构域蛋白相似的功能。另 一方面,Dof结构域蛋白的序列在Dof结构域之外是高度趋异的。已经提出Dof结构域之外 的多样化区域可能与明显不同的Dof结构域蛋白的不同功能有关(Yanagiswa,PlantCell Physiol. 45(4) :386_391(2004)。Dof结构域蛋白展示序列特异性DNA结合活性。序列特异性仅由Dof结构域 7k ^ (Yanagisawa, S. (1995)Nucleic Acids Res. 23 3403-3410 ;Kisu, Y. , Ono, Τ., Shimofurutani, N.,Suzuki, Μ.和 Esaka, Μ. (1998)Plant CellPhysiol. 39 1054-1064.)。 已经对许多Dof蛋白(Dof结构域蛋白)描述了所靶向DNA中的结合位点(De Paolis, Α. , Sabatini, S. , de Pascalis, L. , Contantino, P.禾口 Capone, I. (1996)Plant J. 10 215-223 ;Yanagisawa, S.和 Izui, K. (1993)J. Biol. Chem. 268 :16028_16036 ;Mena, M., Vicente-Carbajosa, J. , Schmidt, R. J.禾口 Carbonero, P. (1998)Plant J. 16 :53_62)。大 部分Dof结构域蛋白结合互补链中的序列AAAG或CTTT。在与AGTA序列结合的南瓜AOBP Dof 结构域蛋白中存在例外(Kisu 等人.1998. Plant cell physiol 39,1054-1064)。序列 (A/T)AAAG代表Dof结构域的已识别的DNA结合核心基序。Dof结构域由包含共有序列CX2CX21CX2C的约50_60个氨基酸组成,其中认为所 述的共有序列形成与Cys2/Cys2锌指结构域相似的锌指结构,其中4个保守的半胱氨酸残 基将与锌离子配位(Uemura等人.2004Plant J 37,741-749)。Dof结构域富含碱性氨基 酸。尽管Dof结构域的氨基酸序列和半胱氨酸残基的排列不同于其他锌指,然而全部Dof 结构域均具有4个保守的半胱氨酸残基(Yanagisawa, S. (1995)Nucleic Acids Res. 23 3403-3410. Yanagisawa, S. (1996)Trends Plant Sci.1 :213-214. Yanagisawa, S. (2002) Trends Plant Sci. 7 :555_560)。拟南芥和稻的Dof结构域蛋白已经被划分成4个主要直向同源聚类,称作Aa、Bb、Cc 和 Dd(Lijavetzky 等人.2003. BMC Evolutionary Biology3)。基于系统发育关系,已经在主要聚类中某些聚类内部识别出子聚类。在Dof结构域外部,不同聚类中的成员之间存 在很小的序列保守性。这种大的序列多样性提示植物中Dof结构域蛋白的差异性生物学作 用。然而,相同聚类或子聚类内部的成员共有大量保守的序列基序,这提示属于相同聚类或 子聚类的Dof蛋白的生物学功能保守性。WO 2007/064724公开了在提高植物产量中有用的属于聚类Dd和Bb的Dof结构域蛋白。在一个实施方案中,现在已经令人惊讶地发现调节编码属于聚类Ce、子聚类C2的 Dof结构域蛋白(D0F-C2转录因子多肽)的核酸的表达产生了相对于合适的对照植物具有 提高(或增强)的产量的植物。根据一个实施方案,提供了用于相对于对照植物改善植物的产量相关性状的方 法,包括调节植物中编码D0F-C2结构域转录因子多肽的核酸的表达。MYB结构域蛋白是具有高度保守的DNA结合结构域的转录因子。最初在禽成髓 细胞瘤病毒的致癌基因(v-myb)中描述了 MYB结构域(Klempnauer等人,(1982)Cell 33, 453-63)。许多脊椎动物含有与v-Myb、c_Myb、A-Myb和B-Myb相关的3种基因并且已经在 昆虫、植物、真菌和粘菌中鉴定到其他的相似基因。所编码的蛋白质对于许多细胞类型中 增殖和分化的控制是重要的。MYB蛋白含有50-53个氨基酸的保守序列的1至4个不完 全同向重复序列,所述保守序列编码参与DNA结合的螺旋-转角-螺旋结构(Rosinski和 Atchley (1998) J Mol Evol 46,74-83)。3个规律间隔的色氨酸残基(它们在三维螺旋-转 角-螺旋结构中形成色氨酸簇)是MYB重复序列的特征。将c-Myb中的这三个重复序列称 作Rl、R2和R3 ;并且将来自其他MYB蛋白的重复序列根据它们与Rl、R2或R3的相似性分 类。由于在MYB结构域之外存在少量序列保守性,因而已经将MYB蛋白基于MYB编码区之 外所鉴定到的保守基序聚类成亚组(Jiang等人,(2004)Genome Biology 5,R46)。AtMYB7 属于 R2R3-MYB 基因家族(Li 和 Parish, Plant J. 8,963-972,1995),该基 因家族是一个大的基因家族(具有拟南芥(Arabidopsis thaliana)中已报道的126种基 因)(Zimmerman等人,Plant J. 40,22-34,2004))。该组成员参与多种过程,包括次级代谢、 细胞形态发生、分生组织形成的调节、花与种子发育、细胞周期、防御和胁迫应答、光和激素 信号传导(Chen等人,Cell Res. 16,797-798,2006)。尽管报道AtMYB7在胁迫下具有增加的 表达(Ma和Bohnert,Genome Biology 8 :R49,2007),然而它在植物中的确切功能仍未知。 进一步推测AtMYB7表达在生物胁迫耐受性中发挥作用(W0 02/16655和WO 03/000898)。 WO 2007099096公开了用于提高植物中种子产量的稻MYB蛋白。在另一个实施方案中,已经令人惊讶地发现调节编码MYB7多肽的核酸的表达产 生相对于对照植物具有增强的产量相关性状、尤其提高的营养生物量和提高的出苗生长势 的植物。根据另一个实施方案,提供了用于相对于对照植物改善植物的产量相关性状的方 法,包括调节植物中编码MYB7多肽的核酸的表达。这种改善的产量相关性状包含提高的生 物量和提高的出苗生长势。定义多肽/蛋白质
术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任 意长度聚合物形式的氨基酸。多核苷酸/核酸/核算序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相 互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷 酸或这二者的组合。对照棺物选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或 无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品 种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。 如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。同源物蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的 所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与衍生它们的非修饰蛋白质具有相似 的生物学活性和功能活性。缺失指从蛋白质中移除一个或多个氨基酸。插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端 融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插 入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、 噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、 二氢叶酸还原酶、Tag · 100表位、c-myc表位、FLAG -表位、IacZ、CMP (钙调蛋白结合肽)、 HA表位、蛋白C表位和VSV表位。替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏α -螺旋 结构或折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单 个残基的,但是根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个 氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的 (见例如 Creighton (1984) Proteins. W. H. Freeman and Company (编著)禾口下表 1)。表1 保守性氨基酸替换的例子
氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法 等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺 失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是 本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland, OH)、 QuickChange位点定向诱变法(Stratagene,San Diego, CA)、PCR介导的位点定向诱变或其 他位点定向诱变法。衍牛物“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白) 的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的 氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天 然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷 酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与衍生出 衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的 一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检 测该衍生物的报道分子,和相对于天然存在蛋白质的氨基酸序列而言,包含非天然存在的 氨基酸残基。此外,“衍生物”也包括天然存在形式的蛋白质与标签肽如FLAG、HIS6或硫氧 还蛋白(对标签肽的综述,见 Terpe,Appl. Microbiol. Biotechnol. 60,523-533,2003)的融 合物。盲向同源物/旁系同源物直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是 相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起 源的基因,并且也衍生于共同的祖先基因。结构域术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一 组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保 守的氨基酸指示在蛋白质结构、稳定性或功能方面很可能是必需的氨基酸。结构域因其在 蛋白质同源物家族的比对序列中高程度保守而鉴定,故它们可以用作鉴定物来确定所讨论的任意多肽是否属于先前已鉴定的多肽家族。基序/共有序列/标签术语“基序”或“共有序列,,或“标签”指在进化相关蛋白质的序列中的短保守区 域。基序往往是结构域的高度保守部分,但是也可以仅包括该结构域的部分,或可以位于保 守结构域之外(若该基序的全部氨基酸位于定义的结构域之外)。^^如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的 过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处在溶液中。杂交过程也可 以用固定至基质如磁珠、琼脂糖凝胶(S印harose)珠或任何其他树脂的互补性核酸之一进 行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如照相平版 印刷术固定至例如硅玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)的互补性 核酸之一进行。为使杂交发生,核酸分子通常被热变性或化学变性,以将双链解链成两条单 链和/或去除来自单链核酸的发夹或其他二级结构。术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子 强度和杂交缓冲液组成的影响。通常,将低严格条件选择成在定义的离子强度和PH处,低 于特定序列的热解链温度(TJ约30°C。中等严格条件是当所述温度在Tm以下20°C时,并 且高严格条件是当所述温度在Tm以下10°C时。高严格杂交条件一般用于分离与靶核酸序 列具有高序列相似性的杂交序列。然而,核酸可以在序列上偏离且依旧编码基本上相同的 多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸 分子。1 是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完 全匹配的探针杂交。取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更 高温度上特异性杂交。最大杂交速率从低于Tm约16°C直至32°C获得。杂交溶液中一价阳 离子的存在降低了两条核酸链之间的静电排斥作用,因而促进杂交体形成;这种作用对于 直到0. 4M的钠浓度是显而易见的(对于更高浓度而言,可以忽略这种作用)。甲酰胺降低 DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0. 6至0. 7°C,且添加50% 甲酰胺允许在30至45°C杂交,尽管杂交速率会降低。碱基对错配降低杂交速率和双链体的 热稳定性。平均且对于大的探针而言,Tm下降约rc/每^碱基错配。根据杂交体的类型, 1可以使用以下等式计算1)DNA-DNA 杂交体(Meinkoth 和 ffahl, Anal. Biochem.,138 :267_284,1984)Tm = 81. 5°C +16. 6Xlog10[Na+]a+0. 41X % [G/Cb]-500 X LT1-。. 61X % 甲酰胺
2) DNA-RNA 杂交体或 RNA-RNA 杂交体Tm = 79. 8+18. 5 (log10 [Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb) 2_820/Lc3)寡DNA杂交体或寡RNAd杂交体对少于20个核苷酸而言Tm = 2 (ln)对20-35 个核苷酸而言Tm = 22+1. 46 (ln)a或者用于其他一价阳离子,但是仅在0. 01-0. 4M范围内是精确的。MX对于在30% -75%范围内的% GC是精确的。CL =双链体的碱基对长度。
10
d01igo,寡核苷酸;ln,=引物的有效长度=2X (G/C数)+ (A/T数)。可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白 质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非 同源性探针,可以通过变换以下条件之一 (i)渐进地降低复性温度(例如从68°C至42°C) 或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)进行一系列杂交。技术人员了解可 以在杂交期间变更并且会维持或改变所述严格条件的多个参数。除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特 异性杂交引起的背景,用稀释的盐溶液洗涤样品。此类洗液的关键因素包括最终洗涤溶液 的离子强度和温度盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在 杂交严格性上或低于所述杂交严格性进行。阳性杂交产生至少两倍于背景信号的信号。通 常,用于核酸杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择严格 性更高或更低的条件。技术人员了解可以在洗涤期间变更并且会维持或改变所述严格条件 的多个参数。例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65°C 于1XSSC中或在42°C于1XSSC和50%甲酰胺中杂交,随后在65°C于0. 3XSSC中洗涤。 用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50°C于4X SSC 或在40°C于6XSSC和50%甲酰胺中杂交,随后在50°C于2XSSC中洗涤。杂交体的长度 是杂交核酸的预期长度。当序列已知的核酸杂交时,可以通过比对序列并鉴定本文中所述 的保守区而确定杂交体长度。1\33(是0. 15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶 液可以额外地包括5XDenhardt试剂、0. 5-1.0% SDSUOOu g/ml变性的片段化鲑精DNA、 0.5%焦磷酸钠。出于定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning :a laboratory manual,第三版 Co Id Spring Harbor LaboratoryPress, CSH, New York 或参考 Current Protocols in Molecular Biology, John Wiley & Sons,N. Y. (1989 和年度更新 版)。剪接变体如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含 子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是基本上保 留蛋白质的生物学活性的一类变体;这可以通过选择性保留蛋白质的功能片段实现。此类 剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本 领域熟知的(见例如 Foissac 和 Schiex(2005)BMC Bioinformatics. 6 25)。等位变体等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包 含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。 SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。基因改组/定向进化基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具 有改良生物学活性的蛋白质的核酸或其部分的变体而组成(Castle等人,(2004)Science 304(5674) 1151-4 ;美国专利 5,811,238 和 6,395,547)。
调节元件/调控序列/启动子术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广 泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子”一般指 位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接的 核酸转录的核酸调控序列。前述术语包括从经典真核基因组基因(包括对于精确转录启动 所需的TATA框,具有或没有CCA T框序列)衍生的转录调节序列和应答发育性刺激和/或 外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、增强子 和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下它可以包括一个-35 框序列和/或一个-10框转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸分 子在细胞、组织或器官中表达的人工融合分子或衍生物。“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启 动子不必须是植物来源的,但可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植 物启动子”也可以源自植物细胞,例如来自用本发明方法中待表达的并在本文中描述的核 酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。用于本发明方 法中的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修 饰,但不影响启动子、可读框(0RF)或3’调节区如终止子或远离0RF存在的其他3’调节区 的功能性或活性。还有可能所述启动子的活性因修饰其序列或它们被更活跃的启动子、甚 至来自异源生物的启动子彻底替换而提高。为了在植物中表达,如上所述,核酸分子必须有 效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。为鉴定功能性等同启动子,候选启动子的启动子强度和/或表达模式可以例如通 过将此启动子有效连接至报道基因并分析该报道基因在植物的多种组织中的表达水平和 模式进行分析。合适的熟知报道基因包括例如葡糖醛酸酶或半乳糖苷酶。启动子活 性通过测量葡糖醛酸酶或半乳糖苷酶的酶活性进行分析。启动子强度和/或表达 模式可以随后与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/或 表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显影 图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6 :986_994),通 过量化mRNA水平或通过将本发明方法中所用核酸的mRNA水平与持家基因(如18S rRNA) 的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动子。 “低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转 录物的水平上。相反,“强启动子”驱动编码序列在高水平、或以每个细胞约1/10转录物至 约1/100转录物、至约1/1000转录物表达。有效地连接如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能连接,从 而该启动子序列能够启动该目的基因转录。组成型启动子“组成型启动子”指在生长和发育的大部分期间但不是必需在全部期间,以及在大 多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2C给出组成 型启动子的例子。遍在启动子
遍在启动子是在生物的全部组织或细胞中基本上有活性的。发育调节型启动子发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活 性。诱导型启动子诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu. Rev. PlantPhysiol. Plant Mol.Biol. ,48 :89_108)、环境刺激或物理刺激时具有诱导的或提高的转录启动作 用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时其激活,或是“病原体诱导 的”,即当植物暴露于多种病原体时其激活。器官特异件/组织特异件启动子器官特异性或组织特异性启动子是能够偏好地启动某些器官或组织如叶、根、种 子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植 物根中具有转录活性,在植物的任何其他部分中基本上无活性,尽管在该植物的这些其他 部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞 特异性的”。根特异性启动子的例子列于下表2A中。表2A 根特异性启动子的例子 种子特异性启动子是能够在种子组织中优势地具有转录活性的启动子,但无需排 他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子 发育期间和/或萌发期间有活性。种子特异性启动子的例子示于下表2B中。种子特异性 启动子的其他实例在 Qing Qu和 Takaiwa(Plant Biotechnol. J. 2,113—125,2004)中给出, 所述文献的公开内容如完整所述那样通过引用方式并入本文。表2B 种子特异性启动子的例子如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性 的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分中仍允 许任意泄露表达。表2c 组成型启动子的例子 组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织 中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分 中仍允许任意泄露表达。终止子术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产 生初级转录物的3’加工和多腺苷酸化及转录终止的信号。终止子可以从天然基因、从多种 其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶基因或章鱼碱合酶 基因或备选地从另一种植物基因或较次优选地从任何其他真核基因衍生。调节就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物 相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未 调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语 “调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何改变,这引起植物产量 提高和/或生长增加。表达术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体 的转录。术语“表达”或“基因表达”尤其意指某个基因或某些基因或基因构建体转录成结 构性RNA (rRNA.tRNA)或mRNA,所述RNA随后翻译成或不翻译成蛋白质。该过程包括DNA的转录和所得mRNA产物的加工。增加的表汰/过量表汰如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水 平为额外的任何形式的表达。用于提高基因或基因产物表达的方法在本领域内被充分报道并且包括例如由适 宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以导入在非异源形式的多核 苷酸的适宜位置(一般在上游)中导入充当启动子或增强子元件的分离的核酸,从而上调 编码目的多肽的核酸表达。例如,可以在体内通过突变、缺失和/或替换而改变内源性启动 子(见Kmiec,US5, 565,350 ;Zarling等,W09322443),或可以将分离的启动子以相对于本 发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端包括多腺苷酸化区。 该多腺苷酸化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端 序列可以从例如胭脂碱合酶基因或章鱼碱合酶基因或备选地从另一种植物基因或较不优 选地从任何其他真核基因衍生。内含子序列也可以添加至5’非翻译区(UTR)或部分编码序列的编码序列以提 高细胞质中聚集的成熟信使的量。已经显示在植物和动物表达构建体的转录单位中包 含可剪接内含子提高了 mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和 Berg(1988)Mol. Cell biol. 8 :4395_4405 ;Callis等(1987)Gens Dev 1 :1183_1200)。此类 内含子增强基因表达的作用一般在所述内含子置于转录单位的5’末端附近时最强烈。玉米 内含子Adhl-S内含子1、2和6、Bronze-1内含子的用途是本领域已知的。对于总体信息, 见《玉米手册》,第 116 章,编者 Freeling 和 Walbot,Springer, N. Y. (1994)。内源基因本文中对“内源性”基因的称谓不仅指如植物中以其天然形式(即没有人类任何 干预)存在的所讨论基因,还指处于分离形式的随后(再)被导入植物(转基因)的相同 基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因 表达的相当大程度地度降低和/或内源基因表达的实质降低。分离的基因可以从生物分离 或可以是人造的,例如通过化学合成法。降低的表达本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或 多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上 消除以增加的优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90% 或 95%、96%、97%、98%、99% 或更多降低。为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷 酸的足够长度。为进行基因沉默,该长度可以短至20、19、18、17、16、15、14、13、12、11、10个 或更少核苷酸,或者该长度可以长至整个基因(包括部分或完整的5’和/或3’UTR)。基本 上连续的核苷酸片段可以从编码目的蛋白的核酸(靶基因)或从能够编码目的蛋白的直向 同源物、旁系同源物或同源物的任何核酸衍生。优选地,基本上连续的核苷酸的片段能够与 靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增加的优选顺 序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于 降低或基本消除内源基因表达的多种方法的前提。可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除 内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下, 从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核 酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,(部分或完全地)作为被 间隔序列(非编码性DNA)隔开的反向重复序列。在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用 降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆该反向重复序列。 非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于 形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或 完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hp RNA由植 物加工成siRNA,该siRNA被掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述 mRNA转录物,从而相当大程度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细 节,见例如 Grierson 等人(1998)W0 98/53083 ;ffaterhouse 等人(1999)W0 99/53050。本发明方法的实施不取决于在植物中导入并表达将所述核酸作为反向重复序列 克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法中任何一种或多种方法 来实现相同效果。用于降低内源基因表达的一种这样的方法是RNA介导的基因表达沉默(下调)。 在这种情况下,沉默作用由植物中与内源性靶基因实质相似的双链RNA序列(dsRNA)触发。 这种dsRNA进一步被植物加工成约20个至约26个核苷酸的所谓短干扰RNA (siRNA)。所 述siRNA被掺入RNA诱导的沉默复合体(RISC),其中所述RISC切割内源靶基因的mRNA转 录物,从而相当大程度地将降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA 序列与靶基因对应。RNA沉默方法的另一个例子涉及将核酸序列或其部分(在此情况下是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上连续的核苷酸)以有义方向导入植物。“有义方向”是指与自身mRNA转录物同源的DNA 序列。因而将所述核酸序列的至少一个拷贝导入植物。这个额外核酸序列会降低内源基因 表达,从而产生已知为共抑制作用的现象。将一个核酸序列的几个额外拷贝导入植物时,基 因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。RNA沉默方法的另一个例子涉及使用反义核酸序列。“反义”核酸序列包含与编码 蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列 互补的核苷酸序列。反义核酸序列优选地互补于待沉默的内源基因。这种互补性可以存在 于基因的“编码区”中和/或其“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基 的密码子的核苷酸序列的区域。术语“非编码区”指分布在编码区侧翼的被转录但不翻译 成氨基酸的5’和3’序列(也称作5’和3’非翻译区)。反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以互补于整个核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁 系同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸),不过也可以是仅对所 述核酸序列的一部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列 可以互补于编码多肽的mRNA转录物的翻译起点周围的区域。合适反义寡核苷酸序列的长 度是本领域已知的并且可以从约50、45、40、35、30、25、20、15或10个核苷酸或更小的核苷 酸长度开始。本发明的反义核酸序列可以使用化学合成反应和酶连接反应,利用本领域已 知的方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在核苷酸 或以多种方式修饰的核苷酸化学地合成,其中所述的修饰核苷酸设计旨在增加分子的生物 学稳定性或增加反义与有义核酸序列之间所形成的双链体的物理稳定性,例如,可以使用 硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子 是本领域熟知的。已知的核苷酸修饰包括甲基化、环化和‘加帽’及用类似物(如肌苷)替 换一个或多个天然存在核苷酸。对核苷酸的其他修饰作用是本领域熟知的。反义核酸序列可以使用表达载体以生物学方式产生,其中一种核酸序列已经以反 义方向亚克隆(即从插入的核酸转录出的RNA会对目的靶核酸为反义方向)到所述表达载 体中。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核 酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。用于本发明方法中沉默作用的核酸分子(无论被导入植物中或原位(insitu)地 产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合以因而抑制蛋白质的表达, 例如通过抑制转录和/或翻译做到这一点。杂交可以因形成稳定双链体的常规核苷酸互 补性引起,或例如,在与DNA双链体结合的反义核酸序列的情况下,因双螺旋大沟内的特异 性相互作用引起。反义核酸序列可以通过在特定组织部位转化或直接注射导入植物。备选 地,反义核酸序列可以被修饰以靶向所选的细胞并且随后全身性施用。例如,对于全身性施 用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结 合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做 到这一点。反义核酸序列也可以使用本文中所述的载体递送至细胞。根据又一个方面,反义核酸序列是a-端基异构核酸序列。a端基异构核酸序 列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述 链彼此平行(Gaultier等(1987)Nucl Ac Resl5 :6625_6641)。反义核酸序列也可以包含 2,-0-甲基核糖核苷酸(Inoue 等(1987) Nucl Ac Res 15,6131-6148)或嵌合 RNA-DNA 类 似物(Inoue 等(1987) FEBS Lett. 215,327-330)。内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸 酶活性的催化性RNA分子,能够切割与之具有互补区域的单链核酸序列,如mRNA。因此, 核酶(例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述) 可以用来催化地切割编码多肽的mRNA转录物,因而相当大程度地降低待翻译成多肽的 mRNA转录物的数目。可以设计对核酸序列具有专一性的核酶(见例如Cech等美国专利 号4,987,071 ;和Cech等美国专利号5,116,742)。备选地,与核酸序列相对应的mRNA转 录物可以用来从RNA分子的汇集物中选出具有特定核糖核酸酶活性的催化性RNA(Bartel 和Szostak (1993) Science 261,1411-1418)。核酶在植物中用于基因沉默的用途是本领域 已知的(例如 Atkins 等(1994) W0 94/00012 ;Lenne 等(1995) W0 95/03404 ;Lutziger 等(2000)W0 00/00619 ;Prinsen 等(1997)WO 97/13865 和 Scott 等(1997)W097/38116)。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(Amp1 icon VIGSWO 98/36083)或 Baulcombe(W0 99/15682)及其他人描述的策略实现。如果内源基因中存在突变和/或在随后导入植物的分离基因/核酸中存在突变, 基因沉默也可能发生。所述降低或基本上消除可以由无功能的多肽引起。例如,该多肽可 以与多种相互作用的蛋白质结合;一种或多种突变和/或截短作用因而可以产生仍能够结 合相互作用的蛋白质(如受体蛋白)但不能展示正常功能的多肽(如信号传导配体)。基因沉默的又一种方法是瞄准互补于基因调节区(例如启动子和/或增强子) 的核酸序列以形成阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res. 6,569-84,1991 ;Helene 等,Ann. N. Y. Acad. Sci. 660,27-361992 ;和 Maher, L. J. Bioassays 14,807-15,1992。技术人员会熟知其他方法,如使用针对内源多肽的抗体以抑制该多肽在植物中 (in planta)的功能,或干扰涉及某多肽的信号传导途径。特别地,可以考虑人造分子可能 用于抑制靶多肽的生物学功能,或用于干扰涉及所述靶多肽的信号传导途径。备选地,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体 编码具有降低的活性的多肽。也可以使用此类天然变体,例如来进行同源重组。人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源 miRNA是通常19-24个核苷酸长度的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻 译的功能。大多数的植物微RNA (miRNA)与其靶序列具有完全或接近完全的互补性。然而, 存在具有多达5个错配的天然靶。它们从具有特征性折返结构的较长非编码性RNA由Dicer 家族的双链特异性RNA酶加工得来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的 主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们 与胞浆中的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁 和/或翻译抑制。miRNA过量表达的影响因此往往反映为靶基因的mRNA水平降低。可以专门地遗传工程化一般21个核苷酸长度的人工微RNA(amiRNA)以负向地调 节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。 用于靶识别的经验参数已经被定义并可以用来辅助具体amiRNA的设计(Schwab等,Dev. Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获得的 (Schwab 等,2006 Plant Cell. 2006 18(5) :1121_33)。为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子 叶植物的核酸序列转化单子叶植物,并使用来自双子叶植物的核酸序列转化双子叶植物。 优选地,将来自任意的给定植物物种的核酸序列导入相同的物种。例如,将来自稻的核酸序 列转化到稻植物中。然而,不绝对要求待导入的核酸序列来自与待导入该核酸序列的植物 相同的植物物种。只要内源靶基因与待导入的核酸之间存在实质同源性即可。上文描述了用于降低或基本上消除植物中内源基因表达的多种方法的例子。例 如,本领域技术人员将能够轻易调整用于沉默的前述方法,从而通过利用合适的启动子在 完整植物中或其部分中实现内源基因表达的降低。选择标记(基因)/报道基因
“选择标记”、“选择标记基因”或“报道基因”包括对细胞赋予表型的任何基因,其 中在所述细胞中表达该“选择标记”、“选择标记基因”或“报道基因”以促进鉴定和/或选择 用本发明核酸构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而鉴定核 酸分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入新代谢性状 或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如使新霉素和 卡那霉素磷酸化的nptll或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、链霉素、四环 素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin) (G418)、壮观霉素或杀稻瘟菌素 的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta 抗性的bar ;提供草甘膦抗性的 aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状 的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异构酶,或抗营 养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如0 -葡糖醛酸酶、 GUS或0 -半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧 光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。技术人员 熟悉此类标记。取决于生物和选择方法,优选不同的标记。已知当核酸稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且根据 需要,将其整合至细胞的基因组中,这取决于所用的表达载体和所用的转染技术。为鉴定并 选择这些整合体,通常将编码选择标记的基因(如上文所述的基因)连同目的基因一起导 入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体中使用。 此外,编码选择标记的核酸分子可以在包含编码本发明多肽或在本发明方法中使用的序列 的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸稳定转染的细胞可以 通过选择加以鉴定(例如具有整合的选择标记的细胞存活而其他细胞死亡)。因为一旦已经成功地导入所述标记基因、尤其抗生素抗性基因和除草剂抗性基 因,则这些核酸不再是转基因宿主细胞中需要的或是不想要的,故而,用于导入核酸的本发 明方法有利地使用能够移除或切除这些标记基因的技术。一种这样的方法是所谓共转化 法。共转化法同时使用两种载体以转化,一种载体携带本发明的核酸而第二种载体携带标 记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体)这两种载 体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼 存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过实施杂交从转化植物 中移除。在另一种方法中,整合至转座子的标记基因用于随目的核酸一起转化(称作Ac/Ds 技术)。转化体可以与转座酶来源物杂交,或转化体用引起转座酶表达的核酸构建体瞬时或 稳定转化。在一些情况下(大约10% ),一旦转化已经成功发生,则转座子从宿主细胞的基 因组跳出并丢失。在其他许多情况下,转座子跳到一个不同位置。在这些情况下,标记基因 必须通过实施杂交来消除。在微生物学中,开发了有可能或促进检测这类事件的技术。又 一种有利方法依赖于所谓重组系统;所述方法的优势在于杂交消除作用可以用该重组系统 实行。最知名的该类型系统称作Cre/lox系统。Crel是移除位于loxP序列之间序列的重 组酶。如果标记基因整合于loxP序列之间,一旦转化已经成功发生,则它因重组酶的表达 被移除。其他重组系统是 HIN/HIX、FLP/FRT 和 REP/STB 系统(Tribble 等,J. Biol. Chem., 275,2000 22255-22267 ;Velmurugan 等,J. Cell Biol.,149,2000 :553_566)。位点特异性 地整合本发明核酸序列至植物基因组是可能的。自然,这些方法也可以应用于微生物如酵母、真菌或细菌。转基因的/转基因/重组为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含 所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生 物,这些构建体均通过重组方法产生,其中(a)编码在本发明方法中有用的蛋白质的核酸序列,或(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或(c)a)和b)并不位于它们的天然遗传环境中或已经通过重组方法被修饰,所述的 修饰有可能采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境 理解为意指原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组 文库的情况下,优选地保留,至少部分地保留该核酸序列的天然遗传环境。该环境分布在该 核酸序列的至少一侧并且具有至少50bp、优选至少500bp、特别优选至少lOOObp、最优选至 少5000bp序列长度。当通过非天然、合成性(“人工”)方法(例如诱变处理)修饰天然存 在表达盒时,该表达盒_例如所述核酸序列的天然启动子与编码如上文所定义在本发明方 法中有用的多肽的相应核酸序列的天然存在组合_变成转基因表达盒。合适的方法例如在 US 5,565,350 或 W0 00/15815 中描述。为了本发明的目的,如上所述,将转基因植物因而理解为意指在本发明方法中使 用的核酸不处于它们在所述植物基因组中的天然基因座处,所述核酸有可能同源或异源地 表达。然而,如所提及,转基因还意指尽管本发明的或在本发明方法中使用的核酸处在植物 基因组中它们的天然位置处,然而相对于天然序列而言,其序列已经被修饰,和/或所述天 然序列的调节序列已经被修饰。转基因优选地理解为意指本发明核酸在基因组中非天然基 因座处表达,即所述核酸的同源表达或优选异源表达发生。在本文中提及优选的转基因植 物。MiL如本文中提及的术语“导入”或“转化”包括转移外源多核苷酸至宿主细胞中,无论 转化所用的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织 可以用本发明的基因构建体转化并且可完整植物以从中再生。所选的具体组织根据可用于 并且最好适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、 花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存的分生组织(例如顶端分生组织、腋芽和 根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以 瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至 宿主基因组中。所得的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转 化植物。外来基因转移至植物基因组的过程称作转化。植物物种的转化现在是相当常规的 技术。有利地,可以使用几种转化方法中的任意方法将目的基因导入合适的祖先细胞。描 述用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转 化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子 枪轰击法、使用病毒或花粉的转化法和微量投射法(microprojection)。转化方法可以选 自用于原生质体的钙/聚乙二醇法(Krens,F.A.等人,(1982)Nature296,72-74 ;NegrutiuI 等人(1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R. D.等人 (1985) Bio/Techno 1 3,1099-1102);对植物材料的微量注射法(Crossway A 等人,(1986) Mol. Gen Genet 202 179-185) ;DNA 或 RNA 包被粒子轰击法(Klein TM 等人,(1987) Nature 327:70)、用(非整合性)病毒感染等。包括转基因作物植物在内的转基因植物优选通过 农杆菌介导的转化法产生。有利的转化方法是植物原位(in planta)转化法。为此目的, 例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明, 已经证明将转化的农杆菌悬液作用于完整植物或至少作用于花原基是特别有利的。随后 培育该植物直至获得已处理植物的种子(Clough和Bent, Plant J. (1998) 16,735-743)。 用于农杆菌介导稻转化的方法包括用于稻转化的熟知方法,如在以下任意文献中描述的那 些方法欧洲专利申请 EP 1198985A1,Aldemita 和 Hodges (Planta 199:612-617,1996); Chan 等(Plant Mol Biol 22(3) :491_506,1993),Hiei 等(Plant J 6(2) :271_282,1994), 其公开内容如充分所述那样通过引用的方式并入本文。在谷物转化的情况下,优选的方 法如 Ishida 等人(Nat. Biotechnol 14(6) :745_50,1996)或 Frame 等人(Plant Physiol 129(1) =13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所 述方法例如还由 B. Jenes 等,Techniques for Gene,在Transgenic Plants,第 1 卷, Engineering and Utilization,编者 S. D. Kung 和 R. ffu, AcademicPress (1993) 128-143 及 在 Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225)中描述。待 表达的核酸或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的 载体,例如pBinl9(Bevan等,Nucl. Acids Res. 12 (1984) 8711)。通过这种载体转化的农杆 菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟南 芥在本发明范围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过在农 杆菌溶液中浸泡擦伤的叶或切碎的叶并随后在合适培养基中培育它们。借助根癌农杆菌 转化植物例如由Hfifgen和Willmitzer在Nucl. Acid Res. (1988) 16,9877中描述或尤其
从F.F.White,用于高等植物中基因转移的载体(Vectors for Gene Transfer in Higher Plants);在Transgenic Plants,第 1 卷,Engineering and Utilization, S. D. Kung禾口 R. Wu 编著,Academic Press,1993,第 15-38 页中获知。 除了转化随后必需再生成完整植物的体细胞之外,也可以转化植物分生组织的 细胞,并且尤其那些发育成配子的细胞。在这种情况下,转化的配子遵循天然的植物发育 过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发 育的植物中获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman, KA 禾口 MarksMD(1987)Mol Gen Genet 208 274-289 ;Feldmann K (1992),在编者 CKoncz, N-H Chua 禾口 J Shell, Methods in Arabidopsis Research. WordScientific, Singapore, 第274-289页]。备选方法基于反复移除花序并将莲座丛中心内的切除部位与转化的农杆 菌孵育,因而同样可以在较晚的时间点获得转化的种子(Chang(1994)Plant J. 5 :551_558 ; Katavic(1994)MolGen Genet, 245 =363-370) 然而,特别有效的方法是改良真空渗入法, 如“浸花”法。在拟南芥属植物真空浸润法的情况下,用农杆菌悬液在减低的压力下处 理完整植物[Bechthold,N(1993). C R Acad Sci Paris Life Sci,316 :1194_1199],而 在“浸花”法的情况下,将正在发育的花组织与表面活性剂处理过的农杆菌悬液短暂孵育 [Clough,SJ 和 Bent,AF (1998) The Plant J. 16,735-743]。在这两种情况下均收获某个比例的转基因种子,并且这些种子可以通过生长在如上所述的选择条件下与非转基因种子区 分开。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母系方式遗传,这降低 或消除了借助花粉的转基因流动风险。叶绿体基因组的转化一般通过已经在Klaus等人, 2004 [Nature Biotechnology 22 (2),225-229]中示意性展示的方法实现。简而言之,将待 转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源 侧翼序列指导向原质体系的位点特异性整合。已经对许多不同的植物物种描述质体转化 法并且在Bock (2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology). J Mol Biol. 2001 年月 21 日;312 (3) :425_38 或 Maliga, P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology), TrendsBiotechnol. 21, 20-28 中给出综述。其他 的生物技术进展最近已经以无标记质体转化体的形式报道,其中可以通过瞬时共整合的 标记基因产生所述无标记质体转化体(Klaus等人,2004,Nature Biotechnology 22(2), 225-229)。T-DNA 活化标签技术(T-DNA activation tagging)T-DNA活化标签技术(Hayashi等Science (1992) 1350-1353)涉及以如此方式在目 的基因的基因组区域内或基因的编码区上游或下游10kb处插入通常含有启动子(也可以 是翻译增强子或内含子)的T-DNA,从而该启动子指导所靶向基因的表达。一般,目标基因 的天然启动子对该基因表达的调节作用被破坏,并且该基因受新导入的启动子控制。该启 动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且引 起在所插入T-DNA附近的基因表达受到调节。所得的转基因植物表现显性表型,原因在于 所导入启动子附近的基因受修饰的表达。TILLING术语“TILLING”是“基因组中定向诱导的局部损伤法”的缩写并且指用于产生和/ 或鉴定核酸的诱变技术,其中所述核酸编码表达和/或活性改良的蛋白质。TILLING还允许 选择携带此类突变变体的植物。这些突变变体可以展示在强度或在位置或在时间方面改良 的表达(例如,如果所述突变影响启动子)。这些突变变体可以展示比其天然形式基因所表 现活性更高的活性。TILLING联合了高密度诱变法与高通量筛选法。TILLING中一般所遵循 的步骤是(&作]\^诱变(1^(161 GP和Koncz C (1992)在Methods inArabidopsis Research, Koncz C, Chua NH, Schell J, Singapore编辑,World Scientific Publishing Co,第 16-82 页;Feldmann等,(1994)在Meyerowitz EM, Somerville CR编辑,Arabidopsis. Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY,第 137-172 页;Lightner 禾口 Caspar T(1998) ^ J Martinez-Zapater, J SalinasMethods onMolecular Biology H 82 卷 Humana Press, Totowa, NJ,第 91-104 页);(b)DNA 制备和汇集个体 DNA ; (c)PCR 扩增 目的区域;(d)变性和复性以允许异双链体形成;(e)DHPLC,其中汇集物中异双链体的存在 被检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)将突变PCR产物测序。用于 TILLING 的方法是本领域熟知的(McCallum 等,(2000)Nat Biotechnol 18 :455_457 ;综述 ML Stemple(2004)Nat Rev Genet 5(2) 145-50)。同源重组同源重组允许在基因组中限定选择的位置处导入所选择的核酸。同源重组是在生物科学中例行用于低等生物如酵母或展叶剑叶藓属(Physcomitrella)苔藓的标准技术。 已经对模式植物(Offringa等(1990) EMBO J 9(10) :3077_84)和作物植物例如稻(Terada 等(2002)NatBiotech 20(10) 1030-4 ;Iida 和 Terada(2004)Curr Opin Biotech 15(2) 132-8)描述了用于植物中进行同源重组的方法,并且存在与靶生物无关而通常适用的方法 (Miller 等,Nature Biotechnol. 25,778-785,2007)。术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并且与时 间间隔有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际 产量是某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以 种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗 生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。早期牛长势“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可 以因提高的植物适应性所致,其中所述提高的植物适的原因是例如该植物更好地适应环境 (即优化能量资源的用途和在苗与根之间的分配)。具有早期生长势的植物也显示提高的 籽苗存活和更佳的作物建立,这往往产生高度均一的田块(作物以均一方式生长,即大多 数植物在基本上相同的时间达到各个发育期)和往往更好及更高的产量。因而,早期生长 势可以通过测量多种因素如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分 数、籽苗生长、籽苗高度、根长度、根和苗生物量和许多其他因素等确定。提高/改善/增强术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如本 文中定义的对照植物相比较,至少3%、4%、5%、6%、7%、8%、9%或10%、优选至少15% 或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。种子产量提高的种子产量自身可以表现为以下一个或多个指标a)种子生物量(种子总重 量)增加,这可以基于单粒种子基础和/或每株植物和/或每平方米;b)提高的每株植物 花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充实种子数与种子总 数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产量与总生物量的比 率;和f)提高的千粒核重(TKW),这从计数的充实种子数及其总重量中外推出来。提高的 TKW可以因增加的种子尺寸和/或种子重量弓|起,并且也可以因胚尺寸和/或胚乳尺寸增加 引起。种子产量的提高也可以表现为种子尺寸和/或种子体积的增加。此外,种子产量 的提高自身也可以表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提 高。提高的产量也可以产生改良的构造,或可以因改良的构造而出现。绿度指数从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每 个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/ 红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在养分可 利用性降低的生长条件下,植物的绿度指数在开花前的最后成像中测量。相反,在干旱胁迫生长条件下,植物的绿度指数在干旱后的首次成像中测量。脑本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、苗、茎、 叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核 酸。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、 花粉和小孢子,同样其中每种前述对象包含目的基因/核酸。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤 其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或 灌木,其中所述植物选自包含以下物种的名单槭树属物种(Acer spp.)、猕猴桃属物种 (Actinidia spp. )、fCM 禾中(Abelmoschus spp. )(Agave sisalana) ^^JC^M^J 种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属物种(Allium spp.)、苋 属物禾中(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananascomosus)、 番荔枝属物种(Annona spp.)、旱芹(Apium graveolens)、蜘蛛兰属物种(Arachis spp.)、 木波罗属物种(Artocarpus spp.)、石刁柏(Asparagusofficinalis)、燕麦属物种(Avena spp.)(例如燕麦(Avena sativa)、里予燕麦(Avenafatua)、比赞燕麦(Avena byzantina) > Sf^^J^^ft (Avena fatua var. sativa) (Avena hybrida)、P曰杉匕(Averrhoa carambola) > M tt M (Bambusasp. ) > # /R (Benincasa hispida) > E M ^ (Bertholletia excelsea)、甜菜(Betavulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、#青物禾中(Brassica rapa ssp.)[卡 i若拉油菜、油禾子油菜(oilseed rape) > M 胄(turniprape) ]) > Cadaba farinosa> ^ (Camellia sinensis) > _ 入■ (Canna indica)、大麻(Cannabis sativa)、辣椒属物禾中(Capsicum spp. ) > Carex elata、番木瓜 (Carica papaya) > (Carissa macrocarpa) > |JL| M ft (Caryaspp. ) > tE 花(Carthamus tinctorius)、栗属物禾中(Castanea spp.)、美洲木棉(Ceibapentandra)、 苦苣(Cichorium endivia)、樟属物禾中(Cinnamomum spp.)、西瓜(Citrullus lanatus)、 柑桔属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋 头(Colocasia esculenta)、非洲梧桐属物种(Colaspp.)、黄麻属(Corchorus sp.)、芫荽 (Cor i an drum sativum)、棒属物禾中(Corylusspp.)、山才查属物禾中(Crataegus spp.)、番红 ^ (Crocus sativus) ^/RM^ft (Cucurbita spp. )、#j!M 禾中(Cucumis spp.) 属物种(Cynara spp.)、胡萝卜(Daucus carota)、山马幢属物种(Desmodium spp.)、龙眼 (Dimocarpuslongan) (Dioscorea spp.)、t市丰对属物禾中(Diospyros spp.)、禾卑 属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油 棕(Elaeis oleifera))、糝子(Eleusine coracana)、蔗茅属物种(Erianthus sp.)、枇杷 (Eriobotrya japonica)、㈱属_禾中(Eucalyptus sp. )、tl [子果(Eugeniauniflora)、#■属 物种(Fagopyrum spp. )、7jC 青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、 无花果(Ficus carica)、金桔属物种(Fortunellaspp.)、草莓属物种(Fragaria spp.)、 银杏(Ginkgo biloba)、大豆属(Glycinespp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向曰奏(Helianthusannuus))、长管营草(Hemerocallis fulva)、木樓属 物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘M (Ipomoea batatas)、核杉匕属物禾中(Juglans spp.)、萬 H (Lactuca sativa)、山 H 豆 属物禾中(Lathyrusspp.)> 兵豆(Lens culinaris)> M 麻(Linum usitatissimum)> M 枝(Litchichinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、 习习扇豆属物禾中(Lupinus spp. ) > Luzula sylvatica、番 属物禾中(Lycopersiconspp.) (例如番爺(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、凹缘金虎 尾(Malpighia emarginata)、牛油果(Mammeaamericana)、芒果(Mangifera indica)、木 WM^ft (Manihot spp.(Manilkara zapota)^^!! (Medicago sativa)
禾中(Melilotus spp.)、_^M 禾中(Mentha spp. (Miscanthus sinensis) 瓜属物种(Momordicaspp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种 (Nicotianaspp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntia spp.)、鸟足豆属 物种(Ornithopus spp.)、稻属(Oryza spp.)(例如稻、阔叶稻(Oryza latifolia))、稷 (Panicum mi 1 iaceum) >(Panicum virgatum) > X^S^ (Passifloraedulis) >
M (Pastinaca sativa) ^^M^M^ft (Pennisetum sp.)、鱼f 禾中(Persea spp.)、 Jf (Petroselinum crispum)、(Phalarisarundinacea) > ^ ii M ft (Phaseolus spp.)、猫尾草(Phleum pratense)、朿 lj 奏属物禾中(Phoenix spp.)、南方声華(Phragmites australis)、酸菜属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pi sum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、 牧豆草属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidiumspp.)、 石 (Punica granatum)、西洋梨(Pyrus communis)、f乐属物禾中(Quercusspp.)、萝卜 (Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶薦子属物禾中(Ribes spp.)、蓖麻 (Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔴属物种(Saccharum spp.)、柳属 物种(Salix sp.)、接骨木属物种(Sambucusspp.)、黑麦(Secale cereale)、胡麻属物种 (Sesamum spp.)、白芥属物种(Sinapissp.)、爺属(Solanum spp.)(例如马铃薯(Solanum tuberosum)、红爺(Solanumintegrifolium)或番爺)、两色蜀黍(Sorghum bicolor)、菠菜 属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸 ii (Tamarindus indica) > bJ bJW (Theobroma cacao)、$$由胃属 禾中(Trifoliumspp.) > Triticosecale rimpaui、小麦属(Triticum spp.)(例如普通小麦(Triticumaestivum)、硬 粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦 (Triticum macha)、普ffl/j、麦(Triticumsativum)或普通zj、麦(Triticum vulgare))、/j、金 莲花(Tropaeolum minus)、金莲花(Tropaeolum majus)、越桔属物禾中(Vaccinium spp.)、野 碗豆属物种(Viciaspp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种 (Vitis spp.)、玉米(Zea mays)、Zizania palustris、麥属物禾中(Ziziphus spp.)及其他。发明详述令人惊讶地,现在已经发现调节植物中编码D0F-C2结构域转录因子或MYB7多肽 的核酸的表达产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案, 本发明提供了用于相对于对照植物而言增强植物中产量相关性状的方法,包括调节植物中 编码D0F-C2结构域转录因子或MYB7多肽的核酸的表达。表述“增强/增强的产量相关性状”和“改善/改进的产量相关性状”具有相等的含义并且在本文中可互换地使用。表述“改善/改进的产量相关性状”和“改善/改进的植物生长特征”具有相等的 含义并且在本文中可互换地使用。用于调节(优选增加)编码D0F-C2结构域转录因子或MYB7多肽的核酸表达的优 选方法是在植物中导入并表达分别编码D0F-C2结构域转录因子或MYB7多肽的核酸。下文任何对“在本发明方法中有用的蛋白质”的谈及意指如本文中定义的D0F-C2 结构域转录因子多肽或MYB7多肽。下文任何对“在本发明方法中有用的核酸”的谈及意指 能够编码这种D0F-C2结构域转录因子多肽或这种MYB7多肽的核酸。待导入植物(并且因 而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型的任意核酸,下文也 称作“D0F-C2转录因子核酸”或“D0F-C2转录因子基因”或“MYB7核酸”或“MYB7基因”。如本文中所定义的术语“D0F-C2转录因子多肽”指包含如下特征⑴和特征(ii) 的任意多肽(i)DOF结构域,其以增加的优选顺序与由SEQ ID NO 35或SEQ IDN0 36代表的 D0F 结构域序列具有至少 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%, 96%、97%、98%、99%或更多的序列同一性;和(ii)具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2 或1个非保守性氨基酸替换的基序I :ERKARPQKDQ(SEQ IDN0 37);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有3、2或1个非 保守性氨基酸替换的基序II :YWSGMI (SEQ ID NO 38)。如本文中所用的术语“D0F-C2转录因子多肽”、“D0F-C2转录因子蛋白”、“D0F-C2 转录因子”、“D0F-C2多肽”和“D0F-C2蛋白”具有相同含义并且是彼此可互换的。额外地,D0F-C2多肽可以包含1、2、3、4种或全部的以下基序-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或 1个非保守性氨基酸替换的基序III :RLLFPFEDLKPLVS(SEQID NO 39);和/或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有4、3、2或1 个非保守性氨基酸替换的基序IV JNVKPMEEI (SEQ ID NO 40);和/或;-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、 4、3、2或1个非保守性氨基酸替换的基序V :KNPKLLHEGAQDLNLAFPHH(SEQ ID NO 41);和/ 或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或 1个非保守性氨基酸替换的基序VI :MELLRSTGCYM(SEQ IDN0 42);和/或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、 4、3、2 或 1 个非保守性氨基酸替换的基序 VII :MMDSNSVLYSSLGFPTMPDYK (SEQ ID NO 43)。在本发明方法中有用的优选多肽包含如特征⑴中所述的Dof结构域并包含基序 I和II。更优选地,包含基序I、基序II和基序III。进一步优选地,该多肽也包含基序III。 进一步优选地,该多肽也包含基序IV。最优选地,该多肽包含如特征(i)中所述的Dof 结构 域和基序I、基序II、基序III、IV和V。(由SEQID N0:1编码的)SEQ ID NO :2是D0F-C2转录因子多肽的例子,其中所述 D0F-C2转录因子多肽包含如本文以上所定义的特征(i)和(ii),即与由SEQ ID NO :35或SEQ ID NO 36代表的Dof结构域具有至少60%序列同一性,并且具有基序I和在这种情况 下额外包含基序II。在表A1中给出了包含如本文以上所定义特征(i)和(ii)的D0F-C2 转录因子多肽的其他例子。在本说明书中使用的术语“表A”将用来说明表A1和/或A2的内容。在本说明书 中使用的术语“表A1”将用来说明表A1的内容。在本说明书中使用的术语“表A2”将用来 说明表A2的内容。在一个优选的实施方案中,术语“表A”意指表A1。在一个优选的实施 方案中,术语“表A”意指表A2。在本说明书中使用的术语“表B”将用来说明表B1和/或B2的内容。在本说明书 中使用的术语“表B1”将用来说明表B1的内容。在本说明书中使用的术语“表B2”将用来 说明表B2的内容。在一个优选的实施方案中,术语“表B”意指表B1。在一个优选的实施 方案中,术语“表B”意指表B2。在本说明书中使用的术语“表C”将用来说明表C1和/或C2的内容。在本说明书 中使用的术语“表C1”将用来说明表C1的内容。在本说明书中使用的术语“表C2”将用来 说明表C2的内容。在一个优选的实施方案中,术语“表C”意指表C1。在一个优选的实施 方案中,术语“表C”意指表C2。在本说明书中使用的术语“表D1”将用来说明表D1和/或D2的内容。在本说明 书中使用的术语“表D1”将用来说明表D1的内容。在本说明书中使用的术语“表D2”将用 来说明表D2的内容。在一个优选的实施方案中,术语“表D”意指表D1。在一个优选的实 施方案中,术语“表D”意指表D2。在本说明书中使用的术语“表2”将用来说明表2A和/或表2B和/或表2C的内 容。在本说明书中使用的术语“表2A”将用来说明表2A的内容。在本说明书中使用的术语 “表2B”将用来说明表2B的内容。在本说明书中使用的术语“表2C”将用来说明表2C的内 容。在一个优选的实施方案中,术语“表2”意指表2A。在一个优选的实施方案中,术语“表 2”意指表2B。在一个优选的实施方案中,术语“表2”意指表2C。在表A1中给出的多肽是来自多种植物源的由SEQ ID NO :2代表的D0F-C2转录因 子多肽的“旁系同源物和直向同源物”例子,其属于如Lijavetzky等人.2004的图2和图 3中定义的主要直向同源组Cc,亚组C2及C2. 1和C2. 2。用于实施本发明的优选多肽属于 如Lijavetzky等人.2004所定义的直向同源组C2(其包含拟南芥的C2以及稻的C2. 1和 C2. 2)。本发明的优选D0F-C2多肽是表A1中给出的任意多肽的旁系同源物或直向统原物。备选地,D0F-C2转录因子多肽的同源物以增加的优选顺序与SEQ IDN0 2所代表 的氨基酸具有至少 25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、 37%,38%,39%A0%A1%A2%A3%A4:%A5%A6%A7%A8%A9%,50%,51%, 52%,53%,54%,55%,56%,57%,58%,59%,60%,61 %,62%,63%,64%,65%,66%, 67%,68%,69%,70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%,81 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%, 97%、98%或99%的总体序列同一性,并且包含如下特征⑴和特征(ii)(i)DOF结构域,其以增加的优选顺序与SEQ ID NO 35或SEQ IDN0 :36所代表 的 D0F 结构域具有至少 60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、 96%、97%、98%、99%或更多的序列同一性;和
(ii)具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2 或ι个非保守性氨基酸替换的基序I :ERKARPQKDQ(SEQ IDNO 37);和/或 具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有3、2或1个非 保守性氨基酸替换的基序II =YffSGMI (SEQ ID NO 38)。如本文中定义的“MYB7多肽”指包含2个SANT结构域(SMART登录号SM00717)、 Myb_DNA结合结构域(Pfam登录号PF00249)、同源异型域样(Superfamily登录号 SSF46689))的任意R2R3 MYB多肽,条件是该R2R3 MYB多肽不是由SEQ ID NO: 141编码的 或具有SEQ ID NO :142序列的0sMYB4。另外,“MYB7多肽”还包含基序1至7中的4种或更多种基序,优选地还包含基序 1至7中的5种或更多种基序,更优选地还包含基序1至7中的6种或更多种基序,最优选 地还包含基序1至7的全部。基序1 (SEQ ID NO 55) (T/S)X(E/Q/D)EDXXLXX(Y/H) IXXXG ;其中在位置 2 中的 X 可以是任意氨基酸,但优选地是K、Q、A、P、T、I、S之一,更优选地是K或Q ;其中在位置6中 的X可以是任意氨基酸,但优选地是Q、E、D、A、S之一,更优选地是Q、E或D ;其中在位置7 中的X可以是任意氨基酸,但优选地是R、L、K、M、I之一,更优选地是R、L或K ;其中在位置 9中的X可以是任意氨基酸,但优选地是I、V、T、G、L、A之一,更优选地是I、V或T ;其中在 位置10中的X可以是任意氨基酸,但优选地是N、D、A、S、K、G之一,更优选地是N、D、A或 S ;其中在位置13中的X可以是任意氨基酸,但优选地是R、K、Q、Ε、T、N之一,更优选地是 R、K、Q或E ;其中在位置14中的X可以是任意氨基酸,但优选地是V、K、A、S、Τ、E、N之一, 更优选地是V、K、A或S ;和其中在位置15中的X可以是任意氨基酸,但优选地是Y、H、N、D 之一,更优选地是H或Y。基序2 (SEQ ID NO 56)(E/Y/P/H/L)(G/S)(C/N/S/R/G)W(R/N)(S/T/A/L/N)(L/I)P(K/R/T/A/S)(A/S/K/ N/L/R)。优选地,基序 2 是 EG (C/N) WR (S/T/A) LP (K/R) (A/S)。基序3 (SEQ ID NO :57) :RCGKSCRLRWXNYLRP,其中X可以是任意氨基酸,优选地是 I、M、L 或 T 之一。基序4(SEQID NO 58) RTDNE(I/V)KN(Y/H/F)WN。优选地,基序4是RTDNEIKNYWN。基序5 (SEQ ID NO 59) (T/S) (H/N/R) (I/V/L) (K/R/S) (R/K) (K/R) (L/I)XXXG(I/ L/T) (D/T) (P/L),其中在位置8中的X可以是任意氨基酸,优选地是I、L、V、T、A、R之一,更 优选地是I、L、V或T ;其中在位置9中的X可以是任意氨基酸,优选地是S、N、R、G、A、V、K、 Q之一,优选地是S、N、R、G或A之一;其中在位置10中的X可以是任意氨基酸,优选地是 R、K、Q、M、T 之一。优选地,基序 5 是 TH(I/V/L) (K/R) (R/K) (K/R) (L/I)XXXG(I/L)DP。基序6 (SEQ ID NO 60)X(P/L/Q/ff)(D/E/V)(L/1)NL(E/D)LX(I/L/V)(S/D/N/G) (L/P/1) (P/S/A/V/T),其 中在位置1中的X可以是任意氨基酸,优选地是F、G、C、L、D或Y之一,并且其中在位置9 中的X可以是任意氨基酸,优选地是R、K、G、T、C、D、S之一。基序7 (SEQ ID NO 61) (F/Y/C/D) (R/S/T) (S/T/G/R) (L/I) (Ε/Ρ) (M/T)K。备选地,MYB7蛋白的同源物以增加的优选顺序与SEQ ID NO :50所代表的氨基 酸具有至少 25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%,39%A0%A1%A2%A3%A4:%A5%A6%A7%A8%A9%,50%,51%,52%, 53%,54%,55%,56%,57%,58%,59%,60%,61 %,62%,63%,64%,65%,66%,67%, 68%,69%,70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%,81 83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%, 98%或99%的总体序列同一性,条件是该同源蛋白包含如上概述的保守基序并且条件是该 同源物不是如SEQ ID NO 142中给出的0sMYB4。
使用总体比对算法如程序GAP (GCG Wisconsin Package, Accelrys)中的 Needleman Wunsch算法,优选地采用默认参数,确定总体序列同一性。与总体序列同一性相 比较,仅考虑保守的结构域或基序时,该序列同一性通常会更高。局部比对算法如BLAST可 以用来确定多肽的保守区域(如D0F-C2转录因子多肽中的DOF结构域)中的序列相似性。优选地,多肽序列在构建进化系统树(如图X中所绘制的一个进化系统树)中使 用时,与包含SEQ ID NO 2所代表的氨基酸序列的组C2聚类,而不与任何其他组聚类。术语“结构域”和“基序”在本文的“定义”部分中定义。存在用于鉴定结构 域的专业数据库,例如,SMART (Schultz 等人,(1998)Proc. Natl. Acad. Sci. USA 95, 5857-5864 ;Letunic ^ 人,(2002)Nucleic Acids Res 30,242-244)、InterPro (Mulder 等,(2003)Nucl. Acids. Res. 31,315-318)、Prosite(Bucher 和 Bairoch(1994),用于 生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94 ;第二届分子生物学智能系统国际会议文 集.Altman R. ,Brutlag D. ,Karp P. , Lathrop R. ,Searls D.编辑,第 53-61 页,AAAIPress, Menlo Park ;HuIo 等,Nucl. Acids. Res. 32 :D134_D137,(2004))或 Pfam(Bateman 等, Nucleic Acids Research 30(1) =276-280(2002)) 一组用于计算机方式分析蛋白质序 列的工具可在ExPASY蛋白质组服务器(瑞士生物信息研究所(Gasteiger等人,ExPASy 用于深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in-depth protein knowledgeand analysis),Nucleic Acids Res. 31 :3784_3788 (2003))上获得。也 可以使用常规技术如通过序列比对鉴定结构域或基序。用于比对序列以做比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、 BLAST、FASTA 禾口 TFASTA。GAP 使用 Needleman 和 Wunsch 算法((1970) J Mol Biol 48 443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列 的)比对结果。BLAST 算法(Altschul 等人,(1990) J Mol Biol 215 :403_10)计算序列 同一性百分数并开展两个序列之间相似性的统计分析。用于开展BLAST分析的软件是通 过国家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序 列比对算法(1. 83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和 同一性的总体百分数也可以使用MatGAT软件包中可用的方法之一确定(Campanella等, BMC Bioinformatics. 2003年7月10日;4:29. MatGAT 使用蛋白质序列或DNA序列产生相
生 / 同一'性失巨阵的一禾中应用(an application that generates similarity/identity matrices using proteinor DNA sequences))。如本领域技术人员会显而易见,可以进行 少许手工编辑以优化保守基序之间的比对。此外,作为使用全长序列鉴定同源物的替代,也 可以使用特定的结构域。使用上文提及的程序,使用默认参数,可以确定完整核酸或氨基酸序列范围或保守基序范围内的序列同一性值。对于局部比对,所述Smith-Waterman算法是特别有用的(Smith TF, Waterman MS (1981) J. Mol. Biol 147(1) ; 195-7)。备选地,可以通过与已知D0F-C2结构域转录因子多肽进行序列比较并建立序列 相似性而鉴定在本发明方法中有用的D0F-C2结构域转录因子多肽。可以使用本领域熟知 的任意方法如Blast算法(用于局部比对)或BestFit算法(用于总体比对)比对所述序 列。取得与给定序列出现比对结果的概率作为用于鉴定相似多肽的基础。一般用来代表这 种概率的参数称作e-值。所述e-值是S评分可靠性的一个量度。S评分是查询项与所示 序列的相似性的一个度量。e-值描述给定S评分预期以多大频率随机发生。临界e_值可 以高至1. 0。显示与查询序列的显著序列同一性并由BLAST搜索产生的受信任(真实)命 中的常见阈值低于1. e-5(e提高至第5可能性),在某种情况下采用甚至更低的阈值,例如 1. e-10(e提高至第10可能性)或甚至更低。优选地,在本发明方法中有用的D0F-C2结构域转录因子多肽以增加的优选顺序 在与表Al任意多肽的比对中具有低于1. e-10、l. e-15、l. e_20、l· e_25、l. e_50、l· e_75、 1. e-100、1. e-150、1. e_200、1. e_300、1. e-400 和 1. e-500 的 e_ 值。应当理解编码本发明D0F-C2结构域转录因子多肽的核酸不限于天然来源的序 列。该核酸可以编码“从头”设计的D0F-C2结构域转录因子多肽。另外,D0F-C2转录因子多肽一般具有DNA结合活性并具有核定位信号和激活结构 域。激活结构域和DNA结合活性的存在可以由本领域技术人员使用常规技术和方法轻易地 确定。已经描述了测量Dof结构域多肽的DNA结合活性的实验方法(Umemura等人.2004 ; Yanagisawa, S.禾口 Sheen,J. (1998)Plant Cell 10 :75_89 ;Plesch, G.,Ehrhardt, Τ.禾口 MuelIer-Roeber, B. (2001)Plant J. 28 :455_464)。在本发明方法中有用的优选D0F-C2转录因子多肽能够与包含序列(Α/Τ) AAAG(SEQ ID NO 44)的DNA片段和/或基因启动子区结合,其中所述序列代表Dof结构域 的已识别的DNA结合核心基序。另外,D0F-C2结构域转录因子多肽在稻中根据实施例5和6中概述的本发明方法表达时,产生这样的植物,其具有提高(或增强)的产量相关性状,尤其种子总重量、每株植 物种子总数、充实种子数、每花序的花数和收获指数。本发明通过用SEQ ID NO 1所代表的核酸序列转化植物进行说明,其中所述核酸 序列编码SEQ ID NO :2的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法可 以有利地使用如本文中定义的编码D0F-C2结构域转录因子的任意核酸或D0F-C2结构域转 录因子多肽实施。另外,ΜΥΒ7多肽(至少它们的天然形式)一般具有DNA结合活性和激活结构域。 本领域技术人员可以使用常规技术和方法轻易地确定激活结构域和DNA结合活性的存在。 可以使用对本领域技术人员而言的标准技术如双杂交相互作用法轻易地鉴定与ΜΥΒ7多 肽(例如在转录复合物)相互作用的蛋白质。推测ΜΥΒ7蛋白与BHLH转录因子相互作用 (Zimmerman 等人,Plant Journal 40,22—34,2004)。另外,MYB7多肽在稻中根据实施例8和9中概述的本发明方法表达时,产生这样 的植物,其具有增强的产量相关性状,尤其提高的生物量和/或提高的出苗生长势。本发明通过用SEQ ID NO :49所代表的核酸序列转化植物进行说明,其中所述核酸序列编码SEQ ID N0:50的多肽序列。然而,本发明的实施不限于这些序列;本发明的方法 可以有利地使用如本文中定义的编码MYB7的任意核酸或MYB7多肽实施。编码D0F-C2结构域转录因子或MYB7多肽的核酸的例子在本文实施例1的表Al中 给出。此类核酸在实施本发明的方法中有用。在实施例1的表Al中给出的氨基酸序列是 由SEQ ID NO :2所代表的D 0F-C2结构域转录因子多肽的或由SEQ ID NO :50所代表的MYB7 多肽的直向同源物和旁系同源物的示例序列,术语“直向同源物”和“旁系同源物”如本文中 定义。其他直向同源物和旁系同源物可以通过开展所谓交互性blast搜索轻易地鉴定。通 常,这包括第一 BLAST,其中所述的第一 BLAST包括将查询序列(例如使用实施例1的表A 中列出的任意序列)针对任意序列数据库,如可公开获得的NCBI数据库进行BLAST。当从 核苷酸序列开始时,一般使用BLASTN或TBLASTX (使用标准默认值),并且当从蛋白质序列 开始时,使用BLASTP或TBLASTN (使用标准默认值)。可以任选地筛选BLAST结果。筛选结 果或非筛选结果的全长序列随后针对来自生物的序列进行反向BLAST搜索(第二 BLAST), 其中查询序列从所述的生物中衍生(在一个实施方案中查询序列是SEQ ID NO :1或SEQ ID NO :2和在另一个实施方案中是SEQ ID NO 49或SEQ ID NO 50的情况下,第二 BLAST 因而将针对拟南芥序列进行)。随后比较第一 BLAST和第二 BLAST的结果。如果来自第一 blast的高阶位命中是源自与衍生查询序列的物种相同的物种,则鉴定到旁系同源物,随后 一个反向BLAST理想地在最高命中当中产生该查询序列;若在第一 BLAST中的高阶位命中 不是源自与衍生查询序列的物种相同的物种,则鉴定到直向同源物,并且在反向BLAST时, 优选地产生属于最高命中的该查询序列。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶 然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了 E-值外,比较结果也由同 一性百分数评价。同一性百分数指两个所比较的核酸(或多肽)序列之间的特定长度范围 内相同核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻 接树法,以帮助观察相关基因的聚类并鉴定直向同源物和旁系同源物。核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1 的表A中所给出任一氨基酸序列的同源物和衍生物的核酸,术语“同源物”和“衍生物”如 本文中定义。还在本发明方法中有用的是这样的核酸,其编码在实施例1的表A中所给出 任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中有用的同 源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。在实施本发明方法中有用的其他核酸变体包括编码D0F-C2结构域转录因子或 MYB7多肽的核酸的部分、与编码D0F-C2结构域转录因子或MYB7多肽的核酸杂交的核酸、编 码D0F-C2结构域转录因子或MYB7多肽的核酸的剪接变体、编码D0F-C2结构域转录因子或 MYB7多肽的核酸的等位变体和通过基因改组获得的编码D0F-C2结构域转录因子或MYB7多 肽的核酸的变体。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改组作用”如本文中 所述。如本文中所定义的术语“部分”指编码包含如下特征(i)和特征(ii)的多肽的一 段 DNA (i)DOF结构域,其以增加的优选顺序与SEQ ID NO 35或SEQ IDNO :36所代表 的 DOF 结构域具有至少 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,96%、97%、98%、99%或更多的序列同一性;和(ii)具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2 或ι个非保守性氨基酸替换的基序I :ERKARPQKDQ(SEQ IDNO 37);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有3、2或1个非 保守性氨基酸 替换的基序II =YffSGMI (SEQ ID NO 38)。另外,在上文“部分”中的多肽可以包含任意的1、2、3、4种或全部的以下基序-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或 1个非保守性氨基酸替换的基序III :RLLFPFEDLKPLVS(SEQID NO 39);和/或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有4、3、2或1 个非保守性氨基酸替换的基序IV JNVKPMEEI (SEQ ID NO 40);和/或;-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、 4、3、2或1个非保守性氨基酸替换的基序V :KNPKLLHEGAQDLNLAFPHH(SEQ ID NO 41);和/ 或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或 1个非保守性氨基酸替换的基序VI :MELLRSTGCYM(SEQ IDNO 42);和/或-具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、 4、3、2 或 1 个非保守性氨基酸替换的基序 VII :MMDSNSVLYSSLGFPTMPDYK (SEQ ID NO 43)。编码D0F-C2结构域转录因子或MYB7多肽的核酸不必须是全长核酸,因为本发明 方法的实施不取决于全长核酸序列的使用。根据本发明,提供了用于增强植物中产量相关 性状的方法,包括在植物中导入并表达实施例1的表A中给出的任一核酸序列的一部分或 编码实施例1表A中所给出任意氨基酸序列的直向同源物、旁系同源物或同源物的核酸的 一部分。核酸的一部分可以例如通过对所述核酸产生一个或多个缺失而制备。所述部分可 以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产生联合有 几种活性的蛋白质。当融合至其他编码序列时,翻译后产生的所得多肽可以比对该蛋白质 部分所预测的多肽更大。在一个实施方案中,在本发明方法中有用的部分编码如本文中定义的D0F-C2结 构域转录因子多肽,并且基本上具有如实施例1的表Al中所给出氨基酸序列相同的生物学 活性。优选地,此部分是在实施例1的表Al中给出的任一核酸的一部分,或是编码在实施例 1的表Al中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地, 该部分的长度是至少 150、200、250、300、350、400、450、500、550、600、650、700、1000 个或更 多个连续核苷酸,所述连续核苷酸属于实施例1的表Al中给出的任一核酸序列或属于编码 在实施例1的表Al中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选 地,该部分是SEQ IDNO 1的核酸的一部分。优选地,该部分编码下述氨基酸序列的片段,其 中所述氨基酸序列在构建进化系统树(如图3中所绘制的一个进化系统树)中使用时,与 包含SEQ ID NO :2所代表的氨基酸序列的C2组聚类,而不与任何其他组聚类。在另一个实施方案中,在本发明方法中有用的部分编码如本文中定义的MYB7多 肽,并且基本上具有如实施例1的表A2中所给出氨基酸序列相同的生物学活性。优选地, 此部分是在实施例1的表A2中给出的任一核酸的一部分,或是编码在实施例1的表A2中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长 度是至少400、450、500、550、600、650、700、750、800个连续核苷酸,所述连续核苷酸属于实 施例1的表A2中给出的任一核酸序列或属于编码在实施例1的表A2中所给出任一氨基酸 序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID N0:49的核酸的一部 分。在本发明方法中有用的另一种核酸变体是能够在降低的严格条件下、优选在严格 条件下与编码 如本文中定义的D0F-C2结构域转录因子或MYB7多肽的核酸或与如本文中定 义的部分杂交的核酸。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并 表达能够与实施例1的表A中给出的任一核酸杂交的核酸,或包括在植物中导入并表达这 样的核酸,其中所述核酸能够与编码在实施例1的表A中给出的任意核酸序列的直向同源 物、旁系同源物或同源物的核酸杂交。在本发明方法中有用的杂交序列编码如本文中定义的D0F-C2结构域转录因子或 MYB7多肽,其基本上具有如实施例1的表A中所给出氨基酸序列相同的生物学活性。优选 地,该杂交序列能够与实施例1的表A中给出的任一核酸或与这些序列中任意序列的一部 分杂交,所述的一部分如上文定义,或所述杂交序列能够与编码在实施例1的表A中给出的 任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选地,该杂交序列能够与如 SEQ ID NO :1或SEQ ID NO 49所代表的核酸或与其一部分杂交。优选地,该杂交序列部分编码具有下述氨基酸序列的多肽,其中当所述氨基酸序 列是全长的并且在构建进化系统树(如图3中所绘制的一个进化系统树)中使用时,该氨 基酸序列与包含SEQ ID NO :2所代表的氨基酸序列的C2组聚类,而不与任何其他组聚类。在本发明方法中有用的另一种核酸变体是编码如上文所定义的D0F-C2结构域转 录因子或MYB7多肽的剪接变体,剪接变体如本文中定义。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并 表达实施例1的表A中给出的任一核酸序列的剪接变体或编码实施例1表A中所给出任意 氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。在一个实施方案中,优选的剪接变体是由SEQ ID NO :1所代表的核酸的剪接变体, 或是编码SEQ ID NO :2的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所述剪 接变体编码的氨基酸序列在构建进化系统树(如图3中所绘制的一个进化系统树)中使用 时,与包含SEQ ID NO 2所代表的氨基酸序列的C2组聚类,而不与任何其他组聚类。在另一个实施方案中,优选的剪接变体是由SEQ ID NO :49所代表的核酸的剪接变 体,或是编码SEQ ID NO :50的直向同源物或旁系同源物的核酸的剪接变体。在实施本发明方法中有用的另一种核酸变体是编码如上文所定义的D0F-C2结构 域转录因子或MYB7多肽的核酸的等位变体,等位变体如本文中定义。根据本发明,提供用于增强植物中产量相关性状的方法,包括在植物中导入并表 达实施例1的表A中给出的任一核酸的等位变体,或包括在植物中导入并表达编码在实施 例1的表A中所给出任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变 体。在本发明方法中有用的等位变体基本上具有与SEQ ID NO 2的D0F-C2结构域转录因子多肽和实施例1的表Al中所述的任意氨基酸序列相同的生物学活性。等位变体存 在于自然界中,并且在本发明的方法中包括使用这些天然等位基因。优选地,所述等位变体 是SEQ ID NO :1的等位变体或编码SEQ ID NO :2的直向同源物或旁系同源物的核酸的等位 变体。优选地,由所述等位变体编码的氨基酸序列在构建进化系统树(如图3中所绘制的 一个进化系统树)中使用时,与包含SEQ ID NO :2所代表的氨基酸序列的C2组聚类,而不 与任何其他组聚类。在另一个实施方案中,在本发明方法中有用的等位变体基本上具有与SEQ ID NO 50的MYB7多肽和实施例1的表A2中所述的任意氨基酸序列相同的生物学活性。等位变体 存在于自然界中,并且在本发明的方法中包括使用这些天然等位基因。优选地,所述等位变 体是SEQ ID NO :49的等位变体或编码SEQ ID NO :50的直向同源物或旁系同源物的核酸的 等位变体。基因改组或定向进化也可以用来产生编码如上文定义的D0F-C2结构域转录因子 或MYB7多肽的核酸的变体;术语“基因改组”如本文中定义。根据本发明,提供了用于增强植物中产量相关性状的方法,包括在植物中导入并 表达在实施例1的表A中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸的 变体,所述的核酸编码在实施例1的表A中给出的任意氨基酸序列的直向同源物、旁系同源 物或同源物,其中所述的变体核酸通过基因改组获得。优选地,由通过基因改组所获得的变体核酸编码的氨基酸序列在构建进化系统树 (如图3中 所绘制的一个进化系统树)中使用时,与包含由SEQID NO 2代表的氨基酸序列 的C2组聚类,而不与任何其他组聚类。另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱 变,最常见的是基于PCR 的方法(Current Protocols inMolecular Biology. Wiley 编辑)。编码D0F-C2结构域转录因子多肽的核酸可以衍生自任何天然或人工来源。该核 酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选 地,编码D0F-C2结构域转录因子多肽的核酸来自植物,还优选来自双子叶植物,更优选来 自十字花科,该核酸最优选地来自拟南芥。本发明方法的实施产生了具有增强的产量相关性状的植物。特别地,本发明方法 的实施产生这样的植物,其相对于对照植物具有出苗生长势和/或提高的产量、尤其提高 的种子产量和/或生物量。术语“产量”和“种子产量”和“出苗生长势”在本文的“定义” 部分中更详细地描述。本文中对增强的产量相关性状的谈及意指植物的一个或多个部分的生物量(重 量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。特别地,在一个实施方案中,此类可收获部分是种子,并且本发明方法的实施产生 了相对于对照植物的种子产量而言,具有提高的种子产量的植物。在另一个实施方案中,此类可收获部分是营养生物量和/或种子,并且本发明方 法的实施产生了相对于对照植物而言,具有提高的生物量和/或种子产量的植物。优选地, 营养生物量是地上部分生物量。以谷物为例,产量提高可以表现为以下一个或多个指标每平方米已建立的植物 数目增加、每株植物花序数的提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例, 产量提高可以自身表现为下列一种或多种指标的提高每平方米植物数、每株植物的花序 数、每个花序的小穗数、每个花序的花(小花)数目(其表述为充实种子数对原发花序数的 比)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。 在一个实施方案中,本发明提供了用于相对于对照植物而言提高植物的产量、尤 其种子产量的方法,所述方法包括调节植物中编码如本文中定义的D0F-C2结构域转录因 子多肽的核酸表达。在另一个实施方案中,本发明提供了用于相对于对照植物提高植物的产量、尤其 生物量的方法,所述方法包括调节植物中编码如本文中定义的MYB7多肽的核酸表达。由于本发明的转基因植物具有提高的产量,故这些植物有可能在其生活周期的相 应阶段(在其生活周期的至少部分期间)相对于对照植物的生长速率表现出提高的生长速率。提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本 上遍及整株植物。具有提高的生长速率的植物可以具备较短的生活周期。植物的生活周期 可以意指从干燥成熟种子生长直至植物已经产生与起始材料相似的干燥成熟种子的阶段 所需要的时间。这个生活周期可以受诸因素如早期生长势、生长速率、绿度指数、开花时间 和种子成熟速度影响。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上 在植物整个生活周期期间发生。在植物生活周期中早期期间提高的生长速率可以反映增强 的生长势。生长速率的提高可以改变植物的收获周期,从而允许植物更晚地播种和/或更 早地收获,而这本来是不可能的(可以随更早的开花时间获得相似效果)。如果大幅提高 生长速率,则可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播 种并收获其他稻植物,全部稻植物均处于一个常规生长时期中)。类似地,如果大幅提高生 长速率,则可以允许进一步播种不同植物物种的种子(例如播种并收获谷物植物,随后例 如播种并任选收获大豆、马铃薯或任何其他合适的植物)。在一些作物植物的例子中,来自 相同根状茎的额外收获次数也可以是可能的。改变植物的收获周期可以导致每平方米一年 生物量生产提高(原因在于可以培育并收获任何具体植物的次数(即在一年中)提高)。 生长速率的提高也可以允许将转基因植物在比其野生型对应物更广泛的地理区域内培育, 因为培育作物的地域限制往往由栽种时期(早季)或在收获时期(晚季)的不利环境条件 决定。如果缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线衍生 多个参数而确定,此类参数可以是T-Mid(植物达到50%最大植物大小所花费的时间)和 Τ_90(植物达到90%最大植物大小所花费的时间),以及其他。根据本发明的一个优选特征,本发明方法的实施产生了相对于对照植物具有提高 的生长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包 括在植物中调节编码如本文中定义的D0F-C2结构域转录因子或ΜΥΒ7多肽的核酸表达。与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种 胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。 在严重胁迫条件下,植物甚至可能完全停止生长。另一方面,轻度胁迫在本文中定义为植物 所暴露的任何下述胁迫,其中所述的胁迫不导致植物完全停止生长,但同时不能恢复生长。 与非胁迫条件下的对照植物相比较,轻度胁迫在本发明的意义下导致受胁迫植物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、13%、12%、 11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,栽培作物植物中并 不经常遭遇严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。 轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干 旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物 胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生 物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。特别地,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于 对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218 :1-14)中报道,非生物 性胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和分子变化。 干旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长损害及细 胞损害。Rabbani等人(Plant Physiol (2003) 133 1755-1767)描述了干旱胁迫与高盐度 胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导 致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以 引起功能蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导 途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文 中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚 对于给定地点的正常土壤条件和气候条件。相对于可比较条件下培育的对照植物,本发明方法的实施赋予在非胁迫条件下或 在轻度干旱条件下培育的植物提高的产量相关性状。因此,根据本发明,提供了用于在非胁 迫条件下或在轻度干旱条件下培育的植物中提高产量相关性状的方法,所述方法包括增加 植物中编码D0F-C2结构域转录因子或MYB7多肽的核酸表达。 相对于可比较条件下培育的对照植物,本发明方法的实施赋予在养分缺乏条件 下、尤其在缺氮条件下培育的植物提高的产量。因此,根据本发明,提供了用于在养分缺乏 条件下培育的植物中提高产量的方法,所述方法包括调节植物中编码D0F-C2结构域转录 因子或MYB7多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、 钙、镉、镁、锰、铁和硼及其他元素缺少所致。本发明包括通过本发明方法可获得的植物或其部分(包括种子)。所述植物或其 部分包含编码如上文定义的D0F-C2结构域转录因子或MYB7多肽的核酸转基因。本发明也提供了基因构建体和载体以促进在植物中导入和/或表达编码D0F-C2 结构域转录因子或MYB7多肽的核酸。所述基因构建体可以插入适于转化至植物并适于在 转化细胞中表达目的基因的载体,所述载体可以是市售的。本发明也提供了如本文中定义 的基因构建体在本发明方法中的用途。更具体地,本发明提供了构建体,其包含(a)编码如上文定义的D0F-C2结构域转录因子或MYB7多肽的核酸;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列。优选地,编码D0F-C2结构域转录因子或MYB7多肽的核酸如上文定义。术语“调控 序列”和“终止序列”如本文中定义。
植物用包含上述任意核酸的载体转化。技术人员非常了解必须存在于所述载体上 以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。此目的序列有效地与一 个或多个调控序列(至少与启动子)连接。有利地,任意类型的启动子,无论是天然的或合成的,可以用来驱动所述核酸序列 的表达。种子特异性或组成型启动子是在所述方法中特别有用的。优选地,种子特异性启 动子是编码晚期胚发生蛋白的基因的启动子,更优选地是稻WSI18基因的启动子。优选地, 所述组成型启动子也是遍在启动子。对于多种启动子类型的定义,见本文中的“定义”部分。应当明白本发明的应用不限于由SEQ ID NO :1或SEQ ID N0:49代表的编码 D0F-C2结构域转录因子或MYB7多肽的核酸,本发明的应用也不限于编码D0F-C2结构域转 录因子或MYB7多肽的核酸在受种子特异性启动子驱动时,或受根特异性启动子和/或组成 型启动子驱动时的表达。
种子特异性启动子优选地是ABA诱导型启动子,优选地是来自稻的WSI18启动子。 进一步优选地,该WSI18启动子由基本上与SEQ ID NO 47相似的核酸序列代表。组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2启动子。进一步优 选地,该组成型启动子由基本上与SEQ ID NO :53相似的核酸序列代表,最优选地该组成型 启动子如SEQ ID NO 53所代表。对于种子特异性或组成型启动子的其他例子,见本文“定义”部分中的表2。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。优选地,该构 建体包含与SEQ ID NO 48基本上相似或相同的表达盒,所述表达盒包含WSI18启动子、编 码D0F-C2结构域转录因子多肽的核酸和T-玉米醇溶蛋白+T-核酮糖二磷酸羧化酶-加氧 酶转录终止子序列。在另一个实施方案中,该构建体与SEQ ID NO 54基本上相似或相同的表达盒,所 述表达盒包含稻G0S2启动子和编码MYB7多肽的核酸。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可 能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加 至5’非翻译区(UTR)或编码序列中,以提高细胞质中积累的成熟信使的量。(除启动子、增 强子、沉默子、内含子序列、3’ UTR和/或5’ UTR区域之外的)其他调控序列可以是蛋白质 /或RNA稳定化元件。此类序列将是已知的或可以由本领域技术人员轻易地获得。本发明的基因构建体可以还包括对于特定细胞类型中维持和/或复制所需要的 复制起点序列。一个例子是当需要将基因构建体在细菌细胞中作为游离型遗传元件(例如 质粒或粘粒分子)维持时的复制起点。优选的复制起点包括但不限于fl-ori和colEl。为检测如用于本发明方法中的核酸序列的成功转移和/或选择包含这些核酸的 转基因植物,使用标记基因(或报道基因)是有利的。因此,所述基因构建体可以任选地包 含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。一旦不再需要所述标 记基因时,可以从转基因细胞中移除或切除它们。用于标记移除的技术是本领域已知的,有 用的技术在上文定义部分中描述。本发明也提供了用于产生转基因植物的方法,所述转基因植物相对于对照植物 具有增强的产量相关性状,其中所述方法包括在植物中导入并表达编码如上文所定义的 D0F-C2结构域转录因子或MYB7多肽的任意核酸。
更具体地,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加 的增强产量相关性状、尤其提高的(种子)产量和提高的早期生长势,其中所述方法包括(i)在植物或植物细胞中导入并表达编码D0F-C2结构域转录因子多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。在另一个实施方案中,本发明提供了用于产生转基因植物的方法,所述转基因植 物具有增加的增强产量相关性状、尤其提高的营养生物量和/或提高的出苗生长势,其中 所述方法包括(i)在植物或植物细胞中导入并表达编码MYB7多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以能够编码如本文中所定义的D0F-C2结构域转录因子或MYB7多肽 的任意核酸。该核酸可以直接地导入植物细胞或导入植物自身(包括导入组织、器官或植物的 任何其他部分)。根据本发明的优选特征,该核酸优选地通过转化作用导入植物。术语“转 化”在本文的“定义”部分中更详细地描述。可以借助技术人员熟悉的全部方法再生出基因修饰的植物细胞。合适的方法可以 在上文提及的S. D. Kung和R. ffu, Potrykus或H6fgen和Willmitzer的出版物中找到。通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述 标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植 物。为了选择转化的植物,转化中获得的植物材料一般经历选择条件,从而转化植物可以与 非转化植物区分开。例如,以上文所述方式获得的种子可以播种,并且在初始培育时间后, 通过喷洒经受合适的选择。另一种可能性在于种子根据需要消毒后,在使用合适选择剂的 琼脂板上培育,从而仅转化的种子可以长成植物。备选地,筛选所述转化植物的选择标记 (如上文所述的选择标记)的存在性。在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析就目的基因 的存在、拷贝数和/或基因组构造进行评价。备选地或额外地,可以使用RNA印迹分析和/ 或蛋白质印迹分析监测新导入的DNA的表达水平,这两项技术均是本领域普通技术人员熟 知的。产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例 如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并 且1~2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例 如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达 盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转 化根状茎)。本发明明确地扩展至由本文中所述任意方法产生的任意植物细胞或植物,并扩展至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转 化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代展示出与如本发明方法中的 亲本相同的基因型和/或表型特征。本发明也包括含有编码如本文以上所定义D0F-C2结构域转录因子或MYB7多肽的 分离核酸的宿主细胞。本发明的优选宿主细胞是植物细胞。对于本发明方法中所用的核酸或载体、表达盒或构建体或载体而言,宿主植物原则上有利地是能够合成在本发明方法中 所用多肽的全部植物。本发明的方法有利地适用于任意植物。在本发明方法中特别有用的植物包括属 于植物界超家族、尤其单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植 物、粮食作物、树或灌木。根据本发明的一个优选实施方案,植物是作物植物。作物植物的 例子包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,该 植物是单子叶植物。单子叶植物的例子包括甘蔗。 更优选地,该植物是禾谷植物。禾谷植 物的例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦属、高粱和燕麦。优选的稻品种是籼 稻或粳稻或这两个品种的任意杂种,优选的粳稻栽培品种是日本晴。本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根、根状 茎、块茎和球茎。本发明进一步涉及衍生自、优选直接衍生自此种植物的可收获部分的产 品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。根据本发明的优选特征,受调节的表达是增加的表达。在本领域中充分报道了用 于增加核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。如上文提及,用于调节编码D0F-C2结构域转录因子或MYB7多肽的核酸表达的优 选方法是通过在植物中导入并表达编码D0F-C2结构域转录因子或MYB7多肽的核酸;然而, 实施本方法的效果,即增强产量相关性状,也可以使用包括但不限于T-DNA活化标签法、 TILLING、同源重组在内的其他熟知技术实现。在定义部分中提供了对这些技术的描述。本发明也包括编码如本文中所述D0F-C2结构域转录因子或MYB7多肽的核酸的用 途,和这些D0F-C2结构域转录因子或MYB7多肽的用途,用于增强植物中任意的前述产量相 关性状。编码本文中所述D0F-C2结构域转录因子或MYB7多肽的核酸或D0F-C2结构域转 录因子或MYB7多肽自身可以用于其中鉴定到DNA标记的育种程序中,其中所述的DNA标记 可以遗传地与编码D0F-C2结构域转录因子或MYB7多肽的基因连锁。所述核酸/基因或 D0F-C2结构域转录因子或MYB7多肽自身可以用来定义分子标记。这种DNA或蛋白质标记 随后可以在育种程序中用来在本发明的方法中选择具有增强的如上文所定义产量相关性 状的植物。编码D0F-C2结构域转录因子或MYB7多肽的核酸/基因的等位变体也可以用于标 记辅助的育种程序中。此类育种程序有时需要使用例如EMS诱变法通过对植物进行诱变处 理而导入等位变异;备选地,所述程序可以从收集并非故意造成的所谓“天然”来源的等位 变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是步骤选择所讨论和导致产 量提高的序列的优异等位变体。一般通过监测含有所讨论序列的不同等位变体的植物的生 长性能实施选择。可以在温室中或在田间监测生长性能。其他任选步骤包括将其中鉴定到 优异等位变体的植物与另一种植物杂交。这可能用来例如产生感兴趣的表型特征的组合。编码D0F-C2结构域转录因子或MYB7多肽的核酸也可以作为探针用于遗传地或物 理地绘制所述探针构成其一部分的基因并且用作与这些基因连锁的性状的标记。此类信息 可以用于植物育种中,以开发具有所希望表型的品系。编码D0F-C2结构域转录因子或MYB7 多肽的核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。编码D0F-C2结 构域转录因子或MYB7多肽的核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物(Sambrook J,FritschEF和Maniatis T(1989)Molecular Cloning, A Laboratory Manual)可以用编码POI的核酸探测。所得的结合模式随后可以 使用计算机程序如MapMaker (Lander等人(1987)Genomics 1 174-181)开展遗传分析以构 建遗传图谱。此外,该核酸可以用来探测含有一组个体的限制性核酸内切酶处理的基因组 DNA的DNA印迹物,其中所述的一组个体代表具有所定义遗传杂交的亲本和子代。标明了 DNA多态性的分离并用来计算编码D0F-C2结构域转录因子或MYB7多肽的核酸在先前使用 这个群体获得的遗传图中的位置(Botstein等人(1980)Am. J. Hum. Genet. 32 :314_331)。在Bernatzky 禾口 Tanksley (1986) Plant Mol. Biol. Importer 4 :37_41 中描述了植 物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用上文概述的方 法学或其变例对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯 合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等 在Non-mamma1ian Genomic Analyasis :A Practical Guide,Academic press 1996,第 319-346页及其中引用的参考文献)。在另一个实施方案中,所述核酸探针可以在直接荧光原位杂交(FISH)作图法 (Trask(1991)Trends Genet. 7 149-154)中使用。尽管当前的FISH作图法支持使用大的 克隆(几个kb至几百个kb ;见Laan等人(1995) GenomeRes. 5 13-20),然而灵敏度的改善 可以允许使用更短探针进行FISH作图。 用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。 方法例子包括等位基因特异性扩增法(Kazazian (1989) J. Lab. Clin. Med 11 :95_96)、PCR 扩增片段的多态性(CAPS ;Sheffield等人(1993)Genomics 16 :325_332)、等位基因特异性 连接(Landegren 等人(1988) Science 241 :1077_1080)、核苷酸延伸反应(Sokolov (1990) NucleicAcid Res. 18 3671)、放射杂交作图(Walter 等人(1997)Nat. Genet. 7 22~28)和 Happy 作图法(Dear 和 Cook(1989)Nucleic Acid Res. 17 :6795_6807)。对于这些方法,使 用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物 的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法中,可能需要在对应于 当前核酸序列的区域中鉴定作图交叉的亲本之间的DNA序列差异。然而,这对作图法而言 通常不是必需的。如前文所述,本发明方法产生了具有增强的产量相关性状的植物。这些性状也可 以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生物性胁迫和生物 胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。在一个实施方案中,本发明涉及如下概括的主题项1.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编 码包含如下特征⑴和特征(ii)的D0F-C2(具有一个指状物的结合DNA的,亚组C2)结构 域转录因子多肽的核酸的表达(i)DOF结构域,其以增加的优选顺序与SEQ ID N0:83或SEQ IDNO :84代表的DOF 结构域具有至少 60%、65%、70%、75%、80%、85%、90%、91 %、92%、93%、94%、96%、 97%、98%、99%或更多的序列同一性;和(ii)具有O、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或ι个非保守性氨基酸替换的基序I :ERKARPQKDQ(SEQ IDNO 85);和/或 具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有3、2或1个非 保守性氨基酸替换的基序II =YffSGMI (SEQ ID NO 86)。项2.根据项1的方法,其中所述的D0F-C2转录因子多肽还包含1、2、3、4种或全 部的以下基序具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或1 个非保守性氨基酸替换的基序III :RLLFPFEDLKPLVS(SEQID NO 87);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有4、3、2或1个 非保守性氨基酸替换的基序IV JNVKPMEEI (SEQ ID NO 88);和/或;具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、4、 3、2或1个非保守性氨基酸替换的基序V:KNPKLLHEGAQDLNLAFPHH(SEQ ID NO 89);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或1 个非保守性氨基酸替换的基序VI :MELLRSTGCYM(SEQ IDNO 90);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、4、 3、2或1个非保守性氨基酸替换的基序VII :MMDSNSVLYSSLGFPTMPDYK(SEQ ID NO 91)。项3.根据项1或2的方法,其中所述受调节的表达通过在植物中导入和表达编码 D0F-C2转录因子多肽的核酸实施。项4.根据任一前述项的方法,其中所述编码D0F-C2转录因子多肽的核酸编码表 Al中所列的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。项5.根据任一前述项的方法,其中所述的核酸序列编码表Al中给出的任意蛋白 质的直向同源物或旁系同源物。项6.根据任一前述项的方法,其中所述的增强的产量相关性状包括相对于对照 植物而言提高的产量、优选提高的早期生长势和/或提高的种子产量。项7.根据项3至6任一项的方法,其中所述的核酸有效连接至种子特异性启动 子,优选地有效连接至编码晚期胚发生蛋白的基因的启动子,最优选地有效连接至来自稻 的WSI18启动子。项8.根据任一前述项的方法,其中所述编码D0F-C2转录因子多肽的核酸是植物 来源的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),更优选地来 自拟南芥属(Arabidopsis),最优选地来自拟南芥。项9.根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述的植物 或其部分包含编码D0F-C2转录因子多肽的重组核酸。项10.构建体,其包含(i)编码如项1或2中定义的D0F-C2转录因子多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项11.根据项10的构建体,其中所述调控序列之一是种子特异性启动子,优选地 是编码晚期胚发生蛋白的基因的启动子,最优选地是稻WSI18基因的启动子。项12.根据项10或11的构建体在用于制备植物的方法中的用途,所述植物相对 于对照植物具有提高的产量,特别具有提高的早期生长势和/或提高的种子产量。
项13.用根据项10或11的构建体转化的植物、植物部分或植物细胞。项14.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高 的产量、尤其提高的早期生长势和/或提高的种子产量,该方法包括(i)在植物中导入并表达编码如项1或2中定义的D0F-C2转录因子多肽的核酸;(ii)在促进植物生长和发育的条件下培育植物细胞。项15.转基因植物,其相对于对照植物具有由编码如项1或2中所定义D0F-C2转 录因子多肽的核酸的受调节表达引起的提高产量、尤其提高的早期生长势和/或提高的种 子产量,或从所述转基因植物衍生的转基因植物细胞。项16.根据项9、13或15的转基因植物,或从其中衍生的转基因植物细胞,其中 所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑 麦、高粱和燕麦。项17.根据项16的植物的可收获部分,其中所述的可收获部分优选地是苗生物量 和/或种子。项18.产物,从根据项16的植物和/或从根据项17的植物的可收获部分衍生。项19.编码D0F-C2转录因子多肽的核酸在相对于对照植物提高植物中植物产量、 尤其在提高种子产量和/或早期生长势中的用途。在另一个实施方案中,本发明涉及如下概括的主题项20.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编 码MYB7多肽的核酸的表达,其中所述的MYB7多肽包含2个SANT结构域。项21.根据项20的方法,其中所述的MYB7多肽包含基序1至7 (SEQID NO :55至 SEQ ID NO 61)中的4种或更多种基序。项22.根据项20或21的方法,其中所述受调节的表达通过在植物中导入并表达 编码MYB7多肽的核酸实施。项23.根据项20至22的方法,其中所述编码MYB7多肽的核酸编码表A2中所列 的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。项24.根据项20至23的方法,其中所述的核酸序列编码表A2中给出的任意蛋白 质的直向同源物或旁系同源物。项25.根据项20至24的方法,其中所述增强的产量相关性状包含相对于对照植 物而言提高的生物量和/或提高的出苗生长势。项26.根据项20至25任一项的方法,其中所述增强的产量相关性状在非胁迫条 件下获得。项27.根据项22至26任一项的方法,其中所述的核酸有效连接至组成型启动子, 优选地有效连接至G0S2启动子,最优选地有效连接至来自稻的G0S2启动子。项28.根据项20至27的方法,其中所述编码MYB7多肽的核酸是植物来源的,优 选地来自双子叶植物,进一步优选地来自十字花科,更优选地来自拟南芥属,最优选地来自 拟南芥。项29.根据项20至28的方法可获得的植物或其部分,包括种子,其中所述的植物 或其部分包含编码MYB7多肽的重组核酸。
项30.构建体,其包含(i)编码如项20至21中定义的一类MYB7多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。项31.根据项30的构建体,其中所述的控制序列之一是组成型启动子,优选地是 G0S2启动子,最优选地是来自稻的G0S2启动子。项32.根据项30或31的构建体在用于制备植物的方法中的用途,所述植物相对 于对照植物具有提高的产量,特别具有提高的生物量和/或提高的出苗生长势。项33.用根据项30或31的构建体转化的植物、植物部分或植物细胞。
项34.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高 的产量、尤其提高的生物量和/或提高的出苗生长势,该方法包括(i)在植物中导入并表达编码如项20至21中定义的MYB7多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。项35.转基因植物,其相对于对照植物具有由编码项20或21中定义的MYB7多肽 的核酸的受调节表达引起的提高产量、尤其提高的生物量和/或提高的种子产量,或从所 述转基因植物衍生的转基因植物细胞。项36.根据项29、33或35的转基因植物,或从其中衍生的转基因植物细胞,其中 所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑 麦、高粱和燕麦。项37.根据项36的植物的可收获部分,其中所述的可收获部分优选地是营养生物量。项38.产物,从根据项36的植物和/或从根据项37的植物的可收获部分衍生。项39.编码MYB7多肽的核酸在相对于对照植物增强植物中产量相关性状、尤其在 提高生物量和/或出苗生长势中的用途。附图简述本发明现在将参考以下图进行描述,其中
图1代表SEQ ID NO 2的序列和结构域结构。Dof结构域的序列以粗体字符显示。 指出了基序I至基序V。图2A代表表Al中给出的D0F-C2转录因子多肽的多重比对。图2B代表表Al中给出的D0F-C2转录因子多肽中存在的Dof结构域的多重氨基 酸序列比对结果。图3显示拟南芥和稻的D0F-C2转录因子多肽的进化系统树。指出了包含亚组C2 的聚类。图4描述了用于稻中在稻WSI18启动子的控制下增加SEQ ID NO :1表达的双元载 体(pffSI18)。图5详述在实施本发明方法中有用的诸序列的例子。图6代表具有以粗体显示的两个SANT结构域和下划线标出的保守基序1至7的 SEQ ID NO :50。图7代表多种MYB 7蛋白的多重比对结果。
图8代表了用于稻中在稻G0S2启动子(pG0S2)控制下增加编码MYB7的核酸表达 的双元载体。图9详述在实施本发明方法中有用的诸序列的例子。 实施例本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不 意图完全限定或限制本发明的范围。
DNA操作除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版 ColdSpring Harbor Laboratory Press, CSH, New York)或 Ausubel 等人(1994), Current Protocols in Molecular Biology, Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料 和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和 Blackwell 科学出版社(Blackwell Scientific Publications (英国))出版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。实施例1 鉴定与本发明方法中所用核酸序列相关的序列用数据库搜索工具如基本局部比对工具(BLAST) (Altschul等人(1990) J. Mol. Biol. 215 :403-410 ;和 Altschul 等人(1997)Nucleic Acids Res. 25 :3389_3402),在国家 生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方 法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列 或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性 区域。由与本发明方法中所用核酸编码的多肽用于TBLASTN算法,采用默认设置和过滤程 序以略去低复杂性序列启动。该分析的输出结果通过逐对比较进行检验,并根据概率评分 (E-值)进行评级,其中所述的评分反映特定比对结果偶然发生的概率(E-值越低,命中的 显著性越高)。除E-值外,比较也可以通过同一性百分数评分。同一性百分数指两个所比 较的核酸(或多肽)序列之间特定长度范围内相同核苷酸(或氨基酸)的数目。在一些情 况下,可以调整默认参数以调节搜索的严格性。例如,可以提高E-值以显示严格性更低的 匹配。以这种方式,可以鉴定到短的近乎完全的匹配。表Al和表A2提供了与本发明方法中所用核酸序列相关的核酸序列名单。表Al :D0F-C2结构域转录因子核酸和多肽的例子 表A2 :MYB7多肽的例子在一些情况下,相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编 并且公开披露。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这 可通过关键词搜索或通过使用BLAST算法以目的核酸或多肽序列进行。SEQ ID NO 1和SEQ ID NO 11代表在拟南芥基因组的基因座AT4G24060处的两 种剪接变体。实施例2 :D0F-C2结构域转录因子多肽序列和MYB7多肽序列的比对使用来自Vector NTI (Invitrogen)的Alignment X程序进行多肽序列的比 对,其中所述Alignment X程序基于流行的累进比对Clustal W算法(Thompson等人 (1997) Nucleic Acids Res 25 4876-4882 ;Chenna 等人(2003),Nucleic Acids Res 31 3497-3500)。空位开口罚分的默认值是10,空位延伸罚分是0. 1并且所选的权重矩阵是 Blosum 62(如果比对多肽的话)。就D0F-C2结构域转录因子多肽而言,可以进行少许手工编辑以进一步优化比对。 D0F-C2结构域转录因子多肽之间的序列保守性基本上在所述多肽的Dof结构域内并在如 共有SEQ ID NO 37至43所代表的保守基序I至VII的位置处(见图2A)。D0F-C2结构域 转录因子多肽在图2A中比对。图2B代表如在表Al的多肽中存在的DOF结构域的多重比 对结果。显示了共有序列。在共有序列中显示Dof结构域转录因子多肽之间的高度保守氨 基酸残基。在图3中显示来自拟南芥(At)和稻(Os)的DOF家族的转录因子的进化系统树。 含有亚组Cc的DOF多肽的分化体由框显示。使用如Vector NTI (Invitrogen)的AlignX 程序中所提供的邻接法聚类算法构建图3。就MYB7多肽而言,可以进行少许手工编辑以进一步优化比对。诸MYB7多肽之间 的序列保守性基本上在所述多肽氨基半端部分的SANT结构域内,羧基半端部分通常在序列长度和组成方面更为多变。诸MYB7多肽在图7中比对。实施例3 计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioi nformatics. 2003 4 29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的一 Ρ 用(an application thatgenerates similarity/identity matrices using protein or DNA sequences), Campanella JJ, Bitincka L, Smalley J 亥软件由 Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一 性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需预先比对 数据。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2) 执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后 将结果置于距离矩阵中。在分割线下半部分显示序列相似性,并且在对角分割线的上半部 分显示序列同一性。比较中使用的参数是评分矩阵Blosum62第一空位12延伸空位2就D0F-C2结构域转录因子多肽而言表Bl中显示在多肽序列的全长范围内总体 相似性和同一性的软件分析结果。在对角线上方给出同一性百分数而在对角线下方给出相 似性百分数(正常字体)。表Bl 在所述多肽序列的全长范围内总体相似性和同一性的MatGAT结果 与SEQ ID NO :2相比较,在实施本发明方法中有用的D0F-C2结构域转录因子多肽 序列之间的同一性百分数可以低至(在表Bl中以粗体显示的)27. 5%氨基酸同一性。亲缘 最近的旁系同源多肽与SEQ ID NO :2的同一性百分数是45. 7%。SEQ ID NO :2与剪接变体 Aratb_D0F_C2_6的同一性是90%。与表Bl中作为双子叶植物来源形式的直系同源D0F_C2 多肽之间的同一性在25-45%范围内。SEQ ID NO :2与表Bl中所示的作为单子叶植物来源 形式的直系同源D0F_C2多肽之间的同一性在23. 9-35. 4%范围内。就MYB7多肽而言,表B2中显示在多肽序列的全长范围内总体相似性和同一性的 软件分析结果。在对角线下方以粗体给出同一性百分数而在对角线上方(正常字体)给出 相似性百分数。
与SEQ ID NO :50相比较,在实施本发明方法中有用的MYB7多肽序列之间的百分数同一性可以低至28. 7%序列同一性。
于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库, 所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得 蛋白质特征标识(proteinsignatures)。合作数据库包括 SWISS-PROT、PROS ITE, TrEMBL, PRINTS、ProDom和Pfam、Smart和TIGRFAM。Pfam是覆盖众多常见蛋白质结构域和家族的 多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合。Pfam在英国Sanger研究所服 务器上维护。Interpro由英国欧洲生物信息学研究所维护。在表Cl中呈现如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果。表Cl 如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果(主要登录号) 在表C2中呈现如SEQ ID NO 50所代表的多肽序列的InterPro扫描结果。表C2 如SEQ ID NO :50所代表的多肽序列的InterPro扫描结果(主要登录号)。 标出了氨基酸坐标(起始残基和终止残基)。
实施例5 在本发明方法中所用的核酸序列的克隆使用定制的拟南芥幼苗cDNA 文库(在 pCMV Sport 6. O 中;Invitrogen,Paisley, UK)作为模板,通过PCR扩增本在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合 酶,在标准条件下使用50 μ 1 PCR混合物中的200ng模板进行PCR。使用的引物是有义引物 (如SEQ ID N0:44所代表,有义)5' -ggggacaagtttgtacaaaaaagcaggcttaaacaatggatacggctcagtgg-3'禾P反义引物(SEQ ID NO 45 ;反义,互补)5' -ggggaccactttgtacaagaaagctgggtaccgagaaattaattagcacc-3',其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增 的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”pSEQIDNO :1。质粒 PD0NR201作为Gateway 技术的部分从Invitrogen购买。包含SEQ ID NO=I的进入克隆随后在LR反应中与用于稻转化的目的载体一起使 用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆 在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于种 子特异性表达的稻WSI18启动子(SEQ ID NO 47)位于该Gateway盒上游。在LR重组步骤后,将所得表达载体pWSI 18: SEQIDN0 :1 (图4)根据本领域熟知的 方法转化至农杆菌菌株LBA4044中。实施例6 在实施本发明方法中有用的多肽序列的拓扑结构预测TargetP 1. 1预测真核蛋白的亚细胞定位。基于任何氨基端前序列叶绿体转运 肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最 终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP, 具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具 有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹 麦技术大学(Technical University of Denmark)的服务器上维护。对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界 值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。在表Dl中呈现如SEQ ID NO 50所代表的多肽序列的TargetP 1. 1分析的结果。 选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO 50所代表的多肽序列的亚细胞定位可以是细胞质或细胞核,没有预测到转运肽。表Dl 如SEQ ID NO 50所代表的多肽序列的TargetP 1. 1分析结果
预测的转运肽长度 许多其他算法可以用来进行此类分析,包括·在丹麦技术大学服务器上维护的ChloroP 1. 1 ;·在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1. 2版;·在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分 析专家 PA-GOSUB 2. 5 ;·在丹麦技术大学服务器上维护的TMHMM。实施例7 :MYB7样多肽的功能测定法MYB7蛋白质活性可以如Li和Parish (1995)所述验定。简而言之,将MYB7编码 序列以符合T7基因10前导序列可读框的形式克隆并在大肠杆菌中表达。将蛋白质纯化并 使用32P标记的c-myb结合位点(MBS)和玉米P基因产物结位点(PBS),在迁移率滞留测定 法中分析所述蛋白质。以这种方式,显示了来自拟南芥的MYB7不以高亲和力与MBS位点结 合,但对PBS位点具有结合偏好性。实施例8 在本发明方法中所用的核酸序列的克隆本发明方法中所用的核酸序列通过PCR,使用定制的拟南芥幼苗cDNA文库(在 pCMV Sport 6. O 内;Invitrogen,Paisley,UK)作为模板进行扩增。使用 Hifi Taq DNA 聚合酶,在标准条件下利用在50 μ 1 PCR混合物中的200ng模板进行PCR。使用的引物是 prm05966 (SEQ ID NO 51 ;有义,起始密码子为粗体字)5' -ggggacaagtttgtacaaaaaagcaggcttaaaca ggaagatctccttgctg-3 ‘和prm05967 (SEQ ID NO 52 ;反义,互补)5' -ggggaccactttgtacaagaaagctgggtcatttatttcatttccaagcttc-3',其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增 的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”pMYB7。质粒pD0NR201 作为Gateway 技术的部分从Invitrogen购买。
包含SEQ ID NO 49的进入克隆随后在LR反应中与用于稻(粳稻栽培品种日本 晴)转化的目的载体P00640 —起使用。这种载体含有在T-DNA边界内部的植物选择标 记、筛选标记表达盒和意图与已经克隆在该进入克隆中的目的核酸序列发生LR体内重组 的Gateway盒作为功能性元件。用于组成型表达的稻G0S2启动子(SEQ ID NO 53)位于该 Gateway盒上游。在所述LR重组步骤后,所得表达载体PG0S2 MYB7 (图8)根据本领域熟知的方法 转化至农杆菌菌株LBA4044内。实施例9 植物转化
稻转化使用含有所述表达载体的农杆菌来转化稻植物。将粳稻栽培品种日本晴 (Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒在70%乙醇中孵育1分钟, 随后在0. 2% HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后 在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生 的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一 种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代 培养3日,随后共培育(以助长细胞分裂活性)。将含有所述表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜 抗生素的AB培养基上并在28°C培养3日。随后收集细菌并在液体共培育培养基中悬浮至 密度(0D_)约1。该混悬液随后转移至培养皿内并将所述愈伤组织浸入此混悬液中15分 钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25°C于黑暗中 孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28°C于黑暗中在选择剂存在下培 育4周。在此期间,迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养基并在 光照下孵育后,释放了胚发生潜能并且苗在随后4至5周内发育。将苗从愈伤组织切下并 且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬化的苗 在温室中于高湿度和短日照下培育。对于一个构建体,产生大约35个独立的TO稻转化体。将原代转化体从组织培养 箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留显示所述选择剂抗 性的单拷贝转基因植物用于收获Tl种子。种子随后在移栽后3至5个月收获。该方法以 超过50%的比例产生单基因座转化体(Aldemita和Hodges 1996,Chan等1993,Hiei等 1994)。玉米转化玉米的转化用Ishida等人(1996). Nature Biotech 14(6) :745_50所述方法的改 良形式进行。在谷物中,转化是基因型依赖的并且仅特定基因型适合于转化和再生。近交 系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材料的良好来源, 不过也可以成功地使用其他基因型。谷穗从授粉后大约11日(DAP)的谷物植物收获,此时 不成熟的胚的长度是大约1至1. 2mm。不成熟的胚与含有表达载体的根癌农杆菌共培育,并 且转基因植物通过器官发生过程回收。将切下的胚在愈伤组织诱导培养基上、随后在玉米 再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可以使用不同的 选择标记)。培养板在25°C于光照下孵育2-3周,或直至苗发育。将来自每个胚的绿色苗转移至玉米生根培养基并在25°C孵育2-3周,直至根发育。将生根的苗移植至温室中的土 壤内。Tl种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。小麦转化用Ishida 等人(1996)Nature Biotech 14(6) :745_50 描述的方法进行小麦的转 化。栽培品种Bobwhite (可从墨西哥CIMMYT获得)通常用于转化。将不成熟的胚与含有 表达载体的根癌农杆菌共培育,并且通过器官发生过程回收转基因植物。与农杆菌孵育后, 将所述胚在愈伤组织诱导培养基上、随后于再生培养基上体外培育,其中所述的培养基含 有选择剂(例如咪唑啉酮,但是可以使用多种选择标记)。培养板在25°C于光照下孵育2-3 周,或直至苗发育。将来自每个胚的绿色苗转移至生根培养基并在25°C孵育2-3周,直至根 发育。将生根的苗移植至温室中的土壤内。Tl种子从显示选择剂耐受性并且含有单拷贝 T-DNA插入物的植物产生。大豆转化根据Texas A&M美国专利5,164,310中描述的改良方法转化大豆。几个商业大豆 品种适合通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于 转化。将大豆种子消毒用于体外播种。从7日龄的年幼籽苗切除下胚轴、胚根和一片子叶。 进一步培育上胚轴和剩余的子叶以发育腋生结节。切下这些腋生结节并与含有表达载体的 根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并 置于苗伸长培养基上。将长度不超过Icm的苗置于生根培养基上直至根发育。将生根的苗 移植至温室中的土壤内。Tl种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物 产生。油菜籽/卡诺拉油菜转化使用5-6日龄的年幼籽苗的子叶柄和下胚轴作为组织培养用外植体并且根据 Babic等人(1998,Plant Cell Rep 17 :183_188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过也可以使用其他品种。将卡诺拉油菜种子表面消毒用 于体外播种。从所述体外籽苗切下带有子叶的子叶柄外植体,并且通过将该叶柄外植体的 切口末端浸入细菌悬液用(含有表达载体的)农杆菌接种。所述外植体随后在23°C,16小 时光照下于含有3mg/l BAP、3%蔗糖、0. 7%植物琼脂的MSBAP-3培养基上培养2日。与农 杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/lBAP、头孢噻肟、羧苄青霉素或特美 汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特美 汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗的长度是5-10mm时,切下这些苗 并且转移至苗伸长培养基(MSBAP-0. 5,含有0. 5mg/l BAP)。将长度大约2cm的苗转移至用 于根诱导的生根培养基(MSO)。将生根的苗移植至温室中的土壤内。Tl种子从显示选择剂 耐受性并且含有单拷贝T-DNA插入物的植物产生。苜蓿转化使用(McKersie等,1999Plant Physiol 119:839-847)的方法转化苜蓿的再生性 克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得 再生性植物的方法。例如,这些再生性植物可以选自栽培品种Range lander (Agriculture Canada)或如Brown DCW禾口AAtanassov(1985. Plant Cell Tissue Culture 4:111—112)所 述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养(Walker等,1978 Am J Bot 65 :654_659)。叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90 (McKersie 等,1999 Plant Physiol 119 :839_847)或LBA4404 的过夜培养物共培育。 所述外植体在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4. 35g/L K2SOjP 100 μ m乙酰 丁香酮的SH诱导培养基上共培育3日。所述外植体在半浓度的Murashige-Skoog培养基 (Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有抑制农杆菌生长的合 适选择剂和合适抗生素的相同SH诱导培养基上。几周后,将体细胞胚转移至不含生长调节 齐IJ、不含抗生素和含有50g/L蔗糖的B0i2Y发育培养基。随后在半浓度的Murashige-Skoog 培养基上萌发体细胞胚。将生根的籽苗移植至花钵内并且在温室中培育。Tl种子从显示选 择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。棉花转化 使用根癌农杆菌,根据US 5159135中所述的方法转化棉花。棉花种子在3%次氯 酸钠溶液中作20分钟表面消毒并在含500 μ g/ml头孢噻肟的蒸馏水中洗涤。随后将种子 转移至含有50 μ g/m苯菌灵的SH培养基用于萌发。取下4至6日龄籽苗的下胚轴,切成 0.5cm小片并置于0.8%琼脂上。农杆菌混悬液(每毫升大约IO8个细胞,从含有用目的基 因和合适选择标记转化的过夜培养物稀释)用于接种下胚轴外植体。在室温和光照下3日 后,将组织转移至固体培养基(1. 6g/l脱乙酰吉兰糖胶),所述固体培养基含有具维生素B5 的 Murashige 和 Skoog 盐(Gamborg 等人,Exp. Cell Res. 50 151-158 (1968)) ,0. lmg/1 2, 4-D、0. lmg/1 6-呋喃甲基氨基嘌呤和750 μ g/ml MgCL2以及杀死残留细菌的50至100 μ g/ ml头孢噻肟和400-500 μ g/ml羧苄青霉素。单个细胞系在2至3个月(每隔4至6周传 代培养)后分离并且在用于组织增殖的选择培养基上进一步培育(30°C,16小时光周期)。 转化的组织随后在非选择培养基上进一步培育持续2至3个月以产生体细胞胚。将至少 4mm长度的外观健康胚转移至含有精细蛭石中具SH培养基的管内,所述SH培养基补充有 0. lmg/1吲哚乙酸、6-呋喃甲基氨基嘌呤和赤霉酸。在30°C以16小时光周期培育胚,并且 将处于2至3叶期的小植物转移至具有蛭石和养分的花钵。植物硬化并随后移至温室以进 一步培育。实施例10 表型评价方法10. 1评价建立产生大约35个独立的TO稻转化体。将原代转化体从组织培养室转移至温室以培 育并收获Tl种子。留下6个事件,其中Tl子代以3 1比例对所述转基因的存在/不存 在分离。对于这些事件中的每个事件,通过监测目视标记表达选出大约10株含有该转基因 的Tl籽苗(杂合子和纯合子)和大约10株缺少该转基因的Tl籽苗(失效合子)。以随机 位置并排生长转基因植物和相应的失效合子。温室条件是短日照(12小时光照),在光照 下28°C和在黑暗中22°C,和70%相对湿度。在非胁迫条件下培育的植物以规律的间隔期浇 水,以确保水和养分不是限制性的并确保满足植物完全生长和发育的需要。4个Tl事件在T2世代中按照如对Tl世代相同的评价方法进一步评估,但是每个 事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至 少6个不同角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。如下进行与D0F-C2结构域转录因子多肽关联的干旱筛选在盆栽土壤中在正常条件下培育用pWSI 18 SEQIDN0 1转化并从T2种子生长出的稻植物的子代直至它们接近齐穗期。随后将它们转移至灌溉减少的“干燥”区。将湿度 探测器插入随机选择的花钵内,以监测土壤水含量(SWC)。当SWC下降低于某个阈值时,自 动地对所述植物连续再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。栽 培的剩余部分(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正 常条件下详述那样记录生长和产量参数。如下进行与D0F-C2结构域转录因子多肽关联的氮利用效率筛选 在盆栽土壤中在除营养液之外的正常条件下培育用pWSI 18 SEQIDN0 1转化并 从T2种子生长出的稻植物的子代。从移植至成熟期间用含有降低的、通常7至8倍之间更 少的氮(N)含量的特定营养液浇灌所述花钵。栽培的剩余部分(植物成熟、种子收获)与 不在非生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。如下进行与MYB7多肽关联的干旱筛选在盆栽土壤中在正常条件下培育用pG0S2: :MYB7转化并从T2种子生长出的稻植 物的子代直至它们接近齐穗期。随后将它们转移至灌溉减少的“干燥”区。将湿度探测器 插入随机选择的花钵内,以监测土壤水含量(SWC)。当SWC下降低于某个阈值时,自动地对 所述植物连续地再灌溉直至再次达到正常水平。随后将植物再次转移至正常条件。栽培的 剩余部分(植物成熟、种子收获)与不在非生物胁迫条件下培育的植物相同。如对正常条 件下详述那样记录生长和产量参数。如下进行与MYB7多肽关联的氮利用效率筛选在盆栽土壤中在除营养液之外的正常条件下培育用pG0S2: :MYB7转化并从T2种 子生长出的稻植物的子代。从移植至成熟期间用含有降低的、通常7至8倍之间更少的氮 (N)含量的特定营养溶液浇灌所述花钵。培育的其余部分(植物成熟、种子收获)与不在非 生物胁迫下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。7. 2统计分析F-检验使用两因素ANOVA(变量分析)作为总体评价植物表型特征的统计模型。对用本 发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查该 基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。对于该F 检验而言,真实基因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性 F检验值指出了基因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。因为实施了具有重叠事件的两个实验,故进行联合分析。这用于检验对这两个实 验影响的一致性,并且如果一致,则用于积累来自两个实验的证据以提高结论的可信度。所 用的方法是考虑数据的多重水平结构的混合模型法(即实验_事件_分离子)。通过比较 似然比检验与卡方分布(chi squaredistribution)获得P-值。10. 3测量的参数生物量相关的参数测量植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同 角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上与背 景区别的像素总数而确定。这个值对相同时间点上从不同角度拍摄的画面进行平均化并且 通过校正转化成以平方mm表述的物理表面值(physical surface value) 0实验显示以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已 经达到其最大叶生物量的时间点处所测量的面积。早期生长势是萌发后3周的植物(籽 苗)地上部分面积。根生物量的增加表述为总根生物量的增加(测量为植物寿命期间所观 察到的根最大生物量);或表述为根/冠比增加(测量为根和苗的活跃生长期间根质量与 苗质量之间的比例)。早期生长势通过计数来自植物地上部分的与背景区别的像素总数确定。这个值对 相同时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表述的物 理表面值。下述结果是针对萌发后3周的植物。
种子相关的参数测量值将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干 燥3日。随后将所述花序脱粒,并且收集和计数全部种子。使用吹气装置将充实粒与空粒 分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。通过计数分离步骤后 仍留下的充实粒的数目确定充实种子数。种子总产量通过称量从一株植物收获的全部充实 粒测量。每株植物的种子总数通过计数从一株植物收获的壳数测量。千粒核重(TKW)从计 数的充实种子数及它们的总重量外推出来。本发明中的收获指数(HI)定义为种子总产量 与地上部分面积(mm2)之间的比率乘以系数106。如本发明中定义的每花序总花数是种子总 数与成熟原发花序数之间的比率。如本发明中定义的种子充实率是充实种子数对种子(或 小花)总数的比例(表述为%)。实施例11 转基因植物的表型评价结果评价在WSI 18启动子(SEQ ID NO 47)或在如表2A中所述RCc3启动子的控制下 表达D0F-C2转录因子核酸的转基因稻植物的结果。在以下参数至少之一中观察到至少5% 的提高出苗生长势(早期生长势)、种子总产量、种子总数、充实种子数、每穗花数和收获 指数。在下表D2中呈现用载体pWSI 18 SEQIDN0 1转化并在非胁迫条件下生长的植物 的性能。表D2.用实施例5中所述的包含SEQ ID NO 1的植物转化载体转化的转基因植物 的表型评价结果 实施例12 转基因植物的表型评价结果在非胁迫条件下表达MYB7核酸的转基因稻植物(用pG0S2: :MYB7转化并从T2种 子长出来的植物的子代)的评价揭示地上部分生物量(AreaMax)总体提高超过5%,P-值 为0. 0012,并且出苗生长势(早期生长势)总体提高超过5%,P-值小于0. 00001。
权利要求
用于通过调节植物中编码DOF-C2结构域转录因子多肽或MYB-结构域蛋白的核酸表达而增强产量相关性状的方法。
2.根据权利要求1的用于相对于对照植物而言增强植物中产量相关性状的方法,包括 调节以下核酸的表达 a)植物中编码包含如下特征(i)和特征(ii)的D0F-C2(具有一个指状物的结合DNA 的,亚组C2)结构域转录因子多肽的核酸(i)DOF结构域,其以增加的优选顺序与SEQ ID N0:35或SEQ IDNO 36所代表的DOF结 构域具有至少 60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,96%,97%, 98%、99%或更多的序列同一性;和( )具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或1 个非保守性氨基酸替换的基序I :ERKARPQKDQ(SEQ IDNO 37);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有3、2或1个非保守 性氨基酸替换的基序II =YWSGMI (SEQ ID NO :38),或b)植物中编码MYB7多肽的核酸,其中所述MYB7多肽包含两个SANT结构域。
3.根据权利要求2的方法,其中a)所述的D0F-C2转录因子多肽还包含1、2、3、4种或全部的以下基序具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或1个非 保守性氨基酸替换的基序III :RLLFPFEDLKPLVS(SEQID NO 39);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有4、3、2或1个非保 守性氨基酸替换的基序IV JNVKPMEEI (SEQ ID NO 40);和/或;具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、4、3、2 或1个非保守性氨基酸替换的基序V :KNPKLLHEGAQDLNLAFPHH(SEQ ID NO 41);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有5、4、3、2或1个非 保守性氨基酸替换的基序VI :MELLRSTGCYM(SEQ IDNO 42);和/或具有0、1个或多个保守性氨基酸替换和/或以增加的优选顺序具有9、8、7、6、5、4、3、2 或1个非保守性氨基酸替换的基序VII :MMDSNSVLYSSLGFPTMPDYK(SEQ ID NO 43);或者b)所述的MYB7多肽包含基序1至7(SEQ ID NO 55至SEQ ID NO 61)中的4种或更 多种基序。
4.根据权利要求2或3的方法,其中所述受调节的表达通过在植物中导入并表达编码 D0F-C2转录因子多肽的核酸或编码MYB7多肽的核酸实现。
5.根据权利要求2-4的方法,其中a)所述编码D0F-C2转录因子多肽的核酸编码表Al中所列的任一种蛋白质或是这种核 酸的一部分或是能够与这种核酸杂交的核酸;或b)所述编码MYB7多肽的核酸编码表A2中所列的任一种蛋白质或是这种核酸的一部分 或是能够与这种核酸杂交的核酸。
6.根据权利要求2-5的方法,其中所述的核酸序列编码表Al或表A2中给出的任意蛋 白质的直向同源物或旁系同源物。
7.根据权利要求2-6的方法,其中所述增强的产量相关性状包括a)相对于对照植物而 言提高的产量、优选地提高的早期生长势和/或提高的种子产量或b)相对于对照植物而言提高的生物量和/或提高的出苗生长势。
8.根据权利要求2-7的方法,其中所述增强的产量相关性状是在非胁迫条件下获得的。
9.根据权利要求2-8的方法,其中所述核酸有效连接至a)种子特异性启动子,优选地有效连接至编码晚期胚发生蛋白的基因的启动子,最优 选地有效连接至来自稻的WSI18启动子,或b)组成型启动子,优选地有效连接至G0S2启动子,最优选地有效连接至来自稻的G0S2 启动子。
10.根据权利要求2-9的方法,其中所述编码DOF-C2转录因子多肽或MYB7多肽的核酸 是植物来源的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),更优 选地来自拟南芥属(Arabidopsis),最优选地来自拟南芥(Arabidopsis thaliana)。
11.通过根据权利要求2-10的方法可获得的植物或其部分,包括种子,其中所述的植 物或其部分包含编码D0F-C2转录因子多肽或MYB7多肽的重组核酸。
12.构建体,其包含(i)编码权利要求3或4中所定义的D0F-C2转录因子多肽或一类MYB7多肽的核酸;( )能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。
13.根据权利要求12的构建体,其中a)所述调控序列之一是种子特异性启动子,优选地是编码晚期胚发生蛋白的基因的启 动子,最优选地是稻WSI18基因的启动子,或b)所述调控序列之一是组成型启动子,优选地是G0S2启动子,最优选地是来自稻的 G0S2启动子。
14.根据权利要求12或13的构建体在用于制备植物的方法中的用途,所述植物具有提 高的产量和a)相对于对照植物而言特别地具有提高的早期生长势和/或提高的种子产量 或b)相对于对照植物而言特别地具有提高的生物量和/或提高的出苗生长势。
15.用根据权利要求12或13的构建体转化的植物、植物部分或植物细胞。
16.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的产量、 特别地具有提高的生物量和/或提高的生长势和/或提高的种子产量,该方法包括(i)导入并在植物中表达权利要求2或3中所定义的编码D0F-C2转录因子多肽的核酸 或编码MYB7多肽的核酸;和( )在促进植物生长和发育的条件下培育植物细胞。
17.转基因植物,其相对于对照植物而言具有由编码权利要求2或3中所定义的 D0F-C2转录因子多肽或MYB7多肽的核酸受调节地表达而引起的提高的产量、特别地提高 的生物量和/或提高的生长势和/或提高的种子产量,或从所述转基因植物衍生的转基因 植物细胞。
18.根据权利要求11、15或17的转基因植物或从其衍生的转基因植物细胞,其中所述 的植物是作物植物或单子叶植物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、 高粱和燕麦。
19.根据权利要求18的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和/或种子或营养生物量。
20.产物,其从根据权利要求18的植物和/或从根据权利要求19的植物的可收获部分衍生。
21.编码DOF-C2转录因子多肽或MYB7多肽的核酸的用途,用于在植物中相对于对照植 物而言提高植物产量、特别地提高种子产量和/或提高生物量和/或生长势。
全文摘要
本发明总体上涉及分子生物学领域并涉及用于增强植物中多种经济重要的产量相关性状的方法。更具体地,本发明涉及用于通过调节植物中编码DOF-C2(具有一个指状物的结合DNA的,亚组C2)结构域转录因子多肽或MYB 7多肽的核酸的表达而增强植物中产量相关性状的方法。本发明也涉及具有编码DOF-C2结构域转录因子多肽或MYB7多肽的核酸受调节地表达的植物,所述植物相对于对照植物而言具有增强的产量相关性状。本发明也提供了在实施本发明方法中有用的包含DOF-C2结构域转录因子多肽或MYB7多肽的构建体。
文档编号C07K14/415GK101842489SQ200880113918
公开日2010年9月22日 申请日期2008年10月29日 优先权日2007年10月29日
发明者A·I·桑兹莫林纳罗, C·勒佐 申请人:巴斯夫植物科学有限公司