具有提高的产量相关性状的植物和用于制备该植物的方法

文档序号:571119阅读:2882来源:国知局
专利名称:具有提高的产量相关性状的植物和用于制备该植物的方法
具有提高的产量相关性状的植物和用于制备该植物的方法本发明总体上涉及分子生物学领域并涉及用于通过在植物中表达多肽的核酸序 列提高多种植物产量相关性状的方法,其中所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、 ARKL多肽和YTP多肽。本发明也涉及具有编码多肽的核酸序列的表达增加的植物,所述多 肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽,其中所述植物相对于对照 植物具有提高的产量相关性状。本发明也提供了在本发明方法中有用的构建体。持续增长的世界人口和农业用可耕地供应萎缩刺激了有关提高农业效率的研究。 常规的作物及园艺学改良手段利用选择育种技术以鉴定具有受欢迎特征的植物。然而,此 类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经 常含有可能并不总导致受欢迎性状从亲代植物传递下去的异源遗传组分。分子生物学进展 已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一 般处于DNA或RNA形式)并且随后导入该遗传物质至植物中。此类技术具有产生具备多种 经济学、农学或园艺学改良性状的作物或植物的能力。具有特殊经济意义的性状是提高的产量。产量通常定义为来自作物的经济价值的 可测量结果。该结果可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例 如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入、 胁迫耐受性和早期生长势(earlyvigor)也可以是决定产量的重要因素。优化前述因素因 而可以有助于提高作物产量。种子产量是特别重要的性状,因为许多植物的种子对人和动物营养是重要的。作 物如谷物、稻、小麦、卡诺拉油菜和大豆占超过一半的人类总热量摄入,无论通过直接消费 种子本身或通过消费基于加工的种子而产生的肉产品。作物也是糖、油及工业加工中所用 许多类型代谢物的来源。种子含有胚(新苗和新根的来源)和胚乳(萌发期间和籽苗早期 生长期间用于胚生长的养分来源)。种子发育涉及多种基因并且需要代谢物从根、叶和茎转 移至正在生长的种子中。胚乳尤其同化糖类、油和蛋白质的代谢前体并且将它们合成为贮 藏大分子以灌满籽粒。植物生物量是饲料作物如苜蓿、饲用谷物和干草的产量。产量的许多代用物已经 用于谷物作物。它们当中主要是对植物尺寸的估计。植物尺寸可以根据物种和发育阶段以 多种方式测量,不过包括总植物干重、地上部分干重、地上部分鲜重、叶面积、茎体积、植物 高度、莲座丛直径、叶长度、根长度、根质量、分蘖数和叶数。许多物种维持在给定发育阶段 上植物不同部分的尺寸之间的保守比率。这些异速增长关系用来从这些尺寸量值之一外推 至另一种尺寸量值(例如 Tittonell 等人 2005Agric Ecosys &Environ 105:213)。在发 育早期的植物尺寸一般与发育中稍后的植物尺寸相关。具有较大叶面积的较大植物通常可 以比较小的植物吸收更多光线和二氧化碳并且因而可能会在相同的时段期间获得更大重 量(Fasoula和Tollenaar 2005Maydica 50:39)。此外,这也是植物应当初始实现较大尺 寸的微环境优势或遗传优势的潜在延续。存在针对植物尺寸和生长速率的强遗传组分(例 如ter Steege等人2005Plant Physiology 139 1078),并且因而对于一系列各异遗传表 型,在一种环境条件下的植物尺寸很可能关联于另一种环境条件下的尺寸(Hittalmani等人2003Theoretical AppliedGenetics 107:679)。以这种方式,使用标准环境作为作物在 田间于不同位置及时间所遭遇的多样且动态环境的代用物。对于许多作物的另一个重要性状是早期生长势。改进早期生长势是现代稻育种计 划在温带和热带稻品种方面的重要目标。长根对于水栽稻中正确土壤固定是重要的。在稻 直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的苗与 生长势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对良好出苗是重要的。将早期 生长势人工改造到植物内的能力在农业中将是极重要的。例如,不良的早期生长势已经限 制了基于玉米带种质(Corn Belt germplasm)在欧洲大西洋地区引种玉米(Zea mayes L.) 杂种。收获指数即种子产量对地上部分干重的比率在许多环境条件下是相对稳定的并 且因而可以经常获得植物尺寸与谷物产量之间的强相关(例如Rebetzke等人2002 Crop Science 42 :739)。这些过程是内在联系的,因为谷物生物量的主要部分取决于植物叶和茎 的现有和储备光合生产率(Gardener 等人 1985Physiology of Crop Plants. Iowa State UniversityPress,第68-73页)。因此,选择植物尺寸(甚至在发育的早期)已经用作未来 潜在产能的指示物(例如Tittonell等人2005Agric Ecosys & Environl05 :213)。当检 验遗传差异对胁迫耐受性的影响时,使土壤属性、温度、水和养分有效性和光强度标准化的 能力是温室或植物生长室环境与田间相比的固有优势。然而,产量因不良授粉所致的人为 限制可能限制这些受控环境检验产量差异的用途,其中所述的不良授粉因缺少风和昆虫或 成熟根或根冠生长的足够空间引起。因此,在标准化条件下在生长室或温室测量发育早期 的植物尺寸是提供潜在遗传产量优势指示的标准操作。另一个重要性状是改良的非生物胁迫耐受性。非生物胁迫是世界范围作物损失 的主要原因,对于大多数主要作物植物而言平均产量降低超过50% (Wang等人,(2003) Planta 218:1_14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性养分、(大分子和/ 或微量元素)过量或匮乏、辐射和氧化胁迫引起。提高植物的非生物胁迫耐受性能力将在 世界范围对农民是巨大的经济优势并且将允许在不利条件期间及在本来不可能栽培作物 的陆地上栽培作物。因而可以通过优化前述因素之一提高作物产量。取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应 用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应 用如面粉、淀粉或油生产而言,种子参数提高可能是特别希望的。即便在种子参数当中,某 些参数可以更优先于其它参数,这取决于用途。多种机制可以有助于提高种子产量,无论其 形式为提高的种子尺寸或提高的种子数目。提高植物中产量相关性状(种子产量和/或生物量)的一种方法可以是通过调节 植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号传导途径。现在已经发现可以通过增加植物中编码生长调节因子(GRF)多肽的核酸序列表 达而相对于对照植物提高植物中的多种产量相关性状。提高的产量相关性状包含以下一项 或多项提高的早期生长势、提高的地上部分生物量、提高的每株植物总种子产量、提高的 种子充实率、提高的收获指数和提高的千粒核重。现在已经发现可以通过调节植物中编码RAA1样(根构造相关的l(RootArchitecture Associated 1))的核酸表达而改善植物中的多种生长特征。现在已经发现可以通过调节植物中编码种子产量调节蛋白(SYR)的核酸表达而 改善植物中的多种生长特征、特别地提高的非生物胁迫抗性。现在已经发现可以通过调节植物中编码ARKL (ARADIA样)多肽的核酸表达而改善 植物中的多种产量相关性状。现在已经发现可以通过调节植物中编码YTP(产量跨膜蛋白)的核酸表达而改善 植物中的多种产量相关性状。背景DNA结合蛋白是包含许多DNA结合结构域的任一 DNA结合结构域并且因而具有对 DNA的特异或普遍亲和性的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割 DNA分子的核酸酶和参与细胞核中DNA包装的组蛋白。转录因子通常定义为显示序列特异性DNA结合亲和性并且能够激活和/或阻遏转 录的蛋白质。拟南芥(Arabidopsis thaliana)基因组编码至少1533种转录调节蛋白,占 其预计基因总数的约 5. 9% (Riechmann 等人,(2000) Science 290:2105-2109)。稻转录 因子数据库(DRTF)是籼稻(Oryzasativa L. ssp. indica)和粳稻(Oryza sativa L. ssp. japonica)的已知和预测转录因子的集合,并且目前含有籼稻中的2,025种推定转录因子 (TF)基因模型和粳稻中的2,384种推定转录因子基因模型,分布在63个家族中(Gao等人 (2006)Bioinformatics 2006,22(10) 1286-7) 这些家族之一是对植物特异的生长调节因子(GRF)转录因子家族。已经在拟南 芥中鉴定了至少9种GRF多肽(Kim等人,(2003)Plant J 36:94-104)和在稻中鉴定了至 少 12 种 GRF 多肽(Choi 等人,(2004)Plant CellPhysiol 45(7) :897_904)。GRF 多肽以其 氨基端半侧存在至少2个高度保守的结构域为特征,其中所述高度保守的结构域以每个结 构域内部最保守的氨基酸命名(i)QLQ结构域(InterPro登录号IPR014978,PFAM登录号 PF08880),其中该结构域的最保守氨基酸是Gln-Leu-Gln ;和(ii)WRC结构域(InterPro登 录号IPR014977,PFAM登录号PF08879),其中该结构域的最保守氨基酸是Trp-Arg-Cys。WRC 结构域还含有两个明显不同的结构特征,即WRC结构域富含碱性氨基酸Lys和Arg,并还以 保守间隔(CX9CX1(1CX2H)包含3个Cys和1个His残基,其中所述保守间隔命名为转录效应 子(ET)结构域(Ellerstrom 等人,(2005)Plant Molec Biol 59:663-681)。ET 结构域中 半胱氨酸和组氨酸的保守间隔类似于锌指(锌结合)蛋白。此外,在GRF多肽序列中通常 包含核定位信号(NLS)。已经使用酵母双杂交相互作用测定法展示了一些GRF多肽与转录辅激活蛋白小 家族GRF-相互作用因子(GIF1至GIF3,又叫做滑膜肉瘤易位(SYT)多肽,SYT1至SYT3)的 相互作用(Kim 和 Kende(2004)Proc Natl Acad Sci 101:13374-13379)。名字GRF也已经赋予属于14-3-3多肽家族的另一个类型的多肽(和Ferl (1994) Plant Physiol 106 1593-1604),所述多肽与用于开展本发明方法的GRF多肽完全无关。用35S CaMV病毒组成型启动子控制下的稻GRF(OsGRFl)多肽转化的转基因拟南 芥植物显示弯曲的叶、初生花序的伸长严重降低和延迟抽苔(van der Knapp等人,(2000) Plant Physiol 122 :695_704)。与野生型植物相比,用2种拟南芥GRF多肽(AtGRFl和 AtGRF2)之一转化的转基因拟南芥植物产生更大的叶和子叶,抽苔延迟并且部分地不育(原因在于缺少有活力的花粉)(Kim等人,(2003)Plant J 36:94-104)。在美国专利申请US2006/0048240中,将一种拟南芥GRF多肽鉴定为SEQ ID NO: 33421。在美国专利申请2007/0022495,将一种鼠耳芥GRF多肽鉴定为SEQ ID NO 1803 (在 其中又称作G1438)。使用35S CaMV启动子过量表达G1438的转基因拟南芥属植物展示深 绿色的叶。出人意料地,现在已经发现增加编码GRF多肽的核酸序列的表达产生了相对于 对照植物具有提高的产量相关性状的植物。根据一个实施方案,提供了用于相对于对照植物而言提高植物中产量相关性状的 方法,包括增加植物中编码GRF多肽的核酸序列的表达。提高的产量相关性状包含以下一 项或多项提高的早期生长势、提高的地上部分生物量、提高的每株植物总种子产量、提高 的种子充实率、提高的收获指数和提高的千粒核重。关于单子叶植物中根形成的分子生物学知之甚少。迄今仅鉴定到影响根发育的 几种基因例子是形成少数或不形成根颈或支柱根的rtl突变体(Jenkins,J. Hered. 21 79-80,1930)、展示缺陷种子根的 asrl 突变体(DeMiranda 等人,Maize Genet. Coop. News Lett. 54 :18-19,1980)、缺少结节(不定)根的 rtcs 突变体(Hetz 等人,Plant J. 10 845-857,1996)、具有缩短侧根的slrl突变体和slr2突变体(Hochholdinger等人,Plant Physioll25 =1529-1539, 2001)或在主根的横向启动和种子根形成的启动方面均受影响 的 ruml(Woll 等人,Plant Physiol.,139,1255-1267,2005)。Liu 等人(Proteomics 6, 4300-4308,2006)在野生型和ruml籽苗的主根之间进行蛋白质组比较并鉴定了差异性地 受调节并参与木质素生物合成、防御和柠檬酸循环的另外12种基因。单子叶植物中参与根形成的另一种基因是首次从稻分离的raal(Ge等人,Plant Physiol. 135,1502-1513,2004)该基因编码一种与拟南芥FPF1 (促开花因子1)具有58% 同源性的12. 0-kD蛋白质。在稻中,RAA1特异性地表达在顶端分生组织、根尖伸长区、枝区 的中柱和青年侧根中。组成型过量表达提高不定根的数目,不过主根生长减少。此外,内源 性植物生长素含量增加。OsRAAl也由植物生长素诱导;提示在稻根发育中RAA1与植物生 长素之间存在正反馈调节作用(Ge等人,2004)。另外,过量表达OsRAAl的植物具有较长的 叶和不育性小花(Ge等人,2004)。W02006/067219公开了 FPF1和相关蛋白质用于增加植物 中碳水化合物产生的用途,但是过量表达FPF1的转基因植物不显示提高的种子产量并且 据报道不影响根生长。出人意料地,现在已经发现调节编码RAA1样多肽的核酸表达产生了相对于对照 植物而言具有增强的产量相关性状、特别地提高的产量的植物。根据一个实施方案,提供了用于相对于对照植物改善植物的产量相关性状的方 法,包括调节植物中编码RAA1样多肽的核酸表达。改善的产量相关性状包含提高的高度、 苗根比率、根厚度、绿度指数、每穗花数和提高的千粒核重。在正常生长条件以及胁迫条件 下观察到改善的产量相关性状。种子产量调节蛋白(SYR)是迄今尚未表征的一种新蛋白质。SYR对名为ARG0S的 拟南芥蛋白显示一些同源性(在DNA水平上约48%序列同一性,在蛋白质水平上约45%序 列同一性)(Hu 等人,Plant Cell 15,1951-1961,2003 ;US 2005/0108793)。Hu 等人推测 ARG0S是功能独特的蛋白质并且由单一基因编码。拟南芥中ARG0S过量表达的主要表型是提高的叶生物量和开花延迟。相反,稻中SYR的过量表达主要提高种子产量,而叶生物量和 开花时间没有明显受影响。出人意料地,现在已经发现调节植物中编码种子产量调节蛋白(此后命名为 SYR)的核酸表达产生了在非胁迫条件下生长时相对于对照植物而言具有增强的非生物胁 迫耐受性的植物。因此,本发明提供了用于相对于对照植物增强在非胁迫条件下生长的植物中产量 相关性状的方法,包括调节植物中编码SYR多肽的核酸表达。ARKL多肽包含与小鼠蛋白ARKADIA中存在的RING指结构域相似的RING指结构 域,其中所述的小鼠蛋白ARKADIA是参与胚发生期间Nodal信号传导的E3遍在蛋白连接酶 (Mavrakis 等人 2007 ;PLoS Biol. 2007 年 3 月;5 (3) :e67)。遍在蛋白化,作为通过共价连接遍在蛋白而修饰蛋白质的过程,是真核生物中多 种细胞过程的中心和必需部分。在植物中,该途径的缺陷引起许多发育异常、对外界刺激的 应答改变和细胞周期及生长模式的变化。遍在蛋白化的蛋白质通过26S蛋白酶体依赖性或 非依赖性途径被定向降解。遍在蛋白修饰在信号传导蛋白的激活、内吞作用、分选和组蛋白 修饰中发挥作用。遍在蛋白化蛋白质的命运由遍在蛋白连接的本质决定。单个或多个遍在蛋白可以 附着至靶(单遍在蛋白化和多遍在蛋白化;用来形成遍在蛋白链的特定Lys残基可以影响 修饰蛋白质的最终命运,例如降解或激活。遍在蛋白对蛋白质的附着在一个多步骤过程中发生,这个多步骤过程涉及3种 酶,称作 El、E2、E3(Glikcman 和 Ciechanover(2000)Physiol Rev82 :377_482)。最初,遍在 蛋白以ATP依赖性方式连接至蛋白质,随后所述遍在蛋白转移至E2蛋白质中的半胱氨酸接 纳体以形成E2-遍在蛋白中间体,其中所述的E2-遍在蛋白中间体在遍在蛋白连接酶(又 称作E3连接酶或E3酶)所介导的一个反应中充当针对靶蛋白的遍在蛋白供体。存在多种 类型的E3连接酶。RING型E3连接酶以存在称作RING指或RING_ZnF(真正有兴趣的新基 因-锌指)的保守蛋白质结构域为特征。锌结合基序是稳定的结构,并且它们在结合其靶时很少经历构象变化。大多数ZnF 蛋白含有与其靶分子产生串联接触的多个指样突出物,经常识别伸展的底物。RING指是据 推测在蛋白质-蛋白质相互作用中发挥作用的特化的锌结合结构域。RING指长40至60 个残基并与两个锌原子配位。它不同于其他锌指的地方是与锌离子配位的8个金属配体氨 基酸残基属于称作横撑(cross-brace)结构的特定结构(Borden (2000). J Mol Biol 295 1103-1112)。这种结构域中与锌离子配位的半胱氨酸/组氨酸的间隔是C-x(2)-C-x(9至 39) -C-x (1 至 3) -H-X (2 至 3) _C_x (2) _C_x (4 至 48) _C_x (2) -C。金属配体对 1 和 3 配位配 对以结合一个锌离子,而金属配体对2和4配位配对以结合第二个锌离子。存在两种不同 的变体,C3HC4型和C3H2C3型,它们是明显相关的,尽管半胱氨酸/组氨酸模式不同。后者 类型有时候称作'RING-H2指'。在后者中,锌离子的配位由6个半胱氨酸和2个组氨酸 介导,而在C3HC4中,由7个半胱氨酸和1个组氨酸介导。在拟南芥中存在至少477种包含RING结构域的推定蛋白质。一些推定蛋白质含有 多个RING指结构域。RING结构域已经基于存在的金属配体残基和/或这些结构域之间的氨 基酸数划分成8种类型(Stone等人2005) Plant Phys. 137,13-30。RING-H2类是拟南芥中的最大类别。基于结构域的本质和它们的结构组织,拟南芥RING指蛋白已经进一步分成30 个组,组1至组30。也识别出一些组内部的亚组,例如,组2的亚组2. 1和2. 2 (Stone等人 2005)。组I称作缺少之前描述的结构域的RING指蛋白质的组。对那些蛋白质的序列分析 揭示出RING结构域之外少数蛋白质之间具有相似性的区域,它们被称作DAR1至DAR3(与 RING相关的结构域)。DAR1和DAR3长大约40个氨基酸并且DAR2长大约120个氨基酸。 据报道DAR1仅存在于植物来源的蛋白质中(Stone等人,2005)。共同保守结构域的存在提 示了包含所述结构域的蛋白质的相关功能。出人意料地,现在已经发现调节编码ARKL多肽的核酸表达产生了相对于对照植 物而言具有增强的产量相关性状、特别地提高的产量的植物。根据一个实施方案,提供了用于相对于对照植物改善或增强植物的产量相关性状 的方法,包括调节植物中编码ARKL多肽的核酸表达。全部真核细胞均含有在细胞内部建起多种膜封闭区室的复杂内膜系统。该内膜系 统是参与细胞内部运输的膜结构的总称。内膜系统的主要组分是内质网、高尔基体、囊泡、 细胞膜和核膜。内膜系统的诸成员借助彼此或通过使用囊泡使物质通过。全部细胞的共同 特征是称作胞浆膜的外部限制膜。细胞膜由脂质和蛋白质建立。蛋白质与膜的缔合作用可以借助共价键发生,其中 蛋白质借助所述共价键与膜的脂质缔合。在称为跨膜蛋白的情形下,蛋白质的多肽链实际 上横越脂双层。与膜的缔合作用也可以借助所谓外周蛋白的蛋白质通过非共价键与整合型 膜蛋白的突出部分缔合而发生。跨膜蛋白(TM蛋白)具有两亲本质,具备疏水性TM区段(TMS)和亲水环 (hydrophilic loop)。在跨膜蛋白中,在脂质双层内部的部分主要由疏水性氨基酸组成。这 些疏水性氨基酸通常以a螺旋排列,从而在肽键处的极性羰基(-C = 0)和氨基(-NH)可 以彼此相互作用,而不与疏水性周围环境相互作用。从脂质双层突出的那些多肽部分倾向 于具有高百分数的亲水氨基酸。另外,突入胞外空间的那些多肽部分通常被糖基化。已经基于实验性X射线晶体学、NMR、基因融合技术、替代的半胱氨酸可及性方法、 Asp(N)连接糖基化实验和其他生物化学方法确定了蛋白质的跨膜拓朴学。此外,已经开发 了从TM蛋白的氨基酸序列确定其结构和功能的许多跨膜拓朴学预测方法(M611er等人, 2001 ; Ikeda 等人,2002 ;Chen 等人,2002)。蛋白质之间蛋白质序列相似性的分析已经得益于基因组领域的发展。可以使用 特定算法对仍未赋予功能的两种或多种蛋白质当中保守的许多结构域实施分析。一种这 样的保守结构域是如Pfam中所述的所谓DUF221结构域(功能未知结构域221) (Finn等 人Nucleic Acids Research(2006)数据库卷34 :D247_D251)。这种结构域发现于一个 假定的跨膜蛋白家族中,所述的假定的跨膜蛋白均不具有任何已知功能,所比对的区域是 538个残基最大长度。该结构域存在于许多真核来源的蛋白质中。已经报道了编码包含 DUF221的蛋白质的拟南芥基因EDR4在脱水处理时短暂表达(Kiyosue等人;Plant Mol Biol. 199425(5) :791_8)。已经报道了敲除编码另一种含有DUF221结构域的蛋白质的 基因的拟南芥突变体gfslO具有与液泡分选突变体相似的表型(Fuji等人;2007. Plant Cell. 2007. 19(2) :597_609)。出人意料地,现在已经发现调节编码YTP多肽的核酸表达产生了相对于对照植物而言具有增强的产量相关性状、特别地提高的产量的植物。根据一个实施方案,提供了用于相对于对照植物增强(改善)植物的产量相关性 状的方法,包括调节植物中编码YTP多肽的核酸表达。定义多肽/蛋白质术语“多肽”和“蛋白质”在本文中可相互交换地使用并且指由肽键连接起来的任 意长度聚合物形式的氨基酸。多核苷酸/核酸/核酸序列/核苷酸序列术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可相 互交换地使用并且指任意长度的聚合非分支形式的核苷酸,即核糖核苷酸或脱氧核糖核苷 酸或这二者的组合。对照植物选择合适的对照植物是实验设计的例行部分并且可以包括相应的野生型植物或 无目的基因的相应植物。对照植物一般是相同的植物物种或甚至是与待评估植物相同的品 种。对照植物也可以是待评估植物的失效合子。失效合子是因分离而丢失转基因的个体。 如本文中所用的“对照植物”不仅指完整植物,也指植物部分,包括种子和种子部分。同源物蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质和酶,它们相对于非修饰的 所讨论蛋白质具有氨基酸替换、缺失和/或插入并且与衍生它们的非修饰蛋白质具有相似 的生物学活性和功能活性。缺失指从蛋白质中移除一个或多个氨基酸。插入指一个或多个氨基酸残基被导入蛋白质中的预定位点。插入可以包含氨基端 融合和/或羧基端融合以及序列内插入单个或多个氨基酸。通常,在氨基酸序列内部的插 入物比氨基端融合物或羧基端融合物小约1至10个残基级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用的转录激活物的结合结构域或激活结构域、 噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、 二氢叶酸还原酶、Tag 100表位、c-myc表位、FLAG _表位、lacZ、CMP (钙调蛋白结合 肽)、HA表位、蛋白C表位和VSV表位。替换指以具有相似特性(如相似的疏水性、亲水性、抗原性、形成或破坏a -螺旋 结构或折叠结构的倾向性)的其他氨基酸替代蛋白质的氨基酸。氨基酸替换一般是单 个残基的,但是根据给予多肽的功能性约束条件,可以是簇集的;插入通常是约1至10个 氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。保守性替换表是本领域熟知的 (见例如 Creighton (1984) Proteins, ff. H. Freeman and Company (编著)禾口下表 1)。表1 保守性氨基酸替换的例子
残基保守性替换残基保守性替换AlaSerLeulie ;Val 氨基酸替换、缺失和/或插入可以使用本领域熟知的肽合成技术如固相肽合成法 等或通过重组DNA操作轻易地进行。用于操作DNA序列以产生蛋白质的替换、插入或缺 失变体的方法是本领域熟知的。例如,用于在DNA的预定位点处产生替换突变的技术是 本领域技术人员熟知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Cleveland, OH)、 QuickChange位点定向诱变法(Stratagene,San Diego, CA)、PCR介导的位点定向诱变或其 他位点定向诱变法。衍生物“衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式蛋白质(如目的蛋白) 的氨基酸序列相比较,它们包含非天然存在的氨基酸残基对氨基酸的替换或非天然存在的 氨基酸残基的添加。蛋白质的“衍生物”也包括这样的肽、寡肽、多肽,其中与所述多肽的天 然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷 酸化、肉豆蔻酰化、硫酸化等)的氨基酸残基或非天然存在的改变的氨基酸残基。与衍生出 衍生物的氨基酸序列相比较,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的 一个或多个非氨基酸取代基或添加物(例如报道分子或其他配体),如所结合旨在促进检 测该衍生物的报道分子,和相对于天然存在蛋白质的氨基酸序列而言,包含非天然存在的 氨基酸残基。此外,“衍生物”也包括天然存在形式蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白 (对于标签Jj太的综述,见 Terpe,Appl. Microbiol. Biotechnol. 60,523-533,2003)的融合 物。直向同源物/旁系同源物直向同源物和旁系同源物包括用来描述基因祖先关系的进化概念。旁系同源物是 相同物种内因祖先基因复制而起源的基因;直向同源物是来自不同生物的因物种形成而起源的基因,并且也衍生于共同的祖先基因。结构域术语“结构域”指在进化相关性蛋白质的序列比对结果上的特定位置处保守的一 组氨基酸。尽管在其他位置处的氨基酸可以在同源物之间不同,然而在特定位置处高度保 守的氨基酸指示在蛋白质结构、稳定性或功能方面很可能是必需的氨基酸。结构域因其在 蛋白质同源物家族的比对序列中高程度保守而鉴定,故它们可以用作鉴定物来确定所讨论 的任意多肽是否属于先前已鉴定的多肽家族。基序/共有序列/标签术语“基序”或“共有序列,,或“标签”指在进化相关蛋白质的序列中的短保守区 域。基序往往是结构域的高度保守部分,但是也可以仅包括该结构域的部分,或可以位于保 守结构域之外(若该基序的全部氨基酸位于定义的结构域之外)。杂交如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列相互复性的 过程。杂交过程可以完全在溶液中进行,即两种互补性核酸分子均处在溶液中。杂交过程 也可以用固定至基质如磁珠、琼脂糖凝胶(S印harose)珠或任何其他树脂的互补性核酸分 子之一进行。杂交过程也可以用固定至固体支持物如硝酸纤维素膜或尼龙膜上或通过例如 照相平版印刷术固定至例如硅玻璃支持物(后者称作核酸序列阵列或微阵列或称作核酸 序列芯片)的互补性核酸分子之一进行。为使杂交发生,核酸分子通常被热变性或化学变 性,以将双链解链成两条单链和/或去除来自单链核酸分子的发夹或其他二级结构。术语“严格性”指杂交发生的条件。杂交的严格性受诸条件如温度、盐浓度、离子 强度和杂交缓冲液组成的影响。通常,将低严格条件选择成在定义的离子强度和PH处,低 于特定序列的热解链温度(Tm)约30°C。中等严格条件是当所述温度在Tm以下20°C时,并 且高严格条件是当所述温度在Tm以下10°C时。高严格杂交条件一般用于分离与靶核酸序 列具有高序列相似性的杂交序列。然而,核酸序列可以在序列上偏离且依旧编码基本上相 同的多肽,原因是遗传密码的简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类 核酸分子序列。Tm是在定义的离子强度和pH处的下述温度,其中50%的靶序列在所述温度与完 全匹配的探针杂交。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在更 高温度上特异性杂交。最大杂交速率从低于Tm约16°C直至32°C获得。杂交溶液中一价阳 离子的存在降低了两条核酸分子链之间的静电排斥作用,因而促进杂交体形成;这种作用 对于直到0.4M的钠浓度是显而易见的(对于更高的浓度而言,可以忽略这种作用)。甲酰 胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数的甲酰胺降低0. 6至0. 7°C,且添 加50%甲酰胺允许在30至45°C杂交,尽管杂交速率会降低。碱基对错配降低杂交速率和 双链体的热稳定性。平均且对于大的探针而言,Tm下降约11/每%碱基错配。根据杂交 体的类型,Tm可以使用以下等式计算1)DNA-DNA 杂交体(Meinkoth 和 ffahl, Anal. Biochem.,138 :267_284,1984)Tm = 81. 5°C +16. 6Xlog10[Na+]a+0. 41X % [G/Cb]-500 X LT1-。. 61X % 甲酰胺2) DNA-RNA 杂交体或 RNA-RNA 杂交体Tm = 79. 8+18. 5(log10[Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb)2_820/Lc
3)寡DNA杂交体或寡RNAd杂交体对少于20个核苷酸而言Tm = 2 (ln)对20-35 个核苷酸而言Tm = 22+1. 46 (ln)a或者用于其他一价阳离子,但是仅在0. 01-0. 4M范围内是精确的。”又对于在30% -75%范围内的% GC是精确的。CL =双链体的碱基对长度。d 01 igo,寡核苷酸;ln,=引物的有效长度=2 X (G/C数)+ (A/T数)。可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白 质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非 同源性探针,可以通过变换以下条件之一 (i)渐进地降低复性温度(例如从68°C至42°C) 或(ii)渐进地降低甲酰胺浓度(例如从50%至0% )进行一系列杂交。技术人员了解可 以在杂交期间变更并且会维持或改变所述严格条件的多个参数。除了杂交条件之外,杂交特异性一般还取决于杂交后洗液的功能。为除去因非特 异性杂交引起的背景,用稀释的盐溶液洗涤样品。此类洗液的关键因素包括最终洗涤溶液 的离子强度和温度盐浓度越低且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在 杂交严格性上或低于所述杂交严格性进行。阳性杂交产生至少两倍于背景信号的信号。通 常,用于核酸序列杂交测定法或基因扩增检测方法的适宜严格条件如上所述。也可以选择 严格性更高或更低的条件。技术人员了解可以在洗涤期间变更并且会维持或改变所述严格 条件的多个参数。例如,用于长度大于50个核苷酸的DNA杂交体的典型高严格杂交条件包括在65°C 于1XSSC中或在42°C于1XSSC和50%甲酰胺中杂交,随后在65°C于0. 3XSSC中洗涤。 用于长度大于50个核苷酸的DNA杂交体的中等严格杂交条件的例子包括在50°C于4X SSC 或在40°C于6XSSC和50%甲酰胺中杂交,随后在50°C于2XSSC中洗涤。杂交体的长度是 杂交核酸的预期长度。当序列已知的核酸分子杂交时,可以通过比对序列并鉴定本文中所 述的保守区而确定杂交体长度。1\33(是0. 15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤 溶液可以额外地包括5XDenhardt试剂、0. 5-1. 0% SDSUOOu g/ml变性的片段化鲑精DNA、 0.5%焦磷酸钠。出于定义严格性水平的目的,可以参考Sambrook等(2001)MolecularCloning :a laboratory manual,第三版 Cold Spring Harbor LaboratoryPress, CSH, New York 或参 考 Current Protocols in Molecular Biology, John Wiley&Sons,N. Y. (1989 禾口年度更新 版)。剪接变体如本文中所用的术语“剪接变体”包括其中已经切除、替换、置换或添加所选内含 子和/或外显子或其中已经缩短或加长内含子的核酸序列的变体。此类变体将是基本上保 留蛋白质的生物学活性的一类变体;这可以通过选择性保留蛋白质的功能片段实现。此类 剪接变体可以在自然界中找到或可以人工制备。用于预测和分离此类剪接变体的方法是本 领域熟知的(见例如 Foissac 和 Schiex(2005)BMC Bioinformatics. 6 25)。等位变体等位基因或等位变体是给定基因位于相同染色体位置处的备选形式。等位变体包含单核苷酸多态性(SNP)和小的插入/缺失多态性(INDEL)。INDEL的大小通常小于lOObp。 SNP和INDEL形成大部分生物的天然存在多态性株系中的序列变体的最大集合。基因改组/定向进化基因改组或定向进化由反复DNA改组,随后适当筛选和/或选择以产生编码具 有改良生物学活性的蛋白质的核酸序列或其部分的变体而组成(Castle等人,(2004) Science 304(5674) :1151_4 ;美国专利 5,811,238 和 6,395,547)。调节元件/调控序列/启动子术语“调节元件”、“调控序列”和“启动子”均在本文中可相互交换地使用并且在广 泛含义上意指能够实现与它们相连接的序列表达的调节性核酸序列。术语“启动子” 一般 指位于基因转录起点上游并参与识别和结合RNA聚合酶和其他蛋白质,因而指导有效连接 的核酸转录的核酸序列调控序列。前述术语包括从经典真核基因组基因(包括对于精确转 录启动所需的TATA框,具有或没有CCAAT框序列)衍生的转录调节序列和应答发育性刺激 和/或外部刺激或以组织特异性方式而改变基因表达的其它调节元件(即上游激活序列、 增强子(increaser)和沉默子)。本术语还包括经典原核基因的转录调节序列,在此情况下 它可以包括一个-35框序列和/或一个-10框转录调节序列。术语“调节元件”也包含赋 予、激活或增加核酸分子序列在细胞、组织或器官中表达的人工融合分子或衍生物。“植物启动子”包含介导植物细胞中编码序列节段表达的调节元件。因此,植物启 动子不必须是植物来源的,但可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植 物启动子”优选地源于植物细胞,例如来自用在本发明方法中待表达并在本文中描述的核 酸序列转化的植物。这也适用于其他“植物”调节信号,如“植物”终止子。用于本发明方 法中的核苷酸序列上游的启动子可以通过一个或多个核苷酸替换、插入和/或缺失进行修 饰,但不影响启动子、可读框(0RF)或3’调节区如终止子或远离0RF存在的其他3’调节区 的功能性或活性。还有可能所述启动子的活性因修饰其序列或它们被更活跃的启动子、甚 至来自异源生物的启动子彻底替换而提高。为了在植物中表达,如上所述,核酸序列分子必 须有效地连接至或包含在正确的时间点并以所需空间表达模式表达基因的合适启动子。为鉴定功能性等同启动子,候选启动子的启动子强度和/或表达模式可以例如通 过将此启动子有效连接至报道基因并分析该报道基因在植物的多种组织中的表达水平和 模式进行分析。合适的熟知报道基因包括例如葡糖醛酸酶或半乳糖苷酶。启动子 活性通过测量葡糖醛酸酶或半乳糖苷酶的酶活性进行分析。启动子强度和/或表 达模式可以随后与参考启动子(如在本发明方法中使用的一种启动子)的启动子强度和/ 或表达模式比较。备选地,启动子强度可以使用本领域已知方法如RNA印迹法及放射自显 影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996GenomeMethods 6 :986_994), 通过量化mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较进行分析。通常“弱启动子”意指驱动编码序列在低水平表达的启动 子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000 转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或以每个细胞约1/10转录物 至约1/100转录物、至约1/1000转录物表达。通常,“中等强度启动子”意指驱动编码序列 在一切情况下以低于受35S CaMV启动子控制时所获得水平的水平表达的启动子。有效地连接
如本文中所用的术语“有效地连接”指启动子序列与目的基因之间的功能连接,从 而该启动子序列能够启动该目的基因转录。组成型启动子“组成型启动子”指在生长和发育的大部分期间但不是必需在全部期间,以及在大 多数环境条件下,在至少一种细胞、组织或器官中有转录活性的启动子。下表2a给出组成 型启动子的例子。表2a 植物组成型启动子的例子 遍在启动子遍在启动子是在生物的全部组织或细胞中基本上有活性的。发育调节型启动子发育调节型启动子在某些发育阶段期间或在经历发育变化的植物的部分中有活 性。诱导型启动子诱导型启动子在应答化学刺激(综述见Gatz 1997,Annu. Rev. PlantPhysiol. Plant Mol.Biol. ,48 :89_108)、环境刺激或物理刺激时具有诱导的或提高的转录启动作 用,或可以是“胁迫诱导的”,即当植物暴露于多种胁迫条件时其激活,或是“病原体诱导 的”,即当植物暴露于多种病原体时其激活。器官特异性/组织特异性启动子器官特异性或组织特异性启动子是能够偏好地启动某些器官或组织如叶、根、种 子组织等中转录的启动子。例如,“根特异性启动子”是这样的启动子,该启动子优势地在植 物根中具有转录活性,在植物的任何其他部分中基本上无活性,尽管在该植物的这些其他 部分中仍允许任意泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞 特异性的”。根特异性启动子的例子列于下表2b中。表2b 根特异性启动子的例子 种子特异性启动子是能够在种子组织中优势地具有转录活性的启动子,但无需排 他性地在种子组织中有转录活性(在泄露表达的情况下)。种子特异性启动子可以在种子 发育期间和/或萌发期间有活性。种子特异性启动子的例子示于下文表2c中。种子特异 性启动子的其他例子在 Qing Qu 和 Takaiwa(Plant Biotechnol. J. 2,113-125,2004)中给 出,所述文献的公开内容如完整所述那样通过引用方式并入本文。表2c 种子特异性启动子的例子如本文中所定义的绿色组织特异性启动子是优势地在绿色组织中具有转录活性 的启动子,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分中仍允 许任意泄露表达。可以用来实施本发明方法的绿色组织特异性启动子的例子示于下文表2d中。表2d 绿色组织特异性启动子的例子 组织特异性启动子的另一个例子是分生组织特异性启动子,其优势地在分生组织 中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在该植物的这些其他部分 中仍允许任意泄露表达。可以用来实施本发明方法的分生组织特异性启动子的例子示于下 文表2e中。表2e 分生组织特异性启动子的例子 终止子术语“终止子”包括作为转录单元末端处DNA序列的调控序列,所述的DNA序列产 生初级转录物的3'加工和多腺苷酸化及转录终止的信号。终止子可以从天然基因、从多种 其他植物基因或从T-DNA衍生。待添加的终止子可以从例如胭脂碱合酶基因或章鱼碱合酶 基因或备选地从另一种植物基因或较次优选地从任何其他真核基因衍生。调节就表达或基因表达而言,术语“调节”意指这样的过程,在所述过程中与对照植物 相比较,表达水平因所述基因的表达而改变,优选地,表达水平可以提高或降低。原始、未 调节的表达可以是结构性RNA(rRNA、tRNA)或mRNA的任何类型的表达,随后是翻译。术语 “调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何改变,这引起植物产量 提高和/或生长增加。表达术语“表达”或“基因表达”意指某个特定基因或多个特定基因或特定基因构建体 的转录。术语“表达”或“基因表达”尤其意指某个基因或某些基因或基因构建体转录成结 构性RNA (rRNA.tRNA)或mRNA,所述RNA随后翻译成或不翻译成蛋白质。该过程包括DNA的 转录和所得mRNA产物的加工。增加的表达/过量表达如本文中所用的术语“增加的表达”或“过量表达”意指相对于原有野生型表达水 平为额外的任何形式的表达。
用于提高基因或基因产物表达的方法在本领域内被充分报道并且包括例如由适 宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以导入在非异源形式的多核 苷酸的适宜位置(一般在上游)中导入充当启动子或增强子元件的分离的核酸,从而上调 编码目的多肽的核酸表达。例如,可以在体内通过突变、缺失和/或替换而改变内源性启动 子(见Kmiec,US5, 565,350 ;Zarling等,W09322443),或可以将分离的启动子以相对于本 发明基因的恰当方向及距离导入植物细胞,从而控制该基因的表达。若需要多肽表达,通常希望的是在多核苷酸编码区的3’末端包括多腺苷酸化区。 该多腺苷酸化区可以从天然基因、从多种其他植物基因或从T-DNA衍生。待添加的3’末端 序列可以从例如胭脂碱合酶基因或章鱼碱合酶基因或备选地从另一种植物基因或较不优 选地从任何其他真核基因衍生。内含子序列也可以添加至5’非翻译区(UTR)或部分编码序列的编码序列以提 高细胞质中聚集的成熟信使的量。已经显示在植物和动物表达构建体的转录单位中包 含可剪接内含子提高了 mRNA水平及蛋白质水平上的基因表达高达1000倍(Buchman和 Berg(1988)Mol. Cell biol. 8 :4395_4405 ;Callis 等(1987)Gens Dev 1:1183-1200)。基 因表达的此类内含子增强作用一般在所述内含子置于转录单位的5’末端附近时是最强烈 的。玉米内含子Adhl-S内含子1、2和6、BronZe-l内含子的用途是本领域已知的。对于总 体信息,见《玉米手册》,第116章,编者Freeling和ffalbot, Springer, N. Y. (1994)。内源基因本文中对“内源性”基因的称谓不仅指如植物中以其天然形式(即没有人类任何 干预)存在的所讨论基因,还指处于分离形式的随后(再)被导入植物(转基因)的相同 基因(或基本上同源的核酸/基因)。例如,含有这种转基因的转基因植物可以遭遇转基因 表达的相当大程度地度降低和/或内源基因表达的实质降低。分离的基因可以从生物分离或可以是人造的,例如通过化学合成法。降低的表达本文中提及的“降低的表达”或“降低或基本消除表达”意指内源基因表达和/或 多肽水平和/或多肽活性相对于对照植物的下降。与对照植物相比较,所述降低或基本上 消除以增加的优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90% 或 95%、96%、97%、98%、99% 或更多降低。为了降低或基本消除植物中内源基因的表达,需要核酸序列的基本上连续的核苷 酸的足够长度。为进行基因沉默,该长度可以短至20、19、18、17、16、15、14、13、12、11、10个 或更少核苷酸,或者该长度可以长至整个基因(包括部分或完整的5’和/或3’ UTR)。基 本上连续的核苷酸片段可以从编码目的蛋白的核酸序列(靶基因)或从能够编码目的蛋白 的直向同源物、旁系同源物或同源物的任何核酸序列衍生。优选地,基本上连续的核苷酸的 片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以增 加的优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、 96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中 所讨论用于降低或基本消除内源基因表达的多种方法的前提。可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消 除内源基因表达的方法是使用核酸序列或其部分(在此情况下,所述部分是从目的基因衍生或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构)进行RNA介导的 沉默。RNA沉默方法的另一个例子包括将核酸序列或其部分(在此情况下是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列中衍生的一 段基本上连续的核苷酸)以有义方向导入植物。RNA沉默方法的另一个例子涉及使用反 义核酸序列。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(Amp1 icon VIGS WO 98/36083)或 Baulcombe(W0 99/15682)及其他人描述的策略实现。技术人员会熟知其他方法,如使用针 对内源多肽的抗体以抑制该多肽在植物中(in planta)的功能,或干扰涉及某多肽的信号 传导途径。人工和/或天然的微RNA (miRNA)可以用来敲除基因表达和/或mRNA翻译。内 源miRNA是通常19-24个核苷酸的单链小RNA。可以使用常规工具和技术完成表达的这种降低或基本消除。用于降低或基本消除 内源基因表达的优选方法是在植物中导入并表达基因构建体,其中将核酸(在此情况下, 从目的基因或从能够编码任何一种目的蛋白的直向同源物、旁系同源物或同源物的任何核 酸中衍生的一段基本上连续的核苷酸)克隆至所述基因构建体,(部分或完全地)作为被 间隔序列(非编码性DNA)隔开的反向重复序列。在这种优选的方法中,使用核酸或其部分(在此情况下,所述部分是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上连续的核苷酸)的反向重复序列(其优选能够形成发夹结构),通过RNA介导的沉默作用 降低或基本上消除内源基因的表达。在包含调控序列的表达载体中克隆该反向重复序列。 非编码性DNA核酸序列(间隔序列,例如基质附着区片段(MAR)、内含子、多接头等)位于 形成所述反向重复序列的两个反向核酸之间。在反向重复序列转录后,形成具有(部分或 完全)自我互补性结构的嵌合RNA。这种双链RNA结构称作发夹RNA(hpRNA)。hp RNA由植 物加工成siRNA,该siRNA被掺入RNA诱导的沉默复合体(RISC)。该RISC进一步切开所述 mRNA转录物,从而相当大程度地降低待翻译成多肽的mRNA转录物的数目。对于其他一般细 节,见例如 Grierson 等人(1998)W0 98/53083 ;Waterhouse 等人(1999)W0 99/53050。本发明方法的实施不取决于在植物中导入并表达将所述核酸作为反向重复序列 克隆到其中的基因构建体,不过可以使用几种熟知“基因沉默”方法中任何一种或多种方法 来实现相同效果。用于降低内源基因表达的一种这样的方法是RNA介导的基因表达沉默(下调)。 在这种情况下,沉默作用由植物中与内源性靶基因实质相似的双链RNA序列(dsRNA)触发。 这种dsRNA进一步被植物加工成约20个至约26个核苷酸的所谓短干扰RNA (siRNA)。所 述siRNA被掺入RNA诱导的沉默复合体(RISC),其中所述RISC切割内源靶基因的mRNA转 录物,从而相当大程度地将降低待翻译成多肽的mRNA转录物的数目。优选地,所述双链RNA 序列与靶基因对应。RNA沉默方法的另一个例子涉及将核酸序列或其部分(在此情况下是从目的基因 或从能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸中衍生的一段基本 上连续的核苷酸)以有义方向导入植物。“有义方向”涉及与自身mRNA转录物同源的DNA 序列。因而将所述核酸序列的至少一个拷贝导入植物。这个额外核酸序列会降低内源基因表达,从而产生已知为共抑制作用的现象。将一个核酸序列的几个额外拷贝导入植物时,基 因表达的降低将更明显,因为高转录物水平与触发共抑制作用之间存在正相关。RNA沉默方法的另一个例子涉及使用反义核酸序列。“反义”核酸序列包含与编码 蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补,或与mRNA转录物序列 互补的核苷酸序列。反义核酸序列优选地互补于待沉默的内源基因。这种互补性可以存在 于基因的“编码区”中和/或其“非编码区”中。术语“编码区”指包含被翻译成氨基酸残基 的密码子的核苷酸序列的区域。术语“非编码区”指分布在编码区侧翼的被转录但不翻译 成氨基酸的5’和3’序列(也称作5’和3’非翻译区)。反义核酸序列可以根据Watson和Crick碱基对规则设计。反义核酸序列可以互 补于整个核酸序列(在此情况下是从目的基因或从能够编码目的蛋白的直向同源物、旁系 同源物或同源物的任何核酸中衍生的一段基本上连续的核苷酸),不过也可以是仅对所述 核酸序列的一部分(包括mRNA5’和3’ UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可 以互补于编码多肽的mRNA转录物的翻译起点周围的区域。合适反义寡核苷酸序列的长度 是本领域已知的并且可以从约50、45、40、35、30、25、20、15或10个核苷酸或更小的核苷酸 长度开始。本发明的反义核酸序列可以使用化学合成反应和酶连接反应,利用本领域已知 的方法构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在核苷酸或 以多种方式修饰的核苷酸化学地合成,其中所述的修饰核苷酸设计旨在增加分子的生物学 稳定性或增加反义与有义核酸序列之间所形成的双链体的物理稳定性,例如,可以使用硫 代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸的例子是 本领域熟知的。已知的核苷酸修饰包括甲基化、环化和‘加帽’及用类似物(如肌苷)替换 一个或多个天然存在核苷酸。对核苷酸的其他修饰作用是本领域熟知的。反义核酸序列可以使用表达载体以生物学方式产生,其中一种核酸序列已经以反 义方向亚克隆(即从插入的核酸转录出的RNA会对目的靶核酸为反义方向)到所述表达载 体中。优选地,植物中反义核酸序列的产生借助稳定整合的核酸构建体进行,其中所述的核 酸构建体包含启动子、有效连接的反义寡核苷酸和终止子。用于本发明方法中沉默作用的核酸分子(无论被导入植物中或原位(insitu)地 产生)与mRNA转录物和/或编码多肽的基因组DNA杂交或结合以因而抑制蛋白质的表达, 例如通过抑制转录和/或翻译做到这一点。杂交可以因形成稳定双链体的常规核苷酸互 补性引起,或例如,在与DNA双链体结合的反义核酸序列的情况下,因双螺旋大沟内的特异 性相互作用引起。反义核酸序列可以通过在特定组织部位转化或直接注射导入植物。备选 地,反义核酸序列可以被修饰以靶向所选的细胞并且随后全身性施用。例如,对于全身性施 用,可以修饰反义核酸序列,从而它们与表达在所选细胞表面上的受体或抗原特异性地结 合,例如通过将所述反义核酸序列连接至与细胞表面受体或抗原结合的肽或抗体连接而做 到这一点。反义核酸序列也可以使用本文中所述的载体递送至细胞。根据又一个方面,反义核酸序列是a-端基异构核酸序列。a端基异构核酸序 列与互补RNA形成特定的双链杂交体,在所述双链杂交体中与常见的b-单元相反,所述 链彼此平行(Gaultier等(1987)Nucl Ac Resl5 :6625_6641)。反义核酸序列也可以包含 2,-0-甲基核糖核苷酸(Inoue 等(1987) Nucl Ac Res 15,6131-6148)或嵌合 RNA-DNA 类 似物(Inoue 等(1987) FEBS Lett. 215,327-330)。
25
内源基因表达的降低或基本上消除也可以使用核酶进行。核酶是具有核糖核酸酶 活性的催化性RNA分子,能够切割与之具有互补区域的单链核酸序列,如mRNA。因此,核酶 (例如锤头状核酶(在Haselhoff和Gerlach(1988)Nature 334,585-591中描述)可以用来 催化地切割编码多肽的mRNA转录物,因而相当大程度地降低待翻译成多肽的mRNA转录物 的数目。可以设计对核酸序列具有专一性的核酶(见例如Cech等美国专利号4,987,071 ; 和Cech等美国专利号5,116,742)。备选地,与核酸序列相对应的mRNA转录物可以用来从 RNA分子的汇集物中选出具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak (1993) Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins 等人(1994)W0 94/00012 ;Lenne 等人(1995)W0 95/03404 ;Lutziger 等人(2000)W0 00/00619 ;Prinsen 等人(1997) W0 97/13865 和 Scott 等人(1997) W0 97/38116)。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(Amp1 icon VIGSWO 98/36083)或 Baulcombe(W0 99/15682)及其他人描述的策略实现。如果内源基因中存在突变和/或在随后导入植物的分离基因/核酸中存在突变, 基因沉默也可能发生。所述降低或基本上消除可以由无功能的多肽引起。例如,该多肽可 以与多种相互作用的蛋白质结合;一种或多种突变和/或截短作用因而可以产生仍能够结 合相互作用的蛋白质(如受体蛋白)但不能展示正常功能的多肽(如信号传导配体)。基因沉默的又一种方法是瞄准互补于基因调节区(例如启动子和/或增强子) 的核酸序列以形成阻止靶细胞中基因转录的三重螺旋结构。见Helene,C.,Anticancer Drug Res. 6,569-84,1991 ;Helene 等,Ann. N. Y. Acad. Sci. 660,27-361992 ;和 Maher, L. J. Bioassays 14,807-15,1992。技术人员会熟知其他方法,如使用针对内源多肽的抗体以抑制该多肽在植物中 (in planta)的功能,或干扰涉及某多肽的信号传导途径。特别地,可以考虑人造分子可能 用于抑制靶多肽的生物学功能,或用于干扰涉及所述靶多肽的信号传导途径。备选地,可以建立筛选程序以鉴定植物群体中基因的天然变体,其中所述的变体 编码具有降低的活性的多肽。也可以使用此类天然变体,例如来进行同源重组。人工和/或天然的微RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源 miRNA是通常19-24个核苷酸的单链小RNA。它们主要发挥调节基因表达和/或mRNA翻译 的功能。大多数的植物微RNA (miRNA)与其靶序列具有完全或接近完全的互补性。然而,存 在具有多达5个错配的天然靶。它们从具有特征性折返结构的较长非编码性RNA由Dicer 家族的双链特异性RNA酶加工得来。加工后,它们通过与RNA诱导的沉默复合体(RISC)的 主要组分-Argonaute蛋白结合被掺入该复合体。miRNA充当RISC的特异性组分,因为它们 与胞浆中的靶核酸(大多是mRNA)发生碱基配对。后续调节事件包括靶mRNA切割和摧毁 和/或翻译抑制。miRNA过量表达的影响因此往往反映为靶基因的mRNA水平降低。可以特别地遗传工程化一般21个核苷酸长度的人工微RNA(amiRNA)以负向地调 节单个或多个目的基因的基因表达。选择植物的微RNA靶的决定因素是本领域熟知的。已 经定义了用于靶识别的经验参数并且可以使用它们辅助特定amiRNA的设计(Schwab等人, (2005)Dev Cell8(4) :517_27)。用于设计并产生amiRNA及其前体的便利工具也是公众可 获得的(Schwab 等人,(2006)Plant Cel 18(5) :1121_33)。
为了最佳性能,用于降低植物中内源基因表达的基因沉默技术需要使用来自单子 叶植物的核酸序列转化单子叶植物,并使用来自双子叶植物的核酸序列转化双子叶植物。 优选地,将来自任意的给定植物物种的核酸序列导入相同的物种。例如,将来自稻的核酸序 列转化到稻植物中。然而,不绝对要求待导入的核酸序列来自与待导入该核酸序列的植物 相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在实质同源性即可。上文描述了用于降低或基本上消除植物中内源基因表达的多种方法的例子。例 如,本领域技术人员将能够轻易调整用于沉默的前述方法,从而通过利用合适的启动子在 完整植物中或其部分中实现内源基因表达的降低。选择标记(基因)/报道基因“选择标记”、“选择标记基因”或“报道基因”包括向细胞赋予表型的任意基因,其 中在所述细胞中表达所述“选择标记”、“选择标记基因”或“报道基因”以促进鉴定和/或选 择用本发明核酸序列构建体转染或转化的细胞。这些标记基因能够借助一系列不同原理而 鉴定核酸序列分子的成功转移。合适的标记可以选自赋予抗生素抗性或除草剂抗性、导入 新代谢性状或允许目视选择的标记。选择标记基因的例子包括赋予抗生素抗性的基因(如 使新霉素和卡那霉素磷酸化的nptll或使潮霉素磷酸化的hpt或赋予针对例如博来霉素、 链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin) (G418)、壮观霉素或 杀稻瘟菌素的抗性的基因)、赋予除草剂抗性的基因(例如提供Basta 抗性的bar ;提供 草甘膦抗性的aroA或gox或赋予针对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或 提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或利用木糖的木糖异 构酶,或抗营养性标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致颜色(例如葡 糖醛酸酶、GUS或0 -半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系 统)或荧光(绿色荧光蛋白GFP和其衍生物)的形成。这个名单仅代表少数的可能标记。 技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。已知当核酸序列稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且 根据需要,将外来DNA整合至细胞基因组中,这取决于所用的表达载体和所用的转染技术。 为鉴定并选择这些整合体,通常将编码选择标记的基因(如上文所述的基因)连同目的基 因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体 中使用。此外,编码选择标记的核酸序列分子可以在包含编码本发明多肽或本发明方法中 所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸序列 稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其 他细胞死亡)。因为一旦已经成功地导入所述标记基因、尤其抗生素抗性基因和除草剂抗性基 因,则这些核酸序列是转基因宿主细胞中不再需要或不想要的,因此用于导入核酸序列的 本发明方法有利地使用能够移除或切除这些标记基因的技术。一种这样的方法是所谓共转 化法。共转化法同时使用两种载体以转化,一种载体携带本发明的核酸序列而第二种载体 携带标记基因。大比例的转化体接受或在植物情况下包含(多达40%或更多的转化体) 这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部 分,即侧翼存在T-DNA的序列,该序列通常代表表达盒。标记基因随后可以通过实施杂交 从转化植物中移除。在另一种方法中,整合至转座子的标记基因与想要的核酸序列一起用
27于转化(称作Ac/Ds技术)。转化体可以与转座酶来源物杂交,或转化体用引起转座酶表 达的核酸序列构建体瞬时或稳定转化。在一些情况下(大约10%),一旦转化已经成功发 生,则转座子从宿主细胞的基因组跳出并丢失。在其他许多情况下,转座子跳到一个不同位 置。在这些情况下,标记基因必须通过实施杂交来消除。在微生物学中,开发了有可能或促 进检测这类事件的技术。又一种有利方法依赖于所谓重组系统;所述方法的优势在于杂交 消除作用可以用该重组系统实行。最知名的该类型系统称作Cre/lox系统。Crel是移除 位于loxP序列之间序列的重组酶。如果标记基因整合于loxP序列之间,一旦转化已经成 功发生,则它因重组酶的表达被移除。其他重组系统是HIN/HIX、FLP/FRT和REP/STB系统 (Tribble 等,J. Biol. Chem.,275,2000 :22255_22267 ;Velmurugan 等,J. Cell Biol.,149, 2000:553-566)。位点特异性地整合本发明核酸序列至植物基因组是可能的。自然,这些方 法也可以应用于微生物如酵母、真菌或细菌。转基因的/转基因/重组为本发明的目的,“转基因的”、“转基因”或“重组”例如就核酸序列而言,意指包含 所述核酸序列的表达盒、基因构建体或载体,或用本发明核酸序列、表达盒或载体转化的生 物,这些构建体均通过重组方法产生,其中(a)编码在本发明方法中有用的蛋白质的核酸序列,或(b)与本发明核酸序列有效连接的基因调控序列,例如启动子,或(c)a)和 b)并不位于它们的天然遗传环境中或已经通过重组方法被修饰,所述的修饰有可能 采取例如替换、添加、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指 原初植物中的天然基因组位点或染色体位点或存在于基因组文库中。在基因组文库的情况 下,优选地保留,至少部分地保留该核酸序列的天然遗传环境。该环境分布在该核酸序列的 至少一侧并且具有至少50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp序 列长度。当通过非天然、合成性(“人工”)方法(例如诱变处理)修饰天然存在表达盒时,该 表达盒-例如所述核酸序列的天然启动子与编码如上文所定义在本发明方法中有用的多 肽的相应核酸序列的天然存在组合-变成转基因表达盒。合适的方法例如在US 5,565,350 或TO 00/15815中描述。为本发明目的,如上所述,将转基因植物因此理解为意指本发明方法中所用诸核 酸序列不处于它们在所述植物基因组中的天然基因座处,从而有可能同源或异源地表达所 述核酸序列。然而,如所提及,转基因还意指尽管本发明的或本发明方法中所用的诸核酸序 列处于它们在植物基因组中的天然位置处,然而相对于天然序列,它们的序列已经被修饰, 和/或所述天然序列的调节序列已经被修饰。转基因优选地理解为意指本发明核酸序列在 基因组中的非天然基因座处表达,即所述核酸序列的同源表达或优选异源表达发生。在本 文中提及了优选的转基因植物。转化如本文中提及的术语“导入”或“转化”包括转移外源多核苷酸至宿主细胞中,无论 转化所用的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚发生)的植物组织 可以用本发明的基因构建体转化并且可完整植物以从中再生。所选的具体组织根据可用于 并且最好适于正在进行转化的具体物种的克隆性增殖系统变化。示例性靶组织包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存的分生组织(例如顶端分生组织、腋芽和 根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以 瞬时或稳定地导入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,它可以整合至 宿主基因组中。所得的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转 化植物。外来基因转移至植物基因组的过程称作转化。植物物种的转化现在是相当常规的 技术。有利地,可以使用几种转化方法中的任意方法将目的基因导入合适的祖先细胞。描述 用于转化并从植物组织或植物细胞再生出植物的方法可以用于瞬时转化或稳定转化。转化 方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪 轰击法、使用病毒或花粉的转化法和微量投射法(microprojection)。转化方法可以选自用 于原生质体的钙 / 聚乙二醇法(Krens,F.A.等人,(1982)Nature296,72-74 ;Negrutiu I 等 A (1987)Plant Mol Biol 8:363-373);原生质体的电穿孔法(Shillito R. D.等人(1985) Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A 等人,(1986)Mol. Gen Genet 202:179-185) ;DNA 或 RNA 包被粒子轰击法(Klein TM 等人,(1987) Nature 327 70)、用(非整合性)病毒感染等。包括转基因作物植物在内的转基因植物优选通过农杆菌 介导的转化法产生。有利的转化方法是植物原位(in planta)转化法。为此目的,例如有可 能使农杆菌作用于植物种子或有可能用农杆菌接种植物分生组织。根据本发明,已经证明 将转化的农杆菌悬液作用于完整植物或至少作用于花原基是特别有利的。随后培育该植物 直至获得已处理植物的种子(Clough和Bent,Plant J. (1998) 16,735-743)。用于农杆菌介 导稻转化的方法包括用于稻转化的熟知方法,如在以下任意文献中描述的那些方法欧洲 专利申请EP 1198985Al,Aldemita和 Hodges (Planta 199:612-617,1996) ;Chan 等(Plant Mol Biol 22(3) :491_506,1993),Hiei 等(Plant J 6(2) :271_282,1994),其公开内容 如充分所述那样通过引用的方式并入本文。在谷物转化的情况下,优选的方法如Ishida 等人(Nat. Biotechnol 14(6) :745_50,1996)或 Frame 等人(Plant Physiol 129(1) 13-22,2002)描述,其公开内容如充分所述那样通过引用的方式并入本文。所述方法例如 还由 B. Jenes 等,Techniques for Gene,在Transgenic Plants,第 1 卷,Engineering and Utilization,编者 S. D. Kung 禾口 R. ffu, AcademicPress (1993) 128—143 及在 Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225)中描述。待表达的核 酸序列或构建体优选地克隆至适于转化根癌农杆菌(Agrobacterium tumefaciens)的载 体,例如pBinl9(Bevan等人,Nucl. Acids Res. 12 (1984) 8711)。通过这种载体转化的农 杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物如拟南芥属植物(拟 南芥在本发明范围不视为作物植物),或作物植物,例如烟草植物,所述方式例如是通过 在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后在合适培养基中培育它们。借助根癌农 杆菌转化植物例如由116[区611和机11111^261~在灿(;1.4(^(1 Res. (1988) 16,9877中描述 或尤其从F.F.White,用于高等植物中基因转移的载体(Vectors for Gene Transfer in HigherPlants);在 Transgenic Plants,第 1 卷,Engineering and Utilization,S. D. Kung 和 R.Wu 编著,Academic Press,1993,第 15-38 页中获知。除了转化随后必需再生成完整植物的体细胞之外,也可以转化植物分生组织的 细胞,并且尤其那些发育成配子的细胞。在这种情况下,转化的配子遵循天然的植物发育过程,从而产生转基因植物。因此,例如用农杆菌处理拟南芥属植物的种子并且从正在发 育的植物中获得种子,其中一定比例的所述植物被转化并且因此是转基因的[Feldman, KA 禾卩 MarksMD(1987)Mol Gen Genet 208 274-289 ;Feldmann K (1992),在编者 CKoncz, N-H Chua 禾口 J Shell, Methods in Arabidopsis Research. WordScientific, Singapore, 第274-289页]。备选方法基于反复移除花序并将莲座丛中心内的切除部位与转化的农杆 菌孵育,因而同样可以在较晚的时间点获得转化的种子(Chang(1994)Plant J. 5 :551_558 ; Katavic(1994)MolGen Genet, 245 =363-370) 0然而,特别有效的方法是改良真空浸润法, 如“浸花”法。在拟南芥属植物真空浸润法的情况下,用农杆菌悬液在减低的压力下处 理完整植物[Bechthold,N(1993). C R Acad Sci Paris Life Sci,316 :1194_1199],而 在“浸花”法的情况下,将正在发育的花组织与表面活性剂处理过的农杆菌悬液短暂孵育 [Clough,SJ 和 Bent,AF(1998)The Plant J. 16,735-743]。在这两种情况下均收获某个比 例的转基因种子,并且这些种子可以通过生长在如上所述的选择条件下与非转基因种子区 分开。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母系方式遗传,这降低 或消除了借助花粉的转基因流动风险。叶绿体基因组的转化一般通过已经在Klaus等人, 2004[Nature Biotechnology 22 (2),225-229]中示意性展示的方法实现。简而言之,将待 转化的序列连同选择标记基因一起克隆至同源于叶绿体基因组的侧翼序列之间。这些同源 侧翼序列指导向原质体系的位点特异性整合。已经对许多不同的植物物种描述质体转化 法并且在Bock (2001)基础研究和植物生物技术中的转基因质体(Transgenic plastidsin basic research and plant biotechnology). J Mol Biol. 2001 年月 21 日;312 (3) :425_38 或 Maliga, P(2003)质体转化技术商业化进展(Progresstowards commercialization of plastid transformation technology), TrendsBiotechnol. 21, 20-28 中给出综述。其他 的生物技术进展最近已经以无标记质体转化体的形式报道,其中可以通过瞬时共整合的 标记基因产生所述无标记质体转化体(Klaus等人,2004,Nature Biotechnology 22(2), 225-229)。T-DNA 活化标签技术(T-DNA activation tagging)T-DNA活化标签技术(Hayashi等人Science (1992) 1350-1353)涉及以如此方式在 目的基因的基因组区域内或基因编码区的上游或下游10kb处插入通常含有启动子(也可 以是翻译增强子或内含子)的T-DNA,从而该启动子指导目标基因的表达。一般,目标基因 的天然启动子对该基因表达的调节作用被破坏,并且该基因受新导入的启动子控制。该启 动子一般嵌入T-DNA中。这种T-DNA随机地插入植物基因组,例如借助农杆菌感染,并且引 起在所插入T-DNA附近的基因表达受到调节。所得的转基因植物表现显性表型,原因在于 所导入启动子附近的基因受修饰的表达。TILLING术语“TILLING”是“基因组中定向诱导局部损伤法”的缩写并且指用于产生和/ 或鉴定核酸序列的诱变技术,其中所述核酸序列编码具有改良表达和/或活性的蛋白质。 TILLING还允许选择携带此类突变变体的植物。这些突变变体可以展示在强度或在位置或 在时间方面改良的表达(例如,如果所述突变影响启动子)。这些突变变体可以展示比其 天然形式基因所表现活性更高的活性。TILLING联合了高密度诱变法与高通量筛选法。一 般在 TILLING 中遵循的步骤是(a)EMS 诱变(Redei GP 和 Koncz C(1992)在 Methods inArabidopsis Research, Koncz C, Chua NH, Schell J, Singapore 编辑,World Scientific Publishing Co,第 16-82 页;Feldmann 等,(1994)在 Meyerowitz EM, Somerville CR 编 辑,Arabidopsis. Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY,第 137-172页;Lightner禾口Caspar T(1998)在J Martinez—Zapater, J Salinas编者,Methods onMolecular Biology 第 82 卷 Humana Press, Totowa, NJ,第 91-104 页);(b)制备和汇 集个体DNA ; (c)PCR扩增目的区域;(d)变性和复性以导致异双链体形成;(e)DHPLC,其中 汇集物中异双链体的存在被检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)将突 变PCR产物测序。同源重组同源重组允许在基因组中限定的所选位置处导入所选核酸序列。同源重组是在生 物科学中例行用于低等生物如酵母或小立碗藓属(Physcomitrella)苔藓的标准技术。已 经对模式植物(Offringa等人(1990) EMB0 J 9(10) 3077-84)和作物植物例如稻(Terada 等人(2002)NatBiotech 20(10) 1030-4 ;Iida 和 Terada(2004)Curr Opin Biotech 15(2) 132-8)描述了用于植物中进行同源重组的方法,并且存在与靶生物无关而通常适 用的方法(Miller 等人,Nature Biotechnol. 25,778-785,2007)。产量术语“产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并且与时 间间隔有关。单个植物部分基于它们的数目、大小和/或重量而直接有助于对产量,或实际 产量是某种作物和一年的每平方米产量,这通过总产量(包括收获的和评估的产量)除以 种植的平方米数而确定。术语植物的“产量”可以涉及该植物的营养生物量(根和/或苗 生物量)、涉及繁殖器官和/或涉及繁殖体(如种子)。早期生长势“早期生长势”指活跃、健康、充分平衡的生长,尤其是植物生长早期期间,并且可 以因提高的植物适应性所致,其中所述提高的植物适的原因是例如该植物更好地适应环境 (即优化能量资源的用途和在苗与根之间的分配)。具有早期生长势的植物也显示提高的 籽苗存活和更佳的作物建立,这往往产生高度均一的田块(作物以均一方式生长,即大多 数植物在基本上相同的时间达到各个发育期)和往往更好及更高的产量。因而,早期生长 势可以通过测量多种因素如千粒核重(Thousand Kernel Weight)、萌发百分数、出苗百分 数、籽苗生长、籽苗高度、根长度、根和苗生物量和许多其他因素等确定。提高/改善/增强术语“提高”、“改善”或“增强”是相互可交换的并且在应用含义上应当意指与如 本文中定义的对照植物相比较,至少5%、6%、7%、8%、9%或10%、优选至少15%或20%、 更优选地25 %、30 %、35 %或40 %更多的产量和/或生长。种子产量提高的种子产量自身可以表现为以下一个或多个指标a)种子生物量(种子总重 量)增加,这可以基于单粒种子基础和/或每株植物和/或每公顷或每英亩;b)提高的每 穗和/或每株植物花数目;c)提高的(充实)种子数;d)提高的种子充实率(其表述为充 实种子数与种子总数之间的比率);e)提高的收获指数,其表述为可收获部分(如种子)产 量与总生物量的比率;f)提高的初生穗数;(g)提高的千粒核重(TKW),这从计数的充实种子数及它们的总重量外推出来。提高的TKW可以因增加的种子尺寸和/或种子重量引起, 并且也可以因胚尺寸和/或胚乳尺寸增加引起。种子产量的提高也可以表现为种子尺寸和/或种子体积的增加。此外,产量提高 也可以本身表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的提高。提高 的种子产量也可以产生改良的构造,或可以因改良的构造而出现。绿度指数从植物的数字图像计算如本文中所用的“绿度指数”。对属于图像上植物目标的每 个像素计算绿色值与红色值的比率(在编码颜色的RGB模式中)。绿度指数表述为绿色/ 红色比超过给定阈值的像素百分数。在正常生长条件下,在盐胁迫生长条件下和在养分可 利用性降低的生长条件下,植物的绿度指数在开花前的最后成像中测量。相反,在干旱胁迫 生长条件下,植物的绿度指数在干旱后的首次成像中测量。植物本文中所用的术语“植物”包括完整植物、植物的祖先及子代和包括种子、苗、茎、 叶、根(包括块茎)、花和组织、器官在内的植物部分,其中每种前述对象包含目的基因/核 酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢 子体、花粉和小孢子,同样其中每种前述对象包含目的基因/核酸序列。在本发明方法中特别有用的植物包括属于植物界(Viridiplantae)超家族、尤其 单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植物、粮食作物、树或灌 木,其中所述植物选自包含以下物种的名单槭树属某些物种(Acer spp.)、猕猴桃属某些 物种(Actinidia spp.)、秋葵属某些物种(Abelmoschus spp.)、剑麻(Agave sisalana)、 冰草属某些物种(Agropyron spp.)、匍匐剪股颖(Agrostis stolonifera)、葱属某些物 种(Alliumspp.)、苋属某些物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、 凤梨(Ananas comosus)、番荡枝属某些物禾中(Annona spp.)、旱序(Apiumgraveolens)、 蜘蛛兰属某些物种(Arachis spp.)、木波罗属某些物种(Artocarpus spp.)、石刁柏 (Asparagus officinalis)、燕麦属物种(Avenaspp.)(例如燕麦(Avena sativa)、野燕麦 (Avena fatua)、比赞燕麦(Avenabyzantina)、里予燕麦原变禾中(Avena fatua var. sativa) > 杂种燕麦(Avenahybrida)、阳桃(Averrhoa carambola)、箣竹属物种(Bambusa sp.)、冬 /R (Benincasa hispida) > EL Hf 胃(Bertholletia excelsea)、舌甘胃(Beta vulgaris) > 芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp. ) 禾中[胃、(oilseed rape)(turniprape) ]) > Cadaba farinosa> ^ (Camellia sinensis)、(Canna indica) > (Cannabis sativa) > 辣椒属某些物种(Capsicum spp. )、Carex elata、番木瓜(Carica papaya)、大果假虎刺 (Carissa macrocarpa)、lllt^H^M^^^IJft (Carya spp. )、ll^E (Carthamus tinctorius)、 栗属某些物种(Castanea spp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属某些物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属某些物 种(Citrus spp.)、椰子属某些物种(Cocos spp.)、咖啡属某些物种(Coffea spp.)、芋头 (Colocasiaesculenta)、非洲梧桐属某些物种(Cola spp.)、黄麻属物种(Corchorus sp.)、 芫荽(Coriandrum sativum)、榛属某些物种(Corylus spp.)、山楂属某些物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属某些物种(Cucurbita spp.)、香瓜属某些物
32种(Cucumis spp.)、菜蓟属某些物种(Cynara spp.)、胡萝卜(Daucus carota)、山马幢 属某些物种(Desmodium spp.)、龙眼(Dimocarpuslongan)、薯蓣属某些物种(Dioscorea spp.)、柿树属某些物种(Diospyros spp.)、稗属某些物种(Echinochloa spp.)、油棕属 (Elaeis)(例如油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、糝子(Eleusine coracana)、!i 茅属物禾中(Erianthus sp.)、ft匕把(Eriobotrya japonica)、按属物禾中 (Eucalyptus sp.)、红^子果(Eugenia uniflora)、#麦属某些物禾中(Fagopyrum spp.)、水青 R属某些物禾中(Fagus spp.)、苹状羊茅(Festuca arundinacea)、无花果(Ficus carica)、 金桔属某些物种种(Fortunella spp.)、草莓属某些物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属(Glycine spp.)(例如大豆(Glycine max)、大豆(Sojahispida)或大 豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属(Helianthus spp.)(例如向日 葵(Helianthus annuus))、长管萱草(Hemerocallisfulva)、木槿属某些物种(Hibiscus spp.)、大麦属(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、 核桃属某些物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属某些物种(Lathyrus spp.)、兵豆(Lensculinaris)、亚麻(Linum usitatissimum)、荡枝(Litchi chinensis)、 百脉根属某些物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属某些物 禾中(Lupinus spp. )、Luzula sylvatica、番爺属物禾中(Lycopersicon spp.)(例如番爺 (Lycopersicon esculentum、Lycopersicon lycopersicum> Lycopersiconpyriforme))、硬 皮豆属某些物种(Macrotyloma spp.)、苹果属物种(Malusspp.)、凹缘金虎尾(Malpighia emarginata) > 41 ^ ^ (Mammea americana) > ^r^ (Mangifera indica) > tKWMS ^^ (Manihot spp. )(Manilkarazapota)(Medicago sativa)、m MI@ 禾中
(Melilotus spp.)、薄荷属某些物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属某 些物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属某些物种(Musa spp.)、烟草属某 些物种(Nicotiana spp.)、木犀榄属某些物种(Olea spp.)、仙人掌属某些物种(Opuntia spp.)、鸟足豆属某些物种(Ornithopus spp.)、稻属(Oryzaspp.)(例如稻、阔叶稻(Oryza latifolia)) (Panicum miliaceum)(Panicum virgatum)(Passiflora
edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属某些物种 (Persea spp.(Petroselinum crispum)、|H (Phalaris arundinacea)
些物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属某些物种(Phoenix spp.)、 南方芦苇(Phragmites australis)、酸浆属某些物种(Physalis spp.)、松属某些物种 (Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属某些物种(Pi sum spp.)、早熟禾属某些 物种(Poa spp.)、杨属某些物种(Populus spp.)、牧豆草属某些物种(Prosopis spp.)、李 属某些物种(Prunus spp.)、番石榴属某些物种(Psidium spp.)、石榴(Punica granatum)、 西洋梨(Pyrus communis)、f乐属某些物禾中(Quercus spp.)、萝卜(Raphanus sativus)、波P十 大黄(Rheumrhabarbarum)、茶薦子属某些物禾中(Ribes spp.)、蓖麻(Ricinus communis) > 悬钩子属某些物种(Rubus spp.)、甘蔗属某些物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属某些物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属某些物种 (Sesamum spp.)、白芥属物种(Sinapis sp)、茄属(Solanumspp.)(例如马铃薯(Solanum tuberosum)、红爺(Solanum integrifolium)或番爺)、两色蜀黍(Sorghum bicolor)、菠 菜属某些物种(Spinacia spp.)、蒲桃属某些物种(Syzygium spp.)、万寿菊属某些物种(Tagetes spp. )(Tamarindus indica) > bTbTW (Theobroma cacao)
禾中(Trifolium spp.)、小黑麦属物禾中(Triticale sp.)、Triticosecale rimpaui、小麦属 (Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticumdurum)、圆柱 小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦 (Triticum sativum)或普通小麦(Triticumvulgare))、小金莲花(Tropaeolum minus)、金 莲花(Tropaeolum majus)、越桔属某些物种(Vaccinium spp.)、野碗豆属某些物种(Vicia spp.)、豇豆属某些物种(Vigna spp.)、香堇(Viola odorata)、葡萄属某些物种(Vitis spp.)、玉米(Zea mays)、Zizania palustris、麥属某些物禾中(Ziziphus spp.)及其他。发明详述出人意料地,现在已经发现增加植物中编码GRF多肽的核酸序列的表达产生了 相对于对照植物具有提高的产量相关性状的植物。根据第一实施方案,本发明提供了用于 相对于对照植物而言提高植物中产量相关性状的方法,包括增加植物中编码GRF多肽的核 酸序列的表达。用于增加编码GRF多肽的核酸序列表达的优选方法是在植物中导入并表达编码 GRF多肽的核酸序列。下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文 中定义的GRF多肽。下文任何对“本发明方法中有用的核酸序列”的谈及意指能够编码这 种GRF多肽的核酸序列。待导入植物(并且因而在实施本发明方法中有用)的核酸序列是 编码现在将描述的多肽类型的任意核酸序列,下文也称作“GRF核酸序列”或“GRF基因”。如本文中定义的“GRF多肽”指这样的任意多肽,其包含(i)与如SEQID N0 115 所代表的 QLQ 结构域具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%, 98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO :116所代表的WRC 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更 多氨基酸序列同一性的结构域。备选地或额外地,如本文中定义的“GRF多肽”指这样的任意多肽,其包含(i)具 有 InterPro 登录号 IPR014978 (PFAM 登录号 PF08880)的 QLQ 结构域;(ii)具有 InterPro 登录号IPR014977 (PFAM登录号PF08879)的WRC结构域;禾P (iii)包含在保守间隔 (CX9CX10CX2H)中的3个Cys和一个His残基的转录效应子(ET)结构域。备选地或额外地,如本文中定义的“GRF多肽”指这样的任意多肽,其以增加的优选 顺序与如SEQ ID NO :2所代表的GRF多肽或与本文表A中给出的任意全长多肽序列具有至 少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多的氨基酸序 列同一性。备选地或额外地,"GRF多肽”在酵母双杂交相互作用测定法中与GRF相互作用因 子(GIF)多肽(又叫做滑膜肉瘤易位(SYT)多肽)相互作用。出人意料地,现在已经发现调节植物中编码RAA1样多肽的核酸表达产生相对于 对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于 对照植物增强植物中产量相关性状的方法,包括调节植物中编码RAA1样多肽的核酸表达。用于调节(优选提高)编码RAA1样多肽的核酸表达的优选方法是在植物中导入 并表达编码RAA1样多肽的核酸。
下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文 中定义的RAA1样多肽。下文任何对“在本发明方法中有用的核酸”的谈及指能够编码这种 RAA1样多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在 将描述的蛋白质类型的任意核酸,下文也称作“RAA1样核酸”或“RAA1样基因”。如本文中定义的“RAA1样多肽”指由SEQ ID NO :121代表的任意多肽并指其直 向同源物和旁系同源物。RAA1样蛋白是小的(分子量在10与21kDA之间)碱性多肽(pi 高于8. 5),并通常地在使用具有默认设置的标准Needleman-Wunsch比对程序时与SEQ ID N0:121比对的序列中具有0或1个Cys残基。优选地,RAA1样多肽包含两个或多个以下保守序列基序SEQ ID NO 162,基序 1 :GVW(V/L)FSEQ ID NO 163,基序 2 :LGW (E/S)RY(Y/F)SEQ ID NO 164,基序 3 (D/H) L (L/I) S (I/V/L) P (R/K/A) (S/D) FSEQ ID NO : 165,基序 4 (H/Y) (F/M) YD (V/I)VVK (N/T) (R/P)。备选地,RAA1蛋白的同源物以增加的优选顺序与SEQ ID N0:121所代表的氨基 酸具有至少 30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、 43%,44%,45%,46%,47%,48%,49%,50%,51 %,52%,53%,54%,55%,56%,57%, 58%,59%,60%,61 %,62%,63%,64%,65%,66%,67%,68%,69%,70%,71 73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%, 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%整体序列同一性,条 件是该同源蛋白包含如上文概述的保守基序1 (a、b、c或d)、2和3及亮氨酸丰富结构域。 使用总体比对算法如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman ffunsch 算法,优选地采用默认参数,确定整体序列同一性。优选地,该多肽序列在构建进化系统树(如图8中所绘制的一个进化系统树(Ge 等人,2004))中使用时,与包含如SEQ ID NO 121所代表的氨基酸序列的RAA1样多肽组聚 类,而不与任何其他组聚类。出人意料地,现在已经发现调节植物中编码SYR多肽的核酸表达产生了在非生 物胁迫条件下生长时相对于对照植物具有增强的产量相关性状的植物。根据第一实施方 案,本发明提供了用于相对于对照植物增强在非胁迫条件下生长的植物中产量相关性状的 方法,包括调节植物中编码SYR多肽的核酸表达。用于调节(优选增加)编码SYR多肽的核酸表达的优选方法是在植物中导入并表 达编码SYR多肽的核酸。下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文 中定义的SYR多肽。下文任何对“在本发明方法中有用的核酸”的谈及意指能够编码这种 SYR多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将 描述的蛋白质类型的任意核酸,下文也称作“SYR核酸”或“SYR基因”。如本文中定义的术语“SYR蛋白质或其同源物”指约65个至约200个氨基酸的多 肽,其包含(i)在该蛋白质羧基半端中类似于亮氨酸拉链的亮氨酸丰富结构域,所述亮氨 酸丰富结构域(ii)前有具备序列YFS (保守基序5a,SEQ ID NO 173)或YFT(保守基序5b, SEQ ID NO 174)或 YFG(保守基序 5c,SEQ ID NO : 175)或 YLG(保守基序 5d,SEQ ID NO:
35176)的三肽,并且(iii)后接保守基序 6((V/A/I)LAFMP(T/S),SEQ ID N0:177)。优选地, 保守基序6是(A/V)LAFMP(T/S),最优选地,该保守基序是VLAFMPT。“SYR蛋白质或其同源 物”优选地也具有以保守基序7(SYL或PYL,SEQID NO 178)结尾的保守羧基端肽。SYR蛋 白或其同源物的亮氨酸丰富结构域长约38至48个氨基酸,其紧邻保守基序5之后开始并 紧邻保守基序6之前结束,并且包含至少30%的亮氨酸。该亮氨酸丰富结构域优选地具有 类似于亮氨酸拉链基序(L-X6-L-X6-L-X6-L,其中&是6个连续氨基酸的序列)的基序。SYR 蛋白的优选例子由SEQ ID NO :169代表,在

图11中给出其结构域的概览。进一步优选地,SYR蛋白具有两个跨膜结构域,该蛋白质的氨基端部分和羧基端部 分位于内部,而所述部分之间的跨膜结构域位于外部。备选地,SYR蛋白的同源物以增加的优选顺序与SEQ ID N0:169所代表的氨基 酸具有至少 27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、 40%,41 %,42%,43%,44%,45%,46%,47%,48%,49%,50%,51 %,52%,53%,54%, 55%,56%,57%,58%,59%,60%,61 %,62%,63%,64%,65%,66%,67%,68%,69%, 70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%, 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或 99% 整体序列同一性,条件是该同源蛋白包含如上文概述的保守基序5 (a、b、c或d)、6和7及 亮氨酸丰富结构域。使用总体比对算法如程序GAP(GCGWisconsin Package, Accelrys)中 的Needleman ffunsch算法,优选地采用默认参数,确定整体序列同一性。与整体序列同一 性相比较,仅考虑保守的结构域或基序时,该序列同一性通常会更高。出人意料地,现在已经发现调节植物中编码ARKL多肽的核酸表达产生了相对于 对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于 对照植物增强植物中产量相关性状的方法,包括调节植物中编码ARKL多肽的核酸表达。用于调节(优选提高)编码ARKL多肽的核酸表达的优选方法是在植物中导入并 表达编码ARKL多肽的核酸。下文对任何“在本发明方法中有用的蛋白质”的谈及意指如本文中定义的ARKL多 肽。下文对任何“在本发明方法中有用的核酸”的谈及意指能够编码这种ARKL多肽的核酸。 待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将描述的蛋白质类型 的任意核酸,下文也称作“ARKL核酸”或“ARKL基因”。如本文中定义的“ARKL多肽”指包含锌指RING型保守结构域和任选地包含DAR1 结构域的任意多肽。ARKL多肽中发现的RING型锌指包含规范的C3H2C3锌指结构域型。它 可以进一步划分成如Stone等人2005年定义的组I内部的RING-H2型。已经报道了代表RING-H2结构域的共有序列,为如CX (2) CX (9-39) CX (1-3) HX(2-3)HX(2)CX(4-48)CX(2)C(SEQ ID NO :400)所代表那样。ARKL 多肽中可变环的长度 一般在金属配体2和3之间是14-15个氨基酸并且在金属配体6和7之间是10个氨基酸 (图1)。除涉及Zn2+离子直接配位的那些氨基酸残基之外的特定氨基酸残基是在ARKL多 肽的RING-H2结构域中高度保守的(图1)。SEQ ID NO 401代表大多数ARKL多肽之间保 守的共有序列。在本发明方法中有用的优选ARKL多肽指包含ZfC3H2C3锌指RING结构域的多肽, 这种结构域如SEQ ID NO :400或以增加的优选顺序与如SEQ ID NO 306至SEQ ID NO. 351所代表的一个或多个ZfC3H2C3结构域具有至少50 %、55 %、60 %、65 %、70 %、75 %、80 %、 85%、90%、95%或更多序列同一性的多肽代表。进一步优选地,本发明的ARKL多肽包含如 SEQ ID NO 401所代表的ZfC3H2C3结构域。ARKL多肽一般包含名为DAR1 (与RING相关的结构域)的额外结构域,其中先前 已描述了所述结构域出现在少数植物源RING蛋白的RING结构域外部(Stone等人,2005)。 DAR1结构域一般发现位于RING结构域的氨基端。通常,DAR1结构域包含如SEQ ID NO 399 (基序8)所代表的保守氨基酸标签。在本发明方法中有用的进一步优选ARKL多肽指这样的多肽,其以增加的优选顺 序与如SEQ ID N0:352至SEQ ID NO. 398所代表的一个或多个DAR1结构域具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%或更多序列同一性的 DAR1 结构域。仍 更优选地,本发明的ARKL多肽包含如SEQ ID NO 399所代表的基序8。锌指RING型和DAR1结构域可以在专门研究蛋白家族、结构域和功能位点的蛋白 数据库如 Pfam(Finn 等人 Nucleic Acids Research (2006)数据库第 34 卷D247-D251) 或集成蛋白特征序列数据库PR0SITE、PRINTS、ProDom、Pfam、SMART、TIGRFAMs、PIRSF、 SUPERFAMILY、Gene3D 和 PANTHER 的 InterPro (Mulder 等人 2007Nucleic AcidsResearch, 2007,数据库第34卷D224-D228)中找到。Pfam编纂了覆盖许多常见蛋白质结构域和家 族的多重序列比对结果和隐匿马尔科夫模型(HMM)的庞大集合并且通过英国Sanger研究 所可获得。如Pfam数据库中所认为的受信任匹配是评分高于收集临界阈值的那些序列。 RING-H2结构域(Pfam登录号PF00097)的收集临界阈值在Pfam HMM_fs方法中是16. 0并 且在Pfam HMM_ls方法中是15. 2。然而,包含真实RING-H2结构域的潜在匹配依旧可以低 于该收集临界值。优选地,在本发明方法中有用的ARKL多肽是在它们的序列中具有一个或 多个下述结构域的蛋白质,其中所述结构域超出Pfam蛋白质结构域家族PF000097的收集 临界值,又称作锌指C3HC4型(RING指)家族结构域。备选地,可以通过用包含锌指RING型和/或DAR1结构域的已知多肽开展序列比 较并在所述结构域的区域内建立相似性而鉴定多肽中的锌指RING型和DAR1结构域。可以 使用本领域熟知的任意方法如Blast算法比对所述序列。取得与给定序列出现比对结果的 概率作为用于鉴定相似多肽的基础。一般用来代表这种概率的参数称作e-值。所述e_值 是S评分可靠性的一个量度。S评分是查询项与所示序列的相似性的一个度量。e_值描述 给定S评分预期以多大频率随机发生。临界e_值可以高至1.0。来自使用ARKL多肽作为 查询序列的BLAST搜索输出结果的受信任e-值的常见阈值低于e_5( = 10_5)、1. e_1(l、l. e_15、 1 e-20 1 e-25 1 e-50 1 e_75 1 e-100 1 e-200 1 e-300 1 e-400 1 e-500 1 e-600 1 e-7CI0 禾口 1 e-800 优
丄、丄、丄、丄、丄、丄、丄、丄、丄、丄、丄丄o I/Li
选地,在本发明方法中有用的ARKL多肽包含这样的序列,该序列以增加的优选顺序在比对 结果中与如已知ARKL多肽例如SEQ ID NO 213中发现的锌指RING型DAR1 结构域具有低于 e_5 ( = 10_5)、1. e_10、1. e_15、1. e_20、1. e_25、1. e_50、1. e_75、 1 e,0 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾卩 1 e,0 的 e_ 倌
丄、丄、丄、丄、丄、丄、丄-‘! H ± C;|_| J C; | R. o表A中给出在本发明方法中有用的ARKL多肽的例子。分别在SEQ IDN0 :306至 SEQ ID NO 351和SEQ ID NO 352至SEQ ID NO 398中给出包含如表A的代表性ARKL多 肽中存在的RING-H2和DAR1结构域的序列。在实施例4中给出如在选择表A的ARKL多肽 中存在的RING-H2和DAR1结构域位置的氨基酸坐标。
在本发明方法中有用的进一步优选ARKL多肽是以增加的优选顺序与表A中给出 的任意多肽具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,98% 或更多序列同一性的那些ARKL多肽。出人意料地,现在已经发现调节植物中编码YTP多肽的核酸表达产生了相对于 对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了用于相对于 对照植物增强植物中产量相关性状的方法,包括调节植物中编码YTP多肽的核酸表达。用于调节(优选增加)编码YTP多肽的核酸表达的优选方法是在植物中导入并表 达编码YTP多肽的核酸。下文任何对“本发明方法中有用的蛋白质”的谈及在一个实施方案中意指如本文 中定义的YTP多肽。下文对任何“在本发明方法中有用的核酸”的谈及意指能够编码这种 YTP多肽的核酸。待导入植物(并且因而在实施本发明方法中有用)的核酸是编码现在将 描述的蛋白质类型的任意核酸,下文也称作“YTP核酸”或“YTP基因”。如本文中定义的“YTP多肽”指包含至少一个跨膜结构域和DUF221结构域的至少 50个连续氨基酸部分的多肽。额外地,YTP多肽可以包含如SEQ ID NO :546所代表的基序9。跨膜蛋白具有两亲性结构,该两亲性结构具备横穿膜的疏水性区段和可能位于膜 两侧任意一侧的亲水环(见图20)。环是位于两个TM结构域之间的蛋白质区段(区域)。 位于膜内侧的平均大小的环一般比位于膜外侧的那些环带更多负电荷。跨膜结构域形成一般12-35个氨基酸残基的二级结构(通常是a或0螺旋)。 跨膜结构域之间的环一般短于60个氨基酸残基,尽管也可以存在长的球形区域。YTP多肽 中跨膜结构域的数目是可变的,不过一般在2和20之间。YTP多肽中发现的跨膜结构域优选地具有8个和50个之间的氨基酸,最优选地具 有 8、12、14、16、18、20、22、24、26、28、30、32、34、35 或 36 个氨基酸。YTP 多肽中发现的环优 选地具有超过 20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100 个氨基酸残基。在本发明方法中有用的优选YTP多肽以增加的优选顺序包含多于1、2、4、5、6、8、
10、12个跨膜结构域。跨膜结构域是富含非极性氨基酸的高度疏水性蛋白质。表3显示根据侧链特性 的氨基酸分类。标出了疏水性氨基酸。肽的疏水性特性可以由本领域熟知(如Kyte和 Doolittle (1982) J.Mol. Biol.,157 105-132 所报道)的方法确定。在本发明方法中有用的YTP多肽优选地包含具有至少20 %、30 %、40 %、50 %、 60%或更多非极性氨基酸的跨膜结构域。表3给出20种必需氨基酸的极性。表3 根据侧链特性的氨基酸分类。
蛋白质中的跨膜结构域可以使用本领域熟知的许多技术如X射线晶体学、NMR、基 因融合技术、替代的半胱氨酸可及性方法、Asp (N)连接的糖基化实验鉴定。额外地或备选 地,可以使用计算机算法来预测跨膜结构域。此类结构域的例子已经被描述并且可在提供 生物信息服务的机构获得( M611er等人2001.BiOinfOrmatiCS 17,646) 0在本文的实施
例部分中显示了使用这样一种算法来预测YTP多肽中跨膜结构域。
DUF221结构域指某些真核来源蛋白质中发现的一种保守氨基酸序列。DUF221结 构域通常具有350至550个残基长度。源自拟南芥和稻的YTP多肽中所包含的DUF221结 构域的例子由SEQ ID N0:518至SEQ IDN0 :543代表。在SEQ ID NO :544中给出代表序列 SEQ ID NO 518 至 SEQ ID NO 543 的共有序列。本发明的优选YTP多肽包含DUF221结构域的至少50个连续氨基酸,其中所述的 DUF221结构域以增加的优选顺序与SEQ ID NO 518至SEQID NO :544所代表的任一结构域 具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99% 或100%序列同一性。使用本领域熟知的算法如Blast优选地在局部比对中建立序列相似 性。可以通过在含有保守蛋白质结构域的专业化数据库如Pfam(Firm等人Nucleic Acids Research(2006)数据库第34期D247-D251)中搜索轻易地鉴定YTP多肽。本领 域熟知在搜索此类数据库中有用的工具,例如允许同时搜索几个蛋白质结构域数据库的 INTERPR0(欧洲生物信息研究所,UK)。DUF221结构域可以通过与包含DUF221结构域的已知多肽进行序列比较并在 DUF221结构域区范围内建立相似性百分数加以鉴定。可以使用本领域熟知的任意方法如 Blast算法(用于局部比对)或BestFit算法(用于总体比对)比对所述序列。取得与给 定序列的比对结果的概率作为鉴定相似多肽的基础。一般用来代表这种概率的参数称作 e_值。e_值是评分“S”的可靠性的一种量度。“S”是所比对的两个序列之间相似性的一 种度量。e-值描述给定“S”评分预期以多大频率随机发生。临界e_值可以高至1.0。与 查询序列显示显著序列同一性并由BLAST搜索产生的受信任(真实)命中的常见阈值低于 1. e_5,在某种情况下采用甚至更低的阈值,例如1. e,,或甚至更低。优选地,在本发明方法中有用的YTP多肽包含DUF221结构域的至少50个连续 氨基酸,其中所述的DUF221结构域在局部比对结果中以增加的优选顺序与一种已知多肽 (如表A的任一多肽)中存在的DUF221结构域具有低于1. e_5、l. e_1(l、l. e_15、l. e_2°、l. e_25、
1 e-50 1 e-75 1 e-100 1 e-200 1 e-300 1 e-400 1 e-500 1 e,0 1 e-700 禾口 1 e,0 的 e_ 倌应当理解编码本发明YTP多肽的核酸不限于天然来源的序列。该核酸可以编码 “从头”设计的YTP多肽。备选地或额外地,YTP蛋白以增加的优选顺序与SEQ ID NO :409所代表的氨基 酸具有至少 25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、 38%,39%A0%A1%A2%A3%A4:%A5%A6%A7%A8%A9%,50%,51%,52%, 53%,54%,55%,56%,57%,58%,59%,60%,61 %,62%,63%,64%,65%,66%,67%, 68%,69%,70%,71 %,72%,73%,74%,75%,76%,77%,78%,79%,80%,81 83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%, 98 %或99 %整体序列同一性。使用总体比对算法如程序GAP (GCG Wisconsin Package, Accelrys)中的 Needleman ffunsch算法,优选地采用默认参数,确定整体序列同一性。与整体序列同一性相 比较,仅考虑保守的结构域或基序时,该序列同一性通常会更高。优选地,YTP多肽序列在构建进化系统树(如图21中所绘制的一个进化系统树) 中使用时,与包含如SEQ ID NO 409所代表的氨基酸序列的组1聚类,而不与组2中的YTP多肽聚类。术语“结构域”和“基序”在本文的“定义”部分中定义。存在用于鉴定结 构域的专业数据库,例如,SMART (Schultz 等人(1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864 ;Letunic 等人(2002)Nucleic Acids Res 30,242-244)、 InterPro(Mulder 等人,(2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher ^P Bairoch (1994),用于 生物分子序列基序的概括特征结构及其在自动化序列解读中的功能(A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation).(在)ISMB-94 ;第二届分子生物学智能系统国际会议文 集.Altman R. , Brut lag D. ,Karp P. , Lathrop R. , Sear Is D.编辑,第 53-61 页,AMIPress, Menlo Park ;Hulo 等人,Nucl. Acids. Res. 32 :D134-D137, (2004))或 Pfam(Bateman 等人, Nucleic Acids Research 30(1) =276-280 (2002)) 一组用于计算机方式分析蛋白质序列 的工具可在ExPASY蛋白质组服务器(瑞士生物信息研究所(Gasteiger等人,ExPASy 用于 深入认识和分析蛋白质的蛋白质组服务器(The proteomics server for in_d印thprotein knowledge and analysis), Nucleic Acids Res. 31 :3784_3788 (2003))上获得。以下在本文实施例2和4中呈现对SEQ ID NO 2的多肽序列的分析。例如,如 SEQ ID NO :2所代表的GRF多肽包含InterPro结构域数据库中具有InterPro登录号 IPR014978 (PFAM 登录号 PF08880)的 QLQ 结构域和具有 InterPro 登录号 IPR014977 (PFAM 登录号PF08879)的WRC结构域。也可以使用常规技术如通过序列比对法鉴定结构域。在 图2中显示本文表A的多肽的QLQ结构域的比对结果,并且在图3中显示本文表A的多肽 的WRC结构域的比对结果。此类比对结果用于鉴定GRF多肽之间最保守的氨基酸,如QLQ 和WRC氨基酸残基。用于比对序列以做比较的方法是本领域熟知的,此类方法包括GAP、BESTFIT、 BLAST、FASTA 禾口 TFASTA。GAP 使用 Needleman 和 Wunsch 算法((1970) J Mol Biol 48 443-453)以找到使匹配数最大化并使空位数最小化的两个序列的总体(即覆盖完整序列 的)比对结果。BLAST算法(Altschul等人,(1990) J Mol Biol 215:403-10)计算序列同 一性百分数并开展两个序列之间相似性的统计分析。用于开展BLAST分析的软件是通过国 家生物技术信息中心(NCBI)可公开获得的。同源物可以使用例如ClustalW多重序列比对 算法(1.83版本),以默认配对比对参数和百分数评分方法轻易地鉴定。相似性和同一性 的总体百分数也可以使用MatGAT软件包中的可用方法之一确定(Campanella等,(2003) BMC Bioinformatics, 10 29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的一禾中用(an application that generates similarity/identity matrices using proteinor DNA sequences))。如本领域技术人员会显而易见,可以进行少许手工编辑以优 化保守基序之间的比对。此外,作为使用全长序列鉴定同源物的替代,也可以使用特定的结 构域。利用上文提及的程序,使用默认参数,可以在完整核酸序列或多肽序列范围或所选的 结构域保守基序范围内确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF, Waterman MS (1981) J. Mol. Biol 147(1) ;195-7)。在QLQ结构域外部和在WRC结构域外部,GRF多肽据称具有低的氨基酸序列同一 性。本文的实施例3在表B中描述如SEQ ID NO 2所代表的GRF多肽与表A中所列出GRF多肽之间的同一性百分数,所述同一性百分数可以如15%氨基酸序列同一性那样低。如果 在SEQ ID NO 2的QLQ结构域(如由SEQ ID NO 2中包含的SEQ ID NO 115所代表;图2 中代表的表A的GRF多肽的QLQ结构域)与在实施本发明中有用的多肽的QLQ结构域之间 开展同一性计算,可能相当大程度地提高同一性百分数。类似地,如果在SEQ ID N0:2的 WRC结构域(如由SEQ ID NO :2中包含的SEQ ID NO 116所代表;图3中代表的表A的GRF 多肽的WRC结构域)与在实施本发明中有用的多肽的WRC结构域之间开展同一性计算,可 能相当大程度地提高同一性百分数。在实施本发明中有用的多肽序列之间的QLQ结构域范 围内的同一性百分数范围是在25%和99%氨基酸同一性之间,并且在实施本发明中有用 的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60%和99%氨基酸同一性 之间。如也可以在图3中观察到,WRC结构域在不同GRF多肽之间比QLQ结构域更保守,如 图2中所示。蛋白质亚细胞定位预测的任务是重要的并且得到充分研究。知晓蛋白质的定位 有助于阐明其功能。用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白 (GFP)或葡糖醛酸酶(⑶S)对蛋白质加标签。虽然此类方法与计算性方法相比繁琐费 累,然而它准确。最近在从序列数据计算性预测蛋白质定位方面取得长足进展。在瑞士生 物信息研究所维护的ExPASy蛋白质组工具上可获得本领域技术人员熟知算法当中的例如 PSort、TargetP>ChloroP、LocTree、Predotar>LipoP、MIT0PR0T、PATS、PTSUSignalP 等。另外,在本发明方法中有用的GRF多肽(至少以它们的天然形式)一般,但并非必 需具有转录调节活性和与其他蛋白质相互作用的能力。因此,转录调节活性降低、无转录调 节活性、蛋白质_蛋白质相互作用能力降低或无蛋白质-蛋白质相互作用能力的GRF多肽 可以同等地用于本发明的方法中。可以使用本领域熟知的技术(例如在Current Protocols in MolecularBiology,第 1 和 2 卷,Ausubel 等人(1994),Current Protocols 中)轻易地 在体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。GRF多肽能够在酵母细胞中 转录地激活报道基因(Kim和 Kende(2004)Proc Natl AcadSci 101(36) 13374-13379)。使 用酵母双杂交蛋白质_蛋白质相互作用测定法,GRF多肽也能够在酵母细胞中与GRF相互 作用因子多肽(GIF1至GIF3 ;又叫做滑膜肉瘤易位(SYT)多肽,SYT1至SYT3)在体内相互 作用(上文的Kim和Kende)。也使用体外结合测定法来显示GRF多肽和GIF (也称作SYT) 多肽是相互作用的配偶物(上文的Kim和Kende)。本发明在一个实施方案中通过用SEQ ID NO 1所代表的核酸序列转化植物进行说 明,其中所述核酸序列编码SEQ ID NO :2的GRF多肽序列。然而,本发明的实施不限于这些 序列;本发明的方法可以有利地使用编码如本文中所定义GRF多肽的任意核酸序列实施。本发明在一个实施方案中通过用SEQ ID NO 120所代表的核酸序列转化植物进行 说明,其中所述核酸序列编码SEQ ID NO :121的多肽序列。然而,本发明的实施不限于这些 序列;本发明的方法可以有利地使用编码RAA1样的任意核酸或如本文中定义的RAA1样多 肽实施。另外,RAA1样多肽当根据如实施例中所概述的本发明方法在稻中表达时,产生这 样的植物,其具有提高的产量相关性状,尤其提高的根苗指数、提高的每穗花数和提高的千 粒核重。跨膜结构域长约15至30个氨基酸并且通常由形成a螺旋的疏水性残基组成。各跨膜结构域通常基于疏水性预测(例如Klein等人,Biochim.Biophys.Acta 815, 468,1985 ;或 Sonnhammer 等人,在编者 J. Glasgow, T. Little john, F. Major, R. Lathrop, D. Sankoff和C. Sensen《第六届分子生物学智能系统国际会议文集》(Proceedings of the Sixth InternationalConference on Intelligent Systems for Molecular Biology),第 175-182 页,Menlo Park, CA, 1998. AAAI Press.)。属于定义“SYR多肽或其同源物”的蛋白质的例子在实施例部分的表A中给出并 包括来自多种单子叶植物如稻(SEQ ID N0:169、SEQ ID N0:179和SEQ ID N0:180)、谷物 (SEQ ID N0:181)、小麦(SEQ ID N0:182)、大麦(SEQ ID N0:183)、甘蔗(SEQ ID NO 184 和SEQ ID N0:185)、高粱(SEQ ID NO 186);和来自双子叶植物如拟南芥(SEQ ID NO 187 和 SEQID NO 188)、葡萄(SEQ ID NO 189)、柑橘(SEQ ID NO 190)或番茄(SEQID NO 191 和SEQ ID NO 192)的序列。构思了 Leu丰富结构域对于蛋白质的功能重要,因而带有Leu 丰富结构域、但无保守基序5或6的蛋白质也可以用于本发明的方法中,此类蛋白质的例子 在SEQ ID NO 201和202中给出。应当理解术语“SYR多肽或其同源物”不限于SEQ ID NO :169所代表的序列或不 限于列出作为SEQ ID N0:179至SEQ ID NO :192的同源物,但是应当理解符合包含如上文 所定义亮氨酸丰富结构域这一标准的约65至约200个氨基酸的任意多肽可以适合于本发 明方法中,其中所述的亮氨酸丰富结构域前有保守三肽基序5 (a、b、c或d)并且后接保守基 序6和优选地还后接保守基序7 ;或与SEQ ID NO 169的序列具有至少38%序列同一性。SYR蛋白质或其同源物的活性可以通过在稻中表达G0S2启动子控制下的SYR蛋白 质或同源物进行分析,其中所述的表达产生与相应野生型植物相比,在缺氮条件下或在干 旱胁迫条件下生长时具有提高的生物量和/或种子产量的植物。种子产量的这种提高可以 以几种方式测量,例如测量为总种子重量、充实种子数、充实率、收获指数或千粒核重的提 尚o本发明在一个实施方案中通过用SEQ ID NO: 168所代表的核酸序列转化植物进行 说明,其中所述核酸序列编码SEQ ID NO :169的多肽序列。然而,本发明的实施不限于这些 序列;本发明的方法可以有利地使用编码SYR的任意核酸或如本文中定义的SYR多肽实施。另外,ARKL多肽(至少以它们的天然形式)一般具有E3遍在蛋白-蛋白质连接 酶活性。用于测量E3遍在蛋白-蛋白质连接酶活性的工具和技术是本领域熟知的(美国 专利 6737244 ;W0/2001/075145 ;Miura 等人(2005) Proc Natl Acad Sci U S A. 102(21) 7760-7765 ;Kawasaki 等人(2005) ThePlant Journal 44,258_270。简而言之,ARKL 多肽 的E3遍在蛋白连接酶活性可以通过将ARKL蛋白与E1和E2蛋白和加标签的遍在蛋白孵 育进行分析。可以在SDS-PAGE电泳并使用针对遍在蛋白标签的抗体实施印迹后检测遍在 蛋白化的蛋白质。可以在该测定法中使用的E1和E2蛋白的例子是小麦E1蛋白和拟南芥 AtUBClE2蛋白。以组氨酸加标签的遍在蛋白和检测它的抗体是市售的(Calbiochem,San Diego, CA, USA)。另外,ARKL多肽当根据如实施例中所概述的本发明方法在稻中表达时,产生这样 的植物,其具有提高的产量相关性状,尤其千粒核重、总种子产量、早期生长势和/或收获 指数。本发明在一个实施方案中通过用SEQ ID NO :212所代表的核酸序列转化植物进行说明,其中所述核酸序列编码SEQ ID NO :213的多肽序列。然而,本发明的实施不限于这些 序列;本发明的方法可以有利地使用编码ARKL的任意核酸或如本文中定义的ARKL多肽实施。另外,YTP多肽一般具有种子产量增强活性。用于测量产量增强(或改进)活性 的工具和方法是本领域熟知的。在本文中实施例部分提供了其他细节。另外,YTP多肽当根据如实施例10至15中所概述的本发明方法在稻中表达并按 照表型方式评价时,产生这样的植物,其具有提高的产量相关性状,尤其总种子重量、千粒 核重、每穗花数、种子充实率和收获指数之一项或多项。本发明在一个实施方案中通过用SEQ ID NO :408所代表的核酸序列转化植物进行 说明,其中所述核酸序列编码SEQ ID NO :409的多肽序列。然而,本发明的实施不限于这些 序列;本发明的方法可以有利地使用编码YTP的任意核酸或如本文中定义的YTP多肽实施。编码本发明多肽的核酸序列的例子在本文实施例1的表A中给出,特别是编码分 别选自以下多肽的核酸序列在表A1中给出的GRF多肽、在表A2中给出的RAA1样多肽、在 表A3中给出的SYR多肽、在表A4中给出的ARKL多肽和在表A5中给出的YTP多肽。此类核酸序列在实施本发明的方法中有用。在实施例1的表A中给出的多肽序 列是选自以下多肽的直向同源物和旁系同源物的示例序列,所述多肽分别由SEQ ID N0:2、 121、169、213或409所代表的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽代 表,术语“直向同源物”和“旁系同源物”如本文中定义。其他直向同源物和旁系同源物可 以通过开展所谓交互性blast搜索轻易地鉴定。通常,这包括第一 BLAST,其中所述的第一 BLAST包括将查询序列(例如使用实施例1的表A中列出的任意序列)针对任意序列数据 库,如可公开获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,一般使用BLASTN或 TBLASTX(使用标准默认值),并且当从蛋白质序列开始时,使用BLASTP或TBLASTN(使用标 准默认值)。可以任选地筛选BLAST结果。筛选结果或非筛选结果的全长序列随后针对来 自生物的序列进行反向BLAST搜索(第二 BLAST),其中查询序列从所述的生物中衍生(在 查询序列分别是 SEQ ID NO :1、120、168、212 或 408 或分别是 SEQ ID NO :2、121、169、213 或409的情况下,第二 BLAST因而将针对拟南芥序列进行)。随后比较第一 BLAST和第二 BLAST的结果。如果来自第一 blast的高阶位命中是源自与衍生查询序列的物种相同的物 种,则鉴定到旁系同源物,随后一个反向BLAST理想地在最高命中当中产生该查询序列;若 在第一 BLAST中的高阶位命中不是源自与衍生查询序列的物种相同的物种,则鉴定到直向 同源物,并且在反向BLAST时,优选地产生属于最高命中的该查询序列。在本说明书中使用的术语“表A”将用来说明表Al、A2、A3、A4和/或A5的内容。 在本说明书中使用的术语“表A1”将用来说明表A1的内容。在本说明书中使用的术语“表 A2”将用来说明表A2的内容。在本说明书中使用的术语“表A3”将用来说明表A3的内容。 在本说明书中使用的术语“表A4”将用来说明表A4的内容。在本说明书中使用的术语“表 A5”将用来说明表A5的内容。在一个优选的实施方案中,术语“表A”意指表A1。在一个优选的实施方案中,术 语“表A”意指表A2。在一个优选的实施方案中,术语“表A”意指表A3。在一个优选的实 施方案中,术语“表A”意指表A4。在一个优选的实施方案中,术语“表A”意指表A5。高阶位命中是具有低E-值的那些命中。E-值越低,评分越显著(或换句话说,偶然发现该命中的几率越低)。E-值的计算是本领域熟知的。除了 E-值外,比较结果也由同 一性百分数评价。同一性百分数指两个所比较的核酸(或多肽)序列之间特定长度范围内 相同核苷酸(或氨基酸)的数目。在大型家族的情况下,可以使用ClustalW,随后使用邻接 树法,以帮助观察相关基因的聚类并鉴定直向同源物和旁系同源物。核酸变体也可以用于实施本发明的方法中。此类变体的例子包括编码在实施例1 的表A中所给出多肽序列任一者的同源物和衍生物的核酸序列,术语“同源物”和“衍生物” 如本文中定义。这样的核酸序列也在本发明方法中有用,其编码在实施例1的表A中所给 出任一多肽序列的直向同源物或旁系同源物的同源物和衍生物。在本发明方法中有用的同 源物和衍生物与衍生它们的未修饰蛋白质具有基本上相同的生物学活性和功能活性。在本发明的一个实施方案中,在本发明方法中有用的优选衍生物是在与所述锌离 子之一配位的RING指结构域中配体5的位置处具有半胱氨酸残基(见图15)的ARKL多 肽。在本发明方法中有用的另一种优选衍生物是在锌离子配体位置处具有7个半胱氨酸和 一个组氨酸(ZfC3HC4)作为残基的ARKL多肽。在实施本发明方法中有用的其他核酸变体包括编码分别选自由GRF多肽、RAA1样 多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列的部分、与编码分别选自 由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列杂交 的核酸序列、编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成 的组中多肽的核酸序列的剪接变体、编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL 多肽和YTP多肽组成的组中多肽的核酸序列的等位变体和通过基因改组获得的编码多肽 的核酸序列的变体,其中所述多肽选自分别如本文中所定义GRF多肽、RAA1样多肽、SYR多 肽、ARKL多肽和YTP多肽组成的组。术语“杂交序列”、“剪接变体”、“等位变体”和“基因改 组作用”如本文中所述。编码选自分别如本文中所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和 YTP多肽组成的组中多肽的核酸序列不必须是全长核酸序列,因为本发明方法的实施不取 决于全长核酸序列的使用。根据本发明,提供了用于提高植物中产量相关性状的方法,包括 在植物中导入并表达实施例1的表A中所给出任一核酸序列的一部分或编码实施例1表A 中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的一部分。核酸序列的一部分可以例如通过对所述核酸序列产生一个或多个缺失而制备。所 述部分可以以分离的形式使用或它们可以与其他编码(或非编码)序列融合,例如旨在产 生联合有几种活性的蛋白质。当融合至其他编码序列时,翻译后产生的所得多肽可以比对 该蛋白质部分所预测的多肽更大。在本发明方法中有用的部分在一个实施方案中编码如本文中定义的GRF多肽,并 且基本上具有如实施例1的表A1中所给出多肽序列相同的生物学活性。优选地,此部分 是在实施例1的表A1中给出的任一核酸序列的一部分,或是编码在实施例1的表A1中所 给出任一多肽序列的直向同源物或旁系同源物的核酸序列的一部分。优选地,该部分的长 度以增加的优选顺序是至少 400、450、500、550、600、650、700、750、800、850、900、950、1000、 1050、1100、1150、1190个连续核苷酸,所述连续核苷酸属于实施例1的表A1中给出的任一 核酸序列或属于编码在实施例1的表A1中所给出任一多肽序列的直向同源物或旁系同源 物的核酸序列。优选地,该部分是编码多肽序列的核酸序列的一部分,所述的多肽序列包含(i)与如SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如 SEQ ID NO :116 所代表的 WRC 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、 85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。最优选地,该部分是3£010 N0:1的核酸序列的一部分。在本发明方法中有用的部分在一个实施方案中编码如本文中定义的RAA1样多 肽,并且基本上具有如实施例1的表A2中所给出氨基酸序列相同的生物学活性。优选地,此 部分是在实施例1的表A2中给出的任一核酸的一部分,或是编码在实施例1的表A2中所 给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度 是至少 250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、 1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200 个连续核苷酸,所述连续核 苷酸属于实施例1的表A2中给出的任一核酸序列或属于编码在实施例1的表A2中所给出 任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQID NO 120的 核酸的一部分。优选地,该部分编码下述氨基酸序列的片段,其中所述氨基酸序列在构建进 化系统树(如图8中所绘制的一个进化系统树)中使用时,与包含如SEQ ID NO 121所代 表的氨基酸序列的RAA1样多肽组聚类,而不与任何其他组聚类。在本发明方法中有用的部分在一个实施方案中编码如本文中定义的SYR样多肽, 并且基本上具有如实施例1的表A3中所给出氨基酸序列相同的生物学活性。优选地,此部 分是在实施例1的表A3中给出的任一核酸的一部分,或是编码在实施例1的表A3中所给 出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是 至少150、200、250、300、350、400、450、500、550、600个连续核苷酸,所述连续核苷酸属于实 施例1的表A3中给出的任一核酸序列或属于编码在实施例1的表A3中所给出任一氨基酸 序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID N0:168的核酸的一 部分。优选地,该部分编码约65个至约200个氨基酸的多肽,其包含如上文定义的前有保 守三肽基序5 (a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富结 构域;或与SEQ ID NO 169的序列具有至少38%序列同一性。在本发明方法中有用的部分在一个实施方案中编码如本文中定义的ARKL样多 肽,并且基本上具有如实施例1的表A4中所给出氨基酸序列相同的生物学活性。优选地, 此部分是在实施例1的表A4中给出的任一核酸的一部分,或是编码在实施例1的表A4中 所给出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长 度是至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,所述连续核 苷酸属于实施例1的表A4中给出的任一核酸序列或属于编码在实施例1的表A4中所给出 任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地,该部分是SEQ ID N0:212 的核酸的一部分。优选地,该部分编码下述氨基酸序列的片段,其中所述氨基酸序列在构建 进化系统树(如图17中所绘制的一个进化系统树)中使用时,与包含如SEQ IDN0 213所 代表的氨基酸序列的ARKL多肽组聚类,而不与任何其他组如MuSmu_G0liath序列所代表的 组聚类。在本发明方法中有用的部分在一个实施方案中编码如本文中定义的YTP样多肽, 并且基本上具有如实施例1的表A5中所给出氨基酸序列相同的生物学活性。优选地,此部分是在实施例1的表A5中给出的任一核酸的一部分,或是编码在实施例1的表A5中所给 出任一氨基酸序列的直向同源物或旁系同源物的核酸的一部分。优选地,该部分的长度是 至少 300、400、500、550、600、650、700、750、800、850、900、950、1000、1500、2000、2500、3000 个连续核苷酸,所述连续核苷酸属于实施例1的表A5中给出的任一核酸序列或属于编码在 实施例1的表A5中所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选地, 该部分是SEQID N0:408的核酸的一部分。优选地,该部分编码下述氨基酸序列的片段,其 中所述氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时,与 包含如SEQ ID NO 409所代表的氨基酸序列的组1聚类,而不与组2中的YTP多肽聚类。在本发明方法中有用的另一种核酸序列变体是能够在降低的严格条件下、优选地 在严格条件下与编码多肽的核酸序列或与如本文中定义的部分杂交的核酸序列,其中所述 多肽选自分别如本文中定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成 的组。根据本发明,提供了用于提高植物中产量相关性状的方法,包括在植物中导入并 表达能够与实施例1的表A中给出的任一核酸杂交的核酸序列,或包括在植物中导入并表 达这样的核酸序列,其中所述核酸序列能够与编码在实施例1的表A中给出的任意核酸序 列的直向同源物、旁系同源物或同源物的核酸序列杂交。在本发明方法中有用的杂交序列编码选自分别如本文中定义的GRF多肽、RAA1样 多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中的多肽,并且具有基本上具有如实施例1 的表A中所给出多肽序列相同的生物学活性。优选地,该杂交序列能够与实施例1的表A中 给出的任一核酸序列或与这些序列中任一序列的一部分杂交,所述的一部分如上文定义, 或其中所述杂交序列能够与编码在实施例1的表A中给出的任一多肽序列的直向同源物或 旁系同源物的核酸序列杂交。优选地,在一个实施方案中该杂交序列能够与编码多肽序列的核酸序列杂交,其 中所述的多肽序列包含i)与如SEQ ID NO 115所代表的QLQ结构域具有至少50%、55%、 60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性的结构 域;和(ii)与如SEQ ID NO :116所代表的WRC结构域具有至少50%、55%、60%、65%、 70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。最优选 地,该杂交序列能够与如SEQ ID NO :1所代表的核酸序列或与其一部分杂交。优选地,在一个实施方案中该杂交序列能够与如SEQ ID NO 120所代表的核酸或 与其一部分杂交。优选地,该杂交序列部分编码具有下述氨基酸序列的多肽,其中当所述氨基酸序 列是全长并且在构建进化系统树(如图8中所绘制的一个进化系统树)中使用时,该氨基 酸序列与包含如SEQ ID NO :121所代表的氨基酸序列的RAA1样多肽组聚类,而不与任何其 他组聚类。优选地,在一个实施方案中该杂交序列能够与如SEQ ID NO 168所代表的核酸或 与其一部分杂交。优选地,该杂交序列编码约65个至约200个氨基酸的多肽,其包含如上文定义的 前有保守三肽基序5 (a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸 丰富结构域;或与SEQ ID NO 169的序列具有至少38%序列同一性。
优选地,在一个实施方案中该杂交序列能够与如SEQ ID NO 212所代表的核酸或 与其一部分杂交。优选地,该杂交序列部分编码具有下述氨基酸序列的多肽,其中当所述氨基酸序 列是全长并且在构建进化系统树(如图17中所绘制的一个进化系统树)中使用时,该氨基 酸序列与包含如SEQ ID NO :213所代表的氨基酸序列的ARKL样多肽组聚类,而不与任何其 他组如Musmu_G0liath序列所代表的组聚类。优选地,在一个实施方案中该杂交序列能够与如SEQ ID NO 408所代表的核酸或 与其一部分杂交。优选地,该杂交序列部分编码具有下述氨基酸序列的多肽,其中当所述氨基酸序 列是全长并且在构建进化系统树(如图21中所绘制的一个进化系统树)中使用时,与包含 如SEQ ID NO 409所代表的氨基酸序列的组1聚类,而不与组2中的YTP多肽聚类。在本发明方法中有用的另一种核酸序列变体是编码选自分别如本文中所定义的 GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的剪接变体,剪接 变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A中所给出任一核酸序列的剪接变体或编码实施例1表A中所给出任意多肽序 列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。优选的剪接变体在一个实施方案中是由SEQ ID NO :1所代表的核酸序列的剪接变 体,或是编码SEQ ID NO :2的直向同源物或旁系同源物的核酸序列的剪接变体。优选地,该 剪接变体是编码多肽序列的核酸序列的剪接变体,所述的多肽序列包含(i)与如SEQ ID NO :115 所代表的 QLQ 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、 95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与如SEQ ID N0:116所代表的 WRC 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性的结构域。优选的剪接变体在一个实施方案中是由SEQ ID NO :120所代表的核酸的剪接变 体,或是编码SEQ ID NO :121的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所 述剪接变体编码的氨基酸序列在构建进化系统树(如图8中所绘制的一个进化系统树)中 使用时,与包含如SEQ IDNO 121所代表的氨基酸序列的RAA1样多肽组聚类,而不与任何其他组聚类。优选的剪接变体在一个实施方案中是由SEQ ID NO :168所代表的核酸的剪接变 体,或是编码SEQ ID NO :169的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该 剪接变体编码的氨基酸序列是约65个至约200个氨基酸的多肽,其包含如上文定义的前有 保守三肽基序5 (a、b、c或d)并且后接保守基序6和优选还后接保守基序7的亮氨酸丰富 结构域;或与SEQ ID NO 169的序列具有至少38%序列同一性。优选的剪接变体在一个实施方案中是由SEQ ID NO :212所代表的核酸的剪接变 体,或是编码SEQ ID NO :213的直向同源物或旁系同源物的核酸的剪接变体。优选地,由该 剪接变体编码的氨基酸序列在构建进化系统树,如图17中所绘制的一个进化系统树中使 用时,与包含如SEQ ID NO 213所代表的氨基酸序列的ARKL多肽组聚类,而不与任何其他 组如Musmu_G0liath序列所代表的组聚类。
优选的剪接变体在一个实施方案中是由SEQ ID NO :408所代表的核酸的剪接变 体,或是编码SEQ ID NO :409的直向同源物或旁系同源物的核酸的剪接变体。优选地,由所 述剪接变体编码的氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系统树) 中使用时,与包含如SEQ IDN0 409所代表的氨基酸序列的组1聚类,而不与组2中的YTP
多肽聚类。在实施本发明方法中有用的另一种核酸序列变体是编码多肽的核酸序列的等位 变体,其中所述的多肽选自如上文分别所定义GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽 和YTP多肽组成的组,等位变体如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达实 施例1的表A中所给出任一核酸序列的等位变体,或包括在植物中导入并表达编码实施例 1表A中所给出任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDN0 2的GRF多 肽和实施例1的表A中所述任意多肽序列相同的生物学活性。等位变体存在于自然界中, 并且在本发明的方法中包括使用这些天然等位基因。优选地,该等位变体是SEQ ID N0:1 的等位变体或编码SEQID NO :2的直向同源物或旁系同源物的核酸序列的等位变体。优选 地,该等位变体是多肽序列的等位变体,所述的多肽序列包含(i)与如SEQ IDN0 115所代 表的 QLQ 结构域具有至少 50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,98%, 99%或更多氨基酸序列同一性的结构域;和(ii)与如SEQ ID NO 116所代表的WRC结构域 具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多氨基 酸序列同一性的结构域。在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDN0 121的RAA1 样多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然 界中,并且在本发明的方法中包括使用这些天然等位基因。优选地,该等位变体是SEQ ID NO 120的等位变体或编码SEQ ID NO 121的直向同源物或旁系同源物的核酸的等位变体。 优选地,由所述等位变体编码的氨基酸序列在构建进化系统树(如图8中所绘制的一个进 化系统树)中使用时,与包含如SEQ ID N0:121所代表的氨基酸序列的RAA1样多肽聚类, 而不与任何其他组聚类。在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDN0 169的SYR 多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界 中,并且在本发明的方法中包括使用这些天然等位基因。优选地,该等位变体是SEQ ID NO 168的等位变体或编码SEQ ID NO 169的直向同源物或旁系同源物的核酸的等位变体。优 选地,由该等位变体编码的氨基酸序列是约65个至约200个氨基酸的多肽,其包含如上文 定义的前有保守三肽基序5 (a、b、c或d)并且后接保守基序6和优选还后接保守基序7的 亮氨酸丰富结构域;或与SEQ ID NO 169的序列具有至少38%序列同一性。在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDN0 213的ARKL 多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界 中,并且在本发明的方法中包括使用这些天然等位基因。优选地,该等位变体是SEQ ID NO 212的等位变体或编码SEQ ID NO :213的直向同源物或旁系同源物的核酸的等位变体。优 选地,由该等位变体编码的氨基酸序列在构建进化系统树,如图17中所绘制的一个进化系统树中使用时,与包含如SEQ ID NO 213所代表的氨基酸序列的ARKL多肽组聚类,而不与 任何其他组如Musmu_G0liath序列所代表的组聚类。在本发明的一个实施方案中有用的等位变体基本上具有如SEQ IDN0 409的YTP 多肽和实施例1的表A中所述任意氨基酸序列相同的生物学活性。等位变体存在于自然界 中,并且在本发明的方法中包括使用这些天然等位基因。优选地,该等位变体是SEQ ID NO 408的等位变体或编码SEQ ID NO 409的直向同源物或旁系同源物的核酸的等位变体。优 选地,由该等位变体编码的氨基酸序列在构建进化系统树(如图21中所绘制的一个进化系 统树)中使用时,与包含如SEQ ID NO 409所代表的氨基酸序列的组1聚类,而不与组2中 的YTP多肽聚类。基因改组或定向进化也可以用来生成编码多肽的核酸序列的变体,其中所述的多 肽选自如上文分别所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的 组,术语“基因改组”如本文中定义。根据本发明,提供了用于提高产量相关性状的方法,包括在植物中导入并表达在 实施例1的表A中给出的任一核酸序列的变体,或包括在植物中导入并表达核酸序列的变 体,所述的核酸序列编码在实施例1的表A中给出的任意多肽序列的直向同源物、旁系同源 物或同源物,其中所述的变体核酸序列通过基因改组获得。优选地在一个实施方案中,通过基因改组所获得的变体核酸编码这样的多肽序 列,其包含⑴与如SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、60%、65%、 70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii) 与如SEQ ID而116所代表的驟(结构域具有至少50%、55%、60%、65%、70%、75%、 80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。优选地在一个实施方案中,由基因改组获得的变体核酸编码的氨基酸序列在构建 进化系统树(如图8中所绘制的一个进化系统树)中使用时,与包含如SEQ ID NO 121所 代表的氨基酸序列的RAA1样多肽组聚类,而不与任何其他组聚类。优选地在一个实施方案中,由基因改组获得的变体核酸编码的氨基酸序列是约65 个至约200个氨基酸的多肽,其包含如上文定义的前有保守三肽基序5 (a、b、c或d)并且后 接保守基序6和优选还后接保守基序7的亮氨酸丰富结构域;或与SEQ ID NO 169的序列 具有至少38%序列同一性。优选地在一个实施方案中,由基因改组获得的变体核酸编码的氨基酸序列在构建 进化系统树(如图17中所绘制的一个进化系统树)中使用时,与包含如SEQ ID N0:213所 代表的氨基酸序列的ARKL多肽组聚类,而不与任何其他组如PF00097MuSmu_GOliath序列 所代表的组聚类。优选地在一个实施方案中,由基因改组获得的变体核酸编码的氨基酸序列在构建 进化系统树(如图21中所绘制的一个进化系统树)中使用时,与包含如SEQ ID N0:409所 代表的氨基酸序列的组1聚类,而不与组2中的YTP多肽聚类。另外,核酸序列变体也可以通过位点定向诱变获得。几种方法可用于实现位点定 向诱变,最常见的是基于 PCR 的方法(Current Protocols inMolecular Biology. Wiley 编 辑)。编码GRF多肽的核酸序列可以从任何天然来源或人工来源衍生。该核酸序列可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编 码GRF多肽的核酸序列来自植物,进一步优选地来自双子叶植物,更优选地来自十字花科 (Brassicaceae),该核酸序列最优选地来自拟南芥。编码RAA1样多肽的核酸可以从任何任何天然或人工来源衍生。该核酸可以通过 人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码RAA1 样多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科(Poaceae), 最优选地该核酸来自稻。编码SYR多肽的核酸可以从任何天然来源或人工来源衍生。该核酸可以通过人类 有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码SYR多肽 的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科,最优选地该核酸来 自稻。编码ARKL多肽的核酸可以从任何天然来源或人工来源衍生。该核酸可以通过人 类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。优选地,编码ARKL 多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本科,最优选地该核 酸来自稻。编码YTP多肽的核酸也可以通过从头设计的YTP多肽编码,即不从天然来源衍生。 该核酸可以通过人类有意操作,在组成和/或基因组环境方面从其天然形式中修饰而来。 优选地,编码YTP多肽的核酸来自植物,进一步优选地来自单子叶植物,更优选地来自禾本 科,最优选地该核酸来自稻。本发明方法的实施在一个实施方案中产生了具有增强的产量相关性状的植物。特 别地,本发明方法的实施产生了相对于对照植物具有提高的产量、特别地提高的种子产量 的植物。术语“产量”和“种子产量”在本文的“定义”部分中更详细地描述。本发明方法的实施在一个实施方案中产生这样的植物,该植物与对照植物相比在 非生物胁迫下生长时具有提高的非生物胁迫抗性(或非生物胁迫耐受性,所述术语可互换 地使用),实现增强的产量相关性状。特别地,本发明方法的实施产生了相对于对照植物具 有提高的产量、特别地提高的种子产量和提高的生物量的植物。术语“产量”和“种子产量” 在本文的“定义”部分中更详细地描述。本文中对增强的产量相关性状的谈及意指植物的一个或多个部分的生物量(重 量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。在一个实施方案中,此类可收获部分是种子,并且本发明方法的实施产生了相对 于对照植物的种子产量而言具有提高的种子产量的植物。在一个实施方案中,此类可收获部分是根、花和/或种子,并且本发明方法的实施 产生了相对于对照植物的种子产量而言具有提高的生物量和/或种子产量的植物。在一个实施方案中,此类可收获部分是种子,并且本发明方法的实施产生了相对 于对照植物的种子产量而言具有提高的产量、总种子重量、种子充实率、花(或小花)数、收 获指数和千粒核重的植物。以谷物为例,产量提高可以表现为以下一个或多个指标每公顷或英亩建立的植 物的数目提高、每株植物穗数提高、行数、每行核粒数、核粒重、千粒核重、花序长度/直径 的提高、种子充实率(即充实种子数除以种子总数并乘以100)提高,及其他。以稻为例,产
51量提高可以自身表现为下列一种或多种指标的提高每公顷或英亩植物数、每株植物的花 序数、每个花序的小穗数、每花序的花(小花)数目(其表述为充实种子数对原生花序数的 比率)、种子充实率(即充实种子数除以种子总数并乘以100)提高、千粒核重提高及其他。本发明提供了用于相对于对照植物提高植物中产量相关性状的方法,所述方法包 括增加植物中编码选自分别如本文中所定义的GRF多肽和RAA1样多肽组成的组中多肽的 核酸序列表达。本发明提供了用于相对于对照植物提高植物的非生物胁迫抗性、从而在非生物胁 迫条件下生长时,相对于对照植物而言导致植物提高的产量、尤其种子产量和/或提高的 生物量,所述方法包括调节植物中编码如本文中所定义的SYR多肽的核酸表达,优选地增 加该核酸表达。本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述 方法包括调节植物中编码如本文中定义的ARKL多肽的核酸表达。本发明提供了用于相对于对照植物提高植物的产量、尤其种子产量的方法,所述 方法包括调节植物中编码如本文中定义的YTP多肽的核酸表达。由于本发明的转基因植物具有提高的产量相关性状,故这些植物有可能在其生活 周期的对应阶段(在其生活周期的至少部分期间)上相对于对照植物的生长速率表现出提 高的生长速率。除了提高的产量能力外,提高的养分摄取效率也可以有助于产量的提高。观察到 本发明的植物显示较高的养分摄取效率。当植物处于胁迫下时,提高的养分摄取效率允许 植物更好地生长。也观察到本发明的植物具有提高的干旱胁迫耐受性,这允许植物在阻滞 或抑制对照植物生长的条件下继续生长。提高的生长速率可以是植物的一个或多个部分(包括种子)特有的,或可以基本 上遍及整株植物。具有提高的生长速率的植物可以具备更短的生活周期。植物的生活周期 可以意指从干燥成熟种子生长直至植物已经产生与起始材料相似的干燥成熟种子的阶段 所需要的时间。这个生活周期可以受诸因素如早期生长势、生长速率、绿度指数、开花时间 和种子成熟速度影响。生长速率的提高可以在植物生活周期的一个或多个阶段上或基本上 在植物整个生活周期期间发生。提高的生长速率在植物生活周期的早期期间可以反映增加 的(早期)生长势。生长速率的提高可以改变植物的收获周期,从而允许植物较晚播种和 /或较早收获,而这本来是不可能的(相似效果可以随较早的开花时间获得;延迟的开花通 常不是作物中想要的性状)。如果大幅提高生长速率,则可以允许进一步播种相同植物物 种的种子(例如播种并收获稻植物,随后播种并收获其他稻植物,全部稻植物均处于一个 常规生长时期中)。类似地,如果大幅提高生长速率,则可以允许进一步播种不同植物物种 的种子(例如播种并收获谷物植物,随后例如播种并任选收获大豆、马铃薯或任何其他合 适的植物)。在一些作物植物的例子中,来自相同根状茎的额外收获次数也可以是可能的。 改变植物的收获周期可以导致每英亩一年生物量生产提高(原因在于可以培育并收获任 何具体植物的次数(即在一年中)提高)。生长速率的提高也可以允许将转基因植物在比 其野生型对应物更广泛的地理区域内培育,因为培育作物的地域限制往往由栽种时期(早 季)或在收获时期(晚季)的不利环境条件决定。如果缩短收获周期,则可以避开这类不 利条件。生长速率可以通过从生长曲线衍生多个参数而确定,此类参数可以是T-Mid(植物达到50%最大植物大小所花费的时间)和T_90(植物达到90%最大植物大小所花费的 时间),以及其他。根据本发明的优选特征,本发明方法的实施产生了相对于对照植物具有提高的生 长速率的植物。因此,根据本发明,提供了用于提高植物生长速率的方法,所述方法包括增 加植物中编码如本文中定义的GRF多肽或RAA1样多肽或YTP多肽或ARKL多肽的核酸序列 表达。根据本发明的优选特征,本发明方法的实施产生了相对于对照植物,在非生物胁 迫条件下生长时具有提高的生长速率的植物。因此,根据本发明,提供了用于提高非生物胁 迫条件下植物生长速率的方法,所述方法包括调节植物中编码如本文中定义的SYR多肽的 核酸表达、优选地增加该核酸表达。与可比较条件下生长的对照植物相比较,无论该植物处于非胁迫条件下或无论该 植物暴露于多种胁迫,提高的产量相关性状均出现。植物一般通过生长得更慢而应答于胁 迫暴露。在严重胁迫条件下,植物甚至可能完全停止生长。另一方面,轻度胁迫在本文中定 义为植物所暴露的任何下述胁迫,其中所述的胁迫不导致植物完全停止生长,但同时不能 恢复生长。与非胁迫条件下的对照植物相比较,轻度胁迫在本发明的意义下导致受胁迫植 物的生长降低小于40%、35%或30%、优选地小于25%、20%或15%、更优选地小于14%、 13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,栽培作 物植物中并不经常遭遇严重胁迫。因此,由轻度胁迫诱导的受损生长对于农业往往是不受 欢迎的特征。轻度胁迫是植物所暴露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、 寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或 离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌、线虫和昆虫引起 的那些胁迫。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本 领域技术人员清楚对于给定地点的正常土壤条件和气候条件。特别地,本发明的方法可以在非胁迫条件下或在轻度干旱条件开展以产生相对于 对照植物具有提高的产量的植物。如Wang等人(Planta(2003)218 :1-14)中报道,非生物 胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和分子变化。干 旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长损害及细胞 损害。Rabbani等人(Plant Physiol (2003) 133 1755-1767)描述了干旱胁迫与高盐度胁 迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁迫,从而导致 细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以引 起功能蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号传导途 径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停滞。如本文中 所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员清楚对 于给定地点的正常土壤条件和气候条件。与对照植物相比较,无论所述植物处于非胁迫条件下或无论所述植物暴露于多种 胁迫,产量和/或生长速率的提高均出现。植物一般通过生长得更慢而应答于胁迫暴露。 在严重胁迫条件下,植物甚至可能完全停止生长。另一方面,轻度胁迫在本文中定义为植物 所暴露的任何下述胁迫,其中所述的胁迫不导致植物完全停止生长,但同时不能恢复生长。由于农业实践(灌溉、施肥、杀虫剂处理)的进步,栽培作物植物中并不经常遭遇严重胁迫。 因此,由轻度胁迫诱导的受损生长对于农业往往是不受欢迎的特征。轻度胁迫是植物所暴 露的常见生物胁迫和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧 胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是因水胁迫 (尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原 体如细菌、病毒、真菌和昆虫引起的那些胁迫。相对于在可比较条件下培育的对照植物,本发明方法的实施在一个实施方案中产 生在非胁迫条件下或在轻度胁迫条件下培育的具有提高的产量相关性状的植物。因此,根 据本发明,提供了用于提高非胁迫条件下或在轻度胁迫条件下生长的植物中产量相关性状 的方法,所述方法包括增加植物中编码GRF多肽的核酸序列表达。相对于可比较胁迫条件下生长的对照植物,本发明方法的实施产生在非生物胁迫 条件下生长的具有提高的产量相关性状的植物。如Wang等人(Planta (2003) 218 :1_14)中 报道,非生物胁迫导致一系列不利地影响植物生长及生产力的形态学、生理学、生物化学和 分子变化。干旱、盐度、极端温度和氧化胁迫已知相互联系并可以通过相似的机制诱导生长 损害及细胞损害。Rabbani等人(Plant Physiol (2003) 133 1755-1767)描述了干旱胁迫 与高盐度胁迫之间极高程度的“交互作用”。例如,干旱和/或盐化作用主要表现为渗透胁 迫,从而导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧 化胁迫可以引起功能蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细 胞信号传导途径和细胞应答,如产生胁迫蛋白、上调抗氧化物质、积累兼容性溶质和生长停 滞。由于多样的环境胁迫激活相似途径,故本发明采用干旱胁迫的示例不应当视为限于干 旱胁迫,而更应视为一种筛选法以相对于可比较胁迫条件下、通常在非生物胁迫下培育的 对照植物,说明如上文定义的GRF多肽参与提高产量相关性状。如本文中定义的术语“非生物胁迫”意指以下任意一项或多项水胁迫(因干旱或 过量的水所致)、缺氧胁迫、盐胁迫、温度胁迫(因热、寒冷或冰冻温度所致)、化学毒性胁迫 和氧化胁迫。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、 氧化胁迫和离子胁迫。优选地,水胁迫是干旱胁迫。术语“盐胁迫”不限于普通盐(NaCl), 不过可以是由以下一种或多种盐NaCl、KCl、LiCl、MgCl2、CaCl2等引起的任意胁迫。相对于可比较胁迫条件下培育的对照植物,本发明方法的实施产生在非生物胁迫 条件下具有提高的产量相关性状的植物。因此,根据本发明,提供了用于提高非生物胁迫 条件下生长的植物中产量相关性状的方法,所述方法包括增加植物中编码GRF多肽的核酸 序列表达。根据本发明的一个方面,所述非生物胁迫是渗透胁迫,其选自以下一种或多种胁 迫水胁迫、盐胁迫、氧化胁迫和离子胁迫。非生物的环境胁迫的另一个例子是需要被所述植物同化用于生长和发育的一种 或多种养分的可利用性降低。因为养分利用效率强烈影响植物产量和产品品质,故向田地 倾注大量肥料以优化植物生长和产品品质。植物的生产量通常受3种主要养分磷、钾和氮 限制,这3种养分中,氮通常是是植物生长的限速性元素。因此,植物生长所需的主要营养 元素是氮(N)。氮是活细胞中存在的许多重要化合物的组成成分,所述的重要化合物包括氨 基酸、蛋白质(酶)、核酸和叶绿素。1.5%至2%的植物干物质是氮而大约16%的植物总蛋 白是氮。因此,氮可利用性是作物植物生长和生产的主要限制性因素(Frink等人(1999)Proc Natl Acad Sci USA 96(4) :1175_1180),并且也对蛋白质积累和氨基酸组成产生重大 影响。因此,在氮限制性条件下生长时具有提高的产量相关性状的植物是意义重大的。本发明方法的实施产生在养分可利用性降低、尤其氮可利用性降低的条件下培育 的植物,该植物相对于可比较条件下培育的对照植物具有提高的产量相关性状。因此,根据 本发明,提供了用于提高在降低的养分可用性、优选降低的氮可用性条件下生长的植物中 产量相关性状的方法,所述方法包括增加植物中编码GRF多肽的核酸序列表达。降低的养 分可利用性可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他养 分匮乏或过多所致。优选地,降低的养分可利用性是降低的氮可利用性。相对于可比较条件下生长的对照植物,本发明方法的实施在一个实施方案中赋予 在非胁迫条件下或在轻度干旱条件下生长的植物提高的产量。因此,根据本发明,提供了用 于在非胁迫条件下或在轻度干旱条件下培育的植物中提高产量的方法,所述方法包括增加 植物中编码RAA1样多肽的核酸表达。相对于可比较条件下生长的对照植物,本发明方法的实施在一个实施方案中赋予 在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此,根据本发明,提供了 用于在营养缺乏条件下生长的植物中提高产量的方法,所述方法包括调节植物中编码RAA1 样多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、 锰、铁和硼及其他元素缺少所致。相对于可比较条件下生长的对照植物,本发明方法的实施赋予在非生物胁迫条件 如轻度至严重干旱条件下生长的植物提高的产量。因此,根据本发明,提供了用于提高在非 生物胁迫条件如轻度至严重干旱条件下生长的植物中产量的方法,所述方法包括增加植物 中编码SYR多肽的核酸表达。如本文中所用的术语“严重干旱条件”或“严重干旱胁迫”是 与非胁迫条件下生长的对照植物的产量相比较,引起对照植物中50%或更多产量下降的那 些干旱条件。相对于可比较条件下生长的对照植物,本发明方法的实施在一个实施方案中赋予 在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此,根据本发明,提供了 用于提高在营养缺乏条件下生长的植物中产量的方法,所述方法包括增加植物中编码SYR 多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、 铁和硼及其他元素缺少所致。相对于在可比较条件下生长的对照植物,本发明方法的实施赋予在非胁迫条件下 或在轻度干旱条件下生长的植物提高的产量。因此,根据本发明,提供了用于提高在非胁迫 条件下或在轻度干旱条件下生长的植物中产量的方法,所述方法包括调节植物中编码ARKL 多肽的核酸表达。相对于可比较条件下生长的对照植物,本发明方法的实施在一个实施方案中赋予 在养分缺乏条件下、尤其在缺氮条件下生长的植物提高的产量。因此,根据本发明,提供了 用于提高在营养缺乏条件下生长的植物中产量的方法,所述方法包括调节植物中编码ARKL 多肽的核酸表达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、 铁和硼及其他元素缺少所致。相对于在可比较条件下生长的对照植物,本发明方法的实施赋予在非胁迫条件下 或在轻度干旱条件下生长的植物提高的产量。因此,根据本发明,提供了用于提高在非胁迫
55条件下或在轻度干旱条件下生长的植物中产量的方法,所述方法包括调节植物中编码YTP 多肽的核酸表达。相对于可比较条件下生长的对照植物,本发明方法的实施赋予在养分缺乏条件 下、尤其在缺氮条件下生长的植物提高的产量。因此,根据本发明,提供了用于提高在营养 缺乏条件下生长的植物中产量的方法,所述方法包括调节植物中编码YTP多肽的核酸表 达。养分缺乏可以因养分如氮、磷酸盐和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼及其他 元素缺少所致。本发明包括通过本发明方法可获得的植物或其部分(包括种子)或其细胞。所述 植物或其部分或其细胞包含编码选自分别如上文所定义GRF多肽、RAA1样多肽、SYR多肽、 ARKL多肽和YTP多肽组成的组中多肽的核酸转基因。本发明也提供了基因构建体和载体以促进植物中编码选自分别如上文所定义GRF 多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列导入和/或 增加的表达。基因构建体可以插入适于转化到植物中并适于在转化细胞中表达目的基因的 载体中,所述载体可以是市售的。本发明也提供了如本文中定义的基因构建体在本发明方 法中的用途。更具体地,在一个实施方案中,本发明提供了构建体,其包含(a)编码如上文定义的GRF多肽的核酸序列;(b)能够增加(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列。优选地,编码GRF多肽的核酸序列如上文定义。术语“调控序列”和“终止序列”如 本文中定义。优选地,构建体的调控序列之一是从植物基因组分离的组成型启动子。植物组成 型启动子的例子是G0S2启动子,优选地是稻G0S2启动子,更优选地是如SEQ ID N0:117所 代表的G0S2启动子。更具体地,在一个实施方案中,本发明提供了构建体,其包含(d)编码如上文定义的RAA1样多肽的核酸;(e)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(f)转录终止序列。优选地,编码RAA1样多肽的核酸如上文定义。术语“调控序列”和“终止序列”如 本文中定义。更具体地,在一个实施方案中,本发明提供了构建体,其包含1.编码如上文定义的SYR多肽的核酸;2.能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地3.转录终止序列。优选地,编码SYR多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本 文中定义。更具体地,在一个实施方案中,本发明提供了构建体,其包含1.编码如上文定义的ARKL多肽的核酸;2.能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地
3.转录终止序列。优选地,编码ARKL多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本 文中定义。更具体地,在一个实施方案中,本发明提供了构建体,其包含1.编码如上文定义的YTP多肽的核酸;2.能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地3.转录终止序列。优选地,编码YTP多肽的核酸如上文定义。术语“调控序列”和“终止序列”如本 文中定义。植物用包含任意上述核酸序列的载体转化。技术人员非常了解必须存在于所述载 体上以便成功转化、选择和增殖含有目的序列的宿主细胞的遗传元件。此目的序列有效地 与一个或多个调控序列(至少与启动子)连接。有利地,任意类型的启动子,无论是天然的或合成的,可以用来增加所述核酸序列 的表达。组成型启动子是在所述方法中特别有用的,优选从植物基因组分离的组成型启动 子。该植物组成型启动子驱动编码序列在全部情况低于受35S CaMV病毒启动子控制时所 获得水平的水平上表达。其他器官特异性启动子,例如用于叶、茎、块茎、分生组织、种子(胚和/或胚乳) 中优先表达的器官特异性启动子,是在实施本发明的方法中有用的。对于多种启动子类型 的定义,见本文中的“定义”部分。优选地在一个实施方案中,组成型启动子也是遍在启动子。对于多种启动子类型 的定义,见本文中的“定义”部分。应当明白本发明的应用不限于由SEQ ID N0:1代表的编码GRF多肽的核酸序列, 本发明的应用也不限于编码GRF多肽的核酸序列被组成型启动子驱动时的表达。应当明白本发明的应用不限于由SEQ ID NO: 120代表的编码RAA1样多肽的核酸, 本发明的应用也不限于编码RAA1样多肽的核酸被组成型启动子驱动时的表达。组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2启动子。进一步优 选地,该组成型启动子由基本上与SEQ ID NO :124相似的核酸序列代表,最优选地该组成型 启动子如SEQ ID N0:124或SEQ IDN0 :211所代表。根据本发明的另一个优选特征,该组 成型启动子是高速泳动族蛋白(HMGP)启动子,优选地是来自稻的HMGP启动子,更优选地与 SEQ ID NO 125基本上相似,最优选地与SEQ ID NO 125同一。对于组成型启动子的其他 例子,见本文“定义”部分中的表2。应当明白本发明的应用不限于由SEQ ID NO: 168代表的编码SYR多肽的核酸,本 发明的应用也不限于编码SYR多肽的核酸被组成型启动子驱动时的表达。组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2启动子。进一步优 选地,该组成型启动子由基本上与SEQ ID N0:172或SEQ IDN0 :211相似的核酸序列代表, 最优选地,该组成型启动子如SEQ ID N0:172或SEQ ID NO :211所代表那样。对于有用的 组成型启动子的其他例子,见本文“定义”部分中的表2。应当明白本发明的应用不限于由SEQ ID NO :212代表的编码ARKL多肽的核酸,本 发明的应用也不限于编码ARKL多肽的核酸被组成型启动子驱动时或被根特异性启动子驱动时的表达。该组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2启动子。进一步 优选地,该组成型启动子由基本上与SEQ ID NO :406相似的核酸序列代表,最优选地该组成 型启动子如SEQ ID N0:406或SEQ IDN0 :211所代表那样。对于组成型启动子的其他例子, 见本文“定义”部分中的表2。应当明白本发明的应用不限于由SEQ ID NO :1代表的编码YTP多肽的核酸,本发 明的应用也不限于编码YTP多肽的核酸被组成型启动子驱动时的表达。组成型启动子优选地是G0S2启动子,优选地是来自稻的G0S2启动子。进一步优 选地,该组成型启动子由基本上与SEQ ID NO :548相似的核酸序列代表,最优选地该组成型 启动子如SEQ ID N0:548或SEQ IDN0 :211所代表那样。对于组成型启动子的其他例子,见 本文“定义”部分中的表2。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。额外的调节 元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可能适用于实施本发明 的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加至5’非翻译区(UTR) 或编码序列中,以提高细胞质中积累的成熟信使的量。(除启动子、增强子、沉默子、内含子 序列、3’UTR和/或5’UTR区域之外的)其他调控序列可以是蛋白质和/或RNA稳定元件。 此类序列将是已知的或可以由本领域技术人员轻易地获得。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。优选地,该构 建体包含与SEQ ID NO :166基本上相似或同一的表达盒,所述表达盒包含G0S2启动子、编 码RAA1样多肽的核酸。在一个备选的实施方案中,该构建体包含与SEQ ID N0:167基本上 相似或同一的表达盒,所述表达盒包含HMGP启动子、编码RAA1样多肽的核酸。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。优选地,该构 建体包含与SEQ ID NO 407基本上相似或同一的表达盒,所述表达盒包含G0S2启动子、编 码0rysa_ARKLl多肽的核酸和T-玉米醇溶蛋白+T-核酮糖二磷酸羧化酶-加氧酶转录终 止子序列。任选地,可以在被导入植物的构建体中使用一个或多个终止子序列。优选地,该构 建体包含与SEQ ID NO 549基本上相似或相同的表达盒,所述表达盒包含G0S2启动子、编 码YTP多肽的核酸和T-玉米醇溶蛋白+T-核酮糖二磷酸羧化酶-加氧酶转录终止子序列。额外的调节元件可以包括转录增强子以及翻译增强子。本领域技术人员将知道可 能适用于实施本发明的终止子和增强子序列。如定义部分中描述,内含子序列也可以添加 至5’非翻译区(UTR)或编码序列中,以提高细胞质中积累的成熟信使的量。(除启动子、增 强子、沉默子、内含子序列、3' UTR和/或5' UTR区域之外的)其他调控序列可以是蛋白 质/或RNA稳定化元件。此类序列将是已知的或可以由本领域技术人员轻易地获得。本发明的基因构建体可以还包括对于特定细胞类型中维持和/或复制所需要的 复制起点序列。一个例子是当需要将基因构建体在细菌细胞中作为游离型遗传元件(例如 质粒或粘粒分子)维持时的复制起点。优选的复制起点包括但不限于fl-ori和colEl。为检测如在本发明方法中有用的核酸序列的成功转移和/或选择包含这些核酸 序列的转基因植物,使用标记基因(或报道基因)是有利的。因此,所述基因构建体可以任 选地包含选择标记基因。选择标记在本文的“定义”部分中更详细地描述。
—旦不再需要所述标记基因时,可以从转基因细胞中移除或切除它们。用于标记 移除的技术是本领域已知的,有用的技术在上文定义部分中描述。已知当核酸序列稳定或瞬时地整合至植物细胞时,仅少数细胞摄取外来DNA,并且 根据需要,将外来DNA整合至细胞基因组中,这取决于所用的表达载体和所用的转染技术。 为鉴定并选择这些整合体,通常将编码选择标记的基因(如上文所述的基因)连同目的基 因一起导入宿主细胞。这些标记可以在这些基因例如通过常规方法缺失而无功能的突变体 中使用。此外,编码选择标记的核酸序列分子可以在包含编码本发明多肽或本发明方法中 所用多肽的序列的相同载体上,或在独立的载体上导入宿主细胞。已经用所导入核酸序列 稳定转染的细胞可以例如通过选择作用鉴定(例如具有整合的选择标记的细胞存活而其 他细胞死亡)。一旦不再需要所述标记基因时,可以从转基因细胞中移除或切除它们。用于 移除标记基因的技术是本领域已知的,有用的技术在上文定义部分中描述。本发明提供了用于产生相对于对照植物而言具有提高的产量相关性状的转基因 植物的方法,所述方法包括在植物中导入并表达编码这样多肽的任意核酸序列,所述多肽 选自分别如本文以上所定义的GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成 的组。更具体地,在一个实施方案中,本发明提供了用于产生相对于对照植物具有提高 的产量相关性状的转基因植物的方法,所述方法包括(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编 码GRF多肽的核酸序列;和(ii)在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。(i)的核酸序列可以是能够编码如本文中定义的GRF多肽的任意核酸序列。更具体地,在一个实施方案中,本发明提供了用于产生转基因植物的方法,所述转 基因植物具有提高的增强产量相关性状、特别地提高的生物量和/或种子产量,其中所述 方法包括i)在植物或植物细胞中导入并表达编码RAA1样多肽的核酸;和ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以是能够编码如本文中定义的RAA1样多肽的任意核酸。更具体地,在一个实施方案中,本发明提供了用于产生转基因植物的方法,所述转 基因植物具有提高的增强产量相关性状、特别地提高的(种子)产量和/或提高的生物量, 其中所述方法包括(i)在植物或植物细胞中导入并表达编码SYR多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以是能够编码如本文中定义的SYR多肽的任意核酸。更具体地,在一个实施方案中,本发明提供了用于产生转基因植物的方法,所述转 基因植物具有增加的增强产量相关性状、特别地提高的(种子)产量,其中所述方法包括(i)在植物或植物细胞中导入并表达编码ARKL多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以是能够编码如本文中定义的ARKL多肽的任意核酸。更具体地,在一个实施方案中,本发明提供了用于产生转基因植物的方法,所述转基因植物具有增加的增强产量相关性状、特别地提高的(种子)产量,其中所述方法包括i)在植物或植物细胞中导入并表达编码YTP多肽的核酸;和ii)在促进植物生长和发育的条件下培育植物细胞。(i)的核酸可以是能够编码如本文中定义的YTP多肽的任意核酸。所述核酸序列可以直接导入植物细胞或导入植物自身(包括导入组织、器官或植 物的任何其他部分)。根据本发明的优选特征,该核酸序列优选地通过转化作用导入植物。 术语“转化”在本文的“定义”部分中更详细地描述。可以借助技术人员熟悉的全部方法再 生出基因修饰的植物细胞。合适的方法可以在上文提及的S. D. Kung和R. ffu, Potrykus或 H6fgen和Willmitzer的出版物中找到。通常在转化后,对植物细胞或细胞群体选择一个或多个标记的存在性,其中所述 标记由随同目的基因一起共转移的植物可表达基因编码,随后将转化材料再生成完整植 物。为了选择转化的植物,转化中获得的植物材料一般经历选择条件,从而转化植物可以与 非转化植物区分开。例如,以上文所述方式获得的种子可以播种,并且在初始培育时间后, 通过喷洒经受合适的选择。另一种可能性在于种子根据需要消毒后,在使用合适选择剂的 琼脂板上培育,从而仅转化的种子可以长成植物。备选地,筛选所述转化植物的选择标记 (如上文所述的选择标记)的存在。在DNA转移和再生后,推定转化的植物也可以例如使用DNA印迹分析就目的基因 的存在、拷贝数和/或基因组构造进行评价。备选地或额外地,可以使用RNA印迹分析和/ 或蛋白质印迹分析监测新导入的DNA的表达水平,这两项技术均是本领域普通技术人员熟 知的。产生的转化植物可以通过多种方法繁殖,如通过克隆繁殖法或经典育种技术。例 如,第一世代(或T1)转化植物可以进行自交并且选择纯合的第二世代(或T2)转化体,并 且T2植物随后可以通过经典育种技术进一步繁殖。产生的转化生物可以采取多种形式。例 如,它们可以是转化细胞和非转化细胞的嵌合体;克隆性转化体(例如,被转化以含有表达 盒的全部细胞);转化组织和非转化组织的移植体(例如在植物中,与未转化接穗嫁接的转 化根状茎)。本发明明确地扩展至由本文中所述任意方法产生的任意植物细胞或植物,并扩展 至全部植物部分及其繁殖体。本发明进一步扩展以包括已经由前述任意方法产生的原代转 化或转染细胞、组织、器官或完整植物的子代,唯一要求是子代展示出与如本发明方法中的 亲本相同的基因型和/或表型特征。本发明也包括这样的宿主细胞,其含有与植物组成型启动子有效连接的编码多肽 的分离核酸序列,所述多肽选自分别如本文以上所定义的GRF多肽、RAA1样多肽、SYR多肽、 ARKL多肽和YTP多肽组成的组。优选的本发明宿主细胞是植物细胞。相对于本发明方法中 所用核酸序列或载体、表达盒或构建体或载体的宿主植物原则上有利地是能够合成在本发 明方法中使用的多肽的全部植物。本发明的方法有利地适用于任意植物。在本发明中特别有用的植物包括属于植 物界超家族、尤其属于单子叶和双子叶植物的全部植物,包括饲用或饲料豆科植物、观赏植 物、粮食作物、树或灌木。根据本发明的优选实施方案,植物是作物植物。作物植物的例子 包括大豆、向日葵、卡诺拉油菜、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。更优选地,该植物
60是单子叶植物。单子叶植物的例子包括甘蔗。更优选地,该植物是禾谷植物。谷物植物的 例子包括稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱、二粒小麦、斯卑尔脱小麦、黑麦属 (secale)、单粒小麦、埃塞俄比亚画眉草(teff)、蜀黍(milo)和燕麦。本发明也扩展至植物的可收获部分,如但不限于种子、叶、果实、花、茎、根、根状 茎、块茎和球茎,其中所述的植物包含与植物组成型启动子有效连接的编码多肽的分离核 酸序列,其中所述多肽选自分别(如本文以上定义的)GRF多肽、RAA1样多肽、SYR多肽、 ARKL多肽和YTP多肽组成的组。本发明进一步涉及衍生自、优选直接衍生自此种植物的可 收获部分的产品,如干燥颗粒或粉末、油、脂肪和脂肪酸、淀粉或蛋白质。根据本发明的优选特征,受调节的表达是增加的表达。在本领域中充分报道了用 于增加核酸或基因或基因产物表达的方法并且在定义部分中提供了例子。如上文所述,用于增加编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多 肽和YTP多肽组成的组中多肽的核酸序列表达的优选方法是在植物中导入并表达编码分 别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序 列;然而,也可以使用包括但不限于T-DNA活化标签法、TILLING、同源重组在内的其他熟知 技术实现实施本方法的效果,即提高产量相关性状。在定义部分中提供了对这些技术的描 述。本发明也在一个实施方案中包括编码如文中所述GRF多肽的核酸序列和这些GRF 多肽在正常生长条件下、在非生物胁迫生长条件(优选地在渗透胁迫生长条件)下、和在养 分可利用性降低的条件下、优选地在氮可利用性降低的生长条件下提高植物中任意前述产 量相关性状的用途。本发明也在一个实施方案中包括编码如本文中所述RAA1样多肽的核酸的用途, 和这些RAA1样多肽的用途,用于增强植物中任意的前述产量相关性状。本发明也在一个实施方案中包括编码如本文中所述SYR多肽的核酸的用途,和这 些SYR多肽的用途,用于增强非生物胁迫条件下生长的植物中任意的前述产量相关性状。本发明也在一个实施方案中包括编码如本文中所述ARKL多肽的核酸的用途,和 这些ARKL多肽的用途,用于增强植物中任意的前述产量相关性状。本发明也在一个实施方案中包括编码如本文中所述YTP多肽的核酸的用途,和这 些YTP多肽的用途,用于增强植物中任意的前述产量相关性状。编码分别选自由本文中所述GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多 肽组成的组中多肽的核酸序列或本发明的多肽本身可以用于其中鉴定到下述DNA标记的 育种程序中,其中所述的DNA标记可能遗传地与编码GRF多肽的基因连锁。所述基因/核 酸序列或GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽自身可以用来定义分子标 记。这种DNA或蛋白质标记随后可以在育种程序中用来在本发明的方法中选择具有提高的 如上文所定义产量相关性状的植物。编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组 中多肽的基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。此类育种程序有 时需要使用例如EMS诱变法通过对植物进行诱变处理而导入等位变异;备选地,所述程序 可以从收集并非故意造成的所谓“天然”来源的等位变体开始。随后进行等位变体的鉴定, 例如通过PCR法。此后是步骤选择所讨论的和导致产量相关性状提高的序列的优异等位变体。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能实施选择。可以在 温室中或在田间监测生长性能。其他任选步骤包括将其中鉴定到优异等位变体的植物与另 一种植物杂交。这可能用来例如产生感兴趣的表型特征的组合。编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组 中多肽的核酸序列也可以作为探针用于遗传地或物理地绘制所述探针形成其部分的基因 并且用作与这些基因连锁的性状的标记。此类信息可以用于植物育种中,以开发具有所希 望表型的品系。编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组 成的组中多肽的核酸序列的此种用途仅需要至少15个核苷酸长度的核酸序列。编码分别 选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组中多肽的核酸序列 可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的DNA印迹物 (Sambrook J,Fritsch EF禾口Maniatis T(1989)Molecular Cloning,ALaboratory Manual) 可以用编码分别选自由GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽组成的组 中多肽的核酸序列探测。所得的结合模式随后可以使用计算机程序如MapMaker (Lander等 人(1987)Genomics 1 :174_181)开展遗传分析以构建遗传图。此外,所述核酸序列可以用 来探测含有一组个体的限制性核酸内切酶处理的基因组DNA的DNA印迹物,其中所述的一 组个体代表具有定义的遗传杂交的亲本和子代。DNA多态性的分离是明显的并用来计算编 码GRF多肽的核酸序列在先前使用这个群体获得的遗传图中的位置(Botstein等人(1980) Am. J. Hum. Genet. 32 314-331)。在Bernatzky和 Tanksley(1986)Plant Mol. Biol. Reporter 4 :37_41 中描述了植 物基因来源的探针的产生及其在遗传作图中的用途。许多出版物描述了使用上文概述的方 法学或其变例对特定CDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯 合系和其他个体群体可以用于作图。此类方法学是本领域技术人员熟知的。所述核酸序列探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel 等在Non-mammalian Genomic Analyasis :A Practical Guide,Academic press 1996,第 319-346页及其中引用的参考文献)。在另一个实施方案中,所述核酸序列探针可以在直接荧光原位杂交(FISH)作图 法(Trask(1991)Trends Genet. 7 149-154)中使用。尽管当前的FISH作图法支持使用大 的克隆(几个kb至几百个kb ;见Laan等人(1995) Genome Res. 5 13-20),然而灵敏度的改 善可以允许使用更短探针进行FISH作图。用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序 列而实施。方法例子包括等位基因特异性扩增法(Kazazian(1989) J. Lab. Clin. Med 11: 95-96)、PCR 扩增片段的多态性(CAPS ;Sheffield 等人(1993)Genomics 16:325-332)、 等位基因特异性连接(Landegren等人(1988) Science 241 :1077_1080)、核苷酸延伸反 应(Sokolov (1990)NucleicAcid Res. 18 :3671)、放射杂交作图(Walter 等人(1997)Nat. Genet. 7 22~28)和 Happy 作图法(Dear 和 Cook (1989) Nucleic Acid Res. 17 :6795_6807)。 对于这些方法,使用一种核酸序列的序列来设计并产生在扩增反应或在引物延伸反应中使 用的引物对。此类引物的设计是本领域技术人员熟知的。在使用基于PCR遗传作图的方法 中,可能需要在对应于当前核酸序列的区域中鉴定作图交叉的亲本之间的DNA序列差异。 然而,这对作图法而言通常不是必需的。
如前文所述,本发明方法在一个实施方案中产生了具有提高的产量相关性状的植 物。这些性状也可以与经济上有利的其他性状组合,如其他的产量提高性状、非生物胁迫和 生物胁迫耐受性、除草剂、杀虫剂耐受性、调节多种构造性特征和/或生物化学特征和/或 生理学特征的性状。如前文所述,本发明方法在一个实施方案中产生了具有增强的产量相关性状的植 物。这些性状也可以与经济上有利的其他性状组合,如其他的产量增强性状、针对其他非生 物胁迫和生物胁迫的耐受性、调节多种构造性特征和/或生物化学特征和/或生理学特征 的性状。用于转基因植物中基因堆叠的方法是本领域熟知的(见例如,Halpin(2005)Plant Biotech J(3) :141-155综述)。基因堆叠可以通过反复步骤进行,其中两种或多种转基因 可以通过含有一种转基因的植物与携带其他转基因的个体杂交或备选地通过用新基因再 转化(或超转化)含有一种转基因的植物依次导入植物。所述迭代方法的一个限制是转基 因是不连锁的并且将位于植物基因组中不同的随机基因座处。结果是两个基因座可能在后 续世代中分离,这影响了育种程序。备选地,基因堆叠可以借助更快并且可以用于转化技术的所有范围的共转化法实 现。例如使用农杆菌转化法时,(至少两种)转基因可以以许多构象(conformation)存在(i)将编码序列融合以在翻译时形成单一多肽并且处在单一启动子的控制下;(ii)将编码序列依次地置于单一启动子下游,由影响mRNA合成(内部核糖体进入 位点IRES、2A打滑信号(2A stuttering signal)等)或多肽合成(由蛋白酶底物位点等 隔开的多聚蛋白等)的核酸信号隔开;(iii)编码序列独立受各自的启动子驱动,并且所述启动子_编码序列组合位于 相同的T-DNA内部;(iv)编码序列独立受各自的启动子驱动,并且所述启动子_编码序列组合位于相 同质粒的不同T-DNA中;(v)编码序列独立受各自的启动子驱动,并且所述启动子_编码序列组合位于寄 居在相同或各自的农杆菌菌株中的不同质粒的不同T-DNA中。在另一个实施方案中,本发明提供了用于相对于对照植物而言提高植物中产量相 关性状的方法,包括增加植物中编码GRF多肽的核酸序列表达和调节相同植物中编码第二 种多肽的核酸序列表达。出人意料地,现在已经发现增加植物中编码GRF多肽的核酸序列的表达产生了 相对于对照植物具有提高的产量相关性状的植物。根据第一实施方案,本发明提供了用于 相对于对照植物而言提高植物中产量相关性状的方法,包括增加植物中编码GRF多肽的核 酸序列的表达。在一个实施方案中,本发明涉及如下概括的主题物1.用于相对于对照植物提高植物中产量相关性状的方法,包括增加植物中编码生 长调节因子(GRF)多肽的核酸序列表达,和任选地选择具有提高的产量相关性状的植物, 其中所述GRF多肽包含⑴与如SEQ ID NO :115所代表的QLQ结构域具有至少50%、55%、 60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性的结构 域;和(ii)与如SEQ ID NO :116所代表的WRC结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域。2.根据项1的方法,其中所述的GRF多肽包含(i)具有InterPro登录 号PRO 14978 (PFAM登录号PF08880)的QLQ结构域;(ii)具有InterPro登录号 IPR014977(PFAM登录号PF08879)的WRC结构域;和(iii)包含在保守间隔(CX9CX1QCX2H) 中的3个Cys和一个His残基的转录效应子(ET)结构域。3.根据项1或2的方法,其中所述的GRF多肽以增加的优选顺序与如SEQ ID NO 2所代表的GRF多肽或与本文表A中给出的任一多肽序列具有至少50 %、55 %、60 %、65 %、 70%、75%、80%、85%、90%、95%、98%、99% 或更多氨基酸序列同一性。4.根据任一前述项的方法,其中所述的编码GRF多肽的核酸序列由表A中给出的 任一核酸序列SEQ ID NO或其部分或者由能够与表A中给出的任一核酸序列SEQ ID NO杂 交的序列代表。5.根据任一前述项的方法,其中所述的核酸序列编码表A中给出的任一多肽序列 SEQ ID NO的直向同源物或旁系同源物。6.根据任一前述项的方法,其中所述增加的表达由以下任意一种或多种方法实 现T-DNA激活标签法、TILLING或同源重组。7.根据任一前述项的方法,其中所述增加的表达通过在植物中导入并表达编码 GRF多肽的核酸序列实现。8.根据任一前述项的方法,其中所述提高的产量相关性状是以下一项或多项 (i)提高的早期生长势;(ii)提高的地上部分生物量;(iii)提高的每株植物总种子产量; (iv)提高的种子充实率;(V)提高的收获指数;或(Vii)提高的千粒核重(TKW)。9.根据任一前述项的方法,其中所述的核酸序列有效地连接至组成型启动子、优 选地有效连接至植物组成型启动子,更优选地有效连接至G0S2启动子、最优选地有效连接 至如SEQ ID N0:117所代表的来自稻的G0S2启动子。10.根据任一前述项的方法,其中所述的编码GRF多肽的核酸序列是植物来源的, 优选地来自双子叶植物,进一步优选地来自十字花科,最优选地来自拟南芥。11.由根据任一前述项的方法可获得的植物、其部分(包括种子)或植物细胞,其 中所述的植物、其部分或细胞包含有效连接至植物组成型启动子的编码GRF多肽的分离的 核酸转基因。12.构建体,其包含1.编码如项1至5任一项中定义的GRF多肽的核酸序列;2.能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地3.转录终止序列。13.根据项12的构建体,其中所述的调控序列是植物组成型启动子,优选地是 G0S2启动子,更优选地是如SEQ ID NO :117所代表的G0S2启动子。14.根据项12或13的构建体在用于制备植物的方法中的用途,所述植物相对于 对照植物具有提高的产量相关性状,其中所述提高的产量相关性状是以下一项或多项(i) 提高的早期生长势;(ii)提高的地上部分生物量;(iii)提高的每株植物总种子产量;(iv) 提高的种子充实率;(V)提高的收获指数;或(vii)提高的千粒核重(TKW)。15.用根据项12或13的构建体转化的植物、植物部分或植物细胞。
64
16.用于产生相对于对照植物具有提高的产量相关性状的转基因植物的方法,包 括(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编 码如项1至5任一项中定义的GRF多肽的核酸序列;和(ii)在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。17.转基因植物,其相对于对照植物具有因编码如项1至5任一项中所定义GRF多 肽的核酸序列表达增加引起的提高的产量相关性状,所述核酸序列有效连接至植物组成型 启动子,或者从所述转基因植物衍生的转基因植物细胞或转基因植物部分。18.根据项11、15或17的转基因植物,其中所述的植物是作物植物或单子叶植物 或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦,或从所述转基因植物 衍生的转基因植物细胞。19.包含分离的核酸序列的可收获部分,所述分离的核酸序列编码根据项18的植 物的GRF多肽,其中所述的可收获部分优选地是种子。20.产物,从根据项18的植物和/或从根据项19的植物的可收获部分衍生。21.编码如项1至5任一项中所定义GRF多肽的核酸序列在提高产量相关性状中 的用途,其中所述的产量相关性状包含以下一项或多项(i)提高的早期生长势;(ii)提高 的地上部分生物量;(iii)提高的每株植物总种子产量;(iv)提高的种子充实率;(v)提高 的收获指数;或(vii)提高的千粒核重(TKW)。在一个实施方案中,本发明涉及如下概括的主题物22.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码 RAA1样多肽的核酸表达,其中所述的RAA1样多肽包含两个或多个以下基序⑴基序 1 :GVW(V/L)F(SEQ ID NO 162),(ii)基序 2 :LGW(E/S)RY(Y/F) (SEQ ID NO 163),(iii)基序 3 (D/H) L (L/I) S (I/V/L) P (R/K/A) (S/D) F (SEQ ID NO : 164),(iv)基序 4 (H/Y) (F/M) YD (V/I)VVK (N/T) (R/P) (SEQ ID NO 165)。23.根据项22的方法,其中所述的RAA1样多肽还具有10与21KDa之间的分子量 和高于8. 5的pi。24.根据项22或23的方法,其中所述受调节的表达通过在植物中导入并表达编码 RAA1样多肽的核酸实现。25.根据任一前述项的方法,其中所述的编码RAA1样多肽的核酸编码表A中所列 的任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。26.根据任一前述项的方法,其中所述的核酸序列编码表A中给出的任意蛋白质 的直向同源物或旁系同源物。27.根据任一前述项的方法,其中所述的增强的产量相关性状包括相对于对照植 物提高的产量、优选提高的生物量和/或提高的种子产量。28.根据项22至27任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。29.根据项22至27任一项的方法,其中所述的增强的产量相关性状在缺氮条件下获得。
30.根据项24至29任一项的方法,其中所述的核酸有效连接至组成型启动子。31.根据项30的方法,其中所述的组成型启动子是G0S2启动子或HMGP启动子,优 选地是来自稻的G0S2启动子或HMGP启动子。32.根据任一前述项的方法,其中所述的编码RAA1多肽的核酸是植物来源的,优 选地来自双子叶植物,进一步优选地来自禾本科(Poaceae),更优选地来自稻属(Oryza), 最优选地来自稻(Oryza sativa)。33.由根据任一前述项的方法可获得的植物或其部分,包括种子,其中所述的植物 或其部分包含编码RAA1样多肽的重组核酸。34.构建体,其包含(i)编码RAA1样多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。35.根据项34的构建体,其中所述调控序列之一是组成型启动子。36.根据项35的构建体,其中所述的组成型启动子是G0S2启动子或HMGP启动子, 优选地是来自稻的G0S2启动子或HMGP启动子。37.根据项34至36任一项的构建体在用于产生植物的方法中的用途,所述植物相 对于对照植物具有提高的产量,特别地提高的生物量和/或提高的种子产量。38.用根据项34至36任意项的构建体转化的植物、植物部分或植物细胞。39.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的 产量、特别地提高的生物量和/或提高的种子产量,该方法包括⑴在植物中导入并表达编码RAA1样多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。40.转基因植物,其相对于对照植物具有因编码RAA1样多肽的核酸的受调节表达 引起的提高产量、特别地提高的生物量和/或提高的种子产量,或从所述转基因植物衍生 的转基因植物细胞。41.根据项33、38或39的转基因植物,或从其中衍生的转基因植物细胞,其中所述 的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、 高粱和燕麦。42.根据项41的植物的可收获部分,其中所述的可收获部分优选地是根生物量和
/或种子。43.产物,从根据项41的植物和/或从根据项42的植物的可收获部分衍生。44.编码RAA1样多肽的核酸在植物中相对于对照植物提高产量、特别地提高种子 产量和/或根生物量中的用途。在一个实施方案中,本发明涉及如下概括的主题物45.用于相对于对照植物提高植物中非生物胁迫抗性的方法,包括调节植物中编 码SYR多肽的核酸表达,所述SYR多肽包含前有保守三肽基序5(SEQ ID NO :173、174、175 或176之一)并后接保守基序6(SEQ ID NO 177)的亮氨酸丰富结构域,其中所述提高的非 生物胁迫抗性是相对于对照植物而言提高的养分摄取效率和/或提高的干旱胁迫耐受性。46.根据项45的方法,其中所述的SYR多肽以增加的优选顺序与SEQ ID NO 169所代表的 SYR 多肽具有至少 27%、30%、35%、40%、45%、50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%或更多的序列同一性。47.根据项45或46的方法,其中所述的编码SYR多肽的核酸由表A中给出的任 一核酸SEQ ID NO或其部分或者由能够与表A中给出的任一核酸SEQ ID NO杂交的序列代表。48.根据项45至47任一项的方法,其中所述的核酸序列编码表A中给出的任意 SEQ ID NO的直向同源物或旁系同源物。49.根据任一前述项的方法,其中所述的SYR蛋白还包含保守基序7 (SEQ ID NO 178)。50.根据任一前述项的方法,其中所述的养分摄取效率导致提高的种子产量和/ 或提高的生物量。51.项50的方法,其中所述提高的种子产量至少包含提高的总种子重量、千粒核 重和/或提高的充实种子数。52.项50的方法,其中所述提高的生物量是提高的苗生物量和/或提高的根生物量。53.根据任一前述项的方法,其中所述提高的养分摄取效率在轻度干旱条件下出 现。54.根据任一前述项的方法,其中所述提高的干旱胁迫耐受性导致提高的种子产量。55.项54的方法,其中所述提高的种子产量至少包含提高的总种子重量、充实率 和/或收获指数。56.根据任一前述项的方法,其中所述受调节的表达通过在植物中导入并表达编 码SYR多肽的核酸实现。57.根据项56的方法,其中所述核酸有效地连接至组成型启动子,优选地有效连 接至G0S2启动子。58.根据任一前述项的方法,其中所述的编码SYR多肽的核酸是植物来源的,优选 地来自单子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。59.构建体在用于制备具有提高的非生物胁迫抗性的植物的方法中的用途,所述 构建体包含(a)编码如项45至49任一项中定义的SYR多肽的核酸;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列,并且其中所述调控序列之一是组成型启动子,优选地是G0S2启动子,并且其中所 述提高的非生物胁迫抗性是相对于对照植物提高的养分摄取效率和/或提高的干旱胁迫 耐受性。60.编码SYR多肽的核酸在用于相对于对照植物提高植物中非生物胁迫抗性的方 法中的用途,其中所述提高的非生物胁迫抗性是相对于对照植物而言提高的养分摄取效率 和/或提高的干旱胁迫耐受性。61.根据项60的用途,其中所述提高的养分摄取效率导致提高的种子产量和/或提高的生物量。62.根据项60的用途,其中所述提高的干旱胁迫耐受性导致提高的种子产量。在一个实施方案中,本发明涉及如下概括的主题物63.用于相对于对照植物增强植物中产量相关性状的方法,包括调节植物中编码 ARKL多肽的核酸表达。64.根据项63的方法,其中所述的ARKL多肽包含一个或多个以下结构域(i)如SEQ ID NO :400所代表的ZfC3H2C3结构域或以增加的优选顺序与如SEQ ID N0:95至SEQ ID NO. 351所代表的一个或多个ZfC3H2C3结构域具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%或更多序列同一性的结构域;和(II)以增加的优选顺序与如SEQ ID NO :352至SEQ ID NO. 398所代表的一个或 多个 PfamB2828 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95% 或更多序列同一性的DAR1结构域。65.根据项63和64的方法,其中所述的ARKL多肽包含一个或多个以下结构⑴如SEQ ID NO 401所代表的ZfC3H2C3结构域;(ii)如 SEQ ID NO 399 所代表的基序 8。66.根据项63至65的方法,其中所述受调节的表达通过在植物中导入并表达编码 ARKL多肽的核酸实施。67.根据任一前述项的方法,其中所述的编码ARKL多肽的核酸编码表A中所列的 任一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。68.根据任一前述项的方法,其中所述的核酸序列编码表A中给出的任意蛋白质 的直向同源物或旁系同源物。69.根据任一前述项的方法,其中所述的增强的产量相关性状包括相对于对照植 物提高的产量、优选提高的种子产量。70.根据前述项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。71.根据前述项的方法,其中所述增强的产量相关性状在干旱胁迫条件下获得。72.根据任一前述项的方法,其中所述的核酸有效连接至组成型启动子,优选地有 效连接至G0S2启动子,最优选地有效连接至来自稻的G0S2启动子。73.根据任一前述项的方法,其中所述的编码ARKL多肽的核酸是植物来源的,优 选地来自单子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。74.通过根据任意前述项的方法可获得的植物或其部分,包括种子,其中所述的植 物或其部分包含编码ARKL多肽的重组核酸。75.构建体,其包含(i)编码如项63至65中定义的ARKL多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。76.根据项75的构建体,其中所述的控制序列之一是组成型启动子,优选地是 G0S2启动子,最优选地是来自稻的G0S2启动子。77.根据项75或76的构建体在用于制备植物的方法中的用途,所述植物相对于对 照植物具有增强的产量相关性状,优选提高的产量,更优选提高的种子产量。
78.用根据项75或76的构建体转化的植物、植物部分或植物细胞。79.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的 产量、特别地提高的种子产量,该方法包括(i)在植物中导入并表达编码如项63至65中定义的ARKL多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。80.转基因植物,其因编码如项63至65中所定义ARKL多肽的核酸的表达增加而 相对于对照植物具有提高的产量、特别地提高的种子产量,或从所述转基因植物衍生的转 基因植物细胞。81.根据项74、78或80的转基因植物或从其中衍生的转基因植物细胞,其中所述 的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、 高粱和燕麦。82.根据项81的植物的可收获部分,其中所述的可收获部分优选地是苗生物量和
/或种子。83.产物,从根据项81的植物和/或从根据项82的植物的可收获部分衍生。84.编码ARKL多肽的核酸在相对于对照植物增强产量相关性状、优选提高的产 量、更优选提高的种子产量中的用途。在一个实施方案中,本发明涉及如下概括的主题物85.用于相对于对照植物改善植物中产量相关性状的方法,包括调节植物中编码 YTP多肽的核酸表达,所述YTP多肽包含(i)至少一个跨膜结构域和(ii)DUF221结构域的至少一部分。86.根据项85的方法,其中所述的部分以增加的优选顺序与SEQ IDNO 518 至 SEQ ID NO 544 所代表的任一结构域具有至少 50%、55%、60%、65%、 70%,75%,80%,85%,90%,95%,96%,97%,98%,99%^; 100%序列同一性。87.根据项85或86的方法,其中所述的编码YTP多肽的核酸编码以增加的优选顺 序与表 A 的任一多肽具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、 96%、97%、98%、99%或100%氨基酸序列同一性的多肽。88.根据任一前述项的方法,其中所述的YTP多肽还包含基序9 (SEQID NO 545)。89.根据任一前述项的方法,其中所述受调节的表达通过在植物中导入并表达编 码YTP多肽的核酸实现。90.根据任一前述项的方法,其中所述的编码YTP多肽的核酸编码表A中所列的任 一种蛋白质或是这种核酸的一部分或是能够与这种核酸杂交的核酸。91.根据任一前述项的方法,其中所述核酸序列编码表A中给出的任意蛋白质的 直向同源物或旁系同源物或是这种核酸的一部分或是能够与这种核酸杂交的核酸。92.根据任一前述项的方法,其中所述的增强的产量相关性状包括相对于对照植 物提高的产量、优选提高的种子产量。93.根据项85至92任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。94.根据项89至93任一项的方法,其中所述的核酸有效连接至组成型启动子,优选地有效连接至G0S2启动子,最优选地有效连接至来自稻的G0S2启动子。95.根据任一前述项的方法,其中所述的编码YTP多肽的核酸是植物来源的,优选 地来自双子叶植物,进一步优选地来自禾本科,更优选地来自稻属,最优选地来自稻。96.通过根据任意前述项的方法可获得的植物或其部分,包括种子,其中所述的植 物或其部分包含编码YTP多肽的重组核酸。97.构建体,其包含:(i)编码如项85至88中定义的YTP多肽的核酸;(ii)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(iii)转录终止序列。98.根据项97的构建体,其中所述的控制序列之一是组成型启动子,优选地是 G0S2启动子,最优选地是来自稻的G0S2启动子。99.根据项97或98的构建体在用于制备植物的方法中的用途,所述植物相对于对 照植物具有提高的产量,特别地提高的种子产量。100.用根据项97或98的构建体转化的植物、植物部分或植物细胞。101.用于产生转基因植物的方法,所述的转基因植物相对于对照植物具有提高的 产量、特别地提高的种子产量,该方法包括(i)在植物中导入并表达编码如项85至88中定义的YTP多肽的核酸;和(ii)在促进植物生长和发育的条件下培育植物细胞。102.转基因植物,其因编码如项85至88中所定义YTP多肽的核酸的受调节表达 而相对于对照植物具有提高的产量、特别地提高的种子产量,或从所述转基因植物衍生的 转基因植物细胞。103.根据项96、100或102的转基因植物,或从其中衍生的转基因植物细胞,其中 所述的植物是作物植物或单子叶植物或禾谷植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑 麦、高粱和燕麦。104.根据项103的植物的可收获部分,其中所述的可收获部分优选地是苗生物量 和/或种子。105.产物,从根据项103的植物和/或从根据项104的植物的可收获部分衍生。106.编码YTP多肽的核酸在相对于对照植物提高植物中产量、特别地在提高种子 产量和/或苗生物量中的用途。附图简述本发明现在将参考以下图进行描述,其中图1代表如SEQ ID NO 2所代表的GRF多肽的卡通图,其中所述GRF多肽包含以 下特征⑴具有InterPro登录号IPR014978 (PFAM登录号PF08880)的QLQ结构域;(ii) 具有InterPro登录号IPR014977(PFAM登录号PF08879)的WRC结构域;和(iii)以保守间 隔(CX9CX1(1CX2H)包含3个Cys和一个His残基的位于WRC结构域内部的转录效应子(ET) 结构域。图2显示来自表A的GRF多肽的(对于SEQ ID NO :2,如SEQ ID NO 115所代表 的)QLQ结构域的(来自Invitrogen公司Vector NTI 10. 3的)AlignX多重序列比对结果。 保守QLQ氨基酸残基位于多重比对结果的顶部。(用黑色框框定的)两个另外的非常保守残基是 E(Glu)和 P(Pro)。图3显示来自表A的GRF多肽的(对于SEQ ID NO :2,如SEQ ID NO 116所代表 的)WRC结构域的(来自Invitrogen公司Vector NTI 10. 3的)AlignX多重序列比对结果。 在共有序列中以粗体标出保守的WRC氨基酸残基。在整个比对结果范围内用方框垂直地标 出并在比对结果的底部鉴定到命名为转录效应子(ET)结构域的保守间隔(CX9CX1(iCX2H)中 的3个Cys和1个His残基。用双下划线标出WRC结构域中所包含的推定的核定位信号 (NLS)。图4显示用于稻中增加在来自稻的G0S2启动子(pG0S2)控制下编码GRF多肽的 核酸序列表达的双元载体。图5详述了在实施本发明方法中有用的序列的例子。图6代表具有以粗体下划线标出的保守标签序列的稻RAA1样蛋白(SEQ ID NO 121)的序列。图7显示多种RAA1样蛋白的多重比对结果。NP_001046787对应于Q0E1D7, NP_001052368 对应于 Q0JEF5,AAR97604 对应于 Q6RIB0,NP_001042631 对应于 Q9LGE3, NP_001045304 对应于 Q8LR63,NP_974763 对应于 Q9LXB5,NP_197868 对应于 023624, NP_194866 对应于 Q5Q0B3,NP_001060595 对应于 Q8H475。图8显示RAA1样多肽的进化系统树(Ge等人,2004)。OsRAAl对应于SEQ ID NO 121。图9描述用于稻中增加在稻G0S2启动子(pG0S2)控制下编码RAA1样的核酸表达 的双元载体。图10详述在实施本发明方法中有用的诸序列的例子。图11给出在SEQ ID NO 169中存在的保守基序的概略图。亮氨酸丰富结构域用 下划线标出,保守基序5、6和7以粗体表示并且斜体字序列代表具有推定的蛋白激酶C磷 酸化位点的推定的N-糖基化位点。图12显示多种SYR蛋白的多重比对结果。星号表示相同的氨基酸残基,冒号代表 高度保守的替换并且点号代表保守性较小的替换。采用来自图11的信息,可以轻易地在其 他SYR蛋白中鉴定SEQ ID NO :171中的多个结构域和保守基序。图13显示用于在稻中转化并表达在稻G0S2启动子控制下的稻SYR核酸的双元载 体pG0S2::SYR。图14详述在实施本发明方法中有用或在分离此类序列中有用的诸序列的例子。 序列可以从公共EST汇编库以较低质量的测序结果产生。因而,可以预期少数核酸替换。5’ 和3,UTR也可以用于实施本发明的方法。SEQID N0 :193代表ARG0S蛋白序列(GenBank登 录号 AY305869)。图15代表SEQ ID NO 213的氨基酸序列。保守的结构域pfamB2828和 ZfC3H2C3(pfam00097)分别以粗体和加下划线的字符醒目标出。高度保守的基序8以下划 点线表示。将ARKL多肽中最高度保守的氨基酸残基框定。显示了保守的氨基金属配体位 置(编号)和与锌(Zn2+)配位的氨基酸对。图16代表所选ARKL多肽的多重比对结果。标出了共有序列中高度保守的氨基酸 残基。如此图中所示,ARKL多肽羧基端的序列比氨基端序列更为高度保守。
图17显示ARKL多肽的进化系统树,该进化系统树基于如SEQ ID NO :306_314、 316-318、322、323、402所代表的ARKL多肽中包含的RING指(pfam00097)结构域的比对结 果(SEQ ID N0:402 包含小鼠(Musmusculus)Akadia 多肽中存在的 pfam00097 (RING 锌指) 结构域并且SEQID NO 403代表如小鼠Goliath多肽中存在的pfam00097结构域。所用的缩 写:0s 禾S (Orysa) ;Hv 大麦(Horvu) ;Gm 大豆(Glyma) ;Zm 玉米(Zeama) ;Musmu 小鼠。图18描述用于增加在稻G0S2启动子(pG0S2)控制下如SEQ ID NO 212所代表的 0S_ARKL1核酸表达的双元载体。图19详述在实施本发明方法中有用的诸序列的例子。图20代表YTP1的序列(SEQ ID NO 409)。将跨膜结构域框出。具有124个氨基 酸残基的DUF221结构域的一部分以粗体醒目标出。基序8以下划线标出。基序8中的不 变残基以较大尺寸的字母标出。第一和第三环预测位于膜的外部;第二环位于内部。图21显示所选YTP多肽的进化系统树。图22代表所选YTP多肽的多重比对结果。给出了如SEQ ID NO 544所代表的共 有序列。标出了该共有序列中的保守氨基酸残基;空白代表低保守性的区域。图23代表了用于稻中增加在稻G0S2启动子(pG0S2)控制下编码YTP1的核酸表 达的双元载体。图24详述在实施本发明方法中有用的诸序列的例子。 实施例本发明现在参考如下实施例进行描述,所述实施例仅是示意性的。以下实施例不 意图完全限定或限制本发明的范围。DNA操作除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版 Cold Spring HarborLaboratory Press, CSH, New York)或 Ausubel 等人(1994), CurrentProtocols in Molecular Biology, Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料 和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和 Blackwell 科学出版社(Blackwell Scientific Publications)(英国)出版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。实施例1 鉴定与本发明方法中所用核酸序列相关的序列用数据库搜索工具如基本局部比对工具(BLAST) (Altschul等人(1990) J. Mol. Biol. 215 :403-410 ;和 Altschul 等人(1997)Nucleic Acids Res. 25 :3389_3402),在国家 生物技术信息中心(NCBI)的Entrez核苷酸数据库中维护的那些序列中鉴定到与本发明方 法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。使用该程序通过将核酸序列 或多肽序列与序列数据库比较并且计算匹配的统计显著性来找到序列之间的局部相似性 区域。由本发明核酸序列编码的多肽用于TBLASTN算法,采用默认设置和过滤程序以略去 低复杂性序列启动。该分析的输出结果通过逐对比较进行检验,并根据概率评分(E-值)进 行评级,其中所述的评分反映特定比对结果偶然发生的概率(E-值越低,命中的显著性越 高)。除E-值外,比较也可以通过同一性百分数评分。同一性百分数指两个所比较的核酸 (或多肽)序列之间特定长度范围内相同的核苷酸(或氨基酸)的数目。在一些情况下,可
72以调整默认参数以调节搜索的严格性。例如,可以提高E-值以显示严格性更低的匹配。以 这种方式,可以鉴定到短的近乎完全的匹配。表A提供了与本发明方法中所用核酸序列相关的核酸序列名单。表A1 :GRF多肽序列和编码性核酸序列的例子

表A2 :RAA1样多肽的例子
除了在NCBI可获得的公众可用核酸序列外,也按照如本文以上所述的相同方法 搜索专利序列数据库。表A3提供了与如SEQ ID NO 168所代表的核酸序列和由SEQ IDN0 169代表的蛋 白质序列相关的核酸序列和蛋白质序列名单。表A3 与本发明方法中有用的核酸序列(SEQ ID NO 168)相关的核酸序列和相应
的推导多肽。
表A4 :ARKL核酸和各自编码的多肽的例子。女 Orysa 禾酉;Zeama 玉米;Horvu 大麦;Lyces 番爺;Glyma 大豆;Zinel 百日 菊;Lotja 百脉根;Arath 拟南芥;Poptr 毛果杨;Medtr 蒺藜苜蓿。表A5提供了与本发明方法中所用核酸序列相关的核酸序列名单。表A5 :YTP核酸和多肽的例子

在一些情况下,相关序列已经由研究机构如基因组研究机构(TIGR)初步地汇编 并且公开披露。可以使用真核生物基因直向同源物(EGO)数据库来鉴定此类相关序列,这 可通过关键词搜索或通过使用BLAST算法以目的核酸序列或多肽序列进行。在其他情况 下,已经对特定生物创建了专用核酸序列数据库,如由联合基因组研究所(Joint Genome Institute)例如对杨(poplar)和Ostreococcus tauri创建的专用核酸序列数据库。实施例2 a) GRF多肽序列的比对使用(来自Invitrogen公司Vector NTI 10. 3的)AlignX算法进行表A中全部 GRF多肽序列的多重序列比对。在本申请的图2中显示来自表A的(如对SEQ ID N0 2的 SEQ ID NO :115所代表的)GRF多肽的QLQ结构域的比对结果。保守QLQ氨基酸残基位于 多重比对结果的顶部。(用黑色框框定的)两个另外的非常保守残基是E(Glu)和P(Pro)。 在本申请的图3中显示来自表A的(如对SEQ ID NO :2的SEQ ID NO 116所代表的)GRF 多肽的WRC结构域的比对结果。以粗体标出共有序列中保守的WRC氨基酸残基。在整个比 对结果范围内用方框垂直地标出并在比对结果的底部鉴定到命名为转录效应子(ET)结构 域的保守间隔(CX9CX1QCX2H)中的3个Cys和1个His残基。b)RAAl样多肽序列的比对使用来自Vector NTI (Invitrogen)的AlignX程序进行多肽序列的比对,其中所 述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997) Nucleic Acids Res 25 :4876-4882 ;Chenna 等人(2003),NucleicAcids Res 31 :3497_3500)。空位开口罚 分的默认值是10,空位延伸罚分是0. 1并且所选的权重矩阵是Blosum 62(若比对多肽)。 进行少许手工编辑以优化该比对。诸RAA1样多肽之间的序列保守性基本上遍及整个序列内,除所述蛋白质氨基半端中的Gly和/或Ser丰富区域之外。所述RAA1样多肽在图7中 比对。c)SYR多肽序列的比对AlignX(Vector NTI, Invitrogen)基于流行的累进比对 Clustal 算法(Thompson 等人(1997) Nucleic Acids Res 25 :4876_4882 ;Chenna 等人(2003) Nucleic Acids Res 31:3497-3500)。可以使用邻接聚类算法构建进化系统树。空位开口罚分的默认值是10, 空位延伸罚分是0. 1并且所选的权重矩阵是Blosum 62(若比对多肽)。在图12中显示了使用与鉴定在开展本发明方法中有用的多肽相关的多肽的多重 序列比对结果。可以在多种序列中轻易地区分亮氨酸丰富重复序列和保守基序。d) ARKL多肽序列的比对使用来自Vector NTI (Invitrogen)的AlignX程序进行多肽序列的比对,其中所 述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997) Nucleic Acids Res 25 :4876-4882 ;Chenna 等人(2003),NucleicAcids Res 31 :3497_3500)。空位开口罚 分的默认值是10,空位延伸罚分是0. 1并且所选的权重矩阵是Blosum 62(若比对多肽)。 可以进行少许手工编辑以优化该比对。诸ARKL多肽之间的序列保守性基本上存在于羧基 端沿着所述多肽的DAR1和RING-H2结构域内,氨基端结构域通常在序列长度和组成方面更 为多变。所述ARKL多肽在图16中比对。使用如Vector NTI (Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建 ARKL多肽的进化系统树(图17)。e)YTP多肽序列的比对使用来自Vector NTI (Invitrogen)的AlignX程序进行多肽序列的比对,其中所 述AlignX程序基于流行的累进比对Clustal W算法(Thompson等人(1997) Nucleic Acids Res 25 :4876-4882 ;Chenna 等人(2003),NucleicAcids Res 31 :3497_3500)。空位开口罚 分的默认值是10,空位延伸罚分是0. 1并且所选的权重矩阵是Blosum 62(若比对多肽)。 可以进行少许手工编辑以优化该比对。诸YTP多肽之间的序列保守性在所述多肽蛋白的羧 基端沿DUF221结构域中较高。氨基端结构域通常在序列长度和组成方面更为多变。所述 YTP多肽在图22中比对。标出了共有序列中高度保守的氨基酸残基(见图22)。使用如Vector NTI (Invitrogen)的AlignX程序中所提供的邻接法聚类算法构建 YTP多肽的进化系统树(图21)。如图21中所示,组1包含与SEQID N0 409(图21中的 YTP1)聚类的YTP多肽。实施例3 计算在实施本发明方法中有用的多肽序列之间的总体同一性百分数使用现有技术领域可获得的方法之一,即MatGAT(矩阵总体比对工具)软件(BMC Bioinformatics. 20034 29. MatGAT 使用蛋白质序列或DNA序列产生相似性/同一性矩 P车的一JSlSiM (an application that generatessimilarity/identity matrices using protein or DNA sequences), CampanellaJJ, Bitincka L, Smalley J 亥软件由 Ledion Bitincka维护)确定在实施本发明方法中有用的全长多肽序列之间的总体相似性和同一 性百分数。MatGAT软件对DNA序列或蛋白质序列产生相似性/同一性矩阵,无需预先比对 数据。该程序使用Myers和Miller总体比对算法(空位开口罚分12和空位延伸罚分2) 执行一系列配对比对,使用例如Blosum 62(对于多肽而言)计算相似性和同一性并且随后将结果置于距离矩阵中。在分割线下半部分显示序列相似性,并且在对角分割线的上半部 分显示序列同一性。比较中使用的参数是评分矩阵Blosum62第一空位12延伸空位2表B中显示在多肽序列的全长范围内总体相似性和同一性的软件分析结果(不包
括部分多肽序列)。
90与SEQ ID NO2 相比较,在实施本发明方法中有用的全长多肽序列之间的同一性百分数可以低至15%氨基酸同一性。
如果在SEQ ID NO :2的QLQ结构域(如由SEQ ID NO :2中包含的SEQ ID NO 115 所代表;图2中代表的表A的GRF多肽的QLQ结构域)与在实施本发明中有用的多肽的QLQ 结构域之间开展同一性计算,可能相当大程度地提高同一性百分数。类似地,如果在SEQ ID NO 2的WRC结构域(如由SEQ ID NO 2中包含的SEQ ID NO 116所代表;图3中代表的 表A的GRF多肽的WRC结构域)与在实施本发明中有用的多肽的WRC结构域之间开展同 一性计算,可能相当大程度地提高同一性百分数。在实施本发明中有用的多肽序列之间的 QLQ结构域范围内的同一性百分数范围是在25%和99%氨基酸同一性之间,并且在实施本 发明中有用的多肽序列之间的WRC结构域范围内的同一性百分数范围是在60%和99%氨 基酸同一性之间。这也可以在图3中观察到,不同GRF多肽之间WRC结构域比QLQ结构域 更保守,如图2中所示。QLQ结构域之间的氨基酸同一性百分数和WRC结构域之间的同一性百分数显著高 于全长GRF多肽序列之间所计算的氨基酸同一性百分数。在表B2中显示所述多肽序列的全长范围内总体相似性和同一性的与RAA1样多肽 相关的软件分析结果。在对角线上方给出相似性百分数而在对角线下方给出同一性百分数 (粗体字)。剔除Q9LXB6(SEQ ID NO 155)不考虑,与SEQ ID NO 121相比,在实施本发明方法 中有用的RAA1样多肽序列之间的同一性百分数可以低至31%氨基酸同一性。表B2 在多肽序列的全长范围内总体相似性和同一性的MatGAT结果。SEQ ID NO 121 由 Q9LGE3 代表。
95
与SECHDNO:169相比较,与实施本发明方法中有用的SYR多肽相关的多肽序列之间的同一性百分数可以 低至27% M酸同一性。
表B3 在SYR多肽序列的全长范围内总体相似性和同一性的MatGAT结果
与SEQ ID NO: 213 (Orysa_ARKL1)相比较’在实施本发明方法中有用的ARKL多肽序列之间的同一性百分数 可以低至10 % M酸同一性。
表B4:在ARKL多肽序列的全长范围内总体相似性和同一性的MatGAT结果 表B5-2显示与表B5-1中所用序列相对应的SEQ ID NO 。表5-2 :DUF221 结构域
实施例4 鉴定在实施本发明方法中有用的多肽序列中所包含的结构域蛋白质家族、结构域和位点的集成资源(InterPro)数据库是针对基于文本及基 于序列的搜索法的常用特征标识数据库的集成界面。InterPro数据库合并了这些数据库, 所述数据库使用不同的方法学及不同程度的有关充分表征的蛋白质的生物学信息以获得 蛋白质特征标识(proteinsignatures)。合作数据库包括 SWISS-PROT、PROSITE、TrEMBL、 PRINTS、ProDom和Pfam,Smart和TIGRFAM。Interpro由英国欧洲生物信息学研究所维护。在表C中呈现如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果。表C1 如SEQ ID NO 2所代表的多肽序列的InterPro扫描结果 在表C1中呈现如SEQ ID NO 213所代表的多肽序列的InterPro扫描结果。表C2-1 如SEQ ID NO 213所代表的多肽序列的InterPro扫描结果(主要登录
号) 在表C3-1 (受信任匹配)和表C2 (与Pfam-B的匹配)中呈现Pfam搜索如SEQ ID NO 409所代表多肽序列的结果。表C3-1 来自使用SEQ ID NO :409作为查询序列的Pfam搜索的受信任匹配。受 信任匹配具有比Pfam中特定结构域的收集临界阈值更高的收集临界阈值。DUF221是具有 登录号PF02714的Pfam-A结构域。 表C3-2 与 Pfam-B 的匹配 实施例5 在实施本发明方法中有用的多肽序列的亚细胞定位预测用于蛋白质定位的实验方法的范围从免疫定位至使用绿色荧光蛋白(GFP)或 葡糖醛酸酶(GUS)对蛋白质加标签。例如,使用与GUS报道基因融合的GRF多肽来瞬时
地转化洋葱上皮细胞(van der Knapp等人(2000) Plant Phys 122 :695_704)。将细胞核鉴 定为GRF多肽的亚细胞区室。鉴定GRF多肽的亚细胞区室化的此类方法是本领域熟知的。通过多重序列比对、随后通过目视检查在表A的GRF多肽的WRC结构域 (CRRTDGKKWRC)中找到预测的核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的 一个或多个短序列。从序列数据进行蛋白质定位的计算预测。在本领域技术人员熟知的算法当中,例 如 PSort、TargetP、ChloroP、LocTree、Predotar、LipoP、MIT0PR0T、PATS、PTS1、SignalP 等 可在瑞士生物信息研究所维护的ExPASy蛋白质组工具处获得。LOCtree是可以预测非植物和植物真核生物以及原核生物中非膜蛋白的亚细胞定 位和DNA-结合倾向的算法。LOCtree将真核动物蛋白划分成5个亚细胞类别之一,而将植 物蛋白划分成6个亚细胞类别之一,并且原核蛋白质划分成3个亚细胞类别之一。下文表D显示使用SEQ ID NO 2的多肽序列信息的LOCtree输出结果。高置信度 预测具有大于5的可靠性指数值。表D使用SEQ ID NO 2的多肽序列信息的LOCtree输出结果。 使用LOCTree算法,如SEQ ID NO 2所代表的GRF多肽的预测亚细胞区室是细胞核。实施例6 与实施本发明方法中有用的多肽序列相关的测定法
在本发明方法中有用的GRF多肽(至少以它们的天然形式)一般,但并非必需具 有转录调节活性和与其他蛋白质相互作用的能力。可以使用本领域熟知的技术(例如在 Current Protocols in Molecular Biology,第 1 禾口 2 卷,Ausubel 等人(1994), Current Protocols中)轻易地在体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。GRF 多肽能够在酵母细胞中转录地激活报道基因(Kim和Kende(2004)Proc Natl Acad Sci 101 (36) 13374-13379)。使用酵母双杂交蛋白质-蛋白质相互作用测定法,GRF多肽也能 够在酵母细胞中与GRF相互作用因子多肽(GIF1至GIF3;又叫做SYT1至SYT3)在体内相 互作用(上文的Kim和Kende)。体外结合测定法也用来显示GRF多肽和GIF (也称作SYT) 多肽是相互作用的配偶物(上文的Kim和Kende)。在该出版物中描述的实验用于表征GRF 多肽并且是本领域熟知的。实施例7 在实施本发明方法中有用的多肽序列的拓扑结构预测TargetP 1. 1预测真核蛋白的亚细胞定位。基于任何氨基端前序列叶绿体转运 肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)的预测存在性进行定位指派。作为最 终预测基础的评分并不真正是概率,并且它们不是必需地加合成一体。然而,根据TargetP, 具有最高评分的定位是最可能的,并且评分之间的关系(可靠性级别)可以指示该预测具 有多大确定性。可靠性级别(RC)范围从1至5,其中1表示最可靠的预测。TargetP在丹 麦技术大学(Technical University of Denmark)的服务器上维护。对于预测含有氨基端前序列的序列而言,也可以预测潜在的切割位点。可以选择许多参数,如生物组别(非植物或植物)、临界值集合(无、预定义的临界 值集合或用户指定的临界值集合)和切割位点预测的计算(是或否)。在表E1中呈现如SEQ ID NO 121所代表的多肽序列的TargetP 1. 1分析的结果。 选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO 121所代表的多肽序列的亚细胞定位有可能是细胞质,没有预测到转运肽(SignalP)或核 定位信号(PredictNLS)。表El 如SEQ ID NO 121所代表的多肽序列的TargetP 1. 1分析 许多其他算法可以用来进行此类分析,包括 在丹麦技术大学服务器上维护的ChloroP 1. 1 ; 在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1. 2版; 在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分 析专家 PA-G0SUB 2. 5 ; 在丹麦技术大学服务器上维护的TMHMM。在表E2中呈现如SEQ ID NO :169所代表的多肽序列的TargetP 1.1分析的结果。 选择“植物”生物组别,未定义临界值,并且对转运肽的预测长度提出要求。如SEQ ID NO 169所代表的多肽序列的亚细胞定位可以是线粒体;然而,应当指出可靠性级别是5(S卩,最 低的可靠性级别)。表E2 如SEQ ID NO 169所代表的多肽序列的TargetP 1. 1分析结果 通过在丹麦技术大学生物序列分析中心服务器上维护的TMHMM程序鉴定到两个 跨膜结构域。氨基端位于内部的概率是0.997。在表F中给出关于定向的进一步细节表F TMHMM 2. 0 的结果 许多其他算法可以用来进行此类分析,包括在丹麦技术大学服务器上维护的ChloroP 1. 1 ;在澳大利亚布里斯班昆士兰大学生物科学研究所的服务器上维护的Protein Prowler亚细胞定位预测者1. 2版;在加拿大阿伯特省埃德蒙顿市阿尔伯塔大学的服务器上维护的PENCE蛋白组分 析专家 PA-G0SUB 2. 5 ;实施例8 :ARKL多肽的功能测定法遍在蛋白化测定法基本上如Stone等人2005年所述实施。GST标记的ARKL蛋白 质在30°C和pH 7. 5与酵母El、纯化的E2At UBCC8和遍在蛋白(Sigma)孵育。将反应终止 并通过SDS-PAGE电泳、随后通过使用遍在蛋白抗体的蛋白质印迹法分析。通过TPEN处理的珠结合GST-ARKL蛋白与ZnCl2孵育进行锌螯合实验。实施例9 在实施本发明方法中有用的多肽序列的跨膜拓扑结构预测使用TMHMM V 2. 0 算法(Krogh 等人 2001J Mol Biol,305,567-580)来预测 SEQ ID NO 409中的跨膜螺旋。如下文所示,存在4个预测的跨膜螺旋。还显示了所述螺旋的氨基酸残基位置。至 于预测跨膜螺旋之间的环,对于残基28-85与172-373之间的环而言位于膜的内侧并且对 于残基109-151之间的环而言位于膜的外侧。#预测的TMH的序列数4
#TMH中氨基酸的序列Exp数89.26923
#序列Exp数,头60个氨基酸22. 14249
#氨基端在内部的序列总概率0.04519
#序列可能的N端信号序列
起lh终lh (氨基酸华标)
实施例10 a)克隆如SEQ ID NO :1所代表的核酸序列除非另外说明,重组DNA 技术根据(Sambrook(2001)MolecularCloning :a laboratory manual,第 3 版 Cold Spring Harbor LaboratoryPress, CSH, New York)或在 Ausubel 等人(1994), Current Protocols inMolecular Biology, Current Protocols 第 1 卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料和方法在BIOS科学 出版有限责任公司(BIOS Scientific Publications Ltd(英国))和Blackwell科学出版 社(Blackwell Scientific Publications (英国))出版的 R. D. D. Croy 的 PlantMolecular Biology Labfax(1993)中描述。使用从mRNA合成的拟南芥cDNA库作为模板,通过PCR扩增编码如SEQ ID NO 2 所代表的GRF多肽序列的拟南芥cDNA,其中所述mRNA从混合的植物组织提取。包括用于 Gateway重组的AttB位点的以下引物用于PCR扩增l)Prm 10010 (SEQ ID NO: 118,有义)5’ -GGGGACAAGTTTGTACAAAAAAGCAGGCTTAAACAATGATGAGTCTAAGTGGAAGTAG-3’2)Prm 10011 (SEQ ID NO 119,反向,互补)5’ -GGGGACCACTTTGTACAAGAAAGCTGGGTAGCTCTACTTAATTAGCTACCAG-3’使用Hifi Taq聚合酶在标准条件进行PCR。也使用标准方法扩增并纯化具有预期 长度的PCR片段(包括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在此 期间,所述PCR片段与pD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆 (entry clone) ”。质粒 pD0NR201 作为Gateway 技术的部分从 Invitrogen 购买。b)在本发明方法中使用的编码RAA1样多肽的核酸序列的克隆使用定制的稻幼苗cDNA 文库(在 pCMV Sport 6. 0 内;Invitrogen, Paisley, UK) 作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合酶,在标 准条件下利用在50 u 1 PCR混合物中的200ng模板进行PCR。所用的引物是prm09129 (SEQ ID NO 122 ;有义,起始密码子为粗体字)5' ggggacaagtttgtacaaaaaagcaggcttaaacaatg tcaggggtttgggtg 3'和prm09988 (SEQ ID NO 123 ;反义,互补)
5‘ ggggaccactttgtacaagaaagctgggttgtcgcataggtcaatttagg 3',其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增 的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”,pRAAl样。质粒 PD0NR201作为Gateway 技术的部分从Invitrogen购买。c)编码SYR多肽的核酸序列的基因克隆DNA操作除非另外说明,重组DNA技术根据(Sambrook(2001)Molecular Cloning :a laboratory manual,第 3 版,Cold Spring HarborLaboratory Press, CSH, New York)或 Ausubel 等人(1994), CurrentProtocols in Molecular Biology, Current Protocols第1卷和第2卷中描述的标准方案进行。用于植物分子研究工作的标准材料 和方法在BIOS科学出版有限责任公司(BIOS Scientific Publications Ltd(英国))和 Blackwell 科学出版社(Blackwell Scientific Publications (英国))出版的 R. D. D. Croy 的 Plant Molecular Biology Labfax (1993)中描述。使用稻幼苗cDNA文库(Invitrogen,Paisley,UK)作为模板,通过PCR扩增稻SYR 基因。在逆转录从幼苗提取的RNA后,将cDNA克隆入pCMVSport 6. 0。该库的平均插入物 大小是1.5kb并且原始克隆数目是1.59X107cfu数量级。^ 6xlOncfu/ml的首轮扩增后, 确定原始滴度是9.6xl05cfu/ml。提取质粒后,在50 ill PCR混合物中使用200ng模板。引 物prm08170(SEQ ID NO 170 ;有义,起始密码子为粗体,AttBl位点为斜体5 ‘ - ggggacaagtttgtacaaaaaagcaggcttaaacaa.t.g gaaggtgtaggtgctagg-3‘)和prm08171 (SEQ ID NO 171 ;反义,AttBl 位点为斜体 5' -ggggaccactttgtacaagaaagctgggtc
aaaaacaaaaataaattcccc—3 ),用于PCR扩增,其中所述引物包括用于Gateway重组的AttB位点。使用Hifi Taq 聚合酶在标准条件进行PCR。也使用标准方法扩增并纯化具有正确大小的PCR片段(包 括attB位点)。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”,pSYR。质粒pD0NR201 作为Gateway 技术的部分从Invitrogen购买。d)在本发明方法中使用的编码ARKL样多肽的核酸序列的克隆使用定制的稻幼苗和穗cDNA 文库(在 pCMV Sport 6. 0 内;Invitrogen, Paisley, UK)作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合 酶,在标准条件下利用在50 yl PCR混合物中的200ng模板进行PCR。所用的引物是prm 04873 (SEQ ID NO :404 ;有义,起始密码子为粗体字)5,-ggggacaagtttgtacaaaaaagcaggcttaaacaatggatgatcacatgggaaga-3,和prm04874 (SEQ ID NO 405 ;反义,互补)5' -ggggaccactttgtacaagaaagctgggttttggtttctgaagaagcacc-3',其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增 的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”,pARKL。质粒pD0NR201作为Gateway 技术的部分从Invitrogen购买。e)在本发明方法中使用的编码YTP多肽的核酸的克隆使用定制的稻幼苗cDNA 文库(在 pCMV Sport 6. 0 内;Invitrogen, Paisley, UK) 作为模板通过PCR扩增在本发明方法中使用的核酸序列。使用Hifi Taq DNA聚合酶,在标 准条件下利用在50 ill PCR混合物中的200ng模板进行PCR。所用的引物是(SEQ ID NO 546 ;有义,起始密码子为粗体字)5,-ggggacaagtttgtacaaaaaagcaggcttaaacaatggacaccgcgtcgt-3,和(SEQID NO: 547;反义,互补)5,_gggg&cc&ctttgt&c&&g&&&gctgggtc&gc&cttgc&tt&g&tgg&t_3,,其中所述引物包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增 的PCR片段。随后进行Gateway方法的第一步骤,即BP反应,在此期间所述PCR片段与 PD0NR201质粒在体内重组以产生根据Gateway术语学的“进入克隆”,pENTR-YTPl。质粒 PD0NR201作为Gateway 技术的部分从Invitrogen购买。实施例11 a)使用如SEQ ID NO 1所代表的核酸序列的表达载体构建包含SEQ ID NO 1的进入克隆随后在LR反应中与用于稻转化法的目的载体一起 使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克 隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于 组成型表达的稻G0S2启动子(SEQ ID NO 117)位于该Gateway盒上游。在LR重组步骤后,所得表达载体pG0S2::GRF (图4)根据本领域熟知的方法转化 至农杆菌菌株LBA4044中。b)使用如SEQ ID NO 120所代表的核酸序列的表达载体构建包含SEQ ID NO 120的进入克隆随后在LR反应中与用于稻转化的目的载体一起 使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克 隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于 组成型表达的稻G0S2启动子(SEQ ID NO 124)位于该Gateway盒上游。在备选的实施方 案中,用于组成型表达的稻HMGP启动子(SEQ ID NO 125)位于该Gateway盒上游。在LR重组步骤后,所得表达载体pG0S2: :RAA1样(图9)或pHMGP: :RAA1样根据 本领域熟知的方法转化至农杆菌菌株LBA4044中。c)使用编码SYR多肽的核酸序列的表达载体构建进入克隆pSYR随后在LR反应中与用于稻转化的目的地载体一起使用。这种载体 含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克隆在该进入克隆 中的目的序列发生LR体内重组的Gateway盒作为功能性元件。用于组成型表达的稻G0S2 启动子(SEQ IDN0:211)位于该Gateway盒上游。制备了相似的载体构建体,不过是用高速 泳动族蛋白启动子(HMGP,SEQ ID NO 200或SEQ ID NO :210),而不是用G0S启动子。在LR重组步骤后,将所得表达载体pG0S2: :SYR(带G0S2启动子)和 pHMGP::SYR(带HMGP启动子)(二者均用于SYR组成型表达)(图13)转化到农杆菌菌株 LBA4044中并且随后转化至稻植物。d)使用如SEQ ID NO 212所代表的核酸序列的表达载体构建
包含SEQ ID NO 212的进入克隆随后在LR反应中与用于稻转化的目的载体一起 使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克 隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于 根特异性表达的稻G0S2启动子(SEQ ID NO 406)位于该Gateway盒上游。在LR重组步骤后,所得表达载体pG0S2::ARKL(图18)根据本领域熟知的方法转 化至农杆菌菌株LBA4044中。e)使用如SEQ ID NO 408所代表的核酸序列的表达载体构建包含SEQ ID NO 408的进入克隆随后在LR反应中与用于稻转化的目的载体一起 使用。这种载体含有在T-DNA边界内部的植物选择标记、筛选标记表达盒和意图与已经克 隆在该进入克隆中的目的核酸序列发生LR体内重组的Gateway盒作为功能性元件。用于 根特异性表达的稻G0S2启动子(SEQ ID NO 548)位于该Gateway盒上游。在LR重组步骤后,所得表达载体pG0S2: YTP1 (图23)根据本领域熟知的方法转 化至农杆菌菌株LBA4044中。实施例12 植物转化稻转化使用含有所述表达载体的农杆菌来转化稻植物。将粳稻栽培品种日本晴 (Nipponbare)的成熟干燥种子脱壳。通过如下方式实施消毒在70%乙醇中孵育1分钟, 随后在0. 2% HgCl2中孵育30分钟,随后用无菌蒸馏水洗涤6次15分钟。无菌的种子随后 在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育4周后,将胚发生 的盾片衍生的愈伤组织切下并在相同的培养基上增殖。2周后,将所述愈伤组织通过在同一 种培养基上传代培养另外2周进行繁殖或增殖。胚发生的愈伤组织片在新鲜培养基上传代 培养3日,随后共培育(以助长细胞分裂活性)。将含有每一单个表达载体的农杆菌菌株LBA4404独立地用于共培育。农杆菌接种 在含有适宜抗生素的AB培养基上并在28°C培养3日。随后收集细菌并在液体共培育培养 基中悬浮至密度(0D_)约1。该混悬液随后转移至培养皿内并将所述愈伤组织浸入此混悬 液中15分钟。将所述愈伤组织随后在滤纸上蘸干并转移至固化的共培育培养基,并在25°C 于黑暗中孵育3日。共培育的愈伤组织在含2,4-D的培养基上在28°C于黑暗中在选择剂存 在下培育4周。在此期间,迅速生长的抗性愈伤组织团发育。在转移这种材料至再生培养 基并在光照下孵育后,释放了胚发生潜能并且苗在随后4至5周内发育。将苗从愈伤组织 切下并且在含有植物生长素的培养基上孵育2至3周,将苗从所述培养基转移至土壤。硬 化的苗在温室中于高湿度和短日照下培育。对于每一个构建体,产生大约35个独立的T0稻转化体。将原代转化体从组织培 养箱转移至温室。在定量PCR分析验证T-DNA插入物的拷贝数后,仅保留显示所述选择剂 抗性的单拷贝转基因植物用于收获T1种子。种子随后在移栽后3至5个月收获。该方法 以超过50%的比例产生单基因座转化体(Aldemita和Hodgesl996,Chan等1993,Hiei等 1994)。实施例13 表型评价方法13. 1-1评价建立概述产生大约35个独立的T0稻转化体。将原代转化体从组织培养室转移至温室以培育并收获T1种子。留下6个事件,其中所述事件的T1子代以3 1比例对所述转基因的 存在/不存在分离。对于这些事件中的每个事件,通过监测目视标记表达选出大约10株含 有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗(失效合 子)。以随机位置并排生长转基因植物和相应的失效合子。温室条件是短日照(12小时光 照),在光照下28°C和在黑暗中22°C,和70%相对湿度。13. 1-2对于用稻G0S2启动子或HMGP启动子控制下的SYR所转化的植物的评价建产生大约15至20个独立TO稻转化体。将原代转化体从组织培养室转移至温室 以培育并收获T1种子。留下下述8个事件,其中所述事件的T1子代对所述转基因的存在 /不存在以3 1比例分离。对于这些事件中的每个事件,通过监测目视标记表达选出大 约10株含有该转基因的T1籽苗(杂合子和纯合子)和大约10株缺少该转基因的T1籽苗 (失效合子)。将选择的T1植物转移至温室。每株植物接受唯一条码标签以将表型分型数 据无误地关联至相应植物。在直径10cm花钵的土壤中在以下的环境设置中培育选择的T1 植物光周期=11. 5小时,昼间光强度=30,000勒克斯或更大,昼间温度=28°C或更高, 夜间温度=22°C,相对湿度=60-70%。总体建立植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同 角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。4个T1事件在T2世代中按照如对T1世代相同的评价方法进一步评估,但是每个 事件采用更多个体。植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至 少6个不同角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。13. 2统计分析F-检验使用两因素AN0VA(变量分析)作为总体评价植物表型特征的统计模型。对于用 本发明基因转化的全部事件的全部植物的全部所测量参数实施F检验。实施F检验以检查 该基因对全部转化事件的影响并验证该基因的整体作用(又称作基因总体作用)。真实基 因总体作用显著性的阈值对于所述F检验设置在5%概率水平上。显著性F检验值指出基 因作用,这意味不仅仅是基因的存在或位置才造成表型上的差异。因为实施了具有重叠事件的两个实验,故进行联合分析。这用于检验对这两个实 验影响的一致性,并且如果一致,则用于积累来自两个实验的证据以提高结论的可信度。所 用的方法是考虑数据的多重水平结构的混合模型法(即实验_事件_分离子)。通过比较 似然比检验与卡方分布(chi squaredistribution)获得P_值。因为实施了具有重叠事件的两个实验,故进行联合分析。这用于检验对这两个实 验影响的一致性,并且如果一致,则用于积累来自两个实验的证据以提高结论的可信度。所 用的方法是考虑数据的多重水平结构的混合模型法(即实验_事件_分离子)。通过比较 似然比检验与卡方分布获得P-值。13. 3测量的参数生物量相关的参数测量(一般方法)植物从播种期至成熟期数次通过数字成像室。在每个时间点上,从至少6个不同 角度拍摄每株植物的数字图像(2048X 1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数来自植物地上部分的数字图像上与背 景区别的像素总数而确定。这个值对相同时间点上从不同角度拍摄的画面进行平均化并且 通过校正转化成以平方mm表述的物理表面值(physical surface value) 0实验显示以这 种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已 经达到其最大叶生物量的时间点上所测量的面积。早期生长势是萌发后3周的植物(籽 苗)地上部分面积。根生物量的增加表述为总根生物量增加(测量为植物寿命期间所观察 到的根最大生物量);或表述为根苗指数增加(测量为根和苗的活跃生长时间中根质量与 苗质量之间的比例)。早期生长势通过计数来自植物部分的与背景区别的像素总数确定。这个值对相同 时间点上从不同角度拍摄的画面进行平均化并且通过校正转化成以平方mm表述的物理表 面值。下述结果针对萌发后3周的植物。种子相关的参数测量(一般方法)将成熟的原发花序收获、计数、装袋、加条形码标记并且随后在干燥箱内于37°干 燥3日。随后将所述花序脱粒,并且收集和计数全部种子。使用吹气装置将充实粒与空粒 分开。弃去空粒并且再次计数剩余部分。充实粒在分析天平上称重。充实种子数通过计数 分离步骤后仍留下的充实粒的数目确定。每株植物的种子总产量通过称量从一株植物收获 的全部充实粒而测量。每株植物的种子总数通过计数从一株植物收获的壳数测量。千粒核 重(TKW)从计数的充实种子数及它们的总重量外推出来。收获指数(HI)在本发明中定义 为每株植物种子总产量与地上部分面积(mm2)之间的比率,乘以系数106。如本发明中定义 的每花序总花数是种子总数与成熟原发花序数之间的比率。如本发明中定义的种子充实率 是充实种子数对种子(或小花)总数的比例(表述为% )。氮利用效率筛选(对于用SYR转化的植物)来自T2种子的稻植物在盆栽土壤中于正常条件下培育,除了营养液之外。从移植 至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液浇灌所述花 钵。栽培的剩余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物相同。如对 正常条件下详述那样记录生长和产量参数。干旱胁迫筛选(对于用SYR转化的植物)在盆栽土壤中在正常条件下培育来自Tl、T2或其他世代的稻植物直至它们达到 抽穗期。随后将它们转移至灌溉减少的“干燥”区。将湿度探测器插入随机选择的花钵内, 以监测土壤水含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续再灌溉直至 再次达到正常水平。随后将植物再次转移至正常条件。栽培的剩余部分(植物成熟、种子 收获)与不在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产 量参数。施加的干旱条件是如上文定义的“严重干旱条件”。实施例14 表型评价表达编码如SEQ ID NO 2所代表GRF多肽的核酸序列的转基 因稻植物的结果下文呈现了评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表 达的G0S2启动子控制下表达编码如SEQ ID NO :2所代表的GRF多肽的核酸序列并且在正 常生长下培育。如表G中所示,与相应的失效合子(对照)相比,在转基因植物的早期生长势、地上部分生物量、每株植物总种子产量、种子充实率、收获指数和千粒核重(TKW)方面存在显
者提尚。表G:评价转基因稻植物的结果,其中所述的转基因稻植物在用于组成型表达的 G0S2启动子控制下表达编码如SEQ ID NO :2所代表的GRF多肽的核酸序列。 实施例15 a)表型评价表达编码其他GRF多肽的核酸序列的转基因稻植物的结果产生了转基因稻植物,如下文表H中所示,所述转基因稻植物独立地在用于组成 型表达的G0S2启动子控制下表达编码其他GRF多肽的核酸序列。对于这三种构建体,与相应的失效合子(对照)相比,在转基因植物的种子千粒核 重(TKW)方面存在提高。这种提高比表达编码如SEQ ID NO :2所代表GRF多肽的核酸序列 的转基因植物的种子较不明显。表H 转基因稻植物中在用于组成型表达的G0S2启动子控制下所测试的其他GRF 核酸和多肽序列 b)表型评价表达RAA1样核酸的转基因植物的结果评价非胁迫条件下在组成型启动子(无论是G0S2或HMGP)控制下表达RAA1样核 酸的转基因稻植物的结果如下观察到千粒核重提高至少2%,并且观察到至少一种以下 参数苗根指数、总根生物量、每花穗花数提高多于5%。还在降低的氮可利用性条件下,观 察到根生物量、高度和绿度指数之一项或多项提高。
cl)测量在缺氮条件下生长的PG0S2: :SYR转化体的产量相关参数当分析如上文所述的种子时,本发明人发现用pG0S2: :SYR基因构建体转化并在 缺氮胁迫下生长的植物与缺少SYR转基因的植物相比具有更高的表现为充实种子数(提高 多于5%)、总种子重量(提高多于5%)和TKW(提高多于2. 5%)的种子产量。也观察到 苗生物量(多于5% )和根生物量(几个品系多于5% )的提高。c2)测量在严重干旱条件下生长的PG0S2 SYR转化体的产量相关参数当分析如上文所述的种子时,本发明人发现用pG0S2: :SYR基因构建体转化并在 严重干旱条件下生长的植物与缺少SYR转基因的植物相比具有更高的表现为总种子重量 (提高多于5% )、充实率(提高多于5% )和收获指数(提高多于5% )的种子产量。d)表型评价表达Orysa_ARKLl核酸的转基因植物的结果下文呈现了评价在非胁迫条件下表达OrySa_ARKLl核酸的转基因稻植物的结果。 观察到出苗生长势(早期生长势)、总种子产量、充实种子数和收获指数提高至少5 %,并且 观察到千粒核重提高3%。表I.表型评价结果。 也在如上文所述的干旱胁迫条件下评价表达Orysa ARKL1核酸的转基因稻植物。 与相应的对照相比,转基因植物中相同参数(种子产量、充实种子数、早期生长势和收获指 数)也提高,尽管以较低的程度提高。e)表型评价表达YTP1核酸的转基因植物的结果下文呈现了评价在非胁迫条件下表达YTP1核酸的转基因稻植物的结果。观察到 总种子产量、种子充实率、每穗花数、收获指数提高至少5%,并且千粒核重提高2%。下文呈现了评价在非胁迫条件下表达YTP1核酸的转基因稻植物的结果。观察到 总种子重量、充实种子数、充实率、收获指数和千粒核重提高(表J)。表J.表型评价结果。
实施例16 其他作物转化的例子谷物转化玉米(Zeamays)的转化用 Ishida 等人(1"6) Nature Biotech 14(6) 745-50 所述方法的改良形式进行。在谷物中,转化是基因型依赖的并且仅特定基因型适合于转化 和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂交体是用于转化的供体材 料的良好来源,不过其他基因型也可以成功地使用。谷穗从授粉后大约11日(DAP)的谷物 植物收获,此时不成熟的胚的长度是大约1至1. 2mm。不成熟的胚与含有表达载体的根癌农 杆菌共培育,并且转基因植物通过器官发生过程回收。将切下的胚在愈伤组织诱导培养基 上、随后在玉米再生培养基上培育,其中所述的培养基含有选择剂(例如咪唑啉酮,不过可 以使用不同的选择标记)。培养板在25°C于光照下孵育2-3周,或直至苗发育。将来自每 个胚的绿色苗转移至玉米生根培养基并在25°C孵育2-3周,直至根发育。将生根的苗移植 至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产 生。小麦转化用Ishida 等人(1996)Nature Biotech 14(6) :745_50 描述的方法进行小麦的转 化。栽培品种Bobwhite (可从墨西哥CIMMYT获得)通常用于转化。将不成熟的胚与含有 表达载体的根癌农杆菌共培育,并且通过器官发生过程回收转基因植物。与农杆菌孵育后, 将所述胚在愈伤组织诱导培养基上、随后于再生培养基上体外培育,其中所述的培养基含 有选择剂(例如咪唑啉酮,不过可以使用不同的选择标记)。培养板在25°C于光照下孵育 2-3周,或直至苗发育。将来自每个胚的绿色苗转移至生根培养基并在25°C孵育2-3周,直 至根发育。将生根的苗移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷 贝T-DNA插入物的植物产生。大豆转化根据Texas A&M美国专利5,164,310中描述的改良方法转化大豆。几个商业大豆 品种适合通过这种方法转化。栽培品种Jack(从Illinois种子基金会可获得)通常用于 转化。将大豆种子消毒用于体外播种。从7日龄的年幼籽苗切除下胚轴、胚根和一片子叶。 进一步培育上胚轴和剩余的子叶以发育腋生结节。切下这些腋生结节并与含有表达载体的 根癌农杆菌孵育。在共培育处理之后,洗涤外植体并转移至选择培养基。切下再生的苗并 置于苗伸长培养基上。将长度不超过lcm的苗置于生根培养基上直至根发育。将生根的苗 移植至温室中的土壤内。T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物 产生。
油菜籽/卡诺拉油菜转化使用5-6日龄的年幼籽苗的子叶柄和下胚轴作为组织培养用外植体并且根据 Babic等人(1998,Plant Cell Rep 17 :183_188)进行转化。商业品种Westar(Agriculture Canada)是用于转化的标准品种,不过也可以使用其他品种。将卡诺拉油菜种子作表面消毒 用于体外播种。从所述体外籽苗切下带有子叶的子叶柄外植体,并且通过将该叶柄外植体 的切口末端浸入细菌悬液用(含有表达载体的)农杆菌接种。所述外植体随后在23°C,16 小时光照下于含有3mg/l BAP、3%蔗糖、0. 7%植物琼脂的MSBAP-3培养基上培养2日。与 农杆菌共培育2日后,将所述叶柄外植体转移至含有3mg/lBAP、头孢噻肟、羧苄青霉素或特 美汀(300mg/l)的MSBAP-3培养基上培养7日,并且随后在含有头孢噻肟、羧苄青霉素或特 美汀和选择剂的MSBAP-3培养基上培养,直至苗再生。当苗的长度是5-10mm时,切下这些 苗并且转移至苗伸长培养基(MSBAP-0. 5,含有0. 5mg/l BAP)。将长度大约2cm的苗转移至 用于根诱导的生根培养基(MS0)。将生根的苗移植至温室中的土壤内。T1种子从显示选择 剂耐受性并且含有单拷贝T-DNA插入物的植物产生。苜蓿转化使用(McKersie等,1999 Plant Physiol 119:839-847)的方法转化苜蓿的再生 性克隆。苜蓿的再生和转化是基因型依赖性的并且因而需要再生性植物。已经描述了获得 再生性植物的方法。例如,这些再生性植物可以选自栽培品种Range lander (Agriculture Canada)或如Brown DCW禾口AAtanassov(1985. Plant Cell Tissue Culture 4:111—112)所 述的任何其他商业苜蓿品种。备选地,已经选择RA3品种(威斯康星大学)用于组织培养 (Walker等,1978Am J Bot 65 :654_659)。叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90 (McKersie 等,1999Plant Physiol 119 :839_847)或 LBA4404 的过夜培养物共培育。 所述外植体在黑暗中于含有288mg/LPro、53mg/L硫代脯氨酸、4. 35g/L K2S04和100 y m乙 酰丁香酮的SH诱导培养基上共培育3日。所述外植体在半浓度的Murashige-Skoog培 养基(Murashige和Skoog,1962)中洗涤并铺种在不含乙酰丁香酮而含有合适选择剂和 抑止农杆菌生长的合适抗生素的同一种SH诱导培养基上。几周后,将体细胞胚转移至 不含生长调节剂、不含抗生素和含有50g/L蔗糖的B0i2Y发育培养基。随后在半浓度的 Murashige-Skoog培养基上萌发体细胞胚。将生根的籽苗移植至花钵内并且在温室中培育。 T1种子从显示选择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。棉属植物转化使用根癌农杆菌,在下胚轴外植体上进行棉花转化。商业品种如Cokerl30或 Coker 312(SeedCo, Lubbock, TX)是用于转化的标准品种,不过也可以使用其他品种。将 种子进行表面消毒并在黑暗中萌发。将下胚轴外植体从萌发的籽苗切下呈约1-1. 5厘 米长。该下胚轴外植体浸没在含有所述表达载体的根癌农杆菌接种物中5分钟,随后在 MS+1. 8mg/l KN03+2%葡萄糖上在24°C于黑暗中共培育约48小时。将所述外植体转移至含 有适宜的细菌选择标记和植物选择标记的相同培养基(更换数次),直至见到胚发生的愈 伤组织。将所述愈伤组织分开并传代培养直至体细胞胚出现。从体细胞胚衍生的小植物在 生根培养基上成熟直至根发育。将生根的苗移植至温室中的盆栽土壤内。T1种子从显示选 择剂耐受性并且含有单拷贝T-DNA插入物的植物产生。实施例17 非生物胁迫筛选的例子
123
干旱筛选来自所选数目事件的植物在盆栽土壤中在正常条件下培育直至它们达到抽穗期。 随后将它们转移至灌溉减少的“干燥”区。将湿度探测器插入随机选择的花钵内,以监测土 壤水含量(SWC)。当SWC下降低于某个阈值时,自动地对所述植物连续地再灌溉直至再次达 到正常水平。随后将植物转移至正常条件。栽培的剩余部分(植物成熟、种子收获)与不 在非生物胁迫条件下培育的植物相同。如对正常条件下详述那样记录生长和产量参数。盐胁迫筛选植物在由椰子纤维和argeX(3 1比率)组成的基质上培育。在温室中移植小植 物后,在头两周期间使用正常营养液。在这两周后,添加25mM盐(NaCl)至所述营养液,直 至收获植物。如对正常条件下详述那样记录生长和产量参数。降低的营养(氮)可利用性筛选在除营养液之外的正常条件下在盆栽土壤中培育来自6个事件(T2种子)的植 物。从移植至成熟期间用含有降低的、通常7至8倍之间更少的氮(N)含量的特定营养液 浇灌所述花钵。培育的其余部分(植物成熟、种子收获)与不在非生物胁迫下培育的植物 相同。如对正常条件下详述那样记录生长和产量参数。
权利要求
用于相对于对照植物而言提高植物中产量相关性状的方法,所述方法包括调节植物中编码选自以下多肽的核酸序列表达,-生长调节因子(GRF)多肽,-RAA1样多肽,-SYR多肽,-ARKL多肽,-和-YTP多肽,和任选地选择具有提高的产量相关性状的植物。
2.根据权利要求1的方法,其中-所述GRF多肽包含(i)与SEQ ID NO :115 所代表的 QLQ 结构域具有至少 50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域;和(ii)与SEQ ID NO :116 所代表的 WRC 结构域具有至少 50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性的结构域,-所述RAAl样多肽包含两个或多个以下基序(iii)基序1 =GVff(V/L)F(SEQ ID NO: 162),(iv)基序2 :LGff(E/S)RY(Y/F) (SEQ ID NO 163),(ν)基序 3 (D/H) L (L/I) S (I/V/L) P (R/K/A) (S/D) F (SEQ ID NO: 164),(vi)基序4 (H/Y) (F/M) YD (V/1) VVK (N/T) (R/P) (SEQ ID NO 165),-所述SYR多肽包含前有保守三肽基序1 (SEQ ID NO 173、174、175或176之一)并后 接保守基序2(SEQ ID NO 177)的亮氨酸丰富结构域,-所述ARKL多肽包含一个或多个以下结构域(vii)SEQID NO :400所代表的ZfC3H2C3结构域或以增加的优选顺序与SEQ ID NO: 306至SEQ ID N0. 351所代表的一个或多个ZfC3H2C3结构域具有至少50%、55%、60%、 65%、70%、75%、80%、85%、90%、95%或更多序列同一性的结构域;和(viii)以增加的优选顺序与SEQID N0:35至SEQ ID N0. 398所代表的一个或多个 PfamB2828 结构域具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更 多序列同一性的DARl结构域,和-所述YTP多肽包含(ix)至少一个跨膜结构域和(x)DUF221结构域的至少一部分,和任选地选择具有提高的产量相关性状的植物。
3.根据权利要求1的方法,其中所述GRF多肽包含(i)具有InterPro登录 号II3RO14978 (PFAM登录号PF08880)的QLQ结构域;(ii)具有InterPro登录号 IPR014977(PFAM登录号PF08879)的WRC结构域;和(iii)包含在保守间隔(CX9CXiciCX2H) 中的3个Cys和一个His残基的转录效应子(ET)结构域。
4.根据权利要求1的方法,其中所述GRF多肽以增加的优选顺序与SEQID N0:2所代表的GRF多肽或与本文表A中给出的任一多肽序列具有至少50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、98%、99%或更多氨基酸序列同一性。
5.根据任一前述权利要求的方法,其中所述的编码GRF多肽的核酸序列由表A中给出 的任一核酸序列SEQ ID NO或其部分代表或者由能够与表A中给出的任一核酸序列SEQ ID NO杂交的序列代表。
6.根据任一前述权利要求的方法,其中所述的核酸序列编码表A中给出的任一多肽序 列SEQ ID NO的直向同源物或旁系同源物。
7.根据任一前述权利要求的方法,其中所述增加的表达通过T-DNA激活标签法、 TILLING或同源重组中的任意一种或多种实现。
8.根据任一前述权利要求的方法,其中所述增加的表达通过在植物中导入并表达编码 GRF多肽的核酸序列实现。
9.根据任一前述权利要求的方法,其中所述提高的产量相关性状是以下一项或多项 (i)提高的早期生长势;( )提高的地上部分生物量;(iii)提高的每株植物总种子产量; (iv)提高的种子充实率;(ν)提高的收获指数;或(Vi)提高的千粒核重(TKW)。
10.根据任一前述权利要求的方法,其中所述的核酸序列有效连接至组成型启动子,优 选地有效连接至植物组成型启动子,更优选地有效连接至G0S2启动子,最优选地有效连接 至SEQ ID NO :117所代表的来自稻的G0S2启动子。
11.根据任一前述权利要求的方法,其中所述的编码GRF多肽的核酸序列是植物来源 的,优选地来自双子叶植物,进一步优选地来自十字花科(Brassicaceae),最优选地来自拟 南芥(Arabidopsis thaliana)。
12.根据任一前述权利要求的方法能获得的植物、其部分(包括种子)或植物细胞,其 中所述的植物、其部分或细胞包含编码选自以下多肽的分离的核酸转基因,-生长调节因子(GRF)多肽,-RAAl样多肽,-SYR多肽,-ARKL多肽,-禾口-YTP多肽,所述分离的核酸转基因有效连接至植物组成型启动子。
13.构建体,其包含(a)编码多肽的核酸序列,所述多肽选自权利要求1至6任一项中所定义的GRF多肽、 RAAl样多肽、SYR多肽、ARKL多肽和YTP多肽;(b)能够驱动(a)的核酸序列表达的一个或多个调控序列;和任选地(c)转录终止序列。
14.根据权利要求13的构建体,其中所述的调控序列是植物组成型启动子,优选地是 G0S2启动子,更优选地是SEQ ID NO :117所代表的G0S2启动子。
15.根据权利要求13或14的构建体在用于制备植物的方法中的用途,所述植物相对 于对照植物而言具有提高的产量相关性状,所述提高的产量相关性状是以下一项或多项 (i)提高的早期生长势;(ii)提高的生物量,优选地提高的地上部分生物量;(iii)提高的每株植物总种子产量;(iv)提高的种子充实率;(V)提高的收获指数;(Vi)提高的千粒核 重(TKW) ; (vii)提高的非生物胁迫抗性,优选地提高的干旱胁迫耐受性;或(viii)提高的 养分摄取效率。
16.用根据权利要求13或14的构建体转化的植物、植物部分或植物细胞。
17.用于产生相对于对照植物而言具有提高的产量相关性状的转基因植物的方法,所 述方法包括(i)在植物、植物部分或植物细胞中导入并表达在植物组成型启动子控制下的编码多 肽的核酸序列,所述多肽选自权利要求1至6任一项中所定义的GRF多肽、RAAl样多肽、SYR 多肽、ARKL多肽和YTP多肽;和( )在促进植物生长和发育的条件下培育所述植物细胞、植物部分或植物。
18.转基因植物,其相对于对照植物而言具有因编码多肽的核酸序列表达增加所引起 的提高的产量相关性状,所述核酸序列有效连接至植物组成型启动子,所述多肽选自权利 要求1至6任一项中所定义的GRF多肽、RAAl样多肽、SYR多肽、ARKL多肽和YTP多肽,或 者从所述转基因植物衍生的转基因植物细胞或转基因植物部分。
19.根据权利要求12、16或18的转基因植物,其中所述的植物是作物植物或单子叶植 物或谷物植物,如稻、玉米、小麦、大麦、谷子、黑麦、小黑麦、高粱和燕麦,或从所述转基因植 物衍生的转基因植物细胞。
20.根据权利要求18的植物的包含编码多肽的分离核酸序列的可收获部分,所述多肽 选自GRF多肽、RAAl样多肽、SYR多肽、ARKL多肽和YTP多肽,其中所述可收获部分优选地 是种子。
21.产物,其从根据权利要求18的植物和/或从根据权利要求20的植物的可收获部分 衍生。
22.编码多肽的核酸序列在提高产量相关性状中的用途,所述多肽选自权利要求1至6 任一项中所定义的GRF多肽、RAAl样多肽、SYR多肽、ARKL多肽和YTP多肽,所述产量相关 性状包含以下一项或多项(i)提高的早期生长势;(ii)提高的地上部分生物量;(iii)提 高的每株植物总种子产量;(iv)提高的种子充实率;(ν)提高的收获指数;或(vi)提高的 千粒核重(TKW)、(vii)提高的非生物胁迫抗性,优选地提高的干旱胁迫耐受性;或(viii) 提高的养分摄取效率。
全文摘要
本发明总体上涉及分子生物学领域并涉及用于通过增加植物中编码多肽的核酸序列表达来提高多种植物产量相关性状的方法,其中所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽。本发明也涉及具有编码多肽的核酸序列的表达增加的植物,所述多肽选自GRF多肽、RAA1样多肽、SYR多肽、ARKL多肽和YTP多肽,其中所述植物相对于对照植物而言具有提高的产量相关性状。本发明也提供了在本发明方法中有用的构建体。
文档编号C12N15/29GK101855355SQ200880115920
公开日2010年10月6日 申请日期2008年9月15日 优先权日2007年9月14日
发明者A·I·桑兹莫林纳罗, C·勒佐, J·M·穆莱特萨洛尔特, R·S·萨洛姆, V·弗兰卡德 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1