专利名称:具有增强的产量相关性状的植物和用于产生该植物的方法
专利说明具有增强的产量相关性状的植物和用于产生该植物的方法 本发明一般涉及分子生物学领域,并且涉及相对于对照植物增强植物产量相关性状的方法。更具体地,本发明涉及在植物中相对于对照植物增强产量相关性状的方法,这是通过调节、优选增加在植物的根中编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达;或者通过调节植物中编码ANN多肽的核酸的表达。本发明还涉及在根中具有调节的,优选增加的,编码2-Cys PRX的核酸序列表达的植物,或者具有调节的编码ANN多肽的核酸的表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了在本发明方法中有用的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。常规的作物及园艺学改良手段利用选择育种技术来鉴定具有受欢迎特性的植物。然而,此类选择育种技术具有几个缺陷,即这些技术一般耗费很多劳动并且产生这样的植物,其经常含有异源性遗传组分,这可能不总是导致从亲代植物中传递的所希望性状。分子生物学进展已经允许人类改良动物及植物的种质。植物的遗传工程使得可以分离和操作遗传物质(一般处于DNA或RNA形式)并且随后引入该遗传物质至植物中。此类技术具有产生具备多种经济学、农学或园艺学改良性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量。产量通常定义为作物产生的可测量的经济价值。这可以就数量和/或品质方面进行定义。产量直接取决于几个因素,例如器官的数目和大小、植物构造(例如枝的数目)、种子产生、叶衰老等。根发育、养分摄入量、胁迫耐性和早期萌发势(early vigor)也可以是决定产量的重要因素。因此,优化前述因素可以对增加作物产量有贡献。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,不论是通过种子本身的直接消耗,还是通过由加工的种子所饲养的肉类产品的消耗。它们也是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(发芽和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质的代谢前体,将其合成为贮存性高分子,以充盈谷粒。
对于众多作物的另一个重要性状是早期萌发势。改进早期萌发势是现代稻育种计划在温带和热带稻品种上的重要目标。长根在水栽稻中对于正确土壤固定是重要的。在将稻直接播种至被淹没田地的情况下,以及在植物必须从水中迅速出苗的情况下,较长的枝条与萌发势相关。在实施条播的情况下,较长的中胚轴和胚芽鞘对于良好出苗是重要的。将早期萌发势人工改造到植物内的能力将在农业中是极其重要的。例如,不良的早期萌发势已经限制了基于玉米带种质(Corn Belt germplasm)的玉米(Zea mayes L.)杂种在欧洲大西洋地区的引种。
植物生物量为饲料作物如苜蓿、青贮谷物和干草的产量。在谷物作物中使用产量的许多替代参数。其中首要的是估算植物大小。根据物种以及发育阶段的不同,可以通过许多方法测量植物大小,但是包括植物总干重、地上干重、地上鲜重、叶面积、茎体积、植物高度、莲座植物直径、叶长、根长、根生物量、分蘖数和叶数。许多物种在给定的发育阶段维持植物不同部分大小间的保守比。利用这些异速生长关系而对这些有关大小的测量结果进行由此及彼的外推(如Tittonell等2005 AgricEcosys & Environ 105213)。早期发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。具有更大叶面积的较大植物通常能够比较小的植物吸收更多的光和二氧化碳,因此很可能在同期增重更多(Fasoula &Tollenaar 2005 Maydica 5039)。除了植物所具有的最初达到较大大小的微环境或遗传优势的潜在延续,此为其附加效应。植物大小和生长速率存在着强遗传组分(如ter Steege等2005 Plant Physiology 1391078),且迄今为止,种种多样化基因型植物在一种环境条件下的大小很可能与另一种环境条件下的大小有关(Hittalmani等2003 Theoretical Applied Genetics107679)。以这种方式,使用标准环境作为田地中作物在不同时间和地点所遭遇的多样化动态环境的代表。
收获指数为种子产量与地上干重的比值,其在许多环境条件下相对稳定,因此在植物大小和谷物产量之间通常能够获得比较稳固的相关性(如Rebetzke等2002 Crop Science 42739)。这些方法固有地联系在一起,因为大多数谷物生物量取决于植物叶和茎当前或贮存的光合作用生产力(Gardener等1985 Physiology of Crop Plants.Iowa State University Press,pp68-73)。因此,对植物大小的选择,甚至是在发育早期阶段的选择,已经用作为未来潜在产量的指标(如Tittonell等2005 Agric Ecosys & Environ105213)。当测试遗传差异对胁迫耐性的影响时,温室或植物培养室与田地相比具有固有的优势即能够使土壤性能、温度、水和营养的可用性以及光强度标准化。不过,因缺乏风力或昆虫导致不良授粉,或由于空间不足以让成熟根或冠层生长等等,对产量造成的这些人工局限性会限制这些控制环境在测试产量差异中的应用。因此,在培养室或温室标准条件下测量早期发育阶段的植物大小,是提供潜在遗传产量优势指标的标准方法。
另一个重要性状是改进的非生物胁迫耐受性。非生物胁迫是世界范围作物损失的主要原因,对于大多数主要作物植物而言降低平均产量超过50%(Wang等、Planta(2003)2181-14)。非生物胁迫可以由干旱、盐度、极端温度、化学毒性、养分过度或缺少(大量元素和/或微量元素)、辐射和氧化胁迫引起。提高植物对非生物胁迫耐受性的能力将在世界范围对农民是极大经济优势并且会允许在不利条件期间及在作物栽培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途,对某些产量性状的改良可能优先于其它产量性状。例如对于应用如饲料或木材生产或生物燃料资源而言,增加植物营养体部分可能是希望的,而对于应用如面粉、淀粉或油生产而言,增加种子参数可能是尤其希望的。即便在种子参数当中,某些参数可以更优先于其它参数,这取决于应用。多种机制可以对增加种子产量有贡献,无论形式为增加的种子大小或是增加的种子数目。
增加植物中产量-相关性状(例如增加产量,特别是种子产量和/或生物量)的一种方法可以是通过调节植物的内在生长机制如细胞周期或参与植物生长或参与防御机制的多种信号途径。
令人惊讶地,发现多种植物产量相关性状已经相对于对照植物被增强,这是通过调节、优选增加植物根中的编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达,或者通过在植物中调节编码ANN多肽的核酸的表达。
根据一个实施方案,提供了相对于对照植物增强多种产量相关性状的方法,包括调节、优选增加植物根中的编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达,或者通过调节植物中编码ANN多肽的核酸的表达。
背景 1.2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX) 巯基过氧化物酶(Thiol peroxidase,PRX)是遍在的无血红素的过氧化物酶,其催化过氧亚硝酸(peroxynitrite)和多种过氧化物的还原,这是通过催化的半胱氨酸残基并且包含巯基的蛋白质作为还原剂。在植物中,根据保守的催化性半胱氨酸的数量和位置区分了五种不同的类型。四类被定义为过氧化物氧还蛋白,已经通过系统发生序列分析而被鉴定出来---1-Cys、2-Cys、II型和Q型过氧化物氧还蛋白;第五种由谷胱甘肽过氧化物酶表示,其近期被显示为在植物中具有硫氧还蛋白依赖性活性(Rouhier & Jacquot(2005)Free Radic Biol Med 38(11)1413-21)。拟南芥基因组的分析显示在多个植物区室中表达了至少17个硫氧还蛋白依赖性过氧化物酶的同种型。
2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)是一组蛋白质,其参与细胞增殖、分化、凋亡和光合作用。这些酶将H2O2过氧亚硝酸和烷基氢过氧化物分别还原成水或醇(Netto等人,(1996)J Biol Chem 271(26)15315-15321),其中硫氧还蛋白(Trx)作为电子供体。通过进行此,2-Cys PRX调节信号转导途径或保护大分子免受氧化损伤。这些蛋白质是同型二聚体,每个亚基具有两个保守的半胱氨酸(Choi等人,(1998)Nature Struct Biol 5400-406)。过氧化物将一个亚基N末端的半胱氨酸氧化为次磺酸(sulphenic acid),其与另一个亚基的C末端半胱氨酸反应形成分子间二硫化物。为了完成催化循环,通过巯基/二硫化物氧化还原交换将酶还原(Chae等人,(1994)Proc Natl Acad Sci USA 917017-7021)。
通过反义阻抑产生具有还原水平的2-Cys PRX的转基因拟南芥植物(Baier等人(2000)Plant Physiol 124(2)823-32)。2-Cys PRX表达的阻抑导致其它抗氧化基因的提高的表达,表明该酶形成了叶绿体的抗氧化剂网络完整部分,并且与其它防御系统功能性相互连接。
国际专利申请WO05/116082描述了使用组成型花椰菜花叶病毒35S启动子过量表达拟南芥2-Cys PRX(称为BAS1)的转基因拟南芥植物的获得(obtention)。将转基因植物描述为比野生型植物具有对热激和病原体更可能的抗性。
令人惊讶地,现在已经发现在植物的根中调节,优选增加,编码2-Cys PRX多肽的核酸序列的表达赋予了植物相对于对照植物而言具有增强的产量相关性状。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状的方法,所述方法包括调节,优选增加,植物根中编码2-Cys PRX多肽的核酸序列的表达。增强的产量相关性状包括一种或多种(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
2.膜联蛋白样(ANN) 膜联蛋白形成了依赖于钙的磷脂结合蛋白质家族,并且在植物和动物中被发现。在所有测试的植物物种中,已经表明存在至少两种不同的膜联蛋白。在结构上,植物膜联蛋白与动物膜联蛋白相比,差异更少。比较研究表明植物膜联蛋白在核心结构域中具有显著同源性,所述核心结构域包含至少一个,通常4个或更多个长约70个氨基酸的保守性重复。作为钙结合蛋白质,膜联蛋白被假设为在钙信号传导途径中起作用。尽管膜联蛋白的结构在现今是众所周知的,但是并未在功能上对它们进行良好的表征。在植物中,据报道膜联蛋白参与高尔基体介导的分泌、细胞膨胀、液泡生物发生、叶绿体膜结合、细胞周期、结瘤作用信号传导、胁迫信号传导。
US20050089872描述了分别对于来自拟南芥的膜联蛋白1和膜联蛋白4编码基因的T-DNA插入突变体(anx1和anx4)。所述突变体对于盐胁迫和渗透胁迫是敏感的。同样地,脱落酸对于anx1和anx4-1突变体的萌发和生长有不利影响。表达分析显示ANX1蛋白质主要在根中表达,但不在花、茎或叶组织中表达。假定ANX1和ANX4蛋白质在渗透胁迫和ABA信号的转导中起作用。
令人惊讶地,现在发现调节编码ANN多肽的核酸的表达赋予植物相对于对照植物而言具有增强的产量相关,特别是增加的产量。
根据一个实施方案,提供了相对于对照植物增强植物的产量相关性状的方法,所述方法包括在植物中调节编码ANN多肽的核酸的表达。改善的产量相关性状包括增加的种子产量。
定义 多肽/蛋白质 术语“多肽”和“蛋白质”在本文中可互换使用,是指任何长度的通过肽键连接在一起的聚合形式的氨基酸。
多核苷酸/核酸/核酸序列/核苷酸序列 术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在本文中可互换使用并且指处于任意长度聚合未分支形式中的核苷酸,即核糖核苷酸或脱氧核糖核苷酸或这二者组合。
对照植物 选择合适的对照植物是实验设置的惯用部分并且可以包括对应的野生型植物或无目的基因的对应植物。对照植物一般是与待评价植物相同的植物物种或甚至是相同的变种。对照植物也可以是待评价植物的失效合子。如本文中所用的“对照植物”不仅指整株植物,还指植物部分,包括种子及种子部分。
同源物 蛋白质的“同源物”包括这样的肽、寡肽、多肽、蛋白质及酶,它们相对于非修饰的上述蛋白质具有氨基酸替换、缺失和/或插入并且与所述肽、寡肽、多肽、蛋白质及酶来源的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。插入可以包含单个或多个氨基酸的氨基端融合和/或羧基端融合以及序列内插入。通常,在氨基酸序列内部的插入会比氨基端融合或羧基端融合更小,约1-10个残基级别。氨基端或羧基端融合蛋白或融合肽的实例包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶-标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、
表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
取代指以具有相似特性(如相似疏水性、亲水性、抗原性、形成或破坏α-螺旋结构或β-折叠结构的倾向)的其它氨基酸替换蛋白质的氨基酸。氨基酸取代一般是单个残基的,不过可以是聚类性的,这取决于置于多肽的功能性约束;插入通常会是约1-10个氨基酸残基级别。氨基酸取代优选地是保守性氨基酸取代。保守性取代表是本领域众所周知的(见例如Creighton(1984)Proteins.W.H.Freeman and Company(编著)和下表1)。
表1保守性氨基酸取代的实例 氨基酸取代、缺失和/或插入可以使用本领域众所周知的肽合成技术如固相肽合成法等或通过重组DNA操作而容易地进行。用于操作DNA序列以产生蛋白质的取代、插入或缺失变体的方法是本领域众所周知的。例如,用于在DNA中的预定位点处产生取代突变的技术是本领域技术人员众所周知的并且包括M13诱变法、T7-Gen体外诱变法(USB,Clevelaand,OH)、QuickChange位点定向诱变法(Stratagene,SanDiego,CA)、PCR-介导的位点定向诱变或其它位点定向诱变法。
衍生物 “衍生物”包括这样的肽、寡肽、多肽,其中与天然存在形式的蛋白质(如目的蛋白)的氨基酸序列相比,它们包含以非天然存在的氨基酸残基对氨基酸的取代或非天然存在的氨基酸残基的添加。蛋白质的“衍生物”也包含这样的肽、寡肽、多肽,其中与多肽的天然存在形式的氨基酸序列相比,它们包含天然存在的改变(糖基化、酰化、异戊二烯化、磷酸化、肉豆蔻酰化、硫酸化等)氨基酸残基或非天然的改变氨基酸残基。与衍生物所来源的氨基酸序列相比,该衍生物可以也包含与所述氨基酸序列共价或非共价结合的一个或多个非氨基酸取代基或添加(例如报道分子或其它配体),如为促进检测该衍生物而结合的报道分子,和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残基。
直向同源物/旁系同源物 直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。旁系同源物是相同物种内起源于先祖基因复制的基因,直向同源物是来自不同生物的起源于物种形成的基因,并且也来源于共同的先祖基因。
结构域 术语“结构域”指沿进化相关蛋白质的序列比对结果而在特定位置处保守的一组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动,然而在特定位置处的高度保守的氨基酸指示在蛋白质的结构、稳定性或功能方面可能是必需的氨基酸。结构域因通过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定,它们可以用作鉴定物以确定任意的所讨论多肽是否属于先前已鉴定的多肽家族。
基序/共有序列/特征(Signature) 术语“基序”或“共有序列”或“特征”指在进化相关蛋白质的序列中的短保守区。基序往往是结构域的高度保守部分,不过也可以仅包括结构域的部分,或可以位于保守结构域之外(若基序的全部氨基酸位于定义的结构域之外)。
杂交 如本文中所定义的术语“杂交”是其中基本上同源的互补核苷酸序列彼此退火的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸分子均处于溶液中。杂交过程也可以在互补性核酸分子之一固定到基质如磁珠、琼脂糖(Sepharose)珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸分子之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸分子的发夹或其它二级结构。
术语“严格性”指在其中发生杂交的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成影响。通常,将低严格性条件选择为在确定的离子强度及pH时低于特定序列热解链2-Cys PRXnt(Tm)约30℃。中等严格性条件是此时温度低于Tm 20℃,高严格性条件是此时温度低于Tm 10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。然而,核酸序列可以在序列组成上偏离并且因遗传密码子的简并性而依旧编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分子。
Tm是在确定的离子强度及pH下50%的靶序列与完全匹配的探针杂交时的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性地杂交。从低于Tm约16℃直至32℃获得最大杂交速率。一价阳离子在溶液中的存在降低了两条核酸链间的静电排斥,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是明显的(对于更高浓度,这种效应可以忽略)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃。取决于杂交分子的类型,Tm可以使用下列等式计算 1)DNA-DNA杂交分子(Meinkoth和Wahl,Anal.Biochem.,138267-284,1984) Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺 2)DNA-RNA或RNA-RNA杂交分子 Tm=79.8+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc 3)寡DNA或寡RNAd杂交分子 对于<20个核苷酸Tm=2(ln) 对于20-35个核苷酸Tm=22+1.46(ln) a或对于其它一价阳离子,但是仅在0.01-0.4M范围内是精确的。
b仅对于%GC在30%-75%范围内是精确的。
cL=双链体的长度(以碱基对计)。
dOligo,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
可以众多已知技术的任何一种来控制非特异性结合,例如用含蛋白质的溶液封闭薄膜、添加异源性RNA、异源性DNA及SDS至杂交缓冲液并且用RNA酶处理。对于非同源性探针,一系列杂交可以通过改变以下条件之一进行(i)逐渐降低退火温度(例如从68℃至42℃)或(ii)逐渐降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度及温度盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤条件一般在杂交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。
例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格性杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格性杂交条件的实例包括在50℃于4×SSC中或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交核酸分子的预期长度。当序列已知的核酸分子杂交时,可以通过比对序列并鉴定本文中所述的保守区而确定杂交分子长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5×Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平的目的,可以参考Sambrook等(2001)Molecular Cloninga laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York或参考Current Protocols inMolecular Biology,John Wiley & Sons,N.Y.(1989和每年更新版本)。
剪接变体 如本文中所用的术语“剪接变体”包含其中已经切除、替换、移位或添加所选内含子和/或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本上保留了蛋白质的生物活性的一种变体;这可以通过选择性保留蛋白质的功能性片段而实现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的方法是本领域众所周知的(见例如Foissac和Schiex(2005),BMCBioinformatics.;625)。
等位变体 等位基因或等位变体是给定基因的替代形式,位于相同染色体位置内。等位变体包含单核苷酸多态性(SNP)和小插入/缺失多态性(INDEL)。INDEL的尺寸通常小于100bp。SNP和INDEL形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
基因改组/定向进化 基因改组或定向进化的组成为反复DNA改组,随后适当筛选和/或选择以产生编码具有改良生物学活性的蛋白质的核酸分子或其部分的变体(Castle等,(2004)Science 304(5674)1151-4;美国专利5,811,238和6,395,547)。
调节元件/控制序列/启动子 术语“调节元件”、“控制序列”和“启动子”均在本文中可互换使用,并且在广义上意指能够实现与之连接的序列表达的调节性核酸序列。术语“启动子”一般指位于基因转录起点上游并参与识别及结合RNA聚合酶和其它蛋白质,因而指导有效连接的核酸序列转录的核酸控制序列。前述术语包括从典型的真核基因组基因(包括对于精确转录启动所需的TATA盒,具有或没有CCAAT盒序列)中衍生的转录调节序列和应答发育刺激和/或外部刺激或以组织特异性方式改变基因表达的额外调节元件(如,上游激活序列、增强子和沉默子)。本术语还包括典型的原核基因的转录调节序列,在此情况下它可以包括-35盒序列和/或-10盒转录调节序列。术语“调节元件”也包含赋予、激活或增强核酸序列在细胞、组织或器官中表达的合成的融合分子或衍生物。
“植物启动子”包含介导编码序列区段在植物细胞中表达的调节元件。因此,植物启动子不一定是植物来源的,而是可以源自病毒或微生物,例如来自侵袭植物细胞的病毒。“植物启动子”也可以源自植物细胞,例如来自用待于本发明方法中表达及在本文中描述的核酸序列所转化的植物。这也适用于其它“植物”调节性信号,如“植物”终止子。用于本发明方法中的核苷酸序列的启动子上游可以由一个或多个核苷酸替换、插入和/或缺失而受到修饰,但不干扰启动子、可读框(ORF)或3′调节区如终止子或远离ORF的其它3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活性的启动子、甚至来自异源生物的启动子彻底替换该启动子而增加。为在植物中表达,如上所述,核酸序列必须有效连接至或包含合适的启动子,其中所述的启动子在正确时候及时并以所需要的空间表达模式表达基因。
为鉴定功能性等效启动子,候选启动子的启动子强度和/或表达模式可以通过将该启动子与报道基因有效连接并分析该报道基因在植物多种组织的表达水平和模式而进行分析。合适的公知报道基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。启动子活性通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活性进行分析。启动子强度和/或表达模式随后可以与参考启动子(如本发明方法中所用的一种启动子)的启动子强度和/或表达模式比较。备选地,启动子强度可以使用本领域已知方法如Northern印迹法及放射自显影图的密度计分析法、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6986-994),通过定量mRNA水平或通过将本发明方法中所用核酸序列的mRNA水平与持家基因(如18S rRNA)的mRNA水平比较而分析。通常“弱启动子”意指驱动编码序列在低水平上表达的启动子。“低水平”意指在每个细胞约1/10,000转录物至约1/100,000转录物、至约1/500,0000转录物的水平上。相反,“强启动子”驱动编码序列在高水平、或在每个细胞约1/10转录物至约1/100转录物、至约1/1000转录物上表达。
有效连接 如本文中所用的术语”有效连接”指启动子序列与目的基因之间功能性地连接,以至于启动子序列能够启动目的基因转录。
组成型启动子 “组成型启动子”指在生长和发育的大部分、但不必全部阶段期间和在大部分环境条件下在至少一个细胞、组织或器官内有转录活性的启动子。下表2a给出组成型启动子的实例。
表2a组成型启动子的实例 遍在启动子 遍在启动子在生物基本上所有组织或细胞内有活性。
发育调节性启动子 发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导型启动子 诱导型启动子在应答化学品(综述见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,4889-108)、环境刺激或物理刺激时具有受诱导或增加的转录启动,或可以是“胁迫诱导性的”,即当植物暴露于多种胁迫条件时受到激活,或是“病原体诱导性的”,即当植物暴露于多种病原体时受到激活。
器官特异性/组织特异性启动子 器官特异性或组织特异性启动子是能够优先在某些器官官或组织如叶、根、种子组织等内启动转录的启动子。例如,“根特异性启动子”是在植物根中优势地具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何渗漏表达。能够仅在某些细胞中启动转录的启动子在本文中称作“细胞特异的”。
根特异性启动子的实例列在下表2b中 表2b根特异性启动子的实例 根特异性启动子主要在种子组织中具有转录活性,但是并不必需仅仅在种子组织中(在渗漏表达的情形下)。种子特异性启动子可以在种子发育和/或萌发期间有活性。种子特异性启动子对于下列一种或多种是特异性的胚乳、糊粉或胚特异性的。种子特异性启动子的实例显示在下表2c、2d、2e、2f中。种子特异性启动子的其他实例在Qing Qu和Takaiwa(Plant Biotechnol.J.2,113-125,2004)中给出,其公开在本文以其全文引用作为参考。
表2c种子特异性启动子的实例 表2d胚乳特异性启动子的实例 表2e胚特异性启动子的实例 表2f糊粉特异性启动子的实例 如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的启动子,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何渗漏表达。
可以用来实施本发明方法的绿色组织特异性启动子的实例在下表2g中显示。
表2g绿色组织特异性启动的实例 组织特异性启动子的另一个实例是分生组织特异性启动子,其主要在分生性组织中具有转录活性,在植物的任何其它部分内基本上无活性,尽管在植物的这些其它部分内允许任何渗漏表达。可用于实施本发明方法的绿色分生组织特异性启动子的实例示于下文表2h。
表2h分生组织特异性启动子的实例 终止子 术语“终止子”包括这样的控制序列,其是在转录单位末端的DNA序列,发出对初级转录物进行3’加工并多聚腺苷化以及终止转录的信号。终止子可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶基因,或者来自其它植物基因或较不优选地来自任何其它真核基因。
调节 术语”调节”就表达或基因表达而言意指这样的过程,其中表达水平与对照植物相比因所述基因的表达而改变,优选地,表达水平增加。原先未受调节的表达可以是结构RNA(rRNA、tRNA)或mRNA的任何类型表达,随后是翻译。术语“调节活性”应当意指本发明核酸序列或所编码蛋白质的表达的任何变化,这导致植物增强的产量相关性状(例如,增加的产量和/或增加的生长)。
增加的表达/过量表达 如本文中所用的术语”增加的表达”或“过量表达”意指对于原有野生型表达水平是额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如,由适宜启动子驱动的过量表达、使用转录增强子或翻译增强子。可以在非异源形式的多核苷酸的适宜位置(一般是上游)内引入作为启动子或增强子元件的分离核酸序列,以便上调编码目的多肽的核酸序列的表达。例如,内源性启动子可以通过突变、缺失和/或置换而在体内改变(见Kmiec,US 5,565,350;Zarling等,WO9322443),或可以将分离的启动子以相对于本发明基因的正确方向及距离引入植物细胞,以便控制基因表达。
若需要多肽表达,通常希望在多核苷酸编码区的3’末端包括多聚腺苷化区。多聚腺苷化区可以来自天然基因、来自多种其它植物基因或来自T-DNA。待添加的3’末端序列可以来自例如胭脂碱合酶或章鱼碱合酶基因或备选地来自另一植物基因或更不优选来自任何其它真核基因。
内含子序列也可以添加至5′非翻译区(UTR)或部分编码性序列的编码序列上,以增加在胞浆内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物表达构建体中转录单位内的包含在mRNA水平及蛋白质水平上增加基因表达至多达1000倍(Buchman和Berg(1988)Mol.Cell biol.84395-4405;Callis等(1987)Gens Dev 11183-1200)。基因表达的此类内含子增强作用一般在位于转录单位5′末端附近时最强烈。使用玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子是本领域已知的。对于一般信息,见《玉米手册》,第116章,编者Freeling和Walbot,Springer,N.Y.(1994)。
内源基因 本文中提及的“内源”基因不仅仅指如在植物中以其天然形式(即没有任何人类干预)存在的所讨论基因,还指处于分离形式的随后(再)引入植物的相同基因(或基本上同源的基因/核酸序列)(转基因)。例如,含有这种转基因的转基因植物可以遭遇转基因表达大幅降低和/或内源基因表达的大幅降低。分离的基因可以分离自生物或可以是人造的,例如通过化学合成。
减少的表达 本文中提及的“减少的表达”或表达的“降低或基本去除”意指内源基因表达和/或多肽水平和/或多肽活性相对于对照植物的减少。与对照植物相比,降低或基本去除以递增优选顺序是至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%,或95%、96%、97%、98%、99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达,需要核酸序列的足够长度的基本上连续的核苷酸。为了开展基因沉默,这个长度可以是少至20、19、18、17、16、15、14、13、12、11、10个或更少的核苷酸,或者该长度可以多至整个基因(包括5’和/或3’UTR,部分或全体)。基本上连续的核苷酸片段可以来自编码目的蛋白的核酸序列(靶基因)或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列。优选地,基本上连续的核苷酸片段能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸片段以递增优选顺序与靶基因(有义链或反义链)具有50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%的序列同一性。编码(功能性)多肽的核酸序列不是本文中所讨论用于降低或基本去除内源基因表达的多种方法所需的。
这一表达的降低或基本去除可以使用常规工具和技术来实现。用于降低或基本去除内源基因表达的方法是通过RNA-介导的沉默,这是使用核酸序列的反向重复或其部分的反向重复(在这一情形下,是来自目的基因或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列的基本上连续的核苷酸的区段),优选所述反向重复能够形成发夹结构。RNA沉默方法的另一实例涉及将有义方向的核酸序列或其部分(在这一情形下,是来自目的基因或来自能够编码目的蛋白的直向同源物、旁系同源物或同源物的任何核酸序列的基本上连续的核苷酸的区段)引入植物。RNA沉默方法的另一实例涉及使用反义核酸序列。基因沉默也可以通过插入诱变来实现(例如T-DNA插入或转座子插入)或通过下文描述的方案来实现Angell和Baulcombe((1999)Plant J 20(3)357-62)、(Amplicon VIGS WO 98/36083)、或Baulcombe(WO 99/15682)等。其它方法,例如使用直接针对内源多肽用于在植物内抑制其功能的抗体,或干扰多肽所参与的信号通路是本领域技术人员熟知的。人工和/或天然微小RNA(miRNA)可以被用来敲除基因表达和/或mRNA翻译。内源miRNA是单链小RNA,通常19-24个核苷酸长。通常21个核苷酸长的人工微小RNA(amiRNA)可以被遗传工程改造为特异性负调节单个或多个目的基因的基因表达。植物微小RNA靶标选择的决定因素是本领域众所周知的。用于靶标识别的经验参数已经被定义并用来辅助特异性amiRNA的设计(Schwab等人,(2005)Dev Cell 8(4)517-27)。用于设计和产生amiRNA及其前体的常规工具也是公共可获得的(Schwab等人,(2006)Plant Cell 18(5)1121-33)。
为最佳性能,用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植物。优选地,将来自任何给定植物物种的核酸序列引入同一个物种内。例如,将来自稻的核酸序列转化至稻植物。然而,并非绝对要求待引入的核酸序列起源于与该核酸序列将要引入的植物相同的植物物种。只要内源性靶基因与待引入的核酸序列之间存在相当大的同源性就足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的实例。本领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而实现降低内源基因在整株植物或在其部分中的表达。
选择标记(基因)/报道基因 ″选择标记″、″选择标记基因″或“报道基因”包括向细胞赋予表型的任何基因,其中在所述的细胞内表达所述基因以促进鉴定和/或选择用本发明的核酸构建体所转染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合适的标记可以选自赋予抗生素耐药性或除草剂抗性、导入新代谢性状或允许目视选择的标记。选择标记基因的实例包括赋予抗生素耐药性的基因(如使新霉素和卡那霉素磷酸化的nptII或使潮霉素磷酸化的hpt或赋予对例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(Geneticin)(G418)、壮观霉素或杀稻瘟素的抗性的基因)、赋予除草剂抗性的基因(例如提供
抗性的bar;提供草甘膦抗性的aroA或gox或赋予对例如咪唑啉酮、膦丝菌素或磺脲类的抗性的基因)或提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA或利用木糖的木糖异构酶或抗营养标记如2-脱氧葡萄糖抗性)。目视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶、GUS或β-半乳糖苷酶与其有色底物例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生物和选择方法,优选不同的标记。
已知当核酸序列稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸序列稳定转染的细胞可以通过例如选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。
因为一旦已经成功引入了核酸序列,则转基因宿主细胞中不再需要或不希望有标记基因,尤其抗生素耐药性基因和除草剂抗性基因,因此用于引入核酸序列的本发明方法有利地使用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时用于转化的两种载体,一种载体携带本发明的核酸序列而另一种载体携带标记基因。高比例的转化体接受,或在植物的情况下,包含(高达40%或更多的转化体)这两种载体。在用农杆菌(Agrobacterium)转化的情况下,转化体通常仅接受载体的一部分,即侧翼有T-DNA的序列,它通常代表表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中,整合至转座子的标记基因用来与想要的核酸序列一起进行转化(称作Ac/Ds技术)。转化体可以与转座酶来源植物杂交或转化体用导致转座酶表达的核酸构建体瞬时或稳定地转化。在一些情况下(大约10%),转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其它更多情况下,转座子跳至不同位置。在这些情况下,标记基因必须通过进行杂交而去除。在微生物学中,开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于重组系统;此方法的优势在于不必通过杂交去除。该类型的最知名系统称作Cre/lox系统。Cre1是去掉位于loxP序列之间序列的重组酶。若标记基因整合于loxP序列之间,则通过重组酶表达已经成功发生转化时,标记基因被去除。其它重组系统是HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,200022255-22267;Velmurugan等,J.Cell Biol.,149,2000553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因组。这些方法自然也可以应用至微生物如酵母、真菌或细菌。
转基因的/转基因/重组 为本发明目的,″转基因的″、”转基因”或″重组″就核酸序列而言意指包含此核酸序列的表达盒、基因构建体或载体或用本发明的核酸序列、表达盒或载体转化的生物,这些构建均通过重组方法产生,其中 (a)编码用于本发明方法中的蛋白质的核酸序列,或 (b)与本发明核酸序列有效连接的遗传调控序列,例如启动子,或 (c)a)和b) 不处于其天然遗传环境中或已经通过遗传操作方法修饰,修饰有可能采用例如置换、添加、缺失、倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植物中的天然基因组基因座或染色体基因座或在基因组文库中存在。在基因组文库的情况下,核酸序列的天然遗传环境优选地得到保留,至少部分地得以保留。该环境分布在核酸序列的至少一侧并且具有至少50bp,优选至少500bp,特别优选至少1000bp,最优选至少5000bp的序列长度。天然存在的表达盒-例如核酸序列的天然启动子与编码本发明方法中所用多肽的对应核酸序列的天然存在的组合,如上文所定义-在这种表达盒通过非天然的合成(“人工”)方法(如诱变处理)而受到修饰时,变成转基因表达盒。合适方法例如在US 5,565,350或WO 00/15815中描述。
为本发明目的,转基因植物因此如上理解为意指本发明方法中所用的核酸序列不位于所述植物基因组中该核酸序列的天然基因座内,所述核酸序列有可能同源或异源地表达。然而如所提及,转基因还意指尽管本发明核酸序列或在本发明方法中所用核酸序列处于植物基因组中该核酸序列的天然位置内,然而所述序列相对于天然序列而言已经受到修饰,和/或所述天然序列的调节序列已经受到修饰。转基因优选地理解为意指本发明核酸序列在基因组中的非天然基因座内表达,即发生核酸序列的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
转化 如本文中所提及的术语“引入”或“转化”包括外源性多核苷酸转移至宿主细胞内,无论用于转化的方法是什么。能够后续克隆性增殖(无论通过器官发生或胚胎发生)的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。选择的具体组织将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。示例性组织靶包括叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现存分生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持,例如作为质粒。备选地,多核苷酸可以整合至宿主基因组内。产生的转化植物细胞随后可以用来以本领域技术人员已知的方式再生出转化植物。
外来基因转移至植物基因组内称作转化。植物物种的转化现在是相当常规的技术。有利地,几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定转化。转化方法包括使用脂质体、电穿孔法、增加游离DNA摄入的化学品、DNA直接注射至植物、粒子枪轰击法、使用病毒或花粉的转化法和显微投射法(microprojection)。转化方法可以选自用于原生质体的钙/聚乙二醇法(Krens,F.A.等,(1982)Nature 296,72-74;Negrutiu I等(1987)PlantMol Biol 8363-373);原生质体的电穿孔法(Shillito R.D.等(1985)Bio/Technol 3,1099-1102);对植物材料的微量注射法(Crossway A等,(1986)Mol.Gen Genet 202179-185);DNA或RNA涂布的粒子轰击法(Klein TM等,(1987)Nature 32770)、(非整合性)病毒感染法等。转基因植物,包括转基因作物植物,优选地通过农杆菌介导的转化法产生。有利的转化方法是在植物中(in planta)的转化法。为此目的,例如有可能使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。根据本发明已经证明使转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续培育直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735-743)。用于农杆菌介导的稻转化的方法包括用于稻转化的公知方法,如在任一以下文献中描述的那些方法欧洲专利申请EP 1198985 A1,Aldemita和Hodges(Planta 199612-617,1996);Chan等(Plant Mol Biol 22(3)491-506,1993),Hiei等(Plant J 6(2)271-282,1994),其公开内容在本文中引入作为参考,如同完全给出那样。在玉米转化的情况下,优选的方法如Ishida等(Nat.Biotechnol 14(6)745-50,1996)或Frame等(Plant Physiol 129(1)13-22,2002)描述,其公开内容在本文中如充分所述那样引入作为参考。所述方法通过举例方式进一步由B.Jenes等,Techniques for Gene Transfer,在Transgenic Plants,第1卷,Engineering and Utilization,编者S.D.Kung和R.Wu,Academic Press(1993)128-143及在Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中描述。待表达的核酸序列或构建体优选地克隆至适于转化根癌农杆菌(Agrobacteriumtumefaciens)的载体,例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。由这种载体转化的农杆菌随后可以按照已知方式用于转化植物,例如作为模型使用的植物,如拟南芥(拟南芥属于本发明的范围,不视为作物植物)或作物植物,例如烟草植物,通过在农杆菌溶液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。植物通过根癌农杆菌的转化例如由
和Willmitzer在Nucl.AcidRes.(1988)16,9877中描述或尤其从F.F.White,Vectors for GeneTransfer in Higher Plants;在Transgenic Plants,第1卷,Engineeringand Utilization,编者S.D.Kung和R.Wu,Academic Press,1993,第15-38页中获知。
除了转化体细胞(其随后必须再生成完整植物)之外,还有可能转化植物分生组织的细胞及特别转化发育成配子的那些细胞。在这种情况下,转化的配子遵循天然的植物发育过程,产生转基因植物。因此,例如拟南芥种子用农杆菌处理并且从发育植物中获得种子,其中一定比例的所述植物受到转化并且因此是转基因的[Feldman,KA和Marks MD(1987)Mol Gen Genet 208274-289;Feldmann K(1992)。在编者C Koncz,N-H Chua和J Shell,Methods in Arabidopsis Research.WordScientific,Singapore,第274-289页]。替代性方法基于反复去掉花序并使莲座叶丛中心中的切除部位与转化的农杆菌温育,因而转化的种子同样可以在较晚的时间时获得(Chang(1994)Plant J.5551-558;Katavic(1994)Mol Gen Genet,245363-370)。然而,尤其有效的方法是改良的真空渗入法,如“花浸染”法。在拟南芥真空渗入法的情况下,完整植物在减压下用农杆菌混悬液处理[Bechthold,N(1993)。C R Acad SciParis Life Sci,3161194-1199],而在“花浸染法”的情况下,正在发育的花组织与表面活性剂处理的农杆菌混悬液短暂温育[Clough,SJ和Bent,AF(1998)The Plant J.16,735-743]。在两种情况下收获了一定比例的转基因种子,并且这些种子可以通过在如上所述的选择条件下培育而与非转基因种子区分。此外,质体的稳定转化是有利的,因为质体在大部分作物中以母体方式遗传,降低或消除了转基因经花粉流动风险。叶绿体基因组的转化一般通过已在Klaus等,2004[Nature Biotechnology22(2),225-229]中示例性加以展示的方法实现。简而言之,待转化的序列连同选择标记基因一起克隆至与叶绿体基因组同源的侧翼序列之间。这些同源的侧翼序列指导位点特异性整合至原质体系内。已经对众多不同植物物种描述了质体转化并且综述可以出自Bock(2001)在基础研究和植物生物技术中的转基因质体(Transgenic plastids in basic research andplant biotechnology).J Mol Biol.2001年9月21日;312(3)425-38或Maliga,P(2003)质体转化技术商业化进展(Progress towardscommercialization of plastid transformation technology).TrendsBiotechnol.21,20-28。进一步生物技术进展最近已经以无标记质体转化体的形式作了报道,所述无标记质体转化体可以通过瞬时共整合的标记基因产生(Klaus等,2004,Nature Biotechnology 22(2),225-229)。
T-DNA激活标签化 T-DNA激活标签化(Hayashi等Science(1992)1350-1353)涉及在目的基因的基因组区域内或基因编码区上游或下游10kb处以如此结构插入T-DNA(通常含有启动子(也可以是翻译增强子或内含子)),使得启动子指导被靶定基因的表达。通常,由靶定基因的天然启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。启动子一般嵌入在T-DNA中。这种T-DNA随机地插入植物基因组,例如通过农杆菌感染,并导致在所插入T-DNA附近的基因的改良表达。因靠近所引入启动子的基因的改良表达,产生的转基因植物表现显性表型。
TILLING 术语“TILLING”是基因组内定向诱导的局部损伤的缩写,并且是指用于产生和/或鉴定核酸序列的诱变技术,其中所述的核酸序列编码具有修饰表达和/或活性的蛋白质。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以显示在强度方面或在位置方面或在时间方面改良的表达(例如若突变影响启动子)。这些突变变体可以显示比由处于其天然形式的基因所显出活性更高的活性。TILLING将高密度诱变与高通量筛选方法组合。一般在TILLING中遵循的步骤是(a)EMS诱变(RedeiGP和Koncz C(1992)在Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J,Singapore编辑,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)在Meyerowitz EM,Somerville CR编辑,Arabidopsis.Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,第137-172页;Lightner J和Caspar T(1998)在JMartinez-Zapater,J Salinas编者,Methods on Molecular Biology第82卷.Humana Press,Totowa,NJ,第91-104页);(b)个体的DNA制备和汇集;(c)PCR扩增目的区;(d)变性和复性以允许形成异源双链体;(e)DHPLC,其中将异源双链体是否在汇集物中的存在检测为色谱图中的一个额外峰;(f)鉴定突变个体;和(g)对突变PCR产物测序。用于TILLING的方法是本领域众所周知的(McCallum等,(2000)NatBiotechnol 18455-457;综述见Stemple(2004)Nat Rev Genet 5(2)145-50)。
同源重组 同源重组允许选择的核酸序列在基因组中于确定的所选择位置内引入。同源重组是在生物科学中常规地用于低等生物如酵母或苔藓剑叶藓(Physcomitrella)的标准技术。用于在植物中开展同源重组的方法已经不仅对模式植物(Offringa等(1990)EMBO J 9(10)3077-84)而且对作物植物例如稻(Terada等(2002)Nat Biotech 20(10)1030-4;Iida和Terada(2004Curr Opin Biotech 15(2)132-8;Terada等,(2007)Plant Physiol)进行了描述。
产量 术语”产量”通常意指经济价值的可测量结果,一般与指定作物、与面积并与时间段有关。单个植物部分基于它们的数目、大小和/或重量而直接对产量有贡献,或实际产量是对于某作物和一年的每英亩产量,这通过总产量(包括收获的和评估的产量)除以种植的英亩数而确定。术语植物的“产量”可以是指营养生物量(根和/或枝条生物量)、繁殖器官、和/或该植物的繁殖体(例如种子)。
早期萌发势 早期萌发势是指尤其在植物生长早期期间活跃、健康、良好平衡的生长,并且可以因植物适应性增加而产生,其原因在于例如植物更好地适应其环境(即优化能源的使用和枝条与根之间的分配)。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建立,这往往导致高度均匀的田块(作物整齐地生长,即大多数植物在基本上相同的时间上达到发育的各阶段)和往往更好及更高的产量。因而,早期萌发势可以通过测量多种因子如千粒重、萌发百分数、出苗(emergence)百分数、幼苗生长、幼苗高度、根长度、根及枝条生物量和众多其它因素而确定。
增加/改善/增强 术语“增加”,”改善”或“增强”是可互换的并且应当在本申请含义上指与如本文中定义的对照植物相比至少5%、6%、7%、8%、9%或10%、优选至少15%或20%、更优选地25%、30%、35%或40%更多的产量和/或生长。
种子产量 增加的种子产量本身可以表现为下列一种或多种指标a)种子生物量(种子总重量)增加,这可以基于单粒种子和/或每株植物和/或每公顷或每英亩;b)每株植物增加的花数;c)增加的(饱满)种子数;d)增加的种子饱满率(其表述为饱满种子数与种子总数之间的比率);e)增加的收获指数,其表述为可收获部分(如种子)产量与总生物量的比率;和f)增加的千粒重(TKW),这从计数的饱满种子数及其总重量外推而来。增加的TKW可以因增加的种子大小和/或种子重量所致,并且也可以因胚和/或胚乳尺寸的增加所致。
种子产量的增加也可以表现为种子大小和/或种子体积的增加。此外,种子产量的增加本身也可以自我表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的产量也可以产生改良的结构,或可以因改良的结构而出现。
绿色指数 本文使用的“绿色指数”是从植物的数字成像计算出来的。对于在图像上属于植物对象的每一像素,计算了绿色值针对红色值(在RGB模型中的编码颜色)的比例。将绿色指数表示为绿色-对-红色比例超出给定阈值的像素的百分比。在正常生长条件下,在盐胁迫生长条件下,以及在降低的养分利用度的生长条件下,在开花之前在最后的成像中测量植物的绿色指数。相反,在干旱胁迫生长条件下,在干旱后的第一个成像中测量植物的绿色指数。
植物 如本文中所用的术语“植物”包括整株植物、植物的祖先及后代和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花和组织及器官,其中每种所提及对象包含目的基因/核酸序列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样每种提及的对象包含目的基因/核酸序列。
特别用于本发明方法中的植物包括属于植物界(Viridiplantae)超家族的全部植物,尤其单子叶植物和双子叶植物,包括选自以下的饲用或饲料豆类、观赏植物、粮食作物、树或灌木槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp.)、匍匐剪股颖(Agrostisstolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp.)、欧洲海滨草(Ammophila arenaria)、凤梨(Ananas comosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Ayena spp.)(例如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avenahybrida)、阳桃(Ayerrhoa carambola)、箣竹属(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletia excelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(例如欧洲油菜(Brassica napus)、芜青物种(Brassica rapa ssp.)[芸苔(canola)、油菜(oilseed rape)、蔓青(turniprape)])、Cadaba farinosa、茶(Camellia sinensis)、美人蕉(Cannaindica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、Carexelata、番木瓜(Carica papaya)、大果假虎刺(Carissa macrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castaneaspp.)、美洲木棉(Ceiba pentandra)、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑桔属物种(Citrusspp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋头(Colocasia esculenta)、非洲梧桐属物种(Cola spp.)、黄麻属(Corchorussp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucuscarota)、山马蝗属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(例如油棕(Elaeis guineensis)、美洲油棕Elaeis(oleifera))、穇子(Eleusine coracana)、蔗茅属(Erianthus sp.)、枇杷(Eriobotrya j aponica)、桉属(Eucalyptus sp.)、红仔果(Eugeniauniflora)、荞麦属物种(Fagopyrum spp.)、水青冈属物种(Fagus spp.)、苇状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycine spp.)(例如大豆(Glycine max)、大豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirstum)、向日葵属物种(Helianthusspp.)(例如向日葵(Helianthus annuus))、长管萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(例如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglansspp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lensculinaris)、亚麻(Linum usitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinusspp.)、Luzula sylvatica、番茄属(Lycopersicon spp.)(例如番茄(Lycopersicon esculentum、Lycopersicon lycopersicum、Lycopersiconpyriforme))、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malusspp.)、凹缘金虎尾(Malpighia emarginata)、牛油果(Mammeaamericana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkara zapota)、苜蓿(Medicago sativa)、草木樨属物种(Melilotusspp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntiaspp.)、鸟足豆属物种(Ornithopus spp.)、稻属物种(Oryza spp.)(例如稻(Oryza sativa)、阔叶稻(Oryza latifolia))、稷(Panicum miliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinacasativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、芹菜(Petroselinum crispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、猫尾草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinus spp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆草属物种(Prosopisspp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punica granatum)、西洋梨(Pyrus communis)、栎属物种(Quercusspp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubusspp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(例如马铃薯(Solanumtuberosum)、红茄(Solanum integrifolium)或番茄(Solanumlycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物种(Syzygium spp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、Triticosecale rimpaui、Triticale(Triticum secale)、小麦属物种(Triticum spp.)(例如普通小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolum minus)、金莲花(Tropaeolummajus)、越桔属物种(Vaccinium spp.)、野碗豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、Zizania palustris、枣属物种(Ziziphus spp.)等等。
发明详述 1.2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX) 令人惊讶地,现在发现调节(优选增加)植物根中编码2-Cys PRX多肽的核酸序列的表达使得植物与对照植物相比具有增强的产量相关性状。根据第一个实施方案,本发明提供了相对于对照植物在植物中增强产量相关性状的方法,所述方法包括调节(优选增加)植物根中编码2-Cys PRX多肽的核酸序列的表达。
用于调节(优选增加)编码2-Cys PRX多肽的核酸序列的表达的优选的方法是通过在植物根中引入和表达编码2-Cys PRX多肽的核酸序列。
在以下任何中提及“在本发明方法中有用的蛋白质”时意思是如本文定义的2-Cys PRX多肽。在下文任何提及“在本发明方法中有用的核酸序列”意思是能够编码此类2-Cys PRX多肽的核酸序列。待引入植物(并且因此在实施本发明的方法中有用)的核酸序列是编码下述多肽类型的任何核酸序列,其将被描述,在下文中也称为“2-Cys PRX核酸序列”或“2-Cys PRX基因”。
在本文中定义的“2-Cys PRX多肽”是指从N-端到C-端包含(1)质体转运肽;和(2)2-Cys PRX保守结构域的任何多肽。
此外,“2-Cys PRX多肽”包含下述之一或二者(i)SEQ ID NO77所示的基序1,或与SEQ ID NO77具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序;或者(ii)如SEQ ID NO78所示的基序2,或与SEQ IDNO78具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序。
可选地或额外地,在本文中定义的“2-Cys PRX多肽”是指下述任何多肽序列,当其用于构建系统发生树(例如图3中所描述的)时,倾向于与多肽的2-Cys PRX进化枝(包含SEQ ID NO2中所示的多肽序列)聚类,而不与任何其它PRX进化枝聚类。
可选地或额外地,本文定义的“2-Cys PRX多肽”是指下述任何多肽,其与SEQ IDN O2中所示的2-Cys PRX多肽或者与本文表A1中所给出的任何多肽序列以优选性增加的顺序具有至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的序列同一性。
术语“结构域”和“基序“在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecularsequences motifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on IntelligentSystems for Molecular Biology.Altman R.,Brutlag D.,Karp P.,LathropR.,Searls D.,编著,53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32D134-D137,(2004)或者Pfam(Bateman等,Nucleic AcidsResearch 30(1)276-280(2002)。用于计算机分析蛋白质序列的一组工具在ExPASy蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASythe proteomics server for in-depth protein knowledge andanalysis,Nucleic Acids Res.313784-3788(2003))提供。还可以使用常规技术(如序列比对)来鉴定结构域。SEQ ID NO2的多肽序列的分析示于以下实施例2和4中。
比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;429.MatGATan application that generates similarity/identity matrices usingprotein or DNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值(在下文的实施例3中以百分比表示)是使用默认参数的上述程序在完整的核酸序列或多肽序列(本文中表A2)上确定的,但是也可以在所选择的结构域或保守的基序(例如SEQ ID NO77所示的基序1,以及例如SEQ ID NO78所示的基序2,包含在SEQ IDNO2中的基序1和基序2)上测定。
蛋白质亚细胞定位预测的工作是很重要的,并已充分研究。了解蛋白质的定位有助于阐明其功能。蛋白质定位实验方法的范围从免疫定位到使用绿色荧光蛋白(GFP)标记蛋白质。这些方法很准确,但与计算机方法相比需要大量劳动。从序列数据对蛋白质定位进行计算机预测近来已取得很大进展。本领域技术人员熟知的算法在Swiss Institute forBioinformatics提供的ExPASy蛋白组学工具可获得,例如PSort、TargetP、ChloroP、Predotar、LipoP、MITOPROT、PATS、PTS1、SignalP等。对本发明多肽亚细胞定位的鉴定示于实施例5中。具体地,本发明的SEQ ID NO2被指定到光合作用(自养)细胞的质体(叶绿体)区室。
靶向蛋白质至质体的方法为本领域所熟知,包括使用转运肽。表3显示了可用于将任何2-Cys PRX多肽靶向至质体的转运肽实例,其中天然形式的2-Cys PRX多肽通常不靶向至质体,或者其中天然形式的2-CysPRX多肽通过不同的转运肽(例如,其天然转运肽)靶向至质体。例如,编码蓝细菌2-Cys PRX多肽的核酸序列也可适用于本发明的方法,只要2-Cys PRX多肽靶向质体(优选叶绿体)即可。
表3可用于将多肽靶向至质体的转运肽序列的实例 2-Cys PRX多肽被靶向至质体并在其中是有活性的,即2-Cys PRX多肽(至少以其天然形式)能够催化在叶绿体中移除H2O2。用于测试这一活性的测定是本领域已知的。其它细节在实施例6中提供。
本发明以SEQ ID NO1所示的核酸序列转化植物来进行举例说明,其编码多肽序列SEQ ID NO2。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何2-Cys PRX编码核酸序列或2-Cys PRX多肽序列来实施。
2-Cys PRX多肽编码核酸序列的实例在本文实施例1的表A1中给出。这样的核酸序列可用于实施本发明的方法。实施例1的表A1中给出的多肽序列为SEQ ID NO2所示2-Cys PRX多肽序列的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST检索容易地找到其它直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例1的表A1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ IDNO1或SEQ ID NO2的情况下,二次BLAST将会针对芸苔属序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中高排名的命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名的命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物(见图3)。
核酸变体也可用于实施本发明的方法。这类变体的实例包括编码实施例1的表A1所示任一多肽序列的同源物和衍生物的核酸序列,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例1的表A1所示任一多肽序列的直向同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括2-Cys PRX多肽的编码核酸序列的部分、与2-Cys PRX多肽的编码核酸序列杂交的核酸序列、2-Cys PRX多肽的编码核酸序列的剪接变体、2-Cys PRX多肽的编码核酸序列的等位变体,以及通过基因改组获得的2-Cys PRX多肽的编码核酸序列的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
2-Cys PRX多肽的编码核酸序列无需是全长核酸序列,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物的根中引入和表达实施例1的表A1所示任一核酸序列的部分、或者编码实施例1的表A1所示任一多肽序列的直向同源物、旁系同源物或同源物的核酸序列的部分。
例如,可以通过对核酸序列进行一个或多个缺失来制备所述核酸序列的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的2-Cys PRX多肽,并与实施例1的表A1所示多肽序列具有基本上相同的生物活性。优选“部分”是实施例1的表A1所示任一核酸序列的部分,或是编码实施例1的表A1所示任一多肽序列的直向同源物或旁系同源物的核酸序列的部分。优选该部分长度为至少500、550、600、650、700、750、800个连续核苷酸,所述连续核苷酸是实施例1表A1所示任一核酸序列的或者是编码实施例1表A1所示任一多肽序列的直向同源物或旁系同源物的核酸序列的。最优选部分是核酸序列SEQ ID NO1的部分。优选部分编码这样的多肽序列,当例如如图3所示利用其构建系统发生树时,其倾向于与包含SEQ ID NO2所示多肽序列的2-Cys PRX多肽的群而非任何其他群聚类。
可用于本发明方法的另一类核酸变体为在降低的严格条件下、优选在严格条件下,能够与本文所定义的2-Cys PRX多肽的编码核酸序列或者本文所定义的部分杂交的核酸序列。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物的根中引入和表达能够与实施例1的表A1所示任一核酸序列杂交的核酸序列,或者包括在植物的根中引入和表达能够与编码实施例1表A1所示任何核酸序列的直向同源物、旁系同源物或同源物的核酸序列杂交的核酸序列。
可用于本发明方法的杂交序列编码如本文所定义的2-Cys PRX多肽,与实施例1表A1所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与实施例表A1所示任一核酸杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者杂交序列能够与编码实施例1表A1所示任一多肽序列的直向同源物或旁系同源物的核酸序列杂交。最优选杂交序列能够与SEQ ID NO1所示的核酸序列或其部分杂交 优选杂交序列编码这样的多肽序列,当如图3所示利用其构建系统发生树时,其倾向于与包含SEQ ID NO2所示多肽序列的2-Cys PRX多肽的群而非任何其他群聚类。
可用于本发明方法的另一类核酸变体为编码前文所定义的2-Cys PRX多肽的剪接变体,其中剪接变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物的根中引入和表达实施例1表A1所示任一核酸序列的剪接变体、或编码实施例1表A1所示任意多肽序列的直向同源物、旁系同源物或同源物的核酸序列的剪接变体。
优选的剪接变体是SEQ ID NO1所示核酸序列的剪接变体,或编码SEQ ID NO2的直向同源物或旁系同源物的核酸序列的剪接变体。优选剪接变体编码这样的多肽序列,其在例如如图3所示构建系统发生树时,其倾向于与包含SEQ ID NO2所示多肽序列的2-Cys PRX多肽的群而非任何其他群聚类。
可用于实施本发明方法的另一类核酸变体为前文所定义的2-Cys PRX多肽的编码核酸序列的等位变体,其中等位变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物的根中引入和表达实施例1表A1所示任一核酸序列的等位变体,或者包括在植物的根中引入和表达编码实施例1表A1所示任何多肽序列的直向同源物、旁系同源物或同源物的核酸序列的等位变体。
可用于本发明方法的等位变体与SEQ ID NO2的2-Cys PRX多肽及实施例1的表A1所示的任何多肽序列具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的使用包含于本发明的方法中。优选等位变体为SEQ ID NO1的等位变体,或编码SEQ ID NO2的直向同源物或旁系同源物的核酸序列的等位变体。优选等位变体所编码的多肽序列,当利用其在例如如图3所示构建系统发生树时,倾向于与包含SEQ IDNO2所示多肽序列的2-Cys PRX多肽而非任何其他群聚类。
基因改组或定向进化也可用于产生上文所定义的2-Cys PRX多肽的编码核酸序列的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物的根中引入和表达实施例1表A1所示任一核酸序列的变体,或者包括在植物的根中引入和表达编码实施例1的表A1给出的任何多肽序列的直向同源物、旁系同源物或同源物的核酸序列的变体,其中所述变体核酸序列通过基因改组获得。
优选通过基因改组获得的变体核酸序列编码的多肽序列,其在例如如图3所示构建系统发生树时,倾向于与包含SEQ ID NO2所示多肽序列的2-Cys PRX多肽的群而非任何其他群聚类。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编辑)。
编码2-Cys PRX多肽的核酸序列可以来自天然来源,例如来自真细菌或真核生物(真菌、植物或动物)。核酸序列来自任何人工来源,或可以通过有意的人为操作在组成和/或基因组环境上修饰,使之不同于天然形式。优选2-Cys PRX多肽编码核酸序列来自植物,还优选来自双子叶植物,更优选来自芸苔科(Brassicaceae),最优选核酸序列来自芜青(Brassica rapa)。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
本发明提供了增强相对于对照植物的植物产量相关性状、特别是植物的种子产量的方法,所述方法包括调节,优选提高,植物的根中本文所定义的2-Cys PRX多肽的编码核酸序列的表达。
由于本发明的转基因植物具有增强的产量相关性状,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节、优选增加本文中所定义的编码2-Cys PRX多肽的核酸序列在植物根中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于在可比条件下生长的对照植物而具有增强的产量相关性状的植物。如在Wang等(Planta(2003)2181-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(PlantPhysiol(2003)1331755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(cross talk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增强的产量相关性状。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增强产量相关性状的方法,所述方法包括调节、优选增加编码2-CysPRX多肽的核酸序列在植物的根中的表达。
本发明方法的实施导致在非生物胁迫条件下培养的植物相对于可比条件下培养的对照植物具有增强的产量相关性状。如在Wang等(Planta(2003)2181-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。由于不同的环境胁迫激活相似的途径,因此本发明就干旱胁迫进行的示例不应看作局限在干旱胁迫,而是更应看作为筛选,其表明上文定义的2-Cys PRX多肽在一般性非生物胁迫下参与相对于在可比胁迫条件下培养的对照植物而增强产量相关性状。
报道了干旱胁迫与高盐度胁迫间极高程度的“交叉(crosstalk)”(Rabbani等,(2003),Plant Physiol1331755-1767))。因此,很显然,除了在相对于在干旱胁迫条件下培育的对照植物而言增强植物的产量相关性状中有用外,2-Cys PRX多肽还在相对于在多种其它非生物胁迫条件下生长的对照植物而言增强植物中产量相关性状中有用。
本文定义的术语“非生物胁迫”指以下任何一种或多种水胁迫(由于干旱或水过多)、厌氧胁迫、盐胁迫、温度胁迫(由于热、冷或冰冻温度)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,水胁迫为干旱胁迫。术语“盐胁迫”不仅限于常见盐(NaCl),而是可以为由以下一种或多种引起的任何胁迫NaCl、KCl、LiCl、MgCl2、CaCl2等。
特别地,相对于在可比胁迫条件下培育的对照植物而言,在非生物胁迫条件下(优选在干旱胁迫条件下)培育的植物中增强的产量相关性状可以包括下列一种或多种(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
本发明方法的实施赋予在非生物胁迫条件下植物相对于在可比胁迫条件下培养的对照植物而言具有增强的产量相关性状。因此,根据本发明,提供了在非生物胁迫条件下培养的植物中增强产量相关性状的方法,该方法包括在植物的根中调节,优选提高编码2-Cys PRX多肽的核酸序列的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选自以下一种或多种水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选地,水胁迫是干旱胁迫。
非生物环境胁迫的另一实例是植物生长和发育的同化所需的一种或多种养分利用度的降低。由于养分利用效率对植物产量和产品质量有显著影响,因此在田间倾倒了大量肥料来优化植物生长和质量。植物的生产力一般受限于三种主要养分磷、钾和氮,在这三者中,氮通常是植物生长的限速元素。因此,植物生长所需的主要营养元素是氮(N)。这是可见于活细胞中的多种重要化合物的组分,所述化合物包括氨基酸、蛋白质(酶)、核酸和叶绿素。植物干物质的1.5%至2%以及总植物蛋白质的约16%是氮。因此,氮的利用度是作物植物生长和生产的主要限制因素(Frink等(1999)Proc Natl Acad Sci USA 96(4)1175-1180),并也对蛋白质积累和氨基酸组成有重大影响。因此,在氮有限条件下培养时具有增加的产量的作物植物是很有意义的。
本发明方法的实施赋予在养分缺乏条件下(特别是在氮缺乏的条件下)培养的植物相对于在可比条件下培养的对照植物而言具有增强的产量相关性状。因此,根据本发明,提供了在养分缺乏条件下培养的植物中增强产量相关性状的方法,该方法包括在植物的根中调节,优选提高编码2-Cys PRX多肽的核酸序列的表达。养分缺乏可能是由于养分(如氮、磷酸和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等)的缺少或过剩所致。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的2-Cys PRX多肽的核酸转基因,其与根特异性启动子有效连接。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达2-Cys PRX多肽编码核酸序列。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有 (a)编码如上文所定义的2-Cys PRX多肽的核酸序列; (b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的 (c)转录终止序列。
优选地,编码2-Cys PRX多肽的核酸序列如本文所定义。术语“控制序列”和“终止序列”如本文所定义 术语“控制序列”和“终止序列”如本文所定义。
在一个实施方案中,一种构建体的控制序列是器官特异性启动子,优选用于在植物的根中表达的启动子。根特异性启动子的一个实例是Rcc3启动子,如SEQ ID NO80所示的稻Rcc3启动子。
可以使用含有任何上述核酸序列的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子(天然或合成)可以用于驱动核酸序列的表达。根据本发明优选的特征,编码2-Cys PRX多肽的核酸序列与根特异性启动子有效连接。根特异性启动子优选是RCc3启动子(PlantMol Biol.1995 Jan;27(2)237-48),更优选RCc3启动子来自稻,进一步优选RCc3启动子由与SEQ ID NO80基本上相似的核酸序列所表示,最优选地启动子由SEQ ID NO80所表示。也可以用于实施本发明方法的其它根特异性启动子的实例显示于上文“定义”部分的表2b中。
应当清楚,本发明的应用不仅限于由SEQ ID NO1所表示的2-CysPRX多肽编码核酸序列,而且本发明的应用也不限于由根特异性启动子所驱动的2-Cys PRX多肽编码核酸序列的表达。
其它器官特异性启动子(例如用于在叶、茎、块茎、分生组织、种子(胚和/或胚乳)中优选表达)在实施本发明的方法中是有用的。对于多种启动子类型的定义参见本文中“定义”部分。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量,如本文定义部分所描述的。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于f1-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸序列的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。选择标记在本文“定义”部分中有更详细的描述。
已知当核酸序列稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与在包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸序列稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。一旦不再需要,可以从转基因细胞移除或切除标记基因。用于标记基因移除的技术是本领域已知的,有用的技术在上文中描述于定义部分。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物的根中引入和表达编码上文所定义的2-CysPRX多肽的任何核酸序列。
更具体地,本发明提供了产生具有增强的产量相关性状的转基因植物的方法,所述方法包括 (i)向植物、植物部分或植物细胞中引入和表达编码2-Cys PRX多肽的核酸序列,所述序列在根特异性启动子的控制下;和 (ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸序列可以是能够编码如本文所定义的2-Cys PRX多肽的任何核酸序列。
可以将核酸序列直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的特征,优选通过转化将核酸序列引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对可选择标记如上文所述标记的存在筛选转化的植物。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括含有分离的编码上文所定义的2-Cys PRX多肽的核酸序列的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸序列或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用料或饲料豆类、观赏植物、食品作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸序列或基因或基因产物之表达的方法均已详细记载于本领域中,并且在定义部分中提供了实例。
如上文所述,调节(优选提高)2-Cys PRX多肽编码核酸序列之表达的优选方法是在植物的根中引入和表达编码2-Cys PRX多肽的核酸序列;然而也可使用其他熟知的技术实现实施本方法的效果,即增强产量相关性状。所述技术包括但不限于T-DNA激活标签化、TILLING、同源重组。这些技术的描述提供在定义部分中。
本发明还包括编码如本文所述的2-Cys PRX多肽的核酸序列以及这些2-CysPRX多肽在增强植物任何上述产量相关性状中的用途。
可以在育种程序中使用编码本文所述2-Cys PRX多肽的核酸序列或所述2-Cys PRX多肽本身,其中鉴定可能与2-Cys PRX多肽编码基因遗传连锁的DNA标记。可以使用所述基因/核酸序列,或所述2-CYS PRX多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
2-Cys PRX多肽编码基因/核酸序列的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增强产量相关性状的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码2-Cys PRX多肽的核酸序列也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。2-Cys PRX多肽编码核酸序列的这种用途仅需要具有至少15个核苷酸长度的核酸序列。2-Cys PRX多肽编码核酸序列可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,ALaboratory Manual)可以用2-Cys PRX编码核酸序列探测。产生的条带图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics1174-181)进行遗传分析以构建遗传图。此外,该核酸序列可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算2-Cys PRX多肽编码核酸序列在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 437-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在Non-mammalian Genomic AnalyasisA PracticalGuide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.513-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸序列而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 1195-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16325-332)、等位基因特异性连接(Landegren等(1988)Science 2411077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.183671)、放射杂交作图(Walter等(1997)Nat.Genet.722-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.176795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
2.膜联蛋白样(ANN) 令人惊讶地,现在发现在植物中调节编码膜联蛋白样(以后称为ANN)多肽的核酸的表达赋予了植物相对于对照植物具有增强的产量相关性状。根据第一个实施方案,本发明提供了在植物中用于相对于对照植物增强产量相关性状的方法,所述方法包括在植物中调节编码ANN多肽的核酸的表达。
用于调节(优选增加)编码ANN多肽的核酸的表达的优选的方法是在植物中引入和表达编码ANN多肽的核酸。
在下文中对于“本发明方法中有用的蛋白质”的任何提及是指如本文定义的ANN多肽。下文中对于“本发明方法中有用的核酸”的任何提及是指能够编码此类ANN多肽的核酸。待被引入植物(并且因此在实施本发明的方法中有用)的核酸是编码将要被描述的蛋白质类型的任何核酸,在下文中也被称为“ANN核酸”或“ANN基因”。
在本文定义的“ANN多肽”是指以其天然形式(即如其在基因组中所编码的蛋白质)包含至少一个、优选两个或更多个的下列保守的特征序列的任何多肽 特征序列1(SEQ ID NO87) (A/L/V)(M/V/L/I)(L/V/M/I/C)X(W/F)(I/V/M/T/A)(L/P/Y/M/F)(D/E/S/H)(P/A)X(G/S/E/A)RDA 其中第4位的X可以是任何氨基酸,优选的L、S、I、V、Q或M之一;并且第10位的X可以是任何氨基酸,优选地A、V、P、G、S、T或W之一。
优选地,特征序列1是 (A/L/V)(V/L/I)(L/V/M/I)X(W/F)(V/T/A)(L/Y/M/F)(D/E/S/H)PX(E/A)RDA 特征序列2(SEQ ID NO88) A(F/I/V/C/G)XG(F/R/W/M)G(C/T/V)(D/N)(S/A/T/E)X(T/A/V/L/M)(V/I/L)(I/T)X(I/V/T)L(T/A/G)(H/Q/K)(R/S) 其中第3位的X可以是任何氨基酸,优选地K,R,Q,S,E,A或M之一;第10位的X可以是任何氨基酸,优选地T,S,K,N,G,D,A,E,Q,或R之一;第14位的X可以是任何氨基酸,优选地N,A,R,E,D,S,Q之一。
优选地,特征序列2是 A(F/I/V/C/G)XG(W/M)G(T/V)(D/N)EX(A/L/M)(I/L)(I/T)X(I/V/T)L(A/G)(H/Q/K)(R/S) 特征序列3(SEQ ID NO89) (T/S)(D/N/E/T)(D/E/K)XXL(I/T/S/N)R(V/I/A/G)(V/I/F)(V/T/C/S/A)(T/S)R(T/A)(E/D)(I/V/F/L/K/H)(D/S) 其中第4位的X可以是任何氨基酸,优选地S,T,D,E,G,W,N,K之一;第5位的X可以是任何氨基酸,优选地T,A,S,M,H,D,G,W之一。
优选地,特征序列3是 (T/S)(D/E/T)(D/E/K)XXL(T/S/N)R(V/I/A/G)(V/I/F)(V/T/C/S/A)(T/S)R(T/A)(E/D)(I/V/F/L/K/H)(D/S) 特征序列4(SEQ ID NO90) (Y/H)(F/Y)(A/E/V/S)(K/E/D)(V/A/L/I)(L/V/I)(R/H/D)X(S/A)(M/I/L) 其中第8位的X可以是任何氨基酸,优选地K,E,D,T,L,S,Q,R,N,或A之一。
优选地,特征序列4是 (Y/H)(F/Y)(A/E/V/S)(K/E/D)(V/L/I)(L/V/I)(R/D)X(S/A)(I/L) 特征序列5(SEQ ID NO91) (Y/G/K/S)(L/I/M)E(H/E)(D/H)(I/V/L)(G/A/E) 优选地,特征序列5是 S(L/I/M)EE(D/H)(I/V/L)A 特征序列6(SEQ ID NO92) (F/L/V/I/T)(I/L/V)(R/Q/Y)(I/V)(F/L/V/I)(T/S/G/A)(E/D/T)RS 优选地,特征序列6是 (F/L/V/I/T)(I/L/V)(R/Y)(I/V)(L/V/I)(T/S/G/A)TRS 特征序列7(SEQ ID NO93) Y(R/K/M/E/Q)X(F/T/L/M/I)(L/I)(L/I/V)(S/T/V/A)L(V/I/L/A/M)(G/S) 其中第3位的X可以是任何氨基酸,优选地T,D,N,K,S,R,A之一。
由于ANN多肽涉及膜联蛋白,在本发明方法中有用的ANN多肽优选还具有一个或多个膜联蛋白结构域(Pfam entry PF00191、SMARTentry SM00335、InterPro IPR001464,还见图7A和7B)。
优选地,当在系统发生树的构建中使用时(例如图8中所描述的)(取自Cantero等人,Plant Physiol.Biochem.44,13-24,2006),多肽序列倾向于与包含由SEQ ID NO84和SEQ ID NO135所表示的氨基酸序列的ANN多肽的群而非任何其它群聚类。
术语“结构域”、“基序”和“特征”在本文“定义”章节中定义。存在用于鉴定结构域的专门数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244,InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318;Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecularsequences motifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceedings 2nd International Conference on IntelligentSystems for Molecular Biology.Altman R.,Brutlag D.,Karp P.,LathropR.,Searls D.,编著,53-61页,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32D134-D137,(2004)或者Pfam(Bateman等,Nucleic AcidsResearch 30(1)276-280(2002)。用于计算机分析蛋白质序列的一组工具在ExPASY蛋白组服务器(Swiss Institute of Bioinformatics(Gasteiger等,ExPASythe proteomics server for in-depth protein knowledge andanalysis,Nucleic Acids Res.313784-3788(2003))提供。还可以使用常规技术(如序列比对)来鉴定结构域。
比对序列以进行比较的方法为本领域所熟知,这些方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP利用Needleman和Wunsch((1970)J Mol Biol 48443-453)的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对(即在完整序列上)。BLAST算法(Altschul等(1990)J Mol Biol 215403-10)在两序列间计算百分比序列同一性并进行相似性的统计学分析。用于进行BLAST分析的软件在国际生物技术信息中心(National Centre for Biotechnology Information(NCBI))向公众提供。可以使用如默认配对比对参数的ClustalW多重序列比对算法(1.83版)和百分比评分法来容易地鉴定同源物。也可以使用MatGAT软件包(Campanella等,BMC Bioinformatics.2003 Jul 10;429.MatGATan application that generates similarity/identity matrices usingprotein or DNA sequences)中提供的一种方法确定全局的相似性和同一性百分比。本领域技术人员会意识到,可以进行少量手动编辑以优化保守性基序之间的比对。此外,还可以使用特定的结构域代替全长序列来鉴定同源物。序列同一性值可以是使用默认参数的上述程序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序测定的。
此外,ANN多肽(至少在其天然形式下)一般具有钙结合活性和结合至膜的能力。用于测量膜结合活性的工具和技术为本领域所熟知,并且包括对膜表面疏水性、小泡渗漏或小泡聚集的效果的测量。此外,ANN多肽可以表现出酶促活性,例如来自拟南芥的膜联蛋白1被报道表现出过氧化物酶活性(Gorecka等人.,Biochem.Biophys.Res.Comm.336,868-875,2005)。进一步的细节在实施例19中提供。
本发明以SEQ ID NO83所示的核酸序列转化植物来进行举例说明,其各自编码多肽序列SEQ ID NO84。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何ANN编码核酸或ANN多肽来实施。
编码ANN多肽的核酸的实例在本文实施例14的表B1中给出。这样的核酸可用于实施本发明的方法。实施例14的表B1中给出的氨基酸序列为SEQ ID NO84所示ANN多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。可以通过进行所谓的交互BLAST检索容易地找到更多直向同源物和旁系同源物。通常,这包括以查询序列(例如,利用实施例14表B1中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST的一次BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO83或SEQID NO84的情况下,二次BLAST将会针对拟南芥序列)。然后比较一次和二次BLAST的结果。如果一次BLAST中的高排名命中来自查询序列源自的相同物种,然后反向BLAST理想地导致查询序列处于最高命中之列,则找到了旁系同源物;如果一次BLAST中高排名命中不来自查询序列源自的相同物种,且优选地在反向BLAST时导致查询序列在最高命中中,则找到了直向同源物。
高排名的命中是E值低的命中。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还对比较进行同一性百分比评分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalW,继之以邻接树来辅助相关基因的聚类可视化,和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码实施例14表B1中所示任一氨基酸序列的同源物和衍生物的核酸,其中术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有编码实施例14表B1所示任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。
可用于实施本发明方法的其他核酸变体包括ANN多肽编码核酸的部分、与ANN多肽编码核酸杂交的核酸、ANN多肽编码核酸的剪接变体、ANN多肽编码核酸的等位变体,以及通过基因改组获得的ANN多肽编码核酸的变体。术语杂交序列、剪接变体、等位变体和基因改组如本文所述。
编码ANN多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达本文实施例14表B1所示任一核酸序列的部分、或者编码实施例14表B1所示任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
例如,可以通过对核酸进行一个或多个缺失来制备所述核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分所预测到的要大。
可用于本发明方法的“部分”编码如本文所定义的ANN多肽,并与实施例14的表B1所示氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例14的表B1所示任一核酸的部分,或是编码实施例14的表B1所示任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选地,部分长至少400、450、500、550、600、650、700个连续核苷酸,其中连续核苷酸是来自实施例14的表B1中给出的任一核酸序列中的,或者是来自实施例14表B1中给出的任一氨基酸序列的直向同源物或旁系同源物的编码核酸中的。最优选地,部分是SEQ ID NO83的核酸的部分。优选地,部分编码下述氨基酸序列,当使用其来构建系统发生树时(例如图8中所描述的),其倾向于与包含SEQ ID NO84和SEQ ID NO135所示的氨基酸序列的ANN群而非任何其它群聚类。
可用于本发明方法的另一核酸变体是能在降低的严格条件下(优选在严格条件下)与编码本文所定义ANN多肽的核酸或本文所定义的部分杂交的核酸。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达能够与实施例14的表B1所示任一核酸杂交的核酸,或者包括在植物中引入和表达能够与编码实施例14的表B1所示任何核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
可用于本发明方法的杂交序列编码如本文所定义的ANN多肽,并与实施例14的表B1所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与实施例14的表B1所示任一核酸杂交、或与任何前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列能够与编码实施例14的表B1所示任一氨基酸序列的直向同源物或旁系同源物的核酸杂交。最优选杂交序列能够与SEQ ID NO83所示的核酸或其部分杂交。
优选地,杂交序列编码这样的氨基酸序列,当如图8所示利用其构建系统发生树时,其倾向于与包含SEQ ID NO84和SEQ ID NO135所示氨基酸序列的ANN多肽的群而非任何其他群聚类。
可用于本发明方法的另一核酸变体是编码本文所定义ANN多肽的剪接变体,剪接变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例14的表B1所示任一核酸序列的剪接变体,或者编码实施例14的表B1所示任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
优选的剪接变体是SEQ ID NO83所示核酸的剪接变体,或编码SEQID NO84的直向同源物或旁系同源物的核酸的剪接变体。优选剪接变体所编码的氨基酸序列当例如在如图8所示用于构建系统发生树时,其倾向于与包含SEQ ID NO84和SEQ ID NO135所示氨基酸序列的ANN多肽的群而非任何其他群聚类。
可用于实施本发明方法的另一核酸变体为前文所定义的ANN多肽编码核酸的等位变体,其中等位变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例14的表B1所示任一核酸的等位变体,或者包括在植物中引入和表达编码实施例14表B1所示任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位变体。
可用于本发明方法的等位变体与SEQ ID NO84的ANN多肽及实施例14表B1所示的任一氨基酸序列具有基本上相同的生物活性。等位变体天然存在,并且这些天然等位基因的用途包含于本发明的方法中。优选等位变体为SEQ ID NO83的等位变体,或编码SEQ ID NO84的直向同源物或旁系同源物的核酸的等位变体。优选等位变体所编码的氨基酸序列当在例如如图8所示用于构建系统发生树时,其倾向于与包含SEQ ID NO84和SEQ ID NO135所示氨基酸序列的ANN多肽而非任何其他群聚类。
基因改组或定向进化也可用于产生上文所定义的ANN多肽编码核酸的变体;其中术语“基因改组”如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例14的表B1所示任一核酸序列的变体,或者包括在植物中引入和表达编码实施例14的表B1给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
优选通过基因改组获得的变体核酸所编码的氨基酸序列在例如如图8所示构建系统发生树时,其倾向于与包含SEQ ID NO84和SEQ ID NO135所示氨基酸序列的ANN多肽的群而非任何其他群聚类。
另外,核酸变体也可以通过位点定向诱变获得。几种方法可用于实现位点定向诱变,最常见的是基于PCR的方法(Current Protocols inMolecular Biology.Wiley编辑)。
编码ANN多肽的核酸可以衍生自任何天然来源或人工来源。核酸可以根据其天然形式就组成和/或基因组环境方面通过人类有意操作而加以修饰。优选地,编码ANN多肽的核酸来自植物,还优选来自双子叶植物,更优选来自芸苔科(Brassicaceae)、该核酸最优选地来自拟南芥。
本发明方法的实施产生具有增强的产量相关性状的植物。尤其本发明方法的实施产生相对于对照植物而具有增加的产量、尤其增加的种子产量的植物。在本文中的“定义”部分中更详细地描述了术语“产量”和“种子产量”。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量(重量)增加,所述的部分可以包括地上(可收获)部分和/或地下(可收获)部分。尤其,此类可收获部分是种子,并且本发明方法的实施产生相对于对照植物的种子产量具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为下列一种或多种指标每公顷或英亩中已建立植物数的增加、每株植物穗数的增加、行数的增加、每行粒数、粒重、千粒重、玉米穗长度/直径、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)及其它。以稻为例,产量增加本身可以表现为下列一种或多种指标的增加每公顷或英亩植物数、每株植物圆锥花序数、每圆锥花序小穗数、每圆锥花序花(小花)数(其表达为饱满种子数对原圆锥花序数之比)、种子饱满率的增加(其中种子饱满率是饱满种子数除以种子总数并乘以100)、千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、特别是种子产量的方法,所述方法包括调节植物中本文所定义的ANN多肽编码核酸的表达(优选提高表达)。
由于本发明的转基因植物具有增加的产量,因而相对于对照植物的生长速率,这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率(在其生活周期的至少部分期间)。
增加的生长速率可以对于植物的一个或多个部分(包括种子)是特异性的,或可以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种子的阶段所需要的时间。这个生活周期可以受下列因素影响,如早期萌发势、生长速率、绿度指数、开花时间和种子成熟速度。生长速率的增加可以在植物生活周期中的一个或多个阶段上或在基本上整个植物生活周期期间发生。在植物生活周期中的早期期间增加的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期,允许植物较晚播种和/或较早收获,否则这将不可能(相似的作用可以用较早的开花时间获得)。若生长速率充分地增加,可以允许进一步播种相同植物物种的种子(例如播种并收获稻植物,随后播种并收获其它稻植物,全部稻植物均在一个常规生长时段内)。类似地,若生长速率足够地增加,可以允许进一步播种不同植物物种的种子(例如播种并收获玉米植物,随后例如播种并任选收获大豆、马铃薯或任何其它合适植物)。从相同的根茎中收获额外次数在一些作物植物的情况中也是可能的。改变植物的收获周期可以导致每英亩的年生物量产量的增加(因任何特定植物可以生长并收获的次数(如在一年中)增加)。生长速率的增加也可以允许比其野生型对应物在更广泛的地理区域内培育转基因植物,因为对培育作物的区域限制往往由栽种时节(早季)或在收获时期(晚季)的不利环境条件所决定。若缩短收获周期,则可以避开这类不利条件。生长速率可以通过从生长曲线中得到多种参数而确定,此类参数可以是T-Mid(植物达到其50%最大尺寸所花费的时间)和T-90(植物达到其90%最大尺寸所花费的时间),等等。
根据本发明的优选特征,本发明方法的实施产生相对于对照植物而具有增加的生长速率的植物。因而根据本发明,提供增加植物生长速率的方法,所述方法包括调节表达、优选增加本文中所定义的编码ANN多肽的核酸在植物中的表达。
与对照植物相比,无论植物处于非胁迫条件下还是植物暴露于多种胁迫下,都发生产量和/或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在严重胁迫条件下,植物甚至可以完全停止生长。另一方面,轻微胁迫在本文中定义为植物对其暴露的任何胁迫,其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。与非胁迫条件下的对照植物相比,轻微胁迫在本发明意义中导致受胁迫植物生长降低小于40%、35%或30%,优选小于25%、20%或15%,更优选小于14%、13%、12%、11%或10%或更低。由于农业实践(灌溉、施肥、杀虫剂处理)上的进步,在栽培作物植物中并不经常遇到严重胁迫。因此,由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和/或非生物性(环境)胁迫。非生物胁迫可以因干旱或水涝、厌氧胁迫、盐胁迫、化学毒性、氧化胁迫和热、寒冷或冰冻温度所致。非生物胁迫可以是由水胁迫(尤其因为干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、病毒、真菌和昆虫引起的那些胁迫。
尤其,本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于对照植物而具有增加的产量的植物。如在Wang等(Planta(2003)2181-14)中报道,非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、生理学变化、生物化学变化和分子变化。已知干旱、盐度、极端温度和氧化胁迫是相互联系的并可以通过相似机制而诱导生长损害及细胞损害。Rabbani等(Plant Physiol(2003)1331755-1767)描述了干旱胁迫与高盐度胁迫间极高程度的“交叉(crosstalk)”。例如,干旱和/或盐化作用主要表现为渗透胁迫,导致细胞内稳态和离子分布的破坏。经常伴随高温或低温、盐度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此,这些多样的环境胁迫常常激活相似的细胞信号途径和细胞应答,如产生胁迫蛋白质、上调抗氧化物质、积累相容性溶质和生长抑制。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的环境条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。
本发明方法的实施相对于在可比条件下培育的对照植物,赋予在非胁迫条件下或在轻微干旱条件下培育的植物增加的产量。因而根据本发明,提供用于在非胁迫条件下或在轻微干旱条件下培育的植物中增加产量的方法,所述方法包括增加编码ANN多肽的核酸在植物中表达。
本发明方法的实施赋予在养分缺乏条件下(特别是在氮缺乏的条件下)培养的植物相对于在可比条件下培养的对照植物而言增加的产量。因此,根据本发明,提供了在养分缺乏条件下培养的植物中增加产量的方法,该方法包括在植物中增加编码ANN多肽的核酸的表达。养分缺乏可能是由于养分(如氮、磷酸和其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等)的缺少所致。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的ANN多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于在植物中引入和/或表达ANN多肽编码核酸。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更具体地,本发明提供这样的构建体,其含有 (a)编码如上文所定义的ANN多肽的核酸; (b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选的 (c)转录终止序列。
优选地,编码ANN多肽的核酸如上文所定义。术语“控制序列”和“终止序列”如本文所定义。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。将目的序列有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,任何类型的启动子(天然或合成的)均可用于驱动核酸序列的表达。组成型启动子在所述方法中特别有用。多种启动子类型的定义参见本文的“定义”部分。本发明方法中也有用的是绿色组织特异性启动子。
应当清楚本发明的应用不限于编码由SEQ ID NO83所示的核酸的ANN多肽,本发明的应用也不限于由组成型启动子驱动时或由绿色组织特异性启动子驱动时ANN多肽编码核酸的表达。
组成型启动子优选是GOS2启动子,优选来自稻的GOS2启动子。更优选地,组成型启动子由与SEQ ID NO94基本类似的核酸序列所表示,最优选地,组成型启动子如SEQ ID NO94所示。组成型启动子的其它实例参见本文“定义”部分中的表2a。
根据本发明另一个优选的特征,编码ANN多肽的核酸与绿色组织-特异性启动子有效连接。绿色组织特异性启动子优选是扩展蛋白启动子,更优选是来自稻的扩展蛋白启动子。更优选地,绿色组织-特异性启动子由与SEQ ID NO95基本类似的核酸序列所表示,最优选地,绿色组织特异性启动子由SEQ ID NO95表示。其它绿色组织特异性启动子的实例参见本文“定义”部分中的表2g。
任选地,可在引入植物的构建体中使用一个或多个终止子序列。其他调节元件可包括转录及翻译增强子。本领域技术人员会了解适于实施本发明的终止子和增强子序列。也可将内含子序列添加至5′非翻译区(UTR)或编码序列上,以增加在细胞溶胶内积累的成熟信息的量,如本文定义部分所描述的。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区之外)可以是蛋白质和/或RNA稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括需要用于在特定细胞类型中维持和/或复制的复制起点序列。一个实例是当需要将遗传构建体在细菌细胞中维持为附加型遗传元件(例如质粒或粘粒分子)时。优选的复制起点包括但不限于fl-ori和colE1。
为检测如在本发明方法中所用核酸序列的成功转移和/或选择包含这些核酸的转基因植物,使用标记基因(或报道基因)是有利的。因而,遗传构建体可以任选地包含选择标记基因。选择标记在本文“定义”部分中有更详细的描述。
已知当核酸稳定或瞬时整合至植物细胞时,仅小部分的细胞摄取外来DNA并且根据需要将其整合至细胞基因组,这取决于所用表达载体和使用的转染技术。为鉴定并选择这些整合子,通常将编码选择标记(如上文所述之一)的基因连同目的基因一起引入宿主细胞。这些标记可以在其中这些基因因例如常规方法所致的缺失而无功能的突变体中使用。此外,编码选择标记的核酸分子可以引入宿主细胞中,与包含编码本发明多肽或本发明方法中所用多肽的序列在同一载体上,或在单独的载体上。已经用引入的核酸稳定转染的细胞可以通过选择进行鉴定(例如具有整合的选择标记的细胞存活而其它细胞死亡)。一旦不再需要,可以从转基因细胞移除或切除标记基因。用于标记基因移除的技术是本领域已知的,有用的技术在上文中描述于定义部分。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方法,其包括在植物中引入和表达编码上文所定义的ANN多肽的任何核酸。
更具体地,本发明提供了产生具有增加的增强的产量相关性状(特别是增加的种子产量)的转基因植物的方法,所述方法包括 (i)在植物或植物细胞中引入和表达ANN多肽编码核酸;和 (ii)在促进植物生长和发育的条件下培养植物细胞。
(i)的核酸可以是能够编码如本文所定义的ANN多肽的任何核酸。
可以将核酸直接引入植物细胞或植物本身(包括引入组织、器官或植物的任何其它部分)。根据本发明优选的特征,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者
和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂,将种子(适当时在灭菌之后)种在琼脂板上,从而仅转化的种子能够长成植物。可选地,针对可选择标记如上文所述标记的存在筛选转化的植物。
DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印迹),评价目的基因的存在、拷贝数和/或基因组构造。备选地或额外地,可用Northern和/或Western分析监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞经转化含有表达盒);转化和非转化组织的嫁接体(例如在植物中,转化的根状茎嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及所有的植物部分及其繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中亲本产生的相同的基因型和/或表型特征。
本发明也包括含有分离的编码上文所定义的ANN多肽的核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。特别用于本发明方法中的植物包括属于植物界超家族的全部植物,尤其单子叶植物和双子叶植物,包括饲用料或饲料豆类、观赏植物、食品作物、树或灌木。根据本发明优选的实施方案,植物是作物植物。作物植物的实例包括大豆、向日葵、芸苔、苜蓿、油菜、棉花、番茄、马铃薯和烟草。还优选地,植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选地,植物是谷物。谷物的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
本发明也扩展至植物的可收获部分如,但不限于种子、叶、果实、花、茎、根茎、块茎和球茎。本发明进一步涉及来自、优选直接来自这种植物的可收获部分中的产物,如干燥颗粒或粉末、油、脂肪及脂肪酸、淀粉或蛋白质。
根据本发明的一个优选的特征,调节的表达是提高的表达。用于提高核酸或基因或基因产物之表达的方法均已详细记载于本领域中,并且在定义部分中提供了实例。
如上文所述,调节(优选提高)ANN多肽编码核酸之表达的优选方法是在植物中引入和表达编码ANN多肽的核酸;然而也可使用其他熟知的技术实现实施本方法的效果,即增强产量相关性状。所述技术包括但不限于T-DNA激活标签化、TILLING、同源重组。这些技术的描述提供在定义部分中。
本发明还包括编码如本文所述的ANN多肽的核酸以及这些ANN多肽在增强植物任何上述产量相关性状中的用途。
可以在育种程序中使用编码本文所述ANN多肽的核酸或所述ANN多肽本身,其中鉴定可能与ANN多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因,或所述ANN多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产量相关性状的植物。
ANN多肽编码核酸/基因的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如EMS诱变法对植物作诱变处理而引入等位基因变异;备选地,该程序可以从非人为引起的所谓“自然”起源的一组等位变体开始。随后进行等位变体的鉴定,例如通过PCR法。此后是用于选择所讨论及导致增加产量的序列的优异等位变体的步骤。一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定了优异等位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码ANN多肽的核酸也可以用作探针以便对基因进行遗传作图和物理作图,所述探针作为所述基因的一部分及与这些基因关联的性状的标记。此类信息可以用于植物育种中,以便开发具有想要表型的株系。ANN多肽编码核酸的这种用途仅需要具有至少15个核苷酸长度的核酸序列。ANN多肽编码核酸可以用作限制性片段长度多态性(RFLP)标记。限制性消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)Molecular Cloning,A Laboratory Manual)可以用ANN编码核酸探测。产生的条带图式随后可以使用计算机程序如MapMaker(Lander等(1987)Genomics 1174-181)进行遗传分析以构建遗传图。此外,该核酸可以用来探测含有经限制性内切核酸酶处理的一组个体的基因组DNA的Southern印迹,其中所述的一组个体代表具有确定的遗传杂交的亲代和后代。DNA多态性的分离被标出并用来计算ANN多肽编码核酸在使用这个群体先前所获得的遗传图中的位置(Botstein等(1980)Am.J.Hum.Genet.32314-331)。
在Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 437-41中描述了植物基因衍生的探针的产生和其在遗传作图中的用途。众多出版物描述了使用以上所提及的方法学或其改良方法对特定cDNA克隆的遗传作图。例如,F2互交群、回交群、随机交配群、邻近纯合系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸探针也可以用于物理作图(即序列在物理图上的排列;见Hoheisel等在Non-mammalian Genomic AnalyasisA PracticalGuide,Academic press 1996,第319-346页及其中引用的参考文献)。
在另一实施方案中,核酸探针可以在直接荧光原位杂交(FISH)作图法(Trask(1991)Trends Genet.7149-154)中使用。尽管当前的FISH作图法支持使用大型克隆(几个kb至几百个kb;见Laan等(1995)Genome Res.513-20),然而灵敏度的改善可以允许使用更短探针进行FISH作图。
用于遗传作图及物理作图的多种基于核酸扩增的方法可以使用所述核酸而实施。实例包括等位基因特异的扩增法(Kazazian(1989)J.Lab.Clin.Med 1195-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16325-332)、等位基因特异性连接(Landegren等(1988)Science 2411077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic AcidRes.183671)、放射杂交作图(Walter等(1997)Nat.Genet.722-28)和Happy作图法(Dear和Cook(1989)Nucleic Acid Res.176795-6807)。对于这些方法,使用一种核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。此类引物的设计是本领域技术人员众所周知的。在使用基于PCR遗传作图的方法中,可能必须鉴定在对应于当前核酸序列的区域内作图交叉亲代间的DNA序列差异。然而,这对于作图法而言通常不是必需的。
本发明方法产生具有如前文所述的产量提高相关性状的植物。这些性状也可以与其它经济有利的性状组合,如其它的产量增强性状、对其它非生物胁迫和生物胁迫的耐性、调节多种构造性特征和/或生物化学特征和/或生理学特征的性状。
条目 1.相对于对照植物在植物中用于增强产量相关性状的方法,所述方法包括在植物的根中调节,优选增加编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达,其中所述2-Cys PRX多肽从N-末端到C-末端包含(1)质体转运肽;和(2)2-Cys PRX结构域;并且任选地选择具有增加的产量的植物。
2.根据条目1的方法,其中所述2-Cys PRX多肽另外地包含下述之一或二者(i)SEQ ID NO77所示的基序1,或与SEQ ID NO77具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序;或者(ii)如SEQ IDNO78所示的基序2,或与SEQ ID NO78具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序。
3.根据条目1或2的方法,其中当例如如图3所描述的那样,将所述2-Cys PRX多肽用于构建系统发生树时,其倾向于与包含SEQ ID NO2中所示的多肽序列的多肽的2-Cys PRX进化枝聚类,而不与任何其它PRX进化枝聚类。
4.根据任一前述条目的方法,其中所述2-Cys PRX多肽为下述多肽,其与SEQ ID NO2中所示的2-Cys PRX多肽或者与本文表A1中所给出的任何多肽序列以优选性增加的顺序具有至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的序列同一性。
5.根据任一前述条目的方法,其中所述编码2-Cys PRX多肽的核酸序列由表A1中所列出的任一核酸序列所表示,或者是其部分,或者是能够与表A1中所列出的任一核酸序列杂交的序列。
6.根据任一前述条目的方法,其中所述核酸序列编码表A1中所列出的任何多肽的直向同源物或旁系同源物。
7.根据任一前述条目的方法,其中所述调节的,优选增加的,表达由下述任何一个或多个所实现T-DNA激活标签化、TILLING或同源重组。
8.根据任一前述条目的方法,其中所述调节的,优选增加的,表达通过在植物的根中引入和表达编码2-Cys PRX多肽的核酸序列来实现。
9.根据任一前述条目的方法,其中所述增强的产量相关性状是下述一种或多种(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
10.根据任一前述条目的方法,其中所述增强的产量相关性状在非生物胁迫下获得。
11.根据条目10的方法,其中所述非生物胁迫是选自下述一种或多种的渗透胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫;优选地,其中所述水胁迫是干旱胁迫和/或减少的养分利用度,优选地减少的氮利用度。
12.根据条目10或11的方法,其中所述非生物胁迫耐受表现为选自以下一种或多种的增强的产量相关性状(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW),其中每种均是相对于对照植物。
13.根据条目8至12中任一项的方法,其中所述核酸序列与根特异性启动子,优选RCc3启动子,更优选与SEQ ID NO80基本类似的RCc3启动子,最优选如SEQ ID NO80所示的启动子有效连接。
14.根据任一前述条目的方法,其中所述编码2-Cys PRX多肽的核酸序列是植物来源的,优选来自双子叶植物,更优选来自芸苔科(Brassicaceae),最优选来自芜青(Brassica rapa)。
15.通过根据任一前述条目的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含与根特异性启动子有效连接的编码2-CysPRX多肽的核酸转基因。
16.构建体,其包含 (a)编码如条目1至6中任一项所定义的2-Cys PRX多肽的核酸序列; (b)一个或多个能够驱动(a)的核酸序列表达的控制序列;以及任选地 (c)转录终止序列; 其中至少一个控制序列是根特异性启动子,优选Rcc3启动子。
17.根据条目16的构建体在制备植物的方法中的用途,其中所述植物相对于对照植物具有增强的产量相关性状,所述增强的产量相关性状优选是一种或多种的(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
18.用根据条目16的构建体转化的植物、植物部分或植物细胞。
19.产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括 (i)向植物、植物部分或植物细胞中引入和表达编码如条目1至5中任一项所定义的2-Cys PRX多肽的核酸序列,所述序列在根特异性启动子的控制下;和 (ii)在促进植物生长和发育的条件下培养植物细胞。
20.根据条目19的方法,其中所述增强的产量相关性状在提高的非生物胁迫下发生。
21.相对于对照植物具有增强的产量相关性状的转基因植物,或者来自所述转基因植物的转基因植物细胞或植物部分,其中所述转基因植物是从在根中调节,优选增加,编码如条目1至6中任一项所定义的2-CysPRX多肽的核酸序列的表达来产生的。
22.根据条目15、18或21的转基因植物,或来自所述转基因植物的转基因植物细胞或植物部分,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
23.根据条目22的包含编码2-Cys PRX多肽的核酸序列的植物的可收获部分,其中所述可收获部分优选是种子。
24.来自根据条目22的植物和/或来自根据条目23的植物的可收获部分的产品。
25.编码如条目1至6中任一项所定义的2-Cys PRX多肽的核酸序列的用途,其用于相对于对照植物在植物中增强产量相关性状,优选增加下述一种或多种(i)增加的种子饱满率;(ii)每株植物增加的总种子产量;(iii)增加的饱满种子数;(iv)增加的种子总数;(v)增加的千粒重(TKW)或(vi)增加的收获指数。
26.根据条目25的用途,其中所述增强的产量相关性状在非生物胁迫下发生。
27.在植物中相对于对照植物增强产量相关性状的方法,所述方法包括在植物中调节编码ANN多肽的核酸的表达,其中所述ANN多肽包含下列一个或多个基序 (i)特征序列1(SEQ ID NO87), (ii)特征序列2(SEQ ID NO88), (iii)特征序列3(SEQ ID NO89), (iv)特征序列4(SEQ ID NO90), (v)特征序列5(SEQ ID NO91), (vi)特征序列6(SEQ ID NO92), (vii)特征序列7(SEQ ID NO93). 28.根据条目27的方法,其中所述ANN多肽至少包含膜联蛋白结构域。
29.根据条目27或28的方法,其中所述调节的表达通过在植物中引入和表达编码ANN多肽的核酸来实现。
30.根据条目27至29的任一项的方法,其中所述编码ANN多肽的核酸编码表B1中所列出的任一蛋白质,或者是此类核酸的部分,或者是能够与此类核酸杂交的核酸。
31.根据条目27至30中任一项的方法,其中所述核酸序列编码表B1中所给出的任何蛋白质的直向同源物或旁系同源物。
32.根据条目27至31中任一项的方法,其中所述增强的产量相关性状包含相对于对照植物增加的产量,优选增加的种子产量。
33.根据条目27至32中任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
34.根据条目27至33中任一项的方法,其中所述增强的产量相关性状在干旱条件下获得。
35.根据条目29至34中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
36.根据条目29至34中任一项的方法,其中所述核酸与绿色组织特异性启动子,优选与扩展蛋白启动子,最优选与来自稻的扩展蛋白启动子有效连接。
37.根据任一前述条目的方法,其中所述编码ANN多肽的核酸是植物来源的,优选来自双子叶植物,进一步优选来自芸苔科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
38.通过根据任一前述条目的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ANN多肽的重组核酸。
39.构建体,其包含 (i)编码如条目27或28所定义的ANN多肽的核酸; (ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;以及任选地 (iii)转录终止序列。
40.根据条目39的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
41.根据条目39的构建体,其中所述控制序列之一是绿色组织特异性启动子,优选扩展蛋白启动子,最优选来自稻的扩展蛋白启动子。
42.根据条目39至41中任一项的构建体在制备植物的方法中的用途,所述植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量。
43.用根据条目39至41的任一项的构建体转化的植物、植物部分或植物细胞。
44.产生相对于对照植物具有增加的产量,特别是增加的种子产量,的转基因植物的方法,所述方法包括 (i)在植物中引入和表达如条目27或28中所定义的ANN多肽的编码核酸;和 (ii)在促进植物生长和发育的条件下培养植物细胞。
45.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或来自所述转基因植物的转基因植物细胞,所述转基因植物是从编码如条目27或28中所定义的ANN多肽的核酸增加的表达所产生的。
46.根据条目38、43或45的转基因植物,或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
47.根据条目46的植物的可收获部分,其中所述可收获部分优选是种子。
48.来自根据条目46的植物和/或来自根据条目47的植物的可收获部分的产品。
49.编码ANN多肽的核酸的用途,其用于相对于对照植物在植物中增加产量,特别是增加种子产量。
附图描述 本发明将参考以下图来被描述,其中
图1表示2-Cys Prx酶的催化和灭活/再活化循环,根据Rhee等人,(2005)Free radical Biology and Medicine 381543-1552。
图2表示使用由SEQ ID NO2所示的2-Cys PRX的在NCBI对保守结构域数据库(CDD)的搜索(使用默认值)的输出结果。最高命中是entry CD3015,PRX_Typ2cys。
图3显示了使用邻接聚类方法,在来自真细菌、植物藻类、动物的2-Cys PRX和来自植物1-Cys PRX的ClustalW(1.83)多序列比对后建立的系统发生树。2-Cys PRX类用大括号标出。由SEQ ID NO2所示的2-Cys PRX被标在框中。
图4显示了使用默认值,来自真细菌、植物藻类、动物的2-Cys PRX和来自植物的1-Cys PRX的CLUSTAL W(1.83)多序列比对。框中是如SEQ ID NO77所示的基序1和SEQ ID NO78所示的基序2。
图5显示了用于在稻中提高2-Cys PRX编码核酸序列的表达的二元载体,所述编码核酸序列在稻GOS2启动子(pGOS2;SEQ ID NO79)或稻Rcc3(pRcc3;SEQ ID NO80)启动子的控制下。
图6详细描述了用于实施本发明方法的序列的实例。
图7A显示了具有膜联蛋白结构域(如SMART所预测的,黑体下划线标注)的SEQ ID NO84;图7B显示了在拟南芥的膜联蛋白4中膜联蛋白结构域(SMART所预测的)(SEQ ID NO135)。
图8显示了用于本发明方法中的植物膜联蛋白的系统发生树(Cantero等人,Plant Physiol.Biochem.44,13-24,2006)。箭头指示了膜联蛋白1(SEQ ID NO84)和膜联蛋白4(SEQ ID NO135),它们都来自拟南芥。
图9显示了多个植物膜联蛋白的多重比对。标识符是指数据库登录号;NP_174810对应SEQ IDNNO84。保守残基以冒号或点标示。
图10表示了用于在稻中ANN编码核酸的增加的表达的二元载体,其中所述ANN编码核酸在稻GOS2启动子(pGOS2)的控制下。
图11详细描述了用于实施本发明方法的序列的实例。
实施例 本发明现在将参考仅作为说明的下列实施例加以描述。下列实施例不意图彻底定义或限制本发明范围。
DNA操作除非另外声明,重组DNA技术根据(Sambrook(2001)Molecular Cloninga laboratory manual,第三版Cold Spring HarborLaboratory Press,CSH,New York)中或Ausubel等(1994),CurrentProtocols in Molecular Biology,Current Protocols第1和2卷中描述的标准方法进行。用于植物分子工作的标准材料和方法在由BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)出版的R.D.D.Croy的Plant Molecular Biology Labfax(1993)中描述。
实施例1鉴定与本发明方法中所用核酸序列相关的序列 使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215403-410;和Altschul等(1997)Nucleic AcidsRes.253389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,对本发明中使用的核酸序列所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分比进行记分。同一性百分比指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹配。以这种方式,可以鉴定短的几乎精确的匹配。
表A 1提供与本发明方法中所用核酸序列相关的核酸序列列表。
表A12-Cys PRX核酸和多肽序列的实例 在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来鉴定此类的相关序列,这可通过关键词搜索或通过使用BLAST算法利用目的核酸序列或多肽序列进行。
实施例22-Cys PRX多肽序列的比对 用逐步比对(progressive alignment)的Clustal算法(1.83)实施对来自真细菌、植物藻类、动物的2-Cys PRX多肽序列和来自植物的1-CysPRX多肽序列(作为异常值)的比对,使用默认值(Thompson等人(1997)Nucleic Acids Res 254876-4882;Chenna等人(2003).Nucleic AcidsRes 313497-3500)。可以进行细微的手动编辑进一步优化比对。在图4中比对了2-Cys PRX多肽。如SEQ ID NO77所示的基序1和如SEQ IDNO78所示的基序2在框中。
使用本领域熟知的邻接聚类算法构建来自真细菌、植物藻类、动物的2-Cys PRX多肽序列和来自植物的1-Cys PRX多肽序列(作为异常值)的系统发生树(图3)。用大括号标示出2-Cys PRX类。以SEQ IDNO2所示的2-Cys PRX在框中。
实施例3计算可用于实施本发明方法的多肽序列之间的全局同一性百分比。
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003429.MatGATan application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分比。
MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是 评分矩阵Blosum62 第一空位12 延伸空位2 多肽序列全长上的全局相似性和同一性软件分析结果在表A2中显示。同一性百分比在对角线之上以粗体给出并且相似性百分数在对角线之下给出(普通字体)。
与SEQ ID NO2相比,用于实施本发明方法的2-Cys PRX多肽序列之间的同一性百分比可以低到35%氨基酸同一性。
实施例4鉴定用于实施本发明方法的多肽序列中包含的结构域 保守结构域搜索服务(CD-Search)是基于网络的用于检测蛋白质序列中结构和功能结构域的工具,由NCBI提供。CD-Search使用BLAST(R)来搜索结构域模型的综合采集。搜索结果被表现为结构域构造卡通片和查询与结构域模型共有序列之间的配对比对(Marchler-Bauer A,Bryant SH(2004),″CD-Searchprotein domain annotations on the fly″,Nucleic Acids Res.32(W)327-331)。使用SEQ ID NO2所示的2-CysPRX进行的搜索(使用默认值)给出了最高命中是entry CD3015,PRX_Typ2cys(图2,表A3)。
表A3SEQ ID NO2所示的多肽序列的CDD 实施例5用于实施本发明方法的多肽序列的亚细胞定位预测 TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何N端前序列的预测的存在叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不实际是概率,并且它们未必合为一体。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)范围是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO2所代表的多肽序列的TargetP 1.1分析的结果在表A4中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。预测的SEQ ID NO2所示多肽序列的亚细胞定位是质体区室。
表A4SEQ ID NO2所示多肽序列的TargetP 1.1分析 根据TargetP1.1预测的长度是58个氨基酸(自N末端起始),但是这只能通过对成熟蛋白质测序来实验进行验证。Cheong等人(1999)预测了SEQ ID NO2所示的多肽的65个氨基酸的转运肽(Plant Molec Biol40825-834)。
众多其它算法可以用来执行此类分析,包括 ◆在丹麦技术大学(Technical University of Denmar)服务器上提供的ChloroP 1.1; ◆在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience,University of Queensland,Brisbane,Australia)的服务器上提供的蛋白质Prowler亚细胞定位预测程序(Protein Prowler Subcellular LocalisationPredictor)第1.2版; ◆在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(University ofAlberta,Edmonton,Alberta,Canada)的服务器上提供的PENCE Proteme Analyst PA-GOSUB 2.5; ◆在丹麦技术大学服务器上提供的TMHMM。
实施例62-Cys PRX多肽的功能测定 例如,2-Cys PRX多肽存在对过氧化氢的过氧化物酶活性。对于2-Cys PRX蛋白质的酶测定已经在文献中被深入研究,并且是本领域技术人员熟知的。Huang等人(2007;Appl Microbiol Biotechnol 74(1)84-92)、Bernier-Villamor等人(2004;J Exp Bot 55(406)2191-9)和Caporaletti等人(2007;Biochem Biophys Res Commun 355(3)722-7)是描述了2-CysPRX蛋白质的酶活性的近期的公开出版物。
实施例7用于本发明方法的核酸序列的克隆 使用Cheong等人(1999;Plant Molec Biol)中描述的芜青2-Cys PRX克隆作为模板,通过PCR扩增本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶进行PCR,使用50μlPCR混合物中的200ng模板。使用的引物是prm08756(SEQ ID NO81;有义,起始密码子为黑体)5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgtctgttgcttctt-3’和prm08757(SEQ ID NO82;反义,互补)5’-ggggaccactttgtacaagaaagctgggttcgagctaaatagctgagaagag-3’,其包括用于Gateway重组的AttB位点。还使用标准方法将扩增的PCR片段纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“entry克隆”,p2-Cys PRX。质粒pDONR201作为
技术的部分从Invitrogen购买。
包含SEQ ID NO1的entry克隆随后在LR反应中与用于稻转化的两个目的载体一起使用。所述载体在T-DNA边界内含有作为功能性元件的植物选择标记;筛选标记表达盒和意图与已经克隆于所述entry克隆内的目的核酸序列发生LR体内重组的Gateway盒。第一个目的载体在该Gateway盒的上游包含稻GOS2启动子(SEQ ID NO79),用于强组成型表达,第二个目的载体包含用于根特异性表达的稻Rcc3启动子(SEQ ID NO80)。
在LR重组步骤后,产生的表达载体pGOS2::2-Cys PRX和pRcc3::2-Cys PRX(图5)根据本领域众所周知的方法被分别转化至农杆菌菌株LBA4044中。
实施例8植物转化 稻转化 每个含有一个在实施例7中描述的表达载体的两种农杆菌用来转化稻植物。将稻的日本栽培品种Nipponbare的成熟干燥种子脱壳。通过在70%乙醇中温育一分钟,随后在2%HgCl2中30分钟,随后用无菌蒸馏水洗涤6次15分钟而实施消毒。消毒的种子随后在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中温育4周后,将来自小盾片的愈伤组织切下并在同一种培养基上增殖。2周后,愈伤组织通过在同一种培养基上传代培养另外2周而繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上传代培养3日,之后共培育(以增强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培育。农杆菌接种在含有适宜抗生素的AB培养基上并在28℃培养3日。随后将细菌收集并重悬在液体共培育培养基中至密度(OD600)约1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡15分钟。愈伤组织组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于25℃温育3日。共培育的愈伤组织在黑暗中于28℃在选择剂存在下于含有2,4-D的培养基上培育4周。在此时段期间,形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光线下温育后,胚发生潜力释放并且枝条在随后4-5周发育。将枝条从愈伤组织中切下并且在含有植物生长素的培养基上温育2-3周,其中将枝条从所述的培养基上转移至土壤。硬化的枝条在高湿度和短日照下于温室中培育。
对一个构建体产生约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室。在定量PCR分析以验证T-DNA插入物的拷贝数后,仅保留表现选择剂耐受性的单拷贝转基因植物用于收获T1种子。种子随后在移植后3-5月收获。本方法以超过50%的比率产生单一基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。
实施例9表型评价方法 9.1评价准备 产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评价,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048×1536像素,1600万颜色)。
干旱筛选 在正常培养条件下在盆土中培养来自4个事件T2种子的植物,直至到达抽穗阶段。接着将其转移至停止浇水的“干旱”部分。在随机选择的盆中插入湿度探测器,以监控土壤含水量(SWC)。当SWC低一定阈值时,自动对植物持续再浇水直至再次达到正常水平。接着将植物再转移至正常条件。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数。
9.2统计分析F-检验 使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
由于进行了具有重叠事件的两个实验,因而进行了组合分析。这对于检测两个实验中该效果的一致性是有用的,并且如果是这种情形,则集合来自两个实验的证据从而增加了结论的可信度。使用的方法是混合模型方法,其考虑多级结构的数据(即实验-事件-分离子)。通过比较似然比测试与chi方分布来获得p值。
9.3测量的参数 生物量相关的参数测量 从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间对每株植物从至少6个不同角度拍摄2-Cys PRXnt数字图像(2048×1536像素,1600万颜色)。
早期萌发势是萌发后3周的植物(幼苗)地上部分面积。通过计算区分于背景的来自地上植物部分的像素的总数量来确定早期萌发势。将这一值针对从不同角度在同一时间点拍摄的图像进行平均,并将其通过校准转化为以平方米表示的物理表面值。下文描述的结果是针对萌发三周后的植物。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的图像进行平均化并且通过校准转化成以平方米表示的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。
为了测量根相关的参数,在特别设计的盆中培育植物,所述盆具有透明的底部以允许视觉观察根。在植物生长期间通过盆底部用数码相机记录图像。使用适当的软件从图像中推导根特征,例如总估计的面积(其可以与总根体积相关)、某一厚度阈值上的根的平均直径和长度(厚根的长度,或者厚根长)。根生物量的增加被表示为总根生物量的增加(作为植物的生活期限期间所观察到的根的最大生物量来测量);或者表示为根/枝条指数的增加(作为根和枝条的活性生长期中根量和枝条量之间的比例来测量)。
种子相关参数的测量 将成熟的主圆锥花序(primary panicle)收获、计数、装袋、加条形码标记并且随后在干燥箱内在37°干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒(husk)与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每个圆锥花序的花总数在本发明中定义为种子总数与成熟的主圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例10在正常生长条件下培育的转基因植物的表型评价的结果 下文显示表达编码2-Cys PRX多肽(在根特异性启动子的控制下)的核酸序列,并且在正常生长条件下培育的转基因稻植物的评价结果。观察到改善的早期萌发势,以及增加的种子饱满率、每株植物增加的总种子产量、增加的饱满种子数、增加的收获指数以及增加的千粒重。
表A5转基因稻植物的评价结果,所述植物表达用于实施本发明方法的核酸序列(在根特异性启动子的控制下),并且在正常生长条件下培育。
与在可比正常生长条件下培育的对照植物相比,表达编码2-CysPRX多肽的核酸序列(在组成型启动子(稻GOS2启动子)的控制下),并且在正常生长条件下培育的转基因稻植物,在表型检查的任何性状中没有差异(数据未显示)。
实施例11在胁迫生长条件下培育的转基因植物的表型评价的结果 下文显示表达编码2-Cys PRX多肽(在根特异性启动子的控制下)的核酸序列,并且在干旱胁迫生长条件下培育的转基因稻植物的评价结果。观察到改善的早期萌发势,以及增加的地上生物量、增加的根生物量、每个圆锥花序增加数量的花、增加的种子饱满率、每株植物增加的总种子产量、增加的种子数、增加的饱满种子数和增加的收获指数。
表A6转基因稻植物的评价结果,所述植物表达用于实施本发明方法的核酸序列(在根特异性启动子的控制下),并且在干旱生长条件下培育。
实施例12其它作物的转化实例 玉米转化 玉米的转化根据对Ishida等(1996.Nature Biotech 14745-50)描述方法的改良方法进行。在玉米中的转化是基因型依赖的并且仅特定的基因型可操作用于转化和再生。近交系A188(明尼苏达大学)或以A188作为亲本的杂种是用于转化的供体材料的良好来源,但是其它基因型也可以成功地使用。玉米穗从玉米植物中在授粉后大约11日(DAP)收获,此时不成熟胚的长度是大约1至1.2mm。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。切下的胚在愈伤组织诱导培养基上、随后在玉米再生培养基上培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养板在25℃于光照下培养2-3周,或直至枝条发育。将绿色枝条从每个胚转移至玉米生根培养基并在25℃培养2-3周,直至根发育。将生根的枝条移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
小麦转化 小麦的转化用Ishida等Ishida等(1996)Nature Biotech 14(6)745-50描述的方法进行。通常在转化中使用(可从墨西哥CIMMYT获得的)栽培品种Bobwhite。不成熟胚与含有表达载体的根癌农杆菌共培育并且转基因植物通过器官发生而恢复。在与农杆菌温育后,胚在愈伤组织诱导培养基上、随后在再生培养基上体外培育,其中所述的再生培养基含有选择剂(例如咪唑啉酮,但可以使用多种选择标记)。培养平板在25℃于光照下培养2-3周,或直至枝条发育。将绿色枝条从每个胚转移至生根培养基并在25℃培养2-3周,直至根发育。将生根的枝条移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的T-DNA插入物的植物中产生T1种子。
大豆转化 根据对Texas A&M美国专利5,164,310中所述方法的改良方法转化大豆。几个商业大豆品种对于通过这种方法的转化是可行的。栽培品种Jack(从IIIinois种子基金会可获得)通常用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗中切下下胚轴、胚根和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有表达载体的根癌农杆菌温育。在共培育处理之后,将外植体洗涤并转移至选择培养基。将再生的枝条切下并置于枝条伸长培养基上。将长度不超过1cm的枝条置于生根培养基上直至根发育。将生根的枝条移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝T-DNA插入物的植物中产生T1种子。
油菜籽/芸苔(canola)转化 使用5-6日龄幼苗的子叶柄和下胚轴作为用于组织培养的外植体并且根据Babic等(1998,Plant Cell Rep 17183-188)转化。商业栽培品种Westar(Agriculture Canada)是用于转化的标准品种,但是也可以使用其它品种。对芸苔种子作表面消毒以便体外播种。从体外幼苗中切下具有附着子叶的子叶柄外植体,并以(含有表达载体的)农杆菌通过叶柄外植体的切口端浸入细菌混悬液而接种。外植体随后在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基上在23℃,16小时光照下培养2天。在与农杆菌共培育2日后,将叶柄外植体转移至含有的3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基上持续7日,并且随后在含头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养,直至枝条再生。当枝条具有5-10mm长度时,将枝条切下并转移至枝条伸长培养基(含0.5mg/l BAP的MSBAP-0.5)。将长度大约2cm的枝条转移至用于根诱导的生根培养基(MS0)。将生根的枝条移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
苜蓿转化 苜蓿的再生性克隆使用(McKersie等,1999 Plant Physiol119839-847)的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再生植物。已经描述了获得再生性植物的方法。例如,这些再生性植物可以选自栽培品种Rangelander(Agriculture Canada)或如Brown DCW与A Atanassov(1985.Plant Cell Tissue Culture 4111-112)描述的任何其它商业苜蓿品种。备选地,RA3品种(威斯康星大学)已经被选择用于组织培养中(Walker等,1978 Am J Bot 65654-659)。将叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999 Plant Physiol 119839-847)或LBA4404的过夜培养物共培育。外植体在黑暗中在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/LK2SO4和100μm乙酰丁香酮的SH诱导培养基上共培育3天.外植体在半浓缩Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合适抗生素以抑止农杆菌生长的相同SH诱导培养基上。在数周后,将体细胞胚转移至不含生长调节剂、不含抗生素而含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半浓缩Murashige-Skoog培养基上萌发。将生根的幼苗移植至花钵内并且在温室中培育。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
棉花转化 棉花(陆地棉(Gossypium hirsutum L.))转化使用根癌农杆菌在下胚轴外植体上进行。商业栽培种例如Coker130或Coker312(SeedCo,Lubbock,TX)是用于转化的标准品种,但是也可以使用其它品种。将种子表面消毒并且在黑暗中萌发。将下胚轴外植体从萌发的幼苗上切下长约1-1.5厘米。将下胚轴外植体没入包含表达载体的根癌农杆菌接种物中5分钟,然后在黑暗中在MS+1.8mg/l KNO3+2%葡萄糖上在24℃共培养约48小时。将外植体转移至包含适当的细菌和植物选择标记的相同培养基中(更新几次),直到看见胚胎发生愈伤组织。将愈伤组织分离并且传代培养直到体细胞胚出现。将来自体细胞胚的小植物在生根培养基上成熟直到根发育。将生根的枝条移植到温室盆土中。从表现选择剂耐受性并含有单拷贝T-DNA插入物的植物中产生T1种子。
实施例13其它胁迫筛选的实例 盐胁迫筛选 在由椰子纤维和argex(3∶1比例)构成的底物(substrate)上培养植物。在将小植株移植到温室后的前两周使用正常营养液。前两周之后,向营养液中加入25nM盐(NaCl),直至收获植物。
养分(氮)利用度降低筛选 在除营养液以外均为正常的条件下在盆土中培养来自T2种子的稻植物。从移植到成熟均使用特定的营养液对盆浇水,其中含有降低的氮(N)含量,通常降低7至8倍。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数。
实施例14鉴定与本发明方法中所用核酸序列相关的序列 使用数据库序列搜索工具,如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215403-410;和Altschul等(1997)Nucleic AcidsRes.253389-3402)在国家生物技术信息中心(NCBI)的Entrez核苷酸数据库中所维护的那些序列内鉴定到与本发明方法中所用核酸序列相关的(全长cDNA、EST或基因组)序列。该程序用来通过核酸序列或多肽序列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区域。例如,对本发明中使用的核酸所编码的多肽使用TBLASTN算法,采用默认设置和过滤以忽略低复杂性序列抵消。分析的结果通过配对性比较显示,并根据几率评分(E-值)排序,其中该评分反映特定比对结果因偶然而发生的概率(E-值越低,命中的显著性越高)。除了E-值外,比较还通过同一性百分比进行记分。同一性百分比指两个所比较核酸(或多肽)序列之间在特定长度范围内的相同核苷酸(或氨基酸)数目。在一些情况下,可以调整默认参数以调节搜索法的严格性。例如可以增加E-值以显示严格性较小的匹配。以这种方式,可以鉴定短的几乎精确的匹配。
表B1提供与本发明方法中所用核酸序列相关的核酸序列列表。
表B1ANN多肽的实例 在一些情况下,相关序列已经由研究所如基因组研究所(TIGR)试验性汇编并向公众公开。真核生物基因直向同源物(EGO)数据库可以用来鉴定此类的相关序列,这可通过关键词搜索或通过使用BLAST算法利用目的核酸或多肽序列进行。
实施例15ANN多肽序列的比对 使用来自Vector NTI(Invitrogen)的AlignX程序(基于逐步比对的一般Clustal W算法)(Thompson等(1997)Nucleic Acids Res254876-4882;Chenna等(2003).Nucleic Acids Res 313497-3500)实施多肽序列的比对。默认值为空位开放罚分10,空位延伸罚分0.1,选定的权重矩阵为Blosum 62(如果比对多肽的话)。可以进行细微的手动编辑进一步优化比对。在整个序列中发现了ANN多肽的序列保守性。在图9中比对了ANN多肽。
可以使用来自Vector NTI(Invitrogen)的AlignX程序所提供的邻接聚类算法构建APP多肽的系统发生树(如图8所示的那样)。
实施例16计算可用于实施本发明方法的多肽序列之间的全局同一性百分比。
使用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 429.MatGATan application that generatessimilarity/identity matrices using protein or DNA sequences.CampanellaJJ,Bitincka L,Smalley J;软件由Ledion Bitincka提供)确定用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分比。
MatGAT软件为DNA序列或蛋白质序列产生相似性/同一性矩阵,无需数据的预比对。该程序使用Myers和Miller全局比对算法(空位开放罚分12和空位延伸罚分2)执行一系列逐对比对,使用例如Blosum 62(对于多肽)计算相似性和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示,序列同一性在对角分界线的上半部分中显示。
比较中所用的参数是 评分矩阵Blosum62 第一空位12 延伸空位2 多肽序列全长上的全局相似性和同一性软件分析结果在表B2中显示。同一性百分比在对角线之上以粗体给出并且相似性百分数在对角线之下给出(普通字体)。
与SEQ ID NO84(NP_174810)相比,用于实施本发明方法的ANN多肽序列之间的同一性百分比可以低到约30%氨基酸同一性。
表B2全长多肽序列上的全局相似性和同一性的MatGAT结果 实施例17鉴定用于实施本发明方法的多肽序列中包含的结构域 蛋白质家族、结构域和位点集成资源(Integrated Resouce ofProtein Families,Domain and Site,InterPro)数据库是基于文本和序列的检索的通常所用标签数据库的集成界面。InterPro数据库组合了这些数据库,所述的数据库使用不同方法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是多重序列比对的大集合并且是覆盖多个共同蛋白质结构域和家族的隐藏Markov模型(hidden Markov model)。Pfam由位于英国的Sanger研究所服务器提供。Interpro由英国的欧洲生物信息研究所提供。
InterPro扫描如SEQ ID NO84所代表的多肽序列的结果在表B3中示出。
表B3如SEQ ID NO84所代表的多肽序列的InterPro扫描结果(主要登录号)。
实施例18用于实施本发明方法的多肽序列的拓扑学预测 TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配是基于任何N端前序列的预测的存在叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。作为最终预测基础的评分并不实际是概率,并且它们未必合为一体。然而,具有最高评分的位置根据TargetP是最有可能的,并且评分之间的关系(可靠性类别)可以是预测的肯定性的一个指标。可靠性类别(RC)是1-5,其中1表示最强预测。TargetP在丹麦技术大学的服务器上维护。
对于预测含有N端前序列的序列,也可以预测潜在的切割位点。
选择了众多参数,如生物组(非植物或植物)、临界设置(无、临界的预定义设置或临界的用户指定设置)和对切割位点预测的计算(是或否)。
如SEQ ID NO84所代表的多肽序列的TargetP 1.1分析的结果在表B4中显示。已经选择“植物”生物组,未定义临界值并且需要转运肽的预测长度。SEQ ID NO84所示多肽序列的亚细胞定位可能是胞质或核,未预测到转运肽。这一预测与更早期的报道一致,在所述报道中表明了膜联蛋白与质膜、液泡和核周边相关联(Clark & Roux,Plant Physiol.109,1133-1139,1995)。
表B4SEQ ID NO84所示多肽序列的TargetP 1.1分析 众多其它算法可以用来执行此类分析,包括 ◆在丹麦技术大学(Technical University of Denmar)服务器上提供的ChloroP 1.1; ◆在澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience,University ofQueensland,Brisbane,Australia)的服务器上提供的蛋白质Prowler亚细胞定位预测程序(Protein ProwlerSubcellular Localisation Predictor)第1.2版; ◆在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学(Universityof Alberta,Edmonton,Alberta,Canada)的服务器上提供的PENCE Proteme Analyst PA-GOSUB 2.5; ◆在丹麦技术大学服务器上提供的TMHMM。
实施例19ANN多肽的功能测定 膜联蛋白-膜相互作用的测定(Dabitz等人Biochemistry 44,16292-16300,2005) 膜结合测定(共沉淀(Copelleting)测定) 依照Reeves和Dowben(J.Cell.Physiol.73,49-60,1969)的步骤制备磷脂运载体。为了评估植物膜联蛋白-膜结合行为,进行了共沉淀测定(Hofmann和Huber,Methods Enzymol.372,186-216,2003)。对于每个独立的样品(500μl)使用总量为0.2μmol的磷脂,所述样品中包含脂质体缓冲液中的0.5nmol的蛋白质和不同量的钙。作为对照,在该阶段制备100μl的10%SDS中的0.1nmol蛋白质的样品。离心所有样品(23000rpm,4℃进行45分钟),并且将沉淀用50μl的10%SDS重新悬浮,然后进行SDS-PAGE。用考马斯染色凝胶,并且使用ImageJ进行光密度分析(Rasband,W.ImageJ,版本1.30,National Institutes of Health,Bethesda,MD,2005)。每个钙浓度下独立评估3次。使用标准结合方程式,用SigmaPlot进行曲线拟合。
磷脂运载体制备 对于评估膜表面疏水性和脂质体渗漏的实验,使用下述步骤。脑磷脂酰丝氨酸(PS)、卵磷脂酰胆碱(PC)、卵磷脂酰乙醇胺(PE)、nitrobenzoxadiazole磷脂酰乙醇胺(NBD-PE)以及丽丝胺罗丹明B磺酰基磷脂酰乙醇胺(Rh-PE)来自商业提供者。多层磷脂脂质体(MLV)是使用Bangham等人(Preparation and use of liposomes as models of biologicalmembranes,in Methods in Membrane Biology(Korn,E.D.,编著)第1-68页,Plenum Press,New York,1974)的方法制备的。通过5次冷冻-解冻循环,然后使用挤出器(Lipex Biomembranes,Vancouver,BC)在30℃挤出(5次)通过0.1μm Nucleopore滤膜将MLV转化为大单层脂质体(LUV)。根据Chen等人(Anal.Chem.28,1756-1758,1956)的方法进行磷酸盐确定。
膜表面疏水性 膜表面疏水性的增加是由于磷脂首基的脱水,所述脱水是通过蛋白质与膜表面结合或者是在聚集过程中发生的两个运载体之间的无水界面的产生。通过将运载体用N-[5-(二甲基氨基)-萘-2-磺酰基)-1,2-二油酰基(dioleoylyl)-sn-甘油-3-PE(丹磺酰-PE)(其发射波长与探测器环境的介电常数成比例)标记来观察膜表面疏水性的改变。在此背景中,制备纯的PS、PS/PE(3∶1)和包含1mol%丹磺酰-PE的PS/PC(1∶1)LUV,并将其加入到900μl缓冲液中(最终磷脂浓度是45μM)。通过将200nM(0.18nmol)蛋白质注射到无钙的样品中,在不同的pH值观察膜联蛋白对这些运载体的影响。在340nm激发样品,并且从400至600nm(23)记录荧光发射。在监控单独的蛋白质影响后观察表面疏水性的依赖于钙的行为。
脂质体渗漏测定 膜联蛋白-磷脂相互作用可能引起磷脂运载体的不稳定,这导致运载体内部的渗漏。在对二甲苯-双-溴化吡啶(p-xylen-bis-pyridiniumbromid(DPX))存在时,通过8-氨基萘-1,3,6-三磺酸(ANTS)的荧光猝灭来监控运载体渗漏。将水溶性荧光团ANTS和其猝灭剂DPX加入缓冲液中,同时制备运载体。使用Sephadex G-50柱,通过凝胶过滤来移除过量的ANTS/DPX缓冲液。在未紊乱的运载体中,荧光团和猝灭剂空间上接近从而DPX猝灭ANTS的荧光。随着运载体渗漏水平的增加,将ANTS和DPX稀释到外面的缓冲液中,导致ANTS荧光的增加(Ellens等人,Biochemistry 24,3099-3106,1985)。
膜联蛋白1的过氧化物酶活性的测定(Gorecka等人2005) 可以用两种方法测试真核或原核系统中表达的重组膜联蛋白1蛋白质的过氧化物酶活性。第一种方法是基于氧化的鲁米那的化学发光。将用非变性电泳分离的含有待分析蛋白质的样品转移到硝酸纤维素膜上,用包含鲁米那的显色溶液(ECL试剂盒,Amersham)覆盖,并且根据制造商的步骤暴露于x射线医学膜1小时。可选地,使用荧光方法确定重组膜联蛋白1蛋白质的过氧化物酶活性,所述方法中使用Amplex Red试剂(Molecular Probes),在Fluorolog 3荧光分光光度计(Jobin YvonSpex,Edison,NJ)上,对于激发和发射都是1-nm狭缝。测定介质(总体积100μl)包含50mM磷酸钠缓冲液,pH 7.4、2mM H2O2、终浓度100μM的Amplex Red试剂。测量在石英比色杯(光路长10mm(0.1ml体积))中进行。在λem 590nm(λexc 560nm)记录Amplex Red试剂氧化的产品,试卤灵,的荧光发射。为了确定蛋白质磷酸化对于过氧化物酶活性的作用,在测量前将AnnAt1与碱性磷酸酶(Sigma,15U/ml)在36℃在pH7.4的磷酸钾缓冲液中孵育10分钟。将无AnnAt1的样品用作为对照。
实施例20用于本发明方法中的核酸序列的克隆 使用定做的拟南芥幼苗cDNA文库(在pCMV Sport6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增本发明方法中使用的核酸序列。在标准条件中使用Hifi Taq DNA聚合酶进行PCR,使用50μlPCR混合物中的200ng模板。使用的引物是prm08727(SEQ ID NO85;有义,起始密码子为黑体)5’-ggggacaagtttgtacaaaaaagcaggcttaaaca
gcgactcttaaggtttct-3’和prm09025(SEQ ID NO86;反义,互补)5’-ggggaccactttgtacaagaaagctgggtttaagcatcatcttcaccgag-3’,其包括用于Gateway重组的AttB位点。还使用标准方法将扩增的PCR片段纯化。随后实施Gateway方法的第一步骤,即BP反应,在此期间PCR片段与pDONR201质粒发生体内重组以产生根据Gateway命名的“entry克隆”,pANN。质粒pDONR201作为
技术的部分从Invitrogen购买。
包含SEQ ID NO83的entry克隆随后在LR反应中与用于稻转化的目的载体一起使用。所述载体在T-DNA边界内含有作为功能性元件的植物选择标记;筛选标记表达盒和意图与已经克隆于所述entry克隆内的目的核酸序列发生LR体内重组的Gateway盒。用于绿色组织特异性表达的稻扩展蛋白启动子(SEQ ID NO95)位于该Gateway盒的上游。
在可选的实施方案中,使用包含GOS2启动子(SEQ ID NO94)的目的载体产生表达载体pGOS2::ANN。
在LR重组步骤后,产生的表达载体pEXP::ANN(图10)或pGOS2::ANN根据本领域众所周知的方法被转化至农杆菌菌株LBA4044中。
实施例21植物转化 根据本文实施例8中所描述的方法进行稻植物的转化。
实施例22表型评价方法 22.1评价准备 产生大约35个独立的T0稻转化体。原代转化体从组织培养箱转移至温室用于生长和收获T1种子。留下6个事件,其中所述事件的T1后代对转基因的存在/不存在以3∶1比例分离。对于这些事件中的每一事件,通过监测目视标记表达而选择含有转基因的大约10株T1幼苗(杂合子和纯合子)和缺少转基因的大约10株T1幼苗(失效合子)。转基因植物和对应的失效合子在随机位置上并排培育。温室条件是短日照(12小时光照),在光线下28℃和在黑暗中22℃以及相对湿度70%。
4个T1事件在T2世代中按照如用于T1世代的相同评价方法作进一步评价,但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
干旱筛选 在正常培养条件下在盆土中培养来自T2种子的植物,直至到达抽穗阶段。接着将其转移至停止浇水的“干旱”部分。在随机选择的盆中插入湿度探测器,以监控土壤含水量(SWC)。当SWC低一定阈值时,自动对植物持续再浇水直至再次达到正常水平。接着将植物再转移至正常条件。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数。
氮使用效率筛选 在除营养液以外均为正常的条件下在盆土中培养来自T2种子的稻植物。从移植到成熟均使用特定的营养液对盆浇水,其中含有降低的氮(N)含量,通常降低7至8倍。其余培养(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如正常条件下培养所详细描述的那样记录生长和产量参数。
22.2统计分析F-检验 使用双因子ANOVA(方差分析)作为统计模型用于植物表型特征的整体评价。对用本发明基因转化的全部事件的全部植物的所有测量参数实施F检验。实施F检验以检查基因对于全部转化事件的作用并验证基因的整体作用(又称作全局基因作用)。用于真实全局基因作用的显著性的阈值对于F检验设置在5%概率水平上。显著性F检验值标示基因作用,意味着不仅仅基因的存在或位置才造成表型上的差异。
由于进行了具有重叠事件的两个实验,因而进行了组合分析。这对于检测两个实验中该效果的一致性是有用的,并且如果是这种情形,则集合来自两个实验的证据从而增加了结论的可信度。使用的方法是混合模型方法,其考虑多级结构的数据(即实验-事件-分离子)。通过比较似然比测试与chi方分布来获得p值。
22.3测量的参数 生物量相关的参数测量 从播种期直至成熟期,使植物通过数字成像箱数次。在每一时间点上,对每株植物从至少6个不同角度拍摄数字图像(2048x1536像素,1600万颜色)。
植物地上部分面积(或叶生物量)通过计数在来自植物地上部分的数字图像上区别于背景的像素的总数而测定。该值对在相同时间点上从不同角度拍摄的图像进行平均化并且通过校准转化成以平方米表示的物理表面值。实验证实以这种方式测量的地上部分植物面积与地上植物部分的生物量相关。地上部分面积是在植物已经达到其最大叶生物量的时间点上所测量的面积。
种子相关参数的测量 将成熟的主圆锥花序(primary panicle)收获、计数、装袋、加条形码标记并且随后在干燥箱内在37°干燥3日。随后将圆锥花序脱粒并且收集及计数全部种子。使用吹气装置分开饱满粒(husk)与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种子数通过计数分离步骤后的饱满粒数而确定。种子总产量通过称量从植物中收获的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的壳粒数目而测量。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每个圆锥花序的花总数在本发明中定义为种子总数与成熟的主圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例23转基因植物的表型评价结果 对于总种子产量、饱满种子数、饱满率、收获指数而言,观察到在非胁迫条件下培养的表达与组成型启动子有效连接的ANN核酸的转基因稻植物的评价表现出超过5%的增加,而对于TKW而言超过3%。在干旱胁迫条件下,对于总种子产量、饱满种子数和饱满率观察到了增加。
表达与绿色组织特异性启动子有效连接的ANN核酸的植物也表现出产量的增加,特别是增加的TKW。
实施例24转化其它作物的实例 其它作物的转化描述于上文实施例12中。
序列表
<110>克罗普迪塞恩股份有限公司(Cropdesign N.V.)
植物功能基因组中心(Crop Functional Genomics Center)
<120>具有增强的产量相关性状的植物和用于产生该植物的方法
<130>PF59233
<150>EP 07108768.8
<151>2007-05-23
<150>US 60/932,226
<151>2007-05-29
<150>EP 07110086.1
<151>2007-06-12
<150>US 60/937,994
<151>2007-06-29
<160>155
<170>PatentIn版本3.3
<210>1
<211>848
<212>DNA
<213>芜青(Brassica rapa)
<400>1
ttgtacaaaa aagcaggctt aaacaatggc gtctgttgct tcttcaacca ctctcatctc 60
ctcctccgct agtgttctcc cagccaccaa gtcttcgctt cttccatctc cctccctctc120
tttccttcca accctctcct ctccttcccc atccgcttct ctccggctcc ctcgtccctc180
tcccctcacc tcaatccgct cctcttctcg ccggagcttc gctgtcaagg cccaaaccga240
tgatcttcca ttggttggaa acaaggcgcc tgattttgag gcagaggctg tgttcgatca300
ggagttcatc aaggtcaagc tctctgagta cattgggaag aagtatgtga ttctcttttt360
ctaccccttg gacttcactt tcgtctgccc aacagagatt actgccttca gtgaccgata420
tgcagaattt gagaagctga acacagaagt gttaggtgtc tctgttgata gtgtgttctc 480
ccaccttgct tgggttcaaa ccgacagaaa atctggagga cttggtgatc tcaactatcc 540
acttatatca gatgtcacta aatctatctc aaaatctttt ggagtgctca tccatgatca 600
gggaatagcg ttgagagggc ttttcataat agacaaggaa ggagtgatcc aacattcaac 660
catcaacaat cttggtattg gccgaagtgt tgatgagaca atgagaaccc ttcaggcatt 720
acagtacatc caggagaacc ctgatgaagt ctgccctgca ggatggaaac caggggagaa 780
gtcaatgaaa cctgacccca agctcagcaa agagtacttc tcagctattt agctcgaacc 840
cagctttc 848
<210>2
<211>268
<212>PRT
<213>芜青
<400>2
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Ser Ala Ser
1 5 10 15
Val Leu Pro Ala Thr Lys Ser Ser Leu Leu Pro Ser Pro Ser Leu Ser
20 25 30
Phe Leu Pro Thr Leu Ser Ser Pro Ser Pro Ser Ala Ser Leu Arg Leu
35 40 45
Pro Arg Pro Ser Pro Leu Thr Ser Ile Arg Ser Ser Ser Arg Arg Ser
50 55 60
Phe Ala Val Lys Ala Gln Thr Asp Asp Leu Pro Leu Val Gly Asn Lys
65 70 75 80
Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys
85 90 95
Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe
100 105 110
Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe
115 120 125
Ser Asp Arg Tyr Ala Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly
130 135 140
Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp
145 150 155 160
Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Asp
165 170 175
Val Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln
180 185 190
Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile
195 200 205
Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu
210 215 220
Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Ile Gln Glu Asn Pro Asp
225 230 235 240
Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro
245 250 255
Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210>3
<211>841
<212>DNA
<213>芜青
<220>
<221>misc_feature
<222>(662)..(662)
<223>n是a、c、g,或t
<400>3
gccatatggc gtctgttgct tcttcaacca ctctcatctc ctcctccgct agtgttctcc 60
cagccaccaa gtcttcgctt cttccatctc cctccctctc tttccttcca accctctcct120
ctccttcccc atccgcttct ctccggtccc tcgtccctct cccctcacct caatccgctt180
cctcttctcg ccggagcttc gctgtcaagg gccaaaccga tgatcttcca ttggttggaa240
acaaggcgcc tgattttgag gcagagggtg tgttcgatca ggagttcatc aagttcatca300
aggtcaagct ctctgattac attgggaaaa agtatgtgat tctctttttt ctaccccttg360
acttcacttt cgtctgccca acagaaatta ctgccttcag tgaccgatat gcagaatttg420
agaagctgaa tacagaagtg ttaggtgttt ctgttgatag tgtgagtgtg ttctcccacc480
ttgctggggt tcaaaccgac agaaaatttg gaggacttgg tgatctcaac tatccactta540
tatcagatgt cactaaatct atctcaaaat cttttggagt gctcatccat gatcagggaa600
tagcgttgag agggcttttc ataatagaca aggaaggagt gatccaacat tcaaccatca660
anaatcttgg tattggccga agtgttgatg agacaatgag aacccttcag gcattacagt720
acatccagga aggccctggt gaagtctgcc ctgcaggatg gaaaccaggg gagaagtcaa780
tgaaacctga ccccaagctc agcaaagagc tcttctcagc tatttagctc gaggctaagc840
c841
<210>4
<211>273
<212>PRT
<213>芜青
<220>
<221>未确定
<222>(219)..(219)
<223>Xaa可以是任何天然存在的氨基酸
<400>4
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Ser Ala Ser
1 5 10 15
Val Leu Pro Ala Thr Lys Ser Ser Leu Leu Pro Ser Pro Ser Leu Ser
20 25 30
Phe Leu Pro Thr Leu Ser Ser Pro Ser Pro Ser Ala Ser Leu Arg Ser
35 40 45
Leu Val Pro Leu Pro Ser Pro Gln Ser Ala Ser Ser Ser Arg Arg Ser
50 55 60
Phe Ala Val Lys Gly Gln Thr Asp Asp Leu Pro Leu Val Gly Asn Lys
65 70 75 80
Ala Pro Asp Phe Glu Ala Glu Gly Val Phe Asp Gln Glu Phe Ile Lys
85 90 95
Phe Ile Lys Val Lys Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Leu Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Ala Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Val Leu Gly Val Ser Val Asp Ser Val Ser Val Phe Ser His Leu Ala
145 150 155 160
Gly Val Gln Thr Asp Arg Lys Phe Gly Gly Leu Gly Asp Leu Asn Tyr
165 170 175
Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Phe Gly Val
180 185 190
Leu Ile His Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp
195 200 205
Lys Glu Gly Val Ile Gln His Ser Thr Ile Xaa Asn Leu Gly Ile Gly
210 215 220
Arg Ser Val Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Ile
225 230 235 240
Gln Glu Gly Pro Gly Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu
245 250 255
Lys Ser Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Leu Phe Ser Ala
260 265 270
Ile
<210>5
<211>1002
<212>DNA
<213>拟南芥(Arabidopsis thaliana)
<400>5
gtgattgaca gatagataag agtgtttggt agctcagact cagagagtca caaagtgtgt 60
gtagcagcaa tggcgtctgt tgcttcttca actactctca tctcttctcc ctcttctagg120
gtttttccag caaagtcttc actttcctct ccatctgttt ctttccttcg aaccctttct180
tctccttccg catctgcttc tctccgctcc ggatttgctc gacgctcttc cctcagctcc240
acttctcgtc ggagctttgc tgtcaaagcc caggccgatg atcttccact ggttggaaac300
aaggcgcctg attttgaggc agaggctgtg tttgatcaag agttcatcaa ggttaagctc360
tctgattaca ttggaaagaa gtatgtgatt ctctttttct acccattgga ctttactttc420
gtctgcccaa cagagattac tgccttcagt gaccggcatt cagaatttga gaagttgaac480
accgaagtat taggtgtttc tgtcgatagt gtgttctctc accttgcatg ggtccaaaca540
gacaggaaat ctggagggct tggtgatctg aactatcccc ttatttcata tttcactaaa600
tcaatctcaa agtcgttcgg agtgctcatc catgatcagg gaatagcact gagaggactt660
ttcataatcg acaaggaagg agtgatccaa cattccacca tcaacaatct tggtattggc720
caaagcgttg atgagacaat gagaaccctc caggcattac agtacatcca ggaaaacccg780
gatgaagtct gcccagcagg atggaagccg ggtgagaagt caatgaaacc cgacccaaaa840
ctcagcaaag agtacttctc agctatttag aaactctact atgatagcaa aaaggtacaa900
tctttgttat atgtgagcag agtttttttt cttgtacgct aaaacaatcc tttgtttgat960
tctcactttg tccccaaaat tataataaaa aactttttcc gc 1002
<210>6
<211>266
<212>PRT
<213>拟南芥
<400>6
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Pro Ser Ser
1 5 10 15
Arg Val Phe Pro Ala Lys Ser Ser Leu Ser Ser Pro Ser Val Ser Phe
20 25 30
Leu Arg Thr Leu Ser Ser Pro Ser Ala Ser Ala Ser Leu Arg Ser Gly
35 40 45
Phe Ala Arg Arg Ser Ser Leu Ser Ser Thr Ser Arg Arg Ser Phe Ala
50 55 60
Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly Asn Lys Ala Pro
65 70 75 80
Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys
85 90 95
Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro
100 105 110
Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp
115 120 125
Arg His Ser Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly Val Ser
130 135 140
Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys
145 150 155 160
Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Tyr Phe Thr
165 170 175
Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln Gly Ile
180 185 190
Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His
195 200 205
Ser Thr Ile Asn Asn Leu Gly Ile Gly Gln Ser Val Asp Glu Thr Met
210 215 220
Arg Thr Leu Gln Ala Leu Gln Tyr Ile Gln Glu Asn Pro Asp Glu Val
225 230 235 240
Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro
245 250 255
Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210>7
<211>988
<212>DNA
<213>欧洲油菜(Brassica napus)
<400>7
gtcgaccacg cgtccggaga gaaagagaga gagagcagag ttcttcagtc catggcttcc 60
ttagcttcaa ccaccacact tatctcttca tctagcgttc ttcttccctc aaagccttct120
cctttttctc ccgccgcctc cttcctccga actcttcctt ctacctccgt atctacctcc180
tcttctctcc gctcctgttt ctccagcatc agtcccctca cctgcatccg ctcttcctct240
cgccctagct tcgccgtcaa ggcccaggct gatgatttgc cactggttgg taacaaggcg300
cctgattttg aggcagaggc tgtttttgac caagagttca tcaaggtgaa gctctcagag360
tacattggta aaaagtatgt gattctgttt ctctaccctt tggacttcac ttttgtctgc420
cctacggaga ttactgcctt cagtgaccgt tatgaagaat ttgagaagct aaacacggaa480
gtgttaggtg tctcagtcga cagtgtgttc tcgcatcttg cgtgggtcca aacagagaga540
aagtcaggag ggctgggtga cctgaactac ccacttgtct ctgatatcac taaatccatt600
tcaaaatctt ttggagtgct catccctgat cagggcattg cactgagagg gcttttcatc660
atcgacaaaa aaggagtcat acagcattcc acaatcaaca acctcggtat tggccgaagc720
gttgatgaga caatgagaac cctccaggca ttgcagtatg ttcaagaaaa ccctgatgag780
gtttgccccg cgggatggaa gcctggggag aaatcgatga agcctgaccc caagctgagc840
aaagagtatt tttcagctat ttaaaggctt tttaaacaaa tgattggtga aaagcagagg900
catgttttgt cttcattgct tatgtttctg ctatgtgtgt tttcctcaaa attgaataaa 960
aataatggaa tttaaaaaaa aaaaaaaa 988
<210>8
<211>270
<212>PRT
<213>欧洲油菜
<400>8
Met Ala Ser Leu Ala Ser Thr Thr Thr Leu Ile Ser Ser Ser Ser Val
1 5 10 15
Leu Leu Pro Ser Lys Pro Ser Pro Phe Ser Pro Ala Ala Ser Phe Leu
20 25 30
Arg Thr Leu Pro Ser Thr Ser Val Ser Thr Ser Ser Ser Leu Arg Ser
35 40 45
Cys Phe Ser Ser Ile Ser Pro Leu Thr Cys Ile Arg Ser Ser Ser Arg
50 55 60
Pro Ser Phe Ala Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly
65 70 75 80
Asn Lys Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe
85 90 95
Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile Leu
100 105 110
Phe Leu Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr
115 120 125
Ala Phe Ser Asp Arg Tyr Glu Glu Phe Glu Lys Leu Asn Thr Glu Val
130 135 140
Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln
145 150 155 160
Thr Glu Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Val
165 170 175
Ser Asp Ile Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile Pro
180 185 190
Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Lys Gly
195 200 205
Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val
210 215 220
Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu Asn
225 230 235 240
Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met
245 250 255
Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265 270
<210>9
<211>1146
<212>DNA
<213>拟南芥
<400>9
agctatttgg tttctctatc cgattcgtct ctctcacgcc ctcacgttta tccacctcat 60
cctcaaacca aaccacaaga cctctttttt aagtaaccaa tcacagagag atagagagag120
agaacagagt caatgtcaat ggcgtctata gcttcttctt cttccaccac cctactctct180
tcctctaggg ttcttcttcc ctccaagtct tctcttttat ctcctaccgt ctctttcccc240
agaatcatac cctcttcctc ggcatcatcc tcttctctct gttccgggtt ctccagtctc300
ggttccctca ccaccaaccg ctccgcctca cgccggaact tcgccgtcaa ggctcaggct360
gatgatttac cactggtcgg taataaggcg cctgattttg aagctgaggc agtttttgat420
caagagttca taaaggtgaa gctctctgag tacattggca aaaagtatgt tattctattc480
ttctaccctt tggacttcac ttttgtctgc cccactgaga ttactgcctt cagtgaccgt540
tatgaagaat ttgagaagct aaacaccgaa gtattagggg tctctgtcga cagtgtgttc600
tcgcatcttg cgtgggtcca aacagacaga aagtcgggag ggctcggtga tctgaattat660
cctcttgttt cggatatcac taaatccatt tcaaaatcgt ttggagtgct catccctgat 720
cagggcattg cactgagagg gcttttcatc atagacaagg aaggagtcat tcagcattcc 780
accatcaaca acctcggtat tggccgaagt gttgatgaga caatgagaac cctccaggca 840
ttacagtatg ttcaagaaaa cccggatgaa gtgtgccctg cgggatggaa gccaggggag 900
aaatcaatga aacctgaccc caagctcagc aaagaatact tttcagctat ctagaggcta 960
agattgaaca catgtttggt gaaaattagc aatcagagtt gttttattcg tcttttcaaa 1020
gttggagcag agttgttatt tttagccaaa gaacctttgt atctatctca tctttctcct 1080
gtttctgcta tgtgattctc cttaaattga atcaaaaata aagaaatcct tcttttcttt 1140
tgccaa1146
<210>10
<211>271
<212>PRT
<213>拟南芥
<400>10
Met Ala Ser Ile Ala Ser Ser Ser Ser Thr Thr Leu Leu Ser Ser Ser
1 5 10 15
Arg Val Leu Leu Pro Ser Lys Ser Ser Leu Leu Ser Pro Thr Val Ser
20 25 30
Val Pro Arg Thr Leu His Ser Ser Ser Ala Ser Ser Ser Ser Leu Cys
35 40 45
Ser Gly Phe Ser Ser Leu Gly Ser Leu Thr Thr Ser Arg Ser Ala Ser
50 55 60
Arg Arg Asn Phe Ala Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val
65 70 75 80
Gly Asn Lys Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu
85 90 95
Phe Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Glu Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Val Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val
145 150 155 160
Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu Ash Tyr Pro Leu
165 170 175
Val Ser Asp Ile Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile
180 185 190
Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu
195 200 205
Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser
210 215 220
Val Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu
225 230 235 240
Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser
245 250 255
Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265 270
<210>11
<211>867
<212>DNA
<213>菠菜(Spinacia oleracea)
<400>11
gtgtgtagca gcaatggcgt gtgttgcttc ttcaactact ctcatctctt ctccctcttc 60
tagggttttt ccagcaaagt cttcactttc ctctccatct gtttctttcc ttcgaaccct120
ttcttctcct tccgcatctg cttctctccg ctccggattt gctcgacgct cttccctcag180
ctccacttct cgtcggagct ttgctgtcaa agcccaggcc gatgatcttc cactggttgg240
aaacaaggcg cctgattttg aggcagaggc tgtgtttgat caagagttca tcaaggttaa300
gctctctgat tacattggaa agaagtatgt gattctgttt ttctacccat tggactttac360
tttcgtctgc ccaacagaga ttactgcctt cagtgaccgg cattcagaat ttgagaagtt420
gaacaccgaa gtattaggtg tttctgtcga tagtgtgttc tctcaccttg catgggtcca480
aacagacagg aaatctggag ggcttggtga tctgaactat ccccttattt cagatgtcac540
taaatcaatc tcaaagtcgt tcggagtgct catccatgat cagggaatag cactgagagg600
acttttcata atcgacaagg aaggagtgat ccaacattcc accatcaaca atcttggtat660
tggccgaagc gttgatgaga caatgagaac cctccaggca ttacagtaca caggaaaccc720
ggatgaagtc tgcccagcag gatggaagcc gggtgagaag tcaatgaaac ccgacccaaa780
actcagcaag gagtacttct cagctattta gaactctact atgatagcaa aggtacatct840
ttgttatatg tgagcagagt ttttctg867
<210>12
<211>265
<212>PRT
<213>菠菜
<400>12
Met Ala Cys Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Pro Ser Ser
1 5 10 15
Arg Val Phe Pro Ala Lys Ser Ser Leu Ser Ser Pro Ser Val Ser Phe
20 25 30
Leu Arg Thr Leu Ser Ser Pro Ser Ala Ser Ala Ser Leu Arg Ser Gly
35 40 45
Phe Ala Arg Arg Ser Ser Leu Ser Ser Thr Ser Arg Arg Ser Phe Ala
50 55 60
Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly Asn Lys Ala Pro
65 70 75 80
Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys
85 90 95
Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro
100 105 110
Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp
115 120 125
Arg His Ser Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly Val Ser
130 135 140
Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys
145 150 155 160
Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Asp Val Thr
165 170 175
Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln Gly Ile
180 185 190
Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His
195 200 205
Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu Thr Met
210 215 220
Arg Thr Leu Gln Ala Leu Gln Tyr Thr Gly Asn Pro Asp Glu Val Cys
225 230 235 240
Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys
245 250 255
Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210>13
<211>990
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>13
ggcacgagct cctatccaat ggcttgctct gcttcttcta cagcacttct ttcttccaac 60
ccaaaagcag cttccatttc ccccaaatcc tcctttcaag ctcccatttc tcaatgttta120
tctgtacctt cctctttcaa tgggctccgt aattgcaagc cttttgtttc tcgtgtagcc180
cgttccctct ctactcgcgt tgctcaatcc caacgccgtc gtttcgttgt tcgtgcctct240
agtgaacttc cacttgttgg aaatcaagcg ccagactttg aggctgaagc tgtttttgat300
caagaattca tcaaggttaa actatctgag tacattggga agaagtatgt cattctcttt360
ttctacccac tagactttac atttgtttgc ccaacagaga tcactgcttt cagtgaccgt420
tatggagaat ttgaaaagtt gaacacagaa atattgggtg tttccgtaga cagtgtgttc480
tcccaccttg cctgggttca aactgataga aagtctggtg gcctaggtga tctgaactat540
ccattaattt ccgacgtgac caagtcaatt tcaaaatcat acaatgttct gatccccgat600
cagggaattg cattgagagg acttttcatc attgacaagg aaggagttat tcagcattca660
accattaaca atcttggaat tggtcgtagt gttgatgaaa cattgagaac tcttcaggca720
ttgcaatacg ttcaggataa cccggatgaa gtgtgcccag ctggatggaa gcctggggag780
aaatccatga agcctgaccc caagggtagc aaagaatact ttgcatccat atgaggtgat840
gactgcaatt gctttatcta atttgttgtt taggaaggct ggagacccta cttttctgtt900
acatttttct aatgtaccgg ctgagtttgg tcatttttga gaatatatac acttgtacac960
ttttaaaaaa aaaaaaaaaa aaaaaaaaaa 990
<210>14
<211>271
<212>PRT
<213>烟草
<400>14
Met Ala Cys Ser Ala Ser Ser Thr Ala Leu Leu Ser Ser Asn Pro Lys
1 5 10 15
Ala Ala Ser Ile Ser Pro Lys Ser Ser Phe Gln Ala Pro Ile Ser Gln
20 25 30
Cys Leu Ser Val Pro Ser Ser Phe Asn Gly Leu Arg Asn Cys Lys Pro
35 40 45
Phe Val Ser Arg Val Ala Arg Ser Leu Ser Thr Arg Val Ala Gln Ser
50 55 60
Gln Arg Arg Arg Phe Val Val Arg Ala Ser Ser Glu Leu Pro Leu Val
65 70 75 80
Gly Asn Gln Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu
85 90 95
Phe Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Gly Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val
145 150 155 160
Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu
165 170 175
Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Tyr Asn Val Leu Ile
180 185 190
Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu
195 200 205
Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser
210 215 220
Val Asp Glu Thr Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Asp
225 230 235 240
Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser
245 250 255
Met Lys Pro Asp Pro Lys Gly Ser Lys Glu Tyr Phe Ala Ser Ile
260 265 270
<210>15
<211>944
<212>DNA
<213>菜豆(Phaseolus vulgaris)
<400>15
tctattctat ctacactcac tctctcactc tcccactctc ccatggcttc ctcagctccc 60
tgtgcttctc tcatatcctc aaaccctaac attctcttct ctcccaaatt cccttcttct 120
tccttttctt ccctctcctt ccccaattcc cccaactctc ttttcaaacc tttacgcact 180
tctctcaatc cttcatctcc ccctctcaga accttcgttg ccagggcttc gagtgaactt 240
ccattagttg ggaacacagc accggatttt gaagcagagg ccgtttttga tcaggagttc 300
atcaaggtca aactatctga ttatattggg aaaaaatatg ttatcctctt tttctatcca 360
ctggacttca cattcgtttg tccgacagaa atcactgcct tcagtgaccg gtatgcagag 420
tttgaggcac taaatacaga aattttgggt gtttcagttg acagtgtttt ttcacacctt 480
gcatgggttc aaactgatag aaagtcgggt ggtcttggcg acttgaatta tccattgatt 540
tctgatgtca ccaaatccat ctcaaaatct tatgatgttc tcattcccga tcaggggatt 600
gcattgagag gattgttcat tattgacaag gaaggggtta ttcagcattc taccattaac 660
aacctggcca ttggtagaag tgttgatgag acaaagagaa cgctccaggc cttgcagtat 720
gtgcaggaga acccagatga agtttgccca gctgggtgga agcctggtga gaagtccatg 780
aaaccagacc ctaaacttag caaagagtac ttctctgcta tttagggagg ataatggttg 840
aagagtagca attgctcata tgtatcaatc aatgataatt tgtataatgc aacgcaagtt 900
tataaagttt tgattgagag ggtctcatga ttatacaaaa aaaa 944
<210>16
<211>260
<212>PRT
<213>菜豆
<400>16
Met Ala Ser Ser Ala Pro Cys Ala Ser Leu Ile Ser Ser Asn Pro Asn
1 5 10 15
Ile Leu Phe Ser Pro Lys Phe Pro Ser Ser Ser Phe Ser Ser Leu Ser
20 25 30
Phe Pro Asn Ser Pro Asn Ser Leu Phe Lys Pro Leu Arg Thr Ser Leu
35 40 45
Asn Pro Ser Ser Pro Pro Leu Arg Thr Phe Val Ala Arg Ala Ser Ser
50 55 60
Glu Leu Pro Leu Val Gly Asn Thr Ala Pro Asp Phe Glu Ala Glu Ala
65 70 75 80
Val Phe Asp Gln Glu Phe Ile Lys Val Lys Leu Ser Asp Tyr Ile Gly
85 90 95
Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val
100 105 110
Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala Glu Phe Glu
115 120 125
Ala Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser
130 135 140
His Leu Ala Trp Val Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp
145 150 155 160
Leu Asn Tyr Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser
165 170 175
Tyr Asp Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe
180 185 190
Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu
195 200 205
Ala Ile Gly Arg Ser Val Asp Glu Thr Lys Arg Thr Leu Gln Ala Leu
210 215 220
Gln Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys
225 230 235 240
Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr
245 250 255
Phe Ser Ala Ile
260
<210>17
<211>1044
<212>DNA
<213>豌豆(Pisum sativum)
<220>
<22l>misc_feature
<222>(968)..(968)
<223>n是a、c、g,或t
<400>17
atggcttgct cagctccatt tgcttctctc ctatattcaa accctaacac actcttctct 60
cccaaattct cttctccgcg cctctcttct ctctcaatcc ccaatgcacc caattctctc120
cccaaactac gcacttccct ccctctttcc ctcaaccgct cctcttcctc tcgccgcact180
ttcgtcgtta gggcttctgg tgaattacca ttagttggga actcagcgcc ggattttgaa240
gctgaagctg ttttcgatca ggagtttatc aaggtcaaac tatctgaata tattgggaag300
aaatatgtta tcctcttttt ctacccattg gacttcacgt tcgtttgccc aacagaaatc360
actgctttca gtgaccggca tgcagagttt gatgcaataa atactgagat tttgggtgtt420
tcagttgaca gtgtgttctc gcaccttgca tgggttcaat cagatagaaa gtcaggtggc480
cttggtgact tgaaatatcc tctggtttct gatgtcacca aatccatatc ggaatcttac540
ggtgttctca ttcccgatca gggaattgca ttgagaggat tgttcattat cgataaggaa600
ggggtgatcc aacattccac catcaacaac ctcggaattg gtagaagtgt tgacgagaca660
aagagaacac tccaggcttt gcagtatgtg caggagaacc cagatgaagt ttgccctgct720
gggtggaagc ctggtgagaa gtccatgaaa ccagacccca aaggtagcaa agagtacttt780
gctgctgtgt agaatggcta atagtaaatt gctatgagta ttaactactc atctgtatca840
tttgggatgt aaaaggattt tgttttatgt aattctatcc attttgaatt atgaggccta900
tgggcttagc cataaaaata aaaagtatga ggtccaaaag tgtgtggtta cagaagcatg 960
cttgtgtncc ttgattttgg agtgaattat gaattgatgt attatctgta aaaaaaaaaa 1020
aaaaaaaaaa aaaaaaaaaa aaaa 1044
<210>18
<211>263
<212>PRT
<213>豌豆
<400>18
Met Ala Cys Ser Ala Pro Phe Ala Ser Leu Leu Tyr Ser Asn Pro Ash
1 5 10 15
Thr Leu Phe Ser Pro Lys Phe Ser Ser Pro Arg Leu Ser Ser Leu Ser
20 25 30
Ile Pro Asn Ala Pro Asn Ser Leu Pro Lys Leu Arg Thr Ser Leu Pro
35 40 45
Leu Ser Leu Asn Arg Ser Ser Ser Ser Arg Arg Thr Phe Val Val Arg
50 55 60
Ala Ser Gly Glu Leu Pro Leu Val Gly Asn Ser Ala Pro Asp Phe Glu
65 70 75 80
Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys Leu Ser Glu
85 90 95
Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe
100 105 110
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg His Ala
115 120 125
Glu Phe Asp Ala Ile Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser
130 135 140
Val Phe Ser His Leu Ala Trp Val Gln Ser Asp Arg Lys Ser Gly Gly
145 150 155 160
Leu Gly Asp Leu Lys Tyr Pro Leu Val Ser Asp Val Thr Lys Ser Ile
165 170 175
Ser Glu Ser Tyr Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg
180 185 190
Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile
195 200 205
Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu Thr Lys Arg Thr Leu
210 215 220
Gln Ala Leu Gln Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala
225 230 235 240
Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys Gly Ser
245 250 255
Lys Glu Tyr Phe Ala Ala Val
260
<210>19
<211>1078
<212>DNA
<213>稻(Oryza sativa)
<400>19
acccaagctc ccaaacccct ctcgcaccca atccaaccca atcccctcct catccactcc 60
gctctgcggc catggccgcc tgctgctcct ccctcgccac cgccgtctcc tcctcctccg120
ccaagcccct cgccggcatc ccccccgccg cgccgcactc cctctccctc ccccgcgctc180
ccgccgccag gcccctccgc ctctccgcct cctcatccag atccgcccgg gccagcagct240
tcgtcgcccg cgccggcggt gtggacgatg cgccgctggt cgggaacaag gcgcccgact300
tcgatgcgga ggcagtcttc gaccaggagt tcatcaacgt gaagctgtcc gactacatcg360
ggaagaagta cgtcattctc ttcttctacc cgttggactt caccttcgtc tgcccgaccg420
agattaccgc tttcagtgac agatacgatg agttcgagaa gttgaacact gagatcctcg480
gtgtttcaat tgacagtgtg ttctcccatc ttgcatgggt gcagacagac aggaaatctg540
gtgggcttgg tgatctgaaa tacccattga tttcagatgt tactaaatca atttcgaagt600
cctttggtgt cttgatccct gaccagggaa ttgctctgag aggacttttc atcattgaca660
aggagggagt gattcagcac tctaccatta acaaccttgc cattggacgc agtgtagatg720
agaccatgag gacccttcag gcgttgcagt acgtccagga caacccggac gaggtgtgcc780
cggccggatg gaagcccggt gacaagtcga tgaagcctga ccccaaggga agcaaggagt840
acttcgcggc catctaagca cacatatgca tatgcctggt gatggatgta gggagttttt900
ttgctttcgc gagagccatt gcgtttcgtc tccaaagtgt agtaccgtgt gctcgtctga960
tcggattttg ttacttgttc gccaccagct gttactttgt tccctaacaa ataaggcttt 1020
gttttggtcg tgttatacat gtatacatgt tagtgcgttt caagatcgct tctgtttt 1078
<210>20
<211>261
<212>PRT
<213>稻
<400>20
Met Ala Ala Cys Cys Ser Ser Leu Ala Thr Ala Val Ser Ser Ser Ser
1 5 10 15
Ala Lys Pro Leu Ala Gly Ile Pro Pro Ala Ala Pro His Ser Leu Ser
20 25 30
Leu Pro Arg Ala Pro Ala Ala Arg Pro Leu Arg Leu Ser Ala Ser Ser
35 40 45
Ser Arg Ser Ala Arg Ala Ser Ser Phe Val Ala Arg Ala Gly Gly Val
50 55 60
Asp Asp Ala Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Asp Ala Glu
65 70 75 80
Ala Val Phe Asp Gln Glu Phe Ile Asn Val Lys Leu Ser Asp Tyr Ile
85 90 95
Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe
100 105 110
Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Asp Glu Phe
115 120 125
Glu Lys Leu Asn Thr Glu Ile Leu Gly Val Ser Ile Asp Ser Val Phe
130 135 140
Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly
145 150 155 160
Asp Leu Lys Tyr Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys
165 170 175
Ser Phe Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu
180 185 190
Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn
195 200 205
Leu Ala Ile Gly Arg Ser Val Asp Glu Thr Met Arg Thr Leu Gln Ala
210 215 220
Leu Gln Tyr Val Gln Asp Asn Pro Asp Glu Val Cys Pro Ala Gly Trp
225 230 235 240
Lys Pro Gly Asp Lys Ser Met Lys Pro Asp Pro Lys Gly Ser Lys Glu
245 250 255
Tyr Phe Ala Ala Ile
260
<210>21
<211>1067
<212>DNA
<213>黑麦(Secale cereale)
<400>21
tcttcatatt cgggaaccct atctatctgg aggctaccgc ggccgccccc gggcactccc 60
cgcctgacaa ccacggccat ggcgtgcgcc ttctccgcct ccaccgtgtc cacggcggcc120
gcgctcgtcg cgtccccgaa gccagccggg gcgccgagtg cctgtcgttt ccccgcgctt180
cgcaggggcc gcgcaggcct ccgctgcgcg cggctcgagg acgccagggc ccgcagcttc240
gtcgcccgcg ccgcagccga gtacgacctg ccactggtgg ggaacaaagc accggacttc300
gctgcggagg ccgtgttcga ccaggagttc atcaacgtca agctatctga ttacattggg 360
aagaagtatg tgattctttt cttctaccct ctggacttca ccttcgtctg cccaactgag 420
attacggctt tcagcgacag acatgaggag ttcgagaaga taaacactga aattcttggt 480
gtttcagttg atagtgtgtt ttcccatctt gcatgggtgc agacagagag gaaatctggt 540
ggacttggtg atcttaagta tcctctggtt tctgatgtca ccaaatcaat ctcaaagtct 600
tttggtgtat tgatccctga tcagggaatt gctctgagag gattattcat gattgacaag 660
gagggtgtga ttcagcattc cactattaac aaccttggta ttggccgcag tgtggatgag 720
accttgagaa cccttcaggc tctgcaatac gtccaagaaa acccagacga ggtctgcccg 780
gcaggatgga aacccgggga aaagtcgatg aagcctgacc ctaagggcag caaggagtac 840
ttcgctgcca tctagatgcg acctttgcgc tcacagtctg agttttgtca tggccatttc 900
tggttacttg tgttcttgtg acccgagttg tagttatcac gcgtccaatt gcctctgtaa 960
ttcctccaat aagggtttgt ctgtgtgttg attttccctc ctccaatttg gaaagcccaa 1020
tccaagattg gaaataaaac cttctgccac ccaaaaaaaa aaaaaaa 1067
<210>22
<211>258
<212>PRT
<213>黑麦
<400>22
Met Ala Cys Ala Phe Ser Ala Ser Thr Val Ser Thr Ala Ala Ala Leu
1 5 10 15
Val Ala Ser Pro Lys Pro Ala Gly Ala Pro Ser Ala Cys Arg Phe Pro
20 25 30
Ala Leu Arg Arg Gly Arg Ala Gly Leu Arg Cys Ala Arg Leu Glu Asp
35 40 45
Ala Arg Ala Arg Ser Phe Val Ala Arg Ala Ala Ala Glu Tyr Asp Leu
50 55 60
Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Ala Ala Glu Ala Val Phe
65 70 75 80
Asp Gln Glu Phe Ile Asn Val Lys Leu Ser Asp Tyr Ile Gly Lys Lys
85 90 95
Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro
100 105 110
Thr Glu Ile Thr Ala Phe Ser Asp Arg His Glu Glu Phe Glu Lys Ile
115 120 125
Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu
130 135 140
Ala Trp Val Gln Thr Glu Arg Lys Ser Gly Gly Leu Gly Asp Leu Lys
145 150 155 160
Tyr Pro Leu Val Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Phe Gly
165 170 175
Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Met Ile
180 185 190
Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile
195 200 205
Gly Arg Ser Val Asp Glu Thr Leu Arg Thr Leu Gln Ala Leu Gln Tyr
210 215 220
Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly
225 230 235 240
Glu Lys Ser Met Lys Pro Asp Pro Lys Gly Ser Lys Glu Tyr Phe Ala
245 250 255
Ala Ile
<210>23
<211>876
<212>DNA
<213>叉钱苔(Riccia fluitans)
<400>23
gttgggaaag gcagcaaata tggcaaccgc ctgtgctgca gtgtctgcag tggctgttcc 60
tgtggcctct gtagctaacc acattgcgtc ttcatcatct gggaccccat cccttgccat120
tcccaggtct tatgagggtt taaacaaatc cttcggcgct agaattgcac cccgatcaac180
ctccgctttt cgcaagcccg tcactggtgt ctccctcaag cagttctcga agggaaaagt240
cgcttctgcg agatgtgcgt cacctcttgt tggaaatgtc gccccggact tcgaggcgga300
ggccgttttt gaccaagagt tcgtgaagat caagctctcg gagtacattg ggaagagata360
cgttgttctt ttcttctacc ctcttgactt caccttcgtt tgcccaacag aaattaccgc420
atttagcgac aaacacgaag agtttgagaa gttgaacacc gaagttattg gggtttctac480
tgacagtgtg ttttcccatc ttgcctggat tcaaactgac agaaaatctg gaggacttgg540
tgacttgaag tacccacttg tgtccgactt gaccaagaag atcgctgaag attttggagt600
attgatcccc gatcagggca ttgcattgcg aggattgttc atcatcgaca aggagggcgt660
cattcagcac gcaaccatta acaatttggc catcggcaga agtgtggagg agacgcttcg720
aactctgcag gctgtacaat atgtgcagga gaacccagac gaggtctgcc ccgctggctg780
gaagccgggt gaaaagacca tgaagcctga cacaaagctc agcaaggagt acttcgcaca840
agtataggcc gaaaatagct tcgtttggaa tacata 876
<210>24
<211>275
<212>PRT
<213>叉钱苔
<400>24
Met Ala Thr Ala Cys Ala Ala Val Ser Ala Val Ala Val Pro Val Ala
1 5 10 15
Ser Val Ala Asn His Ile Ala Ser Ser Ser Ser Gly Thr Pro Ser Leu
20 25 30
Ala Ile Pro Arg Ser Tyr Glu Gly Leu Asn Lys Ser Phe Gly Ala Arg
35 40 45
Ile Ala Pro Arg Ser Thr Ser Ala Phe Arg Lys Pro Val Thr Gly Val
50 55 60
Ser Leu Lys Gln Phe Ser Lys Gly Lys Val Ala Ser Ala Arg Cys Ala
65 70 75 80
Ser Pro Leu Val Gly Asn Val Ala Pro Asp Phe Glu Ala Glu Ala Val
85 90 95
Phe Asp Gln Glu Phe Val Lys Ile Lys Leu Ser Glu Tyr Ile Gly Lys
100 105 110
Arg Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys
115 120 125
Pro Thr Glu Ile Thr Ala Phe Ser Asp Lys His Glu Glu Phe Glu Lys
130 135 140
Leu Asn Thr Glu Val Ile Gly Val Ser Thr Asp Ser Val Phe Ser His
145 150 155 160
Leu Ala Trp Ile Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu
165 170 175
Lys Tyr Pro Leu Val Ser Asp Leu Thr Lys Lys Ile Ala Glu Asp Phe
180 185 190
Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile
195 200 205
Ile Asp Lys Glu Gly Val Ile Gln His Ala Thr Ile Asn Asn Leu Ala
210 215 220
Ile Gly Arg Ser Val Glu Glu Thr Leu Arg Thr Leu Gln Ala Val Gln
225 230 235 240
Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro
245 250 255
Gly Glu Lys Thr Met Lys Pro Asp Thr Lys Leu Ser Lys Glu Tyr Phe
260 265 270
Ala Gln Val
275
<210>25
<211>1255
<212>DNA
<213>Chlamydomonas incerta
<400>25
atggccgctc tgcagtccgc ttcccgctcc tcggcggtgg ccttctcgcg ccaggcgcgc 60
gtggccccgc gcgttgcctc cagcgttgct cgccgcaacc tggtcgtgcg cgcttcccac120
gctgagaagc ctctggtcgg ctccgtcgcc cctgacttca aggcccaggc cgtgttcgac180
caggagttcc aggagattac cctgagcaag taccgcggca agtacgtggt gctgttcttc240
taccccctgg acttcacctt cgtgtgcccc accgagatca ccgccttctc ggaccgctac300
aaggagttca aggacatcaa caccgaggtc ctgggcgtgt ccgtggacag ccagttcacc360
cacctggcct ggattcagac cgaccgcaag gagggtggcc tgggcgacct gaactacccc420
ctggtggctg acctgaagaa ggagatctcc aaggcctacg gcgtcctgac cgaggacggc480
atctccctgc gcggcctgtt catcatcgac aaggagggcg ttgtgcagca cgccaccatc540
aacaacctgg ctttcggccg ctcggtcgac gagaccaagc gtgtgctgca ggccatccag600
tacgtgcagt ccaaccccga tgaggtctgc cccgccggct ggaagcccgg tgacaagacc660
atgaagcccg accccaaggg ctccaaggag tacttcgccg ccgtgtaaat tgacccttga720
ttgagagtca atgacacgcg agggcgtcat cgcagtactc gggggcatgc tgcagatcag780
caggcatgcg gacgagacca gtgcattggc aggctaggcg cacacgggag gcagagccag840
tgcggcggca gcggcgagcg gcggctgtgg aagcaggcgc tagcagcagc ggcggccgcg900
gcggcgctgc tctccatggg tgcgcctgca agcagcatgt gcatgtggac tcggtgcttc960
tcgttgatgg gtcagggcgg cgttgccggt ggtgcggacc gggcggtaat cgcacgtagc 1020
tcaattgttg cgtgcgggcg ctgtgcgggc tggcgtgacg gcacgcaacc tgtgtggggc 1080
ctgttggtac gctcgcgata atgcagtgcg cggtccgagc ggagggacgc ggcggtgaat 1140
agctgctgta gtttcaggca gggatttacc aggtgacggg tggttgcgcc cacacccgaa1200
cggctgtgat cccaattttc catgagaggg cttgcagatg gacggcgtgt gatcg 1255
<210>26
<211>235
<212>PRT
<213>Chlamydomonas incerta
<400>26
Met Ala Ala Leu Gln Ser Ala Ser Arg Ser Ser Ala Val Ala Phe Ser
1 5 10 15
Arg Gln Ala Arg Val Ala Pro Arg Val Ala Ser Ser Val Ala Arg Arg
20 25 30
Asn Leu Val Val Arg Ala Ser His Ala Glu Lys Pro Leu Val Gly Ser
35 40 45
Val Ala Pro Asp Phe Lys Ala Gln Ala Val Phe Asp Gln Glu Phe Gln
50 55 60
Glu Ile Thr Leu Ser Lys Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe
65 70 75 80
Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe
85 90 95
Ser Asp Arg Tyr Lys Glu Phe Lys Asp Ile Asn Thr Glu Val Leu Gly
100 105 110
Val Ser Val Asp Ser Gln Phe Thr His Leu Ala Trp Ile Gln Thr Asp
115 120 125
Arg Lys Glu Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Val Ala Asp
130 135 140
Leu Lys Lys Glu Ile Ser Lys Ala Tyr Gly Val Leu Thr Glu Asp Gly
145 150 155 160
Ile Ser Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Val Gln
165 170 175
His Ala Thr Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
180 185 190
Lys Arg Val Leu Gln Ala Ile Gln Tyr Val Gln Ser Asn Pro Asp Glu
195 200 205
Val Cys Pro Ala Gly Trp Lys Pro Gly Asp Lys Thr Met Lys Pro Asp
210 215 220
Pro Lys Gly Ser Lys Glu Tyr Phe Ala Ala Val
225 230 235
<210>27
<211>612
<212>DNA
<213>念珠藻属物种(Nostoc sp.)
<400>27
atgtccatca cctacggaac acaagaaagc ctccgcgttg gtcaacaggc tcccgacttt 60
acagcaacag ctgtagttga tcaggaattc aagacaatta agctttccga ctatcgtggt 120
aagtacgttg tcttgttctt ctatccccta gactttacct ttgtttgccc cacggagatc 180
acagcattta gcgatcgcta cgaagaattc aagaaactta acaccgaaat tctcggtgtg 240
tccgttgata gcgagttctc ccacctagct tggattcaaa ctgatcgtaa gtctggtggt 300
gttggcgacc taaattatcc cttagtttcc gatattaaga aagaggttag cgacgcttac 360
aacgtactag acccagcagc aggtatcgct ttacgtggtc tgttcatcat cgataaagat 420
ggtatcattc agcacgctac cattaacaac ctagcttttg gtcgtagcgt tgatgaaacc 480
ctacggacat tgcaagcaat ccagtatgtc cagtctcacc cagatgaagt ttgccctgct 540
ggttggcaac ctggggaaaa gaccatgact cccgaccctg tgaagtccaa agtttacttc 600
gctgctgtgt aa 612
<210>28
<211>203
<212>PRT
<213>念珠藻属物种
<400>28
Met Ser Ile Thr Tyr Gly Thr Gln Glu Ser Leu Arg Val Gly Gln Gln
1 5 10 15
Ala Pro Asp Phe Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Thr
20 25 30
Ile Lys Leu Ser Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr
35 40 45
Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser
50 55 60
Asp Arg Tyr Glu Glu Phe Lys Lys Leu Asn Thr Glu Ile Leu Gly Val
65 70 75 80
Ser Val Asp Ser Glu Phe Ser His Leu Ala Trp Ile Gln Thr Asp Arg
85 90 95
Lys Ser Gly Gly Val Gly Asp Leu Asn Tyr Pro Leu Val Ser Asp Ile
100 105 110
Lys Lys Glu Val Ser Asp Ala Tyr Asn Val Leu Asp Pro Ala Ala Gly
115 120 125
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Asp Gly Ile Ile Gln
130 135 140
His Ala Thr Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
145 150 155 160
Leu Arg Thr Leu Gln Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu
165 170 175
Val Cys Pro Ala Gly Trp Gln Pro Gly Glu Lys Thr Met Thr Pro Asp
180 185 190
Pro Val Lys Ser Lys Val Tyr Phe Ala Ala Val
195 200
<210>29
<211>609
<212>DNA
<213>聚球藻属物种(Synechococcus sp.)
<400>29
ctacttggca atcgccgcga agaactcctt ggatttcact gggtcggggt gcatggtttt 60
ctggccgggc tgccagttgg ccgggcaaac ttcatcgggg tgagattgca cgtattggat120
agcttgcagg gtgcgcaagg tttcatccac actgcggcca aaggccaggt tgttaatggt180
ggcgtgctgg atgatccctt ctttgtcgat gatgaacagg ccgcgcagcg ccacaccggc240
ctccggatcc agaacattgt aggcagcgct gatctccttt ttcaggtcag agaccagagg300
ataccttagc tcgcccaccc ctccggcttt gcggtcggtc tggatccagg ccaagtgaga360
gtattcgctg tccaccgaga cgcccaggat ctcggtatcc agcttggcaa agtcgtcata420
gcggtcgcta aaggccgtga tctccgttgg gcagacaaag gtgaagtcca aggggtagaa480
gaacagcacc acatacttct taccccggta gtcggagagc ttcaccgtct tgaattccat540
gtcatagacg gcggtggccg aaaaatcggg agcgggctgc cccactcgca ggcatccttc600
ctgagacat609
<210>30
<211>202
<212>PRT
<213>聚球藻属物种
<400>30
Met Ser Gln Glu Gly Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe
1 5 10 15
Ser Ala Thr Ala Val Tyr Asp Met Glu Phe Lys Thr Val Lys Leu Ser
20 25 30
Asp Tyr Arg Gly Lys Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr
50 55 60
Asp Asp Phe Ala Lys Leu Asp Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Ile Gln Thr Asp Arg Lys Ala Gly
85 90 95
Gly Val Gly Glu Leu Arg Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ala Ala Tyr Asn Val Leu Asp Pro Glu Ala Gly Val Ala Leu
115 120 125
Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr
130 135 140
Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Thr
145 150 155 160
Leu Gln Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu Val Cys Pro
165 170 175
Ala Asn Trp Gln Pro Gly Gln Lys Thr Met His Pro Asp Pro Val Lys
180 185 190
Ser Lys Glu Phe Phe Ala Ala Ile Ala Lys
195 200
<210>31
<211>612
<212>DNA
<213>泡沫节球藻(Nodularia spumigena)
<400>31
atgtccctca cttacgcaac agaaggatgc ctccgcgttg gtcaacaggc tcctgaattt 60
acagccacag ctgtggtaga tcaagaattt aagaccatta aactttccga ctatcgcggt 120
aagtatgtgg ttctgttttt ctacccctta gactttacct ttgtttgccc cactgagate 180
acagcattta gcgatcgcta cgaagaattt aagaaagtta acacagaagt tctcggtgtt 240
tccgttgata gcgaattctc tcacctagcc tggattcaaa ctgaacgcaa gtctggtggt 300
gtcggcgacc tcaattatcc cttagtttcg gacatcaaaa aagagattag cgccacctac 360
aatgtccttg acccagccgc aggtattgct ttacgcggtt tgttcattat tgataaagat 420
ggtatcatcc agcattctac agtgaataac ctcgcctttg gtcgcagcgt tgatgaaacc 480
ctgcggacat tgcaagccct tcagtatgtt cagtctcacc ccgatgaagt ttgcccagcc 540
ggttggcaac ctggtgatca aacaatggtt cctgaccctg tgaagtcgaa agtctacttc 600
tcggctgtct ag 612
<210>32
<211>203
<212>PRT
<213>泡沫节球藻
<400>32
Met Ser Leu Thr Tyr Ala Thr Glu Gly Cys Leu Arg Val Gly Gln Gln
1 5 10 15
Ala Pro Glu Phe Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Thr
20 25 30
Ile Lys Leu Ser Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr
35 40 45
Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser
50 55 60
Asp Arg Tyr Glu Glu Phe Lys Lys Val Asn Thr Glu Val Leu Gly Val
65 70 75 80
Ser Val Asp Ser Glu Phe Ser His Leu Ala Trp Ile Gln Thr Glu Arg
85 90 95
Lys Ser Gly Gly Val Gly Asp Leu Asn Tyr Pro Leu Val Ser Asp Ile
100 105 110
Lys Lys Glu Ile Ser Ala Thr Tyr Asn Val Leu Asp Pro Ala Ala Gly
115 120 125
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Asp Gly Ile Ile Gln
130 135 140
His Ser Thr Val Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
145 150 155 160
Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Ser His Pro Asp Glu
165 170 175
Val Cys Pro Ala Gly Trp Gln Pro Gly Asp Gln Thr Met Val Pro Asp
180 185 190
Pro Val Lys Ser Lys Val Tyr Phe Ser Ala Val
195 200
<210>33
<211>594
<212>DNA
<213>Thermosynechococcus elongatus
<400>33
ttagcccacg gcttcaaaat agactttgga tttgacaggg tcagggttca tcgtcttgtc 60
accggggtgc cagcccgcgg ggcagacttc atcggggtga gtttgaacgt attgaatcgc120
ttggagtacc cgcagggtct catcaacact gcggccaaag gccaagttat tgattgttgc180
gtgttggata atcccttctt tatcaatgat gaacagaccc cgcagggcca cgccttcttc240
ggtcaggaca ttgtaggcag tgctgatgtc ttttttcagg tcagacacca agggatattt300
aagatcgccg acaccaccag ctttgcgatc agtttgtgtc caagccaagt gggagaactg360
gctatccaca gacacgccca ggatttcggt gttcaatttg gcaaattcat cgtagcgatc420
gctaaaggca acaatttccg tggggcagac aaaggtaaag tccaagggat agaaaaagag480
aacaacgtac ttaccgcgat agtccgagag cttgatggtt ttgaactctt ggtcataaac540
agcaaccgct tcaaaatcgg gggcgggttg accgacgcgc agacactcag acat 594
<210>34
<211>197
<212>PRT
<213>Thermosynechococcus elongatus
<400>34
Met Ser Glu Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe Glu Ala
1 5 10 15
Val Ala Val Tyr Asp Gln Glu Phe Lys Thr Ile Lys Leu Ser Asp Tyr
20 25 30
Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe
35 40 45
Val Cys Pro Thr Glu Ile Val Ala Phe Ser Asp Arg Tyr Asp Glu Phe
50 55 60
Ala Lys Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Gln Phe
65 70 75 80
Ser His Leu Ala Trp Thr Gln Thr Asp Arg Lys Ala Gly Gly Val Gly
85 90 95
Asp Leu Lys Tyr Pro Leu Val Ser Asp Leu Lys Lys Asp Ile Ser Thr
100 105 110
Ala Tyr Asn Val Leu Thr Glu Glu Gly Val Ala Leu Arg Gly Leu Phe
115 120 125
Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr Ile Asn Asn Leu
130 135 140
Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Val Leu Gln Ala Ile
145 150 155 160
Gln Tyr Val Gln Thr His Pro Asp Glu Val Cys Pro Ala Gly Trp His
165 170 175
Pro Gly Asp Lys Thr Met Asn Pro Asp Pro Val Lys Ser Lys Val Tyr
180 185 190
Phe Glu Ala Val Gly
195
<210>35
<211>693
<212>DNA
<213>Ostreococcus tauri
<400>35
atgttgtccg cgagtttgtc caagagcgcg ttcacgccca gggcgtcggc gctccagaag 60
agcgttaagg ggaagaactt ctcccgatcc gccgtccgcg tggaagcgcg caagccgctc120
gtgggctacc cggcgccgga gtttagcgcc gaggcggtgt tcgatcaaga gttccaagac180
atcaagctct cggattaccg cggcaagtac gtcgtgctct tcttctaccc gctcgatttt240
acctttgtgt gcccgacgga aatcaccgcc ttctccgatc gctacgaaga gttcgcgaag300
ctcaacaccg aagtcctcgg cgtgagcgtt gactccaagt tctctcactt ggcgtggttg360
caaaccgacc gcaacgacgg cggcctcggc gacttggcct acccgctcgt cagtgacctc420
aagcgcgaaa tctgcgaatc gtacgatgtg ttgtacgaag acggcaccgc gctccgtggg480
ttgtacatca tcgatcgtga gggcgtcatc cagcactaca catgcaacaa cgctccgttc540
ggccgcaacg tcgacgagtg cctgcgcgtg cttcaagcga tccaatacgt tcaaaacaac600
ccagacgagg tgtgcccggc gggctggacc ccgggtgcgg cgacgatgaa gccggatccg660
aagggctcga aggaatactt caaggcgatc taa 693
<210>36
<211>230
<212>PRT
<213>Ostreococcus tauri
<400>36
Met Leu Ser Ala Ser Leu Ser Lys Ser Ala Phe Thr Pro Arg Ala Ser
1 5 10 15
Ala Leu Gln Lys Ser Val Lys Gly Lys Asn Phe Ser Arg Ser Ala Val
20 25 30
Arg Val Glu Ala Arg Lys Pro Leu Val Gly Tyr Pro Ala Pro Glu Phe
35 40 45
Ser Ala Glu Ala Val Phe Asp Gln Glu Phe Gln Asp Ile Lys Leu Ser
50 55 60
Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe
65 70 75 80
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Glu
85 90 95
Glu Phe Ala Lys Leu Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser
100 105 110
Lys Phe Ser His Leu Ala Trp Leu Gln Thr Asp Arg Asn Asp Gly Gly
115 120 125
Leu Gly Asp Leu Ala Tyr Pro Leu Val Ser Asp Leu Lys Arg Glu Ile
130 135 140
Cys Glu Ser Tyr Asp Val Leu Tyr Glu Asp Gly Thr Ala Leu Arg Gly
145 150 155 160
Leu Tyr Ile Ile Asp Arg Glu Gly Val Ile Gln His Tyr Thr Cys Asn
165 170 175
Asn Ala Pro Phe Gly Arg Asn Val Asp Glu Cys Leu Arg Val Leu Gln
180 185 190
Ala Ile Gln Tyr Val Gln Asn Asn Pro Asp Glu Val Cys Pro Ala Gly
195 200 205
Trp Thr Pro Gly Ala Ala Thr Met Lys Pro Asp Pro Lys Gly Ser Lys
210 215 220
Glu Tyr Phe Lys Ala Ile
225 230
<210>37
<211>609
<212>DNA
<213>聚球藻属物种
<400>37
ctacttggca accgccgcga agaactcctt ggatttcacc gggtcggggt tcagggttct 60
ctggccgggc tgccagttgg ccgggcaaac ttcatcgggg tgagcttgca cgtactggat 120
ggcctgcagg gtgcgcaggg tttcatccac gctgcggcca aaggccaggt tgttgatggt 180
ggcgtgctgg atgatccctt ccttgtcgat gatgaacagg ccgcgcaaag ccacccctgc 240
cgccggatcc aggacattgt aggcggcgct gatctccttt ttcaggtcgg agaccagcgg 300
atacctcagc tcgcccaccc ctccggcttt gcggtcggtc tgaatccagg ccaggtgaga 360
gtactcgcta tccaccgaga cgccgaggat ctccgtgtcc agcttggcaa actcgtcgta 420
gcgatcgctg aaagccgtga tctccgtcgg gcagacgaag gtgaagtcca aggggtagaa 480
gaacagcacc acgtacttct tgccccggta gtcggagagc ctcaccgtct taaattccat 540
gtcgtaaacg gcagtggccg aaaaatcggg agcgggctgc cccacccgca gacatccttc 600
ctgagacat 609
<210>38
<211>202
<212>PRT
<213>聚球藻属物种
<400>38
Met Ser Gln Glu Gly Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe
1 5 10 15
Ser Ala Thr Ala Val Tyr Asp Met Glu Phe Lys Thr Val Arg Leu Ser
20 25 30
Asp Tyr Arg Gly Lys Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr
50 55 60
Asp Glu Phe Ala Lys Leu Asp Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Ile Gln Thr Asp Arg Lys Ala Gly
85 90 95
Gly Val Gly Glu Leu Arg Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ala Ala Tyr Asn Val Leu Asp Pro Ala Ala Gly Val Ala Leu
115 120 125
Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr
130 135 140
Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Thr
145 150 155 160
Leu Gln Ala Ile Gln Tyr Val Gln Ala His Pro Asp Glu Val Cys Pro
165 170 175
Ala Asn Trp Gln Pro Gly Gln Arg Thr Leu Asn Pro Asp Pro Val Lys
180 185 190
Ser Lys Glu Phe Phe Ala Ala Val Ala Lys
195 200
<210>39
<211>603
<212>DNA
<213>聚球藻属物种
<400>39
tcaaccgatg gcggagaaat actccttgga acctttcgga tcgggcttca tggtcttttc 60
gccgggcgtc cagttggcgg ggcagacttc atcggggttg gactgcacgt actggaaggc 120
ctgaagcaca cgcagggttt cgtccacatt ccggccaaca ggcaggttgt tgatcgtgga 180
gtgcatgatc acgccatcgg gatcgatgat gaacagtcca cgcaaagcaa cgccttcggc 240
gtcgtccagc acgttgtatg cggtggcgat ttccttcttg aggtcagcga ccaggggata 300
gttgatgtcg cccagaccgc cctgattgcg gggagtctga atccaggcca gatggctgaa 360
ctggctgtca acggaaacgc cgaggacttc ggtgttcttg ctggagaaat cggcgtagcg 420
gtcgctgaag gccgtgattt ctgtggggca gacgaaggtg aaatccaggg gatagaagaa 480
gagcaccacg tacttgccgc ggtactggga cagggagatt tccttgaatt cctggtccac 540
cactgcagtg gcagtgaaat cgggggcctg ctggcccaca cgaaggcaac cggtctcggt 600
cat603
<210>40
<211>200
<212>PRT
<213>聚球藻属物种
<400>40
Met Thr Glu Thr Gly Cys Leu Arg Val Gly Gln Gln Ala Pro Asp Phe
1 5 10 15
Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Glu Ile Ser Leu Ser
20 25 30
Gln Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe
35 40 45
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala
50 55 60
Asp Phe Ser Ser Lys Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser
65 70 75 80
Gln Phe Ser His Leu Ala Trp Ile Gln Thr Pro Arg Asn Gln Gly Gly
85 90 95
Leu Gly Asp Ile Asn Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile
100 105 110
Ala Thr Ala Tyr Asn Val Leu Asp Asp Ala Glu Gly Val Ala Leu Arg
115 120 125
Gly Leu Phe Ile Ile Asp Pro Asp Gly Val Ile Met His Ser Thr Ile
130 135 140
Asn Asn Leu Pro Val Gly Arg Asn Val Asp Glu Thr Leu Arg Val Leu
145 150 155 160
Gln Ala Phe Gln Tyr Val Gln Ser Asn Pro Asp Glu Val Cys Pro Ala
165 170 175
Asn Trp Thr Pro Gly Glu Lys Thr Met Lys Pro Asp Pro Lys Gly Ser
180 185 190
Lys Glu Tyr Phe Ser Ala Ile Gly
195 200
<210>41
<211>597
<212>DNA
<213>细长聚球藻(Synechococcus elongatus)
<400>41
ctagactgca gcgaagaact ctttcgactt aacagggtcg gggttcatcg tcgctgcacc 60
cggttgccaa ttggcggggc aaacttcatc ggggtgactt tggacgtact gaatggcttg 120
cagcacccgc agggtttcat caacgctgcg gccaaacgcc aggttgttga tggtggcgtg 180
ctggatcaca ccttctttgt cgatgatgaa cagaccgcgc agggcaatgc cttcagccgg 240
atcaagcacg ttgtaggcag tgctgatttc tttcttgagg tcagcaacca gcgggtaagc 300
caagtcaccc aaaccacctt ctttacggct ggtttgaatc caagccaagt ggctgaattg 360
gctatcgacc gagacaccca agatttcggt gttcagggct gaaaagtctg catagcgatc 420
gctaaaagca gtaatttcgg tcgggcaaac aaaggtgaag tcgaggggat agaagaacag 480
aacgacgtat ttgccccggt aattggatag cttgatcgtc tggaattcct gatcaacgac 540
tgcagtcgct tcaaaatcgg gggccaattg gccgacgcgc agggctcctt cggtcat 597
<210>42
<211>198
<212>PRT
<213>细长聚球藻
<400>42
Met Thr Glu Gly Ala Leu Arg Val Gly Gln Leu Ala Pro Asp Phe Glu
1 5 10 15
Ala Thr Ala Val Val Asp Gln Glu Phe Gln Thr Ile Lys Leu Ser Asn
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala Asp
50 55 60
Phe Ser Ala Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Ser His Leu Ala Trp Ile Gln Thr Ser Arg Lys Glu Gly Gly Leu
85 90 95
Gly Asp Leu Ala Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile Ser
100 105 110
Thr Ala Tyr Asn Val Leu Asp Pro Ala Glu Gly Ile Ala Leu Arg Gly
115 120 125
Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ala Thr Ile Asn
130 135 140
Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Val Leu Gln
145 150 155 160
Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu Val Cys Pro Ala Asn
165 170 175
Trp Gln Pro Gly Ala Ala Thr Met Asn Pro Asp Pro Val Lys Ser Lys
180 185 190
Glu Phe Phe Ala Ala Val
195
<210>43
<211>597
<212>DNA
<213>Prochlorococcus marinus
<400>43
ttatagactt gagaaatact ccttgctccc ttctggatct ggcttcattg tcttttcccc 60
tggagtccaa ttggcaggac atacctcgtc tgggttggct tgaacatatt gaaatgcttg120
aagaactctc aaggtctcat caacatttct tcctacaggt aggttgttaa tagtagcgtg180
catgatcaca ccatctggat cgatgatata aagacctctt aaagcaacac cctctgcatc240
gtcgagaacg ttataagcca atgaaatctc tttctttaaa tcggcaacca agggataatt300
gatatcgcca atgcctccat catttctttg agtttgaatc caggcaaggt ggctaaattg360
actgtctaca gataccccta agacctcagt gttcttactt gaaaattcgg agtatctatc420
gctaaaagcg gtaatttcag ttggacatac aaaagtaaaa tctagagggt aaaagaaaag480
cacaacatat ttacctctgt aatttgaaag tgatatttcc ttgaattcct ggtctatcac540
tgcagtagca gtaaaatcag gagctttctg gccaacacgg atacattcgt tcgtcat597
<210>44
<211>198
<212>PRT
<213>Prochlorococcus marinus
<400>44
Met Thr Asn Glu Cys Ile Arg Val Gly Gln Lys Ala Pro Asp Phe Thr
1 5 10 15
Ala Thr Ala Val Ile Asp Gln Glu Phe Lys Glu Ile Ser Leu Ser Asn
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ser Glu
50 55 60
Phe Ser Ser Lys Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Ser His Leu Ala Trp Ile Gln Thr Gln Arg Asn Asp Gly Gly Ile
85 90 95
Gly Asp Ile Asn Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile Ser
100 105 110
Leu Ala Tyr Asn Val Leu Asp Asp Ala Glu Gly Val Ala Leu Arg Gly
115 120 125
Leu Tyr Ile Ile Asp Pro Asp Gly Val Ile Met His Ala Thr Ile Asn
130 135 140
Asn Leu Pro Val Gly Arg Asn Val Asp Glu Thr Leu Arg Val Leu Gln
145 150 155 160
Ala Phe Gln Tyr Val Gln Ala Asn Pro Asp Glu Val Cys Pro Ala Asn
165 170 175
Trp Thr Pro Gly Glu Lys Thr Met Lys Pro Asp Pro Glu Gly Ser Lys
180 185 190
Glu Tyr Phe Ser Ser Leu
195
<210>45
<211>600
<212>DNA
<213>Porphyra purpurea
<400>45
ttatgcagcc gcaaaataat ttttagattt tataggatcc ggattcattg ttctatcacc60
aggtttccaa tttgctggac atacttcatc tggatgggct tgaacatatt gaattgcttg120
cagaactctt aaagtttctt caacgcttct tccaaactcc agattgttaa cggtagaata180
ttgaattata cctttaggat ctataataaa taatcccctt agggctacac ccccactatt240
taatacatta taggcaatgc taatttcttt ttttagatct gatactaaag gatactcaag300
atctcctaat ccaccagatt ctcgatctgt ttgcaaccaa gctaagtgag aatattcgct360
atccacagaa acgcctaaga tttctgtgtt aagttcagaa aaatcagaat acttatcact420
gaacgcggtt atttctgtag ggcaaacaaa agtaaaatct aaagggtaaa aaaataagat480
gacatactta tttttaaagt cagataattt tattgtttta aattcttggt cataaacage540
tgtagctgaa aagtcaggcg cgatctggcc tacttgaaga caattgtgtc ctgaaatcat600
<210>46
<211>199
<212>PRT
<213>Porphyra purpurea
<400>46
Met Ile Ser Gly His Asn Cys Leu Gln Val Gly Gln Ile Ala Pro Asp
1 5 10 15
Phe Ser Ala Thr Ala Val Tyr Asp Gln Glu Phe Lys Thr Ile Lys Leu
20 25 30
Ser Asp Phe Lys Asn Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Lys Tyr
50 55 60
Ser Asp Phe Ser Glu Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Leu Gln Thr Asp Arg Glu Ser Gly
85 90 95
Gly Leu Gly Asp Leu Glu Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ile Ala Tyr Asn Val Leu Asn Ser Gly Gly Val Ala Leu Arg
115 120 125
Gly Leu Phe Ile Ile Asp Pro Lys Gly Ile Ile Gln Tyr Ser Thr Val
130 135 140
Asn Asn Leu Glu Phe Gly Arg Ser Val Glu Glu Thr Leu Arg Val Leu
145 150 155 160
Gln Ala Ile Gln Tyr Val Gln Ala His Pro Asp Glu Val Cys Pro Ala
165 170 175
Asn Trp Lys Pro Gly Asp Arg Thr Met Asn Pro Asp Pro Ile Lys Ser
180 185 190
Lys Asn Tyr Phe Ala Ala Ala
195
<210>47
<211>681
<212>DNA
<213>细基江蓠(Gracilaria tenuistipitara)
<400>47
atgttattat gttgttttat tactgttatt ttatataata tagacaatac taaattttat 60
aacaggaagt gtagtattaa aatgataaca aataataata ttttgagagt tggtcaacaa 120
gcccccaatt tttctgctat tgctgtatat gatcaagagt ttaagaaaat aacactgtct 180
gattacttgg gtaagtatgt aatattactg ttttatcctt tagatttcac atttgtttgt 240
ccaactgaga tcactgcttt cagtgattca tataaagaga ttcaaagtct gaatacagaa 300
gttttgggta tatctgttga cagtgaatat tcacatttag catggttgca aatggaaaga 360
gatattggag gcttaggaga tcttaattac ccgttagttt ctgatttaac aaaacagatt 420
agtgcttcat ataatgttct aacagaagaa ggtaaagcat taagaggttt atttattgtt 480
gatcagcaag gaattataca atattcttta gttaataatt tagactttgg ccgtagtatt 540
agtgaaacta taagaacact taaagctatc caatatgtac aatctcaccc agatgaagtt 600
tgtccagcaa attggcagcc aggaaaagct actataatta atagtcctca aaaatcgaaa 660
aattattttc aatctatata g681
<210>48
<211>226
<212>PRT
<213>细基江蓠
<400>48
Met Leu Leu Cys Cys Phe Ile Thr Val Ile Leu Tyr Asn Ile Asp Asn
1 5 10 15
Thr Lys Phe Tyr Asn Arg Lys Cys Ser Ile Lys Met Ile Thr Asn Asn
20 25 30
Asn Ile Leu Arg Val Gly Gln Gln Ala Pro Asn Phe Ser Ala Ile Ala
35 40 45
Val Tyr Asp Gln Glu Phe Lys Lys Ile Thr Leu Ser Asp Tyr Leu Gly
50 55 60
Lys Tyr Val Ile Leu Leu Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys
65 70 75 80
Pro Thr Glu Ile Thr Ala Phe Ser Asp Ser Tyr Lys Glu Ile Gln Ser
85 90 95
Leu Asn Thr Glu Val Leu Gly Ile Ser Val Asp Ser Glu Tyr Ser His
100 105 110
Leu Ala Trp Leu Gln Met Glu Arg Asp Ile Gly Gly Leu Gly Asp Leu
115 120 125
Asn Tyr Pro Leu Val Ser Asp Leu Thr Lys Gln Ile Ser Ala Ser Tyr
130 135 140
Asn Val Leu Thr Glu Glu Gly Lys Ala Leu Arg Gly Leu Phe Ile Val
145 150 155 160
Asp Gln Gln Gly Ile Ile Gln Tyr Ser Leu Val Asn Asn Leu Asp Phe
165 170 175
Gly Arg Ser Ile Ser Glu Thr Ile Arg Thr Leu Lys Ala Ile Gln Tyr
180 185 190
Val Gln Ser His Pro Asp Glu Val Cys Pro Ala Asn Trp Gln Pro Gly
195 200 205
Lys Ala Thr Ile Ile Asn Ser Pro Gln Lys Ser Lys Asn Tyr Phe Gln
210 215 220
Ser Ile
225
<210>49
<211>924
<212>DNA
<213>小鼠(Mus musculus)
<400>49
gcctagggct ctctcggttt cgagatctct ttcctgtctc taaccgtgtc tggaagtcca 60
tgtgtccggc tcttgttcac gcagtaatgg cctccggcaa cgcgcaaatc ggaaagtcgg120
ctcctgactt cacggccaca gcggtggtgg atggtgcctt caaggaaatc aagctttcgg180
actacagagg gaagtacgtg gtcctctttt tctacccact ggacttcact tttgtttgcc240
ccacggagat catcgctttt agcgaccatg ctgaggactt ccgaaagcta ggctgcgagg300
tgctgggagt gtctgtggac tctcagttca cccacctggc gtggatcaat accccacgga360
aagagggagg cttgggcccc ctgaatatcc ctctgcttgc tgacgtgact aaaagcttgt420
cccagaatta cggcgtgttg aaaaatgatg agggcattgc ttacaggggt ctctttatca480
tcgatgccaa gggtgtcctt cgccagatca cagtcaatga cctacctgtg ggccgctctg540
tagacgaggc tctccgccta gtccaggcct ttcagtatac agacgagcat ggggaagtct600
gccctgctgg ctggaagccc ggcagtgaca ccatcaagcc caatgtggat gacagcaagg660
aatacttctc caaacacaac tgagatgggt aaacatcggt gagcctgaag cttggatttc720
acctgtgccc caacctggat gtcctgtgct ggcccagaaa atgctagatt ttcctccact780
ctctgaaggg gctggagtct aggctgaggc tttctcatta cccacctgga atctggtgaa840
tagtgatcct gccctgagca cacctagctg ggcccaggtc tataggaaac caataaagta900
ttagggacag tgtaaaaaaa aaaa 924
<210>50
<211>198
<212>PRT
<213>小鼠
<400>50
Met Ala Ser Gly Asn Ala Gln Ile Gly Lys Ser Ala Pro Asp Phe Thr
1 5 10 15
Ala Thr Ala Val Val Asp Gly Ala Phe Lys Glu Ile Lys Leu Ser Asp
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Ile Ala Phe Ser Asp His Ala Glu Asp
50 55 60
Phe Arg Lys Leu Gly Cys Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Thr His Leu Ala Trp Ile Asn Thr Pro Arg Lys Glu Gly Gly Leu
85 90 95
Gly Pro Leu Asn Ile Pro Leu Leu Ala Asp Val Thr Lys Ser Leu Ser
100 105 110
Gln Asn Tyr Gly Val Leu Lys Asn Asp Glu Gly Ile Ala Tyr Arg Gly
115 120 125
Leu Phe Ile Ile Asp Ala Lys Gly Val Leu Arg Gln Ile Thr Val Asn
130 135 140
Asp Leu Pro Val Gly Arg Ser Val Asp Glu Ala Leu Arg Leu Val Gln
145 150 155 160
Ala Phe Gln Tyr Thr Asp Glu His Gly Glu Val Cys Pro Ala Gly Trp
165 170 175
Lys Pro Gly Ser Asp Thr Ile Lys Pro Asn Val Asp Asp Ser Lys Glu
180 185 190
Tyr Phe Ser Lys His Asn
195
<210>51
<211>877
<212>DNA
<213>褐家鼠(Rattus norvegicus)
<400>51
gaattcggca cgagggtcgt ccgcgtgtcc ggctcttgcc cacgcagtca tggcctccgg 60
caacgcgcac atcggaaagc ctgcccctga cttcacgggc accgccgtgg tggatggtgc 120
ctttaaggaa atcaagcttt cagactacag agggaagtac gtggtcctct ttttctatcc 180
actggacttc acttttgttt gccccacgga gatcatcgct tttagcgacc acgctgagga 240
cttccgaaag ctaggctgcg aggtgctggg agtgtctgtg gactctcagt tcacccacct 300
ggcctggatc aataccccac ggaaggaggg aggcttgggc ccactgaata tccctctgct 360
tgctgatgtg actaaaagct tgtcccagaa ttacggcgtg ttgaaaaatg atgagggcat 420
cgcttacagg ggcctcttta tcatcgatgc caagggtgtc cttcgccaga tcacagtcaa 480
cgacctacct gtgggacgct ctgtagatga ggctctccgc ctcgtccagg cctttcagta 540
tacagatgag catggggaag tctgtcctgc tggctggaag cccggcagtg acaccatcaa 600
acccaatgtg gatgacagca aggaatactt ctccaaacac aactgagatg ggtaaacatc 660
ggtgagcctg aatcccggat ctcacctgcg cccttacctg gatgtcctgt gctggcccag 720
aaaacgctag atcttcctct acattctaaa ggggctggag gctaggccga ggctttctca 780
ttacccacct ggaatctggt gaatagtgac cctgccctga gcacacccag ctgggcccag 840
gtctatagga aaccaataaa gtattaggga cagtgta 877
<210>52
<211>198
<212>PRT
<213>褐家鼠
<400>52
Met Ala Ser Gly Asn Ala His Ile Gly Lys Pro Ala Pro Asp Phe Thr
1 5 10 15
Gly Thr Ala Val Val Asp Gly Ala Phe Lys Glu Ile Lys Leu Ser Asp
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Ile Ala Phe Ser Asp His Ala Glu Asp
50 55 60
Phe Arg Lys Leu Gly Cys Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Thr His Leu Ala Trp Ile Asn Thr Pro Arg Lys Glu Gly Gly Leu
85 90 95
Gly Pro Leu Asn Ile Pro Leu Leu Ala Asp Val Thr Lys Ser Leu Ser
100 105 110
Gln Asn Tyr Gly Val Leu Lys Asn Asp Glu Gly Ile Ala Tyr Arg Gly
115 120 125
Leu Phe Ile Ile Asp Ala Lys Gly Val Leu Arg Gln Ile Thr Val Asn
130 135 140
Asp Leu Pro Val Gly Arg Ser Val Asp Glu Ala Leu Arg Leu Val Gln
145 150 155 160
Ala Phe Gln Tyr Thr Asp Glu His Gly Glu Val Cys Pro Ala Gly Trp
165 170 175
Lys Pro Gly Ser Asp Thr Ile Lys Pro Asn Val Asp Asp Ser Lys Glu
180 185 190
Tyr Phe Ser Lys His Asn
195
<210>53
<211>1089
<212>DNA
<213>稻
<400>53
gccttcgtct cgacacgttt gcattgcagc agctcataag tttcttcttc gtttctgctc 60
ccagtgctaa ggcagcacag tcgttcgtcg ccatgccagg gctcaccatc ggcgacaccg120
tccccaacct ggagctggac tccacccacg gcaagatccg catccacgac ttcgtcggcg180
acacctatgt catcctcttc tcccaccccg gcgacttcac cccggtctgc accacggagc240
tggcagccat ggccggctac gccaaggagt tcgacaagag gggcgtcaag ctgctcggca300
tctcctgcga cgacgtgcag tctcacaagg actggatcaa ggacatcgag gcctacaagc360
ctgggaaccg cgtgacgtac ccgatcatgg ccgatccgag ccgcgaggcc atcaagcagc420
tgaacatggt cgacccggac gagaaggatt ccaacggcgg ccacctcccg tcccgcgcgc480
tgcacatcgt cggccccgac aagaaggtga agctgagctt cctgtacccg gcgtgcgtgg540
ggcggaacat ggatgaggtg gtgcgtgcgg tcgacgcgct gcagacggcg gcgaagcacg600
cggtggcgac gccggtgaac tggaagcccg gcgagcgcgt cgtcatccct cccggcgtct660
ccgacgacga ggcgaaggag aagttccccc aggggttcga caccgccgac ctgccgtccg720
gcaagggcta cctccgcttc accaaggtcg gctagatcat atcgatatcg acctcgctct780
tcgtacatca tgtgcgccac gcgtgcgtga tagcgtgtgc tggcgtgatg actatgcgag840
atgcatccct gtgtgtgttg gtgtggataa tgccgctacg tttggaacag tagtgcattt900
actctgtgct actgtctgaa ctttggctgt ttggcagact gtttatgtac ccgtatgttc 960
gcccctgtac taatagagtg ggtgttgtgg ttggcaagta ctctcctcgg acaacatttt1020
aactttgact actaataaca aacaaattaa aaagatcaat cagatgttac tagacatctt1080
aattttatt1089
<210>54
<211>220
<212>PRT
<213>稻
<400>54
Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp
1 5 10 15
Ser Thr His Gly Lys Ile Arg Ile His Asp Phe Val Gly Asp Thr Tyr
20 25 30
Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr
35 40 45
Glu Leu Ala Ala Met Ala Gly Tyr Ala Lys Glu Phe Asp Lys Arg Gly
50 55 60
Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Asp
65 70 75 80
Trp Ile Lys Asp Ile Glu Ala Tyr Lys Pro Gly Asn Arg Val Thr Tyr
85 90 95
Pro Ile Met Ala Asp Pro Ser Arg Glu Ala Ile Lys Gln Leu Asn Met
100 105 110
Val Asp Pro Asp Glu Lys Asp Ser Asn Gly Gly His Leu Pro Ser Arg
115 120 125
Ala Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu
130 135 140
Tyr Pro Ala Cys Val Gly Arg Asn Met Asp Glu Val Val Arg Ala Val
145 150 155 160
Asp Ala Leu Gln Thr Ala Ala Lys His Ala Val Ala Thr Pro Val Asn
165 170 175
Trp Lys Pro Gly Glu Arg Val Val Ile Pro Pro Gly Val Ser Asp Asp
180 185 190
Glu Ala Lys Glu Lys Phe Pro Gln Gly Phe Asp Thr Ala Asp Leu Pro
195 200 205
Ser Gly Lys Gly Tyr Leu Arg Phe Thr Lys Val Gly
210 215 220
<210>55
<211>465
<212>DNA
<213>稻
<400>55
atggcgtgcg ccttctccgt ctcctctgcc gcggcgcctc tcgcctcccc gaagggggac 60
ctgccgttgg tcgggaacaa ggcgccggac ttcgaggcgg aggccatgtt cgaccagggg120
ttcatcaagt ctaaatgcat gtttgtaagc tctgcagaga tcactgcttt cagcgacaga180
tatgaggagt ttgagaagat aaatactgaa gttctcggtg tttcgattga cagtgtgggg240
attgctctga gaggattatt catcattgac aaggagggtg tgattcagca ttctaccatt300
aacaaccttg ctattggccg tagcgtggat gagacgctta ggacccttca ggccctacag360
tatgtccaag aaaacccgga tgaggtttgc ccagctggat ggaaacctgg ggagaagtca420
atgaagcctg accccaagga cagcaaggag gaacaagaat gctga465
<210>56
<211>154
<212>PRT
<213>稻
<400>56
Met Ala Cys Ala Phe Ser Val Ser Ser Ala Ala Ala Pro Leu Ala Ser
1 5 10 15
Pro Lys Gly Asp Leu Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Glu
20 25 30
Ala Glu Ala Met Phe Asp Gln Gly Phe Ile Lys Ser Lys Cys Met Phe
35 40 45
Val Ser Ser Ala Glu Ile Thr Ala Phe Ser Asp Arg Tyr Glu Glu Phe
50 55 60
Glu Lys Ile Asn Thr Glu Val Leu Gly Val Ser Ile Asp Ser Val Gly
65 70 75 80
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln
85 90 95
His Ser Thr Ile Asn Asn Leu Ala Ile Gly Arg Ser Val Asp Glu Thr
100 105 110
Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu Asn Pro Asp Glu
115 120 125
Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp
130 135 140
Pro Lys Asp Ser Lys Glu Glu Gln Glu Cys
145 150
<210>57
<211>1085
<212>DNA
<213>稻
<400>57
cattccatca cagacagttc gcagaatcgc agcagcttag cttaattact tttttcacca 60
actcaacttt cagttaattt ccggttaatc ctcgattcct catcatgcct ggactcaccc120
tcggcgacgt cgtccccgac ctggagctcg acaccaccca cggcaagatc cgcctccacg180
acttcgtcgg cgacgcctac gtcatcatct tctcccaccc cgctgacttc acgccggtct240
gcacgacgga gctgtcggag atggcgggct acgccggcga gttcgacaag aggggcgtca300
agctcctcgg cttctcctgc gacgacgtcg agtcgcacaa ggactggatc aaggacatcg360
aggcctacaa gcctggccgc cgcgtcggct tcccgatcgt cgccgacccg gacagggagg420
cgatcaggca gctcaacatg atcgacgccg acgagaagga caccgccggc ggcgagctcc480
ccaaccgggc gctccacatc gtcgggccgg acaagaaggt gaagctgagc ttcctgttcc540
cggcgtgcac ggggcggaac atggcggagg tgctgcgcgc gacggacgcg ctgctgacgg600
cggcgaggca ccgggtggcg acgccggtga actggaagcc cggcgagcgc gtcgtcatcc660
cccccggcgt ctccgacgag gaggccaagg cgaggttccc ggccgggttc gagaccgccc720
agctgccctc caacaagtgc tacctccgct tcacccaggt ggactgagag actgatggtg780
agggagggag ggagagatct gggccgtcgg tttcgtgtgt aataaaccaa cgcacgacgt840
agatgcttcc acgtgtgtgt ttcccgtgct gcttcgattg atcgatcgat cattcggtaa900
gtactctagt tatgtgtaat ctgctgtttg ggtgtagtgg tgcatttgct gttctgttgc960
ctgaaagtga cgaacggatt atgtttgtca tttgtatgta aaatgtaacc gtatgttttt 1020
tatttatccc ttccgaaatt actgtggaat atagtgaagt aatgctgtta ataaacagcc 1080
cgttt 1085
<210>58
<211>220
<212>PRT
<213>稻
<400>58
Met Pro Gly Leu Thr Leu Gly Asp Val Val Pro Asp Leu Glu Leu Asp
1 5 10 15
Thr Thr His Gly Lys Ile Arg Leu His Asp Phe Val Gly Asp Ala Tyr
20 25 30
Val Ile Ile Phe Ser His Pro Ala Asp Phe Thr Pro Val Cys Thr Thr
35 40 45
Glu Leu Ser Glu Met Ala Gly Tyr Ala Gly Glu Phe Asp Lys Arg Gly
50 55 60
Val Lys Leu Leu Gly Phe Ser Cys Asp Asp Val Glu Ser His Lys Asp
65 70 75 80
Trp Ile Lys Asp Ile Glu Ala Tyr Lys Pro Gly Arg Arg Val Gly Phe
85 90 95
Pro Ile Val Ala Asp Pro Asp Arg Glu Ala Ile Arg Gln Leu Asn Met
100 105 110
Ile Asp Ala Asp Glu Lys Asp Thr Ala Gly Gly Glu Leu Pro Asn Arg
115 120 125
Ala Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu
130 135 140
Phe Pro Ala Cys Thr Gly Arg Asn Met Ala Glu Val Leu Arg Ala Thr
145 150 155 160
Asp Ala Leu Leu Thr Ala Ala Arg His Arg Val Ala Thr Pro Val Asn
165 170 175
Trp Lys Pro Gly Glu Arg Val Val Ile Pro Pro Gly Val Ser Asp Glu
180 185 190
Glu Ala Lys Ala Arg Phe Pro Ala Gly Phe Glu Thr Ala Gln Leu Pro
195 200 205
Ser Asn Lys Cys Tyr Leu Arg Phe Thr Gln Val Asp
210 215 220
<210>59
<211>1248
<212>DNA
<213>稻
<400>59
atcgattccc ccaacatatt agggctcacg cctcccaaag tcaaaacagc ccagcccgaa 60
caagcatttc ctcgaacact tcgccctcca ccaccatggc cgccgccgcc tccaccctcg120
cctccctctc cgccaccgcg gccgcggccg ccggcaagcg cctcctcctc tcctccccct180
cccgctccct ctccctctcc ctcgcctccc gcggccgcat cgccgtcatg ccccacctcc240
gcgctggcat cctctccgcc gcaccgagga gggcggtgtc ggcctcggcc ccggccgcgg300
ccaccatcgc ggtcggggac aagctccccg acgcgacgct ctcctacttc gactcgcccg360
acggggagct gaagacggtg accgtgcgcg acctcaccgc cgggaagaag gtggtcctct420
tcgcggtccc cggcgcgttc accccgacct gcacgcagaa gcacgtcccg gggttcgtcg480
ccaaggccgg ggagctccgc gccaaggggg tcgacgccgt ggcctgcgtc tccgtcaacg540
acgcgttcgt gatgcgggcg tggaaggaga gcctcggcgt cggcgacgag gtgctcctcc600
tctccgacgg caacggcgag ctcgcccgcg ccatgggcgt cgagctcgac ctctccgaca660
agcccgccgg cctcggcgtg cggtcccgcc gctacgcgct cctggcggag gacggcgtcg720
tcaaggtgct caacctcgag gagggcggcg ccttcaccac cagcagcgcc gaggagatgc780
tcaaggcgct ctgaagcgtg aacaactcaa gccatcctcc acttttcatc tcaaatctcc840
atagctcggt tcgttgccta cttctctcaa gtgttcgctt cttttcctga ataataaatc900
atggcaacaa tggtggaccg tgcagagtag tgttgtcgtt ttgatgtgtg aagcttctat960
agcgaacata gtgtgcaatt tttaggtaac atatatgagt cttggccttg cactgtttgt 1020
caggtagtaa caacttggca cagctataga ctgtagtaac agagttcctt tcatgttgaa 1080
tggtgaggct gtgatgtgtt ctagagctga ataaacgtgc tctggtaaat actgtcacca 1140
gatcagacta tggagtagta gtaagatttt gcttggttaa ttgggcaatg gctatttttc 1200
aggatcgttc agttgagata aacatgtttt gctgttcaga tgagttcg1248
<210>60
<211>232
<212>PRT
<213>稻
<400>60
Met Ala Ala Ala Ala Ser Thr Leu Ala Ser Leu Ser Ala Thr Ala Ala
1 5 10 15
Ala Ala Ala Gly Lys Arg Leu Leu Leu Ser Ser Pro Ser Arg Ser Leu
20 25 30
Ser Leu Ser Leu Ala Ser Arg Gly Arg Ile Ala Val Met Pro His Leu
35 40 45
Arg Ala Gly Ile Leu Ser Ala Ala Pro Arg Arg Ala Val Ser Ala Ser
50 55 60
Ala Pro Ala Ala Ala Thr Ile Ala Val Gly Asp Lys Leu Pro Asp Ala
65 70 75 80
Thr Leu Ser Tyr Phe Asp Ser Pro Asp Gly Glu Leu Lys Thr Val Thr
85 90 95
Val Arg Asp Leu Thr Ala Gly Lys Lys Val Val Leu Phe Ala Val Pro
100 105 110
Gly Ala Phe Thr Pro Thr Cys Thr Gln Lys His Val Pro Gly Phe Val
115 120 125
Ala Lys Ala Gly Glu Leu Arg Ala Lys Gly Val Asp Ala Val Ala Cys
130 135 140
Val Ser Val Asn Asp Ala Phe Val Met Arg Ala Trp Lys Glu Ser Leu
145 150 155 160
Gly Val Gly Asp Glu Val Leu Leu Leu Ser Asp Gly Asn Gly Glu Leu
165 170 175
Ala Arg Ala Met Gly Val Glu Leu Asp Leu Ser Asp Lys Pro Ala Gly
180 185 190
Leu Gly Val Arg Ser Arg Arg Tyr Ala Leu Leu Ala Glu Asp Gly Val
195 200 205
Val Lys Val Leu Asn Leu Glu Glu Gly Gly Ala Phe Thr Thr Ser Ser
210 215 220
Ala Glu Glu Met Leu Lys Ala Leu
225 230
<210>61
<211>946
<212>DNA
<213>稻
<400>61
acacccaaac ccgacgaaca gccgcagctg caggccacgc atcctcgccg tgaatctccc 60
accgcgctcc ggcgatggca ttcgcggtct ccaccgcctg caggccgtcc ctgctcctgc120
ccccgcgcca gcgctcgtcg ccgccgcggc cgcggccgct cctctgcacg ccctccaccg180
ccgccttccg ccgcggcgcc ctcagcgcga caacaacgcc aacgccggcg cgcgcagcac240
tgccgtcgac gacggggagg aacaggatcg tctgcggcaa ggtgagcaag ggcagcgcgg300
cgcccaactt cacgctgagg gaccaggacg ggagggcggt gtcgctgtcc aagttcaagg360
ggaggccggt ggtggtgtac ttctaccccg ccgacgagac ccccggatgc accaagcagg420
cctgcgcctt ccgcgactcc tacgagaagt tcaagaaggc cggcgccgag gtcatcggca480
tcagcggcga cgacgccgcc tcccacaagg agttcaagaa gaagtacaag ctgccgttca540
cgctgctgag cgacgagggg aacaaggtga ggaaggagtg gggtgtgccg gctgacctgt600
tcgggacgct gccgggaagg cagacgtacg tgctcgacaa gaacggcgtc gtccagtaca660
tctacaacaa ccagttccag cccgagaagc acattggcga gaccctcaag atcctccaga720
gcctctgatt ctcttcttct tcttcctcct tttttaacta caatctctca tgtatgatcc780
atcacagtat accgagaaat taatccatct gttaatctct tctcgatcgt ttttctccct840
cggcatgtgt atagctagtg tatctgtaac tctgtgagta tatatacagt caaaatcggt900
gggctgctag ctctgaattt tgccgtaagg cactctgatt ttctct 946
<210>62
<211>217
<212>PRT
<213>稻
<400>62
Met Ala Phe Ala Val Ser Thr Ala Cys Arg Pro Ser Leu Leu Leu Pro
1 5 10 15
Pro Arg Gln Arg Ser Ser Pro Pro Arg Pro Arg Pro Leu Leu Cys Thr
20 25 30
Pro Ser Thr Ala Ala Phe Arg Arg Gly Ala Leu Ser Ala Thr Thr Thr
35 40 45
Pro Thr Pro Ala Arg Ala Ala Leu Pro Ser Thr Thr Gly Arg Asn Arg
50 55 60
Ile Val Cys Gly Lys Val Ser Lys Gly Ser Ala Ala Pro Asn Phe Thr
65 70 75 80
Leu Arg Asp Gln Asp Gly Arg Ala Val Ser Leu Ser Lys Phe Lys Gly
85 90 95
Arg Pro Val Val Val Tyr Phe Tyr Pro Ala Asp Glu Thr Pro Gly Cys
100 105 110
Thr Lys Gln Ala Cys Ala Phe Arg Asp Ser Tyr Glu Lys Phe Lys Lys
115 120 125
Ala Gly Ala Glu Val Ile Gly Ile Ser Gly Asp Asp Ala Ala Ser His
130 135 140
Lys Glu Phe Lys Lys Lys Tyr Lys Leu Pro Phe Thr Leu Leu Ser Asp
145 150 155 160
Glu Gly Asn Lys Val Arg Lys Glu Trp Gly Val Pro Ala Asp Leu Phe
165 170 175
Gly Thr Leu Pro Gly Arg Gln Thr Tyr Val Leu Asp Lys Asn Gly Val
180 185 190
Val Gln Tyr Ile Tyr Asn Asn Gln Phe Gln Pro Glu Lys His Ile Gly
195 200 205
Glu Thr Leu Lys Ile Leu Gln Ser Leu
210 215
<210>63
<211>770
<212>DNA
<213>稻
<400>63
atctcccttc cctgtcgatt accttctctc cttcctctgt tcctcctctc ctccacacat 60
ccaggcaggc aacacaagaa tcatccggga gagcgacatg gccccggttg ccgtgggcga120
caccctcccc gacggccagc tggggtggtt cgacggggag gacaagctgc agcaggtctc180
cgtccacggc ctcgccgccg gcaagaaggt cgtcctcttc ggcgtccccg gtgccttcac240
cccgacctgc agcaatcagc atgtgccagg attcataaat caggctgagc agctcaaagc300
caagggtgta gacgacatct tgcttgtcag tgttaacgac ccctttgtca tgaaggcgtg360
ggcaaagtca taccctgaga ataagcatgt gaaattcctt gccgatggtt tgggaacata420
caccaaggca cttggtcttg agcttgacct ttcggagaaa gggcttggta ttcgttcgag480
acggtttgct ctccttgctg acaacctcaa ggttactgtt gcaaacattg aggaaggtgg540
ccaattcaca atctctggtg ctgaggagat cctcaaggca ctgtaagagc ttcagctctt600
aggaacggca gcgatcactt ggacctatcg tgtcaatctt gtttaaattt gtctgcaaaa660
tacttgtgcg aataaaattg tcgatgagct gcctagttgt gaggacttta tgataatgtt720
tgaatctgta tccactgttg aatcaagtag taatgttcag tgctcatgtt 770
<210>64
<211>162
<212>PRT
<213>稻
<400>64
Met Ala Pro Val Ala Val Gly Asp Thr Leu Pro Asp Gly Gln Leu Gly
1 5 10 15
Trp Phe Asp Gly Glu Asp Lys Leu Gln Gln Val Ser Val His Gly Leu
20 25 30
Ala Ala Gly Lys Lys Val Val Leu Phe Gly Val Pro Gly Ala Phe Thr
35 40 45
Pro Thr Cys Ser Asn Gln His Val Pro Gly Phe Ile Asn Gln Ala Glu
50 55 60
Gln Leu Lys Ala Lys Gly Val Asp Asp Ile Leu Leu Val Ser Val Asn
65 70 75 80
Asp Pro Phe Val Met Lys Ala Trp Ala Lys Ser Tyr Pro Glu Asn Lys
85 90 95
His Val Lys Phe Leu Ala Asp Gly Leu Gly Thr Tyr Thr Lys Ala Leu
100 105 110
Gly Leu Glu Leu Asp Leu Ser Glu Lys Gly Leu Gly Ile Arg Ser Arg
115 120 125
Arg Phe Ala Leu Leu Ala Asp Asn Leu Lys Val Thr Val Ala Asn Ile
130 135 140
Glu Glu Gly Gly Gln Phe Thr Ile Ser Gly Ala Glu Glu Ile Leu Lys
145 150 155 160
Ala Leu
<210>65
<211>1249
<212>DNA
<213>稻
<400>65
gagagccaac acggtgcatc tctcagccac acagccccac ccgcgccatg tcactcgcca 60
ccgccgccgc cggagcgcaa ccgttcgtcc gctcctcctc ctccgccgcc gcggcgtcct120
cgtcgcggcc cctgctcgcc gtcgccgccg cccgccaccg ccgcccgcat ggatctctcg180
ccgccgccgc cgccgcggca aggcggcgtc gtcgtcgtcc gctcctccag gtgcgcgcgg240
caaggacgga gtccacgggc gtctccgtcg ggttccgcgc gccccagttc gagctcccgg300
agccactgac ggggaagctc tggacattgg atgacttcga aggcaacccc gcgctgctgg360
ttatgtttgt atgtaatcac tgtccattcg taaagcatct caaaaaagat attgcgaagc420
tcacctcatt ctacatggag aaagggcttg ctgctgttgc catatcctcg aactcaattg480
tgacacaccc acaggatggt cctgattaca tagctgagga agcaaaattg tataaatact540
ctttcccgta tctatatgat gagtctcaag aagttgctaa agcttttcga gccgtctgca600
cgccagagtt ttacttgttc aaaaaggatg gacgaaggcc atttgagctt ttctaccatg660
ggcagtttga cgattcaaga ccgagtaaca acgtgccagt taccggaagg gatttaagtc 720
gtgcgattga ttgtgcactt agtggacaag agctaccttt tgtgccaaaa cccagtgtcg 780
ggtgcagcat caaatggcac ccatgaagag cgtattgcat tgtcatgtgc tggaatatag 840
atgtttttcc cccttaaatt gaaggttgaa catggggatt gaggtgagcc atgctctcta 900
ctactagaag tatggaagca cacacatagt agatttatga tagctaattt cacatagtag 960
atttatgata gctaatttat aatgtaattt ttaagggaaa tagatgcagt tgaggccttg1020
tggagctgat tcttaacgtt gtgggggctg ttcaacttga gagttgcaaa actagacatg1080
aatggcgtgg atagtgttat gttgtgtgct ggtgtctcat cttggccgga aaaagaaaaa1140
ctgatggatg taactggtat ttgtgcaaca atgggataat gcacacaagt acaataaccc1200
attattatgg ctaacacaac acccacgggt gaaaattaaa gatgagggc1249
<210>66
<211>252
<212>PRT
<213>稻
<400>66
Met Ser Leu Ala Thr Ala Ala Ala Gly Ala Gln Pro Phe Val Arg Ser
1 5 10 15
Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser Arg Pro Leu Leu Ala Val
20 25 30
Ala Ala Ala Arg His Arg Arg Pro His Gly Ser Leu Ala Ala Ala Ala
35 40 45
Ala Ala Ala Arg Arg Arg Arg Arg Arg Pro Leu Leu Gln Val Arg Ala
50 55 60
Ala Arg Thr Glu Ser Thr Gly Val Ser Val Gly Phe Arg Ala Pro Gln
65 70 75 80
Phe Glu Leu Pro Glu Pro Leu Thr Gly Lys Leu Trp Thr Leu Asp Asp
85 90 95
Phe Glu Gly Asn Pro Ala Leu Leu Val Met Phe Val Cys Asn His Cys
100 105 110
Pro Phe Val Lys His Leu Lys Lys Asp Ile Ala Lys Leu Thr Ser Phe
115 120 125
Tyr Met Glu Lys Gly Leu Ala Ala Val Ala Ile Ser Ser Asn Ser Ile
130 135 140
Val Thr His Pro Gln Asp Gly Pro Asp Tyr Ile Ala Glu Glu Ala Lys
145 150 155 160
Leu Tyr Lys Tyr Ser Phe Pro Tyr Leu Tyr Asp Glu Ser Gln Glu Val
165 170 175
Ala Lys Ala Phe Arg Ala Val Cys Thr Pro Glu Phe Tyr Leu Phe Lys
180 185 190
Lys Asp Gly Arg Arg Pro Phe Glu Leu Phe Tyr His Gly Gln Phe Asp
195 200 205
Asp Ser Arg Pro Ser Asn Asn Val Pro Val Thr Gly Arg Asp Leu Ser
210 215 220
Arg Ala Ile Asp Cys Ala Leu Ser Gly Gln Glu Leu Pro Phe Val Pro
225 230 235 240
Lys Pro Ser Val Gly Cys Ser Ile Lys Trp His Pro
245 250
<210>67
<211>994
<212>DNA
<213>稻
<400>67
aaatcccaac agagaagcat ttcctcgaac acatcgccgt cgccgccctc catggccgct 60
cccaccgcag cagctctctc caccctctcc accgccagcg tcacctccgg caagcgcttc120
atcacctcct ccttctccct ctccttctcc tcccgccccc tcgcaacagg cgtccgcgcc180
gcgggggcga gagcggcgcg gaggtcggcg gcgtcggcgt ccaccgtggt ggcgaccatc240
gccgtcggag acaagctccc cgacgcgacg ctgtcctact tcgacccggc ggacggcgag300
ctgaagacgg tgacggtggc ggagctgacg gcgggcagga aggcggtgct gttcgcggtg360
cccggcgcgt tcacgccgac gtgctcgcag aagcacctcc cggggttcat cgagaaggcc420
ggggagctcc acgccaaggg ggtggacgcc attgcctgcg tgtcggtgaa cgacgcgttc480
gtgatgcgcg cgtggaagga gagcctgggc ctcggcgacg ccgacgtgct cctcctctcc540
gacggcaacc tggagctcac gcgcgcgctc ggcgtcgaga tggacctctc cgacaagccc600
atggggctcg gcgtcaggtc gcgccgctac gcgctcctcg ccgacgacgg cgtcgtcaag660
gtgctcaacc tcgaggaggg cggcgccttc accaccagca gcgccgagga gatgctcaag720
gcgctctgaa gatggaatcc gagctctcgt aggtggcaac aatggcagga tcagcccgtt780
gctctcgcgc gttggtgagt agcgtcgtcg ttgtgaagag gaaattttgt gtgtgttttt840
tttcggttga atgttgcatg ccatgtgctt gacgaaatga cggaataaca aaagaaaaaa900
aactactttt atttttttgt tgaaatttgc aaaccatgtg tttgacgaaa tgtcgagata960
tgaaagctgt gaaatcgctt acgtcacgtg cacc994
<210>68
<211>225
<212>PRT
<213>稻
<400>68
Met Ala Ala Pro Thr Ala Ala Ala Leu Ser Thr Leu Ser Thr Ala Ser
1 5 10 15
Val Thr Ser Gly Lys Arg Phe Ile Thr Ser Ser Phe Ser Leu Ser Phe
20 25 30
Ser Ser Arg Pro Leu Ala Thr Gly Val Arg Ala Ala Gly Ala Arg Ala
35 40 45
Ala Arg Arg Ser Ala Ala Ser Ala Ser Thr Val Val Ala Thr Ile Ala
50 55 60
Val Gly Asp Lys Leu Pro Asp Ala Thr Leu Ser Tyr Phe Asp Pro Ala
65 70 75 80
Asp Gly Glu Leu Lys Thr Val Thr Val Ala Glu Leu Thr Ala Gly Arg
85 90 95
Lys Ala Val Leu Phe Ala Val Pro Gly Ala Phe Thr Pro Thr Cys Ser
100 105 110
Gln Lys His Leu Pro Gly Phe Ile Glu Lys Ala Gly Glu Leu His Ala
115 120 125
Lys Gly Val Asp Ala Ile Ala Cys Val Ser Val Asn Asp Ala Phe Val
130 135 140
Met Arg Ala Trp Lys Glu Ser Leu Gly Leu Gly Asp Ala Asp Val Leu
145 150 155 160
Leu Leu Ser Asp Gly Asn Leu Glu Leu Thr Arg Ala Leu Gly Val Glu
165 170 175
Met Asp Leu Ser Asp Lys Pro Met Gly Leu Gly Val Arg Ser Arg Arg
180 185 190
Tyr Ala Leu Leu Ala Asp Asp Gly Val Val Lys Val Leu Asn Leu Glu
195 200 205
Glu Gly Gly Ala Phe Thr Thr Ser Ser Ala Glu Glu Met Leu Lys Ala
210 215 220
Leu
225
<210>69
<211>959
<212>DNA
<213>稻
<400>69
tacctatgga gacggtcgcc tcgctctcgc gcgccgcgct cgccggcgcg cccgccgcta 60
cacgcgcgac agcgtcgccc gtgaacaggg ccgtggtccc tgcggcgtcc cggccgcgcg120
ggggacgcct ttgctgccga cgctcgctga cggccgtctc cgcggcggca ggggcttccc180
ctcccgtctc cccgtcgcct agccccgatg gcggctcccc cggcgtgtgg gacgctctcg240
gcggcgtgtc cgtgctcgcc gccggcaccg gcgaagccgt tcagctcagg gacctgtggg300
accccaccga gggggtggcc gtggtggcgc tgctccggca cttcgggtgc ttctgctgct360
gggagctggc ctctgttctg aaggaatcca tggcgaaatt cgacgctgcc ggggccaagc420
tgatcgccat cggcgtcggg actcctgaca aagctcgcat tctcgccgat gggctgccgt480
tccctgttga tagcttgtac gctgaccccg agcgcaaggc ttacgacgta ttggggcttt540
accatggtct gggtcggaca ttaatcagtc ctgcgaagat gtactcgggg cttaattcca600
tcaagaaggt aaccaagaac tacacgctca agggcacacc agcagacctg acgggtatct660
tgcagcaggg tggtatgctt gtgttcagag ggaaagagtt gctgtactca tggaaagaca720
aaggcacggg tgatcatgct cctctggatg atgtcctcaa cgcttgctgc aatcgaactt780
cttgaggtct ctagcagtcg gaagatgtgt atgtaaatat atgaaatgct cagcatgcca840
aacagagagc aattagactc aacagtacta gatgttcgat taattatgca ttgttggttt900
gcttatgtac ttagcatgat attggattag ctacccaatg gacatgacac tacagtctg 959
<210>70
<211>259
<212>PRT
<213>稻
<400>70
Met Glu Thr Val Ala Ser Leu Ser Arg Ala Ala Leu Ala Gly Ala Pro
1 5 10 15
Ala Ala Thr Arg Ala Thr Ala Ser Pro Val Asn Arg Ala Val Val Pro
20 25 30
Ala Ala Ser Arg Pro Arg Gly Gly Arg Leu Cys Cys Arg Arg Ser Leu
35 40 45
Thr Ala Val Ser Ala Ala Ala Gly Ala Ser Pro Pro Val Ser Pro Ser
50 55 60
Pro Ser Pro Asp Gly Gly Ser Pro Gly Val Trp Asp Ala Leu Gly Gly
65 70 75 80
Val Ser Val Leu Ala Ala Gly Thr Gly Glu Ala Val Gln Leu Arg Asp
85 90 95
Leu Trp Asp Pro Thr Glu Gly Val Ala Val Val Ala Leu Leu Arg His
100 105 110
Phe Gly Cys Phe Cys Cys Trp Glu Leu Ala Ser Val Leu Lys Glu Ser
115 120 125
Met Ala Lys Phe Asp Ala Ala Gly Ala Lys Leu Ile Ala Ile Gly Val
130 135 140
Gly Thr Pro Asp Lys Ala Arg Ile Leu Ala Asp Gly Leu Pro Phe Pro
145 150 155 160
Val Asp Ser Leu Tyr Ala Asp Pro Glu Arg Lys Ala Tyr Asp Val Leu
165 170 175
Gly Leu Tyr His Gly Leu Gly Arg Thr Leu Ile Ser Pro Ala Lys Met
180 185 190
Tyr Ser Gly Leu Asn Ser Ile Lys Lys Val Thr Lys Asn Tyr Thr Leu
195 200 205
Lys Gly Thr Pro Ala Asp Leu Thr Gly Ile Leu Gln Gln Gly Gly Met
210 215 220
Leu Val Phe Arg Gly Lys Glu Leu Leu Tyr Ser Trp Lys Asp Lys Gly
225 230 235 240
Thr Gly Asp His Ala Pro Leu Asp Asp Val Leu Asn Ala Cys Cys Asn
245 250 255
Arg Thr Ser
<210>71
<211>1183
<212>DNA
<213>稻
<400>71
tccgcaacga cctccacacc gcaacggtcc actcgctcgc ctccgtctcc ctcccgcgtc 60
tagggtttcg ccacgtctca cgcagccatg gccgcggcgg ccgcgtecac ctcgctcccc120
gtcccgcgcg tctccctccc gccgtccgct cgcccagccg ccgctccccg gcacggtctc180
ctcatccccg gtcgccgtgg gtgcttccgt ctccgcggct caccagcggc accggccgcc240
gccgcctcgg gctccccttc cgtgccttcc tcttccccgg aggctgggtc gggcatcggg300
gatgccctcg gtggcgtcgc catctactcc gcggccaccg gcgagcccgt gctgttcagg360
gacctgtggg accagaacga gggaatggct gttgttgccc tgctaaggca ttttgggtgc420
ccttgctgtt gggagttggc ctctgtgttg agggatacaa aagagagatt tgattcagct480
ggtgtcaagc taatagccgt tggtgttggc actccagata aagcccgtat tcttgctgag540
cgtttaccat ttccattgga ctacctctac gcagatcctg agcgcaaggc ctatgatctc600
ttgggtttgt attttggtat tggtcgcaca ttcttcaatc cagccagtgc aagtgtgttt660
tcacgatttg actccctcaa ggaggcagtg aagaactata caattgaagc caccccagat720
gatagggcta gtgttctaca acagggtgga atgtttgtgt tcagagggaa agaattaata780
tatgcaagga aagatgaggg cactggtgat catgcacctc tggatgatgt cctcaacatc840
tgttgtaaag cccctgcggc atgatattgt gtaatcaatg tcccatgaga attttcatag900
cctggttctg ttcgtgtccc aaagttgtat gcagaaaagc atctcttgat tttggaaggc960
tggcttctgc aaggatagta tctctttgtc tgtacgtctg atctaccatg ctgttgatat 1020
gtaatatatc agttgaaaac ttgagggatg taggcagacc aaaggacttt ctcatgccat 1080
aagctcagca gttcttttcc ttttcctcat agaaatgtac taattataga agagaatctt 1140
acactgtaca ataagtttgt gttaaagttg gcgaaatttt cct 1183
<210>72
<211>258
<212>PRT
<213>稻
<400>72
Met Ala Ala Ala Ala Ala Ser Thr Ser Leu Pro Val Pro Arg Val Ser
1 5 10 15
Leu Pro Pro Ser Ala Arg Pro Ala Ala Ala Pro Arg His Gly Leu Leu
20 25 30
Ile Pro Gly Arg Arg Gly Cys Phe Arg Leu Arg Gly Ser Pro Ala Ala
35 40 45
Pro Ala Ala Ala Ala Ser Gly Ser Pro Ser Val Pro Ser Ser Ser Pro
50 55 60
Glu Ala Gly Ser Gly Ile Gly Asp Ala Leu Gly Gly Val Ala Ile Tyr
65 70 75 80
Ser Ala Ala Thr Gly Glu Pro Val Leu Phe Arg Asp Leu Trp Asp Gln
85 90 95
Asn Glu Gly Met Ala Val Val Ala Leu Leu Arg His Phe Gly Cys Pro
100 105 110
Cys Cys Trp Glu Leu Ala Ser Val Leu Arg Asp Thr Lys Glu Arg Phe
115 120 125
Asp Ser Ala Gly Val Lys Leu Ile Ala Val Gly Val Gly Thr Pro Asp
130 135 140
Lys Ala Arg Ile Leu Ala Glu Arg Leu Pro Phe Pro Leu Asp Tyr Leu
145 150 155 160
Tyr Ala Asp Pro Glu Arg Lys Ala Tyr Asp Leu Leu Gly Leu Tyr Phe
165 170 175
Gly Ile Gly Arg Thr Phe Phe Asn Pro Ala Ser Ala Ser Val Phe Ser
180 185 190
Arg Phe Asp Ser Leu Lys Glu Ala Val Lys Asn Tyr Thr Ile Glu Ala
195 200 205
Thr Pro Asp Asp Arg Ala Ser Val Leu Gln Gln Gly Gly Met Phe Val
210 215 220
Phe Arg Gly Lys Glu Leu Ile Tyr Ala Arg Lys Asp Glu Gly Thr Gly
225 230 235 240
Asp His Ala Pro Leu Asp Asp Val Leu Asn Ile Cys Cys Lys Ala Pro
245 250 255
Ala Ala
<210>73
<211>917
<212>DNA
<213>稻
<400>73
ctcggcgcgg ccacagccgc agaaccacac ctaggccgct cgaagaccca cgtagcttcc 60
atccaagctt accgccatgg ccgcgcgcgc gccgctcccc gtaccgcacg cggccgccac120
cagcccgcga ccggctgcgg cgtcgagcct cctccgcgcg aggggcccgt gcgcctccct180
cctctacccg cgccgcctcc gcttctccgt tgcgccggtg gccgccgcca agcccgaggc240
cgtcgggagg gccggggagg cagctgcggc gccggtggaa gggctcgcga aatccctgca300
gggggtggag gtgttcgatc tgagcggaaa ggcggtgccc gttgttgatc tgtggaagga360
caggaaggcc atcgttgcgt tcgcccgcca ttttggatgc gtgctgtgcc gtaagagggc420
cgatcttctc gcggctaagc aggatgcaat ggaggctgca ggggttgctc ttgttttaat480
cggaccaggt actgttgaac aggcaaaggc attttatgac caaaccaaat tcaaaggaga540
agtatacgct gatccaagtc actcatcata taatgccctt gaatttgcat ttgggctgtt600
ctcaacgttt actccatcgg ccggtttgaa gattatacag ttgtacatgg aaggatacag660
gcaggattgg gaactgtcgt tcgagaagac caccagaacg aaaggtggat ggtatcaagg720
gggcctactt gttgcaggac caggcatcga caatattttg tatatccaca aggacaaaga780
agcaggagat gaccctgaca tggatgatgt cttgaaagct tgctgttcct agatcactag840
tatcctatat catttctgtt aacctccaga ccttgaagac acatgtaaat attttgccaa900
gttaaagtat gttatgt 917
<210>74
<211>251
<212>PRT
<213>稻
<400>74
Met Ala Ala Arg Ala Pro Leu Pro Val Pro His Ala Ala Ala Thr Ser
1 5 10 15
Pro Arg Pro Ala Ala Ala Ser Ser Leu Leu Arg Ala Arg Gly Pro Cys
20 25 30
Ala Ser Leu Leu Tyr Pro Arg Arg Leu Arg Phe Ser Val Ala Pro Val
35 40 45
Ala Ala Ala Lys Pro Glu Ala Val Gly Arg Ala Gly Glu Ala Ala Ala
50 55 60
Ala Pro Val Glu Gly Leu Ala Lys Ser Leu Gln Gly Val Glu Val Phe
65 70 75 80
Asp Leu Ser Gly Lys Ala Val Pro Val Val Asp Leu Trp Lys Asp Arg
85 90 95
Lys Ala Ile Val Ala Phe Ala Arg His Phe Gly Cys Val Leu Cys Arg
100 105 110
Lys Arg Ala Asp Leu Leu Ala Ala Lys Gln Asp Ala Met Glu Ala Ala
115 120 125
Gly Val Ala Leu Val Leu Ile Gly Pro Gly Thr Val Glu Gln Ala Lys
130 135 140
Ala Phe Tyr Asp Gln Thr Lys Phe Lys Gly Glu Val Tyr Ala Asp Pro
145 150 155 160
Ser His Ser Ser Tyr Asn Ala Leu Glu Phe Ala Phe Gly Leu Phe Ser
165 170 175
Thr Phe Thr Pro Ser Ala Gly Leu Lys Ile Ile Gln Leu Tyr Met Glu
180 185 190
Gly Tyr Arg Gln Asp Trp Glu Leu Ser Phe Glu Lys Thr Thr Arg Thr
195 200 205
Lys Gly Gly Trp Tyr Gln Gly Gly Leu Leu Val Ala Gly Pro Gly Ile
210 215 220
Asp Asn Ile Leu Tyr Ile His Lys Asp Lys Glu Ala Gly Asp Asp Pro
225 230 235 240
Asp Met Asp Asp Val Leu Lys Ala Cys Cys Ser
245 250
<210>75
<211>886
<212>DNA
<213>稻
<400>75
acgcgtgagt tcgtgacgcg tcacgccccg cggccttccc ctcccaaaaa gcggcaggac 60
gcaacctgat ccccatcccc cgagcaagca aagcggagga acgcgatggc gtcggcgctg120
ctgaggaagg cgacggtagg cggctccgcg gcggcggcgg cggcgaggtg ggcttccagg180
gggctcgcgt cggtgggctc cggctccgac atcgtctcgg cggcgcccgg cgtgtcgctg240
cagaaggcce gctcctggga cgagggcgtc gccaccaact tctccaccac ccctctcaag300
gacatcttcc atgggaagaa agtggtcatc ttcggcctgc ctggtgcata cacaggagtc360
tgttcacagg cacacgtccc tagttataaa aataacattg acaagttgaa agcaaaaggg420
gttgactctg ttatctgtgt ctctgtgaat gacccttatg ccctgaatgg atgggcagaa480
aagctacagg caaaagatgc tattgaattt tatggtgatt ttgatgggag tttccacaaa540
agcttggatt tggaagtaga cctctctgct gctttgcttg gccgccgttc ccacaggtgg600
tcagcctttg ttgacgatgg gaagatcaag gctttcaatg ttgaggtagc tccttctgac660
ttcaaggttt ctggtgccga ggtgatcttg gaceaaatct gatccgagta acgaaattct720
gtcgttgttt gttttctcat gcagcatgca tgcttttgct gtagtaaata aacgaaaact780
cgactactcg agtatccatg taaagatgtt tgtagtctgc cttgctacgc ccagaatatt840
tgttttcctg ttacaaatca gcttgccggg caacatgttt gtcagc 886
<210>76
<211>198
<212>PRT
<213>稻
<400>76
Met Ala Ser Ala Leu Leu Arg Lys Ala Thr Val Gly Gly Ser Ala Ala
1 5 10 15
Ala Ala Ala Ala Arg Trp Ala Ser Arg Gly Leu Ala Ser Val Gly Ser
20 25 30
Gly Ser Asp Ile Val Ser Ala Ala Pro Gly Val Ser Leu Gln Lys Ala
35 40 45
Arg Ser Trp Asp Glu Gly Val Ala Thr Asn Phe Ser Thr Thr Pro Leu
50 55 60
Lys Asp Ile Phe His Gly Lys Lys Val Val Ile Phe Gly Leu Pro Gly
65 70 75 80
Ala Tyr Thr Gly Val Cys Ser Gln Ala His Val Pro Ser Tyr Lys Asn
85 90 95
Asn Ile Asp Lys Leu Lys Ala Lys Gly Val Asp Ser Val Ile Cys Val
100 105 110
Ser Val Asn Asp Pro Tyr Ala Leu Asn Gly Trp Ala Glu Lys Leu Gln
115 120 125
Ala Lys Asp Ala Ile Glu Phe Tyr Gly Asp Phe Asp Gly Ser Phe His
130 135 140
Lys Ser Leu Asp Leu Glu Val Asp Leu Ser Ala Ala Leu Leu Gly Arg
145 150 155 160
Arg Ser His Arg Trp Ser Ala Phe Val Asp Asp Gly Lys Ile Lys Ala
165 170 175
Phe Asn Val Glu Val Ala Pro Ser Asp Phe Lys Val Ser Gly Ala Glu
180 185 190
Val Ile Leu Asp Gln Ile
195
<210>77
<211>22
<212>PRT
<213>人工序列
<220>
<223>基序1
<220>
<221>未确定
<222>(6)..(6)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>未确定
<222>(11)..(11)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>变体
<222>(14)..(14)
<223>/替换=″Gly″
<220>
<221>变体
<222>(15)..(15)
<223>/替换=″Met″
<220>
<221>变体
<222>(19)..(19)
<223>/替换=″Gly″
<220>
<221>变体
<222>(21)..(21)
<223>/替换=″Val″
<220>
<221>变体
<222>(22)..(22)
<223>/替换=″Asn″
<400>77
Pro Leu Val Gly Asn Xaa Ala Pro Asp Phe Xaa Ala Glu Ala Val Phe
1 5 10 15
Asp Gln Glu Phe Ile Lys
20
<210>78
<211>22
<212>PRT
<213>人工序列
<220>
<223>基序2
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Val″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Tyr″
<220>
<221>未确定
<222>(7)..(7)
<223>Xaa可以是任何天然存在的氨基酸
<220>
<221>变体
<222>(10)..(10)
<223>/替换=″Lys″
<220>
<221>变体
<222>(12)..(12)
<223>/替换=″Ala″
<220>
<221>变体
<222>(13)..(13)
<223>/替换=″Glu″
<220>
<221>变体
<222>(14)..(14)
<223>/替换=″Asp″
<220>
<221>变体
<222>(15)..(15)
<223>/替换=″Tyr″
<220>
<221>变体
<222>(16)..(16)
<223>/替换=″Asp″/替换=″Asn″
<220>
<221>变体
<222>(20)..(20)
<223>/替换=″His″
<400>78
Tyr Pro Leu Ile Ser Asp Xaa Thr Lys Ser Ile Ser Lys Ser Phe Gly
1 5 10 15
Val Leu Ile Pro Asp Gln
20
<210>79
<211>2194
<212>DNA
<213>稻
<400>79
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc2160
ttggtgtagc ttgccacttt caccagcaaa gttc2194
<210>80
<211>1264
<212>DNA
<213>稻
<400>80
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatc 1264
<210>81
<211>54
<212>DNA
<213>人工序列
<220>
<223>引物正向引物prm8756
<400>81
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gtctgttgct tctt 54
<210>82
<211>52
<212>DNA
<213>人工序列
<220>
<223>引物反向引物prm8757
<400>82
ggggaccact ttgtacaaga aagctgggtt cgagctaaat agctgagaag ag 52
<210>83
<211>1317
<212>DNA
<213>拟南芥
<400>83
cggacaggcc acgtcgtgtc ctaaacctct tagcctttcc ctttataagt caatcttgtg 60
tcggcttcga ctcccaacat acacaaaaca ctaaaagtag aagaaaaatg gcgactctta 120
aggtttctga ttctgttcct gctccttctg atgatgctga gcaattgaga accgcttttg 180
aaggatgggg tacgaacgag gacttgatca tatcaatctt ggctcacaga agtgctgaac 240
agaggaaagt catcaggcaa gcataccacg aaacctacgg cgaagacctt ctcaagactc 300
ttgacaagga gctctctaac gatttcgaga gagctatctt gttgtggact cttgaacccg 360
gtgagcgtga tgctttattg gctaatgaag ctacaaaaag atggacttca agcaaccaag 420
ttcttatgga agttgcttgc acaaggacat caacgcagct gcttcacgct aggcaagctt 480
accatgctcg ctacaagaag tctcttgaag aggacgttgc tcaccacact accggtgact 540
tcagaaagct tttggtttct cttgttacct catacaggta cgaaggagat gaagtgaaca 600
tgacattggc taagcaagaa gctaagctgg tccatgagaa aatcaaggac aagcactaca 660
atgatgagga tgttattaga atcttgtcca caagaagcaa agctcagatc aatgctactt 720
ttaaccgtta ccaagatgat catggcgagg aaattctcaa gagtcttgag gaaggagatg 780
atgatgacaa gttccttgca cttttgaggt caaccattca gtgcttgaca agaccagagc 840
tttactttgt cgatgttctt cgttcagcaa tcaacaaaac tggaactgat gaaggagcac 900
tcactagaat tgtgaccaca agagctgaga ttgacttgaa ggtcattgga gaggagtacc 960
agcgcaggaa cagcattcct ttggagaaag ctattaccaa agacactcgt ggagattacg 1020
agaagatgct cgtcgcactt ctcggtgaag atgatgctta atcaatcaat cctccacaga 1080
gaaacataag ctgctctaca gcttctgtta tctcttatct ccctctctct ctctttgatg 1140
agtttcaaat cgtttgattt tgtttctaca aaaaccttgt ttgtttctgt tgtgtgtttt 1200
gagttcctaa ataatgcaaa agagagagac agagagaacc agtgtggtct cttaagttat 1260
atatatatga agagcattgg cctaaaacac agactaacaa gtagttctgg ttttgac 1317
<210>84
<211>317
<212>PRT
<213>拟南芥
<400>84
Met Ala Thr Leu Lys Val Ser Asp Ser Val Pro Ala Pro Ser Asp Asp
1 5 10 15
Ala Glu Gln Leu Arg Thr Ala Phe Glu Gly Trp Gly Thr Asn Glu Asp
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Ser Ala Glu Gln Arg Lys Val
35 40 45
Ile Arg Gln Ala Tyr His Glu Thr Tyr Gly Glu Asp Leu Leu Lys Thr
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Ala Ile Leu Leu Trp
65 70 75 80
Thr Leu Glu Pro Gly Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Leu Met Glu Val Ala Cys Thr
100 105 110
Arg Thr Ser Thr Gln Leu Leu His Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Ser Leu Val Thr Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Lys Gln Glu Ala Lys Leu Val His
165 170 175
Glu Lys Ile Lys Asp Lys His Tyr Asn Asp Glu Asp Val Ile Arg Ile
180 185 190
Leu Ser Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Phe Asn Arg Tyr
195 200 205
Gln Asp Asp His Gly Glu Glu Ile Leu Lys Ser Leu Glu Glu Gly Asp
210 215 220
Asp Asp Asp Lys Phe Leu Ala Leu Leu Arg Ser Thr Ile Gln Cys Leu
225 230 235 240
Thr Arg Pro Glu Leu Tyr Phe Val Asp Val Leu Arg Ser Ala Ile Asn
245 250 255
Lys Thr Gly Thr Asp Glu Gly Ala Leu Thr Arg Ile Val Thr Thr Arg
260 265 270
Ala Glu Ile Asp Leu Lys Val Ile Gly Glu Glu Tyr Gln Arg Arg Asn
275 280 285
Ser Ile Pro Leu Glu Lys Ala Ile Thr Lys Asp Thr Arg Gly Asp Tyr
290 295 300
Glu Lys Met Leu Val Ala Leu Leu Gly Glu Asp Asp Ala
305 310 315
<210>85
<211>56
<212>DNA
<213>人工序列
<220>
<223>正向引物P08727
<400>85
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gactcttaag gtttct56
<210>86
<211>50
<212>DNA
<213>人工序列
<220>
<223>反向引物P09025
<400>86
ggggaccact ttgtacaaga aagctgggtt taagcatcat cttcaccgag 50
<210>87
<211>14
<212>PRT
<213>人工序列
<220>
<223>特征序列1
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Leu″/替换=″Val″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Val″/替换=″Leu″/替换=″Ile″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Val″/替换=″Met″/替换=″Ile″/替换=
″Cys″
<220>
<221>未确定
<222>(4)..(4)
<223>Xaa可以是任何天然存在的氨基酸,优选
Leu,Ser,Ile,Val,Gln或Met之一
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Phe″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Val″/替换=″Met″/替换=″Thr″/替换=
″Ala″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Pro″/替换=″Tyr″/替换=″Met″/替换=
″Phe″
<220>
<221>变体
<222>(8)..(8)
<223>/替换=″Glu″/替换=″Ser″/替换=″Hi s″
<220>
<221>变体
<222>(9)..(9)
<223>/替换=″Ala″
<220>
<221>未确定
<222>(10)..(10)
<223>Xaa可以是任何天然存在的氨基酸,优选
Ala,Val,Pro,Gly,Ser,Thr或Trp之一
<220>
<221>变体
<222>(11)..(11)
<223>/替换=″Ser″/替换=″Glu″/替换=″Ala″
<400>87
Ala Met Leu Xaa Trp Ile Leu Asp Pro Xaa Gly Arg Asp Ala
1 5 10
<210>88
<211>19
<212>PRT
<213>人工序列
<220>
<223>特征序列2
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Ile″/替换=″Val″/替换=″Cys″/替换=
″Gly″
<220>
<221>未确定
<222>(3)..(3)
<223>Xaa可以是任何天然存在的氨基酸,优选
Lys,Arg,Gln,Ser,Glu,Ala或Met之一
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Arg″/替换=″Trp″/替换=″Met″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Thr″/替换=″Val″
<220>
<221>变体
<222>(8)..(8)
<223>/替换=″Asn″
<220>
<221>变体
<222>(9)..(9)
<223>/替换=″Ala″/替换=″Thr″/替换=″Glu″
<220>
<221>未确定
<222>(10)..(10)
<223>Xaa可以是任何天然存在的氨基酸,优选
Thr,Ser,Lys,Asn,Gly,Asp,Ala,Glu,Gln,或Arg之一
<220>
<221>变体
<222>(11)..(11)
<223>/替换=″Ala″/替换=″Val″/替换=″Leu″/替换=
″Met″
<220>
<221>变体
<222>(12)..(12)
<223>/替换=″Ile″/替换=″Leu″
<220>
<221>变体
<222>(13)..(13)
<223>/替换=″Thr″
<220>
<221>未确定
<222>(14)..(14)
<223>Xaa可以是任何天然存在的氨基酸,优选
Asn,Ala,Arg,Glu,Asp,Ser或Gln之一
<220>
<221>变体
<222>(15)..(15)
<223>/替换=″Val″/替换=″Thr″
<220>
<221>变体
<222>(17)..(17)
<223>/替换=″Ala″/替换=″Gly″
<220>
<221>变体
<222>(18)..(18)
<223>/替换=″Gln″/替换=″Lys″
<220>
<221>变体
<222>(19)..(19)
<223>/替换=″Ser″
<400>88
Ala Phe Xaa Gly Phe Gly Cys Asp Ser Xaa Thr Val Ile Xaa Ile Leu
1 5 10 15
Thr His Arg
<210>89
<211>17
<212>PRT
<213>人工序列
<220>
<223>特征序列3
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Ser″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Asn″/替换=″Glu″/替换=″Thr″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Glu″/替换=″Lys″
<220>
<221>未确定
<222>(4)..(4)
<223>Xaa可以是任何天然存在的氨基酸,优选
Ser Thr,Asp,Glu,Trp,Asn或Lys之一
<220>
<221>未确定
<222>(5)..(5)
<223>Xaa可以是任何天然存在的氨基酸,优选
Thr,Ala,Ser,Met,His,Asp,Gly,或Trp之一
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Thr″/替换=″Ser″/替换=″Asn″
<220>
<221>变体
<222>(9)..(9)
<223>/替换=″Ile″/替换=″Ala″/替换=″Gly″
<220>
<221>变体
<222>(10)..(10)
<223>/替换=″Ile″/替换=″Phe″
<220>
<221>变体
<222>(11)..(11)
<223>/替换=″Thr″/替换=″Cys″/替换=″Ser″/替换=
″Ala″
<220>
<221>变体
<222>(12)..(12)
<223>/替换=″Ser″
<220>
<221>变体
<222>(14)..(14)
<223>/替换=″Ala″
<220>
<221>变体
<222>(15)..(15)
<223>/替换=″Asp″
<220>
<221>变体
<222>(16)..(16)
<223>/替换=″Val″/替换=″Phe″/替换=″Leu″/替换=
″Lys″/替换=″His″
<220>
<221>变体
<222>(17)..(17)
<223>/替换=″Ser″
<400>89
Thr Asp Asp Xaa Xaa Leu Ile Arg Val Val Val Thr Arg Thr Glu Ile
1 5 10 15
Asp
<210>90
<211>10
<212>PRT
<213>人工序列
<220>
<223>特征序列4
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″His″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Tyr″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Glu″/替换=″Val″/替换=″Ser″
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Glu″/替换=″Asp″
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Ala″/替换=″Leu″/替换=″Ile″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Val″/替换=″Ile″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″His″/替换=″Asp″
<220>
<221>未确定
<222>(8)..(8)
<223>Xaa可以是任何天然存在的氨基酸,优选
Lys,Glu,Asp,Thr,Leu,Ser,Gln,Arg,Asn或Ala之一
<220>
<221>变体
<222>(9)..(9)
<223>/替换=″Ala″
<220>
<221>变体
<222>(10)..(10)
<223>/替换=″Ile″/替换=″Leu″
<400>90
Tyr Phe Ala Lys Val Leu Arg Xaa Ser Met
1 5 10
<210>91
<211>7
<212>PRT
<213>人工序列
<220>
<223>特征序列5
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Gly″/替换=″Lys″/替换=″Ser″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Ile″/替换=″Met″
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Glu″
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″His″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Val″/替换=″Leu″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Ala″/替换=″Glu″
<400>91
Tyr Leu Glu His Asp Ile Gly
1 5
<210>92
<211>9
<212>PRT
<213>人工序列
<220>
<223>特征序列6
<220>
<221>变体
<222>(1)..(1)
<223>/替换=″Leu″/替换=″Val″/替换=″Ile″/替换=
″Thr″
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Leu″/替换=″Val″
<220>
<221>变体
<222>(3)..(3)
<223>/替换=″Gln″/替换=″Tyr″
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Val″
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Leu″/替换=″Val″/替换=″Ile″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Ser″/替换=″Gly″/替换=″Ala″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Asp″/替换=″Thr″
<400>92
Phe Ile Arg Ile Phe Thr Glu Arg Ser
1 5
<210>93
<211>10
<212>PRT
<213>人工序列
<220>
<223>特征序列7
<220>
<221>变体
<222>(2)..(2)
<223>/替换=″Lys″/替换=″Met″/替换=″Glu″/替换=
″Gln″
<220>
<221>未确定
<222>(3)..(3)
<223>Xaa可以是任何天然存在的氨基酸,优选
Thr,Asp,Asn,Lys,Ser,Arg或Ala之一
<220>
<221>变体
<222>(4)..(4)
<223>/替换=″Thr″/替换=″Leu″/替换=″Met″/替换=
″Ile″
<220>
<221>变体
<222>(5)..(5)
<223>/替换=″Ile″
<220>
<221>变体
<222>(6)..(6)
<223>/替换=″Ile″/替换=″Val″
<220>
<221>变体
<222>(7)..(7)
<223>/替换=″Thr″/替换=″Val″/替换=″Ala″
<220>
<221>变体
<222>(9)..(9)
<223>/替换=″Ile″/替换=″Leu″/替换=″Ala″/替换=
″Met″
<220>
<221>变体
<222>(10)..(10)
<223>/替换=″Ser″
<400>93
Tyr Arg Xaa Phe Leu Leu Ser Leu Val Gly
1 5 10
<210>94
<211>2194
<212>DNA
<213>稻
<400>94
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc2160
ttggtgtagc ttgccacttt caccagcaaa gttc2194
<210>95
<211>1244
<212>DNA
<213>稻
<400>95
aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60
gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac120
ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg180
gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga240
ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga300
gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg360
atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc420
atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga480
atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga540
tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc600
ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat660
ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720
tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780
cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840
tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900
gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960
gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020
gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080
ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140
ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200
aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg acaa 1244
<210>96
<211>1141
<212>DNA
<213>陆地棉(Gossypium hirsutum)
<400>96
cagattcaga aagaaataaa ggaagaagaa gcaatggcca ctcttacagt gcccacgaca 60
gttccttcgg tgtctgaaga ttgtgaacag ctaagaaaag ccttttcagg atggggaact 120
aatgagggct taatcataga tatattgggt cacagaaatg ccgagcaacg aaacttgatt 180
cgaaaaacct acgctgaaac ctatggagag gatctcctca aggcactaga caaggagctc 240
tcgaatgact ttgagaggct ggttttgctt tgggctcttg atcctgctga acgtgatgcc 300
cttttggcta atgaagccac caaaaggtgg acttcaagca atcaggtcct tatggaaata 360
gcttgcacaa ggtctgccaa ccaactgctt cacgcaaggc aggcttatca tgctcgttat 420
aagaagtcgc ttgaagagga tgttgctcat cacacgactg gcgacttccg taagctcctc 480
ctacctctag tgagttcata cagatatgag ggagaggagg tgaacatgaa tctggcgaaa 540
acagaggcga agttgcttca tgagaaaatt tcagacaaag cttacagtga tgacgatgtc 600
ataagggttt tggctacaag aagcaaggca cagatcaatg caactctgaa tcactacaaa 660
aatgaatatg gaaatgacat aaacaaggac ttgaaggctg atcctaagga tgagttcctt 720
gcactactaa ggtccacagt gaagtgcttg gtctatccgg aaaagtattt tgagaaggtt 780
cttcgcctag caatcaatag acgaggaacg gatgaaggag ctcttactag agttgtttgc 840
actagggctg aggttgatct aaagatcata gcagatgagt accagcgaag gaacagtgtc 900
ccactgactc gtgccattgt caaggacact catggagact atgaaaaatt gctgctggta 960
cttgcaggac atgtggagaa ttgaatctga tatcatgaga caatttcctg gtgaataaat 1020
gtttatgacc aaactataat ggtctagtgt ggttattgat gttttcctgt ttttctatgt 1080
agtattgcga gttatatgct atccaagaat tcgaagtcta tttaaaaaaa aaaaaaaaaa 1140
a 1141
<210>97
<211>316
<212>PRT
<213>陆地棉
<400>97
Met Ala Thr Leu Thr Val Pro Thr Thr Val Pro Ser Val Ser Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Gly
20 25 30
Leu Ile Ile Asp Ile Leu Gly His Arg Asn Ala Glu Gln Arg Asn Leu
35 40 45
Ile Arg Lys Thr Tyr Ala Glu Thr Tyr Gly Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Leu Val Leu Leu Trp
65 70 75 80
Ala Leu Asp Pro Ala Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Leu Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ala Asn Gln Leu Leu His Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Leu Pro Leu Val Ser Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Glu Glu Val Asn Met Asn Leu Ala Lys Thr Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Asp Val Ile Arg Val
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asn Glu Tyr Gly Asn Asp Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Ala Leu Leu Arg Ser Thr Val Lys Cys Leu Val
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Arg
245 250 255
Arg Gly Thr Asp Glu Gly Ala Leu Thr Arg Val Val Cys Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Ile Ile Ala Asp Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Pro Leu Thr Arg Ala Ile Val Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Lys Leu Leu Leu Val Leu Ala Gly His Val Glu Asn
305 310 315
<210>98
<211>1112
<212>DNA
<213>欧亚花葵(Lavatera thuringiaca)
<400>98
aatggctact cttacagttc cctccacact tccgtcagtg tctgaagatt gtgaacaact 60
caggaaagcc ttctcaggat ggggaactaa tgaggactta atcataaata tattgggtca 120
ccgaaatgcg gacgaacgaa actcgattcg aaaagcttat actgaaaccc atggagaaga 180
tctcctcaag gcactggaca aggaactctc aaatgacttt gagaggctgg ttctgctttg 240
gactcttgat cctcctgaac gtgatgcact tttggcaaat gaagccacca aaaggtggac 300
ttcaagcaat caggtaatta tggaaatagc ctgcagaagt tcttctgacc aactgcttcg 360
cgcgaggcag gcttatcatg ttcgttataa gaaatcgctt gaagaggatg ttgcccatca 420
cacaactggc gacttccgta agcttctcct acctcttgtg agttcataca gatacgaggg 480
agatgaagtg aacatgactc tggcgaaaac agaggccaag ttactccatg agaaaatctc 540
aaacaaagct tacagtgatg acgatgtcat cagggttttg gctacgagaa gcaagtcaca 600
gatcaacgaa cgtcttaatc actacaaaaa tgaatacgca actgatataa acaaggacct 660
gaaggctgac cctaaggatg agttccttgc actgctaagg tccacagtga agtgcttggt 720
ctaccctgaa aagtatttcg agaaggttct tcgtctagca atcaataaac gaggaacgga 780
tgaaggagct cttacgaggg ttgtttccac cagggctgag gttgatctaa agatcatagc 840
agatgagtac cagcgaagga acagtgtccc actgactcgt gctattgtca aggacactaa 900
tggagactac gaaaaattgc tgctggtact tgctggagag gtggaggctt gaaccggttt 960
tcatgagatg attttgtgtt gaataaaaac ttaatgaccg gaactctaat ggtctagtgt 1020
tgctattatg ttatcctgtt ttttttcttc tatggtactg tgagttttat gcaataaagg 1080
cttgttattt agaaaaaaaa aaaaaaaaaa aa 1112
<210>99
<211>316
<212>PRT
<213>欧亚花葵
<400>99
Met Ala Thr Leu Thr Val Pro Ser Thr Leu Pro Ser Val Ser Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Asp
20 25 30
Leu Ile Ile Asn Ile Leu Gly His Arg Asn Ala Asp Glu Arg Asn Ser
35 40 45
Ile Arg Lys Ala Tyr Thr Glu Thr His Gly Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Leu Val Leu Leu Trp
65 70 75 80
Thr Leu Asp Pro Pro Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Ile Met Glu Ile Ala Cys Arg
100 105 110
Ser Ser Ser Asp Gln Leu Leu Arg Ala Arg Gln Ala Tyr His Val Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Leu Pro Leu Val Ser Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Lys Thr Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Ile Ser Asn Lys Ala Tyr Ser Asp Asp Asp Val Ile Arg Val
180 185 190
Leu Ala Thr Arg Ser Lys Ser Gln Ile Asn Glu Arg Leu Asn His Tyr
195 200 205
Lys Asn Glu Tyr Ala Thr Asp Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Ala Leu Leu Arg Ser Thr Val Lys Cys Leu Val
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Lys
245 250 255
Arg Gly Thr Asp Glu Gly Ala Leu Thr Arg Val Val Ser Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Ile Ile Ala Asp Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Pro Leu Thr Arg Ala Ile Val Lys Asp Thr Asn Gly Asp Tyr Glu
290 295 300
Lys Leu Leu Leu Val Leu Ala Gly Glu Val Glu Ala
305 310 315
<210>100
<211>2040
<212>DNA
<213>芜青
<400>100
atggcgtctc tcaaagtccc taccaacgtt cctcttcccg aggaagacgc cgagcaactc 60
cacaaggctt ttgcaggatg gggtaccaac gagaagctga tcatatcaat cctagctcac 120
aggacctcag cacaacgcag cttaatccgc agcgcttatg ccgctgctta caatgaggat 180
ctcctcaagg ccttagacaa agagctttct agtgactttg agcgagttgt catgttgtgg 240
actcttgatc cagcggagag agatgctttc cttgctaaag aatctaccaa aatgttcacc 300
aagaacaatt gggttcttgt tgaaatcgca tgcactaggt gtcctcttga tcttttcaag 360
gtcaaacaag cttaccaagc acgttacaag aaatctctag aggaagatgt tgcgcaacac 420
acatctggtg accttcgtaa gctcttgctt cctcttgtta gtacttttag gtacgaagga 480
gatgaggtga acatgaggct tgcaagatcc gaagctaagt tacttcacga gaaggtctca 540
gagaaagcct ttagtgatga tgacttcatc agaatcttga caacaagaag caaagcacag 600
ctcggtgcaa ctcttaacca ctacaataat gagtacggaa acgctattaa caagcacttg 660
aaggaagatt cagatgatga gtacctgaag ctactaagag ctgcgatcac gtgtttgaca 720
taccctgaga agcattttga gaaggttttg cgtctagcaa ttaacaaaat ggggactgat 780
gagtgggcac taacccgagt tgtgactaca cgaactgaag ttgatatgga acgtatcaaa 840
gaggaatatc aacgaaggaa cagcattcct ttgcaccatg ccgtcgctaa agacacttct 900
ggtgattatg aggatatgct tgtttctctt ctcggacatg gagatgaagg gactctcgac 960
ggatcttttg ctggagataa gcgcctcggc ttctcgtctt cttcacagtc ctcacgtcgt1020
ctcgccctat ctggtgggtc gtctctccaa caacgaatcg agaggactct cttgccactg1080
ctgctctcgg gttatcggag acaagctcca gtgaactccc ctctaactgc cccagacatg1140
tctcgatttt gcagatccga agaaccttct ggttctcttg gtctctcatc atttggtggc1200
tccttcctca ccagagccgg gtctagcgtc aattcacctg ctcctctctc atcaatttat1260
gttaatccgg cgaccgatgt aggtggaact ccactccggc gaccagatct gttccttaaa1320
agtttgagaa gacaagcatc ctccagcgac attcctcttc cccgctccat cctctccatc1380
ctccatgttt ggcctcctcc acccttcaga ttgtgtaaac ttggtttaaa acgattgcat1440
gaagatccat accaccaacc actgcaaaca taccttctat cacagcggtt tgcaaatttg1500
gcgtccgatg taggtgggaa ttcactccgg catacagttt tgagccatat gtttatgaat1560
atgacgtctg atgtgagtgg gaatccactc cggcctccag ctctgagcca tcaaaagcta1620
gtaaggccaa tttgtcggcg cattattctc acctcttttt ctgttgtgga gatcacttta1680
ctaccatgtc tcccttctat gaatggagaa aatttctcag attcttttcc gagcttcagt1740
tgcagtttac tcaetggttt gttactttat ggagcggtcc gtacggggcc tgaaggtgca1800
atcgagacta cttcggtttt tcttgttggt gaagactgtc tttcaacgtc acttgtgact1860
atctctcaac tatccaactt tgccgtggaa gctttattga cgcattcaaa cttgatattg1920
aattcgctgt caacttcata tgaagattta ttatgcttgt ttctaattgc tattatagtt 1980
catgaattgt ccacaagagg atgtttagtt ctcttttggc tttgtagtcc ttgcatttga 2040
<210>101
<211>679
<212>PRT
<213>芜青
<400>101
Met Ala Ser Leu Lys Val Pro Thr Asn Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu His Lys Ala Phe Ala Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Thr Ser Ala Gln Arg Ser Leu
35 40 45
Ile Arg Ser Ala Tyr Ala Ala Ala Tyr Asn Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Ser Asp Phe Glu Arg Val Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Phe Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Cys Pro Leu Asp Leu Phe Lys Val Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Gln His Thr Ser Gly Asp
130 135 140
Leu Arg Lys Leu Leu Leu Pro Leu Val Ser Thr Phe Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Arg Leu Ala Arg Ser Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Val Ser Glu Lys Ala Phe Ser Asp Asp Asp Phe Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Gly Ala Thr Leu Asn His Tyr
195 200 205
Asn Asn Glu Tyr Gly Asn Ala Ile Asn Lys His Leu Lys Glu Asp Ser
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Arg Ala Ala Ile Thr Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Lys
245 250 255
Met Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr Arg Thr
260 265 270
Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Ile Pro Leu His His Ala Val Ala Lys Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Asp Met Leu Val Ser Leu Leu Gly His Gly Asp Glu Gly Thr Leu Asp
305 310 315 320
Gly Ser Phe Ala Gly Asp Lys Arg Leu Gly Phe Ser Ser Ser Ser Gln
325 330 335
Ser Ser Arg Arg Leu Ala Leu Ser Gly Gly Ser Ser Leu Gln Gln Arg
340 345 350
Ile Glu Arg Thr Leu Leu Pro Leu Leu Leu Ser Gly Tyr Arg Arg Gln
355 360 365
Ala Pro Val Asn Ser Pro Leu Thr Ala Pro Asp Met Ser Arg Phe Cys
370 375 380
Arg Ser Glu Glu Pro Ser Gly Ser Leu Gly Leu Ser Ser Phe Gly Gly
385 390 395 400
Ser Phe Leu Thr Arg Ala Gly Ser Ser Val Asn Ser Pro Ala Pro Leu
405 410 415
Ser Ser Ile Tyr Val Asn Pro Ala Thr Asp Val Gly Gly Thr Pro Leu
420 425 430
Arg Arg Pro Asp Leu Phe Leu Lys Ser Leu Arg Arg Gln Ala Ser Ser
435 440 445
Ser Asp Ile Pro Leu Pro Arg Ser Ile Leu Ser Ile Leu His Val Trp
450 455 460
Pro Pro Pro Pro Phe Arg Leu Cys Lys Leu Gly Leu Lys Arg Leu His
465 470 475 480
Glu Asp Pro Tyr His Gln Pro Leu Gln Thr Tyr Leu Leu Ser Gln Arg
485 490 495
Phe Ala Asn Leu Ala Ser Asp Val Gly Gly Asn Ser Leu Arg His Thr
500 505 510
Val Leu Ser His Met Phe Met Asn Met Thr Ser Asp Val Ser Gly Asn
515 520 525
Pro Leu Arg Pro Pro Ala Leu Ser His Gln Lys Leu Val Arg Pro Ile
530 535 540
Cys Arg Arg Ile Ile Leu Thr Ser Phe Ser Val Val Glu Ile Thr Leu
545 550 555 560
Leu Pro Cys Leu Pro Ser Met Asn Gly Glu Asn Phe Ser Asp Ser Phe
565 570 575
Pro Ser Phe Ser Cys Ser Leu Leu Thr Gly Leu Leu Leu Tyr Gly Ala
580 585 590
Val Arg Thr Gly Pro Glu Gly Ala Ile Glu Thr Thr Ser Val Phe Leu
595 600 605
Val Gly Glu Asp Cys Leu Ser Thr Ser Leu Val Thr Ile Ser Gln Leu
610 615 620
Ser Asn Phe Ala Val Glu Ala Leu Leu Thr His Ser Asn Leu Ile Leu
625 630 635 640
Asn Ser Leu Ser Thr Ser Tyr Glu Asp Leu Leu Cys Leu Phe Leu Ile
645 650 655
Ala Ile Ile Val His Glu Leu Ser Thr Arg Gly Cys Leu Val Leu Phe
660 665 670
Trp Leu Cys Ser Pro Cys Ile
675
<210>102
<211>1146
<212>DNA
<213>陆地棉
<400>102
caaccctcaa agttccagtt cacgttcctt ctccttctga ggatgctgaa tggcaacttc 60
ggaaagcttt tgaaggctgg ggtacgaacg agcaattgat tatcgacata ttggctcaca 120
ggaatgcagc acagcgcaat tcaattcgga aagtttatgg tgaagcttat ggggaagatc 180
ttctcaagtg tttggagaag gaacttacaa gtgatttcga gcgggctgtg ctgcttttta 240
cgttggaccc tgcagagcga gatgctcatc tggctaatga agctacaaag aagttcacat 300
caagcaattg gattctcatg gagatagctt gcagtaggtc ttcgcatgaa ctactcaatg 360
tgaaaaaggc gtatcatgct cgttataaga aatcccttga agaagatgtt gctcaccaca 420
ctaccggaga gtaccgcaag cttttggtcc ctcttgttag tgcattccga tatgagggag 480
aggaggtgaa catgacattg gcaaaatctg aggctaagat acttcatgat aaaatttcgg 540
acaagcatta taccgatgag gaggtgatta ggattgtatc aacaaggagt aaggcacagc 600
tcaatgcaac tctcaaccat tacaatactt cattcggcaa tgctatcaac aaggatttga 660
aggctgatcc cagtgatgaa ttcctcaaat tactaagagc tgtgatcaag tgcttgacca 720
ccccagagca atatttcgag aaggttttac gtcaagccat caataagttg ggatccgatg 780
aatgggctct tacccgagtc gtcacaactc gtgcagaggt cgacatggta cgtattaagg 840
aggcatatca acgaagaaac agcatccctc tcgaacaagc aattgctaaa gatacttcgg 900
gtgactatga gaagtttctt cttgccttga tcggagctgg agatgcatga accgtcttcg 960
gtattaagtt cctctgtatg aatgtttagt ttgccttatc cgctatgact taataattta 1020
tgcttggttt ttcatcgttt tcattatcta aagcattgct tgcttccatg atagaacatt 1080
caaaataaaa tgattgagtt cgtttaaaaa aaaaaaaaaa aaaaaaaagg aaaaaaaaaa 1140
aaaaaa 1146
<210>103
<211>315
<212>PRT
<213>陆地棉
<400>103
Thr Leu Lys Val Pro Val His Val Pro Ser Pro Ser Glu Asp Ala Glu
1 5 10 15
Trp Gln Leu Arg Lys Ala Phe Glu Gly Trp Gly Thr Asn Glu Gln Leu
20 25 30
Ile Ile Asp Ile Leu Ala His Arg Asn Ala Ala Gln Arg Asn Ser Ile
35 40 45
Arg Lys Val Tyr Gly Glu Ala Tyr Gly Glu Asp Leu Leu Lys Cys Leu
50 55 60
Glu Lys Glu Leu Thr Ser Asp Phe Glu Arg Ala Val Leu Leu Phe Thr
65 70 75 80
Leu Asp Pro Ala Glu Arg Asp Ala His Leu Ala Asn Glu Ala Thr Lys
85 90 95
Lys Phe Thr Ser Ser Asn Trp Ile Leu Met Glu Ile Ala Cys Ser Arg
100 105 110
Ser Ser His Glu Leu Leu Asn Val Lys Lys Ala Tyr His Ala Arg Tyr
115 120 125
Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Glu Tyr
130 135 140
Arg Lys Leu Leu Val Pro Leu Val Ser Ala Phe Arg Tyr Glu Gly Glu
145 150 155 160
Glu Val Asn Met Thr Leu Ala Lys Ser Glu Ala Lys Ile Leu His Asp
165 170 175
Lys Ile Ser Asp Lys His Tyr Thr Asp Glu Glu Val Ile Arg Ile Val
180 185 190
Ser Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr Asn
195 200 205
Thr Ser Phe Gly Asn Ala Ile Asn Lys Asp Leu Lys Ala Asp Pro Ser
210 215 220
Asp Glu Phe Leu Lys Leu Leu Arg Ala Val Ile Lys Cys Leu Thr Thr
225 230 235 240
Pro Glu Gln Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys Leu
245 250 255
Gly Ser Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr Arg Ala Glu
260 265 270
Val Asp Met Val Arg Ile Lys Glu Ala Tyr Gln Arg Arg Asn Ser Ile
275 280 285
Pro Leu Glu Gln Ala Ile Ala Lys Asp Thr Ser Gly Asp Tyr Glu Lys
290 295 300
Phe Leu Leu Ala Leu Ile Gly Ala Gly Asp Ala
305 310 315
<210>104
<211>1180
<212>DNA
<213>辣椒(Capsicum annuum)
<400>104
aaaaatggca agtctaaccg ttccagcaca tgttccttcg gctgctgaag actgtgaaca 60
actccgatct gccttcaaag gatggggaac aaatgagaag ttgatcatat caattttggc 120
tcatagaact gctgctcagc gcaaattgat tcgtcaaact tatgctgaga ctttcggaga 180
ggatctactt aaagagttgg acagagaact tacccatgat tttgagaaat tggtgctagt 240
gtggacgttg gatccttcag aacgtgatgc tcatttggct aaggaagcta ctaagagatg 300
gacaaaaagc aactttgttc ttgtggagct agcttgtacc agatcgccta aagaactggt 360
tttggctagg gaagcttatc atgcacgtta caagaaatct cttgaagagg atgttgccta 420
tcacactact ggggatcacc gcaagctttt ggtacctctt gtgagctcct accgatatgg 480
aggagaggag gtggacttgc gccttgctaa agcagaatct aaaattctgc atgagaagat 540
ctccgataag gcttacagtg atgatgaggt cattagaatt ttagccacaa ggagcaaagc 600
gcaactcaat gctactttga atcattacaa agatgaacat ggtgaggata tcctaaagca 660
attggaagat ggggatgagt ttgttgcact attgagggcc accattaaag gtcttgtcta 720
cccggagcac tattttgtgg aggttcttcg tgatgcaatc aacaggagag ggacagagga 780
agatcatctg acaagagtta ttgctacaag ggctgaggtc gatctgaaga ttatcgctga 840
tgagtaccag aagagggata gcattcccct gggtcgcgcc attgccaaag atacaagagg 900
agattatgag agtatgctgt tggctttgct tggacaagag gaggactgag gaggatttgg 960
ccacttatgt tttacaatga caagaataaa tatgccatcc cctatatgag aattggcatc 1020
cgttgtatgt ttgatgattg agtgtggtct gtttatgagc ttttagtcct tttttcttct 1080
cgtgagaaac ttctaatatg caactttgtg ctgtctacat atgttttcta ataatatgca 1140
tcgattagtt ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1180
<210>105
<211>322
<212>PRT
<213>辣椒
<400>105
Met Ala His His His His His His Met Ala Ser Leu Thr Val Pro Ala
1 5 10 15
His Val Pro Ser Ala Ala Glu Asp Cys Glu Gln Leu Arg Ser Ala Phe
20 25 30
Lys Gly Trp Gly Thr Asn Glu Lys Leu Ile Ile Ser Ile Leu Ala His
35 40 45
Arg Thr Ala Ala Gln Arg Lys Leu Ile Arg Gln Thr Tyr Ala Glu Thr
50 55 60
Phe Gly Glu Asp Leu Leu Lys Glu Leu Asp Arg Glu Leu Thr His Asp
65 70 75 80
Phe Glu Lys Leu Val Leu Val Trp Thr Leu Asp Pro Ser Glu Arg Asp
85 90 95
Ala His Leu Ala Lys Glu Ala Thr Lys Arg Trp Thr Lys Ser Asn Phe
100 105 110
Val Leu Val Glu Leu Ala Cys Thr Arg Ser Pro Lys Glu Leu Val Leu
115 120 125
Ala Arg Glu Ala Tyr His Ala Arg Tyr Lys Lys Ser Leu Glu Glu Asp
130 135 140
Val Ala Tyr His Thr Thr Gly Asp His Arg Lys Leu Leu Val Pro Leu
145 150 155 160
Val Ser Ser Tyr Arg Tyr Gly Gly Glu Glu Val Asp Leu Arg Leu Ala
165 170 175
Lys Ala Glu Ser Lys Ile Leu His Glu Lys Ile Ser Asp Lys Ala Tyr
180 185 190
Ser Asp Asp Glu Val Ile Arg Ile Leu Ala Thr Arg Ser Lys Ala Gln
195 200 205
Leu Asn Ala Thr Leu Asn His Tyr Lys Asp Glu His Gly Glu Asp Ile
210 215 220
Leu Lys Gln Leu Glu Asp Gly Asp Glu Phe Val Ala Leu Leu Arg Ala
225 230 235 240
Thr Ile Lys Gly Leu Val Tyr Pro Glu His Tyr Phe Val Glu Val Leu
245 250 255
Arg Asp Ala Ile Asn Arg Arg Gly Thr Glu Glu Asp His Leu Thr Arg
260 265 270
Val Ile Ala Thr Arg Ala Glu Val Asp Leu Lys Ile Ile Ala Asp Glu
275 280 285
Tyr Gln Lys Arg Asp Ser Ile Pro Leu Gly Arg Ala Ile Ala Lys Asp
290 295 300
Thr Arg Gly Asp Tyr Glu Ser Met Leu Leu Ala Leu Leu Gly Gln Glu
305 310 315 320
Glu Asp
<210>106
<211>1197
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>106
catccacaat tctccacagt acaagaaaac aaaaaaatgg cgagtcttaa agttccaaca 60
tctgttccag aaccttatga agatgctgag caactcaaaa aagcttttgc tggatggggt 120
acaaatgagg cacttattat tcagattctg gcacatagaa atgcagcaca acgcaagtta 180
atccgagaaa cttatgctgc agcttatgga gaggatcttc tcaaggactt ggatgctgaa 240
ctgacaagtg attttcagcg tgcagtgctt ctgtggactt tgagtcctgc tgagcgcgac 300
gcctacttgg ttaatgaagc taccaaacgt ctgacttcta gcaattgggt tatcttggaa 360
attgcttgta caaggtcttc tgatgatctc tttaaggcga ggcaggccta ccatgctcga 420
tacaagaaat cacttgaaga agatgttgct tatcacacaa ctggggattt ccgtaagctt 480
ttggttcctc ttttaactgc attcagatac gaaggagaag aggcgaacat gacattggca 540
agaaaggagg caaatatact acacgagaag atctctgaca aggcttacaa tgatgaggag 600
ctcatccgaa ttatttctac taggagtaaa gcacagctga atgcaacatt caaccactac 660
cttgaccaac atggcagtga aatcaacaag gatctggaaa ctgattctga tgatgagtac 720
ctgaaattac tcagcgcagc aatagaatgc ttgaaaaccc cagagaaaca ctttgagaaa 780
gttcttcgat tggctatcaa gggtacaggc acagacgaat gggaccttac tagagttgtc 840
actactcggg ctgaagttga catggaacgt atcaaagaag agtaccataa gaggaacagt 900
gttccattgg accgtgcaat tgctggagac acttcaggag actatgaaag gatgcttctg 960
gctttgattg ggcatggaga tgcttgaatg gaatatgtgt tctaagattg gataagaaac 1020
tatttcctaa tgtctgaagt ttgaatttgt ttgatgatgt gtgcatgtat gcccagagtt 1080
tggtttgcat tatatggatt taaataatcc aggtgttgtg ttttgttttt ttcttcactt 1140
gtcatagttt ggttctatat attcggactt cctcaaccag tgatcttatt gtttatc 1197
<210>107
<211>316
<212>PRT
<213>烟草(Nicotiana tabacum)
<400>107
Met Ala Ser Leu Lys Val Pro Thr Ser Val Pro Glu Pro Tyr Glu Asp
1 5 10 15
Ala Glu Gln Leu Lys Lys Ala Phe Ala Gly Trp Gly Thr Asn Glu Ala
20 25 30
Leu Ile Ile Gln Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Glu Thr Tyr Ala Ala Ala Tyr Gly Glu Asp Leu Leu Lys Asp
50 55 60
Leu Asp Ala Glu Leu Thr Ser Asp Phe Gln Arg Ala Val Leu Leu Trp
65 70 75 80
Thr Leu Ser Pro Ala Glu Arg Asp Ala Tyr Leu Val Asn Glu Ala Thr
85 90 95
Lys Arg Leu Thr Ser Ser Asn Trp Val Ile Leu Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Asp Asp Leu Phe Lys Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Pro Leu Leu Thr Ala Phe Arg Tyr Glu Gly
145 150 155 160
Glu Glu Ala Asn Met Thr Leu Ala Arg Lys Glu Ala Asn Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Asn Asp Glu Glu Leu Ile Arg Ile
180 185 190
Ile Ser Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Phe Asn His Tyr
195 200 205
Leu Asp Gln His Gly Ser Glu Ile Asn Lys Asp Leu Glu Thr Asp Ser
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Ser Ala Ala Ile Glu Cys Leu Lys
225 230 235 240
Thr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ala Ile Lys Gly
245 250 255
Thr Gly Thr Asp Glu Trp Asp Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr His Lys Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Arg Met Leu Leu Ala Leu Ile Gly His Gly Asp Ala
305 310 315
<210>108
<211>1086
<212>DNA
<213>陆地棉
<400>108
gggcaggttc ttcacaaaaa agaaaagaaa aattacagtg aaaatggcaa cccttaaagt 60
tccagctcat gtacctgccc cttctgagga tgctgagcaa cttcgtaaag cttttgaagg 120
atggggtaca aatgagcaat tgattatcga cattttggct cacaggaatg cagctcagcg 180
caatttgatt cgtaaaactt atcgtgaagc ttatggggaa gatctcctta agtctttgga 240
tgaggaactt tcaagtgact ttgagcgagc tgtggtgctg tttactttgg accctgcaga 300
gcgtgatgca tttctggctc atgaagctac aaagaggttc acatcaagcc attgggttct 360
catggaaatt gcttgcacta ggtcttcaca tgaactgttc aatgtgagga aggcgtatca 420
cgatctttac aagaaatccc ttgaagaaga tgttgcgcac cataccaagg gagactaccg 480
caagcttttg gtcccacttg ttagtgcatt ccgataccag ggagaggagg tgaacatgac 540
actggcaagg tcggaggcaa agatacttcg tgagaagata tcagacaagc agtacagtga 600
tgaggaggtc atcaggattg taacaacacg gagtaaggca cagttaaatg ctactctgaa 660
tcattacaat actgcatttg ggaatgctat caacaaggat ttgaaggccg accctgaaga 720
cgaattcctc aaattgctga gagctgcaat caagtgcttg actgtccctg agaaatattt 780
tgagaaggtg ctacgtcaag caatcaataa gctgggaaca gatgaatggg ctcttactag 840
agtggtcgcc actcgggcgg aggtagacat ggtgcgtatt aaggaggaat atcagcgaag 900
aaacagtgtg accctggaaa aagcgattgc tggagatacc tctggagact atgagaaaat 960
gctgcttgcg ttgattggag ctggagacgt ctgagctgct ttcctatatt gagttgttgg 1020
tatgaaaatt tagtttgcaa tttgaggtgt gagttatgtt tgtttggttg agggtgtgcc 1080
aatcgc1086
<210>109
<211>316
<212>PRT
<213>陆地棉
<400>109
Met Ala Thr Leu Lys Val Pro Ala His Val Pro Ala Pro Ser Glu Asp
1 5 10 15
Ala Glu Gln Leu Arg Lys Ala Phe Glu Gly Trp Gly Thr Asn Glu Gln
20 25 30
Leu Ile Ile Asp Ile Leu Ala His Arg Asn Ala Ala Gln Arg Asn Leu
35 40 45
Ile Arg Lys Thr Tyr Arg Glu Ala Tyr Gly Glu Asp Leu Leu Lys Ser
50 55 60
Leu Asp Glu Glu Leu Ser Ser Asp Phe Glu Arg Ala Val Val Leu Phe
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Phe Leu Ala His Glu Ala Thr
85 90 95
Lys Arg Phe Thr Ser Ser His Trp Val Leu Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser His Glu Leu Phe Asn Val Arg Lys Ala Tyr His Asp Leu
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val A1a His His Thr Lys Gly Asp
130 135 140
Tyr Arg Lys Leu Leu Val Pro Leu Val Ser Ala Phe Arg Tyr Gln Gly
145 150 155 160
Glu Glu Val Asn Met Thr Leu Ala Arg Ser Glu Ala Lys Ile Leu Arg
165 170 175
Glu Lys Ile Ser Asp Lys Gln Tyr Ser Asp Glu Glu Val Ile Arg Ile
180 185 190
Val Thr Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Asn Thr Ala Phe Gly Asn Ala Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Glu Asp Glu Phe Leu Lys Leu Leu Arg Ala Ala Ile Lys Cys Leu Thr
225 230 235 240
Val Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Leu Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Ala Thr Arg Ala
260 265 270
Glu Val Asp Met Val Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Thr Leu Glu Lys Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Lys Met Leu Leu Ala Leu Ile Gly Ala Gly Asp Val
305 310 315
<210>110
<211>1196
<212>DNA
<213>烟草
<400>110
gcatttacga gttttgacaa tcatatcttc cacagacaga aaaaaaatgg ctagtcttac 60
tgttccggca gaagttcctt cagttgctga agactgtgaa caactccgat ctgccttcaa 120
aggatgggga acaaatgaga agttgatcat atcaattttg gctcatagaa atgctgctca 180
acgcaagttg attcaacaga cttatgctga gacttttggt gaagatctcc ttaaagagtt 240
ggacagagaa cttaccaatg attttgagaa attggtggta gtgtggacat tggatccttc 300
agaacgcgat gcctatttgg ctaaggaagc tactaagaga tggacaaaaa gcaattttgt 360
tcttgtggag attgcttgta ccagatctcc taaagaattg gttttggcaa gggaagctta 420
tcatgctcgt ttcaagaaat ctcttgaaga ggacgttgct tatcacacta ctggggaaca 480
cccccagctt ttggtacctc ttgtgagctc ctaccgatat ggaggggacg aggtggactt 540
gcgccttgct aaagcagaag ctaaaatact gcacgagaag atctccgata aggcttacag 600
tgacgatgag gtcatcagaa ttctagccac aaggagcaaa gcacagatca atgctactct 660
gaaccattac aaagatgaat atgaagaaga tatcctgaag caattggaag agggggatga 720
gtttgttgga ctattgaggg caaccataaa aggtcttgtc taccccgagc actacttcgt 780
ggaggttctt cgagatgcaa ttaacaggag aggaacagat gaagatcatc tgaccagagt 840
tatcgctaca agggctgagg ttgatatgaa gattatcgct gatgagtacc agaagaggga 900
tagcatccct ctgggtcggg ccatcgccaa agatacaaga ggagattatg agagtatgtt 960
gttggctctg cttggacaag aggaggacta agaaggtttt gcttctgttt cataatgacc 1020
agaataaaca tgctatcccc tatatttgag agttggcatc cgttgtatgc ttgatgatta 1080
agcgtggtct gtttaacgtg agcttttagt ccttttcttc ttgtgataaa ctttgaatgt 1140
acaactttat gctatctaag aatgtttttc taaaaaaaaa aaaaaaaaaa aaaaaa 1196
<210>111
<211>314
<212>PRT
<213>烟草
<400>111
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Gln Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr Asn Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Phe Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Glu
130 135 140
His Pro Gln Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Glu Glu Asp Ile Leu Lys Gln Leu Glu Glu Gly Asp
210 215 220
Glu Phe Val Gly Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Asp Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Met Lys Ile Ile Ala Asp Glu Tyr Gln Lys Arg Asp Ser Ile Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Arg Gly Asp Tyr Glu Ser Met
290 295 300
Leu Leu Ala Leu Leu Gly Gln Glu Glu Asp
305 310
<210>112
<211>945
<212>DNA
<213>马铃薯(Solanum tuberosum)
<400>112
atggcaagtc ttacagttcc ggcagaagtt ccttccgtag ctgaagactg tgaacaactc 60
cgatctgcct tcaaaggatg gggaacgaac gagaagttga ttatatcaat tttggctcat 120
agaaatgctg ctcagcgcaa attgattcga cagacttatg ctgaaacttt tggggaagat 180
ctacttaaag agttggacag agaacttacc catgattttg agaaattggt gctaatatgg 240
acactggatc cgtcagaacg tgatgcctat ttggctaagg aagctactaa gagatggaca 300
aaaagcaact ttgttcttgt ggagatagct tgtactagat ctcctaaaga actggttttg 360
gcaagggaag cttatcatgc tcgtaacaag aaatctcttg aagaggacgt tgcttatcac 420
actactgggg atcaccgcaa gcttttggta cctcttgtga gctcctaccg atatggagga 480
gacgaggtgg acttgcgcct tgctaaagca gaatctaaag tactgcatga gaagatctcc 540
gataaggctt acagtgacga tgaggtcatt agaattttag ccacaaggag caaagcgcaa 600
ctcaatgcta ctttgaatca ttacaaagat gaatatggtg aggatatcct aaagcaattg 660
gaagatgagg atgagtttgt tgcactattg agggccacca taaaaggtct tgtctaccct 720
gagcactatt tcgtggaggt tcttcgtgat gcaattaaca ggagaggaac agaggaagat 780
catctgagcc gagttatcgc tacaagggct gaggtggatc tgaagactat cgctaacgag 840
taccagaaga gggatagcat tcctctgggt cgcgccattg ccaaagatac aggaggagat 900
tatgagaata tgctggtggc tttacttgga caagaggagg aatga 945
<210>113
<211>314
<212>PRT
<213>马铃薯
<400>113
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr His Asp Phe Glu Lys Leu Val Leu Ile Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp Glu Asp
210 215 220
Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Ser Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser Ile Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu Asn Met
290 295 300
Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310
<210>114
<211>1160
<212>DNA
<213>番茄(Lycopersicon esculentum)
<400>114
atggcaagtc ttacagttcc ggcagaagtt ccttcagtcg ctgaagactg tgaacaactc 60
cgatctgcct tcaaaggatg gggaacgaat gagaagttga ttatatcaat tttggctcat 120
agaaatgcgg ctcaacgcaa attgattcga cagacttatg ctgagacttt tggggaagat 180
ctgcttaaag agttggacag agaacttact catgattttg agaaattggt ggtagtatgg 240
acactggatc ctgcagaacg tgatgcctat ttggctaagg aagctactaa gagatggaca 300
aaaagcaact ttgttcttgt ggagatagct tgtaccagat ctcctaaaga actggttttg 360
gcaagagaag cttatcatgc tcgtaacaag aaatctctcg aagaggacgt tgcttatcac 420
actactgggg atcaccgcaa gcttttggta cctcttgtga gctcctaccg atatggggga 480
gatgaggtgg acttgcgact tgctaaagca gaatctaaag tgctgcatga gaagatctcc 540
gataaggctt acagtgacga tgaggtcatt agaattttag ccacaaggag caaagcgcaa 600
ctcaatgcta ctttgaatca ttacaaagat gaatatggtg aggatatcct aaagcaatta 660
gaagatgagg atgagtttgt tgcactgtta agggccacca taaaaggtct tgtctacccc 720
gagcactatt tcgtggaggt tcttcgtgat gcaattaaca ggagaggaac agaggaagat 780
catctaaccc gagttatcgc tacaagggct gaggtcgatc tgaagactat cgctaacgag 840
taccagaaga gggatagcgt tcctctgggt cgcgccattg ccaaagatac aggaggagat 900
tatgagaata tgctggtggc tttacttgga caagaggagg aataagaagc ggattggctc 960
acttctgttt ataatgacca gataatatgc cattctccat atatttcaga gttggcatgt 1020
gtttgatgat tgagagtggt ctgttcacat gagctttagt ccttttcttc ttgtgagaaa 1080
ctttgaatat gaatctttgt gctgtctaaa aatgttctct aatgatttgc atccactaaa 1140
aaaaaaaaaa aaaaaaaaaa1160
<210>115
<211>314
<212>PRT
<213>番茄
<400>115
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Ash Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr His Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp Glu Asp
210 215 220
Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser Val Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu Asn Met
290 295 300
Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310
<210>116
<211>1242
<212>DNA
<213>番茄
<400>116
atgtctagtc ttaaagttcc agcatcagtt ccagatcctt atgaagatgc tgagcaactc 60
aaaaaagctt ttaaaggatg gggcacaaat gaggaactta ttattcagat tctggctcat 120
aggaatgcca gacaacgcaa gttaatccga gattcttatg ctgctgctta tggagaggat 180
cttctcaagg acttggattc tgaactgaca agtgattttc agcgtgtggt gcttctctgg 240
actttgagtc ctgctgagcg cgacgcctac ttggttaatg aggctaccaa acgtctgact 300
gctagcaatt ggggtatcat ggaaattgct tgtaccaggt cttctgatga tctttttaag 360
gcgaggcagg cctaccatgc tccatacaag aaatcacttg aagaagatgt tgcttatcat 420
acagtggggg atttccgtaa gcttttggtt cctcttataa ctgcattcag atatgaagga 480
gatgaggtga acatgacatt agcaagaaag ggaagcaaat atctgcatga gaagatctct 540
gacaaggctt accatgacga ggagatcatc cgaatcattt ctactaggag taaagcacag 600
ctgagtgcta cgttcaacca ctaccatgat caccatggcc atgaaatcat caaggatctg 660
gaagctgatg atgacgatga gtacctgaaa ctactcagag cagcaataga atgcttgaaa 720
cccagagaac actttgagaa agttcttcga ttggctatca agaagctggg tacagacgaa 780
tgggatctta ctagagttgt tgccactcgg gctgaagttg acatggagcg tatcaaagaa 840
gagtaccata ggaggaacag tgttacattg gaccgtgcaa ttgctggaga cacttcagga 900
gactatgaaa aaatgcttct ggctctgatt gggcacggag atgcttgaat tacatgtgct 960
gaaaccttaa gataataaaa aactctactt attttctgaa ctttcatttg cttttatgat 1020
ctatggtgtg tactctcaga gtttggttct gtgtttatat gaactaaaaa cactcgggag 1080
ttgagttgtg ttttgttttc gccttcactt ttcatttcgg acttctactg gttttgcctg 1140
ctaaataagc atagcttcaa ctttggcttg aacggatctt gtttctttat aactcagaaa 1200
tagattatgt atcttggttc gtaaaaaaaa aaaaaaaaaa aa1242
<210>117
<211>315
<212>PRT
<213>稻茄
<400>117
Met Ser Ser Leu Lys Val Pro Ala Ser Val Pro Asp Pro Tyr Glu Asp
1 5 10 15
Ala Glu Gln Leu Lys Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Glu
20 25 30
Leu Ile Ile Gln Ile Leu Ala His Arg Asn Ala Arg Gln Arg Lys Leu
35 40 45
Ile Arg Asp Ser Tyr Ala Ala Ala Tyr Gly Glu Asp Leu Leu Lys Asp
50 55 60
Leu Asp Ser Glu Leu Thr Ser Asp Phe Gln Arg Val Val Leu Leu Trp
65 70 75 80
Thr Leu Ser Pro Ala Glu Arg Asp Ala Tyr Leu Val Asn Glu Ala Thr
85 90 95
Lys Arg Leu Thr Ala Ser Asn Trp Gly Ile Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Asp Asp Leu Phe Lys Ala Arg Gln Ala Tyr His Ala Pro
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Val Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Pro Leu Ile Thr Ala Phe Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Arg Lys Gly Ser Lys Tyr Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr His Asp Glu Glu Ile Ile Arg Ile
180 185 190
Ile Ser Thr Arg Ser Lys Ala Gln Leu Ser Ala Thr Phe Asn His Tyr
195 200 205
His Asp His His Gly His Glu Ile Ile Lys Asp Leu Glu Ala Asp Asp
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Arg Ala Ala Ile Glu Cys Leu Lys
225 230 235 240
Pro Arg Glu His Phe Glu Lys Val Leu Arg Leu Ala Ile Lys Lys Leu
245 250 255
Gly Thr Asp Glu Trp Asp Leu Thr Arg Val Val Ala Thr Arg Ala Glu
260 265 270
Val Asp Met Glu Arg Ile Lys Glu Glu Tyr His Arg Arg Asn Ser Val
275 280 285
Thr Leu Asp Arg Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu Lys
290 295 300
Met Leu Leu Ala Leu IIe Gly His Gly Asp Ala
305 310 315
<210>118
<211>1226
<212>DNA
<213>拟南芥
<400>118
ttacttaagt aggacgacgt gcgtctgctt cgtctcatta caaagcagaa gaaacacaaa 60
cagaggcaga gatcttaaga gttaaagact aatcccaaca atggcgtctc tcaaagtccc 120
aagcaatgtt cctcttcccg aagatgacgc cgagcaactc cacaaggctt tttcaggatg 180
gggtaccaac gagaagctga tcatatcaat actagctcac aggaacgcag cacaacgcag 240
cttgatccgc agcgtttatg cagctaccta caatgaggat cttctcaaag cattagacaa 300
agagctttct agcgactttg agagagctgt gatgttgtgg actcttgatc caccagagag 360
agatgcttat ttggctaaag aatccaccaa gatgttcacc aagaacaatt gggttcttgt 420
tgaaatcgct tgcacaaggc ctgctcttga gcttatcaag gtcaagcaag cttaccaagc 480
tcgatacaag aaatcaatcg aggaagatgt cgcgcaacac acatctggtg accttcgtaa 540
gctcttgctt cctcttgtga gcactttcag gtatgaagga gatgatgtga acatgatgct 600
tgcaagatct gaagctaaga tacttcacga gaaggtctca gagaaatctt acagtgacga 660
tgacttcatc agaatcttga caacaagaag caaagcacag ctcggtgcaa cactcaacca 720
ctacaacaac gagtatggaa acgccattaa caagaacttg aaggaagagt cggacgacaa 780
tgactacatg aaactactaa gagctgtaat cacatgtttg acataccctg agaagcattt 840
tgagaaggtt cttcgtctat caatcaacaa aatgggaaca gacgaatggg gactaacccg 900
agtcgtgact acacgaactg aagttgacat ggaacgcatc aaagaggaat atcagcgaag 960
aaacagcatt cctttggacc gtgctatcgc caaagacact tctggtgact atgaggacat 1020
gcttgttgct cttctcggac atggcgatgc ttgaaactgt ttcaactttc gagttcctcc 1080
tttctcttac tgcatggttt gttttaaata aaagagttgt gaaactggtt ctgcaactat 1140
ttatcaatga tcgtttgagt ttgttaaatt tgaatcaaaa tctgtttttc tttcttttaa 1200
atacaatcta aagcacaaac taaagc 1226
<210>119
<211>317
<212>PRT
<213>拟南芥
<400>119
Met Ala Ser Leu Lys Val Pro Ser Asn Val Pro Leu Pro Glu Asp Asp
1 5 10 15
Ala Glu Gln Leu His Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Ser Leu
35 40 45
Ile Arg Ser Val Tyr Ala Ala Thr Tyr Asn Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Ser Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Pro Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Pro Ala Leu Glu Leu Ile Lys Val Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Lys Ser Ile Glu Glu Asp Val Ala Gln His Thr Ser Gly Asp
130 135 140
Leu Arg Lys Leu Leu Leu Pro Leu Val Ser Thr Phe Arg Tyr Glu Gly
145 150 155 160
Asp Asp Val Asn Met Met Leu Ala Arg Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Val Ser Glu Lys Ser Tyr Ser Asp Asp Asp Phe Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Gly Ala Thr Leu Asn His Tyr
195 200 205
Asn Asn Glu Tyr Gly Asn Ala Ile Asn Lys Asn Leu Lys Glu Glu Ser
210 215 220
Asp Asp Asn Asp Tyr Met Lys Leu Leu Arg Ala Val Ile Thr Cys Leu
225 230 235 240
Thr Tyr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ser Ile Asn
245 250 255
Lys Met Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg
260 265 270
Thr Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn
275 280 285
Ser Ile Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr Ser Gly Asp Tyr
290 295 300
Glu Asp Met Leu Val Ala Leu Leu Gly His Gly Asp Ala
305 310 315
<210>120
<211>1172
<212>DNA
<213>烟草(Nicotiana tabacum)
<400>120
ctgcttgcat tttcgagtct tgacaatcat aaaaatggct agtcttactg ttccggcaga 60
agttccttca gtagctgaag actgtgaaca actccgatct gccttcaaag ggtggggaac 120
aaacgagaag ttgatcatat caattttggc tcatagaaat gctgctcaac gcaagttgat 180
tcaacagact tatgctgaga cttttggtga agatctcctt aaagagttgg acagagaact 240
taccaatgat tttgagaaat tggtggtagt gtggacattg gatccttcag aacgcgatgc 300
ctatttggct aaggaagcta ctaagagatg gacaaaaagc aattttgttc ttgtggaaat 360
agcttgtacc agatctccta aagaattggt tttggcacgg gaagcttatc atgctcgtta 420
caagaaatct cttgaagagg acgttgctta tcacactact ggggaacacc gcaagctttt 480
ggtagctctt gtgagctcct atcgatatgg aggagacgag gtggacttgc gtcttgctaa 540
agctgaagct aaaatactgc atgagaagat ctccgataag gcttacagtg acaatgaggt 600
catcagaatt ctagccacaa ggagtaaagc acagatcaat gctactctga atcattacaa 660
agatgaatat gaagaggata tcctaaagca attggaagag ggggatgagt ttgttggact 720
attgagggca accataaaag gtcttgtcta caccgagcac tacttcgtgg aggttcttcg 780
agatgcaatt aacaggagag gaacagagga agatcatctg accagagtta tcgctacaag 840
ggctgaggtt gatatgaaga ctatcgctga tgagtaccag aagagggata gcatccatct 900
gggtcgcgcc attgccaaag atacaagagg agattatgag agtatgttgt tggctctgct 960
tggacaagag gaggactaag aaggatttgc tttataatga ccggaataaa tatgatatcc 1020
cctatatttg agagttggca tccgctgtat gtttgatgat tgagcgtggt ctgtttaacg 1080
tgagcgttga gtccttttct tctcactttg aatatgcaac tttatgctat ctaagaatat 1140
ttttttataa aaaaaaaaaa aaaaaaaaaa aa 1172
<210>121
<211>314
<212>PRT
<213>烟草(Nicotiana tabacum)
<400>121
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Gln Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr Asn Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Glu
130 135 140
His Arg Lys Leu Leu Val Ala Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asn Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Glu Glu Asp Ile Leu Lys Gln Leu Glu Glu Gly Asp
210 215 220
Glu Phe Val Gly Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Thr
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Met Lys Thr Ile Ala Asp Glu Tyr Gln Lys Arg Asp Ser Ile His
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Arg Gly Asp Tyr Glu Ser Met
290 295 300
Leu Leu Ala Leu Leu Gly Gln Glu Glu Asp
305 310
<210>122
<211>1215
<212>DNA
<213>马铃薯
<400>122
atcactctgc attttcgagt cttcacaatc atatcctcct aaccacacac agaagaaaaa 60
aaaatggcaa gtcttacagt tccggcagaa gttccttccg tcgctgaaga ctgtgaacaa 120
ctccgatctg ccttcaaagg atggggaacg aacgagaagt tgattatatc aattttggct 180
catagaaatg ctgctcagcg caaattgatt cgacagactt atgctgaaac ttttggggaa 240
gatctactta aagagattgg gacaggaaga aacttaaccc atgattttga gaaattggtg 300
ctaatatgga cactggatcc gtcagaacgt gatgcctatt tggctaagga agctactaag 360
agatggacaa aaagcaactt tgttcttgtg gagatagctt gtactagatc tcctaaagaa 420
ctggttttgg caagggaagc ttatcatgct cgtaacaaga aatctctcga agaggacgtt 480
gcttatcaca ctactgggga tcaccgcaag cttttggtac ctcttgtgag ctcctaccga 540
tatggaggag acgaggtgga cttgcgcctt gctaaagcag aatctaaagt actgcatgag 600
aagatctccg ataaggctta cagtgacgat gaggtcatta gaattttagc cacaaggagc 660
aaagcgcaac tcaatgctac tttgaatcat tacaaagatg aatatggtga ggatatccta 720
aagcaattgg aagatgagga tgagtttgtt gcactattga gggccaccat aaaaggtctt 780
gtctaccctg agcactattt cgtggaggtt cttcgtgatg caattaacag gagaggaaca 840
gaggaagatc atctgagccg agttattgct acaagggctg aggtcgatct gaagactatc 900
gctaacgagt accagaagag ggatagcatt cctctgggtc gcgccattgc caaagataca 960
ggaggagatt atgagaatat gctggtggct ttacttggac aagaggagga atgaggagga 1020
ttggctcact tctgtgttat aatgaccaga ataaatatgc catctcccat atatttcaga 1080
gttggcatct gtttgatgat tgagtgtggt ctgttttcac atgagctttt agtccttttc 1140
ttcgtgtgag aaactttgaa tatgcatctt tgtgctgtct aaaaatattt tctaaaaaaa 1200
aaaaaaaaaa aaaaa 1215
<210>123
<211>316
<212>PRT
<213>马铃薯
<400>123
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Ile Gly Thr Gly Arg Asn Leu Thr His Asp Phe Glu Lys Leu Val Leu
65 70 75 80
Ile Trp Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu
85 90 95
Ala Thr Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala
100 105 110
Cys Thr Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His
115 120 125
Ala Arg Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr
130 135 140
Gly Asp His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr
145 150 155 160
Gly Gly Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val
165 170 175
Leu His Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile
180 185 190
Arg Ile Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn
195 200 205
His Tyr Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp
210 215 220
Glu Asp Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val
225 230 235 240
Tyr Pro Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg
245 250 255
Arg Gly Thr Glu Glu Asp His Leu Ser Arg Val Ile Ala Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser
275 280 285
Ile Pro Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu
290 295 300
Asn Met Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310 315
<210>124
<211>1176
<212>DNA
<213>拟南芥
<400>124
catacagaaa tttcacttgt tcgaaaaatg gcttctctca aagttcccgc cactgttcct 60
cttcccgaag aagacgctga gcaactctac aaagccttta aaggatgggg aaccaatgag 120
aggatgatca tatcaatctt ggctcacaga aatgcaacgc aacgtagttt cattcgtgcc 180
gtttatgctg ctaactacaa taaggatctt ctcaaggaat tagacagaga gctttccggt 240
gactttgagc gagctgtgat gttgtggact tttgaaccag cggagagaga tgcttatttg 300
gcaaaagaat ctaccaaaat gttcaccaaa aacaattggg ttcttgtcga aatcgcttgt 360
actagatctg ctcttgaact ctttaatgcc aagcaagcat accaagcccg ctacaagacc 420
tccctcgagg aagacgtcgc ataccacaca tctggagaca ttcgaaagct cttggtacct 480
cttgtgagca cttttaggta cgatggagat gaagtgaaca tgacgttagc taggtccgag 540
gctaagatac ttcacgagaa gatcaaggaa aaggcttatg ctgatgatga tctcataaga 600
atcttgacaa ccaggagcaa agcacaaatc agcgcaactc tcaatcacta caaaaacaat 660
ttcggaactt ccatgagcaa atacctaaag gaggattcgg aaaacgaata cattcaattg 720
ctcaaagccg tgatcaaatg cttgacatat ccagagaagt attttgagaa agttctacgt 780
caagccatca acaaattggg aacagatgag tggggactaa cgagagtggt cactacacga 840
gcagagtttg acatggaacg gatcaaagag gaatatatac gtagaaacag tgttcctctt 900
gatcgagcca ttgctaaaga cactcatggt gactatgagg atatacttct cgctcttctc 960
ggacatgacc atgcttgaaa taacatttgc aagttttgtt taagaaaaaa aactaaattt 1020
tatcgctttg tgtttaataa aacagttgtg gttggacttg caacttggtc atgttaagaa 1080
tttagtgtct tcagtttcat ttgtcgtcga tgttttcagt tatttttttt tttaaatcta 1140
aaaattataa aaccatatca aaaattatta ttgatc 1176
<210>125
<211>316
<212>PRT
<213>拟南芥
<400>125
Met Ala Ser Leu Lys Val Pro Ala Thr Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu Tyr Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Arg
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Ser Gly Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Phe Glu Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ala Leu Glu Leu Phe Asn Ala Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Thr Ser Leu Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asp
130 135 140
Ile Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Arg Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Lys Glu Lys Ala Tyr Ala Asp Asp Asp Leu Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Ile Ser Ala Thr Leu Asn His Tyr
195 200 205
Lys Asn Asn Phe Gly Thr Ser Met Ser Lys Tyr Leu Lys Glu Asp Ser
210 215 220
Glu Asn Glu Tyr Ile Gln Leu Leu Lys Ala Val Ile Lys Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Leu Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Phe Asp Met Glu Arg Ile Lys Glu Glu Tyr Ile Arg Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Leu Gly His Asp His Ala
305 310 315
<210>126
<211>1182
<212>DNA
<213>苜蓿(Medicago sativa)
<400>126
ctctcacgtt ccgtctccat cagaagacag tgaacaattg cgcggtgctt ttcaaggatg 60
gggaacgaat gaaggcttga taatatcgat cctggctcat agaaatgcag ctcagcgtaa 120
gtcgatccgc gaaacttaca cgcagaccca tggagaagat cttcttaaag atcttgacaa 180
agaactttca agtgattttg agaaagctgt gctgctgtgg acattggatc cggccgagcg 240
tgatgcattt ttagccaatc aagcaactaa aatgttgact tcaaacaatt cgatcatcgt 300
ggaaattgct tccacaagat ctccacttga acttcttaag gcaaagcaag catatcaagt 360
ccgtttcaaa aagtcccttg aagaagatgt tgcctatcat acttctggtg acatccgcaa 420
gcttttggtt cctcttgtgg gcatacaccg ttatgaggga gatgaggtga acatgacatt 480
ggcaaaatct gaagctaaat tgcttcatga gaagattgcg gataaggctt acaatcatga 540
tgacctgatc aggattgtaa caacaaggag taaagcgcaa ttaaatgcaa ctttgaatca 600
ctataacaat gagtttggga atgtaataga caaggatttg gaaactgatt cggatgatga 660
atatctgaaa ttattgaggg cagcaattaa gggcttgacc taccctgaga aatattttga 720
ggaactcctt aggctggcta taaacaagat gggaaccgat gaaaatgctc ttactagagt 780
ggtgacaact agagctgagg ttgatttgca gcgaattgcg gaggaatacc agagaagaaa 840
cagtgttcct ctggaccgtg caattgacaa agacacttct ggagactatc agaaaattct 900
ccttgcactg atgggacatg atgagtaagt tcttaatctg tccagtagtc atggagtggc 960
tgtttggact atctgttttc ccttcatcat cagcgtgatt ttgctgcgga tctcttgata 1020
gtatacagaa ttcggtgact tgctgtggta actatgcttg tgatatgtat gaactattgt 1080
ggttttaaat aatatgtttt gaatatggac tgaaattcaa aacagaactt tgccttctta 1140
aataatgaaa cagctatcat atttctctcc ttaaaaaaaa aa 1182
<210>127
<211>308
<212>PRT
<213>苜蓿
<400>127
Ser His Val Pro Ser Pro Ser Glu Asp Ser Glu Gln Leu Arg Gly Ala
1 5 10 15
Phe Gln Gly Trp Gly Thr Asn Glu Gly Leu Ile Ile Ser Ile Leu Ala
20 25 30
His Arg Asn Ala Ala Gln Arg Lys Ser Ile Arg Glu Thr Tyr Thr Gln
35 40 45
Thr His Gly Glu Asp Leu Leu Lys Asp Leu Asp Lys Glu Leu Ser Ser
50 55 60
Asp Phe Glu Lys Ala Val Leu Leu Trp Thr Leu Asp Pro Ala Glu Arg
65 70 75 80
Asp Ala Phe Leu Ala Asn Gln Ala Thr Lys Met Leu Thr Ser Asn Asn
85 90 95
Ser Ile Ile Val Glu Ile Ala Ser Thr Arg Ser Pro Leu Glu Leu Leu
100 105 110
Lys Ala Lys Gln Ala Tyr Gln Val Arg Phe Lys Lys Ser Leu Glu Glu
115 120 125
Asp Val Ala Tyr His Thr Ser Gly Asp Ile Arg Lys Leu Leu Val Pro
130 135 140
Leu Val Gly Ile His Arg Tyr Glu Gly Asp Glu Val Asn Met Thr Leu
145 150 155 160
Ala Lys Ser Glu Ala Lys Leu Leu His Glu Lys Ile Ala Asp Lys Ala
165 170 175
Tyr Asn His Asp Asp Leu Ile Arg Ile Val Thr Thr Arg Ser Lys Ala
180 185 190
Gln Leu Asn Ala Thr Leu Asn His Tyr Asn Asn Glu Phe Gly Asn Val
195 200 205
Ile Asp Lys Asp Leu Glu Thr Asp Ser Asp Asp Glu Tyr Leu Lys Leu
210 215 220
Leu Arg Ala Ala Ile Lys Gly Leu Thr Tyr Pro Glu Lys Tyr Phe Glu
225 230 235 240
Glu Leu Leu Arg Leu Ala Ile Asn Lys Met Gly Thr Asp Glu Asn Ala
245 250 255
Leu Thr Arg Val Val Thr Thr Arg Ala Glu Val Asp Leu Gln Arg Ile
260 265 270
Ala Glu Glu Tyr Gln Arg Arg Asn Ser Val Pro Leu Asp Arg Ala Ile
275 280 285
Asp Lys Asp Thr Ser Gly Asp Tyr Gln Lys Ile Leu Leu Ala Leu Met
290 295 300
Gly His Asp Glu
305
<210>128
<211>951
<212>DNA
<213>芜青
<400>128
atggcgtctc tcaaagttcc tgctagtgtt cctcttccag aagaagatgc cgagcagctc 60
cagaaggcct ttaaaggatg gggaaccaac gagaggatga tcatatcaat cttggctcac 120
agaaatgccg agcaacgcag cttcatccgt gctgtttatg ctgctaacta caataaggat 180
cttctcaagg aattagacaa agagctatcc ggtgacttcg agcgagctgt gatgttgtgg 240
acacttgaac cagcggagag agatgcgtat ttggctaagg aatcaacaaa aatgttcact 300
aaagacaatt gggttctagt tgaaatcgct tgtactagat cttcccttga gtttttcaag 360
gccaagcaag cataccaagt tcgctacaag acatctattg aggaagatgt cgcctaccac 420
acatctggag atgtccgaaa gctcttggtt cctcttgtga gtacctttag gtacgatgga 480
gatgaagtaa acatgatgat tgctaagtct gaggctaaga tacttcacga gaagatggag 540
gcgaaggatt acaatgatgg agatctcatt agaatcctga caacaagaag caaagctcaa 600
atcagtgcaa cactcaacca cttcaaaaat aagttcggaa cttccattac aaaatacctt 660
aaagaggatt ccgacaacga atatgttcag ctacttaaag ccgtgatcaa atgcttgact 720
tatccagaga aatattttga gaaagttctt cgtcaagcca tcaacaaaat gggaactgac 780
gagtggggac ttactagagt ggtcaccaca cgagctgagc tcgacatgga acggatcaaa 840
gaggaatact tgcgcaggaa cagtgtccca cttgaccgag ccattgccaa agacactcat 900
ggtgactatg aggatattct tctagctctt atcggacatg gccatgcttg a 951
<210>129
<211>316
<212>PRT
<213>芜青
<400>129
Met Ala Ser Leu Lys Val Pro Ala Ser Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu Gln Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Arg
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Glu Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Lys Glu Leu Ser Gly Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Leu Glu Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asp Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Leu Glu Phe Phe Lys Ala Lys Gln Ala Tyr Gln Val Arg
115 120 125
Tyr Lys Thr Ser Ile Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asp
130 135 140
Val Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asp Glu Val Asn Met Met Ile Ala Lys Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Met Glu Ala Lys Asp Tyr Asn Asp Gly Asp Leu Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Ile Ser Ala Thr Leu Asn His Phe
195 200 205
Lys Asn Lys Phe Gly Thr Ser Ile Thr Lys Tyr Leu Lys Glu Asp Ser
210 215 220
Asp Asn Glu Tyr Val Gln Leu Leu Lys Ala Val Ile Lys Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Met Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Leu Asp Met Glu Arg Ile Lys Glu Glu Tyr Leu Arg Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Ile Gly His Gly His Ala
305 310 315
<210>130
<211>1235
<212>DNA
<213>拟南芥
<400>130
ccttgaggaa aaaaaactaa aacggctcta aattgaaaac aaaagaagag agagagagag 60
agagacgaag aaacagagag attctctcga aaatggccac cattagagta ccaaacgaag 120
ttccttctcc agctcaggat tctgaaactc tcaaacaagc tattcgcgga tggggaacag 180
atgagaaggc gattatacga gttttagggc aaagagacca gagccagaga aggaagatta 240
gagaaagttt tagagagatt tatggcaaag atcttatcga tgttctatcc tccgaactgt 300
ctggtgattt catgaaagct gtggtttcgt ggacgtatga tccagcagag agagacgcaa 360
ggcttgtgaa caagattttg aacaaggaga agaagaagaa aagcttagag aatttgaagg 420
ttatagtaga gatctcttgc acgacttccc caaaccattt gattgctgtg aggaaagctt 480
attgttcact ctttgactct tctcttgaag aacacattgc ttcttctctg ccttttcctc 540
ttgcaaagtt actggtgaca ttggcaagta cattcagata tgacaaagat aggactgatg 600
cagaagtagc tactattgag gcggctatgc tacgtgaagc catagagaag aaacaattag 660
atcatgacca tgtcctgtac atattaggaa cgcgtagtat ctatcagctc agagaaactt 720
ttgttgctta caagaagaat tatggggtca caattgataa ggatgttgat ggatgtccag 780
gagatgctga tctgagaagt ctattgaagg tggcaatctt ttgtattgat actcctgaga 840
aacactttgc aaaggtggta agagattcga ttgagggttt tggaacagat gaggattcgt 900
tgacgagggc gattgtgacg cgtgcagaga tcgatttgat gaaagtaaga ggagagtatt 960
tcaacatgta taatacaagc atggacaatg ctattactgg tgatatttct ggagactaca 1020
aggacttcat tatcacctta cttggatcca aaatctgatc gttctttcgt ttctttgtca 1080
gttgttatat tcttggcttt gcttgtgact tgtataatca atcaatacat tgtattccaa 1140
ctccagtttg aattgtttaa aaaataatca aatttctctt gattcttgca tttttgaatc 1200
aaagcaaatc tatgtttaat tttgttttca aaatt 1235
<210>131
<211>321
<212>PRT
<213>拟南芥
<400>131
Met Ala Thr Ile Arg Val Pro Asn Glu Val Pro Ser Pro Ala Gln Asp
1 5 10 15
Ser Glu Thr Leu Lys Gln Ala Ile Arg Gly Trp Gly Thr Asp Glu Lys
20 25 30
Ala Ile Ile Arg Val Leu Gly Gln Arg Asp Gln Ser Gln Arg Arg Lys
35 40 45
Ile Arg Glu Ser Phe Arg Glu Ile Tyr Gly Lys Asp Leu Ile Asp Val
50 55 60
Leu Ser Ser Glu Leu Ser Gly Asp Phe Met Lys Ala Val Val Ser Trp
65 70 75 80
Thr Tyr Asp Pro Ala Glu Arg Asp Ala Arg Leu Val Asn Lys Ile Leu
85 90 95
Asn Lys Glu Lys Lys Lys Lys Ser Leu Glu Asn Leu Lys Val Ile Val
100 105 110
Glu Ile Ser Cys Thr Thr Ser Pro Asn His Leu Ile Ala Val Arg Lys
115 120 125
Ala Tyr Cys Ser Leu Phe Asp Ser Ser Leu Glu Glu His Ile Ala Ser
130 135 140
Ser Leu Pro Phe Pro Leu Ala Lys Leu Leu Val Thr Leu Ala Ser Thr
145 150 155 160
Phe Arg Tyr Asp Lys Asp Arg Thr Asp Ala Glu Val Ala Thr Ile Glu
165 170 175
Ala Ala Met Leu Arg Glu Ala Ile Glu Lys Lys Gln Leu Asp His Asp
180 185 190
His Val Leu Tyr Ile Leu Gly Thr Arg Ser Ile Tyr Gln Leu Arg Glu
195 200 205
Thr Phe Val Ala Tyr Lys Lys Asn Tyr Gly Val Thr Ile Asp Lys Asp
210 215 220
Val Asp Gly Cys Pro Gly Asp Ala Asp Leu Arg Ser Leu Leu Lys Val
225 230 235 240
Ala Ile Phe Cys Ile Asp Thr Pro Glu Lys His Phe Ala Lys Val Val
245 250 255
Arg Asp Ser Ile Glu Gly Phe Gly Thr Asp Glu Asp Ser Leu Thr Arg
260 265 270
Ala Ile Val Thr Arg Ala Glu Ile Asp Leu Met Lys Val Arg Gly Glu
275 280 285
Tyr Phe Asn Met Tyr Asn Thr Ser Met Asp Asn Ala Ile Thr Gly Asp
290 295 300
Ile Ser Gly Asp Tyr Lys Asp Phe Ile Ile Thr Leu Leu Gly Ser Lys
305 310 315 320
Ile
<210>132
<211>951
<212>DNA
<213>拟南芥
<400>132
atggcaacaa tgaaaatacc aatgacggta ccttctcctc gagtcgatgc tgaccaactc 60
tttaaggcct tcaaaggaag aggctgcgat acttcggtga tcatcaacat cttagctcat 120
cgcaatgcaa cacaacgagc tctcatcgaa caagaatacg aaaccaaatt ctcggatgac 180
ctccgaaaac gtctccactc tgagcttcat ggtcatctca agaaagccgt tcttttgtgg 240
atgcctgaag cagtggagcg agacgcttca atactgaaac gctccttaag aggagccgtg 300
actgatcata aagcgattgc tgagattata tgcacacgat ctggctctca gcttcgtcag 360
atcaaacagg tctactcaaa cactttcggt gtgaaacttg aagaggacat cgaatccgaa 420
gcttctggca atcacaaaag agttttgctc gcgtatttga acactacgcg atatgaagga 480
ccagagatcg ataatgcgag tgtagagaac gatgctagga ctctcaagag cgcggttgca 540
aggaagcata aatctgatga ccagacgttg attcagatat tcactgaccg aagcaggact 600
catttggtcg ctgtaagatc tacttaccgt tccatgtacg gcaaagaact tggaaaggcc 660
ataagagatg agactcgcgg gaacttcgag catgtccttc taacaatttt acaatgtgct 720
gaaaactctt gtttctattt cgcaaaggca ttgaggaaat caatgaaagg attaggaaca 780
gatgacacgg cgttgataag aatcgtggtg acgagagcag aggtggatat gcagttcatc 840
atcacagaat accgtaagag atacaagaag actttgtaca atgctgttca ttctgataca 900
actagtcatt acaggacttt tctcctctct cttttaggcc ccaacgtttg a 951
<210>133
<211>316
<212>PRT
<213>拟南芥
<400>133
Met Ala Thr Met Lys Ile Pro Met Thr Val Pro Ser Pro Arg Val Asp
1 5 10 15
Ala Asp Gln Leu Phe Lys Ala Phe Lys Gly Arg Gly Cys Asp Thr Ser
20 25 30
Val Ile Ile Asn Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ala Leu
35 40 45
Ile Glu Gln Glu Tyr Glu Thr Lys Phe Ser Asp Asp Leu Arg Lys Arg
50 55 60
Leu His Ser Glu Leu His Gly His Leu Lys Lys Ala Val Leu Leu Trp
65 70 75 80
Met Pro Glu Ala Val Glu Arg Asp Ala Ser Ile Leu Lys Arg Ser Leu
85 90 95
Arg Gly Ala Val Thr Asp His Lys Ala Ile Ala Glu Ile Ile Cys Thr
100 105 110
Arg Ser Gly Ser Gln Leu Arg Gln Ile Lys Gln Val Tyr Ser Asn Thr
115 120 125
Phe Gly Val Lys Leu Glu Glu Asp Ile Glu Ser Glu Ala Ser Gly Asn
130 135 140
His Lys Arg Val Leu Leu Ala Tyr Leu Asn Thr Thr Arg Tyr Glu Gly
145 150 155 160
Pro Glu Ile Asp Asn Ala Ser Val Glu Asn Asp Ala Arg Thr Leu Lys
165 170 175
Ser Ala Val Ala Arg Lys His Lys Ser Asp Asp Gln Thr Leu Ile Gln
180 185 190
Ile Phe Thr Asp Arg Ser Arg Thr His Leu Val Ala Val Arg Ser Thr
195 200 205
Tyr Arg Ser Met Tyr Gly Lys Glu Leu Gly Lys Ala Ile Arg Asp Glu
210 215 220
Thr Arg Gly Asn Phe Glu His Val Leu Leu Thr Ile Leu Gln Cys Ala
225 230 235 240
Glu Asn Ser Cys Phe Tyr Phe Ala Lys Ala Leu Arg Lys Ser Met Lys
245 250 255
Gly Leu Gly Thr Asp Asp Thr Ala Leu Ile Arg Ile Val Val Thr Arg
260 265 270
Ala Glu Val Asp Met Gln Phe Ile Ile Thr Glu Tyr Arg Lys Arg Tyr
275 280 285
Lys Lys Thr Leu Tyr Asn Ala Val His Ser Asp Thr Thr Ser His Tyr
290 295 300
Arg Thr Phe Leu Leu Ser Leu Leu Gly Pro Asn Val
305 310 315
<210>134
<211>1337
<212>DNA
<213>拟南芥
<400>134
acagaaacca aaccaagagc cggaaatcaa aaacagtaat aaaagatcaa ctgcaagaaa 60
atggctcttc ctctcgagct cgaaagcctc actgaagcca tctcagctgg gatgggaatg 120
ggagttgatg agaatgcatt gataagcaca ctggggaaat cgcaaaagga acatagaaaa 180
ttgtttagga aagcaagcaa aagtttcttt gttgaagatg aggaaagagc ttttgagaaa 240
tgtcatgatc acttcgtcag acacctcaag cttgagttct cccgcttcaa tactgcggtg 300
gtgatgtggg caatgcatcc atgggagaga gatgcaaggt tggtgaagaa agctttgaag 360
aaaggagaag aagcttacaa cctcatcgtt gaggtctcat gcacacgctc tgctgaggat 420
ctcctcggtg cacgtaaagc ttaccactct ctcttcgacc aatcaatgga agaagacatt 480
gcctctcacg tccacggtcc tcagcgcaag ttgcttgtgg ggctcgtgag tgcttataga 540
tacgaaggaa ataaggtgaa ggatgattct gccaaatccg atgctaagat tctagccgaa 600
gcagtggctt cttcaggcga agaagccgtg gagaaggatg aggttgttag gattttgacc 660
acaagaagca aacttcatct ccaacatctc tacaaacact ttaacgaaat caaaggctct 720
gatcttcttg ggggtgtatc taagtcttct cttctcaatg aagcattgat ttgtttgctc 780
aaaccggctc tgtatttcag caagattttg gatgcgtctc tgaacaaaga cgcagacaag 840
actaccaaga aatggttgac aagagtgttc gttacaagag cagatcatag tgatgagatg 900
aatgagatca aagaagagta caataacctt tatggtgaga ctttggctca aagaatccaa 960
gagaagataa aagggaacta cagagatttc ttgctcacac ttctctccaa atccgattga 1020
tttcgtgttg agaaacctat taccaatact tttggttatt gaagatttat gatttccctt 1080
tttatggttt tatgtttcta attcctaaat ttgcgttttc tctaccgttt ggtaataaag 1140
acatgaaaat ttgatgaact cggtgaatcg agagtaagag ttttgcgatt gtgacaatga 1200
gtgattaata caaggattaa gctccaataa aaaaatgttg cataaatcag aaatgaaact 1260
tgtaactctt cttttcttta tgtgaaactt gtaactctat ttgaaagatt ctatgtgacc 1320
actaaaccga attacgg 1337
<210>135
<211>319
<212>PRT
<213>拟南芥
<400>135
Met Ala Leu Pro Leu Glu Leu Glu Ser Leu Thr Glu Ala Ile Ser Ala
1 5 10 15
Gly Met Gly Met Gly Val Asp Glu Asn Ala Leu Ile Ser Thr Leu Gly
20 25 30
Lys Ser Gln Lys Glu His Arg Lys Leu Phe Arg Lys Ala Ser Lys Ser
35 40 45
Phe Phe Val Glu Asp Glu Glu Arg Ala Phe Glu Lys Cys His Asp His
50 55 60
Phe Val Arg His Leu Lys Leu Glu Phe Ser Arg Phe Asn Thr Ala Val
65 70 75 80
Val Met Trp Ala Met His Pro Trp Glu Arg Asp Ala Arg Leu Val Lys
85 90 95
Lys Ala Leu Lys Lys Gly Glu Glu Ala Tyr Asn Leu Ile Val Glu Val
100 105 110
Ser Cys Thr Arg Ser Ala Glu Asp Leu Leu Gly Ala Arg Lys Ala Tyr
115 120 125
His Ser Leu Phe Asp Gln Ser Met Glu Glu Asp Ile Ala Ser His Val
130 135 140
His Gly Pro Gln Arg Lys Leu Leu Val Gly Leu Val Ser Ala Tyr Arg
145 150 155 160
Tyr Glu Gly Asn Lys Val Lys Asp Asp Ser Ala Lys Ser Asp Ala Lys
165 170 175
Ile Leu Ala Glu Ala Val Ala Ser Ser Gly Glu Glu Ala Val Glu Lys
180 185 190
Asp Glu Val Val Arg Ile Leu Thr Thr Arg Ser Lys Leu His Leu Gln
195 200 205
His Leu Tyr Lys His Phe Asn Glu Ile Lys Gly Ser Asp Leu Leu Gly
210 215 220
Gly Val Ser Lys Ser Ser Leu Leu Asn Glu Ala Leu Ile Cys Leu Leu
225 230 235 240
Lys Pro Ala Leu Tyr Phe Ser Lys Ile Leu Asp Ala Ser Leu Asn Lys
245 250 255
Asp Ala Asp Lys Thr Thr Lys Lys Trp Leu Thr Arg Val Phe Val Thr
260 265 270
Arg Ala Asp His Ser Asp Glu Met Asn Glu Ile Lys Glu Glu Tyr Asn
275 280 285
Asn Leu Tyr Gly Glu Thr Leu Ala Gln Arg Ile Gln Glu Lys Ile Lys
290 295 300
Gly Asn Tyr Arg Asp Phe Leu Leu Thr Leu Leu Ser Lys Ser Asp
305 310 315
<210>136
<211>1110
<212>DNA
<213>拟南芥
<400>136
gtctcatcta gagagctaga gaaatattca gtggtcggag aatggcgtct ctcaaaattc 60
cagcaaatat tcctcttccc gaagaagact ccgagcagct ccacaaggca ttcaaaggat 120
ggggaactaa tgaagggatg atcatatcaa ttttggctca tagaaacgca acgcaacgca 180
gtttcattcg tgccgtttat gctgctaact acaataagga tcttctcaag gaattagacg 240
gagagctttc tggtgacttt gagagagttg tgatgttgtg gactcttgat ccaacggaga 300
gagatgcgta tttggccaat gaatctacca aattgttcac caaaaacatt tgggtcctag 360
ttgaaatcgc ttgtactaga ccttctcttg agtttttcaa gaccaagcaa gcataccatg 420
ttcgctacaa gacctctctc gaggaagatg ttgcatacca tacatctgga aatatccgaa 480
agctattggt tcctcttgtg agcaccttca ggtacgatgg aaatgctgat gaggtcaacg 540
tgaagctggc tagatccgaa gctaagacac ttcacaagaa gatcactgag aaggcttaca 600
ctgatgaaga tctcatcaga atcttgacaa caaggagcaa agcacagatc aatgcaacac 660
tcaatcactt caaggacaag tttggaagtt ccattaacaa gtttctcaaa gaagattcga 720
acgatgatta tgttcaatta ctcaaaaccg cgatcaaatg cttgacatat ccagagaagt 780
actttgagaa ggttctacgt cgagccatca acaggatggg aacagacgag tgggcactta 840
ctagagtggt cactacaaga gcagaggtcg acctggagcg gatcaaagaa gaatacttac 900
gcaggaacag tgttcctctt gatcgagcca ttgctaatga cacttctggt gactacaagg 960
atatgcttct cgcccttctt ggacatgacc atgcttgaaa caacatcatc gtttcatagt 1020
cttttataag acagttgtta tttgtttttc attttctttg aactttggtc cttagttttt 1080
acattttact gcaacaactt attctggttt 1110
<210>137
<211>318
<212>PRT
<213>拟南芥
<400>137
Met Ala Ser Leu Lys Ile Pro Ala Asn Ile Pro Leu Pro Glu Glu Asp
1 5 10 15
Ser Glu Gln Leu His Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Gly
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Gly Glu Leu Ser Gly Asp Phe Glu Arg Val Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Thr Glu Arg Asp Ala Tyr Leu Ala Asn Glu Ser Thr
85 90 95
Lys Leu Phe Thr Lys Asn Ile Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Pro Ser Leu Glu Phe Phe Lys Thr Lys Gln Ala Tyr His Val Arg
115 120 125
Tyr Lys Thr Ser Leu Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asn
130 135 140
Ile Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asn Ala Asp Glu Val Asn Val Lys Leu Ala Arg Ser Glu Ala Lys Thr
165 170 175
Leu His Lys Lys Ile Thr Glu Lys Ala Tyr Thr Asp Glu Asp Leu Ile
180 185 190
Arg Ile Leu Thr Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn
195 200 205
His Phe Lys Asp Lys Phe Gly Ser Ser Ile Asn Lys Phe Leu Lys Glu
210 215 220
Asp Ser Asn Asp Asp Tyr Val Gln Leu Leu Lys Thr Ala Ile Lys Cys
225 230 235 240
Leu Thr Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Arg Ala Ile
245 250 255
Asn Arg Met Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr
260 265 270
Arg Ala Glu Val Asp Leu Glu Arg Ile Lys Glu Glu Tyr Leu Arg Arg
275 280 285
Asn Ser Val Pro Leu Asp Arg Ala Ile Ala Asn Asp Thr Ser Gly Asp
290 295 300
Tyr Lys Asp Met Leu Leu Ala Leu Leu Gly His Asp His Ala
305 310 315
<210>138
<211>951
<212>DNA
<213>拟南芥
<400>138
atggccacca ttgtttctcc tccacatttc tcccctgtcg aagacgctga aaacatcaag 60
gcggcttgtc aaggatgggg aaccaatgaa aatgccatca tctcgatctt aggacaccgg 120
aatttgttcc agaggaagct cataagacaa gcttaccagg agatttacca tgaggatctc 180
attcaccagc tcaaatctga gctctctggc aattttgaga gagctatttg cttgtgggtc 240
ttggatcctc cagagagaga tgctctcttg gctaacttgg ctcttcaaaa gcctattcct 300
gactacaagg ttcttgtcga aattgcctgc atgagatccc ctgaagatat gttagctgct 360
agacgtgctt accgttgcct ctacaagcat tctcttgagg aagacttggc ctcccgtact 420
attggcgaca tcaggagact cttggttgca atggtgtctg cttataaata tgatggagaa 480
gaaattgatg agatgctggc gcaatcagag gctgcgattc ttcatgatga aatccttggt 540
aaggctgttg atcacgaaga aacgatcagg gtgttaagta caaggagcag catgcagctt 600
agcgcaatct tcaaccgcta caaggatata tatggcacat cgatcactaa ggatctcctc 660
aatcacccta caaatgagta cctgagtgca ctacgtgcag ccatcaggtg catcaaaaac 720
cctacccggt attatgcaaa ggttttgcgc aattcaatca acacggtggg gactgatgaa 780
gatgctctga accgtgtgat tgtcacacga gcagaaaagg acctgacgaa tataactggg 840
ctgtacttta agaggaacaa tgtgagtctc gatcaagcta tagcaaaaga gacatcaggg 900
gactacaagg cctttcttct agctttgcta ggacatggaa aacaacttta g 951
<210>139
<211>316
<212>PRT
<213>拟南芥
<400>139
Met Ala Thr Ile Val Ser Pro Pro His Phe Ser Pro Val Glu Asp Ala
1 5 10 15
Glu Asn Ile Lys Ala Ala Cys Gln Gly Trp Gly Thr Asn Glu Asn Ala
20 25 30
Ile Ile Ser Ile Leu Gly His Arg Asn Leu Phe Gln Arg Lys Leu Ile
35 40 45
Arg Gln Ala Tyr Gln Glu Ile Tyr His Glu Asp Leu Ile His Gln Leu
50 55 60
Lys Ser Glu Leu Ser Gly Asn Phe Glu Arg Ala Ile Cys Leu Trp Val
65 70 75 80
Leu Asp Pro Pro Glu Arg Asp Ala Leu Leu Ala Asn Leu Ala Leu Gln
85 90 95
Lys Pro Ile Pro Asp Tyr Lys Val Leu Val Glu Ile Ala Cys Met Arg
100 105 110
Ser Pro Glu Asp Met Leu Ala Ala Arg Arg Ala Tyr Arg Cys Leu Tyr
115 120 125
Lys His Ser Leu Glu Glu Asp Leu Ala Ser Arg Thr IIe Gly Asp Ile
130 135 140
Arg Arg Leu Leu Val Ala Met Val Ser Ala Tyr Lys Tyr Asp Gly Glu
145 150 155 160
Glu Ile Asp Glu Met Leu Ala Gln Ser Glu Ala Ala Ile Leu His Asp
165 170 175
Glu Ile Leu Gly Lys Ala Val Asp His Glu Glu Thr Ile Arg Val Leu
180 185 190
Ser Thr Arg Ser Ser Met Gln Leu Ser Ala Ile Phe Asn Arg Tyr Lys
195 200 205
Asp Ile Tyr Gly Thr Ser Ile Thr Lys Asp Leu Leu Asn His Pro Thr
210 215 220
Asn Glu Tyr Leu Ser Ala Leu Arg Ala Ala Ile Arg Cys Ile Lys Asn
225 230 235 240
Pro Thr Arg Tyr Tyr Ala Lys Val Leu Arg Asn Ser Ile Asn Thr Val
245 250 255
Gly Thr Asp Glu Asp Ala Leu Asn Arg Val Ile Val Thr Arg Ala Glu
260 265 270
Lys Asp Leu Thr Asn Ile Thr Gly Leu Tyr Phe Lys Arg Asn Asn Val
275 280 285
Ser Leu Asp Gln Ala Ile Ala Lys Glu Thr Ser Gly Asp Tyr Lys Ala
290 295 300
Phe Leu Leu Ala Leu Leu Gly His Gly Lys Gln Leu
305 310 315
<210>140
<211>1298
<212>DNA
<213>稻
<400>140
gttgcagatt actaccacca cctccccaaa atcccaatcg aatcgaaatc gaatcgagtc 60
gagtcgccgc cggagccgga gacggaggcg gcagcggcgc agcggtaatg gcgagcctca120
ccctgccgcc ggcgcccacc aaccctcgcc aggacgccat cgacctccac aaggccttca180
aagggtttgg ctgtgatagt acaacagtta taaatatact tactcatcgt gactcgatgc240
aacgcgcgct cattcaacag gaatacagga ctatgtattc tgaggatctc tctcgccgta300
tatcatctga actcagtgga caccacaaga aagcaatgct gctatggatt cttgatcctg360
ctggacgaga tgcaactgtt ttgagagaag ctctgagtgg tgatactatt gacctgagag420
cagccactga gataatatgt tccaggacac catcgcagct gcaaataatg aaacagactt480
atcatgcaaa atttggtact tatcttgagc acgacattgg tcagcgcaca tcaggcgacc540
atcagaagct cttgcttgct tatgtgggga ttccacgcta tgaaggtcct gaggttgatc600
ctactatagt gacacacgat gcaaaggacc tctataaagc tggtgagaaa aggctgggca660
ctgatgagaa gaccttcatc cgcattttca ctgaacgcag ctgggcacac atggcatctg720
ttgcctctgc ttaccatcat atgtatgatc ggtcactgga gaaggttgtg aagagcgaaa780
catctggaaa ctttgaaett gctctgctaa ctatcctcag atgcgctgag aatccagcca840
agtattttgc aaaggtcttg cggaagtcca tgaaaggtat gggcactgat gatagtacac900
ttataagggt tgtagtaaca aggactgaga tcgacatgca atatatcaag gctgagtact960
acaagaaata caaaaaatca ttagctgaag ctatccattc cgagacctca ggaaattatc 1020
gaacattcct cctttctcta gttggtagcc attaggctac atttcgtcga ccctgtggca 1080
cttgacgttc catgactatc ctaaatgcag tggttctacc tggaaactgt aaaatttcgc 1140
catcattgtg ctctctattc gtgtgtgctt gcttaaaaat gtgtgtatat atataacctg 1200
ggcattaaat agttggtgct taatatggtt tggtggttcc atctgacaag tcactcgtta 1260
ctcggtgcat ttattcgaat aagtgatggt atttggtc 1298
<210>141
<211>315
<212>PRT
<213>稻
<400>141
Met Ala Ser Leu Thr Leu Pro Pro Ala Pro Thr Asn Pro Arg Gln Asp
1 5 10 15
Ala Ile Asp Leu His Lys Ala Phe Lys Gly Phe Gly Cys Asp Ser Thr
20 25 30
Thr Val Ile Asn Ile Leu Thr His Arg Asp Ser Met Gln Arg Ala Leu
35 40 45
Ile Gln Gln Glu Tyr Arg Thr Met Tyr Ser Glu Asp Leu Ser Arg Arg
50 55 60
Ile Ser Ser Glu Leu Ser Gly His His Lys Lys Ala Met Leu Leu Trp
65 70 75 80
Ile Leu Asp Pro Ala Gly Arg Asp Ala Thr Val Leu Arg Glu Ala Leu
85 90 95
Ser Gly Asp Thr Ile Asp Leu Arg Ala Ala Thr Glu Ile Ile Cys Ser
100 105 110
Arg Thr Pro Ser Gln Leu Gln Ile Met Lys Gln Thr Tyr His Ala Lys
115 120 125
Phe Gly Thr Tyr Leu Glu His Asp Ile Gly Gln Arg Thr Ser Gly Asp
130 135 140
His Gln Lys Leu Leu Leu Ala Tyr Val Gly Ile Pro Arg Tyr Glu Gly
145 150 155 160
Pro Glu Val Asp Pro Thr Ile Val Thr His Asp Ala Lys Asp Leu Tyr
165 170 175
Lys Ala Gly Glu Lys Arg Leu Gly Thr Asp Glu Lys Thr Phe Ile Arg
180 185 190
Ile Phe Thr Glu Arg Ser Trp Ala His Met Ala Ser Val Ala Ser Ala
195 200 205
Tyr His His Met Tyr Asp Arg Ser Leu Glu Lys Val Val Lys Ser Glu
210 215 220
Thr Ser Gly Asn Phe Glu Leu Ala Leu Leu Thr Ile Leu Arg Cys Ala
225 230 235 240
Glu Asn Pro Ala Lys Tyr Phe Ala Lys Val Leu Arg Lys Ser Met Lys
245 250 255
Gly Met Gly Thr Asp Asp Ser Thr Leu Ile Arg Val Val Val Thr Arg
260 265 270
Thr Glu Ile Asp Met Gln Tyr Ile Lys Ala Glu Tyr Tyr Lys Lys Tyr
275 280 285
Lys Lys Ser Leu Ala Glu Ala Ile His Ser Glu Thr Ser Gly Asn Tyr
290 295 300
Arg Thr Phe Leu Leu Ser Leu Val Gly Ser His
305 310 315
<210>142
<211>1222
<212>DNA
<213>稻
<400>142
ctccccgccg cataaatccc cttcgcctcc ccgccgcgcc ccgcggcgtc gcacgatctc 60
actgaggcat aaagtgagag accgtgattg gatcgatcac cggagcgacg atcaatggcg120
acgctcaccg tgcccgccgc cgtgccgccc gtcgccgagg actgcgagca gctgcgcaag180
gcgttcaaag ggtggggcac gaacgagaag ctcatcatct ccatcctcgc ccaccgcgac240
gcggcgcagc gccgggcgat ccgccgcgcc tacgccgagg cgtacggcga ggagctgctc300
cgcgccctca acgacgagat ccacggcaaa ttcgagaggg cggtgatcca gtggacgctg360
gacccggcgg agcgggacgc ggtgctggcg aacgaggagg cgaggaagtg gcacccgggg420
ggccgcgcgc tcgtcgagat cgcgtgcacg cgcactccat cgcagctctt cgctgcgaag480
caggcgtacc acgagcgctt caagaggtcg ctcgaggagg acgtcgcggc gcacatcacc540
ggcgactacc gtaagctttt ggtgccactt gtgactgtat atcgctatga tgggccagag600
gtgaacacat cgttggcaca ttctgaagcc aaaatactcc atgagaagat ccatgacaag660
gcttacagtg acgatgaaat catcaggatt ctcaccacaa ggagcaaagc acagttacta720
gcaacattca atagttacaa tgatcagttc ggccatccaa tcactaagga tcttaaagct780
gatcctaagg acgagttcct tggtacacta agggcgatca taagatgctt cacttgccct840
gacagatact ttgagaaagt cattcgattg gctctaggag gaatgggcac agacgagaac900
tctcttacaa ggatcataac aactcgtgcc gaggtagacc tgaagctgat aaaggaggcc960
taccagaaga gaaacagtgt cccattggag cgagctgttg ctaaagatac aaccagagac 1020
tacgaggata tactccttgc cctccttgga gcagagtgag gtgtatatct gctccatctc 1080
gtctgtctga tcctccttgt ttgatcggaa aataagatct gcatagaact gtgttctatt1140
ttgttgtttc tgaatgatac aagtgagcta gtctgcatag cagtgctcat ataataaaat1200
ctgtcctgca tactggtttg tc 1222
<210>143
<211>314
<212>PRT
<213>稻
<400>143
Met Ala Thr Leu Thr Val Pro Ala Ala Val Pro Pro Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asp Ala Ala Gln Arg Arg Ala
35 40 45
Ile Arg Arg Ala Tyr Ala Glu Ala Tyr Gly Glu Glu Leu Leu Arg Ala
50 55 60
Leu Asn Asp Glu Ile His Gly Lys Phe Glu Arg Ala Val Ile Gln Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Val Leu Ala Asn Glu Glu Ala
85 90 95
Arg Lys Trp His Pro Gly Gly Arg Ala Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Thr Pro Ser Gln Leu Phe Ala Ala Lys Gln Ala Tyr His Glu Arg
115 120 125
Phe Lys Arg Ser Leu Glu Glu Asp Val Ala Ala His Ile Thr Gly Asp
130 135 140
Tyr Arg Lys Leu Leu Val Pro Leu Val Thr Val Tyr Arg Tyr Asp Gly
145 150 155 160
Pro Glu Val Asn Thr Ser Leu Ala His Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile His Asp Lys Ala Tyr Ser Asp Asp Glu Ile Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Leu Ala Thr Phe Asn Ser Tyr
195 200 205
Asn Asp Gln Phe Gly His Pro Ile Thr Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Gly Thr Leu Arg Ala Ile Ile Arg Cys Phe Thr
225 230 235 240
Cys Pro Asp Arg Tyr Phe Glu Lys Val Ile Arg Leu Ala Leu Gly Gly
245 250 255
Met Gly Thr Asp Glu Asn Ser Leu Thr Arg Ile Ile Thr Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Leu Ile Lys Glu Ala Tyr Gln Lys Arg Asn Ser
275 280 285
Val Pro Leu Glu Arg Ala Val Ala Lys Asp Thr Thr Arg Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Leu Gly Ala Glu
305 310
<210>144
<211>1152
<212>DNA
<213>稻
<400>144
agcacagcac agcacacatc tcgtccagtc catccatggc gagcctgagc gtgccgccgg 60
tgccgacgga cccgcggcgc gacgcgatcg acctccacag ggcgttcaag gggttcggct120
gcgacgccac ggcggtgacc gccatcctcg cccaccgcga cgcctcccag cgcgccctaa180
tccggcgcca ctacgcggcg gtctaccacc aggacctcct ccaccgcctc gccgccgagc240
tctcgggcca ccacaagcgc gccgtcctgc tctgggtgct cgacccggcg tcccgcgacg300
ccgccgtcct ccaccaggcg ctcaacggcg acgtcaccga catgagggcg gccaccgagg360
tggtgtgctc caggacgccg tcgcagctgc tcgtggtgag gcaggcctac ctcgccaggt420
tcggcggcgg cggcggcggc ggcctcgagc acgacgtcgc cgtcagggcg tccggcgacc480
accagaggct gcttctggcg tacctgcgct cgccgcggta cgaggggccc gaggtggtcg540
acatggcggc ggcggcgcgc gacgccaggg agctgtacag ggccggcgag aggcggctcg600
gcaccgacga gaggacgttc atccgcgtct tctccgagcg cagcgccgcc cacatggcgg660
ccgtcgccgc cgcgtaccac cacatgtacg accgctccct cgagaaggct gtgaagagtg720
aaacttcagg gaactttggg tttggcctgc tgacaatcct caggtgcgcc gagagcccgg780
ccaagtactt cgccaaggtg ctccacgagg cgatgaaggg gctgggcacc aacgacacga840
cgctgatcag ggtggtgacg acgagggcgg aggtggacat gcagtacatc aaggcggagt900
accaccggag ctacaagcgc tcgctcgccg acgccgtcca ctccgagacc tccggcaact960
accgcacctt cctcctctcc ctcatcggcc gcgaccgcta acgtcgattg gtttcggtct 1020
ctttgagcgt gtgttaaggg acgcatttgt tccatagcgc acaaacatgg caattattta 1080
tgtgcgtgtg tagtggtgtg ttcgaacgtt cgtttttcgt gtaataaaaa aaattgagtt 1140
tgctgtcttg tg 1152
<210>145
<211>321
<212>PRT
<213>稻
<400>145
Met Ala Ser Leu Ser Val Pro Pro Val Pro Thr Asp Pro Arg Arg Asp
1 5 10 15
Ala Ile Asp Leu His Arg Ala Phe Lys Gly Phe Gly Cys Asp Ala Thr
20 25 30
Ala Val Thr Ala Ile Leu Ala His Arg Asp Ala Ser Gln Arg Ala Leu
35 40 45
Ile Arg Arg His Tyr Ala Ala Val Tyr His Gln Asp Leu Leu His Arg
50 55 60
Leu Ala Ala Glu Leu Ser Gly His His Lys Arg Ala Val Leu Leu Trp
65 70 75 80
Val Leu Asp Pro Ala Ser Arg Asp Ala Ala Val Leu His Gln Ala Leu
85 90 95
Asn Gly Asp Val Thr Asp Met Arg Ala Ala Thr Glu Val Val Cys Ser
100 105 110
Arg Thr Pro Ser Gln Leu Leu Val Val Arg Gln Ala Tyr Leu Ala Arg
115 120 125
Phe Gly Gly Gly Gly Gly Gly Gly Leu Glu His Asp Val Ala Val Arg
130 135 140
Ala Ser Gly Asp His Gln Arg Leu Leu Leu Ala Tyr Leu Arg Ser Pro
145 150 155 160
Arg Tyr Glu Gly Pro Glu Val Val Asp Met Ala Ala Ala Ala Arg Asp
165 170 175
Ala Arg Glu Leu Tyr Arg Ala Gly Glu Arg Arg Leu Gly Thr Asp Glu
180 185 190
Arg Thr Phe Ile Arg Val Phe Ser Glu Arg Ser Ala Ala His Met Ala
195 200 205
Ala Val Ala Ala Ala Tyr His His Met Tyr Asp Arg Ser Leu Glu Lys
210 215 220
Ala Val Lys Ser Glu Thr Ser Gly Asn Phe Gly Phe Gly Leu Leu Thr
225 230 235 240
Ile Leu Arg Cys Ala Glu Ser Pro Ala Lys Tyr Phe Ala Lys Val Leu
245 250 255
His Glu Ala Met Lys Gly Leu Gly Thr Asn Asp Thr Thr Leu Ile Arg
260 265 270
Val Val Thr Thr Arg Ala Glu Val Asp Met Gln Tyr Ile Lys Ala Glu
275 280 285
Tyr His Arg Ser Tyr Lys Arg Ser Leu Ala Asp Ala Val His Ser Glu
290 295 300
Thr Ser Gly Asn Tyr Arg Thr Phe Leu Leu Ser Leu Ile Gly Arg Asp
305 310 315 320
Arg
<210>146
<211>1272
<212>DNA
<213>稻
<400>146
cgggtctcct ctcctccccc gccgacgcgc actcgatccc ccccgcctcc gcctccgcct 60
ccgcctccgc gtcgcccatc tcgagatccc ccgcatggcg acgctcaccg tcccctccgc120
cgtcccgccc gtcgccgacg actgcgacca gctccgcaag gccttccaag ggtggggcac180
gaacgaggcg ctcatcatct ccatcctggc ccaccgcgac gcggcgcagc ggcgcgccat240
ccgccgcgcc tacgccgaca cctacggcga ggagctcctc cgcagcatca ccgacgagat300
ctccggcgac ttcgagaggg ccgtgatcct gtggacgctg gacccggcgg agcgcgacgc360
ggtgctcgcc aacgaggtcg cgaggaagtg gtacccaggg agcgggagcc gcgtgctggt420
cgagatcgcg tgcgcgcgcg gccccgcgca gctgttcgcg gtcaggcagg cctaccacga480
gcgcttcaag cgctcgctcg aggaggacgt cgcggcgcac gccactggtg acttccgcaa540
gctcttggtg ccacttataa gtgcttaccg ctatgagggg ccggaagtca acacaaagtt600
ggcacattca gaagccaaaa ttctgcatga gaagatccag cataaggcat atggtgatga660
tgagatcatc agaattctca ctactaggag caaggctcag ttgattgcga cattcaatcg720
ttacaatgat gaatatggtc acccaatcaa caaggatctc aaggctgatc ccaaggacga780
gttcctttcc acgctgcgtg caatcatccg ctgcttctgt tgccctgaca ggtacttcga840
gaaagtcatc aggttggcca tcgcaggcat gggaacagac gagaactccc tcactaggat900
cattaccact cgtgccgagg tggatctgaa gctgatcacg gaggcgtacc agaagaggaa 960
cagtgtcccg ctggagcgtg cggtcgcagg ggacacctcc ggggactacg agaggatgct1020
tcttgctctt ctgggtcagg agcagtgagc catgcctatc ttgcccagtc acacacttca1080
tgtgatcatg tcatatcaga gaataaacct gttatgcagg ggacacagcc gtggtgatta1140
tgatgttgtt tttccagtgt acggtactgt ttgctgcagc ttgcataaca gtgacgatga1200
aataaatcat agtggaatgc gttggctcat gggacctcac ttattttgca actttttgac1260
aggtcttatt tc1272
<210>147
<211>317
<212>PRT
<213>稻
<400>147
Met Ala Thr Leu Thr Val Pro Ser Ala Val Pro Pro Val Ala Asp Asp
1 5 10 15
Cys Asp Gln Leu Arg Lys Ala Phe Gln Gly Trp Gly Thr Asn Glu Ala
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asp Ala Ala Gln Arg Arg Ala
35 40 45
Ile Arg Arg Ala Tyr Ala Asp Thr Tyr Gly Glu Glu Leu Leu Arg Ser
50 55 60
Ile Thr Asp Glu Ile Ser Gly Asp Phe Glu Arg Ala Val Ile Leu Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Val Leu Ala Asn Glu Val Ala
85 90 95
Arg Lys Trp Tyr Pro Gly Ser Gly Ser Arg Val Leu Val Glu Ile Ala
100 105 110
Cys Ala Arg Gly Pro Ala Gln Leu Phe Ala Val Arg Gln Ala Tyr His
115 120 125
Glu Arg Phe Lys Arg Ser Leu Glu Glu Asp Val Ala Ala His Ala Thr
130 135 140
Gly Asp Phe Arg Lys Leu Leu Val Pro Leu Ile Ser Ala Tyr Arg Tyr
145 150 155 160
Glu Gly Pro Glu Val Asn Thr Lys Leu Ala His Ser Glu Ala Lys Ile
165 170 175
Leu His Glu Lys Ile Gln His Lys Ala Tyr Gly Asp Asp Glu Ile Ile
180 185 190
Arg Ile Leu Thr Thr Arg Ser Lys Ala Gln Leu Ile Ala Thr Phe Asn
195 200 205
Arg Tyr Asn Asp Glu Tyr Gly His Pro Ile Asn Lys Asp Leu Lys Ala
210 215 220
Asp Pro Lys Asp Glu Phe Leu Ser Thr Leu Arg Ala Ile Ile Arg Cys
225 230 235 240
Phe Cys Cys Pro Asp Arg Tyr Phe Glu Lys Val Ile Arg Leu Ala Ile
245 250 255
Ala Gly Met Gly Thr Asp Glu Asn Ser Leu Thr Arg Ile Ile Thr Thr
260 265 270
Arg Ala Glu Val Asp Leu Lys Leu Ile Thr Glu Ala Tyr Gln Lys Arg
275 280 285
Asn Ser Val Pro Leu Glu Arg Ala Val Ala Gly Asp Thr Ser Gly Asp
290 295 300
Tyr Glu Arg Met Leu Leu Ala Leu Leu Gly Gln Glu Gln
305 310 315
<210>148
<211>1491
<212>DNA
<213>稻
<400>148
agtaatacgc aaggaatacc tggatcatac gatacgaata tctagagaca aaacatgatt 60
tgagtgattg atgatcgaga aagaagctca aaaggtcttg aaaagtcgaa acgtccatca120
ctgaaattcg gtttcatgcc ctcagatccc attgctgagt aggacgcaga ttttcttcct180
tcctaccatt tcctttctct tgcttccttt ttggtcattt gagatagctt tatccatcct240
ttagcaaaaa ggaaaccaat agctagcaat acttgccatc atatatacct gggcaatggc300
cggccaagca aactcagttc tctacattga acacttcagg tttgagtaga catggcctct360
cggtgtcttg ttaccacagg ttttgaggat gagtgcagag agatccatga tgcgtgcaac420
cagccacgcc gtttgagcgt tctcttggct catcggagcc catcggagag gcagaaaatc480
aaggcgactt accgtacagt gttcggcgaa gatctcgccg gagaagtgca gaaaatcctc540
atggtcaacc aggaagatga gctctgcaag ctgctctacc tgtgggtgct cgacccgtcg600
gagcgcgacg cgatcatggc tcgggacgcc gtcgagaatg gcggcgccac ggattaccgg660
gtcctggtgg agatcttcac acgccggaag cagaaccagc tcttcttcac caatcaggca720
taccttgcca ggttcaagaa gaacctggag caggacatgg tcacagagcc gtctcatcct780
taccagaggc tattggtagc acttgcaacc tcccacaagt cgcaccacga tgaacttagt840
cggcacattg caaaatgtga cgccaggagg ctctatgatg cgaagaacag cggcatggga900
tcggtcgacg aggctgtcat tcttgagatg ttcagcaaga ggagcatccc acagctcagg960
ctagcattct gcagttacaa gcacatatat gggcatgact acaccaaggc actgaagaaa 1020
aatggcttcg gtgagtttga acaatctttg agggttgttg tgaagtgcat ctacaatcct 1080
tccatgtatt tctccaagct gctgcataga agtctgcaat gctcagcgac caataaaagg 1140
ttggttacaa gggctatttt gggcagtgac gatgtcgata tggacaagat caagtcagtg 1200
ttcaaaagta gttatggaaa ggaccttgag gatttcatcc ttgaaagctt gcctgagaat 1260
gattacagag actttctttt aggtgcggcc aaggggtcaa gggcctcatg aagtctgtgg 1320
agagagatcc ttgaattatc tagggaaagt aaagggtgca tatactgctt tgcatgtaag 1380
agcaaattga ccatcaaaaa cagcagtttt atgttatctg agaataggat ttaggtgaga 1440
acatcatgct cattttgttt attttgggtg aaaaaagtta tcagttcaac t1491
<210>149
<211>319
<212>PRT
<213>稻
<400>149
Met Ala Ser Arg Cys Leu Val Thr Thr Gly Phe Glu Asp Glu Cys Arg
1 5 10 15
Glu Ile His Asp Ala Cys Asn Gln Pro Arg Arg Leu Ser Val Leu Leu
20 25 30
Ala His Arg Ser Pro Ser Glu Arg Gln Lys Ile Lys Ala Thr Tyr Arg
35 40 45
Thr Val Phe Gly Glu Asp Leu Ala Gly Glu Val Gln Lys Ile Leu Met
50 55 60
Val Asn Gln Glu Asp Glu Leu Cys Lys Leu Leu Tyr Leu Trp Val Leu
65 70 75 80
Asp Pro Ser Glu Arg Asp Ala Ile Met Ala Arg Asp Ala Val Glu Asn
85 90 95
Gly Gly Ala Thr Asp Tyr Arg Val Leu Val Glu Ile Phe Thr Arg Arg
100 105 110
Lys Gln Asn Gln Leu Phe Phe Thr Asn Gln Ala Tyr Leu Ala Arg Phe
115 120 125
Lys Lys Asn Leu Glu Gln Asp Met Val Thr Glu Pro Ser His Pro Tyr
130 135 140
Gln Arg Leu Leu Val Ala Leu Ala Thr Ser His Lys Ser His His Asp
145 150 155 160
Glu Leu Ser Arg His Ile Ala Lys Cys Asp Ala Arg Arg Leu Tyr Asp
165 170 175
Ala Lys Asn Ser Gly Met Gly Ser Val Asp Glu Ala Val Ile Leu Glu
180 185 190
Met Phe Ser Lys Arg Ser Ile Pro Gln Leu Arg Leu Ala Phe Cys Ser
195 200 205
Tyr Lys His Ile Tyr Gly His Asp Tyr Thr Lys Ala Leu Lys Lys Asn
210 215 220
Gly Phe Gly Glu Phe Glu Gln Ser Leu Arg Val Val Val Lys Cys Ile
225 230 235 240
Tyr Asn Pro Ser Met Tyr Phe Ser Lys Leu Leu His Arg Ser Leu Gln
245 250 255
Cys Ser Ala Thr Asn Lys Arg Leu Val Thr Arg Ala Ile Leu Gly Ser
260 265 270
Asp Asp Val Asp Met Asp Lys Ile Lys Ser Val Phe Lys Ser Ser Tyr
275 280 285
Gly Lys Asp Leu Glu Asp Phe Ile Leu Glu Ser Leu Pro Glu Asn Asp
290 295 300
Tyr Arg Asp Phe Leu Leu Gly Ala Ala Lys Gly Ser Arg Ala Ser
305 310 315
<210>150
<211>1393
<212>DNA
<213>稻
<400>150
atggaaaaat accatgaaat acaaatggaa aaaatagggt agagcccaga gcattggatg 60
tgcagattaa agctatacta ctagcattca agtttttttc aactctgctg cgtaggaggc120
gtgtgtgtgc catgtgttgc tggtgctgct gcctggactg catccataac atacctccac180
tcaatctcct cttcctccat ttctcccccc attctctctc ctcctcagct gcttctgcag240
gtggaggaga agcagcagca gcagcagctg ttgctcccat ggcttccatc tctgtcccaa300
acccagctcc ttcccctaca gaggatgcag agagcataag aaaggcagtg caaggatggg360
gaacggacga gaatgcgctg atcgagatcc tcggccaccg gacggcggcg cagcgggcgg420
agatcgccgt cgcctacgag ggcctctacg acgagaccct cctcgacagg ctccactccg480
agctctccgg cgacttccgt agcgcgttga tgctgtggac gatggacccg gcggcgcggg540
acgccaagct ggccaacgag gccctgaaga agaagaagaa gggcgagctc cgccacatct600
gggtgctcgt cgaggtcgcc tgcgcgtcgt cgccggacca cctcgtcgcc gtcaggaagg660
cctaccgcgc cgcctacgcc tcgtcgctgg aggaggacgt ggcgtcgtgc tcgctgttcg720
gggacccgct caggcggttc ctggtgcgcc tcgtgagctc ctaccggtac ggcggcggtg780
gcgtcgacgg cgagctggcg atcgccgagg cggcggagct gcacgacgcg gtggtgggca840
gggggcaggc gctgcacggc gacgacgtcg tccgcatcgt cggcacgagg agcaaggcgc900
agctcgcggt gacgctggag cggtacaggc aggagcacgg caagggcatc gacgaggtcc960
tcgacggccg ccgcggcgac cagctcgcgg cggtgctcaa ggccgcgctc tggtgcctca 1020
cctcgccgga gaagcatttc gctgaggtga tccggacatc gattctaggg cttggcaccg 1080
acgaggagat gctgacgaga gggatcgtgt cgcgggcgga ggtggacatg gagaaggtga 1140
aggaggagta caaggtcagg tacaacacca cggtcaccgc cgacgtccgc ggcgacacgt 1200
cggggtacta catgaacacg cttctcaccc tcgtcggccc tgagaagtag ccatgtagca 1260
gcttggacat tttattgctt gctcatttga tttgaacaaa atacaccgtg tgatgttgca 1320
gttattagta aaatgcgagt aggatcgatg ttgttttcgt tgggtggatt aataatggag 1380
catgttttat cgc 1393
<210>151
<211>372
<212>PRT
<213>稻
<400>151
Met Cys Cys Trp Cys Cys Cys Leu Asp Cys Ile His Asn Ile Pro Pro
1 5 10 15
Leu Asn Leu Leu Phe Leu His Phe Ser Pro His Ser Leu Ser Ser Ser
20 25 30
Ala Ala Ser Ala Gly Gly Gly Glu Ala Ala Ala Ala Ala Ala Val Ala
35 40 45
Pro Met Ala Ser Ile Ser Val Pro Asn Pro Ala Pro Ser Pro Thr Glu
50 55 60
Asp Ala Glu Ser Ile Arg Lys Ala Val Gln Gly Trp Gly Thr Asp Glu
65 70 75 80
Asn Ala Leu Ile Glu Ile Leu Gly His Arg Thr Ala Ala Gln Arg Ala
85 90 95
Glu Ile Ala Val Ala Tyr Glu Gly Leu Tyr Asp Glu Thr Leu Leu Asp
100 105 110
Arg Leu His Ser Glu Leu Ser Gly Asp Phe Arg Ser Ala Leu Met Leu
115 120 125
Trp Thr Met Asp Pro Ala Ala Arg Asp Ala Lys Leu Ala Asn Glu Ala
130 135 140
Leu Lys Lys Lys Lys Lys Gly Glu Leu Arg His Ile Trp Val Leu Val
145 150 155 160
Glu Val Ala Cys Ala Ser Ser Pro Asp His Leu Val Ala Val Arg Lys
165 170 175
Ala Tyr Arg Ala Ala Tyr Ala Ser Ser Leu Glu Glu Asp Val Ala Ser
180 185 190
Cys Ser Leu Phe Gly Asp Pro Leu Arg Arg Phe Leu Val Arg Leu Val
195 200 205
Ser Ser Tyr Arg Tyr Gly Gly Gly Gly Val Asp Gly Glu Leu Ala Ile
210 215 220
Ala Glu Ala Ala Glu Leu His Asp Ala Val Val Gly Arg Gly Gln Ala
225 230 235 240
Leu His Gly Asp Asp Val Val Arg Ile Val Gly Thr Arg Ser Lys Ala
245 250 255
Gln Leu Ala Val Thr Leu Glu Arg Tyr Arg Gln Glu His Gly Lys Gly
260 265 270
Ile Asp Glu Val Leu Asp Gly Arg Arg Gly Asp Gln Leu Ala Ala Val
275 280 285
Leu Lys Ala Ala Leu Trp Cys Leu Thr Ser Pro Glu Lys His Phe Ala
290 295 300
Glu Val Ile Arg Thr Ser Ile Leu Gly Leu Gly Thr Asp Glu Glu Met
305 310 315 320
Leu Thr Arg Gly Ile Val Ser Arg Ala Glu Val Asp Met Glu Lys Val
325 330 335
Lys Glu Glu Tyr Lys Val Arg Tyr Asn Thr Thr Val Thr Ala Asp Val
340 345 350
Arg Gly Asp Thr Ser Gly Tyr Tyr Met Asn Thr Leu Leu Thr Leu Val
355 360 365
Gly Pro Glu Lys
370
<210>152
<211>1341
<212>DNA
<213>稻
<400>152
ggtcttttcc ggccgctccc ggcgcccgcc ggccatgtca acaacaagct cgtcaaaaac 60
cgccacgtgc cctctctgcc acgccgacgt gctgctgcca cggcggcggt cagccggctc120
ctcgacgcac agaagccacg acctcgacga cggccccgct ccgccgtcgc cggagtccag180
ctgccgcagc aacgccgcgg tgtgcgggtg cgcccgctgc cggcgccctg atctgatcag240
tcccggaacc ggcatgcgga tgaggaacag attcggcgat ggccccaaca ggatatcagc300
ccagagtgga gcatggctgt gccgagagcg cacggcggag acttgccgga gcacaagtag360
ccggtccggc cgctaccggc gcctgcagcc tgcagcggtc gccggaacac gacgcgccga420
actcataaag cggctgcaag agctctgcca cccagcaaat aaccttccaa attgttctgc480
ttcttggcaa ccacagcgac agcggcagaa aacaattgat cgaattccag atagcctaga540
ttgtggggtg acaatggaaa ggggcaagaa caagcgtgat ggaagtgaca atgggctcat600
cttctctaac ctaatgcacg gtgttgctgc cggcatctat gggtatcctc ctcaccaggg660
atacactcag gctcagagct acctactgct gccggaagca tatccacctc ctccgtggac720
ataccctctt tctagtgctt accctcctca acctgttggt tacccttcag gtggctaccc780
tcctgcagtc tactctgact cgtatctgca ccaaggtagc agagttgcgc gggagcaatg840
ccctctatca tattccaata atgctgtcac ttgcagggag gatgggcaaa tgaactgtga900
aaatggaaca gtaaatatgg agaaaagtgc aatgtcctca aataagatgg ctactagtct960
actaaagagt tgcggcaatg tgatgccatg cagaaatatg gagagaagtg gcccagccat 1020
gtataaggtg gacatgcgcg gcagtacgaa gcaattctct atgggcagca agatgatgat 1080
gtgtctgatt gtgtttggat gtctgatagc tgccttggat atgtttagaa atgttgcaca 1140
aaaacagatg ttttctgtcg ttagtttact ttcttttgta gtcgcgacct atgtctgcta 1200
ggagtctcta catgtaccgt aaaattgctc tttgtgtaat gtgtacttct tcatcctgta 1260
aaaatagaat cccaatcaaa ctatatatgg tttgtctgtc gggctttcaa tacaatctga 1320
gtgtcctctc tttacctttg t 1341
<210>153
<211>388
<212>PRT
<213>稻
<400>153
Met Ser Thr Thr Ser Ser Ser Lys Thr Ala Thr Cys Pro Leu Cys His
1 5 10 15
Ala Asp Val Leu Leu Pro Arg Arg Arg Ser Ala Gly Ser Ser Thr His
20 25 30
Arg Ser His Asp Leu Asp Asp Gly Pro Ala Pro Pro Ser Pro Glu Ser
35 40 45
Ser Cys Arg Ser Asn Ala Ala Val Cys Gly Cys Ala Arg Cys Arg Arg
50 55 60
Pro Asp Leu Ile Ser Pro Gly Thr Gly Met Arg Met Arg Asn Arg Phe
65 70 75 80
Gly Asp Gly Pro Asn Arg Ile Ser Ala Gln Ser Gly Ala Trp Leu Cys
85 90 95
Arg Glu Arg Thr Ala Glu Thr Cys Arg Ser Thr Ser Ser Arg Ser Gly
100 105 110
Arg Tyr Arg Arg Leu Gln Pro Ala Ala Val Ala Gly Thr Arg Arg Ala
115 120 125
Glu Leu Ile Lys Arg Leu Gln Glu Leu Cys His Pro Ala Asn Asn Leu
130 135 140
Pro Asn Cys Ser Ala Ser Trp Gln Pro Gln Arg Gln Arg Gln Lys Thr
145 150 155 160
Ile Asp Arg Ile Pro Asp Ser Leu Asp Cys Gly Val Thr Met Glu Arg
165 170 175
Gly Lys Asn Lys Arg Asp Gly Ser Asp Asn Gly Leu Ile Phe Ser Asn
180 185 190
Leu Met His Gly Val Ala Ala Gly Ile Tyr Gly Tyr Pro Pro His Gln
195 200 205
Gly Tyr Thr Gln Ala Gln Ser Tyr Leu Leu Leu Pro Glu Ala Tyr Pro
210 215 220
Pro Pro Pro Trp Thr Tyr Pro Leu Ser Ser Ala Tyr Pro Pro Gln Pro
225 230 235 240
Val Gly Tyr Pro Ser Gly Gly Tyr Pro Pro Ala Val Tyr Ser Asp Ser
245 250 255
Tyr Leu His Gln Gly Ser Arg Val Ala Arg Glu Gln Cys Pro Leu Ser
260 265 270
Tyr Ser Asn Asn Ala Val Thr Cys Arg Glu Asp Gly Gln Met Asn Cys
275 280 285
Glu Asn Gly Thr Val Asn Met Glu Lys Ser Ala Met Ser Ser Asn Lys
290 295 300
Met Ala Thr Ser Leu Leu Lys Ser Cys Gly Asn Val Met Pro Cys Arg
305 310 315 320
Asn Met Glu Arg Ser Gly Pro Ala Met Tyr Lys Val Asp Met Arg Gly
325 330 335
Ser Thr Lys Gln Phe Ser Met Gly Ser Lys Met Met Met Cys Leu Ile
340 345 350
Val Phe Gly Cys Leu Ile Ala Ala Leu Asp Met Phe Arg Asn Val Ala
355 360 365
Gln Lys Gln Met Phe Ser Val Val Ser Leu Leu Ser Phe Val Val Ala
370 375 380
Thr Tyr Val Cys
385
<210>154
<211>1276
<212>DNA
<213>稻
<400>154
ataggtcaac ttgaatcttg ttcaaaaatt cttttcaagt cttaggtagg tcactgttgg 60
tgccaccttc ttgagaagtt tatgatctgc atgttcacct aagatatcca gtcaagtgct120
aaaaaggtca caaaaatggg aggcagaaag gacaatcatg actcctcaaa tgccgacaaa180
gggttccatg gagcgtatcc aagcggttac cctggtgcat atcccctaat gcaaggatac240
cctaattcac ctggacaata tccgactccc ggtggatacc ctagtgcacc accgggacaa300
tacccaccag ccggtgggta ccctggtgca caatatccac caagcggtta ccctccatca360
caaggtgggt accctccagg agcgtatcca ccatcaggat atccacaaca accaggctac420
ccgccagctg gttacccagg tcatggccat ggtccaccca tgcaaggagg tgggcatggt480
gcaggcgcat ctggctatgg agcgctgctc gccggaggcg ccgcggtggc ggctgctgcg540
gtgggagctc acatggtacg acccggcggc ggtggcggcc acgggatgtt cggccaccat600
ggtggcaaat tcaagaaagg aaagttcaag catggcaagt acggcaagca caagaagttt660
gggcgcaagt ggaagtgata agcaaactaa attgcactgc agtttgcctc cggtttcttg720
tttggttgaa gtgctatagc atgatgggat taagtgtcca tttaccatat atatatatat780
atattcatcg aaatataacc atacgagatc ttattttaaa gataattgta ataaatataa840
tggtgtaatg gatcacaaat tagaaaaaag gtttaggaga aaaaacattt tgagcttgct900
aacagaaaat taaacccacc ataagcaatc agaataggcc acatgtgaat ggctatatcc960
ggttaaatcc gccgaatcca atcatcgaac tcttatttcc cacaaaccaa actcatccag 1020
cctcatgcac ctaactaatc acatccatcc ttagacgatg catgcgtgtg gacattcttg 1080
ccaaaaccaa caattagccg tgagagccca aacaactgag tactccagcc tacgattgtc 1140
aggatatttt ctcatctaac ttattctagt attaggagtt atgaagatat gaaaagccat 1200
tttagttcag aaaattgtac gataaatcat gtaacctgtt tctgaaatgg aaataaaata 1260
tgagaaaaag atacta 1276
<210>155
<211>180
<212>PRT
<213>稻
<400>155
Met Gly Gly Arg Lys Asp Asn His Asp Ser Ser Asn Ala Asp Lys Gly
1 5 10 15
Phe His Gly Ala Tyr Pro Ser Gly Tyr Pro Gly Ala Tyr Pro Leu Met
20 25 30
Gln Gly Tyr Pro Asn Ser Pro Gly Gln Tyr Pro Thr Pro Gly Gly Tyr
35 40 45
Pro Ser Ala Pro Pro Gly Gln Tyr Pro Pro Ala Gly Gly Tyr Pro Gly
50 55 60
Ala Gln Tyr Pro Pro Ser Gly Tyr Pro Pro Ser Gln Gly Gly Tyr Pro
65 70 75 80
Pro Gly Ala Tyr Pro Pro Ser Gly Tyr Pro Gln Gln Pro Gly Tyr Pro
85 90 95
Pro Ala Gly Tyr Pro Gly His Gly His Gly Pro Pro Met Gln Gly Gly
100 105 110
Gly His Gly Ala Gly Ala Ser Gly Tyr Gly Ala Leu Leu Ala Gly Gly
115 120 125
Ala Ala Val Ala Ala Ala Ala Val Gly Ala His Met Val Arg Pro Gly
130 135 140
Gly Gly Gly Gly His Gly Met Phe Gly His His Gly Gly Lys Phe Lys
145 150 155 160
Lys Gly Lys Phe Lys His Gly Lys Tyr Gly Lys His Lys Lys Phe Gly
165 170 175
Arg Lys Trp Lys
180
权利要求
1.相对于对照植物在植物中用于增强产量相关性状的方法,所述方法包括在植物的根中调节,优选增加编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达,其中所述2-Cys PRX多肽从N-末端到C-末端包含(1)质体转运肽;和(2)2-Cys PRX结构域,并且任选地选择具有增加的产量的植物。
2.根据权利要求1的方法,其中所述2-Cys PRX多肽另外地包含下述之一或二者(i)SEQ ID N077所示的基序1,或与SEQ ID NO77具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序;或者(ii)如SEQID NO78所示的基序2,或与SEQ ID NO78具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的氨基酸序列同一性的基序。
3.根据权利要求1或2的方法,其中当例如如图3所描述的那样,将所述2-Cys PRX多肽用于构建系统发生树时,其倾向于与包含SEQ IDNO2中所示的多肽序列的多肽的2-Cys PRX进化枝聚类,而不与任何其它PRX进化枝聚类。
4.根据任一前述权利要求的方法,其中所述2-Cys PRX多肽为下述多肽,其与SEQ ID NO2中所示的2-Cys PRX多肽或者与本文表A1中所给出的任何多肽序列以优选性增加的顺序具有至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更多的序列同一性。
5.根据任一前述权利要求的方法,其中所述编码2-Cys PRX多肽的核酸序列由表A1中所列出的任一核酸序列所表示,或者是其部分,或者是能够与表A1中所列出的任一核酸序列杂交的序列。
6.根据任一前述权利要求的方法,其中所述核酸序列编码表A1中所列出的任何多肽的直向同源物或旁系同源物。
7.根据任一前述权利要求的方法,其中所述调节的,优选增加的,表达由下述任何一个或多个所实现T-DNA激活标签化、TILLING或同源重组。
8.根据任一前述权利要求的方法,其中所述调节的,优选增加的,表达通过在植物的根中引入和表达编码2-Cys PRX多肽的核酸序列来实现。
9.根据任一前述权利要求的方法,其中所述增强的产量相关性状是下述一种或多种(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
10.根据任一前述权利要求的方法,其中所述增强的产量相关性状在非生物胁迫下获得。
11.根据权利要求10的方法,其中所述非生物胁迫是选自下述一种或多种的渗透胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫;优选地,其中所述水胁迫是干旱胁迫和/或减少的养分利用度,优选地减少的氮利用度。
12.根据权利要求10或11的方法,其中所述非生物胁迫耐受表现为选自以下一种或多种的增强的产量相关性状(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW),其中每种均是相对于对照植物。
13.根据权利要求8至12中任一项的方法,其中所述核酸序列与根特异性启动子,优选RCc3启动子,更优选与SEQ ID NO80基本类似的RCc3启动子,最优选如SEQ ID NO80所示的启动子有效连接。
14.根据任一前述权利要求的方法,其中所述编码2-Cys PRX多肽的核酸序列是植物来源的,优选来自双子叶植物,更优选来自芸苔科(Brassicaceae),最优选来自芜青(Brassica rapa)。
15.通过根据任一前述权利要求的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含与根特异性启动子有效连接的编码2-Cys PRX多肽的核酸转基因。
16.构建体,其包含
(a)编码如权利要求1至6中任一项所定义的2-Cys PRX多肽的核酸序列;
(b)一个或多个能够驱动(a)的核酸序列表达的控制序列;以及任选地
(c)转录终止序列;
其中至少一个控制序列是根特异性启动子,优选Rcc3启动子。
17.根据权利要求16的构建体在制备植物的方法中的用途,其中所述植物相对于对照植物具有增强的产量相关性状,所述增强的产量相关性状优选是一种或多种的(i)改善的早期萌发势;(ii)增加的地上生物量;(iii)增加的根(厚和薄)生物量;(iv)每个圆锥花序增加数量的花;(v)增加的种子饱满率;(vi)每株植物增加的总种子产量;(vii)增加的(饱满)种子数;(viii)增加的收获指数;或(ix)增加的千粒重(TKW)。
18.用根据权利要求16的构建体转化的植物、植物部分或植物细胞。
19.产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,所述方法包括
(i)向植物、植物部分或植物细胞中引入和表达编码如权利要求1至5中任一项所定义的2-Cys PRX多肽的核酸序列,所述序列在根特异性启动子的控制下;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
20.根据权利要求19的方法,其中所述增强的产量相关性状在提高的非生物胁迫下发生。
21.相对于对照植物具有增强的产量相关性状的转基因植物,或者来自所述转基因植物的转基因植物细胞或植物部分,其中所述转基因植物是从在根中调节,优选增加,编码如权利要求1至6中任一项所定义的2-Cys PRX多肽的核酸序列的表达来产生的。
22.根据权利要求15、18或21的转基因植物,或来自所述转基因植物的转基因植物细胞或植物部分,其中所述植物是作物植物或单子叶植物或谷物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
23.根据权利要求22的包含编码2-Cys PRX多肽的核酸序列的植物的可收获部分,其中所述可收获部分优选是种子。
24.来自根据权利要求22的植物和/或来自根据权利要求23的植物的可收获部分的产品。
25.编码如权利要求1至6中任一项所定义的2-Cys PRX多肽的核酸序列的用途,其用于相对于对照植物在植物中增强产量相关性状,优选增加下述一种或多种(i)增加的种子饱满率;(ii)每株植物增加的总种子产量;(iii)增加的饱满种子数;(iv)增加的种子总数;(v)增加的千粒重(TKW)或(vi)增加的收获指数。
26.根据权利要求25的用途,其中所述增强的产量相关性状在非生物胁迫下发生。
27.在植物中相对于对照植物增强产量相关性状的方法,所述方法包括在植物中调节编码ANN多肽的核酸的表达,其中所述ANN多肽包含下列一个或多个基序
(i)特征序列1(SEQ ID NO87),
(ii)特征序列2(SEQ ID NO88),
(iii)特征序列3(SEQ ID NO89),
(iv)特征序列4(SEQ ID NO90),
(v)特征序列5(SEQ ID NO91),
(vi)特征序列6(SEQ ID NO92),
(vii)特征序列7(SEQ ID NO93).
28.根据权利要求27的方法,其中所述ANN多肽至少包含膜联蛋白结构域。
29.根据权利要求27或28的方法,其中所述调节的表达通过在植物中引入和表达编码ANN多肽的核酸来实现。
30.根据权利要求27至29的任一项的方法,其中所述编码ANN多肽的核酸编码表B1中所列出的任一蛋白质,或者是此类核酸的部分,或者是能够与此类核酸杂交的核酸。
31.根据权利要求27至30中任一项的方法,其中所述核酸序列编码表B1中所给出的任何蛋白质的直向同源物或旁系同源物。
32.根据权利要求27至31中任一项的方法,其中所述增强的产量相关性状包含相对于对照植物增加的产量,优选增加的种子产量。
33.根据权利要求27至32中任一项的方法,其中所述增强的产量相关性状在非胁迫条件下获得。
34.根据权利要求27至32中任一项的方法,其中所述增强的产量相关性状在干旱条件下获得。
35.根据权利要求29至34中任一项的方法,其中所述核酸与组成型启动子,优选与GOS2启动子,最优选与来自稻的GOS2启动子有效连接。
36.根据权利要求29至34中任一项的方法,其中所述核酸与绿色组织特异性启动子,优选与扩展蛋白启动子,最优选与来自稻的扩展蛋白启动子有效连接。
37.根据任一前述权利要求的方法,其中所述编码ANN多肽的核酸是植物来源的,优选来自双子叶植物,进一步优选来自芸苔科,更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsisthaliana)。
38.通过根据任一前述权利要求的方法可获得的植物或其部分,包括种子,其中所述植物或其部分包含编码ANN多肽的重组核酸。
39.构建体,其包含
(i)编码如权利要求27或28所定义的ANN多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;以及任选地
(iii)转录终止序列。
40.根据权利要求39的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
41.根据权利要求39的构建体,其中所述控制序列之一是绿色组织特异性启动子,优选扩展蛋白启动子,最优选来自稻的扩展蛋白启动子。
42.根据权利要求39至41中任一项的构建体在制备植物的方法中的用途,所述植物相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量。
43.用根据权利要求39至41的任一项的构建体转化的植物、植物部分或植物细胞。
44.产生相对于对照植物具有增加的产量,特别是增加的种子产量,的转基因植物的方法,所述方法包括
(i)在植物中引入和表达如权利要求27或28中所定义的ANN多肽的编码核酸;和
(ii)在促进植物生长和发育的条件下培养植物细胞。
45.相对于对照植物具有增加的产量,特别是增加的种子产量的转基因植物,或来自所述转基因植物的转基因植物细胞,所述转基因植物是从编码如权利要求27或28中所定义的ANN多肽的核酸增加的表达所产生的。
46.根据权利要求38、43或45的转基因植物,或来自其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷物,例如例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。
47.根据权利要求46的植物的可收获部分,其中所述可收获部分优选是种子。
48.来自根据权利要求46的植物和/或来自根据权利要求47的植物的可收获部分的产品。
49.编码ANN多肽的核酸的用途,其用于相对于对照植物在植物中增加产量,特别是增加种子产量。
全文摘要
本发明一般涉及分子生物学领域,并且涉及相对于对照植物增强植物产量相关性状的方法。更具体地,本发明涉及在植物中相对于对照植物增强产量相关性状的方法,这是通过调节、优选增加在植物的根中编码2-半胱氨酸过氧化物氧还蛋白(2-Cys PRX)的核酸序列的表达;或者通过调节植物中编码ANN多肽的核酸的表达。本发明还涉及在根中具有调节的,优选增加的,编码2-Cys PRX的核酸序列表达的植物,或者具有调节的编码ANN多肽的核酸的表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了在本发明方法中有用的构建体。
文档编号C07K14/415GK101688214SQ200880017173
公开日2010年3月31日 申请日期2008年5月23日 优先权日2007年5月23日
发明者崔良燾, 李相烈, 张颢曦, 金玉梅, 许璿美 申请人:克罗普迪塞恩股份有限公司, 植物功能基因组中心