专利名称:水稻叶形调控基因nrl1及其用途的制作方法
技术领域:
本发明属于植物基因工程领域。具体的说,本发明涉及一种利用图位克隆技术克 隆水稻NRLl(NARROW AND ROLLED LEAF 1)基因,以及利用转基因互补实验鉴定该基因的功 能;同时还涉及利用该基因物对水稻叶片大小及卷曲度进行叶形的调控,用于改良水稻品
种以提高产量。
背景技术:
叶片是植物进行光合作用的主要营养器官,也是理想株型的重要组成部分。当前 高产育种中,叶倾角的大小特别是剑叶倾角的大小对水稻光合生产量有重大的影响,而叶 片适当的卷曲或凹凸可造成叶片挺直,减小叶倾角,提高群体的透光率、增加通风度,在中 后期的充足光照下更有利于营养物质向穗部的输送,从而最终提高产量。叶片起始于顶端分生组织外周区的基细胞,这些细胞不断的分化形成叶原基,在 经过近远轴、中侧轴和基顶轴三个轴向的发育后形成完整叶。其中叶片沿着靠近茎和远离 茎的方向分化成基顶轴,而沿着主脉和远离主脉方向的轴则为中侧轴,近远轴则是背面和 腹面的分化。这三个轴向的极性正确分化是形成平展叶的基础,在此过程中发育的异常将 直接影响到叶片的形态建成。叶片在近远轴的极性发生反转可能导致叶片正向和反向的卷 曲、甚至呈现针状、棒状、辐射状。叶片在基顶轴的发育异常将使叶片出现靠近茎的结构,如 叶耳、叶舌、叶鞘与远端叶片的转化。而叶片在中侧轴的异常能够使叶鞘变窄,甚至出现无 叶。目前,国内外科学家们已经对水稻叶片的性状进行了大量研究,但在遗传控制及 分子水平机制的研究相对较少,尤其对叶片形态建成的分子机理研究还很不充分。现已研 究表明水稻中存在多对控制水稻叶片形状的基因,卷叶性状通常由1对或几对基因控制。 虽然迄今为止已报道的水稻卷叶主基因多达12个,但其中3个基因被精细定位,而真正克 隆到的卷叶调控相关的基因仅有2个。基因序列的预测并不一定能获得准确的基因序列 (当然也有预测是准确的);该基因到底是起什么作用,虽然可以通过软件和同源分析推测 该基因的功能,但无法实际证明,并且该基因不一定就是在这个方面起作用。因此,必须要 通过实验获得的基因,并确定该基因编码序列及其产物,同时证明了该基因的用途,在本行 业来说,才是真正获得该基因。
发明内容
本发明要解决的技术问题是提供一种从水稻窄卷叶突变体中克隆的新基因NRL1, 该基因编码一个纤维素合成类似蛋白,主要通过减少叶脉的小脉总数和改变泡状细胞的大 小来调控叶片的宽度和卷曲度。为了解决上述技术问题,本发明提供一种水稻叶形调控基因NRLl编码的蛋白质, 该蛋白质为SEQ ID NO :2所示的氨基酸序列。作为本发明的水稻叶形调控基因NRLl编码的蛋白质的改进氨基酸序列还包括在SEQ ID NO :2所示的氨基酸序列中添加、取代、插入或缺失一个或多个氨基酸或其他物种的同源序列而生成的氨基酸序列或衍生物。本发明还同时提供了编码上述蛋白质的基因,该基因为SEQ ID NO 1所示的核苷 酸序列。作为本发明的基因的改进其核苷酸序列还包括在SEQ ID NO 1所示的核苷酸序 列中添加、取代,插入或缺失一个或多个核苷酸而生成的突变体、等位基因或衍生物。本发明还同时提供了含有上述基因的质粒。本发明还同时提供了含有上述基因的植物表达载体。本发明还同时提供了一种宿主细胞,该宿主细胞含有上述基因序列。作为本发明的宿主细胞的改进该细胞为大肠杆菌细胞、农杆菌细胞或植物细胞。本发明还同时提供了上述NRLl基因的用途用于改良水稻叶宽或卷曲度。作为本发明的NRLl基因的用途的改进用具有SEQ ID NO :1所示的核苷酸序列的 基因转化水稻细胞,再将转化后的水稻细胞培育成植株。本发明的创作过程如下首先获得了一个窄卷叶的突变水稻,由于造成水稻的突 变可能是一个基因,也有可能是好几个基因突变造成的。所以我们通过将突变体与正常水 稻杂交,看后代的分离来确定是一个基因还是多个基因。在确定是一个基因引起外观上的 变化后,我们对该基因进行了分子定位,最后用互补载体,将正常基因的序列通过农杆菌转 入到突变了的水稻中,在转基因水稻植株中,由于转入了一段正常的基因序列,该段序列就 会发挥作用,从而使该基因的外观变得正常。以此来验证该基因所起的作用。进一步具体说明本发明的目的是提供一种从水稻突变体narrow and rolled leaf 1中克隆的新基因NRL1,如SEQ ID NO :1所示的DNA序列,也包括与SEQ ID N0:1所 示的DNA序列至少有70%同源性的基因序列。本发明中的SEQ ID NO :2所示的蛋白质属 于纤维素合成类似蛋白D4(0sCSLD4),其中进行一个或几个替换,插入或缺失所获得的功能 类似物。另外,也包括在SEQ ID NO :1中添加、取代、插入或缺失一个或多个核苷酸而生成 的突变体、等位基因或衍生物,具有相同功能的序列也能达到本发明的目的。本发明的另一个目的是提供一种用NRLl基因进行高效的植物转化的方法,具体 地说,本发明提供了具有SEQ ID NO :1所示的序列的基因或基因部分片段的载体,其中,如 图4所示的pCAMBIA1300-NRLl,该载体可以表达有上述核苷酸序列编码的多肽或其同源类 似物。本发明还提供了一种利用植物表达载体转化植物细胞影响水稻叶片宽度及卷曲 的方法。具体地是利用植物表达载体转化植物细胞以影响农作物叶片形态。实现本发明的具体技术步骤如下一、水稻窄卷叶突变体nrll的分离和遗传分析本发明的水稻窄卷叶叶突变体nrl 1_1来自日本晴的EMS (ethyl methane sulphonate)诱变,突变体与野生型水稻的正反交实验证明该突变体受隐性单基因控制,如 图1所示。二、图位克隆控制水稻叶形的NRLl基因1、NRLl基因的初步定位为了分离NRLl基因,本发明首先组建了定位群体,由nrl 1-1与籼稻品种南京6号(NJ6)杂交组配成F2定位群体,再通过图位克隆的方法,利用均勻分布于全基因组的分子标 记对NRLl位点进行初步定位,将其初步定位在第12染色体,介于HRL9和HRHRL16之间,见 图2。2)、NRLl基因的精细定位通过对HRL9和HRL16两个标记之间的序列分析,发展新的分子标记将NRLl精确 定位于AL845342的BAC上,介于分子标记HA39和HA40之间8. 7Ikb范围之内(图3),通过 分析此区段开放阅读框(ORF)推测候选基因。3)、NRLl基因的鉴定和功能分析 通过转基因技术,结果表明本发明获得了使突变体恢复正常表型的转基因水稻 (图5、6、7),证明了本发明正确克隆了 NRLl基因,氨基酸序列分析表明NRLl编码一个纤维 素合成类似蛋白D4(CSLD4)。综上所述,本发明利用窄卷叶的突变体,通过图位克隆技术首先克隆到了 NRLl基 因,该基因编码一个纤维素合成类似D蛋白(0sCSLD4),并通过叶片的小脉数目和近轴面泡 状细胞的大小来控制水稻叶片的宽度和卷曲度,同时还影响了植株的高度和籽粒的形态。随着我国人口的不断增长、耕地面积持续减少形势下,高产育种一直是水稻研究 的主题。叶片形态是水稻“理想株型”的重要组成部分,也是当前超高产水稻育种关注的重 点。NRLl基因的克隆和应用,能够使稻株能够保持叶片挺直,改善植株的受光姿态,提高光 能利用效率。因而,本发明能对叶形进行改良,最终能提高水稻产量。
下面结合附图对本发明的具体实施方式
作进一步详细说明。图1是水稻反卷横生叶nrll与野生型材料的表型;图2是NRLl基因在水稻第12染色体上的初步定位图;图3是NRLl基因的精细定位图;图 4 是 pCAMBIA1300-NRLl 载体图谱;图5是功能互补实验Ttl转基因水稻植株的表型图;图6是nrll与Ttl转基因水稻植株的叶片表型图;图7是nrll与Ttl转基因水稻植株的叶片横切面表型图。
具体实施例方式实施例1 1、水稻材料本发明中的三个水稻(Oryza sativa L.)窄卷叶突变体nrll (narrow and rolled leaf 1)均是通过EMS (Ethyl Methane Sulphonate)诱变获得。其中nrll_l原始野生材料 为粳稻品种日本晴(Nipponbare)。其等位突变体nrll_2,nrll_3分别为粳稻品种日本晴 和武运粳7号。2、分析和定位群体纯合的nrll-Ι突变体和籼稻品种南京6号进行杂交,F1代自交,得到F2群体,并 从中选出1138株nrll-Ι突变个体作为定位群体。在分蘖期每株取1克左右的嫩叶,用来提取总DNA。3、分子标记定位NRLl基因采用水稻微量DNA的快速提取方法从水稻叶片中提取用于基因定位的基因组 DNA。取大约0. 2g水稻叶片,经液氮冷冻,在直径5cm的小研钵中磨成粉状,转移到1. 5ml 离心管里提取DNA,获得的DNA沉淀溶解于150 μ 1超纯水中。每一个PCR反应用2 μ 1 DNA样品。NRLl基因的初步定位在nrll-Ι与南京6号组合的F2群体中选取193个隐 性个体,组成的小群体进行连锁分析,根据公布的粳稻和籼稻创建的分子遗传图谱,选取 近似均勻分布于各条染色体上的分子标记,利用MJResearch的PTC-200型梯度热循环 仪进行PCR扩增,其中PCR扩增反应总体积为20μ 1,其中包括50mmol/L KCl,10mmol/L Tris-Cl (ρΗ9· 0),1. 5mmol/L MgCl2, 200 μ mol/L dNTP, 50_100ng 的基因组 DNA,1 个单位的 Taq聚合酶和0. 1 μ mol/L引物,其余为去离子水。扩增程序为94°C预变性5min,进入循环 扩增94°C变性lmin,各引物退火温度见表1,退火时间lmin,72°C延伸lmin,循环40次; 72°C延伸lOmin。经5%琼脂糖凝胶电泳分离和溴化乙啶(EB)染色,检测PCR产物的多态 性。最终将NRLl初步定位在第12号染色体HRL16和HRL9标记之间。NRLl基因的精细定位在nrll-Ι与南京6号组合的F2群体中共选取1138株隐性 个体,在初定位的基础上继续设计分子标记,最终将NRLl精确定位于AL845342的BAC上,位于分子标记HA39和HA40之间共 8. 71kb的范围之内。初定位和精细定位的分子标记序列如表1所示。表1、分子标记序列 根据精细定位的结果,在8. 71kb范围内根据Rice Automated Annotation System(http://RiceGAAS. dna. affrc. go. jp)的预测,发现在此区间内只有1个候选基 因,根据两标记剩余的重组个体数及共分离标记,我们设计了该基因的测序引物(如表2 所示),采用PCR法分别从nrll-Ι和野生型品种基因组中扩增出该候选基因进行测序分析。发现三个等位突变体在该个基因的DNA片段中,突均发生单碱基的替换。根据BAC克 隆0SJNBa0027H05序列的基因注释信息(NCBI),预测此基因编码一个纤维素合成类似蛋白 D4(0sCSLD4),该基因与其它物种的纤维素合成类似蛋白D家族的基因具有很高的同源性。表2、测序引物序列 实施例2 植物转化 利用PCR技术将SwaI酶切位点引入pCAMBIA1300载体的多克隆位点中,扩增引物为F :CGAGGTTATGGATCCATTTAAATAAAATCTT,R :GGGAGCATGC CATTTGGTATTC,退火温度为 59. 7°C-59. 8°C。其中前引物含有BamHI (G/GATCC)和SwaI (ATTT/AAAT)的酶切位点,后引 物含有SphI (GCATG/C)的酶切位点。用该引物PCR扩增日本晴基因组DNA,电泳后回收纯 化498bp(命名为SEQ ID NO 3)的片段,将该片段用BamHI和SphI进行双酶切,同时也用 这两种内切酶对PCAMBIA1300载体进行部分酶切,再将两者酶切后大小片段正确的产物连 接,这样就在PCAMBIA1300载体的多克隆位点BamHI之后引入了 SwaI的酶切位点。然后将 BAC克隆0SJNBa0027H05用SwaI和SphI酶切,电泳分离后,割取8. 746kb (命名为SEQ ID NO 4)的DNA片段,连接到改造后的pCAMBIA1300中,获得了转化载体pCAMBIA1300_NRLl, 该克隆覆盖了整个ORF的基因组区域,包括ATG上游2. 3kb启动子序列和2. 5kb的下游序 列。该质粒通过电击的方法转入农杆菌(Agrobacterium tumefaciens)株系EHA105中转 化水稻。我们利用突变体nrll-Ι的幼胚诱导的愈伤组织,经过诱导培养基培养3周后,挑 选生长旺盛愈伤用作转化的受体。用含有双元质粒载体的EHA105菌株侵染水稻愈伤,在黑 暗、25°C条件下共培养3天后,在含有40mg/LHygromyCin的筛选培养基上培养。筛选抗性愈 伤在含有50mg/L预分化培养基上培养10天左右。将预分化的愈伤转至分化培养基上在光 照条件下培养。一个月左右得到抗性转基因植株。对植株进行鉴定和连续的观察,发现植 株叶片恢复了正常形态。与同时期的突变体比较,转基因植株叶片平展不卷曲,宽度正常。以上列举的仅是本发明的若干个具体实施例。有必要指出,本发明不局限于以上 实施例,对于本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变 形,均应认为是本发明的保护范围。序列表SEQ ID NO 11ATGTCGCGGC GGCTGTCGTT GCCGGCGGGG GCGCCGGTGA CGGTGGCGGT GTCGCCGGTG61 CGGAGCCCGG GGGGTGACGC GGTGGTGAGG AGGGGGAGCG GGCTGACGTC CCCCGTGCCG121 AGGCACTCGC TCGGGTCGTC CACCGCCACG CTGCAGGTGT CGCCGGTGAG GCGGAGCGGC181 GGGAGTAGGT ACCTCGGCGC GTCGAGGGAT GGCGGCGCCG ATGAGAGCGC CGAGTTCGTG241 CACTACACCG TGCACATCCC GCCCACGCCC GACCGGGCGA CGGCGTCCGT GGCGAGCGAG301 GCGGAGGCGG CGGCGGAGGC CGAGGAGGTG CACCGGCCGC AGCGGAGCTA CATCTCCGGG361 ACGATATTCA CCGGGGGGCT CAACTGCGCC ACGCGCGGCC ACGTGCTCAA CTTCTCCGGC421 GAGGGCGGCG CCACCGCCGC CTCCAGGGCG GCGGCGTCGG GGAACATGTCGTGCAAGATG481 CGCGGGTGCG ACATGCCCGC GTTCCTCAAC GGCGGCCGCC CGCCGTGCGA CTGCGGGTTC541 ATGATCTGCA AGGAGTGCTA CGCGGAGTGC GCCGCGGGCA ACTGCCCCGG TTGCAAGGAG601 GCCTTCTCCG CGGGCTCCGA CACCGACGAA TCCGACTCCG TCACCGACGA CGACGACGAC661 GAGGCCGTCT CCTCCTCCGA GGAGAGGGAC CAGCTGCCGC TGACATCCAT GGCGAGGAAA721 TTTTCCGTGG TGCACTCCAT GAAGGTCCCC GGCGCCGCCG CCAACGGCAA CGGCAAGCCG781 GCCGAGTTCG ACCACGCCCG CTGGCTCTTC GAGACCAAGG GCACCTATGG CTACGGCAAC 841 GCTCTCTGGC CCAAGGACGG CCACGCCCAT AGCGGCGCCG GCTTCGTCGC CGCCGACGAG901 CCCCCCAACT TCGGTGCCCG CTGCCGCCGC CCCCTCACCA GAAAAACCAG CGTCTCCCAA961 GCCATTCTCA GCCCCTACAG GTACCAAATC CTCCTCAAAA TTTGAACAAT TTCAACAAAT1021 TTTACCAAAT TTGAGCAAAT TGGTTAGCAT TTTGAGGTGG ATTTGTTTTT GATTAGGTTG1081 AATTTTGAAC AATTTCAACA AAATTTACCA AGTTGGTTAG CATTTTGAGG TGGATTTGTT1141 TTTGATTAGG TTGAATTTTG AACAATTTCA ACAAATTTTA CCAAATTTGA GCAAATTTGT1201 TAGCATTTTG AGGTGGATTT GTTTTTGATT AGGTTGTTGA TTGCGATTCG GCTGGTGGCG1261 CTGGGGTTCT TCCTCGCGTG GAGGATTCGG CATCCGAATC CGGAGGCGGT GTGGCTGTGG1321 GCGATGTCGG TGGCGTGCGA GGTGTGGTTC GCCTTCTCAT GGCTGCTCGA CAGCCTCCCC1381 AAGCTCTGCC CCGTCCACCG CGCCGCCGAC CTCGCCGTCC TCGCCGAGCG GTTCGAGTCG1441 CCGACGGCGC GCAACCCCAA GGGCCGCTCC GACCTCCCCG GGATCGACGT GTTCGTCACC1501 AGCGCCGACC CGGAGAAGGA GCCGCCGCTG GTCACCGCCA ACACCATCCT CTCCATCCTC1561 GCCGCGGACT ACCCCGTCGA GAAGCTCGCT TGCTACCTCT CCGACGACGG CGGCGCGCTG
1621 CTGTCGTTCG AGGCGCTCGC CGAGACGGCC AGCTTCGCGC GCACGTGGGT GCCATTCTGC1681 CGCAAGCACG GCGTCGAGCC GCGGTGCCCC GAGGCGTATT TCGGCCAGAA GAGGGACTTC1741 CTCAAGAACA AGGTGCGCGT CGACTTCGTC CGCGAGAGGC GGAAGGTGAA GCGCGAGTAC1801 GACGAGTTCA AGGTGCGGGT GAACTCGCTC CCCGAGGCGA TCCGGCGGCG CTCCGACGCG1861 TACAACGCCG GCGAGGAACT GCGCGCCAGG AGGCGGCAGC AGGAGGAGGC CGCCGCCGCG1921 GCTGCCGCCG GCAACGGCGA GCTTGGAGCG GCGGCGGTCG AGACCGCCGC CGTGAAGGCC 1981 ACGTGGATGT CGGACGGCTC GCACTGGCCG GGGACGTGGA CGTGCCCCGC GGCGGACCAC2041 GCCCGCGGCG ACCACGCCGG GATCATCCAG GCGATGCTGG CGCCGCCGAC CTCGGAGCCG2101 GTGATGGGAG GCGAGGCGGC GGAGTGCGGC GGGCTGATCG ACACCACGGG CGTGGACGTC2161 CGCCTCCCGA TGCTGGTGTA CGTGTCGCGG GAGAAGCGCC CGGGCTACGA TCACAACMG2221 AAGGCCGGCG CCATGAACGC GCTGGTGCGG ACGAGCGCCA TCATGTCGAA CGGGCCCTTC2281 ATCCTCAACC TCGACTGCGA CCACTACGTG CACAACTCGT CGGCGCTCCG GGAGGGGATG2341 TGCTTCATGC TCGACCGCGG CGGCGACCGC GTGTGCTTCG TCCAGTTCCC GCAGCGGTTC2401 GAGGGCGTCG ACCCCAGCGA CCGGTACGCC AACCACAACC TCGTCTTCTT CGACGTGTCC2461 ATGCGCGCCA TGGACGGGCT TCAGGGCCCC ATGTACGTCG GCACCGGCTG CGTCTTCCGC2521 CGCACCGCGC TGTACGGCTT CAGCCCGCCC CGCGCCACCG AGCACCATGG CTGGCTCGGC2581 CGCAGGAAGA TCAAGCTGTT CCTCACCAAG AAGAAGAGCA TGGGCAAGAA GACGGACAGG2641 GCCGAGGACG ACACCGAGAT GATGCTGCCG CCGATCGAGG ACGACGACGG CGGCGCCGAC2701 ATTGAGGCCT CGGCTATGCT ACCGAAGCGG TTCGGCGGGT CGGCGACGTT CGTGGCGTCG2761 ATACCCGTGG CGGAGTACCA GGGTCGGCTG CTGCAGGACA CCCCCGGGTGCCACCACGGC2821 CGCCCTGCGG GCGCGCTCGC TGTGCCGCGC GAGCCGCTCG ACGCGGCGAC GGTGGCGGAG2881 GCCATCGGCG TGATCTCCTG CTTCTACGAG GAGAAGACGG AGTGGGGGCG GCGCATCGGG2941 TGGATCTACG GCTCCGTCAC CGAGGACGTG GTCACCGGCT ACCGGATGCA CAACCGCGGG3001 TGGCGCTCCG TCTACTGCGT GACGCCGCGG CGCGACGCGT TCCGCGGCAC GGCGCCGATC3061 AACCTCACCG ACCGCCTCCA CCAGGTGCTC CGGTGGGCGA CGGGCTCCGT CGAGATCTTC3121 TTCTCCCGCA ACAACGCCCT CTTCGCCTCG CCGCGGATGA AGCTGCTGCA GCGCGTCGCC3181 TACTTCAACG CCGGGATGTA CCCCTTCACC TCCGTGTTCC TCCTCGCCTA CTGCCTCCTC3241 CCGGCCGTCT CCCTCTTCTC CGGCAAGTTC ATCGTGCAGC GACTCAGCGC CACCTTCCTC3301 GCCTTCCTCC TCGTCATCAC CCTCACCCTC TGCCTCCTCG CCCTGCTCGA GATCAAGTGG3361 TCCGGGATCA CGCTCCACGA GTGGTGGCGC AACGAGCAGT TCTGGGTGAT CGGCGGCACC3421 AGCGCGCACC CGGCCGCCGT GCTGCAGGGC CTACTCAAGG TGATCGCCGG CGTGGACATC3481 TCCTTCACGC TGACCTCCAA GCCGGGGAAC GGCGGCGGCG ATGGCGGGGT CGGCGGCGAG3541 GGGAACGACG ACGAGGCGTT CGCGGAGCTG TACGAGGTGA GGTGGAGCTA CCTGATGGTG3601 CCGCCGGTGA CGATCATGAT GGTGAACGCG GTGGCGATCG CGGTGGCGGC GGCGAGGACG3661 CTGTACAGCG AGTTCCCGCA GTGGAGCAAG CTGCTCGGCG GCGCCTTCTT CAGCTTCTGG3721 GTGCTGTGCC ACCTCTACCC GTTCGCCAAG GGCCTCCTCG GCCGCCGCGG CCGCGTGCCC3781 ACCATCGTCT TCGTCTGGTC GGGCCTCATC TCCATGATCA TCTCCCTCCT CTGGGTCTAC3841 ATCAACCCGC CCGCCGGCGC CCGGGAGCGC ATCGGCGGCG GCGGATTCAG CTTCCCATAGSEQ ID NO 2
1 MET Ser Arg Arg Leu Ser Leu Pro Ala Gly Ala Pro ValThr Val16 Ala Val Ser Pro Val Arg Ser Pro Gly Gly Asp Ala Val Val Arg31 Arg Gly Ser Gly Leu Thr Ser Pro Val Pro Arg His Ser Leu Gly46 Ser Ser Thr Ala Thr Leu Gln Val Ser Pro Val Arg Arg Ser Gly61 Gly Ser Arg Tyr Leu Gly Ala Ser Arg Asp Gly Gly Ala Asp Glu76 Ser Ala Glu Phe Val His Tyr Thr Val His lie Pro Pro Thr Pro91 Asp Arg Ala Thr Ala Ser Val Ala Ser Glu Ala Glu Ala Ala Ala
106 Glu Ala Glu Glu Val His Arg Pro Gln Arg Ser Tyr lie Ser Gly121 Thr lie Phe Thr Gly Gly Leu Asn Cys Ala Thr Arg Gly His Val136 Leu Asn Phe Ser Gly Glu Gly Gly Ala Thr Ala Ala Ser Arg Ala151 Ala Ala Ser Gly Asn MET Ser Cys Lys MET Arg Gly Cys Asp MET166 Pro Ala Phe Leu Asn Gly Gly Arg Pro Pro Cys Asp Cys Gly Phe181 MET lie Cys Lys Glu Cys Tyr Ala Glu Cys Ala Ala Gly Asn Cys196 Pro Gly Cys Lys Glu Ala Phe Ser Ala Gly Ser Asp Thr Asp Glu211 Ser Asp Ser Val Thr Asp Asp Asp Asp Asp Glu Ala Val Ser Ser226 Ser Glu Glu Arg Asp Gln Leu Pro Leu Thr Ser MET Ala Arg Lys241 Phe Ser Val Val His Ser MET Lys Val Pro Gly Ala Ala Ala Asn256 Gly Asn Gly Lys Pro Ala Glu Phe Asp His Ala Arg Trp Leu Phe271 Glu Thr Lys Gly Thr Tyr Gly Tyr Gly Asn Ala Leu Trp Pro Lys286 Asp Gly His Ala His Ser Gly Ala Gly Phe Val Ala Ala Asp Glu
301 Pro Pro Asn Phe Gly Ala Arg Cys Arg Arg Pro Leu Thr Arg Lys316 Thr Ser Val Ser Gln Ala lie Leu Ser Pro Tyr Arg Leu Leu lie331 Ala lie Arg Leu Val Ala Leu Gly Phe Phe Leu Ala Trp Arg lie346 Arg His Pro Asn Pro Glu Ala Val Trp Leu Trp Ala MET Ser Val361 Ala Cys Glu Val Trp Phe Ala Phe Ser Trp Leu Leu Asp Ser Leu376 Pro Lys Leu Cys Pro Val His Arg Ala Ala Asp Leu Ala Val Leu
391 Ala Glu Arg Phe Glu Ser Pro Thr Ala Arg Asn Pro Lys Gly Arg406 Ser Asp Leu Pro Gly lie Asp Val Phe Val Thr Ser Ala Asp Pro421 Glu Lys Glu Pro Pro Leu Val Thr Ala Asn Thr lie Leu Ser lie436 Leu Ala Ala Asp Tyr Pro Val Glu Lys Leu Ala Cys Tyr Leu Ser451 Asp Asp Gly Gly Ala Leu Leu Ser Phe Glu Ala Leu Ala Glu Thr466 Ala Ser Phe Ala Arg Thr Trp Val Pro Phe Cys Arg Lys His Gly481 Val Glu Pro Arg Cys Pro Glu Ala Tyr Phe Gly Gln Lys Arg Asp496 Phe Leu Lys Asn Lys Val Arg Val Asp Phe Val Arg Glu Arg Arg511 Lys Val Lys Arg Glu Tyr Asp Glu Phe Lys Val Arg Val Asn Ser526 Leu Pro Glu Ala lie Arg Arg Arg Ser Asp Ala Tyr Asn Ala Gly541 Glu Glu Leu Arg Ala Arg Arg Arg Gln Gln Glu Glu Ala Ala Ala556 Ala Ala Ala Ala Gly Asn Gly Glu Leu Gly Ala Ala Ala Val Glu571 Thr Ala Ala Val Lys Ala Thr Trp MET Ser Asp Gly Ser His Trp586 Pro Gly Thr Trp Thr Cys Pro Ala Ala Asp His Ala ArgGly Asp601 His Ala Gly lie lie Gln Ala MET Leu Ala Pro Pro Thr Ser Glu616 Pro Val MET Gly Gly Glu Ala Ala Glu Cys Gly Gly Leu lie Asp631 Thr Thr Gly Val Asp Val Arg Leu Pro MET Leu Val Tyr Val Ser646 Arg Glu Lys Arg Pro Gly Tyr Asp His Asn Lys Lys Ala Gly Ala661 MET Asn Ala Leu Val Arg Thr Ser Ala lie MET Ser Asn Gly Pro676 Phe lie Leu Asn Leu Asp Cys Asp His Tyr Val His Asn Ser Ser691 Ala Leu Arg Glu Gly MET Cys Phe MET Leu Asp Arg Gly Gly Asp706 Arg Val Cys Phe Val Gln Phe Pro Gln Arg Phe Glu Gly Val Asp721 Pro Ser Asp Arg Tyr Ala Asn His Asn Leu Val Phe Phe Asp Val736 Ser MET Arg Ala MET Asp Gly Leu Gln Gly Pro MET Tyr Val Gly751 Thr Gly Cys Val Phe Arg Arg Thr Ala Leu Tyr Gly Phe Ser Pro766 Pro Arg Ala Thr Glu His His Gly Trp Leu Gly Arg Arg Lys lie781 Lys Leu Phe Leu Thr Lys Lys Lys Ser MET Gly Lys Lys Thr Asp796 Arg Ala Glu Asp Asp Thr Glu MET MET Leu Pro Pro lie Glu Asp811 Asp Asp Gly Gly Ala Asp lie Glu Ala Ser Ala MET Leu Pro Lys826 Arg Phe Gly Gly Ser Ala Thr Phe Val Ala Ser lie Pro Val Ala841 Glu Tyr Gln Gly Arg Leu Leu Gln Asp Thr Pro Gly Cys His His856 Gly Arg Pro Ala Gly Ala Leu Ala Val Pro Arg Glu Pro Leu Asp871 Ala Ala Thr Val Ala Glu Ala lie Gly Val lie Ser Cys Phe Tyr
886 Glu Glu Lys Thr Glu Trp Gly Arg Arg lie Gly Trp lie Tyr Gly901 Ser Val Thr Glu Asp Val Val Thr Gly Tyr Arg MET His Asn Arg916 Gly Trp Arg Ser Val Tyr Cys Val Thr Pro Arg Arg Asp Ala Phe931 Arg Gly Thr Ala Pro lie Asn Leu Thr Asp Arg Leu His Gln Val946 Leu Arg Trp Ala Thr Gly Ser Val Glu lie Phe Phe Ser Arg Asn961 Asn Ala Leu Phe Ala Ser Pro Arg MET Lys Leu Leu Gln Arg Val976 Ala Tyr Phe Asn Ala Gly MET Tyr Pro Phe Thr Ser Val Phe Leu991 Leu Ala Tyr Cys Leu Leu Pro Ala Val Ser Leu Phe Ser Gly Lys
1006 Phe lie Val Gln Arg Leu Ser Ala Thr Phe Leu Ala Phe Leu Leu1021 Val lie Thr Leu Thr Leu Cys Leu Leu Ala Leu Leu Glu lie Lys1036 Trp Ser Gly lie Thr Leu His Glu Trp Trp Arg Asn Glu Gln Phe1051 Trp Val lie Gly Gly Thr Ser Ala His Pro Ala Ala Val Leu Gln1066 Gly Leu Leu Lys Val lie Ala Gly Val Asp lie Ser Phe Thr Leu1081 Thr Ser Lys Pro Gly Asn Gly Gly Gly Asp Gly Gly Val Gly Gly1096 Glu Gly Asn Asp Asp Glu Ala Phe Ala Glu Leu Tyr Glu Val Arg1111 Trp Ser Tyr Leu MET Val Pro Pro Val Thr lie MET MET Val Asn1126 Ala Val Ala lie Ala Val Ala Ala Ala Arg Thr Leu Tyr Ser Glu1141 Phe Pro Gln Trp Ser Lys Leu Leu Gly Gly Ala Phe Phe Ser Phe1156 Trp Val Leu Cys His Leu Tyr Pro Phe Ala Lys Gly Leu Leu Gly1171 Arg Arg Gly Arg Val Pro Thr lie Val Phe Val Trp SerGly Leu1186 lie Ser MET lie lie Ser Leu Leu Trp Val Tyr lie Asn Pro Pro1201 Ala Gly Ala Arg Glu Arg lie Gly Gly Gly Gly Phe Ser Phe ProSEQ ID NO:31 CGAGGTTATG GATCCATTTA AATAAAATCT TTAAAAAATC AGGACATAGA TCAAAAGTAG61 TCTTATAGAA AATCAGCTTT TTGTTACTTG CTTTTTCCCG TAGTACAGAG AATAAAATAA121 TAAAAAAAGA GGGGCTTGTC TTACCGAGAA AAATAGAAAA ATAGGGCAAT AGTCTTCTTT181 TTCTTTGGCC AAGCGATAAG CAGAATCCAG CTTTCTATTC CCACTAGCTG TACTGGCCCA241 AACATTGTAC TTAATGCTCC TATGTACATG GTCCTCAGTG TAGGACTTTA TTACAAAAAA301 TTTTGCATCC TTGTATTCAG TGACAAAATC AGGGCGATTA TACAGTTCAC TATCAACCAG361 AGGAACATTT TTCTCATTTT TGTCATCTAT TGAAGAGTTC TCTGTGTCTT GTTTCTTTGG421 TTTTGTAGCA CGTGGCCCAC GGTTTTGCTC ATTCAGGAAC TCAAGAGCAC CATTCTGAAT481 ACCAAATGGC ATGCTCCCSEQ ID NO 41 GCCGGGGAGT CACGACCATT GCGGGCACCT GTTGAGTCCG GGTACATGTA TGGGCCGGCG61 ACTGCAACAG AGTGTCGTAG ACGACGCTCA GTTGCACTCC ATGACTAGCC CTATTGGCGA121 GTCGACTCTG CATCACGGTT TCCAGCTTTT TCAAGGTCGG GCGGATTCGT GCTGCTAGGC181 AAGGGAGAAA TGGAGCCCCT CTCCACCCGG ACCTGGCACT TCGACCAACG GATTCTCCTT241 GCGCAGTACA TTTGTTGGAT CGCGCGACCA GCCCTTGTAT TCGTCCCGCA TGAAGCGACG301 AACTCGATGG CACTGAGAGA AAGCAGATAG AATCGAGAGA ATGTCTGATC AGGCCGCCAA361 TCTCAAGCGC ACAGAGGGCA GGTAGTTCTC GACGTACCTG TCAGGCGTGC CCGGGGAACA421 AGTGAGGGAG GGTATCATAG TGACCCGGAC ATCTGCGAGC CTTCTTTAAACATCCAGCCG481 GAATATTTCC GGATGACGTT GACCGGTGCA GCCCGCGGAA AGCTGCAAAC CGAGCAGCAG541 GGGGGTTACC CCTCAGAGGT ACAGCTTCCA CCCGCGGCTG GCACAAGAGG GAGATGTGTT601 TTAGACACCT CACAGTGCAA CGGCTAAAGC GCGGCACGCC TGCTAGGGCC CAAATCGTCT661 AGCAGAAGCG AATGGACGCC GTACAAAAAC AGCGCGTATC TACCCGGGTC CACTCAGTGG 721 CACGACGCTC ACGGGACTAC ACAACCTAGT CCAAGATGCC GCGCGAGCGA AACTGATGAC781 GATCAGACTA GCGACTGTAC GCTAGAGGGG TTCTACTCCA GCTCGAGTCC AACTCGTTGG841 GTCTGAGCTT CAGTCTAGCA TCGGACGAAC GCTTATAGTT AACCTGGGCA GGGTAGTCAC901 GCGCGCGTCG CCAGGGCCGG CTACCGTTAC TTTGAATTTA ATTTGCTTCA CTGCAACCAC961 ACTTCCTGGT GATCTGTAGG AAAAGCGGTG GATATTTGAG TGGGTGATGA TAAAGTCGTG1021 GTCGGATGCG CCCAAGCTAC AAACTGAGAA ACCGCGCGGG GTTCCGTCCG CGGTAATTGC1081 CGCCCCCCCG GTGAATTCCC TCCCGTTACG GGGGCACTGA GGCTACCCGC CACCGTGGCT1141 TGCAAGGGTT TCATAGCCGA ACCACGCCGC AAAAACACCC GTAATCGCCT GGGATCCAAT1201 GGGCCACGAT GTTGTCAGGC GCTAACGCTA CCGAAACAAA CCCGTAGATG TCTTCCGACG1261 ACCTTTGCTG TGACTTTGTG CCTTAGAGGC TCACTCATCC TTCTGCATGA TTGCGCCCGA1321 TGCGGCTAAC TGAATGAATT GCTCCGCATT ATATGGCGAT GATGTGCGCC CGTGCTCCGC1381 CTGGGTACCT AGGCCTTTAA CGGATCCGCA GCACGAAGGC CCCTGTTTCG CACTCGTGTG1441 GTGTAATAAT TGGGAGGATT AGATGTTGAG AGCTTAGCTC GCGTTCAAGA GCAGTGACCA1501 GATTCTCCTA CGTGACCCTT CATCATGAGT TTTCGACCGG CCACCCTCTA AAAGGTGGGG1561 AGCCATGGTT CACCTTTGTG CTAGATCAGC GAGAGGTAAC TCGTATTCGT AACGCGAATT
1621 CTAGGGCGAA TCCCGATCCG GGGTCACAAG GGTCACCGAT TTTCGGTTAC CTCAACACGT1681 GTAGCAAGGA CGGTCCGGCA GGGCACGCTT GGATTGGAGG GATACAGTTA TAGTTGCTGT1741 GGCTACGGAC GTTCTAACAA CGAACCTGGA GGCTATTACC GCCCATAGAC GGCCCCGTCC1801 CGCAGACCAT ATTCCCTCCG GCGACGTCGA CTGGCTAACC TCCGGAGATC ATAACTAGGG1861 CCCTGGGGCC GGGTTCGTGG CAAGGGTGTA ATATGTGGAC AGAAGGGCCA ACACCCATAG1921 CCTCAGTCCG GTTGGAAAGC GCACGATCGC CAGTCGAGTC CGGGAGACTT GGGCAATTAT1981 CAAGAATAGT CGAACAGCCT TCAGTCCCTG CGTCCGCATG TGGTTACCTG TGCAGCCAGC
2101 CCTCACTTTG AAACAGAATA TCCGCGGCCG GTACTATCAA CTACACTCGA ATGCCACCTG2161 GGCTCCTTGA CATAACCCTC TAATGGCGCC CTAGCACCTT ACATAGCGTT ACACAGCGGT2221 CTCGAGCAAG CTATTGGCGT GAGCTACGTT AAACTCCCAT GGAAAGCCGG CATCATCCTA2281 TGGACCACCT GAGCTCGCCG TTCACTAAGT TTTTGCCCGC AAATCCTTAC CACTCCGCGT2341 CAGACCAATA CGATAAGGCA CGGGTGCGGA TTCATTCCGG CCGGCTATTG ATAGCTAGGA2401 ATTATGTTCT TAGCAATTTA TTCTTGAGTA GCCCCCAAAC ATGCAATCTA AAGTTCACAA2461 GTGTGAGGTC TTGCCATGTA ATTTGAGGCA AACTGTGCAC ATGGCCTTCG ACGCGTATAG2521 TTACTGGTAA GGCCGAATGC AATGCCCATC GCCCGGAATA GTCAAAGCTG TCAGGGCCTA2581 AGTAGTCATT CTTCAGGGTC AAAGACCTTA AGGATTACGA CGGGTTCCTA ACACCAATGA2641 GATACCGCTG CCTCGTAAAA TTCCAAATCT CGCGGCCCTA CGAGCTCAGG CGGGGCTGAT2701 TTCGTACCCA TGCGCTTCCA CATGGCCTAG GTTAACTGCC GAGGACTTAA CGGGATAAAG2761 GAGGATTGGG GCGACGACAA GATCAGGCGA GCACCGGGAA TACATTTCTAGGGTCTGCCT2821 CAACTACGAC ACATCGGGCG GGGTCAGTCG CTCGGGCGCA TGCACGGGGC TGGTATCGGT2881 TCACTGCTTA CATGTTGGAT AGCCACCTAG ATACGGAGTC GGGCCTCGCT TAGAGTCGGA2941 GGTGCGAAGC ATGTACTCTC AGGCAGAGCT CGTGGCCCAT ACTCGGACAC GCTCTGGTAT3001 GGGCGAGAAA AGGCGGCGCT CGCTGGACTG CATGCAGAAA AACTACCTCC CATGCTGTAT3061 GGATACGGCC AGTCACGATA TGGGTGCTCT CAGGTCTTCG GACGAGCGCT CGGACGATCT3121 AAGTAGGTCT CCAAAACTCG CAGGGTAAAG CCCTTGACGG CTGGACAGCG CTAATCGCCT3181 CCGCCGGGAG CCCAACTAAC TCAATTCGAG GTTTCTTACT TGCGGTGTGA TTCAAGCGCA3241 GTCACCAAAG AGTGTAACGA AACAGCTCTA CGGCACATGG CCCTTCCCAC ATCGAAGGTC3301 ACCCGGTCCC ATCTACCCAG ATTACGCATA ACTAGCGATT TCACCGCTCG GATCCCAGCA3361 AGGGGTATGC TGATTGAATA ATAGGCGTAC TTTCAAGGCT AAGTACGCGG AGCCTGATGA3421 TCCGCAATCA CCTGATAAAT ACCGCGAGCT GCGGTATAAA CGGGCCCCTG TTCAACGCCT3481 GTTTAGTTCA GTGTATAATA AGCGCTGGCG ATCATTCCCA ACCTTCTCTG ACCGCGGCGT3541 TCTCGCTAGG CTCTATTTGT AGGTCAAAAG TTCAGTACTT GCGTGTGGGG GAACGCATAC3601 TCAGAGCCCA TGTCATATGT CCTCATGTAT GGAGTGGATC CGTCTAAGCT GCGTTGGGTC3661 TCCCCTACGG AAGGAGCCGG GCAAAACAGT TTGACGATTA ACAAGAGATG ACCTCCCAGC3721 GGCTGTGGTT TAACCGCGCG CACCGTTAAC AACTAAAGCA GCCGAAGTTC GCGTACTGCG3781 TCTTCGTCGT CGTGTTACCT GTTCACCATT TGATGTCAGA ACAGATGCCG CGGTCCTTCA3841 TAACAGTCAG CCCTCCTCAC TGAGGAGCAC GGTCCGTGAG AGGTTTTCGG TCAGGCATGC
3901 ATTTAAACGA TCTAGCAATA TCTCTTCTAG CGTACTCTAC GCGCCCGGTG CCCGACTTCC
3961 TGGCACTGGA GAGCACGTGG GGTTTGAAGG GCGAGCAGCC CGTTTTAGGC GAGGCAGGAC4021 TGCGAGCGCT GAGGCGCGCG GGCTAAGCGC CTGGCCAGAT TATGGGTAAC ATGGAGTGTA4081 ACGAACTAAC ACCCTGGCCC CTCAACAAAT AAACCGTTCA GGGTTTGATT TTTAAAATGG4141 GTCGGCCTCG TTCGGTTGGC TCCCAAGCAA TAGCGGCCAG CAATGCAACC AGGGGTACCG4201 TCAGGGACGG GGAGAAGTAT TGCGGGCCGG CGTTTTGCCC CGTGGAGGTA GTCGCGCTGA4261 TGGTCAAAAC ACTGCCTGAA ACAGCTCTAT GCCCTGCAAC GACTTCAGGC CACCGTGGGA4321 AGTCAAGGCC TACTACGATT GCTGTACTAT TAAGGGACGT CATGACGCAA AGTTCCGTCA4381 GGGCGTGTAG TCCGCGTCGG GAGCTTGGCG GCGAATAGTA ACTTTATGGC AGATGCTTAC4441 GAGTCGATAA CACTACATCA GGGACCCCTG CGTACCAATG ATGTCAAAAT GAGGACCTAC4501 GCCGCAGAGG ATAGCCGTCC ACTTAAAAAT TGTGTCGTGC TTGCGGTCGC CAGTCGACGC4561 CCGCGCACGA GGGGCTGGTA CCGAGGGGCC GGCCCCTAAT TGAGTAGGTC CCATGCGGGC4621 GCACAGGAGC CCACGTACCG CGAGGAGAAG CTCTCCGATT ATGGCGGACG GAGGGCCACC4681 GTCCCCAGGC GGGCCTCATC CGTAGCGTCC CCTCCAAAGT GACCTGGCTC AGGAAGACCA4741 GTGCGCGGGG CCCCGTAGTT AACTAGCGAC GAGGAATTGC ATCATGGTAT CGGTCTCTAA4801 CAGCCAGCTG CCCCAACCGG GTCACGAGGA TAACGGCTTG AATGGCTATG GTACATGCTC4861 CTGGCGCTGT GGCTCGCGGA ATGATACCAG TTAAAGTCAT CGGAATGCGG CAGGATAGGA4921 CGGTGCCGCG AATAGGGGTG CGGGCAAGGG GGGGCCAGCC AGTGCTAGTG CAGCACAAGA4981 TCATTCCAGC CATCAATAAC AGGAACCAAT TTAGGGTCCT ACAGAATATG CGGCCCGGCC5041 ATTGTCCGTG AAGTGGTGGT GTAAAAGTGG AATGAGAGAA GGCCCATGGG TGCGTTTACT5101 AGGGGAATAA GGCCTTCGTA TCGTTACTGA AGCCATAGGT TCGGGCCTACTCCCTCGGGG5161 GCAGACCACG CCTTTGGAGC CGCCAGATGC GTAGAATCGG TCCGATACAA TGTGAGAGCG5221 CCTATTTCGC GAGCAACCTA ACATTGGCGT GTTCTGCGCC GTCGGCCGAG GGCTACATAA5281 CCTGTTTCCG AGACGGCTGA AGGGGGATTC TCAGGATCGG ACTTGGGCCA GCAAGAGGCC5341 CGTTCAACGT TTTCGGACTC CTTGAGGCCC TCACCGGGGC ACAACGGGAA GCTGAAAGAC5401 CCTAAGATGC TTTCGCCCCA TGAAAGGGGC AGAGAGAATC GCGACCCTAG CTGCTAAAAA
5461 GTATGGCGAT CTAGGCAAGT CAAAGTGAGG GCACCGCGCC CAGCTACTCG GCACGTATAT5521 GTTAGTTAAG GCCGACTTGA TGAACAGTCT CCCTTGGTCG ACAAGGGGAT GGGGCTCACG5581 AAAGTCGCAT TTTGCGCCAG ACCAGAAGAC AGGCGTGGGG GGCTCTAAGG GGCCGACCAG5641 AATTCGAAAG TCGACTCTCG TCGTCCGTAG GAGAAAATCT CGTGGTGTGC CCAGTCTCTG5701 TGATTTAAGA GCTTTTTGGA TTAGCTATAG AACATCGCGT AAAACGAACG GAGCGCCTGG5761 AGCGCGCAGC GAGGGATTGC CAGGTACGGG AGCTGTCTGT ACGGTATATC ATCGTACATG5821 CGTCTATTCG CTCCATTAGT GGGACAAGAC GCACAGGGCA CTACCTCGCC GATAACTCGA5881 TAAAGGCGAG CAAGCCTGTA CCGGGTCACT TCAGCGGAAT AGCCGATATT CGGGTCACGA5941 CAAACGGCAA TTGCATCGCT CCACTCACCA AGCCCCGCCA CGTTCGACGA GATAGAGTCT6001 AAAGAGACCC CTATGAGGAG TCCGACGAAG GGGGTGTGTC TGTCCGCCAT GTTGGGCGAA6061 AGGGTGTTAT TTAGACAGGC GGTTGGTGGG GAAAACTACT TCTATTGGGT GCGGACCCCG6121 ACAGAATCGT TACCAACAAT CAGTCCTAGA CTGTTGCCAC AACGCCGTAA CTAGCGACCC6181 CGGGCGGGTA GACGCAGCTT TTTGGAGAAC GCGGCGCGCC CATACTACGG GGATTTGGGC6241 ATCGCGTCGA GCGTTATACA GATGAGCTCT CCAATCCGGT GCAAGTATAG CAAGACACCC
6301 GCTGGATGTC GAACCCACTA GGAGTGAATC TTTAGGATTA GGGGTGGGTT TAGGTCTGTT6361 CCTCTAGGGA AGTTGCCTCT TCATGGCGAG CTGGGGCCGC TCTCGGCGAG CATAAGCCAC6421 ACGTCCCAAT TCAATAGAGA TCAGCTCTGA TTTGGATAGC CGCACAACGG GAGCCCCTTT6481 TATGAGCAGT AATAGATTGG ATGCTGCAGA AGTACCCCTC GAGCTGATTT TGGTGCCTTC6541 TTCCAAACTC TAGATGACTG GCTATGGTTG GCGCGTCATA CCCGTTTTCC TCCCAGGCTA6601 TTGGTCAAGC GTGGAGGGAA GGTTGTAAAG TTGCAAGTCT AGCTGTAGAG CACAGTACCT6661 CTAAGATCTT TGAGGTAGTC CCGAGAGTCG GAGTTGATAG GCGGCCAGTT CTTGGGGCGG6721 AGCCCCGGAT CTGACTCTGC GGGGGGCATA GTTGGAGTCA AAGCTAAGCG CCTCGCCTAA
6781 ATGCTGGTGG TACTGGATCC GCCCCCAAAT ACGTATATAG GCTTCCCGGG CCGATCATAC6841 TAGCGCGGGG CGAGTAAGGG GGGGCCCGGG CGATACCGAG TTTCCTCTAT GGAGCTTACC6901 GGTTTCCCAG GGCGACAGTG TACATGCCGG TGGTAGCGGG GCAGCATCCC TGTAACACGC6961 GGCGATGCCC TGAGCACTAG GCGCTATCGG CGTCCCTTGG ATGCCCACCT GTTTATTCTG7021 AGTCCCCGTC TTCCGCCCGC CAAGGCTGAT CAATACTCAG CTAAGCAAGC TTTCCTTTCA7081 CCTGTTCGGG TTTCGACGTG ACTAGTCAGT CCCGAAACAG AAAGGTCGGT GGTAAGGTCA7141 GTTAACGGCC GCTACCTTCA GTAAGCCAAT ACTAAGGGCG AAATTACTCC GTATTCTTCC7201 CGCAGTACGT TGCTGCAATC CGGGGACCTT CAAGCAGAGG TGGCTAGTTC CCGGGTAGCG7261 GTTGGATGTA CCGCCGGACT TCGCAGTACG AGTTGGCGCG ACGGCACCAC TATAGATTCC7321 TAACATGCTT AGTCACACGC AGACAGTTTT GGCTCACTAT TGTCCGAAGG TGGGCCGGAG7381 TTGTCGCGCA ACTGCGTTCT ATGGGGTACG CGCTACGACC ATCATACGGC GCGGGTCGAA7441 CCTGCGCCAT CGCTGGCCGC ATGGTAACAC GGGTTCAACG CCTCGCGTAGGTGTGGGCGA7501 TCAATTCTGA ACTTCCGCGT TACTCGAAAG CGATGCCGGG AAATGAACTA TTCGACCTCT7561 GGGATTCAGC TACCGGTCTG CTGGCACTCA TGCGGAGCGC CCCAGACTTA AAAGACCGTC7621 TAGTTCGGAG TCCCACCGTG ATCCGCTCCT TTTCTCAAGT CGCGTTCGGG AAGTCTCGCT7681 CCACCAACCC CCCTACCAAC CCGGCCATAT CCGGCTGGAG TTGCCGCCGT GCCTGACTTC7741 GTAAGCGTAA GTTTCCAGAT ACCCCTGATA GGCTCGGGGC GCGCTGGGCC GACCTCGCAG7801 ACCGGGAGCC CGGGCTGGGT TTCGGAGTCG GTGGGCGATG AATAATAACC CTTGCTCCAG7861 CCACATCGAC CGCGCTACTT ATTTGGGGTA ATAGTCAGCA CTGGGGCATC TGGGCCTTAT7921 CCGTCCGTAC TCTTAGTATC CGTGGACTGC TTATCATCGC AATCCGTCGG CTCATGAGAA7981 CGGGTGCCCA AAACAGCAGT CACCAGGCCA TGTCTCGCGA GTTGACGCGG TGTCAACTCG8041 TGGGGTACGC GCTATGAAGC CGGCGGCTCG ATGAGGAGGG TTTGTCCGCT GGGATCGGAC8101 AAAGCACCAC ACGGATCCAG TACAAGACTC TCAGACCCGT CCCCGCTACC CTTGTGGATG8161 TAGTCACTGG GAAACCGCTG TTTCGCCTGT ATGGTGTTTT CATCCGCGAA TCGATCAAAT8221 CTGGCGGTCT CCAGACTCCG CCACCAGGGG CAGCTGCATA CTCCAGGGCA CCTAAGACAA8281 GGGCCCCCGG TGGAGATTTG GTCAATAACA TAGCGGGCGA CGGACTTTCG TACCGCTGCG8341 AGACTGTGGG TAGTACTCTC GGTTCAGGCT TGCTCGTCTG TGCCTTGCGC TATGCTGACG8401 GTTCTGCAGT GTGAGCCTAA TCCGATAACT ACGTCCATTG CACGAGGCCG GTCCCGGCAT8461 ATCGGTCCTT GCGTGTGGCC GTGGACGATG ACAGGAGAGT TGCACGTGAA GGTAACCACG8521 CGATAGGGTA GGGTGAGGGC ACCGGCTAAT TAAGTGTGCC TTCGAGTCGC GCGCATACGG
8581 AAAAGCCACC CTGGCAACCT ACTTTCCACA CACTAATCTT TATTTGTGTT AAGCGTATGA
8641 GCCCCACAAC ACCAGATGCT ATATTAGGTG GAAGAACAGT TATAGGAAAT TTGGGTGACT
8701 AGGTGGTGTT CGCTTGAGCC ATTGGGCGAC GGTCGTTGCG GGAAAG
权利要求
一种水稻叶形调控基因NRL1编码的蛋白质,其特征在于该蛋白质为SEQ ID NO2所示的氨基酸序列。
2.根据权利要求1所述的水稻叶形调控基因NRLl编码的蛋白质,其特征在于所述氨 基酸序列还包括在SEQ ID NO :2所示的氨基酸序列中添加、取代、插入或缺失一个或多个氨 基酸或其他物种的同源序列而生成的氨基酸序列或衍生物。
3.一种编码权利要求1或2所述蛋白质的基因,其特征在于该基因为SEQ ID NO 1 所示的核苷酸序列。
4.根据权利要求3所述的基因,其特征在于所述核苷酸序列还包括在SEQID NO 1 所示的核苷酸序列中添加、取代,插入或缺失一个或多个核苷酸而生成的突变体、等位基因 或衍生物。
5.一种含有权利要求3或4所述基因的质粒。
6.一种含有权利要求3或4所述基因的植物表达载体。
7.一种宿主细胞,其特征在于该宿主细胞含有权利要求3或4所述的基因序列。
8.根据权利要求7所述的宿主细胞,其特征在于该细胞为大肠杆菌细胞、农杆菌细胞 或植物细胞。
9.如权利要求3所述的水稻叶形调控基因NRLl的用途,其特征在于用于改良水稻叶 宽或卷曲度。
10.根据权利要求9所述的水稻叶形调控基因NRLl的用途,其特征在于用具有SEQ IDNO 1所示的核苷酸序列的基因转化水稻细胞,再将转化后的水稻细胞培育成植株。
全文摘要
本发明公开了一种水稻叶形调控基因NRL1编码的蛋白质,其具有SEQ ID NO2所示的氨基酸序列。本发明还公开了编码上述蛋白质的基因,其具有SEQ ID NO1所示的核苷酸序列。该水稻叶形调控基因NRL1能用于改良水稻叶宽或卷曲度。
文档编号C12N1/21GK101845086SQ200910262020
公开日2010年9月29日 申请日期2009年12月18日 优先权日2008年12月18日
发明者张光恒, 曾大力, 朱丽, 胡江, 董国军, 郭龙彪, 钱前, 颜美仙, 高振宇 申请人:中国水稻研究所