专利名称:甘蔗蔗糖转运蛋白SoERD6基因及其编码蛋白序列的制作方法
技术领域:
本发明属于植物基因工程技术领域,涉及一种甘蔗蔗糖转运蛋白SoERD6基因及其编码蛋白序列。
背景技术:
鹿糖转运蛋白(sucrosetransporters 或 sucrose carrier, SUT 或 SUC)主要功能是负责植物光合产物蔗糖的跨膜运输,在韧皮部介导的源一库蔗糖运输和库器官的蔗糖供给中起着关键作用。植物SUT属于MFS(major facilitator superfamily)超家族下的蔗糖转运蛋白家族的一个中等规模的亚家族。在干旱胁迫下,能诱导植物一些基因的表达,以减轻由胁迫造成对植物的伤害。依据基因做出响应的时间,可以分为ERD(earlyresponsive to dehydration)基因和 RD (responsive to dehydration)基因。ERD 基因是一些对干旱、低温等胁迫信号快速应答的基因,其中ERD6编码的蛋白具有12个跨膜区,且 有一个亲水中心,属于蔗糖转运蛋白。在植物的整个生命过程中,糖类物质作为营养成分以及信号物质发挥着重要的作用。SUT与蔗糖的运输和碳分配密切相关,其活性大小直接影响植物的生长与发育,甚至影响农作物的产量。而蔗糖从源到库的运输过程中,至少需要5种蔗糖转运蛋白作用第I种SUT可能是易化蛋白,负责将蔗糖从叶肉细胞释放到细胞壁中。第2种SUT的功能是将蔗糖装载进韧皮部。第3种SUT在蔗糖运输途径中负责将渗透出韧皮部的蔗糖重新吸收进韧皮部,如茎中的蔗糖转运蛋白。第4种是存在于库组织中的SUT,韧皮部卸出的蔗糖可以通过这种蔗糖转运蛋白介导的跨膜运输或通过胞间连丝进行。Walker等推测参与韧皮部卸出的蔗糖外流运输蛋白具有易化蛋白或质子反向转运蛋白的功能。第5种是在库细胞的液泡中含有用于吸收蔗糖的H+/蔗糖反向转运蛋白和用于释放蔗糖的单向转运蛋白。自从1992年Riesmeier等从菠菜中克隆到第I个植物SUT基因以来,相继从20多种植物中得到52个SUT基因。如水稻中已克隆到5个、拟南芥中9个、玉米中6个、大麦中2个SUT等。Sauer等根据系统进化分析法将9个拟南芥蔗糖转运蛋白家族成员分为SUTl、SUT2和SUT4三个亚族。AtSUCl基因主要在花粉、表皮毛及根中表达,为花粉管的伸长和根尖细胞的快速分裂提供蔗糖。AtSUC2基因在成熟叶片的收集韧皮部和运输韧皮部中均有表达,在收集韧皮部中主要负责韧皮部的蔗糖装载,而在运输韧皮部中的作用还尚不清楚。AtSUC4在源叶小叶脉的伴胞中表达,主要功能是负责蔗糖的韧皮部装载。Endler研究发现,AtSUC4在叶肉细胞的液泡膜上也有表达,参与拟南芥叶肉细胞中蔗糖的液泡贮藏。AtSUC4蛋白属于低亲和高转运能力载体,与高亲和低转运能力的SUTl亚族载体相比,SUT4亚族载体的Km值大约是SUTl亚族的10倍甚至更高,因此Weise推测,SUT4在韧皮部装载过程中可能起着更为重要的作用。甘蔗是重要的糖料和能源植物,蔗糖运输及其在蔗茎中的积累过程十分复杂,而蔗糖在源叶中合成到库组织储存的过程需要蔗糖转运蛋白的参与,因此对甘蔗SUT功能进行研究,对揭示SUT在甘蔗蔗糖的运输和在蔗茎中蔗糖积累的机理将会起到重要作用。目前,已经从甘蔗中克隆到蔗糖转运蛋白基因ShSUTI、ShSUTIA和ShSUT4,并对其功能进行初步研究。ShSUTl主要在成熟叶片和茎节间表达,定位于叶片和茎的维管束外围细胞中,可能具有将蔗糖转运到质外体和将遗漏在质外体的蔗糖重新转入共质体的功能。ShSUT4在叶片中的表达最强,在根部的表达最弱。研究发现ShSUT4的表达量与甘蔗糖分的积累量呈正相关。然而还没有甘蔗蔗糖转运蛋白在甘蔗抗逆胁迫中应用的研究报道。本发明从受干旱胁迫处理的甘蔗心叶中克隆到一个SoERD6,属于蔗糖转录蛋白基因,该基因可能与甘蔗的抗逆性有关,具体功能还需要进一步的研究。
发明内容
本发明的目的是为进一步研究甘蔗蔗糖转运蛋白SoERD6基因在甘蔗蔗糖运输和在蔗茎中积累功能及应用SoERD6基因改良甘蔗品种,提供一种甘蔗蔗糖转运蛋白SoERD6基因及其编码蛋白序列。本发明所采取的技术方案如下
·
甘蔗蔗糖转运蛋白SoERD6基因及其编码蛋白序列,是在对所有植物蔗糖转运蛋白ERD6基因全长序列进行进化分析的基础上,比对玉米、高粱和短柄草等亲缘关系较近的蔗糖转运蛋白ERD6基因cDNA序列,并设计扩增SoERD6基因核心片段的引物。从干旱胁迫5天的甘蔗幼嫩心片提取总RNA,并经过逆转录,用常规PCR法扩增SoERD6基因核心片段;然后在核心片段序列5'端设计两个特异引物,在核心片段序列3'端设计两个特异引物和一个锚定引物,通过RACE PCR技术分别扩增到SoERD6基因核心区的5'端和3'端序列,三个序列经过拼接,获得甘蔗SoERD6基因全长cDNA序列,全长2163bp,经Vector NTI11.0软件分析,该基因的ORF为1521bp,编码506个氨基酸,起始密码子(ATG)位于转录起始位点后169bp处,终止密码子(TAG)后还有一段474bp的非编码序列,并带有真核生物典型的poIyA尾巴。本发明所获得的甘蔗蔗糖转运蛋白SoERD6基因核心区序列,是用以下核苷酸序列为引物扩增获得SUT6F1 (5; -atgagctttcgggaccaggagag-3');SUT6R1 (5; -tcagcggaatgagaatgcgat-31 );本发明所获得的甘蔗蔗糖转运蛋白SoERD6基因5'端序列,是用以下核苷酸序列为引物,与5' -Full RACE Kit(TAKARA)提供的引物结合,鸟巢式扩增获得SUT6SYR1 (51 -gtgaaaccgaactggatgggacc-31 );SUT6SYR2 (51 -tacaatgagcgtgcagagcgtgg-31 );本发明所获得的甘蔗蔗糖转运蛋白SoERD6基因基因3'端的序列,是用以下核苷酸序列为引物,与3,端锚定引物相结合,鸟巢式扩增获得SUT6XYR1 (5' -tggaggaacctttgctatctatg-3');SUT6XYR2 (5' -tgctgtgtctaccatggccctca-3')。以上所述的甘蔗蔗糖转运蛋白SoERD6,其特征在于它具有序列表中SEQID NO. I的DNA序列,且它的编码区从第169位核苷酸到1689位核苷酸。以下是本发明所获得的甘蔗SoERD6基因的全长cDNA序列GAAAGTGCGTGGATTGCCTTCTCTCGGCTAATCATTCAATCAGATCCAATTTCGTGCGCTGATCGTACTCGCCTTCTTCTCCTCCGCCAGCGCTCGAGATTGACGGACGCTCCTCGCAGGAATTCTTCGTCCGTTGCGGTGCGGCCGAGAAGAAACTAAGGCTCAGGC AGCTTTCGGGACCAGGAGAGTGGCGGGGAGGATGCGGGCAGGACGTCCTCCTCGTCCGACCTGCGGAAGCCGCTCCTGAACACCGGGAGCTGGTACCGCATGCCGCCGGCGGGCGGCATGATGGGCTCGCGGCAGTCCAGCCTCATGGAGCGCCTAGGCTCCTCTGCCTTCTCCCTCCGCGACGTCGCCATCTCGGCCACGCTCTGCACGCTCATTGTAGCTCTAGGTCCCATCCAGTTCGGTTTCACCTGCGGGTACTCCTCCCCCACGCAGGACGCCATCATTGCTGACCTCGGCCTCTCCCTCTCCGAGTTCTCGCTCTTCGGATCGTTATCAAACGTAGGGGCAATGGTAGGCGCCATCTCCAGTGGGCAACTTGCAGAGTATATCGGTCGCAAGGGGTCTCTCATGATCGCTGCAATTCCAAACATAATTGGGTGGCTCGCGATATCATTCGCAAAAGATTCCTCTTTCTTGTTTATGGGTCGGCTGCTAGAAGGATTTGGAGTCGGTGTAATATCTTATACAGTACCGGTTTATATTGCAGAAATCGCTCCTCAAGATCAGAGGGGAGCTCTTGGTTCTGTCAATCAGCTCTCCGTCACAATTGGTATATTGCTTGCCTACCTGTTTGGCATGTTTGTTCCCTGGAGAATTCTTGCTGTTCTAGGCGTTTTACCTTGTTCAATACTGATTCCTGGACTGTTCTTTGTCCCTGAATCCCCAAGGTGGCTGGCAAAAATGGGGAAGATGGAGGATTTTGAATATTCACTGCAAGTTCTGCGAGGATTTCAGACGGACATCACAGCAGAAGTAAATGAAATAAAGAGATCAGTAGCATCATCAAGGAGGAGGACAACCATAAGGTTTGCTGATATCAAGCAGAAGAGATACAGTGTTCCCCTTGCGATAGGAATCGGTCTCCTTGTCCTGCAGCAGCTAAGTGGTGTCAATGGCATTCTATTTTATGCTGGGAGCATCTTCAAAGCTGCTGGTATTACAAACAGTAATCTAGCAACCTTTGGTTTGGGGGTTGT TCAGGTGATTGCTACTGGAGTGACAACCTGGTTGACTGACAAAGCTGGTCGAAGGCTTCTTCTCATTATTTCTACCACAGGAATGGTCATTACTCTTGTTATTGTTTCTGTGTCATTTTTTGTGAAGGACAACATAACTGCTGGTTCTCACTTATACTCTACAATGAGTATGCTTTCACTGGCTGGACTTGTGGCATTTGTGATTGCATTTTCTCTTGGCTTGGGAGCAATTCCCTGGGTCATTATGTCTGAGATTCTTCCTGTTAACATCAAGAGCCTTGCTGGAAGTGTTGCGACCCTTGCGAACTGGCTGACAGCATGGGCCATTACAATGACTGCAAGCCTAATGTTGAACTGGAGCAATGGAGGAACCTTTGCTATCTATGCTGCTGTGTCTACCATGGCCCTCATTTTCGTGTGCTTGTGGGTACCGGAGACCAAAGGAAGGACACTAGAGGAAATCGCATTCTCATTCCGC[TGA|CACGTCATGATCTTAGGTATGAGAAGCCACCATGTGCTAGTCATGCCTCAGGGCCATTCAGTTCATGGATTCAGCAGCATCTTGCAGCCATTCTTTCTTGGATGTACCATCTTCAGTGTTCATATGAATGTACATTGTACAATATGAGGCCGTAGCAGAAGGCAAGTGTGTTTATATATATTTGTATATGGTACGATGGATAGTAGCAGAACGCACTCAACCCTTGCATGGGTTGCGGAGAGCAATTCATTTGTTGTATTCATCAGCTATGGTATGTCTGGTTAAATACCGGGCACACGTTAGAATTTTGAAAACAATAAATTTTGAGCAAATTTGTACCCGTGGTATTTACAGTGCTGCCAGCTCTATGCGTTTGCATGCATGCGGTTGGAGTCACTGATCTTGTAATTGGTCATGAACTAGACATGGAGTCTAAATATTTAGGCATGATTTTGGTTTATAAAAAAAAAAAAA甘蔗SoERD6基因编码的蛋白,是具有序列表中SEQID NO. 2氨基酸残基序列的蛋白质,或者是将SEQID NO. 2的氨基酸残基序列经过一个以上氨基酸残基的取代和/或缺失成添加且具有与SEQID NO. 2的氨基酸残基序列相同活性的衍生蛋白质。以下是本发明所获得的甘蔗SoERD6基因所编码蛋白的氨基酸序列MSFRDQESGGEDAGRTSSSSDLRKPLLNTGSWYRMPPAGGMMGSRQSSLMERLGSSAFSLRDVAISATLCTLIVALGPIQFGFTCGYSSPTQDAIIADLGLSLSEFSLFGSLSNVGAMVGAISSGQLAEYIGRKGSLMIAAIPNIIGWLAISFAKDSSFLFMGRLLEGFGVGVISYTVPVYIAEIAPQDQRGALGSVNQLSVTIGILLAYLFGMFVPffRILAVLGVLPCSILIPGLFFVPESPRWLAKMGKMEDFEYSLQVLRGFQTDITAEVNEIKRSVASSRRRTTIRFDIKQKRYSVPLAIGIGLLVLQQLSGVNGILFYAGSIFKAAGITNSNLATFGLGVVQVIATGVTTWLTDKAGRRLLLIISTTGMVITLVIVSVSFFVKDNITAGSHLYSTMSMLSLAGLVAFVIAFSLGLGAIPWVIMSEILPVNIKSLAGSVATLANWLTAWAITMTASLMLNWSNGGTFAIYAAVSTMALIFVCLffVPETKGRTLEEIAFSFR。
本发明的优点及其积极效果本发明的甘蔗SoERD6序列,不仅为研究甘蔗SoERD6的转录、表达机制,进一步探讨甘蔗体内蔗糖的运输和在蔗茎中的积累机理奠定基础,而且通过氨基酸序列可以获得具有生物活性的纯化蛋白,进一步用于研究蔗糖转运蛋白的生物学功能及利用该基因进行甘蔗高糖品种改良。
图I :甘蔗SoERD6基因的全长cDNA序列;图2 :甘蔗SoERD6基因所编码蛋白的氨基酸序列。
具体实施例方式实施例 I、植物SoERD6基因进化分析用与甘蔗同源性最近的玉米ZmERD6 (基因登录号为FJ750248),在NCBI网站(http://www.ncbi.nlm.nih. gov)进行同源性比对分析,获得所有植物ERD6序列。对所获得的所有序列进行分析,除去重复的序列。共得到植物ERD6序列33条,其中全长序列10条。用ClustalX对所有全长ERD6的氨基酸序列进行比对,并将比对结果保存为PHYLIP格式;然后用PHYLIP软件包的Seqboot、Protdistjeighbor和Consense程序进行进化分析,将植物所有全长ERD6基因分为相应的家族。2、设计扩增SoERD6基因核心片段的引物设计扩增SoERD6基因核心片段的引物,在Vector NTI11.0上比对单子叶植物ERD6基因的cDNA序列进行。在保守区设计一对用于扩增SoERD6部分片段的引物。SUT6F1 (5; -atgagctttcgggaccaggagag-3');SUT6R1 (5; -tcagcggaatgagaatgcgat-31 )。3、甘蔗总RNA的提取(I)取经干旱胁迫处理的新鲜甘蔗心叶在液氮中迅速研磨成粉末状。称取IOOmg研磨后的产物,放入用液氮预冷过的I. 5ml离心管中,加入Iml Trizol-A+提取液(天根生化科技有限公司)。(2)将样品充分混匀,室温下放置5min,使得核酸蛋白复合物完全分离。(3) 40C, 14,OOOg,离心 IOmin0(4)吸取上清液于另一个I. 5ml离心管中,加入氯仿体积为上清液体积的1/5,充分振荡混勻15sec,室温放置2_3min。(5) 4°C,14, OOOg,离心 15min。(6)重复步骤4,5 一次。(7)吸取上层水相溶液于另一个I. 5ml离心管中,加入等体积预冷的异丙醇,混匀lOmin,冰上放置25min(8)4°C,14,000g,离心IOmin后,在管侧和管底形成白色胶状沉淀。(9)去上清液,留沉淀。加入lml75%乙醇洗涤沉淀2遍(每次4°C,2,300g,离心3min)。(10)倒出液体,室温放置3_5min ;加入30-50 μ I DEPC处理水,充分溶解后于-70°C保存。(11)取I μ I RNA样品用1%琼脂糖凝胶进行电泳检测,另取I μ IRNA样品测浓度。4、RT-PCR (反转录 PCR):(I)准备一个O. 2ml的离心管,加入以下成分甘蔗总RNA:O. 1-5μ g ;oligo(dT)18 引物(O. 5μ g/μ I) : 1μ I ;加入DEPC-treated water 到总体积12 μ I。(2)轻微混匀,简短离心之后,65° C温育5min,放置冰上冷却。
·
(3)按要求加入以下成分5 X Reaction Buffer 4 μ I ;RiboLock RNase Inhibitor (20U/ μ I) I μ I ;IOmM dNTP Mix 2 μ I ;ReverAid M-MuLV Reverse Tranxcriptase I μ I ;总体积为20 μ I。(4)轻微混匀,简短离心。(5)42。C 温育 60min。(6)70° C温育5min终止反应,-20° C保存备用。5、SoERD6基因核心片段克隆以I μ I RT-PCR产物为模板,用SUT6F1和SUT6R1引物进行常规PCR扩增。PCR产物经胶回收纯化后克隆到T载体并测序。测序结果表明,PCR产物长度1521bp。6、SoERD6基因5 ' -RACE克隆根据上一步测序获得的核心区序列,设计了5' -RACE的基因特异引物SUT6SYR1 (51 -gtgaaaccgaactggatgggacc-31 );SUT6SYR2 (51 -tacaatgagcgtgcagagcgtgg-31 )。5' -Full RACE Kit(TAKARA)试剂盒提供的引物Outer Primer: (5' -catggctacatgctgacagccta-3');Inner Primer (5' -cgcggatccacagcctactgatgatcagtcgatg-3' ) 提取甘蔗幼嫩叶总RNA,按照5 ' -Full RACE Kit (TAKARA)操作手册进行5' -RACE。巣式PCR :以外引物SUT6SYR1和Outer Primer的PCR产物为模板,再以内引物SUT6SYR2和Inner Primer进行第二轮PCR,产物经胶回收纯化后克隆到T载体并测序。测序结果表明,5' -RACE产物长度390bp。7、S0ERD6基因3 ' -RACE克隆根据上一步测序获得的核心区序列,设计了3' -RACE的两个基因特异引物。SUT6XYR1 (5' -tggaggaacctttgctatctatg-3');SUT6XYR2 (5' -tgctgtgtctaccatggccctca-3')。3'锚定引物锚定引物(5'-ggccacgcgtcgactagtac-3');逆转录弓丨物 GZS : (5' -ggccacgcgtcgactagtactttttttttttttttttt-31 )。提取甘蔗幼嫩叶总RNA,按照上述RT-PCR方法,以引物GZS核苷酸序列为反转录引物,逆转录合成cDNA ;用SUT6XYR1和锚定引物进行第一轮PCR扩增,PCR产物稀释50倍后,作为SUT6SYR2和锚定引物的模板,用SUT6XYR2和锚定引物进行第二轮PCR扩增。产物经胶回收纯化后克隆到T载体并测序。测序结果表明,产物长度568bp。8、甘蔗SoERD6基因全长序列分析将所获得的三个序列进行拼接,获得了 SoERD6基因全长cDNA序列,总长2163bp。经Vector NTI11. O软件分析,该序列的ORF为1521bp,编码506个氨基酸。起始密码子(ATG)位于转录起始位点后169bp处,终止密码子(TAA)后还有一段474bp的非编码序列,并带有真核生物典型的polyA尾巴。甘蔗蔗糖转运蛋白SoERD6基因序列表,详见序列表。序列表〈110〉广西大学
<120>甘蔗蔗糖转运蛋白ERD6基因及其编码蛋白序列<160>2〈210〉I<211>2163<212>DNA〈213〉甘鹿(Saccharum off icinarum)〈220〉<221>CDS<222>(168). . . (1689)〈220〉〈221>5, UTP<222>(1). . . (168)〈220〉〈221>3, UTP<222>(1690). . . (2163)〈400〉IGAAAGTGC GTGGATTGCC TTCTCTCGGC TAATCATTCA ATCAGATCCA 48ATTTCGTGCG CTGATCGTAC TCGCCTTCTT CTCCTCCGCC AGCGCTCGAG ATTGACGGAC 108GCTCCTCGCA GGAATTCTTC GTCCGTTGCG GTGCGGCCGA GAAGAAACTA AGGCTCAGGC 168ATG AGC TTT CGG GAC CAG GAG AGT GGC GGG GAG GAT GCG GGC AGG 213Met Ser Phe Arg Asp Gln Glu Ser Gly Gly Glu Asp Ala Gly Arg51015ACG TCC TCC TCG TCC GAC CTG CGG AAG CCG CTC CTG AAC ACC GGG 258Thr Ser Ser Ser Ser Asp Leu Arg Lys Pro Leu Leu Asn Thr Gly202530AGC TGG TAC CGC ATG CCG CCG GCG GGC GGC ATG ATG GGC TCG CGG 303Ser Trp Tyr Arg Met Pro Pro Ala Gly Gly Met Met Gly Ser Arg354045CAG TCC AGC CTC ATG GAG CGC CTA GGC TCC TCT GCC TTC TCC CTC 348
Gln Ser Ser Leu Met Glu Arg LeuGly Ser Ser Ala Phe Ser Leu505560CGC GAC GTC GCC ATC TCG GCC ACG CTC TGC ACG CTC ATT GTA GCT 393Arg Asp Val Ala He Ser Ala ThrLeu Cys Thr LeuHe Val Ala657075CTA GGT CCC ATC CAG TTC GGT TTC ACC TGC GGG TAC TCC TCC CCC 438Leu Gly Pro He Gln Phe Gly PheThr Cys Gly TyrSer Ser Pro808590·
ACG CAG GAC GCC ATC ATT GCT GAC CTC GGC CTC TCC CTC TCC GAG 483Thr Gln Asp Ala He He Ala AspLeu Gly Leu SerLeu Ser Glu95100105TTC TCG CTC TTC GGA TCG TTA TCA AAC GTA GGG GCA ATG GTA GGC 528Phe Ser Leu Phe Gly Ser Leu SerAsn Val Gly Ala Met Val Gly110115120GCC ATC TCC AGT GGG CAA CTT GCA GAG TAT ATC GGTCGC AAG GGG 573Ala He Ser Ser Gly Gln Leu Ala Glu Tyr He GlyArg Lys Gly125130135TCT CTC ATG ATC GCT GCA ATT CCA AAC ATA ATT GGG TGG CTC GCG 618Ser Leu Met He Ala Ala He ProAsn He He GlyTrp Leu Ala140145150ATA TCA TTC GCA AAA GAT TCC TCTTTC TTG TTT ATG GGT CGG CTG 663He Ser Phe Ala Lys Asp Ser SerPhe Leu Phe MetGly Arg Leu155160165CTA GAA GGA TTT GGA GTC GGT GTA ATA TCT TAT ACA GTA CCG CTT 708Leu Glu Gly Phe Gly Val Gly ValHe Ser Tyr ThrVal Pro Val170175180TAT ATT GCA GAA ATC GCT CCT CAA GAT CAG AGG GGA GCT CTT GGT 753Tyr He Ala Glu He Ala Pro GlnAsp Gln Arg GlyAla Leu Gly185190195TCT GTC AAT CAG CTC TCC GTC ACA ATT GGT ATA TTG CTT GCC TAC 798Ser Val Asn GLn Leu Ser Val ThrHe Gly He LeuLeu Ala Tyr200205210CTG TTT GGC ATG TTT GTT CCC TGG AGA ATT CTT GCTGTT CTA GGC 843Leu Phe Gly Met Phe Val Pro TrpArg He Leu Ala Val Leu Gly215220225GTT TTA CCT TGT TCA ATA CTG ATTCCT GGA CTG TTC TTT GTC CCT 888Val Leu Pro Cys Ser He Leu HePro Gly Leu PhePhe Val Pro230235240GAA TCC CCA AGG TGG CTG GCA AAA ATG GGG AAG ATG GAG GAT TTT 933
Glu Ser Pro Arg Trp Leu Ala LysMet Gly Lys MetGlu Asp Phe245250255GAA TAT TCA CTG CAA GTT CTG CGA GGA TTT CAG ACGGAC ATC ACA 978Glu Tyr Ser Leu Gln Val Leu Arg Gly Phe Gln ThrAsp He Thr260265270GCA GAA GTA AAT GAA ATA AAG AGA TCA GTA GCA TCATCA AGG AGG 1023Ala Glu Val Asn Glu He Lys Arg Ser Val Ala SerSer Arg Arg275280285AGG ACA ACC ATA AGG TTT GCT GATATC AAG CAG AAGAGA TAC AGT 1068·Arg Thr Thr He Arg Phe Ala AspHe Lys Gln LysArg Tyr Ser290295300GTT CCC CTT GCG ATA GGA ATC GGTCTC CTT GTC CTGCAG CAG CTA 1113Val Pro Leu Ala He Gly He GlyLeu Leu Val LeuGln Gln Leu305310315AGT GGT GTC AAT GGC ATT CTA TTTTAT GCT GGG AGCATC TTC AAA 1158Ser Gly Val Asn Gly He Leu PheTyr Ala Gly SerHe Phe Lys320325330GCT GCT GGT ATT ACA AAC AGT AATCTA GCA ACC TTTGGT TTG GGG 1203Ala Ala Gly He Thr Asn Ser AsnLeu Ala Thr PheGly Leu Gly335340345GTT GTT CAG GTG ATT GCT ACT GGA GTG ACA ACC TGGTTG ACT GAC 1248Val Val Gln Val He Ala Thr GlyVal Thr Thr TrpLeu Thr Asp350355360AAA GCT GGT CGA AGG CTT CTT CTC ATT ATT TCT ACCACA GGA ATG 1293Lys Ala Gly Arg Arg Leu Leu LeuHe He Ser ThrThr Gly Met365370375GTC ATT ACT CTT GTT ATT GTT TCTGTG TCA TTT TTTGTG AAG GAC 1338Val He Thr Leu Val He Val SerVal Ser Phe PheVal Lys Asp380385390AAC ATA ACT GCT GGT TCT CAC TTA TAC TCT ACA ATGAGT ATG CTT 1383Asn He Thr Ala Gly Ser His LeuTyr Ser Thr MetSer Met Leu395400405TCA CTG GCT GGA CTT GTG GCA TTTGTG ATT GCA TTTTCT CTT GGC 1428Ser Leu Ala Gly Leu Val Ala PheVal He Ala PheSer Leu Gly410415420TTG GGA GCA ATT CCC TGG GTC ATTATG TCT GAG ATTCTT CCT GTT 1473Leu Gly Ala He Pro Trp Val HeMet Ser Glu HeLeu Pro Val425430435AAC ATC AAG AGC CTT GCT GGA AGTGTT GCG ACC CTTGCG AAC TGG 1518
Asn lie Lys Ser Leu Ala Gly Ser Val Ala Thr Leu Ala Asn Trp440445450CTG ACA GCA TGG GCC ATT ACA ATG ACT GCA AGC CTA ATG TTG AAC 1563Leu Thr Ala Trp Ala lie Thr Met Thr Ala Ser Leu Met Leu Asn455460465TGG AGC AAT GGA GGA ACC TTT GCT ATC TAT GCT GCT GTG TCT ACC 1608Trp Ser Asn Gly Gly Thr Phe Ala lie Tyr Ala Ala Val Ser Thr470475480 ATG GCC CTC ATT TTC GTG TGC TTG TGG GTA CCG GAG ACC AAA GGA 1653Met Ala Leu lie Phe Val Cys Leu Trp Val Pro Glu Thr Lys Gly485490495AGG ACA CTA GAG GAA ATC GCA TTC TCA TTC CGC1686Arg Thr Leu Glu Glu lie Ala Phe Ser Phe Arg500505 506TGACACGTCA TGATCTTAGG TATGAGAAGC CACCATGTGC TAGTCATGCC TCAGGGCCAT 1746TCAGTTCATG GATTCAGCAG CATCTTGCAG CCATTCTTTC TTGGATGTAC CATCTTCAGT 1806GTTCATATGA ATGTACATTG TACAATATGA GGCCGTAGCA GAAGGCAAGT GTGTTTATAT 1866ATATTTGTAT ATGGTACGAT GGATAGTAGC AGAACGCACT CAACCCTTGC ATGGGTTGCG 1926GAGAGCAATT CATTTGTTGT ATTCATCAGC TATGGTATGT CTGGTTAAAT ACCGGGCACA 1986CGTTAGAATT TTGAAAACAA TAAATTTTGA GCAAATTTGT ACCCGTGGTA TTTACAGTGC 2046TGCCAGCTCT ATGCGTTTGC ATGCATGCGG TTGGAGTCAC TGATCTTGTA ATTGGTCATG 2106AACTAGACAT GGAGTCTAAA TATTTAGGCA TGATTTTGGT TTATAAAAAA AAAMAA 2163<210>2<211>506<212>PRT〈213〉甘鹿(Saccharum off icinarum)Met Ser Phe Arg Asp Gln Glu Ser Gly Gly Glu Asp Ala Gly Arg51015Thr Ser Ser Ser Ser Asp Leu Arg Lys Pro Leu Leu Asn Thr Gly202530Ser Trp Tyr Arg Met Pro Pro Ala Gly Gly Met Met Gly Ser Arg354045Gln Ser Ser Leu Met Glu Arg Leu Gly Ser Ser Ala Phe Ser Leu505560Arg Asp Val Ala lie Ser Ala Thr Leu Cys Thr Leu lie Val Ala657075Leu Gly Pro lie Gln Phe Gly Phe Thr Cys Gly Tyr Ser Ser Pro808590Thr Gln Asp Ala lie lie Ala Asp Leu Gly Leu Ser Leu Ser Glu
95 100105Phe Ser Leu Phe GlySer Leu Ser Asn Val GlyAla Met Val Gly110 115120Ala He Ser Ser GlyGln Leu Ala Glu Tyr HeGly Arg Lys Gly125 130135Ser Leu Met He AlaAla He Pro Asn He HeGly Trp Leu Ala140 145150He Ser Phe Ala LysAsp Ser Ser Phe Leu PheMet Gly Arg Leu 155 160165Leu Glu Gly Phe GlyVal Gly Val He Ser TyrThr Val Pro Val170 175180Tyr He Ala Glu HeAla Pro Gln Asp Gln ArgGly Ala Leu Gly185 190195Ser Val Asn GLn LeuSer Val Thr He Gly HeLeu Leu Ala Tyr200 205210Leu Phe Gly Met PheVal Pro Trp Arg He LeuAla Val Leu Gly215 220225Val Leu Pro Cys SerHe Leu He Pro Gly LeuPhe Phe Val Pro230 235240Glu Ser Pro Arg TrpLeu Ala Lys Met Gly LysMet Glu Asp Phe245 250255Glu Tyr Ser Leu GlnVal Leu Arg Gly Phe GlnThr Asp He Thr260 265270Ala Glu Val Asn GluHe Lys Arg Ser Val AlaSer Ser Arg Arg275 280285Arg Thr Thr He ArgPhe Ala Asp He Lys GlnLys Arg Tyr Ser290 295300Val Pro Leu Ala HeGly He Gly Leu Leu ValLeu Gln Gln Leu305 310315Ser Gly Val Asn GlyHe Leu Phe Tyr Ala GlySer He Phe Lys320 325330Ala Ala Gly He ThrAsn Ser Asn Leu Ala ThrPhe Gly Leu Gly335 340345Val Val Gln Val HeAla Thr Gly Val Thr ThrTrp Leu Thr Asp350 355360Lys Ala Gly Arg ArgLeu Leu Leu He He SerThr Thr Gly Met365 370375Val He Thr Leu ValHe Val Ser Val Ser PhePhe Val Lys Asp380 385390
Asn lie Thr Ala Gly SerHis Leu Tyr Ser Thr MetSer Met Leu395 400405Ser Leu Ala Gly Leu ValAla Phe Val lie Ala PheSer Leu Gly410 415420Leu Gly Ala lie Pro TrpVal lie Met Ser Glu lieLeu Pro Val425 430435Asn lie Lys Ser Leu AlaGly Ser Val Ala Thr LeuAla Asn Trp440 445450 Leu Thr Ala Trp Ala lieThr Met Thr Ala Ser LeuMet Leu Asn455 460465Trp Ser Asn Gly Gly ThrPhe Ala lie Tyr Ala AlaVal Ser Thr470 475480Met Ala Leu lie Phe ValCys Leu Trp Val Pro GluThr Lys Gly485 490495Arg Thr Leu Glu Glu lieAla Phe Ser Phe Arg500505 50权利要求
1.甘蔗蔗糖转运蛋白S0ERD6基因及其编码蛋白序列,其特征在于 a、甘蔗蔗糖转运蛋白SoERD6基因,它具有以下序列表中的DNA序列,且它的编码区从第169位核苷酸到1689位核苷酸; 甘蔗蔗糖转运蛋白SoERD6基因的全长cDNA序列GAAAGTGCGTGGATTGCCTTCTCTCGGCTAATCATTCAATCAGATCCAATTTCGTGCGCTGATCGTACTCGCCTTCTTCTCCTCCGCCAGCGCTCGAGATTGACGGACGCTCCTCGCAGGAATTCTTCGTCCGTTGCGGTGCGGCCGAGAAGAAACTAAGGCTCAGGC |Sg| AGCTTTCGGGACCAGGAGAGTGGCGGGGAGGATGCGGGCAGGACGTCCTCCTCGTCCGACCTGCGGAAGCCGCTCCTGAACACCGGGAGCTGGTACCGCATGCCGCCGGCGGGCGGCATGATGGGCTCGCGGCAGTCCAGCCTCATGGAGCGCCTAGGCTCCTCTGCCTTCTCCCTCCGCGACGTCGCCATCTCGGCCACGCTCTGCACGCTCATTGTAGCTCTAGGTCCCATCCAGTTCGGTTTCACCTGCGGGTACTCCTCCCCCACGCAGGACGCCATCATTGCTGACCTCGGCCTCTCCCTCTCCGAGTTCTCGCTCTTCGGATCGTTATCAAACGTAGGGGCAATGGTAGGCGCCATCTCCAGTGGGCAACTTGCAGAGTATATCGGTCGCAAGGGGTCTCTCATGATCGCTGCAATTCCAAACATAATTGGGTGGCTCGCGATATCATTCGCAAAAGATTCCTCTTTCTTGTTTATGGGTCGGCTGCTAGAAGGATTTGGAGTCGGTGTAATATCTTATACAGTACCGGTTTATATTGCAGAAATCGCTCCTCAAGATCAGAGGGGAGCTCTTGGTTCTGTCAATCAGCTCTCCGTCACAATTGGTATATTGCTTGCCTACCTGTTTGGCATGTTTGTTCCCTGGAGAATTCTTGCTGTTCTAGGCGTTTTACCTTGTTCAATACTGATTCCTGGACTGTTCTTTGTCCCTGAATCCCCAAGGTGGCTGGCAAAAATGGGGAAGATGGAGGATTTTGAATATTCACTGCAAGTTCTGCGAGGATTTCAGACGGACATCACAGCAGAAGTAAATGAAATAAAGAGATCAGTAGCATCATCAAGGAGGAGGACAACCATAAGGTTTGCTGATATCAAGCAGAAGAGATACAGTGTTCCCCTTGCGATAGGAATCGGTCTCCTTGTCCTGCAGCAGCTAAGTGGTGTCAATGGCATTCTATTTTATGCTGGGAGCATCTTCAAAGCTGCTGGTATTACAAACAGTAATCTAGCAACCTTTGGTTTGGGGGTTGTTCAGGTGATTGCTACTGGAGTGACAACCTGGTTGACTGACAAAGCTGGTCGAAGGCTTCTTCTCATTATTTCTACCACAGGAATGGTCATTACTCTTGTTATTGTTTCTGTGTCATTTTTTGTGAAGGACAACATAACTGCTGGTTCTCACTTATACTCTACAATGAGTATGCTTTCACTGGCTGGACTTGTGGCATTTGTGATTGCATTTTCTCTTGGCTTGGGAGCAATTCCCTGGGTCATTATGTCTGAGATTCTTCCTGTTAACATCAAGAGCCTTGCTGGAAGTGTTGCGACCCTTGCGAACTGGCTGACAGCATGGGCCATTACAATGACTGCAAGCCTAATGTTGAACTGGAGCAATGGAGGAACCTTTGCTATCTATGCTGCTGTGTCTACCATGGCCCTCATTTTCGTGTGCTTGTGGGTACCGGAGACCAAAGGAAGGACACTAGAGgaaatcgcattctcattccgc[tga]cacgtcatgatcttaggtatgagaagccaccatgtgctagtcatgcctcaggGCCATTCAGTTCATGGATTCAGCAGCATCTTGCAGCCATTCTTTCTTGGATGTACCATCTTCAGTGTTCATATGAATGTACATTGTACAATATGAGGCCGTAGCAGAAGGCAAGTGTGTTTATATATATTTGTATATGGTACGATGGATAGTAGCAGAACGCACTCAACCCTTGCATGGGTTGCGGAGAGCAATTCATTTGTTGTATTCATCAGCTATGGTATGTCTGGTTAAATACCGGGCACACGTTAGAATTTTGAAAACAATAAATTTTGAGCAAATTTGTACCCGTGGTATTTACAGTGCTGCCAGCTCTATGCGTTTGCATGCATGCGGTTGGAGTCACTGATCTTGTAATTGGTCATGAACTAGACATGGAGTCTAAATATTTAGGCATGATTTTGGTTTATAAAAAAAAAAAAA b、甘蔗蔗糖转运蛋白SoERD6基因编码的蛋白,是具有以下序列表中氨基酸残基序列的蛋白质; 甘蔗蔗糖转运蛋白SoERD6基因所编码蛋白的氨基酸序列MSFRDQESGGEDAGRTSSSSDLRKPLLNTGSWYRMPPAGGMMGSRQSSLMERLGSSAFSLRDVAISATLCTLIVALGPIQFGFTCGYSSPTQDAIIADLGLSLSEFSLFGSLSNVGAMVGAISSGQLAEYIGRKGSLMIAAIPNIIGWLAlSFAKDSSFLFMGRLLEGFGVGVISYTVPVYIAEIAPQDQRGALGSVNQLSVTIGILLAYLFGMFVPffRILAVLGVLPCSILIPGLFFVPESPRffLAKMGKMEDFEYSLQVLRGFQTDITAEVNEIKRSVAS SRRRTTIRFADIKQKRYSVPLAIGIGLLVLQQLSGVNGILFYAGSIFKAAGITNSNLATFGLGVVQVIATGVTTWLTDKAGRRLLLIISTTGMVITLVIVSVSFFVKDNITAGSHLYSTMSMLSLAGLVAFVIAFSLGLGAIPWVIMSEILPVNIKSLAGSVATLANWLTAWAITMTASLMLNWSNGGTFAIYAAVSTMALIFVCLWVPETKGRTLEEIAFSFRo
2.根据权利要求I所述的甘蔗蔗糖转运蛋白SoERD6基因及其编码蛋白序列,其特征在于所述的甘蔗蔗糖转运蛋白SoERD6基因的全长cDNA序列,是用以下核苷酸序列为引物扩增获得a、用于扩增甘蔗蔗糖转运蛋白SoERD6基因核心区引物对SUT6F1 (5r -atgagctttcgggaccaggagag-3!);SUT6R1 (5r -tcagcggaatgagaatgcgat-3!); b、用于扩增甘蔗蔗糖转运蛋白SoERD6基因5'端的引物SUT6SYR1 (5! -gtgaaaccgaactggatgggacc-3!);SUT6SYR2 (5r -tacaatgagcgtgcagagcgtgg-3!); C、扩增甘蔗甘蔗蔗糖转运蛋白SoERD6基因3'端的引物 SUT6XYR1:(5, -tggaggaacctttgctatctatg-3!);SUT6XYR2 (5' -tgctgtgtctaccatggccctca-3!)。
全文摘要
本发明公开了一种甘蔗蔗糖转运蛋白ERD6基因及其编码蛋白序列,在对所有植物蔗糖转运蛋白ERD6基因全长序列进行比对分析的基础上,在植物蔗糖转运蛋白ERD6基因序列的保守区设计引物,从甘蔗幼嫩叶片提取总RNA,并经反转录,用常规PCR法扩增,结合RACE PCR技术克隆到甘蔗蔗糖转运蛋白SoERD6基因的全长cDNA序列。不仅为研究甘蔗蔗糖转运蛋白ERD6基因的转录和表达机制,进一步探讨蔗糖在甘蔗体内的运输和在蔗茎中积累机理奠定基础,而且通过氨基酸序列可以获得具有生物活性的纯化蛋白,进一步用于研究蔗糖转运蛋白的生物学功能及利用该基因进行甘蔗高糖品种改良。
文档编号C07K14/415GK102925461SQ201210473830
公开日2013年2月13日 申请日期2012年11月21日 优先权日2012年11月21日
发明者杨丽涛, 牛俊奇, 李杨瑞, 黄静丽 申请人:广西大学