专利名称::麻疯树鲨烯合酶蛋白编码序列及其在植物中的应用的制作方法
技术领域:
:本发明涉及分子生物学、基因工程
技术领域:
。具体地,本发明涉及一种在麻疯树中表达的jc-sqs蛋白(麻疯树鲨烯合酶蛋白,JatrophacurcasSqualeneSynthase,JCSQS)及其核酸序列。
背景技术:
:麻疯树中含有多种化学成份,从麻疯树中分离得到的化学成份有萜类、黄酮类、香豆素类、脂肪类、甾醇类、生物碱类和蛋白质类等物质。目前,从麻疯树中分离得到的甾醇类物质主要是e-谷甾醇(13-sitostero1),胡萝卜甾醇(daucosterol),豆甾醇(sterolsstigma-sterol)和类甾醇(steroidsapogenins)。天然植物甾醇对人体有重要作用,目前广泛被应用于防治冠心病、动脉粥样硬化、前列腺疾病的治疗中,它能抑制人体对胆固醇的吸收,促进胆固醇降解代谢,抑制醇的生化合成。尤其是豆甾醇,具有较强的抗炎和消炎作用而被直接应用于抗炎药物。在植物的异戊二烯合成途径中,鲨烯合酶催化法呢基焦磷酸(FPP)生成鲨烯,继而生成三砲、甾醇、胆固醇等萜烯类重要物质,鲨烯合酶作为该过程的关键酶,其活性直接影响到后续过程产物的产量(GoldsteinJL,BrownMS.Regulationofthemevalonatepathway.Vfe^/re,1990,343:425430)。这一设想在刺五加中被证实,实验表明,过量表达人参SQS基因的刺五加中,植物甾醇含量和三萜皂苷含量增加了2-2.5倍(Jin-WookSeo等,OverexpressionofsqualenesynthaseinEleutherococcussenticosusincreasesphytosterolandtriterpeneaccumulation,PHYTOCHEMISTRY,2005,66:869-877)。因而,通过基因工程手段提高SQS基因表达量可提高麻疯树中甾醇含量。在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的编码麻疯树鲨烯合酶的cDNA序列。本发明中有关麻疯树鲨烯合酶基因的克隆以及功能研究受到国家自然科学基金(30771745)资助。
发明内容本发明的目的在于克服现有技术中的不足,提供一种麻疯树JcSQS蛋白编码序列。其包含所说基因的融合基因构建体,携带该构建体的新的重组表达载体,被所说的表达载体转化植物细胞,以及由转化细胞产生的所说基因的转基因植物及其后代,包括植物种子及植物组织,所获得转基因植物将具有提高植物中甾醇的含量。本发明通过以下技术方案实现,本发明所分离出的DNA分子包括编码具有麻疯树JcSQS蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在40-55'C条件下与SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列杂交。所述的编码具有SEQIDNO.2所示的氨基酸序列的多肽。所述的序列具有SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列。本发明分离出的麻疯树JcSQS蛋白多肽,它包括具有SEQIDNO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。所述的蛋白多肽是具有SEQIDNO.2序列的多肽。本发明所提供的载体DNA分子转化的宿主细胞,它是真核细胞。该宿主细胞包含所述的DNA分子中8-100个连续核苷酸。在本发明中,"分离的"、"纯化的"DNA是指,该DNA或片段己从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段己经与天然状态下伴随核酸的组分分开,而且己经与在细胞中伴随其的蛋白质分开。在本发明中,术语"麻疯树JcSQS蛋白(或多肽)编码序列"指编码具有麻疯树JcSQS蛋白活性的多肽的核苷酸序列,如SEQIDNO.1中第114-1352位核苷酸序列及其简并序列。该简并序列是指,位于SEQIDNO.l序列的编码框第114-1352位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQIDNO.l中第114-1352位核苷酸序列同源性低至约70%的简并序列也能编码出SEQIDN0.2所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQIDNO.51中从核苷酸第114-1352位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQIDNO.l中从核苷酸第114-1352位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。该术语还包括能编码具有与天然的麻疯树JcSQS蛋白相同功能的蛋白的SEQIDNO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-IO个)核苷酸的缺失、插入和/或取代,以及在5'和/或3'端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。在本发明中,术语"麻疯树JcSQS蛋白或多肽"指具有麻疯树JcSQS蛋白活性的SEQIDNO.l序列的多肽。该术语还包括具有与天然麻疯树JcSQS蛋白相同功能的SEQIDN0.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地l-30个,更佳地l-20个,最佳地1-IO个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括麻疯树JcSQS蛋白的活性片段和活性衍生物。本发明的麻疯树JcSQS蛋白多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与麻疯树JcSQS蛋白DNA杂交的DNA所编码的蛋白、以及利用麻疯树JcSQS蛋白多肽的血清获得的多肽或蛋白。在本发明中,"麻疯树JcSQS蛋白保守性变异多肽"指与SEQIDNO.1的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。表l<table>tableseeoriginaldocumentpage6</column></row><table>Cys(C)SerSerGin(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAlaHis(H)Asn;Gin;Lys;ArgArglie(I)Leu;Val;Met;Ala;PheLeuLeu(L)lie;Val;Met;Ala;PhelieLys(K)Arg;Gin;AsnArgMet(M)Leu;Phe;lieLeuPhe(F)Leu;Val;lie;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;PheTyrTyr(Y)Trp;Phe;Thr;SerPheVal(V)lie;Leu;Met;Phe:AlaLeu表2为本发明的麻疯树/c6V5"与绿玉树(^//wr&'a"rwca〃i)价邻S的核苷酸序列的同源比较(GAP)表。表2dbj|AB433916.l|EuphorbiatirucalliEtSSmRNAforsqualenesynthetase,completecdsLength=4236Score=1290bits(698),Expect=0』Identities=1037/1201(86%),Gaps=22/1201(1%)Strand=Plus/PlusQuery114ATGGGGAGTTTAGGTGCGATTTTGAAACATCCAGATGACTTATACCCACTTTTGAAGCTC173Sbjct1ATGGGGAGTTTGGGAGCGATTCTGAGGCATCCAGATGATTTTTACCCGCTTTTGAAGCTC60Query174AAAATGGC-TGCAAGGCATGCAGAGAAGCAGAT-CCCACCCGAACCTCATTGGGGTTTCT231iiiiiiiiiiiiiiiiiiiiiiiimilmiimiiiimmimSbjct61AAAATGGCTTCCAA-GCATGCAGAGAAACAGATCCCCGCAC-AACCTCACTGGGGTTTCT118Query232GTTACTCTATGCTTCATAAGGTTTCTCATATCTTTGCTCTTGTTATTCAACAGCTTGGCASbjct119GTTATTCCATGCTTCATAAGGTCTCTCGTAGCTTTGCTCTCGTCATTCAACAGCTTGGGA291178Query292CTGMCTTCGAGATGCTGTATGCATATTTTATTTGGTTCTTCGAGCCCTTGACACAGTTG351miiiiiiimiliiiimmmmmmmmimmiSbjct179CTGAGCTCCGCGACGCTGTCTGTATATTCTATTTGGTTCTTAGAGCCCTTGACACTGTTG238Query352AGGATGATACAAGCATACCTACAGATGTCAAAGTGCCTATCCTGATAGCTTTTCAC-CGT410Sbjct239AGGATGATACAAGCATCCCCACAGATGTGAAAGTGCCTATCTTGATAGCTTTTCACAAG-297Query411CACATATATGATCAAGACTGGCATTTTTCATGTGGTGCTMGGACTATAAAGTTCTCATG470Sbjct298CACATATATGATCGTGAATGGCATTTTTCTTGTGGTACTAAGGATTATAAAGTTCTCATG357Query471GATCAGTTTCACCATGTTTCMCAGCTTTTCTAGAGCTTGGGAAAAGTTATCAGGAGGCA530Sbjct358GACCAGTTTCATCATGTGTCAACTGCTTTTCTTGAGCTTGGCAAAAGTTATCAGGAGGCA417Query531ATTCAGGATATTACGAAAAGAATGGGTGCAGGAATGGCTAAATTCATATGCAAGGAGGTG590Sbjct418ATTGAGAATATTACAAAAAGAATGGGTGCTGGMTGGCTAAATTCATATGCAAAGAGGTG477Query591GAAACAATTGATGACTACGATGMTATTGCCATTATGTAGCAGGACTTGTTGGACTAGGC650Sbjct478GAAACCGTTGATGACTACGATGMTATTGCCATTATGTGGCAGGACTTGTCGGACTAGGT537Query651CTGTCCAAGCTTTTCCATGCCTCTGAATTG~GAAGATTTGGCACCAGATG-TCCTTTCCA708Sbjct538CTTTCCAAACTTTTTTATGCCTCTGG~TTCCGAAGATTTGGCACCAGATCATC-TTTCCA595Query709ACTCAATGGGTTTATTTCTTCAGAAAACAAACATTATTCGAGATTATCTGGAGGACATAA768Sbjct596ACTCGATGGGGTTATTTCTTCAGAAAACAAACATTATCCGGGATTATTTGGAGGATATAA655Query769ATGAGATACCCMGTCACGCATGTTTTGGCCTCGCCAGATCTGGAGTAAATATGTTGACA828Sbjct656ATGAGATACCTAAGTCACGAATGTTTTGGCCTCGGCAGATCTGGAGTAAATATGTTAACA715Query829AACTTGAGGACTTGAAATATGAAGAGAACT(HJCTCAAGGCAGTGCGATGCTTGAATGAT887mimmmmmiimiimimmmmimimmiSbjct716AACTTGAGGACTTAAAATATGAAGAAAACTCAG"TCAAGGCAGTGCAATGCCTGAATGAT774Query888ATGGTGACAAATGCTCTGATGCATGTGGATGACTGCTTGAAGTACATGTCTGCATTGCGT947Sbjct775ATGGTTACTAATGCTTTGATACATATGGATGATTGCTTGAAATACATGTCTGCACTACGA834Query948GATCCTGCTATATTTCGATTTTGTG-CAATCCCCCAGATMTGTCMTTGGMCACTAGC1006iimmmimimmmiimiimmiimmi111111Sbjct835GATCCTGCTATATTTCGATTTTGTGGCA-TCCCTCAGATAATGGCAATTGGTACCCTTGC893Query1007ATTGTGCTACAACMCATCGAAGTATTCAGAGGTGTTGTCAAGATGAGGCGTGGTCTMC1066Sbjct894ATTGTGCTACMCMCATCGAAGTATTTAGAGGCGTAGTGAAGATGAGGCGTGGTCTTAC953Query1067TGCTAAGGTCATTTATCAAACAAAAAGTATGGCCGATGTATATGGTGCTTTCTTT-GATT1125miiimmiimilimilmilmi1111m11iSbjct954TGCAAAGGTCATTGACCGAACAAGGACCATGGCAGATGTCTATAGAGCCTT-TTTCGACT1012Query1126TCTCCTGTATGCTCAAGTCCAAGGTCGACATGAGTGATCCAAATGCAGAAAAGACATT-A1184Sbjct1013TCTCTTGTATGATGAAATCCAAGGTTGACAGGAATGATCCTAATGCGGAAAAGACACTGA1072Query1185AGCAGGCTGGAAGG"GATACAAAAAGCATGCCAGGAGTCTGGGCTTCTAAACAAAAGGM1243imilmiimiiiiiiillmimmimilimmiSbjct1073AT-AGGCTCGAAGCAG~TACAAAAAACTTGCAAGGATTCTGGGATGCTAAATAAAAGGM1130Query1244ATCATACATTMTAGG-AGTAAGCCAAGATACMTTCTGCACTGATTGTCCTACTTTTTG1302illimimiiiiiimiiiimimmimmilmiSbjct1131ATCTTACATAAAT~GGCAGCMTCCAATTTATMTTCTGCTCTGCTTGTTCTACTATTTG1189Query1303T1303Sbjct1190T1190Query:麻疯树/c5"0的核酸序列Sbjct:绿玉树的核酸序列(AB433916)表3为本发明的麻疯树JcSQS蛋白的氨基酸序列与柿树DkSQS的氨基酸序列的同源比较(FASTA)表,其中,相同的氨基酸在两个序列之间用氨基酸单字符标出。表3gb|ACN69082.l|squalenesynthase[Diospyroskaki]Length=415Score=763bits(1971),Expect=0.0,Method:Compositionalmatrixadjust,Identities=357/413(86%),Positives=390/413(94%),Gaps=0/413(0%)9Query1MGSLGAILKHPDDLYPLLKLKMAARHAEKQIPPEP冊GFCYSMLHKVSRSFALVIQQLGT60MGSLA+L+HPDD+YPL+KLKMAARHAEKQIPPEP冊FCY+MLHKVSRSFLVIQQLGTSbjct1MGSLAAMLRHPDDVYPLVKLKMAAFHAEKQIPPEP冊AFCYTMLHKVSRSFGLVIQQLGT60Query61ELRDAVCIFYLVLRALDTVEDDTSIPTDVKVPILIAFHRHIYDQDWHFSCGAKDYKVLMD120ELR+AVCIFYLVLRALDTVEDDTSIT+VKVPIL+AFHHITO+D冊FSCG++YKVLMDSbjct61ELRNAVCIFYLVLRALDTVEDDTSIATEVKVPILLAFHHHIYDRD冊FSCGTREYKVLMD120Query121QFHHVSTAFLELGKSYQEAIEDITKRMGAGMAKFICKEVETIDDYDEYCHYVAGLVGLGL180+FHHVSTAFLELGKYQEAIEDITRMGAGMAKFICKEVETIDDYDEYCHYVAGLVGLGLSbjct121EFHHVSTAFLELGKGYQEAIEDITMRMGAGMAKFICKEVETIDDYDEYCHYVAGLVGLGL180Query181SKLFHASELEDLAPDVLSNSMGLFLQKTNIIRDYLEDINEIPKSRMFWPRQIWSKYVDKL240SKLFHASLEDLAPDLSNSMGLFLQKTNIIRDYLEDINEIPKSRMFWPRQIWSKYV+KLSbjct181SKLFHASGLEDLAPDSLSNSMGLFLQKTNIIRDYLEDINEIPKSRMFWPRQIWSKYVNKL240Query241EDLKYE鹏LKAVRCLNDMVTNALMHVDDCLKYMSALRDPAIFRFCVIPQIMAIGTLALC300EDLKYE+NS+K+V+CLNDMVTNAL+HVDDCLKYMSALRDPAIFRFCIPQIMAIGTLALCSbjct241EDLKYEKNSVKSVQCLNDMVTNALIHVDDCLKYMSALRDPAIFRFCAIPQIMAIGTLALC300Query301YNNIEVFRGWKMRRGLTAKVIYQTKSMADVYGAFFDFSCMLKSKVDMSDPNAEKTLSRL360YNNIEVFRGWKMRRGLTAKVIQTK+++DVYGAFFDFSCMLKSKV++DPN+KTLSR+Sbjct301YNNIEVFRGWKMRRGLTAKVIDQTKTISDVYGAFFDFSCMLKSKVEKNDPNSTKTLSRI360Query361EGIQKACQESGLLNKRKSYINRSKPRYNSALIVLLFVILSIVFSYLSANRPSI413EIQKC+ESGL+KRKSYIRSK+NSLI+LF+IL+I+F+YLSANRPISbjct361EAIQKTCRESGTLSKRKSYILRSKRTHNSTLIFVLFIILAILFAYLSANRPPI413Query:麻疯树JcSQS氨基酸序列Sbjct:柿树(Z7/o印jrasAaA"/Li肌f.)DkSQS氨基酸序列(GenBankAccessionNo.ACN69082)本发明还包括麻疯树JcSQS蛋白或多肽的类似物。这些类似物与天然法呢基焦磷酸合酶多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如0、Y-氨基酸)的类似物。应理解,本发明的多肽并不限于上述列举的代表性的多肽。修饰(通常不改变一级结构)形式包括体内或体外多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化的氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)序列。还包括被修饰从而提高了其蛋白水解性能或优化了溶解性能的多肽。在本发明中,可选用本领域己知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的麻疯树JcSQS蛋白多肽时,可以将麻疯树JcSQS蛋白编码序列可操作地连于表达调控序列,从而形成麻疯树JcSQS蛋白表达载体。如本发明所用,"可操作地连于"指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,"可操作地连于"意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。在本发明中,术语"宿主细胞"为真核细胞。常用的真核宿主细胞包括酵母细胞、麻疯树细胞和其它植物细胞。还可用Northern印迹法技术分析麻疯树JcSQS蛋白基因产物的表达,即分析麻疯树jc-sqs蛋白的RNA转录物在细胞中的存在与否和数量。此外,本发明中可用作探针的核酸分子,该分子通常具有麻疯树JcSQS蛋白核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码麻疯树JcSQS蛋白的核酸分子。本发明涉及检测样品中是否存在麻疯树JcSQS蛋白核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于麻疯树JcSQS蛋白核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。11此外,根据本发明的麻疯树JcSQS蛋白核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选麻疯树JcSQS蛋白同源基因或同源蛋白。为了得到与麻疯树JcSQS蛋白基因相关的麻疯树cDNAs的点阵,可以用DNA探针筛选麻疯树cDNA文库,这些探针是在低严紧条件下,用32P对麻疯树JcSQS蛋白的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自麻疯树的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,PaloAlto。这种筛选方法可以识别与麻疯树JcSQS蛋白的基因家族的核苷酸序列。本发明的麻疯树JcSQS蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得到有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可通过化学合成将突变弓1入本发明的蛋白序列中。除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,1969Solid-PhaseP印tideSynthesis,WHFreemanCo.,SanFrancisco;MerrifieldJ.1963J.AmChem.Soc85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用AppliedBiosystems的431A型肽合成仪(FosterCity,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。利用本发明的麻疯树JcSQS蛋白,通过各种常规筛选方法,可筛选出与麻疯树JcSQS蛋白发生相互作用的物质,或者受体、抑制剂或拮抗剂等。本发明的麻疯树JcSQS蛋白基因可通过基因工程技术用来提高植物中萜类物质的含量,生产新药源化合物。因而本发明具有很大的应用前景。图1是将麻疯树SQS蛋白的氨基酸序列在NCBI数据库中检索的结构域。图2是麻疯树SQS蛋白的疏水性分析,其中,疏水性分析图是基于Kyte和Doolittle报道的氨基酸的疏水值而建立的。图3是麻疯树SQS蛋白的氨基酸跨膜分析。具体实施例方式下面结合实验室具体的试验数据和结合具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆实验室手册(NewYork:ColdSpringHarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。实施例l麻疯树JcSQS蛋白基因的克隆1.组织分离(isolation)麻疯树种子来源于四川省攀枝花地区,麻疯树种子采集后,放在实验室保存。2.RNA的分离(RNAisolation)将麻疯树种子的种皮剥掉,取出种仁,用研钵研碎,加入液氮后,研磨成粉后,取100mg移至1.5mLEP管中,抽提总RNA(两步裂解法)。用甲醛变性胶电泳鉴定总RNA质量,然后在分光光度计上测定RNA含量。3.基因的全长克隆(CloningofFull-lengthcDNA)根据一些植物SQS的氨基酸保守序列,设计兼并引物,利用同源性基因克隆原理,采用SMARTRACEcDNA扩增方法(Clonetech试剂盒)进行cDNA全长克隆,分四个阶段进行(1)核心序列的克隆13PCR(JcSQSF+JcSQSR)得到JcSQS-1(383bp),回收,连接到pMD-18T载体上,用M13F或M13R作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsingroup,USA)中的BLAST和FASTA软件搜索已有的数据库(GeneBank+EMBL),知其核苷酸序列及编码蛋白与己知的植物如大豆(Wyc&e等的SQS基因的同源性很高,故初步认为它是一个SQS基因。(2)3,-RACE根据核心序列的扩增的结果,设计两个正向特异引物(JcSQSFl和JcSQSF2)。采用二次PCR扩增方法进行。第一次PCR(JcSQSFl+AP)得到PCR产物,稀释100倍后,用其做模板,进行第二次PCR(JcSQSF2+AP),得到JcSQS-3(8%bp),回收,连接,测序过程同(l))。(3)5,-RACE根据核心序列的扩增的结果,设计两个反向特异引物(JcSQSRl和JcSQSR2)。采用二次PCR扩增方法进行。第一次PCR(JcSQSRl+UPM)得到PCR产物,稀释100倍后,用其做模板,进行第二次PCR(JcSQSR2+NUP),得到JcSQS-3(87%p),回收,连接,测序(过程同(l))。(4)编码序列的克隆将核心序列、5'RACE与3'RACE测序结果序列比对并进行拼接,得到全长片段序列信息,并设计寡核苷酸序列JcSQSFl:5'-ATGGGGAGTTTAGGTGCGATTTTGAA-3,(SEQIDNO.3)为正向引物,寡核苷酸序列JcSQSRl:5'-CTAGATACTTGGTCGATTTGCAGAA-3'(SEQIDNO.4)为反向引物,以总RNA为模板,进行RT-PCR扩增,PCR条件为94°C5分钟,随之以94°C1分钟、58°C1分钟和72°C2分钟进行35个循环,最后以72°C延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为1242bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQIDNO.3和SEQIDN0.4所示的序列。实施例2麻疯树JcSQS蛋白基因的序列信息与同源性分析本发明新的麻疯树JcSQS蛋白全长cDNA的长度为1609bp,详细序列见SEQIDNO.l,其中开放读框位于114-1352位核苷酸。根据全长cDNA推导出麻疯树JcSQS蛋白的氨基酸序列,共413个氨基酸残基,分子量47234.03,pi为6.89。详细序列见SEQIDNO.2。将麻疯树JcSQS蛋白的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank+EMBL+鹏J+PDB和Non-redundantGenBankCDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现麻疯树SQS基因的核苷酸序列与其它植物的核苷酸序列如绿玉树(£wpAorZ^a"r"ca7力')(AB433916),三七(尸朋a;r/otow'/3se/7g)(DQ186630),人参(Zkwar,'/7。〃e/b2i〃5")(細2456),光果甘草(67yc/rr//za《7a6ra)(D86409)等有一定的同源性。但麻疯树SQS的氨基酸序列与其它植物的氨基酸序列有着更广泛和较高的相似性,如与麻疯树SQS的氨基酸序列与其它植物的氨基酸序列有着广泛的相似性,如与蓖麻(允ccM7"/is)(EEF49485),柿("ias"AKm(ACN69082),葡萄(K/Wspa'/i/era)(CA047232),杨树(/^/〃7〃strz'c力ocarpa)(EEE87720),大豆(67/ci/e历a力(BAA22559),绿玉树(f〃p力or力ia">固77/)(BAH23429)的一致性分别为88%、85%、86%、85%,86%和87%,相似性分别为95%、94%、93%、93%,93%和95%。实施例3麻疯树SQS蛋白的结构特征分析1.麻疯树SQS蛋白的结构域分析将麻疯树SQS蛋白的氨基酸序列在NCBI数据库(网址为http:〃www.ncbi.nlm.nih.gov/Blast,cgi)中检索结构域,得到结果如图1所示在氨基酸序列中,存在异戊烯基焦磷酸合成酶(Trans-IsoprenylDiphosphateSynthases,Trans一IPPS)的催化位点(即序列表中SEQID.1自氨基端(N端)第38-320位氨基酸残基。2.麻疯树SQS蛋白的疏水性分析对转运肽剪切后的成熟SQS进行分析,发现其含有多个疏水性区域,尤其是第386-408位氨基酸疏水性很强,具有明显的跨膜趋势(图2)。3.麻疯树SQS蛋白的转运肽及氨基酸跨膜分析通过TMH固预测发现成熟SQS具有两个跨膜区,分别为281-303位氨基酸及386-408位氨基酸,这表明麻疯树成熟SQS是跨膜结合蛋白,具有两个与膜固定结合的位点(图3)。实施例4麻疯树鲨烯合酶cDNA的活性分析在该实施例中,将全长的麻疯树JcSQS编码序列或片段构建入商品化的蛋白质融合表达载体之中,以鉴定JcSQS的活性。1.麻疯树JcSQS原核表达载体的构建以及大肠杆菌转化根据麻疯树JcSQS的氨基酸序列,设计蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET30a(+)-vector载体而定),以便构建原核表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将麻疯树JcSQS基因在保证阅读框正确的前提下克隆至Pet30a(+)-vector(Merck)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21(DE3),筛选鉴定得到含有JcSQS表达载体的工程菌BL21(DE3)-JcSQS。2.重组麻疯树鲨烯合酶的表达和纯化含有重组表达质粒pET30a(+)-JcSQS的大肠杆菌BL21(DE3)单克隆分别接入5mL含有50g/mL卡那霉素的LB培养基,37'C培养过夜,次日稀释100倍继续培养至OD咖^为0.6时加入终浓度为0.5mmol/L的IPTG(isopropy1-beta-D-thiogalactoside),28。C诱导表达8h。离心收集细菌培养物,磷酸盐缓冲液(50mmol/LPBS,pH7.2)重悬,超声波冰上破碎。12000r/min离心10min,取上清过Nr-琼脂糖柱(北京卓冠科技有限公司),取适量洗脱液SDS—PAGE检测。Brandford法测定蛋白含量。3.重组鲨烯合酶的功能鉴定取经N:T-琼脂糖柱纯化的重组鲨烯合酶蛋白10g,加入500uL反应体系(50mrao1/L磷酸缓冲液pH7.2,含50umol/LFPP,25mmo1/LMgCl"25,1/L巯基乙醇,5ramo1/LNADPH),上覆200uL正己烷,37。C反应5h,充分漩涡振荡后IO000r/min离心,取上层正己烷抽提物GC—MS检测反应产物。GC—MS分析条件为120°C3min,15'C/min升至180。C,25。C/min升至260°C,保持25min,溶剂切割6min;进样口温度260"C,离子源温度230'C.GC一MS仪器为岛津GC—MS—QP2010,色谱柱为DB—5ms(30mXO.25mm)。经测定,催化产物单一,质谱图与鲨烯标准品质谱图相似度高,认定催化产物为鲨烯,从而认定克隆所得的麻疯树/c5"。堪因全长cDNA所编码蛋白具有鲨烯合酶的功能。实施例5麻疯树鲨烯合酶cDNA的功能分析在该步骤中,将编码麻疯树鲨烯合酶的cDNA序列构建入植物表达载体之中,并转化烟草,以鉴定其功能。1.植物表达载体的构建依据麻疯树鲨烯合酶全长cDNA序列(表l),设计扩增出完整阅读框的引物,分别在正反引物上引入限制性内切酶位点。以实施例1步骤3中获得的扩增产物为模板,经PCR扩增后,保证麻疯树鲨烯合酶的阅读框完全正确。用内切酶酶切,载体p2300用也用相同的内切酶酶切,分别回收目的片段。将经酶切的麻疯树鲨烯合酶cDNA的目的片段与经相应内切酶切过的p2300载体连接,转化大肠杆菌DH5a,37°C培养20h,进行重组子的PCR鉴定和酶切鉴定。2.植物表达载体转化农杆菌(1)取一份感受态农杆菌EHA105,加入含麻疯树鲨烯合酶cDNA的植物表达载体约lpg,轻轻混匀;(2)于液氮中速冻2分钟,37。C温育5分钟;(3)加入500叱YEB液体培养基,28'C轻摇2-4小时,消除感受态;(4)分别取50-200^菌液,分别涂布于含适当抗生素的YEB选择平板上,28'C倒置培养两天。(5)鉴定呈阳性的农杆菌EHA105单菌落,接种到含50mg/L利福平,100mg/L那霉素的20ml液体YEB培养基中,于28°C恒温摇床振荡培养30个小时至对数生长期,取适量农杆菌用液体MS培养基稀释20-30倍。3.烟草的遗传转化及再生(l)取无菌烟草叶片,切除叶片边缘与中脉,于Ms+1.0mg/LNAA固体培养基中28'C预培养2天;17(2)重新取出材料,放入无菌MS液体培养基稀释过的带有目的基因的农杆菌中,浸泡15分钟,然后在有28'C摇床中低速摇15分钟;(3)取出小叶片,用无菌滤纸吸去多余菌液,于MS固体培养基中28'C暗培养两天;(4)把小叶片,用加100mg/LCb的无菌水洗两次,无菌滤纸吸去多余菌液后,转入含100mg/LKm和100mg/LCb分化培养基Ml中,28。C光下培养至分化出愈伤组织,直至长出芽,其间每15天继代一次;(5)将长至3-5cm的芽转入生根培养基1/2MS上诱导生根。(6)经鉴定为阳性转基因烟草后,继续培养成苗。4.转基因烟草叶片植物甾醇的提取(1)取各转基因烟草叶片,迅速冷冻干燥,制成冻干粉,置真空干燥箱中避光保存,并尽并尽快测定。(2)准确称取冻干粉l.OOOg于具塞三角瓶中,加入甲醇10ml,摇匀,盖上瓶塞,用超声波提取20分钟,过滤于lOmL容量瓶中并定容。取20nL上机测定。5.高效液相色谱-蒸发光散射检测器法测定转基因烟草叶片植物甾醇(1)豆甾醇和P-谷甾醇标准品的制备分别称取豆甾醇和e-谷甾醇标准品(ACROS公司产品)l.Omg,各用少量甲醇溶解,溶液转入25.0ml容量瓶中定容,浓度为0.04mg/ml,冰箱保存。临用时,吸取1.Oml于10.0ml容量瓶中,加流动相至刻度,此时浓度为0.004mg/ml。(2)测定方法:流动相甲醇-乙腈(75:25,V:V),流速1.0mL/min;ELSD参数漂移管温度40°C,增益6,载气压力3.6bar。18本发明涉及的序列及记号分列如下<110>复旦大学<120>麻疯树SQS蛋白编码序列<160>2<170>Patentlnversion3.1〈210〉1<211>1609<212>迈咖A<213>麻疯树(/a加/力acarcasL.)<220>〈221>CDS〈222〉(114)..(1352)<223><400>1TTCTGCAAAAACCATTACCCGGATCTGACAATAGATGACTTATACCCAAspAspLeuTyrPro15GAGAAGCAGATCCCAGluLysGinliePro30CTTCATAAGGTTTCTLeuHisLysValSer45ACTGAACTTCGAGATThrGluLeuArgAsp60CTTGACACAGTTGAGUuAspThrValGlu80CCTATCCTGATAGCTProlieLeulieAla95TTTTCATGTGGTGCT19ACGCGGGGGTACAAACTCATCCGTCATCTCCATCTCTGTCAAATTTGCATATAAACTCMATTTTGGGTTGAAAATCAAAATGGGGAGTTTAGGTGCGATTTTGAAACATCCAMetGlySerLeuGlyAlalieLeuLysHisPro1510CTTTTGAAGCTCAAAATGGCTGCAAGGCATGCALeuLeuLysLeuLysMetAlaAlaArgHisAla2025CCCGMCCTCATTGGGGTTTCTGTTACTCTATGProGluProHisTrpGlyPheCysTyrSerMet3540CATATCTTTGCTCTTGTTATTCAACAGCTTGGCHisliePheAlaLeuVallieGinGinLeuGly5055GCTGTATGCATATTTTATTTGGTTCTTCGAGCCAlaValCysliePheTyrUuValLeuArgAla657075GATGATACAAGCATACCTACAGATGTCAAAGTGAspAspThrSerlieProThrAspValLysVal8590TTTCACCGTCACATATATGATCAAGACTGGCATPheHisArgHis100AAALysAAGGACLysAspTTTPheAAALys145ACAThrCTALeu130AGAArgATTlieAACAsnCGCArg225GAGGluCCCProGAAGlu305GTCValTATTyr115GAGGluGGACTAGlyLeuGCACCAAlaProATTlie210ATGMetGACAspAATGATAsnAspTACATGTyrMetCAGGin290GTAValATTlieGGCGlyGATAsp195ATTlieTTTPheTTGLeuATGMetTCTSer275ATAlieTTCPheTATTyrlieTyrAspGinAspTrpHisPheSer105CAGTTTCACCATGinPheHisHisGTTValCTCLeuATGMetCTTLeuGGGAAAGlyLysATGGGTMetGlyGATGACAspAspCTGLeu180GTCValCGAArgTGGTrpAMLysGTGVal260GCAAlaATGMetAGAArgCMGinGCAAlaTACTyr165TCCSerGGAGly150GATAspAAGLysCTTTCCLeuSerGATTATAspTyrCCTProTATTyr245ACAThrTTGLeuTCASerGGTGlyACAThr325CGCArg230GAAGluAATAsnCGTArgATTlieGTTVal310AAALysAGTSer135ATGMetGAAGluCTTLeuMCAsnCTGLeu215CAGGinGATAsp120TATTyrGCTAlaTATTyrTTCPheTCASer200GAGGluATClieGAGAACGluAsnGCTCTGAlaLeuGATAspGGAGly295GTCValCCTPro280ACAThrAAGLysCAGGAGGinGluAAATTCLysPheTGCCysCATHis185ATGMetCATHis170GCCAlaGGTGlyGACATAAsplieTGGAGTTrpSerAGTATGSerMetTCGSerATGMet265GCTAlaCTALeuATGMetGCCAlaGCAAlaATAlie155TATTyrATTlie140TGCCysGTAValTCTGAASerGluTTATTTLeuPheCTCLeu250CATHisATAlieGCAAlaAGGArgGATAsp330AATAsnAAALys235MGLysGAGGlu220TATTyrGCAAlaGTGGATValAspTTTCGAPheArgTTGLeuCGTArg315GTAValTGCCys300GGTGlyTATTyrGTTVal125GAGGluMGLysGCAAlaTTGLeuCTTLeu205ATAlieGTTValGTGValGACAspTTTPhe285TACTyrCTALeuGGTGlyCysGlyAla110TCASerACAGCTThrAlaGATAspGAGGluGGAGlyGAAGlu190CAGGinCCCProGACAspCGAArgTGCCys270TGTCysMCAsnACTThrGCTAlaATTACGlieThrGTGGAAValGlu160CTTGTTLeuVal175GATTTGAspLeuAAAACALysThrMGTCALysSerAAACTTLysLeu240TGCTTGCysLeu255TTGAAGLeuLysGCAATCAlalieMCATCAsnlieGCTAAGAlaLys320TTCTTTPhePhe335CTCAAGTCCAAGGTCGACLeuLysSerLysValAsp345AGCAGGCTGGAAGGGATASerArgLeuGluGlylie360AACAAAAGGAAATCATACAsnLysArgLysSerTyr375GCACTGATTGTCCTACTTAlaLeulieValLeuLeu390395CTTTCTGCAMTCGACCALeuSerAlaAsnArgPro410GATTTCTCCTGTATGAspPheSerCysMet340GCAGAAAAGACATTAAlaGluLysThrLeu355GAGTCTGGGCTTCTAGluSerGlyLeuLeu370CCAAGATACMTTCTProArgTyrAsnSer385ATCGTTTTCTCTTATlieValPheSerTyr405GACTCTGTTCMCTTTGTTCACAGAATATTGTAATGCCAGAAAGTTTGCACCCCCTTAACTACTCTACTCTTAATTGTGGAAAAAAAATGACTTGCTCCATCGAACTAAGTCTGTTCCCTGATATTTCCTGAAATCCCATTTAGTTATGGTGGAGCAATMTATTAAATGAGTGATCCAMTMetSerAspProAsn350CMAAAGCATGCCAGGinLysAlaCysGin365ATTAATAGGAGTAAGlieAsnArgSerLys380TTTGTAATACTGTCCPheVallieLeuSer400AGTATCTAGAGATTGTSerlieTCGTCTTTTACAATCTTTGCAAACAAAAAGGCCTATAAGTACTTATTGCTTGATTGTTGTGATTGTAAAGTGCAAAAAAA<210>2<211>413〈212>PRT<213>麻疯树(/atro/AacarcasL.)<400>2MetGlySerLeuGlyAlalie15LeuLeuLysLeuLysMetAla20ProGluProHisTrpGlyPhe35HisliePheAlaLeuVallie5055AlaValCysliePheTyrLeu6570AspAspThrSerlieProThr85PheHisArgHislieTyrAsp100LeuLysHisProAspAspLeuTyrPro1015AlaArgHisAlaGluLysGinliePro2530CysTyrSerMetLeuHisLysValSer4045GinGinLeuGlyThrGluLeuArgAsp60ValLeuArgAlaLeuAspThrValGlu7580AspValLysValProlieLeulieAla9095GinAspTrpHisPheSerCysGlyAla105110LysPheLys145ThrGlyAlaAsnArg225GluAsnTyrProGlu305ValAspAlaGluPro385lieAspTyrLysVal115LeuGluLeuGly130ArgMetGlyAlalieAspAspTyr165LeuGlyLeuSer180ProAspValLeu195lielieArgAsp210MetPheTrpProAspLeuLysTyr245AspMetValThr260MetSerAlaLeu275GinlieMetSer290ValPheArgGlylieTyrGinThr325PheSerCysMet340GluLysThrUu355SerGlyLeuLeu370ArgTyrAsnSerValPheSerTyr405LeuMetAspGinPheHisHisValSerThrAla120125LysSerTyrGinGluAlalieGluAsplieThr135140GlyMetAlaLysPhelieCysLysGluValGlu150155160AspGluTyrCysHisTyrValAlaGlyLeuVal170175LysLeuPheHisAlaSerGluLeuGluAspLeu185190SerAsnSerMetGlyLeuPheLeuGinLysThr200205TyrLeuGluAsplieAsnGlulieProLysSer215220ArgGinlieTrpSerLysTyrValAspLysLeu230235240GluGluAsnSerLeuLysAlaValArgCysLeu250255AsnAlaLeuMetHisValAspAspCysLeuLys265270ArgAspProAlaliePheArgPheCysAlalie280285lieGlyThrLeuAlaLeuCysTyrAsnAsnlie295300ValValLysMetArgArgGlyLeuThrAlaLys310315320LysSerMetAlaAspValTyrGlyAlaPhePhe330335LeuLysSerLysValAspMetSerAspProAsn345350SerArgLeuGluGlylieGinLysAlaCysGin360365AsnLysArgLysSerTyrlieAsnArgSerLys375380AlaLeulieValLeuLeuPheVallieLeuSer390395400LeuSerAlaAsnArgProSerlie410<210>3<211>26<212>■<213>麻疯树(/artrc;p力acurcasL.)22ATGGGGAGTTTAGGTGCGATTTTGAA<210>4<211>25<212>■<213>麻疯树(/atropAacurcasL.)〈400>4CTAGATACTTGGTCGATTTGCAGM权利要求1.一种分离出的DNA分子,其特征在于,它包括编码具有麻疯树JcSQS蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列杂交。2.如权利要求l所述的DNA分子,其特征在于,所述的序列编码具有SEQIDNO.2所示的氨基酸序列的多肽。3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列。4.一种分离出的麻疯树JcSQS蛋白多肽,其特征在于,它包括具有SEQIDNO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQIDN0.2序列的多肽。6.—种载体,其特征在于,它包含权利要求1所述的DNA。7.如权利要求6所述的载体,其特征在于,是用于构建所述植物表达载体,其中,用于构建所述植物表达载体的出发载体为P3301、BI121、pB1121、pBinl9、pCAMBIA2301、pCAMBIA1301或pCAMBIA1300。8.—种用权利要求6所述载体转化的宿主细胞,其特征在于它是原核或真核细胞。9.一种产生具有麻疯树JcSQS蛋白质活性的多肽的方法,特征在于其步骤如下(1)将编码具有麻疯树JcSQS蛋白活性的多肽的纯化的核苷酸序列可操作地连于表达调控序列,形成麻疯树JcSQS蛋白表达载体,所述的核苷酸序列与SEQIDN0.1中从核苷酸第114-1352位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成麻疯树JcSQS蛋白的重组细胞;(3)在适合表达麻疯树JcSQS蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有麻疯树JcSQS蛋白活性的基本纯的多肽。10.—种利用转基因技术将编码具有麻疯树JcSQS蛋白活性多肽的核苷酸序列转化入植物以提高植物中萜类物质的方法,其特征在于其步骤如下-(1)将编码具有麻疯树JcSQS蛋白活性的多肽的纯化的核苷酸序列可操作地连于植物表达调控序列,形成含麻疯树JcSQS蛋白的植物表达载体,所述的核苷酸序列与SEQIDNO.1中从核苷酸第114-1352位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入植物宿主细胞。其特征在于所述植物宿主为水稻、小麦、大豆、玉米、烟草、油菜、高粱、棉花、苜蓿、麻疯树或拟南芥。(3)通过筛选如抗生素筛选,获得转化细胞并最终再生转基因植株及其后代,包括植物种子及植物组织。11.一种能与权利要求7所述的麻疯树JcSQS蛋白多肽多肤特异性结合的抗体,其特征在于它包括多克隆抗体和单克隆抗体。12.—种核酸分子,其特征在于,它包含权利要求1所述的DNA分子中8-100个连续核苷酸。13.—种用于检测样品中是否存在麻疯树JcSQS核苷酸序列的方法,其特征在于它包括用权利要求10所述探针与样品进行杂交,然后检测探针是否发生了结合,该样品是PCR扩增后的产物,其中PCR扩增引物对应于麻疯树JcSQS核苷酸编码序列,并可位于该编码序列的两侧或中间,引物长度为15-50个核苷酸。全文摘要本发明涉及分子生物学、基因工程
技术领域:
。具体涉及一种在麻疯树中表达的麻疯树鲨烯合酶蛋白及其核酸序列。利用本发明的麻疯树鲨烯合酶蛋白,通过各种常规筛选方法,可筛选出与麻疯树鲨烯合酶蛋白发生相互作用的物质,或者受体、抑制剂或拮抗剂等。本发明的麻疯树鲨烯合酶蛋白基因可通过基因工程技术用来提高植物中萜类物质的含量,生产新药源化合物,具有很大的应用前景。文档编号C12N15/54GK101619320SQ200910056308公开日2010年1月6日申请日期2009年8月12日优先权日2009年8月12日发明者嵘侯,周选围,娟林申请人:复旦大学