专利名称:一种多抗复合型Bt基因及其在植物中的应用的制作方法
技术领域:
本发明涉及分子生物学、酶学、生理学以及基因工程等领域。具体地,本发明涉及一种首次根据植物偏爱密码子设计人工合成的的Bt基因核酸序列。本发明还涉及Bt基因在植物中的表达。
本发明中,我们用化学合成法,首次根据植物偏爱密码子设计了可以在植物中特别是在液泡中能够高效表达的具有持久生物活性(整个植物生长季节)的Bt蛋白及其编码序列。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中所提及的在植物液泡中高效表达的复合型Bt基因编码序列。
本发明的第二目的是提供一种在植物中持久表达的Bt基因晶体蛋白。
本发明的第三目的是提供一种在植物中表达的Bt晶体蛋白,该蛋白不但可以具有特异毒杀鳞翅目、而且具有特异毒杀鞘翅目等昆虫能力。
本发明的第四目的是提供一种利用重组技术在生产利用上述技术表达Bt蛋白及核酸序列的方法。
本发明还提供了这种新的Bt基因和编码序列在转基因植物上的应用。
在本发明的一个方面,提供了一种人工设计并合成的含有液泡定位系统的新的Bt基因的克隆载体pGEM-5zf-CryIIIA/Cry I A(c),该载体包括A.根据蛋白酶抑制剂基因和几丁质酶基因的表达特点设计的异端具有液泡定位表达作用的信号肽序列,该序列位于SEQ ID NO.5中的25-79位。B.根据植物偏爱密码子设计的具有多个与野生型Bt基因保守区段类似的核酸序列,所述的核酸序列与SEQ ID NO.5中从核苷酸第25-1871位DNA分子的核苷酸序列有至少75%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.6所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.5中从核苷酸第25-1050位的核苷酸序列。
在本发明的另一方面,提供了一种在植物中表达的Bt基因晶体蛋白,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.6序列中1-588位的多肽,更佳地,该多肽是具有SEQ ID NO.6中从18-588位的多肽。
在本发明的另一方面,还提供了几种表达载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在实例中该宿主细胞是烟草和番茄。
在本发明的另一方面,还提供了一种在植物中产生和表达具有活性的Bt基因晶体蛋白的方法,其步骤如下(1)将人工合成的编码具有Bt基因核苷酸序列可操作地连于表达调控序列,形成Bt基因表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列有至少75%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成Bt基因的重组细胞;(3)在适合表达Bt晶体蛋白的条件下,培养步骤(2)中的重组细胞;(4)再生重组细胞,获得表达Bt基因的转基因植物及其后代,包括植物种子及植物组织。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.5中第25-1871位的序列。
在本发明中,术语“Bt基因”指编码具有与不同野生型苏云金杆菌芽孢分泌的晶体蛋白(CryIIIA或者Cry I A(c))相同杀虫活性的的复合型核苷酸序列,如SEQID NO.5中第25-1871位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.5序列的编码框第25-1871位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.5中第25-1871位核苷酸序列同源性低至约75%的简并序列也能编码出SEQ ID NO.6所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ IDNO.5中从核苷酸第25-1871位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列的同源性至少75%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的Bt基因相同功能的蛋白的SEQ ID NO.5中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“Bt晶体蛋白”指具有与多个野生型苏云金杆菌晶体蛋白(CryIIIA或者Cry I A(c))相同活性的SEQ ID NO.6序列的多肽。该术语还包括具有与Bt晶体蛋白在植物中表达相同功能的SEQ ID NO.6序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-20个,较佳地1-15个,更佳地1-10个,最佳地1-5个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为15个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的在植物中偏爱的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个植物偏爱密码子所表达的氨基酸通常也不会改变蛋白质的功能。该术语还包括在植物中的表达的Bt基因的活性片段和活性衍生物。
本发明的Bt基因的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与Bt基因DNA杂交的DNA所编码的蛋白、以及利用Bt晶体蛋白的抗血清获得的多肽或蛋白。
在本发明中,“Bt晶体蛋白保守性变异多肽”是指与SEQ ID NO.6的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
发明还包括人工合成的在植物中表达的Bt晶体蛋白或多肽的类似物。这些类似物与Bt晶体蛋白的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的在植物中表达的Bt基因时,可以将Bt基因编码序列可操作地连于表达调控序列,从而形成Bt基因表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为真核细胞。常用的真核宿主细胞包括酵母细胞、烟草细胞、番茄细胞及其它植物细胞。
还可用Nothem印迹法技术分析Bt基因产物的表达,即分析Bt基因的RNA转录物在细胞中的存在与否和数量。
Bt基因RNA的Nothem印迹分析和特异抗体的Bt晶体蛋白Western印迹分析可以联合使用,以证实Bt基因在生物样本中的表达。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有Bt基因编码序列从25-1871位连续核苷酸,较佳地具有从901-1401位连续核苷酸。该探针可用于检测样品中是否存在编码的核酸分子。
本发明还提供了检测样品中是否存在核苷酸序列的Bt基因方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于Bt基因的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
本发明的Bt基因核苷酸编码序列通常可以用人工合成的方法获得。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
表2、表3分别为本发明的按植物偏爱密码子设计人工合成的Bt基因分别与野生型的CryIIIA、Cry I A(c)核苷酸序列(GenBank Accession No.M84650.1,GenBankAccession No.AF177675.1)的同源比较(GAP)表。相同的核苷酸在两个序列之间用竖线符标出。
表4、表5分别为本发明的按植物偏爱密码子设计的复合型Bt基因与野生型的CryIIIA、Cry I A(c)(GenPept Accession No.CAB41411.1,GenPept Accession No.AAD55947.1)的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸的缩写代码标出。
实施例1Bt基因的合成1.基因合成(gene synthesis)Bt基因由本实验室根据植物偏爱密码子设计并委托上海生工生物工程服务有限公司合成之后连入pGEM-5zf载体。
2.酶切(restriction enzyme cutting)将含合成基因的质粒载体用BamHI及SacI双酶切,切下合成的Bt基因;3.连接(ligation)将切下的基因连入已经用BamHI及SacI切好的质粒pBI121和改造的pCAMBIA2301植物表达载体大片段中,用蓝白筛选检测转化的大肠杆菌阳性克隆。
4.基因的PCR检测用以下序列为引物,用合成的基因为模板进行PCR检测BtF1CTAAGGATCC CATTGCCGGC CGCCATGAGA(即SEQ ID No.1)BtR1GATGTCGATG AACTCAAGCT CGGTTCCTGG(即SEQ ID No.2)PCR条件为94℃5分钟,随之以94℃1分钟、56℃1分钟和72℃1分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为1844bp。
将基因转入表达载体后用以下引物对所含基因进行PCR检测BtF2ATGACCGCTG ACAACAACAC GGAGGCCCTC(即SEQ ID No.3)BtR2CCAAGCATAG GATCAAACGA TATTATCACC(即SEQ ID No.4)PCR条件为94℃5分钟,随之以94℃1分钟、60℃1分钟和72℃1分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为1764bp。
实施例2基因的序列信息与同源性分析本发明的Bt基因的全长为1871bp(含接头),详细序列见SEQ ID NO.5,其中开放读框位于25-1871位核苷酸。根据推导出的全长Bt基因的氨基酸序列,共606个氨基酸残基,分子量为60KD,pI为7.5,详细序列见SEQ ID NO.6。
将按植物偏爱密码子设计合成的Bt基因全长序列及其编码蛋白质用BLAST程序在Non-redundant+GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与存在一定的同源性。在核苷酸水平上,它与野生型的CryIIIA、Cry I A(c)核苷酸序列(GenBank Accession No.M84650.1,GenBank Accession No.AF177675.1)的全编码序列分别有54.3%,41.2%的相同性(见表2),在氨基酸水平上,它与CryIIIA、Cry I A(c)的氨基酸残基分别有63.8%,56.8%的相似性(GenPeptAccession No.CAB41411.1,GenPept Accession No.AAD55947.1)(见表3)。由上可见,在植物中表达的野生型的CryIIIA、Cry I A(c)无论从核酸还是蛋白水平上都存在较高的同源性,可以认为两者在功能上也有很高相似性。
实施例3在烟草和番茄细胞中进行真核细胞表达含目的基因(Bt基因)表达载体的构建将含Bt基因的中间载体PGEM-5zf进一步克隆到植物双元表达载体(如pBI121、pCAMBIA2301)中,在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌(如EHA105)中,利用叶盘法技术转化模式植物烟草和番茄。利用叶盘法转化烟草1.用无菌牙签挑取YEB选择平板上的阳性菌落,接种于2ml YEB液体(Sm+,Kan+),28度,200rpm振荡培养24-36小时;2.室温下4,000g离心10min;3.弃上清,菌体用1/2MS液体培养基悬浮,稀释到原体积的5-20倍,使菌液的OD600=0.5左右;4.取生长两周左右的烟草的无菌叶片,去掉其主叶脉,将其剪成约1平方厘米见方的小叶片;5.将叶片放入制备好的菌液中,浸泡2-5min,在无菌滤纸上吸干菌液;6.把经侵染的叶片放于MS培养基上,28℃暗培养48小时;7.将叶片转到含卡那霉素(Kan)的筛选培养基(MS+6-BA1.0mg/L+NAA0.1mg/L+Kan50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见抗性愈伤组织的形成;8.约20天后可见分化芽长出,待芽长大后,切下,置于生根培养基(1/2MS+NAA0.5mg/L+Kan25mg/L)上进行生根培养,2-7天左右生根;9.等根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。
转化番茄1、将番茄种子灭菌后播于1/2MS培养基上,约10天左右长出子叶;2、农杆菌培养过夜,OD为0.8-1.5,室温下4,000g离心10min;3、弃上清,菌体用1/2MS液体培养基悬浮,加入子叶浸泡10分钟;4、在无菌滤纸上吸干菌液;将子叶放在MS1培养基上,共培养两天;5、将叶片转到含Kan的愈伤和分化培养基(MS+ZT1.0mg/L+IAA1.0mg/L+Kan50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见抗性愈伤组织的形成和植株再生;6、待芽长大后约1-2厘米的时将幼芽移植在生根培养基中(1/2MS)上进行生根培养,2-7天左右生根;7、根系发达后,将植株取出,用无菌水洗净附着的固体培养基,在珍珠岩中驯化一周,用1%的MS浇灌,移入土中。利用western blot检测在转基因烟草和番茄植株中的表达1.蛋白的提取a)取50mg叶片,加入100ul 1*PBS(KH2PO40.2g/l,Na2HPO41.15g/l,KCl0.2g/l,NaCl8g/l)于1.5ml离心管中研磨;b)13000,4℃离心10分钟;c)取上清,备用。注以上过程于冰上进行。
2.蛋白的定量参考Bradford法(Bradford,1976)。取2ul蛋白样品,加入1ml Bradford试剂,混匀后,分光光度计测OD595。
3.SDS-PAGE分离蛋白SDS-PAGE的制备参考《分子克隆》(Sambrook等,1989);a)加样前,将样品置于含50mmol/L DTT的加样缓冲液(2*加样缓冲液甘油2.4g,1M Tris-HCl pH6.81ml;溴酚兰0.01%,H2O定容至20ml),煮沸10分钟;b)室温100V电压下聚丙烯酰胺凝胶电泳,直到指示剂(溴酚兰)前沿达到凝胶底部。
4.蛋白质向硝酸纤维膜上转移a)转移之前,用转移缓冲液(39mmol甘氨酸,48mmol Tris Base,0.037%SDS,20%甲醇)平衡凝胶和硝酸纤维膜30分钟;b)室温下用半干式电转仪转移1h,凝胶两侧各垫3层Whatman滤纸;5.膜上蛋白的检测a)将硝酸纤维膜浸在封闭液中,37℃缓慢摇动、封闭60分钟(封闭液取5g脱脂奶粉溶于100ml 1*PBS(含0.5g叠氮钠));b)再将滤膜浸泡在洗涤缓冲液中,37℃洗涤两次,每次15分钟;c)加入第一抗体(抗Bt基因的抗体),37℃温育30分钟;同步骤b),洗涤三次;d)加入第二抗体(亲和素-碱性磷酸酶复合物),37℃温育30分钟;同步骤b),洗涤两次;e)加入底物显色观察蛋白条带。
本发明涉及的序列及记号分列如下(1)SEQ ID NO.1的信息(i)序列特征(A)长度30bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.1CTAAGGATCCCATTGCCGGCCGCCATGAGA(2)SEQ ID NO.2的信息(i)序列特征(A)长度30bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.2GATGTCGATGAACTCAAGCTCGGTTCCTGG(3)SEQ ID NO.3的信息(i)序列特征(A)长度30bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.3ATGACCGCTGACAACAACACGGAGGCCCTC(4)SEQ ID NO.4的信息(i)序列特征(A)长度30bp(B)类型核苷酸
(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.4CCAAGCATAG GATCAAACGA TATTATCACC(5)SEQ ID NO.5的信息(i)序列特征(A)长度1910bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型核苷酸(iii).序列描述SEQ ID NO.51CTAAGGATCC CATTGCCGGC CGCCATGAGA GCTCTCGCTC TCGCGGTGGT51 GGCCCTGGCG GTGGTGGCCG TGCGCGGCAT GACTGCCGAA AACAACACGG101 AGGCACTAGA CAGCTCCACC ACCAAGGATG TCATTCACAA GGGCATATCC151 GTGGTGGGTG ATCTCCTTGG CGTCGTTGGA TTCCCCTTCG GTGGAGCCCT201 TGTTTCCTTC TACACCAACT TCCTCAACAC TATTTGGCCA AGCGAGGACC251 CCTGGAAGGC CTTCATGGAG CAAGTGGAGG CACTGATGGA TCAGAAGATT301 GCCGATTACG CAAAGAACAA GGCCCTTGCA GAGCTGCAAG GCCTTCAAAA351 CAATGTCGAG GATTATGTTA GCGCACTCAG CTCATGGCAA AAGAACCCTG401 TGAGCTCAGT AACCCACACA GCCAGGGTCG TATTAGAGAG CTGTTCTCTC451 AAGCAGAGAG CCATTTCCGT AACTCAATGC CTTCCTTTGC AATTTCTGGA501 TACGAGGTTC TCTTCCTCAC CACTTACGCA CAAGCTGCCA ACACGCACCT551 CTTCTTGCTT AAGGACGCAC AAATCTACGG AGAGGAGTGG GGATACGAGA601 AGGAGGATAT TGCCGAGTTC TACAAGAGAC AACTTAAACT TACGCAAGAG651 TACACTGATC ACTGTGTCAA GTGGTACAAC GTTGGACTTG ATAAACTCAG701 AGGTTCATCT TACGAGTCTT GGGTGAACTT CAACCGTTAT CGCAGAGAGA751 TGACCCTTAC CGTGCTAGAT CTCATCGCAC TGTTCCCACT GTACGATGTT801 CGTCTTTACC CAAAGGAGGT TAAGACCGAG CTTACCAGAG ACGTTCTCAC851 CGATCCAATT GTCGGAGTCA ACAACCTTAG AGGCTACGGA ACCACCTTCT901 CTAATATTGA GAACTACATT CGCAAGCCAC ACCTGTTTGA CTACCTGCAC951 AGAATCCAAT TCCACACGCG TTTCCAACCA GGATACTACG GTAACGACTC1001 TTTCAACTAC TGGTCCGGAA ACTACGTTTC AACTAGACCA AGCATAGGAT1051 CAAACGATAT TAACACCTCT CCATTCTACG GAAACAAGTC CAGCGAGTAC1101 AGAAGGCCAT TCAATATCGG TATCAACAAC CAGCAACTTT CCGTTCTCGA1151 TGGAACAGAG TTCGCCTATG GAACCTCTTC TAACTTGCCA TCCGCTGTTT1201 ACAGAAAGTC CGGAACCGTT GATAGCTTGG ACGAAATTCC ACCACAGAAC1251 AACAATGTGC CACCCAGGCA AGGATTCAGC CACAGGTTGA GCCATGTGTC1301 CATGTTCCGT TCCGGTTCTA GCAACAGTAG CGTGAGCATC ATCAGAGCTC1351 CTATGTTCTC TTGGATACAT CGTAGTGCTG AGTTCAACAA TATCATTGCA1401 TCCGATAGCA TCACTCAAAT TCCTGCAGTT AAGGGAAACT TTCTCTTCAA1451 TGGTTCAGTC ATTTCAGGAC CAGGATTCAC AGGAGGAGAC CTCGTTAGAC1501 TCAACAGCAG TGGAAATAAC ATCCAGAATA GAGGGTATAT TGAAGTTCCA1551 ATTCATTTCC CTTCCACATC TACCAGATAT AGAGTTCGTG TGAGGTATGC1601 TTCTGTAACT CCTATTCATC TCAACGTTAA TTGGGGTAAT TCATCTATCT1651 TCAGCAACAC AGTTCCAGCT ACAGCTACCT CCTTGGATAA CCTCCAATCC1701 AGCGACTTCG GATACTTTGA GAGCGCCAAT GCTTTCACAT CTTCACTCGG1751 CAACATAGTG GGTGTTAGAA ACTTTAGTGG AACTGCAGGT GTGATCATAG1801 ACAGATTTGA GTTCATTCCA GTTACTGCAA CACTCGAATA ATAACGAGCT1851 CCAAGCTTGG GAGCTCAAAA A(6)SEQ ID NO.6的信息(i)序列特征(A)长度606个氨基酸(B)类型氨基酸(C)链性单链(D)拓扑结构2个α螺旋-β折叠(ii).分子类型多肽(iii).序列描述SEQ ID NO.61 MRALA LAVAM LAVVA VRGMT ADNNT EALDS STTKD VIQKG41 ISVVG DLLGV VGFPF GGALV SFYTN FLNTI WPSED PWKAF81 MEQVE ALMDQ KIADY AKNKA LAELQ GLQNN VEDYV SALSS121 WQKNP VSSRN PHSQG RIREL FSQAE SHFRN SMPSF AISGY161 EVLFL TTYAQ AANTH LFLLK DAQIY GEEWG YEKED IAEFY201 KRQLK LTQEY TDHCV KWYNV GLDKL RGSSY ESWVN FNRYR241 REMTL TVLDL IALFP LYDVR LYPKE VKTEL TRDVL TDPIV281 GVNNL RGYGT TFSNI ENYIR KPHLF DYLHR IQFHT RFQPG321 YYGND SFNYW SGNYV STRPS IGSND IITSP FYGNK SSELY361 RRPFN IGINN QQLSV LDGTE FAYGT SSNLP SAVYR KSGTV401 DSLDE IPPQN NNVPP RQGFS HRLSH VSMFR SGSSN SSVSI441 IRAPM FSWIH RSAEF NNIIA SDSIT QIPAV KGNFL FNGSV481 ISGPG FTGGD LVRLN SSGNN IQNRG YIEVP IHFPS TSTRY521 RVRVR YASVT PIHLN VNWGN SSIFS NTVPA TATSL DNLQS561 SDFGY FESAN AFTSS LGNIV GVRNF SGTAG VIIDR FEFIP601 VTATL E表2上列本发明的按植物偏爱密码子设计的Bt基因的核酸序列下列野生型的CryIIIA的核酸序列(GenBank Accession No.M84650.1)Identities=1011/1871(54.3%)Query79 atgactgccgaaaacaacacggaggcactagacagctccaccaccaaggatgtcattcac138||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1atgactgctgataacaacacggaggcacttgatagctctaccaccaaggatgtcattcaa60Query139 aagggcatatccgtggtgggtgatctccttggcgtcgttggattccccttcggtggagcc198||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct61 aagggcatttccgtggtgggtgatctccttggcgtcgttggattccccttcggtggagcc120Query199 cttgtttccttctacaccaacttcctcaacactatttggccaagcgaggacccctggaag258||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct121 cttgtttccttctacaccaacttcctcaacactatttggccaagcgaggacccctggaag180Query259 gccttcatggagcaagtggaggcactgatggatcagaagattgccgattacgcaaagaac318||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct181 gccttcatggagcaagtggaggcactgatggatcagaagattgccgattacgcaaagaac240Query319 aaggcccttgcagagctgcaaggccttcaaaacaatgtcgaggattatgttagcgcactc378||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct241 aaggcccttgcagagctgcaaggccttcaaaacaatgtcgaggattatgttagcgcactc300Query379 agctcatggcaaaagaaccctgtgagctca-gtaacccacacagccagggtcgtattaga437||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct301 agctcatggcaaaagaaccctgtgagctcacgtaacccacacagccagggtcgtattaga360Query438 gagctgttctctcaagcagagagccatttccgtaactcaatgccttcctttgcaatttct 497||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct361 gagctgttctctcaagcagagagccatttccgtaactcaatgccttcctttgcaatttct 420Query498 ggatacgaggttctcttcctcaccacttacgcacaagctgccaacacgcacctcttcttg 557||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct421 ggatacgaggttctcttcctcaccacttacgcacaagctgccaacacgcacctcttcttg 480Query558 cttaaggacgcacaaatctacggagaggagtggggatacgagaaggaggatattgccgag 617||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct481 cttaaggacgcacaaatctacggagaggagtggggatacgagaaggaggatattgccgag 540Query618 ttctacaagagacaacttaaacttacgcaagagtacactgatcactgtgtcaagtggtac 677||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct541 ttctacaagagacaacttaaacttacgcaagagtacactgatcactgtgtcaagtggtac 600Query678 aacgttggacttgataaactcagaggttcatcttacgagtcttgggtgaacttcaaccgt 737||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct601 aacgttggacttgataaactcagaggttcatcttacgagtcttgggtgaacttcaaccgt 660Query738 tatcgcagagagatgacccttaccgtgctagatctcatcgcactgttcccactgtacgat 797||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct661 tatcgcagagagatgacccttaccgtgctagatctcatcgcactgttcccactgtacgat 720Query798 gttcgtctttacccaaaggaggttaagaccgagcttaccagagacgttctcaccgatcca 857||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct721 gttcgtctttacccaaaggaggttaagaccgagcttaccagagacgttctcaccgatcca 780Query858 attgtcggagtcaacaaccttagaggctacggaaccaccttctctaatattgagaactac 917||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct781 attgtcggagtcaacaaccttagaggctacggaaccaccttctctaatattgagaactac 840Query918 attcgcaagccacacctgtttgactacctgcacagaatccaattccacacgcgtttccaa 977||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct841 attcgcaagccacacctgtttgactacctgcacagaatccaattccacacgcgtttccaa 900Query978 ccaggatactacggtaacgactctttcaactactggtccggaaactacgtttcaactaga 1037||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct901 ccaggatactacggtaacgactctttcaactactggtccggaaactacgtttcaactaga 960Query1038 ccaagcataggatcaaacgatattaacacctctccattctacggaaacaagtccagcgag 1097||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct961 ccaagcataggatcaaacgatattatcacctctccattctacggaaacaagtccagcgag 1020
表3上列本发明的按植物偏爱密码子设计的Bt基因的核酸序列下列野生型的Cry 1Ac的核酸序列(GenBank Accession No.AF177675.1)Score=1477bits(745),Expect=0.0Identities=745/1871(41.2%)Query1097 gtacagaaggccattcaatatcggtatcaacaaccagcaactttccgttctcgatggaac 1156||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1020 gtacagaaggccattcaatatcggtatcaacaaccagcaactttccgttctcgatggaac 1079Query1157 agagttcgcctatggaacctcttctaacttgccatccgctgtttacagaaagtccggaac 1216||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1080 agagttcgcctatggaacctcttctaacttgccatccgctgtttacagaaagtccggaac 1139Query1217 cgttgatagcttggacgaaattccaccacagaacaacaatgtgccacccaggcaaggatt 1276||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1140 cgttgatagcttggacgaaattccaccacagaacaacaatgtgccacccaggcaaggatt 1199Query1277 cagccacaggttgagccatgtgtccatgttccgttccggttctagcaacagtagcgtgag 1336||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1200 cagccacaggttgagccatgtgtccatgttccgttccggttctagcaacagtagcgtgag 1259Query1337 catcatcagagctcctatgttctcttggatacatcgtagtgctgagttcaacaatatcat 1396||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1260 catcatcagagctcctatgttctcttggatacatcgtagtgctgagttcaacaatatcat 1319Query1397 tgcatccgatagcatcactcaaattcctgcagttaagggaaactttctcttcaatggttc 1456||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1320 tgcatccgatagcatcactcaaattcctgcagttaagggaaactttctcttcaatggttc 1379Query1457 agtcatttcaggaccaggattcacaggaggagacctcgttagactcaacagcagtggaaa 1516||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1380 agtcatttcaggaccaggattcacaggaggagacctcgttagactcaacagcagtggaaa 1439Query1517 taacatccagaatagagggtatattgaagttccaattcatttcccttccacatctaccag 1576||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1440 taacatccagaatagagggtatattgaagttccaattcatttcccttccacatctaccag 1499Query1577 atatagagttcgtgtgaggtatgcttctgtaactcctattcatctcaacgttaattgggg 1636||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1500 atatagagttcgtgtgaggtatgcttctgtaactcctattcatctcaacgttaattgggg 1559Query1637 taattcatctatcttcagcaacacagttccagctacagctacctccttggataacctcca 1696||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1560 taattcatctatcttcagcaacacagttccagctacagctacctccttggataacctcca 1619Query1697 atccagcgacttcggatactttgagagcgccaatgctttcacatcttcactcggcaacat 1756||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1620 atccagcgacttcggatactttgagagcgccaatgctttcacatcttcactcggcaacat 1679Query1757 agtgggtgttagaaactttagtggaactgcaggtgtgatcatagacagatttgagttcat 1816||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||Sbjct1680 agtgggtgttagaaactttagtggaactgcaggtgtgatcatagacagatttgagttcat 1739Query1817 tccagttactgcaacactcgaataa 1841|||||||||||||||||||||||||Sbjct1740 tccagttactgcaacactcgaataa 1764表4上列本发明的按植物偏爱密码子设计的Bt基因编码蛋白质的氨基酸序列下列野生型的CryIIIA蛋白质的氨基酸序列(GenBank Accession No.CAB41411.1)Identities=417/606(63.2%)Query79 MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWK 258MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWKSbjct56 MTADNNTEALDSSTTKDVIQKGISVVGDLLGVVGFPFGGALVSFYTNFLNTIWPSEDPWK 115Query259 AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIR 438AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIRSbjct116 AFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALSSWQKNPVSSRNPHSQGRIR 175Query439 ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAE 618ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAESbjct176 ELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLLKDAQIYGEEWGYEKEDIAE 235Query619 FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYD 798FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYDSbjct236 FYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRYRREMTLTVLDLIALFPLYD 295Query799 VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQ 978VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQSbjct296 VRLYPKEVKTELTRDVLTDPIVGVNNLRGYGTTFSNIENYIRKPHLFDYLHRIQFHTRFQ 355Query979 PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSE------------YRRPFNIG 1122PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSEYR NSbjct356 PGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGNKSSEPVQNLEFNGEKVYRAVANTN 415Query1123 INNQQLSVLDG---TEFA-YGTSSNLPSA----VYRKSGTV--DSLDEIPPQNNNVPPRQ 1272+ +V GEF+ Y ++ S R G V DS+D++PP+ + P +Sbjct416 LAVWPSAVYSGVTKVEFSQYNDQTDEASTQTYDSKRNVGAVSWDSIDQLPPETTDEPLEK 475Query1273 GFSHRLSHVXXXXXXXXXXXXXIIRAPMFSWIHRSAEFNNIIASDSITQIPAVKGNFLFN 1452G+SH+L++V P+ +W H+S +F N+I S ITQ+P VK L +Sbjct476 GYSHQLNYVMCFLMQGSRGT-----IPVLTWTHKSVDFFNMIDSKKITQLPLVKAYKLQS 530Query1453 G-SVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTSTRYRVRVRYASVTPIHLNV 1629G SV++GP FTGGD+++ +G+ Y+ + S S +YR R+ YAS + I +Sbjct531 GASVVAGPRFTGGDIIQCTENGSAATI--YVTPDV---SYSQKYRARIHYASTSQITFTL 585Query1630 NWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLGNI-VGVRNFSGTAGVIIDR 1806+ + TD L + F + F S N+ +GV SV ID+Sbjct586 SLDGAPFNQYYFDKTINKGDTLTYNSFNLASFSTPFELSGNNLQIGVTGLSAGDKVYIDK 645Query1807 FEFIPV 1824EFIPVSbjct646 IEFIPV 651表5上列本发明的按植物偏爱密码子设计的Bt基因编码蛋白质的氨基酸序列下列野生型的CryIC蛋白质的氨基酸序列(GenBank Accession No.AAD55947.1)Identities=345/606(56.8%)Query208 FYTNFLNTIWPSEDP--WKAFMEQVEALMDQKIADYAKNKALAELQGLQNNVEDYVSALS 381F++ IWP W AF+ Q+E L++Q+I ++A+N+A++ L+GL N + Y +Sbjct30 FVLGLVDIIWGIFGPSQWDAFLVQIEQLINQRIEEFARNQAISRLEGLSNLYQIYAESFR 89Query382 SWQKNPVSSRNPHSQGRIRELFSQAESHFRNSMPSFAISGYEVLFLTTYAQAANTHLFLL 561W+ +PNP + +R F+ S++P FA+ Y+V L+ Y QAAN HL +LSbjct90 EWEADPT---NPALREEMRIQFNDMNSALTTAIPLFAVQNYQVPLLSVYVQAANLHLSVL 146Query562 KDAQIYGEEWGYEKEDIAEFYKRQLKLTQEYTDHCVKWYNVGLDKLRGSSYESWVNFNRY 741+D ++G+ WG++ I Y+L YTD+ V+WYN GL+++ G WV +N++Sbjct147 RDVSVFGQRWGFDAATINSRYNDLTRLIGNYTDYAVRWYNTGLERVWGPDSRDWVRYNQF 206Query742 RREMTLTVLDLIALFPLYDVRLYPKEVKTELTRDVLTDPIVGVNNLRG-YGTTESNIENY 918RRE+TLTVLD++ALFP YD R YP++LTR++ T+P++ N G + + IESbjct207 RRELTLTVLDIVALFPNYDSRRYPIRTVSQLTREIYTNPVL--ENFDGSFRGSAQGIERS 264Query919 IRKPHLFDYLHRIQFHTRFQPGYYGNDSFNYWSGNYVSTRPSIGSNDIITSPFYGN---- 1086IR PHL D L+ I +TGYY YWSG+ + P ST P YGSbjct265 IRSPHLMDILNSITIYTDAHRGYY------YWSGHQIMASPVGFSGPEFTFPLYGTMGNA 318Query1087 ------------------KSSEYRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKS 1212S+ YRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKSSbjct319 APQQRIVAQLGQGVYRTLSSTLYRRPFNIGINNQQLSVLDGTEFAYGTSSNLPSAVYRKS 378Query1213 GTVDSLDEIPPQNNNVPPRQGFSHRLSHVXXXXXXXXXXXXXIIRAPMFSWIHRSAEFNN 1392GTVDSLDEIPPQNNNVPPRQGFSHRLSHV IIRAPMFSWIHRSAEFNNSbjct379 GTVDSLDEIPPQNNNVPPRQGFSHRLSHVSMFRSGSSNSSVSIIRAPMFSWIHRSAEFNN 438Query1393 IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTS 1572IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTSSbjct439 IIASDSITQIPAVKGNFLFNGSVISGPGFTGGDLVRLNSSGNNIQNRGYIEVPIHFPSTS 498Query1573 TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLG 1752TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLGSbjct499 TRYRVRVRYASVTPIHLNVNWGNSSIFSNTVPATATSLDNLQSSDFGYFESANAFTSSLG 558Query1753 NIVGVRNFSGTAGVIIDRFEFIPVTATLE 1839NIVGVRNFSGTAGVIIDRFEFIPVTATLESbjct559 NIVGVRNFSGTAGVIIDRFEFIPVTATLE 58权利要求
1.一种人工合成的DNA分子,其特征在于,它包括根据植物偏爱密码子设计的编码具有Bt晶体蛋白活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQID NO.5中从核苷酸第25-1871位的核苷酸序列有至少75%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.6所示的氨基酸序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列。
4.一种在植物中表达的Bt晶体蛋白,其特征在于,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是在植物中表达的具有SEQ IDNO.6序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞,其特征在于它是真核细胞。
8.一种在植物中产生和表达具有Bt晶体蛋白活性的多肽的方法,特征在于其步骤如下(1)将人工合成的编码具有Bt晶体蛋白活性多肽的核苷酸序列可操作地连于表达调控序列,形成Bt晶体蛋白蛋白表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸第25-1871位的核苷酸序列有至少75%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成Bt晶体蛋白的重组细胞;(3)在适合表达Bt晶体蛋白的条件下,培养步骤(2)中的重组细胞;(4)再生重组细胞,获得表达Bt晶体蛋白的转基因植物及其后代,包括植物种子及植物组织。
9.一种核酸分子,其特征在于,它包含权利要求1所述的DNA分子中25-1871个连续核苷酸。
10.一种用于检测样品中是否存在Bt基因核苷酸序列的方法,其特征在于它包括用权利要求9所述探针与样品进行杂交,然后检测探针是否发生了结合,该样品是PCR扩增后的产物,其中PCR扩增引物对应于Bt基因核苷酸编码序列,并可位于该编码序列的两侧或中间,引物长度为15~50个核苷酸。
全文摘要
本发明提供了一种按植物偏爱密码子设计合成的具有在液泡中高效表达的复合型Bt(Bacillus thuringiensis)基因。涉及包含所说基因的融合基因构建体,携带该构建体的新的重组表达载体。该表达载体具有在普通植物中(包括水稻、小麦、玉米、油菜、棉花等)特别是在液泡中高效表达的特性。还涉及被所说的表达载体转化的植物细胞,以及由所说的Bt基因转化细胞产生的表达的转基因植物及其后代,包括植物种子及植物组织。本发明还提供了在样品中检测Bt基因核酸序列和多肽的方法。
文档编号C12N15/63GK1417330SQ0113217
公开日2003年5月14日 申请日期2001年11月9日 优先权日2001年11月9日
发明者左开井, 唐克轩, 孙小芬, 庞永珍 申请人:复旦大学