专利名称:蜘蛛神经毒素及其生产方法
技术领域:
本发明涉及一种新的毒素以及生产毒素的方法,尤其不仅仅限于一种昆虫特异性神经毒素δ-毒蛛昆虫毒素(Latroinsectotoxin)(δ-LIT)以及它们的生产方法。
在毒寇蛛(Latrodectus mactans Tredecimguttatus)的毒液中已发现一个高分子量的神经毒素家族。这些毒素中一些已被鉴定为具有脊椎动物或无脊椎动物特异性。α-毒蛛毒素(α-LT)和α-毒蛛昆虫毒素(LIT)为已被分别表明为具有脊椎动物和无脊椎动物特异性的两种神经毒素。这些蛋白质的一级结构已被确定,但由于不能实现它们基因的功能表达,因此不可能表征被克隆毒素的结构特征。
本发明的目的是提供一种新的毒素及利用重组技术生产一种通常由前体蛋白的翻译后修饰自然产生的毒素的方法。
根据本发明提供了一种由基因序列的截短形式表达产生截短多肽如毒素或它的类似物。
多肽优选多神经毒素,优选对应于由基因序列编码的基本上无毒的前体多肽的毒性衍生物。多肽可包含对应于基本上无毒的前体多肽的氨基酸序列的截短形式。多肽的氨基酸序列优选对应于主要在羧基(C)端被截短,且合意的截短发生在约150至200个氨基酸的前体多肽的氨基酸序列。此外,多肽的氨基酸序列还可对应于在氨基(N)端被截短优选少于50个氨基酸,且合意的为7或28个氨基酸的前体多肽氨基酸序列。
多肽的氨基酸序列可能与昆虫特异性神经毒素δ-毒蛛昆虫毒素(δ-LIT)或它的活性衍生物的氨基酸序列同源,优选包括如序列1和序列2所示的氨基酸序列或它的活性衍生物。毒素优选由包括序列1所示序列的基因序列的核苷酸结构物或其截短形式或它的活性变异体表达。毒素优选由基本上如保藏在The National Collecticns of Industrialand Marine Bacterinl ILimited,保藏号为NCIMB 40632中的微生物所提供的序列表达。
本发明还提供了一种用作毒素的蛋白质,包括基本上如序列1和序列2所示的氨基酸序列或其活性衍生物。
根据本发明的另一方面,提供了一种核苷酸序列,包括基因序列的截短形式或其类似物,用于多肽如毒素的表达。
核苷酸序列优选对应于编码前体多肽并在3’端被截短的基因或其活性衍生物。核苷酸序列优选对应于被截短400至650个核苷酸碱基,且合意的为550至600个之间的核苷酸碱基的基因。
核苷酸序列也可对应于在其5’端被截短的基因,优选截短少于100个核苷酸碱基,且合意的为84或21个核苷酸碱基。
核苷酸序列优选对应于部分编码毒寇蛛的毒液中的神经毒素或其活性衍生物的基因。
核苷酸序列可对应于部分编码昆虫特异性毒素δ-毒蛛昆虫毒素(δ-LIT)的前体多肽或其活性衍生物的基因。核苷酸序列优选编码包含991个氨基酸序列的多肽。
核苷酸序列优选包含序列1所示的碱基序列或其活性衍生物,优选如保藏在The National Collecticns of Industrial and MarineBacterinl Limited,保藏号为NCIMB 40632的微生物所包含的碱基序列。
核苷酸序列优选编码具有如序列1和序列2所示的氨基酸序列的多肽或其活性衍生物。
核苷酸序列可为使用酶如逆转录酶从mRNA衍生而来的cDNA。用另一种方法,核苷酸序列可为使用聚合酶链反应(PCR)产生的寡核苷酸DNA结构物。
根据本发明的另一个方面,提供了一种生产多肽的方法,该方法包括制备包含基因截短形式的重组DMA分子,并在宿主表达系统,如病毒或细菌表达系统中表达截短形式生产多肽。
生产的多肽优选为活性毒素,且合意的为基本上如上所定义的神经毒素。截短形式优选包含编码非毒性的前体多肽的基因的部分。
截短形式优选包含基本上如上所定义和如序列1所示的核苷酸序列或其活性衍生物。表达系统包含用包含该序列截短形式的载体pT7-7转化的E.coli BL21(DE3)细菌细胞,且合意的为基本上如保藏在The National Collecticns of Industrial and Marine BacterinaLimited,保藏号为NCIMB 40632。表达系统可包含杆状病毒系统。
在本发明的另一方面,提供了一种重组DNA分子,如病毒,尤其是包含编码通常如上定义的毒素的基因的截短形式和基本上如保藏号NCIMB 40632中的微生物所提供的基因的杆状病毒。
本发明另一方面还提供了一种包含基因的截短形式的表达载体,该截短形式编码通常如上定义的毒素。
本发明还提供了一种细胞,如用如上定义的重组分子转化的病毒或细菌细胞。
还提供了一种包含如上定义的毒素的杀虫剂。该杀虫剂可口服或局部施用。杀虫剂可包含喷雾用液。
本发明还提供了一种杀虫剂系统,它包括在昆虫体内表达基因的截短形式来产生一种上面描述的毒素,以杀死或使昆虫丧失能力的方法。杀虫剂系统可包含病毒表达系统且合意的的杆状病毒表达系统。
根据另一方面,提供一种包含含有基本上如上所定义的基因序列的截短形式的被遗传修饰的细胞的植物。
还进一步根据本发明,提供了一种包含含有基本上如上所定义的基因序列的截短形式被遗传修饰的细胞的非人类动物。
根据本发明的另一个方面,提供了一种通过基本上分离的无毒性的前体多肽的加工产生的毒素。
毒素优选为神经毒素,并优选通过向前体多肽的羧基(C)端截短产生,优选通过定点诱变产生。且合意的毒素的氨基酸序列通常对应于被截短150至200个氨基酸的前体多肽的氨基酸序列。毒素氨基酸序列还可通过向前体多肽氨基酸序列的氨基(N)端截短产生,从中酶切下来的片段优选为明显小于从羧基端酶切下来的片段,可包含7或28个氨基酸。
毒素优选具有对应于由毒寇蛛基因的部分编码的多肽的氨基酸序列。毒素可包含或为昆虫特异性神经毒素δ-毒蛛昆虫毒素(δ-LIT)的类似物或其活性衍生物。
毒素优选包含如序列1和序列2所示的氨基酸序列或其活性衍生物。
在本发明的另一方面,提供了一种从无活性前体多肽制备活性多肽的方法,该方法包括截短分离的前体多肽。
分离的前体多肽优选在羧基端截短,可使用蛋白酶酶切,优选通过定点诱变。也可提供N末端的截短。活性多肽优选为毒素并且基本上如上所描述。
根据本发明的另一方面,提供一种编码如上所定义的毒素前体多肽,并优选具有如序列4所示的氨基酸序列或其活性衍生物的分离核苷酸碱基序列。碱基序列优选包含序列3所示的序列或其衍生物。核苷酸碱基序列优选编码神经毒素δ-毒蛛昆虫毒素(LIT)的前体多肽。碱基序列优选为基本上如保藏号为NCIMB 40633的微生物所提供的。
另一方面提供了一种重组DNA分子如病毒,尤其为包含如前面段落所定义的序列的杆状病毒。
在本发明的另一方面,还提供了一种细胞,如用前面段落所述的重组DNA分子转化的细菌细胞或病毒细胞。
本发明还提供了一种杀虫剂系统,它包括表达如上所述的基因产生如上所述的前体多肽并加工前体多肽在昆虫体内产生毒素来杀死或使昆虫丧失能力的方法。杀虫剂系统可包含病毒表达系统且合意的是杆状病毒表达系统。
根据本发明的另一方面,提供了一种包含含有如上所定义的基因的被遗传修饰的细胞的植物。
进一步根据本发明,提供了一种包含含有如上所定义的基因的被遗传修饰的细胞的非人类动物。
现将参考所附序列仅通过实施例描述本发明的优选具体例,其中根据本发明的一个方面,序列1表示基因截短形式的核苷酸碱基序列和由此编码的多肽的相应的氨基酸序列。
序列2表示序列1的多肽序列。
根据本发明的另一方面,序列3表示基因的核苷酸碱基序列和由此编码的多肽的相应的氨基酸序列;以及序列4表示序列3的多肽序列。
参照这些序列,如序列2所示的多肽如毒素通过基因序列(序列1)的截短形式或其类似物的表达产生。
来自毒寇蛛毒液(BWSV)的毒素δ-毒蛛昆虫毒素(δ-LIF)已被纯化并显示具有昆虫特异性毒素。δ-LIT的结构基因已被克隆和序列测定,天然(前体)和功能蛋白毒素的N端和C端已按如下所描述地被确定。δ-LITcDNA的定点诱变使细菌中成熟蛋白产物(毒素)的表达成为可能,并且显示出对蝗虫具有毒性。
细胞表达系统中的这些和其它类似毒素的表达和产生以前向来是不可能的。本发明包括酶解位点的识别,以裂解前体蛋白以产生毒素,以及基因序列的截短的精确位点的识别,以使毒素在细菌中表达,及其他合适的宿主。
根据布达佩斯条约,于1994年5月3日,在The NationalCollecticns of Industrial and Marine Bacteria Limited, of 23st.Machar Drive,Aberdeen,Scotland,United Kingdom进行了微生物保藏。用基因序列的截短形式克隆的大肠杆菌(XL-1Blue pT7.δM)保藏号为40632,用基本上全部基因序列克隆的大肠杆菌保藏号为NO.40633。
cDNA克隆和序列测定更详细地如下进行,从毒寇蛛的毒液腺中分离出poly(A+)-RNA,在质粒载体pSP65中建立cDNA文库(根据Kiyatkin et al, 1993)。用基于δ-LIT(氨基酸残基1-8)-5’GA(C/T)GA(A/G)GA(A/G)GA(C/T)GG(A/T)GAAATGAC 3’的末端标记的具23个单体的寡核苷酸探针筛选具有6×104克隆的文库。进行杂交。克隆纯化阳性克隆,通过限制性内切酶谱分析来分析,通过如(Sambrooket al,1989)所述的超声处理切除和断裂插入片段,接着将其克隆至pBluescript II SKt和SK-载体的SmaI位点(Stratagene,USA)。用辅助噬菌体感染后获得序列测定的单链模板(Stratagene)。通过使用测序酶2.0版本盒(USB Corporation)和T7, T3载体特异性引物(Stratagene)的链终止法(Sanger et al,1977)测定DNA序列。在每个序列两条链上测定至少两次。合成引物用于测序没有被分离的亚克隆片段覆盖的区域。
使用计算机软件DNASTAR(Dnastar Inc)和PCGENE(Intelligenetics Inc)进行DNA和蛋白质序列分析。该项工作得益于安装在SERC Daresbury SEQMET设备上的GCG程序(Devereux,Haeberli and Smithies,(1984),核酸研究12(1);387-395)。
如下进行全长cDNA构建。两组寡核苷酸引物用于通过聚合酶链反应产生δ-LIT编码序列的N-端和C-端重叠部分。为了便于亚克隆至表达载体,5’有义引物(P1) (TTGGGATCCGATGAAGAAGATGGAGAA)和3’反义引物(P8)(CAATGGTCGACACAGAAGGAATGGTA)含有BamHI和SalI限制性内切酶位点。两个其它引物-P9,有义(GTCTGAACCATTTACTGTCC)(位置1283-1302)和P3,反义(GTAAGATTACCATCTGCAAC)(互补于位置2253-2272)被选择用来产生具有内NcoI(2056)限制性位点的重叠片段。设计了一段寡核苷酸用来终止氨基酸991-5’CGTTTCGTCGACTCATTCCGGTAAAGTACGACGAAA 3’之后的蛋白质序列。在标准条件下(30循环,55℃下1分钟,72℃下3分钟,94℃下1分钟,100pmol/引物,1-10ng首链cDNA)使用1单位的Taq-聚合酶(Promega)进行聚合酶链反应。在第一个循环中,变性时间延长至5分钟。被扩增物质的分子质量在琼脂糖凝胶上检测。使用由制造商推荐的带有随机和特异性引物的首链cDNA合成盒(Pharmacia)进行首链cDNA合成。使用GeneClean盒(Bio 101 Inc.)从琼脂糖凝胶中纯化PCR产物,用适宜酶对(N-末端部分为BamHI和NdeI,C-末端为SolI-NdeI)酶解,并克隆至用同样的酶对限制的pT7-7载体中,N-末端BamHI/NdeI-片段,C-末端NdeI/SalI-片段与pT7-7 BamHI/SalI-酶解载体之间的三种方法的连接的结果产生了全长cDNA,最终构建物在氨基末端(MARIRARG)具有八个另外的氨基酸残基。所有质粒结构通过从两端及连接区域的序列测定来鉴定。全长的构建物被称为pTδ.FL,它的样品保藏号为NCIMB 40633,截短克隆称为pT7.δM.(NCIMB 40632)。
为了证实δ-LIF cDNA的同一性,将这个克隆在E.coli BL 21(DE3)细胞中的细菌pT7-7载体中表达。构建序列4的1214个氨基酸残基的全长的毒性cDNA(对应于Asp残基29至1186),并称之为pT7.δFL。第一个28个氨基酸残基被认为存在于蜘蛛毒液腺中的前体多肽中,但在N-末端加工期间被酶切掉。重组蛋白质构成全部细菌溶胞产物蛋白质的约10%。建立人蜘蛛毒液腺纯化的δ-LIT的特异性多克隆抗体,并且它被证实对δ-毒素具有特异性。在表达重组全长δ-LIT的细菌中,该蛋白质特异性地检测出的130KDa的蛋白质细菌表达的全长的δ-LIT和从毒液腺中纯化的毒素的比较显示出约23KDa的大小差异,与计算的分子量一致。全长δ-LIT对昆虫无毒性,被认为是毒素无活性的前体形式。
从毒液腺纯化的δ-LIT通过质谱测量法分析,产生m/z+比率为110916的显著的分子离子。(在Kratos Kompact MALDI 3质谱仪中,用芥子酸作为基质。氮激光激发为337nm。在线性图中检测阳离子)。这接近于在氨基酸991被截短的δ-LIT的预期分子质量。比较起来,细菌表达的全长的δ-LIT产生m/z+比率为133631的分子离子(VK,DRB,PNRV,未显示数据),在计算值的100Da之内。定点诱变用于产生在δ-LIT序列(序列2)的氨基酸991之后被截短的新的δ-LITcDNA克隆(pT7δM)。将这种蛋白在细菌中表达,产生与从蜘蛛毒液分离出的成熟毒素类似分子质量的蛋白质。
在30℃下将用pT7克隆转化的E.coli BL21(DE3)分子生长在含100mg氨苄青霉素/ml的LB培养基中直至A600nm为约0.5。接着通过加入ZPTG(1mM)至培养基诱导表达,继续保温1小时。为了功能研究,洗涤细菌,并将其重新悬浮在50mM Tris HCl,100mM NaCl,,100mMKcl,0.4%Triton X-100,12%(W/V)蔗糖, 5mM DTT,2μg/ml aprotonin,2mM EDTA pH 8中并在冰上超声处理。将硫酸铵加到澄清上清液中直至20%饱和的最终浓度,并将沉淀重悬浮在没有DTT的缓冲液中。这些样品(5-15μl)用于胸部注射至蝗虫内(100-300mg体重);每一试验在多于4个蝗虫上进行,这些蝗虫用于试验24小时毒性。
pT7-7和pT7.δ FL的提取液对蝗虫不产生作用,携带pT7.δM的细菌的提取液导致迅速死亡。蝗虫的死亡时间从5分钟到4小时不等,它取决于各批毒素的潜能。
在从成体(雄性和雌性)蝗虫(Usherwood and Machili,1968)的后胸足分离的神经系统兴奋和静止的爪牵缩肌的神经-肌肉标本上进行初步研究。δ-LIT被在标准蝗虫盐水(mMNaCl,180;Kcl,10;CaCl2,2;Hepes,10(pH 6.8)中使用。使用其中省去CaCl2的盐水进行了一些研究。运用与Grass描笔式记录器相连的Grass形变传感器记录机械反应。运用细胞内微电极(约10mΩ电阻)从成体蝗虫(一种性别)的后胸伸肌胫肌的纤维得到微型刺激性突触后电位的记录。δ-LIT被在标准蝗虫盐水,其中CaCl2被省去的盐水或含有MgCl2代替NaCl的盐水中使用。小终板电位被记录在录象磁带上,并被使用家庭软件在MassComp计算机上进行分析。在斑纹吸管(直径1-2μm,由ClarkElectromedical glass制造)顶端,运用吸管沉浸技术(Montal andMuller,198),由单层的植物醇磷脂酰胆碱或9份同工凝集素和1份胆甾醇的混合物形成双膜双分子层。用类似的斑纹吸管从蝗虫后胸伸肌胫肌纤维(Huddie et al)切去膜碎片。为了降低内源钾通道的活性,将KCl从吸管和浴器盐水中省去。
蝗虫牵缩肌爪肌的神经诱发颤搐收缩被10-11M的δ-LIT(在标准盐水中使用)减少约40%,并在使用10-10M毒素期间被消除。在δ-LIT使用期间有时发生小的自发性收缩。颤搐幅度的变化伴随有不可逆的肌肉挛缩。当δ-LIT浓度降低时,挛缩的出现延迟,幅度减小。肌肉挛缩也发生在肌肉没有神经兴奋而使用毒素时。在没有钙的盐水中不发生颤搐收缩,当10-10M的毒素被用于以这种盐水平衡的标本时,甚至在施用毒素30分钟后,仍不发生挛缩。
当从蝗虫肌肉纤维切下的里面向外翻的碎片在斑纹吸管被暴露于10-11M的α-LIT中时,观察到通道开放和约40pS的最大电导。这种类型的通道开放在不存在毒素时从末观察到。当斑纹吸客和浴器含有相同的盐水时(包括2mM CaCl2),通道电流显示出内部调整,在负吸管电位时通道开放时间比在正吸管电位时长。当有10倍Ca2+梯度通过碎片时,通道电流的逆转电位为+/-15mV,这是依赖于Ca2+梯度的信号。
在其中10-11M的δ-LIT被置于斑纹吸管的人工双分子层研究中,观察到约30pS电导的单通道开放。当毒素从斑纹吸管省去时,没有看到这些通道。在斑纹吸管和浴器中具有相同的盐水(含2mM CaCl2)时,α-LITx通道的电流-电压特征与0mV时的逆转电位为S形。通过控制斑纹吸管和浴器的离子状况,通道表现为Ca选择性。
用对应于δ-LIT的N-末端序列(如上所述)的23个bP的寡核苷酸探针对来自毒液腺cDNA的cDNA文库进行筛选。为了减少核苷酸错读的数目,参考从α-LT和α-LIT cDNA的核苷酸序列得到的密码子使用数据(Kiyatkin et al,1990,Kiyatkin et al,1993)。克隆2纯化和序列测定五个阳性cDNA克隆。最大的克隆(pDT-1)包含多于2(kb)的δ-LIT编码区。用PstI-3’片段再筛选cDNA文库以寻找编码毒素C-末端部分的克隆。分离覆盖δ-LIT C-末端编码区的另外的cDNA克隆pDT-17。覆盖整个开放读码的两个重叠克隆全部序列已被测定。通过利用两组不同的引物,跨越重叠区域进行聚合酶链反应,两个克隆已被证实为来自毒液腺的单链连续RNA的一部分。该复合克隆编码带有从第一个框内甲硫氨酸开始,到TAA终止密码子结束的3642个碱基对框架的cDNA(序列3)。
甲硫氨酸残基之前是证明推断序列全长的框内终止密码子。
通过根据(Krasnoperov et al,1992)的三次柱层析从毒寇蛛毒液中将δ-LIT纯化均一。序列测定δ-LIT的N-末端序列的23个氨基酸残基。用胰蛋白酶酶解纯的毒素,分离出七种单独的肽并进行部分序列测定。
直接N-末端序列测定证明成熟蛋白从序列DEEDGEM开始,因此序列1和2中的第一个残基为这个序列的第一个Asp。推断的从Asp(+1)开始的多肽由1186个氨基酸(如序列3+4所示, Asp残基29至残基1214)残基组成,预测的分子质量为132671道尔顿,pI为5.4。它含有由氨基酸序列分析所测定的全部多肽序列。在成熟蛋白的N-末端(如序列3所示)的上游有两个框内甲硫氨酸残基(-7和-28),它可作为翻译起始位点。Met(-7)的密码子ATG周围的核苷酸序列与典型的Kozak共有序列(Kozak,1989)较为有关,但Met(-28)的核苷酸排序稳定地对应于从蛛形纲分离出的至少两种其它已知蛋白的起始点主要家庭尘螨过敏原(AAAATGA)(Yuuki et al,1991)和用α-毒蛛毒素(AAATGA)共纯化的低分子量蛋白(Kiyatkin et al,1992)。在这两种情况下,在成熟蛋白N-末端之前的推断序列不对应于典型的信号肽结构。我们总结出δ-LIT N-末端的翻译后修饰只限于去掉7或28个氨基酸残基。可作为可能的内肽酶酶切位点的一簇阳性氨基酸残基Arg-X-Iys-Arg(-1-4)的存在支持了翻译后加工发生在N-末端的假设。
利用PEST(Pogets,S.et al,1986)对δ-LIT推断结构的分析揭示了富含P,E,S和T的氨基酸序列的存在,它在前面已与细胞内蛋白的快速降解有关(Gottesman & Maurizi,1992)。这个区域具有序列EESGAPEGSFDSPSS,位于残基956-970之间。在δ-LIT C-末端部分的PEST-区域的出现与蛋白的C-末端加工是一致的。
δ-LIT的计算机分析预测三种假定的跨膜螺旋,其中二种位于末端区域(残基39-67和221-240),最小长度的第三种位于中心区域。第二种假定的跨膜螺旋(残基221-2407)在所有的蜘蛛高分子量蛋白神经毒素中属于一个非常保守的区域(Kiyatkin et al,1993)。
预测的δ-LIT氨基酸序列的斑点-基质分析揭示出在蛋白分子的中心部分的重复基序的存在。δ-LIT的一级结构的460个氨基酸残基包括串联排列的锚蛋白样重复单元的不完全复制体。(Michaely &Bennett,1992)。而αLT和α-LIT(Kiyatkin et al,1990,Kiyatkin etal,1993)具有不少于20个的重复单元,δ-LIT已发现仅具有不少于20个的重复单元,δ-LIT已发现仅具有13个连续的重复单元。它们的最佳定位是具有当初在(Lux et al,1990)中提出的相位。根据与共有序列良好的相关性,在第一个重复单元之前的13个氨基酸序列可被看作是被减少了的重复单元。大多数的δ-LIT重复单元为33-34个氨基酸长度。但两个重复单元分别含35(R1)和36(R6)个残基。
PCOMPARE程序分析显示出两种昆虫特异性毒素的重复单元之间的线性相关。通过α-LIT类似重复单元与δ-LIT重复单元R2-R9的比较发现极大的线性对应(Kiyatkin et al,1993)。δ-LIT的第一个重复单元不完全对应于α-LIT的第一个重复单元,而表现出与来自α-LIT的R7的高度相似性。δ-LIT的重复单元R10与来自α-LIT的R7最为相似,这个重复单元异常地在位置8和31分别具有Ser和Gly残基,下一个相似的范围被发现在δ-LIT的R11-R13与α-LIT的R10-R12之间。我们已发现R7,R2和R9重复单元在杀虫毒素中最为高度保守,这意味着是杀虫毒性的功能角色。已表明红细胞锚蛋白重复单元就它们与不同蛋白结合的作用能力而言,是不相同的(Davis etal,1991),因此毒素的重复单元也被期望对它们的功能做出不同的贡献。
δ-和α-LIT的斑点-基质比较表明它们具有相似的总体结构,曾经具有强烈的中心对角断裂(在δ-LIT的900和1130氨基酸残基之间)并复原为两种毒素的最后160个氨基酸。中心对角的位移反映了毒素长度的不同;δ-LIT比其昆虫特异性对应物短190个氨基酸。
成熟蛋白质可被分成一些结构功能区由约470个氨基酸残基组成,与α-LIT具有高度线性同源性的N-末端;约430个氨基酸,差不多完全由串联排列的锚蛋白样重复单元组成的中心功能区和约160个氨基酸的C-末端功能区。
杀虫毒素蛋白质序列的排列表明N和C-末端结构功能区证明了被颇为不同的序列分开的高度同一性的功能区的存在,具有N-末端功能区为44.9%,C-末端为37.1%的高水平的同一性。两种杀虫毒素一级结构最令人注目的变化集中在含重复单元的域的C-末端部分。同源的范围定位于δ-LIT的13锚蛋白重复单元。这个区域的后面是与α-LIT或α-LT的及与来自NBRF-PIR数据库的任何其它蛋白没有明显同源性的约110个氨基酸残基。有意思地是,δ-LIT所缺少的这个域形成了α-LIT一级结构的一个特有的域,它具有异常簇的Cys-残基,并与哺乳动物特异性的α LT具有同源性(Kiyatkin et al,1993)。两种昆虫特异性的神经毒素之间的如此显著的结构差异意味着锚蛋白样重复功能域的C-末端部分在提供它们不同的功能特征的结构基础中起着特殊的作用。
来自毒寇蛛毒液的高分子量蛋白质毒素是有效的,具有特异性的一类毒素。这些毒素为说明神经蛋白质的功能及提供昆虫特异性毒素提供了很大的可能。然而由于不能表达具任一功能的这些蛋白质毒素,这种可能在以前没有被认识到。本发明提供了在细菌中的编码新的昆虫特异性毒素的新的DNA转录本的克隆,这种毒素及其它多肽的功能表达。
用基于毒素的1-23氨基酸序列的寡核苷酸克隆δ-LIT cDNA,并通过另外的肽序列证明它的同一性,使用δ-LIT特异性抗体证明免疫化学同一性。推断出的δ-LIT的一级结构与哺乳动物特异性的αLT和昆虫特异性的α-LIT具有相当大的相似性,这意味着这些毒素是具有相似结构的一族的一部分。这三种蛋白质具有由“锚蛋白样”的重复单元组成的中心功能区,在δ-LIT中具有13个重复单元。锚蛋白族的蛋白质将血蛋白偶联至各种膜内在蛋白上(Bennett,1992),人们认为锚蛋白的“锚蛋白重复”功能域负责与蛋白质特异性的结合(Davis andBennett,1990 J.Biol Chem 25610589-10596,Davis et al(1991)J.Biol Chem 266 11163-11169)。与锚蛋白族的这种结构相似性反映在毒蛛毒素的已知的功能特性上;已知αLT与受体结合具有高度亲和性(Kd 10-9M)。与αLT受体的特异性结合是否借助于毒素的锚蛋白重复域来传递还有待确定。
意外地,δ-LIT与昆虫特异性α-LIT的相似性(38%)不大于与哺乳动物特异性αLT(37%)。然而δ-LIT仅具有13个重复单元,αLT和α-LIT分别具有19和20个锚蛋白重复单元。后者6/7的重复在δ-LIT中不具对应物,可能为结构单元,因为α-毒素在这个区域都含有6个半胱氨酸残基和部分保守的间隔。然而,由于αLT和α-LIT的靶毒性差异,不可能识别具有昆虫特异性毒性的这种结构特征。
δ-LIT在由cDNA序列推断出的毒素分子量与从毒液纯化而来的纯毒素的相对迁移率之间显示明显的差异。虽然通过蛋白质序列测定已清楚地鉴定了蛋白质的N-末端,但难以证明C-末端的准确位置。细菌中全长的δ-LIT cDNA的表达证明计算的分子质量被精确地反映在SDS-PAGE中蛋白质的相对迁移率中,天然毒液获得物如果不是全部则主要来自蛋白酶解的C-末端加工。将全长的重组蛋白质纯化。但在任何条件下对蝗虫无毒。全长的蛋白质是功能毒素的无活性前体。通过MALDI-质谱测定法分析从毒液纯化的δ-LIT的C-末端的准确位点,将酶解位点定位于蛋白质的第991个氨基酸。cDNA突变产生一具有如序列2所示的序列的991个氨基酸的蛋白质,并在细菌中表达,成熟的重组蛋白质是可溶性的,对蝗虫具有致死性。蛋白质的不完全纯化意味着毒素为高毒性的。
从使用由如上所述的全部基因的截短形式而来的成熟毒素的表达具有相当多的优点。第一,通过在细菌系统中截短形式的功能表达,可相对容易地产生毒素,因而免除需要从蜘蛛毒液腺纯化毒素。这使毒素的工业化生产和今后的商业开发成为可能,例如作为杀虫剂系统的主要成分。
而且它提供了除常规方法如喷雾外的毒素作为杀虫剂的可能的施用系统。例如可以产生一种含有掺入了截短序列的重组分子的被修饰的植物细胞或植物,如作物。该系统包含含有截短形式的重组杆状病毒。这种病毒在体内为高感染性的,并且抵抗宿主细胞中的失活,在宿主昆虫细胞中能够高水平地表达插入的核苷酸序列。这被期望对植物甚至哺乳动物无害。在摄食植物组织时,昆虫将吸收重组分子和/或毒素,最终导致了昆虫的死亡。因为毒素是昆虫特异性的,它被期望对消费它的人类或动物不具有有害影响。
这是本发明的一个实施方案用于在细菌表达系统中表达通常通过生物系统中前体蛋白质的翻译后修饰而产生毒素的例子。它将被理解为编码其它蛋白质的其它基因的截短形式可以这种方式表达,并处于本发明的范围内。
本发明还提供了由全长分离基因表达产生,接着被翻译后修饰的前体多肽形成的毒素。前体多肽具有如序列4所示的氨基酸序列,毒素具有如序列2所示的序列。
编码毒素δLIT的前体多肽的分离基因(序列3)(或类似物)可被克隆至表达前体多肽的载体中。可使用杆状病毒表达系统。接着通过定点诱变可将由此产生的前体多肽在如上所述的位点截短来产生活性毒素。这使毒素δLIT或它的活性衍生物能够与毒寇蛛无关地而被产生。因此在工业规模上用作如上所述的杀虫剂。
虽然在前面说明书努力引起被认为是对本发明具有特别重要性的那些特征的注意,它应被理解为对关于上文涉及和/或图中所示的任何可专利的特征或特征的组合的申请人权利要求的保护,无论是否重点强调,均已被置于其中。
序列表(1)一般信息(i)申请人(A)名称BRITISH TECHNOLOGY GROUP LIMITED(B)街道101 NEWINGTON CAUSEWAY(C)城市LONDON(E)国家UNITED KINGDOM(F)邮政编码(ZIP)SEI 6BU(ii)发明名称新的毒素和生产毒素的方法(iii)序列数目4(iv)计算机可读形式(A)媒介类型Floppy软盘(B)计算机IBM PC,兼容(C)操作系统PC-DOD/MS-DOS(D)软件PatentIn Release E1.0,Version E1.30(EPO)(2)序列1的信息(i)序列特征(A)长度2976个碱基对(B)类型核酸(C)链型双链(D)拓扑结构末知(ii)分子类型其它核酸(A)说明/desc=“质粒DNA”(vi)起始来源(A)生物LATRODECTUS MACTANSTREDECIMGUTTATUS(vii)中间来源(B)克隆pT7.deltaM(ix)特性(A)名称/关键词CDS(B)位置1..2976(xi)序列描述序列1GAT GAA GAA GAT GGA GAA ATG ACT CTA GAA GAA AGA CAA GCA CAA TGC48Asp Glu Glu Asp Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cys1 5 10 15AAA GCA ATA GAG TAC AGC AAT TCA GTT TTT GGG ATG ATC GCT GAT GTA96Lys Ala Ile Glu Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val20 25 30GCT AAC GAC ATC GGT TCC ATT CCT GTA ATT GGC GAA GTA GTT GGC ATT 144Ala Asn Asp Ile Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile35 40 45GTA ACT GCC CCA ATT GCC ATC GTA AGT CAC ATT ACT AGC GCA GGC TTG 192Val Thr Ala Pro Ile Ala Ile Val Ser His Ile Thr Sar Ala Gly Leu50 55 60GAT ATA GCT TCT ACG GCA TTA GAT TGT GAT GAT ATA CCT TTT GAT GAG 240Asp Ile Ala Ser Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu65 70 75 80ATT AAG GAA ATA TTA GAA GAA AGA TTC AAT GAA ATA GAT AGA AAG TTG 288Ile Lys Glu Ile Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu85 90 95GAC AAG AAC ACA GCT GCT TTG GAA GAG GTC TCT AAA CTG GTA AGT AAA 336Asp Lys Asn Thr Ala Ala Leu Glu Glu Val Ser Lys Leu Val Ser Lys100 105 110ACT TTT GTT ACG GTG GAA AAA ACA AGG ATT GAA ATG AAC GAA AAT TTT 384Thr Phe Val Thr Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Phe115 120 125AAG CTT GTT TTG GAA ACT ATA GAA AGC AAA GAA ATA AAA TCA ATT GTA 432Lys Leu Val Leu Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val130 135 140TTC AAA ATA AAT GAT TTT AAA AAG TTT TTT GAA AAA GAA CGA CAA AGA 480Phe Lys Ile Asn Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg145 150 155 160ATT AAA GGT TTG CCT AAA GAT AGG TAT GTT GCT AAG CTT CTA GAA CAA 528Ile Lys Gly Leu Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln165 170 175AAA GGT ATT TTA GGT TCT TTA AAA GAA GTA AGA GAA CCA TCT GGA AAC 576Lys Gly Ile Leu Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn180 185 190AGT CTG AGC TCC GCG TTA AAT GAA CTC TTA GAC AAA AAC AAC AAC TAT 624Ser Leu Ser Ser Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr195 200 205GCC ATC CCA AAA GTG GTT GAT GAT AAT AAG GCC TTT CAG GCG CTG TAT 672Ala Ile Pro Lys Val Val Asp Asp Asn Lys Ala Phe Gln Ala Leu Tyr210 215 220GCT TTA TTT TAT GGA ACT CAG ACT TAT GCA GCC GTT ATG TTT TTC TTA 720Ala Leu Phe Tyr Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu225 230 235 240CTC GAA CAA CAT TCT TAT CTG GCT GAT TAT TAT TAC CAA AAA GGT GAT768Leu Glu Gln His Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp245 250 255GAT GTA AAT TTT AAT GCA GAA TTT AAT AAT GTA GCA ATT ATT TTT GAT816Asp Val Asn Phe Asn Ala Glu Phe Asn Asn Val Ala Ile Ile Phe Asp260 265 270GAC TTT AAA TCA TCA CTA ACA GGA GGA GAT GAC GGA TTA ATA GAT AAT864Asp Phe Lys Ser Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn275 280 285GTC ATT GAG GTT CTT AAC ACC GTG AAA GCA TTA CCA TTT ATA AAG AAC912Val Ile Glu Val Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn290 295 300GCC GAC AGT AAA CTA TAC AGA GAA TTA GTA ACT AGA ACA AAA GCT TTA960Ala Asn Ser Lys Leu Tyr Arg Glu Leu Val Thr Ars Thr Lys Ala Leu305 310 315 320GAG ACT CTT AAA AAT CAA ATC AAA ACG ACT GAT TTG CCT CTT ATA GAT 1008Glu Thr Lau Lys Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp325 330 335GAT ATA CCC GAA ACT TTG TCT CAA GTG AAC TTT CCG AAT GAC GTT AAT 1056Asp Ile Pro Glu Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn340 345 350CAA TTG CCT ACA CCA ATA GGA AAT TGG GTT GAT GGC GTA GAA GTT AGG 1104Gln Leu Pro Thr Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg355 360 365TAC GCA GTA CAG TAT GAA AGT AAG GGC ATG TAT TCG AAA TTC AGT GAA 1152Tyr Ala Val Gln Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu370 375 380TGG TCT GAA CCA TTT ACT GTC CAA GGT AAC GCT TGT CCG ACT ATA AAA 1200Trp Ser Glu Pro Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys385 390 395 400GTT CGT GTT GAT CCG AAA AAG AGA AAT AGA CTT ATC TTT AGG AAG TTC 1248Val Arg Val Asp Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe405 410 415AAC TCA GGA AAA CCT CAG TTT GCT GGA ACC ATG ACT CAT TCA CAA ACA 1296Asn Ser GTy Lys Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr420 425 430AAT TTT AAA GAT ATT CAT CGT GAT CTA TAC GAT GCA GCC TTA AAT ATT 1344Asn Phe Lys Asp Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile435 440 445AAT AAG TTG AAA GCA GTG GAT GAA GCT ACA ACT TTG ATT GAA AAG GGT 1392Asn Lys Leu Lys Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly450 455 460GCA GAC ATA GAA GCA AAA TTT GAC AAT GAC AGA AGT GCA AGT CAC GCA1440Ala Asp Ile Glu Ala Lys Phe Asp Asn Asp Arg Ser Ala Met Mls Ala465 470 475 480GTT GCA TAT CGA GGA AAT AAC AAA ATA GCC TTA AGA TTT CTT TTG AAA1488Val Ala Tyr Arg Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys485 490 495AAT CAA TCC ATT GAG ATC GAG TTA AAA GAT AAA AAC GGC TTT ACT CCT1536Asn Gln Ser Ile Asp Ile Glu Leu Lys Asp Lys Asn Gly Pha Thr Pro500 505 510CTA CAC ATC GCA GCT GAA GCA GGT CAG GCA GGA TTT GTT AAG TTA CTA 1584Leu His Ile Ala Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu515 520 525ATA AAT CAT GGA GCT GAT GTG AAT GCA AAA ACA AGT AAG ACA AAT TTG 1632Ile Asn His Gly Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu530535 540ACA CCA TTA CAT CTT GCA ACA CGT AGT GGA TTT TCA AAA ACT GTA AGA 1680Thr Pro Leu His Leu Ala Thr Arg Ser Gly Phe Ser Lys Thr Val Arg545 550 555 560AAT TTA CTA GAA AGC CCA AAT ATT AAG GTA AAT GAA AAG GAG GAT GAC 1728Asn Leu Leu Glu Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp565 570 575GGA TTT ACA CCT TTG CAT ACT GCA GTA ATG AGT ACT TAT ATG GTT GTC 1776Gly Phe Thr Pro Leu His Thr Ala Val Met Ser Thr Tyr Met Val Val580 585 590GAT GCT TTG CTA AAT CAT CCA GAC ATT GAT AAA AAT GCG CAG TCT ACG 1824Asp Ala Leu Leu Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr595 600 605TCA GGA TTG ACT CCT TTC CAT TTA GCA ATT ATT AAT GAA AGT CAA GAA 1872Ser Gly Leu Thr Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu610 615 620GTT GCA GAA TCT TTA GTG GAA AGT AAT GCT GAT CTA AAT ATT CAG GAT 1920Val Ala Glu Ser Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp625 630 635 640GTT AAC CAT ATG GCT CCT ATT CAT TTT GCA GCT TCA ATG GGT AGT ATT 1968Val Asn His Met Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile645 650 655AAA ATG CTT AGA TAT CTC ATT TCC ATA AAA GAT AAA GTT AGT ATT AAT 2016Lys Met Leu Arg Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn660 665 670TCT GTG ACT GAG AAT AAT AAC TGG ACA CCT TTA CAT TTT GCT ATA TAT 2064Ser Val Thr Glu Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr675 680 685TTT AAA AAA GAT GAT GCT GCA AAA GAA TTG TTG AAA CAA GAT GAC ATA 2112Phe Lys Lys Glu Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile690 695 700AAT TTA ACA ATT GTT GCA GAT GGT AAT CTT ACC GTT TTA CAT CTT GCT 2160Asn Leu Thr Ile Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala705 710 715 720GTT TCG ACA GGA CAA ATA AAT ATA ATT AAA GAA TTA TTG AAG AGA GGC 2208Val Ser Thr Gly Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly725 730 735TCC AAT ATA GAA GAA AAA ACT GGA GAA GGA TAT ACA TCT CTC CAC ATC 2256Ser Asn Ile Glu Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile740 745 750GCT GCG ATG CGA AAG GAG CCA GAG ATA GCT GTT GTT TTG ATT GAA AAC 2304Ala Ala Met Arg Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn755 760 765GGT GCT GAC ATA GAA GCT CGA TCA GCT GAT AAT TTA ACA CCT TTA CAT 2352Gly Ala Asp Ile Glu Ala Arg Ser Ala Asp Asn Leu Thr Pro Leu His770 775 780TCT GCC GCA AAA ATA GGA AGG AAA TCT ACA GTA CTT TAC TTA TTA GAA 2400Ser Ala Ala Lys Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu785 790 795 800AAA GGA GCT GAC ATT GGA GCT AAA ACA GCA GAC GGT TCT ACT GCC TTG 2448Lys Gly Ala Alp Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu805 810 815CAT TTA GCT GTA TCT GGT CGT AAA ATG AAA ACT GTT GAA ACT CTA TTA 2496His Leu Ala Val Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu820 825 830AAT AAA GGA GCA AAT TTA AAA GAA TAC GAT AAC AAT AAA TAT TTG CCA 2544Aan Lys Gly Ala Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro835 840 845ATA CAT AAA GCT ATT ATT AAT GAT GAC CTT GAC ATG GTA CGT TTG TTT 2592Ile His Lys Ala Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe850 855 860CTT GAA AAA GAT CCC AGT CTC AAA GAT GAT GAA ACA GAA GAG GGT AGA 2640Leu Glu Lys Asp Prp Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg865 870 875 880ACT TCA ATT ATG TTA ATT GTT CAG AAA TTG CTT CTT GAA TTA TAT AAC 2688Thr Ser Ile Mel Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn885 890 895TAT TTT ATA AAT AAT TAT GCT GAA ACT TTG GAT GAA GAA GCT TTA TTC 2736Tyr Phe Ile Asn Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe900 905 910AAC CGC TTA GAT GAA CAA GGG AAA TTA GAG CTT GCA TAT ATC TTC CAT 2784Asn Arg Leu Asp Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His915 920 925AAT AAA GAA GGT GAT GCA AAA GAG GCT GTT AAG CCA ACT ATC CTT GTT 2832Asn Lys Glu Gly Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val930 935 940ACA ATT AAA CTT ATG GAA TAC TGC TTA AAA AAA CTT CGC GAA GAG TCT 2880Thr Ile Lys Leu Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser945 950 955 960GCA GCT CCT GAA GGT AGT TTC GAT TCT CCA TCT TCA AAG CAA TGT ATT 2928Gly Ala Pro Glu Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile960 970 975TCT ACC TTT TCA GAG GAT GAA ATG TTT CGT CGT ACT TTA CCG GAA TGA 2976Ser Thr Phe Ser Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu *980 985 990(2)序列2的信息(i)序列特征(A)长度922个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述序列2Asp Glu Glu Asp Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cly1 5 10 15Lys Ala Ile Glu Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val20 25 30Ala Asn Asp Ile Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile35 40 45Val Thr Ala Pro Ile Ala Ile Val Ser His Ile Thr Ser Ala Gly Leu50 55 60Asp Ile Ala Ser Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu65 70 75 80Ile Lys Glu Ile Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu85 90 95Asp Lys Asn Thr Ala Ala Leu Glu Glu Val Ser Lys Lev Val Ser Lys100 105 110Thr Pne Val Thr Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Pne115 120 125Lys Leu Val Leu Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val130 135 140Phe Lys Ile Asn Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg145 150 155 160Ile Lys Gly Leu Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln165 170 175Lys Gly Ile Leu Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn180 185 190Ser Leu Ser Ser Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr195 200 205Ala Ile Pro Lys Val Val Asn Asp Asn Lys Ala Phe Gln Ala Leu Tyr210 215 220Ala Leu Phe Tyr Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu225 230 235 240Leu Glu Gln His Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp245 250 255Asp Val Asn Phe Asn Ala Glu Phe Asn Asn Val Ala Ile Ile Phe Asp260 265 270Asp Phe Lys Ser Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn275 280 285Val Ile Glu Val Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn290 295 300Ala Asp Ser Lys Leu Tyr Arg Glu Leu Val Thr Arg Thr Lys Ala Leu305 310 315 320Glu Thr Leu Lys Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp325 330 335Asp Ile Pro Glu Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn340 345 350Gln Leu Pro Thr Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg355 360 365Tyr Ala Val Gln Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu370 375 380Trp Ser Glu Pro Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys385 390 395 400Val Arg Val Asp Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe405 410 415Ash Ser Gly Lys Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr420 425 430Asn Phe Lys Asp Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile435 440 445Asn Lys Leu Lys Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly450 455 460Ala Asp Ile Glu Ala Lys Phe Asp Asn Asp Arg Ser Ala Met His Ala465 470 475 480Val Ala Tyr Arg Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys485 490 495Asn Gln Ser Ile Asp Ile Glu Leu Lys Asp Lys Asn Gly Phe Thr Pro500 505 510Leu His Ile Ala Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu515 520 525Ile Asn His Gly Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu530 535 540Thr Pro Leu His Leu Ala Thr ArG Ser Gly Phe Ser Lys Thr Val Arg545 550 555 560Asn Leu Leu Glu Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp565 570 575Gly Phe Thr Pro Leu His Tnr Ala Val Met Ser Thr Tyr Met Val Val580 585 590Asp Ala Leu Leu Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr595 600 605Ser Gly Leu Thr Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu610 615 620Val Ala Glu Ser Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp625 630 635 640Val Asn His Met Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile645 650 655Lys Met Leu Arg Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn660 665 670Ser Val Thr Glu Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr675 680 685Phe Lys Lys Glu Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile690 695 700Asn Leu Thr Ile Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala705 710 715 720Val Ser Thr Gly Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly725 730 735Ser Asn Ile Glu Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile740 745 750Ala Ala Met Arg Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn755 760 765Gly Ala Asp Ile Glu Ala Arg Ser Ala Asp Asp Leu Thr Pro Leu His770 775 780Ser Ala Ala Lys Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu785 790 795 800Lys Gly Ala Asp Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu805 810 815His Leu Ala Val Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu820 825 830Asn Lys Gly Ala Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro835 840 845Ile His Lys Ala Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe850 855 860Leu Glu Lys Asp Pro Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg865 870 875 880Thr Ser Ile Met Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn885 890 895Tyr Phe Ile Asn Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe900 905 910Asn Arg Leu Asp Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His915 920 925Asn Lys Glu Gly Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val930 935 940Thr Ile Lys Leu Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser945 950 955 960Gly Ala Pro Glu Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile965 970 975Ser Thr Phe Ser Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu *980 985 990(2)序列3的信息(i)序列特征(A)长度3706个碱基对(B)类型核酸
(C)链型双链(D)拓扑结构环状(ii)分子类型其它核酸(A)描述/desc=“质粒DNA”(vi)起始来源(A)生物LATRODECTUS MACTANSTREDECIMGUTTATUS(vii)中间来源(B)克隆pT7.deltaFL(ix)特点(A)名称/关键词CDS(B)位置45..3686(xi)序列描述序列3EGTCAATTGA AACTTTATGA TAGGATTCAC TTTCTTATAT AGAA ATG CAT TCC AAA 56Met His Ser Lys995GAA TTA CAA ACT ATT TCA GCA GCG GTA GCA CGA AAA GCA GTA CCC AAT 104Glu Leu Gln Thr Ile Ser Ala Ala Val Ala Arg Lys Ala Val Pro Asn100010051010AGT ATG GTT ATT CGG TTG AAA AGA GAT GAA GAA GAT GGA GAA ATG ACT 152Thr Met Val Ile Arg Leu Lys Arg Asp Glu Glu Asp Gly Glu Met Thr101510201025CTA GAA GAA AGA CAA GCA CAA TGC AAA GCA ATA GAG TAC AGC AAT TCA 200Leu Glu Glu Arg Gln Ala Gln Cys Lys Ala Ile Glu Tyr Ser Asn Ser103010351040GTT TTT GGG ATG ATC GCT GAT GTA GCT AAC GAC ATC GGT TCC ATT CCT 248Val Phe Gly Met Ile Ala Asp Val Ala Asn Asp Ile Gly Ser Ile Pro1045105010551060GTA ATT GGC GAA GTA GTT GGC ATT GTA ACT GCC CCA ATT GCC ATC GTA 296Val Ile Gly Glu Val Val Gly Ile Val Thr Ala Pro Ile Ala Ile Val106510701075AGT CAC ATT ACT AGC GCA GGC TTG HAT ATA GCT TCT ACG GCA TTA GAT 344Ser His Ile Thr Ser Ala Gly Leu Asp Ile Ala Ser Thr Ala Leu Asp108010851090TGT GAT GAT ATA CCT TTT GAT GAG ATT AAG GAA ATA TTA GAA GAA AGA 392Cys Asp Asp Ile Pro Phe Asp Glu Ile Lys Glu Ile Leu Glu Glu Arg109511001105TTC AAT GAA ATA GAT AGA AAG TTG GAC AAG AAC ACA GCT GCT TTG GAA 440Phe Asn Glu Ile Asp Arg Lys Leu Asp Lys Asn Thr Ala Ala Leu Glu111011151120GAG GTC TCT AAA CTG GTA AGT AAA ACT TTT GTT ACG GTG GAA AAA ACA 488Glu Val Ser Lys Leu Val Ser Lys Thr Phe Val Thr Val Glu Lys Thr1125113011351140AGG AAT GAA ATG AAC GAA AAT TTT AAG CTT GTT TTG GAA ACT ATA GAA 536Arg Asn Glu Met Asn Glu Asn Phe Lys Leu Val Leu Glu Thr Ile Glu114511501155AGC AAA GAA ATA AAA TCA ATT GTA TTC AAA ATA AAT GAT TTT AAA AAG 584Ser Lys Glu Ile Lys Ser Ile Val Phe Lys Ile Asn Asp Phe Lys Lys116011651170TTT TTT GAA AAA GAA CGA CAA AGA ATT AAA GGT TTG CCT AAA GAT AGG 632Phe Phe Glu Lys Glu Arg Gln Arg Ile Lys Gly Leu Pro Lys Asp Arg117511801185TAT GTT GCT AAG CTT CTA GAA CAA AAA GGT ATT TTA GGT TCT TTA AAA 680Tyr Val Ala Lys Leu Leu Glu Gln Lys Gly Ile Leu Gly Ser Leu Lys119011951200GAA GTA AGA GAA CCA TCT GGA AAC AGT CTG AGC TCC GCG TTA AAT GAA 728Glu Val Arg Glu Pro Ser Gly Asn Ser Leu Ser Ser Ala Leu Asn Glu1205121012151220CTC TTA GAC AAA AAC AAC AAC TAT GCC ATC CCA AAA GTG GTT GAT GAT 776Leu Leu Asp Lys Asn Asn Asn Tyr Ala Ile Pro Lys Val Val Asp Asp122512301235AAT AAG GCC TTT CAG GCG CTG TAT GCT TTA TTT TAT GGA ACT CAG ACT 824Asn Lys Ala Phe Gln Ala Leu Tyr Ala Leu Phe Tyr Gly Thr Gln Thr124012451250TAT GCA GCC GTT ATG TTT TTC TTA CTC GAA CAA CAT TCT TAT CTG GCT 872Tyr Ala Ala Val Met Phe Phe Leu Leu Glu Glu His Sar Tyr Leu Ala125512601265GAT TAT TAT TAC CAA AAA GGT GAT GAT GTA AAT TTT AAT GCA GAA TTT 920Asp Tyr Tyr Tyr Gln Lys Gly Asp Asp Val Asn Phe Asn Ala Glu Phe127012751280AAT AAT GTA GCA ATT ATT TTT GAT GAC TTT AAA TCA TCA CTA ACA GGA 968Asn Asn Val Ala Ile Ile Phe Asp Asp Phe Lys Ser Ser Leu Thr Gly1285129012951300GGA GAT GAC GGA TTA ATA GAT AAT GTC ATT GAG GTT CTT AAC ACC GTG 1016Gly Asp Asp Gly Leu Ile Asp Asn Val Ile Glu Val Lau Asn Thr Val130513101315AAA GCA TTA CCA TTT ATA AAG AAC GCC GAC AGT AAA CTA TAC AGA GAA 1064Lys Ala Leu Pro Phe Ile Lys Asn Ala Asp Ser Lys Leu Tyr Arg Glu132013251330TTA GTA ACT AGA ACA AAA GCT TTA GAG ACT CTT AAA AAT CAA ATC AAA 1112Leu Val Thr Arg Thr Lys Ala Leu Glu Thr Leu Lys Asn Gln Ile Lys133513401345ACG ACT GAT TTG CCT CTT ATA GAT GAT ATA CCC GAA ACT TTG TCT CAA 1160Thr Thr Asp Leu Prp Leu Ile Asp Asp Ile Pro Glu Thr Leu Ser Gln135013551360GTG AAC TTT CCG AAT GAC GAA AAT CAA TTG CCT ACA CCA ATA GGA AAT 1208Val Asn Phe Pro Asn Asp Glu Asn Gln Leu Pro Thr Pro Ile Gly Asn1365137013751380TGG GTT GAT GGC GTA AAA GTT AGG TAC GCA GTA CAG TAT GAA AGT AAG 1256Trp Val Asp Gly Val Glu Val Arg Tyr Ala Val Gln Tyr Glu Ser Lys138513901395GGC ATG TAT TCG AAA TTC AGT GAA TGG TCT GAA CCA TTT ACT GTC CAA 1304Gly Met Tyr Ser Lys Phe Ser Glu Trp Ser Glu Pro Phe Thr Val Gln140014051410GGT AAC GCT TGT CCG ACT ATA AAA GTT CGT GTT GAT CCG AAA AAG AGA 1352Gly Asn Ala Cys Pro Thr Ile Lys Val Arg Val Asp Pro Lys Lys Arg141514201425AAT AGA CTT ATC TTT AGG AAG TTC AAC TCA GGA AAA CCT CAG TTT GCT 1400Asn Arg Leu Ile Phe Arg Lys Phe Asn Ser Gly Lys Pro Gln Phe Ala143014351440GGA ACC ATG ACT CAT TCA CAA ACA AAT TTT AAA GAT ATT CAT CGT GAT 1448Gly Thr Met Thr His Ser Gln Thr Asn Phe Lys Asp Ile His Arg Asp1445145014551460CTA TAC GAT GCA GCC TTA AAT ATT AAT AAG TTG AAA GCA GTG GAT GAA 1496Leu Tyr Asp Ala Ala Leu Asn Ile Asn Lys Leu Lys Ala Val Asp Glu146514701475GCT ACA ACT TTG ATT GAA AAG GGT GCA GAC ATA GAA GCA AAA TTT GAC 1544Ala Thr Thr Leu Ile Glu Lys Gly Ala Asp Ile Glu Ala Lys Phe Asp148014851490AAT GAC AGA AGT GCA ATG CAC GCA GTT GCA TAT CGA GGA AAT AAC AAA 1592Asn Asp Arg Ser Ala Met His Ala Val Ala Tyr Arg Gly Asn Asn Lys149515001505ATA GCC TTA AGA TTT CTT TTG AAA AAT CAA TCC ATT GAC ATC GAG TTA 1640Ile Ala Leu Arg Phe Leu Leu Lys Asn Gln Ser Ile Asp Ile Glu Leu151015151520AAA GAT AAA AAC GGC TTT ACT CCT CTA CAC ATC GCA GCT GAA GCA GGT 1688Lys Asp Lys Asn Gly Phe Thr Pro Leu His Ile Ala Ala Glu Ala Gly1525153015351540CAG GCA GGA TTT GTT AAG TTA CTA ATA AAT CAT GGA GCT GAT GTG AAT 1736Gln Ala Gly Phe Val Lys Leu Leu Ile Asn His Gly Ala Asp Val Asn154515501555GCA AAA ACA AGT AAG ACA AAT TTG ACA CCA TTA CAT CTT GCA ACA CGT 1784Ala Lys Thr Ser Lys Thr Asn Leu Thr Pro Leu His Leu Ala Thr Arg156015651570AGT GGA TTT TCA AAA ACT GTA AGA AAT TTA CTA GAA AGC CCA AAT ATT 1832Ser Gly Phe Ser Lys Thr Val Arg Asn Leu Lau Glu Ser Pro Asn Ile157515801585AAG GTA AAT GAA AAG GAG GAT GAC GGA TTT ACA CCT TTG CAT ACT GCA 1880Lys Val Asn Glu Lys Glu Asp Asp Gly Phe Thr Pro Leu His Thr Ala159015951600GTA ATG AGT ACT TAT ATG GTT GTC GAT GCT TTG CTA AAT CAT CCA GAC 1928Val Met Ser Thr Tyr Met Val Val Asp Ala Leu Leu Asp His Pro Asp1605161016151620ATT GAT AAA AAT GCG CAG TCT ACG TCA GGA TTG ACT CCT TTC CAT TTA 1976Ile Asp Lys Asp Ala Gln Ser Thr Ser Gly Leu Thr Prp Phe His Leu162516301635GCA ATT ATT AAT GAA AGT CAA GAA GTT GCA GAA TCT TTA GTG GAA AGT 2024Ala Ile Ile Asn Glu Ser Gln Glu Val Ala Glu Ser Leu Val Glu Ser164016451650AAT GCT GAT CTA AAT ATT CAG GAT GTT AAC CAT ATG GCT CCT ATT CAT 2072Asn Ala Ase Leu Asn Ile Gln Asp Val Asn His Met Ala Pro Ile His165516601665TTT GCA GCT TCA ATG GGT AGT ATT AAA ATG CTT AGA TAT CTC ATT TCC 2120Phe Ala Ala Ser Met Gly Ser Ile Lys Mer Leu Arg Tyr Leu Ile Ser167016751680ATA AAA GAT AAA GTT AGT ATT AAT TCT GTG ACT GAG AAT AAT AAC TGG 2168Ile Lys Asp Lys Val Ser Ile Asn Ser Val Thr Glu Asn Asn Asn Trp168516901695ACA CCT TTA CAT TTT GCT ATA TAT TTT AAA AAA GAA GAT GCT GCA AAA 2216Thr Pre Leu His Phe Ala Ile Tyr Phe Lys Lys Glu Asp Ala Ala Lys170517101715GAA TTG TTG AAA CAA GAT GAC ATA AAT TTA ACA ATT GTT GCA GAT GGT 2264Glu Leu Leu Lys Gln Asp Asp Ile Asn Leu Thr Ile Val Ala Asp Gly172017251730AAT CTT ACC GTT TTA CAT CTT GCT GTT TCG ACA GGA CAA ATA AAT ATA 2312Asn Leu Thr Val Leu His Leu Ala Val Ser Thr Gly Gln Ile Asn Ile173517401745ATT AAA GAA TTA TTG AAG AGA GGC TCC AAT ATA GAA GAA AAA ACT GGA 2360Ile Lys Glu Leu Leu Lys Ars Gly Ser Asn Ile Glu Glu Lys Thr Gly17501755 1760GAA GGA TAT ACA TCT CTC CAC ATC GCT GCG ATG CGA AAG GAG CCA GAG 2408Glu Gly Tyr Thr Ser Leu His Ile Ala Ala Met Arg Lys Glu Pro Glu1765177017751780ATA GCT GTT GTT TTG ATT GAA AAC GGT GCT GAC ATA GAA GCT CGA TCA 2456Ile Ala Val Val Leu Ile Glu Asn Gly Ala Asp Ile Glu Ala Arg Ser1785l7901795GCT GAT AAT TTA ACA CCT TTA CAT TCT GCC GCA AAA ATA GGA AGG AAA 2504Ala Asp Asn Leu Thr Pro Leu His Ser Ala Ala Lys Ile Gly Arg Lys180018051810TCT ACA GTA CTT TAC TTA TTA GAA AAA GGA GCT GAC ATT GGA GCT AAA 2552Ser Thr Val Leu Tyr Leu Leu Glu Lys Gly Ala Asp Ile Gly Ala Lys181518201825ACA GCA GAC GGT TCT ACT GCC TTG CAT TTA GCT GTA TCT GGT CGT AAA 2600Thr Ala Asp Gly Ser Thr Ala Leu His Leu Ala Val Ser Gly Arg Lys183018351840ATG AAA ACT GTT GAA ACT CTA TTA AAT AAA GGA GCA AAT TTA AAA GAA 2648Met Lys Thr Val Glu Thr Leu Leu Asn Lys Gly Ala Asn Leu Lys Glu1845185018551860TAC GAT AAC AAT AAA TAT TTG CCA ATA CAT AAA GCT ATT ATT AAT GAT 2696Tyr Asp Asn Asn Lys Tyr Leu Pro Ile His Lys Ala Ile Ile Asn Asp186518701875GAC CTT GAC ATG GTA CGT TTG TTT CTT GAA AAA GAT CCC AGT CTC AAA 2744Asp Leu Asp Met Val Arg Leu Phe Leu Glu Lys Asp Pro Ser Leu Lys188018851890GAT GAT GAA ACA GAA GAG GGT AGA ACT TCA ATT ATG TTA ATT GTT CAG 2792Asp Asp Glu Thr Glu Glu Gly Arg Thr Ser Ile Met Leu Ile Val Gln189519001905AAA TTG CTT CTT GAA TTA TAT AAC TAT TTT ATA AAT AAT TAT GCT GAA 2840Lys Leu Leu Leu Glu Leu Tyr Asn Tyr Phe Ile Asn Asn Tyr Ala Glu191019151920ACT TTG GAT GAA GAA GCT TTA TTC AAC CGC TTA GAT GAA CAA GGG AAA 2888Thr Leu Asp Glu Glu Ala Leu Phe Asn Arg Leu Asp Glu Gln Gly Lys1925193019351940TTA GAG CTT GCA TAT ATC TTC CAT AAT AAA GAA GGT CAT GCA AAA GAG 2936Leu Glu Leu Ala Tyr Ile Phe His Asn Lys Glu Gly Asp Ala Lys Glu194519501955GCT GTT AAG CCA ACT ATC CTT GTT ACA ATT AAA CTT ATG GAA TAC TGC 2984Ala Val Lys Pro Thr Ile Leu Val Thr Ile Lys Leu Met Glu Tyr Cys196019651970TTA AAA AAA CTT CGC GAA GAG TCT GGA GCT CCT GAA GGT AGT TTC GAT 3032Leu Lys Lys Leu Arg Glu Glu Ser Gly Ala Pro Glu Gly Ser Phe Asp197519801985TCT CCA TCT TCA AAG CAA TGT ATT TCT ACC TTT TCA GAG GAT GAA ATG 3080Ser Pro Ser Ser Lys Gln Cys Ile Ser Thr Phe Ser Glu Asp Glu Met199019952000TTT CGT CGT ACT TTA CCG GAA ATT GTA AAA GAA ACG AAC AGC AGA TAT 3128Phe Arg Arg Thr Leu Pro Glu Ile Val Lys Glu Thr Asn Ser Arg Tyr2005201020152020TTA CCA CTA AAG GGC TTT TCT CGC AGC CTA AAT AAG TTT CTC CCT TCT 3176Leu Pro Leu Lys Gly Phe Ser Arg Sar Leu Asn Lys Phe Leu Pro Ser202520302035CTA AAA TTT GCC GAA AGT AAG AAT AGC TAC AGA TCT GAA AAT TTT GTT 3224Leu Lys Phe Ala Glu Ser Lys Asn Ser Tyr Arg Sar Glu Asn Phe Val204020452050AGC AAT ATT GAT TCC AAC GGA GCA TTA CTT TTA CTC GAT GTA TTT ATC 3272Ser Asn Ile Asp Ser Asn Gly Ala Leu Leu Leu Leu Asp Val Phe Ile205520602065AGA AAG TTT ACT AAT GAG AAA TAC AAT TTG ACT GGA AAA GAA GCT GTA 3320Arg Lys Phe Thr Asn Glu Lys Tyr Asn Leu Thr Gly Lys Glu Ala Val207020752080CCC TAT CTG GAA GCA AAG GCT TCA TCA TTA CGT ATC GCT TCT AAA TTT 3368Pro Tyr Leu Glu Ala Lys Ala Ser Ser Leu Arg Ile Ala Ser Lys Phe2085209020952100GAA GAA CTT CTA ACT GAA GTT AAA GGT ATT CCG GCT GGA GAG CTA ATT 3416Glu Glu Leu Leu Thr Glu Val Lys Gly Ile Pro Ala GLy Glu Leu Ile210521102115AAT ATG GCC GAA GTG AGT TCC AAC ATA CAT AAG GCA ATT GCA AGT GGT 3464Asn Met Ala Glu Val Ser Ser Asn ILe His Lys Ala Ile ALa Ser Gly212021252130AAG CCT GTA TCA AAA GTC TTA TGT TCG TAT TTG GAT ACC TTT TCT GAA 3512Lys Pro Val Ser Lys Val Leu Cys Ser Tyr Leu Asp Thr Phe Ser Glu213521402145TTA AAT TCT CAA CAA ATG GAA GAA TTA GTT AAC ACA TAC TTA TCC ACC 3560Leu Asn Ser Gln Gln Met Glu Glu Leu Val Asn Thr Tyr Leu Ser Thr215021552160AAA CCT TCT GTA ATT ACG TCA GCA TCT GCA GAT TAC CAG AAA CTT CCT 3608Lys Pro Ser Val Ile Thr Ser Ala Ser Ala Asp Tyr Gln Lys Leu Pro21652170 2175 2180AAT TTG TTA ACT GCA ACT TGC TTA GAA CCA GAA AGA ATG GCT CAA CTT 3656Asn Leu Leu Thr Ala Thr Cys Leu Glu Pro Glu Arg Met Ala Gln Leu218521902195ATA GAT GTG CAT CAA AAG ATG TTT TTA CGT TAAAATACCA TTCCTTCTGT 3706Ile Asp Val His Gln Lys Met Phe Leu Arg22002205(2)序列4的信息(i)序列特征(A)长度1214个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述序列4Met His Ser Lys Glu Leu Gln Thr Ile Ser Ala Ala Val Ala Arg Lys1 5 10 15Ala Val Pro Asn Thr Met Val Ile Arg Leu Lys Arg Asp Glu Glu Asp20 25 30Gly Glu Met Thr Leu Glu Glu Arg Gln Ala Gln Cys Lys Ala Ile Glu35 40 45Tyr Ser Asn Ser Val Phe Gly Met Ile Ala Asp Val Ala Asn Asp Ile50 55 60Gly Ser Ile Pro Val Ile Gly Glu Val Val Gly Ile Val Thr Ala Pro55 70 75 80Ile Ala Ile Val Ser His Ile Thr Ser Ala Gly Leu Asp Ile Ala Ser85 90 95Thr Ala Leu Asp Cys Asp Asp Ile Pro Phe Asp Glu Ile Lys Glu Ile100 105 110Leu Glu Glu Arg Phe Asn Glu Ile Asp Arg Lys Leu Asp Lys Asn Thr115 120 125Ala Ala Leu Glu Glu Val Ser Lys Leu Val Ser Lys Thr Phe Val Thr130 135 140Val Glu Lys Thr Arg Asn Glu Met Asn Glu Asn Phe Lys Leu Val Leu145 150 155 160Glu Thr Ile Glu Ser Lys Glu Ile Lys Ser Ile Val Phe Lys Ile Asn165 170 175Asp Phe Lys Lys Phe Phe Glu Lys Glu Arg Gln Arg Ile Lys Gly Leu180 185 190Pro Lys Asp Arg Tyr Val Ala Lys Leu Leu Glu Gln Lys Gly Ile Leu195 200 205Gly Ser Leu Lys Glu Val Arg Glu Pro Ser Gly Asn Ser Leu Ser Ser210 215 220Ala Leu Asn Glu Leu Leu Asp Lys Asn Asn Asn Tyr Ala Ile Pro Lys225 230 235 240Val Val Asp Asp Asn Lys Ala Phe Gln Ala Leu Tyr Ala Leu Phe Tyr245 250 255Gly Thr Gln Thr Tyr Ala Ala Val Met Phe Phe Leu Leu Glu Gln Mls260 265 270Ser Tyr Leu Ala Asp Tyr Tyr Tyr Gln Lys Gly Asp Asp Val Asn Phe275 280 285Asn Ala Glu Phe Asn Asn Val Ala Ile IlE Phe Asp Asp Phe Lys Ser290 295 300Ser Leu Thr Gly Gly Asp Asp Gly Leu Ile Asp Asn Val Ile Glu Val305 310 315 320Leu Asn Thr Val Lys Ala Leu Pro Phe Ile Lys Asn Ala Asp Ser Lys325 330 335Leu Tyr Arg Glu Leu Val Thr Arg Thr Lys Ala Leu Glu Thr Leu Lys340 345 350Asn Gln Ile Lys Thr Thr Asp Leu Pro Leu Ile Asp Asp Ile Pro Glu355 360 365Thr Leu Ser Gln Val Asn Phe Pro Asn Asp Glu Asn Gln Leu Pro Thr370 375 380Pro Ile Gly Asn Trp Val Asp Gly Val Glu Val Arg Tyr Ala Val Gln385 390 395 400Tyr Glu Ser Lys Gly Met Tyr Ser Lys Phe Ser Glu Trp Ser Glu Pro405 410 415Phe Thr Val Gln Gly Asn Ala Cys Pro Thr Ile Lys Val Arg Val Asp420 425 430Pro Lys Lys Arg Asn Arg Leu Ile Phe Arg Lys Phe Asn Ser Gly Lys435 440 445Pro Gln Phe Ala Gly Thr Met Thr His Ser Gln Thr Asn Pna Lys Asp450 455 460Ile His Arg Asp Leu Tyr Asp Ala Ala Leu Asn Ile Asn Lys Leu Lys465 470 475 480Ala Val Asp Glu Ala Thr Thr Leu Ile Glu Lys Gly Ala Asp Ile Glu485 490 495Ala Lys Phe Asp ASn Asp Arg Ser Ala Met His Ala Val Ala Tyr Arg500 505 510Gly Asn Asn Lys Ile Ala Leu Arg Phe Leu Leu Lys Asn Gln Ser Ile515 520 525Asp Ile Glu Leu Lys Asp Lys Asn Gly Phe Thr Pro Leu His Ile Ala530 535 540Ala Glu Ala Gly Gln Ala Gly Phe Val Lys Leu Leu Ile Asn His Gly545 550 555 560Ala Asp Val Asn Ala Lys Thr Ser Lys Thr Asn Leu Thr Pro Leu His565 570 575Leu Ala Thr Arg Ser Gly Phe Ser Lys Thr Val Arg Asn Leu Leu Glu580 585 590Ser Pro Asn Ile Lys Val Asn Glu Lys Glu Asp Asp Gly Phe Thr Pro595 600 605Leu His Thr Ala Val Met Ser Thr Tyr Met Val Val Asp Ala Leu Leu610 615 620Asn His Pro Asp Ile Asp Lys Asn Ala Gln Ser Thr Ser Gly Leu Thr625 630 635 640Pro Phe His Leu Ala Ile Ile Asn Glu Ser Gln Glu Val Ala Glu Ser645 650 655Leu Val Glu Ser Asn Ala Asp Leu Asn Ile Gln Asp Val Asn His Met660 665 670Ala Pro Ile His Phe Ala Ala Ser Met Gly Ser Ile Lys Met Leu Arg675 680 685Tyr Leu Ile Ser Ile Lys Asp Lys Val Ser Ile Asn Ser Val Thr Glu690 695 700Asn Asn Asn Trp Thr Pro Leu His Phe Ala Ile Tyr Phe Lys Lys Glu705 710 715 720Asp Ala Ala Lys Glu Leu Leu Lys Gln Asp Asp Ile Asn Leu Thr Ile725 730 735Val Ala Asp Gly Asn Leu Thr Val Leu His Leu Ala Val Ser Thr Gly740 745 750Gln Ile Asn Ile Ile Lys Glu Leu Leu Lys Arg Gly Ser Asn Ile Glu755 760 765Glu Lys Thr Gly Glu Gly Tyr Thr Ser Leu His Ile Ala Ala Met Arg770 775 780Lys Glu Pro Glu Ile Ala Val Val Leu Ile Glu Asn Gly Ala Asp Ile785 790 795 800Glu Ala Arg Ser Ala Asp Asn Leu Thr Pro Leu His Ser Ala Ala Lys805 810 815Ile Gly Arg Lys Ser Thr Val Leu Tyr Leu Leu Glu Lys Gly Ala Asp820 825 830Ile Gly Ala Lys Thr Ala Asp Gly Ser Thr Ala Leu His Leu Ala Val835 840 845Ser Gly Arg Lys Met Lys Thr Val Glu Thr Leu Leu Asn Lys Gly Ala850 855 860Asn Leu Lys Glu Tyr Asp Asn Asn Lys Tyr Leu Pro Ile His Lys Ala865 870 875 880Ile Ile Asn Asp Asp Leu Asp Met Val Arg Leu Phe Leu Glu Lys Asp885 890 895Pro Ser Leu Lys Asp Asp Glu Thr Glu Glu Gly Arg Thr Ser Ile Met900 905 910Leu Ile Val Gln Lys Leu Leu Leu Glu Leu Tyr Asn Tyr Phe Ile Asp915 920 925Asn Tyr Ala Glu Thr Leu Asp Glu Glu Ala Leu Phe Asn Arg Leu Asp930 935 940Glu Gln Gly Lys Leu Glu Leu Ala Tyr Ile Phe His Asn Lys Glu Gly945 950 955 960Asp Ala Lys Glu Ala Val Lys Pro Thr Ile Leu Val Thr Ile Lys Leu965 970 975Met Glu Tyr Cys Leu Lys Lys Leu Arg Glu Glu Ser Gly Ala Pro Glu980 985 990Gly Ser Phe Asp Ser Pro Ser Ser Lys Gln Cys Ile Ser Thr Phe Ser995 10001005Glu Asp Glu Met Phe Arg Arg Thr Leu Pro Glu Ile Val Lys Glu Thr10l010151020Asn Ser Arg Tyr Leu Pro Leu Lys Gly Phe Ser Arg Ser Leu Asn Lys1025103010351040Phe Leu Pro Ser Leu Lys Phe Ala Glu Ser Lys Asn Ser Tyr Arg Ser104510501055Glu Asn Phe Val Ser Asn Ile Asp Ser Asn Gly Ala Leu Leu Leu Leu106010651070Asp Val Phe Ile Arg Lys Phe Thr Asn Glu Lys Tyr Asn Leu Thr Gly107510801085Lys Glu Ala Val Pro Tyr Leu Glu Ala Lys Ala Ser Ser Leu Arg Ile109010951100Ala Ser Lys Phe Glu Glu Leu Leu Thr Glu Val Lys Gly Ile Pro Ala1105111011151120Gly Glu Leu Ile Asn Met Ala Glu Val Ser Ser Asn Ile His Lys Ala112511301135Ile Ala Ser Gly Lys Pro Val Ser Lys Val Leu Cys Ser Tyr Leu Asp114011451150Thr Phe Ser Glu Leu Asn Ser Gln Gln Mer Glu Glu Leu Val Asn Thr115511501165Tyr Leu Ser Thr Lys Pro Ser Val Ile Thr Ser Ala Ser Ala Asp Tyr117011751180Gln Lys Leu Pro Asn Leu Leu Thr Ala Thr Cys Leu Glu Pro Glu Arg1185119011951200Met Ala Gln Leu Ile Asp Val His Gln Lys Met Phe Leu Arg12051210
权利要求书按照条约第19条的修改1.一种活性昆虫特异性神经毒素多肽,通过表达对应于编码存在于毒寇蛛(Latrodectus mactans Tredecimguttatus)毒液中的昆虫特异性神经毒素的基因的一部分的基因序列的截短形式,或它的类似物而产生。
2.上述任一权利要求的多肽,其中多肽对应于由基因序列编码的基本上无毒的前体多肽的毒性衍生物。
3.上述任一权利要求的多肽,其中多肽包含对应于基本上无毒的前体多肽的氨基酸序列的截短形式的氨基酸序列。
4.权利要求3的多肽,其中多肽的氨基酸序列对应于主要在羧基(C)端被截短的前体多肽的氨基酸序列。
5.权利要求4的多肽,其中截短为约150至200个氨基酸。
6.权利要求3-5任一项的多肽,其中多肽的氨基酸序列另外还对应于在氨基端(N)截短的前体多肽的氨基酸序列。
7.权利要求6的多肽,其中截短为少于50个氨基酸,更理想为7或28个氨基酸。
8.上述任一项权利要求的多肽,其中多肽的氨基酸序列同源于昆虫特异性神经毒素δ-毒蛛昆虫毒素(δ-LIT)或它的活性衍生物的氨基酸序列。
9.上述任一项权利要求的多肽,其中多肽包含序列1和序列2所示的氨基酸序列或它的活性衍生物。
10.上述任一项权利要求的多肽,其中毒素由包含如序列1所示序列的基因序列的截短形式或核苷酸构建物或它的活性变异体表达。
11.上述任一项权利要求的多肽,其中多肽基本上由保藏在国立工业和海洋微生物保藏有限公司,保藏号为NCIMB 40632的微生物提供的序列表达。
12.用作毒素的一种蛋白质,它包含基本上如序列1和序列2所示的氨基酸序列或它的活性衍生物。
13.一种包含对应于编码存在于毒寇蛛毒液中的昆虫特异性神经毒素的基因的一部分的基因序列的截短形式或它的类似物的核苷酸序列,用于活性昆虫特异性神经毒素多肽的表达中。
14.权利要求13的核苷酸序列,其中核苷酸序列对应于编码前体多肽,并在它的3’端被截短的基因,或它的活性衍生物。
15.权利要求14的核苷酸序列,其中核苷酸序列对应于被截短约400至650个核苷酸碱基,更理想的为550至600个核苷酸碱基的基因。
16.权利要求13至15任一项的核苷酸序列,其中核苷酸对应于在它的5’端被截短的基因。
17.权利要求16的核苷酸序列,其中截短为少于100个核苷酸碱基,更理想的为84或21个核苷酸碱基。
18.权利要求13至17任一项的核苷酸序列,其中核苷酸序列对应于编码昆虫特异性毒素δ-毒蛛昆虫毒素(δ-LIT)的前体多肽的基因的一部分,或它的活性衍生物。
19.权利要求13至18任一项的核苷酸序列,其中核苷酸序列编码包含991个氨基酸序列的多肽。
20.权利要求1至19任一项的核苷酸序列,其中核苷酸序列包含如序列1所示的碱基序列,或它的活性衍生物。
21.权利要求13至20任一项的核苷酸序列,其中核苷酸序列包含基本上如包含在保藏在国立工业和海洋微生物保藏有限公司中,保藏号为NCIMB 40632的微生物中的碱基序列。
22.权利要求13至21任一项的核苷酸序列,其中核苷酸序列编码具有如序列1和序列2所示的氨基酸序列的多肽,或它的活性衍生物。
23.权利要求13至22任一项的核苷酸序列,其中核苷酸序列为通过使用酶,如逆转录酶,从mRNA衍生而来的cDNA。
24.权利要求13至23任一项的核苷酸序列,其中核苷酸序列为多半使用聚合酶链反应(PCR)产生的寡核苷酸DNA构建物。
25.一种生产如权利要求1所述多肽的方法,该方法包括制备包含如权利要求13所述的基因的截短形式的重组DNA分子,在宿主表达系统如细菌表达系统表达截短形式来产生多肽。
26.权利要求25的方法,其中产生的多肽为基本上如上述任一项权利要求所述的活性毒素。
27.权利要求25或26的方法,其中截短形式包含编码非毒性前体多肽的基因的一部分。
28.权利要求25至27任一项的方法,其中截短形式包含基本上如权利要求14至24任一项所述的核苷酸序列。
29.权利要求25至28任一项的方法,其中表达系统包含用含有序列截短形式的pT7-1载体转化的E.coli BL21(DE3)细菌细胞。
30.权利要求25至29任一项的方法,其中表达系统包含杆状病毒系统。
31.一种包含编码通常如上述任一项权利要求所述的毒素的基因的截短形式的重组DNA分子。
32.权利要求31所述的重组DNA分子,其中该分子包含病毒。
33.权利要求32所述的重组DNA分子,其中该分子包含杆状病毒。
34.基本上如保藏号为NCIMB 40632的微生物所提供的重组DNA分子。
35.一种包含通常如权利要求14至24任一项所述的基因的截短形式的表达载体。
36.一种如用基本上如权利要求31或35所述的重组分子转化的细胞,如病毒或细菌细胞。
37.一种包含基本上如权利要求1至12任一项所述的毒素的杀虫剂。
38.权利要求37的杀虫剂,其中杀虫剂为口服或局部施用。
39.权利要求37或38的杀虫剂,其中杀虫剂包含喷雾用液。
40.一种杀虫剂系统,包含在昆虫中表达如权利要求13至24任一项所述的基因的截短形式来产生基本上如上述任一项权利要求所述的毒素以杀死或使昆虫丧失能力的方法。
41.权利要求40的杀虫剂系统,其中杀虫剂系统包含病毒表达系统。
42.权利要求41的杀虫剂系统,其中病毒表达系统包含杆状病毒表达系统。
43.一种包含含有基本上如权利要求13至24任一项所述的基因序列的截短形式的遗传修饰细胞的植物。
44.一种包含含有基本上如权利要求13至24任一项所述的基因序列的截短形式的遗传修饰细胞的非人类动物。
45.一种毒素,通过加工具有对应于存在于毒寇蛛毒液中的昆虫特异性神经毒素的氨基酸序列的基本上分离的非毒性前体多肽而产生。
46.权利要求45的毒素,其中毒素通过截短前体多肽的羧基(C)端而产生。
47.权利要求46的毒素,其中毒素的氨基酸序列通常对应于被截短150至200个氨基酸的前体多肽的氨基酸序列。
48.权利要求45至47任一项的毒素,其中毒素的氨基酸序列通过朝前体多肽的氨基酸序列的氨基(N)端截短而产生。
49.权利要求48的毒素,其中从氨基端切下的片段明显短于从羧基端切下的片段。
50.权利要求48或49的毒素,其中切下来的片段包含7个或28个氨基酸。
51.权利要求45至50的毒素,其中毒素包含或为昆虫特异性神经毒素δ-毒蛛昆虫毒素(LIT)的类似物,或它的活性衍生物。
52.权利要求45至51任一项的毒素,其中毒素包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
53.一种生产具活性的昆虫特异性神经毒素多肽的方法,该多肽从具有对应于存在于毒寇蛛毒液中的昆虫特异性神经毒素的氨基酸序列的分离的非活性前体多肽产生,该方法包括截短分离的前体多肽。
54.权利要求53的方法,其中分离的前体多肽在羧基端被截短。
55.权利要求53或54的方法,其中截短使用蛋白水解切断,优选通过定点诱变完成。
56.权利要求53至55任一项的方法,其中提供了N-末端的截短。
57.权利要求53至56任一项的方法,其中活性多肽为毒素,并基本上如权利要求1至12、45至52任一项所述。
58.一种分离的核苷酸碱基序列,编码具有如序列4所示的氨基酸序列的毒性前体多肽或它的衍生物。
59.一种分离的碱基序列,包含如序列3所示的碱基序列或它的衍生物。
60.权利要求58或59的分离的碱基序列,其中核苷酸碱基序列编码神经毒素δ-毒蛛昆虫毒素(LIT)的前体多肽。
61.一种基本上如保藏号为NCIMB 40633的微生物所提供的分离碱基序列。
62.一种重组DNA分子,包含基本上如权利要求58至61任一项所述的序列。
63.权利要求62的重组DNA分子,其中该分子包含病毒。
64.权利要求63的重组DNA分子,其中病毒包含杆状病毒。
65.用基本上如权利要求62至64任一项的重组DNA分子转化的细胞,如细菌或病毒细胞。
66.一种杀虫剂系统,包括在昆虫中表达基本上如权利要求58至61任一项所述的碱基序列来产生前体多肽,并加工前体多肽产生毒素,从而杀死或使昆虫丧失能力的方法。
67.权利要求66的杀虫剂系统,其中系统包含病毒表达系统。
68.权利要求67的杀虫剂系统,其中病毒表达系统包含杆状病毒。
69.一种包含含有基本上如权利要求58至61任一项所述的核苷酸序列的被遗传修饰的细胞的植物。
70.一种包含含有基本上如权利要求58至61任一项所述的核苷酸序列的被遗传修饰的细胞的非人类动物。
71.一种新的毒素,基本上如上文序列1和序列2所描述。
72.一种核苷酸序列,基本上如上文序列1所描述。
73.一种分离的多肽,基本上如上文序列3和序列4所描述。
74.一种分离的核苷酸序列,基本上如上文序列3所描述。
权利要求
1.一种由截短形式的基因序列或其类似物表达形成的多肽,例如一种毒素。
2.权利要求1的多肽,其中多肽为一种神经毒素。
3.上述任一项权利要求的多肽,其中多肽对应于基因序列编码的基本上无毒性的前体多肽的毒性衍生物。
4.上述任一项权利要求的多肽,其中多肽包含对应于基本上无毒性的前体多肽的氨基酸序列的截短形式的氨基酸序列。
5.权利要求4的多肽,其中多肽的氨基酸序列对应于主要在它的羧基(C)端被截短的前体多肽的氨基酸序列。
6.权利要求5所述的多肽,其中截短约150至200个氨基酸。
7.权利要求4-6任一项所述的多肽,其中多肽氨基酸序列还对应于在氨基端(N)截短的前体多肽的氨基酸序列。
8.权利要求7的多肽,其中截短少于50个氨基酸,更理想的为7或28个氨基酸。
9.上述任一项权利要求所述的多肽,其中多肽的氨基酸序列同源于昆虫特异性神经毒素δ-毒蛛昆虫毒素(δ-LIT)的氨基酸序列或它的活性衍生物。
10.上述任一项权利要求所述的多肽,其中多肽包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
11.上述任一项权利要求所述的多肽,其中毒素由包含序列1所示序列的基因序列的核苷酸构建物或截短形式或它的活性变异体表达。
12.上述任一项权利要求所述的多肽,其中多肽由基本上如保藏在国立工业和海洋微生物保藏有限公司,保藏号为NCIMB 40632的微生物所提供的序列表达。
13.一种用作毒素的蛋白质,包含基本上如序列1和序列2所示的氨基酸序列,或它的活性衍生物。
14.一种可用于多肽,如毒素的表达的核苷酸序列,包含基因序列的截短形式或它的类似物。
15.权利要求14的核苷酸序列,其中核苷酸序列对应于编码前体多肽,并在它的3’端被截短的基因,或它的活性衍生物。
16.权利要求15的核苷酸序列,其中核苷酸序列对应于被截短约400至650个核苷酸碱基,更理想的为550至600个核苷酸碱基的基因。
17.权利要求14-16任一项的核苷酸序列,其中核苷酸序列对应于在它的5’端被截短的基因。
18.权利要求17的核苷酸序列,其中截短少于100个核苷酸碱基,更理想的为84或21个核苷酸碱基。
19.权利要求14-18任一项的核苷酸序列,其中核苷酸序列对应于编码毒寇蛛(Latrodectus Mactans Tredecimguttatus)毒液中的神经毒素的基因的一部分或它的活性衍生物。
20.权利要求19所述的核苷酸序列,其中核苷酸序列对应于编码昆虫特异性毒素δ-毒蛛昆虫毒素(δ-LIT)的前体多肽的基因的一部分或它的活性衍生物。
21.权利要求14-20任一项的核苷酸序列,其中核苷酸序列编码包含991个氨基酸序列的多肽。
22.权利要求14-21任一项所述的核苷酸序列,其中核苷酸序列包含如序列1所示的碱基序列,或它的活性衍生物。
23.权利要求14-22任一项所述的核苷酸序列,其中核苷酸序列包含基本上如包含在保藏在国立工业和海洋微生物保藏有限公司中,保藏号为NCIMB 40632的微生物中的碱基序列。
24.权利要求14-23任一项的核苷酸序列,其中核苷酸序列编码具有如序列1和序列2所示的氨基酸序列的多肽,或它的活性衍生物。
25.权利要求14-24任一项的核苷酸序列,其中核苷酸序列为通过使用酶,如逆转录酶从mRNA衍生而来的cDNA。
26.权利要求14-25任一项的核苷酸序列,其中核苷酸序列为可能使用聚合酶链反应(PCR)产生的寡核苷酸DNA构建物。
27.一种生产多肽的方法,该方法包括产生包含基因截短形式的重组DNA分子,在宿主表达系统中如病毒或细菌表达系统中表达截短形式来生产多肽。
28.权利要求27的方法,其中产生的多肽为基本上如上述任一项权利要求所述的活性毒素。
29.权利要求27或28的方法,其中截短形式包含编码非毒性前体多肽的基因的一部分。
30.权利要求27-29的方法,其中截短形式包含基本上如权利要求14-26任一项所述的核苷酸序列。
31.权利要求27至30任一项的方法,其中表达系统包含用含有序列截短形式的pT7-1载体转化的大肠杆菌BL21(DE3)细菌细胞。
32.权利要求27至31任一项的方法,其中表达系统包含杆状病毒系统。
33.一种重组DNA分子,包含编码通常如上述任一项权利要求所述的毒素的基因的截短形式。
34.权利要求33的重组DNA分子,其中该分子包含病毒。
35.权利要求34的重组DNA分子,其中该分子包含杆状病毒。
36.一种基本上如保藏号为NCIMB 40632的微生物所提供的重组DNA分子。
37.一种包含通常如权利要求14至26任一项的基因的截短形式的表达载体。
38.一种细胞,如用基本上如权利要求33-37任一项所述的重组分子转化的病毒或细菌细胞。
39.一种包含基本上如权利要求1-13任一项所述的毒素的杀虫剂。
40.权利要求39的杀虫剂,其中杀虫剂为口服或局部施用。
41.权利要求39或40的杀虫剂,其中杀虫剂包含喷雾用液。
42.一种杀虫剂系统,包含在昆虫中表达基因的截短形式来产生基本上如上述任一项权利要求所述的毒素以杀死或使昆虫丧失活动能力的方法。
43.权利要求42的杀虫剂系统,其中该杀虫剂系统包含病毒表达系统。
44.权利要求43的杀虫剂系统,其中病毒表达系统包含杆状病毒系统。
45.一种包含含有基本上如权利要求14-26任一项的基因序列的截短形式的遗传修饰细胞的植物。
46.一种包含含有基本上如权利要求14-26任一项所述的基因序列的截短形式的遗传修饰细胞的非人类的动物。
47.一种通过加工分离的基本上无毒性的前体多肽而产生的毒素。
48.如权利要求47的毒素,其中毒素通过截短前体多肽的羧基(C)端而产生。
49.如权利要求48所述的毒素,其中毒素的氨基酸序列通常对应于被截短150至200个氨基酸的前体多肽的氨基酸序列。
50.如权利要求47至49任一项的毒素,其中毒素的氨基酸序列通过截短前体多肽的氨基酸序列的氨基(N)端而产生。
51.如权利要求50的毒素,其中从氨基端切下的片段明显短于从羧基端切下的片段。
52.如权利要求50或51的毒素,其中切下来的片段包含7个或28个氨基酸。
53.如权利要求47-52的毒素,其中毒素具有对应于被毒寇蛛(Latrodectus mactans Tredecimgutttus)的基因的一部分编码的多肽的氨基酸序列。
54.如权利要求47-53任一项的毒素,其中毒素包含或为昆虫特异性神经毒素δ-毒蛛昆虫毒素(δ-LIT)的类似物,或它的活性衍生物。
55.如权利要求47-54任一项所述的毒素,其中毒素包含如序列1和序列2所示的氨基酸序列或它的活性衍生物。
56.从分离的非活性的前体多肽生产活性多肽的方法,该方法包括截短分离的前体多肽。
57.如权利要求56的方法,其中分离的前体多肽在羧基端被截短。
58.如权利要求56或57的方法,其中截短使用蛋白水解,优选通过定点诱变完成。
59.如权利要求56至58任一项的方法,其中可提供N-末端的截短。
60.如权利要求56至59任一项的方法,其中活性多肽为毒素,并基本上如权利要求1至13、47至55任一项所述。
61.一种分离的核苷酸碱基序列,编码具有如序列4所示的氨基酸序列的毒性前体多肽,或它的衍生物。
62.一种分离的碱基序列,它包含如序列3所示的碱基序列,或它的衍生物。
63.如权利要求61或62任一项所述的分离的碱基序列,其中核苷酸碱基序列编码神经毒素δ-毒蛛昆虫毒素(δ-LIT)的前体多肽。
64.一种基本上如保藏号为NO. NCIMB 40633的微生物所提供的分离的碱基序列。
65.一种重组DNA分子,包含基本上如权利要求61~64任一项的序列。
66.如权利要求65的重组分子,其中该分子包含病毒。
67.如权利要求66所述的重组分子,其中病毒包含杆状病毒。
68.一种用基本上如权利要求65至67任一项的重组DNA分子转化的细胞,如细菌或病毒细胞。
69.一种杀虫剂系统,包括在昆虫体中表达基本上如权利要求61至64任一项所述碱基序列来产生前体多肽,并加工前体多肽以产生毒素,从而杀死或使昆虫丧失活动能力的方法。
70.如权利要求69所述的杀虫剂系统,其中该系统包含病毒表达系统。
71.如权利要求69所述的杀虫剂系统,其中病毒表达系统包含杆状病毒。
72.一种包含含有基本上如权利要求61至64任一项的核苷酸序列的被遗传修饰的细胞的植物。
73.一种包含含有基本上如权利要求61至64任一项的核苷酸序列的被基因修饰的细胞的非人类的动物。
74.一种新的毒素,基本上如上文序列1和序列2所描述。
75.一种核苷酸序列,基本上如上文序列1所描述。
76.一种分离的多肽,基本上如上文序列3和序列4所描述。
77.一种分离的核苷酸序列,基本上如上文序列3所描述。
78.所公开的任何新的主题或其组合,无论是否落在与任何上述权利要求相同的发明范围内或与其有关。
全文摘要
一种包含分离的无脊椎动物特异性神经毒素δ-毒蛛昆虫毒素(LIT)的衍生物或类似物的毒素。毒素通过在细菌宿主中表达对应于来自毒寇蛛的基因组的基因的截短形式的核苷酸序列而产生。基因编码无毒性前体蛋白质,而截短形式编码活性毒素。
文档编号C12N15/09GK1147272SQ95192820
公开日1997年4月9日 申请日期1995年4月24日 优先权日1994年4月27日
发明者D·R·贝尔, P·N·R·乌舍伍德, I·杜卢波瓦, T·沃科瓦, E·格里辛, V·克拉斯诺佩罗夫, T·G·加金纳, M·V·科沃切夫, K·A·普卢尼科夫, O·G·申莫廷科 申请人:英国技术集团有限公司