专利名称:新杀虫蛋白质和菌株的制作方法
技术领域:
本发明涉及控制植物和非植物害虫的方法和组合物。本发明特别提供了从芽孢杆菌属的营养生长阶段分离到的新杀虫蛋白质。本发明还提供了芽孢杆菌菌株、蛋白质、以及编码这些蛋白质的基因。本发明的方法和组合物可以用于控制植物和非植物害虫的各种系统。
虫害在世界重要的商业性农作物损失中是一个主要因素。广谱性化学杀虫剂被广泛用于控制或根除农业重要性害虫。然而,研制有效的替代杀虫剂有实质性的利益。
微生物杀虫剂在替代化学虫害控制中起着重要的作用。最广泛使用的微生物产品基于细菌苏云金芽孢杆菌(Bt)。Bt是革兰氏阳性孢子形式,它在孢子形成期产生一种杀虫结晶蛋白质(ICP)。
已知的多种Bt产生超过25种不同但相关的ICP。由Bt制造的多数ICP对鳞翅目、双翅目和鞘翅目中的一些昆虫的幼虫有毒。通常,当ICP被敏感昆虫摄食后,晶体溶解并被昆虫肠蛋白质酶转化为毒性成分。没有一个对鞘翅目幼虫如土豆甲虫(Leptinotarsa decemlineata)或大黄粉虫(Tenebrio molitor)有活性的ICP′s对Diabrotica属的成员特别是玉米根叶甲(Diabroticavirgifera virgifera,WCRW)或长角叶甲(Diabrotica longicornis barberi)有明显的效果。
蜡状芽孢杆菌(Bc)与Bt关系密切。一个主要的区别特征是在Bc中缺乏伴孢晶体。Bc是一种广泛分布的细菌,在土壤中大量存在,并已从许多食品和药物中分离出来。这种有机体与食品变质有关。
虽然Bt曾在控制虫害中十分有用,但有需要增加潜在的生物防治剂的数量。
本发明提供了用于控制植物害虫的组合物和方法。尤其是提供了在芽孢杆菌菌株的营养生长期间产生的新杀虫蛋白质。这些蛋白质可用作杀虫剂。
本发明还特别涉及实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-I。优选地是保藏号为NRRL B-21058的蜡状芽孢杆菌菌株和保藏号为NRRL B-21060的苏云金芽孢杆菌菌株。优选的还有选自保藏号为NRRL B-21224,NRRLB-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌菌株。
本发明还涉及可在芽孢杆菌属的几个种(Bacillus spp)的营养生长期间分离到的昆虫特异性蛋白质,但是优选的是苏云金芽孢杆菌和蜡状芽孢杆菌菌株的昆虫特异性蛋白质以及它们的组分,其中所说的蛋白质不是得自球形芽孢杆菌SSII-I的杀蚊毒素。本发明的昆虫特异性蛋白质对鞘翅目或鳞翅目昆虫毒性更高,其分子量大约为30kDa或更大,优选的大约为100kDa,更优的大约为80kDa。
更特别地,本发明的昆虫特异性蛋白质杀虫活性谱包括针对地老虎属和/或灰翅夜蛾属的种类,但是优选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。
优选地,本发明的昆虫特异性蛋白质可被分离,例如,从保藏号为No.NRRL B-21058的蜡状芽孢杆茵或从保藏号为NRRL B-21060的苏云金芽孢杆菌中分离。
优选地,本发明的昆虫特异性蛋白质也能从保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRLB-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌属几个种的菌株分离。
本发明尤其包括氨基酸序列选自SEQ ID NO5和SEQ ID NO7的昆虫特异性蛋白质,包括任何在结构上和/或功能上与其同源的蛋白质。
也优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO20,SEQ ID NO21,SEQ ID NO29,SEQ ID NO32和SEQID NO2的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白质。
特别优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQ ID NO29和SEQ ID NO32的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白质。
本发明进一步优选的实施方案包括本发明的昆虫特异性蛋白质,其中代表分泌信号的序列被除去或灭活。
本发明还包括辅助蛋白质,这种辅助蛋白质提高昆虫特异性蛋白质的昆虫特异性活性。这些辅助蛋白质优选的具有大约50kDa的分子量,并且能被分离,例如从蜡状芽孢杆菌菌株尤其是蜡状芽孢杆菌菌株AB78的营养生长期分离。
本发明优选的实施方案涉及一种辅助蛋白质,其中代表分泌信号的序列被除去或灭活。
本发明还涉及多亚基杀虫蛋白质,这种蛋白质包含一种以上的多肽链,其中至少一种多肽链代表本发明的昆虫特异性蛋白质,至少一种多肽链代表本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述昆虫特异性蛋白质的杀虫活性。
按照本发明优选的多亚基杀虫蛋白质的分子量大约为50kDa到200kDa。
本发明尤其包括多亚基杀虫蛋白质,它包含按照本发明的昆虫特异蛋白质和辅助蛋白质,这种辅助蛋白质能激活或增强所说昆虫特异性蛋白质的杀虫活性。
本发明还涉及由几个蛋白质结构域组成的融合蛋白,其中蛋白质结构域包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,这种融合蛋白由符合读框的基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及用于融合的其它可有可无的组分的组合的特性。
本发明的一个特定实施方案涉及包含核糖核酸酶S-蛋白质、本发明的昆虫特异性蛋白质和按照本发明辅助蛋白质的融合蛋白。
本发明的另一个实施方案涉及按照本发明的昆虫特异性蛋白质和按照本发明辅助蛋白质组成的融合蛋白,其中在该融合蛋白的N-端或者是昆虫特异性蛋白质或者是辅助蛋白质。
优选的是这样一种融合蛋白,该蛋白质包含形成的SEQ ID NO23给出的蛋白质的SEQ ID NO5给出的昆虫特异性蛋白质和SEQ ID NO2给出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。
优选的是这样一种融合蛋白,该蛋白质包含形成SEQ ID NO50中给出的蛋白质的SEQ ID NO35给出的昆虫特异性蛋白质和SEQ ID NO27给出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。
本发明还涉及这样的融合蛋白,该蛋白质包含融合成信号序列的本发明昆虫特异性蛋白质和/或按照本发明的辅助蛋白质。优选的是分泌信号序列或导向序列,它指导转基因产物到特定的细胞器或细胞区室,对受体蛋白质来说,所述信号序列是异源源。
本发明内特别优选的是这样一种融合蛋白质,其中该蛋白质具有SEQ IDNO43或SEQ ID NO46给出的序列,此外还包括在结构上和/或功能上与其同源的蛋白质。
本申请所用的实质上序列同源性指在氨基酸序列间的结构关系相近。例如,实质上的同源性可以是40%同源,优选地是50%,更优选的是60%或80%或更多。同源也包含这样一种关系,其中一个或几个几个氨基酸的子序列(subsequences)缺失,或其它氨基酸的子序列被分散开(interdispersed)。
本发明的另一个方面还涉及这样的DNA分子,该分子包含编码可在芽孢杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。本发明尤其涉及这样的DNA分子,其包含编码昆虫特异性蛋白质的核苷酸序列,其中杀虫活性谱包含针对地老虎属和/或灰翅夜蛾属种类的活性,但优选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodopterafrugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]活性。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO4或SEQ IDNO6给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO19,SEQ IDNO28,SEQ ID NO31或SEQ ID NO1给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,它包含编码按照本发明之辅助蛋白质的核苷酸序列,这种辅助蛋白质能增强昆虫特异性蛋白质的昆虫特异性活性。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明的实施方案还涉及这样的DNA分子,该分子包含编码可在芽孢杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。这些核苷酸序列被最优化以适于在微生物或植物中表达。
优选的是这样的DNA分子,其中该分子包含SEQ ID NO17或SEQ IDNO18给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
也优选的是这样的DNA分子,其中该分子包含SEQ ID NO24,SEQ IDNO26,SEQ ID NO27或SEQ ID NO30给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,该分子包含编码多亚基杀虫蛋白质的核苷酸序列,这种多亚基杀虫蛋白质包含一个以上的多肽链,其中上述的多肽链中至少一条代表本发明的昆虫特异性蛋白质,而且至少一条代表按照本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀虫活性。
优选的是这样的DNA分子,该分子包含编码本发明的昆虫特异性蛋白质和按照本发明的辅助蛋白质的核苷酸序列,其中辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀虫活性。
特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO1或SEQID NO19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。本发明的另一个实施方案涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,它由符合读框基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及在融合使用的其它可有可无的组分的组合的特性。
本发明内优选的是这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,在该融合蛋白的N-端是昆虫特异性蛋白质或辅助蛋白质。特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO22给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列和信号序列,优选的是分泌信号序列或导向序列,其中融合蛋白包含本发明的昆虫特异性蛋白质和/或本发明的辅助蛋白质,导向序列指导转基因产物到特定的细胞器或细胞区室,这个信号序列对受体DNA来说是异源源。
本发明还包括DNA分子,它包含编码按照本发明融合蛋白或多亚基蛋白质的核苷酸序列,这种序列被最优化以适于在微生物或植物中表达。
优选的的是最优化的DNA分子,其中该分子包含SEQ ID NO42,SEQID NO45或SEQ ID NO49给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本发明还涉及这样的最优化的DNA分子,其中编码分泌信号的序列从5′端除去,但尤其涉及这样的最优化的DNA分子,其中该分子包含SEQ IDNO35或SEQ ID NO39给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。
本申请所用的实质上序列同源性指在核苷酸序列间的结构关系相近。例如,实质上的同源的DNA分子可能是60%同源,优选地是80%,更优选的是90%或95%或更多的同源。同源也包括这样一种关系,其中一个或几个核苷酸或氨基酸的子序列缺失,或者有附加核苷酸或氨基酸的子序列被分散开。
也包括在本发明中的是能和按照本发明上文限定的DNA分子杂交的的DNA分子,但优选的是能和所说的DNA分子获得的寡核苷酸探针杂交的DNA分子,探针包含为上述的昆虫特异性蛋白质编码的序列邻接序列,其长度为10个核苷酸,杂交在适当严格的条件下进行。这种DNA分子具有昆虫特异性活性,昆虫特异性蛋白质也由该DNA分子编码。
优选的是这样的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M磷酸钠的缓冲液中。
尤其优选的是这样的DNA分子,该分子包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列,它可通过以下方法获得(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;(b)用按照权利要求107的寡核苷酸探针与所说DNA分子杂交,探针从包含SEQ ID NO28,SEQ ID NO30,或SEQ ID NO31给出的核苷酸序列的DNA分子获得;(c)分离该杂交DNA。
本发明还涉及昆虫特异性蛋白质,其中所说的蛋白质由按照本发明的DNA分子编码。
也包括在本发明中的是表达盒,该表达盒包含可操作连接到表达序列上的按照本发明的DNA分子和可有可无的调节序列。其中表达序列包含结合DNA构建体在宿主有机体(优选的是微生物和植物)中表达所必需的转录和翻译调节信号。
本发明还涉及载体分子,该载体分子包含按照本发明的表达盒。
按照本发明的表达盒和/或载体分子优选的是植物基因组的一部分。
本发明的另一个实施方案还涉及宿主有机体,优选的是选自植物和昆虫细胞,细菌,酵母,杆状病毒,原生动物,线虫和藻类的有机体,该有机体包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的分子。
本发明还涉及转基因植物,但优选的是包括植物体部分及其后代和种子在内的玉米植株,该植物包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的分子。
优选的是包括植物体部分及其后代和种子再内的转基因植物,该植物可以用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子稳定地转化。
也优选的是包括植物体部分及其后代和种子在内的转基因植物,该植物能够表达按照本发明的昆虫特异性蛋白质。
本发明还涉及这样的转基因植物,优选的是玉米植株,按照本发明在上文中的定义,这种植物还表达第二种不同的昆虫防治素,但优选的是Btδ-内源毒素,该植物优选的是杂种植物。
在本发明的范围内,转基因植物的部分可理解为包括植物细胞,原生质体,组织,胼胝体,胚胎以及花,茎,果实,叶,根。这些部分起源于预先用按照本发明的DNA分子转化的转基因植物或他们的后代,因而至少包含转基因细胞的一部分,它们也是本发明的目的。
本发明还涉及按照本发明的植物繁殖材料,该材料用种子保护剂包衣处理过。
本发明还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化的微生物,其中该微生物优选地在植物中繁殖,更优选的是根定居性细菌。
本发明的另一个实施方案涉及胶囊化的昆虫特异性蛋白质,该蛋白质包含含有按照本发明的昆虫特异性蛋白质的微生物。
本发明也涉及一种杀虫组合物,该组合物包含有效杀虫量的本发明的宿主有机体,但优选的是纯化芽孢杆菌菌株以及适当的载体。
也包括在本发明中的是杀虫组合物,该组合物包含有效杀虫量的单独的或与本发明的宿主有机体和/或按照本发明的胶囊化昆虫特异性蛋白质组合的按照本发明的分离的蛋白质分子以及适当的载体。
本发明的另一个实施方案包括获得按照本发明的纯化蛋白质的方法,该方法包括把包含上述的昆虫特异性蛋白质的溶液加入到NAD柱,并洗脱组合的(bound)蛋白质。
也包括在本发明的是一种用于鉴别按照本发明的昆虫特异性蛋白质的杀虫活性的方法,该方法包括在培养基上培养芽孢杆菌菌株;从所述培养基获得上清液;用所述上清液饲喂昆虫幼虫;测定死亡率。
本发明的另一个方面涉及分离按照本发明的昆虫特异性蛋白质的杀虫活性的方法,该方法包括
在培养基上培养芽孢杆菌菌株;从所述培养基获得上清液;从述民上清液分离上述的昆虫特异性蛋白质。
本发明也包括一种用于分离编码表现出按照本发明的蛋白质的杀虫活性的昆虫特异性蛋白质的DNA分子,该方法包括获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;用从芽孢杆菌属微生物获得的DNA分子与上述DNA分子杂交;分离该杂种DNA。
本发明还涉及增加昆虫靶范围的方法,该方法通过使用与至少一种不同于按照本发明的昆虫特异性蛋白质的杀虫蛋白质组合(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过氧化物酶的杀虫蛋白质组合)的按照本发明的昆虫特异性蛋白质。
优选的是在植物体内增加昆虫靶范围的方法,该方法通过将按照本发明的昆虫特异性蛋白质与至少一种不同于按照本发明的昆虫特异性蛋白质的杀虫蛋白质一起(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过氧化物酶的杀虫蛋白质一起)在所说的植物体内表达。
也包括在本发明的是保护植物使之免受由虫害造成的破坏的方法,但是优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera fruglperda],甜菜夜蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损坏,这种方法包括对植物或该植物的生长区域施用按照本发明的杀虫组合物或毒素蛋白质。
本发明还涉及保护植物使之免受由虫害造成的损坏的方法,但是优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损坏。这种方法包括种植一种转基因植物,它能在上述的虫害发生的范围内表达按照本发明的昆虫特异性蛋白质。
本发明也包括产生宿主有机体的方法,这种有机体包含有稳定地整合到它的基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化上述宿主有机体。
本发明的另一个实施方案涉及产生转基因植物或植物细胞的方法,在这种植物或植物细胞内包含有稳定地整合到植物基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子分别转化上述植物和植物细胞。
本发明还涉及产生杀虫组合物的方法,该方法包含将有效杀虫量的按照本发明的分离的芽孢杆菌菌株和/或宿主有机体和/或分离的蛋白质分子和/或胶囊化的蛋白质与适当的载体混合。
本发明还包括产生转基因亲本植株的转基因后代的方法,这种方法包括把包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列的DNA分子稳定地掺入到植物基因组内。这种方法还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的载体分子转化上述亲本植物,并通过已知的植物育种技术把杀虫特性转移到上述转基因亲本的后代体内。也包括在本发明的是能特异地和编码可在芽孢杆菌属的几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交的寡核苷酸探针。其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。其中所说的探针包含为上述昆虫特异性蛋白质编码的序列的邻接部分长度为10个核苷酸。
本发明还包括上述寡核苷酸探针用于筛选芽孢杆菌菌株或其它有机体,以确定昆虫特异性蛋白质是否天然存在或特定的转化有机体是否包含所述基因的用途用途。
本发明认识到杀虫蛋白质在芽孢杆菌菌株营养生长期间产生。认识到这一类杀虫蛋白质的存在,本发明包括所有除了得自球形芽孢杆菌SSII-1的杀蚊毒素外的营养生长期间的杀虫蛋白质,即下文提到的VIP。
VIP在孢子形成后并不丰富,主要是在稳定生长期之前的对数期表达。本发明所用的营养生长期定义为孢子形成期开始之前的时期。编码VIP的基因可被分离、克隆并转化到不同的运送载体中以用于虫害防治方法。
本发明所指的虫害包括(但并不限于)昆虫,真菌,细菌,线虫,螨类,蜱类,原生动物病原体,动物寄生性肝吸虫等等。虫害包含从鞘翅目,双翅目,膜翅目,鳞翅目,食毛目,同翅目,半翅目,直翅目,缨翅目,革翅目,等翅目,虱目,蚤目,毛翅目等,特别是鞘翅目和鳞翅目选择的害虫。
表1-10是主要作物害虫和人畜重要性害虫表,这些害虫包括在本发明的范围内。
表1鳞翅目(蝶蛾类)玉米玉米螟小地老虎玉米夜蛾草地贪夜蛾巨座玉米螟非洲蔗螟小蔗螟高粱高粱螟草地贪夜蛾非洲蔗螟玉米夜蛾粒肤地虎小麦一点粘虫草地贪夜蛾非洲蔗螟西部灰地老虎非洲蔗螟向日葵sunflower bud moth(Suleima helianthana)向日葵斑螟棉花烟芽夜蛾玉米夜蛾甜菜夜蛾棉红铃虫水稻小蔗螟fall armyworm(Spodoptera frugiperda)玉米夜蛾大豆大豆夜蛾黎豆夜蛾苜蓿绿夜蛾玉米螟甜菜夜蛾烟芽夜蛾玉米夜蛾大麦玉米螟小地老虎表2鞘翅目(甲虫类)玉米玉米根叶甲长角叶甲瓜十一星叶甲梳爪叩头虫属的几个种北方圆头犀金龟(白蛴螬)南方圆头犀金龟(白蛴螬)日本丽金龟高粱white grub(Phyllophaga crinita)wireworm(Eleodes,Conoderus和Aeolus spp.)橙足负泥虫玉米跳甲玉米谷象小麦橙足负泥虫三叶草叶象瓜十一星叶甲向日葵向日葵叶甲胡萝卜金龟棉花棉铃象水稻葡萄肖叶甲稻根象米象大豆墨西哥大豆瓢虫表3同翅目(粉虱,蚜虫等)玉米玉米蚜玉米根蚜高粱玉米蚜美甘蔗伪毛蚜小麦俄罗斯小麦蚜麦二叉蚜麦长管蚜棉花棉蚜棉序盲蝽苘麻粉虱水稻叶蝉(Nephoteftix nigropictus)大豆桃蚜蚕豆微叶蝉大麦麦二叉蚜油用油菜甘蓝蚜表4半翅目(臭虫类)玉米美洲谷长蝽高粱美洲谷长蝽棉花美国牧草盲蝽水稻美洲谷长蝽拟缘蝽大豆拟缘蝽大麦美洲谷长蝽拟缘蝽烟草蝽表5直翅目(蝗虫,蟋蟀和蜚蠊非类)玉米赤胫黑蝗血黑蝗小麦赤胫黑蝗异黑蝗血黑蝗棉花赤胫黑蝗异黑蝗大豆赤胫黑蝗异黑蝗结构/室内美洲大蠊德国蠊东方蠊表6双翅目(蝇蚊类)玉米玉米种蝇玉米斑潜蝇高粱高粱瘿蚊小麦小麦瘿蚊麦红吸浆虫美洲杆蝇麦瘦种蝇向日葵向日葵籽瘿蚊大豆玉米种蝇大麦玉米种蝇小麦瘿蚊攻击人类和动物以及携带疾病的昆虫埃及伊蚊白纹伊蚊巴氏白蛉家蝇黑虻旋丽蝇表7缨翅目(蓟马类)玉米玉米黄呆蓟马小麦烟褐花蓟马棉花烟蓟马烟褐花蓟马大豆soybean thrips(Sericothrips variabilis)烟蓟马表8膜翅目(叶蜂,蚂蚁,黄蜂等等)玉米窃蚁小麦麦茎蜂表9其它目与代表的物种革翅目(蠼螋类)欧洲球螋等翅目(白蚁类)欧洲散白蚁食毛目(羽虱类)鸡头羽虱牛羽虱虱目(吸虱类)人虱蚤目(跳蚤类)猫栉首蚤表10蜱螨目(蜱螨类)玉米棉叶螨高粱红叶螨棉叶螨小麦麦瘿螨棉花红叶螨棉叶螨大豆草莓叶螨棉叶螨大麦潜岩螨重要的人和动物蜱螨变异革螨波斯锐缘蜱嗜皮螨特嗜皮螨现在已经认识到,杀虫蛋白质可从芽孢杆菌的营养生长阶段分离,其它菌株可用标准方法分离并测定对植物和非植物害虫的活性。通常芽孢杆菌菌株可使用本领域已知的方法从来自包括土壤,植物,昆虫,谷物仓库粉尘以及其它样品材料等任何环境的样品中分离到,参见,例如,Travers等,(1987)应用环境微生物,531263-1266;Saleh等,(1969)加拿大微生物学杂志,151101-1104;DeLucca等,(1981)加拿大微生物学杂志,27865-870;Norris等,(1981),“芽孢杆菌属和乳孢芽孢杆菌属”,在Starr等(eds.),原核生物细菌的生境、分离与鉴别手册。第II卷,Springer-Verlog BerlinHeidelberg.分离后,可以测试菌株在营养生长期间的杀虫活性。用这种方式,可以鉴别新的杀虫蛋白质和菌株。
在本发明中使用的芽孢杆菌属微生物包含蜡状芽孢杆菌,苏云金芽孢杆菌以及表11所列的芽孢杆菌属种类。
表11芽孢杆菌属物种表形态组1巨大芽孢杆菌蜡状芽孢杆菌*蜡状芽孢杆菌菌覃状变种苏云金芽孢杆菌*地衣状芽孢杆菌枯草芽孢杆菌*短小芽孢杆菌强固芽孢杆菌*凝结芽孢杆菌形态组2多粘芽孢杆菌软化芽孢杆菌环状芽孢杆菌嗜热脂肪芽孢杆菌蜂房芽孢杆菌*侧孢芽孢杆菌*短芽孢杆菌尘埃芽孢杆菌日本甲虫芽孢杆菌*缓死芽孢杆菌*幼虫芽孢杆菌*形态组3球形芽孢杆菌*巴斯德氏芽孢杆菌未指定的菌株亚组A蜜蜂芽孢杆菌*B.filicolonicus溶硫胺素芽孢杆菌嗜减芽孢杆菌亚组B丛毛芽孢杆菌B.chitinosporus缓慢芽孢杆菌亚组C栗褐芽孢杆菌解硫胺素芽孢杆菌B.macroidesB.freundenreichii亚组DB.pantothenticus植表芽孢杆菌亚组ElB.aminovoransB.globisporusB.insolitusB.psychrophilus亚组E2B.psychrosaccharolyticB.macquariensis*号表明已经发现和昆虫有关的芽孢杆菌菌株根据Parry,J.M.等,(1983)芽孢杆菌属物种的彩色图谱,Wolfe医学出版社,伦敦所述分组。
按照本发明,芽孢杆菌在营养生长期间产生的杀虫蛋白质可分离出来。在一个实施方案中,分离了在营养生长期间产生的杀虫蛋白质。用于蛋白质分离的方法在本领域中是已知的。通常,蛋白质可用常规色谱法(包括凝胶过滤,离子交换)和免疫亲合色谱法、高效液相色谱法(如反相高效液相色谱法,离子交换高效液相色谱法,筛析高效液相色谱法,高效层析聚焦与疏水相互作用层析等)、电泳法(如一维凝胶电泳法,二维凝胶电泳法等)分离。这些方法在本领域中是已知的。参见例如,分子生物学中通用方法,第一卷和第二卷,Ausubel等(eds.),John Wiley & Sons,NY(1988)。另外,可以制备抗实质上纯的蛋白质制剂的抗体。参见例如,Radka等(1983),免疫学杂志,1282804;Radka等(1984),免疫遗传学,1963。可把任何方法结合起来,用来提纯具有杀虫特性的蛋白质。当步骤确定后,在每一提纯步骤后都测定杀虫活性。
这样的纯化步骤将产生实质上纯化的蛋白质片断。“实质上纯化的”或“实质上纯的”是指蛋白质实质上从天然状态下与蛋白质结合的复合物中分离出来。蛋白质的“实质上纯化的”制备可通过SDS-PAGE后目视或光密度扫描确定有无其它可检测的带存在来评价。另外,在纯化制剂中没有其它氨基末端序列或N-末端残基的存在也能表明纯化的水平。可以用“纯”制剂通过离子交换,反相色谱或毛细管电泳表明无其它峰的存在来检验纯度。术语“实质上纯化的”或“实质上纯的”并不意味排除少量不干扰蛋白质生物活性的杂质的存在,例如,杂质可能因为不完全的纯化而存在。
纯化的蛋白质分离后,蛋白质或它包含的多肽可以通过本领域已知的标准方法确定其特征并测序。例如,纯化的蛋白质或它包含的多肽可以用溴化氰或用蛋白质酶如木瓜蛋白质酶,胰凝乳蛋白质酶,胰蛋白质酶,赖氨酰-C肽链内切酶等裂解。(Oike等,(1982),生物化学杂志,2579751-9758;Liu等,(1983),国际肽链和蛋白质研究杂志,21209-215)。形成的肽链最好通过HPLC或凝胶溶解以及电印迹进PVDF膜分离,以便于氨基酸序列分析,要完成这个任务,肽链最好用自动序列分析仪分析。已经知道,N-端,C-端,或内部的氨基酸序列都可测定。从纯化的蛋白质的氨基酸序列可以合成一条核苷酸序列,它可用作探针以协助分离编码杀虫蛋白质的基因。
已经知道,杀虫蛋白质可以是低聚物,并且在分子量,原体(protomer)数量,组成肽链,对特定昆虫的活性以及其它特征都有变化。然而,通过这里提出的方法对许多害虫具有活性的蛋白质都可分离并确定其特征。
已经知道,纯化蛋白质分离和确定特征后,可以用多种方法包括氨基酸的取代,缺失,截断和插入来改变。这种操作的方法在本领域中都是已知的。例如,杀虫蛋白质的氨基酸序列变异体可以通过DNA突变来制备。这种突变体具有所需的杀虫活性。很明显,在编码变异体的DNA中所做的突变不应使序列置于阅读框架之外,最好不创造能产生第二个mRNA结构的互补区域。参见EP专利申请出版物No.75,444。
在这种意义上,本发明包含了杀虫蛋白质及其组分和片段。也就是说,已经认识到可以生成保留杀虫活性的蛋白质的组分原体,多肽链或蛋白质片段。这些片段包含截断序列以及蛋白质的N-端,C-端,内部和内部缺失(internally deleted)的氨基酸序列。
蛋白质序列的大多数缺失,插入,和替代并不期望产生杀虫蛋白质特性的根本改变。然而,当在替代,缺失或插入之前预测确切的影响有困难时,本领域的技术人员将希望通过常规筛选测定评价结果。
这儿所说的蛋白质或其它组分多肽可以单独或结合使用,也就是说,几种蛋白质可以用来控制不同的虫害。
一些蛋白质是单一多肽,而许多蛋白质由一条以上的多肽链组成,即它们是寡聚体。另外,一些VIP作为寡聚体具有杀虫活性。在这种情况下,另外的原体用来增强杀虫活性或激活杀虫蛋白质。这些增强或激活原体就是提到的辅助蛋白质。辅助蛋白质通过与杀虫蛋白质相互作用形成寡聚蛋白质来激活或增强杀虫蛋白质,寡聚蛋白质与缺乏辅助蛋白质时观察到的活性相比,杀虫活性增强。
辅助蛋白质激活或增强杀虫蛋白质(如AB78的VIP1蛋白质)的活性。这些辅助蛋白质可以用得自AB78的VIP2蛋白质例证,但并不限制在这种蛋白质上。如在申请的实验部分说明的,辅助蛋白质可以激活许多杀虫蛋白质。这样,在本发明的一个实施方案中,一种植物(第1亲本)可以用一种辅助蛋白质转化。这种亲本可以和许多亲本2植物杂交,该亲本2植物用一种或多种其杀虫活性由辅助蛋白质激活的杀虫蛋白质转化。
本发明的杀虫蛋白质中,一组新的昆虫特异性蛋白质在本发明的范围内能令人惊奇地被鉴定出来。这种蛋白质在整个申请中被指定为VIP3,可以从芽孢杆菌属的几个种的菌株中获得,但优选的是从苏云金芽孢杆菌菌株中,更优选的是从苏云金芽孢杆菌菌株AB88和AB424中获得。该VIP大部分存在于芽孢杆菌的培养物上清液中,至少可达到菌株AB88的75%。通过VIP3蛋白质的独特的杀虫活性谱可以进一步确定其特征。它的活性包括对地老虎属和/或灰翅夜蛾属物种,但是尤其是对小地老虎[BCW]和/或草地贪夜蛾和/或甜菜夜蛾和/或烟芽夜蛾和/或玉米夜蛾的活性。
小地老虎是相当抗δ-内毒素的重要农业害虫。Maclntosh等(1990)在脊椎动物病理学杂志,56,258-266报道δ-内毒素和CrylA(B)和CrylA(C)对BCW的杀虫特性,其食用半致死浓度(LC50)分别超过80μg和18μg/ml,按照本发明的杀虫蛋白质vip3A杀虫蛋白质加到至少比CrylA蛋白质达到刚好50%死亡率所需的数量要低10至500倍,优选的是50至350倍,更优选的是200至300倍时,可提供50%的死亡率。本发明特别优选的vip3A杀虫蛋白质当数量加到比CrylA蛋白质达到刚好50%死亡率所需的数量要低260倍时就达到100%的死亡率。
根据发明的vip3杀虫蛋白质大多数存在于培养物上清液中,因而可以归类为分泌蛋白质。它们最好在N-末端包含许多的荷正电的残基,接着是疏水核心区,而且在输出期间N-末端不被加工。
如本发明范围内报道的其它杀虫活性蛋白质一样,VIP3蛋白质可以在生长阶段而不能在孢子形成阶段检测到。这使它和其它属于δ-内毒素类的蛋白质有了更清楚的区别。优选的,昆虫特异性蛋白质在指数中期开始并持续到孢子形成期。由于表达方式的特异性与VIP3蛋白质的高稳定性,在孢子形成期培养物上清液中发现了大量的蛋白质。尤其优选的是在在分类位置上为SEQ ID NO29和SEQ ID NO32的VIP3蛋白质,以及包含编码该蛋白质的核苷酸序列的相应DNA序列。但尤其是包含SEQ ID NO28,SEQ IDNO30和SEQ ID NO31给出的核苷酸序列的DNA分子。
本发明的杀虫蛋白质可与Bt内毒素或其它杀虫蛋白质组合使用能扩大昆虫靶范围。进而,本发明的VIP和Btδ-内毒素或其它明显的自然杀虫素结合对于预防和/或控制昆虫抗性有特别的效用。其它杀虫素包含蛋白质酶抑制因子(丝氨酸和半胱氨酸类型),外源凝集素,α-淀粉酶和过氧化物酶。在一个优选的实施方案中,VIP在一种转基因植物中表达伴随着一个或多个δ-内毒素的表达。这种超过一种的杀虫素在同一转基因植物中共同表达可以通过遗传工程使植物包含并表达所需的基因来达到。另外,一种植物(第1亲本)可以通过遗传工程操作表达VIP。第二种植物(第2亲本)可以通过遗传工程操作表达Btδ-内毒素。通过亲本1和亲本2杂交获得表达引入亲本1和亲本2的所有基因的后代植物。特别优选的Btδ-内毒素是那些本文一并参考的在EP-A0618976给出的Btδ-内毒素。
许多细胞毒素蛋白质(尽管并非全部)作用是双重(binary)的。双重毒素(binary toxins)典型地是由两个蛋白质结构域组成,一个称为结构域A,另一个称为结构域B(参见细菌蛋白质毒素的原始资料集,J.E.Alouf和J.H.Freer eds.(1991)学术出版社)。结构域A具有高效细胞毒素活性。结构域B在被内在化(being inlernized)之前与外源细胞表面受体结合。典型地,细胞毒素结构域A必须靠转移结构域被送到细胞质。结构域A和B常常是分离的多肽或原体,通过蛋白质-蛋白质相互作用或二硫键结合。然而,毒素可以是单一多肽,在细胞内被水解加工成两个结构域。如假单孢菌外毒素A。总之,双重毒素具有三个重要的结构域细胞毒素A结构域,结合受体的B结构域和转移结构域。结构域A和B常通过蛋白质-蛋白质相互作用结合。
本发明的受体结合结构域对于把任何蛋白质,毒素,酶,转录因子,核酸,化学因子或任何其它因子送进具有被本发明的双重毒素的受体结合结构域识别的受体的靶昆虫是有用的。同样地,因为双重毒素具有转移结构域,它能通过磷脂双层膜并使细胞毒素也穿过这些膜,这样的转移结构域在使任何蛋白质,毒素,酶,转录因子,核酸,化学的或任何其它因因子穿过磷脂双层膜如质膜或泡囊膜(vesicle membrane)可能是有用的。转移结构域自身可使膜形成穿孔,这样就有毒性或杀虫活性。而且,所有双重毒素具有细胞毒素结构域,这样的细胞毒素结构域不管是单独使用还是以任何方式被送进任何靶细胞都可用作致死蛋白质。
最后,由两个多肽链组成的双重毒素常形成一个复合物,在本发明的双重毒素的组分内可能具有蛋白质-蛋白质相互作用的结构域。这些蛋白质-蛋白质相互作用结构域可能在形成毒素,酶,转录因子,核酸,抗体,细胞结合组分或任何其它化学制剂,因子,蛋白质或蛋白质结构域之间的结合是具有用的。
毒素,酶,转录因子,抗体,细胞结合组分或其它蛋白质结构域能通过符合读框的基因融合而融合到杀虫蛋白质或辅助蛋白质中,符合读框的融合基因由核糖体翻译时,产生有VIP和在融合中使用的其它组分组合的特性的融合蛋白。而且,如果融合蛋白结构域和另一个蛋白质,核酸,碳水化合物,脂类,或其它化学制剂或因子有亲和力,就形成一个三组分的复合物。这个复合物有它的所有组分的特性。类似的原理可用于产生四个或更多组分的复合物。这些复合物可用作杀虫毒素,药物,实验室试剂和诊断试剂等。这样的目前正在使用的复合物的例子是用于潜在的癌症治疗的融合毒素,ELISA测定试剂和免疫印迹分析试剂。
改变杀虫蛋白质或辅助蛋白质的一个方法就是把一个15个氨基酸的“S-尾巴”融合到蛋白质上,但不破坏蛋白质的昆虫细胞结合结构域,转移结构域或蛋白质-蛋白质相互作用结构域。S-尾巴和核糖核酸酶S-蛋白质有高度的亲和力(Kd=10~9M),后者和S-尾巴结合时,形成活性的核糖核酸酶(参见F.M.Richards和H.W.Wyckoff(1971),“酶”,第IV卷。(Boyer,P.D.ed.).pp.647-806.学术出版社,纽约)。融合可以通过这样的方法完成破坏或移去杀虫蛋白质或辅助蛋白质的细胞毒素活性,并用新的细胞毒素核糖核酸酶活性取代VIP细胞毒素活性。最后毒素将包含S-蛋白质,杀虫蛋白质以及辅助蛋白质,其中不论杀虫蛋白质还是辅助蛋白质是作为带有S-尾巴的翻译融合蛋白产生的,类似的方法可用于把其它潜在的细胞毒素融合到杀虫蛋白质和辅助蛋白质中,这些细胞毒素包含(但不限于)核糖体活化蛋白质,昆虫激素,激素受体,转录因子,蛋白质酶,磷酸酶,假单孢杆菌外毒素或任何进入细胞内时是致死的蛋白质或化学因子,同样地,任何非致死的但改变细胞的生理生化的蛋白质也可被送入细胞。
对不同种类的活性谱可通过把结构域融合到识别其它种类细胞表面受体的杀虫蛋白质或辅助蛋白质上而改变,这样的结构域可能包含(但不限于)抗体,转铁蛋白质,激素,或从表现出亲合选择性文库的噬菌体中分离到的肽链序列。和营养素,维生素,激素,或其它能转移进细胞的化学物质结合的肽序列也能用于改变毒性谱。相似地,其它结合到细胞表面受体或膜上并能被内在化的蛋白质或化学物质也可以用来改变VIP1和VIP2的活性谱。
本发明的杀虫蛋白质是那些有特异杀虫活性的蛋白质。这些蛋白质的分子量可以不同,其组分肽链分子量至少有30kDa或更大,优选的大约50kDa或更大。
本发明的辅助蛋白质分子量可以不同,至少大约15kDa或更大,优选的大约20kDa或更大,更优选的大约30kDa或更大。辅助蛋白质自身可能有组分多肽链。
杀虫蛋白质和辅助蛋白质也可能是多亚基的杀虫蛋白质的组分。这样一个包含辅助蛋白质作为其一个或多个组分多肽的杀虫蛋白质分子量可以不同,分子量为至少50kDa到至少200kDa,优选的大约100kDa到150kDa。
辅助蛋白质可用于和本发明的杀虫蛋白质结合以增强活性或激活杀虫蛋白质。为确定辅助蛋白质是否影响活性,杀虫蛋白质可单独表达和与辅助蛋白质一起表达,在饲喂测定杀虫活性时比较它们各自的活性。
检测菌株自身和它与辅助蛋白质结合后的活性,对于筛选有潜在杀虫活性的菌株是有益的。在某些情况下,辅助蛋白质与菌株的天然蛋白质结合产生杀虫活性,而在缺乏辅助蛋白质时没有检测到活性。
如上所述,辅助蛋白质可以通过本领域已知的各种方法修饰,因此,本发明所用的术语“营养杀虫蛋白质”(VIP)包含那些在营养生长期间产生的单独或结合使用有杀虫活性的蛋白质。这种蛋白质包括杀虫蛋白质、辅助蛋白质和那些仅仅在辅助蛋白质存在时显示活性的蛋白质或这些蛋白质的多肽组分。
已经认识到用其它方法可获得这些蛋白质的核苷酸与氨基酸序列。例如,要获得编码杀虫蛋白质的核苷酸序列,表达杀虫蛋白质的粘粒克隆可从基因文库中分离到。小的亚克隆可从较大的活性粘粒克隆中制得并测其活性。用这种方法,可以测定表达活性杀虫蛋白质的克隆的序列以确定基因的核苷酸序列。然后,可以推导出组成蛋白质的氨基酸序列。对于一般的分子技术,参见例如,分子克隆实验室手册,第二版,第1-3卷,Sambrook等(eds.)冷泉港实验室出版社,冷泉港,NY(1989)以及其中引用的参考文献。
本发明也包括得自有机体而不是芽孢杆菌的核苷酸序列,其中核苷酸序列可通过本发明的芽孢杆菌核苷酸序列杂交来分离。测定此核苷酸序列编码的蛋白质的杀虫活性。本发明也包括由此核苷酸序列编码的蛋白质。而且,本发明包括从有机体而不是芽孢杆菌获得的蛋白质,其中蛋白质可与抗本发明蛋白质的抗体发生交叉反应。同样,分离到的蛋白质可使用本文或其它本领域中众所周知的方法测定其杀虫活性。
编码本发明的杀虫蛋白质的核苷酸序列分离后,它们可以被操纵并用来在许多宿主如其它有机体(包含微生物和植物)中表达蛋白质。
可以优化本发明的杀虫基因以增强其在植物中的表达。参见,例如EP-A 0618976;EP-A 0359472;EP-A 0385962;WO 91/16432;Perlak等(1991),美国科学院学报(Proc.Natl.Acad.Sci.USA)883324-3328;Murray等(1989),核酸研究17477-498。用这种方法,利用植物的最优密码子可以合成基因。对于一个特定的宿主来说,最优密码子是编码宿主氨基酸频率最高的单个密码子,例如对于特定氨基酸的玉米最优密码子可以从玉米的已知基因序列中推导出。对于玉米的28个基因的玉米密码子的使用可在Murray等,(1989),核酸研究17477 498中找到,本文一并参考。合成的基因也可以基于特定宿主对特定的氨基酸使用的密码子的分布制得。
用这种方法,可以优化核苷酸序列以适合在任何植物中表达。已经认识到可以优化或合成所用或任何一部分基因序列,也就是说,合成的或部分优化的序列也可以使用。
以同样的方法,核苷酸序列也可以优化以适于在任何微生物中表达。对于芽孢杆菌,最优密码子使用参见如美国专利号No.5,024,837和Johansen等,(1988)基因65293-304。
植物表达盒的构建和外源DNA导入植物的方法在本领域中已有叙述。此表达盒可能包含原体,终止子,增强子,前导序列,内含子以及其它可操作地连结到杀虫蛋白质编码序列的其它调节序列。进一步认识到VIP基因的启动子或终止子能在表达盒中使用。
通常,为把外源DNA导入植物,可以使用Ti质粒载体传送外源DNA,也可以用直接DNA吸收,脂质体,电穿孔,微注射,以及使用微粒。这些方法在本领域都已发表。参见,例如,Guerche等,(1987)植物科学52111-116;Neuhause等,(1987)理论与应用遗传(Theor.Appl.Genet.)7530-36;Klein等,(1987)自然32770-73;Howell等,(1980)科学2081265;Horsch等,(1985)科学2271229-1231;DeBlock等,(1989)植物生理91694-701;植物分子生物学方法Weissbach和Weissbach,eds.)学术出版社,(1988);植物分子生物学方法Schuler和Zielinski,eds.)学术出版社,(1989)。也参见美国专利申请号08/008,374,本文一并参考。也参见EP-A 0193259和EP-A 0451878。可以理解,转化的方法取决于被转化的植物细胞。
已经进一步认识到,可以修饰表达盒的组分以增强表达。例如,可以用截短序列,核苷酸替代或其它修饰。参见,例如,Perlak et(1991)美国科学院学报883324-3328;Murray等,(1989)核酸研究17477-498;和WO9116432。
构建体也可以包含任何可操作地连结到核苷酸序列必须的调节子如终止子,(Guerineau等,(1991),分子基因遗传226141-144;Proudfoot,(1991),细胞64671-674;Sanfacon等,(1991),Genes Dev.,5141-149;Mogen等(1990),植物细胞,21261-1272;Munroe等,(1990),基因,91151-158;Ballas等,(1989),核酸研究,177891-7903;Joshi等,(1987),核酸研究,159627-9639);植物翻译共用序列(Joshi,C.P.,(1987),核酸研究,156643-6653),内含子(Luehrsen和Walbot,(1991),分子基因遗传,22581-93)等等。在表达盒构建体中包含5′前导序列将是有益的。此前导序列可以起作用以增强翻译。
在本领域中已知的翻译前导序列包含小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎病毒5′非编码区)(Elroy-Stein,O.,Fuerst,T.R.,和Moss,B.(1989)美国国家科学院进展866126-6130);马铃薯Y病毒组前导序列,如TEV前导序列(Tobacco Etch Virus)(Allison等,(1986);MDMV前导序列(玉米矮缩花叶病毒);病毒学,1549-20);人类免疫球蛋白质重链结合蛋白质(BiP),Macejak,D.G.和Sarnow,P.,(1991),自然,35390-94;
苜蓿花叶病毒的外壳蛋白质mRNA的不翻译前导序列(AMV RNA4),(Jobling,S.A.,和Ge小时ke,L.,(1987),自然,325622-625;烟草花叶病毒前导序列(TMV),(Gallie,D.R.等,(1989),RNA分子生物学,第237-256页;Maize chlorotic mottle Virus病毒前导序列(MCMV)(Lommel,S.A.等,(1991),病毒学,81382-385。也参见Della-Cioppa等,(1987),植物生理,84965-968。
植物终止子可在表达盒内使用。参见,Rosenberg等,(1987),基因,56125;Guerineau等,(1991),分子基因遗传,226141-144;Proudfoot等,(1991),细胞,64671-674;Sanfacon等,(1991),Genes Dev.,5141-149;Mogen等,(1990),植物细胞,21261-1272;Munroe等,(1990),基因91151-158;Ballas等,(1989),核酸研究,177891-7903;Joshi等,(1987),核酸研究,159627-9639.
为了组织特异性表达,本发明的核苷酸序列能可操作地连结到组织特异性启动子上。参见,例如,EP-A 0618976,本文一并参考。
也包括在本发明的范围之内的是转基因植物,尤其是通过前面叙述的步骤转化的转基因丰产植物以及它们的包含并最好也表达按照本发明的杀虫蛋白质无性和/或有性后代,尤其优选的是杂种植物。
按照本发明的转基因植物可以是双子叶植物或单子叶植物。优选的是禾本科的单子叶植物,包含黑麦草属,玉蜀黍属,小麦属,Triticale,蜀黍属,甘蔗属,雀麦属,稻属,燕麦属,大麦属,黑麦属和狗尾草属植物。
尤其优选的是转基因玉米,小麦,大麦,高粱,黑麦,燕麦,草坪草和水稻。
双子叶植物中尤其优选的是大豆,棉花,烟草,甜菜,油子油菜和向日葵。
表达“后代”可理解为包含“无性”和“有性”产生的转基因植物的后代。这个定义也意味着包含通过已知的方法如细胞融合、突变选择获得的突变体与变异体,它们仍能表现出最初被转化的亲本植物的独特的特性,这个定义还包含所有转化植物材料的杂交和融合产物。
本发明的另一个目的涉及转基因植物的繁殖材料。
与本发明有关的转基因植物的繁殖材料定义为可在体内或体外有性或无性繁殖的任何植物材料。在本发明的范围之内尤其优选的是原生质体,细胞,愈伤组织,组织,器官,种子,胚胎,花粉,卵细胞,合子,以及其它可从转基因植物获得的任何繁殖材料。
起源于曾通过本发明转化的转基因植物或它们的后代因而至少包含转基因细胞的一部分的植物体部分(如花,茎,果实,叶,根),也是本发明的目标。
在植物繁殖材料(果实,块茎,谷粒,种子)尤其是种子作为商业性产品出售之前,通常用保护性包衣剂处理。包衣剂包含除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂的混合物,如果需要的话,还可加入载体,表面活性剂或施用促进辅剂(application-promotingadiuvants),以防止由细菌,真菌或有害动物引起的破坏。
为了处理种子,保护性包衣剂可以以液体制剂浸渗块茎或谷粒的方式用于种子,或者用结合的湿或干制剂给种子包衣。另外,在特定的情况下,对植物施用的其它方法也是可能的,如直接处理芽或果实。
按照本发明之植物种子包括含有编码按照本发明之杀虫蛋白质的核苷酸序列的DNA分子,它也可以用种子保护性包衣剂处理,包衣剂包含种子处理复合物,如克菌丹,萎锈灵,福美双(IMTDR),methalaxyl(ApronR),和pirimiphos-methyl(Actellic)和其它在种子处理中常用的药剂。在本发明的范围之内优选的是包含按照本发明之杀虫组合物单独或与一种种子处理时常用的种子保护性包衣剂结合的保护性包衣剂。
这样,本发明的另一个目的是为栽培植物提供繁殖材料,尤其是用上文定义的种子保护性包衣剂处理的植物种子。
已经认识到编码杀虫蛋白质的基因可用于转移昆虫致病有机体。这些有机体包括杆状病毒,真菌,原生动物,细菌和线虫。
本发明的芽孢杆菌菌株可用于保护农作物及其产品使之免受害虫危害。另外,编码杀虫剂的基因可通过适当的载体进入微生物宿主体内,该宿主再被施用到环境或植物或动物上。微生物宿主可以从已知具有一种或多种兴趣作物的“phytosphere”(phylloplane,phyllosphere,Rhizosphere和/或rhizoplana)中选择出来。选择这些微生物的目的是使其有能力在特定的环境中与野生型微生物成功地竞争,能保持稳定并能表达多肽杀虫剂的基因,并使杀虫剂增强对环境性退化和灭活的抗性。
这些微生物包括细菌,藻类和真菌。其中特别的兴趣微生物如细菌,例如,假单孢杆菌属,欧文氏杆菌属,克雷白氏杆菌属,黄单孢菌属,链霉菌属,根瘤菌属,红假单孢杆菌属,Methylius,土壤杆菌属,醋杆菌属,乳芽孢杆菌属,节杆菌属,固氮杆菌属,明串珠属,产碱杆菌属;真菌,特别是酵母如,糖酵母属,隐球酵母属,克鲁维氏酵母属,掷孢酵母属,红酵母属,和短柄霉属。其中特别的兴趣微生物是这样的phytosphere细菌种类诸如丁香假单孢杆菌,荧光假单孢杆菌,粘质沙雷氏菌,木质醋杆菌,土壤杆菌,球形红假单孢杆菌,田野黄单孢菌,苜蓿根瘤菌,真养产碱杆菌,Clavibacter xyli和棕色固氮杆菌;phytosphere酵母种类如深红酵母,胶粘酵母,海滨酵母,橙黄酵母,浅白隐球酵母,流散酵母,罗仑氏酵母,罗茜糖酵母,善地酵母,啤酒酵母,红色掷孢酵母,香气酵母,佛地克鲁维氏酵母和出芽短柄霉。其中特别的兴趣微生物是带色素的微生物。
在能使基因稳定保持并表达的条件下,有很多方法可用于把表达杀虫蛋白质的基因导入微生物宿主体内。例如,可以构建一个表达盒,它包含感兴趣的DNA构建体(这种构建体能可操作地与转录和翻译调节信号连结以利于其表达)和与宿主有机体的序列同源的序列(靠此产生整合)和/或在宿主体内有功能的复制系统(靠此整合或保持稳定)。
转录和翻译调节信号包括(但不限于)启动子,转录起始位点,操纵子,激活子,增强子,其它调节分子,核糖体结合位点,起始密码子,终止信号等,参见如,美国专利号5,039,523;美国专利号4,853,331;EPO 0480762A2;Sambrook等,supra;分子克隆实验室手册,Maniatis等(eds.),冷泉港实验室,冷泉港,NY(1982);高级细菌遗传学,Davis等,(eds.)冷泉港实验室,冷泉港,NY(1980);以及其中引用的文献。
在适当的宿主细胞内,当包含杀虫剂的细胞施用到靶昆虫所在的环境中时,这些细胞将被处理以延长细胞中的毒素活性,适当的宿主细胞包含原核生物或真核生物,通常被限制在不产生对高等有机体如哺乳动物有毒的物质的细胞内。然而,如果产生对高等有机体有毒的物质的有机体的毒素不稳定或施用水平非常低而能避免对宿主有毒的可能时,这种有机体也可以使用。作为宿主,最感兴趣的是生原核生物和低真核生物,如真菌。作为例证的革兰氏阴性和革兰氏阳性原核生物,包含肠杆菌科的埃希式杆菌属,欧文氏杆菌属,志贺氏菌属,沙门氏菌属和变形菌属;芽孢杆菌科,根瘤菌科的根瘤菌属;螺菌科的发光杆菌属,发酵但孢菌属,沙雷氏菌属,气单孢菌属,弧菌属,脱硫弧菌属,螺菌属,乳芽孢杆菌科,假单孢菌科,如假单孢杆菌属和醋杆菌属;固氮杆菌科和硝化杆菌科。在真核生物中是真菌,如藻状菌纲和子囊菌纲,也包含酵母如糖酵母属,裂殖酵母属以及担子菌纲酵母如红酵母属,短柄霉属,掷孢酵母属等等。
在选择宿主细胞用于生产时特别的兴趣特征包含易于把蛋白质基因导入宿主体内,表达系统的可利用性,表达效率,蛋白质在宿主体内的稳定性,以及辅助基因潜能的存在。用作杀虫剂微囊体感兴趣的特征包含对杀虫剂的保护质量,如厚细胞壁,着色,胞内包装或内含体的形成;叶片亲和力;对哺乳动物无毒;吸引害虫摄食;易杀死和固定并却不破坏毒素等等,其它考虑的因素包含易于形成制剂,易于操作,经济,贮存时稳定性等等。
特别的兴趣宿主有机体包含酵母,如红酵母属的一个种,短柄霉属的一个种以及掷孢酵母属的一个种,phylloplane有机体如假单孢杆菌的一个种,欧文氏杆菌属的一个种和黄杆菌属的一个种,或其它的有机体如埃希氏杆菌属乳芽孢杆菌属的一个种,芽孢杆菌属的一个种等等。特异的有机体包含荧光假单孢杆菌,铜绿假单孢杆菌,海滨酵母,苏云金芽孢杆菌,大肠杆菌枯草芽孢杆菌等等。
VIP基因可被导入微生物体内,微生物在植物(附生植物)体内繁殖,把VIP蛋白质送入潜在的靶害虫。附生植物可以是例举的革兰氏阳性或革兰氏阴性细菌。
例如,定居性细菌通过本领域已知的方法可以从感兴趣的植物中分离出来,尤其是,定居性的芽孢杆菌可以从植物根中分离到。(参见,例如,J.Handelsman,S.Raffel,E.Mester,L.Wunderlich和C.Grau,应用环境微生物,56713-718,(1990))。VIP1和/或VIP2和/或VIP3可以通过本领域的标准方法导入根定居性蜡状芽孢杆菌内。
从蜡状芽孢杆菌菌株AB78中得到的VIP1和/或VIP2使用标准方法借助于结合可导入根定居性蜡状芽孢杆菌内(J.Gonzalez,B.Brown和B.Carlton,美国科学院学报,796951-6955,(1982))。
VIP1和/或VIP2和/或VIP3或其它本发明的VIP也可通过电转化法导入根定居性芽孢杆菌。尤其是,VIP可象在实施例10中所述被克隆到一个穿梭载体如pHT3101内(D.Lereclus等,FEMS微生物学通信,60211-218(1989))。穿梭载体pHT3101包含着编码特定VIP蛋白质的序列,它可通过电穿孔转化进入根定居性芽孢杆菌。
可以设计表达系统以使VIP蛋白质能分泌到革兰氏阴性细菌入大肠杆菌的细胞质外,VIP蛋白质分泌的优点为(1)避免在细胞质内表达的VIP蛋白质的潜在毒性影响,(2)可以增加所表达的VIP蛋白质的水平和(3)有助于VIP蛋白质的高效纯化。
可以使VIP蛋白质在大肠杆菌中分泌,如通过把一个适当的信号肽融合到VIP的信号肽的氨基端,或者用大肠杆菌的信号肽取代VIP的信号肽。被大肠杆菌识别的信号肽可在已知的大肠杆菌分泌蛋白质中发现,如OmpA蛋白质(J.Ghrayeb,H.Kimura,M.Takahara,Y.Masui和M.Inouye,EMBO杂志,32437-2442(1984))。OmpA是大肠杆菌外膜的主要蛋白质。因而认为它的信号肽在转化过程中是高效的。OmpA信号肽加工前也不需要修饰,而其它信号是需要修饰的,如脂蛋白质信号肽(G.Duffaud,P.March和M.Inouye,酶学方法,153492(1987))。
尤其是使用本领域已知的标准方法,可以把单一的BamHI限制位点导入VIP编码序列的氨基端和羧基端。这些BamHI片段可以符合读框地克隆进载体pIN-III-ompAl,A2或A3中(J.Ghrayeb,H.Kimura,M.Takahara,H.Hsiung,Y.Masui和M.Inouye,EMBO杂志,32437-2442(1984)),进而创造出ompAVIP融合基因,它能分泌到周质空间。在pIN-III-ompA的多接头的其它的限制位点可用本领域中已知的标准方法除去,以使VIP氨基-端氨基酸的编码序列直接连接在ompA信号肽裂解位点之后。这样,在大肠杆菌中分泌的VIP序列和天然的VIP序列是一致的。
当VIP天然信号肽不需要成熟蛋白质的适当折叠时,可以除去此信号序列并用ompA信号序列取代。单一BamHI限制位点可被导入前体蛋白质编码序列的氨基端(直接在VIP信号肽编码序列之后)和VIP编码序列的羧基端。然后,可以用上述方法把这些BamHI片段克隆进pIN-III-ompA载体。
在杀虫控制或用基因工程把其它有机体作为杀虫剂中使用本发明菌株的常用方法在本领域中是已知的。参见,例如,美国专利号5,039,523和EP0480762A2。
VIP能在细菌宿主内发酵,加工产生的细菌以与苏云金芽孢杆菌菌株作为杀虫喷洒剂相同的方式用作杀虫喷洒剂。在由芽孢杆菌分泌的VIP的情况下,分泌信号使用在本领域中已知的方法除去或突变。这样的突变和/或缺失防止在发酵期间VIP蛋白质分泌进生长培养基。VIP保留在细胞内,然后细胞被加工以生产胶囊化的VIP。任何适合微生物都能用于这个目的。用假单胞菌属以胶囊化的蛋白质的形式表达苏云金芽孢杆菌内毒素,加工产生的细胞并用作杀虫剂喷洒(H.Gaertner等.1993,高级工程杀虫剂,L.Kimed.)。
用这种方式可利用苏云金芽孢杆菌的各种菌株。这样的Bt菌株产生内毒素蛋白质以及VIP。此外,这样的菌株仅仅产生VIP。枯草芽孢杆菌的孢子形成缺失菌株能产生高水平的苏云金芽孢杆菌之CryIIIA内毒素(Agaisse,H.和Lereclus,D.,“苏云金芽孢杆菌CryIIIA毒素基因在B.subtilis中的表达不是依赖于孢子形成特异性的西格马因子并在spoOA突变体内增长”,细菌学杂志.,1764734-4741(1994))。一种相似的spoOA突变体可是在苏云金芽孢杆菌中的制备,并用于生产不是被分泌进培养基而是保留在细胞内的胶囊化VIP。
为使VIP保留在芽孢杆菌属细胞内,可以除去信号肽以使它不再有分泌信号的功能。尤其是推定的VIP1信号肽包括在这个序列C-末端部分有推定的共用裂解位点Ala-X-Ala的蛋白质开始的31个氨基酸(G.von Heijne,分子生物学杂志。18499-105(1989))。推定的VIP2信号肽在Ala40后有推定的裂解位点的蛋白质的前40个氨基酸。无论在VIP1还是VIP2裂解位点可用本领域中已知的方法突变,再用不被信号肽酶识别的氨基酸取代裂解位点共用序列。
另外,VIP1,VIP2和/或本发明的其它VIP信号肽可从序列中除去。因而使它们作为分泌蛋白质在芽孢杆菌中是不可识别的。尤其是,使用本领域已知的方法,可用基因工程把蛋氨酸起始位点导入到VIP前体蛋白质序列的前面部分,在Asp32起始,或导入到VIP2前体蛋白质的前面部分,在Glu41起始。
VIP基因可导入微生物,微生物在植物(附生植物)中繁殖把VIP蛋白质运送给潜在的靶害虫。附生植物可以是革兰氏阳性或革兰氏阴性细菌。
本发明的在遗传上改变以包含杀虫基因或蛋白质的芽孢杆菌菌株和微生物可用于保护农作物及其产品使之免受害虫危害。在本发明的一个方面,完整的(即未水解的)产生毒素(杀虫剂)的有机体细胞施用到靶昆虫的环境中时,可用延长在细胞内生成的毒素活性的试剂处理。
另外,杀虫剂可通过把异源基因导入单细胞宿主产生。异源基因的表达直接或间接地导致杀虫剂细胞内生产和保持。然后在细胞施用到靶害虫的环境中时能延长细胞内生成的毒素活性的条件下处理细胞。生成的产物保留了毒素的毒性,这些天然胶囊化的杀虫剂可与传统技术结合形成制剂,可施用到寄生靶昆虫的环境如土壤,水,以及植物叶片。参见,例如,EPA 0192319以及其中引用的参考文献。
本发明的有效成分通常以组合物的形式施用,可以施用到作物或被处理的植物上,可与其它复合物同时或先后使用,这些复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可与农业上可接受的载体,表面活性剂或施用促进辅剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。
施用本发明的活性成分或包含至少一种有本发明的菌株产生的杀虫蛋白质的农化组合物的最优方法是叶面施用,种子包衣和土壤施用。施用的数量和比率(rate)取决于相应害虫的侵害程度。
因此,本发明还提供一种杀虫组合物,该组合物包含作为活性成分的至少一种按照本发明的新昆虫特异性蛋白质和/或重组微生物以及农业辅剂如载体,稀释剂,表面活性剂或施用促进辅剂,其中微生物含有至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子,但尤其是包含至少一种含有编码重组形式的新昆虫特异性蛋白质的核苷酸序列之DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或者它们的衍生物或突变体。组合物还可包含生物活性复合物。该复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可加入农业上可接受的载体,表面活性剂或常在制剂领域中使用的施用促进辅剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。
组合物可以包含重量为0.1%至99%的活性成分,重量为1%至99.9%固体或液体辅剂,和重量为0到25%的表面活性剂。活性成分包含至少一种按照本发明的新昆虫特异性蛋白质或重组微生物,该微生物包含至少一种编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子,但尤其是包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或者它们的衍生物或突变体。活性成分或者包含该活性成分的组合物可以和其它不损失杀虫效力的杀虫剂或化学物质(1993农作物保护化学药品参考,化学与药学出版社,加拿大)一起施用到被保护的植物和作物上。它与大多数常用的农业喷洒物质相容,但不应在极端碱性的喷洒溶液中使用。它也可以以粉剂,悬浮液,可湿性粉剂或其它任何适合农业施用的物质形态使用。
本发明还提供通过对(A)虫害发生的环境,(B)植物或植物体的一部分(防止该植物或植物部分受到害虫引起的破坏)或(C)种子(为保护从该种子发育来的植物不受虫害引起的破坏)使用包含至少一种按照本发明的新昆虫特异性蛋白质和包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的活性成分或包含该活性成分的组合物来控制或抑制害虫的方法。
应用于植保领域的更优方法是施用到植物叶片上(叶面施用),使用的数量和比率取决于被保护的植物和正被谈论的害虫成灾的危害性。然而,如果植物所在地点用用液体制剂灌注,或者活性成分以固体形式掺入植物所在地点如以粒子形式进入土壤(土壤施用),活性成分也能通过根系进入植物(内吸作用)。在稻谷作物中,这种粒子可以定量地施用到水淹的农田里。
按照本发明的组合物也适合保护植物繁殖材料,如种子(象果实,块茎或谷粒)或植物插条免受虫害危害。繁殖材料在种植前可用制剂处理,如种子播前包衣,本发明的活性成分也可应用到谷粒(包衣)或者用液体制剂浸谷粒,或者用固体制剂包被谷粒。繁殖材料播种时,制剂也可施用到种植位点,如播种时施用到播种犁沟中。本发明也涉及这些处理植物繁殖材料的方法以及被处理的植物繁殖材料。
按照本发明的组合物包含作为活性成分的重组微生物,它包含至少一种重组形式的新毒素基因,但尤其是芽孢杆菌属几个种菌株的重组体(如蜡状芽孢杆菌或苏云金芽孢杆菌的菌株,它们包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子)或其衍生物或突变体。该组合物可以以任何已知的用细菌菌株进行种子或土壤处理的方式施用。参见,例如,美国专利N0.4,863,866。即使微生物不再存活,菌株对于生物控制也是有效的,然而优选的是活着的微生物的施用。
在本发明的范围之内保护的目标农作物包含如下种类谷物(小麦,大麦,黑麦,燕麦,水稻,高粱以及有关的农作物),甜菜(糖用甜菜和饲料甜菜),草坪草(果园草(orchardgrass),羊茅等),核果,梨果与软果(soft fruit)(苹果,梨,梅,桃,杏,樱桃,草莓,木莓和黑莓),豆科植物(蚕豆,小扁豆,豌豆,大豆),油料植物(油菜,芥,罂粟,橄榄,向日葵,椰子,蓖麻,可可豆,花生),黄瓜植物(黄瓜,南瓜,甜瓜),纤维植物(棉花,亚麻,大麻,黄麻),柑桔(桔,柠檬,葡萄,柑橘),蔬菜(菠菜,莴苣,芦笋,甘蓝以及其它白菜属蔬菜,洋葱,番茄,土豆,红辣椒),樟科植物(鳄梨,胡萝卜,樟,樟脑),落叶树和针叶树(如椴树,紫杉,橡树,桤木,杨,白桦,冷杉,落叶松,松),或者如玉米,烟草,坚果树类,咖啡,甘蔗,茶,藤本植物,忽布,香蕉和天然橡胶植物以及装饰品(包括合成物)。
包含至少一种包含编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子重组体的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金芽孢杆菌菌株,通常以杀虫组合物的形式施用,可用于作物或被保护的植物,还可与生物活性复合物同时施用或先后施用。这些复合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的混合物,如果需要,还可还加入农业上可接受的载体,表面活性剂或常在制剂领域中使用的施用促进辅剂。
按照本发明的活性成分可以以非修饰的形式或与其它适合的农业上可接受的载体一起使用。这些载体是通常在农业制剂领域中使用是辅助剂,因而制剂以已知的方式形成可乳化的浓缩物,可包衣的浆状物,直接喷洒或可稀释的溶液,稀释的乳剂,可湿性粉剂,可溶性粉剂,粉剂,粒剂也可以是胶丸如聚合物。根据组合物的特性,施用方式如喷洒、喷雾、喷粉、散布(scattering)或灌注(pouring)可根据意定的目标和流行的环境选择。施用的最佳比率通常为每公顷(“ha”,大约2.471英亩)大约50克至大约5k克活性成分(a.i.),优选的是大约100克至2kg a.i./ha和200g至500g a.i./ha。
种子包衣的较好的施用比率是每100kg种子0.5k到100kg a.i.,优选的是每100kg种子3克至100克或每100kg种子10g至50g a.i.。
适当的载体和辅剂可以是固体或液体和通常在制剂中使用的相应物质。如天然的或再生的矿物质,溶剂,分散剂,润湿剂,胶粘剂,粘合剂或者肥料。制剂(即包含至少一种包含编码重组形式的昆虫特异性蛋白质之核苷酸序列的DNA分子的重组芽孢杆菌属几个种的菌株,如蜡状芽孢杆菌和苏云金芽孢杆菌作为活性成分或与其它活性成分结合,并在适当时加入固体或液体的辅剂的杀虫组合物,制品或混合物)以已知的方法制备。例如,通过均匀混合和/或用伸展剂(extender)如溶剂,固体载体,在某些情况下是表面活性复合物(表面活性剂)磨碎活性成分。
适合溶剂有芳香烃,优选的是包含8至12碳原子的片断(如二甲苯混合物,萘),邻苯二酸盐(如邻苯二甲酸二正丁酯或双(2-乙基己基)酞酯),脂族烃(如环己烷或石蜡,醇和乙二醇以及它们的醚和酯,如乙醇,乙二醇单甲醚或单苯醚),酮(如环己酮),强极性溶剂(如N-2-吡咯烷酮,二甲基亚砜或二甲基甲酰胺),以及植物油或环氧化植物油如环氧化椰子油或大豆油或水。
在粉剂和可扩散性粉剂中使用的固体载体是通常的天然矿物填料如方解石,滑石,高岭土,蒙脱石或绿坡缕石。为了提高物理特性,也可能加入高扩散性硅酸或高扩散性的吸收多聚物。适合的粒状吸附载体是多孔型的,如浮石,碎砖,海泡石或皂土;适合非吸附性载体是如方解石或沙子的材料。此外,也可以使用许多预先粒子化的无机或有机材料,如特别的白云石或磨碎的植物残余物。
依靠制剂的活性成分的特性,合适的表面活性复合物可以是能较好乳化、扩散和湿润特性的非离子、阳离子和/或阴离子表面活性剂。术语“表面活性剂”也可以理解为表面活性剂组成的混合物,适合的阴离子表面活性剂可以是水溶性皂和水溶性合成表面活性复合物。适合的皂是碱金属盐,碱土金属盐,或高级脂肪酸(C10-C12)的未取代的或取代的铵盐,如油酸或硬脂酸的钠盐或钾盐,或可从椰子油或牛脂油获得的天然脂肪酸混合物的钾盐或钠盐。也适合的表面活性剂还有脂肪酸甲基磺酸盐以及修饰或非修饰的硫酸酯。
然而更常使用的是所谓的合成表面活性剂,特别是脂肪磺酸盐,脂肪硫酸盐,磺基化的苯并咪唑衍生物或烷基芳基磺酸盐,脂肪磺酸盐,脂肪硫酸盐通常是碱金属盐、碱土金属盐、取代或未取代铵盐的形式,并且通常包括C8-C22烷基基团(它也包含烷基基团的烷基部分),例如,木质素磺酸、十二烷基磺酸或从天然脂肪酸得到的脂肪醇硫酸盐混合物的钠盐或钙盐。此复合物也包括脂肪醇/环氧乙烷加成形成的硫酸酯和磺酸酯的盐。磺基化的苯并咪唑衍生物优选地包括2个磺酸基团和一个包括大约8到22个碳原子的脂肪酸基团。烷基芳基磺酸盐的例子是是十二烷基苯磺酸、二丁基萘磺酸或萘磺酸/甲醛的钠盐,钙盐或三乙醇胺盐的浓缩产物。也适合的是相应的磷酸盐,如p壬基酚和4-14mol的环氧乙烷加成形成的磷酸三乙酯的盐。
非离子表面活性剂是优选的是脂族或环脂醇或饱和或不饱和脂肪酸和烷基酚的聚乙二醇醚的衍生物。该衍生物包括3到30个乙二醇醚基团和在烃(脂族)部分的8到20个碳原子以及在烷基酚中的烷基部分的6到18个碳原子。
适合的非离子表面活性剂还有水溶性的聚环氧乙烷和聚丙二醇、乙二胺聚丙二醇以及在烷基链包含1到10个碳原子的烷基聚丙二醇的加成产物,该产物包括20到250个乙二醇醚基团和10到100个丙二醇醚基团。此化合物通常每个丙二醇单元包含1至5个乙二醇单元。非离子表面活性剂的代表例子是壬基酚聚乙氧基乙醇,蓖麻油聚乙二醇醚,聚丙烯/环氧乙烷加成物,三丁基苯氧基聚乙氧基乙醇,聚乙烯乙二醇和辛基苯氧基聚乙氧基乙醇。聚氧乙烯脱水山梨糖醇的脂肪酸酯如聚氧乙烯脱水山梨糖醇三油酸盐也是适合非离子表面活性剂。
阳离子表面活性剂优选地是季铵盐,包含作为N-取代基的至少C8-C22烷基基团,取代基还有低级未取代的或卤化烷基,苯基或低级烃烷基基团。优选的是以卤化物,甲基硫酸盐或乙基硫酸盐的形式存在的盐,如硬脂酰三甲基氯化铵或苄基二(2-氯乙基)溴化乙胺。
在制剂领域常用的表面活性剂已有叙述,如“McCutcheon′s洗涤剂和乳化剂年鉴”,MC出版公司。Ridgewood,N.J.,1979;Dr.Helmut Stache,“Tensid Taschenbuch”(表面活性剂手册),Carl Hanser Verlag,慕尼黑/维也纳。
本发明的杀虫组合物的另一个特别优选的特征是施用到植物或土壤后有效成分的持续性。失去活性的可能原因包含被紫外光、热、叶片分泌物和pH值灭活。例如,在高pH值下,特别是有还原剂存在时,δ-内毒素晶体可溶解并变得易于水解灭活。高的叶片pH值可能也是重要的,特别是叶片表面的pH值能达到8-10的范围时。本发明的杀虫组合物可以通过加入附加剂以协助防止活性成分失去,或以活性成分受保护免于灭活的方法如用胶囊包被材料解决这些问题。胶囊化可以化学完成(McGuire和Shasha,J EconEntomol 851425-1433,1992)或生物完成(Barnes和Cum分钟gs,1986;EP-A 0 192 319)。化学胶囊化参与了活性成分用多聚物包被的加工,而生物胶囊化参与了δ-内毒素在微生物中的表达。对于生物胶囊化,包含至少含有编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子的完整微生物在制剂中用作活性成分。紫外线保护剂的加入可以有效地减少放射破坏。由于热的灭活也可以通过包含一个适当的附加物来控制。
本申请内优选的制剂是包含微生物作为活性成分的制剂,其中活性成分是营养细胞的形式或者更优选的的是以孢子形式(如果能得到的话)。例如,适合的制剂可能由与多价阳离子形成交联并包含这些微生物的多聚物凝胶,如在由D.R.Fravel等编著的植物病理学,75卷,No.7,774-777,1985中有藻酸盐作为多聚物材料的叙述。从这本出版物中还知道载体物质可以共用(co-use)。通常制剂通过混合天然产生的或合成的凝胶形式的多聚物如藻酸盐和多价金属离子盐的水溶液来制得。这样形成了单个小滴,这种单滴使微生物悬浮在任一种或两种的反应溶液中成为可能。凝胶形成以小滴的混合开始,这些凝胶离子的随后干燥是可能的。这种方法称为ionotropic凝胶化。依据干燥的程度,形成了结构上通过多价阳离子交联并包含微生物和表现出均匀分布的载体的多聚物的致密、坚硬的粒子。粒子的大小可达5mm。
在EP-A1-0097571中叙述了基于部分交联的多糖加上如微生物并包含精细分离的硅酸作为载体材料可通过如Ca++离子发生交联的组合物。组合物的水活性不大于0.3。W.J.Cornick等在一篇综述文章[生物控制新方向抑制农业病虫害的替代,345-372页,Alan R.Liss,Inc.(1990)]中叙述了各种制剂系统、用蛭石作为载体离子化以及通过在前面提到的ionotropic凝胶化制备的致密藻酸盐小珠。
D.R.Fravel在《杀虫剂制剂和施用系统》(11卷,ASTM STP 1112美国检验和材料学会,费城,1992,173至179页)中也提到过这样的组合物,它可用于制造按照本发明的重组微生物的制剂。
本发明的杀虫组合物通常包含大约0.1%至大约99%,优选的是大约0.1%至大约95%,更优的是大约3%至大约90%的活性成分;从大约1%至大约99.9%,优选的大约1%至大约99%,更优的是大约5%至大约95%的固体或液体辅剂;以及从0至大约25%,优选的是大约0.1%至大约25%,更优的从大约0.1%至大约20%的表面活性剂。
在本发明一个优选的实施方案中,杀虫组合物通常包含0.1%至99%,优选的是0.1%至95%重组的包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金芽孢杆菌菌株,或者它与其它活性成分(1%至99%的固体或液体辅剂以及0至25%优选的是0.1%至20%的表面活性剂)的结合物。
但是,商业性产品最好以浓缩物制成制剂,最终用户通常使用实质上更低浓度的稀释制剂。杀虫组合物也可以包含更多的成分,如稳定剂,消泡剂,粘度调节剂,粘合剂,胶粘剂以及肥料或其它活性成分。
在本发明的一个实施方案中,分离到一种蜡状芽孢杆菌微生物,它能杀死玉米根叶甲和长角叶甲,新的蜡状芽孢杆菌菌株AB78保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21058。
片断蛋白质可从蜡状芽孢杆菌菌株中实质纯化出来。蛋白质纯度可用SDS-PAGE和生物活性检验。蛋白质分子量为大约60至大约100kDa,特别是大约70至大约90kDa,更特别的是大约80kDa,即下文的VIP。
氨基末端序列分析表明N-端氨基酸的序列是NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile-Pro-(SEQ ID NO8),其中Asx代表Asp或Asn。全部的氨基酸序列由SEQID NO7给出。编码SEQ ID NO7中的氨基酸的DNA序列由SEQ ID NO6给出。
可生成一段对编码NH2-末端3-9个氨基酸的基因区域的寡核苷酸探针。探针合成基于苏云金芽孢杆菌(Bt)δ-内毒素基因的密码子使用。用于Southern杂交的寡核苷酸探针的核苷酸序列如下5-GAA ATT GAT CAA GAT ACN GAT-3(SEQ ID NO9)其中N代表任何碱基。
此外,这里所述的Bc AB78 VIP1基因的DNA探针,可用于筛选任何芽孢杆菌属菌株或其它有机体以确定VIP1基因(或有关的基因)是否天然存在,或特定的转化有机体是否包含VIP1基因。
现在,全面叙述了本发明,通过参考下面的详细的实施例将更好地理解本发明。实施例用于例证,除非特别指出,它不能被认为是对本发明的限定。
基于包含在本发明中的蛋白质序列的一致性,发展了标准的命名法。下面详细的实施例中的基因和蛋白质名和使用在专利申请[美国申请号31594/08]中的名字的关系如下基因/蛋白质 基因/蛋白质蛋白质描述按标准命 本专利中的名法的名称 名称
VIP1A(a)VIP1得自菌株AB78的EQ ID NO5给出的VIP1VIP2A(b)VIP2得自菌株AB78的SEQ ID NO2给出的VIP2VIP1A(a)VIPI得自苏云金芽孢杆菌变种tenebrioni的同系物 SEQ ID NO21给出的VPI1VIP2A(b)VIP2得自苏云金芽孢杆菌变tenebrionis的SEQ同系物 ID NO20给出的VIP2VIP3A(a)-- 得自AB88菌株的在本申请的SEQ IDNO20中给出的VIPVIP3A(b)-- 得自AB424菌株的在本申请的SEQ IDNO31中给出的VIP实验制剂实施例在下列制剂实施例中使用的活性成分是保藏号为NRRL B-21058的蜡状芽孢杆菌菌株;保藏号为NRRL B-21060,NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227以及NRRL B-21439的苏云金芽孢杆菌菌株;和保藏号为NRRL B-21228,NRRL B-21229以及NRRLB-21230的芽孢杆菌属几个种的菌株。所有提到的菌株是包含按照本发明的昆虫特异性蛋白质的天然分离的菌株。
另外,分离到的昆虫特异性蛋白质单独或与上述的芽孢杆菌属菌株组合用作活性成分。A1.可湿性粉剂a) b) c)苏云金芽孢杆菌孢子 25%50%75%木质素磺酸钠 5% 5% --十二烷基磺酸钠 3% -- 5%二异丁基萘磺酸钠 -- 6% 10%辛基酚聚乙二醇醚 -- 2% --(7-8moles环氧乙烷)高扩散性硅酸 5%10% 10%高岭土 62% 27% ---孢子完全与辅剂混合,混合物在适当的碾磨机上完全磨碎,产生的可湿性粉剂可用水溶解生成合乎需要的浓度的悬浮液。A2.可乳化浓缩物苏云金芽孢杆菌孢子10%辛基酚聚乙二醇醚(4-5moles环氧乙烷)3%十二烷基苯磺酸钙 3%蓖麻油聚乙二醇醚(36moles环氧乙烷) 4%环己酮30%二甲苯混合物 50%任何所需浓度的乳浊液都可通过用水稀释此浓缩物来获得。A3.粉剂a) b)苏云金芽孢杆菌孢子 5%8%滑石95% --高岭土 -- 92%准备使用的粉剂可通过把活性成分与载体混合并在适当的碾磨机上磨碎混合物获得。
A4.挤压粒剂(Extruder Granulate)苏云金芽孢杆菌孢子10%木质素磺酸钠 2%羧甲基纤维素 1%高岭土87%混合活性成分或结合物,用辅剂磨碎,然后混合物用水湿润。挤压混合物,粒化,在流动空气中干燥。
A5.包衣颗粒苏云金芽孢杆菌孢子 3%聚乙二醇(mol wt 200)3%高岭土 94%活性成分或结合物和用聚乙烯乙二醇湿润的高岭土在混合机中均匀混合。这种方法可获得非粉性包衣颗粒。
A6.悬浮浓缩液苏云金芽孢杆菌孢子 40%乙二醇 10%壬基酚聚乙二醇醚(15moles环氧乙烷)6%木质素磺酸钠 10%羧甲基纤维素 1%37%甲醛水溶液 0.2%75%水溶液形式的硅酮油 0.8%水 32%活性成分或结合物与辅剂密切混合,产生悬浮浓缩物。从中任何所需浓度的悬浮液可以用水稀释得到。
实施例1.AB78的分离和特征确定在实验室中蜡状芽孢杆菌菌株AB78在T3培养基上(每升3克胰胨,2克胰蛋白质际,1.5克酵母抽提物,0.05M磷酸钠(pH6.8),以及0.005克MnCl2;Travers,R.S.1983)作为平板污染物来分离。在对数生长阶段,AB78产生明显对玉米根叶甲的活性。抗革兰氏阳性芽孢杆菌属的几个种的抗体活性液被证明。
表12AB78培养物上清液抗体活性测试细菌AB78链霉素大肠杆菌0.0 3.0巨大芽孢杆菌1.1 2.2蕈状芽孢杆菌1.3 2.1蜡状芽孢杆菌CB 1.0 2.0蜡状芽孢杆菌11950 1.3 2.1蜡状芽孢杆菌14579 1.0 2.4
蜡状芽孢杆菌AB78 0.02.2苏云金芽孢杆菌israelensis变种 1.12.2苏云金芽孢杆菌tenebrionis变种 0.92.3AB78的形态特征如下营养生长阶段为直杆菌,3.1-5.0mm长,0.5-2.0mm宽。细胞有圆形末端,以单细胞组成短链。单亚端圆柱形-椭圆形,每细胞形成内生孢子。无伴孢晶体形成。菌落不透明,缺刻状,裂片形,扁平。无色素产生。细胞能游动,有鞭毛。
AB78的生长特征如下兼性厌氧型,最适生长温度21-30℃,可在15,20,25,30,37℃下生长。高于40℃不能生长。可在5-7%NaCl中生长。
表13提供了AB78的生化特征简介。
表13蜡状芽孢杆菌菌株AB78的生化特性从L-阿拉伯糖产酸-亚甲蓝再氧化+从L-阿拉伯糖产气-硝酸盐还原 +从D-木糖产酸-NO3还原成NO2+从D-木糖产气-VP +从D-葡萄糖产酸 +H2O2降解 +从D-葡萄糖产气 -吲哚-从乳糖产酸 -酪氨酸降解 +从乳糖产气 -二羟基丙酮 -从蔗糖产酸 -石蕊牛乳酸 -从蔗糖产气 -石蕊牛乳凝结-从D-甘露醇产酸 -石蕊牛乳碱 -
从D-甘露醇产气 -石蕊牛乳胨化 -Proprionate利用 +石蕊牛乳还原 -柠檬酸利用 +酪蛋白质水解 +马尿酸水解 W淀粉水解 +亚甲蓝还原 +明胶液化 -卵磷脂酶产生 WW=软弱的反应实施例2.细菌培养用蜡状芽孢杆菌菌株AB78的继代培养物接种到下列培养基,即已知的TB肉汤胰胨 12g/l酵母提取物 24g/l甘油 4ml/lKH2PO42.1g/lKH2PO414.7g/lpH7.4高压灭菌的肉汤冷却后加入磷酸钾。培养瓶在250rpm的旋转振荡器上在30℃下培养24-36小时。这代表指数生长中期的早期。
上述方法易于通过本领域已熟知的方法扩大成发酵罐。
营养生长阶段通常为24-36小时。开始培养代表指数生长中期的早期,之后,AB78细菌从培养物上清液中离心得到。培养物上清液中包含用于生物检定活性蛋白质。
实施例3.昆虫生物检定测试蜡状芽孢杆菌菌株AB78分别抗不同种类的昆虫如下玉米根叶甲,长角叶甲,瓜十一星叶甲(Diabrotica virgifera virgifera,D.longcornisbarberi和D。undecempunctata howardi)稀释液用生长24-36小时的AB78培养物上清液制得。与熔化的人工食品混合(Marrone等,(1985),经济昆虫学杂志,78290-293),使其固化。固化食品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡率。
大肠杆菌克隆生物检定大肠杆菌细胞在包含100μg/ml氨苄青霉素的肉汤上生长过夜。10ml培养物超声处理3次,每次20秒,500μl的超声处理培养物加入到熔化的玉米根叶甲食物中。
土豆甲虫(Leptinotarsa decemlineata)生长24-36小时的AB78培养物上清液用Triton X-100(使其最终浓度为0.1%TX-100)制得稀释液。5cm2的土豆叶片在此溶液浸一下,空气中干燥,置于塑料盘中的湿润滤纸上。新生幼虫置于食物上,保持在30℃,6-8天后计算死亡率。
大黄粉虫(Tenebrio molitor)用生长24-36小时的AB78培养物上清液制得稀释液。与熔化的人工食品(Bioserv#9240)混合,使其固化。固化食品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡率。
玉米螟,小地老虎,烟芽夜蛾,烟草天蛾和甜菜夜蛾分别(Ostrinianubilalis,Agrotis ipsilon,Heliothis virescens,Manduca serta,Spodopteraexigua)生长24-36小时的AB78培养物上清液用TX-100(最终浓度为0.1%TX-100)制得稀释液。用移液管吸取100μl到18cm2到固化人工食品(Bioserv#9240)的表面,空气中干燥。新生幼虫置于食物上,保持在30℃,3-6天后计算死亡率。
尖音库蚊(Culex pipiens)用生长24-36小时的AB78培养物上清液制得稀释液。用移液管吸取100μl到有10ml水的30ml塑料杯中,三龄幼虫置于水中,保持在室温下,24-48小时后计算死亡率。AB78的杀虫活性谱如表14。
表14AB78培养物上清液对不同种类的昆虫的活性迄今所测的昆虫种类 目 活性玉米根叶甲(Diabrotica virgifera virgirera) 鞘翅目+++长角叶甲(Diabrotica longicornis barberi) 鞘翅目+++瓜十一星叶甲(Diabrotica undecimpunctata howardi) 鞘翅目-土豆甲虫(Leptinotarsa decemlineata) 鞘翅目-大黄粉虫(Tenebrio molitor) 鞘翅目-玉米螟(Ostrinia nubilalis) 鳞翅目-烟芽夜蛾(Heliothis virescens)鳞翅目-烟草天蛾(Manduca serta) 鳞翅目-甜菜夜蛾(Spodoptera exigua) 鳞翅目-小地老虎(Agrotis ipsilon)鳞翅目-尖音库蚊(Culex pipiens) 双翅目-最近发现的蜡状芽孢杆菌菌株AB78与已知的得自Bt的鞘翅目活性的δ-内毒素相比,杀虫活性谱显著不同。特别是,AB78比已知的鞘翅目活性的Bt菌株对甲虫类有更强的选择活性。其中对Diabrotica属的几个种的有特别的活性。尤其是对玉米根叶甲和长角叶甲的活性最大,但对瓜十一星叶甲无活性。
检测许多芽孢杆菌菌株在营养生长期间对玉米根叶甲的活性。结果表明AB78有独特的抗玉米根叶甲的活性,这不是普遍现象。
表15芽孢杆菌属的几个种的培养物上清液对玉米根叶甲的活性芽孢杆菌菌株 WCRW死亡百分率%蜡状芽孢杆菌AB78(Bat.l) 100蜡状芽孢杆菌AB78(Bat.2) 100蜡状芽孢杆菌(Carolina Bio.) 12蜡状芽孢杆菌ATCC 11950 12蜡状芽孢杆菌ATCC 14579 8蕈状芽孢杆菌(Carolina Bio.) 30日本甲虫芽孢杆菌28苏云金芽孢杆菌HD135 41苏云金芽孢杆菌HD191 9苏云金芽孢杆菌GC91 4苏云金芽孢杆菌isrealensis变种 24水对照 4AB78对玉米根叶甲的特异性活性在表16给出。
表16AB78培养物上清液对新生玉米根叶甲的活性培养物上清液浓度(μl/ml)WCRW死亡%
100 10025 8710 805 402.5 201600计算出半致死浓度(LC50)是玉米根叶甲食物中培养物上清液浓度为6.2μl/ml。
对细胞团状沉淀也进行生物检定,表明对WCRW无活性。这样,活性仅仅存在于上清液中表明VIP是一种外毒素。
实施例4.叶甲类活性蛋白质从AB78的分离和纯化无细胞的培养介质和残骸通过加入固体硫酸铵(472g/L)制成70%饱和液。室温下溶解,冰浴中冷却,10000×g离心30分钟使可沉淀的蛋白质沉淀,丢弃上清液。团状沉淀在pH7.5下起始体积为20mM的1/10TRIS-HCl中溶解。溶解的沉淀通过透析进入pH为7.5的20mM TRIS-HCl中,或者通过除盐层析柱除去盐分。
去盐物质用pH为2.5的20mM柠檬酸钠滴定到pH3.5,室温下温育30分钟后,溶液在3000×g下离心10分钟,这个阶段的上清液包含着最大数量的活性蛋白质。
pH中性化到7.0后,把上清液加Mono-Q,阴离子交换,层析柱用20mMpH为7.5的Tris以300ml/分钟的流速平衡。层析柱用pH为7.5的在20mMTris中的400mMNaCl逐步和线形梯度展开。
层析片段的生物检定和SDS-PAGE分析用于确定活性片段。SDS-PAGE分析鉴别出生物活性蛋白质有一个分子量在大约80kDa到50kDa之间的组分。
实施例5.叶甲类(corn rootworm)活性蛋白质的序列分析由SDS-PAGE分离的80kDa组分转移到PVDF膜上,在ABI470脉冲液体分析仪上通过重复的Edman循环进行氨基端序列分析,然后再转移进含有10%甲醇、pH为11.0的10mM CAPS缓冲液中,步骤如下电泳后在转移缓冲液中凝胶温育5分钟,ProBlott PVDF膜用100%MeOH短时间湿润,然后在转移缓冲液中平衡。在泡沫海绵和滤纸块之间的三明治形物排列为阳极-凝胶-膜-阴极。
转移在70V恒定电压下进行1小时。
转移后,膜以水漂洗,用在50%MeOH中的考马斯蓝R-250染色2分钟。
用50%MeOH、40%水10%醋酸漂洗几次脱色。
脱色后,膜在空气中干燥,把条带切下进行序列分析,使用BlottCartridge与适当的周期达到最大的效率和产量。数据使用610序列分析模型软件进行分析,它能定性和定量测定每一个序列周期的PTH-氨基酸衍生物。
测到的N-端序列为NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile-Pro-(SEQ ID NO8),其中Asx代表Asp或Asn。80kDa组分的全部氨基酸序列在SEQ ID NO7给出。编码SEQ ID NO7蛋白质的DNA序列在SEQ IDNO6给出。
实施例6.DNA探针的结构本发明生成了探察编码N-末端序列氨基酸3-9的基因区域(实施例5)的寡核苷酸探针。探针是在苏云金芽孢杆菌(Bt)的密码子使用基础上合成的。寡核苷酸序列5′-GAA ATT GAT CAA GAT ACN GAT-3′(SEQ ID NO9)用作Southern杂交的探针。寡核苷酸用标准的方法和设备合成。
实施例7.叶甲类活性蛋白质的等电点测定从纯化步骤的第五步得到的纯化蛋白质使用快速凝胶电泳系统(Pharmacia)在PI为3-9的等电聚焦凝胶上分析。分离和银染展开步骤都使用此系统的标准操作步骤。PI值大约为4.9。
实施例8.AB78的PCR数据使用PCR分析(参见如美国专利申请序列号No.08,008,006;和Carozzi等,(1991),应用环境微生物,57(11)3057-3061,本文一并参考)检验到蜡状芽孢杆菌菌株AB78不含任何苏云金芽孢杆菌或球形芽孢杆菌的杀虫结晶蛋白质基因(第17表)。
表17由PCR测定的抗AB78 DNA的芽孢杆菌杀虫结晶蛋白质基因的引物测试引物 产生的产物对CryIIIA特异性的2组 阴性CryIIIB阴性对CryIA特异性的2组 阴性CryIA(a) 阴性CryIA(b)特异性的 阴性CryIB 阴性CryIC特异性的 阴性CryIE特异性的 阴性对球形芽孢杆菌特异性的2组 阴性对CryIV特异性的2组 阴性芽孢杆菌属对照(PI-PLC) 阳性实施例9.得自蜡状芽孢杆菌菌株AB78的总DNA的粘粒克隆在从菌株AB78制备的总DNA中克隆出VIP1A(a)基因的步骤如下AB78 DNA分离如下
1.细菌在10ml的L-肉汤中生长过夜。(使用50ml的无菌离心管)2.加25ml的新鲜L-肉汤和氨苄青霉素(30μg/ml)。
3.细胞在30℃下生长2-6小时,同时振荡。
4.50ml的聚丙烯桔色盖试管在IEC桌面临床离心机中以3/4转速旋转细胞。
5.把细胞团状沉淀重新悬浮在10mlTES(TES=50mM TRIS pH8.0,100mM EDTA,15mMNaCl)中。
6.加30mg溶菌酶,在37℃下培养2小时。
7.加200μl20%的SDS和400μl蛋白质酶K原种(20mg/ml),在37℃下培养。
8.加200μl新鲜蛋白质酶K,55℃下培养1小时。加5mlTES使最终体积达到15ml。
9.酚提取两次(10ml酚,室温下在IEC桌面临床离心机中以3/4的转速旋转)。使用宽内径移液管把上清液(上相)转移到干净试管中。
10.用1∶1(体积)的酚三氯甲烷/异戊醇(24∶1比率)再抽提一次。
11.用相等体积的冷异丙醇沉淀DNA;离心使沉淀成团状。
12.团状沉淀在5ml TE中重新悬浮。
13.用pH为5.2的0.5ml3M NaOAc和11ml的95%乙醇沉淀DNA,在-20℃下放置2小时。
14.用塑料环从试管中“钩出”DNA,转移到一个小离心管中,旋转离心,用移液管吸去多余的乙醇,真空中干燥。
15.在0.5ml的TE中重新悬浮,培养90分钟。在65℃下把DNA放回溶液中。
16.用标准方法测定浓度。
AB78的粘粒克隆除非特别指出,所有方法都根据Stratagene方法,Supercos1指导手册,cat.No.251301进行。
一般步骤如下A.AB78 DNA用Sau 3A部分消化
B.载体DNA制备C.DNA的连接和包装D.Tittering粘粒文库1.把50ml的过夜培养物放置在有0.2%麦芽糖的5ml TB上,开始HB101细胞的培养。在37℃下培养3.5小时。
2.旋转离心出细胞,重新悬浮进0.5ml 10mM MgSO4中。
3.再加上100l cells100l 稀释的包装混合物100l 10mM MgSO430l TB4.在室温下吸附30分钟,不振荡。
5.加1ml TB,并使之慢慢混合。在37℃下培养30分钟。
6.把200l 平铺在L-amp平板上。在37℃下培养过夜。
随机选择至少400个粘粒克隆,如实施例3所述筛选抗玉米根叶甲的活性物。得自5个活性克隆和5个非活性克隆的DNA用于Southern杂交。结果表明使用上述的寡核苷酸探针杂交结果与对玉米根叶甲的活性相关(表18)。
粘粒克隆P3-12和P5-4保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21061和NRRL B-21059。
表18AB78粘粒克隆对玉米根叶甲的活性克隆 平均死亡率(N=4)与探针杂交的克隆P1-73 47
P1-83 b4P2-269P3-12 85P5-497不与探针杂交的克隆P1-25P3-84P3-912P3-18 0P4-69实施例10.对玉米根叶甲有活性的一个6KB区域的鉴别P3-12的DNA用限制性内切酶Sau 3A部分消化,连接到大肠杆菌载体pUC19内,转移进大肠杆菌。特异地探察80KDa VIP1A(a)的探针通过P3-12DNA的一部分PCR扩增合成。与VIP1(a)一部分杂交的寡核苷酸MK113和MK117使用80kDa蛋白质的部分氨基酸合成。质粒亚克隆通过菌落和PCR生成的探针进行杂交来鉴别,并测其抗玉米根叶甲的活性。与PCR生成的片段杂交的这样一个克隆PL2在上述测定中对玉米根叶甲是活性的。
得自pL2的一个6kb ClaI限制性片段被克隆进大肠杆菌-芽孢杆菌穿梭载体PHT3103的的SmaI位点(Lereclus,D.等,FEMS微生物通信,60211-218(1989))生产pCIB6201。这个构建体的抗玉米根叶甲活性超过芽孢杆菌和大肠杆菌菌株。在pBluescript SK(+)载体内(Stratagene)包含同样的6kb cla1片段的pCIB6022产生出相当的CIP1(a)蛋白质(通过western印迹),这个蛋白质对玉米根叶甲也是活性的。
pCIB6022的核苷酸序列通过双脱氧末端法(Sanger等,美国科学院学报,745463-5467(1977)),使用PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。序列在SEQ ID NO1中给出。通过SEQ IDNO1中叙述的开放读框表明6kb片段编码VIP1A(a)和VIP2A(a)。编码VIP2A(a)的序列在SEQ ID NO4中提供。VIP1A(a)和VIP2A(b)在发现于pCIB6022的6kb片段的关系在表19中描述。pCIB6022保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21222。
实施例11.VIP1A(a)DNA区功能分析为证明VIP1A(a)开放读框(ORF)对于杀虫活性是必须的。在基因中创造出一个翻译移码突变。限制性内切酶Bgl II识别把857bp定位进VIP1A(a)密码区的单一位点。pCIB6201用Bgl II消化,并且以DNA聚合酶(Klenow片段)和dNTPS添补单链末端。重新与质粒连结转化进大肠杆菌。产生的质粒pCIB6203在VIP1A(a)的编码区包含着四个核苷酸插入序列。pCIB6203对WCRW无杀虫活性,证明VIP1A(a)是对WCRW活性的本质成分。
为进一步限定编码VIP1A所必须的区域,构建了VIP1A(a)和VIP2A(a)(辅助蛋白质)区的亚克隆,并测其互补pCIB6203突变的能力。pCIB6203包含在pBluescript SK(+)载体(Stratagene)中的Xbal-EcoRV片段。western印迹分析表明pCIB6023产生的VIP1A(a)蛋白质与克隆PL2和pCIB6022产生的蛋白质大小和数量相等。pCIB6023包含编码上述80kDa蛋白质的完整基因。pC1B6023保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21223N。pCIB6206包含在pBluescript SK(+)载体(Stratagene)中得自pCIB6022的4.3kb的Xbal-ClaI片段。pCIB6206也保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21321。
pCIB6023,pCIB6206,和pCIB6203单个测试时不产生可检测的对玉米根叶甲的活性。然而,包含pCIB6203(VIP1A(a)突变,加上VIP2A(a))的细胞和pCIB6023(只有VIP1A(a))的细胞的混合物表现出对玉米根叶甲的高度活性。同样地,包含pCIB6206的细胞和pCIB6203的细胞的混合物显示对玉米根叶甲的高度活性。
为进一步确定VIP2A(a)的界限,我们构建了pCIB6024,它包含着完整的VIP2A(a),但是缺乏VIP1A(a)的大部分编码区。pCIB6024通过凝胶纯化得自pCIB6022的2.2kb ClaI限制性片段构建,并用DNA聚合酶(Klenow片段)和dNTPs添补单链末端,然后把这个片段连结进用酶Eco RV消化的pBluescript SK(+)载体内(Stratagene)。包含pCIB6024的细胞不表现对玉米根叶甲的活性。但包含pCIB6024的细胞和pCIB6023的细胞的混合物显示出对玉米根叶甲的高度活性(参见表19)。
这样,pCIB6023和pCIB6206一定产生一个功能性的VIPIA(a)基因产物,而pCIB6203和pCIB6024一定产生一个功能性的VIP2A(a)基因产物。这些结果表明需要得自VIP2A(a)区的基因产物与VIP1A(a)结合,才能产生最大的抗玉米根叶甲的活性(参见表19)。
表19pCIB6022的特征
VIP的功能互补
方框区表示VIP1A(a)和VIP2A(a)的范围。白方框表示编码在芽孢杆菌中观察到的80kDa肽链的VIP1区域。黑方框表示由DNA序列分析指出的VIP1A(a)的N-末端“前肽”。打点方框表示VIP2A(a)的编码区。大“X”表示导入VIP1A(a)的移码突变位置。箭头表示由β-半乳糖苷酶转录的结构。
实施例12.AB78抗体产生抗体产生在两只Lewis大鼠中开始,要求有移动杂交瘤细胞系产物的可能性并能为基因组DNA文库的极限筛选产生足够的血清。另一个因素是可供使用的抗原数量非常有限以及它仅能够用PAGE纯化随后转移到硝酸纤维素膜上的事实。
由于在硝酸纤维素上得到的抗原有限,硝酸纤维素在DMSO中乳化,并注射进动物的后脚掌,以在(popliteal)淋巴结的上游得到B-细胞产物。通过用开始的血进行Werstern印迹分析判断,产生了高效价的血清。随后的几次注射和放血产生完成筛选需要的所有血清。
然后开始另一只大鼠的杂交生产。取下popliteal淋巴结,离析产生的细胞与小鼠骨髓瘤P3x63Ag8.653融合。随后按下述的方法完成细胞筛选。选择四个对极限稀释克隆有最高乳化抗原反应的initial孔。选择另外的10个孔用于扩展或深低温保存。
在DMSO中乳化硝酸纤维素膜上的AB78以利于筛选的步骤把在PAGE中电泳的AB78样品转移到硝酸纤维素膜上后,使用可逆菌株Ponceau S使所有的转移的蛋白质显示出来。鉴别出相对应于AB78毒素(前面已经鉴别并N-末端测序)的带,并从硝酸纤维素膜上切割下来。每条带大约1mm×5mm大小,以使被乳化的硝酸纤维素的量最小。单个的带放于有250μl的微离心管内,使用塑料研钵离析(Kontes,Vineland,NJ)。为促进乳化,DMSO混合物加热到37-45℃下2-3分钟。加热后可能需要进一步的离析,但是所有的硝酸纤维素膜都应该乳化。在AB78样品乳化后,立即置于冰上。为用乳化抗原包被微滴定板,样品必须在硼酸盐溶液中稀释如下1∶5,1∶10,1∶15,1∶20,1∶30,1∶50,1∶100和0。包被的抗体必须现配现用。ELISA方法1.在BBS中用AB78/DMSO包被。在4℃下培养过夜。
2.用1X ELISA洗涤缓冲液洗涤平板3次。
3.在室温下封闭(在含有1%BSA和0.05%Tween20的PBS中)30分钟。
4.用1X ELISA洗涤缓冲液洗涤平板3次。
5.加入大鼠血清。在37℃下培养1.5小时。
6.用1X ELISA洗涤缓冲液洗涤平板3次。
7.加入浓度为2μg/ml的山羊抗大鼠到ELISA稀释液中,37℃下培养1小时。
8.用1X ELISA洗涤缓冲液洗涤平板3次。
9.加入2μg/ml的兔抗山羊碱性磷酸酶到ELISA稀释液中,37℃下培养1小时。
10.用1X ELISA洗涤缓冲液洗涤平板3次。
11.加入底物,在室温的培养30分钟。
12.30分钟后用3N NaOH停止反应。
VIP2A(a)抗血清的制备部分纯化的AB78培养物上清液用不连续的SDS-PAGE(Nevex)按制造厂商的说明分离。分离的蛋白质按Towbin等(1979)所述的方法电泳到硝酸纤维素膜上(S&S#21640)。硝酸纤维膜用Ponceau S染色,鉴别出VIP2A(a)带。注射前切下VIP2A(a)带并立即在DMSO中乳化。用乳化的VIP2A(a)与弗氏完全佐剂大约1∶1的混合物在四个不同位点肌肉注射开始免疫兔子。随后每四周一次的免疫除了不使用弗氏完全佐剂外与第一次相同。在VIP2A(a)蛋白质免疫反应后,收获第一次血清。使用这种血清对AB78培养物上清液的western印迹分析鉴别出大多全长度的VIP2A(a)蛋白质。
实施例13.带AB78 VIP克隆的非活性BT菌株的杀虫活性的激活
pCIB6203与得自Bt菌株GC91的24小时的培养物(指数生长中期的早期)上清液一起导致玉米根叶甲的100%死亡。pCIB6203和GC91单独对玉米根叶甲都无活性。数据如下测试材料 玉米根叶甲的死亡百分率pCIB6203 0GC91 16pCIB6203+GC91 100对照 0实施例14.蜡状芽孢杆菌AB81的分离和生物活性定名为AB81的第二种蜡状芽孢杆菌菌株是通过标准方法从谷物箱粉末样品中分离的得到的。如实施例2的方法培养和制备AB81亚克隆以进行生物检定。生物活性用实施例3中描述的方法进行评价,结果如下测试的昆虫种类 死亡百分率玉米螟 0小地老虎 0玉米根叶甲 55实施例15.苏云金芽孢杆菌的分离和生物活性定名为AB6的苏云金芽孢杆菌是通过本领域中已知的标准方法从谷物箱粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。
生物活性用实施例3所述的方法评价,结果如下测试的昆虫种类 死亡百分率玉米螟 0小地老虎 100小地老虎(接种样品) 0玉米根叶甲 0高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性素不是β-外毒素。
菌株AB6保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRLB-821060。
实施例16.苏云金芽孢杆菌AB88的分离和生物学活性。
定名为AB88的苏云金芽孢杆菌是通过标准方法从谷物箱粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。生物活性用实施例3所述的方法评价结果如下培养物上清液的死亡百分率测试的昆虫种类 目 没有高压灭菌 高压灭菌小地老虎 鳞翅目 100 5玉米螟 鳞翅目 100 0草地贪夜蛾 鳞翅目 100 4玉米夜蛾 鳞翅目 100 12烟芽夜蛾 鳞翅目 100 12土豆甲虫 鞘翅目 0 0玉米根叶甲 鞘翅目 0 5高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性素不是β-外毒素。
Δ-内毒素结晶通过标准方法从菌株AB88中纯化得到。在对小地老虎的生物检定时,没有观察到纯结晶有活性。
实施例17.得自菌株AB88的VIP的纯化细菌液体培养物在TB培养基中30℃下生长过夜(12小时)。细胞在5000×g下离心20分钟,保留上清液。存在于上清液中的蛋白质用硫酸铵(70%饱和度)沉淀。离心(5000×g下15分钟),保留团状沉淀。团状沉淀在pH为7.5最初体积为20mM的Tris中重新悬浮。在4℃下对同样的缓冲液透析过夜。AB88透析液与AB78中的类似物质相比更浑浊。透析液用20mM柠檬酸钠(pH2.5)滴定到pH4.5,在室温下培养30分钟。溶液在3000g下离心10分钟。蛋白质团状物重新溶解在20mM pH为9.0的Bis-Tris-Propane中。
澄清化后,AB88蛋白质通过下列几种不同的方法分离等电点聚焦(Rotofor,BioRad,Hercules,CA),pH4.5下沉淀,离子交换色谱,大小排阻色谱以及超滤作用。
蛋白质在Poros HQ N阴离子交换层析柱(PerSeptive生物系统,剑桥,MA)上使用从0到500mM NaCl的线形梯度在20mM pH为9.0的Bis-Tris-Propane中以4ml/分钟的流速分离。杀虫蛋白质在250mM NaCl中洗脱。
玉米螟(ECB)活性蛋白质保留在由透析液在pH为4.5下沉淀获得的团状沉淀中。使用pH值3-10的两性电解质在透析液中制备IEF时,ECB杀虫活性在用pH为7或更大得到的所有片段中都有杀虫活性发现。这些片断的SDS-PAGE分析显示出分子量为大约60kDa和大约80kDa的蛋白质带。60kDa和80kDa带用阴离子交换HPLC在Poros-Q层析柱上分离(PerSeptive生物系统,剑桥,MA)。N-末端序列从包含分子量稍有不同但大小都约为60KDa的两个片断中获得。获得的序列相互之间相似,而且和一些δ-内毒素相似。
阴离子交换片断23(较小) xEPFVSAxxxQxxx(SEQ ID NO10)阴离子交换片断28(较大) xEYENVEPFVSAx(SEQ ID NO11)当ECB活性的pH为4.5的团状沉淀进一步在Poros-Q层析柱上通过阴离子交换分离。活性只在主要包含约60KDa带的片段中有发现。
当AB88透析液pH降到4.5时,小地老虎活性蛋白质也保留在团状沉淀内。使用pH3-10的两性电解质制备的IEF中,在ECB活性的IEF片断中没有发现对BCW的活性;代替的是,它在pH4.5-5.0中的片段的活性是最高的,它的主要组分分子量为大约35KDa和大约80KDa。
pH4.5团状沉淀用阴离子交换HPLC分离,产生只包含35KDa物质的片段和包含35KDa和80KDa带的片段。
实施例18.AB88 VIP的定性包含不同对鳞翅目昆虫有活性的营养生长时期蛋白质的片段如实施例17所述生成。有杀虫活性的片段在8-16%的SDS-聚丙烯酰胺凝胶中分离,并转移到PVDF膜上[LeGendre等,(1989)用于微序列分析的蛋白质和肽纯化实用指南,ed Matsudaria PT(学术出版公司,纽约]。片段的生物分析证明不同的VIP负责对不同的鳞翅目种类的活性。
对小地老虎活性是由于80kDa和/或35kDa蛋白质,不管是单独或结合施用。这些蛋白质和已知的Btδ-内毒素序列无同源性,证明它们和任何Bt的δ-内毒素无关。得自菌株AB88的vip3A(a)杀虫蛋白质主要存在于AB88的培养物上清液内(至少为总数的75%)。
这些蛋白质在AB88Btδ-内毒素结晶中也没有找到。主要的δ-内毒素蛋白质的N-末端序列与80kDa和35kDa VIP的N-末端序列相比,没有表现出序列同源性。vip3A(a)杀虫蛋白质的N-末端序列有许多正电荷残基(从Asn2至Asn7),其后有疏水核心区(从THR8至Ile34)。不同于大多数已知的分泌蛋白质,菌株AB88的vip3A(a)杀虫蛋白质在输出时不是N-末端加工。
结果概述如下地老虎VIP N-末端序列 主要δ-内毒素蛋白质的N-末端序列130KDaMDNNPNINE(SEQ IDNO14)80kDa 80kDaMNKNNTKLPTRALP(SEQ ID NO12) MDNNPNINE(SEQID NO12)60kDaMNVLNSGRTTI(SE Q IDNO16)35kDaALSENTGKDGGYIVP(SEQ ID NO13)对玉米螟活性是由于60kDa的VIP,对草地贪夜蛾活性是由于一个未知大小的VIP。
苏云金芽孢杆菌菌株AB88保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21225。
实施例18A.苏云金芽孢杆菌AB428的分离和生物活性定名为AB424的苏云金芽孢杆菌菌株用本领域已知的标准方法从藓类覆盖的松球果样品中分离到的。如实施例2所述培养并制备AB424的继代培养物以用于生物检定。生物活性用实施例3所述的方法评价,结果如下测试的昆虫种类 死亡百分率玉米螟 100小地老虎100玉米根叶甲0菌株AB424保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRLB-21439。
实施例18B.编码小地老虎活性蛋白质的VIP3A(a)和VIP3A(b)基因的克隆分离出分离菌AB88和AB424的总DNA[Ausubel等(1988),分子生物学通用方法(John Wiley&Sons,NY)],用限制性酶Xbal(苏云金芽孢杆菌AB88 DNA的4.0至5.0Kb大小级别的Xbal片段的文库)和EcoRl(苏云金芽孢杆菌AB424的4.5-6.0Kb大小级别的EcoRl片段的文库)分别消化,连结进pBluescript载体,用同样的酶线形化,再去磷酸化,然后转化进大肠杆菌DH5α菌株。重组体克隆印迹进硝酸纤维素滤纸,随后用32P标记的33个碱基长的相对应于对小地老虎活性的80KDa蛋白质N-端的11个氨基酸的寡核苷酸探察。
42℃下在2×SSC/0.1%SDS(1×SSC=0.15M NaCl/0.015M柠檬酸钠,pH7.4)中杂交5分钟,然后在50℃下1×SSC/0.1%SDS中杂交两次10分钟。在400个重组体克隆中有四个是阳性的。阳性重组体的昆虫生物检定表明对小地老虎幼虫有和AB88或AB424上清液类似的毒性。
质粒pCIB7104包含AB88 DNA的一个4.5Kb的Xbal片段。建立亚克隆以限定杀虫蛋白质的编码区。
大肠杆菌pCIB7105通过把pCIB7104的3.5kb Xbal-Accl片段克隆进pBluescript载体来构建。
质粒pCIB7106包含AB424 DNA的一个5.0Kb的EcoRl片段。片段进一步用HincII消化,产生一个2.8kb的EcoRI-HincII插入序列(pCIB7107),它仍能编码有功能的杀虫蛋白质。
pCIB7104、AB88的阳性重组体克隆、pCIB7107以及AB424的阳性重组体克隆的核苷酸序列用Sanger等(美国科学院学报,745463-5467(1977))的双脱氧末端法测定,使用PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI 373自动测序仪上分析。
克隆pCIB7104包含着VIP3A(a)基因,其编码区SEQ ID NO28给出,编码的蛋白质序列SEQ ID NO29给出。设计在玉米中高度表达的编码区的合成物由本SEQ ID NO30给出。基于SEQ ID NO29给出的氨基酸序列可以设计许多合成基因。
克隆pCIB7107包含着VIP3A(b)基因,其编码区在SEQ ID NO31中给出,编码的蛋白质序列在SEQ ID NO32中给出。pCIB7104和pCIB7107都保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号分别为NRRL B-21422和B-21423。
VIP3A(a)基因包含着一个开放读框(ORF),它从核苷酸732伸展至3105。这个ORF编码一个分子量为88,500道尔顿的791个氨基酸的肽链。一个Shine-Dalgarno(SD)序列定位在第一个蛋氨酸之前的6个碱基处,它的序列鉴别为对芽孢杆菌的强的SD。
VIP3A(b)基因98%等同于VIP3A(a)。
分离自苏云金芽孢杆菌AB88细胞的总DNA的blost用一个跨VIP3A杀虫蛋白质的N末端区域的33个碱基的片段探察。单个带可在不同的限制性消化时观察到。这个结果通过使用更大的跨基因编码区的探针证实。GenBank资料库碱基的研究表明它和已知蛋白质无同源性。
实施例18C.VIP3A杀虫蛋白质的表达VIP3A(a)杀虫蛋白质表达的时间过程用Western印迹法分析。得自苏云金芽孢杆菌AB88培养物的样品完全通过生长曲线和孢子形成期。VIP3A(a)杀虫蛋白质在开始培养15小时之后就可在对数生长期的AB88培养物上清液中检测到。它在稳定生长阶段的早期达到最高水平,并在孢子形成期间和此期后仍然保持着较高水平。当使用AB424蜡状芽孢杆菌培养物上清液时获得了类似的结果。如同用Northern印迹测定的结果一样,VIP3A(a)杀虫蛋白质的水平反映了VIP3A(a)基因的表达。孢子形成期的开始通过显微镜直接观察和测定δ-内毒素在细胞团状沉淀中的存在来决定。Cry-I型蛋白质可在稳定期后期、孢子形成期和此期之后检测到。
实施例18D.类似于VIP3的新基因的杂交鉴定为确定得自分离菌AB88的芽孢杆菌包含着与VIP3A有关的基因,通过杂交筛选芽孢杆菌的收集品。463个芽孢杆菌菌株的培养物生长在微滴定孔中直到孢子形成。96-针菌落印模(stampel)用于把培养物转移到包含L-琼脂的150mm平板上。接种板保持在30℃下10小时,再在4℃下过夜。菌落印迹进尼龙滤纸,用1.2Kb HindIII的VIP3A(a)衍生片段探查。使用Maniatis等(分子克隆实验室手册(1982))的杂交条件在62℃下杂交过夜。滤纸用2×SSC/0.1%SDS在62℃下洗涤,并对X-射线底片曝光。
所筛选的463个芽孢杆菌菌株中,有60个菌株包含着可用杂交检测到的类似于VIP3的基因。它们中的一些(AB6和AB426)的特征还表明它们的上清液中包含着BCW杀虫蛋白质,这个蛋白质与对BCW有活性的VIP3蛋白质类似。
实施例18E.包含着一个隐蔽的类似于VIP3的基因的苏云金芽孢杆菌菌株M2194的特性定名为M2194的苏云金芽孢杆菌菌株,通过在实施例18C中所述的菌落杂交表明包含类似于VIP3的基因。与M2194 VIP3类似的基因被认为是隐蔽的,因为在整个细菌生长阶段不管是通过抗从AB88中分离到的VIP3蛋白质的多克隆抗体的免疫印迹分析还是通过在实施例3中所述的生物检定都无法检测到其表达。
抗纯化的VIP3A(a)杀虫蛋白质的抗血清在兔中产生。硝酸纤维素结合的蛋白质(50μg)溶解在DMSO中,用弗氏完全佐剂(Difco)乳化。两只兔皮下注射三个月,每月一次。第二次和第三次注射10天后放血,血清从血样品中制得。[Harlow等,(1988),抗体实验室手册(冷泉港实验室出版社,Plainview,NY)]。
M2194与类似于VIP3的基因通过在实施例9中创造pCIB7108的方法克隆进PKS。包含pCIB7108(它包含M2194 VIP3基因)的大肠杆菌对小地老虎是活性的,证明此基因编码带杀虫活性的有功能的蛋白质。质粒pCIB7108保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号为NRRLB-21438。
实施例18F.VIP3A蛋白质的杀虫活性VIP3A杀虫蛋白质的活性谱在用带VIP*A的重组大肠杆菌饲喂幼虫的昆虫生物检定中定量测定。在这些测定中,携带VIP3A(a)和VIP3A(b)基因的细胞对小地老虎,草地贪夜蛾,甜菜夜蛾,烟芽夜蛾,玉米夜蛾是有杀虫活性的。在同样的实验条件下,包含VIP3A蛋白质的细菌浸提液没表现出任何抗玉米螟的活性。
VIP*A对小地老虎幼虫的效果处理 死亡百分率TB培养基 5AB88上清液 100AB424上清液 100缓冲液 7大肠杆菌pKS 10大肠杆菌pCIB7104(AB88) 100
大肠杆菌pCIB7105(AB88) 100大肠杆菌pCIB7106(AB424) 100大肠杆菌pCIB7107(AB424) 100VIP3A杀虫蛋白质对鳞翅目昆虫幼虫的效果处理昆虫死亡百分率(%)大肠杆菌pKS BCW 10FAW 5BAW 10TBW 8CEW 10ECB 5大肠杆菌pCIB7105大肠杆菌pCIB7107 BCW 100FAW 100BAW 100TBW 100CEW 50ECB 10BCW=小地老虎;FAW=草地贪夜蛾;BAW=甜菜夜蛾;TBW=烟芽夜蛾;CEW=玉米夜蛾;ECB=玉米螟实施例19.芽孢杆菌属其它种的分离和生物活性可把营养生长期间产生杀虫活性蛋白质的其它芽孢杆菌属种类分离出来。这些菌株是用标准方法从环境样品中分离的。制备分离物用于实施例2和实施例3中分别叙述的生物检定和测定。在营养生长期间产生在生物检定中对小地老虎有活性的杀虫蛋白质的分离物列于下表;在δ-内毒素结晶的存在与营养生长期间的杀虫蛋白质的产生之间没有观察到相关关系。
芽孢杆菌属分离菌δ-内毒素结晶的存在死亡百分率AB6 +100AB53 -80AB88 +100AB195-60AB211-70AB217-83AB272-80AB279-70AB289+100AB292+80AB294-100AB300-80AB359-100分离物AB289,AB294和AB359保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21227,NRRL B-821229和NRRL B-21226。
在营养生长期间产生对玉米根叶甲有活性的杀虫蛋白质的芽孢杆菌属分离物如下表。
芽孢杆菌属分离物δ-内毒素结晶的存在死亡百分率
AB52- 50AB59- 71AB68+ 60AB78- 100AB122 - 57AB218 - 64AB256 - 64分离物AB59和AB256保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21228,NRRL B-821230。
实施例20.类似于VIP1/VIP2的新基因的杂交鉴定为鉴别包含与在AB78的VIP1A(a)/VIP2A(a)区发现的基因相关的基因,用杂交筛选芽孢杆菌菌株的收集物。463个芽孢杆菌属菌株的独立培养物生长在96孔微滴定盘的孔中(共五个盘)直到培养物形成孢子。测试的菌株中,基于δ-内毒素结晶的存在或缺乏把288个菌株归类为苏云金芽孢杆菌,175个归类为其它芽孢杆菌属种类。对于每个微滴定盘,使用96-针菌落印模转移大约100μl孢子培养物到两个包含L-琼脂的150mm平板上。接种板在30℃下生长4-8小时,然后冷却到4℃。再把菌落转移到尼龙网上,用本领域已知的方法水解细胞。滤纸与包含VIP1A(a)和VIP2A(a)DNA序列的DNA片段产生的探针杂交。杂交使用Church和Gilbert的杂交条件在65℃下过夜(Church,G.M.,W.Gilbert,美国科学院学报,811991-1995(1984))。滤纸用包含0.1%SDS的2×SSC在65℃下洗涤,并对X-底片曝光。
在供筛选的463个芽孢杆菌属菌株中,鉴定出55个菌株和VIP1A(a)/VIP2A(a)探针杂交。从这些菌株的22个中分离DNA,使用Southern印迹法用VIP1(a)/VIP2A(a)DNA作为探针分析。基于Southern印迹的方式将这些菌株分为8类,每一类都和AB78的Southern印迹的方式不同。其中一类的方式和苏云金芽孢杆菌变种tenebrionis的VIP1(a)/VIP2A(a)同系物的方式相同(见下面)。测定22个菌株每一个对玉米根叶甲(WCRW)的活性。发现AB433,AB434和AB435三个菌株对WCRW有活性。使用VIP2(a)抗血清Western印迹方式表明菌株AB6,AB433,AB434,AB435,AB444和AB445产生的蛋白质大小与VIP2A(a)相当。
在供鉴定的菌株中,最显著的是苏云金芽孢杆菌菌株AB6(NRRL B-21060),如实施例15所述,它产生抗小地老虎(Agrotis ipsilon)的VIP活性,用对VIP2A(a)的多克隆抗血清的Werstern印迹分析表明AB6产生和VIP2A(a)相似的VIP,但是杀虫活性谱不同。
实施例21.得自苏云金芽孢杆菌变种TENEBRIONIS的VIP1(a)/VIP2A(a)同系物的克隆用Southern印迹技术测定几个已经定性的芽孢杆菌菌株是否有与VIP1(a)/VIP2A(a)相似的DNA的存在。并分析芽孢杆菌菌株AB78,AB88,GC91和ATCC10876的DNA是否有与VIP1(a)/VIP2A(a)类似序列的存在。Bt菌株GC91,HD-1和Bc菌株ATCC10876的DNA不和VIP1(a)/VIP2A(a)杂交,表明它们缺乏和VIP1(a)/VIP2A(a)基因类似的序列。相似的,杀虫菌株AB88(实施例16)的DNA不和VIP1(a)/VIP2A(a)的DNA杂交,表明由这个菌株产生的VIP活性不是由VIP1(a)/VIP2A(a)同系物造成的。相对而言,苏云金芽孢杆菌变种tenebrionis(Btt)包含着能和VIP1(a)/VIP2A(a)杂交的序列,进一步的分析证明Btt包含与VIP1(a)/VIP2A(a)类似的序列。
为确定VIP2A(a)和VIP1(a)的Btt同系物的特征,克隆了编码这些蛋白质的基因。Southern印迹分析鉴定出一个9.5kb Eco RI限制型片段。基因组DNA用Eco RI消化,凝胶纯化长度大约为9.5kb的DNA片段。这段DNA连结进用Eco RI消化的pBluescript SK(+)载体,转化进大肠杆菌以产生质粒文库。大约10,000菌落通过菌落杂交筛选VIP2A(a)同源序列的存在,鉴定出28个阳性菌落。所有的28个克隆是一致的,都包含着VIP1A(a)/VIP2A(a)同系物。克隆pCIB7100保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21322。几个亚克隆从pCIB7100构建。一个得自pCIB7100的3.8kb的Xba I片段被克隆进pBluescript SK(+)载体,产生pCIB7101.得自pCIB7100的1.8kb的HindIII片段和一个1.4kb的HindIII片段被克隆pBluescript SK(+)载体,分别产生pCIB7102和pCIB7103。亚克隆pCIB7101,pCIB7102和pCIB7103保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号分别为NRRL B-21323,B21324和B-21325。
包含VIP2A(a)和VIPIA(a)同系物的pCIB7100的DNA序列区用双脱氧末端法测定(Sanger等,1977,美国科学院学报,745463-5467)。反应使用PRISM Readv Reaction Dye双脱氧末端循环测序试剂盒和PRISMSequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。特制的寡核苷酸用作引物测定一定区域的DNA序列,这个区域的DNA序列见SEQID NO19。
SEQ ID NO19中的4kb区域包含两个开放读框(ORFs),它编码与得自菌落AB78的VIPIA(a)和VIP2A(a)高度相似的蛋白质。使用标准命名法定名为VIP2A(b)的VIP2A(a)同系物的氨基酸序列在SEQ IN NO20中。使用标准的命名法定名为VIP1A(b)的VIP1A(a)同系物的氨基酸序列在SEQ INNO21给出。VIP2A(b)蛋白质和得自AB78的VIP2A(a)蛋白质的氨基酸有91%相同。两种VIP2蛋白质的氨基酸序列在表20给出。VIP1A(b)蛋白质和得自AB78的VIP1A(a)的氨基酸有77%相同。两种VIP1蛋白质的氨基酸序列在表21给出。表21所示的序列列表表明VIP1A(b)和得自AB78的VIP1A(a)的相似性。这个列表表明两个VIP1蛋白质在氨基末端比在羧基末端有更高的氨基酸一致性。事实上,两个蛋白质氨基末端2/3(直到表21所示的VIP1A(b)序列的氨基酸618)表现出90%的一致性,而羧基末端的1/3(VIP1A(b)序列的619-833的氨基酸)表现出35%一致性。
Western印迹分析表明;苏云金芽孢杆菌变种tenebrionis(Btt)产生类似于VIP1A(a)蛋白质和类似于VIP2A(a)蛋白质。然而,这些蛋白质没有表现出对玉米根叶甲的活性。生物检定抗玉米根叶甲活性使用Btt的24小时培养物上清液或大肠杆菌克隆pCIB7100(它包含着VIP1A(a)/VIP2A(a)同系物)。在任何一种情况下都没有检测到对玉米根叶甲的活性。
假定Btt和AB78的VIP2蛋白质之间是相似的,测定Btt的VIP2A(b)替代AB78的VIP2A(a)的能力。包含pCIB6206(它产生AB78 VIP1A(a)但不产生VIP2A(a)蛋白质)与Btt培养物上清液混合,并测定这种混合物对玉米根叶甲的活性。Btt培养物上清液和包含pCIB6206细胞都没有对WCRW的活性,Btt和pCIB6206的混合物却产生了对WCRW的高度活性。而且,另外的生物检定表明在大肠杆菌中含有Btt VIP1A(b)/VIP2A(b)基因的Btt克隆pCIB7100与pCIB6206混合时也产生对WCRW的活性。这样,由Btt产生的VIP2A(b)蛋白质是由AB78产生的VIP2A(a)的功能等价物。
这样,通过使用VIP DNA作为杂交探针鉴定新的有杀虫活性的菌株的能力得到了证明。进而,包含类似于VIP1A(a)/VIP2A(a)序列的芽孢杆菌产生已经证明对不同种类害虫有毒性的类似于VIP1A(a)/VIP2A(a)的蛋白质。相似的方法可以鉴别VIP1/VIP2族的许多成员。而且,相似的方法的使用可以鉴别其它种类的VIP的同系物(例如AB88的VIP)。
表20苏云金芽孢杆菌变种tenebrionis的VIP2氨基酸序列(VIP2A(b))与AB78的VIP2氨基酸序列(VIP2A(a))的比较Btt1 MQRMEGKLFVVSKTLQVVTRTVLLSTVYSITLLNNVVIKADQLNINSQSK 50 SEQ ID NO20|.|||||||:|||.|||||:|||||||:||.||||||||:|||||||||AB78 1 MKRMEGKLFMVSKKLQVVTKTVLLSTVFSISLLNNEVIKAEQLNINSQSK 50 SEQ ID NO251 YTNLQNLKIPDNAEDFKEDKGKAKEWGKEKGEEWRPPATEKGEMNNFLDN 100|||||||||.|..|||||||:|||||||||:.||: .|||||.|||||||51 YTNLQNLKITDKVEDFKEDKEKAKEWGKEKEKEWKLTATEKGKMNNFLDN 100101 KNDIKTNYKEITFSMAGSCEDEIKDLEEIDKIFDKANLSSSIITYKNVEP 150|||| ||||||||||||| |||||||.||||:|||.|||.||||||||||101 KNDIXTNYKEITFSMAGSFEDEIKDLKEIDKMFDKTNLSNSIITYKNVEP 150151 ATIGFNKSLTEGNTINSDAMAQFKEQFLGKDMKFDSYLDTHLTAQQVSSK 200.|||||||||||||||||||||||||||::|:||||||||||||||||||151 TTIGENKSLTEGNTINSDAMAQFKEQFLDRDIKFDSYIDTHLTAQQVSSK 200201 KRVILKVTVPSGKGSTTPTKAGVILNNNEYKMLIDNGYVLHVDKVSKVVK 250.||||||||||||||||||||||||||.||||||||||::||||||||||201 ERVILKVTVPSGKGSTTPTKAGVILNNSEYKMLIDNGYMVHVDKVSKVVK 250251 KGMECLQVEGTLKKSLDFKNDINAFAHSWGMKIYEDWAKNLTASQREAID 300||:||||:|||||||||||||||||||||||| ||:|||:||.|||||||251 KGVECLQIEGTLKKSLDFKNDINAEAHSWGMKNYEEWAKDLTDSQREALD 300||||||||||||||||||||||||||||:|||||||||||||||||||||301 GYARQDYKEINNYLRNQGGSGNEKLDAQIKNISDALGKKPIPENITVYRW 350351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400||||||||||||||||||||||||||||||||||||||||||||||||||351 CGMPEEGYQISDPLPSLKDFEEQFINTIKEDKGYMSTSLSSERLAAFGSR 400401 KIILRLQVPKGSTGAYLSAIGGFASEKEILIDKDSKYHIDKATEVIIKGV 450|||||||||||||||||||||||||||||||||||||||||.||||||||401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKVTEVIIKGV 450451 KRYVVDATLLTN 462||||||||||||451 KRYVVDATLLTN 462
表21苏云金芽孢杆菌变种tenebrionis的VIP1氨基酸序列(VIP1A(b))与AB78的VIP1氨基酸序列(VIP1A(a))的比较151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQPQQVQQDELRNPEFNKKE 200198 SQEFLAKASKTNLFKQKMKRDIDEDTDTDGDSIPDLWEENGYTIQNKVAV 247|||||||:||.|||.|||||:|||||||||||||||||||||||||::||201 SQEFLAKPSKINLFTQKMKREIDEDTDTDGDSIPDLWEENGYTIQNRIAV 250248 KWDDSLASKGYTKFVSNPLDSHTVGDPYTDYEKAARDLDLSNAKETFNPL 297|||||||||||||||||||:||||||||||||||||||||||||||||||251 KWDDSLASKGYTKFVSNPLESHTVGDPYTDYEKAARDLDLSNAKETFNPL 300298 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASIEAGGGP 347|||||||||||||||||||||||||||||||||||||||||||:||| ||301 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASVEAGIGP 350348 LGLSFGVSVTYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 397|:||||||.||||||||||||||||||||||||||||||||||||||||351 KGISFGVSVNYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 400Btt 1 MKNMKKKIASVVTCMLLAPMFLNGNVNAVNADSKINQISTTQENQQKEMD 50 SEQ ID NO21|||||||||||||| |||||||||||||| ||||.|||||||.|||||||Ab78 1 MKNMKKLASVVTCTLLAPMFILNGNVNAVYADSKTNQISTTQKNQQKEMD 50 SEQID NO551 RKGLLGYYFKGKDFNNLTMFAPTRDNTLMYDQQTANALLDKKQQEYQSIR 100||||||||||||||.||||||||||.||:||||||| |||||||||||||51 RKGLLGYYFKGKDFSNLTMFAPTRDSTLIYDQQTANKLLDKKQQEYQSIR 100101 WIGLIQRKETGDFTFNLSKDEQAIIEIDGKIISNKGKEKQVVHLEKEKLV 150||||||.|||||||||||.||||||||:||||||||||||||||||:|||101 WIGLIQSKETGDFTFNLSEDEQAIIEINGKIISNKGKEKQVVHLEKGKLV 150151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQSQQVQ...LRNPEFNKKE 197||||||||||||||||||||||||||||||||.|||| ||||||||||398 GAIYDVKPTTSFVLNMNTIATITAKSNSTALRISPGDSYPEIGENAIAIT 447||||||||||||||||:||||||||||||||.||||:|||.|:|:||||401 GAIYDVKPTTSFVLNNDTIATITAKSNSTALNISPGESYPKKGQNGIAIT 450448 SMDDFNSHPITLNKQQVNQLINNKPIMLETDQTDGVYKIRDTHGNIVTGG 497||||||||||||||.||:.|:||||:||||:||||||||:||||||||||451 SMDDFNSHPITLNKKQVDNLLNNKPMMLETNQTDGVYKIKDTHGNIVTGG 500498 EWNGVTQQIKAKTASIIVDDGKQVAEKRVAAKDYGHPEDKTPPLTLKDTL 547|||||.|||||||||||||||..|||||||||||::||||||.|||||.|501 EWNGVIQQIKAKTASIIVDDGERVAEKRVAAKDYENPEDKTPSLTLKDAL 550548 KLSYPDEIKETNGLLYYDDKPIYESSVMTYLDENTAKEVKKQINDTTGKF 597||||||||||.:|||||.:||||||||||||||||||||.||:|||||||551 KLSYPDEIKEIEGLLYYKNKPIYESSVMTYLDENTAKEVTKQLNDTTGKF 600
实施例22.VIP蛋白质融合形成单一多肽VIP蛋白质以单一多肽或以两个或更多相互作用的多肽存在于自然界。当活性VIP由两个或更多相互作用的蛋白质链组成时,这些蛋白质链可以以单个多肽链从两个(或多个)VIP编码区融合形成的基因中产生。编码两个链的基因通过基因的编码区合并而融合,产生编码两个VIP多肽的单个开放读框。组合物多肽可以如融合产生如融合蛋白氨基末端的更小的多肽。或者它们可以可以被融合产生象融合蛋白氨基末端的更大的多肽。在两个多肽结构域之间,可以任意使用接头。这些接头在本领域是已知的。此接头可被任意设计成包含蛋白质酶裂解位点的接头,以便只要单融合多肽被靶昆虫摄入,它就能在接头区域裂解,释放活性VIP分子的两个多肽组分。
蜡状芽孢杆菌菌株AB78的VIP1A(a)和VIP2A(a)通过编码区融合形成单多肽。产生的DNA包含SEQ ID NO22给出的序列,它编码的蛋白质的序列在SEQ ID NO23给出。以相似的方式,也可以产生其它融合蛋白。
编码VIP1A(a)和VIP2A(a)的基因融合通过使用分子生物学的标准方法完成。在VIP1A(a)和VIP2A(a)编码区之间,要缺失的核苷酸通过已知的诱变技术缺失,或者替代地使用PCR技术融合的编码区。
融合的VIP多肽可以使用被优化以利于在其它宿主中表达的合成基因或部分合成基因在其它有机体内表达。例如,为在玉米中表达上述的融合VIP多肽,人们使用玉米每一氨基酸的优化密码子制作了合成基因,参见,例如,EP-A 0618976,本文一并参考。根据这种方法创造的DNA序列在SEQ IDNO17(100kDa VIP1A(a)编码序列的玉米优化体),SEQ ID NO18(80kDa VIP1A(a)编码序列的玉米优化体)和SEQ ID NO24(VIP2A(a)编码序列的玉米优化体)中给出。
优化以适于在玉米中表达的合成VIP1和VIP2基因可以使用PCR技术或通过在一个共用限制位点融合以设计成合成基因。另外,也可以把合成的基因设计成编码包含VIP1和VIP2结构域的单一多肽的基因。
在融合蛋白的VIP1和VIP2结构域之间加入一个多肽接头可以通过PCR诱变、使用编码接头肽的合成DNA接头或其它本领域已知的方法实现。
融合的VIP多肽可由一个或多个结合结构域组成。如果在融合中使用超过一个的结合结构域,可用这样一个融合蛋白来控制多个靶害虫。其它的结合结构域可以通过使用其它VIP的全部或部分、苏云金芽孢杆菌内毒素或它的一部分、其它能够和靶害虫结合的蛋白质或从这些结合蛋白质中衍生的适当的结合结构域中获得。
pCIB5531提供了一个融合结构体的例子,它包含编码一个VIP2A(a)在N-末端、VIP1A(a)在C-末端的单多肽融合物的玉米最优化DNA序列。在两个编码区之间插入编码带有肽序列PSTPPTPSPSTPPTPS(SEQ ID NO47)的接头的DNA序列。编码这个接头的序列和相关的克隆位点是5′-CCCGGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCTCCG ACA CCT AGC GAT ATC GGA TCC-3′(SEQ ID NO48)。在使用标准方法杂交和磷酸化之后,合成代表上链和下链(upper strand and lowerstrang)的寡核苷酸并把它克隆进pUC载体。使用PCR除去VIP2A(a)中的终止密码子并用带一个Smal位点的BgIII限制位点取代。通过把pCIB5522(参见实施例24)的VIP2A(a)基因的BamHI/Pstl片段、一个包含VIP2A(a)基因(和构建pCIB5522使用的基因相同)的Pstl-末端的PCR片段、一个末端能和5′末端平端位点并在3′末端有BamHI的合成接头以及下面叙述的PCIB5526修饰的合成VIP1A(a)基因(参见SEQ ID NO35)连接起来,可以形成一个翻译融合蛋白。融合蛋白通过上述四个序列连接,形成一个质粒,它包含着没有翻译终止密码子的VIP2基因、接头和没有芽孢杆菌分泌信号的VIP1A(a)编码区。这个构建体的DNA序列在SEQ ID NO49给出,它编码的融合蛋白在SEQ ID NO50给出。VIP1A(a)在N-末端和VIP2A(a)在C-末端的单多肽融合蛋白可以用相似的方式得到。而且,一个或两个基因都可连接进在5′或3′端有(或无)和其它分子(如毒素编码基因或报道基因)的接头的翻译融合物。
实施例23.VIP2对植物细胞器的定位已知在植物中存在着几种定位基因产物的机制。控制这些机制功能的序列在某些细节上已确定特征。例如,基因产物定位到叶绿体由一个在各种蛋白质的氨基末端发现的信号序列控制。这个信号在叶绿体输入过程中裂解,产生成熟的蛋白质。(e.g.Comai等,生物化学杂志,26315104-15109(1988))。这些信号序列可被融合到异源基因产物如VIP2使这些产物输入叶绿体(van den Broeck等,自然313358-363(1985))。编码适当的信号序列DNA可从编码RUBISCO蛋白质、CAB蛋白质、EPSP合成酶、GS2蛋白质以及许多已知定位于叶绿体的其它蛋白质的cDNA的5′端分离到。
其它基因产物定位到其它细胞器如线粒体和过氧化物酶体中(e.g.Unger等,植物分子生物学,13411-418(1989))。编码这些产物的cDNA也能被操纵使异源基因产物如VIP2定位到这些细胞器上。这样的序列的例子是核编码的ATP酶和线粒体特异性天冬氨酸氨基转移酶的同工型。相似地,对细胞的蛋白质体的定位由Rogers等描述(美国科学院学报,826512-6516(1985))。
通过上面叙述的适当的导向序列融合成兴趣编码序列(如VIP2),有可能把转基因产物定位到任何细胞器或细胞区室。例如,对于叶绿体定位,得自RUBISCO基因、CAB基因、EPSP合成酶基因、GS2基因的叶绿体信号序列可以符合读框地融合到转移基因的氨基末端ATG上。选择的信号序列应该包含已知的裂解位点,构建的融合体应该考虑裂解所需的裂解位点之后的任何氨基酸。在某些情况下,可以通过在裂解位点和起始密码子ATG之间加入少数氨基酸,或者取代编码序列内的一些氨基酸以满足这个需要。为叶绿体输入构建的融合体可以通过离体转录的结构的离体翻译再加上使用Bartlett等(Edelmann等(Eds.),叶绿体分子生物学方法,Elsevier.pp1081-1091(1982);Wasmann等,分子基因遗传学,205446-453(1986))叙述的技术进行离体叶绿体吸收来测定叶绿体的吸收效率。这些构建技术在本领域是熟知的,同样地适用于线粒体和过氧化物酶体。
上面所述的细胞定位机制不仅可以用于与它们的关联启动子连接,而且可以用于与异源启动子连接以影响在启动子转录调节下的特异细胞定位目标。这个启动子的表达方式不同于定位信号衍生的启动子。
编码分泌信号的DNA序列存在于天然的芽孢杆菌VIP2基因中。这个信号不存在于N-末端序列为LKITDKVEDF(SEQ ID NO2的57至66氨基酸残基)的成熟蛋白质中。使用基因工程的方法使VIP2分泌出植物细胞或定位到亚细胞结构的细胞器上如内质网、液泡、线粒体或包含叶绿体的质体上是可能的。由分泌信号肽融合到标志基因上形成的杂种蛋白质成功地定位进分泌途径(Itirriaga G.等,植物细胞,1381-390(1989),Denecke等,植物细胞,251-59(1990))。鉴别出氨基末端序列负责对内质网,质外体和糊粉层细的胞外分泌定位(Koehler&Ho,植物细胞,2769-783(1990))。
蛋白质保留在内质网或是液泡中需要另外的信号存在。在蛋白质的羧基末端的肽序列KDEL/HDEL对于蛋白质保留在内质网中是必须的(由Pelham综述,细胞生物学年评,51-23(1989)。使蛋白质保留在液泡中的信号也已经确定其特征。液泡定位信号可能存在于氨基末端部分(Holwerda等,植物细胞,4307-318(1992),Nakamura等,植物生理,1011-5(1993)),羧基末端部分或存在于定位蛋白质的内部序列中(Tague等,植物细胞,4307-318(1992),Saalbach等,植物细胞,3695-708(1991))。另外,氨基末端序列和羧基末端序列结合负责基因产物的液泡定位(Shinshi等,植物分子生物学,14357-368(1990))。相似地,使用特异性的羧基末端信号肽融合蛋白也可把蛋白质定位到线粒体或质体上(Heijne等,欧洲生物化学杂志,180535-545(1989),Archer和Keegstra,植物分子生物学,231105-1115(1993))。
为了把VIP2定位到分泌或不同的亚细胞结构的细胞器上,编码已知信号肽的玉米优化DNA序列按需要设计到基因的5′或3′端。为把VIP2分泌出细胞,PCT申请号IB95/00497的真核分泌信号肽MGWSWIFLFLLSGAAGVHCL(SEQ ID NO25)或任何其他在文献中记载(Itirriaga等,植物细胞,1381-390(1989);Denecke等,植物细胞,251-59(1990))的DNA序列都可以加到完整的VIP2基因序列的5′端或者构建的编码成熟蛋白质的序列上或者构建核苷酸286的基因上或编码从氨基酸残基94(蛋氨酸)开始的蛋白质的基因上。为使VIP2保留在内质网内,可把编码内质网信号肽KDEL/HDEL的DNA序列和分泌信号加到基因的3′端。要定位到液泡,可把编码信号肽SSSSFADSNPIRVTDRAAST(SEQ ID NO3;Holwerda等,植物细胞,4307-318(1992))的DNA序列设计得和分泌信号或编码Dombrowski等(植物细胞,5587-596(1993))所述的羧基信号肽的序列相邻或者在基因的3′端插入功能性的变异。相似地,通过在叙述的编码所需定位信号的VIP2序列中插入一个序列,VIP2可被设计定位到线粒体或包含叶绿体的质体中。存在于VIP2中的细菌分泌信号可以保留或从最终的构建体中除去。
pCIB5528是一个掺入真核分泌信号的构建体与VIP编码序列融合的例子。合成相对应于编码SEQ ID NO25中的分泌信号肽的上链和下链的寡核苷酸,其序列为5′-GGATCCACC ATG GGC TGG AGC TGG ATCTTC CTG TTC CTG CTG AGC GGC GCC GCG GGC GTG CAC TGCCTGCAG-3′(SEQ ID NO41)。杂交时,分泌信号的5′端与对应于限制位点BamHI和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸化并连接进pCIB5527中(在实施例23A中叙述的构建体),后者再根据标准方法用BamHI/Pstl消化。产生的玉米优化编码序列SEQ ID NO42给出,它编码SEQ ID NO43给出的蛋白质。这个被编码的蛋白质在芽孢杆菌分泌信号的地方包含着真核分泌信号。
pCIB5533是一个掺入液泡分泌信号的构建体与VIP编码序列融合的例子。合成相对应于编码SEQ ID NO3中的分泌信号肽的上链和下链的寡核苷酸,其序列为5′-CCG CGG GCG TGC ACT GCC TCA GCA GCAGCA GCT TCG CCG ACA GCA ACC CCA TCC GCG TGA CCG ACGGCG CCG CCA GCA CCC TGC AG-3′(SEQ ID NO44)。杂交时,液泡定位信号的5′端与对应于限制位点SacII和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸化并连接进pCIB5588中(上面所述的构建体),后者再根据标准方法用SacII/Pstl消化。产生的玉米优化编码序列SEQ IDNO45给出,它编码SEQ ID NO46给出的蛋白质。这个被编码的蛋白质除真核分泌信号之外还包含液泡定位肽。
也可以用相似的方法,设计VIP1基因使其分泌、定位到亚细胞细胞器上。
实施例23A.从VIP1A(a)和VIP2A(a)中除去芽孢杆菌分泌信号VIP1A(a)和VIP2A(a)在菌株AB78的生长期间分泌。作为分泌信号的肽链特征在文献中已有叙述(Simonen和Palva,微生物综述,pg.109-137(1993))。根据上面出版物的信息,在两个基因中鉴别了推定的分泌信号。在VIP1A(a)中这个信号由氨基酸1-33组成(参见SEQ ID NO5)。分泌信号的加工可能发生在第33个氨基酸丝氨酸之后。VIP2A(a)的分泌信号鉴别为氨基酸1-49(参见SEQ ID NO2)。分泌的成熟VIP2A(a)蛋白质的N-末端肽链分析表明N-末端序列为LKITDKVEDFKEDK。在SEQ ID NO2中发现这个序列从氨基酸57开始。通过除去芽孢杆菌分泌信号修饰编码这些蛋白质的基因,构建成玉米优化VIP1A(a)编码区域,它把编码开始33个氨基酸的序列(即分泌信号)从5′端除去。这种修饰通过PCR使用一个引物达到,此引物包含着能与玉米优化基因(SEQ ID NO26)在核苷酸位置100杂交的序列5′-GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC-3′(SEQ IDNO33),并加上一个BamHI限制位点和一个包含起始密码子的翻译起始位点共用序列。包含着序列5′-AAG CTT CAG CTC CTT G-3′(SEQ IDNO34)的反向引物在互补链的位置507处杂交,得到一个在5′端包含着限制位点BamHI和在3′端包含着HindIII位点的527bp的扩增产物。扩增产物被克隆进T-载体(在下面的实施例24中叙述)并测序以保证DNA序列正确。然后,通过限制性消化获得BamHI/HindIII片段,并用于取代克隆进根优选的启动子盒中的玉米最优化VIP1A(a)基因的BamHI/HindIII片段。获得的构建体定名为pCIB5526。为除去芽孢杆菌分泌信号的VIP1A(a)编码的玉米优化编码区在SEQ ID NO35给出,它编码的蛋白质在SEQ ID NO36给出。
编码加工形式的VIP2A(a)的基因(即分泌信号被除去)的编码区通过和上面用于构建加工形式的VIPIA(a)相类似的方法构建。修饰通过PCR使用正引物5′-GGA TCC ACC ATG CTG CAG AAC CTG AAG ATC AC-3′(SEQ ID NO37)达到。此引物与玉米优化的VIP2A(a)基因(SEQ ID NO27)的核苷酸位置150处杂交。一个不活动的突变插入此引物的核苷酸位置15,获得一个Pstl限制性位点。反向引物序列为5′-AAG CTT CCA CTC CTTCTC-3′(SEQ ID NO38)。用在3′端的限制性位点获得一个259bp产物。此扩增产物被克隆进T-载体,测序并连接进BamHI/HindIII消化的包含玉米优化的VIP2A(a)的根优选的启动子盒中。获得的构建体定名pCIB5527。为VIP2A(a)编码的除去分泌信号的玉米优化编码区在SEQ ID NO39给出,它编码的蛋白质在SEQ ID NO40给出。
实施例24.VIP1A(a)和VIP2A(a)玉米优化基因的构建和克隆设计玉米优化基因通过天然的VIP1A(a)和VIP2A(a)蛋白质序列使用在玉米中最常用的密码逆翻译得到(Murray等,核酸研究,17477-498(1989))。为了易于克隆,DNA序列被进一步修饰,每间隔200-360个核苷酸掺入单一限制位点。使VIP1A(a)克隆进11个这样的片段,VIP2A(a)克隆进5个片段。在几个片段的克隆后,使用两个片段共同的限制性位点连接相邻的片段,得到完整的基因。为克隆每一片段,寡核苷酸(50-85个核苷酸)设计成对应于DNA的上链和下链。第一个寡核苷酸对(oligo pair)上部寡核苷酸被设计成在3′末端包含15bp的单链区,它和指导定位的下一个寡核苷酸对下链相似的单链区(此区指导给定片段的各种寡核苷酸对的定位和序列)。也可设计寡核苷酸使之与所有代表片段的寡核苷酸杂交时末端有相对应于特定限制位点的单链区形成。检测每一寡核苷酸的结构是否有稳定的二级结构,如使用NBI公司的OLIGO方法形成的发夹环。如果需要,可以改变核苷酸,以降低二级结构的稳定性。同时并不改变蛋白质的氨基酸顺序。把一个植物核糖体结合位点共用序列TAAACAATG(Joshi等,核酸研究,156643-6653(1987))或真核生物核糖体结合位点共用序列CCACCATG(Kozak,核酸研究,12857-872(1984))插入基因翻译起始密码子。
克隆由IDT Inc.合成的寡核苷酸作为冻干的粉剂使用。寡核苷酸以200μM的浓度重新悬浮。每30μl的寡核苷酸加入甲酰胺使其最终浓度为25-50%,样品煮沸2分钟,然后在Novex的premade 10%聚丙烯酰胺/尿素凝胶上分离,电泳后,把凝胶放在包含荧光指示剂的TLC板上,用UV光照射,寡核苷酸通过UV投影可以检测到。切下包含正确大小DNA的区域,通过绞碎的凝胶片在包含0.4M LiCl,0.1mM EDTA的缓冲液中过夜温育以从聚丙烯酰胺中提取DNA。离心通过微孔UFMC滤膜把DNA从凝胶残余物中分离出来。提取的DNA通过加入2倍体积的无水酒精沉淀。离心后,沉淀以2.5μM的浓度重新悬浮在dH2O中。片段或是通过寡核苷酸杂交并与适当的载体连接,或是通过使用以一个特定片段作为模板的所有寡核苷酸和末端特异性PCR引物的等摩尔的混合物的杂交片段的扩增来克隆。
通过杂交和连接克隆同源的双链寡核苷酸对通过混合5μl的上链和5μl的下链(对每一寡核苷酸对加入包含1×多核苷酸激酶(PNK)的缓冲液(70mMTris-HCl(pH值为7.6),10mM MgCl2,5mM二硫苏糖醇(DTT),50mMKCl和5%甲酰胺,最终体积为50μl的缓冲液))得到。寡核苷酸煮沸l0分钟,缓慢冷却到37℃或室温。移去10μl用于在TAE缓冲系统(Metaphorer;FMC)中的4%琼脂糖上分析。每一杂交的寡核苷酸对都通过加入最终浓度为1mM的ATP、最终浓度为100μg/ml的BSA、200单位的多核苷酸激酶以及10×PNK缓冲液(总体积为10μl)活化。杂交和磷酸化之后,反应在37℃下温育2小时到过夜。加入对某一特定片段的片段的寡核苷酸对10μl混合,最终体积为50μl。寡核苷酸对在80℃下加热10分钟杂交,缓慢冷却到37℃。2μl的寡核苷酸用大约100ng的载体混合,使用含50mMTris-HCl(pH7.8),10mM MgCl2,10mM二硫苏糖醇,1mM ATP的缓冲液连接。按照标准方法,反应在室温下温育2小时或过夜,再转化进大肠杆菌DH5a菌株,平铺到含浓度为100μg/ml的氨苄青霉素的L-平板上,进一步确定阳性克隆的特征。并通过在EP 0618976中详细描述的使用通用引物“Reverse”和M13“-20”作为引物的PCR筛选证实。阳性克隆通过用适当的酶消化DNA再加上DNA测序鉴别。选择带有期望的DNA序列的重组体备用。
PCR扩增和克隆进T-载体PCR扩增通过使用所有低聚体的混合物进行。其中混合物表示特定片段的上链和下链(每一个最终的浓度为5mM)作为模板,特定片段的特异性末端引物(最终浓度为2μM)dATP,dPTP,dCTP和dGTP各200μM 10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.01%明胶以及5单位的聚合酶,最终体积为50μl。扩增反应在Perkin Elmer热循环器9600中通过95℃下温育1分钟(一个周期)、90℃下温育20个周期(每个周期45sec.)、50℃下45sec.、72℃下30sec.进行。最后在72℃下温育5分钟,再分析产物。10μl的反应液用于在TAE缓冲系统中的2.5%Nusieve(FMC)琼脂糖凝胶上分析。正确大小的片段通过凝胶纯化,并被克隆进PCR克隆载体或T-载体。T-载体构建体由Marchuk等叙述(核酸研究,191154(1991))。pBluescriptsk+载体(Stratagener,Ca.)用作亲本载体。正确克隆的转化和鉴别按上述的方法进行。
VIP1A(a)的片段1,3,4,5,6,8和9以及VIP2A(a)的片段2和4通过PCR扩增产物的克隆获得;但是,VIP1A(a)的片段2,7,10和11以及VIP2A(a)的片段1,3和5通过杂交/连接获得。
一旦获得带有期望序列的片段,可以通过把相邻的片段克隆到一起装配成完整的基因。对完整的基因重新测序并测定其在转移进包含根优化启动子的植物表达载体(发表在美国专利申请序列No.08 017,209,此处被参考文献收编)和水稻肌动蛋白质启动子之前对WCRW的活性。
pCIB5521是这样一个植物表达载体。玉米优化的VIP1A(a)编码区(SEQID NO26)克隆进一个植物表达载体。这个载体在带有PEP羧化酶内含子#9的基因的5′端包含根优选的启动子,在3′端有35S终止子。质粒也包含质粒pUC19抗氨苄青霉素的序列。另一个植物表达载体是pCIB5522,它包含玉米优化的VIP2A(a)编码区(SEQ ID NO27)和基因5′端的根优选启动子融合的产物,此基因有PEP羧化酶内含子#9和其后3′端的35S终止子。
实施例25.NAD亲合层析基于VIP2对低物NAD的亲合性可以使用一种纯化方法。在实施例4中描述的用pH3.5的柠檬酸钠缓冲液处理的上清液透析进pH为7.5的20mMTRIS中,过夜。在中性化的上清液中加入相等体积的洗涤NAD琼脂糖并在4℃下轻微振荡温育过夜。树脂和蛋白质溶液加入到一次性10ml的一次性聚丙烯层析柱中,使蛋白质溶液流出。层析柱用5倍于柱体积的pH7.5的20mMTRIS冲洗,然后用2-5倍柱体积的pH7.5的20mM TRIS、100mM NaCl冲洗,接着再用2-5倍柱体积的的pH7.5的20mM TRIS冲洗。最后VIP蛋白质用pH为7.5的20mM TRIS加上5mM NAD洗脱。大约收集到3倍于柱体积的流出液,在Centricon-10中浓缩。典型的产量是每毫升树脂大约7-15μg蛋白质。
当纯化的蛋白质通过SDS-PAGE以及其后的银染分析时,可见的有两条多肽带,一个分子量大约为80,000,另一个分子量大约为45,000。测序表明分子量为80,000的蛋白质对应于蛋白质水解处理的VIP1A(a)的加工形式,分子量为45,000的蛋白质对应于蛋白质水解处理的VIP2A(a)的加工形式。VIP1A(a)和VIP2A(a)的共纯化表明两种蛋白质可能形成一个复合物并有蛋白质-蛋白质相互作用区域。以这种方式纯化的VIP1A(a)和VIP2A(a)对玉米根叶甲是生物活性的。
实施例26.1玉米优化的VIP1A(a)和VIP2A(a)的表达包含着不同的含有VIP基因的质粒的大肠杆菌菌株用于分析VIP的表达。带有单个质粒的大肠杆菌菌株在L-肉汤中生长过夜并表达从上面实施例3所述的培养物中提取的蛋白质。蛋白质表达使用抗体通过western印迹分析并用本领域已知的类似于在上面实施例12中所述的标准方法展开。同样,表达的蛋白质对玉米根叶甲的杀虫活性根据上面实施例3中所述的方法测定。大肠杆菌表达测定结果叙述如下大肠杆菌中VIP的表达含有所需质粒的 测定No.1 测定No.2 检测到蛋白质大肠杆菌提取物 死亡百分率对照00 无pCIB5521(玉米优化 47 27 有的VIP1A(a))pCIB5522(玉米优化 77 有的VIP2A(a))pCIB6024(天然VIP2A(a)) 13 13 有pCIB6206(天然VIP1A(a)) 27 40 有pCIB5521+pCIB5522结合 87 47的提取液pCIB5521+pCIB6024结合 93 100的提取液pCIB5522+pCIB6206结合 100 100的提取液
pCIB6024+pCIB6206结合 100 100的提取液这些质粒的DNA用于在玉米原生质体表达系统中过渡性地表达VIP。原生质体从玉米2717第6系培养物通过使用纤维素酶RS和解析酶R10消化细胞壁分离得到。原生质体通过过筛和离心回收。原生质体使用大约75g质粒DNA和PEG-40用标准的直接转基因法转化。处理的原生质体在室温下黑暗中培养过夜。VIP表达的分析通过在原生质外植体上Western印迹分析和通过如上所述的在大肠杆菌中表达的方法进行对玉米根叶甲杀虫活性的分析来完成。玉米原生质体表达测定的结果如下VIP在植物原生质体中的表达测定的提取液测定No.1 测定No.2 检测到蛋白质死亡百分率(%)无DNA对照 27 10 无pCIB5521(p)(玉米 20(0) 30 有优化的VIP1A(a))pCIB5522(p)(玉米 20(0) 20 有优化的VIP2A(a))pCIB552 1(p)+pCIB5522(p)87(82) 90结合的提取物pCIB552 1(p)+pCIB5522(e)100-结合提取物pCIB5522(p)+pCIB5521(e)53(56) -结合提取物
pCIB5521(p)+pCIB6024(e) 100 -结合提取物pCIB5522(p)+pCIB6206(e) 100 -结合提取物pCIB6024(e)(天然VIP2A(a)) 0 - 有pCIB6206(e)(天然VIP1A(a)) 20 - 有pCIB5521+pCIB5522(通过转 100100 有化传送的质粒)(p)=用所需的质粒转化的原生质体培养物的提取物(e)=包含所需质粒的大肠杆菌的提取物用玉米和大肠杆菌所获得的表达数据表明玉米优化的VIP1A(a)和VIP2A(a)基因分别与天然VIP1A(a)和VIP2A(a)基因编码相同的蛋白质。而且,由玉米优化基因编码的蛋白质和天然基因编码的蛋白质是功能等价物。
在本说明书中提到的所有出版物和专利应用表明了与本发明有关适合的本领域技术人员的水平。本文一并参考的所有出版物和专利申请与特别或单独指出的本文一并参考的单个出版物或专利申请在相同程度上被参考。
下列寄存物保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号)菌株定名 保存号 保存日期1.大肠杆菌PL2 NRRL B-21221 1994.3.92.大肠杆菌PL2 NRRL B-21221N1994.9.23.大肠杆菌pCIB6022 NRRL B-21222 1994.3.94.大肠杆菌pCIB6023 NRRL B-21223 1994.3.95.大肠杆菌pC186023 NRRL B-21223N1994.9.2
6.苏云金芽孢杆菌HD73-78VIPNRRL B-212241994.3.97.苏云金芽孢杆菌AB88 NRRL B-212251994.3.98.苏云金芽孢杆菌AB359 NRRL B-212261994.3.99.苏云金芽孢杆菌AB289 NRRL B-212271994.3.910.芽孢杆菌属一个种AB59 NRRL B-212281994.3.911.芽孢杆菌属一个种AB294 NRRL B-212291994.3.912.芽孢杆菌属一个种AB256 NRRL B-212301994.3.913.大肠杆菌P5-4 NRRL B-210591993.3.1814.大肠杆菌P3-12 NRRL B-210611993.3.1815.蜡状芽孢杆菌AB78 NRRL B-210581993.3.1816.苏云金芽孢杆菌AB6 NRRL B-210601993.3.1817.大肠杆菌pCIB6202 NRRL B-213211994.9.218.大肠杆菌pCIB7100 NRRL B-213221994.9.219.大肠杆菌pCIB7101 NRRL B-213231994.9.220.大肠杆菌pCIB7102 NRRL B-213241994.9.221.大肠杆菌pCIB7103 NRRL B-213251994.9.222.大肠杆菌pCIB7104 NRRL B-214221995.3.2423.大肠杆菌pCIB7107 NRRL B-214231995.3.2424.大肠杆菌pCIB7108 NRRL B-214381995.5.525.苏云金芽孢杆菌AB424NRRL B-214391995.5.5尽管为了清楚理解前面通过说明和实施例详细描述了本发明,很明显在所附的权利要求书的范围内一定的改变和修正是可实施的。
序列表(1)一般信息(A)姓名 CIBA-GEIGY AG(B)街道 Klybeckstr.141(C)城市 巴塞尔(E)国家 瑞士(F)邮区代码(ZIP)4002(G)电话 +41 61 69 1111(H)传真 +41 61 696 79 76(I)电传 962 991(ii)发明名称 新杀虫蛋白质和菌株(iii)序列数 52个(iv)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,版本#1.30B(2)SEQ ID NO1信息(i)序列特征(A)长度6049个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(vi)原始来源(A)有机体蜡状芽孢杆菌(B)菌株AB78
(C)单独的分离物NRRL B-21058(ix)特征(A)名称/关键词CDS(B)位置1082..2467(D)其它信息/产物=“VIP2A(a)”(ix)特征(A)名称/关键词misc_特征(B)位置2475..5126(D)其它信息/注=“100kd VIP1A(a)蛋白质的编码序列。该编码序列在SEQ ID NO4中重复并单独翻译”(xi)序列描述SEQ ID NO1ATCGATACAA TGTTGTTTTA CTTAGACCGG TAGTCTCTGT AATTTGTTTA ATGCTATATT 60CTTTACTTTG ATACATTTTA ATAGCCATTT CAACCTTATC AGTATGTTTT TGTGGTCTTC 120CTCCTTTTTT TCCACGAGCT CTAGCTGCGT TTAATCCTGT TTTGGTACGT TCGCTAATAA 180TATCTCTTTC TAATTCTGCA ATACTTGCCA TCATTCGAAA GAAGAATTTC CCCATAGCAT 240TAGAGGTATC AATGTTGTCA TGAATAGAAA TAAAATCTAC ACCTAGCTCT TTGAATTTTT 300CACTTAACTC AATTAGGTGT TTTGTAGAGC GAGAAATTCG ATCAAGTTTG TAAACAACTA 360TCTTATCGCC TTTACGTAAT ACTTTTAGCA ACTCTTCGAG TTGAGGGCGC TCTTTTTTTA 420TTCCTGTTAT TTTCTCCTGA TATAGCCTTT CTACACCATA TTGTTGCAAA GCATCTATTT 480GCATATCGAG ATTTTGTTCT TCTGTGCTGA CACGAGCATA ACCAAAAATC AAATTGGTTT 540CACTTCCTAT CTAAATATAT CTATTAAAAT AGCACCAAAA ACCTTATTAA ATTAAAATAA 600GGAACTTTGT TTTTGGATAT GGATTTTGGT ACTCAATATG GATGAGTTTT TAACGCTTTT 660GTTAAAAAAC AAACAAGTGC CATAAACGGT CGTTTTTGGG ATGACATAAT AAATAATCTG 720TTTGATTAAC CTAACCTTGT ATCCTTACAG CCCAGTTTTA TTTGTACTTC AACTGACTGA 780ATATGAAAAC AACATGAAGG TTTCATAAAA TTTATATATT TTCCATAACG GATCCTCTAT 840CTTTAGGTTA TAGTTAAATT ATAAGAAAAA AACAAACGGA GGGAGTGAAA AAAAGCATCT 900TCTCTATAAT TTTACAGGCT CTTTAATAAG AAGGGGGGAG ATTAGATAAT AAATATGAAT 960ATCTATCTAT AATTGTTTGC TTCTACAATA ACTTATCTAA CTTTCATATA CAACAACAAA 1020ACAGACTAAA TCCAGATTGT ATATTCATTT TCAGTTGTTC CTTTATAAAA TAATTTCATA 1080A ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA 1126Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu1 5 10 15CAA GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT 1174Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser20 25 30TTA TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT 1222Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser35 40 45CAA AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA 1270Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val50 55 60GAG GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA 1318Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu65 70 75AAA GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT 1366Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn80 85 90 95AAT TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT 1414Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile100 105 110ACT TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA 1462Thr Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys115 120 125GAA ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC 1510Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile130 135 140ACC TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA 1558Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu145 150 155ACA GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA 1606Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu160 165 170 175CAA TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT 1654Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His180 185 190TTA ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT 1702Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val195 200 205ACG GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC 1750Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val210 215 220ATT TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG 1798Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met225 230 235GTC CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC 1846Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys240 245 250 255TTA CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT 1894Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp260 265 270ATA AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG 1942Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp275 280 285GCT AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT 1990Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala290 295 300AGG CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA 2038Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly305 310 315AGT GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT 2086Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala320 325 330 335TTA GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT 2134Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys340 345 350GGC ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA 2182Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu355 360 365AAA GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA 2230Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly370 375 380TAT ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT 2278Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser385 390 395AGA AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG 2326Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala400 405 410 415TAT TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT 2374Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu420 425 430GAT AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT 2422Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile435 440 445AAA GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 2467Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn450 455 460TAAGGAGATG AAAAATATGA AGAAAAAGTT AGCAAGTGTT GTAACGTGTA CGTTATTAGC2527TCCTATGTTT TTGAATGGAA ATGTGAATGC TGTTTACGCA GACAGCAAAA CAAATCAAAT2587TTCTACAACA CAGAAAAATC AACAGAAAGA GATGGACCGA AAAGGATTAC TTGGGTATTA2647TTTCAAAGGA AAAGATTTTA GTAATCTTAC TATGTTTGCA CCGACACGTG ATAGTACTCT2707TATTTATGAT CAACAAACAG CAAATAAACT ATTAGATAAA AAACAACAAG AATATCAGTC2767TATTCGTTGG ATTGGTTTGA TTCAGAGTAA AGAAACGGGA GATTTCACAT TTAACTTATC2827TGAGGATGAA CAGGCAATTA TAGAAATCAA TGGGAAAATT ATTTCTAATA AAGGGAAAGA2887AAAGCAAGTT GTCCATTTAG AAAAAGGAAA ATTAGTTCCA ATCAAAATAG AGTATCAATC2947AGATACAAAA TTTAATATTG ACAGTAAAAC ATTTAAAGAA CTTAAATTAT TTAAAATAGA3007TAGTCAAAAC CAACCCCAGC AAGTCCAGCA AGATGAACTG AGAAATCCTG AATTTAACAA3067GAAAGAATCA CAGGAATTCT TAGCGAAACC ATCGAAAATA AATCITITCA CTCAAAAAAT3127GAAAAGGGAA ATTGATGAAG ACACGGATAC GGATGGGGAC TCTATTCCTG ACCTTTGGGA3187AGAAAATGGG TATACGATTC ACAATAGAAT CGCTGTAAAG TGGGACGATT CTCTAGCAAG3247TAAAGGGTAT ACGAAATTTG TTTCAAATCC ACTAGAAAGT CACACAGTTG GTGATCCTTA3307TACAGATTAT GAAAAGGCAG CAAGAGATCT AGATTTGTCA AATGCAAAGG AAACGTTTAA3367CCCATTGGTA GCTGCTTTTC CAAGTGTGAA TGTTAGTATG GAAAAGGTGA TATTATCACC3427AAATGAAAAT TTATCCAATA GTGTAGAGTC TCATTCATCC ACGAATTGGT CTTATACAAA3487TACAGAAGGT GCTTCTGTTG AAGCGGGGAT TGGACCAAAA GGTATTTCGT TCGGAGTTAG3547CGTAAACTAT CAACACTCTG AAACAGTTGC ACAAGAATGG GGAACATCTA CAGGAAATAC3607TTCGCAATTC AATACGGCTT CAGCGGGATA TTTAAATGCA AATGTTCGAT ATAACAATGT3667AGGAACTGGT GCCATCTACG ATGTAAAACC TACAACAAGT TTTGTATTAA ATAACGATAC3727TATCGCAACT ATTACGGCGA AATCTAATTC TACAGCCTTA AATATATCIC CTGGAGAAAG3787TTACCCGAAA AAAGGACAAA ATGGAATCGC AATAACATCA ATGGATGATT TTAATTCCCA3847TCCGATTACA TTAAATAAAA AACAAGTAGA TAATCTGCTA AATAATAAAC CTATGATGTT3907GGAAACAAAC CAAACAGATG GTGTTTATAA GATAAAAGAT ACACATGGAA ATATAGTAAC3967TGGCGGAGAA TGGAATGGTG TCATACAACA AATCAAGGCT AAAACAGCGT CTATTATTGT4027GGATGATGGG GAACGTGTAG CAGAAAAACG TGTAGCGGCA AAAGATTATG AAAATCCAGA4087AGATAAAACA CCGTCTTTAA CTTTAAAAGA TGCCCTGAAG CTTTCATATC CAGATGAAAT4147AAAAGAAATA GAGGGATTAT TATATTATAA AAACAAACCG ATATACGAAT CGAGCGTTAT4207GACTTACTTA GATGAAAATA CAGCAAAAGA AGTGACCAAA CAATTAAATG ATACCACTGG4267GAAATTTAAA GATGTAAGTC ATTTATATGA TGTAAAACTG ACTCCAAAAA TGAATGTTAC4327AATCAAATTG TCTATACTTT ATGATAATGC TGAGTCTAAT GATAACTCAA TTGGTAAATG4387GACAAACACA AATATTGTTT CAGGTGGAAA TAACGGAAAA AAACAATATT CTTCTAATAA4447TCCGGATGCT AATTTGACAT TAAATACAGA TGCTCAAGAA AAATTAAATA AAAATCGTGA4507CTATTATATA AGTTTATATA TGAAGTCAGA AAAAAACACA CAATGTGAGA TTACTATAGA4567TGGGGAGATT TATCCGATCA CTACAAAAAC AGTGAATGTG AATAAAGACA ATTACAAAAG4627ATTAGATATT ATAGCTCATA ATATAAAAAG TAATCCAATT TCTTCACTTC ATATTAAAAC4687GAATGATGAA ATAACTTTAT TTTGGGATGA TATTTCTATA ACAGATGTAG CATCAATAAA4747ACCGGAAAAT TTAACAGATT CAGAAATTAA ACAGATTTAT AGTAGGTATG GTATTAAGTT4807AGAAGATGGA ATCCTTATTG ATAAAAAAGG TGGGATTCAT TATGGTGAAT TTATTAATGA4867AGCTAGTTTT AATATTGAAC CATTGCAAAA TTATGTGACC AAATATGAAG TTACTTATAG4927TAGTGAGTTA GGACCAAACG TGAGTGACAC ACTTGAAAGT GATAAAATTT ACAAGGATGG4987GACAATTAAA TTTGATTTTA CCAAATATAG TAAAAATGAA CAAGGATTAT TTTATGACAG5047TGGATTAAAT TGGGACTTTA AAATTAATGC TATTACTTAT GATGGTAAAG AGATGAATGT5107TTTTCATAGA TATAATAAAT AGTTATTATA TCTATGAAGC TGGTGCTAAA GATAGTGTAA5167AAGTTAATAT ACTGTAGGAT TGTAATAAAA GTAATGGAAT TGATATCGTA CTTTGGAGTG5227GGGGATACTT TGTAAATAGT TCTATCAGAA ACATTAGACT AAGAAAAGTT ACTACCCCCA5287CTTGAAAATG AAGATTCAAC TGATTACAAA CAACCTGTTA AATATTATAA GGTTTAACA 5347AAATATTAAA CTCTTTATGT TAATACTGTA ATATAAAGAG TTTAATTGTA TTCAAATGAA5407GCTTTCCCAC AAAATTAGAC TGATTATCTA ATGAAATAAT CAGTCTAATT TTGTAGAACA5467GGTCTGGTAT TATTGTACGT GGTCACTAAA AGATATCTAA TATTATTGGG CAAGGCGTTC5527CATGATTGAA TCCTCGAATG TCTTGCCCTT TTCATTTATT TAAGAAGGAT TGTGGAGAAA5587TTATGGTTTA GATAATGAAG AAAGACTTCA CTTCTAATTT TTGATGTTAA ATAAATCAAA5647ATTTGGCGAT TCACATTGTT TAATCCACTG ATAAAACATA CTGGAGTGTT CTTAAAAAAT5707CAGCTTTTTT CTTTATAAAA TTTTGCTTAG CGTACGAAAT TCGTGTTTTG TTGGTGGGAC5767CCCATGCCCA TCAACTTAAG AGTAAATTAG TAATGAACTT TCGTTCATCT GGATTAAAAT5827AACCTCAAAT TAGGACATGT TTTTAAAAAT AAGCAGACCA AATAAGCCTA GAATAGGTAT5887CATTTTTAAA AATTATGCTG CTTTCTTTTG TTTTCCAAAT CCATTATACT CATAAGCAAC5947ACCCATAATG TCAAAGACTG TTTTTGTCTC ATATCGATAA GCTTGATATC GAATTCCTGC6007AGCCCGGGGG ATCCACTAGT TCTAGAGCGG CCGCCACCGC GG 6049(2)SEQ ID NO2信息(i)序列特征(A)长度462个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr100 105 110Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Mer Val225 230 225 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn450 455 460(2)SEQ ID NO3信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(ix)特征(A)名称/关键词肽(B)位置1..20(D)其它信息/注=“用于液泡定位的信号肽”(xi)序列描述SEQ ID NO3Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg Val Thr Asp Arg1 5 10 15Ala Ala Ser Thr20(2)SEQ ID NO4信息(i)序列特征(A)长度2655个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(vi)原始来源(A)有机体蜡状芽孢杆菌(B)菌株AB78(C)单独的分离物NRRL B-21058(ix)特征(A)名称/关键词CDS(B)位置1..2652(D)其它信息/注=“100kd蛋白质VIP1A(a)”/注=“这一序列与SEQ ID NO1的核苷酸2475-5126之间的部分相同”(xi)序列描述SEQ ID NO4ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA 48Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu465 470 475TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC 96Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp480 485 490AGC AAA ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG 144Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu495 500 505 510ATG GAC CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT 192Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe515 520 525AGT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT 240Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr530 535 540GAT CAA CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT 288Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr545 550 555CAG TCT ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT 336Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp560 565 570TTC ACA TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT 384Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn575 580 585 590GGG AAA ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA 432Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu595 600 605GAA AAA GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA 480Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr610 615 620AAA TTT AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA 528Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys625 630 635ATA GAT AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA 576Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg640 645 650AAT CCT GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA 624Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro655 660 665 670TCG AAA ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA 672Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu675 680 685GAC ACG GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT 720Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn690 695 700GGG TAT ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA 768Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu705 710 715GCA AGT AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC 816Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His720 725 730ACA GTT GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA864Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu735 740 745 750GAT TTG TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT912Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe755 760 765CCA AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA960Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu770 775 780AAT TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT 1008Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr785 790 795ACA AAT ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT 1056Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly800 805 810ATT TCG TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA 1104Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala815 820 825 830CAA GAA TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT 1152Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala835 840 845TCA GCG GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT 1200Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr850 855 860GGT GCC ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC 1248Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn865 870 875GAT ACT ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT 1296Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn880 885 890ATA TCT CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA1344Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala895 900 905 910ATA ACA TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA1392Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys915 920 925AAA CAA GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA1440Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr930 935 940AAC CAA ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA1488Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile945 950 955GTA ACT GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA1536Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys960 965 970ACA GCG TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT1584Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg975 980 985 990GTA GCG GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA1632Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu995 10001005ACT TTA AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA1680Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu101010151020ATA GAG GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC1728Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser102510301035GTT ATG ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA1776Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln104010451050TTA AAT GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT1824Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp1055106010651070GTA AAA CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT1872Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu107510801085TAT GAT AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC1920Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn109010951100ACA AAT ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT1968Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser110511101115AAT AAT CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA 2016Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys112011251130TTA AAT AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA 2064Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu1135114011451150AAA AAC ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC 2112Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile115511601165ACT ACA AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT 2160Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp117011751180ATT ATA GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT 2208Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile118511901195AAA ACG AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA 2256Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr120012051210GAT GTA GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA 2304Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys1215122012251230CAG ATT TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT 2352Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Ieu Glu Asp Gly Ile Leu Ile123512401245GAT AAA AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT 2400Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser125012551260TTT AAT ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT 2448Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr126512701275TAT AGT AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT 2496Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp128012851290AAA ATT TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT 2544Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser1295130013051310AAA AAT GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT 2592Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe131513201325AAA ATT AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT 2640Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His133013351340AGA TAT AAT AAA TAG 2655Arg Tyr Asn Lys1345(2)SEQ ID NO5信息(i)序列特征(A)长度884个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO5Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu1 5 10 15Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp20 25 30Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu35 40 45Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe50 55 60Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr65 70 75 80Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr85 90 95Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp100 105 110Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn115 120 125Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu130 135 140Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr145 150 155 160Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys165 170 175Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg180 185 190Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro195 200 205Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu210 215 220Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn225 230 235 240Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu245 250 255Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His260 265 270Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu275 280 285Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe290 295 300Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu305 310 315 320Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr325 330 335Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly340 345 350Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala355 360 365Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala370 375 380Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr385 390 395 400Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn405 410 415Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn420 425 430Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala435 440 445lle Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys450 455 460Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr465 470 475 480Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile485 490 495Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys500 505 510Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg515 520 525Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu530 535 540Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu545 550 555 560lle Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser565 570 575Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln580 585 590Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp595 600 605Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu610 615 620Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn625 630 635 640Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser645 650 655Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys660 665 670Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu675 680 685Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile690 695 700Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp705 710 715 720Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile725 730 735Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr740 745 750Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys755 760 765Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile770 775 780Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser785 790 795 800Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr805 810 815Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp820 825 830Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser835 840 845Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe850 855 860Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His865 870 875 880Arg Tyr Asn Lys(2)SEQ ID NO6信息(i)序列特征(A)长度2004个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(vi)原始来源(A)有机体蜡状芽孢杆菌(B)菌株AB78(C)单独的分离物NRRL B-21058(ix)特征(A)名称/关键词CDS(B)位置1..2001(D)其它信息/注=“80kd蛋白质VIP1A(a)”/注=“这一序列与SEQ ID NO1的核苷酸3126-5126之间所发现的序列相同”(xi)序列描述SEQ ID NO6ATG AAA AGG GAA ATT GAT GAA GAC ACG GAT ACG GAT GGG GAC TCT ATT48Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile88 890 895 900CCT GAC CTT TGG GAA GAA AAT GGG TAT ACG ATT CAA AAT AGA ATC GCT96Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala905 910 915GTA AAG TGG GAC GAT TCT CTA GCA AGT AAA GGG TAT ACG AAA TTT GTT 144Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val920 925 930TCA AAT CCA CTA GAA AGT CAC ACA GTT GGT GAT CCT TAT ACA GAT TAT 192Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr935 940 945CAA AAG GCA GCA AGA GAT CTA GAT TTG TCA AAT GCA AAG GAA ACG TTT 240Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe950 955 960AAC CCA TTG GTA GCT GCT TTT CCA AGT GTG AAT GTT AGT ATG GAA AAG 288Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys965 970 975 980GTG ATA TTA TCA CCA AAT GAA AAT TTA TCC AAT AGT GTA GAG TCT CAT 336Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His985 990 995TCA TCC ACG AAT TGG TCT TAT ACA AAT ACA GAA GGT GCT TCT GTT GAA 384Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu100010051010GCG GGG ATT GGA CCA AAA GGT ATT TCG TTC GGA GTT AGC GTA AAC TAT 432Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr101510201025CAA CAC TCT GAA ACA GTT GCA CAA GAA TGG GGA ACA TCT ACA GGA AAT 480Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn103010351040ACT TCG CAA TTC AAT ACG GCT TCA GCG GGA TAT TTA AAT GCA AAT GTT 528Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val1045105010551060CGA TAT AAC AAT GTA GGA ACT GGT GCC ATC TAC GAT GTA AAA CCT ACA 576Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr106510701075ACA AGT TTT GTA TTA AAT AAC GAT ACT ATC GCA ACT ATT ACG GCG AAA 624Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ale Lys108010851090TCT AAT TCT ACA GCC TTA AAT ATA TCT CCT GGA GAA AGT TAC CCG AAA 672Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys109511001105AAA GGA CAA AAT GGA ATC GCA ATA ACA TCA ATG GAT GAT TTT AAT TCC 720Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser111011151120CAT CCG ATT ACA TTA AAT AAA AAA CAA GTA GAT AAT CTG CTA AAT AAT 768His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn1125113011351140AAA CCT ATG ATG TTG GAA ACA AAC CAA ACA GAT GGT GTT TAT AAG ATA 816Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile114511501155AAA GAT ACA CAT GGA AAT ATA GTA ACT GGC GGA GAA TGG AAT GGT GTC 864Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val11601165l170ATA CAA CAA ATC AAG GCT AAA ACA GCG TCT ATT ATT GTG GAT GAT GGG 912Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly
117511801185GAA CGT GTA GCA GAA AAA CGT GTA GCG GCA AAA GAT TAT GAA AAT CCA960Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro119011951200GAA GAT AAA ACA CCG TCT TTA ACT TTA AAA GAT GCC CTG AAG CTT TCA 1008Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser1205121012151220TAT CCA GAT GAA ATA AAA GAA ATA GAG GGA TTA TTA TAT TAT AAA AAC 1056Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn122512301235AAA CCG ATA TAC GAA TCG AGC GTT ATG ACT TAC TTA GAT GAA AAT ACA 1104Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr124012451250GCA AAA GAA GTG ACC AAA CAA TTA AAT GAT ACC ACT GGG AAA TTT AAA 1152Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys125512601265GAT GTA AGT CAT TTA TAT GAT GTA AAA CTG ACT CCA AAA ATG AAT GTT 1200Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val127012751280ACA ATC AAA TTG TCT ATA CTT TAT GAT AAT GCT GAG TCT AAT GAT AAC 1248Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn1285129012951300TCA ATT GGT AAA TGG ACA AAC ACA AAT ATT GTT TCA GGT GGA AAT AAC 1296Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn130513101315GGA AAA AAA CAA TAT TCT TCT AAT AAT CCG GAT GCT AAT TTG ACA TTA 1344Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu132013251330AAT ACA GAT GCT CAA GAA AAA TTA AAT AAA AAT CGT GAC TAT TAT ATA 1392Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile133513401345AGT TTA TAT ATG AAG TCA GAA AAA AAC ACA CAA TGT GAG ATT ACT ATA 1440Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile135013551360GAT GGG GAG ATT TAT CCG ATC ACT ACA AAA ACA GTG AAT GTG AAT AAA 1488Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys1365137013751380GAC AAT TAC AAA AGA TTA GAT ATT ATA GCT CAT AAT ATA AAA AGT AAT 1536Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn138513901395CCA ATT TCT TCA CTT CAT ATl AAA ACG AAT GAT GAA ATA ACT TTA TTT 1584Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe140014051410TGG GAT GAT ATT TCT ATA ACA GAT GTA GCA TCA ATA AAA CCG GAA AAT 1632Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn141514201425TTA ACA GAT TCA GAA ATT AAA CAG ATT TAT AGT AGG TAT GGT ATT AAG 1680Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys143014351440TTA GAA GAT GGA ATC CTT ATT GAT AAA AAA GGT GGG ATT CAT TAT GGT 1728Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly1445145014551460GAA TTT ATT AAT GAA GCT AGT TTT AAT ATT GAA CCA TTG CCA AAT TAT 1776Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr146514701475GTG ACC AAA TAT GAA GTT ACT TAT AGT AGT GAG TTA GGA CCA AAC GTG 1824Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val148014851490AGT GAC ACA CTT GAA AGT GAT AAA ATT TAC AAG GAT GGG ACA ATT AAA 1872Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys149515001505TTT GAT TTT ACC AAA TAT AGT AAA AAT GAA CAA GGA TTA TTT TAT GAC 1920Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp151015151520AGT GGA TTA AAT TGG GAC TTT AAA ATT AAT GCT ATT ACT TAT GAT GGT 1968Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly152515301535 1540AAA GAG ATG AAT GTT TTT CAT AGA TAT AAT AAA TAG 2004Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys15451550(2)SEQ ID NO7信息(i)序列特征(A)长度667个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO7Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile1 5 10 15Pro Asp Leu Trp Hlu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala20 25 30Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val35 40 45Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr50 55 60Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe65 70 75 80Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys85 90 95Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His100 105 110Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu115 120 125Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr130 135 140Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn145 150 155 160Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val165 170 175Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr180 185 190Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys195 200 205Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys210 215 220Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser225 230 235 240His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn245 250 255Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile260 265 270Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val275 280 285Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly290 295 300Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro305 310 315 320Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser325 330 335Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn340 345 350Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr355 360 365Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys370 375 380Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val385 390 395 400Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn405 410 415Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn420 425 430Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu435 440 445Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile450 455 460Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile465 470 475 480Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys485 490 495Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn500 505 510Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe515 520 525Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn530 535 540Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys545 550 555 560Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly565 570 575Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr580 585 590Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val595 600 605Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys610 615 620Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp625 630 635 640Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly645 650 655Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys660 665(2)SEQ ID NO8信息(i)序列特征(A)长度16个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(iii)假设否(v)片段类型N-末端(vi)原始来源(A)有机体蜡状芽孢杆菌(B)菌株AB78(C)单独的分离物NRRL B-21058(ix)特征(A)名称/关键词肽(B)位置1..16(D)其它信息/注=“从菌株AB78纯化的蛋白质的N-末端序列”(xi)序列描述SEQ ID NO8Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asx Gly Asp Ser Ile Pro1 5 10 15(2)SEQ ID NO9信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(ix)特征(A)名称/关键词misc_特征(B)位置1..21(D)其它信息/注=“基于SEQ ID NO8的氨基酸3-9之寡核苷酸探针,采用苏云金芽孢杆菌的密码子使用”(xi)序列描述SEQ ID NO9CAAATTGATCAAGATACNGAT(2)SEQ ID NO10信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(iii)假设否(v)片段类型N-末端(vi)原始来源(A)有机体苏云金芽孢杆菌(B)菌株AB88(ix)特征(A)名称/关键词肽(B)位置1..14(D)其它信息/注=“已知为阴离子交换组分23的蛋白质的N-末端氨基酸序列(较小)”(xi)序列描述SEQ ID NO10Xaa Glu Pro Phe Val Ser Ala Xaa Xaa Xaa Gln Xaa Xaa Xaa1 510(2)SEQ ID NO11信息(i)序列特征(A)长度13个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构N-末端(vi)原始来源(A)有机体苏云金芽孢杆菌(xi)序列描述SEQ ID NO1lXaa Glu Tyr Glu Asn Val Glu Pro Phe Val Ser Ala Xaa1 510(2)SEQ ID NO12信息(i)序列特征(A)长度14个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构N-末端(vi)原始来源(A)有机体苏云金芽孢杆菌(xi)序列描述SEQ ID NO12Met Asn Lys Asn Asn Thr Lys Leu Pro Thr Arg Ala Leu Pro1 5 10(2)SEQ ID NO13信息(i)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性
(ii)分子类型肽(iii)假设否(v)片段类型N-末端(vi)原始来源(A)有机体苏云金芽孢杆菌(B)菌株AB88(ix)特征(A)名称/关键词肽(B)位置1..15(D)其它信息/注=“抗Agrotis ipsilon活性的35kDaVIP的N-末端氨基酸序列”(xi)序列描述SEQ ID NO13Ala Leu Ser Glu Asn Thr Gly Lys Asp Gly Gly Tyr Ile Val Pro1 5 10 15(2)SEQ ID NO14信息(i)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构N-末端(vi)原始来源(A)有机体苏云金芽孢杆菌(xi)序列描述SEQ ID NO14Met Asp Asn Asn Pro Asn Ile Asn Glu1 5(2)SEQ ID NO15信息(i)序列特征(A)长度9个氨基酸
(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(iii)假设否(v)片段类型N-末端(ix)特征(A)名称/关键词肽(B)位置1..9(D)其它信息/注=“80kDa δ-内毒素的N-末端序列”(xi)序列描述SEQ ID NO15Met Asp Asn Asn Pro Asn Ile Asn Glu1 5(2)SEQ ID NO16信息(i)序列特征(A)长度11个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(iii)假设否(v)片段类型N-末端(vi)原始来源(A)有机体苏云金芽孢杆茵(ix)特征(A)名称/关键词肽(B)位置1..11(D)其它信息/注=“60kDa δ-内毒素的N-末端序列”(xi)序列描述SEQ ID NO16Met Asn Val Leu Asn Ser Gly Ary Thr Thr Ile1 510(2)SEQ ID NO17信息(i)序列特征(A)长度2655个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(ix)特征(A)名称/关键词misc_特征(B)位置1..2652(D)其它信息/注=“玉米优化的得自AB78的100kd VIP1A(a)DNA序列”(xi)序列描述SEQ ID NO17ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG 60TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120ACCCAHAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG 180GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG1020GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC1080TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG1140TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC1200GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC1260ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC1320AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC1380ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC1440AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACCGGCGGC1500GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC1560GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG1620ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG1680ATCGAGGGCC TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT1740CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC1800AAGGACHTGA HCCACCTGTA CGACHTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG1860CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC1920ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC1980GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC2040ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG2100ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC2160ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC2220GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG2280AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC2340GGCATCCTGA TCGACAAGAA GGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC2400TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG2460CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC2520AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG2580AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC2640CGCTACAACA AGTAG 2655(2)SEQ ID NO18信息(i)序列特征(A)长度2004个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(iv)反义否(ix)特征(A)名称/关键词misc_特征(B)位置1..2004(D)其它信息/注=“玉米优化的得自AB78的80kd VIP1A(a)DNA序列”(xi)序列描述SEQ ID NO18ATGAAGCGCG AGATCGACGA GGACACCGAC ACCGACGGCG ACAGCATCCC CGACCTGTGG 60GAGGAGAACG GCTACACCAT CCAGAACCGC ATCGCCGTGA AGTGGGACGA CAGCCTGGCT 120AGCAAGGGCT ACACCAAGTT CGTGAGCAAC CCCCTGGAGA GCCACACCGT GGGCGACCCC 180TACACCGACT ACGAGAAGGC CGCCCGCGAC CTGGACCTGA GCAACGCCAA GGAGACCTTC 240AACCCCCTGG TGGCCGCCTT CCCCAGCGTG AACGTGAGCA TGGAGAAGGT GATCCTGAGC 300CCCAACGAGA ACCTGAGCAA CAGCGTGGAG AGCCACTCGA GCACCAACTG GAGCTACACC 360AACACCGAGG GCGCCAGCGT GGAGGCCGGC ATCGGTCCCA AGGGCATCAG CTTCGGCGTG 420AGCGTGAACT ACCAGCACAG CGAGACCGTG GCCCAGGAGT GGGGCACCAG CACCGGCAAC 480ACCAGCCAGT TCAACACCGC CAGCGCCGGC TACCTGAACG CCAACGTGCG CTACAACAAC 540GTGGGCACCG GCGCCATCTA CGACGTGAAG CCCACCACCA GCTTCGTGCT GAACAACGAC 600ACCATCGCCA CCATCACCGC CAAGTCGAAT TCCACCGCCC TGAACATCAG CCCCGGCGAG 660AGCTACCCCA AGAAGGGCCA GAACGGCATC GCCATCACCA GCATGGACGA CTTCAACAGC 720CACCCCATCA CCCTGAACAA GAAGCAGGTG GACAACCTGC TGAACAACAA GCCCATGATG 780CTGGAGACCA ACCAGACCGA CGGCGTCTAC AAGATCAAGG ACACCCACGG CAACATCGTG 840ACCGGCGGCG AGTGGAACGG CGTGATCCAG CAGATCAAGG CCAAGACCGC CAGCATCATC 900GTCGACGACG GCGAGCGCGT GGCCGAGAAG CGCGTGGCCG CCAAGGACTA CGAGAACCCC 960GAGGACAAGA CCCCCAGCCT GACCCTGAAG GACGCCCTGA AGCTGAGCTA CCCCGACGAG 1020ATCAAGGAGA TCGAGGGCCT GCTGTACTAC AAGAACAAGC CCATCTACGA GAGCAGCGTG 1080ATGACCTATC TAGACGAGAA CACCGCCAAG GAGGTGACCA AGCAGCTGAA CGACACCACC 1140GGCAAGTTCA AGGACGTGAG CCACCTGTAC GACGTGAAGC TGACCCCCAA GATGAACGTG 1200ACCATCAAGC TGAGCATCCT GTACGACAAC GCCGAGAGCA ACGACAACAG CATCGGCAAG 1260TGGACCAACA CCAACATCGT GAGCGGCGGC AACAACGGCA AGAAGCAGTA CAGCAGCAAC 1320AACCCCGACG CCAACCTGAC CCTGAACACC GACGCCCAGG AGAAGCTGAA CAAGAACCGC 1380GACTACTACA TCAGCCTGTA CATGAAGAGC GAGAAGAACA CCCAGTGCGA GATCACCATC 1440GACGGCGAGA TATACCCCAT CACCACCAAG ACCGTGAACG TGAACAAGGA CAACTACAAG 1500CGCCTGGACA TCATCGCCCA CAACATCAAG AGCAACCCCA TCAGCAGCCT GCACATCAAG 1560ACCAACGACG AGATCACCCT GTTCTGGGAC GACATATCGA TTACCGACGT CGCCAGCATC 1620AAGCCCGAGA ACCTGACCHA CAGCGAGATC AAGCAGATAT ACAGTCGCTA CCGCATCAAG 1680CTGGAGGACG GCATCCTGAT CGACAAGAAG GGCGGCATCC ACTACGGCGA GTTCATCAAC 1740GAGGCCAGCT TCAACATCGA GCCCCTGCAG AACTACGTGA CCAAGTACGA GGTGACCTAC 1800AGCAGCGAGC TGGGCCCCAA CGTGAGCGAC ACCCTGGAGA GCGACAAGAT TTACAAGGAC 1860GGCACCATCA AGTTCGACTT CACCAAGTAC AGCAAGAACG AGCAGGGCCT GTTCTACGAC 1920AGCGGCCTGA ACTGGGACTT CAAGATCAAC GCCATCACCT ACGACGGCAA GGAGATGAAC 1980GTGTTCCACC GCTACAACAA GTAG2004(2)SEQ ID NO19信息(i)序列特征(A)长度4074个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..1386(D)其它信息/产物=“得自Btt的VIP2A(b)”(ix)特征(A)名称/关键词misc_特征(B)位置1..4074(D)其它信息/注=“克隆的得自Btt d DNA序列,其含有VIP1A(b)VIP2A(b)两者的基因”(xi)序列描述SEQ ID NO19ATG CAA AGA ATG GAG GGA AAG TTG TTT GTG GTG TCA AAA ACA TTA CAA48Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln670 675 680GTA GTT ACT AGA ACT GTA TTG CTT AGT ACA GTT TAC TCT ATA ACT TTA96Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu685 690 695TTA AAT AAT GTA GTG ATA AAA GCT GAC CAA TTA AAT ATA AAT TCT CAA 144Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln700 705 710 715AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC CCT GAT AAT GCA GAG 192Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu720 725 730GAT TTT AAA GAA GAT AAG GGG AAA GCG AAA GAA TGG GGG AAA GAG AAA 240Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys735 740 745GGG GAA GAG TGG AGG CCT CCT GCT ACT GAG AAA GGA GAA ATG AAT AAT 288Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn750 755 760TTT TTA GAT AAT AAA AAT GAT ATA AAG ACC AAT TAT AAA GAA ATT ACT 336Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr765 770 775TTT TCT ATG GCA GGT TCA TGT GAA GAT GAA ATA AAA GAT TTA GAA GAA 384Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu780 785 790 795ATT GAT AAG ATC TTT GAT AAA GCC AAT CTC TCG AGT TCT ATT ATC ACC 432Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr800 805 810TAT AAA AAT GTG GAA CCA GCA ACA ATT GGA TTT AAT AAA TCT TTA ACA 480Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr815 820 825GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA 528Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln830 835 840TTT TTA GGT AAG GAT ATG AAG TTT GAT AGT TAT CTA GAT ACT CAT TTA 576Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu845 850 855ACT GCT CAA CAA GTT TCC AGT AAA AAA AGA GTT ATT TTG AAG GTT ACG 624Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr860 865 870 875GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT 672Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile880 885 890TTA AAC AAT AAT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT GTG CTC 720Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu895 900 905CAT GTA GAT AAG GTA TCA AAA GTA GTA AAA AAA GGG ATG GAG TGC TTA 768His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Leu910 915 920CAA GTT GAA GGG ACT TTA AAA AAG AGT CTC GAC TTT AAA AAT GAT ATA 816Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile925 930 935AAT GCT GAA GCG CAT AGC TGG GGG ATG AAA ATT TAT GAA GAC TGG GCT 864Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala940 945 950 955AAA AAT TTA ACC GCT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG 912Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg960 965 970CAA GAT TAT AAA GAA ATC AAT AAT TAT TTG CGC AAT CAA GGC GGG AGT 960Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser975 980 985GGA AAT GAA AAG CTG GAT GCC CAA TTA AAA AAT ATT TCT GAT GCT TTA 1008Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu990 995 1000GGG AAG AAA CCC ATA CCA GAA AAT ATT ACC GTG TAT AGA TGG TGT GGC 1056Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly100510101015ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys1020102510301035GAT TTT GAA GAA CAA TTT TTA AAT ACA ATT AAA GAA GAC AAA GGG TAT 1152Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr104010451050ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg105510601065AAA ATT ATA TTA CGC TTA CAA GTT CCG AAA GGA AGT ACG GGG GCG TAT 1248Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr107010751080TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp108510901095AAA GAT AGT AAA TAT CAT ATT GAT AAA GCA ACA GAG GTA ATC ATT AAA 1344Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys1100110511101115GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 1386Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn11201125TAAGGAG ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACC TGT 1435Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys1 5 10ATG TTA TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT AAC 1483Met Leu Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn15 20 25 30GCG GAT AGT AAA ATA AAT CAG ATT TCT ACA ACG CAG GAA AAC CAA GAG 1531Ala Asp Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln35 40 45AAA GAG ATG GAC CGA AAG GGA TTA TTG GGA TAT TAT TTC AAA GGA AAA 1579Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys50 55 60GAT TTT AAT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AAT ACC CTT 1627Asp Phe Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu65 70 75ATG TAT GAC CAA CAA ACA GCG AAT GCA TTA TTA GAT AAA AAA CAA CAA 1675Met Tyr Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln80 85 90GAA TAT CAG TCC ATT CGT TGG ATT GGT TTG ATT CAG CGT AAA GAA ACG 1723Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr95 100 105 110GGC GAT TTC ACA TTT AAC TTA TCA AAG GAT GAA CAG GCA ATT ATA GAA 1771Gly Asp Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu115 120 125ATC GAT GGG AAA ATC ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC 1819Ile Asp Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val130 135 140CAT TTA GAA AAA GAA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA 1867His Leu Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser145 150 155GAT ACG AAA TTT AAT ATT GAT AGT AAA ACA TTT AAA GAA CTT AAA TTA 1915Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu160 165 170TTT AAA ATA GAT AGT CAA AAC CAA TCT CAA CAA GTT CAA CTG AGA AAC 1963Phe Lys Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn175 180 185 190CCT GAA TTT AAC AAA AAA GAA TCA CAG GAA TTT TTA GCA AAA GCA TCA 2011Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser195 200 205AAA ACA AAC CTT TTT AAG CAA AAA ATG AAA AGA GAT ATT GAT GAA GAT 2059Lys Thr Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp210 215 220ACG GAT ACA GAT GGA GAC TCC ATT CCT GAT CTT TGG GAA GAA AAT GGG 2107Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly225 230 235TAC ACG ATT CAA AAT AAA GTT GCT GTC AAA TGG GAT GAT TCG CTA GCA 2155Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala240 245 250AGT AAG GGA TAT ACA AAA TTT GTT TCG AAT CCA TTA GAC AGC CAC ACA 2203Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr255 260 265 270GTT GGC GAT CCC TAT ACT GAT TAT GAA AAG GCC GCA AGG GAT TTA GAT 2251Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp275 280 285TTA TCA AAT GCA AAG GAA ACG TTC AAC CCA TTG GTA GCT GCT TTT CCA 2299Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro290 295 300AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT 2347Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn305 310 315TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACG 2395Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr320 325 330AAT ACA GAA GGA GCT TCC ATT GAA GCT GGT GGC GGT CCA TTA GGC CTT 2443Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu335 340 345 350TCT TTT GGC GTG AGT GTT ACT TAT CAA CAC TCT GAA ACA GTT GCA CAA 2491Ser Phe Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln355 360 365GAA TGG GGA ACA TCT ACA GGA AAT ACT TCA CAA TTC AAT ACG GCT TCA 2539Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser370 375 380GCG GGA TAT TTA AAT GCA AAT GTT CGG TAT AAC AAT GTA GGG ACT GGT 2587Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly385 390 395GCC ATC TAT GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC AAT 2635Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn400 405 410ACC ATC GCA ACG ATT ACA GCA AAA TCA AAT TCA ACA GCT TTA CGT ATA 2683Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile415 420 425 430TCT CCG GGG GAT AGT TAT CCA GAA ATA GGA GAA AAC GCT ATT GCG ATT 2731Ser Pro Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile435 440 445ACA TCT ATG GAT GAT TTT AAT TCT CAT CCA ATT ACA TTA AAT AAA CAA 2779Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln450 455 460CAG GTA AAT CAA TTG ATA AAT AAT AAG CCA ATT ATG CTA GAG ACA GAC 2827Gln Val Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp465 470 475CAA ACA GAT GGT GTT TAT AAA ATA AGA GAT ACA CAT GGA AAT ATT GTA 2875Gln Thr Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val480 485 490ACT GGT GGA GAA TGG AAT GGT GTA ACA CAA CAA ATT AAA GCA AAA ACA 2923Thr Gly Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr495 500 505 510GCG TCT ATT ATT GTG GAT GAC GGG AAA CAG GTA GCA GAA AAA CGT GTG 2971Ala Ser Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val515 520 525GCG GCA AAA GAT TAT GGT CAT CCA GAA GAT AAA ACA CCA CCT TTA ACT 3019Ala Ala Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr530 535 540TTA AAA GAT ACC CTG AAG CTT TCA TAC CCA GAT GAA ATA AAA GAA ACT 3067Leu Lys Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr545 550 555AAT GGA TTG TTG TAC TAT GAT GAC AAA CCA ATC TAT GAA TCG AGT GTC 3115Asn Gly Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val560 565 570ATG ACT TAT CTG GAT GAA AAT ACG GCA AAA GAA GTC AAA AAA CAA ATA 3163Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile575 580 585 590AAT GAT ACA ACC GGA AAA TTT AAG GAT GTA AAT CAC TTA TAT GAT GTA 3211Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val595 600 605AAA CTG ACT CCA AAA ATG AAT TTT ACG ATT AAA ATG GCT TCC TTG TAT 3259Lys Leu Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr610 615 620GAT GGG GCT GAA AAT AAT CAT AAC TCT TTA GGA ACC TGG TAT TTA ACA 3307Asp Gly Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr625 630 635TAT AAT GTT GCT GGT GGA AAT ACT GGG AAG AGA CAA TAT CGT TCA GCT 3355Tyr Asn Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala640 645 650CAT TCT TGT GCA CAT GTA GCT CTA TCT TCA GAA GCG AAA AAG AAA CTA 3403His Ser Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu655 660 665 670AAT CAA AAT GCG AAT TAC TAT CTT AGC ATG TAT ATG AAG GCT GAT TCT 3451Asn Gln Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser675 680 685ACT ACG GAA CCT ACA ATA GAA GTA GCT GGG GAA AAA TCT GCA ATA ACA 3499Thr Thr Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr690 695 700AGT AAA AAA GTA AAA TTA AAT AAT CAA AAT TAT CAA AGA GTT GAT ATT 3547Ser Lys Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile705 710 715TTA GTG AAA AAT TCT GAA AGA AAT CCA ATG GAT AAA ATA TAT ATA AGA 3595Leu Val Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg720 725 730GGA AAT GGC ACG ACA AAT GTT TAT GGG GAT GAT GTT ACT ATC CCA GAG 3643Gly Asn Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu735 740 745 750GTA TCA GCT ATA AAT CCG GCT AGT CTA TCA GAT GAA GAA ATT CAA GAA 3691Val Ser Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu755 760 765ATA TTT AAA GAC TCA ACT ATT GAA TAT GGA AAT CCT AGT TTC GTT GCT 3739Ile Phe Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala770 775 780GAT GCC GTA ACA TTT AAA AAT ATA AAA CCT TTA CAA AAT TAT GTA AAG 3787Asp Ala Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys785 790 795GAA TAT GAA ATA TAT CAT AAA TCT CAT CGA TAT GAA AAG AAA ACG GTC 3835Glu Tyr Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val800 805 810TTT GAT ATC ATG GGT GTT CAT TAT GAG TAT AGT ATA GCT AGG GAA CAA 3883Phe Asp Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln815 820 825 830AAG AAA GCC GCA TAATTTTAAA AATAAAACTC GTTAGAGTTT ATTTAGCATG 3935Lys Lys Ala AlaGTATTTTTAA GAATAATCAA TATGTTGAAC CGTTTGTAGC TGTTTTGGAA GGGAATTTCA 3995TTTTATTTGG TCTCTTAAGT TGATGGGCAT GGGATATGTT CAGCATCCAA GCGTTTNGGG 4055GGTTANAAAA TCCAATTTT 4074(2)SEQ ID NO20信息(i)序列特征(A)长度462个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO20Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln1 5 10 15Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu20 25 30Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu50 55 60Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr100 105 110Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu115 120 125Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr130 135 140Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln165 170 175Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu180 185 190Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile210 215 220Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Leu245 250 255Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala275 280 285Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn450 455 460(2)SEQ ID NO21信息(i)序列特征(A)长度834个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO21Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Met Leu1 5 10 15Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn Ala Asp20 25 30Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln Lys Glu35 40 45Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe50 55 60Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu Met Tyr65 70 75 80Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln Glu Tyr85 90 95Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr Gly Asp100 105 110Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu Ile Asp115 120 125Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu130 135 140Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr145 150 155 160Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys165 170 175Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn Pro Glu180 185 190Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser Lys Thr195 200 205Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp Thr Asp210 215 220Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr225 230 235 240Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys245 250 255Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr Val Gly260 265 270Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser275 280 285Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val290 295 300Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser305 310 315 320Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr325 330 335Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu Ser Phe340 345 350Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp355 360 365Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly370 375 380Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile385 390 395 400Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn Thr Ile405 410 415Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile Ser Pro420 425 430Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile Thr Ser435 440 445Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln Gln Val450 455 460Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp Gln Thr465 470 475 480Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val Thr Gly485 490 495Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr Ala Ser500 505 510Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val Ala Ala515 520 525Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr Leu Lys530 535 540Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr Asn Gly545 550 555 560Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val Met Thr565 570 575Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile Asn Asp580 585 590Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val Lys Leu595 600 605Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr Asp Gly610 615 620Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr Tyr Asn625 630 635 640Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala His Ser645 650 655Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu Asn Gln660 665 670Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser Thr Thr675 680 685Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr Ser Lys690 695 700Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile Leu Val705 710 715 720Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg Gly Asn725 730 735Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu Val Ser740 745 750Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu Ile Phe755 760 765Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala Asp Ala770 775 780Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys Glu Tyr785 790 795 800Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val Phe Asp805 810 815Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln Lys Lys820 825 830Ala Ala(2)SEQ ID NO22信息(i)序列特征(A)长度4041个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..4038(D)其它信息/产物=“VIP1A(a)/VIP2A(a)融合蛋白质”(xi)序列描述SEQ ID NO22ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA CAA 48Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln835 840 845 850GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT TTA 96Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu855 860 865TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT CAA144Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln870 875 880AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA GAG192Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu885 890 895GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA AAA240Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys900 905 910GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT AAT288Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn915 920 925 930TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT ACT336Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr935 940 945TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA GAA384Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu950 955 960ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC ACC432Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr965 970 975TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA ACA480Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr980 985 990GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA528Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln995 100010051010TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT TTA576Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu101510201025ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT ACG624Tnr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr103010351040GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT672Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile104510501055TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG GTC720Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val106010651070CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC TTA768His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu1075108010851090CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT ATA816Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile109511001105AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG GCT864Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala111011151120AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG912Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg112511301135CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA AGT960Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser114011451150GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT TTA 1008Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu1155116011651170GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT GGC 1056Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly117511801185ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys119011951200GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA TAT 1152Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr120512101215ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg122012251230AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG TAT 1248Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr1235124012451250TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp125512601265AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT AAA 1344Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys127012751280GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT ATG AAA 1392Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys128512901295AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA TTA GCT 1440Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala130013051310CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC AGC AAA 1488Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys1315132013251330ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG ATG GAC 1536Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp133513401345CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT AGT AAT 1584Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn135013551360CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT GAT CAA 1632Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln136513701375CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT CAG TCT 1680Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser138013851390ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT TTC ACA 1728Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr1395140014051410TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT GGG AAA 1776Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys141514201425ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA GAA AAA 1824Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys143014351440GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA AAA TTT 1872Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe144514501455AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA ATA GAT 1920Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp146014651470AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA AAT CCT 1968Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro1475148014851490GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA TCG AAA 2016Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys149515001505ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA GAC ACG 2064Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr151015151520GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT GGG TAT 2112Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr152515301535ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA GCA AGT 2160Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser154015451550AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC ACA GTT 2208Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val1555156015651570GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA GAT TTG 2256Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu157515801585TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT CCA AGT 2304Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser159015951600GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT TTA 2352Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu160516101615TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACA AAT 2400Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn162016251630ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT ATT TCG 2448Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser1635164016451650TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA CAA GAA 2496Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu165516601665TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG CCT TCA GCG 2544Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala167016751680GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT GGT GCC 2592Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala168516901695ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC GAT ACT 2640Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr170017051710ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT ATA TCT 2688Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser1715172017251730CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA ATA ACA 2736Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr173517401745TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA AAA CAA 2784Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln175017551760GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA AAC CAA 2832Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln176517701775ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA GTA ACT 2880Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr178017851790GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA ACA GCG 2928Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala1795180018051810TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT GTA GCG 2976Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala181518201825GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA ACT TTA 3024Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu183018351840AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA ATA GAG 3072Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu184518501855GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC GTT ATG 3120Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met186018651870ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA TTA AAT 3168Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn1875188018851890GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT GTA AAA 3216Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys189519001905CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT TAT GAT 3264Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp191019151920AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC ACA AAT 3312Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn192519301935ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT AAT AAT 3360Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn194019451950CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA TTA AAT 3408Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn1955196019651970AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA AAA AAC 3456Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn197519801985ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC ACT ACA 3504Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr199019952000AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT ATT ATA 3552Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile200520102015GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT AAA ACG 3600Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr202020252030AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA GAT GTA 3648Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val2035204020452050GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA CAG ATT 3696Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile205520602065TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT GAT AAA 3744Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys207020752080AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT TTT AAT 3792Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn208520902095ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT TAT AGT 3840Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser210021052110AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT AAA ATT 3888Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile2115212021252130TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT AAA AAT 3936Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn213521402145GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT AAA ATT 3984Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile215021552160AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT AGA TAT 4032Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr216521702175AAT AAA TAG 4041Asn Lys2180(2)SEQ ID NO23信息(i)序列特征(A)长度1346个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO23Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr100 105 110Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys450 455 460Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala465 470 475 480Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys485 490 495Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp500 505 510Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn515 520 525Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln530 535 540Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser545 550 555 560Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr565 570 575Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys580 585 590Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys595 600 605Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe610 615 620Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp625 630 635 640Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro645 650 655Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys660 665 670Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr675 680 685Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr690 695 700Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser705 710 715 720Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val725 730 735Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu740 745 750Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser755 760 765Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu770 775 780Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn785 790 795 800Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser805 810 815Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu820 825 830Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala835 840 845Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala850 855 860Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr865 870 875 880Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser885 890 895Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr900 905 910Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln915 920 925Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln930 935 940Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr945 950 955 960Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala965 970 975Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala980 985 990Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu995 10001005Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu101010151020Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met1025103010351040Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn104510501055Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys106010651070Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp107510801085Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn109010951100Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn1105111011151120Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn112511301135Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn114011451150Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr115511601165Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile117011751180Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr1185119011951200Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val120512101215Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile122012251230Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys123512401245Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn125012551260Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser1265127012751280Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile128512901295Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn130013051310Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile131513201325Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr133013351340Asn Lys1345(2)SEQ ID NO24信息(i)序列特征(A)长度1399个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词misc_特征(B)位置1..1386(D)其它信息/注=“玉米优化的得自AB78的VIP2A(a)DNA序列”(xi)序列描述SEQ ID NO24ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG 60ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC 300AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATGGCCGG CAGCTCGAG 360GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACCG GCGCCTACCT GAGCGCCATC 1260GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGACAAGG ACAGCAAGTA CCACATCGAC 1320AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380ACCAACTAGA TCTGAGCTC 1399(2)SEQ ID NO25信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(ix)特征(A)名称/关键词肽(B)位置1..19(D)其它信息/注=“将VIP2分泌出细胞的分泌信号肽序列”(xi)序列描述SEQ ID NO25Gly Trp Ser Trp Ile Phe Leu phe Leu Leu Ser Gly A1a Ala Gly Val1 5 10 15His Cys Leu(2)SEQ ID NO26信息(i)序列特征(A)长度2655个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词misc_特征(B)位置1..2655(D)其它信息/注=“玉米优化的编码VIP1A(a)的DNA序列”(xi)序列描述SEQ ID NO26ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG60TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGGC TGDTGGGCTA CTACTTCAAG 180GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360GAGGAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG 1020GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC 1080TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG 1140TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC 1200GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC 1260ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC1320AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC1380ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC1440AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACGGGCGGC1500GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC1560GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG1620ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG1680ATCGAGGGCT TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT1740CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC1800AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG1860CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC1920ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC1980GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC2040ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG2100ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC2160ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC2220GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG2280AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC2340GGCATCCTGA TCGACAAGAA AGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC2400TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG2460CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC2520AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG2580AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC2640CGCTACAACA AGTAG 2655(2)SEQ ID NO27信息(i)序列特征(A)长度1389个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词misc_特征(B)位置1..1389(D)其它信息/注=“玉米优化的编码VIP2A(a)的DNA序列”(xi)序列描述SEQ ID NO27ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG60ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGCAAGAA TGAACAACTT CCTGGACAAC 300AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATAGCCGG CAGCTTCGAG 360GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACTG GTGCCTACCT GAGCGCCATC 1260GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGATAAGG ACAGCAAGTA CCACATCGAC 1320AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380ACCAACTAG 1389(2)SEQ ID NO28信息(i)序列特征(A)长度2378个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置9..2375(D)其它信息/注=“包含在pCIB7104中的编码VIP3A(a)的天然DNA序列”(xi)序列描述SEQ ID NO28AGATGAAC ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA 50Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro1 5 10AGT TTT ATT GAT TAT TTT AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC98Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile15 20 25 30AAA GAC ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA146Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu35 40 45ACC CTA GAC GAA ATT TTA AAG AAT CAG CAG TTA CTA AAT GAT ATT TCT194Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser50 55 60GGT AAA TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG242Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln65 70 75GGA AAC TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT290Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn80 85 90GAA CAA AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA338Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile95 100 105 110AAT ACG ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT386Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser115 120 125GAT GTA ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA434Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu130 135 140AGT AAA CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA482Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val145 150 155AAT GTA CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA530Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tvr Gln160 165 170AGG ATT AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA578Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr175 180 185 190GAA ACT AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CTT626Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu195 200 205GAT GAG TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT674Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn210 215 220GAT GTG GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG722Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met225 230 235GTA GGA AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA770Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu240 245 250TTA ATT ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT818Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn255 260 265 270GTT TAT AAC TTC TTA ATT GTA TTA ACA GCT CTG CAA GCC CAA GCT TTT866Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe275 280 285CTT ACT TTA ACA ACA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT914Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp290 295 300TAT ACT TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT962Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe305 3l0 315AGA GTA AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT 1010Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn320 325 330TAT GCA AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA 1058Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu335 340 345 350GCT AAA CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA 1106Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser355 360 365ATT ACA GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA 1154Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln370 375 380GTC GAT AAG GAT TCC TTA TCG GAA GTT ATT TAT GGT GAT ATG GAT AAA 1202Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys385 390 395TTA TTG TGC CCA GAT CAA TCT GAA CAA ATC TAT TAT ACA AAT AAC ATA 1250Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile400 405 410GTA TTT CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA 1298Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys415 420 425 430ATG AAA ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT 1346Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser435 440 445ACA GGA GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG 1394Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala450 455 460GAG TAT AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA 1442Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu465 470 475GGT GTC ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC 1490Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu480 485 490CAA GCT GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT 1538Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr495 500 505 510TTA AGA GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA 1586Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys515 520 525TTG ATC GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG 1634Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly530 535 540TCC ATA GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT 1682Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn545 550 555GCG TAT GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT 1730Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr560 565 570GTT CAT AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA 1778Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys575 580 585 590CCG AAA ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT 1826Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser595 600 605ATT CAT TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA 1874Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr610 615 620AAT AAT AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA 1922Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr625 630 635GGA ACT GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA 1970Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly640 645 650GAT GAA GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT 2018Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser655 660 665 670GAA AAG TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT 2066Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser675 680 685ACG GGA TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA 2114Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly690 695 700GGA CGA GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT 2162Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr705 710 715TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA 2210Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg720 725 730AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA 2258Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys735 740 745 750GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTT TAT 2306Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr755 760 765ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT 2354Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His770 775 780TTT TAC GAT GTC TCT ATT AAG TAA 2378Phe Tyr Asp Val Ser Ile Lys785(2)SEQ ID NO29信息(i)序列特征(A)长度789个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO29Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr275 280 285Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr770 775 780Asp Val Ser Ile Lys785(2)SEQ ID NO30信息(i)序列特征(A)长度2403个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词misc_特征(B)位置11..2389(D)其它信息/注=“玉米优化的编码VIP3A(a)的DNA序列”(xi)序列描述SEQ ID NO30GGATCCACCA ATGAACATGA ACAAGAACAA CACCAAGCTG AGCACCCGCG CCCTGCCGAG60CTTCATCGAC TACTTCAACG GCATCTACGG CTTCGCCACC GGCATCAAGG ACATCATGAA 120CATGATCTTC AAGACCGACA CCGGCGGCGA CCTGACCCTG GACGAGATCC TGAAGAACCA 180GCAGCTGCTG AACGACATCA GCGGCAAGCT GGACGGCGTG AACGGCAGCC TGAACGACCT 240GATCGCCCAG GGCAACCTGA ACACCGAGCT GAGCAAGGAG ATCCTTAAGA TCGCCAACGA 300GCAGAACCAG GTGCTGAACG ACGTGAACAA CAAGCTGGAC GCCATCAACA CCATGCTGCG 360CGTGTACCTG CCGAAGATCA CCAGCATGCT GAGCGACGTG ATGAAGCAGA ACTACGCCCT 420GAGCCTGCAG ATCGAGTACC TGAGCAAGCA GCTGCAGGAG ATCAGCGACA AGCTGGACAT 480CATCAACGTG AACGTCCTGA TCAACAGCAC CCTGACCGAG ATCACCCCGG CCTACCAGCG 540CATCAAGTAC GTGAACGAGA AGTTCGAAGA GCTGACCTTC GCCACCGAGA CCAGCAGCAA 600GGTGAAGAAG GACGGCAGCC CGGCCGACAT CCTGGACGAG CTGACCGAGC TGACCGAGCT 660GGCCAAGAGC GTGACCAAGA ACGACGTGGA CGGCTTCGAG TTCTACCTGA ACACCTTCCA 720CGACGTGATG GTGGGCAACA ACCTGTTCGG CCGCAGCGCC CTGAAGACCG CCAGCGAGCT 780GATCACCAAG GAGAACGTGA AGACCAGCGG CAGCGAGGTG GGCAACGTGT ACAACTTCCT 840GATCGTGCTG ACCGCCCTGC AGGCCCAGGC CTTCCTGACC CTGACCACCT GTCGCAAGCT 900GCTGGGCCTG GCCGACATCG ACTACACCAG CATCATGAAC GAGCACTTGA ACAAGGAGAA 960GGAGGAGTTC CGCGTGAACA TCCTGCCGAC CCTGAGCAAC ACCTTCAGCA ACCCGAACTA 1020CGCCAAGGTG AAGGGCAGCG ACGAGGACGC CAAGATGATC GTGGAGGCTA AGCCGGGCCA 1080CGCGTTGATC GGCTTCGAGA TCAGCAACGA CAGCATCACC GTGCTGAAGG TGTACGAGGC 1140CAAGCTGAAG CAGAACTACC AGGTGGACAA GGACAGCTTG AGCGAGGTGA TCTACGGCGA 1200CATGGACAAG CTGCTGTGTC CGGACCAGAG CGAGCAAATC TACTACACCA ACAACATCGT 1260GTTCCCGAAC GAGTACGTGA TCACCAAGAT CGACTTCACC AAGAAGATGA AGACCCTGCG 1320CTACGAGGTG ACCGCCAACT TCTACGACAG CAGCACCGGC GAGATCGACC TGAACAAGAA 1380GAAGGTGGAG AGCAGCGAGG CCGAGTACCG CACCCTGAGC GCGAACGACG ACGGCGTCTA 1440CATGCCACTG GGCGTGATCA GCGAGACCTT CCTGACCCCG ATCAACGGCT TTGGCCTGCA 1500GGCCGACGAG AACAGCCGCC TGATCACCCT GACCTGTAAG AGCTACCTGC GCGAGCTGCT 1560GCTAGCCACC GACCTGAGCA ACAAGGAGAC CAAGCTGATC GTGCCACCGA GCGGCTTCAT 1620CAGCAACATC GTGGAGAACG GCAGCATCGA GGAGGACAAC CTGGAGCCGT GGAAGGCCAA 1680CAACAAGAAC GCCTACGTGG ACCACACCGG CGGCGTGAAC GGCACCAAGG CCCTGTACGT 1740GCACAAGGAC GGCGGCATCA GCCAGTTCAT CGGCGACAAG CTGAAGCCGA AGACCGAGTA 1800CGTGATCCAG TACACCGTGA AGGGCAAGCC ATCGATTCAC CTGAAGGACG AGAACACCGG 1860CTACATCCAC TACGAGGACA CCAACAACAA CCTGGAGGAC TACCAGACCA TCAACAAGCG 1920CTTCACCACC GGCACCGACC TGAAGGGCGT GTACCTGATC CTGAAGAGCC AGAACGGCGA 1980CGAGGCCTGG GGCGACAACT TCATCATCCT GGAGATCAGC CCGAGCGAGA AGCTGCTGAG 2040CCCGGAGCTG ATCAACACCA ACAACTGGAC CAGCACCGGC AGCACCAACA TCAGCGGCAA 2100CACCCTGACC CTGTACCAGG GCGGCCGCGG CATCCTGAAG CAGAACCTGC AGCTGGACAG 2160CTTCAGCACC TACCGCGTGT ACTTCAGCGT GAGCGGCGAC GCCAACGTGC GCATCCGCAA 2220CAGCCGCGAG GTGCTGTTCG AGAAGAGGTA CATGAGCGGC GCCAAGGACG TGAGCGAGAT 2280GTTCACCACC AAGTTCGAGA AGGACAACTT CTACATCGAG CTGAGCCAGG CCAACAACCT 2340GTACGCCGGC CCGATCGTGC ACTTCTACGA CGTGAGCATC AAGTTAACGT AGAGCTCAGA 2400TCT 2403(2)SEQ ID NO31信息(i)序列特征(A)长度2612个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置118..2484(D)其它信息/注=“得自AB424的编码VIP3A(a)的天然DNA序列”(xi)序列描述SEQ ID NO31ATTGAAATTG ATAAAAAGTT ATGAGTGTTT AATAATCAGT AATTACCAAT AAAGAATTAA 60GAATACAAGT TTACAAGAAA TAAGTGTTAC AAAAAATAGC TGAAAAGGAA GATGAAC 117ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA AGT TTT 165Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe790 795 800 805ATT GAT TAT TTC AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC AAA GAC 213Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp810 815 820ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA ACC CTA 261Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu825 830 835GAC GAA ATT TTA AAG AAT CAG CAG CTA CTA AAT GAT ATT TCT GGT AAA 309Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys840 845 850TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG GGA AAC 357Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn855 860 865TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT GAA CAA 405Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln870 875 880 885AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA AAT ACG 453Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr890 895 900ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT GAT GTA501Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val905 910 915ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA AGT AAA549Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys920 925 930CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA AAT GTA597Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val935 940 945CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA AGG ATT645Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile950 955 960 965AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA GAA ACT693Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr970 975 980AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CGT GAT GAG741Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu985 990 995TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT GAT GTG789Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val100010051010GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG GTA GGA837Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly101510201025AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA TTA ATT885Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile1030103510401045ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT GTT TAT933Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr105010551060AAC TTC CTA ATT GTA TTA ACA GCT CTG CAA GCA AAA GCT TTT CTT ACT981Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr106510701075TTA ACA CCA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT TAT ACT 1029Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr108010851090TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT AGA GTA 1077Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val109511001105AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT TAT GCA1125Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala1110111511201125AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA GCT AAA 1173Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys113011351140CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA ATT ACA 1221Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr114511501155GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA GTC GAT 1269Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp116011651170AAG GAT TCC TTA TCG GAA GTT ATT TAT GGC GAT ATG GAT AAA TTA TTG 1317Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu117511801185TGC CCA GAT CAA TCT GGA CAA ATC TAT TAT ACA AAT AAC ATA GTA TTT 1365Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe1190119512001205CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA ATG AAA 1413Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys121012151220ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT ACA GGA 1461Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly122512301235GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG GAG TAT 1509Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr124012451250AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA GGT GTC 1557Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val125512601265ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC CAA GCT 1605Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala1270127512801285GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT TTA AGA 1653Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg129012951300GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA TTG ATC 1701Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile130513101315GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG TCC ATA 1749Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile132013251330GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT GCG TAT 1797Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr133513401345GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT GTT CAT 1845Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His1350135513601365AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA CCG AAA 1893Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys137013751380ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT ATT CAT 1941Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His138513901395TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA AAT AAT 1989Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn140014051410AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA GGA ACT 2037Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr141514201425GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA GAT GAA 2085Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu1430143514401445GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT GAA AAG 2133Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys145014551460TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT ACG GGA 2181Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly146514701475TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA GGA CGA 2229Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg148014851490GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT TAT AGA 2277Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg149515001505GTG TAT TTC TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA AAT TCT 2325Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser1510151515201525AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA GAT GTT 2373Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val153015351540TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTC TAT ATA GAG 2421Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu154515501555CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT TTT TAC 2469Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr156015651570GAT GTC TCT ATT AAG TAAGATCGGG ATCTAATATT AACAGTTTTT AGAAGCTAAT 2524Asp Val Ser Ile Lys1575TCTTGTATAA TGTCCTTGAT TATGGAAAAA CACAATTTTG TTTGCTAAGA TGTATATATA 2584GCTCACTCAT TAAAAGGCAA TCAAGCTT2612(2)SEQ ID NO32信息(i)序列特征(A)长度789个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO32Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr275 280 285Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr770 775 780Asp Val Ser Ile Lys785(2)SEQ ID NO33信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于制备pCIB5526的正向引物”(iii)假设否(xi)序列描述SEQ ID NO33GGATCCACCA TGAAGACCAA CCAGATCAGC(2)SEQ ID NO34信息(i)序列特征(A)长度15个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于制备pCIB5526的反向引物”(iii)假设否(xi)序列描述SEQ ID NO34AAGCTTCAGC TCCTT(2)SEQ ID NO35信息(i)序列特征(A)长度2576个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置9..2564(D)其它信息/注=“包含在pCIB5526中的玉米优化的编码除去了芽孢杆菌属分泌信号的VIP1A(a)的序列”(xi)序列描述SEQ ID NO35GATCCACC ATG AAG ACC AAC CAG ATC AGC ACC ACC CAG AAG AAC CAG CAG50Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln825 830 835AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC TAC TAC TTC AAG GGC AAG 98Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys840 845 850GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC ACG CGT GAC AGC ACC CTG146Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu855 860 865ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG CTG GAC AAG AAG CAG CAG194Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln870 875 880GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG ATC CAG AGC AAG GAG ACC242Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr885 890 895GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC GAG CAG GCC ATC ATC GAG290Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu900 905 910 915ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC AAG GAG AAG CAG GTG GTG338Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val920 925 930CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC AAG ATC GAG TAC CAG AGC386His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser935 940 945GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC TTC AAG GAG CTG AAG CTT434Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu950 955 960TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG CAG GTG CAG CAG GAC GAG 482Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu965 970 975CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG AGC CAG GAG TTC CTG GCC 530Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala980 985 990 995AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG CAG ATG AAG CGC GAG ATC 578Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile100010051010GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC ATC CCC GAC CTG TGG GAG 626Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu101510201025GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC GCC GTG AAG TGG GAC GAC 674Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp103010351040AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC GTG AGC AAC CCC CTG GAG 722Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu104510501055AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC TAC GAG AAG GCC GCC CGC 770Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg1060106510701075GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC TTC AAC CCC CTG GTG GCC 818Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala108010851090GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG AAG GTG ATC CTG AGC CCC 866Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro109511001105AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC CAC TCG AGC ACC AAC TGG 914Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp111011151120AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG GAG GCC GGC ATC GGT CCC 962Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro112511301135AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC TAC CAG CAC AGC GAG ACC 1010Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr1140114511501155GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC AAC ACC AGC CAG TTC AAC 1058Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn116011651170ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC GTG CGC TAC AAC AAC GTG 1106Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val117511801185GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC ACC ACC AGC TTC GTG CTG 1154Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu119011951200AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC AAG TCG AAT TCC ACC GCC 1202Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala120512101215CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC AAG AAG GGC CAG AAC GGC 1250Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly1220122512301235ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC AGC CAC CCC ATC ACC CTG 1298Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu124012451250AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC AAC AAG CCC ATG ATG CTG 1346Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu125512601265GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG ATC AAG GAC ACC CAC GGC 1394Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly127012751280AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC GTG ATC CAG CAG ATC AAG 1442Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys128512901295GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC GGC GAG CGC GTG GCC GAG 1490Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu13001305 1310 1315AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC CCC GAG GAC AAG ACC CCC 1538Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro132013251330AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG AGC TAC CCC GAC GAG ATC 1586Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile133513401345AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG AAC AAG CCC ATC TAC GAG 1634Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu135013551360AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC ACC GCC AAG GAG GTG ACC 1682Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr136513701375AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC AAG GAC GTG AGC CAC CTG 1730Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu1380138513901395TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC GTG ACC ATC AAG CTG AGC 1778Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser140014051410ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC AAC AGC ATC GGC AAG TGG 1826Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp141514201425ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC AAC GGC AAG AAG CAG TAC 1874Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr143014351440AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC CTG AAC ACC GAC GCC CAG 1922Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln144514501455GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC ATC AGC CTG TAC ATG AAG 1970Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys1460146514701475AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC ATC GAC GGC GAG ATA TAC 2018Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr148014851490CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC AAG GAC AAC TAC AAG CGC 2066Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg149515001505CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC AAC CCC ATC AGC AGC CTG 2114Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu151015151520CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG TTC TGG GAC GAC ATA TCG 2162His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser152515301535ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG AAC CTG ACC GAC AGC GAG 2210Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu1540154515501555ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC AAG CTG GAG GAC GGC ATC 2258Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile156015651570CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC GGC GAG TTC ATC AAC GAG 2306Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu157515801585GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC TAC GTG ACC AAG TAC GAG 2354Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu159015951600GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC GTG AGC GAC ACC CTG GAG 2402Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu
160516101615AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC AAG TTC GAC TTC ACC AAG 2450Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys1620162516301635TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC GAC AGC GGC CTG AAC TGG 2498Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp164016451650GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC GGC AAG GAG ATG AAC GTG 2546Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val165516601665TTC CAC CGC TAC AAC AAG TAGATCTGAG CT2576Phe His Arg Tyr Asn Lys1670(2)SEQ ID NO36信息(i)序列特征(A)长度852个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO36Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu1 5 10 15Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe20 25 30Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr35 40 45Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr50 55 60Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp65 70 75 80Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn85 90 95Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu100 105 110Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr115 120 125Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys130 135 140Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg145 150 155 160Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro165 170 175Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile Asp Glu180 185 190Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn195 200 205Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu210 215 220Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His225 230 235 240Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu245 250 255Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe260 265 270Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu275 280 285Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr290 295 300Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly305 310 315 320Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala325 330 335Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala340 345 350Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr355 360 365Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn370 375 380Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn385 390 395 400Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala405 410 415Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys420 425 430Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr435 440 445Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile450 455 460Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys465 470 475 480Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg485 490 495Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu500 505 510Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu515 520 525Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser530 535 540Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln545 550 555 560Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp565 570 575Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu580 585 590Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn595 600 605Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser610 615 620Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys625 630 635 640Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu645 650 655Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile660 665 670Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp675 680 685Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile690 695 700Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr705 7l0 715 720Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys725 730 735Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile740 745 750Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser755 760 765Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr770 775 780Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp785 790 795 800Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser805 810 815Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe820 825 830Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His835 840 845Arg Tyr Asn Lys850(2)SEQ ID NO37信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于制备pCIB5527的正向引物”(iii)假设否(xi)序列描述SEQ ID NO37GGATCCACA TACTGCAGAA CCTGAAGATC AC(2)SEQ ID NO38信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于制备pCIB5527的反向引物”(iii)假设否(xi)序列描述SEQ ID NO38AAGCTTCCAC TCCTTCTC(2)SEQ ID NO39信息(i)序列特征(A)长度1241个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置9..1238(D)其它信息/注=“包含在pCIB5527中的玉米优化的编码除去了芽孢杆菌属分泌信号的VIP2A(a)的序列”(xi)序列描述SEQ ID NO39GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC 50Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe855 860 865AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys870 875 880GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG 146Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu885 890 895GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC 194Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser900 905 910ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC 242Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp915 920 925 930AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG 290Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys935 940 945AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC 338Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly950 955 960AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG 386Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu965 970 975GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC 434Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala980 985 990CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC 482Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro995 100010051010AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC 530Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn101510201025AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG 578Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val103010351040GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC 626Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile104510501055GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala106010651070GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp1075108010851090CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC770Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp109511001105TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC818Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn111011151120GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG866Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys112511301135AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC914Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro114011451150GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC962Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe1155116011651170GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC 1010Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser117511801185ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC 1058Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile119011951200ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC 1106Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser120512101215GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC 1154Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp122012251230AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG 1202Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val1235124012451250AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG 1241Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn12551260(2)SEQ ID NO40信息(i)序列特征(A)长度410个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO40Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu1 5 10 15Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp20 25 30Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn35 40 45Lys Asn Asp Lle Lys Thr Asn Tyr Lys Glu Lle Thr Phe Ser Ile Ala50 55 60Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met65 70 75 80Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val85 90 95Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr100 105 110Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg115 120 125Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln130 135 140Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly145 150 155 160Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser165 170 175Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys180 185 190Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly195 200 205Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala210 215 220His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr225 230 235 240Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys245 250 255Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys260 265 270Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro275 280 285Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe290 295 300Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu305 310 315 320Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser325 330 335Leu Ser Ser Glu Arg Leu Ale Ale Phe Gly Ser Arg Lys Ile Ile Leu340 345 350Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile355 360 365Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys370 375 380Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg385 390 395 400Tyr Val Val Asp Ala Thr Leu Leu Thr Asn405 410(2)SEQ ID NO41信息(i)序列特征(A)长度72个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于构建pCIB5527的编码真核生物分泌信号的寡核苷酸”(iii)假设否(xi)序列描述SEQ ID NO41GGATCCACCA TGGGCTGGAG CTGGATCTTC CTGTTCCTGC TGAGCGGCGC CGCGGGCGTG 60CACTGCCTGC AG 72(2)SEQ ID NO42信息(i)序列特征(A)长度1421个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置9..1238(D)其它信息/注=“包含在pCIB5528中的玉米优化的编码除去了芽孢杆菌属分泌信号并插入了真核生物分泌信号的VIP2A(a)的DNA序列”(xi)序列描述SEQ ID NO42GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC50Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe415 420AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys425 430 435 440GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG146Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu445 450 455GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC194Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser460 465 470ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC242Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp475 480 485AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG290Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys490 495 500AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC338Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly505 510 515 520AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG386Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu525 530 535GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC434Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala540 545 550CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC482Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro555 560 565AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC530Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn570 575 580AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG578Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val585 590 595 600GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC626Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile
605 610 615GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala620 625 630GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp635 640 645CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC 770Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp650 655 660TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC 818Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn665 670 675 680GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG 866Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys685 690 695AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC 914Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro700 705 710GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC 962Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe715 720 725GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC1010Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser730 735 740ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC1058Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile745 750 755 760ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC1106Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser765 770 775GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC1154Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp780 785 790AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG1202Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val795 800 805AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG1241Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn810 815 820(2)SEQ ID NO43信息(i)序列特征(A)长度410个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO43Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu1 5 10 15Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp20 25 30Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn35 40 45Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala50 55 60Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met65 70 75 80Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val85 90 95Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr100 105 110Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg115 120 125Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln130 135 140Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly145 150 155 160Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser165 170 175Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys180 185 190Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly195 200 205Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala210 215 220His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr225 230 235 240Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys245 250 255Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys260 265 270Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro275 280 285Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe290 295 300Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu305 310 315 320Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser325 330 335Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu340 345 350Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile355 360 365Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys370 375 380Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg385 390 395 400Tyr Val Val Asp Ala Thr Leu Leu Thr Asn405 410(2)SEQ ID NO44信息(i)序列特征(A)长度86个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“用于构建pCIB5533的编码液泡定位肽的寡核苷酸”(iii)假设否(xi)序列描述SEQ ID NO44CCGCGGGCGT GCACTGCCTC AGCAGCAGCA GCTTCGCCGACAGCAACCCC ATCCGCGTGA CCGACCGCGC CGCCAGCACCCTGCAG(2)SEQ ID NO45信息(i)序列特征(A)长度1358个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置9..1355(D)其它信息/注="包含在pCIB5533中的玉米优化的编码除去了芽孢杆菌属分泌信号并插入了液泡定位信号的VIP2A(a)的DNA序列
(xi)序列描述SEQ ID NO45GATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC GCC50Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala415 420GCG GGC GTG CAC TGC CTC AGC AGC AGC AGC TTC GCC GAC AGC AAC CCC 98Ala Gly Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro425 430 435 440ATC CGC GTG ACC GAC CGC GCC GCC AGC ACC CTG CAG AAC CTG AAG ATC146Ile Arg Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile445 450 455ACC GAC AAG GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG194Thr Asp Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu460 465 470TGG GGC AAG GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG242Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys475 480 485GGC AAG ATG AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC290Gly Lys Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn490 495 500TAC AAG GAG ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC338Tyr Lys Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile505 510 515 520AAG GAC CTG AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC386Lys Asp Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser525 530 535AAC AGC ATC ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC434Asn Ser Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe540 545 550AAC AAG AGC CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC482Asn Lys Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala555 560 565CAG TTC AAG GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC530Gln Phe Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr570 575 580CTG GAC ACC CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG578Leu Asp Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val585 590 595 600ATC CTG AAG GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC626Ile Leu Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr605 610 615AAG GCC GGC GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC674Lys Ala Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp620 625 630AAC GGC TAC ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG722Asn Gly Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys635 640 645GGC GTG GAG TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC770Gly Val Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp650 655 660TTC AAG AAC GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC818Phe Lys Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn665 670 675 680TAC GAG GAG TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG866Tyr Glu Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu685 690 695GAC GGC TAC GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC914Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg700 705 710AAC CAG GGC GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC962Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn715 720 725ATC AGC GAC GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG 1010Ile Ser Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val730 735 740TAC CGC TGG TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC 1058Tyr Arg Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro745 750 755 760CTG CCC AGC CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG 1106Leu Pro Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys765 770 775GAG GAC AAG GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC 1154Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala780 785 790GCC TTC GGC AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC 1202Ala Phe Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly795 800 805AGC ACT GGT GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG 1250Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys810 815 820GAG ATC CTG CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC 1298Glu Ile Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr825 830 835 840GAG GTG ATC ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG 1346Glu Val Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu845 850 855CTG ACC AAC TAG 1358Leu Thr Asn(2)SEQ ID NO46信息(i)序列特征(A)长度449个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO46Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly1 5 10 15Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg20 25 30Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile Thr Asp35 40 45Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly50 55 60Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys65 70 75 80Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys85 90 95Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp100 105 110Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser115 120 125Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys130 135 140Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe145 150 155 160Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp165 170 175Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu180 185 190Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala195 200 205Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly210 215 220Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val225 230 235 240Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys245 250 255Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu260 265 270Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly275 280 285Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln290 295 300Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser305 310 315 320Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg325 330 335Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro340 345 350Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp355 360 365Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe370 375 380Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr385 390 395 400Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile405 410 415Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val420 425 430Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr435 440 445Asn(2)SEQ ID NO47信息(i)序列特征(A)长度16个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽(iii)假设否(ix)特征(A)名称/关键词肽(B)位置1..16(D)其它信息/注="用于构建pCIB的融合VIP1(a)和VIP2A(a)d接头肽"(xi)序列描述SEQ ID NO47Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser1 5 10 15(2)SEQ ID NO48信息(i)序列特征(A)长度66个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“编码用于构建pCIB5533的接头肽之DNA序列”(iii)假设否(xi)序列描述SEQ ID NO48CCCGGGCCTT CTACTCCCCC AACTCCCTCT CCTAGCACGC CTCCGACACC TAGCGATATC60GGATCC 66(2)SEQ ID NO49信息
(i)序列特征(A)长度4031个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其它核酸(A)描述/desc=“合成DNA”(iii)假设否(ix)特征(A)名称/关键词CDS(B)位置6..4019(D)其它信息/注="包含在pCIB5531中的玉米优化的编码VIP2A(a)-VIP1A(a)融合蛋白质的DNA序列"(xi)序列描述SEQ ID NO49GATCC ATG AAG CGC ATG GAG GGC AAG CTG TTC ATG GTG AGC AAG AAG 47Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys450 455 460CTC CAG GTG GTG ACC AAG ACC GTG CTG CTG AGC ACC GTG TTC AGC ATC95Leu Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile465 470 475AGC CTG CTG AAC AAC GAG GTG ATC AAG GCC GAG CAG CTG AAC ATC AAC 143Ser Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn480 485 490 495AGC CAG AGC AAG TAC ACC AAC CTC CAG AAC CTG AAG ATC ACC GAC AAG 191Ser Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys500 505 510GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG 239Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys515 520 525GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG 287Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met530 535 540AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG 335Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu545 550 555ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG 383Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu560 565 570 575AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC431Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile580 585 590ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC479Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser595 600 605CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG527Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys610 615 620GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC575Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr625 630 635CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG623His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys640 645 650 655GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC671Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly660 665 670GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC719Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr675 680 685ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG767Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu690 695 700TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC815Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn705 710 715GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG863Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu720 725 730 735TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC911Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr740 745 750GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC959Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly755 760 765GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC 1007Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp770 775 780GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG 1055Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp785 790 795TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC 1103Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser800 805 810 815CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG 1151Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys820 825 830GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC 1199Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly835 840 845AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT 1247Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly850 855 860GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG 1295Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu865 870 875CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC 1343Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile880 885 890 895ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC 1391Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn900 905 910TCC CGG GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG 1439Ser Arg Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro915 920 925ACA CCT AGC GAT ATC GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC ACC 1487Thr Pro Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr930 935 940ACC CAG AAG AAC CAG CAG AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC 1535Thr Gln Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly945 950 955TAC TAC TTC AAG GGC AAG GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC 1583Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro960 965 970 975ACG CGT GAC AGC ACC CTG ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG 1631Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu980 985 990CTG GAC AAG AAG CAG CAG GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG 1679Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu995 10001005ATC CAG AGC AAG GAG ACC GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC 1727Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp101010151020GAG CAG GCC ATC ATC GAG ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC 1775Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly102510301035AAG GAG AAG CAG GTG GTG CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC 1823Lys Glu Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile1040104510501055AAG ATC GAG TAC CAG AGC GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC 1871Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr106010651070TTC AAG GAG CTG AAG CTT TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG 1919Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln107510801085CAG GTG CAG CAG GAC GAG CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG 1967Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu109010951100AGC CAG GAG TTC CTG GCC AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG 2015Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln110511101115CAG ATG AAG CGC GAG ATC GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC 2063Gln Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser1120112511301135ATC CCC GAC CTG TGG GAG GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC 2111Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile114011451150GCC GTG AAG TGG GAC GAC AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC 2159Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe115511601165GTG AGC AAC CCC CTG GAG AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC 2207Val Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp117011751180TAC GAG AAG GCC GCC CGC GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC 2255Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr118511901195TTC AAC CCC CTG GTG GCC GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG 2303Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu1200120512101215AAG GTG ATC CTG AGC CCC AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC 2351Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Ash Ser Val Glu Ser122012251230CAC TCG AGC ACC AAC TGG AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG 2399His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val123512401245GAG GCC GGC ATC GGT CCC AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC 2447Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn125012551260TAC CAG CAC AGC GAG ACC GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC 2495Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly126512701275AAC ACC AGC CAG TTC AAC ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC 2543Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn1280128512901295GTG CGC TAC AAC AAC GTG GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC 2591Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro130013051310ACC ACC AGC TTC GTG CTG AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC 2639Thr Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala131513201325AAG TCG AAT TCC ACC GCC CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC 2687Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro133013351340AAG AAG GGC CAG AAC GGC ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC 2735Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn134513501355AGC CAC CCC ATC ACC CTG AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC 2783Ser His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn1360136513701375AAC AAG CCC ATG ATG CTG GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG 2831Asn Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys138013851390ATC AAG GAC ACC CAC GGC AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC 2879Ile Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly139514001405GTG ATC CAG CAG ATC AAG GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC 2927Val Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp141014151420GGC GAG CGC GTG GCC GAG AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC 2975Gly Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn142514301435CCC GAG GAC AAG ACC CCC AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG 3023Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu1440144514501455AGC TAC CCC GAC GAG ATC AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG 3071Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys146014651470AAC AAG CCC ATC TAC GAG AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC 3119Asn Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn147514801485ACC GCC AAG GAG GTG ACC AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC 3167Thr Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe149014951500AAG GAC GTG AGC CAC CTG TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC 3215Lys Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn150515101515GTG ACC ATC AAG CTG AGC ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC 3263Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu ser Asn Asp1520152515301535AAC AGC ATC GGC AAG TGG ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC 3311Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn154015451550AAC GGC AAG AAG CAG TAC AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC 3359Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr155515601565CTG AAC ACC GAC GCC CAG GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC 3407Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr157015751580ATC AGC CTG TAC ATG AAG AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC 3455Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr158515901595ATC GAC GGC GAG ATA TAC CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC 3503Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn1600160516101615AAG GAC AAC TAC AAG CGC CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC 3551Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser162016251630AAC CCC ATC AGC AGC CTG CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG 3599Asn Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu163516401645TTC TGG GAC GAC ATA TCG ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG 3647Phe Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu165016551660AAC CTG ACC GAC AGC GAG ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC 3695Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile166516701675AAG CTG GAG GAC GGC ATC CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC 3743Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr1680168516901695GGC GAG TTC ATC AAC GAG GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC 3791Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn170017051710TAC GTG ACC AAG TAC GAG GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC 3839Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn171517201725GTG AGC GAC ACC CTG GAG AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC 3887Val Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile173017351740AAG TTC GAC TTC ACC AAG TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC 3935Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr174517501755GAC AGC GGC CTG AAC TGG GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC 3983Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp1760176517701775GGC AAG GAG ATG AAC GTG TTC CAC CGC TAC AAC AAG TAGATCTGAG4029Gly Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys17801785CT4031(2)SEQ ID NO50信息(i)序列特征(A)长度1338个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO50Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln1 5 10 15Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu20 25 30Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln35 40 45Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu50 55 60Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys65 70 75 80Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn85 90 95Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr100 105 110Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu115 120 125Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr130 135 140Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr145 150 155 160Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln165 170 175Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu180 185 190Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr195 200 205Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile210 215 220Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val225 230 235 240His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu245 250 255Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile260 265 270Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala275 280 285Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg290 295 300Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser305 310 315 320Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu325 330 335Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly340 345 350Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys355 360 365Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr370 375 380Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg385 390 395 400Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr405 410 415Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp420 425 430Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys435 440 445Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Ser Arg450 455 460Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro465 470 475 480Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr Thr Gln485 490 495Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr500 505 510Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg515 520 525Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp530 535 540Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln545 550 555 560Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln565 570 575Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu580 585 590Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile595 600 605Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys610 615 620Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val625 630 635 640Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln645 650 655Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met660 665 670Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro675 680 685Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val690 695 700Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser705 710 715720Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu725 730 735Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn740 745 750Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val755 760 765Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser770 775 780Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala785 790 795 800Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln805 810 815His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr820 825 830Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg835 840 845Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr850 855 860Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser865 870 875 880Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys885 890 895Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His900 905 910Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys915 920 925Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys930 935 940Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile945 950 955 960Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu965 970 975Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu980 985 990Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr995 10001005Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys101010151020Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala1025103010351040Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp104510501055Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr106010651070Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser107510801085Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly109010951100Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn1105111011151120Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser112511301135Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp114011451150Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp1155 11601165Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro117011751180Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp1185119011951200Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu120512101215Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu122012251230Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu123512401245Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val125012551260Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser1265127012751280Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe128512901295Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser130013051310Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys131513201325Glu Met Asn Val Phe His Arg Tyr Asn Lys13301335(2)SEQ ID NO51信息(i)序列特征(A)长度2444个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(iii)假设否(ix)特征(A)名称/关键词 CDS(B)位置17..2444(D)其它信息/产物="3A(a)合成天然融合体"(xi)序列描述SEQ ID NO51GGATCCACCA ATGAAC ATG AAC AAG AAC AAC ACC AAG CTG AGC ACC CGC 49Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg1 5 10GCC CTG CCG AGC TTC ATC GAC TAC TTC AAC GGC ATC TAC GGC TTC GCC 97Ala Leu Pro Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala15 20 25ACC GGC ATC AAG GAC ATC ATG AAC ATG ATC TTC AAG ACC GAC ACC GGC145Thr Gly Ile Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly30 35 40GGC GAC CTG ACC CTG GAC GAG ATC CTG AAG AAC CAG CAG CTG CTG AAC193Gly Asp Leu Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn45 50 55GAC ATC AGC GGC AAG CTG GAC GGC GTG AAC GGC AGC CTG AAC GAC CTG241Asp Ile Ser Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu60 65 70 75ATC GCC CAG GGC AAC CTG AAC ACC GAG CTG AGC AAG GAG ATC CTT AAG289Ile Ala Gln Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys80 85 90ATC GCC AAC GAG CAG AAC CAG GTG CTG AAC GAC GTG AAC AAC AAG CTG337Ile Ala Asn Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu95 100 105GAC GCC ATC AAC ACC ATG CTG CGC GTG TAC CTG CCG AAG ATC ACC AGC385Asp Ala Ile Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser110 115 120ATG CTG AGC GAC GTG ATG AAG CAG AAC TAC GCC CTG AGC CTG CAG ATC433Met Leu Ser Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile125 130 135GAG TAC CTG AGC AAG CAG CTG CAG GAG ATC AGC GAC AAG CTG GAC ATC481Glu Tyr Leu Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile140 145 150 155ATC AAC GTG AAC GTC CTG ATC AAC AGC ACC CTG ACC GAG ATC ACC CCG529Ile Asn Val Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro160 165 170GCC TAC CAG CGC ATC AAG TAC GTG AAC GAG AAG TTC GAA GAG CTG ACC577Ala Tyr Gln Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr175 180 185TTC GCC ACC GAG ACC AGC AGC AAG GTG AAG AAG GAC GGC AGC CCG GCC625Phe Ala Thr Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala190 195 200GAC ATC CTG GAC GAG CTG ACC GAG CTG ACC GAG CTG GCC AAG AGC GTG673Asp Ile Leu Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val205 210 215ACC AAG AAC GAC GTG GAC GGC TTC GAG TTC TAC CTG AAC ACC TTC CAC721Thr Lys Asn Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His220 225 230 235GAC GTG ATG GTG GGC AAC AAC CTG TTC GGC CGC AGC GCC CTG AAG ACC769Asp Val Met Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr240 245 250GCC AGC GAG CTG ATC ACC AAG GAG AAC GTG AAG ACC AGC GGC AGC GAG817Ala Ser Glu Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu255 260 265GTG GGC AAC GTG TAC AAC TTC CTG ATC GTG CTG ACC GCC CTG CAG GCC865Val Gly Asn Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala270 275 280CAG GCC TTC CTG ACC CTG ACC ACC TGT CGC AAG CTG CTG GGC CTG GCC913Gln Ala Phe Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala285 290 295GAC ATC GAC TAC ACC AGC ATC ATG AAC GAG CAC TTG AAC AAG GAG AAG961Asp Ile Asp Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys300 305 310 315GAG GAG TTC CGC GTG AAC ATC CTG CCG ACC CTG AGC AAC ACC TTC AGC 1009Glu Glu Phe Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser320 325 330AAC CCG AAC TAC GCC AAG GTG AAG GGC AGC GAC GAG GAC GCC AAG ATG 1057Asn Pro Asn Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met335 340 345ATC GTG GAG GCT AAG CCG GGC CAC GCG TTG ATC GGC TTC GAG ATC AGC 1105Ile Val Glu Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser350 355 360AAC GAC AGC ATC ACC GTG CTG AAG GTG TAC GAG GCC AAG CTG AAG CAG 1153Asn Asp Ser Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln365 370 375AAC TAC CAG GTG GAC AAG GAC AGC TTG AGC GAG GTG ATC TAC GGC GAC 1201Asn Tyr Gln Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp380 385 390 395ATG GAC AAG CTG CTG TGT CCG GAC CAG AGC GAG CAA ATC TAC TAC ACC 1249Met Asp Lys Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr400 405 410AAC AAC ATC GTG TTC CCG AAC GAG TAC GTG ATC ACC AAG ATC GAC TTC 1297Asn Asn Ile Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe415 420 425ACC AAG AAG ATG AAG ACC CTG CGC TAC GAG GTG ACC GCC AAC TTC TAC 1345Thr Lys Lys Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr430 435 440GAC AGC AGC ACC GGC GAG ATC GAC CTG AAC AAG AAG AAG GTG GAG AGC 1393Asp Ser Ser Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser445 450 455AGC GAG GCC GAG TAC CGC ACC CTG AGC GCG AAC GAC GAC GGC GTC TAC 1441Ser Glu Ala Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr460 465 470 475ATG CCA CTG GGC GTG ATC AGC GAG ACC TTC CTG ACC CCG ATC AAC GGC 1489Met Pro Leu Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly480 485 490TTT GGC CTG CAG GCC GAC GAG AAC AGC CGC CTG ATC ACC CTG ACC TGT 1537Phe Gly Leu Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys495 500 505AAG AGC TAC CTG CGC GAG CTG CTG CTA GCC ACC GAC CTG AGC AAC AAG 1585Lys Ser Tyr Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys510 515 520GAG ACC AAG CTG ATC GTG CCA CCG AGC GGC TTC ATC AGC AAC ATC GTG 1633Glu Thr Lys Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val525 530 535GAG AAC GGC AGC ATC GAG GAG GAC AAC CTG GAG CCG TGG AAG GCC AAC 1681Glu Asn Gly Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn540 545 550 555AAC AAG AAC GCC TAC GTG GAC CAC ACC GGC GGC GTG AAC GGC ACC AAG 1729Asn Lys Asn Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys560 565 570GCC CTG TAC GTG CAC AAG GAC GGC GGC ATC AGC CAG TTC ATC GGC GAC 1777Ala Leu Tyr Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp575 580 585AAG CTG AAG CCG AAG ACC GAG TAC GTG ATC CAG TAC ACC GTG AAG GGC 1825Lys Leu Lys Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly590 595 600AAG CCA TCG ATT CAC CTG AAG GAC GAG AAC ACC GGC TAC ATC CAC TAC 1873Lys Pro Ser Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr605 610 615GAG GAC ACC AAC AAC AAC CTG GAG GAC TAC CAG ACC ATC AAC AAG CGC 1921Glu Asp Thr Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg620 625 630 635TTC ACC ACC GGC ACC GAC CTG AAG GGC GTG TAC CTG ATC CTG AAG AGC 1969Phe Thr Thr Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser640 645 650CAG AAC GGC GAC GAG GCC TGG GGC GAC AAC TTC ATC ATC CTG GAG ATC 2017Gln Asn Gly Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile655 660 665AGC CCG AGC GAG AAG CTG CTG AGC CCG GAG CTG ATC AAC ACC AAC AAC 2065Ser Pro Ser Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn670 675 680TGG ACC AGC ACC GGC AGC ACC AAC ATC AGC GGC AAC ACC CTG ACC CTG 2113Trp Thr Ser Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu685 690 695TAC CAG GGC GGC CGG GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT 2161Tyr Gln Gly Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser700 705 710 715TTT TCA ACT TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA 2209Phe Ser Thr Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val720 725 730AGG ATT AGA AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC 2257Arg Ile Arg Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser735 740 745GGT GCT AAA GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT 2305Gly Ala Lys Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp750 755 760AAC TTT TAT ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT 2353Asn Phe Tyr Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro765 770 775ATT GTA CAT TTT TAC GAT GTC TCT ATT AAG NAA GAT CGG GAT CTA ATA 2401Ile Val His Phe Tyr Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile780 785 790 795TTA ACA GTT TTT AAA AGC NAA TTC TTG TAT AAT GTC CTT GAT T 2444Leu Thr Val Phe Lys Ser Xaa Phe Leu Tyr Asn Val Leu Asp800 805(2)SEQ ID NO52信息(i)序列特征(A)长度809个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述 SEQ ID NO52Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe1 5 10 15Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp20 25 30Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu35 40 45Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys50 55 60Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn65 70 75 80Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln85 90 95Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr100 105 110Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val115 120 125Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys130 135 140Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val145 150 155 160Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile165 170 175Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr180 185 190Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu195 200 205Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val210 215 220Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly225 230 235 240Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile245 250 255Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr260 265 270Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr275 280 285Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr290 295 300Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val305 310 315 320Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala325 330 335Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys340 345 350Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr355 360 365Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp370 375 380Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu385 390 395 400Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe405 410 415Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys420 425 430Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly435 440 445Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr450 455 460Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val465 470 475 480Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala485 490 495Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg500 505 510Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile515 520 525Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile530 535 540Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr545 550 555 560Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His565 570 575Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys580 585 590Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His595 600 605Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn610 615 620Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr625 630 635 640Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu645 650 655Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys660 665 670Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly675 680 685Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg690 695 700Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg705 710 715 720Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser725 730 735Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val740 745 750Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu755 760 765Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr770 775 780Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile Leu Thr Val Phe Lys785 790 795 800Ser Xaa Phe Leu Tyr Asn Val Leu Asp80权利要求
1.一种实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-1。
2.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21058的蜡状芽孢杆菌。
3.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21060的苏云金芽孢杆菌。
4.一种芽孢杆菌菌株,该菌株在营养生长期间产生杀虫蛋白质,其中所说的芽孢杆菌是选自保藏号为NRRL B-21224,NRRL B-21225,NRRLB-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌。
5.一种昆虫特异性蛋白质,该蛋白质及其组分可从芽孢杆菌属几个种的营养生长期间分离到,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。
6.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌选自苏云金芽孢杆菌和蜡状芽孢杆菌。
7.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质对鞘翅目或鳞翅目是毒性的。
8.权利要求5的昆虫特异性蛋白质,其中杀虫活性谱包括针对地老虎属和/或灰翅夜蛾属的物种,但是优选地是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。
9.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21058的蜡状芽孢杆菌。
10.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是保藏号为NRRL B-21060的苏云金芽孢杆菌。
11.权利要求5的昆虫特异性蛋白质,其中所说的芽孢杆菌是选自保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌。
12.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质分子量大约为30kDa或者更大。
13.权利要求12的昆虫特异性蛋白质,其中所说的蛋白质分子量为大约60到大约100kDa。
14.权利要求12的昆虫特异性蛋白质,其中所说的蛋白质分子量大约为80kDa。
15.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质包含选自SEQID NO2,SEQ ID NO5,SEQ ID NO7的序列,并包括其同源序列。
16.权利要求5的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO20,SEQ ID NO21,SEQ ID NO29,SEQ ID NO32和SEQID NO2给出的序列,包括其同源序列。
17.权利要求8的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQID NO29和SEQ ID NO给出的序列,包括其同源序列。
18.按照权利要求5到15任一之昆虫特异性蛋白质,其中代表分泌信号的序列被除去或灭活。
19.一种辅助蛋白质,该蛋白质能够提高昆虫特异性蛋白质的昆虫特异性活性。
20.权利要求19的辅助蛋白质,其中所说的辅助蛋白质分子量为大约50kDa。
21.权利要求19的辅助蛋白质,其中所说的辅助蛋白质得自蜡状芽孢杆菌。
22.权利要求19到21任一之辅助蛋白质,其中所说的辅助蛋白质和所说的昆虫特异性蛋白质都得自菌株AB78。
23.按照权利要求19到22任一之辅助蛋白质,其中代表分泌信号的序列被除去或灭活。
24.一个多亚基杀虫蛋白质,该蛋白质包含一个以上的多肽链,其中所说的多肽链中至少有一个多肽链代表权利要求5到18任一之昆虫特异性蛋白质和至少有一个多肽链代表按照权利要求19至23任一之昆虫辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
25.按照权利要求24的多亚基杀虫蛋白质,其分子量为大约50kDa到大约200kDa。
26.权利要求25的多亚基杀虫蛋白质,该蛋白质包含权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
27.一种包含几个蛋白质结构域的融合蛋白,该融合蛋白至少包含一种权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19至23任一之昆虫辅助蛋白质,它由符合读框的融合基因产生,当融合基因由核糖体翻译时,产生融合蛋白,该蛋白质至少具有权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质和其它的用于融合的可有可无的组分的组合的特性。
28.按照权利要求27的融合蛋白,该蛋白质包含核糖核酸酶S-蛋白质,按照权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质。
29.按照权利要求27的融合蛋白,该蛋白质包含按照权利要求5的昆虫特异性蛋白质和按照权利要求19的辅助蛋白质,所说的融合蛋白的N-末端是昆虫特异性蛋白质或者辅助蛋白质。
30.按照权利要求29的融合蛋白,该蛋白质包含形成SEQ ID NO23给出的蛋白质之SEQ ID NO5给出的昆虫特异性蛋白质和SEQ ID NO2给出的辅助蛋白质,包括其同源蛋白质。
31.按照权利要求29的融合蛋白,该蛋白质包含形成SEQ ID NO50给出的蛋白质之SEQ ID NO35给出的昆虫特异性蛋白质和SEQ ID NO27的辅助蛋白质,包括其同源蛋白质。
32.按照权利要求28的融合蛋白,该蛋白质包含融合成信号序列的权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质,就受蛋白质而言,所述信号序列是异源源。
33.按照权利要求32的融合蛋白,其中所说的信号序列是分泌信号。
34.按照权利要求32的融合蛋白,其中所说的信号序列是导向序列,这种序列指导特异性转基因产物向细胞器或细胞区室转移。
35.按照权利要求33的融合蛋白,其中该蛋白质包含SEQ ID NO43给出的序列,包括其同源序列。
36.按照权利要求34的融合蛋白,其中的融合蛋白包含SEQ ID NO46给出的序列,包括其同源序列。
37.一种DNA分子,这种DNA分子包含编码权利要求5-7,9,10,12-15,和19-22任一之蛋白质的核苷酸序列。
38.一种DNA分子,这种DNA分子包含编码权利要求8,11,16-18和23-26任一之蛋白质的核苷酸序列。
39.一种DNA分子,这种DNA分子包含编码可从芽孢杆菌属几个种的营养生长期间分离的昆虫特异性蛋白质及其组分的核苷酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。
40.权利要求39中的DNA分子,其中所说的分子包含SEQ ID NO4或SEQ ID NO6给出的核苷酸序列,包括其同源序列。
41.权利要求39中的DNA分子,其中所说的分子包含SEQ ID NO19,SEQ ID NO28,SEQ ID NO31或SEQ ID NO1给出的核苷酸序列,包括其同源序列。
42.一种DNA分子,这种分子包含编码能够提高昆虫特异性蛋白质的昆虫特异性活性的辅助蛋白质的核苷酸序列。
43.权利要求42中的DNA分子,其中所说的分子包含SEQ ID NO19给出的核苷酸序列,包括其同源序列。
44.按照权利要求37,39,40或42任一之DNA分子,这种分子包含被优化以适于在微生物中表达的核苷酸序列。
45.按照权利要求37,39,40或42的DNA分子,这种分子包含被优化以适于在植物中表达的核苷酸序列。
46.按照权利要求38,41或43任一之DNA分子,这种分子包含全部或部分优化以适于在微生物中表达的核苷酸序列。
47.按照权利要求38,41或43的DNA分子,这种分子包含被优化以适于在植物中表达的核苷酸序列。
48.权利要求45的DNA分子,其中所说的分子包含SEQ ID NO17或SEQ ID NO18给出的核苷酸序列,包括其同源序列。
49.权利要求47的DNA分子,其中所说的分子包含SEQ ID24,SEQ IDNO26,SEQ ID NO27或SEQ ID NO30给出的核苷酸序列,包括其同源序列。
50.一种DNA分子,这种分子包含编码多亚基杀虫蛋白质的核苷酸序列,所述蛋白质包含一个以上的多肽链,其中该多肽链中至少有一个多肽链代表权利要求5到18任一之昆虫特异性蛋白质和至少有一个多肽链代表按照权利要求19到23任一之昆虫辅助蛋白质,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
51.权利要求50中的DNA分子,这种分子包含编码权利要求5到18任一之昆虫特异性蛋白质和按照权利要求19到23任一之昆虫辅助蛋白质的核苷酸序列,这种辅助蛋白质激活或提高所说的昆虫特异性蛋白质的杀虫活性。
52.权利要求51中的DNA分子,其中所说的分子包含SEQ ID NO1或SEQ ID NO19给出的核苷酸序列,包括其同源序列。
53.一种编码融合蛋白的DNA分子,该融合蛋白包含几个蛋白质结构域,其中至少包括一种权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之昆虫辅助蛋白质,它由符合读框的融合基因产生,当融合基因由核糖体翻译时,产生融合蛋白。该蛋白质至少具有权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之辅助蛋白质和其它可有可无的用于融合的组分的结合的特性。
54.权利要求53中的DNA分子,该DNA分子编码按照权利要求5的昆虫特异性蛋白质和按照权利要求19的辅助蛋白质,其中所说的融合蛋白的N-末端是昆虫特异性蛋白质或辅助蛋白质。
55.权利要求53中的DNA分子,其中所说的分子包含SEQ ID NO22给出的核苷酸序列,包括其同源序列。
56.权利要求53中的编码融合蛋白的DNA分子,其中所说的融合蛋白包含融合成信号序列的权利要求5到18任一之昆虫特异性蛋白质和/或按照权利要求19到23任一之昆虫辅助蛋白质,就受体DNA而言,其是异源源。
57.权利要求56中的DNA分子,其中所说的信号序列是分泌信号。
58.权利要求56中的DNA分子,其中所说的信号序列是指导特异性转基因产物向细胞器或细胞分室转移的导向序列。
59.按照权利要求53到58任一之DNA分子,其中其组分序列至少一种包含被优化以适于在微生物中表达的核苷酸序列。
60.按照权利要求53到58任一之DNA分子,其中其组分序列至少一种包含被优化以适于在植物中表达的核苷酸序列。
61.权利要求60中的DNA分子,其中所说的分子包含SEQ ID NO42,SEQ ID NO45,或SEQ ID NO49给出的核苷酸序列,包括其同源序列。
62.权利要求45中的DNA分子,其中编码分泌信号的序列从这种DNA分子的5′端除去。
63.权利要求62中的DNA分子,其中所说的分子包含SEQ ID NO35或SEQ ID NO39给出的核苷酸序列,并包括其同源序列。
64.一种DNA分子,这种DNA分子能在适当严格的条件下和按照权利要求37-63任一之DNA分子杂交,而且具有昆虫特异性活性。
65.权利要求64中的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M磷酸钠的缓冲液中。
66.一种昆虫特异性蛋白质,其中所说的蛋白质由权利要求64或65中的DNA分子编码。
67.一种表达盒,该表达盒包含可操作连结到植物表达序列和可有可无的其它调节序列上的,按照权利要求37,39,40,42,44,45或48任一之DNA分子,其中所说的植物表达序列包含相关DNA构建体在宿主有机体中的表达所必需的转录和翻译调节信号。
68.一种表达盒,该表达盒包含按照权利要求38,41,43,46,47或49-65任一之DNA分子可操作地连结植物表达序列和可有可无的调节序列。其中植物表达序列包含对于结合DNA构建体在宿主有机体中的表达是必须的转录和翻译调节信号。
69.按照权利要求69的表达盒,其中所说的宿主有机体是植物。
70.按照权利要求68的表达盒,其中所说的宿主有机体是植物。
71.一种载体分子,该分子包含按照权利要求67或69的表达盒。
72.一种载体分子,该分子包含按照权利要求68或70的表达盒。
73.按照权利要求69或70的表达盒或按照权利要求71或73的载体是植物基因组的一部分。
74.一种宿主有机体,该有机体包含按照权利要求37,39,40,42,44,45或48任一之DNA分子、含有所说的DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
75.一种宿主有机体,该有机体包含按照权利要求38,41,43,46,47或49-65任一之DNA分子、含有所说的DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
76.按照权利要求74或75的宿主有机体,该有机体选自植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻类。
77.一种包括植物体部分、后代及其种子在内的转基因植物,该植物包含权利要求37,39,40,42,44,45或48任一之DNA分子、含有所述DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
78.一种包括植物体部分、后代及其种子在内的转基因植物,该植物包含权利要求38,41,43,46,47或49-65任一之DNA分子、含有所述DNA分子的表达盒或含有该表达盒的载体分子,优选地是稳定地掺合进宿主有机体的基因组。
79.一种包含植物体部分、后代及其种子在内的转基因植物,该植物可以用权利要求38,41,43,46,47或49-65任一之DNA分子稳定地转化。
80.一种包含植物体部分、后代及其种子在内的转基因植物,该植物能表达权利要求5,7,9,10,12-15或19-22任一之昆虫特异性蛋白质。
81.一种包含植物体部分、后代及其种子在内的转基因植物,该植物能够表达权利要求8,11,16-18,23-36或66任一之昆虫特异性蛋白质。
82.按照权利要求80或81的转基因植物,该植物还表达第二种不同的昆虫防治素。
83.权利要求82的转基因植物,其中所说的第二种昆虫防治素是Btδ-内毒素。
84.按照权利要求77到83任一之转基因植物,该植物是玉米植物。
85.按照权利要求77到84任一之转基因植物,该植物是杂交植物。
86.用种子保护剂包衣剂处理过的按照权利要求77到84任一之植物繁殖材料。。
87.一种微生物,该微生物用按照权利要求66到70任一之表达盒和/或按照权利要求71或72任一之载体分子转化过,该微生物优选的是在植物上繁殖的微生物。
88.权利要求87的微生物,该微生物是一种根定居性细菌。
89.一种胶囊化的昆虫特异性蛋白质,该蛋白质包含权利要求87或88任一之微生物,此微生物包含按照权利要求18或23的昆虫特异性蛋白质。
90.一种杀虫组合物,该组合物包含有效杀虫量的权利要求74-76任一之宿主有机体以及适当的载体。
91.一种杀虫组合物,该组合物包含有效杀虫量的权利要求1-4任一之纯化的芽孢杆菌菌株以及适当的载体。
92.一种杀虫组合物,该组合物包含按照权利要求5到36和66任一之分离蛋白质分子以及适当的载体。所述蛋白质分子单独或与权利要求74-76任一之宿主有机体和/或权利要求89中的胶囊化昆虫特异性蛋白质结合。
93.一种获得按照权利要求5到36任一之纯化的昆虫特异性蛋白质的方法,该方法包括把包含该昆虫特异性蛋白质的溶液加入到NAD柱中并洗脱大量的蛋白质。
94.一种用于鉴别按照权利要求5到36任一之昆虫特异性蛋白质的杀虫活性的方法,该方法包括(a)在培养基中培养芽孢杆菌菌株;(b)从所述的培养基获得上清液;(c)用所述上清液饲喂昆虫幼虫;(d)测定死亡率。
95.一种用于分离按照权利要求5到36任一之昆虫特异性蛋白质的方法,该方法包括(a)在培养基中培养芽孢杆菌菌株;(b)从所述培养基获得上清液;(c)从该上清液中分离所说的昆虫特异性蛋白质。
96.一种用于分离DNA分子的方法,该DNA分子包含编码昆虫特异性蛋白质的核苷酸序列,该蛋白质显示出权利要求5到36任一之蛋白质的杀虫活性,该方法包括(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;(b)用从芽孢杆菌属微生物获得的DNA与该DNA分子杂交;(c)分离所述杂交DNA。
97.一种增加昆虫靶范围的方法,该方法通过使用与至少一种不同于权利要求5到36任一之昆虫特异性蛋白质的第二杀虫蛋白质组合的权利要求5到36任一之昆虫特异性蛋白质。
98.一种增加昆虫靶范围的方法,其中将按照权利要求5到36任一之昆虫特异性蛋白质与至少一种不同于权利要求5到36任一之昆虫特异性蛋白质的第二杀虫蛋白质一起在植物中表达。
99.一种按照权利要求97或98的方法,其中所说的第二杀虫蛋白质选自Btδ-内毒素、蛋白质酶抑制因子、外源凝集素、α-淀粉酶和过氧化物酶。
100.一种保护植物使之免受由虫害造成的破坏的方法,该方法包括对植物或该植物的生长区域施用按照权利要求90到92任一之杀虫组合物。
101.一种保护植物使之免受由虫害造成的损坏的方法,该方法包括对植物施用权利要求5到36任一之毒素蛋白质。
102.一种保护植物使之免受由虫害造成的破坏的方法,该方法包括种植转基因植物,这种植物在虫害发生的区域内表达权利要求5到36任一之昆虫特异性蛋白质。
103.一种产生按照权利要求74到76的宿主有机体的方法,该方法包括用权利要求67到70和73任一之DNA分子和按照权利要求71和72的载体分子转化宿主有机体。
104.一种产生按照权利要求77到85任一之转基因植物和植物细胞的方法,这种方法包括用按照权利要求70或73任一之表达盒或按照权利要求72的载体分子分别转化所说的植物和植物细胞。
105.一种产生按照权利要求90到92任一之杀虫组合物的方法,该方法包括把按照权利要求1到4任一之芽孢杆菌菌株和/或按照权利要求74到76的宿主有机体和/或按照权利要求5到36和66任一之分离的蛋白质分子和/或按照权利要求89中的胶囊化的蛋白质以有效杀虫剂量与一个合适的载体混合。
106.一种产生转基因亲本植株之转基因后代的方法,该方法包括把含有编码按照权利要求5到36和66任一之昆虫特异性蛋白质的核苷酸序列的DNA分子稳定地掺入植物基因组,该方法还包括用按照权利要求70或73任一之表达盒或按照权利要求72的载体分子转化所说的亲本植株,并用已知植物育种技术把杀虫特性转移到上述的转基因亲本植株的后代中。
107.一种寡核苷酸探针,该探针能和编码在芽孢杆菌属的几个种营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素,其中所说的探针包含为上述昆虫特异性蛋白质编码的序列之邻接部分长度至少为10个核苷酸。
108.寡核苷酸探针在筛选芽孢杆菌菌株和其它有机体以确定是否有天然昆虫特异性蛋白质存在或特定的转化有机体是否包含所说的基因上的用途。
109.一种DNA分子,这种分子包含编码权利要求8,11,16-18和23到36任一之蛋白质的核苷酸序列,该序列可通过以下步骤获得(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;(b)用按照权利要求107中的寡核苷酸探针与上述DNA分子杂交,其中的寡核苷酸探针从包含SEQ ID NO28,SEQ ID NO30或SEQ ID NO31给出的核苷酸序列的DNA分子获得;(c)分离所说的杂交DNA。
全文摘要
本发明涉及杀虫菌株和蛋白质。本发明提供了能够在营养生长期间产生杀虫蛋白质和辅助蛋白质的芽孢杆菌属菌株。本发明也提供了纯化的蛋白质,编码这些蛋白质的核苷酸序列以及使用这些菌株、蛋白质和基因防治害虫的方法。
文档编号C07K16/00GK1160420SQ95195349
公开日1997年9月24日 申请日期1995年9月27日 优先权日1994年9月28日
发明者G·W·沃伦, M·G·科泽尔, M·A·默林斯, G·J·奈, B·卡尔, N·M·德塞, K·科斯蒂克卡, N·B·达克, J·J·埃斯特鲁克 申请人:诺瓦提斯公司