专利名称:生产依马菌素的方法和组合物的制作方法
技术领域:
本发明涉及农用化学品领域,特别是杀虫剂领域。更特别地,本发明涉及除虫菌素的衍生化,尤其是依马菌素(emamectin)的合成。
背景技术:
依马菌素是一种潜在的杀虫剂,控制多种害虫例如蓟马、潜叶虫和蠕虫,所述蠕虫包括美洲苜蓿粉蝶、甜菜夜蛾、白菜金翅夜蛾、棉铃虫、切根虫、菜蛾、烟夜蛾、谷实夜蛾、番茎麦蛾。在美国专利号4,874,749和Cvetovich,R.J.等,J.Organic Chem.597704-7708,1994中描述了依马菌素(4”-脱氧-4”-表-N-甲基氨基除虫菌素Bla/Blb)(称为MK-244)。
美国专利号5,288,710描述了农用化学中特别有用的依马菌素的盐。这些依马菌素的盐是有用的杀虫剂,特别用于对抗昆虫及螨目(Acarina)的典型代表。在欧洲专利申请EP-A 736,252中列出了依马菌素有效对抗的一些害虫。
使用依马菌素的一个缺点是从除虫菌素合成依马菌素困难。这是由于所述过程的第一步引起的,该步是制备依马菌素的最昂贵和耗时的步骤,其中除虫菌素的4”-甲醇基团必须被氧化成酮。4”-甲醇基团的氧化难以解决是由于分子中存在其它两个羟基,而这两个羟基必须在氧化前进行化学保护并且氧化后去保护。这样,所述的第一步显著地提高从除虫菌素制备依马菌素的整体成本和时间。
由于依马菌素作为杀虫剂的效力和能力,有必要发展一种节省成本和时间的方法和/或试剂用于区域选择性地氧化除虫菌素的4”-甲醇基团以制备4”-酮-除虫菌素,而后者为从除虫菌素制备依马菌素的必需中间体。
发明内容
本发明提供P450单加氧酶新家族,该家族中的每一个成员能够区域选择性地氧化未保护的除虫菌素的4”-甲醇基团,由此提供一种廉价、有效制备4”-酮-除虫菌素(即制备依马菌素中的必需中间体)的方法。本发明允许除去昂贵、耗时的步骤(1)在氧化4”-甲醇基团之前,化学保护除虫菌素分子上的其它两个在氧化前必须化学保护的羟基;和(2)在氧化后化学去保护所述其它两个羟基。因此,本发明提供了显著降低从除虫菌素制备依马菌素的整体成本的试剂和方法。
●因此,一方面,本发明提供一种纯化的核酸分子,该核酸分子编码一种显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在一个具体实施方式
中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽基本上与SEQ ID NO2所示多肽相似,并优选与SEQ ID NO2多肽具有至少50%至99%之间的氨基酸序列同一性,并且所述50%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在进一步的具体实施方式
中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽与抗SEQ ID NO2所示多肽的抗体有免疫学反应性。
●本发明进一步提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列a)如SEQ ID NO1所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO1所示的核苷酸序列或其互补序列的50至200或更多连续核苷酸;
e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列,或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性氧化为4”-酮-除虫菌素的多肽。
●在一个具体的实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含一种编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽基本上与SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ IDNO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ IDNO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ IDNO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ IDNO32、SEQ ID NO34或SEQ ID NO95所示多肽相似,并优选与其具有至少60%至99%之间氨基酸序列同一性,并且所述60%和99%之间范围内的每一个单个的数字也是本发明的一部分。
●在进一步的具体实施方式
中,本发明涉及一种纯化的核酸分子,该核酸分子包含一种编码显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的核苷酸序列,其中所述多肽与抗如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ IDNO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ IDNO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ IDNO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ IDNO32、SEQ ID NO34或SEQ ID NO95所示多肽的抗体有免疫学反应性。
●本发明进一步提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列a)如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33或SEQ ID NO94所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或SEQ IDNO94所示的核苷酸序列或其互补序列的50至200或更多连续核苷酸;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
在某些实施方式中,所述核酸分子包含与SEQ ID NO1具有至少66%至99%之间同一性的核酸序列或实质上由这种核酸序列构成,并且所述66%和99%之间范围内的每一个单个的数字也是本发明的一部分。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33或SEQ ID NO94具有至少70%至99%之间同一性的核酸序列,并且所述70%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在一些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33或SEQ ID NO94具有至少80%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33或SEQ ID NO94具有至少90%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ IDNO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ IDNO31、SEQ ID NO33或SEQ ID NO94具有至少95%同一性的核酸序列。
●在某些实施方式中,所述核酸分子包含以下核酸序列或实质上由以下核酸序列构成,所述核酸序列选自SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33和SEQ ID NO94。
●在特定实施方式中,所述核酸分子分离自链霉菌属(Streptomyces)的株系。在某些实施方式中,链霉菌的株系选自杀结核链霉菌(Streptomyces tubercidicus)、利迪链霉菌(Streptomyceslydicus)、普拉特链霉菌(Streptomyces platensis)、恰塔努加链霉菌(Streptomyces chattanoogensis)、春日链霉菌(Streptomyceskasugaensis)和龟裂链霉菌(Streptomyces rimosus)和生白链霉菌(Streptomyces albofaciens)。
●在这方面的某些实施方式中,核酸分子进一步包含编码通过共价键连接于P450单加氧酶的标签的核酸序列。在某些实施方式中,所述的标签选自组氨酸标签、GST标签、HA标签、HSV标签、Myc-标签和VSV-G-标签。
●在另一方面,本发明提供一种纯化的多肽,该多肽显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。
●在一些实施方式中,所述多肽包含以下核酸分子编码的氨基酸序列或本质上由这种氨基酸序列构成,所述核酸分子a)如SEQ ID NO1或其互补序列所示;b)与(a)基本上相似;c)能与(a)或其互补序列杂交;d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO1所示的核苷酸序列或其互补序列的50至200个或更多连续核苷酸;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
在一些实施方式中,所述多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2具有至少50%至99%同一性的氨基酸序列,并且所述50%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在一些实施方式中,所述多肽包含以下核酸分子编码的氨基酸序列或本质上由这种氨基酸序列构成,所述核酸分子
a)如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33或ID NO94或其互补序列所示;b)与(a)基本上相似;c)能与(a)或其互补序列杂交;d)能够与一种核酸分子杂交,该核酸分子包含如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或ID NO94所示的核苷酸序列或其互补序列的50至200或更多个连续核苷酸,或其互补序列;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少60%至99%之间同一性的氨基酸序列,并且所述60%和99%之间范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少70%同一性的氨基酸序列。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少80%同一性的氨基酸序列。
●在一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少90%同一性的氨基酸序列。
●在某些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少95%同一性的氨基酸序列。
●在本发明该方面的一些实施方式中,P450单加氧酶包含以下氨基酸序列或本质上由以下氨基酸序列构成,所述氨基酸序列选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ IDNO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ IDNO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ IDNO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ IDNO34和SEQ ID NO95。
●在某些实施方式中,根据本发明显示P450单加氧酶的酶活性的多肽还包含标签。在一些实施方式中,所述的标签选自组氨酸标签、GST标签、HA标签、HSV标签、Myc-标签和VSV-G-标签。
●在另一方面,本发明提供一种结合剂,该结合剂与根据本发明的多肽特异性结合,根据本发明的多肽显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的酶活性。在一些实施方式中,结合剂为抗体。在某些实施方式中,抗体为多克隆抗体或单克隆抗体。
●在另一方面,本发明提供一个P450单加氧酶多肽家族,其中,该家族中的每个成员都能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2所示氨基酸序列具有至少50%至99%同一性的氨基酸序列,并且在50%至99%范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ IDNO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ IDNO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95所示氨基酸序列具有至少60%至99%同一性的氨基酸序列,并且在60%至99%范围内的每一个单独的数字也是本发明的一部分。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ IDNO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ IDNO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95所示氨基酸序列具有至少70%同一性的氨基酸序列。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ IDNO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ IDNO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95所示氨基酸序列具有至少80%同一性的氨基酸序列。在一些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95所示氨基酸序列具有至少90%同一性的氨基酸序列。
●在某些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下氨基酸序列构成与如SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ IDNO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ IDNO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95所示氨基酸序列具有至少95%同一性的氨基酸序列。
●在本发明这方面的一些实施方式中,该家族的每个成员包含以下氨基酸序列或实质上由以下的氨基酸序列构成,所述氨基酸序列选自SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34和SEQ ID NO95。
●在另一方面中,本发明提供一种细胞,该细胞经基因工程化包含一种编码显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子。
●在一些实施方式中,将所述核酸分子定位以在细胞中表达。在某些实施方式中,细胞还包含一种核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白酶活性的多肽的核苷酸序列。
●在一些实施方式中,该细胞还包含一种核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白还原酶蛋白的酶活性的多肽的核苷酸序列。
●在某些实施方式中,细胞为基因工程化的链霉菌属的株系。在某些实施方式中,细胞为基因工程化的浅青紫链霉菌(Streptomyceslividans)株系。在特定实施方式中,所述的基因工程化的浅青紫链霉菌株系具有NRRL指定号B-30478。在一些实施方式中,细胞为基因工程化的假单胞菌属(Pseudomonas)的株系。在一些实施方式中,细胞为基因工程化的恶臭假单胞菌(Pseudomonas putida)株系。在某些实施方式中,基因工程化的恶臭假单胞菌株系具有NRRL指定号B-30479。在一些实施方式中,细胞为基因工程化的大肠杆菌(Escherichia coli)株系。
●在另一方面,本发明提供一种纯化的核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白的酶活性的多肽的核苷酸序列,其中,所述的核酸分子分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。
●在特定实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示铁氧还蛋白的酶活性的多肽的核苷酸序列,其中所述多肽与如SEQ ID NO36或SEQ ID NO38所示的多肽基本上相似,优选与其具有至少80%至90%氨基酸序列同一性,并且,所述的80%至90%之间范围内的每一个单独的数字也是本发明的一部分。
●在进一步的特定实施方式中,本发明涉及一种纯化的核酸分子,该核酸分子包含编码显示铁氧还蛋白酶活性的多肽的核苷酸序列,其中所述多肽与抗SEQ ID NO36或SEQ ID NO38所示多肽的抗体有免疫学反应性。
●本发明还提供一种纯化的核酸分子,该核酸分子包含一种核苷酸序列,该核苷酸序列a)如SEQ ID NO35或SEQ ID NO37所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与包含SEQ ID NO35或SEQ ID NO37所示核苷酸序列的50至200或更多个连续核苷酸的核酸分子或其互补序列杂交;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,其编码仍显示铁氧还蛋白的酶活性并且能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
●在某些实施方式中,编码本发明的铁氧还蛋白的核酸分子包含以下核酸序列或本质上由以下核酸序列构成与SEQ ID NO35或SEQ ID NO37具有至少81%同一性的核酸序列。在一些实施方式中,该核酸分子包含以下核酸序列或本质上由以下核酸序列构成与SEQID NO35或SEQ ID NO37具有至少85%或至少90%,或至少95%,或至少99%同一性的核酸序列。在某些实施方式中,编码本发明的铁氧还蛋白的核酸分子包含或本质上由SEQ ID NO35或SEQ IDNO37的核酸序列构成。
●在另一方面,本发明提供一种纯化的铁氧还蛋白,其中所述的铁氧还蛋白分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。在某些实施方式中,本发明的铁氧还蛋白包含或本质上由与SEQ ID NO36或SEQ ID NO38具有至少80%同一性的氨基酸序列构成。在一些实施方式中,所述的核酸分子包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ IDNO36或SEQ ID NO38具有至少85%,或至少90%,或至少95%,或至少99%同一性的氨基酸序列。
●在特定实施方式中,本发明的铁氧还蛋白包含SEQ ID NO36或SEQ ID NO38所示的氨基酸序列或本质上由该氨基酸序列构成。
●在另一方面,本发明提供一种纯化的核酸分子,该核酸分子包含编码根据本发明显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列,其中所述核酸分子分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。
●在某些实施方式中,包含编码根据本发明显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列的核酸分子包含SEQ ID NO98、SEQID NO100、SEQ ID NO102或SEQ ID NO104所示的核酸序列或本质上由该核酸序列构成。
●在另一方面,本发明提供一种纯化的多肽,该多肽显示铁氧还蛋白还原酶蛋白的酶活性,其中所述多肽分离自含有能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的链霉菌属株系。在某些实施方式中,本发明的该多肽包含或本质上由SEQ ID NO99、SEQ ID NO101、SEQ ID NO103或SEQ ID NO105所示的氨基酸序列构成。
●在另一方面,本发明提供一种制备式(I)化合物的方法
其中R1-R9相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,E/Z异构体,E/Z异构体的混合物,和/或其互变异构体,每种情况中为游离形式或盐形式,其中该方法包括1)将式(II)化合物
其中R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给出的含义相同,与根据本发明的多肽接触,所述多肽能够区域选择性地氧化在4”位的醇,以形成式(III)化合物 其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)中给出的含义相同;和
2)使式(III)化合物与式HN(R8)R9的胺在还原剂存在的情况下反应,其中R8和R9与式(I)中给定的含义相同,并且其是已知的;并且,在每种情况下,如果需要,将按照本方法或其它方法可获得的式(I)化合物、或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出所需的异构体;和/或将可按照本方法和其它方法获得的游离式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
●在一些实施方式中,使式(II)化合物进一步与根据本发明显示铁氧还蛋白酶活性的多肽接触。在某些实施方式中,使式(II)化合物进一步与根据本发明显示铁氧还原白还原酶酶活性的多肽接触。在一些实施方式中,使式(II)化合物进一步与还原剂(例如,NADH或NADPH)接触。
●在进一步的实施方式中,本发明提供一种制备式(III)化合物的方法
其中R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与权利要求1的式(I)中给定的含义相同,其中所述方法包括1)使式(II)化合物 其中R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,
与根据本发明能够区域选择性地氧化在4”位的醇的多肽接触,将所述接触保持足够发生氧化反应的时间并且分离和纯化式(II)化合物。
●在另一实施方式中,本发明提供一种根据本发明制备式(I)化合物的方法,其中n为1;m为1;A为双键;B为单键或双键,C为双键,D为单键,E为双键,F为双键;或单键和环氧桥;或单键和亚甲基桥;R1、R2和R3为H;R4为甲基;R5为C1-C10-烷基,C3-C8-环烷基或C2-C10-链烯基;R6为H;R7为OH;R8和R9相互独立地为H;C1-C10-烷基或C1-C10-酰基;或一起形成-(CH2)q-;且q为4、5或6。
●在另一实施方式中,本发明提供一种根据本发明制备式(I)化合物的方法,其中n为1;m为1;A、B、C、E和F为双键;D为单键;R1、R2和R3为H;R4为甲基;
R5为s-丁基或异丙基;R6为H;R7为OH;R8为甲基;R9为H。
●在另一实施方式中,本发明提供一种根据本发明制备4”-脱氧-4”-N-甲基氨基除虫菌素B1a/B1b苯甲酸盐的方法。
●在另一方面,本发明提供一种生产依马菌素的方法。该方法包括将根据本发明显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶的酶活性的多肽加入包含除虫菌素的反应混合物中;和将反应混合物在使多肽将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的条件下温育。在一些实施方式中,反应混合物进一步包含根据本发明显示铁氧还蛋白的酶活性的多肽。在某些实施方式中,反应混合物进一步包含根据本发明显示铁氧还蛋白还原酶的酶活性的多肽。在一些实施方式中,反应混合物进一步包含还原剂(例如NADH或NADPH)。
●在另一方面,本发明提供一种生产式(I)化合物的制剂,该制剂包含根据本发明显示能够区域选择性地氧化在4”位的醇以形成式(II)化合物的P450单加氧酶活性的多肽。在一些实施方式中,该制剂进一步包含根据本发明显示铁氧还蛋白的酶活性的多肽(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。
●在另一方面,本发明提供一种生产依马菌素的制剂,该制剂包含将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,该制剂进一步包含铁氧还蛋白(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。
●在某些实施方式中,该制剂进一步包含根据本发明显示铁氧还蛋白还原酶的酶活性的多肽(例如,来自分离或获得P450单加氧酶的细胞或株系的铁氧还蛋白)。在一些实施方式中,该制剂进一步包含还原剂(例如,NADH或NADPH)。
图1为显示质粒pTBBKA图谱的概图。图中显示了指定的限制性内切酶的识别位点,和该位点在质粒的核苷酸序列中的定位。图中还显示了质粒中含有的基因(例如,卡那霉素抗性“KanR”)和其它功能方面(例如,Tip启动子)。
图2为显示质粒pTUA1A图谱的概图。图中显示了指定的限制性内切酶的识别位点,和该位点在质粒的核苷酸序列中的定位。图中还显示了质粒中含有的基因(例如,氨苄青霉素抗性“AmpR”)和其它功能方面(例如,Tip启动子)。
图3为显示质粒pRK-ema1/fd233图谱的概图。该质粒通过将含有组织在单一转录单元上的ema1和fd233基因的BglI片段连接入广宿主范围质粒pRK290中而获得。ema1/fd233基因由tac启动子(Ptac)表达并且ema1/fd233基因后为tac终止子(Ttac)。显示的限制性内切酶识别位点为BglII“B”;EcoRI“E”;PacI“Pc”;PmeI“Pm”和SalI“S”。
本发明提供一种多肽家族,所述多肽家族显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物例如除虫菌素4”位的醇,以产生式(III)化合物,尤其是4”-酮-除虫菌素。
更具体地,根据本发明的多肽家族可以用于制备式(I)化合物的方法中,
其中,R1-R9相互独立地代表氢或取代基;M为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥(epoxidebridge) 或单键和下式的亚甲桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,每种情况中为游离形式或盐形式,其中,该方法包括1)将式(II)化合物
其中R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,与根据本发明的多肽接触,所述多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)在4”位的醇,以产生式(III)化合物 其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)中给定的含义相同;和2)在还原剂存在的情况下使式(III)化合物与已知的式HN(Rg)R9的胺反应,其中R8和R9与式(I)中给定的含义相同,并且;并且,在每种情况下,如果需要,将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出所需的异构体;和/或将可按照本方法或其它方法获得的游离的式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法和其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
文献中描述了式(I)化合物的合成方法。然而,发现主要由于产量低和使用程序繁琐,文献中已知的方法在制备过程中产生很多问题。因此,在这方面已知方法并不令人满意,从而需要获得这些化合物的改进的制备方法。
化合物(I)、(II)和(III)可以为互变异构体的形式。因此,在前后文中,如果适当的话,化合物(I)、(II)和(III)应被理解为包括相应的互变异构体,即使相应的互变异构体在每种情况下并没有特别提及。
化合物(I)、(II)和(III)能够形成酸加成盐。例如,与强无机酸(inorganic acid),与强有机羧酸或与有机磺酸形成那些盐。强无机酸(inorganic acid)例如无机酸(mineral acid)如高氯酸、硫酸、硝酸、亚硝酸、磷酸或氢卤酸。强有机羧酸例如,未取代或取代的,如卤素取代的,C1-C4烷羧酸,如乙酸,饱和或不饱和二羧酸,如草酸、丙二酸、琥珀酸、马来酸、延胡索酸或苯二甲酸,羟基羧酸如抗坏血酸、乳酸、苹果酸、酒石酸或柠檬酸,或苯甲酸。有机磺酸例如未取代或取代的,如卤代的,C1-C4烷基-或芳基-磺酸,如甲磺酸或对甲苯磺酸。而且,具有至少一个酸性基团的式(I)、(II)和(III)化合物能够与碱形成盐。与碱的合适的盐为,例如金属盐如碱金属或碱土金属盐,如钠、钾或镁盐,与氨或有机胺形成的盐,所述有机胺例如吗啉、哌啶、吡咯烷,单-、二-或三-低级烷基胺,例如乙基-、二乙基-、三乙基-或二甲基-丙基胺,或单-、二-或三-羟基-低级烷基胺,例如单-、二-或三-乙醇胺。另外,还可以形成相应的内盐。在本发明范围内优选农用化学有用的盐。鉴于游离形式和其盐形式的式(I)、(II)和(III)化合物间的紧密关系,如果适当和有利的话,前后文提及的式(I)、(II)和(III)的游离化合物或其各自的盐应理解为也包含式(I)、(II)和(III)的相应的盐或游离化合物。对于式(I)、(II)和(III)化合物的互变异构体和其盐的情况,这也同样适用。在每种情况下,通常优选游离形式。
本发明范围内优选制备式(I)化合物的方法,其中n为1;m为1;A为双键;B为单键或双键,C为双键,D为单键,E为双键,F为双键;或单键和环氧桥(epoxy bridge);或单键和亚甲桥;R1、R2和R3为H;R4为甲基;R5为C1-C10-烷基,C3-C8-环烷基或C2-C10-链烯基;R6为H;R7为OH;R8和R9相互独立地为H;C1-C10-烷基或C1-C10-酰基;或一起形成-(CH2)q-;和q为4、5或6。
本发明范围内特别优选制备式(I)化合物的方法,其中
n为1;m为1;A、B、C、E和F为双键;D为单键;R1、R2和R3为H;R4为甲基;R5为s-丁基或异丙基;R6为H;R7为OH;R8为甲基;R9为H。
非常特别优选制备依马菌素,更特别是依马菌素的苯甲酸盐的方法。依马菌素为4”-脱氧-4”-N-甲基氨基除虫菌素B1a/B1b的混合物并且描述于US-P-4,4874,749中和作为MK-244描述于有机化学杂志(Journal of Organic Chemistry),Vol.59(1994),7704-7708中。US-P-5,288,710中描述了农业化学中特别有用的依马菌素的盐。上文描述的显示P450单加氧酶酶活性的该肽家族中的每个成员都能够在4”位区域选择性地氧化未保护的除虫菌素,因此开辟了制备依马菌素的新的更经济途径。
每个家族成员都能催化下列反应 除虫菌素 4”-酮-除虫菌素 依马菌素B1a(R=CH3)和B1b(R=H) B1a(R=CH3)和B1b(R=H) R=CH3,H
因此,本发明提供一种纯化的核酸分子,该核酸分子编码显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物(例如除虫菌素)在4”的醇,以产生式(III)化合物(尤其是4”-酮-除虫菌素)。
特别地,本发明提供一种纯化的核酸分子,该核酸分子编码将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。“核酸分子”是指单链或双链多核苷酸,例如脱氧核糖核酸(DNA)、核糖核酸(RNA)或DNA或RNA的类似物。
本发明还提供一种纯化的多肽,该多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物例如除虫菌素在4”位的醇,以产生式(III)化合物,尤其是4”-酮-除虫菌素。
特别地,本发明还提供一种纯化的P450单加氧酶,该单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素。
如本文所示,“纯化的”意指已将核酸分子或多肽(例如酶或抗体)从天然伴随它的成份中分离出来。从来源中“纯化”的感兴趣的这样的核苷酸序列或片段的例子,可以为通过化学方法,例如通过使用限制性内切酶,从所述来源切离或取出的核苷酸序列或片段,从而可进一步通过基因工程的方法对其进行操作,例如扩增,用于本发明。这样的核苷酸序列或片段通常称为“重组体”。在一个具体方面,纯化的核酸分子可从核苷酸序列(该序列就象在染色体中天然存在的一样与所述核酸分子侧翼相连),例如启动子或增强子分离。
对于蛋白质或多肽的情况,纯化的蛋白质和多肽分别与细胞中伴随它的成份,例如细胞膜的其它蛋白质或片段相分离。当然,分子生物学的普通技术人员会理解,水、缓冲液和其它小分子可以额外存在于纯化的核酸分子或纯化的蛋白制备物中。本发明纯化的核酸分子或纯化的多肽(例如酶)至少95%重量、或至少98%重量、或至少99%重量、或100%重量地没有天然伴随所述的核酸分子或多肽的成份。
根据本发明,纯化的核酸分子可以通过例如从染色体上将所述核酸分子切离产生。然后,可将其连接入表达质粒。可获得产生编码本发明P450单加氧酶的纯化的核酸分子的其它方法,并且包括,但不限于,在核酸合成仪上人工合成核酸分子。
相似地,本发明纯化的P450单加氧酶可以通过,例如在细胞中重组表达编码P450单加氧酶的核酸分子产生,其中所述细胞中天然不存在P450单加氧酶。当然,其它获得本发明纯化的P450单加氧酶的方法,包括,但不限于,在多肽合成仪上人工合成P450单加氧酶,和利用例如与P450单加氧酶特异性结合的抗体,从天然存在P450单加氧酶的细胞中分离P450单加氧酶。
已知链霉菌属的细菌通过脱氢酶或氧化酶将仲醇生物转化为酮。然而,在本发明发现杀结核链霉菌株系R-922的细胞色素P450单加氧酶负责将除虫菌素区域选择性氧化为4”-酮-除虫菌素之前,没有报道链霉菌的其它细胞色素P450单加氧酶将仲醇氧化为酮的实验数据。
根据本发明的一些实施方式,核酸分子和/或由核酸分子编码的多肽分离自链霉菌属株系。因此,核酸分子(或由其编码的多肽)可以分离自,但不限于,杀结核链霉菌、利迪链霉素、普拉特链霉菌、恰塔努加链霉菌、春日链霉菌、龟裂链霉菌和生白链霉菌。
如上所述和如下详细描述的,本文提供显示能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的整个家族。所有的这些家族成员相关,在氨基酸水平具有至少60%同一性。含有编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的有用核酸分子包含以下核酸序列或本质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ IDNO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33或SEQ ID NO94具有至少70%同一性的核酸序列。在某些实施方式中,包含编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的核酸分子包含以下核酸序列或本质上由以下核酸序列构成与SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ IDNO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ IDNO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33或SEQ ID NO94具有至少80%同一性;或至少85%同一性;或至少90%同一性;或至少95%同一性;或至少98%同一性的核酸序列。
相似地,本发明提供一种显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的纯化多肽,其中,在一些实施方式中,所述多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少60%同一性的氨基酸序列。在某些实施方式中,本发明的显示P450单加氧酶的酶活性的纯化的多肽包含以下氨基酸序列或本质上由以下氨基酸序列构成与SEQ IDNO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95具有至少70%同一性;或至少80%同一性;或至少90%同一性;或至少95%同一性的氨基酸序列。
在一些实施方式中,含有编码本发明显示P450单加氧酶酶活性的多肽的核苷酸序列的核酸分子包含以下核酸序列或本质上由以下核酸序列构成SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33或SEQ ID NO94。相似地,在一些实施方式中,本发明的显示P450单加氧酶的酶活性的纯化的多肽包含或本质上由以下氨基酸序列构成SEQ 1D NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34或SEQ ID NO95。
为了描述两条或多条核酸或多核苷酸间的序列相关性,使用以下术语(a)“参考序列”,(b)“比较窗口”,(c)“序列同一性”,(d)“序列同一性百分比”和(e)“基本上相同”。
(a)本文所使用的“参考序列”为作为序列比较基础的指定序列。参考序列可以为具体序列的子集或全部;例如作为全长cDNA或基因序列的片段,或全部cDNA或基因序列。
(b)本文使用的“比较窗口”涉及多核苷酸序列的连续且指定的片段,其中,为了两条序列的最佳比对(alignment),比较窗口中的多核苷酸片段与参考序列(其不包含添加或缺失)相比,可以包含添加或缺失(即缺口)。通常,比较窗口至少20个连续的核苷酸长,可选地可为30、40、50、100或更长。本领域技术人员理解,为了避免由于多核苷酸序列中包含缺口而产生与参考序列的高相似性,通常引入缺口罚值(gap penalty),并将其从匹配的数目中减去。
本领域熟知为比较而进行序列比对的方法。因此,使用数学算法可完成任何两条序列间同一性百分比的确定。这些数学算法的优选的非限制性例子为Myers和Miller的算法,1988;Smith等的局部同源性算法;Needleman和Wunsch的同源性比对算法,1970;Pearson和Lipman的查找相似性的方法,1988;Karlin和Altschul的算法,1990,如Karlin和Altschul修改的,1993。
可以采用这些数学算法的计算机执行工具,用于比较序列以确定序列的同一性。这样的执行工具包括,但不限于PC/Gene程序中的CLUSTAL(获自Intelligeneties,Mountain View,加利福尼亚);ALIGN程序(Version 2.0)和成斯康星遗传学软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、BLAST、FASTA和TFASTA,Version 8(获自遗传学计算机小组(Genetics Computer Group,GCG)),575 Science Drive,麦迪逊,威斯康星,美国)。可以使用默认参数利用这些程序进行比对。Higgins等1988;Higgins等1989;Corpet等1988;Huang等1992和Pearson等1994很好地描述了CLUSTAL程序。ALIGN程序基于Myers和Miller的算法,见上文。Altschul等(1990)的BLAST程序基于Karlin和Altschul的算法,见上文。
可通过国家生物技术信息中心(http//www.ncbi.nlm.nih.gov/)公开获得进行BLAST分析的软件。该算法包括通过鉴定查询序列的长度W的短字符,首先鉴定高分序列对(high scoring sequence pairs,HSPs),其中长度W的短字符与数据库序列中相同长度的字符比对时,其与一些阳性值阀值得分T匹配或符合。T指临近字符得分阀值(Altschul等,1990)。这些起始临近字符命中(hits)作为起始寻找含有它们的更长HSPs的开端。然后,这些字符命中沿着每个序列在两端延伸至积累比对得分可以增长。对于核苷酸序列,使用参数M(一对匹配残基的奖赏得分;总是>0)和N(不匹配残基的处罚得分;总是<0)来计算积累得分。对于氨基酸序列,使用得分矩阵计算积累得分。当积累比对得分从其最大取得值减少数值X,或由于积累一个或多个负分残基比对而使积累得分达到0或低于0,或达到任何一个序列的终点时,在每个方向中字符命中的延伸停止。
除了计算百分序列同一性,BLAST算法还进行两条序列间相似性的统计分析(参见,例如,Karlin & Altschul(1993))。一种由BLAST算法提供的相似性的测定为最小总数概率(P(N)),该测定提供了两条核苷酸或氨基酸序列间匹配会偶然发生的概率。例如,如果待测核酸序列与参考核酸序列比较的最小总数概率小于约0.1,更优选小于约0.01,最优选小于约0.001,则认为待测核酸序列与参考序列相似。
为了获得缺口比对以进行比较,可以使用如Aitschul等1997描述的缺口BLAST(在BLAST 2.0中)。可替代地,可使用PSI-BLAST(BLAST 2.0中)进行检测分子间远缘相关性的反复检索。参见Altschul等,见上文。当使用BLAST、缺口BLAST、PSI-BLAST时,可以使用各个程序的默认参数(例如核苷酸序列采用BLASTN,蛋白质采用BLASTX)。BLASNTN程序(用于核苷酸序列)使用的默认值是字符长度(wordlength(W))为11,期望值(expectation(E))为10,截断值(cutoff)为100,M=5,N=4,和两条链的比较。对于氨基酸序列,BLASTP程序使用的默认值是字符长度(W)为3,期望值(E)为10,和BLOSUM62得分矩阵(参见Henikoff & Henikoff,1989)。参见http//www.ncbi.nlm.nih.gov.。还可以通过手工检查进行比对。为了本发明目的,用于测定与本文公开的核苷酸序列的百分序列同一性的核苷酸序列比较,优选使用BlastN程序(version 1.4.7或更晚),并使用其默认参数或任何等价程序来进行。“等价程序”意指任何序列比对程序,该程序对于任何考虑的两条序列,当与该优选程序产生的相应比对进行比较时,产生具有相同核苷酸或氨基酸残基匹配和相同百分序列同一性的比对。
(C)如本文所示,在两条核酸或多肽序列的上下文中“序列同一性”或“同一性”是指在特定的比较窗口比较最大对应性时,两条序列中相同的残基。当使用序列同一性百分比涉及蛋白质时,应该认识到,不相同的残基位置通常是因保守氨基酸替换而不同,保守氨基酸替换是氨基酸残基替换为另外具有相似化学特性(例如,电荷或疏水性)的氨基酸残基并且因此不改变分子的功能特性。当序列的不同在于保守性替换时,百分序列同一性可以上调,以校正替换的保守特性。不同在于这样的保守性替换的序列称为具有“序列相似性”或“相似性”。本领域技术人员熟知进行这种调整的方法。通常这种方法包括将保守性替换记为部分而不是完全不匹配,由此提高了序列同一性百分比。因此,例如,当给定相同的氨基酸的得分为1并且非保守性替换的得分为0时,给定保守性替换的得分为0至1之间。例如,如在PC/GENE程序中(Intelligenetics,Mountain View,加利福尼亚)执行的一样计算保守性替换的得分。
(d)如本文所示,“序列同一性百分比”意指通过比较比较窗口中两条最佳比对序列而测定的值,其中为了获得两条序列的最佳比对,与参考序列(其不包含添加或缺失)相比,比较窗口中多核苷酸序列部分可以包含添加或缺失(即缺口)。通过下述方法计算百分比测定两条序列中存在相同核酸碱基或氨基酸残基的位置的数量而产生的匹配位置的数量,将匹配位置的数量除以比较窗口中位置的总数,和将结果乘以100以产生序列同一性的百分比。
(e)(i)术语多核苷酸序列“基本上相同”是指多核苷酸序列包含以下这样的序列使用标准参数,采用描述的一种比对程序,与参考序列相比,该序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、优选至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更优选至少90%、91%、92%、93%或94%、最优选至少95%、96%、97%、98%或99%序列同一性。本领域技术人员知晓,通过考虑密码子简并性、氨基酸相似性、阅读框架定位等可以适当地调整这些数值以确定由两条核苷酸序列编码的蛋白质的相应同一性。用于这些目的的氨基酸序列的基本上同一性通常是指至少70%,更优选至少80%、90%和最优选至少95%的序列同一性。
如果两条分子在严谨条件下(见下)相互杂交,也指示核苷酸序列基本上相同。通常,严谨条件选择为比在指定离子强度和pH下特定序列的热解链温度(Tm)约低5℃。然而,严谨条件包括约1℃至约20℃范围内的温度,依赖于本文另外限定的期望的严谨程度。在严谨情况下相互不杂交的核酸,如果他们编码的多肽基本上相同,也仍是基本上相同的。这种情况可以发生于,例如,使用遗传密码允许的最大的密码子简并性产生的核酸拷贝时。两条核酸序列基本上相同的一个指示为由第一核酸序列编码的多肽与第二核酸编码的多肽有免疫学交叉反应性。
(e)(ii)在多肽的上下文中术语“基本上相同”是指所述多肽包含以下序列在一个特定的比较窗口中,与参考序列具有至少50%、60%、70%、71%、72%、73%、74%、75%、76%、77%、78%或79%、优选80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更优选至少90%、91%、92%、93%或94%、或甚至更优选95%、96%、97%、98%或99%序列同一性。优选地,使用Needleman和Wunsch(1970)的同源性比对算法进行最佳比对。两条多肽序列基本上相同的一个指示为一条多肽与抗第二多肽的抗体免疫学反应。因此,例如,当两条多肽不同仅仅在保守性替换时,一条多肽与第二多肽基本上相同。
为了序列比较,通常一条序列作为参考序列,而待测序列与之比较。当使用序列比较算法时,将待测序列和参考序列输入计算机,如果需要,指定亚序列坐标,和指定序列算法程序参数。然后序列比较算法程序基于指定的程序参数,计算待测序列相对于参考序列的百分序列同一性。
如上所述,两条核酸序列基本上相同的另一种指示为在严谨条件下,两条分子相互杂交。短语“特异性杂交”指当特定的核苷酸序列存在于复杂混合物(例如,整个细胞)DNA或RNA中时,一种核酸分子在严谨条件下只与该特定的核苷酸序列结合、形成双螺旋或杂交。“基本上结合”指探针核酸与靶核酸互补杂交,并且包含较少的不匹配,而该不匹配可以通过降低杂交介质的严谨性来调节以获得期望的靶核酸序列的检测。
在上下文核酸杂交实验,例如Southern和Northern杂交中的“严谨的杂交条件”和“严谨杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。Tm为(在指定的离子强度和pH下)50%靶序列与完全匹配的探针杂交时的温度。特异性通常为杂交后洗涤的函数,关键因素为最终洗涤溶液的离子强度和温度。DNA-DNA杂交体的Tm可以通过Meinkoth和Wahl等式大致计算,1984;Tm81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟苷和胞嘧啶的百分比,%form为杂交溶液中甲酰胺的百分比,L杂交体的长度,以碱基对表示。对于每1%错配,Tm降低约1℃。因此,可以将Tm、杂交和/或洗涤条件调整为与期望同一性的序列杂交。例如,如果欲得到>90%同一性的序列,可将Tm降低10℃。通常,选择严谨条件为约比指定离子强度和pH下特定的序列和其互补序列的热解链温度I低约5℃。然而,严格严谨条件可以使用比热解链温度I低1、2、3或4℃的杂交和/或洗涤;中度严谨条件可以使用比热解链温度I低6、7、8、9或10℃的杂交和/或洗涤;低严谨条件可以使用比热解链温度I低11、12、13、14、15或20℃的杂交和/或洗涤。使用所述等式,杂交和洗涤组合物,和合适的T,普通技术人员理解,内在描述了杂交和/或洗涤溶液严谨性的变化。如果错配的期望程度导致T小于45℃(水溶液)或32℃(甲酰胺溶液),优选提高SSC的浓度以致于可以使用较高的温度。在Tijssen,1993中可以找到核酸杂交的大量的指导。通常,选择高严谨杂交和洗涤条件为约比指定离子强度和pH下特定序列的热解链温度Tm低约5℃。
高严谨洗涤条件的例子为0.15M NaCl于72℃约15分钟。严谨洗涤条件的例子为于65℃,0.2X SSC洗涤15分钟(参见,Sambrook,见上,对SSC缓冲液的描述)。通常,高严谨洗涤之前为低严谨洗涤以除去背景探针信号。对例如多于100个核苷酸的双链,中度严谨洗涤的例子为1X SSC,45℃,15分钟。对例如多于100个核苷酸的双链,低严谨洗涤的例子为4-6X SSC,40℃,15分钟。对于短探针(例如约10至50个核苷酸),严谨条件通常包括盐浓度低于约1.5M,更优选约0.01至1.0M,Na离子浓度(或其它盐),pH7.0至8.3,和温度通常至少约30℃并且对于长探针(例如,>50个核苷酸)至少60℃。严谨条件还可以通过加入去稳定剂例如甲酰胺来获得。通常,在特定杂交分析中比观察到的不相关探针的信噪比高2X(或更高)的信噪比指示检测到特异杂交。如果核酸编码的蛋白质基本上相同,在严谨条件下相互不杂交的核酸也仍是基本上相同。这种情况可以发生于,例如,使用遗传密码允许的最大的密码子简并性产生的核酸拷贝时。
选择非常严谨条件为与特定探针的Tm相等。在Southern或Northern印迹中的滤膜上具有多于100个互补残基的互补核酸杂交的严谨条件例子为50%甲酰胺,例如,在50%甲酰胺,1M NaCl,1%SDS中于37℃杂交并于60至65℃于0.1X SSC中洗涤。示例性的低严谨条件包括用30至35%甲酰胺,1M NaCl,1%SDS (十二烷基硫酸钠)的缓冲溶液于37℃杂交,并且于1X至2X SSC(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)中于50至55℃洗涤。示例性的中度严谨条件包括于40至45%甲酰胺,1.0M NaCl,1%SDS中于37℃杂交,并且于0.5X至1X SSC中于55至60℃洗涤。
以下为可以用于克隆与本发明的参考核苷酸序列基本上相同的直向同源核苷酸序列的杂交/洗涤条件组合的例子参考核苷酸序列优选与所述的参考核苷酸序列于7%十二烷基硫酸钠(SDS),0.5MNaPO4,1mM EDTA于50℃杂交并且于2X SSC,0.1%SDS于50℃洗涤,更希望于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mMEDTA于50℃杂交并且于1X SSC,0.1%SDS中于50℃洗涤,更希望于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中于50℃杂交并且于0.5X SSC,0.1%SDS中于50℃洗涤,优选于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中于50℃杂交并且于0.1X SSC,0.1%SDS中于50℃洗涤,更优选于7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA于50℃杂交并且于0.1X SSC,0.1%SDS中于65℃洗涤。
显示将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的本发明纯化多肽的一个非限制性的来源为以下实施例中描述的无细胞提取物。纯化根据本发明显示P450单加氧酶活性的多肽的另一种方法为给蛋白质加标签,由此方便其纯化。因此,本发明提供一种显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的纯化的多肽,其中,所述多肽与标签共价结合。本发明进一步提供一种编码这样带有标签的多肽的核酸分子。
如本文所示,“标签”意指共价与本发明多肽结合的多肽或其它分子,由此,结合剂(例如多肽或分子)特异性结合标签。根据本发明,“特异性结合”意指结合剂(例如抗体或Ni2+树脂)识别并结合特定的多肽或化学物质但基本上不识别或结合样品中的其它分子。在一些实施方式中,特异性结合配体的结合剂与那个配体形成缔合,该缔合在水中,生理条件下,或在就离子强度而言近似的生理条件下,例如140mM NaCl,5mM MgCl2,亲和力至少106M-1,或至少107M-1,或至少108M-1,或至少109M-1。例如,组氨酸标签被镍(例如载Ni2+-柱,以His·Bind树脂商购于Novagen Inc,Madison,WI)特异性结合。同样地,Myc标签被特异性结合Myc的抗体特异性结合。
如下所示,通过产生编码带有组氨酸标签的多肽的核酸分子,并在大肠杆菌中表达所述多肽,组氨酸标签附加到本发明显示P450单加氧酶的酶活性的纯化的多肽上。这些多肽,一旦被大肠杆菌表达,通过常规技术容易纯化(例如使用可商购于Novagen的一个His·Bind试剂盒或使用商购于Clontech Laboratories,Inc.,Palo Alto,CA的TALONTM树脂(和生产商说明))。
另外的标签可以附加于本发明任何或所有的多肽上以便于纯化。这些标签包括,但不限于,HA-标签(氨基酸序列YPYDVPDYA(SEQ ID NO39)),Myc-标签(氨基酸序列EQKLISEEDL(SEQ IDNO40)),HSV标签(氨基酸序列QPELAPEDPED(SEQ ID NO41)),和VSV-G-标签(氨基酸序列YTDIEMNRLGK(SEQ ID NO42))。将这些标签共价附加(例如,通过多肽键)于本发明的多肽上,允许分别使用抗-HA抗体、抗-Myc抗体、抗-HSV抗体或抗VSV-G抗体纯化带有标签的多肽,而所有的这些抗体都可以商购获得(例如从以下公司获得MBL International Corp.,Watertown,MA;NovagenInc.;Research Diagnostics Inc.,Flanders,NJ)。
本发明显示P450单加氧酶活性的带有标签的多肽还可以通过共价键用化学物质,例如生物素标记,生物素被链霉抗生物素蛋白特异性结合,因此,可以在链霉抗生物素蛋白柱上纯化。相似地,本发明带有标签的P450单加氧酶可以共价连接于(例如,通过多肽键)抗体的恒定区。这样的带有标签的P450单加氧酶可以例如,在蛋白A琼脂糖上纯化。
本发明带有标签的P450单加氧酶还可以被GST(谷胱甘肽-S-转移酶)或免疫球蛋白的恒定区标记。例如,本发明的核酸分子(例如,含有SEQ ID NO1)可以克隆入商购自Amersham Pharmacia Biotech,Inc.(Piscataway NJ)的pGEX质粒中,并且使质粒在大肠杆菌中表达。由该核酸分子编码的所得P450单加氧酶共价结合于GST(谷胱甘肽-S-转移酶)。这些GST融合蛋白可以在谷胱甘肽琼脂糖柱上纯化(商购自例如,Amersham Pharmacia Biotech),由此获得纯化。许多pGEX质粒能使GST部分从融合蛋白中轻松移去。例如,pGEX-2T质粒在插入的感兴趣的核酸分子和GST编码核酸序列之间含有凝血酶识别位点。相似地,pGES-3T质粒含有因子Xa位点。通过用合适的酶处理融合蛋白,然后使用谷胱甘肽琼脂糖(GST特异性与之结合)从本发明的P450单加氧酶中分离GST部分,可以纯化本发明的P450单加氧酶。
另一种获得本发明显示P450单加氧酶活性的纯化的多肽的方法为使用与这样的多肽特异性结合的结合剂。因此,本发明提供一种与本发明P450单加氧酶特异性结合的结合剂。本发明的这种结合剂可以为化学化合物(例如蛋白质),金属离子或小分子。
在特定的实施方式中,结合剂为抗体。术语“抗体”包括,但不限于,多克隆抗体、单克隆抗体、抗体片段(例如Fab、Fv或Fab’片段),单链抗体、嵌合抗体、双特异性抗体、任何同种型抗体(例如,IgG、IgA和IgE)和来自任何种(例如,兔子、鼠和人)的抗体。
在一个非限制性的实例中,本发明的结合剂为多克隆抗体。在另一个非限制性的实例中,本发明的结合剂为单克隆抗体。制备单克隆和多克隆抗体的方法是熟知的(参见,例如,免疫学中的当前方法(Current Protocols in Immunology),编辑John E.Coligan,JohnWiley & Sons,Inc.1993;分子生物学中的当前方法(Current Protocolsin Molecular Biology),编辑Ausubel等,John Wiley & Sons,Inc.2000)。
本文描述的显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽属于新的P450单加氧酶的家族。因此,本发明还提供P450单加氧酶多肽家族,其中该家族的每个成员均能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。在一些实施方式中,该家族的每个成员包含以下氨基酸序列或由以下氨基酸序列构成该氨基酸序列与SEQ ID NO2、SEQ ID NO4、SEQID NO6、SEQID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQID NO32、SEQ ID NO34或SEQ ID NO95具有至少50%同一性。在特定实施方式中,该家族的每个成员由包含以下核酸序列或由以下核酸序列组成的核酸分子编码与SEQ ID NO1、SEQ ID NO3、SEQID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ IDNO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ IDNO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ IDNO29、SEQ ID NO31、SEQ ID NO33或SEQ ID NO94具有至少66%同一性的核酸序列。
本发明,其提供P450单加氧酶的整个家族,该家族的每个成员都能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素,允许产生天然不存在的改进的P450单加氧酶,而其有效地将除虫菌素区域选择性氧化为4”-酮-除虫菌素并且使不期望的副产物降低。例如,本发明的P450单加氧酶家族的一个成员P450Ema1酶催化不希望的进一步氧化,因为在含有ema1基因的杀结核链霉菌株系R-922和浅青紫链霉菌进行的反应中检测到3”-O-脱甲基-4”-酮-除虫菌素的形成。3”-O-脱甲基-4”-酮-除虫菌素的形成由3”-O-甲基基团的氧化引起,藉此,形成易水解的3”-O-羟甲基基团,其水解形成甲醛和3”-羟基。
通过提供显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽家族(参见,例如以下表3),可以将该家族的单个成员进行家族基因“改组(shuffling)”,以产生编码本发明的优化P450单加氧酶的新的杂合基因。在一个非限制性的例子中,编码P450Ema1蛋白的O2结合位点的ema1基因的一部分可以与编码P450Ema2蛋白的O2结合位点的ema2基因的一部分交换。这样嵌合的ema1/2蛋白在本发明的P450单加氧酶定义中。
还可以使用定点诱变或定向进化技术产生编码具有改进特性的酶的ema1基因衍生物,改进的特性包括更高的整体活性和/或形成的副产物减少。获得这样的突变体的一个方法为按照与如下描述的UV突变杀链霉菌株系R-922相似的方法,将链霉菌株系本身突变。
额外的衍生物可以通过对P450单加氧酶的氨基酸序列进行保守性或非保守性变化制备。保守性和非保守性氨基酸替换是熟知的(参见,例如Stryer,生物化学(Biochemistry),3rdEd.,W.H.Freeman和Co.,NY 1988)。相似地,可以通过在蛋白的N-端(例如,参见如下描述的ema1A基因)、在C-端截短蛋白或从蛋白的中部截短(例如除去氨基酸残基)产生截短的本发明P450单加氧酶。
只要突变、衍生物或截短的P450单加氧酶能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素,这样的突变、衍生物或截短的P450单加氧酶也为本发明的P450单加氧酶。
在另一方面,本发明提供一种细胞,该细胞经基因工程化含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子。“基因工程化”意指核酸分子对于引入它的细胞而言为外源的。可以通过任何方式将外源核酸分子引入基因工程化的细胞,包括,但不限于,转染、转导和转化。
在某些实施方式中,将核酸分子定位以用于在基因工程化的细胞中表达。“定位以用于表达”意指编码多肽的外源核酸分子以这种方式与调控序列连接,以允许在引入细胞时核酸分子表达。“调控序列”意指核酸序列,例如,起始信号、多腺苷酸化(polyA)信号、启动子和增强子,其控制与其可操作地连接的蛋白质编码序列的表达。编码蛋白质或多肽片段的核酸分子的“表达”意指该核酸分子表达为蛋白质和/或mRNA。
本发明的基因工程化细胞可以为原核细胞(例如大肠杆菌)或真核细胞(例如酿酒酵母(Saccharomyces cerevisiae)或哺乳动物细胞(例如,HeLa))。根据本发明的一些实施方式,基因工程化细胞为其野生型(即,未基因工程化的)细胞天然不含有插入的核酸分子并且不天然表达由插入的核酸分子编码的蛋白质的细胞。因此,细胞可以为基因工程化链霉菌株系,例如浅青紫链霉菌或除虫链霉菌(Streptomyces avermitilis)。可替换地,细胞可以为基因工程化的假单胞菌属的株系,例如恶臭假单胞菌或荧光假单胞菌(Pseudomonasfluorescens)株系。在另一替换方式中,细胞可以为基因工程化的大肠杆菌株系。
应注意,在一些经基因工程化而包含编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子的细胞类型中,真正的基因工程化细胞本身可以不能将除虫菌素转变为4”-酮-除虫菌素。而是,由这样的基因工程化细胞异源表达的P450单加氧酶可以从该细胞中纯化,其中本发明纯化的P450单加氧酶可以用于将除虫菌素区域选择性氧化为4”-酮-除虫菌素。这样,本发明的基因工程细胞不需要本身能够将除虫菌素转变为4”-酮-除虫菌素;而是,本发明的基因工程细胞只需要含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子,不管在该细胞中多肽是否有活性。
另外,基因工程化的含有编码显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的核酸分子的细胞(例如,大肠杆菌),可以不能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素,尽管从该基因工程细胞中纯化的P450单加氧酶能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素。然而,如果将相同细胞基因工程化以含有本发明显示P450单加氧酶酶活性的多肽、本发明的铁氧还蛋白和/或本发明的铁氧还蛋白还原酶,那么都从该细胞中纯化的P450单加氧酶与铁氧还蛋白和铁氧还蛋白还原酶一起,在还原剂(例如,NADH或NADPH)存在下,将能够将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。而且,含有本发明的P450单加氧酶、本发明的铁氧还蛋白和本发明的铁氧还蛋白还原酶的基因工程细胞本身可能能够进行这种氧化。
而且,在一个非限制性例子中,对细胞(例如,大肠杆菌)基因工程化以表达本发明的P450单加氧酶、铁氧还蛋白和铁氧还蛋白还原酶蛋白,当从基因工程大肠杆菌中纯化所有的这三种蛋白时,这些蛋白一起在还原剂(例如,NADH或NADPH)存在下,将具有活性并且能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素,因此,可用于生产依马菌素的方法中。
根据本发明,已将下列材料按照国际承认用于专利程序目的保藏微生物的布达佩斯条约的规定,保藏于农业研究机构保藏中心(Agricultural Research Service,Patent Culture Collection(NRRL),1815 North University Street,Peoria,Illinois 61604)(1)浅青紫链霉菌ZX7(ema1/fd233-TUA1A)NRRL指定号B-30478;和(2)含有质粒pRK290-ema1/fd233的恶臭假单胞菌NRRL B-4067,NRRL指定号B-30479。
在鉴定显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的P450单加氧酶酶活性的多肽的新家族中,在发现P450单加氧酶的相同的细菌株系中,还鉴定了新的铁氧还蛋白和新的铁氧还蛋白还原酶。因此,在另一方面,本发明提供一种包含编码显示铁氧还蛋白酶活生的多肽的核苷酸序列的纯化核酸分子,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。相似地,本发明提供一种包含编码显示铁氧还蛋白还原酶酶活性的多肽的核苷酸序列的纯化核酸分子,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。本发明还提供一种显示铁氧还蛋白的酶活性的纯化的多肽和显示铁氧还蛋白还原酶的酶活性的纯化的多肽,其中铁氧还蛋白和铁氧还蛋白还原酶蛋白分离自含有将除虫菌素区域选择性氧化为4”-酮-除虫菌素的多肽的链霉菌属株系。
含有编码显示铁氧还蛋白酶活性的多肽的核苷酸序列的有用核酸分子包含或本质上由以下核酸序列构成该核酸序列与SEQ ID NO35或SEQ ID NO37具有至少81%同一性。可替换地,该核酸分子包含或本质上由以下核酸序列构成该核酸序列与SEQ ID NO35或SEQID NO37具有至少85%,或至少90%,或至少95%或至少99%同一性。包含编码显示铁氧还蛋白酶活性的多肽的核苷酸序列的核酸分子可以包含或本质上由SEQ ID NO35或SEQ ID NO37的核酸序列构成。
显示铁氧还蛋白活性的本发明的蛋白质可以包含或本质上由以下氨基酸序列构成该氨基酸序列与SEQ ID NO36或SEQ ID NO38具有至少80%同一性。在一些实施方式中,所述核酸分子包含或本质上由以下氨基酸序列构成该氨基酸序列与SEQ ID NO36或SEQID NO38具有至少85%,或至少90%,或至少95%,或至少99%同一性。本发明的铁氧还蛋白可以包含或本质上由SEQ ID NO36或SEQ IDNO38的氨基酸序列构成。
含有编码本发明显示铁氧还蛋白还原酶酶活性的蛋白质的核苷酸序列的有用核酸分子包含或本质上由以下核酸序列构成所述核酸序列与SEQ ID NO98、SEQ ID NO100、SEQ ID NO102或SEQ IDNO104具有至少85%,或至少90%,或至少95%,或至少99%同一性。在本发明特定实施方式中,编码本发明的铁氧还蛋白还原酶的核酸分子可以包含或本质上由以下氨基酸序列构成SEQ ID NO98、SEQ ID NO100、SEQ ID NO102或SEQ ID NO104。
本发明的铁氧还蛋白还原酶可以包含或本质上由以下氨基酸序列构成所述氨基酸序列与SEQ ID NO99、SEQ ID NO101、SEQ IDNO103或SEQ ID NO105具有至少85%,或至少90%,或至少95%,或至少99%同一性。在本发明的特定实施方式中,本发明的铁氧还蛋白还原酶可以包含或本质上由以下氨基酸序列构成SEQ ID NO99、SEQ ID NO101、SEQ ID NO103或SEQ ID NO105。
本领域已知纯化铁氧还蛋白和铁氧还蛋白还原酶蛋白及编码这样的铁氧还蛋白和铁氧还蛋白还原酶的核酸分子的方法,并且这些方法与上述纯化本发明的P450单加氧酶和编码本发明的P450单加氧酶的核酸分子描述的方法相同。
在获得本发明纯化的P450单加氧酶和纯化的铁氧还蛋白的一个非限制性的例子中,可以对浅青紫链霉菌株系(或恶臭假单胞菌或其它任何不天然产生本发明的P450单加氧酶的细胞)基因工程化以包含编码本发明P450单加氧酶的第一核酸分子和编码铁氧还蛋白的第二核酸分子,其中对第一和第二核酸分子定位以在该基因工程细胞中表达。第一和第二核酸分子可以在分开的质粒中,或可以在同一质粒中。这样,同一基因工程细胞或株系将产生本发明的P450单加氧酶和本发明的铁氧还蛋白。
在获得本发明纯化的P450单加氧酶和纯化的铁氧还蛋白及本发明的纯化的铁氧还蛋白还原酶的另一个非限制性的例子中,可以对浅青紫链霉菌株系(或恶臭假单胞菌株系,或其它任何不天然产生本发明的P450单加氧酶的细胞)基因工程化以包含编码本发明P450单加氧酶的第一核酸分子和编码本发明的铁氧还蛋白的第二核酸分子及编码本发明铁氧还蛋白还原酶蛋白的第三核酸分子,其中对第一和第二及第三核酸分子定位以在基因工程细胞中表达。第一和第二及第三核酸分子可以在分开的质粒中提供,或可以在同一质粒中提供。这样,同一基因工程细胞或株系将产生本发明的P450单加氧酶和本发明的铁氧还蛋白及铁氧还蛋白还原酶蛋白。
如同上文对本发明的P450单加氧酶描述的一样,铁氧还蛋白和/或铁氧还蛋白还原酶蛋白可以进一步包含标签。另外,本发明还包括与铁氧还蛋白特异性结合的结合剂(例如,抗体)和与本发明铁氧还蛋白还原酶蛋白特异性结合的结合剂。产生带有标签的铁氧还蛋白、带有标签的铁氧还蛋白还原酶蛋白,和与铁氧还蛋白或铁氧还蛋白还原酶特异性结合的结合剂(例如抗体)的方法与如上描述的产生本发明带有标签的P450单加氧酶和产生与本发明P450单加氧酶特异性结合的结合剂的方法相同。
本发明还提供一种生产依马菌素的方法。在该方法中,把能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶加入含有除虫菌素的反应混合物中。然后,将反应混合物在允许P450单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素的条件下温育。反应混合物还可以包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,反应混合物还包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白。反应混合物还可以包含还原剂,例如NADH或NADPH。
另外,本发明提供一种生产4”-酮-除虫菌素的方法。该方法包括把能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶加入含有除虫菌素的反应混合物中,并且在允许P450单加氧酶将除虫菌素区域选择性氧化为4”-酮-除虫菌素的条件下温育。在一些实施方式中,反应混合物进一步包含铁氧还蛋白,例如本发明的铁氧还蛋白。反应混合物还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白。在特定实施方式中,反应混合物还可以包含还原剂,例如NADH或NADPH。
本发明还提供一种生产依马菌素的制剂,该制剂包含能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,所述制剂还包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,铁氧还蛋白从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白还原酶。在特定实施方式中,所述的铁氧还蛋白还原酶从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含还原剂,例如NADH或NADPH。
另外,本发明还提供一种生产4”-酮-除虫菌素的制剂,该制剂包含能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的P450单加氧酶。在一些实施方式中,所述制剂还包含铁氧还蛋白,例如本发明的铁氧还蛋白。在特定实施方式中,铁氧还蛋白从分离或获得P450单加氧酶的相同种细胞或株系分离。在一些实施方式中,所述制剂还可以包含铁氧还蛋白还原酶,例如本发明的铁氧还蛋白还原酶。在特定实施方式中,所述的铁氧还蛋白还原酶从分离或获得P450单加氧酶的相同种细胞或株系分离。所述制剂还可以包含还原剂,例如NADH或NADPH。
以下实施例意欲进一步阐述本发明的某些优选实施方式,并不在本质上进行限制。
实施例I杀结核链霉菌株系R-922的优化生长条件在一个非限定性的实施例中,将提供杀结核链霉菌株系R-922细胞稳定供应所需的发酵条件最优化,该株系R-922能够有效地将除虫菌素区域选择性氧化为4”-酮-除虫菌素。
首先,制备下列溶液。对ISP-2琼脂,将4g酵母提取物(商购自Oxoid Ltd,Basingstoke,英国)、4g D(+)-葡萄糖、10g bacto麦芽提取物(Difco No.0186-17-7(Difco产品商购自例如Voigt GlobalDistribution,Kansas City,MO))和20g琼脂(Difco No.0140-01)溶解于1升软化水中,并将pH调为7.0。将溶液于121℃灭菌20分钟,冷却,并保持于55℃至需要直接制备琼脂平板的时间。
对于PHG培养基,将10g蛋白胨(Sigma 0521;商购自SigmaChemical Co.,St.Louis,MO),10g酵母提取物(商购自Difco),10g D-(+)-葡萄糖,2g NaCl,0.15g MgSO4×7 H2O,1.3g NaH2PO4×H2O,和4.4g K2HPO4溶解于1升软化水中,并将pH调为7.0。
杀结核链霉菌株系R-922在28℃生长于ISP-2琼脂的培养皿中。这样培养物用于接种具有挡板的4个500ml摇瓶,每个含有100mlPHG培养基。将这些预培养物于28℃,120rpm的定轨摇床中培养72小时,然后,用于接种装备有机械搅拌器的10升发酵罐中,罐中含有8升PHG培养基。此主要培养物生长于28℃并且以500rpm搅拌,通气量为1.75vvm(14升/分钟)和压力为0.7bar。在对数生长末期,在约20小时后,通过离心收获细胞。湿细胞的产量为70-80g/l培养物。
实施例II全细胞生物催化分析如根据本发明测定的,应用下列全细胞生物催化分析确定链霉菌属细胞能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素的活性是由P450单加氧酶催化的。
杀结核链霉菌株系R-922生长于PHG培养基中,杀结核链霉菌株系I-1529生长于M-17或PHG培养基中。PFG培养基含有10g/l蛋白胨(Sigma,0.521),10g/l酵母提取物(Difco,0127-17-9),10g/l D-葡萄糖,2g/l NaCl,0.15g/l MgSO4×7 H2O,1.3g/l NaH2PO4×1 H2O,和4.4g/l K2HPO4,pH 7.0。M-17培养基含有10g/l甘油,20g/l白糊精(Dextrin white),10g/l Soytone(Difco 0437-17),3g/l酵母提取物(Difco 0127-17-9),2g/l(NH4)2SO4和2g/l CaCO3,pH7.0。
为了培养细胞,接种ISP2琼脂平板(不长于1-2周)并培养3-7天直至获得好的生长。接着,将过度生长的琼脂块转移到(采用接种环)250ml含有50ml PHG培养基并具有一个挡板的三角瓶中。将这种预培养物于28℃,120rpm培养2-3天。接着,将5ml预培养物转移到500ml含有100ml PHG培养基并具有1个挡板的三角瓶中。将此主要培养物于28℃,120rpm培养2天。接着,将培养物在BeckmanRotor JA-14上于8000rpm离心10分钟。接着将细胞用50mM磷酸钾缓冲液,pH 7.0洗涤一次。
为了进行全细胞生物催化分析,将500mg湿细胞放入25ml三角瓶中,其中加入了10ml的50mM磷酸钾缓冲液,pH7.0。用磁力搅动棒搅动细胞以分散细胞。接着,加入异丙醇中的除虫菌素B1a溶液(30mg/ml)15μl并在定轨摇床中以160rpm,于28℃摇动混合物。株系R-922反应2小时,株系I-1529反应30小时。
为了逐步建立全细胞生物催化分析中的培养物,向含有静息细胞的三角瓶中加入10ml甲基-叔丁基-醚并将整个细胞混合物转移至30ml离心管中,剧烈振荡,然后于16000rpm离心10分钟。将醚相吸入50ml梨形瓶中并通过旋转蒸发器于真空中蒸发(≤0.1mbar)。将残渣再次溶解于1.2ml乙腈中并转移至HPLC样品瓶中。通过HPLC分析使用HPLC程序I可以从生物催化反应观察到除虫菌素B1a至4”-羟基-除虫菌素B1a和4”-酮-除虫菌素B1a(也称为4”-氧代-除虫菌素B1a)的转变,及副产物的形成。
为了进行HPLC程序I,使用如下参数硬件泵 L-6250 Merck-Hitachi自动取样器 AS-2000A Merck-Hitachi接口模块D-6000 Merck-Hitachi道1-检测器 L-7450A UV-Diode ArrayMerck-Hitachi柱加热炉(Column Oven) 无柱 70mm×4mm吸附剂 Kromasil 100-3.5μ-C18梯度模型低压力范围5-300bar柱温 室温(≈20℃)溶剂A 乙腈溶剂B 水流速1.5ml/min检测243nm泵表 0.0min 75%A25%B线性梯度7.0min 100%A 0%B9.0min 100%A 0%B跳跃(jump) 9.1min 75%A25%B
12.0min 75%A25%B停止时间 12min取样间隔 每200msec保留时间表 时间 参考2.12min 4”-羟基-除虫菌素B1a3.27min 除虫菌素B1a3.77min 3”-O-脱甲基-4”-酮-除虫菌素B1a4.83min 4”-酮-除虫菌素B1a实施例III利用链霉菌株系R-922的无细胞提取物的生物转化为了制备能够将除虫菌素区域选择性氧化为4”-酮-除虫菌素的来自杀结核链霉菌株系R-922的活性无细胞提取物,制备下列溶液,保存于4℃并在使用时保持在冰上。
将链霉菌株系R-922的湿细胞6克在PP-缓冲液中洗涤,然后悬浮于35ml破碎缓冲液中并4℃在弗氏压碎器中破碎。得到的悬浮液于35000×g离心1小时。收集无细胞提取液的上清液。将1μl底物加入499μl澄清的无细胞提取液中,30℃孵育1小时。然后,将1ml甲基-叔丁基醚加入反应混合物中并彻底混合。然后将混合物于14000rpm离心2分钟,将甲基-叔丁基醚相转移入10ml烧瓶中并通过旋转蒸发器于真空中蒸发。将残渣溶解于200μl乙腈中并转移至HPLC样品瓶中。
对于HPLC,使用HPLC程序I。
当将1μl底物加入499μl澄清的无细胞提取液中并于30℃孵育时,使用HPLC程序I通过HPLC分析没有观察到除虫菌素至4”-酮-除虫菌素的转化。
然而,探讨了向无细胞提取液加入菠菜铁氧还蛋白和菠菜铁氧还蛋白还原酶及NADPH以恢复生物催化活性的可能性(参见,通常,D.E.Cane和E.I.Graziani,J.Amer.Chem.Soc.1202682,1998)。相应地,制备以下溶液
将底物溶液保存于4℃,其它溶液保存在-20℃,并且在使用时保持于冰上。
将下列溶液加入475μl澄清的无细胞提取液中10μl铁氧还蛋白,10μl铁氧还蛋白还原酶和1μl底物。在将底物加入细胞中后,将混合物立即且彻底混合和通气。然后,加入5μl的NADPH并且将混合物于30℃温育30分钟。然后,向混合物中加入1ml甲基-叔丁基醚并且彻底混合。接着,将混合物以14000rpm离心2分钟,并且将甲基-叔丁基醚相转移入10ml烧瓶中并且通过旋转蒸发器于真空中蒸发。将残渣溶解于200μl乙腈中并转移至HPLC样品瓶中。使用HPLC程序I进行HPLC分析。
通过HPLC分析可观察到4”-酮-除虫菌素的形成。因此,向无细胞提取液中加入菠菜铁氧还蛋白和菠菜铁氧还蛋白还原酶及NADPH恢复了生物催化活性。
一旦注射30μl样品,在4.83分钟出现一个峰,显示存在4”-酮-除虫菌素B1a。HPLC-质谱分析将870 D的质量分配给该峰,该质量与4”-酮-除虫菌素B1a的分子量相当。
注意,当通过HPLC和HPLC-质谱分析对产物形成进行分析时,除了4”-酮-除虫菌素,还发现在2.12分钟给出相应的酮水合物(ketohydrate)4”-羟基-除虫菌素的峰。该发现显示P450通过羟基化作用将除虫菌素转变为4”-羟基-除虫菌素,并从其通过脱水作用形成4”-酮-除虫菌素。有趣的是,当来自菠菜的铁氧还蛋白被来自细菌巴氏梭菌或来自红藻Porphyra umbilicalis的铁氧还蛋白替代后,仍发生从除虫菌素至4”-酮-除虫菌素的生物催化转变,显示该酶并不依赖特定的铁氧还蛋白来获取还原当量。
实施例IV分离具有提高活性的突变链霉菌属株系R-922为了获得具有提高的将除虫菌素区域选择性氧化为4”-酮-除虫菌素的能力的链霉菌属株系R-922的株系,产生UV突变体。为此,收集链霉菌属株系R-922的孢子,并于-20℃贮存于15%甘油中。所述贮存液含有2×109孢子。
接着将孢子贮存液稀释并转移到含有10ml无菌水的培养平板上,并将悬浮液暴露于Stratalinker UV crosslinker 2400(商购自Stratagene,La Jolla,CA)的UV光下。Stratalinker UV crosslinker使用254-nm光源并且用于照射样品的能量量可以在“能量方式(energy mode)”中设定。
通过试验,确定了需要接受8000微焦耳UV照射(254nm)以杀死99.9%的孢子。在诱变中使用这种水平的UV曝光。
将存活的UV诱变孢子铺板,培养并转移到基本培养基中。约0.3-0.4%的存活孢子测定为营养缺陷型的,显示在群体中诱变的水平好。
在如实施例II描述的全细胞生物催化分析中筛选诱变克隆的活性。如HPLC色谱中显示的,与野生型株系R922相比,一个突变体(“R-922UV突变体”)显示将除虫菌素区域选择性氧化为4”-酮-除虫菌素的能力提高2至3倍。尽管编码负责区域选择性氧化活性的P450单加氧酶的基因,即ema1,在R-922UV突变体中并没有突变,但是该突变体提供了含有ema1蛋白质的无细胞提取液的优良来源。
实施例V从链霉菌属株系R-922分离P450单加氧酶为了浓缩P450酶,将35ml活性无细胞提取液滤过45μm滤膜,并通过阴离子交换层析分馏。阴离子交换层析的条件如下FPLC设备 kta prime(购自Pharmacia Biotech)FPLC-柱 HiTrapTMQ(5ml)堆积到Resource Q(6ml)(购自Pharmacia Biotech)上洗脱液 缓冲液A25mM Tris/HCl(pH 7.5)缓冲液B25mM Tris/HCl(pH 7.5),含有1M KCl温度 洗脱瓶和馏分置于冰浴中流速 3ml/min检测 UV 280nm泵表 0.0min 100%A0%B线性梯度 至2.0min 90%A 10%B5.0min 90%A 10%B线性梯度 至30.0min 50%A 50%B线性梯度 至40.0min 0%A 100%B50.0min 0%A 100%B采用35%-40%缓冲液B洗脱酶活性。将活性馏分合并,并通过排阻限为5kD的BiomaxTM过滤器(商购自Millipore Corp.,Bedford,MA)于5000rpm离心过滤浓缩,然后在含有20%甘油的破碎缓冲液中再稀释至体积5ml,其含有3-10mg/ml蛋白质。这种浓缩的酶溶液含有至少25%的起始酶活性。
将酶进一步通过大小排阻层析纯化。大小排阻层析的条件如下FPLC设备kta prime(购自Pharmacia Biotech)FPLC-柱 HiLoad 26/60 Superdex 200 prep grade(购自Pharmacia Biotech)样品3-5ml获自阴离子层析步骤的浓缩的酶溶液样品制备通过45μm滤膜过滤洗脱缓冲液 PP-缓冲液(pH 7.0)+0.1M KCl温度4℃流速2ml/min检测UV 280nm酶活性在205-235ml洗脱缓冲液之间洗脱。将活性馏分合并,并通过排阻限为5kD的BiomaxTM过滤器(购自Millipore)于5000rpm离心过滤浓缩,然后在含有20%甘油的破碎缓冲液中再稀释以形成含有2-5mg/ml蛋白质的溶液0.5-1ml。这种浓缩的酶溶液含有至少10%的起始酶活性。这种酶制剂,当通过SDS page检查纯度(参见,通常,Laemmli,U.K.,自然(Nature)227680-685,1970和分子生物学当前方案,见上)和用考马斯蓝染色时,根据已知分子量的参考蛋白,显示一条分子量为45-50KD的主蛋白带。
实施例VI试图从链霉菌属株系R-922和I-1529分离P450单加氧酶基因基于上述显示来自株系R-922负责将除虫菌素区域选择性氧化为4”-酮-除虫菌素的酶为P450单加氧酶的结果,开始进行从这个株系克隆P450单加氧酶的直接基于PCR的方法(参见,通常,Hyun等,J.Microbiol.Biotechnol.8(3)295-299,1998)。该方法基于的实事为所有的P450单加氧酶包含高度保守的氧结合和血红素结合域,所述结合域在核苷酸水平也是保守的。针对这些保守结构域设计PCR引物并且使用R-922或I-1529基因组DNA作为模板扩增P450基因的DNA片段。使用的PCR引物如表1所示。
表1
*顶行显示氨基酸序列;下面第二行显示相应的核苷酸序列;S=G或C。
&Hyun等,见上,描述了该引物。
使用任何特异于编码O2结合域的核苷酸序列的引物与任何特异于编码血红素结合域的核苷酸序列的引物和来自链霉菌属株系R-922或I-1529的基因组DNA的PCR扩增产生约350bp DNA片段。由于P450基因中编码O2结合位点和血红素结合位点的基因片段分离约350bp,这恰好为PCR扩增期望的大小。
将350bp PCR片段克隆入pCR2.1-TOPO TA克隆质粒(商购自Invitrogen,Carlsbad,CA)并转化入大肠杆菌株系TOP10(Invitrogen,Carlsbad,CA)。将来自株系R-922和I-1529的约150个单独的克隆测序以确定代表了多少独特的P450基因片段。序列分析显示它们包括来自株系R-922的8个独特的P450基因片段和来自I-1529的7个独特的片段。
通过威斯康星大学程序包(University of Wisconsin Package)version 10.1的程序Pretty(Altschul等,Nucl.Acids Res.253389-3402)将分别来自杀结核链霉菌株系R-922和链霉菌株系I-1529的P450基因特异性PCR片段的推测氨基酸序列和参与合成碳霉素(Stol-ORFA)的耐热链霉菌(S.thermotolerans)P450单加氧酶(GenBank Accession No.D30759)进行比对的Blast分析,显示来自R-922和I-1529株系的所有独特的P450基因片段都衍生于P450基因并且编码O2结合域和血红素结合域间的区域。
接着,为了克隆从中获得PCR片段的全长基因,通过使用PCR克隆的DNA片段作为对含有来自株系R-922和I-1529的基因组DNA的基因文库的杂交探针。为此,采用Sau3A I部分消化来自R-922和I-1529的基因组DNA,用小牛肠碱性磷酸酶(CIP)去磷酸并连接入粘粒pPEH215,一种修饰的SuperCos 1(商购自Stratagene,LaJolla,CA)。使用Gigapack III XL包装提取物将连接产物包装并转染入大肠杆菌XL1 Blue MR宿主细胞。从R-922文库中鉴定出与PCR产生的P450基因片段强烈杂交的20个粘粒,对其中的3个独特的P-450基因亚克隆和测序。根据Church和Gilbert(Church和Gilbert,Proc.Natl.Acad.Sci.美国811991-1995,1984)的方案在高严谨条件下进行杂交。简要地讲,这些高严谨条件包括含有500mM磷酸钠(Na-phosphate),1mM EDTA,7%SDS,1%BSA的杂交缓冲液;含有40mM磷酸钠,1mM EDTA,5%SDS,0.5%BSA的洗涤缓冲液1;和含有40mM磷酸钠,1mM EDTA,1%SDS的洗涤缓冲液2(注意,在分子生物学当前方案(见上)中描述了其它高严谨杂交条件)。从I-1529文库中鉴定出19个强杂交粘粒,对其中4个独特的P-450基因亚克隆和测序。
在另一个从株系R-922和I-1529中分离各种P450单加氧酶基因的方法中,使用来自另外细菌的已知P450基因作为杂交探针以鉴定含有来自株系R-922和I-1529的同源P450单加氧酶基因的粘粒克隆。在本次尝试中探针使用来自纤维堆囊菌(Sorangium cellulosum)株系So ce90的epoF P450基因,其参与环氧聚微管素(epothilones)的合成(Molnar等,Chem Biol.7(2)97-109,2000)。使用epoF P450基因探针,从株系R-922中鉴定出一个粘粒(克隆LC),并且从株系I-1529中鉴定出三个(克隆LA,LB和EA)。在每种情况中,将同源基因片段亚克隆和测序,并且发现其编码P450单加氧酶。
然而,与实施例VII(以下)鉴定的17个多肽序列比较,未匹配任何这些克隆基因。两条多肽序列(即,LVKDDPALLPR和AVHELMR)定位于O2和血红素结合域之间的区域,所以,这些应该能鉴定通过PCR方法获得的任何部分基因片段。因此,基于Hyun等(见上)的已知PCR技术和使用已知P450基因作为杂交探针的标准方法未鉴定出编码负责区域选择性氧化除虫菌素的特定P450单加氧酶的基因。因此,确定需要额外的试验以分离本发明编码P450单加氧酶的基因。
实施例VII来自链霉菌属株系R-922的P450单加氧酶的部分测序由Friedrich Miescher Institute(Basel,瑞士)进行来自链霉菌属株系R-922的P450单加氧酶的部分氨基酸测序。SDS page上主要带的蛋白质用胰蛋白酶消化并将形成的肽通过质谱和Edman降解分离并测序(一般参见,Zerbe-Burkhardt等,J.Biol.Chem.2736508,1998)。发现如下17条肽的序列
序列序列I.D.No.
HPGEPNVMDPALITDPFTGYGALR (SEQ ID NO61)FVNNPASPSLNYAPEDNPLTR (SEQ ID NO62)LLTHYPDISLGIAPEHLER (SEQ ID NO63)VYLLGSILNYDAPDHTR (SEQ ID NO64)TWGADLISMDPDR (SEQ ID NO65)EALTDDLLSELIR (SEQ ID NO66)FMDDSPVWLVTR (SEQ ID NO67)LMEMLGLPEHLR (SEQ ID NO68)VEQIADALLAR (SEQ ID NO69)LVKDDPALLPR (SEQ ID NO70)DDPALLPR (SEQ ID NO71)TPLPGNWR (SEQ ID NO72)LNSLPVR (SEQ ID NO73)ITDLRPR (SEQ ID NO74)EQGPVVR (SEQ ID NO75)AVHELMR (SEQ ID NO76)AFTAR (SEQ ID NO77)FEEVR (SEQ ID NO78)这些肽与选择的放线菌P450单加氧酶序列的比对显示,所有的这些肽为单一P450单加氧酶的片段。
实施例VIII从株系R-922中克隆编码负责将除虫菌素氧化为4”-酮-除虫菌素的酶的P450单加氢酶基因通过将获自株系R-922的P450酶的几个肽的氨基酸序列反向翻译设计PCR引物(参见实施例VII和以下表2)。在PCR反应中,5条正向引物(2aF,2bF,3F,1F,和7F)的每一个与一个反向引物(5R)配对,并以R-922基因组DNA作为模板。在每个反应中,产生了期望大小的DNA片段。
表2
*多义密码Y=C或T;R=A或G;S=C或G;W=A或T**当引物与引物5R配对时,PCR产物的期望大小将分别采用引物(2bF和5R)和(2aF和5R)产生的580和600bp PCR片段克隆入pCR-Blunt II-TOPO克隆质粒(商购自Invitrogen,Carlsbad,CA)并转化入大肠杆菌株系TOP10(Invitrogen,Carlsbad,CA)。然后将插入的DNA片段测序。序列检查显示600和580bp片段在它们共同的580 bp序列中相同。而且,从600bp和580bp片段的核苷酸序列推断的氨基酸序列(SEQ ID NO2)与从分离基因此区域中对齐的纯化P450Ema1酶分离的肽的氨基酸序列间完全匹配。这个结果强烈提示这些克隆中分离的基因片段来源于编码负责将除虫菌素氧化为4”-酮-除虫菌素的P450Ema1酶的基因。
使用以引物2aF(SEQ ID No80)和5R(SEQ ID No90)产生的600bp PCR片段作为对分离自株系R-922的基因组DNA的粘粒文库(如实施例VI描述的粘粒文库)的杂交探针。鉴定出命名为pPEH249和pPEH250的与探针强烈杂交的2个粘粒。将每个粘粒编码P450酶的部分测序,发现两个粘粒间序列相同。鉴定了ema1基因的全部编码序列(SEQ ID NO1)。获自P450Ema1的所有多肽片段的氨基酸序列与从ema1基因推断的氨基酸序列完全匹配。利用BLASTP(Altschul等,见上)比较由ema1基因编码的蛋白质的推断的氨基酸序列,确定数据库中最接近的匹配为与来自耐热链霉菌的P450单加氧酶的匹配,而其在碳霉菌的生物合成中起作用(Arisawa等,Biosci.Biotech.Biochem.59(4)582-588,1995)并且其与ema1只具有49%的同一性(同一性=202/409(49%),阳性(Positives)=271/409(65%),缺口=2/409(0%))。在Blast分析中,采用如下设置BLASTP 2.0.10λ(Lambda) K H0.322 0.140 0.428带缺口的λ(Gapped Lambda) K H0.270 0.04700.230矩阵(Matrix)BLOSUM62缺口罚值(Gap Penalties)存在(Existence)11,延伸(Extension)1对DB的命中数(Number of Hits to DB)375001765序列数(Number of Sequences)1271323延伸数(Number of extensions)16451653成功延伸数(Number of successful extensions)46738优于10.0的序列数(Number of sequences better than 10.0)2211没有缺口、优于10.0的HSP′s数(Number of better than 10.0without gapping)628初步测试中成功缺口的HSP′s数(Number of HSP′s successfullygapped in prelim test)1583
初步测试中尝试缺口的HSP′s数(Number of HSP′s thatattempted gapping in prelim test)43251缺口HSP′s数(非初步测试)(Number of HSP′s gapped(non-prelim))2577查询的长度(length of query)430数据库长度(length of database)409,691,007有效HSP长度(effective HSP length)55查询的有效长度(effective length of query)375数据库的有效长度(effective length of database)339,768,242有效检索空间(effective search space)127413090750使用的有效检索空间(effective search space used)127413090750这两条基因的核苷酸序列的相似比较显示它们在核苷酸水平具有65%的同一性。这些结果证明P450Ema1为新的酶。
实施例IXema1基因在浅青紫链霉菌株系ZX7中异源表达ema1基因的编码序列与硫链丝菌肽可诱导的启动子(tipA)(Murakami等,J.Bacteriol.1711459-1466,1989)融合。TipA启动子来自质粒pSIT151(Herron和Evans,FEMS MicrobiologyLetters 171215-221,1999)。
通过首先用下列引物扩增ema1编码序列以在5’端引入PacI克隆位点和在3’端引入PmeI匹配端,实现tipA启动子和ema1编码序列的融合。
正向引物下面划线的序列为PacI识别序列;粗体序列为ema1编码序列的起始。
反向引物下面划线的序列为PmeI识别序列的一半;粗体序列为ema1翻译终止子的反向互补序列,然后为ema1编码序列的3’端。
5’-AAACTCACCCCAACCGCACCGGCAGCGAGTTC-3”(SEQ ID NO92)将含有ema1编码序列的PacI消化的PCR片段克隆入质粒pTBBKA(参见图1),该质粒已用PacI和PmeI限制(即消化),并且连接的质粒转化入大肠杆菌。将四个克隆测序。四个中的三个含有全部和正确的ema1编码序列。第四个ema1基因克隆含有ema1基因的截短的版本。全长ema1基因编码以氨基酸序列MSELMNS(SEQ IDNO93)起始的蛋白质。截短的基因编码缺少开始的4个氨基酸并以第二个蛋氨酸残基起始的蛋白质。这个基因命名为ema1A。ema1A的核苷酸和氨基酸序列分别以SEQ ID NO33和SEQ ID NO34提供。这些质粒pTBBKA-ema1和pTBBKA-ema1A中的ema和ema1A基因与tipA启动子正确邻接以引起基因从这个启动子表达。
质粒pTBBKA含有来自链霉菌插入元件IS117的基因,该基因编码催化将质粒位点特异性整合入链霉菌属物种的染色体中的整合酶(Henderson等,Mol.Microbiol.31307-1318,1989和Lydiate等,Mol.Gen.Genet.20379-88,1986)。由于质粒pTBBKA仅具有大肠杆菌复制起点,并含有转移位点(mobilization site),其可以通过结合从大肠杆菌转移至链霉菌属株系,在那儿其不复制。然而,由于IS117整合酶,它能够整合入染色体。由于质粒带有卡那霉素抗性基因,所以可以通过对卡那霉素的抗性选择含有染色体整合的链霉菌属克隆。
还将ema1编码序列克隆入其它在引入链霉宿主后或者在链霉菌中复制或者象pTBBKA一样整合入染色体的质粒。例如,将ema1克隆入质粒pEAA,质粒pEAA与质粒pTBBKA相似但含有tipA启动子的KpnI/PacI片段被ermE基因启动子替换(Schmitt-John和Engels,Appl Microbiol Biotechnol.36(4)493-498,1992)。另外,pEAA不含有卡那霉素抗性基因。ema1基因以PacI/PmeI片段形式克隆入pEAA以产生质粒pEAA-ema1,在该质粒中ema1基因由组成型ermE启动子表达。
质粒pTUA1A为链霉菌-大肠杆菌穿梭质粒(参见图2),该质粒含有tipA启动子。也将ema1基因克隆入质粒pTUA1A的PacI/PmeI位点以产生质粒pTUA-ema1。
也将ema1A基因片段以与ema1基因片段相同的方式,作为PacI/PmeI片段连接入质粒pTUA1A和pEAA,分别产生质粒pTUA-ema1A和pEAA-ema1A。
将含有ema1或ema1A基因的基于pTBBKA、pTUA1A和pEAA的质粒引入浅青紫链霉菌ZX7,并且在每种情况下,获得并验证转化体(分别为浅青紫链霉菌株系ZX7∷pTBBKA-ema1或ema1A,ZX7(pTUA-ema1或-ema1A),和ZX7∷pEAA-ema1或-ema1A)。
测试野生型浅青紫链霉菌株系ZX7,发现其不能将除虫菌素氧化为4”-酮-除虫菌素。使用静息细胞(resting cells),检测每种转化的浅青紫链霉菌株系ZX7∷pTBBKA-ema1,ZX7∷pTBBKA-ema1A,ZX7(pTUA-ema1),ZX7(pTUA-ema1A),ZX7∷pEAA-ema1,和ZX7∷pEAA-ema1A将除虫菌素氧化为4”-酮-除虫菌素的能力。为此,进行如上描述的全细胞生物催化活性分析(包括分析方法)。注意,对于全细胞生物催化分析,转化的浅青紫链霉菌,象株系R-922一样生长于PHG培养基上,并仍然象株系R-922一样,具有16小时的反应时间(即,在此期间,将于50mM磷酸钾缓冲液10ml,pH7.0中的转化浅青紫链霉菌湿细胞500mg于28℃,在15μl异丙醇中的除虫菌素(30mg/ml)溶液存在下以160rpm振荡)。
发现在诱导剂硫链丝菌肽(5ug/ml)存在下,含有ema1或ema1A的株系ZX7∷pTBBKA-ema1,ZX7∷pTBBKA-ema1A,ZX7(pTUA-ema1),ZX7(pTUA-ema1A)将除虫菌素氧化为4”-酮-除虫菌素,证据为出现了氧化的4”-酮-除虫菌素化合物(参见表3)。
表3
1pTBBKA=IS117整合酶,tipA启动子;pTUA=复制型质粒,tipA启动子;pEAA=IS117整合酶,ermE启动子2未测定这些结果结论性证明由ema1基因编码的P450Ema1酶在杀结核链霉菌株系R-922中负责将除虫菌素氧化为4”-酮-除虫菌素。而且,该数据证明比自然ema1基因在N端短4个氨基酸的ema1A基因也编码活性的P450Ema1酶。正如用HPLC分析可证明的,在用0、0.5、或5.0μg/ml硫链丝菌肽诱导ema1表达后,由浅青紫链霉菌株系ZX7∷pTBBKA-ema1将除虫菌素氧化为4”-酮-除虫菌素依赖于用于诱导ema1表达的硫链丝菌肽的量而变化。注意,在不存在硫链丝菌肽的情况下浅青紫链霉菌株系ZX7∷pEAA-ema1和ZX7∷pEAA-ema1A(参见表3)显示这种氧化活性,原因是在这些株系中,由不需要诱导的ermE启动子表达ema1或ema1A基因。
实施例X从杀结核链霉菌株系I-1529分离ema1同源基因还发现杀结核链霉菌I-1529在除虫菌素的生物催化形成4”-酮-除虫菌素衍生物中具有活性。采用以如前所述的引物2aF(SEQ IDNo80)和5R(SEQ ID No90)产生的600bp ema1 PCR片段在Church和Gilbert的高严谨条件下(Church和Gilbert,Proc.Natl.Acad.Sci.USA 811991-1995,1984)对实施例VI所述的来自株系I-1529的粘粒文库进行探针探测,以鉴定含有来自株系I-1529的ema1同系物的克隆。鉴定出3个强杂交的粘粒。将两个粘粒,pPEH252和pPEH253,中的P450基因区域测序,发现是同样的。DNA序列分析揭示存在一个与株系R-922的ema1基因高度同源的基因。将Ema2(即,P450Ema2),Ema1(即,P450Ema1)推断的氨基酸序列,和来自参与碳霉素(Carb-450)生物合成的耐热链霉菌的P450单加氧酶(GenBank登记号D30759)比较,显示来自R-922和I-1529的所有的独特的P450基因片段都衍生于P450基因并且编码O2结合域和血红素结合域间的区域。
来自杀结核链霉菌株系I-1529的基因,命名为ema2,编码与P450Ema1酶在氨基酸水平具有90%同一性且在核苷酸水平具有90.6%同一性的酶。ema2基因的核苷酸序列和P450Ema2推断的氨基酸序列分别在SEQ ID NO3和SEQ ID NO4提供。
用与ema1和ema1A基因同样的方式将ema2编码序列克隆入质粒pTBBKA,pTUA1A,和pEAA,使得编码序列在这些质粒中与tipA或ermE*启动子功能性融合。将得到的质粒,pTBBKA-ema2,pTUA-ema2,和pEAA-ema2通过接合从大肠杆菌转移至浅青紫链霉菌ZX7以产生含有ema2基因的株系ZX7∷TBBKA-ema2和ZX7(pTUA-ema2)和ZX7∷pEAA-ema2,ema2基因整合入染色体中或保持在质粒上。
然后,检测株系ZX7∷TBBKA-ema2,ZX7(pTUA-ema2)和ZX7∷pEAA-ema2将除虫菌素氧化为4”-酮-除虫菌素的能力。ema2基因尽管与ema1基因相比水平低,但也显示提供生物催化活性(参见表3)。
这些结果证明来自杀结核链霉菌株系I-1529的ema2基因也编码能够将除虫菌素氧化为4”-酮-除虫菌素的P450单加氧酶(P450Ema2)。
实施例XI来自其它生物催化株系的ema1同系物的表征鉴定出17个链霉菌属株系,包括株系R-922和I-1529,能够催化将除虫菌素的4”-甲醇区域特异性氧化为酮。接着,完成编码所有这些株系的生物催化酶的基因的分离和表征。
为此,从这些株系分离出基因组DNA,通过用几个限制性内切酶酶切和与ema1基因Southern杂交进行评价。每个DNA鉴定出一个特定的限制性内切酶,该内切酶将产生一个与ema1基因杂交的确定大小的单一DNA片段。对于每个株系,只有一个强杂交DNA片段,因此,暗示在这些实验中使用高严谨杂交条件下,没有检测出其它P450基因。将每个DNA用合适限制性内切酶消化,并进行琼脂糖凝胶电泳。从凝胶中将包含ema1-杂交片段大小的狭窄大小范围的DNA切除。将大小选择的DNA连接入合适的克隆质粒并且将连接的质粒用于转化大肠杆菌。通过与ema1基因片段的菌落杂交筛选每个实验中的大肠杆菌克隆以鉴定包含ema1同源DNA片段的克隆。
确定每个ema1-同源克隆中克隆的DNA的核苷酸序列,并检查与ema1具有同源性的编码P450酶的基因的存在。采用这种方式,从15个其它活性株系的14株系中分离出ema1同源基因。这些基因的核苷酸和推断的氨基酸序列参见表4的SEQ ID NOS5-32和94-95。这些酶的关系可以通过系统树形式显示。这样的系统树可以使用商购的GCG Wisconsin software program version 1.0(Madison,WI)产生。
表4
*该株系采用16s rDNA分析显示在恰塔努加种(Chattanoogensis)中;然而,采用德国培养物保藏中心(German culturecollection(DSMZ))使用的经典分类方法显示其为saraceticus。
实施例XII构建带有组氨酸标签的ema1和ema1同系物以便于酶纯化为了纯化P450Ema1酶和由其它生物催化株系的ema1同系物编码的P450酶,将每个P450基因克隆入大肠杆菌表达质粒pET-28b(+)(商购自Novagen,Madison,WI)。设计pET-28质粒是用来便于在N-,或C-端与组氨酸标签的融合并提供在大肠杆菌中从T7噬菌体启动子的基因强表达。在许多情况下,ema基因的编码序列以序列ATGT起始。通过PCR将这些基因扩增,这样,在5’端的引物在5’端引入PciI识别位点(5’ATATGT 3’)。PciI位点的后4个碱基与ema基因编码序列起始端的ATGT对应。
设计基因3’端的PCR引物以除去ema基因编码序列末端的翻译终止密码子并且在3’端加入XhoI识别位点。得到的PCR片段用PciI和XhoI限制性酶切以在5’端产生PciI端点和在3’端产生XhoI端点,由此,便于所述片段克隆入先前用NcoI和XhoI限制性酶切的pET-28b(+)中。由于PciI和NcoI的末端是相容的,所述片段以与T7启动子和核糖体结合位点合适的方向克隆入pET-28b(+)以提供基因的表达。
在每个ema基因的3’端,编码序列与组氨酸标签序列在读框中于XhoI位点融合,组氨酸标签序列后为翻译终止密码子。这导致产生C端加有6个组氨酸残基的Ema酶以方便在镍柱上的纯化。
在ema基因的ATG翻译起始密码子后没有T核苷酸的情况下,通过对5’端采用不同的策略利用PCR扩增ema基因。设计5’端的引物以在ATG翻译起始密码子的前面紧接着引入C,并且3’端的引物与如上所描述的相同。扩增的PCR片段用XhoI限制性酶切以在3’端产生XhoI末端,并且保留5’端为平端。将这些片段克隆入pET-28b(+),该pET-28b(+)已用NcoI限制性酶切(但是NcoI端通过用绿豆核酸外切酶处理成平端)并用XhoI限制性酶切。
用这种方式,将ema基因克隆入pET-28b(+)以与以前描述的T7启动子和C末端的组氨酸标签形成功能性融合。将所有带有组氨酸的ema基因测序,以确保没有由PCR引入错误。
通过标准方案分离和纯化大量的P450Ema1和P450Ema2酶。培养含有在诱导型tac启动子控制下的T7 RNA聚合酶基因和合适的pET-28/ema质粒的大肠杆菌株系BL21 DE3(商购自Invitrogen;Carlsbad,CA),收集并裂解细胞。将裂解物施用于Ni-NTA柱(商购自Qiagen Inc.,Valencia,CA),并根据生产商推荐的程序纯化蛋白质。
由于显示将除虫菌素高效率转化为4”-酮-除虫菌素,证明纯化的带有组氨酸标签的P450Ema1和P450Ema2在体外活性分析中具有高度活性。
实施例XIIIema1在假单胞菌中的表达接着将ema1基因构建体引入恶臭假单胞菌(野生型恶臭假单胞菌商购自美国典型培养物保藏中心(American Type CultureCollection),马纳萨斯,弗吉尼亚州,ATCC Nos.700801和17453)。ema1和ema1/fd233基因片段以PacI/PmeI片段克隆入质粒pUK21(Viera和Messing,基因(Gene)100189-194,1991)。将片段以正确的方向克隆入pUK21上tac启动子(Ptac)和终止子(Ttac)之间的位置以用于从tac启动子表达。以BglII片段从pUK21切除Ptac-ema1-Ttac和Ptac-ema1/fd233-Ttac基因片段并将这些片段克隆入广宿主范围的可传递质粒pRK290(Ditta等,Proc.Natl.Acad.Sci.美国777347-7351,1980)以产生质粒pRK-ema1和pRK-ema1/fd233(图3)。将这些质粒采用标准方法(Ditta等,Proc.Natl.Acad.Sci.美国777347-7351,1980)通过接合转移从大肠杆菌宿主引入恶臭假单胞菌株系ATCC 700801和ATCC 17453。
检测含有质粒pRK-ema1或pRK-ema1/fd233的恶臭假单胞菌ATCC 700801和ATCC 17453催化除虫菌素氧化的能力。如表3所示的结果显示这些株系能够催化这些反应。
实施例XIV编码与P450Ema1单加氧酶一起有活性的铁氧还蛋白的基因的鉴定P450单加氧酶对其催化的每个羟基化反应需要2个电子(Mueller等,“P45cam研究的二十五年对加氧酶催化作用的机制见解(Twenty-five years of P450camresearchMechanistic Insights intoOxygenase Catalysis)”细胞色素P450(Cytochrome P450),第二版,P.R.Ortiz de Montellano(编辑),pp.83-124;Plenum Press,NY1995)。这些电子由铁氧还蛋白一次一个传递给P450单加氧酶。电子归根结底来自NAD(P)H,并由铁氧还蛋白还原酶传递给铁氧还蛋白。当与特定铁氧还蛋白相互作用时,特定P450单加氧酶具有更高的活性。在许多情况下,编码与给定的P450单加氧酶特异性相互作用的铁氧还蛋白的基因与编码P450酶的基因位置临近。
如上所述,除了ema1基因,还分离和测序株系R-922的4个P450基因和株系I-1529的7个P450基因(参见实施例VI)。对于其中的一些,对P-450基因的侧翼DNA有足够的序列信息以寻找相关联的铁氧还蛋白基因的存在。通过该方法,从两个株系的每个都鉴定出2个独特的铁氧还蛋白基因。从株系R-922鉴定出铁氧还蛋白基因fd229和fd230,从株系I-1529鉴定出fd233和fdEA。另外,发现一个铁氧还蛋白还原酶基因位置与来自株系I-1529的fdEA基因邻近。
为了检测与P450Ema1联合的每个这些铁氧还蛋白的生物活性,通过PCR扩增每个单个铁氧还蛋白基因以产生一个基因片段,该基因片段包括5’平端,天然的核糖体结合位点和铁氧还蛋白基因编码序列,和在3’段的PmeI限制性酶切位点。将每个这样的铁氧还蛋白基因片段克隆入质粒pTUA-ema1中位于ema1基因3’端的PmeI位点。采用这种方法,产生了由操作性连接于功能性启动子的ema1基因和一个铁氧还蛋白基因构成的人工操纵子。
在fdEA铁氧还蛋白基因的情况下,其中发现铁氧还蛋白还原酶基因freEA位置与fdEA基因邻近,采用相似的PCR策略,产生同时含有fdEA和freEA基因的DNA片段。按照与其它铁氧还蛋白描述的一样,也将该基因片段克隆入质粒pTUA-ema1的PmeI位点。
通过将各个ema1-铁氧还蛋白基因质粒引入浅青紫链霉菌株系ZX7,检测每个ema1-铁氧还蛋白基因联合的生物活性。测定了浅青紫链霉菌中每个质粒的生物催化活性。在4个不同的构建体中,当与在同样的质粒和宿主背景下ema1单独表达相比时,只有来自株系I-1529的铁氧还蛋白基因fd233提供增强的活性(参见表3)。浅青紫链霉菌中的pTUA-ema1/fd233质粒与pTUA-ema1质粒相比,提供约高1.5至3倍的活性。含有其它铁氧还蛋白基因的其它三个质粒与只有ema1基因的质粒相比,给出基本上相同的结果。同样地,pTUA-ema1/fdEA/freEA质粒没有产生与pTUA-ema1不同的结果。fd233基因的核苷酸序列和推断的氨基酸序列分别显示于SEQ IDNOs35和36。
fd233的核苷酸和氨基酸序列的BLAST分析揭示最接近的匹配是与天蓝色链霉菌(S.coelicolor)(GenBank登录号AL445945)和浅青紫链霉菌(GenBank登录号AF072709)的铁氧还蛋白。在核苷酸水平,fd233分别与天蓝色链霉菌和浅青紫链霉菌的铁氧还蛋白具有80和79.8%的同一性。在肽水平,fd233分别与天蓝色链霉菌和浅青紫链霉菌的铁氧还蛋白具有79.4和77.8%的同一性。
由于fd233来自株系I-1529,ema1来自株系R-922,所以由这两个基因编码的蛋白质天然不能相互作用。在设计鉴定来自株系R-922的与fd233基因同源并有可能编码与P450Ema1最佳相互作用的铁氧还蛋白的铁氧还蛋白基因的方法中,使用fd233基因作为对株系R-922 DNA的基因文库的杂交探针。鉴定出强杂交质粒pPEH232并且将杂交DNA克隆和测序。比较来自fd233和粘粒pPEH232上的铁氧还蛋白基因fd232的推断的氨基酸序列,揭示它们只有单个氨基酸不同。
以相似的方式,构建质粒pTUA-ema1-fd232并在浅青紫链霉菌ZX7中测试。这个质粒给出与从质粒pTUA-ema1-fd233获得的结果相似结果(参见表3)。fd232的核苷酸序列和推断的氨基酸序列分别显示于SEQ ID NOs37和38。
也将ema1-fd233操纵子作为PacI-PmeI片段亚克隆入已用相同限制酶消化的pTBBKA和pEAA。在除虫菌素转变分析中,检测浅青紫链霉菌ZX7∷pTBBKA-ema1-fd233和浅青紫链霉菌ZX7∷pEAA-ema1-fd233并且发现,比在可比较质粒中含有单独ema1基因的株系具有更高的活性(参见表3)。
实施例XVP450Ema1和P450Ema2在其它细胞中的异源表达表达构建体pRK-ema1(实施例XIII)和pRK-ema2(用与实施例XIII描述的pRK-ema1相似的方法产生)通过接合移动至3个荧光土壤假单胞菌株系。按照标准方法进行接合(Ditta等,Proc.Natl.Acad.Sci.美国,777347-7351,1980)。这些株系为荧光假单胞菌MOCG134、荧光假单胞菌Pf-5和荧光假单胞菌CHAO。对每个转接合子进行将除虫菌素转变为4”-酮-除虫菌素的标准静息细胞分析。对株系Pf-5和CHAO,转变水平低于检测极限。株系MOCG134对ema1产生3%转变,对ema2产生5%转化。
另外,通过原生质体介导的转化,将如表5所列出的构建体引入除虫链霉菌MOS-0001(Kieser,T.;Bibb,M.J.;Buttner,M.J.;Chater,K.F.;Hopwood,D.A.(编辑)实用链霉菌遗传学(PracticalStreptomyces Genetics)The John Innes Foundation,诺里奇(英格兰),2000),(Stutzman-Engwall,K.等(1999)指导B2∶B1除虫菌素比率的除虫链霉菌基因(Streptomyces avermitilis gene directing the ratio ofB2∶B1 avermectins),WO 99/41389))。
表5
检测野生型除虫链霉菌MOS-0001并且发现其不能将除虫菌素氧化为4”-酮除虫菌素。
使用静息细胞,检测每个转化的除虫链霉菌株系MOS-0001∷pTBBKA-ema1,MOS-0001(pTUA-ema1),MOS-0001∷pEAA-ema1,MOS-0001∷pTBBKA-ema1A/fd233,和MOS-0001(pTUA-ema1A/fd233)将除虫菌素氧化为4”-酮-除虫菌素的能力。为此,进行如上所述的(包括分析方法)全细胞生物催化分析。注意对于全细胞生物催化分析,转化的除虫链霉菌,象株系R-922一样,生长于PHG培养基,并且,再一次如株系R-922一样,反应时间为16小时(即,在此期间,将于10ml的50mM磷酸钾缓冲液(pH 7.0)中的500mg转化的除虫链霉菌湿细胞于异丙醇中15μl除虫菌素溶液(30mg/ml)存在下,于在28℃以160rpm振荡。
如表5所示,在诱导剂硫链丝菌肽(5μg/ml)存在下,发现含有ema1-或ema1A/fd233的株系MOS-0001∷pTBBKA-ema1,MOS-0001∷pTBBKA-ema1A/fd233,MOS-0001(pTUA-ema1)和MOS-0001(pTUA-ema1A/fd233)将除虫菌素氧化为4”-酮-除虫菌素,证据为出现氧化的4”-酮-除虫菌素化合物。注意,除虫链霉菌株系MOS-0001∷pEAA-ama1在不存在硫链丝菌肽下显示这样氧化活性,因为在该株系中,ema1基因由不需要诱导的ermE启动子表达。
这样,在各种链霉菌属和假单病菌属的株系中,ema1 P450单加氧酶基因的表达提供在静息细胞分析中能够将除虫菌素转变为4”-酮除虫菌素的重组细胞。
接着,在大肠杆菌中检测P450Ema1单加氧酶的表达和活性。为此,如前所述将ema1基因克隆入大肠杆菌表达质粒pET-28b(+)中(商购自Novagen,Madison,WI)。将含有在诱导型tac启动子控制下的T7聚合酶基因和pET-28/ema1质粒的大肠杆菌株系BL21 DE3(商购自Invitrogen;Carlsbad,CA)培养于具有一个挡板的250ml烧瓶中含有5mg/l卡那霉素的50ml LB培养基中,于37℃培养16小时,以130rpm振荡。使用0.5ml这种培养物接种具有一个挡板的2升烧瓶中含有5mg/l卡那霉素的500ml LB培养基中,并将培养物于37℃培养4小时,然后30℃培养4小时,并伴以130rpm振荡。通过离心收集细胞,并于50mM磷酸钾缓冲液中洗涤,并再次离心。
对于静息细胞分析,称取90mg湿细胞于深孔平板中,三次重复,并悬浮于0.5ml 50mM磷酸钾缓冲液中。对于无细胞提取物,将8ml破碎缓冲液中的4克湿细胞在弗氏压碎器中破碎。
对于静息细胞分析,将5μl底物(2.5mg/ml于2-丙醇中)加入细胞悬浮液。用可透过空气的箔将平板封住,并于28℃在定轨摇床中以1000rpm温育22小时进行反应。没有检测到除虫菌素转变为4”-酮除虫菌素。
对于无细胞分析,如实施例III所述,加入100μl无细胞提取物,2-丙醇中的1μl底物溶液(20mg/ml),5μl 100mM NADPH,10μl铁氧还蛋白,10μl铁氧还蛋白还原酶,和374μl磷酸钾缓冲液pH 7.0。在30℃以600rpm振荡培养20小时分析。9.2%+/-0.3%的除虫菌素转变为4”-酮除虫菌素。
这样,ema1基因在大肠杆菌中的表达导致有活性的Ema1 P450单加氧酶的产生,当所述单加氧酶从细胞中纯化时,能够将除虫菌素转变为4”-酮除虫菌素。
实施例XVI鉴定和克隆编码支持提高的P450Ema1单加氧酶适性的铁氧还蛋白还原酶的基因支持P450单加氧酶活性的电子传递途径还包括铁氧还蛋白还原酶。这些蛋白向铁氧还蛋白供给电子并且,如铁氧还蛋白和P450单加氧酶一样,已知特定的铁氧还蛋白还原酶对某些铁氧还蛋白比其它铁氧还蛋白是更好的电子供体。
因此,克隆链霉菌属株系的许多铁氧还蛋白还原酶基因并评价它们对生物催化反应的影响。为此,从NCBI获取大量细菌铁氧还蛋白还原酶(Fre)蛋白序列,并使用GCG包的程序Pretty比对。使用两个保守区域(相距约266个氨基酸残基)以产生PCR的简并寡核苷酸。使用正向引物(CGSCCSCCSCTSWSSAAS(SEQ ID NO96;其中“S”为C或G;并且“W”为A或G))并且反向引物(SASSGCSTTSBCCCARTGYTC(SEQ ID NO97;其中“S”为C或G;“B”为C,G,或T;“R”为A或G;并且“Y”为C或T))从有生物催化活性的链霉菌株系R-922和I-1529扩增800bp产物。将这些产物集合体克隆入TOPO TA克隆载体(商购自Invitrogen Inc.,Carlsbad,CA)并按照标准方法(参见,例如,分子生物学当前方案,Ausubel等编辑,John Wiley & Sons,Inc.2000)对来自R922和I-1529的各20个克隆测序。测序显示从这些株系分离出4个独特的fre基因片段3个来自R922(fre3,fre12,fre14)和1个来自I-1529(fre16)。使用fre3、fre12、fre14和fre16基因片段作为探针从链霉菌属株系R922和I-1529的基因组克隆库鉴定全长铁氧还蛋白还原酶。通过这种方法,将这4个不同fre基因每一个的全部编码序列克隆和测序。核酸和氨基酸序列提供如下fre3(SEQ ID NOs98和99);fre12(SEQ ID NOs100和101);fre14(SEQ ID NOs102和103);和fre16(SEQ ID NOs104和105)。
为了分析每个fre基因与Ema1活性相关的生物活性,将每个基因插入如上所描述的ema1/fd233操纵子,fd233基因的3’端。这形成由相同启动子表达的ema1,fd233和各fre基因构成的人工操纵子。将ema1/fd233/fre操纵子克隆入假单胞菌质粒pRK290,并引入3个不同的恶臭假单胞菌株系。然后使用全细胞分析分析这些株系的Ema1生物催化活性,并且发现,其中的一个基因,即来自株系I-1529的fre基因fre16,提高了P450Ema1单加氧酶的活性约2倍。由于仅在恶臭假单胞菌的一个株系ATCC保藏号No.17453中看到,而在其它两个株系中未看到,故此这种效果是株系特异性的。在恶臭假单胞菌株系ATCC 17453中,fre基因fre16的存在导致与没有该基因的23%相比,除虫菌素至4”-酮-除虫菌素的转变率44%。其它fre基因对任何检测的恶臭假单胞菌株系中的生物催化活性没有影响。
在相似的方法中,将每个ema1/fd233/fre操纵子克隆至链霉菌属的质粒pTUA,pTBBKA和pEAA中,并引入浅青紫链霉菌株系ZX7。在每种情况下,在浅青紫链霉菌中,任何fre基因对生物催化活性没有影响。
等同物仅仅使用常规试验方法,本领域技术人员将知晓,或能够确定,本文描述的多种特定物质和方法的等同物。这样的等同物被认为在本发明的范围之内。
本文涉及的专利和科学文献确立本领域技术人员能够获得的知识。本文引用的这些公布的专利、申请和参考文献,包括GenBank数据库序列,在此引入作为参考,其程度就象具体和单个地指明将每篇文献引入作为参考一样。任何本文引用的参考文献和本说明书的具体教导间的矛盾,在解决时应利于后者。同样,任何本领域理解的单词或短语的定义与本说明书具体教导的该单词或短语的定义间的矛盾,在解决时应利于后者。
序列表<110>Syngenta Participations AG<120>生产依马菌素的方法和组合物<130>PB/5-60016A<140>
<141>
<150>US 60/291,149<151>2001-05-16<160>105<170>FastSEQ for Windows Version 4.0<210>1<211>1293<212>DNA<213>杀结核链霉菌(Streptomyces tubercidicus)<400>1atgtcggaat taatgaactc tccgttcgcc gcgcacgtcg ggaaacaccc gggcgagccg 60aatgtgatgg accccgccct gatcaccgac ccgttcaccg gctacggcgc gctgcgtgag120cagggcccgg tcgtacgggg ccggttcatg gacgactcgc ccgtctggct ggtgacgcgg180ttcgaggagg tccgccaggt cctgcgcgac cagcggttcg tgaacaatcc ggcctcgccg240tccctgaact acgcgcccga ggacaacccg ctgacccggc tgatggagat gctgggcctc300cccgagcacc tccgcgtcta cctgctcgga tcgatcctca actacgacgc ccccgaccac360acccggctgc gccgtctggt gtcgcgggcg ttcacggccc gcaagatcac cgacctgcgg420ccccgggtcg agcagatcgc cgacgcgctg ctggcccggc tgcccgagca cgccgaggac480ggcgtcgtcg acctcatcca gcacttcgcc taccccctgc cgatcaccgt catctgcgaa540ctggtcggca tacccgaagc ggaccgcccg cagtggcgaa cgtggggcgc cgacctcatc600tcgatggatc cggaccggct cggcgcctcg ttcccggcga tgatcgagca catccatcag660atggtccggg aacggcgcga ggcgctcacc gacgacctgc tcagcgaact gatccgcacc720catgacgacg acggcgggcg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc780gtcctcgccg gccacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc840acccaccccg accagctgcg tctggtcaag gacgatccgg ccctcctccc ccgtgccgtc900cacgagctga tgcgctggtg cgggccggtg cacatgaccc agctgcgcta cgccaccgcc960gacgtcgacc tcgccggcac accgatccgc cagggcgatg ccgttcaact catcctggta 1020tcggccaact tcgacccccg tcactacacc gaccccgacc gcctcgatct cacccggcac 1080cccgcgggcc acgccgagaa ccatgtgggt ttcggccatg gagcgcacta ctgcctgggc 1140gccacactcg ccaaacagga aggtgaagtc gccttcggca aactgctcac gcactacccg 1200gacatatcgc tgggcatcgc cccggaacac ctggagcgga caccgctgcc gggcaactgg 1260cggctgaact cgctgccggt gcggttgggg tga1293<210>2<211>430<212>PRT<213>杀结核链霉菌
<400>2Met Ser Glu Leu Met Asn Ser Pro Phe Ala Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe20 25 30Thr Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro65 70 75 80Ser Leu Asn Tyr Ala Pro Glu Asp Asn Pro Leu Thr Arg Leu Met Glu85 90 95Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly195 200 205Ala Ser Phe Pro Ala Met Ile Glu His Ile His Gln Met Val Arg Glu210 215 220Arg Arg Glu Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Val Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Thr Ala305 310 315 320Asp Val Asp Leu Ala Gly Thr Pro Ile Arg Gln Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Thr His Tyr Pro385 390 395 400Asp Ile Ser Leu Gly Ile Ala Pro Glu His Leu Glu Arg Thr Pro Leu405 410 415Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Val Arg Leu Gly
420 425430<210>3<211>1293<212>DNA<213>杀结核链霉菌<400>3atgtcggcat tatccagctc tccgttcgct gcgcatgtcg ggaaacaccc gggtgagccg 60aatgtgatgg agccggcgct gctcaccgac ccgttcgcgg gctacggcgc gctgcgtgag120caggccccgg tcgtacgggg ccggttcgtg gacgactcac cggtctggtt cgtgacgcgc180ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggccgcgccg240cccctggccc catcggccga ggagaacccg ctgaccaggc tgatggacat gctgggcctc300cccgagcacc tccgcgtcta catgctcggg tcgattctca actacgacgc ccccgaccac360acccggctgc gccgtctggt gtcgcgcgcg ttcacggcgc ggaagatcac cgatctgcga420ccgcgtgtcg agcagatcgc cgacgagctg ctggcccgcc tccccgagta cgccgaggac480ggcgtcgtcg acctcatcca gcatttcgcc tacccgctgc cgatcaccgt catctgcgag540ctggtcggca tacccgaagc ggaccgcccg cagtggcgga agtggggcgc cgacctcatc600tcgatggacc cggaccggct cggcgcaacg ttcccggcga tgatcgagca catccatgag660atggtccggg agcggcgcgc ggcgctcacc gatgatctgc tcagcgagct gatccgtacc720catgacgacg atggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc780gtcctcgccg gtcacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc840acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc ccgggccgtc900catgaactga tgcgctggtg cgggccggtg cagatgacgc agctgcgcta cgcggccgcc960gacgtcgacc tcgccggtac gcggatccac aagggcgacg ccgtacaact cctcctggtt 1020gcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgatct gacgcgtcac 1080cccgccggcc acgccgagaa ccatgtgggt ttcggccacg gtgcgcatta ctgcctgggt 1140gccaccctcg ccaagcagga gggcgaagtc gcgttcggca agctgctcgc gcactacccg 1200gagatgtccc tgggcatcga accggaacgt ctggagcgat tgccgctgcc tggcaactgg 1260cggctgaatt ccctgccgtt gcggctgggg tga1293<210>4<211>430<212>PRT<213>杀结核链霉菌<400>4Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Ala Pro Val Val Arg Gly Arg35 40 45Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Ash Asn Pro Ala Ala Pro65 70 75 80Pro Leu Ala Pro Ser Ala Glu Glu Asn Pro Leu Thr Arg Leu Met Asp85 90 95Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Met Leu Gly Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser
115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu Tyr Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Lys Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly195 200 205Ala Thr Phe Pro Ala Met Ile Glu His Ile His Glu Met Val Arg Glu210 215 220Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala305 310 315 320Asp Val Asp Leu Ala Gly Thr Arg Ile His Lys Gly Asp Ala Val Gln325 330 335Leu Leu Leu Val Ala Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro385 390 395 400Glu Met Ser Leu Gly Ile Glu Pro Glu Arg Leu Glu Arg Leu Pro Leu405 410 415Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Gly420 425 430<210>5<211>1413<212>DNA<213>龟裂链霉菌(Streptomyces rimosus)<400>5atgaccacat cgcccaccga gtcccgggcg gccaccccgc ccgactccac cgcctccccc 60tcgaccgctt ccgccccggc caccacccct tcggccgccg cctctccgga caccaccgac120cgcaccacgc tcccctccta cgtcggcctc cacccgggcg agccgaacct gatggaaccg180gagctgctgg agaacccgta caccggctac ggcacgctgc gcgagcaggc cccgctcgtc240cgcgcccggt tcatcgacga ctcgcccatc tggctggtga cccgcttcga cgtggtgcgc300gaggtgatgc gtgaccagcg gttcgtcaac aacccgaccc tggtgcccgg catcggcgcg360gacaaggacc cgcgtgcccg gctgatcgag ctgttcggca tccccgagga cctggccccg420
tacctcaccg acaacatcct caccagcgac ccgccggacc acacccggct gcgccgcctg480gtctcccgcg ccttcaccgc acgccgtatc caggacctgc ggccgcgcgt cgagcggatc540accgacgagc tgctggaacg gctgccggac catgccgagg acggcgtcgt cgacctcgtc600gagcacttcg cctacccgct gcccatcacg gtcatctgcg agctggtcgg catcgacgag660gaggatcggg cgctgtggcg gcggttcggc gccgacctcg cctcgctgaa ccccaagcgc720atcggcgcca ccatgccgga gatgatctcg cacatccacg agctgatcga cgaacggcgc780gcggccctgc gggacgacct gctcagcggg ctcatccggg cgcaggacga cgacggcggc840cggctgagcg acgtcgagat ggtcaccctg gtcctgaccc tggtactggc cggtcacgag900accaccgccc acctcatcag caacggcacc ctcgccctgc tcacccaccc cgaccagcgg960cggctgatcg acgaggaccc ggcgctgctg ccgcgcgcgg tccacgagct gatgcgctgg 1020tgcgggccga tccaggccac ccagcttcgg tacgccctgg aggacaccga ggtggccgga 1080gtccaggtcc gccagggcga ggccctgatg ttcagcctcg tcgcggccaa ccacgacccg 1140cgccactaca ccgggccgga gcggctcgac ctgacgcggc agccggccgg ccgcgccgag 1200gaccacgtcg gcttcggcca cggcatgcac tactgcctgg gtgcctcact cgcccggcag 1260gaggccgagg tggcctacgg gaagctgctc acccgctacc cggacctggc gctcgccctc 1320accccggaac agttggagga ccaggaacgc ctgcggcagc ccggcacctg gcgcctgcga 1380cggctgccgc tgaggctgca cgcgcagagc tga1413<210>6<211>470<212>PRT<213>龟裂链霉菌<400>6Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Pro Asp Ser1 5 10 15Thr Ala Ser Pro Ser Thr Ala Ser Ala Pro Ala Thr Thr Pro Ser Ala20 25 30Ala Ala Ser Pro Asp Thr Thr Asp Arg Thr Thr Leu Pro Ser Tyr Val35 40 45Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu Pro Glu Leu Leu Glu50 55 60Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu Gln Ala Pro Leu Val65 70 75 80Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp Leu Val Thr Arg Phe85 90 95Asp Val Val Arg Glu Val Met Arg Asp Gln Arg Phe Val Asn Asn Pro100 105 110Thr Leu Val Pro Gly Ile Gly Ala Asp Lys Asp Pro Arg Ala Arg Leu115 120 125Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Ala Pro Tyr Leu Thr Asp130 135 140Asn Ile Leu Thr Ser Asp Pro Pro Asp His Thr Arg Leu Arg Arg Leu145 150 155 160Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln Asp Leu Arg Pro Arg165 170 175Val Glu Arg Ile Thr Asp Glu Leu Leu Glu Arg Leu Pro Asp His Ala180 185 190Glu Asp Gly Val Val Asp Leu Val Glu His Phe Ala Tyr Pro Leu Pro195 200 205Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp Glu Glu Asp Arg Ala210 215 220Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser Leu Asn Pro Lys Arg
225 230 235 240Ile Gly Ala Thr Met Pro Glu Met Ile Ser His Ile His Glu Leu Ile245 250 255Asp Glu Arg Arg Ala Ala Leu Arg Asp Asp Leu Leu Ser Gly Leu Ile260 265 270Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val275 280 285Thr Leu Val Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His290 295 300Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr His Pro Asp Gln Arg305 310 315 320Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu325 330 335Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr Gln Leu Arg Tyr Ala340 345 350Leu Glu Asp Thr Glu Val Ala Gly Val Gln Val Arg Gln Gly Glu Ala355 360 365Leu Met Phe Ser Leu Val Ala Ala Asn His Asp Pro Arg His Tyr Thr370 375 380Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu385 390 395 400Asp His Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ser405 410 415Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly Lys Leu Leu Thr Arg420 425 430Tyr Pro Asp Leu Ala Leu Ala Leu Thr Pro Glu Gln Leu Glu Asp Gln435 440 445Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu Arg Arg Leu Pro Leu450 455 460Arg Leu His Ala Gln Ser465 470<210>7<211>1293<212>DNA<213>利迪链霉菌(Streptomyces lydicus)<400>7atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg 60aacgtgatgg atccggcgct gatcggggat ccgttcgccg gttacggcgc gctgcgcgag120cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc180ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg240gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc300cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac360acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg420ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac480ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa540ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc600tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag660ctgatcgcgg cgcggcgccg ggcgctcacc gacgatctgc tcagcgagct gatccggacc720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc780gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc840acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg900
cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag960gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg 1020tcggcgaacc gcgacccgcg ccactacacc gaccccgacc ggctggacct gacccggcac 1080cctgccggcc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc 1140gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc 1200gagctgtcgc tggccgtcgc gccggaggcc ctggagcgca caccggtacc gggcagctgg 1260cggctgaacg cgctgccgct gcgtctgcgc tga1293<210>8<211>430<212>PRT<213>利迪链霉菌<400>8Met Ser Ala Ser Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala65 70 75 80Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp85 90 95Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser195 200 205Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala210 215 220Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Ash Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu
305 310 315 320Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro385 390 395 400Glu Leu Ser Leu Ala Val Ala Pro Glu Ala Leu Glu Arg Thr Pro Val405 410 415Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg420 425 430<210>9<211>1299<212>DNA<213>链霉菌属物种(Streptomyces sp.)<400>9atgtcagcct tatccagctc tccgttcgcc gagcacatag ggaaacaccc gggcgagccg 60aacgtgatgg aaccggctct gatcaacgat ccgttcggcg gctacggcgc gctgcgcgag120caggggccgg ttgtgcgtgg ccggttcatg gacgactcgc ccgtgtggtt cgtgacccgc180ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggcgtcgccg240ctcctgggca gtcaggtcga ggagatgccg atggtcaagc tgctggagca gatgggcctc300cccgagcacc ttcgggtcta tctgctcgga tcgatcctca acagtgacgc ccccgatcac360acccggcttc gccgcctcgt ctcgcgggcc ttcaccgcac gtaagatcac cggtctgcgg420ccgcgcgtcg agcagatcgc cgacgagctg ctggcccggc tccccgagca cgccgaggac480ggcgtcgtcg acctcatcca gcacttcgcc tacccgctgc cgatcacggt catctgcgaa540ctggtcggca tacccgaagc cgatcgcccg caatggcgcg catggggcgc cgacctcgtg600tcactggagc cggacaagct cagcacgtcg ttcccggcga tgatcgacca cacccatgaa660ctgatccgcc aacggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgtgcc720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt gttcgctctc780gtcttcgccg gtcacgagac caccgcccac ctcataggca acggcacggc ggcgctgctc840acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc gcgtgccgtc900catgagctga tgcgctggtg cgggccggtg cacatgaccc agttgcgtta cgcctccgag960gacatcgacc tcgccggtac gccgatccgg aagggcgacg ccgtccaact catcctggta 1020tcggcgaact tcgacccccg ccactacagc gaccccgatc gcctcgacct gacccgtcac 1080cccgcaggcc acgccgagaa ccacgtgggc ttcggccacg ggatgcacta ctgcttgggc 1140gccgcgctcg ccaggcagga aggcgaagtg gcgttcggca aactgctcgc gcactacccg 1200gacgtagcgc tgggcgtcga accggaagcc ctggagcggg tgccgatgcc cggcagttgg 1260cggctgaatt ccttgccgct gcggttggcg aagcgctaa 1299<210>10<211>432<212>PRT<213>链霉菌属物种<400>10Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Glu His Ile Gly Lys His
1 5 10 15Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Ile Asn Asp Pro Phe20 25 30Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro65 70 75 80Leu Leu Gly Ser Gln Val Glu Glu Met Pro Met Val Lys Leu Leu Glu85 90 95Gln Met Gly Leu Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Ser Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Gly Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Ala Trp Gly Ala Asp Leu Val Ser Leu Glu Pro Asp Lys Leu Ser195 200 205Thr Ser Phe Pro Ala Met Ile Asp His Thr His Glu Leu Ile Arg Gln210 215 220Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Ala225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Val Phe Ala Leu Val Phe Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ser Glu305 310 315 320Asp Ile Asp Leu Ala Gly Thr Pro Ile Arg Lys Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Ser Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val G1y Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ala Leu Ala370 375 380Arg Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro385 390 395 400Asp Val Ala Leu Gly Val Glu Pro Glu Ala Leu Glu Arg Val Pro Met405 410 415Pro Gly Ser Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Ala Lys Arg420 425 430
<210>11<211>1293<212>DNA<213>恰塔努加链霉菌(Streptomyces chattanoogenesis)<400>11atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg 60aacgtgatgg atccggcgct gatcggtgat ccgttcgccg gttacggcgc gctgcgcgag120cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc180ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg240gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc300cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac360acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg420ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac480ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa540ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc600tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag660ctgatcgcgg cgcggcgccg ggcgctcacc gacgacctgc tcagcgagct gatccggacc720catgacgacg acggcagcag gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc780gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc840acccaccccg accagctgcg gctgctcaag gacgacccgg cactgctgcc gcgcgcggtg900cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag960gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg 1020tcggcgaacc gcgacccgcg ccactacacc gaccccgacc gtctggacct gacccggcac 1080cccgccggtc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc 1140gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc 1200gagctgtcgc tggccgtcgc gccggacgcc ctggagcgca caccggtacc gggcagctgg 1260cggctgaacg cgctgccgct gcgtctgggc tga1293<210>12<211>430<212>PRT<213>恰塔努加链霉菌<400>12Met Ser Ala Set Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala65 70 75 80Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp85 90 95Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr
130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser195 200 205Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala210 215 220Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu305 310 315 320Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro385 390 395 400Glu Leu Ser Leu Ala Val Ala Pro Asp Ala Leu Glu Arg Thr Pro Val405 410 415Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Gly420 425 430<210>13<211>1290<212>DNA<213>链霉菌属物种<400>13atgaccgaat tagcggactc ccccttcagc gagcacgtcg gcaaacaccc cggcgagccg 60aacgtgatgg aaccggccct gctcaccgat ccgttcaccg gctacggcga actgcgcgaa120cagggcccgg tggtccgcgg ccggttcgcg gacgacaccc ccgtgtggtt catcacccgc180ttcgaggagg cccgcgaggt gctgcgcgac caccggttcg ccaatgcccc cgccttcgcg240gcgggaggtg gaagcggtga cacaccctcc aaccggctga tggaaatcat ggcctgccc 300gagcactacc gggtgtacct cgccaacacc atcctcacca tggacgcccc cgaccacacc360cggatccggc gattggtctc ccgggcattc accgcccgta agatcaccga tctgcgaccc420cgggtggagg acatcgcgga cgatctgctg aggcggctgc ccgagcacgc cgaggacggc480gtcgtcgacc tcatcaagca ctacgcctat ccgctgccca taacggtcat ctgcgaactg540
gtgggaattc cggaggaaga ccgactgcag tggcgggatt gggggtccgc gttcgtctcc600ctgcaaccgg atcggctcag caaagcgttc ccggcgatga tcgaacacat tcacgcgctg660atccgcgaac ggcgcgcggc gctcaccgac gatctgctca gcgaactgat ccgggtccat720gacgacgacg gcggccgact cagcgacgtc gaaatggtca cgatggtcct gaccctcgtt780ctcgccggtc atgagaccac cgcccatctc atcggcaacg gcactgccgc gcttctcacc840caccccgacc agctgcacct gctgaaatcc gatccggagc tgctcccacg cgccgtgcac900gagctgatgc gctggtgcgg accggtgcag atgacgcagt tgcggtacgc caccgaggac960gtcgaggtgg ccggggtgca ggtcaagcag ggcgaagcgg tgctggccat gctggtcgcg 1020gcgaaccacg acccccgcca cttcgccgac cccgcccggc tcgacctcac ccgccagccg 1080gcgggccggg ccgagaacca cgtcggtttc ggccacggca tgcactactg cctgggcgcc 1140agcctggccc gccaggaggg cgaggtcgcc ttcgggaacc tgctcgcgca ctacccggac 1200gtgtcgctgg cggtggaacc ggacgccctc cagcgggtcc cgctgccggg caactggcgg 1260ctggccgcac tgccggtccg gctgcgctga1290<210>14<211>429<212>PRT<213>链霉菌属物种<400>14Met Thr Glu Leu Ala Asp Ser Pro Phe Ser Glu His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe20 25 30Thr Gly Tyr Gly Glu Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Ala Asp Asp Thr Pro Val Trp Phe Ile Thr Arg Phe Glu Glu Ala50 55 60Arg Glu Val Leu Arg Asp His Arg Phe Ala Asn Ala Pro Ala Phe Ala65 70 75 80Ala Gly Gly Gly Ser Gly Asp Thr Pro Ser Asn Arg Leu Met Glu Ile85 90 95Met Gly Leu Pro Glu His Tyr Arg Val Tyr Leu Ala Asn Thr Ile Leu100 105 110Thr Met Asp Ala Pro Asp His Thr Arg Ile Arg Arg Leu Val Ser Arg115 120 125Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu Asp130 135 140Ile Ala Asp Asp Leu Leu Arg Arg Leu Pro Glu His Ala Glu Asp Gly145 150 155 160Val Val Asp Leu Ile Lys His Tyr Ala Tyr Pro Leu Pro Ile Thr Val165 170 175Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Leu Gln Trp Arg180 185 190Asp Trp Gly Ser Ala Phe Val Ser Leu Gln Pro Asp Arg Leu Ser Lys195 200 205Ala Phe Pro Ala Met Ile Glu His Ile His Ala Leu Ile Arg Glu Arg210 215 220Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Val His225 230 235 240Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met Val245 250 255Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile Gly
260 265 270Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu His Leu Leu275 280 285Lys Ser Asp Pro Glu Leu Leu Pro Arg Ala Val His Glu Leu Met Arg290 295 300Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Thr Glu Asp305 310 315 320Val Glu Val Ala Gly Val Gln Val Lys Gln Gly Glu Ala Val Leu Ala325 330 335Met Leu Val Ala Ala Asn His Asp Pro Arg His Phe Ala Asp Pro Ala340 345 350Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu Asn His Val355 360 365Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Ser Leu Ala Arg370 375 380Gln Glu Gly Glu Val Ala Phe Gly Asn Leu Leu Ala His Tyr Pro Asp385 390 395 400Val Ser Leu Ala Val Glu Pro Asp Ala Leu Gln Arg Val Pro Leu Pro405 410 415Gly Asn Trp Arg Leu Ala Ala Leu Pro Val Arg Leu Arg420 425<210>15<211>1428<212>DNA<213>生白链霉菌(Streptomyces albofaciens)<400>15atgaccacat cgcccaccga gtcccgggcg gccaccccgc ccgactccac cgcctccccc 60tcgaccgctg ccgccccggc caccacccct tcggccgccg cctctccgga caccacctct120cccgccacca ccgaccgcac cacgctcccc tcctacgtcg gcctccaccc gggcgagccg180aacctgatgg aaccggagct gctggacaac ccgtacaccg gctacggcac gctgcgcgag240caggcgccgc tcgtccgcgc ccggttcatc gacgactcgc ccatctggct ggtgacccgc300ttcgacgtgg tgcgcgaggt gatgcgcgac cagcggttcg tcaacaaccc gaccctggtg360cccggcatcg gtgcggacca ggacccgcgc gcccggctga tcgagctgtt cggcatcccc420gaggacctgg ccccgtacct caccgacacc atcctcacca gcgacccgcc ggaccacacc480cggctgcgcc gcctggtctc ccgtgccttc accgcacgcc gtatccagga cctgcggccg540cgcgtcgagc ggatcaccga cgagctgctg gcgcggctgc cggaccatgc cgaggacggc600gtcgtcgacc tcgtcgagca cttcgcctac ccgctgccca tcacggtcat ctgcgaactg660gtcggcatcg acgaggagga ccgggcgctg tggcggcggt tcggcgccga cctcgcctcg720ctgaacccca agcgcatcgg cgccaccatg ccggagatga tcgcgcacat ccacgaggtg780atcgacgagc ggcgtgcgga cctgcgggac gacctgctca gcgggctcat ccgggcgcag840gacgacgacg gcggccggct gagcgacgtc gagatggtca cgctggtgct gaccctggtg900ctggccggtc acgagaccac cgcccacctc atcagcaacg gcaccctcgc cctgctcacc960caccccgacc agcggcggct gatcgacgag gacccggcgc tgctgccgcg cgcggtccac 1020gagctgatgc gctggtgcgg gccgatccag gccacccagc tgcggtacgc catggaggac 1080accgaggtgg ccggtgtcca ggtccgccag ggcgaggccc tgatgttcag cctcgtcgcg 1140gccaaccacg acccgcgcca ctacaccggc ccggagcggc tcgacctgac gcggcagccg 1200gccggccgcg ccgaggacca cgtcggcttc gggcacggga tgcactactg cctgggtgcc 1260tcactggccc ggcaggaggc cgaggtggcg tacggcaagc tgctcacccg ctacccggac 1320ctggcgctcg cgctcacccc ggaacagctg gaggaccagg aacgcctgcg gcagcccggc 1380acctggcgcc tgcgacggct gccgctgagg ttgcacgcgg agagctga1428
<210>16<211>475<212>PRT<213>生白链霉菌<400>16Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Pro Asp Ser1 5 10 15Thr Ala Ser Pro Ser Thr Ala Ala Ala Pro Ala Thr Thr Pro Ser Ala20 25 30Ala Ala Ser Pro Asp Thr Thr Ser Pro Ala Thr Thr Asp Arg Thr Thr35 40 45Leu Pro Ser Tyr Val Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu50 55 60Pro Glu Leu Leu Asp Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu65 70 75 80Gln Ala Pro Leu Val Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp85 90 95Leu Val Thr Arg Phe Asp Val Val Arg Glu Val Met Arg Asp Gln Arg100 105 110Phe Val Asn Asn Pro Thr Leu Val Pro Gly Ile Gly Ala Asp Gln Asp115 120 125Pro Arg Ala Arg Leu Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Ala130 135 140Pro Tyr Leu Thr Asp Thr Ile Leu Thr Ser Asp Pro Pro Asp His Thr145 150 155 160Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln165 170 175Asp Leu Arg Pro Arg Val Glu Arg Ile Thr Asp Glu Leu Leu Ala Arg180 185 190Leu Pro Asp His Ala Glu Asp Gly Val Val Asp Leu Val Glu His Phe195 200 205Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp210 215 220Glu Glu Asp Arg Ala Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser225 230 235 240Leu Asn Pro Lys Arg Ile Gly Ala Thr Met Pro Glu Met Ile Ala His245 250 255Ile His Glu Val Ile Asp Glu Arg Arg Ala Asp Leu Arg Asp Asp Leu260 265 270Leu Ser Gly Leu Ile Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser275 280 285Asp Val Glu Met Val Thr Leu Val Leu Thr Leu Val Leu Ala Gly His290 295 300Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr305 310 315 320His Pro Asp Gln Arg Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro325 330 335Arg Ala Val His Glu Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr340 345 350Gln Leu Arg Tyr Ala Met Glu Asp Thr Glu Val Ala Gly Val Gln Val355 360 365Arg Gln Gly Glu Ala Leu Met Phe Ser Leu Val Ala Ala Asn His Asp
370 375 380Pro Arg His Tyr Thr Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro385 390 395 400Ala Gly Arg Ala Glu Asp His Val Gly Phe Gly His Gly Met His Tyr405 410 415Cys Leu Gly Ala Ser Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly420 425 430Lys Leu Leu Thr Arg Tyr Pro Asp Leu Ala Leu Ala Leu Thr Pro Glu435 440 445Gln Leu Glu Asp Gln Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu450 455 460Arg Arg Leu Pro Leu Arg Leu His Ala Glu Ser465 470 475<210>17<211>1293<212>DNA<213>普拉特链霉菌(Streptomyces platensis)<400>17atgtcggcat tacccacctc accgttcgct gcacacgtcg ggaaacaccc gggcgagccg 60aatgtgatgg acccggcact gatcaccgac ccgttcaccg gctacggcgc gctgcgcgag 120cagggcccgg tcgtccgcgg ccgcttcgtg gacgactcac ccgtctggct ggtgacgcga 180ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaaccc ggcggcgccc 240tccctgggcc acgcggccga ggacaacccg ctcaccaggc tgatggacat gctgggcctc 300cccgagcacc tccgccccta cctcctcgga tcgattctca attacgacgc ccccgaccac 360acccggctgc gccgcctggt gtcgcgggcc ttcaccgccc gcaagatcac cgacctgcgg 420ccgcgggtcg agcagatcgc cgacgccctg ctggcccggc tgcccgagca cgccgaggac 480ggcgtcgtcg atctcatccg gcacttcgcc tacccgctgc cgatcaccgt catctgcgaa 540ctggtcggca tacccgaagc ggaccgcccg cagtggcgga cgtggggcgc cgacctcgtc 600tcgatggagc cggaccggct caccgcctcg ttcccgccga tgatcgagca catccaccgg 660atggtccggg agcggcgcgg cgcgctcacc ggcgatctgc tcagcgagct gatccgtgcc 720catgacgacg acggcggccg gctcagcgac gtcgagatgg tcaccttgat cctcacgctc 780gtcctcgccg gtcacgagac caccgctcac ctcatcagca acggcacggc ggcgctgctc 840acccaccccg accaactgcg cctgctccag gacgacccgg ccctgctccc ccgtgccgtc 900cacgagctga tgcgctggtg cgggccggtg cagatgaccc agctgcgtta cgccgccgcc 960gacgtcgacc tggccggcac cacgatccac cggggcgacg ccgtccaact catcctggtg1020tcggcgaact tcgacccccg ccactacacc gaccccgacc gcctcgatct gacccgccac1080cccgcgggac atgcggagaa ccatgtgggt ttcggccatg gggcgcacta ctgcctgggc1140gccacactcg ccaagcagga gggcgaagtc gccttcggca aactgctcgc gcactacccg1200gagatggcgt tgggcgtcgc accggagcgc ctggagcgga cgcccctgcc gggcaactgg1260cggctgaacg cgctgccggt gcggttgggg tga 1293<210>18<211>430<212>PRT<213>普拉特链霉菌<400>18Met Ser Ala Leu Pro Thr Ser Pro Phe Ala Ala His Val Gly Lys His1 5 10 15
Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe20 25 30Thr Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Val Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro65 70 75 80Ser Leu Gly His Ala Ala Glu Asp Asn Pro Leu Thr Arg Leu Met Asp85 90 95Met Leu Gly Leu Pro Glu His Leu Arg Pro Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Arg His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Val Ser Met Glu Pro Asp Arg Leu Thr195 200 205Ala Ser Phe Pro Pro Met Ile Glu His Ile His Arg Met Val Arg Glu210 215 220Arg Arg Gly Ala Leu Thr Gly Asp Leu Leu Ser Glu Leu Ile Arg Ala225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Leu245 250 255Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Gln Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala305 310 315 320Asp Val Asp Leu Ala Gly Thr Thr Ile His Arg Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro385 390 395 400Glu Met Ala Leu Gly Val Ala Pro Glu Arg Leu Glu Arg Thr Pro Leu405 410415Pro Gly Asn Trp Arg Leu Asn Ala Leu Pro Val Arg Leu Gly420 425 430
<210>19<211>1293<212>DNA<213>春日链霉菌(Streptomyces kasugaensis)<400>19atgtcggcat cacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgagccg60aacgtgatgg atccggcgct gatcggggat ccgttcgccg gttacggcgc gctgcgcgag 120cagggcccgg tcgtgcgggg gcggttcatg gacgactccc ccgtgtggtt cgtgacccgc 180ttcgaggagg tccgcgaggt cctgcgtgac ccgcggttcc ggaacaatcc ggtctccgcg 240gcgccgggcg cggcccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc 300cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac 360acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg 420ccgcgcgtca cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac 480ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa 540ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc 600tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag 660ctgatcgcgg cgcggcgccg ggcgctcacc gacgatctgc tcagcgagct gatccggacc 720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc 780gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc 840acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg 900cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag 960gacgtcgagc tggcgggcgt ccggatccgc acgggggacg ccgtccagct catcctggtg 1020tcggcgaacc gcgacccgcg ccactacacc gaccccgacc ggctggacct gacccggcac 1080cctgccggcc acgcggagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc 1140gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc 1200gagctgtcgc tggccgtcgc gccggaggcc ctggagcgca caccggtacc gggcagctgg 1260cggctgaacg cgctgccgct gcgtctgcgc tga 1293<210>20<211>430<212>PRT<213>春日链霉菌<400>20Met Ser Ala Ser Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Glu Val Leu Arg Asp Pro Arg Phe Arg Asn Asn Pro Val Ser Ala65 70 75 80Ala Pro Gly Ala Ala Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp85 90 95Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Thr130 135 140
Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser195 200 205Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala210 215 220Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245250 255Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu305 310 315 320Asp Val Glu Leu Ala Gly Val Arg Ile Arg Thr Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro385 390 395 400Glu Leu Ser Leu Ala Val Ala Pro Glu Ala Leu Glu Arg Thr Pro Val405 410 415Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg420 425 430<210>21<211>1428<212>DNA<213>龟裂链霉菌<400>21atgaccacat cgcccaccga gtcccgggcg gccaccccga ccggctccac cgcctccccc 60tcgaccgctt ccgccccggc caccacccct tcggccgcca cctcttcgga caccacctat120cccgccacca ccgaccgcac cacgctcccc tcctacgtcg gcctccaccc gggcgagccg180aacctgatgg aaccggagct gctggacaac ccgtacaccg gctacggcac gctgcgcgag240caggccccgc tcgtccgtgc ccggttcatc gacgactcgc ccatctggct ggtgacccgc300ttcgacgtgg tgcgcgaggt gatgcgcgac cagcggttcg tcaacaaccc gaccctggtg360cccggcatcg gtgcggacaa ggacccgcgc gcccggctga tcgagctgtt cggcatcccc420gaggacctga ccccgtacct cgccgacacc atcctcacca gcgacccgcc ggaccacacc480cggctgcgcc gcctggtctc ccgtgccttc accgcgcgcc gcatccagga cctgcggccg540cgcgtcgagc agatcaccga cgcgctgctg gagcgactgc cggaccatgc cgaggacggc600
gtcgtcgacc tcgtcgagca cttcgcctac ccgctgccca tcacggtcat ctgcgagctg660gtcggcatcg acgaggagga ccggacgctg tggcggcggt tcggcgccga cctcgcctca720ctgaacccca agcgcatcgg cgccaccatg ccggagatga tcgcgcacat ccacgaggtg780atcgacgagc ggcgcgcggc cctgcgggac gacctgctca gcgggctcat ccgggcgcag840gacgacgacg gcggccggct gagcgacgtc gagatggtca ccctggtcct gaccctggtg900ctggccggtc acgagaccac cgcccacctc atcagcaacg gcaccctcgc cctgctcacc960caccccgacc agcggcggct gatcgacgag gacccggcac tgctgccgcg cgcggtccac 1020gagctgatgc gctggtgcgg gccgatccag gccacccagc tgcggtacgc catggaggac 1080accgaggtcg ccggtgtcca ggtccgccag ggcgaggccc tgatgttcag cctcgtcgcg 1140gccaaccacg acccgcgcca ctacaccggg ccggagcggc tcgacctgac gcggcagccg 1200gccggccgcg ccgaggacca cgtcggcttc gggcacggga tgcactactg cctgggtgcc 1260tcactcgccc ggcaggaggc cgaggtggcc tacgggaagc tgctcacccg ctacccggac 1320ctggagctcg ctctcacacc ggaacagctg gaggaccagg aacgcctgcg gcagcccggc 1380acctggcgcc tgcggcggct gccgctgaag ctgcacgcgc ggagctga1428<210>22<211>475<212>PRT<213>龟裂链霉菌<400>22Met Thr Thr Ser Pro Thr Glu Ser Arg Ala Ala Thr Pro Thr Gly Ser1 5 10 15Thr Ala Ser Pro Ser Thr Ala Ser Ala Pro Ala Thr Thr Pro Ser Ala20 25 30Ala Thr Ser Ser Asp Thr Thr Tyr Pro Ala Thr Thr Asp Arg Thr Thr35 40 45Leu Pro Ser Tyr Val Gly Leu His Pro Gly Glu Pro Asn Leu Met Glu50 55 60Pro Glu Leu Leu Asp Asn Pro Tyr Thr Gly Tyr Gly Thr Leu Arg Glu65 70 75 80Gln Ala Pro Leu Val Arg Ala Arg Phe Ile Asp Asp Ser Pro Ile Trp85 90 95Leu Val Thr Arg Phe Asp Val Val Arg Glu Val Met Arg Asp Gln Arg100 105 110Phe Val Asn Asn Pro Thr Leu Val Pro Gly Ile Gly Ala Asp Lys Asp115 120 125Pro Arg Ala Arg Leu Ile Glu Leu Phe Gly Ile Pro Glu Asp Leu Thr130 135 140Pro Tyr Leu Ala Asp Thr Ile Leu Thr Ser Asp Pro Pro Asp His Thr145 150 155 160Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr Ala Arg Arg Ile Gln165 170 175Asp Leu Arg Pro Arg Val Glu Gln Ile Thr Asp Ala Leu Leu Glu Arg180 185 190Leu Pro Asp His Ala Glu Asp Gly Val Val Asp Leu Val Glu His Phe195 200 205Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu Leu Val Gly Ile Asp210 215 220Glu Glu Asp Arg Thr Leu Trp Arg Arg Phe Gly Ala Asp Leu Ala Ser225 230 235 240Leu Asn Pro Lys Arg Ile Gly Ala Thr Met Pro Glu Met Ile Ala His245 250 255
Ile His Glu Val Ile Asp Glu Arg Arg Ala Ala Leu Arg Asp Asp Leu260 265 270Leu Ser Gly Leu Ile Arg Ala Gln Asp Asp Asp Gly Gly Arg Leu Ser275 280 285Asp Val Glu Met Val Thr Leu Val Leu Thr Leu Val Leu Ala Gly His290 295 300Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr Leu Ala Leu Leu Thr305 310 315 320His Pro Asp Gln Arg Arg Leu Ile Asp Glu Asp Pro Ala Leu Leu Pro325 330 335Arg Ala Val His Glu Leu Met Arg Trp Cys Gly Pro Ile Gln Ala Thr340 345 350Gln Leu Arg Tyr Ala Met Glu Asp Thr Glu Val Ala Gly Val Gln Val355 360 365Arg Gln Gly Glu Ala Leu Met Phe Ser Leu Val Ala Ala Asn His Asp370 375 380Pro Arg His Tyr Thr Gly Pro Glu Arg Leu Asp Leu Thr Arg Gln Pro385 390 395 400Ala Gly Arg Ala Glu Asp His Val Gly Phe Gly His Gly Met His Tyr405 410 415Cys Leu Gly Ala Ser Leu Ala Arg Gln Glu Ala Glu Val Ala Tyr Gly420 425 430Lys Leu Leu Thr Arg Tyr Pro Asp Leu Glu Leu Ala Leu Thr Pro Glu435 440 445Gln Leu Glu Asp Gln Glu Arg Leu Arg Gln Pro Gly Thr Trp Arg Leu450 455 460Arg Arg Leu Pro Leu Lys Leu His Ala Arg Ser465 470 475<210>23<211>1293<212>DNA<213>杀结核链霉菌<400>23atgtcggcat tatccaactc cccgctcgcc gcacatgtcg ggaaacaccc tggcgagccg 60aatgtgatgg acccggcgct gatcaccgac ccgttcggcg gctacggcgc actgcgcgag120caaggcccgg tcgtacgggg ccggttcatg gacgactcgc ccgtctggct ggtgacgcgc180ttcgaagagg tccgccaagt cctgcgcgat cagcggttcg tgaacaaccc ggccgcaccg240tccctgggac gctcgatcga cgaaagcccc gcggtcagac ttttggaaat gttggggttg300cccgaccatt tccggccgta tctgctcggg tcgatcctca actacgacgc acccgaccac360acccggctcc gccgactggt ctcgcgcgcc ttcacggcac gcaagatcac cgacctgcgg420ccgcgggtcg agcagatcac cgacgacctg ctgacccggc ttcccgagca cgccgaggac480ggtgtggtcg acctcatcca gcacttcgcc taccccctgc cgatcaccgt gatctgcgaa540ctggtcggca tcgccgaagc ggaccgcccg caatggcgga agtggggagc cgatctcgtc600tcgctggagc cggggcggct gagcaccgcg ttcccggcga tggtcgagca catccatgag660ctgatccgcg agcggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgcacc720catgacgacg acggcggccg gctcagcgac atcgagatgg tcaccatgat cctcacgatc780gtcctggccg gccacgagac caccgcccac ctcataggca acggcacggc ggcgctgctc840acccaccccg accagctgcg cctactcaag gacgatccgg cgctgctgcc gcgcgccgtc900cacgagctga tgcgctggtg cgggccggtg cacatgaccc agctgcggtt cgcgtccgag960gacgtcgagg tcgccgggac accgatccac aagggcgacg ccgtacaact catcctggta 1020
tcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgacct gacccgccac 1080cccgccggcc acgccgagaa ccatgtgggc ttcggccacg gaatgcacta ctgcctgggt 1140gccaccctcg ccaaacagga aggcgaagtc gccttctccc gcctcttcac gcactacccg 1200gaactgtccc tgggcgtcgc ggcggaccag ctggcgcgga cacaggtacc cggcagctgg 1260cggctggaca ccctgccgct gcgactgggg tga1293<210>24<211>430<212>PRT<213>杀结核链霉菌<400>24Met Ser Ala Leu Ser Asn Ser Pro Leu Ala Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe20 25 30Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro65 70 75 80Ser Leu Gly Arg Ser Ile Asp Glu Ser Pro Ala Val Arg Leu Leu Glu85 90 95Met Leu Gly Leu Pro Asp His Phe Arg Pro Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Thr Asp Asp Leu Leu Thr Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Ala Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Glu Pro Gly Arg Leu Ser195 200 205Thr Ala Phe Pro Ala Met Val Glu His Ile His Glu Leu Ile Arg Glu210 215 220Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Ile Glu Met Val Thr Met245 250 255Ile Leu Thr Ile Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Phe Ala Ser Glu305 310 315 320Asp Val Glu Val Ala Gly Thr Pro Ile His Lys Gly Asp Ala Val Gln
325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Ser Arg Leu Phe Thr His Tyr Pro385 390 395 400Glu Leu Ser Leu Gly Val Ala Ala Asp Gln Leu Ala Arg Thr Gln Val405 410 415Pro Gly Ser Trp Arg Leu Asp Thr Leu Pro Leu Arg Leu Gly420 425 430<210>25<211>1293<212>DNA<213>普拉特链霉菌<400>25atgtcggcat tatccagctc accgttcgcc gcgcatgtcg ggaaacaccc gggcgagccg 60aatgtgatgg acccggcgct gatcgccgat ccgttcggtg gttatggcgc actgcgtgag120caagggccgg tcgtacgggg ccggttcatg gacgactcac ccgtctggct cgtgacgcgc180ttcgaggaag tccgccaagt cctgcgcgac cagcggttcc tgaacgatcc gacggccccc240tccctggggc gctcattcga cgacagcccc acggccaggc tgctggagat gatgggactg300cccgagcatt tccggccgta tctgctcggt tcgattctga acaacgacgc ccccgaccac360acccggctgc gccgtctggt gtcgcgcgcc ttcacggcac gcaagatcac cgacctgcgg420ccgcgggtcg agcagatcgc cgacgagctg ctgacccggc ttcccgagta cgccgaggac480ggcgtggtcg acctcatcaa gcacttcgcc taccccctgc cgatcgccgt catctgcgaa540ctggtcggca tagccgaagc ggatcgtccg cagtggcgga agtggggtgc cgacctcgtc600tcgctgcagc cggaccggct cagcacctcg ttcccggcga tgatcgagca catccatgag660ctgatccgcg agcggcgcgg ggcgctcacg gacgatctgc tcagcgagct gatccgtgcc720catgacgacg acggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacggtg780gtgctcgccg gccacgagac caccgcgcac ctcataggca acggcacggc ggcgctgctc840acccaccccg accagctgcg gctgctcagg gacgacccgg ctctgtttcc ccgtgccgtc900cacgagctgt tgcgctggtg cgggccggtc cacatgaccc agatgcggtt tgcgtccgag960gatgtcgaca tcgccgggac gaagatccgt aagggcgacg ccgtacaact gatcctggta 1020tcggccaact tcgacccccg ccactacacc gaccccgaac gtctcgacct gacccgtcac 1080cccgccggcc acgccgagaa ccatgtgggc ttcggccacg ggatgcacta ctgcctgggc 1140gccaccctcg ccaaacagga gggcgaagtc gcgttcgaga agctcttcgc gcactacccg 1200gaggtgtcgc tgggcgtcgc accggaacaa ctggaaagga caccactgcc cggcagctgg 1260cggctcgatt ccctgccgct gcggttgcgg taa1293<210>26<211>430<212>PRT<213>普拉特链霉菌<400>26Met Ser Ala Leu Ser Ser Ser Pro Phe Ala A1a His Val G1y Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Ala Asp Pro Phe
20 25 30Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Leu Asn Asp Pro Thr Ala Pro65 70 75 80Ser Leu Gly Arg Ser Phe Asp Asp Ser Pro Thr Ala Arg Leu Leu Glu85 90 95Met Met Gly Leu Pro Glu His Phe Arg Pro Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Glu Leu Leu Thr Arg Leu Pro Glu Tyr Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Lys His Phe Ala Tyr Pro Leu Pro Ile Ala165 170 175Val Ile Cys Glu Leu Val Gly Ile Ala Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Leu Ser195 200 205Thr Ser Phe Pro Ala Met Ile Glu His Ile His Glu Leu Ile Arg Glu210 215 220Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Ala225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Ile Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Arg Asp Asp Pro Ala Leu Phe Pro Arg Ala Val His Glu Leu Leu290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Met Arg Phe Ala Ser Glu305 310 315 320Asp Val Asp Ile Ala Gly Thr Lys Ile Arg Lys Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Glu Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Glu Lys Leu Phe Ala His Tyr Pro385 390 395 400Glu Val Ser Leu Gly Val Ala Pro Glu Gln Leu Glu Arg Thr Pro Leu405 410 415Pro Gly Ser Trp Arg Leu Asp Ser Leu Pro Leu Arg Leu Arg420 425 430<210>27
<211>1293<212>DNA<213>普拉特链霉菌<400>27atgtcggcat tatccagctc tccgttcgct gcgcatgtcg ggaaacaccc gggtgagccg 60aatgtgatgg agccggcgct gctcaccgac ccgttcgcgg gctacggcgc gctgcgtgag120caggccccgg tcgtacgggg ccggttcgtg gacgactcac cggtctggtt cgtgacgcgc180ttcgaggagg tccgccaagt cctgcgcgac cagcggttcg tgaacaatcc ggccgcgccg240cccctggccc catcggccga ggagaacccg ctgaccaggc tgatggacat gctgggcctc300cccgagcacc tccgcgtcta catgctcggg tcgattctca actacgacgc ccccgaccac360acccggctgc gccgtctggt gtcgcgcgcg ttcacggcgc ggaagatcac cgatctgcga420ccgcgtgtcg agcagatcgc cgacgagctg ctggcccgcc tccccgagta cgccgaggac480ggcgtcgtcg acctcatcca gcatttcgcc tacccgctgc cgatcaccgt catctgcgag540ctggtcggca tacccgaagc ggaccgcccg cagtggcgga agtggggcgc cgacctcatc600tcgatggacc cggaccggct cggcgcaacg ttcccggcga tgatcgagca catccatgag660atggtccggg agcggcgcgc ggcgctcacc gatgatctgc tcagcgagct gatccgtacc720catgacgacg atggcggccg gctcagcgac gtcgagatgg tcaccatgat cctcacgctc780gtcctcgccg gtcacgagac caccgcccac ctcatcagca acggcacggc ggcgctgctc840acccaccccg accagctgcg cctgctcaag gacgacccgg ccctgctccc ccgggccgtc900catgagctga tgcgctggtg cgggccggtg cagatgacgc agctgcgcta cgcggccgcc960gacgtcgacc tcgccggtac gcggatccac aagggcgacg ccgtacaact cctcctggtt 1020gcggcgaact tcgacccccg ccactacacc gaccccgacc gtctcgatct gacgcgtcac 1080cccgccggcc acgccgagaa ccatgtgggt ttcggccacg gtgcgcatta ctgcctgggt 1140gccaccctcg ccaagcagga gggcgaagtc gcgttcggca agctgctcgc gcactacccg 1200gagatgtccc tgggcatcga accggaacgt ctggagcgat tgccgctgcc tggcaactgg 1260cggctgaatt ccctgccgtt gcggctgggg tga1293<210>28<211>430<212>PRT<213>普拉特链霉菌<400>28Met Ser Ala Leu Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Glu Pro Ala Leu Leu Thr Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Ala Pro Val Val Arg Gly Arg35 40 45Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ala Pro65 70 75 80Pro Leu Ala Pro Ser Ala Glu Glu Asn Pro Leu Thr Arg Leu Met Asp85 90 95Met Leu Gly Leu Pro Glu His Leu Arg Val Tyr Met Leu Gly Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu Tyr Ala Glu Asp
145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Lys Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly195 200 205Ala Thr Phe Pro Ala Met Ile Glu His Ile His Glu Met Val Arg Glu210 215 220Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Ile Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Ser Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ala Ala305 310 315 320Asp Val Asp Leu Ala Gly Thr Arg Ile His Lys Gly Asp Ala Val Gln325 330 335Leu Leu Leu Val Ala Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Leu Ala His Tyr Pro385 390 395 400Glu Met Ser Leu Gly Ile Glu Pro Glu Arg Leu Glu Arg Leu Pro Leu405 410 415Pro Gly Asn Trp Arg Leu Asn Ser Leu Pro Leu Arg Leu Gly420 425 430<210>29<211>1293<212>DNA<213>利迪链霉菌<400>29atgtcggcat tacccagcaa cacgttcacc gagcacgtcg gcaagcaccc gggcgaaccg 60aacgtgatgg atccggcgct gatcggtgat ccgttcgccg gttacggcgc gctgcgcgag120cagggcccgg tcgtgcgggg gcggttcgtg gacgactccc ccgtgtggtt cgtgacccgc180ttcgaggagg tccgcgaggt cctgcgggac cagcggttcc ggaacaatcc ggtctcctcg240gcgccggacg cggaccccga ggacaccccg ctgtcccggc tgatggacat gatgggtttc300cccgagcacc tgcgcgtcta tctgctcggc tcgatcctca acaacgacgc ccccgaccac360acccggctgc gccgcctggt ctcccgggcc ttcaccgcgc ggaagatcac cgatctgcgg420ccgcgcgtcg cacagatagc cgacgagctg ctggcccggc tgccggagca cgccgaggac480ggcgtcgtcg acctgatcca gcacttcgcc tatcccctgc cgatcaccgt catctgcgaa540ctggtcggca tccccgagga ggaccgcccg cagtggcgca cctggggcgc cgacctggtc600tcgctgcagc cggaccggat gagccggtcc ttcccggcga tgatcgacca catccacgag660
ctgatcgcgg cgcggcgccg ggcgctcacc gacgacctgc tcagcgagct gatccgaacc720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc780gtcctggccg gccacgagac caccgcgcac ctcatcggca acggcacggc ggccctgctc840acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgcggtg900cacgagttga tgcgctggtg cggcccggtg cacatgaccc agctgcgcta cgccgccgag960gacgtcgagc tggcgggcgt ccggatccgc aagggggacg ccgtccagct catcctggtg 1020tcggcgaacc gcgatccgcg ccactacacc gaacccgacc gtctggacct gacccggcac 1080cccgccggcc acgccgagaa ccatgtgggg ttcggccacg gggcgcacta ctgtctgggc 1140gccacgctcg ccaagcagga gggcgaggtc gccctcggcg ccctgctcag gcacttcccc 1200gagctgtcgc tggccgtcgc gccggacgcc ctggagcgca caccggtacc gggcagctgg 1260cggctgaatg cgctgccgct gcgtctgcgc tga1293<210>30<211>430<212>PRT<213>利迪链霉菌<400>30Met Ser Ala Leu Pro Ser Asn Thr Phe Thr Glu His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Gly Asp Pro Phe20 25 30Ala Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Val Asp Asp Ser Pro Val Trp Phe Val Thr Arg Phe Glu Glu Val50 55 60Arg Glu Val Leu Arg Asp Gln Arg Phe Arg Asn Asn Pro Val Ser Ser65 70 75 80Ala Pro Asp Ala Asp Pro Glu Asp Thr Pro Leu Ser Arg Leu Met Asp85 90 95Met Met Gly Phe Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Ala130 135 140Gln Ile Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Glu Asp Arg Pro Gln Trp180 185 190Arg Thr Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Asp Arg Met Ser195 200 205Arg Ser Phe Pro Ala Met Ile Asp His Ile His Glu Leu Ile Ala Ala210 215 220Arg Arg Arg Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu
275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Met Thr Gln Leu Arg Tyr Ala Ala Glu305 310 315 320Asp Val Glu Leu Ala Gly Val Arg Ile Arg Lys Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Arg Asp Pro Arg His Tyr Thr Glu Pro340 345 350Asp Arg Leu Asp Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Leu Arg His Phe Pro385 390 395 400Glu Leu Ser Leu Ala Val Ala Pro Asp Ala Leu Glu Arg Thr Pro Val405 410 415Pro Gly Ser Trp Arg Leu Asn Ala Leu Pro Leu Arg Leu Arg420 425 430<210>31<211>1293<212>DNA<213>利迪链霉菌<400>31atgtcggcat cgaccagctc tcccctcagc gcccacgtcg gcaagcaccc gggcgaaccc 60catgtgatgg atccggcgct gatcagcgat ccgttcggcg gctacggtgc cctgcgcgag120cagggaccgg tcgtccgcgg acggttcttc gacgactcgc ccttgtggtt agtgacccgc180ttcgaggaag tccgccaggt cctgcgcgac cagcggttcg tgaacaaccc cgccgacccg240gcgctcggcg tcgcgccgga ggactccccg cagctgcgcg cgctggcgat gctgggcatc300cccgagcacc tgcacggcta tctgctcaac tcgatcctca actacgacgc ccccgaccac360acccggctgc gccgcctggt ctcccgcgcc ttcaccgccc gcaagatcac cgatcttcgg420ccgcgggtgg cgcagataac cgccgagctg ctggaccgac tcccggagca cgccgaggac480ggcgtggtcg acctgatcga gcacttcgcc tacccgctgc cgatcacggt gatctgcgaa540cttgtcggca tcgccgcgga ggaccggccc cagtggcgtt cctggggcgc cgacctggtc600tcggtggacc ccgaccggct cggccggacc ttcccggcga tgatcgacca catccacgcg660ctgatcggcc agcggcgggc cgcgctcacc gacgacctgc tcagcgagct gatccggacc720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccctggt cctcaccctc780gtgctggccg gccacgagac caccgcacac ctcatcggca acggcaccgc ggccctgctc840acccaccccg accagctgcg gctgctcaag gacgacccgg cgctgctgcc gcgcgccgtc900cacgagctga tgcgctggtg cgggccggtg cacgtcaccc agctgcggta cgccgccgag960gacgtcgacc tcgccggcac ccggatccgc aggggcgacg ccgtgcaggc cgtcctggtc 1020tcggcgaacc acgacccgcg ccactacacc gaccccgaac gcctggacct gacccggcag 1080cccgcgggcc gcgccgagaa ccacgtgggc ttcgggcacg gggcgcacta ctgcctgggc 1140gccagcctcg ccaggcagga gggtgaggtc gccctgggcg ccctgttcga ccgctacccc 1200gacctggcgc tggcggtggc gcccgaggag ctggagcgca ccccggtgcc cggtacctgg 1260cggctgacgt cgctgccggt gcgcctgggc tga1293<210>32<211>430<212>PRT<213>利迪链霉菌
<400>32Met Ser Ala Ser Thr Ser Ser Pro Leu Ser Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro His Val Met Asp Pro Ala Leu Ile Ser Asp Pro Phe20 25 30Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg35 40 45Phe Phe Asp Asp Ser Pro Leu Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Asp Pro65 70 75 80Ala Leu Gly Val Ala Pro Glu Asp Ser Pro Gln Leu Arg Ala Leu Ala85 90 95Met Leu Gly Ile Pro Glu His Leu His Gly Tyr Leu Leu Asn Ser Ile100 105 110Leu Asn Tyr Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Ala130 135 140Gln Ile Thr Ala Glu Leu Leu Asp Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Glu His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Ala Ala Glu Asp Arg Pro Gln Trp180 185 190Arg Ser Trp Gly Ala Asp Leu Val Ser Val Asp Pro Asp Arg Leu Gly195 200 205Arg Thr Phe Pro Ala Met Ile Asp His Ile His Ala Leu Ile Gly Gln210 215 220Arg Arg Ala Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Leu245 250 255Val Leu Thr Leu Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Leu Lys Asp Asp Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met290 295 300Arg Trp Cys Gly Pro Val His Val Thr Gln Leu Arg Tyr Ala Ala Glu305 310 315 320Asp Val Asp Leu Ala Gly Thr Arg Ile Arg Arg Gly Asp Ala Val Gln325 330 335Ala Val Leu Val Ser Ala Asn His Asp Pro Arg His Tyr Thr Asp Pro340 345 350Glu Arg Leu Asp Leu Thr Arg Gln Pro Ala Gly Arg Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Ala His Tyr Cys Leu Gly Ala Ser Leu Ala370 375 380Arg Gln Glu Gly Glu Val Ala Leu Gly Ala Leu Phe Asp Arg Tyr Pro385 390 395 400Asp Leu Ala Leu Ala Val Ala Pro Glu Glu Leu Glu Arg Thr Pro Val405 410 415
Pro Gly Thr Trp Arg Leu Thr Ser Leu Pro Val Arg Leu Gly420 425 430<210>33<211>1281<212>DNA<213>杀结核链霉菌<400>33atgaactctc cgttcgccgc gcacgtcggg aaacacccgg gcgagccgaa tgtgatggac 60cccgccctga tcaccgaccc gttcaccggc tacggcgcgc tgcgtgagca gggcccggtc120gtacggggcc ggttcatgga cgactcgccc gtctggctgg tgacgcggtt cgaggaggtc180cgccaggtcc tgcgcgacca gcggttcgtg aacaatccgg cctcgccgtc cctgaactac240gcgcccgagg acaacccgct gacccggctg atggagatgc tgggcctccc cgagcacctc300cgcgtctacc tgctcggatc gatcctcaac tacgacgccc ccgaccacac ccggctgcgc360cgtctggtgt cgcgggcgtt cacggcccgc aagatcaccg acctgcggcc ccgggtcgag420cagatcgccg acgcgctgct ggcccggctg cccgagcacg ccgaggacgg cgtcgtcgac480ctcatccagc acttcgccta ccccctgccg atcaccgtca tctgcgaact ggtcggcata540cccgaagcgg accgcccgca gtggcgaacg tggggcgccg acctcatctc gatggatccg600gaccggctcg gcgcctcgtt cccggcgatg atcgagcaca tccatcagat ggtccgggaa660cggcgcgagg cgctcaccga cgacctgctc agcgaactga tccgcaccca tgacgacgac720ggcgggcggc tcagcgacgt cgagatggtc accatgatcc tcacgctcgt cctcgccggc780cacgagacca ccgcccacct catcagcaac ggcacggcgg cgctgctcac ccaccccgac840cagctgcgtc tggtcaagga cgatccggcc ctcctccccc gtgccgtcca cgagctgatg900cgctggtgcg ggccggtgca catgacccag ctgcgctacg ccaccgccga cgtcgacctc960gccggcacac cgatccgcca gggcgatgcc gttcaactca tcctggtatc ggccaacttc 1020gacccccgtc actacaccga ccccgaccgc ctcgatctca cccggcaccc cgcgggccac 1080gccgagaacc atgtgggttt cggccatgga gcgcactact gcctgggcgc cacactcgcc 1140aaacaggaag gtgaagtcgc cttcggcaaa ctgctcacgc actacccgga catatcgctg 1200ggcatcgccc cggaacacct ggagcggaca ccgctgccgg gcaactggcg gctgaactcg 1260ctgccggtgc ggttggggtg a 1281<210>34<211>426<212>PRT<213>杀结核链霉菌<400>34Met Asn Ser Pro Phe Ala Ala His Val Gly Lys His Pro Gly Glu Pro1 5 10 15Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe Thr Gly Tyr Gly20 25 30Ala Leu Arg Glu Gln Gly Pro Val Val Arg Gly Arg Phe Met Asp Asp35 40 45Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val Arg Gln Val Leu50 55 60Arg Asp Gln Arg Phe Val Asn Asn Pro Ala Ser Pro Ser Leu Asn Tyr65 70 75 80Ala Pro Glu Asp Asn Pro Leu Thr Arg Leu Met Glu Met Leu Gly Leu85 90 95Pro Glu His Leu Arg Val Tyr Leu Leu Gly Ser Ile Leu Asn Tyr Asp
100 105 110Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser Arg Ala Phe Thr115 120 125Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu Gln Ile Ala Asp130 135 140Ala Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp Gly Val Val Asp145 150 155 160Leu Ile Gln His Phe Ala Tyr Pro Leu Pro Ile Thr Val Ile Cys Glu165 170 175Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp Arg Thr Trp Gly180 185 190Ala Asp Leu Ile Ser Met Asp Pro Asp Arg Leu Gly Ala Ser Phe Pro195 200 205Ala Met Ile Glu His Ile His Gln Met Val Arg Glu Arg Arg Glu Ala210 215 220Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr His Asp Asp Asp225 230 235 240Gly Gly Arg Leu Ser Asp Val Glu Met Val Thr Met Ile Leu Thr Leu245 250 255Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile Ser Asn Gly Thr260 265 270Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu Val Lys Asp Asp275 280 285Pro Ala Leu Leu Pro Arg Ala Val His Glu Leu Met Arg Trp Cys Gly290 295 300Pro Val His Met Thr Gln Leu Arg Tyr Ala Thr Ala Asp Val Asp Leu305 310 315 320Ala Gly Thr Pro Ile Arg Gln Gly Asp Ala Val Gln Leu Ile Leu Val325 330 335Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Asp Pro Asp Arg Leu Asp340 345 350Leu Thr Arg His Pro Ala Gly His Ala Glu Asn His Val Gly Phe Gly355 360 365His Gly Ala His Tyr Cys Leu Gly Ala Thr Leu Ala Lys Gln Glu Gly370 375 380Glu Val Ala Phe Gly Lys Leu Leu Thr His Tyr Pro Asp Ile Ser Leu385 390 395 400Gly Ile Ala Pro Glu His Leu Glu Arg Thr Pro Leu Pro Gly Asn Trp405 410 415Arg Leu Asn Ser Leu Pro Val Arg Leu Gly420 425<210>35<211>195<212>DNA<213>杀结核链霉菌<400>35atgcggatca cgatcgacac cgacatctgt atcggcgccg gccagtgcgc cctgaccgcg 60ccgggagtgt tcacccagga cgacgacggc ttcagcgccc tgctgcccgg ccgcgaggac 120ggtgcgggcg acccgctggt gcgggaggcc gcccgcgcct gcccggtgca ggccatcacg 180gtcacggacg actga 195
<210>36<211>64<212>PRT<213>杀结核链霉菌<400>36Met Arg Ile Thr Ile Asp Thr Asp Ile Cys Ile Gly Ala Gly Gln Cys1 5 10 15Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser20 25 30Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Leu Val Arg35 40 45Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile Thr Val Thr Asp Asp50 55 60<210>37<211>195<212>DNA<213>杀结核链霉菌<400>37atgcggatca ccatcgacac cgacatctgc atcggcgccg gccagtgcgc cctgaccgcg60ccgggagtct tcacccagga cgacgacggt ttcagcgccc tgctgcccgg ccgcgaggac120ggcgcgggcg acccgctggt gcgcgaggcc gcccgcgcct gccccgtgca ggccatttcg180gtcacggacg actga 195<210>38<211>64<212>PRT<213>杀结核链霉菌<400>38Met Arg Ile Thr Ile Asp Thr Asp Ile Cys Ile Gly Ala Gly Gln Cys1 5 10 15Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser20 25 30Ala Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Leu Val Arg35 40 45Glu Ala Ala Arg Ala Cys Pro Val Gln Ala Ile Ser Val Thr Asp Asp50 55 60<210>39<211>9<212>PRT<213>人工序列<220>
<223>合成肽<400>39
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala1 5<210>40<211>10<212>PRT<213>人工序列<220>
<223>合成肽<400>40Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu1 5 10<210>41<211>11<212>PRT<213>人工序列<220>
<223>合成肽<400>41Gln Pro Glu Leu Ala Pro Glu Asp Pro Glu Asp1 5 10<210>42<211>11<212>PRT<213>人工序列<220>
<223>合成肽<400>42Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys1 5 10<210>43<211>7<212>PRT<213>链霉菌属(Streptomyces)<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>43Ile Ala Gly His Glu Thr Thr1 5
<210>44<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(18)<223>第6、9和18位核苷酸是“s”,其中“s”=g或c<400>44atcgcsggsc acgagacsac 20<210>45<211>7<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>45Val Ala Gly His Glu Thr Thr1 5<210>46<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(18)<223>第3、6、9和18位核苷酸是“s”,其中“s”=g或c<400>46gtsgcsggsc acgagacsac 20<210>47<211>7<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>47Leu Ala Gly His Glu Thr Thr1 5
<210>48<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(18)<223>第3、6、9和18位核苷酸是“s”,其中“s”=g或c<400>48ctsgcsggsc acgagacsac 20<210>49<211>9<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>49Leu Leu Leu Ile Ala Gly His Glu Thr1 5<210>50<211>25<212>DNA<213>人工序列<220>
<221>misc_feature<222>(2)..(17)<223>第2、5、8、14和17位核苷酸是“s”,其中“s”=g或c<400>50tsctsctsat cgcsggscac gagac25<210>51<211>9<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>51His Gln Cys Leu Gly Gln Asn Leu Ala1 5
<210>52<211>26<212>DNA<213>人工序列<220>
<221>misc_feature<222>(12)..(24)<223>第12、15和24位核苷酸是“s”,其中“s”=g或c<400>52gtggtcacgg asccstgcttggascg 26<210>53<211>8<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>53Phe Gly His Gly Val His Gln Cys1 5<210>54<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(15)<223>第6、12和15位核苷酸是“s”,其中“s”=g或c<400>54aagccsgtgc cscasgtggt cacg 24<210>55<211>8<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>55
Phe Gly phe Gly Val His Gln Cys1 5<210>56<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(15)<223>第6、12和15位核苷酸是“s”,其中“s”=g或c<400>56aaggcsaagc cscasgtggt cacg 24<210>57<211>8<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列<400>57Phe Gly His Gly Ile His Gln Cys1 5<210>58<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(12)<223>第6和12位核苷酸是“s”,其中“s”=g或c<400>58aagccsgtgc cstaggtggt cacg 24<210>59<211>8<212>PRT<213>链霉菌属<220>
<221>misc_feature<222>
<223>链霉菌属共有序列
<400>59Phe Gly His Gly Val His Phe Cys1 5<210>60<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(15)<223>第6、12和15位核苷酸是“s”,其中“s”=g或c<400>60aagccsgtgc cscasgtgaa gacg24<210>61<211>24<212>PRT<213>杀结核链霉菌<400>61His Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro1 5 10 15Phe Thr Gly Tyr Gly Ala Leu Arg20<210>62<211>21<212>PRT<213>杀结核链霉菌<400>62Phe Val Asn Asn Pro Ala Ser Pro Ser Leu Asn Tyr Ala Pro Glu Asp1 5 10 15Asn Pro Leu Thr Arg20<210>63<211>19<212>PRT<213>杀结核链霉菌<400>63Leu Leu Thr His Tyr Pro Asp Ile Ser Leu Gly Ile Ala Pro Glu His1 5 10 15Leu Glu Arg
<210>64<211>17<212>PRT<213>杀结核链霉菌<400>64Val Tyr Leu Leu Gly Ser Ile Leu Asn Tyr Asp Ala Pro Asp His Thr1 5 10 15Arg<210>65<211>13<212>PRT<213>杀结核链霉菌<400>65Thr Trp Gly Ala Asp Leu Ile Ser Met Asp Pro Asp Arg1 5 10<210>66<211>13<212>PRT<213>杀结核链霉菌<400>66Glu Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg1 5 10<210>67<211>12<212>PRT<213>杀结核链霉菌<400>67Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg1 5 10<210>68<211>12<212>PRT<213>杀结核链霉菌<400>68Leu Met Glu Met Leu Gly Leu Pro Glu His Leu Arg1 5 10<210>69
<211>11<212>PRT<213>杀结核链霉菌<400>69Val Glu Gln Ile Ala Asp Ala Leu Leu Ala Arg1 5 10<210>70<211>11<212>PRT<213>杀结核链霉菌<400>70Leu Val Lys Asp Asp Pro Ala Leu Leu Pro Arg1 5 10<210>71<211>8<212>PRT<213>杀结核链霉菌<400>71Asp Asp Pro Ala Leu Leu Pro Arg1 5<210>72<211>8<212>PRT<213>杀结核链霉菌<400>72Thr Pro Leu Pro Gly Asn Trp Arg1 5<210>73<211>7<212>PRT<213>杀结核链霉菌<400>73Leu Asn Ser Leu Pro Val Arg1 5<210>74<211>7<212>PRT<213>杀结核链霉菌
<400>74Ile Thr Asp Leu Arg Pro Arg1 5<210>75<211>7<212>PRT<213>杀结核链霉菌<400>75Glu Gln Gly Pro Val Val Arg1 5<210>76<211>7<212>PRT<213>杀结核链霉菌<400>76Ala Val His Glu Leu Met Arg1 5<210>77<211>5<212>PRT<213>杀结核链霉菌<400>77Ala Phe Thr Ala Arg1 5<210>78<211>5<212>PRT<213>杀结核链霉菌<400>78Phe Glu Glu Val Arg1 5<210>79<211>7<212>PRT<213>杀结核链霉菌<400>79Pro Gly Glu Asp Asn Val Met1 5
<210>80<211>21<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(18)<223>第3、6、12和18位核苷酸是“s”,其中“s”=c或g<220>
<221>misc_feature<222>(9)..(9)<223>第9位核苷酸是“r”,其中“r”=a或g<220>
<221>misc_feature<222>(15)..(15)<223>第15位核苷酸是“y”,其中“y”=c或t<400>80ccsggsgarc csaaygtsat g 21<210>81<211>7<212>PRT<213>杀结核链霉菌<400>81Ala Leu Ile Thr Asp Pro Phe1 5<210>82<211>21<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(18)<223>第3、6、12和18位核苷酸是“s”,其中“s”=c或g<400>82gcsctsatya csgacccstt c 21<210>83<211>8<212>PRT<213>杀结核链霉菌<400>83Phe Met Asp Asp Ser Pro Val Trp1 5
<210>84<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(13)..(13)<223>第13位核苷酸是“w”,其中“w”=a或t<220>
<221>misc_feature<222>(14)..(21)<223>第14、15、18和21位核苷酸是“s”,其中“s”=c或g<400>84ttcatggacg acwssccsgt stgg24<210>85<211>8<212>PRT<213>杀结核链霉菌<400>85Leu Asn Tyr Asp Ala Pro Asp His1 5<210>86<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(18)<223>第3、15和18位核苷酸是“s”,其中“s”=c或g<220>
<221>misc_feature<222>(6)..(9)<223>第6和9位核苷酸是“y”,其中“y”=c或t<400>86ctsaaytayg acgcsccsga ccac 24<210>87<211>8<212>PRT<213>杀结核链霉菌<400>87Val Glu Gln Ile Ala Asp Ala Leu1 5
<210>88<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(3)..(24)<223>第3、15、21和24位核苷酸是“s”,其中“s”=c或g<220>
<221>misc_feature<222>(12)..(12)<223>第12位核苷酸是“y”,其中“y”=c或t<220>
<221>misc-feature<222>(6)..(6)<223>第6位核苷酸是“r”,其中“r”=a或g<400>88gtsgarcaga tygcsgacgc scts 24<210>89<211>8<212>PRT<213>杀结核链霉菌<400>89Asp Leu Ile Ser Met Asp Pro Asp1 5<210>90<211>24<212>DNA<213>人工序列<220>
<221>misc_feature<222>(6)..(21)<223>第6、11、12和21位核苷酸是“s”,其中“s”=c或g<220>
<221>misc_feature<222>(9)..(9)<223>第9位核苷酸是“r”,其中“r”=a或g<220>
<221>misc_feature<222>(10)..(10)<223>第10位核苷酸是“w”,其中“w”=a或t<400>90ctggastarw sstacctggg sctg 24<210>91<211>36
<212>DNA<213>杀结核链霉菌<400>91agattaatta atgtcggaat taatgaactg tccgtt 36<210>92<211>32<212>DNA<213>杀结核链霉菌<400>92aaactcaccc caaccgcacc ggcagcgagt tc 32<210>93<211>7<212>PRT<213>杀结核链霉菌<400>93Met Ser Glu Leu Met Asn Ser1 5<210>94<211>1293<212>DNA<213>杀结核链霉菌<400>94atgtcggcaa tatccagctc cccgttcgcc gcacacgtcg gaaagcatcc cggcgagccg 60aatgtgatgg acccggcgct gatcaccgac ccgttcggcg gctacggcgc actgcgtgag 120caaggccccg tcctaccggg ccggttcatg gacgactcac ccgtctggct cgtgacgcgc 180ttcgaagagg tccgccaagt cctgcgcgat cagcggttcc tgaacaaccc ggccgcgtcg 240tcaccggggc attcgatcga cgagagcccc acggccaggc tgctggacat gatggggatg 300cccgaacatt tccggccgta tctgatgggg tcgatcctca acaacgacgc ccccgaccac 360acccggctgc gccgtctggt gtcacgcgcg ttcacggcac gcaagatcac cgatctgcgg 420ccgcgggtcg agcagctcgc cgacgagctg ctggcccggc ttcccgagca cgccgaggac 480ggtgtggtcg acctgatcaa gcacttcgcc tatcccctgc cgatcaccgt gatctgcgaa 540ctggtcggca tcccggaagc ggaccgcccg caatggcgga agtggggcgc cgacctcgtt 600tcgctgcagc cggagcggct cagcacctcg ttcccggcga tgatcgagca catccatgaa 660ctgatccgcg agcggcgcgg cgcgctcacc gacgatctgc tcagcgagct gatccgtacc 720catgacgacg acggcagccg gctcagcgac gtcgagatgg tcaccatggt cctcaccgtc 780gtcctggccg gccacgagac caccgcccac ctgataggca acggcacggc ggcgctgctc 840acccaccccg accagctgcg cctggtcaag gacgacccgg agctgcttcc gcgtgccgtc 900cacgagctgc tgcgctggtg cgggccggtc cagatgaccc agctgcggta cgcctccgag 960gatgtcgaga tcgccgggac gccgatccgt aagggcgacg ccgtacaact catcctggta 1020tcggcgaact tcgacccccg ccactacacc gcccccgaac gcctcgacct gacccgccac 1080cccgccggcc acgccgagaa ccatgtgggc ttcggccacg gaatgcacta ctgcctgggc 1140gccaccctcg ccaaacagga gggcgaagtc gcgttcggca agctcttcac gcactacccg 1200gagctgtcgc tggccgtcgc accggacgag ttggagcgaa cgccggtgcc cggcagctgg 1260
cggttggatt cgctgccggt gcggttgggg tga 1293<210>95<211>430<212>PRT<213>杀结核链霉菌<400>95Met Ser Ala Ile Ser Ser Ser Pro Phe Ala Ala His Val Gly Lys His1 5 10 15Pro Gly Glu Pro Asn Val Met Asp Pro Ala Leu Ile Thr Asp Pro Phe20 25 30Gly Gly Tyr Gly Ala Leu Arg Glu Gln Gly Pro Val Leu Pro Gly Arg35 40 45Phe Met Asp Asp Ser Pro Val Trp Leu Val Thr Arg Phe Glu Glu Val50 55 60Arg Gln Val Leu Arg Asp Gln Arg Phe Leu Asn Asn Pro Ala Ala Ser65 70 75 80Ser Pro Gly His Ser Ile Asp Glu Ser Pro Thr Ala Arg Leu Leu Asp85 90 95Met Met Gly Met Pro Glu His Phe Arg Pro Tyr Leu Met Gly Ser Ile100 105 110Leu Asn Asn Asp Ala Pro Asp His Thr Arg Leu Arg Arg Leu Val Ser115 120 125Arg Ala Phe Thr Ala Arg Lys Ile Thr Asp Leu Arg Pro Arg Val Glu130 135 140Gln Leu Ala Asp Glu Leu Leu Ala Arg Leu Pro Glu His Ala Glu Asp145 150 155 160Gly Val Val Asp Leu Ile Lys His Phe Ala Tyr Pro Leu Pro Ile Thr165 170 175Val Ile Cys Glu Leu Val Gly Ile Pro Glu Ala Asp Arg Pro Gln Trp180 185 190Arg Lys Trp Gly Ala Asp Leu Val Ser Leu Gln Pro Glu Arg Leu Ser195 200 205Thr Ser Phe Pro Ala Met Ile Glu His Ile His Glu Leu Ile Arg Glu210 215 220Arg Arg Gly Ala Leu Thr Asp Asp Leu Leu Ser Glu Leu Ile Arg Thr225 230 235 240His Asp Asp Asp Gly Ser Arg Leu Ser Asp Val Glu Met Val Thr Met245 250 255Val Leu Thr Val Val Leu Ala Gly His Glu Thr Thr Ala His Leu Ile260 265 270Gly Asn Gly Thr Ala Ala Leu Leu Thr His Pro Asp Gln Leu Arg Leu275 280 285Val Lys Asp Asp Pro Glu Leu Leu Pro Arg Ala Val His Glu Leu Leu290 295 300Arg Trp Cys Gly Pro Val Gln Met Thr Gln Leu Arg Tyr Ala Ser Glu305 310 315 320Asp Val Glu Ile Ala Gly Thr Pro Ile Arg Lys Gly Asp Ala Val Gln325 330 335Leu Ile Leu Val Ser Ala Asn Phe Asp Pro Arg His Tyr Thr Ala Pro340 345 350
Glu Arg Leu Asp Leu Thr Arg His Pro A la Gly His Ala Glu Asn His355 360 365Val Gly Phe Gly His Gly Met His Tyr Cys Leu Gly Ala Thr Leu Ala370 375 380Lys Gln Glu Gly Glu Val Ala Phe Gly Lys Leu Phe Thr His Tyr Pro385 390 395 400Glu Leu Ser Leu Ala Val Ala Pro Asp Glu Leu Glu Arg Thr Pro Val405 410 415Pro Gly Ser Trp Arg Leu Asp Ser Leu Pro Val Arg Leu Gly420 425 430<210>96<211>18<212>DNA<213>人工序列<400>96cgsccsccsc tswssaas 18<210>97<211>21<212>DNA<213>人工序列<400>97sassgcstts bcccartgyt c 21<210>98<211>1266<212>DNA<213>杀结核链霉菌<400>98gtggtcgacg cacaccagac gttcgtcatc gtcgggggtg gcctggccgg cgcaaaggcc 60gcggagactc tccgcgcgga ggggttcacc ggccgggtga tcctcatctg tgacgagcgc 120gaccacccgt acgagcgccc cccgctctcc aaggggttcc tgctcggcaa ggaagagcgc 180gacagcgtgt tcgtccatga gcccgcctgg tacgcccagg cacagatcga actgcacctg 240ggccagcccg ccgtccgcct cgaccccgag ggcaggaccg tccgcctcgg cgacggcacc 300ctgatcgcct acgacaagct gctgctggcc accggcgccg aaccgcggcg cctggacatc 360cccggcaccg gcctggccgg cgtgcaccac ctgcgccgcc tcgcccacgc cgaacggctg 420cgcggcgtcc tggcctccct cggccgcgac aacggccatc tggtgatcgc cggagccggc 480tggatcggcc tggaggtcgc cgccgcggcc cgctcctacg gcgccgaggt gaccgtcgtc 540gaggccgccc cgacgccgct gcacggcatc ctggggcccg aactcggcgg tctgttcacc 600gatctgcacc gcgagcacgg cgtccgcttc cacttcggcg cccgcttcac cgagatcgtc 660ggagagggcg gcatggtgct cgccgtgcgc accgacgacg gcgaggaaca ccccgcccac 720gatgtgctcg ccgcgatcgg cgccgccccg cgcaccgcgc tcgccgaaca ggccgggctg 780gatctcgccg acccggagac cggcggcggg gtggccgtcg acgcggcgct gcgcacctcc 840gacccgtaca tctacgccgc cggtgacgtc gccgccgccg accacccgct gctggacacc 900
cggctgcggg tcgaacactg ggccaacgcc ctcaacggcg gcccggccgc cgcccgcgcc 960atgctcggcc aggacatcag ctacgaccgc atcccgtact tcttctccga ccagtacgac 1020gtcggcatgg agtactccgg ctacgccccg cccggctcgt acgcccaggt cgtctgccgc 1080ggcgacgtcg ccaagcggga gttcatcgcc ttctggctgg cggcggacgg ccggctgctc 1140gcgggcatga acgtcaacgt ctgggacgtc gccgagtcca tccagcaact catccgctcc 1200ggggcgccgt tggagcccgg cgcactggcc gatccgcagg ttccgctggc ggcactgctc 1260ccgtag 1266<210>99<211>421<212>PRT<213>杀结核链霉菌<400>99Val Val Asp Ala His Gln Thr Phe Val Ile Val Gly Gly Gly Leu Ala1 5 10 15Gly Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Thr Gly Arg20 25 30Val Ile Leu Ile Cys Asp Glu Arg Asp His Pro Tyr Glu Arg Pro Pro35 40 45Leu Ser Lys Gly Phe Leu Leu Gly Lys Glu Glu Arg Asp Ser Val Phe50 55 60Val His Glu Pro Ala Trp Tyr Ala Gln Ala Gln Ile Glu Leu His Leu65 70 75 80Gly Gln Pro Ala Val Arg Leu Asp Pro Glu Gly Arg Thr Val Arg Leu85 90 95Gly Asp Gly Thr Leu Ile Ala Tyr Asp Lys Leu Leu Leu Ala Thr Gly100 105 110Ala Glu Pro Arg Arg Leu Asp Ile Pro Gly Thr Gly Leu Ala Gly Val115 120 125His His Leu Arg Arg Leu Ala His Ala Glu Arg Leu Arg Gly Val Leu130 135 140Ala Ser Leu Gly Arg Asp Asn Gly His Leu Val Ile Ala Gly Ala Gly145 150 155 160Trp Ile Gly Leu Glu Val Ala Ala Ala Ala Arg Ser Tyr Gly Ala Glu165 170 175Val Thr Val Val Glu Ala Ala Pro Thr Pro Leu His Gly Ile Leu Gly180 185 190Pro Glu Leu Gly Gly Leu Phe Thr Asp Leu His Arg Glu His Gly Val195 200 205Arg Phe His Phe Gly Ala Arg Phe Thr Glu Ile Val Gly Glu Gly Gly210 215 220Met Val Leu Ala Val Arg Thr Asp Asp Gly Glu Glu His Pro Ala His225 230 235 240Asp Val Leu Ala Ala Ile Gly Ala Ala Pro Arg Thr Ala Leu Ala Glu245 250 255Gln Ala Gly Leu Asp Leu Ala Asp Pro Glu Thr Gly Gly Gly Val Ala260 265 270Val Asp Ala Ala Leu Arg Thr Ser Asp Pro Tyr Ile Tyr Ala Ala Gly275 280 285Asp Val Ala Ala Ala Asp His Pro Leu Leu Asp Thr Arg Leu Arg Val290 295 300
Glu His Trp Ala Asn Ala Leu Asn Gly Gly Pro Ala Ala Ala Arg Ala305 310 315 320Met Leu Gly Gln Asp Ile Ser Tyr Asp Arg Ile Pro Tyr Phe Phe Ser325 330 335Asp Gln Tyr Asp Val Gly Met Glu Tyr Ser Gly Tyr Ala Pro Pro Gly340 345 350Ser Tyr Ala Gln Val Val Cys Arg Gly Asp Val Ala Lys Arg Glu Phe355 360 365Ile Ala Phe Trp Leu Ala Ala Asp Gly Arg Leu Leu Ala Gly Met Asn370 375 380Val Asn Val Trp Asp Val Ala Glu Ser Ile Gln Gln Leu Ile Arg Ser385 390 395 400Gly Ala Pro Leu Glu Pro Gly Ala Leu Ala Asp Pro Gln Val Pro Leu405 410 415Ala Ala Leu Leu Pro420<210>100<211>1314<212>DNA<213>杀结核链霉菌<400>100atgcccgctg cacgccgccg ccttcgacct ccgcaccgga gcggcgacct gcctgcccgc 60ccgccgggcc gtgcgcaccc accccgtgac cgtccaggac ggcatgatct acgtccatca 120cgccgcggag gagggcaccg ccgcatgaag tcggtcgctg tcatcggggc ctcgctggcg 180ggcctgtacg ccgcgcggtc cctgcgttcc caggggttcg acggccgcct ggtgatcgtc 240ggggacgagt gccacggccc ctacgaccgg cccccgctgt ccaaggactt cctcaccggc 300gccaccgacc cgggccgact cgccctggcc gacgccgagg agatcgccga actcgacgcc 360gaatggctgc tgggcacccg ggccaccggg ctcgacaccg gcggacgcac ggtgctgctc 420gatggcggcc ggtccctgac caccgacggc gtggtcctcg ccaccggcgc cgccccgcgc 480ctgctccccg gaccggtgcc cgccggggtc cacaccctgc gcaccctcga cgacgcccag 540gcgctccgtg cggatctggc gccggcgccg gtccgggtcg tggtgatcgg cggcggcttc 600atcggcgccg aggtcgcctc gtcctgcgcc gccctaggcc atgacgtcac cgtggtcgag 660gccgcgccgc tccccctcgt cccccaactc ggccacgcca tggccgagat ctgcgccgcc 720ctgcatgcgg accacggcgt cacgctgctc accggaaccg gtgtcgcccg gctgcgcagc 780gagggcgacg gccggcgcgt caccggcgtc gagctgaccg acggccgcct gctccccgcc 840gacgtggtcg tcgtcggcat cggggtacgc ccccgcaccg cctggctcac ggactccgga 900ctgccgctcg acgacggtgt gctctgcgac gcgggctgtg tcaccccgct gcccgccgtc 960gtggccgtcg gcgacgtcgc cagggtggac ggcgcccgtg ccgagcactg gaccagcgcc 1020accgaacagg ccgccgtggc ggcgcggaac ctgctggccg gcagcaccgt cgcgacccac 1080cggagcctgc cgtacttctg gtccgaccag tacggcgtcc gcatccagtt cgcgggccac 1140cggctgccca ccgacacacc gcgcgtcctc gaaggctccc ccgacgaccg cagcttcctc 1200gcctgttacg aacgggacgg acgcaccacc gcggtgctcg ccctcaaccg gccccgcccc 1260ttcatgcggc tccgccgcga actcgcccgc accgccctgt cggccaccac ctga 1314<210>101<211>437<212>PRT<213>杀结核链霉菌
<400>101Met Pro Ala Ala Arg Arg Arg Leu Arg Pro Pro His Arg Ser Gly Asp1 5 10 15Leu Pro Ala Arg Pro Pro Gly Arg Ala His Pro Pro Arg Asp Arg Pro20 25 30Gly Arg His Asp Leu Arg Pro Ser Arg Arg Gly Gly Gly His Arg Arg35 40 45Met Lys Ser Val Ala Val Ile Gly Ala Ser Leu Ala Gly Leu Tyr Ala50 55 60Ala Arg Ser Leu Arg Ser Gln Gly Phe Asp Gly Arg Leu Val Ile Val65 70 75 80Gly Asp Glu Cys His Gly Pro Tyr Asp Arg Pro Pro Leu Ser Lys Asp85 90 95Phe Leu Thr Gly Ala Thr Asp Pro Gly Arg Leu Ala Leu Ala Asp Ala100 105 110Glu Glu Ile Ala Glu Leu Asp Ala Glu Trp Leu Leu Gly Thr Arg Ala115 120 125Thr Gly Leu Asp Thr Gly Gly Arg Thr Val Leu Leu Asp Gly Gly Arg130 135 140Ser Leu Thr Thr Asp Gly Val Val Leu Ala Thr Gly Ala Ala Pro Arg145 150 155 160Leu Leu Pro Gly Pro Val Pro Ala Gly Val His Thr Leu Arg Thr Leu165 170 175Asp Asp Ala Gln Ala Leu Arg Ala Asp Leu Ala Pro Ala Pro Val Arg180 185 190Val Val Val Ile Gly Gly Gly Phe Ile Gly Ala Glu Val Ala Ser Ser195 200 205Cys Ala Ala Leu Gly His Asp Val Thr Val Val Glu Ala Ala Pro Leu210 215 220Pro Leu Val Pro Gln Leu Gly His Ala Met Ala Glu Ile Cys Ala Ala225 230 235 240Leu His Ala Asp His Gly Val Thr Leu Leu Thr Gly Thr Gly Val Ala245 250 255Arg Leu Arg Ser Glu Gly Asp Gly Arg Arg Val Thr Gly Val Glu Leu260 265 270Thr Asp Gly Arg Leu Leu Pro Ala Asp Val Val Val Val Gly Ile Gly275 280 285Val Arg Pro Arg Thr Ala Trp Leu Thr Asp Ser Gly Leu Pro Leu Asp290 295 300Asp Gly Val Leu Cys Asp Ala Gly Cys Val Thr Pro Leu Pro Ala Val305 310 315 320Val Ala Val Gly Asp Val Ala Arg Val Asp Gly Ala Arg Ala Glu His325 330 335Trp Thr Ser Ala Thr Glu Gln Ala Ala Val Ala Ala Arg Asn Leu Leu340 345 350Ala Gly Ser Thr Val Ala Thr His Arg Ser Leu Pro Tyr Phe Trp Ser355 360 365Asp Gln Tyr Gly Val Arg Ile Gln Phe Ala Gly His Arg Leu Pro Thr370 375 380Asp Thr Pro Arg Val Leu Glu Gly Ser Pro Asp Asp Arg Ser Phe Leu385 390 395 400Ala Cys Tyr Glu Arg Asp Gly Arg Thr Thr Ala Val Leu Ala Leu Asn405 410 415
Arg Pro Arg Pro Phe Met Arg Leu Arg Arg Glu Leu A1a Arg Thr A1a420 425 430Leu Ser A1a Thr Thr435<210>102<211>1233<212>DNA<213>杀结核链霉菌<400>102atggcccaga acacggcatt catcatcgcg ggagcggggc tggccggggc gaaggccgcg 60gagacactgc gcgcggaggg cttcggcggc cccgtcctgc tgctgggcga cgagcgcgag 120cgtccctacg agcggccgcc gctgtccaag ggctacctct tgggcacctc cgagcgggag 180aaggcgtacg tccatccgcc ccagtggtac gccgagcacg acgtcgatct gcggctgggc 240aacgccgtca ccgccctcga cccggccggc cacgaggtga ccctcgccga cggcagccgg 300ctgggctacg ccaagctgct gctggccacc ggctccactc cgcgccggct gccggtgccc 360ggcgccgacc tcgacggggt ccacacgctg cggtacctgg cggacagcga ccgcctcaag 420gacctcttcc ggtccgcgtc ccggatcgtg gtgatcggcg gcggctggat cggcctggag 480accacggccg ccgcgcgtgc ggcgggggtc gaggtgaccg tgctggagtc ggcgccgctg 540cccctgctgg gggtgctggg ccgcgaggtc gcccaggtct tcgccgatct gcacaccgag 600cacggtgtcg cgctgcgctg cgacacccag gtcacggaga tcaccggcac gaacggcgcg 660gtcgacgggg tacggctggc cgacggcacc cggatcgcgg ccgacgcggt gatcgtcggc 720gtcgggatca cccccaactc cgagacggcc gccgcggccg ggctcaaggt cgacaacggc 780gtcgtcgtgg acgagcggct gtgctcctcc cacccggaca tctacgccgc cggcgacgtc 840gccaacgcct accaccccct cctgggcaag cacctccgcg tcgagcactg ggccaacgcc 900ctccaccagc cgaagaccgc ggcccgggcc atgctgggcg gggaggccgg ctacgaccgg 960ctgccgtact tcttcaccga ccagtacgac ctgggcatgg agtacacggg gcatgtggag 1020ccgggcgggt acgaccgcgt ggtgttccgc ggcgacaccg gtgcccgcga gttcatcgcc 1080ttctggctct ccggcggccg ggtgctggcc gggatgaatg tgaacgtatg ggacgtcacc 1140gacccgatcc gggccctggt ggcgagcggg cgggccgtgg accccgagcg gctcgccgac 1200gcggacgtac cgctggcgga tctggtcccc tga 1233<210>103<211>410<212>PRT<213>杀结核链霉菌<400>103Met Ala Gln Asn Thr Ala Phe Ile Ile Ala Gly Ala Gly Leu Ala Gly1 5 10 15Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Gly Gly Pro Val20 25 30Leu Leu Leu Gly Asp Glu Arg Glu Arg Pro Tyr Glu Arg Pro Pro Leu35 40 45Ser Lys Gly Tyr Leu Leu Gly Thr Ser Glu Arg Glu Lys Ala Tyr Val50 55 60His Pro Pro Gln Trp Tyr Ala Glu His Asp Val Asp Leu Arg Leu Gly65 70 75 80Asn Ala Val Thr Ala Leu Asp Pro Ala Gly His Glu Val Thr Leu Ala
85 90 95Asp Gly Ser Arg Leu Gly Tyr Ala Lys Leu Leu Leu Ala Thr Gly Ser100 105 110Thr Pro Arg Arg Leu Pro Val Pro Gly Ala Asp Leu Asp Gly Val His115 120 125Thr Leu Arg Tyr Leu Ala Asp Ser Asp Arg Leu Lys Asp Leu Phe Arg130 135 140Ser Ala Ser Arg Ile Val Val Ile Gly Gly Gly Trp Ile Gly Leu Glu145 150 155 160Thr Thr Ala Ala Ala Arg Ala Ala Gly Val Glu Val Thr Val Leu Glu165 170 175Ser Ala Pro Leu Pro Leu Leu Gly Val Leu Gly Arg Glu Val Ala Gln180 185 190Val Phe Ala Asp Leu His Thr Glu His Gly Val Ala Leu Arg Cys Asp195 200 205Thr Gln Val Thr Glu Ile Thr Gly Thr Asn Gly Ala Val Asp Gly Val210 215 220Arg Leu Ala Asp Gly Thr Arg Ile Ala Ala Asp Ala Val Ile Val Gly225 230 235 240Val Gly Ile Thr Pro Asn Ser Glu Thr Ala Ala Ala Ala Gly Leu Lys245 250 255Val Asp Asn Gly Val Val Val Asp Glu Arg Leu Cys Ser Ser His Pro260 265 270Asp Ile Tyr Ala Ala Gly Asp Val Ala Asn Ala Tyr His Pro Leu Leu275 280 285Gly Lys His Leu Arg Val Glu His Trp Ala Asn Ala Leu His Gln Pro290 295 300Lys Thr Ala Ala Arg Ala Met Leu Gly Gly Glu Ala Gly Tyr Asp Arg305 310 315 320Leu Pro Tyr Phe Phe Thr Asp Gln Tyr Asp Leu Gly Met Glu Tyr Thr325 330 335Gly His Val Glu Pro Gly Gly Tyr Asp Arg Val Val Phe Arg Gly Asp340 345 350Thr Gly Ala Arg Glu Phe Ile Ala Phe Trp Leu Ser Gly Gly Arg Val355 360 365Leu Ala Gly Met Asn Val Asn Val Trp Asp Val Thr Asp Pro Ile Arg370 375 380Ala Leu Val Ala Ser Gly Arg Ala Val Asp Pro Glu Arg Leu Ala Asp385 390 395 400Ala Asp Val Pro Leu Ala Asp Leu Val Pro405 410<210>104<211>1266<212>DNA<213>杀结核链霉菌<400>104gtggtcgacg cacaccagac gttcgtcatc gtcgggggtg gcctggccgg cgcaaaggcc 60gcggagactc tccgcgcgga agggttcacc ggccgggtga tcctcatctg tgacgagcgc 120gaccacccgt acgagcgccc cccgctctcc aaggggttcc tgctcggcaa ggaagagcgc 180gacagcgttt tcgtccacga acccgcctgg tacgcccagg cacagatcga actgcacctg 240
ggccagcccg ccgtccgcct cgaccccgag gcgaagaccg tccgcctcgg cgacggcacc 300ctgatcgcct acgacaagct gctgctggcc accggcgccg agccgcgccg cctggacatc 360cccggcaccg gcctggccgg cgtgcaccac ctgcgccgcc tcgcccacgc cgaacggctg 420cgcggcgtcc tggcctccct cgggcgggac aacgggcatc tggtgatcgc cggcgccggc 480tggatcggcc tggaggtcgc cgccgcggcc cgctcctacg gcgccgaggt caccgtcgtc 540gaggccgccc cgacaccgct gcacggcatc ctggggcccg aactcggcgg cctgttcacc 600gaactgcacc gcgcacacgg cgtgcgcttc cacttcggcg cccgtttcac cgagatcgtc 660ggacaggacg gcatggtgct cgccgtgcgc accgacgacg gcgaggagca ccccgcccac 720gacgtgctcg ccgcgatcgg cgccgccccg cgcaccgcac tcgccgaaca ggccggactc 780gacctcgccg acccggaggc cggcggcggc gtggccgtcg acgcgacgct gcgcacctcc 840gacccgtaca tctacgccgc cggcgacgtg gccgccgccg accaccccct cctggacacc 900cggctgcgcg tcgaacactg ggccaacgcc ctcaacggcg gcccggccgc cgcgcgcgcc 960atgctcggcc aggacatcag ctacgaccgc gtcccgtact tcttctccga ccagtacgac 1020gtcggcatgg agtactccgg ctacgccccg cccggctcct acgcacaggt cgtctgccgc 1080ggcgacgtcg ccaaacggga gttcatcgcg ttctggctcg gcgaggacgg acggctgctc 1140gcggggatga acgtcaacgt ctgggacgtc gccgaaacca tccagcaact catccgcggc 1200ggggtgcggt tggagcccgg cgagctggct gatccggagg ttccgctgac ctcactgctc 1260ccgtag1266<210>105<211>421<212>PRT<213>杀结核链霉菌<400>105Val Val Asp Ala His Gln Thr Phe Val Ile Val Gly Gly Gly Leu Ala1 5 10 15Gly Ala Lys Ala Ala Glu Thr Leu Arg Ala Glu Gly Phe Thr Gly Arg20 25 30Val Ile Leu Ile Cys Asp Glu Arg Asp His Pro Tyr Glu Arg Pro Pro35 40 45Leu Ser Lys Gly Phe Leu Leu Gly Lys Glu Glu Arg Asp Ser Val Phe50 55 60Val His Glu Pro Ala Trp Tyr Ala Gln Ala Gln Ile Glu Leu His Leu65 70 75 80Gly Gln Pro Ala Val Arg Leu Asp Pro Glu Ala Lys Thr Val Arg Leu85 90 95Gly Asp Gly Thr Leu Ile Ala Tyr Asp Lys Leu Leu Leu Ala Thr Gly100 105 110Ala Glu Pro Arg Arg Leu Asp Ile Pro Gly Thr Gly Leu Ala Gly Val115 120 125His His Leu Arg Arg Leu Ala His Ala Glu Arg Leu Arg Gly Val Leu130 135 140Ala Ser Leu Gly Arg Asp Asn Gly His Leu Val Ile Ala Gly Ala Gly145 150 155 160Trp Ile Gly Leu Glu Val Ala Ala Ala Ala Arg Ser Tyr Gly Ala Glu165 170 175Val Thr Val Val Glu Ala Ala Pro Thr Pro Leu His Gly Ile Leu Gly180 185 190Pro Glu Leu Gly Gly Leu Phe Thr Glu Leu His Arg Ala His Gly Val195 200 205Arg Phe His Phe Gly Ala Arg Phe Thr Glu Ile Val Gly Gln Asp Gly
210 215 220Met Val Leu Ala Val Arg Thr Asp Asp Gly Glu Glu His Pro Ala His225 230 235 240Asp Val Leu Ala Ala Ile Gly Ala Ala Pro Arg Thr Ala Leu Ala Glu245 250 255Gln Ala Gly Leu Asp Leu Ala Asp Pro Glu Ala Gly Gly Gly Val Ala260 265 270Val Asp Ala Thr Leu Arg Thr Ser Asp Pro Tyr Ile Tyr Ala Ala Gly275 280 285Asp Val Ala Ala Ala Asp His Pro Leu Leu Asp Thr Arg Leu Arg Val290 295 300Glu His Trp Ala Asn Ala Leu Asn Gly Gly Pro Ala Ala Ala Arg Ala305 310 315 320Met Leu Gly Gln Asp Ile Ser Tyr Asp Arg Val Pro Tyr Phe Phe Ser325 330 335Asp Gln Tyr Asp Val Gly Met Glu Tyr Ser Gly Tyr Ala Pro Pro Gly340 345 350Ser Tyr Ala Gln Val Val Cys Arg Gly Asp Val Ala Lys Arg Glu Phe355 360 365Ile Ala Phe Trp Leu Gly Glu Asp Gly Arg Leu Leu Ala Gly Met Asn370 375 380Val Asn Val Trp Asp Val Ala Glu Thr Ile Gln Gln Leu Ile Arg Gly385 390 395 400Gly Val Arg Leu Glu Pro Gly Glu Leu Ala Asp Pro Glu Val Pro Leu405 410 415Thr Ser Leu Leu Pro420
权利要求
1.一种纯化的编码多肽的核酸分子,所述多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物在4”位的醇 其中R1-R7相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,以制备式(III)化合物 其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
2.如权利要求1所述的核酸分子,该核酸分子包含编码显示P450单加氧酶的酶活性并能将除虫菌素区域选择性氧化为4”酮-除虫菌素的多肽的核酸序列。
3.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中,所述多肽与SEQ IDNO2所示的多肽基本上相似,并且与SEQ ID NO2所示的多肽具有至少50%,至99%之间的氨基酸序列同一性。
4.如权利要求3所述的核酸分子,该核酸分子包含如下核苷酸序列,所述核苷酸序列a)如SEQ ID NO1所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与如下核酸分子杂交,该核酸分子包含SEQ ID NO1所示的核苷酸序列或其互补序列的50至200或更多个连续核苷酸;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
5.如权利要求1或2所述的核酸分子,该核酸分子包含与SEQID NO1具有至少66%同一性的核酸序列。
6.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中所述多肽基本上与SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ IDNO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ IDNO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ IDNO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ IDNO34或SEQ ID NO95所示多肽相似,并与其具有至少60%至99%之间的氨基酸序列同一性。
7.如权利要求1或2所述的核酸分子,该核酸分子包含编码显示P450单加氧酶酶活性的多肽的核酸序列,其中所述多肽与抗SEQID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ IDNO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ IDNO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ IDNO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ IDNO34或SEQ ID NO95所示多肽的抗体有免疫学反应性。
8.如权利要求1或2所示的核酸分子,该核酸分子包含如下核苷酸序列,该核苷酸序列a)如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或SEQ ID NO94所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或SEQ IDNO94所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸;e)与(a)、(b)或(c)互补;和f)为(a)、(b)或(c)的反向互补序列;g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
9.如权利要求8所述的核酸分子,该核酸分子包含选自如下的核酸序列SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ IDNO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ IDNO33和SEQ ID NO94。
10.如权利要求1至9任一项的核酸分子,其中所述的核酸分子分离自链霉菌属的株系。
11.如权利要求1至10任一项的核酸分子,该核酸分子还包含编码通过共价键与P450单加氧酶连接的标签的核酸序列。
12.一种多肽,该多肽显示P450单加氧酶的酶活性并能够区域选择性地氧化式(II)化合物在4”位的醇, 其中R1-R7相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,以制备式(III)化合物 其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
13.一种显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”酮-除虫菌素的多肽。
14.如权利要求12或13所述的多肽,该多肽包含由以下核酸分子编码的氨基酸序列,所述核酸分子a)如SEQ ID NO1或其互补序列所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO1所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
15.权利要求12至14任一项所述的多肽,该多肽包含与SEQ IDNO2具有至少50%同一性的氨基酸序列。
16.如权利要求12或13所述的多肽,该多肽包含由以下核酸分子编码的氨基酸序列,所述核酸分子a)如SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ IDNO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ ID NO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ ID NO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或SEQ ID NO94或其互补序列所示;b)与(a)基本上相似;c)能够与(a)或其互补序列杂交;d)能够与以下核酸分子杂交,该核酸分子包含SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15、SEQ ID NO17、SEQ IDNO19、SEQ ID NO21、SEQ ID NO23、SEQ ID NO25、SEQ IDNO27、SEQ ID NO29、SEQ ID NO31、SEQ ID NO33或SEQ IDNO94所示核苷酸序列或其互补序列的50至200或更多个连续核苷酸,或其互补序列;e)与(a)、(b)或(c)互补;f)为(a)、(b)或(c)的反向互补序列;或g)为(a)、(b)、(c)、(d)、(e)或(f)的功能性部分,该功能性部分编码仍显示P450单加氧酶的酶活性并能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
17.如权利要求16所述的多肽,该多肽包含选自以下的氨基酸序列SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16、SEQ ID NO18、SEQ ID NO20、SEQ ID NO22、SEQ ID NO24、SEQ ID NO26、SEQ ID NO28、SEQ ID NO30、SEQ ID NO32、SEQ ID NO34和SEQ ID NO95。
18.如权利要求12至17任一项所述的多肽,该多肽还包含标签。
19.一种与权利要求12至18任一项所述的多肽特异性结合的结合剂。
20.如权利要求20所述的结合剂,其中所述的结合剂为抗体。
21.显示P450单加氧酶的酶活性的多肽家族,其中该家族的每个成员都能够区域选择性地氧化式(II)化合物在4”位的醇 其中R1-R7相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,以制备式(III)化合物 其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
22.显示P450单加氧酶的酶活性的多肽家族,其中该家族的每个成员都能将除虫菌素氧化为4”酮-除虫菌素。
23.如权利要求21或22所述的家族,其中该家族的每个成员包含与SEQ ID NO2具有至少50%同一性的氨基酸序列。
24.一种纯化的核酸分子,该核酸分子包含编码分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽的核苷酸序列,其中所述的核酸分子分离自含有P450单加氧酶的链霉菌属的株系,所述的P450单加氧酶能够区域选择性地氧化式(II)化合物在4”位的醇 其中R1-R7相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,以产生式(III)化合物 其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
25.如权利要求24所述的纯化的核酸分子,该核酸分子包含编码分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽的核苷酸序列,其中所述的核酸分子分离自含有将除虫菌素区域选择性地氧化为4”-酮除虫菌素的P450单加氧酶的链霉菌属株系。
26.如权利要求25所述的核酸分子,该核酸分子包含选自SEQ IDNO35和SEQ ID NO37的核酸序列。
27.如权利要求25所述的核酸分子,该核酸分子包含选自SEQ IDNO98、SEQ ID NO100、SEQ ID NO102和SEQ ID NO104的核酸序列。
28.一种分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽,其中所述的多肽分离自含有P450单加氧酶的链霉菌属株系,所述的P450单加氧酶能够区域选择性地氧化式(II)化合物在4”位的醇 其中R1-R7相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;和标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,以制备式(III)化合物 其中,R1-R7、m、n、A、B、C、D、E和F与上述式(II)中给定的含义相同。
29.一种分别显示铁氧还蛋白和铁氧还蛋白还原酶的酶活性的多肽,其中所述的铁氧还蛋白分离自含有将除虫菌素区域选择性地氧化为4”酮-除虫菌素的P450单加氧酶的链霉菌属株系。
30.如权利要去29所述的铁氧还蛋白,该铁氧还蛋白包含选自SEQ ID NO36和SEQ ID NO38的氨基酸序列。
31.如权利要求29所述的铁氧还蛋白还原酶蛋白,该铁氧还蛋白还原酶蛋白包含选自SEQ ID NO99、SEQ ID NO101、SEQ IDNO103和SEQ ID NO105的氨基酸序列。
32.一种细胞,其经基因工程化包含编码显示如权利要求1至11任一项所述P450单加氧酶的酶活性的多肽的核酸分子。
33.如权利要求32所述的细胞,该细胞还包含分别编码铁氧还蛋白和铁氧还蛋白还原酶蛋白或编码其联合的核酸分子。
34.如权利要求32或33所述的细胞,其中将所述的核酸分子定位以在细胞中表达。
35.如权利要求32至34任一项所述的细胞,其中所述的细胞为选自链霉菌属株系细胞、假单胞菌属株系细胞和大肠杆菌株系细胞的基因工程化细胞。
36.如权利要求35所述的细胞,其中所述的细胞分别具有NRRL指定号B-30478和NRRL指定号B-30479。
37.一种制备式(I)化合物的方法, 其中R1-R9相互独立地代表氢或取代基;m为0、1或2;n为0、1、2或3;且标有A、B、C、D、E和F的键相互独立地表示两个相邻碳原子通过以下形式相连双键、单键、单键和下式的环氧桥 或单键和下式的亚甲基桥 包括,当可适用时,其E/Z异构体,E/Z异构体的混合物,和/或互变异构体,在每种情况中为游离形式或盐形式,其中所述方法包括1)将式(II)化合物 其中R1-R7、m、n、A、B、C、D、E和F与上述式(I)中给定的含义相同,与根据本发明的多肽接触,所述多肽能够区域选择性地氧化在4”位的醇,以形成式(III)化合物 其中,R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与式(I)给定的含义相同;和2)使式(III)化合物与式HN(R8)R9的胺在还原剂存在的情况下反应,其中R8和R9与式(I)中给定的含义相同,并且所述胺是已知的;并且,在每种情况下,如果需要,将可按照本方法或其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体,在每种情况中为游离形式或盐形式,转变为不同的式(I)化合物或其E/Z异构体或互变异构体,在每种情况中为游离形式或盐形式;将可按照本方法获得的E/Z异构体混合物分离,并分离出需要的异构体;和/或将可按照本方法或其它方法获得的游离的式(I)化合物、或其E/Z异构体或互变异构体转变为盐,或将可按照本方法或其它方法获得的式(I)化合物、或其E/Z异构体或互变异构体的盐转变为游离的式(I)化合物或其E/Z异构体或互变异构体或转变为不同的盐。
38.一种制备式(III)化合物的方法, 其中R1、R2、R3、R4、R5、R6、R7、m、n、A、B、C、D、E和F与权利要求37所述的式(III)中给定的含义相同,其中所述方法包括1)使式(II)化合物 其中R1-R7、m、n、A、B、C、D、E和F与上述式(I)给定的含义相同,与根据本发明的能够区域选择性地氧化在4”位的醇的多肽接触,将所述接触保持足够发生所述氧化反应的时间并且分离和纯化式(II)化合物。
39.如权利要求37或38任一项所述的方法,用于制备依马菌素,该方法包括将显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”酮-除虫菌素的多肽加入含有除虫菌素的反应混合物中;将反应混合物在使该多肽将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的条件下温育。
40.如权利要求37至39任一项的方法,其中所述的反应混合物还包含铁氧还蛋白。
41.如权利要求37至40任一项的方法,其中所述的反应混合物还包含铁氧还蛋白还原酶蛋白。
42.一种用于生产依马菌素的制剂,该制剂包含显示P450单加氧酶的酶活性并将除虫菌素区域选择性地氧化为4”-酮-除虫菌素的多肽。
43.如权利要求42所述的制剂,该制剂还包含铁氧还蛋白。
44.如权利要求42或43所述的制剂,该制剂还包含铁氧还蛋白还原酶蛋白。
全文摘要
本发明公开了P450单加氧酶家族,该家族的每个成员能将除虫菌素区域选择性地氧化为4”-酮-除虫菌素。在从除虫菌素生产依马菌素的方法和制剂中可使用P450单加氧酶。本发明还公开了纯化本发明的P450单加氧酶的方法,与本发明的P450单加氧酶特异性结合的结合剂,和表达本发明的P450单加氧酶的基因工程细胞。本发明还公开了与本发明的P450单加氧酶具有活性的铁氧还蛋白和铁氧还蛋白还原酶。
文档编号C12P21/00GK1514880SQ02810000
公开日2004年7月21日 申请日期2002年5月15日 优先权日2001年5月16日
发明者I·摩尔纳, J·M·利宫, R·E·泽科尔, P·E·汉默, D·S·希尔, J·P·帕克拉特科, T·G·巴克尔, I 摩尔纳, 利宫, 巴克尔, 希尔, 帕克拉特科, 汉默, 泽科尔 申请人:辛根塔参与股份公司