具有溶菌酶活性的多肽和编码所述多肽的多核苷酸的制作方法
【专利摘要】本发明涉及具有溶菌酶活性的分离的多肽和编码这些多肽的多核苷酸。本发明还涉及核酸构建体、载体以及包括这些多核苷酸的宿主细胞连同产生和使用这些多肽的方法。
【专利说明】具有溶菌酶活性的多肽和编码所述多肽的多核苷酸[0001 ] 参考序列表
[0002]本申请包含一个计算机可读形式的序列表,将其通过引用结合在此。
[0003]原子坐标的引用
[0004]本申请将Acremonium alkalophilum CBS114.92溶菌酶的三维结构的原子坐标列于图6中。
[0005]发明背景
发明领域
[0006]本发明涉及具有溶菌酶活性的多肽、催化结构域以及编码这些多肽和催化结构域的多核苷酸。本发明还涉及核酸构建体、载体以及包括这些多核苷酸的宿主细胞连同生产和使用这些多肽和催化结构域的方法。
[0007]相关技术说明
[0008]溶菌酶是一种由许多生物作为对抗细菌的防御性机制而产生的O-糖基水解酶。该酶通过裂解肽聚糖的糖苷键来水解细菌的细胞壁;肽聚糖是细菌中的一种重要的结构分子。在细菌的细胞壁被溶菌酶作用弱化后,由渗透压导致细菌细胞溶解。
[0009]溶菌酶出现在许多生物中,例如病毒、植物、昆虫、鸟类、爬行类以及哺乳类。在哺乳类中,已经从鼻腔分泌物、唾液、眼泪、肠、尿和乳中分离到溶菌酶。该酶裂解N-乙酰胞壁酸的I号碳与N-乙酰-D-葡糖胺的4号碳之间的糖苷键。在体内,这两种碳水化合物聚合以形成细胞壁多糖。
[0010]在溶菌酶作为抗微生物剂的潜力方面的兴趣日益增加。例如,已经显示溶菌酶活性对抗病原体,如肺炎链球菌、炭疽杆菌、屎肠球菌、嗜热脂肪芽孢杆菌、肉毒杆菌、丁酸梭菌、产气荚膜梭菌、生孢梭菌(Clostridium sporogenes)、酪丁酸梭菌、以及单核细胞增生利斯特菌。
[0011]已经将溶菌酶分类为五种不同的糖苷水解酶(GH)家族(CAZy,www.cazy.0rg):母鸡蛋白溶菌酶(GH22),鹅蛋白溶菌酶(GH23),噬菌体T4溶菌酶(GH24),鞘氨醇单胞菌鞭毛蛋白(GH73)以及Chalaropsis溶菌酶(GH25)。来自家族GH23和GH24的溶菌酶主要从噬菌体中已知并且还未在真菌中鉴别。已经发现溶菌酶家族GH25与其他溶菌酶家族在结构上是不相关的。
[0012]已经提出了溶菌酶在动物饲料(参见例如W000/21381和W004/026334),在乳酪生产(参见例如W005/080559)、食品保藏(Hughey (休伊)和Johnson(约翰逊)(1987)ApplEnviron Microbiol (《应用与环境微生物学》)53:2165)、洗涤剂(参见例如US5,041,236和 EP0425016),在口腔护理(参见例如 US4, 355,022、W004/017988 和 W008/124764)、美容和皮肤学、避孕、泌尿学、以及妇科(参见例如W008/124764)中的用途。
[0013] 已经从拟鞘孢属(Chalaropsis)报道了一种GH25溶菌酶(Felsch(费什)Jff, Ingagami (英戈米)T,和 Hash (哈什)JH.(1975), “The N, O-Diacetylmuramidaseof Chalaropsis species ;V The complete amino acid sequence(Chalaropsis 物种的N,O- 二乙酰胞壁质酶;V,完整氨基酸序列),J.Biol.Chem.(《生物化学杂志》)250(10):3713-3720)。
[0014]作为在商业市场可获得的主要产品的母鸡蛋白溶菌酶不裂解例如金黄色葡萄球菌细胞壁中的N,6-0- 二乙酰胞壁质酶并且因此尤其不能溶解这一重要的人类病原体(Masschalck(马斯克)B, Deckers (德克斯)D, Michiels (米盖尔思)CW(2002),“Lyticand nonlytic mechanism of inactivation of gram-positive bacteria by lysozymeunder atmospheric and high hydrostatic pressure (在大气压和高流体静力压下由溶菌酶灭活革兰氏阳性细菌的溶解和非溶解机制)”,J Food Prot.(《食品保护杂志》)65(12):1916-23)。
[0015]已经观察到不同的溶菌酶针对不同微生物具有不同的特异性。所以,令人希望的是使得若干溶菌酶可得,以便能够针对每种具体的应用选择适合的酶。所以,具有溶菌酶活性的新的多肽是令人希望的。
[0016]发明概述
[0017]本发明涉及属于GH25家族并且具有溶菌酶活性的分离的真菌多肽。
[0018]本发明进一步涉及具有溶菌酶活性的分离的多肽,这些多肽选自下组,该组由以下各项组成:
[0019](a)与SEQ ID NO:4的成熟多肽或与SEQ ID N0:8的成熟多肽具有至少80%序列一致性的一种多 肽;
[0020](b)由以下一种多核苷酸编码的一种多肽,该多核苷酸与SEQ ID NO: 3的成熟多肽编码序列或与SEQ ID NO:7的成熟多肽编码序列具有至少80%序列一致性;
[0021](c)由以下一种多核苷酸编码的一种多肽,该多核苷酸在中-高严谨度条件下与SEQ ID N0:3或SEQ ID NO:7的成熟多肽编码序列、或其全长互补体杂交;
[0022](d)SEQ ID N0:4或SEQ ID N0:8的成熟多肽的一种变体,该变体在一个或多个(例如,若干个)位置处包括取代、缺失和/或插入;以及
[0023](e)具有溶菌酶活性的(a)、(b)、(C)、或(d)的多肽的一个片段。
[0024]本发明还涉及编码本发明的多肽的分离的多核苷酸;核酸构建体;重组表达载体;包括这些多核苷酸的重组宿主细胞;以及产生这些多肽的方法。
[0025]此外,本发明涉及包括本发明的多肽的组合物,例如洗涤剂组合物、动物饲料组合物以及细菌的基因组DNA提取组合物。
[0026]本发明还涉及具有抗微生物活性的本发明的多肽以及将本发明的这些多肽用作生物膜形成的抑制剂,在洗涤剂、在牙齿护理、在动物饲料中使用并且用于分解细菌的细胞壁的方法。
[0027]本发明还涉及一种编码信号肽的多核苷酸,该信号肽包括SEQ ID N0:4的氨基酸I至19或SEQ ID NO: 8的氨基酸-23至-1或由其组成,该多核苷酸被可操作地连接至编码一种蛋白质的基因;涉及核酸构建体、表达载体、以及包括这些多核苷酸的重组宿主细胞;以及涉及产生一种蛋白质的方法。
[0028]序列表综述
[0029]SEQ ID NO:1 是如从 Acremonium alkalophilum CBS114.92 中分离的 P244A7GH24基因的DNA序列。[0030]SEQ ID NO: 2是如从SEQ ID NO:1推导的氨基酸序列。
[0031]SEQ ID NO: 3 是如从 Acremonium alkalophilum CBS114.92 中分离的 P242M9GH25基因的DNA序列。
[0032]SEQ ID NO:4是如从SEQ ID NO:3推导的氨基酸序列。
[0033]SEQ ID NO:5 是正向引物 F-P242M9。
[0034]SEQ ID NO:6 是反向引物 R-P242M9。
[0035]SEQ ID NO: 7是合成地优化的GH25基因的DNA序列。
[0036]SEQ ID NO:8是如从SEQ ID NO:7推导的氨基酸序列。
[0037]SEQ ID NO:9 是正向引物 BamHI。
[0038]SEQ ID NO: 10 是反向引物 EcoRI。
[0039]附图简要说明
[0040]图1 不出了 Acremonium alcalophilum GH24 溶菌酶(EXP03890, SEQ ID NO:2) >Acremonium alcalophilum GH25 溶菌酶(EXP03864, SEQ ID NO:4)以及一种来自烟曲霉GH25的参考溶菌酶在肉葡萄球菌和大肠杆菌上的径向扩散测定(radial diffusionassays)。
[0041]图 2 示出了 Acremonium alcalophilum GH25 溶菌酶 P242M9 (SEQ ID NO: 4)在 30或60秒钟后在60°C、76°C、70°C、75°C、8(rC以及85°C下的温度稳定性,如在540nm在分光光度计中所测量的重悬滕黄微球菌ATTC N0.4698的溶液的光密度下降。
[0042]图3 示出了 GH25 溶菌酶 P242M9 (SEQ ID NO: 4)在 50mM 乙酸钠(pH4.5)、50mM 乙酸钠(ρΗ5.5)以及50mM MES(2-(N-吗啉代)乙磺酸)(ρΗ6.5)中如使用差示扫描量热法(DSC)所确定的热稳定性。
[0043]图4示出了 4个浓度的GH25溶菌酶Ρ242Μ9 (SEQ ID NO: 4),合成GH25溶菌酶(SEQID NO:8)以及SEQ ID NO:8的11个变体的溶菌酶活性,如通过重悬产气荚膜梭菌ΝΝ01260的溶液的光密度下降所确定的。
[0044]图5示出了 4个浓度的GH25溶菌酶Ρ242Μ9 (SEQ ID NO: 4),合成GH25溶菌酶(SEQID NO:8)以及SEQ ID Ν0:8的11个变体的溶菌酶活性,如通过重悬产气荚膜梭菌临床分离株的溶液的光密度下降所确定的。
[0045]图6列出了 Acremonium alkalophilum CBS114.92GH25 溶菌酶的三维结构的原子坐标。这些原子坐标可以协助生成描绘Acremonium alkalophilum CBS114.92GH25溶菌酶的结构的三维模型以及同源结构(例如上述溶菌酶的变体)的三维模型。
[0046]定义
[0047]溶菌酶:在此将术语“溶菌酶”活性定义为一种催化两个或更多个碳水化合物之间、或碳水化合物与非碳水化合物部分之间的糖苷键的水解的O-糖基水解酶。溶菌酶裂解细菌细胞壁的黏多糖和黏肽中的某些残基之间的糖苷键,例如在肽聚糖中的N-乙酰胞壁酸与N-乙酰-D-葡糖胺残基之间以及在壳糊精中的N-乙酰-D-葡糖胺残基之间的1,4- β -键,这导致溶菌作用。溶菌酶属于EC3.2.1.17酶类。出于本发明的目的,根据描述于实例4中的浊度测定确定溶菌酶活性。在一个方面中,本发明的多肽具有至少20%,例如至少40 %、至少50 %、至少60 %、至少70 %、至少80 %、至少90 %、至少95 %、或至少100 %的SEQ ID Ν0:4或SEQ ID Ν0:8的成熟多肽的溶菌酶活性。[0048]等位变体:术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种可变形式中的任何。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是沉默的(编码的多肽中无改变),或可以编码出具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
[0049]抗微生物活性:在此将术语“抗微生物活性”定义为一种杀死微生物或抑制微生物的生长的活性,这些微生物是例如藻类、古细菌、细菌、真菌和/或原生动物。抗微生物活性可以是例如意在杀死细菌的杀菌的或意在阻止细菌的生长的抑菌的。抗微生物活性可以包括催化在肽聚糖中的N-乙酰胞壁酸与N-乙酰-D-葡糖胺残基之间以及在壳糊精中的N-乙酰-D-葡糖胺残基之间的1,4-β-键的水解。抗微生物活性还可以包括溶菌酶结合在微生物的表面并抑制其生长。抗微生物作用还可以包括通过抑制或减少细菌毒素并且通过噬菌素作用使用本发明的溶菌酶作为免疫刺激剂激活细菌自溶素。出于本发明的目的,根据描述于实例10中的抗微生物测定确定抗微生物活性。
[0050]改变的/修饰的特性:在此将“改变的/修饰的特性”定义为与相对于亲本溶菌酶或鉴别的参考序列相比被改变或修饰的变体相关的特征。除非另行说明,改变的或修饰的特性可以是一种与相对于另一种参考溶菌酶或亲本溶菌酶被改进的变体相关的特征。下面给出了可以被改变/修饰或改进的特性的实例。
[0051]热稳定性:术语“热稳定性”是指相对于亲本或鉴别的参考序列在升高的温度下,在缓冲液中或在例如在产品储存/运输过程中存在的那些条件下或类似于在工业使用该变体的过程中存在的那些条件下,在一段孵育期后的溶菌酶活性。变体可以或可以不展示出相对于亲本的改变的热活性曲线。在一个方面中,在选定的温度下,具有溶菌酶活性的变体的热稳定性是亲本或参考序列热稳定性的至少1.0倍,例如至少1.1倍、至少1.5倍、至少1.8倍、至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、以及至少25倍。优选地,使用描述于“材料与方法”部分中的溶菌酶浊度活性测定测试该活性。
[0052]温度曲线/温度稳定性:术语“温度曲线/温度稳定性”是指与亲本或鉴别的参考序列相比,该变体酶显示出改变的温度曲线,其中将该温度曲线确定为作为温度的函数的溶菌酶活性。优选地,将在每一温度下的活性表示为标准化至在最适温度下的值的相对活性(以% )。最适温度是在被测试温度(即具有5°C -10°C跳跃的那些)内该活性最高的温度。
[0053]pH稳定性:术语“pH稳定性”是指在超出该酶在其中有活性的pH范围(pH活性范围)的PH下,在一段孵育期后,变体酶展示出相对于亲本或鉴别的参考序列的结构稳定性。这样的一种变体可以或可以不展示出相对于亲本的改变的PH活性曲线。例如,该变体在增加的或降低的PH下可以是没活性的,但是能够保持其三维结构并且然后一旦它被回复到PH活性范围便恢复活性。可替代地,在增加的或降低的pH下孵育后,该变体可以具有相对于亲本的改进的复性能力。
[0054]在一个方面中 ,pH稳定性曲线被改变,这样使得溶菌酶变体在酸性pH下具有改进的稳定性。如在此使用,酸性pH意指从pH2至5.5,优选是从2.5至5.25,更优选是从3至
5,甚至更优选是从3.5至4。优选地,当在给定的pH下孵育I小时后,当与已经在pH6.5下维持相同的时间的变体相比时,该变体溶菌酶维持至少40%,优选是至少50%、60%、70%或80 %,更优选是至少90 %,甚至更优选是至少95 %的残余活性。优选地,该变体溶菌酶的残余活性比已经在相同条件下处理的亲本溶菌酶或鉴别的参考序列的残余活性高至少1.1倍、至少1.3倍、至少1.5倍,优选是至少2倍,更优选是至少5倍,最优选是至少7倍,并且甚至最优选是至少10倍。优选地,使用描述于“材料与方法”部分中的溶菌酶浊度活性测定测试该活性。
[0055]pH活性:在此将术语“pH活性”定义为当与亲本溶菌酶或鉴别的参考序列的pH活性曲线相比时,变体溶菌酶展示出pH依赖性活性曲线的改变。pH活性曲线提供了在给定的条件(例如温度和溶剂成分)下,在PH范围内该酶在阻止微生物生长、消除微生物细胞和/或催化水解反应中的效率的量度。溶菌酶具有特定的PH范围,在该范围内该多肽是稳定的并且保留其酶活性,超出这一范围,该溶菌酶变得不具有活性并且可能也不稳定。在该PH范围内通常存在该溶菌酶显示出最高活性的pH最佳值。
[0056]在碱性pH(例如从pH7.5至12,优选是从8至11,更优选是从8.5至10,甚至更优选是从9至9.5)下具有改进的活性的溶菌酶变体将能够在更具碱性的环境(例如洗涤剂)中起作用。
[0057]在酸性pH(例如从pH2至6.5,优选是从2.5至6,更优选是从3至5.5,甚至更优选是从3.5至5)下具有改进的活性的变体将能够在更具酸性的条件(例如在某些食物中的防腐剂)下起作用。
[0058]在中性或弱酸性pH(如从pH4至7.0,优选是从4.5至6.5,更优选是从5至6.5)下具有改进的活性的变体将能够在弱酸性或中性条件下起作用,例如用于饲料中的益生分子,来稳定动物的健康微生物菌落或通过抑制动物的GI道中的病毒性病原体、寄生虫病原体或细菌性病原体的生长/肠道定植(intestinal colonization)。
[0059]在一个方面中,pH活性曲线被改变,这样使得溶菌酶变体在更具碱性的pH下具有改进的活性。优选地,在高至少0.5个单位、优选高至少1.0pH单位、更优选高至少1.5pH单位、甚至更优选的高至少2.0pH单位的pH下,该溶菌酶变体的活性比亲本酶或鉴别的参考序列的活性高至少1.1倍、优选是至少1.5倍、更优选是至少2倍、甚至更优选是至少5倍并且最优选是至少10倍。优选地,该溶菌酶变体在相同时间维持亲本溶菌酶或鉴别的参考序列在其pH最佳值下展示出的至少40 %,优选是至少50 %、60 %、70 %或80 %、或90 %,更优选是至少95%,甚至更优选是至少100%的活性。优选地,使用描述于“材料与方法”部分中的溶菌酶浊度活性测定测试该活性。
[0060]在另一个方面中,pH活性曲线被改变,这样使得溶菌酶变体在更具酸性的pH下具有改进的活性。优选地,在低至少0.5个单位、优选低至少1.0pH单位、更优选低至少1.5pH单位、甚至更优选的低至少2.0pH单位的pH下,该溶菌酶变体的活性比亲本酶或鉴别的参考序列的活性高至少1.1倍、优选是至少1.5倍、更优选是至少2倍、甚至更优选是至少5倍并且最优选是至少10倍。优选地,该溶菌酶变体在相同时间维持亲本溶菌酶或鉴别的参考序列在其pH最佳值下展示出的至少40 %,优选是至少50 %、60 %、70 %或80 %、或90 %,更优选是至少95%,甚至更优选是至少100%的活性。优选地,使用描述于“材料与方法”部分中的溶菌酶浊度活性测定测试该活性。
[0061] 底物特异性:术语“底物特异性”是指对于该溶菌酶可以杀死/抑制的细菌的类型和/或关于模型溶菌酶底物(例如P-NP- (NAG-NAM) η或p_NP_ (NAG) m寡聚体)的该溶菌酶的特异性。通过修饰该溶菌酶的底物特异性,可以改变该溶菌酶可以杀死和/或抑制的细菌的类型。在一个方面中,将该溶菌酶的底物特异性拓宽,由此允许杀死和/或抑制除了野生型溶菌酶可以杀死和/或抑制的细菌以外的其他类型的细菌。
[0062]糖化作用敏感性:非酶的糖化作用是一种自发的翻译后过程,其中还原糖共价地结合至主要在赖氨酸(K)残基上的蛋白质中的游离氨基基团。糖化作用可以影响溶菌酶的活性。根据本发明,可以通过指定的氨基酸改变来减少溶菌酶对非酶的糖化作用的敏感性。
[0063]改进的特性还可以包括热特性,例如造粒稳定性、蒸汽稳定性、更宽的温度活性曲线。另外的改进的特性可以包括蛋白酶灵敏度、和/或糖基化模式。优选地,关于所希望的应用条件评估改进。
[0064] 催化结构域:术语“催化结构域”是指含有酶的催化机构的酶的区域。
[0065]cDNA:术语“cDNA”是指可以通过得自真核或原核细胞的成熟的、剪接的mRNA分子的反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
[0066]编码序列:术语“编码序列”是指多核苷酸,其直接明确多肽的氨基酸序列。编码序列的边界通常由开放读码框确定,其以起始密码子例如ATG、GTG或TTG开始,并以终止密码子例如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
[0067]控制序列:术语“控制序列”是指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。各个控制序列可以相对于编码多肽的多核苷酸是原生的(native)(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是原生的或外源的。这样的控制序列包括但不局限于前导子,聚腺苷酸化序列,前肽序列,启动子,信号肽序列,和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。可以为这些控制序列提供为了特定限制性位点引入的接头,从而促进这些控制序列与编码多肽的多核苷酸编码区连接。
[0068]表达:术语“表达”包括产生多肽涉及的任何步骤,包括但不局限于:转录、转录后修饰、翻译、翻译后修饰、和分泌。
[0069]表达载体:术语“表达载体”是指包括编码多肽的多核苷酸并且可操作地与提供了其表达的控制序列相连接的线性或环状DNA分子。
[0070]片段:术语“片段”意指具有从成熟多肽或结构域的氨基和/或羧基端缺失的一个或多个(例如,若干个)氨基酸的多肽或催化结构域;其中,该片段具有溶菌酶活性。在一个方面中,片段包含至少184个氨基酸残基(例如,SEQ ID NO:4的氨基酸25至208)、或至少195个氨基酸残基(例如,SEQ ID N0:4的氨基酸22至216)。在另外的方面中,片段包含至少184个氨基酸残基(例如,SEQ ID NO:8的氨基酸10至193)、或至少195个氨基酸残基(例如,SEQ ID NO:8的氨基酸5至199)。
[0071]宿主细胞:术语“宿主细胞”是指对转化、转染、转导等敏感的任何细胞类型,其具有包含本发明的多核苷酸的核酸构建体或表达载体。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。
[0072]分离的:术语“分离的”是指处于非天然出现的形式或环境中的物质。分离的物质的非限制性实例包括(I)任何非天然出现的物质,(2)任何物质,包括但不限于从与其性质上相关的一种或多种或所有天然发生的组分至少部分地移除的任何酶、变体、核酸、蛋白质、肽或辅因子;⑶相对于自然中发现的物质,由人手工修饰的物质;或⑷通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如编码该物质的基因的多个拷贝;使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中。
[0073]成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰(例如N-末端加工、C-末端截短、糖基化、磷酸化等)之后处于其最终形式的多肽。在一个方面中,基于预测SEQID NO:4的氨基酸I至19和SEQ ID NO:8的氨基酸-40至-18是信号肽的SignalP程序(Nielsen(尼尔森)等人,1997,Protein Engineering(蛋白质工程)10:1-6),该成熟多肽是SEQ ID NO:4的氨基酸20至227或SEQ ID NO:8的氨基酸I至208。本领域已知,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽的混合物(即,具有不同的C末端和/或N末端氨基酸)。
[0074]成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有溶菌酶活性的成熟多肽的多核苷酸。在一个方面中,基于预测SEQ ID NO:3的核苷酸I至57和SEQ ID NO:7的核苷酸I至69编码信号肽的SignalP程序(尼尔森等人,1997,同上),该成熟多肽编码序列是SEQ ID NO: 3的核苷酸58至147和核苷酸302至835与SEQ ID NO: 7的核苷酸121至744的结合序列。
[0075]核酸构建体:术语“核酸构建体”意指从天然存在的基因中分离的、或以自然中不会另外出现的方式被修饰成包含核酸区段的、或合成的单链亦或双链的核酸分子,它包含一个或多个控制序列。
[0076]可操作地连接:术语“可操作地连接”是指一种配置,其中控制序列位于相对于多核苷酸的编码序列的适当位置处,这样使得该控制序列指导该编码序列的表达。
[0077]序列一致性:用参 数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
[0078]出于本发明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁施,1970,J.Mol.Biol.(《分子生物学杂志》)48:443-453)来确定两个氨基酸序列之间的序列一致性,该算法如 EMBOSS 软件包(EMBOSS:The European Molecular Biology OpenSoftware Suite (欧洲分子生物学开放软件套件),Rice (赖斯)等人,2000, Trends Genet.(《遗传学趋势》)16:276-277)(优选5.0.0版或更新版本)的Needle程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分0.5,以及EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩阵。标记为“最长一致性”的Needle (尼德尔)的输出(使用-nobrief选项获得)被用作百分比一致性并且被计算如下:
[0079](一致的残基X 100)/(比对长度-比对中的空位总数)
[0080]出于本发明的目的,使用尼德曼-翁施算法(尼德曼和翁施,1970,同上)确定两个脱氧核糖核苷酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:TheEuropean Molecular Biology Open Software Suite (欧洲分子生物学开放软件套件),赖斯等人,2000,同上)(优选5.0.0版或更新版本)的Needle程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。标记为“最长一致性”的Needle (尼德尔)的输出(使用-nobrief选项获得)被用作百分比一致性并且被计算如下:
[0081](一致的脱氧核糖核酸X 100)/(比对长度-比对中的空位总数)。[0082]严谨度条件:如下定义不同的严谨度条件。
[0083]术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS,200毫克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2% SDS’在45°C下洗涤三次,每次15分钟。
[0084]术语“低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5XSSPE、0.3% SDS,200毫克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2% SDS,在50°C下洗涤三次,每 次15分钟。
[0085]术语“中严谨度条件”意指对于至少100个核苷酸长度的探针而言,遵循标准DNA印迹程序,在42°C在5X SSPE、0.3% SDS,200微克/ml剪切和变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、0.2% SDS,在55°C下洗涤三次,每次15分钟。
[0086]术语“中-高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、0.2% SDS,在60°C下洗涤三次,每次15分钟。
[0087]术语“高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA 印迹(Southern blotting)程序,在 42°C下在 5XSSPE、0.3% SDS,200 毫克 /ml 剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC,0.2% SDS,在65°C下洗涤三次,每次15分钟。
[0088]术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS,200毫克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2% SDS’在70°C下洗涤三次,每次15分钟。
[0089]子序列:术语“子序列”是指具有从成熟多肽编码序列的5’和/或3’端缺失的一个或多个(例如,若干个)核苷酸的多核苷酸;其中子序列编码具有溶菌酶活性的片段。在一个方面中,一个子序列包含至少552个核苷酸(例如,SEQ ID NO: 3的核苷酸73至147和核苷酸302至778的连接序列),或至少585个核苷酸(例如,SEQ ID NO: 3的核苷酸64至147和核苷酸302至802的连接序列)。在一个另外的方面中,一个子序列包含至少552个核苷酸(例如,SEQ ID NO: 7的核苷酸148至699的序列),或至少585个核苷酸(例如,SEQ ID NO:7的核苷酸133至717的序列)。
[0090]基本上纯的多核苷酸:术语“基本上纯的多核苷酸”意指不含其他外来的或不需要的核苷酸的多核苷酸制剂,并且处于适合在基因工程多肽生产系统内使用的形式。因此,基本上纯的多核苷酸包含按重量计至多10%、至多8%、至多6%、至多5%、至多4%、至多3%、至多2%、至多1%、以及至多0.5%的其他该多核苷酸与其天然地或重组地相关的多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选地,该多核苷酸按重量计至少90%纯,例如至少92%纯、至少94%纯、至少95 %纯、至少96 %纯、至少97 %纯、至少98 %纯、至少99 %纯、以及至少99.5 %纯。优选的是本发明的多核苷酸以实质上纯的形式存在。
[0091]基本上纯的多肽:术语“基本上纯的多肽”意指包含按重量计至多10%、至多8%、至多6%、至多5%、至多4%、至多3%、至多2%、至多1%、以及至多0.5%的其他该多肽与其天然地或重组地相关的多肽材料的多肽。优选地,该多肽按存在于该制剂中的总的多肽材料的重量计至少92%纯,例如至少94%纯、至少95%纯、至少96%纯、至少97%纯、至少98%纯、至少99%、至少99.5%纯、以及100%纯。优选的是本发明的多肽以基本上纯的形式存在。例如,这可以通过采用众所周知的重组方法或采用经典的纯化方法制备多肽来完成。
[0092]变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括一个或多个(若干个)氨基酸残基的改变(即,取代、插入、和/或缺失)的具有溶菌酶活性的一个多肽。取代意指占据一个位置的氨基酸被一个不同的氨基酸替代;缺失意指占据一个位置的氨基酸的移除;并且插入意指邻近于并且紧跟着占据位置的氨基酸之后添加I个、2个或3个氨基酸。根据本发明的变体可以包括从I个至5个;从I个至10个;从I个至15个;从I个至20个;从I个至25个;从I个至30个;从I个至35个;从I个至40个;从I个至45个;从即I个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个或45个改变。
[0093]本发明的这些变体具有至少一个选自下组的改变/修饰,该组由以下位置编号组成:6、10、11、28、30、33、37、39、59、60、61、62、63、92、93、94、96、98、99、100、101、106、133、134、135、136、137、139、140、142、143、158、161、162、178、183 和 / 或 190,其中该位置对应于在SEQ ID N0:8的成熟序列中的位置。该变体多肽序列优选是一种在自然界中未发现的多肽。
[0094]野生型溶菌酶:术语“野生型”溶菌酶意指由天然存在的微生物(例如在自然界中发现的细菌、酵母或丝状真菌)表达的一种溶菌酶。
[0095]用于变体命名的规则
[0096]出于本发明的目的,使用在SEQ ID N0:8中披露的成熟多肽来确定另一种溶菌酶中的相应氨基酸残基。将另一种溶菌酶的氨基酸序列与SEQ ID N0:8中披露的成熟多肽进行比对,并且基于该比对,使用尼德曼-翁施算法(尼德曼和翁施,1970,《分子生物学杂志》48:443-453)来确定与SEQ ID NO: 8中披露的成熟多肽的任何氨基酸残基相对应的氨基酸位置编号,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,《遗传学趋势》16:276-277)(优选5.0.0版或更新版本)的Needle程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分0.5,以及EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩阵。标记为“最长一致性“的Needle (尼德尔)的输出(使用-nobrief选项获得)被用作百分比一致性并且被计算如下:(一致的残基X 100)/(比对长度-比对中的空位总数)。将尼德曼-翁施算法用于序列比较并且用于计算序列一致性。
[0097]可以使用若干计算机程序通过多种多肽序列的比对来确定在另一种溶菌酶中的对应氨基酸残基的识别,这些计算机程序包括,但不限于:MUSCLE(multiple sequencecomparison by log - expectation (基于日志-期望值的多序列比较);版本3.5或更新版本;Edgar (埃德加),2004, Nucleic Acids Research (《核酸研究》)32:1792-1797),MAFFT (版本6.857或更新版本;Katoh(卡托赫)和Kuma(库玛),2002, NucleicAcids Research (《核酸研究》)30: 3O59-3O66 ;Katoh (卡托赫)等人,2005, NucleicAcids Research(《核酸研究》)33:5Il-5I8 ;Katoh(卡托赫)和 Toh(都),2007,Bioinformatics (《生物信息学》)23:372-374 ;Katoh (卡托赫)等人,2009, Methods inMolecular Biology (《分子生物学方法》)537:39-64 ;Katoh (卡托赫)和Toh (都),2010,Bioinformatics (《生物信息学》)26:1899-1900),以及利用 ClustalW 的 EMBOSSEMMA (1.83 或更新版本;Thompson (汤普森)等人,1"4, Nucleic Acids Research (《核酸研究》)22:4673-4680),使用它们各自的缺省参数。
[0098]当其他酶与SEQ ID N0:8的成熟多肽分歧,使得传统基于序列的比较不能检测其关系(Lindahl(林达尔)和Elofsson (埃洛弗松),2000,J.Mol.Biol.(《分子生物学杂志》)295:613-615)时,可以使用其他成对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(特征曲线)来搜索数据库。例如,PS1-BLAST程序通过一个迭代数据库搜索过程来产生多个轮廓并且能够检测远距离同源物(Atschul (阿特休尔)等人,1997,《核酸研究》25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏度。程序(例如 GenTHREADER) (Jones (琼斯),1999,《分子生物学杂志》287:797-815 ;McGuff i (麦谷芬)和琼斯,2003,《生物信息学》19:874-881)利用来自多种来源(PS1-BLAST,二级结构预测、结构比对轮廓、以及溶剂化可能性)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,Gough (高夫)等人,2000,《分子生物学杂志》313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评定这类模型的准确度。
[0099]对于已知结构的蛋白,若干工具和资源可用于检索并产生结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。使用多种算法(例如距离比对矩阵(Holm(赫尔姆)和Sander (桑德尔),1998, Proteins (《蛋白杂志》)33:88-96)或者组合扩展(Shindyalov (辛迪亚洛夫)和Bourne (伯恩),1998,《蛋白质工程》11: 739-747))可以比对两个或更多个蛋白结构,并且可以额外利用这些算法的实施来随所感兴趣的结构查询结构数据库以便发现可能的结构同源物(例如,赫尔姆和Park(帕克),2000,《生物信息学》16:566-567)。
[0100]在描述本发明的变体中,以下所述的命名法适于引用方便。采用了已接受的IUPAC
单个字母和三字母的氨基酸缩写。
[0101]取代:对于氨基酸取代,使用了以下命名法:原始氨基酸、位置、取代的氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代被表示为“Thr226Ala”或者“T226A”。多个突变由加号(“ + ”)分开,例如“Gly205Arg+Ser411Phe”或者“G205R+S411F”代表分别在位置205和位置411上甘氨酸(G)被精氨酸(R)并且丝氨酸(S)被苯丙氨酸(F)取代。 [0102]缺失:对于氨基酸缺失,使用了以下命名法。原始氨基酸、位置、*。因此,在位置195上的甘氨酸缺失被表示为“Glyl95*”或者“G195*”。多个缺失由加号(“ + ”)分开,例如 “Glyl95*+Ser411*,,或 “G195*+S411*,,。[0103]插入:对于氨基酸插入,使用了以下命名法:原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此,在位置195上的甘氨酸之后插入赖氨酸被表示为“Glyl95GlyLys”或者“G195GK”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2 ;等]。例如,在位置195上的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Glyl95GlyLysAla” 或者 “G195GKA”。
[0104]在这类情况下,通过将小写字母添加到在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此将是:
[0105]
【权利要求】
1.一种具有溶菌酶活性的分离的多肽,该多肽选自下组,该组由以下各项组成: (a)与SEQID NO: 4的成熟多肽或SEQ ID NO: 8的成熟多肽具有至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的一种多肽; (b)由以下一种多核苷酸编码的一种多肽,该多核苷酸与SEQID NO: 3的成熟多肽编码序列或SEQ ID NO:7的成熟多肽编码序列具有至少80%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性; (c)由以下一种多核苷酸编码的一种多肽,该多核苷酸在中-高严谨度条件下与SEQID NO:3或SEQ ID NO:7的成熟多肽编码序列、或其全长互补体杂交; (d)SEQID N0:4或SEQ ID NO:8的成熟多肽的一种变体,该变体在一个或多个(例如,若干个)位置处包括取代、缺失和/或插入;以及 (e)具有溶菌酶活性的(a)、(b)、(c)或(d)的多肽的一个片段。
2.如权利要求1所述的多肽,选自包括SEQID N0:4或SEQ ID NO:8或者SEQ ID NO:4或SEQ ID NO:8的成熟多肽或由其组成的多肽。
3.如权利要求2所述的多肽,其中该成熟多肽选自SEQID NO: 4的氨基酸20至227或SEQ ID NO:8的氨基酸I至208。
4.如权利要求1-3中任一项所述的多肽,该多肽是SEQID N0:4或SEQ ID NO:8的成熟多肽的一种变体,该变体在一个或多个(若干个)位置处包括取代、缺失、和/或插入。
5.一种组合物,该组合物包括如权利要求1-4中任一项所述的多肽。
6.如权利要求5所述的组合物是一种洗涤剂组合物。
7.如权利要求6所述的用于衣物、餐具或清洁硬表面的洗涤剂组合物。
8.如权利要求6至7中任一项所述的洗涤剂组合物,其中该组合物包括一种或多种另外的选自下组的酶,该组包括蛋白酶、淀粉酶、脂肪酶、角质酶、纤维素酶、内切葡聚糖酶、木葡聚糖酶、果胶酶、果胶裂解酶、黄原胶酶、过氧化物酶、卤代过氧酶、过氧化氢酶和甘露聚糖酶、或其任何混合物。
9.如权利要求6至8中任一项所述的洗涤剂组合物,包括一种或多种选自下组的组分,该组包括表面活性剂、助洗剂、助水溶剂、漂白系统、聚合物、织物调色剂、辅料、分散剂、染料转移抑制剂、荧光增白剂、污物释放聚合物以及抗再沉积剂。
10.一种动物饲料组合物,该组合物包括如权利要求1-4中任一项所述的多肽。
11.如权利要求10所述的动物饲料组合物,该组合物进一步包括以下各项中的一种或多种:淀粉酶;植酸酶;木聚糖酶;半乳聚糖酶;α -半乳糖苷酶;蛋白酶,磷脂酶,β -葡聚糖酶,或其任何混合物。
12.—种动物饲料添加剂,包括 至少一种如权利要求1-4中任一项所述的多肽;以及 至少一种脂溶性维生素,和/或 至少一种水溶性维生素,和/或 至少一种痕量矿物质。
13.如权利要求12所述的动物饲料添加剂,进一步包括以下各项中的一种或多种:淀粉酶;植酸酶;木聚糖酶;半乳聚糖酶;α-半乳糖苷酶;蛋白酶,磷脂酶,β-葡聚糖酶,或其任何混合物。
14.如权利要求5所述的组合物,是一种细菌基因组DNA提取组合物。
15.如权利要求14所述的细菌基因组DNA提取组合物,其中该组合物另外包括一种或多种另外的溶菌酶。
16.根据权利要求1-4中任一项所述的多肽作为一种生物膜形成的抑制剂的用途。
17.根据权利要求1-4中任一项所述的多肽在一种牙科组合物中的用途。
18.根据权利要求1-4中任一项所述的多肽在一种洗涤剂组合物中的用途。
19.根据权利要求1-4中任一项所述的多肽在动物饲料中的用途。
20.根据权利要求1-4中任一项所述的多肽用于分解细菌的细胞壁的用途。
21.如权利要求20所述的多肽,其中该多肽在用于从细菌分离DNA的工艺中使用。
22.—种从细菌分离DNA的方法,包括: (a)用如权利要求1-4中任一项所述的多肽处理该分离的细菌;并且 (b)回收该细菌DNA。
23.—种分离的多核苷酸,该多核苷酸编码如权利要求1-4中任一项所述的多肽。
24.一种核酸构建体或表达载体,包括可操作地连接至一个或多个控制序列的如权利要求23所述的多核苷酸,该一个或多个控制序列指导该多肽在一种表达宿主中的产生。
25.一种重组宿主细胞,包括可操作地连接至一个或多个控制序列的如权利要求23所述的多核苷酸,该一个或多个控制序列指导该多肽的产生。
26.—种产生如权利要求1-4中任一项所述的多肽的方法,该方法包括: (a)培养一种细胞,该细胞以其野生型形式在有益于产生该多肽的条件下产生该多肽;并且 (b)回收该多肽。
27.—种产生具有溶菌酶活性的多肽的方法,该方法包括: (a)在有益于产生该多肽的条件下培养如权利要求25所述的宿主细胞;并且 (b)回收该多肽。
28.一种用编码如权利要求1-4中任一项所述的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
29.—种产生具有溶菌酶活性的多肽的方法,该方法包括: (a)在有益于产生该多肽的条件下培养如权利要求28所述的转基因植物或植物细胞;并且 (b)回收该多肽。
【文档编号】C12N9/36GK103957929SQ201280058088
【公开日】2014年7月30日 申请日期:2012年11月23日 优先权日:2011年11月25日
【发明者】K·M·施诺尔, J·E·尼尔森, M·克劳森 申请人:诺维信公司