枯草杆菌酶变体和编码它们的多核苷酸的制作方法
【专利摘要】本发明涉及多种蛋白酶变体以及用于获得蛋白酶变体的多种方法。本发明还涉及编码这些变体的多核苷酸;包含这些多核苷酸的核酸构建体、载体、以及宿主细胞;以及使用这些变体的方法。
【专利说明】枯草杆菌酶变体和编码它们的多核苷酸[000? ] 序列表的引用
[0002]本申请含有一个计算机可读形式的序列表,该序列表通过引用结合在此。
[0003]发明背景
发明领域
[0004]本发明涉及相对于亲本枯草杆菌酶在一种或多种特性中展示变化的多种新蛋白酶变体,所述特性包括:洗涤性能、热稳定性、存储稳定性或催化活性。本发明的这些变体适合用于例如清洁剂或洗涤剂组合物中,如衣物洗涤剂组合物和餐具洗涤剂组合物,包括自动餐具洗涤剂组合物。本发明还涉及编码这些变体的分离的DNA序列、表达载体、宿主细胞以及用于产生和使用本发明变体的方法。此外,本发明涉及含有本发明变体的清洁剂和洗涤剂组合物。
[0005]相关技术说明
[0006]在洗涤剂工业中,酶在洗涤配制品中的应用已经超过30年。用于此类配制品的酶包括蛋白酶、脂肪酶、淀粉酶、纤维素酶、甘露糖苷酶以及其他酶或其混合物。商业上最重要的酶是蛋白酶。
[0007]越来越多商业上使用的蛋白酶是天然存在的野生型蛋白酶的蛋白质工程化变体, Everlase?、Relase ?、Coronase?、Liquanase \ Ovozymex、PolarzymeR
和 Kannase?丨(诺维信公司(Novozymes A/s))、Maxacal?,Properase?^Purafect?,
FN2'FN3?以及FN4? (杜邦/杰能科国际公司(DuPont/Genencorinternational, Inc.))。
[0008]此外,本领域描述了多种变体,如在WO 2004/041979(诺维信公司)中描述了相对于亲本枯草杆菌酶在例如洗涤性能、热稳定性、存储稳定性或催化活性方面展示变化的多种枯草杆菌酶变体。这些变体适合用于在例如清洁剂或洗涤剂组合物中使用。
[0009]已描述多种有用的枯草杆菌酶变体,其中很多已提供在不同洗涤剂中的改进活性、稳定性以及溶解度。US 6,436,690 (布罗德三世(Brode III)等人)描述了在环59至66(BPN,编号)中的变化,在WO 2009/149200(丹尼斯克公司(Danisco US INC.))中描述了在位置53和55(BPN’编号)处的取代。此外,WO 2002/31133 (诺维信公司)描述了环51-56 (BPN^编号)中的插入。然而,多种因素造成进一步改进蛋白酶是有利的。洗涤条件例如就温度和PH而言不断发生变化,并且很多污物仍难以在常规洗涤条件下被完全除去。因此,尽管在蛋白酶开发方面已有深入研究,但仍然存在对新的改进蛋白酶的需要。
[0010]因此,本发明的一个目的在于提供一种蛋白酶的与其亲本蛋白酶相比具有改进特性的多种变体。
[0011]发明概述
[0012]本发明涉及在与具有SEQ ID NO: 2的成熟多肽的位置53、54、55、56、以及57相对应的一个或多个(例如,若干个)位置上包含一个变化的多种蛋白酶变体,其中该变体具有蛋白酶活性并且其中这些变体具有与SEQ ID N0:2至少65%—致的氨基酸序列。
[0013]本发明还涉及一种用于获得一种蛋白酶变体的方法,该方法包括在亲本枯草杆菌酶的与具有SEQ ID NO: 2的成熟多肽的位置53、54、55、56、以及57相对应的一个或多个位置引入一个缺失,其中该变体具有与SEQ ID NO: 2至少65%—致的氨基酸序列;以及回收该变体。本发明还涉及编码这些变体的分离的多核苷酸;包含这些多核苷酸的核酸构建体、载体、以及宿主细胞;以及产生这些变体的方法。
[0014]定义
[0015]蛋白酶:术语“蛋白酶”在此被定义为水解肽键的酶。它包括任何属于EC3.4酶组的酶(包括其13个亚类中的每一种)。EC编号是指来自加利福尼亚州(California),圣地哥(San Diego),学术出版社(Academic Press)的NC-1UBMB的酶命名法1992,包括分别在欧洲生物化学杂志(Eur.J.Biochem.) 1994,223,1-5 ;欧洲生物化学杂志1995,232,1-6 ;欧洲生物化学杂志1996,237,1-5 ;欧洲生物化学杂志1997,250, 1_6 ;以及欧洲生物化学杂志1999,264,610-650中公开的补充文献I至5。 [0016]蛋白酶活性:术语“蛋白酶活性”意指蛋白质分解活性(EC3.4)。本发明的蛋白酶是内肽酶(EC3.4.21)。存在若干蛋白酶活性类型:三种主要活性类型是:其中在Pl的Arg或Lys之后存在酰胺底物裂解的胰蛋白酶样活性、其中在Pl的多个疏水氨基酸中的一个之后发生裂解的糜蛋白酶样活性、以及其中在Pl的Ala之后裂解的弹性蛋白酶样活性。出于本发明的目的,根据以下“材料与方法(Materials and Methods) ”所述的程序确定蛋白酶活性。本发明的这些枯草杆菌酶变体具有SEQ ID NO:2的成熟多肽的至少20%、例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、以及至少100%的蛋白酶活性。
[0017]等位基因变体:术语“等位基因变体”意指基因的占据相同染色体基因座的两种或更多种可替代形式中的任一种。等位基因变异通过突变天然地发生,并且可以导致种群内的多态性。基因突变可以是沉默的(在所编码的多肽中没有变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
[0018]cDNA:术语“cDNA”意指可以通过从得自原核或真核细胞的成熟的、剪接的mRNA分子反转录来制备的DNA分子。cDNA缺乏可以存在于相应基因组DNA中的内含子序列。起始的、初级的RNA转录物是mRNA的前体,其通过包括剪接的一系列步骤加工,然后作为成熟的已剪接的mRNA出现。
[0019]编码序列:术语“编码序列”意指直接指明其多肽产物的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架通常以ATG起始密码子或替代性起始密码子(例如GTG和TTG)开始,并且以终止密码子(例如TAA、TAG、和TGA)结束。编码序列可以是DNA、cDNA、合成或重组的多核苷酸。
[0020]控制序列:术语“控制序列”意指对于表达编码本发明变体的多核苷酸所必需的所有部件。每个控制序列对于编码变体的多核苷酸可以是天然的或外源的,或者彼此可以是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。为了引入特异性限制位点以便促进控制序列与编码变体的多核苷酸的编码区的连接,控制序列可以带有接头。[0021]表达:术语“表达”包括涉及变体产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
[0022]表达载体:术语“表达载体”意指包含编码一种变体的一种多核苷酸并可操作地连接至提供其表达的额外核苷酸的线性或环形DNA分子。
[0023]高严谨度条件:术语“高严谨度条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹法(Southernblotting)程序,在42°C下在5X SSPE.0.3% SDS、200 μ g/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2% SDS在65°C下将载体材料洗涤三次,每次15分钟。
[0024]宿主细胞:术语“宿主细胞”意指对于用包含本发明多核苷酸的核酸构建体或表达载体进行的转化、转染、转导等是易感的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
[0025]改进的特性:术语“改进的特性”意指与一种变体有关的特征,该特征相比于亲本、或者相比于具有SEQ ID N0:2的蛋白酶、或者相比于具有与所述变体一致的氨基酸序列但是在一个或多个所述指定位置不具有变化的蛋白酶有所改进。此类改进的特性包括但不限于洗涤性能、蛋白酶活性、热活性曲线、热稳定性、PH活性曲线、pH稳定性、底物/辅因子特异性、改善的表面特性、底物特异性、产物特异性、增加的稳定性、在存储条件下的改进的稳定性、以及化学稳定性。
[0026]改进的洗涤性能:术语“改进的洗涤性能”在此被定义为一种蛋白酶变体例如通过增强的去污能力(这是特别优选的)而相对于亲本枯草杆菌酶变体、相对于具有SEQ IDNO:2的蛋白酶、或者相对于具有与所述变体一致的氨基酸序列但是在一个或多个所述指定位置不具有变化的蛋白酶的洗涤性能展示蛋白酶变体的洗涤性能的变化。术语“洗涤性能”包括在衣物洗涤并且例如在餐具洗涤中的洗涤性能。洗涤性能可以被量化,如在此的“洗涤性能”定义下所描述的。
[0027]改进的蛋白酶活性:术语“改进的蛋白酶活性”在此被定义为通过增加的蛋白质转化而相对于(相比于)亲本枯草杆菌酶、或相比于具有SEQ ID NO:2的蛋白酶、或者相对于具有与所述变体一致的氨基酸序列但是在一个或多个所述指定位置不具有变化的蛋白酶的活性展示活性改变的蛋白酶变体的改变的蛋白酶活性(如上文所定义的)。
[0028]改进的热活性:术语“改进的热活性”意指一种变体在特定温度下相对于亲本或相对于具有SEQ ID N0:2的蛋白酶的温度依赖的活性曲线展示改变的温度依赖的活性曲线。热活性值提供了变体在一定温度范围内增强水解反应的催化的效率的测量。在特定温度范围内一种变体是稳定的并且保留其活性,但是随着温度增加而变得不太稳定并且因此活性有所降低。此外,由一种变体催化的初始反应速率可以通过增加温度来加速,这通过确定该变体的热活性来测量。一种具有较大热活性的变体将引起一种酶组合物在增强底物水解速率方面的增加,从而减少所需要的时间和/或降低活性所需要的酶浓度。可替代地,具有减小的热活性的一种变体将 在比由亲本的温度依赖活性曲线定义的亲本的最佳温度更低的温度下提高酶促反应。
[0029]分离的变体:术语“分离的变体”意指通过人工修饰的变体。在一个方面,如通过SDS-PAGE确定的,该变体是至少I %纯的、例如至少5%纯的、至少10%纯的、至少20%纯的、至少40%纯的、至少60%纯的、至少80%纯的、以及至少90%纯的。[0030]分离的多核苷酸:术语“分离的多核苷酸”意指通过人工修饰的多核苷酸。在一个方面,如通过琼脂糖电泳法确定的,该分离的多核苷酸是至少1%纯的、例如至少5%纯的、至少10 %纯的、至少20 %纯的、至少40 %纯的、至少60 %纯的、至少80 %纯的、至少90 %纯的、以及至少95%纯的。多核苷酸可以是基因组的、cDNA、RNA、半合成、合成来源或其任何组合。
[0031]低严谨度条件:术语“低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS,200 μ g/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2% SDS在50°C下将载体材料洗涤三次,每次15分钟。
[0032]成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N末端加工、C末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面,该成熟多肽与具有SEQ ID NO:2的氨基酸序列对应。
[0033]成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有蛋白酶活性的成熟多肽的多核苷酸。在一个方面,成熟多肽编码序列是基于预测编码信号肽的SEQ IDNO:1的核苷酸I至90的SignalP(尼尔森(Nielsen)等人,1997,蛋白质工程(ProteinEngineering) 10:1-6)的 SEQ ID NO:1 的核苷酸 322 至 1146。
[0034]中严谨度条件:术语“中严谨度条件”意指对于至少100个核苷酸长度的探针而言,遵循标准DNA印迹程序,在42°C在5X SSPE、0.3% SDS,200 μ g/ml剪切和变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2% SDS在55°C下将载体材料洗涤三次 ,每次15分钟。
[0035]中-高严谨度条件:术语“中-高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在60°C下将载体材料洗涤三次,每次15分钟。
[0036]突变体:术语“突变体”意指编码变体的多核苷酸。
[0037]核酸构建体:术语“核酸构建体”意指从天然存在的基因中分离的、或以自然界中不会另外存在的方式被修饰成包含核酸片段的、或合成的单链或双链的核酸分子。当核酸构建体含有表达本发明编码序列所需要的控制序列时,术语核酸构建体与术语“表达盒”含义相同。
[0038]可操作地连接:术语“可操作地连接”意指如下构造,其中控制序列相对于多核苷酸的编码序列安置在适当位置,这样使得控制序列指导编码序列的表达。
[0039]亲本:术语“亲本”意指对其做出改变以产生本发明的酶变体的一种蛋白酶。因此,亲本是具有与所述变体一致的氨基酸序列但是在一个或多个所述指定位置不具有变化的一种蛋白酶。应理解,在上下文中,表述“具有一致氨基酸序列”与100%序列一致性有关。该亲本可以是天然存在的(野生型)多肽或其变体。在一个具体实施例中,该亲本是与具有SEQ ID NO:2的多肽具有至少60%的一致性、例如至少65%、至少70%、至少75%、至少80%、至少81 %、至少82%、至少83%、至少84%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的一致性的蛋白质。[0040]序列一致性:通过参数“序列一致性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。出于本发明的目的,使用在EMBOSS包(EMBOSS:欧洲分子生物学开发软件套(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet) 16:276-277)(优选版本3.0.0或更新版本)的尼德尔(Needle)程序中实施的尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁施,1970,分子生物学杂志(J.Mol.Biol.)48:443-453)确定两个氨基酸序列之间的序列一致性程度。可任选使用的参数是空位开放罚分(gap open penalty) 10、空位延伸罚分(gap extension penalty) 0.5、以及EBL0SUM62 (BL0SUM62的EMBOSS版)取代矩阵。使用尼德尔(Needle)标记的“最长一致性(longest identity) ”的输出(使用-nobrief选项获得)作为一致性百分比,并且计算如下:
[0041](一致的残基X100)/(比对长度-比对中的空位总数)。
[0042]出于本发明的目的,使用在EMBOSS包(EMBOSS:欧洲分子生物学开发软件套,赖斯等人,2000,同上)(优选版本3.0.0或更新版本)的尼德尔程序中实施的尼德曼-翁施算法(尼德曼和翁施,1970,同上)确定两个脱氧核糖核苷酸序列之间的序列一致性程度。可任选使用的参数是空位开放罚分10、空位延伸罚分0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用尼德尔标记的“最长一致性”的输出(使用-nobrief选项获得)作为一致性百分比,并且计算如下:
[0043](一致的脱氧核糖核苷酸X100)/(比对长度-比对中的空位总数)。 [0044]基本上纯的变体:术语“基本上纯的变体”意指包含按重量计至多10%、至多8%、至多6%、至多5%、至多4%、至多3%、至多2%、至多1%、以及至多0.5%的其他多肽材料的制剂,这些其他多肽材料是与其天然或重组地相关的。优选地,该变体按存在于制剂中的总多肽材料的重量计是至少92 %纯的,例如至少94%纯的、至少95 %纯的、至少96 %纯的、至少97 %纯的、至少98 %纯的、至少99 %纯的、至少99.5 %纯的、以及100 %纯的。本发明的变体优选以基本上纯的形式存在。例如,这可通过经由众所周知的重组方法或经由经典的纯化方法制备变体来完成。
[0045]变体:术语“变体”意指具有蛋白酶活性的相比于其亲本在一个或多个(或一个或若干个)位置包含一个变化即取代、插入、和/或缺失的多肽,该亲本是具有与所述变体一致的氨基酸序列但是在一个或多个所述指定位置不具有所述变化的蛋白酶。取代意指占据一个位置的氨基酸被一个不同的氨基酸置换;缺失意指除去占据一个位置的氨基酸;并且插入意指在与占据一个位置的氨基酸相邻处添加氨基酸,例如I至10个氨基酸,优选I至3个氨基酸。
[0046]非常高严谨度条件:术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在70°C下将载体材料洗涤三次,每次15分钟。
[0047]非常低严谨度条件:术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42°C下在5X SSPE、0.3% SDS、200y g/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在45 °C下将载体材料洗涤三次,每次15分钟。[0048]洗涤性能:术语“洗涤性能”被用作酶在例如洗涤(如衣物洗涤或硬表面清洁)过程中除去存在于有待清洁的物体上的污物的能力。洗涤性能可以通过计算如在此处的材料与方法所述的AMSA测定中定义的所谓强度值(Int)来定量。也参见在此的实例2中的洗涤性能测试。此外,洗涤性能,特别是根据本发明的蛋白酶变体的洗涤性能可以通过以下所述的参考洗涤测试来确定。还参见在此处的实例3。
[0049]野生型蛋白酶:术语“野生型蛋白酶”意指由天然存在的有机体(例如在自然界中发现的细菌、古生菌、酵母、真菌、植物或动物)表达的一种蛋白酶。野生型蛋白酶的实例是BPN’,即 SEQ ID NO:2。
[0050]转录启动子:术语“转录启动子”用于指为促进特定基因的转录的一个DNA区域的启动子。转录启动子典型地位于它们所调节的基因附近,在相同链上并且在上游(朝向有义链的5’区域)。
[0051]转录终止子:术语“转录终止子”用于指标记基因结束的基因序列区段或者供转录的基因组DNA上的操纵子。
[0052]变体命名惯例
[0053]出于本发明的目的,在SEQ ID NO: 2中披露的成熟多肽是用于确定在另一个枯草杆菌蛋白酶中的相应氨基酸残基。将另一种枯草杆菌蛋白酶的氨基酸序列与SEQ ID N0:2中披露的成熟多肽比对,并且基于该比对,使用在EMBOSS包(EMBOSS:欧洲分子生物学开发软件套,赖斯等人,2000,遗传学趋势16:276-277)(优选版本5.0.0或更新版本)的尼德尔程序中实施的尼德曼-翁施算法(尼德曼和翁施,1970,分子生物学杂志48:443-453)确定与SEQ ID NO: 2中所披露的成熟多肽的任何氨基酸残基相对应的氨基酸位置号。使用的参数是空位开放罚分10、空位 延伸罚分0.5、以及EBL0SUM62 (BL0SUM62的EMBOSS版)取代矩阵。
[0054]可以通过使用若干计算机程序、使用其对应默认参数比对多个多肽序列来确定在另一种枯草杆菌蛋白酶中的相应氨基酸残基的鉴别,所述计算机程序包括但不限于MUSCLE (通过对数预期的多种序列比较;版本3.5或更新版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research) 32:1792-1797)、MAFFT (版本 6.857 或更新版本;加藤(Katoh)和库马(Kuma),2002,核酸研究30:3059-3066 ;加藤等人,2005,核酸研究33:511-518 ;加藤和都(Toh),2007,生物信息学(Bioinformatics) 23:372-374 ;加藤等人,2009,分子生物学方法(Methods in Molecular Biology) 537:39-64 ;加藤和都,2010,生物信息学26:1899-1900)、以及采用Clustalff (1.83或更新版本;汤姆斯(Thompson)等人,1994,核酸研究 22:4673-4680)的 EMBOSS EMMA。
[0055]当从具有SEQ ID NO:2的成熟多肽中分出其他酶从而使得传统基于序列的比对难以检测它们的关系(林达尔(Lindahl)和埃洛弗松(Elofsson),2000,分子生物学杂志295:613-615)时,可以使用其他成对序列比对算法。在基于序列的搜索中的较大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(特征曲线(profile))来搜索数据库。例如,PS1-BLAST程序通过一个迭代数据库搜索过程来产生多个特征曲线并且能够检测关系疏远的同源物(阿特休尔等人,1997,核酸研究25:3389-3402)。当多肽的家族或超家族在蛋白质结构数据库中具有一个或多个代表时,甚至可以实现更大的灵敏度。程序如GenTHREADER(琼斯(Jones),1999,分子生物学杂志287:797-815 ;麦古芬(McGuffin)和琼斯(Jones),2003,生物信息学19:874-881)利用来自多种来源的信息(PS1-BLAST、二级结构预测、结构比对曲线、以及溶剂化潜能)作为到神经网络的输入,该神经网络预测查询序列的结构折叠。类似地,高夫(Gough)等人,2000,分子生物学杂志313:903-919的方法可以用于比对具有未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于生成该多肽的同源性模型,并且可以使用多种出于该目的而开发的工具来评价这类模型的准确度。
[0056]对于具有已知结构的蛋白质,若干工具和资源可用于检索和生成结构比对。例如,已对蛋白质的SCOP超家族进行结构比对,并且那些比对是可访问的并且可下载的。可以使用多种算法如距离比对矩阵(奥尔姆(Holm)和桑德(Sander),1998,蛋白质(Proteins) 33:88-96)或者组合延伸(Shindyalov 和伯恩(Bourne), 1998,蛋白质工程11:739-747)比对两种或更多种蛋白质结构,并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库,以便发现可能的结构同源物(例如,奥尔姆和帕克(Park),2000,生物信息学 16:566-567)。
[0057]在描述本发明的变体中,采用以下所述的命名法以方便参考。采用已接受的IUPAC
单个字母和三字母的氨基酸缩写。
[0058]取代。对于一个氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变通过加号(“ + ”)、逗号或空格分开,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”、“G205R,S411F,,、“G205R S411F”,分别代表位置205和411的甘氨酸(G)取代为精氨酸(R),以及丝氨酸(S)取代为苯丙氨酸(F)。
[0059]缺失。对于一个氨基酸缺失,使用以下命名法:原始氨基酸、位置、*。因此,在位置195上的甘氨酸缺失表示为“Glyl95*”或者“G195*”。多个缺失通过加号(“ + ”)分开,例如,“Glyl95*+Ser411*,,或“G195*+S411*,,。
[0060]插入:额外的氨基酸残基的插入,例如像在G195后插入赖氨酸可以表示为:Glyl95GlyLys或者G195GK。可替代地,额外的氨基酸残基的插入,如在G195后插入赖氨酸可以表不为:*195aL。当插入多于一个的氨基酸残基,例如像在G195后插入Lys和Ala时,这种插入可以表示为:Glyl95GlyLysAla或者G195GKA。在此类情况下,还可以通过将小写字母添加到在一个或多个插入的氨基酸残基前的氨基酸残基位置号处来对一个或多个插入的氨基酸残基进行编号,在这个实例中:*195aK*195bA。在以上的实例中,序列194至196因此为:
[0061]194195196
[0062]诺维信蛋白酶(Savinase)A-G-L
[0063]194195195a 195b 196
[0064]变体A-G-K-A-L
[0065]在其中取代和插入发生在相同位置的情况下,这可以表示为S99SD+S99A或者简单地为S99AD。相同修饰也可以表示为S99A+*99aD。
[0066]在其中插 入与所存在的氨基酸残基相同的氨基酸残基的情况下,显然是在命名中出现了简并。如果例如在以上实例中,在甘氨酸之后插入甘氨酸,则将它表示为G195GG或者*195aGbG。对于以下变化,相同的实际变化也可以仅表示为A194AG或者*194aG,从
[0067]
【权利要求】
1.一种用于获得一种蛋白酶变体的方法,该方法包括在亲本枯草杆菌酶的与具有SEQID NO:2的成熟多肽的位置53、54、55、56以及57相对应的一个或多个位置引入一个缺失,其中该变体具有与SEQ ID NO:2至少65%—致的氨基酸序列;并且回收该变体。
2.如权利要求1所述的方法,其中该变体包含与具有SEQID NO:2的该成熟多肽的位置53、54、55、56或57相对应的两个、三个、四个或五个缺失。
3.如权利要求1或2所述的方法,其中通过一种方法获得该蛋白酶变体,该方法包括在亲本枯草杆菌酶的与具有SEQ IDN0:2的该成熟多肽的位置53、54、55、56或57相对应的环中引入一个或多个选自下组的氨基酸的缺失,该组由Ser、Glu、Thr> Asn或Pro组成,其中该变体与SEQ ID N02具有至少65%的一致性。
4.如权利要求1所述的方法,其中通过一种方法获得该蛋白酶变体,该方法包括在亲本枯草杆菌酶的与具有SEQ ID NO: 2的该成熟多肽的位置55、56或57相对应的环中引入一个或多个氨基酸的缺失。
5.如权利要求1至4中任一项所述的方法,其中该蛋白酶变体与具有SEQID NO:2的该成熟多肽具有至少70%,例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96 %、至少97 %、至少98 %、或者至少99 %、但小于100 %的序列一致性。
6.如权利要求1至5中任一项所述的方法,其中该亲本枯草杆菌酶是选自下组,该组由以下各项组成: (a)与具有SEQID NO:2的该成熟多肽具有至少65%的序列一致性的一种多肽; (b)由在中严谨度或高严谨度条件下与(i)SEQ ID NO:1的成熟多肽编码序列、(ii)编码具有SEQ ID N0:2的该成熟多肽的一种序列、或者(iii)⑴或(ii)的全长互补体杂交的一种多核苷酸编码的一种多肽; (c)由与SEQID NO:1的成熟多肽编码序列或者编码具有SEQ ID NO: 2的该成熟多肽的一种序列具有至少70%—致性的一种多核苷酸编码的一种多肽;以及 (d)具有SEQID NO:2的该成熟多肽的一个片段,该片段具有蛋白酶活性。
7.如权利要求1至6中任一项所述的方法,其中该亲本枯草杆菌酶与具有SEQID NO: 2的该成熟多肽具有至少65 %,例如至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
8.一种蛋白酶变体,该蛋白酶变体在与具有SEQ 10勵:2的成熟多肽的位置53、54、55、56或57相对应的环中包含一个或多个氨基酸的缺失并且在与具有SEQ ID NO:2的该成熟多肽的位置53、54、55、56或57相对应的位置进一步包含一个或多个取代,其中 (a)该变体与SEQID NO:2具有至少65%且小于100%的序列一致性,并且 (b)该变体具有蛋白酶活性。
9.如权利要求8所述的变体,其中该变体在与SEQID NO: 2的位置53相对应的一个位置包含一个缺失并且在与具有SEQ ID NO: 2的该成熟多肽的位置54、55、56或57相对应的一个或多个位置进一步包含一个取代,和/或 其中该变体在与SEQ ID NO: 2的位置54相对应的一个位置包含一个缺失并且在与具有SEQ ID NO:2的该成熟多肽的位置53、55、56或57相对应的一个或多个位置进一步包含一个取代,和/或 其中该变体在与SEQ ID NO: 2的位置55相对应的一个位置包含一个缺失并且在与具有SEQ ID NO:2的该成熟多肽的位置53、54、56或57相对应的一个或多个位置进一步包含一个取代,和/或 其中该变体在与SEQ ID NO: 2的位置56相对应的一个位置包含一个缺失并且在与具有SEQ ID NO:2的该成熟多肽的位置53、54、55或57相对应的一个或多个位置进一步包含一个取代,或者 其中该变体在与SEQ ID NO: 2的位置57相对应的一个位置包含一个缺失并且在与具有SEQ ID NO:2的该成熟多肽的位置53、54、55或56相对应的一个或多个位置进一步包含一个取代。
10.如权利要求8至9所述的变体,其中在与位置53相对应的该位置上的氨基酸是选自Gly、Ala、Thr、Asn或者是不存在的,和/或 其中在与位置54相对应的该位置上的氨基酸是选自Gly、Ala、Ser、Thr、Asn或者是不存在的,和/或 其中在与位置55相对应的该位置上的氨基酸是选自Gly、Ala、Ser、Asn或者是不存在的,和/或 其中在与位置56相对应的该位置上的氨基酸是选自Gly、Ala、Ser、Thr或者是不存在的,或者 其中在与位置57相对应的该位置上的氨基酸是选自Gly、Ala、Ser、Thr、Asn或者是不存在的。
11.如权利要求8至10中任一项所述的变体,该变体在与位置53、54、55、56、以及57中任一个相对应的三个位置包含一个变化。
12.如权利要求8至11中任一项所述的变体,该变体包含一个或多个选自下组的变化,该组由缺失S53*、E54*、T55*、N56*以及P57*和/或取代S53G、T55S以及P57A组成。
13.如权利要求8至12中任一项所述的变体,其中该变体是选自以下变体:S53G+T55S+N56*+P57A+Y217L、P14T+T55S+N56*+P57A+Y217L、P14T+S53G+N56*+P57A+Y217L、P14T+S53G+T55S+N56*+Y217L、P14T+S53G+T55S+N56*+P57A、P14T+S53G+T55S+N56*+P57A+S101L+Y217L、 V4I+S53G+T55S+N56*+P57A+Y217L、P14T+S53G+T55S+N56*+P57A+Y217L、T55S+N56*+P57A+Y217L、S53G + T55S+N56*+P57A + I79T+Y217L、S53G+T55S+N56*+P57A+P86H+A92S+Y217L、 S53G+T55S+N56*+P57A+A88V+Y217L、 S53G+T55S+N56*+P57A+A98T+Y2I7L、S53G+T55S+N56*+P57A+Y217L、S53G+T55P+N56*+S63G+G146S+Y217L。
14.如权利要求8至13中任一项所述的变体,该变体相比于该亲本或者相比于具有SEQID NO:2的该蛋白酶具有改进的洗涤性能。
15.如权利要求8至14中任一项所述的变体,其中该变体是选自下组,该组由以下各项组成: a.与SEQID NO:2的该成熟多肽具有至少65%的序列一致性的一种多肽; b.由在中严谨度或高严谨度条件下与(i)SEQID NO:1的成熟多肽编码序列、(ii)编码具有SEQ ID NO:2的该成熟多肽的一种序列、或者(iii)⑴或(ii)的全长互补体杂交的一种多核苷酸编码的一种多肽; c.由与SEQID NO:1的成熟多肽编码序列或者编码具有SEQ ID NO: 2的成熟多肽的一种序列具有至少65%—致性的一种多核苷酸编码的一种多肽;以及 d.具有SEQ ID NO:2的成熟多肽的一个片段,该片段具有蛋白酶活性。
16.如权利要求8至15中任一项所述的变体,其中该变体与具有SEQIDN0:2的该成熟多肽具有至少70 %,例如至少75 %、至少80 %、至少85 %、至少90 %、至少95 %、至少96 %、至少97%、至少98%、至少99%、但小于100%的序列一致性。
17.如权利要求8至16中任一项所述的变体,其中在该变体中的变化总数是I至20个,例如I至10个和I 至5个,如1、2、3、4、5、6、7、8、9或者10个变化。
【文档编号】C12N9/54GK104011204SQ201280063467
【公开日】2014年8月27日 申请日期:2012年12月18日 优先权日:2011年12月20日
【发明者】W.贝森马特, A.本尼, E.P.弗里斯, P.O.米奇尔森 申请人:诺维信公司