专利名称:α-淀粉酶突变体的制作方法
技术领域:
本发明涉及亲本类透阿米尔(Termamyl-like)α-淀粉酶的变体(突变体),其在中温和/或高pH下的活性更高。发明背景α-淀粉酶(α-1,4-葡聚糖-4-葡聚糖水解酶,EC3.2.1.1)构成这样一组酶,它们催化淀粉和其他线性及分枝1,4-葡萄糖苷寡-糖和多糖的水解。
有大量专利和科学文献涉及这类工业上非常重要的酶。从例如WO90/11352、WO95/10603、WO95/26397、WO96/23873和WO96/23874可以知道许多α-淀粉酶,比如类透阿米尔α-淀粉酶变体。
在更近期的涉及α-淀粉酶的公开文献中,WO96/23874提供了一种类透阿米尔α-淀粉酶的三维、X-射线晶体结构数据,该酶含有解淀粉芽孢杆菌α-淀粉酶(BANTM)的300个氨基端氨基酸残基以及含有所述氨基酸序列的地衣形芽孢杆菌α-淀粉酶的羧基端301-483位氨基酸(后者以透阿米尔TM的商品名出售),因此该酶与工业上很重要的芽孢杆菌α-淀粉酶(其在本文中包含在术语“类透阿米尔α-淀粉酶”中,该术语特别包括地衣形芽孢杆菌、解淀粉芽孢杆菌(BANTM)和嗜热脂肪芽孢杆菌(BSGTM)α-淀粉酶)有密切的关系。WO96/23874还描述了在分析亲本类透阿米尔α-淀粉酶之结构的基础上,设计相对亲本改变了性质的亲本类透阿米尔α-淀粉酶之变体的方法。发明简述本发明涉及新的类透阿米尔α-淀粉酶的α-淀粉分解酶变体(突变体),该变体在高pH和中温的洗涤能力(相对亲本α-淀粉酶)提高。
在本发明文中术语“中温”意指10℃到60℃,优选20℃到50℃,特别是30℃到40℃。
术语“高pH”意指目前用于洗涤的碱性pH,更具体说是大约pH8到10.5。
在本发明文中,“低温α-淀粉酶”意指一种在0-30℃的温度范围内具有相对最佳活性的α-淀粉酶。
在本发明文中,“中温α-淀粉酶”意指一种在30℃-60℃的温度范围内具有最佳活性的α-淀粉酶。比如,SP690和SP722α-淀粉酶分别是“中温α-淀粉酶”。
在本发明文中,“高温α-淀粉酶”意指一种在60℃-110℃的温度范围内具有最佳活性的α-淀粉酶。比如,透阿米尔是一种“高温α-淀粉酶”。
本发明的变体可以实现这些特性的改变类透阿米尔α-淀粉酶在pH8到10.5的稳定性;和/或在pH8到10.5对Ca2+的稳定性;和/或在10℃-60℃,优选20℃-50℃,特别是30℃-40℃的特异活性。
应当注意的是,相对最适温度通常取决于所用的特定pH。换句话说,在例如pH8确定的相对最适温度可能与例如pH10确定的相对最适温度非常不同。
温度对酶活性的影响活性部位及其周围的动力学取决于温度和氨基酸组成,并且对一种酶的相对最适温度有重要意义。通过比较中温和高温α-淀粉酶的动力学,可以确定出高温α-淀粉酶在中等温度下的功能关键区域。图2显示了SP722α-淀粉酶(SEQ ID NO2)和地衣形芽孢杆菌α-淀粉酶(以Termanyl购自Novo Nodisk)(SEQ ID NO4)。
图中显示,在中温范围(30-60℃),SP722绝对活性的相对最适温度比同源的地衣形芽孢杆菌α-淀粉酶高,后者在60-100℃左右具有最佳活性。这些分布图主要取决于活性部位残基及其周围的温度稳定性和动力学。另外,活性分布图取决于所用pH和活性部位残基的pKa。
本发明的第一个方面涉及亲本类透阿米尔α-淀粉酶的具有α-淀粉酶活性的变体,所述变体包含1或多个突变,这些突变对应于SEQ ID NO2所示氨基酸序列的下列突变T141, K142, F143, D144, F145, P146, G147, R148, G149,Q174, R181, G182, D183, G184, K185, A186, W189, S193, N195,H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172, F173,F267, W268, K269, N270, D271, L272, G273, A274, L275, K311,E346, K385, G456, N457, K458, P459, G460, T461, V462, T463。
本发明的一个变体有1或多个下列取代或缺失T141A, D,R,N,C,E,Q,G,H,I,L,K,M,F,P,S,W,Y,V;K142A, D,R,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;
F143A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;D144A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;F145A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;P146A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G147A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;R148A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;G149A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;R181*,A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;G182*,A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;D183*,A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;G184*,A, R, D, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;K185A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;A186D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W189A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;S193A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;H107A, D, R, N, C, E, Q, G, I, L, K, M, F, P, S, T, W, Y, V;K108A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G109A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;D166A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W167A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;D168A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q169A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;S170A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;R171A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q172A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;F173A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;Q174*,A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y,V;F267A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;W268A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;D271A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L272A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G273A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;A274D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L275A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;K311A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;E346A, D, R, N, C, Q, G, H, I, K, L, M, F, P, S, T, W, Y, V;K385A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G456A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;N457A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;
P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G460A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;T461A, D, R, M, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;V462A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y;T463A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V。
优选的是具有1或多个下列取代或缺失的变体K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R;K458R; P459T; T461P; Q174*;R181Q,N,S; G182T,S,N; D183*; G184*;K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V;A186T,S,N,I,V,R;189T,S,N,Q。
特别优选的是在D183和G184位点缺失并有1或多个下列取代或缺失的变体K142R; S193P;N195F;K269R,Q;N270Y,R,D;K311R;E346Q;K385R;K458R; P459T;T461P;Q174*;R181Q,N,S;G182T,S,N;K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V;A186T,S,N,I,V,R;W189T,S,N,Q。
上述本发明的变体相对亲本α-淀粉酶至少以下性质之一发生改变i)在pH8到10.5的pH稳定性提高;和/或ii)在pH8到10.5对Ca2+的稳定性提高,和/或iii)在温度为10℃到60℃,优选20-50℃,尤其是30-40℃特异活性增强。另外,以下将做具体阐述。
本发明更进一步涉及编码本发明所述变体的DNA构建体;制备本发明所述变体的方法;以及本发明所述变体单独地或与其他酶结合,在各种工业产品或方法中的用途,例如,用在洗涤剂中或用于淀粉液化。
本发明最后一个方面涉及生产α-淀粉酶的方法,该酶的最适pH、和/或最适温度发生改变,和/或稳定性提高。
命名法则在本说明书和权利要求书中,使用了氨基酸残基的常规单字母和三字母编码。为了便于参考,采用以下命名法则来描述本发明的α-淀粉酶变体原氨基酸位点取代氨基酸根据这一命名原则,例如在第30位丙氨酸到天冬酰胺的取代应表示为Ala30Asn或A30N在同一位点的丙氨酸缺失表示为Ala30*或A30*添加的氨基酸残基,比如赖氨酸插入表示为Ala30AlaLys或A30AK连续的氨基酸残基片段,比如30-33位氨基酸残基缺失表示为(30-33)*或Δ(A30-N33)。
当特定α-淀粉酶与其他α-淀粉酶相比含有一个“缺失”,并且在该位点做了一个插入,这种情况表示为(对于36位插入了一个天冬氨酸)36Asp或36D多重突变用加号隔开,即Ala30Asp+Glu34Ser或A30N+E34S代表在30和34位分别将丙氨酸和谷氨酸取代为天冬氨酸和丝氨酸。
当在一个给定位点可以插入1或多个可选择的氨基酸残基时,将其表示为A30N,E或A30N或A30E另外,当本文中确定了一个适合进行修饰的位置而没有建议具体的修饰方式,应当理解为可以用任何氨基酸残基来取代该位点的氨基酸残基。因此,例如,如果提及30位的丙氨酸修饰,但没有具体化,应当理解可以将该丙氨酸缺失或用任何其他氨基酸来取代它,即下列之一的氨基酸R、N、D、A、C、Q、E、G、H、I、L、K、M、F、P、S、T、W、Y、V。
附图简述
图1是6个亲本类透阿米尔α-淀粉酶的氨基酸序列对比。最左端的数字代表下列各氨基酸序列1SEQ ID NO22Kaoamyl3SEQ ID NO1
4SEQ ID NO55SEQ ID NO46SEQ ID NO3图2显示SP722(SEQ ID NO2)(pH9)和地衣形芽孢杆菌α-淀粉酶(SEQ ID NO4)(pH7.3)的温度活性关系图。
图3显示SP690(SEQ ID NO1)、SP722(SEQ ID NO2)、地衣形芽孢杆菌α-淀粉酶(SEQ ID NO4)在pH10的温度分布图。
图4是5个α-淀粉酶的氨基酸序列对比。最左端的数字代表下列各氨基酸序列1amyp-小鼠2amyp-大鼠3amyp-猪 猪胰腺α-淀粉酶(PPA)4amyp-人5amy-altha A.haloplanctis α-淀粉酶(AHA)发明详述类透阿米尔α-淀粉酶众所周知,芽孢杆菌亚种所产生的许多α-淀粉酶在氨基酸水平上同源性极高。例如,发现包含SEQ ID NO4所示氨基酸序列的地衣形芽孢杆菌α-淀粉酶(商品名为透阿米尔TM)与包含SEQ ID NO5所示氨基酸序列的解淀粉芽孢杆菌α-淀粉酶大约89%同源,与包含SEQ ID NO3所示氨基酸序列的嗜热脂肪芽孢杆菌α-淀粉酶大约79%同源。其他的同源α-淀粉酶包括来源于芽孢杆菌菌株NCIB12289、NCIB12512、NCIB12513或DSM9375的α-淀粉酶(这些在WO95/26397中都有详细的描述)以及Tsukamoto等描述过的α-淀粉酶(生物化学和生物物理研究通讯,151(1988),25-31页,参见SEQ ID NO6)。
其他同源α-淀粉酶包括EP0252666中描述的地衣形芽孢杆菌(ATCC27811)产生的α-淀粉酶,以及WO91/00353和WO94/18314中鉴定到的α-淀粉酶。在产品OptithermTM和TakathermTM(Solvay有售)、MaxamylTM(Gist-brocades/Genencor有售)、Spezym AATM和Spezym Delta AATM(Genencor有售)以及KeistaseTM(Daiwa有售)中含有其他一些商品类透阿米尔地衣形芽孢杆菌α-淀粉酶。
由于发现这些α-淀粉酶之间有极大的同源性,可以认为它们属于同类α-淀粉酶,即“类透阿米尔α-淀粉酶”类。
因此,在本文中,术语“类透阿米尔α-淀粉酶”意指这类α-淀粉酶,它在氨基酸水平上与透阿米尔TM(即具有文中SEQ ID NO4所示氨基酸序列的地衣形芽孢杆菌α-淀粉酶)有极大的同源性。换句话说,以下所有具有SEQ ID NO1、2、3、4、5、6、7或8所示氨基酸序列,或者WO95/26397中的SEQ ID NO1所示氨基酸序列(与此处SEQ ID NO7所示氨基酸序列相同)之α-淀粉酶或者WO95/26397中的SEQ ID NO2所示氨基酸序列(与此处SEQ ID NO8所示氨基酸序列相同)或者Tsukamoto等文中(1988,该氨基酸序列在文中见SEQ ID NO6)之α-淀粉酶都被认为是“类透阿米尔α-淀粉酶”。其他的类透阿米尔α-淀粉酶是这样一些α-淀粉酶i)与SEQ ID NO1-8所示氨基酸序列中的至少一个有至少60%、比如至少70%(例如至少75%),或至少80%(例如至少85%),至少90%或至少95%同源,和/或ii)与至少一个所述α-淀粉酶的抗体有免疫交叉反应,和/或iii)由这样一种DNA序列编码,这些序列能与编码以上特定α-淀粉酶的DNA序列进行杂交,根据本申请的SEQ ID NO9、10、11或12(这些编码序列分别编码此处SEQ ID NO1、2、3、4和5所示的氨基酸序列)、WO95/26397中的SEQ ID NO4(文中SEQ ID NO13显示了该DNA序列和终止密码子TAA,并编码文中SEQ ID NO8所示的氨基酸序列)以及WO95/26397中的SEQ ID NO5(文中SEQ ID NO14所示)很容易得到这些序列。
对于特性i),可以借助任何常规算法来确定“同源性”,优选利用GCG程序包7.3版本(1993年6月)中的GAP程序,该程序中GAP罚分采用缺省值,即GAP生成罚分为3.0,GAP延伸罚分为0.1(Genetic computergroup(1991)GCG程序包程序手册,版本7,575 Science Drive,Madison,Wisconsin,USA53711)。
可以利用透阿米尔(SEQ ID NO4)和类透阿米尔α-淀粉酶之间的结构对比来鉴定其他类透阿米尔α-淀粉酶中的等同/相应位点。获得所述结构对比的一个方法是利用GCG程序包中的Pile Up程序,该程序中GAP罚分采用缺省值,即GAP生成罚分为3.0,GAP延伸罚分为0.1。其他结构对比方法包括疏水簇分析(Gaboriaud等,(1987),FEBS快报224,149-155页)和反相成丝技术(reverse threading)(Huber T,Torda,AE,蛋白质科学,7卷,1期142-149(1998))。
可以利用抗相关类透阿米尔α-淀粉酶的至少一个表位、或者与之反应的抗体来检测α-淀粉酶的特性ii),即免疫交叉反应性。可以通过本领域的已知方法,例如Hudson等(实用免疫学,第3版(1989),Blackwell ScientificPublications)描述的方法来制备单克隆或多克隆抗体。可以利用本领域已知的检测方法(这类例子有Western印迹或者Hudson等(1989)描述的径向免疫扩散法)来确定免疫交叉反应性。就这方面而言,发现具有SEQ ID NO1、2、3、4、5、6、7或8所示氨基酸序列的α-淀粉酶之间分别有免疫交叉反应。
可以在所研究的α-淀粉酶的全长或部分核苷酸或氨基酸序列的基础上适当地制备到用于根据特性iii)来鉴定类透阿米尔α-淀粉酶的寡核苷酸探针。
检测杂交的适宜条件包括在5×SSC中预浸泡,于~40℃在含有20%甲酰胺、5×Denhardt′s溶液、50mM磷酸钠(pH6.8)以及50mg超声变性小牛胸腺DNA的溶液中预杂交1小时,然后于~40℃在补充有100mM ATP的同一溶液中杂交18小时,随之将滤膜洗3次,每次在2×SSC、0.2%SDS中于40℃(低严格性),优选50℃(中等严格性),更优选65℃(高严格性),还要优选的是~75℃(极高严格性)洗30分钟。有关杂交方法的其他细节可见Sambrook等,分子克隆实验手册,第2版,Cold Spring Harbor,1989.
在本文中,“来源于”不仅是指由所研究的微生物菌株产生或能产生的α-淀粉酶,也指分离自该菌株的DNA序列所编码的、并在用所述DNA序列转化的宿主微生物中产生的α-淀粉酶。最后,该术语意指这样的α-淀粉酶,它由合成的和/或cDNA来源的DNA序列编码并且具备所述α-淀粉酶的鉴定特征。该术语还用来表示亲本α-淀粉酶可以是天然存在的α-淀粉酶的变异体,即由天然存在的α-淀粉酶的1或多个氨基酸残基经过修饰(插入、取代、缺失)所产生的变体。
亲本杂交α-淀粉酶亲本α-淀粉酶(即主链α-淀粉酶)可以是一种杂交α-淀粉酶,即包含组合在一起的来源于至少两个α-淀粉酶的部分氨基酸序列。
亲本杂交α-淀粉酶可以是这样的酶,在氨基酸同源性和/或免疫杂交反应性和/或DNA杂交(如上所述)的基础上可以确定它属于类透阿米尔α-淀粉酶家族。在这种情况中,杂交α-淀粉酶通常包含类透阿米尔α-淀粉酶的至少一部分和1或多个其他α-淀粉酶的1个或多个部分,后者选自微生物(细菌或真菌)和/或哺乳动物来源的类透阿米尔α-淀粉酶或非类透阿米尔α-淀粉酶。
因此,亲本杂交α-淀粉酶可以包括来源于至少两个类透阿米尔α-淀粉酶,或者来源于至少一个类透阿米尔α-淀粉酶和至少一个非类透阿米尔细菌α-淀粉酶,或者来源于至少一个类透阿米尔和至少一个真菌α-淀粉酶的部分氨基酸序列的组合。来源于部分氨基酸序列的类透阿米尔α-淀粉酶可以是,例如文中提到的那些特定类透阿米尔α-淀粉酶中的任何一个。
例如,亲本α-淀粉酶可以包括来源于地衣形芽孢杆菌菌株的α-淀粉酶的羧基端部分和来源于解淀粉芽孢杆菌菌株或嗜热脂肪芽孢杆菌菌株的α-淀粉酶的氨基端部分。例如,亲本α-淀粉酶可以包括地衣形芽孢杆菌α-淀粉酶的羧基端部分的至少430个氨基酸残基,还可以,例如,包括a)与具有SEQ ID NO5所示氨基酸序列的解淀粉芽孢杆菌α-淀粉酶的37个氨基端氨基酸残基相对应的氨基酸片段和与具有SEQ ID NO4所示氨基酸序列的地衣形芽孢杆菌α-淀粉酶的445个羧基端氨基酸残基相对应的氨基酸片段,或者杂交类透阿米尔α-淀粉酶与透阿米尔序列(即SEQ ID NO4所示的地衣形芽孢杆菌α-淀粉酶)相同,除了氨基端的35个氨基酸残基被BAN(成熟蛋白质)(即SEQ ID NO5所示的解淀粉芽孢杆菌α-淀粉酶)的氨基端33个残基(成熟蛋白质)取代;或者包括b)与具有SEQ ID NO3所示氨基酸序列的嗜热脂肪芽孢杆菌α-淀粉酶的68个氨基端氨基酸残基相对应的氨基酸片段和与具有SEQ ID NO4所示氨基酸序列的地衣形芽孢杆菌α-淀粉酶的415个羧基端氨基酸残基相对应的氨基酸片段。
另一合适的亲本杂交α-淀粉酶是先前在WO96/23874(Novo Nordisk申请)中描述的酶,该酶由BAN(解淀粉芽孢杆菌α-淀粉酶)的氨基端(成熟蛋白质的1-300位氨基酸)和透阿米尔的羧基端(成熟蛋白质的301-483位氨基酸)构成。通过将上述杂交α-淀粉酶(BAN1-300/透阿米尔301-483)的1或多个以下位点取代使其活性提高Q360,F290和N102。尤其有意义的取代是1或多个以下取代Q360E、D;F290A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T;N102D、E。
SEQ ID NO2所示SP722α-淀粉酶中的相应位点是S365、Y295、N106中的1或多个。在SEQ ID NO2所示α-淀粉酶中尤其有意义的相应取代是S365D、E;Y295A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T;以及N106D、E中的1或多个。
SEQ ID NO1所示SP690α-淀粉酶中的相应位点是S365、Y295、N106中的1或多个。尤其有意义的相应取代是S365D、E;Y295A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T;以及N106D、E中的1或多个。
上面提到的非类透阿米尔α-淀粉酶可以,例如,是(与类透阿米尔α-淀粉酶不同的)真菌α-淀粉酶、哺乳动物或植物α-淀粉酶或者细菌α-淀粉酶。这类α-淀粉酶的具体例子包括米曲霉TAKAα-淀粉酶、黑曲霉酸α-淀粉酶、枯草芽孢杆菌α-淀粉酶、猪胰腺α-淀粉酶和大麦α-淀粉酶。所有这些α-淀粉酶的结构与文中所述的典型类透阿米尔α-淀粉酶的结构显著不同。
上面提到的真菌α-淀粉酶,即来源于黑曲霉和米曲霉,在氨基酸水平上同源性极高,通常认为属于同族α-淀粉酶。来源于米曲霉的真菌α-淀粉酶以商品名FungamylTM销售。
另外,如果类透阿米尔α-淀粉酶的特定变体(本发明的变体)是指—以常规方式—特定类透阿米尔α-淀粉酶的氨基酸序列中的特异氨基酸残基发生的修饰(例如缺失或取代),那么应将其理解为涵盖了在等同位点(由各氨基酸序列之间的最可能氨基酸对比所确定的)进行修饰的另一个类透阿米尔α-淀粉酶的变体。
在本发明的一个优选实施方案中,α-淀粉酶主链来源于地衣形芽孢杆菌(与亲本类透阿米尔α-淀粉酶一样),例如前面提到过的,比如具有SEQ IDNO4所示氨基酸序列的地衣形芽孢杆菌α-淀粉酶。
本发明变体的改变特性以下讨论存在于本发明的变体中的突变与可能由该突变导致的预期性状变化(相对亲本类透阿米尔α-淀粉酶的这些性状)之间的关系。
在pH8-10.5的稳定性提高在本发明文中,对于实现在高pH下稳定性提高有重要意义的突变(包括氨基酸取代)包括与SP722α-淀粉酶(具有SEQ ID NO2所示氨基酸序列)中的1或多个下列位点所发生的突变相对应的突变 T141、 K142、F143、 D144、 F145、 P146、 G147、 R148、 G149、 R181、 A186、S193、 N195、 K269、 N270、 K311、 K458、 P459、 T461。
本发明的变体具有1或多个下列取代(使用SEQ ID NO2的编号)T141A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;K142A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;F143A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;D144A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;F145A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;P146A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G147A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;R148A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;G149A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;K181A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;A186D, R, N, C, E, Q, G, H, I, L, P, K, M, F, S, T, W, Y, V;S193A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K311A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;T461A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V。
优选的高pH稳定性变体包括SP722α-淀粉酶(具有SEQ ID NO2所示氨基酸序列)中的1或多个下列取代K142R、R181S、A186T、S193P、N195F、K269R、N270Y、K311R、K458R、P459T和T461P。
在具体实施方案中,用具有SEQ ID NO1所示序列的芽孢杆菌菌株NCIB12512α-淀粉酶,或者具有SEQ ID NO3所示序列的嗜热脂肪芽孢杆菌α-淀粉酶,或者具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶,或者具有SEQ ID NO5所示序列的解淀粉芽孢杆菌α-淀粉酶作为主链,即亲本类透阿米尔α-淀粉酶来进行这些突变。
从图1的对比结果可以看到,嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的N270对应的位点已有一个酪氨酸。另外,芽孢杆菌菌株NCIB12512α-淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣形芽孢杆菌α-淀粉酶和解淀粉芽孢杆菌α-淀粉酶在与SP722中的K458对应的位点早已有精氨酸。另外,地衣形芽孢杆菌α-淀粉酶在与SP722中的T461对应的位点已有一个脯氨酸。因此,所述取代与这些α-淀粉酶无关。
可以利用实施例2中提及的分子动力学模拟,通过在所发现的区域进行取代来构建在高pH下稳定性提高的α-淀粉酶变体。模拟描述了那些在高pH(即pH8-10.5)比在中等pH有更高柔性或可变性的区域。
利用任何与类透阿米尔α-淀粉酶(BA2,在Novo Nodisk提出的WO96/23874的附录1中公开了该酶的3D结构)同源(定义如下)的细菌α-淀粉酶的结构,即有可能建立这些α-淀粉酶结构的模型并可以对它进行分子动力学模拟。用GCG程序包7.3版(1993年6月)中的UWGCG GAP程序测量到所述细菌α-淀粉酶的同源性可以为至少60%、优选70%以上、更优选80%以上、最优选90%以上同源于前面提及的类透阿米尔α-淀粉酶(BA2),测量采用缺省值作为GAP罚分(Genetic computer group(1991)GCG程序包程序手册,版本7,575 Science Drive,Madison,Wisconsin,USA53711)。将不利的残基取代为其他残基是可行的。
在pH8-10.5的Ca2+稳定性提高Ca2+稳定性提高意味着酶在Ca2+耗尽的情况下,稳定性已有提高。在本发明文中,对于获得在高pH下Ca2+稳定性提高有重要意义的突变(包括氨基酸取代)包括与SP722α-淀粉酶(具有SEQ ID NO2所示氨基酸序列)中的下列位点相对应的1或多个位点突变或缺失R181、G182、D183、G184、K185、A186、W189、N195、N270、E346、K385、K458、P459。
本发明的变体具有1或多个下列取代或缺失R181*, A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;G182*, A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;D183*, A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;G184*, A, R, D, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;K185A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;A186D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W189A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;
N270A, R, D, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;E346A, R, D, N, C, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K385A, R, D, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;K458A, R, D, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;P459A, R, D, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V。优选的是具有1或多个下列取代或缺失的变体R181Q,N;G182T,S,N;D183*;G184*;K185A,R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V;A186T,S,N,I,V;W189T,S,N,Q;N195F,N270R,D;E346Q;K385R;K458R;P459T。
在具体实施方案中,用具有SEQ ID NO1所示序列的芽孢杆菌菌株NCIB12512α-淀粉酶,或者具有SEQ ID NO5所示序列的解淀粉芽孢杆菌α-淀粉酶,或者具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶作为进行这些突变的主链。
从图1的对比结果可看到,地衣形芽孢杆菌α-淀粉酶没有与SP722中的D183和G184对应的位点。因此,所述缺失与该α-淀粉酶无关。
在一个优选实施方案中,变体是这样的芽孢杆菌菌株NCIB12512α-淀粉酶,它在D183和G184缺失,并有下列取代之一R181Q、N和/或G182T、S、N和/或D183*;G184*和/或K185A、R、D、C、E、Q、G、H、I、L、M、N、F、P、S、T、W、Y、V和/或A186T、S、N、I、V和/或W189T、S、N、Q和/或N195F和/或N270R、D和/或E346Q和/或K385R和/或K458R和/或P459T。
在中温的特异活性增强本发明另外一个方面,对于获得在10-60℃,优选20-50℃,尤其是30-40℃特异活性增强的变体来说,重要的突变包括与SP722α-淀粉酶(具有SEQ ID NO2所示氨基酸序列)中的1或多个下列位点相对应的突变H107, K108, G109, D166, W167, D168, Q169, S170, R171, Q172,F173, Q174, D183, G184, N195, F267, W268, K269, N270, D271,L272, G273, A274, L275, G456, N457, K458, P459, G460, T461,V462, T463。
本发明的变体具有1或多个下列取代H107A, D, R, N, C, E, Q, G, I, L, K, M, F, P, S, T, W, Y, V;K108A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G109A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;
D166A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W167A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;D168A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q169A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;S170A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;R171A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q172A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;F173A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;Q174*,A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;D183*,A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;G184*,A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;F267A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;W268A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;D271A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L272A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G273A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;A274D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L275A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G456A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;N457A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G460A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;T461A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;V462A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y;T463A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V。
优选的变体具有1或多个下列取代或缺失Q174*、D183*、G184*、K269S。
在具体实施方案中,用具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶作为进行这些突变的主链。
本发明变体的通用突变在中温特异活性增强特别有意义的氨基酸取代是那些能提高酶活性部位周围的可变性的取代。这可以通过那些能破坏活性部位附近(即优选与构成活性部位的任何残基在10A或8A或6A或4A之内)的稳定性相互作用的改变来实现。
这类例子是那些能降低侧链尺寸的突变,比如Ala到GlyVal到Ala或GlyIle或Leu到Val、Ala或GlyThr到Ser我们希望,通过导入空腔或者通过能填塞突变造成的空间的结构重排,这些突变导致活性部位区域的柔性提高。
可以优选本发明的变体还包含1或多个除上面概括过的以外的修饰。因此,将被修饰的α-淀粉酶变体某部分存在的1或多个脯氨酸取代为非脯氨酸残基可能是有益的,所述非脯氨酸可以是任何可能的、天然非脯氨酸残基,优选是Ala、Gly、Ser、Thr、Val或Leu。
类似地,可以优选将亲本α-淀粉酶被修饰的那些氨基酸残基中存在的1或多个Cys残基取代为非半胱氨酸残基,比如Ser、Ala、Thr、Gly、Val或Leu。
另外,可以将本发明的变体进行修饰—作为唯一的修饰或者结合上面概括的任何修饰—以便将与SEQ ID NO4中的185-209位氨基酸片段所对应的氨基酸片段中存在的1或多个Asp和/或Glu分别取代为Asn或Gln。同样有意义的是在类透阿米尔α-淀粉酶中,将与SEQ ID NO4中的185-209位氨基酸片段所对应的氨基酸片段中存在的1或多个Lys残基取代为Arg。
应当明白,本发明涵盖了含有两个或多个上述修饰的变体。
另外,向此处描述的任何变体导入点突变可能是有益的。
活性部位周围可变性提高的α-淀粉酶变体可以通过替换靠近底物部位的1或多个位点的1或多个氨基酸残基来提高本发明α-淀粉酶变体的可变性。这些位点是(使用SP722α-淀粉酶(SEQ ID NO2)的编号)V56、K108、D168,Q169、Q172、L201、K269、L272、L275、K446、P459。
因此,本发明的一个方面涉及在1或多个上述位点发生突变的变体。
优选的取代是下列中的1或多个V56A,G,S,T;K108A,D,E,Q,G,H,I,L,M,N,S,T,V;
D168A, G, I, V, N, S, T;Q169A, D, G, H, I, L, M, N, S, T, V;Q172A, D, G, H, I, L, M, N, S, T, V;L201A, G, I, V, S, T;K269A, D, E, Q, G, H, I, L, M, N, S, T, V;L272A, G, I, V, S, T;L275A, G, I, V, S, T;Y295A, D, E, Q, G, H, I, L, M, N, F, S, T, V;K446A, D, E, Q, G, H, I, L, M, N, S, T, V;P459A, G, I, L, S, T,V。
在本发明的具体实施方案中,用具有SEQ ID NO1所示序列的芽孢杆菌菌株NCIB12512α-淀粉酶,或者具有SEQ ID NO3所示序列的嗜热脂肪芽孢杆菌α-淀粉酶,或者具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶,或者具有SEQ ID NO5所示序列的解淀粉芽孢杆菌α-淀粉酶作为进行这些突变的主链。
从图1的对比可以看到,地衣形芽孢杆菌α-淀粉酶和解淀粉芽孢杆菌α-淀粉酶在与SP722中的K269相对应的位点有一个Glu。另外,嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的K269相对应的位点有一个Ser。因此,所述取代与这些α-淀粉酶无关。
另外,从图1的对比可以看到,解淀粉芽孢杆菌α-淀粉酶在与SP722中的L272相对应的位点有一个Ala,嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的L272相对应的位点有一个Ile。因此,所述取代与这些α-淀粉酶无关。
从图1的对比可以看到,芽孢杆菌菌株12512α-淀粉酶在与SP722中的L275相对应的位点有一个Ile。因此所述取代与该α-淀粉酶无关。
从图1的对比可以看到,解淀粉芽孢杆菌α-淀粉酶在与SP722中的Y295相对应的位点有一个Phe。另外,嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的Y295相对应的位点有一个Asn。因此,所述取代与这些α-淀粉酶无关。
从图1的对比可以看到,地衣形芽孢杆菌α-淀粉酶和解淀粉芽孢杆菌α-淀粉酶在与SP722中的K446相对应的位点有一个Asn。另外,嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的K446相对应的位点有一个His。因此,所述取代与这些α-淀粉酶无关。
从图1的对比可以看到,地衣形芽孢杆菌α-淀粉酶、解淀粉芽孢杆菌α-淀粉酶以及嗜热脂肪芽孢杆菌α-淀粉酶在与SP722中的P459相对应的位点有一个Ser。另外,芽孢杆菌菌株12512α-淀粉酶在与SP722中的P459相对应的位点有一个Thr。因此,所述取代与这些α-淀粉酶无关。
在中温有较高活性的酶的稳定化本发明另一个实施方案涉及提高低温α-淀粉酶(例如河豚毒素交替单胞菌(Feller等,(1994),欧洲生物化学杂志222441-447))和中温α-淀粉酶(例如SP722和SP690)的稳定性,这些酶具有中温活性,即通常称为嗜冷酶和嗜温酶。对于这一特定酶类,稳定性应理解为热稳定性或在钙耗竭条件下的稳定性。
通常,在中温显示高活性的酶在那些对酶有抑制作用的条件(比如温度或钙耗竭)下也会有严重问题。
从而,本发明的目的是提供在中温显示所需高活性,同时在轻微抑制条件下不丧失活性的酶。
应当优选稳定化变体于中温测定的活性是初始活性的100%或以上与50%之间,更优选在100%或以上与70%之间,最优选在100%或以上与85%之间,所述初始活性是酶在稳定化前在该特定温度的活性,并且得到的酶应能在抑制条件下比野生型的酶忍受更长时间的温育。
可以考虑的酶包括例如细菌或真菌来源的α-淀粉酶。
一例这类低温α-淀粉酶是分离自河豚毒素交替单胞菌(Feller等,(1994),欧洲生物化学杂志222441-447)的酶。已得到了该α-淀粉酶的晶体结构(Aghajari等,(1998),蛋白质科学7564-572)。
河豚毒素交替单胞菌α-淀粉酶(图4所示对比结果的5)与猪胰腺α-淀粉酶(PPA)(图4所示对比结果的3)大约66%同源。PPA3D结构是已知的,并且可从Brookhaven数据库中以1OSE或1DHK的名字获得。根据与其他更稳定的α-淀粉酶的同源性,可以使得来自河豚毒素交替单胞菌α-淀粉酶实现“低温高活性酶”的稳定化,并同时维持所需的中温高活性。
图4显示5个α-淀粉酶,包括AHA和PPAα-淀粉酶的多重序列对比。使河豚毒素交替单胞菌α-淀粉酶的稳定性提高的特异突变是T66P、Q69P、R155P、Q177R、A205P、A232P、L243R、V295P、S315R。
制备α-淀粉酶变体的方法几种将突变导入基因的方法是本领域已知的。简要讨论α-淀粉酶-编码DNA序列之后,将讨论在α-淀粉酶-编码序列中的特定位点产生突变的方法。
克隆编码α-淀粉酶的DNA序列可以利用多种本领域的公知方法,从任何能产生目的α-淀粉酶的细胞或微生物中分离编码亲本α-淀粉酶的DNA序列。首先,应当利用得自能产生目的α-淀粉酶的有机体的染色体DNA或信使RNA来构建基因组DNA和/或cDNA文库。然后,如果α-淀粉酶的氨基酸序列是已知的,可以合成并合成并用同源的、标记的寡核苷酸来由从目的有机体制备的基因组文库鉴定α-淀粉酶-编码克隆。另外,可以使用标记的寡核苷酸探针(该探针含有与已知α-淀粉酶基因同源的序列)作为探针,采用低严谨性杂交和洗涤条件来鉴定α-淀粉酶-编码克隆。
另一种鉴定α-淀粉酶-编码克隆的方法包括将基因组DNA片段插入表达载体(比如质粒),用所得基因组DNA文库转化α-淀粉酶阴性的细菌,以及随后将转化细菌铺到含有α-淀粉酶底物的琼脂上,从而能鉴定表达α-淀粉酶的克隆。
可选择地,可以通过已确立的标准方法来合成制备编码酶的DNA序列,例如S.L.Beaucage和M.H.Caruthers(1981)描述的磷酸脒方法或Matthes等(1984)描述的方法。在磷酸脒方法中,在例如自动DNA合成仪中合成寡核苷酸,将其纯化、退火、连接和克隆到合适的载体中。
最后,DNA序列可以是基因组和合成来源混合的、合成和cDNA来源混合的,或者基因组和cDNA来源混合的,其是依照标准技术,将合成的、基因组或cDNA来源的片段连接在一起而制备的(在合适时,对应完整DNA序列各部分的片段)。还可以如US4683202或R.K.Saiki等(1988)描述的,使用特异引物通过聚合酶链反应(PCR)来制备DNA序列。
表达α-淀粉酶变体根据本发明,可以利用表达载体将通过上述方法,或者通过本领域已知的任何替代方法制备的编码变体的DNA序列表达为酶的形式,载体通常包括调控序列,该序列编码启动子、操纵子、核糖体结合位点、翻译起始信号以及任选地,阻遏子基因或各种激活子基因。
携带编码本发明所述α-淀粉酶变体之DNA序列的重组表达载体可以是任何能方便地进行重组DNA操作的载体,且载体的选择通常取决于它将要导入的宿主细胞。因此,载体可以是自主复制的载体,即以染色体外个体存在的载体,其复制独立于染色体的复制,例如质粒、噬菌体或染色体外元件、微小染色体或人工染色体。可选择地,载体可以是这样的,当被导入宿主细胞时,它会整合到宿主基因组中,并与所整合到其中的染色体一起复制。
在所述载体中,DNA序列应当可操纵地连接到合适的启动子序列。该启动子可以是任何在所选宿主细胞中显示转录活性的DNA序列,并可以来源于编码宿主细胞的同源或异源蛋白质的基因。适于引导编码本发明所述α-淀粉酶变体的DNA序列的转录的合适的启动子序列是在所选宿主细胞中显示转录活性的序列,并可以来源于编码宿主细胞的同源或异源蛋白质的基因。适于引导编码本发明所述α-淀粉酶变体的DNA序列进行转录(特别是在细菌宿主中)的启动子的例子是大肠杆菌lac操纵子的启动子、天蓝色链霉菌琼脂糖酶基因dagA的启动子、地衣形芽孢杆菌α-淀粉酶(amyL)的启动子、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)的启动子、解淀粉芽孢杆菌α-淀粉酶(amyQ)的启动子、枯草芽孢杆菌xylA和xylB基因等的启动子。在真菌宿主中进行转录时,有用的启动子的例子是来源于这样一些基因的启动子,所述基因编码米曲霉TAKA淀粉酶、米赫氏根霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉葡糖淀粉酶、米赫氏根霉脂酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶。
本发明的表达载体还可以包含合适的转录终止子以及,在真核细胞中时的多腺苷酸化序列,它们与编码发明所述α-淀粉酶变体的DNA序列可操纵地连接在一起。终止和多腺苷酸化序列可以适当地来自与启动子相同的来源。
载体还可以包含能使载体在目的宿主细胞中进行复制的DNA序列。这类序列的例子是质粒pUC19、pACYC177、pUB110、pE194、pAMB1和pIJ702的复制原点。
载体还可以包含选择标记,例如一个其产物能补偿宿主细胞缺陷的基因,比如来自枯草芽孢杆菌或地衣形芽孢杆菌的dal基因;或者赋予抗生素抗性(比如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。另外,载体可以包含曲霉选择标记,比如amdS、argB、niaD和sC,产生潮霉素抗性的标记,或者可以通过共转化(例如WO91/17243中描述的)来实现选择。
胞内表达在某些方面可能是有益的,例如用某种细菌作为宿主细胞时,但通常优选表达是胞外的。总之,此处提及的芽孢杆菌α-淀粉酶包含一个允许被表达的蛋白酶分泌到培养基中的前导区。如果需要,可以方便地通过取代编码该前区的DNA序列来将该前区替换为不同的前导区或信号序列。
用于分别将编码α-淀粉酶变体、启动子、终止子和其他元件的本发明所述DNA构建体连接在一起,并将其插入合适的包含复制所用的必要信息之载体的步骤是本领域技术人员所熟知的(参考,例如,Sambrook等,分子克隆实验指南,第2版,Cold Spring Harbor,1989)。
本发明的细胞,它包含如上所述的本发明DNA构建体或表达载体,可以有效地作为重组制备本发明α-淀粉酶变体的宿主细胞。可以用本发明编码变体的DNA构建体,方便地通过将该构建体(以1或多拷贝)整合到宿主染色体中来转化所述细胞。通常认为整合是有益的,因为这样DNA序列更可能稳定地保持在细胞中。可以依照常规方法,例如通过同源或异源重组将DNA构建体整合到宿主染色体中。可选择地,可以根据宿主细胞的不同类型用上面描述过的表达载体来转化细胞。
本发明的细胞可以是更高等的生物,比如哺乳动物或昆虫的细胞,但优选是微生物细胞,比如细菌或真菌(包括酵母)细胞。
合适的细菌的例子是革兰氏阳性细菌,比如枯草芽孢杆菌、地衣形芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、巨大芽孢杆菌、苏云金芽孢杆菌,或者浅青紫链霉菌或鼠灰链霉菌,或者是革兰氏阴性细菌,比如大肠杆菌。可以通过例如原生质体转化或利用竞争细胞以已知方式来实现细菌的转化。
可以有利地从酵母属或裂殖酵母属中选择酵母微生物,例如酿酒酵母。丝状真菌最好是属于曲霉属的种,例如米曲霉或黑曲霉。可以通过一个包括原生质体形成和转化,以及随后以已知方式再生细胞壁的方法来转化真菌细胞。在EP238023中描述了转化曲霉宿主细胞的适用步骤。
再一方面,本发明涉及制备发明所述α-淀粉酶变体的方法,该方法包括在有助于变体生产的条件下培养以上描述的宿主细胞,以及从细胞和/或培养基中回收变体。
用于培养细胞的培养基可以是任何适合目的宿主细胞生长以及本发明所述α-淀粉酶变体进行表达的常规培养基。可以从供应商那里获得合适的培养基或者可以根据公开的配方(例如,美国典型培养物保藏中心的目录中所描述的)来制备。
可以通过公知方法从培养基中方便地回收宿主细胞所分泌的α-淀粉酶变体,这些方法包括通过离心或过滤从培养基中分离细胞,以及借助盐(比如硫酸铵)来沉淀培养基中的蛋白类成分,然后利用层析操作,比如离子交换层析、亲合层析等。
工业应用本发明的α-淀粉酶变体具备适合多种工业应用的有价值的特性。具体来说,本发明的酶变体可以作为洗涤、餐具清洗和硬金属表面清洁的洗涤剂组合物的成分。
许多变体在由淀粉生产甜味剂和乙醇,和/或纺织品退浆时尤其有用。在例如US3912590和欧洲专利公开号252730和63909中描述了在包括淀粉液化和/或糖化步骤的常规淀粉转化过程中使用的条件。
洗涤剂组合物如上所述,可以适当地将本发明的变体加入洗涤剂组合物中。涉及洗涤剂组合物相关成分的进一步的细节、在这类洗涤剂组合物中配制变体的合适方法以及洗涤剂组合物的有关类型,可以参考例如,WO96/23874和WO97/07202。
包含本发明变体的洗涤剂组合物可以另外含有1或多种其他酶,比如脂酶、角质酶、蛋白酶、纤维素酶、过氧化物酶或漆酶,和/或另一种α淀粉酶。
可以将本发明的α-淀粉酶变体以常规使用的浓度加入洗涤剂中。目前考虑可以将本发明的变体以相当于每升使用常规剂量水平洗涤剂的洗涤/餐具清洗液中含0.00001-1mgα-淀粉酶的用量加入。
本发明还涉及提供具有1)改变了的最适pH,和/或2)改变了的最适温度,和/或3)稳定性提高的α-淀粉酶的方法,该方法包括以下步骤i)通过将两个或多个实质不同的pH、温度和/或稳定性曲线的α-淀粉酶3D结构的分子动力学进行比较,确定(a)进行α-淀粉酶突变的目的位点和/或区域,ii)在所确定的位点和/或区域取代、添加和/或缺失1或多个氨基酸。
在本发明的实施方案中,将一个中温α-淀粉酶与一个高温α-淀粉酶进行比较。在另一个实施方案中,将低温α-淀粉酶与中温或高温α-淀粉酶进行比较。
进行比较的α-淀粉酶应当优选相互之间至少70%,优选80%,到90%,比如达到95%,特别是95%同源。
进行比较的α-淀粉酶可以是上面定义的类透阿米尔α-淀粉酶。在具体实施方案中,进行比较的α-淀粉酶是SEQ ID NO1到SEQ ID NO8所示的α淀粉酶。
在另一个实施方案中,所比较的目的α-淀粉酶的稳定性曲线是Ca2+依赖曲线。
材料和方法酶SP722(SEQ ID NO2,Novo Nodisk有售)透阿米尔TM(SEQ ID NO4,Novo Nodisk有售)SP690(SEQ ID NO1,Novo Nodisk有售)枯草芽孢杆菌SHA273见WO95/10603质粒pJE1包含编码SP722α-淀粉酶变体的基因(SEQ ID NO2),即该基因缺失了成熟蛋白质中氨基酸D183-G184所对应的6个核苷酸。JE1基因的转录由amyL启动子引导。该质粒还包含复制原点和来自质粒pUB110(Gryczan,TJ等,(1978),细菌杂志134318-329)的cat-基因,后者赋予对卡那霉素的抗性。
方法构建文库载体pDorK101可以用大肠杆菌/芽孢杆菌穿梭载体pDorK101(以下有描述)在大肠杆菌中导入突变,而不表达α-淀粉酶,然后以在芽孢杆菌中α-淀粉酶具有活性的方式进行修饰。如下构建载体在SEQ ID NO2SP722的5’编码区中的PstI位点,用一个含有大肠杆菌复制原点的1.2kb片段通过基因打断使pJE1中的JE1编码基因(缺失D183-G184的SP722)失活。所述片段是从pUC19(GenBank入册编号#X02514)经PCR扩增到的,扩增使用正向引物5’-gacctgcagtcaggcaacta-3’和反向引物5’-tagagtcgacctgcaggcat-3’。用PstI于37℃将PCR扩增产物和pJE1载体消化2小时。于室温连接pJE1载体片段和PCR片段1小时,并通过电转化转化到大肠杆菌中。所得载体命名为pDorK101。
滤膜筛选检测可以用该检测方法,依靠筛选温度设置来筛选较之亲本酶在高pH的稳定性提高的类透阿米尔α-淀粉酶变体,以及较之亲本酶在高pH和中温的稳定性提高的类透阿米尔α-淀粉酶变体。
高pH滤膜检测将芽孢杆菌文库铺在含有10μg/ml卡那霉素的TY琼脂板上的醋酸纤维素(OE67,Schleicher & Schuell,Dassel,Germany)和硝酸纤维素滤膜(Protran-Ba85,Schleicher & Schuell,Dassel,Germany)夹心上,于37℃保持至少21小时。将醋酸纤维素层放在TY琼脂板上。
铺板之后,但要在保温之前用针将每个滤膜夹心特异地标记一下,以便能够确定阳性变体在滤膜上的位置,并将结合了变体的硝酸纤维素滤膜转移到盛有甘氨酸-NaOH缓冲液(pH8.6-10.6)的容器中,于室温(可以在10-60℃变化)温育15分钟。将带有菌落的醋酸纤维素滤膜于室温保存在TY平板上待用。温育后,在含有1%琼脂糖、0.2%淀粉的甘氨酸-氢氧化钠缓冲液(pH8.6-10.6)的平板上检测残存的活性。用与滤膜夹心相同的方式标记带有硝酸纤维素滤膜的检测平板,并于室温培养2小时。移去滤膜后,用10%Lugol溶液将检测平板染色。降解淀粉的变体检测为深蓝色背景上的白色斑点,然后在保存平板上鉴定。在与第一次筛选相同的条件下将阳性变体重筛两次。
低钙滤膜检测将芽孢杆菌文库铺在含有关抗生素(例如卡那霉素或氯霉素)的TY琼脂板上的醋酸纤维素(OE67,Schleicher & Schuell,Dassel,Germany)和硝酸纤维素膜(Protran-Ba85,Schleicher & Schuell,Dassel,Germany)夹心上,于37℃保持至少21小时。将醋酸纤维素层放在TY琼脂板上。
铺板之后,但要在培养之前用针将每个滤膜夹心特异地标记一下,以便能够将阳性变体固定在滤膜上,将结合了变体的硝酸纤维素滤膜转移到盛有碳盐酸-碳酸氢盐缓冲液(pH8.5-10)和不同浓度(0.001mM-100mM)EDTA的容器中,将膜于室温温育1小时。将带有菌落的醋酸纤维素滤膜于室温保存在TY平板上待用。温育后,在含有1%琼脂糖、0.2%淀粉的碳酸盐-碳酸氢盐缓冲液(pH8.5-10)的平板上检测残存活性。以与滤膜夹心相同的方式标记带有硝酸纤维素滤膜的检测平板,并于室温培养2小时。移去滤膜后,用10%Lugol溶液将检测平板染色。降解淀粉的变体检测为深蓝色背景上的白色斑点,然后在保存平板上鉴定。在与第一次筛选相同的条件下将阳性变体重筛两次。
获得目的区域的方法有三个已知的细菌α-淀粉酶3D结构。两个是地衣形芽孢杆菌α-淀粉酶的,Brookhaven数据库1BPL(Machius等,(1995),分子生物学杂志246545-559)和1VJS(Song等,(1996),用于糖类163工程的酶(生物技术进展,12卷)。这两个结构在两个钙离子和一个钠离子的结合位点周围所谓B-结构域的地方缺少一段重要的结构。因此我们使用了α-淀粉酶BA2(WO96/23874,它是BANTM(SEQ ID NO5)和地衣形芽孢杆菌α-淀粉酶(SEQ ID NO4)的杂交体)的3D结构。在该结构的基础上,建立了地衣形芽孢杆菌α-淀粉酶和SP722α-淀粉酶的模型。
α-淀粉酶变体的发酵和纯化可以利用本领域公知的方法进行发酵和纯化。
稳定性测定全部稳定性实验使用相同的设置进行。方法是在相应条件(1-4)下温育酶。于不同时刻取样品,例如0、5、10、15和30分钟后,将样品在检测缓冲液(0.1M 50mM Britton缓冲液pH7.3)中稀释25倍(所有取样稀释度相同),并采用Phadebas检测法(Pharmacia)在标准条件(pH7.3,37℃)下测量活性。
以温育前(0分钟)测量的活性作为对照(100%)。将下降的百分比作为温育时间的函数来计算活性。表中显示在温育例如30分钟后的残存活性。
特异活性测定采用Phadebas检测法(Pharmacia)将特异活性确定为活性/mg酶。测定依照产品说明书进行(还可见以下“α-淀粉酶活性检测”)。
α-淀粉酶活性检测法1. Phadebas检测法通过一种采用Phadebas片剂作为底物的方法来测定α-淀粉酶的活性。Phadebas片剂(PhadebasAmylase Test,由Pharmacia Diagnostic提供)含有一种交联的不溶性兰色淀粉聚合物,该聚合物与牛血清白蛋白和缓冲物质混合在一起并做成片剂。
进行每次测量时,将一个药片悬浮于含有5ml 50mM Britton-Robinson缓冲液(50mM醋酸、50mM磷酸、50mM硼酸、0.1mM CaCl2、用NaOH调至所需pH)的试管中。于所需温度在水浴中进行实验。将待测α-淀粉酶在xml 50mM Britton-Robinson缓冲液中进行稀释。将1ml该α-淀粉酶溶液加入5ml 50mM Britton-Robinson缓冲液中。α-淀粉酶水解淀粉产生水溶性兰色碎片。在620nm比色测定到的所得兰色溶液的吸光度是α-淀粉酶活性的函数。
重要的是温育10或15分钟后测量的620nm吸光度应在0.2到2.0吸收单位内。在这样的吸光度范围内,活性和吸光度是线性关系(Lambert-Beer定律)。因此,必须调节酶的稀释度以便符合该法则。在特别设置的条件(温度、pH、反应时间、缓冲液条件)下,1mg给定α-淀粉酶将水解一定量的底物并产生兰色。在620nm测量兰色的强度。在给定条件下,所测得的吸光度与受测α-淀粉酶的特异活性直接成比例(活性/毫克纯α-淀粉酶蛋白质)。
2.替代方法通过一种采用PNP-G7作为底物的方法来确定α-淀粉酶的活性。PNP-G7(邻-硝基苯-α,D-麦芽庚糖苷的缩写)是一种被封闭的寡糖,可以被内-淀粉酶切割。切割之后,试剂盒中包含的α-葡糖苷酶消化底物释放出游离的PNP分子,它呈现黄色,因此可以在λ=405nm(400-420nm)的可见光处比色测量。包含PNP-G7底物和α-葡糖苷酶的试剂盒由Boehringer-Mannheim(cat.No.1054635)制造。
将一瓶底物加入5ml缓冲液(BM1442309)来制备底物。将一瓶α-葡糖苷酶(BM1462309)加入45ml缓冲液(BM1442309)来制备α-葡糖苷酶。将5mlα-葡糖苷酶与0.5ml底物混匀制得工作溶液。
将20μl酶溶液转移到一个96孔微量滴定板上并于25℃温育来进行检测。加入200μl工作溶液(25℃)。将溶液混匀,预保温1分钟,并在3分钟内每15秒测量一次OD405nm处的吸光度。
在给定条件设置下,随时间变化的吸光度曲线的斜率与受测α-淀粉酶特异活性(活性/毫克酶)直接成比例。
使用DOPE程序进行随机诱变的一般方法可以通过以下步骤进行随机诱变1.在亲本酶中选择目的修饰区域2.在所选区域内决定突变位点和非突变位点3.决定进行何种突变,例如相对要构建的变体的预期稳定性和/或性能4.选择结构上可行的突变5.相对步骤4来调整步骤3所选的残基6.利用合适的预测算法来分析核苷酸分布状态7.如果必要,根据遗传密码的可行性调节所需残基(例如,考虑遗传密码带来的限制(例如,为了避免导入终止密码子))(本领域技术人员应意识到某些密码子组合实际上不能用,需要进行调整)。
8.制备引物9.利用引物进行随机诱变10.通过筛选选择具有预期的改善特性的所得α-淀粉酶变体。
适用于步骤6的预测算法是本领域所公知的。Tomandl,D.等(计算机辅助的分子设计杂志,11(1997),29-38)描述了一种算法。以下描述另一种DOPE算法预测算法“DOPE”程序是一种可用来以一定方式优化三联密码子的核苷酸组成的算法,从而,三联密码子能编码与所需氨基酸分布最相似的氨基酸分布。为了评价哪一个可能的分布状态与所需氨基酸分布最相似,需要一个评分公式。在“DOPE”程序中,发现以下函数是合适的s≡Πi=1N(xiyiyiyi(1-xi)1-yi(1-yi)1-yi)wi,]]>
其中Xi’是通过该程序计算得到的氨基酸和氨基酸组的数量,yi’是程序使用者定义的氨基酸和氨基酸组的希望量(例如,明确需要导入20个氨基酸或终止密码子中的哪一个,比如体现为一定的百分比(例如,90%Ala、3%Ile、7%Val)),wi’是由程序使用者定义的重要因素(例如,取决于将某个特定氨基酸残基插入所需位点的重要性)。N是21加上由程序使用者定义的氨基酸组的数量。用于该函数,规定0°为1。
利用Monte-Carlo算法(Valleau,J.P.& Whittington,S.G.(1977)描述过一个例子A guide to Mont Carlo for statictical mechanics1 highways。《统计力学,Part A平衡技术》B.J.Berne编,New YorkPlenum)来找出该函数的最大值。在每次迭代中进行以下步骤1.给每个碱基选择一个新的随机核苷酸组成,其中对于密码子所有三个位置的4种核苷酸G、A、T、C之一,目前和新组成之间的绝对差小于或等于d(参见以下d的定义)。
2.利用以上描述的函数s来比较新组成和目前组成的评分。如果新评分高于或等于目前组成的评分,保留新组成,将目前组成改为这个新的。如果新评分小,保留该组成的概率为exp(1000(新评分-目前评分))。
一个循环通常包括1000次上述迭代,其中的d由1线性降低至0。在一个优化过程中,进行100或更多次循环。最终得到产生最高评分的核苷酸组成。
实施例实施例1同源构建透阿米尔TM的实施例地衣形芽孢杆菌α-淀粉酶与其他类透阿米尔α-淀粉酶的总的同源性很高,相似百分比极高。用Wisconsin大学Genetics Computer Group的程序GCG计算的透阿米尔TM与BSG(具有SEQ ID NO3的嗜热脂肪芽孢杆菌α-淀粉酶)和BAN(具有SEQ ID NO5的解淀粉芽孢杆菌α-淀粉酶)的相似率分别为89%和78%。与BANTM和BSG相比,TERM缺失残基G180和K181这两个残基。与BAN和透阿米尔TM相比,BSG在G371和I372之间缺失3个残基。另外与BANTM和透阿米尔TM相比,BSG在羧基端多出20个残基。与BSG 相比,在氨基端,BANTM少2个残基,透阿米尔TM少1个残基。
在WO96/23974附录1所公开的结构的基础上,建立地衣形芽孢杆菌(透阿米尔TM)和解淀粉芽孢杆菌α-淀粉酶(BANTM)的结构模型。可以类似地建立其他类透阿米尔α-淀粉酶(例如文中公开的)的结构。
与用来描述当前结构的α-淀粉酶相比,透阿米尔TM的区别在于它在178-182位附近缺少两个残基。为了在模型结构中补偿这一点,用BIOSYM的HOMOLOGY程序来取代该结构(不仅是结构保守的区域)中等同位点处的残基,缺失位点除外。使透阿米尔TM(BANTM)中的G179(G177)和K180(K180)之间形成肽键。在模型中只发现有很少几个原子过于接近,这表明求解结构和模型结构之间结构关系密切(因此,后者是有效的)。
然后利用INSIGHT程序给这个非常粗略的透阿米尔TM结构在与求解结构相同的坐标处加上所述求解结构中的水(605)和离子(4个钙和1个钠)。这可以在只有很少的重叠下做到,换句话说,即吻合得很好。然后利用200步Steepest下降和600步共轭梯度(Conjugated gradient)对该模型结构进行最小化(参见Brook等,1983,计算化学杂志4187-217)。然后对最小化了的结构进行分子动力学处理,加热5皮秒,随之平衡至多200皮秒但要在35皮秒以上。用Verlet算法进行动力学,利用偶联至水浴的Behrendsen(Behrendsen等,1984,化学物理学杂志813684-3690)保持300K的平衡温度。每皮秒去除旋转和翻译。
实施例2提取鉴定pH稳定性提高和温度活性改变的α-淀粉酶变体的重要区域的方法对目的酶(此处是SP722和透阿米尔TM)的X-射线结构和/或建立的模型结构进行分子动力学模拟。利用CHARMM程序(得自分子模拟(MSI)程序或其他的合适程序,例如DISCOVER(来自MSI)做分子动力学模拟。在真空中进行分子动力学分析,更优选的是包含结晶水,或用包埋在水中(例如水球或水箱)的酶来进行。模拟进行300皮秒或更长时间,例如300-1200皮秒。提取结构中CA碳的各向同性波动,并在结构间进行比较。如果序列有缺失和/或插入,插入来自其他结构的各向同性波动从而使各向同性波动的差异为0。对各向同性波动的解释见CHARMM手册(可从MSI获得)。
可以利用标准电荷在可带电的氨基酸上进行分子动力学模拟。即令Asp和Glu带负电,Lys和Arg带正电。该条件类似大约7的中性pH。为了分析更高或更低pH,可以滴定分子以便使标准的可滴定残基的pKa(通常在pH2-10)发生改变,可滴定残基是Lys、Arg、Asp、Glu、Tyr和His,还有Ser、Thr和Cys也是可滴定的,但此处不考虑在内。此处将由pH导致的电荷改变描述为Asp和Glu在高pH带负电,Arg和Lys不带电。这是模拟10到11左右的pH,此时开始滴定Lys和Arg,因为这些残基正常pKa在9-11左右。
1.提取鉴定高pH稳定性之α-淀粉酶变体的重要区域的方法对于构建高pH稳定性的变体来说,重要的区域是那些在极端pH显示出最高可变性的区域,即有最高各向同性波动的区域。
通过进行两次分子动力学模拟来鉴定这种区域i)一次高pH运行,这时将碱性氨基酸Lys和Arg看作是中性的(即非质子化的),酸性氨基酸Asp和Glu带(-1)电荷和ii)一次中性pH运行,碱性氨基酸Lys和Arg带有(+1)净电荷,酸性氨基酸带有(-1)电荷。
比较这两次运行,鉴定出在高pH比在中性pH分析下可变性更高的区域。
导入这样一些残基,这些残基能提高总的稳定性(例如氢键)、使该区域更刚性(通过突变,比如用脯氨酸取代或替换甘氨酸残基)、或者提高电荷或它们的相互作用均能够提高酶的高pH稳定性。
2.提取鉴定中温活性提高之α-淀粉酶变体的区域的方法对于构建中温活性提高之变体来说,重要的区域反映在SP722和透阿米尔各向同性波动的差值,即SP722减去透阿米尔CA的各向同性波动。选择各向同性波动中具有最高可变性的区域。预计这些区域和残基能提高酶在中温的活性。只有存在可变性正确的特定残基,才能表达α-淀粉酶的活性。如果残基的可变性太低,活性将下降或丧失。
实施例3通过定域随机、预测的诱变来构建在中温Ca2+稳定性比亲本酶提高的类透阿米尔α-淀粉酶变体为了提高α-淀粉酶在低钙浓度下的稳定性,在预选区域进行随机诱变。
区域 残基SAIR181-W189
利用DOPE软件(参见材料与方法)确定出SA1区中每个建议变化的峰值密码子,这些变化能减少终止密码子的数量(见表1)。计算密码子三个位置处的确切核苷酸分布状态以便给出氨基酸变化的建议数目。针对预测区域中的指定位点进行具体预测从而更可能得到所需残基,但仍允许其他可能性。
表1每个位点氨基酸残基的分布状态R181 72%R、 2%N、 7%Q、 4%H、 4%K、 11%SG182 73%G、 13%A、 12%S、 2%TK185 95%K、 5%RA186 50%A、 4%N、 6%D、 1%E、 1%G、 1%K、 5%S、31%TW187;100%WD188100%DW18992%W、8%S将所得预测的寡核苷酸链作为有义链在表2中显示野生型核苷酸和氨基酸序列以及每个预测位点的核苷酸分布状态。
表2位点181 182 185 186 187 188 189氨基酸序列 Arg Gly Lys Ala Thr Asp Thr野生型核苷酸序列cga ggt aaa gct tgg gat tgg正向引物(SEQ ID NO15)FSA5’-caa aat cgtatc tac aaa ttc 123 456 a7g 8910 tgg gat tllg gaa gtagat tcg gaa aat-3’每个预测位点的核苷酸分布状态1 35%A, 65%C2 83%G, 17%A3 63%G, 37%T4 86%G, 14%A5 85%G, 15%C6 50%T, 50%C7 95%A, 5%G
858%G, 37%A, 5%T986%C, 13%A, 1%G1083%T, 17%G1192%G, 8%C反向引物(SEQ ID NO6)RSA5’-gaa ttt gta gat acg att ttg-3’随机诱变利用表2中明显的峰值寡核苷酸(用一个常用术语称为FSA)和用于SA1区域的反向引物RSA以及跨越SacII和DraIII位点的SEQ ID NO2SP722特异引物,经重叠延伸法(Horton等,基因77(1989)61-68)来制备具有21个碱基对重叠的PCR-文库片段。质粒pJE1作为聚合酶链反应的模板。将PCR片段克隆到大肠杆菌/芽孢杆菌穿梭载体pDork101(见材料与方法)中,该载体能在大肠杆菌中进行诱变,在枯草芽孢杆菌中瞬时表达从而防止大肠杆菌中淀粉酶致死性的累积。将克隆的PCR片段导入大肠杆菌中后,从质粒中切下修饰过的pUC19片段,将启动子和突变了的透阿米尔基因物理地连接在一起,在芽孢杆菌中进行表达。
筛选可以用前面“材料与方法”部分描述的低钙滤膜检测法来筛选文库。
实施例4构建淀粉酶SEQ ID NO1(SP690)的变体将编码SEQ ID NO1之淀粉酶的基因放入WO96/23873中描述的质粒pTVB106中。从该构建体中的amyL启动子开始在枯草芽孢杆菌中表达淀粉酶。
蛋白质的一个变体是Δ(T183-G184)+Y243F+Q391E+K444Q。WO96/23873中描述了该变体的构建过程。
经Sarkar和Sommer(1990,生物技术8404-407)所描述的mega-引物法来构建Δ(T183-G184)+N195F。
利用基因特异引物B1(SEQ ID NO17)和诱变引物101458(SEQ IDNO19)经PCR来扩增一个接近645bp的DNA片段,该片段来自类pTVB106质粒(在编码SEQ ID NO1之淀粉酶的基因中含有Δ(T183-G184)突变)。
从琼脂糖凝胶中纯化该645bp片段,并与引物Y2(SEQ ID NO18)一起作为在同一模板上进行的第2次PCR中的mega-引物。
用限制酶BstEII和AflIII消化所得近1080bp的片段,纯化产生的约510bp的DNA片段,并将其与用相同酶消化过的类pTVB106质粒(在编码SEQ ID NO1的淀粉酶的基因中含有Δ(T183-G184)突变)进行连接。用连接产物和氯霉素抗性转化子来转化感受态枯草芽孢杆菌SHA273(淀粉酶和蛋白酶低)细胞,并经DNA测序检测来证明质粒中正确的突变存在。
引物B1(SEQ ID NO17)5’CGA TTG CTG ACG CTG TTA TTT GCG 3’引物Y2(SEQ ID NO18)5’CTT GTT CCC TTG TCA GAA CCA ATG 3’引物101458(SEQ ID NO19)5’GT CAT AGT TGC CGA AAT CTG TAT CGA CTT C 3’以相似的方法构建变体Δ(T183-G184)+K185R+A186T,除了所用诱变引物为101638外。
引物101638(SEQ ID NO20)5’CC CAG TCC CAC GTA CGT CCC CTG AAT TTA TAT ATT TTG 3’以相似的方法来构建变体Δ(T183-G184)+A186T、Δ(T183-G184)+A186I、Δ(T183-G184)+A186S、Δ(T183-G184)+A186N,除了所用模板为类pTVB106质粒(携有变体Δ(T183-G184)+K185R+A186T),并用它作为克隆载体。
诱变寡核苷酸(Oligol)是5’CC CAG TCC CAG NTCTTT CCC CTG AAT TTA TAT ATT TTG3’(SEQ ID NO21)N代表用于合成诱变寡核苷酸(mutagenicoli-gonucleotide)的4种碱基A、C、G和T的混合物。
测定转化子的序列来确定成熟淀粉酶中186位氨基酸的正确密码子。
如下构建变体Δ(T183-G184)+K185R+A186T+N195F用引物X2和引物101458在类pTVB106质粒(携有突变Δ(T183-G184)+K185R+A186T)上进行PCR。将所得DNA片段与引物Y2一起作为在类pTVB106质粒(携有突变Δ(T183-G184)+N195F)上进行的PCR中的mega-引物。用限制性内切酶Acc65I和AflIII消化第2次PCR的产物,并将其克隆至用相同的酶消化过的类pTVB106质粒(Δ(T183-G184)+N195F)。
引物X2(SEQ ID NO22)5’GCG TGG ACA AAG TTT GAT TTT CCT G 3’如下构建变体Δ(T183-G184)+K185R+A186T+N195F+Y243F+Q391E+K444Q用引物X2(SEQ ID NO22)和引物10+K185R1458(SEQ ID NO19)在类pTVB106质粒(携有突变Δ(T183-G184)+K185R+A186T)上做PCR。将所得DNA片段与引物Y2(SEQ ID NO18)一起作为在类pTVB106质粒(携有突变Δ(T183-G184)+Y243F+Q391E+K444Q)上进行的PCR中的mega-引物。用限制性内切酶Acc65I和AflIII消化第2次PCR的产物,并将其克隆至用相同的酶消化过的类pTVB106质粒(Δ(T183-G1 84)+Y243F+Q391E+K444Q)。
实施例5构建亲本SP722α-淀粉酶(SEQ ID NO2)的定点α-淀粉酶变体如下所述构建淀粉酶SEQ ID NO2(SP722)的变体。
将编码SEQ ID NO2之淀粉酶的基因转入WO96/23873中描述的质粒pTVB112中。从该构建体中的amyL启动子开始在枯草芽孢杆菌中表达淀粉酶。
经Sarkar和Sommer(1990,生物技术8404-407)所描述的mega-引物法来构建Δ(D183-G184)+V56I。
利用基因特异引物DA03和诱变引物DA07经PCR来扩增一个接近820bp的DNA片段,该片段来自类pTVB112质粒(在编码SEQ ID NO2之α-淀粉酶的基因中含有Δ(D183-G184)突变)。
从琼脂糖凝胶中纯化该820bp片段,并与引物DA01一起作为在同一模板上进行的第2次PCR中的mega-引物。
用限制酶NgoM I和Aat II消化所得近920bp的片段,纯化产生的约170bp的DNA片段,并将其与用相同酶消化过的类pTVB112质粒(在编码SEQ ID NO2所示淀粉酶的基因中含有Δ(D183-G184)突变)进行连接。用连接产物来转化感受态枯草芽孢杆菌SHA273(淀粉酶和蛋白酶低)细胞,并经DNA测序检测氯霉素抗性转化子来证明质粒上含有正确的突变。
引物DA01(SEQ ID NO23)5’CCTAATGATGGGAATCACTGG 3’引物DA03(SEQ ID NO24)5’GCATTGGATGCTTTTGAACAACCG 3’引物DA07(SEQ ID NO25)5’CGCAAAATGATATCGGGTATGGAGCC 3’经Sarkar和Sommer(1990,生物技术8404-407)描述的mega-引物法来构建变体Δ(D183-G184)+K108L、Δ(D183-G184)+K108Q、Δ(D183-G184)+K108E、Δ(D183-G184)+K108V。
用引物DA03和诱变引物DA20在类pTVB112质粒(携有突变Δ(D183-G184))上做PCR。将所得DNA片段与引物DA01一起作为在类pTVB112质粒(携有突变Δ(D183-G184))上进行的PCR中的mega-引物。用限制性内切酶Aat II和Mlu I消化约920bp的第2次PCR的产物,并将其克隆至用相同的酶消化过的类pTVB112质粒(Δ(D183-G184))。
引物DA20(SEQ ID NO26)5’GTGATGAACCACSWAGGTGGAGCTGATGC 3’S代表用于合成诱变寡核苷酸的2种碱基C和G的混合物,W代表用于合成诱变寡核苷酸的2种碱基A和T的混合物。
测定转化子的序列来确定成熟淀粉酶中108位氨基酸的正确密码子。
以相似的方法构建变体Δ(D183-G184)+D168A、Δ(D183-G184)+D168I、Δ(D183-G184)+D168V、Δ(D183-G184)+D168T,除了所用诱变引物为DA14。
引物DA14(SEQ ID NO27)5’GATGGTGTATGGRYCAATCACGACAATTCC 3’R代表用于合成诱变寡核苷酸的2种碱基A和G的混合物,Y代表用于合成诱变寡核苷酸的2种碱基C和T的混合物。
测定转化子的序列来确定成熟淀粉酶中168位氨基酸的正确密码子。
以相似的方法构建变体Δ(D183-G184)+Q169N,除了所用诱变引物为DA15。
引物DA15(SEQ ID NO28)
5’GGTGTATGGGATAACTCACGACAATTCC 3’以相似的方法构建变体Δ(D183-G184)+Q169L,除了所用诱变引物为DA16。
引物DA16(SEQ ID NO29)5’GGTGTATGGGATCTCTCACGACAATTCC 3’以相似的方法构建变体Δ(D183-G184)+Q172N,除了所用诱变引物为DA17。
引物DA17(SEQ ID NO30)5’GGGATCAATCACGAAATTTCCAAAATCGTATC 3’以相似的方法构建变体Δ(D183-G184)+Q172L,除了所用诱变引物为DA18。
引物DA18(SEQ ID NO31)5’GGGATCAATCACGACTCTTCCAAAATCGTATC 3’以相似的方法构建变体Δ(D183-G184)+L201I,除了所用诱变引物为DA06。
引物DA06(SEQ ID NO32)5’GGAAATTATGATTATATCATGTATGCAGATGTAG 3’以相似的方法构建变体Δ(D183-G184)+K269S,除了所用诱变引物为DA09。
引物DA09(SEQ ID NO33)5’GCTGAATTTTGGTCGAATGATTTAGGTGCC 3’以相似的方法构建变体Δ(D183-G184)+K269Q,除了所用诱变引物为DA11。
引物DA11(SEQ ID NO34)5’GCTGAATTTTGGTCGAATGATTTAGGTGCC 3’以相似的方法构建变体Δ(D183-G184)+N270Y,除了所用诱变引物为DA21。
引物DA21(SEQ ID NO35)5’GAATTTTGGAAGTACGATTTAGGTCGG 3’以相似的方法构建变体Δ(D183-G184)+L272A、Δ(D183-G184)+L272I、Δ(D183-G184)+L272V、Δ(D183-G184)+L272T,除了所用诱变引物为DA12。
引物DA12(SEQ ID NO36)5’GGAAAAACGATRYCGGTGCCTTGGAGAAC 3’R代表用于合成诱变寡核苷酸的2种碱基A和G的混合物,Y代表用于合成诱变寡核苷酸的2种碱基C和T的混合物。
测定转化子的序列来确定成熟淀粉酶中272位氨基酸的正确密码子。
以相似的方法构建变体Δ(D183-G184)+L275A、Δ(D183-G184)+L275I、Δ(D183-G184)+L275V、Δ(D183-G184)+L275T,除了所用诱变引物为DA13。
引物DA13(SEQ ID NO37)5’GATTTAGGTGCCTRYCAGAACTATTTA 3’R代表用于合成诱变寡核苷酸的2种碱基A和G的混合物,Y代表用于合成诱变寡核苷酸的2种碱基C和T的混合物。
测定转化子的序列来确定成熟淀粉酶中275位氨基酸的正确密码子。
以相似的方法构建变体Δ(D183-G184)+Y295E,除了所用诱变引物为DA08。
引物DA08(SEQ ID NO38)5’CCCCCTTCATGAGAATCTTTATAACG 3’以Sarkar和Sommer(1990,生物技术8404-407)描述的mega-引物法来构建变体Δ(D183-G184)+K446Q。
利用基因特异引物DA04(该引物在终止密码子下游214-231bp退火)和诱变引物DA10经PCR来扩增一个接近350bp的DNA片段,该片段来自类pTVB112质粒(在编码SEQ ID NO2的淀粉酶的基因中含有Δ(D183-G184)突变)。
将所得DNA片段与引物DA05一起作为在类pTVB112质粒(携有突变Δ(D183-G184))上进行的PCR中的mega-引物。用限制性内切酶SnaB I和NotI消化约460bp的第2次PCR产物,并将其克隆至用相同的酶消化过的类pTVB106质粒(携有Δ(D183-G184)突变)。
引物DA04(SEQ ID NO39)5’GAATCCGAACCTCATTACACATTCG 3’引物DA05(SEQ ID NO40)
5’CGGATGGACTCGAGAAGGAAATACCACG 3’引物DA10(SEQ ID NO41)5’CGTAGGGCAAAATCAGGCCGGTCAAGTTTGG 3’以相似的方法构建变体Δ(D183-G184)+K458R,除了所用诱变引物为DA22。
引物DA22(SEQ ID NO42)5’CATAACTGGAAATCGCCCGGGAACAGTTACG 3’以相似的方法构建变体Δ(D183-G184)+P459S和Δ(D183-G184)+P459T,除了所用诱变引物为DA19。
引物DA19(SEQ ID NO43)5’CTGGAAATAAAWCCGGAACAGTTACG 3’W代表用于合成诱变寡核苷酸的2种碱基A和T的混合物。
测定转化子的序列来确定成熟淀粉酶中495位氨基酸的正确密码子。
以相似的方法构建变体Δ(D183-G184)+T461P,除了所用诱变引物为DA23。
引物DA23(SEQ ID NO44)5’GGAAATAAACCAGGACCCGTTACGATCAATGC 3’以相似的方法构建变体Δ(D183-G184)+K142R,除了所用诱变引物为DA32。
引物DA32(SEQ ID NO45)5’GAGGCTTGGACTAGGTTTGATTTTCCAG 3’以相似的方法构建变体Δ(D183-G184)+K269R,除了所用诱变引物为DA31。
引物DA31(SEQ ID NO46)5’GCTGAATTTTGGCGCAATGATTTAGGTGCC 3’实施例6构建亲本透阿米尔α-淀粉酶(SEQ ID NO4)的定点α-淀粉酶变体将编码透阿米尔α-淀粉酶的amyL基因转入WO96/10603(NovoNordisk)中描述的质粒pDN1528中。通过WO97/41213或上面描述的“mega引物法”来构建分别携带所述亲本α-淀粉酶中N265R和N265D取代的变体。
诱变寡核苷酸是用于N265R取代的引物b115’PCC AGC GCG CCT AGG TCA CGC TGC CAA TAT TCA G(SEQ IDNO56)用于N265D取代的引物b125’PCC AGC GCG CCT AGG TCA TCC TGC CAA TAT TCA G(SEQ IDNO57)P代表磷酸根基团。
实施例7确定具有SEQ ID NO2所示氨基酸序列的亲本α-淀粉酶之变体在碱性pH的pH稳定性在这组分析中,利用了纯化的酶样品。用在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量。将溶液在75℃温育。
温育20和30分钟后,用PNP-G7检测法(在“材料与方法”部分描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和75℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO2)和受测变体的一个函数。<ta
>在另一组分析中,使用了培养物上清液。用溶在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量。将溶液在80℃温育。
温育30分钟后,用Phadebas检测法(在上述“材料与方法”部分描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和80℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO2)和受测变体的一个函数
实施例8确定氨基酸序列如SEQ ID NO1、SEQ ID NO2和SEQ ID NO4所示的亲本α-淀粉酶之变体在碱性pH的钙稳定性ASEQ ID NO1序列之变体的钙稳定性用溶在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量,并在(时间t=0时)向其中加入聚磷酸盐至终浓度为2400ppm。将溶液于50℃温育。
温育20和30分钟后,用PNP-G7检测法(上面描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和50℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO1)和受测变体的一个函数
<p>n.d.=未测B. SEQ ID NO2序列之变体的钙稳定性在这组分析中使用了纯化的酶样品。用溶在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量,并在(时间t=0时)向其中加入聚磷酸盐至终浓度为2400ppm。将溶液于50C温育。
温育20和30分钟后,用PNP-G7检测法(上面描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和50℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO2)和受测变体的一个函数。
在这组分析中使用了培养物上清液。用溶在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量,并在(时间t=0时)向其中加入聚磷酸盐至终浓度为2400ppm。将溶液于50℃温育。
温育30分钟后,用Phadebas检测法(上面描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和50℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO2)和受测变体的一个函数。
C. SEQ ID NO4中序列之变体的钙稳定性用溶在100mM CAPS缓冲液(调至pH10.5)中的各变体溶液进行测量,并加入聚磷酸盐(在时间t=0)至终浓度为2400ppm。将溶液于60℃温育20分钟。
温育20分钟后,用PNP-G7检测法(上面描述过)测量残存活性。用Britton Robinson缓冲液(pH7.3)测量样品中的残存活性。测量残存活性相对0分钟时同一酶的相应对照溶液的下降值,所述对照溶液未在高pH和60℃温育。
在下表中将初始活性的百分比作为亲本酶(SEQ ID NO4)和受测变体的一个函数。
<p>实施例9在中温测量氨基酸序列如SEQ ID NO1所示之α-淀粉酶的活性ASEQ ID NO1中序列的变体的α-淀粉酶活性用溶在50mM Britton Robinson缓冲液(调节至pH7.3)中的各变体溶液,利用Phadebas检测法(上面描述过)进行测量。在37℃用50mM BrittonRobinson缓冲液(pH7.3),并在25℃用50mM CAPS缓冲液(pH10.5)测量样品中的活性。
下表显示亲本酶(SEQ ID NO1)和受测变体的温度依赖活性和在25℃的活性相对37℃活性的百分比。
用溶在50mM Britton Robinson缓冲液(调至pH7.3)中的各变体溶液,采用Phadebas检测法(上面描述过)进行另一项测量。于37℃和50℃用50mMBritton Robinson缓冲液(pH7.3)测量样品中的活性。
下表显示亲本酶(SEQ ID NO1)和受测变体的温度依赖活性以及在37℃的活性相对50℃的活性的百分比。
BSEQ ID NO2中的序列的变体的α-淀粉酶活性用溶在50mM Britton Robinson缓冲液(调至pH7.3)中的各变体溶液,采用Phadebas检测法(上面描述过)进行测量。于25℃和37℃用50mM BrittonRobinson缓冲液(pH7.3)测量样品中的酶活性。
下表显示亲本酶(SEQ ID NO2)和受测变体的温度依赖活性以及在25℃活性相对37℃活性的百分比。<
NO4中的序列的变体的α-淀粉酶活性用溶在50mM Britton Robinson缓冲液(调至pH7.3)中的各变体溶液,采用Phadebas检测法(上面描述过)进行测量。在37℃用50mM Britton Robinson缓冲液(pH7.3),并在60℃用50mM CAPS缓冲液(pH10.5)测量样品中的活性。
下表显示亲本酶(SEQ ID NO4)和受测变体的温度依赖活性以及在37℃活性相对60℃活性的百分比。<
/透阿米尔301-483的基因以及可在枯草芽孢杆菌中使用的复制原点和赋予氯霉素抗性的cat基因。
采用mega-引物法(Sarkar和Sommer,1990),以质粒pTVB191为模板来构建变体BM4(F290E)。
用引物p1(SEQ ID NO52)和诱变寡核苷酸bm4(SEQ ID NO47)经聚合酶链反应(PCR)在标准条件下扩增一个444bp的片段。
从琼脂糖凝胶上纯化该片段,并与引物p2(SEQ ID NO53)一起作为第2次PCR的“mega-引物”,产生一个531bp的片段。用限制内切酶HinDIII和Tth111T消化该片段。将这样产生的389bp片段连接到用相同的两种酶切割过的质粒pTVB191中。将所得质粒转化至枯草芽孢杆菌SHA273中。通过在含有氯霉素和不溶性淀粉的平板上培养转化子来挑选出氯霉素抗性克隆。用碘蒸汽将平板染色后,选出形成晕圈的克隆,即分离到了表达活性α-淀粉酶的克隆。经DNA测序来证实所导入的突变。
以类似的方法构建变体BM5(F290K)、BM6(F290A)、BM8(Q360E)和BM11(N102D)。以下给出构建这些变体的细节。
变体BM5(F290K)诱变寡核苷酸bm5(SEQ ID NO48)引物(第一次PCR)p1(SEQ ID NO52)所得片段的大小444bp引物(第二次PCR)p2(SEQ ID NO53)限制内切酶HinD III、Tth111I切割片段的大小389bp变体BM6(F290A)诱变寡核苷酸bm6(SEQ ID NO49)引物(第一次PCR)p1(SEQ ID NO52)所得片段的大小444bp引物(第二次PCR)p2(SEQ ID NO53)限制内切酶HinD III、Tth111I切割片段的大小389bp变体BM8(Q360E)诱变寡核苷酸bm8(SEQ ID NO50)引物(第一次PCR)p1(SEQ ID NO52)所得片段的大小230bp引物(第二次PCR)p2(SEQ ID NO53)限制内切酶HinD III、Tth111I切割片段的大小389bp
变体BM11(N102D)诱变寡核苷酸bm11(SEQ ID NO51)引物(第一次PCR)p3(SEQ ID NO54)所得片段的大小577bp引物(第二次PCR)p4(SEQ ID NO55)限制内切酶HinD III、Pvu I切割片段的大小576bp诱变寡核苷酸bm4(SEQ ID NO47)F290E引物5’GTG TTT GAC GTC CCG CTT CAT GAG AAT TTA CAG Gbm5(SEQ ID NO48)F290K引物5’GTG TTT GAC GTC CCG CTT CAT AAG AAT TTA CAG Gbm6(SEQ ID NO49)F290A引物5’GTG TTT GAC GTC CCG CTT CAT GCC AAT TTA CAG Gbm8(SEQ ID NO50)Q360E引物5’AGG GAA TCC GGA TAC CCT GAG GTT TTC TAC GGbm11(SEQ ID NO51)N102D引物5’GAT GTG GTT TTG GAT CAT AAG GCC GGC GCT GAT G其他引物p15’CTG TTA TTA ATG CCG CCA AAC C(SEQ ID NO52)p25’G GAA AAG AAA TGT TTA CGG TTG CG(SEQ ID NO53)p35’G AAA TGA AGC GGA ACA TCA AAC ACG(SEQ ID NO54)p45’GTA TGA TTT AGG AGA ATT CC(SEQ ID NO55)实施例11亲本杂交体BAN1-300/透阿米尔301-483 α-淀粉酶变体在碱性pH下的α-淀粉酶活性用各酶的溶液,采用Phadebas检测法(上面描述过)进行测量。在50mMBritton Robinson缓冲液(用NaOH调至所需pH)中于30℃温育15分钟后,测量活性。NU/mg酶pH wt Q360E F290A F290K F290EN102D8.0 5300780083004200660062009.0 160027003400210019001900引用文献Klein,C.等,生物化学1992,318740-8746,Mizuno,H.等,分子生物学杂志(1993)2341282-1283,Chang,C.等,分子生物学杂志(1993)229235-238,Larson,S.B.,分子生物学杂志(1994)2351560-1584Lawson,C.L,分子生物学杂志(1994)236590-600,Qian,M.,等,分子生物学杂志(1993)231785-799,Brady,R.L.等,Acta Crystallogr.sect.B.47527-535,Swift,H.J.,等,Acta Crystallogr.sect.B.47535-544,A.Kadziola,博士论文“大麦α-淀粉酶及采用X-射线晶体学研究的其与底物类似物抑制剂形成的复合体”,哥本哈根大学化学系1993MacGregor,E.A.,Food Hydrocolloids,1987,1卷,5-6B.Diderichsen和L.Christiansen,来自嗜热脂肪芽孢杆菌的产麦芽糖的α-淀粉酶的克隆,FEMS微生物快报5653-60(1988)Hudson等,实用免疫学,第3版(1989),Blackwell Scientific Publications,Sambrook等,分子克隆实验指南,第2版,Cold Spring Harbor,1989S.L.Beaucage和M.H.Caruthers,面体快报22,19811859-1869Matthes等,EMBO杂志3,1984801-805。R.K.Saiki等,科学239,1988487-491。Morinaga等,1984,生物技术2646-639Nelson和Long,分析生物化学180,1989147-151Hunkapiller等,1984,自然310105-111R.Higuchi,B.Krummel和R.K.Saiki(1988)。DNA片段体外制备和特异突变的一般方法蛋白质和DNA相互作用的研究。核酸研究167351-7367。
Dubnau等,1971,分子生物学杂志56209-221。
Gryczan等,1978,细菌杂志134318-329。
S.D.Erlich,1977,Proc.Natl.Acad.Sci.741680-1682。
Boel等,1990,生物化学296244-6249。
序列表(1)一般资料(i)申请人(A)姓名Novo Nordisk A/S(B)街道Novo Alle(C)城市DK-2880 Bagsvaerd(E)国家丹麦(F)邮政编码(ZIP)DK-2880(G)电话+45 44 44 88 88(H)传真+45 44 49 32 56(ii)发明题目α-淀粉酶变体(iii)序列数46(iv)计算机可读形式(A)介质类型软盘(B)计算机IBMPC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Release#1.0,Version#1.25(EPO)(2)SEQ ID NO1的资料(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO1His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr1 5 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala20 25 30Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp35 40 45Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly85 90 95Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp100 105 110Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn115 120 125Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp130 135 140Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr145 150 155 160His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys165 170 175Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp180 185 190Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met195 200 205Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr210 215 220Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His225 230 235 240Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr245 250 255Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu260 265 270Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val275 280 285Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly290 295 300Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys305 310 315 320His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro325 330 335Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala340 345 350Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr355 360 365Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser370 375 380Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr385 390 395 400Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu405 410 415Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp420 425 430Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly435 440 445Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile450 455 460Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser465 470 475 480Val Trp Val Lys Gln485(2)SEQ ID NO2的资料(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO2His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His1 5 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser20 25 30Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp35 40 45Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly85 90 95Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp100 105 110Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn115 120 125Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp130 135 140Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr145 150 155 160His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg165 170 175Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp180 185 190Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met195 200 205Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr210 215 220Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His225 230 235 240Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala245 250 255Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu260 265 270Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val275 280 285Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly290 295 300Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys305 310 315 320His Pro Met His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro325 330 335Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala340 345 350Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr355 360 365Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala370 375 380Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr385390 395 400Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu405 410 415Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp420 425 430Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly435 440 445Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile450 455 460Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser465 470 475 480Ile Trp Val Lys Arg485(2)SEQ ID NO3的资料(i)序列特征(A)长度514个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO3Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu1 5 10 15Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn20 25 30Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys35 40 45Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp50 55 60Leu Gly Glu Phe Asn Gln Lys Gly Ala Val Arg Thr Lys Tyr Gly Thr65 70 75 80Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met85 90 95Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly100 105 110Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln115 120 125Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe130 135 140Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His145 150 155 160Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr165 170 175Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu180 185 190Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His195 200 205Pro Glu Val Val Thr Glu Leu Lys Ser Trp Gly Lys Trp Tyr Val Asn210 215 220Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys225 230 235 240Phe Ser Phe Phe Pro Asp Trp Leu Ser Asp Val Arg Ser Gln Thr Gly245 250 255Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys260 265 270Leu His Asn Tyr Ile Met Lys Thr Asn Gly Thr Met Ser Leu Phe Asp275 280 285Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Thr290 295 300Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro305 310 315 320Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln325330 335Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala340 345 350Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp355 360 365Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile370 375 380Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His385 390 395 400Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val405 410 415Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro420 425 430Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val435 440 445Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser450 455 460Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp465 470 475 480Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Trp Ser Ile Thr Thr485 490 495Arg Pro Trp Thr Asp Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val500 505 510Ala Trp(2)SEQ ID NO4的资料(i)序列特征(A)长度483个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Ala Asn Leu Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Met Pro1 5 10 15Asn Asp Gly Gln His Trp Arg Arg Leu Gln Asn Asp Ser Ala Tyr Leu20 25 30Ala Glu His Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly35 40 45Thr Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu50 55 60Gly Glu Phe His Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys65 70 75 80Gly Glu Leu Gln Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn85 90 95Val Tyr Gly Asp Val Val Ile Asn His Lys Gly Gly Ala Asp Ala Thr100 105 110Glu Asp Val Thr Ala Val Glu Val Asp Pro Ala Asp Arg Asn Arg Val115 120 125Ile Ser Gly Glu His Leu Ile Lys Ala Trp Thr His Phe His Phe Pro130 135 140Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe145 150 155 160Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys165 170 175Phe Gln Gly Lys Ala Trp Asp Trp Glu Val Ser Asn Glu Asn Gly Asn180 185 190Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Val195 200 205Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gln210 215 220Leu Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe225 230 235 240Leu Arg Asp Trp Val Asn His Val Arg Glu Lys Thr Gly Lys Glu Met245 250 255Phe Thr Val Ala Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Glu Asn260 265 270Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Val Phe Asp Val Pro Leu275 280 285His Tyr Gln Phe His Ala Ala Ser Thr Gln Gly Gly Gly Tyr Asp Met290 295 300Arg Lys Leu Leu Asn Gly Thr Val Val Ser Lys His Pro Leu Lys Ser305 310 315 320Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu325 330 335Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu340 345 350Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly355 360 365Thr Lys Gly Asp Ser Gln Arg Glu Ile Pro Ala Leu Lys His Lys Ile370 375380Glu Pro Ile Leu Lys Ala Arg Lys Gln Tyr Ala Tyr Gly Ala Gln His385 390 395 400Asp Tyr Phe Asp His His Asp Ile Val Gly Trp Thr Arg Glu Gly Asp405 410 415Ser Ser Val Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro420 425 430Gly Gly Ala Lys Arg Met Tyr Val Gly Arg Gln Asn Ala Gly Glu Thr435 440 445Trp His Asp Ile Thr Gly Asn Arg Ser Glu Pro Val Val Ile Asn Ser450 455 460Glu Gly Trp Gly Glu Phe His Val Asn Gly Gly Ser Val Ser Ile Tyr465 470 475 480Val Gln Arg(2)SEQ ID NO5的资料(i)序列特征(A)长度480个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO5Val Asn Gly Thr Leu Met Gln Tyr Phe Glu Trp Tyr Thr Pro Asn Asp1 5 10 15Gly Gln His Trp Lys Arg Leu Gln Asn Asp Ala Glu His Leu Ser Asp20 25 30Ile Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Tyr Lys Gly Leu Ser35 40 45Gln Ser Asp Asn Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu Gly Glu50 55 60Phe Gln Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ser Glu65 70 75 80Leu Gln Asp Ala Ile Gly Ser Leu His Ser Arg Asn Val Gln Val Tyr85 90 95Gly Asp Val Val Leu Asn His Lys Ala Gly Ala Asp Ala Thr Glu Asp100 105 110Val Thr Ala Val Glu Val Asn Pro Ala Asn Arg Asn Gln Glu Thr Ser115 120 125Glu Glu Tyr Gln Ile Lys Ala Trp Thr Asp Phe Arg Phe Pro Gly Arg130 135 140Gly Asn Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly145 150 155 160Ala Asp Trp Asp Glu Ser Arg Lys Ile Ser Arg Ile Phe Lys Phe Arg165 170 175Gly Glu Gly Lys Ala Trp Asp Trp Glu Val Ser Ser Glu Asn Gly Asn180 185 190Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Tyr Asp His Pro Asp Val195 200 205Val Ala Glu Thr Lys Lys Trp Gly Ile Trp Tyr Ala Asn Glu Leu Ser210 215 220Leu Asp Gly Phe Arg Ile Asp Ala Ala Lys His Ile Lys Phe Ser Phe225 230 235 240Leu Arg Asp Trp Val Gln Ala Val Arg Gln Ala Thr Gly Lys Glu Met245 250 255Phe Thr Val Ala Glu Tyr Trp Gln Asn Asn Ala Gly Lys Leu Glu Asn260 265 270Tyr Leu Asn Lys Thr Ser Phe Asn Gln Ser Val Phe Asp Val Pro Leu275 280 285His Phe Asn Leu Gln Ala Ala Ser Ser Gln Gly Gly Gly Tyr Asp Met290 295 300Arg Arg Leu Leu Asp Gly Thr Val Val Ser Arg His Pro Glu Lys Ala305 310 315 320Val Thr Phe Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu325 330 335Ser Thr Val Gln Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu340 345 350Thr Arg Glu Ser Gly Tyr Pro Gln Val Phe Tyr Gly Asp Met Tyr Gly355 360 365Thr Lys Gly Thr Ser Pro Lys Glu Ile Pro Ser Leu Lys Asp Asn Ile370 375 380Glu Pro Ile Leu Lys Ala Arg Lys Glu Tyr Ala Tyr Gly Pro Gln His385 390 395 400Asp Tyr Ile Asp His Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp405 410 415Ser Ser Ala Ala Lys Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro420 425 430Gly Gly Ser Lys Arg Met Tyr Ala Gly Leu Lys Asn Ala Gly Glu Thr435 440 445Trp Tyr Asp Ile Thr Gly Asn Arg Ser Asp Thr Val Lys Ile Gly Ser450455 460Asp Gly Trp Gly Glu Phe His Val Asn Asp Gly Ser Val Ser Ile Tyr465 470 475 480(2)SEQ ID NO6的资料(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO6His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr1 5 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Asn Ser Asp Ala Ser20 25 30Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp35 40 45Lys Gly Ala Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80Thr Arg Ser Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly85 90 95Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp100 105 110Ala Thr Glu Met Val Arg Ala Val Glu Val Asn Pro Asn Asn Arg Asn115 120 125Gln Glu Val Thr Gly Glu Tyr Thr Ile Glu Ala Trp Thr Arg Phe Asp130 135 140Phe Pro Gly Arg Gly Asn Thr His Ser Ser Phe Lys Trp Arg Trp Tyr145 150 155 160His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Arg Leu Asn Asn Arg165 170 175Ile Tyr Lys Phe Arg Gly His Gly Lys Ala Trp Asp Trp Glu Val Asp180 185 190Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Met195 200 205Asp His Pro Glu Val Val Asn Glu Leu Arg Asn Trp Gly Val Trp Tyr210 215 220Thr Asn Thr Leu Gly Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His225 230 235 240Ile Lys Tyr Ser Phe Thr Arg Asp Trp Ile Asn His Val Arg Ser Ala245 250 255Thr Gly Lys Asn Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu260 265 270Gly Ala Ile Glu Asn Tyr Leu Gln Lys Thr Asn Trp Asn His Ser Val275 280 285Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Lys Ser Gly290 295 300Gly Asn Tyr Asp Met Arg Asn Ile Phe Asn Gly Thr Val Val Gln Arg305 310 315 320His Pro Ser His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro325 330 335Glu Glu Ala Leu Glu Ser Phe Val Glu Glu Trp Phe Lys Pro Leu Ala340 345 350Tyr Ala Leu Thr Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr355 360 365Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Arg Ser370 375 380Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Lys Tyr Ala Tyr Gly Lys385 390 395 400Gln Asn Asp Tyr Leu Asp His His Asn Ile Ile Gly Trp Thr Arg Glu405 410 415Gly Asn Thr Ala His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp420 425 430Gly Ala Gly Gly Ser Lys Trp Met Phe Val Gly Arg Asn Lys Ala Gly435 440 445Gln Val Trp Ser Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile450 455 460Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser465 470 475 480Ile Trp Val Asn Lys485(2)SEQ ID NO7的资料(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO7His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr1 5 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ala20 25 30Asn Leu Lys Ser Lys Gly Ile Thr Ala Val Trp Ile Pro Pro Ala Trp35 40 45Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80Thr Arg Asn Gln Leu Gln Ala Ala Val Thr Ser Leu Lys Asn Asn Gly85 90 95Ile Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp100 105 110Gly Thr Glu Ile Val Asn Ala Val Glu Val Asn Arg Ser Asn Arg Asn115 120 125Gln Glu Thr Ser Gly Glu Tyr Ala Ile Glu Ala Trp Thr Lys Phe Asp130 135 140Phe Pro Gly Arg Gly Asn Asn His Ser Ser Phe Lys Trp Arg Trp Tyr145 150 155 160His Phe Asp Gly Thr Asp Trp Asp Gln Ser Arg Gln Leu Gln Asn Lys165 170 175Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp180 185 190Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met195 200205Asp His Pro Glu Val Ile His Glu Leu Arg Asn Trp Gly Val Trp Tyr210 215 220Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His225 230 235 240Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Thr245 250 255Thr Gly Lys Pro Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu260 265 270Gly Ala Ile Glu Asn Tyr Leu Asn Lys Thr Ser Trp Asn His Ser Val275 280 285Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly290 295 300Gly Tyr Tyr Asp Met Arg Asn Ile Leu Asn Gly Ser Val Val Gln Lys305 310 315 320His Pro Thr His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro325 330 335Gly Glu Ala Leu Glu Ser Phe Val Gln Gln Trp Phe Lys Pro Leu Ala340 345 350Tyr Ala Leu Val Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr355 360 365Gly Asp Tyr Tyr Gly Ile Pro Thr His Gly Val Pro Ala Met Lys Ser370 375 380Lys Ile Asp Pro Leu Leu Gln Ala Arg Gln Thr Phe Ala Tyr Gly Thr385 390 395 400Gln His Asp Tyr Phe Asp His His Asp Ile Ile Gly Trp Thr Arg Glu405 410 415Gly Asn Ser Ser His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp420 425 430Gly Pro Gly Gly Asn Lys Trp Met Tyr Val Gly Lys Asn Lys Ala Gly435 440 445Gln Val Trp Arg Asp Ile Thr Gly Asn Arg Thr Gly Thr Val Thr Ile450 455 460Asn Ala Asp Gly Trp Gly Asn Phe Ser Val Asn Gly Gly Ser Val Ser465 470 475 480Val Trp Val Lys Gln485(2)SEQ ID NO8的资料(i)序列特征(A)长度485个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型肽(xi)序列描述SEQ ID NO8His His Asn Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His1 5 10 15Leu Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser20 25 30Asn Leu Arg Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp35 40 45Lys Gly Thr Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr50 55 60Asp Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly65 70 75 80Thr Arg Ser Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly85 90 95Val Gln Val Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp100 105 110Ala Thr Glu Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn115 120 125Gln Glu Ile Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp130 135 140Phe Pro Gly Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr145 150 155 160His Phe Asp Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg165 170 175Ile Tyr Lys Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp180 185 190Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met195 200 205Asp His Pro Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr210 215 220Thr Asn Thr Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His225 230 235 240Ile Lys Tyr Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala245 250 255Thr Gly Lys Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu260 265 270Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val275 280 285Phe Asp Val Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly290 295 300Gly Asn Tyr Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys305 310 315 320His Pro Met His Ala Val Thr Phe Val Asp Asn Mis Asp Ser Gln Pro325 330 335Gly Glu Ser Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala340 345 350Tyr Ala Leu Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr355 360 365Gly Asp Tyr Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala370 375 380Lys Ile Asp Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr385 390 395 400Gln His Asp Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu405 410 415Gly Asn Thr Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp420 425 430Gly Pro Gly Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly435 440 445Gln Val Trp His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile450 455 460Asn Ala Asp Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser465 470 475 480Ile Trp Val Lys Arg485(2)SEQ ID NO9的资料(i)序列特征(A)长度1455个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO9CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC60GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440GTTTGGGTGA AGCAA 1455(2)SEQ ID NO10的资料(i)序列特征(A)长度1455个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO10CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA 1020GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA 1080CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA 1140GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA 1200CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG 1260CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG 1320TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA 1380ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC 1440ATTTGGGTGA AACGA 1455(2)SEQ ID NO11的资料(i)序列特征(A)长度1548个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO11GCCGCACCGT TTAACGGCAC CATGATGCAG TATTTTGAAT GGTACTTGCC GGATGATGGC 60ACGTTATGGA CCAAAGTGGC CAATGAAGCC AACAACTTAT CCAGCCTTGG CATCACCGCT 120CTTTGGCTGC CGCCCGCTTA CAAAGGAACA AGCCGCAGCG ACGTAGGGTA CGGAGTATAC 180GACTTGTATG ACCTCGGCGA ATTCAATCAA AAAGGGACCG TCCGCACAAA ATACGGAACA 240AAAGCTCAAT ATCTTCAAGC CATTCAAGCC GCCCACGCCG CTGGAATGCA AGTGTACGCC 300GATGTCGTGT TCGACCATAA AGGCGGCGCT GACGGCACGG AATGGGTGGA CGCCGTCGAA 360GTCAATCCGT CCGACCGCAA CCAAGAAATC TCGGGCACCT ATCAAATCCA AGCATGGACG 420AAATTTGATT TTCCCGGGCG GGGCAACACC TACTCCAGCT TTAAGTGGCG CTGGTACCAT 480TTTGACGGCG TTGATTGGGA CGAAAGCCGA AAATTGAGCC GCATTTACAA ATTCCGCGGC 540ATCGGCAAAG CGTGGGATTG GGAAGTAGAC ACGGAAAACG GAAACTATGA CTACTTAATG 600TATGCCGACC TTGATATGGA TCATCCCGAA GTCGTGACCG AGCTGAAAAA CTGGGGGAAA 660TGGTATGTCA ACACAACGAA CATTGATGGG TTCCGGCTTG ATGCCGTCAA GCATATTAAG 720TTCAGTTTTT TTCCTGATTG GTTGTCGTAT GTGCGTTCTC AGACTGGCAA GCCGCTATTT 780ACCGTCGGGG AATATTGGAG CTATGACATC AACAAGTTGC ACAATTACAT TACGAAAACA 840GACGGAACGA TGTCTTTGTT TGATGCCCCG TTACACAACA AATTTTATAC CGCTTCCAAA 900TCAGGGGGCG CATTTGATAT GCGCACGTTA ATGACCAATA CTCTCATGAA AGATCAACCG 960ACATTGGCCG TCACCTTCGT TGATAATCAT GACACCGAAC cCGGCCAAGC GCTGCAGTCA 1020TGGGTCGACC CATGGTTCAA ACCGTTGGCT TACGCCTTTA TTCTAACTCG GCAGGAAGGA 1080TACCCGTGCG TCTTTTATGG TGACTATTAT GGCATTCCAC AATATAACAT TCCTTCGCTG 1140AAAAGCAAAA TCGATCCGCT CCTCATCGCG CGCAGGGATT ATGCTTACGG AACGCAACAT 1200GATTATCTTG ATCACTCCGA CATCATCGGG TGGACAAGGG AAGGGGGCAC TGAAAAACCA 1260GGATCCGGAC TGGCCGCACT GATCACCGAT GGGCCGGGAG GAAGCAAATG GATGTACGTT 1320GGCAAACAAC ACGCTGGAAA AGTGTTCTAT GACCTTACCG GCAACCGGAG TGACACCGTC 1380ACCATCAACA GTGATGGATG GGGGGAATTC AAAGTCAATG GCGGTTCGGT TTCGGTTTGG 1440GTTCCTAGAA AAACGACCGT TTCTACCATC GCTCGGCCGA TCACAACCCG ACCGTGGACT 1500GGTGAATTCG TCCGTTGGAC CGAACCACGG TTGGTGGCAT GGCCTTGA1548(2)SEQ ID NO12的资料(i)序列特征(A)长度1920个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特性(A)名称/关键词CDS(B)位置421...1872(xi)序列描述SEQ ID NO12CGGAAGATTG GAAGTACAAA AATAAGCAAA AGATTGTCAA TCATGTCATG AGCCATGCGG 60GAGACGGAAA AATCGTCTTA ATGCACGATA TTTATGCAAC GTTCGCAGAT GCTGCTGAAG 120AGATTATTAA AAAGCTGAAA GCAAAAGGCT ATCAATTGGT AACTGTATCT CAGCTTGAAG 180AAGTGAAGAA GCAGAGAGGC TATTGAATAA ATGAGTAGAA GCGCCATATC GGCGCTTTTC 240TTTTGGAAGA AAATATAGGG AAAATGGTAC TTGTTAAAAA TTCGGAATAT TTATACAACA 300TCATATGTTT CACATTGAAA GGGGAGGAGA ATCATGAAAC AACAAAAACG GCTTTACGCC 360CGATTGCTGA CGCTGTTATT TGCGCTCATC TTCTTGCTGC CTCATTCTGC AGCAGCGGCG 420GCA AAT CTT AAT GGG ACG CTG ATG CAG TAT TTT GAA TGG TAC ATG CCC 468AAT GAC GGC CAA CAT TGG AGG CGT TTG CAA AAC GAC TCG GCA TAT TTG 516GCT GAA CAC GGT ATT ACT GCC GTC TGG ATT CCC CCG GCA TAT AAG GGA 564ACG AGC CAA GCG GAT GTG GGC TAC GGT GCT TAC GAC CTT TAT GAT TTA 612GGG GAG TTT CAT CAA AAA GGG ACG GTT CGG ACA AAG TAC GGC ACA AAA 660GGA GAG CTG CAA TCT GCG ATC AAA AGT CTT CAT TCC CGC GAC ATT AAC 708GTT TAC GGG GAT GTG GTC ATC AAC CAC AAA GGC GGC GCT GAT GCG ACC 756GAA GAT GTA ACC GCG GTT GAA GTC GAT CCC GCT GAC CGC AAC CGC GTA 804ATT TCA GGA GAA CAC CTA ATT AAA GCC TGG ACA CAT TTT CAT TTT CCG 852GGG CGC GGC AGC ACA TAC AGC GAT TTT AAA TGG CAT TGG TAC CAT TTT 900GAC GGA ACC GAT TGG GAC GAG TCC CGA AAG CTG AAC CGC ATC TAT AAG 948TTT CAA GGA AAG GCT TGG GAT TGG GAA GTT TCC AAT GAA AAC GGC AAC 996TAT GAT TAT TTG ATG TAT GCC GAC ATC GAT TAT GAC CAT CCT GAT GTC 1044GCA GCA GAA ATT AAG AGA TGG GGC ACT TGG TAT GCC AAT GAA CTG CAA 1092TTG GAC GGT TTC CGT CTT GAT GCT GTC AAA CAC ATT AAA TTT TCT TTT 1140TTG CGG GAT TGG GTT AAT CAT GTC AGG GAA AAA ACG GGG AAG GAA ATG 1188TTT ACG GTA GCT GAA TAT TGG CAG AAT GAC TTG GGC GCG CTG GAA AAC 1236TAT TTG AAC AAA ACA AAT TTT AAT CAT TCA GTG TTT GAC GTG CCG CTT 1284CAT TAT CAG TTC CAT GCT GCA TCG ACA CAG GGA GGC GGC TAT GAT ATG 1332AGG AAA TTG CTG AAC GGT ACG GTC GTT TCC AAG CAT CCG TTG AAA TCG 1380GTT ACA TTT GTC GAT AAC CAT GAT ACA CAG CCG GGG CAA TCG CTT GAG 1428TCG ACT GTC CAA ACA TGG TTT AAG CCG CTT GCT TAC GCT TTT ATT CTC 1476ACA AGG GAA TCT GGA TAC CCT CAG GTT TTC TAC GGG GAT ATG TAC GGG 1524ACG AAA GGA GAC TCC CAG CGC GAA ATT CCT GCC TTG AAA CAC AAA ATT 1572GAA CCG ATC TTA AAA GCG AGA AAA CAG TAT GCG TAC GGA GCA CAG CAT 1620GAT TAT TTC GAC CAC CAT GAC ATT GTC GGC TGG ACA AGG GAA GGC GAC 1668AGC TCG GTT GCA AAT TCA GGT TTG GCG GCA TTA ATA ACA GAC GGA CCC 1716GGT GGG GCA AAG CGA ATG TAT GTC GGC CGG CAA AAC GCC GGT GAG ACA 1764TGG CAT GAC ATT ACC GGA AAC CGT TCG GAG CCG GTT GTC ATC AAT TCG 1812GAA GGC TGG GGA GAG TTT CAC GTA AAC GGC GGG TCG GTT TCA ATT TAT 1860GTT CAA AGA TAG AAGAGCAGAG AGGACGGATT TCCTGAAGGA AATCCGTTTT 1912TTTATTTT 1920(2)SEQ ID NO12的资料(i)序列特征(A)长度2084个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特性(A)名称/关键词CDS(B)位置343...1794(xi)序列描述SEQ ID NO12GCCCCGCACA TACGAAAAGA CTGGCTGAAA ACATTGAGCC TTTGATGACT GATGATTTGG 60CTGAAGAAGT GGATCGATTG TTTGAGAAAA GAAGAAGACC ATAAAAATAC CTTGTCTGTC 120ATCAGACAGG GTATTTTTTA TGCTGTCCAG ACTGTCCGCT GTGTAAAAAT AAGGAATAAA 180GGGGGGTTGT TATTATTTTA CTGATATGTA AAATATAATT TGTATAAGAA AATGAGAGGG 240AGAGGAAACA TGATTCAAAA ACGAAAGCGG ACAGTTTCGT TCAGACTTGT GCTTATGTGC 300ACGCTGTTAT TTGTCAGTTT GCCGATTACA AAAACATCAG CC GTA AAT GGC ACG 354CTG ATG CAG TAT TTT GAA TGG TAT ACG CCG AAC GAC GGC CAG CAT TGG 402AAA CGA TTG CAG AAT GAT GCG GAA CAT TTA TCG GAT ATC GGA ATC ACT 450GCC GTC TGG ATT CCT CCC GCA TAC AAA GGA TTG AGC CAA TCC GAT AAC 498GGA TAC GGA CCT TAT GAT TTG TAT GAT TTA GGA GAA TTC CAG CAA AAA 546GGG ACG GTC AGA ACG AAA TAC GGC ACA AAA TCA GAG CTT CAA GAT GCG 594ATC GGC TCA CTG CAT TCC CGG AAC GTC CAA GTA TAC GGA GAT GTG GTT 642TTG AAT CAT AAG GCT GGT GCT GAT GCA ACA GAA GAT GTA ACT GCC GTC 690GAA GTC AAT CCG GCC AAT AGA AAT CAG GAA ACT TCG GAG GAA TAT CAA 738ATC AAA GCG TGG ACG GAT TTT CGT TTT CCG GGC CGT GGA AAC ACG TAC 786AGT GAT TTT AAA TGG CAT TGG TAT CAT TTC GAC GGA GCG GAC TGG GAT 834GAA TCC CGG AAG ATC AGC CGC ATC TTT AAG TTT CGT GGG GAA GGA AAA 882GCG TGG GAT TGG GAA GTA TCA AGT GAA AAC GGC AAC TAT GAC TAT TTA 930ATG TAT GCT GAT GTT GAC TAC GAC CAC CCT GAT GTC GTG GCA GAG ACA 978AAA AAA TGG GGT ATC TGG TAT GCG AAT GAA CTG TCA TTA GAC GGC TTC1026CGT ATT GAT GCC GCC AAA CAT ATT AAA TTT TCA TTT CTG CGT GAT TGG1074GTT CAG GCG GTC AGA CAG GCG ACG GGA AAA GAA ATG TTT ACG GTT GCG1122GAG TAT TGG CAG AAT AAT GCC GGG AAA CTC GAA AAC TAC TTG AAT AAA1170ACA AGC TTT AAT CAA TCC GTG TTT GAT GTT CCG CTT CAT TTC AAT TTA1218CAG GCG GCT TCC TCA CAA GGA GGC GGA TAT GAT ATG AGG CGT TTG CTG1266GAC GGT ACC GTT GTG TCC AGG CAT CCG GAA AAG GCG GTT ACA TTT GTT1314GAA AAT CAT GAC ACA CAG CCG GGA CAG TCA TTG GAA TCG ACA GTC CAA1362ACT TGG TTT AAA CCG CTT GCA TAC GCC TTT ATT TTG ACA AGA GAA TCC1410GGT TAT CCT CAG GTG TTC TAT GGG GAT ATG TAC GGG ACA AAA GGG ACA1458TCG CCA AAG GAA ATT CCC TCA CTG AAA GAT AAT ATA GAG CCG ATT TTA1506AAA GCG CGT AAG GAG TAC GCA TAC GGG CCC CAG CAC GAT TAT ATT GAC1554CAC CCG GAT GTG ATC GGA TGG ACG AGG GAA GGT GAC AGC TCC GCC GCC 1602AAA TCA GGT TTG GCC GCT TTA ATC ACG GAC GGA CCC GGC GGA TCA AAG 1650CGG ATG TAT GCC GGC CTG AAA AAT GCC GGC GAG ACA TGG TAT GAC ATA 1698ACG GGC AAC CGT TCA GAT ACT GTA AAA ATC GGA TCT GAC GGC TGG GGA 1746GAG TTT CAT GTA AAC GAT GGG TCC GTC TCC ATT TAT GTT CAG AAA TAA 1794GGTAATAAAA AAACACCTCC AAGCTGAGTG CGGGTATCAG CTTGGAGGTG CGTTTATTTT 1854TTCAGCCGTA TGACAAGGTC GGCATCAGGT GTGACAAATA CGGTATGCTG GCTGTCATAG 1914GTGACAAATC CGGGTTTTGC GCCGTTTGGC TTTTTCACAT GTCTGATTTT TGTATAATCA 1974ACAGGCACGG AGCCGGAATC TTTCGCCTTG GAAAAATAAG CGGCGATCGT AGCTGCTTCC 2034AATATGGATT GTTCATCGGG ATCGCTGCTT TTAATCACAA CGTGGGATCC 2084(2)SEQ ID NO13的资料(i)序列特征(A)长度1455个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO13CATCATAATG GAACAAATGG TACTATGATG CAATATTTCG AATGGTATTT GCCAAATGAC 60GGGAATCATT GGAACAGGTT GAGGGATGAC GCAGCTAACT TAAAGAGTAA AGGGATAACA 120GCTGTATGGA TCCCACCTGC ATGGAAGGGG ACTTCCCAGA ATGATGTAGG TTATGGAGCC 180TATGATTTAT ATGATCTTGG AGAGTTTAAC CAGAAGGGGA CGGTTCGTAC AAAATATGGA 240ACACGCAACC AGCTACAGGC TGCGGTGACC TCTTTAAAAA ATAACGGCAT TCAGGTATAT 300GGTGATGTCG TCATGAATCA TAAAGGTGGA GCAGATGGTA CGGAAATTGT AAATGCGGTA 360GAAGTGAATC GGAGCAACCG AAACCAGGAA ACCTCAGGAG AGTATGCAAT AGAAGCGTGG 420ACAAAGTTTG ATTTTCCTGG AAGAGGAAAT AACCATTCCA GCTTTAAGTG GCGCTGGTAT 480CATTTTGATG GGACAGATTG GGATCAGTCA CGCCAGCTTC AAAACAAAAT ATATAAATTC 540AGGGGAACAG GCAAGGCCTG GGACTGGGAA GTCGATACAG AGAATGGCAA CTATGACTAT 600CTTATGTATG CAGACGTGGA TATGGATCAC CCAGAAGTAA TACATGAACT TAGAAACTGG 660GGAGTGTGGT ATACGAATAC ACTGAACCTT GATGGATTTA GAATAGATGC AGTGAAACAT 720ATAAAATATA GCTTTACGAG AGATTGGCTT ACACATGTGC GTAACACCAC AGGTAAACCA 780ATGTTTGCAG TGGCTGAGTT TTGGAAAAAT GACCTTGGTG CAATTGAAAA CTATTTGAAT 840AAAACAAGTT GGAATCACTC GGTGTTTGAT GTTCCTCTCC ACTATAATTT GTACAATGCA 900TCTAATAGCG GTGGTTATTA TGATATGAGA AATATTTTAA ATGGTTCTGT GGTGCAAAAA 960CATCCAACAC ATGCCGTTAC TTTTGTTGAT AACCATGATT CTCAGCCCGG GGAAGCATTG 1020GAATCCTTTG TTCAACAATG GTTTAAACCA CTTGCATATG CATTGGTTCT GACAAGGGAA 1080CAAGGTTATC CTTCCGTATT TTATGGGGAT TACTACGGTA TCCCAACCCA TGGTGTTCCG 1140GCTATGAAAT CTAAAATAGA CCCTCTTCTG CAGGCACGTC AAACTTTTGC CTATGGTACG 1200CAGCATGATT ACTTTGATCA TCATGATATT ATCGGTTGGA CAAGAGAGGG AAATAGCTCC 1260CATCCAAATT CAGGCCTTGC CACCATTATG TCAGATGGTC CAGGTGGTAA CAAATGGATG 1320TATGTGGGGA AAAATAAAGC GGGACAAGTT TGGAGAGATA TTACCGGAAA TAGGACAGGC 1380ACCGTCACAA TTAATGCAGA CGGATGGGGT AATTTCTCTG TTAATGGAGG GTCCGTTTCG 1440GTTTGGGTGA AGCAA 1455(2)SEQ ID NO14的资料(i)序列特征(A)长度1455个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO14CATCATAATG GGACAAATGG GACGATGATG CAATACTTTG AATGGCACTT GCCTAATGAT 60GGGAATCACT GGAATAGATT AAGAGATGAT GCTAGTAATC TAAGAAATAG AGGTATAACC 120GCTATTTGGA TTCCGCCTGC CTGGAAAGGG ACTTCGCAAA ATGATGTGGG GTATGGAGCC 180TATGATCTTT ATGATTTAGG GGAATTTAAT CAAAAGGGGA CGGTTCGTAC TAAGTATGGG 240ACACGTAGTC AATTGGAGTC TGCCATCCAT GCTTTAAAGA ATAATGGCGT TCAAGTTTAT 300GGGGATGTAG TGATGAACCA TAAAGGAGGA GCTGATGCTA CAGAAAACGT TCTTGCTGTC 360GAGGTGAATC CAAATAACCG GAATCAAGAA ATATCTGGGG ACTACACAAT TGAGGCTTGG 420ACTAAGTTTG ATTTTCCAGG GAGGGGTAAT ACATACTCAG ACTTTAAATG GCGTTGGTAT 480CATTTCGATG GTGTAGATTG GGATCAATCA CGACAATTCC AAAATCGTAT CTACAAATTC 540CGAGGTGATG GTAAGGCATG GGATTGGGAA GTAGATTCGG AAAATGGAAA TTATGATTAT 600TTAATGTATG CAGATGTAGA TATGGATCAT CCGGAGGTAG TAAATGAGCT TAGAAGATGG 660GGAGAATGGT ATACAAATAC ATTAAATCTT GATGGATTTA GGATCGATGC GGTGAAGCAT 720ATTAAATATA GCTTTACACG TGATTGGTTG ACCCATGTAA GAAACGCAAC GGGAAAAGAA 780ATGTTTGCTG TTGCTGAATT TTGGAAAAAT GATTTAGGTG CCTTGGAGAA CTATTTAAAT 840AAAACAAACT GGAATCATTC TGTCTTTGAT GTCCCCCTTC ATTATAATCT TTATAACGCG 900TCAAATAGTG GAGGCAACTA TGACATGGCA AAACTTCTTA ATGGAACGGT TGTTCAAAAG 960CATCCAATGC ATGCCGTAAC TTTTGTGGAT AATCACGATT CTCAACCTGG GGAATCATTA1020GAATCATTTG TACAAGAATG GTTTAAGCCA CTTGCTTATG CGCTTATTTT AACAAGAGAA1080CAAGGCTATC CCTCTGTCTT CTATGGTGAC TACTATGGAA TTCCAACACA TAGTGTCCCA1140GCAATGAAAG CCAAGATTGA TCCAATCTTA GAGGCGCGTC AAAATTTTGC ATATGGAACA1200CAACATGATT ATTTTGACCA TCATAATATA ATCGGATGGA CACGTGAAGG AAATACCACG1260CATCCCAATT CAGGACTTGC GACTATCATG TCGGATGGGC CAGGGGGAGA GAAATGGATG1320TACGTAGGGC AAAATAAAGC AGGTCAAGTT TGGCATGACA TAACTGGAAA TAAACCAGGA1380ACAGTTACGA TCAATGCAGA TGGATGGGCT AATTTTTCAG TAAATGGAGG ATCTGTTTCC1440ATTTGGGTGA AACGA 1455(2)SEQ ID NO15的资料(i)序列特征(A)长度60个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=正向引物FSA(ix)特性(A)名称/关键词misc-feature(B)位置22-27、29、31-33、41(C)其他资料/Note=135%A,65%C283%G,17%A
363%G,37%T486%G,14%A585%G,15%C650%T,50%C795%A,5%G858%G,37%A,5%T986%C,13%A,1%G1083%T,17%G1192%G,8%C(xi)序列描述SEQ ID NO15caaaatcgta tctacaaatt c123456a7g 8910tgggattllggaagtaga ttcggaaaat60(2)SEQ ID NO16的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=反向引物RSA(xi)序列描述SEQ ID NO16gaatttgtag atacgatttt g21(2)SEQ ID NO17的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物B1(xi)序列描述SEQ ID NO17CGATTGCTGA CGCTGTTATT TGCG24(2)SEQ ID NO18的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物Y2(xi)序列描述SEQ ID NO18CTTGTTCCCT TGTCAGAACC AATG24(2)SEQ ID NO19的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物101458(xi)序列描述SEQ ID NO19GTCATAGTTG CCGAAATCTG TATCGACTTC 30(2)SEQ ID NO20的资料(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物101638(xi)序列描述SEQ ID NO20CCCAGTCCCA CGTACGTCCC CTGAATTTATATA TTTTG 35(2)SEQ ID NO21的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=Oligo 1(A)名称/关键词misc-feature(B)位置12(D)其他资料/Note=N=25%A、25%C、25%G、25%T(xi)序列描述SEQ ID NO21CCCAGTCCCA GNTCTTTCCC CTGAATTTAT ATATTTTG 38(2)SEQ ID NO22的资料(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物X2(xi)序列描述SEQ ID NO22GCGTGGACAA AGTTTGATTT TCCTG 25(2)SEQ ID NO23的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA01(xi)序列描述SEQ ID NO23(2)SEQ ID NO24的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA03(xi)序列描述SEQ ID NO24GCATTGGATG CTTTTGAACA ACCG 24(2)SEQ ID NO25的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA07(xi)序列描述SEQ ID NO25CGCAAAATGA TATCGGGTAT GGAGCC 26(2)SEQ ID NO26的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA20(ix)特性
(A)名称/关键词 misc-feature(B)位置13、14(D)其他资料/NoteS=C和G的混合物W=A和T的混合物(xi)序列描述SEQ ID NO26GTGATGAACC ACSWAGGTGG AGCTGATGC29(2)SEQ ID NO27的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA14(ix)特性(A)名称/关键词misc-feature(B)位置13、14(D)其他资料/NoteR=A和G的混合物Y=C和T的混合物(xi)序列描述SEQ ID NO27GATGGTGTAT GGRYCAATCA CGACAATTCC 30(2)SEQ ID NO28的资料(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词 misc-feature(B)其他资料/desc=引物DA15(xi)序列描述SEQ ID NO28GGTGTATGGG ATAACTCACG ACAATTCC 28(2)SEQ ID NO29的资料(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA16(xi)序列描述SEQ ID NO29GGTGTATGGG ATCTCTCACG ACAATTCC 28(2)SEQ ID NO30的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA17(xi)序列描述SEQ ID NO30
GGGATCAATC ACGAAATTTC CAAAATCGTA TC32(2)SEQ ID NO31的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA18(xi)序列描述SEQ ID NO31GGGATCAATC ACGACTCTTC CAAA TCGTA TC32(2)SEQ ID NO32的资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA06(xi)序列描述SEQ ID NO32GGAAATTATG ATTATATCAT GTATGCAGAT GTAG 34(2)SEQ ID NO33的资料(i)序列特征(A)长度30个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA09(xi)序列描述SEQ ID NO33GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30(2)SEQ ID NO34的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA11(xi)序列描述SEQ ID NO34GCTGAATTTT GGTCGAATGA TTTAGGTGCC 30(2)SEQ ID NO35的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性
(A)名称/关键词 misc-feature(B)其他资料/desc=引物DA21(xi)序列描述SEQ ID NO35GAATTTTGGA AGTACGATTT AGGTCGG27(2)SEQ ID NO36的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA12(ix)特性(A)名称/关键词misc-feature(B)位置12、13(D)其他资料/NoteR=A和G的混合物Y=C和T的混合物(xi)序列描述SEQ ID NO36GGAAAAACGA TRYCGGTGCC TTGGAGAAC29(2)SEQ ID NO37的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性
(A)名称/关键词misc-feature(B)其他资料/desc=引物DA13(ix)特性(A)名称/关键词misc-feature(B)位置14,15(D)其他资料/NoteR=A和G的混合物Y=C和T的混合物(xi)序列描述SEQ ID NO37GATTTAGGTG CCTRYCAGAA CTATTTA 27(2)SEQ ID NO38的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA08(xi)序列描述SEQ ID NO38CCCCCTTCAT GAGAATCTTT ATAACG 26(2)SEQ ID NO39的资料(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性
(A)名称/关键词misc-feature(B)其他资料/desc=引物DA04(xi)序列描述SEQ ID NO39GAATCCGAAC CTCATTACAC ATTCG25(2)SEQ ID NO40的资料(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA05(xi)序列描述SEQ ID NO40CGGATGGACT CGAGAAGGAA ATACCACG 38(2)SEQ ID NO41的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词 misc-feature(B)其他资料/desc=引物DA10(xi)序列描述SEQ ID NO41CGTAGGGCAA AATCAGGCCG GTCAAGTTTG G 31(2)SEQ ID NO42的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA22(xi)序列描述SEQ ID NO42CATAACTGGA AATCGCCCGG GAACAGTTAC G 31(2)SEQ ID NO43的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA19(ix)特性(A)名称/关键词misc-feature(B)位置12(D)其他资料/NoteW=A和T的混合物(xi)序列描述SEQ ID NO43CTGGAAATAA AWCCGGAACA GTTACG 36(2)SEQ ID NO44的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA23(xi)序列描述SEQ ID NO44GGAAATAAAC CAGGACCCGT TACGATCAAT GC 32(2)SEQ ID NO45的资料(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA32(xi)序列描述SEQ ID NO45GAGGCTTGGA CTAGGTTTGA TTTTCCAG 28(2)SEQ ID NO46的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物DA31(xi)序列描述SEQ ID NO46GCTGAATTTT GGCGCAATGA TTTAGGTGCC 30(2)SEQ ID NO47的资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feture(B)其他资料/desc=引物bm4(xi)序列描述SEQ ID NO47GTGTTTGACG TCCCGCTTCA TGAGAATTTA CAGG 34(2)SEQ ID NO48的资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物bm5(xi)序列描述SEQ ID NO48GTGTTTGACG TCCCGCTTCA TAAGAATTTA CAGG 34(2)SEQ ID NO49的资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物bm6(xi)序列描述SEQ ID NO49GTGTTTGACG TCCCGCTTCA TGCCAATTTA CAGG 34(2)SEQ ID NO50的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物bm8(xi)序列描述SEQ ID NO50AGGGAATCCG GATACCCTGA GGTTTTCTAC GG32(2)SEQ ID NO51的资料(i)序列特征(A)长度34个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物bm11(xi)序列描述SEQ ID NO51GATGTGGTTT TGGATCATAA GGCCGGCGCT GATG34(2)SEQ ID NO52的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物p1(xi)序列描述SEQ ID NO52CTGTTATTAA TGCCGCCAAA CC 22(2)SEQ ID NO53的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性
(A)名称/关键词misc-feature(B)其他资料/desc=引物p2(xi)序列描述SEQ ID NO53GGAAAAGAAA TGTTTACGGT TGCG 24(2)SEQ ID NO54的资料(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物p3(xi)序列描述SEQ ID NO54GAAATGAAGC GGAACATCAA ACACG25(2)SEQ ID NO55的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型其他核酸(ix)特性(A)名称/关键词misc-feature(B)其他资料/desc=引物p4(xi)序列描述SEQ ID NO55GTATGATTTA GGAGAATTCC 20
权利要求
1.一种亲本类透阿米尔α-淀粉酶的变体,该变体具有α-淀粉酶活性,所述变体包含1或多个突变,其对应于下列SEQ ID NO2所示氨基酸序列中的突变T141、 K142、 F143、 D144、 F145、 P146、 G147、 R148、 G149Q174、 R181、 G182、 D183、 G184、 K185、 A186、 W189、S193、 N195、 H107、 K108、 G109、 D166、 W167、 D168、 Q169、S170、 R171、 Q172、 F173、 F267、 W268、 K269、 N270、 D271、L272、 G273、 A274、 L275、 K311、 E346、 K385、 G456、 N457、K458、 P459、 G460、 T461、 V462、 T463。
2.权利要求1的变体,所述变体有1或多个下列取代或缺失T141A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;K142A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;F143A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;D144A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;F145A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;P146A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G147A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;R148A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;G149A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;R181*,A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;G182*,A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;D183*,A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;G184*,A, R, D, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;K185A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;A186D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W189A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;S193A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;H107A, D, R, N, C, E, Q, G, I, L, K, M, F, P, S, T, W, Y, V;K108A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G109A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;D166A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W167A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;D168A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q169A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;S170A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;R171A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q172A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;F173A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;Q174*,A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y,V;F267A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;W268A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;D271A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L272A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G273A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;A274D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L275A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;K311A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;E346A, D, R, N, C, Q, G, H, I, K, L, M, F, P, S, T, W, Y, V;K385A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G456A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;N457A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G460A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;T461A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;V462A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y;T463A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V.
3.权利要求2的变体,其中所述变体有1或多个下列取代或缺失K142R; S193P; N195F; K269R,Q; N270Y,R,D; K311R; E346Q; K385R;K458R; P459T; T461P; Q174*; R181Q,N,S; G182T, S,N; D183*; G184*;K185A, R,D,C,E,Q,G,H,I,L,M,N,F,P,S,T,W,Y,V; A186T,S,N,I,V,R;W189T,S,N,Q.
4.权利要求1-3的变体,其中所述变体在D183+G184位点缺失,还有1或多个下列取代或缺失 K142R; S193P; N195F; K269R、 Q;N270Y、 R、 D;K311R; E346Q; K385R; K458R; P459T; T461P;Q174*; R181Q、N、 S; G182T、 S、N; D183*; G184*; K185A、R、D、C、E、Q、G、H、I、L、M、N、F、P、S、T、W、Y、V;A186T、S、N、I、V、R;W189T、S、N、Q。
5.权利要求1-4任何一项的变体,其中相对亲本α-淀粉酶所述变体至少下列性能之一发生改变i)在pH8到10.5的pH稳定性提高;和/或ii)在pH8到10.5的Ca2+稳定性提高,和/或iii)在温度为10到60℃,优选20-50℃,特别是30-40℃特异活性增强。
6.权利要求1-5任何一项的变体,在pH8到10.5稳定性提高,具有1或多个对应下列位点(使用SEQ ID NO2的编号)的位点的突变T141、K142、 F143、 D144、 F145、 P146、 G147、 R148、 G149、 R181、A186、 S193、 N195、 K269、 N270、 K311、 K458、 P459、 T461。
7.权利要求6的变体,该变体具有1或多个下列取代T141A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y,V;K142A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y,V;F143A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y,V;D144A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;F145A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y,V;P146A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y,V;G147A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;R148A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;G149A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y,V;K181A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y,V;A186D, R, N, C, E, Q, G, H, I, L, P, K, M, F, S, T, W, Y,V;S193A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y,V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;K269A, D, R, N, C, E, Q; G, H, I, L, M, F, P, S, T, W, Y,V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y,V;K311A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y,V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y,V;P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y,V;T461A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y,V。
8.权利要求7的变体,该变体具有1或多个下列取代K142R、R181S、A186T、S193P、N195F、K269R、N270Y、K311R、K458R、P459T和T461P。
9.权利要求1-5的变体,在pH8到10.5对Ca2+的稳定性提高,具有1或多个对应下列位点(使用SEQ ID NO2的编号)的突变R181、G182、D183、 G184、 K185、 A186、 W189、 N195、 N270、 E346、 K385、K458、 P459。
10.权利要求9的变体,该变体具有1或多个下列取代或缺失R181*, A, D,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;G182*, A, D,R,N,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V;D183*, A, R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;G184*, A, R,D,N,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V;K185A, D, R,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;A186D, R, N,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;W189A, D, R,N,C,E,Q,G,H,I,L,K,M,F,P,S,T,Y,V;N195A, D, R,C,E,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;N270A, R, D,N,C,E,Q,H,I,L,K,M,F,P,S,T,W,Y,V;E346A, R, D,N,C,Q,G,H,I,L,K,M,F,P,S,T,W,Y,V;K385A, R, D,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;K458A, R, D,N,C,E,Q,G,H,I,L,M,F,P,S,T,W,Y,V;P459A, R, D,N,C,E,Q,G,H,I,L,K,M,F,S,T,W,Y,V。
11.权利要求10的变体,其中所述变体具有1或多个下列取代或缺失R181Q、N;G182T、S、N;D183*;G184*;K185A、R、D、C、E、Q、G、H、I、L、M、N、F、P、S、T、W、Y、V;A186T、S、N、I、V;W189T、S、N、Q;N195F;N270R、D;E346Q;K385R;K458R;P459T。
12.权利要求1-11的变体,其中所述亲本类透阿米尔α-淀粉酶选自具有SEQ ID NO1所示序列的芽孢杆菌菌株NCIB12512α-淀粉酶;具有SEQ ID NO5所示序列的解淀粉芽孢杆菌α-淀粉酶;具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶。
13.权利要求1-5的变体,在10-60℃,优选20-50℃,特别是30-40℃的温度范围内特异活性提高,在1或多个下列位点(使用SEQ ID NO2的编号)具有突变H107、K108、G109、D166、W167、D168、Q169、S170、R171、Q172、F173、Q174、D183、G184、N195、F267、W268、K269、N270、D271、L272、G273、A274、L275、G456、N457、K458、P459、G460、T461、V462、T463。
14.权利要求13的变体,该变体含有1或多个下列取代H107A, D, R, N, C, E, Q, G, I, L, K, M, F, P, S, T, W, Y, V;K108A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;G109A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;D166A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;W167A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;D168A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q169A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;S170A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, T, W, Y, V;R171A, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;Q172A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;F173A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;Q174*,A, D, R, N, C, E, G, H, I, L, K, M, F, P, S, T, W, Y, V;D183*,A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;G184*,A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;N195A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;F267A, D, R, N, C, E, Q, G, H, I, L, K, M, P, S, T, W, Y, V;W268A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, Y, V;K269A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;N270A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;D271A, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L272A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G273A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;A274D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;L275A, D, R, N, C, E, Q, G, H, I, K, M, F, P, S, T, W, Y, V;G456A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;N457A, D, R, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V;K458A, D, R, N, C, E, Q, G, H, I, L, M, F, P, S, T, W, Y, V;P459A, D, R, N, C, E, Q, G, H, I, L, K, M, F, S, T, W, Y, V;G460A, D, R, N, C, E, Q, H, I, L, K, M, F, P, S, T, W, Y, V;T461A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V;V462A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y;T463A, D, R, N, C, E, Q, G, H, I, L, K, M, F, P, S, W, Y, V。
15.权利要求14的变体,其中所述变体含有1或多个下列取代或缺失D174*、D183*、G184*、N195F、K269S。
16.权利要求13-15的变体,其中所述亲本类透阿米尔α-淀粉酶是具有SEQ ID NO4所示序列的地衣形芽孢杆菌α-淀粉酶。
17.一种DNA构建体,它含有编码权利要求1-16任何一项所述α-淀粉酶变体的DNA序列。
18.一种携带权利要求17所述DNA构建体的重组表达载体。
19.一种用权利要求17所述DNA构建体或权利要求18所述载体进行转化的细胞。
20.权利要求19的细胞,它是一种微生物细胞。
21.权利要求20的细胞,它是细菌或真菌。
22.权利要求21的细胞,它是革兰氏阳性细菌,比如枯草芽孢杆菌、地衣形芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、或苏云金芽孢杆菌。
23.权利要求1-16任何一项所述α-淀粉酶变体用于洗涤和/或清洗餐具的用途。
24.含有权利要求1-16任何一项所述α-淀粉酶变体的洗涤剂添加剂,任选该添加剂是非dusting颗粒、稳定化的液体或被保护的酶。
25.权利要求24的洗涤剂添加剂,它含有0.02-200mg酶蛋白/g添加剂。
26.权利要求24或25的洗涤剂添加剂,它还含有另一种酶,比如蛋白酶、脂酶、过氧化物酶、另一种淀粉水解酶和/或纤维素酶。
27.一种包含权利要求1-16任何一项所述α-淀粉酶变体的洗涤剂组合物。
28.权利要求27的洗涤剂组合物,它另外包含另一种酶,比如蛋白酶、脂酶、过氧化物酶、另一种淀粉水解酶和/或纤维素酶。
29.一种手洗或自动餐具洗涤剂组合物,该组合物包含权利要求1-16任何一项所述的α-淀粉酶变体。
30.权利要求29的清洗餐具的洗涤剂组合物,该组合物另外包含另一种酶,比如蛋白酶、脂酶、过氧化物酶、另一种淀粉水解酶和/或纤维素酶。
31.一种手洗或自动的衣物洗涤组合物,该组合物包含权利要求1-16任何一项所述的α-淀粉酶变体。
32.权利要求31的衣物洗涤组合物,该组合物另外包含另一种酶,比如蛋白酶、脂酶、过氧化物酶、淀粉水解酶和/或纤维素酶。
33.制备α-淀粉酶的方法,该α-淀粉酶具有1)改变了的pH最佳值,和/或2)改变了的温度最佳值,和/或3)稳定性提高,所述方法包括以下步骤i)将两个或多个pH、温度和/或稳定性曲线迥异的α-淀粉酶的3D结构之分子动力学进行比较,从而确定(a)α-淀粉酶突变的目标位点和/或区域;ii)在所确定的位点和/或区域进行1或多个氨基酸的取代、添加和/或缺失。
34.权利要求33的方法,其中将一种中温α-淀粉酶与一种高温α-淀粉酶进行比较。
35.权利要求33的方法,其中将一种低温α-淀粉酶与一种中温或高温α-淀粉酶进行比较。
36.权利要求33-35的方法,其中所述α-淀粉酶至少70%,优选80%,达到90%,比如达到95%,尤其是95%同源。
37.权利要求36的方法,其中所比较的α-淀粉酶是类透阿米尔α-淀粉酶。
38.权利要求28的方法,其中所比较的α-淀粉酶是SEQ ID NO1到SEQ ID NO8所示的任何一个α-淀粉酶。
全文摘要
本发明涉及亲本类透阿米尔α-淀粉酶的变体,它相对所述亲本α淀粉酶,至少以下性能之一发生改变:i)在pH8到10.5的pH稳定性提高;和/或ii)在pH8到10.5对Ca
文档编号C07K14/32GK1278298SQ9881087
公开日2000年12月27日 申请日期1998年10月30日 优先权日1997年10月30日
发明者托宾·V·博彻特, 阿伦·斯文森, 卡斯滕·安德森, 比贾尼·R·尼尔森, 托宾·L·尼森, 索伦·克贾鲁尔夫 申请人:诺沃挪第克公司