本申请要求2014年11月25日提交的美国临时专利申请序号62/084037的优先权,其出于所有目的通过引用整体并入本文。
本发明涉及具有可用于将各种酮和胺底物转化为仲胺和叔胺产物的亚胺还原酶活性的工程化多肽。
序列表、表格或计算机程序的参考
序列表的正式副本作为ascii格式的文本文件通过efs-web与说明书同时提交,其文件名为“cx2-145wo2_st25.txt”,创建日期为2015年11月20日,且大小为230千字节。通过efs-web提交的序列表是说明书的一部分,并通过引用整体并入本文。
背景
手性仲胺和叔胺是制药行业的重要组成部分。不存在生产这类手性胺化合物的已知的高效的生物催化途径。现有的化学方法使用手性硼试剂或多步合成。
在文献中存在几篇关于仲胺的生物催化合成的报道。据报道,厌氧细菌伍氏醋酸杆菌(acetobacteriumwoodii)完整细胞的亚胺还原酶活性还原亚苄基亚胺(benzylidineimine)和亚丁基亚胺(butylidineimine)(chadha等人,tetrahedron:asym.,19:93-96[2008])。使用伍氏醋酸杆菌的完整细胞,另一篇报告使用在水性介质中的苯甲醛或丁醛和丁胺或苯胺(stephens等人,tetrahedron60:753-758[2004])。据报道,链霉菌属(streptomycessp.)gf3587和gf3546立体选择性地还原2-甲基-1-吡咯啉(mitsukara等人,org.biomol.chem.,8:4533-4535[2010])。
开发用于这种类型的反应的生物催化途径的一个挑战是鉴定可以被工程化以提供在可工业应用条件下有效进行该反应的酶类。冠瘿碱脱氢酶(opinedehydrogenase)是一类氧化还原酶,其使用nadh或nadph作为辅因子作用于ch-nh键。冠瘿碱脱氢酶的天然反应是α-酮酸与氨基酸的还原胺化。具有一些同源性的至少五个天然存在的基因已经被鉴定为编码具有冠瘿碱脱氢酶类的特征活性的酶。这五种酶包括:来自节杆菌属(arthrobactersp.)菌株1c的冠瘿碱脱氢酶(cendh);来自欧洲大扇贝(pectenmaximus)(大扇贝(greatscallop))的章鱼碱脱氢酶(opdh);来自乳酸乳球菌(lactococcuslactis)k1的鸟氨酸合酶(ceos);来自斗嫁
在本领域中存在对生物催化剂和在可工业应用的条件下使用它们以合成手性仲胺和叔胺的方法的需求。
概述
本发明提供了新的生物催化剂和使用它们的相关方法,用于通过使用未活化的酮和未活化的胺作为底物直接还原胺化来合成手性仲胺和叔胺。本发明的生物催化剂是通过seqidno:4、6和8的工程化酶的定向进化而衍生的工程化多肽变体,seqidno:4、6和8的工程化酶由来自节杆菌属菌株1c的、编码具有seqidno:2的氨基酸序列的冠瘿碱脱氢酶的初始野生型基因的定向进化而产生。这些工程化多肽能够催化酮(包括未活化的酮底物诸如环己酮和2-戊酮)或醛底物和伯胺或仲胺底物(包括未活化的胺底物诸如丁胺、苯胺、甲胺和二甲胺)的转化以形成仲胺或叔胺产物化合物。源自冠瘿碱脱氢酶的这些工程化多肽的酶活性被称为“亚胺还原酶活性”,并且本文公开的工程化酶也称为“亚胺还原酶”或“ired”。ired的一般亚胺还原酶活性如下文的方案1所示。
方案1
本发明的具有亚胺还原酶活性的工程化多肽可以接受宽范围的底物。因此,在方案1的生物催化反应中,式(i)的底物的r1和r2基团独立地选自氢原子或任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基;并且式(ii)的底物的r3和r4基团独立地选自氢原子和任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基,条件是r3和r4不能都是氢。任选地,式(i)的底物的r1和r2基团之一或两者和式(ii)的底物的r3和r4基团可以被连接以形成3元至10元环。此外,方案1的生物催化反应可以是分子内反应,其中式(i)的化合物的r1和r2基团的至少一个被连接到式(ii)的化合物的r3和r4基团的至少一个。并且,式(iii)的产物化合物中由*标示的碳原子和/或氮中的一个或二者可以是手性的。如本文进一步描述的,具有亚胺还原酶活性的工程化多肽表现出立体选择性,因此,方案1的亚胺还原酶反应可以用于在单一生物催化反应中建立式(iii)的产物化合物的一个、两个或更多个手性中心。
在一些实施方案中,本发明提供了工程化多肽,其包含与seqidno:2、4或6的氨基酸参考序列具有至少80%序列同一性的氨基酸序列,并且还包含与参考氨基序列相比的一个或更多个氨基酸残基差异,其中工程化多肽具有亚胺还原酶活性。在工程化多肽的一些实施方案中,亚胺还原酶活性是方案1的活性,任选地如表2中示出的反应。
另外,如上文所述,已经确定了冠瘿碱脱氢酶cendh的晶体结构(参见例如britton等人,nat.struct.biol.,5:593-601[1998])。因此,本文公开的各种氨基酸差异和功能活性的这种相关性以及野生型酶cendh的已知三维结构可以为普通技术人员提供足够的信息,以合理地设计本文提供的多肽(以及同源的冠瘿碱脱氢酶,包括opdh、badh、ceos和taudh)的另外的氨基酸残基变化,并保留或改善亚胺还原酶活性或稳定性性质。在一些实施方案中,预期这样的改进可以包括将本发明的工程化多肽工程化以如方案1所述的具有对一系列底物的亚胺还原酶活性并提供一系列产物。
在一些实施方案中,本发明提供了一种工程化多肽,其包含与seqidno:2的参考序列具有至少80%序列同一性和在选自x9、x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x167、x168、x173、x177、x178、x184、x185、x195、x197、x198、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218、x220、x221、x223、x224、x226、x234、x239、x242、x245、x251、x253、x256、x257、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x272、x273、x274、x276、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349的位置的至少一个取代的氨基酸序列,其中与seqidno:2相比,所述多肽具有亚胺还原酶活性。在一些实施方案中,工程化多肽的氨基酸序列包含选自以下的与seqidno:4的参考序列相比的至少一个残基差异:x198、x153、x167、x265、x262、x108、x234、x284、x282、x220、x272、x256、x267、x242、x281、x197、x277、x224和x143。在一些另外的实施方案中,工程化多肽的氨基酸序列包含选自以下的与seqidno:6的参考序列相比的至少一个残基差异:x283、x262、x9、x259、x220、x267、x153、x279、x200、x224、x256、x137、x143、x260、x261、x154、x276和x185。在一些另外的实施方案中,工程化多肽的氨基酸序列包含选自以下的与seqidno:8的参考序列相比的至少一个残基差异:x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x168、x173、x177、x178、x184、x185、x195、x197、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218、x220、x221、x223、x226、x234、x239、x242、x245、x251、x253、x256、x257、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x273、x274、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349。
本发明还提供了工程化亚胺还原酶多肽,其中亚胺还原酶活性包括在合适的反应条件下将下列酮和胺底物化合物对中的至少一个转化为所列的胺产物化合物:(a)酮底物化合物(1a)和胺底物化合物(2a)以产生化合物(3a);(b)酮底物化合物(1b)和胺底物化合物(2b)以产生化合物(3b);(c)酮底物化合物(1c)和胺底物化合物(2c)以产生化合物(3c);(d)酮底物化合物(1d)和胺底物化合物(2d)以产生化合物(3d);(e)酮底物化合物(1d)和胺底物化合物(2c)以产生化合物(3e);(f)酮底物化合物(1d)和胺底物化合物(2c)以产生化合物(3f);以及酮底物化合物(1d)和胺底物化合物(2c)以产生化合物(3g)。在一些实施方案中,参与在合适反应条件下将酮和胺底物化合物对转化成所列的胺产物化合物的亚胺还原酶活性与seqidno:4、6、12、30、126、173、360和/或550的参考多肽的相应活性相比提高了至少2倍。
本发明还提供了工程化多肽,其中氨基酸序列包含选自由seqidno:4-1300的偶数序列标识符组成的组的序列。
本发明还提供了编码本文提供的工程化多肽的多核苷酸。在一些实施方案中,多核苷酸包含选自由seqidno:5-1299的奇数序列标识符组成的组的核酸序列。
本发明还提供包含本文提供的多核苷酸的表达载体。本发明还提供包含本文提供的至少一种多核苷酸的宿主细胞。本发明还提供了包含本文提供的至少一种表达载体的宿主细胞。
本发明还提供了制备具有亚胺还原酶活性的工程化多肽的方法,包括在适于表达该多肽的条件下培养本文提供的宿主细胞,任选地还包括分离该工程化多肽。
发明详述
除非上下文另外清楚地指明,否则如该说明书和所附的权利要求书中使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物。因此,例如对“多肽(apolypeptide)”的提及包括多个多肽。类似地,“包括(comprise、comprises、comprising)”、“包括(include、includes和including)”是可互换的,而不意图限制性的。应当理解,在各种实施方案的描述中使用术语“包括(comprising)”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用“基本上由...组成”或“由...组成”的语言可选择地描述实施方案。还应当理解,在各种实施方案的描述中使用术语“任选的(optional)”或“任选地(optionally)”的情况下,随后描述的事件或情况可能发生或可能不发生,并且该描述包括事件或情况发生的情况和其中它不发生的情况。应该理解,上文的一般描述和下文的详细描述仅是示例性的和说明性的,而不是限制本发明。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。
缩写:
用于遗传编码的氨基酸的缩写是常规的并且如下所示:
当使用三字母缩写时,除非前面具体地有“l”或“d”,或者从使用缩写的上下文清楚看出,否则氨基酸可以关于α-碳(cα)是l-构型或d-构型的。例如,“ala”表示丙氨酸而不指定关于α-碳的构型,而“d-ala”和“l-ala”分别表示d-丙氨酸和l-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的l-构型的氨基酸,小写字母表示关于α-碳的d-构型的氨基酸。例如,“a”表示l-丙氨酸并且“a”表示d-丙氨酸。当多肽序列以单字母或三字母缩写(或其混合物)串表示时,根据常规惯例将序列呈现为氨基(n)至羧基(c)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(a);鸟苷(g);胞苷(c);胸苷(t);和尿苷(u)。除非具体描述,否则缩写的核苷酸可以是核糖核苷或2'-脱氧核糖核苷。核苷可以单独地或总体地指定为核糖核苷或2'-脱氧核糖核苷。当核酸序列以单字母缩写串表示时,序列按照常规惯例呈现为5'至3'方向,并且不示出磷酸。
定义:
参考本发明,本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另有具体定义。因此,以下术语旨在具有以下含义:
“蛋白”、“多肽”和“肽”在本文中可互换使用,来表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如糖基化、磷酸化、脂化、肉豆蔻酸化、泛素化等)。此定义中包括d-氨基酸和l-氨基酸以及d-氨基酸和l-氨基酸的混合物。
“多核苷酸”或“核酸”指共价连接在一起的两个或更多个核苷。多核苷酸可以完全包含核糖核苷(即rna)、完全包含2'脱氧核糖核苷酸(即dna)或核糖核苷和2'脱氧核糖核苷的混合物。虽然核苷通常通过标准磷酸二酯键连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区和双链区二者。此外,虽然多核苷酸通常由天然存在的编码核苷碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成,它可以包含一种或更多种经修饰和/或合成的核苷碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。优选地,此类经修饰的或合成的核苷碱基将是编码核苷碱基。
如本文使用的“冠瘿碱脱氢酶活性”指的是其中将2-酮酸(例如丙酮酸)的羰基和中性l-氨基酸(例如l-正缬氨酸)的氨基转化成仲胺二羧酸酯化合物(例如诸如n-[1-(r)-(羧基)乙基]-(s)-正缬氨酸)的酶活性。
如本文使用的“冠瘿碱脱氢酶”指的是具有冠瘿碱脱氢酶活性的酶。冠瘿碱脱氢酶包括但不限于以下天然存在的酶:来自节杆菌属菌株1c的冠瘿碱脱氢酶(cendh)(seqidno:2)。
如本文使用的“亚胺还原酶活性”指的是如在方案1中说明的,在辅因子nad(p)h的存在下,其中酮或醛的羰基基团和伯胺或仲胺的氨基基团(其中羰基基团和氨基基团可以在单独的化合物上或在相同化合物上)被转化成仲胺或叔胺产物化合物的酶活性。
如本文使用的“亚胺还原酶”或“ired”指的是具有亚胺还原酶活性的酶。应当理解,亚胺还原酶不限于衍生自来自节杆菌属菌种1c的野生型冠瘿碱脱氢酶的工程化多肽,还可以包括具有亚胺还原酶活性的其他酶,包括衍生自其他冠瘿碱脱氢酶的工程化多肽,诸如来自欧洲大扇贝的章鱼碱脱氢酶(opdh)、来自乳酸乳球菌k1的鸟氨酸合酶(ceos)、来自斗嫁
“编码序列”指编码蛋白质的氨基酸序列的核酸部分(例如基因)。
“天然存在的”或“野生型”指自然界中发现的形式。例如,天然存在或野生型多肽或多核苷酸序列是存在于可以从自然资源分离的生物体中并且没有被人工操作有意修饰的序列。
当关于例如细胞、核酸或多肽使用时,“重组”或“工程化”或“非天然存在的”指的是材料或相应于该材料的天然或天然形式的材料,其已经以自然中原本不存在的方式修饰,或与其相同但产生自或源自合成材料和/或通过使用重组技术被操作。非限制性实例包括,除其他以外,表达在天然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的天然基因的重组细胞。
“序列同一性百分比”和“同源性百分比”在本文中可互换使用,指多核苷酸和多肽之间的比较,并且通过在比较窗上比较两个最佳比对(aligned)序列来确定,其中与用于两个序列的最佳比对序列的参考序列相比,比较窗中的多核苷酸或多肽序列的部分可以包括添加或缺失(即缺口)。百分比可以如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,用匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。可选择地,百分比可以如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基或核酸碱基或氨基酸残基与缺口对齐的位置的数目以产生匹配位置的数目,用匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,有许多已建立的算法可用于比对两个序列。用于比较的序列的最佳比对可以例如通过smith和waterman,adv.appl.math.,2:482(1981)的局部同源性算法、needleman和wunsch,j.mol.biol.,48:443(1970)的同源性比对算法、pearson和lipman,proc.natl.acad.sci.usa85:2444(1988)的搜索相似性方法、通过这些算法的计算机化执行(gcgwisconsin软件包中的gap、bestfit、fasta和tfasta)、或通过目视检查(一般参见currentprotocolsinmolecularbiology,f.m.ausubel等人,eds.,currentprotocols,ajointventurebetweengreenepublishingassociates,inc.andjohnwiley&sons,inc.,(1995增补)(ausubel))进行。适用于确定序列同一性百分比和序列相似性的算法的实例是blast和blast2.0算法,其分别在altschul等人,j.mol.biol.,215:403-410(1990)和altschul等人,nucl.acidsres.,3389-3402(1977)中描述。用于进行blast分析的软件可通过美国国家生物技术信息中心(nationalcenterforbiotechnologyinformation,ncbi)网站公开获得。此算法包括首先通过识别查询序列中长度w的短字来识别高得分序列对(hsp),其在与数据库序列中的相同长度的字比对时匹配或满足一些正值阈值得分t。t被称为相邻字得分阈值(altschul等人,同上)。这些最初的相邻字匹配作为启动搜索的种子来发现含有它们的更长的hsp。然后,字匹配沿着每个序列以两个方向延伸,直到累积比对得分不再增加。对于核苷酸序列,使用参数m(对于一对匹配残基的奖励得分;总是>0)和n(对于不匹配残基的罚分;总是<0)计算累积得分。对于氨基酸序列,使用评分矩阵来计算累积得分。当出现以下情况时,每个方向的字匹配的延伸被暂停:累积比对得分从其最大获得值减少量x;由于一个或更多个负得分的残基比对的积累,累积得分变为零或小于零;或者达到任一序列的末端。blast算法参数w、t和x决定了比对的灵敏度和速度。blastn程序(用于核苷酸序列)使用以下为默认参数:字长(w)为11、期望值(e)为10、m=5、n=-4和双链比较。对于氨基酸序列,blastp程序使用以下为默认参数:字长(w)为3、期望值(e)为10和blosum62得分矩阵(参见henikoff和henikoff,proc.natl.acad.sci.usa89:10915[1989])。序列比对和%序列同一性的示例性确定可以采用gcgwisconsin软件包(accelrys,madisonwi)中的bestfit或gap程序,使用提供的默认参数。
“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大的序列的子集;例如,全长基因或多肽序列的区段。通常,参考序列长度为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度,或核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即完整序列的一部分),和(2)还可以包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”上的序列来鉴定和比较序列相似性的局部区域来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列,其中参考序列是可以在一级序列中具有一个或更多个改变的序列。例如,“基于seqidno:4的在对应于x14的残基处具有缬氨酸的参考序列”或“x14v”指其中在seqidno:4中x14处的对应残基(酪氨酸)已经改为缬氨酸的参考序列。
“比较窗”指至少约20个连续核苷酸位置或氨基酸残基的概念区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中与用于两个序列最佳比对的参考序列(其不包含添加或缺失)相比,比较窗中的序列的部分可以包含20%或更少的添加或缺失(即缺口)。比较窗可以长于20个连续残基,并且包括任选地30个、40个、50个、100个或更长的窗。
“大体同一性”是指在至少20个残基位置的比较窗中、通常在至少30个-50个残基窗中,与参考序列相比,具有至少80%序列同一性、至少85%同一性和89%至95%序列同一性,更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比通过在比较窗上比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的具体实施方案中,术语“大体同一性”指当诸如通过程序gap或bestfit使用默认缺口权重进行最佳比对时,两个多肽序列共享至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性或更高(例如99%的序列同一性)。优选地,不相同的残基位置通过保守氨基酸取代而不同。
当在特定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“参考”或“相对于”指给定氨基酸或多核苷酸序列与参考序列相比时,特定参考序列的残基的编号。换句话说,给定聚合物的残基数或残基位置针对参考序列指定,而不是通过给定氨基酸或多核苷酸序列内的残基的实际编号位置指定。例如,可通过引入缺口以优化两个序列之间的残基匹配来比对给定氨基酸序列诸如工程化亚胺还原酶的氨基酸序列与参考序列。在这些情况下,尽管存在缺口,但是给定氨基酸或多核苷酸序列中残基的编号相对于与其比对的参考序列进行。
“氨基酸差异”或“残基差异”指多肽序列的一个位置的氨基酸残基相对于参考序列中的相应位置的氨基酸残基的变化。在本文中,氨基酸差异的位置通常被称为“xn”,其中n指在残基差异所基于的参考序列中的相应位置。例如,“与seqidno:2相比,在x25位置的残基差异”指在对应于seqidno:2的位置25的多肽位置的氨基酸残基的变化。因此,如果seqidno:2的参考多肽在位置25具有缬氨酸,则“与seqidno:2相比在位置x25的残基差异”指在对应于seqidno:2的位置25的多肽的位置上除了缬氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,位置上的特定氨基酸残基差异表示为“xny”,其中“xn”如上所述指定相应的位置,并且“y”是在工程化多肽中发现的氨基酸的单字母标识符(即与参考多肽不同的残基)。在一些实施方案中,多于一个氨基酸可以出现在指定的残基位置,替代氨基酸可以以xny/z的形式列出,其中y和z表示替换的氨基酸残基。在一些情况下(例如,在表3a、3b、3c、3d和3e中),本发明还提供由常规符号“anb”表示的特定氨基酸差异,其中a是参考序列中的残基的单字母标识符,“n”是参考序列中残基位置的编号,b是工程化多肽序列中残基取代的单字母标识符。此外,在一些情况下,本发明的多肽可以包括相对于参考序列的一个或更多个氨基酸残基差异,其由相对于参考序列进行改变的指定位置的列表指示。本发明包括包含一个或更多个氨基酸差异的工程化多肽序列,所述氨基酸差异包括保守性氨基酸取代和非保守性氨基酸取代之一或二者。
“保守性氨基酸取代”指用具有相似侧链的不同残基取代残基,并且因此通常涉及用氨基酸的相同或相似定义类型中的氨基酸取代多肽中的氨基酸。作为实例而非限制,具有脂族侧链的氨基酸可以被另一个脂族氨基酸取代,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸取代,例如丝氨酸和苏氨酸;具有芳族侧链的氨基酸被具有芳族侧链的另一个氨基酸取代,例如苯丙氨酸、酪氨酸、色氨酸和组氨酸;具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸取代,例如赖氨酸和精氨酸;具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸取代,例如天冬氨酸或谷氨酸;并且疏水性或亲水性氨基酸分别被另一个疏水性或亲水性氨基酸替代。示例性保守性取代在下文表1中提供。
表1
“非保守性取代”指用具有显著不同侧链性质的氨基酸取代多肽中的氨基酸。非保守性取代可以使用定义的组之间而非定义的组之内的氨基酸,并影响(a)取代区域中肽骨架的结构(例如,用脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。作为实例而非限制,示例性非保守性取代可以是用碱性或脂族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
“缺失”指通过从参考多肽中去除一个或更多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、多达构成参考酶的氨基酸总数的10%或多达构成参考酶的氨基酸总数的20%,同时保留酶活性和/或保留工程化亚胺还原酶的改进特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包含连续的区段,或者可以是不连续的。
“插入”指通过添加来自参考多肽的一个或更多个氨基酸来修饰多肽。在一些实施方案中,改进的工程化亚胺还原酶包括将一个或更多个氨基酸插入到具有亚胺还原酶活性的天然存在的多肽中,以及将一个或更多个氨基酸插入到其它改进的亚胺还原酶多肽中。插入可以在多肽的内部部分,或在羧基或氨基末端。如本文使用的插入包括本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或由天然存在的多肽中的一个或更多个氨基酸隔开。
本文使用的“片段”指具有氨基末端和/或羧基末端缺失但其余氨基酸序列与序列中相应位置相同的多肽。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长、以及多达全长亚胺还原酶多肽例如seqidno:4-1300中任一个的多肽的70%、80%、90%、95%、98%和99%。
“分离的多肽”指与天然伴随的其它污染物例如蛋白、脂质和多核苷酸基本分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如宿主细胞或体外合成)中移出或纯化的多肽。工程化亚胺还原酶可以存在于细胞内、存在于细胞培养基中,或以各种形式制备,诸如裂解物或分离的制品。因此,在一些实施方案中,工程化亚胺还原酶可以是分离的多肽。
“基本纯的多肽”是指其中多肽种类是存在的优势种类的组合物(即,以摩尔或重量计,其比组合物中的任何其它单个大分子种类更丰富),并且当目标种类构成以摩尔或%重量计存在的大分子种类的至少约50%时,其一般为基本纯的组合物。通常,基本纯的亚胺还原酶组合物将包含组合物中存在的所有大分子种类的按摩尔或%重量计的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多、约98%或更多。在一些实施方案中,目标种类被纯化至基本均质(即组合物中的污染物种类不能通过常规检测方法检测到),其中组合物主要由单个大分子种类组成。溶剂种类、小分子(<500道尔顿)和元素离子种类不被认为是大分子种类。在一些实施方案中,分离的工程化亚胺还原酶多肽是基本纯的多肽组合物。
“立体选择性”指在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于其他种,或者其可以是完全的,其中只形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即二者的总和中一种对映体的分数(通常以百分比表示)。可选择地,本领域通常报告其为根据下式从中计算的对映体过量(e.e.)(通常为百分比):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报道为百分比),通常可选择地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映体过量是立体异构过量的类型。
“高度立体选择性”指能够以至少约85%立体异构体过量将一种或更多种底物例如底物化合物(1e)和(2b)转化成相应的胺产物例如化合物(3i)的化学或酶促反应。
“改进的酶特性”是指与参考亚胺还原酶相比表现出任何酶特性的改进的亚胺还原酶多肽。对于本文描述的工程化亚胺还原酶多肽,比较一般针对亚胺还原酶由其衍生的野生型酶进行,尽管在一些实施方案中,参考酶可以是另一种改进的工程化亚胺还原酶。需要改进的酶特性包括但不限于酶活性(其可以用底物转化的百分比表示)、热稳定性、溶剂稳定性、ph活性谱、辅因子需求、对抑制剂的耐性(refractoriness)(例如底物或产物抑制)、立体专一性和立体选择性(包括对映异构体选择性)。
“增加的酶促活性”指工程化亚胺还原酶多肽的改进特性,其可以通过与参考亚胺还原酶相比比活性(例如,产生的产物/时间/重量蛋白)的增加或将底物转化为产物的百分比(例如使用特定量的亚胺还原酶,在指定时间段内将起始量的底物转化为产物的转化百分比)的增加来表示。在实施例中提供了确定酶活性的示例性方法。与酶活性相关的任何特性都可以被影响,包括经典的酶特性km、vmax或kcat,其变化可导致酶活性的增加。酶活性的提高可以从相应的野生型酶的约1.2倍的酶活性至亚胺还原酶多肽由其衍生的天然存在的或另一种工程化亚胺还原酶活性的2倍、5倍、10倍、20倍、25倍、50倍或更多。亚胺还原酶活性可以通过任何一种标准测定来测量,诸如通过监测底物、辅因子或产物的特性的变化。在一些实施方案中,产生的产物的量可以通过液相色谱-质谱(lc-ms)测量。酶活性的比较使用定义的酶制品、在设定条件下用定义的测定和一种或更多种限定的底物进行,如本文进一步详细描述的。通常,当比较裂解物时,确定细胞数量和测定的蛋白的量,并且使用相同的表达系统和相同的宿主细胞来使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。
“转化”指将底物酶促转化成相应的产物。“转化百分比”指在指定条件下在一段时间内转化成产物的底物的百分比。因此,亚胺还原酶多肽的“酶促活性”或“活性”可以表示为底物向产物的“转化百分比”。
“热稳定”指与野生型酶相比,在暴露于高温(例如40℃至80℃)一段时间(例如0.5小时至24小时)后,保持相似活性(例如超过60%至80%)的亚胺还原酶多肽。
“溶剂稳定”指与野生型酶相比,在暴露于不同浓度(例如5%至99%)的溶剂(乙醇、异丙醇、二甲基亚砜(dmso)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯,乙酸丁酯、甲基叔丁基醚等)一段时间(例如0.5小时至24小时)后,保持相似活性(大于例如60%至80%)的亚胺还原酶多肽。
“热稳定且溶剂稳定”指既热稳定也溶剂稳定的亚胺还原酶多肽。
“严格杂交”在本文中用于指核酸杂合体稳定的条件。如本领域技术人员已知的,杂合体的稳定性反映在杂合体的解链温度(tm)中。通常,杂合体的稳定性是离子强度、温度、g/c含量和离液剂的存在的函数。可以使用已知的用于预测解链温度的方法来计算多核苷酸的tm值(参见例如baldino等人,methodsenzymology168:761-777;bolton等人,1962,proc.natl.acad.sci.usa48:1390;bresslauer等人,1986,proc.natl.acad.sciusa83:8893-8897;freier等人,1986,proc.natl.acad.sciusa83:9373-9377;kierzek等人,biochemistry25:7840-7846;rychlik等人,1990,nucleicacidsres18:6409-6412(勘误,1991,nucleicacidsres19:698);sambrook等人,同上);suggs等人,1981,indevelopmentalbiologyusingpurifiedgenes(brown等人编辑),第683-693页,academicpress;和wetmur,1991,critrevbiochemmolbiol26:227-259。所有出版物通过引用并入本文)。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格的条件下,与编码本发明的工程化亚胺还原酶的序列的互补体杂交。
“杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同但严格性更高的洗涤。术语“中度严格性杂交”是指允许靶dna结合与靶dna具有约60%同一性、优选地约75%同一性、约85%同一性,与靶多核苷酸具有大于约90%同一性的互补核酸的条件。示例性中等严格条件是等同于在50%甲酰胺、5×denhart's溶液、5×sspe、0.2%sds中在42℃杂交、随后在0.2×sspe、0.2%sds、在42℃下洗涤的条件。“高严格性杂交”通常指距离在针对所定义的多核苷酸序列的溶液条件下确定的热解链温度tm约10℃或更少的条件。在一些实施方案中,高严格条件指仅允许在65℃、在0.018mnacl中形成稳定杂合体的那些核酸序列杂交的条件(即如果杂合体在65℃、0.018mnacl中不稳定,它将不会在高严格条件下稳定,如本文所述)。可以例如通过在相当于在42℃下、50%甲酰胺、5×denhart's溶液、5×sspe、0.2%sds的条件下杂交,然后在65℃下、0.1×sspe和0.1%sds中洗涤来提供高严格性条件。另一个高严格性条件是在相当于在65℃、在含有0.1%(w:v)sds的5xssc的条件下杂交,并在65℃用含有0.1%sds的0.1×ssc洗涤。其他高严格性杂交条件和中等严格条件在上文引用的参考文献中描述。
“异源”多核苷酸指通过实验室技术被引入宿主细胞的任何多核苷酸,并且包括从宿主细胞中去除、进行实验室操作然后重新引入宿主细胞的多核苷酸。
“密码子优化”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中有效地表达。虽然因为大多数氨基酸由几个被称为“同义(synonym)”或“同义(synonymous)”密码子的密码子表示,遗传密码是简并的,但公知的是特定生物体的密码子使用是非随机的,并且偏向于特定的密码子三联体。这种密码子使用偏好在给定基因、共同功能或祖先来源的基因、相比于低拷贝数蛋白的高表达蛋白和生物体基因组的聚集蛋白编码区中可以更高。在一些实施方案中,编码亚胺还原酶的多核苷酸可以被密码子优化用于从选择用于表达的宿主生物体的最佳生产。
“优选的、最佳的、高密码子使用偏好密码子”可以互换地指在蛋白编码区中的使用频率高于编码相同氨基酸的其他密码子的密码子。优选密码子可根据单个基因、共同功能或来源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率或其组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用来确定特定生物体中密码子的频率(例如密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析和基因中使用的密码子的有效数目(参见gcgcodonpreference,geneticscomputergroupwisconsinpackage;codonw,johnpeden,universityofnottingham;mcinerney,bioinform.,14:372-73[1998];stenico等人,nucl.acidsres.,222437-46[1994];和wright,gene87:23-29[1990])。不断增加的生物体列表的密码子使用表是可以获得的(参见例如,wada等人,nucl.acidsres.20:2111-2118[1992];nakamura等人,nucl.acidsres.28:292[2000];duret等人,同上;和henaut和danchin,in“escherichiacoliandsalmonella,”neidhardt等人(编辑),asmpress,washingtond.c.,[1996],第2047-2066页)。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达蛋白(例如完整的蛋白编码序列-cds)、表达序列标签(ests)或基因组序列的预测编码区的核酸序列(参见例如mount,bioinformatics:sequenceandgenomeanalysis,第8章,coldspringharborlaboratorypress,coldspringharbor,n.y.,[2001];uberbacher,meth.enzymol.,266:259-281[1996];和tiwari等人,comput.appl.biosci.,13:263-270[1997])。
“控制序列”在本文中被定义为包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每个控制序列可以是编码多肽的核酸序列的天然或外源序列。此类控制序列包括但不限于前导序列、多聚腺苷酸化序列、前体肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子和转录和翻译终止信号。控制序列可以设有接头,目的是引入特定限制性位点以促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作地连接”在本文中被定义为这样一种构造:控制序列被适当地置于相对于感兴趣的多核苷酸序列的某一位置(即处于功能性关系),以便控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是指被宿主细胞识别用于表达感兴趣的多核苷酸(诸如编码序列)的核酸序列。启动子序列含有介导感兴趣的多核苷酸的表达的转录调控序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外多肽或胞内多肽的基因获得。
“合适的反应条件”指生物催化反应溶液中的那些条件(例如酶载量的范围、底物载量、辅因子载量、温度、ph、缓冲液、共溶剂等),在此条件下,本发明的亚胺还原酶多肽能够将底物化合物转化成产物化合物(例如,将化合物(2)转化成化合物(1))。在本发明中提供了并通过实施例说明了示例性的“合适的反应条件”。
“辅因子再生系统”或“辅因子循环系统”指参与还原辅因子的氧化形式的反应(例如nadp+至nadph)的一组反应物。被亚胺还原酶催化的酮底物的还原胺化反应氧化的辅因子通过辅因子再生系统以还原的形式再生。辅因子再生系统包括化学计量还原剂,其是还原氢等同物的来源并且能够还原辅因子的氧化形式。辅因子再生系统还可以包含催化剂,例如催化由还原剂还原辅因子的氧化形式的酶催化剂。分别从nad+或nadp+再生nadh或nadph的辅因子再生系统是本领域已知的,并且可以在本文所述的方法中使用。
“甲酸脱氢酶(formatedehydrogenase)”和“fdh”在本文中可互换使用,分别指催化甲酸盐(formate)和nad+或nadp+转化为二氧化碳和nadh或nadph的nad+或nadp+依赖性酶。
诸如“化合物载量”或“酶载量”或“辅因子载量”中的“载量”指在反应开始时反应混合物中组分的浓度或量。
在生物催化剂介导的过程的上下文中,“底物”指生物催化剂所作用的化合物或分子。例如,在本文公开的还原胺化方法中使用的亚胺还原酶生物催化剂中,存在式(i)的酮(或醛)底物诸如环己酮,和式(ii)的胺底物诸如丁胺。
在生物催化剂介导的过程的上下文中,“产物”指由生物催化剂的作用所产生的化合物或分子。例如,在本文公开的方法中使用的亚胺还原酶生物催化剂的示例性产物是仲胺或叔胺化合物,诸如式(iii)的化合物。
“烷基(alkyl)”指具有从1至18个碳原子(包括端点)的,直链的或支链的,更优选地从1-8个碳原子(包括端点),并且最优选地1-6个碳原子(包括端点)的饱和烃基。具有指定数目的碳原子的烷基在括号中表示,例如(c1-c6)烷基指1-6个碳原子的烷基。
“亚烷基”指具有从1至18个碳原子(包括端点)的,更优选地从1至8个碳原子(包括端点),并且最优选的1至6个碳原子(包括端点)的直链或支链二价烃基。
“烯基”指具有从2至12个碳原子(包括端点)的、直链或支链的、含有至少一个双键但任选地含有多于一个双键的基团。
“亚烯基”是指具有2至12个碳原子(包括端点)和一个或更多个碳-碳双键,更优选地从2至8个碳原子(包括端点),最优选地2至6个碳原子(包括端点)的直链或支链的二价烃基。
“炔基”指具有从2至12个碳原子(包括端点)的、直链或支链的、含有至少一个三键但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键键合部分的基团。
“环烷基”指具有从3至12个碳原子(包括端点)的、具有单个环状环或多个稠环(condensedrings)的环状烷基基团,其可以被从1至3个烷基基团任选地取代。示例性环烷基基团包括但不限于单环结构和多环结构,所述单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,所述多环结构包括桥环系诸如金刚烷基等。
“环烷基烷基”指被环烷基取代的烷基,即环烷基-烷基-基团,优选地在烷基部分具有从1至6个碳原子(包括端点)并且在环烷基部分具有从3至12个碳原子(包括端点)。此类环烷基烷基基团的实例是环丙基甲基、环己基乙基等。
“芳基”指具有单环(例如苯基)或多个稠环(例如萘基或蒽基)的具有从6至12个碳原子(包括端点)的不饱和芳族碳环基团。示例性的芳基包括苯基、吡啶基、萘基等。
“芳基烷基”指被芳基取代的烷基,即芳基-烷基-基团,优选地在烷基部分具有从1至6个碳原子(包括端点)且在芳基部分具有从6至12个碳原子(包括端点)。此类芳基烷基基团的实例是苄基、苯乙基等。
“杂烷基”、“杂烯基”和“杂炔基”指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团取代的如本文定义的烷基、烯基和炔基。可以代替碳原子的杂原子和/或杂原子基团包括但不限于-o-、-s-、-s-o-、-nrγ-、-ph-、-s(o)-、-s(o)2-、-s(o)nrγ-、-s(o)2nrγ-等,包括其组合,其中每个rγ独立地选自氢、烷基、杂烷基、环烷基、杂环烷基、芳基和杂芳基。
“杂芳基”指具有从1至10个碳原子(包括端点)和在环内的选自氧、氮和硫的1至4个杂原子(包括端点)的芳族杂环基团。此类杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。
“杂芳基烷基”指被杂芳基取代的烷基,即杂芳基-烷基-基团,优选地在烷基部分具有从1至6个碳原子(包括端点)并且在杂芳基部分具有从5至12个环原子(包括端点)。此类杂芳基烷基基团的实例是吡啶基甲基等。
“杂环”、“杂环的”和可互换的“杂环烷基”指具有单环或多个稠环的、具有从2至10个碳环原子(包括端点)和在环内的选自氮、硫或氧的从1至4个杂环原子(包括端点)的饱和的或不饱和的基团。此类杂环基团可以具有单环(例如哌啶基或四氢呋喃基)或多个稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、酚噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、四氢咪唑(imidazolidine)、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、二氢吲哚(indoline)等。
“杂环烷基烷基”指被杂环烷基取代的烷基,即杂环烷基-烷基-基团,优选在烷基部分具有从1至6个碳原子(包括端点),并且在杂环烷基部分具有从3至12个环原子(包括端点)。
“氧基”指二价基团-o-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
“烷氧基”或“烷基氧基”在本文中可互换使用来指基团-orζ,其中rζ是烷基基团,包括任选地被取代的烷基基团。
如本文使用的“芳氧基”指基团-or,其中r是如上文定义的芳基基团,包括还如本文定义的任选地被取代的芳基基团。
“羧基”指-cooh。
“羧基烷基”指被羧基基团取代的烷基。
“羰基”指基团-c(o)-。被取代的羰基指基团rη-c(o)-rη,其中每个rη独立地选自任选地被取代的烷基、环烷基、环杂烷基、烷氧基、羧基、芳基、芳氧基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、磺酰基等。典型的被取代的羰基基团包括酸、酮、醛、酰胺、酯、酰基卤、硫酯等。
“氨基”指基团-nh2。被取代的氨基指-nhrη、nrηrη和nrηrηrη,其中每个rη独立地选自任选地被取代的烷基、环烷基、环杂烷基、烷氧基、羧基、芳基、芳氧基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“氨基烷基”指其中一个或更多个氢原子被氨基(包括被取代的氨基)取代的烷基。
“氨基羰基”指被如本文定义的氨基(包括被取代的氨基)取代的羰基并且包括酰胺。
“氨基羰基烷基”指被如本文定义的氨基羰基基团取代的烷基。
“卤素(halogen)”或“卤代(halo)”指氟、氯、溴和碘。
“卤代烷基”指其中一个或更多个氢原子被卤素取代的烷基基团。因此,术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等直到全卤代烷基。例如,表述“(c1c2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1-三氟乙基、全氟乙基等。
“羟基”指-oh。
“羟基烷基”指被一个或更多个羟基取代的烷基。
“硫基(thio)”或“硫烷基”指-sh。被取代的硫基或硫烷基指-s-rη,其中rη是烷基、芳基或其他合适的取代基。
“烷硫基”指-srζ,其中rζ是可以任选地被取代的烷基。典型的烷硫基基团包括但不限于甲硫基、乙硫基、正丙硫基等。
“烷硫基烷基”指被烷硫基基团-srζ取代的烷基,其中rζ是可以任选地被取代的烷基。
“磺酰基”指-so2-。被取代的磺酰基指-so2-rη,其中rη是烷基、芳基或其它合适的取代基。
“烷基磺酰基”指-so2-rζ,其中rζ是可以任选地被取代的烷基。典型的烷基磺酰基基团包括但不限于甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
“烷基磺酰基烷基”指被烷基磺酰基基团-so2-rζ取代的烷基,其中rζ是可以任选地被取代的烷基。
“元环(memberedring)”意在包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此,例如环己基、吡啶、吡喃和噻喃是6元环,并且环戊基、吡咯、呋喃和噻吩是5元环。
“稠合双环(fusedbicyclicring)”是指在每个环中具有5或8个原子的未被取代的和被取代的碳环和/或杂环的环部分,所述环具有2个共用原子。
在本文中关于上述化学基团使用的“任选地被取代的”意指被氢占据的化学基团的位置可以被另一个原子诸如碳、氧、氮或硫或例如但不限于以下的化学基团所取代:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、甲酰氨基、被取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、被取代的磺酰氨基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基甲酰基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环基、(杂环)氧基和(杂环)烷基;其中优选的杂原子是氧、氮和硫。另外,当在这些取代化学基团上存在开放化合价时,它们可以进一步被烷基、环烷基、芳基、杂芳基和/或杂环基团取代,当这些开放化合价存在于碳上时,它们可以进一步被卤素和氧-、氮-、或硫-键合的取代基取代,并且当存在多个这样的开放化合价时,这些基团可以通过直接形成键或通过与新的杂原子(优选氧、氮或硫)键合形成键而连接形成环。进一步预期,可以进行上述取代,条件是用取代基代替氢不会对本发明的分子带来不可接受的不稳定性,并且以别的方式在化学上是合理的。本领域普通技术人员将理解,对于被描述为任选地被取代的任何化学基团,仅意在包括空间上可实现的和/或合成上可行的化学基团。最后,如本文使用的“任选地被取代的”是指术语或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基、环烷基、芳基和杂芳基彼此独立地可以被取代或可以不被取代。
6.3工程化亚胺还原酶(ired)多肽
本发明提供了具有亚胺还原酶活性的工程化多肽、编码该多肽的多核苷酸;制备该多肽的方法以及使用该多肽的方法。当描述涉及多肽时,应当理解,它还描述了编码该多肽的多核苷酸。
如上所述,亚胺还原酶属于催化酮底物和伯胺或仲胺底物还原胺化成仲胺或叔胺产物的一类酶,如方案1所示(参见上文关于式(i)、式(ii)和式(iii)的化合物的方案和基团结构)。
具有seqidno:2的氨基酸序列的来自节杆菌属菌株1c的冠瘿碱脱氢酶(在本文中还被称为“cendh”)天然地催化酮底物(丙酮酸盐)和氨基酸底物(l-2-氨基戊酸(或“l-正缬氨酸”))转化为产物(2s)-2-((1-羧乙基)氨基)戊酸。cendh还催化丙酮酸盐与氨基酸底物l-鸟氨酸和β-丙氨酸以及结构上相似的氨基磺酸底物牛磺酸的反应。此外,发现cendh催化未活化的酮底物环己酮(而不是丙酮酸盐)及其天然胺底物l-正缬氨酸转化为仲胺产物(s)-2-(环己基氨基)戊酸。还发现cendh催化其天然酮底物丙酮酸盐与伯胺丁胺、乙胺和异丙胺转化为它们各自的2-(烷基氨基)丙酸仲胺产物。然而,cendh对丙酮酸盐与仲胺诸如二甲胺的转化不显示任何活性。此外,当与未活化的伯胺底物丁胺一起使用时,cendh不显示出对未活化的酮底物环己酮的任何亚胺还原酶活性。
本发明提供了克服了野生型冠瘿碱脱氢酶cendh的缺陷的工程化亚胺还原酶。衍生自节杆菌属菌株1c的野生型酶的工程化亚胺还原酶多肽能够高效地将丙酮酸盐和l-正缬氨酸转化为产物(2s)-2-((1-羧乙基)氨基)戊酸,并且还能够将一系列式(i)的酮底物化合物和式(ii)的胺底物化合物高效地转化为式(iii)的仲胺和叔胺产物化合物,如以下表2中列出的转化反应(a)至(g)示出的。
显著地,本发明提供了seqidno:4、6或8(其之前从天然存在的seqidno:2的cendh多肽进化)的具有亚胺还原酶活性的参考工程化多肽的序列中的氨基酸残基位置和对应的突变,该突变导致增强的酶特性,包括,除其他以外,亚胺还原酶活性、底物特异性和选择性。特别地,本发明提供了能够催化诸如表2中的那些还原胺化反应(即式(i)的酮底物化合物与式(ii)的伯胺和仲胺底物化合物的还原胺化,藉以产生式(iii)的仲胺或叔胺化合物)的工程化ired多肽。
在一些实施方案中,与野生型酶cendh相比,在限定的时间和相同的酶量下,工程化亚胺还原酶多肽在式(i)的酮底物和式(ii)的胺底物向式(iii)的胺产物的转化中显示了增加的活性。在一些实施方案中,在合适的反应条件下,与seqidno:4、6或8的参考工程化多肽相比,工程化亚胺还原酶多肽具有至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍或10倍或更大的活性。
在一些实施方案中,工程化亚胺还原酶多肽在式(i)的酮底物和式(ii)的胺底物向式(iii)的胺产物的转化中表现出亚胺还原酶活性,对此seqidno:2的野生型多肽cendh不具有可检测的活性。
由工程化亚胺还原酶多肽产生的式(iii)的产物化合物可以是具有一个或更多个手性中心的仲胺或叔胺化合物。在一些实施方案中,工程化亚胺还原酶多肽能够以高于90%、91%、92%、93%、94%、95%,96%、97%、98%、99%、99.5%或更高的对映异构体过量或非对映异构体过量将式(i)和式(ii)的酮和胺底物化合物转化为式(iii)的手性胺产物化合物。
在一些实施方案中,在合适的反应条件下,相对于seqidno:4、6或8的参考多肽的耐受性,工程化亚胺还原酶能够以对于这些底物化合物的一种或两种的存在的增加的耐受性转化式(i)和式(ii)的酮和胺底物化合物。因此,在一些实施方案中,在合适的反应条件下,在约120h或更少、72h或更少、约48h或更少、约36h或更少或约24h或更少的反应时间内,工程化亚胺还原酶多肽能够以至少约1g/l、约5g/l、约10g/l、约20g/l、约30g/l、约40g/l、约50g/l、约70g/l、约100g/l、约125g/l、约150g/l、约175g/l或约200g/l或更大的底物载量浓度以至少约0.001%、至少约0.01%、至少约0.1%、至少约1%、至少约10%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约98%或至少约99%的转化百分比转化式(i)和式(ii)的酮和胺底物化合物。
工程化多肽的上述增强的性质进行转化的合适的反应条件可以根据多肽、底物、辅因子(例如nad(p)h)、辅酶(例如fdh[甲酸脱氢酶]或gdh[葡萄糖脱氢酶])的浓度或量、缓冲剂、共溶剂、ph、温度、反应时间和/或多肽固定于固体支持物上的条件确定,如下文和实施例中进一步描述的。
本发明提供了许多具有亚胺还原酶活性的示例性工程化多肽。这些示例性多肽从seqidno:4、6或8的先前工程化多肽进化(其通过从seqidno:2的野生型cendh的定向进化而获得),并且表现出改善的性质,特别是在多种酮和胺底物的转化中的增加的活性和稳定性,包括将化合物(1a)和(2a)转化为胺产物化合物(3a)、将化合物(1b)和(2b)转化为胺产物化合物(3b)、将化合物(1c)和(2c)转化为胺产物化合物(3c)、将化合物(1d)和(2d)转化为胺产物化合物(3d)、将化合物(1d)和(2c)转化为胺产物化合物(3e)、将化合物(1d)和(2c)转化为胺产物化合物(3f)、将化合物(1d)和(2c)转化为胺产物化合物(3g)。这些具有亚胺还原酶活性的示例性工程化多肽具有与seqidno:4、6或8相比在以下残基位置处包括一个或更多个残基差异的氨基酸序列(以seqidno:10-1300的偶数序列标识符在随附的序列表中提供):x9、x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x167、x168、x173、x177、x178、x184、x185、x195、x197、x198、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218、x220、x221、x223、x224、x226、x234、x239、x242、x245、x251、x253、x256、x257、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x272、x273、x274、x276、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349。表3a-3m中的结果提供了在一系列酮和胺底物上具有增加的亚胺还原酶活性和/或稳定性的变体。
本发明的示例性非天然存在(或工程化)亚胺还原酶多肽的结构和功能信息基于在这些酶的定向进化中使用的七种不同的高通量(htp)筛选测定:将化合物(1a)和(2a)转化为胺产物化合物(3a)、将化合物(1b)和(2b)转化为胺产物化合物(3b)、将化合物(1c)和(2c)转化为胺产物化合物(3c)、将化合物(1d)和(2d)转化为胺产物化合物(3d)、将化合物(1d)和(2c)转化为胺产物化合物(3e)、将化合物(1d)和(2c)转化为胺产物化合物(3f)、将化合物(1d)和(2c)转化为胺产物化合物(3g)。这些htp筛选测定的结果在以下表3a-3m中示出。奇数序列标识符(即seqidno)是指编码偶数seqidno所提供的氨基酸序列的核苷酸序列,并且序列提供在本发明随附的电子序列表文件中,其在此通过引用并入本文。
从表3a-3m中示出的示例性多肽的分析中,酶特性的增强和与seqidno:4、6和/或8的工程化多肽的参考序列相比在这些表中指出的残基位置处的残基差异相关。
另外,如上文所述,已经确定了冠瘿碱脱氢酶cendh的晶体结构(参见例如britton等人,nat.struct.biol.5:593-601[1998])。因此,本文公开的各种氨基酸差异和功能活性的这种相关性以及野生型酶cendh的已知的三维结构可以为普通技术人员提供足够的信息,以合理地设计本文提供的多肽(以及同源的冠瘿碱脱氢酶,包括opdh、badh、ceos和taudh)的另外的氨基酸残基变化,并保留或改善亚胺还原酶活性或稳定性性质。在一些实施方案中,预期这样的改进可以包括将本发明的工程化多肽工程化以如方案1所述的具有对一系列底物的亚胺还原酶活性并提供一系列产物。
鉴于本文提供的指导,进一步预期,偶数序列标识符seqidno:4-1300的任何示例性工程化多肽序列可以被用作合成其它工程化亚胺还原酶多肽的起始氨基酸序列,例如通过添加来自表3a-3m中的其他多肽的各种氨基酸差异的新组合以及本文所述的其它残基位置的后续轮次的进化。通过在进化的早期轮次中保持不变的残基位置处包括氨基酸差异可以产生进一步改进。因此,在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与seqidno:2的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和表3a-3m中提供的至少一种取代。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列相比包含至少两个残基差异的氨基酸序列。
如本领域技术人员将理解的,在一些实施方案中,选择的以上残基差异之一或其组合可以作为核心序列在工程化亚胺还原酶中保持恒定,并且在其它残基位置处的另外的残基差异可以被掺入到核心序列以产生具有改进性质的另外的工程化亚胺还原酶多肽。因此,应理解,对于含有以上残基差异的一个或子集的任何工程化亚胺还原酶,本发明预期了包含所述残基差异的一个或子集并且在本文公开的其他残基位置处另外包含一个或更多个残基差异的其它工程化亚胺还原酶。作为实例而非限制,在残基位置x9处包含残基差异的工程化亚胺还原酶还可以在其它残基位置处(例如x198等)掺入一个或更多个残基差异。
通常,本发明的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:2的节杆菌属菌株c1野生型冠瘿碱脱氢酶参考多肽,或相对于选自偶数序列标识符seqidno:4-1300的工程化多肽的具有亚胺还原酶活性的参考多肽而言增加的活性和/或增加的立体选择性将式(i)的化合物和式(ii)的化合物转化为式(iii)的胺产物化合物(如方案1所说明的)。在一些实施方案中,增加的活性和/或增加的立体选择性是关于表2中示出的式(i)的化合物和式(ii)的化合物的特定组合转化为表2中示出的相应的式(iii)的胺产物化合物而言的。
因此,在一些实施方案中,在合适的反应条件下,具有与选自偶数序列标识符seqidno:4-1300的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列和在选自本文提供的那些的残基位置处与seqidno:2相比的一个或更多个残基差异的本发明的具有亚胺还原酶活性的工程化多肽能够以相对于偶数序列标识符seqidno:4-1300的参考多肽增加的活性和/或增加的立体选择性进行以下转化反应的一个或更多个:
(a)将底物化合物(1a)和(2a)转化成产物化合物(3a);
(b)将底物化合物(1b)和(2b)转化成产物化合物(3b);
(c)将底物化合物(1c)和(2c)转化成产物化合物(3c);
(d)将底物化合物(1d)和(2d)转化成产物化合物(3d);
(e)将底物化合物(1d)和(2c)转化成产物化合物(3e);
(f)将底物化合物(1d)和(2c)转化成产物化合物(3f);和
(g)将底物化合物(1d)和(2c)转化成产物化合物(3g)。
在一些实施方案中,具有亚胺还原酶活性并且能够在合适的反应条件下以增加的活性和/或立体选择性催化以上转化反应(a)-(g)的一个或更多个的工程化多肽包括与偶数序列标识符seqidno:4-1300中的一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性的氨基酸序列和如表3a-3m中提供的存在于偶数序列标识符seqidno:4-1300中的任一个中的与seqidno:2相比的氨基酸残基差异。
在一些实施方案中,具有亚胺还原酶活性并且能够在合适的反应条件下以增加的活性和/或立体选择性催化以上转化反应(a)-(g)的一个或更多个的工程化多肽具有包含选自偶数序列标识符seqidno:4-1300的序列的氨基酸序列。本发明的工程化多肽由其衍生的seqidno:2的来自节杆菌属菌株c1的野生型冠瘿碱脱氢酶(cendh)在将化合物(1)的酮底物和化合物(2)的胺底物转化为仲胺产物化合物(3)中没有可检测的活性。然而,在一些实施方案中,具有亚胺还原酶活性的工程化多肽能够如本文所述地将本文提供的酮底物和胺底物转化为仲胺产物化合物。
此外,在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:4的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1a)的酮底物和化合物(2a)的胺底物转化为胺产物化合物(3a)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:6的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1b)的酮底物和化合物(2b)的胺底物转化为胺产物化合物(3b)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:8的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1c)的酮底物和化合物(2c)的胺底物转化为胺产物化合物(3c)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:8的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1d)的酮底物和化合物(2d)的胺底物转化为胺产物化合物(3d)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:8的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1d)的酮底物和化合物(2c)的胺底物转化为胺产物化合物(3e)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:8的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1d)的酮底物和化合物(2c)的胺底物转化为胺产物化合物(3f)。在一些实施方案中,本文公开的具有亚胺还原酶活性的工程化多肽能够以相对于seqidno:8的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更高的活性将化合物(1d)的酮底物和化合物(2c)的胺底物转化为胺产物化合物(3g)。
除了上文所指定的残基差异的位置之外,本文公开的任何工程化亚胺还原酶多肽还可以包含在表3a-3m中公开的氨基酸差异的那些以外的其它残基位置处的其它残基差异。这些其它残基位置处的残基差异可以提供氨基酸序列的另外的变化,而不会不利地影响多肽催化以上来自表2的转化反应(a)-(g)的一个或更多个的能力。因此,在一些实施方案中,除了存在于选自seqidno:4-1300的工程化亚胺还原酶多肽的任一个中的氨基酸残基差异之外,该序列还可以包含与seqidno:2、4、6和/或8相比在其他氨基酸残基位置处的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个或1-50个残基差异。在一些实施方案中,与参考序列相比的氨基酸残基差异的数量可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个残基位置。在一些实施方案中,与参考序列相比的氨基酸残基差异的数量可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个残基位置。在这些其他位置处的残基差异可以是保守变化或非保守变化。在一些实施方案中,与天然存在的seqidno:2的亚胺还原酶多肽或seqidno:4、6和/或8的工程化亚胺还原酶多肽相比,残基差异可以包括保守取代和非保守取代。
在一些实施方案中,本发明还提供了包含保持本文描述的任何工程化亚胺还原酶的功能活性和/或改进的特性的该工程化亚胺还原酶多肽的片段的工程化多肽。因此,在一些实施方案中,本发明提供了在合适的反应条件下能够催化以上表2的转化反应(a)-(g)的一个或更多个的多肽片段,其中该片段包含本发明的工程化亚胺还原酶多肽的全长氨基酸序列的至少约80%、85%、90%、95%、96%、97%、98%或99%,本发明的工程化亚胺还原酶多肽诸如选自偶数序列标识符seqidno:4-1300的示例性工程化亚胺还原酶多肽。
在一些实施方案中,工程化亚胺还原酶多肽可以具有包含本文所述的工程化亚胺还原酶多肽的任一个的缺失的氨基酸序列,本文所述的工程化亚胺还原酶多肽诸如偶数序列标识符seqidno:4-1300的示例性工程化多肽。因此,对于本发明的工程化亚胺还原酶多肽的每个和每一个实施方案,氨基酸序列可以包括1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多的氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达亚胺还原酶多肽的氨基酸总数的10%、多达氨基酸总数的10%、多达氨基酸总数的20%、或多达氨基酸总数的30%的缺失,其中本文描述的工程化亚胺还原酶的相关的功能活性和/或改进的性质被保持。在一些实施方案中,缺失可以包括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基。在一些实施方案中,缺失的数量可以为1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基的缺失。
在一些实施方案中,本文的工程化亚胺还原酶多肽可以具有与本文所述的工程化亚胺还原酶多肽(诸如偶数序列标识符seqidno:4-1300的示例性工程化多肽)的任一个相比包含插入的氨基酸序列。因此,对于本发明的亚胺还原酶多肽的每个和每一个实施方案,插入可以包含1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸或50个或更多个氨基酸,其中本文所述的工程化亚胺还原酶的相关功能活性和/或改进的性质被保持。插入可以是在亚胺还原酶多肽的氨基或羧基末端,或内部部分。
在一些实施方案中,本文的工程化亚胺还原酶多肽可以具有包含选自偶数序列标识符seqidno:4-1300的序列和任选地一个或数个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的氨基酸序列。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列的数量任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在以上实施方案中,工程化多肽的合适的反应条件可以是在表3a-3m和实施例中描述的那些htp测定条件。在表3a-3m和实施例中(除其他以外)给出了这些上述htp和sfp反应条件和亚胺还原酶多肽的使用指导。
在一些实施方案中,本发明的多肽可以是融合多肽的形式,其中工程化多肽与其它多肽融合,诸如例如但不限于抗体标签(例如myc表位)、纯化序列(例如用于结合金属的his标签)和细胞定位信号(例如分泌信号)。因此,本文所述的工程化多肽可以与其它多肽融合或不融合使用。
应当理解,本文所述的多肽不限于遗传编码氨基酸。除了遗传编码氨基酸之外,本文所述的多肽可以完整地或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的d-立体异构体;2,3-二氨基丙酸(dpr);α-氨基异丁酸(aib);ε-氨基己酸(aha);δ-氨基戊酸(ava);n-甲基甘氨酸或肌氨酸(megly或sar);鸟氨酸(orn);瓜氨酸(cit);叔丁基丙氨酸(bua);叔丁基甘氨酸(bug);n-甲基异亮氨酸(meile);苯基甘氨酸(phg);环己基丙氨酸(cha);正亮氨酸(nle);萘基丙氨酸(nal);2-氯苯丙氨酸(ocf);3-氯苯丙氨酸(mcf);4-氯苯丙氨酸(pcf);2-氟苯丙氨酸(off);3-氟苯丙氨酸(mff);4-氟苯丙氨酸(pff);2-溴苯丙氨酸(obf);3-溴苯丙氨酸(mbf);4-溴苯丙氨酸(pbf);2-甲基苯丙氨酸(omf);3-甲基苯丙氨酸(mmf);4-甲基苯丙氨酸(pmf);2-硝基苯丙氨酸(onf);3-硝基苯丙氨酸(mnf);4-硝基苯丙氨酸(pnf);2-氰基苯丙氨酸(ocf);3-氰基苯丙氨酸(mcf);4-氰基苯丙氨酸(pcf);2-三氟甲基苯丙氨酸(otf);3-三氟甲基苯丙氨酸(mtf);4-三氟甲基苯丙氨酸(ptf);4-氨基苯丙氨酸(paf);4-碘代苯丙氨酸(pif);4-氨基甲基苯丙氨酸(pamf);2,4-二氯苯丙氨酸(opef);3,4-二氯苯丙氨酸(mpcf);2,4-二氟苯丙氨酸(opff);3,4-二氟苯丙氨酸(mpff);吡啶-2-基丙氨酸(2pala);吡啶-3-基丙氨酸(3pala);吡啶-4-基丙氨酸(4pala);萘-1-基丙氨酸(1nala);萘-2-基丙氨酸(2nala);噻唑基丙氨酸(taala);苯并噻吩基丙氨酸(bala);噻吩基丙氨酸(tala);呋喃基丙氨酸(fala);高苯丙氨酸(hphe);高酪氨酸(htyr);高色氨酸(htrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(styrylkalanine)(sala);蒽基丙氨酸(aala);3,3-二苯基丙氨酸(dfa);3-氨基-5-苯基戊酸(afp);青霉胺(pen);1,2,3,4-四氢异喹啉-3-羧酸(tic);β-2-噻吩基丙氨酸(thi);甲硫氨酸亚砜(mso);n(w)-硝基精氨酸(narg);高赖氨酸(hlys);膦酰基甲基苯丙氨酸(pmphe);磷酸丝氨酸(pser);磷酸苏氨酸(pthr);高天冬氨酸(hasp);高谷氨酸(hglu);1-氨基环戊-(2或3)-烯-4-羧酸;哌啶酸(pa);氮杂环丁烷-3-羧酸(aca);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aoly);炔丙基甘氨酸(pggly);高丙氨酸(hala);正缬氨酸(nval);高亮氨酸(hleu)、高缬氨酸(hval);高异亮氨酸(hile);高精氨酸(harg);n-乙酰基亮氨酸(aclys);2,4-二氨基丁酸(dbu);2,3-二氨基丁酸(dab);n-甲基缬氨酸(meval);高半胱氨酸(hcys);高丝氨酸(hser);羟基脯氨酸(hyp)和高脯氨酸(hpro)。本文描述的多肽可以包含的另外的非编码氨基酸对于本领域技术人员而言将是明显的(参见例如fasman,1989,crcpracticalhandbookofbiochemistryandmolecularbiology,crcpress,bocaraton,fl,第3-70页以及其中引用的参考文献中提供的各种氨基酸,其全部通过引用并入)。这些氨基酸可以是l-构型或d-构型的。
本领域技术人员将认识到,具有侧链保护基团的氨基酸或残基还可以构成本文所述的多肽。此类受保护的氨基酸的非限制性实例,其在此情况下属于芳香族类,包括但不限于(保护基团列于括号中):arg(tos)、cys(甲基苄基)、cys(硝基吡啶亚磺酰基)、glu(δ-苄基酯)、gln(呫吨基)、asn(n-δ-呫吨基)、his(bom)、his(苄基)、his(tos)、lys(fmoc)、lys(tos)、ser(o-苄基)、thr(o-苄基)和tyr(o-苄基)。
可以构成本文所述多肽的构象约束的非编码氨基酸包括但不限于n-甲基氨基酸(l构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(pipecolicacid);氮杂环丁烷-3-羧酸;高脯氨酸(hpro)和1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽可以呈各种形式,例如诸如分离的制品、作为基本上纯化的酶、用编码该酶的基因转化的完整细胞和/或作为此类细胞的细胞提取物和/或裂解物。酶可以被冻干、喷雾干燥、沉淀或呈粗制糊状物的形式,如以下进一步讨论的。
在一些实施方案中,工程化多肽可以提供于固体支持物诸如膜、树脂、固体载体或其它固相材料上。固体支持物可以由有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物组成。固体支持物还可以是无机的,诸如玻璃、二氧化硅(silica)、可控孔隙玻璃(cpg)、反相二氧化硅或金属诸如金或铂。固体支持物的形状可以呈珠、球、颗粒(particle)、颗粒(granule)、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特性。固体支持物可以被配置为孔、凹陷或其他容器(container)、容器(vessel)、特征或位置的形式。
在一些实施方案中,本发明的具有亚胺还原酶活性的工程化多肽可以被固定在固体支持物上,使得它们相对于seqidno:4、6和/或8的参考工程化多肽保持其增强的活性、立体选择性和/或其它改善的性质。在此类实施方案中,固定的多肽可以促进式(i)和式(ii)的酮和胺底物化合物向式(iii)的胺产物化合物的生物催化转化(例如表2的转化反应(a)-(g)),并且反应完成后容易保留(例如通过保留固定有多肽的珠子)并然后在随后的反应中重新使用或再循环。此类固定化酶方法允许进一步提高效率和降低成本。因此,还预期,使用本发明的亚胺还原酶多肽的任何方法可以使用结合或固定在固体支持物上的相同的亚胺还原酶多肽进行。
酶固定化的方法是本领域公知的。工程化多肽可以被非共价地或共价地结合。用于将酶缀合和固定到固体支持物(例如树脂、膜、珠、玻璃等)的各种方法是本领域公知的(参见例如yi等人,proc.biochem.,42:895-898[2007];martin等人,appl.micro.andbiotech.,76:843-851[2007];koszelewski等人,j.mol.cat.b:enzy.,63:39-44[2010];truppo等人,org.proc.res.dev.,在线出版:dx.doi.org/10.1021/op200157c;hermanson,bioconjugatetechniques,第二版,academicpress[2008];mateo等人,biotech.prog.,18:629-34[2002];和c.m.niemeyer[编辑],bioconjugationprotocols:strategiesandmethods,inmethodsinmolecularbiology,.,humanapress[2004],其各自通过引用并入本文)。用于固定本发明的工程化亚胺还原酶的固体支持物包括但不限于包含具有环氧化物官能团的聚甲基丙烯酸酯、具有氨基环氧化物官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/dvb共聚物或聚甲基丙烯酸酯的珠或树脂。可用于固定本发明的工程化亚胺还原酶多肽的示例性固体支持物包括但不限于壳聚糖珠、eupergitc和sepabead(mitsubishi),包括以下不同类型的sepabead:ec-ep、ec-hfa/s、exa252、exe119和exe120。
在一些实施方案中,本文所述的多肽可以以试剂盒的形式提供。试剂盒中的酶可以单独存在或作为多种酶存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评估酶的活性的底物以及用于检测产物的试剂。试剂盒还可以包括试剂分配器和试剂盒的使用说明。
在一些实施方案中,本发明的试剂盒包括在不同可寻址位置上包含多个不同亚胺还原酶多肽的阵列,其中不同多肽是各自具有至少一种不同的改良的酶性质的参考序列的不同变体。在一些实施方案中,固定在固体支持物上的多个多肽可以被配置在阵列的多个位置上,可用试剂的自动递送或通过检测方法和/或仪器寻址。阵列可被用于测试各种底物化合物被多肽的转化。包含多种工程化多肽的此类阵列及其使用方法是本领域已知的(参见例如wo2009/008908a2)。
6.4编码工程化亚胺还原酶的多核苷酸、表达载体和宿主细胞
另一方面,本发明提供了编码本文所述的工程化亚胺还原酶多肽的多核苷酸。多核苷酸可以可操作地连接到控制基因表达的一个或更多个异源调控序列,以产生能够表达该多肽的重组多核苷酸。包含编码工程化亚胺还原酶的异源多核苷酸的表达构建体可以被导入到适当的宿主细胞以表达相应的亚胺还原酶多肽。
如对于本领域技术人员将是明显的,蛋白序列的可用性和对应于各种氨基酸的密码子的知识提供了能够编码本发明的多肽的所有多核苷酸的描述。遗传密码的简并性——其中相同的氨基酸由可选择的密码子或同义密码子编码——允许制备极大量的核酸,所有这些核酸都编码改进的亚胺还原酶。因此,具有特定氨基酸序列的知识,本领域技术人员可以通过简单地以不改变蛋白的氨基酸序列的方式修饰序列的一个或更多个密码子来制备任何数量的不同核酸。在此方面,本发明具体预期了通过选择基于可能的密码子选择的组合可以产生的、编码本文描述的多肽的每个和每一个可能的多核苷酸变化,并且所有此类变化将被认为对于本文描述的多肽具体的公开,包括表3a-3m中呈现的和在通过引用并入本文的序列表中作为偶数序列标识符seqidno:4-1300公开的氨基酸序列。
在各种实施方案中,优选地选择密码子来匹配在其中产生该蛋白的宿主细胞。例如,在细菌中使用的优选的密码子被用于在细菌中表达基因;在酵母中使用的优选的密码子被用于酵母中的表达;并且在哺乳动物中使用的优选的密码子被用于在哺乳动物细胞中表达。在一些实施方案中,所有密码子不需要被替换以优化亚胺还原酶的密码子使用,因为天然序列将包含优选的密码子并且因为可不需要对所有氨基酸残基使用优选的密码子。因此,编码亚胺还原酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选密码子。
在一些实施方案中,多核苷酸包含编码seqidno:2的天然存在的亚胺还原酶多肽的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包含与seqidno:1的密码子优化的核酸序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的核酸序列。seqidno:1的密码子优化序列增强编码的、天然存在的亚胺还原酶的表达。
在一些实施方案中,多核苷酸能够在高度严格条件下与seqidno:1的参考序列或其互补物杂交,并编码具有亚胺还原酶活性的多肽。
在一些实施方案中,如上所述,多核苷酸编码与seqidno:2、4、6和/或8相比具有改进的性质的具有亚胺还原酶活性的工程化多肽,其中该多肽包含与选自偶数序列标识符seqidno:4-1300的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列。
在一些实施方案中,如上所述,多核苷酸编码与seqidno:2、4、6和/或8相比具有改进的性质的具有亚胺还原酶活性的工程化多肽,其中该多肽包含与选自偶数序列标识符seqidno:4-1300的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列。
在一些实施方案中,多核苷酸编码能够以与seqidno:4、12和/或30相比改进的性质将底物化合物(1a)和(2a)转化为产物化合物(3a)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列并且在选自以下的残基位置具有与seqidno:4相比的一个或更多个残基差异:x198、x153、x167、x265、x262、x108、x234、x284、x282、x220、x272、x256、x267、x242、x281、x197、x277、x224和x143。
在一些实施方案中,多核苷酸编码能够以与seqidno:6、126和/或173相比改进的性质将底物化合物(1b)和(2b)转化为产物化合物(3b)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:6具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和至少与seqidno:6相比选自以下的残基差异的组合:x283、x262、x9、x259、x220、x267、x153、x279、x200、x224、x256、x137、x143、x260、x261、x154、x276和x185。
在一些实施方案中,多核苷酸编码能够以与seqidno:8相比改进的性质将底物化合物(1c)和(2c)转化为产物化合物(3c)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和与seqidno:8相比如表3g中示出的残基差异组合。
在一些实施方案中,多核苷酸编码能够以与seqidno:8相比改进的性质将底物化合物(1d)和(2d)转化为产物化合物(3d)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和与seqidno:8相比如表3g中示出的残基差异组合。
在一些实施方案中,多核苷酸编码能够以与seqidno:8相比改进的性质将底物化合物(1d)和(2c)转化为产物化合物(3e)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和与seqidno:8相比如表3g中示出的残基差异组合。
在一些实施方案中,多核苷酸编码能够以与seqidno:360和/或550相比改进的性质将底物化合物(1d)和(2c)转化为产物化合物(3f)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和与seqidno:8相比如表3h和3i中示出的残基差异组合。
在一些实施方案中,多核苷酸编码能够以与seqidno:360和/或550相比改进的性质将底物化合物(1d)和(2c)转化为产物化合物(3g)的亚胺还原酶多肽,其中该多肽包含与参考序列seqidno:8具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列和与seqidno:8相比至少选自以下的残基差异的组合:x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x168、x173、x177、x178、x184、x185、x195、x197、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218、x220、x221、x223、x226、x234、x239、x242、x245、x251、x253、x256、x257、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x273、x274、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349。
在一些实施方案中,多核苷酸编码能够以与seqidno:2、4、6、8、12、30、126、173、360和/或550相比改进的性质将底物化合物(1)和(2)转化为产物化合物(3)的工程化亚胺还原酶多肽,其中该多肽包含与选自偶数序列标识符seqidno:4-1300的任一个的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列,条件是该氨基酸序列包含与seqidno:2相比的、包含于偶数序列标识符seqidno:4-1300的多肽序列的任一个的如表3a-3m中列出的任一组残基差异。
在一些实施方案中,编码工程化亚胺还原酶的多核苷酸包含选自奇数序列标识符seqidno:4-1300的多核苷酸序列。
在一些实施方案中,多核苷酸能够在高严格性条件下与选自奇数序列标识符seqidno:3-1299的参考多核苷酸序列或其互补物杂交,并且编码本文所述的具有一种或更多种改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码具有与seqidno:2、4、6和/或8相比在选自以下的残基位置处包含一个或更多个残基差异的氨基酸序列的亚胺还原酶多肽:x9、x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x167、x168、x173、x177、x178、x184、x185、x195、x197、x198、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218,x220、x221、x223、x224、x226、x234、x239、x242、x245、x251、x253、x256、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x272、x273、x274、x276、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349。
在一些实施方案中,在这些残基位置处的具体残基差异选自:相对于seqidno:4的s284q/l/h/c、l277a、e272d、s262v、e256v/s/a、i242c、a234c、h220q、e198d、y153g/q/n/r/e、a167t、q265t、n108c、g282l、p267a、i197m、q265v、r281n/p/l、e224d和r143k;或相对于seqidno:6的v9g、n137d、r143k、y153l/m、f154v、a185t、v200s、h220e、e224h、e256c/w、v259i、v259m、k260r、i261r、s262f/n、p267i/n/s/t/y、g276s、v279a/h/l/n/y和v283e/t/w;或相对于seqidno:8的m12l、l31m、a37p、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、a93g、y98w/c、n108s、n137d、m138l、w141v/t/s、c142a、r143w/l、y153f/e/g/a、f154v/m/l、i155m/s、t156m/q/g/e/a、q159l/m/i/e、a166i、k168m、l173m、g177t/a、s178e、q184l、a185l/g、t195s/r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、h220d、y221w/m/l/i、t223s、i226y、c234m/a、a239q、i242c/v、a245g、n251e、p253d、a256s/l/e/n/k/g、e257s、v259m/l、n260d/k、h261i/e/d、v262s、c263q/e/t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279f/r/e、l280p/e、r281a/s、g282t、v283y/w/t、s284p/m/h/i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、f294a、i330v和l349p。
在一些实施方案中,残基差异选自相对于seqidno:4的e198d、y153g/q/n/r、a167t、q265t/v、n108c、g282l、p267a、i197m、r281n/p/l、e224d和r143k;或相对于seqidno:6的v9g、n137d、r143k、y153l/m、a185t、h220e、e224h、e256w/c、v259m/i、k260r、s262n、p267y/t、g276s、v279a/h/n、v283t/w/e;或相对于seqidno:8的m12l、l31m、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、y98w/c、n137d、w141v/t/s、y153g/a、i155s、t156q/g/e/a、q159m/i/e、a166i、k168m、l173m、g177t/a、q184l、a185l/g、t195r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、y221w/m/l/i、i226y、c234m/a、a239q、i242v、a245g、n251e、p253d、a256n/k/g、e257s、v259m/l、n260k、h261d、v262s、c263t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279r/e、l280p/e、r281s、g282t、v283y/w/t、s284i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、i330v和l349p。
在一些实施方案中,多核苷酸编码本文所述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有约80%或更高的序列同一性、约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施方案中,参考多核苷酸序列选自奇数序列标识符seqidno:3-1299。
编码改进的亚胺还原酶多肽的分离的多核苷酸可以以多种方式被操作以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸可以作为表达载体提供,其中存在一个或更多个控制序列以调控多核苷酸和/或多肽的表达。取决于表达载体,分离的多核苷酸在其插入载体之前的操作可能是期望的或需要的。利用重组dna法修饰多核苷酸和核酸序列的技术是本领域公知的。
在一些实施方案中,除其他之外,控制序列包括启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。可以基于所使用的宿主细胞选择合适的启动子。对于细菌宿主细胞,用于指导本发明的核酸构建体的转录的合适的启动子包括从大肠杆菌lac操纵子、天蓝色链霉菌(streptomycescoelicolor)琼脂水解酶基因(daga)、枯草芽孢杆菌(bacillussubtilis)果聚糖蔗糖转移酶基因(sacb)、地衣芽孢杆菌(bacilluslicheniformis)α-淀粉酶基因(amyl)、嗜热脂肪杆菌(bacillusstearothermophilus)麦芽糖淀粉酶基因(amym)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌青霉素酶基因(penp)、枯草芽孢杆菌xyla和xylb基因和原核生物β-内酰胺酶获得的启动子(villa-kamaroff等人,proc.natl.acad.sci.usa75:3727-3731[1978])以及tac启动子(deboer等人,proc.natl.acad.sci.usa80:21-25[1983])。用于丝状真菌宿主细胞的示例性的启动子包括从米曲霉(aspergillusoryzae)taka淀粉酶、米黑根毛霉(rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉(aspergillusniger)中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉(aspergillusawamori)葡糖淀粉酶(glaa)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(aspergillusnidulans)乙酰胺酶和尖孢镰孢菌(fusariumoxysporum)胰蛋白酶样蛋白酶(参见例如wo96/00787)的基因获得的启动子,以及na2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)以及其突变体、截短的和杂合的启动子。示例性的酵母细胞启动子可以来自酿酒酵母(saccharomycescerevisiae)烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)和酿酒酵母3-磷酸甘油酸激酶的基因。用于酵母宿主细胞的其它有用的启动子是本领域已知的(参见例如romanos等人,yeast8:423-488[1992])。
控制序列还可以是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接到编码多肽的核酸序列的3’末端。在本发明中可以使用在所选择的宿主细胞中起作用的任何终止子。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰孢菌胰蛋白酶样蛋白酶的基因获得。用于酵母宿主细胞的示例性终止子可以从酿酒酵母烯醇化酶、酿酒酵母细胞色素c(cyc1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得。用于酵母宿主细胞的其它有用的终止子也是本领域已知的(参见例如romanos等人,同上)。
控制序列还可以是合适的前导序列,前导序列是对宿主细胞的翻译重要的mrna的非翻译区。前导序列可操作地连接到编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中起作用的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从米曲霉taka淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。用于酵母宿主细胞的合适的前导序列从酿酒酵母烯醇化酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)的基因获得。
控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是可操作地连接到核酸序列的3’末端的序列,并且在转录时被宿主细胞识别为向转录的mrna添加聚腺苷酸残基的信号。在本发明中可以使用在所选择的宿主细胞中有功能的任何多聚腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列可以来自米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因。用于酵母宿主细胞的有用的多腺苷酸化序列是本领域已知的(参见例如guo和sherman,mol.cell.biol.,15:5983-5990[1995])。
控制序列还可以是信号肽编码区域,其编码与多肽的氨基末端连接并指导所编码的多肽进入细胞的分泌途径的氨基酸序列。核酸序列的编码序列的5’末端可以固有地含有信号肽编码区,所述信号肽编码区在翻译阅读框中与编码分泌多肽的编码区的片段天然地连接。可选择地,编码序列的5’末端可以含有对于编码序列是外来的信号肽编码区。在本发明中可以使用指导所表达的多肽进入所选择的宿主细胞的分泌途径的任何信号肽编码区。用于细菌宿主细胞的有效信号肽编码区是从芽孢杆菌nclb11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt、nprs、nprm)和枯草芽孢杆菌prsa的基因获得的信号肽编码区。另外的信号肽是本领域已知的(参见例如simonen和palva,microbiol.rev.,57:109-137[1993])。用于丝状真菌宿主细胞的有效的信号肽编码区可以是从米曲霉taka淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、黑曲霉天冬氨酸蛋白酶、特异腐质霉(humicolainsolens)纤维素酶和humicolalanuginosa脂肪酶的基因获得的信号肽编码区。用于酵母宿主细胞的有用的信号肽可以来自酿酒酵母α因子和酿酒酵母转化酶的基因。其它有用的信号肽编码区是本领域已知的(参见例如romanos等人,同上)。
控制序列还可以是编码位于多肽的氨基末端的氨基酸序列的前肽编码区。所得多肽被称为酶原(proenzyme)或多肽原(在某些情况下称为酶原(zymogen))。通过前肽从多肽原的催化裂解或自身催化裂解,多肽原可以转化成成熟的活性多肽。前肽编码区可以从枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(myceliophthorathermophila)乳糖酶的基因获得(参见例如wo95/33836)。当信号肽和前肽区都存在于多肽的氨基末端时,前肽区定位于多肽的氨基末端旁,而信号肽区定位于前肽区的氨基末端旁。
还可需要添加允许相对于宿主细胞生长调控多肽的表达的调控序列。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开放或关闭的那些。在原核宿主细胞中,合适的调控序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括例如adh2系统或gal1系统。在丝状真菌中,合适的调控序列包括takaα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明多肽的核酸序列可以与调控序列可操作地连接。
在另一方面,本发明还涉及包含编码工程化亚胺还原酶多肽的多核苷酸以及根据它们将被引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等的重组表达载体。上文描述的各种核酸和控制序列可以被连接在一起以产生重组表达载体,其可以包括一个或更多个方便的限制性位点,以允许在此类位点插入或取代编码多肽的核酸序列。可选择地,本发明的核酸序列可以通过将包含该序列的核酸序列或核酸构建体插入到用于表达的合适的载体来表达。在产生表达载体时,编码序列位于载体中,使得编码序列与适当的控制序列可操作地连接以进行表达。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地进行重组dna程序并且可以引起多核苷酸序列的表达。载体的选择通常将取决于载体与待向其中引入该载体的细胞的相容性。载体可以是线性的或闭合环状的质粒。
表达载体可以是自主复制载体(即,作为染色体外实体存在的载体),其复制独立于染色体复制(例如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自身复制的任何工具(means)。可选择地,载体可以是当被引入宿主细胞时被整合进基因组中和与其整合的染色体一起复制的载体。此外,可以使用单个载体或质粒,或一起包含待被引至宿主细胞的基因组的总dna两个或更多个载体或质粒,或可使用转座子。
本发明的表达载体优选地含有一个或更多个选择标记,其允许容易地选择转化的细胞。选择标记是其产物提供杀生物剂或病毒抗性、对重金属的抗性、营养缺陷型的原养型等的基因。细菌选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因或赋予抗生素抗性(诸如氨苄青霉素、卡那霉素、氯霉素(实施例1)或四环素抗性)的标记。用于酵母宿主细胞的合适的标记包括但不限于ade2、his3、leu2、lys2、met3、trp1和ura3。用于在丝状真菌宿主细胞中使用的选择标记包括但不限于amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸盐还原酶)、pyrg(乳清苷-5'-磷酸脱羧酶)、sc(硫酸腺苷酸转移酶)和trpc(邻氨基苯甲酸合酶)及其等同物。用于在曲霉细胞中使用的实施方案包括构巢曲霉或米曲霉的amds和pyrg基因以及吸水链霉菌(streptomyceshygroscopicus)的bar基因。
另一方面,本发明提供了包含编码本发明的改进的亚胺还原酶多肽的多核苷酸的宿主细胞,所述多核苷酸可操作地连接到用于在宿主细胞中表达亚胺还原酶的一个或更多个控制序列。用于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域公知的,并且包括但不限于细菌细胞诸如大肠杆菌、枯草芽孢杆菌、链霉菌和鼠伤寒沙门氏菌细胞;真菌细胞诸如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(atcc登录号201178));昆虫细胞诸如果蝇s2和灰翅夜蛾属(spodoptera)sf9细胞;动物细胞诸如cho、cos、bhk、293和bowes黑素瘤细胞;和植物细胞。示例性的宿主细胞是大肠杆菌w3110(δfhua)和bl21。
用于上述宿主细胞的适当的培养基和生长条件是本领域公知的。用于表达亚胺还原酶的多核苷酸可以通过本领域已知的各种方法引入细胞。技术包括电穿孔、生物弹射粒子轰击(biolisticparticlebombardment)、脂质体介导的转染、氯化钙转染和原生质体融合,除其他以外。
在一些实施方案中,多肽可以在无细胞表达系统中表达(参见例如kudlicki等人cellfreeexpression,第1版,landesbiosciences[2007];和spirin等人(编辑),cellfreeproteinsynthesis:methodsandprotocols,第1版,wiley-vch[2007],其全部通过引用并入本文)。
在本文的实施方案中,可以使用本领域技术人员使用的方法获得改进的多肽和相应的多核苷酸。本文所述的工程化亚胺还原酶可以通过使编码天然存在的编码野生型冠瘿碱脱氢酶cendh或其他工程化亚胺还原酶的基因的多核苷酸(seqidno:2)进行诱变和/或定向进化方法获得,如上所述。
例如,诱变和定向进化方法可以容易地应用于多核苷酸以产生可被表达、筛选和测定的变体文库。诱变和定向进化方法是本领域公知的(参见例如美国专利第5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,489,146、6,506,602、6,506,603、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,613,514、6,653,072、6,716,631、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,288,375、7,421,347、7,430,477、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,873,499、7,904,249、7,957,912、8,383,346、8,504,498、8,849,575、8,876,066、8,768,871号,以及所有相关的非美国的对应申请;ling等人,anal.biochem.,254(2):157-78[1997];dale等人,meth.mol.biol.,57:369-74[1996];smith,ann.rev.genet.,19:423-462[1985];botstein等人,science,229:1193-1201[1985];carter,biochem.j.,237:1-7[1986];kramer等人,cell,38:879-887[1984];wells等人,gene,34:315-323[1985];minshull等人,curr.op.chem.biol.,3:284-290[1999];christians等人,nat.biotechnol.,17:259-264[1999];crameri等人,nature,391:288-291[1998];crameri,等人,nat.biotechnol.,15:436-438[1997];zhang等人,proc.nat.acad.sci.u.s.a.,94:4504-4509[1997];crameri等人,nat.biotechnol.,14:315-319[1996];stemmer,nature,370:389-391[1994];stemmer,proc.nat.acad.sci.usa,91:10747-10751[1994];美国专利申请公布第2008/0220990、us2009/0312196、us2014/0005057、us2014/0214391、us2014/0221216;us2015/0050658、us2015/0133307、us2015/0134315号和所有相关的非美国的对应申请;wo95/22625、wo97/0078、wo97/35966、wo98/27230、wo00/42651、wo01/75767和wo2009/152336;其全部通过引用并入本文)。可使用的其他定向进化程序包括但不限于可以使用的,除其他以外,包括交错延伸过程(step)、体外重组(参见例如zhao等人,nat.biotechnol.,16:258-261[1998])、诱变pcr(参见例如caldwell等人,pcrmeth.appl.,3:s136-s140[1994])和盒式诱变(参见例如black等人,proc.natl.acad.sci.usa93:3525-3529[1996]),其全部通过引用并入本文。
可对在诱变处理后获得的克隆筛选具有一种或更多种期望的改进的酶性质的工程化亚胺还原酶。例如,如果所期望的改进的酶性质是增加将化合物(1b)的酮和化合物(2b)的胺转化为化合物(3b)的仲胺的活性,则可以测量产生化合物(3b)的酶活性。然后分离含有编码具有期望的特性(例如增加化合物(3b)的产量)的亚胺还原酶的多核苷酸的克隆、测序以鉴定核苷酸序列变化(如果有的话)并用于在宿主细胞中表达该酶。测量来自表达文库的酶活性可以使用诸如以下的标准生物化学技术进行:hplc分析,和/或产物的衍生(分离前或分离后),例如用丹磺酰氯或opa。
当已知工程化多肽的序列时,根据已知的合成方法可以通过标准固相方法制备编码该酶的多核苷酸。在一些实施方案中,多达约100个碱基的片段可以被单独地合成、然后被连接(例如通过酶促或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,编码亚胺还原酶的部分的多核苷酸和寡核苷酸可以通过使用经典的亚磷酰胺法的化学合成制备(参见例如beaucage等人,tetra.lett.,22:1859-69[1981])或替代方法(参见例如matthes等人,emboj.,3:801-05[1984]),因为它通常以自动合成方法实施。根据亚磷酰胺方法,寡核苷酸在例如自动dna合成仪中合成、纯化、退火、连接并克隆到适当的载体中。此外,可以从各种商业来源中的任何一个获得基本上任何核酸。在一些实施方案中,通过合成含有缺失、插入和/或取代的寡核苷酸并且以各种排列组合寡核苷酸可以创造另外的变化,以产生具有改进性质的工程化亚胺还原酶。
在一些实施方案中,本发明提供了用于制备工程化亚胺还原酶多肽的方法,其包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自偶数序列标识符seqidno:4-1300的氨基酸序列,并且与seqidno:4相比在选自以下的残基位置处具有一个或更多个残基差异:x198、x153、x167、x265、x262、x108、x234、x284、x282、x220、x272、x256、x267、x242、x281、x197、x277、x224和x143;和(b)表达由该多核苷酸编码的亚胺还原酶多肽。在该方法的一些实施方案中,相对于seqidno:4,残基差异选自e198、y153、a167、q265、s262、n108、a234、s284、g282、h220、e272、e256、p267、i242、r281、i197、l277、e224和r143。在该方法的一些实施方案中,相对于seqidno:4,残基差异选自s284q/l/h/c、l277a、e272d、s262v、e256v/s/a、i242c、a234c、h220q、e198d、y153g/q/n/r/e、a167t、q265t、n108c、g282l、p267a、i197m、q265v、r281n/p/l、e224d和r143k。在一些另外的实施方案中,相对于seqidno:4,残基差异选自x198、x167和x224。在一些另外的实施方案中,相对于seqidno:4,残基差异选自e198、a167和e224。在一些另外的实施方案中,相对于seqidno:4,残基差异选自e198d、y153g/q/n/r、a167t、q265t/v、n108c、g282l、p267a、i197m、r281n/p/l、e224d和r143k。
在一些实施方案中,本发明提供了用于制备工程化亚胺还原酶多肽的方法,其包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自偶数序列标识符seqidno:4-1300的氨基酸序列,并且与seqidno:6相比在选自以下的残基位置处具有一个或更多个残基差异:x283、x262、x9、x259、x220、x267、x153、x279、x200、x224、x256、x137、x143、x260、x261、x154、x276和x185;和(b)表达由该多核苷酸编码的亚胺还原酶多肽。在该方法的一些实施方案中,相对于seqidno:6,残基差异选自v283、s262、v9、v259、h220、p267、y153、v279、v200、e224、e256、n137、r143、k260、i261、f154、g276和a185。在该方法的一些实施方案中,相对于seqidno:6,残基差异选自v9g、n137d、r143k、y153l/m、f154v、a185t、v200s、h220e、e224h、e256c/w、v259i、v259m、k260r、i261r、s262f/n、p267i/n/s/t/y、g276s、v279a/h/l/n/y和v283e/t/w。在一些另外的实施方案中,相对于seqidno:6,残基差异选自x9和x224。在一些另外的实施方案中,相对于seqidno:6,残基差异选自v9和e224。在一些另外的实施方案中,相对于seqidno:6,残基差异选自v9g、n137d、r143k、y153l/m、a185t、h220e、e224h、e256w/c、v259m/i、k260r、s262n、p267y/t、g276s、v279a/h/n和v283t/w/e。
在一些实施方案中,本发明提供了用于制备工程化亚胺还原酶多肽的方法,其包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自偶数序列标识符seqidno:4-1300的氨基酸序列,并且与seqidno:8相比在选自以下的残基位置处具有一个或更多个残基差异:x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x168、x173、x177、x178、x184、x185、x195、x197、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218、x220、x221、x223、x226、x234、x239、x242、x245、x251、x253、x256、x257、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x273、x274、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349;和(b)表达由该多核苷酸编码的亚胺还原酶多肽。在该方法的一些实施方案中,相对于seqidno:8,残基差异选自m12、l31、a37、q44、r46、a48、g55、l56、v65、t82、a93、y98、n108、n137、m138、w141、c142、r143、y153、f154、i155、t156、q159、a166、k168、l173、g177、s178、q184、a185、t195、i197、a199、v200、i201、p203、p205、t206、a210、c213、s215、g216、p218、h220、y221、t223、i226、c234、a239、i242、a245、n251、p253、a256、e257、v259、n260、h261、v262、c263、q265、t266、p267、a268、t269、a273、m274、l277、p278、v279、l280、r281、g282、v283、s284、g285、l289、n290、t291、e292、h293、f294、i330和l349。在该方法的一些实施方案中,相对于seqidno:8,残基差异选自m12l、l31m、a37p、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、a93g、y98w/c、n108s、n137d、m138l、w141v/t/s、c142a、r143w/l、y153f/e/g/a、f154v/m/l、i155m/s、t156m/q/g/e/a、q159l/m/i/e、a166i、k168m、l173m、g177t/a、s178e、q184l、a185l/g、t195s/r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、h220d、y221w/m/l/i、t223s、i226y、c234m/a、a239q、i242c/v、a245g、n251e、p253d、a256s/l/e/n/k/g、e257s、v259m/l、n260d/k、h261i/e/d、v262s、c263q/e/t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279f/r/e、l280p/e、r281a/s、g282t、v283y/w/t、s284p/m/h/i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、f294a、i330v和l349p。在一些另外的实施方案中,相对于seqidno:8,残基差异选自x31、x44、x46、x48、x55、x56、x98、x166、x168、x173、x199、x203、x205、x206、x210、x213、x215、x216、x218、x239、x245、x251、x268、x269、x280、x285、x289、x290、x293、x330和x349。在又一些实施方案中,相对于seqidno:8,残基差异选自l31、q44、r46、a48、g55、l56、y98、a166、k168、l173、a199、p203、p205、t206、a210、c213、s215、g216、p218、a239、a245、n251、a268、t269、l280、g285、l289、n290、h293、i330和l349。在一些另外的实施方案中,相对于seqidno:8,残基差异选自m12l、l31m、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、y98w/c、n137d、w141v/t/s、y153g/a、i155s、t156q/g/e/a、q159m/i/e、a166i、k168m、l173m、g177t/a、q184l、a185l/g、t195r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、y221w/m/l/i、i226y、c234m/a、a239q、i242v、a245g、n251e、p253d、a256n/k/g、e257s、v259m/l、n260k、h261d、v262s、c263t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279r/e、l280p/e、r281s、g282t、v283y/w/t、s284i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、i330v和l349p。
在该方法的一些实施方案中,多核苷酸编码任选地具有一个或更多个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的工程化亚胺还原酶。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列的数量任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在另一方面,本发明提供了制备工程化亚胺还原酶多肽的方法,其中该方法可以包括在适于表达亚胺还原酶多肽的条件下培养能够表达编码该多肽的多核苷酸的宿主细胞。该方法还可以包括分离或纯化所表达的亚胺还原酶多肽,如本文所述的。
在一些实施方案中,用于制备或制造工程化亚胺还原酶多肽的方法还包括分离该多肽的步骤。如上所述,工程化多肽可以在适当的细胞中表达,并使用用于蛋白纯化的公知技术的任何一种或更多种从宿主细胞、培养基和/或表达培养基中分离(或回收),所述技术包括,除其他以外,溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法。用于裂解和从细菌诸如大肠杆菌中高效提取蛋白的合适的溶液是可商购的,诸如cellyticbtm(sigma-aldrich,st.louism)o。用于分离亚胺还原酶多肽的色谱技术包括,除其他以外,反相色谱高效液相色谱法、离子交换层析、凝胶电泳和亲和层析等。
在一些实施方案中,可以制备并以各种形式使用本发明的非天然存在的多肽,包括但不限于粗提取物(例如无细胞裂解物)、粉末(例如摇瓶粉末)、冻干物和基本上纯的制品(例如dsp粉末),如下文实施例中进一步说明的。
在一些实施方案中,可以制备并以纯化形式例如基本纯的形式使用工程化多肽。通常,纯化特定多肽的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等的因素,并且对于本领域技术人员将是明显的。为了促进纯化,预期在一些实施方案中,工程化多肽可以被表达为具有纯化标签(诸如对金属具有亲和力的his标签)或用于结合抗体的抗体标签(例如myc表位标签)的融合蛋白。
在一些实施方案中,亲和技术可以被用于分离改进的亚胺还原酶。对于亲和层析纯化,可以使用特异性结合亚胺还原酶多肽的任何抗体。为了产生抗体,可以通过注射亚胺还原酶多肽或其片段免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。亚胺还原酶多肽或片段可以通过侧链官能团或附接至侧链官能团的接头的方式附接到合适的载体诸如bsa上。在一些实施方案中,亲和纯化可以使用结合亚胺还原酶的特异配体诸如聚(l-脯氨酸)或染料亲和柱(参见例如ep0641862;和stellwagen,incurrentprotocolsinproteinscience,unit9.2-9.2.16[2001])。
6.5使用工程化亚胺还原酶的方法
另一方面,本文所述的具有亚胺还原酶活性的工程化多肽可以在用于将式(i)的化合物和式(ii)的化合物转化为式(iii)的仲胺或叔胺化合物的方法中使用,如上文所述和如方案1所说明的。通常,用于进行方案1的还原胺化反应的此类生物催化方法包括在适于形成式(iii)的胺产物化合物的反应条件下,在辅因子诸如nadh或nadph存在下使酮和胺底物化合物与本发明的具有亚胺还原酶活性的工程化多肽接触或温育。
在一些实施方案中,亚胺还原酶可以在用于制备式(iii)的仲胺或叔胺产物化合物的方法中使用,
其中,r1和r2基团独立地选自任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基;并且任选地r1和r2连接以形成3元至10元环;r3和r4基团独立地选自氢原子和任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基,条件是r3和r4不同时是氢;并且任选地r3和r4连接以形成3元至10元环;并且任选地,由*标示的碳原子和/或氮是手性的。该方法包括在合适的反应条件下,在辅因子的存在下,使式(i)的酮化合物和式(ii)的胺化合物与具有亚胺还原酶活性的工程化多肽接触,
其中r1和r2如上文所定义;
其中r3和r4如上文所定义。
如表2和表3a-3m中的反应所说明的,在用于制备式(iii)的化合物的方法中,本发明的具有亚胺还原酶活性的工程化多肽对宽范围的式(ii)的胺底物化合物具有活性,或可以被进一步工程化以具有活性。因此,在用于制备式(iii)的仲胺或叔胺产物化合物的上述生物催化方法的一些实施方案中,式(ii)的化合物可以是伯胺,其中r3和r4中的至少一个是氢,由此,式(iii)的产物是仲胺化合物。在该方法的一些实施方案中,r3或r4都不是氢并且式(ii)的化合物是仲胺,由此式(iii)的化合物是叔胺。在该方法的一些实施方案中,式(ii)的化合物是仲胺并且r3或r4不同,由此,式(iii)的胺化合物的由*标示的氮原子是手性的。此外,在一些实施方案中,式(iii)的手性胺化合物的一种立体异构体立体选择性地形成,并且任选地高度立体选择性地形成(例如以至少约85%的立体异构过量)。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(ii)的化合物的r3和r4基团连接以形成3元至10元环。在一些实施方案中,环是5元至8元的并且是任选地被取代的环烷基、芳基、芳基烷基、杂环烷基、杂芳基或杂芳基烷基环。
在用于制备式(iii)的胺产物化合物的生物催化方法的一些实施方案中,式(ii)的化合物是伯胺,其中r3基团是氢,且r4选自任选地被取代的(c1-c6)烷基、(c1-c6)烯基、(c1-c6)炔基、(c1-c6)羧基烷基、(c1-c6)氨基烷基、(c1-c6)卤代烷基和(c1-c6)烷硫基烷基。在一些实施方案中,r4基团选自任选地被取代的(c1-c6)烷基、(c1-c6)羧基烷基和(c1-c6)氨基烷基。在一些实施方案中,r4基团是任选地被取代的(c1-c6)烷基或(c1-c6)羧基烷基。在一些实施方案中,式(ii)的化合物选自甲胺、二甲胺、异丙胺、丁胺和异丁胺。在一些实施方案中,胺底物化合物r3基团是氢,并且r4选自任选地被取代的(c4-c8)环烷基、(c4-c8)杂环烷基、(c4-c8)芳基、(c4-c8)芳基烷基、(c4-c8)杂芳基和(c4-c8)杂芳基烷基。在一些实施方案中,胺底物化合物r3基团是氢,并且r4选自任选地被取代的(c4-c8)芳基、(c4-c8)芳基烷基、(c4-c8)杂芳基和(c4-c8)杂芳基烷基。在一些实施方案中,胺底物化合物r3基团是氢,并且r4是任选地被取代的(c4-c8)芳基。在某些实施方案中,式(ii)的化合物是任选地被取代的苯胺。
如表2和表3a-3m中的反应所说明的,在用于制备式(iii)的化合物的方法中,本发明的具有亚胺还原酶活性的工程化多肽对宽范围的式(i)的酮底物化合物具有活性,或可以被进一步工程化以具有活性。在一些实施方案中,化合物(i)的酮底物的r1和r2基团不同,由此,式(iii)的胺化合物的由*标示的碳原子是手性的。此外,在该方法的一些实施方案中,式(iii)的手性胺化合物的一种立体异构体立体选择性地形成,并任选地高度立体选择性地形成(例如以至少约85%的立体异构体过量)。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(i)的化合物的r1和r2基团连接以形成3元至10元环。在一些实施方案中,环是任选地被取代的环烷基、芳基、芳基烷基、杂环烷基、杂芳基或杂芳基烷基环。在该方法的一些实施方案中,式(i)的化合物选自任选地被取代的环丁酮、环戊酮、环己酮和环庚酮。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(i)的化合物的r1和r2基团独立地选自任选地被取代的(c1-c6)烷基、(c1-c6)烯基、(c1-c6)炔基、(c1-c6)羧基烷基、(c1-c6)氨基烷基、(c1-c6)卤代烷基和(c1-c6)烷硫基烷基。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(i)的化合物的r1基团选自任选地被取代的(c1-c6)烷基、(c1-c6)烯基、(c1-c6)炔基、(c1-c6)羧基烷基、(c1-c6)氨基烷基、(c1-c6)卤代烷基和(c1-c6)烷硫基烷基;并且式(i)的化合物的r2基团选自任选地被取代的(c4-c8)环烷基、(c4-c8)杂环烷基、(c4-c8)芳基烷基、(c4-c8)杂芳基和(c4-c8)杂芳基烷基。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(i)的化合物的r1基团是羧基。在一些实施方案中,式(i)的化合物是2-酮酸,其选自丙酮酸、2-氧代-丙酸、2-氧代-丁酸、2-氧代-戊酸、2-氧代-己酸。
在用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(i)的化合物的r1基团是氢原子,且式(i)的化合物是醛。在此类实施方案中,式(i)的化合物的r1基团选自任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基。
如表2中的反应列出的式(i)、式(ii)和式(iii)的化合物所示,在上述用于制备式(iii)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(iii)的产物化合物包括选自由以下组成的组的化合物:化合物(3a)、化合物(3b)、化合物(3c)、化合物(3d)、化合物(3e)、化合物(3f)和化合物(3g)。在该方法的一些实施方案中,式(i)的化合物包括选自由以下组成的组的化合物:化合物(1a)、化合物(1b)、化合物(1c)和化合物(1d)。在该方法的一些实施方案中,式(ii)的化合物包括选自由以下组成的组的化合物:化合物(2a)、化合物(2b)和化合物(2c)。
还预期在一些实施方案中,由本发明的具有亚胺还原酶活性的工程化多肽催化的用于制备式(iii)的胺产物化合物的方法包括分子内反应,其中式(i)的化合物和式(ii)的化合物是相同的单个分子上的基团。因此,在一些实施方案中,式(i)的酮化合物的r1和r2中的至少一个与式(ii)的胺化合物的r3和r4中的至少一个连接,并且该方法包括使具有连接到式(ii)的胺基团的式(i)的酮基团的单个化合物与本发明的工程化多肽在合适的反应条件下接触。说明性的分子内反应包括但不限于以下表4中所示的方案2-5的反应,其中基团r1和r3如上文对于基团r1和r3所定义,且基团r5选自氢原子和任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基。
不囿于理论,认为在大多数情况下,方案1的生物催化反应包括形成中间体亚胺化合物(例如亚胺盐中间体),然后其由酶进一步还原为最终的式(iii)的仲胺或叔胺产物化合物。还预期在一些实施方案中,由本发明的具有亚胺还原酶活性的工程化多肽催化的用于制备式(iii)的胺产物化合物的方法包括将本发明的工程化亚胺还原酶多肽与式(i)的酮化合物和式(ii)的伯胺化合物接触,由此形成亚胺中间体,然后该亚胺中间体进行分子内不对称环化反应以产生环状仲羟胺或叔羟胺中间体,所述环状仲羟胺或叔羟胺中间体经历羟基消除以产生第二亚胺(或烯胺)中间体。然后此第二亚胺(烯胺)随后由本发明的工程化亚胺还原酶多肽原位还原以得到最终的环状胺产物。涉及通过羟胺中间体的不对称环化的说明性反应包括但不限于下表5中示出的方案6-9的反应,其中基团r1和r3如上文对于基团r1和r3所定义的,并且基团r5、r6和r7独立地选自氢原子和任选地被取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烷基、杂芳基和杂芳基烷基。
不囿于理论,认为具有亚胺还原酶活性(ired)的工程化多肽不仅介导亚胺和/或羟胺中间体的形成,如方案2-9的反应中示出的,而且还介导第二个反应箭头描绘的亚胺中间体向最终的式(iii)的胺产物化合物的转化。
通常,亚胺化合物不如胺化合物稳定并且容易受不期望的氧化反应的影响。然而,预期在本发明方法的一些实施方案中,亚胺化合物或可以互变异构以形成亚胺的烯胺化合物可以在不存在酶的情况下由式(i)的酮和式(ii)的胺化合物形成,并然后与本发明的工程化多肽接触以催化其最终转化为式(iii)的仲胺或叔胺产物化合物。例如,首先可以如方案6-9中所示地但在ired(即具有亚胺还原酶活性的工程化多肽)不存在的情况下,通过组合式(i)的酮和式(ii)的胺化合物形成亚胺或烯胺中间体化合物。然后,直接形成的或由烯胺化合物的互变异构形成的亚胺化合物可以与具有亚胺还原酶活性的工程化多肽接触,以催化向最终的式(iii)的胺产物化合物转化。在一些实施方案中,预期在进行与具有亚胺还原酶活性的工程化多肽接触的步骤之前可以分离亚胺或烯胺中间体化合物(如果适度稳定)。因此,预期在该方法的一些实施方案中,首先由式(i)和式(ii)的化合物或通过具有连接至胺基团的酮基团的化合物的分子内反应形成亚胺或烯胺化合物,然后将该亚胺或烯胺化合物与具有亚胺还原酶活性的工程化多肽接触以形成式(iii)的胺产物化合物。
在一些实施方案中,可以获得稳定的亚胺或烯胺化合物(即,不首先使式(i)的酮化合物和式(ii)的胺化合物反应),并将其直接用作ired的底物。预期在此类实施方案中,进行生物催化法,其中仅存在为稳定的亚胺或烯胺化合物的单一底物,并且该化合物与催化稳定的亚胺化合物的还原的本发明的具有亚胺还原酶活性的工程化多肽接触以形成式(iii)的次级化合物。在此类反应中,工程化多肽的立体选择性可以介导邻近式(iii)的化合物的胺基团的手性中心的形成。表6(下文)列出了稳定的亚胺化合物的三个实例,该亚胺化合物可以在使用本发明的工程化多肽的生物催化方法中经历手性还原,以产生用于合成药物索利非那星(solifenacin)和他达拉非(tadalafil),以及用于合成药物化合物右哌甲酯(dexmethylphenidate)的中间体化合物。
可选择地,还预期通过分离的亚胺或烯胺底物化合物的ired催化反应(如表6所示)产生的任何式(iii)的产物化合物也可以通过使用亚胺或烯胺底物化合物的开链版本作为底物的ired催化的分子内反应(如表4所示那些)产生。因此,表6的每种产物化合物也可以使用表7中示出的分子内底物和本发明的具有亚胺还原酶活性的工程化多肽制造。
存在许多包括仲胺或叔胺基团的活性药物成分化合物,其可以使用本发明的具有亚胺还原酶活性的工程化多肽和/或通过本发明的工程化多肽的进一步定向进化而产生的工程化多肽通过生物催化还原胺化生产。例如,表8列出了为已知的活性药物成分化合物或可用于合成活性药物成分化合物的中间体化合物的式(iii)的各种产物化合物,其可以使用本发明的具有亚胺还原酶活性的工程化多肽与相应的式(i)和/或式(ii)的底物化合物制造。
在用于制备式(iii)的仲胺或叔胺产物化合物的上述生物催化方法的一些实施方案中,具有亚胺还原酶活性的工程化多肽衍生自天然存在的冠瘿碱脱氢酶。在一些实施方案中,具有亚胺还原酶活性的工程化多肽是衍生自seqidno:2的来自节杆菌属菌株1c的冠瘿碱脱氢酶,如本文所公开的,并且由偶数序列标识符seqidno:4-1300的工程化亚胺还原酶多肽示例。
本文所述的任何工程化亚胺还原酶均可以在用于制备式(iii)的仲胺或叔胺化合物的上述生物催化方法中使用。作为实例而非限制,在一些实施方案中,该方法可以使用工程化亚胺还原酶多肽,其包含与选自偶数序列标识符seqidno:4-1300的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,包括与seqidno:2、4、6和/或8相比在选自以下的残基位置处包括一个或更多个(即至少1个、至少2个、至少3个等)残基差异的氨基酸序列的亚胺还原酶多肽:x9、x12、x31、x37、x44、x46、x48、x55、x56、x65、x82、x93、x98、x108、x137、x138、x141、x142、x143、x153、x154、x155、x156、x159、x166、x167、x168、x173、x177、x178、x184、x185、x195、x197、x198、x199、x200、x201、x203、x205、x206、x210、x213、x215、x216、x218,x220、x221、x223、x224、x226、x234、x239、x242、x245、x251、x253、x256、x259、x260、x261、x262、x263、x265、x266、x267、x268、x269、x272、x273、x274、x276、x277、x278、x279、x280、x281、x282、x283、x284、x285、x289、x290、x291、x292、x293、x294、x330和x349。
在一些实施方案中,在这些残基位置处的具体残基差异选自:相对于seqidno:4的s284q/l/h/c、l277a、e272d、s262v、e256v/s/a、i242c、a234c、h220q、e198d、y153g/q/n/r/e、a167t、q265t、n108c、g282l、p267a、i197m、q265v、r281n/p/l、e224d和r143k;或相对于seqidno:6的v9g、n137d、r143k、y153l/m、f154v、a185t、v200s、h220e、e224h、e256c/w、v259i、v259m、k260r、i261r、s262f/n、p267i/n/s/t/y、g276s、v279a/h/l/n/y和v283e/t/w;或相对于seqidno:8的m12l、l31m、a37p、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、a93g、y98w/c、n108s、n137d、m138l、w141v/t/s、c142a、r143w/l、y153f/e/g/a、f154v/m/l、i155m/s、t156m/q/g/e/a、q159l/m/i/e、a166i、k168m、l173m、g177t/a、s178e、q184l、a185l/g、t195s/r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、h220d、y221w/m/l/i、t223s、i226y、c234m/a、a239q、i242c/v、a245g、n251e、p253d、a256s/l/e/n/k/g、e257s、v259m/l、n260d/k、h261i/e/d、v262s、c263q/e/t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279f/r/e、l280p/e、r281a/s、g282t、v283y/w/t、s284p/m/h/i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、f294a、i330v和l349p。
在一些实施方案中,残基差异选自相对于seqidno:4的e198d、y153g/q/n/r、a167t、q265t/v、n108c、g282l、p267a、i197m、r281n/p/l、e224d和r143k;或相对于seqidno:6的v9g、n137d、r143k、y153l/m、a185t、h220e、e224h、e256w/c、v259m/i、k260r、s262n、p267y/t、g276s、v279a/h/n、v283t/w/e;或相对于seqidno:8的m12l、l31m、q44n、r46s/n、a48g、g55y/c、l56m、v65l/f、t82v、y98w/c、n137d、w141v/t/s、y153g/a、i155s、t156q/g/e/a、q159m/i/e、a166i、k168m、l173m、g177t/a、q184l、a185l/g、t195r、i197t/l、a199v、v200y、i201m/l/f/c/a、p203g、p205t/s/n/l/g/d/a、t206v/q/n/m/l/i/h/d、a210f、c213y/v/m/l/f、s215e、g216v/s/r、p218q、y221w/m/l/i、i226y、c234m/a、a239q、i242v、a245g、n251e、p253d、a256n/k/g、e257s、v259m/l、n260k、h261d、v262s、c263t、q265n、t266p/n、p267v/q/k、a268n/d、t269h、a273v/t/i、m274v、l277m、p278v、v279r/e、l280p/e、r281s、g282t、v283y/w/t、s284i、g285w、l289w/r、n290y/s/r、t291a、e292v、h293y/q/m/l/f、i330v和l349p。
在上述方法的一些实施方案中,可以使用本文公开的能够进行表2的转化反应(a)-(g)的示例性亚胺还原酶。这包括本文公开的工程化多肽,其包含选自偶数序列标识符seqidno:4-1300的氨基酸序列。关于工程化亚胺还原酶的选择和使用的指导在本文的描述例如表3a-3m和实施例中提供。
在本文的实施方案中并如实施例中说明的,可以在该方法中使用的各种合适的反应条件的范围包括但不限于底物载量、辅因子载量、多肽载量、ph、温度、缓冲液、溶剂体系、反应时间和/或多肽固定在固体支持物上的条件。用于使用本文所述的工程化亚胺还原酶多肽进行底物化合物向产物化合物的生物催化转化的另外合适的反应条件可以根据本文提供的指导通过常规实验容易地优化,其包括但不限于使工程化亚胺还原酶多肽和感兴趣的酮和胺底物在浓度、ph、温度和溶剂条件的实验反应条件下接触,并检测产物化合物。
通常,在本发明的方法中,合适的反应条件包括存在在由亚胺还原酶进行的还原反应中可以充当电子供体的辅因子分子。在一些实施方案中,辅因子选自(但不限于)nadp+(烟酰胺腺嘌呤二核苷酸磷酸)、nadph(还原形式的nadp+)、nad+(烟酰胺腺嘌呤二核苷酸)和nadh(还原形式的nad+)。通常,将还原形式的辅因子加到酶反应混合物中。因此,在一些实施方案中,所述方法在选自nadph和nadh的辅因子(这两种辅因子在本文中统称为“nad(p)h”)的存在下进行。在一些实施方案中,电子供体是nadph辅因子。在一些实施方案中,可以进行该方法,其中反应条件包括约0.03g/l至约1g/l、0.03g/l至约0.8g/l、约0.03g/l至约0.5g/l、约0.05g/l至约0.3g/l、约0.05g/l至约0.2g/l或约0.1g/l至约0.2g/l的nadh或nadph辅因子浓度。在一些实施方案中,该方法在约1g/l、约0.8g/l、约0.5g/l、约0.3g/l、约0.2g/l、约0.1g/l、约0.05g/l或约0.03g/l的nadh或nadph辅因子浓度下进行。
在该方法的一些实施方案中,任选的辅因子再循环系统(也被称为辅因子再生系统)可以被用于从酶促反应中产生的nadp+/nad+再生辅因子nadph/nadh。辅因子再生系统指参与还原辅因子的氧化形式的反应(例如nadp+到nadph)的一组反应物。由酮底物的多肽还原而氧化的辅因子由辅因子再生系统以还原的形式再生。辅因子再生系统包括化学计量的还原剂,其是还原氢等同物的来源并且能够还原辅因子的氧化形式。辅因子再生系统还可以包含催化由还原剂还原辅因子的氧化形式的催化剂,例如酶催化剂。分别从nad+或nadp+再生nadh或nadph的辅因子再生系统是本领域已知的,并且可以在本文所述的方法中使用。
可以在本发明的亚胺还原酶方法中使用的合适的示例性辅因子再生系统包括但不限于甲酸盐和甲酸脱氢酶、葡萄糖和葡萄糖脱氢酶、葡萄糖-6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇和醇脱氢酶、亚磷酸盐和亚磷酸脱氢酶、分子氢和氢化酶等。这些系统可以与作为辅因子的nadp+/nadph或nad+/nadh组合使用。使用氢化酶的电化学再生也可以用作辅因子再生系统(参见例如美国专利第5,538,867和6,495,023号,其均通过引用并入本文)。包含金属催化剂和还原剂(例如分子氢或甲酸盐)的化学辅因子再生系统也可以是合适的(参见例如wo2000/053731,其通过引用并入本文)。
在一些实施方案中,辅因子再生系统包括甲酸脱氢酶,其是催化甲酸盐和nad+或nadp+分别转化为二氧化碳和nadh或nadph的nad+或nadp+依赖性酶。适用于在本文所述的亚胺还原酶方法中用作辅因子再生系统的甲酸脱氢酶包括天然存在和非天然存在的甲酸脱氢酶。合适的甲酸脱氢酶包括但不限于本领域目前已知的那些(参见例如wo2005/018579,通过引用并入本文)。在一些实施方案中,在该方法中使用的甲酸脱氢酶是可商购的fdh-101(codexis,inc.,redwoodcity,california,usa)。甲酸盐可以以盐的形式提供,通常是碱式盐(alkalisalt)或铵盐(例如hco2na、khco2nh4等),以甲酸的形式提供,通常是甲酸水溶液,或其混合物。可以使用碱或缓冲液来提供所需的ph。
在一些实施方案中,辅因子循环系统包括葡萄糖脱氢酶(gdh),其是催化d-葡萄糖和nad+或nadp+分别转化为葡萄糖酸和nadh或nadph的nad+或nadp+依赖性酶。适用于实施本文所述的亚胺还原酶方法的葡萄糖脱氢酶包括天然存在的葡萄糖脱氢酶以及非天然存在的葡萄糖脱氢酶。文献中已经报道了天然存在的葡萄糖脱氢酶编码基因(例如枯草芽孢杆菌61297gdh基因、蜡状芽孢杆菌(b.cereus)atcc14579和巨大芽孢杆菌(b.megaterium))。非天然存在的葡萄糖脱氢酶使用本领域已知的任何合适的方法产生(例如诱变、定向进化等;参见例如wo2005/018579和美国专利申请公布第2005/0095619和2005/0153417号,其各自通过引用并入本文)。在一些实施方案中,在该方法中使用的葡萄糖脱氢酶是cdx-901或gdh-105,其各自是可商购的(codexis,inc.,redwoodcity,california,usa)。
在一些实施方案中,辅因子再生系统包括醇脱氢酶或酮还原酶,其是催化仲醇和nad+或nadp+分别转化为酮和nadh或nadph的nad+或nadp+依赖性酶。可在辅因子再生系统中使用的合适的仲醇包括低级仲醇和芳基-烷基甲醇,包括但不限于异丙醇、2-丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3-二甲基-2-丁醇等。适用于在本文所述的方法中用作辅因子再生系统的醇脱氢酶包括天然存在和非天然存在的酮还原酶。天然存在的醇脱氢酶/酮还原酶包括来自例如但不限于,thermoanerobiumbrockii、红平红球菌(rhodococcuserythropolis)、开菲尔乳杆菌(lactobacilluskefir)和短乳杆菌(lactobacillusbrevis)的已知的酶,并且非天然存在的醇脱氢酶包括由其衍生的工程化醇脱氢酶。在一些实施方案中,可以使用针对热稳定性和溶剂稳定性而工程化的非天然存在的酮还原酶。此类酮还原酶包括本文所述的那些,以及本领域已知的其他的酮还原酶(参见例如美国专利申请公布第20080318295a1、us20090093031a1、us20090155863a1、us20090162909a1、us20090191605a1、us20100055751a1、wo/2010/025238a2、wo/2010/025287a2和us20100062499a1号;其各自通过引用并入本文)。
考虑到例如期望的产物化合物的量、底物浓度对酶活性的影响、酶在反应条件下的稳定性和底物向产物的转化百分比,反应混合物中的酮和胺底物化合物的浓度可以变化。在一些实施方案中,合适的反应条件包括至少约0.5g/l至约200g/l、1g/l至约200g/l、5g/l至约150g/l、约10g/l至约100g/l、20g/l至约100g/l或约50g/l至约100g/l的底物化合物载量。在一些实施方案中,合适的反应条件包括至少约0.5g/l、至少约1g/l、至少约5g/l、至少约10g/l、至少约15g/l、至少约20g/l、至少约30g/l、至少约50g/l、至少约75g/l、至少约100g/l、至少约150g/l或至少约200g/l或甚至更高的酮和胺底物化合物的各自的载量。本文提供的底物载量的值是基于化合物(1d)的分子量,但是,还预期可以使用其它酮和胺底物(诸如酮底物化合物(1a)-(1d)和胺底物化合物(2a)-(2d))的等效的摩尔量,并且等摩尔量的任何这些化合物的水合物或盐可以在该方法中使用。还预期在一些实施方案中,合适的反应条件包括关于化合物(1d)的上述g/l浓度相当的摩尔浓度的每个酮和胺底物化合物的载量。因此,反应条件可以包括至少约5mm、至少约10mm、至少约25mm、至少约50mm、至少约75mm、至少约100mm或甚至更高的每个酮和胺底物化合物的底物载量。此外,预期由式(i)和式(ii)涵盖的底物化合物可以以与用于化合物(1d)的量相同范围的量使用。
在进行本文所述的亚胺还原酶介导的方法时,工程化多肽可以以纯化酶、部分纯化的酶、用编码该酶的基因转化的完整的细胞、此类细胞的提取物和/或裂解物、和/或固定在固体支持物上的酶的形式加入到反应混合物中。用编码工程化亚胺还原酶的基因转化的完整细胞或细胞提取物、其裂解物和分离的酶可以以多种不同的形式使用,包括固体(例如冷冻干燥、喷雾干燥等)或半固体(例如粗制糊状物)。细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙撑亚胺、热处理等)部分纯化,然后在冷冻干燥前进行脱盐程序(例如超滤、透析等)。任何酶制品(包括完整细胞制品)可以通过使用已知的交联剂诸如戊二醛进行交联或固定于固相(例如eupergitc等)来稳定。
编码工程化亚胺还原酶多肽的基因可以分别转化到宿主细胞中或一起转化到相同的宿主细胞中。例如,在一些实施方案中,可以用编码一种工程化亚胺还原酶多肽的基因转化一组宿主细胞,并且可以用编码另一工程化亚胺还原酶多肽的基因转化另一组宿主细胞。两组转化细胞可以以完整细胞的形式或以由其衍生的裂解物或提取物的形式一起用于反应混合物中。在其他实施方案中,可以用编码多个工程化亚胺还原酶多肽的基因转化宿主细胞。在一些实施方案中,工程化多肽可以以分泌的多肽的形式表达,并且含有分泌的多肽的培养基可以用于亚胺还原酶反应。
本文公开的工程化亚胺还原酶多肽的改进的活性和/或立体选择性提供了其中可以用更低浓度的工程化多肽实现更高转化百分比的方法。在该方法的一些实施方案中,合适的反应条件包括底物化合物载量的约1%(w/w)、2%(w/w)、5%(w/w)、10%(w/w)、20%(w/w)、30%(w/w)、40%(w/w)、50%(w/w)、75%(w/w)、100%(w/w)或更高的工程化多肽的量。
在一些实施方案中,工程化多肽以约0.01g/l至约50g/l;约0.05g/l至约50g/l;约0.1g/l至约40g/l;约1g/l至约40g/l;约2g/l至约40g/l;约5g/l至约40g/l;约5g/l至约30g/l;约0.1g/l至约10g/l;约0.5g/l至约10g/l;约1g/l至约10g/l;约0.1g/l至约5g/l;约0.5g/l至约5g/l或约0.1g/l至约2g/l存在。在一些实施方案中,亚胺还原酶多肽以约0.01g/l、0.05g/l、0.1g/l、0.2g/l、0.5g/l、1g/l、2g/l、5g/l、10g/l、15g/l、20g/l、25g/l、30g/l、35g/l、40g/l或50g/l存在。
在反应过程期间,反应混合物的ph可以变化。反应混合物的ph可以保持在期望的ph或在期望的ph范围内。这可以通过在反应过程之前和/或期间加入酸或碱来进行。可选择地,可以通过使用缓冲液来控制ph。因此,在一些实施方案中,反应条件包括缓冲液。保持期望的ph范围的合适的缓冲剂是本领域已知的,并且包括例如但不限于硼酸盐、磷酸盐、2-(n-吗啉代)乙磺酸(mes)、3-(n-吗啉代)丙磺酸(mops)、乙酸盐、三乙醇胺和2-氨基-2-羟甲基-丙烷-1,3-二醇(tris)等。在一些实施方案中,缓冲剂是磷酸盐。在该方法的一些实施方案中,合适的反应条件包括缓冲剂(例如磷酸盐)浓度为约0.01m至约0.4m、0.05m至约0.4m、0.1m至约0.3m或约0.1m至约0.2m。在一些实施方案中,反应条件包括约0.01m、0.02m、0.03m、0.04m、0.05m、0.07m、0.1m、0.12m、0.14m、0.16m、0.18m、0.2m、0.3m或0.4m的缓冲剂(例如磷酸盐)浓度。在一些实施方案中,反应条件包括水作为合适的溶剂,不存在缓冲剂。
在该方法的实施方案中,反应条件可以包括合适的ph。通过使用酸或碱、适当的缓冲液或缓冲和酸或碱添加的组合可以维持期望的ph或期望的ph范围。可以在反应过程之前和/或期间控制反应混合物的ph。在一些实施方案中,合适的反应条件包括ph从约4至约10、ph从约5至约10、ph从约7至约11、ph从约8至约10、ph从约6至约8的溶液。在一些实施方案中,反应条件包括约4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10的溶液ph。
在本文的方法的实施方案中,可以使用合适的温度用于反应条件,例如考虑到较高温度下的反应速率的增加和反应时间段期间酶的活性。因此,在一些实施方案中,合适的反应条件包括从约10℃至约80℃、约10℃至约70℃、约15℃至约65℃、约20℃至约60℃、约20℃至约55℃、约25℃至约55℃或约30℃至约50℃的温度。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃的温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间保持在特定温度。在一些实施方案中,酶促反应期间的温度可以在反应过程中在温度曲线上进行调节。
本发明的方法通常在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂、聚合物溶剂和/或共溶剂系统,其通常包含水性溶剂、有机溶剂和/或聚合物溶剂。水性溶剂(水或水性共溶剂系统)可以是ph缓冲的或不缓冲的。在一些实施方案中,使用工程化亚胺还原酶多肽的方法可以在包含有机溶剂(例如乙醇、异丙醇(ipa)、二甲亚砜(dmso)、二甲基甲酰胺(dmf)、二甲基乙酰胺(dmac)、n-甲基-吡咯烷酮(nmp)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(mtbe)、甲苯等)、离子或极性溶剂(例如1-乙基-4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑六氟磷酸盐、甘油、聚乙二醇(peg)等)的水性共溶剂系统中进行。在一些实施方案中,共溶剂可以是极性溶剂诸如多元醇、二甲亚砜(dmso)或低级醇。水性共溶剂系统的非水性共溶剂组分可以与水性组分混溶,提供单一液相,或可以与水性组分部分混溶或不混溶,提供两个液相。示例性的水性共溶剂系统可以包含水和选自有机溶剂、极性溶剂和多元醇溶剂的一种或更多种共溶剂。通常,选择水性共溶剂系统的共溶剂组分,使得其在反应条件下不会不利地使亚胺还原酶失活。通过利用酶活性测定(诸如本文描述的那些)测量具体工程化亚胺还原酶与限定的感兴趣的底物在候选溶剂系统中的酶促活性可以容易地鉴定适当的共溶剂系统。
在该方法的一些实施方案中,合适的反应条件包括水性共溶剂,其中共溶剂包含约1%至约50%(v/v)、约1%至约40%(v/v)、约2%至约40%(v/v)、约5%至约30%(v/v)、约10%至约30%(v/v)或约10%至约20%(v/v)的dmso。在该方法的一些实施方案中,合适的反应条件可以包括包含约1%(v/v)、约5%(v/v)、约10%(v/v)、约15%(v/v)、约20%(v/v)、约25%(v/v)、约30%(v/v)、约35%(v/v)、约40%(v/v)、约45%(v/v)或约50%(v/v)的dmso的水性共溶剂。
在一些实施方案中,反应条件可以包括用于稳定或促进反应的表面活性剂。表面活性剂可以包括非离子、阳离子、阴离子和/或两亲性表面活性剂。示例性的表面活性剂包括例如但不限于壬基苯氧基聚乙氧基乙醇(np40)、tritonx-100、聚氧乙烯-硬脂酰胺、十六烷基三甲基溴化铵、油烯基酰氨基硫酸钠、聚氧乙烯脱水山梨糖醇单硬脂酸酯、十六烷基二甲基胺等。可以使用任何可以稳定或促进反应的表面活性剂。在反应中使用的表面活性剂的浓度通常可以从0.1mg/ml至50mg/ml,特别是从1mg/ml至20mg/ml。
在一些实施方案中,反应条件可以包括消泡剂,其有助于减少或防止在反应溶液中形成泡沫,诸如当反应溶液被混合或喷洒时。消泡剂包括非极性油(例如矿物油、硅酮等)、极性油(例如脂肪酸、烷基胺、烷基酰胺、烷基硫酸酯(alkylsulfate)等)和疏水性(例如经处理的二氧化硅(silica)、聚丙烯等),其中一些也充当表面活性剂。示例性的消泡剂包括
在亚胺还原酶反应中使用的反应物的量通常将根据所需产物的量以及伴随的所用亚胺还原酶底物的量而变化。本领域普通技术人员将容易地理解如何改变这些量以将它们定制到所需的生产率和生产规模的水平。
在一些实施方案中,加入反应物的顺序不是关键的。反应物可以一起同时加入到溶剂(例如单相溶剂、双相水性共溶剂系统等)中,或者可选择地,一些反应物可以分开加入,而一些反应物可以在不同的时间点一起加入。例如,辅因子、共底物、亚胺还原酶和底物可以先加到溶剂中。
固体反应物(例如酶、盐等)可以各种不同的形式提供给反应,包括粉末(例如冻干、喷雾干燥等)、溶液、乳液、悬浮液等。使用本领域普通技术人员已知的方法和设备,可以容易地将反应物冻干或喷雾干燥。例如,蛋白溶液可以在-80℃下以小等分试样冷冻,然后加到预冷的冻干室中,随后施加真空。
在使用水性共溶剂体系时,为了提高混合效率,可以先将亚胺还原酶和辅因子加入并混合到水相中。然后可以加入并混合有机相,然后加入亚胺还原酶底物和共底物。可选择地,亚胺还原酶底物可以在添加到水相中之前在有机相中预混合。
通常允许亚胺还原酶反应进行,直到底物向产物的进一步转化不随反应时间显著变化,例如少于10%的底物被转化或少于5%的底物被转化)。在一些实施方案中,允许反应进行直到底物完全或接近完全转化为产物。可使用已知方法通过检测底物和/或产物(伴随或不伴随衍生化)来监测底物向产物的转化。合适的分析方法包括气相色谱、hplc等。
在该方法的一些实施方案中,合适的反应条件包括至少约5g/l、10g/l、20g/l、30g/l、40g/l、50g/l、60g/l、70g/l、100g/l或更高的底物的载量,并且其中该方法在约48h或更少、在约36h或更少或在约24h或更少的时间内产生至少约50%、60%、70%、80%、90%、95%或更高的底物化合物向产物化合物的转化率。
当在合适的反应条件下在该方法中使用时,本发明的工程化亚胺还原酶多肽产生至少90%、95%、96%、97%、98%、99%或更高的期望的仲胺或叔胺产物的非对映异构体过量。在一些实施方案中,不形成可检测量的不期望的非对映异构的仲胺或叔胺产物。
在使用工程化亚胺还原酶多肽将底物化合物转化为胺产物化合物的方法的另外的实施方案中,合适的反应条件可以在反应溶液中包括初始底物载量,然后与多肽接触。此反应溶液还补充有连续或分批添加的另外的底物化合物,以至少约1g/l/h、至少约2g/l/h、至少约4g/l/h、至少约6g/l/h或更大的速率随时间加入。因此,根据这些合适的反应条件,多肽被加至具有各自至少约20g/l、30g/l或40g/l的初始酮和胺底物载量的溶液。加入多肽后,然后以约2g/l/h、4g/l/h或6g/l/h的速率向溶液连续加入另外的酮和胺底物,直到各自达到高得多的至少约30g/l、40g/l、50g/l、60g/l、70g/l、100g/l、150g/l、200g/l或更高的最终底物载量。因此,在该方法的一些实施方案中,合适的反应条件包括将多肽加入到具有至少约20g/l、30g/l或40g/l的各自初始底物载量的溶液中,然后以约2g/l/h、4g/l/h或6g/l/h的速率向溶液添加另外的酮和胺底物化合物直到达到至少约30g/l、40g/l、50g/l、60g/l、70g/l、100g/l或更大的最终底物载量。这些底物补充反应条件允许达到更高的底物载量,同时保持底物向胺产物的至少约50%、60%、70%、80%、90%或更高转化的高转化率。
在该方法的一些实施方案中,使用工程化亚胺还原酶多肽的反应可包括以下合适的反应条件:(a)约5g/l至30g/l的底物载量;(b)约0.1g/l至10g/l的工程化多肽;(c)约19g/l(0.13m)至57g/l(0.39m)的α-酮戊二酸盐;(d)约14g/l(0.08m)至63g/l(0.36m)的抗坏血酸;(e)约1.5g/l(3.8mm)至4.5g/l(11.5mm)的feso4;(f)约6至9的ph;(g)约20℃至50℃的温度;和(h)2-24小时的反应时间。
在该方法的一些实施方案中,使用工程化亚胺还原酶多肽的反应可包括以下合适的反应条件:(a)约10g/l至100g/l的底物载量;(b)约1g/l至约50g/l的工程化多肽;(c)约0.1g/l至约5g/l的nadh或nadph载量;(d)约6至10的ph;(g)约20℃至50℃的温度;和(h)6至120小时的反应时间。
在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条件。这些可以包括采取措施来稳定酶或防止酶失活、减少产物抑制、使反应平衡移动到胺产物形成。
在另外的实施方案中,用于将底物化合物转化为产物化合物的任何上述方法还可以包括一个或更多个选自以下的步骤:提取;分离;纯化;和产物化合物的结晶。用于从通过以上公开的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶胺产物的方法、技术和方案是普通技术人员已知的和/或可通过常规实验获得的。此外,在下面的实施例中提供了说明性的方法。
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
实验
仅为了说明的目的提供以下实施例,包括实验和所获得的结果,而不应被解释为限制本发明。
在以下的实验公开内容中,使用以下缩写:ppm(百万分率);m(摩尔/升);mm(毫摩/升),um和μm(微摩/升);nm(纳摩/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);l和l(升);ml和ml(毫升);cm(厘米);mm(毫米);um和μm(微米);sec(秒);min(s)(分钟);h(s)和hr(s)(小时);u(单位);mw(分子量);rpm(每分钟转数);psi和psi(磅/平方英寸);℃(摄氏度);rt和rt(室温);cam和cam(氯霉素);dmso(二甲基亚砜);pmbs(硫酸多粘菌素b);iptg(异丙基β-d-1-硫代吡喃半乳糖苷);gdh(葡萄糖脱氢酶);fdh(甲酸脱氢酶);lb(luria肉汤);tb(terrific肉汤);sfp(摇瓶粉末);cds(编码序列);dna(脱氧核糖核酸);rna(核糖核酸);大肠杆菌w3110(常用的实验室大肠杆菌菌株,可从coligeneticstockcenter[cgsc],newhaven,ct获得);htp(高通量);hplc(高效液相色谱);fiopc(比阳性对照增加倍数);sigma-aldrich(sigma-aldrich,st.louis,mo;difco(difcolaboratories,bddiagnosticsystems,detroit,mi);agilent(agilenttechnologies,inc.,santaclara,ca);corning(corning,inc.,paloalto,ca);dowcorning(dowcorning,corp.,midland,mi);和geneoracle(geneoracle,inc.,mountainview,ca)。
实施例1
生产具有亚胺还原酶活性的衍生自cendh的工程化多肽
在lac启动子的控制下,在大肠杆菌w3110中生产seqidno:4-1300的偶数序列的工程化亚胺还原酶多肽。如下地制备在工程化多肽的定向进化中使用的用于htp测定的酶制品。
高通量(htp)生长、表达和裂解物制备。挑取细胞并在含有1%葡萄糖和30μg/mlcam的lb培养基中、30℃、200rpm、85%湿度下培养过夜。然后将20μl过夜生长物转移到含有包含30μg/mlcam的380μltb生长培养基的深孔板中,并允许在30℃、250rpm、85%湿度下生长。当培养物的od600为0.6-0.8时,通过加入iptg至1mm的终浓度诱导亚胺还原酶基因的表达。然后继续温育过夜(~18h)。将细胞培养物在4000rpm、4℃离心10分钟,并弃去培养基。将细胞沉淀物储存在-80℃并用于如下地制备用于htp反应的裂解物。在0.1m磷酸盐缓冲液ph8.0中制备含有1g/l溶菌酶和1g/lpmbs的裂解缓冲液。在室温下在滴定板振荡器上中速振荡2小时,在250μl裂解缓冲液中裂解96孔板中的细胞沉淀物。然后将板在4℃下以4000rpm离心20分钟,并且在htp测定反应中使用澄清的上清液作为澄清的裂解物。
摇瓶粉末(sfp)的产生:摇瓶方法可以被用于产生可用于二次筛选测定和/或可用于本文公开的生物催化方法中的工程化亚胺还原酶多肽摇瓶粉末(sfp)。与htp测定中使用的细胞裂解物相比,酶的摇瓶粉末(sfp)制品提供了更纯的工程化酶的制品(例如,多达总蛋白的30%),并且除其他以外,允许使用更浓缩的酶溶液。将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到含有30μg/ml氯霉素和1%葡萄糖的50mlluriabertani肉汤中。细胞在培养箱中在30℃下以250rpm振荡生长过夜(至少16小时)。在1l烧瓶中,在含有30μg/mlcam的250mlterrific肉汤(12g/l细菌用胰蛋白胨、24g/l酵母提取物、4ml/l甘油、65mm磷酸钾,ph7.0,1mmmgso4)中将培养物稀释至600nm的光密度(od600)为0.2,并允许在30℃下生长。当培养物的od600为0.6至0.8时,通过加入iptg至1mm的终浓度来诱导亚胺还原酶基因的表达。然后继续温育过夜(至少16小时)。通过离心(4000rpm,20分钟,4℃)并弃去上清液来收获细胞。通过用等体积的冷的(4℃)50mm磷酸钾缓冲液ph8.0重新悬浮来洗涤并通过如上所述的离心来收获细胞沉淀。称量洗涤的细胞,并将其重新悬浮于每1g细胞沉淀的6ml冷的50mm磷酸钾缓冲液ph8.0中。用110lmicrofluidizer(microfluidics,newton,ma)裂解重新悬浮的细胞。通过离心(10,000rpm,60分钟,4℃)除去细胞碎片。收集澄清的裂解物上清液并储存在-20℃。冷冻澄清裂解物的冷冻干燥提供了粗制工程化多肽的干摇瓶粉末。可选择地,细胞沉淀物(洗涤前或洗涤后)可以储存在4℃或-80℃下。
实施例2
衍生自seqidno:4的工程化多肽对于在制备化合物3a和3b中增强的稳定性和亚胺还原酶活性的进化和筛选
seqidno:4的具有亚胺还原酶活性的工程化多肽被用于产生表3a-3c的进一步工程化的多肽。与seqidno:4相比,这些多肽具有增强的亚胺还原酶活性(例如酮底物化合物(1a)向产物的转化百分比)。然后seqidno:6的具有亚胺还原酶活性的工程化多肽被用于产生表3d-3f的进一步工程化的多肽。与seqidno:6相比,这些多肽具有增强的亚胺还原酶活性(例如酮底物化合物(1b)向产物的转化百分比)。
使用如上所述的定向进化方法和htp测定和表4a中注明并在下文描述的分析方法,从seqidno:4或6的“骨架”氨基酸序列产生具有偶数序列标识符seqidno:10-358的氨基酸序列的这些工程化多肽。
使用分别编码seqidno:4和6的工程化多肽的seqidno:3和5的多核苷酸作为起始“骨架”基因序列开始定向进化。使用多种公知的技术(例如饱和诱变、先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用htp测定和测量工程化多肽进行如表2所示的一种或更多种催化反应(a或b)的能力的分析方法筛选。筛选后,相对于起始骨架序列(或“对照”序列)显示出最大改进的工程化多肽被用作用于构建进一步的文库的骨架序列,并且重复筛选过程来进一步进化多肽使其具有期望的活性。
在96孔板格式中,在100μl的总体积中进行酶测定反应。通过向含有55μl裂解物的每个孔中加入以下来开始测定反应:(i)10μlgdh辅因子再循环预混物(预混物含有10g/l葡萄糖、30g/lnad+、10g/lgdh-105);(ii)20μl胺底物储备溶液(500mm于0.1m磷酸钾缓冲液中,ph调节至8.0);和15μl酮底物储备溶液(333mm于dmso中)。所得的测定反应包括50mm酮底物化合物(1a或1b)、100mm胺底物(2a或2b)、55.5mm葡萄糖、3g/lnad+、1g/lgdh-105、85mm磷酸钾,ph8.0,15%(v/v)dmso。将反应板热密封并在44℃下以400rpm振荡过夜(16-24小时)。通过加入含0.1%甲酸的100μlch3cn使每个反应混合物猝灭、振荡并以4000rpm、4℃离心10分钟。将10μl猝灭的混合物在混合下在含0.05%甲酸的ch3cn/h2o(50/50)中稀释20倍。然后将10μl此稀释的混合物在含0.05%甲酸的190μlch3cn/h2o(50/50)中进一步稀释至总计800倍稀释的混合物。然后如以下表中所述地在mrm模式中通过lc-ms分析这些混合物的产物化合物(3a或3b)形成。
胺产物化合物3a的lc-ms分析(表4a):通过在使用mrm跃迁:347/232的mrm模式下的lc-ms分析如以上实施例2所述地制备的htp测定混合物的产物化合物(3a)的形成。另外的相关lc-ms仪器参数和条件如下所示。
胺产物化合物3b的lc-ms分析(表4b):通过在使用mrm跃迁:242/168的mrm模式下的lc-ms分析如以上实施例2所述地制备的htp测定混合物的产物化合物(3b)的形成。另外的相关lc-ms仪器参数和条件如下所示。
实施例3
衍生自seqidno:8的工程化多肽对于在制备化合物3c、3d、3e、3f和3g中增强的稳定性和亚胺还原酶活性的进化和筛选
seqidno:8的具有亚胺还原酶活性的工程化多肽被用于产生表3g-3m的进一步工程化的多肽。这些多肽具有进一步增强的亚胺还原酶活性(例如酮底物化合物(1c或1d)向产物的转化百分比),如这些表中所示。使用如上所述的定向进化方法和htp测定和表4c、4d和4e中说明的并如下所述的分析方法,从seqidno:8的“骨架”氨基酸序列产生具有偶数序列标识符seqidno:358-1300的氨基酸序列的这些工程化多肽。
使用编码seqidno:8的工程化多肽的seqidno:7的多核苷酸作为起始“骨架”基因序列开始定向进化。使用各种公知的技术(例如饱和诱变、先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用htp测定和测量工程化多肽进行如表2所示的一种或更多种催化反应(c、d、e、f和/或g)的能力的分析方法筛选。筛选后,相对于起始骨架序列(或“对照”序列)显示最大改进的工程化多肽被用作用于构建其他文库的骨架序列,并且重复筛选过程以使多肽进化获得期望的活性。
在96孔板格式中,在100μl的总体积中进行酶测定反应。通过向含有55μl裂解物的每个孔中加入以下来开始测定反应:(i)10μlgdh辅因子再循环预混物(预混物含有100g/l葡萄糖、30g/lnad+、10g/lgdh-105);(ii)20μl胺底物储备溶液(250mm于0.1m磷酸钾缓冲液,ph调至8.0);和15μl酮底物储备溶液(333mm化合物于dmso)。所得测定反应包括50mm酮底物化合物(1c或1d)、100mm或50mm胺底物(2c或2d)、55.5mm葡萄糖、3g/lnad+、1g/lgdh-105、85mm磷酸钾,ph8.0,15%(v/v)dmso。将反应板热密封并在44℃下以400rpm振荡过夜(16-24小时)。通过加入含0.1%甲酸的100μlch3cn使每个反应混合物猝灭、振荡并以4000rpm、4℃离心10分钟。将10μl猝灭的混合物在混合下在含0.05%甲酸的ch3cn/h2o(50/50)中稀释10倍至总计100倍稀释的混合物。然后如以下表中所述地在mrm模式中通过lc-ms分析这些化合物的产物化合物(3c、3d、3e、3f和/或3g)形成。
胺产物化合物(3c)的lc-ms分析(表4c):通过在使用mrm跃迁:300.3/190.2的mrm模式下的lc-ms分析如以上实施例3所述地制备的htp测定混合物的产物化合物(3c)的形成。另外的相关lc-ms仪器参数和条件如下所示地使用。
胺产物化合物3d的lc-ms分析(表4d):通过在使用mrm跃迁:385.3/329.4的mrm模式下的lc-ms分析如以上实施例3所述地制备的htp测定混合物的产物化合物(3d)的形成。另外的相关lc-ms仪器参数和条件如下所示地使用。
胺产物化合物(3e、3f和3g)的lc-ms分析(表4e):通过在使用499.2质量单位检测的ms2模式下的lc-ms分析如实施例3中所述地制备的htp测定混合物的产物化合物3f、3g和3e(3f和3g的总和)的形成。另外的相关lc-ms仪器参数和条件如下所示地使用。
序列表
<110>科德克希思公司
奥斯卡·阿尔维左
美利莎·安·梅奥
杰弗里·c·穆尔
<120>工程化亚胺还原酶和用于酮和胺化合物的还原性胺化的方法
<130>cx2-145usp1
<140>
<141>
<150>62/084,037
<151>2014-11-25
<160>102
<210>1
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属(arthrobactorsp.)菌株1c的冠瘿碱脱氢酶变体
<400>1
atgatcgagtcaaaaacatacgccgttttgggaatgggaagcgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtattcttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>2
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>2
metilegluserlysthrtyralavalleuglymetglyserglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>3
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>3
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcaaccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatttagaagctgta600
atacacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcaaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtattcttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>4
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>4
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealathrlysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
lystrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>5
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>5
atgatcgagtcaaaaacatacgccgttttgggaatgggaagcgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcaaccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcagacttactcttt420
gtagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatttagaagctgta600
atacacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacaattcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>6
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>6
metilegluserlysthrtyralavalleuglymetglyserglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealathrlysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrseraspleuleuphevalalalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>7
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>7
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacctgctcttt420
gaagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>8
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>8
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnleuleupheglualaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>9
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>9
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcaaccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>10
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>10
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealathrlysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>11
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>11
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcagacttactcttt420
gaagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggtcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>12
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>12
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrseraspleuleupheglualaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>13
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>13
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacttactcttt420
gaagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>14
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>14
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnleuleupheglualalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>15
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>15
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcagacttactcttt420
gaagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacaattcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>16
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>16
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrseraspleuleupheglualalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>17
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>17
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacctgctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
ggtcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>18
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>18
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnleuleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalglyhisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>19
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>19
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcagatctgctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>20
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>20
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrseraspleuleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>21
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>21
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>22
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>22
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>23
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>23
atgatcgagtcaaaaacatacgccgttttgggaatgggaagcgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtagctagatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
atacacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtattcttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>24
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>24
metilegluserlysthrtyralavalleuglymetglyserglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>25
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>25
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaactttctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>26
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>26
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnpheleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>27
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>27
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtagctagatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtattcttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>28
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>28
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>29
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>29
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcagacttactcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
ggccacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggtcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>30
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>30
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrseraspleuleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalglyhisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>31
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>31
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>32
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>32
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>33
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>33
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacggtctcttt420
gtagctaaatccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtacaattcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>34
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>34
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalalysser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>35
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>35
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcaacaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacctgctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>36
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>36
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealathrlysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnleuleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>37
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>37
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagcaaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacctgctcttt420
gtcgctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatgggacctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>38
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>38
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnleuleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetglyprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>39
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>39
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>40
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>40
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>41
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>41
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>42
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>42
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>43
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>43
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>44
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>44
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>45
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>45
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>46
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>46
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>47
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>47
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>48
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>48
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>49
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>49
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>50
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>50
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>51
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>51
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtagccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>52
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>52
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysserglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>53
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>53
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>54
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>54
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>55
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>55
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>56
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>56
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>57
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>57
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>58
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>58
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>59
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>59
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>60
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>60
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>61
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>61
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
atggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>62
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>62
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrmetglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>63
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>63
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>64
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>64
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>65
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>65
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagatgcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>66
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>66
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysglumetglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>67
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>67
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>68
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>68
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>69
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>69
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggacagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>70
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>70
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>71
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>71
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>72
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>72
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>73
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>73
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>74
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>74
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>75
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>75
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>76
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>76
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>77
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>77
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>78
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>78
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>79
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>79
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>80
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>80
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>81
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>81
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>82
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>82
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>83
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>83
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>84
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>84
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>85
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>85
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>86
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>86
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>87
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>87
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>88
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>88
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>89
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>89
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>90
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>90
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>91
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>91
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>92
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>92
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>93
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>93
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>94
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>94
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>95
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>95
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctggcagccttaacacggtacagttcaaaaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>96
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>96
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalproglyser
275280285
leuasnthrvalglnphelysasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>97
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>97
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtatttttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>98
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>98
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalphepheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>99
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>99
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggctgcggacatcgatgctcagagaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatgggttaac780
gatgtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaaaagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>100
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>100
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
alaaspileaspalaglnargilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpvalasnaspvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprolysser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355
<210>101
<211>1077
<212>dna
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>101
atgatcgagtcaaaaacatacgccgttttgggaatgggaaacgggggtcacgcatttgcc60
gcctatttagcattgaagggccagcgtgtactggcttgggacatcgatgctcagaaaatc120
aaagagattcaggaccgtggagccatcatagcggaaggaccaggacttgctgggactgct180
cacccggatcttgtgacctcagatataggtttggcggttaaagacgctgatgtgatactg240
attaccgtgccggccatccaccacgcttccattgcagccaaaatcgccagttacatttcc300
gagggtcagttgattatccttagccctggggcgacgggtggagcgctggaattccggaaa360
atcctgcgtgaaaatggtgcgccggaggtaacgatcggggaaacctcaaacgggctcttt420
gtagctcggtccgagagaccaggacaggttacggtatattttatacagctggcccaggac480
tttgcatgtctcccagcggcaatggctggatgggccctggaacagatagggtcggttctt540
cctcaataccaggctgtcgaaaacgtgttgcatacttcgctgactaatctggaagctgta600
attcacccgctgactaatctgttaaacgctgctcgttgtgagtctggtaccccattcgat660
tattataccgaggggattacgccatcagtcggggcgctttgcgagaaagtggaccaggaa720
cgcatagcaatcgcaaaggctttcgatttaaacgttccgtcggtcggcgaatggattaac780
gaagtttgtggccagaccccggccacaatttatgaagcgatgcagggtctgccttttctg840
aggggctggatggttcctaccagccttaacacggtacagttcagcaacgatgtaagcacc900
ggactggtaccgttatccgaactgggtcgggtggtgaatgtgcctaccccacttatcgat960
gctgttcttctgttgatcagtgaactggttgacgtggatttcagaaaggaaggtcgtacc1020
ttggaaaaattaggtctgagcggacttaccgccgcggaaataagaagtgctgttgag1077
<210>102
<211>359
<212>prt
<213>人工序列
<220>
<223>来自节杆菌属菌株1c的冠瘿碱脱氢酶变体
<400>102
metilegluserlysthrtyralavalleuglymetglyasnglygly
151015
hisalaphealaalatyrleualaleulysglyglnargvalleuala
202530
trpaspileaspalaglnlysilelysgluileglnaspargglyala
354045
ileilealagluglyproglyleualaglythralahisproaspleu
505560
valthrseraspileglyleualavallysaspalaaspvalileleu
65707580
ilethrvalproalailehishisalaserilealaalalysileala
859095
sertyrilesergluglyglnleuileileleuserproglyalathr
100105110
glyglyalaleugluphearglysileleuarggluasnglyalapro
115120125
gluvalthrileglygluthrserasnglyleuphevalalaargser
130135140
gluargproglyglnvalthrvaltyrpheileglnleualaglnasp
145150155160
phealacysleuproalaalametalaglytrpalaleugluglnile
165170175
glyservalleuproglntyrglnalavalgluasnvalleuhisthr
180185190
serleuthrasnleuglualavalilehisproleuthrasnleuleu
195200205
asnalaalaargcysgluserglythrpropheasptyrtyrthrglu
210215220
glyilethrproservalglyalaleucysglulysvalaspglnglu
225230235240
argilealailealalysalapheaspleuasnvalproservalgly
245250255
glutrpileasngluvalcysglyglnthrproalathriletyrglu
260265270
alametglnglyleupropheleuargglytrpmetvalprothrser
275280285
leuasnthrvalglnpheserasnaspvalserthrglyleuvalpro
290295300
leusergluleuglyargvalvalasnvalprothrproleuileasp
305310315320
alavalleuleuleuilesergluleuvalaspvalaspphearglys
325330335
gluglyargthrleuglulysleuglyleuserglyleuthralaala
340345350
gluileargseralavalglu
355