耐高温dna聚合酶基因序列及编码的多肽和制备方法

文档序号:577146阅读:867来源:国知局
专利名称:耐高温dna聚合酶基因序列及编码的多肽和制备方法
技术领域
本发明涉及微生物遗传领域,具体涉及属于嗜热厌氧菌的一种分离的耐高温DNA聚合酶基因序列及编码的多肽和制备方法。耐高温DNA聚合酶可广泛用于基因克隆,基因诊断和基因治疗等技术领域。
背景技术
DNA聚合酶是与DNA修复及复制过程有关的酶家族,DNA聚合酶已从大肠杆菌(如大肠杆菌DNA聚合酶I和Klenow片段)中分离,T4DNA聚合酶以及近来一些耐高温DNA聚合酶已经被分离,如来自T.aquaticus的DNA聚合酶(美国专利号4,889,818),以及来自T.litoralis的DNA聚合酶,耐高温DNA聚合酶被建议用来扩增现有核苷酸序列,其数量比原有的要多。聚合酶链式反应(PCR)和链置换扩增(SDA)是扩增核苷酸序列的两种方法。PCR是基于寡聚核苷酸引物杂交到特异靶DNA分子的两条链上,随后在DNA聚合酶作用下引物延伸产生两条新的DNA双链,其每条链都能用作下轮杂交与延伸的模板。SDA区别PCR在于其恒温扩增过程,即所有反应在同一温度下进行,无需升高温度来溶解DNA双链。DNA聚合酶如测序酶,Klenow酶,Taq酶等已经广泛用于DNA测序(美国专利号5,173,411)。目前,耐高温DNA聚合酶已经广泛用于基因克隆技术领域,主要是来自T.aquaticus嗜热菌的Taq DNA多聚酶,然而该酶在工作时易产生一定的误差。
腾冲嗜热厌氧菌(Thermoanaerobacter tangcongensis)是生活在我国云南省腾冲县的热泉中的一种微生物,是一种嗜热的真细菌(eubacteria),最适生长温度为75摄氏度,厌氧生长,革兰氏染色反应呈阳性。它由中国科学院微生物所首先发现并进行了分类学上的分析。菌种保存在中国微生物保存中心MB4T(Chinese collection ofmicroorganisms AS 1.2430T=JCM 11007T)。该嗜热厌氧菌是我国特有的一个物种,其体内所具有的耐高温DNA聚合酶也具有自己特有的结构。

发明内容
本发明要解决的技术问题是提供一种非常实用的,性能良好的耐高温DNA聚合酶基因序列及编码的多肽和制备方法。本发明通过对腾冲嗜热厌氧菌全基因组测序,利用基因预测软件得到一段含10,020碱基对的序列,用PCR扩增该基因,然后克隆到表达载体pBV220中,并在大肠杆菌中获得高表达。通过碱基缺失和突变研究以及蛋白质功能研究表明,该基因是一个编码耐高温DNA聚合酶的基因序列,同时,该耐高温DNA聚合酶兼具有反转录酶的活性。该基因对于制备用于生产耐高温DNA聚合酶的转基因微生物或动植物,并回收获得该基因编码的酶有用。
另外,本发明还提供了具有耐高温DNA聚合酶活性的多肽的氨基酸序列及功能等同体。同时,本发明还提供了制备,分离,纯化具有耐高温DNA聚合酶活性的多肽的方法。
本发明所采用的技术方案是本发明涉及一种分离的DNA,它能编码具有耐高温DNA聚合酶活性的多肽的核苷酸序列。
上述分离的DNA,它还具有编码SEQ ID NO2中的氨基酸序列的多肽或所述多肽的修饰形式的核苷酸序列,该修饰形式功能上相当或与耐高温DNA聚合酶相关。
上述分离的DNA,它还具有SEQ ID NO1的多核苷酸序列以及它的突变形式,突变类型包括缺失、无义、插入、错义。
本发明还涉及一种分离出的多肽,它具有耐高温DNA聚合酶活性。
上述分离出的多肽,它具有SEQ ID NO2中的氨基酸序列的多肽,或其保守性变异多肽、或其活性片段、或其活性衍生物。
本发明还涉及一种载体,它含有能编码具有耐高温DNA聚合酶活性的多肽的核苷酸序列之分离的DNA。
本发明还涉及一种用上述载体转化的宿主细胞,包括原核细胞或真核细胞。
本发明还涉及一种生产耐高温DNA聚合酶的方法,包括1)分离出具有编码耐高温DNA聚合酶多肽的核苷酸序列SEQ.ID NO.1;2)构建含SEQ.ID NO.1核苷酸序列的表达载体;3)将步骤2)中表达载体转入宿主细胞,形成能生产耐高温DNA聚合酶多肽的重组细胞;4)培养步骤3)中的重组细胞;5)分离、纯化得到耐高温DNA聚合酶活性的多肽。
本发明的有益效果是本发明对于制备用于生产耐高温DNA聚合酶的转基因微生物或动植物,并回收获得该基因编码的酶有用。
在本发明中,“分离的”DNA是指该DNA或片断已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片断已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,“耐高温DNA聚合酶基因”指编码具有耐高温DNA聚合酶活性的多肽的核苷酸序列,如SEQ ID NO.1的核苷酸序列及其简并序列。该简并序列是指该序列中有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于公知的密码子的简并性,所以与SEQ ID NO.1核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的氨基酸序列。该术语还包括能在中度严谨条件下,更佳地在高度严谨条件下与SEQ ID NO.1的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.1核苷酸序列同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本发明中,“分离的”蛋白的多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析,PAGE或HPLC法测量多肽的纯度。分离的多肽基本上不含天然状态下的伴随其的组份。
在本发明中,“耐高温DNA聚合酶蛋白”指具有耐高温DNA聚合酶活性的SEQ IDNO.2序列的多肽。该术语还包括SEQ ID NO.2序列的变异体,这些变异体具有与天然耐高温DNA聚合酶相同的功能。这些变异体包括(但不限于)若干个氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一个或数个氨基酸,也可以是不影响序列的修饰形式上的差异。例如,为本领域所公知的,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末段和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括耐高温DNA聚合酶的活性片断和活性衍生物。
在本发明中,可选用本领域已知的各种载体,如市售的各种质粒,粘粒,噬菌体及反转录病毒等。在生产本发明的耐高温DNA聚合酶时,可以将耐高温DNA聚合酶基因序列可操作地连于表达调控序列,从而形成耐高温DNA聚合酶表达载体。表达载体含有复制起始点和表达调控序列,启动子,增强子和必要的加工信息位点。表达载体还必须含有可供选择的标记基因,如a)提供对抗生素或其他毒性物质(氨苄青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白质或b)互补营养缺陷型蛋白质或c)提供复合培养基中没有的必需营养成分的蛋白质。各种不同宿主的合适标记基因是本领域中所熟知或生产厂商说明书著名的。这些表达载体可以用本领域技术人员公知的重组DNA技术制备,如可参考Sambrook等人,1989或Ausubel等人,1992。
重组表达载体可以用本领域熟知的方法引入宿主细胞,这些方法包括电转化法,氯化钙法,基因枪法等。将外源重组载体导入宿主细胞的过程称为“转化”。通过培养宿主细胞,诱导所需蛋白的表达,并通过本领域所熟知的蛋白分离技术,如柱层析等得到所需的蛋白质。也可采用固相技术等人工合成该蛋白质。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核细胞如大肠杆菌,枯草杆菌等。常用的真核细胞如酵母细胞,或各种动植物细胞。
本发明的耐高温DNA聚合酶基因全长序列或其片断通常可以用PCR扩增法,重组法,或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列来设计引物,用本领域技术人员已知的常规方法制备的嗜热厌氧菌全基因组DNA为模板,扩增而得到有关序列。一旦获得了有关序列,就可以将其克隆入有关载体,再转入宿主细胞,然后通过常规方法从增殖后的宿主细胞中分离得到大批量的有关序列。


图1是本发明实施例测序文库构建步骤图。
图2是本发明实施例测序与数据分析流程图。
具体实施例方式
下面将通过实施例对本发明作详细描述1)构建测序文库测序文库的构建采用全基因组霰弹法(shotgun)进行。首先培养腾冲嗜热厌氧菌,培养方法按(Yanfen Xue,2000)改进的MB培养基(Balch et al.,1979),按Marmur(1961)方法收集细菌,提取总DNA。为了保证测序文库构建的随机性,最大程度地避免产生断裂热点的问题,采用多种方法、不同条件的建库原则。先采用物理剪切方法(包括超声波法及用Hydroshear Machine进行剪切),其次根据该菌基因组特征选用AluI进行随机部分酶切。物理剪切时采用不同强度处理样品,酶切时通过设置酶量梯度处理样品。处理后的样品经平末端处理后,采用电泳分部收集1.5-4kb DNA片段,与去磷酸化的经SmaI酶切的pUC18进行连接,连接产物通过电转化E.coli DH5α构建了随机测序的文库。同时,为了便于以后长片断(contig)的搭接还构建了长插入片段(10kb左右)的测序文库(将基因组DNA以Sau3AI随机部分酶切,电泳收集10kb左右的片段,与去磷酸化的经BamHI酶切的pUC18进行连接、构建文库)。该文库经两个末端的测序在完成图(finishing)的过程中可以得到contig之间的关系,并可以解决较大的gap对补洞造成的困难。建库流程如图1所示。
2)基因组测序在完成腾冲嗜热厌氧菌基因组的测序时,主要使用了两种全自动测序仪ABI377和MegaBACE 1000。这两种测序仪都是利用电泳原理进行测序,每次可完成96个样品。ABI377是PE公司的产品,是ABI系列的一种。它属于平板凝胶电泳测序仪。MegaBACE 1000是法玛西亚公司的产品,属于毛细管凝胶电泳测序仪。
3)Basecalling和测序质量监控所谓Basecalling是指从测序仪上得到的原始数据文件中得到正确的碱基序列的过程。由于测序仪上得到的是A,T,G,C四种碱基对应的不同波长的光的强度变化轨迹(trace),需要用计算机采取一定的算法从中正确识别出不同的轨迹对应的碱基。这里我们使用的是Phred软件(Ewing B,Hillier L,1998),原因是其结果更可靠,并且其结果输出更便于同一软件包中的其他程序进行进一步的分析。
Phred进行Basecalling的算法原理,是根据轨迹中各个峰的形状,间距,以及信噪比等因素,判断碱基类型,同时对这个碱基给出可信度信息,即碱基的测序质量。在大规模测序中,测序质量的监控是十分重要的,它直接影响对测序的决策,包括文库的构建,覆盖率的大小。同时对测序实验中可能出现的失误能及时反馈。
4)序列拼接所谓序列拼接,就是把全基因组霰弹法,又称鸟枪法随机测序得到的样品序列组装成连续的长片断(contig),主要利用它们之间的重叠序列作参考。考虑到测序中存在载体的影响,需要先对样品序列进行去载体处理。这里所用的软件cross_match和后面拼接所用的软件Phrap都是美国Washington大学的软件(Gordon D,Abajian c,1998),其基本原理为Swith-Waterman算法(Waterman MS,1990)。这是一种动态算法,在考虑了两两序列之间的比较之后,可以得到一组序列的公有序列(consensus sequence)。去除载体后的样品序列再用Phrap进行拼接。在拼接时,碱基的测序质量也被考虑了,所得到的公有序列各碱基的可信度,由组成该公有序列的样品的测序质量计算得到。
5)基因注释在大体得到基因组的大部分序列(完成工作框架图)后,就需要对基因组进行注释,包括进行开读框架(Open Reading Frame,ORF)的预测,基因功能的预测,以及特殊RNA片断的分析等。
第一步采用缺省参数的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)软件预测基因编码序列,然后所有预测的开读框和非编码区(intergenicregion)都用BLAST软件(Altschul,S.F.et al.1997)与NCBI的无冗余蛋白数据库(non-redundant protein database)比较来发现可能漏掉的基因。在判断一个基因的起始点时,将参考各种相关信息,如序列同源性,核糖体结合位点,可能的信号肽序列和启动子序列等。如果在一个开读框内出现多个启动子时,一般采用第一个启动子作为基因的起始点。采用TransTerm软件(Ermolaeva,M.D.2000)在非编码区预测不依赖于Rho(ρ)因子的转录终止子。如果该终止子位于一个基因的下游区的太远处,则可能暗示一个小基因的丢失或测序错误人为地缩短了该基因,可作为进一步分析的参考。在确定移框突变和点突变时,主要根据与数据库中的蛋白质的相似性来判断。如果出现一个蛋白质对应于两个彼此相邻的编码序列的情况,则被认为是一个无活性基因(假基因pseudogenes),因为这说明这两个编码序列之间由于突变而产生异常中止现象,进而使基因失去活性。所有分析结果再用Artemis sequence viewer软件(Rutherford,K.et al.2000)进行手工分析。一些明显与其它编码序列有重叠的开读框,长度小于150碱基对并且在已有数据库中没有同源性和其中没有明显的启动子或终止区域的开读框将被去除。
蛋白质的功能片断(motif)和功能区域(domain)分别采用与Pfam、PRINTS、PROSITE、ProDom和SMART数据库进行比对分析,结果再用InterPro数据库(Apweiler,R.et al.2001)进行汇总分析。根据NCBI的COGs数据库(Tatusov,R.L.et al.2001)并且参照其他数据库的查询结果来确定蛋白质在COGs分类中的功能分类和可能的代谢途径。用TMHMM软件(Krogh,A.et al.2001)来确认膜蛋白、ABC转运蛋白和跨膜功能域。采用革兰氏阴性菌为参数,用SIGNALP2.0软件(Nielsen,H.et al.1999)分析信号肽区域。
6.耐高温DNA聚合酶的制备和提纯根据实施例中基因注释的到的耐高温DNA聚合酶全长编码序列(SEQ IDNO.1),设计能扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点,以便构建表达载体。根据基因预测结果,在该基因上游和下游设计引物,为便于克隆,在上游引物增加了Xbal I位点。
为获得有部分碱基缺失的基因突变体,在所需要缺失部分的两侧再设计引物。所有引物由北京奥科生物公司负责合成。
以第1)部分中获得的测序文库的质粒DNA为模板,经PCR扩增后,在保证阅读框正确的前提下重组至pGEX-2T载体(Pharmacia,Piscataway,NJ)。再将重组载体转化入大肠杆菌DH5α中(转化方法为CaCL2法或电转化法)。筛选鉴定的到含有表达载体的工程菌DH5α-pGEX-2T-Dna。
挑取单菌落的工程菌DH5α-pGEX-2T-Dna于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养37℃过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L,继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达所需蛋白的工程菌。
按上述方法诱导表达所需蛋白的工程菌后,将细菌离心沉淀,按每400ml菌加入20mlPBS饱和的50%谷胱苷肽Sepharose 4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了所需蛋白的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液所得沉淀加入100μl还原型谷胱苷肽洗脱液,室温置10分钟,上清即为洗脱的蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在?Kda处的蛋白质条带即为耐高温DNA聚合酶。
对耐高温DNA聚合酶的保真性进行鉴定步骤1 设计10对PCR引物,用腾冲嗜热厌氧菌热稳定性DNA多聚酶对已知序列的10个目的DNA片段进行PCR扩增,扩增循环条件如下95度变性5分钟---95度变性30秒---52度复性30秒---72度延伸3分钟(35个循环)---72度延伸10分钟---4度结束步骤2 PCR产物纯化并测序PCR产物纯化用QIANQEN公司纯化试剂盒,测序引物用PCR引物,双向测序,在PE公司的ABI-377测序仪上进行。
步骤3序列结果分析将测序结果与已知序列的10个目的DNA系列进行比较,结果完全吻合。
总结本发明介绍了一种纯化的耐高温DNA聚合酶或片段及其基因。它有腾冲嗜热厌氧菌(T.tengcongensis)耐高温DNA聚合酶的活性。本发明中纯净酶在SDS-PAGE下的分子量约90,000D,具有5’--3’外切酶活性,实验条件下DNA合成的最适温度是75度,Mg2+、Mn2+的浓度分别为1mM和0.5mM。该酶适用于链置换合成DNA、DNA测序反应以及DNA反转录合成。与腾冲嗜热厌氧菌耐高温DNA聚合酶具有相同的DNA复制效率的各种突变(如缺失或替换)也被包括在当前的发明中。
序列表1.SEQ ID NO.1(1)序列特征a.长度10020碱基对b.类型DNA/RNAc.链型双链d.几何结构线性(2)分子类型核苷酸(3)序列描述atgaaatttgtgtgtgataaaaattcattgttggaaggcgtcaatatagccataaggggggtatcctcccgtaccacccttcccatattgcaaggaataaaaataacagcaagaggcaatgtcataaagctttcaggtactgacctcgagatagggatagagtgtcaaatacccgcagttattgaagaagagggggagacagttgttccagcaaggatttttagtgacctcgtaaaaaaattgcctgaaggagaagtggaagtaaaaagcgattcacagaatactgtaaatgtggtttcaggagacataaacttctcaattgcaggaagcaatccagaagaatttcctgaaatacctgaagtatcaagagaaaagtcatttaaacttccccaatcaatcctcaaagacttgataaaaaagacagttttttgcgtctcagaagagcagactaggccaattctaacaggggtactttttgaagtatttccaaatgagcttaaagcagtggcattggacggatttagaatggccatatactcttataagtcggaaaagtccttttttgacgaagaagcggagaagtactctcttgtcattccgggagataccatcgatgaaatttcaaggatattggaagatgaagagacagaggtaataatataccacacttccaaccaggtgcttttccagattgataacactaaagtcatctcaaggcttcttgaagggagttttataaactacaacgctgtgctccctaaagattttaagacagagatcactataaataaagatgtgtttatggaaagccttgaaagggcatctctaattgctgagagcaagaacaatttagtaaaatttgaaataggagatagctttattgtgatttcttcaagttcggaaaaaggaagtatgtcagaaaagttggaagtggaagttaaaggaatgcttctagagattgcttttaactctagatatttacttgatgcgctcaaggcaattaatgaagaagaagtaaatctttacttcataaacagcataaatccgctaataataaaaccagtgggggaaaaggaatacctctacatgatactgccggtgaagcttaactaaatgtatcagtctttgtacaggaaatacaggccaaaaagtttcagtgaagttgtggggcaggaccacattgtgaggactctgaggaatcaaataaaaatgggaaggatagggcatgcatatctttttacaggcacaagggggacagggaaaactagtgtagcaaaaatttttgcaaaggcggtaaactgtttaaatccaaaagacggtgagccctgcaattcctgtgaggtgtgtcaggcgataaacactggtactactatggatgtcttggaaatagatgctgcatctaataacagcgtgaatgacgtgagagaacttagagagtctgtaatctactctccttctctgacaaagtacaaagtatatataatagatgaagtgcatatgctttctacaggagcttttaacgcccttttaaaaacacttgaagagccccctcgccatgtgattttcattcttgctaccactgaacctgagaaactgcctgacactatcctctcgcgttgccagaggttcgattttaaaaagataccgacaaagcagattgcacagaatctagaaaggatttgccaagatagcggtatacagattgaacaaaacgggataagagctatcgctctttatggaaatggttcaatgagagatgcgataagtcttttagagcaatgcgcttcttacaaggaaggattaataacctatgaagatgtttgtgaaatattgggagttgcgaatgaagaaatgcttttttcacttttagatcatatttacgagaaggatgcggtagcttctttacagcaactggataaaatattgtcctatggaatagatttaggaaattttctaaggtcctttacttatatgctaagagatatggttatatacaaaactgggggagatgagctaatagagattttgtacggagatcaagagaccataaaagcaaagtcgcagaaatacagcataggatttttgacaaatgctttggagaagtttactgctttgcagagagagataagatatgctgtttcacctgttacattgcttgaattgacgattttaagacttattaggccggaaatttcttacgatatgggaagcttgatagctagaatagaagagctagaggaaaaaataaataaagggtatgtggtaacaaaagaagagagtgcgaaaacacatgaaaaagatgagctagaaaaaaaggttgatgctacaaaagaggcaaaaaaagaaagggaggaaattgatttaggaagagtttggcttgaagtaaagggaattctcaaaaaggaaaggatgatgctctatactttcctagagaagggtgttccccatttaaaggatggcaaaattgttgtggagtattccgaagaagacgctcttttggtggaacagcttggtaggccagagaataaagactttattgaaggagtagtagaaaaagtagtgaagaaaagaattccaatagagtttgctctaaaaaaaagcgaagaggaccttttaattaagcaggtaaaggaattttttggggatggaattgacatagaaataatatagatgaactatagggaatttgtagaaagcataaaaaagggacagatagctcctttataccttttttacggagaagagagatttttgcttttagatgctgttaagaggttgaaggcaaggctcttggtgccagagtttgaggatatgaattacattgtaattgagagggaaaatccggaggaatacgtagaagccatcattgagaattgcgagactctcccttttttttcaaattataaaattgtagtggtgaaaaatgaagaagaacagctttccaagataggtgataaagagttaaaaaggcttactgattattttaaaaacagggtgctaggaaatactagtcttgttgttgtagttgtaagtggtgaaaaaatagattcgagaaaaaaattgtacaagtttatggaaaaagaagctgctgtggtggagtttaaaaagctcactccggaagaggcagttaattatgccggctatttcttaaaaaaacacggtaaaaaggctgcaaaaaaggatgtagaatctcttgtgaaaaacataggaactgacctttactcaattgtgaacgagctggagaaagtgatagcctattcagaaggggaaacgcttgatttggaggaagcaagagaggtgctttcagttactctccagcagaacgtgtttcaccttgtgaatgcaatagggatgaaaaaagagaaagaggcttatagagctctttatgcgcttctttcaaaaggggaagtgccgcttataatcttaacgatgattgcaaggcagataaggcttattgcaaagttgaaatctctagaaggaaaggctttcgataaaaagtctatagccagttacttaggcattcctttctttgctgtagatgatatcgtaaggcagagcaagctttttacaagagaagatttgtataaggcgtacaaagagtgtttgaggtgcgacatagcattaaaaagcggaacagagccttcatttgcgctggaaaatctcataaaaaaattatgcaagcaataaatggttccagcgactttcttggaaaacatgcaaataaaaaaagtaagagttgaaaaaaagagccgaaaactcactgtggttgtctcctctttctcatcaaatgcacaaaagctctcagaatttcagtcttttttggaggaaagctttccttctctaaaggagataaagattgtggtggaaagcccttctttatcaacagtagaagaggttttggaaaactgggagaaagtagtattagagcttagcgaagagtacccttcttccttaagttttttaaagacctgtgatgtcgcaaaagagggacagaataggataactgtaaaggctccaacttacgcaatttacgaaatggctaaaagcagcaaattagattttgcaataagagaatttttaaggaacaggtatgaacttaatttagatgtagaacttattttttcagaagaaggggaagaaattgcagaaaaaataatcgaagaagacataaaagcaattgaggaagttatccaaaaagatgagaagtctaaaaaggagaagagtaggtctgaagaaaatagagttctccttggcaaagaaatgaaagctaaacctatctctattaaggatgtaagtgcagaaaccgatgaggtagtgattgaaggagaaatattttctattgattttaaagagttgaagtcaaaagttctcatggtgtttgacattacagattatactagttcaatacttgtcaaaacctttttgacagaagaaaaatatgaaattttgaaagatgaaatagatgtaggaacttttgtcaggttaagaggaaatgtgatatacgataagtacgaaggagaccttgtaattgatttgaaagacttagagctcattcctccaaaaaagagaatggatttgtccgaagaaaagagagtggagcttcaccttcacacccagatgagcactttagatgccgtcccttctgctactgaagtgataaagagagcggcagaatggggacacaaggctgttgcaataacagaccacgcagtggttcaagcttttccagaggcaatggaagcatctcgagagtatggggttaaggttatatacggaatggaagggtatatggtggatgacggaataccaattgtcactggagaatccgaagctagtttggaaggcgaatttgtggtatttgatatcgaaaccacaggcctttcaaacataaatgacgagataatagagattggtgctgtcaagatcaaaaacaagaaaatagtagatacttttgaaacttttgtaaatcctcaaatacccatttcttctttcatcacaaaactcacaggaatcgatgaatcaatggttaaagatgctcctttaatagaagaggtgttgcctaaatttttggaatttgcaaaaggagcagttctggtagcacacaatgccaattttgatgtgtcctttattaaatcaaaggctaagaaactaggtttgactgttgaaaacactgtcttagatacgcttgagttgagcaggcatctgtaccaagatcttaaaaattacaaactcgacactcttgctgaattttttgaagtaaagcttttgcatcaccacagggccgtggaagacgcgaaggctacagcagaaattttcattaagatgctagaaaagctgcaagaaataggcataaagagtgtaagcgaaatcaactcggttttgatggaaagggaagtggacgtaaaaaaattgcctgtataccatgtgacaattttggtaaaggaccagaagggtttaaggaatttatacgagataatatctaggtcaaacctggagtttttccaccgcacccccagaataccaaagagtctgttggtgaaaatgagagaagggctgatcatagggtctgcctgtgagcagggagaagtgttcagagccttggtttctaacttggaggaaaagaagctcgaagatataatcaacttttacgactatttggaaattcagcctgtggggaacaacgaatttttgattgaaagaggagaggtaagaagcgtagaagaacttaaagaaataaacagaaagatatacgaacttgggaaaaagtacaacaagctggtagtagcaacaggagatgtgcattttttagacccgtgggacgatgtgtacagaaaaatattaatggcgggcaaagggtataaggatgcggacagacagcctcctctttactttaggacaactgaagaaatgcttatggagtttgaatatctaggagaagaagctgccagagaggtagtcattgaaaatccaaataaaattgcggaaattgtggaagatgtaaagcctattcctgagggaacttttccgcctgtcatcgaaggggcagaagaagaattaagaaggattacccttgaaaaagctcatgagatatacggtgacccattgcctccaattgtgcaggaaaggcttgacagagagctaaacgccataataaacaacggttacgctgtaatgtacgtaatagctcagaagctagtatcaaagtcgctgcaggatggatatttggttggttcaagaggctctgtagggtcttctctggtagctactatgagcggcattacagaggtaaatccgctgcctcctcattacgtgtgtccaaaatgcaaacactcagagtttgtgacggacgggtcttttggctgcggagttgacatgcctgacaagtactgccctaactgcggcactttgatgaaaaaagacggctttgacataccttttgaagtgtttatgggctttgaaggagataaggagccggatatagacctaaacttttctggagaatatcagcccatagctcacaggtacactgaagaactttttggaaaaggccatgttttcagggcaggtactattggaacgctggcggataagactgcttacggatatgtgaaaaaatactttgaagagaggaatttaactgtacacaagtcagaaataaaaaggctgacaatgggatgtacaggcataaagagaaccacaggacagcatcccggaggagtcatggtggttccaaaggacaaaagcatttacgactttactccaattcaaaggcctgcagatgcggaagataccgatgtcataactacccattttgattaccattctttgagtggaaagcttctaaaattggacatactggggcatgatgaccctactgtaataaggatgctggaggatttgacaggtgtaaatgccagaaaaatacctctggacgacaaaaagaccatgagcctttttacaagcgtagaagctttgggaatagaccctgaggaacttggcactcccgttggaacgctagggcttcctgagtttggaacaaagtttgtgagacagatgctaattgagacccgtcccacaacttttgatgagcttgtcaggataagtgggctttctcatggaacagatgtatggttaaataatgcgcaggatataataagagaagggatcgctactttaaaggaagtaattgctgcaagagacgacataatgctttacttaataagcaaaggaatggataaaaagctttcctttaagataatggaaaatgttagaaaaggaaaaggcgttacacaggaagaaattgaagagatgaaaaaacacggcgtgcccgactggtttatacagtcctgccagaagataaaatacatgttcccaaaagctcacgctgtagcctatgtgatcatggcatttagaattgcgtattttaaggtgtattatcctgaagctttctatgctacctattttactgtgagagcagatgactttaacttagacatagttttagggggcaaagagagcataaaaagggcaataaaagaaattgaagcgaagggcaacaacgctacaccaaaagagaaaaacttgttgacagtattagaggtagcacttgagatgtacttaaggggcatcaaattcacaaatgtggacctatacaggtccgatgccgagaagtttttaattacagaagaaggacttttgcctccactaaattctcttgaaggagtgggaatacaggccgcaaaggcaattgcccaggagagagaaaatggcaaatttatatccattgaagatttcaggaaccgaaccagggtaagtaaaactgttattgaaatattaaaacagtatggatgtttagaagatttgccagaatctaatcaattaagtttattttgagtgagagctatgtttgtacatcttcacgtgcatacggaatatagcttgttggatgggtcctgcaggataaaggatttgattgcaaaaactaaagagttgggaatgaaagcaatagctattacggaccacggggcaatgtatggagtaatagatttttataaggaagctgtagcccaagggataaagcctatcataggatgtgagatatacgtagcaccgaggagaatgcaggatagagaatatggaattgacgatgaaaattatcatttggtgttactggcaaaggatatgacagggtataaaaatttgatgaaaatagtgactgctgcatctttagaaggattttactataagccccgtgtggacaaagaatttctgaaaaatcacagtgaaggattaattgctttaagcgcctgccttgccggtgaggtcccttccttgatcttacggggagattatgaaaaggcgaaagaggtagccctcttttacgattccatttttggaaggggcaatttttatttagaacttcaagaccatggcattttagagcagaagaaagtgaatagagagcttgtcagaatgtctaaagaaacgggaataccgctagttgctacaaatgatgtccactatttggaaaagaaagatgcaagagctcatgaggtgttattgtgcattcaaacaggaaaaacaattgaagatgaggacaggatgcttttccctacagatgagttttaccttaaatctcctgaagaaatggaagagctttttgcatgctgtaaagaggctattgaaaataccgaaaaaattgccgagatgtgcaatattgagtttgagtttaataagactaagctgcctaaatacgacttgccagaaggagtggactcatacgagtatttgagaaatttatgctatgaaggcctttataagaggtataaaagcccaagccaggaagtcatagataggttagagtacgagctttcagtgataaagcagatgggatatgtggattattttttaatagtgtgggactttataaagtttgcaaaagacaatggaatcatgacagggccaggaagaggttctgctgccggaagtttggtcgcatatactctagggatcactaatgtagatcctataaagtacaatcttctgtttgagaggtttttaaaccctgaaagggtcagcatgcctgacatcgattcggatttttgctatgagagaaggcaagaggttatagactacgtcgtccgaaagtatggcaaagacaatgtggctcagattataacctttggtactatggcagccagagctgtgataagggatgtaggtagagctcttaactacccttatgcagaagtggacgaaatagccaagatgataccttttgaattaggcatgactattgacagagctttggagctaaatcctgagcttaaggagaggtacgaaaaggacgaaagagtaaaacagctaatagatatatcaaaagccttagaaggactccccaggcatgcttctacccatgctgcaggggtggtcatatcaaaggagcctcttgtgaactatgtgccgctgcagaaaaatgatgattctgtagtcacccagtttccaatgaccaccttggaagagcttggacttttaaaaatggattttctggggctgaggactctcactgtcataagagatacaattgaaatggtaaagaaaaacaaagggattatcatagatttggattctttaaactacgatgatccaaaagtgtatgaacttatttcaaaaggagagacagaaggagttttccagcttgaatctcctggaatgaggcagtttatgacagagcttaagcctaaaaacctagaagatataatcgcaggaatttccctttacaggccgggtcctatggaccagataccgaagtaccttgccaacagaaataatcctgaaaaaatagagtacgaacaccccattttaaagcctatattagaggtgacgtacggctctttggtgtatcaggaacaggtcatgcagattgtaagggatgtggcgggttactctcttggtagggcagacctagtaaggcgtgcaatggcgaaaaagaaaatggatgtgatggaacaagaaaggaagaactttatctacggaatagtggatgaggaaggaaatgtagtggtacctggcgctttgaggaacggccttgatgaggagacagcaaataggctttttgaccagatgttagagtttgccaactatgcttttaacaaatctcacgctgcagcttacgcagtcatagcttaccagacagcctatttgaagagatattttccagtggagtttatggcggctcttttgaatagctttgtagataatttggacaagatagctttttacgtgcaggtatgtaagaaaatggggataaaagtgctgccgcctgacatcaatgaaagcgactcctatttcactgtggtaggagacaagataaggtttgggctgagtgctgtgaagaatgtaggaattaatgtgacagaagagattgtaagggaaagagaggcgaggggaaaatttaagtctgtaatagacttttttgagaggatgcaggacagccagctcaacaaaaaggcgatagaaagcctcattaaggcgggagcttttgcatctttgggagtaaaaaggtcccagctccttcagtcttacgataagcttatagaaagcgtgaaaaaagcaaaaagcagtgcgatcgaaggacagatttctctctttgaagtgtcagaagaacataaggaaattgattttagatttcctgatgtagaagagtaccccaaaaacaggattctctcaatggaaaaagagacattggggctttatataagcgggcatccattagaagaataccttgaagatataccgaagattacaaatgtcactacattggattttaagataaatccagaggatgaaatgttcacatccaaattggaagacaatcaagaggttactatagcaggagtgatagtggctaaaaaggtgaagtttacgcgaaatagcaatataatggcttttgtcactcttgaggatatgtacggcactgtagaagtgatagtgttccctgctgtgtatgagagatattcttctctgataaaggaagacaatgctgttttgataaaaggtaaagtgagcgtaaaagaagaggaggagccaaagattttatgcgatgacataaagcttttgtcacaggtcgttgtaaagaagttgtatataaacatggaagattcttcaaagatagaagaggtaaaagaggtgcttaagaaatgcccgggcaatatgcctgtagtgttgaaggtaaacagcaaacttcttgctgcaaagagagatttatgggttaatggcagcaaagaactcataaagaagttagaggacatagtagggaaggaaaatgtgaaagtggtctga2.SEQ ID NO.2(1)序列特征a.长度3754氨基酸b.类型多肽c.链型单链d.几何结构立体(2)分子类型蛋白质(3)序列描述MKFVCDKNSLLEGVNIAIRGVSSRTTLPILQGIKITARGNVIKLSGTDLEIGIECQIPAVIEEEGETVVPARIFSDLVKKLPEGEVEVKSDSQNTVNVVSGDINFSIAGSNPEEFPEIPEVSREKSFKLPQSILKDLIKKTVFCVSEEQTRPILTGVLFEVFPNELKAVALDGFRMAIYSYKSEKSFFDEEAEKYSLVIPGDTIDEISRILEDEETEVIIYHTSNQVLFQIDNTKVISRLLEGSFINYNAVLPKDFKTEITINKDVFMESLERASLIAESKNNLVKFEIGDSFIVISSSSEKGSMSEKLEVEVKGMLLEIAFNSRYLLDALKAINEEEVNLYFINSINPLIIKPVGEKEYLYMILPVKLNMYQSLYRKYRPKSFSEVVGQDHIVRTLRNQIKMGRIGHAYLFTGTRGTGKTSVAKIFAKAVNCLNPKDGEPCNSCEVCQAINTGTTMDVLEIDAASNNSVNDVRELRESVIYSPSLTKYKVYIIDEVHMLSTGAFNALLKTLEEPPRHVIFILATTEPEKLPDTILSRCQRFDFKKIPTKQIAQNLERICQDSGIQIEQNGIRAIALYGNGSMRDAISLLEQCASYKEGLITYEDVCEILGVANEEMLFSLLDHIYEKDAVASLQQLDKILSYGIDLGNFLRSFTYMLRDMVIYKTGGDELIEILYGDQETIKAKSQKYSIGFLTNALEKFTALQREIRYAVSPVTLLELTILRLIRPEISYDMGSLIARIEELEEKINKGYVVTKEESAKTHEKDELEKKVDATKEAKKEREEIDLGRVWLEVKGILKKERMMLYTFLEKGVPHLKDGKIVVEYSEEDALLVEQLGRPENKDFIEGVVEKVVKKRIPIEFALKKSEEDLLIKQVKEFFGDGIDIEIIMNYREFVESIKKGQIAPLYLFYGEERFLLLDAVKRLKARLLVPEFEDMNYIVIERENPEEYVEAIIENCETLPFFSNYKIVVVKNEEEQLSKIGDKELKRLTDYFKNRVLGNTSLVVVVVSGEKIDSRKKLYKFMEKEAAVVEFKKLTPEEAVNYAGYFLKKHGKKAAKKDVESLVKNIGTDLYSIVNELEKVIAYSEGETLDLEEAREVLSVTLQQNVFHLVNAIGMKKEKEAYRALYALLSKGEVPLIILTMIARQIRLIAKLKSLEGKAFDKKSIASYLGIPFFAVDDIVRQSKLFTREDLYKAYKEGLRGDIALKSGTEPSFALENLIKKLGKQMVPATFLENMQIKKVRVEKKSRKLTVVVSSFSSNAQKLSEFQSFLEESFPSLKEIKIVVESPSLSTVEEVLENWEKVVLELSEEYPSSLSFLKTCDVAKEGQNRITVKAPTYAIYEMAKSSKLDFAIREFLRNRYELNLDVELIFSEEGEEIAEKIIEEDIKAIEEVIQKDEKSKKEKSRSEENRVLLGKEMKAKPISIKDVSAETDEVVIEGEIFSIDFKELKSKVLMVFDITDYTSSILVKTFLTEEKYEILKDEIDVGTFVRLRGNVIYDKYEGDLVIDLKDLELIPPKKRMDLSEEKRVELHLHTQMSTLDAVPSATEVIKRAAEWGHKAVAITDHAVVQAFPEAMEASREYGVKVIYGMEGYMVDDGIPIVTGESEASLEGEFVVFDIETTGLSNINDEIIEIGAVKIKNKKIVDTFETFVNPQIPISSFITKLTGIDESMVKDAPLIEEVLPKFLEFAKGAVLVAHNANFDVSFIKSKAKKLGLTVENTVLDTLELSRHLYQDLKNYKLDTLAEFFEVKLLHHHRAVEDAKATAEIFIKMLEKLQEIGIKSVSEINSVLMEREVDVKKLPVYHVTILVKDQKGLRNLYEIISRSNLEFFHRTPRIPKSLLVKMREGLIIGSACEQGEVFRALVSNLEEKKLEDIINFYDYLEIQPVGNNEFLIERGEVRSVEELKEINRKIYELGKKYNKLVVATGDVHFLDPWDDVYRKILMAGKGYKDADRQPPLYFRTTEEMLMEFEYLGEEAAREVVIENPNKIAEIVEDVKPIPEGTFPPVIEGAEEELRRITLEKAHEIYGDPLPPIVQERLDRELNAIINNGYAVMYVIAQKLVSKSLQDGYLVGSRGSVGSSLVATMSGITEVNPLPPHYVCPKCKHSEFVTDGSFGCGVDMPDKYCPNCGTLMKKDGFDIPFEVFMGFEGDKEPDIDLNFSGEYQPIAHRYTEELFGKGHVFRAGTIGTLADKTAYGYVKKYFEERNLTVHKSEIKRLTMGCTGIKRTTGQHPGGVMVVPKDKSIYDFTPIQRPADAEDTDVITTHFDYHSLSGKLLKLDILGHDDPTVIRMLEDLTGVNARKIPLDDKKTMSLFTSVEALGIDPEELGTPVGTLGLPEFGTKFVRQMLIETRPTTFDELVRISGLSHGTDVWLNNAQDIIREGIATLKEVIAARDDIMLYLISKGMDKKLSFKIMENVRKGKGVTQEEIEEMKKHGVPDWFIQSCQKIKYMFPKAHAVAYVIMAFRIAYFKVYYPEAFYATYFTVRADDFNLDIVLGGKESIKRAIKEIEAKGNNATPKEKNLLTVLEVALEMYLRGIKFTNVDLYRSDAEKFLITEEGLLPPLNSLEGVGIQAAKAIAQERENGKFISIEDFRNRTRVSKTVIEILKQYGCLEDLPESNQLSLFVRAMFVHLHVHTEYSLLDGSCRIKDLIAKTKELGMKAIAITDHGAMYGVIDFYKEAVAQGIKPIIGCEIYVAPRRMQDREYGIDDENYHLVLLAKDMTGYKNLMKIVTAASLEGFYYKPRVDKEFLKNHSEGLIALSACLAGEVPSLILRGDYEKAKEVALFYDSIFGRGNFYLELQDHGILEQKKVNRELVRMSKETGIPLVATNDVHYLEKKDARAHEVLLCIQTGKTIEDEDRMLFPTDEFYLKSPEEMEELFACCKEAIENTEKIAEMCNIEFEFNKTKLPKYDLPEGVDSYEYLRNLCYEGLYKRYKSPSQEVIDRLEYELSVIKQMGYVDYFLIVWDFIKFAKDNGIMTGPGRGSAAGSLVAYTLGITNVDPIKYNLLFERFLNPERVSMPDIDSDFCYERRQEVIDYVVRKYGKDNVAQIITFGTMAARAVIRDVGRALNYPYAEVDEIAKMIPFELGMTIDRALELNPELKERYEKDERVKQLIDISKALEGLPRHASTHAAGVVISKEPLVNYVPLQKNDDSVVTQFPMTTLEELGLLKMDFLGLRTLTVIRDTIEMVKKNKGIIIDLDSLNYDDPKVYELISKGETEGVFQLESPGMRQFMTELKPKNLEDIIAGISLYRPGPMDQIPKYLANRNNPEKIEYEHPILKPILEVTYGSLVYQEQVMQIVRDVAGYSLGRADLVRRAMAKKKMDVMEQERKNFIYGIVDEEGNVVVPGALRNGLDEETANRLFDQMLEFANYAFNKSHAAAYAVIAYQTAYLKRYFPVEFMAALLNSFVDNLDKIAFYVQVCKKMGIKVLPPDINESDSYFTVVGDKIRFGLSAVKNVGINVTEEIVREREARGKFKSVIDFFERMQDSQLNKKAIESLIKAGAFASLGVKRSQLLQSYDKLIESVKKAKSSAIEGQISLFEVSEEHKEIDFRFPDVEEYPKNRILSMEKETLGLYISGHPLEEYLEDIPKITNVTTLDFKINPEDEMFTSKLEDNQEVTIAGVIVAKKVKFTRNSNIMAFVTLEDMYGTVEVIVFPAVYERYSSLIKEDNAVLIKGKVSVKEEEEPKILCDDIKLLSQVVVKKLYINMEDSSKIEEVKEVLKKCPGNMPVVLKVNSKLLAAKRDLWVNGSKELIKKLEDIVGKENVKVV
权利要求
1.一种分离的DNA,其特征在于它是编码具有耐高温DNA聚合酶活性的多肽的核苷酸序列。
2.根据权利要求1所述的分离的DNA,其特征在于它的编码具有SEQ ID NO2中的氨基酸序列的多肽或所述多肽的修饰形式的核苷酸序列,该修饰形式功能上相当或与耐高温DNA聚合酶相关。
3.根据权利要求1所述的分离的DNA,其特征在于它具有SEQID NO1的多核苷酸序列以及它的突变形式,突变类型包括缺失、无义、插入、错义。
4.一种分离出的多肽,其特征在于它具有耐高温DNA聚合酶活性。
5.根据权利要求4所述的分离出的多肽,其特征在于它具有SEQ ID NO2中的氨基酸序列的多肽,或其保守性变异多肽、或其活性片段、或其活性衍生物。
6.一种载体,其特征在于它含有权利要求1中之DNA。
7.一种宿主细胞,其特征在于它是用权利要求6所述载体转化的原核细胞或真核细胞。
8.一种制备耐高温DNA聚合酶蛋白的方法,其特征在于该方法包括1)分离出编码耐高温DNA聚合酶蛋白的核苷酸序列SEQ IDNO.1;2)构建含SEQ ID NO.1核苷酸序列的表达载体;3)将步骤2)中表达载体转入宿主细胞,形成能生产耐高温DNA聚合酶蛋白的重组细胞;4)培养步骤3)中的重组细胞;5)分离、纯化得到耐高温DNA聚合酶蛋白。
全文摘要
本发明涉及编码具有活性或其功能等同变异体的分离的DNA和利用重组DNA技术以所述分离的DNA生产具有耐高温DNA聚合酶活性的多肽或其功能等同变异体。以腾冲嗜热厌氧菌全基因组测序与分析为基础,克隆分离了耐高温DNA聚合酶基因。该基因对于制备用于生产耐高温DNA聚合酶的转基因微生物或动植物,并回收获得该基因编码的酶有用。另外,本发明还提供了具有耐高温DNA聚合酶活性的多肽的氨基酸序列及功能等同体。同时,本发明还提供了制备,分离,纯化具有耐高温DNA聚合酶活性的多肽的方法。
文档编号C12N15/63GK1417338SQ0113211
公开日2003年5月14日 申请日期2001年11月6日 优先权日2001年11月6日
发明者李蔚, 汪建, 包其郁, 胡咏武, 胡松年 申请人:杭州华大基因研发中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1