专利名称:用于高效生产工业酶的启动子的制作方法
技术领域:
本发明属于分子生物学领域。具体而言,本发明涉及一类在瑞氏木霉(Trichodermareesei)中进行高效基因表达的用于生产工业酶的新型启动子。
背景技术:
随着基因重组技术的发展,人们开始利用微生物来生产各种有用的蛋白质和其他有用的物质。传统地,一般把原核生物大肠埃希氏菌(大肠杆菌)作为生产宿主,目前已用于多种物质的生产。然而,在大肠埃希氏菌中生产的蛋白质有时会在菌体中形成不溶性颗粒,极大的影响了蛋白质的产量和活性。与真核生物相比,大肠埃希氏菌中没有对蛋白质进行糖基化的机制,而糖基化对大多数蛋白质(尤其是具有药用价值的蛋白质)非常重要,非正确糖基化将降低甚至完全失去药用价值。
丝状真菌是重要的工业菌株,如黑曲霉(Aspergillus niger),米曲霉(A.oryzae),瑞氏木霉(T.reesei)和产黄青霉(Pencillium chrysogenum)等广泛应用于酶制剂,抗生素,有机酸的生产,已有数十年的历史。丝状真菌大规模工业应用的同时,人们也开始对其进行基因表达调控方面的研究。而分子生物学的发展为以丝状真菌为宿主生产同源、异源(尤其是哺乳动物)蛋白开辟了广阔的天地。
丝状真菌中的黑曲霉(A.niger),米曲霉(A.oryzae),瑞氏木霉(T.reesei),构巢曲霉(A.nidulans),粗糙脉孢菌(Neurospora crassa)等都被用来开发宿主-载体系统。其中,瑞氏木霉因具有极好的合成蛋白和分泌蛋白的能力,同时还具有真核的分泌机制和与哺乳动物系统相似的蛋白修饰性能,如高甘露糖型和N-糖基化。瑞氏木霉不仅具有适于蛋白生产的诸多优点,且对人没有毒性,在产酶条件下也不产生真菌毒素和抗生素,因此,瑞氏木霉被公认为是安全的生产菌株,比其他丝状真菌具有更多的优越性,对其发酵生产已具有成熟的技术。由于瑞氏木霉具有以上优良性能,加之比较成熟的工业化规模发酵工艺,瑞氏木霉在基因工程中已被作为宿主菌生产多种外源蛋白。
同时瑞氏木霉也是一种很好的纤维素酶生产菌株,它能够产生完整的纤维素酶并把结晶纤维素水解为葡萄糖。纤维素酶一般分为纤维二糖水解酶(CBH),内切葡萄糖苷酶(EG)和β-葡萄糖苷酶(EC3.2.1.21)。在瑞氏木霉所产生的纤维素酶系组分中,外切葡聚糖纤维二糖水解酶(CBHI)产量可达瑞氏木霉胞外分泌蛋白总量的50%,其最高产量可以达到50mg/L。目前对瑞氏木霉基因调控研究主要集中在木质纤维素降解、代谢酶类的克隆、基因表达和调控上(汪天虹等,2000)。在瑞氏木霉中cbhI为单拷贝,启动子具有很强的启动功能,在所有条件下CBHI mRNA水平是纤维素酶中最高的。CBHI mRNA数量约为CBHII的1.5倍,为EGI的3倍。CBHI启动子在瑞氏木霉中是最强的启动子,并且被用于多种异源蛋白的表达,如生产外源漆酶等。
Ilmen M和Stangl H等先后报道克隆得到瑞氏木霉外切葡聚糖纤维二糖水解酶I(CBH I)、II(CBH II)基因启动子,并对启动子功能进行了分析(Stangl H等1993;Takashima S等,1996;Ilmen M等,1996),发现在cbh1启动子上含有6个葡萄糖阻遏结合位点,其中三个主要的阻遏位点位于-700bp区域。通过对cbh1启动子序列进一步分析,此启动子-828~-639bp区域是CCAAT盒、XlnR结合位点、Ace1结合序列等转录激活因子结合位点富集区。
缺失分析是一种研究丝状真菌基因顺式转录调控区功能的非常有效的方法,用这种方法对许多丝状真菌基因的转录调控区进行了分析。Punt等(1992)用缺失方法研究了A.nidulans gpaA基因启动子区域的功能元件。通过缺失分析,可以将转录调控区的功能区域划定在一个比较小的范围内,其范围大小取决于缺失系列的密度(Adams等,1990)。
多拷贝策略是将编码基因、启动子或启动子的顺式作用元件设计成多拷贝的形式转入宿主菌,以增加目的基因拷贝数或启动子活性从而提高目的产物的产量或稳定性。Verdoes等(1993)在黑曲霉中进行的增加葡糖淀粉酶基因拷贝数的实验表明,酶表达量在一定范围内(1-20拷贝)与拷贝数成线性关系。Liu L等(2003)将黑曲霉启动子中含CCAAT的序列采用多拷贝策略,使报告基因VHb的表达大幅提高,8拷贝的表达水平是单拷贝的20倍。但在瑞氏木霉中,未见有关cbh1启动子多拷贝的报道。
发明内容
鉴于以上现状,本发明要解决的问题是提供一种能在瑞氏木霉中进行高效基因表达的用于生产工业酶的启动子。
本发明人经过悉心研究,通过对cbh1启动子上一系列顺式作用元件的改造,构建出一系列cbh1启动子PIcbh1,PIVcbh1,PVIcbh1,发现这些启动子的活性均高于现有的cbh1启动子,从而完成了本发明。
本发明所述的纤维二糖水解酶I基因启动子PIcbh1,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.5所示的DNA;(b)包含SEQ ID NO.5所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.5所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.5所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
另外,本发明还包括纤维二糖水解酶I基因启动子PIVcbh1,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.15所示的DNA;(b)包含SEQ ID NO.15所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.15所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.15所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
另外,本发明还包括纤维二糖水解酶I基因启动子PVIcbh1,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.16所示的DNA;(b)包含SEQ ID NO.16所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.16所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.16所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
本发明还提供了一种质粒,包含上述启动子所构成的基因表达单元。
其中,所述启动子PIcbh1中的基因表达单元优选质粒pC;启动子PIVcbh1中1的基因表达单元优选质粒p4C;启动子PVIcbh1中的基因表达单元优选质粒p6C。
上述pC,p4C,p6C质粒由下述方法构建用EcoR I,Pst I双酶切质粒pUC19和含有Tcbh1终止子的pTRIL质粒,连接并转化大肠杆菌DH5a,提取含有Tcbh1片段的质粒pUC19-Tcbh1(3300bp),即pT质粒;用Xba I与Xho I双酶切pT质粒与PCR扩增的β-葡糖酸酶基因即gus基因产物,连接、转化得到含有Tcbh1及gus基因的pTG质粒;PstI和Kpn I双酶切权利要求1~3之一所述启动子,并与经过同样处理的pTG质粒连接,pC质粒的核苷酸序列如SEQ ID NO.22所示,p4C质粒的核苷酸序列如SEQ ID NO.23所示,p6C质粒的核苷酸序列如SEQ ID NO.24所示。
本发明还提供了一种转化细胞,其通过向宿主细胞中导入上述的质粒而获得。
其中,上述宿主细胞优选为瑞氏木霉。
本发明所述的转化细胞在基因表达中的应用。
其中,所述的基因来自大肠杆菌,编码β-葡糖酸酶。
发明详述来自瑞氏木霉的PIcbh1,PIVcbh1,PVIcbh1启动子都是本发明构建的,下面对其进行详细说明。
(1)启动子的构建(a)解除葡萄糖阻遏作用的启动子的构建lmen M等(1996)对瑞氏木霉cbh1启动子功能区进行缺失分析发现240bp(-740~-500bp)片段影响cbh1启动子在葡萄糖培养基上的调节并抑制cbh1基因的表达。Takashima Shou等(1996)在对cbh1启动子CreI结合位点进行进一步分析时,发现真正的葡萄糖阻遏位点是位于启动子上游的-724~-684bp之间的3个结合位点。因此,本发明通过缺失-724~-684bp之间含有此区域的50bp构建解除葡萄糖阻遏作用的启动子。
本发明人根据已报道的瑞氏木霉cbh1启动子序列,设计合成两对pCR引物来进行重组pCR。
含有cbh1全长启动子的质粒pTRIL可通过市面上销售的试剂来分离,以分离得到的质粒为模板,通过重组pCR来得到解除了葡萄糖阻遏作用的启动子PIcbh1。
(b)顺式作用元件功能区多拷贝启动子的构建对启动子有关转录激活的重要功能区进行多拷贝是丝状真菌中提高蛋白表达水平的常用策略。在分析cbh1启动子过程中发现-828~-639bp区域含有CCAAT盒以及在A.niger中调节纤维素酶和半纤维素酶的XlnR结合位点、Ace2结合位点。本发明在-724~-684bp缺失的基础上对含CCAAT框、XlnR结合位点、Ace2结合位点的200bp区进行4拷贝和6拷贝。
PIcbh1启动子-805~-606bp区含有3个CCAAT位点、3个XlnR蛋白结合位点以及1个Ace2蛋白结合位点。以SEQ ID NO.1和SEQ ID NO.10所示DNA为引物,以Plcbh1为模板pCR扩增得到含有200bp的片段(SEQ ID NO.11),通过末端平滑化后再用pst I酶切后连接到Stu I-Pst I双酶切后的PIcbh1上,得到顺式作用元件功能区2拷贝的启动子。再以SEQ ID NO.12和SEQ ID NO.13所示DNA为引物、以2拷贝启动子为模板pCR扩增得到含有450bp的片段(SEQ ID NO.14),通过末端平滑化后再用Pst I酶切后得到的400bp片断,与Stu I-Pst I双酶切后的2拷贝启动子连接,转化得到4拷贝启动子,再进行同样操作得到6拷贝启动子。
通过以上方法,可以获得本发明的一系列高表达的cbh1启动子PIcbh1(碱基序列如SEQ ID NO.5所示),PIVcbh1(碱基序列如SEQ ID NO.15所示),PVIcbh1(碱基序列如SEQ ID NO.16所示)。
本发明的上述启动子可以通过上述方法获得,也可以在鉴定碱基序列后,通过化学合成获得。
本发明启动子不仅可以是上述SEQ ID NO.5、15和16所示的DNA,也可以是包含上述碱基序列号中所示碱基序列的DNA,只要其具有启动子活性,还可以是包含在上述碱基序列号所示的碱基序列中缺失、取代或添加至少1个碱基所得的碱基序列的DNA,以及与上述碱基序列号中所述的碱基序列在严紧条件下杂交、来自瑞氏木霉的DNA。
包含上述碱基序列号中所示的碱基序列的DNA和包含在上述碱基序列号所示的碱基序列中缺失、取代或添加至少1个碱基所得的碱基序列的DNA,是指包含下述碱基序列的DNA,该碱基序列通过Protein,Nucleic Acid,Enzyme,Supplemental IssueGeneAmplification pCR Technology TAKKAJ 35(17),2951-3178(1990)或HenryA.Erlich(ed.),pCR Technology(the translation edited by Ikunoshin Kato)(1990)等中记载的本领域技术人员公知的方法缺失、添加、插入和/或取代了可以进行缺失、添加、插入和/或取代的数量的碱基。
与上述碱基序列号中所示的碱基序列在严紧条件下杂交的DNA是指以包含上述序列号所示的碱基序列的DNA为探针,通过菌落杂交、斑点杂交或Southem杂交等方法获得的DNA。
本发明的DNA优选包含与上述碱基序列号所示的碱基序列具有75%或75%以上同源性的碱基序列,同源性优选为80%或80%以上,,再优选90%或90%以上,更优选95%或95%以上,进一步优选98%或98%以上。
“同源性”如下计算将待对比的两个碱基序列以最适方式排列,计数两个序列之间的配对碱基(A、T、C、G、U或I准置数,用该数除以比较碱基总数,所得结果乘以100。具体地,可以用Hitachi soft Engineering公司的DNASIS、SoftwareDevelopment公司的GENETYX或Finland CSC公司的ClustalX分析软件进行计算。
这些DNA可以通过以下方法容易地获得通过本领域技术人员公知的上述方法在上述碱基序列号所示的DNA中缺失、添加、插入和/或取代至少1个碱基,或通过根据Molecular Cloning,2nd Edition(Cold spring Harbor Laborato Press,1989)中记载的方法进行杂交来获得。
本发明中,“具有启动子活性”的启动子是指其通过后述功能分析测得的酶活性为上述碱基序列号中所示的DNA在相同条件下测定的酶活性的50%或50%以上、优选70%或70%以上、更优选80%或80%以上、进一步优选90%或90%以上、特别优选95%或95%以上的启动子。
(3)启动子功能分析新型的启动子功能分析可以通过测定由该启动子转录的mRNA或由该mRNA翻译的基因产物的量来进行。
本发明的启动子在其下游连接结构基因时,可以表达该结构基因的功能。对本发明所用的结构基因没有特殊限制,例如,可以是促红细胞生成素基因,血红蛋白基因,抗体基因等不同来源的有用蛋白的基因等,优选β-葡糖酸酶基因。
此外,本发明的启动子、其下游连接的结构基因以及终止子可以用作基因表达单元。这里的终止子可以使用适当的已知的终止子,只要其可以用于目的表达系统中。对所述的终止子没有特别的限制,如cbhI,egI等。
另外,还可以将上述表达单元插入到质粒载体中使用。本发明所用的质粒载体没有特殊限制,可以列举pUC19,pBR322等。
本发明中,可以将上述质粒转化到构成表达系统的宿主细胞中制备转化细胞,培养该转化细胞,使转化的基因得到表达。另外,也可以不导入质粒,而将包含本发明的启动子及其下游连接的结构基因的DNA直接整合到宿主染色体中。这里所选用的宿主没有特别限制,只要本发明的启动子能在其中发挥作用,但优选丝状真菌,特别优选瑞氏木霉。
可以按照公知的方法用本发明的质粒转化宿主细胞,例如可以采用氯化钙法和电转化法转化大肠杆菌,用原生质体法和电转化法转化瑞氏木霉。
用所得的转化体来分析新型启动子的功能可以将该转化体用其可以利用的碳源进行培养来进行。培养时可以用以乳糖,槐糖,纤维素等作为碳源的培养基。其中,每升培养基中含乳糖,槐糖,纤维素等碳源20克,(NH4)2SO45克,KH2PO415克,MgSO40.6克,CaCl20.6克,FeSO4·7H2O 0.005克,MnSO4·H2O 0.0016克,ZnSO4·7H2O 0.0014克,CoCl20.002克,pH5.5。本发明所用的碳源优选对纤维素酶有诱导作用的碳源,如乳糖,槐糖,纤维素等。对培养温度、培养时间没有特殊限制,只要适合于转化体的生长即可,但优选在25~35℃培养6~80小时。培养完毕的细胞通过分析培养液或细胞内的蛋白质来分析启动子的功能。由连接在启动子下游的基因表达的蛋白在细胞外时,不需要将细胞破碎,但当该蛋白留在细胞内时,则必须将细胞进行处理。进行细胞处理的方法有多种,没有特别的限制,可以用Lysing Enzymes等细胞壁溶解酶将细胞消化后,通过超声处理或冻融法等进行。另外,也可以用玻璃珠或液氮研磨等进行直接的物理性破碎。
启动子的功能分析可以通过以下方法进行,该方法能够特异性地检测出由启动子下游连接的基因表达的蛋白等的活性或量。对分析方法没有特殊限制,例如,可以用(1)中克隆的各启动子区域,构建下述基因的表达载体,该基因编码β-葡糖酸酶,此酶来自大肠杆菌E.coli,然后按Roberts等人(1989)方法来进行酶的活性的检测。
所得的酶活性值用酶活性测定中细胞破碎溶液中的总蛋白量进行标准化,可以将所得的酶活性值计为通过本发明启动子表达的酶比活性,由此可以比较启动子的活性。考虑到瑞氏木霉内源的纤维二糖水解酶活力会干扰GUS酶活的测定,所以在确定转化子GUS酶活时,以GUS比活(U/mg蛋白)测定值减去只转化潮霉素抗性质粒pAN7-1的对照菌株的GUS酶活值计为转化子GUS比活。
β-葡糖酸酶的活性检测结果显示PIcbh1的启动活性是未经改造的启动子的1.8倍;PIVcbh1的启动活性是未经改造的启动子的2.44倍;PVIcbh1的启动活性是未经改造的启动子的2.48倍。
本发明的启动子都是经过改造已经解除了葡萄糖阻遏效应的启动子,因此,其不受碳源种类的限制,只要在瑞氏木霉可以生长繁殖的条件下就可以起作用。但是优选能对瑞氏木霉cbh1启动子具有诱导作用的碳源,例如,乳糖、槐糖、CMC或纤维素等,在这种碳源的诱导下,cbh1启动子能够强表达。
氮源的选择也不受种类的限制,可以列举如硫酸铵、磷酸铵、氯化铵等铵盐,蛋白胨、酵母提取物等。作为无机盐可以列举磷酸二氢钾、磷酸氢二钾、硫酸镁和氯化钠等。
图1表示实施例4中构建的、作为本发明一个实施方案的质粒pC的限制性图谱。
图2表示实施例6中构建的、作为本发明一个实施方案的质粒p4C的限制性图谱。
图3表示实施例8中构建的、作为本发明一个实施方案的质粒p6C的限制性图谱。
具体实施例方式
下面通过实施例更具体地说明本发明,但本发明的技术范围不受这些实施例的限制。
实施例1 pTRIL质粒和pNOM102质粒DNA的提取含有cbh1启动子和终止子的pTRIL质粒(汪天虹等丝状真菌瑞氏木霉外源基因表达系统的构建,中国生物化学与分子生物学报,2003)和带有gus基因的pNOM102质粒(Roberts I N,Expression of the Escherichia coli β-glucuronidase gene inindustrial and phytopathogenic filamentous fungi[J].Curr Genet,1989)可以用公知的方法来提取,例如,碱裂解法(F.奥斯伯R.布伦特等,精编分子生物学实验指南,1998)实施例2解除葡萄糖阻遏效应的启动子PIcbh1的构建以SEQ ID NO.1和SEQ ID NO.2,SEQ ID NO.3和SEQ ID NO.4所示的DNA为引物,以实施例1所制备的pTRIL质粒为模板进行pCR扩增得到两个片段,具体而言,97℃5分钟;94℃30秒,50.4℃30秒,72℃60秒,30个循环。分别得到大小两个片段。再以SEQ ID NO.1和SEQ ID NO.4所示DNA为引物,以上述两个片段为模板进行重组pCR,具体地,97℃5分钟;94℃30秒,50℃30秒,72℃60秒,30个循环,得到了解除葡萄糖阻遏效应的启动子。将该启动子与T载体连接并转化大肠杆菌DH5a,提取质粒进行测序。
测序结果显示本发明所构建的启动子PIcbh1的序列与cbh1启动子在相应位置的碱基序列是一致的。构建得到的启动子PIcbh1的序列如SEQ ID NO.5所示。
实施例3报告基因gus的克隆以实施例1所制备的pNOM102质粒为模板,以SEQ ID NO.6和SEQ ID NO.7所示的DNA进行pCR扩增得到如SEQ ID NO.8所示的gus基因全长序列。更具体而言,97℃5分钟;94℃30秒,57.5℃30秒,72℃60秒,30个循环。在SEQ ID NO.6和SEQ ID NO.7所示的DNA序列中引入了XhoI和XbaI两个酶切位点,由此通过pCR扩增得到的gus基因也引入了XhoI和XbaI这两个酶切位点。
实施例4用解除葡萄糖阻遏效应的启动子PIcbh1构建gus表达载体为了使上述gus基因在瑞氏木霉中表达,在其5’上游连接瑞氏木霉的PIcbh1启动子,并在3’下游连接瑞氏木霉cbh1终止子(SEQ ID NO.9)。用于将启动子和终止子与报告基因连接的限制酶切位点通过pCR法制备。以SEQ ID NO.1和SEQ ID NO.4所示的DNA序列进行pCR,制备得到5’端具有Pst I和Stu I两个酶切位点,3’端具有Kpn I位点的PIcbh1启动子片段。
用EcoR I,Pst I双酶切质粒pUC19和含有Tcbh1终止子的pTRIL质粒,连接并转化大肠杆菌DH5a,提取含有Tcbh1片段的质粒pUC19-Tcbh1(3300bp),即pT质粒。用Xba I与Xho I双酶切pT质粒与pCR扩增的gus基因产物,连接、转化得到含有Tcbh1及gus基因的pTG质粒。Pst I和Kpn I双酶切PIcbh1启动子,并与经过同样处理的pTG质粒连接,由此构建如图1所示的pC质粒,其碱基序列如SEQ ID NO.22所示。
实施例5用顺式作用元件功能区4拷贝启动子PIVcbh1构建实施例2构建的PIcbh1启动子-805~-606bp区含有3个CCAAT位点、3个XlnR蛋白结合位点以及1个Ace2蛋白结合位点。以SEQ ID NO.1和SEQ ID NO.10所示的DNA为引物,以pC质粒为模板扩增得到含有如SEQ ID NO.11所示的200bp的片段。将该片段末端平滑化后,用Pst I处理,处理好的片段与Stu I-Pst I双酶切质粒pC连接,得到质粒p2C。再以p2C为模板,SEQ ID NO.12和SEQ ID NO.13所示的DNA为引物,扩增得到如SEQ ID NO.14所示的450bp的片段,先末断平滑化再用Pst I处理后与StuI/Pst I双酶切质粒p2C中的启动子连接,就得到了PIVcbh1启动子。PIVcbh1的碱基序列如SEQ ID NO.15所示。
实施例6顺式作用元件功能区4拷贝启动子PIVcbh1的构建gus表达载体将实施例5获得的PIVcbh1启动子片段用Pst I和Kpn I双酶切与经过同样处理后的质粒pTG连接,就构建到如图2所示的顺式作用元件功能区4拷贝启动子PIVcbh1的构建gus表达载体p4C质粒,其碱基序列如SEQ ID NO.23所示。
实施例7用顺式作用元件功能区6拷贝启动子PVIcbh1的构建将实施例5中扩增得到的SEQ ID NO.14所示的450bp的片段先末断平滑化再用PstI处理后与Stu I/Pst I双酶切质粒p4C中的启动子PIVcbh1连接,就得到了顺式作用元件功能区6拷贝启动子PVIcbh1。PVIcbh1的碱基序列如SEQ ID NO.16所示。
实施例8用顺式作用元件功能区6拷贝启动子PVIcbh1构建gus表达载体将实施例7获得的PVIcbh1启动子片段用Pst I和Kpn I双酶切后与经过同样处理的质粒pTG连接,就构建到如图3所示的顺式作用元件功能区6拷贝启动子PVIcbh1构建的gus表达载体p6C质粒,其碱基序列如SEQ ID NO.24所示。
实施例9瑞氏木霉转化株的分离用氯化钙法转化瑞氏木霉蛋白酶缺陷株T.reesei Rut C30。
取适量新鲜孢子接种于20ml新鲜基本培养基中,28℃培养48h左右。过滤,并将菌丝重悬于1.2M硫酸镁-10mM磷酸缓冲液(pH5.8,)中,加入10mg/ml LysingEnzymes(SIGMA),28℃温浴1.5~2h。镜检,观察原生质体的生成情况。4000rpm离心10min,弃上清,收集原生质体,用1.0M山梨醇-10mM Tris·HCl(pH7.5)洗涤2次。最后重悬于1M山梨醇-10mM CaCl2-10mM Tris·HCl(pH7.5)中,使原生质体浓度为5×106~5×107/ml。将纯化的携带潮霉素抗性的质粒pAN7-1与目的转化质粒各4~5μg与原生质体(100μl)混合,加入50μl 25%PEG6000-50mM CaCl2-10mM Tris·HCl(pH7.5),冰浴20min,然后加入1ml 25%PEG4000-50mM CaCl2-10mM Tris·HCl(pH7.5),室温放置5min。最后加入2ml 1M山梨醇-10mM CaCl2-10mM Tris·HCl(pH7.5),混匀即成转化液。将适量上述转化液涂布于再生平板(每升培养基中含葡萄糖20克,(NH4)2SO45克,KH2PO415克,MgSO40.6克,CaCl20.6克,FeSO4·7H2O 0.005克,MnSO4·H2O 0.0016克,ZnSO4·7H2O 0.0014克,CoCl20.002克,200μg/ml潮霉素B、1mol/L山梨醇、2%琼脂)上,28℃培养3~4d,挑选潮霉素抗性转化子。
通过上述制备已经获得实施例4、6和8中构建的表达载体的3种转化体。
实施例10瑞氏木霉染色体DNA的制备取约1克过滤抽干的菌丝体用液氮冷冻、研磨至细小粉末状,把粉末加入到5ml抽提缓冲液(200mM Tris-HCl(pH 8.5),250mM NaCl,25mM EDTA,2%SDS)中,37℃水浴1h(清清振荡)。然后,加入等体积的酚氯仿∶异戊醇(25 24 1)溶液至样品中,颠倒混匀,13000rpm离心10min。取上层水相至另一离心管中,加入0.5~0.6体积的冰冷异丙醇,颠倒混匀,-20℃放置10min或-70℃放置3min。12000rpm离心10min,弃上清,以70%乙醇洗涤沉淀两次,真空干燥,用适量含50μg/ml RNase的TE缓冲液完全溶解沉淀。沉淀完全溶解后即可保存于-20℃备用。
实施例11瑞氏木霉转化细胞中gus基因片段的扩增本发明中的启动子构成的基因表达单元中,所用的报告基因是β-葡糖酸酶基因(gus基因)。
按照下述方法扩增瑞氏木霉转化细胞中,本发明所构建的一系列启动子PIcbh1,PIVcbh1,PVIcbh1下游的报告基因gus基因片段。
以实施例10中制备的瑞氏木霉染色体DNA为模板,用SEQ ID NO.17和SEQ ID NO.18所示的合成DNA作为gus基因检测引物,用TaKaRa Taq聚合酶通过pCR扩增。所采用的条件如所述试剂盒中随附的说明书所述。具体地,模板DNA1μg,终浓度分别为10nM的两种引物,0.5U的Taq聚合酶,附带的缓冲液0.002ml和附带的dNTP混合液0.0004ml,加水至体积为0.02ml,然后将其进行pCR30个循环(每个循环包括94℃30秒,51.4℃30秒,72℃1分钟),由此扩增的gus基因片段的大小约为1.0kb(SEQ ID NO.19)。
将该片段与T载体连接测序,测序结果显示测序的碱基片段的序列与gus基因相应区域的碱基序列一致。
实施例12提取瑞氏木霉RNA的提取接种一定量孢子于以乳糖为碳源的培养基中,28℃培养2-3天,过滤抽干。液氮碾磨后,取100mg粉末到1.5ml离心管中,加入800μlTrizol,混匀,加入200μl氯仿/异戊醇(24∶1)或氯仿,振荡混匀,12,000rpm离心5min。在上清液中加入等体积的异丙醇,室温下放置5分钟。12,000rpm,离心5min。弃上清,用70%酒精洗涤沉淀两次,每次700μl,12,000rpm,离心2min。真空离心干燥3-5mn,或放在室温下使酒精完全挥发。用30-50μl DEpC-H2O溶解。
进行甲醛变性琼脂糖电泳,确定RNA的完整性和污染情况。
实施例13启动子基因表达单元的RT-pCR分析以实施例12中的RNA为模板,利用实施例11中gus检测引物进行RT-pCR,具体方法参照说明书(Takara RT-pCRmanual)。同时以各自转化子的总RNA为模板,以SEQ IDNO.20和SEQ ID NO.21为引物进行pCR以检测是否RNA中含有基因组DNA。
RT-pCR结果显示实施例9中所获得的3种转化体细胞的RNA都能扩出特异性的gus基因片段。
实施例14启动子功能分析按Roberts等人(1989)方法进行。将实施例9得到的转化株在乳糖培养基中培养2~3天,然后,将菌丝用大量无菌水洗涤后,经真空泵抽干,于液氮中研磨至粉状。取约0.15g菌丝研磨物于1.5ml离心管中,加1ml浸提缓冲液(50mmol/L PBS pH7.0,1mmol/L EDTA,50μmol/L PMSF)混匀,用台式离心机13,000rpm离心,取上清50μl,加dH2O 430μl,500μl 2×GUS分析缓冲液(0.2mol/L PB PH7.0,20mmol/L KCl,2mmol/LMgSO4,0.2%巯基乙醇),20μl 10mmol/L pNPG(4-nitrophenyl-β-D-glucuronide),37℃反应7小时,加2ml 1mol/L Na2CO3,于OD405测光吸收值。对照组为不经37℃反应,直接加2ml 1mol/L Na2CO3灭活的反应液。将37℃每min产生1nmol p-nitrophenol所需的酶量定义为一个酶活力单位。
蛋白测定采用Lowry等人(1951)的方法。以不同稀释度的BSA绘制蛋白含量标准曲线。
考虑到瑞氏木霉内源的纤维二糖水解酶活力会干扰GUS酶活的测定,所以在确定转化子GUS酶活时,以GUS比活(U/mg蛋白)测定值减去只转化潮霉素抗性质粒pAN7-1的对照菌株的GUS酶活值计为转化子GUS比活。
所得结果如表1所示,由该结果可知,根据本发明所构建的启动子系列是比瑞氏木霉全长cbh1启动子更强的启动子。
表1
β-葡糖酸酶的活性检测结果显示PIcbh1的启动活性是未经改造的启动子的1.8倍;PIVcbh1的启动活性是未经改造的启动子的2.44倍;PVIcbh1的启动活性是未经改造的启动子的2.48倍。
产业适应性根据本发明,可以在丝状真菌,特别是瑞氏木霉中高效地表达内源和外源基因。
序列表<110>山东大学<120>用于高效生产工业酶的启动子<141>2006-01-09<160>24<210>1<211>33<212>DNA<213>人工序列<220>
<223>双缺失启动子小片段5’引物<400>1cgcctgcaga ggcctacctg taaagccgca atg 33<210>2<211>34<212>DNA<213>人工序列<220>
<223>双缺失启动子小片段3’引物<400>2attggactga gtgaagaagc cgttggcaaa ttac34<210>3<211>20<212>DNA<213>人工序列<220>
<223>双缺失启动子大片段5’引物
<400>3cttcactcag tccaatctca 20<210>4<211>29<212>DNA<213>人工序列<220>
<223>双缺失启动子大片段3’引物<400>4cgcggtacct tgactattgg gtttctgtg 29<210>5<211>823<212>DNA<213>人工序列<220>
<223>纤维二糖水解酶I基因启动子PIcbh1<400>5ctgcagaggc ctacctgtaa agccgcaatg cagcatcact ggaaaataca aaccaatggc 60taaaagtaca taagttaatg cctaaaggag tcatatacca gcggctaata attgtacaat 120caagtggcta aacgtaccgt aatttgccaa cggcttcttc actcagtcca atctcagctg 180gtgatccccc aattgggtcg cttgtttgtt ccggtgaagt gaaagaagac agaggtaaga 240atgtctgact cggagcgttt tgcatacaac caagggcagt gatggaagac agtgaaatgt 300tgacattcaa ggagtattta gccagggatg cttgagtgta tcgtgtaagg aggtttgtct 360gccgatacga cgaatactgt atagtcactt ctgatgaagt ggtccatatt gaaatgtaag 420tcggcactga acaggcaaaa gattgagttg aaactgccta agatctcggg ccctcgggcc 480ttcggccttt gggtgtacat gtttgtgctc cgggcaaatg caaagtgtgg taggatcgaa 540cacactgctg cctttaccaa gcagctgagg gtatgtgata ggcaaatgtt caggggccac 600tgcatggttt cgaatagaaa gagaagctta gccaagaaca atagccgata aagatagcct 660cattaaacgg aatgagctag taggcaaagt cagcgaatgt gtatatataa aggttcgagg 720tccgtgcctc cctcatgctc tccccatcta ctcatcaact cagatcctcc aggagacttg 780
tacaccatct tttgaggcac agaaacccaa tagtcaaggt acc 823<210>6<211>27<212>DNA<213>人工序列<220>
<223>gus基因5’引物<400>6cgcctcgagt accccgcttg agcagac 27<210>7<211>27<212>DNA<213>人工序列<220>
<223>gus基因3’引物<400>7gcgtctagat cattgtttgc ctccctg 27<210>8<211>1836<212>DNA<213>大肠杆菌(Escherichia coli)<220>
<223>gus基因<400>8taccccgctt gagcagacat caccatggtc cgtcctgtag aaaccccaac ccgtgaaatc 60aaaaaactcg acggcctgtg ggcattcagt ctggatcgcg aaaactgtgg aattgatcag 120cgttggtggg aaagcgcgtt acaagaaagc cgggcaattg ctgtgccagg cagttttaac 180
gatcagttcg ccgatgcaga tattcgtaat tatgcgggca acgtctggta tcagcgcgaa 240gtctttatac cgaaaggttg ggcaggccag cgtatcgtgc tgcgtttcga tgcggtcact 300cattacggca aagtgtgggt caataatcag gaagtgatgg agcatcaggg cggctatacg 360ccatttgaag ccgatgtcac gccgtatgtt attgccggga aaagtgtacg tatcaccgtt 420tgtgtgaaca acgaactgaa ctggcagact atcccgccgg gaatggtgat taccgacgaa 480aacggcaaga aaaagcagtc ttacttccat gatttcttta actatgccgg aatccatcgc 540agcgtaatgc tctacaccac gccgaacacc tgggtggacg atatcaccgt ggtgacgcat 600gtcgcgcaag actgtaacca cgcgtctgtt gactggcagg tggtggccaa tggtgatgtc 660agcgttgaac tgcgtgatgc ggatcaacag gtggttgcaa ctggacaagg cactagcggg 720actttgcaag tggtgaatcc gcacctctgg caaccgggtg aaggttatct ctatgaactg 780tgcgtcacag ccaaaagcca gacagagtgt gatatctacc cgcttcgcgt cggcatccgg 840tcagtggcag tgaagggcga acagttcctg attaaccaca aaccgttcta ctttactggc 900tttggtcgtc atgaagatgc ggacttacgt ggcaaaggat tcgataacgt gctgatggtg 960cacgaccacg cattaatgga ctggattggg gccaactcct accgtacctc gcattaccct 1020tacgctgaag agatgctcga ctgggcagat gaacatggca tcgtggtgat tgatgaaact 1080gctgctgtcg gctttaacct ctctttaggc attggtttcg aagcgggcaa caagccgaaa 1140gaactgtaca gcgaagaggc agtcaacggg gaaactcagc aagcgcactt acaggcgatt 1200aaagagctga tagcgcgtga caaaaaccac ccaagcgtgg tgatgtggag tattgccaac 1260gaaccggata cccgtccgca aggtgcacgg gaatatttcg cgccactggc ggaagcaacg 1320cgtaaactcg acccgacgcg tccgatcacc tgcgtcaatg taatgttctg cgacgctcac 1380accgatacca tcagcgatct ctttgatgtg ctgtgcctga accgttatta cggatggtat 1440gtccaaagcg gcgatttgga aacggcagag aaggtactgg aaaaagaact tctggcctgg 1500caggagaaac tgcatcagcc gattatcatc accgaatacg gcgtggatac gttagccggg 1560ctgcactcaa tgtacaccga catgtggagt gaagagtatc agtgtgcatg gctggatatg 1620tatcaccgcg tctttgatcg cgtcagcgcc gtcgtcggtg aacaggtatg gaatttcgcc 1680gattttgcga cctcgcaagg catattgcgc gttggcggta acaagaaagg gatcttcact 1740cgcgaccgca aaccgaagtc ggcggctttt ctgctgcaaa aacgctggac tggcatgaac 1800ttcggtgaaa aaccgcagca gggaggcaaa caatga 1836<210>9<211>657<212>DNA<213>瑞氏木霉(Trichoderma reesei)<220>
<223>cbh1终止子<400>9
tgaaccctta ctactctcag tgcctgtaaa gctccgtggc gaaagcctga cgcaccggta 60gattcttggt gagcccgtat catgacggcg gcgggagcta catggccccg ggtgatttat 120tttttttgta tctacttctg acccttttca aatatacggt caactcatct ttcactggag 180atgcggcctg cttggtattg cgatgttgtc agcttggcaa attgtggctt tcgaaaacac 240aaaacgattc cttagtagcc atgcatttta agataacgga atagaagaaa gaggaaatta 300aaaaaaaaaa aaaaacaaac atcccgttca taacccgtag aatcgccgct cttcgtgtat 360cccagtacca cggcaaaggt atttcatgat cgttcaatgt tgatattgtt cccgccagta 420tggctccacc cccatctccg cgaatctcct cttctcgaac gcggtagtgg cgcgccaatt 480ggtaatgacc catagggaga caaacagcat aatagcaaca gtggaaatta gtggcgcaat 540aattgagaac acagtgagac catagctggc ggcctggaaa gcactgttgg agaccaactt 600gtccgttgcg aggccaactt gcattgctgt caagacgatg acaacgtagc cgaggac657<210>10<211>18<212>DNA<213>人工序列<220>
<223>顺式作用元件功能区3’引物<400>10ggaacaaaca agcgaccc 18<210>11<211>200<212>DNA<213>人工序列<220>
<223>顺式作用元件功能区<400>11acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa ccaatggcta aaagtacata 60agttaatgcc taaaggagtc atataccagc ggctaataat tgtacaatca agtggctaaa 120cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat ctcagctggt gatcccccaa 180ttgggtcgct tgtttgttcc 200
<210>12<211>16<212>DNA<213>人工序列<220>
<223>M13-R<400>12aacagctatg accatg 16<210>13<211>16<212>DNA<213>人工序列<220>
<223>顺式作用元件功能区2拷贝3’引物<400>13ctttcacttc accgga 16<210>14<211>449<212>DNA<213>人工序列<220>
<223>顺式作用元件功能区2拷贝<400>14aacagctatg accatgatta cgccctgcag aggcctacct gtaaagccgc aatgcagcat 60cactggaaaa tacaaaccaa tggctaaaag tacataagtt aatgcctaaa ggagtcatat 120accagcggct aataattgta caatcaagtg gctaaacgta ccgtaatttg ccaacggctt 180cttcactcag tccaatctca gctggtgatc ccccaattgg gtcgcttgtt tgttccacct 240gtaaagccgc aatgcagcat cactggaaaa tacaaaccaa tggctaaaag tacataagtt 300
aatgcctaaa ggagtcatat accagcggct aataattgta caatcaagtg gctaaacgta 360ccgtaatttg ccaacggctt cttcactcag tccaatctca gctggtgatc ccccaattgg 420gtcgcttgtt tgttccggtg aagtgaaag 449<210>15<211>1424<212>DNA<213>人工序列<220>
<223>纤维二糖水解酶I基因启动子PIVcbh1<400>15acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa ccaatggcta aaagtacata 60agttaatgcc taaaggagtc atataccagc ggctaataat tgtacaatca agtggctaaa 120cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat ctcagctggt gatcccccaa 180ttgggtcgct tgtttgttcc acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa 240ccaatggcta aaagtacata agttaatgcc taaaggagtc atataccagc ggctaataat 300tgtacaatca agtggctaaa cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat 360ctcagctggt gatcccccaa ttgggtcgct tgtttgttcc ggtgaagtga aagacctgta 420aagccgcaat gcagcatcac tggaaaatac aaaccaatgg ctaaaagtac ataagttaat 480gcctaaagga gtcatatacc agcggctaat aattgtacaa tcaagtggct aaacgtaccg 540taatttgcca acggcttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600gcttgtttgt tccacctgta aagccgcaat gcagcatcac tggaaaatac aaaccaatgg 660ctaaaagtac ataagttaat gcctaaagga gtcatatacc agcggctaat aattgtacaa 720tcaagtggct aaacgtaccg taatttgcca acggcttctt cactcagtcc aatctcagct 780ggtgatcccc caattgggtc gcttgtttgt tccggtgaag tgaaagaaga cagaggtaag 840aatgtctgac tcggagcgtt ttgcatacaa ccaagggcag tgatggaaga cagtgaaatg 900ttgacattca aggagtattt agccagggat gcttgagtgt atcgtgtaag gaggtttgtc 960tgccgatacg acgaatactg tatagtcact tctgatgaag tggtccatat tgaaatgtaa 1020gtcggcactg aacaggcaaa agattgagtt gaaactgcct aagatctcgg gccctcgggc 1080cttcggcctt tgggtgtaca tgtttgtgct ccgggcaaat gcaaagtgtg gtaggatcga 1140acacactgct gcctttacca agcagctgag ggtatgtgat aggcaaatgt tcaggggcca 1200ctgcatggtt tcgaatagaa agagaagctt agccaagaac aatagccgat aaagatagcc 1260tcattaaacg gaatgagcta gtaggcaaag tcagcgaatg tgtatatata aaggttcgag 1320gtccgtgcct ccctcatgct ctccccatct actcatcaac tcagatcctc caggagactt 1380gtacaccatc ttttgaggca cagaaaccca atagtcaagg tacc 1424
<210>16<211>1837<212>DNA<213>人工序列<220>
<223>纤维二糖水解酶I基因启动子PVIcbh1<400>16acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa ccaatggcta aaagtacata 60agttaatgcc taaaggagtc atataccagc ggctaataat tgtacaatca agtggctaaa 120cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat ctcagctggt gatcccccaa 180ttgggtcgct tgtttgttcc acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa 240ccaatggcta aaagtacata agttaatgcc taaaggagtc atataccagc ggctaataat 300tgtacaatca agtggctaaa cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat 360ctcagctggt gatcccccaa ttgggtcgct tgtttgttcc ggtgaagtga aagacctgta 420aagccgcaat gcagcatcac tggaaaatac aaaccaatgg ctaaaagtac ataagttaat 480gcctaaagga gtcatatacc agcggctaat aattgtacaa tcaagtggct aaacgtaccg 540taatttgcca acggcttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600gcttgtttgt tccacctgta aagccgcaat gcagcatcac tggaaaatac aaaccaatgg 660ctaaaagtac ataagttaat gcctaaagga gtcatatacc agcggctaat aattgtacaa 720tcaagtggct aaacgtaccg taatttgcca acggcttctt cactcagtcc aatctcagct 780ggtgatcccc caattgggtc gcttgtttgt tccggtgaag tgaaagacct gtaaagccgc 840aatgcagcat cactggaaaa tacaaaccaa tggctaaaag tacataagtt aatgcctaaa 900ggagtcatat accagcggct aataattgta caatcaagtg gctaaacgta ccgtaatttg 960ccaacggctt cttcactcag tccaatctca gctggtgatc ccccaattgg gtcgcttgtt 1020tgttccacct gtaaagccgc aatgcagcat cactggaaaa tacaaaccaa tggctaaaag 1080tacataagtt aatgcctaaa ggagtcatat accagcggct aataattgta caatcaagtg 1140gctaaacgta ccgtaatttg ccaacggctt cttcactcag tccaatctca gctggtgatc 1200ccccaattgg gtcgcttgtt tgttccggtg aagtgaaaga agacagaggt aagaatgtct 1260gactcggagc gttttgcata caaccaaggg cagtgatgga agacagtgaa atgttgacat 1320tcaaggagta tttagccagg gatgcttgag tgtatcgtgt aaggaggttt gtctgccgat 1380acgacgaata ctgtatagtc acttctgatg aagtggtcca tattgaaatg taagtcggca 1440ctgaacaggc aaaagattga gttgaaactg cctaagatct cgggccctcg ggccttcggc 1500ctttgggtgt acatgtttgt gctccgggca aatgcaaagt gtggtaggat cgaacacact 1560gctgccttta ccaagcagct gagggtatgt gataggcaaa tgttcagggg ccactgcatg 1620gtttcgaata gaaagagaag cttagccaag aacaatagcc gataaagata gcctcattaa 1680acggaatgag ctagtaggca aagtcagcga atgtgtatat ataaaggttc gaggtccgtg 1740
cctccctcat gctctcccca tctactcatc aactcagatc ctccaggaga cttgtacacc 1800atcttttgag gcacagaaac ccaatagtca aggtacc 1837<210>17<211>17<212>DNA<213>人工序列<220>
<223>gus基因5’的检测引物<400>17ggtccgtcct gtagaaa17<210>18<211>17<212>DNA<213>人工序列<220>
<223>gus基因3’的检测引物<400>18gcgtaagggt aatgcga17<210>19<211>999<212>DNA<213>人工序列<220>
<223>检测到的gus基因<400>19ggtccgtcct gtagaaaccc caacccgtga aatcaaaaaa ctcgacggcc tgtgggcatt 60cagtctggat cgcgaaaact gtggaattga tcagcgttgg tgggaaagcg cgttacaaga 120
aagccgggca attgctgtgc caggcagttt taacgatcag ttcgccgatg cagatattcg 180taattatgcg ggcaacgtct ggtatcagcg cgaagtcttt ataccgaaag gttgggcagg 240ccagcgtatc gtgctgcgtt tcgatgcggt cactcattac ggcaaagtgt gggtcaataa 300tcaggaagtg atggagcatc agggcggcta tacgccattt gaagccgatg tcacgccgta 360tgttattgcc gggaaaagtg tacgtatcac cgtttgtgtg aacaacgaac tgaactggca 420gactatcccg ccgggaatgg tgattaccga cgaaaacggc aagaaaaagc agtcttactt 480ccatgatttc tttaactatg ccggaatcca tcgcagcgta atgctctaca ccacgccgaa 540cacctgggtg gacgatatca ccgtggtgac gcatgtcgcg caagactgta accacgcgtc 600tgttgactgg caggtggtgg ccaatggtga tgtcagcgtt gaactgcgtg atgcggatca 660acaggtggtt gcaactggac aaggcactag cgggactttg caagtggtga atccgcacct 720ctggcaaccg ggtgaaggtt atctctatga actgtgcgtc acagccaaaa gccagacaga 780gtgtgatatc tacccgcttc gcgtcggcat ccggtcagtg gcagtgaagg gcgaacagtt 840cctgattaac cacaaaccgt tctactttac tggctttggt cgtcatgaag atgcggactt 900acgtggcaaa ggattcgata acgtgctgat ggtgcacgac cacgcattaa tggactggat 960tggggccaac tcctaccgta cctcgcatta cccttacgc999<210>20<211>18<212>DNA<213>人工序列<220>
<223>RT-pCR gus基因5’的检测引物<400>20gtgaatccgc acctctgg 18<210>21<211>18<212>DNA<213>人工序列<220>
<223>RT-pCR gus基因3’的检测引物<400>21
ggtgatgata atcggctg 18<210>22<211>5904<212>DNA<213>人工序列<220>
<223>pC质粒<400>22gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccctgcagct 240gcagaggcct acctgtaaag ccgcaatgca gcatcactgg aaaatacaaa ccaatggcta 300aaagtacata agttaatgcc taaaggagtc atataccagc ggctaataat tgtacaatca 360agtggctaaa cgtaccgtaa tttgccaacg gcttcttcac tcagtccaat ctcagctggt 420gatcccccaa ttgggtcgct tgtttgttcc ggtgaagtga aagaagacag aggtaagaat 480gtctgactcg gagcgttttg catacaacca agggcagtga tggaagacag tgaaatgttg 540acattcaagg agtatttagc cagggatgct tgagtgtatc gtgtaaggag gtttgtctgc 600cgatacgacg aatactgtat agtcacttct gatgaagtgg tccatattga aatgtaagtc 660ggcactgaac aggcaaaaga ttgagttgaa actgcctaag atctcgggcc ctcgggcctt 720cggcctttgg gtgtacatgt ttgtgctccg ggcaaatgca aagtgtggta ggatcgaaca 780cactgctgcc tttaccaagc agctgagggt atgtgatagg caaatgttca ggggccactg 840catggtttcg aatagaaaga gaagcttagc caagaacaat agccgataaa gatagcctca 900ttaaacggaa tgagctagta ggcaaagtca gcgaatgtgt atatataaag gttcgaggtc 960cgtgcctccc tcatgctctc cccatctact catcaactca gatcctccag gagacttgta 1020caccatcttt tgaggcacag aaacccaata gtcaaggtgg tacccgggag ctcctcgagt 1080accccgcttg agcagacatc accatggtcc gtcctgtaga aaccccaacc cgtgaaatca 1140aaaaactcga cggcctgtgg gcattcagtc tggatcgcga aaactgtgga attgatcagc 1200gttggtggga aagcgcgtta caagaaagcc gggcaattgc tgtgccaggc agttttaacg 1260atcagttcgc cgatgcagat attcgtaatt atgcgggcaa cgtctggtat cagcgcgaag 1320tctttatacc gaaaggttgg gcaggccagc gtatcgtgct gcgtttcgat gcggtcactc 1380attacggcaa agtgtgggtc aataatcagg aagtgatgga gcatcagggc ggctatacgc 1440catttgaagc cgatgtcacg ccgtatgtta ttgccgggaa aagtgtacgt atcaccgttt 1500gtgtgaacaa cgaactgaac tggcagacta tcccgccggg aatggtgatt accgacgaaa 1560acggcaagaa aaagcagtct tacttccatg atttctttaa ctatgccgga atccatcgca 1620
gcgtaatgct ctacaccacg ccgaacacct gggtggacga tatcaccgtg gtgacgcatg 1680tcgcgcaaga ctgtaaccac gcgtctgttg actggcaggt ggtggccaat ggtgatgtca 1740gcgttgaact gcgtgatgcg gatcaacagg tggttgcaac tggacaaggc actagcggga 1800ctttgcaagt ggtgaatccg cacctctggc aaccgggtga aggttatctc tatgaactgt 1860gcgtcacagc caaaagccag acagagtgtg atatctaccc gcttcgcgtc ggcatccggt 1920cagtggcagt gaagggcgaa cagttcctga ttaaccacaa accgttctac tttactggct 1980ttggtcgtca tgaagatgcg gacttacgtg gcaaaggatt cgataacgtg ctgatggtgc 2040acgaccacgc attaatggac tggattgggg ccaactccta ccgtacctcg cattaccctt 2100acgctgaaga gatgctcgac tgggcagatg aacatggcat cgtggtgatt gatgaaactg 2160ctgctgtcgg ctttaacctc tctttaggca ttggtttcga agcgggcaac aagccgaaag 2220aactgtacag cgaagaggca gtcaacgggg aaactcagca agcgcactta caggcgatta 2280aagagctgat agcgcgtgac aaaaaccacc caagcgtggt gatgtggagt attgccaacg 2340aaccggatac ccgtccgcaa ggtgcacggg aatatttcgc gccactggcg gaagcaacgc 2400gtaaactcga cccgacgcgt ccgatcacct gcgtcaatgt aatgttctgc gacgctcaca 2460ccgataccat cagcgatctc tttgatgtgc tgtgcctgaa ccgttattac ggatggtatg 2520tccaaagcgg cgatttggaa acggcagaga aggtactgga aaaagaactt ctggcctggc 2580aggagaaact gcatcagccg attatcatca ccgaatacgg cgtggatacg ttagccgggc 2640tgcactcaat gtacaccgac atgtggagtg aagagtatca gtgtgcatgg ctggatatgt 2700atcaccgcgt ctttgatcgc gtcagcgccg tcgtcggtga acaggtatgg aatttcgccg 2760attttgcgac ctcgcaaggc atattgcgcg ttggcggtaa caagaaaggg atcttcactc 2820gcgaccgcaa accgaagtcg gcggcttttc tgctgcaaaa acgctggact ggcatgaact 2880tcggtgaaaa accgcagcag ggaggcaaac aatgatctag aggatccagg tcaccttctc 2940caacatcaag ttcggaccca ttggcagcac cggcaaccct agcggcggca accctcccgg 3000cggaaaccgt ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg 3060acctacccag tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg 3120cgccagcggc acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaaagctc 3180cgtgcgaaag cctgacgcac cggtagattc ttggtgagcc cgtatcatga cggcggcggg 3240agctacatgg ccccgggtga tttatttttt ttgtatctac ttctgaccct tttcaaatat 3300acggtcaact catctttcac tggagatgcg gcctgcttgg tattgcgatg ttgtcagctt 3360ggcaaattgt ggctttcgaa aacacaaaac gattccttag tagccatgca ttttaagata 3420acggaataga agaaagagga aattaaaaaa aaaaaaaaaa caaacatccc gttcataacc 3480cgtagaatcg ccgctcttcg tggaattcct ggccgtcgtt ttacaacgtc gtgactggga 3540aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg 3600taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga 3660atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg 3720gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc 3780aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc 3840tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc 3900gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt 3960
ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 4020tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 4080ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 4140ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 4200tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 4260gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 4320gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 4380acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 4440tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 4501caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 4560gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 4620cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 4680tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 4740agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 4800tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 4860ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 4920acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 4980ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 5040gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 5100gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 5160ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 5220gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 5280tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 5340cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 5400cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 5460ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 5520tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 5580cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 5640ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 5700aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 5760ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 5820tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 5880gtcagtgagc gaggaagcgg aaga5904<210>23<211>6508<212>DNA<213>人工序列
<220>
<223>p4C质粒<400>23gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccctgcagac 240ctgtaaagcc gcaatgcagc atcactggaa aatacaaacc aatggctaaa agtacataag 300ttaatgccta aaggagtcat ataccagcgg ctaataattg tacaatcaag tggctaaacg 360taccgtaatt tgccaacggc ttcttcactc agtccaatct cagctggtga tcccccaatt 420gggtcgcttg tttgttccac ctgtaaagcc gcaatgcagc atcactggaa aatacaaacc 480aatggctaaa agtacataag ttaatgccta aaggagtcat ataccagcgg ctaataattg 540tacaatcaag tggctaaacg taccgtaatt tgccaacggc ttcttcactc agtccaatct 600cagctggtga tcccccaatt gggtcgcttg tttgttccgg tgaagtgaaa gacctgtaaa 660gccgcaatgc agcatcactg gaaaatacaa accaatggct aaaagtacat aagttaatgc 720ctaaaggagt catataccag cggctaataa ttgtacaatc aagtggctaa acgtaccgta 780atttgccaac ggcttcttca ctcagtccaa tctcagctgg tgatccccca attgggtcgc 840ttgtttgttc cacctgtaaa gccgcaatgc agcatcactg gaaaatacaa accaatggct 900aaaagtacat aagttaatgc ctaaaggagt catataccag cggctaataa ttgtacaatc 960aagtggctaa acgtaccgta atttgccaac ggcttcttca ctcagtccaa tctcagctgg 1020tgatccccca attgggtcgc ttgtttgttc cggtgaagtg aaagaagaca gaggtaagaa 1080tgtctgactc ggagcgtttt gcatacaacc aagggcagtg atggaagaca gtgaaatgtt 1140gacattcaag gagtatttag ccagggatgc ttgagtgtat cgtgtaagga ggtttgtctg 1200ccgatacgac gaatactgta tagtcacttc tgatgaagtg gtccatattg aaatgtaagt 1260cggcactgaa caggcaaaag attgagttga aactgcctaa gatctcgggc cctcgggcct 1320tcggcctttg ggtgtacatg tttgtgctcc gggcaaatgc aaagtgtggt aggatcgaac 1380acactgctgc ctttaccaag cagctgaggg tatgtgatag gcaaatgttc aggggccact 1440gcatggtttc gaatagaaag agaagcttag ccaagaacaa tagccgataa agatagcctc 1500attaaacgga atgagctagt aggcaaagtc agcgaatgtg tatatataaa ggttcgaggt 1560ccgtgcctcc ctcatgctct ccccatctac tcatcaactc agatcctcca ggagacttgt 1620acaccatctt ttgaggcaca gaaacccaat agtcaaggta ccggtacccg ggagctcctc 1680gagtaccccg cttgagcaga catcaccatg gtccgtcctg tagaaacccc aacccgtgaa 1740atcaaaaaac tcgacggcct gtgggcattc agtctggatc gcgaaaactg tggaattgat 1800cagcgttggt gggaaagcgc gttacaagaa agccgggcaa ttgctgtgcc aggcagtttt 1860aacgatcagt tcgccgatgc agatattcgt aattatgcgg gcaacgtctg gtatcagcgc 1920gaagtcttta taccgaaagg ttgggcaggc cagcgtatcg tgctgcgttt cgatgcggtc 1980actcattacg gcaaagtgtg ggtcaataat caggaagtga tggagcatca gggcggctat 2040
acgccatttg aagccgatgt cacgccgtat gttattgccg ggaaaagtgt acgtatcacc 2100gtttgtgtga acaacgaact gaactggcag actatcccgc cgggaatggt gattaccgac 2160gaaaacggca agaaaaagca gtcttacttc catgatttct ttaactatgc cggaatccat 2220cgcagcgtaa tgctctacac cacgccgaac acctgggtgg acgatatcac cgtggtgacg 2280catgtcgcgc aagactgtaa ccacgcgtct gttgactggc aggtggtggc caatggtgat 2340gtcagcgttg aactgcgtga tgcggatcaa caggtggttg caactggaca aggcactagc 2400gggactttgc aagtggtgaa tccgcacctc tggcaaccgg gtgaaggtta tctctatgaa 2460ctgtgcgtca cagccaaaag ccagacagag tgtgatatct acccgcttcg cgtcggcatc 2520cggtcagtgg cagtgaaggg cgaacagttc ctgattaacc acaaaccgtt ctactttact 2580ggctttggtc gtcatgaaga tgcggactta cgtggcaaag gattcgataa cgtgctgatg 2640gtgcacgacc acgcattaat ggactggatt ggggccaact cctaccgtac ctcgcattac 2700ccttacgctg aagagatgct cgactgggca gatgaacatg gcatcgtggt gattgatgaa 2760actgctgctg tcggctttaa cctctcttta ggcattggtt tcgaagcggg caacaagccg 2820aaagaactgt acagcgaaga ggcagtcaac ggggaaactc agcaagcgca cttacaggcg 2880attaaagagc tgatagcgcg tgacaaaaac cacccaagcg tggtgatgtg gagtattgcc 2940aacgaaccgg atacccgtcc gcaaggtgca cgggaatatt tcgcgccact ggcggaagca 3000acgcgtaaac tcgacccgac gcgtccgatc acctgcgtca atgtaatgtt ctgcgacgct 3060cacaccgata ccatcagcga tctctttgat gtgctgtgcc tgaaccgtta ttacggatgg 3120tatgtccaaa gcggcgattt ggaaacggca gagaaggtac tggaaaaaga acttctggcc 3180tggcaggaga aactgcatca gccgattatc atcaccgaat acggcgtgga tacgttagcc 3240gggctgcact caatgtacac cgacatgtgg agtgaagagt atcagtgtgc atggctggat 3300atgtatcacc gcgtctttga tcgcgtcagc gccgtcgtcg gtgaacaggt atggaatttc 3360gccgattttg cgacctcgca aggcatattg cgcgttggcg gtaacaagaa agggatcttc 3420actcgcgacc gcaaaccgaa gtcggcggct tttctgctgc aaaaacgctg gactggcatg 3480aacttcggtg aaaaaccgca gcagggaggc aaacaatgat ctagaggatc caggtcacct 3540tctccaacat caagttcgga cccattggca gcaccggcaa ccctagcggc ggcaaccctc 3600ccggcggaaa ccgtggcacc accaccaccc gccgcccagc cactaccact ggaagctctc 3660ccggacctac ccagtctcac tacggccagt gcggcggtat tggctacagc ggccccacgg 3720tctgcgccag cggcacaact tgccaggtcc tgaaccctta ctactctcag tgcctgtaaa 3780gctccgtgcg aaagcctgac gcaccggtag attcttggtg agcccgtatc atgacggcgg 3840cgggagctac atggccccgg gtgatttatt ttttttgtat ctacttctga cccttttcaa 3900atatacggtc aactcatctt tcactggaga tgcggcctgc ttggtattgc gatgttgtca 3960gcttggcaaa ttgtggcttt cgaaaacaca aaacgattcc ttagtagcca tgcattttaa 4020gataacggaa tagaagaaag aggaaattaa aaaaaaaaaa aaaacaaaca tcccgttcat 4080aacccgtaga atcgccgctc ttcgtggaat tcctggccgt cgttttacaa cgtcgtgact 4140gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 4200ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 4260gcgaatggcg cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca 4320tatggtgcac tctcagtaca atctgctctg atgccgcata gttaagccag ccccgacacc 4380
cgccaacacc cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac 4440aagctgtgac cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac 4500gcgcgagacg aaagggcctc gtgatacgcc tatttttata ggttaatgtc atgataataa 4560tggtttctta gacgtcaggt ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt 4620tatttttcta aatacattca aatatgtatc cgctcatgag acaataaccc tgataaatgc 4680ttcaataata ttgaaaaagg aagagtatga gtattcaaca tttccgtgtc gcccttattc 4740ccttttttgc ggcattttgc cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa 4800aagatgctga agatcagttg ggtgcacgag tgggttacat cgaactggat ctcaacagcg 4860gtaagatcct tgagagtttt cgccccgaag aacgttttcc aatgatgagc acttttaaag 4920ttctgctatg tggcgcggta ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc 4980gcatacacta ttctcagaat gacttggttg agtactcacc agtcacagaa aagcatctta 5040cggatggcat gacagtaaga gaattatgca gtgctgccat aaccatgagt gataacactg 5100cggccaactt acttctgaca acgatcggag gaccgaagga gctaaccgct tttttgcaca 5160acatggggga tcatgtaact cgccttgatc gttgggaacc ggagctgaat gaagccatac 5220caaacgacga gcgtgacacc acgatgcctg tagcaatggc aacaacgttg cgcaaactat 5280taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 5340ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 5400aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 5460agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 5520atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 5580tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 5640tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 5700gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 5760taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 5820aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 5880ctgttcttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 5940catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 6000ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 6060ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 6120agcgtgagct atgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 6180taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 6240atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 6300cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 6360ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata 6420accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca 6480gcgagtcagt gagcgaggaa gcggaaga6508
<210>24<211>6921<212>DNA<213>人工序列<220>
<223>p6C质粒<400>24gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccctgcagac 240ctgtaaagcc gcaatgcagc atcactggaa aatacaaacc aatggctaaa agtacataag 300ttaatgccta aaggagtcat ataccagcgg ctaataattg tacaatcaag tggctaaacg 360taccgtaatt tgccaacggc ttcttcactc agtccaatct cagctggtga tcccccaatt 420gggtcgcttg tttgttccac ctgtaaagcc gcaatgcagc atcactggaa aatacaaacc 480aatggctaaa agtacataag ttaatgccta aaggagtcat ataccagcgg ctaataattg 540tacaatcaag tggctaaacg taccgtaatt tgccaacggc ttcttcactc agtccaatct 600cagctggtga tcccccaatt gggtcgcttg tttgttccgg tgaagtgaaa gacctgtaaa 660gccgcaatgc agcatcactg gaaaatacaa accaatggct aaaagtacat aagttaatgc 720ctaaaggagt catataccag cggctaataa ttgtacaatc aagtggctaa acgtaccgta 780atttgccaac ggcttcttca ctcagtccaa tctcagctgg tgatccccca attgggtcgc 840ttgtttgttc cacctgtaaa gccgcaatgc agcatcactg gaaaatacaa accaatggct 900aaaagtacat aagttaatgc ctaaaggagt catataccag cggctaataa ttgtacaatc 960aagtggctaa acgtaccgta atttgccaac ggcttcttca ctcagtccaa tctcagctgg 1020tgatccccca attgggtcgc ttgtttgttc cggtgaagtg aaagacctgt aaagccgcaa 1080tgcagcatca ctggaaaata caaaccaatg gctaaaagta cataagttaa tgcctaaagg 1140agtcatatac cagcggctaa taattgtaca atcaagtggc taaacgtacc gtaatttgcc 1200aacggcttct tcactcagtc caatctcagc tggtgatccc ccaattgggt cgcttgtttg 1260ttccacctgt aaagccgcaa tgcagcatca ctggaaaata caaaccaatg gctaaaagta 1320cataagttaa tgcctaaagg agtcatatac cagcggctaa taattgtaca atcaagtggc 1380taaacgtacc gtaatttgcc aacggcttct tcactcagtc caatctcagc tggtgatccc 1440ccaattgggt cgcttgtttg ttccggtgaa gtgaaagaag acagaggtaa gaatgtctga 1500ctcggagcgt tttgcataca accaagggca gtgatggaag acagtgaaat gttgacattc 1560aaggagtatt tagccaggga tgcttgagtg tatcgtgtaa ggaggtttgt ctgccgatac 1620gacgaatact gtatagtcac ttctgatgaa gtggtccata ttgaaatgta agtcggcact 1680gaacaggcaa aagattgagt tgaaactgcc taagatctcg ggccctcggg ccttcggcct 1740ttgggtgtac atgtttgtgc tccgggcaaa tgcaaagtgt ggtaggatcg aacacactgc 1800
tgcctttacc aagcagctga gggtatgtga taggcaaatg ttcaggggcc actgcatggt 1860ttcgaataga aagagaagct tagccaagaa caatagccga taaagatagc ctcattaaac 1920ggaatgagct agtaggcaaa gtcagcgaat gtgtatatat aaaggttcga ggtccgtgcc 1980tccctcatgc tctccccatc tactcatcaa ctcagatcct ccaggagact tgtacaccat 2040cttttgaggc acagaaaccc aatagtcaag gtaccggtac ccgggagctc ctcgagtacc 2100ccgcttgagc agacatcacc atggtccgtc ctgtagaaac cccaacccgt gaaatcaaaa 2160aactcgacgg cctgtgggca ttcagtctgg atcgcgaaaa ctgtggaatt gatcagcgtt 2220ggtgggaaag cgcgttacaa gaaagccggg caattgctgt gccaggcagt tttaacgatc 2280agttcgccga tgcagatatt cgtaattatg cgggcaacgt ctggtatcag cgcgaagtct 2340ttataccgaa aggttgggca ggccagcgta tcgtgctgcg tttcgatgcg gtcactcatt 2400acggcaaagt gtgggtcaat aatcaggaag tgatggagca tcagggcggc tatacgccat 2460ttgaagccga tgtcacgccg tatgttattg ccgggaaaag tgtacgtatc accgtttgtg 2520tgaacaacga actgaactgg cagactatcc cgccgggaat ggtgattacc gacgaaaacg 2580gcaagaaaaa gcagtcttac ttccatgatt tctttaacta tgccggaatc catcgcagcg 2640taatgctcta caccacgccg aacacctggg tggacgatat caccgtggtg acgcatgtcg 2700cgcaagactg taaccacgcg tctgttgact ggcaggtggt ggccaatggt gatgtcagcg 2760ttgaactgcg tgatgcggat caacaggtgg ttgcaactgg acaaggcact agcgggactt 2820tgcaagtggt gaatccgcac ctctggcaac cgggtgaagg ttatctctat gaactgtgcg 2880tcacagccaa aagccagaca gagtgtgata tctacccgct tcgcgtcggc atccggtcag 2940tggcagtgaa gggcgaacag ttcctgatta accacaaacc gttctacttt actggctttg 3000gtcgtcatga agatgcggac ttacgtggca aaggattcga taacgtgctg atggtgcacg 3060accacgcatt aatggactgg attggggcca actcctaccg tacctcgcat tacccttacg 3120ctgaagagat gctcgactgg gcagatgaac atggcatcgt ggtgattgat gaaactgctg 3180ctgtcggctt taacctctct ttaggcattg gtttcgaagc gggcaacaag ccgaaagaac 3240tgtacagcga agaggcagtc aacggggaaa ctcagcaagc gcacttacag gcgattaaag 3300agctgatagc gcgtgacaaa aaccacccaa gcgtggtgat gtggagtatt gccaacgaac 3360cggatacccg tccgcaaggt gcacgggaat atttcgcgcc actggcggaa gcaacgcgta 3420aactcgaccc gacgcgtccg atcacctgcg tcaatgtaat gttctgcgac gctcacaccg 3480ataccatcag cgatctcttt gatgtgctgt gcctgaaccg ttattacgga tggtatgtcc 3540aaagcggcga tttggaaacg gcagagaagg tactggaaaa agaacttctg gcctggcagg 3600agaaactgca tcagccgatt atcatcaccg aatacggcgt ggatacgtta gccgggctgc 3660actcaatgta caccgacatg tggagtgaag agtatcagtg tgcatggctg gatatgtatc 3720accgcgtctt tgatcgcgtc agcgccgtcg tcggtgaaca ggtatggaat ttcgccgatt 3780ttgcgacctc gcaaggcata ttgcgcgttg gcggtaacaa gaaagggatc ttcactcgcg 3840accgcaaacc gaagtcggcg gcttttctgc tgcaaaaacg ctggactggc atgaacttcg 3900gtgaaaaacc gcagcaggga ggcaaacaat gatctagagg atccaggtca ccttctccaa 3960catcaagttc ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg 4020aaaccgtggc accaccacca cccgccgccc agccactacc actggaagct ctcccggacc 4080tacccagtct cactacggcc agtgcggcgg tattggctac agcggcccca cggtctgcgc 4140
cagcggcaca acttgccagg tcctgaaccc ttactactct cagtgcctgt aaagctccgt 4200gcgaaagcct gacgcaccgg tagattcttg gtgagcccgt atcatgacgg cggcgggagc 4260tacatggccc cgggtgattt attttttttg tatctacttc tgaccctttt caaatatacg 4320gtcaactcat ctttcactgg agatgcggcc tgcttggtat tgcgatgttg tcagcttggc 4380aaattgtggc tttcgaaaac acaaaacgat tccttagtag ccatgcattt taagataacg 4440gaatagaaga aagaggaaat taaaaaaaaa aaaaaaacaa acatcccgtt cataacccgt 4500agaatcgccg ctcttcgtgg aattcctggc cgtcgtttta caacgtcgtg actgggaaaa 4560ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa 4620tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg 4680gcgcctgatg cggtattttc tccttacgca tctgtgcggt atttcacacc gcatatggtg 4740cactctcagt acaatctgct ctgatgccgc atagttaagc cagccccgac acccgccaac 4800acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt 4860gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag 4920acgaaagggc ctcgtgatac gcctattttt ataggttaat gtcatgataa taatggtttc 4980ttagacgtca ggtggcactt ttcggggaaa tgtgcgcgga acccctattt gtttattttt 5040ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa tgcttcaata 5100atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta ttcccttttt 5160tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag taaaagatgc 5220tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca gcggtaagat 5280ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta aagttctgct 5340atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc gccgcataca 5400ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc ttacggatgg 5460catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca ctgcggccaa 5520cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc acaacatggg 5580ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca taccaaacga 5640cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac tattaactgg 5700cgaactactt actctagctt cccggcaaca attaatagac tggatggagg cggataaagt 5760tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg ataaatctgg 5820agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg gtaagccctc 5880ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac gaaatagaca 5940gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc aagtttactc 6000atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct aggtgaagat 6060cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc 6120agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 6180ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 6240accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct 6300tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 6360cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 6420gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 6480
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 6540gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 6600cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 6660tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 6720ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 6780ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat 6840taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc 6900agtgagcgag gaagcggaag a 692权利要求
1.纤维二糖水解酶I基因启动子PIcbhl,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.5所示的DNA;(b)包含SEQ ID NO.5所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.5所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.5所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
2.纤维二糖水解酶I基因启动子PIVcbhl,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.15所示的DNA;(b)包含SEQ ID NO.15所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.15所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.15所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
3.纤维二糖水解酶I基因启动子PVIcbhl,其包含下述(a)~(d)中任意一项的DNA(a)SEQ ID NO.16所示的DNA;(b)包含SEQ ID NO.16所示的碱基序列,并且具有启动子活性的DNA;(c)包含在SEQ ID NO.16所示的碱基序列中缺失,取代或添加至少1个碱基所得的碱基序列、并且具有启动子活性的DNA;(d)与SEQ ID NO.16所示的碱基序列在严紧条件下杂交,并且具有启动子活性、来自瑞氏木霉的DNA。
4.一种质粒,包含权利要求1~3之一所述启动子所构成的基因表达单元。
5.如权利要求4所述的质粒,其特征是启动子PIcbhl中的基因表达单元是质粒pC;启动子PIVcbhl中1的基因表达单元是质粒p4C;启动子PVIcbhl中的基因表达单元是质粒p6C。
6.如权利要求5所述的质粒,其特征是所述pC,p4C,p6C质粒由下述方法构建用EcoR I,Pst I双酶切质粒pUC19和含有Tcbhl终止子的pTRIL质粒,连接并转化大肠杆菌DH5a,提取含有Tcbhl片段的质粒pUC19-Tcbhl,即pT质粒;用Xba I与Xho I双酶切pT质粒与PCR扩增的β-葡糖酸酶基因即gus基因产物,连接、转化得到含有Tcbhl及gus基因的pTG质粒;Pst I和Kpn I双酶切权利要求1~3之一所述启动子,并与经过同样处理的pTG质粒连接,pC质粒的碱基序列如SEQ ID NO.22所示,p4C质粒的碱基序列如SEQ ID NO.23所示,p6C质粒的碱基序列如SEQ ID NO.24所示。
7.一种转化细胞,其通过向宿主细胞中导入权利要求5所述的质粒而获得。
8.如权利要求7所述的转化细胞,其中所述宿主细胞为瑞氏木霉。
9.权利要求7或8中所述的转化细胞在基因表达中的应用。
10.如权利要求9所述的应用,其中所述的基因来自大肠杆菌,编码β-葡糖酸酶。
全文摘要
本发明公开了一类在瑞氏木霉(Trichodermareesei)中用于高效生产工业酶的启动子。本发明利用重组PCR缺失瑞氏木霉外切葡聚糖纤维二糖水解酶I基因启动子上的葡萄糖阻遏位点,并对含有CCAAT盒、Ace2结合位点、XlnR结合位点等转录激活因子结合基序的功能区域采用多拷贝策略进行了改造,得到一系列高启动活性的启动子,能够高效表达内源和外源蛋白,生产工业酶。
文档编号C12N15/19GK1831131SQ20061004218
公开日2006年9月13日 申请日期2006年1月13日 优先权日2006年1月13日
发明者汪天虹, 刘倜 申请人:山东大学