真菌表达的异源基因中隐蔽剪接位点的修饰方法

文档序号：451255阅读：583来源：国知局

专利名称：真菌表达的异源基因中隐蔽剪接位点的修饰方法
背景技术：
发明领域本发明涉及用于获得包含编码异源蛋白质的核酸序列的重组真菌宿主细胞的方法，其中在核酸序列中至少有一个隐蔽剪接位点被修饰。本发明也涉及具有一个修饰的隐蔽剪接位点的分离的核酸序列和包含所说的核酸序列的核酸构建体，载体，以及重组宿主细胞。本发明还涉及用于重组制备由所说的核酸序列编码的多肽的方法。
相关技术的描述真核基因被间插序列(内含子)间断，所说的内含子必须在前体转录物中经过修饰以产生功能mRNA。内含子消除过程被称为前-mRNA剪接。通常，内含子的分支点序列对通过形成套索结构的内含子剪接来说是必要的。剪接信号直接位于内含子剪接位点的界线处。内含子剪接位点的界线通常分别在5’和3’端有共有内含子序列GT和AG。目前没有报导除AG之外的3’剪接位点，但报导了5’GT剪接位点的一些例外情况。例如，有先例其中在5’界线处CT或GC取代了GT。在GT后的极为优选的核苷酸碱基是ANGT，其中N是A,C,G，或T(在酵母种类中主要是A或T)，但是在CT剪接位点前面没有明显优选的任何特殊核苷酸。在3’剪接位点AG前面主要是嘧啶核苷酸碱基(Py)，即C或T。
间断真菌基因的内含子数量的范围为一个至十二个或更多内含子(Rymond和Rosbash,1992,E.W.Jones,J.R.Pringle，以及J.R.Broach，编者，酵母酵母属的分子和细胞生物学，第143-192页，冷泉港实验室出版社，Plainview，纽约；Gurr等，1987,Kinghorn,J.R.(编者)，真核微生物中的基因结构，第93-139页，LRL出版社，牛津大学)。它们可分布于整个基因中或位于基因的5’或3’端。在酿酒酵母中内含子主要位于基因的5’端。一般地内含子长度不到1kb，并且通常在酵母中长度不到400bp，在丝状真菌中长度不到100bp。
酿酒酵母内含子分支点序列5’-TACTAAC-3’很少确切地出现在丝状真菌内含子中(Gurr等，1987，如前)。在丝状真菌内含子的相同位点观察到密切或松散类似TACTAAC的序列段和一般的共有序列NRCTRAC，其中N是A,C,G，或T，并且R是A或G。例如，第四个位置T在粗糙脉孢菌和黑曲霉两者推断的共有序列中是不变的。此外，核苷酸G,A，和C在第3,6和7位置分别超过80％，虽然黑曲霉的第7位置柔性较大仅仅为65％。然而，第1,2,5，和8位置在粗糙脉孢菌和黑曲霉中严格程度均低得多。其它丝状真菌在其内含子的等同位置有类似的分支点伸展，但是取样太小不能辩明任何肯定趋向。
在真菌宿主菌株中编码多肽的基因的异源表达可能在宿主菌株中导致错误地将基因编码序列内的区域当作间插序列或内含子。例如，现已发现在酿酒酵母中丝状真菌的具内含子的基因被错误地剪接(Gurr等，1987,Kinghorn,J.R.(编者)，真核微生物中的基因结构，第93-139页，LRL出版社，牛津大学)。由于亲本菌株(从中获得所说的基因)不把该区作为内含子，所以称这种内含子为隐蔽内含子。这种不恰当的识别可导致前体mRNA分子的异常剪接，这种异常剪接导致不产生生物活性多肽或产生带有变异生物活性的几群多肽产物。
本发明的目的是提供用于除去在基因编码序列内的隐蔽剪接位点以阻止真菌宿主细胞异源表达的前体mRNA不适宜剪接的方法。
发明概述本发明涉及用于获得重组真菌宿主细胞的方法，该方法包括将编码异源多肽的核酸序列导入真菌宿主细胞内，其中在核酸序列中至少有一个隐蔽剪接位点被修饰。在一个实施方案中，通过用非-共有序列取代核酸内的至少一个隐蔽共有序列修饰隐蔽剪接位点。在另一个实施方案中，通过用第二区(其具有在约40％到约70％范围内的G+C百分含量)取代包含至少一个隐蔽内含子或其部分的第一区来修饰隐蔽剪接位点。在另一个优选的实施方案中，通过用非-共有序列取代隐蔽共有序列和通过用第二区(其具有在约40％到约70％范围内的G+C百分含量)取代包含隐蔽内含子或其部分的第一区来修饰隐蔽剪接位点。
本发明也涉及具有至少一个隐蔽剪接位点的核酸序列和包含所说的核酸序列的核酸构建体，载体，以及宿主细胞。本发明还涉及用于重组制备由所说的核酸序列编码的多肽的方法。
定义＂内含子＂这里定义为非翻译间插核酸序列，其间隔开基因的编码序列，并从原初mRNA转录物中被剪切掉。
＂外显子＂这里定义为转录基因的片段，且其被翻译成多肽。
＂原初mRNA转录物＂这里定义为通过转录产生的基因前体mRNA产物。
＂RNA剪接＂这里定义为由原初mRNA转录物所转录的内含子序列的切除，并接着连接余下的外显子以形成mRNA产物。
＂隐蔽内含子＂这里定义为编码序列的区，其被错误地识别为从原初mRNA转录物中被切除的内含子。隐蔽内含子优选的有10-1500个核苷酸，较优选的20-1000个核苷酸，更优选的30-300个核苷酸，最优选的30-100个核苷酸。
＂共有序列＂这里定义为通常位于5’或3’外显子-内含子界线处含有内含子剪接位点的核酸序列。
＂隐蔽剪接位点＂在这里定义为位于隐蔽内含子的5’或3’界线(这里发生异常剪接)处的位点。
＂隐蔽共有序列＂这里定义为一般地位于隐蔽内含子(其含有隐蔽剪接位点)的5’或3’界线处的核酸序列。隐蔽共有序列优选的不超过10个核苷酸，较优选的不超过6个核苷酸，更优选的3个核苷酸，最优选的2个核苷酸。
＂异常剪接＂这里定义为由原初mRNA转录物所转录的序列区域不适宜的切除，其中所切除的区段被错误地当作间插核酸序列。
＂氨基酸摆动位置＂这里定义为可被另一个核苷酸取代(其原因是真菌宿主细胞的遗传密码的简并性)的核苷酸残基。
＂重组真菌宿主细胞＂这里定义为包含异源核酸序列的真菌宿主细胞。
附图简述

图1显示pUCI9-GFP的限制性酶切图。
图2显示pShTh34的构建。
图3显示具有标记为片段A-D的隐蔽内含子区的GFP cDNA序列(SEQ ID NO:20)。
图4显示pShTh49的构建。
图5显示pShTh58.1的构建。
图6显示由转化体ShTh5 81.1产生的GFP的荧光光谱。
图7显示pShTh58.2的限制性酶切图。
图8显示由转化体ShTh582.1产生的GFP的荧光光谱。
发明详述本发明涉及获得重组真菌宿主细胞的方法，包括将编码异源多肽的核酸序列导入真菌宿主细胞内，其中在核酸序列中至少有一个隐蔽剪接位点被修饰。所说的核酸序列可能是基因组序列以及对应的cDNA与RNA序列。核酸序列优选为cDNA序列。
通过将编码重组真菌宿主细胞所产生的异源多肽的异源mRNA或由所说mRNA合成的cDNA，与从亲本细胞中获得的mRNA或由所说mRNA合成的cDNA作比较，可确定隐蔽剪接位点。亲本细胞是异源mRNA的来源。此外，通过与亲本细胞的核酸序列和它推定的氨基酸序列相比较，可从在真菌宿主细胞中由核酸序列异源编码的多肽的氨基酸序列中确定隐蔽剪接位点。也可利用界线或可靠的真菌内含子剪接位点的共有内含子序列(Rymond和Rosbash,1992，如前述；Gurr等，1987，如前述)来确定隐蔽剪接位点。
隐蔽剪接位点通过用非-共有序列取代隐蔽共有序列和/或用第二区(其具有在约40％到约70％范围内的G+C百分含量，优选为约40％-约60％，更优选为约40％-约50％)取代包含隐蔽内含子或其部分的第一区来修饰。
通过本领域所熟知的方法可用非-共有序列取代5’和3’端隐蔽共有序列，这些方法包括但不限于，寡核苷酸定向诱变，同源再重组，定点诱变，PCR诱变，以及化学合成。在优选的实施方案中，5’隐蔽共有序列是GT,GC，或CT,3’隐蔽共有序列是AG。在更为优选的实施方案中，5’隐蔽共有序列是GTANGT,GCANGT，或CTANGT，其中N是A,C,G，或T。在另一个更为优选的实施方案中，3’隐蔽共有序列是CAG,TAG，或AAG。若某处超过一个合成片段，利用本领域所熟知的方法可将这些片段共同退火成一个片段。然后通过用对该基因特异的寡核苷酸引物扩增合成片段周围的核酸序列剩下的5’和3’部分，可重建整个编码序列。
哪种核苷酸取代隐蔽共有序列的核苷酸优选取决于密码子使用表，如下页所显示的曲霉属真菌宿主细胞的密码子使用表Ⅰ。隐蔽共有序列优选被非-共有序列取代，其中对应于氨基酸摆动位置的核苷酸已被不同的核苷酸所取代以产生相同的氨基酸。
表1
<p>利用上述的用于非-共有序列取代隐蔽共有序列的相同方法可完成用第二区取代隐蔽内含子或其部分的第一区。在一个实施方案中，第二区与第一区具有相同数量的寡核苷酸。在优选的实施方案中，在隐蔽内含子界线的5’和/或3’两侧，第一和第二区优选为10-500个核苷酸，更优选10-200个核苷酸，最优选10-100个核苷酸。在隐蔽内含子中，分支点序列可有可无。在优选的实施方案中，隐蔽内含子序列包含至少七个核苷酸a-b-c-d-e-f-g的分支点序列，其中a是A,C,G，或T；b是A或G,c是C,d是T；e是A或T；f是A；g是C。在更为优选的实施方案中，分支点序列含有至少七个核苷酸，其中a是A,C,G，或T；b是A；c是C,d是T；e是A；f是A；g是C。
在优选的实施方案中，真菌宿主细胞产生的异源多肽的氨基酸序列与野生型多肽的氨基酸序列相同。在另一个优选的实施方案中，真菌宿主细胞产生的异源多肽中的氨基酸残基的数量与野生型多肽中的氨基酸残基数量相同。在另一个优选的实施方案中，非-共有序列与隐蔽共有序列具有相同数量的核苷酸。
重组真菌宿主细胞产生的异源多肽的氨基酸序列不同于野生型多肽的氨基酸序列，前者具有一个或多个氨基酸残基的插入或缺失和/或一个或多个氨基酸残基被不同的氨基酸残基的取代。优选地，氨基酸变化是属于次要的性质，它是不显著影响蛋白质的折叠或活性的保守氨基酸取代；典型为1至约30个氨基酸的小缺失；氨基-或羧基-端的小延伸，如氨基-端的甲硫氨酸残基；至多约20-25个残基的小连接肽；或利于纯化的小延伸，如聚-组氨酸段，抗原表位或结合域。保守取代的例子在碱性氨基酸(如精氨酸，赖氨酸，组氨酸)，酸性氨基酸(如谷氨酸和天冬氨酸)，极性氨基酸(如谷酰胺和天冬酰胺)，疏水氨基酸(如亮氨酸，异亮氨酸，缬氨酸)，芳香族氨基酸(如苯丙氨酸，色氨酸，酪氨酸)及小氨基酸(如甘氨酸，丙氨酸，丝氨酸，苏氨酸，甲硫氨酸)组内。
因此，术语＂异源多肽＂这里不是指所编码的产物的具体长度，因此包括肽，寡肽，以及蛋白质。此外，术语＂异源多肽＂可包括结合形成产物的两个或多个多肽。异源多肽可从下列来源中获得原核来源(例如，芽孢杆菌种的水解酶，即，α-淀粉酶，蛋白酶，脂酶，等等)，真核来源(例如，人胰岛素，人生长激素，牛凝乳酶，因子Ⅷ，绿色荧光蛋白质，等等)，以及不同于真菌宿主的真菌来源(例如，毁丝霉属漆酶，多孔菌属漆酶，鬼伞属过氧化物酶，腐质霉属脂酶，曲霉属淀粉酶，等等)。异源多肽也可能包括杂交多肽，其包含从至少两个不同的多肽中获得的部分或完全多肽序列的组合，其中至少一个多肽对真菌宿主是异源的(例如，被融合到编码黑曲霉葡糖淀粉酶的信号肽与前肽的核酸序列中的编码毁丝霉属漆酶的核酸序列)。异源多肽可进一步包括上述多肽的天然存在的等位基因变体和人工变体。
优选地，异源多肽是激素，酶，受体，或报道分子。在较为优选的实施方案中，异源多肽是氧化还原酶，转移酶，水解酶，裂合酶，异构酶，或连接酶。在更为优选的实施方案中，异源多肽是氨肽酶，淀粉酶，糖酶，羧肽酶；过氧化氢酶，纤维素酶，几丁质酶，角质酶，DNA酶，酯酶，α-半乳糖苷酶，β-半乳糖苷酶，葡糖淀粉酶，α-葡萄糖苷酶，β-葡萄糖苷酶，卤过氧化物酶，转化酶，漆酶，脂肪酶，甘露糖苷酶，卤斑葡聚糖酶，氧化酶，果胶分解酶，过氧化物酶，肌醇六磷酸酶，多酚氧化酶，蛋白水解酶，核糖核酸酶，及木聚糖酶。
在另一个更为优选的实施方案中，异源多肽是Aequorea victoria绿色荧光蛋白质(GFP)。在许多生物(包括大肠杆菌，酵母，植物细胞，蠕虫，苍蝇，以及哺乳动物)中，GFP作为通用报道分子具有许多合乎需要的特点其能使体内基因表达和蛋白质定位被观测到(Chalfie等，1994，科学263:802-805；Delagrave等，1995，生物/技术13:151-154；Heim等，1995，自然373:663-664；Sheen等，1995，植物杂志8:777-784；Prasher,1995,TIG 8:320-323；Haseloff和Amos,1995,TIG 8:328-329)。尚未有GFP作为在丝状真菌中基因表达报道分子的应用的报导。
本发明也涉及用本发明的方法产生的具有修饰隐蔽剪接位点的分离核酸序列。具有修饰隐蔽剪接位点的核酸序列进一步包括基因组序列及对应的cDNA与RNA序列，并且应该理解这里所使用的＂核酸序列＂词组涉及所有这样的变体包括合成的DNA。
本发明也涉及包含所说的核酸序列的核酸构建体。＂核酸构建体＂一般地认为是核酸分子(或为单链-或为双链)，它是从天然存在的基因中分离出的或者它被修饰成含有核酸节段(其通过用自然界中不另外存在的方式相结合和相并列)。在本发明的核酸构建体中，核酸序列可以是基因组，cDNA，半合成起源，或合成起源。
本发明也涉及包含本发明核酸构建体的重组表达载体。重组表达载体可以是任何能便利地进行重组DNA操作过程，并能引起核酸序列(其具有至少一个修饰的隐蔽剪接位点)表达的载体。载体的选择主要取决于载体与该载体导入至的真菌宿主细胞的亲和性。载体可以是线型或闭环质粒。载体系统可能是共同含有要被导入至真菌宿主基因组内的整个DNA的单个载体或质粒或者两个或多个载体或质粒。
所说的载体是自主复制的载体，即，以染色体外实体形式存在且其复制不依赖于染色体复制的载体，例如，质粒，染色体外元件，微染色体，或人工染色体。载体含有用于保证自主复制的任何工具。另外，所说的载体可以是当其被导入进真菌细胞内时能整合到基因组中并且与它整合的染色体一起复制的载体。对于整合，载体可依赖于至少具一个修饰隐蔽剪接位点的核酸序列或载体的任何其它元件来通过同源或非同源重组方法使载体稳定整合到基因组内。另一可取的，载体可以含有用于指导通过同源重组方法使其整合到真菌宿主的基因组内整合过程的附加核酸序列。附加核酸序列能使载体在染色体精确的位置处整合到宿主细胞基因组内。为了增加在精确位置整合的可能性，这里应优选两个核酸序列以提高同源重组的概率，这两个序列分别含有足够数量的核酸，优选为400bp-1500bp，更优选为800bp-1000bp，并与对应的靶序列高度同源。这些核酸序列是与真菌宿主细胞基因组内的靶序列同源的任何序列，且可以是非编码序列或编码序列。
对于自主复制，载体还可包含能使载体在正被谈论的宿主细胞中进行自主复制的复制起点。用于酵母宿主细胞中的复制起点的例子是2u复制起点和CEN3和ARS1的组合。任何与选择的真菌宿主细胞相容的复制起点均可加以利用。
本发明的载体优选含有使被转化细胞容易筛选的一个或多个选择性标记。选择性标记是其产物提供杀生物剂或病毒抗性，重金属抗性，原养型至营养缺陷型，及类似抗性的基因。选择性标记可从下组标记中选择但不限于这些，该组包括amdS(乙酰胺酶)，argB(鸟氨酸甲氨酰转移酶)，bar(膦苏菌素乙酰转移酶)，hygB(潮霉素磷酸转移酶)，niaD(硝酸盐还原酶)，pyrG(乳清酸核苷-5’-磷酸-脱羧酶)，以及sC(硫酸盐腺嘌呤基转移酶)，和trpC(邻氨基苯甲酸合酶)。在曲霉细胞中优选利用构巢曲霉或米曲霉的amdS和pyrG标记和吸水链霉菌的bar标记。此外，可通过共-转染(如WO91/17243中所描述的)完成选择，这里选择性标记在一个单独载体上。
在载体中，将包含至少一个修饰剪接位点的核酸序列有效连接到调控序列上，该调控序列对其所结合的核酸序列的编码序列表达是必须的。术语＂调控序列＂这里是指包括所有其存在对核酸序列的编码序列表达必要或有利的组分。调控序列对编码异源多肽的核酸序列来说可以是天然的或由外源而获得的。这样的调控序列包括但不限于下列序列，前导序列，聚腺苷酸化序列，原肽序列，启动子，信号序列，和转录终止子。最少，调节序列包括启动子，和转录与翻译停止信号。对于在调控序列指导下的表达，以这种使编码序列在与调控序列相容的条件下完成表达的方式，将按照本发明要利用的基因有效连接到调控序列上。术语＂编码序列＂这里定义为当置于上述调控序列的控制下时被转录成mRNA，并且被翻译成异源多肽的序列。编码序列的界线取决于5’端的翻译起始密码子和3’端的翻译终止密码子。编码序列包括但不限于，DNA,cDNA，以及重组核酸序列。
如上所述，本发明的核酸序列可以与合适的启动子序列有效连接。启动子序列是可被用于该核酸序列表达的真菌宿主细胞所识别的核酸序列。启动子序列含有转录和翻译的调控序列，它们介导异源多肽的表达。启动子可以是任何在所选择的真菌宿主细胞中能显示转录活性，并且能从编码与宿主细胞同源或异源的多肽的基因中获得的任何核酸序列。用于指导丝状真菌中本发明核酸构建体转录的合适启动子的例子是从编码下列蛋白质的基因中获得的启动子，这些蛋白质为米曲霉TAKA淀粉酶，米黑根霉菌天冬氨酸蛋白酶，黑曲霉中性α-淀粉酶，黑曲霉酸稳定性α-淀粉酶，黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)，米黑根霉菌脂酶，米曲霉碱性蛋白酶，米曲霉丙糖磷酸异构酶，构巢曲霉乙酰胺酶，以及其杂合体。在酵母宿主中，一个有用的启动子是酿酒酵母烯醇化酶(eno-I)启动子。更为优选的启动子是TAKA淀粉酶，NA2-tpi(来源于编码黑曲霉中性α-淀粉酶和编码米曲霉丙糖磷酸异构酶的基因的杂合启动子)，以及glaA启动子。
本发明的核酸序列也可有效连接在终止子序列的3’端。终止子序列对编码异源多肽的核酸序列来说可以是天然的或由外源而获得的。任何在所选择的真菌宿主细胞中有功能的终止子均可用于本发明，但是特别优选从编码下列蛋白质的基因中获得的终止子，如米曲霉TAKA淀粉酶，黑曲霉葡糖淀粉酶，构巢曲霉邻氨基苯甲酸合酶，黑曲霉α-葡萄糖苷酶和酿酒酵母烯醇化酶。
本发明的核酸序列也可与合适的前导序列有效连接。前导序列是对真菌宿主翻译很重要的mRNA非翻译区。可将前导序列有效连接到编码异源多肽的核酸序列的5’端。前导序列对编码异源多肽的核酸序列来说可以是天然的或由外源而获得的。任何在所选择的真菌宿主细胞中有功能的前导序列均可用于本发明，但是特别优选从编码下列蛋白质的基因中获得的前导序列，如米曲霉TAKA淀粉酶，米曲霉丙糖磷酸异构酶。
聚腺苷酸化序列也能有效连接到本发明核酸序列的3’末端。聚腺苷酸化序列是当转录时被真菌宿主识别并将多聚腺苷残基添加至转录mRNA上的序列。聚腺苷酸化序列对编码异源多肽的核酸序列来说可以是天然的或由外源而获得的。任何在所选择的真菌宿主细胞中有功能的聚腺苷酸化序列均可用于本发明，但是特别优选从编码下列蛋白质的基因中获得的聚腺苷酸化序列，如米曲霉TAKA淀粉酶，黑曲霉葡糖淀粉酶，构巢曲霉邻氨基苯甲酸合酶，黑曲霉α-葡萄糖苷酶。
为了避免为获得异源表达多肽而破坏细胞的必要性并且最大限度地减少在细胞内所表达的多肽可能降解的量，优选所生成的产物分泌在细胞外部的多肽基因的表达。对于这一点而言，本发明的异源多肽可与连接在多肽氨基末端的信号肽相连接。信号肽是使异源多肽从真菌宿主内分泌到培养基中的氨基酸序列。信号肽对编码异源多肽的核酸序列来说可以是天然的或由外源而获得的。本发明核酸序列编码序列的5’端固定地含有信号肽编码区，其在翻译读框中与编码分泌的异源多肽的编码区的这一节段天然地相连接。此外，编码序列的5’端含有对编码分泌的异源多肽的编码区的那一部分来说是外源的信号肽编码区。在编码序列通常不含有信号肽编码区的地方可能要求有外源信号肽。此外，外源信号肽可简单取代天然信号肽以获得所要求异源多肽的加强分泌。外源信号肽编码区可从下列基因中获得，如来源于曲霉物种的淀粉酶或葡糖淀粉酶基因，来源于米黑根霉菌的脂肪酶或蛋白酶基因，及来源于酿酒酵母的α-因子基因，或小牛前凝乳酶原基因。真菌宿主细胞有效的信号肽是米曲霉TAKA淀粉酶信号肽，黑曲霉中性淀粉酶信号肽，米黑根霉菌天冬氨酸蛋白酶信号肽，Humicola lanuginosus纤维素酶信号肽，或米黑根霉菌脂肪酶信号肽。然而，任何能使所选择的真菌宿主中异源多肽分泌的信号肽均可用于本发明。
可将本发明的核酸序列连接到一种前肽编码区。前肽是位于多肽原或酶原的氨基端的氨基酸序列。从多肽原上切割前肽则产生成熟的具生化活性的多肽。所形成的多肽称为多肽原或酶原。多肽原一般是无活性的，但通过催化或自身催化从多肽原或酶原上切割前肽则能转变为成熟的有活性的多肽。该前肽编码区对异源多肽可以是天然的或由外源而获得的。外源前肽编码区可从酿酒酵母α-因子基因或Myceliophthora thermophila漆酶基因(WO95/33836)中获得。
本领域技术人员均知道用于连接上述元件以构建本发明重组表达载体的方法(参见，例如，Sambrook等，分子克隆，实验手册，第二版，冷泉港，纽约，1989)。
本发明也涉及用本发明的方法产生的重组真菌宿主细胞，在利用本发明的重组载体时优选这些真菌宿主细胞。优选利用包含本发明的核酸序列的载体转化细胞，接着载体整合到宿主染色体上。＂转化作用＂指将包含至少有一个修饰隐蔽剪接位点的核酸序列的载体导入真菌宿主细胞中，使得载体以染色体整合体或自我复制的染色体外载体形式存在。通常认为整合有利于该核酸序列在细胞中更稳定地保持。通过上述的同源或非同源重组可使载体整合到宿主染色体上。
真菌宿主细胞的选择很大程度上取决于编码异源多肽的基因和它的来源。真菌宿主细胞可能是酵母细胞或丝状真菌细胞。
本文中的＂酵母＂包括产子囊酵母(酵母目)，产担孢子酵母，以及属于半知菌纲(芽酵母属)的酵母。产子囊酵母分为蚀精霉科和酵母科。后者包括四个亚科，即裂殖酵母亚科(例如，裂殖酵母属)，拿逊酵母亚科，油脂酵母亚科，以及酵母亚科(例如毕赤酵母属，克鲁维酵母属和酵母属)。产担孢子酵母包括白冬孢酵母属，红冬孢酵母属，锁掷酵母属，线黑粉菌属，和线黑粉菌类。属于半知菌纲的酵母划分成两科。掷孢酵母科(例如，Sorobolomyces和布勒掷孢酵母属)和隐球酵母科(例如，假丝酵母属)。由于酵母分类在将来可能有变化，对于本发明目的，酵母定义按照酵母生物学和酵母活性中所描述的(Skinner.F.A.Passmore.S.M.和Davenport.R.R，编辑，应用细菌学学会专题研讨系列第9期，1980)。在本领域大家熟知酵母生物学和酵母遗传学操纵(参见，例如，酵母生化和遗传学，Bacil.M.,Horecker.B.J.和Stopani,A.O.M.编辑，第2版，1987；酵母，Rose.A.H.和Harrison.J.S.编辑，第二版，1987；酵母分子生物学，Strathern等，编辑，1981)。
本文中的＂真菌＂包括phyla子囊菌亚门，担子菌亚门，壶菌亚门和接合菌亚门(如Hawksworth等定义的，真菌的Ainsworth和Bisby’s字典，第8版，1995,CAB International，大学出版社，剑桥，英国)及卵菌亚门(其引用于Hawksworth等，1995，如前，第171页)和所有的有丝分裂孢子的真菌(Hawksworth等，1995，如前)。子囊菌亚门代表组包括，例如，脉孢菌属，正青霉属(=薄膜革菌属)，裸胞壳(=曲霉属)，散囊菌属(=曲霉属)和上面列出的确切的酵母。担子菌亚门的例子包括蘑菇，锈斑病菌，及黑穗病菌。壶菌亚门代表组包括，例如，异水霉属，小芽枝霉属，雕蚀菌属，及水生真菌。卵菌亚门代表组包括，例如，水霉属水生真菌(水霉菌)如绵霉属。有丝分裂孢子真菌的例子包括曲霉属，正青霉属，假丝酵母属和链格孢属。接合菌亚门代表组包括，例如，根霉属和毛霉属。
＂丝状真菌＂包括真菌亚门和卵菌亚门的所有的丝状菌形式(如Hawkswarth等定义的，1995，如前)。所说的丝状真菌的特点是其营养菌丝体由下列物质组成几丁质，纤维素，葡聚糖，脱乙酰壳多糖，甘露聚糖，和其它复合多糖。营养生长是通过菌丝伸长，碳分解代谢是专性好氧代谢。相反地，酵母(如酿酒酵母)的营养生长是通过萌发单细胞的菌体，碳分解代谢是发酵代谢。
在一个实施方案中，真菌宿主细胞是酵母细胞。在优选的实施方案中，酵母宿主细胞是，假丝酵母属，克鲁维酵母属，酵母属，裂殖酵母属，毕赤酵母属和Yarrowia物种的细胞。在优选的实施方案中，酵母宿主细胞是酿酒酵母细胞，卡尔酵母细胞，糖化酵母细胞，克鲁弗酵母细胞，诺地酵母细胞，saccharamyces oviformis细胞。在另一个优选的实施方案中，酵母宿主细胞是乳酸克鲁维酵母细胞。在另一个最优选的实施方案中，酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个实施方案中，真菌宿主细胞是丝状真菌细胞。在优选的实施方案中，丝状真菌宿主细胞是下列物种的细胞(但不限于这些)顶孢霉属，曲霉属，镰孢属，腐质霉属，毁丝霉属，毛霉属，脉孢菌属，正青霉属，梭孢壳属，中国弯劲霉属，木霉属。在更为优选的实施方案中，丝状真菌宿主细胞是曲霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是顶孢霉属细胞。在另一个更优选的实施方案中，丝状真菌宿主细胞是镰孢属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是腐质霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是毁丝霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是毛霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是脉孢菌属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是正青霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是梭孢壳属细胞。在另一个更为优选实施方案中，丝状真菌宿主细胞是中国弯劲霉属细胞。在另一个更为优选的实施方案中，丝状真菌宿主细胞是木霉属细胞。在最为优选的实施方案中，丝状真菌宿主细胞是米曲霉细胞，黑曲霉细胞，臭曲霉细胞或日本曲霉细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是尖镰孢细胞或禾谷镰孢细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是Humicola insolens细胞或Humicolalanuginosus细胞。在另一个最为优选的实施方案中，丝状真菌宿主细胞是Myceliophthora thermophila细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是米黑毛霉细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是粗糙脉孢菌细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是产紫青霉细胞。在另一个最优选的实施方案中，丝状真菌宿主细胞是青地梭孢壳霉细胞。在另一个最优选的实施方案中，木霉属细胞是绿色木霉细胞，Trichoderma longibrachiatum细胞，Trichodermaharzianum细胞，或康宁木霉细胞。
本发明的重组真菌宿主细胞进一步包含一段或多段编码一种或多种因子的序列，这些因子利于异源多肽的表达，例如，激活剂(如反式作用因子)，伴性分子，和加工蛋白酶。将编码一个或多个这些因子的核酸优选地不有效地连接到编码异源多肽的核酸上。激活剂是一种激活编码多肽的核酸序列转录的蛋白质(Kudla等，1990,EMBO杂志第9期1355-1364；Jarai和Buxton,1994，当前遗传学26:2238-244；Verdier,1990，酵母6:271-297)。编码激活剂的核酸序列可由下列基因中获得编码酿酒酵母的血红素激活蛋白1(hapl)的基因，编码酿酒酵母的半乳糖代谢蛋白4(ga14)的基因，及编码构巢曲霉的氨调节蛋白(are4)的基因。另一些实施例，参见前面所说的Verdier,1990，和MacKenzie等，1993，普通微生物杂志139:2295-2307。伴性分子是一种辅助另一种多肽正确折叠的蛋白质(Hartl等，1994,TIBS 19:20-25；Bergeron等，1994,TIBS 19:124-128；Demolder等，1994，生物技术杂志32:179-189；Craig,1993，科学260:1902-1903；Gething和Sambrook,1992，自然355:33-45；Puig和Gilbert,1994，生物化学杂志269:7764-7771；Wang和Tsou,1993,FASEB杂志7:1515-11157；Robinson等，1994，生物/技术1:381-384)。编码伴性分子的核酸序列可从编码下列物质的基因中获得，如米曲霉蛋白质二硫化物异构酶，酿酒酵母钙连接蛋白，酿酒酵母BiP/GRP78，和酿酒酵母Hsp70。另外的例子，参见Gething和Sambrook,1992，如前所述，和Hartl等，1994，如前所述。加工蛋白酶是一种能切割前肽以产生成熟具生化活性的多肽的蛋白酶(Enderlin和Ogrydziak,1994，酵母10:67-79；Fuller等，1989，美国国家科学院院报86:1434-1438；Julius等，1984，细胞37:1075-1089；Julius等，1983，细胞32:839-852)。编码加工蛋白酶的核酸序列可从编码下列物质的基因中获得黑曲霉Kex2，酿酒酵母二肽氨基肽酶，酿酒酵母Kex2，和Yarrowia lipolytica二碱基加工内蛋白酶(xpr6)。任何在选用的真菌宿主细胞中有功能的因子都可用于本发明中。
真菌细胞可通过一种包括原生质体形成，原生质体转化和细胞壁再生的方法，用大家熟知的方式进行转化。适于转化曲霉属宿主细胞的方法在EP238023和Yelton等，1980，美国国家科学院院报81:1470-1474中得以描述。适于转化镰孢属物种的方法如Malardier等，基因78:117-156,1989，或共同未决的美国系列号08/269,449中所述。酵母转化可利用下列刊物中所描述的方法Becker和Guarente,Abelson,J.N.和Simon,M.I.(编辑)，酵母遗传学指南和分子生物学，酶学方法，第194卷，pp182-187，学院出版公司，纽约；Ito等，1983，细菌学杂志153:163；和Hinnen等，1978，美国国家科学院院报75:1920。
本发明也涉及产生异源多肽的方法，该方法包括在利于异源多肽表达的条件下培养重组真菌宿主细胞。利用本领域所熟知的方法，将本发明的真菌细胞培养在适于异源多肽产生的营养培养基中。例如，细胞可在合适的培养基中和适于异源多肽表达和/或分离条件下，在实验室或工业发酵罐中通过摇瓶培养法，小规模或大规模的发酵法(包括连续，批量，分批加料或固态发酵)进行培养。利用本领域所熟知的方法(参见，例如，Bennett,J.W.及LaSure,L.，编辑，真菌中的多基因操纵，学院出版社，CA,1991)，在含碳和氮源及无机盐的合适的营养培养基中进行培养。合适的培养基可由销售商提供或按照公开的组成(例如美国典型培养物收集中心的目录)而制备。如果异源多肽分泌到营养培养基中，可从培养基中直接回收多肽。如果异源多肽不被分泌，则从细胞溶胞产物中回收。
所表达的异源多肽可通过本领域所熟知的方法进行检测，该方法对特殊多肽是特异的。这些检测方法可能包括特异性抗体的利用，酶产物的形成，或酶底物的消失。例如，如果异源多肽有酶促活性，可利用酶测定法。此外，如果对异源多肽有特异性的多克隆或单克隆抗体是可得到的，则利用多肽的抗体进行免疫测定法。酶检测和免疫检测技术为本领域技术人员所熟知。
可以用本领域所熟知的方法回收所形成的异源多肽。例如，多肽可通过常规方法从营养培养基中回收，这些方法包括(但不限于)离心，过滤，抽提，喷雾干燥，蒸发，或沉淀。然后所回收的多肽可通过多种层析法(例如，离子交换层析法，凝胶过滤层析法，亲和柱层析法，或类似的层析法)进行进一步纯化。
下列实施例进一步描述了本发明，但本发明的范围并不限于这些实施例。
实施例实施例1寡核苷酸引物按照制造厂商的说明，利用应用生物系统394型DNA/RNA合成仪(应用生物系统公司，Foster City,CA)合成下列寡核苷酸引物95-48 TGTCACTACTTTCTCTTATGG(SEQ ID NO:1)95-89 GTAATGGTTGTCTGGTAAAAG(SEQ ID NO:2)95-448TATCGGCCGCACCGGCCAAGATGAGTAAAGGAGAAGAACTT(SEQ ID NO:3)95-449ATACATGCATTTATTTGTATAGTTCATCCATGCCATGTGT(SEQ ID NO:4)95-656 TGTTACAAACTCAAGAAGGAT(SEQ ID NO:5)95-1202 ATGAGTAAAGGAGAAGAACTTTTC(SEQ ID NO:6)95-1411AAGACTCGAGCCGAGGTCAAGTTCGAGGGCGATACCCTTTGTTAACCGCATCGAGCTCAAGGGCATTGACTTCAAGGAGGACGGC(SEQ ID NO:7)95-1412GCTTGTCGGCCATGATGTAGACGTTATGTGAGTTATAGTTGTACTCCATCTGTGGCCAAGAATGTTGCCGTCCTCCTTGAAGT(SEQ ID NO:8)951413 CATCATGGCCGACAAGCCAAAGAACGGCATCAAGGTTAACTTCAAGATCCGCCACAACATTAAGGACGGCAGCGTTCAGCTCGC(SEQ ID NO:9)95-1414CGCCGATCGGAGTGTTCTGCTGATAATGGTCGGCGAGCTGAACGCTGCCG(SEQ ID NO:10)95-1415 AAGACTCGAGCCGAGGTCAAG(SEQ ID NO:11)95-1422 TCAAGCTTTATGTCCAAGGGCGAGGAGCTCTTCACTGGAGTTGTC(SEQ ID NO:12)95-1457 GATGCTCGAGTCTTGTAGTTCCCGTCATCTTTGTAAAA(SEQ IDNO:13)95-1458 GATGCGATCGGCGATGGCCCTGTCCTTTTACCAGACAA(SEQ IDNO:14)95-1464 TGAGAATTCGGATCCTTATTTGTATAGTTCATCCATGCC(SEQ IDNO:15)96-67TCCATTTAAATATGAGCAAGGGCGAGGAGCTCTTCACTGGAGTTGTC(SEQ ID NO:16)96-68 TTCCTTAATTAATTATTTGTATAGTTCATCCATGCC(SEQ ID NO:17)GFP2: TGGAATAAGCTTTATGAGTAAAGGAGAAGAACTTTT(SEQ ID NO:18)GFP1: AAGAATTCGGATCCCTTTAGTGTCAATTGGAAGTCT(SEQ ID NO:19)
实施例2:DNA测序利用应用生物系统373A型自动DNA测序仪(应用生物系统，FosterCity,CA)，在每条链上均使用Taq聚合酶循环-测序法，并采用荧光标记的双脱氧核苷酸(Giesecke等，1992，病毒学方法杂志38:47-60)和M13反向引物(-48)和M13(-20)正向引物(新英格兰生物实验实，Beverly,MA)和被测序DNA所独有的引物，从而测定核苷酸序列。
实施例3:Aequoren virtoria绿色荧光蛋白质(GFP)分析利用Perkin-Elmer Cetus LS50B荧光计(Perkin-Elmer Corp.,Norwalk,CT)检测GFP的产生。具体地说，将100微升的蛋白质抽提物放置到位于Perkin-Eimer Cetus LS50B平板阅读器中的96孔的微量滴定平板中。将提取物置于395nm的光下，读取从400到600nm的发射光谱值。
利用Zeiss Axioplan显微镜(Carl Zeiss,Inc.,Thornwood,NY)和GFP过滤器装置(色度技术公司，Brattleboro,VT)观察菌丝体的GFP荧光。
实施例4表达载体pShTh34的构建构建丝状真菌表达载体pShTh34以将GFP结构基因置于TAKA淀粉酶启动子，信号序列和终止子的控制之下。
利用制造厂商推荐的AMV逆转录酶(Promega,Madison,WI)，将总RNA(其是通过标准方法从Aequoria victoria中分离出的(Sambrook等，1989，如前))转化成cDNA。然后利用根据以前发表的GFP序列(Prasher等，1992，基因111:229-233；基因库登记入册号M62653)所设计的PCR引物，和UITmaTM聚合酶(Perkin Elmer,Foster City,CA)通过PCR扩增cDNA。引物的序列如前面SEQ IDNOS:18和19所示。
将限制性核酸内切酶位点插入到引物的5’(HindⅢ位点)和3’(EcoRⅠ和BamHⅠ位点)，这有利于PCR扩增的GFP cDNA克隆到微修饰的pUC19载体中。构建详情是LacZ Shine-Dalgarno AGGA，其后紧接着5’HindⅢ位点加上额外T和GFP ATG密码子，在LacZ启动子GFP的融合点产生下列DAN序列PLacZ-AGGAAAGCTTTATG-GFP。在GFP cDNA的3’端，对应于发表的GFP序列中的770核苷酸的碱基对通过PCR产生的BamHⅠ,EcoRⅠ连接区(如图1所示)融合到pUC19多克隆位点(MCS)中的EcoRⅠ位点上。
利用pUC19-GFP作为模板，用实施例1中所描述的寡核苷酸引物95-448和95-449通过PCR扩增GFP结构基因。扩增反应包含下列组分各200微摩尔的dATP,dCTP,dGTP，及dTTP,50ng模板，各30皮摩尔引物，1×Taq聚合酶缓冲液，和0.5单位Taq聚合酶(Stratagene克隆系统，La Jolla,CA)。将反应物按如下方案在Ericomp热循环仪中温育94℃下5分钟循环一次；每次循环94℃1分钟，60℃1分钟，74℃1分钟共30次循环；74℃下15分钟循环一次。利用这些引物可将SfiⅠ限制性酶切位点添加在紧接ATG起始密码子的上游，且将NsiⅠ位点添加在紧接GFP终止密码子的下游。利用琼脂糖电泳标准方法分离出该片段。将所形成的片段亚克隆到pMWR1以产生如图2所示的pShTh34。
实施例5:pShTh34的丝状真菌转化将pShTh34与pPyrG(真菌遗传储藏中心，堪萨斯城，KS)共转化进米曲霉HoWB104pyrG原生质体内。以每ml2×107浓度的原生质体进行转化。将100μl的原生质体与10μg的DNA置于冰上30分钟。添加1ml的SPTC(40％PEG4000,0.8M山梨醇，0.05M Tris pH8.0,0.05MCaCl2)并将原生质体在34℃下温育20分钟。将原生质体直接铺板在包含基本培养基的平板上(每升6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml微量金属溶液，1g葡萄糖，500mg MgSO4-7H2O,342.3g蔗糖和20g纯净琼脂，pH为6.5)。微量金属溶液(1000X)包括每升22gZnSO4-7H2O,11g H3BO3,5g MnCl2-4H2O,5g FeSO4-7H2O,1.6gCoCl2-5H2O,1.6g(NH4)6Mo7O24，及50g Na4EDTA。将平板在37℃下温育5-7天。将转化体转移到含相同培养基但无蔗糖的平板上并在37℃下温育3-5天。在相同的条件下，用同样的平板通过划线孢子与挑取分离的菌落来纯化转化体。所形成的转化体被命名为米曲霉ShTh340。
实施例6:GFP抽提用实施例3所述的荧光分析法筛选出实施例5中所述米曲霉ShTh340转化体中的能表达GFP的转化体。将10个米曲霉ShTh340-19转化体在37℃下，12孔微量滴定平板中，在4ml MY51培养基中静态培养1-5天，所说的培育基每升包含下列组分50g麦芽糖，2g MgSO4-7H2O,10g KH2PO4,2gK2SO4,2g枸橼酸，10g酵母抽提物，0.5ml如实施例5中所述的微量金属溶液，1g尿素，及2g(NH4)2SO4。收集菌丝团，转移到1.5ml微量离心管中，并置于干冰上5分钟。然后将微量离心管放置在真空离心蒸发浓缩器(Savant仪器公司，Farmingdale,NY)中，并在真空下室温干燥过夜。利用无菌的柳叶刀在管中压碎干燥的培养物。将压碎的培养物悬浮在400微升pH为5.5的50mM磷酸钠-0.5M NaCl中，其包含1mM PMSF和0.1mM的抑肽素。菌丝体碎片以MC12V型Sorvall微离心机(DuPont仪器公司，Newtown,CT)，在20分钟全速下形成小球。将200微升的上清液转移到一根新微量离心管中，并按照实施例3中所述的方法进行测定。
没有任何米曲霉ShTh340-19转化体产生可检测的荧光。
实施例7:mRNA分析用Timberlake和Barnard方法(1981，细胞26:29-37)从实施例6所描述的米曲霉ShTh340-19转化体中分离出总RNA。
利用3’Race试剂盒(Bethesda研究实验室，Gaithersburg,MD)，按照厂家说明书合成特异性GFP cDNA。用1微克来自所说转化体的总RNA与3’UAP寡核苷酸引物和实施例1中所描述的特异性5’寡核苷酸引物95-1202一起反应。扩增反应物含有下列组分各200微摩尔的dATP,dCTP,dGTP，和dTTP，每种引物各1皮摩尔，50ng模板，1×Taq聚合酶缓冲液，和0.5单位的Taq聚合酶。按如下程序将反应物在Ericomp热循环仪中温育94℃5分钟循环1次；94℃1分钟，50℃1分钟，和72℃1分钟循环30次；74℃5分钟循环1次。利用有义寡核苷酸引物95-1202或95-88与实施例1所描述的任何反义引物95-89或95-656，将cDNA产物进行嵌套式PCR扩增。PCR条件如上述。利用TA克隆试剂盒，按照厂商说明将PCR产物克隆进pCRⅡ。然后通过利用QIAwell-8质粒试剂盒(Quiagen,Chatsworth,CA)按照厂商说明从转化体中提取质粒DNA，并按照实施例2所描述的方法测序质粒插入片段筛选转化体。
实施例8隐蔽内含子的鉴定实施例7中所述的测序了的亚克隆分成三组，列在如下所示的表1中(图3,SEQ ID NO.20)。第一组含有在GFP编码序列内的称为片段A和片段D的两个缺失。片段A以序列GTG始于核苷酸347(ATG核苷酸等于GFP编码序列中的1,2,3)，并以序列AAG终止于核苷酸397；片段D以序列GTA始于核苷酸448，并以序列TAG终止于核苷酸503。第二组含有称为片段B的单个缺失。片段B以序列GTA始于核苷酸380，并以序列CAG终止于核苷酸463。第三组含有称为片段C的单个缺失。片段C以序列GTA始于核苷酸380，并以序列TAG终止于核苷酸503。这些缺失片段序列两侧是上面所列出的核苷酸，符合作为丝状真菌内含子(其具有所期望的共有5’和3’剪接位点)被识别的标准，并且可能是由米曲霉中的GFP mRNA的错误剪接下来的隐蔽内含子。
表2隐蔽内含子的分布内含子数量A和D 15B1C5D3实施例9:pShTh49表达载体的构建为了在曲霉宿主中表达GFP基因，对所确定的推断隐蔽剪接位点进行修饰。构建pShTh49(一种大肠杆菌表达载体)以包含正确的GFP基因。具体地说，利用实施例4所描述相同的条件及实施例1所描述的寡核苷酸引物95-1422和95-1457，扩增来自pUC19-GFP的GFP基因的5’端。利用这些引物将XhoⅠ位点323bp导入在ATG起始密码子下游。利用琼脂糖电泳标准方法分离出该片段，然后利用TA克隆试剂盒(InvitrogenCorp.,La Jolla,CA)按照厂商的说明将其亚克隆进pCRⅡ以产生pShTh46。利用与实施例4相同的条件及实施例1所描述的寡核苷酸引物95-1464和95-1458，扩增来自pUC19-GFP的GFP基因的3’端以将PvuⅠ位点191bp导入在终止密码子的上游。然后利用TA克隆试剂盒按照厂商的说明将PCR产物克隆进pCRⅡ以产生pShTh47。利用应用生物系统394型DNA/RNA合成仪，按照制造厂商的说明(应用生物系统，Foster City,CA)，并利用曲霉的密码子用法图表(参见表Ⅰ，如前)合成GFP余下的内部编码序列(用于构建需要的碱基323至565)。合成出三段84个碱基的寡核苷酸片段和一段50个碱基的寡核苷酸片段(95-1411,95-1412,95-1413,95-1414)，并使其共同退火，用T4 DNA聚合酶(Boehringer Mannheim,Indianapolis,IN)形成双链。利用与实施例4所述的相同条件及实施例1所描述的寡核苷酸引物95-1414和95-1415，通过PCR扩增所形成的片段。利用琼脂糖电泳标准方法分离出所扩增的片段，然后利用TA克隆试剂盒且按照厂商的说明将其克隆进pCRⅡ以产生pShTh45。装配来自pShTh45,pShTh46和pShTh47的GFP片段，并将合成的GFP等位基因(gfp49)导入进pUC19衍生物(其包含LacZShine-Delgarno序列，接着为HindⅢ,BamHⅠ,EcoRⅠ限制性酶切位点)以产生pShTh49(图4)。
因而，在所确定的隐蔽内含子中所观察的5’和3’剪接位点每一个均发生了变化。此外，在设计的片段的全长中，只要可能位于密码子摆动位置G+C含量就增加。总的来说，基因的G+C含量从38.5％增至44.5％(在合成性设计的片段中，由33.3％增至51％)。
实施例10:pShTh49的转化按照厂商的说明将pShTh49转化进大肠杆菌DH5α(Bethesda研究实验室，Gaithersburg,MD)，并在如实施例3所描述的荧光显微镜下观察转化体。将转化体于37℃在5ml Luria-Bertani培养基中(补充了异丙基-β-D-巯基吡喃半乳糖苷(IPTG))摇动培养。14小时后，用IPTG诱导gfp49，如实施例5所述用Zeiss荧光显微镜观察到荧光大肠杆菌，这表明gfp49是一种功能性蛋白，其在与真正GFP相同的条件下能发荧光。
实施例11表达载体pShTh58.1的构建首先，通过利用实施例4所描述相同的条件及实施例1所描述的寡核苷酸引物96-67和96-68扩增来自pShTh49的片段从而构建pShTh58.1(一种丝状真菌表达载体)。该片段是利用琼脂糖电泳标准方法而分离的。所形成的GFP编码片段分别在5’和3’端含有单一SwaⅠ和PacⅠ限制性酶切位点。然后用SwaⅠ和PacⅠ消化这一片段，用琼脂糖电泳标准方法进行分离，并连接到pBANe13载体DNA中以产生pShTh58.1(图5)。
实施例12:pShTh58.1的转化利用与实施例5相同的方案，将pShTh58.1转化到米曲霉HowB425中。所形成的转化体被命名为ShTh581菌株。
实施例13:gfp49的表达如实施例6所述，将五个ShTh581转化体在含MY51培养基的微量滴定板中进行培育，以诱导出用于GFP生产的TATA启动子。在3天和4天时收集菌丝体。然后如实施例4所述分离来自这些菌丝体的细胞内蛋白质，并如实施例3所述分析GFP的存在情况。其中5个检测转化体中的4个在以395nm的光激发时发光值出现高峰，其对应于在509nm时GFP的发光峰值(图6)。这些结果表明gfp49的mRNA的校正导致在米曲霉(其可产生发荧光的GFP)中GFP的正确表达。
实施例14表达载体pShTh58.2的构建通过用Morph诱变试剂盒(5-引物3-引物，Boulder,CO)处理pShTh58.1从而构建真菌表达载体pShTh58.2。按照厂商的说明，将引物96-83与14ng的pShTh58.1相混合以产生pShTh58.2(其产生W57C突变(图7))。
实施例15:gfp58.2的表达如实施例4所述，将一个ShTh582转化体在含MY51培养基的微量滴定板中进行培育。在3天和4天时收集菌丝体。然后如实施例4所述分离来自这些菌丝体的细胞内蛋白质，并如实施例6所述分析GFP的存在情况。发现该转化体能产生一种物质，该物质在以395nm的光激发时在509nm处发出高峰荧光，其对应于GFP的发光峰值(图8)。这些结果表明gfp49的mRNA的校正导致在米曲霉(其可产生发荧光的GFP)中GFP的正确表达。
实施例16:GFP转化体的Southern分析将转化体ShTh582.1的孢子(GFP具有隐蔽内含子和GC含量变化)和ShTh581.1(GFP具有隐蔽内含子和GC含量变化及W57C突变)以及作为对照的ShTh590.1(野生型GFP)和BANe130.1(pBANe13无GFP)在YEG培养基中37℃下过夜培养。用MiFacloth过滤菌丝体，并用蒸馏水漂洗三次。排掉多余的水。用液氮冻结菌丝体并利用研钵与研杵研磨成粉末。用Purgene DNA分离试剂盒(Gentra系统公司。研究TrianglePark,NC)分离基因组DNA。
用PmeⅠ消化两微克取自每个样品的基因组DNA，并在1％琼脂糖上通过长度进行分级分离。在每一个步骤，使凝胶变性，中和，浸泡在20X SSC中10分钟。利用Schleicher和Schuell TurboBlotter将消化的DNA转移到硝酸纤维素膜上3小时，UV层联DNA。利用BoehringerMannheim特征系统(Boehringer Mannheim,Indianapolis,IN)探测膜。在42℃下，用Easy Hyb(Boehringer Mannheim,Indianapolis,IN)与膜进行预杂交1小时。利用pShTh58.2DNA，寡核苷酸96-67和96-68，及Boehringer Mannheim Dig DNA标记混合物(BoehringerMannheim,Indianapolis,IN)使GFP探针进行DIG标记。在它变性后，定量探针并加入1ng/ml。然后探测膜过夜。倒掉探针，室温下用2XSSC-0.1％SDS洗脱膜两次(每次5分钟)，并在65℃下用0.1XSSC-0.1％SDS洗脱膜两次(每次15分钟)。通过下列Boehringer Mannheim提供的方案，并利用Lumi-Phos 530(Boehringer Mannheim,Indianapolis,IN)检测Dig-标记的核苷酸。将这些膜置于胶片下20分钟。
这些结果表明在转化体ShTh582.1,ShTh581.1，和ShTh590.1中观察到了GFP带，而在BANe130.1转化体中没有观察到GFP带。
微生物的保藏按照布达佩斯条约，以下菌株已经保藏在农业研究机构专利培养物保藏中心(NRRL)，北方区域研究实验室，1815学院街，Peoria，伊利诺州61604，美国。
菌株保藏号保藏日期大肠杆菌DH5αpShTh58.2NRRL B-215841996年6月6日该菌株已在以下前提下保藏，即在本专利申请的未决期间，该培养物对于由专利商标委员会按照37C.F.R§1.14和35U.S.C.§122确定的有资格的人来说是可以获得的。该保藏物代表每一种所保藏菌株的基本上纯的培养物。在主题申请的相应申请或其后续申请在外国提出，外国专利法要求保藏时，该保藏物也是可获得的。然而，应该清楚保藏物的可获得性并不构成对破坏政府授予的专利权的主题发明的实施许可。
由于这些实施方案旨在说明本发明的几个方面，因而本文所描述和要求的本发明其范围并不受本文所揭示的具体实施方案限制。本发明的范围包括任何等同的实施方案。确实，通过先前的描述，除了本文所描述和显示的那些实施例之外，本发明的各种修改对于本领域技术人员来说是显而易见的。这样的修改也包括在附加权利要求的范围之内。
本文引用了各种参考文献，它们公开的内容本文以其整体一并参考。
序列表(1)一般信息(ⅰ)申请人(A)名称Novo Nordisk Biotech公司(B)街道1445 Drew路(C)城市Davis(D)州加利福尼亚(E)国家美国(F)邮区代码95616-4880(G)电话(916)757-8100(H)传真(916)758-0317(ⅱ)发明名称真菌表达的异源基因中隐蔽剪接位点的修饰方法(ⅲ)序列数20(ⅳ)通讯地址(A)收信人北美Novo Nordisk公司(B)街道405 Lexington街，第64层(C)城市纽约(E)国家美国(F)邮区代码10174-6401(Ⅴ)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0，版本#1.30(Ⅵ)当前申请的资料(A)申请号待指定(B)申请日1997年6月20日(C)分类号
(ⅷ)律师/代理人资料(A)姓名Agris Dr.,Cheryl H.
(B)登记号34,086(C)参考/证书号4855.204-WO(ⅸ)电讯信息(A)电话212-867-0123(B)传真212-878-9655(2)SEQ ID NO.1的信息(ⅰ)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO.1:TGTCACTACT TTCTCTTATG G 21(2)SEQ ID NO.2信息(ⅰ)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO.2:GTAATGGTTG TCTGGTAAAA G 21(2)SEQ ID NO.3信息(ⅰ)序列特征(A)长度41个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:3:TATCGGCCGC ACCGGCCAAG ATGAGTAAAG GAGAAGAACT T 41(2)SEQ ID NO:4信息(ⅰ)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:4:ATACATGCAT TTATTTGTAT AGTTCATCCA TGCCATGTGT 40(2)SEQ ID NO:5信息(ⅰ)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:5:TGTTACAAAC TCAAGAAGGA T 21(2)SEQ ID NO:6信息(ⅰ)序列特征(A)长度24个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:6:ATGAGTAAAG GAGAAGAACT TTTC24(2)SEQ ID NO:7信息(ⅰ)序列特征(A)长度85个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:7:AAGACTCGAG CCGAGGTCAA GTTCGAGGGC GATACCCTTT GTTAACCGCA TCGAGCTCAA60GGGCATTGAC TTCAAGGAGG ACGGC 85(2)SEQ ID NO:8信息(ⅰ)序列特征(A)长度83个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:8:GCTTGTCGGC CATGATGTAG ACGTTATGTG AGTTATAGTT GTACTCCATC TGTGGCCAAG60AATGTTGCCG TCCTCCTTGA AGT83(2)SEQ ID NO:9信息(ⅰ)序列特征
(A)长度84个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:9:CATCATGGCC GACAAGCCAA AGAACGGCAT CAAGGTTAAC TTCAAGATCC GCCACAACAT 60TAAGGACGGC AGCGTTCAGC TCGC84(2)SEQ ID NO:10信息(ⅰ)序列特征(4)长度50个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅲ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:10:CGCCGATCGG AGTGTTCTGC TGATAATGGT CGGCGAGCTG AACGCTGCCG50(2)SEQ ID NO:11信息(ⅰ)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:11:AAGACTCGAG CCGAGGTCAA G 21(2)SEQ ID NO:12信息
(ⅰ)序列特征(A)长度45个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:12:TCAAGCTTTA TGTCCAAGGG CGAGGAGCTC TTCACTGGAG TTGTC 45(2)SEQ ID NO:13信息(ⅰ)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:13:GATGCTCGAG TCTTGTAGTT CCCGTCATCT TTGTAAAA38(2)SEQ ID NO:14信息(ⅰ)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅲ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:14:GATGCGATCG GCGATGGCCC TGTCCTTTTA CCAGACAA 38(2)SEQ ID NO:15信息(ⅰ)序列特征
(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:15:TGAGAATTCG GATCCTTATT TGTATAGTTC ATCCATGCC 39(2)SEQ ID NO:16信息(ⅰ)序列特征(A)长度47个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:16:TCCATTTAAA TATGAGCAAG GGCGAGGAGC TCTTCACTGG AGTTGTC 47AGTTGTC 47(2)SEQ ID NO:17信息(ⅰ)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:17:TTCCTTAATT AATTATTTGT ATAGTTCATC CATGCC 36(2)SEQ ID NO:18信息(ⅰ)序列特征(A)长度36个碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:18:TGGAATAAGC TTTATGAGTA AAGGAGAAGA ACTTTT 36(2)SEQ ID NO:19信息(ⅰ)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:19:AAGAATTCGG ATCCCTTTAG TGTCAATTGG AAGTCT 36(2)SEQ ID NO:20信息(ⅰ)序列特征(A)长度751个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:20:ATGAGTAAAG GAGAAGAACT TTTCACTGGA GTTGTCCCAA TTCTTGTTGA ATTAGATGGC 60GATGTTAATG GGCAAAAATT CTCTGTTAGT GGAGAGGGTG AAGGTGATGC AACATACGGA120AAACTTACCC TTAAATTTAT TTGCACTACT GGGAAGCTAC CTGTTCCATG GCCAACGCTT180GTCACTACTT TCTCTTATGG TGTTCAATGC TTTTCAAGAT ACCCAGATCA TATGAAACAG240CATGACTTTT TCAAGAGTGC CATGCCCGAA GGTTATGTAC AGGAAAGAAC TATATTTTAC300AAAGATGACG GGAACTACAA GACACGTGCT GAAGTCAAGT TTGAAGGTGA TACCCTTGTT360AATAGAATCG AGTTAAAAGG TATTGATTTT AAAGAAGATG GAAACATTCT TGGACACAAA420ATGGAATACA ACTATAACTC ACATAATGTA TACATCATGG CAGACAAACC AAAGAATGGC480ATCAAAGTTA ACTTCAAAAT TAGACACAAC ATTAAAGATG GAAGCGTTCA ATTAGCAGAC540CATTATCAAC AAAATACTCC AATTGGCGAT GGCCCTGTCC TTTTACCAGA CAACCATTAC600CTGTCCACGC AATCTGCCCT TTCCAAAGAT CCCAACGAAA AGAGAGATCA CATGATCCTT660CTTGAGTTTG TAACAGCTGC TGGGATTACA CATGGCATGG ATGAACTATA CAAATAAATG720TCCAGACTTC CAATTGACAC TAAAGGGATC C 75权利要求
1．一种用于获得重组真菌宿主细胞的方法，所说的方法包括将编码异源多肽的核酸序列导入到真菌宿主细胞内，其中在核酸序列中至少有一个隐蔽剪接位点被修饰。
2．按照权利要求1的方法，其中至少一个隐蔽剪接位点通过非-共有序列取代至少一个隐蔽共有序列来修饰。
3．按照权利要求2的方法，其中隐蔽共有序列是5’隐蔽共有序列。
4．按照权利要求3的方法，其中5’隐蔽共有序列是GT,GC，或CT。
5．按照权利要求4的方法，其中5’隐蔽共有序列是GTANGT,GCANGT，或CTANGT，其中N是A,C,G，或T。
6．按照权利要求2的方法，其中隐蔽共有序列是3’隐蔽共有序列。
7．按照权利要求6的方法，其中3’隐蔽共有序列是AG。
8．按照权利要求6的方法，其中3’隐蔽共有序列是CAG,TAG，或AAG。
9．按照权利要求1的方法，其中由真菌宿主细胞产生的异源多肽的氨基酸序列是野生型多肽。
10．按照权利要求1的方法，其中通过用具有在约40％到约70％范围内的G+C百分含量的第二区取代包含至少一个隐蔽内含子或其部分的第一区来修饰至少一个隐蔽剪接位点。
11．按照权利要求10的方法，其中G+C百分含量为约40％到约60％之间。
12．按照权利要求11的方法，其中G+C百分含量为约40％到约50％之间。
13．按照权利要求10的方法，其中至少两个隐蔽内含子或其部分被取代。
14．按照权利要求1的方法，其中通过用非-共有序列取代核酸序列中的至少一个隐蔽共有序列和通过用具有在约40％到约70％范围内的G+C百分含量的第二区取代包含至少一个隐蔽内含子或其部分的第一区来修饰至少一个隐蔽剪接位点。
15．按照权利要求1的方法，其中至少两个隐蔽剪接位点被修饰。
16．按照权利要求1的方法，其中由真菌宿主细胞产生的异源多肽与对应的野生型多肽含有相同数量的氨基酸残基。
17．按照权利要求1的方法，其中非-共有序列与共有序列具有相同数量的核苷酸。
18．按照权利要求1的方法，其中所说的核酸序列编码激素，酶，受体，或报道分子。
19．按照权利要求1的方法，其中所说的核酸序列编码酶。
20．按照权利要求18的方法，其中所说的酶是氧化还原酶，转移酶，水解酶，裂合酶，异构酶，或连接酶。
21．按照权利要求19的方法，其中酶选自氨肽酶，淀粉酶，糖酶，羧肽酶；过氧化氢酶，纤维素酶，几丁质酶，角质酶，DNA酶，酯酶，α-半乳糖苷酶，β-半乳糖苷酶，葡糖淀粉酶，α-葡萄糖苷酶，β-葡萄糖苷，卤过氧化物酶，转化酶，漆酶，脂肪酶，甘露糖苷酶，卤斑葡聚糖酶酶，氧化酶，果胶分解酶，过氧化物酶，肌醇六磷酸酶，多酚氧化酶，蛋白水解酶，核糖核酸酶，及木聚糖酶。
22．按照权利要求18的方法，其中核酸序列编码报道分子。
23．按照权利要求22的方法，其中报道分子是Aequorea victoria绿色荧光蛋白质。
24．按照权利要求1的方法，其中真菌细胞是丝状真菌细胞。
25．按照权利要求24的方法，其中丝状真菌细胞是顶孢霉属，曲霉属，镰孢属，腐质霉属，毁丝霉属，脉孢菌属，青霉属，梭孢壳属，中国弯劲霉，或木霉属的某个种的细胞。
26．按照权利要求24的方法，其中丝状真菌细胞是曲霉属细胞。
27．按照权利要求26的方法，其中曲霉属细胞是米曲霉细胞，黑曲霉细胞，臭曲霉细胞，或日本曲霉细胞。
28．按照权利要求24的方法，其中丝状真菌细胞是镰孢属细胞。
29．按照权利要求28的方法，其中镰孢属细胞是尖镰孢细胞或禾谷镰孢细胞。
30．按照权利要求24的方法，其中丝状真菌细胞是腐质霉属细胞。
31．按照权利要求30的方法，其中腐质霉属细胞是Humicolainsolens细胞或Humicola lanuginosus细胞。
32．按照权利要求24的方法，其中丝状真菌细胞是毁丝霉属细胞。
33．按照权利要求32的方法，其中毁丝霉属细胞是Myceliophthorathermophila细胞。
34．按照权利要求24的方法，其中丝状真菌细胞是毛霉属细胞。
35．按照权利要求34的方法，其中毛霉属细胞是米黑毛霉细胞。
36．按照权利要求24的方法，其中丝状真菌细胞是链孢霉属细胞。
37．按照权利要求36的方法，其中链孢霉属细胞是粗糙脉孢菌细胞。
38．按照权利要求24的方法，其中丝状真菌细胞是青霉属细胞。
39．按照权利要求38的方法，其中青霉属细胞是产紫青霉细胞。
40．按照权利要求24的方法，其中丝状真菌细胞是梭孢壳属细胞。
41．按照权利要求40的方法，其中梭孢壳属细胞是Thielaviaterrestris细胞。
42．按照权利要求24的方法，其中丝状真菌细胞是木霉属细胞。
43．按照权利要求42的方法，其中木霉属细胞是Trichoderma reesei细胞，绿色木霉细胞，Trichoderma longibrachiatum细胞，Trichoderma harzianum细胞，或康宁木霉细胞。
44．按照权利要求1的方法，其中真菌细胞是酵母细胞。
45．按照权利要求44的方法，其中酵母细胞是念珠菌属，克鲁维酵母属，酵母属，裂殖酵母属，毕赤酵母属，或Yarrowia中某个种的细胞。
46．按照权利要求45的方法，其中酵母细胞是酵母属细胞。
47．按照权利要求46的方法，其中酵母属细胞是酿酒酵母细胞，卡尔酵母细胞，糖化酵母细胞，Saccharomyces douglasii细胞，克鲁弗酵母细胞，诺地酵母细胞，或Saccharomyces oviformis细胞。
48．按照权利要求45的方法，其中酵母细胞是克鲁维酵母细胞。
49．按照权利要求48的方法，其中克鲁维酵母细胞是乳酸克鲁维酵母细胞。
50．按照权利要求45的方法，其中酵母细胞是Yarrowia细胞。
51．按照权利要求50的方法，其中Yarrowia细胞是Yarrowialipolytica细胞。
52．一种用于修饰来源于在真菌宿主细胞中异源表达的分离的核酸序列的至少一个隐蔽剪接位点的方法，所说的方法包括用非-共有序列取代核酸序列中的隐蔽共有序列和/或通过用具有在约40％到约70％范围内的G+C百分含量的第二区取代包含至少一个隐蔽内含子或其部分的第一区来修饰至少一个隐蔽剪接位点。
53．一种按照权利要求53的方法获得的分离的核酸序列。
54．一种包含权利要求53的核酸序列的核酸构建体。
55．一种包含权利要求54的核酸构建体的重组表达载体。
56．按照权利要求55的载体，其中核酸序列有效地与启动子序列相连接。
57．按照权利要求55的载体，其中核酸序列有效地与转录终止信号相连接。
58．按照权利要求55的载体，其还包括选择性标记。
59．一种包含权利要求54的核酸构建体的重组真菌宿主细胞。
60．一种按照权利要求1的方法获得的重组真菌宿主细胞。
61．一种用于在真菌宿主细胞内异源产生多肽的方法，该方法包括在营养培养基中培养权利要求59的真菌细胞，并且从培养基中回收多肽。
全文摘要
本发明涉及用于获得包含编码异源多肽的核酸序列的真菌宿主细胞的方法,其中在核酸序列中至少有一个隐蔽剪接位点被修饰。本发明也涉及具有一个隐蔽剪接位点的核酸序列和包含所说的核酸序列的核酸构建体,载体,以及宿主细胞。本发明还涉及用于重组制备所说的核酸序列编码的多肽的方法。
文档编号C12N15/11GK1223691SQ97195895
公开日1999年7月21日申请日期1997年6月20日优先权日1997年6月20日
发明者S·A·索姆普森申请人:诺沃诺尔迪斯克生物技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.A.索姆普森
技术所有人：诺沃奇梅兹生物技术有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。