代谢进化方法
【专利摘要】本发明涉及代谢途径中天然芳族小分子产物的变体的代谢进化方法,其通过采用至少一种基因A的基因嵌合体来体细胞体内组装和重组所述代谢途径,所述方法包括:a)在单个步骤过程中,(i)用与作为细胞基因组的主要部分或存在于基因构建体的框架中的待重组的另一基因的序列同源性小于99.5%的至少一种基因A转化细胞,(ii)重组所述基因,(iii)在靶基因组的整合位点产生所述基因的基因嵌合体,其中所述至少一种基因A在与所述整合位点的5′或3′端锚定的5’端或3’端具有单侧翼靶序列,(iv)重组所述代谢途径的最终的其它基因,和b)选择能够表达所述变体的包括所述基因嵌合体和所述最终的其它基因的克隆,本发明涉及产生代谢途径中天然芳族小分子产物的变体的细胞文库的制备方法,和由此产生并用于制备所述变体的文库。
【专利说明】代谢进化方法
【技术领域】
[0001]本发明涉及代谢途径中天然芳族小分子产物的变体的代谢进化方法,其通过采用基因嵌合体来体细胞体内组装和重组所述代谢途径。
【背景技术】
[0002]蛋白质设计的首要目标之一是产生具有新的或改进的性质的蛋白质。为在蛋白质或酶上赋予期望活性的能力在化学和制药工业中具有相当大的实际应用。定向蛋白质进化已应运而生,成为蛋白质工程中强有力的技术平台,其中在变体文库中通过实验寻找拥有期望性质的克隆。
[0003]定向蛋白质进化利用自然选择的力量来进化具有期望性质但未在自然中发现的蛋白质或核酸。多种技术用于产生蛋白质突变体和变体并用于选择期望的功能。重组DNA技术已将单结构基因或整个通路基因转移至适合的替代宿主以便快速繁殖和/或高水平生产蛋白质。活性或其他性质的积累改进通常通过迭代突变和筛选而获得。定向进化的应用主要存在于学术和工业实验室,用以改进蛋白质稳定性并增强酶和有机体的活性或总体性能,或者用以改变酶底物特异性和设计新活性。大多数定向进化工程追求使在农业、医药或工业领域对人类有用的性质(生物催化)进化。
[0004]整个代谢途径的进化是特别吸引人的概念,这是因为大多数天然和新的化合物是通过途径而不是通过单个酶产生的。代谢途径工程通常需要途径中所有酶的协调操作。新的代谢途径的进化和生物处理的增强通常通过重组和筛选或选择的迭代循环的过程以进化单个基因、整个质粒、多基因簇或者甚至整个基因组来进行。
[0005]Shao等(I)描述了在酿酒酵母(Saccharomyces cerevisiae)中一步法组装编码整个生物化学途径的大型重 组DNA或基因组,其通过在5’和3’端包含相邻片段的5’或3’端序列的两个侧翼(锚定)区的体内同源重组来组装。
[0006]Elefanty等(2)描述了产生突变小鼠的基因靶向实验,其中IacZ报告基因已敲入至SCL座位。参考图1,示出了采用两个锚定序列,即5’和3’端各一个的SCL-1acZ基因靶向策略。
[0007]US7807422B2 (3)公开了通过重组微生物生产类黄酮。将一组基因引入异源宿主细胞,以使基因的表达导致酶的产生。
[0008]Naesby等(4)描述了在酵母中随机组装生物合成途径和生产多种天然产物或中间体。编码七步类黄酮途径的酶的基因被单独地克隆至酵母表达盒中,然后将酵母表达盒随机组合到酵母人工染色体上。类似地,Trantas等(5)能够在酵母质粒中表达编码类黄酮和芪途径的酶的异源基因。
[0009]定向进化可在活细胞中进行,也称为体内进化,或者可根本不涉及细胞(体外进化)。体内进化具有选择细胞环境中的性质的优势,当将进化的蛋白质或核酸用于生物体时这是有用的。酵母中的体内同源重组已广泛用于克隆、质粒构建和文库建立。
[0010]通过突变或重组获得文库多样性。DNA改组(DNA shuffling)允许来自多基因的有利突变定向重组。在DNA改组中,DNA序列群随机断裂,然后重组成全长杂合序列。
[0011]出于同源重组的目的,天然产生的同源基因用作起始多样性的来源。单基因改组文库成员典型地为超过95%的同一性。然而,家族改组允许典型地超过60%同一性的序列的嵌段交换(block exchange)。功能序列多样性来自自然选择存活下来的相关亲本序列;因此,在给定序列中容忍数量大得多的突变而不引入对结构或功能的有害影响。
[0012]在W01990007576A1(6)中记载了具有多达30%多样性的不同来源的DNA片段的重组。在错配修复缺陷菌或错配修复(MMR)体系暂时失活的细菌中通过属间和/或种间重组而在体内产生杂合基因。因此,避免了修复损伤DNA的那些过程,这将对趋异序列之间的重组频率即部分同源重组产生抑制效果。
[0013]文库的多样性可通过利用单倍体细胞有效配对而引起二倍体生物形成的能力来增强。在酿酒酵母的营养生命周期中,细胞具有单倍体基因组,即每个染色体以单拷贝存在。在特定条件下,单倍体细胞可配对。借此形成二倍体细胞。二倍体细胞可再次形成单倍体细胞,特别是在特定的营养素缺失的时候。然后它们经历称为减数分裂的过程,随后孢子形成而形成四个单倍体孢子。减数分裂期间,两个亲本基因组的不同染色体重组。减数分裂重组期间,DNA片段交换产生重组的DNA物质。
[0014]W02005/075654A1 (7)公开了在酿酒酵母中产生重组DNA序列的体系,其基于酿酒酵母的有性生殖周期。杂合二倍体细胞在诱导减数分裂和孢子形成过程的条件下生长。减数分裂通常的特征在于增加遗传重组频率。因此,减数分裂的产物(单倍体细胞或孢子)由于两种不同DNA序列之间的重组而可包含重组DNA序列。通过迭代法,选择重组单倍体后代并彼此配对,所得二倍体再次形成孢子,它们的后代孢子经受适当的选择条件,从而确定新的重组事件。该过程描述于野生型或错配修复缺陷型酿酒酵母细胞中。因此,将感兴趣的两侧各有两个选择标记的基因整合至错配修复缺陷型二倍体菌株的两个姐妹染色体中每一个的同一位点。DNA序列添加到与整合有DNA的基因座的侧翼DNA序列100%同一性的新DNA片段的5’或3’端。这些侧翼靶序列约400-450核苷酸长。然后迫使细胞起始孢子形成。孢子形成期间发生重组过程。所得孢子和重组序列可由选择适当侧翼标记来区分。
[0015]酵母有效重组同源DNA序列的能力还可用于增加文库的多样性。当享有89.9%同源性的两种基因通过PCR突变并转化至野生型酵母中时,通过体内同源重组建立10e7的嵌合文库,贯穿两种基因显示多个交叉点(8)。
[0016]尽管已通过工程化重组宿主进行了改进代谢途径来在工业规模上产生小分子的努力,但此类代谢产物的变体仅通过例如造成中间体积累的不完整途径而零星发现。
[0017]本发明的目的为提供作为代谢途径产物的天然芳族小分子的改善的生产方法。
[0018]该目的通过提供本申请实施方案来实现。
【发明内容】
[0019]根据本发明,提供代谢途径中天然芳族小分子产物的变体的代谢进化方法,其通过采用至少一种基因A的基因嵌合体来体细胞体内组装和重组所述代谢途径来进行,所述方法包括:
[0020]a)在单个步骤过程中,[0021](i)用与作为细胞基因组的整合部分或存在于基因构建体的框架中的待重组的另一基因的序列同源性小于99.5%的至少一种基因A转化细胞,
[0022](ii)重组所述基因,
[0023](iii)在靶基因组的整合位点产生所述基因的基因嵌合体,其中所述至少一种基因A在与所述整合位点的5'或3'端锚定的5’端或3’端具有单侧翼靶序列,
[0024](iv)重组所述代谢途径的最终的其它基因,和
[0025]b)选择能够表达所述变体的包括所述基因嵌合体和所述最终的其它基因的克隆。
[0026]特别优选将选择标记用于基因嵌合体,并根据选择标记的存在来选择克隆。例如,基因嵌合体包括选择标记,例如其中所述基因A连接至选择标记。可选地,还可通过重组体产生的任何产物的存在,例如借助确定产率或功能特性来进行选择。具体地,一种或多种不同的选择标记可用于区分基因嵌合体的类型。
[0027]用于本发明方法的选择标记可选自由已知的营养缺陷型标记、抗生素抗性标记、荧光标记、敲入标记、活化剂/结合域标记和显隐性标记以及比色标记中的任一种组成的组。优选的标记可暂时失活或功能性敲除,并可再建立以恢复其标记性质。进一步优选的标记为可追踪的基因,其中所述标记为基因序列A和/或其它基因如基因B的功能,而不是具有标记功能的单独序列,以便基因嵌合体的表达可通过检测嵌合体本身来直接确定。在该情况下,基因嵌合体是直接可追踪的。
[0028]根据特定实施方案,所述基因包括在线性多核苷酸、载体或酵母人工染色体中。具体地,基因A和/或待重组的其 它基因为优选300-20,OOObp的线性多核苷酸的形式。具体地,没有必要构建或采用质粒或大质粒。因此基因可被原样使用,即不需要载体。
[0029]用于重组和整合的基因还可包括在任何基因构建体中,所述基因构建体例如将用作承载所述基因的载体。所述基因因此可包括在基因构建体如线性多核苷酸、载体或酵母人工染色体中。这些优选包括线性多核苷酸、质粒、PCR构建体、人工染色体、类酵母人工染色体、病毒载体或转座元件。
[0030]根据本发明的特定实施方案,靶基因组的整合位点位于各基因中,例如在线性多核苷酸、质粒或染色体(包括人工染色体)中。
[0031]具体地,所述另一基因为靶基因组例如细胞基因组的一部分。在优选的实施方案中,所述另一基因为作为细胞基因组的一部分的基因B。
[0032]根据可选的优选实施方案,所述另一基因为从靶基因组分离的基因构建体,例如线性多核苷酸,并在重组过程中任选地整合进靶基因组中。
[0033]根据本发明,根据所述方法的具体方面,用至少一种基因A和至少一种基因B共转化所述细胞,其中所述基因A的单侧翼靶序列锚定至所述靶基因组上的整合位点的5'端,并且其中基因B连接至锚定于整合位点3’端的单侧翼靶序列。
[0034]具体地,可用具有选择标记的至少一种基因A和至少一种基因B共转化细胞,其中所述基因A的单侧翼靶序列锚定至所述靶基因组的整合位点的5'端,并且其中基因B连接至锚定于整合位点3’端的不同选择标记和单侧翼靶序列,并且其中选择至少两种选择标记的克隆。
[0035]具体地,用至少两种不同基因Al和A2,并任选地用至少两种不同的基因BI和B2共转化细胞。[0036]根据本发明,根据所述方法的另一方面,共转化至少一种其它基因C,所述其它基因C具有与基因A和/或所述另一基因如基因B的序列杂交的序列,从而获得所述其它基因C与基因A和/或所述另一基因的组装和最终的重组。
[0037]具体地,所述基因C的杂交序列与所述序列具有小于99.5%的序列同源性,并优选至少30%的序列同源性。
[0038]具体地,选择所述基因中具有至少一种核苷酸置换或交叉的基因嵌合体,即具有基因内交叉的嵌合体,例如包括基因A的一部分和结合的所述另一(多个)基因的一部分的那些,其被理解为部分基因的混合物,从而获得重组基因内基因嵌合体,例如适用于以不同方式如具有改进性质或改进产量表达产物的基因。此类基因内基因嵌合体可通过一系列基因的重组并优选组装来生产,其中一种或多种组装的基因具有这种基因内基因嵌合体。
[0039]根据优选实施方案,可获得至少三种不同基因A和/或B和/或C的嵌合体。
[0040]优选的,所述基因A和/或所述另一基因为非编码序列或编码多肽或具有活性的多肽的一部分的序列。
[0041]具体地,本发明方法采用编码具有活性的多肽的一部分的基因A、B和/或C。因此,基因如基因A和/或B和/或C,优选其全部本身都不独立地编码生物学活性多肽,而仅编码其部分,并仅在基因组装时可引起相应活性或修饰活性。
[0042]使用本发明的方法,可组装和重组编码生物化学途径的多肽的多基因。根据优选的实施方案,重组和组装所述代谢途径的至少两种基因,例如重组和组装编码所述代谢途径的多肽的至少两种基因。
[0043]具体地,所述基因为优选300-20,OOObp的线性多核苷酸。
`[0044]根据具体实施方案,获得至少3个、优选至少9个、多至20,000个碱基对优选每700bp具有3个交叉事件的基因嵌合体。优选包括至少一种基因内嵌合体的基因嵌合体,其每700bp碱基对、优选每600bp、每500bp或甚至更低,优选具有至少3个交叉事件,优选至少4、5或10个交叉事件。典型地,高交叉事件提供大的重组基因多样性,这可用于生产选择适当文库成员的文库。嵌合体或交叉事件的程度可被理解为此类文库的质量参数。
[0045]根据本发明的方法具体提供了具有基因内基因嵌合体的至少一种克隆的选择。具体地,选择具有基因组装和至少一种基因内基因嵌合体的至少一种克隆。
[0046]根据本发明方法修饰的基因可为例如出于科学或工业目的用于源材料的酶促加工来产生有机小分子的任何基因。这些基因可编码,例如整个或部分多肽的变体,包括那些部分序列,其不编码具有生物学活性的多肽,所述多肽具体选自由酶、转录因子、转运蛋白、信号肽、受体、激素、生长因子组成的组,但还可编码可改善产物表达的非多肽基因,例如启动子、终止子及其它调控因子。
[0047]因此,如此处所理解的,用于包括“酶促进化”或“酶促合成”的“代谢进化”的序列的重组和/或组装是指,例如由酶变体或由改善酶(包括辅因子)的表达或活性的化合物来支持代谢途径的酶促加工的序列嵌合体,以及非编码序列。
[0048]如果编码作为具有生物活性的多肽的部分的氨基酸序列的基因(也称为“部分基因”)被修饰,可优选此类部分基因的组装具有功能特性,如编码具有生物活性的多肽。优选若干不同基因,如大小在3bp-20,OOObp范围内、具体至少lOObp,优选300bp_20,OOObp,具体多至10,OOObp的不同的部分基因重组,其中不同基因的数量为至少2,更具体至少3、4、5、6、7、8、9,或至少10,从而产生编码例如具有被有利调节的生物活性,如具有增加的生物活性的重组多肽的重组基因序列。如在这一点上使用的术语“生物活性”具体是指酶促活性,例如将特定底物转化为特定产物的活性。根据本发明作为多样化的优选基因编码多链多肽。
[0049]根据本发明的方法具体是指选自由苯丙素类(phenylpropanoids)、类黄酮、黄酮醇、花青苷、木质素、花青素、查耳酮、香草醛和及其天然产生的衍生物(通常包括中间体)组成的组的天然芳族小分子。
[0050]特别地,所述变体由重组酶变体合成。
[0051]在具体实施方案中,酶变体由此类基因嵌合体例如直接通过基因嵌合体的重组和最终组装,或作为此类基因嵌合体例如通过一系列酶促过程的结果来获得。典型的方法是指肉桂酸酯-4-水解酶(C4H)和编码具有改善的或新的酶学特性(enzymologicproperties)的酶的C4H产生基因。 [0052]4-香豆酰(coumaroyl)CoA是聚丙烷类(polypropanoid)代谢中的关键分子,也是用于界定类黄酮和芪合成的重要连接点的连接酶4CL的底物。关键酶CHS合成用作类黄酮和异黄酮合成中间体的查耳酮。
[0053]根据优选的实施方案,所述变体为具有选自例如由功能分析确定的抗菌、抗氧化、芳香(fragrant)和风味(flavorful)活性的组的生物活性的苯丙素类。
[0054]特别优选的方法采用酶和包括至少2个具有生物活性的酶的酶途径的重组和组装,从而获得具有相应基因嵌合体的酶变体或途径变体,用于加工生物源材料或阵列,进而产生具有新结构和功能的天然芳族小分子的变体。由此首次能够通过酶进化合成新的小分子。
[0055]任何有重组能力的真核或原核宿主细胞可用于通过根据本发明的体细胞体内重组产生基因嵌合体。根据本发明的优选实施方案,所述细胞为修复缺陷型细胞,例如核酸修复缺陷型细胞,如具有DNA修复缺陷,即DNA修复缺陷型细胞,或MMR缺陷型细胞。
[0056]具体地,所述细胞为真核细胞或原核细胞,优选真菌、哺乳动物或植物细胞。
[0057]优选地,所述细胞为曲霉属(Aspergillus sp)或真菌细胞,优选地,其可选自由酵母属(Saccharomyce)、念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、汉逊酵母属(Hansenula)、裂殖酵母属(Schizosaccaromyces)、耶氏酵母属(Yarrowia)、毕赤酵母属(Pichia)和曲霉属(Aspergillus)组成的组。
[0058]优选地,采用单倍体菌株,例如单倍体酵母菌株。
[0059]可选地,可使用原核生物如大肠杆菌(E.coli)、芽孢杆菌属(Bacillus)、链霉菌属(Streptomyces)或哺乳动物细胞诸如HeLa细胞或Jurkat细胞,或植物细胞诸如拟南芥属(Arabidopsis)。
[0060]根据具体实施方案,侧翼祀序列为至少5bp,优选至少IObp,更优选至少20bp、50bp、100bp,多至5,OOObp长。具体地,侧翼靶序列连接至所述基因或为所述基因的整合、末端部分。优选所述侧翼靶序列与所述整合位点的锚定序列杂交具有30%至99.5%范围内的同源性,优选小于95%、小于90%、小于80%。
[0061]当根据本发明使用锚定至基因组的靶整合位点的至少两种不同侧翼靶序列时,优选它们不相互重组,优选它们享有小于30%的同源性。[0062]根据本发明的特定实施方案,提供基因变体的细胞展示方法,其包括使用根据本发明的方法在细胞中建立基因嵌合体的变体,在所述细胞表面展示所述变体,从而获得嵌合体文库。
[0063]根据本发明的具体方面,提供产生代谢途径中天然芳族小分子产物的变体的细胞文库,其包括通过采用至少一种基因A的基因嵌合体来体细胞体内组装和重组所述代谢途径来工程化重组细胞,所述方法包括:
[0064]a)在单个步骤过程中,
[0065](i)用与作为细胞基因组的整合部分或存在于基因构建体的框架中的待重组的另一基因的序列同源性小于99.5%的至少一种基因A转化细胞,
[0066](ii)重组所述基因,
[0067](iii)在靶基因组的整合位点产生所述基因的基因嵌合体,其中所述至少一种基因A在与所述整合位点的5,或3,端锚定的5’端或3’端具有单侧翼靶序列,
[0068](iv)重组所述代谢途径的最终的其它基因,和
[0069]b)收集能够产生所述变体的包括所述基因嵌合体和所述最终的其它基因的克隆。
[0070]根据本发明的另一方面,提供通过此类方法可获得的文库,所述文库包括至少10E3种产生包含至少1%,更优选至少10%,更优选至少20%,更优选至少40%,更优选至少60%,更优选至少80%,甚至更优选至少90%,更优选至少95%的功能ORF的所述变体的不同克隆。
[0071]很好理解,术语“可获得”还指通过所述方法获得的产物。
[0072]根据具体实施方案,提供包括编码一系列(repertoire)代谢途径的重组基因的细胞文库,所述细胞文库通过根据本发明的方法可获得。
[0073]具体地,所述文库为包括编码一系列合成酶的重组基因的细胞文库。
[0074]具体地,提供合成 重组酶的文库,所述文库可由根据本发明方法可获得的此类文库来获得。
[0075]通过此类优选的展示可获得的文库具体包括功能开放阅读框(ORF)内的高百分比的基因嵌合体,优选至少80%。
[0076]根据本发明的文库具体可以为任何适合的形式,具体为包括各种含有基因变体的生物体的生物文库。根据本发明的生物文库可包含在生物群体中和/或具体由生物群体表达,从而建立一系列生物体,其中个体生物包括至少一种文库成员。
[0077]根据本发明的具体方面,进一步提供包括来自此类文库的基因变体的生物体,例如选自一系列生物体的生物体。根据本发明提供的生物体可用于在适合的表达体系,例如生产宿主细胞中表达基因表达产物。
[0078]根据本发明的方法优选进一步提供用于从根据本发明的文库例如通过功能分析选择天然芳族小分子的变体。
[0079]优选进一步例如通过确定所述变体的结构和功能来表征变体。
[0080]在具体实施方案中,所述方法进一步包括在重组宿主中生产所述变体。
[0081]在另一具体实施方案中,所述方法进一步包括合成生产所述变体。
【专利附图】
【附图说明】[0082]图1:非减数分裂体内重组
[0083]重组同源基因A和B (小于99.5%的同源性)。由于标记序列和侧翼靶序列不同源,重组/组装仅发生在基因A和B之间。结果,杂合/嵌合DNA包含重组基因A和B、两种标记和两种侧翼靶序列。基因嵌合体整合至靶染色体的靶基因座内。已整合整个构建体的克隆在对两种标记具有选择性的适当培养基上生长。
[0084]T5’和T3’对应于酵母基因组上的靶序列(小于99.5%的同源性)(约400bp),引起在染色体位点上的同源整合。Ml和M2为双重选择的侧翼标记。基因A和基因B是具有给定同源度(degree of homology)(小于99.5%)的相关的部分同源形式。重叠序列对应于两种基因的整个0RF。在MMR缺陷型酵母转化株中通过部分同源重组组装后,双重选择允许重组体的分离。
[0085]图2:通过部分同源重组的DNA的重组和组装
[0086]该图示出具体实施方案的示意性描述,其中用至少两种基因(此处DNA片段A和B)共转化细胞,在其80bp的重叠部分上具有小于99.5%的同源性。各DNA片段的侧翼为一个选择标记。
[0087]片段A包含对应于染色体上5’端正确整合位点的侧翼靶序列和与片段B重叠的杂交区,片段B包含对应于3’整合位点的侧翼靶序列和与片段A重叠的杂交区。用所得片段转化错配缺陷型酵母细胞。所得转化株涂在对两种标记具有选择性的培养基上。分离可选择两种标记的克隆,重组/整合簇的完整性以及基因A和B的ORF的重构由所选重组体的基因组DNA的分子分析证实。
[0088]T5’和T3’对应于酵母基因组上的靶序列(小于99.5%的同源性)(约400bp),引起在染色体位点上的同源重组。Ml和M2为双重选择的侧翼标记。DNA片段A和B可组装至一个基因(可为可追踪的,如GFP),或可表示通过该方法组装的两种基因。所有基因的重叠序列具有小于99.5%的同 源性(120bp),允许组装后通过部分同源重组的ORF的重构。双重选择允许重组体分离并用作组装的初步证实。
[0089]图3:基因A、B和C的重组和组装
[0090]该图示出另外的基因C的共转化,基因C具有与基因A和/或B的侧翼序列杂交从而获得所述基因C与基因A和B的组装的序列。
[0091]T5’和T3’对应于酵母基因组上的靶序列(小于99.5%的同源性)(约400bp),引起染色体位点上的同源重组。Ml和M2为双重选择的侧翼标记。基因A、基因B和基因C为具有给定的同源度(小于99.5%)的相关的部分同源形式。重叠序列对应于基因的5’部分和3’部分。基因B连接侧翼片段,新的ORF ABC通过序列相似性重建。在MMR缺陷型酵母转化株中通过部分同源重组组装后,双重选择允许重组体的分离。
[0092]图4:通过包含部分同源基因序列的片段的类黄酮途径的组装
[0093]该图示出8个片段的共转化,所述8个片段包括用于从苯丙氨酸开始生产类黄酮的8个基因。各片段仅在各亲本基因(部分同源或同源序列)的整个ORF区中杂交和重组。由此,整个途径在DNA缺陷修复型酵母细胞中重组,然后整合至染色体中。
[0094]Tg5’和Tg3’对应于酵母基因组上的靶序列(小于99.5%的同源性)(约400bp),引发向期望的染色体位点的同源整合。URA3和HPH(潮霉素抗性)为能够双重选择重组途径的侧翼标记。基因CH1、F3H、PAL、CHS、C4H、FLS和4CL为具给定的同源度(小于99.5%)的相关的部分同源形式。各基因具有允许它们在酵母细胞中表达的一个启动子和一个终止子序列。重叠序列对应于基因的整个ORF。在MMR缺陷型酵母转化株中通过部分同源重组组装片段后,功能重组的完整途径重建,并且双重选择允许重组体的分离。
[0095]各基因的植物来源用三个字母后接基因名来表示,也以三个字母示出。对应的植物物种在左侧表示。基因的部分同源形式之间的序列同一性以百分比表示。在一些片段旁的符号*表示这些还用于同源整合,意指重叠片段的基因序列为100%—致(野生型对照,克隆H3)。
[0096]图5:新的重组类黄酮途径的结构和用于扩增各组装片段的引物
[0097]该图示出在如图4所述用合成DNA片段转化后DNA修复缺陷型酵母细胞中整合的类黄酮途径的最终体内重组结构。灰色箭头(第一个和最后的箭头)对应于选择标记,黑色箭头表示类黄酮途径的具体基因,白色框表示各基因内的启动子和终止子序列(详情参见图4)。该图还列出用于扩增图4中示出的各片段的引物。对于引物详情和功能参见表6。
[0098]图6:用于证实途径组装和扩增测序用重组基因的引物
[0099]如图5所示,该图示出用于证实酵母菌中整合后片段组装并用于扩增用于测序分析的重组基因的引物。对于引物详情和功能参见表7。
[0100]图7:由克隆Ml获得的重组途径的嵌合序列
[0101]7A:该图示出由包含类黄酮途径的表达盒的片段在酵母中组装和整合获得的7个重组基因的嵌合结构。从选择的克隆中提取基因组,并将特定引物用于扩增重组类黄酮基因。白色框对应于来自亲本基因`A的序列(即PA=CHI基因,来自大豆(Glycine max),还存在于H3 [野生型对照]克隆中)。黑色框对应于来自基因B的序列(即PB=CHI基因,来自菊花属(Chrysanthemum sp.)物种)。Ml克隆中存在超过I个核苷酸的交换说明了作为组装的结果的亲本基因之间的交叉事件(详情参见图14的序列)。7B:所用各亲本基因的基因名称和植物来源的参考。
[0102]图8:来自包含类黄酮途径的重组克隆的酵母上清液的抑菌效果
[0103]该图示出表达类黄酮基因的酵母培养上清液对大肠杆菌培养细胞的抑制效果。将1/10体积的包含重组类黄酮途径的克隆的诱导上清液添加至9/10体积的接种有大肠杆菌T0P10细胞的LB中,0D600为0.05。在几个时间点,测量0D,并将所得值与不表达类黄酮基因的相应对照相比较。当添加克隆H3、M1、M7和M8的上清液时观察到对大肠杆菌生长的强抑制效果。没有观察到克隆M3和M4,以及阴性对照克隆Y26或仅使用酵母培养基的显著效果。
[0104]图9:酵母培养上清液中在类黄酮存在下的DPH粹灭(quenching)
[0105]该图示出由表达重组类黄酮途径的克隆产生的化合物如在类黄酮情况下所公知的能够猝灭DPH。用乙酸乙酯提取包含重组类黄酮途径的克隆的酵母培养诱导上清液并冻干。以1/10初始体积的70%乙醇回收颗粒。将9 ill各样品添加至I U 10.1mM的DPH(DMS0中)中并混合。然后,将I加样在Hybond-C膜上并在紫外透射仪(UV-transi Iuminator)上观察样品的猝灭(插图(inset)A)。程序Image-J用于测量斑点的信号强度。将值标准化(normalized)为利用仅由培养基制备的提取物所获得的信号(未猝灭)。柚皮素(Naringenin) (I u M)用作最大猝灭的对照。H3、Ml、M4和M7克隆揭示了猝灭值较高,而克隆M2、M3和Y26 (阴性对照)观察到弱的效果或无效果。
[0106]图10:基因和蛋白质嵌合体OXAl 1/0XA7 (SEQ ID N0sl-14)的序列
[0107]0XA7来源的核苷酸序列加粗和下划线,突变的核苷酸序列加粗斜体。
[0108]通过双重选择分离克隆,DNA用于扩增和测序。仅使用清楚可读的双链序列。用类Clustal程序比对所得色谱图。
[0109]图11:基因和蛋白质嵌合体OXAl 1/0XA5 (SEQ ID N0sl5_38)的序列
[0110]0XA5来源的核苷酸序列加粗和下划线,突变的核苷酸序列加粗斜体。
[0111]通过双重选择分离克隆,DNA用于扩增和测序。仅使用清楚可读的双链序列。用类Clustal程序比对所得色谱图。
[0112]图12:亲本基因 OXAl I (绿脓杆菌(P.aeruginosa),G1: 296549,SEQ ID39)、0XA7(大肠杆菌,G1:516188, SEQ ID40)和 0XA5 (绿脓杆菌,G1: 48856,SEQ ID41)的序列
[0113]图13:包括复合嵌合基因的克隆的序列,对应于部分同源组装0XA11/0XA5/0XA7
[0114]序列克隆和相应蛋白质退火的结果:图13a)0UL3-05-1I(SEQ ID N0s42and43),图13b)0UL3-05-1II(SEQ ID N0s44 和 45),图 13c) 0UL3-05-1V (SEQ ID N0s46 和 47),图 13d)0UL3-05-1X(SEQ ID N0s48和 49),和图 13e) 0XA11/0XA5/0XA7 的 0UL3-05-X(SEQ ID N0s50和 51)。
[0115]0XA5的核苷酸序列加粗,对应于0XA7`的核苷酸序列加下划线。未加粗、非下划线的序列对应于OXAlI。
[0116]图14:实施例3的重组克隆的序列
[0117]序列克隆和结果提供为SEQ ID No:52-58。
[0118]图15:重组克隆Ml的诱导嵌合体C4H酶与对照克隆H3相比能够积累更高量的对
香豆酸
[0119]该图示出,在部分诱导条件下,并通过想培养基添加肉桂酸,克隆Ml (嵌合类黄酮途径)的上清液与对照(无嵌合体)H3克隆相比包含两倍以上的对香豆酸。
[0120]培养物在蔗糖的存在下生长,从而在无外源苯丙氨酸和甲硫氨酸下表达PAL活性,进而诱导C4H表达。通过向培养基添加150 μ M的前体来进行肉桂酸酯供给。在不同时间取等份培养物,并通过片化(pelleting)细胞获得上清液。在SPE柱上提取上清液,并通过使用C18HPLC柱和如(4)所记载的丙腈/水梯度的标准操作手册分离甲醇提取物。用标准分子预先校准的使用峰下面积计算上清液中对香豆酸和肉桂酸的摩尔浓度。将值标准化为培养物中的细胞数。对香豆酸的生产如连续的黑线所示。H3对照克隆对应于黑色方形,嵌合体Ml克隆对应于黑色菱形。浅灰色线示出供给前体肉桂酸酯的消耗。
[0121]图16:在用柚皮素-查尔酮供给期间在对照(无嵌合体)和Ml (嵌合体)克隆的上清液中的中间体和最终的类黄酮产物的不同产量
[0122]该图示出,当完全诱导的培养物供给有150 μ M柚皮素-查尔酮(NAR)时,Ml (黑色方形)上清液中对香豆酸的量比Η3(黑色菱形,插图Α)高5倍。阴性对照值用灰色三角形标识。在SPE柱中提取上清液,并通过使用C18HPLC柱和如(4)所记载的丙腈/水梯度的标准操作手册分离甲醇提取物。12小时时肉桂酸酯的产生和消耗(插图B)与12小时时二氢堪非醇(dihydrokaempferol)的产生(插图C)相关,这最后肯定源自供给分子柚皮素。最终的类黄酮产物堪非醇紧随其后(18小时,插图D)。Ml克隆产生的堪非醇的量比对照H3少3倍,然而嵌合体克隆比对照H3消耗更多的前体。这些差异表明重组发生的嵌合性导致最终和中间产物的生产改善,并示出在相同的培养和供给条件下重组途径的前体和/或中间体的利用表现不同。
【具体实施方式】
[0123]因此,本发明涉及天然芳族小分子的变体的酶促进化,其首次可通过新的和高效方法用于体内重组部分同源DNA序列,即相似但不相同的序列。下文中术语同源重组(在重组部分同源序列时有时称为部分同源重组)是指具有一定同源性的序列重组,其可以相同或可以不相同。不像依靠位点特异性消化和连接的常规克隆方法,同源重组比对互补序列并能够在片段之间交换。重组嵌合基因,也称为杂合基因,通过具有错配碱基的序列杂交在细胞中产生。通过这样的创造性突变形成方法,可容易以时间有效的方式建立适用于选择和设计感兴趣多肽的多样性。
[0124]具体地,本发明通过体内重组的功能体系,在单个步骤过程中采用不同基因的有效重组和嵌合体形成、多样化和组装。
[0125]术语“单个步骤过程”是指工程化重组的几个工序,如用基因转化细胞、基因重组、嵌合基因的重组和基因整合至靶基因组中,典型地在一个方法步骤中进行。因此,将会不需要在体内重组之前的体外重组DNA载体,或任何工序的重复循环,包括采用减数分裂的那些。有利地,可避免减数分裂酵母细胞的使用。
[0126]根据本发明的单个步骤过程可甚至包括由宿主在同一时间表达此类设计重组体。从而没有必要进一步操作来获得表达产物。
[0127]根据本发明的术语“基因嵌合体”是指至少两种不同基因与至少一个交叉事件的组合。具体地,此类交叉提供DNA序列的组合或混合。基因嵌合体可通过(多个)基因的基因内混合、基因内基因嵌合和/或基因组装来建立,基因组装理解为连接基因,例如至少两种线性基因或其部分头尾连接,从而获得例如在重叠部分的具有基因间交叉的基因组装,和可选地通过重叠串在一起的复合基因,进一步可选地具有基因内和基因间(多个)交叉两者的基因或(多个)基因嵌合体的组装。
[0128]术语“交叉”是指在两条DNA链可交换遗传信息的位点处基因(即至少一个核苷酸)之间的重组。交叉过程导致后代嵌合基因具有来自亲本基因的基因或序列的不同组
口 o
[0129]任选地,可提供不基于交叉的其它修复机制,例如包括链连接后的识别错误核苷酸、删除和/或置换的核苷酸切除修复或非同源端连接机制。
[0130]术语“侧翼靶序列”是指核苷酸序列与感兴趣的靶标互补的区域,例如基因组靶整合位点,包括基因A和/或待重组的其它基因、线性多核苷酸以及线性或环状质粒YAC等的位点。由于具体的互补或同源度,侧翼靶序列可与基因杂交并将基因整合至靶整合位点。
[0131]术语细胞的“基因组”是指全部生物体遗传信息,由基因和DNA的非编码序列,或为染色体或为非染色体遗传因子表示,例如诸如包括基因A和/或待重组的其它基因等的线性多核苷酸、病毒、自我复制媒介(carriers)和载体(vectors)、质粒和包括人工染色体等的转座子。人工染色体为线性或环状DNA分子,包含引入细胞时稳定保持所必需的所有序列,它们表现得类似于天然染色体,因而被认为是基因组的一部分。[0132]术语“同源性”表示两种以上的核苷酸序列在相应位置具有(达到一定程度的,高达100%的)相同或保守碱基对。对于如本文公开的全长天然DNA序列或DNA序列的片段,同源序列,也被称为互补的、相应的或匹配的序列,如根据本发明所使用的优选与同源配对序列杂交,例如与相应的互补序列具有至少30%序列同一性,但小于99.5%序列同一性,可能小于95%、小于90%、小于85%或小于80%。优选地,同源序列将具有至少约30%的核苷酸序列同一性,优选至少约40%同一性,更优选至少约50%同一性,更优选至少约60%同一性,更优选至少约70%同一'丨生,更优选至少约80%同一'丨生,更优选至少约90%同一'丨生,更优选至少约95%同一性。如上所不限制上下限的优选范围为在30%至99.5%的相应序列同一性的范围内。如本文所示用的,同一度(degree of identity)通常还是指互补序列。
[0133]相对于基因的核苷酸序列的〃百分比(%)同一性〃定义为与DNA序列中的核苷酸同一的候选DNA序列中的核苷酸的百分比,在比对序列并引入间隙(gap)后,如有必要的话,获得最大百分序列同一性,并且不考虑任何保守替换作为序列同一性的一部分。为了确定百分比核苷酸序列同一性的比对可以以本领域技术中的各种方式,例如使用公开的计算机软件来实现。本领域技术人员可确定适当的参数用于测量比对,包括任何所需算法来实现要比较的序列的全长上的最大比对。
[0134]术语“锚定”意指基因或基因嵌合体与整合序列通过称为“锚定序列”的片段利用部分或完全序列同源性来结合,从而使此类基因或基因嵌合体能够整合至基因组的整合位点中。具体地,锚定序列可为与基因组的整合位点同源或部分同源的侧翼靶区域。优选的锚定序列具有优选与靶整合位点的至少约70%的序列同源性,更优选与基因组的杂交部分至少80%、90%、95%、多至99.5%或完全匹配。
[0135]整合位点可适当地为宿主基因组上的确定的基因座,此处会发生高频重组事件。优选的基因座为,例如酿酒酵母的III号染色体上的BUD31-HCM1基因座。通常,优选显示高频重组但没有细胞生存 能力变化的酵母染色体上的任何其它基因座。
[0136]术语〃表达”或“表达体系〃或“表达盒”是指包含可操作地连接的期望的编码序列和调控序列的核酸分子,以便转化或转染有这些序列的宿主能够产生编码蛋白。为了影响转化,表达体系可包括在载体中;然而,相关DNA也可整合至宿主染色体中。
[0137]术语“基因”还应包括基因的DNA片段,特别是那些部分基因。片段还包含几个开放阅读框,为相同ORF或不同ORF的重复。该术语应具体包括核苷酸序列,其全部或部分为非编码多肽如未转录或未翻译序列,或编码多肽。
[0138]根据本发明使用的术语“基因A”应意指编码感兴趣的非编码序列或一个或多个多肽的任何核苷酸序列。基因A的特征在于,存在于基因构建体例如表达盒、线性多核苷酸、质粒或载体的框架中,其优选至少包括标记序列并在基因A或基因构建体的5’端或3’端具有单侧翼靶序列。在根据本发明的方法中,基因A典型地为用于基因嵌合体形成的一系列基因中的第一个基因。基因A与待重组的另一基因同源,待重组的另一基因根据具体情况最终为基因A的变体,或基因B、C、D、E、F、G、H等任一个。从而,出于最大保真目的,典型地每个基因A仅提供一个侧翼靶序列。基因A的变体称为基因A1、A2、A3等,其具有一定程度的序列同源性,和可选地类似的功能特性。术语“至少一种基因A”应意指至少基因A和可选地基因A的变体。
[0139]根据本发明使用的术语“基因B”应意指感兴趣的非编码序列或一个或多个多肽,其选择为与待重组的另一基因用于基因嵌合体形成,待重组的另一基因根据具体情况最终为基因A,基因B的变体,或基因C、D、E、F、G、H等任一个。基因B与基因A或其它基因一定程度上同源,从而使得能够与基因A或待重组的其它基因嵌合体形成。在根据本发明的方法中,基因B典型地为用于基因嵌合体形成的一系列基因中的最后一个基因。基因B可为细胞基因组的整合部分,或存在于基因构建体例如表达盒、线性多核苷酸、质粒或载体的框架中,其优选至少包括标记序列并在基因B或基因构建体的5’端或3’端具有单侧翼靶序列,作为基因A的侧翼靶序列的配对物,意指在基因的另一端。如果基因A的侧翼靶序列在基因A的5’端,则基因B将典型地在3’端具有其侧翼靶序列,反之亦然。从而,出于最大保真目的,典型地每个基因B仅提供一个侧翼靶序列。基因B可为基因A的变体。基因B的变体称为基因B1、B2、B3等,其具有一定程度的序列同源性,和可选地类似的功能特性。术语“至少一种基因B”应意指至少基因B和可选地基因B的变体。
[0140]根据本发明使用的术语“基因C”应意指编码感兴趣的非编码序列或一个或多个多肽的任何核苷酸序列。基因C的特征在于,存在于基因构建体例如表达盒、线性多核苷酸、质粒或载体的框架中,其可选地包括标记序列,并且进一步的特征在于其核苷酸序列的片段根据具体情况与基因A和/或基因B,基因C的变体或最终的其它基因D、E、F、G、H等同源。基因C优选具有在基因C的5’端或3’端的单侧翼靶序列或在两侧的侧翼靶序列。从而,基因C可与基因A和/或待重组的其它基因部分或完全杂交,连接和组装基因。在根据本发明的方法中,基因C典型地为用于基因嵌合体形成的一系列待重组基因中的在基因A后的第二个基因。基因C的变体称为C1、C2、C3等,其具有一定程度的序列同源性,和可选地类似的功能特性。
[0141]另外的基因D可任选地通过与基因C的序列同源的其核苷酸序列或其核苷酸序列的片段的杂交来重组和组装,基因D的变体或最终的其它基因A、B、E、F、G、H等根据具体情况提供各自的重组和连接。基因D优选具有在基因D的5’端或3’端的单侧翼靶序列或在两侧的侧翼靶序列。在根据本发明的方法中,基因D典型地为用于基因嵌合体形成的一系列待重组基因中的在基因C之后的下Iv基因。基因D的变体称为Dl、D2、D3等,其具有一定程度的序列同源性,和可选`地类似的功能特性。
[0142]另外的基因E可任选地通过与基因D的序列同源的其核苷酸序列的片段的杂交来重组和组装,基因E的变体或最终的其它基因A、B、C、F、G、H等根据具体情况提供各自的重组和连接。基因E优选具有在基因E的5’端或3’端的单侧翼靶序列或在两侧的侧翼靶序列。在根据本发明的方法中,基因E典型地为用于基因嵌合体形成的一系列待重组基因中的在基因D之后的下一个基因。基因E的变体称为E1、E2、E3等,其具有一定程度的序列同源性,和可选地类似的功能特性。
[0143]另外的基因F、G、H等可相应地使用。这些系列的另外的基因不理解为受英文字母数的限制。最终的感兴趣的基因链将通过连接基因A和B获得,从而在基因组的整合位点获得基因组装。如此组装的感兴趣的基因可以可操作地连接以分别支持相应的感兴趣多肽和代谢物的表达。具体的组装方法采用通过体内重组的盒的组合,从而组装甚至大量DNA片段,从而获得实质大小的期望的DNA分子。表示重叠序列的盒适合旨在覆盖整个期望序列。在一个实施方案中,优选的重叠为至少约5bp、优选至少约10bp。在其他实施方案中,重叠可为至少15、优选至少20多至1,OOObp。[0144]在一个优选的实施方案中,一些盒旨在包含允许鉴定的标记序列。典型地,标记序列位于耐性转座子插入位点,从而最小化对最终期望的核酸序列的生物效应。
[0145]在具体实施方案中,宿主细胞能够通过与所述基因或片段的混合物共转化,并培养其中转移了重组或组装序列的所述宿主,在宿主细胞中重组或组装甚至大量的具有重叠序列的核酸的基因或DNA片段,例如至少2个,优选至少3、4、5、6、7、8、9个,更优选至少10个基因或核酸片段。
[0146]根据本发明使用的基因或DNA片段,作为整个基因或部分,可为双链或单链。双链核酸序列通常为300-20,000个碱基对,单链片段通常较短并可在40-10,000个核苷酸的范围内。例如,差不多2Mb多达500Mb的组装体(assemblies)可在酵母中组装。
[0147]来自大量生物体的基因组序列是公开的,并可经根据本发明的方法来使用。这些基因组序列优选包括从不同宿主细胞株或不同物种获得的信息,从而提供具有特定多样性的同源序列。
[0148]用作重组底物的起始基因通常为包括基因变体形式的多核苷酸的集合。变体形式显示彼此的实质的序列同一性,从而允许底物之间的同源重组。多核苷酸之间的多样性可为天然的,例如等位基因或例如易错PCR或易错递归序列(recursive sequence)重组诱导的物种变体,或者为体 外重组的结果。多样性还可由利用替代的密码子选择(codon usage)来再合成编码天然蛋白的基因所造成。底物之间应有至少足够的多样性,以使重组可产生比起始原料更多样化的产物。必须存在在至少一个以上的位置处不同的至少两种底物。多样性程度依赖于重组底物的长度和待进化的功能改变的程度。多达69%的位置的多样性是典型的。
[0149]根据本发明,优选基因A、B、C和其它基因至少在设计为杂交的片段处,例如在重叠部分处共享至少30%的同源性,以便在重叠处获得至少一个交叉和可选地将包括全长基因的基因组装。有限的同源性百分比为至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,更优选至少90%,甚至更优选至少95%,多达小于99.5%。
[0150]还可期望简单地组装,例如串起来并可选地混合这些基因和基因变体,根据该方法使更大的基因如个体代谢途径的成员多样化,或者代谢途径的组装多重性。不是天然存在的代谢途径可以以该方式构建。因此,酶,存在于一个生物体中对由缺乏此类下游酶的不同生物体产生的期望底物起作用,可借助构建基因或部分基因的组装而在同一生物体中编码,从而获得重组酶。可由此包括多种酶来构建复合代谢途径。如果一组多肽或部分多肽应根据它们的生物化学功能在途径内排列,则是有利的。典型的感兴趣的基因途径为编码用于工业感兴趣的次级代谢产物如类黄酮、大环内酯、聚酮化合物(polyketides)等的合成的酶。
[0151]另外,组合文库可通过混合片段来制备,其中一个以上的片段提供有编码酶或其它蛋白质的相同的杂交序列,但不同的插入序列。
[0152]遗传途径可以组合形式构建,以便组合文库中的各成员具有不同的基因变体的组合。例如,变体的组合文库可由个体DNA元件构建,其中不同的片段被重组和组装,并且其中不同片段的每一个具有几个变体。代谢途径的重组和组装可以不需要标记序列的存在来证明设计成功。代谢物以期望方式的表达对工作例已经会是指示性的。成功的代谢途径的重组和组装可例如由次级代谢产物在细胞培养基中的检测来确定。[0153]原核和真核宿主细胞二者预期供所公开的方法使用,包括细菌宿主细胞如大肠杆菌或芽孢杆菌属(Bacillus sp),酵母宿主细胞如酿酒酵母,昆虫宿主细胞如草地贪夜蛾(Spodooptera frugiperda),或人宿主细胞如 HeLa 和 Jurkat。
[0154]优选的宿主细胞为单倍体细胞,如假丝酵母属(Candida sp)、毕赤酵母属(Pichiasp)和酵母属(Saccharomyces sp)。
[0155]本发明的方法不会使用生殖周期或减数分裂重组。DNA片段可转化至单倍体细胞中。转化子可立即在选择性平板上划线培养(streaked out)。然后将通过PCR或其它手段如缺口修复(gap repair)来分离重组体。
[0156]本发明的方法可在任何野生型或修复缺陷型原核或真核细胞(包括具有核算修复如DNA或RNA修复的缺陷的那些)中构建。在野生型细胞中,选择允许部分同源重组的适合的整合位点。在野生型细胞中进行的根据本发明的方法优选提供基因例如具有至少80%、优选至少90%的序列同一性的基因A和B的重组。尽管损伤和错配DNA通常被修复而使重组被抑制,但出乎意料的结果是,整合位点的部分同源重组在此类野生型细胞中也是可以的。
[0157]错配修复(MMR)体系的突变或修饰将增强细胞中的重组频率。任选地,可使用其它修复缺陷体系,例如DNA修复基因radUrecQ的完全或暂时敲除,这可增强重组。
[0158]DNA修复缺陷型细胞优选用于根据本发明的方法。作为实例,错配修复可完全或暂时敲除,或可为有条件的或通过向细胞培养基添加具体底物来诱导,其中细胞在进行目标重组期间或之后培养。特别地,细胞的MMR缺陷可通过瞬时或永久损害错配修复的任何策略来实现,所述策略包括错配修复中涉及的基因突变,用UV光处理,用化学品如2-氨基嘌呤处理,错配修复中涉及的基因例如经可控启动子的诱导表达或抑制,这将允许瞬时失活或激活。`
[0159]细菌错配修复体系已广泛地研究。在其它体系例如酵母中,已识别了几种基因,其产物与酿酒酵母中的细菌错配修复蛋`白如MutS蛋白类似物即Mshl、Msh2p、Msh3p、Msh4、Msh5、Msh6p,和 MutL 蛋白即 Mlhlp、Mlh2p、Mlh3p 和 Pmsl 享有同源性。
[0160]优选的错配修复缺陷型细胞的实例为具体的酵母细胞,例如具有缺陷的或(瞬时)失活的MSH2的酿酒酵母菌株,例如设计的W303、BY、SKl菌株,如MXY47 (具有破坏的MSH2 的 W303)菌株。
[0161]MMR的进一步的优选体系为公知的细菌菌株的选择,例如US5912119中记载的那些,例如如mutS或mutL型的酶MutHLS错配修复体系缺陷菌株,其中参与错配识别的蛋白质MutS和MutL缺陷。优选的菌株为例如使用F-mutL或重组大肠杆菌Hfr/鼠伤寒沙门氏菌FnutL的鼠伤寒沙门氏菌(S.Typhimurium)的菌株。
[0162]此外,根据本发明优选使用其它真核错配修复缺陷型细胞如HeLa和Jurkat细胞。
[0163]根据本发明的方法主要采用成功的重组产物的标记辅助选择。使用工具如分子标记或DNA指纹可绘制(map)感兴趣的基因。这允许筛选大量拥有感兴趣特性的细胞。筛选基于是否存在特定基因。
[0164]根据本发明使用的术语“选择标记”是指编码蛋白质的或非编码的DNA序列,在成功整合时提供标记。具体地,编码蛋白质的标记序列选自营养标记、色素标记、抗生素抗性标记、抗生素敏感性标记、荧光标记、敲入标记、活化剂/结合域标记和显隐性标记、比色标记和编码酶的不同亚单位的序列(其只有在同一细胞中表达两种以上的亚单位时起作用)的组。该术语还应指用于直接确定基因嵌合体的可追踪的待重组基因,而不需要使用单独的标记序列。
[0165]“营养标记”为编码可补偿细胞的营养缺陷并因而给予营养缺陷型细胞以原营养的基因产物的标记序列。根据本发明,术语“营养缺陷型”意指细胞必须在包含营养缺陷型细胞本身不能生产的必需营养素的培养基中生长。营养标记基因的基因产物促进在营养缺陷型细胞中缺失的该必需营养素的合成。通过成功表达营养标记基因,不必添加该必需营养素至细胞生长的培养基。
[0166]优选的标记序列为URA3、LEU2、CAN1、CYH2、TRP1、ADEl 和 MET5。
[0167]编码“色素标记”的基因编码色素合成中涉及的基因产物,其表达时可染色细胞。从而,提供了成功表达色素标记的迅速细胞表型检测。
[0168]“抗生素抗性标记”为编码基因产物的基因,其允许细胞在抗生素的存在下在不表达所述产物的细胞不能生长的浓度下生长。
[0169]“抗生素敏感性标记”为标记基因,其中在抗生素的存在下基因产物抑制表达所述标记的细胞生长。
[0170]“敲入”标记理解为表示敲除细胞的缺失环节,因而在成功重组和操作后引起细胞生长的核苷酸序列。敲除细胞为基因工程细胞,其中已通过靶向突变关闭一个以上的基因。此类缺失基因可适当地用作敲入标记。
[0171]“荧光标记”应意指编码可通过发出相应的荧光信号来检测的荧光团的核苷酸序列。细胞可容易通过流式细胞仪的公知技术基于差示荧光标记分类。
[0172]用于多样化或重组的基因可为非编码序列或编码多肽的序列或编码蛋白质的序列或其具有足以成功重组事件的 序列长度的部分或片段。更具体地,所述基因具有3bp的最小长度,优选至少IOObp,更优选至少300bp。
[0173]根据本发明获得的优选的基因嵌合体为至少3个、优选多至20,000个碱基对,优选的范围将为300-10,OOObp ;特别优选至少500bp或至少1,OOObp的大DNA序列。
[0174]具体优选的是下述基因嵌合体,其特征在于每700个碱基对有至少3个交叉事件,优选每700个碱基对有至少4个交叉事件,每700个碱基对有至少5、6或7个交叉事件,这包括单核苷酸,至少I个、优选至少2、3、4、5、10、20多至更大的核苷酸序列的片段的交叉。
[0175]根据本发明的方法在一个单重组基因中不仅可获得奇数而且还获得偶数的重组事件。这对体内重组中的减数分裂特别有利。
[0176]重组嵌合的复合模式可通过本发明的方法获得,在一个单分子中提供大批不同长度的重组序列块。此外,可获得对应于链模板之一的核苷酸的类似点的替换(point-likereplacement)作为关于开放阅读框的框架的多样性的重要来源。嵌合和类似点的交换(point-like exchange)在蛋白质水平不必保守。的确,可在重组后产生具有不同极性的新的氨基酸,给予通过该方法衍生的重组蛋白以新的潜能和酶促蛋白性质。
[0177]优选地,基因为非编码序列或者编码治疗或工业用途的酶或蛋白质的蛋白质编码序列或其部分片段。在下文中,术语“多肽”应包括具有优选至少2个氨基酸的感兴趣的肽,优选至少3个多肽和蛋白质。优选选择感兴趣的多肽,但不限于酶、转录因子、转运蛋白、信号肽、受体、激素和生长因子。由基因嵌合体产生的相应的重组变体可引发和催化新的代谢物的合成。因此,这是第一次能够通过支持酶促合成过程的代谢进化来有效生产大量天然芳族小分子的变体。
[0178]具体地,芳族氨基酸如苯丙氨酸、酪氨酸或/和色氨酸的代谢物例如由植物或酵母通过酶促活性生产的那些,或任何中间体或衍生物可以以新的方式生产。一系列酶变体由此导致不同的代谢物形成,然后筛选其用于期望的结构和功能。那些天然芳族小分子的变体具有使仅合成的有机物质拥有功能或生物活性的可能性增加的优势。
[0179]Phe和Tyr密切相关。它们含有苯环,在酪氨酸中苯环被另外羟基化。酪氨酸由必需氨基酸苯丙氨酸直接合成。色氨酸含有共轭的吲哚环。这些代谢关系引起复杂的营养依赖性。
[0180]在植物中,莽草酸酯合成途径(shikimate pathway)产生化合物苯丙氨酸用于生物合成苯丙素类。对羟基肉桂酸酯和由还原酶、氧化酶和转移酶的组合产生的酯限定了器官中代谢物的具体模式,并且依赖于它们的发育,该属性是各植物物种的特征。PP途径的起始的三个步骤为被PAL、C4H和4CL酶催化,并提供所有随后分支和所得代谢物如类黄酮、木质素、苯丙素类酯、橙酮、异黄酮、芪、前花青素等的基础。
[0181]例如,PAL已知催化Phe的脱氨基作用以给出肉桂酸,这是苯丙素类途径的第一步,以及初级和次级代谢之间的调控点。苯丙素类化合物为一系列天然具有许多功能的酚类化合物如木质素、类黄酮、异类黄酮、香豆素和芪的前体。
[0182]代谢途径的产物典型地为天然小分子或其例如在糖基化、酰化、氨基化、羟基化或甲基化等方面不同的具有改进的或新的功能的变体。这些代谢物适合作为芳香剂(fragrant)或风味剂(flavor)或作为治疗分子(例如抗感染药或用于癌症治疗)。
[0183]本文所使用的术语“芳族小分子”应指具有芳族结构的有机小分子的范围,其中一个以上的CH基可被杂原子如N、0和S替换,包括具有不同类型和数量的芳环和各种取代基的复合结构。`
[0184]可作为代谢物获得的天然芳族小分子的优选实例为香草醛、香豆酸、阿魏酸、木质素、3-苯丙素类、类黄酮、花青素。
[0185]具有新功能性质的优选实例为例如乙基香草醛(风味剂)、辛基甲氧基肉桂酸酯及其酯类物质(遮光剂(sunscreen))、具有增加的抗菌作用的查耳酮衍生物。
[0186]此类代谢物生产的中间体有时用作风味剂或芳香剂或作为食品成分。
[0187]一旦通过选择包括基因嵌合体的克隆来合成代谢物或此类代谢物的中间体,它们典型地通过适当的表达体系例如通过微生物或通过体外合成过程来大规模生产。
[0188]在本发明的优选实施方案中,在单个步骤过程中进行嵌合基因的组装、其与宿主基因组的重组以及进一步的嵌合基因的表达以产生感兴趣的重组多肽或所述宿主细胞的代谢物。
[0189]根据本发明,可采用本领域技术中常规的分子生物学、微生物学和重组DNA技术。此类技术在文献(9)中完整描述。
[0190]对于体内重组,待重组基因与基因组或其它基因使用标准转染技术用于转染宿主。在适当的实施方案中,提供复制起始的DNA包括在构建体中。复制起始可由技术人员适当地选择。根据基因的性质,如果序列已经与本身可作为复制起始操作的基因或基因组一起存在,可不需要补充的复制起始。[0191]合成核酸序列或盒以及亚单位可以以线性多核苷酸,质粒,大质粒,合成或人工染色体如植物、细菌、哺乳动物或酵母人工染色体的形式生产。
[0192]细胞可在内源或外源DNA已引入细胞内部时被此类DNA转化。转化DNA可以或不可整合,即共价连接至细胞的基因组。在原核生物、酵母和哺乳动物细胞中,例如转化DNA可保持在附加元件如质粒上。关于真核生物细胞,稳定转化的细胞为其中转化DNA已整合至染色体中以便通过染色体复制由子细胞继承的细胞。该稳定性通过真核生物细胞建立细胞系的能力或包括含有转化DNA的子细胞群的克隆来阐明。
[0193]不同基因底物可并入质粒。质粒通常是标准的克隆载体,例如细菌多拷贝质粒。底物可并入相同或不同的质粒。通常至少两种具有不同类型的选择标记的不同类型的质粒用于允许选择含有至少两种类型的载体的细胞。
[0194]含有不同个基因底物的质粒最初通过任意方法引入(例如,化学转化、自然感受态、电穿孔、基因枪、包装至噬菌体或病毒体系内)。通常,质粒以饱和浓度存在或接近于饱和浓度(相对于最大转染能力),从而增加不止一个质粒进入同一细胞的能力。包含各种底物的质粒可同时或多轮转染。例如,在后一种方法中,可用第一份质粒转染细胞,选择转染子并繁殖,然后用第二份质粒转染。优选的质粒为,例如pUC和pBluscribe衍生物如pMXY9、PMXY12 和 pMIX-LAM 或 YAC 衍生物如 YCp50。 [0195]进化的速率可通过允许所有基因底物参与重组来增加。这可通过使转染细胞进行电穿孔来实现。电穿孔的条件与常规用于将外源DNA引入细胞的那些条件相同。进化速率还可通过融合细胞以诱导质粒或染色体交换来增。融合可通过化学试剂如PEG或病毒蛋白如流感病毒血凝素、HSV-1gB和gD来诱导。进化速率还可通过使用增变基因宿主细胞(如细菌中的Mut L、S、D、T、H,酵母中的类似突变体和共济失调毛细血管扩张人细胞系)来增加。
[0196]承载重组基因的细胞为期望的功能而进行筛选或选择。例如,如果进化的底物含有抗药基因,则其将为抗药性而选择。
[0197]典型地,在本发明的重组方法中,已取得期望表型的重组终产物在0.1%-50%的位置上与初始底物不同,并具以超过自然获得的突变速率数量级(如,至少10-倍、100倍或1,000倍,或10,000倍)的速率进化。出于生产目的,最终的基因嵌合产物可转移至更适合利用重组DNA(shuffled DNA)的另一宿主。
[0198]在根据本发明的优选方法中,宿主细胞使用公知的细胞展示体系在细胞表面展示基因嵌合体。通过借助此类杂交的多样化,产生可适当展示的一系列基因变体,从而建立此类变体的文库。
[0199]适当的展示方法包括酵母展示和细菌细胞展示。特备优选的文库为如在蛋白质工程和文库筛选中的许多应用中使用的酵母表面展示文库。此类文库提供相对于野生型多肽具有增强的表型性质的多肽变体的适当选择。优选地,细胞基础的选择方法用于针对例如表面固定化配体。常规使用的选择技术包括分析和比较由此类文库获得的突变多肽的性质与野生型多肽的性质。改进的期望性质将包括能够结合至受体的连接多肽的结合性质的特异性或亲和性的变化。多肽亲和性突变为本发明的特别优选的实施方案。进一步期望的变体性质是指稳定性,例如感兴趣的重组多肽的热稳定性、PH稳定性、蛋白酶稳定性、溶解度、产量或选择水平。[0200]根据本发明的方法获得的文库包含高百分比的功能性嵌合基因的潜在的主要候选物,其可在功能ORF中表达。优选的文库具有至少80%的包含在功能ORF中的基因嵌合体,优选至少85%、至少90%、甚至至少95%。根据本发明提供的文库具体进一步的特征在于,只是高百分比的成功杂交的标记序列的存在。根据本发明,不仅可获得奇数而且偶数的嵌合补丁(mosaic patch),增加了通过所述方法产生的重组文库中的变体或文库成员的数量。
[0201]通常根据本发明的文库包括至少10个基因嵌合体的变体,优选至少100个,更优选至少1,000个,更优选至少104,更优选至少105,更优选至少106,更优选至少107,更优选至少108,更优选至少109,更优选至少101(1,更优选至少1011,多至1012,甚至更高的数量是可行的。
[0202]根据本发明的方法可提供包含至少IO2个表达基因嵌合体的功能变体的独立克隆的文库。根据本发明,还提供预选的例如亲和性强的独立克隆池,该池包括优选至少10个,更优选至少100个,更优选至少1,000个,更优选至少10,000,甚至超过100,000个独立克隆。包含预选池的那些文库是选择根据本发明的高亲和性变体的优选资源。
[0203]根据本发明使用的文库优选包括至少IO2个文库成员,更优选至少IO3个,更优选至少IO4个,更优选至少IO5个,更优选至少IO6个文库成员,更优选至少IO7个,更优选至少IO8个,更优选至少IO9个,更优选至少101°个,更优选至少IO11个,多至IO12个文库成员,优选源自亲本基因,为相应的感兴趣多肽设计新性。
[0204]优选地,文库为酵母文库,酵母宿主细胞优选将具有生物活性的感兴趣的多肽展示在细胞表面。可选地,产物停留在细胞内或分泌到细胞外。酵母宿主细胞优选选自酵母属、毕赤酵母属、汉逊酵母属、裂殖酵母属、克鲁维酵母属、耶氏酵母属和假丝酵母属。更优选地,宿主细胞为酿酒酵母。
[0205]本文所述实施例为本`发明的示例,且不意欲对本发明限制。已根据本发明记载了不同的本发明实施方案。可在不`偏离本发明的精神和范围下对本文所记载和说明的技术进行许多修改和变化。因此,应理解实施例仅为示例且不限定本发明的范围。
[0206]实施例
[0207]实施例1
[0208]描述
[0209]在第一实验计划中,我们使用了 OXA类的β -内酰胺酶基因作为待重组底物。OXA基因的优势在于可获得不同多样性(5-50%)的部分同源基因的事实。这些基因因此是测试体内重组多样性的限度的良好候选物。所述基因还容易操作(约SOObp长)。
[0210]表1:0xa基因的序列同一性
[0211]
【权利要求】
1.一种代谢途径中天然芳族小分子产物变体的代谢进化方法,其通过采用至少一种基因A的基因嵌合体来体细胞体内组装和重组所述代谢途径来进化,所述方法包括: a)在单个步骤过程中, (i)用与作为细胞基因组的整合部分或存在于基因构建体框架中的待重组的另一基因的序列同源性小于99.5%的至少一种基因A转化细胞, (ii)重组所述基因, (iii)在靶基因组的整合位点产生所述基因的基因嵌合体,其中所述至少一种基因A在与所述整合位点的5'或3'端锚定的5’端或3’端具有单侧翼靶序列, (iv)重组所述代谢途径的最终的其它基因,和 b)选择能够表达所述变体的包括所述基因嵌合体和所述最终的其它基因的克隆。
2.根据权利要求1所述的方法,其中所述另一基因为所述细胞基因组的一部分。
3.根据权利要求1或2所述的方法,其中用至少一种基因A和至少一种基因B共转化所述细胞,其中所述基因A的单侧翼靶序列锚定至所述靶基因组整合位点的5'端,并且其中所述基因B连接至锚定于所述整合位点3’端的单侧翼靶序列。
4.根据权利要求1至3任一项所述的方法,其中用至少两种不同基因Al和A2共转化所述细胞,和可选地用至 少两种不同基因BI和B2共转化。
5.根据权利要求1至4任一项所述的方法,其中共转化至少一种其它基因C,所述其它基因C具有与所述基因A和/或所述另一基因的序列杂交的序列,从而获得所述其它基因C与所述基因A和/或所述另一基因的组装。
6.根据权利要求1至5任一项所述的方法,其中所述基因A和/或所述另一基因为非编码序列或编码多肽或具有活性的部分多肽的序列。
7.根据权利要求1至6任一项所述的方法,其中将所述代谢途径的至少两种基因重组和组装。
8.根据权利要求7所述的方法,其中所述基因为优选300至20,OOObp的线性多核苷酸。
9.根据权利要求1至8任一项所述的方法,其中获得至少3多至20,000个碱基对的优选每700bp具有至少3个交叉事件的基因嵌合体。
10.根据权利要求1至9任一项所述的方法,其中所述细胞为DNA修复缺陷型细胞。
11.根据权利要求1至10任一项所述的方法,其中所述细胞为真核细胞或原核细胞,所述真核细胞优选真菌、哺乳动物或植物细胞。
12.根据权利要求1至11任一项所述的方法,其中所述天然芳族小分子选自由苯丙素类、类黄酮、黄酮醇、花青苷、木质素、花青素、查耳酮、香草醛和其天然产生的衍生物组成的组。
13.根据权利要求1至12任一项所述的方法,其中所述变体由重组酶变体合成。
14.一种产生代谢途径中天然芳族小分子产物的变体的细胞文库的制备方法,其包括通过采用至少一种基因A的基因嵌合体来体细胞体内组装和重组所述代谢途径,从而工程化重组细胞,所述方法包括: a)在单个步骤过程中, (i)用与作为细胞基因组的整合部分或存在于基因构建体的框架中的待重组的另一基因的序列同源性小于99.5%的至少一种基因A转化细胞, (ii)重组所述基因, (iii)在靶基因组的整合位点产生所述基因的基因嵌合体,其中所述至少一种基因A在与所述整合位点的5,或3,端锚定的5’端或3’端具有单侧翼靶序列, (iv)重组所述代谢途径的最终的其它基因,和 b)收集包括所述基因嵌合体和所述最终的其它基因的克隆从而获得能够产生所述变体的文库。
15.根据权利要求14所述的方法获得的文库,其包括至少10E3种产生所述变体的不同克隆。
16.根据权利要求15所述的文库,其为包含编码一系列代谢途径的重组基因的细胞文库。
17.根据权利要求15或16所述的文库,其为包括编码一系列合成酶的重组基因的细胞文库。
18.一种合成重组酶的文库,其可由根据权利要求15至17任一项所述的文库获得。
19.一种生物体,其包括来自根据权利要求15至18任一项所述的文库的基因变体。
20.一种从根据权利要求15至18任一项所述的文库选择天然芳族小分子的变体的方法。
21.根据权利要求20所述的方法,其进一步包括确定所述变体的结构和功能。
22.根据权利要求20或21所述的方法,其进一步包括在重组宿主中生产所述变体。
23.根据权利要求20或21所述的方法,其进一步包括合成生产所述变体。
24.根据权利要求20至23任一项所述的方法,其中所述变体为具有选自由抗菌、抗氧化活性组成的组的生物学活性或者作为芳香剂和风味剂的苯丙素类。
【文档编号】C12P17/06GK103764828SQ201280041012
【公开日】2014年4月30日 申请日期:2012年6月20日 优先权日:2011年6月21日
【发明者】鲁迪·潘查伊坦, 萨拉·西巴伊, 亚历杭德罗·卢克 申请人:艾威艾基克斯有限公司