提高的衣康酸生产的制作方法

文档序号:18217572发布日期:2019-07-19 22:45阅读:838来源:国知局
提高的衣康酸生产的制作方法

数十年来,衣康酸在微生物细胞中的生产和代谢已被广泛研究(calam,c.t.等人,1939,thom.j.biochem.,33:1488-1495;bentley,r.和thiessen,c.p.,1956,j.biol.chem.226∶673-720;cooper,r.a.和kornberg,h.l.,1964,biochem.j.,91:82-91;bonnarme,p.等人,1995,j.bacteriol.117:3573-3578;dwiarti,l.等人,2002,j.biosci.bioeng.1:29-33),但衣康酸的代谢途径尚未明确地确定(wilke,th.和vorlop,k.-d.,2001,appl.microbiol.biotechnol.56:289-295;bonnarme,p.等人,1995,j.bacteriol.177:3573-3578)。在这方面的两个复杂因素是:衣康酸的生物合成途径被认为在细胞溶质和线粒体中发生(jaklitsch,w.m.等人,1991,j.gen.microbiol.appl.6:51-61),以及已发现顺乌头酸酶(一种将柠檬酸互变为顺式乌头酸且反之亦然的酶)以及代谢途径中的其他酶在微生物细胞中以许多同种型存在。

衣康酸生产现在在土曲霉(aspergillusterreus)中实现商业化,所述土曲霉与黑曲霉(aspergillusniger)和米曲霉(a.oryzae)具有生理相似性。然而,后两者由于缺乏顺式乌头酸脱羧酶(cad)活性而累积柠檬酸。这些真菌所使用的底物包括单糖和二糖,诸如葡萄糖、蔗糖和果糖以及淀粉(因为它们以可被微生物体降解的形式存在)、以及糖蜜。最近,已发现甘油也是土曲霉在衣康酸生产中的有用的底物(us5,637,485)。

目前设想用于衣康酸生物合成的一般方案在图21中给出,其中明确描述了在胞质溶胶和线粒体中均存在生物合成途径,以及这两个隔室间的连接。在该方案的数个方面存在尝试改善微生物体中衣康酸的现有商业生产的可能性。

发明概述

本发明人现已发现所选用于增加衣康酸抗性和降低衣康酸降解和/或生化转化的突变体菌株,因此产生了提高水平的衣康酸。此外,本发明人已发现抑制衣康酰-coa转移酶(ec2.8.3.-)、衣康酰-coa水合酶/柠苹酰-coa水解酶(ec4.2.1.56)或柠苹酰-coa裂解酶(ec4.1.3.25)的活性和/或抑制产生衣康酸的生物体(如曲霉属)中编码这些酶的基因的表达,能够克服由衣康酸引起的毒性作用并同时促进衣康酸生产。因此,本发明包括通过增加对衣康酸的毒性作用的抗性和降低衣康酸降解和/或生化转化来增加微生物体中衣康酸生产的方法。一种获得增加的衣康酸生产的方法是通过选择对衣康酸的毒性作用具有抗性的衣康酸生产生物体的突变体菌株。另一种方法是通过抑制酶衣康酰-coa转移酶(ec2.8.3.-)和/或衣康酰-coa水合酶(柠苹酰-coa水解酶,ec4.2.1.56)和/或柠苹酰-coa裂解酶(ec4.1.3.25)的功能或抑制编码这些酶的基因的表达。所述抑制可通过编码所述衣康酰-coa转移酶和/或衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶(ec4.1.3.25)的基因的突变来实现,其中所述突变选自:

a)启动子突变或诱导型启动子插入;

b)编码序列突变,其选自一个或多个核苷酸的插入、缺失或改变;

c)蛋白结合位点插入;和

d)它们的组合。

在一个可替代的实施方案中,所述酶的表达被沉默,其可通过以下实现:

a)反义沉默;

b)有义共遏制(senseco-suppression);或

c)rna干扰。

本发明进一步包括了根据上述中任一项所述的方法,其中所述微生物体是天然生产衣康酸的微生物体,其中任选地,所述微生物体还提供有编码顺乌头酸酶的基因和/或编码柠檬酸合酶、2-甲基柠檬酸脱水酶和/或顺式乌头酸脱羧酶的基因。此外,可以将编码可转运顺乌头酸酶(-代谢物)的转运蛋白的基因,诸如土曲霉ateg_09970.1或ateg_09972.1添加至衣康酸生产中。

可替代地,所述微生物体经遗传构建用以生产衣康酸,优选通过引入编码顺式乌头酸脱羧酶的基因,其中任选地所述微生物体还提供了编码顺乌头酸酶的基因和/或编码柠檬酸合酶和/或2-甲基柠檬酸脱水酶和/或顺乌头酸酶转运蛋白(诸如土曲霉ateg_09970.1或ateg_09972.1)的基因。优选地,所述微生物体是曲霉属,优选土曲霉或黑曲霉。

本发明的另一实施方案是微生物体,优选曲霉属,更优选土曲霉或黑曲霉,其中编码衣康酰-coa转移酶和/或衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶(ec4.1.3.25)的基因的表达受抑制。

附图说明

图1:土曲霉nrrl1960的受控发酵,显示出衣康酸生产和降解。示出了相对于发酵时间(小时)的葡萄糖浓度(g/l)、衣康酸滴度(g/l)和生物量(gdwt/kg)。

图2:产生ia和ca的黑曲霉菌株citb#77和citb#101的受控发酵,显示出衣康酸生产和降解。a.衣康酸(ia)滴度和柠檬酸(ca)滴度(g/l),和b.示出了相对于发酵时间eft(h)的葡萄糖浓度(g/l)和生物量(g/kg)。

图3:来源于工业化的柠檬酸生产菌株的ia生产性黑曲霉菌株q199(cbs143051)的受控发酵,显示出柠檬酸生产和衣康酸生产和降解。示出了相对于发酵时间eft(小时)的葡萄糖浓度(g/l)、衣康酸盐滴度(g/l)、柠檬酸盐滴度(g/l)和生物量(gdwt/kg)。

图4:ab1.13cad4.1(cbs141653)菌株在补充有数个浓度的衣康酸的m12+cu中的生长。没有c源的培养基用作阴性对照。生产培养基中10g/lia的胞外浓度导致生物量发展减少75%。在33℃下孵育7天后,在20g/lia生长和甚至更高浓度的ia下观察到进一步恶化的生长。

图5:黑曲霉ia生产性菌株citb#99(cbs141659)和#113(cbs141660)的受控发酵中的有机酸产生和生物量形成,与ab1.13#49b(cbs141657)相比,显示出减少的生物量形成。示出了相对于发酵时间eft(h)的a.衣康酸(ia)滴度和柠檬酸(ca)滴度(g/l)以及b.葡萄糖浓度(g/l)和生物量(g/kg)。

图6:用进化突变体ee#3、#7、#9、#10、#13、#25(cbs141661)和#26(cbs141662)以及citb#99(cbs141659)进行的摇瓶实验的生物量生成。摇瓶填装有存在和不存在ia的生产培养基。在该实验中使用进化实验突变体菌株及其亲本菌株citb#99。该实验一式两份进行。在33℃下孵育5天后,示出了相对于发酵条件(+/-ia)的生物量(g/kg)。

图7:用进化突变体ee#3、#7、#9、#10、#13、#25(cbs141661)和#26(cbs141662)以及citb#99(cbs141659)进行的摇瓶实验的平均生长抑制。摇瓶中装有存在和不存在ia的生产培养基。在该实验中使用进化实验突变体菌株及其亲本菌株citb#99。该实验一式两份进行。ia导致的生长减少是通过在33℃下孵育5天后将在存在ia情况下的生物量值除以在不存在ia情况下的生物量值来计算的。

图8:摇瓶实验中ia的降解。摇瓶装有补充有20g/l的ia和葡萄糖(1g/l和5g/l)的生产培养基。仅添加补充有1g/l葡萄糖的生产培养基作为该实验的阳性对照。在该实验中使用进化实验突变体菌株ee#25(cbs141661)、ee#26(cbs141662)和其亲本菌株citb#99(cbs141659)和ab1.13cad4.1(cbs141653)。该实验一式两份进行。ia的降解以在33℃下孵育5天后培养液中ia(g/l)的降低来表示。

图9:ia抗性菌株中ia和ca生产。摇瓶装有生产培养基。在该实验中使用进化实验突变体菌株ee#25(cbs141661)、ee#26(cbs141662)及其亲本菌株citb#99(cbs141659)。在这些培养中获得的衣康酸和柠檬酸水平以33℃下孵育5天后的g/l给出。

图10:ia抗性黑曲霉菌株中特定衣康酸的生产。摇瓶装有生产培养基。在该实验中使用进化实验突变体菌株ee#25(cbs141661)、ee#26(cbs141662)及其亲本菌株citb#99(cbs141659)。给出在33℃下孵育5天后以g/g生物量表示的特定衣康酸生产。

图11:衣康酰-coa转移酶的blast结果。

图12:衣康酰-coa水合酶(柠苹酰-coa水解酶)的blast结果。

图13:柠苹酰-coa裂解酶的blast结果。

图14:反式乌头酸2-甲基转移酶的blast结果。

图15:可替代的衣康酸途径基因反式顺乌头酸酶脱羧酶(a)和乌头酸异构酶(b)的blast结果。

图16:(a)针对基因an07g00760(衣康酰-coa转移酶)的splitmarker设计,其使用侧接有直接重复序列的米曲霉pyre选择标记。(b)针对基因an07g00760(衣康酰-coa转移酶)的splitmarker设计,其使用大肠埃希氏菌潮霉素b磷酸转移酶(hph)选择标记。(c)针对基因an07g09220(衣康酰-coa水合酶)的splitmarker设计,其使用侧接有直接重复序列的米曲霉pyre选择标记。(d)针对基因an16g06510(反式乌头酸2-甲基转移酶)的splitmarker设计,其使用侧接有直接重复序列的米曲霉pyre选择标记。

图17:在烧瓶中生长的经改良的ia生产性黑曲霉菌株中的改善的衣康酸生产。erlenmeyer烧瓶装有生产培养基。在该实验中使用缺失突变体citb#99δict#rd1(cbs143055)、citb#99δich#rb2(cbs143056)及其亲本菌株citb#99(cbs141659)。将烧瓶在33℃下孵育并且(a)摇动(250rpm)或者(b)静置。及时获得衣康酸水平(g/l)。

图18:在烧瓶中生长的,来源于工业化柠檬酸生产菌株的经改良的ia生产性黑曲霉菌株中的改善的衣康酸生产。erlenmeyer烧瓶装有生产培养基。在该实验中使用缺失突变体q199δict#4(cbs143050)及其亲本菌株q199(cbs143051)。将摇瓶在35℃下以250rpm孵育,并及时获得衣康酸水平(g/l)。

图19:经改良的ia生产性黑曲霉菌株citb#99δict#rd1(cbs143055)和citb#99δich#rb2(cbs143056)的受控发酵,显示出衣康酸的生产改善且没有降解。示出了相对于发酵时间eft(h)的a.衣康酸(ia)滴度(g/l)和b.葡萄糖浓度(g/l),以及生物量(gdwt/kg)。

图20:来源于工业化柠檬酸生产菌株的经修饰的ia生产性黑曲霉菌株q199δict#4(cbs143050)的受控发酵,显示出衣康酸的生产和无降解。示出了相对于发酵时间eft(小时)的衣康酸盐滴度(g/l)、柠檬酸盐滴度(g/l)、葡萄糖浓度(g/l)和生物量(gdwt/kg)。

图21:土曲霉中衣康酸的一条或多条假定的生物合成和分解代谢途径.1,柠檬酸合酶a;2,顺乌头酸酶;3,顺式乌头酸脱羧酶(衣康酸盐形成);4,顺式乌头酸脱羧酶(柠康酸盐形成);5,柠康酸异构酶;6,线粒体二羧酸-三羧酸反向转运体;7,线粒体三羧酸转运蛋白;8,二羧酸转运蛋白;9,2-甲基柠檬酸脱水酶;10,柠檬酸合酶b;11,衣康酰-coa转移酶;12,衣康酰-coa水合酶;13,柠苹酰-coa裂解酶;14,反式乌头酸2-甲基转移酶。

图22.衣康酸降解途径(改编自sasikaran等人,2014,nat.chem.biol.10:371-377)。

发明详述

″真菌″在本文中定义为真核微生物体,并且包括真菌亚门的所有物种(alexopoulos,c.j.,1962,in:introductorymycology,johnwiley&sons,inc.,newyork)。因此,术语真菌包括丝状真菌和酵母。″丝状真菌″在本文中定义为真核微生物体,其包括所有真菌亚门(eumycotina)的丝状形式。这些真菌的特征在于由几丁质、纤维素和其他复合多糖组成的营养菌丝体。用于本发明的丝状真菌在形态学上、生理学上和遗传上与酵母不同。丝状真菌的营养生长是通过菌丝伸长进行的,并且大多数丝状真菌的碳分解代谢是绝对好氧的。″酵母″在本文中定义为真核微生物体,并且包括主要以单细胞形式生长的真菌亚门的所有物种。酵母可以通过单细胞菌体的出芽生长,或可以通过生物体的分裂生长。

术语″真菌的″,当指代蛋白或核酸分子时,分别意指其氨基酸或核苷酸序列天然存在于真菌中的蛋白或核酸。

术语″基因″,如本文所用,是指含有核酸聚合酶(在真核生物中是rna聚合酶ii)的模板的核酸序列。基因被转录成mrna,然后所述mrna被翻译为蛋白。

″表达″是指将基因转录成结构性rna(rrna、trna)或信使rna(mrna),随后翻译成蛋白。

术语″抑制″既可用于抑制蛋白的表达,也可用于抑制蛋白的功能。当与蛋白表达结合使用时,术语″抑制″是指编码所述蛋白的mrna的表达或细胞中蛋白的浓度的可测量地减少。减少可以是从低于正常值到零(即没有可测量的mrna或蛋白)的任何值。此外,关于蛋白功能,术语″抑制″是指任何对蛋白的完全活性起作用、从而减少和/或完全遏制蛋白功能的作用和/或处理。

如本文所用的术语″载体″包括对常染色体表达载体和用于整合到染色体中的整合载体的引用。

术语″表达载体″是指直链或环状的dna分子,其包含在提供其转录的另外核酸区段的控制下(即,可操作地连接)的编码目标多肽的区段。这种另外区段可以包括启动子和终止子序列,并且可以任选地包括一个或多个复制起点、一个或多个选择标记、增强子、多腺苷酸化信号等。表达载体通常来源于质粒或病毒dna,或可能含有两者的元件。特别地,表达载体包含核苷酸序列,其在5′至3′方向上包含并可操作地连接:(a)真菌识别的转录和翻译起始区,(b)目标多肽的编码序列,和(c)真菌识别的转录和翻译终止区。″质粒″是指自主复制的染色体外dna,它没有整合到微生物体的基因组中并且通常本身是环形的。

″整合载体″指直链或环状的dna分子,其可以掺入微生物体的基因组中并提供编码目标多肽基因的稳定遗传。整合载体通常包含一个或多个区段,所述区段包含在提供其转录的另外的核酸区段的控制下(即,可操作地连接)的编码目标多肽的基因序列。这种另外的区段可以包括启动子和终止子序列,及一个或多个驱动目标基因通过同源重组的过程整合至靶细胞的基因组中的区段。通常,整合载体将是可以转移到宿主细胞中、但具有在该生物体中是非功能性的复制子的载体。如果在该区段内包括适当的标记,则可以选择包含目标基因的区段的整合。

″转化(transformation)″和″转化(transforming)″,如本文所用,是指将外源多核苷酸插入宿主细胞中,不论以何种用于插入的方法,例如直接摄取、转导、f-交配或电穿孔。外源多核苷酸可以保持为非整合的载体例如质粒,或可替代地,可以整合到宿主细胞基因组中。

″宿主细胞″意指含有载体或重组核酸分子并支持载体或重组核酸分子的复制和/或表达的细胞。宿主细胞可能是原核细胞,诸如大肠埃希氏菌,或真核细胞诸如酵母、真菌、植物、昆虫、两栖动物或哺乳动物细胞。优选地,宿主细胞是真菌细胞。

关于衣康酸的生物合成途径的关键是各种底物的定位。据认为,衣康酸的生产主要发生在细胞溶质中,但部分生产发生在线粒体中。在线粒体和胞浆之间还存在衣康酸(或在形成衣康酸的代谢途径中的其他化合物)的主动转运。在许多生化途径中,终产物抑制其自身的产生以防止生物系统中的过量终产物。过量的终产物不仅会在经济意义上导致能量损失,还会产生不良副作用诸如毒性。预期通过耗尽细胞的衣康酸,新衣康酸的形成将继续而没有终产物抑制并且没有任何由衣康酸盐的毒性引起的抑制,因此导致总共的衣康酸产率增加。由ia毒性导致的抑制也可以通过选择ia抗性突变体来缓解。

衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和柠苹酰-coa裂解酶(ec4.1.3.25)是衣康酸分解代谢中最重要的酶(参见图21),并且它们经由衣康酰-coa将衣康酸降解成柠苹酰-coa,所述柠苹酰-coa被柠苹酰-coa丙酮酸裂解酶进一步降解成乙酰-coa和丙酮酸盐。

本发明公开了抑制这些酶中的一种或多种,防止衣康酸的毒性作用导致的生长抑制,并抑制衣康酸或其前体的降解或生化转化,并且将有利地用于能够生产衣康酸的微生物体中的衣康酸的过量产生。一种或多种酶的抑制可以通过各种机制进行,这些机制将在下面简要讨论。

原则上,衣康酸降解中的第一步(即酶衣康酰-coa转移酶)的抑制已经足以阻断衣康酸的降解。然而,如果仅作为预防性安全措施,则阻断第二步,即通过酶衣康酰-coa水合酶(柠苹酰-coa水解酶)的转化也是有利的。阻断这第二步具有另外的益处,因为没有这第二步可以下调整个降解途径和/或它可以避免产生源自第二步的有毒中间体。

除了这两种酶之外,还可能(另外)阻断酶柠苹酰-coa丙酮酸裂解酶。

在这种酶具有活性的生物体中这种酶的额外抑制会进一步增加衣康酸生产。

据信任何通过抑制上述酶来抑制衣康酸的降解或生化转化的方法,无论所述抑制是在翻译、转录、转录后或功能水平上,都会产生所需的效果。

一种或多种酶优选通过在转录或翻译水平上的抑制,如通过突变、反义抑制或通过rna干扰(rnai)来抑制。编码该酶的基因的突变可以通过用突变的核苷酸序列进行定点诱变来完成,这引起酶的异常表达或异常酶的表达。此类突变可以包括但不限于以下实例:

1)基因的启动子序列的变化,从而降低启动子功能。启动子通常位于编码序列的上游(5′)。在其更广泛的范围内,术语″启动子″包括位于距转录起始位点的数百个碱基对内、偶尔甚至更远的rna聚合酶结合位点以及调节序列元件。此类调节序列是如参与响应于生理条件控制转录起始的有效性的蛋白因子的结合的序列。启动子序列的变化可以通过例如核糖体结合位点缺失或通过tata盒缺失来实现,这导致聚合酶的识别或结合丧失,并从而导致mrna形成受抑制。可替代地,启动子可以缩短,或甚至完全缺失,或用诱导型启动子来代替。在后一种情况下,酶产物仅在启动子的诱导后形成。诱导型启动子是本领域技术人员已知的。通常,与诱导型启动子特异性结合以激活转录的因子以无活性形式存在,然后通过诱导物直接或间接转化为活性形式。诱导物可以是化学剂,诸如蛋白质、代谢物(糖、醇等)、生长调节剂、除草剂或酚类化合物,或由热、盐、伤害、有毒元素等直接或通过病原体或疾病介质诸如病毒的作用间接施加的生理应激。含有诱导型启动子的细胞可以通过喷雾、加热或类似方法将诱导物外部施加到细胞来暴露于诱导物。诱导型启动于是本领域技术人员已知的,并且存在可以想象用于抑制酶的表达的几种诱导型启动子。适合根据本发明使用的诱导型启动子包括但不限于热激启动子、由哺乳动物类固醇受体系统诱导的启动子和任何化学诱导型启动子。诱导型启动子的实例包括黑腹果蝇(drosophilamelanogaster)的诱导型70kd热激动启动子(wing等人1989,molgengenet,219:9-16)和由乙醇诱导的醇脱氢酶启动子。通过简单的化学物质诱导的启动子特别有用。这种简单或常见的化学物质用于所谓的基因开关启动子的诱导。基因开关启动子的实例包括alca/alcr基因开关启动子,如公开的国际专利申请no.wo93/21334中所述;gst启动子,如公开的国际专利申请nos.wo90/08826和wo93/031294中所述;和蜕皮激素开关系统,如公开的国际专利申请no.wo96/37609中所述。在这种开关系统中,通过施加外部化学物质来控制基因表达的时间。开关化学物质可以作为喷雾或蒸汽施加到转基因植物的全部或部分或作为根部浸液施加。在上述描述开关启动子系统的参考文献中提供了适合的开关化学物质的实例。外部化学刺激优选是一种化学物质,其的使用对微生物细胞无害。诱导型开关启动子系统优选包括一个或两个组件系统;然而,包括两个以上组分的系统也包括在本发明中。alca/alcr开关启动子系统是特别优选的。在alca/alcr启动子开关系统中,优选的化学诱导剂是呈液体或蒸汽形式的乙醇。使用乙醇的主要优点之一是少量乙醇产生高水平的表达。alca/alcr诱导型启动子系统是涉及编码alca启动子和alcr蛋白的dna序列的双组分系统,其表达置于所需启动子的控制下。alcr蛋白在诱导物存在下激活alca启动子,并且在alca启动子控制下的任何基因(在这种情况下是编码酶的基因)将因此仅在此诱导物的存在下表达。利用此类系统,基因构建体的活性可以受到地点和时间的限制。其他基因开关系统和/或诱导型启动子在本领域中是已知的并且也同样适用。使用这种诱导型启动子或基因开关系统的一个优势是在培养物生长的某些时刻可能需要酶的表达。在那种情况下,在这些时间期间,可以将诱导物引入培养物中,从而导致酶表达。在其他时刻,不存在诱导物并且将发生衣康酸的积累。

2)编码序列的变化。此类变化可以通过编码衣康酰-coa转移酶和/或衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶酶的基因的开放阅读框中的一个或多个核苷酸的插入、缺失或改变来实现。此类变化应该能够引起转录酶的氨基酸序列的变化。优选的改变类型通过插入或缺失一个或两个核苷酸来引起移码突变。此类突变会使基于三核苷酸密码子的信息失真,并且会导致从突变点构建完全不同的氨基酸序列,直到遇到终止密码子。通常,此类移码突变(特别是当突变位于基因的5′末端附近时)产生的蛋白质不再具有由原始基因编码的酶的生物功能。可替代地,终止密码子可以插入基因中,这导致在此点终止氨基酸序列的产生,从而导致产生n末端截短的蛋白质。同样在这种情况下,当突变位于基因的5′末端附近时,得到的截短的蛋白将不再具有任何生物功能。

3)引入蛋白结合位点。蛋白结合位点的插入将导致相应的蛋白(如果存在)的附着,从而引入基因转录的空间位阻。优选地,此类结合位点是在起始密码子的前面或附近(在启动子序列中或编码序列中)引入的并且附着的蛋白的存在将阻碍聚合酶开始或继续转录。这再次实现了可调节的系统,其中转录量可以通过可用于结合的蛋白量来调节。此类系统的优选结合位点是与曲霉属物种中的碳-分解代谢物-遏制相关的转录阻遏蛋白crea特异性的那些(mathieu,m.等人,2005,mol.microbiol.56(2):535-548;felenbok,b.等人,2001,prog.nucleicacidres.mol.biol.69:149-204;mathieu,m.和felenbok,b.,1994,emboj.13(17):4022-4027)。

4)基因剪接的变化。真核基因通常存在于其中具有编码序列(称为″外显子″)的部分散布有具有非编码序列(″内含子″)的部分的结构中。对于真核基因的正确表达,整个基因被转录成(前)mrna,但随后内含子被剪接出rna,导致最终mrna仅具有编码序列(和一些调控序列,诸如聚a尾)。

尤其是在各种疾病中也已知可以从dna的相同基因组区产生可替代的rna转录物。这些可替代的转录物通常称为″变体″。更具体地,″前mrna变体″是由相同基因组dna产生的转录物,其不同于在起始或终止位置从相同基因组dna产生的其他转录物,并且含有内含子和外显子序列。在剪接期间切除一个或多个外显子或内含子区或其部分时,前mrna变体产生较小的″mrna变体″。因此,mrna变体是加工的前mrna变体,并且每个独特的前mrna变体必须总是由于剪接而产生独特的mrna变体。这些mrna变体也被称为″可替代的剪接变体″。如果没有发生前mrna变体的剪接,则前mrna变体与mrna变体相同。

本质上也已知此类变体可以通过使用可替代的信号来开始或终止转录而产生,并且前mrna和mrna可以具有多于一个起始密码子或终止密码子。使用可替代的起始密码子的源自前mrna或mrna的变体被称为该前mrna或mrna的″可替代的起始变体″。使用可替代的终止密码子的那些转录物被称为该前mrna或mrna的″可替代的终止变体″。一种特定类型的可替代的终止变体是″聚腺苷酸变体″,其中产生的多个转录物通过转录机制由″聚腺苷酸终止信号″之一的可替代选择产生,从而产生终止于独特的聚a位点的转录物。

如本文所用,″反义机制″是所有涉及化合物与靶核酸杂交的那些,其中杂交的结果或效果是靶降解或靶占有,伴随着涉及例如转录或剪接的细胞机构的停滞。

如本文所用,术语″前体mrna″或″前mrna″是指含有一条或多条插入序列(内含子)的信使核糖核酸(mrna)的未成熟单链。前mrna由rna聚合酶从细胞细胞核中的dna模板转录,并由内含子和编码区(外显子)的交替序列组成。通过将内含子剪接出并将外显子连接来将前mrna进行完全加工,其被称为″信使rna″或″mrna″,其是完全没有内含子序列的rna。真核前mrna仅在完全加工成mrna之前暂时存在。当前mrna已被适当地加工成mrna序列时,它被输出细胞核并最终通过细胞质中的核糖体翻译成蛋白。

如本文所用,术语″剪接″和″(前)mrna加工″是指转录后前mrna的修饰,其中去除内含子并且连接外显子。前mrna剪接涉及两个连续的生化反应。两种反应都涉及rna核苷酸之间的剪接体转酯酶。在第一反应中,在内含子内的特定分支点核苷酸的2′-oh(其在剪接体组装期间定义)在5′剪接位点处对内含子的第一核苷酸进行亲核攻击,从而形成套索中间体。在第二反应中,释放的5′外显子的3′-oh在3′剪接位点处在内含子的最后一个核苷酸处进行亲核攻击,从而连接外显子并释放内含子套索。前mrna剪接由内含子沉默子序列(iss)、外显子沉默子序列(ess)和末端茎环(tsl)序列调节。

如本文所用,″剪接的调节″是指改变前mrna转录物的加工,使得一个或多个剪接产物增加或减少,或两个或更多个剪接产物的比率变化。剪接的调节也可以是指改变前mrna转录物的加工,使得剪接的mrna分子含有由于外显子跳跃或外显子内含、一个或多个外显子缺失而导致的外显子的不同组合,或通常不在剪接的mrna中发现的另外序列(如,内含子序列)。

如本文所用,″剪接位点″是指前mrna(未剪接的rna)分子中的外显子和内含子之间的连接(也被称为″剪接点″)。″隐蔽的剪接位点″是通常不使用、但是当通常的剪接位点被封闭或不可用时或者当突变导致正常休眠位点变为活性剪接位点时可以使用的剪接位点。″异常剪接位点″是由天然dna和前mrna中的突变产生的剪接位点。

改变基因的剪接并从而产生不具有功能或仅具有部分功能的表达产物可以通过封闭基因正确表达所需的剪接位点来实现。可以通过引入能够与前mrna相互作用和/或杂交,从而修改基因表达和/或剪接的反义寡聚化合物(通常为寡核苷酸或寡核苷酸类似物或模拟物)来实现剪接的改变。寡聚化合物可以以单链、双链、环状、支链或发夹的形式引入,并且可以含有结构元件,诸如内部或末端凸起或环。寡聚双链化合物可以是两链杂交以形成双链化合物或具有足够自身互补性的单链以允许完全或部分双链化合物的杂交和形成。酶依赖性反义寡核苷酸包括依赖于rna酶h活性来降解靶mrna的形式,并且包括单链dna、rna和硫代磷酸酯反义。空间阻断的反义寡核苷酸(rna酶-h非依赖性反义)通过与mrna的靶序列结合而干扰基因表达或其他mrna依赖性细胞过程。空间阻断反义包括2′-0烷基反义寡核苷酸、吗啉代反义寡核苷酸和三环dna反义寡核苷酸。

在本发明中,在如上定义的寡聚化合物的帮助下封闭引起内含子1剪接的剪接位点将导致非功能性蛋白质的表达。

另一实施方案提供了通过沉默基因表达来形成酶衣康酰-coa转移酶和/或柠苹酰-coa水解酶(衣康酰-coa水合酶)和/或柠苹酰-coa裂解酶的表达抑制。基本上,此时已知三种用于沉默的方法,并且在本申请中考虑了这些方法:反义表达、有义共遏制和rna抑制。然而,本发明不限于这些方法,并且也包括了引起编码酶衣康酰-coa转移酶和/或柠苹酰-coa水解酶(衣康酰-coa水合酶)和/或柠苹酰-coa裂解酶的基因沉默的任何其他方法。

对于反义表达,编码所述基因的核苷酸序列、其同源物或变体、或其至少40个核苷酸或更多的一部分,在反义方向上被置于适合的启动子之后。在转录该核苷酸序列后,产生mrna,其与通过内源性雌性抑制子基因的转录形成的mrna互补。现在已经充分证明,此类反义mrna的产生能够抑制与其互补的基因的内源表达。此外,已经证明,为了实现这种效果,即使具有小于100%同源性的序列也是有用的。还可以使用比它们应该抑制的内源性mrna短的反义mrna。通常,人们普遍认为具有70%或更高的同一性的23个核苷酸或更多的mrna序列将能够产生抑制作用。主要专利参考文献是calgeneinc的ep240,208。没有理由怀疑反义技术的可操作性。它是成熟的,在世界各地的实验室中均常规使用,并且使用其的产品可商购。

第二种方法通常被称为有义共遏制。当所述基因或所述基因的一部分以其有义方向表达时,就会发生这种现象。虽然当使用全长基因时,这种表达最常导致基因过表达,但已发现在某些情况下并且尤其是在使用比全长序列短的序列的情况下,该基因或片段的表达导致内源基因的抑制。关于有义共遏制的主要专利参考文献是在dnaplanttechnologyinc名义下的ep465,572。

bird和ray综述了有义和反义基因调控(gen.eng.reviews9:207-221,1991)。因此,可以通过在靶生物体的基因组中插入额外拷贝的靶雌性抑制基因编码序列来获得基因沉默,所述靶雌性抑制基因编码序列可以包含整个的或部分的或者截短的序列并且可以呈有义或反义取向。另外,可由基因组基因序列获得的内含子序列可以用于遏制载体的构建。还有报道称在转基因和内源基因的生物体内实现了基因沉默,其中唯一的序列同一性在启动子区内。

沉默基因的第三种可能的方法是通过使用所谓的rnai技术,该技术涵盖了使用双链rna实现内源基因沉默的所有应用。正如fire等人(nature,391:806-811,1998)所证实的,应用无论是细胞内产生还是胞外添加的其一条链与内源产生的mrna至少部分互补的dsrna,都非常能够抑制mrna翻译为蛋白。据信这种现象通过dsrna的短链段(长度为23核苷酸)的中间产物起作用。为了实现dsrna的产生,构建体被制备为携带至少19个、通常23个核苷酸或更多个有义和反义核苷酸序列(也一起被称为反向重复),其中的一个与需要沉默的内源基因互补。有义和反义核苷酸序列可以通过允许形成的rna折回的任何长度的间隔子核苷酸序列连接,使得通过有义和反义序列形成双链rna。然后,间隔子用于形成连接有义和反义序列两者的发夹环。有义和反义序列的顺序并不重要。也可能在一个和相同的构建体中组合多于一个有义-反义组合。如果简单形式被描述为:prom-s-spac-as-term,则也可应用以下构建体:prom-s1-spac-as1-spac-s2-spac-as2-term或prom-s2-spac-s1-spac-as1-spac-as2-term。只要所述构建体的转录的终产物产生一种或多种dsrna,则构建体构建的变化是可能的。可替代地,双链结构可以由编码互补rna链的两个单独的构建体形成,其中rna双链体形成发生于细胞中。简言之,这些构建体看起来像:prom1-s1-term1和prom2-as1-term2。prom1和prom2可以相同或不同,但都应该是组成型或果实特异性启动子,term1和term2可以相同或不同。两个构建体均可以在同一载体上被引入到细胞中,但也可以使用两种不同的载体引入。

含有与靶雌性抑制基因的一部分相同的核苷酸序列的rna对于抑制是优选的。已经发现相对于靶序列具有插入、缺失和单点突变的rna序列对于抑制是有效的。因此,可以使用序列同一性小于100%的序列。序列同一性可以通过本领域已知的序列比较和比对算法计算(参见gribskov和devereux,sequenceanalysisprimer,stocktonpress,1991,以及其中引用的参考文献),例如通过使用smith-waterman算法,如在bestfit软件程序中使用默认参数(如威斯康星大学计算组(universityofwisconsincomputinggroup))中实施。因此,rna的双链体区可以在功能上被定义为能够与一部分靶基因转录物杂交的(双链)核苷酸序列(如,400mmnacl,40mmpipesph6.4,1mmedta,50℃至65℃杂交12-16小时;然后洗涤)。相同核苷酸序列的长度应为至少23个核苷酸,但优选更大:40、50、100、200、300或400个碱基。

如本文所公开的,抑制构建体和靶内源基因之间的100%序列同一性不是实施本发明所需的。因此,本发明具有能够耐受由于遗传突变、菌株多态性或进化趋异而可能预期的序列变异的优点。

因此,本发明还包括具有在适合的启动子控制下的核苷酸序列的构建体,其中所述核苷酸序列在有义方向上或在反义方向上或者以反向重复形式包含编码酶衣康酰-coa转移酶和/或柠苹酰-coa水解酶(衣康酰-coa水合酶)和/或柠苹酰-coa裂解酶的基因或其同源物或变体的序列的40个或更多个核苷酸的一部分。

可替代地,通过作用于靶基因启动子的负作用的转录因子的表达来阻止转录。这种负作用的转录因子可以是天然的或人工的。人工的负作用的转录因子可以通过与一般转录阻遏子偶联的经工程化的多趾(polydactyl)锌指转录因子的过表达来使用。根据另一个实施方案,对靶基因的干扰是由使靶基因mrna去稳定化组成,尤其是通过选自以下的与靶基因mrna互补的核酸分子:反义rna、rnai分子、病毒诱导的基因沉默(vigs)分子、共抑制子分子、rna寡核苷酸或dna寡核苷酸。

在另一个实施方案中,对靶基因的干扰包括抑制靶基因表达产物。这可以通过一种或多种显性阴性核酸构建体的一种或多种表达产物、通过与靶基因产物相互作用的一种或多种抑制剂的过表达、或通过一种或多种化学化合物来实现。在(真核)基因转录中引入位点特异性改变的新方法是通过最近描述的crispr-cas遗传工程化的同源重组系统中的变异来进行。(congl等人science2013;339:819-823;malip等人science2013;339:823-826;chosw等人natbiotechnol2013;31:230-232;jinekm等人elife2013;2:e00471)。这种变异需要使用cas酶,其内切核酸酶活性缺陷,但当与grna共表达时,其保留其特异性干扰转录延伸、rna聚合酶结合或转录因子结合的能力。该系统也表示为crispri。(qils等人cell2013;152:1173-1183;larson,mh等人2013,natureprotocols8:2180-2196;amelio,i.和melinog.,2015,celldeath&differentiation,22:3-5)。

上述系统都是作用于表达并且不改变基因的潜在遗传序列的系统。在此方面,当需要抑制表达或当不再需要抑制表达时,这些系统也相对容易开启或关闭。此类开关可以如有利地通过将沉默系统的一个或所有组分的表达置于特定时间或位置限制的启动子的控制下来实现。

除了基因表达的变化之外,基因本身可以以不再表达功能性蛋白的方式改变。这可以通过突变基因来实现。可以通过一种或多种化学化合物和/或物理手段和/或通过插入遗传元件来随机引入一种或多种突变。适合的化学化合物是甲基磺酸乙酯、亚硝基甲基脲、羟基胺、原黄素、n-甲基-n-亚硝基胍、n-乙基-n-亚硝基脲、n-甲基-n-硝基″亚硝基胍、硫酸二乙酯、乙烯亚胺、叠氮化钠、福尔马林、乌拉坦、苯酚和环氧乙烷。可以使用的物理手段包括紫外线辐射、快中子暴露x射线和γ辐射。遗传元件是转座子、t-dna或逆转录病毒元件。

通过所谓的定点诱变技术提供了更有效的和靶向的技术。许多用于定点诱变(sdm)的系统是本领域技术人员已知的,最著名的是基于核酸酶的sdm系统,诸如锌指核酸酶、转录激活因子样效应子核酸酶(transcriptionactivator-likeeffectornucleases,talen)和laglidadg归巢核酸内切酶(curtin,s.j.等人,2012,theplantgenome5:42-50)。用于sdm的另一种技术基于与靶基因的同源重组。最近,已经证明以上描述的crispr-cas系统对于基于同源重组的sdm非常有效(参见,如wo2014/144155)。

在一个实施方案中,talen(转录激活因子样效应子核酸酶)蛋白或酶用于破坏或灭活细胞的衣康酸降解或生化转化途径的一个或多个基因。在此类实施方案中,talen(转录激活因子样效应子核酸酶)蛋白或酶用于破坏或灭活或突变选自包括衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶的基因。talen蛋白由dna结合结构域和核酸酶结构域构成。dna结合结构域也有两个部分-识别双链断裂(dsb)靶标左边序列的tal结构域,被称为tal-l,以及识别dsb靶标右边序列的tal结构域,被称为tal-r。tal-l和tal-r结构域均与核酸酶结构域表达为融合蛋白。天然tal效应蛋白具有两个结构域:效应子结构域和dna结合结构域。可以操纵dna结合结构域的结构,使得结构域特异性结合至基因组中的任何dna序列。这些dna结合蛋白结构域可以连接至定制的效应子结构域诸如核酸酶,从而产生嵌合性talen(转录激活因子样效应子核酸酶)蛋白。提供tale/talen的dna序列特异性的dna结合结构域由可变数量的氨基酸重复组成。每个重复含有33-35个氨基酸并识别单个dna碱基对。dna识别经由在每个重复内的位置12和13处的2个高变氨基酸残基发生,称为重复可变二残基(rvd),其对于识别特异性dna序列是至关重要的。可以改变tal效应子中重复的rvd以产生识别特异性靶dna序列的tal蛋白。rvd对简单密码有特异性,如,ni=a、hd=c、ng=t、nn=g或a(boch,2009;moscou,2009)。n、i、h、d和g代表单字母的氨基酸代码。dna结合结构域的重复在tale表达载体中组装,并与核酸酶foki内切核酸酶催化结构域一起共表达以产生tale核酸酶(talen)。此类talen,一旦在细胞中表达,就特异性结合序列并产生双链断裂,其通过非同源末端连接(nhej)修复。在此类细胞过程中,基因序列内的突变,即缺失和/或插入产生非功能性蛋白产物。

除了诱导的突变之外,还可以发生自发突变,其导致改善的衣康酸抗性以及由于减少降解和/或生化转化而改善的衣康酸水平。对于本申请中示例的抗性突变体,突变的确切性质未(尚未)已知,但突变存在于衣康酸的降解或生化转化途径之一中。

如本文中可互换使用的″成簇规则间隔短回文重复″和″crispr″是指含有多个短直接重复的基因座,其在约40%的测序细菌和90%的测序古生菌的基因组中存在。crispr系统是一种参与防御入侵的噬菌体和质粒的微生物核酸酶系统,提供一种形式的获得性免疫。微生物宿主中的crispr基因座含有crispr相关(cas)基因以及能够编程crispr介导的核酸切割的特异性的非编码rna元件的组合。外部dna的短区段,称为间隔子,被整合到crispr重复之间的基因组中,并且充当过去暴露的″记忆″。cas9与sgrna的3′末端形成复合物,并且蛋白质-rna对通过sgrna序列的5′末端与预定义的20bpdna序列(称为原型间隔子)之间的互补碱基配对来识别其基因组靶标。在自然界中,这种复合物经由crrna内编码的区域,即病原体基因组内的原型间隔子和原型间隔子-相邻基序(pam),针对病原体dna的同源基因座。非编码crispr阵列在直接重复内转录和切割成含有单个间隔子的短crrna,其将cas核酸酶导向靶位点(原型间隔子)。通过简单地交换表达的sgrna的20bp识别序列,可以将cas9核酸酶指导至新的基因组靶标。crispr间隔子用于在真核生物体中以类似于rnai的方式识别和沉默外源遗传元件。

已知三类crispr系统(i型、ii型和iii型效应子系统)。ii型效应子系统使用单一效应子酶cas9切割dsdna,在四个连续步骤中进行靶向的dna双链断裂。与需要多个不同效应子作为复合物的i型和iii型效应子系统相比,ii型效应子系统可以在诸如真核细胞的替代环境中起作用。ii型效应子系统由从含有间隔子的crispr基因座转录的长前crrna、cas9蛋白和参与前crrna加工的tracrrna组成。tracrrna与分离前crrna的间隔子的重复区杂交,从而启动内源rna酶iii进行的dsrna切割。这种切割之后是cas9进行的每个间隔子内的第二个切割事件,产生与tracrrna和cas9保持相关的成熟crrna,形成cas9:crrna-tracrrna复合物。

cas9:crrna-tracrrna复合物解开dna双链体并搜索与crrna匹配的序列以进行切割。在检测靶dna中的″原型间隔子″序列与crrna中剩余的间隔子序列之间的互补性后发生靶识别。如果在原型间隔子的3′末端处也存在正确的原型间隔子相邻基序(pam),则cas9介导靶dna的切割。对于原型间隔子靶向,序列必须紧接着是原型间隔子邻接基序(pam),即由dna切割所需的cas9核酸酶识别的短序列。不同的ii型系统具有不同的pam要求。化脓性链球菌crispr系统可具有对于该cas9(spcas9)的如5′-nrg-3′的pam序列,其中r是a或g,并且在人细胞中表征该系统的特异性。crispr/cas9系统的独特能力是通过共表达单个cas9蛋白与两个或多个sgrna来同时靶向多个不同基因组基因座的直接能力。例如,化脓性链球菌ii型系统自然地优选使用″ngg″序列,其中″n″可以是任何核苷酸,但也接受其他pam序列,诸如经工程化的系统中的″nag″(hsu等人,naturebiotechnology(2013)doi:10.1038/nbt.2647)。类似地,来源于脑膜炎奈瑟菌(neisseriameningitidis)的cas9(nmcas9)通常具有nnnngatt的天然pam,但在各种pam中具有活性,包括高度简并的nnnngnnnpam(esvelt等人naturemethods(2013)doi:10.1038/nmeth.2681)。

化脓性链球菌的ii型效应子系统的经工程化的形式显示出在真核细胞中起作用以用于基因组工程化。在该系统中,cas9蛋白通过合成重构的″指导rna″(″grna″,也在本文中可互换地用作嵌合性单指导rna(″sgrna″))指向基因组靶位点,其是一般不需要rna酶iii和crrna加工的crrna-tracrrna融合。

在本发明中,crispr/基于cas9的经工程化的系统可用于靶生物体的基因组编辑。crispr/基于cas9的经工程化的系统可以被设计成靶向任何基因,但是用于本发明,尤其是选自以下基因:衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶。crispr/基于cas9的系统可包括cas9蛋白或cas9融合蛋白和至少一种grna。cas9融合蛋白可以,例如包括具有与cas9内源性结构域不同活性的结构域,诸如反式活化结构域。

crispr/基于cas9的系统可包括cas9蛋白或cas9融合蛋白。cas9蛋白是切割核酸并由crispr基因座编码并参与ii型crispr系统的核酸内切酶。cas9蛋白可以来自任何细菌或古细菌物种,诸如化脓性链球菌。cas9蛋白可以突变,以使核酸酶活性失活。最近,没有内切核酸酶活性的来自化脓性链球菌的失活的cas9蛋白(icas9,还被称为″dcas9″)通过grna靶向细菌、酵母和人细胞中的基因,以通过空间位阻使基因表达沉默。如本文所用,″icas9″和″dcas9″都是指具有氨基酸取代的d10a和h840a并且使其核酸酶活性失活的cas9蛋白。crispr/基于cas9的系统可以可替代地包括cas融合蛋白。融合蛋白可以包含两个异源多肽结构域,其中第一个多肽结构域包含cas蛋白,并且第二多肽结构域具有不同于cas9蛋白的核酸酶活性的核酸酶活性。融合蛋白可包括与具有核酸酶活性的第二多肽结构域融合的如上所述的cas9蛋白或突变的cas9蛋白。核酸酶或具有核酸酶活性的蛋白是能够切割核酸的核苷酸亚基之间的磷酸二酯键的酶。核酸酶通常进一步分为内切核酸酶和外切核酸酶,尽管一些酶可能属于这两类。众所周知的核酸酶是脱氧核糖核酸酶和核糖核酸酶。

grna提供了crispr/基于cas9的系统的靶向。grna是两种非编码rna的融合:crrna和tracrrna。sgrna可以通过交换编码20bp原型间隔子的序列来靶向任何所需的dna序列,所述原型间隔子通过与所需dna靶标的互补碱基配对赋予靶向特异性。grna模拟参与ii型效应子系统的天然存在的crrna:tracrrna双链体。该双链体可以包括例如42个核苷酸的crrna和75个核苷酸的tracrrna,用作cas9切割靶核酸的指引。如本文可互换使用的″靶区″、″靶序列″或″原型间隔子″是指crispr/基于cas9的系统靶向的靶基因区域。在本发明中,这将是选自以下基因中的靶区域:衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶。crispr/基于cas9的系统可以包括至少一个grna,其中grna靶向不同的dna序列。靶dna序列可以重叠。靶序列或原型间隔子之后是原型间隔子的3′末端处的pam序列。不同的ii型系统具有不同的pam要求。例如,化脓性链球菌ii型系统使用″ngg″序列,其中″n″可以是任何核苷酸。

grna可以靶向任何核酸序列,诸如以上提及的基因。crispr/基于cas9的系统可以使用不同序列和长度的grna。grna可包含靶dna序列的互补多核苷酸序列,接着是pam序列。grna可以在互补多核苷酸序列的5′末端包含″g″。grna可包含靶dna序列的至少10个碱基对、至少11个碱基对、至少12个碱基对、至少13个碱基对、至少14个碱基对、至少15个碱基对、至少16个碱基对、至少17个碱基对、至少18个碱基对、至少19个碱基对、至少20个碱基对、至少21个碱基对、至少22个碱基对、至少23个碱基对、至少24个碱基对、至少25个碱基对、至少30个碱基对或至少35个碱基对互补多核苷酸序列,其中所述靶序列来源于选自以下基因的编码序列:衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶,然后是pam序列。pam序列可以是″ngg″,其中″n″可以是任何核苷酸。grna可以靶向靶基因的启动子区、增强子区或转录区中的至少一个。

可以通过确定它们的同一性百分比来比较两条或更多条序列(多核苷酸或氨基酸)。两条序列的同一性百分比,无论是核酸还是氨基酸序列,是两条对齐序列之间的精确匹配数除以较短序列的长度并乘以100。核酸序列的近似比对是由smith和waterman,advancesinappliedmathematics2:482-489(1981)的局部同源性算法提供。该算法可以通过使用由dayhoff,atlasofproteinsequencesandstructure,m.o.dayhoff编,增刊3:353-358,nationalbiomedicalresearchfoundation,washington,d.c.,usa开发的评分矩阵应用于氨基酸序列,并由gribskov,nucl.acidsres.14(6):6745-6763(1986)进行归一化。用于确定序列的同一性百分比的此算法的示例性实现由geneticscomputergroup(madison,wis.)在″bestfit″实用应用程序中提供。该方法的默认参数在wisconsin序列分析包程序手册,版本8(1995)(可从geneticscomputergroup,madison,wis获得)中描述。在本公开的上下文中建立同一性百分比的优选方法是使用由intelligenetics,inc.(mountainview,calif.)分发的mpsrch程序包。从这套包中可以使用smith-waterman算法,其中默认参数用于对表进行评分(例如,空位开放罚分为12,空位延伸罚分为1,且空位为6)。从生成的数据中,″匹配″值反映了序列同一性。用于计算序列之间的同一性或相似性百分比的其他适合程序在本领域中通常是已知的,例如另一个比对程序是blast,与默认参数一起使用。例如,blastn和blastp可以通过使用以下默认参数来使用:遗传编码=标准;过滤器=无;链=两条;截断值=60;预期值=10;矩阵=blosum62;描述=50条序列;排序依据=高评分;数据库=非冗余,genbank+embl+ddbj+pdb+genbankcds翻译+swiss蛋白+spupdate+pir。这些程序的详细信息,请访问以下网址:http://www.ncbi.nlm.gov/cgi-bin/blast。关于本文所述的序列,序列同一性的所需程度的范围为大约80%至100%以及其间的任何整数值。通常,序列之间的同一性百分比为至少70-75%,优选80-82%,更优选85-90%,甚至更优选92%,仍然更优选95%,并且最优选98%序列同一性。

可替代地,多核苷酸之间的序列相似性可以通过在允许同源区之间稳定双链体形成的条件下多核苷酸的杂交、然后用一种或多种单链特异性核酸酶消化和经消化的片段的尺寸测定来确定。当如使用上述方法测定,序列在限定长度的分子上表现出在超过限定长度的分子中至少约70%-75%、优选80%-82%、更优选85%-90%、甚至更优选92%、再更优选95%和最优选98%序列同一性时,两个核酸或两条多肽序列基本上彼此同源。如本文所用,基本上同源也是指显示与指定dna或多肽序列完全同一性的序列。基本上同源的dna序列可以在southern杂交实验中例如在如对于此特定系统所限定的严格条件下鉴定。限定适当的杂交条件属于本领域的技术范围。参见,如sambrook等人,同上;nucleicacidhybridization:apracticalapproach,b.d.hames和s.j.higgins编,(1985)oxford;washington,d.c.;irlpress)。

两个核酸片段的选择性杂交可以通过如下确定。两个核酸分子之间的序列同一性程度影响此类分子之间的杂交事件的效率和强度。部分同一的核酸序列将至少部分地抑制完全同一的序列与靶分子的杂交。可以使用本领域公知的杂交测定来评估完全同一的序列的杂交抑制(如,southern(dna)印迹、northern(rna)印迹、溶液杂交等,参见sambrook,等人,molecularcloning:alaboratorymanual,第二版,(1989)coldspringharbor,n.y.)。此类测定可以使用不同程度的选择性进行,例如使用从低到高严格性的条件。如果采用低严格性的条件,则可以使用缺少甚至部分程度的序列同一性的二级探针(例如,与靶分子具有小于约30%序列同一性的探针)来评估非特异性结合的缺失,使得在没有非特异性结合事件的情况下,二级探针不会与靶标杂交。

用于根据本发明的方法中的(重组dna)构建体可以使用本领域技术人员熟知的重组dna技术构建。重组基因构建体可以插入载体中,所述载体可以是商业上可获得的、适合于引入微生物体中和适合于转化细胞中表达基因产物。

可以包括作为引入的重组dna的一部分的选择标记用于选择转化的或转染的细胞(含有重组dna的那些)而非未转化的细胞。适合的标记的实例包括提供抗生素抗性的基因。含有重组dna的细胞能够在杀死未转化/未转染的细胞的抗生素浓度存在下存活。

靶生物是能够产生衣康酸的微生物体。该性质可以是内源性的,或者可以通过重组遗传技术将其引入细胞中。内源衣康酸产生细胞的实例是土曲霉的细胞,更特别是土曲霉菌株tn484-m1(高产量)和菌株cm85j(低产量)(dwiarti,l.等人,2002,j.biosci.bioeng.1:29-33)、菌株nrrl1960(riscaldati,e.等人,2000,j.biotechnol.83(3):219-230;bonarme,p.等人,1995,j.bacteriol.177(12):3573-3578)和菌株l.s.h.t.m.cat.no.am.1(calam,c.t.等人,1939,thom.j.biochem.33:1488-1495)和解乌头酸曲霉(kinoshita,1931,bot.mag.45:30)、玉米黑粉菌(wo2015/140314;geiser,e.等人,2016,microbbiotechnol.(9)1:116-126)和米曲霉(jimenez-quero,a.等人,2016,jmicrobiolbiotechnol.,doi:10.4014/jmb.1603.03073)。

可替代地,非天然衣康酸产生菌株可以通过在另一种微生物、优选黑曲霉中引入来源于任何上述菌株的顺式乌头酸脱羧酶来构建。这种酶将顺式乌头酸转化为衣康酸。如果宿主生物体缺乏足够的底物,那么可以考虑还将编码顺乌头酸酶和/或2-甲基柠檬酸脱水酶的基因引入相同的宿主生物体中,所述酶将无处不在的底物柠檬酸盐转化为顺式乌头酸。根据技术,编码上述酶的基因可以来源于土曲霉,其通常是本领域技术人员已知的。此外,构建具有这些基因的表达载体以及引入此类载体至宿主生物体中属于技术人员的技能范围内。

在两种情况下,通过存在能够在线粒体膜上转运衣康酸的转运蛋白或其前体或存在将衣康酸输出细胞之外的转运蛋白,可以进一步增强衣康酸的生产。此类转运蛋白和基因的实例是如wo2009/110796和wo2009/104958中所述的土曲霉ateg_09970.1或ateg_09972.1。

关于玉米黑粉菌,应该注意到在该微生物体中发现了可替代的衣康酸生物合成途径(参见geiser,e.等人,2016,microbbiotechnol.(9)1:116-126)。基于基因组挖掘,此途径的共生同源基因也存在于黑曲霉中:

反式-顺乌头酸酶脱羧酶an01g02970

乌头酸异构酶an13g01480

然而,途径基因的低水平同源性和不同的基因组结构使得这种途径不太可能在黑曲霉中具有功能性。

衣康酸的生物合成途径的关键是各种底物的定位。据认为衣康酸的生产主要发生在细胞溶质中。在许多生化途径中,终产物抑制其自身的产生以防止生物系统中的过量终产物。过量的终产物不仅会在经济意义上导致能量损失,还会产生不良副作用,诸如毒性。如实验部分所示,已经证明,在衣康酸的分批培养结束时,生产水平降低,这被认为是由于衣康酸的降解或生化转化导致的。此外,在高水平衣康酸产生菌株中,生物量形成也减少,这被认为是由于衣康酸和/或其代谢物中的一种的毒性作用导致的。预期通过耗竭细胞的衣康酸,新的衣康酸的形成将继续,而没有终产物抑制,因此导致总共的衣康酸产量增加。这可以通过另外为培养生物体提供转运蛋白来建立,所述转运蛋白将衣康酸前体转运到细胞溶质并将衣康酸转运到细胞外。此类转运蛋白已在wo2009/104958和wo2009/110796中示出和例举。本文要求保护的基因和方法通过引用并入本申请。

另外,本发明通过提供具有降低的衣康酸敏感性的突变体来减轻不想要的毒副作用,从而实现另一种方法。除了终产物抑制减少的效果之外,本发明还防止由分解或转化衣康酸或其前体的酶、衣康酰-coa转移酶和/或衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶产生的产物积累引起的毒性作用。据信,所谓的有机酸毒性(由衣康酸的存在所引起)的效果不是由衣康酸本身引起的,而是由从有机酸离开的代谢途径的第一步骤中生成的coa-酯引起的。因此,如所示的酶的抑制将产生更高浓度的衣康酸盐而没有归因于在细胞内以及排泄到培养基中的此类较高量的有机酸的毒性作用。

虽然酶当其在曲霉属中时,具有将这些酶的表达靶向至线粒体的定位信号,但即使衣康酸主要存在于细胞溶质中,也发现这些基因的抑制是有利的。解释这一点的理论是,可能在细胞溶质和线粒体之间仍然存在一种主动转运形式,并且如果衣康酸在线粒体中降解并因此耗竭,则应通过将衣康酸转运至线粒体来恢复平衡。因此,细胞溶质中衣康酸的量因此而减少。

已证明衣康酸的降解发生在病原菌鼠疫耶尔森菌(yersiniapestis)和铜绿假单胞菌(pseudomonasaeruginosa)中。该途径由三个步骤组成,用以在细胞结构单元中将衣康酸降解为化学物质丙酮酸盐和乙酰coa:通过衣康酰-coa转移酶(ict)的作用将衣康酸转化为衣康酰-coa。随后通过衣康酰-coa水合酶(ich)(柠苹酰-coa水解酶)的作用将衣康酰-coa转化为柠苹酰-coa,以及柠苹酰-coa被柠苹酰-coa裂解酶(ccl)切割为丙酮酸盐和乙酰coa(图22)(改编自sasikaran等人,2014,nat.chem.biol.10:371-377)。因此,通过抑制这三个基因中的任一个的表达来阻止降解,并从而增加衣康酸的量并减少由衣康酸的降解产物引起的毒性作用。

如本文中广泛描述的,可以以许多不同方式实现基因表达的抑制。当然,抑制优选针对这些酶中的一种或多种,因为它们出现在衣康酸生产微生物体中。

用于本发明中的微生物体优选是天然生产衣康酸的微生物体。优选地,编码上述一种或多种蛋白和一种或多种酶的基因的过表达是在丝状真菌、酵母和/或细菌中实现的,诸如但不限于曲霉属,诸如真菌土曲霉、解乌头酸曲霉和黑曲霉、构巢曲霉(aspergillusnidulans)、米曲霉或烟曲霉(aspergillusfumigatus)、玉蜀黍黑粉菌(ustilagozeae)、玉米黑粉菌(ustilagomaydis)、黑粉菌属(ustilagosp.)、念珠菌属(candidasp.)、解脂耶氏酵母(yarrowialipolytica)、红酵母属(rhodotorulasp.)和南极拟酵母(pseudozymaantarctica)、细菌大肠埃希氏菌和真菌酿酒酵母(saccharomycescerevisiae)。尤其优选的是异源柠檬酸生产生物体,其中底物可在宿主生物体中获得。

还已建立(参见us2004/0033570)土曲霉的所谓d4b区段,其包含负责洛伐他汀合成的cad基因(参见us2004/0033570中的图2)。因此,据认为,已知生产洛伐他汀的这些微生物体也是适用于生产衣康酸的候选物。此类微生物体包括红曲霉属(monascusspp.)(诸如红色红曲霉(m.ruber)、紫色红曲霉(m.purpureus)、丛毛红曲霉(m.pilosus)、透明红曲霉(m.vitreus)和软毛红曲霉(m.pubigerus))、青霉属(penicilliumspp.)(诸如桔青霉(p.citrinum)、黄青霉(p.chrysogenum))、菌寄生属(hypomycesspp.)、矛束孢属(doratomycesspp.)(诸如具柄矛束孢(d.stemonitis))、茎点霉属(phomaspp.)、正青霉属(eupenicilliumspp.)、裸子囊菌属(gymnoascusspp.)、拉巴毕赤酵母(pichialabacensis)、卡氏念珠菌(candidacariosilognicola)、多变拟青霉(paecilomycesvirioti)、短柄帚霉(scopulariopsisbrevicaulis)和木霉属(trichodermaspp.)(诸如绿色木霉(t.viride))。

因此,d4b区段的cad编码部分以及自这些上述的洛伐他汀产生性微生物体编码的具有cad活性的酶也被认为是适合用于本发明。进一步考虑,当通过以上提及的基因的过表达为此类生物体提供用于衣康酸表达的功能性途径时,可以使用本质上不产生或几乎不产生衣康酸的异源生物体,如黑曲霉或米曲霉。

用于衣康酸表达的功能性途径可以通过用编码顺式乌头酸脱羧酶cad(ec4.1.1.6)(诸如由ateg_09971.1的核酸序列编码的酶)的基因转化生物来产生,这还包括具有类似活性的酶(参见ep07112895)。然后,该生物体可以进一步配备有影响代谢产物转运的基因,诸如能够尤其是将顺式乌头酸盐、柠檬酸盐或异柠檬酸盐从线粒体转运至细胞溶质的二羧酸/三羧酸转运蛋白,优选由ateg_09970.1的核酸序列编码的基因。这些后续过程将使用编码cad酶的基因的过表达导致细胞溶质中顺式乌头酸增加,所述顺式乌头酸可以进一步转化为衣康酸。

此外,任选地,此类生物也可以包含能够在细胞膜上转运衣康酸或衣康酸盐的酶,诸如由ateg_09972.1的核酸序列编码的酶。

甚至可以通过调节包含锌指和真菌特异性转录因子结构域的调节蛋白(可以在包含ateg_09970的基因簇上发现)的活性来实现本发明的进一步优化,其中该调节蛋白被表示为ateg_09969.1。

过表这些酶的微生物体、提供此类微生物体的方法和来自ateg簇的基因的序列信息已在申请wo2009/014437、wo2009/104958和wo2009/110796中大量描述,其在此通过引用并入本文。

单独或组合的上述方法导致衣康酸随后的增加。改善的生产和减少毒性的组合导致适合的宿主增加衣康酸产量。上述基因优选来源于曲霉属,如土曲霉、黑曲霉、构巢曲霉、米曲霉或烟曲霉。然而,也有可能从其他衣康酸盐生产微生物体诸如玉蜀黍黑粉菌、玉米黑粉菌、黑粉菌属、南极拟酵母、念珠菌属、解脂耶氏酵母和红酵母属得到基因。

如上所述的重组宿主细胞可以使用本领域已知的用于向细胞提供重组核酸的方法获得。这些包括用包含偶联至驱动表达的启动子序列的目标核酸构建体的适合质粒(还被称为载体)进行的宿主细胞的转化、接合转移、转染或电穿孔。本发明的宿主细胞优选用如下进一步定义的核酸构建体进行转化,并且可包含单个但优选包含多个拷贝的核酸构建体。核酸构建体可以以附加体方式维持,并因此包含用于自主复制的序列,诸如ars序列。适合的附加型核酸构建体可以如基于酵母2μ或pkd1(fleer等人,1991,biotechnology9:968-975)质粒。优选地,然而,核酸构建体以一个或多个拷贝整合到宿主细胞的基因组中。宿主细胞基因组的整合可以通过非法重组随机发生,但优选核酸构建体通过同源重组整合到宿主细胞基因组中,如真菌分子遗传学领域所熟知的(参见如wo90/14423、ep-a-0481008、ep-a-0635574和us6,265,186),最优选地,对于同源重组,ku70δ/ku80δ技术,例如wo02/052026和krappmann,2007,fungalbiol.rev.21:25-29中使用的。

用本发明的核酸构建体转化宿主细胞和如上所述的本发明的真菌宿主细胞的另外遗传修饰可以通过本领域熟知的方法进行。此类方法已知例如来自标准手册,诸如sambrook和russel(2001)″molecularcloning:alaboratorymanual(第3版),coldspringharborlaboratory,coldspringharborlaboratorypress或f.ausubel等人编,″currentprotocolsinmolecularbiology″,greenpublishingandwileyinterscience,newyork(1987)。从如ep-a-0635574、wo98/46772、wo99/60102和wo00/37671中已知用于转化和遗传修饰真菌宿主细胞的方法。

在另一方面,本发明涉及发酵过程,其中本发明的转化的宿主细胞用于将底物转化为衣康酸。优选的发酵过程是需氧发酵过程。发酵过程可以是浸没式或固态发酵过程。

在固态发酵过程(有时称为半固态发酵)中,转化的宿主细胞在固体培养基上发酵,该固体培养基在没有任何自由流动物质的情况下为真菌提供锚定点。固体培养基中的水量可以是任意量的水。例如,固体培养基可以是几乎干燥的,或者可能是泥浆状的。本领域技术人员知道术语″固态发酵″和″半固态发酵″是可互换的。先前已经描述了各种各样的固态发酵装置(参见,larroche等人,″specialtransformationprocessesusingfungalsporesandimmobilizedcells″,adv.biochem.eng.biotech.,(1997),第55卷,第179页;roussos等人,″zymotis:alargescalesolidstatefermenter″,appliedbiochemistryandbiotechnology,(1993),第42卷,第37-52页;smits等人,″solid-statefermentation-aminireview,1998),agro-food-industryhi-tech,3月/4月,第29-36页)。这些设备分为两类,即静态系统和搅拌系统。在静态系统中,固体培养基在整个发酵过程中是静止的。用于固态发酵的静态系统的实例包括烧瓶、培养皿、托盘、固定床柱和烤箱。搅拌系统提供了在发酵过程中混合固体培养基的方法。搅拌系统的一个实例是旋转鼓(larroche等人,同上)。另一方面,在浸没式发酵过程中,转化的真菌宿主细胞在浸没于通常是本领域公知的搅拌槽发酵罐内的液体培养基中时进行发酵,尽管其他类型的发酵罐诸如气升式发酵罐也可以适用(参见,如us6,746,862)。

本发明优选的是浸没式发酵过程,其以补料分批或重复(补料)分批模式进行。在补料分批发酵中,连续输入含有碳源和/或其他相关营养素的进料,以提高衣康酸产量。例如,进料的输入可以是在恒定速率下,或者当特定底物的浓度或发酵参数低于某个设定点时。在重复的分批发酵中,通过终止发酵并从培养基中回收产生的产物,以规定的时间间隔收获培养物。除了更新培养基之外,通常还丢弃部分微生物培养物,而其余部分用作为用于后续分批培养的新接种物。

优选使用宿主细胞,其天然地含有如图21所描绘的衣康酸途径的酶/转运蛋白,以及细胞溶质和线粒体中的柠檬酸途径的酶/转运蛋白。然而,如果宿主缺少这些基因中的一种或多种,则可以将它们与上述酶和蛋白共同引入。这种共引入可以通过将这种基因的核苷酸序列置于与上述基因相同的质粒载体上,或置于单独的质粒载体上来进行。

此外,由于衣康酸途径部分位于细胞溶质中并且部分位于线粒体中,因此预期在那些隔室中的任一个或两个中基因/酶的过表达是理想的。本领域技术人员将知道如何通过使用适当的信号序列来在细胞溶质或线粒体中实现过表达。

如上已经描述,本发明的另一部分是由对衣康酸和/或其代谢物的毒性作用具有″抗性″的菌株形成的。此类菌株可以通过在对非突变体菌株有抑制的衣康酸浓度存在下生长的菌株的自发突变和选择来获得。在这些衣康酸抗性菌株中,有产生高水平的衣康酸的那些菌株。以这种方式,获得了于2017年8月17日根据布达佩斯条约(budapesttreaty)以登录号cbs141661和cbs141662保藏在乌特勒支(荷兰)的韦斯特迪克真菌生物多样性研究所(westerdijkfungalbiodiversityinstitute)(之前称为centraalbureauschimmelcultures(cbs))的两个菌株ee#25和ee#26。当然也可能通过高衣康酸生产菌株的化学或辐射处理和选择来诱导突变。

实施例

通过减少/去除衣康酸降解和/或生化转化改善衣康酸的生产

引言

本发明涉及真菌中衣康酸的微生物生产领域。本发明包括显示通过减少衣康酸的毒性降解和/或生化转化来提高衣康酸水平的结果,其通过:

(1)从生产宿主降低/去除衣康酰-coa转移酶、衣康酰-coa水合酶(柠苹酰-coa水解酶)和/或柠苹酰-coa裂解酶活性。

(2)通过突变体选择降低生产宿主的ia敏感性。

除了降低衣康酸水平,转化途径中的修饰也会影响衣康酸生产菌株的衣康酸敏感性,因为有机酸毒性通常不是由有机酸本身介导的,而是由转化途径的第一步中生成的coa-酯介导的。coa转移酶活性的破坏可导致毒性作用降低。所用的所有菌株和转化体列于表1中。

表1:所用的菌株和转化体.

菌株cbs141653、cbs141655、cbs141657、cbs141659、cbs141660、cbs141661和cbs141662已于2016年7月21日以‘安全保藏物’存放于韦斯特迪克真菌生物多样性研究所(之前称为centraalbureauschimmelcultures(cbs))。在2017年8月17日,这些保藏物转换为根据布达佩斯条约的保藏物。编号cbs143047至cbs143057的菌株于2017年7月24日根据布达佩斯条约保藏于韦斯特迪克真菌生物多样性研究所(荷兰)的cbs保藏物中。

实施例i:

衣康酸生产宿主菌株的受控发酵显示在发酵结束时降低的ia水平

用衣康酸生产性土曲霉菌株和衣康酸生产性黑曲霉转化体菌株进行受控发酵,其携带土曲霉cada、mtta和mfsa基因并过表达黑曲霉citb基因。如图1、图2和图3所示,在延长的发酵后观察到衣康酸水平显著降低,表明衣康酸降解和/或生化转化作为此类降低的手段。土曲霉的发酵条件

除非另有说明,否则使用以下条件:

37℃

ph开始3.5,设定点2.3

do设定点第1天,75%

第2、3、4天:50%

随后数天:25%

预培养物:100ml相同的培养基,与在发酵培养基(107个孢子/ml)中所用的一样,在带有挡板的500ml的erlenmeyer烧瓶中,过夜,37℃,150rpm

ph控制:4mkoh(碱)、1.5mh3po4(酸)

消泡剂:struktol(schill&seilacher)

培养基组成:

每升脱矿质水中:2.36gnh4so4,0.11gkh2po4,2.08gmgso4*7h2o,0.13gcacl2*2h2o,0.074gnacl,0.2mgcuso4*5h2o,5.5mgfe(ih)so4*7h2o,0.7mgmncl2*4h2o和1.3mgznso4*7h2o及作为碳源的100g葡萄糖。

使用黑曲霉菌株citb#77和#101的受控批次培养在5l规模的台式newbrunswickscientific发酵罐(bioflo3000)中于33℃进行。接种后起始ph为3.5,并使培养基自然酸化至ph2.3,然后通过添加4mkoh将ph保持在2.3。接种时溶解氧(do)张力为25%,并且do下降至20%并保持在20%。该系统用100%无菌空气作为100%do和100%n2作为0%do校准。将发酵罐用72小时含有1.0*10^8个孢子的100ml带挡板的摇瓶培养物接种。用于发酵和预培养的培养基组成(m12+cu)列于表2中。

使用q199(cbs143051)(一种携带ia基因簇(cada.mtta和mfsa)并过表达citb的来源于工业柠檬酸生产菌株(cbs140903)的转化体)进行的受控分批培养于35℃进行。将发酵罐用72小时的含有1.0*10^6个孢子的100ml无挡板的摇瓶培养物接种。用于发酵和预培养的培养基组成列于表2中,具有以下修改:使用160g/l葡萄糖代替100g/l葡萄糖,并且使用1.43g/lnh4no3和0.00058g/lfec13*6h2o代替(nh4)2so4和feso4。

菌株q199(cbs143051)经由共转化菌株aceet#1(cbs143053)与含有mtta和mfsa和pyre选择标记的单独表达盒构建。菌株aceet#1(cbs143053)经由an39pyre#4(cbs143052)(一种工业柠檬酸生产菌株(cbs140903)的pyre突变体(通过氟乳清酸选择产生))与含有cada-amds和citb的单独表达盒的共转化来构建。表达盒的序列和转化描述于hossain等人,2016,microb.cellfact.,15:130中。

表2:用作ia生产培养基的培养基12+cu的组成。改编自li等人2012,bmcbiotechnol.,12:57。

实施例2:

衣康酸毒性

用补充有以下ia浓度:0、10、20、40、75g/l的100mlm12+cu制备摇瓶(500ml),并通过添加koh/h2so4将ph调节至2.3。将烧瓶用1ml过夜生长的预培养物接种。7天后,收获菌丝体,并通过测量干重来确定生物量。使用ab1.13cad4.1(cbs141653)菌株测试ia对黑曲霉生长的影响。如图4所示,黑曲霉的生长在细胞外培养基中浓度为10g/lia时已经受到阻碍。在更高的浓度(20、40和75g/l)下,ia对生长的不利作用变得更加明显。基于这一结果,我们假设ia毒性确实可能限制其产生。

实施例3:

受控发酵期间提高的ia水平导致生物量形成减少

再次将黑曲霉在5l规模的台式newbrunswickscientific发酵罐(bioflo3000)中于33℃进行受控的分批培养。接种后起始ph为3.5,并使培养基自然酸化至ph2.3,然后通过添加4mkoh将ph保持在2.3。接种时溶解氧(do)张力为25%,并且do下降至20%并保持在20%。将系统用100%无菌空气作为100%do和100%n2作为0%do校准。将发酵罐用72小时含有1.0*10^8个孢子的100ml带挡板的摇瓶培养物接种。用于发酵和预培养的培养基组成列于表2中(改编自li等人2012,bmcbiotechnol.,12:57)。

如图5所示,在携带ia基因簇(cada、mtta和mfsa)和与ia生产相伴的过表达citb基因的两个高ia生产性黑曲霉转化体中,受控发酵期间产生的生物量的量低于低ia生产菌株ab1.13#49b(cbs141657)的量,显示ia在这些条件下对真菌生长的毒性作用。

实施例4:

分离对ia的生长抑制降低的黑曲霉突变体菌株

在用citb#99(cbs141659)菌株进行的实验室级进化实验中,申请人鉴定并分离了对ia的抗性增加的突变体菌株。在具有50-100g/l的ia的琼脂平板上进行数轮生长选择中进行选择。从这个进化实验中,突变体的特征在于它们的ia敏感性、ia消耗和ia生产率。在摇瓶实验中,评价了这些菌株在具有和不具有ia(40g/l)的生产培养基中生长的能力。该实验的结果显示于图6和图7。从图6中,显而易见的是,当在没有ia的培养基中生长时,所有进化突变体产生大约相同量的生物量。在含有40g/lia的进化培养基中,与亲本菌株citb#99相比,在40g/lia存在下,进化突变体ee#25(cbs141661)和ee#26(cbs141662)始终显示出更多的生物量。图7显示了菌丝体生长的平均抑制,证实了ee#25和ee#26与亲本菌株citb#99相比较少的生长抑制。

此外,ee#25和ee#26降解ia(即从培养基中摄取ia并代谢)的能力,与citb#99和ab1.13cad4.1(cbs141653)(一种仅携带异源cada基因的菌株)一起评估。含有产生培养基的摇瓶补充有ia(20g/l)和葡萄糖(1g/l和5g/l)。补充葡萄糖是分生孢子萌发所必需的。含有生产培养基并补充有1g/l葡萄糖的摇瓶用作阳性对照。在该实验中使用的所有四种菌株均显示ia的消耗(图8)。在补充有20g/lia和1g/l葡萄糖的培养基中,与citb#99和ab1.13cad4.1(cbs141653)相比,进化突变体菌株ee#25和ee#26从培养基中消耗更少的ia。在补充有ia和0.5%葡萄糖的生产培养基(表2)中可以看到相同的效果(图8)。ia进化突变体ee#25和ee#26共同显示出对ia的敏感性降低和消耗减少,使得它们作为适合用于改善的ia生产的菌株。

将两个进化突变体ee#25和ee#26与它们的亲本菌株citb#99用于ia和ca生产的比较。摇瓶(125ml)用25ml工作体积的ia生产培养基填充,并用1.0x106个孢子/ml接种,并于33℃孵育5天。将孵育上清液通过0.22μm过滤器过滤并在hplc上分析。通过在whatmann过滤器上过滤并于105℃干燥干生物量来测定生物量。在这些条件下,两种突变体产生更多的ia,而在不同培养基中ca水平较低。在m12+cu参考培养基中,产生了多4倍的ia和少2倍的ca(图9),对应于提高了4-5倍的比生产率(图10)。

实施例5

用于衣康酸分解代谢的基因组挖掘

在丝状真菌中,最近已经基于使用来自细菌如假单胞菌属/耶尔森氏菌属的衣康酸分解代谢途径基因编码的蛋白进行的同源性搜索描述了衣康酸的分解代谢途径,其中已描述了降解途径(chen,m等人,2016,appl.microbiol.biotechnol.doi10.1007/s00253-016-7554-0)。

对于衣康酰-coa转移酶和衣康酰-coa水合酶,至少两种可能的直系同源基因在黑曲霉和土曲霉中被鉴定出。基于chen等人公布的关于土曲霉的结果,通过在大肠埃希氏菌中的表达鉴定了该途径的功能同源物。

对于黑曲霉,鉴定了直系同源基因(75-85%同一性)(参见表3)。所有三个途径基因的蛋白分析表明降解途径的线粒体定位。

表3:衣康酸分解代谢途径蛋白序列.

粗体是chen等人,2016年对土曲霉描述的那些蛋白序列(ateg_xxxxx)及其在黑曲霉中最接近的同源物(anxxgxxxxx)。其他序列代表同一基因家族的编码旁系同源蛋白的基因。

衣康酰-coa转移酶

an07g00760,ateg_06299

an18g05120,ateg_02992,ateg_03794,ateg_09143

an11g10300,ateg_01554

>gi|145237042|ref|xp_001391168.1|caib/baif家族酶[黑曲霉cbs513.88](an07g00760;ict)mito:22,cyto:3

>gi|350635343|gbeha23704.1|假设的蛋白aspnidraft_40237[黑曲霉atcc1015](an07g00760;ict)mito:12,cyto:6,extr:6,pero:2

>gi|114191143|gb|eau32843.1|假设的蛋白ateg_06299[土曲霉nih2624](ateg_06299:ict)mito:25

这些基因的blast比对提供于图11中。

衣康酰-coa水合酶

an07g09220,ateg_03709

an17g02190,ateg_09462

>gi|145238698|ref|xp_001391996.1|假设的蛋白ani_1_2118064[黑曲霉cbs513.88](an07g09220:ich)mito:21,cyto:3,nucl:2

>gi|350635935gb|eha24296.1|假设的蛋白aspnidraft_180396[黑曲霉atcc1015](an07g09220:ich)mito:23,cyto:3

>gi|114193811|gb|eau35511.1|保守的假设蛋白[土曲霉nih2624](ateg_03709:ich)mito:23.5,cyto_mito:13.5

这些基因的blast比对提供于图12中。

柠苹酰-coa裂解酶

an01g08610,ateg_03186

>gi|145229949|ref|xp_001389283.1|柠檬酸裂解酶β亚基[黑曲霉cbs513.88](an01g08610:ccl)mito:26

>gi|350638357|gb|eha26713.1|柠檬酸裂解酶[黑曲霉atcc1015](an01g08610:ccl)mito:26

>gi|114194760gb|eau36460.1|保守的假设蛋白[土曲霉nih2624](ateg_03186:ccl)mito:25,cyto:1.5

这些基因的blast比对提供于图13中。

实施例6:

用于衣康酸酯化的基因组挖掘

关于衣康酸向相关的甲基衣康酸酯的转化,最近的出版物(zhao等人,2015,wo2015181310/wo2015181312)显示了反式乌头酸甲基转移酶(tmt-1)在生产单酯和二酯中的作用。土曲霉的基因组挖掘揭示了tmt-1样甲基转移酶同源物(与酿酒酵母tmt-1具有30%同一性)的存在,而没有线粒体靶向序列的预测。在黑曲霉中,没有发现这种蛋白的密切同源物。观察到许多弱的甲基转移酶同源物。这些基因中的一些是基因簇的一部分。在黑曲霉atcc1015中,存在与黑曲霉cbs513.88中额外不同的同系物。在土曲霉和黑曲霉中,存在顺式乌头酸2-甲基转移酶同源物,预测其为线粒体定位(表4)。

表4:衣康酸甲基转移酶途径.

反式-乌头酸3-甲基转移酶(tmt-1)ateg_06208

反式-乌头酸2-甲基转移酶(tmt-2)ateg_04223,an16g06510

>gi|317036255|ref|xp_001397953.2|反式-乌头酸2-甲基转移酶[黑曲霉cbs513.88]an16g06510mito:21,nuc|:5

>gi|350633811gb|eha22176.1|假设的蛋白aspnidraft_40903[黑曲霉atcc1015]an16g06510:反式-乌头酸2-甲基转移酶)cyto:13,cyto_nucl:12.333,cyto_mito:9.999,nucl:8.5,mito:5.5

>gi|115391793ref|xp_001213401.1|反式-乌头酸2-甲基转移酶[土曲霉nih2624](ateg_04223:反式-乌头酸2-甲基转移酶)mito:13.5,cyto_mito:10.833,cyto:7,pero:5,cyto_nucl:4.833

这些基因的blast比对提供于图14中。

实施例7:

用于可替代的ia生物合成途径的基因组挖掘

基于geiscr等人(microbbiotechnol.2016年1月;9(1):116-126.)的数据,在丝状真菌玉米黑粉菌中发现了可替代的ia生物合成途径。基于基因组挖掘,该途径的旁系同源基因也存在于黑曲霉中(参见表5)。

表5:可替代的衣康酸途径.

黑曲霉的反式乌头酸脱羧酶umag_05076同源物.

umag_05076

>gi|961452800gb|als30796.1|反式-乌头酸脱羧酶1[玉米黑粉菌]

an14g01340

>gi|317034933|refxp_001400761.2|精氨基琥珀酸裂解酶[黑曲霉cbs513.88]

an01g02970

>gi|145228845|ref|xp_001388731.1|精氨基琥珀酸裂解酶[黒曲霉cbs513.88]

黑曲霉的乌头酸异构酶umag_11778同源物。

umag_11778

>gi|961452802|gb|als30798.1|乌头酸-δ-异构酶1[玉米黑粉菌]

an13g01480

>gi|317034401|ref|xp_001396287.2|假设的蛋白ani_1_618114[黑曲霉cbs513.88]

an02g11060

>gi|145233725|ref|xp_001400235.1|假设的蛋白ani_1_3022024[黑曲霉cbs513.88]

an12g05470

>gi|317033882|ref|xp_001395615.2|假设的蛋白ani_1_1868104[黑曲霉cbs513.88]

an18g00050

>gi|317037430|ref|xp_001398476.2|假设的蛋白ani_1_924164[黑曲霉cbs513.88]

这些途径基因的低水平同源性和不同的基因组的组织,使得这种途径在黑曲霉中不太可能具有功能。

这些基因的blast比对提供于图15a和15b中。

实施例8:

基因表达分析

基于土曲霉中的转录组分析(参见登录号gse73033;chen,m.等人,2016,appl.microbiol.biotechnol.dol10.1007/s00253-016-7554-0),在ia降解的条件(40g/lia添加至培养基)下诱导三个分解代谢途径基因的表达,从而引起高衣康酸水平,而甲基转移酶途径基因未被诱导(参见表6)。

表6:土曲霉中的基因表达分析

括号内的rkpm值代表诱导的表达水平。

类似地,进行在发酵罐中生长的表达功能性衣康酸途径的黑曲霉菌株的全基因组基因表达分析,以鉴定由衣康酸基因簇的表达共调节的基因。研究了以下菌株:ab1.13wt、ab1.13cad4.1(cbs141653)、ab1.13#49b(cbs141657)、citb#99(cbs141659)和citb#113。

在5l规模的台式newbrunswickscientific发酵罐(bioflo3000)中于33℃进行受控分批培养。接种后起始ph为3.5,并使培养基自然酸化至ph2.3,然后通过添加4mkoh将ph保持在2.3。接种时溶解氧(do)张力为25%,并且do下降至20%并保持在20%。系统用100%无菌空气作为100%do和100%n2作为0%do校准。将发酵罐用72小时的含有1.0*10^8个孢子的100ml带挡板的摇瓶培养物接种。用于发酵和预培养的培养基组成(m12+cu)列于表2。用于rna分离的生物量样品在发酵期间的数个时间点取得,并用蒸馏水洗涤并在液氮中冷冻。通过用0.1mm酸洗的锆二氧化硅珠进行珠打来破坏菌丝体,并使用来自invitrogen(carlsbad,ca,usa)的chargeswitchrna提取方法进行rna提取。在1xmops/6%甲醛琼脂糖凝胶上检查质量控制并用溴化乙锭染色。

荷兰莱顿(leiden,nl)的baseclear使用illuminahiseq2000系统基于rna-seq进行数字基因表达谱分析实验。获得大约8-32m未过滤的配对末端(pe)读段(在~320bpcdna插入物上,99bp/读段)。修剪读段的5′末端的前2个碱基,这是因为这些碱基显示出异常低的gc含量。然后进一步过滤读段,使得过滤后的所有质量phred评分为至少22,读段长度为至少40个碱基。大约70-80%的碱基通过了这些标准(包括因裁剪而损失2%)。过滤后,对于所有样品,#pe-读段/样品分别在7.6m和19.8m之间。

读段与黑曲霉参考基因组的fasta文件中的20个重叠群对齐(来自http://www.ebi.ac.uk/ena)。源embl注释转换为gff格式。embl数据似乎来源于具有不同特征标签的多个来源。将这些转换为一个统一的gff格式,可以被申请人的第三方软件接受(所有重叠群中的一致的gene_ids)。将缺失基因定义插入(如用于cad)。使用基于burrows-wheeler变换(bwt)算法的软件将读段与参考基因组比对。比对允许4%的错配率。最大插入长度为3。最大缺失长度为3。所有样品都有超过85%的读段对齐,从而生成sam比对文件。将基因表达测量为参考基因的比对读段的数目,并归一化为rpkm值(每百万个读段的每kb的读段;mortazavi等人,2008,naturemethods,5:621-628)。

鉴定了可能与衣康酸分解相关的数种基因(表7)。此外,编码反式乌头酸2-甲基转移酶(an16g06510)的基因似乎是由衣康酸诱导的。还有人指出,在黑曲霉中,对于所有基因,诱导水平对于过表达不同部分的ia生物合成途径和/或citb过表达的菌株是不同的,表明了对于有机酸转运和产物中间体定位的作用。

表7:黑曲霉ia生产性菌株中的基因表达分析.

括号内的rkpm值代表诱导的表达水平

如表7所示,在ia生产性黑曲霉转移体菌株中明显诱导了所提出的ia降解途径的两个基因和编码衣康酸甲基转移酶途径中的一步的基因,表明了两个途径在受控发酵期间ia的降解和/或生化转化中的作用。

实施例9:

宿主菌株改性

基于表6和表7中描述的结果,鉴定了三种基因被靶向用以基因破坏,因为它们被观察到的过表达可导致产生的衣康酸水平降低,即衣康酰-coa转移酶(an07g00760)和衣康酰-coa水合酶(an07g09220)和柠苹酰-coa裂解酶(an01g08610)。

分解代谢途径中单个基因的靶向基因破坏被认为导致途径中间体(尤其是coa酯)的积累,这可能导致毒性增加,因此也考虑了组合的破坏突变。

基于注释的基因序列,根据arentshorst等人,2015,genetictransformationsystemsinfungi,第1卷,fungalbiology,doi10.1007/978-3-319-10142-2_25中描述的方法,为这3个基因开发了四个所谓的分裂标记基因破坏盒(参见图16)。

转化是在两个菌株中完成的。将citb#99pyre#67(cbs143054)(高衣康酸产生实验室-株citb#99(cbs141659)的选定pyre突变体)与pyre分裂标记共转化以产生icta(an07g00760)缺失菌株citb#99δict#rd1(cbs143055)、icha(an07g09220)缺失菌株citb#99δich#rb2(cbs143056)和tmta(an16g06510)缺失菌株citb#99δtmt#6(cbs143057)。将菌株q199(cbs143051)(高衣康酸生产菌株,来源于工业柠檬酸生产菌株)与hph分裂标记共转化以产生icta缺失菌株q199δict#4(cbs143050)。在我们的发酵实验中,我们看到由于衣康酸或其中一种降解产物对黑曲霉生长的毒性作用,最高的生产菌株也生长最差(参见图2、3和5)。另一个icta缺失菌株是在工业柠檬酸生产菌株背景中使用不同的途径创建的。第一菌株cadmfs#15(cbs143047)是由菌株an39pyre#4(cbs143052)与含有cada-amds和mfsa的单独表达盒共转化而产生的。接下来,cadmfs#15的选定pyre突变体,即cadmfs#15pyre#8(cbs143048)与含有cada、mtta、mfsa、citb和hph分裂标记的单独表达盒共转化以产生icta(an07g00760)缺失菌株转化体cadmfs#15mttcitbcadmfsδicthygb#21(cbs143049)。用pcr产物进行分裂标记片段和表达盒的共转化。表达盒的序列和转化描述于hossain等人,2016,microb.cellfact.,15:130中。将选定的转化体纯化,并通过诊断性pcr分析相应靶基因的破坏和转化基因的存在。鉴定正确的基因破坏转化体并用于进一步研究。

实施例10:

改善的衣康酸生产

携带衣康酰-coa转移酶(an07g00760)和/或衣康酰-coa水合酶(an07g09220)和/或柠苹酰coa裂解酶(an01g08610)缺失的衣康酸生产性黑曲霉菌株通过减少/去除衣康酸降解和/或生化转化导致衣康酸生产改善。可从图17和图18中看出,在振荡和静态烧瓶中,在衣康酰-coa转移酶(an07g00760)或衣康酰-coa水合酶(an07g09220)的缺失菌株中观察到衣康酸水平产生显著提高。在工业柠檬酸产生菌株背景中使用不同途径产生的icta(an07g00760)缺失菌株cadmfs#15mttcitbcadmfsδicthygb#21(cbs143049)获得了类似的结果。

将缺失菌株及其亲本菌株在装有100ml生产培养基的500mlerlenmeyer烧瓶中培养。培养基组成列于表2,具有以下修改:使用160g/l葡萄糖(图17)或200g/l葡萄糖(图18)代替100g/l葡萄糖,并使用1.43g/lnh4no3和0.00058g/lfecl3*6h2o代替(nh4)2so4和feso4。将烧瓶用1.0*10^6(图17)或1.0*10^5(图18)个孢子/ml接种,并于33℃(图17)或35℃(图18)在孵育箱中以250或0rpm孵育(图17b)。通过hplc分析及时获得有机酸水平(g/l)。

用携带衣康酰-coa转移酶(an07g00760)或衣康酰-coa水合酶(an07g09220)缺失的菌株进行受控发酵实验。使用缺失菌株citb#99δict#rd1(cbs143055)和缺失菌株citb#99δich#rb2(cbs143056)进行的受控发酵如实施例3中所述来进行。然而,生产培养基(表2)含有1.43g/lnh4no3和0.00058g/lfecl3*6h2o代替(nh4)2so4和feso4。用缺失菌株q199δict#4(cbs143050)(参见图20)进行的受控发酵如实施例1中对菌株q199(cbs143051)所述的来进行,但用200g/l葡萄糖代替160g/l葡萄糖。

从这些发酵中确定衣康酸水平,并与来自亲本宿主菌株的类似样品进行比较(参见图3和5)。从图17和图19可以清楚地看出,衣康酰-coa转移酶(an07g00760)的缺失比衣康酰-coa水合酶(an07g09220)的缺失更加改善了衣康酸的生产,表明了遗漏整个降解途径更有益。

缺失来自降解途径的三个基因中的任一个,不仅导致较少或没有衣康酸降解,而且还导致较少的细胞内途径中间体的积累,导致黑曲霉的生长抑制较少。此外,在这些菌株中观察到增加水平的衣康酸。

核苷酸&蛋白序列

编码序列突出显示。

衣康酰-coa水合酶

>gbacje01000009.1|:2143350-2147500黑曲霉atcc1015,全基因组鸟枪序列(衣康酰-coa水合酶ich)an07g09220

>gi|350635935|gb|eha24296.1|假设的蛋白aspnidraft_180396[黑曲霉atcc1015](an07g09220:ich)mito:23,cyto:3

>gb|aajn01000104.1|:124953-128107土曲霉nih2624contl.104,全基因组鸟枪序列(ateg_03709:ich)

>gi|114193811|gb|eau35511.1|保守的假设蛋白[土曲霉nih2624](ateg_03709:ich)mito:23.5,cyto_mito:13.5

衣康酰-coa转移酶

>gb|acje01000009.1|:151257-155510黑曲霉atcc1015,全基因组鸟枪序列(衣康酰-coa转移酶ict)an07g00760

>gi|350635343|gb|eha23704.1|假设的蛋白aspnidraft_40237[黑曲霉atcc1015](an07g00760;ict)mito:12,cyto:6,extr:6,pero:2

>gb|aajn01000170.1|:c168650-165409土曲霉nih2624cont1.170,全基因组鸟枪序列(ateg_06299:ict)

>gi|114191143|gb|eau32843.1|假设的蛋白ateg_06299[土曲霉nih2624](ateg_06299:ict)mito:25

柠苹酰-coa裂解酶

>gb|acje01000004.1|:c2178751-2175602黑曲霉atcc1015,全基因组鸟枪序列柠苹酰-coa裂解酶(ccl)an01g08610

>gi|350638357|gb|eha26713.1|柠檬酸裂解酶[黑曲霉atcc1015](an01g08610:ccl)mito:26

>gb|aajn01000091.1|:c71368-68661土曲霉nih2624cont1.91,全基因组鸟枪序列(ateg_03186:cc1)

>gi|114194760|gb|eau36460.1|保守的假设蛋白[土曲霉nih2624](ateg_03186:ccl)mito:25,cyto:1.5

反式乌头酸2-甲基转移酶

>gb|acje01000013.1|:1755738-1758598黑曲霉atcc1015,全基因组鸟枪序列(an16g06510:反式-乌头酸2-甲基转移酶)

>gi|350633811|gb|eha22176.1|假设的蛋白aspnidraft_40903[黑曲霉atcc1015]an16g06510:反式-乌头酸2-甲基转移酶)cyto:13,cyto_nucl:12.333,cyto_mito:9.999,nucl:8.5,mito:5.5

>gb|aajn01000116.1|:171440-174275土曲霉nih2624cont1.116,全基因组鸟枪序列(ateg_04223:反式-乌头酸2-甲基转移酶)

>gi|115391793|ref|xp_001213401.1|反式-乌头酸2-甲基转移酶[土曲霉nih2624](ateg_04223:反式-乌头酸2-甲基转移酶)mito:13.5,cyto_mito:10.833,cyto:7,pero:5,cyto_nucl:4.833

5-侧翼an07g09220/pyre

3-侧翼an07g09220/pyre

5-侧翼an07g00760/pyre

3-侧翼an07g00760/pyre

5-侧翼-ict-hygb

3-侧翼-ict-hygb

5-侧翼_tmta

3-侧翼_tmta

pct

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1