大规模并行组合遗传学的制作方法

文档序号:467610阅读:265来源:国知局
大规模并行组合遗传学的制作方法
【专利摘要】本发明涉及能够快速产生遗传元件的高阶组合以及提供用于快速表征单个细胞或合并群体中所编码遗传元件之特定组合的条形码化基础的方法和组合物。
【专利说明】大规模并行组合遗传学
[0001] 政府权益
[0002] 本发明是在国立卫生研宄院授予的基金号DP2 0D008435的政府支持下完成的。政 府对本发明享有一定的权益。

【技术领域】
[0003] 本发明涉及用于快速产生遗传元件的高阶(high-order)组合以及容易地鉴定遗 传元件的方法和组合物。

【背景技术】
[0004] 生物学一直受限于不能产生复杂细胞干扰(perturbation)。之前的研宄仅使用单 个基因过表达研宄(Kitagawa等(2005)DNAResearch12 :291_9;Soo等(2011)ProcNatl AcadSciUSA108:1484-9)和单个基因敲除研宄以及有限的一组双敲除研宄(Butland 等(2008)NatureMethods5 :789_95;Pan等(2004)MolecularCell16 :487_96;Tong等 (2004)Science303:808-13)来筛选期望的表型。然而,无法扩展这些方法以产生更高阶的 干扰组合,阻碍了更强力和复杂的网络询问(interrogation)。另外,不容易扩展这些方法 以产生超过几千种的组合。这阻止了以高通量合并方式筛选和研宄上百万的组合,而是依 赖于基于孔(well-based)或基于集落(colony-based)的筛选。最后,这些方法未能被设 计来快速表征特定组合。


【发明内容】

[0005] 本文描述了能够快速产生遗传元件的高阶组合以及提供用于快速表征单个细胞 或合并群体中所编码遗传元件之特定组合的条形码化(barcoded)基础的方法和组合物。 这些新方法对于许多领域都带来很大影响,能够使其中产生遗传元件之组合的大量调查 成为多信息的并且多产的。该技术可产生对于之前难以研宄的复杂表型和突发网络特性 (emergentnetworkproperty)的新的令页悟。
[0006] 本发明的一些方面涉及遗传构建体,所述遗传构建体包含:DNA元件;所述DNA元 件侧翼的第一相容性(compatible)末端元件和第二相容性末端元件,其中所述第一和第 二相容性末端元件能够彼此退火;条形码(barcode)元件;所述条形码元件侧翼的第三相 容性末端元件和第四相容性末端元件,其中所述第三和第四相容性末端元件能够彼此退火 但是不能与第一或第二相容性末端元件退火;以及位于所述第四相容性末端元件与所述第 一相容性末端元件之间的分离位点(separationsite),其中所述DNA元件、第一相容性末 端元件和第二相容性末端元件位于所述分离位点的一侧,而所述条形码元件、第三相容性 末端元件和第四相容性末端元件位于所述分离位点的另一侧。
[0007] 本发明的另一些方面涉及遗传构建体,所述遗传构建体包含:多个DNA元件;所述 多个DNA元件侧翼的第一相容性末端元件和第二相容性末端元件,其中所述第一和第二相 容性末端元件能够彼此退火;多个条形码元件;所述多个条形码元件侧翼的第三相容性末 端元件和第四相容性末端元件,其中所述第三和第四相容性末端元件能够彼此退火但是不 能与第一或第二相容性末端元件退火;以及位于所述多个DNA元件与所述多个条形码元件 之间的分离位点。
[0008] 本发明的另一些方面涉及用于产生组合遗传构建体的方法,所述方法包括:提供 包含本发明相关的第一遗传构建体的载体;在所述第一遗传构建体内的分离位点处切割所 述载体,导致所述第一遗传构建体被分离成第一区段和第二区段;提供本发明相关的第二 遗传构建体;以及使所述第二遗传构建体与经切割的载体退火,其中退火发生在第一和第 二遗传构建体内能够彼此退火的相容性末端元件处,并且其中在退火后,第二遗传构建体 整合在第一遗传构建体的第一区段和第二区段之间,产生组合遗传构建体。在一些实施方 案中,所述方法是迭代(iterative)的。
[0009] 本发明的另一些方面涉及用于鉴定一个DNA元件或多个DNA元件的方法,所述方 法包括:提供本发明相关的遗传构建体;进行测定以确定所述遗传构建体内的条形码或多 个条形码的DNA序列和/或所述遗传构建体内的DNA元件或多个DNA元件的DNA序列;以 及鉴定所述DNA元件或多个DNA元件。
[0010] 本发明的另一些方面涉及文库,所述文库包括:两种或更多种本发明相关的遗传 构建体。
[0011] 本发明的另一些方面涉及用于产生组合遗传构建体的方法,所述方法包括:提供 载体,所述载体包含:第一DNA元件、第一条形码元件和位于所述第一DNA元件与所述第一 条形码元件之间的两个位点特异性重组元件;提供第一插入片段(insert),所述第一插入 片段包含:第二DNA元件、第二条形码元件以及所述第二DNA元件和所述第二条形码元件 各自侧翼的位点特异性重组元件,使得与载体内的位点特异性重组元件不相容的两个位点 特异性重组元件位于第二DNA元件和第二条形码元件之间,并且与载体内的位点特异性重 组元件相容的两个位点特异性重组元件位于第二DNA元件和第二条形码元件外侧;在载体 与第一插入片段之间进行位点特异性重组,其中位点特异性重组发生在位于载体内的第一 DNA元件和第一条形码元件之间的位点特异性重组元件与位于第一插入片段内第二DNA元 件和第二条形码元件外侧的相容性位点特异性重组元件之间,并且其中在位点特异性重组 之后,第一插入片段位于载体内,且载体包含多个DNA元件和多个条形码元件,两个位点特 异性重组元件位于多个DNA元件和多个条形码元件之间;提供第二插入片段,所述第二插 入片段包含:第三DNA元件、第三条形码元件以及第三DNA元件和第三条形码元件各自侧翼 的位点特异性重组元件,使得与位于载体的多个DNA元件和多个条形码元件之间的两个位 点特异性重组元件不相容的两个位点特异性重组元件位于第三DNA元件和第三条形码元 件之间,并且与位于载体的多个DNA元件和多个条形码元件之间的两个位点特异性重组元 件相容的两个位点特异性重组元件位于第三DNA元件和第三条形码元件外侧;在载体与第 二插入片段之间进行位点特异性重组,其中位点特异性重组发生在位于载体内的多个DNA 元件和多个条形码元件之间的位点特异性重组元件与位于第二插入片段内第三DNA元件 和第三条形码元件外侧的相容性位点特异性重组元件之间,并且其中在位点特异性重组之 后,第二插入片段位于载体内,且载体包含多个DNA元件和多个条形码元件,两个位点特异 性重组元件位于多个DNA元件和多个条形码元件之间;以及重复位点特异性重组n次,交替 地在载体与第一插入片段之间进行位点特异性重组并且在载体与第二插入片段之间进行 位点特异性重组,从而产生组合遗传构建体。
[0012] 本发明的另外一些方面涉及通过这样的方法所产生的组合遗传构建体。本发明的 另一些方面涉及鉴定这样的组合遗传构建体内的一个DNA元件或多个DNA元件的方法,所 述方法包括:提供组合遗传构建体;进行测定以确定组合遗传构建体内的一个或更多个条 形码元件的DNA序列和/或组合遗传构建体内的一个或更多个DNA元件的DNA序列;以及 鉴定所述DNA元件或多个DNA元件。
[0013] 本发明的另一些方面涉及用于产生组合遗传构建体的方法,所述方法包括:提供 载体,所述载体包含:第一DNA元件、第一条形码元件和位于所述第一DNA元件与所述第一 条形码元件之间的第一限制性酶的识别位点;提供插入片段,所述插入片段包含:第二DNA 元件、第二条形码元件以及位于所述第二DNA元件和所述第二条形码元件之间的第一限制 性酶的识别位点,以及位于所述第二DNA元件和所述第二条形码元件外侧的不同于第一限 制性酶的一种或更多种限制性酶的两个识别位点,使得在载体内的识别位点处的限制性消 化与在位于插入片段内第二DNA元件和第二条形码元件外侧的两个识别位点处的限制性 消化产生相容性末端;用限制性酶消化载体和插入片段;使插入片段与载体退火,从而产 生含多个DNA元件和多个条形码元件的组合遗传构建体;以及任选地重复所述方法n次。 [0014] 本发明的另一些方面涉及通过这样的方法所产生的组合遗传构建体。本发明的另 一些方面涉及鉴定这样的组合遗传构建体内的一个DNA元件或多个DNA元件的方法,所述 方法包括:提供组合遗传构建体;进行测定以确定组合遗传构建体内的一个或更多个条形 码元件的DNA序列和/或组合遗传构建体内的一个或更多个DNA元件的DNA序列;以及鉴 定所述DNA元件或多个DNA元件。
[0015] 参考本发明的附图和详细描述,本发明的这些和其他方面以及其各种实施方案将 变得更加明显。
[0016] 本发明的每一个限定可涵盖本发明的多个实施方案。因此,预期本发明的每一个 限定都涉及可能包括在本发明每一个方面中的任何一个元件或元件的组合。本发明并不将 其应用局限于下述说明书提出的或附图所示的构造细节和组件布置。本发明能够具有另一 些实施方案,并且能够以多种方式实施或执行。
[0017] 附图简述
[0018] 附图并未旨在按比例绘制。在附图中,各图中示出的每一个相同或近似相同的组 件用相同的数字表示。为了清楚起见,并没有在每个图中将每一个组件都进行标记。在附 图中:
[0019] 图1表示描绘了本发明的一个非限制性实施方案的示意图。图1A示出了每一个 独特DNA元件的独特条形码化构建体的产生。图1B示出与本发明一些方面相关的遗传构 建体可产生载体(例如,通过限制性酶切割)和同源插入片段(例如,通过PCR)。相容性末 端可退火并且连接。图1C示出与本发明一些方面相关的组合构建体允许通过独特条形码 (箭头)的测序快速鉴定DNA元件,并且保留分离位点以允许进一步的插入。
[0020] 图2证明了单个独特元件与其自身的组合。图2A描绘了未切割质粒的凝胶电泳, 示出每次添加约?lkb的增加,对应于插入片段的长度。图2B描绘了在构建体区域侧翼的 两个位点处的限制性消化,示出长度增加。
[0021] 图3描绘了mCherry和GFP构建体的组合和功能性表达。使用滤镜描绘了 mCherry(图3A)、GFP(图3B)以及重叠(图3C)的荧光图像。
[0022] 图4描绘了来自组合反应的四个克隆的测序结果和比对。底部示出了序列注释。 深色阴影序列表示条形码的独特部分。回收了两个条形码化构建体的所有四种可能的排 列,同时在右侧保留了Xbal分离位点。
[0023] 图5描绘了与本发明一些方面相关的限制性位点构思技术。限制性酶BamHI和 Bglll产生相容性突出端,所述突出端在连接时,形成不能被这两种酶中的任一种识别的痕 (scar)。分离位点由Bglll和EcoRI限制性位点组成。用不同的限制性酶消化载体和插入 片段允许插入插入片段,并且保留了分离位点用于进一步组合。
[0024] 图6描绘了容易地产生更高阶组合。图6A示出了来自单个集落(colony)的成对 (pairwise)、3X、和4X组合之经证实的序列。条形码区侧翼是Spel和AvrII限制性位点。 图6B示出了用于条形码化基因单(IX)以及2X至4X组合之质粒分离物的限制性消化。 消化每个质粒以使可变的组合区(用点表示)和载体的恒定其余部分分开。
[0025] 图7描绘了通过限制性位点组装的GFP和mCherry组合的定量评估。样品#1-24 是分离自转化至大肠杆菌(E.coli)DH5a细胞之组合文库的集落。GFP-GFP组合的代表是 样品 #1、8、14、15、16、18、21、22 和 24 ;mCherry-mCherry组合的代表是 #7、10、11、17、20 ; GFP&mCherry组合的代表是 #2-6、8、12、13、19、23。
[0026] 图8描绘了条形码拼接(barcodestitching)。将条形码置于DNA元件的任一端并 融合在一起。该策略局限于成对组合并且每片需要单独文库。该图改编自Merryman(2012) MetabolicEngineering14:196_204〇
[0027] 图9描绘了Gateway?克隆技术,其允许转移dna而不切割dna(来自http:// wolfson.huji.ac.il/expression/gatewayman.pdf)〇
[0028] 图io描绘了用于在一个遗传构建体内组装多个插入片段的多位点Gateway?Pro克隆技术的一个非限制性实例(来自网址:pfgrc.jcvi.org/index.php/gateway_ clones/about_knockoutclones.html)〇
[0029] 图11描绘了可以由具有独特重组序列的两个载体文库通过PCR产生两个插入片 段文库的一个非限制性实施方案,每个插入片段内的DNA元件和条形码元件侧翼为重组序 列。att重组序列用B、P、L或R表示。BC=条形码,DNA=DNA元件。
[0030] 图12描绘了使用一个载体文库和两个插入片段文库通过重组介导的组合遗传学 迭代产生更高阶组合。迭代过程在所述两个插入片段文库之间交替。条形码彼此十分靠近, 允许确定条形码,并因此鉴定下游DNA元件。
[0031] 图13描绘了使遗传构建体中部的两个重组序列始终正交于末端以避免自身重组 的一个非限制性实施方案。
[0032] 图14描绘了通过PCR添加反应末端(B1+B2,L3+L4)的本发明的一个非限制性实 施方案。该实施方案避免了载体最后与自身反应。
[0033] 图15描绘了使用单一酶分离位点的大规模并行组合遗传学(MassivelyParallel CombinatorialGenetics)的一个非限制性实施方案。在本实施方案中,单一酶酶1在载体 的分离位点切割,产生3-碱基的3'突出端。插入片段内的条形码元件和DNA元件侧翼为 不同酶酶2的限制性位点,其产生与酶1相容的突出端。对载体和插入片段进行的消化和 连接产生了包含插入片段的载体,并且在载体中保留了酶1的限制性位点。
[0034] 图16A描绘了大规模并行组合遗传学组装策略的一个非限制性实施方案。使转录 因子(TF)表达构建体条形码化(BC),并且如所示定位的四个限制性位点(1A、1B、2A、2B)。 对1A/1B和2A/2B是产生一对内相容但是不与另一对相容之突出端的独特限制性位点。合 并条形码化载体并用酶1B+2A进行消化。插入片段由载体通过PCR产生,并且用1A+2B进 行消化。图16B描绘了成对文库中组合间的高通量测序读数(reads)的分布。图16C描绘 了大规模并行组合遗传学构建体的表达。用250ng/mLaTc诱导GFP和mCherry构建体的 全部4种成对组合以及单GFP和单mCherry构建体并通过流式细胞术评估。
[0035] 图17描绘了质粒图,其示出条形码化并且侧翼是用于大规模并行组合遗传学文 库组装之限制性位点的单基因表达构建体(GFP)。
[0036] 图18A描绘了大规模并行组合遗传学方法的一个非限制性实施方案。将含有大规 模并行组合遗传学文库的大肠杆菌NDM-1细胞稀释到具有和不具有aTc的培养物中并生长 到对数中期。然后将每一培养物进一步稀释到具有和不具有抗生素以及具有和不具有aTc 的培养物中。在对数生长阶段早期和对数生长阶段晚期,收获每一种条件下的DNA并进行 高通量测序处理。不同条件下组合丰度(abundance)的比较揭示了导致期望表型的基因 型。图18B描绘了"hit"概况热图。实验间组合的系统聚类(hierarchicalclustering)S 评分示出了不同表型的谱。标记为协同的区域表示在添加头孢曲松(ceftriaxone)和aTc 二者之后消失的组合。相反地,生长表示在添加头孢曲松和aTc二者之后相对过度呈现的 组合。
[0037] 图19描绘了基因组合和相反(reciprocal)组合的系统聚类。编号1-8表示对应 于图18B中那些的基因对。R表不基因对的相反排列。赋予相同表型的基因对及其相反对 聚类在一起。
[0038] 图20A描绘了示出NDM-1抗生素易感性表型之协同作用的图。NDM-1抗生素易感性 表型。图20B描绘了示出NDM-1抗生素易感性表型之对照的图。组合对于头孢曲松表现出 较小的增强。与adiY+marA相比,eCFP+norR作用的开始被延迟。图20C描绘了示出NDM-1 抗生素易感性表型生长优势的图。在整个实验过程中,组合表现出对诱导最小的影响。
[0039] 图21A和21B描绘了示出个别基因之抗生素易感性的图。
[0040] 图22描绘了抗生素头孢曲松、亚胺培南(imipenem)、哌拉西林-三唑巴坦 (piperacillin-tazobactam)和庆大霉素(gentamicin)间的系统聚类。高处理的0-内酰 胺聚类在一起,与庆大霉素分开。
[0041] 图23A描绘的图示出在诱导时,组合使抗生素致死性提高了 4-6个数量级,并且对 于生长的抑制超过10小时。图23B描绘的图示出随机的致死组合(例如cadC+allR)对于 头孢曲松显著更低效的加强(amplification),并且随时间的持续生长抑制更少。图23C描 绘的图示出相比组合torR+metR,单独的torR和metR对于头孢曲松的加强显著更弱。图 23D描绘的图示出含torR+metR和nhaR+melR的噬菌粒感染的NDM1细胞表现出在头孢曲松 以及诱导下培养物杀伤性加强。
[0042] 图24描绘了荧光诱导曲线的图。
[0043] 图25描绘了所有抗生素aTc条件下顶部hit的系统聚类。6311个基因对表现出 大于2. 4或小于-2. 4的至少一种S评分,其中2. 4是S评分群体分布标准偏差的3倍。在 聚类分析中使用欧几里德相关性与平均联接。在aTc存在下,0 -内酰胺亚胺培南、头孢曲 松和哌拉西林-三唑巴坦的hit聚类在一起(红色括弧),与庆大霉素分开。
[0044] 图26描绘了示出组合189X187X18个基因的较低复杂度三重(tri-wise)组合 文库的图。在636174种可能的组合中,由约3千万个测序读数回收了 582, 433种独特组合 (所有可能组合的92%)。
[0045] 图27描绘了展示组合189X187X187个基因的较高复杂度三重组合文库的图。在 6, 609, 141种可能的基因组合中,由约2千万个测序读数回收了 4, 042, 316种组合(61% )。
[0046] 图28描绘了通过整合多个aSyn串联拷贝和半乳糖(Gal)诱导型启动子产生的 遗传筛选菌株。通过Tet-ON诱导型系统控制组合文库的表达。实验设计为回收有助于用 Gal和多西环素(Dox)处理之细胞生存的遗传组合。
[0047] 图29描绘了独特条形码(BC)和4个限制性位点的单一表达构建体。合并条形 码化的载体并且用酶AvrII+Notl消化。通过用Spel+PspOMI消化产生插入片段。一锅式 (one-pot)连接反应产生成对组合文库。
[0048] 图30描绘了示出通过大规模并行组合遗传学和P2A策略构建的eGFP和mCherry 的成对组合之基因表达定量分析的图。
[0049] 图31描绘了通过RNA指导的转录程序的大规模并行组合遗传学筛选。
[0050] 图32描绘了基因敲减(geneticknockdown)的大规模并行组合遗传学筛选。
[0051] 图33描绘了慢病毒载体设计。在慢病毒载体骨架中构建:表达前体-miR的串联 转录单位以及由CMVp驱动的GFP基因和/或由Ubcp驱动的处于RFP基因3'UTR的miR传 感器(sensor)序列(例如,miR的互补革E序列的四个重复)。Ubcp,人泛素C启动子;CMVp, 人巨细胞病毒启动子;RFP,红色荧光蛋白;GFP,绿色荧光蛋白。
[0052] 图34描绘了示出HEK293T细胞中前体-miR表达的图。使用包含以下的慢病毒感 染HEK293T细胞:表达三种不同前体-miR(g卩,miR-124、miR-128和miR132)的串联转录 单位以及由CMVp驱动的GFP基因和/或由Ubcp驱动的处于RFP基因3'UTR的miR传感器 序列。在前向散射和侧向散射设门之后,通过流式细胞仪测定RFP+细胞与GFP+细胞的百分 比。HEK293T;感染后4天。
[0053] 图35描绘了示出原代人真皮成纤维细胞(HDF)中前体-miR的表达的图。使用包 含以下的慢病毒感染HDF细胞:表达两种不同前体-miR(S卩,miR-128和miR132)的串联转 录单位(SEQIDN0:1)以及由CMV启动子(CMVp)驱动的GFP基因和/或由Ubcp驱动的处 于RFP基因3'UTR的miR传感器序列。在前向散射和侧向散射设门之后,通过流式细胞仪 测定RFP+细胞与GFP+细胞的百分比。HEK293T;感染后7天。
[0054] 图36描绘了示出HEK293T细胞中组合前体-miR表达的图。使用包含以下的慢病 毒感染HEK293T细胞:表达单个或组合前体-miR(S卩,miR-128、miR-132或miR-128-132) 的串联转录单位以及由CMVp驱动的GFP基因和/或由Ubcp驱动的处于RFP基因3'UTR的 miR传感器序列。在前向散射和侧向散射设门之后,通过流式细胞仪测定RFP+细胞与GFP+ 细胞的百分比。J1EK293T;感染后4天。
[0055] 图37描绘了示出原代HDF细胞中组合前体-miR表达的图。使用包含以下的慢病 毒感染HDF细胞:表达单个或组合前体-miR(g卩,miR-128、miR-132或miR-128-132)的串 联转录单位以及由CMVp驱动的GFP基因和/或由Ubcp驱动的处于RFP基因3'UTR的miR 传感器序列。在前向散射和侧向散射设门之后,通过流式细胞仪测定RFP+细胞与GFP+细胞 的百分比。HEK293T;感染后7天。
[0056] 图38描绘了包含串联的mir-128和mir-132之载体的图。
[0057] 发明详述
[0058] 本文描述了一种称为大规模并行组合遗传学的新技术,其克服了具有有限的领域 (例如遗传学和系统生物学)的障碍。本发明至少部分地基于能够快速产生遗传元件的高 阶组合和快速鉴定导致期望表型之组合的方法和组合物的出人意料的发现。该技术能够作 为新的研宄方法并且被广泛应用。本文描述的方法具有超过之前方法的显著优点,包括容 易地使用并且迅速扩展到高阶组合所允许的遗传干扰的灵活度(flexibility)。
[0059] 在过去,大规模系统性干扰的研宄局限于低复杂度的干扰。例如,ASKA文库是大 肠杆菌基因组中全部约4000个开放阅读框("ORF")的单基因过表达模式的文库。ORF是 基于质粒的,并且排列在大量板上。研宄已经筛选了期望表型(例如抗生素抗性)的这种 单过表达文库,并且通过单个测序来鉴定克隆(Soo等(2011)ProcNatlAcadSciUSA108: 1484-9)。理论上可通过在具有不同选择标志物的质粒上产生另一个ORF文库并且用ASKA 文库的一个成员和新文库的一个成员来共转染菌株的这种方式得到成对组合策略。然而, 产生全部约1600万个成对0RF组合的尝试可能直接受阻于规模限制。这一点在产生更高 阶组合时甚至更明显,例如,同时进行多个载体的转化的低效率和少量的独特选择标志物 阻碍了高阶组合。
[0060] 类似障碍影响了现有的方法来组合敲除。已经产生了大肠杆菌(例如,KEI0文库) 和酿酒酵母(S.cerevisiae)的单基因敲除文库。条形码化的文库允许在与高通量测序配 对时进行合并筛选。然而,仍没有有效的方法来产生双基因敲除文库。SyntheticGenetic Array(Tong等(2004)Science303 :808_13)使用酵母接合(yeastmating)来在基于板的 形式中产生双敲除;在大肠杆菌中也已经报道了类似的方法(Butland等(2008)Nature Methods5:789-95)。然而,由于接合是在两个独特菌株于板上共点样(co-spotted)时发 生的,因此扩展到超过数千种组合是不切实际的。另外,每一个后续实验都需要对细胞再次 铺板的费力过程。
[0061] 遗传元件的组合已经对于多种特定应用有用,例如干细胞分化中的转录因子。 在过去,通常方法是利用许多单独转录因子共转染细胞类型并且观察分化;然后从该库 (pool)中逐一除去每一成员直到鉴定出诱导分化的最小组(Son等(2011)CellStemCell 9 :205-18)。这种方法是费力的,因为每一种独特组合都需要单独实验,并且由于其需要利 用许多单独元件共转染,所以效率低。由于通常在转染后数周才观察分化表型的事实,因此 这些问题变得更复杂。
[0062] 最近的工作已经说明了背靠背(back-to-back)条形码"拼接"的概念 (Merryman(2012)MetabolicEngineering14:196-204;Roth等(US专利公开No.US 2009/0098555)),其中分别在3'末端和5'末端具有条形码的两个DNA元件融合在一起,使 得两个条形码相邻(图8)。用于实现这一点的方法包括PCR重叠和吉布森组装(Gibson assembly)。相邻使得能够通过测序来追踪组合。但是,这种方法的策略无法扩展到成对组 合之外。另外,每一个条形码化的片都需要构建单独文库而不是迭代使用相同的插入片段 文库。
[0063] 本文描述的大规模并行组合遗传学方法提供了多个相对于现有方法的优点。其能 够快速产生组合的多组多样的遗传元件,例如转录因子。另外,该技术能够合并地筛选多种 组合阶数(例如,可以合并并且同时一起筛选成对、三重和n重组合),鉴定给定应用所需的 最小组合。
[0064] 本文所述技术超过过去方法的另一个优点是其在DNA干扰类型的灵活度。过去的 方法(例如合成遗传阵列方法),例如适合于一种技术(例如适合于产生基因敲除),但是 不适合其他类型的干扰。相比之下,本文所述技术能够空前地将基因过表达和敲减组合在 一起。另一个优于过去方法的优点是本文所述方法可扩展到成对组合之外。
[0065] 大规模并行组合遗传学方法的一些方面涉及遗传构建体,所述遗传构建体包含一 个或更多个DNA元件和一个或更多个条形码元件,其中每一特定DNA元件都与独特条形码 元件相关联。如本文使用的,特定DNA元件与独特条形码元件之间相关联意指特定DNA元 件与独特条形码元件始终包含在同一个遗传构建体内。因此,在遗传构建体内存在独特条 形码元件则表明相关联的特定DNA元件也存在于同一遗传构建体内。
[0066] 应理解的是,DNA元件可包括任何DNA片段并且可具有任何功能或序列。在一些 实施方案中,DNA元件包含可编码或不编码蛋白质的基因或基因片段。DNA元件可包含编 码区和非编码区二者。例如,在一些实施方案中,DNA元件可包含开放阅读框或者其片段、 核糖体结合位点、启动子和/或终止子。在一些实施方案中,DNA元件包括非编码DNA、单 链DNA或者RNA的前体,所述RNA例如长非编码RNA(lncRNA)、微小RNA(miRNA)/小干扰 RNA(siRNA)或短发夹RNA。在一些实施方案中,DNA元件是全基因组关联研宄(Genome-Wide AssociationStudy,GWAS)相关基因或者来自全基因组0RF集的DNA元件。DNA元件还可 以包含宏基因组样品或者合成生物学电路(circuit)的一种或更多种部件。
[0067] 在一些实施方案中,DNA元件编码转录因子(包括内源和人工转录因子)、组蛋白 修饰酶、微小RNA(miR)、激酶或磷酸酶、代谢酶、表观遗传酶(epigeneticenzyme)、FDA批 准药物的靶标、致癌基因、单克隆抗体和/或突变体蛋白质。
[0068] 图1表示本发明相关的遗传构建体之非限制性实例的多个示意图。在图1A中,DNA 元件(指定为DNA-1),其侧翼是第一相容性末端元件G2A和第二相容性末端元件G2B,这两 个末端元件能够彼此退火。所述遗传构建体还包含指定为BC-1的条形码元件,其侧翼是第 三相容性末端元件G1A和第四相容性末端元件G1B,这两个末端元件能够彼此退火,但是不 能与G2A或G2B退火。所述遗传构建体还包含分离位点,使得条形码元件在分离位点的一 侦牝而DNA元件在分离位点的另一侧。虽然图1中描绘的是条形码元件在相对于DNA元件 的上游或5',但是该排列也可以相反。
[0069] 相容性末端元件可以以多种本领域普通技术人员熟悉的方式产生,并且可由多种 不同的序列组成。如本文使用的,相容性末端元件是指能够彼此连接或退火的DNA区域。在 多个非限制性实施方案中,相容性末端元件可由具有相容性突出端、吉布森组装序列或任 何其他DNA组装方法的功能元件(包括重组酶、大范围核酸酶、TAL效应物/锌指核酸酶、 反式切割核酶/DNA核酶(DNAzyme)或整合酶)的限制性位点构成。
[0070] 在一些实施方案中,使用吉布森组装来产生相容性突出端。吉布森组装是指等 温DNA末端连接技术,借此可以在单个反应中联合多个DNA片段。这种方法在Gibson等 (2009)NatureMethods6 :343-5中有进一步的描述,并且其通过引用并入。
[0071] 在另一些实施方案中,使用限制性位点消化来产生相容性末端,如图5中所描绘。 使用这种方法,由两种独特的限制性酶产生相容性突出端。当连接这些突出端时,将产生 这两种酶均不再识别的痕。应理解的是,可使用任意产生相容性突出端的限制性酶。在一 些非限制性实施方案中,使用标准生物学部件(part)(例如Bi〇Bricks'K)(TheBioBricks Foundation)或BglBricks(Anderson等(2010)JournalofBiologicalEngineering4: l))以及与这些标准生物学部件相关联的酶。标准生物学部件(例如BioBricks?,或 BglBricks)的使用应被认为对于本领域普通技术人员来说是常规的。应理解的是,尽管可 使用经典限制性酶(例如1、11或III型限制性酶),但是也可使用其他DNA切割分子。例 如,可使用靶向核酶来切割特定靶位点。也可使用大范围核酸酶以使对插入之DNA元件的 干扰可能性最小。也可使用TALE或ZF核酸酶靶向长DNA位点以使在插入的DNA元件内之 内部切割的可能性最小。另外,可使用TGPG'克隆来实现限制性消化和连接。
[0072] 基因构建体内的分离位点表示允许使构建体线性化的区域。应理解的是,分离位 点可对应于任何切割DNA的手段。在一些实施方案中,分离位点是限制性酶识别位点。
[0073] 本发明的另一些方面涉及组合构建体和产生组合构建体的方法。如本文使用的, "组合构建体"是指包含多个DNA元件的遗传构建体。如本文使用的,多个DNA元件是指超 过一个DNA元件。如图1B所示,组合构建体的产生可涉及使含本发明相关之第一遗传构建 体的载体线性化,这通过在遗传构建体内的分离位点处切割载体来实现。图1B中示出了作 为插入片段的本发明相关的第二遗传构建体。如本文使用的"插入片段"是指旨在插入到 经切割之载体中的遗传构建体。在一些实施方案中,插入片段通过例如PCR或限制性消化 从载体纯化。可通过使插入片段内端部的相容性末端组件与线性化载体内的其相容性元件 退火来将插入片段连接至经切割的载体。
[0074] 图1C描绘了含多个DNA元件和多个相应条形码元件的组合后组合构建体。在图 1C中描绘的非限制性实例中,遗传构建体包含被称作DNA-1和DNA-2的两个不同的DNA元 件,以及被称作BC-1和BC-2的两个对应条形码元件。组合构建体还包含位于所述多个条 形码元件和多个DNA元件之间的分离位点。
[0075] 分离位点可以是单个限制性酶识别位点。图15示出了包含被单个限制性酶位点 (例如,Bglll位点)分开的DNA元件和条形码元件之载体的一个非限制性实施方案。图 15中示出了相应插入片段的一个非限制性实例,其包含DNA元件和条形码元件。在一些实 施方案中,一个限制性位点(例如,Bglll位点)位于插入片段的DNA元件和条形码元件之 间,而两个限制性位点(例如,AlwNI位点)位于DNA元件和条形码元件的外侧。当Bglll 和AlwNI切割DNA时,它们产生相容性末端。因此,用Bglll消化载体并且用AlwNI消化插 入片段,允许将插入片段连接到载体内,产生包含被限制性位点(例如Bglll位点)分开的 两个DNA元件和两个条形码元件的载体。
[0076] 应理解的是,在切割DNA时产生相容性末端的多种不同的酶的组合也可结合本发 明的这个方面来使用。在一些实施方案中,在插入片段内部,位于DNA元件和条形码元件外 侧的两个限制性位点由相同的限制性酶识别,其产生与消化载体的限制性酶相容的末端。 在另一些实施方案中,在插入片段内,位于DNA元件和条形码元件外侧的两个限制性位点 由两种不同的限制性酶识别,其各自产生与消化载体的限制性酶相容的末端。
[0077] 本发明的另一些方面涉及使用位点特异性重组来产生组合遗传构建体。在这些实 施方案中,本发明相关的遗传构建体不需要分离位点并且不需要通过限制性酶切割。基于 重组之克隆方法的一个非限制性实例是本领域普通技术人员熟悉的Gateway?克隆技术 (LifeTechnologies,Carlsbad,CA)〇
[0078] 图9提供了Gateway?克隆方法的一个实例。DNA元件侧翼是允许在Clonase? 酶反应混合物的存在下重组的位点特异性重组元件。在Gateway系统内,位点特异性重组 元件被称为附着位点或"att位点",包括attBl、attB2、attPl、attP2、attLl、attL2、attRl 和attR2。attBl与attPl反应,attB2 与attP2 反应,attLl与attRl反应,而attL2 与 attR2反应。应理解的是,任何基于重组的克隆方法都可适合于本发明的方面。
[0079] 图1〇描绘了用于在一个遗传构建体内组装多个插入片段的多位点Gateway? Pro克隆技术的一个非限制性实例(来自http://pfgrc.jcvi.org/index.php/gateway_ clones/about_knockoutclones.html)〇
[0080] 图11描绘了基于重组的组合遗传方法的一个非限制性实施方案。在该实例中,使 用两个载体文库来产生两个插入片段文库。每一个载体均包含DNA元件、条形码元件和两 个位点特异性重组元件。应理解的是,可使用多种方法来产生插入片段文库。在一些实施 方案中,通过例如PCR由载体文库(例如图11中所示载体文库1和载体文库2)来产生插 入片段文库(例如图11中所示插入片段文库1或插入片段文库2)。在一些实施方案中,使 用PCR来向插入片段文库添加正交重组序列(orthogonalrecombinationsequences)的 侧翼对。
[0081] 图12描绘了使用基于重组的组合遗传学来产生在一个组合遗传构建体的一个非 限制性实施方案。在该实例中,来自载体文库1的载体表现为包含DNA元件、条形码元件以 及位于所述DNA元件和所述条形码元件之间的两个位点特异性重组元件。所述载体与来自 文库2的插入片段重组,其包含各自侧翼都是位点特异性重组元件的DNA元件和条形码元 件。在来自文库2的插入片段内,两个位点特异性重组元件位于DNA元件和条形码元件之 间,并且两个位点特异性重组序列位于DNA元件和条形码元件外侧。位于DNA元件和条形 码元件外侧的位点特异性重组元件与位于载体内DNA元件和条形码元件之间的载体的两 个位点特异性重组元件相容。
[0082] 在相容位点重组后,来自插入片段文库2的插入片段包含在载体内,从而产生包 含两个DNA元件和两个条形码元件的载体,其中两个位点特异性重组位点位于所述DNA元 件和所述条形码元件之间。
[0083] 如图12中所示,然后可使载体与来自插入片段文库1的插入片段重组,其包含DNA 元件和条形码元件,其各自侧翼为位点特异性重组元件。在来自文库1的插入片段内,两个 位点特异性重组元件位于DNA元件和条形码元件之间,并且两个位点特异性重组序列位于 DNA元件和条形码元件外侧。位于DNA元件和条形码元件外侧的位点特异性重组元件与位 于载体内DNA元件和条形码元件之间的载体的两个位点特异性重组元件相容。
[0084] 在重组之后,来自插入片段文库1的插入片段包含在载体内,从而产生包含三个 DNA元件和三个条形码元件的载体,其中两个位点特异性重组位点位于所述DNA元件和所 述条形码元件之间。
[0085] 图13和14描绘了可以如何设计载体和插入片段以使其彼此重组同时避免载 体-载体重组。在一些实施方案中,通过PCR来将位点特异性重组元件添加至遗传构建体。
[0086] 本文所述用于产生组合构建体的方法可以迭代。例如,可将通过组合事件产生的 图1C中所示组合构建体再次在分离位点切割,并且可以将一个或更多个另外的插入片段 连接至组合构建体,同时保留分离位点以用于进一步插入。类似地,可使图12中的载体交 替地与文库1插入片段和文库2插入片段重组,产生组合遗传构建体。显著地,通过迭代过 程,随着遗传构建体内DNA元件数目的持续增加,与每一个DNA元件相关联的独特条形码也 随着其所关联的DNA元件保留在同一遗传构建体内。在一些实施方案中,组合过程重复至 少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20次或超过20次。在一些实施方 案中,所述过程重复n次,其中n可以是 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20或大于20的数字。
[0087] 应理解的是,组合构建体可包含任何数目的DNA元件及相关联的条形码元件。在 一些实施方案中,组合构建体包含 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、 45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、 70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、 95、96、97、98、99、100或超过100个DNA元件及相关联的条形码元件。
[0088] 本发明的另一些方面涉及用于鉴定遗传构建体内的一个或更多个DNA元件的方 法。在组合事件之后,与特定DNA元件相关联的独特条形码随着所述特定DNA元件一起保留 在同一遗传构建体内。因此,鉴定一个条形码元件或多个条形码元件使得能够鉴定同一遗 传构建体内的相关联DNA元件或多个DNA元件。在一些实施方案中,通过测序或通过微阵 列分析来确定条形码元件和/或DNA元件的序列。应理解的是,任何确定DNA序列的手段 都适用于鉴定一个或更多个条形码元件和相应的DNA元件。显著地,在组合构建体中(例 如图1C中所示),多个条形码元件彼此极为靠近,使得能够通过例如DNA测序的方法同时快 速鉴定多个条形码元件,并因此鉴定多个DNA元件。
[0089] 本发明的另一些方面涉及包含两个或更多个本文所述遗传构建体的文库,其适用 于大规模并行组合遗传学的方法。如本文使用的,遗传构建体的文库是指两个或更多个遗 传构建体的集合。在一些实施方案中,产生遗传构建体的文库,其中每一个独特DNA元件都 在质粒上。该质粒文库可合并以形成载体文库。可以通过例如对载体文库进行PCR来产生 插入片段文库。在第一组合事件中,所有载体可以与所有插入片段配对,产生成对组合的完 全组合组。该成对文库与插入片段文库之间的进一步反应可导致由单个载体文库产生的三 重、四重或超过4重的文库。图6证明了条形码元件的成对、三重和四重组合的有效整合。
[0090] 本发明的一些方面涉及使用组合构建体文库进行筛选。例如,可测试含组合文库 的细胞库对于应激物(例如化疗)的抗性。为了确定哪一种DNA元件组合在赋予特定表型 (例如,化疗抗性)方面最有效,可分离在化疗下存活的细胞并测定条形码或多个条形码的 序列,其使得能够快速鉴定有效赋予期望表型的一个DNA元件或多个DNA元件。
[0091] 应理解的是,由于是在体外进行组合步骤,因此该技术可扩展到可以接受DNA的 任何生物体。在一些实施方案中,所述生物体是细菌,而所述构建体由质粒或噬菌体携带。 在另一些实施方案中,所述生物体是酵母,而所述构建体由质粒或穿梭载体携带。在另一些 实施方案中,例如在啮齿类动物或哺乳动物细胞中,可由质粒携带或者由病毒(例如慢病 毒或腺病毒)递送本文所述的遗传构建体。
[0092] 本文所述方法和组合物可广泛应用于可从产生遗传元件的组合组受益的任何研 宄。例如,该方法可导致鉴定通过网络干扰阐明的新药物靶标(其可定义导致疾病的更加 精细的酶促途径),或者能够发现用于治疗疾病的新化学或生物学介质(包括化学和/或生 物学介质的组合)的药物。另外,本文描述的技术可用来发现用于疾病治疗和/或预防的 现有药物靶标的组合,并且可导致使用FDA批准疗法的新组合治疗。
[0093] 可根据本发明的方面对基因表达进行干扰之方式的多个非限制性实例包括:强过 表达、可调过表达(通过可调的诱导型启动子)、强敲减(通过短发夹RNA(shRNA))或其他 反义RNA构建体)和可调敲减(通过shRNA或其他反义RNA构建体以及可调的诱导型启动 子)。
[0094] 可根据本发明的方面进行筛选或所选之目的表型的多个非限制性实例包括,在细 菌和真菌(例如,酵母)中:抗生素抗性或易感性、持久性、毒力和代谢工程;以及在哺乳动 物细胞中:降低疾病状态、产生疾病状态、复杂的多因子疾病、衰老和衰老相关疾病、神经退 行性疾病(neurodegeneration)、化疗抗性、途径调控(pathwaymodulation)(例如,应激 反应)、感染抗性、干细胞分化、细胞类型转分化和FDA批准药物的增强。
[0095] 通过可调诱导型启动子来调节过表达或敲减的能力使得产生比之前的可能性细 微得多的一组干扰。可以例如组合许多蛋白质的多个过表达水平并筛选最佳表型,只要 可通过表达水平的优化最佳干扰网络动力学即可。另外,通过对于不同DNA元件使用独立 的诱导型启动子,可同时进行多个实验以探测表达空间(expressionspace)或瞬时空间 (temporalspace)〇
[0096] 该技术能够使宿主直接用于生物医学应用。利用基因治疗载体可导致在体外和体 内递送敲减和过表达构建体的组合集。这种技术的非限制性生物医学应用包括治疗具有复 杂表型的多因素疾病,以及组织工程应用,由此对细胞修饰然后植入到人中。本文所述方法 可应用于组合的抗体治疗,包括多克隆和/或单克隆抗体的组合。类似地,可通过多表位的 组合选择来优化组合疫苗。
[0097] 另外,所述技术能够以广泛的可能进行基础发现。一个实例是体内蛋白质相互作 用的整体作图(globalmapping)。通过测量基因过表达和敲减的成对或更高阶组合对于生 长率和其他表型的影响,可获得对蛋白质相互作用的综合作图。由该数据,可阐明相互作用 的途径和网络枢纽(hub),得到细胞内蛋白质网络的更加精细的概念,并发现对于期望表型 的新网络干扰。
[0098] 本文所述方法、构建体和文库的另一个基本应用是发现多因素疾病的决定因素。 尽管已经报道了疾病状态下细胞的基因表达谱以及与疾病相关的基因,但是复杂病症(例 如糖尿病、肥胖和衰老)的特定遗传决定因素依然未知。大规模并行组合遗传学可产生疾 病状态的细胞,产生新疾病模型并且鉴定新的治疗靶标。
[0099] 这种技术相比于之前方法的一个相当大的优点在于重新利用用于研宄事实上任 何表型之所构建文库的能力。例如,人类基因组中所有已知开放阅读框(0RF)之合并的组 合慢病毒文库可用于筛选从干细胞分化到癌症转移抑制的表型。这大幅降低了研宄进一步 问题所需要的边际努力(marginaleffort)。
[0100] 本发明涵盖可引入DNA的任何细胞类型,包括原核细胞和真核细胞。在一 些实施方案中,所述细胞是细菌细胞,例如埃希氏菌属(Escherichiaspp.)、链霉菌 属(Streptomycesspp.)、发酵单胞菌属(Zymonasspp.)、醋杆菌属(Acetobacter spp.)、梓檬酸杆菌属(Citrobacterspp.)、集胞藻属(Synechocystisspp.)、根瘤菌属 (Rhizobiumspp.)、梭状芽抱杆菌属(Clostridiumspp.)、棒状杆菌属(Corynebacterium spp.)、链球菌属(Streptococcusspp.)、黄单胞菌属(Xanthomonasspp.)、乳杆菌属 (Lactobacillusspp.)、乳球菌属(Lactococcusspp.)、芽抱杆菌属(Bacillusspp.)、产 喊菌属(Alcaligenesspp.)、假单胞菌属(Pseudomonasspp.)、气单胞菌属(Aeromonas spp.)、固氮菌属(Azotobacterspp.)、丛毛单胞菌属(Comamonasspp.)、分枝杆菌属 (Mycobacteriumspp.)、红球菌属(Rhodococcusspp.)、葡糖杆菌属(Gluconobacter spp.)、罗尔斯通菌属(Ralstoniaspp.)、嗜酸硫杆菌属(Acidithiobacillusspp.)、小 月菌属(Microlunatusspp.)、地杆菌属(Geobacterspp.)、地芽抱杆菌属(Geobacillus spp.)、节杆菌属(Arthrobacterspp.)、黄杆菌属(Flavobacteriumspp.)、沙雷氏菌属 (Serratiaspp.)、糖多抱菌属(Saccharopolysporaspp.)、栖热菌属(Thermusspp.)、 寡养单胞菌属(Stenotrophomonasspp.)、色杆菌属(Chromobacteriumspp.)、中华根 瘤菌属(Sinorhizobiumspp.)、糖多抱菌属(Saccharopolysporaspp.)、土壤杆菌属 (Agrobacteriumspp.)和泛菌属(Pantoeaspp.h细菌细胞可以是革兰氏阴性细胞,例如 大肠杆菌细胞,或者革兰氏阳性细胞,如芽孢杆菌属(Bacillus)物种。
[0101] 在另一些实施方案中,细胞是真菌细胞,例如酵母细胞,如酵母属(Saccharomyces spp.)、裂殖酵母属(Schizosaccharomycesspp.)、毕赤酵母属(Pichiaspp.)、法夫酵母属 (Paffiaspp.)、克鲁维酵母属(Kluyveromycesspp.)、假丝酵母属(Candidaspp.)、蓝状 菌属(Talaromycesspp.)、酒香酵母属(Brettanomycesspp.)、管囊酵母属(Pachysolen spp.)、德巴利氏酵母菌(Debaryomycesspp.)、亚罗酵母属(Yarrowiaspp.)和工业多倍体 酵母菌株。优选的酵母菌株是酿酒酵母菌株。另一些真菌的实例包括曲霉属(Aspergillus spp.)、青霉属(Penniciliumspp.)、镜刀菌属(Fusariumspp.)、根霉属(Rhizopusspp.)、 顶抱霉属(Acremoniumspp.)、脉抱菌属(Neurosporaspp.)、类壳属(Sordariaspp.)、巨 座壳属(Magnaporthespp.)、异水霉属(Allomycesspp.)、黑粉菌属(Ustilagospp.)、葡 萄抱属(Botrytisspp.)和木霉属(Trichodermaspp.)〇
[0102] 在另一些实施方案中,细胞是藻类细胞、植物细胞、昆虫细胞、啮齿类动物细胞或 哺乳动物细胞,包括人细胞(例如,人胚肾细胞(例如,J1EK293T细胞)、人真皮成纤维细 胞)。
[0103]在一些实施方案中,在重组表达载体中表达本发明相关的一种或更多种基因。如 本文使用的,"载体"可以是用于在不同遗传环境之间转运或用于在宿主细胞中表达的多种 核酸中的任意,可通过限制和连接或通过重组向其中插入期望的序列。载体通常由DNA构 成,但是也可以使用RNA载体。载体包括但不限于:质粒、黏粒、噬菌粒、病毒基因组和人工 染色体。
[0104] 克隆载体是能够自主复制或整合到宿主细胞基因组中的载体,其特征还在于具有 一个或更多个内切核酸酶限制性位点,在这些位点处可以以可确定方式切割载体或者可以 向其中连接期望的DNA序列,或者重组位点,在所述重组位点处可整合具有相容性末端的 插入片段以使新的重组载体保持其在宿主细胞中复制的能力。在质粒的情况下,在宿主通 过有丝分裂繁殖之前,期望序列可随着宿主细胞(例如宿主细菌)内质粒拷贝数的增加进 行许多次复制,或者每个宿主只进行一次。在噬菌体的情况下,复制可在溶菌阶段主动进 行,或者在溶源阶段被动进行。
[0105] 表达载体是这样的载体,可通过限制和连接或通过重组来将期望的DNA序列插入 其中从而使其与调控序列有效连接并且可表达为RNA转录本。载体还可包含一个或更多个 标志物序列,所述标志物序列适于鉴定已被载体转化或转染或者未被载体转化或转染的细 胞。标志物包括,例如编码提高或降低对抗生素或其他化合物的抗性或敏感性之蛋白质的 基因,编码可通过本领域中已知的标准测定检测其活性之酶(例如,半乳糖苷酶、荧光 素酶或碱性磷酸酶)的基因,以及明显影响经转化或转染细胞、宿主、集落或噬菌斑之表型 的基因(例如,绿色荧光蛋白)。优选的载体是能够自主复制并表达与之有效连接的DNA片 段中存在的结构基因产物的那些载体。
[0106] 如本文使用的,当编码序列和调控序列以如下方式共价连接时它们被认为是"有 效"连接的:使编码序列的表达或转录处于调控序列的影响或控制之下。如果希望将编码 序列翻译成功能蛋白质,则在以下情况下,认为两个DNA序列有效连接:如果5'调控序列中 启动子的诱导导致编码序列转录,以及如果两个DNA序列之间的连接的性质(1)不导致引 入移码突变,(2)不干扰指导编码序列之转录的启动子区的能力,或(3)不干扰相应RNA转 录本翻译成蛋白质的能力。因此,如果启动子区能够影响DNA序列的转录从而使所得转录 本可以翻译成期望的蛋白质或多肽,则所述启动子区与编码序列有效连接。
[0107] 当在细胞中表达核酸分子时,可以使用多种转录控制序列(例如,启动子/增强子 序列)来指导其表达。启动子可以是天然启动子,即其内源环境下的基因启动子,其提供正 常的基因表达调控。在一些实施方案中,启动子可以是组成型启动子,即启动子不受调控, 从而允许其相关基因持续转录。也可以使用多种条件性启动子(conditionalpromoter), 例如通过分子的存在或不存在控制的启动子。在一些实施方案中,启动子是人泛素C启动 子(Ubcp)。在一些实施方案中,启动子是人巨细胞病毒启动子(CMVp)。
[0108] 基因表达所需的调控序列的确切性质在物种或细胞类型之间可能不同,但是必要 时一般应包括分别参与转录和翻译起始的5'非转录序列和5'非翻译序列,例如TATA框、 加帽序列、CAAT序列等。特别地,这样的5'非转录调控序列包含启动子区,其包含用于有 效连接基因的转录控制的启动子序列。需要时,调控序列还可包含增强子序列或上游激活 子序列。本发明的载体可任选地包含5'前导序列或信号序列。对合适载体的选择和设计 在本领域普通技术人员的能力和判断之内。
[0109] 包含用于表达的所有必要元件的表达载体在市场上可以得到,并且是本领域技术 人员已知的。参见,例如Sambrook等,MolecularCloning:ALaboratoryManual,第四版, ColdSpringHarborLaboratoryPress,2012。通过向细胞中引入异源DNA(RNA)来对细 胞进行遗传改造。使该异源DNA(RNA)处于转录元件的有效控制之下,以允许异源DNA在宿 主细胞中表达。
[0110] 可以使用本领域中的标准方法和技术将本发明相关的核酸分子引入到细胞中。例 如,可以通过标准方案(例如转化(包括化学转化)和电穿孔、转导、粒子轰击等)引入核 酸分子。还可通过将核酸分子整合到基因组中来实现核酸分子的表达。
[0111] 在一些实施方案中,在细菌细胞中重组表达本发明相关的一种或更多种基因。可 以将根据本发明的细菌细胞培养在任何类型(富集培养基或基本培养基)和任何组成的培 养基中。本领域普通技术人员将理解,多种类型的培养基都可适合于本发明的方面。所选 培养基可以补充有多种额外组分。补充组分的一些非限制性实例包括:葡萄糖、抗生素、用 于基因诱导的异丙基0-D-1-硫代半乳糖吡喃糖苷(IPTG)、ATCC痕量矿物质补充剂和甘 醇酸酯。类似地,可通过常规实验对本发明细胞的培养基和生长条件的其他方面进行优化。 例如,pH和温度是可以优化的因素的非限制性实例。在一些实施方案中,可以优化补充组 分的浓度和量。
[0112] 本发明的多个方面涉及使用大规模并行组合遗传学并利用抗药性(例如多重抗 药性)细菌菌株(例如,新德里金属-0内酰胺酶1 (NDM-1)大肠杆菌菌株)或病毒株来鉴 定抗生素抗性表型中多样的干扰。特别地,本文的方法和构建体可用来鉴定例如可增强用 于治疗的现有抗生素的转录因子组合。因此,在一些实施方案中,本文提供了转录因子(TF) 的成对、三重和n重(例如,4、5、6、7、8、9或10重)组合的文库,其可通过例如下一代测序 进行分析。
[0113] 在一些实施方案中,组合转录因子文库可用来鉴定表现出对单一抗生素或一系列 抗生素间(例如,超过一种抗生素,或者2、3、4或更多种抗生素)的抗生素抗性表型之协同 作用的TF的组合(例如,2种或更多种,例如,2、3、4、5、6、7、8、9或10)。在一些实施方案 中,本文提供了表达mtlR和uidR或者qseB和bolA的构建体。在一些实施方案中,本文提 供了包含表达mtlR和uidR或者qseB和bolA之构建体的细胞(例如,细菌细胞)。
[0114] 在一些实施方案中,本文提供了表达rstA和rob、rstA和mirA、rcsB和mirA、或 feaR和hcaR的构建体。在一些实施方案中,本文提供了含表达rstA和rob、rstA和mirA、 rcsB和mirA、或feaR和hcaR之构建体的细胞(例如,细菌细胞)。
[0115] 在一些实施方案中,组合转录因子文库可用来鉴定表现出加强抗生素杀菌活性之 致死效应的TF组合。在一些实施方案中,本文提供了表达torR和metR、nhaR和melR、allR 和metJ、malL和yfeT、cadC和allR、torR、metR或torR的构建体。在一些实施方案中,本 文提供了包含表达torR和metR、nhaR和melR、allR和metj、malL和yfeT、cadC和allR、 torR或metR之构建体的细胞(例如,细菌细胞)。
[0116] 根据本发明使用的抗生素包括但不限于氨基糖苷类、阿米卡星、庆大霉素、卡那 霉素、新霉素、奈替米星、安布霉素、巴龙霉素、大观霉素、安沙霉素类、格尔德霉素、除秀 霉素(Herbimycin)、利福昔明、链霉素、碳头孢稀(Carbacephem)、氯拉卡比、碳青霉稀类 (Carbapenems)、厄他培南(Ertapenem)、多尼培南、亚胺培南/西司他丁、美罗培南,头孢菌 素类(第一代),头孢羟氨苄、头孢唑啉、头孢噻吩或噻孢霉素、头孢氨苄,头孢菌素类(第 二代),头孢克洛、头孢羟唑、头孢西丁、头孢丙烯、头孢氨呋肟,头孢菌素类(第三代),头 孢克聘、头孢地尼、头孢托仑(Cefditoren)、头孢哌酮、头孢氨噻、头孢泊聘、头孢他啶、头 孢布坦、头孢唑肟、头孢曲松,头孢菌素类(第四代),头孢吡肟,头孢菌素类(第五代),头 孢洛林醋(Ceftarolinefosamil)、头孢卩比普(Ceftobiprole),糖肽类、替考拉宁、万古霉 素、特拉万星(Telavancin),林可酰胺类,克林霉素、林可霉素、脂肽、达帕托霉素,大环内 醋类,阿奇霉素、克拉霉素、地红霉素、红霉素、罗红霉素、醋竹桃霉素、泰利霉素、螺旋霉素、 单菌霉素类、氨曲南、硝基呋喃类、呋喃唑酮、呋喃妥因、曙唑烷酮类(Oxazolidonones)、 利奈挫胺、泼斯挫来(Posizolid)、雷得挫来(Radezolid)、泰地挫胺(Torezolid)、青霉素 类,阿莫西林、氨苄青霉素、阿洛西林、羧苄青霉素、氯唑西林、双氯青霉素、氟氯西林、美洛 西林、甲氧苯青霉素、萘夫西林、苯唑西林、青霉素G、青霉素V、哌拉西林、青霉素G、替莫 西林、替卡西林、青霉素组合类、阿莫西林/克拉维酸钾(clavulanate)、氨苄青霉素/舒 巴坦、哌啶西林/三唑巴坦、替卡西林/克拉维酸钾、多肽,杆菌肽、粘菌素、多粘菌素B, 喹诺酮类,环丙沙星、依诺沙星、加替沙星、左氟沙星、洛美沙星、莫西沙星、萘啶酸、诺氟沙 星、氧氟沙星、曲伐沙星、葛帕沙星、司帕沙星、替马氟沙星、磺胺类、磺胺米隆、磺胺醋酰、 磺胺嘧啶、磺胺嘧啶银、磺胺间二甲氧嘧啶、磺胺甲二挫、磺胺甲B恶挫、磺胺(旧)、柳氮磺 吡啶、磺胺异卩恶唑、甲氧苄啶-磺胺甲异唑(复方新诺明)(TMP-SMX)、磺酰胺柯衣定 (Sulfonamidochrysoidine)(旧)、四环素类、去甲金霉素、多西环素、米诺环素、氧四环素、 四环素、氯法齐明、氨苯砜、卷曲霉素、环丝氨酸、乙胺丁醇、乙硫烟胺、异烟肼(Isoniazid)、 吡嗪酰胺、利福平(Rifampicin)(美国利福平(Rifampin))、利福布丁、利福喷丁、链霉素、 胂凡纳明、氯霉素、磷霉素、夫西地酸、甲硝唑、莫匹罗星、平板霉素、喹奴普丁 /达福普汀、 甲砜霉素、替加环素、替硝唑和甲氧苄啶。
[0117] 本文预期的另一些抗生素抗性病原体包括但不限于金黄色葡萄球菌 (Staphylococcusaureus)、链球菌(Streptococcus)和肠球菌(Enterococcus)、绿胺杆 菌(Pseudomonasaeruginosa)、艰难梭状芽抱杆菌(Clostridiumdifficile)、沙门氏菌 (Salmonella)、大肠杆菌(Escherichiacoli)、鲍曼不动杆菌(Acinetobacterbaumannii) 和结核分枝杆菌(Mycobacteriumtuberculosis) 〇
[0118] 本发明的多个方面涉及大规模并行组合遗传学用于阐明复杂人疾病潜在的病理 机制的用途。例如,本发明方法可在酵母模型中用来研宄寿命和神经退行性病症的调节。通 过探索高阶遗传相互作用,大规模并行组合遗传学可提供对于新治疗策略以及衰老相关疾 病中药物开发的领悟。酵母模型已经广泛用于研宄多种以蛋白质错误折叠和聚集为特征的 人神经退行性病症(总结在表1中)。
[0119] 表1.酵母中的人神经病症模拟

【权利要求】
1. 一种遗传构建体,其包含: DNA元件; 所述DNA元件侧翼的第一相容性末端元件和第二相容性末端元件,其中所述第一和第 二相容性末端元件能够彼此退火; 条形码元件; 所述条形码元件侧翼的第三相容性末端元件和第四相容性末端元件,其中所述第三和 第四相容性末端元件能够彼此退火但是不能与所述第一或第二相容性末端元件退火;以及 位于所述第四相容性末端元件与所述第一相容性末端元件之间的分离位点,其中所述 DNA元件、第一相容性末端元件和第二相容性末端元件位于所述分离位点的一侧,而所述条 形码元件、第三相容性末端元件和第四相容性末端元件位于所述分离位点的另一侧。
2. -种遗传构建体,其包含: 多个DNA元件; 所述多个DNA元件侧翼的第一相容性末端元件和第二相容性末端元件,其中所述第一 和第二相容性末端元件能够彼此退火; 多个条形码元件; 所述多个条形码元件侧翼的第三相容性末端元件和第四相容性末端元件,其中所述第 三和第四相容性末端元件能够彼此退火但是不能与所述第一或第二相容性末端元件退火; 以及 位于所述多个DNA元件与所述多个条形码元件之间的分离位点。
3. -种用于产生组合遗传构建体的方法,其包括: 提供包含根据权利要求1或权利要求2之第一遗传构建体的载体; 在所述第一遗传构建体内的分离位点处切割所述载体,导致所述第一遗传构建体被分 成第一区段和第二区段; 提供根据权利要求1或权利要求2的第二遗传构建体;以及 使所述第二遗传构建体与经切割的载体退火,其中所述退火发生在所述第一和第二遗 传构建体内能够彼此退火的相容性末端元件之间,并且其中在退火后,所述第二遗传构建 体整合在所述第一遗传构建体的所述第一区段和第二区段之间,产生组合遗传构建体。
4. 权利要求3所述的方法,其中所述方法是迭代的。
5. -种用于鉴定一个DNA元件或多个DNA元件的方法,其包括: 提供根据权利要求1或权利要求2的遗传构建体; 进行测定以确定所述遗传构建体内条形码或多个条形码的DNA序列和/或所述遗传构 建体内DNA元件或多个DNA元件的DNA序列;以及 鉴定所述DNA元件或多个DNA元件。
6. -种文库,其包含: 两种或更多种根据权利要求1或权利要求2的遗传构建体。
7. -种用于产生组合遗传构建体的方法,其包括: 提供载体,所述载体包含: 第一 DNA元件, 第一条形码元件,以及 位于所述第一 DNA元件与所述第一条形码元件之间的两个位点特异性重组元件; 提供第一插入片段,所述第一插入片段包含: 第二DNA元件, 第二条形码元件,以及 所述第二DNA元件和所述第二条形码元件各自侧翼的位点特异性重组元件,使得与所 述载体内的位点特异性重组元件不相容的两个位点特异性重组元件位于所述第二DNA元 件和所述第二条形码元件之间,并且与所述载体内的位点特异性重组元件相容的两个位点 特异性重组元件位于所述第二DNA元件和所述第二条形码元件外侧; 在所述载体与所述第一插入片段之间进行位点特异性重组,其中所述位点特异性重组 发生在位于所述载体内第一 DNA元件与第一条形码元件之间的位点特异性重组元件与位 于所述第一插入片段内第二DNA元件和第二条形码元件外侧的相容性位点特异性重组元 件之间,并且其中在位点特异性重组之后,所述第一插入片段位于所述载体内,且所述载体 包含多个DNA元件和多个条形码元件,两个位点特异性重组元件位于所述多个DNA元件与 所述多个条形码元件之间; 提供第二插入片段,所述第二插入片段包含: 第三DNA元件, 第三条形码元件,以及 所述第三DNA元件和所述第三条形码元件各自侧翼的位点特异性重组元件,使得与位 于所述载体的多个DNA元件和多个条形码元件之间的两个位点特异性重组元件不相容的 两个位点特异性重组元件位于所述第三DNA元件和所述第三条形码元件之间,并且与位于 所述载体的多个DNA元件和多个条形码元件之间的两个位点特异性重组元件相容的两个 位点特异性重组元件位于所述第三DNA元件和所述第三条形码元件外侧; 在所述载体与所述第二插入片段之间进行位点特异性重组,其中所述位点特异性重组 发生在位于所述载体内多个DNA元件和多个条形码元件之间的位点特异性重组元件与位 于所述第二插入片段内第三DNA元件和第三条形码元件外侧的相容性位点特异性重组元 件之间,并且其中在位点特异性重组之后,所述第二插入片段位于所述载体内,并且所述载 体包含多个DNA元件和多个条形码元件,两个位点特异性重组元件位于所述多个DNA元件 和所述多个条形码元件之间;以及 重复所述位点特异性重组n次,交替地在所述载体与所述第一插入片段之间进行位点 特异性重组以及在所述载体与所述第二插入片段之间进行位点特异性重组,从而产生组合 遗传构建体。
8. -种通过权利要求7的方法产生的组合遗传构建体。
9. 一种用于鉴定一个DNA元件或多个DNA元件的方法,其包括: 提供根据权利要求8的组合遗传构建体; 进行测定以确定所述组合遗传构建体内的一个或更多个条形码元件的DNA序列和/或 所述组合遗传构建体内的一个或更多个DNA元件的DNA序列;以及 鉴定所述DNA元件或多个DNA元件。
10. -种用于产生组合遗传构建体的方法,其包括: 提供载体,所述载体包含: 第一 DNA元件, 第一条形码元件,和 位于所述第一 DNA元件与所述第一条形码元件之间的第一限制性酶的识别位点; 提供插入片段,所述插入片段包含: 第二DNA元件, 第二条形码元件, 位于所述第二DNA元件与所述第二条形码元件之间的第一限制性酶的识别位点,和 位于所述第二DNA元件和第二条形码元件外侧的不同于所述第一限制性酶的一种或 更多种限制性酶的两个识别位点,使得在所述载体内识别位点处的限制性消化与在位于所 述插入片段内第二DNA元件和第二条形码元件外侧的两个识别位点处的限制性消化产生 相容性末端; 用限制性酶消化所述载体和插入片段; 使所述插入片段与所述载体退火,从而产生包含多个DNA元件和多个条形码元件的组 合遗传构建体;以及 任选地重复所述方法n次。
11. 一种通过权利要求10的方法产生的组合遗传构建体。
12. -种用于鉴定一个DNA元件或多个DNA元件的方法,其包括: 提供根据权利要求11的组合遗传构建体; 进行测定以确定所述组合遗传构建体内一个或更多个条形码元件的DNA序列和/或所 述组合遗传构建体内的一个或更多个DNA元件的DNA序列;以及 鉴定所述DNA元件或多个DNA元件。
【文档编号】C12N15/10GK104508130SQ201380040777
【公开日】2015年4月8日 申请日期:2013年6月28日 优先权日:2012年6月29日
【发明者】蒂莫西·冠-塔·卢, 艾伦·诚 申请人:麻省理工学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1