基因组整合的方法与流程

文档序号:13145898阅读:11733来源:国知局
相关申请的交叉引用本申请要求2013年12月19日提交的美国临时申请号61/918,625,和2014年2月7日提交的美国临时申请号61/937,444的优先权,所述各临时专利申请通过引用其全部内容并入本文。1.发明领域本发明所提供的方法和组合物普遍涉及分子生物学和基因工程领域。2.发明背景基因工程技术将有针对性的修饰引入宿主细胞基因组,并发现其在各种领域中的用途。根本而言,基因如何影响表型的决心依赖于引入有针对性的插入和缺失从而削弱或废除原生基因功能的能力。在合成生物学领域,能够生产目的化合物的转基因微生物的制造,需要将定制的DNA序列插入到所述宿主细胞染色体中;工业规模生产一般需要将几十种基因例如整个生物合成路径,引入到单一宿主基因组中。在治疗环境中,引入精确的基因组修饰的能力,对于处理由于单基因缺陷所致的疾病具有巨大的潜能,例如伴X染色体的严重联合免疫缺陷(SCID),血友病B,β-地中海贫血,囊性纤维化,肌肉萎缩症和镰状细胞性贫血症。最新基因工程进展已经能够操控和/或引入几乎任何基因,从而来处理各种细胞类型和生物体。尤其是,位点特异性设计师核酸酶的出现,通过将靶向断裂引入到宿主细胞基因组中,已经能够进行位点特异性基因修饰,例如基因组编辑。所述这些核酸酶包括锌指核酸酶(ZFNs),转录激活样效应因子核酸酶(TALENs),基于成簇规律间隔短回文重复CRISPR/Cas(CRISPR-相关的)的RNA-引导的核酸内切酶。ZFNs已被使用,尤其已被用于修饰作物中的目标基因位点(Wrightetal.,PlantJ44:693-705(2005)),来改善表达治疗抗体的哺乳动物细胞培养株(Malphettesetal.,BiotechnolBioeng106(5):774-783(2010)),和编辑人基因组从而引起对HIV的抵抗(Urnovetal.,NatRevGenet11(9):636-646(2010))。同样,TALENs已被用于修饰各种基因组,包括那些作物(Li,etal.,Nat.Biotechnol.30:390–392(2012))、人、牛、和鼠(Xuetal.,MolecularTherapy—NucleicAcids2,e112(2013))。最近,CRISPRs已被成功用于编辑细菌基因组(例如Jiangetal.,NatureBiotechnology31(3):233-239(2013);Qietal.,Cell,5,1173–1183(2013),酵母(例如DiCarloetal.,NucleicAcidsRes.,7,4336–4343(2013)),斑马鱼(例如Hwangetal.,Nat.Biotechnol.,3,227–229(2013)),果蝇(例如Gratzetal.,Genetics,194,1029–1035(2013)),人细胞(例如Congetal.,Science6121,819–823,(2013);Malietal.,Science,6121,823–826(2013);Choetal.,Nat.Biotechnol.,3,230–232(2013)),和植物(例如Jiangetal.,NucleicAcidsResearch41(20):e188(2013));Belhajetal.,PlantMethods9(39)(2013))。位点特异性核酸酶诱导染色体DNA断裂将刺激所述宿主细胞的细胞DNA修复机制,包括非同源末端连接(NHEJ),单链退火(SSA),和定向同源修复(HDR)。核酸酶诱导的双链断裂的NHEJ-介导的修复导致在所述靶位点引入小缺失或插入,导致基因功能的损伤或废除,如通过移码突变。相同分子的断裂端通过不涉及另一DNA分子的多步酶促过程,从而再次连接。NHEJ容易出错且不精确,将在修复期间,在断裂位点,与可变大小的不同和不可预知的插入和缺失产生突变体等位基因。同样地,当来自DSB侧翼重复序列的互补链互相退火时,SSA将发生,并导致DSB修复但间插序列的缺失。相反,HDR通常会导致一个准确修复的分子,因其依赖于一个独立的未损坏的具有同源序列的分子来帮助修复所述断裂。原产自所述细胞的同源供体序列主要有两种来源:同源染色体,可在整个细胞周期获得,和所述断裂分子的姐妹染色单体(其仅可在DNA复制后获得)。然而,基因组工程技术通常引入包括与所述DSB靶位点同源并可与所述靶位点重组的区域的外源性供体DNAs。通过包括在外源性供体内,得到所述目标序列的修饰,这些修饰通过HDR可以被整合到所述原始目标序列中,或替代所述原始目标序列。根据核酸酶诱导的DNA断裂,所述宿主细胞修复路径的选择取决于多种因素,并且所述结果可以指示所需基因组修饰的精度。所述因素包括所述宿主细胞的DNA破坏响应路径,断裂的本质,染色质重塑,特异性修复蛋白的转录,和出现在所述细胞周期后期阶段的周期蛋白依赖性激酶活性。参见如Beucheretal.,EMBOJ28:3413-27(2009);etal.,NatCellBiol7:195-201(2005);Jazayerietal.,NatCellBiol8:37-45(2006);Huertasetal.,Nature455:689-92(2008);Moyaletal.,MolCell41:529-42(2011);和Chernikovaetal.,RadiatRes174:558-65(2010)。如果供体DNA对裂解DNA具有强同源性,那么通过同源重组,所述供体整合的机会将会显著增加。参见如Moehleetal.,Proc.NatlAcad.Sci.USA,9:3055–3060(2007);Chenetal.,Nat.Methods,9,753–755(2011)。然而,同源供体DNA通过HDR整合到分裂靶位点中的总体频率,与通过NHEJ所述靶位点的非整合修复相比,仍然可以很低。最近研究表明HDR-介导的编辑通常是一个低效率事件,且越少精确的NHEJ可以主导DSBs修复的机制。譬如Mali等人(Science339:823-826(2013))试图使用CRISPR(向导RNA和Cas9核酸内切酶)和同时提供单链供体DNA,在人K562细胞内进行基因修饰,并观测到在AAVS1位点HDR-介导的基因修饰频率为2.0%,然而,NHEJ-介导的靶向突变发生在相同位点观测到频率为38%。Li等人(NatBiotechnol.(8):688-91(2013))试图使用CRISPR(向导RNA和Cas9核酸内切酶)和同时提供双链供体DNA,在植物本氏烟中进行基因置换,并观测到HDR-介导的基因置换频率为9.0%,然而,NHEJ-介导的靶向突变发生观测到频率为14.2%。Kass等人(ProcNatlAcadSciUSA.110(14):5564–5569(2013))对在源于不同血统的原代正常体细胞类型中的HDR进行了研究,并观测到鼠胚的和成年成纤维细胞,以及源于乳腺上皮细胞、卵巢和在I-SceI核酸内切酶诱导的DSBs经历HDR的新生儿大脑的细胞,频率大约为1%(0.65-1.7%)。Kass和其他人报道了,当细胞在所述细胞周期的S和G2阶段时,具有更高的HDR活性。Li等人(NatBiotechnol.(8):688-91(2013))通过拟南芥CYCD3(细胞周期蛋白D-型3),所述细胞周期的主激活因子的共表达,测试了在本氏烟中通过激发异位细胞分裂来提高HDR的可能性;然而,此举很难提升HDR的比率(从9%-11.1%CYCD3)。提高HDR比率的策略同样包括击出对抗的NHEJ修复机制。例如Qi等人(GenomeRes23:547–554(2013))报道了增加5-16倍靶向拟南芥的HDR-介导基因的ku70突变体和3-4倍的lig4突变体。然而,总体比率观测到不高于~5%,且大部分小于1%。此外,一旦有所需基因靶向事件发生,所述ku70或lig4突变必须穿过突变体植物。考虑到HDR-介导的大多数细胞类型整合的比率相对较低,将外源性DNA插入到染色体通常需要选择标记伴随整合,此举能够使已经历所需整合事件的转化细胞富集。然后,这个将外源序列引入可能与下游应用并不兼容,并且延长所述标记表达的所述基因组同样可能产生有害影响。例如,将新霉素抗性基因整合到人细胞基因组中,随后通过在G418延长培养时间,已被报道会引起所述细胞特性的改变,并且增强型绿色荧光蛋白(EGFP)以及其他荧光蛋白的表达,已被报道会引起免疫原性和毒性。参见如Bareseetal.,HumanGeneTherapy22:659-668(2011);Morrisetal.,Blood103:492-499(2004);和Hanazonoetal.,HumanGeneTherapy8:1313-1319(1997)。此外,转基因(GM)植物中选择标记基因的整合引发了水平转移到其他生物体的担忧;至于抗生素抗性标记,需特别考虑的是所述这些标记可导致耐抗生素菌株的增加。同样关注涉及除草剂-抗性标记的整合和可能新的侵略性野草的产生。在后期,以最低限度,整合标记序列的去除是时间和劳动密集型的。这是特别不确定的,其中仅有限的选择标记缓存可以在所给宿主上,且标记必须可回收并能够应用于其他工程步骤。因此,仅引入最小外源序列的某种应用证明需要影响所需表型,如安全和/或守规,并且可能最终需要回避标记完全整合。因此,存在需要提高HDR-介导的将一个或多个外源性核酸整合到宿主细胞基因组中的效率和/或选择性的方法和组合物。并且,存在需要基因工程策略,所述基因工程策略无需选择标记的编码序列的协同整合。所述这些及其他需求参见本发明所提供的组合物和方法。3.发明摘要本发明提供方法和组合物涉及选择一种同源重组(HR)感受态宿主细胞的方法。不受操作理论的约束,一般认为在细胞群中HR的能力可以通过选择可同源重组一个或多个线性片段的宿主细胞从而可被挑选出来,并引入所述宿主细胞,形成表达选择标记的环状载体。此处,所述特征将被用于提高宿主细胞的识别,所述宿主细胞通过HR可将一个或多个外源性核酸位点特异性地整合到所述宿主细胞基因组中。在一些实施例,位点特异性整合是通过使宿主细胞基因组接触位点特异性核酸酶来提高的,所述位点特异性核酸酶能够在整合的目标位点产生断裂。从而,通过将以下各项引入到宿主细胞:(i)一个或多个外源性核酸,所述外源性核酸对于所述宿主细胞基因组的一个或多个靶位点具有同源区域;(ii)一个或多个核酸酶,所述核酸酶能够在目标靶位点选择性地产生断裂;和(iii)一种线性核酸,所述线性核酸酶可以自我同源重组、或者可以与引入所述宿主细胞的另外一个或多个线性DNA片段同源重组,从而形成一种来自表达所述选择标记的环状的、功能表达载体,并且选择用于表达所述选择标记,已将所述一个或多个外源性核酸整合到其分别的靶位点中的细胞的共选择也将实现。增加恢复通过本发明所述的方法和组合物来执行完成所需整合的宿主细胞的频率,否则将能够使基因工程难以设计或难于处理宿主细胞,并提高高阶工程设计的效率,如多重整合。因此,一方面,本发明提供一种将一个或多个外源性核酸整合到宿主细胞基因组的一个或多个靶位点中的方法,所述方法包含使一个或多个宿主细胞接触一个或多个外源性核酸(ES),所述外源性核酸(ES)通过同源重组能够重组在所述宿主细胞基因组的一个或多个靶位点(TS);和一个或多个核酸酶(N),所述核酸酶(N)能够在各TS产生断裂;和选择一种有能力同源重组的宿主细胞。在一些实施例,所述选择包含选择一种其中外源性核酸已经同源重组的宿主细胞。在一些实施例,所述已经同源重组的核酸是一种线性核酸,所述线性核酸能够自我同源重组、或者与另外一个或多个线性核酸同源重组。在一些实施例,所述线性核酸根据同源重组形成一个环状核酸。在一些实施例,所述已经同源重组的核酸编码一个选择标记。在一些实施例,形成一个环状核酸的所述线性核酸的同源重组形成了一个所述选择标记的编码序列。另一方面,本发明提供一种选择有能力同源重组的宿主细胞的方法,包括:(a)使一个或多个宿主细胞接触一种线性核酸,所述线性核酸能够自我同源重组,或者与同所述细胞群接触的另外一个或多个线性核酸同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成;和(b)选择一种表达所述选择标记的宿主细胞。另一方面,本发明提供一种将外源性核酸整合到宿主细胞基因组靶位点中的方法,所述方法包括:(a)使一个或多个宿主细胞接触:(i)一种外源性核酸(ES),所述外源性核酸(ES)通过同源重组,能够重组在所述宿主细胞基因组的所述靶位点(TS);(ii)一种能够在TS产生断裂的核酸酶(N);和(iii)一种线性核酸,所述线性核酸能够自我同源重组、或者能够与同所述宿主细胞接触的另外一个或多个线性核酸同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成;和(b)选择一种表达所述选择标记的宿主细胞。在一些实施例,所述线性核酸包含能够互相同源重组的两个内部同源区域,于是所述内部同源区域的同源重组导致的结果是表达所述选择标记的所述环状染色体外核酸的形成。在一些实施例,所述线性核酸包含一个同源区域,所述同源区域能够与同所述宿主细胞接触的另一个线性核酸的同源区域重组,于是所述两个线性核酸的同源重组导致的结果是表达所述选择标记的所述环状染色体外核酸的形成。在一些实施例,所述线性核酸包含所述选择标记的一个部分的、中断的、和/或不连续的编码序列,其中,所述选择标记不能从所述线性核酸进行表达,于是所述环状染色体外核酸的所述形成导致的结果是所述选择标记的一个完整编码序列的形成,其中所述选择标记可以从所述环状染色体外核酸进行表达。在一些实施例,所述接触的宿主细胞是在所述选择之前培养至少约12小时、24小时、36小时、48小时、72小时或多于72小时的一段时间。在一些实施例,所述接触的细胞是在选择对所述存活细胞不表达所述选择标记的培养条件下进行培养。在一些实施例,其中步骤(b)中所述的选择包括通过视觉、比色或荧光检测方法来检测所述选择标记的所述表达。在一些实施例,所述方法进一步包括恢复宿主细胞的步骤,其中,ES已经在TS同源重组。在一些实施例,所述恢复不需要将选择标记整合到所述宿主细胞基因组中。在一些实施例,所述恢复以至少约每10、9、8、7、6、5、4、3、或2的发生频率中的一个接触宿主细胞或其克隆群进行筛选。在一些实施例,所述方法进一步包括从所述选定的宿主细胞中消除所述环状染色体外核酸的步骤。在一些实施例,所述方法包括将多个(n)外源性核酸整合到所述宿主细胞基因组的多个(n)靶位点中,其中n至少为2,其中,步骤(a)包括使所述宿主细胞接触所述多个外源性核酸,其中x是从1到n的不同整数,并且对于每个整数x,每个外源性核酸(ES)x通过同源重组能够重组在一个靶位点(TS)x,所述靶位点(TS)x选自所述宿主细胞基因组的所述多个(n)靶位点;和对于每个所述靶位点(TS)x,使所述细胞也接触一个能够在(TS)x产生断裂的核酸酶(N)x。在一些实施例,单一核酸酶能够分裂每个(TS)x。在一些实施例,n=3、4、5、6、7、8、9或10。在一些实施例,(ES)x包含第一同源区(HR1)和第二同源区(HR2),其中HR1和HR2通过同源重组,能够分别与第三同源区(HR3)和第四同源区(HR4)进行重组,其中HR3和HR4各自在TS处。在一些实施例,(N)x能够在TS产生单链断裂或双链断裂。在一些实施例,(ES)x进一步包含一种目的核酸D。在一些实施例,(D)x是选自由选择标记,启动子,编码表位标记的核酸序列,目的基因,报告基因,和编码终止密码子的核酸序列组成的组。在一些实施例,(ES)x是线性的。在一些实施例,所述环状染色体外核酸进一步包含所述核酸酶的编码序列。在一些实施例,所述核酸酶是RNA-引导的DNA核酸内切酶。在一些实施例,所述RNA-引导的DNA核酸内切酶是Cas9核酸内切酶。在一些实施例,所述环状染色体外核酸进一步包含一个序列,所述序列编码crRNA活性和tracrRNA活性,并通过所述RNA-引导的DNA核酸内切酶能够位点特异性识别和分裂TS。在一些实施例,所述crRNA活性和所述tracrRNA活性均表示为一个单一连续的RNA分子。在一些实施例,所述核酸酶是选自由核酸内切酶,锌指核酸酶,TAL-效应因子DNA结合结构域-核酸酶融合蛋白(TALEN),转座酶,和位点特异性重组酶组成的组。在一些实施例,所述锌指核酸酶是一种融合蛋白,所述融合蛋白包含与一个工程化锌指结合结构域融合的IIS型限制性核酸内切酶的分裂结构域。在一些实施例,所述IIS型限制性核酸内切酶是选自由HO核酸内切酶和FokI核酸内切酶组成的组。在一些实施例,所述锌指结合结构域包含3、5或6个锌指。在一些实施例,所述核酸内切酶是一种归巢核酸内切酶,所述归巢核酸内切酶是选自由LAGLIDADG(SEQIDNO:1)归巢核酸内切酶,HNH归巢核酸内切酶,His-Cys箱归巢核酸内切酶,GIY-YIG(SEQIDNO:2)归巢核酸内切酶,和蓝藻归巢核酸内切酶组成的组。在一些实施例,所述核酸内切酶是选自由H-DreI、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、Pi-PspI、F-SceI、F-SceII、F-SuvI、F-CphI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、i-UarAP、i-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MgaI、PI-MtuI、PI-MtuHIPPI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、或PI-TliII组成的组。在一些实施例,所述核酸内切酶是通过修饰而特异性地结合一个内源性基因组序列,其中所述修饰的核酸内切酶不再结合其野生型核酸内切酶识别序列。在一些实施例,所述修饰的核酸内切酶是衍生自一种归巢核酸内切酶,所述归巢核酸内切酶是选自由LAGLIDADG(SEQIDNO:1)归巢核酸内切酶,HNH归巢核酸内切酶,His-Cys箱归巢核酸内切酶,GIY-YIG(SEQIDNO:2)归巢核酸内切酶,和蓝藻归巢核酸内切酶组成的组。在一些实施例,所述修饰的核酸内切酶是衍生自一种核酸内切酶,所述核酸内切酶是选自由H-DreI、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、Pi-PspI、F-SceI、F-SceII、F-SuvI、F-CphI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、i-UarAP、i-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MgaI、PI-MtuI、PI-MtuHIPPI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、或PI-TliII组成的组。在一些实施例,所述宿主细胞是原核细胞。在一些实施例,所述宿主细胞是真核细胞。在一些实施例,所述宿主细胞是选自由真菌细胞、细菌细胞、植物细胞、昆虫细胞、鸟细胞、鱼细胞和哺乳动物细胞组成的组。在一些实施例,所述宿主细胞是一种哺乳动物细胞,所述哺乳动物细胞是选自由啮齿类动物细胞、灵长类动物细胞和人细胞组成的组。在一些实施例,所述宿主细胞是酵母细胞。在一些实施例,所述酵母是酿酒酵母。另一方面,本发明提供一种宿主细胞,包含:一种外源性核酸(ES),所述外源性核酸(ES)通过同源重组能够重组在所述宿主细胞基因组的靶位点(TS);一种能够在TS产生断裂的核酸酶(N);和一种线性核酸,所述线性核酸能够自我同源重组、或者能够与所述宿主细胞内的另外一个或多个线性核酸同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成。在一些实施例,所述线性核酸包含能够互相同源重组的两个内部同源区域,于是所述内部同源区域的同源重组导致的结果是表达所述选择标记的所述环状染色体外核酸的形成。在一些实施例,所述线性核酸包含一个同源区域,所述同源区域能够与所述宿主细胞内另一个线性核酸的同源区域重组,于是所述两个线性核酸的同源重组导致的结果是表达所述选择标记的所述环状染色体外核酸的形成。在一些实施例,所述线性核酸包含所述选择标记的一个部分的、中断的、和/或不连续的编码序列,其中所述选择标记不能从所述线性核酸进行表达,于是所述环状染色体外核酸的所述形成导致的结果是所述选择标记的一个完整编码序列的形成,其中,所述选择标记可以从所述环状染色体外核酸进行表达。另一方面,本发明提供一种组合物,包含:一种位点特异性核酸酶,或一种包含位点特异性核酸酶的编码序列的核酸;和一种包含两个内部同源区域的线性核酸,所述两个内部同源区域能够在宿主细胞内互相同源重组,于是所述内部同源区域的同源重组导致的结果是含有一个用于选择标记的编码序列的环状核酸的形成。在一些实施例,所述线性核酸包含所述选择标记的一个部分的、中断的、和/或不连续的编码序列,其中,所述选择标记不能从宿主细胞内的所述线性核酸进行表达,于是所述环状核酸的所述形成导致的结果是所述选择标记的一个完整编码序列的形成,其中,所述选择标记可以从宿主细胞内的所述环状核酸进行表达。另一方面,本发明提供一种组合物,所述组合物包含一种位点特异性的核酸酶,或一种包含位点特异性核酸酶的编码序列的核酸;和一种第一线性核酸和另外的一个或多个线性核酸,其中,所述第一和第二线性核酸能够在宿主细胞内互相同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状核酸的形成。在一些实施例,每个线性核酸包含所述选择标记的一个部分的、中断的、和/或不连续的编码序列,其中,所述选择标记不能从宿主细胞内的每个线性核酸进行表达,于是所述环状核酸的所述形成导致的结果是所述选择标记的一个完整编码序列的形成,其中,所述选择标记可以从宿主细胞内的所述环状核酸进行表达。在一些实施例,所述环状核酸进一步包含一个位点特异性核酸酶的编码序列。在一些实施例,所述位点特异性核酸酶是RNA-引导的DNA核酸内切酶。在一些实施例,所述RNA-引导的DNA核酸内切酶是Cas9核酸内切酶。在一些实施例,所述组合物进一步包含:一种包含crRNA活性的核糖核酸和一种包含tracrRNA活性的核糖核酸;或一种编码包含crRNA活性的核糖核酸的脱氧核糖核酸和一种编码包含tracrRNA活性的核糖核酸的脱氧核糖核酸。在一些实施例,所述环状核酸进一步包含一种编码包含crRNA活性的核糖核酸的脱氧核糖核酸,和一种编码包含tracrRNA活性的核糖核酸的脱氧核糖核酸。在一些实施例,编码所述crRNA活性和所述tracrRNA活性的所述脱氧核糖核酸是在一个单一连续的RNA分子上编码所述活性。在一些实施例,所述位点特异性核酸酶是选自由核酸内切酶,锌指核酸酶,TAL-效应因子DNA结合结构域-核酸酶融合蛋白(TALEN),转座酶,和位点特异性重组酶组成的组。本发明还提供一种宿主细胞,所述宿主细胞包含任何上述组合物。本发明还提供一种细胞培养组合物,包括细胞培养基和任何本发明所述的宿主细胞。在一些实施例,所述细胞培养组合物,其进一步包括一种选择用于表达所述选择标记的化合物。另一方面,本发明也提供一种包含第一同源区(HR1)和第二同源区(HR2)的线性核酸,其中HR1和HR2通过同源重组能够互相重组,于是HR1和HR2的同源重组导致的结果是含有一个用于选择标记的编码序列的环状核酸的形成。在一些实施例,HR1包含所述选择标记的第一段不完整编码序列,和HR2包含所述选择标记的第二段不完整编码序列,并且HR1与HR2的同源重组导致的结果是所述选择标记的一个完整编码序列的重新构建。在一些实施例,所述线性核酸进一步包含一个本发明所述的位点特异性核酸酶的编码序列。本发明还提供通过位点特异性RNA引导的核酸内切酶(RGEN),如CRISPR/Cas9介导的,将一个或多个供体DNAs基因组整合到宿主细胞基因组中的方法和组合物。一方面,本发明提供一种将一个或多个外源性核酸整合到宿主细胞基因组的一个或多个靶位点中的方法,所述方法包括:(a)使一个或多个宿主细胞接触:(i)一个或多个外源性供体核酸(ES),所述外源性供体核酸(ES)通过同源重组,能够重组在所述宿主细胞基因组的一个或多个靶位点(TS);(ii)一种RNA-引导的核酸内切酶(RGEN);(iii)一个或多个核糖核酸,所述核糖核酸通过所述RGEN能够位点特异性识别和分裂所述一个或多个TS;和(iv)一种线性预重组核酸,所述线性预重组核酸能够自我同源重组、或者能够与同所述宿主细胞接触的另外一个或多个线性预重组核酸同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成;和(b)选择一种表达所述选择标记的宿主细胞,从而选择一种细胞,所述细胞已经将所述一个或多个外源性核酸整合到宿主细胞基因组的所述一个或多个靶位点中。在一些实施例,所述同源重组导致的结果是在所述环状染色体外核酸内,形成所述选择标记的一个完整编码序列。在一些实施例,至少一个线性预重组核酸包含一个序列,所述序列编码所述一个或多个核糖核酸,并通过所述RNA-引导的DNA核酸内切酶能够位点特异性识别和分裂TS。在一些实施例,所述一个或多个核糖核酸是在一个单一连续的向导RNA(gRNA)分子上包含crRNA活性和tracrRNA活性。在一些实施例,至少一个线性预重组核酸包含一个编码所述RNA-引导的DNA核酸内切酶的序列。在一些实施例,所述RNA-引导的DNA核酸内切酶是Cas9。在一些实施例,所述环状染色体外核酸的所述形成是由于两个或三个线性预重组核酸的同源重组所产生的。在一些实施例,所述一个或多个线性预重组核酸是在体内通过含有所述一个或多个预重组核酸的一个或多个环状核酸的RGEN分裂而产生。在一些实施例,多个(n)外源性核酸被整合到所述宿主细胞基因组的多个(n)靶位点中,其中n至少为2,其中步骤(a)包括使所述宿主细胞接触:(i)所述多个外源性核酸,其中x是从1到n的不同整数,并且对于每个整数x,每个外源性核酸(ES)x通过同源重组能够重组在一个靶位点(TS)x,所述靶位点(TS)x选自所述宿主细胞基因组的所述多个(n)靶位点;(ii)对于每个所述靶位点(TS)x,一个通过所述RGEN能够位点特异性识别和分裂(TS)x的向导RNA(gRNA)x。在一些实施例,所述选择标记是抗药性标记,荧光蛋白或通过比色或荧光检测方法来检测的蛋白。在一些实施例,ES进一步包含一种目的核酸D。在一些实施例,D是选自由选择标记,启动子,编码表位标记的核酸序列,目的基因,报告基因,和编码终止密码子的核酸序列组成的组。在一些实施例,所述宿主细胞是选自由真菌细胞、细菌细胞、植物细胞、昆虫细胞、鸟细胞、鱼细胞和哺乳动物细胞组成的组。在一些实施例,所述接触的宿主细胞是在所述选择之前培养至少约12小时、24小时、36小时、48小时、72小时或多于72小时的一段时间。在一些实施例,所述接触的细胞是在选择对所述存活细胞不表达所述选择标记的培养条件下进行培养。在一些实施例,步骤(b)中所述的选择包括经视觉、比色或荧光检测方法来检测所述选择标记的所述表达。另一方面,本发明提供一种用于将一个或多个外源性核酸整合到宿主细胞基因组的一个或多个靶位点中的组合物,所述组合物包括:(a)一个或多个外源性供体核酸(ES),所述外源性供体核酸(ES)通过同源重组,能够重组在宿主细胞基因组的一个或多个靶位点(TS);(b)一种RNA-引导的核酸内切酶(RGEN),或一种编码所述RGEN的核酸;(c)一个或多个核糖核酸,所述核糖核酸通过所述RGEN能够位点特异性识别和分裂所述一个或多个TS,或一个或多个编码所述一个或多个核糖核酸的核酸;和(d)一种线性预重组核酸,所述线性预重组核酸能够在体内自我同源重组、或者能够与同所述组合物中另外的一个或多个线性预重组核酸同源重组,于是所述体内同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成。在一些实施例,所述同源重组导致的结果是在所述环状染色体外核酸内,形成所述选择标记的一个完整编码序列。在一些实施例,至少一个线性预重组核酸包含一个序列,所述序列编码所述一个或多个核糖核酸,并通过RNA-引导的DNA核酸内切酶能够位点特异性识别和分裂TS。在一些实施例,所述一个或多个核糖核酸分子是在一个单一连续的向导RNA(gRNA)分子上包含crRNA活性和tracrRNA活性。在一些实施例,至少一个线性预重组核酸包含一个编码所述RNA-引导的DNA核酸内切酶的序列。在一些实施例,所述RNA-引导的DNA核酸内切酶是Cas9。在一些实施例,所述组合物包含两个或三个能够同源重组形成所述环状染色体外核酸的线性预重组核酸。在一些实施例,所述一个或多个线性预重组核酸是在体内通过包含所述一个或多个预重组核酸的一个或多个环状核酸的RGEN分裂而产生。在一些实施例,所述组合物包含:(a)多个(n)外源性核酸,所述外源性核酸能够整合到所述宿主细胞基因组的多个(n)靶位点中,其中n至少为2,其中x是从1到n的不同整数,并且对于每个整数x,每个外源性核酸(ES)x通过同源重组能够重组在一个靶位点(TS)x,所述靶位点(TS)x选自所述宿主细胞基因组的所述多个(n)靶位点;和(b)对于每个所述靶位点(TS)x,一个通过所述RGEN能够位点特异性识别和分裂(TS)x的向导RNA(gRNA)x。在一些实施例,所述选择标记是抗药性标记,荧光蛋白或通过比色或荧光检测方法来检测的蛋白。在一些实施例,ES进一步包含一种目的核酸D。在一些实施例,D是选自由选择标记,启动子,编码表位标记的核酸序列,目的基因,报告基因,和编码终止密码子的核酸序列组成的组。另一方面,本发明提供一种宿主细胞,所述宿主细胞包含用于RGEN–介导的将一个或多个外源性核酸整合到本发明所述宿主细胞基因组的一个或多个靶位点中的任一组合物。在一些实施例,所述宿主细胞是选自由真菌细胞、细菌细胞、植物细胞、昆虫细胞、鸟细胞、鱼细胞和哺乳动物细胞组成的组。4.附图简要说明图.1提供了一个例示性实例,关于使用一种位点特异性核酸酶(N)和两个能够自我同源重组(HR)从而形成一种含有用于选择标记(GFP)的编码序列的环状质粒的预重组分子,在外源性核酸(D)的宿主细胞内进行基因组整合。在此实例中,绿色荧光蛋白(GFP)的所述编码序列是在所述两个预重组分子中进行分裂,且所述编码序列是在体内根据所述两个分子之间的重叠同源区域的HR进行重新构建。对于选择表达所述选择标记同样选择已将所述外源性核酸整合到其靶位点中的细胞,并随后选择含有可以被消除的所述选择标记的所述质粒。HR1–上游同源区域;HR2–下游同源区域;TS–靶位点;N–位点特异性核酸酶;D–目的核酸。图.2提供了一个例示性实例,关于使用多个位点特异性核酸酶和两个能够自我同源重组从而形成一种含有用于选择标记(GFP)的编码序列的环状质粒的预重组分子,在多个外源性核酸的宿主细胞内同时进行基因组整合。在此实例中,两个预重组分子同时引入了三个外源性供体DNAs,针对所述宿主细胞基因组内的独特靶位点,每个均具有同源区域,和一个或多个能够在所述三个靶位点产生分裂的核酸酶。对于选择表达所述选择标记同样选择用于已将每个外源性核酸整合到其分别的靶位点的细胞。HR1–上游同源区域;HR2–下游同源区域;TS–靶位点;N–位点特异性核酸酶;D–目的核酸。图.3提供了两个例示性实例,即选择能够HR-介导聚集预重组分子,并靶向基因组整合外源性供体DNA的细胞。图.3A描述了一个基于HR-介导的质粒形成的选择策略,所述质粒包含一种基于荧光的选择标记。宿主细胞与一个或多个外源性供体DNAs进行转化,一个或多个预重组分子,其根据体内HR-介导的聚集从而形成含有基于荧光的选择标记(如GFP)的环状质粒,并且可选地,一个或多个位点特异性核酸酶能够分裂所述宿主细胞基因组的一个或多个靶位点。HR感受态细胞通过荧光来进行标记,并使用标准技术如流式细胞术可以从所述宿主细胞群进行分离。FIG.3B描述了一个基于HR-介导的形成一个基于药物的选择标记的选择策略。在此实例中,当在含有所述合适筛选剂的媒介中进行培养,HR感受态细胞通过药物抗性和存活进行标记,然而,非HR感受态药物敏感细胞则被消除。在两者中任一个选择方法下被分离的细胞或克隆细胞群,对于隐匿一个或多个外源性供体DNAs的靶向整合可以进行扩增和证实,譬如,通过PCR和/或所述基因组靶向区域的测序。图.4提供了例示性预重组组合物用于本发明所述基因组整合的方法。对于任何本发明所述预重组组合物,所述组合物可以被直接转化为宿主细胞作为线性核酸分子,或者,包含所述预重组分子的母环状分子可以被引入所述宿主细胞,并通过一个或多个核酸酶在体内进行分裂,从而解放所述预重组分子。在HR感受态宿主细胞内,所述线性预重组分子同源重组从而形成一个含有选择标记的环状载体。图.4A描述了两个例示性实例,关于预重组分子以1-片式体内聚集所述标记质粒。(L)一种单一线性预重组分子可以包含两个重叠的同源区域(由垂直条纹盒表示)在即所述选择标记(由GFP表示)的非包含的一个完整编码序列的外面。(C)或者,所述单一线性预重组分子可以包含两个重叠的同源区域,其中每个同源区域包含选择标记的一个部分的编码序列(分别为GF和FP,以灰色阴影重叠)。(R)对于所述两个实例,所述单一线性预重组分子的体内自我同源重组导致的结果是含有所述选择标记的所述完整编码序列的环状质粒的形成。在一些实施例,所述单一线性预重组分子可以进一步包含一个用于位点特异性核酸酶的编码序列(未显示)。图.4B描述了两个例示性实例,关于预重组分子组合物以2-片式体内聚集所述标记质粒。两个线性预重组分子可以各自包含两个非重叠的同源区域(分别由垂直和水平的条纹盒表示),所述其他预重组分子的同源区域与各同源区域是同源的。(L)所述两个线性预重组分子中的一个可以包含选择标记(由GFP表示)的一个完整编码序列,并与所述两个非重叠同源区域分开。(C)或者,每个所述两个预重组分子可以包含所述选择标记的一个部分的编码序列,所述选择标记与所述其他预重组分子上的一个部分的标记编码序列具有同源性(分别为GF和FP,以灰色阴影重叠)。(R)对于所述两个实例,所述两个线性预重组分子的体内自我同源重组导致的结果是一个含有所述选择标记的所述完整编码序列的环状质粒的形成。在一些实施例,所述线性预重组分子中的一个可以进一步包含一个用于位点特异性核酸酶的完整编码序列,或者,各所述两个预重组分子可以包含一个部分的核酸酶编码序列,所述部分的核酸酶编码序列与所述其他预重组分子上的部分的核酸酶编码序列具有同源性(未显示)。此类实例可以用于仅HR感受态细胞所需的核酸酶表达,譬如,减少在非HR感受态细胞内核酸酶介导的NHEJ的发生率。图.4C描述了两个例示性实例,关于预重组分子组合物以3-片式体内聚集所述标记质粒。所述三个线性预重组分子可以各包含两个非重叠的同源区域(分别由垂直和水平的条纹盒;水平条纹盒和菱形填充盒;和垂直条纹盒和菱形填充盒表示),所述其他预重组分子中的一个上的同源区域与各同源区域是同源的。(L)所述三个线性预重组分子中的一个可以包含一个选择标记(由GFP表示)的完整编码序列,并与所述两个非重叠同源区域分开。(C)或者,每个至少两个预重组分子可以包含所述选择标记的一个部分的编码序列,所述选择标记与一个其他预重组分子上的一个部分的标记编码序列具有同源性(分别为GF和FP)。(R)对于所述两个实例,所述三个线性预重组分子的自我同源重组导致的结果是一个含有所述选择标记的所述完整编码序列的环状质粒的形成。在一些实施例,作为以2-片式的聚集,所述线性预重组分子中的一个可以进一步包含用于位点特异性核酸酶的一个完整编码序列,或者,每个至少两个预重组分子可以包含一个部分的核酸酶编码序列,其与一个其他预重组分子上的一个部分的核酸酶编码序列具有同源性(未显示)。图.5提供了例示性预重组组合物用于RNA-引导的DNA核酸内切酶(RGEN)的本发明所述基因组整合方法的具体实例。图.5A:在一些图.4A所描述的以1-片式体内聚集的实施例中,所述单一预重组分子可以进一步包含一个或多个序列,所述序列编码crRNA活性和tracrRNA活性(如向导RNA(gRNA)序列),并通过RGEN(如CRISPR/Cas9)能够位点特异性识别和分裂基因组靶位点。在一些实施例,所述预重组分子可以进一步包含一个所述RGEN(如Cas9;未显示)的编码序列。图.5B:在一些图.4B所描述的以2-片式体内聚集的实施例中,所述两个预重组分子中的一个可以进一步包含一个gRNA序列。在其他实施例,所述两个预重组分子中的一个可以进一步包含RGEN的一个完整编码序列,或者,所述两个预重组分子中的一个可以包含一个部分的核酸酶编码序列,其与另一个预重组分子(未显示)上的部分的核酸酶编码序列具有同源性。图.5C:在一些以3-片式体内聚集的实施例中,所述三个预重组分子中的一个可以进一步包含一个gRNA序列。在其他实施例,所述三个预重组分子中的一个可以进一步包含RGEN的一个完整编码序列,或者,每个至少两个预重组分子可以包含一个部分的核酸酶编码序列,其与另一个预重组分子(未显示)上的部分的核酸酶编码序列具有同源性。图.6提供了例示性用于RGEN-介导的多重基因组整合的线性预重组组合物。图.6A:在一些以2-片式体内聚集的实施例中,其中参与所述聚集的所述两个预重组分子中的一个包含一个gRNA序列,这些分子中的几个可以立刻提供(例如,3:gRNA-1、gRNA-2、gRNA-3),每个包含一个独特gRNA序列,并靶向于一个不同的基因组靶位点。在这个实施例中,另一预重组分子代表一个常见的载体支柱,所述载体支柱可以包含一个选择标记(L)的完整编码序列,或一个部分的标记编码序列,其与为每个含有片段(C)的所述gRNA所共有的一个部分的编码序列是同源的。(R)HR感受态细胞能够重组每个独特的gRNA,所述gRNA含有具有所述常见载体支柱的片段,从而重建三个不同的标记质粒,其中每个标记质粒包含一个独特的gRNA序列。图.6B:在其他实施例,所述两个预重组分子中的一个可以进一步包含一个RGEN(如Cas9)的完整编码序列。或者,所述两个预重组分子中的每个可以包含一个部分的核酸酶编码序列,所述部分的核酸酶编码序列与另一个预重组分子(未显示)上的一个部分的核酸酶编码序列具有同源性。多重基因组整合可以通过2-片式、3-片式、或高阶预重组组合物联合多个独特的gRNA盒来执行完成,其中所述gRNA盒位于所述组合物的一个或多个所述预重组分子内。图.7描述了用于确定CRISPR/Cas-9介导的多重供体DNA整合的gRNA递送的最佳方式,如实施例1所描述。(L)独特的gRNA盒被描绘为新月形,并且独特药物选择标记则被描绘为长方形。(R)gRNA盒被引入宿主细胞作为:(1)环状载体,其中三个独特gRNA盒中的每个被克隆到一种质粒中,所述质粒包含一个独特的选择标记;(2)环状载体,其中三个独特gRNA盒中的每个被克隆到一种质粒中,所述质粒包含相同选择标记;(3)线性表达盒,其中所述三个线性gRNA盒与含有一种选择标记的环状质粒共转化;和(4)线性表达盒,其中每个线性表达盒具有与一个含有选择标记的共转化线性质粒的所述终端具有同源性终端,从而允许HR-介导的体内环状质粒的聚集,所述环状质粒包含每个gRNA和一个常见选择标记。图.8提供了一个关于确定gRNA递送的最佳方式的实验结果,如实施例1所描述。Cas9-表达的宿主细胞(酿酒酵母)与供体DNAs被转化的同时,无标记整合/删除RHR2、HO和ADH5开放性阅读框和靶向于每个基因位点的gRNA结构。gRNA递送的方式有:1)具有三个不同选择标记的三个质粒,2)具有相同标记的三个质粒,3)一个单一标记质粒,其具有三个线性gRNA盒,和4)一个单一的线性化的标记质粒,其具有用于三个线性gRNA盒的缺口修复的侧翼序列。通过cPCR,使用一个在所述缺失结构外的上游正向引物对菌落进行分析,并且与一个短连接序列结合的反向引物整合代替每个开放性阅读框。对于每个递送方式,对11个菌落以及充当一个阴性对照的母菌落(“N”)进行分析。图.9提供了一个对于确定标记载体缺口修复益处的实验结果(如实施例2所描述),其与来自选择用于gRNA,对于CRISPR/Cas-9介导的单独将供体DNA分别整合到所述RHR2、HO和ADH5位点中的益处分开。Cas9-表达的宿主细胞(酿酒酵母)与一种供体DNA一同被转化,用于无标记删除RHR2、HO和ADH5开放性阅读框和靶向于每个基因位点的gRNA结构。除了所述合适的供体DNA,线性gRNA盒与下述各项共转化:1)一个封闭的标记载体(A),或2)相同的载体,但线性化的和切去顶端的如此一个额外提供片段的缺口修复是需要关闭所述载体和重建所述标记盒(B)。通过PCR,使用一个在所述缺失结构外的上游正向引物,对菌落进行分析,并且一个结合在短连接序列上的反向引物整合代替每个开放性阅读框。对于每个递送方式,对23个菌落以及充当一个阴性对照的母菌落(“N”)进行分析。所述实验重复3次;来自一个单一实验的结果已披露。图.10提供了总计三个如图.9所示的缺口修复实验的结果。对于三个实验中的每一个,对23个菌落进行分析。图.11提供了总计三个如图.9所示的缺口修复实验的箱形图。图.12:提供了通过缺口修复聚集所述标记质粒的成倍增加;总计三个如图.9所示的缺口修复实验。图.13提供了一个用于确定2-片式体内聚集相对于一种对于CRISPR/Cas-9介导的同时将三个供体DNAs分别整合到所述Gal80、HO和ADH5位点中的3-片式体内聚集标记/gRNA载体的益处的实验结果。Cas9-表达的宿主细胞(单倍体酿酒酵母)与供体DNAs被转化的同时,无标记删除Gal80、HO和ADH5开放性阅读框,靶向作用于每个位点的gRNA结构,和用于2或3片式中任一个标记/gRNA载体聚集的预重组分子。通过cPCR,使用一个在所述缺失结构外的上游正向引物,对菌落进行分析,并且一个结合在短连接序列上的反向引物整合代替每个开放性阅读框。对于每个递送方式,对11个菌落以及充当一个阴性对照的母菌落(“N”)进行分析。图.14提供了一个用于确定2-片式体内聚集相对于一种对于CRISPR/Cas-9介导的同时将三个供体DNAs分别整合到所述Gal80、HO和ADH5位点中的3-片式体内聚集标记/gRNA载体的益处的实验结果。Cas9-表达的所述双倍体酵母菌株CAT-1(酿酒酵母)的细胞与供体DNAs被转化的同时,泛等位基因,无标记删除Gal80、HO和ADH5开放性阅读框,靶向作用于每个位点的gRNA结构,和用于2或3片式中任一个标记/gRNA载体聚集的预重组分子。通过PCR,使用一个在所述缺失结构外的上游正向引物,对菌落进行分析,并且一个结合在短连接序列上的反向引物整合代替每个开放性阅读框。利用一个选择方案的所述实验,在其中使用2或3个同源重组事件,细胞必须处理转化DNA试剂,来创建一个选择性质粒。泛等位基因同时进行三重整合的比率接近高于10倍当需要三个同源重组事件时。从所述实验中恢复的菌落的数量同样大致低于10倍当需要三个同源重组事件时(未显示),表明所述选择方案负责增加所述三重整合的比率。图.15提供了一个关于在“异源块”的背景下,引入点突变的原理图。一个靶向氨基酸是盒装的,且相邻分裂位点是用分裂位点和PAM序列(顶板)进行注释的。在沉默的密码子变化和侧翼同源性的异源块的背景下,一个含有所需点突变的供体DNA可以通过退火处理和延伸60-mer的寡核苷酸(中板)或与更大克隆结构合成产生。整合所述供体DNA来产生所需点突变(底板)。图.16提供了一个关于使用CRISPR联合一个标记/gRNA载体的2-片式体内聚集来引入在供体DNA内进行编码的单一点突变的实验结果。对候选菌落(1-11)和母阴性对照(c)通过菌落PCR对所述异源块和侧翼序列进行分析(左板和表格)。选定的阳性菌落是通过测序一个更大的跨越所述整合位点的PCR产物来进行证实。图.17提供了一个关于使用CRISPR联合一个标记/gRNA载体的2-片式体内聚集来引入在供体DNA内进行编码的多样点突变的实验结果。所述ECM38、PGD1、和ADH2基因位点进行靶向作用的同时,引入三个点突变。对供体DNAs与每个靶位点的上游和下游的同源性侧翼的500bp进行克隆。对候选菌落通过菌落PCR对所述异源块和侧翼序列进行鉴定(左板和表格)。10/11个菌落(90.9%)对于所有三个异源块的整合是阳性的。图.18提供了一个关于使用CRISPR联合一个标记/gRNA载体的2-片式体内聚集来引入在供体DNA内进行编码的多样点突变的实验结果。对所述ADH2、PGD1、ECM38、SIN4和CYS4位点进行靶向作用的同时,引入五个点突变。在此种情况下,对供体DNAs与每个靶位点的上游和下游的同源性侧翼的500bp进行克隆。对候选菌落通过菌落PCR对所述异源块和侧翼序列进行鉴定(左板和表格)。2/11个菌落(18.2%)对于所有五个异源块的整合是阳性的(克隆#’s4和9)。图.19提供了一个实验结果,所述实验是关于将在所述GAL80位点的一个短连接序列整合到单倍体CENPK2(A)中,并将所述GAL80位点的相同结构泛等位基因地整合到二倍体工业菌株CAT-1(B)和二倍体工业菌株PE-2(C)中。对于所述短连接序列(奇数线路)的整合以及对于所述野生型等位基因存在下(偶数线路),对每个菌落进行分析。在各自凝胶上的所述最后两个线路是亲本(阴性)对照。图.20提供了一个关于使用CRISPR联合一个标记/gRNA载体的2-片式体内聚集,来引入多种样式的一个用于生产所述类异戊二烯的金合欢烯的12-基因生物合成途径(总计~30kb)。对所述Gal80、HO和BUD9位点进行靶向作用的同时,引入3个供体DNAs,所述供体DNAs包含用于所述金合欢烯路径组成的编码序列(供体1:所述转录调节因子GAL4;来自青蒿素的金合欢烯合酶(2个副本);ERG10,编码乙酰辅酶A硫解酶;和ERG13,编码HMG-CoA合酶;供体2:tHMG1(2个副本)编码HMG-CoA还原酶;和供体3:ERG12,编码甲羟戊酸激酶;ERG8,编码磷酸甲羟戊酸激酶;ERG19,编码甲羟戊酸焦磷酸酯脱羧酶;IDI1,编码异戊烯焦磷酸酯异构酶;和ERG20,编码焦磷酸法尼酯合成酶)。对供体DNAs与每个靶位点的上游和下游的同源性侧翼的500bp进行克隆。通过菌落PCR对内部连接序列和所述整合靶位点侧翼的序列,对候选菌落进行鉴定。11/47个菌落(23.4%)对于整个整合路径是阳性的。图.21提供了一个用于证实在通过具有完全整合所述金合欢烯路径的cPCR,对所述11个菌落进行鉴定的一组蔗糖板模型试验中,生产金合欢烯的实验结果。每个cPCR阳性克隆产生金合欢烯的量的范围是从~0.1至1.5g/L的金合欢烯。图.22提供了等位基因交换cPCRs的结果,其展示了单一和多重等位基因交换的高比率。图.23(A)–(F)提供了使用CRISPR显示协同表型,来证明多重等位基因交换产生的实验结果。(A)ACE2的截断导致不完整细胞分裂和凝结。(B)分泌的和细胞周期突变体在37℃不生长。(C)细胞周期突变体在非许可温度下在G1中被捕捉。(D)SEC3-GFP在许可温度(23℃)下被恰当地定位在所述苞芽上,但在升温情况下,被错误地定位在分泌突变体上。(E)两个等位基因分别提高耐热性,并一起产生一个更加耐热的菌株。(F)几个突变赋予乙醇抗性,但所有等位基因一起协同作用更进一步加强乙醇的耐受性。所有五个变化可使用CRISPR同时产生。图.24提供了证明以单一转化方式,将整个粘康酸生物合成路径整合到一个原生酵母菌株中的结果。(A)所述粘康酸生物合成路径的原理图。(B)所述粘康酸路径通过总计28kb的六片供体DNA被引入到三个独立的位点。每片通过所述目标基因位点(终端)的上游(US)同源区域或下游同源区域(DS),以及与具有重叠的同源性(中心)的另一片供体DNA重组到所述基因组。(C)一步所述路径的整合允许所述路径瓶颈的快速诊断:AroY.菌株与所述整合的路径产生~3g/LPCA(倒数第二行)。当饲养邻苯二酚时(倒数第一行),这些菌株将所有可用邻苯二酚完全转化为粘康酸(倒数第三、四、五行)。(D)所述粘康酸路径在乳酸克鲁维酵母中还被一步引入到三个独立的位点(10kb)。(E)乳酸克鲁维酵母菌株与所述整合的路径产生~1g/LPCA(倒数第一行),展示相同的路径瓶颈如酿酒酵母。当饲养邻苯二酚时,这些菌株同样将所有可用邻苯二酚完全转化为粘康酸(倒数第二行)。图.25提供了在293T细胞内的靶向基因组位点的扩增子,随后与CRISPR试剂和供体DNA进行转染的RFLP试验的结果。细胞转染如下:(2)关闭“无gRNA”质粒+线性供体;(3)打开“无gRNA”质粒;(4)打开“无gRNA”质粒+CD4缺口片段;(6)关闭gRNA质粒+线性供体;(8)打开gRNA质粒+整个缺口+线性供体。5.本发明实例的详细说明5.1定义本发明使用的关于核酸酶,如归巢核酸内切酶、锌指核酸酶、TAL-效应因子核酸酶、或RNA-引导的DNA核酸内切酶(如CRISPR/Cas9)的术语“分裂”、“断裂”是指在一个特别的核酸内产生断裂的行为。所述断裂可以留下一个钝端或粘性末端(即5'或3'悬垂部分),正如本领域技术人员所理解的。所述术语还包含单链DNA断裂(“缺口”)和双链DNA断裂。本发明使用的术语“工程化宿主细胞”是指一个宿主细胞是通过使用基因工程技术(即重组技术)来基因修饰一个母细胞而产生的。所述工程化宿主细胞可以包含添加、删除、和/或修饰所述母细胞的所述基因组的核苷酸序列。本发明使用的术语“异源性”是指不能正常在自然界发现。术语“异源性核苷酸序列”是指一个核苷酸序列不能正常在自然界给定的细胞中发现。据此,一个异源性核苷酸序列可以是:(a)与其宿主细胞无关(即对于所述细胞是“外源的”);(b)天然存在于所述宿主细胞中(即“内源的”),但在所述细胞中以非天然数量存在(即大于或小于所述宿主细胞中天然存在的量);或(c)天然存在于所述宿主细胞,但位于其天然基因位点之外。本发明使用的术语“同源”是指两个或多个核酸序列,或两个或多个氨基酸序列之间的同一性。序列同一性可以根据同一(或相似或同源)的百分比来进行测定;比例越高,彼此越接近于相同的序列。当使用标准方法进行匹配时,核酸或氨基酸序列的同源物或直系同源物拥有一个相对高度的序列同一性。序列匹配比较的方法在本领域是周知的。各种程序和对比算法公开于:Smith&Waterman,Adv.Appl.Math.2:482,1981;Needleman&Wunsch,J.Mol.Biol.48:443,1970;Pearson&Lipman,Proc.Natl.Acad.Sci.USA85:2444,1988;Higgins&Sharp,Gene,73:237-44,1988;Higgins&Sharp,CABIOS5:151-3,1989;Corpetetal.,Nuc.AcidsRes.16:10881-90,1988;Huangetal.ComputerAppls.Biosc.8,155-65,1992;和Pearsonetal.,Meth.Mol.Bio.24:307-31,1994.Altschuletal.,J.Mol.Biol.215:403-10,1990,提出了详细的考虑有关序列匹配方法和同源计算方法。NCBI基本局部匹配查询工具(BLAST)(Altschuletal.,J.Mol.Biol.215:403-10,1990)从几个来源获取,包括国家生物信息中心(NCBI,国家医学图书馆,38A幢,8N805室,贝塞斯达,马里兰州20894)和互联网,用于与序列分析程序对比、同源性分析、同源性比较、网上对比和分析相关。更多信息可以在NCBI网站获悉。本发明使用的术语“无标记”是指将供体DNA整合到宿主细胞基因组的靶位点中,但并未伴随选择标记的整合。在一些实施例,所述术语同样涉及所述宿主细胞的恢复,但并未利用一个依靠将选择标记整合到所述宿主细胞基因组中的选择方法。譬如,在某些实施例,一个游离或额外染色体的选择标记可以用于选择细胞,所述细胞包含一个编码能够分裂基因组靶位点的核酸酶的质粒。此种应用可被认为是“无标记”只要所述选择标记未被整合到所述宿主细胞基因组。本发明使用的术语“可操作地连接”是指一个在核酸序列之间功能化的连接,如此所述序列编码一个所需的功能。譬如一个目的基因的编码序列,如一个选择标记与其启动子和/或调控序列进行可操作的连接,当所述连接的启动子和/或调控区域功能性地控制所述编码序列的表达。所述术语还涉及编码序列之间的连接,如此他们可以通过相同连接启动子和/或调控区域从而被控制;编码序列之间的此类连接也可以认为是在片格或在相同编码片格中被连接。“可操作地连接”还可以是指一个功能的但非编码序列的连接,如一个自主传播序列或复制起点。此类序列均是以可操作的连接,当他们能够完成他们的正常功能时,譬如能够在宿主细胞内复制、传播、和/或隔离承载所述序列的载体。本发明使用的术语“选择一种表达选择标记的宿主细胞”还包括从转化细胞群,富集表达选择标记的宿主细胞。本发明使用的术语“选择标记”是指一个起向导作用用于选择一种含有本发明所述标记载体的宿主细胞的基因。所述选择标记可以包括但不限于:荧光标记、发光标记和药物选择标记等。所述荧光标记可以包括但不限于,编码荧光蛋白如绿色荧光蛋白(GFP)、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(dsRFP)等的基因。所述发光标记可以包括但不限于,编码发光蛋白的基因如荧光素酶。用于本发明所述方法和组合物的合适的药物选择标记包括但不限于,对抗生素的抗性基因如氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、四环素、氯霉素、和新霉素。在一些实施例,所述选择可以是阳性选择;即表达所述标记的细胞与细胞群是隔离的,如产生一个富集的含有所述选择标记的细胞群体。在其他实施例,所述选择可以是阴性选择;即所述细胞群与所述细胞是隔离的,如产生一个富集的不含有所述选择标记的细胞群体。可以通过任何便利的适合用于所述选择标记的分离技术进行分离。譬如,如果一种荧光标记已被利用,则细胞可以通过荧光激活细胞分选方法来进行分离,反之,如果细胞表面标记已被插入,则细胞可以通过亲和分离技术从所述异源群体中分离,如磁力分离、亲和色谱法、与一种附着于固体基质的亲和试剂“平移”、或其他便利的技术。本发明使用的术语“同时”、“同时的”,当用于多重整合,包含一段时间始于宿主细胞与核酸酶共转化的点,如编码核酸酶的质粒,和不只一个供体DNA被整合到所述宿主细胞基因组中,并结束在所述转化宿主细胞或其克隆群的点,并进行筛选且成功用于所述供体DNAs在其分别的靶位点的整合。在一些实施例,所述一段时间包含通过“同时的”是所述核酸酶在所述宿主细胞染色体内结合并分裂其目标序列至少所需的时间量。在一些实施例,所述一段时间包含通过“同时的”是至少6小时、12小时、24小时、36小时、48小时、60小时、72小时、96小时或多于96小时,始于宿主细胞与核酸酶,如编码核酸酶的质粒,和不只一个供体DNA,共转化的点。5.2整合外源性核酸的方法本发明提供了将一个或多个外源性核酸整合到一个或多个选定的宿主细胞基因组靶位点中的方法。在某些实施例,所述方法包含使所述宿主细胞与一个或多个整合的多核苷酸接触,即供体DNAs,包含一种被整合到所述基因组靶位点中的外源性核酸;一个或多个能够在所述基因组靶位点附近或以内引起双链断裂的核酸酶;和一种线性核酸,所述线性核酸能够自我同源重组、或者能够与同所述细胞群接触的另外一个或多个线性核酸同源重组,于是所述宿主细胞内的线性核酸的所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成。在一些实施例,所述接触的宿主细胞随后是在选择性条件下生长的。若不受操作理论的影响,据认为通过HR迫使所述宿主细胞来环化所述表达载体,以便依据本发明所述方法来进行选择,增加所述选定的细胞也成功地完成了所述一个或多个目标HR-介导的外源性DNA的基因组整合的可能性。尤其在一方面,本发明提供了一种用于将外源性核酸无标记整合到宿主细胞基因组靶位点中的方法,所述方法包括:(a)使宿主细胞接触:(i)一种外源性核酸(ES),所述外源性核酸(ES)包含第一同源区(HR1)和第二同源区(HR2),其中(HR1)和(HR2)能够在所述靶位点(TS)初始化宿主细胞介导的同源重组。(ii)一种能够在(TS)产生分裂的核酸酶(N),于是所述分裂导致的结果是(ES)在(TS)同源重组;和(iii)一种线性核酸,所述线性核酸能够自我同源重组、或者能够与同所述宿主细胞接触的另外一个或多个线性核酸同源重组,于是所述同源重组导致的结果是含有一个用于选择标记的编码序列的环状染色体外核酸的形成;和(b)选择一种表达所述选择标记的宿主细胞。在一些实施例,所述方法包含恢复一种具有(ES)在(TS)进行整合的宿主细胞,其中所述恢复不需要选择标记的整合。图.1提供了一个例示性实例,关于使用一种位点特异性核酸酶和一种能够通过宿主细胞介导的HR进行体内聚集从而形成环状标记表达载体的预重组组合物,来进行外源性核酸的基因组整合。一种供体多核苷酸被引入宿主细胞,其中所述多核苷酸包含一种目的核酸(D),其两侧是第一同源区域(HR1)和第二同源区域(HR2)。HR1和HR2分别共享基因组靶位点(TS)的5’和3’同源区域。一种位点特异性核酸酶(N)也被引入所述宿主细胞,其中所述核酸酶能够识别并分裂所述靶位点内的独特序列。同样引入所述细胞的是一种预重组组合物,其在这个实施例中包含两个线性预重组分子,其中每个分子含有两个能够互相同源重组的同源区域。在所述这个实例中,所述同源区域定位在每个预重组分子的5’和3’终点。每个预重组分子的其中一个同源区域包含选择标记(分别是GF和FP)的一个部分的编码序列,如此根据所述两个同源区域之间的HR,一个完整的和可操作的所述选择标记(GFP)的编码序列在一个环状的标记表达载体上重新构建。通常,此种环化是通过在选择用于表达所述选择标记的条件下培养所述细胞来进行选择,例如通过使用选择剂(例如抗生素)补充所述培养基,其中所述选择标记是抗药性标记,或分类整理能表达标记的细胞,并通过比色或荧光检测方法来进行检测。伴随地,在有能力HR的细胞内,在所述靶位点内,通过所述位点特异性核酸酶在所述分裂的靶位点促进所述HR-介导的所述目的供体核酸的整合,诱导双链断裂。通过这一要求,所述宿主细胞通过HR来环化所述表达载体以便被选择,还完成了HR-介导的所述外源性供体DNA整合的细胞恢复同样是增长的。所述这个恢复增长的频率消除了对于共整合一个选择标记以便选择具有经历重组事件的转化子的需要。通过消除用于选择标记的需要,例如,在构建一个工程化微生物期间,需要用于工程化一个宿主细胞基因组的时间将大幅减少。此外,工程策略不再被选择标记再利用的需求所限制,由于有一个有限的标记缓存提供给一个给定的宿主生物体。在一些实施例,转化细胞的无标记恢复包含一个成功地整合外源性核酸以约每1000、900、800、700、600、500、400、300、200或100的发生频率中的一个接触宿主细胞或其克隆群进行筛选。尤其在一些实施例,转化细胞的无标记恢复包含一个成功地整合外源性核酸以约每90、80、70、60、50、40、30、20或10的发生频率中的一个接触宿主细胞或其克隆群进行筛选。在更优选的实施例,转化细胞的无标记恢复包含一个成功地整合外源性核酸以约每9、8、7、6、5、4、3或2的发生频率中的一个接触宿主细胞或其克隆群进行筛选。本发明提供各种方法在未使用选择标记的情况下,来识别那些在或接近所述靶位点具有可改变基因组的细胞。在一些实施例,此类方法寻求检测在所述靶位点的任何变化,包括但不限于PCR方法,测序方法,核酸酶消化作用如限制性内切酶图谱法、印迹法、和任何他们的组合。表型读数,例如一个预测收益或损失的功能,还可以用作影响所述目标基因组修饰的代理。另一方面,本发明提供一种用于将多个外源性核酸整合到宿主细胞基因组中的方法,所述方法包括:(a)使宿主细胞接触:(i)多个外源性核酸,其中每个外源性核酸(ES)x包含第一同源区域(HR1)x和第二同源区域(HR2)x,其中(HR1)x和(HR2)x能够在所述宿主细胞基因组靶位点(TS)x,初始化宿主细胞介导的(ES)x的同源重组;(ii)对于每个所述靶位点(TS)x,一个能够在(TS)x产生断裂的核酸酶(N)x,于是所述断裂导致的结果是(ES)x在(TS)x进行同源重组;和(iii)一种线性核酸,所述线性核酸能够自我同源重组、或者能够与同所述宿主细胞接触的另外一个或多个线性核酸同源重组,于是所述同源重组导致的结果是含有一个选择标记的编码序列的环状染色体外核酸的形成;和(b)选择表达所述选择标记的宿主细胞。在一些实施例,所述方法进一步包括恢复宿主细胞,其中每个选定的外源性核酸(ES)x已被整合到每个选定的靶序列(TS)x中,其中x是从1至n的任何整数,其中n至少为2。图.2提供了一个例示性实例,关于使用多个位点特异性核酸酶,对多个外源性核酸同时进行基因组整合。在此实施例中,三个不同的供体多核苷酸被引入宿主细胞,其中每个多核苷酸包含一个含有目的核酸(D)x的外源性核酸(ES)x,其中x=1、2或3。每个(D)x的两侧分别是第一同源区域(HR1)x和第二同源区域(HR2)x。(HR1)x和(HR2)x分别共享所述基因组内总计3个独特的选定的5’和3’靶位点(TS)x的同源区域。一个或多个位点特异性核酸酶(N)x(例如,一个或多个(如“x”数目)具有一个唯一识别位点的核酸内切酶;或一个RNA-引导的核酸内切酶与一个或多个(如“x”数目)向导RNAs一起)也被引入所述宿主细胞,其中每个核酸酶(N)x能够识别并分裂其相应靶位点(TS)x内的一个独特序列。还被引入所述细胞的是一种预重组组合物,其在此实施例中包含两个线性预重组分子,其中每个线性预重组分子包含两个能够互相同源重组的同源区域。在此实施例中,所述同源区域定位在每个预重组分子的5’和3’终点。每个预重组分子的其中一个同源区域包含选择标记(分别为GF和FP)的一个部分编码序列,如此根据所述两个同源区域之间的HR,一个所述选择标记(GFP)完整的和可操作的编码序列在一个环化的标记表达载体上重新构建。此种环化是通过在选择用于表达所述选择标记的条件下培养所述细胞进行选择。伴随地,在有能力HR的细胞内,通过其相应位点特异性核酸酶(N)x促进所述相应目的核酸(D)x,通过所述宿主细胞的内源性同源重组机构在(TS)x的整合,来分裂靶位点(TS)x。通过这一要求,所述宿主细胞通过HR来环化所述表达载体以便被选择,还完成了HR-介导的所述外源性供体DNAs的整合的细胞恢复也同样是增长的。尤其在一些实施例,每个任选地包含一种目的核酸(D)x的外源性核酸(ES)x,被同时整合到其分别的基因组靶位点(TS)x中,即与所述宿主细胞和所述多个整合的多核苷酸和多个核酸酶的单一转化。在一些实施例,所述方法用于同时整合任何多个外源性核酸(ES)x,即其中x是从1至n的任何整数,其中n至少为2,依照本发明上述方法中所列举的变量。在一些实施例,本发明所提供的同时整合的方法用于同时整合多达10个外源性核酸(ES)x到10个选定的靶位点(TS)x中,即其中x是从1至n的任何整数,其中n=2、3、4、5、6、7、8、9、或10。在一些实施例,本发明所提供的同时整合的方法用于同时整合多达20个外源性核酸(ES)x到20个选定的靶位点(TS)x中,即其中x是从1至n的任何整数,其中n=2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20。在一些实施例,n=2。在一些实施例,n=3。在一些实施例,n=4。在一些实施例,n=5。在一些实施例,n=6。在一些实施例,n=7。在一些实施例,n=8。在一些实施例,n=9。在一些实施例,n=10。在一些实施例,n=11。在一些实施例,n=12。在一些实施例,n=13。在一些实施例,n=14。在一些实施例,n=15。在一些实施例,n=16。在一些实施例,n=17。在一些实施例,n=18。在一些实施例,n=19。在一些实施例,n=20。在一些实施例,本发明所提供的同时整合的方法用于同时整合多于20个外源性核酸。正如将一个单独外源性核酸整合到一个单独的靶位点中,所述宿主细胞恢复已成功地将每个外源性核酸整合到其分别的靶位点中,并以实质较高的频率发生,相较于未使所述宿主细胞接触一个或多个本发明所述的线性预重组分子,并选择用于所述选择标记的表达。在一些实施例,所述这个提高的整合频率消除了用于识别多个预重组事件一个或多个选择标记的共整合的需求。在一些实施例,含有多个成功整合外源性核酸的转化细胞的无标记恢复以约每1000、900、800、700、600、500、400、300、200或100的发生频率中的一个,接触宿主细胞或其克隆群进行筛选。尤其在一些实施例,无标记恢复以约每90、80、70、60、50、40、30、20、或10的发生频率中的一个,接触宿主细胞或其克隆群进行筛选。在更优选的实施例,无标记恢复以约每9、8、7、6、5、4、3、或2的发生频率中的一个,接触宿主细胞或其克隆群进行筛选。5.2.1HR-介导的环状标记表达载体的体内聚集本发明提供的方法包括通过缺口修复,宿主细胞介导的环状表达载体的聚集。缺口修复对于体内聚集重组DNA分子是一个快速且有效的方法。这项技术已被描述为可有效地聚集和/或修复许多有机体中的质粒,包括细菌(大肠杆菌,参见如Dattaetal.,Gene379:109-115(2006)),酵母(酿酒酵母,参见如Bessaetal.,Yeast29:419-423(2012)),昆虫(黑腹果蝇,参见如Carreira-Rosarioetal.,JVisExp77:e50346(2013))和哺乳动物细胞(人细胞,参见如Adaretal.,NucleicAcidsResearch37(17):5737-5748(2009))。缺口修复通过单一线性DNA的两个同源区域之间的同源重组,或两个或多个独立的线性DNA碎片之间的同源重组,可以产生一个环状DNA分子。典型地,所述聚集的环化DNA充当一个运输复制序列和选择标记的载体,参见如Orr-Weaveretal.,MethodsEnzymol101:228-245(1983)。所述技术在图.4中进行概述,通常从线性“有缺口的”载体和线性DNA片段(插入物)(Orr-Weaveretal.,1983)的共转化开始。在有能力同源重组的细胞中,重组在载体和插入物之间的同源序列的两对侧翼延长之间发生,导致一个较大的所述缺口已被修复的环状载体形成。提供所述插入物的侧翼同源的一个简单的方式是通过聚合酶链反应(PCR),其中尾随的引物提供所述同源区域。一方面,本发明提供的方法和组合物,所述宿主细胞接触一个单一连续的线性(有缺口的)核酸,所述线性核酸充当一个预重组载体中间体。本发明使用的短语“单一核酸”包括所述相同核酸分子分子的多重复制品的实例。在一些实施例,所述预重组载体是自我环化,并包含两个能够互相同源重组的特异性序列重组区域,如此引入预重组-感受态宿主细胞导致的结果是一个环状表达载体的形成。在一些实施例,所述重组区域定位在或接近所述线性预重组载体的终点(例如其中一个预重组区域与介于所述两个区域的另外的序列定位在所述线性载体的每个终点)、内部的终点(如每个预重组区域通过另外的序列位于两端的侧翼)、或其组合(如其中一个预重组是在所述线性载体的其中一个终点,另一个预重组是内部的另一个且通过另外的序列位于两边的侧翼)。在一些实施例,所述第一和第二重组区域可以包含任何足够长度的核苷酸序列,并共享任何允许互相同源重组的序列同一性。在一些实施例,“足够序列同一性”是指序列具有至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少99%,或至少100%的在重组区域之间的同一性,超过一个长度,譬如,至少15个碱基对,至少20个碱基对,至少50个碱基对,至少100个碱基对,至少250个碱基对,至少500个碱基对,或多于500个碱基对。序列同一性的程度可以使用任何计算机程序和相关参数来确定,包括那些本发明所述的,如BLAST2.2.2或FASTA版本3.0t78,与默认参数。对于重组区域之间,同源有效长度的讨论,参见Hastyetal.,MolCellBiol11:5586-91(1991)。在一些实施例,所述第一和第二重组区域共享至少25%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少30%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少35%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少40%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少45%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少50%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少60%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少65%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少70%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少75%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少80%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少85%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少90%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少95%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少99%核苷酸序列同一性。在一些实施例,所述第一和第二重组区域共享至少100%核苷酸序列同一性。在一些实施例,每个所述第一和第二重组区域由约50至5,000个核苷酸组成。在一些实施例,每个所述第一和第二重组区域包含约50至5,000个核苷酸。在一些实施例,每个所述第一和第二重组区域由约100至2,500个核苷酸组成。在一些实施例,每个所述第一和第二重组区域由约100至1,000个核苷酸组成。在一些实施例,每个所述第一和第二重组区域由约250至750个核苷酸组成。在一些实施例,每个所述第一和第二重组区域由约100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900或5,000个核苷酸组成。在一些实施例,每个所述第一和第二重组区域由约500个核苷酸组成。在一些实施例,每个所述第一和第二重组区域包含约18个核苷酸碱基对。在一些实施例,每个所述第一和第二重组区域由15至500个核苷酸碱基对组成。在一些实施例,每个所述第一和第二重组区域由15至500、15至495、15至490、15至485、15至480、15至475、15至470、15至465、15至460、15至455、15至450、15至445、15至440、15至435、15至430、15至425、15至420、15至415、15至410、15至405、15至400、15至395、15至390、15至385、15至380、15至375、15至370、15至365、15至360、15至355、15至350、15至345、15至340、15至335、15至330、15至325、15至320、15至315、15至310、15至305、15至300、15至295、15至290、15至285、15至280、15至275、15至270、15至265、15至260、15至255、15至250、15至245、15至240、15至235、15至230、15至225、15至220、15至215、15至210、15至205、15至200、15至195、15至190、15至185、15至180、15至175、15至170、15至165、15至160、15至155、15至150、15至145、15至140、15至135、15至130、15至125、15至120、15至115、15至110、15至105、15至100、15至95、15至90、15至85、15至80、15至75、15至70、15至65、15至60、15至55、15至50、15至45、15至40、15至35、15至30、15至25、或15至20个核苷酸碱基对组成。在一些实施例,每个所述第一和第二重组区域由15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、9596、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199或200个核苷酸碱基对组成。在一些优选实施例,本发明所述的方法和组合物,同源区域对的每个同源区域包含足够长度的核苷酸序列和序列同一性,所述序列同一性允许互相同源重组,但不与其他参与聚集的所述预重组分子的区域同源重组,也不与任何所述宿主细胞的基因组区域同源重组。在一些实施例,所述环状表达载体是由一个单一的自我环化的预重组分子构成,在其他实施例,所述环状表达载体是由HR-介导的两个或多个线性预重组分子的聚集而形成。譬如,一个环状体可以从两个线性预重组分子聚集,其中所述第一个分子为一个有缺口的载体,第二个分子为一个含有两个独立同源区域的插入物,所述两个独立同源区域能够与两个在所述有缺口载体上的同源区域重组。对于每个有缺口的线性载体和所述线性插入物,所述重组区域可以被定位在或接近所述线性预重组载体的终点(例如,其中一个预重组区域与介于所述两个区域的另外的序列被定位在所述线性载体的每个终点)、内部的终点(如每个预重组区域通过另外的序列位于两端的侧翼)、或其组合(如其中一个预重组是在所述线性载体的其中一个终点,另一个预重组是内部的另一个且通过另外的序列位于两边的侧翼)。在其他一些实施例,所述修复有缺口载体的插入物可以从至少两个含有彼此同源区域的线性核酸自我聚集。例如,所述环状载体可以由三个不同的线性预重组片段构成,其中所述第一个线性分子包含同源区域A1和B1,所述第二个线性分子包含B2和C2,和第三个线性分子包含C3和A3,如此在HR感受态宿主细胞内,每个片段的同源区域之间的重组(即A1与A3,B1与B2,和C2与C3)导致的结果是一个含有区域A→B→C的环状表达载体的形成。在其他实施例,所述环状载体在HR感受态宿主细胞内,从至少4、5、6、7、8、9或10个不同线性预重组片段进行聚集,以此类推。若不受理论操作的限制,据认为需要所述环状表达载体从多于两个选择用于尤其擅长同源重组的宿主细胞的线性预重组分子进行聚集。因此,所述环状表达载体从多个预重组分子的聚集可以是优选的,当需要高阶整合事件时,例如,多重基因组整合(如2个或多个供体外源性DNAs),或当执行基因组整合到一个细胞类型,所述细胞类型已知或怀疑具有非常低比率的HR。在其中一个实施例,对于将三个外源性供体核酸多重(同时的)整合到宿主细胞三个分别的基因组靶位点中,所述宿主细胞“被迫”聚集至少三个线性预重组片段,从而形成所述环状表达载体。仅可以成功重组所述三个片段从而形成表达选择标记的所述环状载体的细胞可以在所述选择中存活,即被选中,且所述这些细胞将更有可能成功地将每个所述三个外源性供体核酸整合到其分别的基因组靶位点中。在一些实施例,当需要将至少2、3、4、5、6、7、8、9、10或大于10个外源性供体核酸多重整合到至少2、3、4、5、6、7、8、9、10或大于10个分别的基因组靶位点中,所述宿主细胞被迫聚集,即重组至少2、3、4、5、6、7、8、9、10或大于10个预重组片段从而形成所述环状表达载体,选择标记从此在所述宿主细胞内进行表达。在一些实施例,至少2、3、4、5、6、7、8、9、10或大于10个预重组片段的所述体内聚集形成了一个含有用于多于一个选择标记(如两个、三个、或多于三个不同的选择标记)的编码序列的环状表达载体。在优选实施例,所述环状表达载体一旦聚集,则包含一个选择标记的编码序列,以及合适的调控序列如启动子和/或终止子,其能够表达所述宿主细胞内的标记。选择标记包括那些两者均能够选择含有选择标记的宿主细胞,而其他实例能够选择不包含所述选择标记的细胞,其被发现用于所述实例,其中需要在选择之后消除所述环状表达载体(见如下讨论)。在一些实施例,在所述环状表达载体聚集之前,所述线性预重组分子,或至少多个片段聚集的所述预重组片段中的一个,包含一个所述选择标记的完整编码序列,与其调控序列可操作地连接,并与涉及所述HR-介导的聚集的所述同源区域分离。从而,所述环状表达载体的聚集并未改变所述选择标记的编码序列,也未改变任何其需用于表达的调控序列。在一些此类实施例,所述环化事件能够使所述标记的编码序列传播,并从所述标记的编码序列持续表达,然而,非环化线性载体在所述宿主细胞内不能进行传播和/或维持。在优选实施例,在本发明所述的方法中,不包含环状表达载体的宿主细胞不能在选择步骤中存活和/或未被选中。若不受操作理论的限制,据认为需要所述宿主细胞通过HR来环化所述表达载体,以便根据本发明所述的方法而被选中,提高所述选定的细胞也已成功完成了所述一个或多个目标HR-介导的基因组整合外源性DNA的可能性。在其他实施例,编码所述选择标记的序列,和/或其需用于表达的调控序列,是不完整的,即在任何单一的预重组分子上不是以可操作的连接。在一些此类实施例,仅当所述环状表达载体是所述标记编码序列,连同其调控因子,进入可操作的连接状态。因此,编码所述标记的序列,和或其必要的调控序列可以被分成任何数量的重叠的同源序列,所述重叠的同源序列是被分配在任何数量的参与所述聚集的片段中,只要所述组成预重组片段之间的HR导致所述选择标记的编码序列与其调控序列以可操作的连接进行重建。所述这些实例尤其用于避免选择在宿主细胞内形成环状表达载体的宿主细胞,所述环状表达载体是由于所述预重组片段通过非HR作用机理的连接所致,例如,非同源末端连接或单链退火处理;存活于所述选择的此类细胞将代表是假阳性的。这些有害事件的频率可以通过使用磷酸酯酶移除所述预重组片段上的5’-磷酸酯基团来降低,其为用于体外结扎术的标准方法。载体再连接通过使用TaqDNA聚合酶和dATP处理所述预重组片段同样可以避免;其已被报道在阻止载体体内再次环化方面是非常有效的,并促进真实的重组克隆筛选。参见Bessaetal.,Yeast29:419-423(2012)。此外,通过错误地引入预环化的DNA所引起的假阳性,是可以通过PCR而非通过线性化的环状载体来准备所述预重组片段从而避免,所述线性化的环状载体是通过核酸内切酶消化然后分离所述片段,其可以继续存在未消化的环状样板载体。然而,若不受操作理论的限制,据认为需要所述宿主细胞通过HR来重建所述标记编码序列,例如,从至少两个部分序列,以便在选择过程中存活,提高根据本发明所述方法选定的细胞还成功完成了所述一个或多个目标HR-介导的外源性DNA基因组整合的可能性。在一些本发明所述方法的实施例,所述环状表达载体,一旦聚集,则进一步包含一个本发明所述位点特异性核酸酶的编码序列,以及合适的调控序列如启动子和/或终止子,其能够表达所述宿主细胞内的所述核酸酶。在一些实施例,所述核酸酶是选自由CRISPR/Cas-相关的RNA-引导的核酸内切酶,大范围核酸酶,锌指核酸酶,TAL-效应因子DNA结合结构域-核酸酶融合蛋白(TALEN),转座酶,和位点特异性重组酶组成的组。在一些实施例,所述核酸酶是CRISPR-相关的RNA-引导的核酸内切酶。在一些此类实施例,所述环状表达载体进一步包含一个序列或序列,所述序列可以编码一个RNA引导的核酸内切酶的必需的引导序列,例如,crRNA活性和tracrRNA活性,其通过所述RNA-引导的DNA核酸内切酶能够位点特异性识别和分裂所述基因组靶DNA。在一些实施例,所述crRNA活性和所述tracrRNA活性是从作为一个单一连续的RNA分子,即嵌合向导RNA(gRNA)分子的所述环状表达载体进行表达。在一些实施例,所述环状表达载体包含一个或多个序列,所述序列编码一个RNA-引导的核酸内切酶的向导序列(如gRNA),但并未包含所述核酸酶的编码序列。在一些此类实施例,一个或多个编码所述RNA-引导的核酸酶的序列可以在独立的载体上提供,并被整合到所述基因组,或所述核酸酶可以被引入所述细胞作为一个蛋白,如在体内进行表达和纯化。在任何上述实施例中,核酸酶编码序列,和/或其他需用于在所述宿主细胞内表达和可操作所述核酸酶的的序列,包括在所述环状表达载体内,在任何所述一个或多个参与所述聚集反应的预重组线性片段中,所述这些序列可以是完整的(即,以可操作的连接),或者可以被分成任何数量的重叠同源序列,所述重叠的同源序列是被分配在任何数量的参与所述聚集的片段中,只要所述组成预重组片段之间的HR导致所述核酸酶的编码序列与其调控序列以可操作的连接进行重建。有利地,使所述核酸酶的编码序列(和/或编码向导RNA序列的序列,其中所述核酸酶是一个RNA-引导的核酸酶)连接所述环状表达载体,确保了这些序列的表达维持在一个水平并且时间充分,从而辅助所述HR-介导的整合事件。根据本发明所述的方法,当在所述目标整合位点附近,结合引入一个靶向的基因组双链断裂(DSB),可以提高所述基因靶向的效率。参见如Jasin,M.,TrendsGenet12(6):224-228(1996);和Urnovetal.,Nature435(7042):646-651(2005)。并且使所述核酸酶的编码序列和/或相关的引导序列连接所述环状表达载体,来消除引入多个载体到所述宿主细胞以便影响这些序列的表达的需要。此外,此类连接允许同时消除所述核酸酶和所述标记的质粒,紧接着选择一个已经完成所需整合的宿主细胞。从而,不必要地延长所述核酸酶的表达是可避免的,且因此避免任何与此相关的毒性(参见如Choetal.,GenomeRes,“Analysisofoff-targeteffectsofCRISPR/Cas-derivedRNA-guidedendonucleasesandnickases,”(2013);Sanderetal.,“Insilicoabstractionofzincfingernucleasecleavageprofilesrevealsanexpandedlandscapeofoff-targetsites,”NucleicAcidsResearch41(19):e181(2013))。在一些本发明所述方法的实施例中,所述环状表达载体,一旦聚集,则进一步包含一个或多个外源性供体核酸,如下述5.2.2部分。在一些实施例,所述外源性供体核酸通过使外源性供体核酸与亦被引入所述宿主细胞的核酸酶的识别序列侧面相接,可以从所述环状表达载体释放,譬如,一个亦被所述环状表达载体编码的核酸酶。本领域技术人员将清楚,所述环状表达载体将优选包含一个自主传播序列,其能够使所述表达载体在多轮宿主细胞分裂期间被复制、传播、和分离。所述自主传播序列可以是原核的或真核的,并包括一个复制起源。复制起源是独特的多核苷酸,所述多核苷酸包含多个重复短序列,所述重复短序列通过多聚体的起源-结合蛋白从而被识别,并在所述起源位点聚集DNA复制酶中起到了关键作用。本发明所述合适的用于进入和聚集载体的复制起源包括但不限于大肠杆菌孢子,colE1质粒起源,2和ARS(两者均用于酵母体系),sfl,SV40EBVoriP(用于哺乳动物系统),或那些在pSC101中发现的复制起源。表达载体优选的实例包括原核的和真核的自主传播序列。在任何所述一个或多个参与所述聚集反应的预重组线性片段中,所述序列可以是完整的(即,以可操作的连接),或者可以被分成任何数量的重叠同源序列,所述重叠的同源序列是被分配在任何数量的参与所述聚集的片段中,只要所述组成预重组片段之间的HR导致所述自主传播序列进行重建。尤其在一些实施例,所述自主传播序列是不完整的,即在任何单一的预重组分子上不是以可操作的连接。在一些此类实施例中,仅当通过重组所述预重组分子环化所述表达载体时,是使所述自主传播序列进入可操作的连接状态。所述这些实例特别用于避免选择在其内形成环状表达载体的宿主细胞,所述环状表达载体是由于所述预重组片段的非HR-连接所致,所述预重组片段包含一个完整的自主传播序列,譬如,通过非同源末端连接或单链退火处理;在所述选择中存活的此类细胞将代表假阳性。本领域技术人员将清楚,本发明所述一个或多个线性预重组DNA片段之间的所述体内重组将导致所述宿主细胞内环状表达载体的形成,也可以与含有作为起点的所述合适(如相同)同源区域的环状预重组核酸一起实现。对于本发明所述的任何预重组组合物,所述组合物可以直接被转化为宿主细胞作为线性核酸分子,或者,亲本的含有所述预重组分子的环状分子可以被引入到所述宿主细胞,并在体内通过一个或多个核酸酶进行分裂,从而解放所述预重组分子。在一些实施例,所述一个或多个参与所述标记载体聚集的线性预重组分子,可以通过所述一个或多个核酸酶靶向作用所述一个或多个分裂的基因组靶位点,并经由所述宿主细胞内的体内分裂,从一个亲本的环状质粒中解放。另一方面,本发明所提供的方法,关于制造预重组表达载体中间体,并用于本发明所述整合方法的实践。在一些实施例,一个含有自主传播序列的碱基载体,第一个结合序列的引物,和第二个结合序列的引物,通过使用至少第一个引物和第二个引物来进行扩增。所述第一个引物通常包含具有一个第一个序列-特异性重组序列的5'部分和具有一个对所述碱基载体的第一个结合序列的引物充分互补(即具有充分互补性,从而能够扩增所述的核酸而非其他不希望的分子)的启动部分的3'部分。同理,所述第二个引物包含具有一个第二个序列-特异性重组序列的5'部分和具有一个对所述碱基载体的第二个结合序列的引物充分互补的启动部分的3'部分。扩增所述碱基载体(在所述扩增过程开始之前,其可以是线性或环状的)导致的结果是线性表达载体中间体的生产,其中所述线性表达载体中间体具有包含第一个序列-特异性重组区域的第一个终点和包含第二个序列-特异性重组区域的第二个终点。在一些实施例,所述碱基载体是一个质粒,优选的质粒如本领域已知的基于各种细菌-或酵母-衍生的染色体外的元素。在一些其他实施例,所述碱基载体进一步包含一个或多个选择标记、转录起始序列、和/或转录终止序列。本领域技术人员将领会,意图调节目标核酸所携带的基因表达的元素应该被定位在所述表达载体,以便功能上地或可操作地与所述被表达的基因相关联,一旦所述环状表达载体在体内聚集。所述此类元素的特殊定位取决于那些被使用的元素、宿主细胞、被表达的基因、和其他因素,包括宿主细胞内所需整合的数量,如上所述。结果,根据即时的教导制造的特殊表达载体的最终设计,其问题的关键是抉择并取决于具体应用。然而,其他方面关于根据前述方法进行制造的表达载体中间体,和含有相同表达载体的宿主细胞。还有另一方面涉及多个不同的表达载体中间体的制造方法,用于本发明所述整合方法的实践。在此类方法中,扩增碱基载体产生两个或多个表达载体中间体,其中每个具有独特的的序列-特异性重组区域,其允许与不同插入核酸进行同源重组。此类扩增反应优选在分开的反应混合物中进行,并产生不同的表达载体中间体。在更优选的实例中,这样一个高通量方法,其必需的操作是在一个自动化的方式下完成的,其中一个或多个步骤是通过一个电脑控制装置来完成的。在一些实施例,任何载体可以用于构建一个本发明所述的预重组分子。尤其,本领域已知的和那些通过商业途径可获得的载体(和其变体或衍生物)可以进行工程化,从而包括上述重组区域。此类载体可以从以下公司获得,例如VectorLaboratoriesInc.,InVitrogen,Promega,Novagen,NEB,Clontech,BoehringerMannheim,Pharmacia,EpiCenter,OriGenesTechnologiesInc.,Stratagene,PerkinElmer,Pharmingen,LifeTechnologiesInc.,和ResearchGenetics。尤其一些通用类目的载体包括原核的和/真核的克隆载体,表达载体,融合载体,双杂交或反向双杂交载体,用于不同宿主的穿梭载体,突变形成载体,转录载体,接收大的插入物载体等。其他目的载体包括病毒性起源载体(M13载体,细菌噬菌体λ载体,腺病毒载体,腺病毒群载体(AAV),和逆转录病毒载体),高、低和可调节的复制数载体,具有用于结合一个单一宿主的可兼容复制子的载体(PACYC184和pBR322),和真核游离复制载体(pCDM8)。在其他实施例,一个预重组分子可以通过本领域已知的标准程序从克隆DNA(如DNA“文库”)得到,通过化学合成,通过cDNA克隆,或通过克隆基因组DNA或其片段,从所需的细胞中进行纯化,或通过PCR扩增和克隆来得到。参见,例如Sambrooketal.,MolecularCloning,ALaboratoryManual,3d.ed.,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork(2001);Glover,D.M.(ed.),DNACloning:APracticalApproach,2d.ed.,MRLPress,Ltd.,Oxford,U.K.(1995)。5.2.1.1选择标记在优选实施例,所述环状表达载体,一旦聚集,则包含一个选择标记的编码序列,以及合适的调控序列如能够在所述宿主细胞内表达所述标记的启动子和/或终止子。有用的选择标记包括那些能在阳性和阴性选择体系中运行的选择标记。在一些实施例,所需细胞的选择是基于选择通过所述选择标记编码的抗药性(FIG.3B)。阳性选择体系是能够促进转化细胞生长的那些。他们可以被分成有条件的阳性或无条件的阳性选择体系。一个有条件的阳性选择体系是由一个蛋白的基因编码组成,通常可以抵抗一个特定底物的酶,所述特定底物对未转化细胞是有毒的,或所述特定底物激励所述转化细胞的生长和/或分化。在有条件的阳性选择体系中,所述底物可以几种方法中的一个行事。其可以是抗生素、除草剂、药物或代谢类似物、或碳供应前体。在不同情况下,所述酶的基因编码与特异性底物,一起激励所述转化细胞的选择性生长和增殖。所述底物对所述未转化的细胞是有毒的或无毒的。可通过抑制蛋白合成赋予卡那霉素抗药性的nptII基因,是对未转化细胞有毒的体系的经典实例。编码用于磷酸甘露糖的manA基因,是一个有条件的阳性选择体系的实例,其中所述选择底物是无毒的。在此体系中,所述底物甘露糖对于未转化的细胞不能充当一个碳源,但其将促进用manA转化的细胞的生长。无条件的阳性选择体系不需要外部的底物但仍然促进所述转化细胞的选择性生长和分化。在植物中的一个实例是ipt基因,其通过内源性修饰所述植物激素水平从而提高发芽的发展。阴性选择体系引起转化细胞的死亡。这些显性选择标记体系可以被描述为有条件的和无条件的选择体系。当所述选择体系不是底物依赖时,则是无条件的阴性选择体系。一个实例是关于毒性蛋白的表达,例如一个核糖核酸酶切除特定的细胞类型。当所述毒性基因的作用需要一个底物来表达毒性时,所述体系是有条件的阴性选择体系。所述这些包括编码胞嘧啶脱氨酶的细菌codA基因,细菌细胞色素P450单一氧合酶基因,细菌的卤代烷脱卤素酶基因,或拟南芥乙醇脱氢酶基因。所述这些基因中的每个将非毒性剂转化为毒性剂,并导致所述转化细胞的死亡。所述Coda基因也被证明是一个有效的叶绿体转化的显性阴性选择标记。土壤杆菌属aux2和tms2基因也对其可用于阳性选择体系感兴趣。阳性-阴性选择体系的组合尤其可用于本发明所提供的整合方法,如同阳性选择可用于细胞富集,所述细胞已成功重组所述环状表达载体(假定,已完成一个或多个目标HR-介导的基因组整合),和阴性选择可用于从相同细胞群消除(“治疗”)所述表达载体,一旦所需基因组整合已被确证。本领域已知有很多选择标记(参见如Kaufinan,Meth.Enzymol.,185:487(1990);Kaufman,Meth.Enzymol.,185:537(1990);SrivastavaandSchlessinger,Gene,103:53(1991);Romanosetal.,inDNACloning2:ExpressionSystems,2ndEdition,pages123-167(IRLPress1995);Markie,MethodsMol.Biol.,54:359(1996);Pfeiferetal.,Gene,188:183(1997);TuckerandBurke,Gene,199:25(1997);Hashida-Okadoetal.,FEBSLetters,425:117(1998))。在一些实施例,所述选择标记是一种抗药性标记。抗药性标记能够使细胞对一个外源性药物解毒,否则将杀死所述细胞。抗药性标记的例证性实例包括但不限于那些能够抵抗抗生素如氨苄青霉素、四环素、卡那霉素、争光霉素、链霉素、潮霉素、新霉素、博莱霉素等的抗药性标记。其他选择标记包括博莱霉素抗性基因、金属硫蛋白基因、潮霉素B-磷酸转移酶基因、AURI基因、腺苷脱氨酶基因、氨基糖苷类磷酸转移酶基因、二氢叶酸还原酶基因、胸苷激酶基因、黄嘌呤-鸟嘌呤转磷酸核糖激酶基因等。pBR和pUC-衍生的质粒包含作为选择标记的细菌性抗药性标记AMPr或BLA基因(参见Sutcliffe,J.G.,etal.,Proc.Natl.Acad.Sci.U.S.A.75:3737(1978))。所述BLA基因编码酶Tem-1,其起到β-内酰胺酶的作用,并负责细菌性抵抗β-内酰胺抗生素,例如窄谱头孢菌素类、头霉素类、和碳青霉烯类(厄他培南)、头孢羟唑、和头孢哌酮、及所有除替莫西林外的抗革兰氏阴性菌的青霉素类。其他有用的选择标记包括但不限于:NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、鼠dhfr、HPH、DSDA、KANR、和SHBLE基因。所述诺尔丝菌素(S.noursei)的NAT1基因编码诺尔丝菌素N-乙酰转移酶,并能够抵抗诺尔丝菌素。来自绿色产色链霉菌(S.viridochromogenes)Tu94的PAT基因编码草丁膦N-乙酰转移酶,并能够抵抗草铵膦(bialophos)。来自酿酒酵母的AUR1-C基因能够抵抗AuerobasidinA(AbA),通过Auerobasidiumpullulans而产生的一种抗真菌抗生素(antifuncalantibiotic)其对芽殖酵母酿酒酵母是有毒的。所述PDR4基因能够抵抗浅蓝菌素。所述SMR1基因能够抵抗甲嘧磺隆。所述来自Tn9转位子的CAT编码序列能够抵抗氯霉素。所述鼠dhfr基因能够抵抗甲氨蝶呤。所述肺炎克雷伯菌(Klebsiellapneumonia)的HPH基因编码潮霉素B磷酸转移酶并能够抵抗潮霉素B。所述大肠杆菌的DSDA基因编码D-丝氨酸脱氨酶,并允许酵母与作为唯一氮源的D-丝氨酸一起在孔板上生长。所述Tn903转位子的KANR基因编码氨基糖苷类磷酸转移酶,并能够抵抗G418。所述来自印度斯坦链异壁菌(Streptoalloteichushindustanus)的SHBLE基因编码博莱霉素结合蛋白,并能够抵抗博莱霉素。在其他实施例,所述选择标记是一个营养缺陷型标记。当在缺乏所述主要成分的媒介中生长时,营养缺陷型标记允许细胞合成一个主要成分(通常为一个氨基酸)。可选的营养缺陷型基因包括,如hisD,其允许在组氨醇存在下,在组氨酸自由媒介中生长。在一些实施例,所述选择标记在所述宿主菌株内补救一个营养的营养缺陷型。在此类实施例中,所述宿主菌株包含一个在一个或多个所述宿主的氨基酸生物合成途径的基因中的功能破坏,所述宿主可引起营养缺陷型表型,譬如,HIS3、LEU2、LYS1、MET15、和TRP1,或一个在一个或多个所述宿主的核苷生物合成途径的基因中的功能破坏,所述宿主可引起营养缺陷型表型,譬如,ADE2和URA3。尤其在一些实施例,所述宿主细胞包含一个在所述URA3基因中的功能破坏。所述在宿主细胞内引起营养缺陷型表型的功能破坏可以是一个点突变,一个部分或完整的基因缺失,或一个附加的或替代的核苷酸。所述氨基酸或核苷酸生物合成途径内的功能破坏导致所述宿主菌株变成营养缺陷型突变体,相对于原养型的野生型细胞,在未补充一个或多个营养素的情况下,其不能在媒介中以最佳状态生长。所述宿主菌株内功能破坏的生物合成基因,其后可以充当可以随后被补救的营养缺陷型基因标记,例如,根据引入一个或多个含有一个所述破坏的生物合成基因的功能复制品的质粒。在酵母中,利用所述URA3、TRP1、和LYS2基因作为选择标记具有显著优势,因阳性和阴性选择是可能的。阳性选择通过所述URA3、TRP1、和LYS2突变的营养缺陷型互补作用来执行,然而阴性选择是分别基于特定抑制剂5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和a-氨基脂肪酸(aAA),来阻止所述原养型菌株的生长,但分别允许所述URA3、TRP1、和LYS2突变体的生长。所述URA3基因编码乳清苷-5’磷酸酯脱羧酶,即一种需要用于尿嘧啶的生物合成的酶。Ura3-(或ura5-)细胞可以在含有FOA的媒介中被选定,其可以杀死所有URA3+细胞,但不能杀死ura3-细胞,因FOA出现并通过脱羧酶作用被转化为毒性化合物5-氟尿嘧啶。所述在FOA媒介中的阴性选择被高度识别,通常少于10-2FOA-抵抗菌落是Ura+。所述FOA选择程序在单倍体菌株中通过突变可以用于生产ura3标记,并且,更重要的是,用于选择那些没有包含URA3质粒的细胞。所述TRP1基因编码一个磷酸核糖的邻氨基苯甲酸酯异构酶,所述异构酶可以催化色氨酸生物合成中的第三个步骤。使用5-氟邻氨基苯甲酸的反选择,通过所述菌株涉及代谢拮抗作用,其中所述菌株缺乏需用于邻氨基苯甲酸转化为色氨酸的酶,并因此抵抗5-氟邻氨基苯甲酸。所述LYS2基因编码氨基乙二酸还原酶,即一种需用于赖氨酸生物合成的酶。Lys2-和lys5-突变体,但非正常菌株,在缺乏正常氮源但含有赖氨酸和aAA的媒介中生长。显然,lys2和lys5突变引起了一个赖氨酸生物合成的毒性中间体的积聚,所述赖氨酸生物合成是通过高阶aAA形成,但所述这些突变体仍然可以使用aAA作为氮源。类似于所述FOA选择程序,含有LYS2的质粒可以便利地从lys2宿主中排出。在其他实施例,所述选择标记是一个标记除了其中一个补救营养缺陷型突变。对于任何本发明所述的方法和组合物,报告基因,如lacZ报告基因用于促进蓝色/白色转化菌落的选择,或荧光蛋白如绿色、红色和黄色荧光蛋白,可以用作选择标记基因来帮助HR-感受态宿主细胞的选择,所述HR-感受态宿主细胞能够从一个或多个预重组片段中成功聚集所述环状表达载体(见图.3A)。在这些实施例中,并非在含有选择性化合物如抗生素的媒介中生长所述转化细胞,所述细胞在足够条件下生长,并允许所述报告子的表达,选择可以通过视觉、比色或所述报告子的荧光检测来完成。所述宿主细胞的无药物和无选择性压力的细胞维持可以提供许多优势。譬如,选择性药物和其他选择性压力因素是经常致突变的,否则会干预所述细胞的生理机能,并导致在基于细胞的试验中得到曲解的结果。譬如,选择性药物可以减少对细胞凋亡的敏感性(Robinsonetal.,Biochemistry,36(37):11169-11178(1997)),增加DNA修复和药物代谢(Deffieetal.,CancerRes.48(13):3595-3602(1988)),增加细胞pH值(Thiebautetal.,JHistochemCytochem.38(5):685-690(1990);Roepeetal.,Biochemistry.32(41):11042-11056(1993);Simonetal.,ProcNatlAcadSciUSA.91(3):1128-1132(1994)),降低溶酶体和胞内pH值(Schindleretal.,Biochemistry.35(9):2811-2817(1996);Altanetal.,JExpMed.187(10):1583-1598(1998)),降低质膜电位(Roepeetal.,Biochemistry.32(41):11042-11056(1993)),增加对氯离子的质膜电导(Gilletal.,Cell.71(1):23-32(1992))和ATP(Abrahametal.,ProcNatlAcadSciUSA.90(1):312-316(1993)),和增加囊泡运输的比率(Altanetal.,ProcNatlAcadSciUSA.96(8):4432-4437(1999))。因此,本发明所提供的方法可以与无药物选择一起实行,所述无药物选择允许筛选免受通过选择性压力引起的人工产品的影响。流仪细胞分选仪可以用来分离用于荧光标记或蛋白(如抗体)表达的细胞阳性,所述荧光标记或蛋白与荧光团耦合,并对所述标记蛋白具有亲和力。在一些实施例,多次分选可以实现。在其中一个实施例,所述流仪细胞分选仪是FACS机器。其他荧光板分析仪,包括那些与高通量筛选相匹配的荧光板分析仪也可以被应用。MACS(磁珠细胞分选法)亦可以被用于,如选择与磁珠耦合、并对所述标记蛋白具有亲和力的蛋白的宿主细胞。其特别用于所述选择标记编码,譬如膜蛋白、跨膜蛋白、膜锚定蛋白、细胞表面抗原、或细胞表面受体(如细胞因子受体、免疫球蛋白受体家族成员、配体依赖性离子通道、蛋白激酶受体、G-蛋白偶联受体(GPCR)、细胞核激素受体、和其他受体;CD14(单核细胞)、CD56(自然杀伤细胞)、CD335(NKp46,自然杀伤细胞)、CD4(辅助型T细胞)、CD8(细胞毒性T细胞)、CD1c(BDCA-1,血树突状细胞亚群)、CD303(BDCA-2)、CD304(BDCA-4、血树突状细胞亚群)、NKp80(自然杀伤细胞,γ/δT细胞,效应因子/记忆性T细胞)、“6B11”(Va24/Vb11;不变的自然杀伤T细胞)、CD137(激活的T细胞)、CD25(调节T细胞)或耗尽CD138(浆细胞)、CD4、CD8、CD19、CD25、CD45RA、CD45RO)。从而,在一些实施例,所述选择标记包含一个显示在所述宿主细胞表面的蛋白,其可以采用一个抗体而被容易地检测到,例如连接一个荧光团或一个比色的或其他视觉读出器。5.2.1.2细胞培养在一些本发明所述方法的实施例中,将与一个或多个预重组片段进行转化的宿主细胞培养一段足够的时间,并用于从所述环状表达载体表达所述选择标记。在一些实施例,其中所述选择标记是一个抗药性标记,将其实施培养一段足够的时间从而产生相当数量的标记蛋白,其可以支持在可选的媒介中表达所述标记细胞的存活。在优选实施例,所述这些条件还可以选择对不表达所述选择标记细胞的存活。选择性压力可以通过使用各种本领域技术人员已知的化合物或处理应用于细胞。若不受理论限制,选择性压力可以通过使宿主细胞暴露在次优的或有害的生长、细胞周期进展或生存能力的条件下而被应用,如此,相较于不能能耐受或抵抗所述这些条件的细胞,而能耐受或抵抗所述这些条件的细胞则被选择。可用于发挥或适用选择性压力的条件包括但不限于,抗生素、药物、突变剂、能减缓或停止细胞生长或生物构建模块合成的化合物、或能破坏RNA、DNA或蛋白合成的化合物、剥夺或限制的营养素、氨基酸、碳水化合物、或来自细胞生长或培养基中细胞生长和生存所需的化合物、处理例如在次优的细胞生长条件下,细胞的生长或维持,如在次优的温度、大气氛条件下(如%二氧化碳、氧或氮或湿度)或在剥夺媒介条件下。使用的选择压力的水平可由本领域技术人员决定。譬如,可以做到这一点,通过完成一个杀死曲线实验,其中对照细胞和含有抗性标记或基因的细胞均随着提高水平、剂量、浓度或所述选择性压力的处理而进行测试,其范围选择对所述阴性细胞仅或优先在所需时间范围内(例如,从1至24小时,1至3天,3至5天,4至7天,5至14天,1至3星期,2至6星期)。确切的水平、浓度、剂量、或可以使用的选择性压力的处理取决于所使用的细胞,他们自己所需的性能,所述能够抵抗或耐受所述选择性压力的标记、因素或基因,以及所述选定细胞内所需性能的水平,并且本领域技术人员会容易领会,基于这些考虑将如何确定适当的范围。所述培养可以在一个适宜容器中的适宜培养基中完成,包括但不限于细胞培养皿、烧瓶、或发酵罐。在一些实施例,所述培养基是一个含有可吸收的碳、氮和磷酸盐源的水媒介。此类媒介还可以包括适宜的盐、金属和其他营养素。在一些实施例,除了选择剂,所述适用的媒介还可以增补一个或多个附加剂,譬如,诱导剂(譬如当一个或多个核苷酸序列编码一个基因产品是在诱导型启动子的控制下进行的),阻抑剂(如当一个或多个核苷酸序列编码一个基因产品是在可抑制的启动子的控制下进行的)。用于细胞培养维护和生长的物料和方法是本领域技术人员周知的,如微生物学或发酵科学(参见如Baileyetal.,BiochemicalEngineeringFundamentals,secondedition,McGrawHill,NewYork,1986)。必须考虑合适的培养基、pH值、温度、和对于需氧的、微需氧的、或缺氧情况的需求,其取决于所述宿主细胞、发酵和所述方法的具体需求。在一些实施例,对所述转化的细胞群培养一段足够的时间,从而经历多个倍增直到达到所需细胞密度。在一些实施例,对所述宿主细胞群培养一段足够的时间,从而在进行细胞培养的发酵器皿或容器中达到细胞密度(OD600)在0.01和400之间。在一些实施例,进行培养直到达到OD600至少为0.01。在一些实施例,进行培养直到达到OD600至少为0.1。在一些实施例,进行培养直到达到OD600至少为1.0。在一些实施例,进行培养直到达到OD600至少为10。在一些实施例,进行培养直到达到OD600至少为100。在一些实施例,进行培养直到达到OD600在0.01和100之间。在一些实施例,进行培养直到达到OD600在0.1和10之间。在一些实施例,进行培养直到达到OD600在1和100之间。在其他实施例,进行培养至少为12小时、24小时、36小时、48小时、60小时、72小时、84小时、96小时或多于96小时的一段时间。在一些实施例,进行培养为3天和20天之间的一段时间。在一些实施例,进行培养为1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天或多于20天的一段时间。在一些本发明所述方法的实施例中,所述方法进一步包括消除所述环状表达载体的步骤,即质粒,来自所述宿主细胞,例如,一旦一个选定的宿主细胞已被确定为包含所需基因组整合。基于质粒的体系通常在所述质粒上需要选择性压力来维持所述细胞内的外源DNA。譬如,大多酵母中的质粒均相对不稳定,因此每次有丝分裂之后,一个酵母细胞通常会失去10%的包含在所述细胞内的质粒。从而,在一些实施例,消除编码来自一个选定细胞的选择标记的质粒,可以通过允许所述选定细胞经历充分的有丝分裂来实现,如此所述质粒可以有效地稀释所述细胞群。或者,无质粒的细胞可以通过选择缺失质粒而被选中,如通过选择对一个相反选择标记(譬如URA3)或通过在选择性培养基和非选择性培养基上均培植相同菌落,而后选择一个在所述选择性培养基上不生长而在所述非选择性培养基上生长的菌落。5.2.2外源性供体核酸有利地,一个整合的多核苷酸,即供体DNA,可帮助将一个或多个外源性核酸结构整合到一个选定的宿主细胞基因组靶位点中。在优选实施例,一个整合的多核苷酸包括一个外源性核酸(ES)x,所述外源性核酸(ES)x包含第一同源区域(HR1)x和第二同源区域(HR2)x,并且任选的一个目的核酸定位在(HR1)x和(HR2)x之间。在一些实施例,所述整合的多核苷酸是一个线性DNA分子。在其他实施例,所述整合的多核苷酸是一个环状DNA分子。在一些实施例,所述整合的多核苷酸是一个单链DNA分子,即寡核苷酸。在其他实施例,所述整合的多核苷酸是一个双链DNA分子。所述整合的多核苷酸可以通过任何对本领域技术人员而言显而易见的技术产生。在一些实施例,所述整合的多核苷酸使用聚合酶链反应(PCR)和本领域周知的分子克隆技术来产生。参见如PCRTechnology:PrinciplesandApplicationsforDNAAmplification,ed.HAErlich,StocktonPress,NewYork,N.Y.(1989);Sambrooketal.,2001,MolecularCloning–ALaboratoryManual,3rdedition,ColdSpringHarborLaboratory,ColdSpringHarbor,NY;PCRTechnology:PrinciplesandApplicationsforDNAAmplification,ed.HAErlich,StocktonPress,NewYork,N.Y.(1989);美国专利申请号US8,110,360。5.2.2.1基因组整合序列在优选实施例,一个整合的多核苷酸包含一个外源性核酸(ES)x,所述外源性核酸(ES)x包含第一同源区域(HR1)x和第二同源区域(HR2)x,其中(HR1)x和(HR2)x能够在所述宿主细胞基因组内选定的靶位点启动宿主细胞介导的同源重组。将一个外源性核酸通过同源重组整合到所述基因组,所述整合的多核苷酸优选包含在其中一个终点的(HR1)x和在另一个终点的(HR2)x。在一些实施例,(HR1)x与所述选定基因组靶位点(TS)x的5’区域是同源的,且(HR2)x与所述选定基因组靶位点(TS)x的3’区域是同源的。在一些实施例,(HR1)x与所述选定基因组靶位点(TS)x的5’区域是约70%、75%、80%、85%、90%、95%或100%同源。在一些实施例,(HR2)x与所述选定基因组靶位点(TS)x的3’区域是约70%、75%、80%、85%、90%、95%或100%同源。在一些实施例,(HR1)x是定位在目的核酸(D)x的5’区域。在一些实施例,(HR1)x是定位在非常邻近(D)x的5’区域末端。在一些实施例,(HR1)x是定位在(D)x的5’区域的上游。在一些实施例,(HR2)x是定位在目的核酸(D)x的3’区域。在一些实施例,(HR2)x是定位在非常邻近(D)x的3’区域末端。在一些实施例,(HR2)x是定位在(D)x的3’区域的下游。在一个特别的基因组位点,可以影响所述整合的多核苷酸整合的性能包括但不限于:所述基因组整合序列的长度,可割取的核酸结构的总长度,和基因组整合位点的所述核苷酸序列或位置。例如,在基因组整合序列的一个链和宿主细胞基因组内特别位点的一个链之间,有效的异源双链核酸分子的形成可以取决于所述基因组整合序列的长度。一个基因组整合序列长度的有效范围是50至5,000核苷酸。对于基因组整合序列和基因组位点之间同源的有效长度的探讨,参见Hastyetal.,MolCellBiol11:5586-91(1991)。在一些实施例,(HR1)x和(HR2)x可以包含任何足够长度的核苷酸序列和序列同一性,所述序列同一性在任何酵母基因组位点,允许所述外源性核酸(ES)x的基因组整合。在一些实施例,各(HR1)x和(HR2)x独立地由约50至5,000个核苷酸组成。在一些实施例,各(HR1)x和(HR2)x独立地由约100至2,500个核苷酸组成。在一些实施例,各(HR1)x和(HR2)x独立地由约100至1,000个核苷酸组成。在一些实施例,各(HR1)x和(HR2)x独立地由约250至750个核苷酸组成。在一些实施例,各(HR1)x和(HR2)x独立地由约100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900或5,000个核苷酸组成。在一些实施例,各(HR1)x和(HR2)x独立地由约500个核苷酸组成。5.2.2.2目的核酸在一些实施例,所述整合的多核苷酸进一步包含一个目的核酸(D)x。所述目的核酸可以是任何本领域技术人员认为有用的DNA片段。譬如,所述DNA片段可以包含一个可被“敲入”宿主细胞基因组的目的基因。在其他实施例,所述DNA片段起“敲掉”结构的作用,根据将所述结构整合到所述宿主细胞基因组的靶位点中,所述结构能够特异性破坏靶基因,从而致使所述破坏的基因无功能。有用的目的核酸(D)x的实例包括但不限于:蛋白编码序列,报告基因,荧光标记编码序列,启动子,增强子,终止子,转录激活因子,转录抑制子,转录激活因子结合位点,转录抑制子结合位点,内含子,外显子,多聚腺苷酸尾,多克隆位点,核定位信号,mRNA稳定信号,整合位点,表位标记编码序列,退化信号,或任何其他天然存在或合成的DNA分子。在一些实施例,(D)x可以是自然起源的。或者,(D)x可以是完全合成的起源,并在体内产生。此外,(D)x可以包含任何分离的天然存在DNA分子的组合,或任何分离的天然存在DNA分子和合成DNA分子的组合。譬如,(D)x可以包含一个与蛋白编码序列可操作地连接的异源启动子,一个与多聚腺苷酸尾连接的蛋白编码序列,一个与表位标记编码序列框内连接的蛋白编码序列,等等。所述目的核酸(D)x可以通过以下途径获得:通过来自克隆DNA(如DNA“文库”)的本领域周知的标准程序,通过化学合成,通过cDNA克隆,通过基因组DNA或其片段克隆,从所需的细胞中纯化,或通过PCR扩增和克隆。参见如Sambrooketal.,MolecularCloning,ALaboratoryManual,3d.ed.,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork(2001);Glover,D.M.(ed.),DNACloning:APracticalApproach,2d.ed.,MRLPress,Ltd.,Oxford,U.K.(1995)。尤其在一些实施例,所述目的核酸(D)x不包括编码选择标记的核酸。在这些实施例,本发明所述方法提供的高效率整合允许整合事件的识别和筛选,无需转化细胞在选择媒介中生长。然而,在其他实施例,在选择媒介中的生长仍然是需要的,所述目的核酸(D)x可以包含一个选择标记,所述选择标记可以用于选择将所述外源性核酸整合到宿主基因组中。所述目的核酸(D)x可以是任何大小,包括尺寸范围从约300个核苷酸直到约1百万个核苷酸碱基对。此类目的核酸可以包括一个或多个基因和/或其相关的调控区域。这些目的核酸可以衍生自任何来源,譬如,来自基因组来源或来自cDNA文库,包括特定组织、标准化的和减去的cDNA文库。基因组来源包括各种生物体的基因组(或其片段),包括病原生物体如病毒(如HIV和肝炎病毒)和细胞病原体。此外,目的核酸可以从任何生物体获得,包括任何植物或任何动物,他们是真核的或原核的。在一些实施例,目的核酸编码一个基因,所述基因为一个疾病相关基因,即存在、不存在、表达、缺乏表达、改变水平的表达、或与疾病相关或引起疾病的存在的改变形式。在一些实施例,所述目的核酸编码一个宿主细胞靶向等位基因的点突变,其可用于引入错义的SNP(即“等位基因交换”)到所述靶向等位基因。在一些此类实施例中,等位交换的核酸酶(如CRISPR/Cas9和gRNA)靶位点的选择相较于删除或整合到ORF中有更多的限制。在优选实施例,所述核酸酶分裂位点应该在所述基因组中是唯一的,且应该尽可能接近于所述靶向核苷酸,如此重组将合并所述突变体序列,而非仅仅所述供体DNA侧翼的序列。原因在于重组修复切口位点无需合并所需SNP,且其包含的可能性预计将减少与所述切口位点的距离。此外,对于最佳效率,所述供体DNA应该如此设计,其不是所述核酸酶(如CRISPR/Cas9和gRNA)的目标。因此,为了使所述供体DNA免受切口的感染,并同时提高重组事件包括所需SNP的机会,一个异源块的方法可以被利用,凭借沉默突变是在所述靶位点和所述点突变之间的密码子内制造的,减少潜在的重组事件将忽略所需的SNP。供体DNAs可以与围绕一个中心“异源块”的侧翼同源一起设计。所述异源块将沉默突变引入围绕所述核酸酶靶位点的序列中,并服务于几个目的。首先,其移除关键用于核酸酶(如CRISPR-Cas9)识别的碱基,如此所述供体DNA将不被切割。此外,所述异源块的整合提供了一个新的引物结合位点,从而通过PCR来识别候选克隆。图.15提供了一个CRISPR/Cas9-介导的在“异源块”情况下引入点突变的原理图。一个靶向氨基酸是盒装的,且邻近的分裂位点是采用分裂位点和PAM序列来注释的(顶板)。一个含有所需点突变的供体DNA在沉默密码子的异源块背景下改变,并且侧翼同源可以通过退火处理和延长60-mer寡核苷酸(中板)或与更大克隆结构合成产生。所述供体DNA的整合产生所需的点突变(底板)。5.2.3核酸酶在一些本发明所述方法的实施例中,宿主细胞基因组接触一个或多个能够分裂的核酸酶,即在选定的靶位点内的指定区域引起断裂。在一些实施例,所述断裂是单链断裂,即所述靶位点的其中一个但并非两个DNA链分裂(即“带切口的”)。在一些实施例,所述断裂是双链断裂。在一些实施例,断裂诱导剂是任何可识别和/或结合特异性多核苷酸识别序列的药剂,从而在或接近于所述识别序列产生断裂。断裂诱导剂的实例包括但不限于,核酸内切酶类,位点特异性重组酶类,转座酶类,和锌指核酸酶类,以及包括其修饰的衍生物、变体、和片段。在一些实施例,所述一个或多个核酸酶的每一个均能够在选定靶位点(TS)x内的指定区域引起断裂。在一些实施例,所述核酸酶能够在位于所述(TS)x的5’和3’区域之间的,分别与(HR1)x和(HR2)x共享同源的区域引起断裂。在其他实施例,所述核酸酶能够在位于所述(TS)x的5’和3’区域的上游或下游区域引起断裂。识别序列是任何多核苷酸序列,所述多核苷酸序列可以通过断裂诱导剂进行特异性识别和/或结合。所述识别位点序列的长度可以改变,并包括如具有至少10、12、14、16、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70个或更多核苷酸长度的序列。在一些实施例,所述识别序列是回文的,即在一条链上的所述序列,在互补链上的相反方向读取相同的序列。在一些实施例,所述缺口/分裂位点是在所述识别序列内。在其他实施例,所述缺口/分裂位点是在所述识别序列外面。在一些实施例,分裂产生钝端终点。在其他实施例,分裂产生单链悬臂结构,即“粘性末端”,其可以是5'悬臂结构或3'悬臂结构。在一些实施例,所述选定的靶位点内的识别序列对于所述宿主细胞基因组可以是内源性或外源性的。当所述识别位点是一个内源性序列,其可以是一个通过天然存在或原生断裂诱导剂来识别的识别序列。或者,一个内源性识别位点可以通过一个设计或选择用于特异性识别所述内源性识别序列的修饰的或工程化的断裂诱导剂,来进行识别和/或结合,从而产生断裂。在一些实施例,所述修饰的断裂诱导剂是衍生自一个原生的、天然存在的断裂诱导剂。在其他实施例,所述修饰的断裂诱导剂是人工创造或合成的。用于选择此类修饰的或工程化断裂诱导剂的方法是本领域周知的。譬如,蛋白的氨基酸序列变体可以通过DNA内的突变来制备得到。用于突变形成和核苷酸序列改变的方法包括,例如Kunkel,(1985)ProcNatlAcadSciUSA82:488-92;Kunkel,etal.,(1987)MethEnzymol154:367-82;U.S.Pat.No.4,873,192;WalkerandGaastra,eds.(1983)TechniquesinMolecularBiology(MacMillanPublishingCompany,NewYork)以及其中所引用的文献。关于氨基酸取代基不太可能影响所述蛋白生物活性的指南已被发现,譬如,在Dayhoff,etal.,(1978)AtlasofProteinSequenceandStructure(NatlBiomedResFound,Washington,D.C.)所述模型中。保守取代基,例如优选使一个氨基酸与另一个具有相似性质的氨基酸交换。保守删除、插入、和氨基酸取代预计在所述蛋白特征上将产生巨大改变,并且任何取代、删除、插入或其组合物的影响可以通过常规筛选试验来进行评估。双链断裂诱导活性试验是已知的,并通常测定整体活性和含有识别位点的DNA基质上的所述药剂的特异性。5.2.3.1成簇的规律间隔的短回文重复序列(CRISPR)在一些本发明所提供方法的实施例中,所述核酸酶是CRISPR/Cas-衍生的RNA-引导的核酸内切酶。CRISPR一个基于II型原核的CRISPR(成簇的规律间隔的短回文重复序列)适应性免疫系统的基因组编辑工具。在真细菌和古生菌中的CRISPR系统使用小RNAs和CRISPR-相关的(Cas)核酸内切酶,从而靶向和分裂入侵的外源DNAs。参见如Bhayaetal.,AnnuRevGenet45:273-297(2011);Ternsetal.,CurrOpinMicrobiol14(3):321-327(2011);和Wiedenheftetal.,Nature482(7385):331-338。在细菌中,CRISPR位点是由一系列重复序列组成,所述重复序列通过称为间隔的外源性DNA片段(~30bp长度)分离得到。所述重复间隔阵列进行转录作为一个长的前体并在重复序列内处理,从而产生小crRNAs,所述小crRNAs通过所述CRISPR核酸酶指定所述目标序列(也称为前间区序列(protospacers))分裂。CRISPR间隔而后用于识别,并使RNA或DNA水平上的外源性遗传元素沉默。分裂所必需的是一个基序立即顺流而下在所述靶区域的3’末端,被称为前间区序列邻近基序(PAM)。所述PAM存在于所述目标DNA,但并非靶向作用他的所述crRNA。一个最简单的CRISPR系统是来自链球菌属pyognes的II型CRISPR系统。所述CRISPR-相关的Cas9核酸内切酶和两个小RNAs,一个靶向-互补的CRISPRRNA(crRNA);和一个交易crRNA(tracrRNA),对于RNA-引导的外源DNAs的分裂是足够的。所述Cas9蛋白,一个所述II型CRISPR-Cas系统的标志蛋白,是一个大的单体DNA核酸酶,其含有两个与RuvC和HNH核酸酶同源的核酸酶结构域。Cas9是通过crRNA引导邻近所述PAM(前间区序列邻近基序)基序的DNA靶向序列:tracrRNA复合物。使crRNA碱基对生长成熟为tracrRNA,从而形成指导Cas9至所述目标DNA的两个RNA结构。在所述crRNA-引导序列的互补位点,所述Cas9HNH核酸酶结构域分裂所述互补链,而所述Cas9RuvC-样结构域分裂所述非互补链,其导致的结果是在所述目标DNA的双链断裂。参见如Deltchevaetal.,Nature47(7340):602-607(2011)。近期研究表明一个模拟所述crRNA的单一的向导RNA(gRNA)嵌合体:tracrRNA复合物可以与Cas9一起用作一个基因组编辑工具,从而引导Cas9引入位点特异性DNA体内的双链断裂。所述靶向基因组内分裂的特异性是通过嵌合的向导RNA分子(gRNA)的间隔-样部分来确定的,所述嵌合的向导RNA分子模拟所述原生的crRNA:tracrRNA复合物。因此,在功能CRISPR/Cas系统中最小数量的组分有两个:Cas9和sgRNA。所述sgRNA向导序列位于其5′末端并赋予DNA靶向特异性。因此,通过修饰所述向导序列,其可能创造具有不同靶向特异性的sgRNAs。所述向导序列的标准长度是20bp。从而,一个DNA靶也可以是20bp,随后一个PAM序列遵循所述一致的NGG。所述这个修饰CRISPR系统的用途已在体外(参见如Jineketal.,Science337(6096):816-821(2012)),哺乳动物细胞株内(参见如Malietal.,Science339(6121):823-826(2013),Jineketal.,Elife2:e00417(2013);Congetal.,Science339(6121):819-823(2013);和Choetal.,NatBiotechnol31(3):230-232(2013)),细菌(参见如Jiangetal.,NatBiotechnol31(3):233-239(2013);和Gasiunasetal.,ProcNatlAcadSciUSA109(39):E2579-E2586.(2012)),酵母(参见如DiCarloetal,NucleicAcidRes41(7):4336-4343(2013)),斑马鱼(参见如Hwangetal.,NatBiotechnol31(3):227-229(2013);和Changetal.,CellRes23(4):465-472(2013)),小鼠(参见如Wangetal.,Cell153(4):910-918(2013),和植物(参见如Belhajetal.,PlantMethods9:39(2013)),均已表明证实。所述Cas9核酸酶可以进行修饰通过:(1)对异源宿主内提高表达的密码子优化;(2)对于适当的划分,与核定位信号(NLS)融合;和(3)所述HNH或RuvC结构域的定点诱变,从而将所述核酸酶转化为特定链的切口酶。在RuvC-或HNH-基序中,Cas9的定点诱变表明链分裂的特异性,从而提供两个特定链切口酶,除了所述野生型核酸内切酶和能够靶向DNA的单链断裂。参见如Jineketal.,Science337(6096):816-821(2012),和Gasiunasetal.,ProcNatlAcadSciUSA109(39):E2579-E2586.(2012)。已报道的锌指核酸酶和TALENs,修饰所述核酸酶从而起一个切口酶的作用,所述切口酶仅使一条链断裂从而减少来自脱靶切割的毒性,并还可以通过非HR作用机制来降低断裂修复的比率,如NHEJ。参见如Jineketal.,Science337(6096):816-821(2012)。本领域已知的任何CRISPR/Cas系统发现其可在本发明所述的方法和组合物中用作一个核酸酶。高度分化的CRISPR-Cas系统可分为三个主要类型,其还可进一步细分为10个亚型,基于核心元素内容和序列(参见如Makarovaetal.,NatRevMicrobiol9:467-77(2011))。核蛋白复合物的结构组织和功能涉及crRNA-介导的区分不同CRISPR/Cas类型之间的外源核酸的沉默(参见Wiedenheftetal.,Nature482:331-338(2012))。在l-E型系统,作为例示的大肠杆菌,使crRNAs成为被称为级联的多亚基效应因子复合物的一部分(CRISPR-相关的抗病毒防御的复合物)(Brounsetal.,Science321:960-4(2008)),其结合在靶向DNA,并通过署名为Cas3蛋白激发退化(Sinkunasetal.,EMBOJ30:1335^2(2011);Beloglazovaetal.,EMBOJ30:616-27(2011))。在III型硫磺矿硫化叶菌和激烈火球菌的CRISPR/Cas系统,CasRAMP模块(Cmr)和crRNA复合物在体内识别并分裂合成的RNA(Haleetal.,MolCell45:292-302(2012);Zhangetal.,MolCell,45:303-13(2012)),而表皮葡萄球菌的CRISPR/Cas系统在体内靶向DNA(Marraffini&Sontheimer,Science.322:1843-5(2008))。RNP复合物通过II型CRISPR/Cas系统涉及DNA沉默,更确切地说,在嗜热链球菌DGCC7710的CRISPR3/Cas系统中(Horvath&Barrangou,Science327:167-70(2010)),是由四个cas基因组成:cas9、casl、cas2、和csn2,其均位于12个重复-间隔单元的上游。Cas9(原名为cas5或csnl)是II型系统的署名基因(Makarovaetal.,NatRevMicrobiol9:467-77(2011))。CRISPR系统用于本发明所提供的方法和组合物还包括那些国际公开号为WO2013/142578A1和WO2013/098244A1所描述的CRISPR系统,其内容在此全部并入本发明。5.2.3.2转录激活因子样效应因子核酸酶在一些本发明所提供方法的实施例中,一个或多个所述核酸酶是TAL-效应因子DNA结合结构域-核酸酶融合蛋白(TALEN)。在黄杆菌属中的植物病原菌的TAL效应因子在疾病中扮演非常重要的角色,或激发防御,通过结合宿主DNA和激活效应因子-特异性宿主基因。参见如Guetal.(2005)Nature435:1122-5;Yangetal.,(2006)Proc.Natl.Acad.Sci.USA103:10503-8;Kayetal.,(2007)Science318:648-51;Sugioetal.,(2007)Proc.Natl.Acad.Sci.USA104:10720-5;Romeretal.,(2007)Science318:645-8;Bochetal.,(2009)Science326(5959):1509-12;和MoscouandBogdanove,(2009)326(5959):1501。TAL效应因子包含一个在特定序列方式内通过一个或多个级联重复结构域,与DNA相互作用的DNA结合结构域。所述重复序列通常包含34个氨基酸,并且所述重复序列通常彼此之间具有91-100%的同源性。所述重复序列的多态性通常位于12位和13位,且在位于12位和13位的重复数可变的双氨基酸残基的同一性与在TAL-效应因子的靶序列的相邻核苷酸的同一性之间,这似乎是一一对应的。所述TAL-效应因子DNA结合结构域可以进行工程化设计来结合一个所需的靶基因,并与一个核酸酶结构域融合,例如来自II型限制性核酸内切酶,通常是一个来自II型限制性核酸内切酶如FokI的非特异性分裂结构域(参见如Kimetal.(1996)Proc.Natl.Acad.Sci.USA93:1156-1160)。其他有用的核酸内切酶可以包括,如HhaI、HindIII、Nod、BbvCI、EcoRI、BglI、和AlwI。因而,在优选实施例,所述TALEN包含TAL效应因子结构域,所述TAL效应因子结构域包含多个TAL效应因子重复序列或其组合,结合一个所需靶DNA序列内的特异性核苷酸序列,如此在所述特异性核苷酸序列内,或邻近所述特异性核苷酸序列,所述TALEN分裂所述靶DNA。用于本发明所述方法的TALENS包括那些WO10/079430所述的和美国专利申请公开号为US2011/0145940所述的TALENS。在一些实施例,在所述靶DNA内结合一个特异性核苷酸序列的所述TAL效应因子结构域可以包含10个或更多的DNA结合重复序列,且优选15个或更多DNA结合重复序列。在一些实施例,每个DNA结合重复序列包含一个重复数可变的双氨基酸残基(RVD),其可以确定在所述靶DNA序列内识别一个碱基对,其中每个DNA结合重复序列负责识别所述靶DNA序列内的一个碱基对,其中所述RVD包含一个或多个:用于识别C的HD;用于识别T的NG;用于识别A的NI;用于识别G或A的NN;用于识别A或C或G或T的NS;用于识别C或T的N*,其中*表示在所述RVD的第二个位点的一个缺口;用于识别T的HG;用于识别T的H*,其中*表示在所述RVD的第二个位点的一个缺口;用于识别T的IG;用于识别G的NK;用于识别C的HA;用于识别C的ND;用于识别C的HI;用于识别G的HN;用于识别G的NA;用于识别G或A的SN;和用于识别T的YG。在一些本发明所述方法的实施例中,一个或多个所述核酸酶是位点特异性重组酶。一个位点特异性重组酶,还涉及作为重组酶的一个多肽重组酶,所述多肽重组酶在其兼容的重组位点之间催化保守位点特异性重组,并包括原生的多肽以及可保持活性的衍生物、变体、和/或片段,和原生的多核苷酸、衍生物、变体、和/或片段,其可编码一个保持活性的重组酶。关于位点特异性重组酶和其识别位点的综述,参见Sauer(1994)CurrOpBiotechnol5:521-7;andSadowski,(1993)FASEB7:760-7。在一些实施例,所述重组酶是一个丝氨酸重组酶或酪氨酸重组酶。在一些实施例,所述重组酶是来自所述整合酶或解离酶家族。在一些实施例,所述重组酶是一个整合酶,所述整合酶是选自由FLP、Cre、λ整合酶、和R组成的组。对于整合酶家族的其他成员,参见如Esposito,etal.,(1997)NucleicAcidsRes25:3605-14和Abremski,etal.,(1992)ProteinEng5:87-91。用于修饰动力学、辅因子相互作用和需求、表达、优化条件、和/或识别位点特异性的方法,和筛选重组酶活性和变体的方法是已知的,参见如Miller,etal.,(1980)Cell20:721-9;Lange-GustafsonandNash,(1984)JBiolChem259:12724-32;Christ,etal.,(1998)JMolBiol288:825-36;Lorbach,etal.,(2000)JMolBiol296:1175-81;Vergunst,etal.,(2000)Science290:979-82;Dorgai,etal.,(1995)JMolBiol252:178-88;Dorgai,etal.,(1998)JMolBiol277:1059-70;Yagu,etal.,(1995)JMolBiol252:163-7;Sclimente,etal.,(2001)NucleicAcidsRes29:5044-51;SantoroandSchultze,(2002)ProcNatlAcadSciUSA99:4185-90;BuchholzandStewart,(2001)NatBiotechnol19:1047-52;Voziyanov,etal.,(2002)NucleicAcidsRes30:1656-63;Voziyanov,etal.,(2003)JMolBiol326:65-76;Klippel,etal.,(1988)EMBOJ7:3983-9;Arnold,etal.,(1999)EMBOJ18:1407-14;WO03/08045;WO99/25840;和WO99/25841。所述识别位点范围从约30个核苷酸最小位点至几百个核苷酸位点。对于重组酶的任何识别位点可用于,包括天然存在的位点和变体。变体识别位点是已知的,参见如Hoess,etal.,(1986)NucleicAcidsRes14:2287-300;Albert,etal.,(1995)PlantJ7:649-59;Thomson,etal.,(2003)Genesis36:162-7;Huang,etal.,(1991)NucleicAcidsRes19:443-8;SieblerandBode,(1997)Biochemistry36:1740-7;SchlakeandBode,(1994)Biochemistry33:12746-51;Thygarajan,etal.,(2001)MolCellBiol21:3926-34;UmlaufandCox,(1988)EMBOJ7:1845-52;LeeandSaito,(1998)Gene216:55-65;WO01/23545;WO99/25821;WO99/25851;WO01/11058;WO01/07572和美国专利号US5,888,732。在一些本发明所述方法的实施例中,一个或多个所述核酸酶是转座酶。转座酶是介导将转座子从所述基因组中的一个位点转换到另一个位点的多肽。转座酶通常包括双链断裂从而切除所述转座子,识别近末端的重复序列,并集合所述切除的转座子的末端,在一些系统中,其他蛋白还需要在转换期间集合所述末端。转座子和转座酶的实例包括但不限于,来自玉米的Ac/Ds、Dt/rdt、Mu-M1/Mn、和Spm(En)/dSpm元素,来自金鱼草的Tam元素,来自噬菌体的Mu转座子,细菌性转座子(Tn)和插入序列(IS),酵母的Ty元素(逆转录转座子),来自拟南芥的Ta1元素(逆转录转座子),来自果蝇的P元素转座子(Gloor,etal.,(1991)Science253:1110-1117),来自果蝇的Copia、Mariner和Minos元素,来自家蝇的Hermes元素,来自Trichplusiani的PiggyBack元素,来自秀丽隐杆线虫的Tc1元素,和来自小鼠的IAP元素(逆转录转座子)。5.2.3.3锌指核酸酶(ZFNs)在一些本发明所述方法的实施例中,一个或多个所述核酸酶是锌指核酸酶(ZFN)。ZFNs是工程化设计为包含一个锌指DNA结合结构域和一个断裂诱导剂结构域的断裂诱导剂。工程化ZFNs是由两个锌指阵列(ZFAs)组成,其中每个与一个非特异性核酸内切酶的单一子单元融合,如所述来自FokI酶的核酸酶结构域,其一经二聚化,便变得有效。通常,一个单一的ZFA是由3或4个锌指结构域组成,其中每个旨在识别一个特异性核苷酸三联体(GGC、GAT等)。因此,ZFNs由两个“3-锌指”ZFAs组成,所述ZFAs能够识别18个碱基对靶位点;18个碱基对识别序列一般是独特的,甚至在大的基因组内,如在那些人类或植物的基因组内。通过指导所述共定位和二聚化两个FokI核酸酶单体,ZFNs产生一个功能化位点特异性核酸内切酶,其可以创造一个在DNA内所述靶向位点的断裂。有用的锌指核酸酶包括那些已知的和那些被工程化的从而对于一个或多个本发明所述的靶位点(TS)具有特异性。锌指结构域适合于设计多肽,所述设计多肽特异性结合一个选定的多核苷酸识别序列,例如,在所述宿主细胞基因组的所述靶位点内。ZFNs是由一个连接非特异性核酸内切酶结构域的工程化DNA-结合的锌指结构域组成,例如来自IIs型核酸内切酶如HO或FokI的核酸酶结构域。或者,工程化锌指DNA结合结构域可以融合到其他能保持DNA切割/分裂活性的断裂诱导剂或其衍生物。譬如,此种类型的融合可以用于引导所述断裂诱导剂至一个不同的靶位点,从而改变所述切口或分裂位点的位置,并引导所述诱导剂至一个较短的靶位点,或引导所述诱导剂至一个较长的靶位点。在一些实例中,锌指DNA结合结构域被融合至一个保持DNA切割和/或分裂活性的位点特异性重组酶、转座酶、或其衍生物。附加的功能可以融合到所述锌指结合结构域,包括转录激活因子结构域,转录阻抑因子结构域,和甲基化酶。在一些实施例,核酸酶结构域的二聚化对于分裂活性是必需的。每个锌指在所述靶DNA中识别三个连续的碱基对。譬如,识别一个9个连续核苷酸序列的3指结构域,与所述核酸酶的二聚需求,两组锌指的三联体用于结合一个18个核苷酸识别序列。有用的设计师锌指模型包括识别各种GNN和ANN三联体的那些(Dreier,etal.,(2001)JBiolChem276:29466-78;Dreier,etal.,(2000)JMolBiol303:489-502;Liu,etal.,(2002)JBiolChem277:3850-6),以及识别各种CNN和TNN三联体的那些(Dreier,etal.,(2005)JBiolChem280:35588-97;Jamieson,etal.,(2003)NatureRevDrugDiscov2:361-8)。还可以参见Durai,etal.,(2005)NucleicAcidsRes33:5978-90;Segal,(2002)Methods26:76-83;PorteusandCarroll,(2005)NatBiotechnol23:967-73;Pabo,etal.,(2001)AnnRevBiochem70:313-40;Wolfe,etal.,(2000)AnnRevBiophysBiomolStruct29:183-212;SegalandBarbas,(2001)CurrOpinBiotechnol12:632-7;Segal,etal.,(2003)Biochemistry42:2137-48;BeerliandBarbas,(2002)NatBiotechnol20:135-41;Carroll,etal.,(2006)NatureProtocols1:1329;Ordiz,etal.,(2002)ProcNatlAcadSciUSA99:13290-5;Guan,etal.,(2002)ProcNatlAcadSciUSA99:13296-301;WO2002099084;WO00/42219;WO02/42459;WO2003062455;US20030059767;美国专利申请公开号US2003/0108880;美国专利号US6,140,466,US6,511,808和US6,453,242。有用的锌指核酸酶还可以包括在WO03/080809;WO05/014791;WO05/084190;WO08/021207;WO09/042186;WO09/054985;和WO10/06512中所描述的那些。5.2.3.4核酸内切酶在一些本发明所述方法的实施例中,一个或多个所述核酸酶是一个核酸内切酶。核酸内切酶是在多核苷酸链内分裂所述磷酸二酯键的酶,并包括分裂DNA作为特异性位点,但没有破坏所述碱基的限制性核酸内切酶。限制性核酸内切酶包括I型、II型、III型、和IV型的核酸内切酶,其进一步包括亚型。限制性核酸内切酶可以进一步描述和分类,例如在REBASE数据库(网页为rebase.neb.com;Roberts,etal.,(2003)NucleicAcidsRes31:418-20),Roberts,etal.,(2003)NucleicAcidsRes31:1805-12,和Belfort,etal.,(2002)inMobileDNAII,pp.761-783,Eds.Craigie,etal.,ASMPress,Washington,D.C。本本发明使用的核酸内切酶还包括归巢核酸内切酶,其像限制性核酸内切酶一样,在一个特异性识别序列上结合并切割。然后,所述归巢核酸内切酶的识别位点通常较长,例如约18bp或更多。归巢核酸内切酶又名大范围核酸酶,基于保守基序已被分成以下家族:LAGLIDADG(SEQIDNO:1)归巢核酸内切酶,HNH归巢核酸内切酶,His-Cys箱归巢核酸内切酶,GIY-YIG(SEQIDNO:2)归巢核酸内切酶,和蓝藻归巢核酸内切酶。参见如Stoddard,QuarterlyReviewofBiophysics38(1):49-95(2006)。所述这些家族在其保守核酸酶活性位点的核心基序和催化机理上有很大不同。参见如GuhanandMuniyappa(2003)CritRevBiochemMolBiol38:199-248;Lucas,etal.,(2001)NucleicAcidsRes29:960-9;JuricaandStoddard,(1999)CellMolLifeSci55:1304-26;Stoddard,(2006)QRevBiophys38:49-95;和Moure,etal.,(2002)NatStructBiol9:764。来自这些家族有用的特异性归巢核酸内切酶的实例包括但不限于:I-CreI(参见Rochaixetal.,NucleicAcidsRes.13:975-984(1985),I-MsoI(参见Lucasetal.,NucleicAcidsRes.29:960-969(2001),I-SceI(参见Fouryetal.,FEBSLett.440:325-331(1998),I-SceIV(参见Moranetal.,NucleicAcidsRes.20:4069-4076(1992),H-DreI(参见Chevalieretal.,Mol.Cell10:895-905(2002),I-HmuI(参见Goodrich-Blairetal.,Cell63:417-424(1990);Goodrich-Blairetal.,Cell84:211-221(1996),I-PpoI(参见Muscarellaetal.,Mol.Cell.Biol.10:3386-3396(1990),I-DirI(参见Johansenetal.,Cell76:725-734(1994);Johansen,NucleicAcidsRes.21:4405(1993),I-NjaI(参见Eldeetal.,Eur.J.Biochem.259:281-288(1999);DeJonckheereetal.,J.Eukaryot.Microbiol.41:457-463(1994),I-NanI(参见Eldeetal.,S.Eur.J.Biochem.259:281-288(1999);DeJonckheereetal.,J.Eukaryot.Microbiol.41:457-463(1994)),I-NitI(参见DeJonckheereetal.,J.Eukaryot.Microbiol.41:457-463(1994);Eldeetal.,Eur.J.Biochem.259:281-288(1999),I-TevI(参见Chuetal.,Cell45:157-166(1986),I-TevII(参见Tomaschewskietal.,NucleicAcidsRes.15:3632-3633(1987),I-TevIII(参见Eddyetal.,GenesDev.5:1032-1041(1991),F-TevI(参见Fujisawaetal.,NucleicAcidsRes.13:7473-7481(1985),F-TevII(参见Kadyrovetal.,Dokl.Biochem.339:145-147(1994);Kaliman,NucleicAcidsRes.18:4277(1990),F-CphI(参见Zengetal.,Curr.Biol.19:218-222(2009),PI-MgaI(参见Savesetal.,NucleicAcidsRes.29:4310-4318(2001),I-CsmI(参见Colleauxetal.,Mol.Gen.Genet.223:288-296(1990),I-CeuI(参见Turmeletal.,J.Mol.Biol.218:293-311(1991)和PI-SceI(参见Hirataetal.,.J.Biol.Chem.265:6726-6733(1990)。在一些本发明所述方法的实施例中,归巢核酸内切酶的一个天然存在的变体,和/或工程化的衍生物被应用。用于修饰所述动力学、辅因子相互作用、表达、优化条件、和/或识别位点特异性、和活性筛选的方法均是已知的。参见如Epinat,etal.,(2003)NucleicAcidsRes31:2952-62;Chevalier,etal.,(2002)MolCell10:895-905;Gimble,etal.,(2003)MolBiol334:993-1008;Seligman,etal.,(2002)NucleicAcidsRes30:3870-9;Sussman,etal.,(2004)JMolBiol342:31-41;Rosen,etal.,(2006)NucleicAcidsRes34:4791-800;Chames,etal.,(2005)NucleicAcidsRes33:e178;Smith,etal.,(2006)NucleicAcidsRes34:e149;Gruen,etal.,(2002)NucleicAcidsRes30:e29;ChenandZhao,(2005)NucleicAcidsRes33:e154;WO2005105989;WO2003078619;WO2006097854;WO2006097853;WO2006097784;和WO2004031346。有用的归巢核酸内切酶还包括在WO04/067736;WO04/067753;WO06/097784;WO06/097853;WO06/097854;WO07/034262;WO07/049095;WO07/049156;WO07/057781;WO07/060495;WO08/152524;WO09/001159;WO09/095742;WO09/095793;WO10/001189;WO10/015899;和WO10/046786中所描述的那些。任何归巢核酸内切酶可以用作一个双链断裂诱导剂,所述双链断裂诱导剂包括但不限于:H-DreI、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、Pi-PspI、F-SceI、F-SceII、F-SuvI、F-CphI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、i-UarAP、i-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MgaI、PI-MtuI、PI-MtuHIPPI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、或PI-TliII,或其任何变体或衍生物。在一些实施例,所述核酸内切酶结合一个原生的或内源性识别序列。在其他实施例,所述核酸内切酶是一个修饰的并结合一个非原生的或外源性识别序列,但不结合一个原生的或内源性识别序列的核酸内切酶。5.2.3.5基因组靶位点在本发明所提供的方法中,一个核酸酶被引入到所述宿主细胞,所述宿主细胞能够在接近基因组靶位点处或其内引起双链断裂,其在或接近所述分裂位点处,大大提高了同源重组的频率。在优选实施例,所述核酸酶的识别序列仅存在于所述宿主细胞基因组的靶位点,从而,通过所述核酸酶将任何脱靶基因组结合和分裂减到最少。在一些实施例,所述基因组靶位点对于所述宿主细胞是内源性的,如一个原生的位点。在一些实施例,所述原生的基因组靶位点是通过核酸酶的类型来进行选择,并应用于本发明所述的整合方法。如果被使用的核酸酶是CRISPR/Cas-衍生的RNA-引导的核酸内切酶,那么优化靶位点可以根据所述被应用的特别的CRISPR-Cas核酸内切酶的靶向识别的需求来进行选择。譬如Cas9靶向识别发生是根据检测所述靶NDA内的“前间区序列”和所述crRNA内余下的间隔序列之间的互补性。Cas9切割所述DNA,只有当一个修正的前间区序列基序(PAM)也存在于所述3’末端。不同的II型系统具有不同的PAM需求。所述化脓性链球菌系统需要一个NGG序列,其中N可以是任何核苷酸。嗜热链球菌II型系统分别需要一个NGGNG和NNAGAAW,虽然不同变形链球菌系统耐受NGG或NAAR。生物信息学分析在不同的细菌中已产生CRISPR位点的大量数据库,所述不同的细菌可以用来识别新的PAMs并扩大CRISPR-可靶向序列的集合。参见如Rhoetal.,PLoSGenet.8,e1002441(2012);和D.T.Prideetal.,GenomeRes.21,126(2011)。在嗜热链球菌中,Cas9在所述前间区序列的上游,产生一个钝端双链断裂3bp,在所述Cas9蛋白内,一个过程介导通过两个催化结构域:分裂所述DNA互补链的HNH结构域,和分裂所述非互补链的RuvC样结构域。如果被应用的所述核酸酶是一个锌指核酸酶,那么最佳靶位点可以使用大量公开的在线资源来进行选择。参见如Reyonetal.,BMCGenomics12:83(2011),在此全部引用作为参考。譬如,对于具有高特异性和体内功能的工程化锌指阵列,寡聚体库工程(OPEN)是一个非常强大并公开可用的方案,并已成功用于生成ZFNs,所述ZFNs在植物、斑马鱼、和人体细胞和多能性干细胞中可有效运转。OPEN是一个基于选择的方法,其中预构建的随机候选ZFAs池是筛选用于识别那些具有高亲和力和特异性的所需靶序列。ZFN基因组是一个基于GBrowse的工具,用于识别和可视观察OPEN-生成的ZFNs的潜在靶位点。在模型生物体的测序和注释的基因组内,ZFN基因组提供了一个潜在靶位点的纲要。ZFN基因组目前包括共超过11.6百万潜在的ZFN靶位点,映射在7个模型生物体的完全测序基因组中:酿酒酵母,衣藻,拟南芥,果蝇,斑马鱼,线虫,和智人。另外的模型生物体,包括三个植物种类:大豆(Glycinemax),水稻(Oryzasativa),玉米(Zeamays),和三个动物种类赤拟谷盗(Triboliumcastaneum),小鼠(Musmusculus),褐鼠(Rattusnorvegicus),在不久的将来将被增加进来。ZFN基因组提供了关于每个潜在ZFN靶位点的信息,包括其染色体定位和关于转录起始位点的位置。使用者可以使用几个不同的标准来查询ZFN基因组(如基因号、记录号、靶位点序列)。如果被应用的所述核酸酶是一个TAL-效应因子核酸酶,那么在一些实施例,最佳靶位点可以根据下述文献所述的方法来进行选择:Sanjanaetal.,NatureProtocols,7:171-192(2012),其在此全部引用并作为参考。简言之,TALENs起二聚体的作用,且一对TALENs,被称为左右TALENs,在DNA相反链上的靶序列。TALENs被工程化为一个所述TALEDNA-结合结构域和一个单体FokI催化结构域的融合。为了促进FokI二聚化,所述左右TALEN靶位点与一个大约14-20个碱基的间隔一同被选择。因此,对于一对TALENs,每个靶向20-bp序列,一个最佳靶位点应该具有5′-TN19N14-20N19A-3′形式,其中所述左TALEN靶向5′-TN19-3′,而所述右TALEN则靶向5′-N19A-3′(N=A,G,TorC)的反义链。在其他本发明所述方法的实施例中,所述基因组靶位点对于所述宿主细胞是外源性的。譬如,一个或多个基因组靶位点使用传统方法,可以工程化进入所述宿主细胞基因组,如基因靶向作用,在完成本发明所述整合方法之前。在一些实施例,相同靶序列的多个副本通过工程化进入所述宿主细胞基因组的不同位点,从而,借助于仅一个特异性识别所述靶序列的单一核酸酶,促进多个整合事件同时进行。在其他实施例,多个不同靶序列通过工程化进入所述宿主细胞基因组的不同靶位点。在一些实施例,所述工程化靶位点包括一个不代表在所述宿主细胞的原生基因组内的靶序列。譬如,归巢核酸内切酶靶向作用大的识别位点(12-40bp),所述大的识别位点通常嵌入内含子或内含肽类,正因如此,其识别位点非常罕见,没有或仅其中的几个位点存在于一个哺乳类动物大小的基因组中。因此,在一些实施例,所述外源性基因组靶位点是一个归巢核酸内切酶的识别序列。在一些实施例,所述归巢核酸内切酶是选自由H-DreI、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、Pi-PspI、F-SceI、F-SceII、F-SuvI、F-CphI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MgaI、PI-MtuI、PI-MtuHIPPI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、或PI-TliII,或其任何变体或衍生物组成的组。尤其在一些实施例,所述外源性基因组靶位点是I-SceI、VDE(PI-SceI)、F-CphI、PI-MgaI或PI-MtuII的识别序列,其中每个如下所示。表1:用于选择归巢核酸内切酶的识别和分裂位点5.2.3.6递送在一些实施例,提供了一个或多个用于本发明所述方法的核酸酶,如递送到所述宿主细胞作为纯化蛋白。在其他实施例,通过多核苷酸来提供一个或多个核酸酶,其中所述多核苷酸包含一个编码所述核酸酶的核酸。在其他实施例,所述一个或多个核酸酶被引入所述宿主细胞作为纯化的RNA,其中所述纯化的RNA可以直接在所述宿主细胞核内进行翻译。在一些实施例,一个整合的多核苷酸,一个编码核酸酶的多核苷酸,或一个上述纯化的核酸酶蛋白,或其任意组合,可以使用任何常规技术引入宿主细胞,从而将外源性蛋白和/或核酸引入本领域已知的细胞中。此类方法包括但不限于,通过来自溶液的细胞直接摄取所述分子,或使用如脂质体或免疫脂质体,通过脂质转染促进摄取;粒子介导的转染等等。参见如美国专利申请号US5,272,065;Goeddeletal.,eds,1990,MethodsinEnzymology,vol.185,AcademicPress,Inc.,CA;Krieger,1990,GeneTransferandExpression--ALaboratoryManual,StocktonPress,NY;Sambrooketal.,1989,MolecularCloning--ALaboratoryManual,ColdSpringHarborLaboratory,NY;和Ausubeletal.,eds.,CurrentEdition,CurrentProtocolsinMolecularBiology,GreenePublishingAssociatesandWileyInterscience,NY。用于转化细胞的详细方法是本领域周知的。参见Hinnenetal.,Proc.Natl.Acad.Sci.USA75:1292-3(1978);Creggetal.,Mol.Cell.Biol.5:3376-3385(1985)。例示性技术包括但不限于,原生质体,电穿孔,PEG1000介导的转化,和醋酸锂或氯化锂介导的转化。在一些实施例,基因枪用于将一个整合的多核苷酸,一个编码核酸酶的多核苷酸,一个纯化的核酸酶蛋白,或其任意组合引入所述宿主细胞,特别地,否则宿主细胞使用常规技术,很难转化/转染,如植物。基因枪通过使所述转化反应与微观黄金粒子结合来起作用,然后在所述靶细胞使用压缩气体来推动所述粒子。在一些实施例,包含编码所述核酸酶的核酸的所述多核苷酸是一个允许在宿主细胞内表达所述核酸酶的表达载体。合适的表达载体包括但不限于那些已知的用于表达大肠杆菌、酵母或哺乳动物细胞内的基因。大肠杆菌表达载体的实例包括但不限于pSCM525、pDIC73、pSCM351、和pSCM353。合适的表达载体的其他实例包括酵母-大肠杆菌pRS系列穿梭载体,所述穿梭载体包含CEN.ARS序列和酵母选择标记;和2μ质粒。在一些实施例,一个编码核酸酶的多核苷酸可以进行修饰,从而在所述宿主细胞内取代具有较高使用频率的密码子,相对于天然存在的多核苷酸序列。譬如,编码所述核酸酶的多核苷酸可以进行修饰,从而在酿酒酵母内取代具有较高使用频率的密码子,相对于天然存在的多核苷酸序列。在一些实施例,其中所述核酸酶的功能是作为一个需要分别表达每个单体的异质二聚体,因为是锌指核酸酶和TAL-效应因子核酸酶的情况下,所述异质二聚体的每个单体可以从所述相同的表达质粒,或从不同质粒进行表达。在一些实施例,其中多个核酸酶被引入所述宿主细胞,从而在不同靶位点产生双链断裂,所述核酸酶可以在一个单独质粒或在不同质粒上进行编码。在一些实施例,所述核酸酶表达载体进一步包含一个选择标记,所述选择标记允许选择含有所述表达载体的宿主细胞。此类选择可有助于在所述宿主细胞内保持所述载体一段时间,对于足够数量核酸酶的表达发生是必要的,譬如,一段12小时、24小时、36小时、48小时、60小时、72小时、84小时、96小时、或多于96小时的时间,此后,所述宿主细胞可以在所述表达载体不再保持的条件下生长。在一些实施例,所述选择标记是选自由URA3、潮霉素B磷酸转移酶、氨基糖苷类磷酸转移酶、博莱霉素抗性、和草丁膦N-乙酰转移酶组成的组。在一些实施例,所述核酸酶表达载体可以包含一个相反选择标记,其允许宿主细胞的选择,所述宿主细胞不包含所述一个或多个供体核酸分子整合之后的表达载体。所述使用的核酸酶表达载体还可以是一个短暂的载体,其没有选择标记,或是一个不用于选择的选择标记。尤其在一些实施例,所述含有短暂核酸酶表达载体的宿主细胞的后代,随着时间的推移,失去了所述载体。在一些实施例,所述表达载体进一步包含一个转录终止序列和一个启动子,所述启动子与编码所述核酸酶的所述核苷酸序列可操作地连接。在一些实施例,所述启动子是一个组成型启动子。在一些实施例,所述启动子是一个诱导型启动子。适合用于酵母细胞的启动子的例证性实例包括但不限于,乳酸菌TEF1基因的启动子,酿酒酵母PGK1基因的启动子,酿酒酵母TDH3基因的启动子,可抑制的启动子如酿酒酵母CTR3基因的启动子,和诱导型启动子如酿酒酵母的半乳糖诱导启动子(如GAL1、GAL7、和GAL10基因的启动子)。在一些实施例,一个附加的含有核定位序列(NLS)的核苷酸序列与编码所述核酸酶的核苷酸序列的5’位连接。所述NLS可以促进较大核酸酶(>25kD)的核定位。在一些实施例,所述核定位序列是一个SV40核定位序列。在一些实施例,所述核定位序列是一个酵母核定位序列。一个核酸酶表达载体可以通过任何本领域技术人员显而易见的技术进行制备。在一些实施例,所述载体是使用聚合酶链反应(PCR)和本领域公知的分子克隆技术进行制备。参见如PCRTechnology:PrinciplesandApplicationsforDNAAmplification,ed.HAErlich,StocktonPress,NewYork,N.Y.(1989);Sambrooketal.,2001,MolecularCloning–ALaboratoryManual,3rdedition,ColdSpringHarborLaboratory,ColdSpringHarbor,NY。5.3宿主细胞另一方面,本发明提供通过任何基因组整合本发明所述的一个或多个外源性核酸的方法而产生一个修饰的宿主细胞。合适的宿主细胞包括任何细胞,即可在其内,将一个核酸或目的“供体DNA”整合到一个所需的染色体或游离的位点中。在一些实施例,所述细胞是一个具有完成同源重组能力的生物体细胞。尽管几个例证性实例在酵母(酿酒酵母)中有所示范,据认为本发明所述的基因组修饰的方法,可以在所有具有功能重组系统的生物有机体上实践,即使所述重组系统并不像在酵母中一样熟练。其他具有功能同源重组系统的细胞或细胞类型包括细菌,如枯草芽孢杆菌和大肠杆菌(其精通RecERecT重组;Muyrersetal.,EMBOrep.1:239-243,2000);原生动物(如疟原虫、弓形虫);其他酵母(如粟酒裂殖酵母);丝状真菌(如棉阿舒囊霉);植物如小立碗藓(SchaeferandZryd,PlantJ.11:1195-1206,1997);和动物细胞,如哺乳动物细胞和鸡DT40细胞(Diekenetal.,Nat.Genet.12:174-182,1996)。在一些实施例,所述宿主细胞是原核细胞。在一些实施例,所述宿主细胞是真核细胞。在一些实施例,所述宿主细胞是选自由真菌细胞、细菌细胞、植物细胞、昆虫细胞、鸟细胞鱼细胞和哺乳动物细胞组成的组。在一些实施例,所述哺乳动物细胞是选自由啮齿类动物细胞、灵长类动物细胞和人细胞组成的组。在一些实施例,所述细胞是真菌细胞(如酵母细胞)、细菌细胞、植物细胞、或动物细胞(如鸡细胞)。在一些实施例,所述宿主细胞是中国仓鼠卵巢(CHO)细胞、COS-7细胞、小鼠成纤维细胞、或小鼠胚胎干细胞。在一些实施例,所述宿主细胞是昆虫细胞。在一些实施例,所述宿主细胞是S2细胞、施耐德细胞、S12细胞、5B1-4细胞、Tn5细胞、或Sf9细胞。在一些实施例,所述宿主细胞是单细胞真核生物细胞。尤其在一些实施例,所述宿主细胞是酵母细胞。有用的酵母细胞包括已沉积微生物寄存(如IFO、ATCC等)和其中属于以下各类的酵母细胞:芽孢酵母属(Aciculoconidium)、神食酵母属(Ambrosiozyma)、节束酵母属(Arthroascus)、双极酵母属(Arxiozyma)、阿舒囊霉属(Ashbya)、Babjevia、本森顿酵母属(Bensingtonia)、Botryoascus、Botryozyma、酒香酵母属(Brettanomyces)、布勒掷孢酵母属(Bullera)、布勒担孢酵母属(Bulleromyces)、念珠菌属(Candida)、固囊酵母属(Citeromyces)、棒孢酵母属(Clavispora)、隐球酵母属(Cryptococcus)、Cystofilobasidium、德巴利氏酵母属(Debaryomyces)、德克氏酵母(Dekkara)、Dipodascopsis、双足囊菌属(Dipodascus)、Eeniella、Endomycopsella、丝囊霉属(Eremascus)、假囊酵母属(Eremothecium)、担孢酵母属(Erythrobasidium)、Fellomyces、Filobasidium、半乳糖霉菌(Galactomyces)、地丝菌属(Geotrichum)、四季酵母属(Guilliermondella)、汉森氏酵母属(Hanseniaspora)、汉逊酵母属(Hansenula)、Hasegawaea、胶珊瑚属(Holtermannia)、Hormoascus、生丝毕赤酵母属(Hyphopichia)、伊萨酵母属(Issatchenkia)、克勒克酵母属(Kloeckera)、Kloeckeraspora、克鲁维酵母菌属(Kluyveromyces)、Kondoa、Kuraishia、克氏担孢酵母属(Kurtzmanomyces)、白冬孢酵母属(Leucosporidium)、油脂酵母属(Lipomyces)、娄德酵母属(Lodderomyces)、马拉色氏霉菌属(Malassezia)、梅奇酵母属(Metschnikowia)、木拉克酵母属(Mrakia)、Myxozyma、拿逊酵母属(Nadsonia)、Nakazawaea、针孢酵母属(Nematospora)、Ogataea、卵孢酵母属(Oosporidium)、管囊酵母属(Pachysolen)、Phachytichospora、Phaffia、毕赤酵母属(Pichia)、红冬孢酵母属(Rhodosporidium)、红酵母属(Rhodotorula)、糖酵母属(Saccharomyces)、类糖酵母属(Saccharomycodes)、覆膜孢糖酵母属(Saccharomycopsis)、Saitoella、Sakaguchia、Saturnospora、裂芽酵母属(Schizoblastosporion)、裂殖糖酵母属(Schizosaccharomyces)、许旺氏酵母属(Schwanniomyces)、锁掷酵母属(Sporidiobolus)、掷孢酵母属(Sporobolomyces)、原孢酵母属(Sporopachydermia)、冠孢酵母属(Stephanoascus)、梗孢酵母属(Sterigmatomyces)、Sterigmatosporidium、Symbiotaphrina、合轴酵母属(Sympodiomyces)、Sympodiomycopsis、有孢圆酵母属(Torulaspora)、Trichosporiella、丝孢酵母属(Trichosporon)、三角酵母属(Trigonopsis)、Tsuchiyaea、Udeniomyces、Waltomyces、威克酵母属(Wickerhamia)、拟威克酵母属(Wickerhamiella)、拟威尔酵母属(Williopsis)、Yamadazyma、耶氏酵母属(Yarrowia)、接合囊酵母属(Zygoascus)、接合糖酵母属(Zygosaccharomyces)、尔酵母属(Zygowilliopsis)、和Zygozyma。在一些实施例,所述酵母宿主细胞是酿酒酵母细胞、毕赤酵母细胞、粟酒裂殖酵母细胞、布鲁塞尔德克酵母细胞、乳酸克鲁维酵母细胞、Arxulaadeninivorans细胞、或多形汉逊酵母(又名安格斯毕赤酵母)细胞。在一些优选实施例,所述酵母宿主细胞是酿酒酵母细胞。在一些实施例,所述酵母宿主细胞是脆壁酵母细胞或乳酸克鲁维酵母(先前称为乳酸酵母)细胞。在一些实施例,所述酵母宿主细胞是一种属于念珠菌属的细胞,如解脂假丝酵母、季也蒙念珠菌、克柔念珠菌、热带念珠菌、或产朊假丝酵母。在另一些优选实施例,所述酵母宿主细胞是马克斯克鲁维酵母(Kluveromycesmarxianus)细胞。在一些优选实施例,所述酵母宿主细胞是酿酒酵母细胞,所述酿酒酵母细胞是选自由贝克氏酵母细胞(Baker’syeastcell)、CBS7959细胞、CBS7960细胞、CBS7961细胞、CBS7962细胞、CBS7963细胞、CBS7964细胞、IZ-1904细胞、TA细胞、BG-1细胞、CR-1细胞、SA-1细胞、M-26细胞、Y-904细胞、PE-2细胞、PE-5细胞、VR-1细胞、BR-1细胞、BR-2细胞、ME-2细胞、VR-2细胞、MA-3细胞、MA-4细胞、CAT-1细胞、CB-1细胞、NR-1细胞、BT-1细胞、和AL-1细胞组成的组。在一些实施例,所述宿主细胞是酿酒酵母细胞,所述酿酒酵母细胞是选自由PE-2细胞、CAT-1细胞、VR-1细胞、BG-1细胞、CR-1细胞、和SA-1细胞组成的组。在一个优选实施例,所述酿酒酵母宿主细胞是PE-2细胞。在另一优选实施例,所述酿酒酵母宿主细胞是CAT-1细胞。在另一优选实施例,所述酿酒酵母宿主细胞是BG-1细胞。在一些实施例,所述酵母细胞是一个适合工业发酵的细胞,如生物乙醇发酵。在一些优选实施例,所述细胞习惯于供养在高溶剂浓度、高温度、扩大底物利用率、营养限制、渗透压力、酸度、亚硫酸盐和细菌污染、或其组合的条件下,其是公认的工业发酵环境的压力条件。5.4应用5.4.1基因和细胞治疗本发明所述的方法和组合物提供了在治疗应用中的优势,其寻求修正遗传缺陷,如在来源于患者的细胞群内的间接体外疗法。譬如,Schwank等人(CellStemCell13:653-658(2013))最近报道了,通过在人类CF患者的培养肠道干细胞内进行同源重组,利用所述CRISPR/Cas9基因组编辑系统来修正所述CFTR位点。所述修正的等位基因表示和其功能完全是,在克隆扩增的细胞器内进行测量,因此这份报告提供了基因修正概念的证据,通过来自有单基因遗传性缺陷的患者的原发性成人干细胞内的同源重组。然而,在培养的干细胞内修正CFTR位点需要嘌呤霉素抗性盒与所述供体DNA的基因组整合,随后在嘌呤霉素内进行选择。有报道表明将所述新霉素抗性基因整合到人细胞基因组中,随后在G418内延长培养时间,将导致细胞特征的改变,虽然增强的绿色荧光蛋白(EGFP)和其他荧光蛋白的表达已被报道会引起免疫原性和毒性。参见如Bareseetal.,HumanGeneTherapy22:659-668(2011);Morrisetal.,Blood103:492-499(2004);和Hanazonoetal.,HumanGeneTherapy8:1313-1319(1997)。因此,本发明所提供的方法和组合物通过原发性成人干细胞内的同源重组,而无需整合选择标记,可以用于完成基因修正。在另一篇HR-介导的遗传疾病修复的报道中,Wu等人(CellStemCell13:659-662(2013)证明了在可引起白内障的Crygc基因内有显性突变的小鼠,通过一同注射Cas9mRNA的受精卵和靶向作用所述突变等位基因的单一向导RNA(sgRNA),可以获救。修正是通过基于一个外源供应的寡核苷酸或外源性WT等位基因的同源指导修复(HDR),从而发生,且由此产生的小鼠是能生育的,并能够发送所述修正的等位基因到其后代中。然而,HDR-介导的修复的比率远低于通过NHEJ的修复或非修复的发病率(参见表1中Wu等人)。因此,通过提供一个用于选择HR-介导的基因修饰的有用的选择机理,本发明所提供的方法和组合物可用于提高基因修正的效率。5.4.2用于代谢途径工程的方法本发明所述的方法和组合物提供了对于构建含有优化生物合成路径的重组生物体的特别优势,譬如,有助于生物质转化为生物燃料、药物或生物材料。功能的非原生生物学路径已在抗疟药物青蒿素的前体生产的微生物宿主内成功构建(参见如Martinetal.,NatBiotechnol21:796-802(2003);源自燃料和化学品的脂肪酸(如脂肪酸酯、脂肪醇和蜡类;参见Steenetal.,Nature463:559-562(2010);源自燃料和化学品的卤代甲烷(参见如Bayeretal.,JAmChemSoc131:6508-6515(2009);降低胆固醇药物的聚酮合酶(参见如Maetal.,Science326:589-592(2009);和聚酮类(参见如Kodumal,ProcNatlAcadSciUSA101:15573-15578(2004)。传统上,代谢工程,尤其是,生物合成路径的构建,在一个以一个时间序列的方式进行,通过引入路径组成,即一次整合到所述宿主细胞基因组的一个单一位点。本发明所述的整合方法可用于减少通常需要工程化一个宿主细胞的时间,譬如,一个微生物细胞包含一个或多个编码新的代谢路径的酶的同源性核苷酸序列,即一个产生代谢物的代谢途径不是通过所述宿主细胞内源性地产生的。在其他优选实施例,本发明所提供的整合方法可用于有效工程化一个宿主细胞,从而使其包含一个或多个编码对于所述宿主细胞是内源性的代谢途径的酶的异源性核苷酸序列,即一个产生代谢物的代谢途径是通过所述宿主细胞内源性地产生的。在其中一个实施例,设计策略可以寻求用补充的外源性路径替代宿主细胞的三个原生基因。通过现有技术的当前情况,修饰所述这些三个内源性位点需要三个独立的转化。相比之下,本发明所提供的同时多重整合的方法,能够使所有三个整合以一个单一转化来完成,从而三倍减少轮工程所需的。此外,所述方法能够使DNA聚集移植,包括优化路径组成,将在一个宿主细胞底盘的多个位点的组成整合到第二个宿主细胞底盘的相似位点。通过减少对于工程化一个所需基因型的所需轮数,代谢途径的构建速度实质是增加的。5.4.2.1类异戊二烯途径工程在一些实施例,本发明所提供的方法可用于同时引入或替代一个或多个生物合成路径组成,从而修饰工程化宿主细胞的产品配置。在一些实施例,所述生物合成路径是类异戊二烯途径。萜类是一大类可在许多有机体内产生的碳氢化合物。但对萜类进行化学修饰时(如通过碳架的氧化或重排),所产生的化合物通常被称为萜类化合物,其还被称为类异戊二烯类化合物。类异戊二烯类化合物扮演非常重要的生物学角色,譬如,作为电子传递链的醌类,作为细胞膜的组分,在亚细胞内通过蛋白异戊烯化靶向作用和调控,作为包括类胡萝卜素、叶绿素的光合色素,作为激素和辅酶因子,和与各种单萜类、倍半萜类和二萜类作为植物防御化合物。他们是工业上有用的抗生素、激素、抗癌药物、杀虫剂和化学制品。萜类是通过连接异戊二烯单元(C5H8)衍生得到,其根据异戊二烯单元存在的数量进行分类。半萜是由一个单一的异戊二烯单元组成。异戊二烯本身被认为是唯一的半萜。单萜类是由两个异戊二烯单元组成,并具有分子式C10H16。单萜的实例有香叶醇、柠檬烯、和萜品醇。倍半萜类是由三个异戊二烯单元组成,并具有分子式C15H24。倍半萜的实例有金合欢烯类和金合欢醇。二萜类是由四个异戊二烯单元组成,并具有分子式C20H32。二萜的实例有咖啡醇、咖啡豆醇、松柏烯、和紫衫烯。二倍半萜类是由五个异戊二烯单元组成,并具有分子式C25H40。二倍半萜的实例有香叶金合欢醇。三萜类是由六个异戊二烯单元组成,并具有分子式C30H48。四萜类包含八个异戊二烯单元,并具有分子式C40H64。生物学上重要的四萜包括非循环的番茄红素、单环γ-胡萝卜素、和双环α-和β-胡萝卜素。多萜类是由许多异戊二烯单元的长链组成。天然橡胶是由聚异戊二烯组成,其内双键为顺式双键。萜类是通过异戊烯焦磷酸(异戊烯基二磷酸或IPP)与其单体二甲基烯丙基焦磷酸(二甲基烯丙基二磷酸或DMAPP)进行缩合,生物合成得到。两种已知途径用于产生IPP和DMAPP,命名为真核生物的甲羟戊酸酯-依赖(MEV)途径(图.3),和原核生物的独立甲羟戊酸酯-或脱氧木酮糖-5-磷酸酯(DXP)途径。植物使用MEV途径和DXP途径。通过对含异戊二烯基二磷酸的合成酶(如分别是GPP合成酶,FPP合成酶,和GGPP合成酶)的作用,IPP和DMAPP依次与聚异戊二烯二磷酸(如香叶二磷酸或GPP,法呢基二磷酸或FPP,和香叶基二磷酸或GGPP)缩合。通过萜类合酶,所述聚异戊二烯二磷酸的中间体转化为更复杂的类异戊二烯结构。由萜类合酶组成大的来自多个产品的基因家族。萜类合酶的实例包括单萜合酶,其可以将GPP转化为单萜;二萜合酶,其可以将GGPP转化为二萜;和倍半萜合酶,其可以将FPP转化为倍半萜。倍半萜合酶的实例有金合欢烯合酶,其可以将FPP转化为金合欢烯。萜类合酶对于调节路径通量到一个类异戊二烯是很重要的,因为他们在代谢分支点起作用,并通过所述细胞指示类异戊二烯类型的产生。此外,所述萜类合酶掌握了高产率生产所述萜类的关键。同样地,在工程化用于异源类异戊二烯生产的宿主内,提高路径通量的策略是引入多个编码萜类合酶的核酸副本。譬如,在含有所述MEV路径的工程化微生物中,其中所述倍半萜类如金合欢烯的生产是需要的,一个倍半萜合酶,如金合欢烯合酶是用作所述路径的终端酶,且多个金合欢烯合酶基因的副本可以被引入所述宿主细胞,并有助于一个优化金合欢烯生产的菌株的产生。因为任何类异戊二烯的生物合成依赖于含异戊二烯二磷酸合酶和萜类合酶的相同路径组成的上游,这些路径组成,一旦工程化进入一个宿主“平台”菌株,可以用于任何倍半萜的生产,和通过将所述特定的倍半萜合酶引入到所述宿主细胞中,所述倍半萜的同一性可以被决定。此外,具有不同异戊二烯单元萜类的生产是需要的,例如一个单萜代替一个倍半萜,两个含异戊二烯基二磷酸合酶和萜类合酶可以被替代,从而产生不同的萜,然而,仍然使用所述路径的上游组分。相应地,本发明提供的方法和组合物可以用于有效修饰一个含有类异戊二烯生产途径的宿主细胞,如利用所述MEV途径生产一个所需的类异戊二烯。在一些实施例,所述宿主细胞包含所述MEV途径,且本发明提供的同时多重整合的方法可用于同时引入多个含异戊二烯基二磷酸合酶和/或萜类合酶的副本,从而定义所述宿主细胞的萜类产品配置。在一些实施例,所述含异戊二烯基二磷酸合酶是GPP合酶,和所述萜类合酶是单萜合酶。在一些实施例,所述含异戊二烯基二磷酸合酶是FPP合酶,和所述萜类合酶是倍半萜合酶。在一些实施例,所述含异戊二烯基二磷酸合酶是GGPP合酶,和所述萜类合酶是二萜合酶。在其他实施例,所述宿主细胞包含所述MEV途径和含异戊二烯基二磷酸合酶和/或萜类合酶,用于生产第一种萜类,譬如,金合欢烯,并且本发明提供的同时多重整合的方法可以用于同时替换一个或多个含异戊二烯基二磷酸合酶和/或萜类合酶的副本,从而生产第二种萜类,如紫穗槐二烯。所述这些实例具体在下述实施例3和4中举例说明。本发明所述的方法同样可以用于构建和/或修饰任何利用多个路径组成的副本的生物合成路径,并特别用于工程化宿主细胞,所述宿主细胞的产品配置通过添加或交换多个单一路径组成的副本,可容易地进行修饰。6.实施例6.1实施例1:使用CRISPR,通过整合3个基因缺失结构,同时删除gRNA递送的多种方式的比较这个实例提供了证明使用CRISPR同时删除酿酒酵母内所述RHR2、HO和ADH5ORFs(采用整合一个短连接序列)的结果。简言之,产生嵌合的gRNAs并靶向作用包含在所述RHR2、HO和ADH5的ORF内的独特序列,并且以各种结构因素转化为表达所述Cas9蛋白的宿主细胞,其中所述Cas9蛋白是来自酿脓链球菌的II型细菌性CRISPR系统。转化的菌落通过使用一个短连接序列替换一个、两个或三个ORFs的菌落PCR(cPCR)来进行筛选。6.1.1Cas9p的组成型表达一个野生型酿酒酵母菌株,(CEN.PK2、Mata、ura3-、TRP1+、leu2-、MAL2-8C、SUC2)可用作一个来自酿脓链球菌的Cas9p的组成型表达的宿主细胞。在中等强度FBA1启动子的控制下,一个含有优化Cas9编码序列的酵母密码子的结构的基因组整合,是靶向作用所述GRE3位点。6.1.2在RHR2、HO和ADH5ORFs内,CRISPR靶位点的选择靶向所述靶向的ORFs内的候选CRISPR是基于PAM序列N(19)NGG的存在,而被识别。所述NGG序列被称为PAM序列,和在所述PAM序列之前的DNA的8个碱基对,对于执行特异性尤其重要(Fuetal.,NatBiotechnol31(9):822-826(2013);Ranetal.,NatProtoc8(11):2281-2308(2013))。然后,候选位点基于所述基因组内所述靶序列的独特性进行排名,与所述基因组内其他位点具有最低相似性的位点,将被选择用来最小化脱靶切割的风险。靶位点如表2所示。表2:CRISPR靶位点6.1.3gRNA递送方式通过与通用结构性RNA和特异性靶向RNA联合,Cas9p靶向于切割位点。现有标准“嵌合的”结构在这项工作中被采用,其中,将所述靶向和结构性RNAs进行融合,从而产生一个单一的向导RNA,或gRNA(Ran,Hsuetal.2013)。所述gRNA结构的表达是通过SNR52聚合酶III启动子与SUP4终止子来驱动的(DiCarlo,Norvilleetal.2013)。分别靶向所述RHR2、HO和ADH5位点的gRNA结构序列,是本发明所提供的序列号为(SEQIDNOs):7、8和9。gRNA递送的几种方式被应用,如上述5.2.1部分和图.7所述。来自pRS4XX-系列2载体(SikorskiandHieter1989)的所述gRNA盒的表达通过下述任一方式实现:1)在转化成Cas9-表达酵母菌株之前,采用标准克隆方法来生成完结的环状质粒(图.7.1和7.2),或2)通过体内缺口修复,使所述gRNA盒聚集到环化的质粒上,通过将所述盒直接转化为Cas9-表达酵母菌株,和线性化的载体支柱(Orr-Weaver,Szostaketal.1983)(图.7.4)。所述gRNA盒的终点和所述线性载体支柱(SEQIDNO:10)之间的同源区域(~500bp),促进体内环状gRNA质粒的聚集。或者3)所述gRNA直接从线性盒进行表达,与一个承受NatA(来自诺尔斯链霉菌属的诺尔丝菌素乙酰转移酶)选择标记(SEQIDNO:11)的封闭质粒共转化,从而选择转化细胞(图.7.3)。最后,在第三种方法的变体中,4)通过在所述NatA标记(SEQIDNO:12)内的PCR,所述线性盒与线性化的载体共转化,如此,一个所述NatA标记的中心编码序列丢失;可以通过缺口修复重组,从而重新创造可承接一个完整NatA表达盒的所述封闭质粒的一个互补重叠的NatAORF片段(SEQIDNO:13),也可以共转化(图.9B;将于下述实施例2中讨论。为了创造环状gRNA质粒(递送方式1),退火处理的寡核苷酸通过缺口修复进入大肠杆菌(Mandecki1986)内的一个线性化支柱,所述寡核苷酸含有所述CRISPR种子序列和与所述盒同源的20bp的上游/下游,正确的克隆将被确认,并且将所述成品质粒转化为宿主菌株。为了制备与所述线性化载体具有~500bp侧翼同源的完整长度的线性gRNA盒(递送方式2、3和4),一个PCR聚集方法被应用。使用一个通用gRNA盒作为样板,使用引物来创造含有所述独特CRISPR种子序列的22个碱基对的中心重叠,半数盒将被扩增。然后,两个半盒聚集在第二个PCR反应,从而生成一个完整长度的gRNA表达盒。10l未纯化的PCR聚集(通常20-60ng/l浓度通过与DNA标记梯的比较来确定),和150ng线性化的2载体用于每个转化。6.1.4线性供体DNA的生成线性供体DNAs包含靶向作用于每个ORF的500bp上游和下游同源区域,其在中心连接的侧翼(CGCTCGTCCAACGCCGGCGGACCT),并且通过美国专利号US8,221,982中所述的多核苷酸聚集的方法来生成。分别整合到所述RHR2、HO和ADH5位点中的供体DNA序列,是如本发明所提供的序列号为(SEQIDNOs):14、15和16。6.1.5使用CRISPR同时删除ORF和整合一个短连接序列使用优化的LiAc方法(GietzandWoods2002),采用在42℃热震之前,在30℃下增加孵化细胞30分钟,供体DNA(~1g)和适当的gRNA试剂共转化为每个Cas9表达菌株。在置于含有选择性抗生素媒介(诺尔丝菌素,100g/ml)的板中,从而维持所述gRNA标记质粒之前,在非选择性YPD(酵母浸出粉胨葡萄糖)媒介中,将细胞进行过夜恢复。如果菌落PCR(cPCR)使用引物,使所述5’整合侧翼的上游结合可产生正确扩增子的所述整合连接序列(表3),无标记整合将得分为正,其结果表明为一个靶向整合事件。表3.用于cPCR验证在RHR2、HO和ADH5位点连接整合的引物序列6.1.6结果与讨论缺口修复递送方式:四种gRNA递送方式是针对同时删除所述RHR2、HO和AHD5开放性阅读框并整合一个短连接序列的效率来进行评估的。对于评估三重整合的菌落PCR的结果如图.8所示,其比率总结在表.4中。表4.关于改变gRNA结构递送的三重整合的比率类型三重比率三重选择,质粒gRNAs0.91单一选择,质粒gRNAs0标记质粒,线性gRNAs0缺口修复线性gRNAs0.64在gRNA递送的第一个方式中,三个gRNAs(分别靶向作用于RHR2、HO和ADH5)中的每个是在承载独特标记的质粒上提供(NatA、URA3盒和HIS3盒;参见图.7.1),且细胞与所有三个质粒进行转化,并三重选择每个标记的表达。三重删除(通过整合)非常高的效率(91%)已被观测到(图.8,板1)。所述这些高效率可能是由于通过三重选择承载其盒的质粒,所有三个gRNAs持续表达所致。相比之下,第二种方式,其中所述gRNAs是在三个承载所述相同标记的质粒上提供(NatA;参见图.7.2),未能生成任何三重删除(图.8,板2)。反而,主导的单一删除与所述删除需求是相符的,从而维持所述三个质粒中的仅一个质粒。在第三种方式中,所述gRNAs提供作为线性盒,与包括NatA标记的质粒来选择转化细胞(见图.7.3)。未观测到三重删除,且极低比率的任何删除事件被观测到(图.8,板3)。这种递送方式预计将导致gRNA结构的短暂表达,且这种方式似乎不如持续表达。探究的第四种递送方式需要将所述三个gRNA盒缺口修复成一个承载所述NatA标记的线性化的载体(见图.7.4)。申请人观测到64%的菌落将被三重删除(图.8,板4)。这是一个令人吃惊的结果,因为这种递送方式不执行像第一种方式那样的所有三个gRNAs的持续表达。的确,第二种方式的结果清楚表明,三个标记样gRNA质粒的共转化是无效的,且第三种方式的结果表明gRNAs从线性盒进行短暂表达同样是非功能性的。因此,对于与作为一种gRNA盒递送方式的缺口修复相关的CRISPR/Cas-9介导的基因组整合事件,有意想不到的有利好处。6.2实施例2:通过缺口修复来选择HR感受态细胞所述这个实例来证明缺口修复的好处,独立选择gRNA表达的好处,用于提高核酸酶介导的整合事件的有效性。通过CRISPR(或任何位点特异性核酸酶),缺口修复可能提高工程化菌落恢复的其中一个作用机理,是通过强制执行细胞的一个附加选择,所述细胞精通同源重组(HR)。HR的精通程度可以在一个异步的细胞群中广泛改变(参见如BranzeiandFoiani,NatRevMolCellBio9(4):297-308(2008)),选择可以完成承载一个选择标记的质粒的缺口修复的细胞可以选择一个特别精通HR的细胞群。这个可以解释所述第四种gRNA递送方式令人惊讶的成功(图.7.4和8.4),如实施例1中的讨论。为了解开来自至少所述gRNAs中的一个的持续表达的选择机理的缺口修复的影响,申请人通过共转化所述适当的供体DNA和线性gRNA盒(如上述实施例1所述)和两个标记载体中的一个,分别评估了单一删除所述RHR2、HO和ADH5位点的比率。第一个标记载体是关闭的,即没有哪个缺口修复对于NatA标记在转化细胞内的表达是必需的(图.9A)。第二个标记是线性化的,如此所述NatA标记的中心部分是缺失的,但可以通过一个重叠片段的缺口修复来补全,从而产生一个关闭的、功能化的承载完整NatA表达盒的标记载体(图.9B)。在所述两种情况下,所述gRNA的表达仅是暂时的。在三个独立的实验中,当标记质粒需要缺口修复时,申请人注意到单一位点删除的比率提高了多达8倍(平均范围为~3-5倍)(图.9,其比率总结如图.10-12所示)。所述这些结果支持下述假设,即缺口修复可以充当精通HR的细胞的附加选择,从而,最有能力成功进行核酸酶辅助的工程化,尤其是靶向整合供体DNA。申请人注意到酿酒酵母尤其擅长HR,并且在细胞内,喜好的NHEJ和其他不完美的修复方法(如哺乳动物细胞),申请人建议在增加承载一个或多个靶向整合的细胞的恢复方面,缺口修复是特别有效的。6.3实施例3:通过多片缺口修复来提高HR感受态细胞的选择所述这个实例证明通过进一步分割所述载体,从而增加标记载体缺口修复的复杂度,可以进一步提高核酸酶辅助的工程化的效率。Cas9-表达单倍体酵母细胞(酿酒酵母)与供体DNAs同时转化,无标记删除Gal80、HO和ADH5开放性阅读框,gRNA结构靶向作用每个位点,和线性化载体支柱,如实施例1所述,通过所述载体支柱被分割成两个碎片的外加转化,每个碎片包含互相重叠的同源区域(47bp),以及与所述gRNA盒重叠的同源区域(~500bp)。如此通过缺口修复一个合并所述gRNA盒的环状NatA标记质粒,从而允许3-片式体内聚集。所述NatA标记ORF被包含在所述两个支柱片段的其中一个上面,然而驱动NatA表达的启动子(乳酸克鲁维酵母Tef1启动子)被包含在所述两个支柱片段的另一个上面,因此,NatA表达可能仅依靠HR-介导的所述片段的聚集。分别靶向作用于每个所述Gal80、HO和ADH5位点的供体DNA序列,靶向作用于每个位点的gRNA结构,和两片式与三片式体内聚集的标记质粒片段,均如本发明提供的序列号(SEQIDNOs)为:21至29。所述Gal80、HO和ADH5位点分别的靶位点,如表5所示。表5:CRISPR靶位点细胞的转化和培养如实施例1所述,且通过cPCR使用一个结合在所述缺失结构外围的上游正向引物,和一个结合在短连接序列上的逆向引物,所述短连接序列整合在每个开放性阅读框的位置,对于在每个位点所述缺失结构的整合,对出现在选择中的菌落进行分析。对于每个递送方式,对11个菌落以及充当阴性对照(“N”)的一个亲本的菌落THAT进行分析。表6.用于cPCR在Gal80、HO和ADH5位点验证连接整合的引物序列如图.13所示,当三个HR事件需要聚集所述标记载体,相较于当仅需要两个HR事件时,同时在所有三个位点进行三重整合的比率实质上更高。尤其,采用2-片式体内聚集所述标记载体,6/11的菌落在所述Gal80位点有一个整合,10/11的菌落在所述HO位点有一个整合,7/11的菌落在所述ADH5位点有一个整合,和5/11的菌落(45.4%)在所有三个位点均有一个整合。相比之下,采用3-片式体内聚集所述标记载体,9/11的菌落在所述Gal80位点有一个整合,10/11的菌落在所述HO位点有一个整合,10/11的菌落在所述ADH5位点有一个整合,和9/11的菌落(81.8%)在所有三个位点均有一个整合。因此,需要3-片式缺口修复所述标记载体代替2-片式缺口修复,并提高了三重整合的比率近2倍。为了确定多重整合的比率是否有提高还可以参见在酿酒酵母的二倍体菌株中的情况,同样地,所述二倍体酵母菌株CAT-1的Cas9-表达细胞与供体DNAs转化的同时,泛等位基因,无标记删除Gal80、HO和ADH5开放性阅读框,gRNA结构靶向作用于每个位点,和选择性DNA分裂成2或3个重叠碎片。通过cPCR,使用一个在所述缺失结构外围的上游正向引物,和与一个短连接序列结合的逆向引物,所述短连接序列整合在每个开放性阅读框的位置,对菌落进行分析(表6)。如图.14所示,当HR事件需要聚集所述标记载体时,在所述二倍体的所有三个位点同时进行三重整合的比率也实质上较高。尤其,采用2-片式体内聚集所述标记载体,3/24的菌落在所述Gal80位点有一个整合,7/24的菌落在所述HO位点有一个整合,2/24的菌落在所述ADH5位点有一个整合,和1/24的菌落(4.2%)在所有三个位点均有一个整合。相比之下,采用3-片式体内聚集所述标记载体,3/8的菌落在所述Gal80位点有一个整合,5/8的菌落在所述HO位点有一个整合,3/8的菌落在所述ADH5位点有一个整合,和3/8的菌落(37.5%)在所有三个位点均有一个整合。因此,需要3-片式缺口修复所述标记载体代替2-片式缺口修复,并提高了在二倍体菌株内三重整合的比率近10倍。从所述实验恢复的菌落数量也减少了大致10倍时,3个事件是必需时(数据未显示),表明需要更高阶所述标记载体的聚集来选择唯一最有能力HR的细胞群。6.4实施例4:使用CRISPR联合缺口修复引入单一或多重点突变所述这个实例证明,如实施例1所述的优化方案的应用(方式4:体内HR-介导的将gRNA盒并入标记载体支柱),用于引入精确点突变或修正点突变。当前,在单一位点引入点突变是一个冗长的过程。DelittoPerfetto方法允许无标记引入点突变,但需要整合一个含有接近所述靶位点的可诱导大范围核酸酶的标记盒(Storicietal.,ProcNatlAcadSciUSA100(25):14994-9(2003))。或者,一个承载URA3标记的复合整合盒可以进行设计并在所述靶位点整合,如此随后缺乏所述URA3的循环,通过5-FOA逆向选择来重新构建包含所述点突变的基因位点。所述这两个方法对于必要基因是有问题的,需要至少两轮基因工程,并且不适合多路复用技术。对于通过CRISPR引入一个点突变(即一个错义SNP)已有几个考虑。首先,除了在所述基因组中是独特的,针对切割的位点应该尽可能靠近所需SNP的位点(图.15)。这是因为重组修复所述切割位点不需要合并所述所需的SNP,并且其包含的可能性预计将减少与切割位点的距离。其次,对于最佳效率,所述供体DNA应该被设计,如此它也不是CRISPR的目标。的确,这个问题被DiCarlo等引用来解释,在他们的实验中可观测到的通过CRISPR,SNP整合的低比率(DiCarloetal.,NucleicAcidsRes.,7,4336–4343(2013)))。为了避开切割,所需的SNP需要在所述供体DNA内破坏所述CRISPR靶位点,一个不可能的要求在大多数位点得到满足。为了使所述供体DNA免受切割,并同时提高包括所需SNP重组事件的可能性,采用异源块法在所述靶位点和所述点突变之间的密码子中制备得到沉默突变,减少潜在的可能省略所需SNP的重组事件(图.15)。此外,所述异源块的整合提供了一个新的引物结合位点,从而通过PCR来鉴定候选克隆个体。作为一个原则性证明,已经历突变发生的酵母细胞(酿酒酵母)的突变等位基因使用上述方法,针对与相应野生型等位基因进行替换。在如实施例1所述的中等强度FBA1启动子的控制下,诱变处理的菌株是用于结构型表达Cas9。而后,所述Cas9p-表达菌株与供体DNAs一同转化(每次一个,对于单一整合事件),其中所述供体DNAs靶向作用于每个所述TRS31、CUE5、ECM38、PGD1、SMC6、NTO1和DGA1开放性阅读框,并且gRNA结构靶向作用每个位点,其中每个位点包含线性NatA标记质粒支柱重叠的同源区域,并通过缺口修复允许环状质粒的体内聚集。细胞的转化和培养如实施例1所述,然后评估在所述7个位点的每一个位点引入点突变(逆转等位基因)。对于所述异源块和侧翼序列,对候选菌落和亲本的阴性对照(c)通过菌落PCR进行分析,选定的阳性菌落是通过测序一个跨越在所述整合位点的更大PCR产物来进行确证。表7.用于cPCR验证等位基因交换的引物序列分别靶向作用于所述TRS31、CUE5、ECM38、PGD1、SMC6、NTO1、DGA1、ADH2、SIN4和CYS4位点的供体DNA序列;所述每个位点的靶序列,和靶向作用于每个位点的gRNA结构是本发明提供的序列号(SEQIDNOs)为:67-96。如图.16所示,在每个位点,观测到异源块整合的高比率(范围从36.4%至90.9%),跨越所需突变的PCR片段的随后的测序显示,大多数克隆包含所需等位基因。为了确定多路引入点突变的可能性,使用多个gRNAs的优化递送方式,使三个位点(ECM38、PGD1和ADH2)同时被靶向作用,进行异源块整合(等位基因交换)。如图.17所示,三个异源块整合的高比率通过PCR分析进行观测(90.9至100%)。为了确定更高阶多重整合是否可行,5个位点(ADH2、PGD1、ECM38、SIN4和CYS4)以一个相似方式,同时进行靶向作用。如图.18所示,同时五倍量异源块整合是通过在2/11菌落(18.2%)中进行cPCR分析来确证的。作为第二个原则性证明,11个不同突变体等位基因被引入原生的酿酒酵母菌株,对于通过这些SNPs所赋予的表型,对所得菌株进行了测试。在检验的等位基因中,其中一个等位基因与工业发酵相关,并赋予更快的沉积(ACE2S372*)(Oud,Guadalupe-Medinaetal.,ProcNatlAcadSciUSA110(45):E4223-4231,2013),在基因中,一系列对温度变化敏感的等位基因对细胞分裂和所述分泌途径是必需的(SEC1G443E,SEC6L633P,MYO2E511K,CDC28R283Q)(LorinczandReed,MolCellBiol6(11):4099-4103,1986;Roumanie,Wuetal.JCellBiol170(4):583-594,2005),并且另一对涉及改善高温生长(NCS2H71LandEND3S258N)(Sinha,Davidetal.,Genetics180(3):1661-1670,2008;Yang,Foulquie-Morenoetal.,PLoSGenet9(8):e1003693,2013)。此外,对与耐乙醇浓度升高有关的一系列五个等位基因进行了测试(SPT15F177S、SPT15Y195H、SPT15K218R、PRO1D154N和PUT1缺失)(Takagi,Takaokaetal.,ApplEnvironMicrobiol71(12):8656-8662,2005;Alper,Moxleyetal.,Science314(5805):1565-1568,2006)。对于引入大多数个体等位基因,可以观测到异源块整合的高比率(>90%)(图.22),并且跨越在所需突变的PCR片段的随后测序来确证这些改变。在许可和限制性温度下,所述对温度变化敏感的突变体进行测试,从而确证他们的目标表型。在ACE2的截断引起细胞分裂期间,细胞不完整的分离是通过亮场显微镜与急剧聚集的细胞来进行确证(图.23A)。不出所料,对温度变化敏感的等位基因CDC28、MYO2和SEC1未能在37℃下生长(图.23B),且所述CDC28等位基因菌株在生长的G1期被捕捉到(图.23C)。为了证明在所述SEC1和SEC6突变体,在限制性温度下的分泌缺陷,泡外复合组成SEC3是在其内源性位点,羧基-末端以GFP标记(同样使用CRISPR),从而起到报告分泌活动的作用。SEC3通常定位在野生型细胞的苞芽上,但其定位显然被破坏在两个分泌突变体中(图.23D)。在很多情况下,一个表型是由复等位基因的协同作用所致,但工程化此类菌株将更费时间,并且通常不是尝试性的。所述优化的多重方法将用于解决此类问题。原生的CENPK2承载一个用于高温生长的等位基因(MKT1D30G)(Yang,Foulquie-Morenoetal.2013),并且两个附加的突变被引入NCS2和END3。当在一定范围温度下生长过夜,所述两个个体等位基因均未受影响。然而,含有两个附加等位基因的菌株以一步整合,并在温度多达42.7℃下存活(图.23E)。在此实验中,耐乙醇的等位基因还被赋予协同作用影响。野生型CENPK2能容忍多达17.5%乙醇(图.23F)。SPT15中的突变增加抵抗多达20%的乙醇(图.23F)。为了检测这些等位基因之间的相互作用,在三个位点的五个靶向作用变化同时被引入一个原生的菌株(在SPT15、PRO1D154N和PUT1缺失的三个突变)。通过使用两个gRNAs来切除~150bp含有所述三个等位基因的基因,在SPT15的三个突变被引入一个单一供体DNA上。27%的所得克隆体含有通过菌落PCR来进行评估,并通过测序来进行确证的所有五个修饰(图.22)。所得菌株具有最高乙醇耐受性,多达22.5%乙醇(图.23F)。这些结果表明,多路复用CRISPR允许快速评估关于因果等位基因组合的假设。所述这些结果表明,使用本发明提供的CRISPR-介导的基因组整合的优化方法和组合物,精确点突变或逆转可以在高效率和高多重型的情况下完成。6.5实施例5:二倍体细胞的双等位基因工程所述这个实例证明,应用如实施例1所述的优化方案(方式4:体内HR-介导的将gRNA盒并入标记载体支柱),用于同时在二倍体酵母菌株中进行双等位基因整合。二倍体工业化SC菌株是高度杂合的,具有多个未映射的但有益的发酵特质。然而,这些菌株通过标准方法很难进行工程化,需要两个连续整合步骤和不同标记来删除一个基因或引入双等位基因工程。因此,在酿酒酵母的CAT-1和PE-2二倍体工业菌株内,所述GAL80位点的CRISPR-介导的双等位基因缺失的效力,是使用实施例1所述的优化方案进行测试的。靶向作用于所述Gal80位点的供体和gRNA序列如实施例3所述。如图.19所示,与供体DNA一同转化的Cas9-表达菌株的cPCR,和靶向作用所述Gal80位点并与一个共转化线性NatA标记载体支柱具有同源性末端的线性gRNA盒,揭示了在CAT-1和PE-2二倍体细胞中,双等位基因供体整合率分别为100%(图.19B)和90%(图.19C)。这些比率可与在已获得的单倍体CENPK2菌株中相同缺失的比率相媲美(100%;图.19A)。所述这些结果证明了本发明提供的用于工程化二倍体宿主细胞的CRISPR-介导的基因组整合的优化方法和组合物的效力。6.6实施例6:完整生物合成途径的多重整合所述这个实例证明,应用如实施例1所述的优化方案(方式4:体内HR-介导的将gRNA盒并入标记载体支柱),用于将一个完整生物合成途径同时整合到一个原生酵母菌株中。通常,工程代谢途径,甚至在易处理的宿主如酿酒酵母中,也是很费时间的。这个时间表将大大改善,如果基因盒的整合可以平行实施,并且不需要任何药物选择标记的整合。因此,CRISPR-介导的整合的优化方案可用于同时整合12个基因盒总计大约30kbDNA到酿酒酵母中,所述DNA编码一个用于生产金合欢烯的功能途径(参见美国专利号US8,415,136)。采用美国专利号US8,221,982和US8,332,160所述的多核苷酸聚集的方法,对基因盒进行设计并克隆。所述途径被分成三个供体结构,用于12个基因的整合:ERG10,编码乙酰辅酶A硫解酶;ERG13,编码HMG-CoA合酶;tHMG1(2个副本),编码HMG-CoA还原酶;ERG12,编码甲羟戊酸激酶;ERG8,编码磷酸甲羟戊酸激酶;ERG19,编码焦磷酸甲羟戊酸脱羧酶;IDI1,编码异戊二烯焦磷酸异构酶;来自青蒿素的金合欢烯合酶(2个副本);ERG20,编码法呢基焦磷酸合酶;和转录调节因子GAL4。在酿酒酵母原生的CENPK2内,所述三个结构被靶向整合到所述Gal80、HO、和BUD9位点中,其中Cas9在中等强度FBA1启动子(SEQIDNO:3)的控制下,对所述GRE3位点进行靶向作用。同时,无标记整合所有三个结构是尝试使用实施例1所述的优化缺口修复方法,且采用cPCR引物对,对克隆个体进行分析,所述引物对结合所述整合靶位点侧翼的5’位和在每个供体结构内的内部连接序列。如图.20所示,对筛选出的47个克隆体进行分析,11个克隆(23.4%)对于整合30kb组成的整个金合欢烯途径是阳性的(克隆体22、24、29-32、41-43、45和46)。第48个克隆是一个亲本的阴性对照。通过在每个靶位点侧翼的3’位的cPCR,随后对所有三倍阳性候选进行分析,以及确证对两个侧翼的整合是阳性的。随后,在一批蔗糖板模型试验中,对所述11个cPCR阳性克隆进行测试,用于金合欢烯的生产。如图.21所示,所有11个克隆生产金合欢烯的量的范围从0.1至接近1.5g/L的数量。一并考虑,这些结果证明了本发明提供的用于快速、多重代谢工程的CRISPR-介导的基因组整合的优化方法和组合物的效力。对于多重工程的优化方案可用于大幅缩短复合途径工程的时间表。譬如,当使用本发明提供的优化方法,同时引入三个点突变到一个酿酒酵母菌株中可能需要约6周的工作(1周用来引入每个等位基因,1周用来使每个标记再循环利用,总计3个周期),相对于1周。此处显示的引入基本的金合欢烯途径的时间表同样被压缩了6倍,因为节省大量时间的工艺与靶向位点的数量是并行的。作为另外的概念证明,11个含有24kbDNA的基因盒的多重整合分布在三个位点,在单倍体CENPK2中尝试编码一个新的粘康酸路线(图.24)。粘康酸是一个前体分子,具有巨大潜能用于生产包括尼龙-6,6,聚氨酯,和聚对苯二甲酸乙二醇酯(PET)的生物塑料。当前,粘康酸是通过有机合成从石油衍生原料制得,但一种可再生能源是所需的。粘康酸的生物合成是通过芳香族氨基酸(莽草酸酯)生物合成途径的过表达来完成的。先前,粘康酸的高水平生产(36.8g/L,分批补料发酵)是在大肠杆菌中完成的(Niu,Drathsetal.,BiotechnolProg18(2):201-211,2002)。然而,用酿酒酵母进行较低pH值发酵将促进下游加工和工业化过程。在原则上努力地证明,在一个工程化酿酒酵母菌株的摇瓶实验中,已观测到多达141mg/L的滴定量(Curran,Leavittetal.,MetabEng15:55-66,2013)。与在酿酒酵母中的初次尝试相反,所述这个实验利用大肠杆菌的莽草酸酯途径基因AROF、AROB和AROD,而非原生的ARO1基因。所述工程化途径如图.24A所示。对于整合,所述途径被分成三个分裂结构(通过体内同源重组,采用内部重叠进行重建),其靶向于CENP内的所述GAL80、HO、和ARO1位点(FIG.24B)。选择HO作为一个中立位点,虽然选择GAL80来移除半乳糖操纵子的葡萄糖抑制,并且删除所述ARO1位点来迫使通量通过所述工程化的路径。ARO1缺失也使芳香族氨基酸营养缺陷型的菌株,在生物量生产阶段(在丰富媒介中)和生产阶段(在基本培养媒介中)之间,创造一个简单的转换机制。同时,使用所述优化缺口修复方法,尝试无标记整合所有三个结构,并通过PCR对克隆体进行分析,揭示了三重整合(n=48)的比率为4.2%。值得注意的是,所述这三个结构的整合需要9个重组事件(每个位点需要两个侧翼事件和一个内部事件)。然而,观察到的比率低于所看到的多重删除,一个完整生物合成途径的引入预计将赋予一个适当性缺陷,并且这可能限制适当整合菌株的恢复。粘康酸及其中间体的生产是在96孔摇板分析试验中进行测试的,采用HPLC进行分析。一步整合菌株显示高滴度PCA(~3g/L),表明在AroY有一个瓶颈,其将PCA转化为邻苯二酚(图.24A)。为了确认下游路径的功能性,多达1g/L邻苯二酚直接供应到生产媒介孔中,并且在工程化过程中观测到,邻苯二酚定量转化为顺反粘康酸,但不是亲本的菌株,在AroY中的路径设计,可以清楚地识别一个单一缺陷。为了测试所述优化缺口修复方法在第二个工业相关酵母中的效力,将尝试整合一个更紧凑版本的在乳酸克鲁维酵母中含有6个基因的粘康酸路径。所述路径被分成三个整合结构,分别靶向作用于所述DIT1、ADH1、和NDT80位点。一个原生的乳酸克鲁维酵母菌株(ATCC8585)是通过在所述GAL80位点整合Cas9,并删除YKU80从而使非同源末端连接的影响减到最小来制得(Kooistra,Hooykaasetal.,Yeast21(9):781-792,2004;Wesolowski-Louvel,FEMSYeastRes11(6):509-513,2011)。所有三个结构的无标记整合是使用相同缺口修复方法,但与一个含有pKD1稳定性元素的质粒支柱,以一步来完成的(Chen,Wesolowski-Louveletal.,JBasicMicrobiol28(4):211-220,1988)。三重整合是以2.1%的比率发生的,如采用PCR分析的那样(n=48)。类比CENPK的结果,高滴定量的PCA(1g/L)被观测到,但没有粘康酸的生产(图.24E)。邻苯二酚喂养实验证实,在AROY功能中的相同缺陷。值得注意的是,ARO1在这个乳酸克鲁维酵母菌株中未被删除,且此差异可以解释被观测到的较低滴定量的PCA。尽管如此,这些结果证明,在两个工业相关的酵母菌株中原型粘康酸生产的能力,并在不到一个月的时间确定一个限制酶,一个工作流程帮助快速设计迭代并允许抽样两个潜在宿主。6.7实施例7:在哺乳动物细胞内提高整合所述这个实例证明,应用如实施例1所述的优化方案(方式4:体内HR-介导的将gRNA盒并入标记载体支柱),来实现在哺乳动物宿主细胞内提高整合比率。为了测试上述酿酒酵母的gRNAs的缺口修复递送方法还可以在哺乳动物细胞内提高整合比率,在HEK-293T细胞中,生成一系列试剂用于转染实验。在广泛的概述中,细胞与一个含有Cas9表达盒的线性质粒支柱,其中所述Cas9表达盒通过2A-连接融合到所述CD4表位标记的5’位,与一个含有靶向作用所述AAVS1位点的gRNA的片段,和与一个通过同源重组修复所述位点的供体DNA片段,并在EcoRI位点侧翼包含上游和下游同源用于后续诊断目的(缺口修复条件),共转化。所述这个转化可以与一个具有Cas9-2A-CD4表达盒和包含在一个封闭质粒(阳性对照)内的gRNA盒的控制反应相媲美。此外,一个不含gRNA的质粒用作阴性对照,从而评估CRISPR-Cas9不存在时,所述供体DNA的同源整合是否以一个可测量的比率发生。转染后,CD4+细胞(转染细胞)使用抗体偶联磁珠进行分离,且对所述细胞进行洗脱并用于基因组DNA的制备。进行一个包含所述整合位点区域的PCR,并且PCR产物使用EcoRI进行消化,从而确定在所述靶位点整合所述供体DNA的细胞的比例。物料和方法所述Cas9核酸酶和相关gRNA的表达。应用LifeTech/GeneArtCRISPR核酸酶与CD4富集的试剂盒(A21175)。根据制造商说明书,编码一个所述AAVS1区域(AAVS1,T2gRNA来自Mali等)内的序列的双链寡核苷酸(通过退火处理寡核苷酸CUT1216和CUT1217制备得到)被绑定到所提供的线性化载体,从而产生pAM3473(SEQIDNO:98)。所述质粒是马克西制备的(maxi-prepped,Qiagen)。适于测试缺口修复的版本pAM3473的生成。对所述pAM3473质粒与Bst1107I和NheI进行消化,从而移除整个gRNA盒,即所述CD4ORF的一部分。所述支柱采用CIP(碱性磷酸酶)进行处理,并用凝胶纯化。含有独特ClaI和XmaI位点,并且使悬臂与所述线性载体兼容的多克隆位点(MCS)双链寡核苷酸,是通过退火处理CUT1214(SEQIDNO:103)和CUT1215(SEQIDNO:104)寡核苷酸制备得到。所述双链寡核苷酸被绑定到所述纯化支柱,从而生成pAM3472(SEQIDNO:97)。所述质粒是马克西制备的(Qiagen)。在使用之前,所述质粒是通过消化ClaI和NheI从而进行线性化,并通过乙醇沉淀进行纯化/浓缩。仅含有CD4抗原表位(并无gRNA)的对照质粒的生成。pAM3473(SEQIDNO:98)与Bst1107I和PacI一同消化,且对所述支柱采用CIP处理,并用凝胶纯化。设计用于重新环化所述gRNA无盒支柱的一个双链寡核苷酸是通过退火处理CUT1254(SEQIDNO:113)和CUT1255(SEQIDNO:114)寡核苷酸,并绑定所述载体支柱从而生成pAM15068(SEQIDNO:102;曾又名“A2”)来制备得到。用于将所述AAVS1gRNA盒缺口修复成线性化pAM3472的片段的制备。所述引物CUT1220(SEQIDNO:107)和CUT1221(SEQIDNO:108)用于扩增一个来自pAM3473的2850bp片段。所述产物通过缺口修复(大肠杆菌)成RYSE09受体载体从而进行亚克隆,并且所述结构通过测序使成为pAM3515(SEQIDNO:100)来进行验证。在转染之前,线性片段使用RYSE0(SEQIDNO:117)和RYSE19(SEQIDNO:118)侧翼引物,通过PhusionPCR扩增制备得到,并且所述PCR产物使用Ampure珠(Axygen)进行纯化。在转染之前,线性片段使用RYSE0和RYSE19侧翼引物,通过PhusionPCR扩增制备得到,并且所述PCR产物使用Ampure珠(Axygen)进行纯化。用于将所述CD4-唯一对照片段缺口修复成线性化pAM3472的片段的制备。所述引物CUT1220(SEQIDNO:107)和CUT1252(SEQIDNO:111)用于一个PhusionPCR反应,使用作为样板的pAM3473,来扩增一个含有所述CD4ORF的3’末端的上游片段,且所述引物CUT1253(SEQIDNO:112)和CUT1221(SEQIDNO:108)用于扩增一个含有所述gRNA盒的侧翼同源下游的下游片段。所述这两个片段使用凝胶纯化,并与用于扩增~2kb产物的引物RYSE0和RYSE19一同用于第二个融合PCR反应。所述产物通过缺口修复(大肠杆菌)成RYSE09受体载体从而进行亚克隆,并且所述结构通过测序使成为pAM3516(SEQIDNO:101)来进行验证。在转染之前,线性片段从这个样板,使用RYSE0和RYSE19侧翼引物,通过PhusionPCR扩增制备得到,并且所述PCR产物使用Ampure珠(Axygen)进行纯化。用于在所述AAVS1靶位点引入一个EcoRI位点的供体DNA的制备。引物CUT1226(SEQIDNO:119)和CUT1223(SEQIDNO:120)使用Phusion聚合酶,用来扩增一个~570bp上游片段,所述上游片段在其来自人基因组DNA(衍生自HEK-293细胞)的3’末端,含有一个合成的EcoRI位点。引物CUT1224(SEQIDNO:109)和CUT1227(SEQIDNO:110)用于扩增一个~540bp下游片段,所述下游片段在其来自相同人基因组样板的5’末端,含有所述EcoRI位点。所述片段是使用具有RYSE0和RYSE19侧翼引物的Phusion聚合酶,通过融合PCR进行扩增,且通过缺口修复(大肠杆菌),将所述~1100bp片段亚克隆成线性化RYSE09载体。所述结构通过测序使成为(SEQIDNO:99)来进行验证。在转染之前,线性片段从这个样板,使用RYSE0和RYSE19侧翼引物,通过PhusionPCR扩增制备得到,并且所述PCR产物使用Ampure珠(Axygen)进行纯化。转染实验。根据制造商说明书(采用1.5倍DNA相对于LF3000的比率),使用脂质体3000,将70%融合附着的293T细胞与DNA进行转染。表8提供了所述DNA结构与用于每个转染的DNA数量(重复进行)。表8.48小时后,细胞使用TryplE(LifeTech)试剂获得,且CD4+细胞采用免疫磁珠阳性分离试剂盒(LifeTech)进行纯化。结合细胞是采用来自每个制造商使用说明的磁珠进行洗脱,并且基因组DNA是根据制造商说明书,使用Prepgem组织试剂盒(Zygem)进行制备得到。用于EcoRI位点整合的RFLP试验。一个RFLP试验是在使用具有引物集的Phusion聚合酶(CUT1297(SEQIDNO:116)和CUT1294(SEQIDNO:115))扩增的PCR片段(920bp)上完成的,所述引物集包含具有一个“外部”引物的所述EcoRI整合位点,如此仅供体DNA在目标基因组整合的背景下,将产生一个产物。片段是使用Ampure珠(Axygen)进行纯化,并与EcoRI进行消化。具有EcoRI位点的PCR产物通过同源重组进行整合,并产生348bp和572bp片段。具有整合EcoRI位点的样板的比例是通过密度测定法(ImageJ),使用公式:消化带密度(348bp+572bp密度)/总密度(348bp+572bp+920bp密度),来进行计算的。结果为了检验实施对缺口修复的要求是否可能增加同源整合的比率,申请人比较了EcoRI位点供体DNA插入HEK-293T细胞,并与质粒和线性DNA几个不同组合进行转染的比率(表8和图.25)。为了评估所述EcoRI供体DNA是否可能在所述AAVS1位点,以一些可观测的水平,并在目标切割不存在的情况下使用CRISPR-Cas9进行整合,细胞与质粒pAM15068进行转染,所述质粒pAM15068包含所述Cas9-2A-CD4ORF,但并不包含gRNA盒,和线性供体DNA(pAM3514PCR产物)。转染细胞采用免疫磁珠进行纯化,制备基因组样板,并消化跨越在所述整合位点的所述PCR产物,从而产生不消化的产物,其表明EcoRI位点整合的比率在CRISPR-Cas9不存在时,是无法测量的(图.25,转染2)。为了证实是否缺乏一个完整CD4ORF的线性化pAM3472质粒,便不可以自主赋予一个CD4+表型,使转染仅仅与此线性片段进行。无PCR的产物是从所述这些纯化细胞制得的样板制备得到,表明具有所述免疫磁珠的转染细胞与作为PCR反应样板的不足有关联(图.25,转染3)。为了证实缺口修复是否可以重组所述CD4ORF,所述线性化pAM3472质粒与所述CD4缺口修复片段(pAM3516PCR产物)共转染,从这些转染纯化得到的细胞的样板产生了一个920bp带,但无消化产物,如无gRNA存在一样(图.25,转染4)。接下来,对包括所述AAVS1gRNA的转染进行检测。为了建立一个具有所述AAVS1gRNA的CRISPR-Cas9系统的功能基线,申请人共转染了一个含有Cas9、CD4和所述gRNA(pAM3473)的表达盒的封闭质粒和所述线性供体DNA结构(pAM3514PCR产物)。EcoRI消化所述PCR产物,显示了572和348bp的辍学产物,并表明总PCR产物的一小部分的消化(图.25,转染6)。使用图像J软件对所述带密度进行定量,揭示了22.5%的总样板包含一个EcoRI位点。为了评估缺口修复是否可能提高此比率,申请人代替了所述线性化pAM3472载体和包含CD4的缺失部分和所述用于封闭载体的gRNA盒(pAM3515PCR产物)的缺口修复片段(图.25,转染8)。重复所述密度测定法过程,申请人观测到47.5%的总样板包含一个EcoRI位点。这说明相对于所述封闭质粒观测到的比率有2.1%倍的改善(转染6),因此,证实了在哺乳动物细胞内,用于基因组整合的改善的缺口修复方法的效果。本说明书引用的所有出版物、专利及专利申请在此通过引用参考并入本文,例如每个单独出版物或专利申请是具体地和个别地表示被纳入参考。尽管,上述发明采用清楚理解本发明目的的实例说明和例证的方式,其已在一些细节中进行描述,鉴于本发明的教导启示,在不偏离附加要求的精神和范围之内,对本发明所作出的一些改变和修饰,其对本领域普通技术人员而言是显而易见的。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1