利用可编程碱基编辑器系统编辑单核苷酸多态性的方法1.相关申请2.本申请主张2018年5月11日提交的美国临时申请号62/670,588,2018年12月17日提交的美国临时申请号62/780,838和2019年3月13日提交的美国临时申请62/817,986的优先权和利益,其整体内容通过引用并入本文。
背景技术:
::3.rett综合征(rtt或rett)是由甲基cpg结合蛋白2(mecp2)基因中的一组异质突变引起的,这些突变削弱或消除了编码蛋白修饰中枢神经系统(cns)中染色质和转录状态的能力。当在整个中枢神经系统中广泛传播时,提供功能性mecp2的基因疗法或使用rna编辑修复内源性mecp2mrna转录物是有希望的治疗干预方法。但是,两种方法都必须克服重大挑战才能达到治疗效果。mecp2基因疗法必须严格控制每细胞递送基因的剂量,否则有模仿mecp2复制综合征表型的风险。rna编辑平台无法准确校正占rtt诊断超过45%的最普遍的mecp2突变,并且无法诱导有效的,不受指导的脱靶编辑。4.mecp2中引起rett综合症(rtt)的基因突变是高度异质的。因此,一种受人欢迎的治疗策略是递送重组腺相关病毒(raav)携带的野生型mecp2。因为所述策略与每个个体的因果突变无关,所以成功的基因治疗方法将为大部分rtt患者群体提供治疗选择。然而,迄今为止,所述策略已经取得了有限的成功。rtt患者几乎总是杂合的女性,由于随机的x染色体失活,导致中枢神经系统(cns)内具有特征性的野生型和突变x染色体mecp2镶嵌表达。因此,已经表达野生型mecp2的神经元中的raav传递和野生型mecp2的表达可能部分模拟mecp2复制综合征的表型。与此一致的是,rtt模型小鼠中枢神经系统的高转导效率导致mecp2表达比野生型小鼠高约2倍。5.因此,需要用于治疗rett综合征的新颖组合物和方法。6.参考文献援引7.本申请说明书中提到的所有出版、专利和专利申请都以相同的程度通过引用并入本文,如同明确地和独立地指出个别独立的出版物、专利或专利申请通过引用并入。除非另有说明,否则本说明书中提及的出版物、专利和专利申请通过引用整体并入本文。技术实现要素:8.如本文所述,本申请的特征在于一种使用可编程核碱基编辑器精确校正病原性氨基酸的组合物和方法。特别地,本申请的组合物和方法可用于治疗rett综合征(rtt)。因此,本申请提供一种使用腺苷(a)碱基编辑器(abe)来精确校正内源性mecp2基因中的单核苷酸多态性,以校正有害突变(例如r133c、t158m、r255*、r270*、r306c)。9.一方面,本申请提供一种编辑包含与rett综合症(rtt)相关的单核苷酸多态性(snp)的mecp2多核苷酸的方法,所述方法包括使mecp2多核苷酸与碱基编辑器接触,所述碱基编辑器与一种或多种指导多核苷酸复合,其中碱基编辑器包括多核苷酸可编程dna结合结构域和腺苷脱氨酶结构域,并且其中一种或多种指导多核苷酸靶向碱基编辑器,以造成与rtt相关的snp的a·t到g·c改变。10.另一方面,本申请提供了通过向细胞或其祖细胞中引入碱基编辑器或编码所述碱基编辑器的多核苷酸至所述细胞而产生的细胞,其中所述碱基编辑器包括多核苷酸可编程dna结合域和腺苷脱氨酶域;以及靶向碱基编辑器的一种或多种指导性多核苷酸,以造成与rtt相关的snp的a·t到g·c改变。11.另一方面,本申请提供了一种在受试者中治疗rtt的方法,所述方法包括向所述受试者施用:碱基编辑器或编码所述碱基编辑器的多核苷酸给所述受试者,其中所述碱基编辑器包括多核苷酸可编程dna结合域和腺苷脱氨酶域;以及靶向碱基编辑器的一种或多种指导性多核苷酸,以造成与rtt相关的snp的a·t到g·c改变。12.在另一方面,本申请提供了碱基编辑器,其包括:(i)修饰的spcas9,其包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332a、r1335q、t1337、t1337l、t1337q、t1337i、t1337v、t1337f和t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代;(ii)腺苷脱氨酶。13.在另一方面、本申请提供了碱基编辑器,其包括:(i)修饰的spcas9,其包含d1135l、s1136r、g1218s、e1219v、a1322r、r1335q和t1337、以及l1111r、g1218r、e1219f、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、t1337l、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337s和t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代(ii)腺苷脱氨酶。14.在各种实施方案中,接触是在细胞、真核细胞、哺乳动物细胞或人类细胞中。在各种实施方案中,细胞是体内或离体的。在各种实施方案中,所述改变是r106w、r168*、r133c、t158m、r255*、r270*和r306c中的一个或多个。在各种实施方案中,与rtt相关的snp处的a·t至g·c改变将甲基cpg结合蛋白2(mecp2)多肽中的半胱氨酸变为精氨酸,蛋氨酸变为苏氨酸,或终止密码子变为精氨酸。在各种实施方案中,与rtt相关的snp导致mecp2多肽的表达,所述mecp2多肽包含在氨基酸位置168、133、255、270或306处的精氨酸。或在位置158上苏氨酸。在各种实施方案中,多核苷酸可编程dna结合结构域是化脓性链球菌cas9(spcas9)或其变体。在各种实施方案中,多核苷酸可编程dna结合结构域包含具有改变的原间隔物相邻基序(pam)特异性的修饰的spcas9。在各种实施方案中,改变的pam对核酸序列5’‑ngt‑3’具有特异性。在各种实施方案中,修饰的spcas9包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d2v2ld1332k、d1332r、r1335q、t1337、t1337l、t1337q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337h、t1337q和t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代。在各个实施方案中、修饰的spcas9包含d1135l、s1136r、g1218s、e1219v、a1322r、r1335q和t1337、以及l1111r、g1218r、e1219f、d1332a、d1332s、d1332t、d1332v、dk2l、d1332l、d1332vd1332r、t1337l、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q和t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代。在各种实施方案中,多核苷酸可编程dna结合结构域是核酸酶失活或切口酶变体。在各种实施方案中,切口酶变体包含d10a的氨基酸取代或其相应的氨基酸取代。在各个实施方案中,腺苷脱氨酶结构域能够使脱氧核糖核酸(dna)中的腺苷脱氨。在各种实施方案中,腺苷脱氨酶是自然界中不存在的修饰的腺苷脱氨酶。在各种实施方案中,腺苷脱氨酶是tada脱氨酶。在各种实施方案中,tada脱氨酶是tada*7.10。在各种实施方案中,一种或多种指导rna包含crisprrna(crrna)和反式编码的小rna(tracrrna),其中crrna包含与mecp2核酸序列互补的核酸序列,所述mecp2核酸序列包含与rtt相关的snp。在各种实施方案中,碱基编辑器与单链指导rna(sgrna)复合,其中所述单链指导rna包含与mecp2核酸序列互补的核酸序列,其中所述mecp2核酸序列包含与rtt相关的snp。在各种实施方案中,细胞是神经元。在各种实施方案中,神经元表达mecp2多肽。在各种实施方案中,细胞来自患有rtt的受试者。附图说明15.在所附权利要求中具体阐述本公开的特征。通过参考下面的详细描述,可以更好地理解本申请的特征和优点,所述详细描述阐述说明性实施例,在实施例中应用本公开的原理及其附图:16.图1是描绘使用对ngtpam具有特异性的碱基编辑器变体对r255xrtt突变进行精确校正的百分比的图。17.图2是描绘使用对ngtpam具有特异性的碱基编辑器变体对r255xrtt突变进行精确校正的百分比的图。18.图3是描述具有t1337l的氨基酸取代的pam变体优化的图。显示使用对ngtpam具有特异性的碱基编辑器变体的r255xrtt突变的精确校正百分比。19.图4是描绘由对ngtpam具有特异性的pam碱基编辑器变体对r255xrtt突变进行精确校正的百分比的图,所述ngtpam是通过改组来自其他表征pam变体的突变而产生的。t1337q被认为对提高编辑效率很重要。20.图5是描绘当t1337和d1332被其他氨基酸取代时碱基编辑效率的变化的图。显示使用对ngtpam具有特异性的碱基编辑器变体的r255xrtt突变的精确校正百分比。21.图6是描绘e1219v和r1335q对于与t1337相关的碱基编辑活动的重要性的图。显示使用对ngtpam具有特异性的碱基编辑器变体的r255xrtt突变的精确校正百分比。22.图7是描述使用对表8和9列出的ngtpam变体具有特异性的pam变体碱基编辑器对r255xrtt突变进行精确校正的百分比的图。23.图8是描绘使用对表8和表9所列的ngtpam变体具有特异性的pam变体碱基编辑器对r255xrtt突变进行精确校正的百分比的图。24.图9是描绘使用对表10中所列的ngtpam变体具有特异性的pam变体碱基编辑器精确校正r255xrtt突变的百分比的图。具体实施方式25.本文描述的是提供一种碱基编辑和碱基编辑系统以精确校正甲基cpg结合蛋白2(mecp2)基因中一个或多个突变的组合物和方法,所述甲基cpg结合蛋白2(mecp2)基因与进行性神经发育障碍rett综合症(rtt)及其症状有因果关系。rtt是一种主要影响女性的x染色体显性疾病,在96%的受影响个体中与mecp2基因突变有关,且其特征是早期发育明显正常,随后丧失精细运动技能和有效沟通,刻板印象运动,失用或步态完全缺乏而退化。患病个体的其他临床特征包括头部生长速率的异常后天减速、阵发性呼吸、胃肠功能障碍、癫痫和脊柱侧弯。26.最普遍的引起rtt的突变是胞苷到胸苷(c→t)的转变突变,导致c·g到t·a碱基对的取代。所述取代可以通过催化a·t到g·c取代的腺苷碱基编辑器(abe)还原为野生型、非致病性基因组序列。通过扩展,引起高度rtt的突变是使用abes转化为野生型序列的潜在靶标,而不会像使用基因疗法那样引起mecp2基因过表达的风险。因此,从a·t到g·cdna的碱基编辑具有精确校正mecp2基因中一个或多个最普遍引起rtt的突变的潜力。27.此处的描述和示例详细示出本申请的实施例。应理解的是,本申请不限于本文描述的特定实施例,因此可以变化。本领域技术人员将认识到,有许多变化和修改包含在本申请范围内。28.在此使用的章节标题仅出于组织目的,并且不应被解释为限制所描述的主题。29.尽管可以在单个实施例的上下文中描述本申请的各种特征,但也可以独立地或以任何合适的组合来提供特征。相反,为了清楚起见,本文中可以在单独的实施例的上下文中描述本申请,但本申请也可在单个实施例中实现。30.定义31.除非另有定义,否则本文所用的所有技术和科学术语具有本领域技术人员通常理解的含义。下列参考文献为本领域技术人员提供本申请中使用的许多术语的一般定义:singleton等人,dictionaryofmicrobiologyandmolecularbiology(第2版1994);thecambridgedictionaryofscienceandtechnology(walker编辑,1988);theglossaryofgenetics,第5版,r.rieger等人,(eds.),springerverlag(1991);andhale&marham,theharpercollinsdictionaryofbiology(1991)。32.在本申请中,单数的使用包括复数,除非另有明确说明。必须注意,在说明书中使用的单数形式“一”、“一个”和“所述”包括复数对象,除非上下文另有明确规定。在本申请中,除非另外说明,否则“或”的使用表示“和/或”。此外,术语“包括”以及其他形式(例如“包含(include)”、“包含(includes)”和“包含(included)”)的使用不是限制性的。33.如本说明书和权利要求书中所使用的,词语“包括”(以及包括的任何形式,例如“包括(comprise)”和“包括(comprises)”),“具有”(以及具有的任何形式,例如“具有(have)”和“具有(has)”),“包含”(以及任何形式的包含,例如“包含(includes)”和“包含(include)”)或“含”(以及任何形式的包含,例如“含有(contains)”和“包含(contain)”)是包含性的或开放式的,并且不排除其他未引用的元素或方法步骤。可预期地,可相对于本申请的任何方法或组成来实现本说明书中讨论的任何实施例,反之亦然。此外,本申请的组合物可用于实现本申请的方法。34.术语“大约(about)”或“大约(approximately)”是指本领域技术人员确定的特定值在可接受的误差范围内,这将部分取决于如何测量或确定所述值,即测量系统的局限性。例如,根据本领域的实践,“约”可以表示在1个或大于1个标准偏差之内。可替代地,“约”可以表示给定值的最高20%、最高10%、最高5%或最高1%的范围。可替代地,特别是关于生物系统或过程,所述术语可以意指在数值的一个数量级内,优选在5倍以内,更优选在2倍以内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,否则应假设术语“约”表示所述特定值在可接受的误差范围内。35.本文提供的范围应理解为所述范围内所有值的简写。例如,1到50的范围应理解为包括任何数字,数字的组合或选自1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36,37、38、39、40、41、42、43、44、45、46、47、48、49或50组成的组的子范围。36.在说明书中对“一些实施例”、“一个实施例”、“一个实施例”或“其他实施例”的引用是指结合这些实施例描述的特定特征,结构或特性包括在至少一些实施例中,但不一定是本申请的所有实施例。[0037]“腺苷脱氨酶”是指能够催化腺嘌呤或腺苷的水解脱氨的多肽或其片段。在一些实施方案中,脱氨酶或脱氨酶结构域是催化腺苷水解为肌苷或脱氧腺苷水解为脱氧肌苷的腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中腺嘌呤或腺苷的水解脱氨。本文提供的腺苷脱氨酶(例如工程化腺苷脱氨酶,进化的腺苷脱氨酶)可以来自任何生物,例如细菌。[0038]“试剂”是指任何小分子化合物、抗体、核酸分子或多肽或其片段。[0039]“改善”是指减少、抑制、减弱、减少、阻止或稳定疾病的发展或进程。[0040]“改变”是指基因或多肽的表达水平或活性的改变(增加或减少),如通过标准领域已知的方法(例如本文所述的方法)检测到的。如本文所用,改变包括表达水平的10%变化,优选25%的变化,更优选40%的变化,最优选50%或更大的表达水平的变化。[0041]“类似物”是指不相同但具有相似功能或结构特征的分子。举例来说,多肽类似物保留了相应的天然存在的多肽的生物活性,同时具有某些生物化学修饰,相对于天然存在的多肽,其可以增强类似物的功能。这种生化修饰可增加类似物的蛋白酶抗性、膜通透性或半衰期,而不会改变例如配体结合。类似物可包括非天然氨基酸。[0042]本文中的“给药”是指对患者或受试者提供本文所述的一种或多种组合物。举例但不限于,可以通过静脉内(i.v.)注射、皮下(s.c.)注射、皮内(i.d.)注射、腹膜内(i.p.)注射或肌内(i.m.)注射进行组合物施用,可以采用一种或多种这样的途径。例如,肠胃外给药可以通过推注或随时间逐渐灌注。可替代地或同时地,通过口服途径施用。[0043]“胞苷脱氨酶”是指能够催化将氨基转化为羰基的脱氨反应的多肽或其片段。在一实施方案中,胞苷脱氨酶将胞嘧啶转化为尿嘧啶或将5‑甲基胞嘧啶转化为胸腺嘧啶。pmcda1,衍生自petromyzonmarinus(petromyzonmarinuscytosinedeaminase1,“pmcda1”)、aid(活化诱导的胞苷脱氨酶;aicda),其衍生自哺乳动物(例如人类、猪、牛、马、猴等)及apobec,是示例性的胞苷脱氨基酶。[0044]“甲基cpg结合蛋白2(mecp2)蛋白”是指与ncbi登录号第np_004983号具至少约95%氨基酸序列同一性的多肽或其片段。在特定实施方案中,mecp2蛋白相对于以下参考序列包含一个或多个改变。在特定实施方案中,与rtt相关的mecp2蛋白包含一种或多种选自r106w、r168*、r133c、t158m、r255*、r270*和r306c的突变。以下提供了示例性的mecp2氨基酸序列。[0045][0046][0047]“mecp2多核苷酸”是指编码mecp2蛋白或其片段的核酸分子。以下提供了示例性mecp2多核苷酸的序列,其可在ncbi登录号第nm_004992号获得。在特定的实施方案中,mecp2多核苷酸包含相对于以下参考序列的一个或多个改变。在特定实施方案中,与rtt相关的mecp2多核苷酸包含一种或多种选自316c>t、397c>t、473c>t、763c>t、808c>t和916c>t的突变。[0048][0049][0050][0051][0052]“碱基编辑器(be)”或“核碱基编辑器(nbe)”是指所述结合多核苷酸并具有核碱基修饰活性的试剂。在各种实施方案中,所述碱基编辑器包含核碱基修饰多肽(例如脱氨酶)和与指导多核苷酸(例如,指导rna)结合的多核苷酸可编程核苷酸结合结构域。在各种实施方案中,所述试剂是生物分子复合物,其包含具有碱基编辑活性的蛋白质结构域,即能够修饰核酸分子(例如,a、t、c、g或u)中的碱基(例如,脱氧核糖核酸)。在一些实施方案中,所述多核苷酸可编程dna结合结构域与脱氨酶结构域融合或连接。在一个实施方案中,所述试剂是融合蛋白,其包含具有碱基编辑活性的结构域。在另一个实施方案中,具有碱基编辑活性的蛋白结构域与指导rna连接(例如,通过所述指导rna上的rna结合基序,以及与脱氨酶融合的rna结合域)。在一些实施方案中,具有碱基编辑活性的结构域能够使核酸分子内的碱基脱氨。在一些实施方案中,所述碱基编辑器能够使dna分子内的碱基脱氨。在一些实施方案中,所述碱基编辑器能够使dna内的胞嘧啶(c)或腺苷(a)脱氨。在一些实施方案中,所述碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施例中,所述碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方案中,所述腺苷脱氨酶从tada进化而来。在一些实施方案中,所述多核苷酸可编程dna结合结构域是crispr相关的(例如,cas或cpf1)酶。在一些实施方案中,所述碱基编辑器是与脱氨酶结构域融合的催化死亡的cas9(dcas9)。在一些实施方案中,所述碱基编辑器是与脱氨酶结构域融合的cas9切口酶(ncas9)。在一些实施方案中,所述碱基编辑器与碱基切除修复(ber)抑制剂融合。在一些实施方案中,所述碱基切除修复抑制剂是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,所述碱基切除修复抑制剂是肌苷碱基切除修复抑制剂。所述碱基编辑器的详细信息在国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中进行了描述,在此将其全部内容通过引用并入本文。另请参见komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)以及rees,h.a.等人“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770‑788.doi:10.1038/s41576‑018‑0059‑1,其全部内容通过引用合并于此。[0053]例如,在此描述的碱基编辑组合物、系统和方法中使用的胞苷碱基编辑器cbe具有以下核酸序列(8877个碱基对),(addgene,watertown,ma;komorac等人,2017,sciadv.,30;3(8):eaao4774。doi:10.1126/sciadv.aao4774),如下所示。还包括有具与be4核酸序列至少95%或更高同一性的多核苷酸序列。[0054][0055][0056][0057][0058]be4氨基酸序列:[0059]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglksggssggssgsetpgtsesatpessggssggsdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggdsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggsggsggstnlsdiieketgkqlviqesilmlpeeveevignkpesdilvhtaydestdenvmlltsdapeykpwalviqdsngenkikmlsggspkkkrk[0060]例如,在此描述的碱基编辑组合物、系统和方法中使用的胞苷碱基编辑器abe具有以下核酸序列(8877个碱基对),(addgene,watertown,ma.;gaudellinm等人,nature.2017年11月23日;551(7681):464‑471.doi:10.1038/nature24644),如下所示。还包括有具与abe核酸序列至少95%或更高同一性的多核苷酸序列。[0061]atatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctggtttagtgaaccgtcagatccgctagagatccgcggccgctaatacgactcactatagggagagccgccaccatgaaacggacagccgacggaagcgagttcgagtcaccaaagaagaagcggaaagtctctgaagtcgagtttagccacgagtattggatgaggcacgcactgaccctggcaaagcgagcatgggatgaaagagaagtccccgtgggcgccgtgctggtgcacaacaatagagtgatcggagagggatggaacaggccaatcggccgccacgaccctaccgcacacgcagagatcatggcactgaggcagggaggcctggtcatgcagaattaccgcctgatcgatgccaccctgtatgtgacactggagccatgcgtgatgtgcgcaggagcaatgatccacagcaggatcggaagagtggtgttcggagcacgggacgccaagaccggcgcagcaggctccctgatggatgtgctgcaccaccccggcatgaaccaccgggtggagatcacagagggaatcctggcagacgagtgcgccgccctgctgagcgatttctttagaatgcggagacaggagatcaaggcccagaagaaggcacagagctccaccgactctggaggatctagcggaggatcctctggaagcgagacaccaggcacaagcgagtccgccacaccagagagctccggcggctcctccggaggatcctctgaggtggagttttcccacgagtactggatgagacatgccctgaccctggccaagagggcacgcgatgagagggaggtgcctgtgggagccgtgctggtgctgaacaatagagtgatcggcgagggctggaacagagccatcggcctgcacgacccaacagcccatgccgaaattatggccctgagacagggcggcctggtcatgcagaactacagactgattgacgccaccctgtacgtgacattcgagccttgcgtgatgtgcgccggcgccatgatccactctaggatcggccgcgtggtgtttggcgtgaggaacgcaaaaaccggcgccgcaggctccctgatggacgtgctgcactaccccggcatgaatcaccgcgtcgaaattaccgagggaatcctggcagatgaatgtgccgccctgctgtgctatttctttcggatgcctagacaggtgttcaatgctcagaagaaggcccagagctccaccgactccggaggatctagcggaggctcctctggctctgagacacctggcacaagcgagagcgcaacacctgaaagcagcgggggcagcagcggggggtcagacaagaagtacagcatcggcctggccatcggcaccaactctgtgggctgggccgtgatcaccgacgagtacaaggtgcccagcaagaaattcaaggtgctgggcaacaccgaccggcacagcatcaagaagaacctgatcggagccctgctgttcgacagcggcgaaacagccgaggccacccggctgaagagaaccgccagaagaagatacaccagacggaagaaccggatctgctatctgcaagagatcttcagcaacgagatggccaaggtggacgacagcttcttccacagactggaagagtccttcctggtggaagaggataagaagcacgagcggcaccccatcttcggcaacatcgtggacgaggtggcctaccacgagaagtaccccaccatctaccacctgagaaagaaactggtggacagcaccgacaaggccgacctgcggctgatctatctggccctggcccacatgatcaagttccggggccacttcctgatcgagggcgacctgaaccccgacaacagcgacgtggacaagctgttcatccagctggtgcagacctacaaccagctgttcgaggaaaaccccatcaacgccagcggcgtggacgccaaggccatcctgtctgccagactgagcaagagcagacggctggaaaatctgatcgcccagctgcccggcgagaagaagaatggcctgttcggaaacctgattgccctgagcctgggcctgacccccaacttcaagagcaacttcgacctggccgaggatgccaaactgcagctgagcaaggacacctacgacgacgacctggacaacctgctggcccagatcggcgaccagtacgccgacctgtttctggccgccaagaacctgtccgacgccatcctgctgagcgacatcctgagagtgaacaccgagatcaccaaggcccccctgagcgcctctatgatcaagagatacgacgagcaccaccaggacctgaccctgctgaaagctctcgtgcggcagcagctgcctgagaagtacaaagagattttcttcgaccagagcaagaacggctacgccggctacattgacggcggagccagccaggaagagttctacaagttcatcaagcccatcctggaaaagatggacggcaccgaggaactgctcgtgaagctgaacagagaggacctgctgcggaagcagcggaccttcgacaacggcagcatcccccaccagatccacctgggagagctgcacgccattctgcggcggcaggaagatttttacccattcctgaaggacaaccgggaaaagatcgagaagatcctgaccttccgcatcccctactacgtgggccctctggccaggggaaacagcagattcgcctggatgaccagaaagagcgaggaaaccatcaccccctggaacttcgaggaagtggtggacaagggcgcttccgcccagagcttcatcgagcggatgaccaacttcgataagaacctgcccaacgagaaggtgctgcccaagcacagcctgctgtacgagtacttcaccgtgtataacgagctgaccaaagtgaaatacgtgaccgagggaatgagaaagcccgccttcctgagcggcgagcagaaaaaggccatcgtggacctgctgttcaagaccaaccggaaagtgaccgtgaagcagctgaaagaggactacttcaagaaaatcgagtgcttcgactccgtggaaatctccggcgtggaagatcggttcaacgcctccctgggcacataccacgatctgctgaaaattatcaaggacaaggacttcctggacaatgaggaaaacgaggacattctggaagatatcgtgctgaccctgacactgtttgaggacagagagatgatcgaggaacggctgaaaacctatgcccacctgttcgacgacaaagtgatgaagcagctgaagcggcggagatacaccggctggggcaggctgagccggaagctgatcaacggcatccgggacaagcagtccggcaagacaatcctggatttcctgaagtccgacggcttcgccaacagaaacttcatgcagctgatccacgacgacagcctgacctttaaagaggacatccagaaagcccaggtgtccggccagggcgatagcctgcacgagcacattgccaatctggccggcagccccgccattaagaagggcatcctgcagacagtgaaggtggtggacgagctcgtgaaagtgatgggccggcacaagcccgagaacatcgtgatcgaaatggccagagagaaccagaccacccagaagggacagaagaacagccgcgagagaatgaagcggatcgaagagggcatcaaagagctgggcagccagatcctgaaagaacaccccgtggaaaacacccagctgcagaacgagaagctgtacctgtactacctgcagaatgggcgggatatgtacgtggaccaggaactggacatcaaccggctgtccgactacgatgtggaccatatcgtgcctcagagctttctgaaggacgactccatcgacaacaaggtgctgaccagaagcgacaagaaccggggcaagagcgacaacgtgccctccgaagaggtcgtgaagaagatgaagaactactggcggcagctgctgaacgccaagctgattacccagagaaagttcgacaatctgaccaaggccgagagaggcggcctgagcgaactggataaggccggcttcatcaagagacagctggtggaaacccggcagatcacaaagcacgtggcacagatcctggactcccggatgaacactaagtacgacgagaatgacaagctgatccgggaagtgaaagtgatcaccctgaagtccaagctggtgtccgatttccggaaggatttccagttttacaaagtgcgcgagatcaacaactaccaccacgcccacgacgcctacctgaacgccgtcgtgggaaccgccctgatcaaaaagtaccctaagctggaaagcgagttcgtgtacggcgactacaaggtgtacgacgtgcggaagatgatcgccaagagcgagcaggaaatcggcaaggctaccgccaagtacttcttctacagcaacatcatgaactttttcaagaccgagattaccctggccaacggcgagatccggaagcggcctctgatcgagacaaacggcgaaaccggggagatcgtgtgggataagggccgggattttgccaccgtgcggaaagtgctgagcatgccccaagtgaatatcgtgaaaaagaccgaggtgcagacaggcggcttcagcaaagagtctatcctgcccaagaggaacagcgataagctgatcgccagaaagaaggactgggaccctaagaagtacggcggcttcgacagccccaccgtggcctattctgtgctggtggtggccaaagtggaaaagggcaagtccaagaaactgaagagtgtgaaagagctgctggggatcaccatcatggaaagaagcagcttcgagaagaatcccatcgactttctggaagccaagggctacaaagaagtgaaaaaggacctgatcatcaagctgcctaagtactccctgttcgagctggaaaacggccggaagagaatgctggcctctgccggcgaactgcagaagggaaacgaactggccctgccctccaaatatgtgaacttcctgtacctggccagccactatgagaagctgaagggctcccccgaggataatgagcagaaacagctgtttgtggaacagcacaagcactacctggacgagatcatcgagcagatcagcgagttctccaagagagtgatcctggccgacgctaatctggacaaagtgctgtccgcctacaacaagcaccgggataagcccatcagagagcaggccgagaatatcatccacctgtttaccctgaccaatctgggagcccctgccgccttcaagtactttgacaccaccatcgaccggaagaggtacaccagcaccaaagaggtgctggacgccaccctgatccaccagagcatcaccggcctgtacgagacacggatcgacctgtctcagctgggaggtgactctggcggctcaaaaagaaccgccgacggcagcgaattcgagcccaagaagaagaggaaagtctaaccggtcatcatcaccatcaccattgagtttaaacccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggcggaaagaaccagctggggctcgataccgtcgacctctagctagagcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctagggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggagaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacactcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtcgacggatcgggagatcgatctcccgatcccctagggtcgactctcagtacaatctgctctgatgccgcatagttaagccagtatctgctccctgcttgtgtgttggaggtcgctgagtagtgcgcgagcaaaatttaagctacaacaaggcaaggcttgaccgacaattgcatgaagaatctgcttagggttaggcgttttgcgctgcttcgcgatgtacgggccagatatacgcgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatc[0062]“碱基编辑活性”是指用于化学改变多核苷酸内的碱基。在一个实施例中,第一碱基被转换为第二碱基。在一个实施方案中,碱基编辑活性是胞苷脱氨酶活性,例如,将靶c·g转化为t·a。在另一个实施方案中,碱基编辑活性是腺苷或腺嘌呤脱氨酶活性,例如将a·t转化为g·c。[0063]术语“碱基编辑器系统”是指用于编辑靶核苷酸序列的核碱基的系统。在各种实施方案中,碱基编辑器(be)系统包含(1)用于使所述核碱基脱氨的多核苷酸可编程核苷酸结合结构域和脱氨酶结构域;(2)指导多核苷酸(例如,指导rna)与多核苷酸可编程核苷酸结合结构域结合。在一些实施方案中,碱基编辑器系统包括(1)碱基编辑器(be),其包含多核苷酸可编程dna结合结构域和用于使所述核碱基脱氨的脱氨酶结构域;(2)指导rna与多核苷酸可编程dna结合结构域结合。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施方案中,碱基编辑器是腺嘌呤或腺苷碱基编辑器(abe)。[0064]在一些实施方案中,核碱基编辑器系统可以包括一个以上的碱基编辑组件。例如,核碱基编辑器系统可以包括一个以上的脱氨酶。在一些实施方案中,核酸酶碱基编辑器系统可包括一种或多种胞苷脱氨酶和/或一种或多种腺苷脱氨酶。在一些实施方案中,可以使用单链指导多核苷酸将不同的脱氨酶靶向靶核酸序列。在一些实施方案中,单链指导多核苷酸可用于将不同的脱氨酶靶向靶核酸序列。[0065]碱基编辑器系统的核碱基成分和多核苷酸可编程核苷酸结合成分可以彼此共价或非共价结合。例如,在一些实施方案中,可以通过多核苷酸可编程核苷酸结合结构域将脱氨酶结构域靶向靶核苷酸序列。在一些实施方案中,可将多核苷酸可编程核苷酸结合结构域融合或连接至脱氨酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与脱氨酶结构域非共价相互作用或与其缔合而将脱氨酶结构域靶向靶核苷酸序列。例如,在一些实施方案中,核碱基编辑组件,例如,核糖核酸编辑组件,可以包含额外异源部分或结构域,其能与作为多核苷酸可编程核苷酸结合域的一部分的额外异源部分或结构域相互作用、与其缔合或能够与其形成复合物。在一些实施方案中,所述额外异源部分可能能够与多肽结合、与多肽相互作用、与多肽缔合或与其形成复合物。在一些实施方案中,所述额外异源部分可能能够与多核苷酸结合、与多核苷酸相互作用、与其缔合或与其形成复合物。在一些实施方案中,所述额外异源部分可能能够结合至指导多核苷酸。在一些实施方案中,所述额外异源部分可能能够结合多肽接头。在一些实施方案中,所述额外异源部分可能能够结合多核苷酸接头。所述额外异源部分可以是蛋白质结构域。在一些实施方案中,所述额外异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白或rna识别基序。[0066]碱基编辑器系统可以进一步包含指导多核苷酸组分。应当理解,碱基编辑器系统的组件可以通过共价键,非共价相互作用,或它们的缔合和相互作用的任何组合彼此关联。在一些实施方案中,脱氨酶结构域可以被指导多核苷酸靶向靶核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组件,例如,脱氨酶成分。脱氨酶成分可包含其他异源部分或域(例如,多核苷酸结合域,例如rna或dna结合蛋白),所述其他异源部分或域能与指导多核苷酸的部分或区段(例如,多核苷酸基序)相互作用或缔合或与其形成复合物)。在一些实施方案中,可以将所述额外异源部分或结构域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白)融合或连接至脱氨酶结构域。在一些实施方案中,所述额外异源部分可能能够与多肽结合,与多肽相互作用,与多肽缔合或与其形成复合物。在一些实施方案中,所述额外异源部分可能能够与多核苷酸结合,与多核苷酸相互作用,与其缔合或与其形成复合物。在一些实施方案中,所述额外异源部分可能能够结合至指导多核苷酸。在一些实施方案中,所述额外异源部分可能能够结合多肽接头。在一些实施方案中,所述额外异源部分可能能够结合多核苷酸接头。所述额外异源部分可以是蛋白质结构域。在一些实施方案中,所述额外异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无体α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白或rna识别基序。[0067]在一些实施例中,碱基编辑器系统可以进一步包括碱基切除修复(ber)成分的抑制剂。应当理解,碱基编辑器系统的组件可以通过共价键、非共价相互作用,或它们的缔合和相互作用的任何组合彼此关联。ber成分的抑制剂可以包括碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以是尿嘧啶dna糖基化酶抑制剂(ugi)。在一些实施方案中,碱基切除修复抑制剂可以是肌苷碱基切除修复抑制剂。在一些实施方案中,碱基切除修复抑制剂可以通过多核苷酸可编程核苷酸结合结构域靶向靶核苷酸序列。在一些实施方案中,可将多核苷酸可编程核苷酸结合结构域融合或连接至碱基切除修复抑制剂。在一些实施方案中,可将多核苷酸可编程核苷酸结合结构域融合或连接至脱氨酶结构域和碱基切除修复抑制剂。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可通过与碱基切除修复抑制剂非共价相互作用或与其缔合而将碱基切除修复抑制剂靶向靶核苷酸序列。例如,在一些实施方案中,碱基编辑器系统的核碱基编辑组件(例如,脱氨酶成分)可包含其他异源部分或域(例如,多核苷酸结合域,例如rna或dna结合蛋白),所述其他异源部分或域能够与指导多核苷酸的一部分或区段(例如,多核苷酸基序)相互作用、缔合或与之形成复合物。在一些实施方案中,碱基切除修复抑制剂可以被指导多核苷酸靶向靶核苷酸序列。例如,在一些实施方案中,碱基切除修复抑制剂可包含其他异源部分或域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白),所述其他异源部分或域能够与指导多核苷酸的一部分或区段(例如,多核苷酸基序)相互作用、缔合或与其形成复合物。在一些实施方案中,所述指导多核苷酸的所述额外异源部分或结构域(例如,多核苷酸结合结构域,例如rna或dna结合蛋白)可以与碱基切除修复抑制剂融合或连接。在一些实施方案中,所述额外异源部分可能能够与多核苷酸结合,与多核苷酸相互作用,与其缔合或与其形成复合物。在一些实施方案中,所述额外异源部分可能能够结合至指导多核苷酸。在一些实施方案中,所述额外异源部分可能能够结合多肽接头。在一些实施方案中,所述额外异源部分可能能够结合多核苷酸接头。额外异源部分可以是蛋白质结构域。在一些实施方案中,所述额外异源部分可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白或rna识别基序。[0068]术语“cas9”或“cas9结构域”是指包含cas9蛋白或其片段(例如,包含cas9的活性、非活性或部分活性的dna切割域的蛋白、和/或cas9的grna结合结构域)。cas9核酸酶有时也称为casnl核酸酶或crispr(规律间隔成簇短回文重复序列)相关的核酸酶。示例性的cas9是化脓性链球菌cas9(spcas9),其氨基酸序列如下。[0069][0070][0070](底线:hnh域;双底线:ruvc域)[0071]术语“保守氨基酸取代”或“保守突变”是指一个氨基酸被具有共同性质的另一氨基酸替代。定义单个氨基酸之间共有特性的一种功能方法是分析同源生物体相应蛋白质之间氨基酸变化的标准化频率(schulz,g.e.和schirmer,r.h.,principlesofproteinstructure,springer‑verlag,纽约(1979))。根据这样的分析,可以定义氨基酸组,其中组内的氨基酸优先彼此交换,因此在它们对整体蛋白质结构的影响上最相似(schulz,g.e.和schirmer,r.h.,同上)。保守突变的非限制性实例包括氨基酸的氨基酸取代,例如赖氨酸取代精氨酸且反之亦然,故可以保持正电荷;谷氨酸取代为天冬氨酸且反之亦然,从而可保持负电荷;苏氨酸取代为丝氨酸,以维持游离的‑oh;以及氨酰胺取代为天冬酰胺,从而维持游离的–nh2。[0072]如本文可互换使用的,术语“编码序列”或“蛋白质编码序列”是指编码蛋白质的多核苷酸的区段。所述区域或序列的起始密码子在5’末端附近,终止密码子在3’末端附近。编码序列也可称为开放阅读框(openingreadingframes)。[0073]如本文所用,术语“脱氨酶”或“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶或脱氨酶结构域是胞苷脱氨酶,其分别催化胞苷或脱氧胞苷水解为尿苷或脱氧尿苷。在一些实施方案中,脱氨酶或脱氨酶结构域是胞嘧啶脱氨酶,其催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺嘌呤水解为次黄嘌呤。在一些实施方案中,脱氨酶是腺苷脱氨酶,其催化腺苷或腺嘌呤(a)水解为肌苷(i)。在一些实施方案中,脱氨酶或脱氨酶结构域是腺苷脱氨酶,其分别催化腺苷或脱氧腺苷水解为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶催化脱氧核糖核酸(dna)中腺苷的水解脱氨。本文提供的腺苷脱氨酶(例如工程化腺苷脱氨酶,进化的腺苷脱氨酶)可以来自任何生物,例如细菌。在一些实施方案中,腺苷脱氨酶来自细菌,例如大肠杆菌、金黄色葡萄球菌(staphylococcusaureus)、伤寒链球菌、腐烂链球菌、流感嗜血杆菌或新月形梭菌。在一些实施方案中,腺苷脱氨酶是tada脱氨酶。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体例如人类、黑猩猩、大猩猩、猴子、牛、狗、大鼠或小鼠的天然存在的脱氨酶的变体。在一些实施方案中,脱氨酶或脱氨酶结构域本质上不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域为至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%同一性的自然发生的脱氨酶。举例来说,脱氨酶结构域描述于国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中,其各自通过引用整体并入本文。另请参阅komor,a.c.等人,“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人,“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);komor,a.c.等人,“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)以及rees,h.a.等人,“baseediting:precisionchemistryonthegenomeandtranscriptomeoflivingcells.”natrevgenet.2018dec;19(12):770‑788.doi:10.1038/s41576‑018‑0059‑1,其全部内容通过引用合并于此。[0074]“可检测标记”是指一种组合物,当其与感兴趣的分子连接时,使其能够通过光谱、光化学、生物化学、免疫化学或化学手段进行检测。例如,有用的标记包括放射性同位素、磁珠、金属珠、胶体颗粒、荧光染料、电子致密试剂、酶(例如,如在elisa中通常使用的)、生物素、过异羟基洋地黄毒苷(digoxigenin)或半抗原。[0075]“疾病”是指损害或干扰细胞、组织或器官正常功能的任何状况或障碍。疾病的例子包括rett综合症。[0076]“有效量”是指相对于未经治疗的患者或没有疾病的个体,缓解本文所述的试剂或活性化合物的量。用于实施本申请以治疗疾病的活性化合物的有效量,根据给药方式、年龄、体重和受试者的总体健康状况而变化。最终,主治医师或兽医将决定适当的量和剂量方案。所述剂量称为“有效”量。在一个实施方案中,有效量是足以在细胞(例如体外或体内细胞)中引入目的基因(例如mecp2)改变的本申请的碱基编辑器的量。在一个实施方案中,所述有效量是达到治疗效果(例如,减少或控制rett综合症或其症状或病状)所需的碱基编辑器的量。这种治疗效果不足以改变受试者、组织或器官的所有细胞中的mecp2,而仅足以改变存在受试者、组织或器官中的约1%、5%、10%、25%、50%、75%或更多细胞中的mecp2。在一个实施方案中,有效量足以缓解rett综合症的一种或多种症状。[0077]“片段”是指多肽或核酸分子的一部分。所述部分优选包含参考核酸分子或多肽的全长的至少10%、20%、30%、40%、50%、60%、70%、80%或90%。片段可以包含10、20、30、40、50、60、70、80、90或100、200、300、400、500、600、700、800、900或1000个核苷酸或氨基酸。[0078]“杂交”是指互补核碱基之间的氢键,其可以是watson‑crick、hoogsteen或反向hoogsteen氢键。举例来说,腺嘌呤和胸腺嘧啶是通过形成氢键而配对的互补核碱基。[0079]术语“碱基修复抑制剂”、“碱基修复抑制剂”、“ibr”或其语法等同物是指能够抑制核酸修复酶例如碱基切除修复酶活性的蛋白质。在一些实施方案中,ibr是肌苷碱基切除修复抑制剂。碱基修复的示例性抑制剂包括ape1、endoiii、endoiv、endov、endoviii、fpg、hogg1、hneil1、t7endol、t4pdg、udg、hsmug1和haag的抑制剂。在一些实施方案中,碱修复抑制剂是endov或haag的抑制剂。在一些实施方案中,ibr是endov或haag的抑制剂。在一些实施方案中,ibr是催化失活的endov或催化失活的haag。在一些实施方案中,碱修复抑制剂是催化失活的endov或催化失活的haag。在一些实施方案中,碱基修复抑制剂是尿嘧啶糖基化酶抑制剂(ugi)。ugi是指能够抑制尿嘧啶‑dna糖基化酶碱基切除修复酶的蛋白质。在一些实施方案中,ugi结构域包含野生型ugi或野生型ugi的片段。在一些实施方案中,本文提供的ugi蛋白包括ugi的片段和与ugi或ugi片段同源的蛋白。在一些实施方案中,碱基修复抑制剂是肌苷碱基切除修复抑制剂。在一些实施方案中,碱修复抑制剂是“催化失活的肌苷特异性核酸酶”或“死亡肌苷特异性核酸酶”。不希望受到任何特定理论的束缚,催化失活的肌苷糖基化酶(例如烷基腺嘌呤糖基化酶(aag))可以结合肌苷,但不能产生脱碱基位点或去除肌苷,从而在空间上阻止新形成的肌苷部分受到dna损伤/修复机制。在一些实施方案中,催化失活的肌苷特异性核酸酶能够结合核酸中的肌苷,但不切割核酸。非限制性示例性的催化失活的肌苷特异性核酸酶包括例如来自人的催化失活的烷基腺苷糖基化酶(aag核酸酶)和例如来自大肠杆菌的催化失活的核酸内切酶v(endov核酸酶)。在一些实施方案中,催化失活的aag核酸酶在另一个aag核酸酶中包含e125q突变或相应的突变。[0080]术语“分离的”、“纯化的”或“生物学上纯净的”是指不含各种程度不同组分的材料,且所述各组分通常在其材料的天然状态下随其伴随。“隔离”表示与原始来源或周围环境的隔离程度。“纯化”表示高于隔离的分离程度。“纯化的”或“生物纯净的”蛋白质充分不含其他物质,以使任何杂质均不会实质性影响所述蛋白质的生物学特性或引起其他不利后果。即,如果本申请的核酸或肽在通过重组dna技术生产时基本不含细胞材料、病毒材料或培养基,或者在化学合成时基本不含化学前体或其他化学品,则将其纯化。纯度和均质性通常使用分析化学技术确定,例如聚丙烯酰胺凝胶电泳或高效液相色谱法。术语“纯化的”可以表示一核酸或一蛋白质在电泳凝胶中本质上形成一条带。对于可进行修饰的蛋白质,例如磷酸化或糖基化,不同的修饰可以产生不同的分离的蛋白质,可以将其分别纯化。[0081]“分离的多核苷酸”是指不含位于基因侧翼的基因的核酸(例如dna),所述基因在衍生本申请的核酸分子的生物的天然存在的基因组中。因此,所述术语包括,例如,掺入载体中的重组dna;进入自主复制的质粒或病毒;或进入原核生物或真核生物的基因组dna;或以独立于其他序列的独立分子(例如,通过pcr或限制性核酸内切酶消化产生的cdna或基因组或cdna片段)等形式存在。另外,所述术语包括从dna分子转录的rna分子,以及作为编码附加多肽序列的杂合基因的一部分的重组dna。[0082]“分离的多肽”是指已经与天然伴随其的组分分离的本申请的多肽。通常,当多肽按重量计至少60%不含与之天然结合的蛋白质和天然存在的有机分子时,将其分离。优选地,所述制剂是按重量计至少75%,更优选地至少90%,并且最优选地至少99%的本申请的多肽。本申请的分离的多肽可通过例如从天然来源提取、通过表达编码这种多肽的重组核酸而获得、或通过化学合成蛋白质,且可以通过任何合适的方法,例如,管柱色谱法、聚丙烯酰胺凝胶电泳或通过hplc分析来测量纯度。[0083]如本文所用,术语“接头”可指共价接头(例如,共价键)、非共价接头、化学基团或连接两个分子或部分,例如,蛋白质复合物或核糖核酸复合物的两个成分,或融合蛋白的两个结构域,例如多核苷酸可编程dna结合结构域(例如,dcas9)和脱氨酶结构域(例如,腺苷脱氨酶或胞苷脱氨酶)。接头可以连接碱基编辑器系统的不同组件或组件的不同部分。例如,在一些实施方案中,接头可以连接多核苷酸可编程核苷酸结合结构域的指导多核苷酸结合结构域和脱氨酶的催化结构域。在一些实施方案中,接头可以连接crispr多肽和脱氨酶。在一些实施方案中,接头可以连接cas9和脱氨酶。在一些实施方案中,接头可以连接dcas9和脱氨酶。在一些实施方案中,接头可以连接ncas9和脱氨酶。在一些实施方案中,接头可以连接指导多核苷酸和脱氨酶。在一些实施方案中,接头可以连接碱基编辑器系统的脱氨基组分和多核苷酸可编程核苷酸结合组分。在一些实施方案中,接头可以连接脱氨基成分的rna结合部分和碱基编辑器系统的多核苷酸可编程核苷酸结合成分。在一些实施方案中,接头可连接脱碱基组分的rna结合部分和碱基编辑器系统的多核苷酸可编程核苷酸结合组分的rna结合部分。接头可位于两个基团,分子或其他部分之间或在其两侧,并通过共价键或非共价相互作用连接至每个,从而将两者连接。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头可以是多核苷酸。在一些实施方案中,接头可以是dna接头。在一些实施方案中,接头可以是rna接头。在一些实施方案中,接头可包含能够结合配体的适体。在一些实施方案中,配体可以是碳水化合物、肽、蛋白质或核酸。在一些实施方案中,接头可包含可从核糖开关衍生的适体。衍生适体的核糖开关可选自茶碱核糖开关、硫胺焦磷酸(tpp)核糖开关、腺苷钴胺素(adocbl)核糖开关、s‑腺苷甲硫氨酸(sam)核糖开关、sah核糖开关、黄素单核苷酸(fmn)核糖开关、四氢叶酸核糖开关、赖氨酸核糖开关、甘氨酸核糖开关、嘌呤核糖开关、glms核糖开关或pre‑queosine1(preq1)核糖开关。在一些实施方案中,接头可包含结合至多肽或蛋白质结构域例如多肽配体的适体。在一些实施方案中,多肽配体可以是k同源性(kh)结构域、ms2外壳蛋白结构域、pp7外壳蛋白结构域、sfmucom外壳蛋白结构域、无菌α基序、端粒酶ku结合基序和ku蛋白、端粒酶sm7结合基序和sm7蛋白或rna识别基序。在一些实施方案中,多肽配体可以是碱基编辑器系统组分的一部分。例如,核碱基编辑成分可包含脱氨酶结构域和rna识别基序。[0084]在一些实施方案中,接头可为氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头的长度可为约5至100个氨基酸,例如,约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20至30、30至40、40至50、50至60、60至70、70至80、80至90或90至100个氨基酸的长度。在一些实施方案中,接头的长度可为约100至150、150至200、200至250、250至300、300至350、350至400、400至450或450至500个氨基酸。也可以考虑更长或更短的接头。[0085]在一些实施方案中,接头连接rna可编程核酸酶的grna结合结构域,包括cas9核酸酶结构域,和核酸编辑蛋白的催化结构域(例如胞苷或腺苷脱氨酶)。在一些实施方案中,接头连接dcas9和核酸编辑蛋白。例如,接头位于两个基团、分子或其他部分之间或在两个基团、分子或其他部分的侧面,并通过共价键连接至每个,从而将两者连接。在一些实施方案中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为5至200个氨基酸,例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20,25、35、45、50、55、60、60、65、70、70、75、80、85、90、90、95、100、101、102、103、104、105、110、120、130、140、150、160、175、180、190或200个氨基酸的长度。也可以考虑更长或更短的接头。在一些实施方案中,接头包含氨基酸序列sgsetpgtsesatpes,其也可以称为xten接头。在一些实施方案中,接头包含氨基酸序列sggs。在一些实施方案中,接头包含(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes或(xp)n基序,或以下各项的组合其中任何一个,其中n独立地是1到30之间的整数,并且x是任何氨基酸。在一些实施方案中,n为1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中,连接基包含多个脯氨酸残基和长度为5至21、5至14、5至9、5至7个氨基酸,例如papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10。这种富含脯氨酸的接头也被称为“刚性”接头。[0086]在一些实施方案中,碱基编辑器的结构域通过包含以下氨基酸序列的接头融合。在一些实施方案中,碱基编辑器的结构域通过包含下述氨基酸序列的接头进行融合:[0087]sggssgsetpgtsesatpessggs,sggssggssgsetpgtsesatpessggssggs,或ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs。在一些实施方案中,碱基编辑器的结构域通过包含氨基酸序列sgsetpgtsesatpes的接头被融合,所述接头也被称为xten接头。在一些实施方案中,接头的长度为24个氨基酸。在一些实施方案中,接头包含氨基酸序列sggssggssgsetpgtsesatpes。在一些实施方案中,接头的长度为40个氨基酸。在一些实施方案中,接头包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggs。在一些实施方案中,接头的长度为64个氨基酸。在一些实施方案中,接头包含氨基酸序列sggssggssgsetpgtsesatpessggssggssggssggssgsspgsetpgtsesatpessggssggs。在一些实施方案中,接头的长度为92个氨基酸。在一些实施方案中,接头包含氨基酸序列pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats。[0088]如本文所用,术语“突变”是指例如核酸或氨基酸序列的序列中的残基被另一残基取代,或序列中一个或多个残基的缺失或插入。突变通常在本文中通过鉴定原始残基,且所述原始残基随后在序列中残基的位置及新取代的残基的身份来描述。本文提供的各种用于进行氨基酸取代(突变)的方法是本领域众所周知的,并且例如由green和sambrook,molecularcloning:alaboratorymanual(第4版,coldspringharborlaboratorypress,coldspringharbor,纽约(2012))所提供。在一些实施方案中,当前公开的碱基编辑器可以在核酸(例如,受试者的基因组内的核酸)中有效地产生“预期突变”,例如点突变,而不会产生大量的意外突变,例如意外的点突变。在一些实施方案中,预期的突变是由与专门设计用于产生预期的突变的指导多核苷酸(例如,grna)结合的特定碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)产生的突变。通常,相对于参考(或野生型)序列,即不包含突变的序列,对序列(例如,本文所述的氨基酸序列)中产生或鉴定的突变进行编号。本领域技术人员将容易理解如何确定氨基酸和核酸序列中的突变相对于参考序列的位置。[0089]如本文所用,术语“核酸”和“核酸分子”是指包含核碱基和酸性部分(例如,核苷、核苷酸或核苷酸的聚合物)的化合物。通常,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻的核苷酸通过磷酸二酯键彼此连接。在一些实施方案中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个个体核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”、“多核苷酸”和“多核酸”可互换使用,以指代核苷酸的聚合物(例如,至少三个核苷酸的字符串)。在一些实施方案中,“核酸”涵盖rna以及单链和/或双链dna。核酸可以是天然存在的,例如在基因组、转录物、mrna、trna、rrna、sirna、snrna、质粒、粘粒、染色体、染色单体或其他天然存在的核酸分子的背景下。另一方面,核酸分子可以是非天然存在的分子,例如重组dna或rna、人工染色体、工程基因组或其片段,或合成dna、rna、dna/rna杂种,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“dna”、“rna”和/或类似术语包括核酸类似物,例如具有除磷酸二酯主链以外的类似物。核酸可以从天然来源中纯化,使用重组表达系统产生,并任选地纯化、化学合成等。在适当的情况下,例如,在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰的碱基或糖和骨架修饰。除非另有说明,否则核酸序列以5'至3'方向显示。在一些实施方案中,核酸是或包含天然核苷(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷);或核苷类似物(例如2‑氨基腺苷、2‑硫代胸苷、肌苷、吡咯并嘧啶、3‑甲基腺苷、5‑甲基胞苷、2‑氨基腺苷、c5‑溴尿苷、c5‑氟尿苷、c5‑碘尿苷、c5‑丙炔基尿苷、c5‑丙炔基胞苷、c5‑甲基胞嘧啶、2‑氨基腺苷、7‑脱氮杂腺苷、7‑脱氮鸟苷、8‑氧代腺苷、8‑氧代鸟苷、o6‑甲基鸟嘌呤和2‑硫代胞苷);化学修饰的碱;生物修饰的碱(例如甲基化的碱);插层基;修饰的糖(例如2'‑氟核糖、核糖、2'‑脱氧核糖、阿拉伯糖和己糖);和/或修饰的磷酸基团(例如,硫代磷酸酯和5'‑n‑亚磷酰胺键)。[0090]术语“核定位序列”、“核定位信号”或“nls”是指促进蛋白质导入细胞核的氨基酸序列。核定位序列是本领域已知的,并且例如描述于plank等人在2000年11月23日提交的国际第pct/ep2000/011690号专利申请,且于2001年5月31日公开的wo第2001/038547号国际专利申请,所述专利的内容因其示例性核定位序列的公开内容通过引用并入本文。在其他实施方案中,nls是例如由koblan等人,naturebiotech,2018,doi:10.1038/nbt.4172所述的优化nls。在一些实施方案中,nls包含氨基酸序列krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprk、pkkkrkv或mdsllmnrrkflyqfknvrwakgrretylc。[0091]在本文中可互换使用的术语“核碱基”、“氮碱基”或“碱基”是指形成核苷的含氮生物化合物,其又是核苷酸的组分。核碱基形成碱基对并彼此堆叠的能力直接导致长链螺旋结构,例如核糖核酸(rna)和脱氧核糖核酸(dna)。五个核碱基‑腺嘌呤(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和尿嘧啶(u)–被称为初级或典范。腺嘌呤和鸟嘌呤衍生自嘌呤、胞嘧啶、尿嘧啶和胸腺嘧啶衍生自嘧啶。dna和rna也可以包含其他修饰的(非主要)碱基。非限制性示例性修饰核碱基可包括次黄嘌呤、黄嘌呤、7‑甲基鸟嘌呤、5,6‑二氢尿嘧啶、5‑甲基胞嘧啶(m5c)和5‑氢甲基胞嘧啶。次黄嘌呤和黄嘌呤可以通过诱变剂的存在而产生,它们都可以通过脱氨基作用(用羰基取代胺基)。次黄嘌呤可以由腺嘌呤修饰。黄嘌呤可以由鸟嘌呤修饰。尿嘧啶可以由胞嘧啶脱氨基产生。“核苷”由核碱基和五碳糖(核糖或脱氧核糖)组成。核苷的实例包括腺苷、鸟苷、尿苷、胞苷、5‑甲基尿苷(m5u)、脱氧腺苷、脱氧鸟苷、胸苷、脱氧尿苷和脱氧胞苷。具有修饰的核碱基的核苷的实例包括肌苷(i)、黄嘌呤(x)、7‑甲基鸟苷(m7g)、二氢尿苷(d)、5‑甲基胞苷(m5c)和假尿苷(ψ)。“核苷酸”由核碱基,五碳糖(核糖或脱氧核糖)和至少一个磷酸基团组成。[0092]术语“核酸可编程dna结合蛋白”或“napdnabp”可与“多核苷酸可编程核苷酸结合域”互换使用,以指代与核酸缔合的蛋白质(例如dna或rna),例如指导核酸,将napdnabp引导至特定核酸序列。例如,cas9蛋白可以与指导rna结合,所述指导rna将cas9蛋白引导至与指导rna互补的特定dna序列。在一些实施方案中,napdnabp是cas9结构域,例如核酸酶活性cas9、cas9切口酶(ncas9)或核酸酶非活性cas9(dcas9)。核酸可编程dna结合蛋白的实例包括但不限于cas9(例如dcas9和ncas9)、cas12a/cpf1、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。其他核酸可编程的dna结合蛋白也在本申请的范围内,尽管它们可能未在本申请中具体列出。参见,例如,makarova等人,“classificationandnomenclatureofcrispr‑cassystems:wherefromhere?”crisprj.2018oct;1:325‑336.doi:10.1089/crispr.2018.0033;yan等人,“functionallydiversetypevcrispr‑cassystems”science.2019jan4;363(6422):88‑91.doi:10.1126/science.aav7271,每个文献的全部内容通过引用并入本文。[0093]如本文所用,术语“核碱基编辑结构域”或“核碱基编辑蛋白”是指可催化rna或dna中的核碱基修饰的蛋白质或酶,例如胞嘧啶(或胞苷)变为尿嘧啶(或尿苷)或胸腺嘧啶(或胸腺嘧啶核苷)、以及腺嘌呤(或腺苷)对次黄嘌呤(或肌苷)的脱氨作用,以及非模板核苷酸的添加和插入。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域(例如胞苷脱氨酶、胞嘧啶脱氨酶、腺嘌呤脱氨酶或腺苷脱氨酶)。在一些实施方案中,核碱基编辑结构域可以是天然存在的核碱基编辑结构域。在一些实施方案中,核碱基编辑结构域可以是来自天然存在的核碱基编辑结构域的工程化或进化的核碱基编辑结构域。核碱基编辑结构域可以来自任何生物,例如细菌、人类、黑猩猩、大猩猩、猴子、牛、狗、大鼠或小鼠。例如,核碱基编辑蛋白在国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和国际第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中描述,其各自通过引用整体并入本文。另请参阅komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),其内容通过引用合并于此。[0094]如本文中所使用的,“获得”与“获得试剂”中的包括合成、购买或以其他方式获得试剂。[0095]如本文所用,“患者”或“受试者”是指被诊断患有、具有患上或发育中、或怀疑患有或发展成疾病或病症的哺乳动物受试者或个体。在一些实施方案中,术语“患者”是指患有疾病或病症的可能性高于平均可能性的哺乳动物受试者。示例性患者可以是人类、非人类灵长类动物、猫、狗、猪、牛、猫、马、骆驼、美洲驼、山羊、绵羊、啮齿动物(例如小鼠、兔子、大鼠或豚鼠)以及其他可以受益于本文公开的疗法。示例性的人类患者可以是男性和/或女性。[0096]“有此需要的患者”或“有此需要的受试者”在本文中是指被诊断为或怀疑患有疾病或病症的患者,例如但不限于rett综合症(rtt)。[0097]术语“致病性突变”、“致病性变异”、“疾病外壳突变”、“引起疾病的变异”、“有害突变”或“易感突变”是指遗传变异或突变,会增加个体的易感性或易患某种疾病或病症。在一些实施方案中,致病性突变包含由基因编码的蛋白质中的至少一种致病性氨基酸取代的至少一种野生型氨基酸。[0098]术语“非保守突变”涉及不同基团之间的氨基酸取代,例如赖氨酸代替色氨酸或苯丙氨酸代替丝氨酸等。在这种情况下,非保守氨基酸取代优选不被取代、干扰功能性变体或抑制其功能。非保守氨基酸取代可增强功能变体的生物学活性,从而与野生型蛋白质相比,功能变体的生物学活性增加。[0099]术语“蛋白质”、“肽”、“多肽”及其语法等同物在本文可互换使用,是指通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。所述术语是指任何大小、结构或功能的蛋白质、肽或多肽。通常,蛋白质、肽或多肽的长度至少为三个氨基酸。蛋白质、肽或多肽可以指单个蛋白质或蛋白质集合。蛋白质、肽或多肽中的一个或多个氨基酸可以被修饰,例如,通过添加化学实体,例如碳水化合物基团、羟基、磷酸基团、法尼基、异法尼基、脂肪酸基团,用于缀合、功能化或其他修饰的接头等。蛋白质、肽或多肽也可以是单分子或可以是多分子复合物。蛋白质、肽或多肽可以只是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的或合成的,或其任何组合。如本文所用,术语“融合蛋白”是指包含来自至少两种不同蛋白的蛋白结构域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基末端(n‑末端)部分或羧基末端(c‑末端)蛋白质上,从而分别形成氨基末端融合蛋白或羧基末端融合蛋白。蛋白质可以包含不同的结构域,例如核酸结合结构域(例如,指导蛋白质与靶位点结合的cas9的grna结合结构域)和核酸切割结构域或核酸的催化结构域酸编辑蛋白。在一些实施方案中,蛋白质包含蛋白质部分,例如构成核酸结合结构域的氨基酸序列,和有机化合物,例如可以充当核酸切割剂的化合物。在一些实施方案中,蛋白质与核酸例如rna或dna复合或相关。本文提供的任何蛋白质可以通过本领域已知的任何方法产生。例如,本文提供的蛋白可通过重组蛋白表达和纯化产生,其特别适合于包含肽接头的融合蛋白。重组蛋白表达和纯化的方法是众所周知的,包括green和sambrook,molecularcloning:alaboratorymanual(第4版,coldspringharborlaboratorypress,coldspringharbor,纽约(2012))中描述的方法,全部内容通过引用将其合并于此。[0100]本文公开的多肽和蛋白质(包括其功能部分和功能变体)可以包含合成氨基酸代替一种或多种天然存在的氨基酸。这样的合成氨基酸是本领域已知的,并且包括例如氨基环己烷羧酸、正亮氨酸、α‑氨基正癸酸、高丝氨酸、s‑乙酰氨基甲基‑半胱氨酸、反式3‑和反式4‑羟基脯氨酸、4‑氨基苯丙氨酸、4‑硝基苯丙氨酸、4‑氯苯丙氨酸、4‑羧基苯丙氨酸、β‑苯基丝氨酸β‑羟基苯丙氨酸、苯基甘氨酸、α‑萘丙氨酸、环己基丙氨酸、环己基甘氨酸、二氢吲哚‑2‑羧酸、1,2,3,4‑四氢异喹啉‑3‑羧酸、氨基丙二酸、氨基丙二酸单酰胺、n'‑苄基‑n'‑甲基赖氨酸、n',n'‑二苄基赖氨酸、6‑羟基赖氨酸、鸟氨酸、α‑氨基环戊烷羧酸、α‑氨基环己烷羧酸、α‑氨基环庚烷羧酸、α‑(2‑氨基‑2‑降冰片烷)‑羧酸、α,γ‑二氨基丁酸、α,β‑二氨基丙酸、高苯丙氨酸和α‑叔丁基甘氨酸。多肽和蛋白质可以与多肽构建体的一个或多个氨基酸的翻译后修饰相关。翻译后修饰的非限制性实例包括磷酸化、酰化(包括乙酰化和甲酰化)、糖基化(包括n‑连接和o‑连接)、酰胺化、羟基化、烷基化(包括甲基化和乙基化),泛素化、吡咯烷酮羧酸的加成、二硫键的形成、硫酸化、肉豆蔻酰化、棕榈酰化、异戊二烯化(isoprenylation)、法尼基化、香叶酰化(geranylation)、糖基磷脂酰肌醇化(glypiation)、硫辛酰化(lipoylation)和碘化。[0101]术语“多核苷酸可编程核苷酸结合结构域”是指与核酸(例如,dna或rna)缔合的蛋白质,例如指导多核苷酸可编程dna结合域的指导多核苷酸(例如,指导rna),其将多核苷酸可编程dna结合结构域引导至特定核酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9蛋白。cas9蛋白可以与指导rna结合,所述指导rna将cas9蛋白引导至与指导rna互补的特定dna序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9结构域,例如核酸酶活性cas9、cas9切口酶(ncas9)或核酸酶失活cas9(dcas9)。核酸可编程dna结合蛋白的非限制性实例包括cas9(例如,dcas9和ncas9)、cas12a/cpf1、cas12b/c2c1和cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12i。cas酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas8a、cas8b、cas8c、cas9(也称为csn1或csx12)、cas10、cas10d、cas12a/cpfl、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h、cas12i、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csccsc2、csa5、csn1、csn2、csm1、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csx11、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2,csa1、csa2、csa3、csa4、csa5、ii型cas效应蛋白、v型cas效应蛋白、vi型cas效应子蛋白、carf、ding、其同源物或其修饰或设计化形式。其他核酸可编程的dna结合蛋白也在本申请的范围内,尽管它们未在本申请中具体列出。[0102]本文在蛋白质或核酸的上下文中使用的术语“重组”是指自然界中不存在而是人类工程化的产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白或核酸分子包含氨基酸或核苷酸序列,所述氨基酸或核苷酸序列包含至少一个、至少两个、至少三个、至少四个、至少五个、至少六个或至少一个与任何自然发生的序列相比有七个突变。[0103]“减少”是指至少10%、25%、50%、75%或100%的负变化。[0104]“参考”是指标准或控制条件。在一个实施方案中,参照是野生型或健康细胞。[0105]“参考序列”是定义的序列,用作序列比较的基础。参考序列可以是指定序列的子集或全部。例如,全长cdna或基因序列的片段,或完整的cdna或基因序列。对于多肽,参考多肽序列的长度通常为至少约16个氨基酸,优选至少约20个氨基酸,更优选至少约25个氨基酸,甚至更优选约35个氨基酸、约50个氨基酸、或约100个氨基酸。对于核酸,参考核酸序列的长度通常为至少约50个核苷酸,优选至少约60个核苷酸,更优选至少约75个核苷酸,甚至更优选约100个核苷酸或约300个核苷酸或其附近或之间的任何整数。[0106]术语“rna可编程核酸酶”和“rna指导的核酸酶”与不是切割靶标的一种或多种rna一起使用(例如,结合或相关)。在一些实施方案中,当rna可编程的核酸酶与rna复合时,可被称为核酸酶:rna复合物。通常,结合的rna被称为指导rna(grna)。grna可以以两个或多个rna的复合体形式存在,也可以以单链rna分子形式存在。以单链rna分子形式存在的grna可以称为单链指导rna(sgrna),尽管“grna”可以互换使用,是指以单分子或双分子或多分子的复合物形式存在的指导rna。通常,以单链rna种类存在的grna包含两个域:(1)与靶核酸具有同源性的域(例如,并指导cas9复合物与靶标结合);(2)结合cas9蛋白的结构域。在一些实施方案中,结构域(2)对应于称为tracrrna的序列,并包含茎环结构。例如,在一些实施方案中,结构域(2)是与jinek等人在science337:816‑821(2012)中所提供的tracrrna相同或同源,其全部内容通过引用并入本文。grna的其他实例(例如,包括该等结构域2)可以于2013年9月6日所提交名称为“switchablecas9nucleasesanduses”的美国u.s.s.n.第61/874,682号专利临时申请,以及于2013年9月6日名称提交名称为“deliverysystemforfunctionalnucleases”的美国专利申请u.s.s.n.第61/874,746号专利临时申请的全部内容通过引用整体并入本文。在一些实施方案中,grna包含结构域(1)和(2)中的两个或更多个,并且可以被称为“延伸的grna”。例如,如本文所述,延伸的grna将例如结合两个或更多个cas9蛋白且在两个或更多个不同的区域结合靶核酸。grna包含与靶位点互补的核苷酸序列,其介导核酸酶/rna复合物与所述靶位点的结合,提供核酸酶:rna复合物的序列特异性。在一些实施方案中,rna可编程核酸酶是(crispr相关系统)cas9核酸内切酶,例如,来自化脓性链球菌的cas9(csnl)(参见,例如,“completegenomesequenceofanmlstrainofstreptococcuspyogenes.”,ferrettijj.、mcshanwm、ajdicdj、savicdj、savicg.、lyonk.、primeauxc、sezates.、suvorovan、kentons.、laihs、linsp、qiany.、jiahg、najarfz、renq.、zhuh.、songl.、whitej.、yuanx.、cliftonsw、roeba、mclaughlinre,proc.natl.acad.sci.usa98:4658‑4663(2001);“crisprrnamaturationbytrans‑encodedsmallrnaandhostfactorrnaseiii.”,deltchevae.、chylinskik.、sharmacm.、gonzalesk.、chaoy.、pirzadaza、eckertmr、vogelj.、charpentiere.,nature471:602‑607(2011)。[0107]术语“单核苷酸多态性(snp)”是发生在基因组中特定位置的单个核苷酸中的变异,其中每个变异在群体中以一定程度(例如>1%)存在。例如,在人类基因组的特定碱基位置,c核苷酸可以出现在大多数个体中,但在少数个体中,所述位置被a占据。这意味着在所述特定位置存在一个snp,并且这两个可能的核苷酸变异c或a被认为是所述位置的等位基因。snp是对疾病易感性的差异基础。疾病的严重程度以及人体对治疗的反应方式也是遗传变异的表现。snp可以落入基因的编码区域,基因的非编码区域或基因间区域(基因之间的区域)内。在一些实施方案中,由于遗传密码的简并性,编码序列内的snp不一定改变所产生的蛋白质的氨基酸序列。编码区中的snp有两种类型:同义和非同义snp。同义snp不会影响蛋白质序列,而非同义snp会改变蛋白质的氨基酸序列。非同义snp有两种类型:错义和无义。不在蛋白质编码区的snp仍会影响基因剪接,转录因子结合,信使rna降解或非编码rna的序列。受这种snp类型影响的基因表达称为esnp(表达snp),可以在基因的上游或下游。单核苷酸变异体(snv)是单核苷酸的变异体,没有频率限制,可以在体细胞中产生。体细胞单核苷酸变异(例如,由癌症引起)也可以称为单核苷酸变异。[0108]“特异性结合”是指识别并结合多肽和/或核酸的核酸分子、多肽或其复合物(例如,核酸可编程dna结合域和指导核酸)、化合物或分子。本申请的酸性分子,但是基本上不识别并结合样品,例如生物样品中的其他分子。[0109]可用于本申请方法的核酸分子包括编码本申请多肽或其片段的任何核酸分子。这样的核酸分子不必与内源核酸序列100%相同,但是通常将显示出实质同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。可用于本申请方法的核酸分子包括编码本申请多肽或其片段的任何核酸分子。这样的核酸分子不必与内源核酸序列100%相同,但是通常将显示出实质同一性。与内源序列具有“基本同一性”的多核苷酸通常能够与双链核酸分子的至少一条链杂交。“杂交”是指在各种严格条件下在互补多核苷酸序列(例如,本文描述的基因)或其部分之间形成双链分子的对。(参见例如wahl,g.m.和s.l.berger(1987)methodsenzymol.152:399;kimmel,a.r.(1987)methodsenzymol.152:507)。[0110]例如,严谨的盐浓度通常小于约750mmnacl和75mm柠檬酸三钠,优选小于约500mmnacl和50mm柠檬酸三钠,更优选小于约250mmnacl和25mm柠檬酸三钠盐。在不存在有机溶剂例如甲酰胺的情况下可获得低严谨度杂交,而在至少约35%的甲酰胺,更优选至少约50%的甲酰胺的存在下可以获得高严谨度杂交。严格的温度条件通常将包括至少约30℃,更优选至少约37℃,最优选至少约42℃的温度。改变其他参数,例如杂交时间、去污剂的浓度,例如,十二烷基硫酸钠(sds)以及包含或排除载体dna是本领域技术人员众所周知的。通过根据需要组合这些各种条件来实现各种严谨度。在一个优选的实施方案中,杂交将在30℃在750mmnacl、75mm柠檬酸三钠和1%sds中发生。在一个更优选的实施方案中,杂交将在37℃下在500mmnacl、50mm柠檬酸三钠、1%sds、35%甲酰胺和100μg/ml变性鲑鱼精dna中进行。在最优选的实施方案中,杂交将在42℃在250mmnacl、25mm柠檬酸三钠、1%sds、50%甲酰胺和200μg/mlssdna中发生。在这些条件下有用的变化对于本领域技术人员是显而易见的。[0111]对于大多数应用,杂交后的洗涤步骤的严谨度也会有所不同。洗涤严谨度条件可以通过盐浓度和温度来定义。如上所述,可以通过降低盐浓度或通过提高温度来提高洗涤严谨度。例如,洗涤步骤的严谨的盐浓度将优选小于约30mmnacl和3mm柠檬酸三钠,最优选小于约15mmnacl和1.5mm柠檬酸三钠。洗涤步骤的严格温度条件通常包括至少约25℃,更优选至少约42℃,甚至更优选至少约68℃的温度。在优选的实施方案中,洗涤步骤将为在25℃的30mmnacl、3mm柠檬酸三钠和0.1%sds中发生。在更优选的实施方案中,洗涤步骤将在42℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中进行。在更优选的实施方案中,洗涤步骤将在68℃下在15mmnacl、1.5mm柠檬酸三钠和0.1%sds中进行。这些条件的其他变化对于本领域技术人员是显而易见的。杂交技术是本领域技术人员众所周知的,并且描述于例如benton和davis(science196:180,1977);grunstein和hogness(proc.natl.acad.sci.,usa72:3961,1975);ausubel等人(currentprotocolsinmolecularbiolog,wileyinterscience,纽约,2001);berger和kimmel(guidetomolecularcloningtechniques,1987年,academicpress,纽约);和sambrook等人,molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,纽约。[0112]“受试者”是指哺乳动物,包括但不限于人类或非人类哺乳动物,例如牛、马、犬、绵羊或猫。[0113]“基本上相同”是指与参考氨基酸序列(例如,本文所述的任何一种氨基酸序列)或核酸序列(例如,本文所述的任何一种核酸序列)。优选地,这种序列在氨基酸水平或核酸水平上与用于比较的序列至少60%,更优选80%或85%,并且更优选90%、95%或什至99%相同。[0114]序列同一性通常使用序列分析软件(例如,威斯康星大学(1710universityavenue,madison,wis.53705)生物技术中心遗传学计算机组的序列分析软件包、blast、bestfit、gap或pileup/prettybox程序进行测量)。此类软件通过将同源性程度分配给各种替换、缺失和/或其他修饰来匹配相同或相似的序列。保守取代通常包括以下组内的取代:甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸,谷氨酸,天冬酰胺,谷氨酰胺;丝氨酸,苏氨酸赖氨酸,精氨酸;和苯丙氨酸、酪氨酸。在确定同一性程度的示例性方法中,可以使用blast程序,其中e‑3和e‑100之间的概率分数表示密切相关的序列。[0115]例如,cobalt用于以下参数:[0116]a)对齐参数:空位罚分‑11、‑1和空位罚分‑5、‑1,[0117]b)cdd参数:使用rpsblast;blaste值0.003;搜寻保守列并重新计算,然后[0118]c)查询聚类参数:使用查询聚类;字元长度4;最大丛集距离0.8;常规字母。[0119]embossneedle例如使用以下参数:[0120]a)矩阵:blosum62;[0121]b)开放空位:10;[0122]c)扩展空位:0.5;[0123]d)输出格式:成对;[0124]e)最终空位罚分:假;[0125]f)最终空位开启:10;以及[0126]g)最终空位扩展:0.5。[0127]术语“靶位点”是指核酸分子内被核碱基编辑器修饰的序列。在一个实施方案中,靶位点被脱氨酶或包含脱氨酶的融合蛋白(例如胞苷或腺嘌呤脱氨酶)脱氨。[0128]因rna可编程核酸酶(例如,cas9)使用rna:dna杂交来靶向dna切割位点,所以这些蛋白质原则上能够靶向由指导rna指定的任何序列。使用rna可编程核酸酶(例如cas9)进行位点特异性切割(例如,修饰基因组)的方法是本领域已知的(例如,参见cong,l.等人,multiplexgenomeengineeringusingcrispr/cassystems.,science339,819‑823(2013);mali,p.等人,rna‑guidedhumangenomeengineeringviacas9.,science339,823‑826(2013);hwang,w.y.等人,efficientgenomeeditinginzebrafishusingacrispr‑cassystem.,naturebiotechnology31,227‑229(2013);jinek,m.等人,rna‑programmedgenomeeditinginhumancells.elife2,e00471(2013);dicarlo,j.e.等人,genomeengineeringinsaccharomycescerevisiaeusingcrispr‑cassystems.,nucleicacidsresearch(2013);jiang,w.等人,rna‑guidededitingofbacterialgenomesusingcrispr‑cassystems.,naturebiotechnology31,233‑239(2013);每个的全部内容通过引用并入本文)。[0129]如本文所用,术语“治疗”是指减轻或改善与之相关的病症和/或症状或获得所需的药理和/或生理作用。应当理解,尽管没有排除,但治疗疾病或病症并不需要完全消除与之相关的疾病、病症或症状。在一些实施方案中,所述作用是治疗性的,即,但不限于,所述作用部分或完全减轻(reduces)、减少(diminishes)、消除(abrogates)、减轻(abates)、减轻(alleviates)、减轻(decreases)疾病的强度或治愈(cures)疾病和/或归因于所述疾病的不良症状。在一些实施方案中,所述作用是预防性的,即所述作用保护或预防疾病或病症的发生或再发生。为此,本申请公开的方法包括给予治疗有效量的本文所述的组合物。[0130]“尿嘧啶糖基化酶抑制剂”是指抑制尿嘧啶切除修复系统的药剂。在一个实施方案中,所述试剂是结合宿主尿嘧啶‑dna糖基化酶并防止从dna去除尿嘧啶残基的蛋白质或其片段。[0131]在本文对变量的任何定义中列举化学基团的列举包括将所述变量定义为所列基团的任何单个基团或组合。本文中对变量或方面的实施例的叙述包括所述实施例作为任何单个实施例或与任何其他实施例或其部分组合。[0132]本文提供的任何组合物或方法可以与本文提供的任何其他组合物或方法中的一种或多种结合。[0133]dna编辑已成为通过在遗传水平上校正致病突变来改变疾病状态的可行方法。直到最近,所有的dna编辑平台都通过在指定的基因组位点诱导dna双链断裂(dsb)并依靠内源性dna修复途径以半随机方式确定产物的结果来起作用,从而导致复杂的遗传产物种群。尽管可以通过同源引导修复(homologydirectedrepair,hdr)途径实现精确的用户定义的修复结果,但许多挑战已阻止了在治疗相关细胞类型中使用hdr进行高效修复。在实践中,相对于竞争性的,易于出错的非同源末端连接途径的效率低下。此外,hdr严格限制在细胞周期的g1期和s期,从而防止有丝分裂后细胞中dsb的精确修复。结果,已经证明难以或不可能以用户定义的可编程方式在这些人群中高效地改变基因组序列。[0134]核碱基编辑器[0135]本文公开了用于编辑、修饰或改变多核苷酸的靶核苷酸序列的碱基编辑器或核碱基编辑器。本文描述的是包含多核苷酸可编程核苷酸结合结构域和核碱基编辑结构域的核碱基编辑器或碱基编辑器。当与结合的指导多核苷酸(例如,grna)结合时,多核苷酸可编程核苷酸结合结构域可以特异性地结合至靶多核苷酸序列(即,通过结合的指导核酸的碱基与靶多核苷酸序列的碱基之间的互补碱基配对),从而将碱基编辑器定位到希望被编辑的靶核酸序列。在一些实施方案中,靶多核苷酸序列包含单链dna或双链dna。在一些实施方案中,靶多核苷酸序列包含rna。在一些实施方案中,靶多核苷酸序列包含dna‑rna杂合体。[0136]多核苷酸可编程核苷酸结合域[0137]术语“多核苷酸可编程核苷酸结合结构域”或“核酸可编程dna结合蛋白(napdnabp)”是指与核酸(例如,dna或rna)相关的蛋白质,例如指导多核苷酸(例如,指导rna),其将多核苷酸可编程核苷酸结合结构域引导至特定核酸序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9蛋白。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cpf1蛋白。[0138]crispr是一种适应性免疫系统,可针对移动遗传元件(病毒、转座因子和结合质粒)提供保护。crispr簇包含间隔子,与先前的移动元件互补的序列以及靶向入侵的核酸。crispr簇被转录并加工成crisprrna(crrna)。在ii型crispr系统中,正确处理pre‑crrna需要反编码小rna(tracrrna)、内源性核糖核酸酶3(rnc)和cas9蛋白。tracrrna可作为核糖核酸酶3辅助pre‑crrna加工的指南。随后,cas9/crrna/tracrrna进行核酸内切切割与间隔物互补的线性或环状dsdna靶标。不与crrna互补的靶链首先在核酸内切,然后在核酸外切3'‑5'。实际上,dna结合和切割通常需要蛋白质和两个rna。但是,可以设计单链指导rna(“sgrna”或简称为“grna”),以便将crrna和tracrrna的各个方面都整合到单个rna物种中。例如参见jinekm.,chylinskik.,fonfarai.,hauerm.,doudnaj.a.,charpentiere.science337:816‑821(2012),其全部内容通过引用结合于此。cas9识别crispr重复序列中的短基序(pam或原间隔物相邻基序),以帮助区分自身和非自身。[0139]核碱基编辑器的cas9域[0140]cas9核酸酶序列和结构是本领域技术人员众所周知的(例如,参见“completegenomesequenceofanmlstrainofstreptococcuspyogenes.”,ferretti等人,j.j.、mcshanw.m.、ajdicd.j.、savicd.j.、savicg.、lyonk.、primeauxc.、sezates.、suvorova.n.、kentons.、laih.s.、lins.p.、qiany.、jiah.g.、najarf.z.、renq.、zhuh.、songl.、whitej.、yuanx.、cliftons.w.、roeb.a.、mclaughlinr.e.、proc.natl.acad.sci.u.s.a.98:4658‑4663(2001);“crisprrnamaturationbytrans‑encodedsmallrnaandhostfactorrnaseiii.”deltchevae.、chylinskik.、sharmac.m.、gonzalesk.、chaoy.、pirzadaz.a.、eckertm.r.、vogelj.、charpentiere.、nature471:602‑607(2011);and“aprogrammabledual‑rna‑guideddnaendonucleaseinadaptivebacterialimmunity.”,jinekm.、chylinskik.、fonfarai.、hauerm.、doudnaj.a.、charpentiere.science337:816‑821(2012),每个都通过引用并入本文)。已经在各种物种中描述cas9直向同源物,包括但不限于化脓性链球菌和嗜热链球菌。基于所述公开,其他合适的cas9核酸酶和序列对本领域技术人员是显而易见的,并且此类cas9核酸酶和序列包括来自chylinski、rhun及charpentier,“thetracrrnaandcas9familiesoftypeiicrispr‑casimmunitysystems”(2013)rnabiology10:5,726‑737;其全部内容通过引用并入本文。[0141]在一些方面,核酸可编程dna结合蛋白(napdnabp)是cas9结构域。本文提供非限制性的示例性cas9结构域。cas9结构域可以是核酸酶活性cas9结构域、核酸酶非活性cas9结构域或cas9切口酶。在一些实施方案中,cas9结构域是核酸酶活性结构域。例如,cas9结构域可以是切割双链核酸的两条链(例如,双链dna分子的两条链)的cas9结构域。在一些实施方案中,cas9结构域包含如本文所述的任何氨基酸序列。在一些实施方案中,cas9结构域包含的氨基酸序列与本文列出的任何氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。在一些实施方案中,与本文列出的任何氨基酸序列相比,cas9结构域包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18,19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、4344、45、46、47、48、49、50个或更多个突变。在一些实施方案中,与本文列出的任何氨基酸序列相比,cas9结构域包含具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。[0142]在一些实施方案中,cas9核酸酶具有失活的(例如,灭活的)dna切割结构域,即,所述cas9是切口酶,称为“ncas9”蛋白(作为“切口酶”cas9)。核酸酶灭活的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶死亡的cas9)或催化失活的cas9。产生具有失活的dna切割结构域的cas9蛋白(或其片段)的方法是已知的(例如,参见jinek等人,science.,337:816‑821(2012);qi等人,“repurposingcrisprasanrna‑guidedplatformforsequence‑specificcontrolofgeneexpression.”(2013)cell,28;152(5):1173‑83,其每一个的全部内容通过引用并入本文。例如,已知cas9的dna切割结构域包括两个亚结构域,即hnh核酸酶亚结构域和ruvc1亚结构域。hnh子域切割与grna互补的链,而ruvc1子域切割非互补链。这些亚结构域内的突变可以使cas9的核酸酶活性沉默。例如,突变d10a和h840a完全灭活了化脓性链球菌cas9的核酸酶活性(jinek等人,science,337:816‑821(2012);qi等人,cell.,28;152(5):1173‑83(2013))。在一些实施方案中,提供了包含cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含两个cas9结构域之一:(1)cas9的grna结合结构域;或(2)cas9的dna切割结构域。在一些实施方案中,包含cas9或其片段的蛋白质被称为“cas9变体”。cas9变体与cas9或其片段具有同源性。例如,cas9变体与野生型cas9具有至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同的同一性。在一些实施方案中,cas9变体与野生型cas9相比,可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个氨基酸或更多的氨基酸变化。在一些实施方案中,cas9变体包含cas9的片段(例如,grna结合结构域或dna切割结构域),使得所述片段与野生型cas9的相应片段至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约96%相同、至少约97%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,所述片段相应野生型cas9的氨基酸长度的至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%相同、至少96%、至少97%、至少98%、至少99%或的至少99.5%。[0143]在一些实施方案中,所述片段的长度为至少100个氨基酸。在一些实施方案中,片段的长度至少100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250或至少1300个氨基酸。在一些实施方案中,野生型cas9对应于来自化脓性链球菌的cas9(ncbi参考序列:nc_017053.1,核苷酸和氨基酸序列如下):[0144]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0145][0145](底线:hnh域;双底线:ruvc域)[0146]在一些实施方案中,野生型cas9对应于或包含以下核苷酸和/或氨基酸序列:[0147]atggataaaaagtattctattggtttagacatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgacggatcccccaagaagaagaggaaagtctcgagcgactacaaagaccatgacggtgattataaagatcatgacatcgattacaaggatgacgatgacaaggctgcagga[0148][0149][0149](单底线:hnh域;双底线:ruvc域)[0150]在一些实施方案中,野生型cas9对应于化脓性链球菌的cas9(ncbi参考序列:nc_002737.2(核苷酸序列如下);以及uniprot参考序列:q99zw2(氨基酸序列如下):[0151]atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga[0152][0153][0153](单底线:hnh域;双底线:ruvc域)[0154]在一些实施方案中,碱基编辑器的crispr蛋白来源的结构域可包括来自溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbiref:nc_016782.1,nc_016786.1);栖蚜蝇螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间型普氏杆菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺旋体(spiroplasmataiwanense)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);波罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquis)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);无害李斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1);脑膜炎双球菌(neisseriameningitidis)(ncbiref:yp_002342100.1),化脓性链球菌(streptococcuspyogenes)或金黄色葡萄球菌的cas9的全部或部分。[0155]在一些实施方案中,dcas9对应于或部分或全部包含具有使cas9核酸酶活性失活的一个或多个突变的cas9氨基酸序列。例如,在一些实施方案中,dcas9结构域包含d10a和h840a突变或另一cas9中的相应突变。在一些实施方案中,dcas9包含dcas9的氨基酸序列(d10a和h840a):[0156][0157][0157](单底线:hnh域;双底线:ruvc域)。[0158]在一些实施方案中,cas9结构域包含d10a突变,而位置840上的残基在以上提供的氨基酸序列中或在本文提供的任何氨基酸序列中的相应位置处仍为组氨酸。[0159]在其他实施方案中,提供了具有除d10a和h840a以外的突变的dcas9变体,其例如导致核酸酶灭活的cas9(dcas9)。举例来说,此类突变包括在d10和h840处的其他氨基酸取代,或在cas9的核酸酶结构域内的其他取代(例如,在hnh核酸酶子结构域和/或ruvc1子结构域中的取代)。在一些实施方案中,提供了dcas9的变体或同源物,其至少约70%相同、至少约80%相同、至少约90%相同、至少约95%相同、至少约98%相同、至少约99%相同、至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供的dcas9变体具有以下氨基酸序列,所述氨基酸序列较短或更长约5个氨基酸、约10个氨基酸、约15个氨基酸、约20个氨基酸、约25个氨基酸、约30个氨基酸、约40个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸或更多。[0160]在一些实施方案中,本文提供的cas9融合蛋白包含cas9蛋白的全长氨基酸序列,例如本文提供的cas9序列之一。然而,在其他实施方案中,本文提供的融合蛋白不包含全长cas9序列,而仅包含其一个或多个片段。本文提供了合适的cas9结构域和cas9片段的示例性氨基酸序列,并且cas9结构域和片段的其他合适的序列对本领域技术人员而言是显而易见的。[0161]cas9蛋白可以与指导rna缔合,指导rna将cas9蛋白引导至与指导rna具有互补性的特定dna序列。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是cas9结构域,例如核酸酶活性cas9、cas9切口酶(ncas9)或核酸酶失活cas9(dcas9)。核酸可编程dna结合蛋白的实例包括但不限于cas9(例如,dcas9和ncas9)、casx、casy、cpf1、cas12b/c2c1和cas12c/c2c3。[0162]核酸酶灭活的cas9蛋白可以互换地称为“dcas9”蛋白(对于核酸酶死亡的cas9)或催化失活的cas9。产生具有失活的dna切割结构域的cas9蛋白(或其片段)的方法是已知的(例如,参见jinek等人,science.337:816‑821(2012);qi等人,“repurposingcrisprasanrna‑guidedplatformforsequence‑specificcontrolofgeneexpression.”(2013)cell.,28;152(5):1173‑83,其每一个的全部内容通过引用并入本文。例如,已知cas9的dna切割结构域包括两个亚结构域,即hnh核酸酶亚结构域和ruvc1亚结构域。hnh子域切割与grna互补的链,而ruvc1子域切割非互补链。这些亚结构域内的突变可以使cas9的核酸酶活性沉默。例如,突变d10a和h840a完全灭活了化脓性链球菌cas9的核酸酶活性(jinek等人,science.,337:816‑821(2012);qi等人,cell.,28;152(5):1173‑83(2013))。[0163]在一些实施方案中,cas9结构域是cas9切口酶。cas9切口酶可以是cas9蛋白,其能够仅切割双链核酸分子(例如,双链dna分子)的一条链。在一些实施方案中,cas9切口酶切割双链核酸分子的靶链,这意味着cas9切口酶切割与结合至cas9的grna(例如,sgrna)碱基配对(互补)的链。在一些实施方案中,cas9切口酶包括d10a突变并且在840位具有组氨酸。在一些实施方案中,cas9切口酶切割双链核酸分子的非靶标、非碱基编辑的链,这意味着cas9切口酶切割未与结合至cas9的grna(例如,sgrna)碱基配对的链。在一些实施方案中,cas9切口酶包含h840a突变并且在位置10处具有天冬氨酸残基或相应的突变。在一些实施方案中,cas9切口酶包含的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%与本文提供的任何cas9切口酶相同。基于本申请和本领域的知识,其他合适的cas9切口酶对于本领域技术人员是显而易见的,并且在本申请的范围内。[0164]在一些实施方案中,cas9结构域是无核酸酶的cas9结构域(dcas9)。例如,dcas9结构域可以结合双链核酸分子(例如,通过grna分子),而不切割双链核酸分子的任一链。在一些实施方案中,无核酸酶的dcas9结构域包含本文列出的氨基酸序列的d10x突变和h840x突变,或本文提供的任何氨基酸序列中的相应突变,其中x是任何氨基酸改变。在一些实施方案中,无核酸酶的dcas9结构域包含本文列出的氨基酸序列的d10a突变和h840a突变,或本文提供的任何氨基酸序列中的相应突变。作为一个实例,无核酸酶的cas9结构域包含克隆载体pplattet‑grna2(登录号第bav54124号)中列出的氨基酸序列:[0165]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd(例如,参见qi等人,“repurposingcrisprasanrna‑guidedplatformforsequence‑specificcontrolofgeneexpression.”cell.,2013;152(5):1173‑83,其全部内容通过引用并入本文)。[0166]应了解,包括其变体和同源物在内的其他cas9蛋白(例如,核酸酶死亡的cas9(dcas9)、cas9切口酶(ncas9)或核酸酶活性cas9),包括其变体和同源物。示例性的cas9蛋白包括但不限于以下提供的那些。在一些实施方案中,cas9蛋白是核酸酶死亡的cas9(dcas9)。在一些实施方案中,cas9蛋白是cas9切口酶(ncas9)。在一些实施方案中,cas9蛋白是核酸酶活性的cas9。[0167]示例性的催化失活cas9(dcas9):[0168]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdaivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0169]示例性的催化cas9切口酶(ncas9):[0170]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0171]示例性的具有催化活性的cas9:[0172]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd。[0173]在一些实施方案中,cas9指来自古细菌(例如,纳米古细菌)的cas9,其构成单细胞原核微生物的域和界。在一些实施方案中,可编程核苷酸结合蛋白可以是casx或casy蛋白,其已经描述于例如burstein等人,“newcrispr‑cassystemsfromuncultivatedmicrobes.”,cellres,2017年2月21日,doi:10.1038/cr.2017.21,其全部内容通过引用合并于此。使用基因组分辨的宏基因组学(metagenomic),鉴定了许多crispr‑cas系统,包括生命古细菌域中首次报导的cas9。这种差异化的cas9蛋白是在鲜为研究的纳古生菌(nanoarchaea)中发现的,是主动crispr‑cas系统的一部分。在细菌中,发现了两个以前未知的系统,即crispr‑casx和crispr‑casy,它们是迄今为止发现的最紧凑的系统。在一些实施例中,在本文所述的碱基编辑器系统中,cas9被casx或casx的变体替代。在一些实施例中,在本文描述的碱基编辑器系统中,cas9被casy或casy的变体替代。应当理解,其他rna引导的dna结合蛋白可以用作核酸可编程dna结合蛋白(napdnabp),并且在本申请的范围内。[0174]在一些实施方案中,本文提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是casx或casy蛋白。在一些实施方案中,napdnabp是casx蛋白。在一些实施方案中,napdnabp是casy蛋白。在一些实施方案中,napdnabp包含的氨基酸序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%与天然存在的casx或casy蛋白相同。在一些实施方案中,可编程核苷酸结合蛋白是天然存在的casx或casy蛋白。在一些实施方案中,可编程核苷酸结合蛋白包含与本文所述的任何casx或casy蛋白具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%,至少97%,至少98%,至少99%或至少99.5%的同一性的氨基酸序列。应当理解,根据本申请,也可以使用来自其他细菌物种的casx和casy。[0175]示例性的casx((uniprot.org/uniprot/f0nn87;uniprot.org/uniprot/f0nh53)tr|f0nn87|f0nn87_sulihcrispr相关的casx蛋白os=冰岛硫化叶菌(菌株hve10/4)gn=sih_0402pe=4sv=1)氨基酸序列如下:[0176]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefyefgrspgmvertrrvklevephyliiaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvriytisdavgqnpttinggfsidltkllekryllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0177]>tr|f0nh53|f0nh53_sulircrispr相关蛋白,casxos=冰岛硫化叶菌(菌株rey15a)gn=sire_0771pe=4sv=1)氨基酸序列如下:[0178]mevplynifgdnyiiqvateaenstiynnkveiddeelrnvlnlaykiaknnedaaaerrgkakkkkgeegetttsniilplsgndknpwtetlkcynfpttvalsevfknfsqvkeceevsapsfvkpefykfgrspgmvertrrvklevephylimaaagwvltrlgkakvsegdyvgvnvftptrgilysliqnvngivpgikpetafglwiarkvvssvtnpnvsvvsiytisdavgqnpttinggfsidltkllekrdllserleaiarnalsissnmreryivlanyiyeyltgskrledllyfanrdlimnlnsddgkvrdlklisayvngelirgeg[0179]δ‑变形菌casx[0180]mekrinkirkklsadnatkpvsrsgpmktllvrvmtddlkkrlekrrkkpevmpqvisnnaannlrmllddytkmkeailqvywqefkddhvglmckfaqpaskkidqnklkpemdekgnlttagfacsqcgqplfvykleqvsekgkaytnyfgrcnvaeheklillaqlkpvkdsdeavtyslgkfgqraldfysihvtkesthpvkplaqiagnryasgpvgkalsdacmgtiasflskyqdiiiehqkvvkgnqkrleslrelagkenleypsvtlppqphtkegvdfayneviarvrmwvnlnlwqklklsrddakpllrlkgfpsfpvverrenevdwwntinevkklidakrdmgrvfwsgvtaekrntilegynylpnendhkkregslenpkkpakrqfgdlllylekkyagdwgkvfdeaweridkkiagltshiereearnaedaqskavltdwlrakasfvlerlkemdekefyaceiqlqkwygdlrgnpfaveaenrvvdisgfsigsdghsiqyrnllawkylengkrefyllmnygkkgrirftdgtdikksgkwqgllygggkakvidltfdpddeqliilplafgtrqgrefiwndllsletgliklangrviektiynkkigrdepalfvaltferrevvdpsnikpvnligvargenipavialtdpegcplpefkdssggptdilrigegykekqraiqaakeveqrraggysrkfasksrnladdmvrnsardlfyhavthdavlvfanlsrgfgrqgkrtfmterqytkmedwltaklayegltsktylsktlaqytsktcsncgftityadmdvmlvrlkktsdgwattlnnkelkaeyqityynrykrqtvekelsaeldrlseesgnndiskwtkgrrdealfllkkrfshrpvqeqfvcldcghevhaaeqaalniarswlflnsnstefksyksgkqpfvgawqafykrrlkevwkpna[0181]示例性的casy((ncbi.nlm.nih.gov/蛋白质/apg80656.1)>apg80656.1crispr相关蛋白casy[未培养的俭菌总门群细菌])氨基酸序列如下:[0182]mskrhprisgvkgyrlhaqrleytgksgamrtikyplysspsggrtvpreivsainddyvglyglsnfddlynaekrneekvysvldfwydcvqygavfsytapgllknvaevrggsyeltktlkgshlydelqidkvikflnkkeisrangsldklkkdiidcfkaeyrerhkdqcnkladdiknakkdagaslgerqkklfrdffgiseqsendkpsftnplnltccllpfdtvnnnrnrgevlfnklkeyaqkldknegslemweyigignsgtafsnflgegflgrlrenkitelkkammditdawrgqeqeeelekrlrilaaltiklrepkfdnhwggyrsdingklsswlqnyinqtvkikedlkghkkdlkkakeminrfgesdtkeeavvssllesiekivpddsaddekpdipaiaiyrrflsdgrltlnrfvqredvqealikerleaekkkkpkkrkkksdaedeketidfkelfphlakplklvpnfygdskrelykkyknaaiytdalwkavekiyksafssslknsffdtdfdkdffikrlqkifsvyrrfntdkwkpivknsfapycdivslaenevlykpkqsrsrksaaidknrvrlpsteniakagialarelsvagfdwkdllkkeeheeyidlielhktalalllavtetqldisaldfvengtvkdfmktrdgnlvlegrflemfsqsivfselrglaglmsrkefitrsaiqtmngkqaellyiphefqsakittpkemsrafldlapaefatslepeslseksllklkqmryyphyfgyeltrtgqgidggvaenalrlekspvkkreikckqyktlgrgqnkivlyvrssyyqtqflewflhrpknvqtdvavsgsflidekkvktrwnydaltvalepvsgservfvsqpftifpeksaeeegqrylgidigeygiaytaleitgdsakildqnfisdpqlktlreevkglkldqrrgtfampstkiarireslvhslrnrihhlalkhkakivyelevsrfeegkqkikkvyatlkkadvyseidadknlqttvwgklavaseisasytsqfcgackklwraemqvdetittqeligtvrvikggtlidaikdfmrppifdendtpfpkyrdfcdkhhiskkmrgnsclficpfcranadadiqasqtiallryvkeekkvedyferfrklknikvlgqmkki[0183]应当理解,多核苷酸可编程核苷酸结合结构域也可以包括结合rna的核酸可编程蛋白。例如,多核苷酸可编程核苷酸结合结构域可以与将多核苷酸可编程核苷酸结合结构域引导至rna的核酸结合。其他核酸可编程的dna结合蛋白也在本申请的范围内,尽管它们未在本申请中具体列出。[0184]可以在本文中使用的cas蛋白包括1类和2类。cas蛋白的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas5d、cas5t、cas5h、cas5a、cas6、cas7、cas8、cas9(也称为csn1或csx12)、cas10、csy1、csy2、csy3、csy4、cse1、cse2、cse3、cse4、cse5e、csc1、csc2、csa5、csn1、csn2、csm1、csm2、csm3、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx1s、csf1、csf2、cso、csf4、csd1、csd2、cst1、cst2、csh1、csh2、csa1、csa2、csa3、csa4、csa5、cas12a/cpf1、cas12b/c2c1、cas12c/c2c3、cas12d/casy、cas12e/casx、cas12g、cas12h和cas12icarf、ding、其同源物或已修饰者。未经修饰的crispr酶可以具有dna切割活性,例如cas9,它具有两个功能性核酸内切酶结构域:ruvc和hnh。crispr酶可以指导在靶序列上例如在靶序列内和/或在靶序列的互补序列内切割一条或两条链。例如,crispr酶可以指导一条或两条链在大约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或自靶序列的第一个或最后一个核苷酸的多个碱基对。[0185]可使用编码相对于相应的野生型酶突变的crispr酶的载体,使突变的crispr酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。cas9可以指与野生型示例性cas9多肽(例如,化脓性链球菌的cas9)具有至少或至少约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性和/或序列同源性的多肽。cas9可以指与野生型示例性cas9多肽(例如,来自化脓性链球菌)具有最多或最多约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性和/或序列同源性的多肽。cas9可指cas9蛋白的野生型或修饰形式,其可包含氨基酸变化,例如缺失、插入、取代、变体、突变、融合、嵌合体或上述之任何组合。[0186]在一些实施方案中,本文描述的方法可以利用工程改造的cas蛋白。指导rna(grna)是一种简短的合成rna,由cas结合所需的支架序列和用户定义的~20个核苷酸间隔区组成,所述间隔区定义了要修饰的基因组靶标。因此,技术人员可以改变cas蛋白的基因组靶标,部分地由与基因组其余部分相比grna靶向序列对基因组靶标的特异性来部分确定。[0187]cas9核酸酶具有两个功能性核酸内切酶结构域:ruvc和hnh。cas9在靶标结合后经历第二个构象变化,所述变化使核酸酶结构域定位,以切割靶标dna的相对链。cas9介导的dna切割的最终结果是靶dna(pam序列上游约3‑4个核苷酸)内的双链断裂(dsb)。然后,通过两种一般的修复途径之一修复所得的dsb:(1)有效但容易出错的非同源末端连接(nhej)途径;或(2)效率较低但高保真同源引导修复(hdr)途径。[0188]非同源末端连接(nhej)和/或同源引导修复(hdr)的“效率”可以通过任何方便的方法来计算。例如,在某些情况下,效率可以用成功hdr的百分比表示。例如,可以使用测量员核酸酶测定法(surveyornucleaseassay)来产生切割产物,并且可以用产物与受質的比例来计算百分比。例如,作为成功的hdr的结果,可以使用直接切割含有新整合的限制性序列的dna的测量员核酸酶。切割的受质越多,表明hdr百分比越高(hdr效率越高)。作为说明性实例,可以使用以下等式[(切割产物)/(受质加上切割产物)]计算hdr的分数(百分比)(例如,(b+c)/(a+b+c),其中“a”是dna受质的条带强度,“b”和“c”是切割产物。[0189]在某些情况下,效率可以用nhej成功率来表示。例如,t7核酸内切酶i测定法可用于产生切割产物,产物与受質的比例可用于计算nhej的百分比。t7核酸内切酶可切割由野生型和突变型dna链杂交引起的错配异源双链dna(nhej在原始断裂位点产生小的随机插入或缺失(插入缺失,indels))。切割程度越高,表示nhej的百分比越高(nhej的效率越高)。作为说明性示例,可以使用以下等式计算nhej的分数(百分比):(1‑(1‑(b(c+c)/(a+b+c))1/2)×100,其中“a”是dna受質的条带强度,“b”和“c”是切割产物(ran等人,cell,2013年9月12日;154(6):1380‑9;ran等人,natprotoc.2013年11月;8(11):2281–2308)。[0190]nhej修复途径是最活跃的修复机制,它经常在dsb位点引起小的核苷酸插入或缺失(indels)。nhej介导的dsb修复的随机性具有重要的实际意义,因为表达cas9和grna或指导多核苷酸的细胞群会导致各种各样的突变。在大多数情况下,nhej在靶标dna中产生小的插入,导致氨基酸缺失、插入或移码突变,从而导致靶标基因的开放阅读框(orf)内的提前终止密码子。理想的最终结果是靶基因内的功能丧失突变。[0191]虽然nhej介导的dsb修复经常破坏基因的开放阅读框,但是同源引导修复(hdr)可用于产生特定的核苷酸变化,范围从单核苷酸变化到大插入,如添加荧光团或标签。[0192]为了利用hdr进行基因编辑,可以将含有所需序列的dna修复模板与grna和cas9或cas9切口酶一起传递到感兴趣的细胞类型中。修复模板可以包含期望的编辑以及紧接在靶标的上游和下游的其他同源序列(称为左和右同源臂)。每个同源臂的长度可以取决于引入的改变的大小,其中较大的插入需要更长的同源臂。修复模板可以是单链寡核苷酸、双链寡核苷酸或双链dna质粒。即使在表达cas9,grna和外源性修复模板的细胞中,hdr的效率通常也较低(<修饰等位基因的10%)。由于hdr发生在单元周期的s和g2阶段,因此可以通过同步单元来提高hdr的效率。nhej中涉及的化学或遗传抑制基因也可以增加hdr频率。[0193]在一些实施方案中,cas9是修饰的cas9。给定的grna靶向序列在整个基因组中可能存在部分同源的其他位点。这些位点称为脱靶位点,在设计grna时需要加以考虑。除了优化grna设计外,还可以通过修饰cas9来提高crispr特异性。cas9通过两个核酸酶结构域ruvc和hnh的组合活性产生双链断裂(dsb)。cas9切口酶是spcas9的d10a突变体,保留一个核酸酶结构域并产生dna切口而不是dsb。切口酶系统也可以与hdr介导的基因编辑结合起来进行特定的基因编辑。[0194]在某些情况下,cas9是cas9蛋白的变体。当与野生型cas9蛋白的氨基酸序列相比时,变体cas9多肽具有的氨基酸序列相差一个氨基酸(例如,具有缺失、插入、取代、融合)。在一些情况下,变体cas9多肽具有降低cas9多肽的核酸酶活性的氨基酸变化(例如,缺失、插入或取代)。例如,在某些情况下,变体cas9多肽具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的核酸酶。相应的野生型cas9蛋白的活性。在某些情况下,变体cas9蛋白没有实质的核酸酶活性。当主题cas9蛋白是没有实质核酸酶活性的变体cas9蛋白时,其可以被称为“dcas9”。[0195]在一些情况下,变体cas9蛋白具有降低的核酸酶活性。例如,变体cas9蛋白展现出核酸内切酶活性的小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%。野生型cas9蛋白,例如野生型cas9蛋白。[0196]在一些情况下,变体cas9蛋白可以切割引导靶序列的互补链,但是具有降低的切割双链指导靶序列的非互补链的能力。例如,变体cas9蛋白可具有降低ruvc结构域功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体cas9蛋白具有d10a(在氨基酸位置10处为谷氨酸的天冬氨酸),因此可以切割双链导向靶序列的互补链,但切割双链导向靶序列的非互补链的能力降低(因此,当变体cas9蛋白切割双链靶核酸时,导致单链断裂(ssb)而不是双链断裂(dsb))(例如,参见jinek等人,science.2012aug.17;337(6096):816‑21)。[0197]在一些情况下,变体cas9蛋白可以切割双链指导靶序列的非互补链,但是具有降低的切割指导靶序列的互补链的能力。例如,变体cas9蛋白可具有降低hnh结构域(ruvc/hnh/ruvc结构域基序)的功能的突变(氨基酸取代)。作为非限制性实例,在一些实施方案中,变体cas9蛋白具有h840a(在氨基酸位置840处的组氨酸至丙氨酸)突变,并因此可以切割指导靶序列的非互补链,但是具有降低的切割靶序列的能力。指导目标序列的互补链(因此,当变体cas9蛋白切割双链指导目标序列时,将产生ssb而不是dsb)。这样的cas9蛋白切割指导靶序列(例如单链指导靶序列)的能力降低,但是保留结合指导靶序列(例如单链指导靶序列)的能力。[0198]在一些情况下,变体cas9蛋白切割双链靶dna的互补链和非互补链的能力降低。作为非限制性实例,在一些情况下,变体cas9蛋白既具有d10a突变又具有h840a突变,使得所述多肽具有降低的切割双链靶dna的互补链和非互补链的能力。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留结合靶dna(例如单链靶dna)的能力。[0199]作为另一个非限制性实例,在一些情况下,变体cas9蛋白具有w476a和w1126a突变,使得多肽具有降低的切割靶dna的能力。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。[0200]作为另一个非限制性实例,在一些情况下,变体cas9蛋白具有p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得所述多肽具有降低的切割靶dna的能力。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。[0201]作为另一个非限制性实例,在一些情况下,变体cas9蛋白具有h840a、w476a和w1126a突变,使得多肽具有降低的切割靶dna的能力。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。作为另一个非限制性实例,在某些情况下,变体cas9蛋白带有h840a、d10a、w476a和w1126a突变,使得所述多肽切割靶dna的能力降低。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。在一些实施方案中,变体cas9已经在cas9hnh结构域(a840h)中的位置840处恢复了催化的his残基。[0202]作为另一个非限制性实例,在一些情况下,变体cas9蛋白带有h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得所述多肽切割靶dna的能力降低。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。作为另一个非限制性实例,在一些情况下,变体cas9蛋白具有d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1127a突变,使得所述多肽具有降低的切割靶dna的能力。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。在某些情况下,当变异的cas9蛋白带有w476a和w1126a突变,或者变异的cas9蛋白带有p475a、w476a、n477a、d1125a、w1126a和d1127a突变时,变异的cas9蛋白不能有效地与pam序列结合。因此,在一些这样的情况下,当在结合方法中使用这种变体cas9蛋白时,所述方法不需要pam序列。换句话说,在某些情况下,当将这种cas9变异蛋白用于结合方法时,所述方法可包含指导rna,但所述方法可在不存在pam序列的情况下进行(因此,结合的特异性由指导rna的靶向片段提供)。可以使其他残基突变以获得上述效果(即,使一个或另一个核酸酶部分失活)。作为非限制性实例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987可以被改变(即被取代)。同样,除丙氨酸取代以外的突变也是合适的。[0203]在一些实施方案中,具有降低的催化活性的变体cas9蛋白(例如,当cas9蛋白具有d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987突变,例如d10a、g12a、g17a、e762a、h840a、n854a、n863a、h982a、h983a、a984a和/或d986a),则cas9变体蛋白仍可以位点特异性方式与靶dna结合(因为只要cas9变体蛋白保留与指导rna相互作用的能力,其仍然可以被指导rna引导至目标dna序列。[0204]化脓性链球菌cas9的替代品可以包括cpf1家族的rna指导的内切核酸酶,在哺乳动物细胞中显示出切割活性。来自普氏杆菌(prevotella)和弗朗西斯菌1(francisella1)的crispr(crispr/cpf1)是一种类似于crispr/cas9系统的dna编辑技术。cpf1是ii类crispr/cas系统的rna指导的核酸内切酶。在普氏杆菌和弗朗西斯菌中发现了这种获得性免疫机制。cpf1基因与crispr基因座相关联,编码一种内切核酸酶,所述核酸内切酶使用指导rna来发现和切割病毒dna。cpf1是一种比cas9小且简单的核酸内切酶,克服了crispr/cas9系统的某些局限性。与cas9核酸酶不同,cpf1介导的dna切割的结果是带有短3'突出端的双链断裂。cpf1的交错切割模式可以打开方向性基因转移的可能性,类似于传统的限制性内切酶克隆,可以提高基因编辑的效率。像上述的cas9变体和直向同源物一样,cpf1还可以将crispr靶向的at位富集区域或at基因组缺少spcas9支持的nggpam位点的位点数目扩展。cpf1基因座包含一个混合的α/β域、一后跟一个螺旋区域、一个ruvc‑ii和一个锌指状域的ruvc‑i。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域。此外,cpf1不具有hnh核酸内切酶结构域,并且cpf1的n端不具有cas9的α‑螺旋识别叶。cpf1crispr‑cas域结构显示cpf1在功能上是独特的,被归类为2类,v型crispr系统。cpf1基因座编码的cas1、cas2和cas4蛋白与i型和iii型相比更类似于ii型系统。功能性cpf1不需要反式激活crisprrna(tracrrna),因此只需要crispr(crrna)。这有利于基因组编辑,因为cpf1不仅比cas9小,而且具有更小的sgrna分子(约为cas9的一半)。与cas9靶向的富含g的pam相比,cpf1‑crrna复合物可通过识别与5'‑ytn‑3'相邻的原间隔子来切割目标dna或rna。鉴定出pam后,cpf1引入了一个4或5个核苷酸突出端的粘性末端样dna双链断裂。[0205]本申请内容的一些方面提供了融合蛋白,其包含充当核酸可编程dna结合蛋白的结构域,其可用于将蛋白质(例如碱基编辑器)引导至特定核酸(例如dna或rna)序列。在特定实施方案中,融合蛋白包含核酸可编程dna结合蛋白结构域和脱氨酶结构域。dna结合蛋白包括但不限于cas9(例如dcas9和ncas9)、cas12a/cpf1、cas12b/c2cl、cas12c/c2c3、cas12d/casy、cas12e/casx,cas12g、cas12h和cas12i。具有不同于cas9的pam特异性的可编程多核苷酸结合蛋白的一个例子是成簇的来自普氏杆菌和弗朗西斯菌1(cpf1)的规则间隔的短回文重复序列。与cas9相似,cpf1也是2类crispr效应子。已经显示cpf1介导具有不同于cas9的特征的强大的dna干扰。cpf1是一种缺少tracrrna的rna指导内切核酸酶,其利用一个富含t的邻近原间隔子的基序(ttn,tttn或ytn)。此外,cpf1通过交错的dna双链断裂切割dna。在16种cpf1家族蛋白中,来自酸性氨基球菌和毛螺菌的两种酶显示在人细胞中具有有效的基因组编辑活性。cpf1蛋白是本领域已知的,并且先前已经进行了描述,例如yamano等人,“crystalstructureofcpf1incomplexwithguidernaandtargetdna.”cell.(165)2016,p.949‑962;其全部内容通过引用结合于此。[0206]在本申请的组合物和方法中还有用的是无核酸酶的cpf1(dcpf1)变体,其可用作指导核苷酸序列可编程的多核苷酸结合蛋白结构域。cpf1蛋白具有类似于cas9的ruvc结构域的ruvc样核酸内切酶结构域,但不具有hnh核酸内切酶结构域,并且cpf1的n端不具有cas9的α‑螺旋识别叶。在zetsche等人,cell,163,759‑771,2015(通过引用并入本文)中显示,cpf1的ruvc‑样结构域负责切割dna链和ruvc‑样结构域的失活。使cpf1核酸酶活性失活。例如,novicidanovicidacpf1中对应于d917a、e1006a或d1255a的突变会失活cpf1核酸酶活性。在一些实施方案中,本申请的dcpf1包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a/d1255a或d917a/e1006a/d1255a的突变。应当理解,根据本申请,可以使用任何突变,例如使cpf1的ruvc结构域失活的取代突变、缺失或插入。[0207]在一些实施方案中,本文提供的任何融合蛋白的核酸可编程核苷酸结合蛋白可以是cpf1蛋白。在一些实施方案中,cpf1蛋白是cpf1切口酶(ncpf1)。在一些实施方案中,cpf1蛋白是核酸酶失活的cpf1(dcpf1)。在一些实施方案中,cpf1、ncpf1或dcpf1包含与本文公开的cpf1序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%,至少99%或至少99.5%同一性的氨基酸序列。在一些实施方案中,dcpf1包含与本文公开的cpf1序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%同一性的氨基酸序列,并且包含对应于d917a、e1006a、d1255a、d917a/e1006a、d917a/d1255a、e1006a的突变/d1255a或d917a/e1006a/d1255a。应当理解,根据本申请,也可以使用来自其他细菌物种的cpf1。[0208]野生型新弗朗西斯菌(francisellanovicida)cpf1的氨基酸序列如下。d917、e1006和d1255用粗体加底线。[0209][0210]以下为新弗朗西斯菌cpf1d917a的氨基酸序列。(a917、e1006和d1255用粗体和底线标出)。[0211][0212][0213]以下为新弗朗西斯菌cpf1e1006a的氨基酸序列(d917,a1006和d1255用粗体和底线标出)。[0214][0215][0216]以下为弗朗西斯菌cpf1d1255a的氨基酸序列(d917、e1006和a1255突变位置以粗体显示并带有底线)。[0217][0218]新弗朗西斯菌cpf1d917a/e1006a的氨基酸序列如下。(a917、a1006和d1255用粗体和底线标出)。[0219][0220][0221]以下为新弗朗西斯菌cpf1d917a/d1255a的氨基酸序列。(a917、e1006和a1255用粗体和底线标出)。[0222][0223][0224]新弗朗西斯菌cpf1e1006a/d1255a的氨基酸序列如下(d917、a1006和a1255用粗体和底线标出)。[0225][0226]以下为新弗朗西斯菌cpf1d917a/e1006a/d1255a的氨基酸序列。(a917、a1006和a1255用粗体和底线标出)。[0227][0228][0229]在一些实施方案中,融合蛋白中存在的cas9结构域之一可以被对pam序列没有要求的指导核苷酸序列可编程dna结合蛋白结构域替代。[0230]在一些实施方案中,核酸可编程dna结合蛋白(napdnabp)是微生物crispr‑cas系统的单个效应子。微生物crispr‑cas系统的单个效应子包括但不限于cas9、cpf1、cas12b/c2c1和cas12c/c2c3。通常,微生物crispr‑cas系统分为1类和2类系统。1类系统具有多亚基效应子复合物,而2类系统具有单个蛋白质效应子。例如,cas9和cpf1是2类效应器。除cas9和cpf1外,shmakov等人,“discoveryandfunctionalcharacterizationofdiverseclass2crisprcassystems”,mol.cell,2015年11月5日;60(3):385‑397还描述了三个不同的2类crispr‑cas系统(cas12b/c2c1和cas12c/c2c3),其全部内容通过引用合并于此。两个系统的效应子cas12b/c2c1和cas12c/c2c3包含与cpf1相关的ruvc样核酸内切酶结构域。第三系统包含具有两个谓词hepnrnase结构域的效应子。与cas12b/c2c1产生的crisprrna不同,成熟的crisprrna的产生不依赖tracrrna。cas12b/c2c1取决于crisprrna和tracrrna的dna切割。[0231]已经报导了酸环脂双歧杆菌cas12b/c2c1(aacc2c1)的晶体结构与嵌合单分子指导rna(sgrna)复合。例如,参见liu等人,“c2c1‑sgrnacomplexstructurerevealsrna‑guideddnacleavagemechanism”,mol.cell,2017年1月19日;65(2):310‑322,其全部内容通过引用合并于此。还已经报导了酸热脂环酸杆菌c2c1以三元复合物结合到靶dna上的晶体结构。例如,参见yang等人,“pam‑dependenttargetdnarecognitionandcleavagebyc2c1crispr‑casendonuclease”,cell,2016年12月15日;167(7):1814‑1828,其全部内容通过引用结合于此。具有目标和非目标dna链的aacc2c1具有催化能力的构象已被独立捕获,放置在单个ruvc催化口袋中,cas12b/c2c1介导的切割导致目标dna错开七个核苷酸。cas12b/c2c1三元复合物与先前鉴定的cas9和cpf1对应物之间的结构比较证明了crispr‑cas9系统使用的机制的多样性。[0232]在一些实施方案中,本文提供的任何融合蛋白的核酸可编程dna结合蛋白(napdnabp)可以是cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp是cas12b/c2c1蛋白。在一些实施方案中,napdnabp是cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含与天然存在的cas12b/c2c1或cas12c/c2c3蛋白至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。在一些实施方案中,napdnabp是天然存在的cas12b/c2c1或cas12c/c2c3蛋白。在一些实施方案中,napdnabp包含与本文提供的任何napdnabp序列至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的氨基酸序列相同。应当理解,根据本申请,也可以使用来自其他细菌物种的cas12b/c2c1或cas12c/c2c3。[0233]一个cas12b/c2c1((uniprot.org/uniprot/t0d7a2#2)[0234]sp|t0d7a2|c2c1_aliagcrispr相关的核酸内切酶c2c1os=嗜酸脂环酸杆菌(菌株atcc49025/dsm3922/cip106132/ncimb13137/gd3b)gn=c2c1pe=1sv=1)氨基酸序列如下:[0235]mavksikvklrlddmpeiraglwklhkevnagvryytewlsllrqenlyrrspngdgeqecdktaeeckaellerlrarqvenghrgpagsddellqlarqlyellvpqaigakgdaqqiarkflspladkdavgglgiakagnkprwvrmreagepgweeekekaetrksadrtadvlraladfglkplmrvytdsemssvewkplrkgqavrtwdrdmfqqaiermmsweswnqrvgqeyaklveqknrfeqknfvgqehlvhlvnqlqqdmkeaspgleskeqtahyvtgralrgsdkvfekwgklapdapfdlydaeiknvqrrntrrfgshdlfaklaepeyqalwredasfltryavynsilrklnhakmfatftlpdatahpiwtrfdklggnlhqytflfnefgerrhairfhkllkvengvarevddvtvpismseqldnllprdpnepialyfrdygaeqhftgefggakiqcrrdqlahmhrrrgardvylnvsvrvqsqseargerrppyaavfrlvgdnhrafvhfdklsdylaehpddgklgsegllsglrvmsvdlglrtsasisvfrvarkdelkpnskgrvpfffpikgndnlvavhersqllklpgeteskdlraireerqrtlrqlrtqlaylrllvrcgsedvgrrerswaklieqpvdaanhmtpdwreafenelqklkslhgicsdkewmdavyesvrrvwrhmgkqvrdwrkdvrsgerpkirgyakdvvggnsieqieylerqykflkswsffgkvsgqviraekgsrfaitlrehidhakedrlkkladriimealgyvyaldergkgkwvakyppcqlilleelseyqfnndrppsennqlmqwshrgvfqelinqaqvhdllvgtmyaafssrfdartgapgircrrvparctqehnpepfpwwlnkfvvehtldacplraddliptgegeifvspfsaeegdfhqihadlnaaqnlqqrlwsdfdisqirlrcdwgevdgelvliprltgkrtadsysnkvfytntgvtyyerergkkrrkvfaqeklseeeaellveadeareksvvlmrdpsgiinrgnwtrqkefwsmvnqriegylvkqirsrvplqdsacentgdi[0236]bhcas12b(组氨酸芽孢杆菌)ncbi参考序列:wp_095142515[0237]mapkkkrkvgihgvpaaatrsfilkiepneevkkglwkthevlnhgiayymnilklirqeaiyehheqdpknpkkvskaeiqaelwdfvlkmqkcnsfthevdkdevfnilrelyeelvpssvekkgeanqlsnkflyplvdpnsqsgkgtassgrkprwynlkiagdpsweeekkkweedkkkdplakilgklaeygliplfipytdsnepivkeikwmeksrnqsvrrldkdmfiqalerflsweswnlkvkeeyekvekeyktleerikediqalkaleqyekerqeqllrdtlntneyrlskrglrgwreiiqkwlkmdenepsekylevfkdyqrkhpreagdysvyeflskkenhfiwrnhpeypylyatfceidkkkkdakqqatftladpinhplwvrfeersgsnlnkyrilteqlhteklkkkltvqldrliyptesggweekgkvdivllpsrqfynqifldieekgkhaftykdesikfplkgtlggarvqfdrdhlrryphkvesgnvgriyfnmtvnieptespvskslkihrddfpkvvnfkpkeltewikdskgkklksgiesleiglrvmsidlgqrqaaaasifevvdqkpdiegklffpikgtelyavhrasfniklpgetlvksrevlrkarednlklmnqklnflrnvlhfqqfediterekrvtkwisrqensdvplvyqdeliqirelmykpykdwvaflkqlhkrleveigkevkhwrkslsdgrkglygislknideidrtrkfllrwslrptepgevrrlepgqrfaidqlnhlnalkedrlkkmantiimhalgycydvrkkkwqaknpacqiilfedlsnynpyeersrfensklmkwsrreiprqvalqgeiyglqvgevgaqfssrfhaktgspgircsvvtkeklqdnrffknlqregrltldkiavlkegdlypdkggekfislskdrkcvtthadinaaqnlqkrfwtrthgfykvyckayqvdgqtvyipeskdqkqkiieefgegyfilkdgvyewvnagklkikkgsskqssselvdsdilkdsfdlaselkgeklmlyrdpsgnvfpsdkwmaagvffgkleriliskltnqysistieddsskqsmkrpaatkkagqakkkk[0238]在一些实施方案中,cas12b是bvcas12b,其是bhcas12b的变体,并且相对于bhcas12b包含以下变化:s893r,k846r和e837g。bvcas12b(芽孢杆菌v3‑13)ncbi参考序列:wp_101661451.1[0239]mairsiklkmktnsgtdsiylrkalwrthqlinegiayymnlltlyrqeaigdktkeayqaeliniirnqqrnngsseehgsdqeilallrqlyeliipssigesgdanqlgnkflyplvdpnsqsgkgtsnagrkprwkrlkeegnpdwelekkkdeerkakdptvkifdnlnkygllplfplftniqkdiewlplgkrqsvrkwdkdmfiqaierllsweswnrrvadeykqlkektesyykehltggeewiekirkfekernmeleknafapndgyfitsrqirgwdrvyekwsklpesaspeelwkvvaeqqnkmsegfgdpkvfsflanrenrdiwrghseriyhiaaynglqkklsrtkeqatftlpdaiehplwiryespggtnlnlfkleekqkknyyvtlskiiwpseekwiekenieiplapsiqfnrqiklkqhvkgkqeisfsdyssrisldgvlggsriqfnrkyiknhkellgegdigpvffnlvvdvaplqetrngrlqspigkalkvissdfskvidykpkelmdwmntgsasnsfgvasllegmrvmsidmgqrtsasvsifevvkelpkdqeqklfysindtelfaihkrsfllnlpgevvtknnkqqrqerrkkrqfvrsqirmlanvlrletkktpderkkaihklmeivqsydswtasqkevwekelnlltnmaafndeiwkeslvelhhriepyvgqivskwrkglsegrknlagismwnideledtrrlliswskrsrtpgeanrietdepfgssllqhiqnvkddrlkqmanliimtalgfkydkeekdrykrwketypacqiilfenlnrylfnldrsrrensrlmkwahrsiprtvsmqgemfglqvgdvrseyssrfhaktgapgirchalteedlkagsntlkrliedgfineselaylkkgdiipsqggelfvtlskrykkdsdnneltvihadinaaqnlqkrfwqqnsevyrvpcqlarmgedklyipksqtetikkyfgkgsfvknnteqevykweksekmkiktdttfdlqdldgfedisktielaqeqqkkyltmfrdpsgyffnnetwrpqkeywsivnniiksclkkkilsnkvel。[0240]在一些实施方案中,cas9结构域是来自金黄色葡萄球菌(sacas9)的cas9结构域。在一些实施方案中,sacas9结构域是核酸酶活性sacas9、核酸酶非活性sacas9(sacas9d)或sacas9切口酶(sacas9n)。在一些实施方案中,sacas9结构域在本文提供的任何氨基酸序列中包含n579a突变或相应的突变。[0241]在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合具有非典型pam的核酸序列。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合具有nngrrt或nnnrrtpam序列的核酸序列。在一些实施方案中,sacas9结构域在本文提供的任何氨基酸序列中包含e781x、n967x和r1014x突变或相应突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,sacas9结构域包含本文提供的任何氨基酸序列中的一个或多个e781k、n967k和r1014h突变,或一个或多个相应突变。在一些实施方案中,sacas9结构域在本文提供的任何氨基酸序列中包含e781k、n967k或r1014h突变或相应的突变。[0242]在一些实施方案中,变体cas蛋白可以是spcas9、spcas9‑vrqr、spcas9‑vrer、xcas9(sp)、sacas9、sacas9‑kkh、spcas9‑mqkser、spcas9‑lrkiqk或spcas9‑lrvsql。[0243]示例性的sacas9的氨基酸序列如下:[0244][0245]在所述序列中,带底线和粗体的残基n579可经突变(例如,突变为a579)以产生sacas9切口酶。[0246]示例性的sacas9n的氨基酸序列如下:[0247][0248][0249]在所述序列中,带底线和粗体的残基n579可经突变(例如,突变为a579)以产生sacas9切口酶。[0250]示例性的sakkhcas9的氨基酸序列如下:[0251][0252]上面的残基a579用底线和粗体标出,其可以从n579突变以产生sacas9切口酶。可以从e781、n967和r1014突变以产生sakkhcas9的上述残基k781、k967和h1014用底线和斜体标出。[0253]碱基编辑器的多核苷酸可编程核苷酸结合结构域本身可以包含一个或多个结构域。例如,多核苷酸可编程核苷酸结合结构域可包含一个或多个核酸酶结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可包含核酸内切酶或核酸外切酶。在本文中,术语“核酸外切酶”是指能够从自由端消化核酸(例如,rna或dna)的蛋白质或多肽,并且术语“核酸内切酶”是指能够催化(例如,切割)内部区域的蛋白质或多肽。在核酸(例如dna或rna)中。在一些实施方案中,核酸内切酶可以切割双链核酸的单链。在一些实施方案中,核酸内切酶可以切割双链核酸分子的两条链。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是脱氧核糖核酸酶。在一些实施方案中,多核苷酸可编程核苷酸结合结构域可以是核糖核酸酶。[0254]在一些实施方案中,多核苷酸可编程核苷酸结合结构域的核酸酶结构域可以切割靶多核苷酸的零、一或两条链。在一些情况下,多核苷酸可编程核苷酸结合结构域可包含切口酶结构域。本文中,术语“切口酶”是指包含核酸酶结构域的多核苷酸可编程核苷酸结合结构域,所述核酸酶结构域仅能够切割双链核酸分子(例如dna)中两条链中的一条链。在一些实施方案中,可通过将一个或多个突变引入活性多核苷酸可编程核苷酸结合域中来从多核苷酸可编程核苷酸结合域的完全催化活性(例如天然)形式衍生切口酶。例如,在多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶结构域的情况下,源自cas9的切口酶结构域可以在位置840处包含d10a突变和组氨酸。在这种情况下,残基h840保留催化活性并因此可以切割核酸双链体的单链。在另一个实例中,cas9衍生的切口酶结构域可包含h840a突变,而位置10的氨基酸残基仍为d。在一些实施方案中,切口酶可源自多核苷酸的完全催化活性(例如天然)形式。通过去除切口酶活性不需要的全部或部分核酸酶结构域来实现可程序设计的核苷酸结合结构域。例如,在多核苷酸可编程核苷酸结合结构域包含衍生自cas9的切口酶结构域的情况下,源自cas9的切口酶结构域可以包含ruvc结构域或hnh结构域的全部或部分的缺失。[0255]包含多核苷酸可编程核苷酸结合结构域的碱基编辑器包含核苷酸酶结构域,所述碱基编辑器能够在特定的多核苷酸靶序列(例如,由结合的指导核酸的互补序列确定)上产生单链dna断裂(切口))。在一些实施方案中,被包含切口酶结构域(例如,cas9衍生的切口酶结构域)的碱基编辑器切割的核酸双链体靶多核苷酸序列的链是未被碱基编辑器编辑的链(即,由碱基编辑器切割的片段与包含要编辑的碱基的链相反)。在其他实施方案中,包含切口酶结构域(例如,cas9衍生的切口酶结构域)的碱基编辑器可以切割靶向于编辑的dna分子的链。在这种情况下,非靶向链不会被切割。[0256]本文还提供了包含多核苷酸可编程核苷酸结合结构域的碱基编辑器,所述多核苷酸可编程核苷酸结合结构域被催化性死亡(即,不能裂解靶多核苷酸序列)。在本文中,术语“催化死亡”和“核酸酶死亡”可互换使用,是指具有一个或多个导致其不能切割核酸链的突变和/或缺失的多核苷酸可编程核苷酸结合结构域。在一些实施方案中,由于一个或多个核酸酶结构域中的特定点突变,催化死亡的多核苷酸可编程核苷酸结合结构域碱基编辑器可缺乏核酸酶活性。例如,在碱基编辑器包含cas9结构域的情况下,cas9可同时包含d10a突变和h840a突变。这样的突变使两个核酸酶结构域失活,从而导致核酸酶活性的丧失。在其他实施方案中,催化死亡的多核苷酸可编程核苷酸结合结构域可包含催化结构域(例如ruvc1和/或hnh结构域)的全部或一部分的一个或多个缺失。在进一步的实施方案中,催化性死亡的多核苷酸可编程核苷酸结合结构域包含点突变(例如d10a或h840a)以及核酸酶结构域的全部或部分缺失。[0257]本文还考虑能够从多核苷酸可编程核苷酸结合结构域的先前功能形式产生催化死亡的多核苷酸可编程核苷酸结合结构域的突变。例如,在催化死亡的cas9(“dcas9”)的情况下,提供了具有d10a和h840a以外的突变的变体,其导致核酸酶失活的cas9。举例来说,此类突变包括在d10和h840处的其他氨基酸取代,或在cas9的核酸酶结构域内的其他取代(例如,在hnh核酸酶子结构域和/或ruvc1子结构域中的取代)。[0258]基于本申请和本领域的知识,其他合适的核酸酶失活的dcas9结构域对本领域技术人员而言是显而易见的,并且在本申请的范围内。这样的另外的示例性的适合的核酸酶失活的cas9结构域包括但不限于d10a/h840a,d10a/d839a/h840a和d10a/d839a/h840a/n863a突变域(参见,例如,prashant等人,cas9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.,naturebiotechnology.,2013;31(9):833‑838,其全部内容通过引用并入本文)。在一些实施方案中,dcas9结构域包含的氨基酸序列具有与本文提供的任何dcas9结构域至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。在一些实施方案中,cas9结构域与本文列出的任何氨基酸序列相比,包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个或更多突变。在一些实施方案中,cas9结构域与本文列出的任何氨基酸序列相比,包含具有至少10、至少15、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少500、至少600、至少700、至少800、至少900、至少1000、至少1100或至少1200个相同的连续氨基酸残基。[0259]可掺入碱基编辑器中的多核苷酸可编程核苷酸结合结构域的非限制性实例包括crispr蛋白衍生的结构域、限制性核酸酶、大范围核酸酶、tal核酸酶(talen)和锌指核酸酶(zfn)。在一些情况下,碱基编辑器包含多核苷酸可编程核苷酸结合结构域,其包含天然或修饰的蛋白质或其部分,其通过结合的指导核酸能够在crispr过程中结合核酸序列(即,成簇的规则间隔的短回文重复序列)介导的核酸修饰。这种蛋白质在本文中被称为“crispr蛋白质”。因此,本文公开的是包含多核苷酸可编程核苷酸结合结构域的碱基编辑器,所述多核苷酸可编程核苷酸结合结构域包含crispr蛋白的全部或部分(即,包含crispr蛋白的全部或部分作为域的碱基编辑器,也称为碱基编辑器的“crispr蛋白衍生域”)。与野生型或天然版本的crispr蛋白质相比,掺入碱基编辑器中的crispr蛋白质的域可以进行修饰。例如,如下所述,相对于野生型或天然形式的crispr蛋白,源自crispr蛋白的结构域可包含一个或多个突变、插入、缺失、重排和/或重组。[0260]在一些实施方案中,掺入碱基编辑器中的源自crispr蛋白的域是当与结合的指导核酸结合时能够结合靶多核苷酸的核酸内切酶(例如,脱氧核糖核酸酶或核糖核酸酶)。在一些实施方案中,掺入碱基编辑器中的源自crispr蛋白质的域是当与结合的指导核酸结合时能够结合靶多核苷酸的切口酶。在一些实施方案中,掺入碱基编辑器中的源自crispr蛋白的域是与结合的指导核酸结合时能够结合靶多核苷酸的催化性死亡域。在一些实施方案中,与碱基编辑器的crispr蛋白衍生的域结合的靶多核苷酸是dna。在一些实施方案中,与碱基编辑器的crispr蛋白来源的结构域结合的靶多核苷酸是rna。[0261]在一些实施方案中,碱基编辑器的crispr蛋白来源的结构域可包括来自溃疡棒状杆菌(corynebacteriumulcerans)(ncbirefs:nc_015683.1,nc_017317.1);白喉棒状杆菌(corynebacteriumdiphtheria)(ncbiref:nc_016782.1,nc_016786.1);栖蚜蝇螺原体(spiroplasmasyrphidicola)(ncbiref:nc_021284.1);中间型普氏杆菌(prevotellaintermedia)(ncbiref:nc_017861.1);中国台湾螺旋体(spiroplasmataiwanense)(ncbiref:nc_021846.1);海豚链球菌(streptococcusiniae)(ncbiref:nc_021314.1);波罗的海贝尔氏菌(belliellabaltica)(ncbiref:nc_018010.1);扭曲冷弯曲菌(psychroflexustorquis)(ncbiref:nc_018721.1);嗜热链球菌(streptococcusthermophilus)(ncbiref:yp_820832.1);无害李斯特菌(listeriainnocua)(ncbiref:np_472073.1);空肠弯曲菌(campylobacterjejuni)(ncbiref:yp_002344900.1);脑膜炎双球菌(neisseriameningitidis)(ncbiref:yp_002342100.1),化脓性链球菌(streptococcuspyogenes)或金黄色葡萄球菌的cas9的全部或部分。[0262]在一些实施方案中,碱基编辑器的cas9衍生结构域是来自金黄色葡萄球菌(sacas9)的cas9结构域。在一些实施方案中,sacas9结构域是核酸酶活性sacas9、核酸酶非活性sacas9(sacas9d)或sacas9切口酶(sacas9n)。在一些实施方案中,sacas9结构域包含n579x突变。在一些实施方案中,sacas9结构域包含n579a突变。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合具有非典型pam的核酸序列。在一些实施方案中,sacas9结构域、sacas9d结构域或sacas9n结构域可以结合具有nngrrtpam序列的核酸序列。在一些实施方案中,sacas9结构域包含e781x、n967x和r1014x突变中的一个或多个。[0263]碱基编辑器可以包括从高保真度cas9的cas9的全部或部分衍生的域。在一些实施方案中,碱基编辑器的高保真cas9结构域是工程化的cas9结构域,其包含相对于相应的野生型cas9结构域降低cas9结构域和dna的糖‑磷酸主链之间的静电相互作用的一个或多个突变。与dna的糖‑磷酸主链的静电相互作用降低的高保真cas9结构域可具有较少的脱靶效应。在一些实施方案中,cas9结构域(例如,野生型cas9结构域)包含一种或多种降低cas9结构域与dna的糖‑磷酸主链之间的缔合的突变。在一些实施方案中,cas9结构域包含一种或多种突变,其使cas9结构域与dna的糖‑磷酸主链之间的缔合降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%至少55%、至少60%、至少65%、至少70%或更高。[0264]在一些实施方案中,修饰的cas9是高保真cas9酶。在一些实施方案中,高保真cas9酶是spcas9(k855a)、espcas9(1.1)、spcas9‑hf1或超精确cas9变体(hypacas9)。修饰后的cas9espcas9(1.1)包含丙氨酸取代,可削弱hnh/ruvc凹槽与非目标dna链之间的相互作用,从而防止链分离和在脱靶位点切割。类似地,spcas9‑hf1通过丙氨酸取代降低了脱靶编辑,丙氨酸取代破坏了cas9与dna磷酸骨架之间的相互作用。hypacas9在rec3域中包含突变(spcas9n692a/m694a/q695a/h698a),可增加cas9校对和目标识别力。与野生型cas9相比,所有三种高保真酶产生的脱靶编辑均更少。下面提供示例性的高保真cas9。98:4658‑4663(2001);“crisprrnamaturationbytrans‑encodedsmallrnaandhostfactorrnaseiii.”deltchevae.等人,nature471:602‑607(2011);以及jinekm.等人“programmabledual‑rna‑guideddnaendonucleaseinadaptivebacterialimmunity.”,science337:816‑821(2012),其每一个的全部内容通过引用并入本文。已经在各种物种中描述了cas9直向同源物,包括但不限于化脓性链球菌和嗜热链球菌。基于所述公开,其他合适的cas9核酸酶和序列对于本领域技术人员而言是显而易见的,并且此类cas9核酸酶和序列包括来自chylinski、rhun及charpentier,“thetracrrnaandcas9familiesoftypeiicrispr‑casimmunitysystems”(2013)rnabiology10:5,726‑737;其全部内容通过引用并入本文。在一些实施方案中,cas9核酸酶具有失活的(例如,失活的)dna切割结构域,即,cas9是切口酶。[0269]在一些实施方案中,指导多核苷酸是至少一个单链指导rna(“sgrna”或“gnra”)。在一些实施方案中,指导多核苷酸是至少一种tracrrna。在一些实施方案中,指导多核苷酸不需要pam序列来将多核苷酸可编程dna结合结构域(例如,cas9或cpf1)引导至靶核苷酸序列。[0270]本文公开的碱基编辑器的多核苷酸可编程核苷酸结合结构域(例如,crispr衍生的结构域)可以通过与指导多核苷酸结合而识别靶多核苷酸序列。指导多核苷酸(例如,grna)通常是单链的,并且可以被编程为与多核苷酸的靶序列位点特异性结合(即,通过互补碱基配对),从而指导与指导结合的碱基编辑器靶序列的核酸。指导多核苷酸可以是dna。指导多核苷酸可以是rna。在某些情况下,指导多核苷酸包含天然核苷酸(例如,腺苷)。在一些情况下,指导多核苷酸包含非天然(或非天然)核苷酸(例如,肽核酸或核苷酸类似物)。在一些情况下,指导核酸序列的靶向区域可以是至少15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸在长度上。指导核酸的靶向区域的长度可以在10至30个核苷酸之间,或在15至25个核苷酸之间,或在15至20个核苷酸之间。[0271]在一些实施方案中,指导多核苷酸包含两个或更多个单独的多核苷酸,其可以通过例如互补碱基配对(例如双链指导多核苷酸)彼此相互作用。例如,指导多核苷酸可以包含crisprrna(crrna)和反式激活crisprrna(tracrrna)。例如,指导多核苷酸可以包含一种或多种反式激活crisprrna(tracrrna)。[0272]在ii型crispr系统中,通过crispr蛋白(例如cas9)靶向核酸通常需要在包含识别靶序列的序列的第一rna分子(crrna)和第二rna分子(trrna)之间进行互补碱基配对,所述序列识别靶序列和包含重复序列的第二个rna分子(trrna),所述重复序列形成稳定指导rna‑crispr蛋白复合物的支架区域。这样的双链指导rna系统可以用作指导多核苷酸,以将本文公开的碱基编辑器引导至靶多核苷酸序列。[0273]在一些实施方案中,本文提供的碱基编辑器利用单链指导多核苷酸(例如,grna)。在一些实施方案中,本文提供的碱基编辑器利用双链指导多核苷酸(例如双链grna)。在一些实施方案中,本文提供的碱基编辑器利用一种或多种指导多核苷酸(例如,多种grna)。在一些实施方案中,单链指导多核苷酸用于本文所述的不同碱基编辑器。例如,单链指导多核苷酸可用于胞苷碱基编辑器和腺苷碱基编辑器。[0274]在其他实施方案中,指导多核苷酸可以在单个分子(即,单分子指导核酸)中既包含核酸的多核苷酸靶向部分又包含核酸的支架部分。例如,单分子指导多核苷酸可以是单链指导rna(sgrna或grna)。在本文中,术语“指导多核苷酸序列”涵盖能够与靶标多核苷酸序列相互作用并将其引导至靶标多核苷酸序列的任何单分子、双分子或多分子核酸。[0275]通常,指导多核苷酸(例如crrna/trrna复合物或grna)包含“多核苷酸靶向片段”和“蛋白质结合片段”,所述片段包含能够识别并结合靶多核苷酸序列的序列。在碱基编辑器的多核苷酸可编程核苷酸结合结构域组分内稳定指导多核苷酸。在一些实施方案中,指导多核苷酸的多核苷酸靶向区段识别并结合至dna多核苷酸,从而促进dna中碱基的编辑。在其他情况下,指导多核苷酸的多核苷酸靶向片段识别并结合至rna多核苷酸,从而促进rna中碱基的编辑。在本文中,“片段”是指分子的部分或区域,例如在指导多核苷酸中核苷酸的连续延伸;片段也可以指复合物的区域/部分,使得片段可以包含大于或等于1的区域。例如,在指导多核苷酸包含多个核酸分子的情况下,其蛋白质结合区段可以包括例如沿着互补性区域杂交的多个单独分子的全部或一部分。包含两个单独分子的靶向dna的rna的结合片段可包含(i)第一个rna分子的40至75个碱基对,长度为100个碱基对;和(ii)第二个rna分子的10至25个碱基对长度为50个碱基对。“段”的定义,除非在特定上下文中另外明确定义,不限于特定数量的总碱基对,也不限于来自以下任何特定数量的碱基对。对于给定的rna分子,不限于复合物中特定数量的单独分子,并且可以包括具有任何总长度的rna分子区域,并且可以包括与其他分子互补的区域。[0276]指导rna或指导多核苷酸可包含两个或更多个rna,例如,crisprrna(crrna)和反式激活crrna(tracrrna)。指导rna或指导多核苷酸有时可以包含单链rna,或通过crrna和tracrrna的一部分(例如功能部分)融合形成的单链指导rna(sgrna)。指导rna或指导多核苷酸也可以是包含crrna和tracrrna的双链rna。此外,crrna可以与靶dna杂交。[0277]如上所述,指导rna或指导多核苷酸可以是表达产物。例如,编码指导rna的dna可以是包含编码指导rna的序列的载体。可以通过用分离的指导rna或包含编码指导rna和启动子的序列的质粒dna转染细胞来将指导rna或指导多核苷酸转移到细胞中。指导rna或指导多核苷酸也可以以其他方式转移到细胞中,例如使用病毒介导的基因递送。[0278]可以分离出指导rna或指导多核苷酸。例如,指导rna可以以分离的rna的形式转染到细胞或生物体中。可以使用本领域已知的任何体外转录系统通过体外转录制备指导rna。指导rna可以以分离的rna的形式而不是包含指导rna的编码序列的质粒的形式转移至细胞。[0279]指导rna或指导多核苷酸可包含三个区域:在5'端的第一区域,其可与染色体序列中的靶位点互补;第二内部区域,其可形成茎环结构;和可以是单链的第三个3'区域。每个指导rna的第一区域也可以是不同的,使得每个指导rna将融合蛋白引导至特定的靶位点。此外,每个指导rna的第二和第三区域在所有指导rna中可以相同。[0280]指导rna或指导多核苷酸的第一区域可以与染色体序列中靶位点的序列互补,使得指导rna的第一区域可以与靶位点碱基配对。在一些情况下,指导rna的第一区域可包含约10个核苷酸至25个核苷酸或约10个核苷酸至25个核苷酸(即,10个核苷酸至核苷酸;或约10个核苷酸至约25个核苷酸;或10个核苷酸至约25个核苷酸;或10个核苷酸至约25个核苷酸;或大约10个核苷酸至25个核苷酸)或更多。例如,在指导rna的第一区域和染色体序列中的靶位点之间的碱基配对区域可以是或可以是大约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25个或更多个核苷酸。有时,指导rna的第一区域的长度可以是或可以是大约19、20或21个核苷酸。[0281]指导rna或指导多核苷酸也可以包含形成二级结构的第二区域。例如,由指导rna形成的二级结构可包含茎(或发夹)和环。环和茎的长度可以变化。例如,环的长度可以在约3至10个核苷酸的范围内或约3至10个核苷酸,并且茎的长度可以在约6至20个碱基对的范围内或或约6至20个碱基对。茎可包含一个或多个1至10个或大约10个核苷酸的突出。第二区域的总长度的长度可以在约16至60个核苷酸的范围内或16至60个核苷酸。例如,环的长度可以是或可以是约4个核苷酸,茎的长度可以是或可以是约12个碱基对。[0282]指导rna或指导多核苷酸还可以在3'端包含基本上可以是单链的第三区域。例如,第三区域有时与目的细胞中的任何染色体序列都不互补,并且有时与其余的指导rna不互补。此外,第三区域的长度可以变化。第三区域的长度可以大于或大于约4个核苷酸。例如,第三区域的长度可以在约5至60个核苷酸的长度范围内。[0283]指导rna或指导多核苷酸可以靶向基因靶标的任何外显子或内含子。在某些情况下,指导可以靶向基因的第1外显子或第2外显子;指导可以靶向基因的外显子3或4。组合物可以包含全部靶向相同外显子的多个指导rna,或者在某些情况下,可以包含可以靶向不同外显子的多个指导rna。基因的外显子和内含子可以被靶向。[0284]指导rna或指导多核苷酸可以靶向约20个核苷酸或约20个核苷酸的核酸序列。靶核酸可以小于或小于约20个核苷酸。靶核酸的长度可以是至少或至少约5、10、15、16、17、18、19、20、21、22、23、24、25、30个核苷酸,或长度在1至100个核苷酸之间。靶核酸可以是至多或至多约5、10、15、16、17、18、19、20、21、22、23、24、25、30、40、50或1至100之间的任意值的核苷酸长度。靶核酸序列可以是或可以是pam第一个核苷酸5'的20个碱基。指导rna可以靶向核酸序列。靶核酸可以是至少或至少约1至10、1至20、1至30、1至40、1至50、1至60、1至70、1至80、1至90或1至100个核苷酸。[0285]指导多核苷酸,例如指导rna,可以指可以与另一种核酸杂交的核酸,例如细胞基因组中的靶核酸或原间隔子。指导多核苷酸可以是rna。指导多核苷酸可以是dna。指导多核苷酸可以被编程或设计成与位点特异性地结合核酸序列。指导多核苷酸可以包含多核苷酸链,并且可以被称为单链指导多核苷酸。指导多核苷酸可以包含两条多核苷酸链,并且可以被称为双链指导多核苷酸。指导rna可以作为rna分子引入细胞或胚胎中。例如,rna分子可以在体外转录和/或可以化学合成。可以从合成dna分子(例如基因片段)转录rna。然后可以将指导rna作为rna分子引入细胞或胚胎中。指导rna也可以以非rna核酸分子例如dna分子的形式引入细胞或胚胎。例如,可以将编码指导rna的dna可操作地连接至启动子控制序列,以在目标细胞或胚胎中表达指导rna。rna编码序列可以可操作地连接至被rna聚合酶iii(poliii)识别的启动子序列。可用于表达指导rna的质粒载体包括但不限于px330载体和px333载体。在某些情况下,质粒载体(例如px333载体)可包含至少两个编码指导rna的dna序列。[0286]选择、设计和验证指导多核苷酸的方法,例如指导rna和靶向序列在本文中描述并且是本领域技术人员已知的。例如,为了使脱碱基酶结构域(例如,aid结构域)中的脱氨酶结构域的潜在受質混杂的影响最小化,可以无意地靶向脱氨的残基数量(例如,脱靶的c残基可能可以最小化在靶核酸基因座内的ssdna上的残基)。另外,可以使用软件工具来优化对应于靶核酸序列的grna,例如以最小化整个基因组的脱靶活性。例如,对于使用化脓性链球菌cas9进行的每个可能的靶向结构域选择,可以在整个基因组中鉴定出所有脱靶序列(在选择的pam之前,例如nag或ngg),其中包含多达一定数量(例如1、2、3、4、5、6、7、8、9或10)个不匹配的碱基对的。可以鉴定出与靶位点互补的grna的第一区域,并且可以根据其总的预测脱靶得分对所有第一区域(例如crrna)进行排名;排名最高的定位域表示目标活动最多且目标最少的活动。可以通过使用本领域已知的和/或本文阐述的方法在功能上评估候选靶向grna。[0287]作为非限制性实例,可以使用dna序列搜索算法来鉴定与cas9一起使用的指导rna的crrna中的靶dna杂交序列。可以使用基于公共工具cas‑offer的定制grna设计软件来进行grna设计,如baes.,parkj.,和kimj.‑s中所述。cas‑offinder:一种快速且通用的算法,可搜索cas9rna引导的核酸内切酶的潜在脱靶位点,bioinformatics30,1473‑1475(2014)。所述软件会在计算指南全基因组偏离目标的倾向后对指南进行评分。通常,对于长度从17到24不等的指南,会考虑从完全匹配到7个不匹配的匹配。一旦非目标位点通过计算确定后,便会为每个指南计算出总得分,并使用网络版汇总为表格输出接口。除了识别与pam序列相邻的潜在靶位点外,所述软件还识别与所选靶位点相差1、2、3或3个以上核苷酸的所有pam相邻序列。靶核酸序列的基因组dna序列,例如可以获得靶基因,并可以使用公开可用的工具(例如repeatmasker程序)筛选重复组件。repeatmasker在输入的dna序列中搜索重复元素和低复杂度的区域。输出是给定查询序列中存在的重复的详细注释。[0288]在鉴定之后,指导rna的第一区域,例如,crrna可以根据它们与靶位点的距离,其正交性和与相关pam序列(例如,基于鉴定包含以下内容的人类基因组中的紧密匹配的5'g)的紧密匹配而存在的5'核苷酸进行分类:相关的pam,例如化脓性链球菌的nggpam,金黄色葡萄球菌的nngrrt或nngrrvpam)。如本文所用,正交性是指人类基因组中包含与靶序列的最小错配的最小数目的序列的数目。“高水平的正交性”或“良好的正交性”可以例如是指20聚体靶向结构域,其在人类基因组中除了预期的靶标之外没有相同的序列,也没有在靶标中包含一个或两个错配的任何序列。可以选择具有良好正交性的靶向结构域,以最大程度地减少脱靶dna的切割。[0289]在一些实施方案中,报导系统可用于检测碱基编辑活性并测试候选指导多核苷酸。在一些实施方案中,报导系统可以包括基于报导基因的测定,其中碱基编辑活性导致报导基因的表达。例如,报导系统可以包括报导基因,所述报导基因包含失活的起始密码子,例如模板链上从3'‑tac‑5'到3'‑cac‑5'的突变。靶c成功脱氨后,相应的mrna将被转录为5'‑aug‑3'而不是5'‑gug‑3',从而能够翻译报导基因。合适的报导基因对于本领域技术人员是显而易见的。报导基因的非限制性实例包括编码绿色荧光蛋白(gfp)、红色荧光蛋白(rfp)、萤光素酶、分泌性碱性磷酸酶(seap)的基因,或对本领域技术人员显而易见的表达的任何其他基因。报导系统可用于测试许多不同的grna,例如,以便确定相应脱氨酶将靶向靶dna序列的哪个残基。还可以测试靶向非模板链的sgrna,以评估特定碱基编辑蛋白(例如,cas9脱氨酶融合蛋白。在一些实施方案中,可以设计这样的grna,使得突变的起始密码子不会与grna碱基配对。指导多核苷酸可包含标准核糖核苷酸,修饰的核糖核苷酸(例如假尿苷),核糖核苷酸异构体和/或核糖核苷酸类似物。在一些实施方案中,指导多核苷酸可以包含至少一种可检测标记。可检测标记可以是荧光团(例如,fam、tmr、cy3、cy5、texasred、oregongreen、alexafluors、halo标签或合适的荧光染料)、检测标签(例如生物素,异羟基洋地黄毒苷等)、量子点或金粒子。[0290]所述指导多核苷酸可以化学合成、酶合成或其组合。例如,可以使用基于标准亚磷酰胺的固相合成方法合成指导rna。或者,可通过将编码指导rna的dna与噬菌体rna聚合酶识别的启动子控制序列可操作地连接,在体外合成指导rna。合适的噬菌体启动子序列的实例包括t7、t3、sp6启动子序列或其变体。在其中指导rna包含两个分开的分子(例如,crrna和tracrrna)的实施方案中,crrna可以被化学合成并且tracrrna可以被酶合成。[0291]在一些实施方案中,碱基编辑器系统可以包含多个指导多核苷酸,例如,grna。例如,grna可以靶向一个或多个靶基因座(例如,至少1grna、至少2grna、至少5grna、至少10grna、至少20grna、至少30grna、至少50grna)包含在碱基编辑器系统中。所述多个grna序列可以串联排列,并且优选被直接重复隔开。[0292]编码指导rna或指导多核苷酸的dna序列也可以是载体的一部分。此外,载体可包含其他表达控制序列(例如增强子序列、kozak序列、聚腺苷酸化序列、转录终止序列等)、选择性标记序列(例如gfp或抗生素抗性基因,例如嘌呤霉素)、复制起点等等。编码指导rna的dna分子也可以是线性的。编码指导rna或指导多核苷酸的dna分子也可以是环状的。[0293]在一些实施方案中,碱基编辑器系统的一个或多个组件可以由dna序列编码。可以将此类dna序列引入表达系统,例如cdna。一个单元、一起或分开。例如,可以将编码多核苷酸可编程核苷酸结合结构域和指导rna的dna序列引入细胞,每个dna序列可以是单独分子的一部分(例如,一个包含多核苷酸可编程核苷酸结合结构域编码序列的载体和另一个包含指导rna编码序列的载体或两者可以是同一分子的一部分(例如,一个包含多核苷酸可编程核苷酸结合域和指导rna的编码(和调节)序列的载体)。[0294]指导多核苷酸可以包含一个或多个修饰,以提供具有新的或增强的特征的核酸。指导多核苷酸可以包含核酸亲和标签。指导多核苷酸可以包含合成核苷酸、合成核苷酸类似物、核苷酸衍生物和/或修饰的核苷酸。[0295]在某些情况下,grna或指导多核苷酸可包含修饰。可以在grna或指导多核苷酸的任何位置进行修饰。可以对单链grna或指导多核苷酸进行一个以上的修饰。修饰后,grna或指导多核苷酸可以进行质量控制。在某些情况下,质量控制可以包括page、hplc、ms或其任意组合。[0296]grna或指导多核苷酸的修饰可以是取代、插入、缺失、化学修饰、物理修饰、稳定化、纯化或其任何组合。[0297]也可以通过5'腺苷酸、5'鸟苷三磷酸帽、5'n7‑甲基鸟苷三磷酸帽、5'三磷酸帽、3'磷酸酯、3'硫代磷酸酯、5'磷酸酯、5'硫代磷酸酯、顺式胸腺嘧啶二聚体、三聚体、c12间隔基、c3间隔基、c6间隔基、d间隔基、pc间隔基、r间隔基、18间隔基9,3'‑3'修饰、5'‑5'修饰、无碱基、吖啶、偶氮苯、生物素、生物素bb、生物素teg、胆甾醇teg、脱硫生物素teg、dnpteg、dnp‑x、dota、dt‑生物素、双重生物素、pc生物素、补骨脂素c2、补骨脂素c6、tina、3'dabcyl、黑洞淬灭剂1、黑洞淬灭剂2、dabcylse、dt‑dabcyl、irdyeqc‑1、qsy‑21、qsy‑35、qsy‑7、qsy‑9、羧基接头、硫醇接头、2'‑脱氧核糖核苷类似物嘌呤、2'‑脱氧核糖核苷类似物嘧啶、核糖核苷类似物、2'‑o‑甲基核糖核苷类似物、糖修饰的类似物、摆动/通用碱基、荧光染料标记、2'‑氟rna、2'‑o‑甲基rna、膦酸甲酯、磷酸二酯脱氧核糖核酸、磷酸二酯rna、硫代磷酸酯dna、硫代磷酸酯rna、una、伪尿苷5'‑三磷酸酯、5'‑甲基胞苷5'‑三磷酸酯或其任意组合修饰grna或指导多核苷酸。[0298]在某些情况下,修饰是永久性的。在其他情况下,修饰是暂时的。在一些情况下,对grna或指导多核苷酸进行了多种修饰。grna或指导多核苷酸修饰可以改变核苷酸的物理化学性质,例如其构象、极性、疏水性、化学反应性、碱基配对相互作用或其任何组合。[0299]修饰也可以是硫代磷酸酯替代物。在某些情况下,天然磷酸二酯键可能易于被细胞核酸酶快速降解,并且;使用硫代磷酸酯(ps)键替代物修饰核苷酸间键对通过细胞降解的水解更稳定。修饰可以增加grna或指导多核苷酸的稳定性。修饰还可以增强生物活性。在某些情况下,硫代磷酸酯增强的rnagrna可抑制rnasea、rnaset1、小牛血清核酸酶或它们的任何组合。这些特性可允许将ps‑rnagrna用于在体内或体外极有可能暴露于核酸酶的应用中。例如,可以在grna的5'或”端的最后3‑5个核苷酸之间引入硫代磷酸酯(ps)键,这可以抑制核酸外切酶降解。在某些情况下,可以在整个grna中添加硫代磷酸酯键,以减少核酸内切酶的攻击。[0300]原间隔物相邻基序[0301]术语“原间隔物相邻基序(pam)”或pam样基序是指在crispr细菌适应性免疫系统中紧随cas9核酸酶靶向的dna序列之后的2‑6个碱基对的dna序列。在一些实施例中,pam可以是5’pam(即,位于原间隔物的5’端的上游)。在其他实施例中,pam可以是3’pam(即位于原间隔物的5’端的下游)。[0302]原间隔物相邻基序(pam)或pam样基序是指在crispr细菌适应性免疫系统中紧随cas9核酸酶靶向的dna序列后的2‑6个碱基对的dna序列。在一些实施例中,pam可以是5’pam(即,位于原间隔物的5’端的上游)。在其他实施例中,pam可以是3’pam(即,位于原间隔物的5’端的下游)。pam序列对于靶标结合至关重要,但是确切的序列取决于cas蛋白的类型。[0303]本文提供的碱基编辑器可以包含crispr蛋白衍生的结构域,其能够结合包含典型或非典型原间隔物相邻基序(pam)序列的核苷酸序列。pam位点是接近靶多核苷酸序列的核苷酸序列。本申请的一些方面提供了包含全部或部分具有不同pam特异性的crispr蛋白质的碱基编辑器。例如,典型的cas9蛋白,例如化脓性链球菌的cas9(spcas9),需要典型nggpam序列结合特定的核酸区域,其中“ngg”中的“n”是腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)或胞嘧啶(c),且g为鸟嘌呤。pam可以是crispr蛋白质特异性的,并且在包含不同crispr蛋白质衍生域的不同碱基编辑器之间可以不同。pam可以是目标序列的5'或3'。pam可以在靶序列的上游或下游。pam的长度可以是1、2、3、4、5、6、7、8、9、10个或更多个核苷酸。通常,pam的长度在2‑6个核苷酸之间。[0304]在一些实施方案中,cas9结构域是化脓性链球菌(spcas9)的cas9结构域。在一些实施方案中,spcas9结构域是核酸酶活性spcas9,核酸酶非活性spcas9(spcas9d)或spcas9切口酶(spcas9n)。在一些实施方案中,spcas9在本文提供的任何氨基酸序列中包含d9x突变或相应的突变,其中x是除d外的任何氨基酸。在一些实施方案中,spcas9包括d9a突变或相应的突变。在本文提供的任何氨基酸序列中。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可以结合具有非典型pam的核酸序列。在一些实施方案中,spcas9结构域、spcas9d结构域或spcas9n结构域可以结合具有ngg、nga或ngcgpam序列的核酸序列。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135x、r1335x和t1336x突变或相应突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135e、r1335q和t1336r突变或相应突变中的一个或多个。在一些实施方案中,spcas9结构域包含d1135e、r1335q和t1336r突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135x、r1335x和t1336x突变或相应突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135v、r1335q和t1336r突变或相应突变中的一个或多个。在一些实施方案中,spcas9结构域包含d1135v、r1335q和t1336r突变,或本文提供的任何氨基酸序列中的相应突变。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135x、g1217x、r1335x和t1336x突变或相应突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135v、g1217r、r1335q和t1336r突变或相应突变中的一个或多个。在一些实施方案中,spcas9结构域在本文提供的任何氨基酸序列中包含d1135v、g1217r、r1335q和t1336r突变或相应的突变。[0305]在一些实施方案中,本文提供的任何融合蛋白的cas9结构域包含至少60%、至少65%、至少70%、至少75%、至少80%的氨基酸序列,与本文所述的cas9多肽具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。在一些实施方案中,本文提供的任何融合蛋白的cas9结构域包含本文描述的任何cas9多肽的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的cas9结构域由本文描述的任何cas9多肽的氨基酸序列组成。[0306]能够结合pam序列的示例性spcas9蛋白的序列如下。[0307]示例性的spcas9[0308]mdkkysigldigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0309]示例性的spcas9n[0310]mdkkysiglaigtnsvgwavitdeykvpskkfkvlgntdrhsikknligallfdsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkklvdstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqtynqlfeenpinasgvdakailsarlsksrrlenliaqlpgekknglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnteitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgtyhdllkiikdkdfldneenediledivltltlfedremieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqgdslhehianlagspaikkgilqtvkvvdelvkvmgrhkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsflkddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd[0311]示例性speqrcas9[0312][0313][0314]以底线和粗体标出上面的残基e1135、q1335和r1337,其可以从d1135、r1335和t1337突变以产生speqrcas9。[0315]示例性spvqrcas9[0316][0317]以底线和粗体标出上述残基v1135、q1335和r1337,其可以从d1135、r1335和t1337进行突变以产生spvqrcas9。[0318]示例性spvrercas9[0319][0320][0321]示例性的spvrqrcas9[0322][0323][0324]以底线和粗体标出上面的残基v1135、r1218、q1335和r1337,其可以从d1135、g1218、r1335和t1337进行突变以产生spvrqrcas9。[0325]在一些实施方案中,cas9结构域是重组cas9结构域。在一些实施方案中,重组cas9结构域是spymaccas9结构域。在一些实施方案中,spymaccas9域是核酸酶活性的spymaccas9、核酸酶非活性的spymaccas9(spymaccas9d)或spymaccas9切口酶(spymaccas9n)。在一些实施方案中,sacas9结构域,sacas9d结构域或sacas9n结构域可以结合具有非典型pam的核酸序列。在一些实施方案中,spymaccas9结构域、spcas9d结构域或spcas9n结构域可以结合具有naapam序列的核酸序列。[0326]示例性spymaccas9[0327]mdkkysigldigtnsvgwavitddykvpskkfkvlgntdrhsikknligallfgsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkkladstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqiynqlfeenpinasrvdakailsarlsksrrlenliaqlpgekrnglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnseitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgayhdllkiikdkdfldneenediledivltltlfedrgmieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqghslheqianlagspaikkgilqtvkivdelvkvmghkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsfikddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkkteiqtvgqngglfddnpksplevtpsklvplkkelnpkkyggyqkpttaypvllitdtkqlipisvmnkkqfeqnpvkflrdrgyqqvgkndfiklpkytlvdigdgikrlwasskeihkgnqlvvskksqillyhahhldsdlsndylqnhnqqfdvlfneiisfskkcklgkehiqkienvysnkknsasieelaesfikllgftqlgatspfnflgvklnqkqykgkkdyilpctegtlirqsitglyetrvdlskiged。[0328]高保真cas9域[0329]本申请的一些方面提供了高保真度的cas9结构域。在一些实施方案中,高保真cas9结构域是经工程改造的cas9结构域,其包含相对于相应的野生型cas9结构域降低cas9结构域与dna的糖‑磷酸骨架之间的静电相互作用的一个或多个突变。与dna的糖‑磷酸主链的静电相互作用降低的高保真cas9结构域可具有较少的脱靶效应。在一些实施方案中,cas9结构域(例如,野生型cas9结构域)包含一种或多种降低cas9结构域与dna的糖‑磷酸主链之间的缔合的突变。在一些实施方案中,cas9结构域包含一种或多种突变,其使cas9结构域与dna的糖‑磷酸主链之间的缔合降低至少1%、至少2%、至少3%、至少4%、至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%或至少70%。[0330]在一些实施方案中,本文提供的任何cas9融合蛋白在本文提供的任何氨基酸序列中包含n497x、r661x、q695x和/或q926x突变或相应突变中的一个或多个,其中x是任何氨基酸。在一些实施方案中,本文提供的任何cas9融合蛋白在本文提供的任何氨基酸序列中包含n497a、r661a、q695a和/或q926a突变或相应突变中的一个或多个。在一些实施方案中,cas9结构域在本文提供的任何氨基酸序列中包含d10a突变或相应的突变。具有高保真度的cas9结构域是本领域已知的,并且对本领域技术人员而言是显而易见的。例如,kleinstiver,b.p.等人,“high‑fidelitycrispr‑cas9nucleaseswithnodetectablegenome‑wideoff‑targeteffects.”,nature529,490‑495(2016);andslaymaker,i.m.等人,“rationallyengineeredcas9nucleaseswithimprovedspecificity.”,science351,84‑88(2015);每个的全部内容通过引用并入本文。[0331]相对于cas9的高保真cas9域突变以粗体和底线显示[0332][0333]在一些情况下,变体cas9蛋白带有h840a、p475a、w476a、n477a、d1125a、w1126a和d1218a突变,使得所述多肽切割靶dna或rna的能力降低。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。作为另一个非限制性实例,在一些情况下,变体cas9蛋白带有d10a、h840a、p475a、w476a、n477a、d1125a、w1126a和d1218a突变,使得所述多肽切割靶dna的能力降低。这样的cas9蛋白切割靶dna(例如单链靶dna)的能力降低,但是保留了结合靶dna(例如单链靶dna)的能力。在某些情况下,当变异的cas9蛋白带有w476a和w1126a突变,或者变异的cas9蛋白带有p475a、w476a、n477a、d1125a、w1126a和d1218a突变时,变异的cas9蛋白不能有效地与pam序列结合。因此,在一些这样的情况下,当在结合方法中使用这种变体cas9蛋白时,所述方法不需要pam序列。换句话说,在某些情况下,当将这种cas9变异蛋白用于结合方法时,所述方法可包含指导rna,但所述方法可在不存在pam序列的情况下进行(结合的特异性为因此由指导rna的靶向片段提供)。可以使其他残基突变以获得上述效果(即,使一个或另一个核酸酶部分失活)。作为非限制性实例,残基d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986和/或a987可以被改变(即被取代)。同样,除丙氨酸取代以外的突变也是合适的。[0334]在一些实施方案中,碱基编辑器的crispr蛋白来源的结构域可包含具有标准pam序列(ngg)的cas9蛋白的全部或一部分。在其他实施方案中,碱基编辑器的cas9衍生的结构域可以采用非典型pam序列。这样的序列已在本领域中描述,并且对本领域技术人员而言是显而易见的。例如,在kleinstiver,b.p.等人,“engineeredcrispr‑cas9nucleaseswithalteredpamspecificities”,nature523,481‑485(2015)中已经描述了结合非典型pam序列的cas9结构域。kleinstiver,b.p.等人,“broadeningthetargetingrangeofstaphylococcusaureuscrispr‑cas9bymodifyingpamrecognition”naturebiotechnology33,1293‑1298(2015);每个的全部内容通过引用合并于此。[0335]在一些实例中,可以将本文公开的碱基编辑器的crispr蛋白衍生的结构域识别的pam提供给编码碱基编辑器的插入物(例如aav插入物)的单独寡核苷酸上的细胞。在这种情况下,在单独的寡核苷酸上提供pam可以切割原本无法被切割的靶序列,因为在与靶序列相同的多核苷酸上不存在相邻的pam。[0336]在一个实施方案中,化脓性链球菌cas9(spcas9)可用作用于基因组工程的crispr核酸内切酶。但是,可以使用其他方法。在某些情况下,可以使用不同的核酸内切酶靶向某些基因组靶标。在某些情况下,可以使用具有非nggpam序列的合成的spcas9衍生变体。另外,已经鉴定了来自各种物种的其他cas9直向同源物,并且这些“非spcas9s”可以结合多种pam序列,这也可用于本申请。例如,相对较大的spcas9大小(大约4kb编码序列)会导致携带spcas9cdna的质粒无法在细胞中有效表达。相反,金黄色葡萄球菌cas9(sacas9)的编码序列比spcas9短约1千个碱基,可能使其在细胞中有效表达。与spcas9相似,sacas9核酸内切酶能够在体外和体内修饰哺乳动物细胞中的靶基因。在某些情况下,cas蛋白可以靶向不同的pam序列。在某些情况下,靶基因可能与cas9pam(例如5'‑ngg)相邻。在其他情况下,其他cas9直系同源物可能具有不同的pam要求。例如,其他pam,例如嗜热链球菌(对于crispr1为5'‑nnagaa,对于crispr3为5'‑nggng)和脑膜炎双球菌(5'‑nnnngatt)。[0337]在一些实施方案中,对于化脓性链球菌,靶基因序列可以在5'‑nggpam之前(即5'至),并且20‑nt指导rna序列可以与相反链碱基配对。介导与pam相邻的cas9切割。在某些情况下,相邻的片段可以是或可以是pam上游的约3个碱基对。在某些情况下,相邻的片段可以是或可以是pam上游的约10个碱基对。在一些情况下,相邻的片段可以是pam上游或可以是pam上游的约0‑20个碱基对。例如,相邻的切割可以紧邻,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20pam上游的21、22、23、24、25、26、27、28、29或30个碱基对。相邻的片段也可以在pam的下游1到30个碱基对。[0338]包含核定位序列(nuclearlocalizationsequence,nls)的融合蛋白[0339]在一些实施方案中,本文提供的融合蛋白进一步包含一个或多个(例如2、3、4、5)核靶向序列,例如核定位序列(nls)。在一实施例中,使用二分式nls。在一些实施方案中,nls包含有助于将包含nls的蛋白质导入细胞核的氨基酸序列(例如,通过核运输)。在一些实施方案中,本文提供的任何融合蛋白还包含核定位序列(nls)。在一些实施方案中,将nls融合至融合蛋白的n端。在一些实施方案中,将nls融合至融合蛋白的c端。在一些实施方案中,nls与cas9结构域的n‑末端融合。在一些实施方案中,将nls融合至ncas9结构域或dcas9结构域的c端。在一些实施方案中,nls与脱氨酶的n‑末端融合。在一些实施方案中,nls与脱氨酶的c‑末端融合。在一些实施方案中,nls通过一个或多个接头与融合蛋白融合。在一些实施方案中,将nls与没有接头的融合蛋白融合。在一些实施方案中,nls包含本文提供或引用的任何nls序列的氨基酸序列。另外的核定位序列在本领域中是已知的,并且对本领域技术人员而言是显而易见的。例如,nls序列在plank等人,pct/ep2000/011690中描述,其内容通过引用并入本文作为示例性核定位序列的参考。在一些实施方案中,nls包含氨基酸序列pkkkrkvegadkrtadgsefespkkkrkv、krtadgsefespkkkrkv、krpaatkkagqakkkk、kktelqttnaenktkkl、krgindrnfwrgengrktr、rksgkiaaivvkrprkpkkrkkvk或kmlknrlcflyqly。在一些实施方案中,nls存在于接头中或nls侧接于接头,例如本文所述的接头。在一些实施方案中,n末端或c末端nls是二分nls。二分体nls包含两个碱性氨基酸簇,它们由相对较短的间隔序列隔开(因此,二分体‑2个部分,而单分体nls没有)。核纤溶酶的nlskr[paatkkagqa]kkkk是普遍存在的二分信号的原型:两个碱性氨基酸簇,由大约10个氨基酸的间隔区隔开。示例性两方nls的序列如下:pkkkrkvegadkrtadgsefespkkkrkv。[0340]在一些实施方案中,本申请的融合蛋白不包含接头序列。在一些实施方案中,存在一个或多个结构域或蛋白质之间的接头序列。[0341]应了解,本申请的融合蛋白可包含一个或多个附加特征。例如,在一些实施方案中,融合蛋白可包含抑制剂、胞质定位序列、输出序列(例如核输出序列或其他定位序列),以及可用于增溶、纯化或检测融合蛋白的序列标签。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(bccp)标签、myc标签、钙调蛋白标签、flag标签、血凝素(ha)标签、多组氨酸标签(也称为组氨酸标签或his‑标签)、麦芽糖结合蛋白(mbp)标签、nus标签、谷胱甘肽s‑转移酶(gst)标签、绿色荧光蛋白(gfp)标签、硫氧还蛋白标签、s标签、softags(例如,softag1、softag3)、链球菌标签、生物素连接酶标签、flash标签、v5标签和sbp标签。对于本领域技术人员而言,其他合适的序列是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[0342]可以使用编码包含一个或多个核定位序列(nls)的crispr酶的载体。例如,可以使用或大约使用1、2、3、4、5、6、7、8、9、10个nls。crispr酶可以在弹药末端或附近包含nls,在羧基末端或附近包含约或大于约1、2、3、4、5、6、7、8、9、10个nls这些的组合(例如,在氨基末端的一个或多个nls和在羧基末端的一个或多个nls)。当存在一个以上的nls时,可以彼此独立地选择一个,这样单个nls可以一个以上的副本存在和/或与一个或多个其他的nls一起存在一个或多个副本中。[0343]所述方法中使用的crispr酶可包含约6个nls。当最接近nls的氨基酸在距n端或c端的多肽链中约50个氨基酸以内时,例如在1、2、3、4、5、10、15、20、25、30、40或50个氨基酸内,则认为nls接近n端或c端。[0344]pam序列可以是本领域已知的任何pam序列。合适的pam序列包括但不限于ngg、nga、ngc、ngn、ngt、ngcg、ngag、ngan、ngng、ngcn、ngcg、ngtn、nngrrt、nnnrrt、ngrrr(n)、tttv、tycv、tycv、tatv、nnngtat、nnagaaw或naaaac。y是嘧啶;n是任何核苷酸碱基;w是a或t。[0345]排他性降低的cas9域[0346]通常,cas9蛋白(如化脓性链球菌的cas9(spcas9))需要典型nggpam序列结合特定的核酸区域,其中“ngg”中的“n”是腺苷(a)、胸苷(t)或胞嘧啶(c),而g为鸟苷。这可能会限制编辑基因组中所需碱基的能力。在一些实施方案中,本文提供的碱基编辑融合蛋白可能需要放置在精确的位置,例如包含在pam上游的靶碱基的区域。例如,参见komor,a.c.等人发表的“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”,nature533,420‑424(2016),其全部内容通过引用并入本文。因此,在一些实施方案中,本文提供的任何融合蛋白可包含cas9结构域,其能够结合不包含典型(例如ngg)pam序列的核苷酸序列。结合非典型pam序列的cas9结构域已经在本领域中描述,并且对本领域技术人员而言是显而易见的。例如,在kleinstiver,b.p.等人发表的“engineeredcrispr‑cas9nucleaseswithalteredpamspecificities”,nature523,481‑485(2015)中已经描述了结合非典型pam序列的cas9结构域。kleinstiver,b.p.等人发表的“broadeningthetargetingrangeofstaphylococcusaureuscrispr‑cas9bymodifyingpamrecognition”naturebiotechnology33,1293‑1298(2015);nishimasu,h.等人发表的“engineeredcrispr‑cas9nucleasewithexpandedtargetingspace”science,2018sep21;361(6408):1259‑1262,chatterjee,p.等人发表的“minimalpamspecificityofahighlysimilarspcas9ortholog”,sciadv.2018oct24;4(10):eaau0766.doi:10.1126/sciadv.aau0766,其各自的全部内容通过引用合并于此。下表1中描述了几种pam变体。[0347]表1.cas9蛋白和相应的pam序列[0348][0349][0350]核碱基编辑结构域[0351]本文描述了包含融合蛋白的碱基编辑器,所述融合蛋白包括多核苷酸可编程核苷酸结合结构域和核苷碱基编辑结构域(例如,脱氨酶结构域)。通过与能够识别靶序列的指导多核苷酸相互作用,可以对碱基编辑器进行编程以编辑靶多核苷酸序列中的一个或多个碱基。一旦识别出靶序列,就将碱基编辑器锚定在将要进行编辑的多核苷酸上,然后碱基编辑器的脱氨酶结构域组分可以编辑靶碱基。[0352]在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在某些情况下,脱氨酶结构域可以是胞嘧啶脱氨酶或胞苷脱氨酶。在一些实施方案中,术语“胞嘧啶脱氨酶”和“胞苷脱氨酶”可以互换使用。在某些情况下,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,术语“腺嘌呤脱氨酶”和“腺苷脱氨酶”可以互换使用。核碱基编辑蛋白的细节在国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和国际第pct/us2016/058344号专利申请(wo第2017/070632)中进行了描述,将其全部内容通过引用并入本文。另请参阅komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),全文其内容通过引用合并于此。[0353]c到t编辑[0354]在一些实施方案中,本文公开的碱基编辑器包括包含胞苷脱氨酶的融合蛋白,所述胞嘧啶脱氨酶能够使多核苷酸的靶胞苷(c)碱基脱氨以产生尿苷(u),所述尿苷具有胸腺嘧啶的碱基配对特性。在一些实施方案中,例如在多核苷酸是双链的(例如dna)的情况下,然后尿苷碱基可以被胸苷碱基取代(例如通过细胞修复机制)以产生c:g至t:a的转变。在其他实施方案中,碱基编辑器将核酸中的c脱氨为u时,不能将u取代为t。[0355]多核苷酸中靶c的脱氨基以产生u是可以由本文所述的碱基编辑器执行的碱基编辑类型的非限制性实例。在另一个实例中,包含胞苷脱氨酶结构域的碱基编辑器可以介导胞嘧啶(c)碱基向鸟嘌呤(g)碱基的转化。例如,可以通过碱基切除修复机制(例如,通过尿嘧啶dna糖基化酶(udg)结构域),从碱基编辑器的胞嘧啶脱氨酶结构域的胞嘧啶脱氨基所产生的多核苷酸的u,从多核苷酸中切除,产生一个无基础的网站。然后可以通过例如转移损伤聚合酶将与无碱基位点相对的核碱基(例如通过碱基修复机制)替换为另一碱基,例如c。尽管通常将与无碱基位点相反的核碱基用c取代,但也可以发生其他取代(例如a,g或t)。[0356]因此,在一些实施方案中,本文所述的碱基编辑器包含能够将多核苷酸中的靶c脱氨到u的脱氨结构域(例如胞苷脱氨酶结构域)。此外,如下所述,碱基编辑器可包含促进由脱氨基产生的u转化为t或g的其他结构域。例如,包含胞苷脱氨酶域的碱基编辑器还可包含尿嘧啶糖基化酶抑制剂(ugi)域来介导u被t取代,从而完成c到t碱基编辑事件。在另一个实例中,碱基编辑器可以掺入跨病变聚合酶以提高c‑to‑g碱基编辑的效率,因为跨病变聚合酶可以促进与无碱基位点相对的c的掺入(即,导致在无碱基位点掺入g,完成c到g(c‑to‑g)碱基编辑活动)。[0357]包含胞苷脱氨酶作为结构域的碱基编辑器可以使任何多核苷酸,包括dna、rna和dna‑rna杂种中的靶c脱氨基。通常,胞苷脱氨酶催化位于多核苷酸单链部分的上下文中的c核碱基。在一些实施方案中,包含靶c的整个多核苷酸可以是单链的。例如,并入碱基编辑器中的胞苷脱氨酶可以使单链rna多核苷酸中的靶c脱氨基。在其他实施方案中,包含胞苷脱氨酶结构域的碱基编辑器可以作用于双链多核苷酸,但是靶标c可以位于在脱氨反应时处于单链状态的多核苷酸的一部分中。例如,在其中nagpb结构域包含cas9结构域的实施方案中,在形成cas9‑grna‑靶dna复合物期间,几个核苷酸可以不成对,导致形成cas9“r‑环复合物”。这些未配对的核苷酸可以形成单链dna的气泡,所述单链dna可以用作单链特异性核苷酸脱氨酶(例如胞苷脱氨酶)的受質。[0358]在一些实施方案中,碱基编辑器的胞苷脱氨酶可包含载脂蛋白bmrna编辑复合体(apobec)家族脱氨酶的全部或一部分。apobec是进化上保守的胞苷脱氨基酶家族。所述家族的成员是c到u(c‑to‑u)编辑酶。像蛋白质一样,apobec的n末端结构域是催化结构域,而c末端结构域是伪催化结构域。更具体地说,催化结构域是锌依赖性胞苷脱氨酶结构域,并且对于胞苷脱氨是重要的。apobec家族成员包括apobec1、apobec2、apobec3a、apobec3b、apobec3c、apobec3d(现在称为“apobec3e”)、apobec3f、apobec3g、apobec3h、apobec4和激活诱导的(胞苷)脱氨酶。在一些实施方案中,并入碱基编辑器中的脱氨酶包含apobec1脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec2脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3a脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3b脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3c脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3d脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3e脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3f脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3g脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec3h脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包括apobec4脱氨酶的全部或一部分。在一些实施方案中,并入碱基编辑器中的脱氨酶包含全部或部分活化诱导的脱氨酶(aid)。在一些实施方案中,并入碱基编辑器中的脱氨酶包含全部或部分胞苷脱氨酶1(cda1)。应当理解,碱基编辑器可以包含来自任何合适生物体(例如人类或大鼠)的脱氨酶。在一些实施方案中,碱基编辑器的脱氨酶结构域来自人类、黑猩猩、大猩猩、猴子、牛、狗、大鼠或小鼠。在一些实施方案中,碱基编辑器的脱氨酶结构域衍生自大鼠(例如大鼠apobec1)。在一些实施方案中,碱基编辑器的脱氨酶结构域是人类apobec1。在一些实施方案中,碱基编辑器的脱氨酶结构域是pmcda1。[0359]pmcda1的碱基序列和氨基酸序列以及人类aid的cds的碱基序列和氨基酸序列在下面显示。[0360]>tr|a5h718|a5h718_petma胞嘧啶脱氨酶os=海七鳃鳗ox=7757pe=2sv=1:[0361]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsg[0362]tergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlk[0363]iwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlekt[0364]lkraekrrselsimiqvkilhttkspav[0365]>ef094822.1海七鳃鳗分离pmcda.21胞嘧啶脱氨酶mrna,完整cds[0366]tgacacgacacagccgtgtatatgaggaagggtagctggatggggggggggggaatacgttcagagaggacattagcgagcgtcttgttggtggccttgagtctagacacctgcagacatgaccgacgctgagtacgtgagaatccatgagaagttggacatctacacgtttaagaaacagtttttcaacaacaaaaaatccgtgtcgcatagatgctacgttctctttgaattaaaacgacggggtgaacgtagagcgtgtttttggggctatgctgtgaataaaccacagagcgggacagaacgtggaattcacgccgaaatctttagcattagaaaagtcgaagaatacctgcgcgacaaccccggacaattcacgataaattggtactcatcctggagtccttgtgcagattgcgctgaaaagatcttagaatggtataaccaggagctgcgggggaacggccacactttgaaaatctgggcttgcaaactctattacgagaaaaatgcgaggaatcaaattgggctgtggaacctcagagataacggggttgggttgaatgtaatggtaagtgaacactaccaatgttgcaggaaaatattcatccaatcgtcgcacaatcaattgaatgagaatagatggcttgagaagactttgaagcgagctgaaaaacgacggagcgagttgtccattatgattcaggtaaaaatactccacaccactaagagtcctgctgtttaagaggctatgcggatggttttc[0367]>tr|q6qj80|q6qj80_人类激活诱导的胞苷脱氨酶os=智人ox=9606gn=aicdape=2sv=1:[0368]mdsllmnrrkflyqfknvrwakgrretylcyvvkrrdsatsfsldfgylrnkngchvellflryisdwdldpgrcyrvtwftswspcydcarhvadflrgnpnlslriftarlyfcedrkaepeglrrlhragvqiaimtfkapv[0369]>ng_011588.1:5001‑15681人类激活诱导的12号染色体上的胞苷脱氨酶(aicda),[0370]参考序列(lrg_17)[0371]agagaaccatcattaattgaagtgagatttttctggcctgagacttgcagggaggcaagaagacactctggacaccactatggacaggtaaagaggcagtcttctcgtgggtgattgcactggccttcctctcagagcaaatctgagtaatgagactggtagctatccctttctctcatgtaactgtctgactgataagatcagcttgatcaatatgcatatatattttttgatctgtctccttttcttctattcagatcttatacgctgtcagcccaattctttctgtttcagacttctcttgatttccctctttttcatgtggcaaaagaagtagtgcgtacaatgtactgattcgtcctgagatttgtaccatggttgaaactaatttatggtaataatattaacatagcaaatctttagagactcaaatcatgaaaaggtaatagcagtactgtactaaaaacggtagtgctaattttcgtaataattttgtaaatattcaacagtaaaacaacttgaagacacactttcctagggaggcgttactgaaataatttagctatagtaagaaaatttgtaattttagaaatgccaagcattctaaattaattgcttgaaagtcactatgattgtgtccattataaggagacaaattcattcaagcaagttatttaatgttaaaggcccaattgttaggcagttaatggcacttttactattaactaatctttccatttgttcagacgtagcttaacttacctcttaggtgtgaatttggttaaggtcctcataatgtctttatgtgcagtttttgataggttattgtcatagaacttattctattcctacatttatgattactatggatgtatgagaataacacctaatccttatactttacctcaatttaactcctttataaagaacttacattacagaataaagattttttaaaaatatatttttttgtagagacagggtcttagcccagccgaggctggtctctaagtcctggcccaagcgatcctcctgcctgggcctcctaaagtgctggaattatagacatgagccatcacatccaatatacagaataaagatttttaatggaggatttaatgttcttcagaaaattttcttgaggtcagacaatgtcaaatgtctcctcagtttacactgagattttgaaaacaagtctgagctataggtccttgtgaagggtccattggaaatacttgttcaaagtaaaatggaaagcaaaggtaaaatcagcagttgaaattcagagaaagacagaaaaggagaaaagatgaaattcaacaggacagaagggaaatatattatcattaaggaggacagtatctgtagagctcattagtgatggcaaaatgacttggtcaggattatttttaacccgcttgtttctggtttgcacggctggggatgcagctagggttctgcctcagggagcacagctgtccagagcagctgtcagcctgcaagcctgaaacactccctcggtaaagtccttcctactcaggacagaaatgacgagaacagggagctggaaacaggcccctaaccagagaagggaagtaatggatcaacaaagttaactagcaggtcaggatcacgcaattcatttcactctgactggtaacatgtgacagaaacagtgtaggcttattgtattttcatgtagagtaggacccaaaaatccacccaaagtcctttatctatgccacatccttcttatctatacttccaggacactttttcttccttatgataaggctctctctctctccacacacacacacacacacacacacacacacacacacacacacacaaacacacaccccgccaaccaaggtgcatgtaaaaagatgtagattcctctgcctttctcatctacacagcccaggagggtaagttaatataagagggatttattggtaagagatgatgcttaatctgtttaacactgggcctcaaagagagaatttcttttcttctgtacttattaagcacctattatgtgttgagcttatatatacaaagggttattatatgctaatatagtaatagtaatggtggttggtactatggtaattaccataaaaattattatccttttaaaataaagctaattattattggatcttttttagtattcattttatgttttttatgtttttgattttttaaaagacaatctcaccctgttacccaggctggagtgcagtggtgcaatcatagctttctgcagtcttgaactcctgggctcaagcaatcctcctgccttggcctcccaaagtgttgggatacagtcatgagccactgcatctggcctaggatccatttagattaaaatatgcattttaaattttaaaataatatggctaatttttaccttatgtaatgtgtatactggcaataaatctagtttgctgcctaaagtttaaagtgctttccagtaagcttcatgtacgtgaggggagacatttaaagtgaaacagacagccaggtgtggtggctcacgcctgtaatcccagcactctgggaggctgaggtgggtggatcgcttgagccctggagttcaagaccagcctgagcaacatggcaaaacgctgtttctataacaaaaattagccgggcatggtggcatgtgcctgtggtcccagctactagggggctgaggcaggagaatcgttggagcccaggaggtcaaggctgcactgagcagtgcttgcgccactgcactccagcctgggtgacaggaccagaccttgcctcaaaaaaataagaagaaaaattaaaaataaatggaaacaactacaaagagctgttgtcctagatgagctacttagttaggctgatattttggtatttaacttttaaagtcagggtctgtcacctgcactacattattaaaatatcaattctcaatgtatatccacacaaagactggtacgtgaatgttcatagtacctttattcacaaaaccccaaagtagagactatccaaatatccatcaacaagtgaacaaataaacaaaatgtgctatatccatgcaatggaataccaccctgcagtacaaagaagctacttggggatgaatcccaaagtcatgacgctaaatgaaagagtcagacatgaaggaggagataatgtatgccatacgaaattctagaaaatgaaagtaacttatagttacagaaagcaaatcagggcaggcatagaggctcacacctgtaatcccagcactttgagaggccacgtgggaagattgctagaactcaggagttcaagaccagcctgggcaacacagtgaaactccattctccacaaaaatgggaaaaaaagaaagcaaatcagtggttgtcctgtggggaggggaaggactgcaaagagggaagaagctctggtggggtgagggtggtgattcaggttctgtatcctgactgtggtagcagtttggggtgtttacatccaaaaatattcgtagaattatgcatcttaaatgggtggagtttactgtatgtaaattatacctcaatgtaagaaaaaataatgtgtaagaaaactttcaattctcttgccagcaaacgttattcaaattcctgagccctttacttcgcaaattctctgcacttctgccccgtaccattaggtgacagcactagctccacaaattggataaatgcatttctggaaaagactagggacaaaatccaggcatcacttgtgctttcatatcaaccatgctgtacagcttgtgttgctgtctgcagctgcaatggggactcttgatttctttaaggaaacttgggttaccagagtatttccacaaatgctattcaaattagtgcttatgatatgcaagacactgtgctaggagccagaaaacaaagaggaggagaaatcagtcattatgtgggaacaacatagcaagatatttagatcattttgactagttaaaaaagcagcagagtacaaaatcacacatgcaatcagtataatccaaatcatgtaaatatgtgcctgtagaaagactagaggaataaacacaagaatcttaacagtcattgtcattagacactaagtctaattattattattagacactatgatatttgagatttaaaaaatctttaatattttaaaatttagagctcttctatttttccatagtattcaagtttgacaatgatcaagtattactctttctttttttttttttttttttttttttgagatggagttttggtcttgttgcccatgctggagtggaatggcatgaccatagctcactgcaacctccacctcctgggttcaagcaaagctgtcgcctcagcctcccgggtagatgggattacaggcgcccaccaccacactcggctaatgtttgtatttttagtagagatggggtttcaccatgttggccaggctggtctcaaactcctgacctcagaggatccacctgcctcagcctcccaaagtgctgggattacagatgtaggccactgcgcccggccaagtattgctcttatacattaaaaaacaggtgtgagccactgcgcccagccaggtattgctcttatacattaaaaaataggccggtgcagtggctcacgcctgtaatcccagcactttgggaagccaaggcgggcagaacacccgaggtcaggagtccaaggccagcctggccaagatggtgaaaccccgtctctattaaaaatacaaacattacctgggcatgatggtgggcgcctgtaatcccagctactcaggaggctgaggcaggaggatccgcggagcctggcagatctgcctgagcctgggaggttgaggctacagtaagccaagatcatgccagtatacttcagcctgggcgacaaagtgagaccgtaacaaaaaaaaaaaaatttaaaaaaagaaatttagatcaagatccaactgtaaaaagtggcctaaacaccacattaaagagtttggagtttattctgcaggcagaagagaaccatcagggggtcttcagcatgggaatggcatggtgcacctggtttttgtgagatcatggtggtgacagtgtggggaatgttattttggagggactggaggcagacagaccggttaaaaggccagcacaacagataaggaggaagaagatgagggcttggaccgaagcagagaagagcaaacagggaaggtacaaattcaagaaatattggggggtttgaatcaacacatttagatgattaattaaatatgaggactgaggaataagaaatgagtcaaggatggttccaggctgctaggctgcttacctgaggtggcaaagtcgggaggagtggcagtttaggacagggggcagttgaggaatattgttttgatcattttgagtttgaggtacaagttggacacttaggtaaagactggaggggaaatctgaatatacaattatgggactgaggaacaagtttattttattttttgtttcgttttcttgttgaagaacaaatttaattgtaatcccaagtcatcagcatctagaagacagtggcaggaggtgactgtcttgtgggtaagggtttggggtccttgatgagtatctctcaattggccttaaatataagcaggaaaaggagtttatgatggattccaggctcagcagggctcaggagggctcaggcagccagcagaggaagtcagagcatcttctttggtttagcccaagtaatgacttccttaaaaagctgaaggaaaatccagagtgaccagattataaactgtactcttgcattttctctccctcctctcacccacagcctcttgatgaaccggaggaagtttctttaccaattcaaaaatgtccgctgggctaagggtcggcgtgagacctacctgtgctacgtagtgaagaggcgtgacagtgctacatccttttcactggactttggttatcttcgcaataaggtatcaattaaagtcggctttgcaagcagtttaatggtcaactgtgagtgcttttagagccacctgctgatggtattacttccatccttttttggcatttgtgtctctatcacattcctcaaatccttttttttatttctttttccatgtccatgcacccatattagacatggcccaaaatatgtgatttaattcctccccagtaatgctgggcaccctaataccactccttccttcagtgccaagaacaactgctcccaaactgtttaccagctttcctcagcatctgaattgcctttgagattaattaagctaaaagcatttttatatgggagaatattatcagcttgtccaagcaaaaattttaaatgtgaaaaacaaattgtgtcttaagcatttttgaaaattaaggaagaagaatttgggaaaaaattaacggtggctcaattctgtcttccaaatgatttcttttccctcctactcacatgggtcgtaggccagtgaatacattcaacatggtgatccccagaaaactcagagaagcctcggctgatgattaattaaattgatctttcggctacccgagagaattacatttccaagagacttcttcaccaaaatccagatgggtttacataaacttctgcccacgggtatctcctctctcctaacacgctgtgacgtctgggcttggtggaatctcagggaagcatccgtggggtggaaggtcatcgtctggctcgttgtttgatggttatattaccatgcaattttctttgcctacatttgtattgaatacatcccaatctccttcctattcggtgacatgacacattctatttcagaaggctttgattttatcaagcactttcatttacttctcatggcagtgcctattacttctcttacaatacccatctgtctgctttaccaaaatctatttccccttttcagatcctcccaaatggtcctcataaactgtcctgcctccacctagtggtccaggtatatttccacaatgttacatcaacaggcacttctagccattttccttctcaaaaggtgcaaaaagcaacttcataaacacaaattaaatcttcggtgaggtagtgtgatgctgcttcctcccaactcagcgcacttcgtcttcctcattccacaaaaacccatagccttccttcactctgcaggactagtgctgccaagggttcagctctacctactggtgtgctcttttgagcaagttgcttagcctctctgtaacacaaggacaatagctgcaagcatccccaaagatcattgcaggagacaatgactaaggctaccagagccgcaataaaagtcagtgaattttagcgtggtcctctctgtctctccagaacggctgccacgtggaattgctcttcctccgctacatctcggactgggacctagaccctggccgctgctaccgcgtcacctggttcacctcctggagcccctgctacgactgtgcccgacatgtggccgactttctgcgagggaaccccaacctcagtctgaggatcttcaccgcgcgcctctacttctgtgaggaccgcaaggctgagcccgaggggctgcggcggctgcaccgcgccggggtgcaaatagccatcatgaccttcaaaggtgcgaaagggccttccgcgcaggcgcagtgcagcagcccgcattcgggattgcgatgcggaatgaatgagttagtggggaagctcgaggggaagaagtgggcggggattctggttcacctctggagccgaaattaaagattagaagcagagaaaagagtgaatggctcagagacaaggccccgaggaaatgagaaaatggggccagggttgcttctttcccctcgatttggaacctgaactgtcttctacccccatatccccgcctttttttcctttttttttttttgaagattatttttactgctggaatacttttgtagaaaaccacgaaagaactttcaaagcctgggaagggctgcatgaaaattcagttcgtctctccagacagcttcggcgcatccttttggtaaggggcttcctcgctttttaaattttctttctttctctacagtcttttttggagtttcgtatatttcttatattttcttattgttcaatcactctcagttttcatctgatgaaaactttatttctcctccacatcagctttttcttctgctgtttcaccattcagagccctctgctaaggttccttttccctcccttttctttcttttgttgtttcacatctttaaatttctgtctctccccagggttgcgtttccttcctggtcagaattcttttctcctttttttttttttttttttttttttttaaacaaacaaacaaaaaacccaaaaaaactctttcccaatttactttcttccaacatgttacaaagccatccactcagtttagaagactctccggccccaccgacccccaacctcgttttgaagccattcactcaatttgcttctctctttctctacagcccctgtatgaggttgatgacttacgagacgcatttcgtactttgggactttgatagcaacttccaggaatgtcacacacgatgaaatatctctgctgaagacagtggataaaaaacagtccttcaagtcttctctgtttttattcttcaactctcactttcttagagtttacagaaaaaatatttatatacgactctttaaaaagatctatgtcttgaaaatagagaaggaacacaggtctggccagggacgtgctgcaattggtgcagttttgaatgcaacattgtcccctactgggaataacagaactgcaggacctgggagcatcctaaagtgtcaacgtttttctatgacttttaggtaggatgagagcagaaggtagatcctaaaaagcatggtgagaggatcaaatgtttttatatcaacatcctttattatttgattcatttgagttaacagtggtgttagtgatagatttttctattcttttcccttgacgtttactttcaagtaacacaaactcttccatcaggccatgatctataggacctcctaatgagagtatctgggtgattgtgaccccaaaccatctctccaaagcattaatatccaatcatgcgctgtatgttttaatcagcagaagcatgtttttatgtttgtacaaaagaagattgttatgggtggggatggaggtatagaccatgcatggtcaccttcaagctactttaataaaggatcttaaaatgggcaggaggactgtgaacaagacaccctaataatgggttgatgtctgaagtagcaaatcttctggaaacgcaaactcttttaaggaagtccctaatttagaaacacccacaaacttcacatatcataattagcaaacaattggaaggaagttgcttgaatgttggggagaggaaaatctattggctctcgtgggtctcttcatctcagaaatgccaatcaggtcaaggtttgctacattttgtatgtgtgtgatgcttctcccaaaggtatattaactatataagagagttgtgacaaaacagaatgataaagctgcgaaccgtggcacacgctcatagttctagctgcttgggaggttgaggagggaggatggcttgaacacaggtgttcaaggccagcctgggcaacataacaagatcctgtctctcaaaaaaaaaaaaaaaaaaaagaaagagagagggccgggcgtggtggctcacgcctgtaatcccagcactttgggaggccgagccgggcggatcacctgtggtcaggagtttgagaccagcctggccaacatggcaaaaccccgtctgtactcaaaatgcaaaaattagccaggcgtggtagcaggcacctgtaatcccagctacttgggaggctgaggcaggagaatcgcttgaacccaggaggtggaggttgcagtaagctgagatcgtgccgttgcactccagcctgggcgacaagagcaagactctgtctcagaaaaaaaaaaaaaaaagagagagagagagaaagagaacaatatttgggagagaaggatggggaagcattgcaaggaaattgtgctttatccaacaaaatgtaaggagccaataagggatccctatttgtctcttttggtgtctatttgtccctaacaactgtctttgacagtgagaaaaatattcagaataaccatatccctgtgccgttattacctagcaacccttgcaatgaagatgagcagatccacaggaaaacttgaatgcacaactgtcttattttaatcttattgtacataagtttgtaaaagagttaaaaattgttacttcatgtattcatttatattttatattattttgcgtctaatgattttttattaacatgatttccttttctgatatattgaaatggagtctcaaagcttcataaatttataactttagaaatgattctaataacaacgtatgtaattgtaacattgcagtaatggtgctacgaagccatttctcttgatttttagtaaacttttatgacagcaaatttgcttctggctcactttcaatcagttaaataaatgataaataattttggaagctgtgaagataaaataccaaataaaataatataaaagtgatttatatgaagttaaaataaaaaatcagtatgatggaataaacttg[0372]以下提供了根据本申请的方面可以与cas9融合的其他示例性脱氨酶。应当理解,在一些实施方案中,可以使用相应序列的活性结构域,例如没有定位信号的结构域(核定位序列、无核输出信号、胞质定位信号)。[0373]人类aid:[0374][0375](底线:核定位序列;双底线:核输出信号)[0376]小鼠aid:[0377][0378](底线:核定位序列;双底线:核输出信号)[0379]犬类aid:[0380][0381](底线:核定位序列;双底线:核输出信号)[0382]牛类aid:[0383][0384](底线:核定位序列;双底线:核输出信号)[0385]大鼠aid:[0386][0387](底线:核定位序列;双底线:核输出信号)[0388]小鼠apobec‑3[0389][0390][0391](斜体:核酸编辑域)[0392]大鼠apobec‑3:[0393][0394](斜体:核酸编辑域)[0395]猕猴apobec‑3g:[0396][0397](斜体:核酸编辑域;底线:胞质定位信号)[0398]黑猩猩apobec‑3g:[0399][0400](斜体:核酸编辑域;底线:胞质定位信号)[0401]绿猴apobec‑3g:[0402][0403][0404](斜体:核酸编辑域;底线:胞质定位信号)[0405]人类apobec‑3g:[0406][0407](斜体:核酸编辑域;底线:胞质定位信号)[0408]人类apobec‑3f:[0409][0410](斜体:核酸编辑域)[0411]人类apobec‑3b:[0412][0413](斜体:核酸编辑域)[0414]大鼠apobec‑3b:[0415]mqpqglgpnagmgpvclgcshrrpyspirnplkklyqqtfyfhfknvryawgrknnflcyevngmdcalpvplrqgvfrkqghihaelcfiywfhdkvlrvlspmeefkvtwymswspcskcaeqvarflaahrnlslaifssrlyyylrnpnyqqklcrliqegvhvaamdlpefkkcwnkfvdndgqpfrpwmrlrinfsfydcklqeifsrmnllredvfylqfnnshrvkpvqnryyrrksylcyqlerangqeplkgyllykkgeqhveilflekmrsmelsqvritcyltwspcpncarqlaafkkdhpdlilriytsrlyfwrkkfqkglctlwrsgihvdvmdlpqfadcwtnfvnpqrpfrpwneleknswriqrrlrrikeswgl[0416]牛类apobec‑3b:[0417]dgwevafrsgtvlkagvlgvsmtegwagsghpgqgacvwtpgtrntmnllrevlfkqqfgnqprvpapyyrrktylcyqlkqrndltldrgcfrnkkqrhaerfidkinsldlnpsqsykiicyitwspcpncanelvnfitrnnhlkleifasrlyfhwiksfkmglqdlqnagisvavmthtefedcweqfvdnqsrpfqpwdkleqysasirrrlqriltapi[0418]黑猩猩apobec‑3b:[0419]mnpqirnpmewmyqrtfyynfenepilygrsytwlcyevkirrghsnllwdtgvfrgqmysqpehhaemcflswfcgnqlsaykcfqitwfvswtpcpdcvaklakflaehpnvtltisaarlyyywerdyrralcrlsqagarvkimddeefaycwenfvynegqpfmpwykfddnyaflhrtlkeiirhlmdpdtftfnfnndplvlrrhqtylcyeverldngtwvlmdqhmgflcneaknllcgfygrhaelrfldlvpslqldpaqiyrvtwfiswspcfswgcagqvraflqenthvrlrifaariydydplykealqmlrdagaqvsimtydefeycwdtfvyrqgcpfqpwdgleehsqalsgrlrailqvrasslcmvphrpppppqspgpclplcsepplgsllptgrpapslpflltasfsfpppaslpplpslslspghlpvpsfhsltscsiqppcssriretegwasvskegrdlg[0420]人类apobec‑3c:[0421][0422](斜体:核酸编辑域)[0423]大猩猩apobec‑3c3c[0424][0425]人类apobec‑3a:[0426][0427](斜体:核酸编辑域)[0428]猕猴apobec‑3a:[0429][0430](斜体:核酸编辑域)[0431]牛类apobec‑3a:[0432][0433](斜体:核酸编辑域)[0434]人类apobec‑3h:[0435][0436](斜体:核酸编辑域)[0437]猕猴apobec‑3h:[0438]malltaktfslqfnnkrrvnkpyyprkallcyqltpqngstptrghlknkkkdhaeirfinkiksmgldetqcyqvtcyltwspcpscagelvdfikahrhlnlrifasrlyyhwrpnyqegllllcgsqvpvevmglpeftdcwenfvdhkeppsfnpsekleeldknsqaikrrleriksrsvdvlenglrslqlgpvtpsssirnsr[0439]人类apobec‑3d:[0440][0441](斜体:核酸编辑域)[0442]人类apobec‑1:[0443]mtsekgpstgdptlrrriepwefdvfydprelrkeacllyeikwgmsrkiwrssgknttnhvevnfikkftserdfhpsmscsitwflswspcwecsqaireflsrhpgvtlviyvarlfwhmdqqnrqglrdlvnsgvtiqimraseyyhcwrnfvnyppgdeahwpqypplwmmlyalelhciilslppclkisrrwqnhltffrlhlqnchyqtipphillatglihpsvawr[0444]小鼠apobec‑1:[0445]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsvwrhtsqntsnhvevnflekftteryfrpntrcsitwflswspcgecsraiteflsrhpyvtlfiyiarlyhhtdqrnrqglrdlissgvtiqimteqeycycwrnfvnyppsneaywpryphlwvklyvlelyciilglppclkilrrkqpqltfftitlqtchyqripphllwatglk[0446]大鼠apobec‑1:[0447]mssetgpvavdptlrrriephefevffdprelrketcllyeinwggrhsiwrhtsqntnkhvevnfiekftteryfcpntrcsitwflswspcgecsraiteflsryphvtlfiyiarlyhhadprnrqglrdlissgvtiqimteqesgycwrnfvnyspsneahwpryphlwvrlyvlelyciilglppclnilrrkqpqltfftialqschyqrlpphilwatglk[0448]人类apobec‑2:[0449]maqkeeaavateaasqngedlenlddpeklkelielppfeivtgerlpanffkfqfrnveyssgrnktflcyvveaqgkggqvqasrgyledehaaahaeeaffntilpafdpalrynvtwyvssspcaacadriiktlsktknlrllilvgrlfmweepeiqaalkklkeagcklrimkpqdfeyvwqnfveqeegeskafqpwediqenflyyeekladilk[0450]小鼠apobec‑2:[0451]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvvevqskggqaqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0452]大鼠apobec‑2:[0453]maqkeeaaeaaapasqngddlenledpeklkelidlppfeivtgvrlpvnffkfqfrnveyssgrnktflcyvveaqskggqvqatqgyledehagahaeeaffntilpafdpalkynvtwyvssspcaacadrilktlsktknlrllilvsrlfmweepevqaalkklkeagcklrimkpqdfeylwqnfveqeegeskafepwediqenflyyeekladilk[0454]牛类apobec‑2:[0455]maqkeeaaaaaepasqngeevenledpeklkelielppfeivtgerlpahyfkfqfrnveyssgrnktflcyvveaqskggqvqasrgyledehatnhaeeaffnsimptfdpalrymvtwyvssspcaacadrivktlnktknlrllilvgrlfmweepeiqaalrklkeagcrlrimkpqdfeyiwqnfveqeegeskafepwediqenflyyeekladilk[0456]海七鳃鳗cda1(pmcdal):[0457]mtdaeyvrihekldiytfkkqffnnkksvshrcyvlfelkrrgerracfwgyavnkpqsgtergihaeifsirkveeylrdnpgqftinwysswspcadcaekilewynqelrgnghtlkiwacklyyeknarnqiglwnlrdngvglnvmvsehyqccrkifiqsshnqlnenrwlektlkraekrrselsfmiqvkilhttkspav[0458]人类apobec3gd316rd317r:[0459]mkphfrntvermyrdtfsynfynrpilsrrntvwlcyevktkgpsrppldakifrgq[0460]vyselkyhpemrffhwfskwrklhrdqeyevtwyiswspctkctrdmatflaedp[0461]kvtltifvarlyyfwdpdyqealrslcqkrdgpratmkfnydefqhcwskfvysq[0462]relfepwnnlpkyyillhfmlgeilrhsmdpptftfnfnnepwvrgrhetylcyever[0463]mhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtc[0464]ftswspcfscaqemakfiskkhvslciftariyrrqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailqnqen[0465]人类apobec3g链a:[0466]mdpptftfnfnnepwwgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyddqgrcqeglrtlaeagakisftysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[0467]人类apobec3g链ad120rd121r:[0468]mdpptftfnfnnepwvrgrhetylcyevermhndtwvllnqrrgflcnqaphkhgflegrhaelcfldvipfwkldldqdyrvtcftswspcfscaqemakfisknkhvslciftariyrrqgrcqeglrtlaeagakisfmtysefkhcwdtfvdhqgcpfqpwdgldehsqdlsgrlrailq[0469]本申请的一些方面基于以下认识:调节本文所述的任何融合蛋白的脱氨酶结构域催化活性,例如通过在脱氨酶结构域中进行点突变来影响融合蛋白的合成能力(例如,碱基编辑器)。例如,减少但不消除碱基编辑融合蛋白中脱氨酶结构域催化活性的突变可使脱氨酶结构域催化邻近靶残基的残基脱氨的可能性降低,从而缩小了脱氨窗口。缩小脱氨窗口的能力可以防止与特定目标残基相邻的残基发生不希望的脱氨基,这可以减少或防止脱靶效应。[0470]例如,在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含选自rapobec1的h121x、h122x、r126x、r126x、r118x、w90x、w90x和r132x的一个或多个突变,或另一个apobec脱氨酶中的一个或多个相应突变,其中x是任何氨基酸。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含一种或多种选自rapobec1的h121r、h122r、r126a、r126e、r118a、w90a、w90y和r132e的突变,或一种或多种相应的突变。另一个apobec脱氨酶。[0471]在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可以包含一种或多种选自hapobec3g的d316x、d317x、r320x、r320x、r313x、w285x、w285x、r326x或一个或多个对应的突变。另一个apobec脱氨酶中的突变,其中x是任何氨基酸。在一些实施方案中,本文提供的任何融合蛋白包含apobec脱氨酶,其包含选自hapobec3g的d316r、d317r、r320a、r320e、r313a、w285a、w285y、r326e的一个或多个突变,或一个或多个相应突变。在另一个apobec脱氨酶中。[0472]在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含rapobec1的h121r和h122r突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的r126a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的r126e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的r118a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的w90a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的w90y突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的w90y和r126e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可以包含apobec脱氨酶,其包含rapobec1的r126e和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的w90y和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含rapobec1的w90y、r126e和r132e突变,或另一apobec脱氨酶中的一个或多个对应突变。[0473]在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的d316r和d317r突变,或另一apobec脱氨酶中的一个或多个相应突变。在一些实施方案中,本文提供的任何融合蛋白包含apobec脱氨酶,其包含hapobec3g的r320a突变,或另一apobec脱氨酶中的一个或多个相应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的r320e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的r313a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的w285a突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的w285y突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的w285y和r320e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的r320e和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的w285y和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。在一些实施方案中,并入碱基编辑器中的apobec脱氨酶可包含apobec脱氨酶,其包含hapobec3g的w285y、r320e和r326e突变,或另一apobec脱氨酶中的一个或多个对应突变。[0474]许多修饰的胞苷脱氨酶可商购获得,包括但不限于sabe3、sakkh‑be3、vqr‑be3、eqr‑be3、vrer‑be3、ye1‑be3、ee‑be3、ye2‑be3、和yee‑be3、可得自addgene(质粒85169、85170、85171、85172、85173、85174、85175、85176、85177)。[0475]以下提供了根据本申请的方面可以与cas9融合的其他示例性脱氨基酶。应当理解,在一些实施方案中,可以使用相应序列的活性结构域,例如没有定位信号的结构域(核定位序列,没有核输出信号,胞质定位信号)[0476]c到t核碱基编辑蛋白的详细信息在国际pct第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)和komor,ac等人中进行了描述,“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016),其全部内容通过引用结合于此。[0477]a到g编辑[0478]在一些实施方案中,本文所述的碱基编辑器可包含脱氨酶结构域,其包括腺苷脱氨酶。碱基编辑器的这种腺苷脱氨酶结构域可以通过使a脱氨基形成肌苷(i)来促进腺嘌呤(a)核苷碱基向鸟嘌呤(g)核苷碱基的编辑,表现出g的碱基配对特性。腺苷脱氨酶能够脱氧核糖核酸(dna)中的脱氧腺苷残基的腺嘌呤脱氨(即除去胺基)的方法。[0479]在一些实施方案中,可通过将一个或多个蛋白结构域融合在一起,从而产生融合蛋白来制备本文提供的核碱基编辑器。在某些实施方案中,本文提供的融合蛋白包含改善融合蛋白的碱基编辑活性(例如,效率、选择性和特异性)的一种或多种特征。例如,本文提供的融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文提供的融合蛋白可具有不具有核酸酶活性的cas9结构域(dcas9)或切割双链dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。不希望受到任何特定理论的束缚,催化残基(例如,h840)的存在维持了cas9切割含有与靶标a相对的t的未编辑(例如,未脱氨基)链的活性。cas9的催化残基(例如,d10至a10)的“残基”阻止了含有目标a残基的编辑链的切割。此类cas9变体能够基于grna定义的靶序列在特定位置产生单链dna断裂(缺口),从而导致未编辑链的修复,最终导致非编辑的子线。在一些实施方案中,a至g碱基编辑器还包含肌苷碱基切除修复抑制剂,例如尿嘧啶糖基化酶抑制剂(ugi)结构域或催化失活的肌苷特异性核酸酶。不希望受任何特定理论的束缚,ugi结构域或催化失活的肌苷特异性核酸酶可以抑制或阻止脱氨基腺苷残基(例如肌苷)的碱基切除修复,这可以提高碱基编辑器的活性或效率。[0480]包含腺苷脱氨酶的碱基编辑器可以作用于任何多核苷酸,包括dna、rna和dna‑rna杂交体。在某些实施方案中,包含腺苷脱氨酶的碱基编辑器可以使包含rna的多核苷酸的靶标a脱氨基。例如,碱基编辑器可以包含能够使rna多核苷酸和/或dna‑rna杂合多核苷酸的靶a脱氨基的腺苷脱氨酶结构域。在一个实施方案中,并入碱基编辑器中的腺苷脱氨酶包含作用于rna(adar,例如,adar1或adar2)的全部或部分腺苷脱氨酶。在另一个实施方案中,掺入碱基编辑器中的腺苷脱氨酶包含作用于trna(adat)的全部或部分腺苷脱氨酶。包含腺苷脱氨酶结构域的碱基编辑器也能够使dna多核苷酸的a核碱基脱氨基。在一个实施方案中,碱基编辑器的腺苷脱氨酶结构域包含adat的全部或一部分,其包含一个或多个突变,所述突变允许adat将dna中的靶标a脱氨基。例如,碱基编辑器可以包含来自大肠杆菌(ectada)的adat的全部或一部分,其包含以下一个或多个突变:d108n、a106v、d147y、e155v、l84f、h123y、i157f或另一个突变腺苷脱氨酶。[0481]腺苷脱氨酶可以衍生自任何合适的生物。在一些实施方案中,腺苷脱氨酶来自原核生物。在一些实施方案中,腺苷脱氨酶来自细菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌、金黄色葡萄球菌、伤寒沙门氏菌、腐烂希瓦氏菌、流感嗜血杆菌、新月形杆菌或枯草芽孢杆菌。在一些实施方案中,腺苷脱氨酶来自大肠杆菌。在一些实施方案中,腺嘌呤脱氨酶是天然存在的腺苷脱氨酶,其包括与本文提供的任何突变相对应的一个或多个突变(例如,ectada中的突变)。任何同源蛋白质中的相应残基可通过例如序列比对和同源残基的测定来鉴定。可以相应地产生与本文所述的任何突变(例如,在ectada中鉴定的任何突变)相对应的任何天然存在的腺苷脱氨酶中的突变(例如,与ectada具有同源性)。[0482]tada[0483]在特定的实施方案中,tada是国际第pct/us2017/045381号专利申请(wo第2018/027078号国际专利申请)中描述的tada中的任何一种,其通过引用整体并入本文。[0484]在一个实施方案中,本申请的融合蛋白包含与tada7.10连接的野生型tada,其与cas9切口酶连接。在特定实施方案中,融合蛋白包含单个tada7.10结构域(例如,以单体形式提供)。在其他实施方式中,abe7.10编辑器包括能够形成异二聚体的tada7.10和tada(wt)。相关序列如下:[0485]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd(称为“ta”)。[0486]tada7.10:[0487]msevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstd[0488]在一些实施方案中,腺苷脱氨酶包含与本文提供的任何腺苷脱氨酶中列出的任何氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同的氨基酸序列。应当理解,本文提供的腺苷脱氨酶可包括一个或多个突变(例如,本文提供的任何突变)。本申请内容提供了具有一定百分比同一性的任何脱氨酶结构域,加上本文所述的任何突变或其组合。在一些实施方案中,与参考序列或本文提供的任何腺苷脱氨基酶相比,腺苷脱氨酶包含具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个突变的氨基酸序列。在一些实施方案中,与本领域已知或本文所述的任何氨基酸序列相比,腺苷脱氨酶包含具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基。[0489]在一些实施方案中,tada脱氨酶是全长大肠杆菌tada脱氨酶。例如,在某些实施方案中,腺苷脱氨酶包含氨基酸序列:[0490]mrrafitgvfflsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstd。[0491]然而,应当理解,对本领域技术人员而言可用于本申请的另外的腺苷脱氨酶是显而易见的,并且在本申请的范围内。例如,腺苷脱氨酶可以是作用于trna(adat)的腺苷脱氨酶的同源物。非限制性地,示例性adat同源物的氨基酸序列包括以下:[0492]金黄色葡萄球菌tada:[0493]mgshmtndiyfmtlaieeakkaaqlgevpigaiitkddeviarahnlretlqqptahaehiaieraakvlgswrlegctlyvtlepcvmcagtivmsriprvvygaddpkggcsgslmnllqqsnfnhraivdkgvlkeacstllttffknlrankkstn[0494]枯草芽孢杆菌(bacillussubtilis)tada:[0495]mtqdelymkeaikeakkaeekgevpigavlvingeiiarahnlreteqrsiahaeml[0496]videackalgtwrlegatlyvtlepcpmcagavvlsrvekvvfgafdpkggcsgtlmnllqeerfnhqaevvsgvleeecggmlsaffrelrkkkkaarknlse[0497]鼠伤寒沙门氏菌((salmonellatyphimurium,s.typhimurium)tada:[0498]mppafitgvtslsdveldheywmrhaltlakrawderevpvgavlvhnhrvigegwnrpigrhdptahaeimalrqgglvlqnyrlldttlyvtlepcvmcagamvhsrigrvvfgardaktgaagslidvlhhpgmnhrveiiegvlrdecatllsdffrmrrqeikalkkadraegagpav[0499]腐败希瓦氏菌(shewanellaputrefaciens,s.putrefaciens)tada:[0500]mdeywmqvamqmaekaeaagevpvgavlvkdgqqiatgynlsisqhdptahaeilclrsagkklenyrlldatlyitlepcamcagamvhsriarvvygardektgaagtvvnllqhpafnhqvevtsgvlaeacsaqlsrffkrrrdekkalklaqraqqgie[0501]流感嗜血杆菌f3031(haemophilusinfluenzae,h.influenzae)tada:[0502]mdaakvrsefdekmmryaleladkaealgeipvgavlvddarniigegwnlsivqsdptαηaeiialrngakniqnyrllnstlyvtlepctmcagailhsrikrlvfg[0503]asdyktgaigsrfhffddykmnhtleitsgvlaeecsqklstffqkrreekkiekallkslsdk[0504]新月形杆菌(caulobactercrescentus,c.crescentus)tada:[0505]mrtdesedqdhrmmrlaldaaraaaeagetpvgavildpstgeviatagngpiaahdptahaeiaamraaaaklgnyrltdltlvvtlepcamcagaisharigrvvfgadd[0506]pkggavvhgpkffaqptchwrpevtggvladesadllrgffrarrkaki[0507]硫还原泥土杆菌(geobactersulfurreducens,g.sulphurredensens)tada:[0508]msslkktpirddaywmgkaireaakaaardevpigavivrdgavigrghnlregsndpsahaemiairqaarrsanwrltgatlyvtlepclmcmgaiilarlervvfgcydpkggaagslydlsadprlnhqvrlspgvcqeecgtmlsdffrdlrrrkkakatpalfiderkvppep[0509]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含d108x突变,或在另一个腺苷脱氨酶(例如ectada)中包含相应的突变,其中x表示野生型中相应氨基酸以外的任何氨基酸。腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶包含d108g、d108n、d108v、d108a或d108y突变,或另一腺苷脱氨酶中的相应突变。然而,应了解,可类似地比对额外的脱氨酶以鉴定可如本文所提供而突变的同源氨基酸残基。[0510]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a106x突变,或在另一个腺苷脱氨酶(例如ectada)中的相应突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a106v突变,或在另一腺苷脱氨酶中包含相应的突变。[0511]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含e155x突变,或在另一个腺苷脱氨酶中的相应突变,其中x的存在表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含e155d、e155g或e155v突变,或在另一腺苷脱氨酶中的相应突变。[0512]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含d147x突变,或在另一个腺苷脱氨酶中的相应突变,其中x的存在指示野生物中相应氨基酸以外的任何氨基酸。型腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶包含d147y、tada参考序列中的突变或另一种腺苷脱氨酶中的相应突变。[0513]应当理解,可以将本文提供的任何突变(例如,基于tada参考序列)引入其他腺苷脱氨酶(如大肠杆菌tada(ectada))、金黄色葡萄球菌tada(satada)或其他腺苷脱氨酶(例如细菌腺苷脱氨酶)。对于本领域技术人员显而易见的是,可以类似地比对额外的脱氨酶以鉴定可以如本文所提供的突变的同源氨基酸残基。因此,可以在具有同源氨基酸残基的其他腺苷脱氨酶(例如ectada)中进行在tada参考序列中鉴定的任何突变。还应当理解,本文提供的任何突变可以在tada参考序列或另一种腺苷脱氨酶中单独或以任何组合进行。举例来说,腺苷脱氨酶可在tada参考序列中包含d108n、a106v、e155v和/或d147y突变,或在另一腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含以下突变组(突变组由“;”分隔),或在另一腺苷脱氨酶中的相应突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n,a106v和e55v;d108n,a106v和d147y;d108n,e55v和d147y;a106v,e55v和d147y;和d108n,a106v,e55v和d147y。然而,应当理解,可以在腺苷脱氨酶(例如野生型tada或ectada)中进行本文提供的相应突变的任何组合。[0514]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、k110x、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x突变,或另一种腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示任何野生型腺苷脱氨酶中相应氨基酸以外的其他氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e或a56s、e59g、e85k或e85g、m94l、1951、v102a、f104l、a106v、r107c、r107h、r107p、d108g或d108n、d108v或d108a或d108y、k110i、m118k、n127s、a138v、f149y、m151v、r153c、q154l、i156d和/或k157r突变另一个腺苷脱氨酶中的一个或多个相应突变。[0515]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含一个或多个h8x、d108x和/或n127x突变,或在另一个腺苷脱氨酶中的一个或多个相应突变,其中x表示存在任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h8y、d108n和/或n127s突变中的一种或多种,或在另一种腺苷脱氨酶中一种或多种相应的突变。[0516]在一些实施方案中,相对于tada参考序列,腺苷脱氨酶包含1、2、3、4、5或6个突变,其h8x、d108x、n127x、d147x、r152x和q154x、或相应的另一个腺苷脱氨酶中的一个或多个突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在包含1、2、3、4、5、6、7或8个突变,所述突变选自tada参考序列中的h8x、m61x、m70x、d108x、n127x、q154x、e155x和q163x组成的组中或相应突变,或另一种腺苷脱氨酶中的突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8x、d108x、n127x、e155x和t166x,或另一腺苷中的相应突变。脱氨酶,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。[0517]在一些实施方案中,相对于tada参考序列,腺苷脱氨酶包含1、2、3、4、5或6个的突变,所述突变选自h8y、d108n、n127s、d147y、r152c和q154h组成的组,或相应的一个或多个其他腺苷脱氨酶的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含1、2、3、4、5、6、7或8个突变,所述突变选自h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h组成的组,或另一个腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8y、d108n、n127s、e155v和t166p组成的组,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个选自tada参考序列中的h8y、a106t、d108n、n127s、e155d和k161q组成的组,或相应的一个或多个突变,或另一种腺苷脱氨酶中的突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5、6、7或8个突变,所述突变选自在tada参考序列中h8y、r126w、l68q、d108n、n127s、d147y和e155v,或另一个腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8y,d108n,a109t,n127s和e155g组成的组,或另一个腺苷脱氨酶中的相应突变。[0518]在一些实施方案中,腺苷脱氨酶在另一种腺苷脱氨酶中包含一个或多个相应的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含d108n、d108g或d108v突变,或在另一个腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a106v和d108n突变,或在另一腺苷脱氨酶中相应的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含r107c和d108n突变,或在另一个腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h8y、d108n、n127s、d147y和q154h突变,或在另一腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h8y、r24w、d108n、n127s、d147y和e155v突变,或在另一腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含d108n、d147y和e155v突变,或在另一腺苷脱氨酶中相应的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h8y、d108n和n127s突变,或在另一腺苷脱氨酶中相应的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a106v、d108n、d147y和e155v突变,或在另一个腺苷脱氨酶(例如,ectada)中的相应突变。[0519]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a、s2x、h8x、i49x、l84x、h123x、n127x、i156x和/或k160x突变中的一种或多种,或另一种腺苷脱氨酶中的一种或多种相应突变,其中x的存在表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的s2a、h8y、i49f、l84f、h123y、n127s、i156f和/或k160s突变中的一种或多种,或另一种腺苷脱氨酶中的一种或多种相应的突变。[0520]在一些实施方案中,腺苷脱氨酶包含l84x突变腺苷脱氨酶,其中x表示野生型腺苷脱氨酶中除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含l84f突变,或在另一腺苷脱氨酶中包含相应的突变。[0521]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h123x突变,或在另一腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h123y突变,或在另一腺苷脱氨酶中包含相应的突变。[0522]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含i157x突变,或在另一腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含i157f突变,或在另一腺苷脱氨酶中包含相应的突变。[0523]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含1、2、3、4、5、6或7个突变,所述突变选自l84x、a106x、d108x、h123x、d147x、e155x和i156x组成的组,或另一种腺苷脱氨酶中的相应突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个突变,所述突变选自tada参考序列中的s2x、i49x、a106x、d108x、d147x和e155x组成的组,或在另一种腺苷脱氨酶中相应的一个或多个突变,其中x表示野生型腺苷脱氨酶中存在除对应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8x,a106x,d108x,n127x和k160x组成的组,或另一腺苷脱氨酶中的相应突变,其中x表示野生型腺苷脱氨酶中存在相应氨基酸以外的任何氨基酸。[0524]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含1、2、3、4、5、6或7个突变,所述突变选自l84f、a106v、d108n、h123y、d147y、e155v和i156f组成的组,或另一个腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个突变,所述突变选自在tada参考序列中s2a、i49f、a106v、d108n、d147y和e155v组成的组。[0525]在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8y、a106t、d108n、n127s和k160s,或在另一种腺苷脱氨酶中相应的一个或多个突变。[0526]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25x、r26x、r107x、a142x和/或a143x突变中的一种或多种,或另一种腺苷脱氨酶中的一种或多种相应突变,其中x的存在表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s、e25y、r26g、r26n、r26q、r26c、r26l、r26k、r107p、r07k、r107a、r107n、r107w、r107h、r107s、a142n、a142d、a142g、a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或另一种腺苷脱氨酶中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶包含一种或多种本文所述的对应于tada参考序列的突变,或另一种腺苷脱氨酶中的一种或多种相应的突变。[0527]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含e25x突变,或在另一个腺苷脱氨酶中相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的e25m、e25d、e25a、e25r、e25v、e25s或e25y突变,或在另一腺苷脱氨酶中的相应突变。[0528]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的r26x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的r26g、r26n、r26q、r26c、r26l或r26k突变,或在另一腺苷脱氨酶中的相应突变。[0529]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的r107x突变,或在另一腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含r107p、r07k、r107a、r107n、r107w、r107h或r107s突变,或在另一个腺苷脱氨酶中的相应突变。[0530]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的a142x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的a142n,a142d,a142g突变或另一种腺苷脱氨酶中的相应突变。[0531]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的a143x突变,或在另一个腺苷脱氨酶中相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的a143d、a143g、a143e、a143l、a143w、a143m、a143s、a143q和/或a143r突变,或在另一个腺苷脱氨酶中的相应突变。[0532]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的h36x、n37x、p48x、i49x、r51x、m70x、n72x、d77x、e134x、s146x、q154x、k157x和/或k161x突变中的一种或多种,或另一个腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h36l、n37t、n37s、p48t、p48l、i49v、r51h、r51l、m70l、n72s、d77g、e134g、s146r、s146c、q154h、k157n和/或k161t突变中的一种或多种,或另一种腺苷脱氨酶中的一个或多个相应突变。[0533]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h36x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h36l突变,或在另一个腺苷脱氨酶中相应的突变。[0534]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中n37x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中n37t或n37s突变,或在另一腺苷脱氨酶中相应的突变。[0535]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含p48x突变,或在另一个腺苷脱氨酶中相应突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含p48t或p48l突变,或在另一腺苷脱氨酶中相应的突变。[0536]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含r51x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含r51h或r51l突变,或在另一腺苷脱氨酶中相应的突变。[0537]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含s146x突变,或在另一个腺苷脱氨酶中的相应突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含s146r或s146c突变,或在另一腺苷脱氨酶中相应的突变。[0538]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含k157x突变,或在另一个腺苷脱氨酶中的相应突变,其中x表示除野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含k157n突变,或在另一腺苷脱氨酶中相应的突变。[0539]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中的p48x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含p48s、p48t或p48a突变,或在另一腺苷脱氨酶中相应的突变。[0540]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中a142x突变,或在另一个腺苷脱氨酶中的相应突变,其中x表示野生型腺苷中相应氨基酸以外的任何氨基酸。脱氨酶。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中a142n突变,或在另一腺苷脱氨酶中相应的突变。[0541]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中w23x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中w23r或w23l突变,或在另一个腺苷脱氨酶中相应的突变。[0542]在一些实施方案中,腺苷脱氨酶包含在tada参考序列中r152x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含在tada参考序列中r152p或r52h突变,或在另一腺苷脱氨酶中相应的突变。[0543]在一个实施方案中,腺苷脱氨酶可包含突变h36l、r51l、l84f、a106v、d108n、h123y、s146c、d147y、e155v、i156f和k157n。在一些实施方案中,腺苷脱氨酶包含以下相对于tada参考序列的突变组合,其中组合的每个突变用“_”分隔,并且每个突变的组合在括号之间:[0544](a106v_d108n),(r107c_d108n),[0545](h8y_d108n_s127s_d147y_q154h),[0546](h8y_r24w_d108n_n127s_d147y_e155v),(d108n_d147y_e155v),[0547](h8y_d108n_s127s),(h8y_d108n_n127s_d147y_q154h),[0548](a106v_d108n_d147y_e155v),(d108q_d147y_e155v)[0549](d108m_d147y_e155v),(d108l_d147y_e155v),(d108k_d147y_e155v),[0550](d108i_d147y_e155v),[0551](d108f_d147y_e155v),(a106v_d108n_d147y),[0552](a106v_d108m_d147y_e155v),[0553](e59a_a106v_d108n_d147y_e155v),(e59acatdead_a106v_d108n_d147y_e155v),[0554](l84f_a106v_d108n_h123y_d147y_e155v_i156y),[0555](l84f_a106v_d108n_h123y_d147y_e155v_i156f),(d103a_d104n),[0556](g22p_d103a_d104n),(g22p_d103a_d104n_s138a),(d103a_d104n_s138a),[0557](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f),[0558](e25g_r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f),[0559](e25d_r26g_l84f_a106v_r107k_d108n_h123y_a142n_a143g_d147y_e155v_i156f),[0560](r26q_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f),[0561](e25m_r26g_l84f_a106v_r107p_d108n_h123y_a142n_a143d_d147y_e155v_i156f),[0562](r26c_l84f_a106v_r107h_d108n_h123y_a142n_d147y_e155v_i156f),[0563](l84f_a106v_d108n_h123y_a142n_a143l_d147y_e155v_i156f),[0564](r26g_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f),[0565](e25a_r26g_l84f_a106v_r107n_d108n_h123y_a142n_a143e_d147y_e155v_i156f),[0566](r26g_l84f_a106v_r107h_d108n_h123y_a142n_a143d_d147y_e155v_i156f),[0567](a106v_d108n_a142n_d147y_e155v),[0568](r26g_a106v_d108n_a142n_d147y_e155v),[0569](e25d_r26g_a106v_r107k_d108n_a142n_a143g_d147y_e155v),[0570](r26g_a106v_d108n_r107h_a142n_a143d_d147y_e155v),[0571](e25d_r26g_a106v_d108n_a142n_d147y_e155v),[0572](a106v_r107k_d108n_a142n_d147y_e155v),[0573](a106v_d108n_a142n_a143g_d147y_e155v),[0574](a106v_d108n_a142n_a143l_d147y_e155v),[0575](h36l_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0576](n37t_p48t_m70l_l84f_a106v_d108n_h123y_d147y_i49v_e155v_i156f),[0577](n37s_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k161t),[0578](h36l_l84f_a106v_d108n_h123y_d147y_q154h_e155v_i156f),[0579](n72s_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f),[0580](h36l_p48l_l84f_a106v_d108n_h123y_e134g_d147y_e155v_i156f),[0581](h36l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n),[0582](h36l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f),[0583](l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t),[0584](n37s_r51h_d77g_l84f_a106v_d108n_h123y_d147y_e155v_i156f),[0585](r51l_l84f_a106v_d108n_h123y_d147y_e155v_i156f_k157n),[0586](d24g_q71r_l84f_h96l_a106v_d108n_h123y_d147y_e155v_i156f_k160e),[0587](h36l_g67v_l84f_a106v_d108n_h123y_s146t_d147y_e155v_i156f),[0588](q71l_l84f_a106v_d108n_h123y_l137m_a143e_d147y_e155v_i156f),[0589](e25g_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l),[0590](l84f_a91t_f104i_a106v_d108n_h123y_d147y_e155v_i156f),[0591](n72d_l84f_a106v_d108n_h123y_g125a_d147y_e155v_i156f),[0592](p48s_l84f_s97c_a106v_d108n_h123y_d147y_e155v_i156f),[0593](w23g_l84f_a106v_d108n_h123y_d147y_e155v_i156f),[0594](d24g_p48l_q71r_l84f_a106v_d108n_h123y_d147y_e155v_i156f_q159l),[0595](l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f),[0596](h36l_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n),[0597](n37s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_k161t),[0598](l84f_a106v_d108n_d147y_e155v_i156f),[0599](r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k161t),[0600](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k161t),[0601](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e_k161t),[0602](l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n_k160e),[0603](r74ql84f_a106v_d108n_h123y_d147y_e155v_i156f),[0604](r74a_l84f_a106v_d108n_h123y_d147y_e155v_i156f),[0605](l84f_a106v_d108n_h123y_d147y_e155v_i156f),[0606](r74q_l84f_a106v_d108n_h123y_d147y_e155v_i156f),[0607](l84f_r98q_a106v_d108n_h123y_d147y_e155v_i156f),[0608](l84f_a106v_d108n_h123y_r129q_d147y_e155v_i156f),[0609](p48s_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f),[0610](p48s_a142n),[0611](p48t_i49v_l84f_a106v_d108n_h123y_a142n_d147y_e155v_i156f_l157n),[0612](p48t_i49v_a142n),[0613](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0614](h36l_p48s_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f),[0615](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0616](h36l_p48t_i49v_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n),[0617](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0618](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_e155v_i156f_k157n),[0619](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_a142n_d147y_e155v_i156f_k157n),[0620](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0621](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_e155v_i156f_k157n),[0622](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t),[0623](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152h_e155v_i156f_k157n),[0624](h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n),[0625](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n),[0626](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_e155v_i156f_k157n),[0627](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142a_s146c_d147y_r152p_e155v_i156f_k157n),[0628](w23l_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146r_d147y_e155v_i156f_k161t),[0629](w23r_h36l_p48a_r51l_l84f_a106v_d108n_h123y_s146c_d147y_r152p_e155v_i156f_k157n),[0630](h36l_p48a_r51l_l84f_a106v_d108n_h123y_a142n_s146c_d147y_r152p_e155v_i156f_k157n)。[0631]在某些实施方案中,本文提供的融合蛋白包含改善融合蛋白的碱基编辑活性的一种或多种特征。举例来说,本文提供的任何融合蛋白可包含具有降低的核酸酶活性的cas9结构域。在一些实施方案中,本文提供的任何融合蛋白可具有不具有核酸酶活性的cas9结构域(dcas9),或切割双链dna分子的一条链的cas9结构域,称为cas9切口酶(ncas9)。[0632]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含d108x突变,或在另一个腺苷脱氨酶中包含相应的突变,其中x表示野生型中相应氨基酸以外的任何氨基酸。腺苷脱氨酶。在一些实施方案中,腺苷脱氨酶包含d108g、d108n、d108v、d108a或d108y突变,或另一腺苷脱氨酶中的相应突变。[0633]在一些实施方案中,腺苷脱氨酶在tada参考序列中包含a106x、e155x或d147x突变,或在另一个腺苷脱氨酶中的相应突变(例如ectada),其中x表示野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含e155d、e155g或e155v突变。在一些实施方案中,腺苷脱氨酶包含d147y。[0634]应当理解,可以将本文提供的任何突变(例如,基于tada参考序列)引入其他腺苷脱氨酶(如大肠杆菌tada(ectada))、金黄色葡萄球菌tada(satada)或其他腺苷脱氨酶(例如细菌腺苷脱氨酶)。相对于tada参考序列鉴定的任何突变都可以在具有同源氨基酸残基的其他腺苷脱氨酶中进行。还应当理解,相对于tada参考序列或另一种腺苷脱氨酶,本文提供的任何突变可以单独或以任何组合进行。[0635]举例来说,腺苷脱氨酶可在tada参考序列中包含d108n、a106v、e155v和/或d147y突变,或在另一腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含以下突变组(突变组由“;”分隔),或在另一腺苷脱氨酶中的相应突变:d108n和a106v;d108n和e155v;d108n和d147y;a106v和e155v;a106v和d147y;e155v和d147y;d108n,a106v和e55v;d108n,a106v和d147y;d108n,e55v和d147y;a106v,e55v和d147y;和d108n,a106v,e55v和d147y。然而,应当理解,可以在腺苷脱氨酶(例如tada参考序列或ectada)中进行本文提供的相应突变的任何组合。[0636]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、t17x、l18x、w23x、l34x、w45x、r51x、a56x、e59x、e85x、m94x、i95x、v102x、f104x、a106x、r107x、d108x、k110x、m118x、n127x、a138x、f149x、m151x、r153x、q154x、i156x和/或k157x突变,或另一种腺苷脱氨酶中的一个或多个相应突变,其中x的存在表示任何野生型腺苷脱氨酶中相应氨基酸以外的其他氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、t17s、l18e、w23l、l34s、w45l、r51h、a56e或a56s、e59g、e85k或e85g、m94l、1951、v102a、f104l、a106v、r107c、r107h、r107p、d108g或d108n、d108v或d108a或d108y、k110i、m118k、n127s、a138v、f149y、m151v、r153c、q154l、i156d和/或k157r突变另一个腺苷脱氨酶中的一个或多个相应突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含一个或多个h8x、d108x和/或n127x突变,或在另一个腺苷脱氨酶中的一个或多个相应突变,其中x表示存在任何氨基酸。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含h8y、d108n和/或n127s突变中的一种或多种,或在另一种腺苷脱氨酶中一种或多种相应的突变。[0637]在一些实施方案中,腺苷脱氨酶包含tada参考序列中的h8x、r26x、m61x、l68x、m70x、a106x、d108x、a109x、n127x、d147x、r152x、q154x、e155x、k161x、q163x和/或t166x突变中的一种或多种,或另一个腺苷脱氨酶中的一个或多个相应突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包括tada参考序列中的h8y、r26w、m61i、l68q、m70v、a106t、d108n、a109t、n127s、d147y、r152c、q154h或q154r、e155g或e155v或e155d、k161q、q163h和/或t166p突变中的一个或多个,或另一个腺苷脱氨酶中的一个或多个相应突变。[0638]在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个突变,其选自tada参考序列中的h8x、d108x、n127x、d147x、r152x和q154x、或相应的另一个腺苷脱氨酶中的一个或多个突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶在包含1、2、3、4、5、6、7或8个突变,所述突变选自tada参考序列中的h8x、m61x、m70x、d108x、n127x、q154x、e155x和q163x组成的组中或相应突变,或另一种腺苷脱氨酶中的突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8x、d108x、n127x、e155x和t166x,或另一腺苷中的相应突变。脱氨酶,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。[0639]在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个突变,所述突变选自h8x、a106x、d108x,另一个腺苷脱氨酶中的一个或多个突变,其中x表示存在野生型腺苷脱氨酶中相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5、6、7或8个选自以下的突变:h8x、r126x、l68x、d108x、n127x、d147x和e155x,或相应的突变或另一种腺苷脱氨酶的突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8x、d108x、a109x、n127x和e155x,或另一个腺苷脱氨酶中的相应突变,其中x表示野生型腺苷脱氨酶中存在除相应氨基酸以外的任何氨基酸。[0640]在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个的突变,所述突变选自tada参考序列中的h8y、d108n、n127s、d147y、r152c和q154h组成的组,或相应的一个或多个其他腺苷脱氨酶的突变。在一些实施方案中,腺苷脱氨酶在tada参考序列中包含1、2、3、4、5、6、7或8个突变,所述突变选自h8y、m61i、m70v、d108n、n127s、q154r、e155g和q163h组成的组,或另一个腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8y、d108n、n127s、e155v和t166p组成的组,或另一种腺苷脱氨酶中的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5或6个选自tada参考序列中的h8y、a106t、d108n、n127s、e155d和k161q组成的组,或相应的一个或多个突变,或另一种腺苷脱氨酶(例如ectada)中的突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4、5、6、7或8个突变,所述突变选自在tada参考序列中h8y、r126w、l68q、d108n、n127s、d147y和e155v,或另一个腺苷脱氨酶的相应突变。在一些实施方案中,腺苷脱氨酶包含1、2、3、4或5个突变,所述突变选自tada参考序列中的h8y,d108n,a109t,n127s和e155g组成的组,或另一个腺苷脱氨酶(例如ectada)中的相应突变。[0641]可以将本文提供的任何突变和任何其他突变(例如,基于ectada氨基酸序列)引入任何其他腺苷脱氨酶中。本文提供的任何突变均可在tada参考序列或另一种腺苷脱氨酶中单独或以任何组合进行。[0642]a至g核碱基编辑蛋白的详细信息在国际pct申请pct/2017/045381(wo2018/027078)和gaudelli,nmaud等人发表的“无需dna切割即可对基因组dna中的a·t到g·c进行可编程碱基编辑”,nature,551,464‑471(2017)进行了描述,其全部内容通过引用并入本文。[0643]胞苷脱氨酶[0644]在一个实施方案中,本申请的融合蛋白包含胞苷脱氨酶。在一些实施方案中,本文提供的胞苷脱氨酶能够将胞嘧啶或5‑甲基胞嘧啶脱氨为尿嘧啶或胸腺嘧啶。在一些实施方案中,本文提供的胞嘧啶脱氨基酶能够使dna中的胞嘧啶脱氨基。胞苷脱氨酶可以源自任何合适的生物。在一些实施方案中,胞苷脱氨酶是天然存在的胞苷脱氨酶,其包含与本文提供的任何突变相对应的一个或多个突变。本领域技术人员将能够例如通过序列比对和同源残基的确定来鉴定任何同源蛋白中的相应残基。因此,本领域技术人员将能够在与本文所述的任何突变相对应的任何天然存在的胞苷脱氨酶中产生突变。在一些实施方案中,胞苷脱氨酶来自原核生物。在一些实施方案中,胞苷脱氨酶来自细菌。在一些实施方案中,胞苷脱氨酶来自哺乳动物(例如人类)。[0645]在一些实施方案中,胞苷脱氨酶包含的氨基酸序列与本文所示的任何一个胞苷脱氨酶氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同。应当理解,本文提供的胞苷脱氨酶可包括一个或多个突变(例如,本文提供的任何突变)。本申请内容提供具有一定百分比同一性的任何脱氨酶结构域,加上本文所述的任何突变或其组合。在一些实施方案中,胞苷脱氨酶与参考序列或本文提供的任何胞苷脱氨基酶相比,具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、21、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50个或更多个突变的氨基酸序列。在一些实施方案中,胞苷脱氨酶与本领域已知或本文所述的任何氨基酸序列相比,包含具有至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少45、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少160或至少170个相同的连续氨基酸残基。[0646]其他结构域[0647]本文所述的碱基编辑器可包括任何有助于促进多核苷酸的核碱基的编辑、修饰或改变的域。在一些实施方案中,碱基编辑器包含多核苷酸可编程核苷酸结合结构域(例如,cas9)、核苷碱基编辑结构域(例如,脱氨酶结构域)和一个或多个其他结构域。在某些情况下,额外的结构域可以促进碱基编辑器的酶促或催化功能、碱基编辑器的结合功能,或者是可能干扰所需碱基编辑结果的细胞机器抑制剂(例如酶)。在一些实施方案中,碱基编辑器可以包含核酸酶、切口酶、重组酶、脱氨酶、甲基转移酶、甲基化酶、乙酰基酶、乙酰基转移酶、转录激活剂或转录阻遏物结构域。[0648]在一些实施方案中,碱基编辑器可包含尿嘧啶糖基化酶抑制剂(ugi)结构域。ugi结构域可以例如通过抑制由c的脱氨基形成的u向c核碱基的转化来提高包含胞苷脱氨酶结构域的碱基编辑器的效率。在某些情况下,对u:g异源双链dna的存在的细胞dna修复反应可能导致细胞中核碱基编辑效率的降低。在这种情况下,尿嘧啶dna糖基酶(udg)可以催化从细胞dna中去除u,这可以启动碱基切除修复(baseexcisionrepair,ber),主要导致u:g对还原为c:g对。在这种情况下,可以在包含一个或多个结合单链、阻断编辑的碱基、抑制ugi、抑制ber、保护编辑的碱基和/或促进未编辑的链的一个或多个域的碱基编辑器中抑制ber。因此,本申请涵盖了包含ugi结构域的碱基编辑器融合蛋白。[0649]在一些实施方案中,碱基编辑器包含全部或部分双链断裂(dsb)结合蛋白作为结构域。例如,dsb结合蛋白可以包括噬菌体mu的gam蛋白,其可以结合到dsb的末端并可以保护它们免于降解。参见komor,ac等人发表的“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”,scienceadvances3:eaao4774(2017),全文其内容通过引用合并于此。[0650]在一些实施方案中,碱基编辑器可包含全部或一部分核酸聚合酶(nap)作为域。例如,碱基编辑器可以包含真核nap的全部或一部分。在一些实施方案中,掺入碱基编辑器中的nap或其部分是dna聚合酶。在一些实施方案中,并入碱基编辑器中的nap或其部分具有跨病变聚合酶活性。在某些情况下,掺入碱基编辑器中的nap或其部分是转病dna聚合酶。在一些实施方案中,并入碱基编辑器中的nap或其部分是rev7、rev1复合物、聚合酶ι、聚合酶κ或聚合酶η。在一些实施方案中,并入碱基编辑器中的nap或其部分是真核聚合酶α、β、γ、δ、ε、γ、η、ι、κ、λ、μ或ν组分。在一些实施方案中,掺入碱基编辑器中的nap或其部分包含与核酸聚合酶(例如,转损dna聚合酶)至少75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%相同的氨基酸序列。[0651]碱基编辑器系统[0652]本文提供的碱基编辑器系统包括以下步骤:(a)使受试者的多核苷酸(例如,双链dna或rna、单链dna或rna)的靶核苷酸序列与碱基接触。编辑器系统,其包含核碱基编辑器(例如,腺苷碱基编辑器或胞苷碱基编辑器)和指导多核酸(例如,grna),其中所述靶核苷酸序列包含靶核碱基对;(b)诱导靶区域的链分离;(c)将靶区域的单链中的靶核碱基对的第一核碱基转化为第二核碱基;(d)切割不超过靶区域的一条链,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基替代。应当理解,在一些实施例中,步骤(b)被省略。在一些实施方案中,靶向核碱基对是一个或多个基因中的多个核碱基对。在一些实施方案中,本文提供的碱基编辑器系统能够对一个或多个基因中的多个核碱基对进行多重编辑。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,多个核碱基对位于一个或多个基因中,其中至少一个基因位于不同的基因座中。[0653]在一些实施方案中,切割的单链(带切口的链)与指导核酸杂交。在一些实施方案中,切割的单链与包含第一核碱基的链相反。在一些实施例中,碱基编辑器包括cas9域。在一些实施方式中,第一碱基是腺嘌呤,而第二碱基不是g、c、a或t。在一些实施方式中,第二碱基是肌苷。[0654]如本文所提供的碱基编辑系统提供了一种新的基因组编辑方法,其使用融合蛋白,所述融合蛋白包含催化缺陷的化脓性链球菌cas9、胞苷脱氨酶和碱基切除修复抑制剂以诱导可编程的单核苷酸(c→t或a→g)dna的变化而不会产生双链dna断裂,不需要供体dna模板,也不会引起过多的随机插入和缺失。[0655]本文提供用于使用碱基编辑器系统编辑核碱基的系统、组合物和方法。在一些实施方案中,碱基编辑器系统包括(1)碱基编辑器(be),其包含多核苷酸可编程核苷酸结合域和用于编辑核碱基的核碱基编辑结构域(例如,脱氨酶域);(2)指导多核苷酸(例如,指导rna)与多核苷酸可编程核苷酸结合结构域结合。在一些实施方案中,碱基编辑器系统包括胞嘧啶碱基编辑器(cbe)。在一些实施例中,碱基编辑器系统包括腺苷碱基编辑器(abe)。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程dna结合结构域。在一些实施方案中,多核苷酸可编程核苷酸结合结构域是多核苷酸可编程rna结合结构域。在一些实施方案中,核碱基编辑结构域是脱氨酶结构域。在某些情况下,脱氨酶结构域可以是胞嘧啶脱氨酶或胞苷脱氨酶。在一些实施方案中,术语“胞嘧啶脱氨酶”和“胞苷脱氨酶”可以互换使用。在某些情况下,脱氨酶结构域可以是腺嘌呤脱氨酶或腺苷脱氨酶。在一些实施方案中,术语“腺嘌呤脱氨酶”和“腺苷脱氨酶”可以互换使用。核碱基编辑蛋白的细节在国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和国际第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中进行了描述,将其全部内容通过引用并入本文。另请参阅komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),全文其内容通过引用合并于此。在一些实施方案中,碱基编辑器禁止编辑的链的碱基切除修复。在一些实施方案中,碱基编辑者保护或结合未编辑的链。在一些实施例中,碱基编辑器包括ugi活动。在一些实施方案中,碱基编辑器包含催化失活的肌苷特异性核酸酶。在一些实施例中,碱基编辑器包括切口酶活性。在一些实施方案中,碱基对的预期编辑在pam位点的上游。在一些实施方案中,碱基对的预期编辑是pam位点上游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施方案中,碱基对的预期编辑在pam位点的下游。在一些实施例中,预期的经编辑的碱基对是pam位点下游的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20核苷酸。[0656]在一些实施例中,所述方法不需要典型(例如,ngg)pam位点。在一些实施方案中,核碱基编辑器包含接头或间隔子。在一些实施方案中,接头或间隔区的长度为1至25个氨基酸。在一些实施方案中,接头或间隔区的长度是5至20个氨基酸。在一些实施方案中,接头或间隔区的长度为10、11、12、13、14、15、16、17、18、19或20个氨基酸。[0657]在一些实施方案中,靶标区域包括靶标窗口,其中所述靶标窗口包括靶标核碱基对。在一些实施方案中,靶标窗口包含1至10个核苷酸。在一些实施方案中,靶窗口是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。在一些实施例中,碱基对的预期编辑在目标窗口内。在一些实施例中,目标窗口包括碱基对的预期编辑。在一些实施例中,使用本文提供的任何碱基编辑器来执行所述方法。在一些实施例中,目标窗口是脱氨窗口。[0658]在一些实施方案中,碱基编辑器是胞苷碱基编辑器(cbe)。在一些实施方案中,非限制性的示例性cbe是be1(apobec1‑xten‑dcas9)、be2(apobec1‑xten‑dcas9‑ugi)、be3(apobec1‑xten‑dcas9(a840h)‑ugi)、be3‑gam、sabe3、sabe4‑gam、be4、be4‑gam、sabe4或sab4e‑gam。be4将apobec1‑cas9n(d10a)接头延伸至32个氨基酸,将cas9n‑ugi接头延伸至9个氨基酸,并将ugi的第二个副本附加至所述构建体的c末端,并将另外9个氨基酸接头附加到一个碱基编辑器中构造。碱基编辑器sabe3和sabe4将化脓性链球菌cas9n(d10a)替换为较小的金黄色葡萄球菌cas9n(d10a)。be3‑gam、sabe3‑gam、be4‑gam和sabe4‑gam具有174个残基,通过16个氨基酸xten接头与be3、sabe3、be4和sabe4的n端融合。[0659]在一些实施例中,碱基编辑器是腺苷碱基编辑器(abe)。在一些实施方案中,腺苷碱基编辑器可以使dna中的腺嘌呤脱氨基。在一些实施方案中,通过用天然或工程改造的大肠杆菌tada、人类adar2、小鼠ada或人类adat2代替be3的apobec1组分来产生abe。在一些实施方案中,abe包含进化的tada变体。在一些实施方案中,abe是abe1.2(tada*‑xten‑ncas9‑nls)。在一些实施方案中,tada*包含a106v和d108n突变。[0660]在一些实施例中,abe是第二代abe。在一些实施方案中,abe是abe2.1,其在tada*(tada*2.1)中包含另外的突变d147y和e155v。在一些实施方案中,abe是与人类烷基腺嘌呤dna糖基化酶(具有e125q突变的aag)的催化失活形式融合的abe2.2、abe2.1。在一些实施方案中,所述abe是与催化灭活的大肠杆菌endov(被d35a突变灭活)的abe2.3、abe2.1融合。在一些实施方案中,abe是abe2.6,其具有比abe2.1中的接头长两倍的接头(32个氨基酸,(sggs)2‑xten‑(sggs)2)。在一些实施方案中,abe是abe2.7,其是与另外的野生型tada单体束缚的abe2.1。在一些实施方案中,abe是abe2.8,其是与另外的tada*2.1单体束缚的abe2.1。在一些实施方案中,abe是abe2.9,其是进化的tada(tada*2.1)与abe2.1的n末端的直接融合。在一些实施方案中,abe是abe2.10,其是野生型tada与abe2.1的n‑末端的直接融合。在一些实施方案中,abe是abe2.11,其是在tada*单体的n末端具有失活的e59a突变的abe2.9。在一些实施方案中,abe是abe2.12,其是在内部tada*单体中具有失活的e59a突变的abe2.9。[0661]在一些实施例中,abe是第三代abe。在一些实施方案中,abe是abe3.1,其是具有三个另外的tada突变(l84f、h123y和i157f)的abe2.3。[0662]在一些实施例中,abe是第四代abe。在一些实施方案中,abe是abe4.3,其是具有额外的tada突变a142n(tada*4.3)的abe3.1。[0663]在一些实施例中,abe是第五代abe。在一些实施方案中,abe是abe5.1,其通过将来自存活克隆(h36l、r51l、s146c和k157n)的共有突变集合导入abe3.1中而产生。在一些实施方案中,abe是abe5.3,其具有包含与内部进化的tada*融合的野生型大肠杆菌tada的异二聚体构建体。在一些实施方案中,abe是abe5.2、abe5.4、abe5.5、abe5.6、abe5.7、abe5.8、abe5.9、abe5.10、abe5.11、abe5.12、abe5.13或abe5.14,如下表2所示。在某些实施例中,abe是第六代abe。在一些实施例中,abe是abe6.1、abe6.2、abe6.3、abe6.4、abe6.5或abe6.6,如下表2所示。在一些实施例中,abe是第七代abe。在一些实施方案中,abe为abe7.1、abe7.2、abe7.3、abe7.4、abe7.5、abe7.6、abe7.7、abe7.8、abe7.9或abe7.10在下面的表2。[0664]表2.abe的基因型[0665][0666][0667][0668]在一些实施方案中,碱基编辑器是融合蛋白,其包含与核碱基编辑结构域(例如,脱氨酶域的全部或一部分)融合的多核苷酸可编程核苷酸结合域(例如,cas9衍生的域)。在一些实施方案中,碱基编辑器还包含包含全部或部分尿嘧啶糖基化酶抑制剂(ugi)的结构域。在一些实施方案中,碱基编辑器包含包含尿嘧啶结合蛋白(ubp)例如尿嘧啶dna糖基化酶(udg)的全部或一部分的结构域。在一些实施方案中,碱基编辑器包含包含全部或部分核酸聚合酶的结构域。在一些实施方案中,掺入碱基编辑器中的核酸聚合酶或其部分是绕道(translesion)dna聚合酶。[0669]在一些实施例中,碱基编辑器的域可以包括多个域。例如,包含衍生自cas9的多核苷酸可编程核苷酸结合结构域的碱基编辑器可以包含rec叶和对应于野生型或天然cas9的rec叶和nuc叶的rec叶和nuc叶。在另一个示例中,碱基编辑器可以包括ruvci域、bh域、rec1域、rec2域、ruvcii域、l1域、hnh域、l2域、ruvciii域、wed域、topo域或ctd域中的一个或多个。在一些实施方案中,碱基编辑器的一个或多个结构域包含相对于包含所述结构域的多肽的野生型版本的突变(例如,取代、插入、缺失)。举例来说,多核苷酸可编程dna结合结构域的hnh结构域可包含h840a取代。在另一个实例中,多核苷酸可编程dna结合结构域的ruvci结构域可包含d10a取代。[0670]本文公开的碱基编辑器的不同域(例如,相邻域)可以在使用或不使用一个或多个接头域(例如,xten接头域)的情况下彼此连接。在一些情况下,接头结构域可以是键(例如,共价键)、化学基团或连接两个分子或部分的分子,例如融合蛋白的两个结构域,例如第一结构域(例如,cas9衍生的结构域)和第二结构域(例如胞苷脱氨酶结构域或腺苷脱氨酶结构域)。在一些实施方案中,连接基为共价键(例如,碳‑碳键、二硫键、碳‑杂原子键等)。在某些实施方案中,连接基是酰胺键的碳氮键。在某些实施方案中,接头是环状或无环的、取代或未取代的、支链或直链的脂族或杂脂族接头。在某些实施方案中,接头是聚合物的(例如,聚乙烯、聚乙二醇、聚酰胺、聚酯等)。在某些实施方案中,连接基包含氨基链烷酸的单体、二聚体或聚合物。在一些实施方案中,连接基包含氨基链烷酸(例如,甘氨酸、乙酸、丙氨酸、β‑丙氨酸、3‑氨基丙酸、4‑氨基丁酸、5‑戊酸等)。在一些实施方案中,接头包含氨基己酸(ahx)的单体、二聚体或聚合物。在某些实施方案中,连接基基于碳环部分(例如环戊烷、环己烷)。在其他实施方案中,接头包含聚乙二醇部分(peg)。在某些实施方案中,连接基包含芳基或杂芳基部分。在某些实施方案中,连接基基于苯环。接头可以包括官能化的部分,以促进亲核试剂(例如硫醇、氨基)从肽到接头的连接。任何亲电子试剂都可以用作接头的一部分。示例性的亲电试剂包括但不限于活化的酯、活化的酰胺、迈克尔受体、烷基卤化物、芳基卤化物、酰基卤化物和异硫氰酸酯。在一些实施方案中,连接子连接rna可编程核酸酶的grna结合结构域,包括cas9核酸酶结构域,以及核酸编辑蛋白的催化结构域。在一些实施方案中,接头连接dcas9和第二结构域(例如胞苷脱氨酶、ugi等)。[0671]通常,连接子位于两个基团、分子或其他部分之间或在两个基团、分子或其他部分的侧面,并通过共价键连接至每个,从而将两者连接。在一些实施方案中,接头是氨基酸或多个氨基酸(例如,肽或蛋白质)。在一些实施方案中,连接基是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度为2至100个氨基酸,例如长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30至35、35至40、40至45、45至50、50至60、60至70、70至80、80至90、90至100、100至150或150至200个氨基酸。在一些实施方案中,接头长度为约3至约104个氨基酸(例如长度为5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、65、70、75、80、85、90、95或100个氨基酸)。也可以考虑更长或更短的接头。在一些实施方案中,接头结构域包含氨基酸序列sgsetpgtsesatpes,其也可以称为xten接头。可以使用任何用于连接融合蛋白结构域的方法(例如,从形式非常灵活的接头(sggs)n、(gggs)n、(ggggs)n和(g)n到形式更刚性的接头(eaaak)n、(ggs)n、sgsetpgtsesatpes(例如参见guilingerjp、thompsondb、liudr发表的“fusionofcatalyticallyinactivecas9tofokinucleaseimprovesthespecificityofgenomemodification”,nat.biotechnol.2014;32(6):577‑82;全部内容通过引用并入本文)或(xp)n基序,或这些的任何组合,以实现核碱基编辑器活性的最佳长度,其中n独立为整数在一些实施方案中,n为1、2、3、4、5、6、7、8、9、10、11、12、13、14或15,其中x为任何氨基酸。在一些实施方案中,接头包含(ggs)n基序,其中n为1、3或7。在一些实施方案中,本文提供的融合蛋白的cas9结构域通过含氨基酸序列sgsetpgtsesatpes的接头进行融合。在一些实施方案中,接头包含多个脯氨酸残基,并且长度为5‑21、5‑14、5‑9、5‑7个氨基酸,例如papap、papapa、papapap、papapapa、p(ap)4、p(ap)7、p(ap)10(例如,参见tanj,zhangf,karcherd,bockr.在2019年1月25日发表的“engineeringofhigh‑precisionbaseeditorsforsite‑specificsinglenucleotidereplacement.”.natcommun.;10(1):439;全部内容通过引用并入本文。这种富含脯氨酸的接头也被称为“刚性”接头。[0672]本申请的融合蛋白包含核酸编辑结构域。在一些实施方案中,核酸编辑域可以催化c到u碱基的改变。在一些实施方案中,核酸编辑结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶或腺苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白bmrna编辑复合体(apobec)家族脱氨酶。在一些实施方案中,脱氨酶是apobec1脱氨酶。在一些实施方案中,脱氨酶是apobec2脱氨酶。在一些实施方案中,脱氨酶是apobec3脱氨酶。在一些实施方案中,脱氨酶是apobec3a脱氨酶。在一些实施方案中,脱氨酶是apobec3b脱氨酶。在一些实施方案中,脱氨酶是apobec3c脱氨酶。在一些实施方案中,脱氨酶是apobec3d脱氨酶。在一些实施方案中,脱氨酶是apobec3e脱氨酶。在一些实施方案中,脱氨酶是apobec3f脱氨酶。在一些实施方案中,脱氨酶是apobec3g脱氨酶。在一些实施方案中,脱氨酶是apobec3h脱氨酶。在一些实施方案中,脱氨酶是apobec4脱氨酶。在一些实施方案中,脱氨酶是激活诱导的脱氨酶(aid)。在一些实施方案中,脱氨酶是脊椎动物脱氨酶。在一些实施方案中,脱氨酶是无脊椎动物脱氨酶。在一些实施方案中,脱氨酶是人、黑猩猩、大猩猩、猴子、牛、狗、大鼠或小鼠的脱氨酶。在一些实施方案中,脱氨酶是人脱氨酶。在一些实施方案中,脱氨酶是大鼠脱氨酶,例如rapobec1。在一些实施方案中,脱氨酶是马油双胞胎胞嘧啶核苷脱氨酶1(pmcda1)。在一些实施方案中,脱氨酶是人apobec3g。在一些实施方案中,脱氨酶是人apobec3g的片段。在一些实施方案中,脱氨酶是包含d316rd317r突变的人apobec3g变体。在一些实施方案中,脱氨酶是人apobec3g的片段,并且包含对应于d316rd317r突变的突变。在一些实施方案中,核酸编辑结构域与本文所述的任何脱氨酶的脱氨酶结构域具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的同一性。[0673]具有指导rna的cas9复合物[0674]本申请的一些方面提供了复合物,其包含本文提供的任何融合蛋白和指导rna(例如,靶向具有rtt可靶向突变的mecp2等位基因的指导)。[0675]在一些实施方案中,指导核酸(例如,指导rna)长为15‑100个核苷酸,并且包含与靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,指导rna是15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35,36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸长。在一些实施方案中,指导rna包含与靶序列互补的15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34,35、36、37、38、39或40个的连续核苷酸的序列。在一些实施方案中,靶序列是dna序列。在一些实施方案中,靶序列是细菌、酵母、真菌、昆虫、植物或动物的基因组中的序列。在一些实施方案中,靶序列是人基因组中的序列。在一些实施方案中,靶序列的3'末端紧邻典型pam序列(ngg)。在一些实施方案中,靶序列的3'末端紧邻非典型pam序列(例如,表1或5'‑naa‑3'中列出的序列)。在一些实施方案中,指导核酸(例如,指导rna)与带有rtt可靶向突变的mecp2等位基因中的序列互补。[0676]本申请的一些方面提供了使用本文提供的融合蛋白或复合物的方法。例如,本申请的一些方面提供了包括使dna分子与本文提供的任何融合蛋白以及至少一个指导rna接触的方法,其中所述指导rna长约15‑100个核苷酸,并且包含至少一个序列。与靶序列互补的10个连续核苷酸。在一些实施方案中,靶序列的3'末端紧邻agc、gag、ttt、gtg或caa序列。在一些实施方案中,靶序列的3′末端紧邻nga、ngcg、ngn、nngrrt、nnnrrt、ngcg、ngcn、ngtn、ngtn、ngtn或5’(tttv)序列。[0677]应该理解的是,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如在成熟蛋白的前体和成熟蛋白本身中,编号之间的差异可能会影响编号。本领域技术人员将能够通过本领域公知的方法,例如通过序列比对和同源残基的确定,来鉴定任何同源蛋白和各自编码核酸中的各自残基。[0678]对于本领域技术人员而言显而易见的是,为了将本文公开的任何融合蛋白靶向至靶位点,例如包含待编辑的突变的位点,通常必须共同与指导rna一起表达融合蛋白。如本文其他地方更详细地解释的,指导rna通常包含允许cas9结合的tracrrna框架和指导序列,其赋予cas9:核酸编辑酶/结构域融合蛋白序列特异性。备选地,指导rna和tracrrna可以作为两个核酸分子分开提供。在一些实施方案中,指导rna包含结构,其中指导序列包含与靶序列互补的序列。指导序列通常为20个核苷酸长。基于本申请内容,用于将cas9:核酸编辑酶/结构域融合蛋白靶向特定基因组靶位点的合适的指导rna的序列对于本领域技术人员是显而易见的。此类合适的指导rna序列通常包含与待编辑靶核苷酸上游或下游50个核苷酸内的核酸序列互补的指导序列。本文提供了一些适用于将任何提供的融合蛋白靶向特定靶序列的示例性指导rna序列。[0679]本文公开的碱基编辑器的域可以以任何序列排列。包含如下融合蛋白的碱基编辑器的非限制性实例可以如下排列:所述融合蛋白包含例如多核苷酸可编程核苷酸结合结构域和脱氨酶结构域:[0680]nh2‑[核碱基编辑域]‑接头1‑[例如,cas9衍生域]‑cooh;[0681]nh2‑[例如,腺苷脱氨酶]‑接头1‑[例如,cas9衍生域]‑cooh;[0682]nh2‑[例如,腺苷脱氨酶]‑接头1‑[例如,cas9衍生域]‑接头2‑[ugi]‑cooh;[0683]nh2‑[例如,tada7.10]‑接头1‑[例如,cas9衍生域]‑cooh;[0684]nh2‑[例如,腺苷脱氨酶]‑接头1‑[例如,cas9衍生域]‑cooh;[0685]nh2‑[例如,tada7.10]‑接头1‑[例如,cas9衍生域]‑cooh;[0686]nh2‑[例如,tada7.10]‑接头1‑[例如,cas9衍生域]‑接头2‑[ugi]‑cooh[0687]nh2‑[例如,腺苷脱氨酶]‑[例如,cas9衍生域]‑cooh;[0688]nh2‑[例如,cas9衍生域]‑[例如,腺苷脱氨酶]‑cooh;[0689]nh2‑[例如,腺苷脱氨酶]‑[例如,cas9衍生域]‑[肌苷ber抑制剂]‑cooh;[0690]nh2‑[例如,腺苷脱氨酶]‑[肌苷ber抑制剂]‑[例如,cas9衍生域]‑cooh;[0691]nh2‑[肌苷ber抑制剂]‑[例如,腺苷脱氨酶]‑[例如,cas9衍生域]‑cooh;[0692]nh2‑[例如,cas9衍生域]‑[例如,腺苷脱氨酶]‑[肌苷ber抑制剂]‑cooh;[0693]nh2‑[例如,cas9衍生域]‑[肌苷ber抑制剂]‑[例如,腺苷脱氨酶]‑cooh;or[0694]nh2‑[肌苷ber抑制剂]‑[例如,cas9衍生域]‑[例如,腺苷脱氨酶]‑cooh。[0695]另外,在某些情况下,gam蛋白可以与碱基编辑器的n末端融合。在某些情况下,gam蛋白可以融合到碱基编辑器的c末端。噬菌体mu的gam蛋白可以结合到双链断裂(dsb)的末端,并保护其免于降解。在一些实施方案中,使用gam结合dsb的自由端可以减少碱基编辑过程中插入缺失的形成。在一些实施方案中,将174个残基的gam蛋白融合至碱基编辑器的n末端。参见komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017)。在某些情况下,一个或多个突变可以改变碱基编辑域相对于野生型域的长度。例如,在至少一个结构域中至少一个氨基酸的缺失可以减少碱基编辑器的长度。在另一种情况下,一个或多个突变不改变相对于野生型结构域的结构域的长度。例如,任何域中的替换都不会更改碱基编辑器的长度。这些碱基编辑器的非限制性示例(其中所有域的长度均与野生型域相同)可以包括:[0696]nh2‑[apobec1]‑接头1‑[cas9(d10a)]‑接头2‑[ugi]‑cooh;[0697]nh2‑[cda1]‑接头1‑[cas9(d10a)]‑接头2‑[ugi]‑cooh;[0698]nh2‑[aid]‑接头1‑[cas9(d10a)]‑接头2‑[ugi]‑cooh;[0699]nh2‑[apobec1]‑接头1‑[cas9(d10a)]‑接头2‑[ssb]‑cooh;[0700]nh2‑[ugi]‑接头1‑[abobec1]‑接头2‑[cas9(d10a)]‑cooh;[0701]nh2‑[apobec1]‑接头1‑[cas9(d10a)]‑接头2‑[ugi]‑接头3‑[ugi]‑cooh;[0702]nh2‑[cas9(d10a)]‑接头1‑[cda1]‑接头2‑[ugi]‑cooh;[0703]nh2‑[gam]‑接头1‑[apobec1]‑接头2‑[cas9(d10a)]‑接头3‑[ugi]‑cooh;[0704]nh2‑[gam]‑接头1‑[apobec1]‑接头2‑[cas9(d10a)]‑接头3‑[ugi]‑接头4‑[ugi]‑cooh;[0705]nh2‑[apobec1]‑接头1‑[dcas9(d10a,h840a)]‑接头2‑[ugi]‑cooh;or[0706]nh2‑[apobec1]‑接头1‑[dcas9(d10a,h840a)]‑cooh。[0707]在一些实施方案中,本文提供的碱基编辑融合蛋白需要定位在精确的位置,例如,靶碱基被放置在限定的区域内(例如,“脱氨窗口”)。在某些情况下,目标可以在4个碱基区域内。在某些情况下,这样定义的目标区域可以在pam上游约15个碱基处。参见komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),全文其内容通过引用合并于此。[0708]定义的目标区域可以是脱氨窗口。脱氨基窗口可以是碱基编辑器作用于靶核苷酸并使其脱氨基的定义区域。在一些实施例中,脱氨窗在2、3、4、5、6、7、8、9或10个碱基区域内。在一些实施例中,脱氨窗为在pam的上游5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25碱基。[0709]本申请的碱基编辑器可包含任何结构域、特征或氨基酸序列,其有助于靶多核苷酸序列的编辑。例如,在一些实施例中,碱基编辑器包括核定位序列(nls)。在一些实施方案中,碱基编辑器的nls位于脱氨酶结构域和多核苷酸可编程核苷酸结合结构域之间。在一些实施方案中,碱基编辑器的nls位于c端至多核苷酸可编程核苷酸结合结构域。[0710]如本文公开的,可存在于碱基编辑器中的其他示例性特征是定位序列,例如细胞质定位序列、输出序列,例如核输出序列或其他定位序列,以及可用于融合蛋白的增溶、纯化或检测。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(bccp)标签、myc标签、钙调蛋白标签、flag标签、血凝素(ha)标签、多组氨酸标签(也称为组氨酸标签或his标签)、麦芽糖结合蛋白(mbp)标签、nus标签、谷胱甘肽s‑转移酶(gst)标签、绿色荧光蛋白(gfp)标签、硫氧还蛋白标签、s标签、软标签(例如,软标签1、软标签3)、链球菌标签、生物素连接酶标签,flash标签、v5标签和sbp标签。对于本领域技术人员而言,其他合适的序列是显而易见的。在一些实施方案中,融合蛋白包含一个或多个his标签。[0711]可包含在融合蛋白中的蛋白质结构域的非限制性实例包括脱氨酶结构域(例如胞苷脱氨酶和/或腺苷脱氨酶)、尿嘧啶糖基化酶抑制剂(ugi)结构域、表位标签、报导基因序列、和/或具有以下一种或多种活性的蛋白质结构域:甲基酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、rna裂解活性和核酸结合活性。其他域可以是异源功能域。这样的异源功能域可以赋予功能活性,例如dna甲基化、dna损伤、dna修复、与靶dna相关的靶多肽(例如组蛋白,dna结合蛋白等)的修饰,导致例如,组蛋白甲基化、组蛋白乙酰化、组蛋白泛素化等。[0712]赋予的其他功能可以包括甲基转移酶活性、脱甲基酶活性、脱氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光解酶活性或糖基化酶活性、乙酰基转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、去烯基化活性、sumo化化活性、脱sumo化化活性、核糖基化活性、去核糖基化活性、肉豆蔻酰基化活性、重塑活性蛋白酶活性、氧化还原酶活性、转移酶活性、水解酶活性、裂解酶活性、异构酶活性、合酶活性、合成酶活性和脱豆基甲酰化活性或其任何组合。[0713]表位标签的非限制性实例包括组氨酸(his)标签、v5标签、flag标签、流感血凝素(ha)标签、myc标签、vsv‑g标签和硫氧还蛋白(trx)标签。报导基因的例子包括但不限于谷胱甘肽‑5‑转移酶(gst)、辣根过氧化物酶(hrp)、氯霉素乙酰基转移酶(cat)β‑半乳糖苷酶、β‑葡糖醛酸糖苷酶、荧光素酶、绿色荧光蛋白(gfp)、hcred、dsred、青色荧光蛋白(cfp)、黄色荧光蛋白(yfp)和包括蓝色荧光蛋白(bfp)的自发荧光蛋白。其他蛋白质序列可包括结合dna分子或结合其他细胞分子的氨基酸序列,包括但不限于麦芽糖结合蛋白(mbp)、s标签、lexadna结合域(dbd)融合物、gal4dna结合域融合物、和单纯疱疹病毒(hsv)bp16蛋白融合体。[0714]碱基编辑效率[0715]crispr‑cas9核酸酶已被广泛用于介导靶向基因组编辑。在大多数基因组编辑应用中,cas9与指导多核苷酸(例如单链指导rna(sgrna))形成复合物,并在由sgrna序列指定的靶位点诱导双链dna断裂(dsb)。细胞主要通过非同源末端连接(nhej)修复途径对dsb作出反应,这会导致随机插入或缺失(indels),从而导致移码突变破坏基因。在存在与dsb侧翼具有高度同源性的供体dna模板的情况下,可以通过称为同源引导修复(hdr)的另一种途径实现基因校正。不幸的是,在大多数非摄动条件下,hdr效率低下,取决于细胞状态和细胞类型,并以更大频率的插入/缺失为主导。由于与人类疾病相关的大多数已知遗传变异都是点突变,因此需要能够更有效,更干净地进行精确点突变的方法。本文提供的碱基编辑系统提供了一种新的编辑基因组编辑的方式,而不会产生双链dna断裂,不需要供体dna模板,并且不会引起过多的随机插入和缺失。[0716]本文提供的碱基编辑器能够修饰特定的核苷酸碱基而不会产生显著比例的插入缺失。如本文所用,术语“插入/缺失”是指核酸内核苷酸碱基的插入或缺失。此类插入或缺失可导致基因编码区内的移码突变。在一些实施方案中,期望产生有效地修饰(例如,突变或脱氨基)核酸内的特定核苷酸而不在靶核苷酸序列中产生大量插入或缺失(即,插入缺失)的碱基编辑器。在某些实施方案中,与插入缺失相比,本文提供的任何碱基编辑器能够产生更大比例的预期修饰(例如,点突变或脱氨基)。[0717]在一些实施例中,本文提供的任何碱基编辑器系统导致在靶多核苷酸序列中小于50%、小于40%、小于30%、小于20%、小于19%、小于18%、小于17%、小于16%、小于15%、小于14%、小于13%、小于12%、小于11%、小于10%、小于9%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%、小于1%、小于0.9%、小于0.8%、小于0.7%、小于0.6%、小于0.5%、小于0.4%、小于0.3%、小于0.2%、小于0.1%、小于0.09%、小于0.08%、小于0.07%、小于0.06%、小于0.05%、小于0.04%、小于0.03%、小于0.02%或小于0.01%的插入缺失形成。[0718]本申请的一些方面是基于这样的认识,即本文提供的任何碱基编辑器均能够在核酸(例如dna的基因组内的核酸)中有效产生预期的突变(例如点突变),而不会产生大量的意外突变(例如意外的点突变)。[0719]在一些实施方案中,本文提供的任何碱基编辑器均能够产生至少0.01%的预期突变(即,至少0.01%的碱基编辑效率)。在一些实施例中,本文提供的任何碱基编辑器均能够产生至少0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%或99%的预期突变。[0720]在一些实施方案中,本文提供的碱基编辑器能够产生预期的点突变与插入缺失的比率大于1:1。在一些实施方案中,本文提供的碱基编辑器能够产生预期的点突变与插入缺失的比率为至少1.5∶1、至少2∶1、至少2.5∶1、至少3∶1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少8.5:1、至少9:1、至少10:1、至少11:1、至少12:1、至少13:1、至少14:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少200:1、至少3001:1、至少400:1、至少500:1、至少600:1、至少700:1、至少800:1、至少900:1或至少1000:1或更多。[0721]预期的突变和插入/缺失的数目可以使用任何合适的方法来确定,例如,如国际第pct/2017/045381号专利申请(wo第2018/027078号国际专利申请)和第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中所述;komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017);其全部内容通过引用结合于此。[0722]在一些实施方案中,为了计算插入缺失频率、扫描测序读数以寻找与两个10‑bp序列的精确匹配,所述两个10‑bp序列位于可能发生插入缺失的窗口的两侧。如果未找到完全匹配的内容,则将其从分析中排除。如果此插入缺失窗口的长度与参考序列完全匹配,则将读数分类为不包含插入缺失。如果插入缺失窗口比参考序列长或短两个或多个碱基,则测序读数分别分类为插入或缺失。在一些实施方案中,本文提供的碱基编辑器可以限制核酸区域中插入缺失的形成。在一些实施方案中,所述区域位于碱基编辑器靶向的核苷酸处或碱基编辑器靶向的核苷酸的2、3、4、5、6、7、8、9或10个核苷酸内的区域。[0723]在靶核苷酸区域形成的插入缺失的数量可以取决于核酸(例如,细胞基因组内的核酸)暴露于碱基编辑器的时间量。在一些实施方案中,在将目标核苷酸序列(例如,细胞基因组内的核酸)暴露于碱基编辑器至少1小时、至少2小时、至少6小时、至少12小时、至少24小时、至少36小时,至少48小时,至少3天,至少4天,至少5天,至少7天,至少10天或至少14天后,确定插入缺失的数量或比例。应当理解,如本文所述的碱基编辑器的特征可以应用于任何融合蛋白,或使用本文提供的融合蛋白的方法。[0724]多重编辑[0725]在一些实施方案中,本文提供的碱基编辑器系统能够多重编辑一个或多个基因中的多个核碱基对。在一些实施方案中,多个核碱基对位于同一基因中。在一些实施方案中,多个核碱基对位于一个或多个基因中,其中至少一个基因位于不同的基因座中。在一些实施方案中,多重编辑可包含一种或多种指导多核苷酸。在一些实施例中,多重编辑可以包括一个或多个碱基编辑器系统。在一些实施方案中,多重编辑可包括具有单链指导多核苷酸的一个或多个碱基编辑器系统。在一些实施方案中,多重编辑可以包括具有多个指导多核苷酸的一个或多个碱基编辑器系统。在一些实施方案中,多重编辑可包含具有单链碱基编辑器系统的一种或多种指导多核苷酸。在一些实施方案中,多重编辑可包含至少一种不需要pam序列靶向结合靶多核苷酸序列的指导多核苷酸。在一些实施方案中,多重编辑可包含至少一种需要pam序列以靶向结合靶多核苷酸序列的指导多核苷酸。在一些实施方案中,多重编辑可以包含至少一种不需要pam序列靶向结合靶多核苷酸序列的指导多核苷酸和至少一种需要pam序列靶向结合靶多核苷酸的指导多核苷酸的混合序列。应当理解,使用本文所述的任何碱基编辑器的多路编辑的特征可以应用于使用本文提供的任何碱基编辑器的方法的任意组合。还应当理解,使用本文所述的任何碱基编辑器进行的多重编辑可包括多个核碱基对的序列编辑。[0726]本文提供的方法包括以下步骤:(a)使受试者的多核苷酸的靶核苷酸序列(例如,双链dna序列)与包含核碱基编辑器(例如,腺苷)的碱基编辑器系统接触。碱基编辑器或胞苷碱基编辑器)和指导多核酸(例如,grna),其中靶核苷酸序列包含靶核碱基对;(b)诱导靶区域的链分离;(c)将靶区域的单链中的靶核碱基对的第一核碱基编辑为第二核碱基;(d)切割不超过靶区域的一条链,其中与第一核碱基互补的第三核碱基被与第二核碱基互补的第四核碱基替代。[0727]在一些实施方案中,多个核碱基对在一个以上的基因中。在一些实施方案中,多个核碱基对在同一基因中。在一些实施方案中,一个或更多个基因中的至少一个基因位于不同的基因座中。[0728]在一些实施方案中,所述编辑是在至少一个蛋白质编码区中的多个核碱基对的编辑。在一些实施方案中,所述编辑是对至少一个蛋白质非编码区中的多个核碱基对的编辑。在一些实施方案中,所述编辑是编辑至少一个蛋白质编码区和至少一个蛋白质非编码区中的多个核碱基对。[0729]在一些实施方案中,所述编辑与一种或多种指导多核苷酸结合。在一些实施例中,碱基编辑器系统可以包括一个或多个碱基编辑器系统。在一些实施方案中,碱基编辑器系统可包括与单链指导多核苷酸结合的一个或多个碱基编辑器系统。在一些实施方案中,碱基编辑器系统可包含一个或多个碱基编辑器系统以及多个指导多核苷酸。在一些实施方案中,使用单链碱基编辑器系统将编辑与一个或多个指导多核苷酸结合。在一些实施方案中,编辑与至少一种不需要pam序列靶向结合靶多核苷酸序列的指导多核苷酸结合。在一些实施方案中,所述编辑与至少一种需要pam序列以靶向结合靶多核苷酸序列的指导多核苷酸结合。在一些实施方案中,所述编辑与至少一种不需要pam序列靶向结合靶多核苷酸序列的指导多核苷酸和至少一种需要pam序列靶向结合靶标的指导多核苷酸的混合物结合。多核苷酸序列。应当理解,使用本文所述的任何碱基编辑器的多路编辑的特性可以应用于使用本文提供的任何碱基编辑器的方法的任意组合。还应当理解,编辑可以包括多个核碱基对的序列编辑。[0730]碱基编辑器的使用方法[0731]疾病相关基因和等位基因中点突变的校正为治疗和基础研究中的应用开辟了基因校正的新策略。[0732]本申请提供了用于治疗被诊断患有与点突变相关的疾病或由点突变引起的疾病的对象的方法,所述疾病可以通过本文提供的碱基编辑器系统来校正。例如,在一些实施方案中,提供了一种方法,其包括对患有这种疾病(例如,由遗传突变引起的疾病)的受试者施用有效量的核碱基编辑器(例如,腺苷脱氨酶碱基编辑器或胞苷脱氨酶碱基编辑器),可校正疾病相关基因中的点突变。本申请提供了用于治疗rtt的方法,所述方法与可以通过脱氨酶介导的基因编辑来校正的点突变相关或由其引起。本文中描述了一些此类疾病,并且基于本申请内容,可以用本文提供的策略和融合蛋白治疗的其他合适的疾病对于本领域技术人员是显而易见的。将理解的是,各个序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同,例如,在成熟蛋白的前体和成熟蛋白本身中,编号之间的差异会影响编号。本领域技术人员将能够通过本领域公知的方法,例如通过序列比对和同源残基的确定,来鉴定任何同源蛋白和各自编码核酸中的各自残基。[0733]本文提供了使用碱基编辑器或碱基编辑器系统来编辑与疾病或病症相关的靶核苷酸序列中的核碱基的方法。在一些实施方案中,碱基编辑器的活性(例如,包含腺苷脱氨酶和cas9结构域)导致点突变的校正。在一些实施方案中,靶dna序列包含与疾病或病症相关的g→a点突变,并且其中突变体a碱基的脱氨基导致不与疾病或病症相关的序列。在一些实施方案中,靶dna序列包含与疾病或病症相关的t→c点突变,并且其中突变体c碱基的脱氨基导致不与疾病或病症相关的序列。[0734]在一些实施方案中,靶dna序列编码蛋白质,并且点突变是密码子,与野生型密码子相比,突变密码子编码的氨基酸发生改变。在一些实施方案中,突变体a的脱氨基导致突变体密码子编码的氨基酸的改变。在一些实施方案中,突变体a的脱氨基产生编码野生型氨基酸的密码子。在一些实施方案中,突变体c的脱氨基导致突变体密码子编码的氨基酸的改变。在一些实施方案中,突变体c的脱氨基导致编码野生型氨基酸的密码子。在一些实施方案中,受试者已经或已经被诊断出疾病或病症。[0735]在一些实施方案中,本文提供的腺苷脱氨酶能够使dna的脱氧腺苷残基的腺嘌呤脱氨基。本申请内容的其他方面提供了融合蛋白,其包含能够结合至特定核苷酸序列的腺苷脱氨酶(例如,如本文所述将dna中的脱氧腺苷脱氨的腺苷脱氨酶)和结构域(例如,cas9或cpf1蛋白)。例如,腺苷可被转化为肌苷残基,其通常与胞嘧啶残基碱基对。这样的融合蛋白尤其可用于核酸序列的靶向编辑。这样的融合蛋白可用于体外dna的靶向编辑,例如用于突变细胞或动物的产生。用于引入靶向突变,例如,用于校正离体细胞(例如,从受试者获得的细胞中的遗传缺陷),然后将其重新引入相同或另一个受试者中;对于体内定向突变的引入,例如,遗传缺陷的校正或疾病相关基因在g到a或t到c到突变的疾病相关基因的引入可以使用本文提供的核碱基编辑器进行处理。本申请提供了利用所述脱氨基酶和核碱基编辑器的脱氨基酶,融合蛋白,核酸,载体,细胞,组合物,方法,试剂盒,系统等。[0736]使用核碱基编辑器靶向mecp2基因中的核苷酸[0737]如本文所述评估靶向mecp2基因中核苷酸的核碱基编辑器的适用性。在一个实施方案中,用一种或多种编码本文所述的核碱基编辑器的核酸分子和少量编码报导分子(例如gfp)的载体转染,转导或以其他方式修饰目的细胞。这些细胞可以是永生化的人类细胞系,例如293t、k562或u20s。或者,可以使用原代人细胞。细胞也可以获自受试者或个体,例如获自组织活检、手术、血液、血浆、血清或其他生物流体。这些细胞可能与最终的细胞靶标有关,[0738]可以使用病毒载体进行递送,如下文进一步描述。在一个实施方案中,可以使用脂质转染(例如脂转染胺或fugene)或通过电穿孔进行转染。转染后,可以通过荧光显微镜或流式细胞术确定gfp的表达,以确认一致和高水平的转染。这些初步转染可以包含不同的核碱基编辑器,以确定哪些编辑器组合提供最大的活性。[0739]如本文所述评估核碱基编辑器的活性,即通过对靶基因进行测序以检测靶序列的改变。对于sanger测序,将纯化的pcr扩增子克隆到质粒主链中,进行转化,微量制备并用单个引物测序。测序也可以使用下一代测序技术进行。使用下一代测序时,扩增子可能为300‑500bp,预期的切割位点不对称放置。pcr之后,可以将下一代测序适配器和条形码(例如illumina多重适配器和索引)添加到扩增子的末端,例如用于高通量测序(例如在illuminamiseq上)。[0740]可以选择在初始测试中诱导最大水平的靶标特异性改变的融合蛋白进行进一步评估。[0741]在特定的实施方案中,核碱基编辑器用于靶向目的多核苷酸。在一个实施方案中,将本申请的核碱基编辑器与用于靶向核酸序列(例如,具有rtt相关突变的mecp2多核苷酸)的指导rna一起递送至细胞(例如,神经元),从而改变靶基因,即mecp2。[0742]在一些实施方案中,指导rna靶向碱基编辑器以将一个或多个编辑引入目的基因的序列。在一些实施方案中,引入mecp2基因的一个或多个改变如以下表6所示。[0743]生成预期的突变[0744]在一些实施方案中,本文提供的方法的目的是通过基因编辑来恢复功能异常的基因的功能。在一些实施方案中,功能异常的基因的功能通过引入预期的突变来恢复。可以例如通过校正人细胞培养物中与疾病相关的突变来验证本文提供的核碱基编辑蛋白用于体外基于基因编辑的人治疗剂。本领域技术人员将理解,本文提供的核碱基编辑蛋白,例如,包含多核苷酸可编程核苷酸结合结构域(例如,cas9)和核碱基编辑结构域(例如,腺苷脱氨酶结构域或胞苷脱氨酶结构域)的融合蛋白。可用于校正从a到g或c到t的任何单点突变。在第一种情况下,将突变体a脱氨基至i校正突变,在后一种情况下,将与突变体t碱基配对的a脱氨基,然后进行一轮复制,以校正突变。[0745]在一些实施方案中,本申请提供了碱基编辑器,其可以有效地在核酸(例如,受试者基因组内的核酸)中产生预期的突变,例如点突变,而无需产生大量的突变。意外突变,例如意外点突变。在一些实施方案中,预期的突变是由与专门设计用于产生预期的突变的指导多核苷酸(例如,grna)结合的特定碱基编辑器(例如,胞苷碱基编辑器或腺苷碱基编辑器)产生的突变。在一些实施方案中,预期的突变是与疾病或病症相关的突变。在一些实施方案中,预期的突变是与疾病或病症相关的腺嘌呤(a)至鸟嘌呤(g)点突变。在一些实施方案中,预期的突变是与疾病或病症相关的胞嘧啶(c)至胸腺嘧啶(t)点突变。在一些实施方案中,预期的突变是基因的编码区或非编码区内的腺嘌呤(a)至鸟嘌呤(g)点突变。在一些实施方案中,预期的突变是基因的编码区或非编码区内的胞嘧啶(c)至胸腺嘧啶(t)点突变。在一些实施方案中,预期的突变是点突变,其在基因的编码区域内产生终止密码子,例如过早的终止密码子。在一些实施方案中,预期的突变是消除终止密码子的突变。[0746]在一些实施方案中,本文提供的任何碱基编辑器均能够产生大于1:1的预期突变与非预期突变(例如,预期点突变:非预期点突变)的比率。本文提供的碱基编辑器中的至少一个能够产生预期突变与非预期突变(例如,预期点突变:非预期点突变)的比率至少为1.5:1、至少2:1、至少2.5:1、至少3:1、至少3.5:1、至少4:1、至少4.5:1、至少5:1、至少5.5:1、至少6:1、至少6.5:1、至少7:1、至少7.5:1、至少8:1、至少10:1、至少12:1、至少15:1、至少20:1、至少25:1、至少30:1、至少40:1、至少50:1、至少100:1、至少150:1、至少200:1、至少250:1、至少500:1、或至少1000:1或者更多。[0747]碱基编辑器效率的细节在国际pct申请第pct/2017/045381号专利申请(wo第201/027078号国际专利申请)和第pct/us2016/058344号专利申请(wo第2017/070632号国际专利申请)中进行了描述,将其全部内容通过引用合并在此。另请参阅komor,a.c.等人“programmableeditingofatargetbaseingenomicdnawithoutdouble‑strandeddnacleavage”nature533,420‑424(2016);gaudelli,n.m.等人“programmablebaseeditingofa·ttog·cingenomicdnawithoutdnacleavage”nature551,464‑471(2017);以及komor,a.c.等人“improvedbaseexcisionrepairinhibitionandbacteriophagemugamproteinyieldsc:g‑to‑t:abaseeditorswithhigherefficiencyandproductpurity”scienceadvances3:eaao4774(2017),全文其内容通过引用合并于此。[0748]在一些实施方案中,对一个或多个基因中多个核碱基对的编辑导致至少一种预期突变的形成。在一些实施方案中,至少一个预期突变的形成导致引起突变的疾病的精确校正。应当理解,如本文所述的碱基编辑器的多重编辑的特征可以应用于使用本文提供的碱基编辑器的方法的组合中的任何一种。[0749]致病突变的精确校正[0750]在一些实施方案中,预期的突变是与疾病或病理学相关的基因中的致病突变或致病突变的精确校正。病原性突变可以是病原性单核苷酸多态性(snp),也可以由snp引起。例如,致病突变可以是基因编码的蛋白质中的氨基酸变化。在另一个实例中,致病突变可以是基因中的致病snp。精确的校正可以使病原体突变恢复到其野生型状态。在一些实施方案中,病原性突变是与疾病或病症相关的g→a点突变,其中用a‑to‑g碱基编辑器(abe)对突变体a碱基的脱氨基产生与以下目的无关的序列:疾病或失调。在一些实施方案中,致病性突变是c→t点突变。可以例如通过将a‑to‑g碱基编辑器(abe)靶向相反链并编辑病原性t核碱基的补体a来校正c→t点突变。在一些实施方案中,病原性突变是与疾病或病症相关的t→c点突变,并且其中用c‑to‑t碱基编辑器(be或cbe)对突变体c碱基的脱氨基产生的序列是与疾病或病症无关。在一些实施方案中,致病突变是a→g点突变。可以通过例如将cbe靶向相反链并编辑病原性g核碱基的补体c来校正a→g点突变。指示的碱基编辑器可以靶向致病性snp或致病性snp的互补序列,描述于dendunnen,j.t.和s.e.antonarakis发表的“mutationnomenclatureextensionsandsuggestionstodescribecomplexmutations:adiscussion.”,humanmutation15:712(2000),其全部内容通过引用合并于此。[0751]在一个特定的实施方案中,所述疾病或病症是rett综合症(rtt)。在一些实施方案中,致病性突变在mecp2基因中。[0752]输送系统[0753]本文公开的碱基编辑器可以被编码在病毒载体中包含的核酸上。示例性病毒载体包括逆转录病毒载体(例如马洛尼鼠白血病病毒,maloneymurineleukemiavirus,mml‑v)、腺病毒载体(例如ad100)、慢病毒载体(基于hiv和fiv的载体)、疱疹病毒载体(例如hsv‑2)和腺相关病毒载体(adeno‑associatedviralvectors,aav)。[0754]腺相关病毒(“aav”)载体还可用于通过靶核酸转导细胞,例如,在核酸和肽的体外生产中,以及在体内和离体基因治疗程序中(例如,参见west等,virology160:38‑47(1987);美国第4,797,368号专利;wo第93/24641号国际专利申请案;kotin,humangenetherapy5:793‑801(1994);muzyczka,j.clin.invest.94:1351(1994)。在许多出版物中描述了重组aav载体的构建,包括美国第5,173,414号专利;tratschin等,mol.cell.biol.5:3251‑3260(1985);tratschin等人,mol.cell.biol.4:2072‑2081(1984);hermonat&muzyczka,pnas81:6466‑6470(1984);和samulski等人,j.virol.63:03822‑3828(1989)。[0755]就体内递送而言,aav可能优于其他病毒载体。在某些情况下,aav毒性低,这可能是由于纯化方法不需要对可激活免疫反应的细胞颗粒进行超离心所致。在某些情况下,aav引起插入突變(insertionalmutagenesis)的可能性很小,因为其没有整合到宿主基因组中。[0756]aav是属于细小病毒家族的小型单链dna依赖病毒。4.7kb野生型(wt)aav基因组由分别编码四个复制蛋白和三个衣壳蛋白的两个基因组成,并且在两侧均带有145‑bp反向末端重复序列(itr)。病毒体由三种衣壳蛋白vp1、vp2和vp3组成,它们以1:1:10的比例由同一开放阅读框产生,但由差异剪接(vp1)和其他翻译起始位点(分别为vp2和vp3)产生。vp3是病毒体中最丰富的亚基,在细胞表面参与受体识别,从而确定病毒的向性。在vp1的唯一n末端已鉴定出在病毒感染性中起作用的磷脂酶结构域。[0757]aav的包装极限为4.5或4.75kb。因此,可以在单个病毒载体中包含公开的碱基编辑器以及启动子和转录终止子。大于4.5或4.75kb的构建体可能导致病毒产生明显减少。例如,spcas9很大,基因本身超过4.1kb,这使其很难包装到aav中。因此,本申请的实施例包括利用所揭露的碱基编辑器,其长度比常规碱基编辑器的长度短。在某些示例中,碱基编辑器小于4kb。公开的碱基编辑器可以小于4.5kb、4.4kb、4.3kb、4.2kb、4.1kb、4kb、3.9kb、3.8kb、3.7kb、3.6kb、3.5kb、3.4kb、3.3kb、3.2kb、3.1kb、3kb、2.9kb、2.8kb、2.7kb、2.6kb、2.5kb、2kb或1.5kb。在某些情况下,公开的碱基编辑器的长度为4.5kb或更短。[0758]aav可以是aav1、aav2、aav5或其任何组合。可以针对要靶向的细胞选择aav的类型;例如,可以选择aav血清型1、2、5或混合衣壳aav1、aav2、aav5或其任何组合以靶向脑或神经元细胞;并且可以选择aav4靶向心脏组织。aav8可用于递送至肝脏。关于这些细胞的某些aav血清型的列表可以在grimm,d.等人发表的,j.virol.82:5887‑5911(2008)中找到。[0759]与野生型aav类似,重组aav(raav)利用顺式作用145bp的itr修饰载体转基因盒的侧翼,可提供高达4.5kb的外源dna包装。感染后,raav可以表达本申请的融合蛋白,并且通过游离形式存在于圆环头尾接头中而持续存在而不整合到宿主基因组中。尽管在体外和体内使用所述系统成功进行raav成功的例子很多,但当基因编码序列的长度等于或大于野生型aav基因组时,有限的包装能力就限制了aav介导的基因传递的使用。[0760]aav载体的小包装能力使超过所述大小的许多基因的传递和/或使用大的生理调节组件具有挑战性。这些挑战可以通过例如将待递送的蛋白质分成两个或更多个片段来解决,其中n‑末端片段与分裂的內含子‑n融合,c‑末端片段与分裂的內含子‑c融合。然后将这些片段包装成两个或多个aav载体。如本文所用,“內含子”是指连接n‑末端和c‑末端蛋白质(例如,待连接的片段)侧翼的自剪接蛋白质内含子(例如,肽)。某些內含子用于连接异源蛋白片段的用途描述于例如wood等人,j.biol.chem.289(21);14512‑9(2014)。例如,当融合至分离的蛋白质片段时,內含子intn和intc相互识别,将自身剪接在一起,并同时连接与它们融合的蛋白质片段的侧翼n和c末端蛋白,从而重建全长来自两个蛋白质片段的蛋白质。其他合适的內含子对于本领域技术人员是显而易见的。[0761]本申请的融合蛋白的片段的长度可以变化。在一些实施方案中,蛋白质片段的长度范围为2个氨基酸至约1000个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约5个氨基酸至约500个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约20个氨基酸至约200个氨基酸。在一些实施方案中,蛋白质片段的长度范围为约10个氨基酸至约100个氨基酸。其他长度的合适的蛋白质片段对本领域技术人员是显而易见的。[0762]在一些实施方案中,核酸酶(例如,cas9)的一部分或片段与內含子融合。核酸酶可以融合到內含子的n末端或c末端。在一些实施方案中,融合蛋白的一部分或片段与內含子融合并且与aav衣壳蛋白融合。内含子,核酸酶和衣壳蛋白可以以任何排列融合在一起(例如,核酸酶‑內含子‑衣壳,内含子‑核酸酶‑衣壳,衣壳‑内含子‑核酸酶等)。在一些实施方案中,将內含子的n端融合至融合蛋白的c端,并且将內含子的c端融合至aav衣壳蛋白的n端。[0763]在一个实施方案中,通过将大的转基因表达盒分成两个分开的两半(5'和3'末端,或头和尾)来产生双重aav载体,其中盒的每一半被包装在单个aav载体中(<5kb)。然后,通过两个双重aav载体共同感染同一细胞,然后进行以下操作:完成全长转基因表达盒的重组:(1)5'和3'基因组之间的同源重组(hr)(双重aav重叠向量);(2)itr介导的5'和3'基因组的尾对头串联连接(双重aav转拼载体);或(3)这两种机制的组合(双重aav混合载体)。体内使用双重aav载体可导致全长蛋白质的表达。双重aav载体平台的使用代表了大小大于4.7kb的转基因的有效且可行的基因转移策略。[0764]基于rna或dna病毒的系统用于传递碱基编辑器的方法利用了高度进化的过程,所述过程可将病毒靶向培养物中或宿主中的特定细胞,并将病毒有效载荷转运至细胞核或宿主细胞基因组。病毒载体可直接施用于培养中的细胞(患者)(体内),或它们可用于体外处理细胞,并且修饰的细胞可任选地施用于患者(离体)。基于病毒的常规系统可以包括逆转录病毒,慢病毒,腺病毒,腺相关病毒和单纯疱疹病毒载体,用于基因转移。用逆转录病毒,慢病毒和腺相关病毒基因转移方法可以将其整合到宿主基因组中,这通常会导致插入的转基因长期表达。另外,已经在许多不同的细胞类型和靶组织中观察到高转导效率。[0765]逆转录病毒的嗜性可以通过掺入外来包膜蛋白,扩大靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞并通常产生高病毒滴度的逆转录病毒载体。因此,逆转录病毒基因转移系统的选择将取决于靶组织。逆转录病毒载体由顺式作用的长末端重复序列组成,其包装能力可容纳6‑10kb的外源序列。最小的顺式作用ltr足以复制和包装载体,然后将其用于将治疗性基因整合到靶细胞中以提供永久性转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(mulv)、长臂猿白血病病毒(galv)、猿猴免疫缺陷病毒(siv)、人免疫缺陷病毒(hiv)及其组合的载体(例如,参见buchscher等人,j.virol.66:2731‑2739(1992);johann等人,j.virol.66:1635‑1640(1992);johann等人,j.virol.66:1635‑1640(1992);sommnerfelt等,virol.176:58‑59(1990);wilson等人,j.virol.63:2374‑2378(1989);miller等人,j.virol.65:2220‑2224(1991);国际第pct/us94/05700号专利申请)。[0766]逆转录病毒载体,特别是慢病毒载体,可能需要小于给定长度的多核苷酸序列以有效整合入靶细胞。例如,与较小的逆转录病毒载体相比,长度大于9kb的逆转录病毒载体可导致较低的病毒滴度。在一些方面,本申请的碱基编辑器具有足够的大小,以使得能够有效地包装和经由逆转录病毒载体递送至靶细胞。在一些情况下,碱基编辑器的大小应使得即使与指导核酸和/或可靶向核酸酶系统的其他组分一起表达时也可以有效包装和递送。[0767]在优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中都具有很高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高滴度和表达水平。所述载体可以在相对简单的系统中大量产生。[0768]因此,本文所述的碱基编辑器可以与病毒载体一起递送。碱基编辑器系统的一个或多个组件可以被编码在一个或多个病毒载体上。例如,碱基编辑器和指导核酸可以被编码在单个病毒载体上。在其他情况下,碱基编辑器和指导核酸被编码在不同的病毒载体上。在任一种情况下,碱基编辑器和指导核酸均可以可操作地连接至启动子和终止子。[0769]编码在病毒载体上的成分的组合可以通过所选择的病毒载体的货物大小限制来确定。[0770]任何合适的启动子都可用于驱动碱基编辑器以及在适当的情况下指导核酸的表达。对于普遍表达,可以使用的启动子包括cmv、cag、cbh、pgk、sv40、铁蛋白重链或轻链等。对于大脑或其他cns细胞表达,合适的启动子可以包括:用于所有神经元的synapsini,用于兴奋性神经元的camkiiα用于gaba能神经元的gad67或gad65或vgat。对于肝细胞表达,合适的启动子包括白蛋白启动子。对于肺细胞表达,合适的启动子可以包括sp‑b。对于内皮细胞,合适的启动子可以包括icam。对于造血细胞,合适的启动子可以包括ifnβ或cd45。对于成骨细胞,合适的启动子可以包括og‑2。[0771]用于驱动碱基编辑器编码核酸分子表达的启动子可以包括aavitr。这对于消除对额外的启动子组件的需求可能是有利的,所述额外的启动子组件可以占用载体中的空间。释放的额外空间可用于驱动其他元素的表达,例如指导核酸或选择标记。itr活性相对较弱,因此由于所选核酸酶的过表达,它可用于减少潜在的毒性。[0772]在一些情况下,本申请内容的碱基编辑器的大小足够小以允许单独的启动子驱动碱基编辑器和同一核酸分子内的兼容性指导核酸的表达。例如,载体或病毒载体可包含可操作地连接至编码碱基编辑器的核酸的第一启动子和可操作地连接至指导核酸的第二启动子。[0773]用于驱动指导核酸表达的启动子可包括:poliii启动子,例如polii启动子和内含子盒的u6或h1使用,以表达grna腺伴随病毒(aav)。[0774]可以使用腺相关病毒(aav)、慢病毒、腺病毒或其他质粒或病毒载体类型,尤其是使用例如来自美国第8,454,972号专利(腺病毒的制剂、剂量)、美国第8,404,658号专利(aav的制剂,剂量)和美国第5,846,946号专利(dna质粒的制剂,剂量)以及来自涉及涉及的临床试验的临床试验和出版物慢病毒、aav和腺病毒。例如,对于aav、给药途径、制剂和剂量可以如美国第8,454,972号专利中以及涉及aav的临床试验中所描述。对于腺病毒、给药途径、制剂和剂量可以如美国第8,404,658号专利中以及涉及腺病毒的临床试验中所述。对于质粒递送、给药途径、制剂和剂量可以如美国第5,846,946号专利中以及涉及质粒的临床研究中所述。剂量可以基于或推断为平均70公斤的个体(例如成年男性),并且可以针对患者,受试者,不同体重和物种的哺乳动物进行调整。给药频率在医学或兽医(例如医师,兽医)的能力范围内,这取决于通常的因素,包括年龄、性别、总体健康状况,患者或受试者的其他状况以及要解决的特定状况或症状。可以将病毒载体注射到目标组织中。对于细胞类型特异性碱基编辑,可以由细胞类型特异性启动子驱动碱基编辑器和任选的指导核酸的表达。[0775]慢病毒是复杂的逆转录病毒,具有在有丝分裂和有丝分裂后细胞中感染并表达其基因的能力。最常见的慢病毒是人类免疫缺陷病毒(hiv),其使用其他病毒的包膜糖蛋白靶向广泛的细胞类型。[0776]慢病毒可以如下制备。在pcases10(包含慢病毒转移质粒主链)克隆化后,将低传代率(p=5)的hek293ft接种到t‑75烧瓶中,直到转染前一天在含10%胎牛血清且无抗生素的dmem中接种至50%融合。20小时后,将培养基更改为optimem(无血清)培养基,并在4小时后进行转染。用10μg慢病毒转移质粒(pcases10)和以下包装质粒转染细胞:5μgpmd2.g(vsv‑g假型)和7.5μgpspax2(gag/pol/rev/tat)。可以在带有阳离子脂质输送剂(50μllipofectamine2000和100ulplus试剂)的4mloptimem中进行转染。6小时后,将培养基更换为含10%胎牛血清的无抗生素dmem。这些方法在细胞培养期间使用血清,但是无血清方法是首选。[0777]慢病毒可以如下纯化。48小时后收集病毒上清液。首先清除上清液中的碎屑,然后通过0.45μm低蛋白结合(pvdf)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀在4℃下重悬于50μldmem中过夜,然后等分并立即冷冻在‑80℃下。[0778]在另一个实施方案中,还考虑了基于马传染性贫血病毒(eiav)的最少的非灵长类慢病毒载体。在另一个实施方案中,retinostatrtm是一种基于马传染性贫血病毒的慢病毒基因治疗载体,其表达血管抑制蛋白内皮抑素和血管抑素,预期通过视网膜下注射来递送。在另一个实施方案中,考虑使用自我灭活的慢病毒载体。[0779]系统的任何rna,例如指导rna或编码碱基编辑器的mrna,都可以rna的形式递送。可以使用体外转录产生编码碱基编辑器的mrna。例如,可以使用包含以下组件的pcr盒合成核酸酶mrna:t7启动子,可选的kozak序列(gccacc),核酸酶序列和3'utr,例如来自β珠蛋白‑polya尾巴的3'utr。所述盒可用于通过t7聚合酶转录。指导多核苷酸(例如,grna)也可以使用体外转录从含t7启动子的盒中转录,随后是序列“gg”和指导多核苷酸序列。[0780]为了增强表达并减少可能的毒性,可以将碱基编辑器编码序列和/或指导核酸进行修饰,以包括一种或多种经修饰的核苷,例如核苷酸。使用伪u或5‑甲基c[0781]在一些实施方案中,本申请内容包括修饰细胞或生物的方法。所述细胞可以是原核细胞或真核细胞。所述细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人类的灵长类、牛、猪、啮齿动物或小鼠细胞。由本申请内容的碱基编辑者,组合物和方法引入细胞的修饰可以是使得改变细胞和细胞的后代以改善生物产物如抗体、淀粉、酒精或其他所需细胞输出的生产。通过本申请的方法引入细胞的修饰可以是使得细胞和细胞的后代包括改变产生的生物产物的改变。[0782]系统可以包括一个或多个不同的载体。一方面,对碱基编辑器进行密码子优化以表达所需的细胞类型,优选为真核细胞,优选为哺乳动物细胞或人细胞。[0783]通常,密码子优化是指修饰核酸序列以在目的宿主细胞中增强表达的过程,方法是用所述宿主细胞的基因中更频繁或最常用的密码子替换天然序列的至少一个密码子(例如约或大于约1、2、3、4、5、10、15、20、25、50或更多密码子),同时保持天然氨基酸序列。各种物种对特定氨基酸的某些密码子表现出特定的偏见。密码子偏倚(生物之间密码子使用的差异)通常与信使rna(mrna)的翻译效率相关,而信使rna(mrna)的翻译效率又被认为尤其取决于翻译的密码子的性质和特定密码子的可用性。转移rna(trna)分子。所选trna在细胞中的优势通常反映了肽合成中最常使用的密码子。因此,可以基于密码子优化来定制基因以在给定生物中最佳基因表达。密码子使用表很容易获得,例如,可在www.kazusa.orjp/codon/上的“codonusagedatabase”(2002年7月9日访问)上找到,并且这些表可以通过多种方式进行修改。参见nakamura,y.等人发表的“来codonusagetabulatedfromtheinternationaldnasequencedatabases:statusfortheyear2000”,nucl.acidsres.28:292(2000)。也可获得用于优化特定序列以在特定宿主细胞中表达的密码子的计算机算法,例如geneforge(aptagen;jacobuss,pa.)。在一些实施方案中,编码工程化核酸酶的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50或更多或所有密码子)对应于最频繁使用的特定氨基酸的密码子。[0784]包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。这样的细胞包括包装腺病毒的293细胞和包装逆转录病毒的psi.2细胞或pa317细胞。基因疗法中使用的病毒载体通常是通过产生将核酸载体包装成病毒颗粒的细胞系而产生的。载体通常包含包装和随后整合入宿主所需的最小病毒序列,其他病毒序列被表达盒替换以表达多核苷酸。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗的aav载体通常仅具有来自aav基因组的itr序列,其是包装和整合入宿主基因组所需的。病毒dna可以包装在细胞系中,所述细胞系包含编码其他aav基因(即rep和cap)但缺少itr序列的辅助质粒。所述细胞系也可以被腺病毒作为辅助感染。辅助病毒可以促进aav载体的复制和辅助质粒中aav基因的表达。在某些情况下,由于缺乏itr序列,辅助质粒的包装量不大。可以通过例如腺病毒比aav更敏感的热处理来减少腺病毒的污染。[0785]碱基编辑器的非病毒式输送[0786]还提供了针对碱基编辑者的非病毒传递方法。一类重要的非病毒核酸载体是纳米颗粒,其可以是有机或无机的。纳米颗粒是本领域众所周知的。任何合适的纳米颗粒设计可用于递送基因组编辑系统组件或编码此类组件的核酸。例如,有机(例如脂质和/或聚合物)纳米颗粒可以适合用作本申请的某些实施方案中的递送载体。用于纳米颗粒制剂和/或基因转移的示例性脂质示于表3中(以下)。[0787]表3[0788][0789][0790][0791]表4列出了用于基因转移和/或纳米颗粒制剂的示例性聚合物。[0792]表4[0793][0794]表5总结了编码本文所述融合蛋白的多核苷酸的递送方法。[0795]表5[0796][0797]在另一方面,基因组编辑系统组分或编码此类组分的核酸,例如核酸结合蛋白,例如cas9或其变体,以及靶向rna的基因组核酸序列的grna的递送可以通过将核糖核蛋白(rnp)传递到细胞来实现这一目标。rnp包含与靶向grna复合的核酸结合蛋白,例如cas9。可以使用已知方法将rnps递送到细胞中,例如电穿孔、核转染或阳离子脂质介导的方法,例如zuris,j.a.等人,2015,nat.biotechnology,33(1):73‑80。rnp有利于用于crispr碱基编辑系统,特别是对于难以转染的细胞,例如原代细胞。另外,rnp还可以减轻细胞中蛋白质表达可能发生的困难,特别是当不能很好地表达在crispr质粒中使用的真核启动子例如cmv或ef1a时。有利地,使用rnp不需要将外源dna递送到细胞中。而且,由于包含核酸结合蛋白和grna复合物的rnp随时间降解,因此使用rnp具有限制脱靶作用的潜力。以类似于基于质粒的技术的方式,rnp可用于递送结合蛋白(例如,cas9变体)并指导同源引导修复(hdr)。[0798]药物成分[0799]本申请的其他方面涉及药物组合物,其包含本文所述的任何碱基编辑器,融合蛋白或融合蛋白‑指导多核苷酸复合物。如本文所用,术语“药物组合物”是指配制用于药物用途的组合物。在一些实施方案中,药物组合物还包含药学上可接受的载体。在一些实施方案中,药物组合物包含另外的试剂(例如,用于特异性递送,增加的半衰期或其他治疗化合物)。[0800]如本文所用,术语“药学上可接受的载体”是指药学上可接受的材料,组合物或媒介物,例如液体或固体填充剂、稀释剂、赋形剂、制造助剂(例如润滑剂、滑石镁、钙或硬脂酸锌(或硬脂酸锌)或溶剂封装材料,涉及将化合物从身体的一个部位(例如,输送部位)携带或运输到另一部位(例如,器官、组织或身体的一部分)。在与制剂的其他成分兼容并且对受试者的组织无害的意义上(例如,生理兼容性、无菌、生理ph等),药学上可接受的载体是“可接受的”。[0801]可以用作药学上可接受的载体的材料的一些非限制性实例包括:(1)糖,例如乳糖、葡萄糖和蔗糖;(2)淀粉,例如玉米淀粉和马铃薯淀粉;(3)纤维素及其衍生物,例如羧甲基纤维素钠、甲基纤维素、乙基纤维素、微晶纤维素和乙酸纤维素;(4)黄芪粉;(5)麦芽;(6)明胶;(7)润滑剂,如硬脂酸镁,十二烷基硫酸钠和滑石粉;(8)赋形剂,例如可可脂和栓剂蜡;(九)花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油、大豆油等油;(10)二醇,例如丙二醇;(11)多元醇,例如甘油、山梨糖醇、甘露糖醇和聚乙二醇(peg);(12)酯,例如油酸乙酯和月桂酸乙酯;(13)琼脂;(14)缓冲剂,例如氢氧化镁和氢氧化铝;(15)海藻酸;(16)无热原水;(17)等渗盐水;(18)林格的解答;(19)乙醇;(20)ph缓冲溶液;(21)聚酯,聚碳酸酯和/或聚酐;(22)填充剂,例如多肽和氨基酸;(23)血清醇,例如乙醇;(23)药物制剂中使用的其他无毒兼容性物质。制剂中还可存在润湿剂、着色剂、脱模剂、包衣剂、甜味剂、调味剂、加香剂、防腐剂和抗氧化剂。诸如“赋形剂”、“载体”、“药学上可接受的载体”、“载体”等的术语在本文中可互换使用。[0802]药物组合物可包含一种或多种ph缓冲化合物,以将制剂的ph维持在反映生理ph的预定水平,例如在约5.0至约8.0的范围内。用于水性液体制剂的ph缓冲化合物可以是氨基酸或氨基酸混合物,例如组氨酸、或氨基酸混合物,例如组氨酸和甘氨酸。或者,ph缓冲化合物优选是将制剂的ph保持在预定水平,例如在约5.0至约8.0的范围内并且不螯合钙离子的试剂。这种ph缓冲化合物的说明性实例包括但不限于咪唑和乙酸根离子。ph缓冲化合物可以以适合将制剂的ph维持在预定水平的任何量存在。[0803]药物组合物还可包含一种或多种渗透调节剂,即将制剂的渗透特性(例如张度,重量克分子渗透压浓度和/或渗透压)调节至血流可接受的水平的化合物。和接受者的血细胞。渗透调节剂可以是不螯合钙离子的试剂。渗透调节剂可以是本领域技术人员已知或可获得的调节制剂的渗透特性的任何化合物。本领域技术人员可以凭经验确定给定的渗透调节剂用于本申请制剂的适用性。合适类型的渗透调节剂的说明性实例包括但不限于:盐,例如氯化钠和乙酸钠;和盐。糖,如蔗糖,葡萄糖和甘露醇;氨基酸,例如甘氨酸;以及这些试剂和/或试剂类型中的一种或多种的混合物。渗透调节剂可以以足以调节制剂的渗透特性的任何浓度存在[0804]在一些实施方案中,配制药物组合物以递送至受试者,例如,用于基因编辑。施用本文所述药物组合物的合适途径包括但不限于:局部、皮下、经皮、皮内、病变内、关节内、腹膜内、膀胱内、经粘膜、牙龈、齿内、耳蜗内、鼓膜内、器官内、硬膜外、鞘内、肌内、静脉内、血管内、骨内、眼周、肿瘤内、脑内和脑室内给药。[0805]在一些实施方案中,本文所述的药物组合物局部施用于患病部位(例如肿瘤部位)。在一些实施方案中,本文所述的药物组合物通过注射、通过导管、通过栓剂或通过植入物施用于受试者,所述植入物为多孔、无孔或凝胶状材料。包括诸如唾液弹性膜的膜或纤维。[0806]在其他实施方案中,本文所述的药物组合物在控释系统中递送。在一个实施方案中,可以使用泵(例如,参见langer,1990,science249:1527‑1533;sefton,1989,crccrit.ref.biomed.eng.14:201;buchwald等,1980,surgery88:507;saudek等,1989,n.engl.j.med.321:574)。在另一个实施方案中,可以使用聚合物材料。(例如,参见”medicalapplicationsofcontrolledrelease”(langer和wise编辑,crcpress,bocaraton,fla.,1974);controlleddrugbioavailability,drugproductdesignandperformance(smolen和ball编辑,wiley,newyork,1984;ranger和peppas,1983,macromol.sci.rev.macromol.chem.23:61。另见levy等,1985,science228:190;during等,1989,ann.neurol.25:351;howard等,1989,j.neurosurg.71:105。)其他控释系统例如在上文的langer中讨论。[0807]在一些实施方案中,按照常规程序将药物组合物配制为适于静脉内或皮下施用给受试者例如人的组合物。在一些实施方案中,用于注射给药的药物组合物是无菌等渗用途的溶液作为增溶剂和局部麻醉剂如利诺卡因以减轻注射部位的疼痛。通常,将成分分别或以单位剂型混合在一起提供,例如,作为干燥的冻干粉或无水浓缩物在指示活性剂的量的密闭容器中,例如安瓿或小袋中。如果要通过输液方式给药,可以将其分配到装有无菌药物级水或盐水的输液瓶中。在通过注射施用药物组合物的情况下,可以提供安瓿注射用无菌水或盐水,以便可以在施用之前将成分混合。[0808]用于全身给药的药物组合物可以是液体,例如无菌盐水、乳酸林格氏液或汉克氏溶液。另外,药物组合物可以是固体形式,并在使用前立即重新溶解或悬浮。也可以考虑冻干形式。药物组合物可以包含在脂质颗粒或囊泡中,例如脂质体或微晶,其也适合于肠胃外给药。颗粒可以具有任何合适的结构,例如单层或多层,只要其中包含组合物即可。可以将化合物截留在“稳定的质粒‑脂质颗粒”(splp)中,所述颗粒包含融合脂质二油酰磷脂酰乙醇胺(dioleoylphosphatidylethanolamine,dope),低含量(5‑10mol%)的阳离子脂质,并通过聚乙二醇(peg)涂层使其稳定(张永鹏等,基因治疗(genether。)1999,6:1438‑47)。带正电荷的脂质,例如n‑[1‑(2,3‑二羟乙基)丙基]‑n,n,n‑三甲基‑铵甲基硫酸盐或“dotap”,对于此类颗粒和囊泡是特别优选的。这种脂质颗粒的制备是众所周知的。例如,参见美国第4,880,635号专利;第4,906,477号专利;第4,911,928号专利;第4,917,951号专利;第4,920,016号专利;第4,921,757号专利;每一个均通过引用并入本文。[0809]例如,本文所述的药物组合物可以作为单位剂量施用或包装。当用于本申请的药物组合物时,术语“单位剂量”是指适合作为对象的单位剂量的物理上离散的单位,每个单位包含预定量的活性物质,所述预定量的活性物质经计算可产生期望的治疗效果并与之结合。所需的稀释剂;即载体或载剂。[0810]此外,可以将药物组合物作为药物试剂盒提供,其包括(a)包含冻干形式的本申请化合物的容器,和(b)包含药学上可接受的稀释剂(例如,用于重构或灭菌的无菌容器)的第二容器。本申请的冻干化合物的稀释液,可以任选地与这种容器结合,可以是由政府机构规定的规范药品或生物制品的生产,使用或销售的通知,所述通知反映了所述机构的批准。制造,使用或销售以进行人为管理。[0811]在一些实施方案中,本文描述的任何融合蛋白、grna和/或复合物作为药物组合物的一部分提供。在一些实施方案中,药物组合物包含本文提供的任何融合蛋白。在一些实施方案中,药物组合物包含本文提供的任何复合物。在一些实施方案中,药物组合物包含核糖核蛋白复合物,其包含与grna和阳离子脂质形成复合物的rna引导的核酸酶(例如,cas9)。在一些实施方案中,药物组合物包含grna,核酸可编程dna结合蛋白、阳离子脂质和药学上可接受的赋形剂。药物组合物可以任选地包含一种或多种其他治疗活性物质。[0812]众所周知,适合于对人给药的药物组合物的修饰是为了使所述组合物适合于对各种动物给药,并且普通熟练的兽医药理学家可以仅通过普通的实验来设计和/或进行这种修饰。预期给予药物组合物的受试者包括但不限于人和/或其他灵长类;哺乳动物、家养动物、宠物和与商业有关的哺乳动物、例如牛、猪、马、绵羊、猫、狗、小鼠和/或大鼠;和/或鸟类、包括与商业相关的鸟类,例如鸡、鸭、鹅和/或火鸡。[0813]本文描述的药物组合物的制剂可以通过药理学领域中已知的或以后开发的任何方法来制备。通常,这样的制备方法包括以下步骤:使一种或多种活性成分与赋形剂和/或一种或多种其他辅助成分结合,然后,如果必要和/或期望的话,将产品成形和/或包装成粉末。所需的单剂量或多剂量单位。药物制剂可以另外包含药学上可接受的赋形剂,如本文所用,其包括任何和所有溶剂、分散介质、稀释剂或其他液体媒介物、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂。适用于所需特定剂型的固体粘合剂、润滑剂等。remington的thescienceandpracticeofpharmacy,第21版,a.r.gennaro(lippincott,williams&wilkins,baltimore,md,2006,通过引用整体并入),公开了用于配制药物组合物的各种赋形剂及其制备已知技术。关于用于生产包含核酸酶的药物组合物的其他合适的方法、试剂、赋形剂和溶剂,还参见2010年11月2日提交的国际第pct/us2010/055131号专利申请(第wo2011/053982a8号国际专利申请)。[0814]除非任何常规的赋形剂介质与物质或其衍生物不兼容,例如通过产生任何不希望的生物学作用或以有害的方式与药物组合物的任何其他组分相互作用,否则预期其用途在本申请的范围内。[0815]如上所述的组合物可以有效量施用。有效量将取决于给药方式,所治疗的特定病症和期望的结果。它还可能取决于状况的阶段,受试者的年龄和身体状况,同时治疗的性质(如果有)以及执业医生众所周知的类似因素。对于治疗应用,所述量足以达到医学上理想的结果。[0816]rtt的治疗方法[0817]还提供了治疗引起rtt的rett综合征(rtt)和/或mecp2中的基因突变的方法,其包括向受试者(例如,哺乳动物,例如人)施用治疗有效量的药物组合物。包含编码本文描述的碱基编辑器系统(例如,碱基编辑器和grna)的多核苷酸。在一些实施方案中,碱基编辑器是融合蛋白,其包含多核苷酸可编程dna结合结构域和腺苷脱氨酶结构域或胞苷脱氨酶结构域。用碱基编辑器和靶向所述碱基编辑器的一个或多个指导多核苷酸转导受试者的细胞以造成a·t到g·c的改变(如果所述细胞被腺苷脱氨酶结构域转导)或c·g含有mecp2基因突变的核酸序列发生u·a改变(如果细胞被胞苷脱氨酶结构域转导)。[0818]本文的方法包括对受试者(包括经鉴定为需要这种治疗的受试者,或怀疑有患疾病的风险和需要这种疗法的受试者)给予有效量的本文所述的组合物。识别需要这种治疗的受试者可以在受试者或卫生保健专业人员的判断中,并且可以是主观的(例如意见)或客观的(例如可以通过测试或诊断方法测量)。[0819]通常,治疗方法包括给予治疗有效量的药物组合物,所述药物组合物包括例如编码碱基编辑器的载体和靶向受试者(例如人类患者)的mecp2基因的grna。需要它。这样的治疗将适当地施用于患有rtt、患有rtt、具有rtt或具有rtt的风险的受试者,特别是人类受试者。本文的组合物还可以用于治疗可能涉及rtt的任何其他疾病。[0820]在一个实施例中,本申请提供了一种监测治疗进度的方法。所述方法包括以下步骤:确定患有或易受与rtt相关的病症或其症状的受试者的诊断标志物(marker)(例如,与rtt相关的snp)或诊断测量值(例如,筛选、测定)的水平。已向受试者施用足以治疗所述疾病或其症状的治疗量的本文组合物。所述方法确定的标志物水平可以与健康正常对照者或其他患病患者的已知标志物水平进行比较,以确定受试者的疾病状况。在优选的实施方案中,在确定第一水平之后的时间点确定受试者中第二水平的标志物,并且比较这两个水平以监测疾病的进程或治疗的功效。在某些优选的实施方案中,在根据本申请开始治疗之前确定受试者中标志物的治疗前水平。然后可以将所述治疗前的标志物水平与治疗开始后受试者中标志物的水平进行比较,以确定治疗的功效。[0821]在一些实施方案中,细胞获自受试者并与本文提供的药物组合物接触。在一些实施方案中,任选地在细胞中已经造成或检测到所需的基因组修饰之后,将从受试者中取出并与药物组合物离体接触的细胞重新引入受试者中。递送包含核酸酶的药物组合物的方法描述于,例如,美国第6,453,24号专利2;美国第6,453,242号专利;美国第5,644,242号专利;和美国第6,503,717号专利;第6,534,261号专利;第6,599,692号专利;第6,607,882号专利;第6,689,558号专利;第6,824,978号专利;第6,933,113号专利;第6,979,539号专利;第7,013,219号专利;和第7,163,824号专利,其全部公开内容通过引用整体并入本文。尽管本文提供的药物组合物的描述主要针对适合于向人给药的药物组合物,但是本领域技术人员应理解,此类组合物通常适合于向各种动物或生物体给药,例如,兽医用途。[0822]套件[0823]本申请的各个方面提供了包括碱基编辑器系统的试剂盒。在一个实施方案中,试剂盒包含核酸构建体,所述核酸构建体包含编码核碱基编辑器融合蛋白的核苷酸序列。融合蛋白包含脱氨酶(例如胞苷脱氨酶或腺嘌呤脱氨酶)和核酸可编程dna结合蛋白(napdnabp)。在一些实施方案中,试剂盒包含至少一种能够靶向感兴趣的核酸分子例如mecp2rtt相关突变的指导rna。在一些实施方案中,试剂盒包含核酸构建体、所述核酸构建体包含编码至少一个指导rna的核苷酸序列。[0824]在一些实施方案中,试剂盒提供了使用所述试剂盒编辑一个或多个与mecp2rtt相关的突变的说明。说明书通常将包括有关使用试剂盒编辑核酸分子的信息。在其他实施例中,所述指令包括以下至少之一:注意事项;警告;临床研究;和/或参考。这些说明可以直接印在容器上(如果有),也可以贴在容器上的标签,也可以印在容器内或随容器提供的单独的纸页、小册子、卡片或文件夹中。在另一个实施方案中,试剂盒可以包括标签或单独的插入物(包装插入物)形式的用于合适的操作参数的说明书。在又一个实施方案中,试剂盒可包含一个或多个带有适当的阳性和阴性对照或对照样品的容器,以用作检测、校准或归一化的标准。所述试剂盒可以进一步包括第二容器,所述第二容器包含药学上可接受的缓冲液,例如(无菌的)磷酸盐缓冲盐水、林格氏溶液或右旋糖溶液。从商业和用户的角度来看,它还可包括其他材料,包括其他缓冲液、稀释剂、过滤器、针头、注射器和带有使用说明的包装说明书。[0825]在某些实施方案中,所述试剂盒可用于治疗患有rett综合症的受试者。[0826]除非另有说明,否则本文公开的实施方案的实施采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术,其在本领域技术范围内。例如,参见,sambrookandgreen,molecularcloning:alaboratorymanual,4thedition(2012);theseriescurrentprotocolsinmolecularbiology(f.m.ausubel,etal.eds.);theseriesmethodsinenzymology(academicpress,inc.),pcr2:apracticalapproach(m.j.macpherson,b.d.hamesandg.r.tayloreds.(1995)),harlowandlane,eds.(1988);antibodies,alaboratorymanual,andcultureofanimalcells:amanualofbasictechniqueandspecializedapplications,6thedition(r.i.freshney,ed.(2010))。[0827]本文设想了涵盖碱基编辑器系统和用途的方法和组成的以下编号的附加实施例:[0828]1.一种对有此需要的受试者中治疗rett综合症(rtt)的方法,其包括向所述受试者施用碱基编辑器系统,所述系统包括[0829]指导多核苷酸或编码所述指导多核苷酸的核酸;[0830]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0831]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0832]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以引起所述受试者细胞的mecp2多核苷酸中rtt的单核苷酸多态性(snp)的a·t至g·c改变,从而治疗rtt。[0833]2.一种在对有此需要的受试者中治疗rett综合症(rtt)的方法,包括[0834](a)将碱基编辑器系统引入单元格,所述系统包括[0835]指导多核苷酸或编码所述指导多核苷酸的核酸;[0836]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0837]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,以及[0838](b)将细胞施用于受试者,[0839]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以引起细胞中mecp2多核苷酸中rtt的单核苷酸多态性(snp)的a·t至g·c改变,从而治疗所述疾病。[0840]3.根据实施方案2的方法,其中所述细胞是神经元。[0841]4.根据实施方案2或3的方法,其中所述细胞对于所述受试者是自体的、同种异体的或异种的。[0842]5.一种编辑mecp2多核苷酸的方法,其包括使所述mecp2多核苷酸与包含以下内容的碱基编辑器系统接触:[0843]指导多核苷酸;[0844]多核苷酸可编程dna结合域,以及[0845]腺苷脱氨酶结构域,[0846]其中所述指导多核苷酸能够靶向所述碱基编辑器系统,以造成mecp2多核苷酸中引起rett综合症(rtt)的单核苷酸多态性(snp)的a·t至g·c。[0847]6.一种生产用于治疗rett综合症(rtt)的修饰细胞的方法,其包括将碱基编辑器系统引入细胞中,所述碱基编辑器系统包括[0848]指导多核苷酸或编码所述指导多核苷酸的核酸;[0849]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0850]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0851]其中所述指导多核苷酸能够靶向所述碱基编辑器系统,以在细胞中的mecp2多核苷酸中引起rtt的单核苷酸多态性(snp)从a·t到g·c改变。[0852]7.根据实施方案6的方法,其中所述引入是体内的。[0853]8.根据实施方案6的方法,其中所述引入是离体的。[0854]9.根据实施方案6至8中任一项的方法,其中所述细胞是神经元。[0855]10.根据实施方案6至9中任一项的方法,其中所述细胞获自患有rtt的受试者。[0856]11.前述实施方案中任一项的方法,其中mecp2多核苷酸编码包含病原性氨基酸的mecp2蛋白,所述病原性氨基酸在位置106包含色氨酸、在位置133具有半胱氨酸、在位置255具有终止密码子、在位置270具有终止密码子或由snp产生的在位置306具有半胱氨酸。[0857]12.根据实施方案11的方法,其中所述a·t至g·c改变用野生型氨基酸替代病原性氨基酸。[0858]13.一种在有此需要的受试者中治疗rett综合症(rtt)的方法,包括向所述受试者施用碱基编辑器系统,所述系统包括[0859]指导多核苷酸或编码所述指导多核苷酸的核酸;[0860]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0861]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0862]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以引起所述受试者细胞的mecp2多核苷酸中rtt的单核苷酸多态性(snp)的a·t至g·c改变,[0863]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生的在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸,从而治疗了rtt。[0864]14.一种在有此需要的受试者中治疗rett综合症(rtt)的方法,包括[0865](a)使单元与碱基编辑器系统联系,所述碱基编辑器系统包括[0866]指导多核苷酸或编码所述指导多核苷酸的核酸;[0867]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0868]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0869](b)将细胞施用于受试者,[0870]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以引起细胞中mecp2多核苷酸中rtt的单核苷酸多态性(snp)的a·t至g·c改变,[0871]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生的在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸,从而治疗了rtt。[0872]15.根据实施方案14的方法,其中所述细胞是神经元。[0873]16.根据实施方案14或15的方法,其中所述细胞对于所述受试者是自体的、同种异体的或异种的。[0874]17.一种校正在mecp2多核苷酸中引起rtt的单核苷酸多态性(snp)的方法,其包括使所述mecp2多核苷酸与包含以下内容的碱基编辑器系统接触:[0875]指导多核苷酸;[0876]多核苷酸可编程dna结合域,以及[0877]腺苷脱氨酶结构域,[0878]其中所述指导多核苷酸能够靶向所述碱基编辑系统以造成所述snp的a·t至g·c,[0879]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸,从而校正了snp。[0880]18.一种生产用于治疗rett综合症(rtt)的修饰细胞的方法,其包括将碱基编辑器系统引入细胞中,所述碱基编辑器系统包括:[0881]指导多核苷酸或编码所述指导多核苷酸的核酸;[0882]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0883]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0884]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以造成所述细胞中mecp2多核苷酸中单核苷酸多态性(snp)的a·t至g·c改变,[0885]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸。[0886]19.根据实施方案18的方法,其中所述引入是体内的。[0887]20.根据实施方案18的方法,其中所述引入是离体的。[0888]21.根据实施方案18至20中任一项的方法,其中所述细胞是神经元。[0889]22.根据实施方案18至21中任一项的方法,其中所述细胞获自患有rtt的受试者。[0890]23.根据实施方案12至22中任一项的方法,其中所述野生型氨基酸是精氨酸。[0891]24.根据实施方案23的方法,其中所述a·t至g·c的改变用精氨酸替代了mecp2蛋白的255位的终止密码子。[0892]25.根据实施方案24的方法,其中所述snp在mecp2多核苷酸的位置763处。[0893]26.前述实施方案中任一项的方法,其中所述多核苷酸可编程dna结合结构域是cas9结构域。[0894]27.根据实施方案26的方法,其中所述cas9结构域是核酸酶失活的cas9结构域。[0895]28.根据实施方案26的方法,其中所述cas9结构域是cas9切口酶结构域。[0896]29.根据实施方案26至28中任一项的方法,其中所述cas9结构域包含spcas9结构域[0897]30.根据实施方案29的方法,其中所述spcas9结构域包含d10a和/或h840a的氨基酸取代或其相应的氨基酸取代。[0898]31.根据实施方案29或30的方法,其中所述spcas9结构域对nggpam具有特异性。[0899]32.根据实施方案29至31中任一项的方法,其中所述spcas9结构域对ngapam、ngtpam或ngcpam具有特异性。[0900]33.根据实施方案29至32中任一项的方法,其中所述spcas9结构域包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332a、r1335q、t1337i、t1337v、t1337f和t1337m中的一个或多个的氨基酸取代或其相应的氨基酸取代。[0901]34根据实施方案29至32中任一项的方法,其中所述spcas9结构域包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r以及l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q和t1337m中的一个或多个的氨基酸取代或相应的氨基酸取代。[0902]35.根据实施方案29至32中任一项的方法,其中所述spcas9结构域包含d1135l、s1136r、g1218s、e1219v、a1322r、r1335q、t1337和a1322r、以及l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q及t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代。[0903]36.根据实施方案29至32中任一项的方法,其中所述spcas9结构域包含d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r中的一个或多个的氨基酸取代,或其相应的氨基酸取代。[0904]37.根据实施方案29至32中任一项的方法,其中所述spcas9结构域对ngpam、nggpam、gaapam、gatpam或caapam具有特异性。[0905]38.根据实施方案36的方法,其中所述cas9结构域包含e480k、e543k和e1219v的氨基酸取代或其相应的氨基酸取代。[0906]39.根据实施方案26至28中任一项的方法,其中所述cas9结构域包含sacas9结构域。[0907]40.根据实施例39所述的方法,其中所述sacas9结构域对nnnrrtpam具有特异性。[0908]41.根据实施例40所述的方法,其中所述sacas9结构域对nngrrtpam具有特异性。[0909]42.根据实施方案39至41中任一项的方法,其中所述sacas9结构域包含n579a的氨基酸取代或其对应的氨基酸取代。[0910]43.根据实施方案39至42中任一项的方法,其中所述sacas9结构域包含e782k、n968k和r1015h的氨基酸取代或其相应的氨基酸取代。[0911]44.根据实施方案26至28中任一项的方法,其中所述cas9结构域包含st1cas9结构域。[0912]45.根据实施例44所述的方法,其中所述st1cas9结构域对nnaccapam具有特异性。[0913]46.根据前述实施方案中任一项的方法,其中所述腺苷脱氨酶结构域是自然界中不存在的修饰的腺苷脱氨酶结构域。[0914]47.根据实施方案46的方法,其中所述腺苷脱氨酶结构域包含tada结构域。[0915]48.根据实施方案47的方法,其中tada结构域包含tada7.10的氨基酸序列。[0916]49.根据前述实施例中任一项所述的方法,其中,所述碱基编辑器系统还包括锌指结构域。[0917]50.根据实施方案97的方法,其中所述锌指结构域包含识别螺旋序列rnehlev、qsttlkr和rtehlar或识别螺旋序列rgehlrq、qsgtlkr和rndklvp。[0918]51.根据实施方案49或50的方法,其中所述锌指结构域是zf1ra或zf1rb。[0919]52.根据前述实施例中任一项所述的方法,其中,所述碱基编辑器系统还包括核定位信号(nls)。[0920]53.根据前述实施例中任一项所述的方法,其中,所述碱基编辑器系统还包括一个或多个接头。[0921]54.根据实施方案53的方法,其中所述多核苷酸可编程dna结合结构域、腺苷脱氨酶结构域、锌指结构域和nls中的两个或更多个是经由接头连接。[0922]55.根据实施方案54的方法,其中所述接头是肽接头,从而形成碱基编辑融合蛋白。[0923]56.根据实施方案55的方法,其中所述肽接头包含选自以下的氨基酸序列:sggssgsetpgtsesatpessggs、sggssggssgsetpgtsesatpessggssggs,ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs、sggssggssgsetpgtsesatpes、sggssggssgsetpgtsesatpessggssggssggssggs、sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs、pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats、(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes和(xp)n。[0924]57.根据实施方案55或56的方法,其中所述碱基编辑融合蛋白包含选自以下的氨基酸序列:[0925]mpkkkrkvsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpesdlvlglaigigsvgvgilnkvtgeiihknsrifpaaqaennlvrrtnrqgrrlarrkkhrrvrlnrlfeesglitdftkisinlnpyqlrvkgltdelsneelfialknmvkhrgisylddasddgnssvgdyaqivkenskqletktpgqiqleryqtygqlrgdftvekdgkkhrlinvfptsayrsealrilqtqqefnpqitdefinryleiltgkrkyyhgpgneksrtdygryrtsgetldnifgiligkctfypdefraakasytaqefnllndlnnltvptetkklskeqknqiinyvknekamgpaklfkyiakllscdvadikgyridksgkaeihtfeayrkmktletldieqmdretldklayvltlnteregiqealehefadgsfsqkqvdelvqfrkanssifgkgwhnfsvklmmelipelyetseeqmtiltrlgkqkttsssnktkyidekllteeiynpvvaksvrqaikivnaaikeygdfdniviemaretneddekkaiqkiqkankdekdaamlkaanqyngkaelphsvfhghkqlatkirlwhqqgerclytgktisihdlinnsnqfevdhilplsitfddslankvlvyatanqekgqrtpyqaldsmddawsfrelkafvresktlsnkkkeyllteediskfdvrkkfiernlvdtlyasrvvlnalqehfrahkidtkvsvvrgqftsqlrrhwgiektrdtyhhhavdaliiaassqlnlwkkqkntlvsysedqlldietgelisddeykesvfkapyqhfvdtlkskefedsilfsyqvdskfnrkisdatiyatrqakvgkdkadetyvlgkikdiytqdgydafmkiykkdkskflmyrhdpqtfekviepilenypnkqindkgkevpcnpflkykeehgyirkyskkgngpeikslkyydsklgnhiditpkdsnnkvvlqsvspwradvyfnkttgkyeilglkyadlqfdkgtgtykisqekyndikkkegvdsdsefkftlykndlllvkdtetkeqqlfrflsrtmpkqkhyvelkpydkqkfeggealikvlgnvansgqckkglgksnisiykvrtdvlgnqhiiknegdkpkldfpkkkrkvegadkrtadgsefespkkkrkv、msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkv、msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrnehlevhtrthtgekpfqcricmrnfsqsttlkrhlrthtgekpfqcricmrnfsrtehlarhlkthlrgssaq或msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrgehlrqhtrthtgekpfqcricmrnfsqsgtlkrhlrthtgekpfqcricmrnfsrndklvphlkthlrgssaq。[0926]58.根据前述实施方案中任一项的方法,其中所述指导多核苷酸包含两个单独的多核苷酸,其中所述两个单独的多核苷酸是两个dna、两个rna或dna和rna。[0927]59.根据实施方案1至58中任一项的方法,其中所述指导多核苷酸包含crrna和tracrrna,其中所述crrna包含与mecp2多核苷酸中的靶序列互补的核酸序列。[0928]60.根据实施方案59的方法,其中靶序列包括选自以下的序列:[0929]ccatgtccagccttcaggca、tccatgtccagccttcaggc、ttccatgtccagccttcagg、gcttccatgtccagccttca、cttccatgtccagccttcagg、agcttccatgtccagccttcagg、agcttccatgtccagccttc、cttaagcttccatgtccagc、agcaaaaggcttttccctgg、gagcaaaaggcttttccctg、agagcaaaaggcttttccct、tagagcaaaaggcttttccc、tagagcaaaaggcttttccct、tttagagcaaaaggcttttccct、ccatgaagtcaaaatcatta、accatgaagtcaaaatcatt、taccatgaagtcaaaatcat、ttaccatgaagtcaaaatcat、agttaccatgaagtcaaaatcat、cttttcacttcctgccgggg、tcagccccgtttcttgggaa、gctttcagccccgtttcttg、cggctttcagccccgtttctt、cccggctttcagccccgtttctt、gcacttcttgatggggagta、tcttgcacttcttgatgggg、cttgcacttcttgatggggag以及gtcttgcacttcttgatggggag。[0930]61.根据实施例58或59所述的方法,其中所述碱基编辑器系统包括单个指导rna(sgrna)。[0931]62.根据实施方案60的方法,其中所述sgrna包含cuuuucacuuccugccgggg。[0932]63.一种包括碱基编辑器系统的修饰的单元,所述碱基编辑器系统包括[0933]指导多核苷酸或编码所述指导多核苷酸的核酸;[0934]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0935]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0936]其中所述指导多核苷酸能够靶向所述碱基编辑器系统,以在细胞中的mecp2多核苷酸中引起rett综合症(rtt)的单核苷酸多态性(snp)的a·t到g·c改变。[0937]64.一种包括碱基编辑器系统的修饰的单元,所述碱基编辑器系统包括[0938]指导多核苷酸或编码所述指导多核苷酸的核酸;[0939]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0940]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0941]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以造成细胞中mecp2多核苷酸中引起rett综合症(rtt)的单核苷酸多态性(snp)的a·t到g·c改变,[0942]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸。[0943]65.根据实施方案63的修饰的细胞,其中mecp2多核苷酸编码包含病原性氨基酸的mecp2蛋白,所述病原性氨基酸在106位包含色氨酸、在133位具有半胱氨酸、在255位具有终止密码子、在270位具有终止密码子或snp产生的306位半胱氨酸。[0944]66.根据实施方案65的修饰的细胞,其中所述a·t至g·c改变用野生型氨基酸替代病原性氨基酸。pam、nggpam、gaapam、gatpam或caapam具有特异性。[0962]84.根据实施方案83的修饰的细胞,其中所述spcas9结构域包含e480k、e543k和e1219v的氨基酸取代或其相应的氨基酸取代。[0963]85.根据实施方案72至74中任一项的修饰的细胞,其中所述cas9结构域包含sacas9结构域。[0964]86.根据实施方案85的修饰的细胞,其中所述sacas9结构域对nnnrrtpam具有特异性。[0965]87.根据实施方案86的修饰的细胞,其中所述sacas9结构域对nngrrtpam具有特异性。[0966]88.根据实施方案85至87中任一项的修饰的细胞,其中所述sacas9结构域包含n579a的氨基酸取代或其对应的氨基酸取代。[0967]89.根据实施方案85至88中任一项的修饰的细胞,其中所述sacas9结构域包含e782k、n968k和r1015h的氨基酸取代或其相应的氨基酸取代。[0968]90.根据实施方案72至74中任一项的修饰的细胞,其中所述cas9结构域包含st1cas9结构域。[0969]91.根据实施方案90的修饰的细胞,其中所述st1cas9结构域对nnaccapam具有特异性。[0970]92.根据实施方案63至91中任一项的修饰的细胞,其中所述腺苷脱氨酶结构域是自然界中不存在的修饰的腺苷脱氨酶结构域。[0971]93.根据实施方案92的修饰的细胞,其中所述腺苷脱氨酶结构域包含tada结构域。[0972]94.根据实施方案93的修饰的细胞,其中tada结构域包含tada7.10的氨基酸序列。[0973]95.根据实施方案63至94的修饰的单元,其中所述碱基编辑器系统进一步包含锌指结构域。[0974]96.根据实施方案95的修饰的细胞,其中所述锌指结构域包含识别螺旋序列rnehlev、qsttlkr和rtehlar或识别螺旋序列rgehlrq、qsgtlkr和rndklvp。[0975]97.根据实施方案95或96的修饰的细胞,其中所述锌指结构域是zf1ra或zf1rb。[0976]98.根据实施例63至97中任一实施例所述的经修饰的单元,其中,所述碱基编辑器系统还包括核定位信号(nls)。[0977]99.根据实施例63至98中任一实施例所述的经修饰的单元格,其中,所述碱基编辑器系统还包括一个或多个接头。[0978]100.根据实施方案99的修饰的细胞,其中所述多核苷酸可编程dna结合结构域、腺苷脱氨酶结构域、锌指结构域和nls中的两个或更多个经由接头连接。[0979]101.根据实施方案54的修饰的细胞,其中所述接头是肽接头,从而形成碱基编辑融合蛋白。[0980]102.根据实施方案100的修饰的细胞,其中所述肽接头包含选自以下的氨基酸序列:sggssggssgsetpgtsesatpessggssggs、ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs、sggssggssgsetpgtsesatpes、sggssggssgsetpgtsesatpessggssggssggssggs、sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs、pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats、(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes和(xp)n。[0981]103.根据实施方案101或102的修饰的细胞,其中所述碱基编辑融合蛋白包含选自以下的氨基酸序列:[0982]mpkkkrkvsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpesdlvlglaigigsvgvgilnkvtgeiihknsrifpaaqaennlvrrtnrqgrrlarrkkhrrvrlnrlfeesglitdftkisinlnpyqlrvkgltdelsneelfialknmvkhrgisylddasddgnssvgdyaqivkenskqletktpgqiqleryqtygqlrgdftvekdgkkhrlinvfptsayrsealrilqtqqefnpqitdefinryleiltgkrkyyhgpgneksrtdygryrtsgetldnifgiligkctfypdefraakasytaqefnllndlnnltvptetkklskeqknqiinyvknekamgpaklfkyiakllscdvadikgyridksgkaeihtfeayrkmktletldieqmdretldklayvltlnteregiqealehefadgsfsqkqvdelvqfrkanssifgkgwhnfsvklmmelipelyetseeqmtiltrlgkqkttsssnktkyidekllteeiynpvvaksvrqaikivnaaikeygdfdniviemaretneddekkaiqkiqkankdekdaamlkaanqyngkaelphsvfhghkqlatkirlwhqqgerclytgktisihdlinnsnqfevdhilplsitfddslankvlvyatanqekgqrtpyqaldsmddawsfrelkafvresktlsnkkkeyllteediskfdvrkkfiernlvdtlyasrvvlnalqehfrahkidtkvsvvrgqftsqlrrhwgiektrdtyhhhavdaliiaassqlnlwkkqkntlvsysedqlldietgelisddeykesvfkapyqhfvdtlkskefedsilfsyqvdskfnrkisdatiyatrqakvgkdkadetyvlgkikdiytqdgydafmkiykkdkskflmyrhdpqtfekviepilenypnkqindkgkevpcnpflkykeehgyirkyskkgngpeikslkyydsklgnhiditpkdsnnkvvlqsvspwradvyfnkttgkyeilglkyadlqfdkgtgtykisqekyndikkkegvdsdsefkftlykndlllvkdtetkeqqlfrflsrtmpkqkhyvelkpydkqkfeggealikvlgnvansgqckkglgksnisiykvrtdvlgnqhiiknegdkpkldfpkkkrkvegadkrtadgsefespkkkrkv、msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkv、[0983]msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrnehlevhtrthtgekpfqcricmrnfsqsttlkrhlrthtgekpfqcricmrnfsrtehlarhlkthlrgssaq或msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrgehlrqhtrthtgekpfqcricmrnfsqsgtlkrhlrthtgekpfqcricmrnfsrndklvphlkthlrgssaq。[0984]104.根据实施方案63至103中任一项的修饰的细胞,其中所述指导多核苷酸包含两个单独的多核苷酸,其中所述两个单独的多核苷酸是两个dna、两个rna或dna和rna。[0985]105.根据实施方案63至104中任一项的修饰的细胞,其中所述指导多核苷酸包含crrna和tracrrna,其中所述crrna包含与mecp2多核苷酸中的靶序列互补的核酸序列。[0986]106.根据实施方案105的修饰的细胞,其中所述靶序列包括选自以下的序列:[0987]ccatgtccagccttcaggca、tccatgtccagccttcaggc、ttccatgtccagccttcagg、gcttccatgtccagccttca、cttccatgtccagccttcagg、agcttccatgtccagccttcagg、agcttccatgtccagccttc、cttaagcttccatgtccagc、agcaaaaggcttttccctgg、gagcaaaaggcttttccctg、agagcaaaaggcttttccct、tagagcaaaaggcttttccc、tagagcaaaaggcttttccct、tttagagcaaaaggcttttccct、ccatgaagtcaaaatcatta、accatgaagtcaaaatcatt、taccatgaagtcaaaatcat、ttaccatgaagtcaaaatcat、agttaccatgaagtcaaaatcat、cttttcacttcctgccgggg、tcagccccgtttcttgggaa、gctttcagccccgtttcttg、cggctttcagccccgtttctt、cccggctttcagccccgtttctt、gcacttcttgatggggagta、tcttgcacttcttgatgggg、cttgcacttcttgatggggag以及gtcttgcacttcttgatggggag.[0988]107.根据实施方案105或106的修饰的细胞,其中所述碱基编辑器系统包含单个指导rna(sgrna)。[0989]108.根据实施方案107的修饰的细胞,其中所述sgrna包含cuuuucacuuccugccgggg。[0990]109.一种碱基编辑器系统,包括[0991]指导多核苷酸或编码所述指导多核苷酸的核酸;[0992]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0993]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0994]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以造成mecp2多核苷酸中引起rett综合症(rtt)的单核苷酸多态性(snp)的a·t至g·c改变。[0995]110.一种碱基编辑器系统,包括[0996]指导多核苷酸或编码所述指导多核苷酸的核酸;[0997]多核苷酸可编程dna结合结构域或编码多核苷酸可编程dna结合结构域的核酸,以及[0998]腺苷脱氨酶结构域或编码腺苷脱氨酶结构域的核酸,[0999]其中所述指导多核苷酸能够靶向所述碱基编辑器系统以造成mecp2多核苷酸中引起rett综合症(rtt)的单核苷酸多态性(snp)的a·t至g·c改变,[1000]其中,mecp2多肽编码由病原性氨基酸引起的mecp2蛋白,所述病原性氨基酸包含在106位的色氨酸、在133位的半胱氨酸、在255位的终止密码子、在270位的终止密码子或由snp产生在306位的半胱氨酸,其中a·t到g·c的变化用野生型氨基酸替代了致病性氨基酸。[1001]111.根据实施方案109的碱基编辑器系统,其中mecp2多核苷酸编码包含病原性氨基酸的mecp2蛋白,所述病原性氨基酸在位置106包含色氨酸、在位置133包含半胱氨酸、在位置255具有终止密码子、在位置270具有终止密码子或snp产生306位的半胱氨酸。[1002]112.根据实施方案111的碱基编辑器系统,其中所述a·t至g·c改变用野生型氨基酸替代病原性氨基酸。[1003]113.根据实施方案110至112中任一项的碱基编辑器系统,其中所述野生型氨基酸是精氨酸。[1004]114.根据实施方案113的碱基编辑器系统,其中所述a·t至g·c改变用精氨酸替代了mecp2蛋白的位置255处的终止密码子。[1005]115.根据实施方案114的碱基编辑器系统,其中所述snp在mecp2多核苷酸的位置763处。[1006]116.根据实施方案109至115中任一项的碱基编辑器系统,其中所述多核苷酸可编程dna结合结构域是cas9结构域。[1007]117.根据实施方案116的碱基编辑器系统,其中所述cas9结构域是核酸酶失活的cas9结构域。[1008]118.根据实施例117所述的碱基编辑器系统,其中,所述cas9域是cas9切口酶域。[1009]119.根据实施方案116至118中任一项的方法,其中所述cas9结构域包含spcas9结构域[1010]120.根据实施方案119的碱基编辑器系统,其中所述spcas9结构域包含d10a和/或h840a的氨基酸取代或其相应的氨基酸取代。[1011]121.根据实施例119或120所述的碱基编辑器系统,其中所述spcas9结构域对nggpam具有特异性。[1012]122.根据实施例119至121中任一实施例所述的碱基编辑器系统,其中所述spcas9结构域对ngapam、ngtpam或ngcpam具有特异性。[1013]123.根据实施方式119至121中任一项的碱基编辑器系统,其中所述spcas9结构域包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332a、r1335q、t1337i、t1337v、t1337f和t1337m中的一个或多个的氨基酸取代,或其相应的氨基酸取代。[1014]124.根据实施方案119至121中任一项的碱基编辑器系统,其中所述spcas9结构域包含l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q和t1337m中的一个或多个的氨基酸取代,或相应的氨基酸取代。[1015]125.根据实施方式119至121中任一项的碱基编辑器系统,其中所述spcas9结构域包含d1135l、s1136r、g1218s、e1219v、a1322r、r1335q、t1337和a1322r、以及l1111、d1135l、s1136r、g1218s、e1219v、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337m中的一个或多个的氨基酸取代,或相应的氨基酸取代。[1016]126.根据实施方案119至121中任一项的碱基编辑器系统,其中所述spcas9结构域包含d1135m、s1136q、g1218k、e1219f、a1322r、d1332a、r1335e和t1337r的氨基酸取代,或其相应的氨基酸取代。[1017]127.根据实施例119或120中任一实施例所述的碱基编辑器系统,其中,所述spcas9结构域对ngpam、nngpam、gaapam、gatpam或caapam具有特异性。[1018]128.根据实施方案127的碱基编辑器系统,其中所述cas9结构域包含e480k、e543k和e1219v的氨基酸取代或其相应的氨基酸取代。[1019]129.根据实施例116至118中任一实施例所述的碱基编辑器系统,其中所述cas9域包括sacas9结构域。[1020]130.根据实施例129所述的碱基编辑器系统,其中,所述sacas9结构域对nnnrrtpam具有特异性。[1021]131.根据实施例130所述的碱基编辑器系统,其中,所述sacas9结构域对nngrrtpam具有特异性。[1022]132.根据实施方案129至131中任一项的碱基编辑器系统,其中所述sacas9结构域包含n579a的氨基酸取代或其对应的氨基酸取代。[1023]133.根据实施方案129至132中任一项的碱基编辑器系统,其中所述sacas9结构域包含e782k、n968k和r1015h的氨基酸取代或其相应的氨基酸取代。[1024]134.根据实施例116至118中任一实施例所述的碱基编辑器系统,其中,所述cas9域包括st1cas9结构域。[1025]135.根据实施例134所述的碱基编辑器系统,其中,所述st1cas9结构域对nnaccapam具有特异性。[1026]136.根据实施方案109至135中任一项的碱基编辑器系统,其中所述腺苷脱氨酶结构域是自然界中不存在的修饰的腺苷脱氨酶结构域。[1027]137.根据实施方案136的碱基编辑器系统,其中所述腺苷脱氨酶结构域包含tada结构域。[1028]138.根据实施方案137的碱基编辑器系统,其中tada结构域包含tada7.10的氨基酸序列。[1029]139.根据实施方式109至138中任一项的碱基编辑器系统,其中所述碱基编辑器系统进一步包括锌指结构域。[1030]140.根据实施例139所述的碱基编辑器系统,其中所述锌指结构域包含识别螺旋序列rnehlev、qsttlkr和rtehlar或识别螺旋序列rgehlrq、qsgtlkr和rndklvp。[1031]141.根据实施方案139或140的碱基编辑器系统,其中所述锌指结构域是zf1ra或zf1rb。[1032]142.根据实施例109至141中任一实施例所述的碱基编辑器系统,其中,所述碱基编辑器系统还包括核定位信号(nls)。[1033]143.根据实施例109至142中任一项所述的碱基编辑器系统,其中,所述碱基编辑器系统还包括一个或多个接头。[1034]144.根据实施方案143的碱基编辑器系统,其中所述多核苷酸可编程dna结合结构域、腺苷脱氨酶结构域、锌指结构域和nls中的两个或更多个经由接头连接。[1035]145.根据实施方案144的碱基编辑器系统,其中所述接头是肽接头,从而形成碱基编辑融合蛋白。[1036]146.根据实施例145的碱基编辑系统,其中,所述肽接头包含选自sggssgsetpgtsesatpessggs、sggssggssgsetpgtsesatpessggssggs、ggsggspgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepatsggsggs、sggssggssgsetpgtsesatpes、sggssggssgsetpgtsesatpessggssggssggssggs、sggssggssgsetpgtsesatpessggssggssggssggssgsetpgtsesatpessggssggs、pgspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepsegsapgtsesatpesgpgsepats、(sggs)n、(gggs)n、(ggggs)n、(g)n、(eaaak)n、(ggs)n、sgsetpgtsesatpes和(xp)n组成的组中的氨基酸序列。[1037]147.根据实施方案145或146的碱基编辑器系统,其中所述碱基编辑融合蛋白包含选自以下的氨基酸序列:[1038]mpkkkrkvsevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpesdlvlglaigigsvgvgilnkvtgeiihknsrifpaaqaennlvrrtnrqgrrlarrkkhrrvrlnrlfeesglitdftkisinlnpyqlrvkgltdelsneelfialknmvkhrgisylddasddgnssvgdyaqivkenskqletktpgqiqleryqtygqlrgdftvekdgkkhrlinvfptsayrsealrilqtqqefnpqitdefinryleiltgkrkyyhgpgneksrtdygryrtsgetldnifgiligkctfypdefraakasytaqefnllndlnnltvptetkklskeqknqiinyvknekamgpaklfkyiakllscdvadikgyridksgkaeihtfeayrkmktletldieqmdretldklayvltlnteregiqealehefadgsfsqkqvdelvqfrkanssifgkgwhnfsvklmmelipelyetseeqmtiltrlgkqkttsssnktkyidekllteeiynpvvaksvrqaikivnaaikeygdfdniviemaretneddekkaiqkiqkankdekdaamlkaanqyngkaelphsvfhghkqlatkirlwhqqgerclytgktisihdlinnsnqfevdhilplsitfddslankvlvyatanqekgqrtpyqaldsmddawsfrelkafvresktlsnkkkeyllteediskfdvrkkfiernlvdtlyasrvvlnalqehfrahkidtkvsvvrgqftsqlrrhwgiektrdtyhhhavdaliiaassqlnlwkkqkntlvsysedqlldietgelisddeykesvfkapyqhfvdtlkskefedsilfsyqvdskfnrkisdatiyatrqakvgkdkadetyvlgkikdiytqdgydafmkiykkdkskflmyrhdpqtfekviepilenypnkqindkgkevpcnpflkykeehgyirkyskkgngpeikslkyydsklgnhiditpkdsnnkvvlqsvspwradvyfnkttgkyeilglkyadlqfdkgtgtykisqekyndikkkegvdsdsefkftlykndlllvkdtetkeqqlfrflsrtmpkqkhyvelkpydkqkfeggealikvlgnvansgqckkglgksnisiykvrtdvlgnqhiiknegdkpkldfpkkkrkvegadkrtadgsefespkkkrkv、msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkv、msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrnehlevhtrthtgekpfqcricmrnfsqsttlkrhlrthtgekpfqcricmrnfsrtehlarhlkthlrgssaq、或msevefsheywmrhaltlakrawderevpvgavlvhnnrvigegwnrpigrhdptahaeimalrqgglvmqnyrlidatlyvtlepcvmcagamihsrigrvvfgardaktgaagslmdvlhhpgmnhrveitegiladecaallsdffrmrrqeikaqkkaqsstdsggssggssgsetpgtsesatpessggssggssevefsheywmrhaltlakrarderevpvgavlvlnnrvigegwnraiglhdptahaeimalrqgglvmqnyrlidatlyvtfepcvmcagamihsrigrvvfgvrnaktgaagslmdvlhypgmnhrveitegiladecaallcyffrmprqvfnaqkkaqsstdsggssggssgsetpgtsesatpessggssggskrnyilglaigitsvgygiidyetrdvidagvrlfkeanvennegrrskrgarrlkrrrrhriqrvkkllfdynlltdhselsginpyearvkglsqklseeefsaallhlakrrgvhnvneveedtgnelstkeqisrnskaleekyvaelqlerlkkdgevrgsinrfktsdyvkeakqllkvqkayhqldqsfidtyidlletrrtyyegpgegspfgwkdikewyemlmghctyfpeelrsvkyaynadlynalndlnnlvitrdenekleyyekfqiienvfkqkkkptlkqiakeilvneedikgyrvtstgkpeftnlkvyhdikditarkeiienaelldqiakiltiyqssediqeeltnlnseltqeeieqisnlkgytgthnlslkainlildelwhtndnqiaifnrlklvpkkvdlsqqkeipttlvddfilspvvkrsfiqsikvinaiikkyglpndiiielareknskdaqkminemqkrnrqtnerieeiirttgkenakyliekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylleerdinrfsvqkdfinrnlvdtryatrglmnllrsyfrvnnldvkvksinggftsflrrkwkfkkernkgykhhaedaliianadfifkewkkldkakkvmenqmfeekqaesmpeieteqeykeifitphqikhikdfkdykyshrvdkkpnrklindtlystrkddkgntlivnnlnglydkdndklkklinkspekllmyhhdpqtyqklklimeqygdeknplykyyeetgnyltkyskkdngpvikkikyygnklnahlditddypnsrnkvvklslkpyrfdvyldngvykfvtvknldvikkenyyevnskcyeeakklkkisnqaefiasfykndlikingelyrvigvnndllnrievnmidityreylenmndkrpphiiktiasktqsikkystdilgnlyevkskkhpqiikkgegadkrtadgsefespkkkrkvssgnsnansrgpsfssglvplslrgshsrpgerpfqcricmrnfsrgehlrqhtrthtgekpfqcricmrnfsqsgtlkrhlrthtgekpfqcricmrnfsrndklvphlkthlrgssaq.[1039]148.根据实施方案109至147中任一项的碱基编辑器系统,其中所述指导多核苷酸包含两个单独的多核苷酸,其中所述两个单独的多核苷酸是两个dna、两个rna或dna和rna。[1040]149.根据实施方案109至148中任一项的碱基编辑器系统,其中所述指导多核苷酸包含crrna和tracrrna,其中所述crrna包含与mecp2多核苷酸中的靶序列互补的核酸序列。[1041]150.根据实施例149所述的碱基编辑器系统,其中所述靶序列包括选自以下的序列:[1042]ccatgtccagccttcaggca、tccatgtccagccttcaggc、ttccatgtccagccttcagg、gcttccatgtccagccttca、cttccatgtccagccttcagg、agcttccatgtccagccttcagg、agcttccatgtccagccttc、cttaagcttccatgtccagc、agcaaaaggcttttccctgg、gagcaaaaggcttttccctg、agagcaaaaggcttttccct、tagagcaaaaggcttttccc、tagagcaaaaggcttttccct、tttagagcaaaaggcttttccct、ccatgaagtcaaaatcatta、accatgaagtcaaaatcatt、taccatgaagtcaaaatcat、ttaccatgaagtcaaaatcat、agttaccatgaagtcaaaatcat、cttttcacttcctgccgggg、tcagccccgtttcttgggaa、gctttcagccccgtttcttg、cggctttcagccccgtttctt、cccggctttcagccccgtttctt、gcacttcttgatggggagta、tcttgcacttcttgatgggg、cttgcacttcttgatggggag以及gtcttgcacttcttgatggggag.[1043]151.根据实施方案149或150的碱基编辑器系统,其中所述碱基编辑器系统包含单个指导rna(sgrna)。[1044]152.根据实施方案151的碱基编辑器系统,其中所述sgrna包含cuuuucacuuccugccgggg。[1045]实施例[1046]提供以下实施例仅用于说明目的,并不旨在限制本文提供的权利要求的范围。[1047]实施例1.从a·t到g·cdna碱基编辑,用于校正细胞中mecp2rtt相关的突变[1048]使用a·t到g·cdna碱基编辑器(abes),采用cas9部分和经过验证的原间隔子相邻基序(pam)序列为偏好,将八个最常见的导致rtt的mecp2突变中的六个靶向还原为野生型序列。为了确定哪种指导rna(grna)和abe‑cas9平台能够最有效,最准确地校正靶向的mecp2突变,通过慢病毒转导将包含rtt可靶向突变的mecp2等位基因(包括r255x)基因组整合到hek293t细胞中(表66)。测量给定突变的grna和abe‑cas9编辑器的编辑效率。转染编码abe‑cas9编辑器和grna的dna后五天,将细胞裂解,并通过miseq分析在所需位点分析碱基编辑。[1049]表6:6个rtt突变[1050][1051][1052][1053]在一组实验中,使用包含核酸序列cuuuucacuuccugccgggg的grna靶向r255x,所述grna将碱基编辑器靶向包含rtt突变763c>t的核酸序列cttttcacttcctgccgggg(r255x)。[1054]建立腺苷脱氨酶碱基编辑器,所述编辑器对具有l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和spcas9中的l1111、d1135l、s1136r、g1218s、e1219v、d1332a、t1337i、t1337v、t1337f和t1337m中的一个或多个氨基酸取代的ngtpam具有特异性。碱基编辑显示了通过精确校正r255x测得的活动。[1055]建立腺苷脱氨酶碱基编辑器,其对具有l1111r、d1135v、g1218r、e1219f、a1322r、r1335v、t1337r和l1111、d1135l、s1136r、g1218s、e1219v、d1332aspcas9中的d1332t、d1332v、d1332l、d1332k、d1332r、r1335q、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337h、t1337q和t1337m中的一个或多个氨基酸取代的ngtpam具有特异性。碱基编辑器显示通过精确校正r255x测得的活性(图1)。[1056]建立腺苷脱氨碱基编辑器,其对具有d1135l、s1136r、g1218s、e1219v、a1322r、r1335q和t1337以及spcas9中的l1111r、d1332a、d1332s、d1332t、d1332v、d1332l、d1332k、d1332r、t1337、t1337i、t1337v、t1337f、t1337s、t1337n、t1337k、t1337r、t1337h、t1337q和t1337m中的一个或多个氨基酸取代的ngtpam具有特异性。碱基编辑器显示了通过精确校正r255x测得的活性(图2)。pcag启动子用于左边的数据(浅灰色),而pcmv启动子用于右边的数据(深灰色)。[1057]如表7所示,产生对ngtpam具有特异性的腺苷脱氨酶碱基编辑器。[1058]表7.ngtpam变体[1059][1060]碱基编辑器显示通过精确校正r255x(图3)测得的活性。特别来说,变体6(也称为lrsvrql)显示4%的碱基编辑,是所有变体中最多的。变体6包含a1322r和t1337l。不受理论的束缚,提出这些氨基酸取代对于ngtpam特异性是重要的。[1061]将来自其他表征的pam变体的另外的突变引入pam变体6中。鉴定出氨基酸残基t1337对于编辑很重要(图4)。与t1337l相比,基于变体6并经过修饰以具有t1337q和t1337的pam变体显示出对r255x的更正编辑。与变体6相比,基于变体6并被修饰为具有d1332a的pam变体也被确定为具有更强的r255x校正编辑能力。[1062]为了进一步表征t1337和d1332处的残基,就校正r255x的编辑效率在这两个位置测试了不同的氨基酸。与在位置1337处的其他取代相比,t1337和t1337q是最重要的编辑残基(图5)。[1063]为了具体评估t1337,将pam变体中的单个氨基酸还原为野生型。不受理论的束缚,所述分析可以鉴定哪些残基对于ngtpam的活性是重要的。尤其是,e1219v和r1335q被证明对于与t1337相关的活性很重要,因为在这些残基中的每个残基上恢复为野生型的现象都大大降低了编辑性(图6)。[1064]分子建模还用于产生成对突变的资料库,以改善ngtpam的识别。改组氨基酸以创建55个pam变体6的新变体。下表8和表9列出了突变的类别:[1065]表8:残基1219、1335、1337、1218的ngtpam变异突变[1066][1067]表9:残基1135、1136、1218、1219和1335的ngtpam变异突变[1068][1069]表8和表9中的55个新pam变体的靶向突变增强了t1337的重要性(图7和8)。表8中的变体5显示了显著增强的编辑(图7)。特别地,变体5的序列(表8)包括对t1337的回复。[1070]产生了其他成对突变,以改善ngtpam识别,如表10所示。[1071]表10:残基1219、1335、1337、1218的ngtpam变异突变[1072][1073]产生了额外的成对突变,以提高ngtpam的识别率,如表10所示。取代g1218r是添加的,可以用e1219f、r1335v和t1337或t1337q编辑(图9)。[1074]实施例2.材料和方法[1075]本文所述实施例中提供的结果是使用以下材料和方法获得的。[1076]克隆[1077]使用verasequltradna聚合酶(enzymatics)或q5hotstart高保真dna聚合酶(newenglandbiolabs)进行pcr。使用user克隆(newenglandbiolabs)构建碱基编辑器(be)质粒。脱氨酶基因合成为gblocks基因片段(integrateddnatechnologies)。下面列出了使用的cas9基因。从先前报导的质粒获得cas9基因。将脱氨酶和融合基因克隆到pcmv(哺乳动物密码子优化)或pet28b(大肠杆菌密码子优化)骨架中。使用定点诱变构建sgrna表达质粒。[1078]简而言之,根据制造商的说明,使用t4多核苷酸激酶(newenglandbiolabs)将上面列出的引物5'磷酸化。接下来,根据制造商的说明,使用q5热启动高保真聚合酶(newenglandbiolabs),以磷酸化引物和编码mecp2的质粒为模板,进行pcr。将pcr产物与dpni(20u,newenglandbiolabs)在37℃下孵育1小时,在qiaprep旋转柱(qiagen)上纯化,并根据制造商的说明使用quickligase(newenglandbiolabs)连接。使用mach1感受态细胞(thermofisherscientific)进行dna载体扩增。[1079]对于grna,显示了以下支架序列:guuuuagagcuagaaauagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuu所述支架用于本文表中所示的pam,例如,ngg、nga、ngc、ngtpam;等等。grna涵盖本文提供或根据本领域技术人员的知识确定的疾病相关基因的支架序列和间隔区序列(靶序列)(例如表3a、3b和4)。本领域技术人员。(参见,例如,komor,ac等发表的“基因组dna中靶碱基的可编程编辑而无双链dna裂解”,nature533,420‑424(2016);gaudelli,nm,等发表的“programmable基因组dna中a·t到g·c的碱基编辑,无需dna裂解”nature551,464‑471(2017);komor,ac等人发表的“改善的碱基切除修复抑制和噬菌体mugam蛋白产生c:g‑to‑t:具有更高效率和更高产品纯度的基础编辑器”,scienceadvances3:eaao4774(2017)和rees,ha等人发表的“基础编辑:活细胞的基因组和转录组的精密化学”。natrevgenet。2018dec;19(12):770‑788。doi:10.1038/s41576‑018‑0059‑1)。[1080]ssdna的体外脱氨酶测定。[1081]所有cy3标记的受質均获自integrateddnatechnologies(idt)。使用tntt7快速偶联转录/翻译试剂盒(promega),根据制造商的说明,在体外使用1μg质粒表达脱氨基酶。蛋白表达后,将5μl裂解物与35μlssdna(1.8μm)和user酶(1个单位)在cutsmart缓冲液(newenglandbiolabs)(50mm乙酸钾,29mmtris‑乙酸盐,10mm乙酸镁)中合并,100μgml‑1bsa,ph7.9)于37℃孵育2小时。在10%tbe‑脲凝胶(bio‑rad)上,将未切割的含u受質从全长未修饰的受質中分离出来。[1082]his6‑rapobec1‑接头‑dcas9融合蛋白的表达和纯化。[1083]用编码pet28b‑his6‑rapobec1‑接头‑dcas9接头的质粒转化大肠杆菌bl21star(de3)感受态细胞(thermofisherscientific)。将所得的表达菌株在含有100μg/ml卡那霉素的luria‑bertani(lb)肉汤中于37℃过夜生长。将细胞以1:100的比例稀释到相同的生长培养基中,并在37℃下生长至od600=~0.6。在2小时内将培养物冷却至4℃,并以0.5mm的浓度加入异丙基‑β‑d‑1‑硫代半乳糖吡喃糖苷(iptg)诱导蛋白质表达。约16小时后,以4,000g离心力收集细胞,并将其重悬于裂解缓冲液(50mm三(羟甲基)‑氨基甲烷(tris)‑hcl(ph7.5)、1mnacl、20%甘油、10mmtris(2‑羧乙基)膦(tcep,soltecventures))。通过超声(20s脉冲打开,20s脉冲关闭,在6w输出下总共8分钟)进行超声处理裂解细胞,并在25,000g离心15分钟后分离出裂解物上清液。将裂解物与his‑pur的镍‑氨乙酸(nickel‑nta)树脂(thermofisherscientific)在4℃下孵育1小时,以捕获带his标签的融合蛋白。将树脂转移到柱上,并用40ml裂解缓冲液洗涤。将带有his标签的融合蛋白在补充了285mm咪唑的裂解缓冲液中洗脱,并通过超滤(amicon‑millipore,截断分子量为100kda)浓缩至1ml总体积。将蛋白质在低盐纯化缓冲液中稀释至20ml,所述缓冲液包含50mm三(羟甲基)‑氨基甲烷(tris)‑hcl(ph7.0)、0.1mnacl、20%甘油、10mmtcep,并加载到spsepharosefastflow中树脂(gelifesciences)。用40ml这种低盐缓冲液洗涤树脂,并用5ml的含有50mm三(羟甲基)‑氨基甲烷(tris)‑hcl(ph7.0)、0.5mnacl、20%甘油的活性缓冲液洗脱蛋白质、10毫米tcep。洗脱的蛋白质通过sds‑page定量。[1084]sgrna的体外转录。[1085]根据制造商的说明,使用transcriptaidt7高产量转录试剂盒(thermofisherscientific)在体外转录了含有t7启动子和20bpsgrna目标序列的线性dna片段。sgrna产品使用megaclear试剂盒(thermofisherscientific)根据制造商的说明进行纯化,并通过uv吸收进行定量。[1086]cy3偶联的dsdna受質的制备。[1087]从idt订购80nt未标记链的序列作为page纯化的寡核苷酸。补充信息中列出的25ntcy3标记的引物与每个80nt受質的3'末端互补。所述引物被订购为idt的hplc纯化寡核苷酸。为了生成cy3标记的dsdna受質,将80nt的链(5μl的100μm溶液)与cy3标记的引物(5μl的100μm溶液)在nebuffer2(38.25μl的50mm)中合并将nacl、10mmtris‑hcl、10mmmgcl2、1mmdtt、ph7.9溶液,newenglandbiolabs)与dntps(0.75μl的100mm溶液)加热至95℃5分钟,然后逐步冷却以每秒0.1℃的速度升至45℃。在此退火期后,加入klenowexo–(5u,newenglandbiolabs),并将反应液在37℃孵育1小时。溶液用缓冲液pb(250μl,qiagen)和异丙醇(50μl)稀释,并在qiaprep旋转柱(qiagen)上纯化,用50μltris缓冲液洗脱。dsdna上的脱氨酶测定。将纯化的融合蛋白(20μl1.9μm的活性缓冲液)与1当量的适当sgrna合并,并在环境温度下孵育5分钟。加入cy3标记的dsdna受質至终浓度125nm,并将所得溶液在37℃下孵育2小时。通过添加缓冲液pb(100μl,qiagen)和异丙醇(25μl)从融合中分离dsdna,并在econospin微旋转柱(epochlifescience)上纯化,用20μlcutsmart缓冲液(newenglandbiolabs)洗脱)。将user酶(1u,newenglandbiolabs)添加到纯化的,编辑的dsdna中,并在37℃下孵育1h。通过将5μl反应溶液与15μl基于dmso的上样缓冲液(5mmtris,0.)合并,使cy3标记的链从其互补链完全变性。[1088]制备用于高通量测序的体外编辑的dsdna。[1089]下面列出的寡核苷酸获自idt。在tris缓冲液中合并互补序列(5μl的100μm溶液),并通过加热至95℃持续5分钟进行退火,然后以0.1℃/s的速率逐渐冷却至45℃,以生成60‑bpdsdna受質。将纯化的融合蛋白(20μl的1.9μm活性缓冲液)与1当量的适当sgrna合并,并在环境温度下孵育5分钟。加入60‑merdsdna受質至终浓度125nm,并将所得溶液在37℃下孵育2h。通过添加缓冲液pb(100μl,qiagen)和异丙醇(25μl)从融合物中分离dsdna,并在econospin微旋转柱(epochlifescience)上纯化,用20μltris缓冲液洗脱。使用以下提供的高通量测序引物对,通过pcr扩增得到的编辑后的dna(以1μl为模板):根据制造商的说明,使用verasequltra(enzymatics)进行13个扩增循环。使用rapidtips(diffinitygenomics)纯化pcr反应产物,并使用含有测序接头的引物通过pcr扩增纯化的dna,进行纯化,并如前所述在miseq高通量dna测序仪(illumina)上测序。[1090]细胞培养。[1091]hek293t(atcccrl‑3216)和u2os(atcchtb‑96)在37℃的dulbecco'smodifiedeagle'smedium加glutamax(thermofisher)中添加了10%(v/v)胎牛血清(fbs)进行维护含5%的二氧化碳。将hcc1954细胞(atcccrl‑2338)保持在如上所述补充的rpmi‑1640培养基(thermofisherscientific)中。含有mecp2基因的无限增殖细胞(taconicbiosciences)在dulbecco的改良eagle'smedium加glutamax(thermofisherscientific)中添加了10%(v/v)胎牛血清(fbs)和200μgml‑1遗传霉素(thermofisherscientific)进行培养。[1092]转染[1093]将hek293t细胞接种在48孔胶原包覆的biocoat平板(corning)上,并以约85%汇合度转染。简而言之,根据制造商的协议,每孔使用1.5μllipofectamine2000(thermofisherscientific)转染750ngbe和250ngsgrna表达质粒。根据制造商的说明,使用适当的amaxanucleofectorii程序转染hek293t细胞(对于hek293t细胞,使用程序q‑001的v试剂盒)。[1094]基因组dna样品的高通量dna测序[1095]3天后收获转染的细胞,并根据制造商的说明使用agencourtdnadvance基因组dna分离试剂盒(beckmancoulter)分离基因组dna。通过侧翼高通量测序引物对,通过pcr扩增了目标上和目标外的基因组区域。按照制造商的说明,使用phusion高保真dna聚合酶(thermofisher)进行pcr扩增,使用5ng基因组dna作为模板。分别确定每个引物对的循环数,以确保反应在线性扩增范围内停止。pcr产物使用rapidtips(diffinitygenomics)纯化。用含有测序接头的引物通过pcr扩增纯化的dna。使用quant‑itpicogreendsdna分析试剂盒(thermofisher)和kapalibraryquantificationkit‑illumina(kapabiosystems)对产品进行凝胶纯化和定量。如前所述(pattanayak,naturebiotechnol。31,839–843(2013)),在illuminamiseq上对样品进行测序。[1096]数据分析。[1097]测序读取使用miseqreporter(illumina)自动解复用,并使用自定义的matlab分析单个fastq文件。使用smith‑waterman算法,将每个读数成对对齐至适当的参考序列。q得分低于31的碱基被ns取代,因此在计算核苷酸频率时被排除在外。此处理产生的预期miseq碱基调用错误率约为1,000分之1。将比对序列,其中阅读和参考序列不包含缺口被存储在比对表中,从所述表中可以列出每个基因座的基本频率。使用以前描述的标准(zuris等人,naturebiotechnol。33,73–80(2015)),使用定制的matlab脚本对indel频率进行定量。扫描测序读数以查找与两个10bp序列的精确匹配,这些序列位于可能发生插入缺失的窗口两侧。如果未找到完全匹配的内容,则将其从分析中排除。如果此插入缺失窗口的长度与参考序列完全匹配,则将读段分类为不包含插入缺失。如果插入缺失窗口比参考序列长或短两个或多个碱基,则测序读数分别分类为插入或缺失。当前第1页1 2 3 当前第1页1 2 3