背景技术:
1、成簇规律间隔短回文重复序列(crispr)和crispr相关(cas)基因(统称为crispr-cas或crispr/cas系统)是古菌和细菌中保护特定物种免受外来遗传元件侵害的适应性免疫系统。
2、在本公开中对任何文献的引用或标识均不是承认该文献可作为本公开的现有技术获得。
技术实现思路
1、针对上述背景,本公开提供优于现有技术的某些优点。尽管本文的公开内容不限于特定优点,但在一方面,本公开提供工程化cas13f多肽,其中所述工程化cas13f多肽:
2、(1)与seq id no:3的氨基酸序列具有至少约80%(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.6%、99.7%或99.8%)且小于100%的序列同一性;
3、(2)包含对应于seq id no:3的氨基酸序列的双突变y666a和y677a的所述双突变;并且
4、(3)与seq id no:3的氨基酸序列相比具有增加的间隔序列特异性切割活性和/或与seq id no:3的氨基酸序列相比具有降低的间隔序列非依赖性旁切活性。
5、在另一方面,本公开提供多核苷酸,所述多核苷酸编码本公开的工程化cas13f多肽。
6、在又另一方面,本公开提供crispr-cas13f系统,所述crispr-cas13f系统包含:
7、a)本公开的工程化cas13f多肽或编码所述工程化cas13f多肽的多核苷酸(例如,dna、rna);以及
8、b)指导核酸或编码所述指导核酸的多核苷酸(例如,dna或rna),所述指导核酸包含:
9、i.能够与所述工程化cas13f多肽形成复合物的同向重复(dr)序列;和
10、ii.能够与靶rna杂交,由此将所述复合物引导至所述靶rna的间隔序列。
11、在又另一方面,本公开提供载体,所述载体包含本公开的多核苷酸。
12、在又另一方面,本公开提供递送系统,所述递送系统包含(1)递送媒介物(vehicle),和(2)本公开的工程化cas13f多肽、本公开的多核苷酸、本公开的crispr-cas13f系统、或本公开的载体。
13、在又另一方面,本公开提供修饰靶rna的方法,所述方法包括使所述靶rna与本公开的crispr-cas13f系统、本公开的载体、或本公开的递送系统接触,由此修饰所述靶rna。
14、在又另一方面,本公开提供在有需要的受试者中治疗疾病的方法,所述方法包括向所述受试者施用本公开的crispr-cas13f系统,其中所述疾病与靶rna关联,其中所述crispr-cas13f系统修饰所述靶rna,并且其中对所述靶rna的修饰治疗所述疾病。
15、上文大体描述了本公开,本公开的各个方面的更详细描述在下文的单独部分中提供。然而,应理解,为了简洁和减少冗余,本公开的某些实施方式仅在一个部分下描述或仅在权利要求或实施例中描述。因此,还应理解,本公开的任何一个实施方式,包括仅在一个方面、部分下或仅在权利要求或实施例中描述的那些实施方式,可以与本公开的任何其他实施方式组合,除非特别否认或组合不当。
16、本公开的一个或多个实施方式的细节在以下说明书中描述。根据以下附图和几个实施方式的详细描述并且还根据所附权利要求,本公开的其他特征和优点将变得明显。
17、定义
18、本公开将对具体实施方式进行描述,但本公开不限于此,而仅受权利要求书的限制。除非另外定义,本文所用的全部技术术语和科学术语具有与本公开所属领域的普通技术人员通常所理解的相同含义。除非另有说明,如下文所述的术语通常以其通常含义进行理解。
19、概述
20、ii类、vii型crispr相关(cas)蛋白(cas13),作为核酸可编程rna核酸酶(naprnan),包括cas13a(c2c2)、cas13b(如cas13b1、cas13b2)、cas13c、cas13d、cas13e和cas13f多肽,能够在包含靶向靶rna的指导序列的指导核酸(例如,指导rna)的指导下切割所述靶rna。在一些实施方式中,所述靶rna是真核的。
21、不希望受理论束缚,在一些实施方式中,指导核酸包含负责与cas13形成复合物的支架序列,以及经有意设计为负责与靶rna的靶序列杂交的指导序列,由此将包含cas13和指导核酸的复合物引导至靶rna。
22、参考图7,示例性dsrna被描述为包含5’至3’单个dna链和3’至5’单个dna链。根据常规转录过程,示例性rna转录物可以使用3'至5'单个dna链作为合成模板进行转录,因此3'至5'单个dna链被称为“模板链”或“反义链”。如此转录的rna转录物与5'至3'单个dna链具有相同的一级序列(除了t被u替换外),因此5'至3'单个dna链被称为“编码链”或“有义链”。
23、示例性指导核酸被描述为包含指导序列和支架序列。指导序列被设计为与rna转录物(靶rna)的一部分杂交,因此指导序列“靶向”所述部分。因此,指导序列设计所基于的靶rna的部分以及指导序列可以与之杂交的部分称为“靶序列”。在一些实施方式中,指导序列与靶序列100%(完全)反向互补。在一些其他实施方式中,指导序列与靶序列反向互补,并且含有与所述靶序列的错配(如图8中例示的)。
24、通常,dsdna的双链序列可以用其5’至3’单个dna链的序列来表示,并且常规地,以5’至3’方向/取向书写。通常,核酸序列(例如,dna序列、rna序列)以5’至3’的方向/取向书写。
25、例如,对于具有5'-atgc-3'的5'至3'单个dna链和3'-tacg-5'的3'至5'单个dna链的dsdna,dsdna可以简单地表示为5'-atgc-3'。正常地,从dsdna转录的rna转录物(靶rna)则具有5'-augc-3'的序列。
26、为了与靶rna杂交,在一个实施方式中,指导核酸的指导序列被设计为具有与靶rna完全反向互补的5’-gcau-3’序列。根据wipo的电子序列表标准st.26,符号“t”用于表示dna中的t和rna中的u两者(参见“表1:核苷酸符号列表”,符号“t”的定义是“dna中的胸腺嘧啶/rna中的尿嘧啶(t/u)”)。因此,在根据st.26的序列表中,这样的指导序列将在gcat中列出,但标记为rna序列。
27、术语
28、如本文所用,如果dna序列,例如5’-atgc-3’被转录成rna序列(例如5'-augc-3'),其中用u(尿苷)替换一级序列中的每个dt(脱氧胸苷,或简称“t”),并且分别用a(腺苷)、g(鸟苷)和c(胞苷)替换其他da(脱氧腺苷,或简称为“a”)、dg(脱氧鸟苷,或简称为“g”)和dc(脱氧胞苷,或简称为“c”),它在本公开中是说,dna序列“编码”rna序列。
29、如本文所用,术语“活性”是指生物活性。在一些实施方式中,活性包括酶活性,例如,效应子的催化能力。例如,活性可以包括核酸酶活性,例如rna核酸酶活性、rna内切核酸酶活性。
30、如本文所用,术语“复合物”是指两个或更多个分子的分组。在一些实施方式中,复合物包含多肽和核酸,所述多肽和核酸彼此相互作用(例如,结合、接触、粘附)。如本文所用,术语“复合物”可以是指指导核酸和多肽(例如,naprnan,如cas13多肽)的分组。如本文所用,术语“复合物”可以是指指导核酸、多肽和靶序列的分组。如本文所用,术语“复合物”可以是指靶向靶rna的指导核酸、naprnan和任选地靶rna的分组。
31、如本文所用,术语“指导核酸”是指有助于将naprnan(例如,cas13多肽)靶向靶序列(例如,靶rna的序列)的任何核酸。指导核酸可以被设计为包括与特定核酸序列(例如,靶rna的序列)互补的序列。指导核酸可以包含有助于将naprnan引导至靶rna的支架序列。在一些实施方式中,指导核酸是指导rna。
32、如本文所用,术语“核酸”、“多核苷酸”和“核苷酸序列”可互换地用于指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸、核糖核苷酸、其组合、及其类似物或修饰。
33、如在crispr-cas技术(例如,crispr-cas13技术)的上下文中所使用的,术语“指导rna”与术语“crispr rna(crrna)”、“单个指导rna(sgrna)”或“rna指导物”可互换地使用,术语“指导序列”与术语“间隔序列”可互换地使用,并且术语“支架序列”与术语“同向重复序列”可互换地使用。
34、如本文所述,指导序列被这样设计以能够与靶序列杂交。如本文所用,术语“杂交(hybridize、hybridizing或hybridization)”是指其中一个或多个多核苷酸序列反应形成复合物的反应,所述复合物经由多核苷酸序列的碱基之间的氢键而稳定。氢键可通过沃森克里克碱基配对、hoogstein结合或以任何其他序列特异性方式发生。能够与给定多核苷酸序列杂交的多核苷酸序列称为给定多核苷酸序列的“互补序列”。如本文所用,指导序列和靶序列的杂交是如此稳定,以允许与包含指导序列的核酸复合的效应多肽(例如,naprnan)或与所述效应多肽相关联(例如,融合)的功能结构域对靶序列或其互补序列(例如,靶rna的序列或其互补序列)起作用(例如,切割、脱氨基)。
35、出于杂交的目的,在一些实施方式中,指导序列与靶序列互补或反向互补。如本文所用,术语“互补”是指第一多核苷酸序列(如指导序列)的核碱基通过传统的沃森-克里克(watson-crick)碱基配对与第二多核苷酸序列(如靶序列)的核碱基碱基配对的能力。两个互补的多核苷酸序列能够在适当的温度和溶液离子强度条件下非共价结合。在一些实施方式中,第一多核苷酸序列(例如,指导序列)与第二核酸(例如,靶序列)包含100%(完全)的互补性。在一些实施方式中,如果第一多核苷酸序列与第二核酸包含至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的互补性,则第一多核苷酸序列(例如,指导序列)与第二多核苷酸序列(例如,靶序列)互补。如本文所用,术语“基本上互补”是指多核苷酸序列(例如,指导序列)与第二多核苷酸序列(例如,靶序列)具有一定程度的互补性。在一些实施方式中,互补性水平使得第一多核苷酸序列(例如,指导序列)能够以足够的亲和力与第二多核苷酸序列(如,靶序列)杂交,以允许与第一多核苷酸序列或包含第一多核苷酸序列的核酸复合的效应多肽(例如,naprnan)或与所述效应多肽相关联(例如,融合)的功能结构域对靶序列或其互补序列(例如,靶rna的序列或其互补序列)起作用(例如,切割、脱氨基)。在一些实施方式中,与靶序列基本上互补的指导序列与所述靶序列具有小于100%的互补性。在一些实施方式中,与靶序列基本上互补的指导序列与所述靶序列具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的互补性。
36、如本文所用,术语“序列同一性”与序列同源性相关。同源性比较可以通过眼睛,或者更通常地借助于容易获得的序列比较程序进行。这些可商购的计算机程序可以计算两个或更多个序列之间的同源性百分比(%),并且也可以计算两个或更多个氨基酸或核酸序列共有的序列同一性。
37、序列同源性可以通过本领域已知的多种计算机程序中的任一种生成,例如blast或fasta等。用于执行这样的比对的合适计算机程序是gcg wisconsin bestfit包(美国威斯康星大学;devereux等人,1984,nucleic acids research[核酸研究]12:387)。可进行序列比较的其它软件的实施例包括,但不限于,blast包(参见ausubel等人,1999同上-第18章)、fasta(atschul等人,1990,j.mol.biol.[分子生物学杂志],403-410)和geneworks比较工具套件。blast和fasta两者均可以用于离线和在线搜索(参见ausubel等人,1999同上,第7-58页至第7-60页)。可以在连续序列上计算序列同源性百分比(%),即将一个序列与其他序列进行比对,并将一个序列中的每个氨基酸或核苷酸与其他序列中的相应氨基酸或核苷酸直接比较,一次一个残基。这被称为“无空位(ungapped)”比对。典型地,此类无空位比对仅在相对短数目的多个残基上进行。尽管这是十分简单和可靠的方法,但其没有考虑,例如,在原本相同的一对序列中,一个插入或缺失可以引起后面的氨基酸残基不再对齐,从而当进行全局比对时可能导致%同源性大大降低。因此,大多数序列比较方法被设计来产生最佳的比对,该最佳比对考虑可能的插入和缺失,从而不会不当地减损整体同源性或同一性得分。这通过在序列比对中插入“空位”以试图使局部同源性或同一性最大化来实现。然而,这些更复杂的方法给比对中出现的每一个空位赋予“空位罚分”使得,对于同样数目的相同氨基酸,具有尽可能少空位的序列比对-反映两个比较序列之间更高的相关性-可以获得比具有许多空位的序列比对更高的得分。典型地使用“亲和力空位成本(affine gapcost)”,其对空位的存在索取相对高的成本,而对空位中每一个后续的残基索取较小的罚分。这是最常用的空位评分系统。当然,高空位罚分可以产生具有较少空位的最佳比对。大多数比对程序允许待修饰的空位罚分。然而,优选的是当使用这样的软件进行序列比较时使用默认值。例如,当使用gcg wisconsin bestfit包时,用对于氨基酸序列的默认空位罚分为:空位-12,每个空位延伸-4。因此最大%同源性的计算首先需要在考虑空位罚分的情况下产生最佳比对。一种称为blast 2序列的新工具,也可用于比较蛋白质和核苷酸序列(参见fems microbiol lett.[fems微生物通讯]1999 174(2):247-50;fems microbiollett.[fems微生物通讯]1999 177(1):187-8和美国国立卫生研究院网站上的国家生物技术信息中心网站)。尽管最终同源性%可以按照同一性来度量,但比对过程本身典型地不是基于全或无配对比较。相反,通常使用标度化相似性打分矩阵(scaled similarity scorematrix),该矩阵基于化学相似性或进化距离对每一成对比较赋予分值。通常使用的这样的矩阵的一个实例是blosum62矩阵-blast程序包的默认矩阵。gcg wisconsin程序通常使用公用默认值或定制符号比较表(如果提供的话)(进一步的细节请参见用户手册)。对于一些应用,优选使用gcg软件包的公用默认值,或者在其他软件的情形中,使用默认矩阵,如blosum62。可替代地,基于类似于clustal的算法,使用在dnasistm(hitachi软件)中的多重比对特征来计算同源性百分比(higgins d g和sharp p m(1988),gene[基因]73(1),237-244)。一旦软件已经产生最佳比对就可以计算%同源性,优选%序列同一性。典型地,作为序列比较的一部分,软件进行此计算,并且生成数值结果。序列还可以具有产生沉默改变并产生功能上等价的物质的氨基酸残基的缺失、插入或取代。可以基于氨基酸特性(如残基的极性、电荷、溶解性、疏水性、亲水性、和/或两亲性质)的相似性来进行有意的氨基酸取代,并且因此将氨基酸以官能团分组在一起是有用的。氨基酸可以仅仅基于它们的侧链特性而分组在一起。然而,包括突变数据也会更有用。出于结构的原因,因此衍生的几组氨基酸可能是保守的。可以维恩图(livingstone c.d.和barton g.j.(1993)“protein sequencealignments:a strategy for the hierarchical analysis of residue conservation[蛋白质序列比对:用于分层分析残基保守性的策略]”comput.appl.biosci.[生物科学中的计算机应用]9:745-756)(taylor w.r.(1986)“the classification of amino acidconservation[氨基酸保守性分类]”j.theor.biol.[理论生物学杂志]119;205-218)的形式描述这些组。可以例如根据下表进行保守性取代,该表描述了普遍接受的氨基酸维恩图分组。
38、如本文所用,术语“多肽”和“肽”在本文中可互换地使用,并且是指任何长度的氨基酸的聚合物。聚合物可以是直链或支链的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。蛋白可具有一种或多种多肽。所述术语还涵盖已修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,如与标记组分缀合。
39、如本文所用,“变体”被解释为意指分别与参考多核苷酸或多肽不同但保留基本特性的多核苷酸或多肽。多核苷酸的典型变体在核酸序列上不同于另一参考多核苷酸。变体的核酸序列的变化可以改变或不改变由参考多核苷酸编码的多肽的氨基酸序列。如下文的讨论,核苷酸变化可导致参考序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短。多肽的典型变体在氨基酸序列上不同于另一参考多肽。通常,差异是有限的,因此参考多肽和变体的序列总体上非常相似,并且在许多区域中是相同的。变体和参考多肽在氨基酸序列上可以因任何组合的一个或多个取代、添加、缺失而不同。取代或插入的氨基酸残基可以是或不是由遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,例如等位基因变体,或者它可以是已知不是天然存在的变体。多核苷酸和多肽的非天然存在的变体可以通过诱变技术、通过直接合成和通过本领域技术人员已知的其他重组方法制备。
40、如本文所用,术语“上游”和“下游”是指核酸中单个核苷酸(例如,dna)序列内的相对位置。通常,第一序列在第二序列“上游”意指所述第一序列在所述第二序列的5',而第一序列在第二序列“下游”意指所述第一序列在所述第二序列的3'。
41、如本文所用,术语“野生型”具有本领域技术人员通常理解的含义,意指当它存在于自然界中时,将其与突变体或变体区分开的、典型形式的生物、菌株、基因或特征。它可以从自然界中的来源分离而未被有意修饰。
42、如本文所用,术语“非天然存在”和“工程化的”可互换地使用,是指人工参与。当这些术语用于描述核酸或多肽时,意指所述核酸或多肽至少基本上不含其在自然界中关联的或在自然界中发现的至少一种其他组分。
43、如本文所用,“细胞”理解为不仅指特定的单个细胞,而且指所述细胞的后代或潜在后代。因为某些修饰可在后代中由于突变或环境影响而发生,这样的子代可能在事实上与亲代细胞不同,但是仍然包括在术语范围内。
44、如本文所用,术语“体内”是指生物的体内,而术语“离体”或“体外”是指生物的体外。
45、如本文所用,术语“治疗(treat、treatment或treating)”是用于获得有益的或所希望的结果(包括临床结果)的方法。出于本公开的目的,有益的或所希望的临床结果包括但不限于以下中的一种或多种:减轻由疾病引起的一种或多种症状、减少疾病的程度、稳定疾病(例如,预防或延迟疾病的恶化)、预防或延迟疾病的传播(例如,转移)、预防或延迟疾病的复发、降低疾病的复发率、延迟或减缓疾病的进展、改善疾病状态、提供疾病的缓解(部分或全部)、减少治疗疾病所需的一种或多种其他药物的剂量、延迟疾病进展、增加生活质量和/或延长存活。“治疗”还涵盖减少疾病(例如癌症)的病理结果。本公开的方法涵盖治疗的这些治疗方面中的任何一个或多个。
46、如本文所用,术语“疾病”包括术语“障碍”和“病症”,且不限于医学上明确定义的术语。
47、如本文所用,对“不是”值或参数的提及通常意指并描述“不同于”值或参数。例如,方法不是用于治疗x型癌症,意指该方法可以用于治疗不同于x型的癌症。
48、如本文所用,单数形式“一种/一个(a/an)”和“所述/该(the)”包括复数个指示物,除非上下文中另外明确指明。
49、如本文所用,短语例如“a和/或b”中的术语“和/或”旨在包括a和b两者;a或b;a(单独);和b(单独)。同样,短语例如“a、b和/或c”中的术语“和/或”旨在涵盖以下实施方式中的每一个:a、b和c;a、b或c;a或c;a或b;b或c;a和c;a和b;b和c;a(单独);b(单独);和c(单独)。
50、如本文所用,当术语“约”位于一系列数字之前时(例如,约1、2、3),应当理解,该一系列数字中的每一个都由术语“约”修饰(即,约1、约2、约3)。本文所用的术语“约x-y”具有与“约x至约y”相同的含义。
51、应当理解,本文所述的本公开的实施方式包括“由实施方式组成”和/或“基本上由实施方式组成”。
52、还需注意的是,权利要求书可以经撰写而排除任何任选的要素。因此,该陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”等或使用“否定型”限定的前提基础。