本申请是申请日:2014年9月5日、申请号:201480058811.5、发明名称为“可变换cas9核酸酶及其用途”的中国发明专利申请的分案申请。
相关申请
本申请要求2014年7月8日提交的美国申请u.s.s.n.14/326,329,2014年7月8日提交的美国申请u.s.s.n.14/326,340,和2014年7月8日提交的美国申请u.s.s.n.14/326,361的在35u.s.c.§365(c)下的优先权,而且还要求2013年9月6日提交的美国临时申请u.s.s.n.61/874,682的在35u.s.c.§119(e)下的优先权,每篇通过提及并入本文。
背景技术:
位点特异性内切核酸酶在理论上容许靶向操作基因组内的单一位点,并且在基因靶向的背景中以及对于治疗应用是有用的。在多种生物体(包括哺乳动物)中,位点特异性内切核酸酶已经用于通过刺激非同源末端连接或同源重组来进行基因组工程。在提供有力的研究工具外,位点特异性核酸酶还具有作为基因治疗剂的潜力,并且两种位点特异性内切核酸酶最近已经进入临床试验:一种(即ccr5-2246)靶向人ccr-5等位基因作为抗hiv治疗办法的一部分(nct00842634,nct01044654,nct01252641),和另一种(vf24684)靶向人vegf-a启动子作为抗癌治疗办法的一部分(nct01082926)。
在没有脱靶活性或仅具有最小脱靶活性的情况中对意图核酸酶靶位点的特异性切割是位点特异性内切核酸酶的临床应用,和还是基础研究应用中的高效率基因组操作的前提。例如,工程化位点特异性结合域的不完全特异性已经与除了意图靶物外的基因组基因座的不想要变化和细胞毒性联系起来。然而,目前可用的大多数核酸酶展现出相当大的脱靶活性,并且如此可能不适合于临床应用。一种在临床和研究背景中使用的出现的核酸酶平台是rna引导性核酸酶,诸如cas9。虽然这些核酸酶能够结合引导指导特异性靶位点切割的rna(grna),但是仍对某些cas9:grna复合物观察到脱靶活性(pattanayaketal.,“high-throughputprofilingofoff-targetdnacleavagerevealsrna-programmedcas9nucleasespecificity.”natbiotechnol.2013;doi:10.1038/nbt.2673)。因此,需要将核酸酶工程化改造为具有改善的特异性的技术。
技术实现要素:
本公开内容的一些方面基于下述认识,即一些工程化位点特异性内切核酸酶的报告的毒性基于脱靶dna切割。此外,一般不能在分子水平上控制存在的rna引导性核酸酶的活性,例如,以将核酸酶从“关闭”转换成“开启”状态。控制核酸酶的活性可以降低招致脱靶效应的可能性。本公开内容的一些方面提供了控制rna-可编程内切核酸酶(诸如cas9内切核酸酶)的结合和/或切割活性的策略、组合物、系统和方法。
因而,本公开内容的一个实施方案提供了rna引导性核酸酶复合物,其包含“可变换”引导rna(grna)。例如,在一些实施方案中,本发明提供了复合物,其包含:(i)包含适体的grna,其中grna在缺乏与适体结合的特定配体的情况中不与靶核酸杂交;和(ii)cas9蛋白。在一些实施方案中,适体由配体结合。在一些方面中,配体是任何分子。在一些方面中,配体是小分子、代谢物、碳水化合物、肽、蛋白质或核酸。在一些实施方案中,grna:配体:cas9复合物结合靶核酸并且介导靶核酸的切割。参见例如图1a-d。
根据另一个实施方案,提供了包含适体的grna。在一些实施方案中,grna在缺乏与适体结合的配体的情况中不与靶核酸杂交。此类grna可以称为“可变换grna”。例如,在一些方面中,grna在缺乏与适体的配体的情况中不结合cas9。参见例如图1a-b。在一些实施方案中,在适体被对适体特异性的配体结合时,grna结合cas9。在一些实施方案中,grna在缺乏或存在与适体结合的特定配体的情况中结合cas9,但是仅在存在与适体结合的配体的情况中结合靶核酸。在一些方面中,配体是任何分子。在一些方面中,配体是小分子、代谢物、碳水化合物、肽、蛋白质或核酸。在一些实施方案中,适体是rna适体,例如,自核开关衍生的rna适体。在一些实施方案中,衍生适体的核开关选自茶碱核开关、焦磷酸硫胺素(tpp)核开关、腺苷钴胺素(adocbl)核开关、s-腺苷甲硫氨酸(sam)核开关、sah核开关、黄素单核苷酸(fmn)核开关、四氢叶酸核开关、赖氨酸核开关、甘氨酸核开关、嘌呤核开关、glms核开关或前q核苷1(preq1)核开关。在一些实施方案中,适体自茶碱核开关衍生,并且包含seqidno:3。在其它实施方案中,适体是非天然存在的,并且在一些方面中,使用指数富集配体系统进化(systematicevolutionofligandsbyexponentialenrichment,selex)平台被工程化改造为结合特定配体。在一些实施方案中,grna的非适体部分包含至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140或至少150个核苷酸,并且适体包含至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少175、至少200、至少250或至少300个核苷酸。
根据另一个实施方案,提供了使用发明性cas9变体进行位点特异性dna切割的方法。例如,在一些方面中,方法包括在cas9蛋白切割dna的条件下使dna与复合物接触,所述复合物包含(i)包含适体的grna,其中grna包含结合dna的部分的序列,(ii)与grna的适体结合的特定配体,和(iii)cas9蛋白。
根据另一个实施方案,提供了用于诱导细胞中的位点特异性dna切割的方法。例如,在一些实施方案中,方法包括:(a)使细胞接触或在细胞内表达包含适体的grna,其中所述grna包含能够结合dna靶序列的序列;(b)使细胞接触或在细胞内表达cas9蛋白;并且(c)使细胞与结合grna的适体的配体接触,导致切割所述dna靶物的grna:配体:cas9复合物的形成。在一些实施方案中,细胞在细胞内生成配体,例如作为生理或病理生理过程的一部分。在一些实施方案中,方法包括(a)使细胞与包含cas9蛋白和包含适体的grna的复合物接触,其中所述grna包含能够结合dna靶序列的序列,并且(b)使细胞与结合grna的适体的配体接触,导致切割所述dna靶物的grna:配体:cas9复合物的形成。在一些方面中,同时或以任何次序序贯实施步骤(a)和(b)。在一些实施方案中,在体外进行方法,而在其它实施方案中,在体内进行方法。
根据另一个实施方案,提供了包含mrna感测性grna的rna引导性核酸酶复合物。例如,在一些实施方案中,复合物包含cas9蛋白和grna,其中grna包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与转录物(mrna)的区域杂交的区域。
根据另一个实施方案,提供了mrna感测性grna,例如,其包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与转录物(mrna)的区域杂交的区域。参见例如图2a-d。在一些实施方案中,区域(i)、(ii)和(iii)的每个序列包含至少5、至少10、至少15、至少20或至少25个核苷酸。在一些方面中,grna形成茎-环结构,其中所述茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且所述环由区域(iii)的部分或整个序列形成。在一些实施方案中,区域(ii)和(iii)都在区域(i)的5’或3’。参见例如图2a对图2c。在一些实施方案中,茎-环结构在缺乏与区域(iii)的序列杂交的转录物的情况下形成。在此例子中,grna被说成为“关闭”状态。参见例如图2a,2c。在一些实施方案中,转录物对区域(iii)的序列的结合导致茎-环结构的解折叠,或者阻止茎-环结构的形成,使得区域(ii)的序列不与区域(i)的序列杂交。在此例子中,grna被说成为“开启”状态。参见例如图2b,2d。在一些实施方案中,grna结合cas9蛋白,并且区域(i)的序列在区域(iii)的序列结合(例如“感测”)转录物时与靶核酸杂交。
根据另一个实施方案,提供了用于位点特异性dna切割的方法,例如其包括使dna与包含与mrna感测性grna结合的cas9蛋白的复合物接触,其中mrna感测性grna被mrna结合,从而容许复合物结合并切割dna。
根据另一个实施方案,提供了延长的dna识别(xdna感测性)grna。参见例如图3a-d。在一些实施方案中,xdna感测性grna包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与靶核酸的另一个区域杂交的区域。在一些实施方案中,区域(i)和(ii)的每种序列包含至少5、至少10、至少15、至少20或至少25个核苷酸;并且区域(iii)的序列包含至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75或至少100个核苷酸。在一些实施方案中,grna形成茎-环结构,其中所述茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且环由区域(iii)的部分或整个序列形成。在一些实施方案中,区域(ii)和(iii)都在区域(i)的5’或3’。参加例如图3a对图3c。在一些实施方案中,茎-环结构在缺乏与(iii)中的序列互补并结合的靶核酸的区域的情况下形成。参见例如图3a,c。在一些实施方案中,靶核酸的区域对区域(iii)的序列的结合导致茎-环结构的解折叠,或者阻止茎-环结构的形成,使得区域(ii)的序列不与区域(i)的序列杂交。参见例如图3b,d。在一些实施方案中,grna结合cas9蛋白,并且(i)中的序列在(iii)中的序列结合靶核酸时结合靶核酸。
根据另一个实施方案,提供了复合物,其包含xdna感测性grna和cas9蛋白,任选地其中复合物包含靶核酸。在一些实施方案中,复合物的形成导致靶核酸的切割。
根据另一个实施方案,提供了用于位点特异性dna切割的方法,其包括使dna与包含xdna感测性grna和cas9的复合物接触。
可以对细胞(例如体外或体内细胞)中的dna进行本文中提供的任何方法。在一些实施方案中,对真核细胞中的dna进行本文中提供的任何方法。在一些实施方案中,真核细胞在个体,例如人中。
根据另一个实施方案,提供了多核苷酸,例如,其编码本文中描述的grna、复合物或蛋白质(例如cas9蛋白)。在一些实施方案中,提供了包含本文中描述的多核苷酸的载体。在一些实施方案中,提供了用于重组表达本文中描述的任何grna、复合物或蛋白质(例如cas9蛋白)的载体。在一些实施方案中,细胞包含用于重组表达本文中描述的任何grna、复合物或蛋白质(例如cas9蛋白)的遗传构建体。
在一些实施方案中,提供了试剂盒。例如,提供了包含本文中描述的任何grna、复合物或蛋白质(例如cas9蛋白)的试剂盒。在一些实施方案中,提供了包含本文中描述的多核苷酸的试剂盒。在一些实施方案中,提供了包含用于重组表达的载体的试剂盒,其中载体包含编码本文中描述的任何grna、复合物或蛋白质(例如cas9蛋白)的多核苷酸。在一些实施方案中,提供了包含细胞的试剂盒,所述细胞包含用于表达本文中描述的任何grna、复合物或蛋白质(例如cas9蛋白)的遗传构建体。
本发明的其它优点、特征和用途从本发明的某些实施方案的详细描述;附图(其是示意性的而并不意图按比例绘制);和权利要求书看会是明显的。
附图说明
图1a-d显示了涉及与适体连接的grna的本发明的某些实施方案。(a)在此图中,示意性描述包含适体的可变换grna。在缺乏结合适体的特定配体(在本文为代谢物)的情况中,负责结合靶核酸的序列与适体(参见远左侧,描绘为“转换序列”的区域)方面杂交。在结合代谢物后,适体经历构象变化,使得负责结合靶核酸的序列不再与适体序列杂交,容许它与靶物杂交。(b)在转换成“开启”状态后,grna在与cas9结合时将核酸酶引导至靶位点,在那里它与靶位点杂交,容许cas9切割靶核酸的每条链。(c-d)在此图中,与grna连接的适体自茶碱核开关衍生。在缺乏茶碱的情况中(c),适体(描绘为“茶碱核开关”)的方面结合负责结合靶核酸(通过小图顶部的双链序列描绘)的序列(描绘为“切割靶物的引导”)方面,从而阻碍grna与靶核酸杂交。在图1c中,从上至下,序列对应于seqidno:4-6。当适体被茶碱(描述为结合适体序列的固体小分子)结合时(d),它经历构象变化,其导致没有与靶核酸杂交的“引导”序列。在图1d中,从上至下,序列对应于seqidno:4、5和11。
图2a-d显示了涉及mrna感测性grna的本发明的某些实施方案。(a-b)在此图中,描绘了包含5’转录物传感器(transcriptsensor)/引导块基序(guideblockmotif)的grna。在缺乏某种mrna的情况中(a),转录物传感器的方面保持未结合,导致形成茎-环结构,其阻断负责结合靶核酸(通过小图顶部的双链序列描绘)的序列(描绘为“切割靶物的引导”)的某些方面,从而阻止grna与靶核酸杂交。在图2a中,从上至下,序列对应于seqidno:4、5和7。在存在与转录物传感器杂交的mrna的情况中(b),grna经历构象变化,其导致没有与靶核酸杂交的“引导”序列,序列(从上至下)对应于seqidno:4、5、7和12。(c-d)类似地,可以对包含3’转录物传感器/引导块的grna应用策略,使得在缺乏mrna的情况中(c),grna为“关闭”状态(从上至下,序列对应于seqidno:4、5和8),并且在存在mrna的情况中(d),grna为“开启”状态(从上至下,序列对应于seqidno:4、5和12)。
图3a-d显示了涉及延长的dna(xdna)识别策略的本发明的某些实施方案。(a-b)在此实施方案中,描绘了包含5’xdna传感器/引导块基序的grna。xdna传感器基序与靶核酸的其它方面(例如在“切割靶物的引导”序列外)互补并杂交。(a)在缺乏正确的靶序列(例如包含“引导”序列的靶物及xdna传感器序列的靶物两者)的情况中,xdna传感器的方面保持未结合,导致形成茎-环结构,其阻断负责结合靶核酸(通过小图顶部的双链序列描绘)的序列(描绘为“切割靶物的引导”)的某些方面,从而阻止grna与靶核酸杂交,序列(从上至下)对应于seqidno:4、5和9。在存在与xdna传感器的部分杂交的正确靶核酸的情况中(b),grna经历构象变化,其导致没有与靶核酸杂交的“引导”序列,序列(从上至下)对应于13、14和9。如此,仅在存在正确的靶核酸的情况中,确实发生grna(和关联cas9蛋白)的结合。这有效增加(即延长)被例如cas9:grna复合物识别的靶核苷酸的数目,这增加特异性。(c-d)类似地,可以对包含3’xdna传感器/引导块的grna应用策略,从而在缺乏靶核酸的情况中(c),grna为“关闭”状态(从上至下,序列对应于seqidno:4、5和10),并且在存在靶核酸的情况中(d),grna为“开启”状态,从上至下,序列对应于seqidno:4、15、5、16和10。
定义
如本文中和权利要求书中使用的,单数形式“一个”、“一种”和“该/所述”包括单数和复数提及物,除非上下文另有清楚指示。如此,例如,提及“药剂”包括单一药剂和多种此类药剂。
术语“适体”指结合特定靶分子(例如特定配体)的核酸或肽分子。在一些实施方案中,配体对适体的结合诱导适体和例如与适体缀合或连接的其它分子的构象变化。在一些实施方案中,经由重复轮次的体外选择或者等同地selex(指数富集配体系统进化)工程化改造核酸(例如dna或rna)适体以结合各种分子靶物,例如,小分子、大分子、代谢物、蛋白质、蛋白质、碳水化合物、金属、核酸、细胞、组织和生物体。用于将适体工程化改造为结合小分子的方法是本领域中已知的,并且包括那些记载于美国专利no.5,580,737和8,492,082;ellingtonandszostak,“invitroselectionofrnamoleculesthatbindspecificligands.”nature.1990;346:818–822;tuerkandgold,“systematicevolutionofligandsbyexponentialenrichment:rnaligandstobacteriophaget4dnapolymerase.”science.1990;249:505–510;burkeandgold,“rnaaptamerstotheadenosinemoietyofs-adenosylmethionine:structuralinferencesfromvariationsonathemeandthereproducibilityofselex.”nucleicacidsres.1997;25(10):2020-4;ulrichetal.,“dnaandrnaaptamers:fromtoolsforbasicresearchtowardstherapeuticapplications.”combchemhighthroughputscreen.2006;9(8):619-32;svobodováetal.,“comparisonofdifferentmethodsforgenerationofsingle-strandeddnaforselexprocesses.analbioanalchem.2012;404:835–842;在此通过提及并入每篇的全部内容。在自然界中也找到核酸适体,例如,那些形成核开关的部分的。“核开关”是mrna分子的调节区段,其结合小分子,例如代谢物,从而导致由mrna编码的蛋白质(例如参与结合核开关的代谢物生成的蛋白质)的生成的变化。核开关在概念上经常分成两个部分:适体和表达平台(例如mrna)。适体直接结合小分子(例如代谢物),并且mrna相应适体变化而经历结构变化。通常,mrna的结构变化导致蛋白质表达的降低或抑制。可以使用本领域中的常规方法从核开关中克隆(例如分离)适体,并且使用适体控制与其连接的其它分子(例如rna,dna)的活性。另外,可以使用已知的方法再工程化改造自然界中找到的适体以结合合成的、非天然的小分子配体以控制与其连接的其它分子的活性。参见例如dixonetal.,“reengineeringorthogonallyselectiveriboswitches.”pnas2010;107(7):2830–2835,其全部内容在此通过提及并入。下文是包括非限制性的一批核开关,包括适体:
钴胺素核开关(又是b12-元件),其结合腺苷酰钴胺素(维生素b12的辅酶形式)以调节钴胺素生物合成和转运钴胺素和类似代谢物,和其它基因。参见例如nahvietal.,“coenzymeb12riboswitchesarewidespreadgeneticcontrolelementsinprokaryotes.”nucleicacidsres.2004;32:143-150;vitreschaketal.,“regulationofthevitaminb12metabolismandtransportinbacteriabyaconservedrnastructuralelement.”rna.2003;9:1084-1097;在此通过提及并入每篇的全部内容。
环状二-gmp核开关结合信号传导分子环状二-gmp以调节由此第二信使控制的多种基因。至少两类环状二-gmp核开关是已知的:环状二-gmp-i核开关和环状二-gmp-ii核开关。参见例如sudarsanetal.,“riboswitchesineubacteriasensethesecondmessengercyclicdi-gmp.”science.2008;321(5887):411–3;leeetal.,“anallostericself-splicingribozymetriggeredbyabacterialsecondmessenger.”science.2010;329(5993):845–8;在此通过提及并入每篇的全部内容。
fmn核开关(也是rfn-元件)结合黄素单核苷酸(fmn)以调节核黄素生物合成和转运。参见例如winkleretal.,“anmrnastructurethatcontrolsgeneexpressionbybindingfmn.”procnatlacadsciusa.2002;99(25):15908–15913;serganovetal.,“coenzymerecognitionandgeneregulationbyaflavinmononucleotideriboswitch.”nature.2009;458(7235):233–7;在此通过提及并入每篇的全部内容。
glms核开关是一种在由葡糖胺-6-磷酸结合时切割自身的核酶。参见例如winkleretal.,“controlofgeneexpressionbyanaturalmetabolite-responsiveribozyme.”nature.2004;428:281-286;jansenetal.,“backboneandnucleobasecontactstoglucosamine-6-phosphateintheglmsribozyme.”natstructmolbiol.2006;13:517-523;hampelandtinsley,“evidenceforpreorganizationoftheglmsribozymeligandbindingpocket.”biochemistry.2006;45:7861-7871;在此通过提及并入每篇的全部内容。
甘氨酸核开关结合甘氨酸以调节甘氨酸代谢基因,包括使用甘氨酸作为能源。参见例如mandaletal.,“aglycine-dependentriboswitchthatusescooperativebindingtocontrolgeneexpression.”science.2004;306(5694):275–279;kwonandstrobel,“chemicalbasisofglycineriboswitchcooperativity.”rna.2008;14(1):25–34;在此通过提及并入每篇的全部内容。
赖氨酸核开关(又是l-box)结合赖氨酸以调节赖氨酸生物合成、分解代谢和转运。参见例如sudarsanetal.,“anmrnastructureinbacteriathatcontrolsgeneexpressionbybindinglysine.”genesdev.2003;17:2688-2697;grundyetal.,“thelboxregulon:lysinesensingbyleaderrnasofbacteriallysinebiosynthesisgenes.”proc.natl.acad.sci.usa.2003;100:12057-12062;在此通过提及并入每篇的全部内容。
preq1核开关结合前-q核苷(pre-queuosine)1,以调节参与此前体至q核苷的合成或转运的基因。至少两种独特类别的preq1核开关是已知的:preq1-i核开关和preq1-ii核开关。参见例如rothetal.,“ariboswitchselectiveforthequeuosineprecursorpreq1containsanunusuallysmallaptamerdomain,”natstructmolbiol.2007;14(4):308–317;kleinetal.,“cocrystalstructureofaclassipreq1riboswitchrevealsapseudoknotrecognizinganessentialhypermodifiednucleobase,”nat.struct.mol.biol.2009;16(3):343–344;kangetal.,“structuralinsightsintoriboswitchcontrolofthebiosynthesisofqueuosine,amodifiednucleotidefoundintheanticodonoftrna.”mol.cell332009;(6):784–90;meyeretal.,“confirmationofasecondnaturalpreq1aptamerclassinstreptococcaceaebacteria.”rna2008;14(4):685;在此通过提及并入每篇的全部内容。
嘌呤核开关结合嘌呤以调节嘌呤代谢和转运。嘌呤核开关的不同形式结合鸟嘌呤(最初称为g-框的形式)或腺嘌呤。对鸟嘌呤或腺嘌呤的特异性完全取决于与特定位置(例如y74)处的核开关中的单一嘧啶的watson-crick相互作用。在鸟嘌呤核开关中,此残基通常是胞嘧啶(例如c74),在腺嘌呤核开关中,它通常是尿嘧啶(例如u74)。嘌呤核开关的同源类型结合脱氧鸟苷,但是比单一核苷酸突变具有更重大的差异。参见例如serganovetal.,“structuralbasisfordiscriminativeregulationofgeneexpressionbyadenine-andguanine-sensingmrnas.”chembiol.2004;11(12):1729–41;bateyetal.,“structureofanaturalguanine-responsiveriboswitchcomplexedwiththemetabolitehypoxanthine.”nature.2004;432(7015):411–415;mandalandbreaker,“adenineriboswitchesandgeneactivationbydisruptionofatranscriptionterminator.”natstructmolbiol.2004;11(1):29–35;在此通过提及并入每篇的全部内容。
sah核开关结合s-腺苷高半胱氨酸以调节参与再循环此代谢物的基因,所述代谢物在甲基化反应中使用s-腺苷甲硫氨酸时生成。参见例如wangetal.,“riboswitchesthatsenses-adenosylhomocysteineandactivategenesinvolvedincoenzymerecycling.”mol.cell2008;29(6):691–702;edwardsetal.,“structuralbasisforrecognitionofs-adenosylhomocysteinebyriboswitches.”rna2010;16(11):2144–2155;在此通过提及并入每篇的全部内容。
sam核开关结合s-腺苷甲硫氨酸(sam)以调节甲硫氨酸和sam生物合成和转运。至少4种sam核开关是已知的:sam-i(最初称作s-框)、sam-ii、smk框核开关和sam-iv。sam-i在细菌中是普遍的,但是sam-ii仅存在于alpha-、beta-和几种gamma-蛋白菌中。认为smk框核开关仅存在于乳杆菌目(lactobacillales)中。sam-iv核开关与sam-i核开关具有相似的配体结合核心,但是在独特支架的背景中。参见例如montangeetal.,“structureofthes-adenosylmethionineriboswitchregulatorymrnaelement.”nature.2006;441:1172-1175;winkleretal.,“anmrnastructurethatcontrolsgeneexpressionbybindingsadenosylmethionine.”natstructbiol.2003;10:701-707;zashaetal.,“theaptamercoreofsam-ivriboswitchesmimicstheligand-bindingsiteofsam-iriboswitches.”rna.2008;14(5):822–828;在此通过提及并入每篇的全部内容。
四氢叶酸核开关结合四氢叶酸以调节合成和转运基因。参见例如amesetal.,“aeubacterialriboswitchclassthatsensesthecoenzymetetrahydrofolate.”chem.biol.2010;17(7):681–5;huangetal.,“long-rangepseudoknotinteractionsdictatetheregulatoryresponseinthetetrahydrofolateriboswitch.”proc.natl.acad.sci.u.s.a.2011;108(36):14801–6;trauschetal.,“thestructureofatetrahydrofolate-sensingriboswitchrevealstwoligandbindingsitesinasingleaptamer.”structure.2011;19(10):1413–23;在此通过提及并入每篇的全部内容。
茶碱核开关通过selex鉴定,并且选择性结合小分子茶碱。该适体包含茶碱结合需要的15个核苷酸的核心基序。参见例如jenisonetal.,“high-resolutionmoleculardiscriminationbyrna.”science.1994;263:1425–1429;zimmermanetal.,“molecularinteractionsandmetalbindinginthetheophylline-bindingcoreofanrnaaptamer.”rna.2000;6(5):659-67;suessetal.,“atheophyllineresponsiveriboswitchbasedonhelixslippingcontrolsgeneexpressioninvivo.”nucleicacidsres.2004;32(4):1610–1614;在此通过提及并入每篇的全部内容。还可参见例如图1c-d。
tpp核开关(也是thi-框)结合硫胺素焦磷酸(tpp)以调节硫胺素生物合成和转运,以及类似代谢物的转运。认为它是至今为止在真核生物中找到的唯一核开关。参见例如edwardsetal.,“crystalstructuresofthethi-boxriboswitchboundtothiaminepyrophosphateanalogsrevealadaptiverna-smallmoleculerecognition.”structure2006;14(9):1459–68;winkleretal.,“thiaminederivativesbindmessengerrnasdirectlytoregulatebacterialgeneexpression.”nature.2002;419(6910):952–956;serganovetal.,“structuralbasisforgeneregulationbyathiaminepyrophosphate-sensingriboswitch.”nature.2006;441(7097):1167–1171;在此通过提及并入每篇的全部内容。
术语“cas9”或“cas9核酸酶”指包含cas9蛋白或其片段的rna引导性核酸酶。cas9核酸酶有时又称为casn1核酸酶或crispr(成簇的规律间隔性短回文重复序列(clusteredregularlyinterspacedshortpalindromicrepeat))关联核酸酶。crispr是一种适应性免疫系统,其提供针对活动的遗传元件(例如病毒、可转座元件和接合质粒)的保护。crispr簇含有间隔物、与前述活动元件互补的序列和靶侵入性核酸。crispr簇被转录并加工成crisprrna(crrna)。在ii型crispr系统中,pre-crrna的正确加工需要反式编码小rna(trans-encodedsmallrna,tracrrna)、内源核糖核酸酶3(rnc)和cas9蛋白。tracrrna充当核糖核酸酶3辅助性pre-crrna加工的引导。随后,cas9/crrna/tracrrna以内切核水解方式(endonucleolytically)切割与间隔物互补的线性或环状dsdna靶物。首先,以内切核水解方式切割不与crrna互补的靶链,然后以外切核水解方式3’-5’修剪。实际上,dna结合和切割通常需要蛋白质和两种rna种类。然而,可以工程化改造单一引导rna(“sgrna”,或仅“gnra”),从而掺入crrna和tracrrna两者的方面掺入单一rna分子中。参见例如jinekm.,chylinskik.,fonfarai.,hauerm.,doudnaj.a.,charpentiere.science337:816-821(2012),在此通过提及并入每篇的全部内容。cas9识别crispr重复序列中的短基序(pam或原间隔物(protospacer)相邻基序)以帮助区分自身或非自身。cas9核酸酶序列和结构是本领域技术人员公知的(参见例如“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferrettij.j.,mcshanw.m.,ajdicd.j.,savicd.j.,savicg.,lyonk.,primeauxc.,sezates.,suvorova.n.,kentons.,laih.s.,lins.p.,qiany.,jiah.g.,najarf.z.,renq.,zhuh.,songl.expand/collapseauthorlistmclaughlinr.e.,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,chylinskik.,sharmac.m.,gonzalesk.,chaoy.,pirzadaz.a.,eckertm.r.,vogelj.,charpentiere.,nature471:602-607(2011);及“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.,chylinskik.,fonfarai.,hauerm.,doudnaj.a.,charpentiere.science337:816-821(2012),通过提及将每篇的全部内容收入本文)。已经在多种物种中描述了cas9直向同系物,包括但不限于酿脓链球菌(s.pyogenes)和嗜热链球菌(s.thermophilus)。其它合适的cas9核酸酶和序列基于本公开内容对于本领域技术人员会是明显的,并且此类cas9核酸酶和序列包含来自生物体的cas9序列和披露于chylinski,rhun,andcharpentier,“thetracrrnaandcas9familiesoftypeiicrispr-casimmunitysystems”(2013)rnabiology10:5,726-737(其全部内容通过提及并入本文)的基因座。在一些实施方案中,包含cas9的蛋白质或其片段的蛋白质称为“cas9变体”。cas9变体与cas9或其片段共享同源性。例如,cas9变体与野生型cas9是至少约70%相同的,至少约80%相同的,至少约90%相同的,至少约95%相同的,至少约98%相同的,至少约99%相同的,至少约99.5%相同的,或至少约99.9%。在一些实施方案中,cas9变体包含cas9的片段(例如grna结合域或dna切割域),使得片段与野生型cas9的相应片段是至少约70%相同的,至少约80%相同的,至少约90%相同的,至少约95%相同的,至少约98%相同的,至少约99%相同的,至少约99.5%相同的,或至少约99.9%。在一些实施方案中,野生型cas9对应于来自酿脓链球菌的cas9(ncbi参照序列:
nc_017053.1,seqidno:1(核苷酸);seqidno:2(氨基酸))。
atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccctattaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaatctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttcaatgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagtttacatgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagactgtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgactga(seqidno:1)
mdkkysigldigtnsvgwavitddykvpskkfkvlgntdrhsikknligallfgsgetaeatrlkrtarrrytrrknricylqeifsnemakvddsffhrleesflveedkkherhpifgnivdevayhekyptiyhlrkkladstdkadlrliylalahmikfrghfliegdlnpdnsdvdklfiqlvqiynqlfeenpinasrvdakailsarlsksrrlenliaqlpgekrnglfgnlialslgltpnfksnfdlaedaklqlskdtydddldnllaqigdqyadlflaaknlsdaillsdilrvnseitkaplsasmikrydehhqdltllkalvrqqlpekykeiffdqskngyagyidggasqeefykfikpilekmdgteellvklnredllrkqrtfdngsiphqihlgelhailrrqedfypflkdnrekiekiltfripyyvgplargnsrfawmtrkseetitpwnfeevvdkgasaqsfiermtnfdknlpnekvlpkhsllyeyftvyneltkvkyvtegmrkpaflsgeqkkaivdllfktnrkvtvkqlkedyfkkiecfdsveisgvedrfnaslgayhdllkiikdkdfldneenediledivltltlfedrgmieerlktyahlfddkvmkqlkrrrytgwgrlsrklingirdkqsgktildflksdgfanrnfmqlihddsltfkediqkaqvsgqghslheqianlagspaikkgilqtvkivdelvkvmghkpeniviemarenqttqkgqknsrermkrieegikelgsqilkehpventqlqneklylyylqngrdmyvdqeldinrlsdydvdhivpqsfikddsidnkvltrsdknrgksdnvpseevvkkmknywrqllnaklitqrkfdnltkaergglseldkagfikrqlvetrqitkhvaqildsrmntkydendklirevkvitlksklvsdfrkdfqfykvreinnyhhahdaylnavvgtalikkypklesefvygdykvydvrkmiakseqeigkatakyffysnimnffkteitlangeirkrplietngetgeivwdkgrdfatvrkvlsmpqvnivkktevqtggfskesilpkrnsdkliarkkdwdpkkyggfdsptvaysvlvvakvekgkskklksvkellgitimerssfeknpidfleakgykevkkdliiklpkyslfelengrkrmlasagelqkgnelalpskyvnflylashyeklkgspedneqkqlfveqhkhyldeiieqisefskrviladanldkvlsaynkhrdkpireqaeniihlftltnlgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd(seqidno:2)
术语“缀合”指两个实体的联合,例如,两个分子,诸如两个蛋白质、两个域(例如结合域和切割域)、或蛋白质和药剂(例如蛋白质结合域和小分子)的联合。在一些方面中,连接在蛋白质(例如rna可编程核酸酶)和核酸(例如引导rna)之间。联合可以是例如经由直接或间接(例如经由接头)共价连接。在一些实施方案中,连接是共价的。在一些实施方案中,经由连接两个分子的接头缀合两个分子。例如,在rna的两个部分彼此缀合的一些实施方案中,例如适体(或核酸感测域)和grna,可以经由多核苷酸接头(例如连接一个rna的3’端至另一个rna的5’端的核苷酸序列)缀合两个rna。在一些实施方案中,接头包含至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少25或至少30个核苷酸。
如本文中在核酸序列的背景中使用的,术语“共有序列”指代表多个相似序列中在每个位置处找到的最频繁的核苷酸残基的计算的序列。通常,通过序列比对确定共有序列,其中彼此比较相似序列,并且计算类似的序列基序。
如本文中使用的,术语“有效量”指足以引发期望的生物应答的生物活性剂的量。例如,在一些实施方案中,核酸酶的有效量可以指足以诱导切割由核酸酶特异性结合并切割的期望靶位点(优选以最小脱靶切割或无脱靶切割)的核酸酶量。如熟练技术人员会领会,theeffectiveamountof药剂(例如核酸酶、杂合蛋白、融合蛋白、蛋白质二聚体、蛋白质(或蛋白质二聚体)和多核苷酸的复合物、或多核苷酸可以随各种因素,如例如期望的生物应答、特定的等位基因、基因组、靶位点、细胞、或靶定的组织、和使用的药剂而变化。
如本文中使用的,术语“工程化/工程化改造”指已经人为设计、生成、制备、合成和/.或制造的核酸分子、蛋白质复合物、复合物、物质、或实体。因而,工程化产物是自然界中不存在的产物。
如本文中使用的,术语“接头”指连接两个相邻分子或模块(例如适体(或核酸感测域)和grna的化学基团或分子。通常,接头位于两个基团、分子或其它模块之间,或者侧翼有两个基团、分子或其它模块,并且经由共价键彼此连接,如此连接两者。在一些实施方案中,接头是核苷酸接头。在一些实施方案中,核苷酸接头包含至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少25或至少30个核苷酸。在一些实施方案中,接头是氨基酸或多个氨基酸(例如肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、多聚体或化学模块。
如本文中使用的,术语“突变”指序列(例如核酸或氨基酸序列)内的残基取代为另一种残基,或者序列内的一个或多个残基的取代或插入。突变在本文中通常通过鉴定后面有序列内的残基位置的初始残基及通过新取代残基的身份描述。用于进行本文中提供的氨基酸取代(突变)的方法是本领域中已知的,并且由例如,greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012))提供。
如本文中使用的,术语“核酸酶”指能够切割连接核酸分子中的核苷酸残基的磷酸二酯键的药剂,例如蛋白质或小分子。在一些实施方案中,核酸酶是蛋白质,例如可以结合核酸分子并且切割连接核酸分子内的核苷酸残基的磷酸二酯键的酶。核酸酶可以是内切核酸酶(其切割多核苷酸链内的磷酸二酯键)或者外切核酸酶(其切割多核苷酸链末端的磷酸二酯键)。在一些实施方案中,核酸酶是位点特异性核酸酶,其结合和/或切割特定核苷酸序列内的特定磷酸二酯键,所述特定核苷酸序列在本文中又称为“识别序列”、“核酸酶靶位点”或“靶位点”。在一些实施方案中,核酸酶是rna引导性(即rna-可编程的)核酸酶,其与具有与靶位点互补的序列的rna(例如引导rna,“grna”)复合(例如结合),从而提供核酸酶的序列同一性。在一些实施方案中,核酸酶识别单链靶位点。在其它实施方案中,核酸酶识别双链靶位点,例如,双链dna靶位点。许多天然存在的核酸酶(例如许多天然存在的dna限制性核酸酶)的靶位点是本领域技术人员公知的。在许多情况中,dna核酸酶(诸如ecori、hindiii或bamhi)识别长度4至10个碱基对的回文双链dna靶位点,并且在靶位点内的特定位置处切割两个dna链之每个。一些内切核酸酶对称切割双链核酸靶位点,即在相同位置处切割两条链,从而末端包含碱基成对核苷酸,在本文中又称为平端。其它内切核酸酶不对称切割双链核酸靶位点,即在不同位置处切割每条链,从而末端包含不成对核苷酸。在双链dna分子末端的不成对核苷酸又称为“突出端”,例如作为“5’-突出端”或作为“3’-突出端”,这取决于不成对核苷酸形成相应dna链的5’还是5’端。以不成对核苷酸为末端的双链dna分子末端又称为粘性末端,因为它们可以“粘附于”包含互补不成对核苷酸的其它双链dna分子末端。核酸酶蛋白质通常包含“结合域”(其介导蛋白质与核酸底物的相互作用,并且在一些情况中还特异性结合靶位点)和“切割域”(其催化核酸主链内的磷酸二酯键的切割)。在一些实施方案中,核酸酶蛋白质可以以单体形式结合并且切割核酸分子,而在其它实施方案中,核酸酶蛋白质必须二聚化或多聚化以切割靶核酸分子。天然存在的核酸酶的结合域和切割域,及可以融合以创建核酸酶结合特异性靶位点的模块结合域和切割域是本领域技术人员公知的。例如,rna可编程核酸酶(例如cas9)的结合域,或具有无活性dna切割域的cas9蛋白可以用作结合域(例如其结合grna以指导对靶位点的结合),从而特异性结合期望的靶位点,并且与切割域(例如foki的切割域)融合或缀合以创建切割靶位点的工程化核酸酶。
如本文中使用的,术语“核酸”和“核酸分子”指包含核碱基和酸性模块的化合物,例如核苷、核苷酸、或核苷酸的多聚体。通常,多聚体核酸,例如包含3个或更多个核苷酸的核酸分子是线性分子,其中相邻核苷酸经由磷酸二酯连接彼此连接。在一些实施方案中,“核酸”指个别的核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”指包含3个或更多个个别的核苷酸残基的寡核苷酸链。如本文中使用的,术语“寡核苷酸”和“多核苷酸”可以互换使用,指核苷酸的多聚体(例如至少3个核苷酸的串)。在一些实施方案中,“核酸”涵盖rna以及单链和/或双链dna。核酸可以是天然存在的,例如,在基因组、转录物、mrna、trna、rrna、sirna、snrna、质粒、粘粒、染色体、染色单体、或其它天然存在的核酸分子的背景中。另一方面,核酸分子可以是非天然存在的分子,例如重组dna或rna、人工染色体、工程化基因组、或其片段、或合成dna、rna、dna/rna杂合物,或者包括非天然存在的核苷酸或核苷。此外,术语“核酸”、“dna”、“rna”和/或相似术语包括核酸类似物,即具有磷酸二酯主链外的类似物。核酸可以从天然来源中纯化,使用重组表达系统生成,并且任选纯化,化学合成,等等。在适当的情况下,例如在化学合成分子的情况中,核酸可以包含核苷类似物,诸如具有经化学修饰的碱基或糖的类似物,和主链修饰。核酸序列以5’至3’方向呈现,除非另有指示。在一些实施方案中,核酸是或者包含天然核苷(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷、和脱氧胞苷);核苷类似物(例如2-氨基腺苷、2-硫代胸苷(2-thiothymidine)、肌苷、吡咯并-嘧啶、3-甲基腺苷、5-甲基胞苷、2-氨基腺苷、c5-溴尿苷、c5-氟尿苷、c5-碘尿苷、c5-丙炔基-尿苷、c5-丙炔基-胞苷、c5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷(7-deazaadenosine)、7-脱氮鸟苷,8-氧代腺苷(8-oxoadenosine)、8-氧代鸟苷(8-oxoguanosine)、o(6)-甲基鸟嘌呤、和2-硫代胞苷);经化学修饰的碱基;经生物修饰的碱基(例如甲基化碱基);插入碱基;经修饰的糖类(例如2’-氟核糖、核糖、2’-脱氧核糖、阿拉伯糖和己糖);和/或经修饰的磷酸酯基团(例如硫代磷酸酯和5’-n-氨基磷酸酯连接)。
如本文中使用的,术语“药物组合物”指可以在治疗疾病或病症的背景中对受试者施用的组合物。在一些实施方案中,药物组合物包含活性成分,例如核酸酶或编码核酸酶的核酸,和药学可接受赋形剂。
如本文中使用的,术语“增殖性疾病”指细胞或组织稳态由于细胞或细胞群体展现出异常升高的增殖速率而受到扰乱的任何疾病。增殖性疾病包括超增殖性疾病,诸如新生前(pre-neoplastic)增生性状况和新生性疾病。新生性疾病以异常的细胞增殖为特征,并且包括良性和恶性新生物两者。恶性新生物又称为癌症。
术语“蛋白质”、“肽”和“多肽”在本文中可互换使用,并且指通过肽(酰胺)键连接在一起的氨基酸残基的多聚体。该术语指任何大小、结构或功能的蛋白质、肽或多肽。通常,蛋白质、肽或多肽会长至少3个氨基酸。蛋白质、肽或多肽可以指个别的蛋白质或蛋白质集合。例如,可以通过添加化学实体,诸如碳水化合物基团、羟基基团、磷酸基团、法呢基基团、异法呢基基团、脂肪酸基团、用于缀合、功能化或其它修饰的接头等修饰蛋白质、肽或多肽中的一个或多个氨基酸。蛋白质、肽或多肽也可以是单一分子或者可以是多分子复合物。蛋白质、肽或多肽可以仅是天然存在的蛋白质或肽的片段。蛋白质、肽或多肽可以是天然存在的、重组的、或合成的、或者其任何组合。如本文中使用的,术语“融合蛋白”指包含来自至少两种不同蛋白质的蛋白质域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基端(n端)部分或者位于羧基端(c端)蛋白质,如此分别形成“氨基端融合蛋白”或“羧基端融合蛋白”。蛋白质可以包含不同域,例如,核酸结合域(例如cas9的grna结合域,其指导蛋白质对靶位点的结合)和核酸切割位点。在一些实施方案中,蛋白质包含蛋白质性部分,例如构成核酸结合域的氨基酸序列,和有机化合物,例如可以起核酸切割剂的作用的化合物。在一些实施方案中,蛋白质与核酸(例如rna)在复合物中,或者与核酸(例如rna)联合。可以通过本领域中已知的任何方法生成本文中提供的任何蛋白质。例如,可以经由重组蛋白表达和纯化(其尤其适合于包含肽接头的融合蛋白)生成本文中提供的蛋白质。用于重组蛋白表达和纯化的方法是公知的,并且包括那些由greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012))描述的,其全部内容通过提及并入本文。
术语“rna可编程核酸酶”和“rna引导性核酸酶”在本文中可互换使用,并且指与一种或多种不作为切割靶物的rna形成复合物(例如结合或联合)的核酸酶。在一些实施方案中,rna可编程核酸酶在与rna的复合物中时可以称为核酸酶:rna复合物。通常,结合的rna称为引导rna(grna)。grna可以以两个或更多个rna的复合物或以单一rna分子存在。以单一rna分子存在的grna可以称为单一引导rna(sgrna),尽管“grna”可互换使用,指以单一分子或以两个或更多个分子的复合物存在的引导rna。通常,以单一rna种类存在的grna包含至少两个域:(1)与靶核酸共享同源性的域(例如,并且指导cas9复合物对靶物的结合);和(2)结合cas9蛋白的域。在一些实施方案中,域(2)是“sgrna”主链,如图1a-3d中任一描述的。在一些实施方案中,域(2)对应于称为tracrrna的序列,并且包含茎-环结构。例如,在一些实施方案中,域(2)与tracrrna同源,如jineketal.,science337:816-821(2012)的图1e中描绘的,其全部内容通过提及并入本文。在一些实施方案中,域2与图1a-3d中任一的“sgrna主链”或如jineketal.,science337:816-821(2012)描述的tracrrna是至少90%、至少95%、至少98%或至少99%相同的。在一些实施方案中,grna包含两个或更多个域(1)和(2),并且可以称为“延长的grna”。例如,延长的grna会结合两个或更多个cas9蛋白,并且在两个或更多个独特区域处结合靶核酸。grna包含与靶位点互补的核苷酸序列,其介导核酸酶/rna复合物对所述靶位点的结合,并且提供核酸酶:rna复合物的序列特异性。结合靶核酸的grna的序列可以包含与靶物的区域互补并且适合于核酸酶:rna复合物结合的任何序列。在一些实施方案中,rna-可编程核酸酶是(crispr-associatedsystem)cas9内切核酸酶,例如,来自酿脓链球菌的cas9(csn1)(参见例如“completegenomesequenceofanm1strainofstreptococcuspyogenes.”ferrettij.j.,mcshanw.m.,ajdicd.j.,savicd.j.,savicg.,lyonk.,primeauxc.,sezates.,suvorova.n.,kentons.,laih.s.,lins.p.,qiany.,jiah.g.,najarf.z.,renq.,zhuh.,songl.expand/collapseauthorlistmclaughlinr.e.,proc.natl.acad.sci.u.s.a.98:4658-4663(2001);“crisprrnamaturationbytrans-encodedsmallrnaandhostfactorrnaseiii.”deltchevae.,chylinskik.,sharmac.m.,gonzalesk.,chaoy.,pirzadaz.a.,eckertm.r.,vogelj.,charpentiere.,nature471:602-607(2011);及“aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.”jinekm.,chylinskik.,fonfarai.,hauerm.,doudnaj.a.,charpentiere.science337:816-821(2012),每篇的全部内容通过提及并入本文。
由于rna可编程核酸酶(例如cas9)使用rna:dna杂交来测定靶dna切割位点,这些蛋白质能够在原则上切割由指导rna规定的任何序列。使用rna-可编程核酸酶,诸如cas9进行位点特异性切割(例如以修饰基因组)的方法是本领域中已知的(参见例如cong,l.etal.multiplexgenomeengineeringusingcrispr/cassystems.science339,819-823(2013);mali,p.etal.rna-guidedhumangenomeengineeringviacas9.science339,823-826(2013);hwang,w.y.etal.efficientgenomeeditinginzebrafishusingacrispr-cassystem.naturebiotechnology31,227-229(2013);jinek,m.etal.rna-programmedgenomeeditinginhumancells.elife2,e00471(2013);dicarlo,j.e.etal.genomeengineeringinsaccharomycescerevisiaeusingcrispr-cassystems.核酸sresearch(2013);jiang,w.etal.rna-guidededitingofbacterialgenomesusingcrispr-cassystems.naturebiotechnology31,233-239(2013);每篇的全部内容通过提及并入本文)。
术语“小分子”和“有机化合物”在本文中可互换使用,并且指具有相对较低的分子量的分子,无论是天然存在的或人工创建的(例如经由化学合成)。通常,有机化合物含有碳。有机化合物可以含有多个碳-碳键、立构中心、和其它官能团(例如胺、羟基、羰基或杂环状环)。在一些实施方案中,有机化合物是单体的,并且具有小于约1500g/mol的分子量。在某些实施方案中,小分子的分子量小于约1000g/mol或小于约500g/mol。在某些实施方案中,小分子是药物,例如,已经被合适的政府机构或管理机关视为在人或动物中使用方面安全且有效的药物。在某些实施方案中,已知小分子结合适体。在一些实施方案中,有机化合物是抗生素药物,例如,抗癌抗生素,诸如dynemicin、新制癌菌素(neocarzinostatin)、加利车霉素(calicheamicin)、埃斯波霉素(esperamicin)、博来霉素(bleomycin)或其衍生物。
如本文中使用的,术语“受试者”指个别的生物体,例如,个别的哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,受试者是非人哺乳动物。在一些实施方案中,受试者是非人灵长类。在一些实施方案中,受试者是啮齿类。在一些实施方案中,受试者是绵羊、山羊、牛、猫或犬。在一些实施方案中,受试者是脊椎动物、两栖动物、爬虫动物、鱼、昆虫、苍蝇或线虫类。在一些实施方案中,受试者是研究动物。在一些实施方案中,受试者是经遗传工程化的,例如经遗传工程化的非人受试者。受试者可以是任何性别的并且在发育的任何阶段。
如本文中在核酸酶的背景中使用的,术语“靶核酸”和“靶基因组”分别指包含给定核酸酶的至少一个靶位点的核酸分子或基因组。
术语“靶位点”在本文中与术语“核酸酶靶位点”可互换使用,指被核酸酶结合并且切割的核酸分子内的序列。靶位点可以是单链的或双链的。在rna引导性(例如rna可编程的)核酸酶(例如包含cas9grna结合域和活性cas9dna切割域的蛋白质二聚体)的背景中,靶位点通常包含与rna可编程核酸酶的grna互补的核苷酸序列,和grna互补序列相邻的3’端的原间隔物相邻基序(pam)。对于rna引导性核酸酶cas9,在一些实施方案中,靶位点可以是20个碱基对加3个碱基对pam(例如nnn,其中n代表任何核苷酸)。通常,pam的第一个核苷酸可以是任何核苷酸,而两个下游核苷酸是根据特定的rna引导性核酸酶规定的。用于rna引导性核酸酶(诸如cas9)的例示性靶位点是本领域技术人员已知的,并且包括但不限于nng、ngn、nag和ngg,其中n代表任何核苷酸。另外,来自不同物种(例如嗜热链球菌代替酿脓链球菌)的cas9核酸酶识别包含序列nggng的pam。其它pam序列是已知的,包括但不限于nnagaaw和naar(参见例如esveltandwang,molecularsystemsbiology,9:641(2013),其全部内容通过提及并入本文)。例如,rna引导性核酸酶(诸如例如cas9)的靶位点可以包含结构[nz]-[pam],其中独立地,每个n是任何核苷酸,并且z是1-50的整数。在一些实施方案中,z是至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30、至少35、至少40、至少45或至少50。在一些实施方案中,z是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、或50。在一些实施方案中,z是20。在一些实施方案中,“靶位点”也可以指核酸分子内被核酸酶结合但不切割的序列。
术语“处理/治疗”指目的为逆转、减轻疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作、或者抑制疾病或病症或其一种或多种症状的过程的临床干预,如本文中描述的。如本文中使用的,“处理/治疗”指目的为逆转、减轻疾病或病症或其一种或多种症状、延迟疾病或病症或其一种或多种症状的发作、或者抑制疾病或病症或其一种或多种症状的过程的临床干预,如本文中描述的。在一些实施方案中,可以在已经形成一种或多种症状后和/或在已经诊断出疾病后施用治疗/处理。在其它实施方案中,可以在缺乏症状的情况中施用治疗,例如以预防疾病或延迟症状的发作或抑制疾病的发作或进展。例如,可以在症状发作前对易感性个体施用治疗/处理(例如鉴于症状史和/或鉴于遗传或其它易感性因素)。也可以在症状已经消退后继续治疗/处理,例如,以预防或延迟其复发。
术语“载体”指包含本发明的一种或多种重组多核苷酸(例如那些编码本文中提供的grna和/或cas9蛋白的重组多核苷酸)的多核苷酸。载体包括但不限于质粒、病毒载体、粘粒、人工染色体和噬菌粒。载体是能够在宿主细胞中复制,并且进一步以可以切割载体并且可以接受期望的核酸序列插入的一个或多个内切核酸酶限制性位点为特征的载体。载体可以含有一种或多种适合于用于鉴定和/或选择细胞的标志物序列,所述细胞已经或尚未用载体转化或遗传修饰。标志物包括例如,编码提高或降低对抗生素(例如卡那霉素、氨苄青霉素)或其它化合物的抗性或敏感性的蛋白质的基因、编码其活性通过本领域中已知的标准测定法可检测的酶(例如β-半乳糖苷酶、碱性磷酸酶或萤光素酶)的基因、和明显影响经转化的或经转染的细胞、宿主、集落或噬斑的表型的基因。本发明涵盖任何适合于转化宿主细胞(例如大肠杆菌、哺乳动物细胞,诸如cho细胞、昆虫细胞等)的载体,例如属于puc系列、pgem系列、pet系列、pbad系列、ptet系列、或pgex序列的载体。在一些实施方案中,载体适合于转化用于重组蛋白生成的宿主细胞。用于选择和工程化改造载体和宿主细胞以表达grna和/或蛋白质(例如本文中提供的那些)、转化细胞、和表达/纯化重组蛋白的方法是本领域中公知的,并且由例如greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012))提供。
具体实施方式
位点特异性核酸酶是用于体外和体内靶向基因组修饰的有力工具。一些位点特异性核酸酶在理论上可以实现一定水平的对靶切割位点的特异性,其会容许在不影响任何其它基因组位点的情况下靶向用于切割的基因组中的单一独特位点。已经报告了活细胞中的核酸酶切割触发dna修复机制,其经常例如经由同源重组或非同源末端连接而导致经切割并且修复的基因组序列的修饰。因而,基因组内的特定独特序列的靶向切割打开了用于体细胞中的基因靶向和基因修饰的新通道,包括难以用常规的基因靶向方法操作的细胞,诸如许多人体细胞或胚胎干细胞。可以在临床背景中使用核酸酶介导的对疾病相关序列,例如hiv/aids患者中的ccr-5等位基因或肿瘤新血管化必需的基因的修饰,并且两种位点特异性核酸酶目前在临床试验中(perez,e.e.etal.,“establishmentofhiv-1resistanceincd4+tcellsbygenomeeditingusingzinc-fingernucleases.”naturebiotechnology.26,808-816(2008);clinicaltrials.govidentifiers:nct00842634,nct01044654,nct01252641,nct01082926)。可以使用位点特异性核酸酶治疗的其它疾病包括例如与三重扩充相关的疾病(例如亨廷顿(huntington)氏疾病、营养不良性肌强直(myotonicdystrophy)、脊髓小脑共济失调(spinocerebellaratatxias)等)、囊性纤维化(cysticfibrosis)(通过靶向cftr基因)、癌症、自身免疫性疾病、和病毒性感染。
用位点特异性核酸酶介导的修饰的一个重要问题是脱靶核酸酶效应,例如与意图的靶序列相差一个或多个核苷酸的基因组序列的切割。脱靶切割的不期望副作用范围为基因靶向事件期间对不想要基因座的插入到临床情况中的重度并发症。由对受试者施用的内切核酸酶对编码必需基因功能或肿瘤阻抑物基因的序列的脱靶切割可以导致受试者的疾病或甚至死亡。因而,期望在设计具有使脱靶效应最小化的最大机会的核酸酶中采用新策略。
在一些方面中,本公开内容的方法和组合物通过提供控制rna引导性核酸酶的短暂活性和/或提高特异性的手段而代表相对于先前方法和组合物的改善。例如,在与靶物互补的rna(例如grna)形成复合物后,本领域中已知的rna引导性核酸酶(天然存在的和那些工程化的两者)通常结合并且切割dna。本发明的方面涉及下述认识,即对rna引导性核酸酶:rna复合物对其靶物的结合时机具有短暂控制会通过最小化或控制复合物能够结合并且切割靶物的时间量来降低脱靶效应的可能性。另外,仅结合要切割的靶位点的工程化grna(例如使用具有在缺乏靶物的情况中阻断结合的延长的靶物识别域的grna)改善rna引导性核酸酶的特异性,并且降低脱靶效应的机会。
可以使用本文中提供的策略、方法、组合物、试剂盒和系统来控制任何rna引导性核酸酶(例如cas9)的活性和/或改善任何rna引导性核酸酶(例如cas9)的特异性。基于本公开内容,适合于与如本文中描述的经修饰的grna一起使用的核酸酶对于本领域技术人员会是明显的。
在某些实施方案中,利用本文中提供的策略、方法、组合物、试剂盒和系统来控制rna-引导性(例如rna-可编程)核酸酶活性的时机。鉴于典型rna引导性核酸酶在形成核酸酶:rna复合物后识别并切割靶序列,本文中提供的经修饰的grna容许控制靶物结合和切割。其它方面提供了grna,其工程化改造为仅当存在意图的靶位点时结合靶位点,从而改善rna-引导性核酸酶的特异性。虽然cas9:grna复合物已经成功用于修饰细胞(cong,l.etal.multiplexgenomeengineeringusingcrispr/cassystems.science.339,819-823(2013);mali,p.etal.rna-guidedhumangenomeengineeringviacas9.science.339,823-826(2013);jinek,m.etal.rna-programmedgenomeeditinginhumancells.elife2,e00471(2013))和生物体(hwang,w.y.etal.efficientgenomeeditinginzebrafishusingacrispr-cassystem.naturebiotechnology.31,227-229(2013))两者,使用cas9:引导rna复合物修饰斑马鱼胚胎的研究以与zfn和talen相似的比率观察到毒性(例如脱靶效应)(hwang,w.y.etal.naturebiotechnology.31,227-229(2013))。因而,本公开内容的方面目的在于使用新的grna平台来降低cas9脱靶效应的机会,所述新的grna平台控制靶物结合和切割的时机和/或改善rna引导性核酸酶的特异性。
虽然与dna和dna切割性核酸酶诸如cas9特别相关,本文中提供的发明构思、方法、组合物、策略、试剂盒和系统在此方面不受限制,而是可以应用于利用核酸模板诸如rna来指导对靶核酸的结合的任何核酸:核酸酶系统。
经修饰的指导rna(grna)
本公开内容的一些方面提供了工程化改造为具有“开始”和“关闭”状态两者的grna。然后,在一些方面中,grna可以统称为“可变换grna”。例如,当grna在阻止grna对靶核酸的结合的结构状态中时,可变换grna被说成为“关闭”状态。在一些方面中,在“关闭”状态中的grna可以结合其关联rna引导性核酸酶(例如cas9),然而,核酸酶:grna复合物(当grna为“关闭”状态时)不能结合靶核酸来介导切割。在其它方面中,在“关闭”状态中的grna不能结合其靶序列或rna引导性核酸酶,诸如cas9。相反,当grna在容许grna对靶核酸结合的结构状态(例如作为与rna引导性核酸酶诸如cas9的复合物)中时,可变换grna被说成为“开启”状态。本公开内容的一些实施方案提供了包含与rna引导性核酸酶(诸如cas9)有关的发明性grna的复合物及其使用方法。本公开内容的一些实施方案提供了编码此类grna和/或rna引导性核酸酶(例如cas9)的核酸。本公开内容的一些实施方案提供了包含此类编码核酸的表达构建体。
基于适体的grna
在一个实施方案中,提供了包含适体的grna。参见例如图1a-d。例如,在一些实施方案中,grna经由核苷酸接头与适体连接,如本文中描述的。适体通常是基于rna或肽的分子,其以亲和力(例如,竞争抗体:抗原相互作用)结合特定配体。在一些实施方案中,适体以约1nm-10μm、约1nm-1μm、约1nm-500nm或约1nm-100nm的kd结合其配体。凭借基于rna的适体,例如,那些在mrna的核开关中找到的,配体对适体域的结合导致控制mrna表达(例如翻译)的构象变化。rna适体已经成功克隆,并且适合于其它分子,例如以控制基因表达,或者已经使用selex针对特定配体工程化改造/选择(参见例如dixonetal.,“reengineeringorthogonallyselectiveriboswitches.”pnas2010;107(7):2830–2835;suessetal.,“atheophyllineresponsiveriboswitchbasedonhelixslippingcontrolsgeneexpressioninvivo.”nucleicacidsres.2004;32(4):1610–1614;ellingtonandszostak,“invitroselectionofrnamoleculesthatbindspecificligands.”nature.1990;346:818–822;tuerkandgold,“systematicevolutionofligandsbyexponentialenrichment:rnaligandstobacteriophaget4dnapolymerase.”science.1990;249:505–510;burkeandgold,“rnaaptamerstotheadenosinemoietyofs-adenosylmethionine:structuralinferencesfromvariationsonathemeandthereproducibilityofselex.”nucleicacidsres.1997;25(10):2020-4;ulrichetal.,“dnaandrnaaptamers:fromtoolsforbasicresearchtowardstherapeuticapplications.”combchemhighthroughputscreen.2006;9(8):619-32;svobodováetal.,“comparisonofdifferentmethodsforgenerationofsingle-strandeddnaforselexprocesses.analbioanalchem.2012;404:835–842;每篇的全部内容在此通过提及并入)。结合适体的配体包括但不限于小分子、代谢物、碳水化合物、蛋白质、肽或核酸。如图1a-d中显示的,与适体连接的grna在缺乏结合适体的特定配体的情况中以“关闭”状态存在。通常,“关闭”状态由结构特征介导,所述结构特征阻止与靶核酸杂交的整个或部分grna序列自由杂交靶核酸。例如,在一些方面中,设计包含适体的grna,使得适体序列的一部分与整个或部分与靶物杂交的grna序列杂交。可以使用本领域中已知的方法工程化改造结合靶物的grna的序列(例如在图1c,d中描绘为“切割靶物的引导”,在本文中称为“引导”序列),以包含靶向任何期望核酸靶物的任何序列,并且因此不限于例示性的图中描绘的序列。类似地,任何合适的适体可以在grna序列的5’或3’连接,并且使用本领域中的常规方法修饰以包含会与grna中的特定引导序列杂交的核苷酸。在一些实施方案中,与本文中提供的任何grna连接的适体是rna适体,如本文中描述的。在一些实施方案中,rna适体衍生自(例如克隆自)核开关。任何核开关可以在rna适体中使用。例示性的核开关包括但不限于茶碱核开关、焦磷酸硫胺素(tpp)核开关、腺苷钴胺素(adocbl)核开关、s-腺苷甲硫氨酸(sam)核开关、sah核开关、黄素单核苷酸(fmn)核开关、四氢叶酸核开关、赖氨酸核开关、甘氨酸核开关、嘌呤核开关、glms核开关和前q核苷1(preq1)核开关。在一些实施方案中,rna适体衍生自茶碱核开关。在一些实施方案中,自茶碱核开关衍生的适体包含seqidno:3。在一些实施方案中,可以修饰seqidno:3的加下划线粗体部分,使得本文中的任何核苷酸用任何其它核苷酸替换,和/或可以通过添加或缺失1或更多个核苷酸修饰。例如,可以修饰加下划线粗体部分,使得包含与部分或整个与靶核酸杂交的grna序列的序列。参见例如图1c。在一些实施方案中,rna适体与seqidno:3是至少80%、至少85%、至少90%、至少95%、至少98%或至少99%相同的。
在一些实施方案中,适体是非天然存在的(例如不存在于自然界中)。例如,在一些实施方案中,使用selex工程化改造或者从文库选择适体。在一些实施方案中,适体包含至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少175、至少200、至少250、或至少300个核苷酸。在一些实施方案中,适体包含20-200、20-150、20-100、或20-80个核苷酸。在一些实施方案中,提供的rna(例如包含与适体连接的grna的rna)的grna部分包含至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少175、或至少200个核苷酸。在一些实施方案中,grna部分包含60-150、60-100、或60-80个核苷酸。
mrna感测性grna
根据另一个实施方案,提供了在某些条件下(例如在存在代谢物、小分子、核酸等的情况中)结合靶核酸的grna。在一些实施方案中,使grna在结构上阻止(例如为“关闭”状态)结合靶物(例如与靶物杂交),除非另一个分子结合grna(例如与grna杂交),导致与“开启”状态对应的结构重排。在一些实施方案中,特定转录物(例如mrna)对grna的结合使grna从“关闭”状态转向“开启”状态。参见例如图2a-d。此类grna称为“mrna感测性”grna。例如,在一些方面中,提供了grna,其包含:(i)与靶核酸区域杂交的区域(例如“引导”序列);(ii)与区域(i)的序列部分或完全杂交的另一个区域(例如“引导块”序列);和(iii)与转录物(mrna)的区域杂交的区域(例如“转录物传感器”)。在一些实施方案中,每个区域(例如i-iii)包含至少5、至少10、至少15、至少20或至少25个核苷酸。在一些实施方案中,grna形成茎-环结构。在一些实施方案中,茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且环由区域(iii)的部分或整个序列形成。在一些实施方案中,区域(ii)和(iii)在区域(i)的5’或3’。参见例如图2a对图2c。可以使用本领域中已知的方法工程化改造结合靶物的grna的序列(例如“引导”序列),以包括靶向任何期望核酸靶物的任何序列,并且因此不限于例示性的图中描绘的序列。类似地,可以使用本领域中常规的方法工程化改造区域(iii)(例如转录物传感器)以包含与感兴趣mrna杂交的任何序列。类似地,可以使用本领域中常规的方法工程化改造区域(ii)以包含与部分或整个“引导”序列杂交的序列。例如,在一些方面中,mrna是在细胞中表达时,期望靶核酸(例如基因)的基因组修饰的。如此,在缺乏mrna的情况中,grna当投递到细胞(或在细胞中表达)时仍然为“关闭”状态。当存在(表达)mrna时,它结合grna的转录物传感器,导致阻止“引导”序列对靶核酸杂交的茎-环结构的解折叠,从而“开启”grna。参见例如图2b和2d。以“开启”状态提供的grna能够联合并引导rna引导性核酸酶(例如cas9蛋白)以结合靶核酸。
延长的-dna感测性(xdna感测性)grna
根据另一个实施方案,提供了保持为“关闭”状态的经修饰的grna,除非grna与靶核酸的至少两个独特区域杂交。参见例如图3a-d。此类grna提供了改善的对rna引导性核酸酶(例如cas9)的特异性,因为它们有效延长特定grna/靶物相互作用的识别序列。此类grna称为“xdna感测性”grna(“x”是“延长的”dna识别的缩写)。例如,提供了grna,其包含:(i)与靶核酸区域杂交的区域(例如“引导”序列);(ii)与区域(i)的序列部分或完全杂交的另一个区域(例如“引导块”序列);和(iii)与靶核酸的另一个区域杂交的区域(例如“xdna传感器”)。在一些实施方案中,xdna传感器必须首先结合靶核酸,之后引导序列能够结合靶物。在一些实施方案中,xdna传感器结合引导序列结合的靶物的相同链。在一些实施方案中,xdna传感器和引导序列结合靶核酸的不同链。在一些实施方案中,区域(i)和(ii)的序列包含至少5、至少10、至少15、至少20或至少25个核苷酸。在一些实施方案中,区域(iii)的序列包含至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75或至少100个核苷酸。在一些实施方案中,grna形成茎-环结构。例如,在一些实施方案中,茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且环由区域(iii)的部分或整个序列形成。在一些实施方案中,区域(i)和(iii)包含grna中相邻的序列。在一些实施方案中,区域(ii)和(iii)在区域(i)的5’或3’。参见例如图3a对图3c。在一些实施方案中,区域(ii)位于区域(i)和(iii)之间。可以使用本领域中已知的方法工程化改造结合靶物的grna的序列(例如“引导”序列)以包含靶向任何期望的核酸靶物的任何序列,并且因此不限于例示性的图中描绘的序列。类似地,可以使用本领域中常规的方法工程化改造区域(iii)(例如xdna传感器)以包含与靶核酸的另一个区域(例如与被“引导”序列靶向的区域不同的区域)杂交的任何序列。同样地,可以使用本领域中常规的方法工程化改造区域(ii)以包含与部分或整个“引导”序列杂交的序列。如此,在缺乏正确的靶核酸(例如包含两个区域的靶物,grna设计为与所述两个区域杂交)的情况中,grna在投递至细胞(或者在细胞中表达)时仍然为“关闭”状态。不希望限于任何具体的理论,预期在grna(例如与cas9联合时)与靶核酸开始接触时,xdna传感器与靶物杂交,这继而解开阻断“引导”序列的茎-环结构,将grna“开启”。若它是正确的靶核酸,则引导序列然后会与靶物杂交,并且任选地复合物会切割靶核酸。参见例如图3b和3d。
复合物
在一些实施方案中,提供了复合物,其包含本文中提供的任何rna/grna(例如包含与适体连接的grna的rna,感测mrna的grna,或者包含xdna传感器的grna)。在一些方面中,提供了复合物,其包含与rna引导性核酸酶联合的提供的rna/grna。在一些实施方案中,rna引导性核酸酶是cas9、cas9的变体、或cas9的片段,例如如本文中描述的。在一些实施方案中,rna引导性核酸酶是cas9蛋白的任何形式,如2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,609,题目为“cas9variantsandusesthereof”和2013年9月6日提交的美国临时专利申请u.s.s.n.61/874,746,题目为“deliverysystemforfunctionalnucleases”中提供的,在此通过提及完整收录每篇的全部内容。
在一些实施方案中,复合物进一步包含配体,例如结合与rna引导性核酸酶联合的rna适体的配体,如本文中描述的。在一些实施方案中,复合物(例如包含提供的rna(grna):配体:cas9蛋白)结合并且任选切割靶核酸。在一些方面中,包含“感测性”grna(例如mrna或xdna)和cas9的复合物结合并且任选切割靶核酸。
药物组合物
在一些实施方案中,提供本文中描述的任何grna作为药物组合物的一部分。在一些实施方案中,药物组合物进一步包含与发明性grna形成复合物的rna引导性核酸酶(例如cas9)。例如,一些实施方案提供了药物组合物,其包含如本文中提供的grna和rna引导性核酸酶或编码此类grna和/或核酸酶的核酸,和药学可接受赋形剂。任选地,药物组合物可以包含一种或多种别的治疗活性物质。
在一些实施方案中,对受试者(例如对人受试者)施用本文中提供的组合物以实现受试者中的靶向基因组修饰。在一些实施方案中,自受试者获得细胞,并且使该细胞与联合rna引导性核酸酶或其编码核酸的提供的grna离体接触。在一些实施方案中,将自受试者取出并且与发明性grna:核酸酶复合物离体接触的细胞再导入受试者中,任选地在已经在细胞中实现或检出期望的基因组修饰后。投递包含核酸酶的药物组合物的方法是已知的,并且记载于例如,美国专利no.6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219;和7,163,824,全部的公开内容通过提及完整并入本文。虽然本文中提供的药物组合物的描述主要涉及适合于对人施用的药物组合物,但是熟练技术人员应当理解,此类组合物一般适合于对所有类别的动物或生物体施用。修饰适合于对人施用的药物组合物以使组合物适合于对各种动物施用是完全了解的,并且普通技术的兽医药理学家可以仅通过常规(若有的话)实验设计和/或进行此类修饰。涵盖药物组合物施用的受试者包括但不限于人和/或其它灵长类;哺乳动物、驯养动物、宠物和商业相关哺乳动物,诸如牛、猪、马、山羊、猫、犬、小鼠和/或大鼠;和/或禽类,包括商业相关禽类,诸如鸡、鸭、鹅和/或火鸡。
可以通过药理学领域中已知或后来开发的任何方法制备本文中描述的药物组合物的配制剂。一般地,此类制备方法包括下述步骤,即使活性成分与赋形剂和/或一种或多种其它辅助成分联合,然后若必要和/或想要的话,运输和/或包装产品成期望的单剂量或多剂量形式。
另外,药物组合物可以包含药学可接受赋形剂,如本文中使用的,其包括任何和所有溶剂、分散介质、稀释剂或其它液体媒介物、分散或悬浮助剂、表面活性剂、等张剂、增稠剂或乳化剂、防腐剂、固体粘合剂、润滑剂等,如适合于期望的特定剂量形式的。remington’sthescienceandpracticeofpharmacy,21stedition,a.r.gennaro(lippincott,williams&wilkins,baltimore,md,2006;其通过提及完整并入本文)公开了配制药物组合物中使用的各种赋形剂及其已知的制备技术。关于其它适合于生成包含核酸酶的药物组合物的方法、试剂、赋形剂和溶剂,还可参见pct申请pct/us2010/055131(公开文本号wo2011053982a8,2010年11月2日),其通过提及完整并入本文。除非任何常规赋形剂介质与物质或其衍生物不相容,诸如通过产生任何不想要的生物效应或以其它方式与药物组合物的任何其它组分以有害的方式相互作用,涵盖其用途在本公开内容的范围内。
在一些实施方案中,可以使用根据本发明的组合物来制备多种疾病、病症和/或状况之任一,包括但不限于下列一项或多项:自身免疫性病症(例如糖尿病、狼疮、多发性硬化、银屑癣、类风湿性关节炎);炎性病症(例如关节炎、盆腔炎性疾病);传染病(例如病毒性感染(例如hiv、hcv、rsv)、细菌性感染、真菌性感染、败血症);神经学病症(例如阿尔茨海默氏病、亨廷顿氏病;孤独症;迪谢内肌营养不良(duchennemusculardystrophy));心血管病症(例如动脉粥样硬化、高胆固醇血症(hypercholesterolemia)、血栓形成(thrombosis)、凝固病症、血管生成性病症,诸如黄斑变性);增殖性病症(例如癌症,良性新生物);呼吸病症(例如慢性阻塞性肺疾病);消化病症(例如炎性肠病、溃疡);肌肉骨骼病症(例如纤维肌痛(fibromyalgia),关节炎(arthritis));内分泌、代谢和营养病症(例如糖尿病,骨质疏松);泌尿学病症(例如肾疾病);心理学病症(例如抑郁,精神分裂症);皮肤病症(例如创伤、湿疹);血液和淋巴病症(例如贫血,血友病)等。
用于位点特异性核酸切割的方法
在本公开内容的另一个实施方案中,提供了用于位点特异性核酸(例如dna)切割的方法。在一些实施方案中,方法包括使dna与本文中描述的任何cas9:rna复合物接触。例如,在一些实施方案中,方法包括在适合于cas9核酸酶切割dna的条件下使dna与复合物接触,所述复合物包含:(i)与如本文中描述的适体连接的grna,其中grna包含与dna的部分结合的序列;(ii)与grna的适体结合的配体;和(iii)rna引导性核酸酶(例如cas9蛋白)。
在一些实施方案中,提供了用于诱导细胞中的位点特异性dna切割的方法。在一些实施方案中,方法包括:(a)使细胞接触或在细胞内表达包含如本文中描述的适体的grna,其中grna包含能够结合dna靶序列的序列;(b)使细胞接触或在细胞内表达rna引导性核酸酶(例如cas9蛋白);以及(c)使细胞与结合grna的适体的特定配体接触,导致切割dna靶物的grna:配体:cas9复合物的形成。在一些实施方案中,方法包括:(a)使细胞与复合物接触,所述复合物包含cas9蛋白和包含如本文中描述的适体的grna,其中grna包含能够结合dna靶序列的序列;并且(b)使细胞与结合grna适体的特定配体接触,导致切割dna靶物的grna:配体:cas9复合物的形成。在一些实施方案中,同时进行步骤(a)和(b)。在一些实施方案中,序贯进行步骤(a)和(b)。如此,在一些实施方案中,其中在细胞与复合物接触后使细胞与配体接触,实现切割的控制,因为切割仅在已经将配体投递到细胞后发生。在这些方法的一些实施方案中,不将配体投递到细胞,而是由细胞内部生成,例如作为生理学或病理生理学过程的一部分。
在一些实施方案中,提供了用于位点特异性dna切割的方法,其利用如本文中描述的mrna感测性grna。例如,在一些实施方案中,方法包括使dna与复合物接触,所述复合物包含rna引导性核酸酶(例如cas9蛋白)和mrna感测性grna,其中grna包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与转录物(mrna)的区域杂交的区域。在一些实施方案中,在区域(iii)中的序列与mrna杂交后发生切割。
在其它实施方案中,提供了用于位点特异性dna切割的方法,其利用如本文中描述的xdna感测性grna。例如,在一些实施方案中,方法包括使dna与复合物接触,所述复合物包含rna引导性核酸酶(例如cas9蛋白)和xdna感测性grna,其中grna包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与靶核酸的另一个区域杂交的区域。在一些实施方案中,在区域(iii)中的序列与不被“引导”序列靶向的靶核酸区域杂交后发生切割。
在一些实施方案中,可以对细胞中的dna进行本文中提供的任何方法。例如,在一些实施方案中,由本文中提供的任何包含rna/grna的复合物接触的dna在真核细胞中。在一些实施方案中,真核细胞在个体中。在一些实施方案中,个体是人。在一些实施方案中,在体外进行本文中提供的任何方法。在一些实施方案中,在体内进行本文中提供的任何方法。
多核苷酸、载体、细胞、试剂盒
在本公开内容的另一个实施方案中,提供了多核苷酸,其编码本文中描述的任何grna(和任选地任何cas9蛋白)。例如,提供了编码本文中描述的任何grna和/或cas9蛋白的多核苷酸,例如用于重组表达和纯化发明性grna,或包含其的复合物,例如包含发明性grna和rna引导性核酸酶(例如cas9蛋白)的复合物。在一些实施方案中,提供的多核苷酸包含单独或与编码本文中描述的任何cas9蛋白的序列组合的一种或多种编码grna的序列。
在一些实施方案中,提供了编码本文中描述的任何grna(和任选地任何cas9蛋白)的载体,例如用于重组表达和纯化发明性grna,或包含发明性grna和rna引导性核酸酶(例如cas9蛋白)的复合物。在一些实施方案中,载体包含或工程化改造为包含多核苷酸,例如那些在本文中描述的。在一些实施方案中,载体包含一种或多种编码grna和/或任何cas9蛋白(例如如本文中描述)的序列。通常,载体包含与启动子可操作连接的编码发明性grna的序列,使得在宿主细胞中表达grna。
在一些实施方案中,提供了用于重组表达和纯化本文中描述的任何grna(和任选地任何cas9蛋白)的细胞。细胞包括适合于重组rna表达和任选地蛋白质表达的任何细胞,例如,包含表达或能够表达发明性grna的遗传构建体的细胞(例如已经用本文中描述的一种或多种载体转化的细胞,或者具有基因组修饰的细胞,所述细胞从已经掺入细胞基因组中的等位基因表达发明性grna和任选地本文中提供的任何cas9蛋白)。用于转化细胞,遗传修饰细胞以及在此类细胞中表达基因和蛋白质的方法是本领域中公知的,并且包括那些由例如greenandsambrook,molecularcloning:alaboratorymanual(4thed.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2012))和friedmanandrossi,genetransfer:deliveryandexpressionofdnaandrna,alaboratorymanual(1sted.,coldspringharborlaboratorypress,coldspringharbor,n.y.(2006))提供的。
本公开内容的一些方面提供了试剂盒,其包含本文中提供的任何发明性grna或复合物和任选地本文中描述的任何cas9蛋白。在一些实施方案中,试剂盒包含任何多核苷酸,其编码提供的grna和任选地任何cas9蛋白。在一些实施方案中,试剂盒包含用于重组表达任何发明性grna和任选地任何cas9蛋白的载体。在一些实施方案中,试剂盒包含细胞,该细胞包含用于表达本文中提供的任何发明性grna、复合物和任选地任何cas9蛋白的遗传构建体。在一些实施方案中,试剂盒包含赋形剂和用法说明,其关于使任何发明性组合物与赋形剂接触以产生组合物,该组合物适合于使核酸与例如发明性grna和rna引导性核酸酶诸如cas9的复合物接触。在一些实施方案中,组合物适合于接触基因组内的核酸。在一些实施方案中,组合物适合于将发明性组合物(例如grna,其与cas9的复合物)投递到细胞。在一些实施方案中,组合物适合于将发明性组合物(例如grna,其与cas9的复合物)投递至受试者。在一些实施方案中,赋形剂是药学可接受赋形剂。
等同方案和范围
本领域技术人员会认可或者仅使用常规实验便确认本文中描述的发明的具体实施方案的许多等同方案。本发明的范围不限于上述描述,而是如所附权利要求书中列出的。
在权利要求书中,冠词诸如“一个/种”和“该/所述”可以意指一个/种或超过一个/种,除非相反指出或者另有从上下文下看明显。如果一个、超过一个、或全部的组成员在给定的产物或方法中存在、采用、或与给定的产物或方法以其它方式相关,那么认为在组的一个或多个成员间包含“或”的权利要求或描述得到满足,除非相反指出或者另有从上下文下看明显。本发明包括组的一个成员在给定产物或方法中确切存在、采用、或与给定的产物或方法以其它方式相关的实施方案。本发明还包括超过一个或全部组成员在给定产物或方法中确切存在、采用、或与给定的产物或方法以其它方式相关的实施方案。
此外,应当理解,本发明涵盖所有变型、组合、和排列,其中来自一个或多个权利要求或说明书的相关部分的一个或多个限定、要素、字句、描述性术语等引入另一项权利要求。例如,从属于另一项权利要求的任何权利要求可以修饰为包含从属于同一基础权利要求的任何其它权利要求中找到的一个或多个限定。此外,在权利要求叙述组合物的情况中,应当理解,包括出于本文中公开的任何目的使用组合物的方法,和根据本文中公开的任何生成方法或本领域中已知的任何生成组合物的方法,除非另有指示或者除非可引起冲突或不一致性对于本领域普通技术人员会是明显的。
在要素以列表呈现的情况中,例如在马库斯组形式中,应当理解还公开了要素的每个亚组,并且可以从该组除去任何要素。还注意到,术语“包括”意图是开放的,并且容许包括其他要素或步骤。应当理解,一般地,在发明或发明的方面称为包含特定要素、特征、步骤等的情况中,本发明的某些实施方案或本发明的范围由此类元素和/或特征组成或基本上由此类元素、特征、步骤等组成。为了简洁的目的,那些实施方案在本文中尚未用同样的文字明确列出。如此,对于包含一个或多个要素、特征、步骤等的本发明的每个实施方案,本发明还提供了由或基本上由那些要素、特征、步骤等组成的实施方案。
在给出范围的情况中,包括端点。此外,应当理解,除非另外指出或者另外从上下文和/或本领域普通技术人员的理解看明显,表示为范围的数值在本发明的不同实施方案中可以假设所述范围内的任何具体的数值(到范围下限单位的十分之一),除非尚显文另有明确叙述。还应当理解,除非另外指出或者另外从上下文和/或本领域普通技术人员的理解看明显,表示为范围的数值可以假设给定范围内的任何子范围,其中子范围的端点以与范围下限单位的十分之一的精确性相同的程度表示。
另外,应当理解本发明的任何具体的实施方案可以明确从任何一个或多个权利要求排除。在给出范围的情况中,可以从一个或多个权利要求明确排除范围内的任何数值。本发明的组合物和/或方法的任何实施方案、要素、特征、应用或方面可以从任何一个或多个权利要求排除。为了简短的目的,本文中没有明确列出排除一个或多个要素、特征、目的或方面的所有实施方案。
本文中提及的所有出版物、专利和序列数据库条目(包括上文列出的那些项)在此通过提及完整收入,就像明确并个别指定通过提及并入每篇个别的出版物或专利一样。在冲突的情况下,以本申请(包括本文中的定义)为准。本发明提供了:
1.一种复合物,其包含:(i)包含适体的grna,其中所述grna在缺乏与所述适体结合的特定配体的情况中不与靶核酸杂交;和(ii)cas9蛋白。
2.实施方案1的复合物,其中所述适体由配体结合。
3.实施方案2的复合物,其中所述配体是小分子、代谢物、肽或核酸。
4.实施方案3的复合物,其中所述grna:配体:cas9复合物结合靶核酸。
5.一种包含适体的grna,其中所述grna在缺乏与所述适体结合的特定配体的情况中不与靶核酸杂交。
6.实施方案5的grna,其中所述grna在缺乏与所述适体结合的特定配体的情况中不结合cas9。
7.实施方案5或6的grna,其中在所述适体被对所述适体特异性的配体结合时,所述grna结合cas9。
8.实施方案5的grna,其中所述grna在缺乏或存在与所述适体结合的特定配体的情况中结合cas9,但是仅在存在与所述适体结合的特定配体的情况中结合靶核酸。
9.实施方案5-8中任一项的grna,其中所述配体是小分子、代谢物、肽或核酸。
10.实施方案5-9中任一项的grna,其中所述适体是rna适体。
11.实施方案10的grna,其中所述rna适体自核开关(riboswitch)衍生。
12.实施方案11的grna,其中衍生所述适体的所述核开关选自茶碱核开关、焦磷酸硫胺素(tpp)核开关、腺苷钴胺素(adocbl)核开关、s-腺苷甲硫氨酸(sam)核开关、sah核开关、黄素单核苷酸(fmn)核开关、四氢叶酸核开关、赖氨酸核开关、甘氨酸核开关、嘌呤核开关、glms核开关或前q核苷(pre-queosine)1(preq1)核开关。
13.实施方案12的grna,其中所述适体自茶碱核开关衍生,并且包含seqidno:3。
14.实施方案10的grna,其中所述适体是非天然存在的。
15.实施方案14的grna,其中使用指数富集配体系统进化(systematicevolutionofligandsbyexponentialenrichment,selex)平台将所述适体工程化改造为结合特定配体。
16.实施方案5-15中任一项的grna,其中非适体部分包含至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140或至少150个核苷酸,并且所述适体包含至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少110、至少120、至少130、至少140、至少150、至少175、至少200、至少250或至少300个核苷酸。
17.一种多核苷酸,其编码实施方案5-16中任一项的grna。
18.一种载体,其包含实施方案17的多核苷酸。
19.一种用于重组表达的载体,其包含编码实施方案5-16中任一项的grna的多核苷酸。
20.一种细胞,其包含用于表达实施方案5-16中任一项的grna的遗传构建体。
21.实施方案20的细胞,其中所述细胞表达cas9蛋白。
22.一种用于位点特异性dna切割的方法,其包括在cas9蛋白切割所述dna的条件下使dna与复合物接触,所述复合物包含(i)实施方案5-16中任一项的grna,其中所述grna包含结合所述dna的部分的序列,(ii)与所述grna的适体结合的特定配体,和(iii)cas9蛋白。
23.实施方案22的方法,其中所述dna在细胞中。
24.实施方案23的方法,其中所述细胞是真核细胞。
25.实施方案24的方法,其中所述细胞在个体中。
26.实施方案25的方法,其中所述个体是人。
27.一种用于诱导细胞中的位点特异性dna切割的方法,其包括:
(a)使细胞接触或在细胞内表达实施方案5-16中任一项的grna,其中所述grna包含能够结合dna靶序列的序列;
(b)使细胞接触或在细胞内表达cas9蛋白;并且
(c)使所述细胞与结合所述grna的适体的特定配体接触,导致切割所述dna靶物的grna:配体:cas9复合物的形成。
28.一种用于诱导细胞中的位点特异性dna切割的方法,其包括(a)使细胞与包含cas9蛋白和实施方案5-16中任一项的grna的复合物接触,其中所述grna包含能够结合dna靶序列的序列,并且(b)使细胞与结合所述grna的适体的特定配体接触,导致切割所述dna靶物的grna:配体:cas9复合物的形成。
29.实施方案28的方法,其中同时或以任何次序序贯实施步骤(a)和(b)。
30.实施方案27-29中任一项实施方案的方法,其中所述细胞是真核细胞。
31.实施方案30的方法,其中所述真核细胞在体外。
32.实施方案30的方法,其中所述真核细胞在体内。
33.实施方案32的方法,其中所述细胞在个体中。
34.实施方案33的方法,其中所述个体是人。
35.一种试剂盒,其包含实施方案5-16中任一项的grna。
36.一种试剂盒,其包含编码实施方案5-16中任一项的grna的多核苷酸。
37.一种试剂盒,其包含用于重组表达的载体,其中所述载体包含编码实施方案5-16中任一项的grna的多核苷酸。
38.一种试剂盒,其包含细胞,该细胞包含用于表达实施方案5-16中任一项的grna和任选地cas9蛋白的遗传构建体。
39.实施方案35-38中任一项的试剂盒,其进一步包含一种或多种cas9蛋白。
40.一种包含cas9蛋白和grna的复合物,其中所述grna包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与转录物(mrna)的区域杂交的区域。
41.一种grna,其包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与转录物(mrna)的区域杂交的区域。
42.实施方案41的grna,其中区域(i)、(ii)和(iii)的每个序列包含至少5、至少10、至少15、至少20或至少25个核苷酸。
43.实施方案41或42的grna,其中所述grna形成茎-环结构,其中所述茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且所述环由区域(iii)的部分或整个序列形成。
44.实施方案43的grna,其中区域(ii)和(iii)都在区域(i)的5’或3’。
45.实施方案44的grna,其中所述茎-环结构在缺乏与区域(iii)的序列杂交的转录物的情况下形成。
46.实施方案45的grna,其中所述转录物对区域(iii)的序列的结合导致所述茎-环结构的解折叠,或者阻止所述茎-环结构的形成,使得区域(ii)的序列不与区域(i)的序列杂交。
47.实施方案45的grna,其中所述grna结合cas9蛋白,并且区域(i)的序列在区域(iii)的序列结合所述转录物时与所述靶核酸杂交。
48.一种多核苷酸,其编码实施方案42-47中任一项的grna。
49.一种载体,其包含实施方案48的多核苷酸和任选地编码cas9蛋白的多核苷酸。
50.一种用于重组表达的载体,其包含编码实施方案42-47中任一项的grna的多核苷酸和任选地编码cas9蛋白的多核苷酸。
51.一种细胞,其包含用于表达实施方案42-47中任一项的grna和任选地cas9蛋白的遗传构建体。
52.一种试剂盒,其包含实施方案42-47中任一项的grna。
53.一种试剂盒,其包含编码实施方案42-47中任一项的grna的多核苷酸。
54.一种试剂盒,其包含用于重组表达的载体,其中所述载体包含编码实施方案42-47中任一项的grna的多核苷酸。
55.一种试剂盒,其包含细胞,该细胞包含用于表达实施方案42-47中任一项的grna的遗传构建体。
56.实施方案52-55中任一项的试剂盒,其进一步包含一种或多种cas9蛋白或用于表达一种或多种cas9蛋白的载体。
57.一种用于位点特异性dna切割的方法,其包括使dna与实施方案40的复合物接触。
58.实施方案57的方法,其中所述dna在细胞中。
59.实施方案58的方法,其中所述细胞在体外。
60.实施方案57的方法,其中所述细胞在体内。
61.实施方案59或60的方法,其中所述细胞是真核细胞。
62.实施方案61的方法,其中所述细胞是个体中的真核细胞。
63.实施方案62的方法,其中所述个体是人。
64.一种grna,其包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与所述靶核酸的另一个区域杂交的区域。
65.实施方案64的grna,其中区域(i)和(ii)的每个序列包含至少5、至少10、至少15、至少20或至少25个核苷酸;并且区域(iii)的序列包含至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75或至少100个核苷酸。
66.实施方案64或65的grna,其中所述grna形成茎-环结构,其中所述茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且所述环由区域(iii)的部分或整个序列形成。
67.实施方案66的grna,其中区域(ii)和(iii)都在区域(i)的5’或3’。
68.实施方案67的grna,其中所述茎-环结构在缺乏与(iii)中的序列互补并结合的靶核酸的区域的情况下形成。
69.实施方案68的grna,其中所述靶核酸的区域对区域(iii)的序列的结合导致所述茎-环结构的解折叠,或者阻止所述茎-环结构的形成,使得区域(ii)的序列不与区域(i)的序列杂交。
70.实施方案68的grna,其中所述grna结合cas9蛋白,并且(i)中的序列在(iii)中的序列结合所述靶核酸时结合所述靶核酸。
71.一种复合物,其包含实施方案64-70中任一项的grna和cas9蛋白,任选地其中所述复合物包含靶核酸。
72.实施方案71的复合物,其中所述复合物的形成导致所述靶核酸的切割。
73.一种分离的多核苷酸,其编码实施方案64-70中任一项的grna。
74.一种载体,其包含实施方案73的多核苷酸和任选地编码cas9蛋白的多核苷酸。
75.一种用于重组表达的载体,其包含编码实施方案64-70中任一项的grna的多核苷酸和任选地编码cas9蛋白的多核苷酸。
76.一种细胞,其包含用于表达实施方案64-70中任一项的grna和任选地cas9蛋白的遗传构建体。
77.一种试剂盒,其包含实施方案64-70中任一项的grna。
78.一种试剂盒,其包含编码实施方案64-70中任一项的grna的分离的多核苷酸。
79.一种试剂盒,其包含用于重组表达的载体,其中所述载体包含编码实施方案64-70中任一项的grna的多核苷酸。
80.一种试剂盒,其包含细胞,该细胞包含用于表达实施方案64-70中任一项的grna的遗传构建体。
81.实施方案77-80中任一项的试剂盒,其进一步包含一种或多种cas9蛋白或编码一种或多种cas9蛋白的载体。
82.一种用于位点特异性dna切割的方法,其包括使dna与实施方案71的复合物接触。
83.实施方案82的方法,其中所述dna在细胞中。
84.实施方案83的方法,其中所述细胞在体外。
85.实施方案83的方法,其中所述细胞在体内。
86.实施方案84或85的方法,其中所述细胞是真核细胞。
87.实施方案85的方法,其中所述细胞是个体中的真核细胞。
88.实施方案87的方法,其中所述个体是人。
89.一种延长的dna(xdna)感测性(sensing)grna,其包含:(i)与靶核酸的区域杂交的区域;(ii)与区域(i)的序列部分或完全杂交的另一个区域;和(iii)与所述靶核酸的另一个区域杂交的区域。
90.实施方案89的xdna感测性grna,其中区域(i)和(ii)的每种序列包含至少5、至少10、至少15、至少20或至少25个核苷酸;并且区域(iii)的序列包含至少5、至少10、至少15、至少20、至少25、至少30、至少40、至少50、至少75或至少100个核苷酸。
91.实施方案89或90的xdna感测性grna,其中所述xdna感测性grna形成茎-环结构,其中所述茎包含与区域(ii)的部分或整个序列杂交的区域(i)的序列,并且所述环由区域(iii)的部分或整个序列形成。
92.实施方案91的xdna感测性grna,其中区域(ii)和(iii)都在区域(i)的5’或3’。
93.实施方案92的xdna感测性grna,其中所述茎-环结构在缺乏与(iii)中的序列互补并结合的靶核酸的区域的情况下形成。
94.实施方案93的xdna感测性grna,其中所述靶核酸的区域对区域(iii)的序列的结合导致所述茎-环结构的解折叠,或者阻止所述茎-环结构的形成,使得区域(ii)的序列不与区域(i)的序列杂交。
95.实施方案94的xdna感测性grna,其中所述grna结合cas9蛋白,并且(i)中的序列在(iii)中的序列结合所述靶核酸时结合所述靶核酸。
96.一种复合物,其包含实施方案89-95中任一项的xdna感测性grna和cas9蛋白,任选地其中所述复合物包含靶核酸。
97.实施方案96的复合物,其中所述复合物的形成导致所述靶核酸的切割。
98.一种分离的多核苷酸,其编码实施方案89-95中任一项的xdna感测性grna。
99.一种载体,其包含实施方案98的多核苷酸和任选地编码cas9蛋白的多核苷酸。
100.一种用于重组表达的载体,其包含编码实施方案89-95中任一项的xdna感测性grna的多核苷酸和任选地编码cas9蛋白的多核苷酸。
101.一种细胞,其包含用于表达实施方案89-95中任一项的xdna感测性grna和任选地cas9蛋白的遗传构建体。
102.一种用于位点特异性dna切割的方法,其包括使dna与包含cas9和xdna感测性grna的复合物接触,其中所述复合物对所述dna的结合导致dna切割。
103.实施方案102的方法,其中所述dna在细胞中。
104.实施方案103的方法,其中所述细胞在体外。
105.实施方案104的方法,其中所述细胞在体内。
106.实施方案105的方法,其中所述细胞是真核细胞。
107.实施方案106的方法,其中所述细胞是个体中的真核细胞。
108.实施方案107的方法,其中所述个体是人。
109.一种试剂盒,其包含实施方案89-95中任一项实施方案的xdna感测性grna。
110.一种试剂盒,其包含编码实施方案89-95中任一项实施方案的xdna感测性grna的分离的多核苷酸。
111.一种试剂盒,其包含用于重组表达的载体,其中所述载体包含编码实施方案89-95中任一项的xdna感测性grna的多核苷酸。
112.一种试剂盒,其包含细胞,该细胞包含用于表达实施方案89-95中任一项的xdna感测性grna的遗传构建体。
113.实施方案112的试剂盒,其进一步包含一种或多种cas9蛋白或编码一种或多种cas9蛋白的载体。
序列表
<110>哈佛大学的校长及成员们
<120>可变换cas9核酸酶及其用途
<130>h0824.70148wo00
<140>pct/us2014/054252
<141>2014-09-05
<150>us14/326,329
<151>2014-07-08
<150>us14/326,340
<151>2014-07-08
<150>us14/326,361
<151>2014-07-08
<150>us61/874,682
<151>2013-09-06
<160>16
<170>patentinversion3.5
<210>1
<211>4104
<212>dna
<213>酿脓链球菌
<400>1
atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtg60
atcactgatgattataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgc120
cacagtatcaaaaaaaatcttataggggctcttttatttggcagtggagagacagcggaa180
gcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgt240
tatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcga300
cttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttgga360
aatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaa420
aaattggcagattctactgataaagcggatttgcgcttaatctatttggccttagcgcat480
atgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgat540
gtggacaaactatttatccagttggtacaaatctacaatcaattatttgaagaaaaccct600
attaacgcaagtagagtagatgctaaagcgattctttctgcacgattgagtaaatcaaga660
cgattagaaaatctcattgctcagctccccggtgagaagagaaatggcttgtttgggaat720
ctcattgctttgtcattgggattgacccctaattttaaatcaaattttgatttggcagaa780
gatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcg840
caaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctatt900
ttactttcagatatcctaagagtaaatagtgaaataactaaggctcccctatcagcttca960
atgattaagcgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcga1020
caacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgca1080
ggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaatttta1140
gaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgc1200
aagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcat1260
gctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagatt1320
gaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagt1380
cgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaa1440
gttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaa1500
aatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtt1560
tataacgaattgacaaaggtcaaatatgttactgagggaatgcgaaaaccagcatttctt1620
tcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaacc1680
gttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatt1740
tcaggagttgaagatagatttaatgcttcattaggcgcctaccatgatttgctaaaaatt1800
attaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgtt1860
ttaacattgaccttatttgaagatagggggatgattgaggaaagacttaaaacatatgct1920
cacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttgggga1980
cgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatatta2040
gattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgat2100
agtttgacatttaaagaagatattcaaaaagcacaggtgtctggacaaggccatagttta2160
catgaacagattgctaacttagctggcagtcctgctattaaaaaaggtattttacagact2220
gtaaaaattgttgatgaactggtcaaagtaatggggcataagccagaaaatatcgttatt2280
gaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatg2340
aaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgtt2400
gaaaatactcaattgcaaaatgaaaagctctatctctattatctacaaaatggaagagac2460
atgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacatt2520
gttccacaaagtttcattaaagacgattcaatagacaataaggtactaacgcgttctgat2580
aaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaac2640
tattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacg2700
aaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattg2760
gttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatact2820
aaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaa2880
ttagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattac2940
catcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatat3000
ccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatg3060
attgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaat3120
atcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccct3180
ctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgcc3240
acagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacag3300
acaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgct3360
cgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttat3420
tcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaa3480
gagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgacttt3540
ttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatat3600
agtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaa3660
aaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcat3720
tatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcag3780
cataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttatt3840
ttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaacca3900
atacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctccc3960
gctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaa4020
gttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgat4080
ttgagtcagctaggaggtgactga4104
<210>2
<211>1367
<212>prt
<213>酿脓链球菌
<400>2
metasplyslystyrserileglyleuaspileglythrasnserval
151015
glytrpalavalilethraspasptyrlysvalproserlyslysphe
202530
lysvalleuglyasnthrasparghisserilelyslysasnleuile
354045
glyalaleuleupheglyserglygluthralaglualathrargleu
505560
lysargthralaargargargtyrthrargarglysasnargilecys
65707580
tyrleuglngluilepheserasnglumetalalysvalaspaspser
859095
phephehisargleuglugluserpheleuvalglugluasplyslys
100105110
hisgluarghisproilepheglyasnilevalaspgluvalalatyr
115120125
hisglulystyrprothriletyrhisleuarglyslysleualaasp
130135140
serthrasplysalaaspleuargleuiletyrleualaleualahis
145150155160
metilelyspheargglyhispheleuilegluglyaspleuasnpro
165170175
aspasnseraspvalasplysleupheileglnleuvalglniletyr
180185190
asnglnleupheglugluasnproileasnalaserargvalaspala
195200205
lysalaileleuseralaargleuserlysserargargleugluasn
210215220
leuilealaglnleuproglyglulysargasnglyleupheglyasn
225230235240
leuilealaleuserleuglyleuthrproasnphelysserasnphe
245250255
aspleualagluaspalalysleuglnleuserlysaspthrtyrasp
260265270
aspaspleuaspasnleuleualaglnileglyaspglntyralaasp
275280285
leupheleualaalalysasnleuseraspalaileleuleuserasp
290295300
ileleuargvalasnsergluilethrlysalaproleuseralaser
305310315320
metilelysargtyraspgluhishisglnaspleuthrleuleulys
325330335
alaleuvalargglnglnleuproglulystyrlysgluilephephe
340345350
aspglnserlysasnglytyralaglytyrileaspglyglyalaser
355360365
glnglugluphetyrlyspheilelysproileleuglulysmetasp
370375380
glythrglugluleuleuvallysleuasnarggluaspleuleuarg
385390395400
lysglnargthrpheaspasnglyserileprohisglnilehisleu
405410415
glygluleuhisalaileleuargargglngluaspphetyrprophe
420425430
leulysaspasnargglulysileglulysileleuthrpheargile
435440445
protyrtyrvalglyproleualaargglyasnserargphealatrp
450455460
metthrarglysserglugluthrilethrprotrpasnphegluglu
465470475480
valvalasplysglyalaseralaglnserpheilegluargmetthr
485490495
asnpheasplysasnleuproasnglulysvalleuprolyshisser
500505510
leuleutyrglutyrphethrvaltyrasngluleuthrlysvallys
515520525
tyrvalthrgluglymetarglysproalapheleuserglyglugln
530535540
lyslysalailevalaspleuleuphelysthrasnarglysvalthr
545550555560
vallysglnleulysgluasptyrphelyslysileglucyspheasp
565570575
servalgluileserglyvalgluaspargpheasnalaserleugly
580585590
alatyrhisaspleuleulysileilelysasplysasppheleuasp
595600605
asnglugluasngluaspileleugluaspilevalleuthrleuthr
610615620
leuphegluaspargglymetileglugluargleulysthrtyrala
625630635640
hisleupheaspasplysvalmetlysglnleulysargargargtyr
645650655
thrglytrpglyargleuserarglysleuileasnglyileargasp
660665670
lysglnserglylysthrileleuasppheleulysseraspglyphe
675680685
alaasnargasnphemetglnleuilehisaspaspserleuthrphe
690695700
lysgluaspileglnlysalaglnvalserglyglnglyhisserleu
705710715720
hisgluglnilealaasnleualaglyserproalailelyslysgly
725730735
ileleuglnthrvallysilevalaspgluleuvallysvalmetgly
740745750
hislysprogluasnilevalileglumetalaarggluasnglnthr
755760765
thrglnlysglyglnlysasnserarggluargmetlysargileglu
770775780
gluglyilelysgluleuglyserglnileleulysgluhisproval
785790795800
gluasnthrglnleuglnasnglulysleutyrleutyrtyrleugln
805810815
asnglyargaspmettyrvalaspglngluleuaspileasnargleu
820825830
serasptyraspvalasphisilevalproglnserpheilelysasp
835840845
aspserileaspasnlysvalleuthrargserasplysasnarggly
850855860
lysseraspasnvalproserglugluvalvallyslysmetlysasn
865870875880
tyrtrpargglnleuleuasnalalysleuilethrglnarglysphe
885890895
aspasnleuthrlysalagluargglyglyleusergluleuasplys
900905910
alaglypheilelysargglnleuvalgluthrargglnilethrlys
915920925
hisvalalaglnileleuaspserargmetasnthrlystyraspglu
930935940
asnasplysleuilearggluvallysvalilethrleulysserlys
945950955960
leuvalseraspphearglysasppheglnphetyrlysvalargglu
965970975
ileasnasntyrhishisalahisaspalatyrleuasnalavalval
980985990
glythralaleuilelyslystyrprolysleugluserglupheval
99510001005
tyrglyasptyrlysvaltyraspvalarglysmetilealalys
101010151020
sergluglngluileglylysalathralalystyrphephetyr
102510301035
serasnilemetasnphephelysthrgluilethrleualaasn
104010451050
glygluilearglysargproleuilegluthrasnglygluthr
105510601065
glygluilevaltrpasplysglyargaspphealathrvalarg
107010751080
lysvalleusermetproglnvalasnilevallyslysthrglu
108510901095
valglnthrglyglypheserlysgluserileleuprolysarg
110011051110
asnserasplysleuilealaarglyslysasptrpaspprolys
111511201125
lystyrglyglypheaspserprothrvalalatyrservalleu
113011351140
valvalalalysvalglulysglylysserlyslysleulysser
114511501155
vallysgluleuleuglyilethrilemetgluargserserphe
116011651170
glulysasnproileasppheleuglualalysglytyrlysglu
117511801185
vallyslysaspleuileilelysleuprolystyrserleuphe
119011951200
gluleugluasnglyarglysargmetleualaseralaglyglu
120512101215
leuglnlysglyasngluleualaleuproserlystyrvalasn
122012251230
pheleutyrleualaserhistyrglulysleulysglyserpro
123512401245
gluaspasngluglnlysglnleuphevalgluglnhislyshis
125012551260
tyrleuaspgluileilegluglnileserglupheserlysarg
126512701275
valileleualaaspalaasnleuasplysvalleuseralatyr
128012851290
asnlyshisargasplysproilearggluglnalagluasnile
129513001305
ilehisleuphethrleuthrasnleuglyalaproalaalaphe
131013151320
lystyrpheaspthrthrileasparglysargtyrthrserthr
132513301335
lysgluvalleuaspalathrleuilehisglnserilethrgly
134013451350
leutyrgluthrargileaspleuserglnleuglyglyasp
135513601365
<210>3
<211>38
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>3
ggugauaccagcaucgucuugaugcccuuggcagcacc38
<210>4
<211>24
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>4
ggcagatgtagtgtttccacaggg24
<210>5
<211>24
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>5
ccctgtggaaacactacatctgcc24
<210>6
<211>133
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>6
ggugauaccagcaucgucuugaugcccuuggcagcacccgcugcgcaggggguaucaggc60
agauguaguguuuccacaguuuuagagcuaugcugaaaagcauagcaaguuaaaauaagg120
cuaguccguuauc133
<210>7
<211>107
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>7
uacaucugccuugugagaguugaaguuguauggcagauguaguguuuccacaguuuuaga60
gcuaugcugaaaagcauagcaaguuaaaauaaggcuaguccguuauc107
<210>8
<211>90
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>8
ggcagauguaguguuuccacaguuuuagagcuaugcugaaaagcauagcaaguuaaaauu60
auguugaaguugagaguguuuacaucugcc90
<210>9
<211>107
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>9
uacaucugccuugugagaguugaaguuguauggcagauguaguguuuccacaguuuuaga60
gcuaugcugaaaagcauagcaaguuaaaauaaggcuaguccguuauc107
<210>10
<211>117
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>10
ggcagauguaguguuuccacaguuuuagagcuaugcugaaaagcauagcaaguuaaaaua60
aggcuaguccguuaucaacuugaaaaaguggugaaguugagaguguuuacaucugcc117
<210>11
<211>134
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>11
ggugauaccagcaucguuugaugcccuuggcagcaccgcugcgcaggggguaucaacagg60
cagauguaguguuuccacaguuuuagagcuaugcugaaaagcauagcaaguuaaaauaag120
gcuaguccguuauc134
<210>12
<211>21
<212>rna
<213>人工序列
<220>
<223>合成多核苷酸
<400>12
auacaacuucaacucucacaa21
<210>13
<211>45
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>13
ttgtgagagttgaagttgtatggcagatgtagtgtttccacaggg45
<210>14
<211>45
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>14
ccctgtggaaacactacatctgccatacaacttcaactctcacaa45
<210>15
<211>21
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>15
tatgttgaagttgagagtgtt21
<210>16
<211>21
<212>dna
<213>人工序列
<220>
<223>合成多核苷酸
<400>16
aacactctcaacttcaacata21