编辑RNA的方法和组合物与流程

文档序号：33103240发布日期：2023-02-01 01:02阅读：60来源：国知局

编辑rna的方法和组合物
1.本技术是申请号为201980067380.1、发明名称为“编辑rna的方法和组合物”的中国专利申请的分案申请。
2.对相关申请的交叉引用
3.本技术要求于2018年10月12日提交的国际申请号pct/cn2018/110105的国际申请，和于2019年4月15日提交的国际申请号cn2019/082713的国际申请的优先权，其内容在此通过提及以其整体并入。
4.以ascii文本文件提交序列表
5.以下以ascii文本文件提交的内容在此通过提及以其整体并入：序列表的计算机可读形式(crf)(文件名：fc00158pct-new-equencelisting-yzg-zhc.txt，记录日期：2019年10月11日，大小：104kb)。
技术领域
6.本发明涉及利用工程化rna来编辑rna的方法和组合物，工程化rna 能够募集腺苷脱氨酶用以使靶标rna中的一个或多个腺苷脱氨基。

背景技术：

7.基因组编辑是生物医学研究和疾病疗法开发的有力工具。到目前为止，最流行的基因编辑技术是成簇规律间隔的短回文重复序列(clusteredregularly interspaced short palindromic repeats，crispr)-cas系统，它是从细菌和古细菌的适应性免疫系统开发出来的。crispr-cas可以精确打靶和切割基因组dna，从而产生双链dna断裂(dsb)。dsb可以通过非同源末端连接(nhej)途径修复，导致插入或缺失(indel)，后者在大多数情况下使基因失活。替选地，同源定向修复(hdr)途径可以使用同源模板dsdna或ssdna修复所述dsb，从而实现精确的基因组编辑。
8.最近，利用脱氨酶蛋白(诸如作用于rna的腺苷脱氨酶，adar)，开发了用于rna编辑的新工具。在哺乳动物细胞中，有三种类型的adar蛋白， adar1(两个同种型，p110和p150)，adar2和adar3(无催化活性)。adar蛋白的催化底物是双链rna，它可以从腺苷(a)核苷碱基中去除-nh2基团，将a 变为肌苷(i)，后者被识别为鸟苷(g)并且在随后的细胞转录和翻译过程中与胞苷(c)配对。研究人员将λn肽与人类adar1或adar2脱氨酶结构域相融合来构建λn-adardd系统，该系统可由boxb茎环和反义rna组成的融合rna 来引导，结合特定的rna靶标。该方法可以在靶标a碱基处将靶标a编辑为 i(引入a-c错配)，从而导致从a至g的rna碱基编辑。用于rna编辑的其他方法包括将反义rna融合至r/g基序(adar-募集rna支架)以通过在哺乳动物细胞中过表达adar1或adar2蛋白来编辑靶标rna，以及利用dcas13-adar 精确打靶和编辑rna。
9.本文提及的所有出版物、专利、专利申请和公开的专利申请的公开内容均通过提及以其整体由此并入本文。
10.发明概述
11.核酸编辑在生物学研究和治疗学的发展中具有巨大的潜力。目前用于 dna或rna编辑的工具依赖于将外源蛋白引入活的生物体，由于可能的异常效应子活性，传递限制和免疫原性，它们可能面临潜在的风险或技术障碍。在一些方面，本技术提供了使用短rna来利用内源性adar(作用于rna的腺苷脱氨酶)蛋白用于靶向rna编辑的可编程方法。在一些方面，本技术提供了一种工程改造的rna，其与靶转录物部分互补以募集天然adar1或 adar2以在靶标rna中的特定位点将腺苷变为肌苷。本文所述的方法统称为“leaper”(利用内源性adar进行rna的可编程编辑)，而募集adar的 rna可互换地称为“drna”或“arrna”。
12.在一个方面，本技术提供了一种用于编辑宿主细胞中的靶标rna的方法，包含将脱氨酶募集rna(drna)或编码脱氨酶募集rna的构建体引入宿主细胞，其中，所述drna包含与靶标rna杂交的互补rna序列，并且其中，所述drna能够募集作用于rna的腺苷脱氨酶(adar)以使靶标rna中的靶标腺苷(a)脱氨基。在某些实施方案中，所述宿主细胞是真核细胞。在一些实施方案中，所述宿主细胞是哺乳动物细胞。在一些实施方案中，所述宿主细胞是人类细胞。在一些实施方案中，所述宿主细胞是小鼠细胞。在一些实施方案中，所述宿主细胞是原核细胞。
13.在某些实施方案中，adar天然地或内源地存在于宿主细胞中，例如，天然地或内源地存在于真核细胞中。在一些实施方案中，adar由宿主细胞内源表达。在某些实施方案中，adar对宿主细胞而言是外源的。在一些实施方案中，adar由核酸(例如dna或rna)编码。在一些实施方案中，该方法包括将adar或编码adar的构建体引入宿主细胞。在一些实施方案中，该方法不包含将任何蛋白质引入宿主细胞中。在某些实施方案中，所述 adar是adar1和/或adar2。在一些实施方案中，adar是选自由 hadar1，hadar2，小鼠adar1和小鼠adar2构成的组的一种或多种 adar。
14.在某些实施方案中，cas不识别所述drna。在一些实施方案中，所述 drna不包含crispr/cas系统中使用的crrna，tracrrna或grna。在一些实施方案中，该方法不包含将cas或cas融合蛋白引入宿主细胞中。
15.在某些实施方案中，所述靶标rna中的靶标a的脱氨基作用导致所述靶标rna中的错义突变、过早的终止密码子、异常剪接或可变剪接。在一些实施方案中，靶标rna编码蛋白质，而所述靶标rna中靶标a的脱氨基作用导致所述蛋白质的点突变、截短、延伸和/或错误折叠。在一些实施方案中，所述靶标rna中靶标a的脱氨基作用导致靶标rna中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复。在一些实施方案中，其中所述靶标rna 编码截短的、延长的、突变的或错误折叠的蛋白质，靶标rna中的靶标a的脱氨基作用通过靶标rna中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复产生有功能的、全长的、正确折叠的和/或野生型蛋白质。在一些实施方案中，靶标rna是调节rna，并且靶标a的脱氨基作用导致由靶标 rna调节的下游分子的表达的变化。在某些实施方案中，该方法用于利用内源性腺苷脱氨酶在靶标rna上的编辑产生由靶标rna编码的蛋白质的点突变和/或错误折叠、和/或在靶标rna中产生过早的终止密码子、异常剪接位点、和/或的可变剪接位点。
16.在某些实施方案中，提供了用于编辑宿主细胞中的多种靶标rna的方法，其中所述方法包含将多种drna或编码所述多种drna的构建体引入宿主细胞中，其中所述多种脱氨酶募集rna中的每一种包含与多种靶标rna中的相应靶标rna杂交的互补rna序列，并且其中每种drna能够募集作用于rna的腺苷脱氨酶(adar)以使相应靶标rna中的靶标腺苷(a)脱氨
基。
17.在一些实施方案中，提供了经编辑的rna或宿主细胞，其具有通过如上所述的rna编辑方法中的任一种生产的经编辑的rna。
18.在一个方面，本技术提供了治疗或预防个体疾病或病症的方法，包含根据如上所述的rna编辑方法的任何一种编辑与个体细胞中的疾病或病症相关的靶标rna。在一些实施方案中，该方法包含离体编辑细胞中的靶标rna。在一些实施方案中，该方法包含将经编辑的细胞施用于个体。在一些实施方案中，该方法包含向个体施用有效量的drna或者编码该drna的构建体。在一些实施方案中，该方法还包含向细胞中引入adar或编码adar的构建体 (例如，病毒载体)。在一些实施方案中，该方法还包含向个体施用adar或编码该adar的构建体(例如，病毒载体)。在一些实施方案中，疾病或病症是遗传性的基因疾病。在一些实施方案中，所述疾病或病症与一种或多种获得性基因突变(例如，药物抗性)相关。
19.本技术的一个方面提供了一种drna，其通过募集作用于rna的腺苷脱氨酶(adar)来使靶标rna中的靶标腺苷脱氨基，所述腺苷脱氨酶包含与靶标rna杂交的互补rna序列。在一些实施方案中，drna包含seq id no： 25-44、142-205、341-342中任一项的核酸序列。
20.在根据本文所述的方法或drna的任何一项的一些实施方案中，所述 drna包含下述rna序列，其包含直接与在靶标rna中待编辑的靶标腺苷相对的胞苷(c)、腺苷(a)或尿苷(u)。在某些实施方案中，所述rna序列还包含一个或多个鸟苷，每个鸟苷直接与靶标rna中的非靶标腺苷相对。在某些实施方案中，靶标rna序列中靶标a的5'最近邻位是选自u，c，a和g的核苷酸，优先度u》c≈a》g，而且靶标rna序列中靶标a的3'最近邻位是选自g， c，a和u的核苷酸，优先度g》c》a≈u。在某些实施方案中，在靶标rna中靶标a处于选自：由uag，uac，uaa，uau，cag，cac，caa，cau， aag，aac，aaa，aau，gag，gac，gaa和gau构成的组的三碱基基序中。在某些实施方案中，其中所述三碱基基序是uag，所述drna包含与所述三碱基基序中的u正对的a，与靶标a正对的c，和与三碱基基序中的g 正对的c，g或u。在某些实施方案中，其中所述三碱基基序是靶标rna中的 uag，所述drna包含与靶标rna的uag相对的acc，acg或acu。
21.在根据本文所述的方法或drna的任何一项的一些实施方案中，所述脱氨酶募集rna包含超过40、45、50、55、60、65、70、75或80个的核苷酸。在某些实施方案中，脱氨酶募集rna长度为40-260、45-250、50-240、60-230、 65-220、70-210、70-200、70-190、70-180、70-170，70-160、70-150、70-140、 70-130、70-120、70-110、70-100、70-90、70-80、75-200、80-190、85-180、 90-170、95-160、100-150或105-140个核苷酸。在某些实施方案中，靶标rna 是选自：由前信使rna，信使rna，核糖体rna，转移rna，长非编码rna 和小rna(例如mirna)构成的组的rna。
22.在根据本文所述的方法或drna的任何一项的一些实施方案中，所述 drna是单链rna。在一些实施方案中，所述互补rna序列是单链的，并且其中所述drna还包含一个或多个双链区。在一些实施方案中，所述drna 包含一种或多种修饰，例如2'-o-甲基修饰和/或硫代磷酸酯修饰。
23.在一些实施方案中，提供了编码上述任何一种drna的构建体(例如，病毒载体或质粒)。在一些实施方案中，所述构建体包含与编码drna的序列可操作地连接的启动子。在一些实施方案中，所述构建体是dna构建体。在一些实施方案中，所述构建体是病毒载体，诸如aav，诸如aav8。
24.在一些实施方案中，提供了文库，其包含根据上述任何一种drna的多个drna或根据上述任何一种构建体的多个构建体。
25.还提供了组合物，宿主细胞，试剂盒和制品，其包含本文所述的任何一种drna，本文所述的任何一种构建体，或本文所述的任何一种文库。
附图说明
26.图1a-1h显示使用利用了内源adar1蛋白的单个drna的rna编辑。图1a 和1b显示使用内源adar1蛋白编辑rna的示意图。图1c显示使用利用了内源 adar1蛋白质的drna编辑报道分子mrna。图1d显示图1b中的结果的统计分析。图1e显示adar1敲除和adar1(p110)，adar1(p150)和adar2的回复结果。图1f显示图1d中的结果的统计分析。图1g显示adar1(p110)，adar1(p150)或adar2过表达对293t-wt细胞中drna介导的rna编辑的影响。图1h显示深度测序(即二代测序，ngs)结果证实了在打靶位点处从a至g的编辑。
27.图2a-2h显示drna的优化。图2a显示与打靶腺苷相对的四种碱基(a， u，c和g)识别的示意图。图2b显示与打靶腺苷相对的碱基识别对drna的 rna编辑效率的影响。图2c显示带有与uag打靶位点的一个，两个或三个碱基错配的drna的示意图。图2d显示与uag打靶位点的一个，两个或三个碱基错配对于用drna编辑的报道rna的影响。drna优选打靶腺苷上的a-c 错配。图2e显示带有变化的长度的drna的示意图。图2f显示基于双荧光报道分子-2，drna长度对于rna编辑效率的影响。图2g显示不同a-c错配位置的示意图。图2h显示a-c错配位置对于rna编辑效率的影响。
28.图3a-3b显示通过本技术的示例性rna编辑方法的内源rna编辑的编辑灵活性。图3a显示在所有16种不同的3-碱基基序上内源rna编辑效率的百分比定量。图3b显示对16种不同3碱基基序的内源rna编辑的5'侧和3'侧碱基优先度的热图。
29.图4a-4h显示在293t细胞中用drna编辑内源基因的mrna。图4a显示 kras mrna靶标和带有变化的长度的drna的示意图。图4b显示在293t细胞中用drna编辑内源kras基因的mrna。空白载体，drna-91nt质粒被分别转染到293t-wt细胞中。在60个小时后，分离rna用于rt-pcr，然后扩增cdna并在illumina nextseq上测序。图4c显示ppib mrna靶标(位点1，位点2和位点3)和相应的drna设计的示意图。图4d，4e和4f显示在293t细胞中用drna编辑内源ppib基因的mrna。图4g显示β-肌动蛋白mrna靶标和 drna(71-nt和131-nt)的示意图。图4h显示在293t细胞中用drna编辑内源β
‑ꢀ
肌动蛋白基因的mrna。
30.图5a-5g显示脱靶分析。图5a显示序列窗口的示意图，其中为ppibmrna靶标(ppib位点1)分析了从a至i的编辑。黑色箭头标明了目标腺苷。图 5b显示通过151-nt drna打靶ppib mrna靶标(ppib位点1)进行从a至i的 rna编辑的深度测序定量。图5c显示序列窗口的示意图，其中为了krasmrna靶标分析了从a至i的编辑。黑色箭头表示靶向的腺苷。图5d显示打靶 kras mrna靶标的91-nt和111-nt drna编辑a至i的rna的深度测序定量。图5e显示含有不同的a-g错配组合的设计的的四种91-nt或111-nt的drna的示意图。基于在图5d中的统计结果以及关于不同氨基酸的基因代码的现有知识，设计了a-g错配。图5f显示drna以及在图5e中不同种类的drna变体对靶向的a56编辑的结果。图5g显示通过111-nt drna和打靶kras mrna靶标的4种111-nt drna变体对从a至i的rna编辑的深度测序定量。
31.图6a-6h显示使用利用了内源adar1蛋白的单个drna的rna编辑。图6a 显示
dlbucas13-adardd融合蛋白的rna编辑的示意图。无催化活性的dlbucas13与adar1或adar2的rna脱氨酶结构域相融合。图6b显示双荧光报道mrna靶标和指导rna的设计的示意图。图6c显示图6a和图6b中的结果的统计分析。图6d显示293t-wt细胞中adar1和adar2的mrna水平。图 6e显示凭借基因组pcr在293t-adar1-ko细胞系中对adar1基因进行基因分型的结果。图6f显示在293t-wt和293t-adar1-ko细胞系中adar1(p110) 和adar1(p150)的表达水平(通过蛋白质印迹法)。图6g显示adar1(p110)， adar1(p150)或adar2过表达对在293t-wt细胞中由drna介导的rna编辑的影响(通过facs)。图6h显示sanger测序结果显示在靶标腺苷位点处的从a至 g的编辑。
32.图7a-7c显示对drna的优化。图7a显示带有变化的长度的drna的示意图以及基于双荧光报道分子-1凭借带有变化的长度的drna对靶向的mrna 进行编辑的结果。图7b显示基于双荧光报道分子-1，不同的a-c错配位置和 a-c错配位置对rna编辑效率的影响的示意图。图7c显示基于双荧光报道分子-3，不同的a-c错配位置和a-c错配位置对rna编辑效率的影响的示意图。
33.图8a-8b显示在293t细胞中用drna编辑内源基因的mrna。图8a显示在293t细胞中用drna编辑内源β-肌动蛋白基因(位点2)的mrna。图8b显示在293t细胞中用drna编辑内源gapdh基因的mrna。
34.图9显示在不同细胞系中凭借drna进行rna编辑。图9显示报道分子质粒和drna质粒被共转染到不同细胞系中，结果显示drna在多种细胞系中可以很好地起作用，这表明了drna应用的普遍性。
35.图10a-10d显示对有效的示例性rna编辑平台的探索。图10a， dlbucas13a-adar1dd(e1008q)融合蛋白和相应的crrna的示意图。使用3
×ꢀ
ggggs接头将催化的无活性lbucas13a融合到adar1的脱氨酶结构域(超活性e1008q变体)上。crrna(crrna
cas13a
)由lbu-crrna支架和间隔子组成，该间隔子与靶向rna互补，具有所示的a-c错配。图10b，双荧光报道系统和具有所示的多个长度的间隔子的lbu-crrna的示意图。图10c，egfp阳性 (egfp
+
)细胞的定量。将稳定表达报道分子-1(reporter-1)的hek293t细胞用所示长度的crrna
cas13a
转染，并伴或不伴dlbucas13a-adar1
dd
(e1008q)的共表达，然后进行facs分析。数据表示为平均值
±
s.e.m.(n＝3)。图10d，用对照(ctrl crrna
70
)或靶向间隔子(crrna
70
)进行的实验的代表性facs结果。
36.图11a-11g显示利用内源性adar1蛋白进行靶向rna编辑的示例性方法。图11a，报道分子-1和70-nt arrna的示意图。图11b，在稳定表达报道分子-1的野生型(hek293t，上图)或adar1敲除(hek293t adar1
–
/
–
，下图) 细胞中，arrna诱导的egfp表达的代表性facs分析。图11c，蛋白质印迹分析显示野生型和hek293t adar1
–
/
–
细胞以及转染有adar1亚型(p110和 p150)的hek293t adar1
–
/
–
细胞中adar1蛋白的表达水平。图11d，蛋白质印迹分析显示野生型和hek293t adar1
–
/
–
细胞以及转染有adar2的 hek293t adar1
–
/
–
细胞中adar2蛋白的表达水平。图11e，egfp阳性(egfp
+
) 细胞的定量。将报道分子-1和所示表达adar的构建体与对照rna
70
或靶向 arrna
70
一起共转染到hek293t adar1
–
/
–
细胞中，然后进行facs分析。通过转染效率对egfp
+
百分比进行归一化，转染效率由mcherry
+
确定。数据为平均值
±
s.e.m.(n＝4)。图11f，电泳图显示对照rna
70
(上图)或arrna
70
(下图) 靶向区域的sanger测序结果。图11g，通过深度测序对靶位点的a至i转化率进行定量。
37.图12a-12b显示adar1/adar2的mrna表达水平，和arrna介导的 rna编辑。图12a，定量pcr显示hek293t细胞中adar1和adar2的mrna 水平。数据表示为平均值
±
s.e.m.(n＝3)。图12b，来自图1e的代表性facs 结果。
38.图13显示定量pcr结果，该结果证明了示例性leaper方法对hek293t 细胞中111-nt arrna或对照rna靶向报道分子-1转录物的表达水平的影响。数据表示为平均值
±
s.e.m.(n＝3)；未配对的双面学生t检验，ns，不显著。
39.图14a-14d显示在多个细胞系中用示例性leaper方法进行的靶向rna 编辑。图14a，蛋白质印迹结果显示在所示人细胞系中adar1，adar2和 adar3的表达水平。将β-微管蛋白用作上样对照。显示的数据是三个独立实验的代表。adar1
–
/
–
/adar2代表过表达adar2的adar1-敲除hek293t细胞。图14b，通过β-微管蛋白表达归一化的相对adar蛋白表达水平。图14c，所示人细胞用报道分子-1，以及71-nt对照arrna(对照rna
71
)或71-nt靶向 arrna(arrna
71
)转染，然后进行facs分析。图14d，如图14c所述分析所示小鼠细胞系。通过转染效率对egfp
+
百分比进行归一化，该转染效率由 mcherry
+
确定。图14b，14c和14d中的误差线均表示平均值
±
s.e.m.(n＝3)；未配对的双面学生t检验，*p《0.05；**p《0.01；***p《0.001；****p 《0.0001；ns，不显著。
40.图15a-15c显示报道分子-1(a)，-2(b)和-3(c)以及它们相应的arrna的示意图。
41.图16a-16g显示示例性leaper方法的表征和优化。图16a，上图，具有与靶uag相对的改变的三联体(5'-cna，n表示a，u，c或g)的arrna设计的示意图。下图，egfp
+
百分比，其显示与靶标腺苷相对的可变碱基对rna 编辑效率的影响。图16b，上图，具有a-c错配(5'-n1cn2)中的胞苷侧翼的改变的相邻碱基的arrna的设计。下图，n1cn2的16种不同组合对rna编辑效率的影响。图16c，a-c错配中的胞苷的5'和3'最邻近位点的优先度的概述。图16d，上图，具有可变长度的arrna的设计。下图，基于报道分子-1和报道分子-2，arrna长度对rna编辑效率的影响。图16e，上图，具有可变a-c 错配位置的arrna的设计。下图，基于报道分子1和报道分子-2，a-c错配位置对的rna编辑效率的影响。图16f，上图，报道分子-3的三联体基序的设计，在靶标腺苷(5'-n1an2)周围具有可变最邻近碱基，在111-ntarrna(arrna
111
)上具有相对基序(5'-n2cn1)。下图，深层测序结果显示 5'-n1an2基序中靶标腺苷的编辑率。图16g，在“报道分子-3”上leaper介导的编辑的5'和3'碱基优先度的概述。16a，16b，16d，16e和16f中的误差线均表示平均值
±
s.e.m.(n＝3)。
42.图17a-17i显示用示例性leaper方法对内源转录物的编辑。图17a，四个疾病相关基因(ppib，kras，smad4和fancc)和相应arrna的靶向内源转录物的示意图。图17b，深度测序结果显示通过引入指定长度的arrna，对ppib，kras，smad4和fancc转录物的靶向腺苷的编辑率。图17c，深度测序结果显示在内源ppib，fancc和idua转录物的非uan位点的编辑率。图17d，两个111-nt arrna的多重编辑率。所示arrna可以单独转染或共转染到hek293t细胞中。从共转染的细胞中测量两个位点的靶向编辑。图 17e，由151-nt arrna覆盖的ppib转录物序列的示意图。黑色箭头指示靶标腺苷。所有腺苷标记为红色。图17f，腺苷的编辑率的热图，其被靶向ppib 基因的所示长度的arrna覆盖(以蓝色粗体框标记的)。对于111nt arrna或 arrna
151-ppib覆盖的区域，由于缺乏有效的pcr引物来扩增该区域，因此通过rna-seq确定a22，a30，a33和a34的编辑率。否则，通过有针对性的深度测序分析来确定编辑率。图17g，上图，报道分子-3的三联体基序的设计，在靶标腺苷(5'-n1an2)周围具有可变最邻近碱基，
在111-nt arrna(arrna
111
) 中具有相对基序(5'-n2’
gn1’
)。下图，深层测序结果显示编辑率。图17h，上图，在5'-n1gn2与5'-uag或5'-aag基序相对的基序中具有两个连续错配的 arrna的设计。深度测序结果显示在与5'-uag基序(左下)或5'-aag基序(右下) 相对的5'-n1gn2基序中具有两个连续错配的arrna
111
的编辑率。图17i，由靶向kras基因的工程化的arrna111变体覆盖的腺苷的编辑率的热图。图17b， 17c，17d，17g和17h中的数据表示为平均值
±
s.e.m.(n＝3)；未配对的双面学生t检验，*p《0.05；**p《0.01；***p《0.001；****p《0.0001；ns，不显著。(f和i)的数据表示为平均值(n＝3)。
43.图18a-18b显示示例性leaper方法对靶向转录物和蛋白质产物的表达水平的影响。图18a，定量pcr显示hek293t细胞中相应的151-nt arrna或对照rna的ppib，kras，smad4和fancc的靶向转录物的表达水平。数据表示为平均值
±
s.e.m.(n＝3)；未配对的双面学生t检验，*p《0.05；**p 《0.01；***p《0.001；****p《0.0001；ns，不显著。图18b，蛋白质印迹结果显示在hek293t细胞中，151-nt arrna对靶向kras基因的蛋白质产物的影响。将β-微管蛋白用作上样对照。
44.图19a-19f显示用示例性leaper方法对内源转录物的编辑。图19a，由 151-nt arrna覆盖的kars转录物序列的示意图。箭头指示靶向腺苷。所有腺苷标记为红色。图19b，由kars转录物中所示arrna覆盖的腺苷的编辑率的热图(以蓝色粗框标记的)。图19c，由151-nt arrna覆盖的smad4转录物的示意图。图19d，由smad4转录物中所示arrna覆盖的腺苷的编辑率的热图。图19e，由151-nt arrna覆盖的fancc转录物的示意图。图19f，由fancc 转录物中所示arrna覆盖的腺苷的编辑率的热图。对于每个arrna，双链体 rna的区域以蓝色粗体框突出显示。数据(图19b，19d和19f)表示为平均值 (n＝3)。
45.图20a-20d显示leaper的rna编辑的转录组范围特异性。20a和20b，对照rna
151
和arrna
151-ppib的转录组范围脱靶分析。上靶位点(ppib)以红色突出显示。在对照rna和靶向ppib的rna组中识别出的潜在脱靶位点标记为蓝色。图20c，脱靶位点和相应的对照rna
151
或arrna
151-ppib之间的预期退火亲和力。使用在线网站工具rnahybrid预测脱靶位点(编辑位点的上游和下游150nt)和相应的对照rna
151
或arrna
151-ppib形成的双链rna的最小自由能(δg)。图20d，上图，arrna
151-ppib和指定的潜在脱靶位点之间的高度互补区域的示意图，其可通过藉由ncbi-blast搜索同源序列来预测。下图，深度测序显示arrna
151-ppib的上靶位点和所有预测的脱靶位点的编辑率。数据表示为平均值
±
s.e.m.(n＝3)。
46.图21a-21b显示潜在脱靶的评估。图21a，arrna
111-fancc的高度互补区和指定的潜在脱靶序列的示意图，其是通过藉由ncbi-blast搜索同源序列来预测的。图21b，深度测序显示arrna
111-fancc的上靶位点和所有预测的脱靶位点的编辑率。所有数据均表示为平均值
±
s.e.m.(n＝3)。
47.图22a-22f显示在哺乳动物细胞中应用示例性leaper方法的安全性评估。图22a和22b，通过转录组范围的rna测序对对照rna
151
(a) arrna
151-ppib(b)对天然编辑位点的作用的转录组范围的分析。皮尔逊相关系数分析(pearson’s correlation coefficient analysis)用于评估天然编辑位点的差异rna编辑率。图22c和22d，用转录组水平上的rna-seq数据对对照 rna
151
(c)arrna
151-ppib(d)的作用进行差异基因表达分析。皮尔逊相关系数分析用于评估差异基因表达。图22e和22f，arrna转染对先天免疫应答的影响。将所示arrna或聚(i:c)转染到hek293t细胞中。然后使用定量pcr分析总rna，以确定ifn-β(e)和
il-6(f)的表达水平。数据(e和f)表示为平均值
±
s.e.m.(n＝3)。
48.图23a-23d显示通过leaper恢复突变体tp53w53x的转录调节活性。图23a，上图，由含有c.158g》a临床相关无义突变(trp53ter)的111-nt arrna 覆盖的tp53转录物序列的示意图。黑色箭头指示靶标腺苷。所有腺苷标记为红色。下图，设计了两个针对tp53
w53x
转录物的优化arrna，其中 arrna
111-ag1在a
46th
处具有a-g错配，而arrna
111-ag4分别在a
16th
，a
46th
， a
91th
和a
94th
处具有a-g错配，以最大程度地减少“易编辑”基序的潜在脱靶。图23b，深度测序结果显示通过arrna
111
，arrna
111-ag1和arrna
111-ag4对 tp53
w53x
转录物进行靶向编辑。图23c，蛋白质印迹显示从hek293t tp53
–
/
–
细胞中的tp53
w53x
转录物中恢复全长p53蛋白的产物。图23d，使用p53-萤火虫-荧光素酶报道系统检测恢复的p53蛋白的转录调节活性，该系统通过共转染的海藻-荧光素酶载体进行了归一化。数据(b，c和d)表示为平均值
±
s.e.m.(n ＝3)；未配对的双面学生t检验，*p《0.05；**p《0.01；***p《0.001；****p 《0.0001；ns，不显著。
49.图24显示通过示例性的leaper方法对突变体tp53w53x转录物的编辑。上图，是111nt arrna覆盖的tp53转录序列的示意图。箭头指示靶标腺苷。所有腺苷标记为红色。下图，是tp53转录物中所示arrna覆盖的腺苷编辑率的热图。
50.图25显示从clinvar数据和相应的111-nt arrna中选择的含有g至a突变的疾病相关cdna的示意图。
51.图26显示通过示例性的leaper方法对病原性突变的校正。通过相应的 111nt arrna从clinvar数据对疾病相关的g》a突变进行a至i校正，靶向所示的来自六个致病基因的临床相关突变(图25以及以下arrna和对照rna和疾病相关的cdna的序列的表)。数据表示为平均值
±
s.e.m.(n＝3)；未配对的双面学生t检验，*p《0.05；**p《0.01；***p《0.001；****p《0.0001；ns，不显著。
52.图27a-27c显示通过示例性leaper方法在多个人原代细胞中的rna编辑。图27a，由leaper介导的rna编辑诱导的egfp阳性(egfp
+
)细胞的定量。用报道分子-1，以及151-nt对照rna(对照rna
151
)或151-nt靶向 arrna(arrna
151
)转染人原代肺成纤维细胞和人原代支气管上皮细胞，然后进行facs分析。图27b和27c，深度测序结果显示人原代肺成纤维细胞，人原代支气管上皮细胞(b)和人原代t细胞(c)中ppib转录物的编辑率。a，b和未治疗组(c)中的数据表示为平均值
±
s.e.m.(n＝3)；对照rna
151
和arrna
151
(c) 的数据表示为平均值
±
s.e.m.(n＝2)。
53.图28a-28d显示arrna的慢病毒转导和合成arrna寡核苷酸的电穿孔的靶向编辑。图28a，egfp
+
细胞的定量。将稳定表达报道分子-1的hek293t 细胞用表达ctrl-rna或靶向arrna的151-nt的慢病毒感染。感染后2天和8天进行facs分析。egfp
+
细胞的比率通过慢病毒转导效率(bfp
+
比率)归一化。图28b，深度测序结果显示慢病毒将151-nt arrna转导入hek293t细胞后， ppib转录物的编辑率。图28c，ppib序列和相应的111-nt靶向arrna的示意图。*(红色)表示具有2'-o-甲基和硫代磷酸酯键修饰的核苷酸。图28d，深度测序结果显示当将111nt合成arrna寡核苷酸电穿孔到人原代t细胞中时， ppib转录物的编辑率。
54.图29a-29e显示通过示例性leaper方法在源自hurler综合征患者的原代成纤维细胞中α-l-艾杜糖醛酸酶活性的恢复。图29a，上图，源自患者的成纤维细胞gm06214中致病突变的遗传信息；中间图，idua基因的外显子9(trp402ter)中含有纯合tgg》tag突变的
gm06214细胞(黑色)的idua成熟 mrna序列的示意图，相应的111-nt靶向arrna
111-idua-v1(蓝色)；下图， gm06214细胞的idua前mrna序列(黑色)和相应的111-nt靶向 arrna
111-idua-v2的示意图(蓝色)。*(红色)表示具有2'-o-甲基和硫代磷酸酯键修饰的核苷酸。图29b，在不同时间点，用4-甲基伞形酮α-l-艾杜糖醛酸酶底物测量α-l-艾杜糖醛酸酶的催化活性。数据表示为平均值
±
s.e.m.(n＝2)。图29c，深度测序结果显示在电穿孔后48小时，在gm06214细胞中，idua 转录物的靶向编辑率。图29d，上图，由111-nt arrna覆盖的idua转录序列的示意图。箭头指示靶标腺苷。所有腺苷标记为红色。下图，由idua转录物中所示arrna覆盖的腺苷编辑率的热图(以蓝色粗体框显示)。e，定量pcr 显示在arrna或聚(i:c)电穿孔后，i型干扰素、干扰素刺激基因和促炎基因的表达。数据表示为平均值(n＝3)。
55.图30a-30c显示双荧光报道分子(报道分子-1，-2和-3)，mcherry和egfp 的三种形式。图30a，报道分子-1的结构，图30b，报道分子-2的结构，图30c，报道分子-3的结构。
56.图31显示aav8-idua-adrna151-kd2和aav8-random151-kd2的质粒信息。
57.图32a-b显示注射有aav8-idua-adrna151-kd2和 aav8-random151-kd2的mpsi小鼠的α-l-艾杜糖醛酸酶相对酶活性。 gm01323细胞作为对照。
58.图33a-b显示注射有aav8-idua-adrna151-kd2和aav8-random151-kd2的mpsi小鼠的rna编辑效率。
59.发明详述
60.本技术提供rna编辑方法(本文称为“leaper”方法)和经特殊设计的 rna，本文称为脱氨酶募集rna(“drna”)或adar-募集rna(“arrna”)，以编辑宿主细胞中的靶标rna。不受任何理论或假设的约束，所述drna通过序列特异的方式与其靶标rna杂交而起作用，形成双链rna，其募集作用于 rna的腺苷脱氨酶(adenosine deaminase acting on rna,adar)以使靶标 rna中的靶标腺苷脱氨基。因此，在一些实施方案中，在无宿主细胞中异位表达或过表达adar蛋白的情况下可以实现有效的rna编辑。本发明还提供了使用所述rna编辑方法治疗或预防个体疾病或病症的方法和组合物。
61.本文所述的rna编辑方法不使用包含adar和特异性结合指导核酸的蛋白质(诸如cas)的融合蛋白。本文描述的脱氨酶募集 rna(deaminase-recruiting rna(drna))不包含crispr/cas系统中使用的 crrna，tracrrna或grna。在一些实施方案中，drna不包含adar招募结构域或化学修饰。在一些实施方案中，drna可以从质粒或病毒载体表达，或合成为寡核苷酸，其可以实现所需的编辑效率。
62.本文所述的leaper方法对靶标转录物和罕见的全局脱靶具有可控的脱靶率。发明人已经使用leaper方法通过修复特定的癌症相关点突变来恢复 p53功能。本文所述的leaper方法还可以应用于包括多种人类原代细胞的广泛的细胞类型，并且可以用于在源自hurler综合征患者的原代成纤维细胞中恢复α-l-艾杜糖醛酸酶催化活性，而无需引起先天免疫应答。在一些实施方案中，leaper方法涉及单分子(即，drna)系统。本文所述的leaper方法可实现精确而有效的rna编辑，从而为基础研究和治疗提供了变革性的潜力。
63.定义
64.将参照特定实施方案并参考某些附图来描述本发明，但是本发明不受限于此，而是仅由权利要求进行限定。权利要求中的任何参考标记不应被解释为为范围的限制。当在本说明书和权利要求中使用术语“包括”时，不排除其他因素或者步骤。对于提及单数名词
principles of hybridization and the strategyof nucleic acid probe assay”，elsevier，n，y中详细描述了严格条件的非限制性实例。
[0072]“杂交”是指其中一种或多种多核苷酸反应形成复合物的反应，所述复合物通过核苷酸残基的碱基之间的氢键稳定。所述氢键可以通过watson crick 碱基配对，hoogstein结合或以任何其他序列特异性的方式发生。能够与给定序列杂交的序列称为给定序列的“互补序列”。
[0073]
如本文所用，术语“细胞”，“细胞系”和“细胞培养物”可互换使用，并且所有这些名称包括后代。应理解，由于故意或无意的突变，所有后代的dna 内容可能不完全相同。本发明包括了具有与原始细胞相同的功能或生物活性的变体后代。
[0074]
rna编辑方法
[0075]
在一些实施方案中，本发明提供了用于编辑宿主细胞(例如，真核细胞) 中的靶标rna的方法，包含将脱氨酶募集rna(drna)或编码drna的构建体引入宿主细胞，其中所述drna包含与靶标rna杂交的互补rna序列，并且其中drna能够募集作用于rna的腺苷脱氨酶(adar)以使靶标rna中的靶标腺苷(a)脱氨基。
[0076]
在一些实施方案中，本发明提供了用于编辑宿主细胞(例如，真核细胞) 中的靶标rna的方法，包含将drna或编码drna的构建体引入宿主细胞，其中所述drna包含与靶标rna杂交的互补rna序列，并且其中所述drna 募集宿主细胞的内源表达的adar，以使靶标rna中的靶标a脱氨基。在一些实施方案中，该方法不包含将任何蛋白质或编码蛋白质的构建体(例如， cas，adar或adar和cas的融合蛋白)引入宿主细胞。
[0077]
在一些实施方案中，提供了用于编辑宿主细胞(例如，真核细胞)中的靶标rna的方法，包含引入：(a)drna或编码drna的构建体，和(b)adar或编码adar的构建体到宿主细胞中，其中所述drna包含与靶标rna杂交的互补rna序列，并且其中所述drna募集adar，以使靶标rna中的靶标a 脱氨基。在一些实施方案中，所述adar是宿主细胞的内源编码的adar，其中所述adar引入包含在宿主细胞中过表达adar。在一些实施方案中，所述adar对宿主细胞是外源的。在一些实施方案中，所述编码adar的构建体是载体，例如质粒，或病毒载体(例如，慢病毒载体)。
[0078]
在一些实施方案中，提供了用于编辑宿主细胞(例如，真核细胞)中的多种(例如，至少约2、3、4、5、10、20、50、100或更多种)靶标rna的方法，其包含引入多个drna或编码多个drna的构建体至宿主细胞，其中每个 drna包含与所述多个靶标rna中的相应靶标rna杂交的互补rna序列，并且其中每个drna能够募集adar，以使相应靶标rna的靶标a脱氨基。
[0079]
在一些实施方案中，提供了用于编辑宿主细胞(例如，真核细胞)中的多个(例如，至少约2、3、4、5、10、20、50、100或更多个)靶标rna的方法，其包含引入多个drna或编码多个drna的构建体至宿主细胞，其中每个 drna包含与所述多个靶标rna的相应靶标rna杂交的互补rna序列，并且其中每个drna募集内源表达的adar，以使相应靶标rna中的靶标a脱氨基。
[0080]
在一些实施方案中，提供了用于编辑宿主细胞(例如，真核细胞)中的多种(例如，至少约2、3、4、5、10、20、50、100、1000或更多种)靶标rna 的方法，包括引入(a)多个drna或者编码多个drna的构建体，和(b)adar 或者编码adar的构建体到宿主细胞中，其中每个drna包含互补rna序列，其与所述多个靶标rna中的相应靶标rna杂交，并且其中每个drna募
150、70-140、70-130、70-120、70-110、70-100、70-90、70-80、75-200、 80-190、85-180、90-170、95-160、100-200、100-150、100-175、110-200、 110-175、110-150或105-140个核苷酸中的任何一种。在一些实施方案中， drna为约71个核苷酸长。在一些实施方案中，drna为约111个核苷酸长。
[0089]
在根据本文描述的任何一种方法或用途的某些实施方案中，drna不包含adar-募集结构域。“adar-募集结构域”可以是与adar高亲和力结合的核苷酸序列或结构，或与在工程化的adar构建体中与adar融合的结合配偶体结合的核苷酸序列。示例性adar募集域包括，但不限于，glur-2， glur-b(r/g)，glur-b(q/r)，glur-6(r/g)，5ht2c和flna(q/r)域；参见，例如wahlstedt，helene和marie，"site-selective versus promiscuous a-to-iediting."wiley interdisciplinary reviews:rna 2.6(2011):761-771，其通过引用以其整体并入本文。在一些实施方案中，drna不包含双链部分。在一些实施方案中，drna不包含发夹，诸如ms2茎环。在一些实施方案中，drna 是单链的。在一些实施方案中，adar不包含dsb结合结构域。在一些实施方案中，drna由互补rna序列组成(或基本上由其组成)。
[0090]
在根据本文描述的任何一种方法或用途的某些实施方案中，drna不包含化学修饰。在一些实施方案中，drna不包含化学修饰的核苷酸，诸如2
’‑o‑ꢀ
甲基核苷酸或具有硫代磷酸酯键的核苷酸。在一些实施方案中，drna仅在前三个残基和后三个残基处包含2'-o-甲基和硫代磷酸酯键修饰。在一些实施方案中，drna不是反义寡核苷酸(aso)。
[0091]
在根据本文所述的方法或用途的任何一种的某些实施方案中，所述宿主细胞是原核细胞。在一些实施方案中，所述宿主细胞是真核细胞。在一些实施方案中，所述宿主细胞是哺乳动物细胞。在一些实施方案中，所述宿主细胞是人类细胞。在一些实施方案中，所述宿主细胞是小鼠细胞。在一些实施方案中，所述宿主细胞是植物细胞或真菌细胞。
[0092]
在根据本文描述的任何一种方法或用途的一些实施方案中，宿主细胞是细胞系，诸如hek293t，ht29，a549，hepg2，rd，sf268，sw13和hela 细胞。在一些实施方案中，宿主细胞是原代细胞，诸如成纤维细胞，上皮细胞或免疫细胞。在一些实施方案中，宿主细胞是t细胞。在一些实施方案中，宿主细胞是有丝分裂后细胞。在一些实施方案中，宿主细胞是中枢神经系统 (cns)的细胞，诸如脑细胞，例如小脑细胞。
[0093]
在一些实施方案中，提供了在原代宿主细胞(例如，t细胞或cns细胞) 中编辑靶标rna的方法，其包括将drna或编码该drna的构建体引入宿主细胞，其中drna包含与靶标rna杂交的互补rna序列，并且其中drna募集宿主细胞的内源表达的adar以使靶标rna中的靶标a脱氨基。
[0094]
在根据本文所述的方法或用途的任何一种的某些实施方案中，所述 adar对宿主细胞是内源的。在一些实施方案中，作用于rna的腺苷脱氨酶 (adar)天然地或内源地存在于宿主细胞中，例如，天然地或内源地存在于真核细胞中。在一些实施方案中，所述adar由宿主细胞内源表达。在某些实施方案中，将所述adar外源引入宿主细胞中。在一些实施方案中，所述 adar是adar1和/或adar2。在某些实施方案中，所述adar是选自下组的一种或多种adar：hadar1，hadar2，小鼠adar1和adar2。在一些实施方案中，adar是adar1，诸如adar1的p110同种型(“adar1
p110”)和/ 或adar1的p150同种型(“adar1
p150”)。在一些实施方案中，adar是 adar2。在一些实施方案中，adar是宿主细胞表达的adar2，例如小脑细胞表达的adar2。
[0095]
在一些实施方案中，adar是宿主细胞外源的adar。在一些实施方案中，adar是天然存在的adar的过度活跃的突变体。在一些实施方案中， adar是包含e1008q突变的adar1。在一些实施方案中，adar不是包含结合结构域的融合蛋白。在一些实施方案中，adar不包含工程化的双链核酸结合结构域。在一些实施方案中，adar不包含与融合至drna中的互补 rna序列的ms2发夹结合的mcp结构域。在一些实施方案中，adar不包括 dsb结合结构域。
[0096]
在根据本文描述的任何一种方法或用途的一些实施方案中，宿主细胞具有高表达水平的adar1(诸如adar1
p110
和/或adar1
p150
)，例如相对于β-微管蛋白的蛋白质表达水平的至少约10％，20％，50％，100％，2x，3x，5x 或更高中的任何一项。在一些实施方案中，宿主细胞具有高表达水平的 adar2，例如相对于β-微管蛋白的蛋白质表达水平的至少约10％，20％， 50％，100％，2x，3x，5x或更高中的任何一项。在一些实施方案中，宿主细胞具有低表达水平的adar3，例如相对于β-微管蛋白的蛋白质表达水平不超过约5x，3x，2x，100％，50％，20％或更少中的任何一项。
[0097]
在根据本文所述的方法或用途的任何一种的某些实施方案中，所述互补 rna序列包含与靶标rna中的靶标a正对的胞苷、腺苷或尿苷。在一些实施方案中，互补rna序列包含与靶标rna中的靶标a正对的胞苷错配。在一些实施方案中，胞苷错配位于距互补rna序列的5'端至少5个核苷酸，例如至少 10、15、20、25、30或更多个核苷酸。在一些实施方案中，胞苷错配位于距互补rna序列的3'端至少20个核苷酸，例如至少25、30、35或更多个核苷酸。在一些实施方案中，胞苷错配不位于距互补rna序列的3'端20(例如15、10、 5或更少)个核苷酸内。在一些实施方案中，胞苷错配位于距互补rna序列的 3'端至少20个核苷酸(例如，至少25、30、35或更多个核苷酸)和5'端至少5个核苷酸(例如，至少10、15、20，25、30或更多个核苷酸)。在一些实施方案中，胞苷错配位于互补rna序列的中心。在一些实施方案中，胞苷错配位于 drna中互补序列中心的20个核苷酸(例如15、10、9、8、7、6、5、4、3、2 或1个核苷酸)内。
[0098]
在根据本文描述的任何一种方法或用途的某些实施方案中，互补rna序列还包含一个或多个鸟苷，诸如1、2、3、4、5、6或多个g，分别与靶标rna 中的非靶标腺苷正对。在一些实施方案中，互补rna序列包含与靶标rna 中的非靶腺苷相对的两个或更多个连续错配核苷酸(例如2、3、4、5或更多个错配核苷酸)。在一些实施方案中，靶标rna包含不超过约20个非靶标a，诸如不超过约15、10、9、8、7、6、5、4、3、2或1个非靶标a中的任何一项。与非靶标a相对的g和连续错配核苷酸可降低adar的脱靶编辑作用。
[0099]
在根据本文描述的任何一种方法或用途的某些实施方案中，靶标a的5' 侧最近邻位是选自u，c，a和g的核苷酸，优先度u》c≈a》g且靶标a的3'侧最近邻位是选自g，c，a和u的核苷酸，优先度g》c》a≈u。在某些实施方案中，靶标rna中的靶标a是选自下组的三碱基基序：uag，uac，uaa， uau，cag，cac，caa，cau，aag，aac，aaa，aau，gag，gac， gaa和gau。在某些实施方案中，所述三碱基基序是uag，并且所述drna 包含与所述三碱基基序中的u正对的a，与所述靶标a正对的c，和与三碱基基序中的g正对的c，g或u。在某些实施方案中，所述三碱基基序是靶标rna 中的uag，并且所述drna包含与靶标rna的uag相对的acc，acg或 acu。在某些实施方案中，三碱基基序是靶标rna中的uag，并且drna包含与靶标rna的uag相对的acc。
[0100]
在根据本文所述的方法或用途的任何一种的某些实施方案中，所述靶标 rna是选
自下组的任何一种：前信使rna，信使rna，核糖体rna，转移 rna，长非编码rna和小rna(例如，mirna)。在一些实施方案中，靶标 rna是前信使rna。在一些实施方案中，靶标rna是信使rna。
[0101]
在根据本文描述的任何一种方法或用途的某些实施方案中，该方法进一步包括将adar3的抑制剂引入宿主细胞。在一些实施方案中，adar3的抑制剂是针对adar3的rnai，诸如针对adar3的shrna或针对adar3的 sirna。在一些实施方案中，该方法进一步包括将干扰素的刺激物引入宿主细胞。在一些实施方案中，adar可由干扰素诱导，例如，adar是adar
p150
。在一些实施方案中，干扰素的刺激物是ifn。在一些实施方案中，adar3 的抑制剂和/或干扰素的刺激物由编码drna的相同构建体(例如，载体)编码。
[0102]
在根据本文描述的任何一种方法或用途的某些实施方案中，靶标rna的编辑效率为至少约5％，诸如至少约6％，7％，8％，9％，10％，15％，20％， 25％，30％，35％，40％，45％，50％，55％，60％，65％或更高中的任何一项。在一些实施方案中，在体内(例如，在动物中)编辑靶标rna的效率为至少约5％(例如，至少约7％)。在一些实施方案中，在体外或离体在细胞中编辑靶标rna的效率为至少约10％(例如，至少约15％)。在一些实施方案中，编辑的效率通过sanger测序来确定。在一些实施方案中，编辑的效率由下一代测序确定。
[0103]
在根据本文描述的任何一种方法或用途的某些实施方案中，该方法具有低的脱靶编辑率。在一些实施方案中，该方法对靶标rna中的非靶标a具有低于约1％(例如，不超过约0.5％，0.1％，0.05％，0.01％，0.001％或更低中的任何一项)的编辑效率。在一些实施方案中，该方法不编辑靶标rna中的非靶标a。在一些实施方案中，该方法对非靶标rna中的a具有低于约0.1％ (例如，不超过约0.05％，0.01％，0.005％，0.001％，0.0001％或更低中的任何一项)的编辑效率。
[0104]
在根据本文描述的任何一种方法或用途的某些实施方案中，该方法不诱导免疫应答，诸如先天免疫应答。在一些实施方案中，该方法不诱导宿主细胞中干扰素和/或白介素的表达。在一些实施方案中，该方法在宿主细胞中不诱导ifn-β和/或il-6表达。
[0105]
本发明还提供了经编辑的rna或宿主细胞，所述宿主细胞具有通过本文所述的方法的任何一种所产生的经编辑的rna。在一些实施方案中，经编辑的rna包含肌苷。在一些实施方案中，所述宿主细胞包含具有错义突变，过早的终止密码子，可变剪接位点或异常剪接位点的rna。在一些实施方案中，所述宿主细胞包含突变的，截短的或错误折叠的蛋白质。
[0106]
如本文所述的“宿主细胞”是指可用作宿主细胞的任何细胞类型，前提是其可如本文所述的被修饰。例如，所述宿主细胞可以是具有作用于rna的内源性表达的腺苷脱氨酶(adar)的宿主细胞，或者可以是通过本领域已知的方法引入作用于rna的腺苷脱氨酶(adar)的宿主细胞。例如，所述宿主细胞可以是原核细胞，真核细胞或植物细胞。在一些实施方案中，所述宿主细胞源自预先建立的细胞系，例如哺乳动物细胞系，包括人类细胞系或非人类细胞系。在一些实施方案中，所述宿主细胞源自个体，例如人类个体。
[0107]
本文使用的“引入(introducing)”或“引入(introduction)”是指将一种或多种多核苷酸(例如drna)或一种或多种构建体(包括本文所述的载体，它的一种或多种转录物)递送至所述宿主细胞。本发明用作能够打靶地编辑rna 的基础平台，例如，前信使rna，信使rna，核糖体rna，转移rna，长非编码rna和小rna(例如mirna)。本技术的方法可以采用许多递送系统，包括但不限于：病毒，脂质体，电穿孔，显微注射和接合作用，以实现如本文所述
的drna或构建体向宿主细胞中的引入。常规的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶标组织。此类方法可用于将编码本技术的drna的核酸施用于培养的细胞或宿主生物体中。非病毒载体递送系统包括dna质粒，rna(例如本文所述的构建体的转录物)，裸核酸和与递送载体复合的核酸，例如脂质体。所述病毒载体递送系统包括dna 和rna病毒，其具有游离或整合的基因组以递送至所述宿主细胞。
[0108]
非病毒递送核酸的方法包括脂质转染，核转染，显微注射，生物射弹，病毒体，脂质体，免疫脂质体，聚合阳离子或脂质:核酸接合物，电穿孔，纳米颗粒，外泌体，微泡或基因枪，裸dna和人工病毒粒子。
[0109]
使用基于rna或dna病毒的系统来递送核酸在使病毒打靶特定细胞和使病毒的有效负载运输到细胞核方面具有高效率。
[0110]
在根据本文描述的任何一种方法或用途的某些实施方案中，该方法包括将编码drna的病毒载体(诸如，慢病毒载体)引入宿主细胞。在一些实施方案中，病毒载体是aav，例如aav8。在一些实施方案中，该方法包括将编码 drna的质粒引入宿主细胞。在一些实施方案中，该方法包括将drna(例如，合成drna)引入(例如，通过电穿孔)到宿主细胞中。在一些实施方案中，该方法包括将drna转染到宿主细胞中。
[0111]
在脱氨基之后，根据靶标rna中的靶标腺苷的位置，可以使用不同方法确定靶标rna和/或靶标rna编码的蛋白质的修饰。例如，为了确定在靶标 rna中是否已将“a”编辑为“i”，可以使用本领域已知的rna测序方法来检测 rna序列的修饰。当靶标腺苷位于mrna的编码区中时，rna编辑可以引起 mrna编码的氨基酸序列的改变。例如，可以将点突变引入mrna，或者 mrna中的先天的或获得性的点突变被回复以产生野生型基因产物，因为“a”转化为了“i”。通过本领域已知的方法进行氨基酸测序可用于发现编码蛋白质中氨基酸残基的任何变化。终止密码子的修饰可以通过评估功能性的、伸长的、截短的、全长的和/或野生型的蛋白质的存在来确定。例如，当靶标腺苷位于uga，uag或uaa终止密码子中时，靶标a(uga或uag)或多个 a(uaa)的修饰可创造出通读突变和/或延长的蛋白质，或者，由靶标rna编码的截短蛋白质可以被回复以产生有功能的、全长的和/或野生型的蛋白质。靶标rna的编辑还可以在靶标rna中产生异常剪接位点和/或可变的剪接位点，从而导致延长的，截短的或错误折叠的蛋白质，或者靶标rna中经编码的异常剪接或可变剪接位点经回复以产生有功能的、正确折叠的、全长的和 /或野生型的蛋白质。在一些实施方案中，本技术考虑编辑先天的和获得性的基因变化，例如，错义突变，过早的终止密码子，异常剪接或由靶标rna编码的可变剪接位点。使用已知方法评估由靶标rna编码的蛋白质的功能，可以发现rna编辑是否实现了期望的效果。因为腺苷(a)对肌苷(i)的脱氨基可以纠正编码蛋白质的突变rna中的靶标位置处的突变a，所以对脱氨基为肌苷的鉴定可以提供功能蛋白质是否存在的评估，或者突变的腺苷引起的、与疾病或药物抗性相关的rna是否已回复或部分回复的评估。类似地，因为腺苷(a)对肌苷(i)的脱氨基作用可能在所得蛋白质中引入点突变，所以对脱氨基为肌苷的鉴定可以找出疾病原因或疾病相关因素的功能性指征。
[0112]
当靶标腺苷的存在引起异常剪接时，读出值可以是异常剪接的发生和频率的评估。另一方面，当期望的目标腺苷的脱氨基作用被引入剪接位点时，可以使用类似的方法来检查是否发生所需的剪接类型。使用本领域技术人员熟知的方法在靶标腺苷脱氨基之后鉴别出肌苷存在的示例性合适方法是 rt-pcr和测序。
[0113]
靶标腺苷的脱氨作用包括例如点突变，过早的终止密码子，异常剪接位点，可变剪接位点和所得蛋白质的错误折叠。这些效应可以诱导与疾病相关的rna和/或蛋白质的结构和功能变化，无论它们是先天遗传的还是由获得性基因突变引起的，或者可以诱导与耐药性发生相关的rna和/或蛋白质的结构和功能变化。因此，通过改变与疾病相关的rna和/或蛋白质的结构和/ 或功能，可以将drna，编码drna的构建体和本技术的rna编辑方法用于预防或治疗遗传性疾病或病症，或与获得性基因突变相关的疾病或病症。
[0114]
在一些实施方案中，靶标rna是调节rna。在一些实施方案中，待编辑的靶标rna是核糖体rna，转移rna，长非编码rna或小rna(例如， mirna，pri-mirna，pre-mirna，pirna，sirna，snorna，snrna，exrna 或scarna)。靶标腺苷的脱氨基作用包括例如核糖体rna，转移rna，长非编码rna或小rna(例如，mirna)，包括了三维结构和/或功能损失或功能获得的变化。在一些实施方案中，靶标rna中靶标a的脱氨基作用改变了靶标rna的一种或多种下游分子(例如，蛋白质，rna和/或代谢物)的表达水平。所述下游分子的表达水平的变化可以是表达水平的增加或减少。
[0115]
本技术的一些实施方案涉及宿主细胞中靶标rna的多重编辑，其可用于筛选靶标基因的不同变体或宿主细胞中的不同基因。在一些实施方案中，其中所述方法包含将多个drna引入所述宿主细胞，所述多个drna中的至少两个drna具有不同的序列和/或具有不同的靶标rna。在一些实施方案中，每种drna具有不同的序列和/或不同的靶标rna。在一些实施方案中，该方法在宿主细胞中的单个靶标rna中产生多个(例如，至少2、3、5、10、50、100、 1000或更多个)修饰。在一些实施方案中，该方法产生宿主细胞中多种(例如，至少2、3、5、10、50、100、1000或更多种)靶标rna的修饰。在一些实施方案中，该方法包含：编辑多个宿主细胞群中的多个靶标rna。在一些实施方案中，每个宿主细胞群接收不同的drna或具有与其他宿主细胞群不同的靶标rna的drna。
[0116]
脱氨酶募集rna，构建体和文库
[0117]
在一个方面，本技术提供了可用于本文所述方法的任何一种的脱氨酶募集rna。本节中描述的任何一种drna可用于本文所述的rna编辑和治疗方法中。设定本文描述的drna的任何特征和参数可以彼此组合，就好像每个组合被单独描述一样。本文描述的drna不包含crispr/cas系统中使用的 tracrrna，crrna或grna。
[0118]
在一些实施方案中，提供了一种脱氨酶募集rna(drna)，其通过募集 adar对靶标rna中的靶标腺苷进行脱氨基作用，所述adar包含与靶标 rna杂交的互补rna序列。
[0119]
在一个方面，本发明提供了包含本文所述的任何一种脱氨酶募集rna的构建体。在某些实施方案中，所述构建体是病毒载体(诸如慢病毒载体)或质粒。在一些实施方案中，病毒载体是aav，诸如aav8。在一些实施方案中，所述构建体编码单个drna。在一些实施方案中，所述构建体编码多个(例如，约1、2、3、4、5、10、20或更多个中的任一项)drna。
[0120]
在一个方面，本技术提供了包含多种脱氨酶募集rna或本文所述的多种构建体的文库。
[0121]
在一个方面，本技术提供了包含所述脱氨酶募集rna或本文所述构建体的组合物或宿主细胞。在某些实施方案中，所述宿主细胞是原核细胞或真核细胞。优选地，所述宿主细胞是哺乳动物细胞。最优选地，所述宿主细胞是人类细胞。
[0122]
在根据本文所述的drna，构建体，文库或组合物中的任一种的某些实施方案中，所
述互补rna序列包含直接与靶标腺苷相对的胞苷，腺苷或尿苷 (其在靶标rna中待编辑)。在某些实施方案中，所述互补rna序列还包含一种或多种鸟苷，其各自与靶标rna中的非靶标腺苷正对。在某些实施方案中，靶标a的5'侧最近邻位是选自u，c，a和g的核苷酸，优先度u》c≈a》g且靶标a的3'侧最近邻位是选自g，c，a和u的核苷酸，优先度g》c》a≈u。在一些实施方案中，靶标a的5'侧最近邻位是u。在一些实施例中，靶标a的5'侧最近邻位是c或a。在一些实施例中，靶标a的3'侧最近邻位是g。在一些实施方案中，靶标a的3'侧最近邻位是c。
[0123]
在根据本文所述的drna，构建体，文库或组合物中的任一种的某些实施方案中，靶标rna中的靶标a是选自下组的三碱基基序：uag，uac， uaa，uau，cag，cac，caa，cau，aag，aac，aaa，aau，gag， gac，gaa和gau。在某些实施方案中，所述三碱基基序是uag，并且drna 包含与三碱基基序中的u正对的a，与靶标a正对的c，和与三碱基基序中的 g正对的c，g或u。在某些实施方案中，所述三碱基基序是靶标rna中的 uag，并且所述drna包含与靶标rna的uag相对的acc，acg或acu。
[0124]
在一些实施方案中，drna包含与靶标rna中的靶标a正对的胞苷错配。在一些实施方案中，胞苷错配靠近互补rna序列的中心，诸如在距互补rna 序列的中心20、15、10、5、4、3、2或1个核苷酸内。在一些实施方案中，胞苷错配距互补rna序列的5'末端至少5个核苷酸。在一些实施方案中，胞苷错配距互补rna序列的3'末端至少20个核苷酸。
[0125]
在根据本文所述的drna，构建体，文库或组合物中的任一种的某些实施方案中，所述drna包含多于大约40、45、50、55、60、65、70、75、80、 90，100、110、120、130、140、150、160、170、180、190、200、210、220、 230、240或250个核苷酸中的任一项。在某些实施方案中，所述drna的长度为40-260、45-250、50-240、60-230、65-220、70-210、70-200、70-190、70-180、 70-170，70-160、70-150、70-140、70-130、70-120、70-110、70-100、70-90、 70-80、75-200、80-190、85-180、90-170、95-160、100-150或105-140个核苷酸中的任一项。
[0126]
在一些实施方案中，drna包含seq id no：25-44、142-205、341-342 中任一项的核酸序列。
[0127]
本技术的drna包含与靶标rna杂交的互补rna序列。所述互补rna序列与靶标rna完全互补或基本上互补，以允许互补rna序列与靶标rna杂交。在一些实施方案中，所述互补rna序列具有100％的与靶标rna的序列互补性。在一些实施方案中，所述互补rna序列具有至少大约70％，80％， 85％，90％，95％，96％，97％，98％或99％或更高的任一项的互补性(在至少约为靶标rna中20、40、60、80、100、150、200或更多个核苷酸中的任何一项的连续伸长(stretch)内)。在一些实施方案中，通过互补rna序列和靶标rna之间的杂交形成的dsrna具有一个或多个(例如，1、2、3、4、5、 6、7、8、9、10或更多个)非watson-crick碱基对(即错配)。
[0128]
adar，例如，人类adar酶编辑具有不同特异性的双链rna(dsrna) 结构，这取决于许多因素。一个重要因素是构成dsrna序列的两条链的互补程度。所述drna和靶标rna之间的完美互补性通常导致adar的催化结构域以非判别性方式使腺苷脱氨基。可以通过在dsrna区域中引入错配来修饰 adar的特异性和效率。例如，优选推荐a-c错配以增加待编辑的腺苷脱氨的特异性和效率。相反，在除了靶标a的其他a(腺苷)位置(即“非靶标a”)， g-a错配可以减少脱靶编辑。所述drna与其靶标rna之间的dsrna形成不一定需要完美的互补性，前提是drna和靶标rna之间的杂交和dsrna的生成具有实质的互补性。在一些实施方案
中，其drna序列或单链rna区域具有至少约70％，80％，85％，90％，95％，96％，97％，98％或99％序列中的任何一项的与靶标rna的互补性(当理想比对时)。可以使用用于对准序列的任何合适的算法来确定理想比对，其非限制性的示例包括smith-waterman 算法，needleman-wimsch算法，基于burrows-wheeler变换的算法(例如 burrows wheeler aligner)。
[0129]
与靶标腺苷相邻的核苷酸也影响脱氨基的特异性和效率。例如，在靶标 rna序列中待编辑的靶标腺苷的5'侧最近邻位具有优先度u》c≈a》g并且在靶标rna序列中待编辑的靶标腺苷的3'侧最近邻位具有在腺苷脱氨基的特异性和效率方面的优先度：g》c》a≈u。在一些实施方案中，当在靶标rna中靶标腺苷可以是选自下组的三碱基基序：uag，uac，uaa，uau，cag， cac，caa，cau，aag，aac，aaa，aau，gag，gac，gaa和gau 时，所述腺苷脱氨基的特异性和效率高于其他的三碱基基因中的腺苷。在一些实施方案中，待编辑的靶标腺苷处于三碱基基序uag，uac，uaa，uau， cag，cac，aag，aac或aaa中时，所述腺苷脱氨基的效率高于其他基序中的腺苷。对于相同的三碱基基序，drna的不同设计也可导致不同的脱氨基效率。以三碱基基序uag为例，在一些实施方案中，当drna包含与待编辑的靶标腺苷正对的胞苷(c)时，所述腺苷(a)直接与尿苷相对，而胞苷(c)，鸟苷(g)或尿苷(u)与鸟苷正对，靶标腺苷脱氨基的效率高于使用其他drna 序列的脱氨基的效率。在一些实施方案中，当drna包含与靶标rna的uag 相对的acc，acg或acu时，所述靶标rna的uag中a的编辑效率可达到约 25％-30％。
[0130]
除了靶标腺苷外，靶标rna中可能存在一种或多种不希望编辑的腺苷。对于这些腺苷，优选尽可能降低它们的编辑效率。本发明发现，鸟苷与靶标 rna中的腺苷正对处，脱氨基效率显着降低。因此，为了减少脱靶脱氨基作用，可以将drna设计成包含一种或多种鸟苷，其直接与靶标rna中除待编辑的靶标腺苷之外的一种或多种腺苷相对。
[0131]
编辑靶标rna序列的所需特异性水平和效率可取决于不同的应用。按照本专利申请中的说明，本领域技术人员将能够根据其需要设计具有与靶标 rna序列互补或基本上互补的序列的drna，并且通过一些试验和错误，获得他们期望的结果。如本文所用，术语“错配”是指双链rna(dsrna)中相对的核苷酸，其根据watson-crick碱基配对规则不形成完美的碱基对。错配碱基对包括：例如g-a，c-a，u-c，a-a，g-g，c-c，u-u碱基对。以a-c匹配为例，其中靶标a在靶标rna中被编辑，drna被设计为包含与待编辑的a 相对的c，在通过靶标rna和drna之间的杂交形成的dsrna中产生a-c错配。
[0132]
在一些实施方案中，通过drna和靶标rna之间的杂交形成的dsrna不包含错配。在一些实施方案中，通过drna和靶标rna之间的杂交形成的 dsrna包含一个或多个，例如1、2、3、4、5、6、7或更多个错配中的任何一个(例如，不同类型错配中相同类型的错配)。在一些实施方案中，通过drna 和靶标rna之间的杂交形成的dsrna包含一种或多种错配，例如，选自g-a， c-a，u-c，a-a，g-g，c-c和u-u中的1、2、3、4、5、6、7种错配。
[0133]
通过drna和靶标rna之间的杂交形成的dsrna中的错配核苷酸可以形成凸起，其可以提高靶标rna的编辑效率。可能存在一个(仅在靶标腺苷处形成)或更多个由错配形成的凸起。额外的诱发凸起的错配可以在靶标腺苷的上游和/或下游。所述凸起可以是单错配凸起(由一个错配的碱基对引起)或多错配的凸起(由多于一个连续的错配碱基对引起，优选两个或三个连续的错配碱基对)。
[0134]
drna中的互补rna序列是单链的。所述drna可以是完全单链的或具有一个或多个(例如，1、2、3或更多个)双链区和/或一个或多个茎环区。在一些实施方案中，互补rna序列是至少约40、45、50、55、60、65、70、75、 80、90、100、110、120、130、140、150、160、170、180、190、200或更多个核苷酸中的任何一项。在某些实施方案中，互补rna序列的长度为 40-260、45-250、50-240、60-230、65-220、70-220、70-210、70-200、70-190、70-180、70-170、70-160、70-150、70-140、70-130、70-120、70-110、70-100、 70-90、70-80、75-200、80-190、85-180、90-170、95-160、100-200、100-150、 100-175、110-200、110-175、110-150或105-140个核苷酸中的任一项。在一些实施方案中，互补rna序列为约71个核苷酸长。在一些实施方案中，互补 rna序列为约111个核苷酸长。
[0135]
在一些实施方案中，除互补rna序列外，drna还可包含用于稳定drna 的区域，例如，一个或多个双链区和/或茎环区。在一些实施方案中，drna 的双链区或茎环区可包含不超过约200、150、100、50、40、30、20、10个或更少个碱基对中的任一项。在一些实施方案中，drna不包含茎环或双链区。在一些实施方案中，drna包含adar募集结构域。在一些实施方案中， drna不包含adar募集结构域。
[0136]
所述drna可包含一个或多个修饰。在一些实施方案中，drna具有一个或多个经修饰的核苷酸，包括核碱基修饰和/或骨架修饰。对rna的示例性修饰包括但不限于：硫代磷酸酯骨架修饰，核糖中的2'-取代(例如2'-o-甲基和2'-氟取代)，lna和l-rna。在一些实施方案中，所述drna不具有对核碱基或骨架的修饰。
[0137]
本技术还考虑包含本文所述drna的构建体。如本文所用的术语“构建体”是指包含编码核苷酸序列的dna或rna分子，所述编码核苷酸序列可以转录成rna或表达成蛋白质。在一些实施方案中，所述构建体含有一个或多个调控元件，其可操作地连接于编码rna或蛋白质的核苷酸序列。当所述构建体被引入宿主细胞时，在合适的条件下，所述构建体中的编码核苷酸的序列可以被转录或表达。
[0138]
在一些实施方案中，所述构建体包含与编码核苷酸序列可操作地连接或空间连接的启动子，使得所述启动子控制编码核苷酸序列的转录或表达。所述启动子可位于其控制下的编码核苷酸序列的5'侧(上游)。所述启动子和编码序列之间的距离可以与该启动子与其起源于启动子的基因中它控制的基因之间的距离大致相同。如本领域所知，可以适应该距离的变化而不丧失启动子功能。在一些实施方案中，所述构建体包含5'utr和/或3'utr，其调节编码核苷酸序列的转录或表达。
[0139]
在一些实施方案中，所述构建体是编码本技术中公开的任何一种drna 的载体。术语“载体”是指能够转运与其连接的另一种核酸的核酸分子。所述载体包括但不限于单链，双链或部分双链的核酸分子；包含一个或多个游离末端的，没有游离末端的(例如环状)核酸分子；包含dna，rna或两者的核酸分子；以及本领域已知的其他多核苷酸种类。一种类型的载体是“质粒”，它是指环状的双链dna环，其中可以插入额外的dna区段，例如通过标准分子克隆技术。某些载体能够在引入它们的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到宿主细胞的基因组中，由此与宿主基因组一起复制。此外，某些载体能够指导它们可操作地连接的编码核苷酸序列的转录或表达。此类载体在本文中称为“表达载体”。
[0140]
所述重组表达载体可以包含适合于在宿主细胞中转录或表达核酸的形式的本发
明的核酸。在一些实施方案中，所述重组表达载体包括一种或多种调节元件，其可以基于待用于转录或表达的宿主细胞进行选择，其与待转录或表达的核酸序列可操作地连接。在所述重组表达载体内，“可操作地连接”旨在表示感兴趣的核苷酸序列以允许核苷酸序列表达的方式与调节元件连接(例如在体外的或在宿主细胞中的转录/翻译系统中，当载体被引入所述宿主细胞时)。
[0141]
在一些实施方案中，提供了构建体(例如，载体，例如病毒载体)，其包含编码drna的核苷酸序列。在一些实施方案中，提供了构建体(例如，载体，诸如病毒载体)，其包含编码所述adar的核苷酸序列。在一些实施方案中，提供了构建体，其包含编码所述drna的第一核苷酸序列和编码所述adar 的第二核苷酸序列。在一些实施方案中，第一核苷酸序列和第二核苷酸序列与相同的启动子可操作地连接。在一些实施方案中，第一核苷酸序列和第二核苷酸序列与不同的启动子可操作地连接。在一些实施方案中，所述启动子是可诱导的。在一些实施方案中，所述构建体不编码adar。在一些实施方案中，载体还包含编码adar3的抑制剂(例如，adar3 shrna或sirna)和/ 或干扰素的刺激物(例如，ifn-α)的核酸序列。在一些实施方案中，构建体是 aav，诸如aav8。
[0142]
治疗方法
[0143]
本文所述的rna编辑方法和组合物可用于治疗或预防个体的疾病或病症，包括但不限于：遗传性的基因疾病以及耐药性。
[0144]
在一些实施方案中，提供了一种离体编辑个体(例如人类个体)细胞中的靶标rna的方法，包括使用本文所述的任何一种rna编辑方法编辑靶标 rna。
[0145]
在一些实施方案中，提供了一种离体编辑个体(例如人类个体)细胞中的靶标rna的方法，包括将drna或编码该drna的构建体引入个体的细胞中，其中所述drna包含与靶标rna杂交的互补rna序列，并且其中所述drna 能够募集adar以使靶标rna中的靶标a脱氨基。在一些实施方案中，所述靶标rna与个体的疾病或病症相关。在一些实施方案中，所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变(例如，抗药性)相关的疾病或病症。在一些实施方案中，该方法还包含从个体获得细胞。
[0146]
在一些实施方案中，提供了一种在患有疾病或病症的个体的细胞中恢复靶标rna或由靶标rna编码的蛋白质的表达或活性的方法，包括使用本文所述的rna编辑方法的任何一种方法编辑靶标rna，其中靶标rna具有与疾病或病症相关的g至a突变。在一些实施方案中，该方法离体在来自个体的分离的细胞上进行。在一些实施方案中，该方法在体内进行。
[0147]
在一些实施方案中，提供了治疗或预防个体(例如，人类个体)中的疾病或病症的方法，包含使用本文描述的rna编辑方法的任何一种编辑个体细胞中与疾病或病症相关的靶标rna。
[0148]
在一些实施方案中，提供了治疗或预防个体(例如，人类个体)中的疾病或病症的方法，包括将drna或编码该drna的构建体引入从个体离体的分离细胞中，其中所述drna包含与和疾病或病症相关的靶标rna杂交的互补 rna序列，并且其中所述drna能够募集adar以使靶标rna中的靶标a脱氨基。在一些实施方案中，所述adar是分离细胞中的内源表达的adar。在一些实施方案中，该方法包含将adar或编码该adar的构建体引入分离的细胞。在一些实施方案中，该方法还包含培养具有经编辑的rna的细胞。在一些实施方案中，该方法还包含向个体施用具有经编辑的rna的细胞。在一些实施方案中，所述疾病或病症是遗传性的
基因疾病或与一种或多种获得性基因突变(例如抗药性)相关的疾病或病症。
[0149]
在一些实施方案中，提供了治疗或预防个体(例如，人类个体)中的疾病或病症的方法，包含将drna或编码该drna的构建体引入从个体离体的分离细胞中，其中所述drna包含与和疾病或病症相关的靶标rna杂交的互补rna序列，并且其中所述drna能够募集宿主细胞的内源表达的adar以使所述靶标rna中的靶标a脱氨基。在一些实施方案中，该方法还包含培养具有经编辑的rna的细胞。在一些实施方案中，该方法还包含向个体施用具有经编辑的rna的细胞。在一些实施方案中，所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变(例如抗药性)相关的疾病或病症。
[0150]
在一些实施方案中，提供了治疗或预防个体(例如，人类个体)中的疾病或病症的方法，包含向个体施用有效量的drna或编码该drna的构建体，其中所述drna包含与和疾病或病症相关的靶标rna杂交的互补rna序列，并且其中所述drna能够募集adar以使靶标rna中的靶标a脱氨基。在一些实施方案中，所述adar是个体细胞中的内源表达的adar。在一些实施方案中，该方法包含向个体施用adar或编码该adar的构建体。在一些实施方案中，所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变 (例如抗药性)相关的疾病或病症。
[0151]
适用于使用本技术的方法治疗的疾病和病症包括与突变相关的疾病，诸如g至a突变，例如导致rna转录物中的错义突变，过早的终止密码子，异常剪接或可变剪接的g至a突变。可以通过本技术的方法恢复的与疾病相关的突变的例子包括但不限于与癌症相关的tp53
w53x
(例如，158g》a)，i型粘多糖贮积病(mps i)与idua
w402x
(例如，外显子9中的tgg》tag突变)，与埃勒斯
ꢀ‑
当洛斯综合征相关的col3a1
w1278x
(例如3833g》a突变)，与原发性肺动脉高压相关的bmpr2
w298x
(例如893g》a)，与朱伯特综合征相关的ahi1
w725x
(例如 2174g》a)，与范科尼贫血相关的fancc
w506x
(例如1517g》a)，与原发性家族性肥厚性心肌病相关的mybpc3
w1098x
(例如3293g》a)，和与x染色体连锁性严重联合免疫缺陷症相关的il2rg
w237x
(例如710g》a)。在一些实施方案中，疾病或病症是癌症。在一些实施方案中，该疾病或病症是单基因疾病。在一些实施方案中，该疾病或病症是多基因疾病。
[0152]
在一些实施方案中，提供了治疗与个体中具有突变(例如，g》a突变)的靶标rna相关的癌症的方法，其包括将drna或编码drna的构建体引入从个体离体的分离细胞中，其中drna包含与靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的 adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是tp53
w53x
(例如158g》a)。在一些实施方案中，drna包含seq id no：195、196或197的核酸序列。
[0153]
在一些实施方案中，提供了一种用个体中具有突变(例如，g》a突变)的靶标rna治疗或预防癌症的方法，其包括向个体施用有效量的drna或编码该drna的构建体。其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar使靶标rna中的靶标a脱氨基，从而拯救靶标rna的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码 adar的构建体。在一些实施方案中，靶标rna是tp53
w53x
(例如158g》a)。在一些实施方案中，drna包含seq id no：195、196或197的核酸序列。
[0154]
在一些实施方案中，提供了一种治疗与个体中具有突变(例如，g》a突变)的靶标rna相关的mps i(例如，hurler综合征或scheie综合征)的方法，包括drna或将编码drna的构建体引入从个体离体的分离细胞中，其中drna 包含与靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此而拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是idua
w402x
(例如，外显子9中的tgg＞tag突变)。在一些实施方案中，drna包含seq id no：204或205的核酸序列。
[0155]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防mps i(例如，hurler综合征或scheie综合征)的方法，包括向个体施用有效量的drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar 以使靶标rna中的靶标a脱氨基，由此拯救了靶标rna中的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna是idua
w402x
(例如，外显子9中的tgg＞tag突变)。在一些实施方案中，drna包含seq id no：204或205的核酸序列。
[0156]
在一些实施方案中，提供了一种治疗或预防个体中与具有突变(例如， g》a突变)的靶标rna相关的埃勒斯-当洛斯综合征的方法，其包括drna或编码drna的构建体引入从个体离体的分离细胞中，其中drna包含与靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨，由此拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar 或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是 col3a1
w1278x
(例如3833g》a突变)。在一些实施方案中，drna包含seq idno：198的核酸序列。
[0157]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防埃勒斯-当洛斯综合征的方法，其包括向个体施用有效量的 drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标 rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar 是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna是 col3a1
w1278x
(例如3833g》a突变)。在一些实施方案中，drna包含seq idno：198的核酸序列。
[0158]
在一些实施方案中，提供了一种治疗与个体中具有突变(例如，g》a突变)的靶标rna相关的原发性肺动脉高压的方法，其包括将drna或编码 drna的构建体引入从离个体体的分离细胞，其中drna包含与靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标 a脱氨基，从而拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是 bmpr2
w298x
(例如，893g》a)。在一些实施方案中，drna包含seq id no： 199的核酸序列。
[0159]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防原发性肺动脉高压的方法，其包括向个体施用有效量的 drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标 rna杂交的互补rna序列，并且其中drna能够募集
adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用 adar或编码adar的构建体。在一些实施方案中，靶标rna是bmpr2
w298x (例如，893g》a)。在一些实施方案中，drna包含seq id no：199的核酸序列。
[0160]
在一些实施方案中，提供了治疗与个体中具有突变(例如，g》a突变)的靶标rna有关的朱伯特综合征的方法，其包括将drna或编码drna的构建体引入从个体离体的分离细胞，其中drna包含与靶标rna杂交的互补rna 序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是ahi1
w725x
(例如 2174g》a)。在一些实施方案中，drna包含seq id no：200的核酸序列。
[0161]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防朱伯特综合征的方法，其包括向个体施用有效量的drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a 脱氨，由此拯救靶标rna中的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna是ahi1
w725x
(例如 2174g》a)。在一些实施方案中，drna包含seq id no：200的核酸序列。
[0162]
在一些实施方案中，提供了治疗与个体中具有突变(例如，g》a突变)的靶标rna相关的范科尼贫血的方法，其包括将drna或编码drna的构建体引入从个体离体的分离细胞中，其中drna包含与靶标rna杂交的互补rna 序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是fancc
w506x
(例如1517g ＞a)。在一些实施方案中，drna包含seq id no：201的核酸序列。
[0163]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防范科尼贫血的方法，其包括向个体施用有效量的drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna是fancc
w506x
(例如 1517g＞a)。在一些实施方案中，drna包含seq id no：201的核酸序列。
[0164]
在一些实施方案中，提供了一种治疗与个体中具有突变(例如，g》a突变)的靶标rna相关的原发性家族性肥厚性心肌病的方法，其包括将drna或编码drna的构建体引入从个体离体的分离细胞，其中drna包含与靶标 rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar 是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar 或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标rna是 mybpc3
w1098x
(例如3293g＞a)。在一些实施方案中，drna包含seq id no： 202的核酸序列。
[0165]
在一些实施方案中，提供了用个体中具有突变(例如，g》a突变)的靶标 rna治疗或预防原发性家族性肥厚性心肌病的方法，其包括向个体施用有效量的drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna 中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar 是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna是 mybpc3
w1098x
(例如3293g＞a)。在一些实施方案中，drna包含seq id no： 202的核酸序列。
[0166]
在一些实施方案中，提供了一种治疗与个体中具有突变(例如，g》a突变)的靶标rna有关的x染色体连锁性严重联合免疫缺陷的方法，其包括 drna或编码drna的构建体引入从个体离体的分离细胞，其中drna包含与靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标 rna中的靶标a脱氨，由此拯救靶标rna中的突变。在一些实施方案中， adar是分离的细胞中内源表达的adar。在一些实施方案中，该方法包括将adar或编码adar的构建体引入分离的细胞。在一些实施方案中，靶标 rna是il2rg
w237x
(例如710g》a)。在一些实施方案中，drna包含seq idno：203的核酸序列。
[0167]
在一些实施方案中，提供了一种用个体中具有突变(例如，g》a突变)的靶标rna治疗或预防的x染色体连锁性严重联合免疫缺陷的方法，包括向个体施用有效量的drna或编码drna的构建体，其中drna包含与与疾病或病症相关的靶标rna杂交的互补rna序列，并且其中drna能够募集adar以使靶标rna中的靶标a脱氨基，由此拯救靶标rna中的突变。在一些实施方案中，adar是个体细胞中内源表达的adar。在一些实施方案中，该方法包括向个体施用adar或编码adar的构建体。在一些实施方案中，靶标rna 是il2rg
w237x
(例如710g》a)。在一些实施方案中，drna包含seq id no： 203的核酸序列。
[0168]
如本文所用，“治疗(treatment)”或“治疗(treating)”是用于获得包括临床结果的有益或期望结果的方法。出于本发明的目的，有益的或期望的临床结果包括但不限于以下一种或多种：减少由疾病引起的另外一种症状，减少疾病的程度，稳定化疾病(例如，预防或延迟疾病的恶化)，预防或延迟疾病的传播(例如，转移)，预防或延迟疾病的发生或复发，延缓或减缓疾病的进展，改善疾病症态，提供缓解(无论是部分的还是全部的)疾病，减少治疗疾病所需的一种或多种其他药物的剂量，延迟疾病的进展，提高生活质量和 /或延长生存期。“治疗”还包括减少疾病或病症的病理后果。本发明的方法考虑了这些治疗方面中的任何一个或多个。
[0169]
术语“个体”，“受试者”和“患者”在本文中可互换使用以描述哺乳动物，包括人类。所述个体包括但不限于：人类，牛，马，猫，犬，啮齿类动物或灵长类动物。在一些实施方案中，所述个体是人。在一些实施方案中，所述个体患有疾病或病症，例如耐药性。在一些实施方案中，所述个体需要治疗。
[0170]
如本领域所理解的，“有效量”是指足以产生所需治疗结果的组合物(例如，drna或编码该drna的构建体)的量(例如，降低疾病或病症的一种或多种症状的严重性或持续时间，稳定疾病或病症的一种或多种症状的严重程度，或消除疾病或病症的一种或多种症状)。对于治疗用途，有益的或期望的结果包括例如减少由疾病引起的一种或多种症状(生物化学的，组织学的和/或行为学的)，包括其在疾病发展期间呈现的并发症和中间病理表型，提高那些患有疾病或病症的人的生活质量，减少治疗疾病所需的其他药物的剂量，增强
另一种药物的效果，延迟疾病的进展和/或延长患者的存活。
[0171]
通常，组合物的剂量，时间表和施用途径(例如，drna或编码该drna 的构建体)可以根据个体的大小和状况，并根据标准药学实践来确定。示例性施用途径包括静脉内，动脉内，腹膜内，肺内，囊内，肌肉内，气管内，皮下，眼内，鞘内或透皮。
[0172]
本技术的rna编辑方法不仅可以用于动物细胞，例如哺乳动物细胞，还可以用于修饰植物或真菌的rna，例如，在具有内源表达的adar的植物或真菌中。本文描述的方法可用于产生具有改善性质的基因工程植物和真菌。
[0173]
组合物，试剂盒和制品
[0174]
本文还提供了包含任何一种drna，构建体，文库或具有如本文所述的经编辑的rna的宿主细胞的组合物(例如药物组合物)。
[0175]
在一些实施方案中，提供了药物组合物，其包含本文所述的drna或者编码该drna的构建体的任一种，以及药学上可接受的载体，赋形剂或稳定剂。示例性的药学上可接受的载体，赋形剂和稳定剂已在例如remington'spharmaceutical sciences第16版,osol,a.ed.(1980)中描述。可接受的载体，赋形剂或稳定剂在所用剂量和浓度下对接受者无毒，包括缓冲剂，诸如磷酸盐，柠檬酸盐和其他有机酸；抗氧化剂，包括抗坏血酸和甲硫氨酸；防腐剂 (诸如十八烷基二甲基苄基氯化铵；六甲基氯化铵；苯扎氯铵，苄索氯铵；苯酚，丁基或苄醇；对羟基苯甲酸烷基酯，诸如对羟基苯甲酸甲酯或对羟基苯甲酸丙酯；儿茶酚；间苯二酚；环己醇；3-戊醇；和间甲酚)；低分子量(少于约10个残基)的多肽；蛋白质，如血清白蛋白，明胶或免疫球蛋白；亲水性聚合物，诸如聚乙烯吡咯烷酮；氨基酸，诸如甘氨酸，谷氨酰胺，天冬酰胺，组氨酸，精氨酸或赖氨酸；单糖，二糖和其他碳水化合物，包括葡萄糖，甘露糖或糊精；螯合剂诸如edta；糖类，诸如蔗糖，甘露醇，海藻糖或山梨糖醇；成盐的反离子诸如钠；金属络合物(例如锌蛋白复合物)；和/或非离子表面活性剂，诸如tween
tm
，pluronics
tm
或聚乙二醇(peg)。在一些实施方案中，提供了冻干制剂。用于体内施用的药物组合物必须是无菌的。这可以通过例如通过无菌过滤膜过滤而容易地实现。进一步提供了可用于本文所述的rna编辑方法或治疗方法中的任一种的试剂盒或制品，其包含如本文所述的任何一种drna，构建体，组合物，文库或者经编辑的宿主细胞。
[0176]
在一些实施方案中，提供了用于编辑宿主细胞中的靶标rna的试剂盒，其包含drna，其中所述drna包含与靶标rna杂交的互补rna序列，其中所述drna能够募集adar以使靶标rna中的a脱氨基。在一些实施方案中，所述试剂盒还包含adar或编码adar的构建体。在一些实施方案中，试剂盒进一步包含adar3的抑制剂或其构建体。在一些实施方案中，试剂盒进一步包含干扰素的刺激物或其构建体。在一些实施方案中，所述试剂盒还包括用于实施本文所述的任何一种rna编辑方法的说明书。
[0177]
本技术的试剂盒处于合适的包装中。合适的包装包括但不限于：小瓶，瓶子，广口瓶，软包装(例如，密封的聚酯薄膜或塑料袋)等。试剂盒可选地提供额外的组分，例如转染或转导试剂，细胞培养基，缓冲液和解释性信息。
[0178]
因此，本技术还提供了制品。所述制品可包括容器和容器上或与容器相关的标签或包装说明书。合适的容器包括小瓶(例如密封的小瓶)，瓶子，罐子，软包装等。在一些实施方案中，所述容器容纳药物组合物，并且可以具有无菌进入口(例如，所述容器可以是静脉内溶液袋或具有可由皮下注射针刺穿的塞子的小瓶)。容纳药物组合物的容器可以是多次
使用的小瓶，其允许重组制剂的重复施用(例如2-6次施用)。包装说明书是指通常包括在治疗产品的商业包装中的说明书，其包含关于使用这些产品的适应症，用法，剂量，施用，禁忌症和/或警告的信息。另外，所述制品还可包含第二容器，其包含药学上可接受的缓冲液，例如抑菌性注射用水(bwfi)，磷酸盐缓冲盐水，林格氏溶液和右旋糖溶液。它还可以包括从商业和用户角度所需的其他材料，包括其他缓冲剂，稀释剂，过滤器，针头和注射器。
[0179]
所述试剂盒或制品可包括多个单位剂量的药物组合物和使用说明书，其以足以在药房(例如，医院药房以及配药药房)中储存和使用的量包装。
[0180]
示例性实施方案
[0181]
在本文提供的实施方案中是：
[0182]
1.一种用于在宿主细胞中编辑靶标rna的方法，包括将脱氨酶募集 rna(drna)或编码所述drna的构建体引入宿主细胞，其中所述drna包含与所述靶标rna杂交的互补rna序列，并且其中所述脱氨酶募集rna能够募集作用于rna的腺苷脱氨酶(adar)以使所述靶标rna中的靶标腺苷脱氨基。
[0183]
2.如实施方案1所述的方法，其中所述rna序列包含与所述靶标rna中的所述靶腺苷正对的胞苷，腺苷或尿苷。
[0184]
3.如实施方案2所述的方法，其中所述rna序列包含与所述靶标rna中的所述靶腺苷正对的胞苷错配。
[0185]
4.如实施方案3所述的方法，其中所述胞苷错配位于所述drna中距所述互补序列的3'端至少20个核苷酸，并且距所述互补序列的5'端至少5个核苷酸。
[0186]
5.如实施方案4所述的方法，其中所述胞苷错配位于所述drna中所述互补序列中心(例如，在中心)的10个核苷酸内。
[0187]
6.如实施方案1-5中任一项所述的方法，其中所述rna序列进一步包含一个或多个鸟苷，其各自与所述靶标rna中的非靶腺苷相对。
[0188]
7.如实施方案1-6中任一项所述的方法，其中所述互补序列包含与所述靶标rna中的非靶腺苷相对的两个或更多个连续错配核苷酸。
[0189]
8.如实施方案1-7中任一项所述的方法，其中所述靶标rna中所述靶标腺苷的5'侧最近邻位是选自u，c，a和g的核苷酸，优先度u＞c≈a＞g，而所述靶标rna中所述靶标腺苷的3'侧最近邻位是选自g，c，a和u的核苷酸，优先度g＞c＞a≈u。
[0190]
9.如实施方案1至8中任一项所述的方法，其中所述靶标rna中的所述靶标腺苷位于选自：uag，uac，uaa，uau，cag，cac，caa，cau， aag，aac，aaa，aau，gag，gac，gaa和gau构成的组的三碱基基序中。
[0191]
10.如实施方案9所述的方法，其中所述三碱基基序是uag，并且其中所述脱氨酶募集rna包含与所述三碱基基序中的尿苷正对的a，与所述靶腺苷正对的胞苷，以及与所述三碱基基序中的鸟苷正对胞苷，鸟苷或尿苷。
[0192]
11.如实施方案1-10中任一项所述的方法，其中所述脱氨酶募集rna的长度为约40-260个核苷酸。
[0193]
12.如实施方案11所述的方法，其中所述脱氨酶募集rna的长度为约 60-230个核苷酸。
[0194]
13.如实施方案11或12所述的方法，其中所述drna的长度大于约70个核苷酸。
[0195]
14.如实施方案11-13中任一项所述的方法，其中所述drna的长度为约 100至约150(例如，约110-150)个核苷酸。
[0196]
15.如实施方案1-14中任一项所述的方法，其中所述靶标rna是选自：由前信使rna，信使rna，核糖体rna，转移rna，长非编码rna和小rna 构成的组的rna。
[0197]
16.如实施方案15所述的方法，其中所述靶标rna是前信使rna。
[0198]
17.如实施方案1-16中任一项所述的方法，其中所述adar由所述宿主细胞内源表达。
[0199]
18.如实施方案1-16中任一项所述的方法，其中所述adar对于所述宿主细胞是外源的。
[0200]
19.如实施方案18所述的方法，其进一步包括将所述adar引入所述宿主细胞。
[0201]
20.如实施方案18或19所述的方法，其中所述adar包含e1008突变。
[0202]
21.如实施方案1-20中任一项所述的方法，其中所述脱氨酶募集rna是单链rna。
[0203]
22.如实施方案1-20中任一项所述的方法，其中所述互补rna序列是单链的，并且其中所述脱氨酶募集rna还包含一个或多个双链区。
[0204]
23.如实施方案1-22中任一项所述的方法，其中所述drna不包含 adar-募集结构域(例如，dsb结合结构域，glur2结构域或ms2结构域)。
[0205]
24.如实施方案1-23中任一项所述的方法，其中所述drna不包含化学修饰的核苷酸(例如，2
’‑
o-甲基或硫代磷酸酯修饰)。
[0206]
25.如实施方案24所述的方法，其包括将编码所述drna的构建体引入所述宿主细胞，其中所述构建体是病毒载体(例如，慢病毒载体)或质粒。
[0207]
26.如实施方案1-25中任一项所述的方法，其中所述靶标rna中靶标腺苷的脱氨基导致靶标rna中的错义突变，过早的终止密码子，异常剪接或可变剪接，或者所述靶标rna中的错义突变，过早的终止密码子，异常剪接或可变剪接的回复。
[0208]
27.如实施方案26所述的方法，其中所述靶标rna中的靶标腺苷的脱氨基作用导致所述靶标rna编码的蛋白质的点突变、截短、延伸和/或错误折叠；或者凭借所述靶标rna中的错义突变、过早的终止密码子、异常剪接或可变剪接的回复导致有功能的、全长的、正确折叠的和/或野生型的蛋白。
[0209]
28.如实施方案1-27中任一项所述的方法，其中所述宿主细胞是真核细胞。
[0210]
29.如实施方案28所述的方法，其中所述宿主细胞是哺乳动物细胞。
[0211]
30.如实施方案29所述的方法，其中所述宿主细胞是人或小鼠细胞。
[0212]
31.如实施方案29或30所述的方法，其中所述adar是adar1和/或 adar2。
[0213]
32.如实施方案1-31中任一项所述的方法，其中所述宿主细胞是原代细胞。
[0214]
33.如实施方案32所述的方法，其中所述宿主细胞是t细胞。
[0215]
34.如实施方案32所述的方法，其中所述宿主细胞是有丝分裂后细胞。
[0216]
35.如实施方案1-34中任一项所述的方法，其进一步包括将adar3的抑制剂引入所述宿主细胞。
[0217]
36.如实施方案1-35中任一项所述的方法，其进一步包括将干扰素的刺激物引入所述宿主细胞。
[0218]
37.如实施方案1-36中任一项所述的方法，包括引入各自靶向不同靶标 rna的多
个drna。
[0219]
38.如实施方案1-37中任一项所述的方法，其中所述编辑靶标rna的效率为至少约5％(例如，至少约10％，20％或30％)。
[0220]
39.如实施方案1-38中任一项所述的方法，其中所述drna不诱导免疫应答。
[0221]
40.凭借如实施方案1-39中任一项所述的方法产生的经编辑的rna或具有经编辑的rna的宿主细胞。
[0222]
41.一种用于治疗或预防个体的疾病或病症的方法，其包括根据实施方案1-39中任一项的方法编辑与个体细胞中的疾病或病症相关的靶标rna。
[0223]
42.如实施方案41所述的方法，其中所述疾病或病症是遗传性的基因疾病或与一种或多种获得性基因突变相关的疾病或病症。
[0224]
43.如实施方案41或42所述的方法，其中所述靶标rna具有g至a突变。
[0225]
44.如实施方案41-43中任一项所述的方法，其中所述疾病或病症是单基因疾病或病症。
[0226]
45.如实施方案41-44中任一项所述的方法，其中所述疾病或病症是多基因疾病或病症。
[0227]
46.如实施方案41-45中任一项所述的方法，其中：
[0228]
(i)所述靶标rna是tp53，并且所述疾病或病症是癌症；
[0229]
(ii)所述靶标rna是idua，并且所述疾病或病症是i型粘多糖贮积病 (mps i)；
[0230]
(iii)所述靶标rna是col3a1，并且所述疾病或病症是埃勒斯-当洛斯综合征；
[0231]
(iv)所述靶标rna是bmpr2，并且所述疾病或病症是朱伯特综合征；
[0232]
(v)所述靶标rna是fancc，并且所述疾病或病症是范科尼贫血；
[0233]
(vi)所述靶标rna是mybpc3，并且所述疾病或病症是原发性家族性肥厚性心肌病；或
[0234]
(vii)所述靶标rna是il2rg，并且所述疾病或病症是x染色体连锁性严重联合免疫缺陷。
[0235]
47.一种通过募集作用于rna的腺苷脱氨酶(adar)使靶标rna中的靶标腺苷脱氨基作用的脱氨酶募集rna(drna)，其包含与所述靶标rna杂交的互补rna序列。
[0236]
48.如实施方案47所述的脱氨酶募集rna，其中所述rna序列包含与所述靶标rna中的所述靶标腺苷正对的胞苷，腺苷或u。
[0237]
49.如实施方案48所述的drna，其中所述rna序列包含与所述靶标 rna中的靶标腺苷正对的胞苷错配。
[0238]
50.如实施方案49所述的drna，其中所述胞苷错配位于所述drna中距所述互补序列的3'端至少20个核苷酸，和距所述互补序列的5'端至少5个核苷酸。
[0239]
51.如实施方案50所述的drna，其中所述胞苷错配位于所述drna中互补序列中心(例如，在中心)的10个核苷酸内。
[0240]
52.如实施方案47-51中任一项所述的脱氨酶募集rna，其中所述rna 序列进一步包含一个或多个鸟苷，其各自与所述靶标rna中的非靶标腺苷正对。
[0241]
53.如实施方案47-51中任一项所述的drna，其中所述互补序列包含与所述靶标rna中的非靶标腺苷相对的两个或更多个连续错配核苷酸。
[0242]
54.如实施方式47-53中任一项所述的脱氨酶募集rna，其中所述靶标 rna中的所述靶标腺苷位于选自：由uag，uac，uaa，uau，cag，cac， caa，cau，aag，aac，aaa，aau，gag，gac，gaa和gau构成的组的三碱基基序中。
[0243]
55.如实施方案54所述的脱氨酶募集rna，其中所述三碱基基序是 uag，并且其中所述drna包含与所述三碱基基序中的尿苷正对的腺苷，与所述靶腺苷正对的胞嘧啶，以及与所述三碱基基序中的鸟苷正对的胞苷、鸟苷或尿苷。
[0244]
56.如实施方案55所述的脱氨酶募集rna，其中所述三碱基基序是所述靶标rna中的uag，并且其中所述脱氨酶募集rna包括与所述靶标rna的 uag相对的acc，acg或acu。
[0245]
57.如实施方案47-56中任一项所述的脱氨酶募集rna，其中脱氨酶募集 rna的长度为约40-260个核苷酸。
[0246]
58.如实施方案57所述的drna，其中所述drna的长度为约70个核苷酸。
[0247]
59.如实施方案57或58所述的drna，其中所述drna的长度为约100至约150个核苷酸(例如，约110-150个)。
[0248]
60.如实施方案47-59中任一项所述的drna，其中所述drna不包含 adar募集结构域(例如，dsb结合结构域，glur2结构域或ms2结构域)。
[0249]
61.如实施方案47-60中任一项所述的drna，其中所述drna不包含化学修饰的核苷酸(例如，2'-o-甲基或硫代磷酸酯修饰)。
[0250]
62.一种编码实施方案47-61中任一项所述的脱氨酶募集rna的构建体。
[0251]
63.如实施方案62所述的构建体，其中所述构建体是病毒载体(例如，慢病毒载体)或质粒。
[0252]
64.一种文库，其包含实施方案47-61中任一项所述的多个脱氨酶募集 rna或实施方案62或63所述的构建体。
[0253]
65.一种组合物，其包含实施方案47-61中任一项所述的脱氨酶募集 rna，实施方案62或63所述的构建体，或实施方案64所述的文库。
[0254]
66.一种宿主细胞，其包含实施方案47-61中任一项所述的脱氨酶募集 rna或实施方案62或63所述的构建体。
[0255]
67.如实施方案66所述的宿主细胞，其中所述宿主细胞是真核细胞。
[0256]
68.如实施方案66或67所述的宿主细胞，其中所述宿主细胞是原代细胞。
[0257]
69.一种用于在宿主细胞中编辑靶标rna的试剂盒，其包含脱氨酶募集 rna，其中所述脱氨酶募集rna包含与所述靶标rna杂交的互补rna序列，其中所述脱氨酶募集rna能够募集adar以使所述靶标rna中的靶标腺苷脱氨基。
实施例
[0258]
下面的实施例仅是本技术的示例，因此不应以任何方式被认为限制本发明。通过示例而非限制的方式提供以下实施例和详细描述。
[0259]
材料和方法
[0260]
质粒构建
[0261]
通过pcr扩增mcherry和egfp(egfp第一密码子atg缺失)编码dna来克隆双荧光报道分子，在pcr期间通过引物添加3
×
gs接头和打靶的dna序列。然后通过ii型限制酶bsmb1
(thermo)和t4 dna连接酶(neb)切割和连接 pcr产物，然后将其插入plenti骨架中(plenti-cmv-mcs-sv-bsd，stanleycohen lab，stanford university)。
[0262]
从lbu质粒(addgene#83485)pcr扩增dlbucas13 dna。adar1dd和 adar2dd从adar1(p150)cdna和adar2 cdna中扩增，这两种cdna都来自厦门大学的汉氏实验室。通过重叠pcr将adar1dd或adar2dd与 dlbucas13 dna融合，并将融合的pcr产物插入plenti骨架中。
[0263]
为了在哺乳动物细胞中表达drna，直接合成drna序列(针对短drna) 并通过合成重叠的ssdna进行退火或pcr扩增，并通过golden-gate克隆将产物克隆到u6表达下的相应载体中。
[0264]
从adar1(p150)cdna中pcr扩增全长adar1(p110)和adar1(p150)，并从 adar2 cdna中pcr扩增全长adar2，然后将其克隆到plenti骨架中。
[0265]
对于三种版本的双荧光报道分子(报道分子-1，-2和-3)，mcherry和egfp (egfp的起始密码子atg被删除)编码序列进行pcr扩增，使用bsmbi (thermo fisher scientific，er0452)消化，然后用t4 dna连接酶(neb， m0202l)介导的与ggggs接头的连接。随后将连接产物插入 plenti-cmv-mcs-puro主链。
[0266]
对于表达dlbucas13-adar dd
(e1008q)的构建体，从adar1
p150
构建体 (来自厦门大学韩家淮实验室的赠予)扩增了adar1
dd
基因。通过pcr从 lbu_c2c2_r472a_h477a_r1048a_h1053a质粒(addgene#83485)扩增了 dlbucas13基因。通过重叠pcr生成adar1
dd
(高活性e1008q变体)，然后融合至dlbucas13。将连接产物插入plenti-cmv-mcs-bsd主链。
[0267]
对于表达arrna的构建体，合成arrna的序列并将金门(golden-gate) 克隆到plenti-sgrna-lib 2.0(addgene#89638)主链中，并且由hu6启动子驱动arrna的转录。对于表达adar的构建体，从adar1
p150
构建体中扩增出全长adar1
p110
和adar1
p150
，并从adar2构建体中扩增出全长adar2(厦门大学韩家淮实验室的赠予)。然后将扩增的产物克隆到 plenti-cmv-mcs-bsd主链中。对于表达具有致病性突变的基因的构建体， tp53的全长编码序列(从vigenebio订购)和其他6种与疾病相关的基因 (col3a1，bmpr2，ahi1，fancc，mybpc3和il2rg，来自中国医学科学院病原生物学研究所的王建伟实验室的赠予)通过诱变pcr从编码具有引入 g》a突变的相应基因的构建体中扩增出。通过gibson克隆方法
59
将扩增产物克隆到plenti-cmv-mcs-mcherry主链中。
[0268]
哺乳动物细胞系和细胞培养
[0269]
哺乳动物细胞系培养达尔伯克改良伊格尔培养基(dulbecco's modifiedeagle medium，10-013-cv，corning，tewksbury，ma，usa)，加入10％胎牛血清(兰州百灵生物技术有限公司，兰州，中国)，在37℃、5％co2下补充以1％青霉素-链霉素。所述adar1-ko细胞系购自edigene china，基因分型结果也由edigene china提供。
[0270]
hela和b16细胞系来自z.jiang的实验室(北京大学)。hek293t细胞系来自c.zhang的实验室(北京大学)。rd细胞系来自j wang的实验室(北京协和医学院和中国医学科学院，病原生物学研究所)。sf268细胞系来自中国医学科学院，基础医学研究所，细胞中心。a549和sw13细胞系来自edigene inc. hepg2，ht29，nih3t3和mef细胞系在我们北京大学的实验室中维护。将这些哺乳动物细胞系在含10％胎牛血清(cellmax，sa201.02)的达尔伯克改良伊格尔培养基(corning，10-013-cv)中培养，并在37℃于5％co2下补充1％青霉素-链霉素。除非另有说明，否则按照制造商的说明用x-tremegene hpdna转染试剂(roche，
06366546001)转染细胞。
[0271]
人原发性肺成纤维细胞(#3300)和人原发性支气管上皮细胞(#3210)购自sciencell research laboratories，inc.，并在成纤维细胞培养基(sciencell， #2301)和支气管上皮细胞培养基(sciencell,#3211)中培养。两种培养基均补充有15％的胎牛血清(bi)和1％的青霉素-链霉素。gm06214和gm01323原代细胞是从卡瑞尔医学研究所(coriell institute for medical research)订购的，并在含15％胎牛血清(bi)和1％青霉素-链霉素的达尔伯克改良伊格尔培养基 (corning，10-013-cv)中培养。将所有细胞在37℃在5％co2下培养。
[0272]
报道系统的转染，facs分析和sanger测序
[0273]
对于双荧光报道编辑实验，将293t-wt细胞或293t-adar1-ko细胞接种在6孔板(6
×
105个细胞/孔)中，24小时后，接种1.5μg报道质粒和1.5μg drna 质粒。根据供应商的方案，使用x-tremegene hp dna转染试剂(06366546001； roche，mannheim，德国)共转染。48至72小时后，收集细胞并进行facs分析。为了进一步确认报道分子mrna编辑，我们使用facs aria流式细胞仪 (bd biosciences)分选来自用报道分子和drna质粒转染的293t-wt细胞的 egfp阳性细胞，然后进行总rna分离(tiangen，dp430)。然后通过 rt-pcr(tiangen，kr103-04)将rna逆转录成cdna，并用相应的引物对(23 个pcr循环)pcr扩增靶标基因座，并纯化pcr产物用于sanger测序。
[0274]
对于adar1(p110)，adar1(p150)或adar2的回复和过表达实验，将293t-wt 细胞或293t-adar1-ko细胞接种于12孔板(2.5
×
105个细胞/孔)中，24小时后，使用x-tremegene hp dna转染试剂(06366546001，roche，mannheim，德国)共转染0.5μg的报道质粒，0.5μg的drna质粒和0.5μg的adar1/2质粒(plenti 骨架作为对照)。48至72小时后，收集细胞并进行facs分析。
[0275]
对于内源mrna实验，将293t-wt细胞接种在6孔板(6
×
105个细胞/孔)中，当约70％汇合时，使用x-tremegene hp dna转染试剂(06366546001，罗氏，曼海姆，德国)转染3μg的drna质粒。72小时后，通过facs收集细胞和分选的gfp阳性或bfp阳性细胞(根据相应的荧光标记物)用于以下的rna分离。
[0276]
人原代t细胞的分离与培养
[0277]
从健康人供体的白细胞分离产物中分离出原代人t细胞。简而言之，通过ficoll离心(dakewei，as1114546)分离外周血单个核细胞(pbmc)，并使用 easysep人t细胞分离试剂盒(stemcell，17951)从pbmc通过磁阴性选择分离t细胞。分离后，将t细胞在x-vivo15培养基，10％fbs和il2(1000u/ml) 中培养，并用cd3/cd28 dynabeads(thermofisher，11131d)刺激2天。健康捐献者的白细胞分离术产品购自allcells llc中国。所有健康的捐助者均提供了知情同意。
[0278]
lenti病毒包装物和报道分子细胞系构建
[0279]
通过x-tremegene hp dna转染试剂将表达质粒与两种病毒包装质粒 pr8.74和pvsvg(addgene)一起共转染到hek293t-wt细胞中。72小时后，收集上清液病毒并储存在-80℃。用慢病毒感染hek293t-wt细胞，72小时后，通过facs分选mcherry阳性细胞并培养以通过有限稀释方法选择出稳定表达具有低egfp背景的双荧光报道系统的单克隆细胞系。
[0280]
对于稳定的报道分子细胞系，将报道分子构建体 (plenti-cmv-mcs-puro骨架)与
两个病毒包装质粒pr8.74和pvsvg一起共转染到hek293t细胞中。72小时后，收集上清病毒并保存在-80℃。用慢病毒感染hek293t细胞，然后通过facs分选mcherry阳性细胞并培养来选择稳定表达无可检测egfp背景的双荧光报道系统的单克隆细胞系。hek293tadar1
–
/
–
和tp53
–
/
–
细胞系是根据以前报道的方法
60
生成的。将靶向adar1的 sgrna和含有cmv驱动的嘌呤霉素抗性基因的pcr扩增供体dna共转染到 hek293t细胞中。然后在转染后7天用嘌呤霉素处理细胞。从嘌呤霉素抗性细胞中分离出单个克隆，然后通过测序和蛋白质印迹进行验证。
[0281]
内源或外源表达转录物的rna编辑
[0282]
为了评估在双荧光报道分子上的rna编辑，将hek293t细胞或 hek293t adar1-/-细胞接种在6孔板中(6
×
105个细胞/孔)。24小时后，将细胞用1.5μg报道分子质粒和1.5μg arrna质粒共转染。为了检查adar1
p110
， adar1
p150
或adar2蛋白表达的影响，通过egfp阳性比率和深度测序来测定编辑效率。
[0283]
将hek293t adar1-/-细胞接种在12孔板中(2.5
×
105个细胞/孔)。24小时后，将细胞与0.5μg报道分子质粒，0.5μg arrna质粒和0.5μgadar1/2质粒 (plenti骨架作为对照)共转染。通过egfp阳性比率和深度测序测定编辑效率。
[0284]
为了评估内源mrna转录物上的rna编辑，将hek293t细胞接种在6孔板中(6
×
105个细胞/孔)。二十四小时后，将细胞用3μg arrna质粒转染。通过深度测序分析编辑效率。
[0285]
为了评估多个细胞系中的rna编辑效率，将8-9
×
104(rd，sf268，hela) 或1.5
×
105(hek293t)个细胞接种在12孔板中。对于难以转染的细胞，例如ht29，a549，hepg2，sw13，nih3t3，mef和b16，将2-2.5
×
105个细胞接种在6孔板中。24小时后，将报道分子和arrna质粒共转染到这些细胞中。通过egfp阳性比率测定编辑效率。
[0286]
为了评估egfp阳性比率，在转染后48至72小时，通过荧光激活细胞分选(facs)分析分选并收集细胞。mcherry信号用作报道分子/表达arrna的细胞的荧光选择标记，计算egfp
+
/mcherry
+
细胞的百分比作为编辑效率的读数。
[0287]
为了ngs定量a至i编辑率，在转染后48至72小时，通过facs测定法分选和收集细胞，然后进行rna分离(tiangen，dp420)。然后，通过 rt-pcr(tiangen，kr103-04)将总rna反转录为cdna，并使用下表中列出的相应引物pcr扩增目标基因座。
[0288]
[0289]
[0290]
[0291]
[0292]
[0293]
[0294]
[0295]
[0296]
[0297][0298]
将pcr产物纯化用于sanger测序或ngs(illumina hiseq x ten)。
[0299]
深度测序
[0300]
对于内源mrna编辑实验，将293t-wt细胞接种在6孔板上(6
×
105个细胞 /孔)，当约70％汇合时，使用x-tremegene hp dna转染试剂(roche)以3μg 的drna转染hek293细胞。72小时后，通过facs分选gfp阳性或bfp阳性细胞(根据相应的荧光标记)，然后进行rna分离。然后通过rt-pcr将分离的 rna逆转录成cdna，并用相应的引物对扩增特异性靶标基因座(23个pcr循环)，并在illumina nextseq上测序。
[0301]
在多个细胞系中进行测试
[0302]
除了hek293t(阳性对照)和hek293t adar1-/-(阴性对照)细胞，选择一种小鼠细胞系(nih3t3)以及源自不同组织和器官的七种人细胞系(rd， hela，sf268，a549，hepg2，ht-29，sw13)进行实验。对于具有较高转染效率的细胞系，将约8-9
×
104个细胞(rd，hela，sf268)或1.5
×
105个 (hek293t)接种到12孔板的每个孔上，至于难以转染的那些(a549，
hepg2， ht-29，sw13，nih3t3)，把2-2.5
×
105个细胞接种于6孔板中。并且将所有这些细胞维持在37℃在达尔伯克改良伊格尔培养基(dmem，corning)中，该培养基补充有10％胎牛血清(fbs，cellmax)和5％co2。24小时后，用x-tremegene hp dna转染试剂(roche)将cg2报道基因和71ntdrna(35-c-35)质粒共转染到不同类型的细胞中。转染后48小时，用胰蛋白酶处理细胞并通过facs(bd)分析。因为具有低转染效率的细胞具有相当少的mcherry和bfp阳性细胞，对于那些铺在6孔板上的细胞，我们将用于facs 分析的总细胞数增加至1
×
105个。
[0303]
针对靶标位点的rna编辑分析
[0304]
对于深度测序分析，使用arrna覆盖序列的靶标位点序列(上游和下游 20-nt)产生索引。使用bwa版本0.7.10-r789对读段进行比对和定量。然后通过samtools对比对bam进行分选，并使用reditools 1.0.4版分析rna编辑位点。参数如下：-u[ag或tc]-t 8-n 0.0-t 6-6-e-d-u。通过费舍尔精确检验 (fisher’s exact test)(p值《0.05)计算出的arrna靶向区域内所有显着的a》g 转化(p值《0.05)都被arrna视为编辑。除靶标腺苷外的转化均为脱靶编辑。同时出现在对照组和实验组中的突变被认为是snp。
[0305]
转录组范围的rna测序分析
[0306]
将具有bfp表达盒的表达对照rna
151
或arrna
151-ppib的质粒转染到 hek293t细胞中。转染后48小时，通过facs富集bfp
+
细胞，并用rnapreppure micro试剂盒(tiangen，dp420)纯化rna。然后使用nebnext聚 (a)mrna磁性分离模块(new england biolabs，e7490)纯化mrna，并用用于 illumina的nebnext ultra ii rna文库制备试剂盒(new england biolabs， e7770)处理，然后使用illumina hiseq x ten平台(2
×
150-bp配对末端；每个样品30g)进行深度测序分析。为了排除转染引起的非特异性作用，我们加入了模拟组，其中仅用转染试剂处理细胞。每个组包含四个副本。
[0307]
生物信息学分析管道由vogel等人
22
引用。使用fastqc进行分析的质量控制，质量修整基于cutadapt(每个读段的前6-bp被修整，最高20-bp被质量修整)。使用awk脚本过滤掉引入的arrna。修剪后，将长度小于90-nt的读段过滤掉。随后，通过star软件
61
将过滤的读段映射到参考基因组 (grch38-hg38)。我们使用gatk haplotypcaller
62
来调用变体。gatk生成的原始vcf文件已通过gatk variantfiltration，bcftools和annovar
63
进行了过滤和注释。在dbsnp，1000genome
64
的变体中，过滤出evs。然后选择每组四个重复的共享变体作为rna编辑位点。将模拟组的rna编辑水平视为背景，通过减去模拟组的变体获得对照rna
151
和arrna
151-ppib的整体靶标。
[0308]
为了评估leaper是否干扰自然的编辑稳态，我们分析了由模拟组和 arrna
151-ppib组(或对照rna
151
组)共享的全局编辑位点。使用pearson相关系数分析评估了天生a-至-i编辑位点的差异rna编辑率。计算了模拟组和 arrna
151-ppib组(或对照rna
151
组)之间编辑率的皮尔森相关性，并在图6中进行了注释。
[0309][0310]
x意指模拟组中每个位点的编辑率；y意指对照rna
151
组(图6a)或 arrna
151-ppib组(图6b)中每个位点的编辑率；σ
x
是x的标准偏差；σy是y的标准偏差；μ
x
是x的平均值；μy是y的平均值；e是期望值。
[0311]
分析rna-seq数据以询问由rna编辑事件诱导的可能的转录变化。使用 hisat2和
vivo装置(btx)在450v电穿孔1ms。然后将细胞转移到温暖的培养基中用于以下测定。
[0321]
α-l-异丁烯酸酶(idua)催化活性测定
[0322]
将收获的细胞离心沉淀重悬并在冰上用在1
×
pbs缓冲液中的28μl 0.5％ triton x-100溶解30分钟。然后将25μl细胞裂解液加入25μl 190μm 4-甲基伞形酮-α-l-艾杜糖醛酸酶底物(cayman，2a-19543-500)中，将其溶解在0.4m 含0.2％triton x-100的甲酸钠缓冲液中，ph 3.5，并在黑暗中在37℃温育90 分钟。加入200μl 0.5m naoh/甘氨酸缓冲液，ph 10.3，淬灭催化反应，然后在4℃下离心2分钟。将上清液转移至96孔板，并使用infinite m200读取器 (tecan)在365nm激发波长和450nm发射波长下测量荧光。
[0323]
实施例1.测试基于报道分子的本发明的rna编辑方法
[0324]
据报道，cas13家族蛋白(c2c2)可以编辑哺乳动物细胞中的rna。我们在多种条件下进一步测试了该系统。首先，我们通过在mcherry和egfp基因之间引入含有终止密码子的3
×
gs接头打靶序列，构建了基于mcherry和 egfp荧光的双荧光报道系统。此外，我们删除了egfp的起始密码子atg，以减少egfp翻译的遗漏。
[0325]
双荧光报道分子-1包含mcherry序列(seq id no：1)，该序列包含3
×
gs 接头和靶标a(seq id no：2)的序列，以及egfp序列(seq id no：3)。
[0326]
atggtgagcaagggcgaggaggataacatggccatcatcaaggagttc atgcgcttcaaggtgcacatggagggctccgtgaacggccacgagttc gagatcgagggcgagggcgagggccgcccctacgagggcacccagac cgccaagctgaaggtgaccaagggtggccccctgcccttcgcctggg acatcctgtcccctcagttcatgtacggctccaaggcctacgtgaagc accccgccgacatccccgactacttgaagctgtccttccccgagggct tcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgacc gtgacccaggactcctccctgcaggacggcgagttcatctacaaggtg aagctgcgcggcaccaacttcccctccgacggccccgtaatgcagaag aagaccatgggctgggaggcctcctccgagcggatgtaccccgagga cggcgccctgaagggcgagatcaagcagaggctgaagctgaaggacg gcggccactacgacgctgaggtcaagaccacctacaaggccaagaag cccgtgcagctgcccggcgcctacaacgtcaacatcaagttggacatc acctcccacaacgaggactacaccatcgtggaacagtacgaacgcgc cgagggccgccactccaccggcggcatggacgagctgtacaag (mcherry的序列) (seq id no:1)
[0327][0327]
(序列包含3
×
gs接头(以斜体且加粗的字符示出)以及靶标a(以加大且加粗的a示出)(seq id no:2)
[0328]
gtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggt cgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcg agggcgagggcgatgccacctacggcaagctgaccctgaagttcatct gcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccc tgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagc agcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagc gcaccatcttcttcaaggacgacggcaactacaagacccgcgccgag gtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaaggg catcgacttcaaggaggacggcaacatcctggggcacaagctggagt acaactacaacagccacaacgtctatatcatggccgacaagcagaaga acggcatcaaggtgaacttcaagatccgccacaacatcgaggacggc agcgtgcagctcgccgaccactaccagcagaacacccccatcggcga cggccccgtgctgctgcccgacaaccactacctgagcacccagtccgc cctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctgg agttcgtgaccgccgccgggatcactctcggcatggacgagctgtaca agtaa(egfp的序列)(seq id no:
3)
[0329]
双荧光报道分子-2包含mcherry序列(seq id no：1)，序列包含3
×
gs接头(显示为斜体且加粗的字符)和靶标a(显示为加大且加粗的a)(seq id no： 4)，以及egfp的序列(seq id no：3)。
[0330][0330]
(序列包含3
×
gs 接头(显示为斜体且加粗的字符)和靶标a(显示为加大且加粗的字符)(seq id no：4)
[0331]
双荧光报道分子-3包含mcherry序列(seq id no：1)，包含1
×
gs接头(显示为斜体且加粗的字符)和靶标a(seq id no：5)的序列，以及egfp的序列 (seq id no：3)。
[0332]32]
(序列包含1
×
gs接头(显示为斜体且加粗的字符)和靶标a(显示为加大且加粗的a)(seq id no：5)
[0333]
我们将mcherry-3
×
gs接头-tag-egfp克隆到plenti骨架中，并将报道质粒装入慢病毒中，感染293t细胞，构建表达双荧光报道基因的稳定细胞系。然后，我们选择具有低egfp荧光背景的单个克隆作为报道系统。我们将 lbucc2c2 crrna指导平铺了28到78个核苷酸长的间隔子横跨打靶腺苷，以测试最佳的crrna设计。我们发现更长的crrna指导赋予更高的egfp阳性效率。引人注目的是，当我们转染打靶的crrna质粒而不共转染任何表达 dc2c2-adardd的质粒时，egfp蛋白基本上被表达。例如，带有下述序列的crrna指导： ggaccaccccaaaaaugaauauaaccaaaacugaacagcuccucgc ccuugcucacuggcagagcccuccagcaucgcgagcaggcgcugcc uccuccgcc(seq id no：6)被赋予了超过25％的egfp阳性效率。这表明终止密码子uag中的腺嘌呤在很大程度上被编辑。相反，随机crrna不能使 egfp阴性细胞呈阳性(图6a，6b和6c)。基于这些结果，我们推断：单个rna 转录物的过表达就可以利用内源adar酶来编辑rna。
[0334]
此外，我们删除了rna指导分子上的支架rna序列，创造了直线的指导rna。我们发现：70核苷酸长的、与带有ac错配的打靶标rna互补的 rna(aaaccgagggaucauaggggacugaauccaccauucuucuccc aaucccugcaacuccuucuuccccugc(seq id no：7)可以有效地使 egfp阴性细胞转化为egfp阳性细胞，而70-nt的随机 rna(ugaacagcuccucgcccuugcucacuggcagagcccuccagca ucgcgagcaggcgcugccuccuccgcc(seq id no：8)不能(图1a，1b， 1c和1d)。因此，我们将该rna指定为drna(脱氨酶募集rna)。为了验证细胞内源性adar可被募集以通过drna进行腺嘌呤脱氨基作用，我们在adar1 p110和adar1 p150双敲除293t细胞系中进行了实验(图6e和6f)。因为adar1 普遍表达，而adar2主要在脑中高水平表达。因此我们提出：通过drna打靶腺嘌呤脱氨基作用主要由adar1而不是adar2介导。正如预期的那样，打靶的 drna不能在293t-adar1-/-细胞中触发egfp表达，但是过表达外源adar1 p110，p150或adar2可以回复293t-adar1-/-细胞中的egfp表达(图1e和1f)，这提示：在293t细胞中，drna可以募集adar1或adar2来介导靶标rna上的腺嘌呤脱氨基作用。此外，我们发现：adar1-p110和adar2具有比adar1-p150 更高的编辑活性(图1g和图6g)，这可能是由于adar1-p110和adar1-p150的不同细胞定位。
[0335]
为了确定egfp的荧光恢复是由打靶的rna编辑事件引起的，我们通过 rt-pcr直接
测量drna介导的报道分子2转录物的编辑，然后进行靶向的 sanger测序和二代测序。测序结果显示：靶标腺嘌呤(a-c错配位点)中的a至 g碱基转化，并且，编辑率可达到13％(图6h和图1h)。此外，我们还在靶标腺嘌呤附近的序列窗口期间观察到略微的a到g编辑，这很可能是由于双链 rna区域增加，之后，我们将尝试用几种策略去除非预期的编辑。
[0336]
实施例2.优化设计drna的因素
[0337]
接下来，我们开始优化drna以实现更高的编辑效率。首先，我们的目的是确定在靶标腺嘌呤相对位置哪个碱基更有利于编辑。以前的研究表明，靶标腺苷的相对的碱基会有效地影响编辑。因此，我们在与靶标a相对的中间位置设计了具有错配n(a，u，c和g)的71nt drna。基于facs结果，我们发现，四种不同的drna有效编辑如下：c》a》u》g(图2a和2b)。最近，据报道，靶标uag位置中的小泡可能有利于编辑效率。因此，我们设计了含有两个或三个错配碱基的靶标uag位点的drna来检验我们的假设。使用 golden gate克隆方法，在具有bfp标记的drna载体上设计和构建了16种不同的71nt drna。我们发现，具有cca和gca序列的drna具有最高的效率，这意味着，小泡对a-i编辑几乎没有贡献，至少在uag靶标位点的情况下。此外，nca序列的四个drna具有较高百分比的gfp阳性细胞，推论出，互补的u-a碱基对可能对adar编辑很重要(图2c和2d)。随后，我们基于报道分子测试不同长度的drna的效率。drna设计为中间位置的错配c，长度范围为31nt至221nt。我们发现，编辑效率随着drna的增加而增加。报道系统的编辑高峰位于171nt drna。51nt drna可以以良好的效率(18％)激活报道系统(图2e和2f)。最后，我们检查了drna错配c的位置是否影响编辑效率。 drna保持相同的71nt长度，设计了与转录起始位置不同的错配c。基于facs 结果，我们发现，相反错配c的位置可能影响编辑效率，并且，位于drna 的5'侧或3'侧的错配c具有较低的效率(图2g和2h)。通过gibson克隆构建出16 种不同的包含靶标序列的报道分子，其含有所有可能的3种碱基基序，然后克隆到plenti骨架(plenti-cmv-mcs-sv-bsd，stanley cohen lab，stanforduniversity)中。所述靶标序列如下所示。
[0338]
含有所有可能的3碱基基序的靶标序列：
[0339]
tat:
[0340]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgctatagggctctgccagtgagcaagggcgaggagctgttcac cggggtggtgcccatc(seq id no:9)
[0341]
taa:
[0342]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgctaaagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:10)
[0343]
tac:
[0344]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgctacagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:11)
[0345]
tag:
[0346]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgctagagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:12)
[0347]
aat:
[0348]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcaatagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:13)
[0349]
aaa:
[0350]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcaaaagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:14)
[0351]
aac:
[0352]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcaacagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:15)
[0353]
aag:
[0354]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcaagagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:16)
[0355]
cat:
[0356]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgccatagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:17)
[0357]
caa:
[0358]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgccaaagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:18)
[0359]
cac:
[0360]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgccacagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:19)
[0361]
cag:
[0362]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgccagagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:20)
[0363]
gat:
[0364]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcgatagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:21)
[0365]
gaa:
[0366]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcgaaagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:22)
[0367]
gac:
[0368]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcgacagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:23)
[0369]
gag:
[0370]
atggacgagctgtacaagctgcagggcggaggaggcagcgcctgctc gcgatgcgagagggctctgccagtgagcaagggcgaggagctgttca ccggggtggtgcccatc(seq id no:24)
[0371]
drna保持相同的111bp长度，并且，在中心处朝向靶标a设计了错配c。
[0372]
在12孔细胞培养群集中，将2
×
105个细胞hek293t铺板到每个孔中，并进行每个实验三次重复。24小时后，使用x-tremegene hp dna转染试剂 (roche)将0.5μg的drna质粒和0.5μg的报道分子靶标质粒共转染至细胞。48 小时后，用胰蛋白酶处理细胞并通过facs(bd)选择出mcherry阳性细胞。收获总共4
×
105个细胞，并使用rnaprep纯细胞/细菌试剂盒(tiangendp430)提取总rna。使用quantscript rt试剂盒(tiangen kr103-04)从2μg 的总
rna合成cdna。并通过pcr扩增111个靶标区域并进行深度测序。
[0373]
我们发现，所有16种不同的3碱基基序都可以通过本技术的示例性rna 编辑方法进行编辑，尽管效率可变。总之，结果表明，要编辑的a的5'侧最近邻位具有优先度u》c≈a》g并且要编辑的a的3'侧最近邻位具有优先度g》 c》a≈u。数据以图3a中的条形图或者图3b中的热图表示。
[0374]
实施例3.编辑从内源基因转录的rna
[0375]
接下来，我们测试了drna是否可以介导从内源基因转录的mrna。我们设计了打靶四种基因kras，ppib，β-肌动蛋白和gapdh的drna。对于 kras mrna，我们设计了91、111、131、151、171和191个核苷酸长度的 drna(图4a)，其序列如下所示。
[0376]
91-nt kras-drna
[0377]
uagcuguaucgucaaggcacucuugccuacgccaccagcuccaacc accacaaguuuauauucagucauuuucagcaggccucucucccgc (seq id no:25)
[0378]
111-nt kras-drna
[0379]
gauucugaauuagcuguaucgucaaggcacucuugccuacgccacc agcuccaacuaccacaaguuuauauucagucauuuucagcaggccu cucucccgcaccugggagc(seq id no:26)
[0380]
131-nt kras-drna
[0381]
uccacaaaaugauucugaauuagcuguaucgucaaggcacucuugc cuacgccaccagcuccaacuaccacaaguuuauauucagucauuuu cagcaggccucucucccgcaccugggagccgcugagccu(seq id no: 27)
[0382]
151-nt kras-drna
[0383]
aucauauucguccacaaaaugauucugaauuagcuguaucgucaag gcacucuugccuacgccaccagcuccaaccaccacaaguuuauauu cagucauuuucagcaggccucucucccgcaccugggagccgcugag ccucuggccccgc(seq id no:28)
[0384]
171-nt kras-drna
[0385]
cuauuguuggaucauauucguccacaaaaugauucugaauuagcug uaucgucaaggcacucuugccuacgccaccagcuccaaccaccaca aguuuauauucagucauuuucagcaggccucucucccgcaccuggg agccgcugagccucuggccccgccgccgccuuc(seq id no:29)
[0386]
191-nt kras-drna
[0387]
uaggaauccucuauuguuggaucauauucguccacaaaaugauucu gaauuagcuguaucgucaaggcacucuugccuacgccaccagcucc aaccaccacaaguuuauauucagucauuuucagcaggccucucucc cgcaccugggagccgcugagccucuggccccgccgccgccuucagug ccugcg(seq id no:30)
[0388]
二代测序结果显示：drna可编辑靶标kras mrna，编辑效率高达 11.7％(图4b)。对于内源性ppib mrna，靶标的三个位点：位点1，位点2和位点3。我们为每个位点设计了151个核苷酸长度的drna(图4c)，其序列如下所示。
[0389]
151-nt ppib-drna(位点1)
[0390]
gaggcgcagcauccacaggcggaggcgaaagcagcccggacagcug aggccggaagaggguggggccgcgguggccagggagccggcgccgc cacgcgcgggugggggggacugggguugcucgcgggcuccgggcgg gcggcgggcgccg(seq id no:31)
[0391]
151-nt ppib-drna(位点2)
[0392]
uccuguagcuaaggccacaaaauuauccacuguuuuuggaacaguc uuuccgaagagaccaaagaucacccggcccacaucuucaucuccaa uucguaggucaaaauacaccuugacggugacuuugggccccuucuu cuucucaucggcc(seq id no:32)
[0393]
151-nt ppib-drna(位点3)
[0394]
gcccuggaucaugaaguccuugauuacacgauggaauuugcuguuu uuguagccaaauccuuucucuccuguagccaaggccacaaaauuau ccacuguuuuuggaacagucuuuccgaagagaccaaagaucacccg gccuacaucuuca(seq id no:33)
[0395]
二代测序的结果显示：drna可以以高达14％的编辑效率有效地编辑 ppib mrna位点1(图4d)。对于ppib mrna位点2和位点3，编辑效率为1.5％和0.6％(图4e和4f)。对于内源性β-肌动蛋白mrna，我们为每个位点选择了两个靶标位点和经设计的drna(图4g)，其序列如下所示。
[0396]
72-ntβ-肌动蛋白-drna(位点1)
[0397]
gcgcaaguuagguuuugucaagaaaggguguaacgcaaccaaguca uaguccgccuagaagcauuugcggug(seq id no:34)
[0398]
131-ntβ-肌动蛋白-drna(位点1)
[0399]
gccaugccaaucucaucuuguuuucugcgcaaguuagguuuuguca agaaaggguguaacgcaaccaagucauaguccgccuagaagcauuu gcgguggacgauggaggggccggacucgucauacuccug(seq id no:35)
[0400]
70-ntβ-肌动蛋白-drna(位点2)
[0401]
ggacuuccuguaacaacgcaucucauauuuggaaugaccauuaaaa aaacaacaaugugcaaucaaaguc(seq id no:36)
[0402]
我们发现，drna可以编辑位点1和位点2的β-肌动蛋白mrna，每个位点的编辑效率高达1.4％(图4h和图8a)。我们还观察到更长的drna被赋予更高的编辑效率，drna-71nt为0.6％，drna-131nt为1.4％(图4h)。对于另一个管家基因gapdh，我们使用71ntdrna(caaggugcggcuccggccccuccccucuucaagggguccaca uggcaacugugaggaggggagauucagug(seq id no：37))，编辑效率为0.3％，可能是由于drna的长度短(图8b)。
[0403]
实施例4.对示例性leaper方法的脱靶分析
[0404]
对于治疗应用，编辑的精确度是关键的。接下来，我们试图表征本技术的示例性rna编辑系统的特异性。我们选择内源性ppib位点1和kras位点进行分析。对于ppib位点1，我们可以看到，在drna覆盖区域之间，在靶标 a76的侧翼存在几个a碱基，例如a22，a30，a33，a34，a39，a49，a80， a91，a107和a140。这揭示了，那些侧翼的a碱基几乎没有受到编辑，而靶标a76碱基(a-c错配)显示高达14％的编辑效率(图5a和5b)。
[0405]
对于kras位点，我们可以在drna覆盖区域中看到，在靶标a56碱基侧翼存在许多腺嘌呤，多达29个侧翼的a碱基。根据kras mrna编辑结果，我们发现虽然靶标a56碱基(a-c错配)显示高达11.7％的编辑效率，但是可以编辑侧翼的腺嘌呤(图5c和5d)。编辑了多种脱靶的腺嘌呤，而诸如a41，a43， a45，a46，a74，a79的腺嘌呤显示出更多的编辑。我们发现那些未经编辑的a碱基的5'侧最近邻位是g或c，而那些有效编辑的腺嘌呤的5'侧最近邻位是t或a。基于这一观察，我们开始设计drna以最小化对那些易于编辑的腺嘌呤的脱靶编辑。在我们的研究中，我们发现adar优选：a-c与a-a，a-u 错配，并且a-g错配是最不优选的。因此，我
们提出，对于5'侧最近邻位为u 或a的脱靶a碱基，a-g错配可能会减少或消除脱靶效应。之前的研究报道了 a-g错配可能会阻碍adar的脱氨基编辑。
[0406]
接下来，基于图5d中的统计结果和现有知识，我们设计了三种91-ntdrna变体和四种111-nt drna变体(具有如下所示的序列)，其含有不同的 a-g错配组合，：drna-ag1(a41，a46，a74)；drna-ag2(a41，a43，a45， a46，a74，a79)；drna-ag3(a31，a32，a33，a41，a43，a45，a46， a47，a74，a79)；drna-ag4(a7，a31，a32，a33，a40，a41，a43，a45， a46，a47，a74，a79，a95)(图4e)。
[0407]
kras-drna-91-ag2
[0408]
uagcuguaucgucaaggcacucgugccgacgccaccagcuccaacca ccacaaggggagagucagucagggucagcaggccucucucccgc(seq id no:38)
[0409]
kras-drna-91-ag3
[0410]
uagcuguaucgucaaggcacucuugccgacgccaccagcuccaacca ccacaaguguauagucagucauuuucagcaggccucucucccgc (seq id no:39)
[0411]
kras-drna-91-ag4
[0412]
uagcuggaucgucaaggcacucgugccgacgccaccagcuccaacc accacaaggggagaggcagucagggucagcaggccucucucccgc (seq id no:40)
[0413]
kras-drna-111-ag1
[0414]
gauucugaauuagcuguaucgucaaggcacucuugccgacgccacc agcuccaaccaccacaaguguauagucagucauuuucagcaggccuc ucucccgcaccugggagc(seq id no:41)
[0415]
kras-drna-111-ag2
[0416]
gauucugaauuagcuguaucgucaaggcacucgugccgacgccacca gcuccaaccaccacaaguggagagucagucauuuucagcaggccucuc ucccgcaccugggagc(seq id no:42)
[0417]
kras-drna-111-ag3
[0418]
gauucugaauuagcuguaucgucaaggcacucgugccgacgccacca gcuccaaccaccacaaggggagagucagucagggucagcaggccucucu cccgcaccugggagc(seq id no:43)
[0419]
kras-drna-111-ag4
[0420]
gcuccccggugcgggagagaggccugcugacccugacugccucucc ccuuguggugguuggagcugguggcgucggcacgagugccuugacg auccagcuaauucagaauc(seq id no:44)
[0421]
然后将这些drna转染到hek293t细胞中，并将空白载体和71-nt非打靶 drna对照： (tctcagtccaatgtatggtccgagcacaagctctaatcaaagtccgcg ggtgtagaccggttgccatagga(seq id no：45))用作阴性对照。对于 91-nt drna，深度测序结果显示，drna-91-ag2的中上靶(on-target)编辑 (a56)降至2.8％，drna-91-ag3的降至2.3％，drna-91-ag4的降至0.7％，这是与没有a-g错配的drna-91的上靶编辑(a56)效率7.9％相比(图4f)。对于 91-nt drna，drna-111-ag2的中上靶编辑(a56)降低至5.1％，而drna
ꢀ‑
111-ag3的降低至4.9％，这是与没有a-g错配的drna-111的上靶编辑(a56) 效率15.1％相比(图4f)，其表明较长的drna可以承受更多的a-g错配。接下来我们选择111-nt drna进行详细的脱靶分析。除a7和a79外，显著消除了侧翼的a碱基编辑(图4g)。对于a7碱基，可以通过该位点的进一步a-g错配设计来防止脱靶效应，这在当前的drna设计中是不存在的。对于a79碱基，引入相邻的两个a-g错配a78/a79可能有助于消除脱靶效应。基于这样的结果，应用本技术的rna编辑系统治疗基
因疾病是非常有希望和鼓舞人心的。
[0422]
实施例5.在多个细胞系中测试示例性leaper方法
[0423]
通过hek293t细胞中的结果，我们认为，由线性drna及其靶标rna形成的双链rna可以募集内源adar蛋白用于a-i编辑。为了证实这一假设，我们选择了更多的细胞系来测试我们的rna编辑方法。结果如图9所示。多个细胞系的结果证明了我们rna编辑方法有普遍性。首先，尽管具有多种编辑效率，但使用drna募集内源性adar适合于多种人类细胞系(其源自7种不同的组织和器官)。此外，该方法不仅可以在人类细胞中起作用，而且可以在小鼠细胞中起作用，从而提供了在小鼠上进行实验的可能性。
[0424]
实施例6.利用内源性adar进行rna编辑
[0425]
为了探索有效的rna编辑平台，我们将高活性e1008q突变体 adar1(adar1
dd
)
40
的脱氨酶结构域与催化失活的lbucas13(dcas13a)，一种 rna引导的靶向rna的crispr效应子
41
融合(图10a)。为了评估rna编辑效率，我们构建了一个包含通过包含3x ggggs编码区和框内uag终止密码子的序列连接mcherry和egfp基因的替代报道分子(报道分子-1，图10b)。报道分子转染的细胞仅表达mcherry蛋白，而在报道分子转录物的uag上进行靶向编辑可以将终止密码子转换为uig，因此允许下游egfp表达。这样的报道分子使我们能够通过监测egfp水平来测量a-至-i编辑效率。然后，我们设计了hu6启动子驱动的crrna(crispr rna)，其包含进行cas13a识别的5' 支架和可变长度的间隔子序列以用于靶向(crrna
cas13a
，紧随lbucas13 crrna序列)。
[0426]
lbucas13 crrna序列
[0427][0428][0429]
与靶转录物互补的序列均包含与uag密码子相对的cca，从而导致胞苷 (c)与腺苷(a)错配(图10b)，因为腺苷脱氨作用优先发生在a-c错配位点
13,14
。为了测试crrna的最佳长度，在稳定表达报道分子-1的hek293t细胞中，将不同长度的非靶向或靶向crrna与dcas13a-adar1
dd
蛋白共表达。用含有至少40-nt长的匹配序列的crrna观察到了由egfp表达出现所指示的明显的rna编辑作用，crrna越长，egfp阳性百分比就越高(图10c)。令人惊讶地，仅长crrna
cas13a
的表达似乎足以激活egfp表达，并且 dcas13a-adar1
dd
的共表达反而降低了crrna活性(图10c，10d)。egfp表达显然是序列依赖性的，因为70-nt(不包括用于长度计算的5'支架)对照rna不能激活egfp的表达(图10c，10d)。
[0430]
令人惊讶的发现是，某些长期工程化的crrna
cas13a
能够独立于 dcas13a-adar1
dd
进行rna编辑，我们决定从crrna中删除cas13a募集的支架序列。因为crrna
70
具有触发egfp表
达的最高活性(图10c，10d)，所以我们选择了相同的70-nt长的指导rna，而没有cas13a募集支架进行进一步测试 (图11a和以下在实施例中使用的arrna和对照rna序列)。
[0431]
[0432]
[0433]
[0434]
[0435]
[0436]
[0437]
[0438]
[0439]
[0440]
[0441]
[0442]
[0443]
[0444]
[0445]
[0446]
[0447][0448]
事实证明，这种线性指导rna在接近40％携带报道分子-1的总细胞中诱导了egfp的强表达(图11b，上图)。由于内源性adar蛋白可以编辑双链 rna(dsrna)底物
12
，因此我们认为长指导rna可以与靶标转录物退火形成 dsrna底物，转而募集内源性adar蛋白用于靶向编辑。因此，我们将这样的指导rna称为arrna(adar募集rna)。为了验证内源性adar蛋白是否确实是上述观察的原因，我们着手研究在adar缺陷细胞中arrna介导的 rna编辑。由于在hek293t细胞中几乎检测不到adar2 mrna(图12a)，因此我们生成了hek293t adar1-/-细胞，从而使该细胞系在adar1和adar2 中均缺乏(图11c，d)。实际上，adar1的消耗消除了arrna
70
诱导的egfp 信号(图11b，下图)。此外，hek293t adar1-/-细胞中adar1
p110
，adar1
p150
或adar2的外源表达(图11c，d)成功地挽救了通过arrna
70
诱导egfp的丢失(图11e，图12b)，证明了arrna诱导的egfp报道分子其表达完全取决于天然的adar1，其活性可以通过其同种型(p110和p150)或adar2重建。对 arrna
70
靶向区域的sanger测序分析显示，uag中预测的腺苷位点有一个a/g 重叠峰，表明明显的a至i(g)转化(图11f)。下一代测序(ngs)进一步证实了a 至i的转化率约为全部报道分子转录物的13％(图11g)。定量pcr分析表明 arrna
70
不会减少靶标转录物的表达(图13)，排除了arrna可能的rnai效应。总体而言，我们的数据表明，arrna能够通过工程化的a-c错配对靶标转录物产生显着水平的编辑。
[0449]
实施例7.leaper可以在多个细胞系中进行rna编辑
[0450]
因为内源性adar蛋白的表达是leaper介导的rna编辑的前提，所以我们测试了leaper在一组来自不同组织的细胞系中的性能，这些细胞系包括ht29，a549，hepg2，rd，sf268，sw13和hela。我们首先使用蛋白质印迹分析检查了所有三种adar蛋白的内源表达。adar1在所有测试的细胞系中都高度表达，其在蛋白质印迹中的身份已通过阴性对照hek293tadar1
–
/
–
系得到证实(图14a，b)。仅在hepg2和hela细胞中检测到adar3(图14a，b)。在任何细胞中均未检测到adar2，其结果并非由于蛋白质印迹失败，因为可以从过表达adar2的hek293t细胞中检测到adar2蛋白(图 14a，b)。这些发现与先前报道的adar1普遍表达，而adar2和adar3的表达仅限于某些组织一致
11
。
[0451]
然后我们着手在这些细胞系中测试靶向报道分子-1的重新设计的71-ntarrna(arrna71)的编辑效率(图15a和上面列出的这项研究中使用的arrna 和对照rna的序列)。
[0452]
leaper在该arrna
71
的所有测试的细胞中都工作，尽管效率有所不同 (图14c)。这些结果与先前的报道一致，除了hepg2和hela细胞外，adar1/2 蛋白水平与rna编辑产量相关
42
。编辑效率与adar1水平的次优相关性可能是由于这两个系中都有大量的adar3表达(图14a，b)，因为据报道adar3 在rna编辑中起抑制作用。重要的是，leaper还用于小鼠起源的三种不同细胞系(nih3t3，小鼠胚胎成纤维细胞(mef)和b16)(图14d)，为通过动物和疾病模型测试其治疗潜力铺平了道路。总体而言，我们得出的结论是， leaper是一种用于广谱细胞类型以及不同生物体的多功能工具。
[0453]
实施例8.leaper的特性和优化
[0454]
为了更好地表征和优化leaper，我们研究了靶标转录物的uag三联体内与腺苷相
对的核苷酸的选择。在hek293t细胞中，靶向报道分子-1的 arrna
71
显示出可变的编辑效率，具有与靶向uag相对的变化的三联体 (5
’‑
cna，n表示a /u/c/g之一)(上面列出的在这项研究中使用的arrna 和对照rna的序列)。a-c错配导致最高的编辑效率，而a-g错配产生最少但明显的编辑(图16a)。然后，我们研究了arrna中a-c错配侧翼核苷酸的优先度。我们测试了胞苷(5'-n1cn2)周围的所有16个5'和3'相邻位点组合(上面列出的在这项研究中使用的arrna和对照rna的序列)，发现3'相邻腺苷是有效编辑所必需的，而腺苷是5'位点上最不利的核苷酸(图16b，c)。因此，我们得出结论，arrna上的cca基序赋予了靶向uag位点的最高编辑效率。值得注意的是，arrna中的3'相邻鸟苷(5'-n1cg)表现出显著的抑制作用(图16b， c)。
[0455]
rna的长度似乎在指导对靶转录物的编辑中与arrna效率有关(图 10c)，与先前的报道一致
42
。为了完全理解这种效果，我们测试了可变长度的arrna，它们靶向两种不同的报道分子转录物-报道分子-1和报道分子
ꢀ‑
2(图15a，b)。对于任一报道分子靶向，设计和测试了10种不同大小的arrna，范围从31-nt到211-nt，cca三联体(用于uag靶向)正好位于中间(上面列出的这项研究中使用的arrna和对照rna的序列)。基于报道分子egfp活性，对于两个报道分子，arrna的长度与编辑效率正相关，在111-191-nt处达到峰值 (图16d)。尽管一个arrna
51
似乎起作用，但71-nt是arrna对两个报道分子均起作用的最短长度(图16d)。
[0456]
接下来，我们研究了arrna内a-c错配位置对编辑效率的影响。我们将所有要测试的arrna的长度固定为71-nt，并将靶向uag的acc三联体从 arrna中的5'滑到3'(上面列出的这项研究中使用的arrna和对照rna的序列)。事实证明，在两个报道分子中，将a-c错配置于中间区域会导致较高的编辑产率，且错配位点接近3'端的arrna优于接近5'端的arrna(图16e)。为方便起见，对所有我们的后续研究，我们都将a-c错配置于arrna的中心。
[0457]
我们还测试了leaper的靶向灵活性，并试图确定靶标上的uag是否是进行rna编辑的唯一基序。对于报道分子-3上的所有16个三联体组合 (5'-n1an2)(图15c)，我们使用了固定长度(111-nt)的相应arrna，并确保了除了编辑位点(ac错配)外，arrna和报道分子的完美序列匹配(图16f和上面列出的这项研究中使用的arrna和对照rna的序列)。ngs结果表明，所有 n1an2基序均可编辑。uan2和gan2分别是最优选和最不优选的基序(图 16f，g)。总体而言，靶标腺苷的最近邻位优先度为5'u》c≈a》g和3' g》c》a≈u(图16g)。
[0458]
实施例9.使用leaper编辑内源转录物
[0459]
接下来，我们检查了leaper是否可以对内源转录物进行有效的编辑。使用不同长度的arrna，我们靶向ppib，kras和smad4基因转录物中的uag 基序，以及fancc基因转录物中的uac基序(图17a，上面列出的这项研究中使用的arrna和对照rna序列)。令人鼓舞的是，所有四种转录物中的靶标腺苷位点均由其相应的所有四种大小的arrna编辑，尽管根据ngs结果的效率有所不同(图17b)。与我们先前的观察一致，更长的arrna倾向于产生更高的编辑率。值得注意的是，151-nt的arrna
ppib
编辑了ppib基因总转录物的50％(图17b)。没有arrna在其靶标转录物(图18a)或最终蛋白质水平(例如kras，图18b)上显示出rnai作用。此外，leaper能够在非uan位点上达到理想的编辑率(图17c和上面列出的这项研究中使用的arrna和对照rna 的序列)，显示leaper在编辑内源转录物上的灵活性。为了进一步探索 leaper的功能，我们测试了leaper是否可以同时靶向多个位点。我们通过共表达两个arrna(上面列出的这项研究中使用的arrna和对照rna的序列)观察到tardbp和fancc转录物的多
重编辑，其效率甚至高于单个 arrna(图17d)的那些，表明leaper非常适合并行编辑多个靶标。
[0460]
值得注意的是，adar1/2倾向于使rna双链体中的多个腺苷杂乱地脱氨基
44
，并且a-c错配不是指导a至i转换的唯一基序(图16a)。因此，可以合理地假设，arrna覆盖范围内靶标转录物上的所有腺苷均受到可变水平的编辑，这是不需要的修饰的主要来源。arrna越长，这样的脱靶的可能性就越高。因此，我们检查了这些靶标转录物中arrna覆盖区域内的所有腺苷位点。对于ppib转录物，在整个测序窗口中，对于可变大小的arrna，观察到很少的脱靶编辑(图17e，f)。但是，在靶向kras，smad4和fancc基因的情况下，检测到多个脱靶编辑(图19a-f)。特别是对于kras，在arrna
111
的测序窗口中，30个腺苷中有11个进行了大量的a至i转化(图19a，b)。
[0461]
我们接下来尝试开发策略以最小化这样的不需要的脱靶效应。因为a-g 错配抑制了uag靶向的编辑(图16a)，所以我们假设将鸟苷与非靶向腺苷配对可能会减少不良的编辑。然后，我们测试了报道分子-3中所有可能的三联体组合(5'-n1an2)中a-g错配对腺苷的影响(图15c和上面列出的这项研究中使用的arrna和对照rna序列)。与a-c错配(图16f)相比，除了uag或aag 靶向(2％)(图17g)，a-g错配确实降低了所有测试靶标上腺苷的编辑。为了进一步降低不想要的位点的编辑率，我们继续测试了两个连续错配的影响。结果表明，与uag或aag相对的三联体的3'端核苷酸处的额外错配消除了其相应的腺苷编辑(图17h以及上面列出的这项研究中使用的arrna和对照rna的序列)。根据这些发现，我们尝试应用此规则以减少kras转录物中的脱靶(图19a)。我们首先设计了一个arrna(arrna
111-ag6)，其在arrna
111
覆盖的所有“易编辑”基序上产生了ag错配(图17i，图19a和上述研究中使用的arrna和对照rna的序列)，包括aau(第61位)，uau(第63位)，uaa(第 65位)，aaa(第66位)，uag(第94位)和aag(第99位)。该arrna
111-ag6消除了大部分脱靶编辑，同时保持了约5％的脱靶编辑率。与图17g中的发现一致，单个a-g错配不能完全最小化aag基序(第99位)的编辑(图17i和图19a)。然后，我们在arrna
111-ag6上添加了更多错配，包括双重错配(与靶标基序 5'-aag相对的5'-cgg)，以及三个另外的a-g错配以减轻第27、98和115位腺苷的编辑(arrna111-ag9)(上面列出的这项研究中使用的arrna和对照rna 的序列)。因此，我们实现了大大提高的编辑特异性，而又没有在靶标位点 (a76)上额外损失编辑率(图17i)。总之，结合其他规则的工程化的leaper 可以对内源转录物进行有效和更精确的rna编辑。
[0462]
实施例10.leaper的rna编辑特异性
[0463]
除了在arrna覆盖的dsrna区域内可能的脱靶效应外，我们还担心通过 arrna的部分碱基配对对其他转录物的潜在脱靶效应。然后，我们进行了转录组范围的rna测序分析，以评估leaper的全局脱靶效应。在进行rna序列分析之前，先用对照rna
151
或ppib特异性arrna(arrna
151-ppib)表达质粒转染细胞。我们在对照rna
151
组中确定了六个潜在脱靶(图20a)，在 arrna
151-ppib的五个潜在脱靶(图20b)，基于ngs分析的ppib脱靶率为～37％(图20b)。进一步的分析表明，除来自eif2ak2转录物的两个位点外，所有位点均位于sine(alu)或line区域(图20a，b)，均易于受到adar介导的编辑
45
，表明这些脱靶可能不是从靶标转录物和arrna或对照rna的配对中得出的。值得注意的是，两组均出现了脱靶转录物，wdr73和smyd4，表明它们不太可能是依赖序列的rna编辑。实际上，最小自由能分析表明，所有这些可能的脱靶转录物均不能与对照rna
151
或arrna
151-ppib形成稳定的双链体(图20c)。为了进
一步测试arrna是否产生依赖序列的脱靶，我们通过使用ncbi blast比较arrna
151-ppib和arrna
111-fancc的序列相似性来选择潜在的脱靶位点。arrna
151-ppib的trappc12转录物以及 arrna
111-fancc的st3gal1，ostm1-as1和ehd2转录物中的三个位点是最佳候选者(图20d和图21a)。ngs分析表明，在这些预测的脱靶位点中均未检测到编辑(图20d和图21b)。这些结果表明，leaper允许在靶标位点进行有效编辑，同时保持转录组范围的特异性，而没有检测到依赖序列的脱靶编辑。
[0464]
实施例11.leaper在哺乳动物细胞中的安全性评估
[0465]
因为arrna依赖于内源性adar蛋白来编辑靶标转录物，所以我们想知道外源性arrna的添加是否通过占用过多的adar1或adar2蛋白来影响天然rna编辑事件。因此，我们从转录组范围的rna测序结果中分析了模拟组和arrna
151-ppib组共享的a-to-i rna编辑位点，并分析了模拟组和对照 rna
151
组之间的比较。与模拟组相比，对照rna
151
组和arrna
151-ppib组均未显示出显著差异(图22a，b)，这表明leaper对内源adar1催化天然a-to-i 编辑事件的正常功能影响很小。
[0466]
同时，我们使用rna-seq数据进行了差异基因表达分析，以验证arrna 是否影响全局基因表达。我们发现，与模拟组相比，对照rna
151
和 arrna
151-ppib均不影响全局基因表达(图22c，d)。与我们先前的观察结果一致(图18a)，arrna对ppib的表达未显示任何rnai作用(图22c，d)。
[0467]
考虑到arrna与靶转录物形成rna双链体并且rna双链体可引起先天免疫应答，我们研究了arrna的引入是否具有这样的作用。为了测试这一点，我们选择了靶向已证明有效的四个基因转录物的arrna。我们没有观察到干扰素-β(ifn-β)(图22e)或白介素6(il-6)(图22f)的任何mrna诱导，这是先天性免疫激活的两个标志。作为阳性对照，双链rna的合成类似物-聚(i：c) 诱导了强烈的ifn-β和il-6表达(图22e，f)。leaper似乎不会在靶细胞中诱导免疫原性，一种对安全治疗很重要的特征。
[0468]
实施例12.通过leaper恢复p53的转录调节活性
[0469]
现在我们已经建立了无需引入外源蛋白质就可以进行rna编辑的新方法，我们试图证明其治疗作用。我们首先针对了肿瘤抑制基因tp53，该基因在维持细胞稳态中起着至关重要的作用，但在》50％的人类癌症中经常发生突变
46
。tp53中的c.158g》a突变是临床相关的无意义突变(trp53ter)，导致无功能的截短蛋白
46
。我们设计了一个arrna
111
和两个替代性arrna (arrna
111-ag1和arrna
111-ag4)(上面列出的本研究中使用的arrna和对照 rna的序列)，它们均靶向tp53
w53x
转录物(图23a)，后两个被设计为最小化潜在脱靶。我们产生了hek293t tp53
–
/
–
细胞系，以消除天然p53蛋白的作用。靶向tp53
w53x
的所有三种形式的arrna都在突变的腺苷位点上转化了 tp53
w53x
转录物的～25-35％(图23b)，可变减少arrna
111-ag1和arrna
111-ag4 的不想要的编辑(图24)。蛋白质印迹表明，基于hek293t tp53
–
/
–
细胞中的 tp53
w53x
转录物，arrna
111
，arrna
111-ag1和arrna
111-ag4均可挽救全长p53 蛋白的产生，而对照rna
111
则不能(图23c)。
[0470]
为了验证修复的p53蛋白是否功能完全，我们用p53-荧光素酶顺式报道系统测试了p53的转录调节活性
47，48
。所有三个版本的arrna均可恢复p53活性，而优化版本的arrna
111-ag1表现最佳(图23d)。总之，我们证明了leaper 能够修复与癌症相关的tp53的提前终止密码子(pre-mature stop codon)并恢复其功能。
[0471]
实施例13.leaper对致病性突变的校正
[0472]
接下来，我们调查了leaper是否可用于校正更多的致病突变。针对六个致病基因的临床相关突变：埃勒斯-当洛斯综合征的col3a1，原发性肺动脉高压的bmpr2，朱伯特综合征的ahi1，范科尼贫血的fancc，原发性家族性肥厚性心肌病的mybpc3和x染色体连锁严重联合免疫缺陷病的il2rg，我们为每个携带相应致病性g》a突变的基因设计了111-nt arrna(图25和上面列出的这项研究中使用的arrna和对照rna的序列，以及这项研究中使用的以下与疾病相关的cdna)。
[0473]
这项研究中使用的与疾病相关的cdna
[0474][0475]
通过在hek293t细胞中共表达arrna/cdna对，我们在所有测试中鉴定了显著量的具有a》g校正的靶转录物(图24)。由于g》a突变占人类已知致病点突变的近一半
10,49
，因此leaper进行的a》g转化可为治疗提供巨大的机会。
[0476]
实施例14.leaper在多个人类原代细胞中进行rna编辑
[0477]
为了进一步探索leaper的临床实用性，我们着手在多个人类原代细胞中测试该方法。首先，我们在人原代肺成纤维细胞和人原代支气管上皮细胞中用151-nt arrna(上面列出的这项研究中使用的arrna和对照rna的序列) 测试了leaper，以编辑报道分子-1(图15a)。在两个人原代细胞中，leaper 均可获得35-45％的egfp阳性细胞(图27a)。然后，我们测试了leaper在这两个原代细胞和人类原代t细胞中编辑内源性基因ppib的结果，发现 arrna
151-ppib在人类原发性肺成纤维细胞，原发性支气管上皮细胞(图27b) 和原代t细胞(图27c)中的编辑率可分别达到》40％，》80％和》30％。leaper 在人原代细胞中的高编辑效率因其在治疗中的潜在应用而特别令人鼓舞。
[0478]
实施例15.通过慢病毒表达和arrna的化学合成的有效编辑
[0479]
然后我们研究了是否可以通过临床上更相关的方法来递送leaper。我们首先通过
基于慢病毒的表达测试了arrna的作用。感染后2天(dpi)，靶向报道分子-1的arrna
151
在hek293t细胞中的40％以上带有报道分子-1的总细胞中诱导了强egfp表达。在8dpi时，egfp比率保持在38％的可比水平(图 28a和上面列出的这项研究中使用的arrna和对照rna序列)，表明leaper 可以适合需要连续施用的疗法。对于天然基因编辑，我们通过慢病毒转导在 hek293t细胞中递送了靶向ppib的arrna
151
，并在6dpi时观察到超过6％的靶标编辑(图28b)。
[0480]
我们接下来测试了用于leaper的合成的arrna寡核苷酸和电穿孔递送方法。化学合成具有111-nt的靶向ppib转录物的arrna和对照rna，并在 arrna的前三个和后三个残基处进行2'-o-甲基和硫代磷酸酯键修饰(图28c)。通过电穿孔引入t细胞后，arrna
111-ppib寡核苷酸在ppib转录物上实现了～20％的编辑(图28d)，这表明leaper有望开发出寡核苷酸药物。
[0481]
实施例16.通过leaper恢复源自hurler综合征患者的原代成纤维细胞中的α-l-艾杜糖醛酸酶活性
[0482]
最后，我们检查了leaper在治疗单基因疾病-hurler综合征方面的潜力，该疾病是由于α-l-艾杜糖醛酸酶(idua)，一种负责粘多糖的降解的溶酶体代谢酶的缺乏而导致的i型粘多糖贮积病最严重的亚型(mps i)
50
。我们选择了从hurler综合征患者最初分离的原代成纤维细胞gm06214。gm06214细胞在 idua基因的外显子9中含有纯合的tgg》tag突变，从而导致蛋白质中的 trp402ter突变。我们通过具有化学修饰的合成rna寡核苷酸设计了两个版本的arrna，分别是靶向idua的成熟mrna和pre-mrna的 arrna
111-idua-v1和arrna
111-idua-v2(图29a以及在上面列出的这项研究中使用arrna和对照rna的序列)。通过电穿孔将arrna
111-idua-v1或 arrna
111-idua-v2引入gm06214细胞后，我们通过ngs分析测量了靶标 rna编辑率，并在不同的时间点用4-mu-α-l-艾杜糖醛酸酶底物测量了α-l
‑ꢀ
艾杜糖醛酸酶的催化活性。在电穿孔后，arrna
111-idua-v1和 arrna
111-idua-v2均可随着时间的推移逐渐恢复idua缺失的gm06214细胞中idua的催化活性，而arrna
111-idua-v2的性能要比arrna111-idua-v1 好得多，而在三个对照组中无α-l-艾杜糖醛酸酶活性可以检测到(图29b)。
[0483]
为了进一步评价leaper在gm06214中恢复的idua活性减轻hurler综合征的程度，我们检查了gm01323细胞中的idua活性，gm01323细胞是来自患有scheie综合征的患者的另一种原代成纤维细胞，该综合征是一种比 hurler轻得多的mps i亚型，由于idua基因杂合基因型导致残留idua活性而引起的。我们发现电穿孔后48小时，在具有arrna
111-idua-v2的gm06214 细胞中idua的催化活性高于gm01323细胞(图29b)。与这些结果一致，ngs 分析表明arrna
111-idua-v2将近30％的a转换为i，比arrna
111-idua-v1的转化率高得多(图29c)。进一步的分析表明，在idua转录物的arrna覆盖区域内检测到最少的不需要的编辑(图29d)。重要的是，leaper不会在原代细胞中触发免疫反应，如我们证明的，与rna双链体聚(i：c)用作阳性对照不同，arrna
111-idua-v1和arrna
111-idua-v2均未诱导一组涉及i型干扰素和促炎反应的基因的表达(图29e)。这些结果表明leaper在靶向某些单基因疾病方面的治疗潜力。
[0484]
实施例17.通过leaper恢复hurler综合征小鼠中的α-l-艾杜糖醛酸酶活性
[0485]
由于leaper提供了在小鼠上进行实验的可能性，因此我们检查了 leaper在体内
治疗单基因疾病-hurler综合征的潜力。选择腺相关病毒(aav) 作为递送系统。将两个序列(seq id no.341和seq id no.342)插入质粒 aav-u6-cmv-gfp载体中，并通过packgene biotech将质粒包装到aav8病毒中(见图31)。病毒滴度如下：
[0486][0487]
选择六只mpsi(idua w392x小鼠，b6.129s-idua
tm1.1kmke/j
)雄性小鼠(4-10 周龄)，分成两组，第一组的三只小鼠各自通过尾静脉注射包装有质粒 aav8-idua-adrna151-kd2的aav8病毒的1e12 gc，第二组的另外三只小鼠各自通过尾静脉注射包装有质粒aav8-random151-kd2的aav8病毒的 1e12 gc以及一个对照。注射后28天，通过颈脱位法处死小鼠并取肝脏。我们测量了两组小鼠中具有4-mu-α-l-艾杜糖醛酸酶底物的小鼠肝细胞中α-l
‑ꢀ
艾杜糖醛酸酶的酶活性。将肝脏分为小块，将研磨后的一部分(立即)用于酶活性测量。第一组的平均相对酶活性高于第二组的平均相对酶活性(参见图 32a)。第一组的每只小鼠的相对酶活性高于第二组的相对酶活性(参见图 32b，gm01323作为对照，并且与野生型细胞相比，其具有0.3％的α-l-艾杜糖醛酸酶酶活性)。从酶活性的结果可以看出，第一组小鼠的α-l-艾杜糖苷酶活性得以恢复。为了确认tgg》tag突变已恢复并且leaper提供有效的 rna编辑，然后我们通过使用研磨的肝的其他部分对两组中的每只小鼠进行了下一代测序分析，来测量小鼠肝细胞中的靶向rna编辑率。另一部分添加了trizol用于ngs。第一组的平均rna编辑效率高于第二组的平均rna编辑效率(参见图33a)。第一组的每只小鼠的rna编辑效率几乎高于第二组的 rna编辑效率(参见图33b)。从rna编辑效率的结果可以看出，leaper方法可提供高达7％的有效rna编辑。
[0488]
adar1(p110)cdna
[0489]5’‑
atggccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggcta aaaatattggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctat agacaagggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaata cgaacagtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaat atacccacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataa agttagaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctc aaaagcagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatcc g
cgcagcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcac cctacaagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagt caaacctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcat caatggccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagcc atgacaattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacag agaaagaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagc cccgtcaccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggc cctgcccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagc aagaaagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatgg cttctgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtc aggaagattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctccca tggctttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaa agttgggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcg gctctccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacagg ggccagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactg gcagcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccct ccttgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagc ttgggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgc agaaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcga aggatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtat atcagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacaga atcccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggc acaatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccat gtcctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagc ccatttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgt gacaagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagag tcagcatatatgattccaaaaggcaatccgggaagactaaggagacaagcgtcaactggtgtctggctgatggc tatgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaa aaagaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggt gaggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggct atgggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagta gattacaaggatgacgacgataag(标记标签)tag-3’(seq id no:332)
[0490]
adar1(p150)cdna
[0491]5’
atgaatccgcggcaggggtattccctcagcggatactacacccatccatttcaaggctatgagcacagacagc tcagataccagcagcctgggccaggatcttcccccagtagtttcctgcttaagcaaatagaatttctcaaggggc agctcccagaagcaccggtgattggaaagcagacaccgtcactgccaccttccctcccaggactccggccaagg tttccagtactacttgcctccagtaccagaggcaggcaagtggacatcaggggtgtccccaggggcgtgcatct cggaagtcaggggctccagagagggttccagcatccttcaccacgtggcaggagtctgccacagagaggtgttg attgcctttcctcacatttccaggaactgagtatctaccaagatcaggaacaaaggatcttaaagttcctg
gaag agcttggggaagggaaggccaccacagcacatgatctgtctgggaaacttgggactccgaagaaagaaatcaa tcgagttttatactccctggcaaagaagggcaagctacagaaagaggcaggaacaccccctttgtggaaaatcg cggtctccactcaggcttggaaccagcacagcggagtggtaagaccagacggtcatagccaaggagccccaaa ctcagacccgagtttggaaccggaagacagaaactccacatctgtctcagaagatcttcttgagccttttattgc agtctcagctcaggcttggaaccagcacagcggagtggtaagaccagacagtcatagccaaggatccccaaac tcagacccaggtttggaacctgaagacagcaactccacatctgccttggaagatcctcttgagtttttagacatg gccgagatcaaggagaaaatctgcgactatctcttcaatgtgtctgactcctctgccctgaatttggctaaaaat attggccttaccaaggcccgagatataaatgctgtgctaattgacatggaaaggcagggggatgtctatagaca agggacaacccctcccatatggcatttgacagacaagaagcgagagaggatgcaaatcaagagaaatacgaac agtgttcctgaaaccgctccagctgcaatccctgagaccaaaagaaacgcagagttcctcacctgtaatatacc cacatcaaatgcctcaaataacatggtaaccacagaaaaagtggagaatgggcaggaacctgtcataaagtta gaaaacaggcaagaggccagaccagaaccagcaagactgaaaccacctgttcattacaatggcccctcaaaag cagggtatgttgactttgaaaatggccagtgggccacagatgacatcccagatgacttgaatagtatccgcgca gcaccaggtgagtttcgagccatcatggagatgccctccttctacagtcatggcttgccacggtgttcaccctac aagaaactgacagagtgccagctgaagaaccccatcagcgggctgttagaatatgcccagttcgctagtcaaac ctgtgagttcaacatgatagagcagagtggaccaccccatgaacctcgatttaaattccaggttgtcatcaatg gccgagagtttcccccagctgaagctggaagcaagaaagtggccaagcaggatgcagctatgaaagccatgac aattctgctagaggaagccaaagccaaggacagtggaaaatcagaagaatcatcccactattccacagagaaa gaatcagagaagactgcagagtcccagacccccaccccttcagccacatccttcttttctgggaagagccccgt caccacactgcttgagtgtatgcacaaattggggaactcctgcgaattccgtctcctgtccaaagaaggccctgc ccatgaacccaagttccaatactgtgttgcagtgggagcccaaactttccccagtgtgagtgctcccagcaaga aagtggcaaagcagatggccgcagaggaagccatgaaggccctgcatggggaggcgaccaactccatggcttc tgataaccagcctgaaggtatgatctcagagtcacttgataacttggaatccatgatgcccaacaaggtcagga agattggcgagctcgtgagatacctgaacaccaaccctgtgggtggccttttggagtacgcccgctcccatggc tttgctgctgaattcaagttggtcgaccagtccggacctcctcacgagcccaagttcgtttaccaagcaaaagtt gggggtcgctggttcccagccgtctgcgcacacagcaagaagcaaggcaagcaggaagcagcagatgcggctc tccgtgtcttgattggggagaacgagaaggcagaacgcatgggtttcacagaggtaaccccagtgacaggggc cagtctcagaagaactatgctcctcctctcaaggtccccagaagcacagccaaagacactccctctcactggca gcaccttccatgaccagatagccatgctgagccaccggtgcttcaacactctgactaacagcttccagccctcct tgctcggccgcaagattctggccgccatcattatgaaaaaagactctgaggacatgggtgtcgtcgtcagcttg ggaacagggaatcgctgtgtaaaaggagattctctcagcctaaaaggagaaactgtcaatgactgccatgcag aaataatctcccggagaggcttcatcaggtttctctacagtgagttaatgaaatacaactcccagactgcgaag gatagtatatttgaacctgctaagggaggagaaaagctccaaataaaaaagactgtgtcattccatctgtatat cagcactgctccgtgtggagatggcgccctctttgacaagtcctgcagcgaccgtgctatggaaagcacagaat cccgccactaccctgtcttcgagaatcccaaacaaggaaagctccgcaccaaggtggagaacggagaaggcac aatccctgtggaatccagtgacattgtgcctacgtgggatggcattcggctcggggagagactccgtaccatgt cctgtagtgacaaaatcctacgctggaacgtgctgggcctgcaaggggcactgttgacccacttcctgcagccc atttatctcaaatctgtcacattgggttaccttttcagccaagggcatctgacccgtgctatttgctgtcgtgtga caagagatgggagtgcatttgaggatggactacgacatccctttattgtcaaccaccccaaggttggcagagtc agcatatatgattccaaaaggcaatccgggaagactaagg
agacaagcgtcaactggtgtctggctgatggcta tgacctggagatcctggacggtaccagaggcactgtggatgggccacggaatgaattgtcccgggtctccaaaa agaacatttttcttctatttaagaagctctgctccttccgttaccgcagggatctactgagactctcctatggtga ggccaagaaagctgcccgtgactacgagacggccaagaactacttcaaaaaaggcctgaaggatatgggctat gggaactggattagcaaaccccaggaggaaaagaacttttatctctgcccagta gattacaaggatgacgacgataag(标记标签)tag-3’(seq id no:333)
[0492]
adar2 cdna
[0493]5’‑
atggatatagaagatgaagaaaacatgagttccagcagcactgatgtgaaggaaaaccgcaatctggacaa cgtgtcccccaaggatggcagcacacctgggcctggcgagggctctcagctctccaatgggggtggtggtggcc ccggcagaaagcggcccctggaggagggcagcaatggccactccaagtaccgcctgaagaaaaggaggaaaa caccagggcccgtcctccccaagaacgccctgatgcagctgaatgagatcaagcctggtttgcagtacacactc ctgtcccagactgggcccgtgcacgcgcctttgtttgtcatgtctgtggaggtgaatggccaggtttttgagggc tctggtcccacaaagaaaaaggcaaaactccatgctgctgagaaggccttgaggtctttcgttcagtttcctaat gcctctgaggcccacctggccatggggaggaccctgtctgtcaacacggacttcacatctgaccaggccgactt ccctgacacgctcttcaatggttttgaaactcctgacaaggcggagcctcccttttacgtgggctccaatgggga tgactccttcagttccagcggggacctcagcttgtctgcttccccggtgcctgccagcctagcccagcctcctctc cctgccttaccaccattcccacccccgagtgggaagaatcccgtgatgatcttgaacgaactgcgcccaggact caagtatgacttcctctccgagagcggggagagccatgccaagagcttcgtcatgtctgtggtcgtggatggtc agttctttgaaggctcggggagaaacaagaagcttgccaaggcccgggctgcgcagtctgccctggccgccatt tttaacttgcacttggatcagacgccatctcgccagcctattcccagtgagggtcttcagctgcatttaccgcag gttttagctgacgctgtctcacgcctggtcctgggtaagtttggtgacctgaccgacaacttctcctcccctcac gctcgcagaaaagtgctggctggagtcgtcatgacaacaggcacagatgttaaagatgccaaggtgataagtg tttctacaggaacaaaatgtattaatggtgaatacatgagtgatcgtggccttgcattaaatgactgccatgca gaaataatatctcggagatccttgctcagatttctttatacacaacttgagctttacttaaataacaaagatgat caaaaaagatccatctttcagaaatcagagcgaggggggtttaggctgaaggagaatgtccagtttcatctgta catcagcacctctccctgtggagatgccagaatcttctcaccacatgagccaatcctggaagaaccagcagata gacacccaaatcgtaaagcaagaggacagctacggaccaaaatagagtctggtgaggggacgattccagtgcg ctccaatgcgagcatccaaacgtgggacggggtgctgcaaggggagcggctgctcaccatgtcctgcagtgaca agattgcacgctggaacgtggtgggcatccagggatccctgctcagcattttcgtggagcccatttacttctcga gcatcatcctgggcagcctttaccacggggaccacctttccagggccatgtaccagcggatctccaacatagag gacctgccacctctctacaccctcaacaagcctttgctcagtggcatcagcaatgcagaagcacggcagccagg gaaggcccccaacttcagtgtcaactggacggtaggcgactccgctattgaggtcatcaacgccacgactggga aggatgagctgggccgcgcgtcccgcctgtgtaagcacgcgttgtactgtcgctggatgcgtgtgcacggcaag gttccctcccacttactacgctccaagattaccaaacccaacgtgtaccatgagtccaagctggcggcaaagga gtaccaggccgccaaggcgcgtctgttcacagccttcatcaaggcggggctgggggcctgggtggagaagccca ccgagcaggaccagttctcactcacgccc gattacaaggatgacgacgataag(标记标签)tag-3’(seq id no:334)
[0494]
疾病相关基因的编码序列(cds)
[0495]
col3a1
[0496]5’‑
atgatgagctttgtgcaaaaggggagctggctacttctcgctctgcttcatcccactattatttt
ggcacaacaggaagctgttgaaggaggatgttcccatcttggtcagtcctatgcgg atagagatgtctggaagccagaaccatgccaaatatgtgtctgtgactcaggatccgttctctgcgatgacataatatgtgacgatcaagaattagactgccccaacccagaaattccatttg gagaatgttgtgcagtttgcccacagcctccaactgctcctactcgccctcctaatggtcaaggacctcaaggccccaagggagatccaggccctcctggtattcctgggagaaatggtg accctggtattccaggacaaccagggtcccctggttctcctggcccccctggaatctgtgaatcatgccctactggtcctcagaactattctccccagtatgattcatatgatgtcaagtctgg agtagcagtaggaggactcgcaggctatcctggaccagctggccccccaggccctcccggtccccctggtacatctggtcatcctggttcccctggatctccaggataccaaggacccc ctggtgaacctgggcaagctggtccttcaggccctccaggacctcctggtgctataggtccatctggtcctgctggaaaagatggagaatcaggtagacccggacgacctggagagcg aggattgcctggacctccaggtatcaaaggtccagctgggatacctggattccctggtatgaaaggacacagaggcttcgatggacgaaatggagaaaagggtgaaacaggtgctcct ggattaaagggtgaaaatggtcttccaggcgaaaatggagctcctggacccatgggtccaagaggggctcctggtgagcgaggacggccaggacttcctggggctgcaggtgctcgg ggtaatgacggtgctcgaggcagtgatggtcaaccaggccctcctggtcctcctggaactgccggattccctggatcccctggtgctaagggtgaagttggacctgcagggtctcctggt tcaaatggtgcccctggacaaagaggagaacctggacctcagggacacgctggtgctcaaggtcctcctggccctcctgggattaatggtagtcctggtggtaaaggcgaaatgggtcc cgctggcattcctggagctcctggactgatgggagcccggggtcctccaggaccagccggtgctaatggtgctcctggactgcgaggtggtgcaggtgagcctggtaagaatggtgcc aaaggagagcccggaccacgtggtgaacgcggtgaggctggtattccaggtgttccaggagctaaaggcgaagatggcaaggatggatcacctggagaacctggtgcaaatgggct tccaggagctgcaggagaaaggggtgcccctgggttccgaggacctgctggaccaaatggcatcccaggagaaaagggtcctgctggagagcgtggtgctccaggccctgcaggg cccagaggagctgctggagaacctggcagagatggcgtccctggaggtccaggaatgaggggcatgcccggaagtccaggaggaccaggaagtgatgggaaaccagggcctccc ggaagtcaaggagaaagtggtcgaccaggtcctcctgggccatctggtccccgaggtcagcctggtgtcatgggcttccccggtcctaaaggaaatgatggtgctcctggtaagaatgg agaacgaggtggccctggaggacctggccctcagggtcctcctggaaagaatggtgaaactggacctcagggacccccagggcctactgggcctggtggtgacaaaggagacaca ggaccccctggtccacaaggattacaaggcttgcctggtacaggtggtcctccaggagaaaatggaaaacctggggaaccaggtccaaagggtgatgccggtgcacctggagctcca ggaggcaagggtgatgctggtgcccctggtgaacgtggacctcctggattggcaggggccccaggacttagaggtggagctggtccccctggtcccgaaggaggaaagggtgctgc tggtcctcctgggccacctggtgctgctggtactcctggtctgcaaggaatgcctggagaaagaggaggtcttggaagtcctggtccaaagggtgacaagggtgaaccaggcggtcca ggtgctgatggtgtcccagggaaagatggcccaaggggtcctactggtcctattggtcctcctggcccagctggccagcctggagataagggtgaaggtggtgcccccggacttccag gtatagctggacctcgtggtagccctggtgagagaggtgaaactggccctccaggacctgctggtttccctggtgctcctggacagaatggtgaacctggtggtaaaggagaaagagg ggctccgggtgagaaaggtgaaggaggccctcctggagttgcaggaccccctggaggttctggacctgctggtcctcctggtccccaaggtgtcaaaggtgaacgtggcagtcctggt ggacctggtgctgctggcttccctggtgctcgtggtcttcctggtcctcctggtagtaatggtaacccaggacccccaggtcccagcggttctccaggcaaggatgggcccccaggtcct gcgggtaacactggtgctcctggcagccctggagtgtctggaccaaaaggtgatgctggccaaccaggagagaagggatcgcctggtgcccagggcccaccaggagctccaggcc cacttgggattgctgggatcactggagcacggggtcttgcaggaccaccaggcatgccaggtcctaggggaagccctggccctcagggtgtcaagggtgaaagtgggaaaccagga gctaacggtctcagtggagaacgtggtccccctggaccccagggtcttcctg
gtctggctggtacagctggtgaacctggaagagatggaaaccctggatcagatggtcttccaggccg agatggatctcctggtggcaagggtgatcgtggtgaaaatggctctcctggtgcccctggcgctcctggtcatccaggcccacctggtcctgtcggtccagctggaaagagtggtgaca gaggagaaagtggccctgctggccctgctggtgctcccggtcctgctggttcccgaggtgctcctggtcctcaaggcccacgtggtgacaaaggtgaaacaggtgaacgtggagctgc tggcatcaaaggacatcgaggattccctggtaatccaggtgccccaggttctccaggccctgctggtcagcagggtgcaatcggcagtccaggacctgcaggccccagaggacctgtt ggacccagtggacctcctggcaaagatggaaccagtggacatccaggtcccattggaccaccagggcctcgaggtaacagaggtgaaagaggatctgagggctccccaggccaccc agggcaaccaggccctcctggacctcctggtgcccctggtccttgctgtggtggtgttggagccgctgccattgctgggattggaggtgaaaaagctggcggttttgccccgtattatgga gatgaaccaatggatttcaaaatcaacaccgatgagattatgacttcactcaagtctgttaatggacaaatagaaagcctcattagtcctgatggttctcgtaaaaaccccgctagaaactgc agagacctgaaattctgccatcctgaactcaagagtggagaatactgggttgaccctaaccaaggatgcaaattggatgctatcaaggtattctgtaatatggaaactggggaaacatgca taagtgccaatcctttgaatgttccacggaaacactggtggacagattctagtgctgagaagaaacacgtttggtttggagagtccatggatggtggttttcagtttagctacggcaatcctga acttcctgaagatgtccttgatgtgcagctggcattccttcgacttctctccagccgagcttcccagaacatcacatatcactgcaaaaatagcattgcatacatggatcaggccagtggaaa tgtaaagaaggccctgaagctgatggggtcaaatgaaggtgaattcaaggctgaaggaaatagcaaattcacctacacagttctggaggatggttgcacgaaacacactggggaatgga gcaaaacagtctttgaatatcgaacacgcaaggctgtgagactacctattgtagatattgcaccctatgacattggtggtcctgatcaagaatttggtgtggacgttggccctgtttgctttttat aa-3’(seq id no:335)
[0497]
bmpr2
[0498]5’‑
atgacttcctcgctgcagcggccctggcgggtgccctggctaccatggaccatcctgctggtcagcgctgcggctgcttcgcagaatcaagaacggctatgtgcgtttaaagatccg tatcagcaagaccttgggataggtgagagtagaatctctcatgaaaatgggacaatattatgctcgaaaggtagcacctgctatggcctttgggagaaatcaaaaggggacataaatcttgt aaaacaaggatgttggtctcacattggagatccccaagagtgtcactatgaagaatgtgtagtaactaccactcctccctcaattcagaatggaacataccgtttctgctgttgtagcacagat ttatgtaatgtcaactttactgagaattttccacctcctgacacaacaccactcagtccacctcattcatttaaccgagatgagacaataatcattgctttggcatcagtctctgtattagctgttttg atagttgccttatgctttggatacagaatgttgacaggagaccgtaaacaaggtcttcacagtatgaacatgatggaggcagcagcatccgaaccctctcttgatctagataatctgaaactg ttggagctgattggccgaggtcgatatggagcagtatataaaggctccttggatgagcgtccagttgctgtaaaagtgttttcctttgcaaaccgtcagaattttatcaacgaaaagaacattt acagagtgcctttgatggaacatgacaacattgcccgctttatagttggagatgagagagtcactgcagatggacgcatggaatatttgcttgtgatggagtactatcccaatggatctttatg caagtatttaagtctccacacaagtgactgggtaagctcttgccgtcttgctcattctgttactagaggactggcttatcttcacacagaattaccacgaggagatcattataaacctgcaattt cccatcgagatttaaacagcagaaatgtcctagtgaaaaatgatggaacctgtgttattagtgactttggactgtccatgaggctgactggaaatagactggtgcgcccaggggaggaag ataatgcagccataagcgaggttggcactatcagatatatggcaccagaagtgctagaaggagctgtgaacttgagggactgtgaatcagctttgaaacaagtagacatgtatgctcttgg actaatctattgggagatatttatgagatgtacagacctcttcccaggggaatccgtaccagagtaccagatggcttttcagacagaggttggaaaccatcccacttttgaggatatgcaggt tctcgtgtctagggaaaaacagagacccaagttcccagaagcctggaaagaaaatagcctggcagtgagg
tcactcaaggagacaatcgaagactgttgggaccaggatgcagaggc tcggcttactgcacagtgtgctgaggaaaggatggctgaacttatgatgatttgggaaagaaacaaatctgtgagcccaacagtcaatccaatgtctactgctatgcagaatgaacgcaac ctgtcacataataggcgtgtgccaaaaattggtccttatccagattattcttcctcctcatacattgaagactctatccatcatactgacagcatcgtgaagaatatttcctctgagcattctatgtc cagcacacctttgactataggggaaaaaaaccgaaattcaattaactatgaacgacagcaagcacaagctcgaatccccagccctgaaacaagtgtcaccagcctctccaccaacacaa caaccacaaacaccacaggactcacgccaagtactggcatgactactatatctgagatgccatacccagatgaaacaaatctgcataccacaaatgttgcacagtcaattgggccaaccc ctgtctgcttacagctgacagaagaagacttggaaaccaacaagctagacccaaaagaagttgataagaacctcaaggaaagctctgatgagaatctcatggagcactctcttaaacagtt cagtggcccagacccactgagcagtactagttctagcttgctttacccactcataaaacttgcagtagaagcaactggacagcaggacttcacacagactgcaaatggccaagcatgtttg attcctgatgttctgcctactcagatctatcctctccccaagcagcagaaccttcccaagagacctactagtttgcctttgaacaccaaaaattcaacaaaagagccccggctaaaatttggc agcaagcacaaatcaaacttgaaacaagtcgaaactggagttgccaagatgaatacaatcaatgcagcagaacctcatgtggtgacagtcaccatgaatggtgtggcaggtagaaacca cagtgttaactcccatgctgccacaacccaatatgccaatgggacagtactatctggccaaacaaccaacatagtgacacatagggcccaagaaatgttgcagaatcagtttattggtgag gacacccggctgaatattaattccagtcctgatgagcatgagcctttactgagacgagagcaacaagctggccatgatgaaggtgttctggatcgtcttgtggacaggagggaacggcca ctagaaggtggccgaactaattccaataacaacaacagcaatccatgttcagaacaagatgttcttgcacagggtgttccaagcacagcagcagatcctgggccatcaaagcccagaag agcacagaggcctaattctctggatctttcagccacaaatgtcctggatggcagcagtatacagataggtgagtcaacacaagatggcaaatcaggatcaggtgaaaagatcaagaaac gtgtgaaaactccctattctcttaagcggtggcgcccctccacctgggtcatctccactgaatcgctggactgtgaagtcaacaataatggcagtaacagggcagttcattccaaatccagc actgctgtttaccttgcagaaggaggcactgctacaaccatggtgtctaaagatataggaatgaactgtctgtga-3’(seq id no:336)
[0499]
ahi1
[0500]5’‑
atgcctacagctgagagtgaagcaaaagtaaaaaccaaagttcgctttgaagaattgcttaagacccacagtgatctaatgcgtgaaaagaaaaaactgaagaaaaaacttgtcaggt ctgaagaaaacatctcacctgacactattagaagcaatcttcactatatgaaagaaactacaagtgatgatcccgacactattagaagcaatcttccccatattaaagaaactacaagtgatg atgtaagtgctgctaacactaacaacctgaagaagagcacgagagtcactaaaaacaaattgaggaacacacagttagcaactgaaaatcctaatggtgatgctagtgtagaggaagac aaacaaggaaagccaaataaaaaggtgataaagacggtgccccagttgactacacaagacctgaaaccggaaactcctgagaataaggttgattctacacaccagaaaacacatacaa agccacagccaggcgttgatcatcagaaaagtgagaaggcaaatgagggaagagaagagactgatttagaagaggatgaagaattgatgcaagcatatcagtgccatgtaactgaaga aatggcaaaggagattaagaggaaaataagaaagaaactgaaagaacagttgacttactttccctcagatactttattccatgatgacaaactaagcagtgaaaaaaggaaaaagaaaaa ggaagttccagtcttctctaaagctgaaacaagtacattgaccatctctggtgacacagttgaaggtgaacaaaagaaagaatcttcagttagatcagtttcttcagattctcatcaagatgat gaaataagctcaatggaacaaagcacagaagacagcatgcaagatgatacaaaacctaaaccaaaaaaaacaaaaaagaagactaaagcagttgcagataataatgaagatgttgatg gtgatggtgttcatgaaataacaagccgagatagcccggtttatcccaaatgtttgcttgatgatgaccttgtcttgggagtttacattcaccgaactgatagacttaagtcagattttatgatttc tcacccaatggtaaaaattcatgtggttgatgagc
atactggtcaatatgtcaagaaagatgatagtggacggcctgtttcatcttactatgaaaaagagaatgtggattatattcttcctattat gacccagccatatgattttaaacagttaaaatcaagacttccagagtgggaagaacaaattgtatttaatgaaaattttccctatttgcttcgaggctctgatgagagtcctaaagtcatcctgtt ctttgagattcttgatttcttaagcgtggatgaaattaagaataattctgaggttcaaaaccaagaatgtggctttcggaaaattgcctgggcatttcttaagcttctgggagccaatggaaatgc aaacatcaactcaaaacttcgcttgcagctatattacccacctactaagcctcgatccccattaagtgttgttgaggcatttgaatggtggtcaaaatgtccaagaaatcattacccatcaacac tgtacgtaactgtaagaggactgaaagttccagactgtataaagccatcttaccgctctatgatggctcttcaggaggaaaaaggtaaaccagtgcattgtgaacgtcaccatgagtcaagc tcagtagacacagaacctggattagaagagtcaaaggaagtaataaagtggaaacgactccctgggcaggcttgccgtatcccaaacaaacacctcttctcactaaatgcaggagaacg aggatgtttttgtcttgatttctcccacaatggaagaatattagcagcagcttgtgccagccgggatggatatccaattattttatatgaaattccttctggacgtttcatgagagaattgtgtggc cacctcaatatcatttatgatctttcctggtcaaaagatgatcactacatccttacttcatcatctgatggcactgccaggatatggaaaaatgaaataaacaatacaaatactttcagagttttac ctcatccttcttttgtttacacggctaaattccatccagctgtaagagagctagtagttacaggatgctatgattccatgatacggatatggaaagttgagatgagagaagattctgccatattg gtccgacagtttgacgttcacaaaagttttatcaactcactttgttttgatactgaaggtcatcatatgtattcaggagattgtacaggggtgattgttgtttggaatacctatgtcaagattaatga tttggaacattcagtgcaccactggactataaataaggaaattaaagaaactgagtttaagggaattccaataagttatttggagattcatcccaatggaaaacgtttgttaatccataccaaag acagtactttgagaattatggatctccggatattagtagcaaggaagtttgtaggagcagcaaattatcgggagaagattcatagtactttgactccatgtgggacttttctgtttgctggaagt gaggatggtatagtgtatgtttggaacccagaaacaggagaacaagtagccatgtattctgacttgccattcaagtcacccattcgagacatttcttatcatccatttgaaaatatggttgcatt ctgtgcatttgggcaaaatgagccaattcttctgtatatttacgatttccatgttgcccagcaggaggctgaaatgttcaaacgctacaatggaacatttccattacctggaatacaccaaagtc aagatgccctatgtacctgtccaaaactaccccatcaaggctcttttcagattgatgaatttgtccacactgaaagttcttcaacgaagatgcagctagtaaaacagaggcttgaaactgtcac agaggtgatacgttcctgtgctgcaaaagtcaacaaaaatctctcatttacttcaccaccagcagtttcctcacaacagtctaagttaaagcagtcaaacatgctgaccgctcaagagattcta catcagtttggtttcactcagaccgggattatcagcatagaaagaaagccttgtaaccatcaggtagatacagcaccaacggtagtggctctttatgactacacagcgaatcgatcagatga actaaccatccatcgcggagacattatccgagtgtttttcaaagataatgaagactggtggtatggcagcataggaaagggacaggaaggttattttccagctaatcatgtggctagtgaaa cactgtatcaagaactgcctcctgagataaaggagcgatcccctcctttaagccctgaggaaaaaactaaaatagaaaaatctccagctcctcaaaagcaatcaatcaataagaacaagtc ccaggacttcagactaggctcagaatctatgacacattctgaaatgagaaaagaacagagccatgaggaccaaggacacataatggatacacggatgaggaagaacaagcaagcagg cagaaaagtcactctaatagagta-3’(seq id no:337)
[0501]
fancc
[0502]5’‑
atggctcaagattcagtagatctttcttgtgattatcagttttggatgcagaagctttctgtatgggatcaggcttccactttggaaacccagcaagacacctgtcttcacgtggctcagttc caggagttcctaaggaagatgtatgaagccttgaaagagatggattctaatacagtcattgaaagattccccacaattggtcaactgttggcaaaagcttgttggaatccttttattttagcatat gatgaaagccaaaaaattctaatatggtgcttatgttgtctaattaacaaagaaccacagaattctggacaatcaaaacttaactcctggatacagggtgtattatctcatatacttt
cagcactc agatttgataaagaagttgctcttttcactcaaggtcttgggtatgcacctatagattactatcctggtttgcttaaaaatatggttttatcattagcgtctgaactcagagagaatcatcttaatgg atttaacactcaaaggcgaatggctcccgagcgagtggcgtccctgtcacgagtttgtgtcccacttattaccctgacagatgttgaccccctggtggaggctctcctcatctgtcatggacg tgaacctcaggaaatcctccagccagagttctttgaggctgtaaacgaggccattttgctgaagaagatttctctccccatgtcagctgtagtctgcctctggcttcggcaccttcccagcctt gaaaaagcaatgctgcatctttttgaaaagctaatctccagtgagagaaattgtctgagaaggatcgaatgctttataaaagattcatcgctgcctcaagcagcctgccaccctgccatattc cgggttgttgatgagatgttcaggtgtgcactcctggaaaccgatggggccctggaaatcatagccactattcaggtgtttacgcagtgctttgtagaagctctggagaaagcaagcaagc agctgcggtttgcactcaagacctactttccttacacttctccatctcttgccatggtgctgctgcaagaccctcaagatatccctcggggacactggctccagacactgaagcatatttctga actgctcagagaagcagttgaagaccagactcatgggtcctgcggaggtccctttgagagctggttcctgttcattcacttcggaggatgggctgagatggtggcagagcaattactgatg tcggcagccgaaccccccacggccctgctgtggctcttggccttctactacggcccccgtgatgggaggcagcagagagcacagactatggtccaggtgaaggccgtgctgggccac ctcctggcaatgtccagaagcagcagcctctcagcccaggacctgcagacggtagcaggacagggcacagacacagacctcagagctcctgcacaacagctgatcaggcaccttctc ctcaacttcctgctctgggctcctggaggccacacgatcgcctgggatgtcatcaccctgatggctcacactgctgagataactcacgagatcattggctttcttgaccagaccttgtacag atggaatcgtcttggcattgaaagccctagatcagaaaaactggcccgagagctccttaaagagctgcgaactcaagtctag-3’(seq id no:338)
[0503]
mybpc3
[0504]5’‑
atgcctgagccggggaagaagccagtctcagcttttagcaagaagccacggtcagtggaagtggccgcaggcagccctgccgtgttcgaggccgagacagagcgggcaggag tgaaggtgcgctggcagcgcggaggcagtgacatcagcgccagcaacaagtacggcctggccacagagggcacacggcatacgctgacagtgcgggaagtgggccctgccgacc agggatcttacgcagtcattgctggctcctccaaggtcaagttcgacctcaaggtcatagaggcagagaaggcagagcccatgctggcccctgcccctgcccctgctgaggccactgg agcccctggagaagccccggccccagccgctgagctgggagaaagtgccccaagtcccaaagggtcaagctcagcagctctcaatggtcctacccctggagcccccgatgacccca ttggcctcttcgtgatgcggccacaggatggcgaggtgaccgtgggtggcagcatcaccttctcagcccgcgtggccggcgccagcctcctgaagccgcctgtggtcaagtggttcaa gggcaaatgggtggacctgagcagcaaggtgggccagcacctgcagctgcacgacagctacgaccgcgccagcaaggtctatctgttcgagctgcacatcaccgatgcccagcctg ccttcactggcagctaccgctgtgaggtgtccaccaaggacaaatttgactgctccaacttcaatctcactgtccacgaggccatgggcaccggagacctggacctcctatcagccttccg ccgcacgagcctggctggaggtggtcggcggatcagtgatagccatgaggacactgggattctggacttcagctcactgctgaaaaagagagacagtttccggaccccgagggactc gaagctggaggcaccagcagaggaggacgtgtgggagatcctacggcaggcacccccatctgagtacgagcgcatcgccttccagtacggcgtcactgacctgcgcggcatgctaa agaggctcaagggcatgaggcgcgatgagaagaagagcacagcctttcagaagaagctggagccggcctaccaggtgagcaaaggccacaagatccggctgaccgtggaactgg ctgaccatgacgctgaggtcaaatggctcaagaatggccaggagatccagatgagcggcagcaagtacatctttgagtccatcggtgccaagcgtaccctgaccatcagccagtgctca ttggcggacgacgcagcctaccagtgcgtggtgggtggcgagaagtgtagcacggagctctttgtgaaagagccccctgtgctcatcacgcgccccttggaggaccagctggtgatgg tggggcagcgggtggagtttgagtgtgaagtatcggaggagggggcgcaagtcaaatggctgaaggacggggtggagctgacccgggaggagaccttc
aaataccggttcaagaa ggacgggcagagacaccacctgatcatcaacgaggccatgctggaggacgcggggcactatgcactgtgcactagcgggggccaggcgctggctgagctcattgtgcaggaaaag aagctggaggtgtaccagagcatcgcagacctgatggtgggcgcaaaggaccaggcggtgttcaaatgtgaggtctcagatgagaatgttcggggtgtgtggctgaagaatgggaag gagctggtgcccgacagccgcataaaggtgtcccacatcgggcgggtccacaaactgaccattgacgacgtcacacctgccgacgaggctgactacagctttgtgcccgagggcttcg cctgcaacctgtcagccaagctccacttcatggaggtcaagattgacttcgtacccaggcaggaacctcccaagatccacctggactgcccaggccgcataccagacaccattgtggttg tagctggaaataagctacgtctggacgtccctatctctggggaccctgctcccactgtgatctggcagaaggctatcacgcaggggaataaggccccagccaggccagccccagatgc cccagaggacacaggtgacagcgatgagtgggtgtttgacaagaagctgctgtgtgagaccgagggccgggtccgcgtggagaccaccaaggaccgcagcatcttcacggtcgag ggggcagagaaggaagatgagggcgtctacacggtcacagtgaagaaccctgtgggcgaggaccaggtcaacctcacagtcaaggtcatcgacgtgccagacgcacctgcggccc ccaagatcagcaacgtgggagaggactcctgcacagtacagtgggagccgcctgcctacgatggcgggcagcccatcctgggctacatcctggagcgcaagaagaagaagagcta ccggtggatgcggctgaacttcgacctgattcaggagctgagtcatgaagcgcggcgcatgatcgagggcgtggtgtacgagatgcgcgtctacgcggtcaacgccatcggcatgtcc aggcccagccctgcctcccagcccttcatgcctatcggtccccccagcgaacccacccacctggcagtagaggacgtctctgacaccacggtctccctcaagtggcggcccccagag cgcgtgggagcaggaggcctggatggctacagcgtggagtactgcccagagggctgctcagagtgggtggctgccctgcaggggctgacagagcacacatcgatactggtgaagg acctgcccacgggggcccggctgcttttccgagtgcgggcacacaatatggcagggcctggagcccctgttaccaccacggagccggtgacagtgcaggagatcctgcaacggcca cggcttcagctgcccaggcacctgcgccagaccattcagaagaaggtcggggagcctgtgaaccttctcatccctttccagggcaagccccggcctcaggtgacctggaccaaagag gggcagcccctggcaggcgaggaggtgagcatccgcaacagccccacagacaccatcctgttcatccgggccgctcgccgcgtgcattcaggcacttaccaggtgacggtgcgcatt gagaacatggaggacaaggccacgctggtgctgcaggttgttgacaagccaagtcctccccaggatctccgggtgactgacgcctggggtcttaatgtggctctggagtggaagccac cccaggatgtcggcaacacggagctctgggggtacacagtgcagaaagccgacaagaagaccatggagtggttcaccgtcttggagcattaccgccgcacccactgcgtggtgcca gagctcatcattggcaatggctactacttccgcgtcttcagccagaatatggttggctttagtgacagagcggccaccaccaaggagcccgtctttatccccagaccaggcatcacctatg agccacccaactataaggccctggacttctccgaggccccaagcttcacccagcccctggtgaaccgctcggtcatcgcgggctacactgctatgctctgctgtgctgtccggggtagcc ccaagcccaagatttcctggttcaagaatggcctggacctgggagaagacgcccgcttccgcatgttcagcaagcagggagtgttgactctggagattagaaagccctgcccctttgacg ggggcatctatgtctgcagggccaccaacttacagggcgaggcacggtgtgagtgccgcctggaggtgcgagtgcctcagtga-3’(seq id no:339)
[0505]
il2rg
[0506]5’‑
atgttgaagccatcattaccattcacatccctcttattcctgcagctgcccctgctgggagtggggctgaacacgacaattctgacgcccaatgggaatgaagacaccacagctgattt cttcctgaccactatgcccactgactccctcagtgtttccactctgcccctcccagaggttcagtgttttgtgttcaatgtcgagtacatgaattgcacttggaacagcagctctgagccccag cctaccaacctcactctgcattattggtacaagaactcggataatgataaagtccagaagtgcagccactatctattctctgaagaaatcacttctggctgtcagttgcaaaaaaaggagatc cacctctaccaaacatttgttgttcagctccaggacccacgggaacccaggagacaggccacacagatgctaaaac
tgcagaatctggtgatcccctgggctccagagaacctaacactt cacaaactgagtgaatcccagctagaactgaactggaacaacagattcttgaaccactgtttggagcacttggtgcagtaccggactgactgggaccacagctggactgaacaatcagtg gattatagacataagttctccttgcctagtgtggatgggcagaaacgctacacgtttcgtgttcggagccgctttaacccactctgtggaagtgctcagcattggagtgaatggagccaccc aatccactgggggagcaatacttcaaaagagaatcctttcctgtttgcattggaagccgtggttatctctgttggctccatgggattgattatcagccttctctgtgtgtatttctggctggaacg gacgatgccccgaattcccaccctgaagaacctagaggatcttgttactgaataccacgggaacttttcggcctggagtggtgtgtctaagggactggctgagagtctgcagccagacta cagtgaacgactctgcctcgtcagtgagattcccccaaaaggaggggcccttggggaggggcctggggcctccccatgcaaccagcatagcccctactgggcccccccatgttacac cctaaagcctgaaacctga-3’(seq id no:340)
[0507]
讨论
[0508]
基因组编辑技术正在彻底改变生物医学研究。高活性核酸酶，诸如锌指核酸酶(zfn)1，转录激活因子样效应子核酸酶(talen)
2-4
和crispr的cas蛋白(聚簇规则间隔短回文重复序列)系统
5-7
已成功工程化成可操纵无数生物中的基因组。最近，已经利用脱氨基酶精确地改变了基因密码而不破坏双链 dna。通过将胞苷或腺苷脱氨酶与crispr-cas9系统联合，研究人员创建了可编程的碱基编辑器，使基因组dna中的c
·
g转化为t
·
a或a
·
t转化为 g
·c8-10
，为纠正致病突变提供新的机会。
[0509]
除了dna之外，rna是用于基因校正的引人注目的靶标，因为rna修饰可以改变蛋白质功能而不会对基因组产生任何永久性变化。目前已利用 adar腺苷脱氨酶对rna实现精确的碱基编辑。在哺乳动物中已鉴定出三种 adar蛋白，即adar1(亚型p110和p150)，adar2和adar3(催化失活)
11,12
，其底物是双链rna，其中与胞嘧啶(c)错配的腺苷(a)优先被脱氨基为肌苷 (i)。肌苷被认为在翻译过程中可模拟鸟苷(g)
13,14
。为了实现靶向rna编辑，将adar蛋白或其催化结构域与λn肽
15-17
，snap-tag
18-22
或cas蛋白 (dcas13b)
23
融合，并设计了一个指导rna来募集嵌合的adar蛋白至特定位点。或者，也有报道称过表达的adar1或adar2蛋白与带有r/g基序的指导rna一起可以实现靶向rna的编辑
24-27
。
[0510]
在哺乳动物系统中所有这些已报道的核酸编辑方法都依赖于两种成分的异位表达：一种酶和一种指导rna。尽管这些二进制系统在大多数研究中都能有效地工作，但是某些固有的障碍限制了它们的广泛应用，尤其是在治疗中。因为基因治疗最有效的体内递送是通过病毒载体
28
，并且高度理想的腺相关病毒(aav)载体受到负荷大小(4.5kb)的限制，因此使同时容纳蛋白质和指导rna成为挑战
29,30
。最近有报道称，由于rna的过度过度编辑
31
， adar1的过度表达赋予多发性骨髓瘤致癌性，并产生大量的全局脱靶编辑
32
。此外，异位表达蛋白质或其非人类来源的结构域具有引发免疫原性的潜在风险
30,33
。此外，预先存在的适应性免疫和p53介导的dna损伤反应可能会损害治疗性蛋白质(诸如cas9
34-38
)的功效。尽管已经尝试利用内源性机制进行 rna编辑，但是仅通过将预组装的靶标转录物：rna双链体注射入非洲爪蟾 (xenopus)胚胎中进行尝试。非常需要不依赖蛋白质异位表达的强健的核酸编辑替代技术。在这里，我们开发了一种利用内源性adar进行rna编辑的新方法。我们表明，表达经过精心设计的指导rna可以对内源rna进行高效且精确的编辑，并纠正致病突变。该一元核酸编辑平台可以为治疗和研究开辟新的途径。
[0511]
特别地，我们表明具有足够长度的线性arrna的表达能够引导内源 adar蛋白在靶
标转录物上将腺苷编辑成肌苷。该系统称为leaper，它利用内源性adar蛋白来实现可编程的核酸编辑，因此比现有方法具有优势。
[0512]
leaper的罕见品质是其简单性，因为它仅依赖于小分子rna来引导内源蛋白质进行rna编辑。这使人想起rnai，其中小的dsrna可以调用靶向 rna降解的天然机制
51
。由于体积小，arrna可以很容易地通过多种病毒和非病毒载体递送。与rnai不同，leaper催化精确的a至i转换，而不会产生目标转录物的切割或降解(图18a)。尽管arrna的长度要求比rnai长，但它既不诱导细胞水平的免疫刺激作用(图22e，f和图29e)，也不影响内源性 adar蛋白的功能(图22a，b)，使其为rna靶向的安全策略。引人注目的是，据报道，adar蛋白或其催化结构域的异位表达会引起大量全局脱靶编辑
32
，并可能引发癌症
31
。
[0513]
最近，几个研究小组报道，由于效应蛋白的表达，胞嘧啶碱基编辑器可在小鼠胚胎，水稻或人类细胞系中产生大量脱靶的单核苷酸变体，这说明了 leaper在潜在治疗应用中的优势
52-54
。令人欣慰的是，leaper能够进行有效的编辑，同时又引起罕见的全局脱靶编辑(图20和图21)。此外，leaper 可以最大程度地减少潜在的免疫原性或克服其他需要引入外源蛋白质的方法通常存在的递送障碍。
[0514]
对于leaper，我们建议使用最小大小高于70-nt的arrna以实现所需的活性。在天然环境中，adar蛋白非特异性编辑具有300-nt以上双链体的alu 重复序列
55
。值得注意的是，alu重复序列形成稳定的分子内双链体，而 leaper导致arrna与mrna或pre-mrna之间的分子间双链体，这应该是不稳定的，更难以形成。因此，我们假设长于70nt的rna双链体在化学计量上对于募集或船坞adar蛋白进行有效编辑很重要。实际上，更长的arrna导致异位表达的报道分子和内源转录物的更高编辑产量(图16d和图17b)。但是，由于adar蛋白混杂地使rna双链体中的腺苷碱基脱氨基，因此更长的 arrna可能在靶向窗口内引起更多的脱靶。
[0515]
虽然leaper可以有效地靶向天然转录物，但是它们的编辑效率和脱靶率却有所不同。对于ppib转录物靶向，我们可以将50％的靶向腺苷转化为肌苷，而在覆盖窗口内没有明显的脱靶(图17b，f)。对于其他转录物，脱靶变得更加严重。我们设法减少了脱靶，诸如引入a-g错配或连续错配以抑制不希望的编辑。但是，太多的错配会降低上靶效率。考虑到效率和潜在的脱靶，我们建议使用长度在100到150-nt之间的arrna对内源转录物进行编辑。如果有选择，最好选择腺苷较少的区域，以最大程度地减少不想要的编辑的机会。令人鼓舞的是，我们没有在arrna靶向的转录双链体之外检测到任何脱靶(图20)。
[0516]
我们已经优化了arrna的设计以实现提高的编辑效率，并证明了可以利用leaper来操纵基因功能或纠正致病突变。我们还表明，leaper不仅限于在uag上运行，它还可以与任何腺苷一起使用，而不管其侧翼核苷酸如何 (图16f，g和图17c)。这样的灵活性对于由某些单点突变引起的遗传疾病的潜在治疗校正是有利的。有趣的是，在编辑idua转录物时，靶向pre-mrna 的arrna比靶向成熟rna更有效，这表明核是adar蛋白的主要作用位点，并且leaper可通过修饰pre-mrna中的剪接位点来操纵剪接。更重要的是， leaper证明了同时靶向多个基因转录物的高效性(图17d)。leaper的这种多路复用能力可能会在将来用于治疗某些多基因疾病。
[0517]
在rna水平上进行遗传校正是有益的。首先，在目标转录物上进行编辑不会永久改变基因组或全套转录组(transcriptome repertoire)，从而使rna 编辑方法比基因组编辑方法更安全地用于治疗。此外，暂时编辑非常适合于临时控制治疗特定状态偶尔改变导致
的疾病。其次，leaper和其他rna编辑方法不会在基因组上引入dsb，从而避免了产生不希望的大dna片段缺失的风险
37
。采用切口酶cas9的dna碱基编辑方法仍可在基因组中产生插入缺失8。此外，独立于天然dna修复机制，leaper也应在有丝分裂后的细胞中起作用，诸如adar2高表达的小脑细胞
11
。
[0518]
我们已经证明，leaper可以应用于广泛的细胞类型，诸如人类细胞系 (图14c)，小鼠细胞系(图14d)和包括原代t细胞的人类原代细胞(图27和图 28d)。通过慢病毒递送或合成的寡核苷酸进行的有效编辑为治疗发展提供了更大的潜力(图28)。此外，leaper可以在多种应用中产生表型或生理变化，包括恢复p53的转录调控活性(图7)，纠正致病突变(图26)以及恢复源自hurler 综合征患者原代成纤维细胞的α-l-艾杜糖醛酸酶活性(图29)。因此可以设想，leaper在疾病治疗方面具有巨大潜力。
[0519]
stafforst及其同事报道了一种新的，看似相似的rna编辑方法，称为 restore，其通过使用合成的反义寡核苷酸募集内源性adar而起作用
56
。 restore和leaper之间的根本区别在于用于募集内源性adar的指导 rna的独特性质。restore的指导rna限于化学合成反义寡核苷酸(aso)，具体取决于复杂的化学修饰，而leaper的arrna可以多种方式生成，可以通过病毒或非病毒载体进行化学合成和表达(图28和图29)。重要的是，aso 经过大量化学修饰，因此只能在疾病治疗中短暂起作用。相比之下，arrna 可以通过表达产生，一种对于不断编辑而言尤其重要的特征。
[0520]
关于leaper的效率和特异性，仍有改进的余地。由于leaper依赖于内源性adar，因此靶细胞中adar蛋白的表达水平是成功编辑的决定因素之一。根据先前的报道
57
和我们的观察(图14a，b)，adar1
p110
在组织中普遍表达，确保了leaper的广泛适用性。adar1
p150
是干扰素诱导的同种型
58
，并已证明在leaper中具有功能(图11e，图12b)。因此，在某些情况下，干扰素刺激性rna与arrna的共转染可能会进一步提高编辑效率。或者，由于 adar3发挥抑制作用，因此抑制adar3可能会增强表达adar3的细胞的编辑效率。此外，arrna的其他修饰可能会提高其编辑效率。例如，与某些adar 募集支架融合的arrna可能会增加局部adar蛋白浓度，从而提高编辑产量。到目前为止，我们只能利用内源性adar1/2蛋白进行a至i碱基的转化。探索是否可以类似地利用更多的天然机制来修饰遗传元件，特别是实现有效的核酸编辑，是令人兴奋的。
[0521]
总体上，我们提供了原理证明，可以共同选择细胞中的内源性机制来编辑rna转录物。我们证明了leaper是一个简单，高效和安全的系统，为基于基因编辑的疗法和研究开辟了一条新途径。
[0522]
参考文献
[0523]
1 porteus,m.h.&carroll,d.gene targeting using zinc finger nucleases. nat biotechnol 23,967-973(2005).
[0524]
2 boch,j.et al.breaking the code of dna binding specificity of tal-type iii effectors.science 326,1509-1512(2009).
[0525]
3 moscou,m.j.&bogdanove,a.j.a simple cipher governs dna recognition by tal effectors.science 326,1501(2009).
[0526]
4 miller,j.c.et al.a tale nuclease architecture for efficient genome editing.nat biotechnol 29,143-148(2011).
[0527]
5 jinek,m.et al.a programmable dual-rna-guided dna endonuclease in adaptive bacterial immunity.science 337,816-821(2012).
[0528]
6 cong,l.et al.multiplex genome engineering using crispr/cas systems. science 339,819-823(2013).
[0529]
7 mali,p.et al.rna-guided human genome engineering via cas9.science 339,823-826(2013).
[0530]
8 komor,a.c.,kim,y.b.,packer,m.s.,zuris,j.a.&liu,d.r. programmable editing of a target base in genomic dna without double-stranded dna cleavage.nature 533,420-424(2016).
[0531]
9 ma,y.et al.targeted aid-mediated mutagenesis(tam)enables efficient genomic diversification in mammalian cells.nat methods 13,1029-1035 (2016).
[0532]
10 gaudelli,n.m.et al.programmable base editing of a*t to g*c in genomic dna without dna cleavage.nature 551,464-471(2017).
[0533]
11 tan,m.h.et al.dynamic landscape and regulation of rna editing in mammals.nature 550,249-254(2017).
[0534]
12 nishikura,k.functions and regulation of rna editing by adar deaminases.annu rev biochem 79,321-349(2010).
[0535]
13 bass,b.l.&weintraub,h.an unwinding activity that covalently modifies its double-stranded rna substrate.cell 55,1089-1098(1988). 14 wong,s.k.,sato,s.&lazinski,d.w.substrate recognition by adar1 and adar2.rna 7,846-858(2001).
[0536]
15 montiel-gonzalez,m.f.,vallecillo-viejo,i.,yudowski,g.a.& rosenthal,j.j.correction of mutations within the cystic fibrosis transmembrane conductance regulator by site-directed rna editing.proc natl acad sci u s a 110,18285-18290(2013).
[0537]
16 sinnamon,j.r.et al.site-directed rna repair of endogenous mecp2 rna in neurons.proc natl acad sci u s a 114,e9395-e9402(2017).
[0538]
17 montiel-gonzalez,m.f.,vallecillo-viejo,i.c.&rosenthal,j.j.an efficient system for selectively altering genetic information within mrnas. nucleic acids res 44,e157(2016).
[0539]
18 hanswillemenke,a.,kuzdere,t.,vogel,p.,jekely,g.&stafforst,t. site-directed rna editing in vivo can be triggered by the light-driven assembly of an artificial riboprotein.j am chem soc 137,15875-15881 (2015).
[0540]
19 schneider,m.f.,wettengel,j.,hoffmann,p.c.&stafforst,t.optimal guidernas for re-directing deaminase activity of hadar1 and hadar2 in trans.nucleic acids res 42,e87(2014).
[0541]
20 vogel,p.,hanswillemenke,a.&stafforst,t.switching protein localization by site-directed rna editing under control of light.acs synthetic biology 6,1642-1649(2017).
immunity to cas9 proteins in humans.nat med 25,249-254(2019).
[0558]
37 haapaniemi,e.,botla,s.,persson,j.,schmierer,b.&taipale,j. crispr-cas9 genome editing induces a p53-mediated dna damage response.nat med 24,927-930(2018).
[0559]
38 ihry,r.j.et al.p53 inhibits crispr-cas9 engineering in human pluripotent stem cells.nat med 24,939-946(2018).
[0560]
39 woolf,t.m.,chase,j.m.&stinchcomb,d.t.toward the therapeutic editing of mutated rna sequences.proc natl acad sci u s a 92, 8298-8302(1995).
[0561]
40 zheng,y.,lorenzo,c.&beal,p.a.dna editing in dna/rna hybrids by adenosine deaminases that act on rna.nucleic acids res 45, 3369-3377(2017).
[0562]
41 abudayyeh,o.o.et al.c2c2 is a single-component programmable rna-guided rna-targeting crispr effector.science 353,aaf5573 (2016).
[0563]
42 daniel,c.,widmark,a.,rigardt,d.&ohman,m.editing inducer elements increases a-to-i editing efficiency in the mammalian transcriptome.genome biol 18,195(2017).
[0564]
43 chen,c.x.et al.a third member of the rna-specific adenosine deaminase gene family,adar3,contains both single-and double-stranded rna binding domains.rna 6,755-767(2000).
[0565]
44 savva,y.a.,rieder,l.e.&reenan,r.a.the adar protein family. genome biol 13,252(2012).
[0566]
45 nishikura,k.a-to-i editing of coding and non-coding rnas by adars. nat rev mol cell biol 17,83-96(2016).
[0567]
46 floquet,c.,deforges,j.,rousset,j.p.&bidou,l.rescue of non-sense mutated p53 tumor suppressor gene by aminoglycosides.nucleic acids res 39,3350-3362(2011).
[0568]
47 kern,s.e.et al.identification of p53 as a sequence-specific dna-binding protein.science 252,1708-1711(1991).
[0569]
48 doubrovin,m.et al.imaging transcriptional regulation of p53-dependent genes with positron emission tomography in vivo.proc natl acad sci u s a 98,9300-9305(2001).
[0570]
49 landrum,m.j.et al.clinvar:public archive of interpretations of clinically relevant variants.nucleic acids res 44,d862-868(2016).
[0571]
50 ou,l.et al.zfn-mediated in vivo genome editing corrects murine hurler syndrome.mol ther 27,178-187(2019).
[0572]
51 fire,a.et al.potent and specific genetic interference by double-stranded rna in caenorhabditis elegans.nature 391,806-811(1998).
[0573]
52 zuo,e.et al.cytosine base editor generates substantial off-target single-nucleotide variants in mouse embryos.science(2019).
[0574]
53 jin,s.et al.cytosine,but not adenine,base editors induce genome-wide off-target mutations in rice.science(2019).
[0575]
54 kim,d.,kim,d.e.,lee,g.,cho,s.i.&kim,j.s.genome-wide target specificity of crispr rna-guided adenine base editors.nat biotechnol 37,430-435(2019).
[0576]
55 levanon,e.y.et al.systematic identification of abundant a-to-i editing sites in the human transcriptome.nat biotechnol 22,1001-1005(2004).
[0577]
56 merkle,t.et al.precise rna editing by recruiting endogenous adars with antisense oligonucleotides.nat biotechnol 37,133-138(2019).
[0578]
57 wagner,r.w.et al.double-stranded rna unwinding and modifying activity is detected ubiquitously in primary tissues and cell lines.mol cell biol 10,5586-5590(1990).
[0579]
58 patterson,j.b.&samuel,c.e.expression and regulation by interferon of a double-stranded-rna-specific adenosine deaminase from human cells: evidence for two forms of the deaminase.mol cell biol 15,5376-5388 (1995).
[0580]
59 gibson,d.g.et al.enzymatic assembly of dna molecules up to several hundred kilobases.nat methods 6,343-345(2009).
[0581]
60 zhou,y.,zhang,h.&wei,w.simultaneous generation of multi-gene knockouts in human cells.febs lett 590,4343-4353(2016).
[0582]
61 dobin,a.et al.star:ultrafast universal rna-seq aligner. bioinformatics 29,15-21(2013).
[0583]
62 van der auwera,g.a.et al.from fastq data to high confidence variant calls:the genome analysis toolkit best practices pipeline.curr protoc bioinformatics 43,11 10 11-33(2013).
[0584]
63 wang,k.,li,m.&hakonarson,h.annovar:functional annotation of genetic variants from high-throughput sequencing data.nucleic acids res 38,e164(2010).
[0585]
64 genomes project,c.et al.an integrated map of genetic variation from 1,092 human genomes.nature 491,56-65(2012).
[0586]
65 pertea,m.,kim,d.,pertea,g.m.,leek,j.t.&salzberg,s.l. transcript-level expression analysis of rna-seq experiments with hisat, stringtie and ballgown.nat protoc 11,1650-1667(2016).

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：魏文胜璩良伊宗裔朱诗优王春慧曹中正周卓袁鹏飞
技术所有人：北京辑因医疗科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。