新型微rna筛选方法、验证系统及其应用的制作方法
【专利摘要】本发明公开了新型微RNA筛选方法、验证系统及其应用。本发明的筛选验证系统可简单快速经济地检测hetRNA的表达。本发明为天然hetRNA的筛选验证提供了一个方便可行的路径和方法,为将来大规模的发现验证hetRNA提供了强大的技术支撑。本发明还提供了新的构建用于RNA筛选数据库的方法。
【专利说明】新型微RNA筛选方法、验证系统及其应用
【技术领域】
[0001] 本发明属于生物【技术领域】,特别涉及一种新型微RNA(hetRNA)筛选系统的构建方 法及其应用。
【背景技术】
[0002] 最近的研究表明,真核基因组90%以上的序列都会被转录,产生大量的非编 码 RNA(ncRNAs) 【Costa FF.,Bioessays2010;32(7):599-608;Carninci P,Yasuda J,Hayashizaki Υ·,Curr Opin Cell Biol2008;20(3):274-280】,包括长的非编码 RNA(lncRNAs)和小的非编码(sRNAs〈200nt)。sRNAs几乎能直接或间接影响细胞的每一个 生物学活动【Czech B, Hannon GJ·,Nat Rev Genet 2010;12(1):19-31】。自从 1993 年发 现microRNAs ( -种sRNA)以来,解析小RNA组学(sRNAome)已经成了很多实验室的目标 【Lee RC,Feinbaum RL,Ambros V·,Celll993;75(5):843-854】。这导致多种功能性的内源 微RNA(〈30nt)的发现【Choudhuri S.,JBiochem Mol Toxicol2010;24(3) :195-216. ;Taft RJ, Pang KC, Mercer TR, Dinger M, Mattick JS. , J Pathol 2009;220 (2):126-139. ;Li Z,Kim Sff, Lin Y et al. ,J Virol2009;83(24):12751-12758. ;Taft RJ, Simons C, Nahkuri S et al.,Nat Struct Mol Biol;17(8):1030-1034】。但是,这些微 RNA-般是连续地存在 于对应的基因组上。
[0003] 最近发展起来的深度测序技术(deep sequencing)特别适合于发现微RNA 【Hafner M,Landgraf P, Ludwig J et al·,Methods 2008;44(1):3_12】。深度测序技术 可以产生千万乃至上亿的微RNA数据,这使得人们能够比先前更为详尽地解析微RNA组 学,特别是它能够发现那些先前克隆和标准的方法无法实现的新的尤其是低丰度的微RNA 【Nagalakshmi U,Waern K,Snyder M·, Curr Protoc Mol Biol2010;Chapter4:Unit4 11 11-13. ;van der Brug M,Nalls MA,Cookson MR·, Brain Res2010;1338:146_154·】。但 是,随之而来的挑战是如何确定这百万级以上的小核苷酸序列在基因组上的定位。事实 上,对一般的测序平台来说,的确有明显比例的数据是不能在基因组中找到定位的【Blow N.,Nature2009 ;458(7235):239-242.】。有趣的是,最近,人们在高通量测序数据中发 现一种不连续的小于200nt的小RNA,这种小RNA在基因组上被一个内含子所隔开【Na ture2009;457(7232):1028-1032. ;Mercer TR, Dinger ME, Bracken CP et al., Genome Res;20(12):1639-1650. ;Valen E, Preker P, Andersen PR et al., Nat Struct Mol Biol; 18 (9) : 1075-1082.】。但是,有没有小于30nt的不连续的微RNA还有待进一步探究。 毕竟小于200nt还是很大的分子,也容易与基因组匹配,但小于30nt的分子就很困难了。
[0004] 综上所述,本领域对于微RNA的认识还非常有限,迫切需要开发新的鉴别新型微 RNA的方法。此外,还需要开发简单方便快速的技术来进行验证,以便筛选和鉴别新型的微 RNA。
【发明内容】
[0005] 本发明的目的就是提供一种鉴别新型微RNA或其前体的方法。
[0006] 本发明的第一方面,提供了一种构建用于hetRNA筛选的数据库的方法,所述方法 包括:
[0007] (a)提供一微小RNA深度测序数据库(或称为微RNA垃圾数据库,或0级RNA筛选 库),
[0008] 其中所述微小RNA测序数据库中的各RNA序列记为RNAjO,其中RNAjO表示序号为 j0的RNA序列,j0为1-nO的正整数,n0为所述微小数据库中的RNA序列总数,并且RNAjO 是未能与基因组序列匹配的微小RNA,并且所述微小RNA测序数据库不包括已验证或证实 的hetRNA和已知小RNA的RNA序列;
[0009] (b)将所述微小RNA测序数据库中的各RNA序列RNAjO,与标准RNA (reference RNA或RefSeq RNA)数据库进行比对,从而在所述标准RNA数据库中排除与各RNA序列 RNAjO不匹配的标准RNA序列,并选取标准RNA数据库中与RNAjO匹配的标准RNA,并将对应 于该匹配的标准RNA的截短序列组成一级RNA筛选库(匹配的RNAjO被称为起始微RNA), 其中,所述标准RNA的截短序列的结构如式I所示:
[0010] X-SEQfflAJ0-Y (I)
[0011] 式中,
[0012] SEQmj(l为相匹配的RNAjO的核苷酸序列;
[0013] X为所述标准RNA中位于所述RNAjO直接上游(immediately upstream)的长度为 50-100bp的核苷酸序列;
[0014] Y为所述标准RNA中位于所述RNAjO直接下游(immediately downstream)的长度 为50-100bp的核苷酸序列;
[0015] 为连接X和SEQmj(l以及连接SEQmj(l和Y的键(化学键);
[0016] 其中所述一级RNA筛选库所含有的各标准RNA的截短序列记为RNAj 1,其中,RNAj 1 表示序号为jl的标准RNA的截短序列,其中jl为1-nl的正整数,nl为一级RNA筛选库中 的RNA序列总数;
[0017] (C)将所述一级筛选库中的RNAjl,与基因组序列数据库进行比对,从而排除不含 有内含子的RNA序列,并且选取内含子要位于成熟微RNA序列(即起始微RNA)之中的RNA 序列,组成二级RNA筛选库,
[0018] 其中所述二级RNA筛选库所含有的各RNA记为RNAj2,其中,RNAj2表示序号为j2 的RNA序列,其中j2为1-η2的正整数,n2为二级RNA筛选库中的RNA序列总数;
[0019] (d)将所述二级筛选库中的RNAj2序列进行二级结构分析,进行二级结构预测,排 除无法形成茎环结构的RNA序列,并将所述二级筛选库中可形成茎环结构的RNA序列组成 三级RNA筛选库,即用于hetRNA筛选的数据库,
[0020] 其中,所述三级RNA筛选库所含有的各RNA记为RNAj3, RNAj3表示序号为j3的 RNA序列,其中j3为1-η3的正整数,n3为三级RNA筛选库中的RNA序列总数。
[0021] 在另一优选例中,所述的表示连接式I中各序列的腱,更佳地,为化学键。
[0022] 在另一优选例中,所述的微小RNA深度测序数据库、标准RNA数据库、和基因组序 列数据库是来自同一物种的。
[0023] 在另一优选例中,所述的物种包括(但并不限于):哺乳动物、鸟类、爬行动物、昆 虫。
[0024] 较佳地,所述的哺乳动物包括人、啮齿动物、灵长目、牛、羊、猪、狗、猫。
[0025] 更佳地,所述的哺乳动物包括小鼠、大鼠、人。
[0026] 在另一优选例中,所述的标准RNA数据库是国际通用公用数据库NCBI (National Center for Biotechnology Information)网站的标准 RNA 数据库。
[0027] 在另一优选例中,在步骤(c)中,基因组序列是NCBI网站的基因组序列。
[0028] 在另一优选例中,在步骤(d)中,二级结构预测是用公用网站the mFold Server 进行。
[0029] 在另一优选例中,所述的三级RNA筛选库也称为包含内含子剪接位点的hetRNA前 体库。
[0030] 在另一优选例中,所述的微小RNA测序数据库中的RNA序列长度为18_30nt。
[0031] 在另一优选例中,在步骤(d)中还包括:将所述微小RNA测序数据库中对应于 RNAjO的各RNA序列组成相应的成熟hetRNA库。
[0032] 本发明第二方面,提供了一种鉴定由包含内含子的hetRNA前体产生的成熟 hetRNA的方法,包括步骤:
[0033] (a)提供一微小RNA深度测序数据库(或称为微RNA垃圾数据库,或0级RNA筛选 库),
[0034] 其中所述微小RNA测序数据库中的各RNA序列记为RNAjO,其中RNAjO表示序号为 j0的RNA序列,j0为1-nO的正整数,n0为所述微小数据库中的RNA序列总数,并且RNAjO 是未能与基因组序列匹配的微小RNA,并且所述微小RNA测序数据库不包括已验证或证实 的hetRNA和已知小RNA的RNA序列;
[0035] (b)将所述微小RNA测序数据库中的各RNA序列RNAjO,与标准RNA (reference RNA或RefSeq RNA)数据库进行比对,从而在所述标准RNA数据库中排除与各RNA序列 RNAjO不匹配的标准RNA序列,并选取标准RNA数据库中与RNAjO匹配的标准RNA,并将对应 于该匹配的标准RNA的截短序列组成一级RNA筛选库(匹配的RNAjO被称为起始微RNA), 其中,所述标准RNA的截短序列的结构如式I所示:
[0036] X-SEQfflAJ0-Y (I)
[0037] 式中,
[0038] SEQmj(l为相匹配的RNAjO的核苷酸序列;
[0039] X为所述标准RNA中位于所述RNAjO直接上游(immediately upstream)的长度为 50-100bp的核苷酸序列;
[0040] Y为所述标准RNA中位于所述RNAjO直接下游(immediately downstream)的长度 为50-100bp的核苷酸序列;
[0041] 为连接X和SEGUj。以及连接SEGUj。和Y的键(化学键);
[0042] 其中所述一级RNA筛选库所含有的各标准RNA的截短序列记为RNAj 1,其中,RNAj 1 表示序号为jl的标准RNA的截短序列,其中jl为1-nl的正整数,nl为一级RNA筛选库中 的RNA序列总数;
[0043] (c)将所述一级筛选库中的RNAjl,与基因组序列数据库进行比对,从而排除不含 有内含子的RNA序列,并且选取内含子要位于成熟微RNA序列(即起始微RNA)之中的RNA 序列,组成二级RNA筛选库,
[0044] 其中所述二级RNA筛选库所含有的各RNA记为RNAj2,其中,RNAj2表示序号为j2 的RNA序列,其中j2为1-η2的正整数,n2为二级RNA筛选库中的RNA序列总数;
[0045] (d)将所述二级筛选库中的RNAj2序列进行二级结构分析,进行二级结构预测,排 除无法形成茎环结构的RNA序列,并将所述二级筛选库中可形成茎环结构的RNA序列组成 三级RNA筛选库,
[0046] 其中,所述三级RNA筛选库所含有的各RNA记为RNAj3, RNAj3表示序号为j3的 RNA序列,其中j3为1-η3的正整数,n3为三级RNA筛选库中的RNA序列总数;和
[0047] (e)对三级RNA筛选库中的RNAj3序列,测定其形成hetRNA的能力,其中,如果所 述RNAj3能够形成hetRNA,则所述的RNAj3是包含内含子的hetRNA前体,而其所形成的 hetRNA 为成熟 hetRNA。
[0048] 在另一优选例中,所述的hetRNA来源于选自下组的物种:哺乳动物、鸟类、爬行动 物、昆虫。
[0049] 在另一优选例中,所述的哺乳动物包括人、啮齿动物、灵长目、牛、羊、猪、狗、猫。
[0050] 更佳地,所述的哺乳动物包括小鼠、大鼠、人。
[0051] 在另一优选例中,所述的转染受体细胞是293FT细胞。
[0052] 在另一优选例中,在转染后,通过茎环引物扩增法(STEM LOOP PCR)进行检测。
[0053] 在另一优选例中,所述的测序数据库是深度测序的数据库。
[0054] 在另一优选例中,所述的深度测序指测序深度彡20。
[0055] 本发明第三方面,提供了 一种鉴定候选RNA序列是否是包含内含子的hetRNA前体 的方法,包括步骤:
[0056] ⑴构建一表达载体,所述质粒携带对应于待鉴定的RNA序列的DNA序列并可将所 述DNA序列表达为RNA序列,其中所述的待鉴定的RNA序列包含内含子;
[0057] (ii)用所述表达载体转染受体细胞,并培养所述的经转染的受体细胞;
[0058] (iii)鉴别所述的经转染的受体细胞中hetRNA,从而确定所述待鉴定的RNA序列 是否是包含内含子的hetRNA前体,其中,如果与对照的受体细胞相比,并经测序列证明,在 经转染的受体细胞中形成了对应于所述待鉴定的RNA序列的hetRNA序列,则表示待鉴定的 RNA序列是包含内含子的hetRNA前体,而所形成的hetRNA为成熟hetRNA。
[0059] 在另一优选例中,所述的待鉴定的RNA序列来自用本发明第一方面所述方法构建 的用于hetRNA筛选的数据库,即所述三级RNA筛选库所含有的RNAj3。
[0060] 在另一优选例中,在步骤(iii)中,鉴别步骤包括:抽提所述经转染的受体细胞的 总RNA ;PCR扩增待验证的成熟hetRNA序列;以及对上述PCR扩增序列进行测序验证。
[0061] 本发明第四方面,提供了一种用本发明第三方面所述的方法所鉴别出的微RNA分 子或微RNA分子的前体。
[0062] 在另一优选例中,所述的微RNA分子的序列如SEQ ID N0. :22或23所示的hetRNA ; 或
[0063] 所述的微RNA分子前体的序列如SEQ ID N0. : 24或25所示。
[0064] 应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具 体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在 此不再一一累述。
【专利附图】
【附图说明】
[0065] 图1显示了 hetRNA(前体包含内含子的微RNA)形成的示意图。
[0066] 图2显示了本发明筛选天然hetRNA的分析流程图。
[0067] 图3显示人工构建的包含内含子的miRNA前体可在细胞体系中剪切形成成熟 miRNA。图中,"Primer"表示引物。
[0068] 其中,(A)为人造的包含内含子的miRNA前体的剪接过程的示意图。
[0069] (B)对应于⑷中的核酸序列及结构。箭头表示内含子hmirtron-1224插入 miR-1955前体的位点。
[0070] (C)内含子剪接后剩余产物的RT-PCR结果。剪接的确认引物与载体匹配,不与前 体匹配,如图(A)所示,其序列为PCDNA6F和PCDNA6R。最后一条泳道的235bp和320bp条 带分别指剪接前后的PCR产物。
[0071] (D)人工设计结构产生的成熟hetRNA-1955的RT-PCR结果。引物设计用标准 的茎环引物法。"No vector"指HEK293FT没有转染质粒;PE-miR-126, PE-miR-1955和 PE-miR-1955-hmirtron-1224 指样品各自转染包含 miR-126,miR-1955 和 miR-1955 中含内 含子 mirtron-1224 的 miR-1955 前体质粒;PE 指载体 pcDNA6. 2-GW/EmGFP-miR。U6 和 gapdh 作为上样对照。所有PCR产物均经测序验证。
[0072] 图4显示了天然内源性hetRNA_Ubap21的筛选和验证。
[0073] 其中,(A)hetRNA_Ubap21的筛选示意图。
[0074] (B)天然hetRNA_Ubap21过表达的证明。上图的表达情况证实了内含子剪接。 最后一条泳道的926bp和243bp条带指剪接前后的PCR产物。剪接的确认引物与载体匹 配,但不与前体匹配,如图3(A)所示,其序列为1^)嫩6?和1^)嫩61? ;下图指检测成熟的 hetRNA_Ubap21。
[0075] (C)检测小鼠组织中天然的内源性hetRNAs。上图,证明天然内含子的剪接,引物 设计跨过内含子(见实施例)。下图检测小鼠组织中的hetRNA-Ubap21。PCR引物设计用标 准的茎环引物法。质粒被转染进HEK293FT细胞。PE指所用载体。U6和gapdh作为上样对 照。所有PCR产物均经测序验证。
[0076] 图5显示了天然内源性hetRNA-Pccb的验证。
[0077] 其中,(A)天然内源性hetRNA-Pccb利用细胞体系的验证示意图。
[0078] (B)对应于(A)中的核酸序列及结构。箭头表示天然内含子插入hetRNA-Pccb前 体的位点。
[0079] (C)天然人hetRNA-Pccb过表达的证明。上图的表达证实了内含子剪接的证明。 最后一条泳道的217bp条带指剪接后的PCR产物,剪接的确认引物与载体匹配,但不与前体 匹配,如图(A)所示,其序列为PCDNA6F和PCDNA6R ;下图指检测成熟的hetRNA-Pccb。
[0080] (D)检测小鼠组织中天然的内源性hetRNAs。hetRNA-Pccb序列在大鼠附睾小RNA 文库的垃圾序列中发现。在大鼠睾丸中能够被RT-PCR和测序证明。PCR引物设计用标准的 茎环引物法。质粒被转染进HEK293FT细胞。PE指所用载体。U6和gapdh作为上样对照。 所有PCR产物均经测序验证。
【具体实施方式】
[0081] 本发明人经过广泛而深入的研究,首次开发了一种RNA-hetRNA筛选系统,并利用 筛选系统,首次验证了在哺乳动物等物种中,存在内源性的含内含子的hetRNA前体分子, 即hetRNA前体。在此基础上完成了本发明。
[0082] 具体地,本发明人选取质粒pcDNA6. 2-GW/EmGFP-miR作为载体,用含内含子的 hetRNA前体序列作为受体,FASTDIGEST限制性内切酶作为消化酶,293FT细胞作为反应器, STEM LOOP PCR作为表达检测方法,形成一个完全的筛选技术系统,从而实现简单快速经济 地检测hetRNA的表达。
[0083] 术语
[0084] 如本文所用,术语"本发明RNA"、"hetRNA"可互换使用,指由hetRNA前体所产生 的、长度彡30nt的微RNA。通常,hetRNA的长度为18-30nt。
[0085] 如本文所用,术语"本发明前体"、"本发明的RNA前体"、"hetRNA前体"可互换使 用,指可产生所述hetRNA的RNA分子,该前体的特点是具有茎环结构(也称为发夹结构), 并且在前体的序列中含有插入的内含子序列。所述hetRNA前体在剪接过程中,可剪切掉内 含子序列,从而产生长度< 30nt的hetRNA。通常,hetRNA前体的长度为50-200bp。
[0086] 应理解,本发明前体可指RNA序列、DNA序列或RNA-DNA序列,也包括相应的正义 序列或反义序列。
[0087] hetRNA
[0088] 本发明证实了,在未匹配的深度测序数据中,至少一部分序列是基因组转录来的 hetRNA前体,它被一个内含子所隔开。
[0089] 如图1所示,在未匹配的深度测序数据中,基因组转录来的转录物(hetRNA前体) 被一个内含子所隔开。不象典型的miRNA和mirtron前体,产生的成熟hetRNA是前体中的 内含子被剪接后所形成的产物。
[0090] 天然hetRNA的鉴别
[0091] 本发明提供了一种鉴别各物种中,天然存在的或内源性hetRNA的方法和系统。
[0092] 参见图2, 一种代表性的方法包括:
[0093] 通过对RNA深度测序小RNA数据的"垃圾"数据在NCBI网站上对标准RNA使用 BLAST,然后选取能够匹配的标准RNA (reference RNA)(也可称为参照RNA);
[0094] 将匹配的标准RNA再与基因组序列(同一物种)进行基因组的BLAST,选出在基 因组中被内含子所分隔的序列作为目标序列;
[0095] 将目标序列用the mFold Server网站进行二级结构预测,选取前体有莖环结构 的内含子打断的微RNA作为以后实验验证的候选分子;
[0096] 对所述具有茎环结构的RNA序列,测定其形成hetRNA的能力,其中,如果所述 RNA能够形成hetRNA,则表示所形成的微RNA是hetRNA,而相应的RNA序列是hetRNA前体。
[0097] 在本发明方法中,可使用商业化的或公开的数据库,也可使用通过常规方法构建 的数据库。代表性的数据库包括(但并不限于)NCBI数据库等。例如,网站blast可使用 地址:http://blast, ncbi. nlm. nih. gov/ ;mFold Server 网站可使用地址:http://mfold. rna. albany. edu/?q=mfold〇
[0098] 筛选系统和测定方法
[0099] 本发明还提供了一种用于本发明方法的筛选系统(RNA-hetRNA筛选系统)。
[0100] -种代表性的RNA-hetRNA的筛选系统包括:
[0101] (a)转染质粒,所述转染质粒用于插入对应于待筛选RNA分子的DNA序列;
[0102] (b)转染受体细胞,所述的转染受体细胞用于转入所述的转染受体,并且将所述转 染质粒中所插入的DNA转录为RNA ;
[0103] (c)任选的抽提细胞总RNA的试剂;
[0104] (d)任选的进行STEM-LOOP PCR的试剂。
[0105] 一种代表性的转染系统测定方法包括:
[0106] (el)提供质粒(例如pcDNA6. 2-GW/EmGFP-miR)作为转染载体;
[0107] (e2)用多个引物对(含前体序列及插入其中的intron序列),通过PCR拼接形成 序列X,或商业化人工合成所述序列X,其中该序列X包含待测定的具有茎环结构的hetRNA 前体序列;
[0108] (e3)用合适内切酶分别酶切质粒和序列X ;
[0109] (e4)将上述序列X亚克隆进所述载体;
[0110] (e5)将步骤(e4)所得到质粒转染合适的转染受体细胞(如293FT细胞);
[0111] (e6)用TRIZ0L试剂提取细胞总RNA ;
[0112] (e7)将步骤(e6)所得RNA用STEM-LOOP PCR方法检测目标hetRNA的表达。
[0113] 本发明的主要优点包括:
[0114] (a)提供了一种筛选天然hetRNA的方便可行的路径和方法,为将来大规模的发现 验证hetRNA提供了强大的技术支撑。
[0115] (b)首次证实了包括人在内的物种中,存在hetRNA前体以及所述hetRNA前体可产 生长度< 30nt的hetRNA。为研究hetRNA及其前体的功能奠定了基础。
[0116] (c)为从废弃的微RNA深度测序列数据库中挖掘新型微RNA提供了一种新思路。
[0117] (d)打破了基因测序结果分析中传统以与基因组匹配为标准的黄金准则,建议改 为以RNA和基因组双重匹配为标准。
[0118] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本 发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照 常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否 则百分比和份数是重量百分比和重量份数。
[0119] 材料和通用方法
[0120] 1.主要试剂
[0121] pcDNA6· 2_GW/EmGFP-miR :购自 INVITRIGEN。
[0122] 限制性内切酶 Fast-Digest :购自 Fermentas。
[0123] 2.试验方法
[0124] 2.1质粒构建
[0125] 质粒pcDNA6. 2-GW/EmGFP-miR-X的产生。序列X由上海博尚生物技术公司合成, 然后亚克隆进载体 pcDNA6. 2-GW/EmGFP(Invitrogen,UK)的 Hind III 和 EcoR I 位点。 质粒pcDNA6. 2-GW/EmGFP-miR-Y的产生。序列Y用引物对通过PCR,然后亚克隆进载体 pcDNA6.2_GW/EmGFP(Invitrogen,UK)的 BamHI and Xhol 位点。为了成功的构建质粒,不 要选用通常所的限制性内切酶,而要选用Fast-Digest系统(如Fermentas, Canada)来作 用于特别复杂的双发夹前体结构的。X序列用于构建人工模型,Y序列用于鉴定内源性的 hetRNAs。所有的序列最终均过测序确认(Biosune,China)。
[0126] X序列如下:
[0127] Mir-1955-hmirtron_1224 前体:
[0128] ctggtttacttactacaagtcccag gtgaggactcgggaggtggagggtggtgccgccggggc cgggcgctgtttcagctcgcttctccccccacctcctctctcctcag gatgcactgcagctttttcttaa cttcagacaagagcattgcatgctgggacatgtagttggtttaaatagca(SEQ ID NO:1)
[0129] 其中,粗体为 intron hmirtron-1224;非粗体部分为 mir_1955precursor ;下划线 部分是成熟的 mir-1955(agtcccaggatgcactgcagctttt,SEQ ID N0:2);斜体碱基为突变碱 基。
[0130] Y序列如下:
[0131] HetRNA_Ubap21前体序列(含天然内含子),PCR扩增用小鼠Raw264. 7细胞基因 组DNA为模板。引物如下:
[0132] Pre-hetRNA-Ubap21_F:catcgcggatcctcagtcgacaacttatacctcccaa(SEQ ID NO:3);
[0133] Pre-hetRNA-Ubap21in-R:gaaccgctcgagaccttcaacagattgcgtggtctg (SEQ ID NO:4)〇
[0134] HetRNA_Ubap21前体序列(不含天然内含子),用Trizol法抽提的Raw264. 7细胞 总RNA转录来的cDNA为模板,通过PCR扩增获得。其中,引物如下:
[0135] hetRNA-Ubap21-F:CATCGCGGATCCtcagtcgacaacttatacctcccaa(SEQ ID NO. :5);
[0136] hetRNA-Ubap21in-R:GAACCGCTCGAGactgtttcattgagagagggtatact(SEQ ID NO. : 6)。
[0137] hetRNA-Pccb的前体序列(含或不含天然内含子)均用HEK293FT细胞,其中不含 天然内含子的前体序列扩增所使用的是Trizol法抽提的细胞总RNA转录来的cDNA为模 板,前体含天然内含子的序列扩增则使用细胞基因组DNA为模板。扩增hetRNA前体及前体 含内含子的引物如下:
[0138] hhetRNA-Pccb-F:TCACCGGAATTCgtcacagtcatcaccaggaa(SEQ ID NO. :7);
[0139] hhetRNA_Pccb-R:GTACCCAAGCTTtagttggtatcaccacaaaggtgc(SEQ ID NO. :8)。
[0140] 细胞培养和转染
[0141] HEK293T细胞(实验室保存或常规市售)用培养其常规的市售培养基Dulbecco' s modified Eagle's medium(DMEM),其中含 10% 胎牛血清(Hyclone,USA)。质粒转染用 Lipofectamine2000 (Invitrogen,UK),操作按说明书进行。
[0142] E14T小鼠胚胎干细胞(ESCs)(购自Austin Smith)用无饲养层培养。E14T小鼠 胚胎干细胞用悬滴法诱导向心肌的自发分化。简单讲,ESCs被胰酶消化(D0)并悬浮培养 在培养基中,没有LIF for2days (D2),接下悬浮培养四天,胚状体铺板于明胶覆盖的培养盘 (D6)当出现自发收缩的买心肌细胞时收集样品D9。在各个时间点样品用于提取RNA。
[0143] RNA 分离和 RT-PCR
[0144] 小鼠或培养的细胞总RNA用TRIzol提取(购自Invitrogen,UK),用Super Script II reverse transcriptase(Invitrogen,UK)反转录 cDNA,其中 miRNA用特异性莖环引物, mRNA和u6用随机引物,mRNA和gapdh用oligo dT。PCR扩增必须用高保真的K0D-PLUS DNA polymerase(Toyobo,Japan)。所有操作根据说明书进行。所有PCR产物均经测序确认 (Invitrogen,UK)〇
[0145] 引物如下(5'to3'):
[0146]
【权利要求】
1. 一种构建用于hetRNA筛选的数据库的方法,其特征在于,所述方法包括: (a) 提供一微小RNA深度测序数据库, 其中所述微小RNA测序数据库中的各RNA序列记为RNAjO,其中RNAjO表示序号为jO 的RNA序列,jO为1-nO的正整数,nO为所述微小数据库中的RNA序列总数,并且RNAjO是 未能与基因组序列匹配的微小RNA,并且所述微小RNA测序数据库不包括已验证或证实的 hetRNA和已知小RNA的RNA序列; (b) 将所述微小RNA测序数据库中的各RNA序列RNAjO,与标准RNA (reference RNA或 RefSeq RNA)数据库进行比对,从而在所述标准RNA数据库中排除与各RNA序列RNAjO不匹 配的标准RNA序列,并选取标准RNA数据库中与RNAjO匹配的标准RNA,并将对应于该匹配 的标准RNA的截短序列组成一级RNA筛选库(匹配的RNAjO被称为起始微RNA),其中,所述 标准RNA的截短序列的结构如式I所示: X-SEQ碰J0-Y (I) 式中, SEQ?^为相匹配的RNAjO的核苷酸序列; X为所述标准RNA中位于所述RNAjO直接上游的长度为50-100bp的核苷酸序列; Y为所述标准RNA中位于所述RNAjO直接下游的长度为50-100bp的核苷酸序列; 为连接X和SEQK_以及连接SEQK_和Y的键; 其中所述一级RNA筛选库所含有的各标准RNA的截短序列记为RNAjl,其中,RNAjl表 示序号为jl的标准RNA的截短序列,其中jl为1-nl的正整数,nl为一级RNA筛选库中的 RNA序列总数; (c) 将所述一级筛选库中的RNAj 1,与基因组序列数据库进行比对,从而排除不含有内 含子的RNA序列,并且选取内含子要位于成熟微RNA序列之中的RNA序列,组成二级RNA筛 选库, 其中所述二级RNA筛选库所含有的各RNA记为RNAj2,其中,RNAj2表示序号为j2的 RNA序列,其中j2为1-η2的正整数,n2为二级RNA筛选库中的RNA序列总数; (d) 将所述二级筛选库中的RNAj2序列进行二级结构分析,进行二级结构预测,排除无 法形成茎环结构的RNA序列,并将所述二级筛选库中可形成茎环结构的RNA序列组成三级 RNA筛选库,即用于hetRNA筛选的数据库, 其中,所述三级RNA筛选库所含有的各RNA记为RNAj3, RNAj3表示序号为j3的RNA序 列,其中j3为l_n3的正整数,n3为三级RNA筛选库中的RNA序列总数。
2. 如权利要求1所述的方法,其特征在于,所述的微小RNA测序数据库中的RNA序列长 度为 18-30nt。
3. 如权利要求1所述的方法,其特征在于,在步骤(d)中还包括:将所述微小RNA测序 数据库中对应于RNAjO的各RNA序列组成相应的成熟hetRNA库。
4. 一种鉴定由包含内含子的hetRNA前体产生的成熟hetRNA的方法,其特征在于,包括 步骤: (a)提供一微小RNA深度测序数据库, 其中所述微小RNA测序数据库中的各RNA序列记为RNAjO,其中RNAjO表示序号为jO 的RNA序列,jO为Ι-nO的正整数,nO为所述微小数据库中的RNA序列总数,并且RNAjO是 未能与基因组序列匹配的微小RNA,并且所述微小RNA测序数据库不包括已验证或证实的 hetRNA和已知小RNA的RNA序列; (b) 将所述微小RNA测序数据库中的各RNA序列RNAjO,与标准RNA (reference RNA或 RefSeq RNA)数据库进行比对,从而在所述标准RNA数据库中排除与各RNA序列RNAjO不匹 配的标准RNA序列,并选取标准RNA数据库中与RNAjO匹配的标准RNA,并将对应于该匹配 的标准RNA的截短序列组成一级RNA筛选库(匹配的RNAjO被称为起始微RNA),其中,所述 标准RNA的截短序列的结构如式I所示: X-SEQ碰J0-Y (I) 式中, SEQ?^为相匹配的RNAjO的核苷酸序列; X为所述标准RNA中位于所述RNAjO直接上游的长度为50-100bp的核苷酸序列; Y为所述标准RNA中位于所述RNAjO直接下游的长度为50-100bp的核苷酸序列; 为连接X和SEQK_以及连接SEQK_和Y的键; 其中所述一级RNA筛选库所含有的各标准RNA的截短序列记为RNAjl,其中,RNAjl表 示序号为jl的标准RNA的截短序列,其中jl为1-nl的正整数,nl为一级RNA筛选库中的 RNA序列总数; (c) 将所述一级筛选库中的RNAj 1,与基因组序列数据库进行比对,从而排除不含有内 含子的RNA序列,并且选取内含子要位于成熟微RNA序列之中的RNA序列,组成二级RNA筛 选库, 其中所述二级RNA筛选库所含有的各RNA记为RNAj2,其中,RNAj2表示序号为j2的 RNA序列,其中j2为1-η2的正整数,n2为二级RNA筛选库中的RNA序列总数; (d) 将所述二级筛选库中的RNAj2序列进行二级结构分析,进行二级结构预测,排除无 法形成茎环结构的RNA序列,并将所述二级筛选库中可形成茎环结构的RNA序列组成三级 RNA筛选库, 其中,所述三级RNA筛选库所含有的各RNA记为RNAj3, RNAj3表示序号为j3的RNA序 列,其中j3为l_n3的正整数,n3为三级RNA筛选库中的RNA序列总数;和 (e) 对三级RNA筛选库中的RNAj 3序列,测定其形成hetRNA的能力,其中,如果所 述RNAj3能够形成hetRNA,则所述的RNAj3是包含内含子的hetRNA前体,而其所形成的 hetRNA 为成熟 hetRNA。
5. 如权利要求4所述的方法,其特征在于,所述的hetRNA来源于选自下组的物种:哺 乳动物、鸟类、爬行动物、昆虫。
6. 如权利要求5所述的方法,其特征在于,所述的哺乳动物包括人、哨齿动物、灵长目、 牛、羊、猪、狗、猫。
7. -种鉴定候选RNA序列是否是包含内含子的hetRNA前体的方法,其特征在于,包括 步骤: (i) 构建一表达载体,所述质粒携带对应于待鉴定的RNA序列的DNA序列并可将所述 DNA序列表达为RNA序列,其中所述的待鉴定的RNA序列包含内含子; (ii) 用所述表达载体转染受体细胞,并培养所述的经转染的受体细胞; (iii) 鉴别所述的经转染的受体细胞中hetRNA,从而确定所述待鉴定的RNA序列是否 是包含内含子的hetRNA前体,其中,如果与对照的受体细胞相比,并经测序列证明,在经转 染的受体细胞中形成了对应于所述待鉴定的RNA序列的hetRNA序列,则表示待鉴定的RNA 序列是包含内含子的hetRNA前体,而所形成的hetRNA为成熟hetRNA。
8. 如权利要求7所述的方法,其特征在于,在步骤(iii)中,鉴别步骤包括:抽提所述 经转染的受体细胞的总RNA ;PCR扩增待验证的成熟hetRNA序列;以及对上述PCR扩增序列 进行测序验证。
9. 一种用权利要求4所述的方法所鉴别出的微RNA分子或微RNA分子的前体。
10. 如权利要求9所述的微RNA分子,其特征在于,所述的微RNA分子的序列如SEQ ID NO. : 22或23所示的hetRNA ;或 所述的微RNA分子前体的序列如SEQ ID NO. : 24或25所示。
【文档编号】C12N15/113GK104123480SQ201310153531
【公开日】2014年10月29日 申请日期:2013年4月27日 优先权日:2013年4月27日
【发明者】荆清, 李湘麒, 李粤 申请人:中国科学院上海生命科学研究院