一种合成无修饰rna文库及用来校准rna修饰检测的方法
技术领域:
:[0001]本发明属于rna修饰位点检测
技术领域:
:,具体涉及一种合成无修饰rna文库及用来校准rna修饰检测的方法。
背景技术:
::[0002]rna修饰在调节生命活动中发挥了重要的作用,准确鉴定rna修饰位点有助于我们了解rna修饰的分布、功能和机理机制。然而现有的多种rna修饰鉴定方法都存在不足,如不同的研究对于同一种rna修饰的含量和分布存在巨大分歧,其中,依赖抗体的检测方法精度低、重复性差,通过测序截断和突变检测修饰的方法存在较大的假阳性。因此很多研究会使用负对照的方法对假阳性位点进行过滤,比如使用体内的去甲基化反应或体内敲除品系作为负对照,但是去除甲基化的效率并不稳定。有些研究会使用不带修饰的rna序列作为负对照,但是只能限制在某一些基因,无法高通量地评价每个位点的假阳性情况。[0003]因此,有必要创建一种能高通量地评价每个位点的假阳性情况,并能有效降低rna修饰位点检测假阳性的方法。技术实现要素:[0004]为了克服上述现有技术的不足,本发明提出了一种无修饰rna文库的合成方法,在rna修饰检测中,以该无修饰rna文库作为负对照,可以有效降低rna检测方法的假阳性,使鉴定出的rna修饰信号更加准确。[0005]为了实现上述目的,本发明所采用的技术方案是:[0006]本发明提供一种无修饰rna文库的合成方法,具体包括以下步骤:[0007]s1、以rna作为起始,以polyt引物或者n6随机引物作为反转录的引物,使用具有模板置换能力的反转录酶和t7启动子序列引物通过反转录在第一链cdna合成时在rna的5‘端(一链cdna的3‘端)加上t7启动子序列;[0008]s2、在步骤s1的第一链cdna的基础上采用引物延伸法以t7延伸引物合成双链cdna,使双链cdna在5‘端具有t7启动子序列;[0009]s3、从双链cdna中转录出与体内提取的rna具有相同序列的体外转录rna,得到无修饰rna文库。[0010]优选地,步骤s1所述polyt引物的序列如seqidno.1所示,所述n6随机引物的序列如seqidno.3所示。[0011]优选地,步骤s1所述的t7启动子序列引物如seqidno.2所示。[0012]优选地,步骤s2所述t7延伸引物的序列如seqidno.4所示。[0013]本发明通过反转录,使用带有模板置换功能的反转录酶,该酶在反转录到3‘端时会自动合成三个连续的c,反应体系中有已经加入的t7启动子序列引物(tsot7primer)序列在3’端是三个g,其中两位为rna碱基,一位为锁核酸碱基,能够直接与三个c配对,反转录酶可以继续以这段引物作为模板继续反转录,把t7启动子的序列添加到了rna的5‘端(一链cdna的3‘端)。然后做一轮引物延伸得到双链cdna,双链cdna5‘端具有t7启动子序列,通过t7rna聚合酶完成体外转录,得到无修饰rna文库。其合成流程如图1所示。[0014]优选地,步骤s1所述的rna包括但不限于totalrna,磁珠纯化得到的mrna,采用rrna去除方法得到的mrna。[0015]进一步的,磁珠纯化得到的mrna采用本领域常规的方法,具体使用的是thermofisher公司的dynabeadstmmrnapurificationkit(61006),原理是利用了偶联polyt序列的磁珠将含有polya尾的mrna从totalrna中富集出来。[0016]进一步的,采用rrna去除方法得到的mrna采用本领域常规的方法,即使用合成rrna相关的序列,与totalrna中的rrna序列互补配对,使用rnaseh酶将rrna切断,以达到降低totalrna中rrna含量的目的。[0017]优选地,步骤s1所述的具有模板置换能力的rna反转录酶为m-mlv反转录酶[moloneymurineleukemiavirus(m-mlv)reversetranscriptase]。[0018]优选地,步骤s3采用体外转录的方法合成无修饰rna文库。具体地,所述体外转录合成法为:使用体外转录试剂盒按照说明书的操作规范对延伸得到的双链cdna进行体外转录不少于2h,然后加入dnase在37℃反应不少于30分钟,最后采用rna纯化试剂盒按照说明书的操作规范对转录产生的rna进行纯化,得到无修饰rna文库。[0019]本发明还提供了采用上述的合成方法合成得到的无修饰rna文库在rna修饰检测中的应用。[0020]优选地,所述rna修饰检测包括但不限于merip-seq检测方法、m6a-ref-seq检测方法、m5cbs-seq检测方法。[0021]本发明开发了一种新方法用来创建一个与内源转录组序列和表达量相同,但是不含修饰的体外rna文库,将这个体外rna文库作为负对照来降低修饰检测的假阳性位点。在修饰位点检测的实验中,同时对体内提取出的rna和体外rna文库进行处理和高通量测序文库构建。随后对两个样本的测序数据进行分析,由于体外rna文库是不含任何修饰的rna文库,因此在体外rna文库中检测出来的信号是假阳性信号。通过排除体外rna文库鉴定出来的假阳性信号,可以降低体内提取的rna样本中检测的rna修饰的假阳性,使鉴定出的修饰信号更加准确。[0022]本发明还提供了一种降低rna修饰检测假阳性的方法,即在rna修饰检测中,以采用上述方法合成的无修饰rna文库作为负对照。[0023]优选地,上述的降低rna修饰检测假阳性的方法,具体为:首先用提取的rna采用上述方法合成无修饰rna文库,然后采用rna修饰检测方法同时对体内提取的rna和无修饰rna文库进行处理(具体处理方法按照常规的rna修饰检测方法进行),并通过高通量测序检测出修饰信号,用体内提取的rna的修饰信号排除掉无修饰rna文库的假阳性修饰信号,即可得到rna修饰的真阳性信号。[0024]与现有技术相比,本发明的有益效果是:[0025]本发明提供一种无修饰rna文库的合成方法,以rna作为起始,先以polyt引物或者n6随机引物通过反转录在rna的5‘端加上t7启动子序列,再采用引物延伸法得到5‘端有t7启动子序列的双链cdna,最后从双链cdna中转录出与体内提取的rna具有相同序列的体外转录rna文库,该文库不含有任何碱基修饰。该方法简单快捷,所合成得到的无修饰rna文库可在rna修饰检测中作为负对照,可以极大地降低rna检测方法的假阳性,使鉴定出的rna修饰信号更加准确;采用本发明方法合成的无修饰rna文库可以广泛应用于各种rna修饰检测方法中。附图说明[0026]图1体外合成rna文库的流程图;[0027]图2为体内提取的rna和体外rna文库样本的dotblot实验结果;[0028]图3为体内提取的rna和体外rna文库样本的基因表达量;[0029]图4为实施例2中的使用和不使用体外合成rna文库校准的m6apeak及假阳性peak在全转录组的分布情况;[0030]图5为实施例3中的使用和不使用体外合成rna文库校准的m6a位点及假阳性位点在全转录组的分布情况;[0031]图6为实施例3中的使用和不使用体外合成rna文库校准的m6a位点及假阳性位点的序列偏好性;[0032]图7为实施例4中的使用和不使用体外合成rna文库校准的m5c位点及假阳性位点在全转录组的分布情况;具体实施方式[0033]下面对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。[0034]下述实施例中的实验方法,如无特殊说明,均为常规方法,下述实施例中所用的试验材料,如无特殊说明,均为可通过常规的商业途径购买得到的。[0035]实施例1无修饰rna库的合成[0036]1、mrna的提取[0037]以人的hek293t细胞系作为材料,使用trizol(thermoscientific,15596026)按照说明书操作提取总rna,使用dynabeadsmrnapurificationkit(thermofisher,61006)按照说明书操作提取mrna。[0038]2、序列合成[0039](1)tsot7primer(t7启动子序列引物):[0040]5'-actctaatacgactcactatagggagagggcrgrg+g-3',r代表核糖核酸,+代表有锁核酸(lna-lockednucleicacid)修饰。[0041](2)polytprimer(polyt引物):5'-t(30)vn-3'。[0042](3)n6randomprimer(n6随机引物):5’-nnnnnn-3’(n代表a,g,c或t中的任意碱基)。[0043](4)t7extensionprimer(t7延伸引物):5'-gctctaatacgactcactatagg-3'。[0044]3、单链cdna的合成[0045](1)mrna+ploytprimer:[0046]总量或体积mrna100ngpolytprimer或n6randomprimer(12μm)1ultotal4ul[0047]70℃反应3分钟,42℃反应2分钟。[0048](2)第一链cdna合成[0049]反应体系如表格所示:[0050][0051]42℃反应1.5小时,68℃反应10分钟。[0052](4)引物延伸和双链cdna纯化[0053]反应体系如表格所示:[0054]体积步骤(3)产物10ul50×advantageultrapurepcrdeoxynucleotidemix(takara,639125)2ulrnaseh(neb,m0297)2ul10×advantage2pcrbuffer(takara,639207)10uladvantage2pcrpolymerasemix(takara,639207)1ult7extensionprimer(10μm)2ulrnase-freewater(thermoscientific,r0581)to100ul[0055]37℃反应15分钟,95℃反应2分钟,60℃反应1分钟,68℃反应10分钟,反应后得到双链cdna。[0056]使用nucleospinpcrcleanup(macherey-nagel,740609.50)试剂盒按照说明书的操作规范对所得双链cdna进行纯化。[0057](5)体外转录产生无修饰rna文库[0058]使用hiscribetmt7highyieldrnasynthesiskit(neb,e2040)体外转录试剂盒按照说明书的操作规范对上述双链cdna进行体外转录2小时,然后加入2ulturbodnase(thermofisher,am2238)在37℃反应30分钟,最后采用rnaclean&concentrator-5kit(zymoresearch,r1015)试剂盒按照说明书的操作规范对转录产生的rna进行纯化,得到无修饰rna文库。体外合成rna文库的流程见图1。[0059](6)无修饰rna文库合成结果的验证[0060]对体内提取的rna和体外转录的无修饰rna文库的样本进行dotblot实验和rna-seq建库测序,以验证体外rna文库与体内提取的rna拥有相似的表达量,但是不含有修饰。[0061]dotblot实验利用m6a抗体和rna上的m6a进行结合并通过显色来对样本中的m6a含量进行定量。主要步骤为:将等量的体内提取的rna(mrna)和体外转录的无修饰rna文库的样本点到尼龙膜(gehealthcare,rpn303b)上并进行uv交联,使用3%bas(genviewfa016-100g)对样本在室温下封闭1小时,将膜与m6a抗体(neb,e1610s,抗体比例为1:2000)在室温下进行孵育2h,随后使用1%tbst(tris-bufferedsalinewith0.1%tween20,sangon)洗两次。随后膜与兔抗二抗(cst,7074)室温下进行孵育1小时。使用1%tbst对膜洗5次,使用显色液(thermofisherscientific,34095)进行显影和拍照。将显影液洗掉,使用亚甲蓝染料进行染色,白光拍照确定两个样本的上样量。[0062]如图2示的dotblot实验结果,在与m6a抗体孵育之后,可以显示样本中m6a的含量。使用亚甲蓝染料染色可以显示上样量。结果表明,在同等上样量的情况下,体内提取的rna中m6a的含量很高,而无修饰rna文库的样本不含有m6a修饰。[0063]rna-seq用nebnextultraiidirectionalrnalibraryprepkit(neb,e7760)建库试剂盒进行建库测序。对rna-seq测序数据的分析如下:首先对测序数据进行质量控制,使用cutadapt(https://cutadapt.readthedocs.io/en/stable/)软件去除接头,使用hisat2(http://daehwankimlab.github.io/hisat2/)软件将测序数据比对到人的参考基因组上,使用featurecounts(http://subread.sourceforge.net/)软件和r包deseq2(https://bioconductor.org/packages/release/bioc/html/deseq2.html)计算比对到一个基因上的测序短片段的含量,参考wagner等人的论文(wagnergp,kink,lynchvj.measurementofmrnaabundanceusingrna-seqdata:rpkmmeasureisinconsistentamongsamples.theorybiosci.2012dec;131(4):281-5.doi:10.1007/s12064-012-0162-3.epub2012aug8.pmid:22872506)使用tpm(transcriptsperkilobasemillion,每千个碱基的转录每百万映射读取的转录本)来代表基因的表达量,并计算每个基因在体内提取rna和体外合成rna文库中的表达量水平。[0064]如图3所示的基因表达量情况所示,横坐标表示体内提取rna中的基因表达量,纵坐标表示体外合成rna文库中的基因表达量,二者的相关系数为0.949,表明有很高的相关性,说明体外rna文库中的基因与体内提rna中的拥有相似的表达量。[0065]实施例2无修饰rna文库在merip-seq检测中作为负对照[0066]1、实验流程[0067]对实施例1中体内提取的rna和体外转录的无修饰rna文库进行merip-seq检测。merip-seq使用n6-methyladenosineenrichmentkit(e1610s),按说明书中的方法进行实验,并使用nebnextultraiidirectionalrnalibraryprepkit(neb,e7760)建库试剂盒进行高通量建库。[0068]2、数据分析和结果[0069]对merip-seq高通量测序数据进行质量控制,使用cutadapt(https://cutadapt.readthedocs.io/en/stable/)软件去除接头,使用hisat2(http://daehwankimlab.github.io/hisat2/)软件将测序数据比对到人的参考基因组上。然后使用已发表的r包exomepeak(https://bioconductor.riken.jp/packages/3.0/bioc/html/exomepeak.html)对体内提取的rna和体外rna文库的测序数据进行callpeak分析(即确定m6a修饰所在的区域)。由于体外rna文库不含修饰,callpeak分析所得的m6a修饰所在的区域是假阳性区域,因此在体内提取的rna样本所call的peak中删去假阳性区域,即可得到置信度更高的m6a区域。[0070]m6a修饰并没有绝对准确的阳性位点数据集可供评估,但前人的大量研究都表明m6a修饰在终止密码子附近有明显的富集,可以用其在终点密码子的富集程度来评价位点鉴定的准确性。对使用体内提取的rna所得的m6apeak,经过体外合成rna文库校准过的m6apeak以及假阳性peak在转录组上的分布情况进行统计,其结果如图4所示。[0071]结果表明,经过校准的m6a区域在终止密码子附近有更多的富集,而体外rna文库得到的假阳性区域主要分布在编码区。可见,在merip-seq检测中,以体外rna文库作为负对照,通过去除体外rna文库的假阳性检测结果,可以提高merip-seq检测rna修饰的准确度。[0072]实施例3无修饰rna文库在单碱基精度m6a-ref-seq检测方法中作为负对照[0073]1、实验流程[0074]对实施例1中体内提取的rna和体外转录的无修饰rna文库进行m6a-ref-seq检测。具体流程如下:[0075](1)mazf酶切反应:在酶切反应之前,使用pcr仪在85℃下对mrna加热5分钟,随后立即插冰上2分钟,以去除mrna中的二级结构。然后进行mazf(takara,2415a)酶切反应,mazf反应体系如下:[0076][0077][0078]mazf反应体系置于37℃反应30分钟,反应结束后使用rnaclean&concentrator-5kit(zymoresearch,r1015)纯化试剂盒对反应产物进行纯化。[0079](2)末端修复:使用t4多核苷酸激酶(t4polynucleotidekinase,t4pnk,vazymebiotech)对酶切后的mrna进行末端修复。体系如下:[0080]总量或终浓度步骤(1)产物~100ng10×t4pnk缓冲液(10x)10ult4多核苷酸激酶(t4pnk)20u三磷酸腺苷(atp)1mm无酶水(rnase-freeh2o)to50ul[0081]反应体系置于37℃反应30分钟,反应结束后使用rna纯化试剂盒对反应产物进行纯化。[0082](3)使用购买的商用小rna建库试剂盒(vahtssmallrnalibraryprepkit(vazymebiotech,nr801))按照说明书的操作规范进行建库,建库步骤主要为:[0083]1)3’接头与底物变性,将酶切后的mrna和3’接头混合,在pcr仪里70℃加热2分钟,立即拿出插在冰上,尽量去除rna中的二级结构。[0084]2)3’接头连接,mrna与3’接头进行连接反应。[0085]3)多余3’接头封闭,使用反转录引物对多余3’接头进行封闭。[0086]4)5’接头连接,mrna与5’接头进行连接反应。[0087]5)cdna合成,使用反转录酶对mrna片段进行反转录合成cdna。[0088]6)文库富集,使用引物对已合成的cdna进行文库扩增和纯化。[0089]将建好的文库进行高通量测序。[0090](4)数据分析和结果[0091]对merip-seq高通量测序数据进行质量控制,使用cutadapt(https://cutadapt.readthedocs.io/en/stable/)软件去除接头,使用hisat2(http://daehwankimlab.github.io/hisat2/)软件将测序数据比对到人的参考基因组上。由于mazf识别aca序列,在分析时对全基因组的每个aca位点进行分析,计算体内提取的rna和体外rna文库这两个样本在该aca位点截断的测序reads数目和通过aca位点的测序reads数目,并采用以下的计算公式计算假阳性率。最后使用fisher精确检验对同一aca位点在体内提取rna和体外rna文库中通过和截断的次数进行检验。[0092][0093]fisher精确检验p-value≤0.05且假阳性率(fpr)≤0.2的位点为高置信度m6a修饰位点。如图5和图6所示,相比于不使用体外合成rna文库做校准,经过校准的m6a位点在终止密码子附近更加富集,且已知m6a位点主要存在于drach(d=g/a/u,r=a/g,h=a/u/c)序列中,相比于不使用体外合成rna文库做校准,经过校准的m6a位点在drach中的比例更高,特别是有将近一半的位点集中在ggaca序列中。而假阳性的位点主要位于编码区,且更多分布于非draca序列中。[0094]可见,在m6a-ref-seq检测中,以体外rna文库作为负对照,通过去除体外rna文库的假阳性检测结果,可以提高m6a-ref-seq检测rna修饰的精确度。[0095]实施例4无修饰rna库在m5cbs-seq检测方法中作为负对照[0096]1、实验流程[0097]使用ezrnamethylationtmkit(zymoresearch,r5001)按照说明书的操作规范对实施例1中体内提取的rna和体外转录的无修饰rna文库进行bisulfite(亚硫酸氢盐)处理。具体处理的步骤如下:[0098](1)将1ug的rna稀释成20ul体积,加入130ulrna转换试剂,并在pcr仪中进行如下处理:[0099]温度时间70℃10min3cycles64℃45min4℃hold[0100](2)在柱子中加入250ul的rna结合buffer,并将上一步的样品加入柱子中,混匀,加入400ul乙醇混匀,离心30秒,转速为≥10,000xg,弃去滤液。[0101](3)加入200ulrna清洗buffer离心30s,加入200ulrnadesulphonationbuffer并在37℃孵育30分钟,离心30秒,弃去滤液。[0102](4)加入200ulrna清洗buffer离心30秒,此步骤重复两次,空转柱子弃去所有乙醇,加入10ul无核酶水,离心30秒进行洗脱。[0103](5)使用nebnextultraiidirectionalrnalibraryprepkit(neb,e7760)建库试剂盒进行建库并进行高通量测序。[0104]2、数据分析和结果[0105]使用已经发表的数据分析流程rna-m5c(https://github.com/sysu-zhanglab/rna-m5c)对数据进行质量控制和基因组比对。对于体内提取的rna和体外rna文库的数据,均计算碱基c的转换比例。使用fisher精确检验p-value≤0.05,假阳性率(fpr)≤0.2,甲基化比例≥0.05的参数得到高置信度的m5c修饰位点。[0106]如图7所示,相比于不使用体外合成rna文库做校准,经过校准的m5c位点只在起始密码子附近有富集,这印证了先前的研究结果。而如果不使用体外合成rna文库做校准,还会在终止密码子附近有富集,和假阳性位点的分布相似。[0107]可见,在m5cbs-seq检测中,以体外rna文库作为负对照,通过去除体外rna文库的假阳性检测结果,可以提高m5cbs-seq检测rna修饰的精确度。[0108]以上对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。当前第1页1 2 3 当前第1页1 2 3