本发明涉及生物医药,具体是一种circrna/lncrna编码的多肽作为分子标志物在制备评估胶质瘤u87化疗疗效和预后试剂中的用途。
背景技术:
1、胶质母细胞瘤(glioblastoma multiforme,gbm)是中枢神经系统最常见的原发恶性肿瘤,其以侵袭性强、术后易复发和放化疗的高度耐受性为特征,预后较差,给社会和家庭带来沉重的负担。探寻胶质母细胞瘤的增殖机制,寻找gbm新的分子治疗靶点已成为gbm研究领域的前沿和热点、难点。
2、本发明国内外首次联合转录组测序、核糖体足迹测序和多肽定量分析技术,对10对新鲜的胶质母细胞瘤组织和配对癌旁组织进行多组学联合分析,对显著差异表达的circrna/lncrna等非编码rna进行go功能富集分析、基于pathway的kegg分析,发现显著差异表达的circrna和lncrna主要参与细胞凋亡、机体的免疫调节、蛋白质泛素化介导的水解、磷脂酰肌醇等过程,在肿瘤的发生发展机制中发挥重要作用。结合核糖体足迹测序(ribo-seq,ribosome profiling sequencing)数据结果,利用orf pipeline脚本针对可能具有编码能力的circrna进行orf注释,寻找具有编码能力的circrna,ires finder软件预测ires序列;并基于各sorf丰度和位置分布分别计算orfscore和rrs(ribosome releasescore),sorf(small orf)序列特征计算fickett score,hexamer score,综合四个值大小,筛选出lncrna中可能具有翻译功能的sorf。通过多肽定量分析技术对组织中的小分子多肽进行分析。通过结合转录组rna-seq、ribo-seq、多肽定量分析数据,发现部分非编码rna(circrna、lncrna、mirna)具有编码小分子多肽的能力,且该多肽可通过特定的生物学机制参与胶质母细胞瘤的恶性增殖过程。此项技术的联合应用为circrna/lncrna参与肿瘤恶性增殖机制提供了全新的研究视野,并为胶质母细胞瘤全新生物靶点的筛选提供了新的方向。
3、胶质母细胞瘤(glioblastoma multiforme,gbm)是中枢神经系统最常见的原发恶性肿瘤,年发病率约为3-4/10万人,其以侵袭性强、术后易复发和放化疗的高度耐受性为特征。目前,gbm患者接受的标准化治疗方式主要为手术切除、术后替莫唑胺标准化的化疗、放射性治疗,但中位生存期仍然只有14-16月左右,仅约3%-5%的患者总体生存期可超过3年。研究证实gbm的恶性进展是多种信号传导通路之间相互调控的结果。目前已揭示的关键信号传导通路有:1、pi3k/akt信号传导通路;2、p53信号传导通路;3、wnt-β-catenin信号传导通路;4、nf-kb/snail信号通路;5、idh1/idh2突变等;其中多个被who列入最新版的cns分级系统里。针对上述及其它重要信号传导通路的gbm分子靶向治疗药物已在新发或复发的gbm患者中进行临床试验,然而绝大多数分子靶向治疗药物经过临床验证,并未给gbm患者带来总体生存期(os)和无进展生存期(pfs)的显著改善。因此寻找gbm新的分子治疗靶点已成为gbm研究领域的前沿和热点。
4、目前gbm的分子机制研究集中于基因的转录调控和表观修饰,基因的转录调控中以非编码rna(ncrna)中环状rna(circrna)的研究较为深入。最新研究表明circrna/lncrna可通过编码小分子多肽或者蛋白质参与肿瘤的恶性进展过程。由于5’帽状结构的缺失,circrna长久以来被认为属于非编码rna,不具有编码多肽或蛋白的功能。随着测序技术(全转录组测序,ribo-seq、rnc-seq)的进展,研究者通过核糖体测序及生信分析及实验验证发现部分circrna其内部存在可编码的sorfs,可以编码参与细胞代谢活动的功能多肽或蛋白,通过多肽或者蛋白的功能调控肿瘤的恶性进展。例如,zheng等发现circ-ppp1r12a存在sorf,在结肠癌组织中呈显著高水平表达,通过编码多肽ppp1r12a-73aa促进结肠癌的增殖、迁移和侵袭。jiang等发现由mapk1的第2-4外显子构成的circ-mapk1序列中存在可编码的sorf和ires,具有编码蛋白mapk1-109aa能力,体外实验证实过表达mapk1-109aa可显著抑制胃癌细胞增殖和侵袭,这表明该多肽可能是胃癌靶向治疗的潜在靶点。li等发现circ-her2可编码蛋白her2-103aa,促进egfr/her3的akt磷酸化导致乳腺癌增殖加速。liang等通过circular rna数据库发现circ-β-catenin在肝癌组织中高表达,生信分析预测circ-β-catenin序列中存在可编码的sorf和ires,可编码蛋白β-catenin-370aa,在肝癌增殖过程中起重要作用。值得关注的是,circrna编码多肽或者蛋白的研究在gbm研究领域也有相关报道。例如,yang等通过高通量测序发现circ fbxw7在gbm组织样本中低表达,通过circular rna数据库生信分析并采用双荧光素酶实验和液相色谱串联质谱法,发现circfbxw7中存在可编码的sorf,编码蛋白fbxw7-185aa;fbxw7-185aa可以与usp28竞争性结合,通过降解c-myc基因,抑制gbm细胞增殖。zhang等发现circ linc-pint中的sorf可以编码多肽pint-87aa,临床gbm样本显示pint87aa显著低表达;体外细胞实验显示pint87aa可显著抑制gbm细胞的增殖和侵袭;并与可聚合酶相关因子(paf1)复合物结合,抑制多个癌症基因的转录;通过预后相关性分析,pint87aa的表达水平与gbm患者临床结局负关联。以上研究初步显示circrna编码多肽或者蛋白的机制在gbm恶性进展的调控中起重要作用。
5、随着分子生物学技术的发展,目前对于肿瘤靶向标志物的筛选涉及到的主要有基因芯片技术、高通量转录组测序技术、单细胞测序技术、dna/rna甲基化测序技术、核糖体测序技术等。circrna/lncrna长久以来被认为属于非编码rna,不具有编码多肽或蛋白的功能,被认为是翻译过程中的冗长片段,然而circrna/lncrna参与调控多种恶性肿瘤的关键信号传导通路,包括肝癌、肺癌、胃癌、乳腺癌等实体肿瘤,这提示非编码rna可能是肿瘤恶性进展的核心驱动因素之一,其参与肿瘤恶性进展的机制包括海绵吸附机制、rna结合蛋白机制、外泌体circrna/lncrna机制等。而最新研究表明circrna/lncrna可通过编码小分子多肽或者蛋白质参与肿瘤的恶性进展过程。
6、以往在研究编码基因表达丰度的时候,实际上最关心的中心法则的终产物——蛋白,而不是中间产物mrna(或circrna/lncrna)。但由于检测的便利性,使用最普遍的却是转录组测序(rna-seq),这意味在这种情况下将基因的转录丰度看作是功能产物——蛋白的丰度。显而易见这种替代式的方法(把mrna当成蛋白)是有很大误差的。因为细胞内的mrna不是以相同的速率被翻译的,mrna的丰度并不一定能反映基因在细胞内行使功能的状态。也就是说,细胞中有多少mrna本身没有意义,大部分mrna只有被真正翻译为蛋白才能行使真正的作用。那么这个关键步骤就是翻译的过程。从mrna到蛋白的翻译过程,充满大量变数。mrna低丰度的基因,完全可以通过疯狂翻译产生大量蛋白分子,实现功能的逆转;而mrna高丰度的基因,如果在翻译阶段被某种调控因素所限速,那么在蛋白阶段也可能跌入低谷。这就是翻译调控,可以在不改变转录丰度的前提下,快速应答从而改变蛋白的丰度。
7、本发明中所应用的第三组技术多肽定量分析,通过高通量转录组学技术来挖掘潜在可能编码多肽的sorfs、然后利用翻译组核糖体测序技术的方法寻找orfs的翻译证据。预测出某条sorf潜在可能翻译,并且有了基因上的翻译证据。那么该sorf真的能翻译为功能多肽吗?这时候,就需要利用质谱技术对该sorf的合成蛋白进行检测。检测到蛋白多肽表达,才能确确实实证明该sorf真的可以编码为功能多肽。利用质谱方法对sorfs编码的多肽(seps)进行直接的检测是能证明sorfs可翻译的最直接证据。然而这并没有想象中的简单。因为对这些小分子多肽进行质谱检测,存在着不少困难:1、由于seps很小、分子量低,可能没有蛋白酶消化的位点,或者不能消化为能够被质谱仪检测到的肽段;2、seps一般丰度很低,在常规的蛋白质组质谱检测中会被高丰度的大分子蛋白影响从而检测不到;3、一般通过比对蛋白数据库来鉴定肽段和蛋白,而常用的蛋白数据库并不含有由sorf这些“非编码”序列编码的seps。因此,应该利用针对10kda以下多肽的“多肽组学”来对这些seps进行检测。
8、通常10kda以上的多肽称为蛋白质,利用常规的蛋白质组来检测即可。多肽组学的检测范围又可以细分为0.5-3kda和3-10kda,目前质谱技术无法检测0.5kda以下的肽段。那么,回顾上面提到的利用传统质谱技术检测小分子多肽的困难,本发明多肽组学是怎样解决的呢?1、一般来说,3kda以上的小肽,会用胰蛋白酶grypsin)进行酶解,所以只要该小肽含有合适酶切的赖氨酸或精氨酸酶切位点,做多肽组质谱鉴定是没什么问题的。大部分情况下,用胰蛋白酶就能切开绝大部分多肽。但是如果关注的特殊蛋白没有合适的胰酶酶解位点,那么可以试着用其他的蛋白酶,如lysc、gluc等来进行酶解的优化。对于3kda以下的小肽,一般不需要酶切,直接检测即可。2、需要对100aa以下的多肽进行富集。多肽富集的方法一般有超滤管和柱子,如milipore的超滤管,分3kda和10kda大小的多肽,根据研究对象的分子量范围来选择。首先将样品加到超滤管中,然后14000g离心10-30min(根据分子量),收集下层流出液体,接着进行酶解和lc-ms/ms检测就可以了。3、针对蛋白数据库并不含有由sorf这些“非编码”序列编码的seps的问题,蛋白的鉴定依赖于数据库。而目前常用的蛋白数据库如uniprot、ensemble等收录的是100aa以上的蛋白质这是由于一直以来人们认为蛋白编码基因是指编码100个氨基酸以上的基因,所以100aa以下的小肽自然就被过滤掉了。因此,多肽组学所用的数据库比较特别,通过结合翻译组数据构建一个虚拟蛋白库利用所研究肿瘤的基因组中的非编码rna的sorf翻译而来的蛋白序列作为数据库,来鉴定sorf编码的多肽。
技术实现思路
1、本发明提供一种circrna/lncrna编码的多肽作为分子标志物在制备评估胶质瘤u87化疗疗效和预后试剂中的用途。本发明采用的翻译组测序——核糖体测序技术是指对与核糖体结合的正在翻译的rna片段进行测序,来准确获取样本中所有可翻译分子(包括mrna和其他潜在可翻译rna分子如lncrna,circrna等)的信息与精确定量,是连接转录组与蛋白质组之间的桥梁。ribo-seq是最常用的一种翻译组测序技术,该技术利用rna酶消化细胞中的rna,得到被核糖体保护的正在翻译的rna片段(ribosome footprints,rfs),然后对这些rfs进行富集、测序与分析。翻译组测序可以研究细胞内基因翻译的水平、区域、速率等,结合转录组、小rna测序、蛋白组等进行关联分析,可以更精确地研究转录后调控、翻译调控机制。
2、一种circrna/lncrna编码的多肽作为分子标志物在制备评估胶质瘤u87化疗疗效和预后试剂中的用途,筛选出的具有表达差异的circrna/lncrna,在gbm组织中低表达或高表达;并通过构建过表达该circrna/lncrna和标记flag标签的质粒并转染人293t细胞,后续采用wb证实293t细胞中存在该circrna/lncrna编码的多肽;通过免疫共沉淀(co-ip)和wb实验初步证实该多肽与相应下游结合的靶蛋白相互作用,及其过表达或敲低后对胶质瘤u87细胞增殖机制的影响。
3、用于检测circrna/lncrna编码的多肽表达水平的试剂在制备评估胶质瘤u87化疗疗效和预后试剂盒中的用途。
4、所述的试剂为引物。
5、一种检circrna/lncrna编码的多肽的试剂盒,所述的试剂盒中含有用于逆转录反应的试剂以及用于检测生物样品中circrna/lncrna编码的多肽的表达水平的pcr反应试剂。
6、所述的生物样品为胶质瘤u87新鲜病理组织。
7、本发明联合高通量转录组测序技术、核糖体测序技术、多肽定量分析技术的应用,精准筛选出一批具有翻译功能的非编码rna,通过编码小分子功能多肽参与胶质母细胞瘤恶性增殖进程,为胶质母细胞的分子靶向机制研究探寻了一个全新的方向。