本发明属于分子生物学,涉及一种中高分化食管鳞癌预后预测模型及其构建方法和应用;更具体地,涉及一种12q13.13扩增在评估中高分化食管鳞癌预后中的应用。
背景技术:
1、作为人类最常见的癌症之一,食管癌是世界第六大致死恶性肿瘤。其主要有食管鳞癌(escc)和食管腺癌(eac)两大类型,腺癌主要发生在西方国家,而在东亚,超过90%的食管癌是食管鳞癌。escc发病和死亡病例在均居于各大肿瘤前列。目前食管鳞癌主要治疗手段为手术切除,对于较早期的良性病例,可以进行内镜黏膜下剥离手术。然而食管鳞癌整体预后较差的根本原因,在于其早期就容易发生周围组织和淋巴组织的转移播散,对于已经发生转移的患者,即使进行手术,其长期生存率也并不理想,五年内累积复发率可达到70%-90%。目前对食管癌复发转移潜能相关的标志物研究并不充分,这导致了临床上对复发转移诊断的滞后性,同时也导致escc缺乏特异性药物靶点,这均严重影响了escc患者的预后。
2、食管鳞癌可分为低分化和中高分化两种类型,中高分化食管鳞癌是最常见的类型之一,占所有食管癌的一半以上,以中国为例,中高分化食管鳞癌患者约占总患者的40%~80%左右。患者的年龄、性别、饮食、病理类型等因素可能影响食管鳞癌的分化程度。中高分化食管鳞癌通常发生在40岁以上的成年人中,一些研究也表明,随着时间的推移,高分化食管鳞癌的比例逐渐升高,特别是在50岁以上的人中更为常见。吸烟、饮酒、胃食管反流、食管化学性损伤、营养不良、高温烹调食品、烟熏食品、口腔癌、头颈部癌症等都与中高分化食管鳞癌的发病风险增加有关。
3、理论上,中高分化肿瘤具有更好的预后。在食管癌中,食管切除手术后,低分化食管鳞癌的5年生存率在10%至30%之间,而中高分化食管鳞癌人群的5年生存率也仅为30%~50%左右,由于中高分化人群在食管癌人群中占比较高,因此由中高分化导致的食管癌死亡率不容忽视。
4、早期发现的中高分化食管鳞癌的治愈率较高,治愈率随肿瘤分期的加重而降低。术后化疗和(或)放疗可以改善中高分化食管鳞癌的预后,尤其是在有淋巴结转移的情况下,但与其他具有靶向疗法的肿瘤相比,其干预手段有限,预后整体偏差。
技术实现思路
1、为了解决上述技术问题,本发明提供一种中高分化食管鳞癌预后预测模型及其构建方法和应用。本发明通过对中高分化食管鳞癌是否发生12号染色体长臂13.13区段(12q13.13)扩增进行检测,用以对中高分化食管鳞癌的预后评估。相较非12q13.13扩增的中高分化食管鳞癌患者,12q13.13扩增的中高分化食管鳞癌患者预后较差。本发明可以对中高分化食管鳞癌患者的诊断和预后评估提供一定的帮助。
2、概述
3、全外显子组测序技术(wes),运用核酸序列捕获方法,将基因组外显子区域的dna进行富集,而后通过插入接头,构建dna文库,并通过二代测序技术(ngs)进行测序。该方法可检测基因外显子序列的单核苷酸变异(snv)和拷贝数变异(cnv),同时还可根据上述信息,评估染色体臂扩增、缺失等结构变异。
4、发明人对144例食管鳞癌患者肿瘤组织和配对癌旁样本进行了wes检测,同时收集了相关患者的临床病理信息和超过10年的随访信息。发现在上述人群队列中,12号染色体长臂13.13区段的扩增是食管鳞癌的高频突变之一,在整体队列水平,12q13.13扩增与食管鳞癌生存显著相关。发明人进一步比较了低分化食管鳞癌患者和中高分化食管鳞癌患者中12q13.13扩增与生存的关系。结果表明,在低分化患者人群中,12q13.13扩增与预后无显著差异;而在中高分化患者中,12q13.13扩增人群食管鳞癌发病12q13.13扩增与生存显著相关(如图3所示,非12q13.13扩增的中高分化食管鳞癌患者五年总生存率接近60%,12q13.13扩增的中高分化食管鳞癌患者十年总生存率低于30%)。本发明结果表明,利用检出的12q13.13扩增的中高分化患者,12q13.13扩增可作为一个发生中高分化食管鳞癌进展和预后较差的风险因素。
5、详述
6、为了解决上述技术问题,本发明第一方面提供一种中高分化食管鳞癌预后预测模型的构建方法,其包含以下步骤:
7、(1)建立输入模块,所述输入模块用于输入中高分化食管鳞癌样本的12号染色体长臂13.13区段的基因扩增信息;
8、(2)建立分析模块,所述分析模块用于分析样本的12号染色体长臂13.13区段的基因扩增信息与数据库相比是否有统计学上的显著增加;
9、(3)建立输出模块,若有统计学上的显著增加,则所述输出模块用于输出结果为样本的预后较差。
10、在某一较佳实施方案中,所述统计学上的显著增加的判断标准是q值小于0.1。
11、q值即q value(p-adjusted),为校正后的p值(q value=padj=fdr=correctedp-value=p-adjusted),是对p值进行了多重假设检验,能更好地控制假阳性率。
12、其中p值(p value)为统计学差异显著性检验指标。
13、本发明所述的q值优选为利用软件gistic2进行计算。
14、在某一较佳实施方案中,本发明所述的统计学上的显著增加的判断标准是p值小于0.05。
15、本发明中,12号染色体长臂13.13区段也简称为12q.13.13,即为12号染色体长臂1区3带1亚带3次亚带对应的区域。
16、本发明所述预后可体现在生存率上,比如进展生存期或总生存期;优选指的是总生存期。
17、总生存期(os)即从患者接受治疗开始到患者因任何原因死亡的时间,即患者通过治疗活了多久。
18、本发明所述的预后较差可为本领域技术人员的常规理解,也可指生存率降低,优选为生存率低于30%,更优选为5年生存率低于30%。
19、本发明所述的12q13.13扩增指的是整个12q.13.13上发生任一个或多个基因或基因片段的扩增,并不特指12q.13.13上某一序列或某一基因发生的扩增。
20、在某些较佳实施方案中,上述构建方法中:步骤(1)还包括对样本进行全外显子组测序技术来获得12号染色体长臂13.13区段的基因扩增信息。
21、在某些较佳实施方案中,上述构建方法中:步骤(2)中的数据库包括配对千人基因数据库、食管鳞癌人群癌旁基因组或血细胞基因数据库。
22、所述配对千人基因组数据库可为本领域常规,比如可来自https://www.internationalgenome.org/。
23、本发明所述的食管鳞癌人群癌旁基因组的构建可为本领域常规,也可参考本发明实施例中食管鳞癌人群癌基因组的构建进行。
24、在某些较佳实施方案中,步骤(1)还包括如下步骤:
25、s1、建立dna提取模块:所述dna提取模块用于提取样本的基因组dna;
26、s2、建立基因文库模块:所述基因文库模块用于获得对基因组dna实施超声处理打断、末端修复、接头连接、杂交捕获和pcr扩增所得到的基因文库;
27、s3、建立测序模块:所述测序模块例如为illumina hiseq进行全外显子组测序,获得测序数据;
28、s4、建立数据分析模块:所述数据分析模块对所述测序模块获得的测序数据进行选自以下组的分析:质控检测、片段匹配、变异分析、拷贝数分析和显著突变基因分析;以及获取拷贝数变异、单核苷酸变异以及小片段序列插入和缺失的信息;
29、s5、建立生物信息分析模块:所述生物信息分析模块用于确定12号染色体长臂13.13区段的突变位置及突变类型,并进行生物学分析,筛选12号染色体长臂13.13区段扩增基因变异情况。
30、在某些实施方案中,步骤s1中:所述dna提取模块利用试剂盒提取样本的基因组dna。
31、所述试剂盒优选为qiaamp dna mini kit。
32、在某些较佳实施方案中,所述步骤s1,采用qiaamp dna mini kit基因组dna提取试剂盒及其标准操作步骤,提取样本基因组dna;采用1%琼脂糖凝胶电泳,对所提取dna进行质量控制,所提取dna样本浓度,利用dna assay kit dna浓度检测试剂盒,在2.0fluorimeter核酸检测仪中进行检测。
33、在某些实施方案中,步骤s2中,所述基因文库模块使用agilent sure selecthuman all exon 50mb kit进行基因文库构建。
34、在某些实施方案中,步骤s2中,采用0.6μg基因组dna样本,进行后续文库构建。
35、在某些实施方案中,步骤s2中,所述超声处理打断包括通过超声处理将基因组dna打碎为180bp-280bp的片段,并进行质控以及dna浓度检测。
36、优选地,所述步骤s2,dna样本利用超声仪(covaris)进行片段破碎,使得dna片段分子量范围在180-280bp之间。
37、优选地,步骤s2中末端修复是在片段dna 3’端连接测序接头a碱基。
38、优选地,步骤s2中pcr扩增条件为:95℃预变性2min;98℃变性20s,70℃5mim,25~30个循环;得到的扩增产物4℃短期保存或-20℃长期保存。
39、优选地,步骤s2中pcr产物进行biotin磁珠富集。
40、优选地,步骤s2中pcr富集产物通过pcr添加接头标签序列,利用ampure xp系统进行纯化,利用agilent high sensitivity dna assay dna检测试剂盒,在agilentbioanalyzer 2100系统中进行定量。
41、在某些实施方案中,步骤s3中,所述测序数据为原始序列数据。
42、在某些实施方案中,步骤s3中,所述测序在ngs测序平台进行。
43、优选地,步骤s3中样本通过hiseq pe cluster kit(illumina)试剂盒,在cbotcluster generation系统中进行反应;在illumina hiseq平台测序仪中进行测序,获取150bp双尾序列信息。
44、优选地,将s4所得数据与数据库进行比对,得到拷贝数变异、单核苷酸变异、小片段序列插入以及缺失的信息。
45、优选地,步骤s3~s5中,获取原始数据,还包括对其进行数据清洗的步骤,例如根据illumina数据处理标准流程进行数据清洗。
46、优选地,步骤s3~s5中,经过数据清洗的数据,还包括对其进行数据匹配和基因注释的步骤,例如利用人类基因组参考序列(ucsc hg19),通过burrows-wheeler aligner(bwa)软件、samtools软件、picard软件(http://broadinstitute.github.io/picard/)进行序列匹配和基因注释。
47、优选地,步骤s3~s5中,还包括进行位点变异分析、拷贝数变异分析,例如利用samtools mpileup、bcftools、gatk’s(gatk 4)相关工具进行位点变异分析、拷贝数变异分析。
48、在某些实施方案中,步骤s4中,所述的质控检测包括测序深度、覆盖度均一性和对比率分析。
49、优选地,步骤(2)中,还包括进行结果分析,例如根据gistic2软件分析样本的12号染色体长臂13.13区段的基因扩增信息与数据库相比是否有统计学上的显著增加。
50、本发明第二方面提供一种中高分化食管鳞癌预后的预测模型,其通过如本发明第一方面所述的构建方法建立。
51、在某一较佳实施方案中,所述预测模型包括:
52、(1)输入模块,所述输入模块用于输入中高分化食管鳞癌样本的12号染色体长臂13.13区段的基因扩增信息;
53、(2)分析模块,所述分析模块用于分析样本的12号染色体长臂13.13区段的基因扩增信息与数据库相比是否有统计学上的显著增加;
54、(3)输出模块,若有统计学上的显著增加,则所述输出模块用于输出结果为样本的预后较差。
55、本发明第三方面提供用于12号染色体长臂13.13区段扩增的试剂在制备中高分化食管鳞癌样本的预后检测剂中的用途。
56、在某一较佳实施方案中,所述试剂用于检测12号染色体长臂13.13区段的表达水平;所述表达水平为蛋白表达水平和/或mrna转录水平。
57、在本发明一较佳实施方案中,所述试剂为与12号染色体长臂13.13区段特异性结合,或者与编码12号染色体长臂13.13区段的核酸特异性杂交的生物分子试剂。
58、在本发明一较佳实施方案中,所述生物分子试剂选自引物、探针和抗体。
59、在本发明一较佳实施方案中,所述试剂为用于转录组和/或蛋白质组测序的试剂。
60、在某一较佳实施方案中,当12号染色体长臂13.13区段发生扩增时,所述样本的预后较差。
61、在某一较佳实施方案中,所述样本可为患者。
62、在某一较佳实施方案中,采用测序技术检测样本的12号染色体长臂13.13区段是否发生扩增。
63、在某一较佳实施方案中,使用全外显子组测序技术。
64、本发明第四方面提供一种利用预测模型评估受试者的中高分化食管鳞癌预后的方法,其通过检测样本的12号染色体长臂13.13区段上是否发生扩增来判断受试者的预后,当12号染色体长臂13.13区段发生扩增时,所述受试者的预后较差,所述预测模型为通过如本发明第一方面所述构建方法建立,或者为如本发明第二方面所述的预测模型。
65、在某一较佳实施方案中,采用测序技术检测样本的12号染色体长臂13.13区段是否发生扩增。
66、在某一较佳实施方案中,使用全外显子组测序技术。
67、在某一较佳实施方案中,所述方法为非治疗或诊断目的,可适用的场景为实验室研究、环境检测等。
68、本发明第五方面提供一种如本发明一方面所述构建方法建立的预测模型或者如本发明第二方面所述的预测模型在评估受试者的中高分化食管鳞癌预后中的应用。
69、较佳地,在所述应用中,通过检测样本的12号染色体长臂13.13区段上是否发生扩增来判断受试者的预后,当12号染色体长臂13.13区段发生扩增时,所述受试者的预后较差。
70、本发明第五方面提供一种治疗中高分化食管鳞癌的方法,其向有需要的患者施用治疗有效量的抑制或激活12号染色体长臂13.13区段上的基因的药剂。
71、在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
72、本发明所用试剂和原料均市售可得。
73、本发明的积极进步效果在于:本发明通过对中高分化食管鳞癌是否发生12q13.13扩增进行检测,用以对中高分化食管鳞癌预后做预测。相较非12q13.13扩增的中高分化食管鳞癌患者,12q13.13扩增的中高分化食管鳞癌患者预后较差。本发明可以对中高分化食管鳞癌患者的诊断,治疗及用药提供一定的帮助。