本发明涉及生物检测领域,具体地,本发明涉及淋巴瘤基因捕获芯片及其应用,更具体地,本发明涉及淋巴瘤基因捕获芯片以及检测淋巴瘤基因的基因变异的方法。
背景技术:
淋巴瘤是起源于淋巴造血系统的恶性肿瘤,主要表现为无痛性淋巴结肿大,肝脾肿大,全身各组织器官均可受累,伴发热、盗汗、消瘦、瘙痒等全身症状。全球每年约有35万新发患者,我国每年新发病例约有25000例。恶性淋巴瘤在我国是发病率增速最快的恶性肿瘤之一,以每年5%的速度上升,居常见恶性肿瘤第8位。根据不同的淋巴细胞起源,可以分为b细胞、t细胞和nk细胞淋巴瘤。b细胞淋巴瘤是b细胞发生的实体肿瘤。包括非霍奇金淋巴瘤(nhl)和霍奇金淋巴瘤(hl)两类。nhl发病率远高于hl,具有很强异质性。b细胞淋巴瘤分型众多,经典霍奇金淋巴瘤和结节性淋巴细胞为主型霍奇金淋巴瘤,现在被认为是起源于b细胞的肿瘤。弥漫性大b细胞淋巴瘤、滤泡性淋巴瘤、黏膜相关淋巴组织淋巴瘤(malt)、小淋巴细胞淋巴瘤/慢性淋巴细胞白血病、套细胞淋巴瘤(mcl)5种b细胞非霍奇金淋巴瘤最为常见,占非霍奇金淋巴瘤的3/4。b细胞淋巴瘤的预后和治疗取决于淋巴瘤的具体类型以及分期分级。
弥漫大b细胞淋巴瘤(dlbcl)是最常见的非霍奇金淋巴瘤,约占世界新确诊病例的30%-40%,我国的发病率更高一些。它是侵袭性肿瘤的代表,如果没有治疗可致命。当前免疫化学疗法采用利妥昔单抗和环磷酰胺、阿霉素、长春新碱和泼尼松龙联合治疗(r-chop),能治愈大多数dlbcl患者,但是r-chop方案治疗失败的患者大多数最终将死于该疾病。
传统的诊断方法一般基于病理学和细胞免疫表型检测。分子学研究已经阐明了dlbcl的复杂生物异质性。尤其是,细胞起源的确定可为dlbcl提供重要的预测信息,激活b细胞(abc)分子亚型对r-chop治疗效果比生发中心b细胞淋巴瘤(gcb)亚型更差(3年无进展生存期为40%vs75%)。然而,目前尚无标准的商业化检测方法可用于精确确定dlbcl亚型。目前基因表达谱是金标准,但它由于需要新鲜冰冻组织样本因此通常不可用。为了检测石蜡包埋组织样本,开发了几种免疫组织化学为基础的算法,该方法事实上是基因表达谱的一种不完美的替代,也会面临免疫组化方法重现性差的问题。除确定分子细胞起源外,目前通过细胞遗传学和分子基因检测,已经明确bcl-2基因重排,c-myc基因重排等为可影响dlbcl治疗的生物预测因子。myc原癌基因重排常见于约10%的dlbcl患者中。myc蛋白表达增加与结局特别差相关,多项研究明确myc基因重排与r-chop治疗的dlbcl患者的预后差相关。此外,最近研究显示,myc受到bcl2基因严重影响。所谓的双重打击淋巴瘤是指同时具有myc和bcl2易位的亚组,约占dlbcl病例的5%,通常较难治疗,中位生存期约为8个月。
过去30年对恶性淋巴瘤的研究主要是为了制定精准、可重复的以及世界范围可接受的分类规则,最终确定了约110种不同的变异类型。然而,这种分类方法对临床治疗影响较小,目前临床治疗仍然主要依赖联合化疗的经验治疗。通过全外显子和全基因组测序对淋巴瘤基因组学综合评估,研究发现基因组改变广泛存在于不同的淋巴瘤变异体中。此外,这些研究表明,每个淋巴瘤患者具有独特的基因组变异。因此,未来淋巴瘤研究的主要任务是确定关键驱动突变和可能的致癌突变组合,可作为当前分类的预测生物标记物。
目前国内外已有成型的血液肿瘤基因检测产品推出,其中国外主要有两家foundationone和precipiodiagnostic,前者产品foundationoneheme以芯片捕获结合高通量测序为技术手段,以illuminahiseq2500为平台,检测405个癌症相关基因变异(snv、indel、cnv、generearrangement)和265个融合基因,检测疾病涉及白血病、淋巴瘤、骨髓瘤、多种肉瘤及儿科肿瘤。后者产品smartgentmacademic-basedcomprehensivegeneticdiagnostics以多重pcr结合高通量测序为技术手段,以illuminahiseq2500和ion-torrent为平台,检测33种(或48种)基因变异。国内主要是陆道培医院,以pcr法检测36种融合和2种内部缺失型突变。
技术实现要素:
本申请是基于发明人对以下事实和问题的发现和认识做出的:
目前国内外已有成型的血液肿瘤检测产品只是针对部分淋巴瘤相关基因的变异情况进行检测,不能为各亚型淋巴瘤患者提供全面的基因变异检测服务,也不能为各亚型淋巴瘤患者提供精准的临床辅助诊断、用药指导、预后判断以及复发监测依据。
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明提出一种基于目标区域捕获结合高通量测序技术的淋巴瘤基因检测产品,该产品可用于淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等)患者进行基因变异检测,可检测样本类型包含肿瘤患者的新鲜组织、石蜡包埋组织、外周血。该淋巴瘤基因检测产品可为各个亚型的淋巴瘤患者提供全面、快速、精准的基因变异检测服务,不仅可用于临床医生辅助临床诊断与分型,还可为患者提供个体化用药指导,以及预后判断和复发监测依据。
在本发明的第一方面,本发明提出了一种淋巴瘤基因捕获芯片。根据本发明的实施例,所述芯片包括:基体,探针,所述探针设置在所述基体上,所述探针特异性识别表1所示基因的至少之一。根据本发明的实施例,所述芯片包括了常见高发淋巴肿瘤各亚型的相关drivergene、高频突变基因、癌症相关5条信号通路中重要基因、靶向药物及化疗药物药物敏感和耐药相关基因;可用于对淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的检测,可实现对淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等)的检测;有效用于淋巴瘤的早期筛查、辅助诊断、用药指导以及复发监控。
在本发明的第二方面,本发明提出了一种建库方法。根据本发明的实施例,所述方法包括:将待建库基因片段进行末端修复、末端加a、加接头以及第一pcr扩增处理;将扩增处理产物与前面所述的芯片进行杂交;以及将杂交处理产物进行第二pcr扩增处理,以便获得测序文库。利用根据本发明实施例的建库方法构建测序文库,相比于现有技术,相同数据量可进行更高深度的数据挖掘,基于所构建的测序文库进行测序并进行数据分析,可获得淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的信息,可实现对淋巴瘤各亚型的早期筛查、辅助诊断、用药指导以及复发监控。
在本发明的第三方面,本发明提出了一种试剂盒。根据本发明的实施例,所述试剂盒包含前面所述的芯片。根据本发明的实施例,所述试剂盒可用于对淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的检测,可实现对淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等)的检测;有效用于淋巴瘤的早期筛查、辅助诊断、用药指导以及复发监控。
在本发明的第四方面,本发明提出了一种检测淋巴瘤基因的基因变异的方法。根据本发明的实施例,所述方法包括:利用前面所述的淋巴瘤基因捕获芯片与待测基因组dna进行杂交,以捕获目标dna;利用高通量测序对捕获得到的目标dna进行测序。利用根据本发明实施例的检测淋巴瘤基因的基因变异的方法,相比于现有技术,相同数据量可进行更高深度的数据挖掘,可获得淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的信息,可实现对淋巴瘤各亚型的早期筛查、辅助诊断、用药指导以及复发监控。另外,上述检测淋巴瘤基因的基因变异的方法还可用于非诊断目的,如用于科学研究:1)分析淋巴瘤突变频谱图,比较中国人某个亚型淋巴瘤突变与文献中突变谱的异同;2)探究分子分型与药物疗效的相关性,寻找新的有意义的突变位点。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
淋巴瘤基因捕获芯片
在本发明第一方面,本发明提出了一种淋巴瘤基因捕获芯片。根据本发明的实施例,所述芯片包括:基体,探针,所述探针设置在所述基体上,所述探针特异性识别表1所示基因的至少之一。根据本发明的实施例,所述芯片包括了常见高发淋巴肿瘤各亚型的相关drivergene、高频突变基因、癌症相关5条信号通路中重要基因、靶向药物及化疗药物药物敏感和耐药相关基因;可用于对淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的检测,可实现对淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等)的检测;有效用于淋巴瘤的早期筛查、辅助诊断、用药指导以及复发监控。
表1:基因列表
根据本发明的实施例,所述探针特异性识别表1所示基因的80%、85%、90%、95%、98%或99%。
根据本发明的实施例,所述探针进一步特异性识别表2所示融合基因的至少之一,其中,所述融合基因的断点如表3所示。上述基因为sv类型的融合基因,对于sv类型的基因需要确定明确的断点位置或者断点所在的区域。根据本发明的具体实施例,断点的查找及确定是通过如下方式确定的:1)下载ticdb数据库中所有融合的序列,与融合基因序列比对得到断点信息,2)整理cosmic数据库中记载的断点信息,3)google或pubmed查找文献中报道的已知断点信息,对于没有具体断点信息的融合,根据文献描述,得到对应的断点所在区间信息。
表2:融合基因
表3:融合基因断点位置
根据本发明的实施例,所述探针特异性识别snv和indel类型的基因如myd88、ms4a1、bcor、etv6、notch1、tp53、idh2、egfr的外显子区域。所述探针特异性识别snv和indel类型的基因的外显子区域,所述芯片的对于目标区域捕获的灵敏度和特异性进一步提高。
根据本发明的实施例,所述探针特异性识别cnv类型的基因cds区域,所述cds区域包括杂合snp位点,如ptenchr1089623716,89630142,89630424,89631401,89631427,89631809,89632262,89633231,89633307,89638616。发明人发现,所述探针特异性识别cnv类型基因的cds区域,所述芯片的对于目标区域捕获的灵敏度和特异性进一步提高。
根据本发明的实施例,所述芯片是以罗氏的nimblegenez芯片为基体的液相芯片。选用罗氏的nimblegenez芯片,是因为其具有以下优势:1)高特异性和高覆盖率;2)降低成本,节约时间;3)易于定制每一捕获设计。
根据本发明的实施例,所述淋巴瘤为高发淋巴瘤,所述高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤和霍奇金淋巴瘤中的一种或多种。相比于现有技术,根据本发明实施例芯片实现了对上述淋巴瘤亚型的精确诊断。
建库方法
在本发明的第二方面,本发明提出了一种建库方法。根据本发明的实施例,所述方法包括:将待建库基因片段进行末端修复、末端加a、加接头以及第一pcr扩增处理;将扩增处理产物与前面所述的芯片进行杂交;以及将杂交处理产物进行第二pcr扩增处理,以便获得测序文库。利用根据本发明实施例的建库方法构建测序文库,相比于现有技术,相同数据量可进行更高深度的数据挖掘,基于所构建的测序文库进行测序并进行数据分析,可获得淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的信息,可实现对淋巴瘤各亚型的早期筛查、辅助诊断、用药指导以及复发监控。
根据本发明的实施例,所述待测基因片段是通过下列方式获得的:1)提取淋巴肿瘤组织基因组dna(gdna),作为第一待测待测基因;2)提取外周血血浆游离肿瘤dna(ctdna)或血浆游离dna(cfdna),以便获得第二待测基因片段,所述第二待测基因片段的大小为150~190bp,优选地,所述第二待测基因片段的大小为170bp;3)将所述第一待测基因进行打断处理,以便获得第二待测基因片段,所述第二待测基因片段的大小为200~300bp,其中,所述第一待测基因片段和所述第二待测基因片段来自同一个体。通过上述方式获取待测基因片段,可对受检者进行多次实时采血,进而可实现早期筛查时的定期检测,监控肿瘤发病风险,肿瘤患者可在手术后、化疗用药/靶向用药后随时检测,以分析手术预后情况及用药的灵敏性、耐药性情况等。
试剂盒
在本发明的第三方面,本发明提出了一种试剂盒。根据本发明的实施例,所述试剂盒包含前面所述的芯片。根据本发明的实施例,所述试剂盒可用于对淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的检测,可实现对淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等)的检测;有效用于淋巴瘤的早期筛查、辅助诊断、用药指导以及复发监控。检测淋巴瘤基因的基因变异的方法
在本发明的第四方面,本发明提出了一种检测淋巴瘤基因的基因变异的方法。根据本发明的实施例,所述方法包括:利用前面所述的淋巴瘤基因捕获芯片与待测基因组dna进行杂交,以捕获目标dna;利用高通量测序对捕获得到的目标dna进行测序。利用根据本发明实施例的检测方法,相比于现有技术,相同数据量可进行更高深度的数据挖掘,可获得淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的信息,可实现对淋巴瘤各亚型的早期筛查、辅助诊断、用药指导以及复发监控。另外,上述检测淋巴瘤基因的基因变异的方法还可用于非诊断目的,如用于科学研究:1)分析淋巴瘤突变频谱图,比较中国人某个亚型淋巴瘤突变与文献中突变谱的异同;2)探究分子分型与药物疗效的相关性,寻找新的有意义的突变位点。
根据本发明的实施例,所述方法是通过如下方式实现的:(1)将所述待测基因组dna进行打断处理,以便获得dna片段,优选地,所述dna片段的长度为200-300bp;(2)将所述dna片段进行纯化、末端修复、末端加a、加接头和第一pcr扩增处理;(3)将步骤(2)得到的产物与权利要求1~5任一项所述的芯片进行杂交,以捕获目标dna片段;(4)利用所述目标dna片段构建测序文库;(5)利用高通量测序对步骤(4)得到的测序文库进行测序,以便得到测序结果;(6)将步骤(5)得到测序结果进行分析,以便得到所述基因变异信息。
根据本发明的实施例,利用根据本发明实施例的上述检测方法,可获得淋巴瘤相关基因的单核苷酸位点变异(snv)、indelinsertion插入或deletion缺失(indel)、基因拷贝数变异(cnv)和染色体结构变异(sv)的信息,可实现对淋巴瘤各亚型的早期筛查、辅助诊断、用药指导以及复发监控。
根据本发明的再一具体实施例,在步骤(3)之后和步骤(4)之前进一步包括:对捕获到的目标dna片段进行第二pcr扩增处理。进而进一步提高目标dna片段的富集效率。
根据本发明的再一具体实施例,步骤(6)进一步包括:(6-1)对所述测序结果进行质控,以便去除n≥10%和碱基质量值≤5的碱基数目>50%的读长;(6-2)将质控后的测序结果与参考序列比对;(6-3)利用mutect、somvar流程对比对结果进行snv变异分析;利用gatk、somvar流程对比对结果进行indel变异分析;利用contra.py流程对比对结果进行cnv变异分析;利用somvar流程对比对结果进行sv变异分析。通过上述分析流程,可对淋巴瘤基因变异类型进行分型处理,所获得基因变异信息全面而可信度高。
根据本发明的实施例,所示变异分析是在深度≥10×,normal变异率≤2%,cancer变异率≥1%,变异reads数≥3,somaticp值≤0.05的参数下进行的。根据本发明的实施例,在上述参数下,对基因变异的分析的数据利用度更高、结果的可信性度更高。
根据本发明的具体实施例,所述的捕获芯片、建库方法、试剂盒以及检测淋巴瘤基因的基因变异的方法适用于所有可以提供淋巴肿瘤组织和外周血样本的淋巴瘤类型,所涉及的内容主要包括4大部分:用于淋巴瘤早期筛查辅助诊断、用药指导、预后判断,及微小残留监控的目标区域捕获芯片设计;组织及微量血浆样本建库及杂交上机测序;下机数据的生物信息分析、变异数据解读;以及基因辅助诊断和预测药物疗效数据库的构建。
(一)淋巴瘤早期筛查辅助诊断、用药指导、预后判断,及微小残留监控的目标区域捕获芯片设计
设计淋巴肿瘤个体化目标区域捕获芯片之前首先应该明确以下检测内容:1)panel检测的疾病类型为淋巴瘤各亚型(常见高发淋巴瘤包括弥漫性大b细胞淋巴瘤、生发中心b细胞淋巴瘤、滤泡性淋巴瘤、套细胞淋巴瘤、伯基特淋巴瘤、边缘区b细胞淋巴瘤、毛细胞淋巴瘤、外周/皮肤t细胞淋巴瘤、间变性大细胞淋巴瘤、慢性淋巴瘤细胞白血病/小淋巴细胞淋巴瘤、结节性边缘区淋巴瘤、nk/t细胞淋巴瘤、霍奇金淋巴瘤等);2)panel检测的目的为早期筛查、辅助诊断、用药指导以及复发监控;3)panel的检测内容为snv、indel、cnv和sv。
基因的选取[基因的选取是收集过程,该基因芯片包含了靶向药物相关基因、化疗药物相关基因、癌基因/抑癌基因、致病性基因、信号通路相关基因等。]:包括淋巴肿瘤个体化目标区域捕获芯片基因列表的确定以及基因区域的确定。其中基因列表的选取包括了靶向药物相关基因、化疗药物相关基因、癌基因/抑癌基因、致病性基因、信号通路相关基因等等。靶向药物相关基因的确定:首先要确定目前已经获得fda批准的淋巴瘤靶向药物以及临床ii/iii期药物(共31个),主要参考淋巴瘤最新版nccn指南、fda.gov网站、clinicaltrials.gov网站以及google检索,确定淋巴瘤包含的靶向药物后再通过phamgkb、drugbank、dgidb数据库以及google检索各个靶向药物对应的相关基因进行查找并整理。化疗药物相关基因的确定:首先参考淋巴瘤nccn指南来确定可用于淋巴瘤的化疗药物列表(共25个),再通过检索pharmgkb数据库查找确定化疗药物相关基因。癌基因/抑癌基因的确定:主要根据文献报道整理,目前已知癌基因及抑癌基因约137种。致病性基因的确定:主要参考cosmic和cancergenetics两个数据库,根据两个数据库中不同淋巴瘤亚型(40种亚型)所统计的高频突变基因,确定需要选定的致病性基因列表。信号通路相关基因的确定:与b细胞淋巴瘤相关的信号通路主要有①b细胞发育过程相关信号通路,②b细胞活化相关信号通路、③b细胞增殖、凋亡信号通路,④b细胞迁移相关信号通路,⑤b细胞粘附、趋化相关信号通路,⑥b细胞与血管内皮作用、血管生成信号通路,⑦无氧代谢与b细胞存活相关信号通路,⑧表观遗传学去甲基化、组蛋白去乙酰化等与b细胞淋巴瘤发生相关信号通路,确定上述信号通路后,需要查找keggpathway数据库或google、pubmed检索文献确定各通路中的主要因子。
通过上述步骤确定芯片的基因列表后,需要依据panel包含的突变类型(snv单核苷酸位点变异、indelinsertion插入或deletion缺失、cnv基因拷贝数变异和sv(染色体)结构变异确定基因的区域,对于snv和indel类型的基因可将基因的全部外显子区域设计入内,对于cnv类型的基因可设计cds区域,同时需要添加杂合snp位点,而对于sv类型的基因则需要确定明确的断点位置或者断点所在的区域[设计原则]。断点的查找及确定:1)下载ticdb数据库中所有融合的序列,与融合基因序列比对得到断点信息,2)整理cosmic数据库中记载的断点信息,3)google或pubmed查找文献中报道的已知断点信息,对于没有具体断点信息的融合,根据文献描述,得到对应的断点所在区间信息。
在淋巴肿瘤个体化目标区域捕获芯片设计过程中,淋巴瘤亚型分类(约40种亚型)众多,与淋巴瘤相关的信号通路(8条重要信号通路)较多,淋巴瘤相关靶向药物(31个)也非常多,同时,淋巴瘤相关的融合基因形式及融合断点繁多且没有单一的数据库可以查询整理,这些都导致芯片设计过程复杂繁琐,查找步骤复杂,需要查找的数据库及文献报道繁多,最终都导致芯片设计的复杂性和困难度较大。
基于tcga、icgc、cosmic等数据库和相关文献参考,采用迭代算法设计出用于肿瘤个体化检测的目标区域捕获芯片lymper(由罗氏公司生产,nimblegenez液相芯片)。lymper芯片包括了常见高发淋巴肿瘤各亚型的相关drivergene、高频突变基因、癌症相关5条信号通路中重要基因、靶向药物及化疗药物药物敏感和耐药相关基因等,共计476个基因(基因列表详见表1)以及53种融合基因(融合基因列表详见表2,融合基因断点位置列表详见表3),芯片大小1.88m。
(二)样本制备
1.组织样本制备;外科手术后切取60mg的新鲜组织样本,立即放入液氮完全冷冻后,低温(-80℃)保存,得到肿瘤组织基因组dna(gdna);
2.外周血浆样本制备:取患者外周血5-10ml,存于edta抗凝管中,在4-6小时内对外周血进行分离,得到血浆游离肿瘤dna(ctdna)或血浆游离dna(cfdna);
3.gdna及cfdna/ctdna定量检测;
(三)文库制备及测序
1.对gdna超声打断,片段大小200~300bp;
2.对gdna片段和cfdna/ctdna片段进行末端修复;
3.对gdna片段和cfdna/ctdna片段末端加a;
4.连接adapter文库接头:文库接头(adapter)是指经过设计的一段碱基序列,作用在于gdna和cfdna/ctdna文库扩增时与引物相结合,使dna扩增进行,并且在上机测序时与standardanchor相结合,利于探针与待测序位点结合辅助dna测序进行。
5.文库进行第一轮pcr扩增;
6.扩增后文库质控并进行淋巴瘤个体化芯片(独有设计)杂交;
7.杂交文库进行第二轮pcr扩增;
8.文库定量及质控;
9.illuminahiseq2500/2000上机测序,组织类样本测序深度达300×以上,血浆类样本测序深度达1000×以上;
(四)目标区域捕获测序下机数据进行生物信息分析
获得下机数据后需进行如下生物信息分析,得到最终的变异结果
1.soapnukefilter:去除低质量reads;
2.与reference序列比对,产生bam文件;
3.标记重复序列;
4.比对结果不好的序列重新比对,并校正质量值;
5.去除错配序列;
6.分析下机数据qc;
7.寻找变异;
8.对变异结果进行注释,得到最终数据结果。
(五)变异数据解读
对生物信息分析后的变异数据进行个体化解读,参考构建的血液及淋巴系统肿瘤数据库及相关文献,对患者检出的变异进行分析,判断变异所产生的致病原因、各种化疗药物的预期疗效及毒副作用、最适合的获益靶向药物及耐药性靶向药物,让临床医生对于淋巴肿瘤患者的用药治疗更有针对性,免去无效用药所耽误的宝贵时间以及毒副作用给患者带去的治疗痛苦。
本发明中开发的淋巴瘤基因捕获芯片比现有oseq-t芯片效果更好,测序质量及数据有效利用率均优于现有芯片,比较结果如表4所示。
表4:
研究结果显示,正常人外周血中的游离血浆dna(cfdna)的浓度为1-100ng/ml,而肿瘤患者外周血中的循环肿瘤dna(ctdna)含量将明显增加,由于肿瘤细胞分泌、凋亡或坏死所产生基因组片段入血,使肿瘤患者外周血中的ctdna含量平均浓度可达180ng/ml,通过对肿瘤患者外周血ctdna的含量变化及突变情况进行定时监控,可应用于:
1.肿瘤的早期筛查辅助诊断检测;
2.遗传性肿瘤预测及状态评估;
3.肿瘤早期发病进展检测;
4.肿瘤术后效果检测评估;
5.肿瘤靶向治疗、化疗治疗基因变异情况分析;
6.肿瘤致病基因微量残留检测;
7.肿瘤耐药性基因变异情况分析;
相对与临床传统的肿瘤检测方法,该技术优势如下:
1)微创性:正常受检者及肿瘤患者只需要提供5-10ml外周血样本;
2)实时性:可对受检者进行多次实时采血,早期筛查时可定期检测,监控肿瘤发病风险,肿瘤患者可在手术后、化疗用药/靶向用药后随时检测,以分析手术预后情况及用药的灵敏性、耐药性情况等;
3)高灵敏度:不受限与病灶位置及大小,通过高深度的目标区域捕获测序,可以检测出突变频率为1%的低频变异,对于肿瘤发病早期以及肿瘤治疗复发后所出现的变异能够及时准确检出;
4)高特异性:在ctdna含量较少的情况下,能够保证较低的假阳性率、假阴性率,确保得到的检测结果能够准确的反应受检者实时外周血状况;
5)高通量:基于新一代测序技术的目标区域捕获测序,能够在很短的时间内同时进行多例样本检测,并且在目标区域捕获芯片的使用下,相同数据量可进行更高深度的数据挖掘。
实施例
以下具体实施过程以1例淋巴瘤患者的肿瘤组织(样本1)和1例淋巴瘤患者外周血血浆(样本2)作为研究对象,内容如下:
(一)外周血样本分离
1.采集受检者外周血1-2管(5ml/管)于edta抗凝管中,轻柔上下颠倒(防止细胞破裂)6-8次充分混匀,在采血当天4-6小时内进行以下处理;
2.在4℃条件下1600g离心10分钟,离心后将上清(血浆)分装到多个1.5ml/2ml离心管中,在吸取过程中不能吸到中间层白细胞;
3.在4℃条件下16000g离心10分钟,去除残余细胞,将上清(血浆)转移到新的1.5ml/2ml离心管中,不能吸到管底白细胞,即得到分离后所需血浆;
4.血浆样本处理完后,分离得到的血浆及剩余血细胞均保存到-80℃冰箱中,避免反复冻融。
(二)血浆游离dna提取(采用qiaampcirculatingnucleicacidkit)
1.加30μl蛋白酶k至1.5ml离心管中;
2.加入300μl血浆;
3.加入240μlbufferacl和1.68μlcarrierrna(0.2μg/μl),涡旋振荡30s,60℃温浴30min,温浴期间适当取出振荡;
4.加入540μlbufferacb,涡旋振荡15-30s,冰上或-20℃冰箱放置5min;
5.取700μl血浆混合物加入过滤柱中,7500rpm离心30s;
6.过滤柱空甩8000rpm,1min;
7.加入600μlbufferacw1,8000rpm,1min离心洗涤;
8.加入700μlbufferacw2,8000rpm,1min离心洗涤;
9.加入700μl无水乙醇,8000rpm,1min离心洗涤;
10.过滤柱空甩14.000rpm,3min;
11.把过滤柱放入新收集管中,打开盖子,56℃金属浴10min;
12.将柱子放入新离心管汇总,加入60μlbufferave回溶3min;
13.14.000rpm离心1min,qubit(invitrogen,thequant-ittmdsdnahsassaykit)定量质控所提取的cfdna。
(三)组织dna提取(采用qiaamprdnaffpetissuekit)
1.将玻璃片上的石蜡用手术刀刮下置于1.5ml离心管中。
2.加1ml二甲苯(生物安全柜中),震荡混匀,室温放置10min,14600rpm,10min。
3.去上清,加无水乙醇1ml(生物安全柜中),震荡混匀14600rpm,5min。
4.弃上清,56℃烘干。
5.加atlbuffer180ul,proteinasek20ul,震荡混匀。
6.56℃,1h。
7.90℃,1h。
8.加入200ulalbuffer,200ul无水乙醇,震荡混匀。
9.过柱,8000rpm,1min,换套管。
10.加入500ulaw1,8000rpm,1min换套管。
11.加入500ulaw2,8000rpm,1min换套管。
12.用55ulh2o洗脱,56℃,5min,12000rpm离心2min。qubit(invitrogen,thequant-ittmdsdnahsassaykit)定量质控所提取的gdna。
(四)组织dna打断
1.根据qubit浓度取100ngdna,补加适量nf水至总体积40ul。
2.加入2根长度约1cm的打断棒。
3.根据原始dna的质控图(胶图或2100质控图)判定总的打断时间。
4.每4cycle,震荡混匀,轻甩离心(每个cycle为打30s停30s)。
5.打断后2100质控,dna主带应在250bp-300bp之间,质控合格的样本,磁珠纯化,取50ng建库。
(五)文库构建(采用kapaltplibrarypreparationkit)
1.末端修复体系如表5所示
表5:
反应后加入agencourtampurexpreagent120μl,磁珠纯化后,使用42μlddh2o回溶,带磁珠进行下一步反应;
2.末端加a体系如表6所示
表6:
反应后加入peg/naclsprisolution90μl,充分混合并进行磁珠纯化,使用(35-adapter)μlddh2o回溶,带磁珠进行下一步反应;
3.接头连接体系如表7所示
表7:
反应后,加入peg/naclsprisolution50μl,进行第一次磁珠纯化,使用50μltris-hcl(1mm,ph8.0)回溶;
再加入peg/naclsprisolution50μl,进行第二次磁珠纯化,使用25μltris-hcl(1mm,ph8.0)回溶;
4.第一轮pcr扩增体系如表8所示
表8:
反应后加入agencourtampurexpreagent90μl,磁珠纯化后,使用31μlddh2o回溶,取上清后质控并进行芯片杂交。
(六)目标区域捕获芯片杂交
1.本实施例中采用roche订购合成的淋巴瘤基因芯片lymper-1.88m,参照芯片制造商提供的说明书进行杂交捕获及洗脱。最后使用21μlddh2o回溶杂交洗脱磁珠。
2.第二轮pcr扩增体系如表9所示
表9:
反应后加入agencourtampurexpreagent108μl,磁珠纯化后,使用31μleb回溶,取上清后质控并上机测序。
(七)上机测序
本实施例中,采用illuminahiseq2500pe101+8+101程序进行上机测序,测序实验操作按照制造商提供的操作说明书(参见illumina/solexa官方公布cbot)进行上机测序操作。
(八)下机数据生物信息分析
以下流程均为常规分析流程。
1.soapnukefilter:去除n≥10%和碱基质量值≤5的碱基数目>50%的reads;
2.bwaaln->sampe|samtoolsview|samtoolssort:与reference序列比对,产生bam文件;
3.markduplicates.jar:标记潜在的pcr重复reads;
4.genomeanalysistk.jar-trealignertargetcreator、indelrealigner:将比对不好的reads重新比对;
5.genomeanalysistk.jar-tbaserecalibrator、printreads:校正质量值;
6.filt_bam:去掉mismatch≥3的reads;
7.qc:统计芯片的捕获效率、有效reads数、平均深度、重复率、覆盖度及未被覆盖的区间等信息;
8.callsnv/indel/sv/cnv:
用mutect、somvar流程callsomaticsnv变异;
用gatk、somvar流程callsomaticindel变异;
用contra.py流程callcnv;
用somvar流程callsv;
所使用的筛选参数为:深度≥10x,normal变异率≤2%,cancer变异率≥1%,变异reads数≥3,somaticp值≤0.05;
9.注释
注释变异的功能、reads支持数、变异频率、氨基酸变异及cosmic中的变异等;
注释21个质控点;
注释signature:根据变异情况判断疾病的来源。
(九)变异解读及药物疗效预测
根据经过严格生物信息分析后的变异结果,结合血液系统肿瘤辅助诊断、化疗药物、靶向药物相关基因数据库,对淋巴瘤患者的变异基因进行详细解读,分析各变异与各亚型淋巴瘤发病的相关性,分析临床化疗药物的用药可获益性、耐药性及毒副作用,分析各变异与预后判断或复发监测的相关性。给出淋巴瘤个体化基因检测报告,供临床检验结果辅助及为医生后续治疗提供基因参考。
样本1,年龄56岁,女,临床诊断为弥漫大b细胞淋巴瘤,既往有乙肝病史,送检样本类型为原发灶石蜡组织样本,送检医院为中南大学湘雅医院。样本2,年龄74岁,男,临床诊断为非霍奇金淋巴瘤iv期,送检类型为外周血样本,送检医院为西安交通大学第一附属医院。两个样本经目标区域捕获高通量测序得到的数据质量情况见表9。将样本1和样本2经生物信息分析得到的变异结果进行进一步的筛选及解读,首先筛选出所有淋巴瘤相关基因的snv、indel、cnv和sv突变数据,然后在mycancergenome(https://www.mycancergenome.org/)数据库、pharmgkb(https://www.pharmgkb.org/)数据库、mdanderson(https://pct.mdanderson.org/#/)数据库、cosmic(http://cancer.sanger.ac.uk/cancergenome/projects/cosmic/)数据库、以及相关研究文献中对筛选出来的突变位点进行搜索,明确突变位点是否为致病突变,或者是否为靶向药物用药相关突变。经详细解读,在样本1和样本2中分别发现2个和3个淋巴瘤致病突变,并且这些突变都是靶药相关突变,同时发现这些突变位点与靶向药物的疗效关系在现有研究文献报道过,可推荐靶向药物,检出位点信息及靶药详见表10。
表9:实施例样本目标区域高通量测序质量情况
表10:实施例样本检测变异结果
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。