专利名称:一种基因拷贝数变异的检测方法
技术领域:
本发明涉及基因拷贝数变异检测领域,尤其涉及一种利用相似序列结合高分辨熔解曲线分析进行基因拷贝数变异检测的方法。
背景技术:
拷贝数变异(Copy Number Variations, CNVs)最初是70年前在果蝇Bar基因研究中发现的,后来被认为是动植物基因组中普遍存在的现象,它是指基因组DNA中较大片段的缺失或重复现象。有些拷贝数变异属于多态性范畴,并不对动植物的表型造成影响,而有些拷贝数变异则通过扰乱基因序列和改变基因含量来影响基因表达,从而造成表型差异和表型适应,也会引起疾病。保守估计至少10%的人类基因组序列存在拷贝数变异的现象。 当功能基因区域如SMN基因、HER2基因等发生拷贝数变异时,可能导致基因产物数量的异常,从而导致非正常表型的出现,引起相关的疾病如脊髓性肌萎缩(SMA)、乳腺癌等。染色体非整倍体(Aneuploidy)也是一种典型的拷贝数变异现象,体细胞内缺失或增加的染色体往往导致危害程度不同的病征,如特纳综合征05,X)、克氏综合征07,XXY)、唐氏综合征07,+21)等。这类遗传病不仅患病率极高,并且后天几乎无法根治。因此,针对此类遗传疾病,人群筛查与产前诊断显得尤为重要。目前应用于拷贝数变异检测的技术主要有1.比较基因组杂交(CGH)该技术发展至今,已与芯片技术(Microarray)结合后衍生为芯片比较基因组杂交技术(Array-CGH)。该技术可以在全部染色体或染色体亚带水平上,对不同基因组之间DNA序列的拷贝数进行检测,从而发现拷贝数变异。然而该技术分辨率在Mb水平,更小片段的拷贝数片段则不易检出。同时该技术操作繁琐,通量低、耗时长且成本昂贵,需要较为大量的模板DNA,不利于大范围的推广。2. MLPA 全称为多重连接探针扩增技术,是2002年发展起来的一种拷贝数检测方法。目前已有相应的试剂盒检测如SMA、唐氏综合征等疾病。该技术具有较准确的相对定量功能。但是该方法探针制备较为复杂,同时操作步骤繁琐,耗时长。并且采用毛细管电泳作为分析手段,通量较低、成本较高且属于开放式操作,易于造成PCR产物的污染。高分辨熔解曲线分析(High Resolution Melting, HRM)于2003年发明,是一项近年来备受关注的技术,其通过精确的变温速率控制以及DNA饱和染料的指示,实现了通过研究PCR产物序列的熔解温度而对PCR产物进行鉴定。由于该技术具有快速、廉价、高通量等优点,已被广泛应用于单核苷酸多态性(SNPs)、基因突变(Mutation)和表观遗传学 (Epigenetic)等研究。目前,已有将HRM应用于基因拷贝数变异研究的报道,但均是通过检测待测序列内部的SNP位点来实现的。其原理是待测基因在某个SNP位点上是杂合子, 当发生拷贝数变异时,该SNP位点的杂合比例发生了变化,从而在HRM分析中体现出差别。 采用该原理具有以下一些不足之处首先,该方法实现的前提是SNP位点必须是杂合的,否则HRM无法区别两个等位基因序列。这就使得单个SNP位点仅能用于一部分待测群体,而要囊括所有待测群体则必须采用多个SNP位点联合检测,这不仅增加了实验的成本和设计的难度,而且降低了检测的通量。并且,单个核苷酸的差异对于熔解曲线的影响较小,甚至于有些差异几乎不影响熔解曲线的偏移。这是造成检测灵敏度较低的主要因素。
发明内容
本发明的目的在于提供一种基因拷贝数变异的检测方法。该方法是利用相似序列结合HRM分析进行基因拷贝数变异的检测。为达到上述目的,本发明采用如下技术方案1)根据待测基因序列在全基因组范围内筛选相似但不相同的内源性相似序列 (内标法)或者根据待测基因序列人工合成相应的外源性相似序列(外标法)。2)将待测基因序列与相似序列进行比对,设计共同的扩增引物。如有需要,还可设计相应的非标记探针。3)采用共同的引物进行PCR,在一个反应管内同时扩增待测基因序列与相似序列。4) HRM 分析 PCR 产物。所述相似序列与待测基因序列可以是同源关系,也可以是非同源关系。所述相似序列可与待测基因序列位于同一染色体上,也可位于不同染色体上。所述相似序列包括经表观遗传学研究方法如重亚硫酸盐转化(bisulfite conversion)后形成的相似序列。所述共同的扩增引物可以是一对扩增引物,也可以是多对扩增引物多位点验证。所述共同的扩增引物与模板可以是完全匹配,也可以是不完全匹配。所述HRM分析采用DNA饱和性染料,包括但不局限于EvaGreen染料、LC Green PLUS染料、ResoLight染料、SYTO 9染料等。所述HRM分析数据处理方式包括但不局限于归一化处理、温度平移、差异作图等。所述方法不仅可应用于基因拷贝数变异检测,包括但不局限于SMN基因、HER2基因等的检测;同样适用于染色体非整倍体检测,包括但不局限于特纳综合征、克氏综合征、 唐氏综合征等的检测。所述方法具有极高的检测灵敏度,不仅可应于常规的人群筛查与产前诊断样本, 同样适用于嵌合体检测以及母体外周血中胎儿游离DNA(cell-free fetal DNA)或RNA样本的检测,因此本发明可应用于无创产前诊断(noninvasive prenatal diagnosis)。该方法的主要原理如图1所示。基因组中,存在着许多相似的序列(similar sequence),这些序列可能出自同源基因(paralogue),如ZFX基因与ZFY基因,Dscam基因与DsCam3基因等,也可能出自非同源基因。当基因组中没有目的基因的相似序列时,还可以人工合成一段相应的外源性相似序列。采用基因组中的内源性相似序列称为内标法,采用人工合成的外源性相似序列成为外标法。待测基因序列与相似序列的核苷酸组成大部分相同,中间穿插着一些不同,如同多个天然的SNP杂合位点。在HRM的变温杂交过程中,待测序列与相似序列将相互作用形成特定的熔解曲线。当待测基因发生拷贝数变异时,待测序列与相似序列的比例将发生变化,形成的熔解曲线可明显区别于野生型待测基因。由于待测基因序列与相似序列之间的区别要远大于SNP的区别,因此理论上采用相似序列进行 HRM分析将具有比SNP分析更高的灵敏度和特异性。并且,由于相似序列的差异是固定的,不同于SNP位点有纯合杂合的区别,因此可以应用于所有待测群体。由于染色体非整倍体造成了整条染色体上的相关基因的拷贝数变异,因此本发明也可通过检测该染色体上的基因达到检测染色体非整倍体的目的。同时,CNV不仅存在于人类基因组中,在其他动植物基因组中也存在,例如最近有关于玉米 CNV 的报道(Allelic genome structural variations in maize detected by array comparative genome hybridization. Theor Appl Genet. 2010 Jan ; 120 (2) 355-67),因此,本发明还可用于其他动植物基因组中CNV的检测。与现有试剂盒及相关技术相比,本发明具有以下突出优点1)设计简单、结果准确;2)无需受SNP位点是否杂合的限制,可应用于所有待测群体;3)待测序列与相似序列的区别大于SNP的区别,因此对于HRM的影响更大,有效提高检测的灵敏度和特异性;4)由于其高灵敏度与高特异性,可适用于微量标本的检测。如干血斑标本、羊水细胞、绒毛细胞样本、母体外周血中的胎儿游离核酸样本、植物花粉样本。5)封闭式操作,避免了 PCR产物的污染;6)操作简便、快速(Ih)、廉价、高通量;
图1相似序列结合HRM检测基因拷贝数变异原理图。㈧以21号染色体上目标序列检测为例,在6号染色体上选取相应的内源性相似序列(内标法)。如无内源性相似序列,也可人工合成一段与目标序列相似的外源性序列(外标法)。(B)以内标法为例,目标序列与相似序列内部含有7个核苷酸的差异,用双向箭头示出。大写字母表示引物结合位置。(C)经过同一对引物的PCR扩增以及HRM分析,通过数据处理即可将21三体与正常对照区分开来。图2采用内标法进行21,18,13三体的检测。熔解曲线中虚线代表三体标本,实线代表正常对照。统计学分析中,方框的上下边界指示25%与75%置信区间,方框内的点代表平均值,方框内的横线代表中值,误差棒指示5%与95%置信区间。图3采用内标法进行性染色体非整倍体的检测。熔解曲线中虚线代表非整倍体标本,实线代表正常对照。统计学分析中,方框的上下边界指示25 %与75 %置信区间,方框内的点代表平均值,方框内的横线代表中值,误差棒指示5%与95%置信区间。图4正常基因组DNA背景下21三体DNA的检测。(A)不同比例21三体DNA熔解曲线图。每条熔解曲线均由10个样本求平均值所得。(B)统计学分析。方框的上下边界指示25%与75%置信区间,方框内的点代表平均值,方框内的横线代表中值,误差棒指示最大值与最小值。
具体实施例方式以下实施例结合附图对本发明作进一步的说明,所给出的是本发明的一些具体实施例,这些实施例只是说明而不表示本发明所有的可能性,本发明并不局限于这些实施例中提到的材料、反应条件或参数,任何在相关领域具备经验的人,都可以按照本发明的原理,利用其它类似材料或反应条件实现本发明所描述的基因拷贝数变异检测。这些并不脱离本发明描述的基本概念。实施例1内标法检测人类常染色体拷贝数变异21,18,13三体是人类最常见的三种常染色体非整倍体。21三体又称唐氏综合征, 活婴中发生率约1/700。唐氏综合征包含一系列的遗传病,会导致包括学习障碍、智能障碍和残疾等高度畸形。该病无法经过后天治愈,因此对于唐氏综合征的产前诊断尤为重要。18 三体和13三体的发病率约为1/5000和1/25000,患病胎儿具有严重的畸形与生理缺陷,因此对于二者的产前诊断同样十分重要。一、材料1、仪器实时荧光PCR仪、移液器、离心机。2、引物设计本发明针对21号染色体上的目标序列在7号染色体上选择了一段相似序列;针对 18号染色体上的目标序列在9号染色体上选择了一段相似序列;针对13号染色体上的目标序列在17号染色体上选择了一段相似序列。一共设计了 3对引物分别对三条染色体的异常情况进行检测,引物序列如下T21-F :SEQIDNO:1
T21-R :SEQIDNO:2
T18-F :SEQIDNO:3
T18-R :SEQIDNO:4
T13-F :SEQIDNO:5
T13-R :SEQIDNO:6
3、试剂2 χ LightCycler 480 high resolution melting master(Roche) ;Mg2+。二、方法1、样本的选择21三体DNA样本47例,18三体DNA样本10例,13三体DNA样本3例,正常对照 DNA样本48例。上述样本均经过染色体核型分析验证。2、PCR 扩增与 HRMPCR 反应体系包括 1 χ LightCycler 480 high resolution melting master, 2. 5mmol/LMg2+, 200nmol/L 上下游引物,IOOng 基因组 DNA。PCR与HRM反应在Roche LightCycler 480 II仪器上进行,按以下条件进行扩增检测第一阶段95°CIOmin ;第二阶段:95V15sec,60°C 15sec,72°C 15sec,35 个循环;第三阶段95°C10sec,40°C 10sec,60°C至 95°C每秒采集荧光 20 次,50°C IOsec03、结果分析依次进行归一化处理、温度平移和差异作图。最后以野生型样本作为基准进行分析。
6
从图2可以看出21,18,13三体患者DNA样本与正常对照DNA样本能够明显区分。 21三体与18三体检测的临床灵敏度与特异性均为100%。13三体检测的临床灵敏度为 100%,临床特异性为97.9%。实施例2内标法检测人类性染色体拷贝数变异除21三体外,出生后可存活的染色体非整倍体多数为性染色体非整倍体,如45,X 和47,XXY等。性染色体非整倍体发生率较高,如女性中发生45,X的比例为1/2000左右, 而男性中发生47,XXY的比例为1/1000左右。性染色体非整倍体对患者的表型发育具有一定的影响,尤其在生殖系统方面。虽然性染色体非整倍体无法治愈,但是早期发现性染色体非整倍体后在发育期间辅以激素治疗,可以有效减轻病征,因此,性染色体的早期与快速诊断显得尤为重要。一、材料1、仪器实时荧光PCR仪、移液器、离心机。2、引物设计本发明针对X染色体上的两个目标序列在3号染色体和Y染色体上分别选择了一段相似序列,这样即可分析X染色体与常染色体的数目比例,也可分析X染色体与Y染色体的数目比例。一共设计了 2对引物进行检测,引物序列如下X3-F :SEQ ID NO 7X3-R :SEQ ID NO 8XY-F :SEQ ID NO 9XY-R SEQ ID NO 103、试剂2 χ LightCycler 480 high resolution melting master(Roche) ;Mg2+。二、方法1、样本的选择特纳综合征05,X)DNA样本8例,克氏综合征07,XXY) DNA样本14例,正常男性 DNA样本M例,正常女性DNA样本M例。上述样本均经过染色体核型分析验证。2、PCR 扩增与 HRMPCR 反应体系包括 1 χ LightCycler 480 high resolution melting master, 2. 5mmol/LMg2+, 200nmol/L 上下游引物,IOOng 基因组 DNA。PCR与HRM反应在Roche LightCycler 480 II仪器上进行,按以下条件进行扩增检测第一阶段95°CIOmin ;第二阶段:95V15sec,60°C 15sec,72°C 15sec,35 个循环;第三阶段95°C10sec,40°C 10sec,60°C至 95°C每秒采集荧光 20 次,50°C IOsec03、结果分析依次进行归一化处理、温度平移和差异作图。以野生型样本作为基准进行分析,最后根据表一进行结果判断。从图3可以看出特纳综合征与克氏综合征患者DNA样本与正常对照DNA样本能够明显区分。两个检测的临床灵敏度与特异性均为100%,
权利要求
1.一种基因拷贝数变异的检测方法,其特征在于所述方法包括以下步骤1)根据待测基因序列在全基因组范围内筛选相似但不相同的内源性相似序列或者人工合成相应的外源性相似序列;2)将待测基因序列与相似序列进行比对,设计共同的扩增引物;如有需要,还可设计相应的非标记探针;3)采用共同的引物进行PCR,在一个反应管内同时扩增待测基因序列与相似序列;4)高分辨熔解曲线分析PCR产物。
2.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述相似序列与待测基因序列为同源关系,或是非同源关系。
3.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述相似序列与待测基因序列位于同一染色体上,或位于不同染色体上。
4.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述相似序列包括经亚硫酸盐转化后形成的相似序列。
5.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述共同的扩增引物为一对扩增引物,或是多对扩增引物多位点验证。
6.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述共同的扩增引物与模板完全匹配,或是不完全匹配。
7.根据权利要求1所述的一种基因拷贝数变异检测的方法,其特征在于所述高分辨熔解曲线分析采用DNA饱和性染料。
8.根据权利要求1所述的一种基因拷贝数变异检测的,其特征在于所述的DNA饱和性染料包括EvaGreen染料、LC Green PLUS染料、ResoLight染料或SYTO 9染料。
9.根据权利要求1所述的一种基因拷贝数变异的检测方法,其特征在于所述高分辨熔解曲线分析数据处理方式包括归一化处理、温度平移和差异作图。
全文摘要
本发明涉及基因检测领域,尤其涉及一种基因拷贝数变异的检测方法。该方法通过挑选与待测基因序列相似但不相同的内源性或外源性相似序列,设计相应的引物对待测基因序列与相似序列同时进行扩增,随后进行高分辨熔解曲线分析。当待测基因发生拷贝数变异时,其高分辨熔解曲线分析结果将与野生型待测基因分析结果明显区分,从而达到检测的目的。本发明所述方法不仅可应用于基因拷贝数变异检测,同样适用于染色体非整倍体检测。本发明所述方法不仅适用于基因拷贝数变异和染色体非整倍体的人群筛查与常规产前诊断,同样适用于无创产前诊断。本发明所述方法具有快速、准确、高灵敏度、高特异性、高通量、低成本、无污染等优点。
文档编号C12Q1/68GK102409088SQ201110284638
公开日2012年4月11日 申请日期2011年9月22日 优先权日2011年9月22日
发明者周裕林, 左正宏, 郭奇伟 申请人:郭奇伟