对fmr1和fmr2基因5’非翻译区进行表征的pcr方法
【专利说明】对FMRI和FMR2基因5'非翻译区进行表征的PCR方法
[000。 本申请是基于申请日为2010年2月16日,优先权日为2009年3月24日,申请号 为201080032511. 1,发明名称为"对FMRl和FMR2基因5'非翻译区进行表征的PCR方法" 的专利申请的分案申请。
[0002] 相关申请的交叉引用
[000引本申请根据35U.S.C. § 119(e),要求2009年3月24日提交的美国临时申请 61/162,977 的权利。
[0004] 发明描述 发明领域
[0005] 本发明属于DNA合成与分析领域,特别是设及富含GC的模板和产物。
[0006] SM
[0007] 自从首次分离到DNA合成酶并确定了体外合成DNA的条件,DNA合成反应已被广 泛在生物技术、医药和研究应用中用于制备和分析目的。聚合酶链式反应,或PCR是可W快 速和指数性扩增DNA序列的一类DNA合成反应。与其他循环进行的合成反应一样,PCR设 及W循环的方式反复拷贝祀序列。典型的PCR实施过程包括提供与待扩增序列末端互补的 引物、合适的缓冲液、儀盐、脱氧核巧S憐酸(dNTPs)和嗜热DNA聚合酶。包含在例如基因 组DNA样品中的模板或祀DNA与运些成分在水溶液中接触。混合物在不同溫度进行循环, 运些溫度促进模板的变性、引物与模板的退火、然后聚合酶对引物的延伸,从而产生更多 产物。由于每个循环的产物可W在随后的反应中作为模板,产物的量几乎指数增长直至其 他反应成分(开始过量存在)被耗尽。参见例如美国专利4, 683, 202 ;M.J.Mc化erson&S. G.Moller,PCR=TheBasics^ndEd.,化71〇'&尸拘11。13)(2006)。
[0008] PCR与其他形式的循环进行的核酸合成反应对于分子生物学、生物技术、W及日渐 地对于医学都是标准工具。PCR和相关技术的关键优势是快速、低成本、敏感度、可用于高通 量分析W及多能性。扩增只需要几小时甚至更短时间、少数的个别反应可能只耗费1美元 W下的试剂、需要的模板量通常在纳克级别、自动化使得每个机器人每天可W进行几千个 反应,可W设计出用于扩增几乎任何序列的引物。
[0009] PCR及相关技术被广泛用于分析和制备应用。PCR的典型制备用途是用于扩增序 列使它可W克隆到异源载体中。PCR重要的分析应用包括设及具有大小多态性的基因座的 病情诊断或基因型确定。
[0010] 表现出医学相关的大小多态性的基因座一个例子是,位于人X染色体上的FMRl基 因的5'非翻译区扣TR)。正常个体的该区域内通常有5-44个CGG重复。相反,含有200到 2000或更多个CGG重复的基因座等位基因指示着脆性X染色体综合征(FX巧。运种等位基 因被称为全突变等位基因(化11Mutationalleles)。它们在遗传学上不稳定。患有FXS 的个体可能有诸如共济失调、卵巢早衰、学习障碍和其他认知/行为状况(包括类自闭症症 状)的症状的各种组合。
[0011] PCR多能性的一个令人遗憾的例外是难W扩增富含GC序列的长片段,包括 FMR15'UTR的全突变等位基因。对FMRIPCR进行的优化企图包括对常规PCR方法条件的 改进。参见GenomeRes. 6(7):633-8(1996);NucleicAcidsRes. 25(19):3957-8(1997); J.Mol.Diagn8:544-550(2006) Med.Genet. 51 (4) :527-34 (1994)。但是在FMRIPCR 方法发展了 15年多W后,即使最近的2008年(Genet.Med. 10(10) :714-9 (2008)),一篇发表 的关于检测新生儿中脆性X染色体的试验性筛选研究仍报道说"在确定女性中FMRl重复数 目的内部验证过程中使用的…两种定量链式聚合酶反应(PCR)分析方法未能产生可靠和 可重复的结果(粗体是后加的),此外"由初级或次级分离物进行的二次PCR的失败高度提 示FMR1CGG重复的异常大小"。因此,本领域技术人员仍然把可重复地PCR扩增全突变脆性 X染色体等位基因看作是有待解决的问题。
[0012] 在通过PCR检测含有超过100个重复的CGGS联重复区时观察到,随着重复数 目的增加,检测越来越弱(J.Mol.Dia即.7:605-12(2005))。运一困难,结合FXS综合征的 各不相同的特性,导致为了检测全突变等位基因使用诸如Southern印迹的程序(同上)。 Southern印迹通常比PCR更耗时,成本更高,没有PCR适合用于高通量应用。
[0013]Tassone等(J.Mol.Dia即.10:43-49(2008);"Tassone2008")最近发表的文 章描述了用于不经等位基因的全长扩增来检测较长CGG等位基因的分析法。还可参见 W02008/011170。该方法利用了与延展的CGG区内的位点杂交的嵌合PCR引物,运样如果存 在宽的PCR产物弥散带就表明延展等位基因阳性(同上46页)。
[0014] 随机杂交策略可能导致非特异性扩增和分辨力不足。运篇文章中使用的基础PCR 条件已被多个不同实验室进行了检验,似乎可W成功扩增的CGG重复数目是大约350CGG重 复。参见例如Salutoetal.,J.Mol.Dia即.7:605-612 (2005)。Tassone2008 中的非特异 扩增很明显。Tassone2008图1所示的琼脂糖凝胶中的弥散带似乎含有的产物超过了包 含350个重复的扩增子的预期最大长度,因此可能弥散带大部分不代表CGG重复的特异产 物(参见化ssone2008的图1 ;泳道5中的弥散带似乎延伸到上样孔内的空间)。Tassone 等在图3的图标中指出他们使用了Hi曲-LowIaddeHBionexus,Oakland,CA)作为分子量 标记,图1中的标记似乎与图3的相同。化曲-Lowladder中最大的条带大约lOkb,而图1 中的弥散带超过了该条带。运一长度也比分析中使用的样品的预期全长产物长。列出的最 大等位基因大小是615个CGG重复。因此,通过给1845nt重复加上大约200nt旁侧序列估 计出全长产物预期大约沈b。非特异性产物会降低基于扩增的脆性X染色体关联等位基因 状态的确定方法的准确性和可信度。
[0015] 此外,用于检测脆性X染色体的一些单纯基于基因特异性引物设计的常规PCR方 法有局限性。例如,运类方法根据PCR扩增子的迁移率提供对CGG重复数目的一个估计。为 了能够准确地确定重复数目,通常相对外部校准物(例如一组合适的分子量标准)来测量 扩增子迁移率。能够不依赖外部校准物的情况下准确确定CGG的数目将是可取的。
[0016] 而且,FMRl等位基因可能含有散布在CGG重复中的AGG序列,通常位于重复区段的 5'区域。对AGG序列元件的了解可W从一方面表征等位基因。AGG序列元件可W用于临床 决策。例如注意到某个仅含有59个重复的FMRl等位基因,从母亲到她的孩子中延展为全突 变等位基因的病例,并且已知该等位基因缺乏任何AGG元件。参见Nolinetal. ,Am.J.Hum. Genet. 72:454 - 464 (2003)。的确,全突变如果会,也是很少在第一批20个CGG重复之后含 有AGG元件,生物物理研究表明在CGG重复区段中带有AGG"中断者"的模板更可能采取更 常规的DNA结构,更稳定和易于被准确地复制。参见例如Weisman-Shomer et al., Nucleic Acids Res.28:1535-41 (2000);Zhong et al. , Am. J. Med. Genet.64:261-5(1996); Larsen et al., Am. J. Med. Genet.93:99-106(2000);和Dombrowski et al., Hum. Mol. Genet.11:371-78(2002)。因此,需要对FMRl基因中诸如AGG元件的中断元件进行作图的 技术。所W中断元件作图具有与脆性X染色体综合征,W及其他重复相关疾病有关的研究 和诊断应用。
[0017] 现有的AGG元件作图方法包括测序和限制性酶切图谱。DNA测序技术比较繁重,特 别是因为该技术通常需要对目标序列进行富集或分离(无论是体外或通过电脑模拟),在 脆性X染色体诊断测试中不是常规进行的。基于限制性酶切图谱的方法使用MnlI酶(酶识 别GAGG序列,在所述序列5'方向7个碱基对处切割)来根据包含FMR15'UTR中CGG重复 区的PCR产物被消化得到的片段大小来推测AGG的位置。参见例如Eichleretal.,化t. Genet. 8:88-94(1994);ZhongetHum.Genet. 57:351-361 (1995)。Eichler等 的方法包括重复区的PCR扩增、产物纯化、过夜酶切消化、电泳7小时W及Southern印迹。 在Zhong等的方法中,"将PCR产物用酪/氯仿提取一次,乙醇沉淀并在10升中用5单位 MnlI于 37°C部分消化 50-70 分钟(thePCRproductwasextractedoncewithphenol/ chloroform,ethanolprecipit曰ted,曰ndpartiallydigestedinIOliterswithSunits at化r50-70min.)"(同上353页)。之后进行电泳和Southern印迹。运两种方法除了 PCR和电泳还设及多个步骤,包括纯化/清理、限制酶切和Southern印迹。
[001引本文提供了方法对FMRl和FMR2基因的5'UTR中CGG重复进行定量,W及中断序 列的序列成分进行鉴定、定量和掲示。本发明潜在的应用包括给脆性X染色体测试的临床 应用。
[0019] 一些实施方案中,发明设及分析样品中至少一种模板所包含的至少一种CGG富含 区的方法,所述方法包括:
[0020] (a)提供至少两个不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一 引物讯与CGG富含区之外的位点退火的第二引物;
[0021] 化)用所述至少两个不同引物和包含至少一种CGG富含区的至少一种模板进行 PCR,其中所述PCR产生一组产物;
[0022] (C)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式 (representation);从及
[0023] (d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所 述至少一种CGG富含区中处于何处的信息。
[0024] -些实施方案中,发明设及分析样品中至少一种模板所包含的至少一种CGG富含 区的方法,所述方法包括:
[00巧](a)提供至少S种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5'侧 翼(flap)的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5'侧 翼所包含的序列的第=引物,其中第一引物提供的浓度低于第=引物;
[0026] 化)用所述至少S种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一 组产物;
[0027] (C)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;W及
[0028] (d)由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或 者中断序列在所述至少一种CGG富含区中处于何处的信息。
[0029] 一些实施方案中,发明设及分析样品中至少一种模板所包含的至少一种CGG富含 区的方法,所述方法包括:
[0030] (a)提供两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复; 第二引物与CGG富含区之外的位点退火;
[0031] 化)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产 生一组产物;
[0032] (C)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;W及
[0033] (d)由所述表现形式得出关于CGG重复数目的信息。
[0034] 一些实施方案中,发明设及分析样品中至少一种模板所包含的至少一种CGG富含 区的方法,所述方法包括:
[003引 (a)提供S种不同引物,其中第一引物含有〔66、0^、6〔6、〔6(:、00:或660重复和 5'侧翼;第二引物与CGG富含区之外的位点退火;第S引物具有第一引物的5'侧翼所包含 的序列;
[0036] 化)用所述S种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一 组产物;
[0037] (C)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;W及
[0038] (d)由所述表现形式得出关于CGG重复数目的信息。
[0039] 一些实施方案中,发明设及包含选自SEQIDNO:44和SEQIDNO:45的序列的寡 核巧酸。
[0040] 应当理解,如权利要求,W上概述和下面的详述仅用于示范和解释,不是对发明的 限制。
[00川发明详述
[0042] 发明设及扩增CGG重复区全部或部分的扩增反应。一些实施方案中,CGG重复区 包含在FMRl的5'UTR或FMR2的5'UTR中。
[0043] 发明设及运样的扩增反应,所述反应使用与CGG重复区W外退火的引物,和与CGG 重复序列、序列的序列置换或反向互补佑〔6、〇^、〔6(:、6〇:或660退火的引物。与〔66重 复区W外(上游或下游)退火的引物可W是正向或反向引物。引物可W与CGG重复区旁侧 的序列退火。运类正向引物的例子包括CGGTGGAGGGCCGCCTCTGAGC(沈QIDNO: 1)、 CAGGCGCTCAGCTCCGTTTCGGTTT(沈QIDNO:2)、CAGTCAGGCGCTCAGCTCCGTTTC G(沈QIDNO:3)、TCCGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:4)、GGTTCGGCCTCAGTC AGGCGCTCAGCTCCGTTTCG(SEQIDNO:5)、GGGTTCGGCCTCAGTCAGGCGCTCAGCTCC GTTTCG(SEQIDNO:6)、GCGGGCCGGGGGTTCGGCCTCAGTCA(SEQIDNO:7)、CAGCGG GCCGGGGGTTCGGCCTCAG(沈QIDNO:8)、GCAGCGGGCCGGGGGTTCGGCCTCA(SEQID NO:9)、GGGCCGGGGGTTCGGCCTCAGTCAG(沈QIDNO:10)、GGGGTTCGGCCTCAGTCA GGCGCTCA(SEQIDNO:11)、GGGGTTCGGCCTCAGTCAGGCGCTCAG(沈QIDNO:12)、GGC GCTCAGCTCCGTTTCGGTTTCACTTCC(沈QIDNO: 13)、TCAGGCGCTCAGCTCCGTTTC GGTTTCA(沈QIDNO: 14)、CACTTCCGGTGGAGGGCCGCCTCTGA(SEQIDNO:巧)、TTC CGGTGGAGGGCCGCCTCTGAGC(沈QIDNO:16)和TCAGGCGCTCAGCTCCGTTTCGGT TTCACGGCGGCGGCGGCGGA(SEQIDNO:44)。运类反向引物的例子包括CGCACTTCCACC ACCAGCTCCTCCA(SEQIDNO:17)、GGAGCCCGCCCCCGAGAGGTG(沈QIDNO:18)、GGG AGCCCGCCCCCGAGAGGT(沈QIDNO: 19)、CGCACTTCCACCACCAGCTCCTCCAT(SEQ IDNO:20)、CGGGAGCCCGCCCCCGAGAGGTG(沈QIDNO:21)、CCGGGAGCCCGCCCCCGA GAGGT(沈QIDNO:22)、CCGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:23)、CGCCGGGAG CCCGCCCCCGAGAGGTG(沈QIDNO:24)、GCGCCGGGAGCCCGCCCCCGAGAGGT(沈QID NO:25)、CGCCGGGAGCCCGCCCCCGAGAGGT(沈QIDNO:26)、GCGCCATTGGAGCCCCGC ACTTCCACCA(SEQIDNO: 27)、GCGCCATTGGAGCCCCGCACTTCCA(SEQIDNO: 28)、 AGCGCCATTGGAGCCCCGCACTTCC(沈QIDNO:29)、CGCCATTGGAGCCCCGCACTTCCA C(沈QIDNO:30)、TTGGAGCCCCGCACTTCCACCACCA(沈QIDNO:31)、AGCCCCGCACTT CCACCACCAGCTCCT"SEQIDNO:3。、GAGCCCCGCACTTCCACCACCAGCTCCT(SEQID N0:33)、CATTGGAGCCCCGCACTTCCACCACCAG(SEQIDNO:34)、CCCGCACTTCCACCA CCAGCTCCTCCATCT(沈QIDNO:35)、TAGAAAGCGCCATTGGAGCCCCGCACTTCC(沈Q IDNO:36)、AAGCGCCATTGGAGCCCCGCACTTCC(沈QIDNO:37)、AAGCGCCATTGGAGC CCCGCACTTCCCCGCCGCCGCCGCCG(SEQIDNO:43)和AAGCGCCATTGGAGCCCCGCA CTTCCCCGCCGCCGCCGCCT(沈QIDNO:4巧。
[0044] 发明进一步设及方法及其用途,包括提供引物TCAGGCGCTCAGCTCCGTTTCGGTTTCAC TTCCGGT(沈QIDN0:38)、AGCGTCTACTGTCTCGGCACTTGCCCGCCGCCGCCG(SEQIDN0:39)、TCA GGCGCTCAGCTCCGTTTCGGTTTCA(SEQIDN0:40)和TCAGGCGCTCAGCTCCGTTTCGGTTTCA CGGCGGCGGCGGCGG(SEQIDN0:41)。发明还设及包含沈QIDNOs1-38 或 40 之一并在 3' 端附加CGG重复或其置换和反转序列的引物。发明进一步设及包括提供引物的方法及其用 途,所述引物含有多个序列CGG的=核巧酸重复或其置换和反转序列。在一些实施方案中, 引物中的CGG重复数量是四个或五个。在一些实施方案中,引物含有12-15个核巧酸的S 核巧酸重复序列。在一些实施方案中,引物含有从3个到10个的多个重复。引物可能含有 3、4、5、6、7、8、9或10个重复,和任选的1或2个0和/或0残基的其他部分重复。还可^ 提供其他引物来保证例如多态位点的结合,或者用于扩增大小已知区域作为内部标准。
[0045] 在一些实施方案中,与CGG重复序列退火的引物对包含中断元件的CGG富含区内 的位点优先结合。与CGG重复序列退火的引物优先结合至少一种包含中断元件的位点,通 过例如在PCR反应中使用该引物和如上所述与CGG富含区之外结合的反向第二引物,会导 致选择性扩增包含所述中断元件的至少一种产物。优先结合活性可W是对包含CGG和AGG 元件的位点,或者它们的置换和/或反转序列特异的,比如包含(1) 一个AGG元件或者包含 A的部分AGG元件,W及(2)=、四、五、或六个CGG元件和任选的部分CGG元件的位点。
[0046] 优先结合的程度,表达为使用所述引物和结合到CGG富含区之外的反向第二引物 进行的扩增反应中被选择性扩增的产物与背景产物的比率,可W是至少3倍、4倍、5倍或6 倍;或者可W在3-12倍、3-10倍、3-8倍、4-12倍、4-10倍、4-8倍、3-7倍、4-7倍、3-6倍或 4-6倍的范围内。所述至少一种被选择性扩增的产物通常其长度对应沿着模板从与包含中 断元件的位点优先结合时第一引物的5'端到与CGG富含区之外位点结合时第二引物的5' 端之间的距离。
[0047] -些实施方案中,与CGG重复序列退火并优先结合包含中断元件的CGG富含区内 的位点的引物可能在与CGG重复序列退火的引物部分的内部或者末端含有A、T或U残基, 或者换句话说,在CGG、CCG、GCG、CGC、GCC或GGC重复之中或者末端含有A、T或U残基;参 见例如W上SEQIDNOs44和45。A、T或U残基可W发生在引物的3'端。当A、T或U残 基发生在CGG、CCG、GCG、CGC或GCC、GGC重复的末端时,A、T或U残基与最后一个完整CGG、 CCG、GCG、CGC、GCC或GGC重复之间可能有也可能没有部分CGG、CCG、GCG、CGC、GCC或GGC 重复。如下文更详细的描述,可W用非天然核巧酸残基代替A、T或U残基,所述非天然核巧 酸残基比其他天然核巧酸残基更优先与T/U或A残基配对。类似地,也可能用一或多个比其 他天然核巧酸残基更优先与C或G残基配对的非天然核巧酸残基代替构成CGG、CCG、GCG、 CGC、GCC或GGC重复的一或多个G和/或C。在本来是由CGG、CCG、GCG、CGC、GCC或GGC重 复(任选含有A、T、U或如上讨论的相应的非天然残基)构成的序列中存在一或多个运种非 天然残基不影响所述序列在本发明公开中被认为是CGG、CCG、GCG、CGC、GCC或GGC重复序 列。
[0048] 在非错定分析法中,提供的第一引物对不包含中断元件的CGG富含区有优先结合 活性。在非错定方法结果中,较低水平的产物表明存在着中断元件,因为运些产物的合成设 及第一引物结合到包含中断元件的位点上并延伸。低水平的产物在电泳图中显示为缺口或 者被较高峰包围的低峰。
[0049] 在错定分析法中,提供的第一引物对包含中断元件的CGG富含区有优先结合活 性。应当注意,可W给运样的反应提供对包含中断元件的CGG富含区内的位点有优先结合 活性的引物,所述反应其中的至少一种模板包含至少一种含有〇、1或复数个中断元件的 CGG富含区;引物"对包含中断元件的CGG富含区有优先结合活性"的说法并不表示例如CGG 富含区一定包含复数个中断元件。错定分析法中,较高水平的产物表明存在着中断元件,因 为运些产物的合成设及第一引物与包含中断元件的位点结合并延伸。高水平产物可能在电 泳图中显示为被低峰