单链多核苷酸扩增方法
【专利说明】单链多核苷酸扩増方法
[0001]相关申请的交叉引用
[0002]本申请要求于2012年12月3日提交的美国临时专利申请N0.61/732,826的优先权权益,其通过引用以其整体并入。
技术领域
[0003]本申请一般性地涉及核酸样品制备和测序领域。
【背景技术】
[0004]核酸序列分析工具是鉴定基因改变的基础,其进而可用于诊断遗传疾病、预测对药物治疗的响应性以及分析药物的药物基因组学。由于序列分析经常涉及在有限量的样品中确定稀有的遗传改变,因此灵敏度是一个大的挑战。在分析组织样品(如癌症样品)中的体细胞突变时尤其如此,所述组织样品经常包含与具有突变之细胞混合的正常细胞。
[0005]为了增加灵敏度,使用了多种核酸扩增方法。最常用的扩增方法是聚合酶链式反应(“PCR”),其涉及使用Taq聚合酶来进行多个循环的扩增。因为Taq聚合酶固有的保真性(fidelity)问题,所以PCR方法经常产生可掩盖待分析之真正突变的人工突变,使得极难检测样品中的稀有突变。因此,可能降低核酸方法的精确度。
[0006]人基因组DNA很复杂并且具有很多重复序列。这为序列分析带来了另外的挑战。首先,目的多核苷酸在多核苷酸混合物中的代表性可能显著不足。其次,分析复杂DNA样品的成本可能极其昂贵,特别是在分析基因组DNA和检测多个遗传突变的情况下。虽然已开发了多种下一代测序方法,但是仍然需要灵敏、精确且有效的核酸样品制备和测序分析方法。
[0007]本文引用的所有参考文献(包括专利申请和出版物)均通过引用以其整体并入。
【发明内容】
[0008]在一个方面中,本申请提供了由靶多核苷酸产生单链多核苷酸群的方法。所述方法的第一步包括在复合体中延伸RNA引物,所述复合体包含RNA引物和含有与所述靶多核苷酸互补之序列的DNA模板,其中所述RNA引物与所述DNA模板杂交。所述方法的第二步包括用从RNA/DNA杂合体切割RNA的酶切割RNA引物,以使得另一 RNA引物与所述DNA模板杂交并通过链置换来重复引物延伸。所述方法产生了单链多核苷酸群。
[0009]本申请还提供了分析靶多核苷酸的方法。所述方法的第一步包括在复合体中延伸RNA引物,所述复合体包含RNA引物和含有与所述靶多核苷酸互补之序列的DNA模板,其中所述RNA引物与所述DNA模板杂交。所述方法的第二步包括用从RNA/DNA杂合体切割RNA的酶切割所述RNA引物,以使得另一 RNA引物与DNA模板杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸群。在第三步中包括分析所述单链多核苷酸。
[0010]在上述方法中,所述复合体还可包含与所述DNA模板上的区域杂交的终止多核苷酸序列,所述区域在所述RNA引物所杂交之区域的5’。上述方法中使用的DNA模板可由RNA多核苷酸序列产生。任选地,如下产生所述方法中使用的DNA模板:在复合体中延伸RNA引物,所述复合体包含DNA分子和RNA引物,其中所述RNA引物与所述DNA分子杂交;以及用从RNA/DNA杂合体切割RNA的酶切割RNA引物,以使得另一 RNA引物与DNA模板杂交并通过链置换来重复引物延伸,从而产生DNA模板。
[0011]在一个相关方面中,本申请提供了通过孵育反应混合物由靶多核苷酸序列产生单链多核苷酸群的方法。所述方法中的反应混合物包含含有与所述靶多核苷酸互补之序列的DNA模板、可与所述DNA模板杂交的RNA引物、DNA聚合酶和从RNA/DNA杂合体切割RNA的酶。所述方法的孵育步骤在这样的条件下进行,所述条件允许引物杂交、引物延伸、RNA切割和在从引物延伸产物切割RNA时从模板置换引物延伸产物从而使另一 RNA引物杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸的多个拷贝。
[0012]本申请还提供了通过产生单链多核苷酸群来分析靶多核苷酸的方法。在第一步中,通过孵育反应混合物来产生单链多核苷酸群,所述反应混合物包含含有与所述靶多核苷酸互补之序列的DNA模板、可与所述DNA模板杂交的RNA引物、DNA聚合酶和从RNA/DNA杂合体切割RNA的酶。在该方法中,孵育在这样的条件下进行,所述条件允许引物杂交、弓丨物延伸、RNA切割和在从引物延伸产物切割RNA时从模板置换引物延伸产物从而使另一 RNA引物杂交并通过链置换来重复引物延伸,从而产生单链多核苷酸的多个拷贝。在第二步中,分析所述单链多核苷酸群。
[0013]在上述任意方法中,RNA引物可为约6至约20个核苷酸长。任选地,RNA引物可包含polyA序列。任选地,RNA引物可包含随机引物序列。上述任意方法中所使用的DNA模板可任选地包含接头(adaptor)序列,并且RNA引物可任选地包含与所述接头序列杂交的序列。本文所提供的任意方法的延伸步骤可通过选自以下的DNA聚合酶进行:链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7 DNA聚合酶和大肠杆菌(E.coli)DNA聚合酶I。所述方法中从RNA/DNA杂合体切割RNA的酶可以是RNA酶H (RNase H)。所述方法中使用的DNA模板可任选地为基因组DNA。
[0014]在一个相关方面中,本申请提供了用于单链多核苷酸扩增的试剂盒。所述试剂盒包含RNA引物、DNA聚合酶和从RNA/DNA杂合体切割RNA的酶。试剂盒中从RNA/DNA杂合体切割RNA的酶可以是RNase H。试剂盒中的DNA聚合酶可选自链置换DNA聚合酶、高保真DNA聚合酶、具有校正活性的聚合酶、T7 DNA聚合酶和大肠杆菌DNA聚合酶I。试剂盒中的RNA引物可为约6至约20个核苷酸长。任选地,RNA引物可包含polyA序列。任选地,RNA引物包含随机引物序列。
【附图说明】
[0015]图1描绘了单链多核苷酸扩增的一种示例性方法。
[0016]图2描绘了单链多核苷酸扩增的另一种示例性方法。
[0017]发明详述
[0018]本申请提供了使用RNA引物进行单链多核苷酸扩增的方法。该扩增方法使用与DNA模板杂交的RNA引物。使用聚合酶来实现沿DNA模板的RNA引物的延伸。然后,使用从RNA/DNA杂合体切割RNA的酶(例如RNase H)从DNA模板切割RNA引物,在模板链上留下引物杂交序列,所述引物杂交序列可用于结合另一 RNA引物并允许起始另一扩增循环。由聚合酶产生另一条链,其置换之前复制的链,产生经置换的延伸产物。RNA引物的重复延伸导致产生了单链多核苷酸的多个拷贝。
[0019]因此,在一方面中,本申请提供了产生单链多核苷酸产物的方法。在另一方面中,提供了分析单链多核苷酸产物的方法。还提供了可用于本文所述方法的试剂盒和组合物。
[0020]1.定义
[0021]本文使用的“单链多核苷酸扩增”是指通过在包含靶多核苷酸序列的单链模板核酸上重复延伸单个引物来合成单链子链的多个拷贝。新合成的核酸分子在后续的引物延伸反应期间不能用作产生另外的核酸分子的模板。
[0022]本文使用的“扩增”一般是指产生期望序列的两个或更多个拷贝的过程。
[0023]本文中可互换使用的“多核苷酸”或“核酸”是指任意长度的核苷酸聚合物,包括DNA和RNA。所述核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、经修饰的核苷酸或碱基和/或其类似物、或者可通过DNA聚合酶或RNA聚合酶并入聚合物中的任何底物。多核苷酸可包含经修饰的核苷酸,例如甲基化的核苷酸及其类似物。
[0024]本文中使用的“寡核苷酸”一般是指短的、一般为单链的、一般为合成的多核苷酸,其长度一般(但不一定)少于约200个核苷酸。术语“寡核苷酸”和“多核苷酸”并不互相排斥。以上对于多核苷酸的描述同样完全适用于寡核苷酸。
[0025]本文使用的使多核苷酸“片段化”是指使多核苷酸断裂成不同的多核苷酸片段。片段化可例如通过剪切或通过酶促反应来实现。
[0026]“引物”一般是短的单链多核苷酸,一般具有游离3’ -OH基团,其通过与靶多核苷酸上存在的靶序列杂交而与目的靶多核苷酸结合,并随后促进与靶多核苷酸互补之多核苷酸的聚合。
[0027]本文使用的术语“标签”是指可用于将连接有标签的分子与不包含所述标签的其他分子分开的部分。
[0028]本文使用的术语“末端核苷酸”是指位于核酸分子5’端或3’端的核苷酸。
[0029]“杂交”和“退火”是指其中一个或更多个多核苷酸反应以形成复合体的反应,所述复合体通过核苷酸残基碱基之间的氢键键合而稳定化。氢键键合可通过Watson-Crick碱基配对、Hoogstein结合或者以任何其他序列特异性方式发生。
[0030]本文使用的“接头”是指可与多核苷酸片段连接的寡核苷酸。
[0031]本文关于两个多核苷酸(如接头和多核苷酸片段)使用的术语“连接”是指两个单独的多核苷酸共价连接以产生具有连续骨架的单个更大的多核苷酸。
[0032]术语“3’” 一般是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置下游的区域或位置。
[0033]术语“5’” 一般是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置上游的区域或位置。
[0034]“5’突出端”是延伸超过双链核酸分子5’端的一段(stretch)未配对核苷酸。例如,5’突出端可以是单个未配对核苷酸,或者其可以为至少5、10、15或超过15个核苷酸长。例如,引物可包含,例如5至25个不与例如模板链中存在的序列和/或靶多核苷酸序列互补的核苷酸。换言之,在引物的其他部分与靶多核苷酸杂交的情况下,5’突出端的核苷酸不与靶多核苷酸序列杂交。
[0035]“3’突出端”是延伸超过双链核酸分子3’端的一段未配对核苷酸。例如,3’突出端可以是单个未配对核苷酸,或者其可以为至少5、10、15或超过15个核苷酸长。例如,弓丨物可包含,例如5至25个不与例如模板链中存在的序列和/或靶多核苷酸序列互补的核苷酸。换言之,在引物的其他部分与靶多核苷酸杂交的情况下,3’突出端的核苷酸不与靶多核苷酸序列杂交。
[0036]本文使用的术语“靶多核苷酸”是指包含一个或更多个目的序列和正在研究的序列的多核苷酸。
[0037]本文使用的“阵列”包括具有空间或光学可寻址(addressable)区域之核酸或其他分子的排列。当阵列是核酸阵列时,核酸可在沿核酸链的任意点被物理吸附、化学吸附或共价连接至所述阵列。
[0038]术语“确定”、“测量”、“评价”、“评估”、“测定”和“分析”在本文中可互换使用,是指任意形式的测量并且包括确定要素是否存在。这些术语包括定量确定和/定性确定二者。
评估可以是相对的或绝对的。“评估......的存在”包括确定物质存在的量以及确定其是否存在。
[0039]本文使用的术语“单核苷酸多态性”或简称“SNP”是指基因组序列中特定位点处的单个核苷酸的改变,导致在群体中以可感知频率(例如,群体中至少1% )出现的两个或更多个替代等位基因。
[0040]本文使用的术语“变性”是指使核酸双链体分为两条单链。
[0041]术语“富集”是指使样品中特定核酸序列的相对丰度相对于处理前所述样品中最初存在的整体核酸序列水平提高的过程。因此,富集步骤提供了相对百分比或分数提高,而不是直接提高(例如目的核酸序列的绝对拷贝数)。在富集步骤之后,待分析样品可称为富集的多核苷酸或经选择的多核苷酸。
[0042]本文使用的核酸样品的“复杂性(complexity) ”是指所述样品中存在的不同的独特序列的数目。如果样品不如其所来源的核酸样品复杂,则认为该样品具有“降低的复杂性”。
[0043]本文使用的“固体支持物”是指具有与标签结合之特性的固体或半固体材料,所述特性是固有的或者通过连接一些赋予所述特性的组分(例如,抗体、链霉亲和素