长fish探针的合成的制作方法

文档序号:469631阅读:316来源:国知局
长fish探针的合成的制作方法
【专利摘要】本发明涉及长FISH探针的合成,具体地提供了一种方法,其包括:合成包含与染色体中的独特序列杂交的探针序列的一组重叠的寡核苷酸;以一定方式组装所述重叠的寡核苷酸从而产生一个或多个双链多核苷酸,每个双链多核苷酸均包含多个探针序列;标记该一个或多个双链多核苷酸而产生一个或多个标记探针;和将所述标记探针与完整染色体原位杂交。
【专利说明】长FISH探针的合成

【背景技术】
[0001] 染色体重排、缺失和其它畸变久已被与遗传疾病关联。染色体结构异常经常 起因于同源重组中的错误。非整数倍性(Aneuploidy),也称作数目异常(numerical abnormality),其中细胞中的染色体含量异常,可能由于减数分裂期间染色体不分离而发 生。在Edwards、Patau和唐氏综合征中会见到三倍体,其中存在染色体的三个拷贝,而不是 通常的两个。结构异常和非整数倍性可能在配子(gamete)中出现,因此可能存在于受影响 的人体的所有细胞中,或者它们也可以在减数分裂期间出现,导致同时具有一些正常细胞 和一些异常细胞的遗传嵌合(mosaic)个体的产生。
[0002] 基因组不稳定性还会在某些细胞中,例如癌细胞中,造成复杂的染色体重排模式。 常规细胞遗传学测定法,例如吉姆萨(G)条带分析,已经在癌细胞中鉴定了大量的癌症特 异性易位和染色体异常,例如费城(t9,22)染色体。唐氏综合征(三体)、Jac 〇bSen综合征 (缺失)和伯基特氏淋巴瘤(易位)在传统上是通过核型分析(karyotype analysis)进行 研究的。
[0003] 细胞遗传条带分析(cytogenetic banding)和可视化(visualization),例如Μ条 带和光谱核型分析(spectral karyotyping) (SKY)的进步已经使得人们能够对颠换和易位 进行细致的分析,并能够鉴定感兴趣的癌症中染色体材料的失衡增加或缺失。荧光原位杂 交(FISH)进一步使得人们能够使用仅与染色体中显示高度互补性的区域结合的荧光探针 来检测染色体上特定DNA序列的存在或缺失。
[0004] 在开发用于检测染色体异常的技术方法方面,还存在很大的、未能满足的需求。


【发明内容】

[0005] 提供了一种方法,其包括:a)合成一组重叠的寡核苷酸,该组重叠的寡核苷酸包 含与染色体中的独特序列杂交的探针序列;b)以一定方式组装这些重叠的寡核苷酸从而 产生一个或多个双链多核苷酸,其中每一个均包含多个探针序列;c)标记该一个或多个 双链多核苷酸而产生一个或多个标记探针;和d)将所述标记探针与完整染色体原位杂交。 所述一个或多个双链多核苷酸可以通过多种不同的方式,例如通过连接或通过聚合酶链式 组装(polymerase chain assembly),从所述重叠的寡核苷酸制备。
[0006] 附图简沭
[0007] 图1是示意性图解本文所述探针合成方法的某些一般特征的图。
[0008] 图2是示意性图解本方法的一个实施方案的图。
[0009] 图3是示意性图解本方法的另一个实施方案的图。
[0010] 图4是示意性图解本方法的另一个实施方案的图。
[0011] 定义
[0012] 如本文中所使用的,术语"样品"是指含有一种或多种感兴趣的被分析物的材料或 材料混合物,其通常是,但不一定是液体形式。
[0013] 如本文中所使用的,术语"基因组样品"是指含有来自生物体的遗传材料的材料或 材料混合物。如本文中所使用的,术语"基因组DNA"是指从生物体获得的脱氧核糖核酸。 术语"基因组样品"和"基因组DNA"涵盖可能已经过扩增、纯化或断裂的遗传材料。如本文 中所使用的,术语"测试基因组"是指在某个研究中感兴趣的基因组DNA。
[0014] 术语"核苷酸"意图包括这样的部分(moieties):它们不仅含有已知的嘌呤和嘧 陡碱基,还包含其它已经被修饰的杂环碱基。这样的修饰包括甲基化噪呤或啼陡、酰基化噪 呤或嘧啶、烷基化核糖或其它杂环。此外,术语"核苷酸"包括这样的部分,其含有半抗原或 荧光标记,并且可能不仅包含常规的核糖和脱氧核糖,还包含其它的糖。修饰的核苷或核苷 酸还包括对糖部分的修饰,例如其中一个或多个羟基被卤素原子或脂肪族基团代替,或者 被官能化为醚、胺或其它。
[0015] 术语"核酸"和"多核苷酸"在本文中可以互换使用,描述由核苷酸(例如脱氧核糖 核苷酸或核糖核苷酸)构成的任意长度(例如大于约2个碱基,大于约10个碱基,大于约 100个碱基,大于约500个碱基,大于1000个碱基,直至约10, 000个或更多个碱基)的聚合 物,其可以通过酶促或合成产生(例如美国专利No. 5, 948, 902及其引用的参考文献中所述 的PNA),其能够与天然存在的核酸以类似两个天然存在的核酸的序列特异性方式杂交,例 如能够参与Watson-Crick碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺 嘌呤、胸腺嘧啶和尿嘧啶(分别为G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖骨 架,而PNA的骨架由通过肽键连接的重复N-(2-氨基乙基)甘氨酸单元构成。在PNA中,各 种噪呤和啼陡碱基通过亚甲基羰基键(methylene carbonyl bonds)与骨架相连。锁定核酸 (locked nucleic acid) (LNA)通常被称作无法触及的RNA,是一种修饰的RNA核苷酸。LNA 核苷酸的核糖部分被修饰而具有一个连接2'氧和4'碳的额外的桥。该桥将核糖"锁闭"为 3'-内向(北型)(North)构象,这种构象常常在A型双链体中发现。在任何期望的情况下, 在寡核苷酸中LNA核苷酸可以与DNA或RNA残基混合。术语"非结构核酸(unstructured nucleic acid) "或"UNA"是含有以降低的稳定性彼此结合的非天然核苷酸的核酸。例如, 非结构核酸可以含有G'残基和C'残基,其中这些残基对应于G和C的非天然存在形式,即 类似物,它们彼此以降低的稳定性碱基配对,但是仍然保持分别与天然存在的C和G残基进 行碱基配对的能力。非结构核酸在US20050233340中有描述,本文为了公开UNA而通过援 引将其并入。
[0016] 如本文中所使用的,术语"寡核苷酸"是指核苷酸的单链多聚体,长度为约2-200 个核苷酸,多达500个核苷酸。寡核苷酸可以是合成的,或者可以酶促制备,并且在一些实 施方案中,长度为30-150个核苷酸。寡核苷酸可以含有核糖核苷酸单体(即可以是寡核糖 核苷酸)或脱氧核糖核苷酸单体。寡核苷酸的长度可以是例如10-20、11-30、31-40、41-50、 51-60、61-70、71-80、80-100、100-150 或 150-200 个核苷酸。
[0017] 如本文中所使用的,术语"序列特异性寡核苷酸"是指仅与单倍体基因组中的单一 位点结合的寡核苷酸。在某些实施方案中,"序列特异性"寡核苷酸可以和所研究样品中独 特的互补核苷酸序列杂交。
[0018] 如本文中所使用的,术语"互补"是指通过非共价键与感兴趣的靶核酸碱基配对的 核苷酸序列。在经典的Watson-Crick碱基配对中,DNA中的腺嘌呤(A)与胸腺嘧啶(T)形 成碱基对,鸟苷酸(G)与胞嘧啶(C)形成碱基对。在RNA中,胸腺嘧啶被尿嘧啶(U)代替。 这样,A与T互补,而G与C互补。在RNA中,A与U互补,反之亦然。典型地,"互补"是指 与感兴趣的靶标完全互补的核苷酸序列,从而序列中的每一个核苷酸均与靶核酸相应位置 处的每一个核苷酸互补。在某些情况下,核苷酸序列可以与靶部分互补,其中不是所有核苷 酸均与靶核酸所有相应位置处的每一个核苷酸互补。
[0019] 如本文中所使用的,术语"引物"是指这样的寡核苷酸,其或者是天然存在的,例如 在纯化的限制性消化物中,或者是合成产生的,当将该寡核苷酸置于与某条核酸链互补的 引物延伸产物的合成被诱发的条件下,即有核苷酸和诱发剂(如DNA聚合酶)存在、且温度 和pH适宜时,该寡核苷酸能够充当合成的启动点。引物可以是单链的或者双链的,并且必 须足够长,以便在存在诱发剂时可以引发期望的延伸产物的合成。引物的确切长度将取决 于许多因素,包括温度、引物来源、和方法的用途。例如,对于诊断应用,取决于靶序列的复 杂性,寡核苷酸引物通常含有15-25或更多个核苷酸,尽管它也可含有更少的核苷酸。本 文中的引物经过选择以与特定靶DNA序列的不同链基本上互补。这意味着,引物必须有足 够的互补性以与其相应链杂交。因此,引物序列不必反映模板的确切序列。例如,在引物的 5'端可以附接非互补的核苷酸片段,而引物序列的其余部分与所述链互补。或者,可以将非 互补的碱基或更长序列散布在引物中,只要引物序列与链的序列足够互补从而可以与之杂 交,藉此形成用于合成延伸产物的模板即可。
[0020] 如本文中所使用的,术语"探针"是指这样的核酸,其与感兴趣的核苷酸序列部分 或完全互补,从而能够在严格的杂交条件下与之稳定杂交。在某些情况下,靶分析物的检测 需要探针与靶杂交。探针可以具有,但非必须具有与靶序列不互补的区域,只要这样的序列 在严格杂交条件下不会实质性地改变探针期望的特异性即可。如果存在这些非互补区,它 们可能含有5'启动子序列和/或RNA转录的结合位点,限制性内切酶识别位点,或可以含有 可赋予探针、靶核酸、或者探针和靶核酸二者以期望的二级或三级结构(例如催化活性位 点或发夹结构)的序列。探针可以用能够用来检测或确认探针已与靶序列杂交的报告基团 部分,例如放射性同位素、荧光基团或化学发光部分,用酶或其它配体进行标记。在某些实 施方案中,探针可以固定在基质的表面上,其中基质可以具有各种构型,例如片层、珠子或 其它结构。在某些实施方案中,探针可以存在于平面支持物的表面上,例如以阵列的形式。
[0021] 如本文中所使用的,术语"扩增"是指,合成与模板核酸的一条或两条链互补的核 酸分子的过程。扩增核酸分子通常包括使模板核酸变性、使引物在低于引物熔点的温度下 与模板核酸退火、和酶促地从引物延长以产生扩增产物。变性、退火和延长步骤可以分别 进行一次。然而,一般而言,变性、退火和延长步骤进行多次(例如至少5-10次,多达30-40 次,或更多次),从而使扩增产物的量增加,经常指数倍增,尽管指数扩增并不是本方法要求 的。扩增通常要求存在脱氧核糖核苷三磷酸、DNA聚合酶和对该聚合酶的最佳活性而言合 适的缓冲液和/或辅助因子。术语"扩增产物"是指由此处所定义的扩增程序产生的核酸 序列。
[0022] 本文中,术语"确定"、"测量"、"评估"、"评价"、"分析"和"测定"可以互换使用,指 任意形式的测量,并且包括确定某要素是否存在。这些术语包括定量和/或定性确定。评 估可以是相对的或绝对的。"评估…的存在"包括确定某物的存在量,以及确定其是否存在。
[0023] 如本文中所使用的,术语"Tm"是指寡核苷酸双链体的熔解温度,在该温度一半的 双链体仍保持杂交,而一半的双链体解离为单链。寡核苷酸双链体的T m可以通过实验确定 或者用如下的公式预测:Tm=81.5+16.6(l Og1(l[Na+])+0.41(G+C分数)-(60/N),其中N是链 长度,[Na+]小于 1M。见 Sambrook and Russell (2〇01;Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor Press, Cold Spring Harbor N. Y.,第 10 章)。还 存在其它用于预测寡核苷酸双链体Tm的公式,且一个公式可能或多或少地适用于一个给 定的条件或一组条件。
[0024] 术语"使用(using)"具有其常规含意,并且同样意指"利用(employing)",例如, 利用方法或组合物以达成目的。例如,如果使用程序创造一个文件,则该是执行该程序以制 作文件,所述文件通常是所述程序的输出物。在另一个例子中,如果使用计算机文件,则通 常是访问、读取所述文件,且使用存储于该文件中的信息以达成目的。简单地说,如果使用 一种独特的标识,例如条形码,则通常是读取该独特的标识以识别,例如,与该独特的标识 相关联的物体或文件。
[0025] 如本文中所使用的,术语"染色体重排"是指染色体的一个或多个部分在单个染色 体内或者在染色体之间重新排列的事件。在某些情况下,染色体重排可以反映染色体结构 的异常。染色体重排可以是例如颠换(inversion)、缺失、插入、或易位。
[0026] 术语"接触"意思是使之在一起。因此,当将第一个物品与第二个物品放在一起, 例如使它们彼此碰到或将它们置于同一溶液中,则称第一个物品与第二个物品接触。因此 "被接触样品"是寡核苷酸探针所杂交的测试染色体。
[0027] 术语"杂交"是指核酸与互补核酸通过Watson-Crick碱基配对的特异结合。因此, 术语"原位杂交"是指核酸与中期(metaphase)或间期(interphase)染色体的特异结合。
[0028] 术语"杂交"和"结合"在用于指示核酸时可以互换使用。
[0029] 术语"多个"、"一组"、"多"、和"群体"可以互换使用,意思是至少2个、至少10个、 至少100个、至少500个、至少1000个、至少10, 000个、至少100, 000个,至少1000, 000个、 至少10, 000, 000个或者更多。
[0030] 如本文中所使用的,术语"染色体区"是指生物体基因组中连续的一段核苷酸。染 色体区的长度范围可以是l〇kb到整个染色体,例如100kb-10MB。
[0031] "测试染色体"是从哺乳动物细胞分离的完整中期或间期染色体,其中完整染色体 具有与哺乳动物细胞中存在的相同染色体相同的整体形态,例如含有着丝粒、含有端粒的 长臂和含有端粒的短臂。测试染色体与参考染色体相比可以含有颠换、易位、缺失、插入或 其它重排。测试染色体是所研究的染色体。
[0032] "参考染色体"是完整的中期染色体,可以将测试染色体与其进行比较以鉴定重 排。参考染色体可以任意选择。参考染色体可以具有已知的序列。参考染色体可以自身含 有染色体重排。
[0033] 如本文中所使用的,术语"参考染色体区"是指将测试染色体区与之比较的染色体 区。在某些情况下,参考染色体区可以具有已知的核苷酸序列,例如其序列已录入NCBI的 Genebank数据库和其它数据库中的染色体区。
[0034] 如本文中所使用的,术语"原位杂交条件"是指允许核酸与完整染色体中的互补核 酸杂交的条件。合适的原位杂交条件可以包括杂交条件和任选的清洗条件,清洗条件包括 温度、变性剂浓度、盐、温育时间等。这些条件是本领域已知的。
[0035] 术语"不同的非连续区域"是指染色体上不连续的区域或间隔。
[0036] 术语"结合模式"是指一组标记探针与某个完整染色体结合的模式。
[0037] 如本文中所使用的,术语"聚合酶链式组装"是指这样的方案,其中将多个重叠的 寡核苷酸组合,并使之经历多轮引物延伸(即在聚合酶和核苷酸存在下进行多轮连续的 引物延伸、变性和退火)使用彼此作为模板经历,从而延长寡核苷酸,借此产生含有每个起 始寡核苷酸核苷酸序列的产物分子。然后,在标记之前,使用与产物分子末端位点结合的引 物对产物分子进行扩增。
[0038] 如本文中所使用的,术语"(使)变性"是指通过将核酸双链体置于合适的变性条 件下使核酸双链体的至少一部分碱基对分离。变性条件是本领域众所周知的。在一个实施 方案中,为了使核酸双链体变性,可以将双链体暴露于超过双链体的Tm的温度,由此使双 链体的一条链从另一个链上释放。在某些实施方案中,可以通过将核酸暴露于至少90°C达 合适的时间量(例如至少30秒,多达30min)使之变性。在某些实施方案中,可以使用完全 变性条件来完全分离双链体的碱基对。在其它实施方案中,可以使用部分变性条件(例如 用低于完全变性条件的温度)分离双链体某些部分的碱基对(例如富含A-T碱基对的区域 可以分离,而富含G-C碱基对的区域可以保持配对)。核酸还可以被化学变性(例如使用尿 素或NaOH)。
[0039] 如本文中所使用的,术语"延伸"是指通过使用聚合酶添加核苷酸使引物延伸。如 果与核酸退火的引物被延伸,则该核酸充当延长反应的模板。
[0040] 术语"重叠的寡核苷酸"是指一组寡核苷酸,其中每一个寡核苷酸的某个末端(例 如3'端)与该组中另一个寡核苷酸的某个末端互补,使得重叠的寡核苷酸的各末端可以彼 此杂交,并可以通过使用其它寡核苷酸作为模板被聚合酶所延伸。
[0041] 术语"彼此连结"是指彼此结合形成一个单元。多核苷酸序列可以彼此连结产生 一个单一的序列。
[0042] 术语"重复序列"是指基因组中非独特的序列,例如卫星DNA、LINES、SINES,或者 本来在单倍体基因组的至少两个区域内出现的序列,例如在同源基因或已被复制的基因中 出现的序列。
[0043] 示例实施方案详细说明
[0044] 在更详细描述本发明之前,应当理解,本发明并不仅限于所述的特定实施方案,因 此它们当然可以发生变化。还应当理解,这里所用的术语只是出于描述特定实施方案的目 的,并不意图有限制,因为本发明的范围仅由随附的权利要求所限定。
[0045] 当提供某个值的范围时,应该理解为还具体公开了上限和下限之间的每一个居间 值,到下限的单位的十分之一,除非上下文中另有明确说明。在指明的范围中,任意指明的 值或居间值与该范围中的其它指明的或居间值之间的每一个更小范围都包括在本发明之 中。
[0046] 除非另外指出,否则这里所用全部技术和科学术语均具有与本发明所属领域普通 技术人员所公知的相同的意思。尽管在实践或测试本发明时也可以使用与本文中所述的相 似或等同的方法或材料,但是现在描述的是优选的方法和材料。
[0047] 本文通过援引并入本说明书中所引证的全部出版物和专利的内容,就像具体地逐 个声明通过援引并入每一个单独的出版物或专利一样;通过援引并入这些出版物和专利是 为了公开和描述与对这些出版物的引证相关联的方法和/或材料。对任何出版物的引证是 出于引证其中早于申请日的公开内容的目的,而不应当被解释为了承认本发明无权基于发 明在先而使这些出版物不构成本发明的现有技术。而且,所提供的出版日期可能与实际的 出版日期不同,其可能需要单独加以确认。
[0048] 应当注意,如本文中所使用的,以及在随附的权利要求中,除非上下文明确地另有 要求,否则单数形式"一"、"一个"、和"该"包括复数形式。此外应当注意,权利要求可以使 用排除任何任选元素的表述。因此,本陈述应视为将排他性术语如"唯一"、"仅"等与某一 权利要求元素联用、或使用"负"限定的在先基础。
[0049] 如本领域技术人员阅读本公开文件时容易想到的,本文中所描述和例示的每个单 独的实施方案都具有离散的组成成分和技术特征,其可以随时从任意其它几个实施方案的 特征分离或与其它几个实施方案的特征结合而不背离本发明的教导的范围或精神。任何提 到的方法都可以以提到的顺序进行,或以任意逻辑上可能的顺序进行。
[0050] 本方法的某些方面如图1所示。在某些实施方案中,该方法包括合成一组重叠的 寡核苷酸2,其包含探针序列,所述探针序列中每一个与基因组4中的一个独特序列(即仅 与一个位置)杂交。在这些实施方案中,重叠寡核苷酸的长度范围可以是50-200个核苷酸 (或者更长)。重叠寡核苷酸中每一个的一个末端(例如3'端)与重叠寡核苷酸中另一个 的一个末端互补,从而重叠寡核苷酸的末端可以彼此杂交,并且如果需要,可以用另一个重 叠寡核苷酸(another of the overlapping oligonucleotides)作为模板加以延伸。相 邻的寡核苷酸之间可以有10%_90%重叠。在某些情况下,重叠的区域(即相邻寡核苷酸之 间的互补区域)可以是12-50个碱基,例如15-30个碱基的范围。探针序列的长度范围可 以是10-200个,例如20-150个核苷酸。取决于寡核苷酸是如何制备的(例如取决于它们 是刚刚合成的未处理的寡核苷酸,还是已经通过PCR进行了扩增的寡核苷酸),寡核苷酸可 以是单链寡核苷酸或双链寡核苷酸。在制备重叠寡核苷酸之后,以一定的方式组装重叠寡 核苷酸,以产生一个或多个双链多寡核苷酸6,所述双链多寡核苷酸各自包含多个(例如至 少2个、至少5个、至少10个、至少50个、或者至少100个或更多、多达1,000个或更多) 探针序列。如将在下文中更详细描述的,如果寡核苷酸是单链的,则可以通过聚合酶链式组 装制备所述一个或多个双链多核苷酸。在一个其中寡核苷酸为双链的实施方案中,所述一 个或多个双链多核苷酸可以通过将双链寡核苷酸连接在一起来制备。在组装好所述一个或 多个双链多核苷酸之后,将它们标记产生一个或多个标记探针8。标记可以用任何方便的 方式完成。例如,在某些情况下,可以通过将一个或多个标记化学缀合于一个或多个双链多 核苷酸来标记探针,例如使用通用连接系统(Universal Linkage System) (ULS?,KREATECH Diagnostics;van Gijlswijk et al Universal Linkage System:versatile nucleic acid labeling technique Expert Rev.Mol.Diagn. 20011:81-91)。简而言之,ULSTM 标记是基 于钼(II)与核酸的稳定结合性质。ULS分子由与所选的可检测分子偶联的单功能钼复合 体组成。或者,标记可以用缺口平移、随机引发(random priming)、或任何其它在Ausubel 等,(Short Protocols in Molecular Biology,第三版,Wiley&Sons, 1995)或 Sambrook 等,(Molecular Cloning:A Laboratory Manual,第三版,(2001) Cold Spring Harbor, N. Y.)中描述的合适方法实现。在某些情况下,所述一个或多个双链多核苷酸的多个位点被标 记,且不被通过末端标记方式标记。图1所示的示例实施方案中图解了一种已通过化学缀 合而被标记的探针。可以显见,本方法的使用其它标记方法(例如缺口平移或随机引发) 的实施方案会产生与图1所不不同的产物。在该一个或多个双链多核苷酸被标记之后,所 得的探针与完整染色体,例如从哺乳动物细胞分离的完整中期或间期染色体原位杂交。所 得的探针与完整染色体的结合应当会产生结合模式10,可以对其进行分析,从而可能鉴定 出染色体重排。
[0051] 如上文所指出的,在某些实施方案中,所述一个或多个双链多核苷酸可以通过聚 合酶链式组装由重叠的单链寡核苷酸组装而成,其中如上文指出的,聚合酶链式组装涉及 使多个重叠的单链寡核苷酸使用彼此作为模板经历多轮引物延伸(即在聚合酶和核苷酸 的存在下进行多个连续的引物延伸、变性和复性的循环),由此产生产物分子,然后用与最 终的产物分子的末端位点结合的引物对该最终的产物分子进行扩增。实施聚合酶链式组装 方法的不例条件可以在例如 Hughes 等(Methods in Enzymology2011498:277_309)和 Wu 等.(J.Biotechnol. (2006),124:496-503)中找到,它们均援引并入本文。如果使用聚合酶 链式组装,那么产物双链多核苷酸的长度范围可以是l〇〇bp_5kb,例如200bp-3kb。在这些 实施方案中,通过聚合酶链式组装产生的一个或多个双链多核苷酸的连续核苷酸序列与靶 染色体中的序列可以有至少95%相同(例如至少98%或至少99%相同)。本方法中所用的 寡核苷酸的重叠末端可以是T m匹配的。
[0052] 如上文所指出的,所述一个或多个双链多核苷酸可以由重叠双链寡核苷酸通过将 双链寡核苷酸的末端连接在一起组装而成。在这些实施方案中,所述双链寡核苷酸可以通 过对寡核苷酸进行PCR扩增加以制备,例如按照美国专利8, 034, 917所述。在这些情况下, 所述双链寡核苷酸可以从寡核苷酸的混合物进行PCR扩增,所述混合物中不同的寡核苷酸 根据下式(从5'至3'),其中乂 1和&为一对PCR引物提供结合位点(例如,乂1具 有与第一 PCR引物相同的序列,而X2具有与第二PCR引物互补的序列),且V是一个可变区 域,其具有与基因组中的独特序列互补的可变的核苷酸序列。可变区一般对应于基因组的 非重复区,可以用一对PCR引物进行扩增。在某些情况下,对于所有待组装的寡核苷酸而言 &和X 2的核苷酸序列是相同的,从而单一一组寡核苷酸的所有可变区可以用单一一对PCR 引物来扩增。在这些实施方案中,PCR产物\和&区可以含有IIS型限制酶的位点,从而 Xi和X 2的序列可以从PCR产物中移除,以产生一组在该方法的本实施方案中使用的重叠双 链寡核苷酸。这些双链寡核苷酸一旦产生,可以将它们全部连接在一起,并如上所述地进行 标记。在这些实施方案中,一个或多个双链多核苷酸的长度范围是300-5, 000个碱基对,尽 管在某些实施方案中,长度可为超过5, 000个碱基对长。由于该连接基本上是随机的,因此 所述一个或多个双链多核苷酸的整个连续核苷酸序列与靶染色体中的序列可以具有小于 10%的序列同一性。然而,在通过本方法制备的一个或多个双链多核苷酸中,应当有数个较 短的序列(例如50-150个核苷酸)与靶序列有至少95% (例如至少98%或至少99%)的序 列同一性,并能够和靶序列杂交。在这些实施方案中,所述一个或多个双链多核苷酸中的探 针序列的顺序是随机的。图2图解了可以实施该基于连接酶的实施方案的一种方式。
[0053] 在一些实施方案中,寡核苷酸与染色体中多个不同区域杂交,其中所述不同区域 被重复序列(repeat sequences)(例如在基因组中不独特的序列(sequences),例如卫星 DNA、LINES、SINES或原本在单倍体基因组的至少两个部分中出现的序列,例如在同源基因 或已经过复制的基因中出现的序列)所分隔。在这些实施方案中,可以分析基因组序列以 鉴定被重复序列(repeat sequences)所分隔的祀区域。在某些情况下,可以为每个祀区域 设计一组重叠的探针序列。例如,如果有两个、三个或四个靶区域,则可以产生相等数目的 双链多核苷酸,其中每个双链多核苷酸对应于单个靶区域。这些实施方案可以包括:为每个 靶区域设计一组重叠探针序列;合成多组包含所述重叠探针序列的寡核苷酸;和以一定方 式组装这些重叠探针序列,使得为每个靶区域产生一个双链多核苷酸。该实施方案在图3 中图示(其中图3演示了本方法的该实施方案可以用聚合酶链式组装完成的一种方式)。在 其它情况下,在鉴定出被重复序列分隔的靶区域之后,可以将各核苷酸序列彼此连结(即, 彼此相连形成含有每一个靶序列的单一序列,这些靶序列的顺序可以和基因组中发现的顺 序相同或不同)。在这些实施方案中,连结起来的核苷酸序列可以被分成(split into)多 个具有限定长度(例如长度范围是500bp-5kb)的区域,并且可以为该多个区域的每一个设 计一组探针序列。与上文一致,该方法可以涉及合成多组包含探针序列的重叠寡核苷酸;和 以一定方式组装这些探针序列,使得为所述多个区域中的每一个产生一个可以被标记的双 链多核苷酸,如上所述。图4图解了该方法的这个实施方案可以通过聚合酶链式组装实现 的一种方式。
[0054] 可以显见,对应于基因组不同区域中的不同双链多核苷酸可以用相同的标记物 (例如相同的荧光团)标记,在某些情况下,可以在标记之前将不同的双链多核苷酸组合。 在某些情况下,不同的双链多核苷酸可以用不同的标记物(例如不同的荧光团)标记。
[0055] 在某些实施方案中,对象中使用的寡核苷酸可以在阵列上提供。在某些实施方案 中,阵列可以用原位合成方法合成,其中核苷酸单体被顺次添加到生长中的核苷酸链,其中 所述核苷酸链附接于呈阵列形式的固体支持物。这些原位制造方法包括在下列文献中描述 的那些:美国专利Nos. 5,449, 754和6, 180, 351,以及公开的PCT申请No. W098/41531,和其 中引证的参考文献,以及多种其他出版物。在一个实施方案中,方法中所用的寡核苷酸可以 如此制备:使用原位合成方法制造寡核苷酸阵列,并从阵列中切出寡核苷酸。
[0056] 适合用作本方法中的标记物的荧光染料(荧光团)可以从许多适合于成 像应用的染料中任意选择。有若干种染料可以从各种来源商购,例如Molecular Probes (Eugene, Oreg.)和Exciton (Dayton, Ohio),这为选择一组具有期望的光谱性质的 染料提供了极大的灵活性。荧光团的实例包括,但不仅限于,4-乙酰胺基-4'-异硫氰酸 芪-2, 2' -二磺酸;吖啶和其衍生物,如吖啶,吖啶橙,吖啶黄,吖啶红,和吖啶异硫氰酸酯; 5- (2 ' -氨乙基)氨基萘-1-磺酸(EDANS );4-氨基-N- [3-乙烯砜基/苯基]萘酰亚胺-3, 5 二石黄酸酉旨(amin〇-N-[3-vinylsulfonyl)phenyl]naphthalimide-3, 5disulfonate)(突光 黄 VS) ;N-(4-氨基-1-萘酰)马来酰亚胺(N-(4-amin〇-l-naphthyl)maleimide);邻氨基 苯甲酰胺;亮黄(Brilliant Yellow);香豆素及衍生物,如香豆素、7-氨基-4-甲基香豆素 (八皿(3,香豆素12()),7-氨基-4-三氟甲基香豆素((>)111]^1311151) ;花青及衍生物,如焰红染 料(cyanosine),Cy3,Cy5,Cy5. 5,和 Cy7 ;4',6_ 二脒基-2-苯基吲哚(DAPI) ;5',5"-二溴 邻苯三酚-磺酞(溴邻苯三酚红);7_二乙氨基-3-(4'-异硫氰酸苯基)-4-甲基香豆素;二 乙氨基香豆素;二亚乙基三胺五乙酸;4, 4'-二异硫氰酸二氢-芪-2, 2'-二磺酸;4, 4'-二 异硫氰酸芪_2,2' -二磺酸;5-[二甲氨基]萘-1-磺酰氯(DNS,丹酰氯);4-(4' -二甲氨 基苯偶氮基)苯甲酸(DABCYL) ;4_二甲氨基苯偶氮基苯基-4' -异硫氰酸酯(DABITC); 曙红及衍生物,如曙红和曙红异硫氰酸酯;藻红及衍生物,如藻红B和藻红异硫氰酸酯;乙 啡啶;荧光素及衍生物,如5-羧基荧光素(FAM)、5_ (4, 6-二氯三嗪-2-基)氨基荧光素 (0丁八朽、2'7'-二甲氧基-4'5'-二氯-6-羧基荧光素〇(^)、荧光素异硫氰酸酯$11'〇、荧 光素氯三嗪、萘基荧光素、和QFITC(XRITC);荧光胺;IR144;IR1446;丽丝胺(Lissamine) ?;丽丝胺罗丹明、突光黄(Lucifer yellow);异硫氰基孔雀石绿(Malachite Green isothiocyanate) ;4-甲基伞形酮;邻甲酚酞;硝基酪氨酸;碱性副品红;尼罗红;俄勒冈 绿;酚红;B-藻红蛋白;邻苯二醛;芘及其衍生物,如芘、芘丁酸酯和琥珀酰亚氨基-1-芘丁 酸酯;活性红4(Cibacr 〇n?亮红3B-A);罗丹明及衍生物,如6-羧基-X-罗丹明(R0X)、 6_羧基罗丹明(R6G)、4,7-二氯罗丹明丽丝胺、罗丹明B磺酰氯、罗丹明(Rhod)、罗丹明B、 罗丹明123、罗丹明X异硫氰酸酯、磺基罗丹明B、磺基罗丹明101、磺基罗丹明101磺酰氯 衍生物(德克萨斯红)、Ν,Ν,Ν',Ν'-四甲基-6-羧基罗丹明(TAMRA)、四甲基罗丹明、和四 甲基罗丹明异硫氰酸酯(TRITC);核黄素;玫瑰酸和铽螯合物衍生物;氧杂蒽;Alexa-Fluor 染料(例如 Alexa Fluor350、Alexa Fluor430、Alexa Fluor488、Alexa Fluor546、Alexa Fluor555、Alexa Fluor568、Alexa Fluor594、Alexa Fluor633、Alexa Fluor647、Alexa Fluor660> Alexa Fluor680> Alexa Fluor700> Alexa Fluor750) > Pacific Blue> Pacific Orange、Cascade Blue>Cascade Yellow ;Quantum Dot 染料(Quantum Dot Corporation); 来自 Pierce 的 Dylight 染料(Rockford,IL),包括 Dylight800、Dylight680、Dylight649、 Dylight633、Dylight549、Dylight488、Dylight405 ;或其组合。也可以使用其它本领 域技术人员已知的突光团或其组合,例如可以从Molecular Probes(Eugene,Oreg.)和 Exciton (Dayton, Ohio)获得的那些。
[0057] 下面的表1提供了可以和2、3或4组合使用的荧光团的示例性组合。该表格不是 全面性的。在表1中,指示了 20种不同的二染料组合、9种不同的三染料组合、和8种不同 的四染料组合(纵向阅读;填充了黑色的框指示组合中的染料)。
[0058] 表 1 染料组合实例(AF=Alexa Fluor)
[0059]

【权利要求】
1. 一种方法,包括: (a) 合成包含与染色体中的独特序列杂交的探针序列的一组重叠的寡核苷酸; (b) 以一定方式组装这些重叠的寡核苷酸,从而产生一个或多个双链多核苷酸,每一个 均包含多个探针序列; (c) 标记该一个或多个双链多核苷酸以产生一个或多个标记探针;和 (d) 将所述标记探针与完整染色体原位杂交。
2. 权利要求1的方法,其中所述组装是通过将多个双链寡核苷酸彼此连接,或者通过 聚合酶链式组装而完成的。
3. 权利要求1的方法,其中所述标记是通过随机引发、缺口平移,或通过将一个或多个 标记物缀合于所述一个或多个双链多核苷酸而完成的。
4. 权利要求1的方法,其中所述探针序列的长度范围是10-150个核苷酸。
5. 权利要求1的方法,其中所述一个或多个双链多核苷酸的长度范围是300-5, 000个 喊基对。
6. 权利要求1的方法,其中所述探针序列在所述一个或多个双链多核苷酸中的顺序是 随机的。
7. 权利要求1的方法,其中所述一组寡核苷酸与染色体中的多个不同区域杂交,其中 所述不同区域被重复序列所分隔。
8. 权利要求1的方法,其中所述染色体是哺乳动物染色体。
9. 权利要求1的方法,还包括: (e) 使用显微镜阅读步骤(d)的产物以生成杂交模式。
10. 权利要求9的方法,还包括: (f) 将所述杂交模式与对照杂交模式进行比较。
【文档编号】C12N15/10GK104099409SQ201410045228
【公开日】2014年10月15日 申请日期:2014年2月7日 优先权日:2013年3月5日
【发明者】S.陈, M.鲁沃洛, E.M.莱普鲁斯特 申请人:安捷伦科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1