专利名称:前列腺癌中gstp1高甲基化的检测的制作方法
前列腺癌中GSTP1高甲基化的检测
背景技术:
本发明涉及甲基化基因的检测以及其他诊断方法和用于这些方法的试剂盒。表观遗传改变(不涉及DNA核苷酸序列改变的基因表达改变)主要由DNA甲 基化修饰和染色质重建构成。DNA甲基化变异已经在多种肿瘤和基因的文献中记载 (Esteller 等人(2001) ; Bastian 等人(2004);和 Esteller (2005))。特定 CpG 位点的甲基 化程度随患者样本而变化(Jeronimo等人(2001);和Pao等人(2001))。最近已经公开了多种潜在的甲基化标记物。谷胱甘肽S-转移酶(GST)为示例性 蛋白质,表达它们的基因的甲基化状态对于前列腺癌具有重要的预后和诊断价值。该蛋 白质催化细胞内的排毒反应,包括通过使化学活性亲电体与谷胱甘肽结合而使亲电致癌 物失活(Pickett 等人(1989) ; Coles 等人(1990);和 Rushmore 等人(1993))。由若干不 同基因在不同位点编码的人类GST被分为四个家族,分别称为α、μ、Ji和θ (Mannerv ik等人(1992))。由表观遗传改变导致的GSTPl表达量减少通常与前列腺癌和肝癌相关。计算方法(Da s等人(2006))和亚硫酸氢盐测序(Chan等人(2005))显示,CpG 岛内多个位点可以被甲基化,并且甲基化程度会在这些位点之间变化。例如,在口腔癌 中,pl6、上皮钙粘蛋白基因(E-cadherin)、周期蛋白Al基因(cyclinAl)和细胞球蛋白基 因(cytoglobin)在各个CpG位点的甲基化程度具有显著差异(Shaw等人(2006))。在前 列腺和膀胱肿瘤中,内皮素受体B显示为甲基化热点(Pao等人(2001)。)在结直肠癌和 胃癌中,相比更中心的区域,几乎在每个样本中都检测到死亡相关蛋白激酶基因的CpG 岛的边缘被甲基化(Satoh等人(2002))。在乳腺癌中,发现RASSF1A基因CpG岛的甲 基化分布存在差异,并且甲基化会从第一外显子逐渐扩散到启动子区(Yan等人(2003); 和Strannikova等人(2005))。RASSF2在CpG岛的5’和3’边缘存在频繁的甲基化, 而在转录起始位点附近的甲基化则不是那么频繁(Endoh等人(2005))。在子宫内膜癌中, 四种GSTPl设计显示灵敏度在14%和24%之间,但样本量太 小,无法确定这些差异是否是真实的(Chan等人(2005))。两种检测设计增加了前列腺癌 的检测灵敏度(Nakayama等人(2003));然而,这两种设计共用相同的反向引物,因此 在检测区域内存在较大重叠。pl6、上皮钙粘蛋白基因、周期蛋白Al基因和细胞球蛋白 基因的不同CpG序列的甲基化百分比存在差异(Shaw等人(2006))。在乳腺癌中,CpG 位点的甲基化程度存在差异(Yan等人(2003))。肿瘤MLH IRNA表达和MLH1DNA甲基化之间存在负相关性(Yu等人 (2006))。在肺癌细胞系中,甲基化阳性样本的DAPK基因表现出较低的RNA表达水平 (Toyooka等人(2003))。然而,这些研究只检测了一个甲基化位点,因此无法确定与CpG 岛内多个位置处的RNA表达的相关性。转录起始位点周围的核心区是提供启动子甲基化 信息的替代标记(Eckhardt等人(2006))。在食道鳞状上皮细胞癌中,从正常到浸润性癌,各基因处的甲基化频率增加 (Guo 等人(2006))。TMSl (ρ = 0.002)、DcRl (ρ = -0.01)、DcR2 (ρ = 0.03)和 CRBPl (ρ =0.03)的甲基化与格里森评分相关,CRBPl的甲基化与较高分期相关(ρ = 0.0002),Repr imo(ρ = 0.02)禾Π TMS 1(ρ = 0.006)的甲基化与较高(> 8ng/ml)PSA 水平相关 (Suzuki等人(2006))。甲基化状态与子宫内膜癌的肌层浸润程度相关。患者肿瘤附近正 常组织内的ASC甲基化频率显著(ρ = 0.04)升高与生化复发相关,这表明其与侵袭性疾 病的相关性(Chan等人(2005))。RARb2、PTGS2和EDNRB可能对接受过根治性前列 腺切除术的患者具有预后价值(Bastian等人(2007))。对于已知会在前列腺癌中甲基化的两种基因GSTPl和RARb2,人们已在多个 位点进行了甲基化特异性PCR(MSP)检测分析(Lee等人(1994) ; Harden等人(2003); Jeronimo 等人(2004);和 Nakayama 等人(2001))。
发明内容
在本发明的一个方面,提供了基于GSTPl序列(登录号X08508)第834-1319位 碱基跨度的CpG岛的检测分析法。这些新设计与现有技术(本说明书中称为形式1)并 不交叉。在本说明书中,新设计称为形式2和形式3。这些检测分析法大大提高了临床 灵敏度和分析灵敏度。
具体实施例方式检测可表征前列腺癌存在的若干基因的启动子序列中是否存在高甲基化的分子 检测分析法是已知的。一种此类基因为GSTP1,并且一种检测分析法在(例如)全文并 入本文中的美国专利公布20080254455中有所描述。该检测分析法专注于通过启动子的 CpG岛内的胞嘧啶甲基化而使基因表观遗传沉默,因此基因表达显著下调或完全消失。 甲基化特异性PCR(MSP)检测分析法设计用于通过区分甲基化和未甲基化胞嘧啶来检测 甲基化序列。在用于PCR反应之前,对基因组DNA进行亚硫酸氢钠修饰,以将未甲基 化DNA中的所有胞嘧啶转化为尿嘧啶,而在甲基化DNA中只有不在鸟嘌呤前面的胞嘧 啶转化为尿嘧啶。所有鸟嘌呤前面的胞嘧啶(在CpG 二核苷酸中)仍然为胞嘧啶。GSTPl启动子的高甲基化及其与前列腺癌的关系已经广泛地描述于文献中。本 发明的检测分析法大大改善了对GSTPl的启动子序列甲基化的检测方法。新检测分析法 更灵敏和更具特异性,并且其与相同基因的一个以上扩增子结合使用提高了可靠性。本 发明描述了新设计及其与采用福尔马林固定石蜡包埋(FFPE)样本的现有设计的比较。当 处理来自FFPE组织的降解DNA、脱落进入尿液中的极少数前列腺细胞中的DNA以及前 列腺癌患者血液中自由漂浮的DNA时,分子检测分析的高灵敏度和高特异性尤其具有价 值。对基因组内具有表达蛋白质、肽或mRNA的潜能的核酸序列(这些序列被称为 “基因”)的修饰本身已经表明,其对于给定细胞中是否表达蛋白质、肽或mRNA具有决
定性。给定基因是否能够表达蛋白质、肽或mRNA以及这种表达发生(如有可能)的程 度取决于多种复杂因素。不管理解和评价这些因素的难度如何,通过测定基因表达或修 饰形式可以提供有关重要事件(例如肿瘤发生、癌细胞转移、细胞凋亡和其他临床相关 现象)发生的有用信息。对于基因活性或非活性程度的相对指标可见于基因表达或修饰 谱图。样本可以为含有 适于甲基化检测的基因组DNA的任何生物流体、细胞、组织、器官或其一部分。试验样本可以包括或疑似包括赘生性细胞,例如来自含有或疑似含有 赘生性细胞的结肠、直肠、乳房、卵巢、前列腺、肾、肺、血液、脑或其他器官或组织 的细胞。该术语包括存在于个体中的样本以及得自或衍生自个体的样本。例如,样本可 以为得自活组织检查的标本的组织切片或置于组织培养物中的细胞或适合组织培养的细 胞。样本还可以为亚细胞部分或提取物,或者为粗的或基本上纯的核酸分子或蛋白质制 品。标准样本可用来确定基准水平,并且因此可得自具有用来比较试验样本的特定表型 特征的源组织。用于确定基因修饰谱图的样本可通过本领域已知的任何方法获得。样本可按照 标准技术得自作为基因组DNA通常来源的所有类型的生物来源,包括(但不限于)含有 DNA的细胞或细胞组分、细胞系、活检样本、体液(例如血液、痰、粪便、尿液、脑脊 液、精液)、石蜡包埋组织(例如来自眼、肠、肾、脑、心脏、前列腺、肺、乳房或肝的 组织)、组织切片、以及它们的所有可能的组合。合适的生物样本可以在配制用于诊断 目的的标记物之后采集和获取。样本可以得自细胞群或预测患有疾病或为疾病表型的组 织。基因组DNA可以得自优质源,使得样本只含有所关注的组织类型、污染最低并且 DNA片段化最低。制备样本需要收集患者样本。本发明的方法中使用的患者样本是指疑似含有患 病细胞(例如,取自结肠样本内的原发肿瘤的上皮细胞或取自外科手术切缘的上皮细胞) 的样本。激光捕获显微切割(LCM)技术是选择待研究细胞的一种方式,该技术可以最大 限度减少因细胞异质性导致的变异性。因此,很容易检测正常细胞和癌细胞之间在基因 表达方面的中等或微小变化。样本也可以包括提取自周边血液的循环上皮细胞。这类样 本可以采用多种方法获得,但最优选的方法是美国专利6136182中描述的磁分离技术。 在已经获得含有所关注细胞的样本之后,提取和扩增DNA,并获得胞嘧啶甲基化谱图, 以用于适当组合中的基因。DNA甲基化及其相关方法在(例如)下列专利中有所讨论美国专利公 布 No.20020197639, 20030022215, 20030032026, 20030082600, 20030087258, 20030096289, 20030129620, 20030148290, 20030157510, 20030170684, 20030215842, 20030224040, 20030232351, 20040023279, 20040038245, 20040048275, 20040072197, 20040086944, 20040101843, 20040115663, 20040132048, 20040137474, 20040146866, 20040146868, 20040152080, 20040171118, 20040203048, 20040241704, 20040248090, 20040248120, 20040265814, 20050009059, 20050019762, 20050026183, 20050053937, 20050064428, 20050069879, 20050079527, 20050089870, 20050130172, 20050153296, 20050196792, 20050208491, 20050208538, 20050214812, 20050233340、20050239101、20050260630、20050266458、20050287553 以及美国专禾Ij No.5786146、 6214556、 6251594、 6331393 和 6335165。DNA修饰试剂盒可商购获得,这些试剂盒可以将具有未甲基化胞嘧啶的纯化基 因组DNA转化为缺少未甲基化胞嘧啶但具有额外的尿嘧啶的基因组。该处理方法是一个 两步骤的化学过程,其包括由亚硫酸氢盐催化的脱氨基反应步骤和由氢氧化钠催化的脱 磺酸基反应步骤。通常,脱氨基反应是在液体中进行,并通过在冰上孵育来 终止反应,然后加入柱结合缓冲液。固相结合和洗涤之后,洗脱DNA,并且在液体中进行脱磺酸基 反应。加入乙醇终止反应,然后通过沉淀净化修饰过的DNA。然而,可商购获得的两 种试剂盒(Zymo和Chemicon)都是在DNA结合到反应柱的情况下进行脱磺酸基反应,然 后通过洗涤反应柱终止反应。将处理过的DNA从反应柱上洗脱,准备进行MSP检测分 析。DNA分离步骤可以按照标准方案进行。DNA可以从任何合适的身体样本(例 如,来自组织的细胞(新鲜或固定样本)、血液(包括血清和血浆)、精液、尿液、淋巴 或骨髓)中分离。对于某些类型的身体样本,尤其是诸如血液、精液、尿液和淋巴之类 的液体样本,优选的是首先对样本进行处理,以富集某些细胞类型(如前列腺细胞)的浓 度。一种合适的富集方法涉及使用与磁珠结合的细胞特异性抗体和磁性细胞分离装置分 离所需细胞。在扩增步骤之前,优选地对分离的DNA进行处理,使得未甲基化的胞嘧啶转化 为尿嘧啶或能够与腺嘌呤形成碱基对的另一种核苷酸,而甲基化的胞嘧啶则保持不变或 转化为能够与鸟嘌呤形成碱基对的核苷酸。优选地,在对分离的DNA进行处理和扩增之后进行试验,以确认未甲基化的胞 嘧啶已经有效转化为尿嘧啶或能够与腺嘌呤形成碱基对的另一种核苷酸,而甲基化的胞 嘧啶则保持不变或有效转化为能够与鸟嘌呤形成碱基对的另一种核苷酸。优选地,对分离的DNA的处理涉及按照标准方案将分离的DNA与亚硫酸氢盐 反应。在用亚硫酸氢盐处理过程中,未甲基化的胞嘧啶转化为尿嘧啶,而甲基化的胞嘧 啶则保持不变。通过下列步骤可以验证未甲基化的胞嘧啶已经转化为尿嘧啶,而甲基化 的胞嘧啶保持不变G)用合适的限制性内切酶对处理和扩增后的DNA的等分试样进行 限制性酶切,所用限制性内切酶可以识别亚硫酸氢盐产生的或耐受亚硫酸氢盐的限制性 酶切位点;以及Gi)通过电泳评价限制性片段模式。作为另外一种选择,可使用靶向处 理过的DNA的特定区域(该区域的未甲基化胞嘧啶已转化为尿嘧啶,而甲基化胞嘧啶保 持不变)的特异性寡核苷酸进行差异杂交来加以验证。扩增步骤可以涉及聚合酶链反应 (PCR)扩增、连接酶链反应扩增等。优选地,扩增步骤按照PCR扩增的标准方案进行,在这种情况下,反应物通常 为合适的引物、dNTP和热稳定DNA聚合酶,并且反应条件为循环变化的温度和时间, 以交替进行双链变性、引物退火(如在高度严格的杂交条件下)和后续的DNA合成。为了实现用亚硫酸氢盐处理的DNA进行选择性PCR扩增,可利用弓I物和条件来 区分包含异常胞嘧啶甲基化位点的靶区与没有异常胞嘧啶甲基化位点的靶区。因此,为 了只扩增异常胞嘧啶甲基化发生的所述位点被甲基化的靶区,用于对亚硫酸氢盐处理过 的DNA退火的引物(即反向引物)可以包含位于其与甲基化胞嘧啶形成碱基对的位点处 的鸟嘌呤核苷酸。如果分离的DNA内的靶区在异常胞嘧啶甲基化发生的位点处具有未 甲基化的胞嘧啶核苷酸(该核苷酸经过亚硫酸氢盐处理已转化为尿嘧啶),此类引物将形 成失配。用于对相对链退火的引物(即正向引物)可以包含在对应于亚硫酸氢盐处理的 DNA内的甲基化胞嘧啶的位点的任何位点处的胞嘧啶核苷酸。扩增步骤用来扩增GST-Pi基因和/或其调 控旁侧序列内的靶区。调控旁侧序列 可以看作GST-Pi基因的5'和3'旁侧序列,该序列包括调控(单独或与另一个类似元件一起)GST-Pi基因表达的元件。可以通过不涉及选择性扩增的方法来检测异常胞嘧啶甲基化的位点,以对疾病 进行诊断或预后。例如,可以将寡核苷酸/多核苷酸探针设计为在采用亚硫酸氢盐处理 的DNA进行的杂交研究(如Southern印迹)中使用,该DNA在适当严格的杂交条件下, 选择性地仅与包含胞嘧啶异常甲基化位点的DNA杂交。作为另外一种选择,适当选择的 特征性限制性内切酶可用来产生区分包含胞嘧啶异常甲基化的位点的DNA和不包含该位 点的DNA的限制性片段模式。本发明的方法还可以包括将含核酸标本与修饰未甲基化胞嘧啶的试剂接触; 利用CpG特异性寡核苷酸引物扩增标本内的含CpG的核酸;以及检测甲基化的核酸。优 选的修饰为将未甲基化胞嘧啶转化为另一种核苷酸,以将未甲基化胞嘧啶和甲基化胞嘧 啶区分开。优选地,试剂将未甲基化胞嘧啶修饰为尿嘧啶,并且该试剂为亚硫酸氢钠, 然而,也可以使用修饰未甲基化胞嘧啶而不能修饰甲基化胞嘧啶的其他试剂。亚硫酸氢 钠(NaHSO 3)修饰是最优选的,亚硫酸氢钠很容易与胞嘧啶的5,6-双键反应,却很难 与甲基化胞嘧啶反应。胞嘧啶与亚硫酸氢根离子反应形成易发生脱氨基反应的磺化胞嘧 啶反应中间体,从而产生磺化尿嘧啶。碱性条件下可以去除磺酸基,从而导致尿嘧啶形 成。Taq聚合酶将尿嘧啶识别为胸腺嘧啶,因而在PCR之后所得产物只在起始模板内出 现5-甲基胞嘧啶的位置含有胞嘧啶。Scorpion报告基因和试剂以及其他检测体系也可以 类似地将以此方式处理过的修饰类与未修饰类区分开。在本发明中,用于对标本中修饰(例如用亚硫酸氢盐)之后的含CpG核酸进行 扩增的引物可特异性地识别未处理DNA、甲基化DNA和未甲基化DNA。在甲基化特异 性PCR(MSPCR)中,扩增未甲基化DNA的引物或引发序列优选地在3' CG碱基对内具 有T,以便将其与甲基化DNA内保留的C区分开,并且互补序列设计用于反义引物。扩 增未甲基化DNA的MSP引物或引发序列通常在序列中含有相对较少的C或G,因为正义 引物中不含C,反义引物中不含G(C被修饰为U(尿嘧啶),U又被扩增为扩增产物中的 T(胸腺嘧啶))。本发明的引物为具有足够长度和正确序列的寡核苷酸,以在多态性位点内的大 量核酸上特异性地引发聚合反应。当接触适当的探针或报告基因时,被扩增的序列显现 甲基化状态,从而提供诊断信息。优选引物最优选为能够引发引物延伸产物合成的八个 或更多个脱氧核苷酸或核糖核苷酸,该引物延伸产物与多态性位点链基本上互补。有利 于合成的环境条件包括存在核苷三磷酸和用于聚合反应的试剂(例如DNA聚合酶)以及 适当的温度与pH。引物或引发序列的引发片段优选为单链,以使扩增效率最大化,但 也可以为双链。如果为双链,则在用于制备延伸产物之前首先应处理引物,以分离两条 链。引物必须足够长,以在存在聚合反应诱发剂的情况下引发延伸产物的合成。引物的 精确长度取决于诸如温度、缓冲液、阳离子和核苷酸组合物之类的因素。寡核苷酸引物 最优选地含有约12-20个核苷酸,但也可以含有更多或更少核苷酸,优选根据熟知的设 计指南或准则设计。引物设计为与待扩增的基因组位点的每条链基本上互补,并且包含 上述适当的G或C核苷酸。这意味着引物必须具有足够的互补性,以便在允许聚合反应 试剂作用的条件下与它们各自的链杂交。换句话讲,引物应具有与5'和3'旁侧序列的 足够互补性,以便杂交并允许基因组位点扩增。引物用于扩增过程。也就是说,相对于所涉及的反应步骤数,反应(优选为酶链反应)产生更多靶位点。在最优选实施例中, 反应产生数量呈指数级增加的更多靶位点。诸如此类的反应包括PCR反应。通常,一 条引物与该位点的负(_)链互补,另一条引物与正(+)链互补。将引物与变性的核酸退 火之后,用诸如DNA聚合酶I大片段(Klen0w)之类的酶和核苷酸进行延伸,会产生含有 靶位点序列的新合成的+链和-链。链式反应的产物为离散的核酸双链,其末端对应于 所采用的特异性引物的末端。引物可以使用任何合适的方法制备,例如包括自动化方法在内的常规磷酸三酯 和磷酸二酯方法。在一个此类自动化实施例中,使用二乙基亚磷酰胺作为原料,并按照 Beaucage等人(1981)所述方法进行合成。美国专利No.4458066描述了一种用于在改性 的固体载体上合成寡核苷酸的方法。采自尿液或尿 道冲洗液的任何核酸标本,不论是否为纯化形式,都可以用作起 始核酸,前提是其包含或疑似包含含有靶位点(如CpG)的特异性核酸序列。因此,该方 法可以采用(例如)DNA或RNA(包括信使RNA)。DNA或RNA可以为单链或双链。 当RNA用作模板时,将采用最适于将模板反转录成DNA的酶和/或条件。此外,可以 采用含有各自的一条链的DNA-RNA杂合体。也可以采用核酸混合物,或者也可以采用 在上述扩增反应中使用相同或不同引物产生的核酸。待扩增的特异性核酸序列(即靶位 点)可以为大分子的一部分,或者可以最初以离散分子形式存在,以使得该特异性序列 构成整个核酸。如果提取的样本不纯,则可以在扩增之前用适量的试剂对样本进行处理,试剂 数量应可以有效裂开样本的细胞、流体、组织或动物细胞膜,并且可以暴露和/或分离 核酸的链。用以暴露和分离链的这一裂解和核酸变性步骤会使扩增更容易发生。当样本的靶核酸序列含有两条链时,需要在用作模板前将核酸的两条链分 离。链分离可以作为单独的步骤进行,或者与引物延伸产物的合成同时进行。链分 离可以采用多种合适的变性条件(包括物理、化学或酶方法)实现。一种分离核酸链 的物理方法涉及加热核酸直至其变性。典型的热变性可以涉及约80至105°C范围内的 温度和长达10分钟的加热时间。链分离也可以由被称为解旋酶的一类酶或RecA酶 诱发,RecA酶具有解旋酶活性,并且已知在存在riboATP的情况下也可以使DNA变 性。KuhnHoffmann-Berling(1978)描述了适合使用解旋酶对核酸解链的反应条件。 C.Radding(1982)综述了使用RecA的技术。这些技术的改进技术现在也为人们所熟知。当互补的核酸链被分离时,不论核酸原来是双链或是单链,分离后的链都适合 用作合成另外的核酸链的模板。这种合成在允许引物与模板杂交的条件下进行。通常, 合成是在缓冲的水溶液中进行,该缓冲的水溶液优选的pH值为7-9,最优选的pH值为约 8。在含有分离的模板链的缓冲液中优选地加入摩尔过量的两种寡核苷酸引物(对于基因 组核酸,引物与模板的比率通常为约108 1)。当本发明的方法用于诊断应用时,互补 链的数量可能是未知的,因此无法始终确切知道引物的数量相对于互补链的数量。然而 在实践中,当复杂核酸长链的混合物中含有待扩增序列时,所添加的引物的摩尔量通常 超出互补链(模板)的摩尔量。优选采用较大的摩尔过量,以提高该方法的效率。将足量的脱氧核苷三磷酸dATP、dCTP、dGTP和dTTP单独或与引物一起加入 合成混合物,并将所得溶液加热至约90-10(TC,加热时间最多10分钟,优选1至4分钟。加热之后,将溶液冷却至室温,以有利于引物杂交。向冷却的混合物中加入用于 进行引物延伸反应的适当的试剂(“聚合反应试剂”),并在本领域已知的条件下进行反 应。如果聚合反应试剂具有热稳定性,则也可以与其他试剂一起加入。该合成(或扩增) 反应可以在从室温到聚合反应试剂不再起作用的温度下进行。聚合反应试剂可以为会实 现引物延伸产物合成的任何化合物或体系,优选为酶。用于此目的的合适的酶包括(例 如)大肠杆菌DNA聚合酶1、大肠杆菌DNA聚合酶I的Klenow片段、T4DNA聚合酶、 其他可用的DNA聚合酶、聚合酶突变型、逆转录酶和其他酶,其中包括热稳定酶(例如 在经受足以引起变性的高温之后仍能进行引物延伸的酶)。优选试剂为Taq聚合酶。合 适的酶将有利于核苷酸以正确的方式组合,从而形成与每个位点核酸链互补的引物延伸 产物。通常,合成将在每个引物的3'端开始,并沿着模板链的5'端方向继续进行,直 到合成结束,产生不同长度的分子。然而,也可能存在在5'端开始合成并在其他方向继 续的聚合反应试剂,其方法与上述相同。最优选地,扩增方法为PCR扩增。只要使用本发明引物通过PCR扩增的甲基化 和未甲基化位点按照替代方式类似地扩增,也可以采用替代扩增方法。在一个此类最优 选的实施例中,检测分析法为巢式PCR法。在巢式PCR法中,进行了两个或更多个分阶 段的聚合酶链反应。在第一阶段聚合酶链反应中,采用一对寡核苷酸外引物扩增第一序 列,这对寡核苷酸外引物由分别与特定第一靶核苷酸序列两侧在5'和3'位置相连的上 下游引物组成。在后续阶段,利用第二组寡核苷酸内引物或巢式引物(也由上下游引物 组成)扩增包含在第一靶核苷酸序列内的较小的第二靶核苷酸序列。上下游内引物分别与第二靶核苷酸序列两侧在5'和3'位置相连。旁侧引物互 补于PCR过程中扩增的双链靶核苷酸序列的3'端部分的片段。第一阶段聚合酶链反应 中靶向扩增的基因区内的第一核苷酸序列旁侧的5'端上游位置连有上游引物和3'端下 游位置连有下游引物。第一靶核苷酸序列以及相应的第一阶段聚合酶链反应的扩增产物 具有预测的碱基对长度,该长度取决于外引物对的上游引物的5'端上游杂交位置与下游 引物的3'端下游杂交位置之间的碱基对距离。在第一阶段聚合酶链反应结束时,对所得混合物的等分试样继续进行第二阶 段聚合酶链反应。该反应优选地在密封或密闭的容器(例如得自Cepheid的“SMART CAP”装置)内自动进行。在第二阶段反应中,将第一阶段反应的产物与特异性内引物 或巢式引物相混合。这些内引物来自第一靶核苷酸序列内的核苷酸序列,并且连接于包 含在第一靶核苷酸序列内的较小的第二靶核苷酸序列两侧。对该混合物进行初始变性、 退火和延伸步骤,然后再进行与前述方式一样的热循环,从而可使第二靶核苷酸序列反 复进行变性、退火和延伸或复制。该第二靶核苷酸序列旁侧的5'端上游位置连有上游引 物和3'端下游位置连有下游引物。第二靶核苷酸序列以及相应的第二阶段PCR的扩增 产物也具有预测的碱基对长度,该长度取决于内引物对的上游引物的5'端上游杂交位置 与下游引物的3'端下游杂交位置之间的碱基对距离。扩增产物优选地用该产物的特异性探针或报告基因识别为甲基化或未甲基化 的,如美国专利4683195所描述。用于检测多核苷酸的探针和报告基因领域的进展是本 领域的技术人员所熟知的。任选地,可通过 其他技术(例如限制性内切酶酶切和Southern印迹分析)验证核酸的甲基化模式。可用来检测5' CpG甲基化的甲基化敏感限制性内切酶的例子包括 SmaK SacIK EagK MspK HpaIK BstUI 禾P BssHII。在本发明的另一方面,采用甲基化比率。这可通过确定所得标记物的扩增的甲 基化类与扩增的基准标记物或扩增的未甲基化标记物区域的数量之间的比率来进行。采 用甲基化比率时,最好使用定量实时PCR。高于已确定或预定的截止值或阈值的比率将 视为高甲基化并表征患有诸如癌症(对于GSTPl来说为前列腺癌)之类增生性疾病。按 照已知的方法确定截止值,这些方法用于至少两组样本具有已知的疾病状态的样本和具有已知的正常状态的样本。本发明的基准标记物也可以用作内参。基准标记物优选为 在样本的细胞内组成型表达的基因,例如β肌动蛋白基因(β-Actin)。确定值或预定值(截止值或阈值)也可以在根据本发明的不使用比率的方法中确 定和使用。在这种情况下,截止值是相对于某些基线值而确定的甲基化数量或程度,其 中基线值的例子有正常样本的甲基化数量或程度、或者癌症在临床上不明显(被认为 未发展到临床上显著的状态或非侵袭性)的样本的甲基化数量或程度。就像其在基于甲 基化比率的方法中的应用一样,这些截止值是按照熟知的方法确定的。由于与标记物相关的基因的转录水平降低往往是由多核苷酸序列和/或表达控 制序列(如启动子序列)的特定元件的高甲基化引起,制备了为匹配这些序列而制备的引 物。因此,本发明提供了通过检测特定区域(优选地在标记物的表达控制区或启动子区 内)的甲基化而检测或诊断细胞增殖疾病的方法。在此类诊断或预后方法中可以使用用 于检测这些区域的甲基化的探针。本发明的试剂盒可由多种组分构成,前提条件是这些组分都含有至少一种引物 或探针或检测分子(如Scorpion报告基因)。在一个实施例中,试剂盒包括用于扩增和检 测甲基化标记物片段的试剂。任选地,试剂盒包括样本制备试剂和/或制品(如试管), 以从样本提取核酸。在优选试剂盒中,包括了一管式MSP所需的试剂,例如,对应的PCR引物组、 热稳定DNA聚合酶(如Taq聚合酶)和合适的检测试剂(如水解探针或分子信标)。在 任选的优选试剂盒中,检测试剂为Scorpion报告基因或试剂。也可以使用单染料引物或 双链DNA特异性荧光染料(例如溴化乙锭)。引物优选为产生高浓度的量。试剂盒中的 额外材料可以包括合适的反应试管或管形瓶、屏蔽组分,通常是蜡珠,任选包括镁; 必要的缓冲液和试剂,例如dNTP;可用于MSP反应的对照核酸和/或任何额外的缓冲 液、化合物、辅因子、离子组分、蛋白质和酶、聚合物等。可任选地,试剂盒包括核酸 提取试剂和材料。生物标记为核酸/蛋白质指示标记物的任何标记。核酸可以为本领域已知的任 何核酸,包括(但不限于)细胞核、线粒体(同质、异质)、病毒、细菌、真菌、支原 体等的核酸。标记可以为直接或间接的,并且可在给定生理参数条件下以及与内参、安 慰剂、正常组织或另一恶性肿瘤进行比较时,测量基因过表达或低表达。生物标记包 括(但不限于)核酸和蛋白质(均有过表达和低表达以及直接和间接之分)。使用核酸 作为生物标记的方法可以包括本领域已知的任何方法,包括(但不限于)测量DNA的扩 增、缺失、插入和复制;测量RNA;测量微RNA(miRNA);测量杂合性丢失(LOH); 直接或经基因组扩增后测量单核苷酸多态性(SNPs,Brookes(1999)),拷贝数多态性(CNPs);测量微卫星DNA ;测量表观遗传改变(例如DNA高甲基化或低甲基化)和 FISH。使用蛋白质作为生物标记的方法包括本领域已知的任何方法,包括(但不限于) 测量数量、活性、修饰(例如糖基化、磷酸化、ADP核糖基化、泛素化等)或免疫组织化 学(IHC)和代谢周转。其他生物标记包括成像、分子谱、细胞计数和细胞凋亡标记物。当标记基因含有SeqJD No.指定的序列时,其对应于该序列。当基因区段或片 段含有足以表明其为该基因序列的一部分参考序列或其互补序列时,其对应于此基因序 列。当基因表达产物中的RNA、mRNA或cDNA杂交到含有此序列(如探针)的组合物 上时,其对应于此序列,或者对于肽或蛋白质来说,其被该mRNA编码。当基因表达产 物的区 段或片段含有足以表明其为该基因序列或基因表达产物序列的一部分参考基因表 达产物或其互补序列时,其对应于此基因序列或基因表达产物序列。本说明书所描述和受权利要求书保护的本发明的方法、组合物、制品或试剂盒 包括一种或多种标记基因。在整个本说明书中使用的“标记物”或“标记基因”是指 对应于如下任何基因的基因或基因表达产物该基因的过表达或低表达与指示或组织类 型相关。建立基因表达谱的优选方法包括测定RNA的量,该RNA由能够编码蛋白质或肽 的基因生成。此测定通过反转录PCR(RT-PCR)、竞争性RT-PCR、实时RT-PCR、差异 显示RT-PCR、Northern印迹分析和其他相关的测试实现。虽然可以采用单个PCR反应来 实施这些技术,但最好扩增由mRNA产生的互补DNA(cDNA)或互补RNA(cRNA),并 使用微阵列对其进行分析。多种不同的阵列构型及其制备方法是本领域的技术人员已知 的,并在如下专利中有所描述,例如5445934、5532128、5556752、5242974、5384261、 5405783, 5412087, 5424186, 5429807, 5436327, 5472672, 5527681, 5529756, 5545531、 5554501、 5561071、 5571639、 5593839、 5599695、 5624711、 5658734 和 5700637。微阵列技术允许同时测量数千种基因的稳态mRNA水平,从而提供了识别细胞 增殖失控的效应(如启动、阻滞或调控)的强大工具。目前广泛使用的微阵列技术有两 种。第一种是cDNA阵列,第二种是寡核苷酸阵列。虽然这些芯片的构造存在差异,但 是基本上所有的下游数据分析和输出都是相同的。这些分析的结果通常为接收自标记探 针的信号的强度的测量值,该标记探针用于检测来自样本的cDNA序列,该cDNA序列在 微阵列的已知位置上与核酸序列杂交。信号强度通常与cDNA的量成比例,因此也与在 样本细胞中表达的mRNA成比例。大量的此类技术是可得的并且可用的。用于确定基 因表达的优选方法可见于美国专利6271002、6218122、6218114和6004755。通过比较此类信号强度可以分析表达水平。完成该比较最好的方式是生成试验 样本与对照样本中基因表达强度的比率矩阵。例如,可以将来自患病组织的基因表达强 度与相同类型的良性或正常组织产生的表达强度进行比较。这些表达强度的比值反映了 试验样本和对照样本之间在基因表达上的倍数变化。选择可以基于产生序列表的统计试验,该序列表与肿瘤起源的原发部位相关的 因子之间的每个基因的差异表达的显著性证据有关。此类试验的例子包括ANOVA和 Kraskal-Wallis。列表中的名次可以作为模型中的权重,该模型设计用于将这种权重总和 (最多到截止值)解释为有利于一类而不利于另一类的优势证据。文献中描述的之前的证据也可以用来调整权重。优选的实施 例通过识别稳定的对照组,并将此组换算成所有样本之间的方差为 零,从而将每个测量值归一化。将该对照组定义为受测定的系统误差影响并且已知不会 独立于该误差而改变的任何单个内源转录物或内源转录物组。所有标记物都通过产生零 方差的样本特异性因子调整,以用于对照组的任何描述性统计量(如平均值或中值)或用 于直接测量。作为另外一种选择,如果对照组方差只与系统误差有关的假设不真,而进 行归一化时所得分类误差较小,则对照组仍然按照规定使用。非内源峰值对照也可能是 有用的,但不是优选的。基因表达谱可以多种方式显示。最常见的方式是将原始荧光强度或比率矩阵 布置到树状图中,其中列表示试验样本,行表示基因。如此布置数据可以使有相似 表达谱的基因彼此相邻。每个基因的表达比率用颜色来直观表示。例如,小于1的 比率(下调)出现在图谱的蓝色部分,而大于1的比率(上调)出现在图谱的红色部 分。可商购获得的计算机软件程序可用于显示此类数据,这些计算机软件程序包括
“Genespring" (SiliconGenetics, Inc.)禾口 ‘‘Discovery” 与"Infer" (Partek, Inc.)。就测量蛋白质含量来确定基因表达而言,本领域任何已知的方法都是合适的, 只要其可导致足够的特异性和灵敏度。例如,可通过使蛋白质结合至该蛋白质特异性的 抗体或抗体片段,并测量抗体结合的蛋白质的量来测量蛋白质含量。可用放射性荧光试 剂或其他可检测试剂标记抗体,以方便检测。检测方法包括(但不限于)酶联免疫吸附 测定法(ELISA)和免疫印迹技术。在本发明的方法中使用的调控基因在“实例”中有所描述。相对于不同起源恶 性肿瘤患者而言,差异表达的基因在特定起源恶性肿瘤患者中或者上调或者下调。上调 和下调为相对术语,其表示基因表达量相对于某些基线存在可识别差值(超出用来测量 的系统中的噪音的贡献)。在这种情况下,根据算法确定基线。然后使用相同的测量方法 可测得患病细胞中所关注的基因相对于基线水平或者上调或者下调。在上下文中,“患 病的”是指由细胞不可控制的增殖引起的阻断或干扰或潜在干扰机体功能正常发挥的机 体状态变化。当某人的基因型或表型的某些方面与疾病的存在相符时,此人被诊断为患 有此疾病。然而,进行诊断或预后的行为可以包括确定疾病/状况事宜,例如确定复发 可能性、治疗类型和治疗监控。在治疗监控中,通过比较基因表达随时间的变化,确定 是否基因表达谱已经变化为或正变化为更符合正常组织的模式,从而就给定疗程的效果 做出临床判断。可以对基因进行分组,以便获得的关于在此组中基因集合的信息提供作出临床 相关判断(例如诊断、预后或治疗选择)的重要依据。这些基因集合构成本发明的组合。 对于大部分诊断标记物,通常希望使用足以作出正确医疗判断的数量最少的标记物。这 样可以防止为等待进一步分析而延误治疗,并防止无谓地浪费时间和资源。确定基因表达组合的一种方法是通过使用优化算法,例如在确定股票投资组合 时广泛使用的均值方差算法。该方法在20030194734中有详细描述。基本上,该方法 需要确定一组输入值(金融应用中的股票,此处则为用强度衡量的表达),该输入值会 优化使用它所获得的收益(如产生的信号),同时又使收益的不确定性最低。许多商业 软件程序可以进行这种运算。优选使用本说明书中称为“Wagner软件”的“WagnerAssociatesMean-Variance Optimization Application” (Wagner Associates 均值-方差优化应 用程序)。该软件使用 “Wagner Associates Mean—VarianceOptimization Library” (Wagner Associate s均值-方差优化库)中的函数确定有效边界,优选采用马可维茨理论中的优化 投资组合(Markowitz(1952))。使用这类软件需要转化微阵列数据,以便以股票收益方 式将该数据作为输入处理,并且在该软件用于所需财务分析目的时,需要使用风险测量 值。选择组合的方法也可以包括启发式规则的使用。优选地,在生物学基础上和为 得出临床结果而对该技术的理解的基础上制定启发式规则。更优选地,将这些规则用于 优化方法中的输出。例如,可以将选择组合的均值-方差方法应用于在患有癌症的受试 者中差异表达的多种基因的微阵列数据。该方法的输出将为最优基因集,该基因集可 以包括表达于周边血液和患病组织的某些基因。如果试验方法中使用的样本采自周边血 液,并且差异表达于癌症病例中的某些基因,也可以差异表达于周边血液,则可以应用 启发式规则,其中组合选自不包括差异表达于周边血液的那些样本的有效边界。当然, 也可以在形成有效边界之前应用该规则,例如,在数据预选过程中应用该规则。可以使用未必与所考虑的生物学相关的其他启发式规则。例如,可以应用这样 一条规则,即只有指定百分比的组合可以由特定的基因或一组基因表示。可商购获得的 软件(例如Wagner软件)很适合这些类型的启发式方法。例如,当除了准确度和精度 之外的因素(如预期许可费)对是否愿意包括一个或多个基因有影响时,这种方法是可用 的。本发明的基因表达谱也可以结合在癌症诊断、预后或治疗监控方面有用的其他 非基因诊断方法一起使用。例如,在一些情况下,将上述基于基因表达的方法的诊断作 用与来自诸如血清蛋白质标记物(如癌症抗原27.29 ( "CA 27.29"))之类的常规标记物 的数据结合具有有益效果。存在一系列此类标记物,其中包括诸如CA 27.29之类的被分 析物。在一种此类方法中,从接受治疗的患者体内定期采集血样,然后对血样进行有关 上述一种血清标记物的酶免疫分析。当标记物浓度显示肿瘤复发或治疗失败,则采集适 于基因表达分析的样本来源。当存在可疑肿块时,则通过细针穿刺术(FNA)采样,然后 再按上述方法分析从肿块中抽取的细胞的基因表达谱。作为另外一种选择,可以从之前 移除肿瘤的组织的邻近区域采集组织样本。当其他试验会得到含混结果时,该方法尤其 有用。分离核酸和蛋白质的方法是本领域熟知的。参见(例如)可见于万维网上的 Ambion网址和美国专利20070054287中的有关RNA的讨论。DNA分析可以为本领域已知的任何方法,包括(但不限于)甲基化、去甲基 化、染色体核型分析、倍体分析(非整倍体、多倍体)、DNA完整性分析(通过凝胶或 分光光度测定评价)、易位、突变、基因融合、活化-钝化、单核苷酸多态性(SNPs)、 拷贝数或用于检测基因构成的全基因组扩增。RNA分析包括本领域已知的任何方法,包 括(但不限于)q-RT-PCR、miRNA或转录后修饰。蛋白质分析包括本领域已知的任何 方法,包括(但不限于)抗体检测、翻译后修饰或代谢周转。蛋白质可以为 细胞表面标 记物,优选为上皮、内皮、病毒或细胞型。生物标记可以与病毒/细菌感染、侵害或抗 原表达有关。
根据本发明制备的试剂盒包括用于确定基因表达谱的格式化检测分析法。这些 试剂盒可以包括进行检测分析所需的一些或全部材料,例如试剂和指令以及在其中进行 生物标记检测分析的介质。本发明的制品包括可用于治疗、诊断、预后和以其他方式评估疾病的基因表达 谱的表现形式。这些基因表达谱的表现形式被压缩到可以由设备自动读取的介质中,例 如计算机可读介质(磁性介质、光学介质等)。该制品也可以包括评估该介质中的基因表 达谱的指令。例如,该制品可以包括CD ROM,该CD ROM具有比较上述基因组合的基 因表达谱的计算机指令。该制品也可以将基因表达谱以数字形式记录在其中,以便将其 与得自患者样本的基因表达数据进行比较。作为另外一种选择,基因表达谱可以不同的 表示格式进行记录。图 像记录是一种此类格式。聚类算法(例如上述得自Partek,Inc. 的“DISCOVERY”和“INFER”软件中所包括的)是可视化此类数据的最佳辅助工具。根据本发明的不同类型的制品为用来显示基因表达谱的介质或格式化检测分析 法。这些制品可以包括(例如)微阵列,在微阵列中互补序列或探针固定到矩阵上,而表 征所关注基因的序列与固定有互补序列或探针的矩阵结合,从而形成对其存在的可读判 定。作为另外一种选择,根据本发明的制品可以制成试剂盒,该试剂盒用于进行杂交、 扩增和产生表征所关注基因表达水平的信号,以检测癌症。本专利申请的GSTPl检测分析在测定样本中表现出大幅改善的检测分析性能。 将相同基因(GSTPl)的一种以上设计组合使用,表现出临床灵敏度更高,同时具有极高 的特异性。将相同基因的两种检测分析组合,可提供了更简单的解决方案,以极高特异 性在给定多重检测分析中靶向较少的基因实现更高的临床灵敏度。GSTPl多重检测分析 设计的良好检测分析性能使得可以从多重检测分析中除去其他标记基因,从而提高特异 性。在高特异性下改善的临床灵敏度会产生更好的阴性预测值和阳性预测值。提供了下面的实施例以举例说明本发明而不是限制本发明。实例 1在FFPE组织样本中对两种新设计(形式2和形式3)与现有设计(形式1)进行 了比较。所有三种设计均在下表1中示出。表1.GSTP1检测分析设计的描述
权利要求
1.一种前列腺癌检测分析法,具有用于检测多个甲基化位点的试剂,其中每个靶标 指向相同基因的不同部分。
2.根据权利要求1所述的检测分析法,其中所述基因为GSTPl。
3.根据权利要求2所述的检测分析法,其中至少一个甲基化位点在启动子区。
4.根据权利要求2所述的检测分析法,其中两个或更多个甲基化位点在启动子区。
5.根据权利要求1所述的检测分析法,其中试剂检测至少三个不同的甲基化位点。
6.根据权利要求1所述的检测分析法,具有仅用于检测多个甲基化位点的试剂,所述 多个甲基化位点指向相同基因的不同部分。
7.根据权利要求6所述的检测分析法,其中所述基因为GSTPl。
8.根据权利要求7所述的检测分析法,其中至少一个甲基化位点在启动子区。
9.根据权利要求7所述的检测分析法,其中两个或更多个甲基化位点在启动子区。
10.根据权利要求7所述的检测分析法,其中试剂检测至少三个不同的甲基化位点。
11.一种前列腺癌检测分析法,具有用于检测多个甲基化位点的试剂,其中所述多个 甲基化位点包括Seq.ID No.2和Seq.ID No.4。
12.根据权利要求12所述的检测分析法,还包括用于检测多个甲基化位点的试剂,其 中所述多个甲基化位点包括Seq.ID No.6。
13.—种前列腺癌检测分析法,具有用于检测多个甲基化位点的试剂,其中所述多个 甲基化位点包括Seq.ID No.2和Seq.ID No.6。
14.根据权利要求13所述的检测分析法,还包括用于检测多个甲基化位点的试剂,其 中所述多个甲基化位点包括Seq.ID No.4。
15.一种试剂盒,包含用于检测来自相同基因的多个甲基化核苷酸序列的试剂和转化 试齐LU
16.根据权利要求15所述的试剂盒,其中所述转化试剂包括亚硫酸氢钠。
17.根据权利要求16所述的试剂盒,其中所述基因为GSTPl。
18.根据权利要求16所述的试剂盒,其中所述试剂设计成与FFPE组织样本一起使用。
19.根据权利要求18所述的试剂盒,其中所述样本为前列腺样本。
20.根据权利要求16所述的试剂盒,其中所述试剂设计成与尿液样本一起使用。
全文摘要
本发明描述了一种用于检测前列腺癌的检测分析法,包括用于检测多个甲基化标记物的试剂,所述多个甲基化标记物来自诸如GSTP1的一种基因内。
文档编号C12Q1/68GK102016067SQ200980107428
公开日2011年4月13日 申请日期2009年1月19日 优先权日2008年1月22日
发明者A·马宗德, J·F·巴登, J·M·瓦戈, S·A·瓦德 申请人:维里德克斯有限责任公司