专利名称:患者的基于基因的算法型癌症预后和临床结果的制作方法
技术领域:
本发明涉及用于改善患者的癌症预后和临床结果的新方法和工具。
背景技术:
成千上万基因的mRNA表达水平的微阵列模型分析或评估已经表明可以通过某些基因的表达水平将癌症分成不同的分子亚组。这些亚组看来具有不同的临床结果,并且还 可能对癌症治疗中所用的不同治疗剂有不同的响应。但是目前对基础生物学的了解不允许 特定癌症患者护理的“个体化”。因此,例如,对于乳腺癌,如今给予许多女性全身性治疗, 如化疗或内分泌疗法,试图来降低其初次诊断后乳腺癌复发的风险。不幸地,这种全身性治 疗仅仅对少数将会复发的女性有益,因此使许多女性暴露于不必要的且具有潜在毒性的治 疗。使用微阵列技术研发的新预后工具显示出允许我们推动乳腺癌患者定制治疗的可能。 这些基因组工具可能是非常需要的优于目前所用临床方法的改进。长期以来公认乳腺癌的组织学分级可提供重要的临床预后信息。然而,尽管美 国病理学家学院(College of American Pa thologists)推荐使用肿瘤等级作为乳腺 癌的预后因子,但最新的服务于美国癌症联合委员会(American Joint Committee on Cancer(AJCC)的乳腺特别工作组(Breast Task Force)没有将该等级包括在其分级标准 中,因此将难以克服机构之间的不一致性和缺少数据。这可能部分地与观测者之间的可变 性和所用的各种分级方法有关,导致机构间的可重复性低。随着标准化方法,如Elston和 Ellis研发的那些方法(Histopathology 19 (5)p. 403-410 (1991))的出现,机构之间的一 致性已经得到改善。然而,虽然等级1(低风险)和等级3(高风险)明显地与不同的预后 相关,但是归类为中间等级的肿瘤在为治疗做出的临床决定中出现困难,因为它们的存活 特征与总的(未分级)群体的存活特征没有不同并且它们的比例很大(40-50%)。更精确 的分级系统将考虑到女性的更好的预测以及改进的选择以适合于进一步的乳腺癌治疗。目前诊断的大多数乳腺癌是激素响应性的。他莫西芬目前是这些患者的辅助治疗 中最常见的抗雌激素药。在这种情况下给予他莫西芬时,这些患者中仍有高达40%将会复 发。目前,由于在评价芳香酶抑制剂替代他莫西芬使用或在辅助情况下与他莫西芬结合或 顺次使用的几个大型试验中的阳性结果,因此对于患有激素响应性乳腺癌的绝经后女性存 在许多选择。此外,不清楚哪种治疗选择是最佳的,尤其是在芳香酶抑制剂使用的长期健康 代价未知的情况下。鉴定给予他莫西芬时处于复发高风险的组的能力有助于鉴定出他莫西 芬对其可能不是最好选择的患者。因而这些患者可能是备选治疗策略的特定目标。因此,需要可以精确地评价预后并因此帮助肿瘤学家对个体癌症患者定制他们的 治疗决定的方法和系统。特别地,需要针对乳腺癌患者的方法和系统。发明目的本发明的目的在于提供用于获得癌症预后和/或用于获得临床结果,优选是癌症 (人)患者,尤其是通过(用)抗雌激素化合物或芳香酶抑制剂治疗的患者的存活结果的方 法和工具,该方法和工具不存在现有技术的方法和工具的缺陷或其可改进现有技术的方法 和工具。
发明概述本发明涉及基因集,其包含至少一个、两个、三个选自基因序列CCNB1、CCNA2、 ⑶C2、⑶C20、MCM2、MYBL2、KPNA2和STK6的基因序列,优选四个、五个、六个、七个或八个(但 不超过八个)基因序列,或其特定区域(探针或引物序列),其出乎意料地足以用于进行基 因表达分析,以获得癌症(尤其是乳腺癌)的有效的预后和诊断。本发明的基因集还出乎意料地足以用于获得临床结果,优选患有癌症的患者(人 患者),尤其是通过(用)抗雌激素化合物和/或芳香酶抑制剂(激素疗法)治疗的患者 的 存活结果。发明人已经鉴定出该基因集足以用于通过基因表达分析获得抗肿瘤治疗功效的 预测(和计算给予选择性抗肿瘤化合物治疗后的复发评分)。本发明的这种基因集可以用于以下方法中的基因表达分析,该方法用于选择将应 用于该患者的最合适且有效的治疗,用于避免对该组患者进行激素治疗,其中这种激素治 疗对于这些呈现ER+型乳腺癌或ER-型乳腺癌的患者的治疗是无效的。发明人还出乎预料地发现了其他增殖基因序列可以用于获得功效的预测(和将 该治疗的复发评分与选择性抗肿瘤化合物相关联),尤其是使用文献W02006/119593中所 述的基因集的序列和方法,尤其是通过使用基于基因表达等级指数(GGI)分析的预后方 法。优选地,在本发明中,该基因集包含至少四个(但低于八个)选自CCNB1、⑶C2、 CDC20、MCM2、MYBL2、CCNA2、STK6 和 KPNA2 基因序列的基因序列。优选地,该基因集包含这些中的至少四个基因,更优选仅由CCNB1、⑶C2、⑶C20和 MCM2四个基因序列集成或更优选仅由四个基因序列⑶C2、⑶C20、MYBL2和KPNA2或这些序 列的特定部分(探针、引物等)组成。因此,该基因集可以包含基因序列⑶C2、⑶C20、KPNA2 和MYBL2 (这最后一个序列可能由CCNB1、MCM2、STK6或CCNA2来替换),或基因序列CDC2、 CDC20、KPNA2、MYBL2和一个、两个、三个或四个选自CCNB1、MCM2、STK6和CCNA2基因序列的 基因序列。这些基因序列在肿瘤样品中的表达分析足以用于获得将应用于患有癌症(尤其 是乳腺癌,更优选为ER+型乳腺癌)的患者(人患者)的治疗有效的预后和诊断以及的预 测。这些基因的表达分析还表示将应用于(或避免)患有ER-型乳腺癌的患者(人患 者)的治疗的预测。该基因的特征可以在各种数据库中找到,例如,在网站www. genecards. org λ www. genenames. org、www· ncbi. nlm. nih. gov 上。这些基因呈现以下特征MYBL2 (Ref seq :NM_002466) :V_myb成髓细胞瘤病毒致癌基因同系物(鸟类)-样2 是转录因子基因MYB家族的成员,即细胞周期进展中所涉及的核蛋白。所编码的蛋白在细 胞周期的S-期过程中通过细胞周期蛋白A/细胞周期蛋白-依赖性激酶2得到磷酸化并同 时具有激活剂和抑制剂活性。已经表明其能激活细胞分裂周期2、细胞周期蛋白Dl和胰岛 素样生长因子-结合蛋白5基因。该基因可以存在转录子变体,但尚未确定它们的全长性 质。KPNA2 (Refseq :XM_001133253)核胞浆转运蛋白α 2涉及蛋白输入核被膜中。KPNA2还是细胞周期关卡介质的调控剂并可在V(D) J重组中起作用。CDC2(也称为Cdkl) (Refseq :NM_001786)细胞分裂周期2蛋白是Ser/Thr蛋白激 酶家族的成员。该蛋白是称为M-期促进因子(MPF)的高保守蛋白激酶复合物的催化亚基, 其对于真核细胞周期的G1/S和G2/M期的转变是必需的。有丝分裂细胞周期蛋白稳定地结 合该蛋白并作为调控亚基。该蛋白的激酶活性受到细胞周期中细胞周期蛋白的累积和破坏 的调控。该蛋白的磷酸化和去磷酸化也在细胞周期控制中起重要作用。
⑶C20 (Refseq :NM_001255)细胞分裂周期20同系物(酿酒酵母)似乎作为调控 蛋白在细胞周期的多个点与几种其他的蛋白相互作用。这是以下两种微管依赖性过程所需 的,细胞分裂后期之前的核移动和染色体分离。STK6 (也称为Aurora激酶A) (Refseq :NM_003600)是有丝分裂丝氨酸/苏氨酸激 酶家族的成员。其涉及有丝分裂和减数分裂期间的重要过程,其正确的功能是健康细胞增 殖所必需的。Aurora A通过一个或多个磷酸化作用来激活并且其活性在细胞周期的G2期 至M期转换的过程中达到峰值。CCNBl (Refseq :NM_031966)细胞周期蛋白Bl是参与有丝分裂的调控蛋白。该基 因产物与P 34(cdc2)复合,以形成成熟促进因子(MPF)。已经发现了两种可替换的转录子, 即组成型表达的转录子和细胞周期调控的转录子,其主要在G2/M期过程中表达。使用交替 转录起始位点获得不同的转录子。CCNA2 (Refseq :NM_001237)属于高保守细胞周期蛋白家族的细胞周期蛋白A2, 该家族成员的特征在于细胞周期中蛋白丰度鲜明的周期性。细胞周期蛋白起CDK激酶的调 控剂作用。不同的细胞周期蛋白呈现截然不同的表达和降解模式,这有助于每个有丝分裂 事件的时间协调。与只存在于生殖细胞中的细胞周期蛋白Al相反,该细胞周期蛋白在所有 测试的组织中表达。该细胞周期蛋白结合并激活CDC2或CDK2激酶,并因此促进细胞周期 G1/S和G2/M转换。MCM2 (NM_004526)微小染色体维持缺陷蛋白2(mitotin)是参与真核细胞基因组 复制启动的高保守微小染色体维持蛋白(MCM)中的一种。通过MCM蛋白形成的六聚蛋白复 合物是复制前复合物(pre-RC)的关键组分并涉及复制叉的形成和其他DNA复制相关蛋白 的补充。该蛋白与MCM 4、MCM 6和MCM 7形成复合物并显示出能调节复合物的解螺旋酶活 性。该蛋白是磷酸化的并因此受蛋白激酶CDC2和CDC7的调控。有利地,基因序列集可包括在检测试剂盒或设备中,该试剂盒或设备可以(进一 步)包括以下SEQ ID NO :1至SEQ ID NO :16的引物序列和可能的一种或多种用于检测(存 在于生物样品中的这些基因的扩增)的元件(回路、缓冲液、聚合酶,...)。根据本发明的检测试剂盒或设备或根据本发明的基因序列集还可以包括用作参 照基因的其他标准化基因序列。优选,这些基因序列选自TFRC、⑶S、RPLP0*TBP。这些 基因的特征可以在各种数据库中找到,例如,在网站www. genecards. org、www. genenames. org、www. ncbi. nlm. nih. gov 上。有利地,用于这些基因序列扩增的引物序列也存在于根据本发明的试剂盒中,优 选它们具有SEQ ID NO 17至SEQ ID NO 24的序列。可以将该基因序列集的基因序列(探针)结合到作为阵列并存在于检测试剂盒 或设备中的固体支持物(微孔平板、平板、玻璃或塑料材料的珠子、滤器、膜等)表面上,该试剂盒或设备可能包括用于基因扩增的工具和介质,如实时PCR工具和介质(优选用于 qRT-PCR 扩增)。本发明还涉及一个或多个以下SEQ ID NO :1至SEQ ID NO :16的引物序列,用于优 选存在于本发明试剂盒或设备中的一个或多个基因序列的特异性扩增。根据本发明的试剂盒(或设备)或基因序列集还可以包括一个或多个用作参照的 其他标准化基因序列。优选地,这些参照基因序列选自基因序列TFRC、⑶S、RPLP0和TBP及 其特定部分。有利地,用于这些参照序列扩增的引物序列SEQ ID N0:17至SEQ ID NO 24 也存在于根据本发明的试剂盒或设备中。该试剂盒或设备可以进一步包括计算机化系统,其包括结合于作为阵列和处理模块的固体支持物表面上的该基因序列集的基因序列,优选将该系统进行配置,以基于互补 结合序列的基因表达来计算基因表达等级指数(GGI)或可能的复发评分(RS),并可能用于 产生该肿瘤样品的风险评估,如W02006/119593中所述的。本发明还涉及通过获自肿瘤样品的核苷酸序列之间的结合来获得样品中核苷酸 序列的基因表达的方法,该肿瘤样品具有一个或多个,优选两个、三个、四个、五个、六个、七 个或八个选自上述八个或四个基因的基因序列或其特定部分(探针、引物,...),更优选 CCNBl、CCNA2、CDC2、CDC20、MCM2、MYBL2、KPNA2 和 STK6,更特别地为 CCNBl、CDC2、CDC20、 MCM2或CDC2、CDC20、MYBL2和KPNA2基因序列或其部分,或一个或多个SEQ ID NO :1至SEQ ID NO :16的引物序列,可能与一个或多个用于优选存在于根据本发明的试剂盒中的这些参 照基因序列扩增的引物序列SEQ ID N0:17至SEQ ID NO :24相结合,用于获得肿瘤样品的 预后、诊断或临床结果。因此,根据通过样品中存在的核苷酸序列与根据本发明的基因集序列之间的结合 获得的该检测结果(基因表达),可以将这些检测步骤与合适治疗的选择步骤相结合,该治 疗将应用于从中获得该样品的患者。优选地,根据本发明的方法是基于遗传扩增(优选通过PCR),优选基于使用上述 引物序列的qRT-PCR,上述引物序列允许本发明的基因核苷酸集的优选核苷酸序列(mRNA) 或其互补链的扩增。本发明的另一个方面涉及一种包括以下步骤的方法(a)测量获自哺乳动物患者(优选人患者)的用于接受分析的肿瘤样品中的基因 表达;(b)利用以下公式计算肿瘤样品的基因表达等级指数(或基因组等级)(GGI)~ Σ^ JeG3 JeGx其中χ是mRNA的基因表达水平,G1和G3是分别在组织学等级1 (HGl)和组织学 等级3(HG3)中上调的基因集,优选是本发明的基因集,而j指的是探针或探针集,其中该基 因集包含或对应(由其组成)本发明的基因(序列)集,(c)可以根据从该肿瘤样品获得的基因表达等级指数(GGI)选择将应用于已从中 获得该样品的人患者的合适治疗。该肿瘤样品可以是ER+型乳腺癌或ER-型乳腺癌。在该方法中,根据本发明的试剂盒或设备,接受诊断的肿瘤(癌症)样品获自患有癌症的组织,所述癌症选自乳腺癌、结肠癌、肺癌、前列腺癌、肝细胞癌、胃癌、胰腺癌、宫颈 癌、卵巢癌、肝癌、膀胱癌、尿道癌、甲状腺癌、肾癌、癌、黑素瘤或脑癌。优选,该肿瘤样品是 乳腺肿瘤样品(更优选鉴定为等级HG2、HG1或HG3的组织学乳腺肿瘤样品)。样品也可以 是(早期乳腺癌(BC))患者的冷冻(FS)或干燥的肿瘤样品(石蜡包埋的肿瘤样品(FFPE))。这些方法、试剂盒或设备可以进一步基于基因表达等级指数(GGI)将肿瘤样品标 示为低风险(GG1)或高风险(GG3)。该实施方案可以进一步包括给患者提供乳腺癌治疗方 案,该治疗方案与接受分析的乳腺肿瘤样品的低风险或高风险标示相适。基因表达等级指数GGI可以包括选择的截留值(cutoff)和标度值(scale),使得 HG1病例的平均GGI为约-1,而HG3病例的平均GGI为约+1。对于从应用不同标度的不同 平台所获数据的校准需要截止值 &基因集可以包括至少一个选自标示为“在等级1肿瘤中上调的”基因的基因(参 见TO2006/119593)。G3基因集可以包括至少一个,优选至少两个、三个、四个、五个、六个、 七个或八个选自本发明基因集基因的基因。在本发明的另一个方面,根据本发明的方法包括以下步骤(a)测量肿瘤样品中的基因表达;(b)使用以下等式计算该肿瘤样品的复发评分(RS)或临床结果,尤其是获得该样 品并可能通过添加抗雌激素化合物或芳香酶抑制剂治疗的人患者的存活结果 其中G是与癌症远端复发相关的基因集,Pi是探针或探针集,i表示特定的基因 簇或组,w,是簇i的权重,j是特定的探针集值,XiJ是簇i中的探针集j的密度,n,是簇i 中的探针集的数量。这些方法、试剂盒或设备可以进一步包括基于复发评分将所述癌症样品归类为低 风险或高风险癌症复发的步骤。用于区分低风险和高风险的截止值可以是-100至+100的 复发评分(RS)或-10至+10的复发评分(RS)。所检测的复发可以是用他莫西芬、芳香酶抑制剂、化疗、内分泌疗法、(抗体)免疫 疗法或本领域技术人员所用的任何其他治疗方法治疗后的复发。优选地,复发是用他莫西 芬治疗后的复发。该方法可以用于消除对ER+或ER-乳腺型癌症的无效内分泌治疗。可以基于肿瘤样品的癌症复发风险状况来调整患者的治疗方案。例如,(a)如果患 者归类为低风险,则继续用抗雌激素化合物(选择性雌激素受体调节剂或下调剂(SERM或 SERD),如他莫西芬、雷洛昔芬、flaslodex)和(相继的)芳香酶抑制剂(AI)治疗低风险患 者,或(b)如果患者归类为高风险,则除了他莫西芬以外,可以用可替换的内分泌疗法来治 疗高风险患者。对于归类为高风险的患者,可以将该患者的治疗方案调整为化疗(给予紫 杉醇、紫杉烷、蒽环类抗生素、5-氟尿嘧啶、环磷酰胺等)或特定的分子靶向抗癌治疗或可 以是免疫治疗。可以从雌激素受体(或癌组织样品的另一种特异性标记物)阳性群体产生基因集并收集样品。可以通过各种方法产生基因集,并且组成的基因可以根据患者群和特定的病 征而变化。本发明的另一个方面提供了计算机化的系统或诊断设备(或试剂盒),其包括 (a)生物分析模块,优选是生物阵列,将其配置为用于基于本发明的基因集来检测肿瘤样品 的基因表达;和(b)处理模块,将其配置为用于基于基因表达来计算肿瘤样品的GGI或可能 的RS或可能的临床结果并用于产生乳腺肿瘤样品的风险评价和选择待应用的治疗。发明人还 出乎意料地观察到可以使用根据本发明的引物对直接获自哺乳动物 (包括人患者)的肿瘤样品或对来自早期乳腺癌(BC)患者的保存样品(尤其是冷冻(FS) 和干燥的肿瘤样品(石蜡包埋的肿瘤样品)(FFPE))获得有效的qRT-PCR测试。发明人使用从其收集了冷冻和石蜡包埋肿瘤样品的乳腺癌群测试了该qRT-PCR 测试的精确性以及与最初的微阵列设备GGI (基因组等级指数)的一致性,并且发明人获得 了使用冷冻(FS材料)以及石蜡包埋样品(FFPEMW)的微阵列产生的基因组等级指数 (GGI)和这些qRT-PCR测试之间的统计学显著性关联,和使用源自冷冻(FS)和石蜡包埋肿 瘤样品(FFPE)的qRT-PCR的基因组等级指数(GGI)之间的统计学显著性关联。发明人对独立ER-阳性的只用他莫西芬处理的冷冻乳腺癌群和石蜡包埋的Jules Bordet Institute布鲁塞尔,比利时)连续诊断的乳腺癌样品的独立群测试了预后值。发明人出乎预料地观察到qRT-PCR测定的高基因组等级指数(GGI)与综合乳腺癌 群的复发高风险相关,尤其是ER-阳性患者。这与本发明的微阵列结果相一致。在多变量 分析中,由qRT-PCR测定的GGI保持显著性。因此,基于有限数量的基因优选在根据本发明 的基因集中所选基因的qRT-PCR,以精确和可重复的方式概括了源自使用冷冻和石蜡包埋 肿瘤样品(FFPE)的微阵列的基因组等级指数的预后力。本发明的另一个方面涉及用于有效筛选和/或测试对癌症活性的化合物(或基于 给予活性化合物的治疗方法)的方法,其包括根据本发明的方法和工具,尤其是包括测试、 监控和调节该化合物对哺乳动物患者(包括人患者)的功效的步骤,该步骤通过在将该化 合物施用于患者之前和之后使用本发明的方法和工具测试这些患者的癌症风险来进行。因此,该方法包括选择用于内分泌(抗雌激素)治疗(如选择性雌激素受体调节 剂或下调剂(SERM或SERD),即,他莫西芬、雷洛昔芬、flaslodex、芳香酶抑制剂(Al))、化 疗(如蒽环类抗生素、紫杉烷、5-氟尿嘧啶、紫杉醇、环磷酰胺)、分子靶向抗癌治疗、免疫治 疗等中的一种或多种活性化合物,可以将其(分开或同时)给予哺乳动物患者,用于治疗和 /或防止癌症,并且通过以下方法用于测试所述活性化合物的功效,该方法包括在将所述化 合物给予哺乳动物之前和之后从治疗的哺乳动物收集肿瘤样品(活组织检查),使所述肿 瘤样品接受使用根据本发明的方法和工具的诊断(通过使用根据本发明的基因集或根据 本发明的试剂盒或设备检测所述肿瘤样品中的基因表达),可能产生该肿瘤样品在给予测 试化合物之前或之后的风险评价复发评分或临床结果(或遗传特征或模式)并可能鉴定该 化合物对癌症是否具有功效或可能存在产生癌症的风险。因此,该方法代表了一种新的抗 肿瘤或可能的肿瘤和毒性化合物的筛选测试或监控方法。根据本发明的方法可以应用于呈现出易患癌症的哺乳动物或患有癌症的患者,包 括人患者,用于监控所给予的治疗活性化合物的功效。本发明的方法还可以包括将活性化 合物给予一组呈现出通过该方法鉴定的相同肿瘤遗传特征的人患者群的步骤。
附图简述
图1表示对于无远端转移存活的GGI的Kaplan Meyer存活曲线(高对低)。图2表示(A)通过组织学等级(HG1、HG2和HG3)、(B)基因表达等级指数(GGI) (GG低和GG高)、(C)使用4个根据本发明选定的基因进行的qRT-PCR(GG(RT-PCR)低和 GG(RT-PCR)高)对ER+患者(冷冻样品)的存活分析。(D)通过qRT-PCR分级(GG(RT_PCR) 低和GG(RT-PCR)高)对结节阴性患者的分析。(E)RT-PCR分级(GG (RT-PCR))、基因表达等 级指数(GGI)和组织学等级(HG)的交叉列表。通过使用95% CI回归的误差率(HR)概括 两组之间无复发存活的差异。图3表示ER+和ER-患者(石蜡包埋样品)的存活分析,以通过使用4个根据本发 明选定的基因进行的qRT-PCR限定的指数函数来进行。(A)整个群体的分析(GG(rt-PCR)低 和GG(rt-PCR)高)。(B)雌激素阳性样品的分析(GG(rt-PCR)低和GG(rt-PCR)高)。(C) 雌激素阳性结节阴性样品的分析(GG(rt-PCR)低和GG(rt-PCR)高)。(D)通过RT-PCR分 级对组织学等级2(HG2)肿瘤患者的分析。通过标记为GG(rt-PCR)低和高将90名HG2肿 瘤患者分成低-和高-风险亚组。通过使用95% CI回归的误差率(HR)概括两组之间无复 发存活的差异。所有统计学检验是双边的。图4表示通过RT-PCR分级对只用他莫西芬治疗的ER+晚期乳腺癌患者(N = 279) 的无进展存活(PFS)分析。将7个半月后复发的低风险患者与高风险患者相比较(在50% 存活观察到差异)。通过使用95% C I回归的误差率(HR)概括两组之间无复发存活的差 异。所有统计学检验是双边的。发明详述^X大多数科学、医学和技术术语是本领域技术人员所通常理解的。术语“微阵列”指在基质(不溶性固相支持物表面)上的可杂交阵列元件(优选 多核苷酸探针)的有序排列。术语“差异表达的基因”、“差异的基因表达”及其同义词可互换使用,并且指相对 于它们在正常或对照受试者中的表达,其在患病(特别是癌症,如乳腺癌)受试者中的表达 激活至更高或更低水平的基因。该术语也包括其表达在同样疾病的不同阶段激活至更高 或更低水平的基因。还应当理解,差异表达的基因可以在核酸水平或蛋白质水平得到激活 或抑制,或者可以经历可选择的剪接而形成不同的多肽产物。这样的差异可以由例如mRNA 水平,多肽的表面表达、分泌或其他分配的改变来证明。差异的基因表达可以包括两个或多 个基因或其基因产物之间的表达的比较,或者两个或多个基因或其基因产物之间的表达率 的比较,或者甚至相同基因的两个不同加工产物的比较,该加工产物在正常受试者和患病 (特别是癌症)受试者之间或者在同样疾病的不同阶段之间是不同的。差异表达包括基因 或其表达产物的定量以及定性的在时间或细胞表达模式方面的差异,例如,在正常的和患 病的细胞中,或者在已经历不同的疾病事件或疾病阶段的细胞中。对于本发明的目的,当给 定基因的表达在正常的和患病的受试者之间,或者在患病受试者疾病发展的各种不同阶段 之中存在至少约两倍,优选至少约四倍,更优选至少约六倍,最优选至少约十倍的差异时, 认为存在“差异的基因表达”。基因表达作谱(gene expression profiling)包括对生物样品中的mRNA和/或蛋白质水平进行定量的所有方法。本发明所用的术语“预后”和“诊断”指预测归因于癌症的死亡或者肿瘤性疾病 (如乳腺癌(乳腺肿瘤))进展(包括复发、转移性扩散和抗药性)的可能性。本发明所用的术语“预测”指患者将对于某种药物或某类药物作出有利或不利响应的可能性,以及那些响应的程度,或者患者将在外科手术切除或原发肿瘤和/或化疗后 存活一段时间而无癌症复发的可能性。本发明的预测方法是用于预测以下情况的有用工具,即患者是否可能对治疗方案 (如,使用给定药物或药物组合的化疗,和/或放疗)作出有利的响应,或者患者是否可能在 外科手术和/或终止化疗或其他治疗形式后长期存活。术语“高风险”指预期患者在少于10年,5年,4年,优选少于3年会有远端复发。术语“低风险”指预期患者在10年,5年,4年之后,优选在超过3年之后会有远端复发。术语“肿瘤(癌)样品”对应于获自组织或细胞哺乳动物受试者(优选呈现出易 患癌症体质的人患者)和获自哺乳动物受试者(优选人患者)的生物流体或活体组织检查 的任何样品,包括冷冻或干燥(石蜡包埋的肿瘤样品,优选人)肿瘤样品。本发明所用的术语“肿瘤”指所有的肿瘤性细胞生长和增殖,不管是恶性的或良性 的,以及所有的癌前期的和癌性的细胞和组织。术语“癌症”和“癌的”指或描述哺乳动物中通常以不受控细胞生长为特征的生理 状态。癌症的实例包括但不限于,乳腺癌、结肠癌、肺癌、前列腺癌、肝细胞癌、胃癌、胰腺癌、 宫颈癌、卵巢癌、肝癌、膀胱癌、尿道癌症、甲状腺癌、肾癌、癌、黑素瘤和脑癌。未加工的“GGI”(基因表达等级指数)是所有高HG3基因的log表达(或log比) 之和减去所有高HGl基因的log表达(或log比)之和,并且可以写为 其中χ是mRNA的基因表达水平,G1和G3分别是在HGl和HG3中上调的基因集,和j指 探针或探针集。GGI可以包括经选择的截止值和标度值,从而使HGl病例的平均GGI为约-1,和 HG3病例的平均GGI为约+1 GGI中的截止值是0并相应于这些平均值的均值。GGI在_4至+4值的范围内。如上所述,通过基因组等级指数(GGI)的增殖捕获在乳腺癌中是重要的预后因 素,远超过雌激素受体状况并包括许多之前公开的预后特征的预测力的重要部分。令人惊讶地,GGI与ER-阴性和ER-阳性乳腺癌患者对化疗的响应相关,仅有 11. 9%具有低GGI的患者对化疗具有完全响应,而40. 4%具有高GGI的患者在相同治疗后 具有完全响应。发明人还能够使用来自早期乳腺癌患者的冷冻(FS)和石蜡包埋的肿瘤样品(FFPE)通过qRT-PCR来转化和证实GGI的预后值。发明人已经研发了基于8个涉及细胞 周期不同阶段的选定GGI基因和4个参照基因的qRT-PCR测定。这些选定的基因是CNB1、 CCNA2、CDC2、CDC20、MCM2、MYBL2、KPNA2 和 STK6 (4 个参照基因是 TFRC、GUS、RPLP0 和 TBP)。 优选的4个选定基因是CDC2、CDC20、CCNB1和MCM2 (测定1)或更优选CDC2、CDC20、MYBL2 和KPNA2 (测定2)。发明人已经测试了该qRT-PCR测试的精确性与如上所述的最初微阵列产生的GGI 相一致,通过使用从其可以获得冷冻的、石蜡包埋的肿瘤样品组织和微阵列数据的乳腺癌 群来进行(N = 30)。在使用冷冻材料(对于测定2 :HR = 0.945,(95% C I :0. 856-0. 98,p = 3. 67E-09)和 FFPE 材料(对于测定 2 :HR = 0. 889,(95% CI 0. 721-0. 958),p = 8. 26E-07) 的通过微阵列和qRT-PCR测定(1和2)产生的GGI之间观察到统计学显著性关联,以及使 用qRT-PCR的源自冷冻和FFPE肿瘤样品测定(1和2)的GGI之间观察到统计学显著性关 联(对于测试 2 :HR = 0. 851,95% CI 0. 636-0. 943),p = 7. 73E-06)。对78个激素-依赖性乳腺肿瘤的冷冻样品组织群测试了 qRT-PCR测定1和2的 预后值。在高复发风险与生物测定1和2的这4个基因的升高表达之间观察到统计学显著 性关联(对于生物测定2的HR = 3. 338(95% CI 1. 189-9. 374), p = 0. 022)。生物测定1 和2的预后值在多变量分析与年龄(< 50岁)和肿瘤大小(> 2cm) —起的过程中保持了 显著性(对于生物测定 2 的 HR = 3. 267(95% CI 1. 157-9. 227),p = 0. 025)。发明人还评估了该测定2对1995年和1996年之间在Bordetlnstitute连续手术 的208个乳腺癌群的预后值。这些样品是石蜡包埋的肿瘤样品组织。在高复发风险和该生物测定在综合群体的 4个基因的高表达之间观察到统计学显著性关联(HR= 1.072 (95% CI 0. 999-3. 507),p = 0. 050),特别是激素依赖性乳腺癌亚群(HR = 2. 26(95% CI 1. 075-4. 751),p = 0. 032)。对于综合群(HR= 1. 880(95% CI 0. 941-3. 757),p = 0. 074)和 ER 阳性亚组(HR =2. 249 (95% CI 0. 982-5. 150),p = 0. 055),甚至在与结节入侵一起的多变量分析过程 中,预后值仍保持显著性。对另一个有106个石蜡包埋乳腺肿瘤样品的独立群也证实了生物测定2的预后 值,具有相似的结果。基于有限数量的基因如选自本发明所述基因集的四个基因的生物测定,优选 qRT-PCR测试(测定1或测定2),使得使用冷冻和石蜡包埋的肿瘤样品的源自微阵列的GGI 预后力是精确而可重复的方式。如图8至11中所述的,qRT-PCR测定2的预后值与微阵列 的预后值相当。如图中所示,仅用他莫西芬治疗的高风险患者(JNI)的RT-PCR等级指数对于结节 阴性ER-阳性(以及ER-阴性)乳腺型癌症患者是一种出乎意料的强预后测试,并可以用于 避免用在这种检测的特异性人患者组治疗中无效的化合物进行的不必要(和可能毒性的) 的激素疗法。相反,对于结节阴性ER-阳性(以及ER-阴性)乳腺型癌症,RT-PCR等级指数出 乎意料地是对化疗阳性响应的强预测物。因此,根据本发明的基因集诊断试剂盒和方法也是用于这些患者的预测性测定和 方法。
11
已经根据本发明描述了本发明的不同实施方案。对本发明中所述和所示的技术和 结构可以进行许多改进和改变,而不脱离本发明的精神和范围。因此,应当理解 本发明中所 述的设备仅是说明性的并且对本发明的范围没有限制。
权利要求
基因集,其包含至少4个,但少于8个选自基因CDC2、CDC20、MYBL2、KPNA2、CCNB1、MCM2、CCNA2和STK6的基因。
2.根据权利要求1的基因集,其中所述基因选自⑶C2、⑶C20、MYBL2和KPNA2基因。
3.根据权利要求1的基因集,其中所述基因选自CCNB1、⑶C2、⑶C20和MCM2基因。
4.根据权利要求1至3的基因集,其中将基因序列结合到固体支持物表面,作为阵列。
5.包含根据权利要求1至4任一项的基因集的诊断试剂盒或设备,可能包括用于肿瘤 样品的实时PCR分析的工具。
6.根据权利要求5的诊断试剂盒或设备,其中所述用于实时PCR分析的工具是用于 qRT-PCR的工具。
7.根据权利要求5或6的诊断试剂盒或设备,其包含一个或多个选自SEQI D N0:1至 SEQ ID NO 16的引物序列。
8.根据权利要求7的诊断试剂盒或设备,其进一步包含用于参照基因的实时PCR分析 的工具。
9.根据权利要求8的诊断试剂盒或设备,其中参照基因选自TFRC、GUS、RPLP0和TBP基因。
10.根据权利要求8或9的诊断试剂盒或设备,其进一步包含一个或多个选自SEQID NO 17至SEQ ID NO 24的引物序列。
11.根据权利要求8至10任一项的试剂盒或设备,其是计算机化的系统,所述系统包含a)生物测定模块,将其配置为用于基于根据权利要求1至4任一项的基因集来检测肿 瘤样品的基因表达;和b)处理模块,将其配置为用于基于所述基因表达来计算肿瘤样品的基因表达等级指数 (GGI)或复发评分(RS)和用于产生肿瘤样品的风险评估。
12.根据之前的权利要求5至11任一项的试剂盒或设备,其中所述肿瘤样品来自患有 癌症的组织,所述癌症选自乳腺癌、结肠癌、肺癌、前列腺癌、肝细胞癌、胃癌、胰腺癌、宫颈 癌、卵巢癌、肝癌、膀胱癌、尿道癌、甲状腺癌、肾癌、癌、黑素瘤或脑癌,优选乳腺肿瘤样品。
13.权利要求12的试剂盒或设备,其中所述肿瘤样品是冷冻样品(FS)或石蜡包埋的肿 瘤样品(FPPE)。
14.肿瘤样品中癌症的预后或诊断方法,其包括以下的步骤使获自该肿瘤样品的核 苷酸序列与根据权利要求1至4任一项的基因集接触,并测量该肿瘤样品中的核苷酸序列 的基因表达并将该核苷酸序列的表达与癌症预后或诊断相关联。
15.根据权利要求14的方法,将其与雌激素受体和/或孕酮受体基因表达检测相结合。
16.权利要求14或15的方法,其中所述肿瘤样品是冷冻或石蜡包埋的肿瘤样品。
全文摘要
本发明涉及用于肿瘤样品预后测定的方法和工具。
文档编号C12Q1/68GK101861400SQ200880113682
公开日2010年10月13日 申请日期2008年4月16日 优先权日2007年10月30日
发明者C·索蒂里乌, V·杜尔贝克 申请人:布鲁塞尔自由大学