使用目标基因表达的概率建模评估细胞信号传导途径活性的制作方法
【专利摘要】本申请主要涉及特定方法,其至少基于医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平来推断所述医疗个体的组织中一种或多种细胞信号传导途径的活性;装置,其包含配置以进行此类方法的数字压缩机;和非临时性存储介质,其存储由数字处理设备可执行以进行此类方法的指令。
【专利说明】使用目标基因表达的概率建模评估细胞信号传导途径活性
[0001]本文描述的主题主要涉及生物信息学、基因组处理技术、蛋白质组处理技术及相关技术。
[0002]基因组和蛋白质组分析已经基本上实现了医疗领域诸如肿瘤学中的临床应用,并且是其的潜在希望,其中已知多种癌与基因组突变/变异和/或具体基因的高或低的表达水平的具体组合相关,其在癌的生长和演变(例如细胞增殖和转移)中起作用。例如,fct信号传导途径影响细胞增殖的调节,并且是高度调节的。由于丧失调节而导致的高fct途径活性与癌,其中与恶性结肠肿瘤相关。尽管不受任何具体运行理论的限制,但认为恶性结肠细胞中Wnt途径的去调节导致高Wnt途径活性,其依次导致恶性结肠细胞的细胞增殖,即结肠癌的扩散。另一方面,例如在骨质疏松症的情况中,异常低的途径活性可能也涉及(ofinterest)。
[0003]获取基因组和蛋白质组数据的技术在临床环境中已经变得容易获得。例如,常规使用通过微阵列的测量来评估基因表达水平、蛋白水平、甲基化等等。自动基因测序能够成本划算的鉴定DNA和mRNA中的遗传变异。基因测序过程中mRNA水平的定量评估保留了作为另一种评估基因表达水平的临床工具的希望。
[0004]尽管(或,也许,由于)这些进展,但基因组和蛋白质组分析的临床应用面临根本上的障碍——数据过载。例如,单一临床样品中可鉴定的突变的数目可以为成千上万或者更多的数目。这些突变的大多数是所谓的旁观者突变(bystander mutations)而对癌生长并无具体作用,并且仅有少数的确对癌生长和功能演变起作用,并且这些代表了有效治疗的靶标。单一微阵列能够产生数以万计基因的基因表达水平。处理这样大量的数据来鉴定临床上有用的信息,如例如在选择正确疗法的应用中是困难的。
[0005]一种方法是将分析限制为少数规范的或标准化的测试,诸如由美国食品和药物管理局(FDA)认可的测试。在这样的方法中,检测具体指示物或指示物的组合(例如突变和/或特定的高或低基因表达水平)以测试对所指示的疾病病况(例如癌的具体类型)为“阳性的”。规范测试由临床研究所支持,其已经显示出与疾病病况或与治疗效力密切相关。该方法仅用于已经开发了规范测试的那些临床病况,例如疾病的具体诊断、或预测在具体阶段具体癌类型中对药物的应答,并且由于它仅应用于规范的病况,因此也是精确的。
[0006]另一种方法基于鉴定基因组或蛋白质组指示物的功能相关的组。例如,Wnt途径包含蛋白质组反应的级联。该链的主要组分包括(但不限于)fct信号传导蛋白与细胞的卷曲表面受体的结合,其导致蛋白散乱家族(disheveled family of proteins)的蛋白的活化,其依次影响细胞核中的转录剂诸如基于β连环蛋白/TCF4的蛋白复合物的水平。这些转录剂依次控制目标mRNA分子的转录,其依次翻译为Wnt途径的目标蛋白。临床研究已经显示了 Wnt途径的调节蛋白与Wnt途径的活性之间的某些关联。
[0007]然而,将此类临床研究结果应用到具体患者的诊断和临床评价中是困难的,这是由于信号传导途径例如Wnt途径的复杂性。作为简单实例,在fct途径的“上游”的蛋白表达水平的测量可以无法检测在fct途径的“下游”的蛋白的异常行为。认为Wnt途径包括大量反馈机制并且“上游”和“下游”的简单概念可能对于fct途径的本质部分是不适用的;更常见的是,包含fct途径的蛋白级联的一部分中的异常行为可能对蛋白级联的其他部分以及对作为整体的fct途径的活性具有或多或少的影响。还进一步,在某些临床研究中,信号传导级联的调节蛋白的蛋白表达水平通过测量编码该调节蛋白的基因的mRNA表达水平来评估。这是间接测量,其可能无法准确地评估调节蛋白表达水平,并且甚至难以反映有活性蛋白(在具体的翻译后修饰如磷酸化之后)的量。
[0008] 导致产生本发明的主要问题因此是提供分别进行基因组和蛋白质组分析的合适方法和手段。当研究本说明书、本文提供的实施例时,以及具体是当研究所附的权利要求时,与本发明相关的问题以及进一步的缺陷下的具体方面变得明确。
[0009]本发明提供了如本文所公开的新的且改进的方法和装置。
[0010]与本发明的主要方面一致,以上问题通过使用目标基因表达的概率建模来评估细胞信号传导途径活性的具体方法来解决,即包括以下内容的方法:
至少基于在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的表达水平(具体为mRNA和/或蛋白水平)来推断所述医疗受试者的组织中的一种或多种细胞信号传导途径的活性,其中所述推断包括:
通过评价概率模型(优选Bayesian网络)的至少一部分来推断医疗受试者的组织中一种或多种细胞信号传导途径的活性,所述模型对于一组输入表不一种或多种细胞信号传导途径,所述一组输入包括至少在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平;
估计医疗受试者的组织中至少一种转录因子(TF)元件(至少一个控制一种或多种细胞信号传导途径的一个或多个目标基因的TF元件)的水平,所述估计至少部分基于与至少一个TF元件和在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平有关的条件概率;和
基于组织样品中转录因子的估计水平来推断一种或多种细胞信号传导途径的活性;和基于医疗受试者的组织中的一种或多种细胞信号传导途径的推断活性来确定在医疗受试者的组织中一种或多种细胞信号传导途径是否运行异常;
其中通过数字处理设备使用一种或多种细胞信号传导途径的概率模型来进行所述推断。
[0011 ] “一种或多种目标基因”可以是“直接目标基因”和/或“间接目标基因”(如本文所述)。
[0012]优选所述推断包含估计医疗受试者的组织中由概率模型的TF节点所代表的至少一种转录因子(TF)元件的水平,所述TF元件控制一种或多种细胞信号传导途径的一个或多个目标基因的转录,所述估计至少部分基于与代表在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的概率模型中的所述TF节点和多个节点相关的概率模型的条件概率。
[0013]概率模型可以是Bayesian网络模型。因此,根据优选的实施方案,通过使用Bayesian网络进行推断,所述Bayesian网络包含代表关于一种或多种信号传导途径的信息的节点和Bayesian网络的连接节点之间的条件概率关系。
[0014]一种或多种细胞信号传导途径可以是Wnt途径、ER (雌激素受体)途径、AR (雄激素受体)途径和/或Hedgehog途径。因此,根据优选的实施方案,一种或多种细胞信号传导途径包含Wnt途径、ER途径、AR途径和/或Hedgehog途径。
[0015]具体合适的目标基因描述于以下正文部分以及下文的实施例中(例如见表1-9)。
[0016]因此,根据优选的实施方案,一个或多个目标基因选自包含以下目标基因或由其组成的组:表1或表6中列出的目标基因(对于Wnt途径)、表2、表5或表7中列出的目标基因(对于ER途径)、表3或表8中列出的目标基因(对于Hedgehog途径)以及表4或表9中列出的目标基因(对于AR途径)。
[0017]具体优选的是这样的方法,其中所述推断包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个fct途径的目标基因的表达水平来推断该医疗受试者的组织中fct途径的活性,所述目标基因选自包含以下或由其组成的组:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、S0X9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6 和 FZD7。
[0018]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个fct途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:NKD1、OAT、FATU LEFU GLUL, REGIB、TCF7L2、C0L18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKKl、HNFlA 和 LECT2。
[0019]具体优选的是这样的方法,其中所述推断(还)包括:
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个ER途径的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性,所述目标基因选自包含以下或由其组成的组:CDH26、SGK3、PGR、GREB1、CA 12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD, TFFl 和 NRIPl。
[0020]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个ER途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:APlBU ATP5J、C0L18A1、C0X7A2L、EBAG9、ESRl、HSPBl、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDMl5, PTMA, RARA, SODl 和 TR頂25。
[0021]还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个Hedgehog途径的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,所述目标基因选自包含以下或由其组成的组:GLI1、PTCHl、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXLU CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXMU GLI3、TCEA2、FYN 和CTSLl。
[0022]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个Hedgehog途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:BCL2、F0XA2、F0XF1、G19、HHIP, IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRMl 和 TOMl。
[0023]还优选这样的方法,其中所述推断(还)包括
至少基于在医疗受试者的组织的提取样品中测量的一个或多个、优选至少三个AR途径的目标基因的表达水平来推断该医疗受试者的组织中AR途径的活性,所述目标基因选自包含以下或由其组成的组:KLK2、PMEPAU TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRGl、LRIGl、CREB3L4、LCPl、⑶CYI A3、AR 和 EAF2。[0024]进一步优选这样的方法,其中所述推断进一步基于在医疗受试者的组织的提取样品中测量的至少一个AR途径的目标基因的表达水平,所述目标基因选自包含以下或由其组成的组:APP、NTS、PLAU, CDKN1A、DRG1、FGF8、IGFU PRKACB, PTPNU SGKl 和 TACC2。
[0025]本发明的另一方面涉及这样的方法(如本文所述),进一步包括:
为医疗受试者推荐开药,所述药物矫正一种或多种细胞信号传导途径的异常运行;其中只有当基于一种或多种细胞信号传导途径的推断活性来确定所述一种或多种细胞信号传导途径在医疗受试者的组织中运行异常时,才进行所述推荐。
[0026]本发明还涉及这样的方法(如本文所述),其包括:
至少基于在医疗受试者的组织的提取样品中测量的fct途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中fct途径的活性和/或
至少基于在医疗受试者的组织的提取样品中测量的ER途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中ER途径的活性和/或
至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中Hedgehog途径的活性,
和/或
至少基于在医疗受试者的组织的提取样品中测量的AR途径的一组目标基因中两个、三个或更多个的目标基因的表达水平来推断该医疗受试者的组织中AR途径的活性。
[0027]优选地,
Wnt途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、S0X9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCNDU DEFA6 和 FZD7,
和/或
ER途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:CDH26、SGK3、PGR、GREB1、CA 12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFFI和 NRIPl,
和/或
Hedgehog途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:GLI 1、PTCHl、PTCH2、IGFBP6、SPPl、CCND2、FST、FOXLl、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXMU GLI3, TCEA2、FYN 和 CTSLl,
和/或
AR途径的所述目标基因的组包括至少九个,优选所有选自包含以下或由其组成的组中的目标基因:KLK2、PMEPAl、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRGl、LRIGl、CREB3L4、LCP1、⑶CY1A3、AR 和 EAF2。
[0028]具体优选这样的方法,其中
Wnt途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:NKDU OAT、FATl、LEFl、GLUL, REGIB、TCF7L2、C0L18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKKl、HNFlA 和 LECT2,
和/或
ER途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:APlBU ATP5J、C0L18A1、C0X7A2L、EBAG9、ESRl、HSPBl、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDM l5, PTMA, RARA, SODl 和 TR頂25,
和/或
Hedgehog途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:BCL2、F0XA2、FOXFl、G19、HHIP, IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、NKX2.8、PITRMl 和 TOMl,
和/或
AR途径的所述目标基因的组进一步包括至少一个选自包含以下或由其组成的组中的目标基因:APP、NTS、PLAU, CDKN1A、DRG1、FGF8、IGFU PRKACB, PTPNU SGKl 和 TACC2。
[0029]根据本发明使用的一种或多种样品可以是这样的样品,例如其获自乳腺损伤,或获自已知或怀疑具有结肠癌的医疗受试者的结肠,或获自已知或怀疑具有肝癌的医疗受试者的肝,等等,优选经活组织检查方法或其他样品提取方法获得。提取样品的组织还可以是转移组织,例如,(怀疑的)源自结肠、乳腺、肝或已经扩散到结肠、乳腺、肝或其他器官之外的其他器官的恶性组织。在某些情况下,组织样品可以是循环的肿瘤细胞,即已经进入血流并且可以使用合适的分离技术提取作为提取的组织样品的肿瘤细胞。
[0030]本发明的另一个公开方面涉及如本文所述的非临时性存储介质或如本文所述的计算机方法用于疾病的特异性诊断或预测在具体阶段在具体癌类型中对药物的应答的用途。
[0031]根据另一公开方面,配置包含数字处理器的装置来进行如本文所述的本发明的方法。
[0032]根据另一公开方面,非临时性存储介质存储通过数字处理设备可执行的指令来进行如本文所述的本发明的方法。非临时性存储介质可以是计算机可读取的存储介质,诸如硬盘驱动器或其他磁性存储介质、光盘或其他光存储介质、随机存取存储器(RAM)、只读存储器(ROM)、闪速存储器、或其他电子存储介质、网络服务器等等。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
[0033]根据另一公开方面,计算机方法包含方法代码工具用于使数字处理设备进行如本文所述的本发明的方法。数字处理设备可以是手提式设备(例如,个人数据助手或智能电话)、笔记本计算机、台式计算机、平板计算机或设备、遥控网络服务器等等。
[0034]—种优点在于临床决策支持(CDS)系统基于一种或多种细胞信号传导途径的概率分析提供临床推荐,例如使用Wnt途径、ER途径、AR途径和/或Hedgehog途径的Bayesian网络模型。
[0035]另一优点在于细胞信号传导途径活性的改进的评估受误差影响更低。
[0036]另一优点在于提供CDS系统,其为细胞信号传导途径的调节丧失推荐靶向治疗。
[0037]另一优点在于提供CDS系统,将其设计为检测具体的细胞信号传导途径的调节丧失,诸如fct途径、ER途径、AR途径或Hedgehog途径,并且其易于适应为起源于具体细胞信号传导途径的不同类型的癌提供推荐。
[0038]如本文所述的本发明还可以例如有利地与以下一起使用 -基于预测(推断)的活性的诊断;
-基于预测(推断)的活性的预后;
-基于预测(推断)的活性的药物处方;
-基于预测(推断)的活性的药物效力预测;
-基于预测(推断)的活性的副作用预测;
-药物效力监测;
-药物开发;
-测定开发;
-途径研究; -癌分期;
-基于预测(推断)的活性的临床试验中受试者的注册;
-待进行的后续测试的选择,和/或;
-伴随诊断测试的选择。
[0039]在阅读并理解所附的附图、以下描述及具体在阅读本文以下提供的更详尽的实施例后,进一步的优点对于本领域技术人员而言将是显而易见的。
[0040]图1显示了表示细胞信号传导途径的部分的简单Bayesian网络。细胞信号传导途径由转录因子(TF)复合物和作为存在的转录因子复合物的结果产生的目标基因所表示。在二元离散的情况下TF元件与目标基因之间的概率关系可以由简图中所示的条件概率表所表示。
[0041]图2显示了描述假定的细胞信号传导途径的的说明性Bayesian网络。上游蛋白和下游目标mRNA节点均描绘于简图中。上游蛋白作为转录因子复合物中的输入,而目标mRNAs为转录因子复合物的输出节点。
[0042]图3显示了具有多个转录因子复合物的单一细胞信号传导途径或具有组合入一个Bayesian网络的它们自身的转录信号复合物的多个细胞信号传导途径或其组合的Bayesian网络代表的说明性实例。
[0043]图4显示了说明与图1类似的细胞信号传导途径的简单代表的Bayesian网络的实例。现在已经加入额外的节点以代表目标mRNA向目标蛋白的翻译。
[0044]图5显示了说明细胞信号传导途径的另一个简单代表的Bayesian网络的说明。使用转录因子复合物及它的目标蛋白水平来代表途径。
[0045]图6显示了具有节点的额外层的图1的说明性Bayesian网络,所述节点代表微阵列芯片上连系探针强度与对应的目标mRNA水平的探针组(piObesets)。
[0046]图7显示了图1的Bayesian网络的变体实施方案的说明性实例,其包括代表甲基化和拷贝数变化的节点作为该具体实例中所包括的任何目标mRNA水平的额外信息节点的实例。
[0047]图8显示了在结肠样品(GSE20916)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。
[0048]图9显示了在结肠样品(GSE4183)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。
[0049]图10显示了在结肠样品(GSE15960)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。
[0050]图11显示了在乳腺癌样品(GSE12777)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。
[0051]图12显示了在乳腺癌样品(GSE21653)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。
[0052]图13显示了在肝癌样品(GSE9843)的数据组中如本文所述的Bayesian网络和最近重心法的预测的fct途径活性。[0053]图14显示了在结肠样品(GSE20916)的数据组中如本文所述的使用Bayesian网络使用证据组织列表(evidence curated list)的目标基因相比于广泛文献列表的目标基因的预测的fct途径活性。
[0054]图15显示了在结肠样品(GSE4183)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的fct途径活性。
[0055]图16显示了在结肠样品(GSE15960)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的fct途径活性。
[0056]图17显示了在乳腺癌样品(GSE12777)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的fct途径活性。
[0057]图18显示了在肝癌样品(GSE9843)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的fct途径活性。
[0058]图19显示了在成神经管细胞瘤样品(GSE10327)的数据组中如本文所述的使用Bayesian网络使用证据组织列表的目标基因相比于广泛文献列表的目标基因的预测的Wnt途径活性。
[0059]图20图示了配置以评估一种或多种如本文公开的细胞信号传导途径的临床决策支持(⑶S)系统(示例性显示为Wnt途径)。
[0060]图21显示了来自GSE4183的结肠样品中预测的Wnt途径活性。
[0061]图22显示了来自GSE10327的成神经管细胞瘤样品中预测的Wnt途径活性。
[0062]图23显示了来自GSE9843的肝癌样品中预测的Wnt途径活性。
[0063]图24显示了来自GSE12777的乳腺癌细胞系中预测的Wnt途径活性。
[0064]图25显示了来自GSE12777的乳腺癌细胞系中预测的ER途径活性。
[0065]图26显示了来自GSE12276的乳腺癌样品中预测的ER途径活性。
[0066]图27显示了来自GSE36133的癌细胞系中预测的ER途径活性。
[0067]图28显示了来自GSE34211的癌细胞系中预测的Hedgehog途径活性。
[0068]图29显示了来自GSE10327的成神经管细胞瘤样品中预测的Hedgehog途径活性。
[0069]图30显示了来自GSE12276的乳腺癌样品中预测的Hedgehog途径活性。
[0070]图31显示了来自GSE21618的MCF7和他莫昔芬抗性细胞系中预测的ER途径活性。
[0071]图32显示了来自GSE11324的雌激素刺激的MCF7细胞系样品的时间序列中预测的ER途径活性。
[0072]图33显示了 GSE12276的管腔A样品中Wnt、ER和Hedgehog途径活性。
[0073]图34显示了 GSE12276的基本样品中Wnt、ER和Hedgehog途径活性。
[0074]图35显示了来自GSE20916的结肠样品中预测的Wnt途径活性。
[0075]图36显示了用雌激素(E2)刺激的MCF7细胞系或阴性对照(EtOH) (GSE9253)中预测的ER途径活性。
[0076]图37显示了来自根据途径活性分组的GSE12276数据组的患者的Kaplan-Meier存活曲线。
[0077]图38显示了来自GSE7708用不同治疗方案处理的LNCaP细胞系中预测的AR途径活性。
[0078]图39显示了来自GSE17951的前列腺癌样品中预测的AR途径活性。
[0079]图40显示了来自GSE12276的乳腺癌样品中预测的AR途径活性。
[0080]图41显示了含有代表多种癌类型的细胞系样品的GSE36133数据组中预测的AR途径活性。
[0081]图42显示了含有代表多种癌类型的细胞系样品的GSE34211数据组中预测的AR途径活性。
[0082]以下实施例仅仅说明具体优选的方法和与其相关的所选的方面。其中提供的教导可用于构建几种测试和/或试剂盒,例如来检测、预测和/或诊断一种或多种细胞信号传导途径的异常活性。此外,根据使用如本文所述的方法,能够有利地指导药物处方,能够进行药物预测和药物效力(和/或副作用)的监测,能够预测并监测药物抗性,例如来选择后续待进行的一种或多种测试(如伴随诊断测试)。以下实施例不应解释为限制本发明的范围。
[0083]实施例1:Bayesian网络构建
如本文所公开,通过构建概率模型(例如图6中显示的说明性Bayesian模型)并且并入大量不同的目标基因的表达水平与细胞信号传导途径的活性之间的条件概率关系,可以使用此类模型以高度的准确性来测定细胞信号传导途径的活性。此外,通过调节条件概率并/或向模型中加入新的节点来代表额外的信息源,能够容易地升级概率模型来并入通过后期临床研究获得的额外知识。在这种方式中,能够适当地升级概率模型来包括最近的医学知识。
[0084]代表细胞信号传导途径的最简单的Bayesian网络模型之一将是包括转录因子元件及相关的目标基因的两水平模型(见图1)。转录因子复合物元件是转录因子复合物的水平的代表。转录因子元件的蛋白水平与转录因子的目标基因的许多mRNA水平相关(在该示例性Bayesian网络中,仅描述了三个目标基因,已知在转录因子可获得的情况下其表达于组织中)。应该理解许多、大部分或所有的途径的目标基因(在Wnt、ER、Hedgehog和AR途径的情况下,具体分别为表1、表2、表3和表4中提及的目标基因)类似地由TF元件调节。TF元件的水平与目标基因的mRNA水平之间的关系通过边缘在Bayesian网络中建立模型。对于目标基因的每一个,条件概率分布说明了基因的mRNA水平如何依赖于TF元件的水平。
[0085]TF元件和目标基因的水平可以多种表示。一种选择是使用二元离散,对TF元件为状态“不存在”和“存在”,以及对目标基因的mRNA水平为“下”和“上”(见图1)。TF元件与目标基因之间的概率关系随后可以由条件概率表所表示(如同一附图中所示)。除了二元离散,水平还可以表示为连续的水平值,或者为具有三种或更多种量子化水平的量子化的值(例如,对于目标基因为“下”、“正常”和“上”)。
[0086] 简单Bayesian网络的前述说明仅仅是Bayesian网络模型的说明性实施方案(图1)。通常,Bayesian网络模型包含通过边缘连接的节点的无环有向图。每一节点代表关于邻近(at hand)的途径(或者更常见地,关于细胞信号传导途径)的信息项。途径元件节点每一个代表细胞信号传导途径的基因组或蛋白质组元件。通过说明性实例,途径元件节点可以代表以下之一但不限于此:蛋白、蛋白复合物、从细胞信号传导途径的目标基因转录的mRNA分子、甲基化的基因、磷酸化的蛋白、磷酸化的蛋白复合物,等等。如本文之后所讨论的,几种其他类型的节点(但不限于给出的实例)可以包括于Bayesian网络中以代表其他类型的信息,诸如具体测量数据元件、基因变异发生,等等。
[0087]如果此类蛋白水平的知识对于确定临床决策支持推荐能够提供证据,则通常将代表途径的调节蛋白(以有活性的或无活性的状态)的额外的“上游”水平加入。例如,如果特异性靶向此类蛋白而非整个途径的药物是可获得的,在Bayesian网络中包含对转录因子基本的蛋白或转录因子上游的必要蛋白(见图2)可能是有用的。认为转录因子(TF)元件是大部分信号传导途径中的蛋白复合物(即,以特定结构结合在一起的蛋白的组合,其行使调节从目标基因的转录的功能)。对于其他途径,TF元件可以是单一蛋白。此外,信号传导途径可以经多于一个转录因子行使它们的活性,导致具有流入(feeding) —个或多个目标基因的多个转录因子的更复杂的Bayesian网络(见图3影响目标基因转录的多个转录因子元件的假定说明)。这样的多转录因子Bayesian网络还可以是在一个Bayesian网络中组合的途径的组合的结果。
[0088]目标基因进一步下游的额外的信息节点也可以包括在Bayesian网络中。该说明性的实例是目标基因mRNA翻译为蛋白(图4)或者作为目标基因mRNA水平的替代节点的目标基因的蛋白水平节点(图5)。目标基因的mRNA分子通过与核糖体分子相互作用翻译来形成对应于mRNA分子和对应于目标基因的蛋白。这是目标基因在蛋白水平上的表达。通过但不限于例如质谱法、免疫组织化学、凝胶电泳技术的蛋白水平的测量可以作为这些目标蛋白水平的证据。
[0089]可以基于微阵列对应的探针组的测量强度,例如通过求平均数或通过其他技术的其他手段(例如RNA测序)来计算目标基因的表达水平。在某些实施方案中,如本文所述并参考图6,通过用每一探针组的节点扩展Bayesian网络将该计算整合入Bayesian网络中,所述探针组被使用并且包括运行来自对应的目标基因节点的这些“测量”节点的每一个的边缘。
[0090]概率模型任选还可以并入额外的基因组信息,诸如突变的信息、拷贝数变化、基因表达、甲基化、易位信息等等,其改变与途径的信号传导级联相关的基因组序列以推断途径活性并定位导致异常功能(活化或无活性)的Wnt途径中的缺陷,如同图7对甲基化和拷贝数数据的说明性情况的说明性参考所述。然而,应该理解其他类型的关于目标基因的信息类似地翻译为信息节点。此类基因组信息可以通过但不限于RNA测序和SNP分析来获得。
[0091]此外,应该理解尽管本文后面所述的实施例关于提供Wnt、ER、AR和Hedgehog途径作为说明性实例,但本文公开的对细胞信号传导途径分析的方法容易地应用于这些途径之外的其他细胞信号传导途径,诸如具有细胞膜中受体的胞内信号传导途径(例如Notch、HER2/PI3K、TGF β、EGF, VEGF和TNF-NF κ B细胞信号传导途径)和具有细胞内受体的胞内信号传导途径(例如孕酮、视黄酸、和维生素D细胞信号传导途径)。
[0092]实施例2:机器学习方法的比较
在此用fct途径作为实例彼此比较两种类型的机器学习技术的性能:将通过最近重心法的手段预测fct活性与本发明选择的方法比较,其例如使用Bayesian网络。
[0093]如上所讨论,基于它的优点在于:使用条件概率关系,概率方法能够并入“软”形式(例如展示出提供证据的特征的研究个体的百分比)和“硬”形式中可获得的信息,选择Bayesian网络方法。此外,概率模型还使信息能够基于解释细胞信号传导途径的部分(而非综合的)知识再经使用条件概率表来并入。
[0094]此处证明相比于其他机器学习方法(例如众所周知的方法最近重心分类),发明人使用Bayesian网络以它们包括已知的生物学特性和软证据的可获得性的方式加入值。最近重心分类是机器学习方法,其中对于每一类的训练样品,计算平均概况(=重心),并且随后,对于待分类的样品,基于最近的重心(然后最近重心的标签是预测结果)预测标签。根据Bayesian网络中所用的探针组的相同列表计算两个重心,并且对于“Wnt开”和“Wnt关”重心,它们分别基于GSE8671的相同fRMA处理数据的腺瘤样品和正常结肠样品。随后使用样品和两个重心之间的两个欧几里德距离的log2-比来分类来自多种数据组的样品以推断样品的分类。这表示log2_比为O对应于样品与两个重心的相同距离,值〉O对应于分类为有活性的fct信号传导的样品,而值〈O对应于鉴定为具有无活性的Wnt信号传导途径的样品。
[0095]构建与图6和本文所述的方法类似的Bayesian网络。与Wnt Bayesian网络的该描述类似,使用来自Gene Expression Omnibus的数据组GSE8671的32个正常结肠样品和32个腺瘤样品的fRMA处理数据(在http://www.ncb1.nlm.nih.gov/geo/上可进入,最后于2011年7月13日访问)训练探针组及它们对应基因之间的边缘的条件概率表。随后用多种数据组测试训练后的Bayesian网络来推断Wnt途径为“开”的概率P (Wnt开),即有活性的,其与fct途径转录复合物“存在”的推断概率相同。
[0096]随后用多种fRMA处理的微阵列数据组来测试训练后的Bayesian网络和最近重心模型,来推断通过P (ffnt开)和距离的log2-比测量的Wnt途径是“开”的概率。Bayesian网络和最近重心模型结果的概述显示于图8-13中。读者应该注意两种方法的输出度量不是一对一关系,然而,在方法中输出度量的标记和相对量级是相当的。
[0097]结肠(癌)样品(GSE20916,GSE4183)的非常大的部分平均分类在有活性的和无活性的fct途径中,除了 GSE15960之外,其有一大部分在最近重心法中错误地分类为阴性样品(假阴性)。假阴性的更高部分的这种感知也维持在其他癌类型中。这尤其是对于乳腺癌样品(GSE12777,GSE21653)和肝癌(GSE9843)是正确的;除了少数例外,预测所有样品均具有无活性的fct途径,已知其在基础类型的乳腺癌和CTNNBl肝癌样品的情况中是不正确的。在某些情况下,在例如GSE15960中明显的是,可以通过降低和增加最近重心分类的阈值来校正分类。这之后的理念将是fct活性的阈值在不同组织类型中可能是改变的。然而,这会涉及可应用于其他组织类型的最近重心法的额外训练。Bayesian网络模型的长处之一是该组织特异性训练不是必需的,这是由于将它设立为对组织类型非特异性的。
[0098]实施例3:目标基因的选择转录因子(TF)是蛋白复合物(即,以特定结构结合在一起的蛋白的组合)或蛋白,其通过结合特定DNA序列能够调节来自目标基因的转录,由此控制从DNA至mRNA遗传信息的转录。由于转录复合物的这种作用直接产生的mRNA在本文中称为“直接目标基因”。途径激活还可以产生更多二级基因转录,称为“间接目标基因”。在下文中,优选包含直接目标基因或者由其组成的Bayesian网络模型(作为示例性概率模型)作为途径活性和mRNA水平之间的直接联系,然而直接和间接目标基因之间的区别并不总是明显的。在此呈现使用基于可获得的文献数据的评分函数选择直接目标基因的方法。尽管如此,由于有限的信息和生物学变异及不确定性,不能排除间接目标基因的意外选择。
[0099]根据积累证据的科学实验的类型,通过使用其中对于特定目标基因的科学证据给予等级的分级系统,从科学文献中选择特定途径mRNA目标基因。尽管某些实验证据仅仅暗示基因为目标基因,如例如在其中已知Hedgehog途径是有活性的胚胎的微阵列中增加的mRNA,但其他证据可以是非常有力的,如鉴定的途径转录因子结合位点和细胞中特定途径的刺激后染色质免疫沉淀(ChIP)测定中该位点的取回以及细胞系中途径的特定刺激后mRNA的增加的组合。
[0100]可以在科学文献中鉴定用于发现特定途径目标基因的几种类型的实验:
1.ChIP实验,其中显示了途径-转录因子与它在基因组上的结合位点的直接结合。实例:通过使用染色质-免疫沉淀(ChIP)技术,随后将具有和不具有有活性的Wnt途径的结肠细胞系的DNA中的假定的功能TCF4转录因子结合位点鉴定为仅基于核苷酸序列识别的结合位点的亚组。将假定的功能性鉴定为来源于ChIP的证据,即发现转录因子结合DNA结合位点。
[0101]2.电泳迁移率变化(EMSA)测定,其显示了转录因子与含有结合序列的DNA片段的体外结合。相比于基于ChIP的`证据,基于EMSA的证据更弱,这是由于它无法被翻译为体内情形。
[0102]3.途径的刺激和测量微阵列上的mRNA概况或使用RNA测序,使用途径诱导的细胞系并测量在存在放线菌酮的情况下诱导后几个时间点测量的mRNA概况,其抑制翻译为蛋白,因而假定诱导的mRNAs是直接目标基因。
[0103]4.与3类似,但使用定量PCR来测量mRNAs的量。
[0104]5.使用生物信息学方法鉴定基因组中的转录因子结合位点。对于Wnt途径的实例:使用已知的TCF4-13连环蛋白转录因子DNA结合序列,在人基因组序列上运行软件方法,并鉴定基因启动子区中和其他基因组区中潜在的结合位点。
[0105]6.与3类似,仅仅是不存在放线菌酮。
[0106]7.与4类似,仅仅是不存在放线菌酮。
[0107]8.特定组织或细胞样品的mRNA表达概况,其中已知途径是有活性的,但在不存在合适的阴性对照条件的情况下。
[0108]在最简单的形式中,技术人员能够对其中鉴定目标mRNA的这些实验方法的每一种给予潜在的目标mRNA I分。
[0109]或者,分能够递增给予,表示一种技术I分,第二种技术加第二分,等等。使用该相对分级策略,技术人员能够形成最可靠的目标基因的列表。
[0110]或者,可以使用以另一种方式的分级来鉴定最可能是直接目标基因的目标基因,通过给予提供体内直接目标基因最多证据的技术更高数目的分,在上文的列表中,这将表示对实验方法I)为8分,对2)为7分,并且降低至对实验方法8为I分。这样的列表可以被称为“一般目标基因列表”。
[0111]尽管存在生物学变异和不确定性,但发明人假定直接目标基因最可能以组织不依赖的形式来诱导。这些目标基因的列表可被称为“证据组织目标基因列表”。已经使用这些组织的目标列表来构建计算模型,其能够应用于来自不同组织来源的样品。
[0112]“一般目标基因列表”可能包含更加组织特异性的基因,并且能够潜在地用于优化并增加应用于来自特定组织样品如乳腺癌样品的模型的灵敏度和特异性。
[0113]以下将示例性说明证据组织目标基因列表的选择如何具体构建ER途径。
[0114]为了选择用作“模型”的输入的ER目标基因的目的,使用以下三种标准:
1.基因启动子/增强子区含有雌激素应答元件(ERE)基序:
a.应该证明ERE基序响应雌激素,例如通过其中特定ERE基序连接报道基因的瞬时转染测定的手段,和
b.ERE基序的存在应该通过例如基因启动子/增强子区的富含基序分析来确定。
[0115]2.通过例如ChlP/CHIP实验或染色质免疫沉淀测定证实ER (差异地)体内结合所讨论的基因的启动子/增强子区:
a.证实当ER途径为有活性时ER结合基因的启动子/增强子区,和
b.如果ER途径没有活性,则(优选)不结合(或弱结合)基因的基因启动子/增强子区。
[0116]3.例如通过以下证实当ER途径是有活性的,该基因差异转录,
a.经实时PCR或微阵列实验的所讨论的基因的mRNA的倍数富集,或
b.经免疫沉淀测定证实RNAPol II结合基因的启动子区。
[0117]通过确定这样的基因为ER目标基因来完成选择,对于所述基因集合了足够且充分记载的证明上述所有三个标准均达到的实验证据。收集ER差异结合证据的合适实验是比较当暴露于或不暴露于雌激素时,响应雌激素的癌细胞系(例如MCF-7细胞系)中的ChlP/CHIP实验的结果。其同样适用于收集mRNA转录的证据。
[0118]上文讨论了目标基因选择方法的一般方法和更具体的实例,其已用于基于使用上述方法发现的证据来选择大量的目标基因。在对示例性途径即fct、ER、Hedgehog和AR途径的Bayesian网络模型中使用的目标基因列表分别显不于表1、表2、表3和表4中。
[0119]用于本文所述的ER途径的Bayesian网络的ER途径的目标基因(显示于表2中)包含基于它们文献证据分值选择目标基因;仅将具有最高证据分值的目标基因(优选本发明的目标基因)加入该短表中。还包括具有更低证据分值的那些基因在内的ER目标基因的完整列表显不于表5中。
[0120]显示于表1、表2、表3和表4中的Wnt、ER、Hedgehog和AR途径的目标基因的进一步亚选择或分级基于文献证据分值和使用联系探针组节点与对应的目标基因节点的训练后的条件概率表计算的比值比(odds ratios)的组合来进行。所述比值比为在推断途径活性中目标基因重要性的评估。通常,预期相比于具有更低比值比的目标基因,具有更高比值比的目标基因的表达水平可能对于途径的总体活性信息更多。然而,由于细胞信号传导途径的复杂性,应该理解更复杂的相互关系可以存在于目标基因与途径活性之间-例如,在分离中考虑具有低比值比的目标 基因的多种组合的表达水平可以比考虑具有更高比值比的目标基因更有证明性。在本文报道的fct、ER、Hedgehog和AR建模中,已经发现表6、表
7、表8和表9中显不的目标基因相比于更低分级的目标基因对预测Wnt、ER、Hedgehog和AR途径活性有更高的证明性(因此,表6-9中显示的目标基因根据本发明尤其优选)。尽管如此,鉴于使用获取技术诸如微阵列能够获得大量组基因的表达水平的相对容易,考虑在如图6中所不的Bayesian模型中利用表6、表7、表8和表9的目标基因的某些或全部,并且任选额外使用表1、表2、表3和表4中显示的分级的一个、两个、某些或全部额外的目标基因。
[0121]表1.用于Bayesian网络中的Wnt途径的目标基因和用于测量目标基因的mRNA表达水平的相关探针组的证据组织列表(# =附加序列表中的序列编号)。
【权利要求】
1.一种方法,其包括: 至少基于在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20)来推断所述医疗受试者的组织中的一种或多种细胞信号传导途径的活性,其中所述推断包括: 通过评价概率模型(40-1,…,40-7)优选Bayesian网络(40-1,…,40-7)的至少一部分来推断医疗受试者的组织中一种或多种细胞信号传导途径的活性,其表示对于一组输入的一种或多种细胞信号传导途径,所述一组输入包括至少在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20); 估计医疗受试者的组织中至少一种转录因子(TF)元件(至少一个控制一种或多种细胞信号传导途径的一个或多个目标基因的TF元件)的水平(46),所述估计至少部分基于与至少一个TF元件和在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的一个或多个表达水平(20)有关的条件概率; 基于组织样品中转录因子的估计水平来推断一种或多种细胞信号传导途径的活性;和 基于医疗受试者的组织中的一种或多种细胞信号传导途径的推断活性来确定在医疗受试者的组织中一种或多种细胞信号传导途径是否运行异常; 其中通过数字处理设备(12)使用一种或多种细胞信号传导途径的所述概率模型(40-1,…,40-7)来进行所述推断。
2.权利要求1的方法,其中所述推断包括: 估计医疗受试者的组织中由概率模型的TF节点所代表的至少一种转录因子(TF)元件的水平(46),所述TF元件控制一种或多种细胞信号传导途径的一个或多个目标基因的转录,所述估计至少部分基于与代表在医疗受试者的组织的提取样品中测量的一种或多种细胞信号传导途径的一个或多个目标基因的概率模型中的所述TF节点和多个节点相关的所述概率模型(40-1,…,40-7)的条件概率; 并且其中所述推断优选通过使用包含代表关于所述一种或多种信号传导途径的信息的节点的Bayesian网络(40_1,…,40_7)及所述Bayesian网络的连接节点之间的条件概率关系来进行。
3.权利要求1或2中任一项的方法,其中所述一种或多种细胞信号传导途径包含fct途径、ER途径、AR途径和/或Hedgehog途径。
4.权利要求3的方法,其中所述推断包括: 至少基于在医疗受试者的组织的提取样品中测量的fct途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中Wnt途径的活性,所述目标基因选自包含以下的组:KIAA1199、AXIN2、RNF43、TBX3、TDGFl、S0X9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6 和 FZD7。
5.权利要求3或4的方法,其中所述推断(还)包括: 至少基于在医疗受试者的组织的提取样品中测量的ER途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中ER途径的活性,所述目标基因选自包含以下的组:CDH26、SGK3、PGR、GREB1、CA 12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1 和 NRIPl。
6.权利要求3— 5中任一项的方法,其中所述推断(还)包括: 至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中Hedgehog途径的活性,所述目标基因选自包含以下的组:GLI 1、PTCHl、PTCH2、IGFBP6、SPP1、CCND2、FST、FOXL1、CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXMUGLI3,TCEA2、FYN 和 CTSLl。
7.权利要求3— 6中任一项的方法,其中所述推断(还)包括: 至少基于在医疗受试者的组织的提取样品中测量的AR途径的一个或多个、优选至少三个目标基因的表达水平(20)来推断所述医疗受试者的组织中AR途径的活性,所述目标基因选自包含以下的组:KLK2、PMEPAl、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRGl、LRIGl、CREB3L4、LCPl、⑶CYI A3、AR 和 EAF2。
8.权利要求4的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的fct途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:NKDU OAT、FATl、LEFl、GLUL, REGIB、TCF7L2、C0L18A1、BMP7、SLC1A2、ADRA2C、PPARG,DKKl、HNFlA 和 LECT2。
9.权利要求5的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的ER途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:APlBl、ATP5J、C0L18A1、C0X7A2L、EBAG9、ESRl、HSPBl、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDMl5, PTMA, RARA, SODl 和 TR頂25。
10.权利要求6的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的Hedgehog途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:BCL2、F0XA2、FOXFU G19、HHIP, IL1R2、JAG2、JUP、MIF、MYLK, NKX2.2、NKX2.8、PITRMl 和 TOMl。
11.权利要求7的方法,其中所述推断进一步基于在所述医疗受试者的组织的提取样品中测量的AR途径的至少一个目标基因的表达水平(20),所述目标基因选自包含以下的组:APP、NTS、PLAU, CDKN1A、DRG1、FGF8、IGF1、PRKACB、PTPNU SGKl 和 TACC2。
12.权利要求1一 11中任一项的方法,其进一步包括: 为所述医疗受试者推荐开药,所述药物矫正一种或多种细胞信号传导途径的异常运行; 其中只有当基于一种或多种细胞信号传导途径的推断活性来确定所述一种或多种细胞信号传导途径在所述医疗受试者的组织中异常运行时,才进行所述推荐。
13.权利要求1一 11中任一项的方法,其中所述方法用于至少一种以下活动: 基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的诊断; 基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的预后; 基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的药物处方; 基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的药物效力的预测;基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的副作用的预测; 药物效力监测; 药物开发; 测定开发; 途径研究; 癌分期; 基于所述医疗受试者的组织中所述一种或多种细胞信号传导途径的推断活性的医疗受试者在临床试验中的注册; 待进行的后续测试的选择,和 伴随诊断测试的选择。
14.权利要求1一 13中任一项的方法,其包括: 至少基于在医疗受试者的组织的提取样品中测量的fct途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中Wnt途径的活性 和/或 至少基于在医疗受试者的组织的提取样品中测量的ER途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中ER途径的活性和/或 至少基于在医疗受试者的组织的提取样品中测量的Hedgehog途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中Hedgehog途径的活性, 和/或 至少基于在医疗受试者的组织的提取样品中测量的AR途径的一组目标基因中两个、三个或更多个的目标基因的表达水平(20)来推断所述医疗受试者的组织中AR途径的活性。
15.权利要求14的方法,其中 Wnt途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:KIAA1199、AXIN2、RNF43、TBX3、TDGF1、S0X9、ASCL2、IL8、SP5、ZNRF3、KLF6、CCND1、DEFA6和 FZD7, 和/或 ER途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:CDH26、SGK3、PGR、GREB1、CA12、XBP1、CELSR2、WISP2、DSCAM、ERBB2、CTSD、TFF1 和 NRIP1,和/或 Hedgehog途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:GLI1、PTCH1、PTCH2、IGFBP6、SPPU CCND2、FST、FOXLU CFLAR、TSC22D1、RAB34、S100A9、S100A7、MYCN、FOXMU GLI3, TCEA2、FYN 和 CTSLl, 和/或 AR途径的所述目标基因的组包括至少九个,优选所有选自包含以下的组中的目标基因:KLK2、PMEPAl、TMPRSS2、NKX3_1、ABCC4、KLK3、FKBP5、ELL2、UGT2B15、DHCR24、PPAP2A、NDRGl、LRIGl、CREB3L4、LCPl、⑶ CYI A3、AR 和 EAF2。
16.权利要求15的方法,其中 Wnt途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:NKDl、OAT、FATl、LEFl、GLUL、REGIB、TCF7L2、C0L18A1、BMP7、SLC1A2、ADRA2C、PPARG、DKKl、HNFlA 和 LECT2, 和/或 ER途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:APlBl、ATP5J、C0L18A1、C0X7A2L、EBAG9、ESRl、HSPBl、IGFBP4、KRT19、MYC、NDUFV3、PISD、PREDMl5, PTMA, RARA, SODl 和 TR頂25, 和/或 Hedgehog途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:BCL2、F0XA2、FOXFl、G19、HHIP、IL1R2、JAG2、JUP、MIF、MYLK、NKX2.2、ΝΚΧ2.8、PITRMl和 TOMl, 和/或 AR途径的所述目标基因的组进一步包括至少一个选自包含以下的组中的目标基因:APP、NTS、PLAU, CDKN1A、DRG1、FGF8、IGFU PRKACB, PTPNU SGKl 和 TACC2。
17.装置,其包含配置用于进行权利要求1一 16中任一项所述的方法的数字处理器(12)。
18.非临时性存储介质,其存储由数字处理设备(12)可执行以进行权利要求1一 16中任一项所述的方法的存储指令。
19.计算机程序,其包含用于使数字处理设备(12)进行权利要求1一 16中任一项所述的方法的程序代码工具。
20.权利要求18中所述的非临时性存储介质或权利要求19中所述的计算机程序用于疾病的特异性诊断或预测在具体阶段在具体癌类型中对药物的应答的用途。
【文档编号】C12Q1/68GK103649337SQ201280035666
【公开日】2014年3月19日 申请日期:2012年7月19日 优先权日:2011年7月19日
【发明者】W.F.J.维哈伊格, A.范德斯托佩, H.J.范奥詹, K.C.杜拉, M.阿维斯德恩达, R.霍夫曼恩 申请人:皇家飞利浦有限公司