早期乳腺癌的预后预测诊断用基因标记物及其用图_3

文档序号:9583544阅读:来源:国知局
定的计算式中而计算出数值的步骤;
[0041](e)根据上述数值的水平计算出乳腺癌预后良好或差的步骤。
[0042]根据对象患者或试样的不同,整体的基因表达量或表达水平可能存在差异,因此本发明中的检测对象的表达水平需要进行标准化。标准化利用能够显示出基本表达量或表达水平的差异的基因的表达量或表达水平的差异来进行,优选对CTBPl (C末端结合蛋白1,C-terminal-binding protein I)、TBP (TATA 结合蛋白,TATA-binding protein)、HMBS (轻甲基胆素合酶,hydroxymethylbilane synthase)、CULl (cullin 1,滞蛋白 I)和 UBQLNl (泛醌蛋白1,Ubiquilin-1)中的一种或五种基因的表达量(或者,在选择多个基因的情况下,为这些基因的表达量的平均值)进行测定,计算出相对于它们的表达量的比。
[0043]另一方面,本发明提供一种乳腺癌预后预测诊断方法,其包括利用引物对由乳腺癌患者的试样对下述选择的基因的mRNA表达水平进行测定的步骤,上述引物对是针对选自由TRBC1、BTN3A2和HLA-DPAl组成的组中的任意一个基因的引物对,上述引物对能够通过PCR扩增对对象基因进行扩增。
[0044]本发明提供一种引物对,其是针对选自由TRBC1、BTN3A2和HLA-DPAl组成的组中的任意一个基因的引物对,上述引物对能够通过PCR扩增对对象基因进行扩增。
[0045]本发明提供引物对在乳腺癌预后预测用制剂的制造中的应用,该引物是针对选自由TRBC1、BTN3A2和HLA-DPAl组成的组中的任意一个基因的引物对,上述引物对能够通过PCR扩增对对象基因进行扩增。
[0046]作为参考,上述提及的核苷酸和蛋白质操作可以参照下述文献。(Maniatis etal.,Molecular Cloning:A Laboratory Manual, Cold Spring Harbor Laboratory,ColdSpring Harbor, N.Y.(1982) ;Sambrook et al., Molecular Cloning:A LaboratoryManual, 2d Ed., Cold Spring Harbor Laboratory Press (1989) ;Deutscher, M., Guideto Protein Purificat1n Methods Enzymologyj vol.182.Academic Press.1nc.,SanDiego,CA(1990) ;Ausubel et al., Current Protocols of Molecular B1logy, JohnWiley and Sons (1997) ;Rupp and Locker,Lab Invest.56:A67 (1987) ;De Andres etal.,B1Techniques 18:42044 (1995) ;Held et al.,Genome Research 6:986-994 (1996);T.E.Godfrey et al.J.Molec.Diagnostics 2:84-91 (2000) ;K.Specht et al., Am.J.Pathol.158:419-29 (2001)).
[0047]发明的效果
[0048]本发明提供早期乳腺癌的预后预测诊断用的基因标记物。本发明的基因标记物能够进行乳腺癌患者的预后和预测的诊断,因此,以抗癌治疗的必要性判断为代表,能够有效地用于对之后的乳腺癌治疗方向提供头绪的目的。
【附图说明】
[0049]图1a是表示基于乳腺癌组织的微阵列数据的策管(curat1n)和预处理(pre-processing)的标准化过程的示意图。图1b是表示由发现数据集发掘预后预测基因的过程的图。
[0050]图2是将预后预测模型(冷冻试样)在发现数据集中进行验证的结果。9a中,将利用预后预测模型得到的全体患者的预后预测指数4等分,分类为4个预后组后,确认各预后组的观察生存概率是否良好地分离。对观察生存概率与预测生存概率也进行了比较。9b中对全部患者的观察生存概率与利用预后预测模型预测出的生存概率进行了比较。9c是针对影响力最高的P.均值将全部患者分为四个组、考察各组的观察生存概率与利用预后预测模型预测出的生存概率是否一致的图。9d是针对5年生存率考察观察生存概率与预测生存概率的一致程度的图。
[0051]图3是在验证集I中对预后预测模型进行验证的结果。与在发现数据集中进行验证的方法相同。1a是针对判定的验证结果,1b是针对观察时间的校正的验证结果。1c是针对5年生存率的校正的验证结果。
[0052]图4是在验证集2中对预后预测模型进行验证的结果。与在发现数据集中进行验证的方法相同。Ila是针对判定的验证结果,Ilb是针对观察时间的校正的验证结果。Ilc是针对5年生存率的校正的验证结果。
[0053]图5是在验证集3中对预后预测模型进行验证的结果。与在发现数据集中进行验证的方法相同。
[0054]图6是针对所选择的P-基因的FFPE试样(西门子、纵轴)/冷冻试样(冷冻、横轴)间的关联性测定结果,基因的名称和关联性的值(cor)分别如记载所示。
[0055]图7是针对所选择的1-基因的FFPE试样(西门子、纵轴)/冷冻试样(冷冻、横轴)间的关联性测定结果,基因的名称和关联性的值(cor)分别如记载所示。
【具体实施方式】
[0056]以下通过实施例详细说明本发明。
[0057]但是,下述实施例仅为本发明的示例,本发明的内容不限于下述实施例。
[0058]关于本说明书的实施例,是将韩国专利公开公报第10-2012-0079295号和PCT公开公报W02012093821A2所公开的内容全部作为参考引入本说明书,对本发明所属技术领域的水平和本发明的内容进行更明确的说明。
[0059]<实验方法>
[0060]早期乳腺癌组织的表达谱的收集
[0061]利用早期乳腺癌患者的冷冻癌组织得到的表达谱和临床信息从公开数据库GEO (http://www.ncb1.nlm.nih.gov/geo)进行收集。共计9个独立的表达谱集是各自由100个以上的样品构成的较大的数据集,均是为了进行与早期乳腺癌患者的预后相关的研究而制作的。(2,4,9,10,13,25,32,33)。其中8个数据集是利用昂飞U133A微阵列平台制作的,只有余下的一个是利用安捷伦Hu25K制作的。多数情况下,同时收集了患者的重要临床信息(年龄、性别、癌的大小、转移状态和分化程度)和生存信息。8个利用昂飞U133A制作的数据集中,6个数据集的生存信息针对的是无远处转移生存期(distant metastasisfree survival),余下的2个为总生存期(overall survival)。安捷伦数据具有针对远处转移的生存信息。由于远处转移在决定预后方面是最具决定性的事项、远处转移由癌的固有特性决定、并且收集到的数据中具有针对远处转移的信息的患者最多,因此,决定基于是否存在远处转移来进行生存分析。对收集到的全部患者的信息进行比较,剔除重复的186名患者的表达谱,对共计1861名独立患者进行了研究。对于利用同一平台(昂飞U133A)制作的7个数据集,收集对应的全部患者的表达谱的原文件(.CEL),进行标准化。关于标准化方法,进行rma (背景校正:rma,标准化:分位数标准化,汇总:中位数平滑)方法,在执行标准化时,利用了 Manhong Dai等人开发的自定义⑶F (http: //brainarray.man1.med.umich.edu/Brainarray/) ENTREZG版本13 (34)。标准化后,各探针的表达量减去发现数据集内的各探针的平均值,由此将1-色(color)表达量转换为与2-色表达量相同的形态。将共计8个标准化后的数据集中的5个数据集汇总为一个数据集来作为发现数据集使用,将2个数据集另行汇总为验证数据集1,将余下的一个作为验证数据集2使用。安捷伦数据集作为验证数据集3使用。
[0062]患者的预后和ER状态的定义设定
[0063]为了发掘与患者的预后相关的基因,将收集到的患者分类为预后良好的组和预后差的组。一般来说,利用临床上5年生存或者转移信息来进行分类。S卩,将5年内发生转移或死亡的情况称为预后差,将5年以上未转移或生存的情况称为预后良好。利用发现数据集的患者信息,对发生了转移的患者的生存时间分布进行了考察。发生了转移的患者中的73%以上在5年以内发生了转移,在10年以后观察到转移的情况不足7%。基于此,将发现数据集的患者中5年以内发生了转移的217名患者分类为“预后差的组”,将10年以上未发生转移的281名患者分类为“预后良好的组”。分类的结果,预后差的组的生存时间中位数为2.4年,预后良好的组的生存时间中位数为12.9年。通过明确分类为预后差的组和预后良好的组,能够将由不准确的生存信息所致的错误降至最低限度。是否表达雌激素受体是对乳腺癌患者进行亚型分类时最普遍使用的基准。通常在临床上,根据病理学者做出的ERIHC (免疫组织化学,immunohistochemistry)判断结果,分为ER+或ER-。在收集到的发现数据集中,约200名患者不具备ER IHC信息,考虑到构成发现数据集的5个数据集独立地确定了 ERIHC,利用各患者的表达谱中的ESRl基因的mRNA表达量确定了 ER状态。对于具备ER IHC信息的患者,利用ER IHC信息和ESRlmRNA表达量进行了 ROC(收敛域,reg1nof convergence)分析。对ER IHC结果和ESRlmRNA表达量进行比较,将准确度(0.88)最高的表达量的点作为截止值,在显示出截止值以上的表达量的情况下分类为ER+,在显示出截止值以下的表达量的情况下分类为ER-。在发现数据集中,864名配置为ER+,240名配置为 ER-。
[0064]预后预测基因的选择
[0065]在发现数据集中,将预后良好的组和预后差的组分类为ER+、ER-的情况。预后良好的患者共计275名,预后差的患者为218名。通过SAM(微阵列显著性分析,SignificantAnalysis of Microarray)分析,考察了在预后组之间表达量产生差异的基因。利用SAM分析结果的q_值,选择出预后良好的组中过表达的基因、预后差的组中过表达的基因。将选择出的基因汇总在一起,结果制作出共计302个不重复的基因集
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1