专利名称:一种肺腺癌血清标志物蛋白质的制作方法
技术领域:
本发明涉及肺腺癌早期诊断,特别是一种肺腺癌血清标志物蛋白质、其筛选方法 及其相关决策树模型和其检测方法。
背景技术:
肺腺癌是临床常见的恶性肿瘤之一。肺腺癌患者早期一般没有明显症状,70% 80%的病人在就诊时已处于晚期,5年生存率低于10%。极早期诊断或早期诊断是成功治 疗肺腺癌、改善预后和提高患者生存率至关重要的环节。大量研究显示肺腺癌的发生与吸 烟无关,其死亡率又非常高,因此,肺腺癌的极早期诊断和极早期治疗已成为国内外研究的执占。随着后基因组时代的到来,蛋白质组研究越来越受到国内外科技工作者的关注, 蛋白质组是指“一个细胞或一个组织基因组所表达的全部蛋白质”。从蛋白质组学角度看肿 瘤是一种蛋白质缺陷病,其发生过程中有许多蛋白质发生了异常变化,从而导致肿瘤组织 表达的蛋白质图谱的变化。肿瘤蛋白质组学研究主要是为了建立肿瘤细胞和组织的蛋白质 表达谱及研究肿瘤细胞和组织与正常细胞和组织之间差异表达的蛋白质,以期发现用于肿 瘤诊断、预后和治疗的分子标志物。当前,在蛋白质组学研究中最广泛使用的蛋白质分析方法是质谱技术。由质谱技 术发展而来的蛋白质指纹图谱SELDI-T0E-MS技术,即表面增强激光解析电离飞行时间质 谱,是一种包含层析与质谱的特殊蛋白质芯片技术,它综合了芯片微阵列与质谱技术两者 的优点。SELDI-T0F-MS包括蛋白质芯片、飞行质谱仪和分析软件三部分。其原理是利用高 能激光束使芯片中的分析物解析形成离子,根据不同质荷比,这些离子在仪器场中飞行的 时间长短不一,由此绘制出一张质谱图。经电脑处理后,直接显示样品中各种蛋白质的分子 量、含量等信息。同时还可将它与正常人或某种疾病患者的图谱,甚至数据库中的图谱进行 对照,从而发现和捕获新的疾病特异性相关蛋白及其特征。采用这种高灵敏度的蛋白质指 纹图谱技术寻找高特异性和高敏感性的肿瘤标志物已成为当前临床医学研究的热点之一。许多疾病包括肿瘤在发病早期,细胞内的蛋白质成分和数量都会发生一定的变 化,并在血清蛋白质中反映出来,因此比较不同人群血清中蛋白质的差异,可筛选出肿瘤相 关的特异性蛋白质(群)。国内外有许多肿瘤蛋白质组学研究均采用SELDI-T0F-MS的方 法,取得了很多成果。目前已寻找到肝癌、胃癌、前列腺癌、肾癌、卵巢癌、乳腺癌等血清肿瘤 特异性蛋白质。对于SELDI-T0F-MS得到的质谱图作分析研究一般采用生物信息学技术。 目前常用的程序是利用Ciphergen ProteinChip软件对分组数据及相关性进行分析,再用 BioMarker Wizard软件对芯片检测得到的蛋白质相对含量及蛋白质质荷比数据进行处理。 不同组、相同质荷比的蛋白质含量采用方差分析计算P值。将处理的数据以EXCEL的格式 导入Biomarker Patterns Software分析,选出最佳诊断蛋白质组决策树模型。通过血清及仪器标准化质控,肿瘤蛋白质组学必将对临床肿瘤研究起到决定性的 影响。
4
肺腺癌是临床常见的恶性肿瘤之一。肺腺癌患者早期一般没有明显症状,70% 80%的病人在就诊时已处于晚期,5年生存率低于10%。极早期诊断或早期诊断是成功治 疗肺腺癌、改善预后和提高患者生存率至关重要的环节。大量研究显示肺腺癌的发生与吸 烟无关,其死亡率又非常高,因此,肺腺癌的极早期诊断和极早期治疗已成为国内外研究的执占。目前肺癌特别是肺腺癌相关血清标志物特异性、敏感度低,因此临床医学亟待寻 找正确率、灵敏度、特异度高的新的肺腺癌相关血清标志物。
发明内容
为了解决上述技术问题,本发明提供了一种正确率、灵敏度、特异度高的肺腺癌血 清标志物蛋白质、其筛选方法及其相关决策树模型和其检测方法。本发明解决其技术问题所采用的技术方案是一种肺腺癌血清标志物蛋白质, 其存在于肺腺癌病人的血清中,用表面加强的激光解析电离飞行-时间质谱检测,采用 SAX-2蛋白芯片,包括质谱峰m/z 14022. 9、质谱峰m/z3735. 99或质谱峰m/z 14022. 9和m/ z3735. 99。进一步的所述表面加强的激光解析电力化-飞行时间质谱法检测的最适条件 是采用SAX-2蛋白芯片,使用蛋白质生物系统PBS II,激光强度165,灵敏度6,作用时间 90ns ο一种用于肺腺癌血清标志物蛋白质的筛选方法,其包括以下步骤(a)样品预处理所有肺腺癌患者于术前静脉采血5ml,健康对照组清晨空腹静脉采血5ml,采集空 腹全血标本5ml,立即置4°C下运送和保存,且于4h内4°C 4000r/min离心lOmin,取血清按 每管50 μ 1分装后置-80°C冰箱保存备用,①蛋白芯片活化:25mM PH9. OTris HCl加入SAX-2芯片的加样孔,200 μ 1/孔,放 上振荡器平衡15分钟,共两次;②样品稀释吸取6 μ 1样本加入234 μ 1 25mM PH9. OTris HCl,混勻;③上样将稀释后的样品200μ 1加入芯片的加样孔,在自动摇床上孵育1. 5h ;④洗脱甩去孔内液体,每孔加入200 μ 1 150mM Tris HCl PH7. 5洗脱10分钟,共 两次。再加300 μ 1去离子水冲洗一次,静置待干;⑤获能每孔加入能量吸收剂SPA0. 5μ 1,含饱和芥子酸溶于50%乙腈和0. 15% 三氟乙酸,待自然挥发后再加一次;⑥仪器检测用All-In-One标准蛋白质ΝΡ20芯片校正SELDI飞行质谱仪,设定仪 器参数,将芯片放入PBSII质谱仪处理,将研究范围限定为m/z 2000至20000,反复优化各 项参数后,设定激光强度165,灵敏度6,作用时间90ns,仪器自动读取数据,经计算机形成 模拟谱图;(b)统计学处理用Ciphergen ProteinChip软件对分组数据及相关性进行分析,用 BioMarkerffizard软件对不同组在相同质荷比的蛋白质含量数据进行初步分析归类,将所 有实验结果以EXCEL形式导出后进行统计,肺腺癌组与对照组数据利用t-test检验鉴定血
5清蛋白质差异表达谱峰,统计软件使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ值范 围 4.47Ε-42 至 0. 000907。为了得到的肺腺癌早期血清蛋白质群中,建立了 ρ值最小的两个蛋白质的决策树 模型,即m/z 14022. 9决策树模型和m/z 3735. 99决策树模型,一种用于筛选方法所得到的 相关决策树模型,,其建立相关决策树模型包括如下步骤(a)运用SELDI-T0F技术,采用SAX-2芯片,从肺腺癌患者血清和正常人血清中筛 选比较,找到差异蛋白峰共102个,ρ值范围4. 47E-42至0. 000907,建立了肺腺癌血清蛋白 质图谱;(b)肺腺癌组与对照组数据利用t-test检验鉴定血清蛋白质差异表达谱峰,统计 软件使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ < 0. 001 ;(c)应用Rweka软件工具建立分类决策树,决策树在判断某一质荷比峰强度与另 一临界点关系时,将数据集分为2个节点,分别用新的质荷比峰判断,产生新节点,反复叠 代至节点不能再分为止,从而得到稳定的决策树诊断模型;(d)为了检测该模型能否胜过随机猜测,将数据的组别标签随机打乱,然后利用训 练好的模型来预测,即采用perturbation test方法,最终结果ρ < 0. 0001,因此,该决策树 模型显著高于随机猜测结果,可见由于m/zl4022. 9有较好的区分能力,导致决策树只有一 个判断节点m/z 14022. 9 ;或将m/zl4022. 9剔除掉,用ρ值略大于它的m/z3735. 99重新训练决策树,应用 perturbation test方法,结果ρ < 0. 0001,该m/z3735. 99决策树模型也显著高于随机猜
测结果。用于检测血清中是否存在肺腺癌血清标志物蛋白质的方法,其检测方法包括以下 步骤(a)取血清样品;(b)用步骤(a)中的血清样品制备弱阴离子交换蛋白质芯片;(c)用表面加强的激光解析电力化-飞行时间质谱法检测,获得血清蛋白质组波 普;(d)确定是否存在质谱峰m/zl4022. 9、质谱峰m/z3735. 99或质谱峰m/zl4022. 9 和m/z3735. 99,存在所述波峰就表示存在所述的肺腺癌早期血清标志物蛋白质。本发明通过采用SAX-2蛋白芯片检测肺腺癌患者及健康对照者的血清蛋白质差 异性表达,筛选到102个有差异的质谱峰(ρ < 0. 001),建立肺腺癌蛋白质图谱,筛选得到其 中P值最小的两个蛋白质m/zl4022. 9,m/z3735. 99,并对这两个蛋白质进行决策树模型的 建立,其均有非常好的区分能力,在决策树模型中仅有它的参与就可获得诊断肺腺癌,其正 确率为98. 387%,盲测发现,其对肺腺癌的诊断正确率、灵敏度、特异度均为100%。
下面结合附图和实施例对本发明进一步说明。图1采用m/z 14022. 9建立决策树。图2采用m/z3735. 99建立决策树。
具体实施例方式肺腺癌血清标志物蛋白质存在于肺腺癌病人的血清中,用表面加强的激光解析电 离飞行_时间质谱检测,采用SAX-2蛋白芯片,包括质谱峰m/z 14022. 9、质谱峰m/z3735. 99 或质谱峰m/zl4022. 9和m/z3735. 99,所述表面加强的激光解析电力化-飞行时间质谱法检 测的最适条件是采用SAX-2蛋白芯片,使用蛋白质生物系统PBS II激光强度165,灵敏度 6,作用时间90ns。肺腺癌患者31名,其中男性19例,平均年龄61. 4岁;女性12例,平均年龄59. 6 岁,均经病理确诊,患者未经过任何放疗或化疗治疗。健康对照者选自无疾病证据的志愿 者,共31例,男性19例,平均年龄61. 1岁,女性12例,平均年龄59. 8岁。标本均取自苏州 大学附属第一医院,两组的性别、年龄、吸烟程度(以每日吸烟量与吸烟年数计量)一一匹 配。所有患者于术前静脉采血5ml,健康对照组清晨空腹静脉采血5ml。采集空腹全血标本5ml,立即置4°C下运送和保存,且于4h内4°C 4000r/min离心 lOmin,取血清按每管50 μ 1分装后置_80°C冰箱保存备用。肺腺癌组与对照组数据利用t-test检验鉴定血清蛋白质差异表达谱峰。统计软 件使用MATLAB 7. 5,筛选到102个有差异的质谱峰(ρ < 0. 001)。ρ值范围4. 47Ε-42至 0. 000907。以ρ值为序,升序排列,ρ值最小的10个蛋白质峰可见表1,ρ值范围4. 6Ε-21 至0. 000907的其它92个血清差异蛋白未列出。肺腺癌组与对照组血清差异蛋白质表达 强度见表1。表1肺腺癌组和对照组血清差异蛋白质表达及其强度 应用Rweka软件工具建立分类决策树,决策树在判断某一质荷比峰强度与另一临 界点关系时,将数据集分为2个节点,分别用新的质荷比峰判断,产生新节点,反复叠代至 节点不能再分为止,从而得到稳定的决策树诊断模型。本实验中共有病例和对照各31例, 146个峰(m/z小于3000由于读值不准,变异较大,已剔除),建立的决策树,如图1所示,该 决策树4倍交叉证实诊断正确率为98. 387 士0. 127%。为了检测该模型能否胜过随机猜测,将数据的组别标签随机打乱,然后利用训练 好的模型来预测,即采用perturbation test方法,最终结果ρ < 0. 0001。因此,该决策树 模型显著高于随机猜测结果。可见由于m/zl4022. 9有较好的区分能力,导致决策树只有一 个判断节点。将m/zl4022. 9剔除掉,用ρ值略大于它的m/z3735. 99重新训练决策树,如 图2所示,该决策树4倍交叉证实诊断正确率为98士0. 1414%,应用perturbation test方 法,结果P < 0.0001。该决策树模型也显著高于随机猜测结果。对这两个决策树模型采用与交叉证实的样本数相当的12个随机样本(包括肺腺 癌病人血清和正常对照血清)作盲测,诊断肺腺癌的正确率、灵敏度、特异度均为100%。上述方式中,所用到的筛选方法包括以下步骤(a)样品预处理所有肺腺癌患者于术前静脉采血5ml,健康对照组清晨空腹静脉采血5ml,采集空 腹全血标本5ml,立即置4°C下运送和保存,且于4h内4°C 4000r/min离心lOmin,取血清按 每管50 μ 1分装后置-80°C冰箱保存备用,①蛋白芯片活化25mM PH9. OTris HCl加入SAX-2芯片的加样孔,200 μ 1/孔,放 上振荡器平衡15分钟,共两次;②样品稀释吸取6 μ 1样本加入234 μ 1 25mM PH9. OTris HCl,混勻;③上样将稀释后的样品200μ 1加入芯片的加样孔,在自动摇床上孵育1. 5h ;④洗脱甩去孔内液体,每孔加入200 μ 1 150mM Tris HCl PH7. 5洗脱10分钟,共 两次。再加300 μ 1去离子水冲洗一次,静置待干;⑤获能每孔加入能量吸收剂SPA0. 5μ 1,含饱和芥子酸溶于50%乙腈和0. 15% 三氟乙酸,待自然挥发后再加一次;⑥仪器检测用All-In-One标准蛋白质ΝΡ20芯片校正SELDI飞行质谱仪,设定仪 器参数,将芯片放入PBSII质谱仪处理,将研究范围限定为m/z 2000至20000,反复优化各 项参数后,设定激光强度165,灵敏度6,作用时间90ns,仪器自动读取数据,经计算机形成 模拟谱图;(b)统计学处理用Ciphergen ProteinChip软件对分组数据及相关性进行分析,用 BioMarkerffizard软件对不同组在相同质荷比的蛋白质含量数据进行初步分析归类,将所 有实验结果以EXCEL形式导出后进行统计,肺腺癌组与对照组数据利用t-test检验鉴定血 清蛋白质差异表达谱峰,统计软件使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ值范 围 4.47Ε-42 至 0. 000907。建立相关相关决策树模型包括如下步骤(a)运用SELDI-T0F技术,采用SAX-2芯片,从肺腺癌患者血清和正常人血清中筛 选比较,找到差异蛋白峰共102个,ρ值范围4. 47E-42至0. 000907,建立了肺腺癌血清蛋白
8质图谱;(b)肺腺癌组与对照组数据利用t-test检验鉴定血清蛋白质差异表达谱峰,统计 软件使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ < 0. 001 ;(c)应用Rweka软件工具建立分类决策树,决策树在判断某一质荷比峰强度与另 一临界点关系时,将数据集分为2个节点,分别用新的质荷比峰判断,产生新节点,反复叠 代至节点不能再分为止,从而得到稳定的决策树诊断模型;(d)为了检测该模型能否胜过随机猜测,将数据的组别标签随机打乱,然后利用训 练好的模型来预测,即采用perturbation test方法,最终结果ρ < 0. 0001,因此,该决策树 模型显著高于随机猜测结果,可见由于m/zl4022. 9有较好的区分能力,导致决策树只有一 个判断节点m/zl4022.9 ;或将m/zl4022. 9剔除掉,用ρ值略大于它的m/z3735. 99重新训练决策树,应用 perturbation test方法,结果ρ < 0. 0001,该m/z3735. 99决策树模型也显著高于随机猜
测结果。而对于用于检测血清中是否存在肺腺癌血清标志物蛋白质的方法为(a)取血清样品;(b)用步骤(a)中的血清样品制备弱阴离子交换蛋白质芯片;(c)用表面加强的激光解析电力化-飞行时间质谱法检测,获得血清蛋白质组波 普;(d)确定是否存在质谱峰m/zl4022. 9、质谱峰m/z3735. 99或质谱峰m/zl4022. 9 和m/z3735. 99,存在所述波峰就表示存在所述的肺腺癌早期血清标志物蛋白质。
9
权利要求
一种肺腺癌血清标志物蛋白质,其特征是所述肺腺癌血清标志物蛋白质存在于肺腺癌病人的血清中,用表面加强的激光解析电离飞行 时间质谱检测,采用SAX 2蛋白芯片,包括质谱峰m/z14022.9、质谱峰m/z3735.99或质谱峰m/z14022.9和m/z3735.99。
2.根据权利要求1所述的肺腺癌血清标志物蛋白质,其特征是所述表面加强的激光 解析电力化-飞行时间质谱法检测的最适条件是采用SAX-2蛋白芯片,使用蛋白质生物系 统PBS II,激光强度165,灵敏度6,作用时间90ns。
3.一种根据权利要求1所述的肺腺癌血清标志物蛋白质的筛选方法,其特征是所述 筛选方法包括以下步骤(a)样品预处理所有肺腺癌患者于术前静脉采血5ml,健康对照组清晨空腹静脉采血5ml,采集空腹全 血标本5ml,立即置4°C下运送和保存,且于4h内4°C 4000r/min离心lOmin,取血清按每管 50 μ 1分装后置-80°C冰箱保存备用,①蛋白芯片活化25mMPH9.0 Tris HCl加入SAX-2芯片的加样孔,200 μ 1/孔,放上振 荡器平衡15分钟,共两次;②样品稀释吸取6μ1样本加入234 μ 1 25mM PH9. O Tris HC1,混勻;③上样将稀释后的样品200μ1加入芯片的加样孔,在自动摇床上孵育1. 5h ;④洗脱甩去孔内液体,每孔加入200μ 1 150mM Tris HCl PH7. 5洗脱10分钟,共两 次。再加300 μ 1去离子水冲洗一次,静置待干;⑤获能每孔加入能量吸收剂SPA0.5μ 1,含饱和芥子酸溶于50%乙腈和0. 15%三氟 乙酸,待自然挥发后再加一次;⑥仪器检测用All-In-One标准蛋白质ΝΡ20芯片校正SELDI飞行质谱仪,设定仪器参 数,将芯片放入PBSII质谱仪处理,将研究范围限定为m/z 2000至20000,反复优化各项参 数后,设定激光强度165,灵敏度6,作用时间90ns,仪器自动读取数据,经计算机形成模拟 谱图;(b)统计学处理用Ciphergen ProteinChip软件对分组数据及相关性进行分析,用BioMarkerWizard 软件对不同组在相同质荷比的蛋白质含量数据进行初步分析归类,将所有实验结果以 EXCEL形式导出后进行统计,肺腺癌组与对照组数据利用t-test检验鉴定血清蛋白质差异 表达谱峰,统计软件使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ值范围4. 47Ε-42至 0.000907。
4.一种根据权利要求3所述的肺腺癌血清标志物蛋白质的筛选方法所得到的相关决 策树模型,其特征是建立所述相关决策树模型包括如下步骤(a)运用SELDI-T0F技术,采用SAX-2芯片,从肺腺癌患者血清和正常人血清中筛选比 较,找到差异蛋白峰共102个,ρ值范围4. 47E-42至0. 000907,建立了肺腺癌血清蛋白质图 谱;(b)肺腺癌组与对照组数据利用t-test检验鉴定血清蛋白质差异表达谱峰,统计软件 使用MATLAB 7. 5,筛选到102个有差异的质谱峰,ρ < 0. 001 ;(c)应用Rweka软件工具建立分类决策树,决策树在判断某一质荷比峰强度与另一临 界点关系时,将数据集分为2个节点,分别用新的质荷比峰判断,产生新节点,反复叠代至节点不能再分为止,从而得到稳定的决策树诊断模型;(d)为了检测该模型能否胜过随机猜测,将数据的组别标签随机打乱,然后利用训练好 的模型来预测,即采用perturbation test方法,最终结果ρ < 0. 0001,因此,该决策树模型 显著高于随机猜测结果,可见由于m/zl4022. 9有较好的区分能力,导致决策树只有一个判 断节点m/zl4022. 9 ;或将m/zl4022. 9剔除掉,用ρ值略大于它的m/z3735. 99重新训练决 策树,应用perturbation test方法,结果ρ < 0. 0001,该m/z3735. 99决策树模型也显著高 于随机猜测结果。
5. 一种用于检测血清中是否存在权利要求1所述的肺腺癌血清标志物蛋白质的方法, 其特征是,所述检测方法包括以下步骤(a)取血清样品;(b)用步骤(a)中的血清样品制备弱阴离子交换蛋白质芯片;(c)用表面加强的激光解析电力化-飞行时间质谱法检测,获得血清蛋白质组波普;(d)确定是否存在质谱峰m/z14022. 9、质谱峰m/z3735. 99或质谱峰m/z 14022. 9和m/ z3735. 99,存在所述波峰就表示存在所述的肺腺癌早期血清标志物蛋白质。
全文摘要
本发明涉及肺腺癌早期诊断,特别是一种肺腺癌血清标志物蛋白质,同时还提供了其筛选方法及其相关决策树模型和其检测方法。本发明通过采用SAX-2蛋白芯片检测肺腺癌患者及健康对照者的血清蛋白质差异性表达,筛选到102个有差异的质谱峰(p<0.001),建立肺腺癌蛋白质图谱,筛选得到其中p值最小的两个蛋白质m/z14022.9,m/z3735.99,并对这两个蛋白质进行决策树模型的建立,其均有非常好的区分能力,在决策树模型中仅有它的参与就可获得诊断肺腺癌,其正确率为98.387%,盲测发现,其对肺腺癌的诊断正确率、灵敏度、特异度均为100%。
文档编号G01N30/14GK101923080SQ20101012869
公开日2010年12月22日 申请日期2010年3月22日 优先权日2010年3月22日
发明者史进方, 蒋敏, 顾国浩 申请人:苏州大学附属第一医院