一种结构域映射蛋白相互作用组的定量分析方法

文档序号:6148604阅读:400来源:国知局
专利名称:一种结构域映射蛋白相互作用组的定量分析方法
技术领域
本发明属蛋白质组学生物信息学领域,涉及一种结构域映射蛋白相互作用组的定 量分析方法。
背景技术
现有技术公开了定量蛋白质组学技术鉴定蛋白相互作用目前的研究已经不局限 于每个单个蛋白或者其的差异变化,而是面向整个蛋白相互作用网络。这些错综复杂的网 络以传导各种外界和内在信息,形成功能显著的信号传导通路,调控生理反应,并交叉在一 起构成细胞的真实生命图景。而构成这些网络结构主体的各种蛋白质,通过相互联系、相互 作用和相互制约的关系中来形成复杂的蛋白质复合体,级联传递各种信息和各种反馈调节 的调控网络而发挥其功能和活性作用的,并最终组成更为错综复杂、具有多维时空特性的 生命网络体系。通过研究蛋白质相互作用关系,不仅可以发现许多新的相互关系及其生物 学功能,更可以对整个细胞调控网络进行全面的认知,这对于发现许多重要的药物作用靶 点和疾病诊治靶标有着基于分子水平机理的科学的启示作用。现有技术的定量方法主要包 括体外标化学反应记和体内生命代谢标记。结构域与蛋白质相互作用的关系结构域是蛋白质序列中具有进化保守性的一段 氨基酸序列,是蛋白质分子相互作用的结构基础,同时也是细胞整个信号调控网络中的最 小功能单位。结构域信息对于预测和分析鉴定蛋白质间相互作用网络具有重要价值。近年 来已出现多种基于结构域信息的相互作用预测方法,从已有数据库中提炼出不同结构域相 互作用的概率,再用生物信息学方法进行未知数据的预测,为实验提供可能性的前提。另 外,结构域组合间相互作用是蛋白质相互作用中的基本单元的假设,暗示具有相同或者相 似结构域的不同蛋白可能通过协同的或者拮抗的方式与某一目标蛋白相互作用来传导信 号、反馈调节、行使特定的生物学功能。据报道,Jing使用基于结构域的聚类方法来分析 14-3-3蛋白的相互作用关系,结果发现了具有某一特定功能结构域的蛋白簇群通过与靶蛋 白构成相互作用组来发挥其在细胞骨架与细胞形态上的特定功能(Current Biology, 14, 1436-1450)。聚类分析方法聚类分析属于无监督学习的范畴,常用于目标观测对象的分类。就 是在没有先验知识的情况下,基于“物以类聚”的观点,利用表征观测对象的一组变量对目 标按照它们在性质上的亲疏、相似程度进行分类。基本思想是在多维模式空间中,任何一个 子集内部样本之间的相似性即同类内相似性大于不同子集样本之间的相似性,即类于类之 间的相似性。分层聚类分析(hierarchical clustering analysis,又称系统聚类分析),是 把模式样本聚合成一系列聚合类的分层结构,所得到的系统结构可由一个树形图来表示。 聚类结果使用树形图(Dendrogram)和灰度梯度图相结合进行可视化表示。

发明内容
本发明的目的是提供一种结构域映射蛋白相互作用组的定量分析方法。
具体而言,本发明利用“双标签”蛋白质组学技术定量化检测蛋白质相互作用,并 通过所鉴定到蛋白质的结构域和定量信息即相互作用程度来分别进行双边聚类和可视化 分析,最终得到了靶蛋白相互作用网络中全体蛋白质独特的、多层次的、合理的结构及功能 分类,表现出蛋白质通过特定的结构域以及与靶蛋白不同的相互作用程度来响应特定细胞 过程的生物学意义。本发明结合蛋白质的结构域特征和对应的相互作用定量信息分别对所鉴定到的 蛋白质进行双边聚类和可视化分析,得到对相互作用网络中蛋白质独特的、多层次的、合理 的结构及功能分类,以进一步分析具有某一特定结构和功能蛋白质群体在相互作用网络中 对于特定生物过程的响应情况。包括下述步骤步骤1 采用“双标签”(表位标签和稳定同位素标记氨基酸标签)定量蛋白质组 学技术对相互作用蛋白(蛋白复合物)进行定性鉴定和定量分析,得到与靶蛋白相互作用 蛋白的名称和对应的结合程度即定量数据;其中的表位标签为Flag ;稳定同位素标记氨基酸标签为氘代亮氨酸Cl3-Leu ;步骤2 从蛋白质结构域数据库 SMART (Simple Modular Architecture Research Tool)和PfanKProtein Family Database)中获得步骤1所鉴定的所有相互作用蛋白的功 能结构域信息;步骤3 将步骤2的所有结构域名称混合并按字母顺序排列作为列,将所有鉴定到 的蛋白名称作为行。用步骤一中得到的每个蛋白质的定量数据来表示相应各个蛋白所有结 构域的定量数值,用零代表不存在的结构域,最后生成蛋白质X结构域(MXN)的数据矩 阵;步骤4 使用蛋白结构域的相关系数(Correlation Coefficient)作为样本相似 性测度,采用最小距离法(Single linkage)作为类间相似度依据,对蛋白及其结构域进行 双边聚类分析,采用树形图(Dendrogram)来反映不同蛋白和不同结构域的系统聚类结构关系。步骤5 采用灰度梯度图来可视化的展示相互作用蛋白的聚类模式,用不同颜色 的小方块标记来表示蛋白结合程度的定量信息,其中每个小方块表示一个数据点的定量信 息,其中所述的灰度梯度图可视化蛋白相互作用的结合程度,结合越多,颜色越浅。本发明方法结合定量蛋白质组学技术和生物信息学的数据挖掘方法,利用蛋白质 结构域的特征数据,对相互作用网络中的蛋白进行基于结构域的聚类分析,并结合蛋白相 互作用的定量信息对聚类数据进行定量差异可视化的研究,通过实验,结果显示,具有下述 优点提出一种独特的、多层次的、合理的蛋白质结构及功能分类方法,体现了一种新颖 的、多层次的、具有统计学意义和生物学意义的对蛋白质相互作用蛋白的分析策略,对于理 解H2AX的多功能性,以及以其为中心的蛋白质相互作用网络应答刺激的多层次性和多能 性有着很好的提示作用。本发明方法适用于对相互作用蛋白质数据的大规模分析。为了便于理解,以下将通过具体的附图和实施例对本发明的进行详细地描述。需 要特别指出的是,具体实例和附图仅是为了说明,显然本领域的普通技术人员可以根据本 文说明,在本发明的范围内对本发明做出各种各样的修正和改变,这些修正和改变也纳入 本发明的范围内。


图1为结构域映射蛋白相互作用组定量分析的全图,其中,横轴表示所有的蛋白质名称,纵轴表示所有的结构域,灰色盒表示对应蛋白 与靶蛋白相互作用的程度即定量数值,黑色表示无对应的结构域。图2为图1中A区域的放大图。图3为图1中B区域的放大图。
具体实施例方式实施例11、在博来霉素诱导细胞DNA损伤的条件下,使用“双标签”定量蛋白质组学技术 共鉴定到了 89种与靶蛋白H2AX相互作用的蛋白,将这些鉴定到的蛋白在SMART(Simple Modular Architecture Research Tool)禾口 Pfam(Protein Family Database)结构域数据 库中搜索,得到对应的结构域注释,即相应的SMART ID和Pfam ID的结构域列表;2、将步骤1得到的所有结构域的SMART ID和Pfam ID共269个混合并按字母顺 序排列作为列,将所有蛋白编号(GeneSymbol)作为行,用表示与H2AX相互作用的结合程度 的定量信息来表示相应各个蛋白所有结构域对应的定量数值,用零代表不存在的结构域, 生成数据矩阵;3、使用蛋白功能结构域的相关系数(Correlation Coefficient)作为样本相似性 测度,采用最小距离法(Single linkage)作为类间相似度依据,对蛋白和功能结构域进行 双边聚类分析,其中,相关系数的相似度计算公式为
其中, 最小距离法计算不同类的两个最近点之间的相似度作为两类间的相似度,公式 为 双边聚类算法通过下述步骤(1)计算每类间的相似度,形成相似度矩阵;(2)在相似度矩阵中寻找最相似的元素,合并行列对应的聚合类;(3)重新计算新的聚合类之间的相似度,形成新的相似度矩阵;(4)返回第2步,直至所有模式样本被聚合为一类,或聚合到规定的类别数,或所 有类别间距离均大于给定的相似度阈值;(5)使用树形图(Dendrogram)反映蛋白功能结构域的系统聚类结构关系。4、使用灰度梯度图进行可视化的展示相互作用蛋白的聚类模式,其中,使用具有 渐进性颜色差异的小方块标记表示蛋白结合程度的定量信息,每个小方块的灰度值表示一 个蛋白与H2AX相互作用定量的强度信息。
本发明方法使用结构域映射蛋白相互作用组的定量分析方法对博来霉素诱导条 件下H2AX相互作用蛋白进行了综合分析,实验结果显示获得了一些结构聚类显著的蛋白 质群体(如图1)。这些蛋白质类群具有相似的结构域来发挥相似的功能,参与相近的生物 过程。而蛋白质类群内相似的定量信息以及蛋白质类群之间不同的定量信息则反应了不 同功能蛋白质在行使功能时所需要参与的数量,以及不同功能在应答细胞反应所扮演的角 色,提示不同蛋白质类群因为不同功能而在细胞应答过程中的主辅和上下游的关系。由于 信号传导的级联性,往往上游的关键信号分子的蛋白相互作用变化较小,而下游的效应分 子变化巨大。有效关键功能的蛋白只需要轻微的改变相互作用程度就能够应对刺激而辅助 性的蛋白需要急剧的变化来接受信号配合应答。故相互作用的定量信息能够很好的解释在 信号调控网络中不同功能蛋白是通过不能程度的结合改变来构成一个多层次的调控网络 来适应新的环境,应答外界刺激,减小自身的副作用。本发明方法实验结果还显示,有一蛋白质聚类具有BRCT和FHA结构域的特征(如 图2)。该结构域被证明参与DNA损伤过程中的相互作用,并且具有与磷酸化肽相互结合的 功能。具有这个结构域的蛋白,包括MDCl,PARPl,NBN等都是DNA损伤应答过程中H2AX信 号传递的重要效应分子。而这类蛋白质在应答DNA损伤时与H2AX相互作用的强度变化是 比较微弱的,这也反映了这些蛋白质处于损伤信号传导通路的上游位置,扮演主要的信号 传递者的角色。本发明方法实验结果还显示,含有WD-40结构域的蛋白在聚类分析中出现了富集 (如图3),提示WD40结构域可能在DNA损伤修复过程中扮演非常重要的角色。这一结构域 是进化上十分保守的结构,有着广泛的分子功能,在许多细胞信号传导方面都有着不可替 代的作用。值得注意的是该一类蛋白是所有数据中定量信息变化最显著的群体,表明这一 蛋白类群在DNA损伤应答中的辅助角色或者是充当信号下游的分子。而具有这些结构的蛋 白质都是通过与H2AX相互作用,参与到H2AX相互作用网络中发挥各种的生物学功能来应 答外界的刺激。
权利要求
一种结构域映射蛋白相互作用组的定量分析方法,其特征在于,利用蛋白质组学技术定量化鉴定蛋白相互作用得其结构域特征,对该结构域特征进行双边聚类分析,得所述蛋白质聚类矩阵,再结合所述蛋白质对应的定量信息对所述的聚类分析图谱进行差异定量可视化的处理,获得对蛋白相互作用网络中蛋白质的结构及功能分类。
2.根据权利要求1所述的方法,其特征在于,其包括下述步骤1)采用“双标签”定量蛋白质组学技术对蛋白复合物即相互作用蛋白进行定性鉴定和 定量分析,得到与靶蛋白相互作用蛋白的名称和对应的结合程度即定量数据;2)从蛋白质结构域数据库中获得步骤1所鉴定的所有相互作用蛋白的结构域; 3)将步骤2的所有结构域名称混合并按字母顺序排列作为列,将所有鉴定到的蛋白名 称作为行,用步骤1得到的每个蛋白质的定量数据表示相应各个蛋白所有结构域的定量数 值,用零代表不存在的结构域,最后生成蛋白质X结构域的数据矩阵;4)采用蛋白结构域的相关系数作为样本相似性测度,用最小距离法作为类间相似度依 据,对蛋白及其结构域进行双边聚类分析,用树形图反映不同蛋白和不同结构域的系统聚 类结构关系;5)用灰度梯度图来可视化的展示相互作用蛋白的聚类模式。
3.根据权利要求1所述方法,其特征在于,所述蛋白质对应的定量信息为蛋白质与靶 蛋白相互作用的程度。
4.根据权利要求2所述的方法,其特征在于,所述步骤1)中的“双标签”定量蛋白质组 学技术为表位标签和稳定同位素标记氨基酸标签技术,其中的表位标签为Flag ;稳定同位 素标记氨基酸标签为氘代亮氨酸d3-Leu。
5.根据权利要求2所述方法,其特征在于,所述步骤2中的结构域数据库为Simple Modular Architecture Research Tool 禾口 Protein Family Database。
6.根据权利要求2所述的方法,其特征在于所述步骤3中到的结构域X蛋白质矩阵 体现蛋白质与靶蛋白相互作用程度的特征。
7.根据权利要求2所述的方法,其特征在于所述步骤4的蛋白功能结构域的相关系 数的相似度计算公式为 其中,
8.根据权利要求2所述的方法,其特征在于所述步骤4的最小距离法计算公式为d(r, s) = min(dist (xri, xsj)), i e (i, ... , nr), j e (1, ... , ns)。
9.根据权利要求2所述的方法,其特征在于,所述步骤4的双边聚类算法包括下述步骤(1)计算每类间的相似度,形成相似度矩阵;(2)在相似度矩阵中寻找最相似的元素,合并行列对应的聚合类;(3)重新计算新的聚合类之间的相似度,形成新的相似度矩阵;(4)返回第2步,直至所有模式样本被聚合为一类,或聚合到规定的类别数,或所有类别间距离均大于给定的相似度阈值;(5)使用树形图反映蛋白功能结构域的系统聚类结构关系。
10.根据权利要求2所述的方法,其特征在于,步骤5的灰度梯度图,其中不同深浅颜色 的小方块表示不同蛋白结合程度的定量信息。
全文摘要
本发明属蛋白质组学生物信息学领域,涉及一种结构域映射蛋白相互作用组的定量分析方法。本发明利用“双标签”蛋白质组学技术定量化检测蛋白质相互作用,并通过所鉴定到蛋白质的结构域和定量信息即相互作用程度来分别进行双边聚类和可视化分析,最终得到了靶蛋白相互作用网络中全体蛋白质独特的、多层次的、合理的结构及功能分类,表现出蛋白质通过特定的结构域以及与靶蛋白不同的相互作用程度来响应特定细胞过程的生物学意义。适用于对相互作用蛋白质数据的大规模分析。
文档编号G01N33/53GK101881766SQ20091005094
公开日2010年11月10日 申请日期2009年5月8日 优先权日2009年5月8日
发明者汪洋, 罗凯旋, 邹鹏, 陈先 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1