专利名称:组织特异性相互作用拓扑网络构建与分析方法
技术领域:
本发明涉及一种拓扑网络的构建与分析。特别是涉及一种组织特异性相互作用拓扑网络构建与分析方法。
背景技术:
组织特异性基因(tissue-specific genes),是指不同的细胞类型进行特异性表达的基因,其产物赋予各种类型细胞特异的形态结构特征与特异的生理功能,在特别细胞类型中大量(通常)表达并编码特殊功能产物。转录因子(transcription factor)是一群能与基因5端上有特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。转录因子又称为序列特异性DNA绑定因子(sequence-specific DNA-binding factor),绑定到特定的 DNA序列,从而控制着遗传信息从DNA向mRNA的传递。转录因子独立或者与其它蛋白质以一种复杂的模式发挥作用,对特定基因向RNA聚合酶的转录起到增强或者抑制的作用。转录因子绑定到DNA序列的增强子(enhancer)区域或者启动子(promoter)区域。组织特异性编码蛋白(Tissue-specific proteins)就是由组织特异性基因指导合成的一类蛋白质,是组织特异性基因表达的结果,例如表皮的角蛋白、肌肉细胞的肌动蛋白和肌球蛋白、红细胞的血红蛋白等。这类蛋白与细胞的特殊性有着直接的关系,从而导致了组织的特殊性。而且,组织特异性编码蛋白往往能够揭示出关于DNA相关功能的丰富信息,在组织特异性方面起着决定性的作用。随着计算生物学的发展和人类基因组等相关的基因组计划的完成,为我们提供了大量的基因表达与调控关系的数据,为研究组织特异性基因、转录因子以及编码蛋白相互作用的关系提供了丰富的信息资源。利用现在的计算生物学技术发现基因表达与组织特异性的内在机制,成为现代生物信息学中具有挑战性的任务之一。其中组织特异性表现在组织特异性基因、组织特异性转录因子以及组织特异性编码蛋白三个方面。虽然,已经存在的组织特异性基因、组织特异性转录因子以及编码蛋白的数据量比较丰富,但是这些数据复杂而又分散,不能为我们在研究组织特异性的内在机制提供准确而又全面的信息。目前大部分工作还是集中在如何更加精确的获得组织特异性基因、转录因子和编码蛋白上,未能考虑到生物现象产生的多因素原因。在国内目前还不存在构建组织特异性基因、转录因子和编码蛋白的拓扑网络方面的技术专利。但是国际上存在一些相关领域的技术专利。LEMISCHKAIHORUS禾口 PRITSKER MOSHEUS的专利名称“基因相互作用的分析方法”,专利申请号US20060524043,优先权US20060524043、US20050718533P。该发明提供了一种孤立的互动多核苷酸序列,其中包含一个标签和两个或更多的遗传因素。该发明还提供了识别两个或更多的遗传因素相互作用的方法。该发明实施提供了一种分析和确定在不同培养条件下或作为或病理分化细胞发育,结果两个或两个以上,其中遗传因素相互作用的遗传因素相互作用,刺激或抑制细胞生长的方法。MYRIAD GENETICS INCUS的专利名称“蛋白质的相互作用”,专利申请号 US20020105959,优先权US20020105958、US20010278428P。该发明涉及的新型蛋白质相互作用的发现,在哺乳动物的生理途径,包括生理疾病或疾病有关。生理紊乱和疾病的例子包括非胰岛素依赖型糖尿病(NIDDM),神经退行性疾病如阿尔茨海默氏病(AD),等等。因此, 该发明是针对这些蛋白质复合物和/或他们的片段,以配合物的抗体,生殖生理疾病(包括诊断,以倾向和存在的障碍诊断),药物筛选诊断为代理商的调节蛋白质相互作用的描述外,并在共同的途径额外的蛋白质鉴定蛋白质所述。系统生物学认为,任何生物现象的产生是多种因素综合作用的结果。组织特异性基因及其转录产物与转录因子之间相互作用关系是理解组织特异性形成机制及其生物标志物发现的一个重要线索。
发明内容
本发明所要解决的技术问题是,提供一种通过已经辨识的组织特异性基因,获取其转录因子及编码蛋白,构建组织特异性基因、转录因子、编码蛋白三种相互作用网络,并分析其网络结构特性,辨识出具有组织特异性的功能模块的组织特异性相互作用拓扑网络构建与分析方法。本发明所采用的技术方案是一种组织特异性相互作用拓扑网络构建与分析方法,包括集成的相互作用网络节点相似性度量、组织特异性相互作用网络的构建模块、相互作用网络的拓扑分析模块和组织特异性功能模块的辨识模块;其中,所述的组织特异性相互作用网络的构建模块,包括组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;所述的相互作用网络的拓扑分析模块,包括统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;所述的组织特异性功能模块的辨识模块,包括从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识,即相关的组织特异性基因、转录因子和编码蛋白; 通过比较目标集合与Gene Ontology和KEGG生物领域知识库的拟合程度,从而实现组织特异性功能分析,对结构组织特异性分析,是通过统计相互作用网络中相似结构的子网来实现。所述的集成的相互作用网络节点相似性度量是假设相互作用网络中的两个节点Ii1, Ii2,存在m个证据E1, E2, L,Effl支持他们之间的
相互作用,采用下面的公式来度量Ii1, n2的相似性
权利要求
1.一种组织特异性相互作用拓扑网络构建与分析方法,其特征在于,包括集成的相互作用网络节点相似性度量、组织特异性相互作用网络的构建模块、相互作用网络的拓扑分析模块和组织特异性功能模块的辨识模块;其中,所述的组织特异性相互作用网络的构建模块,包括组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;所述的相互作用网络的拓扑分析模块,包括统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;所述的组织特异性功能模块的辨识模块,包括从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识,即相关的组织特异性基因、转录因子和编码蛋白;通过比较目标集合与Gene Ontology和KEGG生物领域知识库的拟合程度,从而实现组织特异性功能分析,对结构组织特异性分析,是通过统计相互作用网络中相似结构的子网来实现。
2.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的集成的相互作用网络节点相似性度量是假设相互作用网络中的两个节点I^n2,存在m个证据E1, E2, L,Effl支持他们之间的相互作用,采用下面的公式来度量Α,n2的相似性
3.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性基因相互作用的网络构建,包括利用文献挖掘的形式在生物学文献数据库中抽取出组织特异性基因;获取支持组织特异性基因相互作用的证据,所述的相关的证据包括基因表达数据、转录因子绑定以及启动子序列模式相似性;通过距离计算转化为概率,从而得到表达数据的证据;通过统计两个基因绑定的共同转录因子计算得到转录因子绑定的证据;
4.根据权利要求3所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的启动子序列的模式相似性是通过如下公式计算得到
5.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性转录因子相互作用的网络构建,对候选的组织特异性基因,利用 TRANSFACT等数据库获取其转录因子,通过分析组织特异性基因promoter区域与转录因子的绑定位点出发,研究转录因子之间的相互作用关系,首先统计转录因子在同一绑定位点共现的频度,根据这些频度数据构建转录因子之间的相互作用网络,然后通过已知的蛋白质相互作用网络及它们调控的目标基因的共表达关系来修正网络的结构。
6.根据权利要求1所述的组织特异性相互作用拓扑网络构建与分析方法,其特征在于,所述的组织特异性编码蛋白相互作用网络构建是,对候选的组织特异性基因,获取其编码蛋白;选取编码蛋白之间相互作用的证据,所述证据包括基因表达数据、蛋白表达数据、DIP相互作用数据;通过直接计算距离转化为概率得到前两个证据,即基因表达数据和蛋白表达数据;根据数据库的描述项来计算DIP相互作用数据;根据上面得到的三个证据来构建编码蛋白之间相互作用的网络。
全文摘要
一种组织特异性相互作用拓扑网络构建与分析方法,有集成的相互作用网络节点相似性度量;组织特异性相互作用网络的构建模块,包括组织特异性基因相互作用的网络构建、组织特异性转录因子相互作用的网络构建和组织特异性编码蛋白相互作用网络构建;相互作用网络的拓扑分析模块,包括统计网络中各个节点的连接度、统计网络中各个节点的中介度、计算网络中各个节点的紧密性、计算相互作用网络中的最大集团和统计出相互作用网络中的Hub节点;组织特异性功能模块的辨识模块,包括从基因本体数据库和KEGG生物领域知识库中获取相关的组织特异性知识。本发明提供了从遗传信息出发构建相互作用网络的理想方法,并是研究组织特异性内在机制比较理想的分析工具。
文档编号G06F19/12GK102184346SQ20111011859
公开日2011年9月14日 申请日期2011年5月9日 优先权日2011年5月9日
发明者宫秀军, 田彬 申请人:天津大学