一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法

文档序号:10655785阅读:724来源:国知局
一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法
【专利摘要】一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法,包括如下步骤:柽柳科植物rbcL 基因序列的获得;柽柳科植物17个物种的谱系分析及适应性位点检测;柽柳科植物Rubisco结构模拟及选择性位点分析;以柽柳科3个属17个种的rbcl基因为对象,以“分支?位点”为模型检测出该基因在氨基酸水平上共有3个正选择位点,这些选择性的位点不但与维持蛋白质的疏水性和熵值显著相关,而且与全球CO2浓度变化有关,同时也证明了柽柳科植物适应干旱生境与rbcL基因的适应性进化有关。
【专利说明】
-种检测怪柳科植物rbcL基因适应性进化与结构建模的方法
技术领域
[0001] 本发明设及一种检测怪柳科植物基因适应性进化与结构建模的方法。
[0002] 本发明W怪柳科3个属17个种的础C遥因为对象,用"分支-位点'模型检测出该基 因在氨基酸水平上共有3个正选择位点;通过Bioedit推测出运些选择性位点不但与维持蛋 白质稳定的疏水性和赌值显著相关,而且与全球C〇2浓度变化有关。
【背景技术】
[0003] 核酬糖-1,5-二憐酸簇化酶/加氧酶(Rubisco,EC4.1.1.39)被认为是世界上最 丰富的蛋白质,该酶具有双重功能,能催化两种反应:一是簇化反应;二是加氧反应。 Rubisco对净光合率具有决定性的影响,是光合碳同化的关键酶;所有绿色植物的Rubisco 都由8个大亚基和8个小亚基组成,大亚基由位于叶绿体的基因编码组成,基本包 含了酶催化所需的所有活性位点,其催化中屯、区域的氨基酸序列决定了催化效率;小亚基 目前功能未明,但也影响酶的催化效率。一般认为,Rubi SCO对C〇2的利用效率越高,光合作 用的效率就越高,植物适应环境的能力就越强。若能增加 C〇2和Rubisco大亚基的亲和力,可 显著提高光合作用的生产力。Jordan等人认为,进化的压力将使Rubisco对C〇2的利用向更 高的方向发展,因此环境因素诸如高溫、干旱和渗透压等都会导致编码大亚基的基因 发生适应性进化。
[0004] 基因水平检测适应性进化有助于理解基因的结构与功能变异和生物的进化史。通 过度量核巧酸序列非同义替换率(c/ N)与同义替换率W S)的比值(CO),可W判断自然选择 对非同义替换的固定是起推动还是阻碍作用。当N/V S大于1时,证明蛋白质发生有益的 氨基酸替换,表现为正选择作用。目前,用于正选择压力分析的主要有=类,第一类是计数 方法(counting method),在=类方法中第一类计数方法最为保守;第二类是随机效应似然 法(random effects IikeUhood models,REL),该算法允许同义替换存在位点间差异;第 S类是固定效应似然法(fixed effects 1化el化ood mode Is,邱L),该方法是第二类方法 的扩展,它W固定支长和核巧酸替换速率等为参数,对氨基酸位点逐个进行独立的替换率 计算,之后再借助似然比检验来确定氨基酸位点是否受到选择压力作用;上述模型检测到 的正向氨基酸微点存在假阳性,因此需要进一步通过贝叶斯途径将发生正向选择的氨基酸 位点加 W鉴定。
[0005] 怪柳科(Tamaricaceae)是一个古老的科,起源于第立纪,包括亚洲中部在内的" 古地中海"沿岸地区,该科世界分布,目前已知3-5属约120种;中国是怪柳科植物的重要分 布区,拥用多数种类,而且特有种较多,共有约4属近40种;本科植物的叶互生,1-5毫米长, 呈鱗片状,无托叶;花福射对称,两性,单生或排成总状花序或圆锥花序;花專和花瓣4-5、果 实为葫果;种子有束毛或有翅;它们大多是生长在干旱和半干旱区域的砂荒、沿盐溃化河流 泛滥地和滨海盐碱滩地、草原和盐碱地区域,能够容忍高达15,000 ppm的含盐量,因此非常 耐旱、耐盐、耐高溫,是我国西部和北方荒漠地带防风、固沙造林和水±保持的优良树种。
[0006] 怪柳科在被子植物中的系统学位置一直有较大的争议,近20年来,分子技术应用 到了怪柳科系统位置的研究中,但基于DNA序列性状对怪柳科进行的系统性研究所得的结 论与基于经典形态性状所得的结论不尽吻合;目前,从区系的发生与形成来看,怪柳科的红 砂属和琵琶柴属都是白聖纪、老第=纪不遗的特有植物;在运个观点下,可W推测,怪柳科 植物可能存在过一个相当长的干热时期,并在第四纪充分发展。
[0007] 作为编码光合碳同化的关键酶Rubisco的基因在分子水平有可能会发生适应性进 化;迄今,已经在多种陆生植物的基因中检测到正选择的作用,由此充分证实,针对 Rubisco提高C〇2利用效率的选择压力将导致基因的适应性进化;考虑到怪柳科植物对 恶劣环境的适应,因此可W推断怪柳科植物的基因经受了适应性进化;鉴于GenBank中 有大量的基因序列数据,本发明将对怪柳科的物种,利用PAML程序检测其基因的 适应性进化。

【发明内容】

[0008] 本发明的目的在于讨探怪柳科植物rbcL基因是否收到了正向选择作用,W及正向 选择的氨基酸位点上对Rubisco酶结构的影响,从而关联历史环境因素,探讨氨基酸位点的 选择作用与全球气候演变的关系;本发明将为深入了解怪柳科植物对逆境的分子适应机制 提供参考。
[0009] 为了实现本发明的上述目的,本发明提供了如下的技术方案: 一种检测怪柳科植物基因适应性进化与结构建模的方法,该方法包括怪柳科植物 rAcZ基因序列获得;怪柳科植物17个物种的谱系分析及适应性位点检测;怪柳科植物 Rubisco结构模拟及选择性位点分析; 怪柳科植物基因序列获得的步骤为:登录NCBI平台,查找所有怪柳科植物rAcZ 基因序列,排除不可靠及无完整Rubisco催化活性区的序列,并弃去基因非Rubisco催 化活性区的序列;通过在the GENSCAN Web Server at M口平台,输入所得的所有基 因序列,弃去编码太短或太长的氨基酸长度DNA序列;从上述平台上得到的氨基酸序列,通 过BLAST找到相应的蛋白质序列,使用PFAM定位它们的RuBisCo_large superfamily结构 域,确保得到的基因序列正确;最终分别得到怪柳科S个属的17条干净的DNA和氨基 酸序列;用Bioedit软件植入的ClustalW程序对17条核巧酸序列和氨基酸序列进行比对,并 随后对结果进行手工校正,得到适合化UP 4.0和Modeltest 3.7程序检测的数据矩阵; 怪柳科植物17个物种的谱系分析及适应性位点检测步骤:用化up 4.0和Modeltest 3.7程序检测最合适的进化模型;然后W八PWwrWenta为外类群,使用MEGA 6.0软件 植入的最大似然法(maximum Iikel化oocUML),建立怪柳科S个属的蛋白序列系统发育关 系树;基于ML系统发育关系树,WPAML 4.2中的COdeml程序,选择"分支-位点"模型中的M8 模型,检测怪柳科物种中存在的正选择位点;利用最大似然法估计出的模型参数值,再通过 贝叶斯定律计算出每个氨基酸所属位点类别的后验概率,根据后验概率,鉴定出正向选择 的位点; 怪柳科植物Rubisco结构模拟及选择性位点分析步骤:采用化yre2对红砂RubiSCO蛋 白S维结构建模,到置信度为100%的最佳模板PDB文件;用pymol软件显示PDB文件,并标注 出受选择性的位点;利用Bioedit 7.2.2软件植入的赌值分析及疏水性分析单元,结合 化yre2模拟的Rubisco结构,分析运些位点的变化对Rubisco结构及功能的影响。
[0010]结果表明:怪柳科植物的=个属的17个物种显示出了单系结构(图1),其中红砂属 最原始,而水柏枝属和怪柳属相对进化;支持怪柳科起源于古地中海区,随古热带成分盛 行,并在第四纪充分发展。选择"分支-位点"模型中的M8模型,经过贝叶斯后验概率去除假 阳性位点,检测到怪柳科物种中存在的正选择位点。=个位点分别为112,199和220(表 Do
[00111 棄1炫尬1獻1 7物!釉TF向佛巧仿占 M?腊刑捻細||
* represents for the significance lower than 0.05, ** for lower than 0.01.对比参考序列为1_6^。1日日化. 在112位点,氨基酸替代类型为41日-乂日';在119位点,为化'-〉^日或化尸〉617;而 在220位点,为lie-〉Met(表2); 表2怪柳科17物种受选择位点氨基酸替代类型 恩堅怔点分別米目于核甘酸仕;《6、
怔点天雙;利用化algorithm)(町全柳 科Rubisco蛋白S维结构建模,并标注出受选择的氨基酸位点(图2);发现运些受选择的位 点主要分布在Rubisco蛋白的a螺旋结构上;通过Bioedit 7.2.2分析运些位点的疏水性 和赌值,发现氨基酸替换使得=个位点的疏水性降低(图3),而赌值升高(图4);由于基 因编码Rubisco大亚基,疏水性和赌值变化与光合作用过程中C02利用效率相关联;结合全 球C02浓度变化,发现运些受选择的位点促进了 C3植物朝C4方向的进化,从而使得怪柳科植 物光合效率提高,适应了干旱的草原、荒漠环境。
【附图说明】
[0012] 图1:怪柳科17个物种核巧酸序列系统发育树 图2:红砂(化soongorica) 蛋白S维结构及受选择位点 图3: 突变位点蛋白疏水性变化 图4: 突变位点蛋白赌值变化
【具体实施方式】: 下面结合附图,用本发明实施例来进一步说明本发明的实施方式,但并不W此来限定 本发明。
[0013] -种检测怪柳科植物基因适应性进化与结构建模的方法概述:
[0014] 该方法包括:①怪柳科植物基因序列的获得;②怪柳科植物17个物种的谱 系分析及适应性位点检测;③怪柳科植物Rubisco结构模拟及选择性位点分析。 其中①怪柳科植物基因序列的获得的步骤为:登录NCBI平台,查找所有怪柳科植 物基因序列;排除不可靠及无完整Rubisco催化活性区的序列,并弃去基因非 Rubisco催化活性区的序列;通过在the GENSCAN Web Server at MIT平台,输入所得的所 有基因序列,弃去编码太短或太长的氨基酸长度DNA序列;从the GENSCAN Web Server at M口平台上得到的氨基酸序列,通过化AST找到相应的蛋白质序列,使用PFAM 定位它们的RuBisCo_large supe;rfamily结构域,确保得到的基因序列正确;最终分 别得到怪柳科S个属的17条干净的DNA和氨基酸序列;用Bioedit软件植入的Clus化IW程序 对17条核巧酸序列和氨基酸序列进行比对,并随后对结果进行手工校正,得到适合化UP 4.0和Modeltest 3.7程序检测的数据矩阵; 其中②怪柳科植物17个物种的谱系分析及适应性位点检测的步骤为: 用Paup 4.0和Modeltest 3.7程序检测最合适的进化模型;然后WF. 化lve;rulen1:a为外类群,使用MEGA 6.0软件植入的最大似然法(maximum UkeIihood,ML), 建立怪柳科S个属的蛋白序列系统发育关系树;基于ML系统发育关系树,WPAML 4.2中的 codeml程序,选择"分支-位点"模型中的M8模型,计算种间同义(synonymous )及非同义 (nonsynonymous)突变速率(〇=dN/dS)。当dN/dS =1,突变位点则认为是随机发生的;当 dN/dS<l,则认为此位点受到了纯化选择的作用;而当dN/dS〉l,则认为此位点受到了正向选 择的作用;利用最大似然法估计出的模型参数值,再通过贝叶斯定律计算出每个氨基酸所 属位点类别的后验概率,根据后验概率,检测出怪柳科物种中存在的正选择位点; 其中③怪柳科植物Rubisco结构模拟及选择性位点分析的步骤为:采用化yre2对红砂 Rubisco蛋白S维结构建模,到置信度为100%的最佳模板PDB文件。用pymol软件显示PDB文 件,并标注出受选择性的位点。利用Bioedit 7.2.2软件植入的赌值分析及疏水性分析单 元,结合化yre2模拟的Rubisco结构,分析运些位点的变化对Rubisco结构及功能的影响。
[0015]结果表明:怪柳科植物的=个属的17个物种显示出了单系结构(图1),其中红砂属 最原始,而水柏枝属和怪柳属相对进化,支持怪柳科起源于古地中海区,随古热带成分盛 行,并在第四纪充分发展的观点。通过"分支-位点"模型中的M8模型,经过贝叶斯后验概率 去除假阳性位点,检测到怪柳科物种中存在的正选择位点。=个位点分别为112,199和 220(表1)。在112位点,基酸替代类型为Ala-〉Ser;在119位点,为llir-〉Ala或Thr-〉 Gly;而在220位点,为lie-〉Met(表2)。运些位点分别来自于核巧酸在336、595及660位点突 变。矛Il用化yre2 a 1 gorithm对怪柳科Rubi SCO蛋白S维结构建模,并标注出受选择的氨基酸 位点(图2)。发现运些受选择的位点主要分布在Rubisco蛋白的a螺旋结构上。通过 Bioedit 7.2.2分析运些位点的疏水性和赌值,发现氨基酸替换使得=个位点的疏水性降 低(图3),而赌值升高(图4)。由于rbcL基因编码Rubisco大亚基,疏水性和赌值变化与光合 作用过程中C02利用效率相关联。结合全球C〇2浓度变化,发现运些受选择的位点促进了C3 植物朝C4方向的进化,从而使得怪柳科植物光合效率提高,适应干旱的草原、荒漠环境。
【主权项】
1. 一种检测柽柳科植物rbcL基因适应性进化与结构建模的方法,其特征在于包括如下 步骤:①柽柳科植物基因序列的获得;②柽柳科植物17个物种的谱系分析及适应性位 点检测;③柽柳科植物Rubisco结构模拟及选择性位点分析; 其中柽柳科植物rkZ基因序列获得的步骤为:登录NCBI平台,查找所有柽柳科植物 rkZ基因序列;排除不可靠及无完整Rubisco催化活性区的序列,并弃去rkZ基因非 Rubisco催化活性区的序列;通过在the GENSCAN Web Server at MIT平台,输入所得的所 有rkZ基因序列,弃去编码太短或太长的氨基酸长度DNA序列;从the GENSCAN Web Server at MIT平台得到的氨基酸序列,通过BLAST找到相应的蛋白质序列,使用PFAM定 位它们的RuBisCo_large superfami ly结构域,确保得到的基因序列正确,得到柽柳 科三个属的17条干净的DNA和氨基酸序列;用Bioedit软件植入的ClustalW程序对17条核苷 酸序列和氨基酸序列进行比对,并随后对结果进行手工校正,得到适合Paup 4.0和 Modeltest 3.7程序检测的数据矩阵; 其中柽柳科植物17个物种的谱系分析及适应性位点检测的步骤为: 用Paup 4.0和Modeltest 3.7程序检测最合适的进化模型;然后以 /5 为外类群,使用MEGA 6.0软件植入的最大似然法(maximum likelihood, ML),建立柽柳科三个属的蛋白序列系统发育关系树;基于ML系统发育关系树,以PAML 4.2 中的codeml程序,选择"分支-位点"模型中的M8模型,计算种间同义(synonymous)及非同义 (nonsynonymous)突变速率(c〇=dN/dS);当dN/dS =1,突变位点则认为是随机发生的;当 dN/dS〈l,则认为此位点受到了纯化选择的作用;而当dN/dS>l时,则认为此位点受到了正向 选择的作用;利用最大似然法估计出的模型参数值,再通过贝叶斯定律计算出每个氨基酸 所属位点类别的后验概率,根据后验概率,检测出柽柳科物种中存在的正选择位点; 其中柽柳科植物Rubi sco结构模拟及选择性位点分析的步骤为: 采用Phyre2对红砂Rubisco蛋白三维结构建模,到置信度为100%的最佳模板PDB文件; 用pymol软件显示文件,并标注出受选择性的位点;利用Bioedit 7.2.2软件植入的熵 值分析及疏水性分析单元,结合P h y r e 2模拟的R u b i s C 0结构,分析这些位点的变化对 Rubisco结构及功能的影响。2. 根据权利要求1所述的检测柽柳科植物rbcL基因适应性进化与结构建模的方法,通 过"分支-位点"模型中的M8模型,经过贝叶斯后验概率去除假阳性位点,检测到柽柳科物种 中存在的正选择位点,三个位点分别为112,199和220。
【文档编号】G06F19/12GK106021976SQ201610457872
【公开日】2016年10月12日
【申请日】2016年6月23日
【发明人】燕霞, 马小飞, 钱朝菊
【申请人】中国科学院寒区旱区环境与工程研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1