抗菌肽抗菌活性预测方法及抗菌肽的制作方法
【专利摘要】本发明属于多肽设计领域,具体涉及多肽的抗菌活性预测方法及抗菌肽。本发明的目的是克服目前抗菌肽抗菌活性预测相对复杂,不具备操作性的缺点。本发明解决其技术问题采用的技术方案是提供抗菌肽抗菌活性预测方法。该方法获取已知的抗菌肽序列及其抗菌活性数据,计算得到每个氨基酸在每个位置时对整段抗菌肽活性的贡献值,根据该贡献值建立预测模型;最后将需要预测的多肽氨基酸序列代入标准预测模型,得到抗菌活性预测值。使用该活性预测方法可以预测随机获得的多肽的抗菌活性。本发明在此基础上获得了一类具有广谱抗菌活性的多肽,具有很好的应用前景。
【专利说明】抗菌肽抗菌活性预测方法及抗菌肽
【技术领域】
[0001]本发明属于多肽设计领域,具体涉及多肽的抗菌活性预测及抗菌肽。
【背景技术】
[0002]当前,细菌性感染和疾病呈上升趋势,细菌耐药性的形成是一个重要的原因。由耐药性细菌,如耐药性结核杆菌、大肠杆菌和被称为“超级细菌”耐甲氧西林金葡菌(MRSA)等对人和动物造成的危害日趋严重。抗菌素耐药性的蔓延可能会使上个世纪药物治疗方面的许多突破不复存在。传染性病原体对目前使用的药物已产生越来越强的耐药性,但至今尚未开发出足够的药物解决这一问题。因此,许多传染病可能有一天会变得无法控制,并可在世界各地迅速蔓延。耐药性细菌的出现致使现有抗菌药物对细菌感染治疗的疗效低下或无效,形成的危害日益严重。随着现有药物耐药性问题日趋严重,抗生素管道濒临枯竭,迫切需要开发出新型的抗菌制剂。科研工作者们正努力寻求新的抗菌策略,这些策略包括:合理应用抗生素;改造现有抗生素或研发新的抗生素;微生态制剂的研究与应用;噬菌体制剂研究与应用;中草药细菌耐药抑制剂研究与应用;抗菌肽研究与应用等。其中高效、低毒、广谱的抗菌肽作为最有希望代替抗生素的新药制剂倍受国内外科研工作者的关注,成为当iu的研究热点。
[0003]抗菌肽一般由生物体内各器官产生来抵抗微生物感染,并且许多抗菌肽都具有免疫调节作用。为了增强抗菌肽的抗菌作用与免疫调节作用,缓解各类菌种日益增强的耐药性,科学家们发展了许多设计合成或改造天然抗菌肽的方法。虽然不同的抗菌肽有多种长度、氨基酸组成或二级结构等特征,但在两亲性、电荷性等方面具有相似性,并可能有其它一些无法直观寻找的共同特征,这些特征对抗菌肽的抗菌活性可能都具有重大影响。基于此,科学家们建立了许多生物信息学工具与预测方法来寻找与抗菌肽活性相关的规律,大多数的方法都在一定程度上与高活性抗菌肽的相似性有关。
[0004]当优化一个已经具有较好的抗菌活性的抗菌肽时,进行序列上的大幅度改变往往会造成抗菌活性的巨大变化,并由于其中的变量太多而难以确定影响活性的因素。而只改变少量的氨基酸时,由于两者的序列相似度太高,大部分活性预测方法都不能很好的区分两者的活性。为了解决以上问题并寻找一个预测方法能够辨别相似度较高的多肽序列并能成功对对现有多肽进行改造或者直接判断新构建多肽的抗菌活性,是本领域目前亟待解决的技术问题。
【发明内容】
[0005]本发明的目的是克服目前抗菌肽抗菌活性预测相对复杂,不具备操作性的缺点,提供一种抗菌肽抗菌活性预测方法。
[0006]本发明解决其技术问题,采用的技术方案是,抗菌肽抗菌活性预测方法,其特征在于,包括以下步骤:
[0007]步骤1、获取已知的抗菌肽序列及其抗菌活性数据,并对所有抗菌肽的抗菌活性数据采用抗菌活性标准化换算得到抗菌活性标准化数值,随机选取其中一部分的抗菌肽序列及其抗菌活性标准化数值作为训练集,将剩余部分的抗菌肽序列及其抗菌活性标准化数值作为测试集;
[0008]步骤2、将训练集的抗菌肽序列转换为由氨基酸在抗菌肽中的位置及氨基酸名称构成的氨基酸矩阵;
[0009]步骤3、根据训练集的抗菌活性标准化数值与氨基酸矩阵,计算得到每个氨基酸在每个位置时对整段抗菌肽活性的贡献值,根据该贡献值建立预测模型;
[0010]步骤4、将测试集代入预测模型,计算得到预测活性值;
[0011]步骤5、计算所有预测活性值与测试集的抗菌活性标准化数值的线性关系,比较其回归系数,选择至少两个回归系数最大的预测模型,作为标准预测模型;
[0012]步骤6、将需要预测的多肽氨基酸序列代入标准预测模型,得到抗菌活性预测值。
[0013]具体的,步骤I中,所述抗菌活性标准化换算的方法为:将抗菌活性数据中以质量多少来体现活性强弱的mg/L为单位的IC50值换算成以能体现单个多肽活性的单位摩尔每升(M/L)的活性值,再将该活性值转换为越大越好且线性分布的抗菌活性标准化数值。
[0014]进一步的,所述抗菌活性标准化换算的公式为:f (a) = -ln(a/KX 10_3),其中,f(a)为抗菌活性标准化数值,a为该抗菌肽的IC50值,单位为mg/L,K为该抗菌肽的分子量,单位为mol/kg。
[0015]具体的,步骤3中,所述根据训练集的抗菌活性标准化数值与氨基酸矩阵,计算得到每个氨基酸在每个位置时对整段抗菌肽活性的贡献值的方法为:采用公式
【权利要求】
1.抗菌肽抗菌活性预测方法,其特征在于,包括以下步骤: 步骤1、获取已知的抗菌肽序列及其抗菌活性数据,并对所有抗菌肽的抗菌活性数据采用抗菌活性标准化换算得到抗菌活性标准化数值,随机选取其中一部分的抗菌肽序列及其抗菌活性标准化数值作为训练集,将剩余部分的抗菌肽序列及其抗菌活性标准化数值作为测试集; 步骤2、将训练集的抗菌肽序列转换为由氨基酸在抗菌肽中的位置及氨基酸名称构成的氨基酸矩阵; 步骤3、根据训练集的抗菌活性标准化数值与氨基酸矩阵,计算得到每个氨基酸在每个位置时对整段抗菌肽活性的贡献值,根据该贡献值建立预测模型; 步骤4、将测试集代入预测模型,计算得到预测活性值; 步骤5、计算所有预测活性值与测试集的抗菌活性标准化数值的线性关系,比较其回归系数,选择至少两个回归系数最大的预测模型,作为标准预测模型; 步骤6、将需要预测的多肽氨基酸序列代入标准预测模型,得到抗菌活性预测值。
2.如权利要求1所述的抗菌肽抗菌活性预测方法,其特征在于,步骤I中,所述抗菌活性标准化换算的方法为:将抗菌活性数据中以质量多少来体现活性强弱的mg/L为单位的IC50值换算成以能体现单个多肽活性的单位为摩尔每升的活性值,再将该活性值转换为越大越好且线性分布 的抗菌活性标准化数值。
3.如权利要求2所述的抗菌肽抗菌活性预测方法,其特征在于,所述抗菌活性标准化换算的公式为:f(a) = _ln(a/KX10_3),其中,f(a)为抗菌活性标准化数值,a为该抗菌肽的IC50值,单位为mg/L,K为该抗菌肽的分子量,单位为mol/kg。
4.如权利要求3所述的抗菌肽抗菌活性预测方法,其特征在于,步骤3中,所述根据训练集的抗菌活性标准化数值与氨基酸矩阵,计算得到每个氨基酸在每个位置时对整段抗菌n肽活性的贡献值的方法为:采用公式--0 = Σ(β.?χ?)进行计算,其中,η为该抗菌肽肽链的J=I氨基酸个数,I的取值范围为任意20个值,每一个值代表20种天然氨基酸中的一种氨基酸,j为该i氨基酸在该抗菌肽中的从氮端到碳端的位置,取值范围为I到η之间的正整数;Bj为该抗菌肽中j位置氨基酸的常系数,当该j位置有氨基酸时,Bj为1,当该j位置无氨基酸时,Bj为O ;Xij为i氨基酸在抗菌肽中j位置时对整段抗菌肽活性的贡献值。
5.如权利要求4所述的抗菌肽抗菌活性预测方法,其特征在于,步骤3中,若由于已知f(a)的数量不足够解出所有的Xij时,根据氨基酸的性质,将性质最相近的氨基酸所代表的Xij进行最少的合并后计算。
6.如权利要求5所述的抗菌肽抗菌活性预测方法,其特征在于,所述性质包括带电荷性及亲水性。
7.如权利要求1所述的抗菌肽抗菌活性预测方法,其特征在于,步骤I中,所述随机选取其中一部分的抗菌肽序列及其抗菌活性标准化数值作为训练集是指随机选取其中80%~90%的抗菌肽序列及其抗菌活性标准化数值作为训练集。
8.如权利要求1或2或3或4或5或6或7所述的抗菌肽抗菌活性预测方法,其特征在于,还具有以下步骤:步骤7、对需要预测的多肽序列,根据其每个氨基酸自身的电荷大小,计算该抗菌肽的等电点值,筛选出合适等电点值的抗菌肽。
9.如权利要求3所述的抗菌肽抗菌活性预测方法,其特征在于,步骤7中,所述合适等电点值为11~13。
10.多肽,其特征在于具有如下所示的氨基酸序列:
V-Q-W-R-1-R-X1-X2-V-1-R-X3,其中 Xl = I 或 V,X2 = A 或 C,X3 = A、R 或 K ; 或者:
V-Q-L-R-1-R-V-X4-V-1-R-X5,其中 X4 = A 或 C,X5 = R 或 K。
11.根据权利要求1所述的多肽,其特征在于氨基酸序列为下表中SEQID N0.1~SEQIDN0.16任一条氨基酸序列所示:
12.权利要求10或11所述的多肽在制备抗菌药物中的用途。
13.由权利要求10或11所述的多肽为主要活性成分制成的抗细菌或抗真菌的药物。
【文档编号】C07K7/08GK104036155SQ201410241068
【公开日】2014年9月10日 申请日期:2014年5月30日 优先权日:2014年5月30日
【发明者】杨莉, 王震玲, 何谷, 魏于全 申请人:四川大学