专利名称:来自甲型流感2009大流行h1n1病毒的rna依赖性rna聚合酶的pa亚基片段及其用途的制作方法
技术领域:
本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基之氨基端片段的多肽片段,其中所述PA亚基来自甲型流感2009大流行HlNl病毒或其变体。本发明还涉及(i)适于使用X射线晶体衍射对所述多肽片段进行结构测定的多肽片段晶体,以及(ii)使用所述多肽的结构坐标来筛选和设计对多肽片段中的核酸内裂解(endonucleolytically)活性位点进行调节(优选抑制)的化合物的计算方法。此外,本发明涉及鉴定(优选以高通量形式鉴定)与具有核酸内切酶活性的PA多肽片段结合并且优选抑制所述核酸内裂解活性的化合物的方法。本发明还涉及能够调节(优选抑制)本发明PA亚基多肽片段或其变体的核酸内切酶活性的化合物,以及包含所述化合物的药物组合物,其用于治疗由正粘病毒(Orthomyxoviridae)科、布尼亚病毒(Bunyaviridae)科和/ 或沙粒病毒科(Arenviridae)病毒通过病毒感染引起(优选由甲型流感2009大流行HlNl病毒的病毒感染引起)的疾病病症。优选地,所述化合物可通过本文公开的方法进行鉴定,或者所述药物组合物可通过本文公开的方法生产。
背景技术:
流感在世界范围内导致很高的发病率和死亡率,许多人认为它对人类来说是最为重要的病毒威胁。每年的流感流行席卷全球,而且偶发的新毒株导致破坏力巨大的大流行。目前,控制流感病毒流行的主要方法是疫苗接种。但是,很快就产生了避开疫苗接种作用的突变流感病毒。由于生产新的流感疫苗需要约6个月,所以尤其需要替代性治疗方法(即抗病毒药物)来作为对抗迅速传播的大流行的第一道防线。开发抗病毒药物的一个极佳出发点是病毒必需蛋白的结构数据。因此,对流感病毒表面抗原神经氨酸酶的晶体结构测定(yon Itzstein等,1993 ;Nature 363:418-423)直接引导开发出了具有抗病毒活性的神经氨酸酶抑制剂,其阻止病毒从细胞中释放,但是不阻止病毒产生。随后这些神经氨酸酶抑制剂及其衍生物被开发成抗流感药物扎那米韦(Glaxo)和奥司他韦(Roche),许多国家目前都储备它们以用作对抗可能的大流行的第一道防线。但是,这些药物仅仅缩短临床疾病的持续时间。作为替代地,其它抗流感化合物例如金刚烷胺和金刚乙胺靶向病毒膜中的离子通道蛋白(即M2蛋白),干扰病毒在细胞内部的脱壳。但是,由于它们的副作用和抗性病毒突变体的迅速产生,它们尚未被广泛应用(Magden 等,2005, Appl. Microbiol. Biotechnol. 66 :612-621)。此外,已经表明更不特异的病毒药物(例如利巴韦林)可用于治疗流感感染(Eriksson等,1977, Antimicrob. AgentsChemother. 11 :946-951)。但是,可能是由于严重的副作用,利巴韦林仅在几个国家得到批准(Furuta 等,2005, Antimicrob. Agents Chemother. 49 :981-986)。显然,需要新型抗病毒化合物,优选为针对不同靶标的化合物。甲、乙、丙型流感病毒和鲑传贫病毒(Isavirus)以及托高土病毒(Thogotovirus)属于正粘病毒,其与布尼亚病毒科(包括汉坦病毒(Hantavirus)、内罗病毒(Nairovirus)、正布尼亚病毒(Orthobunyavirus)、白蛉病毒(Phlebovirus)和番爺斑萎病毒(Tospovirus))都是负链RNA病毒。它们的基因组是分段的,并且存在于包含RNA依赖性RNA聚合酶的核糖核蛋白颗粒中,所述RNA依赖性RNA聚合酶(i)将最初的单链病毒粒RNA(vRNA)复制为病毒mRNA以及(ii)复制vRNA。对于病毒mRNA的产生,所述聚合酶利用所谓的“抢帽(cap-snatching) ” 机制(Plotch 等,1981, Cell 23 :847-858 ;Kukkonen 等,2005,Arch.Virol. 150:533-556;Lcahy 等,1997,J. Virol. 71 :8347-8351 ;Noah 和 Krug,2005,Adv. Virus Res. 65 :121-145)。所述聚合酶包含三个亚基=PBl (聚合酶碱性蛋白)、PB2和PA。对于抢帽机制,病毒聚合酶通过PB2亚基与细胞mRNA分子的5’ RNA帽结合,并且通过聚合酶的核酸内裂解活性在核苷酸10至13位对其进行切割。加帽的RNA片段作为引物用于通过PBl亚基中的核苷酸转移酶中心合成病毒mRNA (Li等,2001,EMBO J. 20 2078-2086)。最终,通过聚合酶在模板5’端的寡聚U基序处的推进,病毒mRNA的3’端被聚腺苷酸化。最近的研究已清楚地确定了负责帽结合的PB2的结构域(Fechter等,2003,J. Biol. Chem. 278 :2038卜20388 ;Guilligay 等,2008 Nat. Struct. Mol. Biol. 15 500-506)。至今认为聚合酶的核酸内裂解活性存在于PBl亚基中(Li等,同上)。
所述聚合酶复合体似乎是合适的抗病毒药物靶标,因为其对于病毒mRNA的合成和病毒复制来说是必需的,并且包含数个可能与宿主细胞蛋白质中存在的显著不同的功能性活性位点(Magden等,同上)。因此,例如,已尝试通过类似于PBl内PA结合结构域的25个氨基酸的肽来干扰聚合酶亚基的组装(Ghanem等,2007,J. Virol. 81 =7801-7804)。此外,已尝试通过核苷类似物(如2’ -脱氧-2’ -氟鸟苷)来干扰病毒转录(Tisdale等,1995,Antimicrob. Agents Chemother. 39 :2454-2458),并且已经证明 T-705 (经取代的卩比嗪化合物)可用作流感病毒RNA聚合酶的特异性抑制剂(Furuta等,同上)。此外,已祀向聚合酶的核酸内切酶活性,并已鉴定出一系列4-取代的2,4-二氧代丁酸化合物作为流感病毒此活性的选择性抑制剂(Tomassini 等,1994, Antimicrob. Agents Chemother. 38 :2827-2837)。另外,已证明氟他胺(在真菌物种Delitschia confertaspora的提取物中鉴定到的经取代的2,6- 二酮哌嗪)抑制流感病毒的核酸内切酶(Tomassini等,1996, Antimicrob. AgentsChemother. 40 :1189-1193)。但是,迄今仅在聚合酶的完整三聚复合体的环境下研究了化合物对病毒聚合酶核酸内裂解活性的抑制作用。虽然提出了聚合酶的PA亚基的帽结合和核酸内切酶活性、vRNA复制和有争议的蛋白酶活性,但是对其的功能性表征是最不充分的。PA(在甲型流感病毒中有716个残基)可通过胰酶消化在213位残基处分割。最近所测定的与PBlN端肽结合的PA C端三分之二的晶体结构提供了对PA亚基的一大部分(但是其功能仍不清楚)和亚基间关键相互作用之一的确切性质的一级结构的理解(He等,2008, Nature 454 :1123-1126 ;0bayashi等,2008,Nature 454:1127-1131)。PA氨基端结构域中保守残基的系统突变已经鉴定出对聚合酶复合体的蛋白质稳定性、启动子结合、帽结合和核酸内切酶活性重要的残基(Hara等,2006,J. Virol. 80 :7789-7798)。已经广泛研究了完整病毒核糖核蛋白颗粒(RNP)环境下的核酸内切酶的酶学。最近已发现,与本领域的一般观点相反,对于甲型H3N2流感病毒的RNA依赖性RNA聚合酶,核酸内裂解活性仅存在于PA亚基内(Dias等,2009)。本发明人现已通过X射线晶体衍射对甲型流感2009大流行HlNl病毒的PA结构域进行结构表征,并且鉴定出所述结构域内的核酸内裂解活性中心。本发明人出乎意料的发现,所述病毒PA亚基的多肽片段易于结晶,因此,所述多肽片段非常适合于在所述多肽片段环境下研究甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶的核酸内裂解活性,从而简化靶向所述病毒聚合酶之核酸内切酶活性的新型抗病毒化合物的开发,并且优化之前鉴定的化合物。本发明人对具有甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之核酸内裂解活性的PA多肽片段的重组产生允许使用可从直接表达系统中易于得到的材料对所述病毒聚合酶功能性位点的抑制剂进行体外高通量筛选。此外,核酸内裂解性PA HlNl多肽片段以及其中的酶活中心的结构数据允许定向设计抑制剂并且用计算机筛选潜在的治疗化合物。而且,本发明人第一次实现了甲型流感2009大流行HlNl病毒PA亚基的PA多肽片 段及其变体与结合的抑制剂的共结晶,并且发现可以改进靶向甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之核酸内切酶活性的新型抗病毒化合物的开发。尤其是,共结晶数据第一次详细示出甲型流感2009大流行HlNl病毒PA亚基的PA多肽片段活性位点中所包含的哪些氨基酸特别地参与化合物结合。该新知识允许对现有抑制剂的修饰进行优化设计以改善其效力,或者允许设计和优化有效阻断核酸内切酶活性的新型抑制剂。本发明的一个目的是(i)通过X射线晶体衍射提供HlNl病毒聚合酶PA亚基的核酸内裂解氨基端结构域的高分辨率结构数据,(ii)通过X射线晶体衍射提供与已知抑制剂共结晶的HlNl病毒聚合酶PA亚基的核酸内裂解氨基端结构域的高分辨率结构数据,
(iii)提供计算及体外方法(优选是高通量形式)来鉴定可以调节且优选抑制(优选通过阻断HlNlPA亚基内的核酸内裂解活性位点)甲型流感2009大流行HlNl病毒病毒聚合酶的核酸内切酶活性的化合物,以及(iv)提供包含这些化合物的药理学组合物以用于治疗由利用抢帽机制合成病毒mRNA的病毒所致的传染性疾病。发明概述在第一方面中,本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基的氨基端片段的多肽片段,其中所述PA亚基来自SEQ ID NO :2的甲型流感2009大流行HlNl病毒或者是其变体,其中所述变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。在另一方面中,本发明涉及编码本发明的分离多肽片段的分离的多核苷酸。在另一方面中,本发明涉及包含本发明的分离多核苷酸的重组载体。在另一方面中,本发明涉及包含本发明的分离多核苷酸或本发明的重组载体的重组宿主细胞。在另一方面中,本发明涉及鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括以下步骤a)构建由以下结构坐标定义的活性位点的计算机模型(i)如图I所示的本发明多肽片段的结构坐标,(ii)如图2所示的本发明多肽片段的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标,(V)如图5所示的本发明多肽片段的结构坐标,(vi)如
图15所示的本发明多肽片段的结构坐标,或者(Vii)如图16所示的本发明多肽片段的结构坐标。b)通过选自以下的方法来选择潜在的调节化合物(iv)将分子片段组装成所述化合物,(V)从小分子数据库中选择化合物,和(vi)对所述化合物进行从头配体设计;c)采用计算方法进行所述化合物与所述活性位点的计算机模型之间的拟合程序运算,以提供所述化合物在所述活性位点的能量最低的构型;以及d)评价所述拟合运算的结果来定量所述化合物与活性位点的模型之间的关联,从而评价所述化合物与所述活性位点相关联的能力。 在另一方面,本发明涉及鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括以下步骤(i)使本发明的多肽片段或其变体或者本发明的重组宿主细胞与测试化合物接触,以及(ii)分析所述测试化合物调节所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。在另一方面中,本发明涉及能够调节(优选抑制)本发明的PA亚基多肽片段或其变体的核酸内切酶活性的化合物。优选地,所述化合物可通过本发明的(体外)方法进行鉴定。在另一方面中,本发明涉及包含本发明化合物或其可药用盐以及一种或更多种可药用赋形剂和/或载体的药物组合物。优选地,所述药物组合物可通过本发明的(体外)
方法产生。在另一方面中,本发明涉及针对SEQ ID NO 2的甲型流感2009大流行HlNl病毒PA亚基或其变体的活性位点的抗体,其中所述变体在SEQ ID NO :2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。 在另一方面中,本发明涉及本发明的化合物、本发明的药物组合物或本发明的抗体在制备用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染所引起(优选由甲型流感2009大流行HlNl病毒的病毒感染引起)之疾病病症的药物中的用途。在另一方面中,本发明涉及以下化合物在制备用于治疗、改善或预防由甲型流感2009大流行HlNl病毒通过病毒感染所引起之疾病病症的药物中的用途4_[3_[ (4-氯苯基)甲基]-I-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-2)、4- [3- [ (4-氯苯基)甲基]_1_ (苯基甲基磺基)_3_哌啶基]_2_羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)。在另一方面中,本发明涉及本发明的化合物、本发明的药物组合物或本发明的抗体用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染所引起(优选由甲型流感2009大流行HlNl病毒通过病毒感染所引起)的疾病病症。
在另一方面中,本发明涉及用于治疗、改善或预防由甲型流感2009大流行HlNl病毒通过病毒感染所引起的疾病病症的以下化合物4-[3-[(4_氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-3)、4_ [4- [ (4-氯苯基)甲基]-1-(环己基甲基)-4_哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-2)、4- [3- [ (4-氯苯基)甲基]-I-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)。发明详述在下文对本发明详细描述之前,应理解本发明不限于本文所述的具体方法、方案和试剂,因为这些可以不同。还应理解,本文所用术语仅用于描述具体的实施方案,而不意在限制仅由所附权利要求所限定的本发明的范围。除非另外定义,否则本文所使用的所有的技术和科学术语与本领域普通技术人员通常所理解的含义相同。
以下将描述本发明的要素。虽然这些要素在具体的实施方案中列出,但是应理解它们可以以任何方式和任何数目组合以产生另外的实施方案。不应将多种描述的实施例和优选的实施方案解释为将本发明限制为仅明确描述的实施方案。应将该描述理解为支持和涵盖具有任何数目的公开和/或优选要素的明确描述的实施方案组合的实施方案。此外,除非另有说明,否则应认为本申请中所有所述要素的任何排列和组合是本发明说明书所公开的。例如,如果在一个优选实施方案中本发明的多肽片段对应SEQ ID NO :2所示氨基酸序列的I至198位氨基酸,而在另一个优选实施方案中本发明的PA多肽片段可以使用优选可从PA多肽片段切割(优选使用TEV蛋白酶)下来的肽标签来标记,那么本发明的一个优选实施方案是,利用可使用TEV蛋白酶从PA多肽上切割下来的肽标签标记对应SEQ ID NO:2所示氨基酸序列的I至198位氨基酸的多肽片段。优选地,本文所用术语如“A multilingual glossary of biotechnologicalterms (IUPAC Recommendations) ”,H. G. ff. Leuenberger, B. Nagel 和 JJ. K61M 编,Helvetica Chimica Acta, CH-4010 Basel, Switzerland, (1995)中所述。为了实施本发明,除非另有说明,否则采用在本领域文献中解释的常规化学、生物化学方法和重组DNA技术(参见,例如,Molecular Cloning A Laboratory Manual,第二版,J. Sambrook 等编,Cold Spring Harbor Laboratory Press, Cold Spring Harbor1989)。在本说明书及所附权利要求的通篇中,除非上下文另有要求,否则词语“包含”及其变化形式例如“包括”和“含有”应理解为表示包含所述整数或步骤或者整数或步骤的组,但是不排除任何其它的整数或步骤或者整数或步骤的组。除非上下文明确指出,否则本说明书和所附权利要求书中不使用数量词限制时包括复数的情况。在本说明书中引用了一些文件。本文上文或下文中所引用的每个文件(包括所有专利、专利申请、科技文献、制造商说明、说明书等)都通过引用整体并入本文。本文中的任何内容均不应解释为认可本发明不能由于在先发明而早于这些公开内容。定义术语“多肽片段”指包含单个氨基酸链的蛋白质的一部分。术语“蛋白质”包括呈现二级和三级结构的多肽片段,还指由形成四级结构的数个氨基酸链(即数个亚基)形成的蛋白质。术语“肽”指最多50个氨基酸的短氨基酸链,其不一定呈现二级或三级结构。“拟肽”是由N-取代的甘氨酸通过寡聚组装而产生的肽类似物。如果两个或更多个多肽中的残基在多肽结构中占据类似的位置,则称所述残基为彼此“对应”。如本领域所熟知的,两个或更多个多肽中的类似位置可通过根据氨基酸序列或结构相似性比对多肽序列来确定。这样的比对工具对本领域技术人员来说是公知的,可以例如获得自万维网,例如使用标准设置的ClustalW(www. ebi. ac. uk/clustalw)或 Align (http: //www. ebi. ac. uk/emboss/align/index, html),对于 Align 优选EMBOSS: :needle, Matrix :Blosum62,缺口打开10. 0,缺口延伸O. 5。本领域技术人员理解,为产生满意的比对,可能需要在任一序列中引入缺口。如果两个或更多个PA亚基中的残基在最佳序列比对中对齐,则称所述残基为“对应”的。将两个多肽之间的“最佳序列比对”定义为产生最大数量的对齐的相同残基的比对。如果两个比对序列之间的序列相似性(优选同一性)在IO、20或30个氨基酸的长度上降至低于30 %,优选低于20 %,更优选低于IO %,贝U “最佳序列比对区”结束并由此确定用于测定相似性得分的比较序列的长度边界。本发明涉及具有核酸内切酶活性的甲型流感2009大流行HlNl病毒的RNA依赖性 RNA聚合酶PA亚基片段。术语“RNA依赖性RNA聚合酶PA亚基”指具有SEQ ID NO :2所示氨基酸序列的甲型流感2009大流行HlNl病毒的PA亚基。术语“RNA依赖性RNA聚合酶PA亚基变体”指这样的甲型流感2009大流行HlNl病毒的PA亚基变体,其在SEQ ID NO :2的氨基酸位置186或与其对应的氨基酸位置上包含氨基酸丝氨酸,并且优选其在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO :2所示氨基酸序列的序列相似性(优选序列同一性)至少为 60%、65%、70%、80%、81%、82%、83%、84%、84%、85%、86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、96%、97%、98%、或 99%,其中的最佳序列比对可用本领域已知工具得到,例如使用标准设置(优选EMBOSS: ineedle,Matrix :Blosum62,缺口打开10. O,缺口延伸O. 5)的Align。优选地,当PA亚基变体与SEQID NO 2的PA亚基比对时,比对将在两个多肽的全长上进行,并因而在此基础上确定比对得分。但是,有可能PA亚基变体可包含C端/N端或内部的缺失或添加,例如通过N端/C端的融合。在此情况下,仅将最佳比对区域用于分别评估相似性和同一性。优选地,来自这些变体的片段优选在产生核酸内切酶活性所需的区域内分别显示出所示的相似性和同一性。因此,SEQ ID NO :2与PA亚基变体之间的任何比对都应优选地包含核酸内切酶活性位点。因此,上述序列与SEQ ID NO :2的相似性和同一性存在于至少80、90、100、110、120、130、140、150、160、165、170、180、190、200、210、220、230、240、250、300 个或更多个氨基酸长度上,优选包含核酸内切酶活性位点。因此,本发明的多肽片段基于上面定义的甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体。因此,在以下说明书中,术语“多肽片段”和“PA多肽片段”总是包括来自具有核酸内切酶活性之SEQ ID NO 2所示PA蛋白质和其PA蛋白质变体(如上所述)的两种片段。然而本说明书还使用术语“PA多肽片段变体”或“PA片段变体”来特别表示来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之PA亚基变体的具有核酸内切酶活性的PA多肽片段或PA片段。因此,本发明的PA多肽片段优选包含天然甲型流感2009大流行HlNl病毒的PA亚基序列,或基本由其组成或由其组成。但是,还设想PA多肽片段变体在SEQ ID NO 2的186位氨基酸或其对应氨基酸位点上包含氨基酸丝氨酸,并且优选还包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15位或更多个氨基酸位置上的氨基酸替换,和/或在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID N0:2所示氨基酸序列的序列相似性(优选序列同一性)为至少
83%,84%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97%、98%或99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS: :needle, Matrix :Blosum62,缺口打开 10. 0,缺口延伸 O. 5)的 Align。应理解本发明的PA片段可包含不来自PA的另外的氨基酸如标签、酶等,在该比对中不考虑这些另外的氨基酸,即在比对得分的计算中将其排除在外。在一个优选实施方案中,当将片段序列与SEQ ID NO 2 在至少 70、80、90、100、110、120、130、140、150、160、165、170、180 或 190 个氨基酸的长度上进行比对时得到上述比对得分,其中SEQ ID NO :2的序列优选包含核酸内切酶活性位点。在一个优选的实施方案中,PA多肽片段变体包含至少这样的氨基酸残基其对应 于SEQ ID NO :2的甲型流感2009大流行HlNl病毒PA亚基的I至190位氨基酸残基,或者其由SEQ ID NO 2的甲型流感2009大流行HlNl病毒PA亚基的I至190位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID N0:2所示氨基酸序列的I至190位氨基酸残基的序列相似性(优选序列同一性)为至少80%、81%、82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97^^98^^99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS: :needle, Matrix :Blosum62,缺口打开 10. O,缺口延伸 O. 5)的 Align。更优选地,PA多肽片段变体包含至少这样的氨基酸残基其对应于SEQ ID NO 2的甲型流感2009大流行HlNl病毒PA亚基的I至198位氨基酸残基,或者其由SEQ ID NO 2的甲型流感2009大流行HlNl病毒PA亚基的I至198位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO 2所示氨基酸序列的I至198位氨基酸残基的序列相似性(优选序列同一性)优选为至少70%、更优选75%、更优选80%、81%、82%,83%,84%,85%,86%,87%,88%,89%,90%,91 %,92%,93%,94%,95%,96%,97^^98^^99%,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选EMBOSS: :needle,Matrix :Blosum62,缺口打开 10. 0,缺口延伸 O. 5)的 Align。还优选 PA 多肽片段变体包含至少这样的氨基酸残基,其对应于SEQ ID NO :2的甲型流感2009大流行HlNl病毒PA亚基的I至200位氨基酸残基,或者其由SEQ ID NO :2的甲型流感2009大流行HlNl病毒PA亚基的I至200位氨基酸残基组成,并且在使用最佳序列比对的片段全长上和/或在最佳序列比对区域中与SEQ ID NO 2所示氨基酸序列的I至200位氨基酸残基的序列相似性(优选序列同一性)为至少60 %、更优选65 %、更优选70 %、更优选75 %、更优选 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95 %、96 %、97 %、98 %、99 %,其中最佳序列比对可得自于本领域已知工具,例如使用标准设置(优选 EMBOSS: :needle,Matrix :Blosum62,缺口打开 10. 0,缺口延伸 O. 5)的 Align。应注意,所有上述优选的PA多肽片段变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。在本发明的上下文中,术语“PA N端(PA-Nter) ”指由SEQ ID NO 2所示氨基酸序列的I至198位氨基酸残基(PA HlNl I至198)以及任选地额外氨基端接头(即MGSGMA (SEQID NO :3))所组成的多肽片段。在本发明的上下文中,术语“PAN端突变体”指由SEQ ID NO:2所示氨基酸序列中的I至198位氨基酸残基(其中52至64位氨基酸被替换为氨基酸甘氨酸)(PA HlNl I至198 Δ 52-64 Gly)以及任选地额外氨基端接头(即MGSGMA (SEQ IDNO :3))组成的多肽片段(变体)。术语“序列相似性”意指最佳序列比对中相同位置处的氨基酸相同或相似,优选相同。“相似氨基酸”具有相似的特征,例如极性、可溶性、亲水性、疏水性、电荷或大小。相似的氨基酸优选为亮氨酸、异亮氨酸和缬氨酸;苯丙氨酸、色氨酸和酪氨酸;赖氨酸、精氨酸和组氨酸;谷氨酸和天冬氨酸;甘氨酸、丙氨酸和丝氨酸;苏氨酸、天冬酰胺、谷氨酰胺和甲硫氨酸。本领域技术人员非常了 解序列相似性检索工具,例如可从万维网上获得(例如WWW.ebi. ac. uk/Tools/similarity, html)。本文使用的术语“可溶”指在生理等渗条件(例如,O. 14M氯化钠或蔗糖)下,在有效浓度的变性剂(如胍或尿素)不存在的情况下,的水性缓冲剂中以100,000 X g离心30分钟之后,仍以至少200 μ g/ml、优选至少500 μ g/ml、优选至少lmg/ml、更优选至少2mg/ml、甚至更优选至少3mg/ml、甚至更优选至少4mg/ml、最优选至少5mg/ml的蛋白质浓度保留在上清液中的多肽片段。被测试溶解度的蛋白质片段优选在下文所述的细胞表达系统之一中表达。涉及多肽时,术语“纯化的”不需要是绝对纯的(例如均一制备物),而是表示所述多肽相对于自然环境中的来说相对更纯。通常,纯化的多肽基本不含其它蛋白质、脂类、碳水化合物或与其天然相关联的其他物质,纯化的多肽优选为功能显著性水平,例如至少85%纯,更优选至少90%或95%纯,最优选至少99%纯。表述“纯化至适于结晶的程度”指多肽为85%至100%纯,优选90%至100%纯,更优选95%至100%或98%至100%纯,并且可以浓缩至高于3mg/ml,优选高于10mg/ml,更优选高于18mg/ml而没有沉淀。本领域技术人员可以使用蛋白质纯化的标准技术来纯化多肽。基本纯的多肽会在非还原性聚丙烯酰胺凝胶上产生单个主要条带。在使用本发明方法鉴定化合物的上下文中使用的术语“关联”是指部分(即化学实体或化合物或其部分或片段)与PA亚基的核酸内切酶活性位点之间接近的状态。该关联可以是非共价的,即通过例如氢键、范德华力、静电或疏水性相互作用在能量上有利地接近,或者该关联可以是共价的。术语“核酸内切酶活性”或“核酸内裂解活性”是指导致多核苷酸链中磷酸二酯键的切割的酶促活性。在本发明的上下文中,多肽片段具有核酸内裂解活性,其优选对多核苷酸类型是非选择性的,即本发明的多肽片段优选表现出对DNA和RNA、优选对单链DNA(ssDNA)或单链RNA(ssRNA)的核酸内裂解活性。在这种情况下中,“单链”是指在多核苷酸链中优选至少3个核苷酸、优选至少5个核苷酸、更优选至少10个核苷酸的一段是单链的,即不与另一核苷酸碱基配对。优选地,虽然本发明的多肽片段的核酸内裂解活性不取决于识别位点(即特定核苷酸序列),但是其引起多核苷酸链的非特异性切割。例如,本领域技术人员可以这样测试本发明多肽片段的核酸内裂解活性孵育具有或不具有各自多肽片段的RNA或DNA底物(例如锅柄状RNA或者线性或环形单链DNA)(例如在37°C下孵育某一时间段(例如5、10、20、40、60或80分钟),并且通过例如凝胶电泳检测多核苷酸的完整性。本文使用的术语“核苷酸”是指由与戊糖I’位相连之嘌呤、氮杂嘌呤或嘧啶核苷碱基(例如腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、氮杂腺嘌呤、氮杂鸟嘌呤等)组成的化合物,包括2’ -脱氧和2’ -轻基形式,例如Kornberg和Baker, DNA Replication,第二版(Freeman, San Francisco, 1992)中所述,并且还包括但不限于具有经修饰碱基部分和/或经修饰糖部分的合成核苷,例如 Scheit, Nucleotide Analogs (John Wiley, N. Y. , 1980)中一般性描述的。术语“分离的多核苷酸”指这样的多核苷酸,其为(i)从其天然环境中分离的,
(ii)通过聚合酶链式反应扩增的,或者(iii)全部或部分合成的,并且是指脱氧核糖核苷酸碱基或核糖核苷酸碱基的单链或双链多聚体,包括DNA和RNA分子,有义和反义链两者。该术语包括cDNA、cRNA、基因组DNA以及重组DNA。多核苷酸可以由完整基因或其部分组成。·本文使用的术语“重组载体”包括本领域技术人员已知的任何载体,包括质粒载体、粘粒载体、曬菌体载体(例如λ曬菌体)、病毒载体(例如腺病毒或杆状病毒载体)或者人工染色体载体(例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或者Pl人工染色体(PAC))。所述载体包括表达载体及克隆载体。表达载体包括质粒和病毒载体,并且一般包含期望的编码序列以及在特定宿主生物(例如细菌、酵母、植物、昆虫或哺乳动物)或体外表达系统中表达有效连接之编码序列所需的合适DNA序列。克隆载体一般用于改造和扩增某个期望的DNA片段,并且可缺乏表达期望DNA片段所需的功能序列。本文使用的“重组宿主细胞”是指包含编码目的多肽片段(即本发明的甲型HlNl流感的PA多肽片段或其变体)的多核苷酸的宿主细胞。此多核苷酸可以以如下方式存在于宿主细胞中(i)本身自由分散的,(ii)整合入重组载体中,或者(iii)整合入宿主细胞基因组或线粒体DNA中。重组细胞可用于表达目的多核苷酸,或者用于扩增本发明的多核苷酸或重组载体。术语“重组宿主细胞”包括用本发明的多核苷酸或重组载体转化、转染或感染的原始细胞的后代。重组宿主细胞可以是细菌细胞如大肠杆菌细胞、酵母细胞如酿酒酵母(Saccharomyces cerevisiae)或巴斯德毕赤酵母(Pichia pastoris)、植物细胞、昆虫细胞如SF9或High Five细胞或者哺乳动物细胞。优选的哺乳动物细胞的实例有中国仓鼠卵巢(CHO)细胞、非洲绿猴肾(COS)细胞、人胚肾(HEK293)细胞、HELA细胞等。本文使用的术语“晶体”或“结晶”是指这样的结构(例如三维固体聚集体),其中平面以确定的角度相交,并且其中化学组成物质有规则的结构(例如内部结构)。术语“晶体”可包括下列任一项固体物理晶形例如实验制备的晶体,可来源于晶体的晶体结构(包括二级和/或三级和/或四级结构元件),基于晶体结构的2D和/或3D模型、其代表物如其示意图或图示或者用于计算机的其数据集。在一个方面中,所述晶体可用于X射线晶体衍射技术。在这里,所用的晶体可承受X射线束中的暴露并用于产生解析X射线晶体结构所需的衍射图样数据。晶体可以表征为能够以T. L. Blundell和L. N. Johnson, “ProteinCrystallography”,Academic Press, New York(1976)所不晶形之一定义的图样衍射 X 射线。术语“晶胞”指基本的立方体形或平行六面体形的单元。晶体的整个体积可以由规则装配的这些单元构建。每个晶胞包含图样单位的完整呈现,对其进行重复构建出晶体。
术语“空间群”指晶体对称元素的排布。在空间群的命名中,大写字母表示晶格类型,其它符号表示可以在不改变外观的情况下对不对称单元进行的对称操作。术语“结构坐标”是指定义一个或更多个氨基酸残基相对于坐标系的位置的一组数值。该术语指定义分子三维结构的数据集(例如笛卡儿坐标、温度因子和占位)。结构坐标可略微改变而仍保持几乎相同的三维结构。独特结构坐标组的度量是所得结构的均方根差。本领域普遍技术人员可以认为使三维结构(特别是酶促活性中心的三维结构)的均方
根差彼此相差小于3 A、2 A. 1.51. 1.0 A或0.5 A的结构坐标非常相似。术语“均方根差”意指与平均值的偏差的平方的算术平均值的平方根。这是表示与趋势或目标的偏差或偏离的一种方法。为本发明的目的,“均方根差”定义PA多肽片段或其酶促活性中心的变体的骨架与图I中PA多肽片段PA N端的结构坐标所定义的PA多肽片段或其酶促活性中心的骨架之间的偏差。本文使用的术语“构建计算机模型”包括根据原子结构信息和相互作用模型进行 的分子结构和/或功能的定量和定性分析。术语“建模”包括常规的基于数字的分子动力学和能量最低化模型,交互式计算机图像模型,经修改的分子力学模型,距离几何以及其它基于结构的约束模型。术语“拟合程序运算”是指利用化学实体、酶促活性中心、结合口袋、分子或分子复合物或其部分的结构坐标,将化学实体与酶促活性中心、结合口袋、分子或分子复合物或其部分相关联的操作。这可通过在酶促活性中心处定位、旋转或移动化学实体以匹配酶促活性中心的形状和静电互补性来实现。可对共价相互作用、非共价相互作用(例如氢键、静电、疏水、范德华力相互作用以及非互补静电相互作用例如排斥的电荷-电荷、偶极-偶极和电荷-偶极相互作用)进行优化。或者,可使化学实体与酶促活性中心的结合形变能量最小化。本文使用的术语“测试化合物”是指包含被测试抑制目的多肽片段(即具有核酸内裂解活性的本发明PA多肽片段或其变体)之核酸内裂解活性的能力的化合物、分子或复合物的物质。测试化合物可以是任何物质,包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂类、金属、核苷酸、核苷酸类似物、核苷、核酸、小有机或无机分子、化学化合物、元素、糖类、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺以及其组合和衍生物。术语“小分子”指分子量为50至约2,500道尔顿、优选200至800道尔顿的分子。此夕卜,本发明的测试化合物可任选地包含可检测标记。这些标记包括但不限于酶标记、放射性同位素或者放射活性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。可使用公知方法将这些可检测标记连接到测试化合物。本发明的测试化合物还可包含物质的复杂混合物,例如含有天然产物的提取物,或者混合的组合性合成的产物。它们也可以被测试,并且可以在后续步骤中从混合物纯化出抑制靶多肽片段之核酸内裂解活性的组分。测试化合物可来自或选自合成或天然化合物的文库。例如,合成化合物文库可购自 Maybridge Chemical Co. (Trevillet, Cornwall, UK) > ChemBridge Corporation (SanDiego, CA)或 Aldrich (Milwaukee, WI)。天然化合物文库例如可得自 TimTec LLC (Newark,DE)。或者,可使用细菌、真菌、植物和动物细胞以及组织提取物形式的天然化合物文库。另夕卜,测试化合物可使用组合化学法或作为单个化合物或作为混合物而合成产生。使用组合化学法制成的化合物集合在本文中称为组合文库。
在本发明的上下文中,“调节核酸内裂解活性的化合物”可提高或降低(优选抑制)甲型流感2009大流行HlNl病毒或甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或者其变体的核酸内裂解活性。优选地,这类化合物特异性针对甲型流感2009大流行HlNl病毒的PA亚基或其变体的核酸内裂解活性,而不调节(优选降低)其它核酸内切酶(尤其是哺乳动物的核酸内切酶)的核酸内裂解活性。术语“降低核酸内裂解活性的化合物”是指这样的化合物与不存在所述化合物而其它反应条件(即缓冲条件、反应时间和温度)相同的甲型流感2009大流行HlNl病毒或甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性相比,所述化合物使所述PA亚基或其变体的核酸内裂解活性降低50 %、更优选60 %、甚至更优选70 %、甚至更优选80 %、甚至更优选90 %,以及最优选100 %。最优选地,降低甲型流感2009大流行HlNl病毒PA亚基或其变体的核酸内裂解 活性的化合物抑制所述活性,即与不存在所述化合物时的活性相比,将所述活性降低至少95 %,优选100 %。尤其优选地,降低或抑制甲型流感2009大流行HlNl病毒PA亚基或其变体的核酸内裂解活性的化合物特异性降低或抑制所述PA亚基或其变体的核酸内裂解活性,而不以相同的程度抑制(优选根本不抑制)其它核酸内切酶(如RNase H或限制性核酸内切酶)的核酸内裂解活性。例如,本领域技术人员可以使用相同的缓冲剂和反应条件以及底物和核酸内切酶浓度来建立以下样品(I)底物(如锅柄状RNA)、核酸内裂解活性的PA HlNl多肽片段或其变体,(2)底物(如锅柄状RNA)、核酸内裂解活性的PA HlNl多肽片段或其变体、测试化合物,(3)底物(如锅柄状RNA)、参照核酸内切酶(如RNAse H),(4)底物(如锅柄状RNA)、参照核苷酸(如RNAse H)、测试化合物。孵育样品之后,本领域技术人员可通过例如凝胶电泳分析底物。优选对样品(4)产生切割底物和对样品(2)产生完整底物的测试化合物。术语“高通量形式”是指多种类型的高通量筛选测定和技术,其用于筛选测试化合物文库抑制目的多肽片段的核酸内切酶活性的能力。通常,以多孔形式进行高通量测定,并且包括无细胞测定以及基于细胞的测定。术语“抗体”是指单克隆和多克隆抗体二者,即任何免疫球蛋白或其能够识别抗原或半抗原的部分,即识别具有核酸内裂解活性的甲型流感2009大流行HlNl病毒的PA多肽片段或其肽。在一个优选实施方案中,抗体能够与甲型流感2009大流行HlNl病毒的PA多肽片段或其变体中的酶促(核酸内裂解)活性中心结合。抗体的抗原结合部分可通过重组DNA技术或者对完整抗体进行酶促或化学切割产生。在一些实施方案中,抗原结合部分包括Fab、Fab’、F(ab’)2、Fd、Fv、dAb以及互补决定区(CDR)片段、单链抗体(scFv)、嵌合抗体例如人源化抗体、双抗体以及多肽,所述多肽至少含有抗体中足以使特异性抗原与该多肽结合的部分。术语“可药用盐”是指可通过本发明的方法鉴定的化合物的盐或本发明化合物的盐。合适的可药用盐包括酸加成盐,其可以例如通过将本发明化合物的溶液与可药用酸(如盐酸、硫酸、富马酸、马来酸、琥珀酸、乙酸、苯甲酸、柠檬酸、酒石酸、碳酸或磷酸)的溶液混合来形成。此外,当所述化合物带有酸性部分时,其合适的可药用盐可包括碱金属盐(例如钠盐或钾盐);碱土金属盐(例如钙或镁盐);以及与合适的有机配体形成的盐(例如使用反阴离子(counteranion)例如卤离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、烧基磺酸根和芳基磺酸根形成的铵,季铵,以及胺阳离子)。可药用盐的示例性实例包括但不限于乙酸盐、己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴化物、丁酸盐、乙二胺四乙酸钙、樟脑酸盐、樟脑磺酸盐、右旋樟脑磺酸盐、碳酸盐、氯化物、柠檬酸盐、克拉维酸盐、环戊烷丙酸盐、二葡萄糖酸盐、二盐酸盐、十二烷基硫酸盐、乙二胺四乙酸盐、乙二磺酸盐、丙酸酯十二烷硫酸盐、乙磺酸盐(esylate)、乙磺酸盐(ethanesulfonate)、甲酸盐、富马酸盐、葡庚糖酸盐(gluceptate)、葡庚糖酸盐(glucoheptonate)、葡糖酸盐、谷氨酸盐、甘油磷酸盐、对羟乙酰氨基苯胂酸、半硫酸盐、庚酸盐、己酸盐、己基间苯二酸盐、哈胺盐(hydrabamine)、氢溴酸盐、盐酸盐、氢碘酸盐、2-羟基-乙磺酸盐、羟基萘酸盐、碘化物、异硫代羟酸盐(isothionate)、乳酸盐、乳糖酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、扁桃酸盐、甲磺酸盐(mesylate)、甲磺酸盐(methanesulfonate)、甲基硫酸盐、粘酸盐、2_萘磺酸盐、萘磺酸盐、烟酸盐、硝酸盐、N-甲基葡糖胺铵盐、油酸盐、草酸盐、双羟萘酸盐(pamoate)(恩波酸盐(embonate))、棕榈酸盐、泛酸盐、pectinate、过硫酸盐、3_苯基丙酸盐、磷酸盐/ 二磷酸盐、苦味酸盐、特戊酸盐、聚半乳糖醛酸盐、丙酸盐、水杨酸盐、硬脂酸盐、硫酸盐、碱式醋酸盐、琥珀酸盐、单宁酸盐、酒石酸盐、茶氯酸盐、甲苯磺酸盐、三乙基碘化物、i^一酸盐、戊酸盐等(参见例如 S. M. Berge 等,“Pharmaceutical Salts”, J. Pharm. Sci. 66 1-19 (1977))。 在用于本文时,术语“赋形剂”用于表示药物制剂中非活性成分的所有物质,例如载体、粘合剂、润滑剂、增稠剂、表面活性剂、防腐剂、乳化剂、缓冲剂、调味剂或着色剂。术语“可药用载体”包括例如碳酸镁、硬脂酸镁、滑石、糖、乳糖、果胶、糊精、淀粉、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、低熔点蜡、可可脂等。详述尽管之前人们认为仅可在三聚复合体中检测到核酸内切酶活性,本发明人出乎意料地发现,来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基N端的独立折叠的小结构域表现出对三聚复合体所报道的核酸内切酶功能特性。此外,本发明人发现该PA多肽片段可通过重组方法容易地产生,因此适用于核酸内裂解活性及其调节的体外研究。本发明人出乎意料地发现,来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基N端的结构域易于结晶,因此所述结构域适用于鉴定、选择和设计靶向甲型流感2009大流行HlNl聚合酶之核酸内切酶活性的新型抗病毒化合物,以及通过计算机方法优化先前鉴定的化合物。本发明的一个方面是提供包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基氨基端片段的多肽片段,其中所述PA亚基来自SEQ ID NO :2的甲型流感2009大流行HlNl病毒或其变体,其中所述变体在SEQ ID NO :2的186氨基酸位置或与其对应的氨基酸位置上包含氨基酸丝氨酸。在本发明的一个优选实施方案中,所述变体包含SEQ ID NO 2所示氨基酸序列的I至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体包含SEQ ID NO 2所示氨基酸序列的I至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸。在本发明的另一个更优选实施方案中,所述变体包含SEQ ID NO :2所示氨基酸序列的I至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸。
优选地,本发明的多肽片段是可溶的,优选可溶于水溶液中。本发明多肽片段的最短长度由其切割多核苷酸链(例如锅柄状RNA或单链DNA)的能力来确定,即多肽的最短长度由其核酸内裂解活性来确定。优选地,核酸内切酶活性不取决于多核苷酸类型,因此,它可以作用于DNA和RNA,优选作用于单链DNA和RNA。优选地,核酸内切酶活性不取决于底物核苷酸中的特异性识别位点。在一个优选实施方案中,本发明的多肽片段适于结晶,即优选所述多肽片段可结晶。优选地,可从本发明多肽片段得到的晶体适用于通过X射线晶体衍射对多肽片段进行结构测定。优选地,所述晶体大于25立方微米,并且优选对辐射足够稳定以在优选3.5 A或更好的分辨率下使得暴露于单色X射线时收集的衍射数据完整性大于85%。 在一个实施方案中,所述多肽片段可使用以下溶液结晶(i)蛋白质水溶液,即结晶溶液,其中在浓度范围为IOmM至3M、优选IOmM至2M、更优选20mM至IM且pH 3至pH 9、优选pH 4至pH 9、更优选pH 7至pH 9之缓冲体系(如HEPES或Tris-HCl)中蛋白质浓度为 5 至 20mg/ml,如 5,5. 5、6、6· 5、7、7· 5、8、8· 5、9、9· 5,10,10. 5、11、11· 5,12,12. 5、13、13. 5,14,14. 5,15,15. 5,16,16. 5,17,17. 5,18,18. 5,19,19. 5 或 20mg/ml,优选 8 至 15mg/ml,最优选10至15mg/ml ;和(ii)包含一种或更多种物质的沉淀溶液/储集溶液,所述物质例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、氯化钠、甘油或乙二醇。任选地,蛋白质溶液可包含一种或更多种盐,例如单价盐,如NaCl、KCl或LiCUt选NaCl,其浓度为IOmM至1M、优选20mM至500mM、更优选50mM至200mM ;和/或二价盐,如MnCl2,CaCl2,MgCl2,ZnCl2 或 CoCl、优选 MgCl2 和 MnCl2,其浓度为 O. ImM 至 50mM、优选 O. 5mM至25mM、更优选ImM至IOmM或ImM至5mM。优选地,沉淀/储集溶液包含浓度范围为O. 5M至2M、优选为IM至I. 8M的甲酸钠,浓度范围为IOmM至1M、优选50mM至500mM、更优选75mM至150mM并且pH优选为4至8、更优选为5至7的缓冲体系(如HEPES),和/或浓度范围为I %至20 %、优选2%至8 %、更优选2%至5%的乙二醇。结晶溶液中的PA多肽片段或其变体优选为85%至100%纯、更优选90%至100%纯、甚至更优选95%至100%纯。为了产生晶体,将适于结晶的蛋白质溶液与等体积的沉淀溶液混合。在一个优选实施方案中,结晶介质包含O. 05μ I至2μ I、优选O. 8μ I至I. 2μ I的适于结晶的蛋白质溶液,其与相似体积、优选等体积的包含I. OmM至2. OmM甲酸钠、80mM至120mM HEPES (pH 6. 5至DH 7. 5)和2%至5%乙二醇或甘油的沉淀溶液混合。在另一个实施方案中,沉淀溶液包含I. 6mM甲酸钠、O. IM HEPES (pH 7. O)和5%乙二醇或甘油,优选基本由它们组成或由它们组成;而结晶/蛋白质溶液包含20mM HEPES(pH7. 5)、150mM NaCl、2. OmMMnCl2 和 2. OmM MgCl2 中的 10mg/ml 至 15mg/ml,优选基本由它们组成或由它们组成。在另一个实施方案中,PA多肽片段可使用以下溶液与化合物(优选与调节(优选抑制)PA多肽片段的核酸内切酶活性的化合物,优选与表I或2的化合物)共结晶(i)蛋白质水溶液,在浓度范围为IOmM至3M、优选IOmM至2M、更优选20mM至IM且pH为pH 3至pH 9、优选pH 4至pH 9、更优选pH 7至pH 9的缓冲体系(如HEPES或Tris-HCl)中的PA多肽片段浓度为 5 至 20mg/ml,如 5、5· 5、6、6· 5、7、7· 5、8、8. 5、9、9· 5、10、10· 5、11、11· 5、12、12. 5、13、13· 5、14、14· 5、15、15· 5、16、16· 5、17、17· 5、18、18· 5、19、19· 5 或 20mg/ml,优选 8至15mg/ml,最优选10至15mg/ml ;和(ii)包含一种或更多种物质的沉淀溶液/储集溶液,所述物质例如甲酸钠、硫酸铵、硫酸锂、乙酸镁、乙酸锰、氯化钠、乙二醇、甘油或PEG。为了共结晶,将化合物(优选调节(优选抑制)PA多肽片段的核酸内切酶活性的化合物,优选表I或表 2的化合物)添加到蛋白质水溶液中至终浓度为O. 5mM至5mM,优选I. 5mM至5mM,即O. 5、I、I. 5、2、2. 5、3、4· 5 或 5mM。任选地,蛋白质溶液可包含一种或更多种盐,例如单价盐,如NaCl、KCl或LiCUt选NaCl,其浓度范围为IOmM至1M、优选20mM至500mM、更优选50mM至200mM ;和/或二价盐,如 MnCl2、CaCl2、MgCl2、ZnCl2 或 CoCl,优选 MgCl2 和 MnCl2,其浓度范围为 O. ImM 至 50mM、优选O. 5mM至25mM、更优选ImM至IOmM或ImM至5mM。优选地,沉淀/储集溶液包含浓度范围为O. IM至2. 5M、优选O. IM至2. OM的硫酸铵,浓度范围为IOmM至1M、优选50mM至500mM、更优选75mM至150mM并且pH为4至7、更优选pH为5至6的缓冲体系(如Bis-Tris),和/或浓度范围为I %至30%、优选15%至30 %、更优选 20 % 至 25 % 的 PEG (如 PEG 3350)。蛋白质溶液中的PA多肽片段或其变体优选85 %至100 %纯、更优选90 %至100 %纯、甚至更优选95%至100%纯。为进行共结晶,可将包含PA多肽片段或其变体和化合物的蛋白质水溶液与等体积的沉淀溶液混合。在一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH 7. 5) U50mM NaCl、2. OmM MnCl2和2· OmM MgCl2以及终浓度为I. 5mM的4_[3_[ (4-氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-3)中的 10mg/ml 至 15mg/ml PA多肽片段,优选基本由它们组成或由它们组成;而储集溶液/沉淀溶液包含2. OM硫酸铵和O. IMBis-Tris (pH 5. 5),优选基本由它们组成或由它们组成(也参见表I)。在另一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH7. 5) U50mM NaCl、2. OmM MnCl2,2. OmM MgCl2和终浓度为I. 5mM的4_[4_[ (4-氯苯基)甲基]_1_(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-2)中的 10mg/ml 至 15mg/ml PA多肽片段,优选基本由它们组成或由它们组成,优选浸入到最初用核糖尿苷一磷酸(rUMP)生长的晶体中;而储集溶液/沉淀溶液包含O. IM硫酸铵、O. IM Bis-Tris (pH 5. 5)和25%(w/v)PEG 3350,优选基本由它们组成或由它们组成(也参见表I)。在另一个优选实施方案中,蛋白质溶液包含在20mM HEPES(pH7. 5) U50mM NaCl、2. OmM MnCl2和I. OmM MgCl2以及终浓度为5mM的核糖尿苷一磷酸(rUMP)中的10mg/ml至15mg/ml PA多肽片段,优选基本上由它们组成或由它们组成;而储集溶液/沉淀溶液包含O. IM硫酸铵、O. IM Bis-Tris (pH 5.5)和25% (w/v)PEG 3350,优选基本上由它们组成或由它们组成(也参见表I)。用于PA多肽片段或其变体与例如4-[3-[(4_氯苯基)甲基]_1_(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-1)或[(2R,3R) -5,7- 二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)的共结晶的另一些优选储集溶液/沉淀溶液也可从表I中得到。可通过任何本领域技术人员已知的任何方法使晶体生长,包括但不限于悬滴(hanging drop)和坐滴(sitting drop)技术、夹心滴(sandwich-drop)、透析以及微批量或微管批量设备。对本领域技术人员来说很明显的是,改变上面公开的结晶条件来鉴定产生单独或与化合物相复合之本发明PA多肽片段或其变体的晶体的其它结晶条件。这些改变包括但不限于调整pH、蛋白质浓度和/或结晶温度,改变所用盐和/或沉淀剂的种类或浓度,使用不同的结晶方法,或者引入有助于结晶的添加剂例如去污剂(例如吐温20(单月桂酯)、LDOA、Brij 30 (4月桂基醚))、糖(例如葡萄糖、麦芽糖)、有机化合物(例如二噁烷、二甲基甲酰胺)、镧系元素离子或者多聚离子化合物。还可使用高通量结晶测定来帮助发现或优化结晶条件。可使用微接种(microseeding)来提高晶体的尺寸和质量。简言之,将微晶体破碎以产生晶种储备溶液(stock seed solution)。对所述晶种储备溶液进行系列稀释。使用针、玻璃棒或毛发线,将来自各稀释液的小样品添加到一组经平衡的滴中,其中含有的蛋白质浓度等于或小于不存在晶种时产生晶体所 需的浓度。目的是最后得到在滴中发挥晶体生长的晶核作用的单晶种。如本文所述获得如图I至5所示结构坐标、对所述坐标进行解读的方法及其在了解蛋白质结构中的应用为本领域技术人员公知,并参考标准教科书,例如 J. Drenth, " Principles of protein X-ray crystallography 〃,第二版,Springer Advanced Texts in Chemistry, New York (1999); 和 G. E. Schulz 和R. H. Schirmer, " Principles of Protein Structure " , Springer Verlag, NewYork(1985)。例如,通常使用冷冻至IOOK的低温保护(例如用20%至30%甘油)的晶体首先获得X射线衍射数据,例如使用同步加速器设备的线束或者旋转阳极作为X射线源。然后,通过公知的方法解析相位问题,例如多波长异常衍射(multiwavelength anomalousdiffraction, MAD)、多重同晶置换(multiple isomorphous replacement, MIR)、单波长异常衍身寸(single wavelength anomalous diffraction, SAD)或者分子置换(molecularreplacement, MR)。可使用 SHELXD 解出亚结构(Schneider 和 Sheldrick, 2002, ActaCrystallogr. D. Biol. Crystallogr. (PtlO Pt 2),1772-1779),使用 SHARP 计算相位(Vonrhein等,2006,Methods Mol. Biol. 364 :215-30),用溶剂扁平化及非结晶对称平均化进行改进(例如使用 RESOLVE (TerwiIIiger, 2000, Acta Cryst. D. Biol. Crystallogr. 56 965-972))。可使用例如 ARP/wARP (Perrakis 等,1999,Nat. Struct. Biol. 6 :458-63)进行模型自构建并使用例如REFMAC进行精修化(Murshudov, 1997, Acta Crystallogr. D. Biol.Crystallogr. 53 :240-255)。优选地,本发明多肽片段内包含的PA片段氨基端对应于(优选地基本由其组成或由其组成)SEQ ID NO : 2的甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基的I至190位,优选I至198位,优选I至200位氨基酸或其变体。在一个优选实施方案中,将本发明的多肽片段纯化至适于结晶的程度,优选其为85%至100%纯、更优选90%至100%纯、最优选95%至100%纯。在另一个优选实施方案中,将本发明的多肽片段纯化至适于共结晶的程度,其优选为85%至100%纯、更优选90%至100%纯、最优选95%至100%纯。在另一个实施方案中,本发明的多肽片段能够与二价阳离子结合。优选地,本发明的多肽片段与一个或更多个二价阳离子结合,优选与两个二价阳离子结合。在此情况下,二价阳离子优选选自锰、钴、钙、镁和锌,并且更优选锰或钴,最优选锰和/或镁。因此,在一个优选实施方案中,本发明的多肽片段以以与以下复合的形式存在(i)两个锰阳离子,(ii)两个镁阳离子或(iii) 一个锰阳离子和一个镁阳离子。在一个优选实施方案中,二价阳离子与对应于SEQ ID NO 2中氨基酸Glu80和Aspl08的氨基酸(第二阳离子)和对应于SEQID NO 2中氨基酸His41、Aspl08、Ilel20和Glull9的氨基酸(第一阳离子)配位。在一个优选实施方案中,I位的二价阳离子为锰且2位为锰或镁,即I位为锰且2位为镁(参见图6),或者I位为锰且2位为锰(参见图7至10、图17和图18)。在另一个实施方案中,本发明的多肽片段是这样的多肽片段或其变体,其中N端与SEQ ID NO :2的PA亚基氨基酸序列的15位或更低位(例如15、14、13、12、11、10、9、8、
7、6、5、4、3、2或I位)上的氨基酸相同或相对应;而C端与选自SEQ ID NO :2的PA亚基氨基酸序列的 186 至 200 位(例如 186、187、188、189、190、191、192、193、194、195、196、197、198、199或200位)上的氨基酸相同或相对应,优选C端与SEQ ID NO :2的PA亚基氨基酸序列的190至200、更优选190至198位上的氨基酸相同或相对应;其中所述变体在SEQ IDNO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸并且保留核酸内切酶 活性。在本发明的一个优选实施方案中,所述变体包含SEQ ID NO 2所示氨基酸序列的I至198位氨基酸,其中52位至64位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成SEQ ID NO 2所示氨基酸序列的I至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA (SEQ IDN03)的氨基端接头。在本发明的一个更优选实施方案中,所述变体包含SEQ ID NO :2所示氨基酸序列的I至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成SEQ ID NO 2所示氨基酸序列的I至198位氨基酸,其中52至72位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA (SEQ IDN03)的氨基端接头。在本发明的另一个更优选实施方案中,所述变体包含SEQ ID NO : 2所示氨基酸序列的I至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述变体由以下组成SEQ ID NO :2所示氨基酸序列的I至198位氨基酸,其中52至69位氨基酸被替换为氨基酸甘氨酸,以及任选的具有氨基酸序列MGSGMA(SEQID NO 3)的氨基端接头。优选地,所述多肽片段具有或者对应于选自以下的氨基酸序列SEQ ID NO :2所示氨基酸序列的5至190位、10至190位、15至190位、20至190位、5至198位、10至198位、15至198位、20至198位氨基酸及其变体,其中所述变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸并且保留核酸内切酶活性。在另一个实施方案中,本发明的多肽片段(变体)a)由以下组成SEQ ID NO 2所示氨基酸序列的I至198位氨基酸和任选的具有氨基酸序列MGSGMA (SEQ ID NO 3)的氨基端接头,并且其结构由以下来限定⑴图I所示的结构坐标,(ii)图2所示的结构坐标,(iii)图3所示的结构坐标,(iv)图4所示的结构坐标,或(V)图5所示的结构坐标,或者b)由以下组成SEQ ID NO :2所示氨基酸序列的I至198位氨基酸,其中52至64位氨基酸被替换为氨基酸甘氨酸,和任选的具有氨基酸序列MGSGMA (SEQ ID NO 3)的氨基端接头,并且其结构由以下来限定(vi)图15所示的结构坐标,或(vii)图16所示的结构坐标。优选地,本发明多肽片段的晶体结构由图I所示的结构坐标来限定且未与化合物共结晶(天然结构)。更优选地,在与化合物共结晶后,优选与调节(优选抑制)本发明多肽片段核酸内切酶活性的化合物共结晶之后,所述多肽片段(变体)具有图2至图5、图15或图16所示结构坐标限定的晶体结构。尤其优选地,在与表I或表2的化合物共结晶之后,所述多肽片段(变体)具有如图2至图5、图15或图16所示结构坐标来限定的结构,S卩,与4-[3-[(4_氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)共结晶之后具有如图2和图3所示的结构坐标所限定的结构,与4-[4-[(4_氯苯基)甲基]-1-(环己基 甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)共结晶之后具有如图4所示的结构坐标所限定的结构,与核糖尿苷一磷酸(rUMP)共结晶之后具有如图5所示的结构坐标所限定的结构,与4-[3-[ (4-氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)共结晶之后具有如图15所示的结构坐标所限定的结构,或者与[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)共结晶之后具有如图16所示的结构坐标所限定的结构。鉴于以上内容,本领域技术人员容易理解的是,所述多肽片段(变体)的晶体结构仅由图I、图2至图5、图15或图16中所含其氨基酸和任选地其结合之二价阳离子的结构坐标来限定,而不由图2至图5、图15或图16中还包含的用于共结晶的各化合物的结构坐标限定,即图2和图3中化合物EMBL-R05-3具有残基描述子(descriptor) ci3,图4中化合物EMBL-R05-2具有残基描述子ci2,图5中的化合物rUMP具有残基描述子U,图15中化合物EMBL-R05-1具有残基描述子cil,图16中化合物EGCG具有残基描述子tte。还优选的是,具有由图I所示结构坐标限定的结构的所述多肽片段(变体)具有空间群C2的晶型,并且晶胞尺寸为a = 26. 36nm±0. 5nm, b = 6. 62nm±0. 3nm, c =6. 63nm±0. 3nm,a = 90。,β =96±2°,γ = 90。;具有由图 2 至图 5 所示结构坐标限定的结构的所述多肽片段(变体)具有空间群PZPA的晶型,并且晶胞尺寸为a =5. 46±0· 3nm, b = 12. 25±0· 4nm, c = 13. 0±0· 3nm, α = 90° , β =90° , Y =90° ;具有由图15所示结构坐标限定的结构的所述多肽片段(变体)具有空间群Ρ6222的晶型,并且晶胞尺寸为 a = 7. 50nm±0. 3nm, b = 7. 50nm±0. 3nm, c = 12. 00nm±0. 5nm, α =90。,β = 90°,Y = 120° ;或具有由图16所示结构坐标限定的结构的所述多肽片段(变体)具有空间群P6422的晶型,并且晶胞尺寸为a = 9. 99nm±0. 5nm, b = 9. 99nm±0. 5nm, c =
8.27nm±0. 3nm, a = 90° , β = 90° , γ = 120°。优选地,多肽片段(变体)的晶体以2.8 A或更高、优选2.6 A或更高、更优选
2.5 A或更高、甚至更优选2.4 Λ或更高、最优选2.1 I或更高或者1.9 A或更高的分辨率衍射X射线。例如多肽片段(变体)的晶体以1.9、2.0、2. 1、2. 2、2. 3、2.4、2. 5、2.6、2. 7、2.8 Λ或更高的分辨率衍射X射线。
本发明的另一方面提供了编码本发明的上述(分离的)PA多肽片段及其变体的分离的多核苷酸。在本发明的一个优选实施方案中,所述分离的多核苷酸编码包含SEQ ID N0:2所示氨基酸序列之I至198位氨基酸的PA多肽片段。在本发明的另一个优选实施方案中,所述分离的多核苷酸编码包含SEQ ID N02所示氨基酸序列之I至198位氨基酸的PA多肽片段变体,其中52位至64位氨基酸被替换为氨基酸甘氨酸。在本发明的一个更优选实施方案中,所述分离的多核苷酸编码包含SEQ ID N02所示氨基酸序列之I至198位氨基酸的PA多肽片段变体,其中52位至72位氨基酸被替换为氨基酸甘氨酸。 在本发明的另一更优选实施方案中,所述分离的多核苷酸编码包含SEQ ID N02所示氨基酸序列的I至198位氨基酸的PA多肽片段变体,其中52位至69位氨基酸被替换为氨基酸甘氨酸。用于得到这些分离的核苷酸片段的分子生物学方为本领域技术人员公知(对于标准分子生物学方法,参见Sambrook等编,"Molecular Cloning A LaboratoryManual " , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NewYork(1989),其通过引用并入本文)。例如,可从经甲型流感2009大流行HlNl病毒感染的细胞中分离RNA,并且使用随机引物(例如随机六聚体或十聚体)或者用于产生目的片段的特异性引物通过逆转录聚合酶链式反应(RT-PCR)产生cDNA。然后可通过标准PCR使用片段特异性引物扩增目的片段。编码甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基片段的分离的核苷酸来自SEQ ID N0:1。在此情况下,“来自”是指SEQ ID NO : I编码全长PA多肽,因此编码优选PA多肽片段的多核苷酸可根据各自所编码PA多肽片段的需要在多核苷酸的3’和/或5’端包含缺失。在另一方面中,本发明涉及包含本发明的分离的多核苷酸的重组载体。本领域技术人员十分了解用于将目的多核苷酸序列整合入载体的技术(也参见Sambrook等,1989,见上)。这些载体包括本领域技术人员已知的任何载体,包括质粒载体、粘粒载体、噬菌体载体例如λ噬菌体、病毒载体例如腺病毒或杆状病毒、或者人工染色体载体例如细菌人工染色体(BAC)、酵母人工染色体(YAC)或Pl人工染色体(PAC)。所述载体可以是适于原核或真核表达的表达载体。所述质粒可包含复制起点(ori),多克隆位点和调节序列例如启动子(组成型或诱导型)、转录起始位点、核糖体结合位点、转录终止位点、多聚腺苷酸化信号以及选择标记,例如抗生素抗性或基于对突变或缺失进行回补(complementation)的营养缺陷型标记。在一个实施方案中,所述目的多核苷酸序列与调节序列有效连接。在另一个实施方案中,所述载体包含编码帮助纯化目的多肽片段之表位、肽或蛋白质标签的核苷酸序列。这些表位、肽或蛋白质标签包括但不限于血凝素(HA)、FLAG、myc标签、多聚His标签、谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、NusA以及硫氧还蛋白标签,或者荧光蛋白标签例如(增强型)绿色荧光蛋白((E)GFP)、(增强型)黄色荧光蛋白((E)YFP)、来自珊瑚(Discosoma)物种的(DsRed)或者单体的(mRFP)红色荧光蛋白(RFP)、青色荧光蛋白(CFP)等。在一个优选实施方案中,可将表位、肽或蛋白质标签从目的多肽片段上切下,例如,使用蛋白酶如凝血酶、因子Xa、PreScission、TEV蛋白酶等。优选地,标签可用TEV蛋白酶切下。这些蛋白酶的识别位点是本领域技术人员公知的。例如,TEV蛋白酶的七氨基酸的共有序列识别位点为Glu-X-X-Tyr-X-Gln-Gly/Ser,其中X可以是任何氨基酸并且在本发明的情况下优选为Glu-Asn-Leu-Tyr-Phe-Gln-Gly (SEQ ID NO 12)。在另一个实施方案中,所述载体包含导致目的多肽片段分泌到重组宿主细胞的培养基中或者细菌的周质间隙中的功能性序列。所述信号序列片段通常编码信号肽,该信号肽由引导蛋白质从细胞中分泌出来的疏水氨基酸构成。所述蛋白质或分泌到生长培养基中(革兰氏阳性菌),或分泌到位于细胞外膜与内膜之间的周质间隙中(革兰氏阴性菌)。优选地,在信号肽片段与外源基因之间编码有加工位点,其可在体内或体外被切割。在另一方面中,本发明提供包含本发明的分离的多核苷酸或本发明的重组载体的重组宿主细胞。所述重组宿主细胞可以是原核细胞例如古细菌和细菌细胞、或者真核细胞例如酵母、植物、昆虫或哺乳动物细胞。在一个优选实施方案中,所述宿主细胞是细菌细胞例如大肠杆菌细胞。本领域技术人员十分了解将所述分离的多核苷酸或所述重组载体引入所述宿主细胞的方法。例如,细菌细胞可使用例如化学转化(如氯化钙法)或者电穿孔容 易地进行转化。酵母细胞可以例如使用醋酸锂转化法或电穿孔进行转化。其它真核细胞可例如使用市售的基于脂质体的转染试剂盒例如Lipofectamine (Invitrogen)、市售的基于脂类的转染试剂盒例如Fugene (Roche Diagnostics)、基于聚乙二醇的转染、磷酸I丐沉淀、基因枪(生物轰击(biolistic))、电穿孔或者病毒感染进行转染。在本发明的一个优选实施方案中,所述重组宿主细胞表达目的多核苷酸片段。在一个甚至更优选实施方案中,所述表达产生本发明的可溶性多肽片段。这些多肽片段可利用本领域技术人员公知的蛋白质纯化方法进行纯化,任选地利用上述表位、肽或蛋白质标签。在另一方面中,本发明涉及鉴定对甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内切酶活性进行调节的化合物的方法,其包括下列步骤a)构建由以下结构坐标定义的活性位点的计算机模型(i)如图I所示的本发明多肽片段的结构坐标,( )如图2所示的本发明多肽片段的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标,(V)如图5所示的本发明多肽片段的结构坐标,(vi)如图15所示的本发明多肽片段(变体)的结构坐标,或者(vii)如图16所示的本发明多肽片段(变体)的结构坐标。b)通过选自以下的方法来选择潜在的调节化合物(i)将分子片段组装成所述化合物,(ii)从小分子数据库中选择化合物,和(iii)对所述化合物进行从头配体设计;c)采用计算方法进行所述化合物与所述活性位点的计算机模型之间的拟合程序运算,以提供所述化合物在所述活性位点的能量最低的构型;以及d)评价所述拟合运算的结果来定量所述化合物与活性位点的模型之间的关联,从而评价所述化合物与所述活性位点相关联的能力。在一个优选实施方案中,在本发明方法中的步骤a)中构建由以下结构坐标定义的活性位点的计算机模型⑴如图I所示的本发明多肽片段的结构坐标(即氨基酸结构坐标)和如图I所示的二价阳离子的结构坐标,(ii)如图2所示的本发明多肽片段的结构坐标(即氨基酸结构坐标)和如图2所示的二价阳离子的结构坐标,(iii)如图3所示的本发明多肽片段的结构坐标和如3所示的二价阳离子的结构坐标,(iv)如图4所示的本发明多肽片段的结构坐标和如图4所示的二价阳离子的结构坐标,(V)如图5所示的本发明多肽片段的结构坐标和如图5所示的二价阳离子的结构坐标,(vi)如图15所示的本发明多肽片段(变体)的结构坐标(即氨基酸结构坐标)和如图15所示的二价阳离子的结构坐标,和/或(vii)如图16所示的本发明多肽片段(变体)的结构坐标(即氨基酸结构坐标)和如图16所示的二价阳离子的结构坐标。优选地,调节化合物与甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基及其变体中的核酸内裂解活性位点相关联,优选结合。调节化合物可提高或降低(优选降低)所述核酸内裂解活性。在本发明该方面的一个优选实施方案中,调节来自甲型流感2009大流行HlNl病 毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性的化合物降低所述活性,更优选地所述化合物抑制所述活性。优选地,与不具有所述化合物而其它反应条件(即缓冲条件、反应时间和温度)相同的来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性相比,化合物使所述PA亚基或其变体的核酸内裂解活性降低50 %、更优选60 %、甚至更优选70 %、甚至更优选80 %、甚至更优选90 %且最优选100%。尤其优选地,化合物特异性降低或抑制来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内裂解活性,但是不以相同程度降低或抑制(优选根本不降低或抑制)其它核酸内切酶、尤其是哺乳动物的核酸内切酶的核酸内裂解活性。基于图I的(天然)核酸内裂解活性位点的结构坐标,本发明允许使用分子设计技术来鉴定、选择或设计潜在地对来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性进行调节的化合物。基于图2至图5、图15或图16的核酸内裂解活性位点的结构坐标,本发明首次进一步允许优化鉴定、选择和设计潜在地对来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶之PA亚基或其变体的核酸内裂解活性进行调节的化合物。所述结构坐标由已与调节化合物共结晶的本发明多肽片段(多肽片段变体)得到,优选与4-[3-[(4_氯苯基)甲基]-1-(苯甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-3)(参见图2和图3)、4_[4_[ (4-氯苯基)甲基]-1-(环己基甲基)-4-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)(参见图4)、核糖尿苷一磷酸(rUMP)(参见图5)、4-[3-[(4_氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)(参见图 15)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)(参见图16)共结晶(还参见表I或表2)。换言之,本发明人出乎意料的发现,不具有结合化合物的本发明多肽片段(变体)(即天然多肽片段(变体))的结构坐标(参见例如图I)与具有结合化合物的本发明多肽片段(变体)的结构坐标(参见例如图2至图5、图15或图16)不同,因为在化合物结合之后,所述多肽片段(变体)改变了其构象。因此,这种新的三维信息允许对现有抑制剂的修饰进行优化设计以改善其效力,或设计和优化有效阻断核酸内切酶活性的新型抑制剂。
鉴于与制备和测试可能可调节核酸内裂解活性的多种化合物相关的较高成本,这样的预测模型是有价值的。为了使用针对甲型流感2009大流行HlNl的PA多肽片段(变体)产生的结构坐标,必须将结构坐标转变为三维形状。这通过使用能够从一组结构坐标产生分子或其部分之三维图示的市售软件来完成。这样的计算机程序的一个实例为MODELER (在 Insight II Homology 软件包(Sali 和 Blundell,1993,J. Mol. Biol.,234,779-815 在 Insight II(97. O),Molecular Simulations Incorporated,San Diego,CA)中运行)。本领域技术人员可使用数种方法来根据调节2009流行性甲型HlNl流感PA亚基或甲型流感2009大流行HlNlPA亚基PA多肽变体之核酸内裂解活性的能力筛选化学实体或片段。该过程可从对例如基于图I至图5、图15或图16之结构坐标的核酸内裂解活性位点的三维计算机模型进行肉眼观察开始。然后可将选择的片 段或化学化合物以多种方向放置于或对接入活性位点内。可使用软件例如Cerius、Quanta和Sybyl (Tripos Associates,St. Louis, MO)完成对接,然后是的能量最小化和具有标准分子动力学力场的分子动力学,例如0PLS-AA、CHARMM和AMBER。可在合适化合物或片段的选择过程中协助本领域技术人员的另一些专门化计算机程序包括,例如(i)AUTODOCK(GoodselI等,1990, Proteins Struct. , Funct. , Genet. ,8 195-202 ;AUT0D0CK 可得自 Scripps Research Institute,La Jolla, CA)以及(ii)DOCK(Kuntz 等,1982,J. Mol. Biol.,161 :269-288 页;DOCK 可得自University of California, San Francisco, CA)。一旦选择了合适的化合物或片段,则可将其设计或组装成单个化合物或复合物。这种人工建模利用软件例如Quanta或Sybyl进行。在单个化合物或片段的连接中协助本领域技术人员的可用程序包括,例如(i) CAVEAT (Bartlett等,1989, MolecularRecognition in Chemical 和 Biological Problems, Special Publication, RoyalChem. Soc. 78 182-196 ;Lauri 和 Bartlett,1994,J.Comp. Aid. Mol. Des. 8 :51-66 ;CAVEAT 可得自 University of California, Berkley, CA), (ii) 3D Database 系统例如ISIS (MDL Information Systems, San Leandro, CA ;综述于 Martin, 1992, J. Med. Chem. 35 2145-2154),和(iii)HOOK(Eisen 等,1994, Proteins Struct. , Funct. , Genet. 19 199-221 ;H00K 可得自 Molecular Simulations Incorporated, San Diego, CA)。本发明能够进行的另一种方法是在小分子数据库中用计算机筛选可以与甲型流感2009大流行HlNlPA亚基的核酸内裂解活性位点或甲型流感2009大流行HlNlPA多肽变体之活性位点以整体或部分结合的化合物。在此筛选中,这些化合物与活性位点的匹配度可由形状互补性或者由估计的相互作用能量来判断(Meng等,1992, J. Comp. Chem. 13 505-524)。或者,用于甲型流感2009大流行HlNlPA亚基或其甲型流感2009大流行HlNl多肽变体的核酸内裂解活性的潜在调节剂(优选核酸内裂解活性的抑制剂)可基于图I至图5的PA多肽片段的3D结构从头设计。有本领域技术人员可得到的多种配体从头设计方法。这些方法包括(i) LUDI (Bohm, 1992,J. Comp. Aid. Mol. Des. 6 :61-78 ;LUDI 可得自 MolecularSimulations Incorporated,San Diego,CA),(ii)LEGEND(Nishibata和Itai,Tetrahedron47 :8985-8990 ;LEGEND 可得自 Molecular Simulations Incorporated, San Diego, CA),(iii) LeapFrog (可得自 Tripos Associates, St. Louis, MO), (iv) SPROUT (Gi I let 等,1993,J. Comp. Aid. Mol. Des. 7 :127-153 ;SPROUT 可得自 University of Leeds, UK),(v)GROUPBUILD (Rotstein 和 Murcko,1993,J. Med. Chem. 36 :1700-1710),以及(vi) GROW (Moon和 Howe, 1991,Proteinsll :314-328)。此外,可支持本领域技术人员对核酸内裂解活性位点的潜在调节剂和/或抑制剂(优选核酸内裂解活性位点的结合伴侣)进行从头设计和建模的数种分子建模方法(通过引用并入本文)已有描述,并且包括如Cohen等,1990,J. Med. Chem. 33 =883-894 ;Navia 和 Murcko, 1992, Curr. Opin. Struct. Biol. 2 :202-210 ;Balbes 等,1994,综述于Computational Chemistry,第 5 卷,Lipkowitz 和 Boyd 编,VCH, New York,第 37-380 页;Guida, 1994,Curr. Opin. Struct. Biol. 4 :777-781。被设计或选择用作与甲型流感2009大流行HlNlPA亚基或其变体的核酸内裂解活性位点相结合的分子可以进一步通过计算进行优化,从而使其在结合状态下优选与目 标区域不存在排斥性静电相互作用。这些非互补性(例如静电)相互作用包括排斥性电荷-电荷、偶极-偶极以及电荷-偶极相互作用。特别地,在结合状态下结合化合物与结合口袋之间所有静电相互作用之和优选对结合焓无影响或有有利贡献。本领域有可评价化合物形变能和静电相互作用的特定计算机程序。合适的程序实例包括(i)Gaussian 92修订版 C(Frisch, Gaussian, Incorporated, Pittsburgh, PA), (ii)AMBER,4. 0 版(Koliman,University of California, San Francisco, CA),(iii)QUANTA/CHARMM(MolecularSimulations Incorporated,San Diego,CA),(iv)OPLS-AA(Jorgensen,1998,Encyclopediaof Computational Chemistry, Schleyer 编,Wiley, New York,第 3 卷,第 1986-1989 页),以及(v) Insight II/Discover (Biosysm Technologies Incorporated, San Diego, CA)。这些程序可使用例如Silicon Graphics工作站、IRIS 4D/35或IBM RISC/6000工作站550型来执行。其它硬件系统和软件包是本领域技术人员已知的。一旦如上所述选择和设计了目的分子,就可对其进行一些原子或侧链基团的替换以改善或修饰其结合特性。一般来说,最初的替换是保守的,即,替换基团与原始基团的大小、形状、疏水性和电荷大致相同。当然,应理解,应避免本领域中已知改变构象的组分。然后可通过与如上详细所述相同的计算机方法来分析这些经替换的化学化合物与甲型流感2009大流行HlNlPA亚基或其变体的核酸内裂解活性位点的匹配效率。在本发明上述方法的一个实施方案中,甲型流感2009大流行HlNlPA亚基或其变体的核酸内裂解活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20和His41或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Lys34或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Tyr24或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Arg84 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Phel05或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Tyrl30或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Ile38或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41和Argl24或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34 和 Tyr24 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24 和 Arg84 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84和Phel05或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05和Tyrl30或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30和Ile38或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38 和 Argl24 或其对应氨基酸。而在又一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38 和 Glu26或其对应氨基酸,或者SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Argl24 和 Glu26 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38 和 Lysl34或其对应氨基酸,或者SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Argl24 和 Lysl34 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38 和 Leul06 或其对应氨基酸,或者 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24 和 Leul06 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38 和 Lysl37 或其对应氨基酸,或者 SEQID NO 2 的 PA 亚基的氨基酸611180、6111119、六8口108、116120、把841、1^834、了7124、六找84、Phel05、Tyrl30、Ile38、Argl24和Lysl37或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的?六亚基的氨基酸611180、6111119、六8口108、116120、出841、1^834、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Gly26 和 Lysl34 或其对应氨基酸,或者 SEQ ID NO 2的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Gly26和Lysl34或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 八亚基的氨基酸611180、6111119、48口108、116120、把841、1^834、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Leul06 和 Lysl37 或其对应氨基酸,或者 SEQ ID NO 2 的 PA 亚基的氨基酸611180、6111119、六8 108、116120、^841、1^834、17^4、六找84、卩1^105、Tyrl30、Ile38、Argl24、Leul06和Lysl37或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26 和 Lysl37 或其对应氨基酸,或者 SEQ ID NO 2的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Glu26和Lysl37或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 八亚基的氨基酸611180、6111119、48口108、116120、把841、1^834、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26 和 Leul06 或其对应氨基酸,或者 SEQ ID NO 2的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Glu26和Leul06或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Lysl34^P Leul06 或其对应氨基酸,或者 SEQ ID NO 2 的 PA 亚基的氨基酸611180、6111119、六8 108、116120、^841、1^834、17^4、六找84、卩1^105、Tyrl30、Ile38、Argl24、LyS134和Leul06或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Lysl34^P Lysl37 或其对应氨基酸,或者 SEQ ID NO 2 的 PA 亚基的氨基酸611180、6111119、六8 108、116120、^841、1^834、17^4、六找84、卩1^105、Tyrl30、Ile38、Argl24、LyS134和Lysl37或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、 Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26、Lysl34 和 Leul06 或其对应氨基酸,或者 SEQID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Glu26、Lysl34 和 Leul06 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26、Lysl34、Leul06 和 Lysl37 或其对应氨基酸,或者 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Glu26、Lysl34、Leul06 和 Lysl37 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Glu26或其对应氨基酸。在另一个实施方案中,所述活性位点包含 SEQ ID NO 2 的 PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41 和 Lysl34或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Leul06或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Lysl37或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Glu26 和 Lysl34 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34和 Leul06 或其对应氨基酸。在另一个实施方案中,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34、Leul06 和 Lysl37 或其对应氨基酸。在本发明上述方法的一个实施方案中,甲型流感2009大流行HlNlPA亚基或其变体的核酸内裂解活性位点由根据图I至图5的PA亚基SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20和His41的结构坐标来限定,或者由根据图15或图16的分别对应于 SEQ ID 勵2中氨基酸611180、6111119、48口108、116120和把841的?4亚基氨基酸6111、Glu、Asp、lie和His的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图 5 的 PA 亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Lys34的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20 和 His41 和 Lys34 的 PA 亚基氨基酸 Glu、Glu、Asp、Ile、His 和 Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Tyr24的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Tyr24的PA亚基氨基酸Glu、Glu、Asp、lie、His和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Arg84的结构坐标来限定,或者由根据图15或图16的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Arg84 的 PA 亚基氨基酸Glu、Glu、Asp、Ile、His和Arg的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Phel05的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Phel05 的 PA 亚基氨基酸 Glu、Glu、 Asp、lie、His和Phe的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图 5 的 PA 亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Tyr130的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41 和 Tyr130 的 PA 亚基氨基酸 Glu、Glu、Asp、He, His 和 Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Ile38的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Ile38的PA亚基氨基酸Glu、Glu、Asp、lie、His和He的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41 Arg124的结构坐标来限定,或者由根据图15或图16的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Argl24 的 PA亚基氨基酸Glu、Glu、Asp、lie、His和Arg的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34和Tyr24的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34 和 Tyr24 的 PA 亚基氨基酸 Glu、Glu、Asp、Ile、His、Lys 和 Tyr 的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO 2中氨基酸611180、6111119、48口108、116120、把841、1^834、了7124和 Arg84 的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24 和 Arg84 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr 和 Arg的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84 和 Phel05的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84 和 Phel05 的 PA 亚基氨基酸 Glu,Glu,Asp、lie、His、Lys> Tyr、Arg和Phe的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05和Tyr 130的结构坐标来限定,或者由根据图15或图16 的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24> Arg84> Phel05 和 Tyr 130 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg>Phe和Tyr的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30和Ile38的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ IDNO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30和 Ile38 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr 和 lie 的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至图5的PA亚基SEQ ID NO 2 中氨基酸 Glu80、Glull9、Asp 108、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38和Argl24的结构坐标来限定,或者由根据图15或图16的分别对应于SEQ ID NO 2中氨基酸 Glu80、Glull9、Asp 108、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130,Ile38 和 Argl24 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr、Arg、Phe> Tyr、He 和 Arg的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO :2中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38和Glu26的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38 和Glu26 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr> He 和 Glu 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38和Lysl34的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO :2中氨基酸611180、6111119、六8 108、116120、^841、1^834、丁7『24、六找84、卩1^105、丁71'130、11638 和Lysl34 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr、Arg、Phe> Tyr> He 和 Lys 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24, Arg84、Phel05、Tyr130,Ile38和Leul06的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID N0:2中氨基酸611180、6111119、六8 108、116120、^841、1^834、丁7『24、六找84、卩1^105、丁71'130、11638 和Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr、Arg、Phe> Tyr> He 和 Leu 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130,Ilel38和Lys 137的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130,Ile38 和 Lys137 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys、Tyr、Arg、Phe、Tyr、lie 和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Gly26和Lysl34的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO :2 中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30> Ile38、Glu26 和 Lysl34 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr、lie、Glu和Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图 I 至 5 的 PA 亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Leul06 和 Lysl37 的结构坐标来限定,或者由根据图 15 或 16 的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Leul06 和 Lysl37 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr、Arg、Phe> Tyr、lie、Leu 和 Lys 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26 和 Lysl37 的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel 20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26 和 Lysl37 的PA 亚基氨基酸 Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、Ile、Glu 和 Lys 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO :2中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、 Glu26和Leul06的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO:2中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26 和 Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr> lie、Glu和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Lysl34和Leul06的结构坐标来限定,或者由根据图15或16的分别对应于 SEQ ID NO 2 中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30> Ile38、Lysl34 和 Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys>Tyr、Arg、Phe、Tyr、Ile、Lys和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图 I 至 5 的 PA 亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Lysl34 和 Lysl37 的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Lysl34 和 Lysl37 的 PA 亚基氨基酸Glu、Glu、Asp、Ile、His、Lys、Tyr、Arg、Phe、Tyr、lie、Lys 和 Lys 的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26、Lysl34和Leul06的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26、Lysl34 和 Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr> lie、Glu、Lys和Leu的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的 PA 亚基 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl 30、Ile38、Glu26、Lysl34、Leul06 和 Lysl37 的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Glu26、Lysl34、Leul06 和 Lysl37 的PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys> Tyr> Arg、Phe> Tyr> lie、Glu、Lys> Leu 和 Lys的结构坐标来限定。在又一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38、Argl24、Glu26、Lysl34、Leul06 和 Lysl37 的结构坐标来限定,或者由根据图 15 或 16 的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl24、Glu26、Lysl34、Leul06 和 Lysl37 的PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Lys、Tyr、Arg、Phe、Tyr> lie、Arg、Glu、Lys、Leu 和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Glu26的结构坐标来限定,或者由根据图15 或 16 的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和Glu26的PA亚基氨基酸Glu、Glu、Asp、lie、His和Glu的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41和Lysl34的结构坐标来限定,或者由根据图15或16的分别对应于 SEQ ID NO 2 中氨基酸 611180、6111119、48口108、116120、把841和1^8134的?4亚基氨基酸Glu、Glu、Asp、lie、His和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图 I 至 5 的 PA 亚基 SEQ ID NO :2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和Leul06的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41 和 Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His和Leu的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41 和 Lysl37 的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41和Lysl37的PA亚基氨基酸Glu、Glu、Asp、lie、His和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO :2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26和Lysl34的结构坐标来限定,或者由根据图15 或 16 的分别对应于 SEQ ID NO 2 中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26和Lysl34的PA亚基氨基酸Glu、Glu、Asp、lie、His、Glu和Lys的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2中氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34 和 Leul06 的结构坐标来限定,或者由根据图 15 或 16 的分别对应于 SEQ ID NO 2 中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34 和 Leul06 的 PA 亚基氨基酸 Glu、Glu、Asp、Ile、His、Glu、Lys 和 Leu 的结构坐标来限定。在另一个实施方案中,所述活性位点由根据图I至5的PA亚基SEQ ID NO 2中氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34、Leul06 和 Lysl37 的结构坐标来限定,或者由根据图15或16的分别对应于SEQ ID NO 2中氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41、Glu26、Lysl34、Leul06 和 Lysl37 的 PA 亚基氨基酸 Glu、Glu、Asp、lie、His、Glu、Lys、Leu和Lys的结构坐标来限定。本发明人出乎意料地发现,二价阳离子的结合需要甲型流感2009大流行HlNlPA亚基的活性位点中SEQ ID NO 2的氨基酸His41、Glu80、Aspl08、Glull9和Ilel20(参见,例如图I和6),而在图2至5(也参见图7至10以及表I和2)所示的结构中化合物(即抑制剂)的结合需要甲型流感2009大流行HlNlPA亚基的活性位点中SEQ ID NO 2的氨基酸Tyr24、Lys34、Ile38、Arg84、Phel05和Tyrl30,并且这些氨基酸的构象从未连接结构(unligated structure)改变(参见图I和6)。另外,本发明人确定了还需要甲型流感2009大流行HlNlPA亚基的活性位点中SEQ ID NO 2的氨基酸残基Leul06、Lysl34、Lysl37和Glue26以与测试化合物接触(参见表I和2、图2至5以及图7至10)。也参见图15至19。另外,本发明人发现,在图16和18所示的结构中化合物(即抑制剂)相互作用需要甲型流感2009大流行HlNlPA亚基的活性位点中的氨基酸Argl24。化合物/配体相互作用的残基和活性位点的可塑性的三维信息对为改善现有抑制剂的效力而对其进行的修饰优化设计非常重要。另外,因而,设计、鉴定和选择与这些氨基酸相互作用的新型抗病毒化合物是高度优选的。如果根据本文上述方法的计算机建模表明化合物与甲型流感2009大流行HlNlPA亚基或其变体的活性位点结合,则可合成所述化合物并且任选地,所述化合物或其可药用盐可以与一种或更多种可药用赋形剂和/或载体一起配制。因而,上述方法还可包括以下步骤 (e)合成所述化合物并且任选地将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制。任选地,所述化合物或其可药用盐或其制剂调节(优选降低、更优选抑制)甲型流感2009大流行HlNlPA亚基或其变体的核酸内裂解活性的能力可在体内或体外进行测试,其还包括进一步的以下步骤(f)将所述化合物与本发明的PA多肽片段或其变体或者本发明的重组宿主细胞相接触,并确定所述化合物的以下能力(i)结合活性位点和/或(ii)调节(优选降低、更优选抑制)甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内裂解活性的能力。这些化合物与活性位点的匹配度可通过形状互补性或估计的相互作用能来判断(Meng等,1992,J. Comp. Chem. 13 =505-524)。合成所述化合物的方法为本领域技术人员熟知或者这些化合物可以是市售的。本发明的另一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行HlNlPA亚基或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。本发明的又一方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基多肽片段或其变体的核酸内裂解活性位点来调节(优选地降低、更优选地抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性。本发明的又一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)另一些病毒(优选地正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。
优选地,上述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点具有如上所述的结构。因而,优选地,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20和His41或其相应氨基酸。更优选地,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyr130 和 Ile38 或其相应氨基酸,或者包含 SEQ ID NO 2 的 PA 亚基的氨基酸 Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38 和 Argl24 或其相应氨基酸。
还更优选地,所述活性位点包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Glu26、Lysl34、Leul06 和 Lysl37 或其相应氨基酸。最优选地,所述活性位点包含SEQ ID NO 2的PA亚基的氨基酸Glu80、Glul 19、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Glu26、Lysl34、Leul06和Lysl37或其相应氨基酸,或者包含SEQ ID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20、His41、Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38、Argl 24、Glu26、Lysl34、Leul06和Lysl37或其相应氨基酸。优选地,上述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点由上述的PA亚基的结构坐标来限义。可以容易地评估化合物关联(优选结合)前述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点的能力和/或调节(优选降低、更优选抑制)PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不存在或存在不同量的测试化合物的情况下将经纯化的PA亚基或PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定的时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件以使得PA亚基或PA亚基多肽片段在没有测试化合物的情况下有核酸内裂解活性。之后,通过例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解地切割时提供信号,但如果底物分子完整则不提供信号。例如,底物多核苷酸链可用突光报告分子和突光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么荧光报告分子就会被淬灭。如果底物多核酸链被切割,那么荧光报告分子和淬灭剂分离,从而荧光报告分子发出可被例如ELISA阅读器检测到信号。另一些合适的方法在下文描述。优选地,所述化合物可通过上述方法鉴定。更优选地,所述化合物通过上述方法鉴定。可由上述方法鉴定的化合物可以调节甲型流感2009大流行HlNlPA亚基或其变体的核酸内切酶活性。可由上述方法鉴定的化合物可以调节(优选降低、更优选抑制)本发明的甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性。还可以的是,可由上述方法鉴定的化合物也可以调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。本发明的化合物可以是任何试剂,包括但不限于肽、拟肽、多肽、蛋白质(包括抗体)、脂质、金属、核苷酸、核苷、核酸、小有机或无机分子、化学化合物、元素、糖、同位素、碳水化合物、成像剂、脂蛋白、糖蛋白、酶、分析探针、聚胺及其组合和衍生物。术语“小分子”指分子量为50至约2,500道尔顿、优选200 800道尔顿的分子。另外,根据本发明的测试化合物可任选地包含可检测标记。这些标记包括但不限于酶标记、放射性同位素或放射活性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在本发明化合物的一个优选实施方案中,所述化合物不是4-取代的2- 二氧代丁酸、4-取代的4- 二氧代丁酸、4-取代的2,4- 二氧代丁酸、2,6- 二酮哌嗪或其衍生物、取代的2,6-二酮哌嗪或其衍生物、吡嗪-2,6-二酮或取代的吡嗪-2,6-二酮如行1^丨1^(^、^异轻戍酸或N-轻酰胺(N-hydroxymide)。尤其地,根据本发明的化合物不是式I的化合物
Voh
HOH 式IR1 = Me>Et>PhR2 =酰基、氨基甲酰基、磺酰基在本发明化合物的另一个优选实施方案中,化合物不是4-[3-[(4_氯苯基)甲基]-1-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸、4-[4-[ (4-氯苯基)甲基]-1_(环己基甲基)-4-哌啶基]-2_羟基-4-氧代-2- 丁烯酸、4-[3-[(4_氯苯基)甲基]-1-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸、核糖尿苷一磷酸(rUMP)、脱氧胸苷一磷酸(dTMP)或2. 4- 二氧代-4-苯基丁酸(DPBA)。在本发明化合物的又一个优选实施方案中,所述化合物不是儿茶素,优选地不是(-)_表没食子儿茶素没食子酸酯(EGCG)如[(21 ,31 )-5,7-二羟基-2-(3,4,5-三羟苯基)色满-3-基]3,4,5-三羟基苯甲酸酯、(-)_表儿茶素没食子酸酯(ECG)、(-)_表没食子儿茶素(EGC)、(-)_表儿茶素(EC)或没食子酸(GA)。在本发明之化合物的另一个优选实施方案中,所述化合物不是苯乙基苯基酞亚胺、源自反应酮或雷特格韦的苯乙基苯基酞亚胺类似物(也是二酮丁酸衍生物)。在又一个方面中,本发明提供一种(体外)方法,其用于鉴定调节(优选降低、更优选抑制)来自甲型流感2009大流行HlNl病的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性的化合物,所述方法包括下列步骤(i)将根据本发明的所述多肽片段或其变体或者根据本发明的所述重组宿主细胞与测试化合物接触,和(ii)分析所述测试化合物调节(优选降低、更优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。优选地,所述化合物通过关联(优选结合)来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。
在又一个方面中,本发明提供一种(体外)方法,其用于鉴定结合核酸内裂解活性位点,(和)优选地调节(更优选降低、最优选抑制)来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性的化合物,所述方法包括下列步骤(i)将根据本发明的所述多肽片段或其变体或者根据本发明的所述重组宿主细胞与测试化合物接触,和(ii)分析所述测试化合物结合核酸内裂解位点,(和)优选地调节(更优选降低、最优选抑制)所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。在一个实施方案中,甲型流感2009大流行HlNlPA多肽片段或其变体和测试化合物之间的相互作用可以以下拉测定(pull down assay)的形式进行分析。例如,可将根据本发明的PA多肽片段或其变体纯化并固定在珠子上。在一个实施方案中,固定在珠子上的PA多肽片段可与下列物质接触例如(i)另一种经纯化的蛋白质、多肽片段或肽,(ii)蛋白 质、多肽片段或肽的混合物或者(iii)细胞或组织提取物,并且蛋白质、多肽片段或肽的结 合可通过将聚丙烯酰胺凝胶电泳与考马斯染色或Western印迹联合进行验证。未知的结合伴侣可通过质谱分析进行鉴定。在另一个实施方案中,甲型流感2009大流行HlNlPA多肽片段或其变体和测试化合物之间的相互作用可采用基于酶联免疫吸附测定(ELISA)的实验的形式进行分析。在一个实施方案中,可将根据本发明的PA多肽片段或其变体固定在ELISA板的表面并与测试化合物接触。对于例如蛋白质、多肽、肽和表位标签化的化合物,可以通过对测试化合物或表位标签特异的抗体来验证测试化合物的结合。这些抗体可以直接偶联酶或用偶联所述酶(与合适的底物组合)的第二抗体进行化学发光反应(例如,辣根过氧化物酶)或显色反应(碱性磷酸酶)来检测。在另一个实施方案中,不能通过抗体检测的化合物结合可通过直接偶联测试化合物的标记来验证。这些标记可包括酶标记、放射性同位素或放射性化合物或元素、荧光化合物或金属、化学发光化合物和生物发光化合物。在另一个实施方案中,可将测试化合物固定在ELISA板上并与根据本发明的PA多肽片段或其变体接触。所述多肽的结合可通过如上述的PA多肽片段特异性抗体和化学发光或显色反应来验证。在又一个实施方案中,经纯化的甲型流感2009大流行HlNlPA多肽片段或其变体可与肽阵列一起孵育,并且PA多肽片段与对应特定肽序列的特异性肽点的结合可通过以下进行分析例如PA多肽特异性抗体、针对融合至PA多肽片段的表位标签的抗体或者通过由PA多肽片段偶联的荧光标签发出的荧光信号。在另一个实施方案中,将根据本发明的重组宿主细胞与测试化合物接触。这可通过将测试蛋白质或多肽共表达并通过例如荧光共振能量转移(FRET)或免疫共沉淀验证相互作用来实现。在另一个实施方案中,可将直接标记的测试化合物添加至重组宿主细胞的培养基中。测试化合物穿透膜并结合PA多肽片段的能力可例如通过所述多肽的免疫沉淀以及验证标记的存在来验证。在另一个实施方案中,评估测试化合物调节(优选降低、更优选抑制)甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不同量的测试化合物存在或不存在的情况下使经纯化的PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件以使PA亚基多肽在没有测试化合物的情况下有核酸内裂解活性。之后,通过例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解切割时提供信号,而如果底物分子完整则不提供信号。例如,底物多核苷酸链可用突光报告分子和突光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么突光报告分子就被淬灭。如果底物多核酸链被切割,那么突光报告分子和淬灭剂分离,从而突光报告分子发出可被例如ELISA阅读器检测到信号。这个实验设置可应用于多孔板形式并且适于根据化合物调节、降低或抑制甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性的能力来高通量筛选所述化合物。优选地,测试化合物抑制甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性的能力在上述方法中进行分析。在一个优选实施方案中,关联(优选结合)核酸内裂解活性位点且调节、降低和/或抑制甲型流感2009大流行HlNl PA亚基多肽片段或其变体之核酸内裂解活性的化合物的上述鉴定方法以高通量形式进行。在一个优选实施方案中,所述方法使用根据本发明的PA多肽片段或其变体和标记的测试化合物在如上述的多孔微量滴定板中进行。 在一个优选实施方案中,测试化合物来自合成或天然化合物的文库。例如,合成化合物文库可购自 Maybridge Chemical Co. (Trevillet, Cornwall, UK)、ChemBridgeCorporation (San Diego, CA)或 Aldrich (Milwaukee, WI)。天然化合物文库例如可得自TimTec LLC(Newark, DE)。或者,可使用细菌、真菌、植物和动物提取物的天然化合物文库。另外,可使用组合化学合成产生单种化合物或混合物形式的测试化合物。在另一个实施方案中,可以以体内形式测试所鉴定化合物对甲型流感2009大流行HlNl病毒的生命周期的抑制作用。可以在所鉴定化合物存在或不存在的情况下,用甲型流感2009大流行HlNl病毒感染对易受流感病毒感染的细胞系,如293T人胚肾细胞、Madin-Darby狗肾细胞或鸡胚成纤维细胞。在一个优选实施方案中,可将已鉴定的化合物以多种浓度添加至细胞培养基中。病毒蚀斑的形成可被用作甲型流感2009大流行HlNl病毒的感染能力的读出值,并且可将经鉴定化合物处理的细胞与未用其处理的细胞进行比较。在本发明的又一个实施方案中,应用于任何上述方法的测试化合物是小分子。在一个优选实施方案中,所述小分子来自文库,例如小分子抑制剂文库。在另一个实施方案中,所述测试化合物是肽或蛋白质。在一个优选实施方案中,所述肽或蛋白质来自肽文库或蛋白质文库。在用于计算和体外鉴定关联(优选结合)核酸内裂解活性位点且调节、降低和/或抑制本发明甲型流感2009大流行HlNlPA亚基多肽片段或其变体之核酸内裂解活性的化合物的上述方法的另一个实施方案中,所述方法还包括将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制的步骤。如上文所述,本发明的一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)本发明的甲型流感2009大流行HlNlPA亚基或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)本发明的PA亚基或其变体的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基或其变体的核酸内切酶活性。本发明的另一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)根据本发明的甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)根据本发明的PA亚基多肽片段或其变体的核酸内裂解活性位点来调节、优选地降低、更优选地抑制所述PA亚基多肽片段或其变体的核酸内切酶活性。本发明的又一个方面是提供一种化合物,其能够调节(优选降低、更优选抑制)另一些病毒(优选为正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。优选地,所述化合物能够通过关联(优选结合)另一些病毒(优选为正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内裂解活性位点来调节(优选降低、更优选抑制)所述PA亚基的核酸内切酶活性。可容易地评估化合物关联(优选结合)前述PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性位点和/或调节(优选降低、更优选抑制)PA亚基或其变体或者PA亚基多肽片段或其变体的核酸内裂解活性的能力。例如,在不同量的测试化合物存在或不存在的情况下使经纯化的PA亚基或PA亚基多肽片段与其底物(如锅柄状RNA或单链DNA)接触并孵育一定的时间,例如5、10、15、20、30、40、60或90分钟。选择反应条件使得PA亚基或PA亚基多肽片段在没有测试化合物的情况下有核酸内裂解活性。之后,通过 例如凝胶电泳分析底物的降解/核酸内裂解切割。或者,此类测试可包含标记的底物分子,当底物分子被核酸内裂解切割时提供信号,而如果底物分子完整则不提供信号。例如,底物多核苷酸链可用荧光报告分子和荧光淬灭剂标记,从而只要底物多核苷酸链是完整的,那么荧光报告子就会被淬灭。如果底物多核酸链被切割,那么荧光报告子和淬灭剂分离,从而突光报告子发出可被例如ELISA阅读器检测到信号。另一些合适的方法在下文描述。优选地,所述化合物可通过上述(体外)方法进行鉴定。更优选地,所述化合物通过上述(体外)方法进行鉴定。可由上述(体外)方法鉴定的化合物可以调节甲型流感2009大流行HlNlPA亚基或其变体的核酸内切酶活性。可由上述(体外)方法鉴定的化合物可以调节(优选降低、更优选抑制)根据本发明的甲型流感2009大流行HlNlPA亚基多肽片段或其变体的核酸内切酶活性。还可以的是,可由上述(体外)方法鉴定的化合物可以调节(优选降低、更优选抑制)另一些病毒(优选正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒)的PA亚基的核酸内切酶活性。本发明化合物可以是以上计算机(in silico)筛选方法中所述的任何试剂。在本发明化合物的一个优选实施方案中,化合物不是4-取代的2- 二氧代丁酸、4-取代的4- 二氧代丁酸、4-取代的2,4-二氧代丁酸、2,6-二酮哌嗪或其衍生物、取代的2,6-二酮哌嗪或其衍生物、吡嗪_2,6- 二酮或取代的吡嗪_2,6- 二酮如flutimide、N-异羟戊酸或N-羟酰胺。尤其地,根据本发明的化合物不是式I的化合物
权利要求
1.多肽片段,其包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基的氨基端片段,其中所述PA亚基来自甲型流感2009大流行HlNl病毒的SEQ ID NO :2或者是其变体,其中所述变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。
2.根据权利要求I所述的多肽片段,其是可溶的。
3.根据权利要求I或2所述的多肽片段,其是可结晶的。
4.根据权利要求I至3中任一项所述的多肽片段,其中所述氨基端片段对应于SEQIDNO 2的甲型流感2009大流行HlNl病毒RNA依赖性RNA聚合酶PA亚基的至少I至190位氨基酸。
5.根据权利要求I至4中任一项所述的多肽片段,其中所述多肽片段被纯化至适于结晶的程度。
6.根据权利要求I至5中任一项所述的多肽片段,其结合了两个二价阳离子,其中所述二价阳离子优选为锰和/或镁。
7.根据权利要求I至6中任一项所述的多肽片段,其中N端与SEQID NO :2的PA亚基氨基酸序列的第I位氨基酸一致或对应,并且C端与选自SEQ ID NO 2的PA亚基氨基酸序列190至198位的氨基酸一致或对应,或者是其变体,其中所述变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸并且保留核酸内切酶活性。
8.根据权利要求I至7中任一项所述的多肽片段,所述多肽片段 (a)由以下组成SEQID NO 2所示氨基酸序列的I至198位氨基酸,以及任选地具有氨基酸序列MGSGMA(SEQ ID NO 3)的氨基端接头,并且所述多肽片段具有以下所限定的结构(i)如图I所示的结构坐标,(ii)如图2所示的结构坐标,(iii)如图3所示的结构坐标,(iv)如图4所示的结构坐标,或(V)如图5所示的结构坐标,或者 (b)由以下组成SEQID NO 2所示氨基酸序列的I至198位氨基酸,其中52至64位氨基酸替换为氨基酸甘氨酸,以及任选地具有氨基酸序列MGSGMA (SEQ ID NO 3)的氨基端接头,并且所述多肽片段具有以下所限定的结构(vi)如图15所示的结构坐标,或(vii)如图16所示的结构坐标。
9.根据权利要求8所述的多肽片段,其中所述多肽片段具有以下所限定的结构(i)具有空间群C2的晶型,并且晶胞尺寸为a = 26. 36nm±0. 5nm、b = 6. 62nm±0. 3nm、c =.6.63nm±0. 3nm、a =90°、β = 96±2。、γ =90°,(ii)至(v)具有空间群 P2PA 的晶型,并且晶胞尺寸为 a = 5· 46±0· 3nm、b = 12. 25±0· 4nm、c = 13. 0±0· 3nm、α = 90°、β= 90°、γ = 90°,(vi)具有空间群Ρ6222的晶型,并且晶胞尺寸为a = 7. 50nm±0. 3nm、b = 7. 50nm±0. 3nm、c = 12. 00nm±0. 5nm、a = 90°、β = 90°、Y = 120。,或(vii)具有空间群P6422的晶型,并且晶胞尺寸为a = 9. 99nm±0. 5nm、b = 9. 99nm±0. 5nm、c =.8. 27nm±0. 3nm、a = 90°、β = 90°、Y = 120°。
10.根据权利要求8或9所述的多肽片段,其中所述晶体以2.6I或更高、优选2.1產或更高或者1.9 I或更高的分辨率衍射X射线。
11.分离的多核苷酸,其编码权利要求I至 ο中任一项所述的分离的多肽片段。
12.重组载体,其包含权利要求11所述的分离的多核苷酸。
13.重组宿主细胞,其包含权利要求11所述的分离的多核苷酸或权利要求12所述的重组载体。
14.用于鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括下列步骤 (a)构建由以下限定的活性位点的计算机模型(i)如图I所示的权利要求8的多肽片段的结构坐标,(ii)如图2所示的权利要求8的多肽片段的结构坐标,(iii)如图3所示的权利要求8的多肽片段的结构坐标,(iv)如图4所示的权利要求8的多肽片段的结构坐标,(V)如图5所示的权利要求8的多肽片段的结构坐标,(vi)如图15所示的权利要求8的多肽片段的结构坐标,或者(vii)如图16所示的权利要求8的多肽片段的结构坐标, (b)通过选自以下的方法来选择潜在的调节化合物 (i)将分子片段组装成所述化合物, (ii)从小分子数据库中选择化合物,和 (iii)对所述化合物进行从头配体设计; (c)采用计算方法进行所述化合物与所述活性位点的计算机模型之间的拟合程序运算,以提供所述化合物在所述活性位点的能量最低的构型;以及 (d)评价所述拟合运算的结果来定量所述化合物与所述活性位点的模型之间的关联,从而评价所述化合物与所述活性位点相关联的能力。
15.根据权利要求14所述的方法,其中所述活性位点包含SEQID NO :2的PA亚基的氨基酸Glu80、Glull9、Aspl08、Ilel20和His41或与其对应的氨基酸。
16.根据权利要求15所述的方法,其中所述活性位点还包含SEQID NO :2的PA亚基的氨基酸 Lys34、Tyr24、Arg84、Phel05、Tyr130, Ile38 和 Argl24 或与其对应的氨基酸。
17.根据权利要求15或16所述的方法,其中所述活性位点还包含SEQID NO 2的PA亚基的氨基酸Glu26、Lysl34、Leul06和Lysl37或与其对应的氨基酸。
18.根据权利要求14所述的方法,其中所述活性位点由根据图I至5的PA亚基SEQIDNO :2之氨基酸Glu80、Glull9、Aspl08、Ilel20和His41的结构坐标来限定,或者由根据图15 或 16 的分别对应 SEQ ID NO :2 之氨基酸 Glu80、Glull9、Aspl08、Ilel20 和 His41 的 PA亚基氨基酸Glu、Glu、Asp、Ile和His的结构坐标来限定。
19.根据权利要求18所述的方法,其中所述活性位点由根据图I至5的PA亚基SEQIDNO :2 之氨基酸 Lys34、Tyr24、Arg84、Phel05、Tyrl30、Ile38 和 Argl24 的结构坐标来限定,或者由根据图15或16的分别对应SEQ ID NO 2之氨基酸Lys34、Tyr24、Arg84、Phel05、Tyr130、Ile38 和 Argl24 的 PA 亚基氨基酸 Lys、Tyr、Arg、Phe、Tyr、lie 和 Arg 的结构坐标来限定。
20.根据权利要求18或19所述的方法,其中所述活性位点由根据图I至5的PA亚基SEQ ID NO :2之氨基酸Glu26、Lysl34、Leul06和Lysl37的结构坐标来限定,或者由根据图15或16的分别对应SEQ ID NO 2之氨基酸Glu26、Lysl34、Leul06和Lysl37的PA亚基氨基酸Glu、Lys、Leu和Lys的结构坐标来限定。
21.根据权利要求14至20中任一项所述的方法,其还包括以下步骤 (e)合成所述化合物,并且任选地将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制。
22.根据权利要求21所述的方法,其还包括以下步骤 (f)使所述化合物与权利要求I至10中任一项所述的多肽片段或其变体或者权利要求13所述的重组宿主细胞接触,并且测定所述化合物调节所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。
23.鉴定化合物的方法,所述化合物调节来自甲型流感2009大流行HlNl病毒的RNA依赖性RNA聚合酶PA亚基或其变体的核酸内切酶活性,所述方法包括以下步骤 (i)使权利要求I至10中任一项所述的多肽片段或其变体或者权利要求13所述的重组宿主细胞与测试化合物接触,和 (ii)分析所述测试化合物调节所述PA亚基多肽片段或其变体的核酸内切酶活性的能力。
24.根据权利要求23所述的方法,其中对所述测试化合物抑制所述PA亚基多肽片段或其变体的核酸内切酶活性的能力进行分析。
25.根据权利要求23或24所述的方法,其中所述方法以高通量形式进行。
26.根据权利要求23至25中任一项所述的方法,其中所述测试化合物是小分子。
27.根据权利要求23至26中任一项所述的方法,其中所述测试化合物是肽或蛋白质。
28.根据权利要求23至27中任一项所述的方法,其中所述方法还包括将所述化合物或其可药用盐与一种或更多种可药用赋形剂和/或载体一起配制的步骤。
29.化合物,其能够调节、优选抑制权利要求I至10中任一项所述的PA亚基多肽片段或其变体的核酸内切酶活性。
30.根据权利要求29所述的化合物,其中所述化合物可通过权利要求14至22中任一项所述的方法或通过权利要求23至28中任一项所述的方法鉴定。
31.药物组合物,其包含权利要求29或30所述的化合物或其可药用盐以及一种或更多种可药用赋形剂和/或载体。
32.根据权利要求31所述的药物组合物,其中所述药物组合物可通过权利要求21或28所述的方法生产。
33.针对SEQID NO :2的甲型流感2009大流行HlNl病毒PA亚基或其变体的活性位点的抗体,其中所述变体在SEQ ID NO 2的186位氨基酸或与其对应的氨基酸位置上包含氨基酸丝氨酸。
34.根据权利要求33所述的抗体,其中所述抗体识别SEQID NO :2所示氨基酸序列的5至15个氨基酸长度的多肽片段,其中所述多肽片段包含选自以下的一个或更多个氨基酸残基Lys34、Glu26、Ile38、Tyr24、His41、Glu80、Arg84、Leul06、Aspl08、Glull9、Ilel20、Tyr130,Lysl34、Phel05、Lysl37和 Argl24。
35.权利要求29或30的化合物、权利要求31或32的药物组合物或者权利要求33或34的抗体在制备药物中的用途,所述药物用于治疗、改善或预防由正粘病毒科(Orthomyxoviridae)、布尼亚病毒科(Bunyaviridae)和 / 或沙粒病毒科(Arenviridae)病毒通过病毒感染而引起的疾病病症,优选由甲型流感2009大流行HlNl病毒通过病毒感染而引起的疾病病症。
36.4- [3- [ (4-氯苯基)甲基]-I-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-3)、4- [4- [ (4-氯苯基)甲基]_1_ (环己基甲基)_4_哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-2)、4-[3-[(4-氯苯基)甲基]-I-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5-三羟基苯甲酸酯(EGCG)在制备药物中的用途,所述药物用于治疗、改善或预防由甲型流感2009大流行HlNl病毒通过病毒感染而引起的疾病病症。
37.权利要求29或30的化合物、权利要求31或32的药物组合物或者权利要求33或34的抗体,其用于治疗、改善或预防由正粘病毒科、布尼亚病毒科和/或沙粒病毒科病毒通过病毒感染而引起的疾病病症,优选由甲型流感2009大流行HlNl病毒通过病毒感染而引起的疾病病症。
38.4- [3- [ (4-氯苯基)甲基]-I-(苯基甲基)-3-哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-3)、4-[4-[(4-氯苯基)甲基]_1_ (环己基甲基)_4_哌啶基]-2-羟基-4-氧代-2- 丁烯酸(EMBL-R05-2)、4_ [3- [ (4-氯苯基)甲基]-I-(苯基甲基磺基)-3-哌啶基]-2-羟基-4-氧代-2-丁烯酸(EMBL-R05-1)或[(2R,3R)-5,7-二羟基-2-(3,4,5-三羟基苯基)色满-3-基]3,4,5_三羟基苯甲酸酯(EGCG),其用于治疗、改善或预防由甲型流感2009大流行HlNl病毒通过病毒感染而引起的疾病病症。
全文摘要
本发明涉及包含具有核酸内切酶活性的病毒RNA依赖性RNA聚合酶PA亚基之氨基端片段的多肽片段,其中所述PA亚基来自甲型流感2009大流行H1N1病毒或其变体。本发明还涉及(i)适于使用X射线晶体衍射对所述多肽片段进行结构测定的多肽片段晶体,以及(ii)使用所述多肽的结构坐标来筛选和设计对多肽片段中的核酸内裂解(endonucleolytically)活性位点进行调节(优选抑制)的化合物的计算方法。此外,本发明涉及鉴定(优选以高通量形式鉴定)与具有核酸内切酶活性的PA多肽片段结合并且优选抑制所述核酸内裂解活性的化合物的方法。本发明还涉及能够调节(优选抑制)本发明PA亚基多肽片段或其变体的核酸内切酶活性的化合物,以及包含所述化合物的药物组合物,其用于治疗由正粘病毒(Orthomyxoviridae)科、布尼亚病毒(Bunyaviridae)科和/或沙粒病毒科(Arenviridae)病毒通过病毒感染引起(优选由甲型流感2009大流行H1N1病毒的病毒感染引起)的疾病病症。优选地,所述化合物可通过本文公开的方法进行鉴定,或者所述药物组合物可通过本文公开的方法生产。
文档编号A61K31/33GK102803288SQ201180014380
公开日2012年11月28日 申请日期2011年3月15日 优先权日2010年3月16日
发明者斯蒂芬·库萨克, 伊娃·科瓦林斯基, 克洛艾·苏维塔 申请人:欧洲分子生物学实验室(Embl)