专利名称:SARS冠状病毒非结构蛋白nsp2的氨基端区域的表达纯化及其晶体结构的制作方法
技术领域:
本发明涉及对严重急性呼吸道综合征SARS冠状病毒非结构蛋白nsp2进行基因工程改造以获得在大肠杆菌中的高效表达、纯化和结晶的方法,以及严重急性呼吸道综合征SARS冠状病毒非结构蛋白nsp2第I位到第277位氨基酸的三维晶体结构。
背景技术:
2002年底至2003年初,全球大规模爆发的SARS疫情引起了全人类的恐慌,极大挑战了我国和全世界应对重大疫情的能力,更引起了各国政府和科学家们对冠状病毒的极大重视。目前,尽管SARS疫情大规模爆发已经被控制住,2003年之后仍出现过小规模发作。虽然这些小规模的疫情很早被监视和控制在摇篮中,而没有形成再次大规模的爆发,但SARS疫情再次大规模爆发的可能性仍然存在。最近研究显示某些蝙蝠很有可能是SARS冠状病毒的天然宿主,而且SARS冠状病毒在适应性和生态压力的双重驱动下,会不断通过基因重排、重组和突变在其天然宿主中藏匿并伺机爆发,甚至会传播到新宿主身上,这说明冠状病毒对人类健康仍然是一个潜在威胁。因此,针对SARS冠状病毒的侵染、基因组复制和转录机制、与宿主相互作用关系、抑制剂药物开发以及疫苗的研发各方面的研究正在逐步深入地进行,以应对SARS疫情的再次爆发。解析SARS冠状病毒非结构蛋白nsp2的三维结构不仅对揭示其复制机制具有重要的科学意义,对开发抗SARS冠状病毒药物具有重要价值和理论指导意义。SARS冠状病毒为不分节段的单股正链RNA病毒,其基因组长度大约为30kb。SARS冠状病毒复制酶基因由两个大的开放阅读框ORFla和ORFlb组成,它们均位于基因组的5’端。ORFla编码一条长约441kDa的复制酶多蛋白ppla,ORFla和ORFlb共同编码一条长约741kDa的复制酶多蛋白pplab。pplab C端的ORFlb编码的复制酶部分在翻译时需要-1位的核糖体移位。这两个复 制酶多蛋白被病毒编码的两个蛋白酶(一个木瓜蛋白酶类的半胱氨酸蛋白酶PLP2(nsp3)以及一个3C主蛋白酶(nsp5)共同切割成16个独立的功能亚基,这16个独立的功能亚基被称为非结构蛋白(Non-structrual protein, Nsp),在复制转录过程中形成复合物来共同行使功能。非结构蛋白nsp2是复制转录复合物的一个组成成分,已有的研究显示,nsp2似乎可以和包括nsp6, nsp7, nsp8, nspll, nspl5, nspl6在内的多种非结构蛋白相互作用,并存在一定的细胞内共定位,推测nsp2可能间接参与到病毒的转录与复制过程之中。也有研究表明,SARS冠状病毒nsp2可与宿主两个重要蛋白prohibitin I (PHB I)and prohibitin2(PHB2)及其形成的复合物相互作用,可能参与干扰宿主信号传递,降低宿主的免疫反应,从而利于SARS-CoV更好地复制和增殖,这些需要进一步的实验来确定。而由于国内对严重急性呼吸道综合征SARS冠状病毒实验的严格限制和相关实验模型的缺乏,使得针对SARS冠状病毒活毒的实验无法进行。只能退而求其次,在细胞水平或者宿主动物模型上去研究与SARS冠状病毒属于同一种属的小鼠肝炎病毒MHV(mousehepatitis virus),或者SARS冠状病毒的假病毒或者复制子,但这些不能替代SARS冠状病毒活毒。对SARS冠状病毒非结构蛋白nsp2蛋白质结构的解析对揭示蛋白质功能具有重大而直接的指导意义。
发明内容
本发明的一个方面,提供了一种将SARS冠状病毒非结构蛋白nsp2进行基因工程改造,以提高其在大肠杆菌中能够得到高效表达的方法。本发明优选使用大肠杆菌的原核细胞表达系统(但不排除其他的表达系统,如在其他细菌或者其他的真核生物细胞中进行表达),对以上所述蛋白以GST (谷胱甘肽-S-转移酶)融合蛋白的方式进行表达,并用于蛋白质结晶的方法。本发明述及在大肠杆菌中高效获得SARS冠状病毒非结构蛋白nsp2的表达方法。优选地,本发明将SARS冠状病毒非结构蛋白nsp2进行了基因工程改造,将非结构蛋白nsp2全长基因进行了截短的研究,提供了一个可以在大肠杆菌中高效表达的方法,该方法包括了氨基端第I位氨基酸至约280位氨基酸的编码基因,更优选地·包括I位至277位氨基酸。根据本发明的另一个方面,本发明提供了一种纯化SARS冠状病毒非结构蛋白nsp2的方法。将基因工程方法改造过以后的非结构蛋白nsp2基因连接于带有标签的表达性质粒载体中,转化进入大肠杆菌细胞中进行表达、纯化。优选地,其中所述的标签选自GST、Flag-tag、Myc-tag、MBP-tag、His-tag ;所述载体含有选择性标记基因。所述与特异标签识别的方法是通过亲和层析柱进行,所述去掉标签的方法通过用蛋白酶酶解,所述分离纯化蛋白的方法是进一步用离子交换层析等方法分离纯化非结构蛋白nsp2 ;用凝胶电泳的方法确定蛋白质的纯度;用分析型超速离心的方法确定蛋白质的聚合状态和均一性。根据本发明的另一个方面,本发明提供了一种结晶上述得到的SARS冠状病毒非结构蛋白nsp2蛋白的方法,所述的方法包括:将非结构蛋白nsp2浓缩至5-10mg/ml,在4-18摄氏度下用悬滴气相扩散法筛选晶体生长条件。根据本发明的另一个方面,本发明提供了衍射性能良好的非结构蛋白nsp2的蛋白质晶体。根据本发明的另一个方面,本发明提供了 SARS冠状病毒非结构蛋白nsp2的三维晶体结构,该结构描述了非结构蛋白nsp2的二级结构组成、肽链走向、组织模式以及三维分子构造。其中针对非结构蛋白nsp2晶体进行X射线晶体衍射,得到非结构蛋白nsp2晶体的晶体衍射数据,用所述的蛋白质晶体的衍射数据进一步通过结构解析,构建非结构蛋白nsp2的三维结构。其中所述非结构蛋白nsp2为所述非结构蛋白nsp2全长蛋白序列的从第I位氨基酸至277位氨基酸的编码基因,其中所述晶体三维结构中的原子具有表I中所列的至少40%的原子坐标,或者SARS冠状病毒非结构蛋白nsp2的晶体三维结构中至少40%氨基酸的主链碳骨架的原子结构坐标与表I中的坐标的平均根方差小于或等于1.5埃。优选地,其中所述的母体晶体具有P2 (I) 2 (I) 2空间群,晶胞参数为约:a = 67.1埃,b = 76.8 埃,c = 65.0 埃,α = β = γ =90。。
优选地,其中所述非结构蛋白nsp2由α螺旋1,即含Asp20-Arg28的氨基酸区段,α螺旋2,即含Leu36_Lys46的氨基酸区段,β折叠1,即含Trp61_Arg65的氨基酸区段,α螺旋3,即含Tyr70-His72的氨基酸区段,α螺旋4,即含Pio75-G1u77的氨基酸区段,β折叠2,即含Lys79-Lys83的氨基酸区段,β折叠3,即含Asn99_Vall04的氨基酸区段,β折叠4,即含Metl 18-Val 124的氨基酸区段,α螺旋5,即含Prol30_Glul32的氨基酸区段,β折叠5,即含Serl39_Cysl44的氨基酸区段,β折叠6,即含Aspl48_Thrl54的氨基酸区段,β折叠7,即含LysHisl59-Cysl62的氨基酸区段,β折叠8,即含Vall87_Prol90的氨基酸区段,α螺旋6,即含Prol92-Glnl95的氨基酸区段,α螺旋7,即含Val205_Asn210的氨基酸区段,β折叠9,即含Arg217-Arg219的氨基酸区段,β折叠10,即含Gly222_Phe227的氨基酸区段,β折叠11,即含Cys230-Tyr238的氨基酸区段,β折叠12,即含Arg241_Asp251的氨基酸区段,α螺旋8,即含Glu265-Leu275的氨基酸区段组成。其中,由所述的β折叠1,2,3,12组成一个反平行的β片层的平面;β折叠4与5,6与7各自相互反平行,然后一起组成一个类似于β折叠桶的形状;β折叠8,12,11,10,9组成另外一个反平行β片层的扭曲的平面。所述的α螺旋1-4和8围绕在第一个平面外,α螺旋5_7围绕在另一平面周围。共同组成一个α β β α的结构域。优选地,其中所述非结构蛋白nsp2中结合有三个选自锌、镁、锰、铜、钴、铁构成的组中的金属离子,其中三个金属离子分别位于由Cys21-Cys52-His55-His57、Cysl44-Cysl47-Cysl62-Cysl65,Cysl91-Cysl94-His203-Cys237 构成的四元锚定中心。更优选地,其中所述金属离子为锌离子。优选地,其中所述的SARS冠状病毒非结构蛋白nsp2包含三个锌指结构域,分别可以代表为CX30CX2HXH、CX2CX14CX2C、CX2CX8HX3C。更优选地,SARS冠状病毒非结构蛋白nsp2所含有的第二个锌指结构域类似于转录因子的锌指,第一个和第三个锌指则是全新的折叠类型。三个锌指对于SARS冠状病毒非结构蛋白nsp2功能的发挥具有决定性的作用。优选地,其中所述的SARS冠状病毒非结构蛋白nsp2的晶体结构整体为全新的折叠类型,锌指结构域的发现为其功能的发掘与阐释提供了理论指导依据,也为设计和筛选可能的抑制剂奠定了理论基础。根据本发明的另一个方面,本发明提供了上述SARS冠状病毒非结构蛋白nsp2的晶体三维结构在其功能研究、设计和筛选可能的抑制剂方面的应用,包括:根据蛋白质的三维结构,通过计算机模拟来寻找可能的特定的活性位点或者结合口袋;根据蛋白质的三维结构,通过找到的可能的特定的活性位点或者结合口袋,找寻可能的底物类型,进行生化实验,并将可能的特定的活性位点或者结合口袋中的氨基酸突变,验证突变的效果;将根据蛋白质的三维结构,结合上述实验结果,进行体内天然底物类型的发掘,并将之扩展到与所述的SARS冠状病毒非结构蛋白nsp2序列相似性在至少30%的其他病毒种属,进而分析和总结。根据本发明的另一个方面, 提供了基于SARS冠状病毒非结构蛋白nsp2蛋白质三维结构,探索其功能的方法,包括:通过蛋白结晶方法获得SARS冠状病毒非结构蛋白nsp2的晶体,或者获得SARS冠状病毒非结构蛋白nsp2蛋白质晶体的三维结构坐标,其中所述三维结构包括任何与该坐标中至少含有40%氨基酸残基的主链碳骨架原子三维坐标的平均根方差小于等于1.5埃的结构;进行生化实验分析验证基于结构的预测理论。
图1为基于来自四种不同病毒类型的非结构蛋白nsp2的序列对比。其中,包括来源于四种不同冠状病毒代表毒株的非结构蛋白nsp2,即人冠状病毒 HCoV-229E、SARS 冠状病毒 SARS-CoV-BJO1、小鼠肝炎病毒 MHV-A59 (Mouse HeptitisVirus)和鸟支气管炎病毒 IBV-M41 (Avian Infectious Bronchitis Virus)。其非结构蛋白nsp2的编码序列分别为:HCoV-229E来自美国国立卫生院数据库Accession:NP_073550.1,SARS-CoV-BJOI来自美国国立卫生院数据库Accession:NP_828850.1,MHV-A59来自美国国立卫生院数据库Accession:NP_045298.1,IBV-M41来自美国国立卫生院数据库Accession:NP_040829.1。这一比对结果表明,来源于冠状病毒属三个种群的非结构蛋白nsp2的一级序列保守性不高,SARS-CoV的非结构蛋白nsp2与同属同一种群的MHV的非结构蛋白nsp2才具有相对较高的一级序列相似性。图中用...表示在相对应区段的氨基酸缺失,红色和黄色表示保守型高低。在说明书及权利要求书中具体的氨基酸位置均是以SARS-CoV的非结构蛋白nsp2的序列说明的。图2为SARS冠状病毒非结构蛋白nsp2的纯化和电泳图。⑷为SARS冠状病毒非结构蛋白nsp2经过阴离子交换层析的情况。(B)为SARS冠状病毒非结构蛋白nsp2经过阴离子交换层析后的蛋白质电泳图,显示目的蛋白(黑色箭头所指处)的纯度在95%以上。图3为SARS冠状病毒非结构蛋白nsp2的蛋白质晶体图。(A)为进行优化之前的晶`体图片。(B)为进行优化之后的晶体图片。图4为SARS冠状病毒非结构蛋白nsp2的母体蛋白质晶体衍射图。其中左下角的小图为分辨率最外壳层的衍射点。图5为SARS冠状病毒非结构蛋白nsp2的三维结构图。其中,(A)为非结构蛋白nsp2的三维结构飘带图的俯视、侧视图。该结构按照三个不同锌指而使用了不同的色彩,其中,锌原子用球状模型表示,依次标记为ZN1,ZN2, ZN3。锌指I区域用绿色表示,锌指2区域用红色表示,锌指3区域用蓝色,连接三个锌指之间的区域用灰色表示。(B)非结构蛋白nsp2的的表面电势分布图。色彩区间为从红(-10kbT/ec)到蓝(+10kbT/ec),其中蓝色为正电荷表面,红色为负电荷表面,白色为不带电荷表面相关部分氨基酸。图6为SARS冠状病毒非结构蛋白nsp2的三个负责与核酸相互作用的锌指结构域的精细三维结构图。锌原子表示为灰色球状模型,锚定锌原子的氨基酸表示为棍棒模型,锌原子与相应氨基酸侧链的键长表示在括号里,键用红色虚线表示。相对应的密度图用蓝色表示为1.5σ。图A是由Cys21-Cys52-His55-His57锚定的锌指I。图B为由Cysl44-Cysl47-Cysl62-Cysl65 锚定的锌指 2。图 C 为由 Cysl91-Cysl94-Cys203_His237锚定的锌指3。图D为经生物信息学分析软件找到的第二个锌指的结构同源类似物,包括Tudor以及核酸酶P。
具体实施例方式本发明人提供了一种将SARS冠状病毒非结构蛋白nsp2进行基因工程改造,以提高其在大肠杆菌中能够得到高效表达蛋白的方法。通过X射线衍射晶体学方法解析了 SARS冠状病毒非结构蛋白nsp2的分辨率达1.6埃的三维晶体结构。SARS冠状病毒非结构蛋白nsp2蛋白的表达纯化方法:来源于SARS冠状病毒cDNA的非结构蛋白nsp2的基因,其编码的蛋白质序列为:SARS冠状病毒非结构蛋白nsp2蛋白质序列MAVTRYVDNNFCGPDGYPLDCIKDFLARAGKSMCTLSEQLDYIESKRGVYCCRDHEHEIAWFTERSDKSYEHQTPFEIKSAKKFDTFKGECPKFVFPLNSKVKVIQPRVEKKKTEGFMGRIRSVYPVASPQECNNMHLSTLMKCNHC
DEVSWQTCDFLKATCEHCGTENLVIEGPTTCGYLPTNAVVKMPCPACQDPEIGPEHSVADYHNHSNIETRLRKGGRTRCFGGCVFAYVGCYNKRAYWVPRASADIGSGHTGITCDNVETLNEDLLEILSRERVNINIVGDFHLNEEVAIILASFSASTSAFIDTIKSLDYKSFKTIVESCGNYKVTKGKPVKGAWNIGQQRSVLTPLCGFPSQAAGVIRSIFARTLDAANHSIPDLQRAAVTILDGISEQSLRLVDAMVYTSDLLTNSVIIMAYVTGGLVQQTSQffLSNLLGTTVEK
LRPIFEWIEAKLSAGVEFLKDAWEILKFLITGVFDIVKGQIQVASDNIKDCVKCFIDVVNKALEMCIDQVTIAGAKLRSLNLGEVFIAQSKGLYRQCIRGKEQLQLLMPLKAPKEVTFLE⑶SHDTVLTSEEVVLKNGELEALETPVDSFTNGAIVGTPVCVNGLMLLEIKDKEQYCALSPGLLATNNVFRLKGG即Met Ala Val Thr Agr Tyr Asp Asn Asn Phe Cys Gly Pro Asp Tyr Pro Leu AspCys He Lys Asp Phe Leu Ala Arg Ala Gly Lys Ser Met Cys Thr Leu Ser GluGln Leu Asp Tyr He Glu Ser Lys Arg Gly Val Tyr Cys Cys Arg Asp His GluHis Glu lie Ala Trp Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gln Thr ProPhe Glu He Lys Ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu Cys Pro LysPhe Val Phe Pro Leu Asn Ser Lys Val Lys Val lie Gln Pro Arg Val Glu Lys LysLys Thr Glu Gly Phe Met Gly Arg lie Arg Ser Val Tyr Pro Val Ala Ser Pro GlnGlu Cys Asn Asn Met His Leu Ser Thr Leu Met Lys Cys Asn His Cys Asp GluVal Ser Trp Gln Thr Cys Asp Phe Leu Lys Ala Thr Cys Glu His Cys Gly ThrGlu Asn Leu Val He Glu Gly Pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn ValVal Lys Met Pro Cys Pro Ala Cys Gln Asp Pro Glu lie Gly Pro Glu His Ser ValAla Asp Tyr His Asn His Ser Asn He Glu Thr Arg Leu Arg Lys Gly Gly ArgThr Arg Cys Phe Gly Gly Cys Val Phe Ala Tyr Val Gly Cys Tyr Asn Lys ArgAla Tyr Trp Val Pro Arg Ala Ser Ala Asp lie Gly Ser Gly His Thr Gly lie ThrGly Asp Asn Val Glu Thr Leu Asn Glu Asp Leu Leu Glu He Leu Ser Arg GluArg Val Asn lie Asn lie Val Gly Asp Phe His Leu Asn Glu Glu Val Ala lie IleLeu Ala Ser Phe Ser Ala Ser Thr Ser Ala Phe lie Asp Thr lie Lys Ser Leu AspTyr Lys Ser Phe Lys Thr lie Val Glu Ser Cys Gly Asn Tyr Lys Val Thr Lys Gly
Lys Pro Val Lys Gly Ala Trp Asn lie Gly Gln Gln Arg Ser Val Leu Thr Pro LeuCys Gly Phe Ser Gln Ala Ala Gly Val lie Arg Thr Leu Asp Ala Ala Asn His Serlie Pro Asp Leu Gln Arg Ala Ala Val Thr lie Leu Asp Gly lie Ser Glu Gln SerLeu Arg Leu Val Asp Ala Met Val Tyr Ser Asp Leu Leu Thr Asn Val He HeMet Ala Tyr Val Thr Gly Gly Leu Val Gln Gln Thr Ser Gln Trp Leu Ser AsnLeu Leu Gly Thr Thr Val Glu Lys Leu Arg Pro lie Phe Glu Trp lie Glu Ala LysLeu Ser Ala Gly Val Glu Phe Leu Lys Phe Ala Trp Glu lie Leu Lys Phe Leu lieThr Gly Val Phe Asp lie Val Lys Gly Gln lie Gln Val Ala Ser Asp Asn lie LysAsp Cys Val Lys Cys Phe He Asp Val Val Asn Lys Ala Leu Glu Met Cys HeAsp Gln Val Thr He Ala Gly Ala Lys Leu Arg Ser Leu Asn Leu Gly Glu ValPhe lie Ala Gln Ser Lys Gly Leu Tyr Arg Gln Cys lie Arg Gly Lys Glu Gln LeuGln Leu Leu Met Pro Leu Lys Ala Pro Lys Glu Val Thr Phe Leu Gly Glu GlyAsp Ser His Asp Thr Val Leu Thr Ser Glu Glu Val Val Leu Lys Asn Gly GluLeu Glu Ala Leu Glu Thr Pro Val Asp Ser Phe Thr Asn Gly Ala He Val GlyThr Pro Val Cys Val Asn Gly Leu Met Leu Leu Glu He Lys Asp Lys Glu GlnTyr Gln Tyr Cys Ala Leu Ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe ArgLeu Lys Gly Gly通过分子克隆技术将SARS冠状病毒非结构蛋白nsp2的基因进行克隆,克隆到PGEX-6P-1载体(GE)上,以便进一步表达蛋白。将改造后的非结构蛋白nsp2基因克隆到PGEX-6P-1载体(GE)上表达氨基末端融合GST的融合蛋白(GST_nsp2),将克隆的质粒转化入大肠杆菌BL21 (DE3)中,在BL21 (DE3)中使用浓度为0.5mM的IPTG(异丙基-β -D硫代半乳糖苷)诱导大肠杆菌表达蛋白,具体参见实施例1实施例实施例1改造SARS冠状病毒非结构蛋 白nsp2,用于大肠杆菌表达的方法本发明人初期尝试将非结构蛋白nsp2蛋白进行全长表达,历经在不同表达载体pGEX,pET等,以及不同表达菌株,如BL21 (DE3),BL21 plys等上的尝试,均不能得到稳定的蛋白。暗示着需要对SARS冠状病毒非结构蛋白nsp2的基因进行基因水平上的改造。经过设计PCR扩增引物,构建了从SARS冠状病毒非结构蛋白nsp2的氨基端第I位氨基酸开始,逐个删除氨基酸的4余个克隆,得到了一个能够大量表达,并且能够长时间(摄氏37±5°C两周以上)保持蛋白稳定性的克隆,即为SARS nsp2Metl-Arg277。SARS冠状病毒非结构蛋白nsp2在大肠杆菌中的表达纯化通过分子克隆技术将SARS冠状病毒非结构蛋白nsp2(第I至277位氨基酸)克隆到pGEX-6p-l载体(GE)上,其克隆位点是BamHI及XhoI。将克隆的含有SARS冠状病毒非结构蛋白nsp2基因的表达质粒转化到大肠杆菌的BL21(DE3)中,进行蛋白的表达,从而使细菌可以表达蛋白N端(氨基端)连接有GST融合蛋白并且含有可以被Prescission蛋白酶切割的酶切位点,从而可以进一步将GST蛋白标签与目的蛋白分离。将克隆构建的融合蛋白表达质粒转化入BL21 (DE3)中后,先在37度使用5mL的LB培养基过夜培养,大约12小时后,转接到800mL的LB培养基中扩大培养,再在37度下在摇瓶中培养至OD为0.4-0.6左右,大约为四小时,随后降低培养温度至16度,然后加入0.5mM的IPTG (异丙基-β -D硫代半乳糖苷)进行诱导表达,大约16-20小时后通过离心收集细菌,用于进一步纯化。将离心收集得到的表达菌体用含有 137mM NaCl, 2.7mM KC1,4.3mMNa2HP04,1.4mM KH2P04,10% glycerol, pH7.4的缓冲液中悬浮,使用超声破碎仪(宁波新芝)裂解细胞,通过高速离心(约15,OOOrpm)后分离出不溶性沉淀,将获得的上清通过Glutathione-sepharose亲和柱(GE)来初步分离纯化GST-SARS nsp2Metl-Arg277蛋白。含有GST标签的蛋白结合到Glutathione-Sepharose亲和柱上以后,使用如上所述的缓冲液将杂蛋白洗净,使用PreScission蛋白酶酶解结合在亲和柱上的GST融合蛋白,此过程大约20小时,然后将酶切下来的蛋白使用Resource Q阴离子交换层析(GE)进一步纯化出SARS nsp2Metl_Arg277蛋白,纯度一般可以达到99%以上(参见附图2)。通过以上步骤纯化的蛋白使用浓缩管浓缩至10mg/mL用于结晶实验。实施例2SARS冠状病毒非结构蛋白nsp2的结晶将如上方法表达纯化好的SARS冠状病毒非结构蛋白nsp2浓缩至浓度约为10mg/ml,用气相悬滴法使用结晶试剂(来自Hampton Research等公司的Screen Kit I/
I1、Index等试剂盒)筛选晶体生长条件。经过初步筛选,本发明人在0.2M magnesiumacetate tetrahydrate, 0.1M sodium cacodylate trihydrate (pH 6.5), and 20% (w/v)polyethylene glycol (PEG)8, 000结晶试剂条件下获得了初始晶体。通过进一步优化,其中,在使用4% (v/v)n-propanol作为添加剂的条件下获得了外观良好的晶体(参见附图3)。进行X射线衍射,挑选到了分辨率约为1.6埃左右的母体晶体,并进而收集了相应的数据。 实施例3SARS冠状病毒非结构蛋白nsp2的晶体衍射数据收集和结构解析在日本高能同步辐射加速器机构的BL17A线站,波长1.0000埃,探测器为ADSCQ270下收集到一套衍射分辨率为1.6埃的母体衍射数据(参见附图4),然后使用位于上海同步光源BL17U-MX线站的同步辐射仪,在波长为硒元素的吸收边处(0.9798埃)的X光下,探测器为ADSC Q315收集一套衍射分辨率为2.5埃的单波长反常散射的衍射数据。利用HK2000 (Otwinowski 1997)处理数据,发现晶体具有P2 (I) 2 (I) 2空间群,晶胞参数为约:a = 67.1埃,b = 76.8埃,c = 65.0埃,α = β = γ = 90°。通过马修斯常数的计算发现其一个不对称蛋白中应该含有I个蛋白质分子,溶剂含量为53.8%。利用CCP4软件对处理得到的sea文件进行处理,使用phenix程序下的Autosolve进行相位的寻找,从计算得到的电子密度图上能够清楚地观察到连续的主链走向和多个二级结构,用Coot搭出了初步的模型之后,交替使用Coot和phenix软件进行精细结构模型的搭建,用refmac和Phenix进行模型的修正,最终获得结构的R因子为21.6%,自由R因子为25.1%。实施例4SARS冠状病毒非结构蛋白nsp2的三维结构我们使用实施例3中的方法、软件,完成了的SARS冠状病毒非结构蛋白nsp2的晶体结构的解析工作,使用软件Coot和pymol软件,进一步分析SARS冠状病毒非结构蛋白nsp2的二级结构组成、肽链走向、组织模式以及三维分子构造(参见附图5)。我们发现,SARS冠状病毒非结构蛋白nsp2呈现一种典型的α β β α的三明治结构,可以明显划分成三个区域,分别由锌指1、2、3组成。本领域的普通技术人员可知,与其中所述晶体三维结构中的原子具有表I中所列的至少40%的原子坐标,或者SARS冠状病毒非结构蛋白nsp2的晶体三维结构中至少40%氨基酸的主链碳骨架的原子结构坐标与表I中的坐标的平均根方差小于或等于1.5埃的原子坐标,均可被认为与SARS冠状病毒非结构蛋白nsp2具有雷同结构。具体而言,SARS冠状病毒非结构蛋白nsp2的三个锌指ZF1、ZF2和ZF3 分别属于 Cys2His2(C-X30-C-X2-H-X-H)、 Cys4(C-X2-C-X14-C-X2-C)和CyS2HiSCyS(C-X2-C-X8-H-X3-C)锌指类型。组成锌指I的其中一个氨基酸Cys21来自α 螺旋的N端,另外三个氨基酸Cys52-His55-His57来自连接螺旋α2和β折叠β I的长而弯曲的loop。组成锌指2的四个氨基酸均来自于由β折叠β4-β5-β6-β7形成的β发夹结构。组成锌指3的其中两个氨基酸Cysl91和Cys203来自两段短的loop,Cysl94来自螺旋α 6的中间,His237位于β折叠β 11的N端。实施例5SARS冠状病毒非结构蛋白nsp2的金属离子利用软件C00T,pymol对实施例3得到的SARS冠状病毒非结构蛋白nsp2蛋白电子密度图进行分析,在由氨基酸Cys21-Cys52-His55-His57、氨基酸Cysl44-Cysl47-Cysl62-Cysl65、以及氨基酸 Cysl91-Cysl94-Cys203_His237 等位点各自所环绕的区域,都分别发现含有一团未经解释的电子密度。使用珀金埃尔默原子吸收光谱仪(PerkinElm AAnalyst 800)对SARS冠状病毒非结构蛋白nsp2蛋白质进行原子吸收光谱的分析,发现SARS冠状病毒非结构蛋白nsp2蛋白含有金属离子锌,本领域的一般技术人员经分析可知,这表明这三团电子密度应该分别是锌离子。我们把这三个区域分别定义为锌指1,锌指2和锌指3 (参见附图6)。实施例6SARS冠状病毒非结构蛋白nsp2的潜在功能位点利用软件C00T、pymol分别对实施例3和实施例4得到的SARS冠状病毒非结构蛋白nsp2蛋白电子密度图和表面电势图进行分析,发现所述的非结构蛋白nsp2含有三个锌指结构,而且表面电势集中分布有正电荷聚集区,这与锌指负责结合核酸的经典功能相符。我们利用服务器Dali进行与SARS冠状病毒非结构蛋白nsp2晶体结构具有类似组成的结构类似物,但没有得到很好的结果,显示SARS冠状病毒非结构蛋白nsp2具备全新的结构类型。如果分别将各个锌指进行结构类似物的寻找,发现只有锌指2能够找到相关的结构类似物(参见附图6D),表明锌指I和3是一种新型的锌指折叠类型。实施例7利用SARS冠状病毒非结构蛋白nsp2的潜在功能位点信息进行功能探索我们利用实施例6所述的潜在功能位点,即三个锌指结构,进行SARS冠状病毒非结构蛋白nsp2的功能探索,主要是进行体外生化实验分析SARS冠状病毒非结构蛋白nsp2可否与核酸相结合,以及如果结合的话,观察破坏锌指后对功能的影响。首先,我们采 用核酸标准物lamda-DNA,将之与SARS冠状病毒非结构蛋白nsp2蛋白孵育30min,然后进行非变性聚丙烯酰胺凝胶电泳,观察核酸标准物Iamda-DNA的迁移率有无受影响。发现在结合了 SARS冠状病毒非结构蛋白nsp2蛋白后,标准物Iamda-DNA的迁移率变缓,并且破坏SARS冠状病毒非结构蛋白nsp2蛋白的三个锌指后,标准物Iamda-DNA的迁移率又恢复如初。实验结果表I单分子的SARS冠状病毒非结构蛋白nsp2的原子坐标群如下:注释坐标创建日期:2010年6月04日,编辑日期:2011年10月09日。注释高分辨率范围(埃):1.6注释低分辨率范围(埃):50·
权利要求
1.一种严重急性呼吸道综合症SARS冠状病毒非结构蛋白nsp2的晶体结构,其中,所述SARS冠状病毒非结构蛋白nsp2为所述SARS冠状病毒非结构蛋白nsp2全长蛋白序列的从第I位氨基酸至约280位氨基酸的编码基因,其中所述晶体三维结构中的原子具有表I中所列的至少40%的原子坐标,或者SARS冠状病毒非结构蛋白nsp2的晶体三维结构中至少40%氨基酸的主链碳骨架的原子结构坐标与表I中的坐标的平均根方差小于或等于1.5埃。
2.根据权利要求1所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中,所述SARS冠状病毒非结构蛋白nsp2为所述SARS冠状病毒非结构蛋白nsp2全长蛋白序列的从I位氨基酸至276位氨基酸的编码基因,但在其第一位氨基酸之前增加了一个甲硫氨酸作为起始密码子,所以所述SARS冠状病毒非结构蛋白nsp2重新编码为Metl_Arg277,以下所用编号均依据于此。
3.根据权利要求1所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述的母体晶体具有P2 (I) 2 (I) 2空间群,晶胞参数为约:a = 67.1埃,b = 76.8埃,c = 65.0埃,α=β = Y = 90。。
4.根据权利要求1或2所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述SARS冠状病毒非结构蛋白nsp2由α螺旋1,即含Asp20_Arg28的氨基酸区段,α螺旋2,即含Leu36-Lys46的氨基酸区段,β折叠1,即含Trp61_Arg65的氨基酸区段,α螺旋3,即含Tyr70-His72的氨基酸区段,α螺旋4,即含Pro75_Glu77的氨基酸区段,β折叠2,即含Lys79-Lys83的氨基酸区段,β折叠3,即含Asn99_Vall04的氨基酸区段,β折叠4,即含Met 118-Vall24的氨基酸区段,α螺旋5,即含Prol30_Glul32的氨基酸区段,β折叠5,即含Serl39_Cysl44的氨基酸区段,β折叠6,即含Aspl48_Thrl54的氨基酸区段,β折叠7,即含LysHisl59-Cysl62的氨基酸区段,β折叠8,即含Vall87_Prol90的氨基酸区段,α螺旋6,即含Prol92-Glnl95的氨基酸区段,α螺旋7,即含Val205_Asn210的氨基酸区段,β折叠9,即含Arg217-Arg219的氨基酸区段,β折叠10,即含Gly222_Phe227的氨基酸区段,β折叠11,即含Cys230-Tyr238的氨基酸区段,β折叠12,即含Arg241_Asp251的氨基酸区段,α螺旋8,即含Glu265-Leu275的氨基酸区段组成。其中,由所述的β折叠1,2,3,12组成一个反平行的β片层的平面;β折叠4与5,6与7各自相互反平行,然后一起组成一个类似于β折叠桶的形状;β折叠8,12,11,10,9组成另外一个反平行β片层的扭曲的平面。所述的α螺旋1-4和8围绕在第一个平面外,α螺旋5_7围绕在另一平面周围。共同组成一个α β β α的结构域。
5.根据权利要求1或2所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述SARS冠状病毒非结构蛋白nsp2中结合有三个选自锌、镁、锰、铜、钴、铁构成的组中的金属离子,其中三个金属离子分别位于由Cys21-Cys52-His55-His57、Cysl44-Cysl47-Cysl62-Cysl65,Cysl91-Cysl94-His203-Cys237 构成的四元锚定中心。
6.根据权利要求4所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述金属离子为锌离子。
7.根据权利要求4或5所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述金属SARS冠状病毒非结构蛋白nsp2包含三个锌指结构域,分别可以代表为CX30CX2HXH、CX2CX14CX2C、CX2CX8HX3C。更优选地,SARS冠状病毒非结构蛋白nsp2所含有的第二个锌指结构域类似于转录因子的锌指,第一个和第三个锌指则是全新的折叠类型。三个锌指对于SARS冠状病毒非结构蛋白nsp2功能的发挥具有决定性的作用。
8.根据权利要求1-6所述的SARS冠状病毒非结构蛋白nsp2的晶体结构,其中所述的SARS冠状病毒非结构蛋白nsp2整体为全新的折叠类型,锌指结构域的发现为其功能的发掘与阐释提供了理论指导依据,也为设计和筛选可能的抑制剂奠定了理论基础。
9.根据权利要求1-8中任一项所述的SARS冠状病毒非结构蛋白nsp2的晶体三维结构在其功能研究、设计和筛选可能的抑制剂方面的应用,包括: 根据蛋白质的三维结构,通过计算机模拟来寻找可能的特定的活性位点或者结合口袋; 根据蛋白质的三维结构,通过找到的可能的特定的活性位点或者结合口袋,找寻可能的底物类型,进行生化实验,并将可能的特定的活性位点或者结合口袋中的氨基酸突变,验证突变的效果; 将根据蛋白质的三维结构,结合上述实验结果,进行体内天然底物类型的发掘,并将之扩展到与所述的SARS冠状病毒非结构蛋白nsp2序列相似性在至少30%的其他病毒种属,进而分析和总结。
10.一种纯化SARS冠状病毒非结构蛋白nsp2的方法,其中,将权利要求1所述的SARS冠状病毒非结构蛋白nsp2基因连接于带有标签的表达性质粒载体中,转化进入大肠杆菌细胞中进行表达、纯化。
11.根据权利要求19所述的方法,其中所述的标签选自GST、Flag-tag、Myc_tag、MBP-tag、His-tag、特异性抗体,所述载体含有选择性标记基因。
12.—种结晶前述权利要求中任一项所述的SARS冠状病毒非结构蛋白nsp2蛋白的方法,所述的方法包括:将SARS冠状病毒非结构蛋白nsp2浓缩至5-10mg/ml,在4_18摄氏度下用气相扩散法筛选晶体生长条件。
13.一种衍射性能良好的根据前述权利要求中任一项所述的SARS冠状病毒非结构蛋白nsp2蛋白质晶体。
全文摘要
本发明提供一种严重急性呼吸道综合症SARS冠状病毒非结构蛋白nsp2的氨基端区域的晶体三维结构,其中SARS冠状病毒非结构蛋白nsp2的氨基端区域为所述SARS冠状病毒非结构蛋白nsp2的从约1~约50位氨基酸至在约150至300位范围内的氨基酸,其中所述晶体三维结构中的原子具有表1中所列的至少40%的原子坐标,或者SARS冠状病毒非结构蛋白nsp2的氨基端的晶体三维结构中至少40%氨基酸的主链碳骨架的原子结构坐标与表1中的坐标的平均根方差小于或等于1.5埃。本发明还提供对SARS冠状病毒非结构蛋白nsp2的表达、纯化和结晶的方法;以及SARS冠状病毒非结构蛋白nsp2的晶体结构及晶体结构在功能研究、潜在药物筛选及药物设计方面的理论指导意义和应用。
文档编号C12N15/50GK103172711SQ20111042845
公开日2013年6月26日 申请日期2011年12月20日 优先权日2011年12月20日
发明者饶子和, 李元元, 杨诚, 刘祥, 王权, 陈帅, 王敬兰, 张颖, 陈卫强 申请人:天津市国际生物医药联合研究院