专利名称:由sars相关联冠状病毒新病毒株的基因组编码的蛋白质和肽的用途的制作方法
技术领域:
本发明涉及严重急性呼吸综合征(SARS)相关联冠状病毒的一个新病毒株,该病毒株源自一个被记录为No.031589的并采集于河内(越南)的样本,本发明还涉及由其基因组得来的核酸分子,还涉及所述核酸分子编码的蛋白质和肽及其应用,特别是作为诊断试剂和/或疫苗。
背景技术:
冠状病毒是一种含有大约30,000个碱基的正极性单链RNA的病毒,其RNA在宿主细胞的细胞质中复制;其基因组的5’端有帽结构,3’端包含多聚腺苷酸尾部。该病毒包于包膜中,并在表面含有称为刺(spicule)的突起结构。
该基因组从其5’端到3’端包括下述的开放读码框或ORF对应于转录-复制复合物的蛋白的ORF1a和ORF1b,对应于结构蛋白S、E、M和N的ORF-S、ORF-E、ORF-M和ORF-N。它还包括对应于编码未知功能蛋白的ORF位于ORF-S和ORF-E之间并与后者重叠的区域;位于ORF-M和ORF-N之间的区域;包括于ORF-N的区域。
S蛋白是一种膜糖蛋白(200-220kDa),其存在于从病毒包膜表面形成的刺或刺突的形式中。它在病毒附着于宿主细胞的受体并诱导病毒包膜和细胞膜相融合的过程中起作用。
小包膜蛋白(E),也被称为sM(small membrane),是一种约10kDa大小的非糖基化跨膜蛋白,是病毒体中含量最少的蛋白质。它在冠状病毒在内质网和高尔基体的中间区域(compartiment intermédiaire)的出芽过程中起了重要作用。
M蛋白或基质蛋白(25-30kDa)是一种含量较多的膜糖蛋白,它通过M/E相互作用整合至病毒颗粒中,而S蛋白通过S/M相互作用结合到病毒颗粒中。M蛋白看来对于冠状病毒的成熟和对于病毒颗粒装配位点的决定十分重要。
N蛋白或核壳蛋白(45-50kDa)是冠状病毒结构蛋白中最保守的,它对于基因组RNA的壳体化和支配其与病毒体结合都是必需的。该蛋白可能还参与了RNA的复制。
当宿主细胞被感染时,位于病毒基因组5’端的读码框(ORF)被翻译为一种多聚蛋白质,这种多聚蛋白质被病毒的蛋白酶切割后释放出几种非结构蛋白,例如RNA依赖的RNA聚合酶(Rep)和ATP酶解旋酶(Hel)。这两种蛋白与病毒基因组的复制和用于合成病毒蛋白质的转录物的产生有关。这些亚基因组mRNA的产生机制并不完全清楚。然而最近的事实表明,每个基因的5’端的转录调控的序列代表了调节亚基因组mRNA的不连续转录的信号。
病毒膜蛋白(S,E和M蛋白)插入到中间区域中,而复制的RNA(正链)与N(核壳)蛋白装配。当核壳复合物向内质网中出芽时,该蛋白质-RNA复合物与包含于内质网膜内的M蛋白组合,形成病毒颗粒。然后病毒迁移穿过高尔基复合体并最终通过例如胞吐作用离开细胞。病毒附着于宿主细胞的位点就在S蛋白的位置上。
人类感冒中15%到30%由冠状病毒引起,它还引起动物的呼吸器官和消化器官感染,尤其是猫(FIPV猫传染性腹膜炎病毒(Felineinfectious peritonitis virus))、家禽(IBV鸟类传染性支气管炎病毒(Avian infectious bronchitis virus))、小鼠(MHV鼠肝炎病毒(Mouse hepatitis virus))、猪(TGEV传染性肠胃炎病毒(Transmissible gastroenterititis virus),PEDV猪流行性腹泻病毒(Pocine Epidemic Diarrhea virus),PRCoV猪呼吸道冠状病毒(Pocine Respiratory Coronavirus),HEV凝血型脑脊髓炎病毒(Hemagglutinating encephalomyelitis virus))和牛(BCoV牛冠状病毒(Bovine corona virus))。
通常,每种冠状病毒只感染一个物种;在具有免疫能力的个体中,感染会任选诱导能够消灭感染细胞的中和抗体和细胞免疫。
一种称为严重急性呼吸综合征(SARS)的非典型性肺炎的流行从2002年末季度出现在中国的最初主要疫区,在2003年第一季度蔓延至许多国家(越南、香港、新加坡、泰国和加拿大)。这种疾病十分严重以至于死亡率为3%到6%。世界上众多的实验室都在研究该疾病的产生原因。
在2003年3月,分离了一种与严重急性呼吸综合征的病例相关联的新的冠状病毒(SARS-CoV或SARS病毒)(T.G.KSIAZEK et al.,TheNew England Journal of Medicine,2003,348,1319-1330;C.DROSTENet al.,The New England Journal of Medicine,2003,348,1967-1976;Peiris et al.,Lancet,2003,361,1319)。
而后得到了这种新冠状病毒的基因组序列,具体而言是Urbani分离株(Genbank编号 AY274119.3和A.MARRA et al.,Science,May 1,2003,300,1399-1404)和Toronto分离株(Tor2,Genbank编号AY278741和A.ROTA et al.,Science,2003,300,1394-1399)的序列。
该基因组的结构与其它已知的冠状病毒相类似,所以可以确定SARS-CoV属于冠状病毒科(Corona viridae);具体鉴定了如下的开放读码框ORF1a和ORF1b和对应于S、E、M和N蛋白的开放读码框;编码蛋白的位于ORF-S和ORF-E之间的区域(ORF3)、位于ORF-S和ORF-E之间并与ORF-E重叠的区域(ORF4)、位于ORF-M和ORF-N之间的区域(ORF7至ORF11)和对应于ORF-N的区域(ORF13和ORF14)。
鉴定了Tor2和Urbani分离株的序列之间的七处差异;3处对应沉默突变(ORF1b的16622位的c/t和19064位的a/g,ORF-S的24872位的t/c),4处分别改动了其氨基酸序列ORF1a编码的蛋白(7919位的c/t对应了A/V突变)、S蛋白(23220位的g/t对应了A/S突变)、ORF3编码的蛋白(25298位的a/g对应了R/G突变)和M蛋白(26857位的t/c对应了S/P突变)。
另外,系统发育分析显示SARS-CoV与其它的冠状病毒关系很远,它既不像是人呼吸器官冠状病毒的突变体,也不像是已知冠状病毒的重组体(关于其综述见于Holmes,J.C.I.,2003,111,1605-1609)。
测定和重视新的变种对于开发有足够敏感性和特异性的SARS检验和诊断试剂和开发可保护人们不使SARS蔓延的免疫原性组合物都有着重要意义。
发明内容
发明人现鉴定了另一种与Tor2和Urbani分离株都有区别的SARS关联冠状病毒毒株。
因此本发明的主题是一种分离的或纯化的严重急性呼吸综合征相关联的人类冠状病毒毒株,其特征在于其基因组中含有以互补DNA形式出现的S蛋白基因23220-23222位的丝氨酸密码子或ORF3基因25298-25300位的甘氨酸密码子,以及ORF1a的7918-7920位的丙氨酸密码子或M蛋白基因26857-26859位的丝氨酸密码子,所述位置是参照Genbank序列AY274119.3表示的。
根据所述病毒株的一个优选的实施方案,其基因组的DNA等价物含有对应于序列SEQ ID No1的序列,该冠状病毒毒株来源于从一名SARS患者的支气管肺泡灌洗液(lavage bronchoalvé olaire)中收集的样本,该样本记录为No.031589并采集于河内(越南)法国医院。
根据本发明,所述的序列SEQ ID No1是对应于上述分离的冠状病毒株基因组的核糖核酸分子的脱氧核糖核酸。
序列SEQ ID No1与Genbank中的序列AY274119.3(Tor2分离株)的区别之处在于它包含了如下的突变 -23220位置的g/t;Tor2的S蛋白的氨基酸序列中577位置的丙氨酸密码子(gct)替换为丝氨酸密码子(tct), -25298位置的a/g;Tor2的ORF3编码的蛋白的氨基酸序列中11位置的精氨酸密码子(aga)替换为甘氨酸密码子(gga)。
此外,序列SEQ ID No1与Genbank中的序列AY278741(Urbani分离株)的区别之处在于它包含了如下的突变 -7919位置的t/c;ORF1a编码的蛋白的氨基酸序列中2552位置的缬氨酸密码子(gtt)替换为丙氨酸密码子(gct), -16622位置的t/c;这一突变不改变ORF1b编码的蛋白的氨基酸序列(沉默突变), -19064位置的g/a;这一突变不改变ORF1b编码的蛋白的氨基酸序列(沉默突变), -24872位置的c/t;这一突变不改变S蛋白的氨基酸序列,及 -26857位置的c/t;M蛋白的氨基酸序列中154位置的脯氨酸密码子(ccc)替换为丝氨酸密码子(tcc)。
除非明确指出,否则核苷酸和肽序列的位置参照Genbank中的序列AY274119.3表示。
本发明的主题还有一段分离的或纯化的多核苷酸,其特征在于其序列为前面所定义的分离的冠状病毒株的基因组的序列。
根据本发明所述多核苷酸的一个优选的实施方案,它包括序列SEQID No1。
本发明的主题还有一段分离的或纯化的多核苷酸,其特征在于其序列可与前面所定义的多核苷酸序列在高度严紧的条件下杂交。
术语“分离的或纯化的”意为“经过人工”从自然状态修饰的,换而言之如果一个物体在自然界中存在,所谓分离的或纯化的即从其自然环境中修饰和/或提取。例如,一种天然存在于活的生物体中的多核苷酸或蛋白质/肽就是未分离、未纯化的;另一方面,同样是这种多核苷酸或蛋白质/肽,被以克隆、扩增和/或化学合成的方法从其在自然中共存的分子中分开而得到,它在本发明的意图中就是分离的。进一步而言,一种以转化、基因操作或任何其他方法被引入生物体的多核苷酸或蛋白质/肽,也是“分离的”,纵使它存在于所述生物体中。术语纯化用在本发明中意为根据本发明的蛋白质/肽基本上未与其它蛋白质或多肽相结合,例如从重组宿主细胞培养物中纯化的产物或从非重组来源纯化的产物。
根据本发明的意图,高度严紧杂交条件应被理解为选择的温度和离子强度条件使得互补多核苷酸之间保持特异性的和选择性的杂交。
作为示例,用于定义上述多核苷酸的有利的高度严紧条件如下DNA-DNA或DNA-RNA杂交分两步进行(1)在含5×SSC(1×SSC为0.15MNaCl+0.015M柠檬酸钠溶液)、50%甲酰胺、7%十二烷基硫酸钠(SDS)、10×登哈特溶液(Denhardt’s)、5%硫酸葡聚糖、1%鲑鱼精DNA的磷酸缓冲液(20mM,pH7.5)中,于42℃预杂交3小时;(2)42℃杂交20小时,然后用2×SSC+2%SDS于20℃洗涤两次、每次20分钟,再用0.1×SSC+0.1%SDS于20℃洗涤20分钟,最后用0.1×SSC+0.1%SDS于60℃洗涤30分钟。
本发明的主题还有上述多核苷酸的代表性片段,其特征在于所述片段可以由以下方法得到通过使用能识别和切割上述多核苷酸中存在的位点的限制性内切酶,或通过使用上述多核苷酸的特异性寡核苷酸引物扩增,或通过体外转录,或通过化学合成。
根据所述片段的一个优选的实施方案,它选自至少对应于下列开放读码框的其中一个的cDNAORF1a、ORF1b、ORF-S、ORF-E、ORF-M、ORF-N、ORF3、ORF4、ORF7至ORF11、ORF13和ORF14,以及对应于所述多核苷酸的非编码5’端或3’端的cDNA。
根据上述实施方案的一个优选特征,所述片段含有选自以下序列的序列 -代表对应于编码S蛋白的ORF-S的cDNA的序列SEQ ID No2和4, -代表对应于编码E蛋白的ORF-E的cDNA的序列SEQ ID No13和15, -代表对应于编码M蛋白的ORF-M的cDNA的序列SEQ ID No16和18, -代表对应于编码N蛋白的ORF-N的cDNA的序列SEQ ID No36和38, -代表分别对应于以下读码框的cDNA的序列ORF-1a和ORF-1b(ORF-1ab,SEQ ID No31)、ORF3和ORF4(SEQ ID No7、8)、ORF7到11(SEQ ID No19、20)、ORF13(SEQ ID No32)和ORF14(SEQID No34),以及 -代表分别对应于所述多核苷酸非编码的5’端(SEQ ID No39和72)和3’端(SEQ ID No40、73)cDNA的序列。
本发明的主题还有编码上述S蛋白的cDNA片段,其特征在于它含有选自序列SEQ ID No5和6(Sa和Sb片段)的序列。
本发明的主题还有对应于上述ORF-1a和ORF-1b的cDNA片段,其特征在于它含有选自序列SEQ ID No41至54(L0至L12片段)的序列。
本发明的主题还有上述多核苷酸片段,其特征在于它含有所述病毒株基因组序列的至少15个连续的碱基或碱基对,该连续的碱基或碱基对包括至少一个下述位置7979、16622、19064、23220、24872、25298和26857。优选的为一个20至2500个碱基或碱基对的片段,优选20个至400个。
根据所述片段的一个优选的实施方案,它包括对应于下列位置的至少两个成组的碱基或碱基对7919和23220、7919和25298、16622和23220、19064和23220、16622和25298、19064和25298、23220和24872、23220和26857、24872和25298、25298和26857。
本发明的主题还有至少18个碱基的引物,它能够扩增SARS相关联冠状病毒基因组或其DNA等价物的片段。
根据所述引物的一个实施方案,它们选自 -No.1引物对,分别对应于上述多核苷酸序列的28507至28522位置(正义引物,SEQ ID No60)和28774至28759位置(反义引物,SEQ ID No61), -No.2引物对,分别对应于上述多核苷酸序列的28375至28390位置(正义引物,SEQ ID No62)和28702至28687位置(反义引物,SEQ ID No63),和 -由引物SEQ ID No55和56构成的引物对。
本发明的主题还有能够检测SARS相关联冠状病毒基因组或其片段是否存在的探针,其特征在于它选自上述片段和对应于上述多核苷酸序列的下述位置的片段28561至28586、28588至28608、28541至28563和28565至28589(SEQ ID No64至67)。
根据本发明的探针和引物可以用本领域技术人员所熟知的方法用放射性或非放射性的化合物直接或间接地标记,以便获得可检测和/或可定量的信号。在使用的放射性同位素中,可以提到32P、33P、35S、3H或125I。非放射性实体可选自例如生物素、亲和素、链霉亲和素、地高辛(digoxygénine)、半抗原、染料等配基;例如放射发光、化学发光、生物发光、荧光和磷光试剂等发光试剂。
本发明包括从前述序列中衍生的标记探针和引物。
所述探针和引物可用于SARS相关联冠状病毒感染的诊断。
本发明的主题还有从生物样本中检测SARS相关联冠状病毒的方法,该方法的特征在于它至少包括 (a)存在于所述生物样本中的核酸的提取, (b)使用上述引物对和RT-PCR对ORF-N片段的扩增,和 (c)使用适当手段对(b)中所得的扩增产物的检测。
(b)中的扩增产物(扩增子)使用引物对No.1时是268bp,使用引物对No.2时是328bp。
根据所述方法的一个优选的实施方案,检测方法的(b)步骤使用至少一个对应于下列位置的探针上述多核苷酸序列的28561至28586、28588至28608、28541至28563和28565至28589位置。
优选地,SARS相关联冠状病毒基因组的检测和任选的定量应用实时PCR、使用No.2引物对和对应于28541至28563位置和对应于28565至28589位置的探针,探针用不同化合物标记,特别是不同的荧光试剂。
使用上述引物和探针的实时PCR非常灵敏,它可以检出102拷贝的RNA,甚至可达10拷贝的RNA;而且它是可靠和可重复的。
本发明包括单链、双链和三链的多脱氧核糖核苷酸和多核糖核苷酸,它们对应于上述冠状病毒分离毒株的基因组及其片段的序列,及其正义或反义互补序列,特别是对应于上述基因组及其片段的序列的RNA和DNA。
本发明还包括使用特异性针对上述纯化的或分离的病毒株基因组的引物获得的扩增片段,特别是使用上述引物或引物对,该限制性片段包括下述片段或由下述片段的序列构成上述片段序列、从包括SEQ IDNo1序列或前面定义片段的载体体外转录而得到的片段、通过化学合成而得到的片段。限制性片段的实例由图13所示的序列SEQ ID No1的限制性图谱中推导出。根据本发明,所述片段可以为分离片段的形式,也可以为片段混合物的形式。本发明还包括经修饰的片段,相对于前面的片段,它移除或添加了相对上述片段长度约15%比例的核苷酸和/或在核苷酸性质方面进行修饰,只要经修饰的核苷酸片段保留与上述分离株的基因组或反义基因组RNA序列杂交的能力即可。
根据本发明的核酸分子通过本身已知的常规方法获得,依照下述的标准步骤例如描述于Current Protocols in Molecular Biology(Frederick M. AUSUBEL,2000,Wley and son Inc.,Library ofCongress,USA)。例如,它们可通过核酸序列的PCR或RT-PCR扩增或全部或部分的化学合成获得。
本发明的主题还有DNA或RNA芯片或滤器,其特征在于它包括至少一个上述多核苷酸或其片段之一。
根据本发明的DNA或RNA芯片或滤器通过本身已知的常规方法制备,例如将寡核苷酸用化学或电化学方法移植于玻璃或尼龙的载体上。
本发明的主题还有重组的克隆和/或表达载体,特别是包括上述核酸片段的质粒、病毒、病毒载体或噬菌体。优选的所述重组载体为将所述核酸片段置于适当元件控制下以调控其转录和翻译的表达载体。此外,所述载体可包括与所述插入物的5’端和/或3’端同相(en phase)融合的序列(标签),它用于所述载体表达的蛋白质的固定和/或检测和/或纯化。
这些载体通过本身已知的常规重组DNA和基因工程方法构建并引入宿主细胞。有许多本身已知的载体可供将所关注的核酸分子插入其中,以便将核酸分子引入宿主细胞并在宿主细胞中保留;合适载体的选择依赖于载体的预定用途(例如所关注的序列的复制、序列的表达、序列以染色体外的形式的保留或整合至宿主的染色体物质中)和宿主细胞的性质。
根据本发明,所述的质粒特别选自下述质粒 -称为SARS-S的质粒,包含于在法国微生物保藏中心(CollectionNationale de Cultures de Microorganismes,25 rue du Docteur Roux,75724 Paris Cedex15)(CNCM)于2003年6月20日保藏的No.I-3059细菌菌株中;该质粒包含编码源自记录为No.031589的样本的SARS-CoV病毒株的S蛋白的cDNA序列,参照Genbank序列AY274119.3,所述序列对应于21406至25348(SEQ ID No4)位置的核苷酸, -称为SARS-S1的质粒,包含于在法国微生物保藏中心于2003年5月12日保藏的No.I-3020细菌菌株中;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的S蛋白的cDNA序列的5’片段,参照Genbank序列AY274119.3 Tor2,所述片段对应于21406至23454(SEQ ID No5)位置的核苷酸, -称为SARS-S2的质粒,包含于在法国微生物保藏中心于2003年5月12日保藏的No.I-3019细菌菌株中;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的S蛋白的cDNA序列的3’片段,参照Genbank序列编号AY274119.3,所述片段对应于23322至25348(SEQ ID No6)位置的核苷酸, -称为SARS-SE的质粒,包含于在法国微生物保藏中心于2003年11月13日保藏的No.I-3126细菌菌株中;该质粒包含对应于上述源自记录为No.031589的样本的SARS-CoV病毒株的位于ORF-S和ORF-E之间并与ORF-E相重叠的区域的cDNA,参照Genbank序列编号AY274119.3,所述区域对应于25110至26244(SEQ ID No8)位置的核苷酸, -称为SARS-E的质粒,包含于在法国微生物保藏中心于2003年5月28日保藏的No.I-3046细菌菌株中;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的E蛋白的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26082至26413(SHQ IDNo15)位置的核苷酸, -称为SARS-M的质粒,包含于在法国微生物保藏中心于2003年5月28日保藏的No.I-3047细菌菌株中;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的M蛋白的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26330至27098(SEQ IDNo18)位置的核苷酸, -称为SARS-MN的质粒,包含于在法国微生物保藏中心于2003年11月13日保藏的No.I-3125细菌菌株中;该质粒包含对应于上述源自在河内收集的记录为No.031589的样本的SARS-CoV病毒株的位于ORF-M和ORF-N之间的区域的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26977至28218(SEQ ID No20)位置的核苷酸, -称为SARS-N的质粒,包含于在法国微生物保藏中心于2003年6月5日保藏的No.I-3048细菌菌株中;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的N蛋白的cDNA,参照Genbank序列编号AY274119.3,所述序列对应于28054至29430(SEQ ID No38)位置的核苷酸;因此该质粒包含序列SEQ ID No38的插入物,并且包含于在法国微生物保藏中心于2003年6月5日保藏的No.I-3048细菌菌株中, -称为SARS-5’NC的质粒,包含于在法国微生物保藏中心于2003年11月7日保藏的No.I-3124细菌菌株中;该质粒包含对应于上述源自记录为No.031589的样本的SARS-CoV病毒株的基因组的非编码5’端的cDNA,参照Genbank序列编号AY274119.3,所述序列对应于1至204(SEQ ID No39)位置的核苷酸, -称为SARS-3’NC的质粒,包含于在法国微生物保藏中心于2003年11月7日保藏的No.I-3123细菌菌株中;该质粒包含对应于上述源自记录为No.031589的样本的SARS-CoV病毒株的基因组的非编码3’端的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于位于28933至29727位置(SEQ ID No40)之间的核苷酸,结尾是一系列的核苷酸a., -称为pIV2.3N的表达质粒,包括编码N蛋白(SEQ ID No37)的C端与多组氨酸标签的融合蛋白的cDNA片段, -称为pIV2.3SC的表达质粒,包括编码对应于S蛋白(SEQ ID No3)氨基酸序列的475至1193位置的片段的C端与多组氨酸标签的融合蛋白的cDNA片段, -表达质粒pIV2.3SL,包括编码对应于S蛋白(SEQ ID No3)氨基酸序列的14至1193位置的片段的C端与多组氨酸标签的融合蛋白的cDNA片段, -称为pIV2.4N的表达质粒,包括编码N蛋白(SEQ ID No3)的N端与多组氨酸标签的融合蛋白的cDNA片段, -称为pIV2.4SC或pIV2.4S1的表达质粒,包括编码对应于S蛋白(SEQID No3)氨基酸序列的475至1193位置的片段的N端与多组氨酸标签的融合蛋白的插入物,和 -称为pIV2.4SL的表达质粒,包括编码对应于S蛋白(SEQ ID No3)氨基酸序列的14至1193位置的片段的N端与多组氨酸标签的融合蛋白的cDNA片段。
根据上述表达质粒的一个优选特征,它包含于在法国微生物保藏中心于2003年10月23日保藏的No.I-3117细菌菌株中。
根据上述表达质粒的另一个优选特征,它包含于在法国微生物保藏中心于2003年10月23日保藏的No.I-3118细菌菌株中。
根据上述表达质粒的另一个优选特征,它包含于在CNCM保藏的细菌菌株中,编号列出如下 a)菌株编号No.I-3118,保藏日期2003年10月23日, b)菌株编号No.I-3019,保藏日期2003年5月12日, c)菌株编号No.I-3020,保藏日期2003年5月12日, d)菌株编号No.I-3059,保藏日期2003年6月20日, e)菌株编号No.I-3323,保藏日期2004年11月22日, f)茵株编号No.I-3324,保藏日期2004年11月22日, g)菌株编号No.I-3326,保藏日期2004年12月1日, h)菌株编号No.I-3327,保藏日期2004年12月1日, i)菌株编号No.I-3332,保藏日期2004年12月1日, j)茵株编号No.I-3333,保藏日期2004年12月1日, k)菌株编号No.I-3334,保藏日期2004年12月1日, l)菌株编号No.I-3335,保藏日期2004年12月1日, m)茵株编号No.I-3336,保藏日期2004年12月1日, n)菌株编号No.I-3337,保藏日期2004年12月1日, o)菌株编号No.I-3338,保藏日期2004年12月2日, p)菌株编号No.I-3339,保藏日期2004年12月2日, q)菌株编号No.I-3340,保藏日期2004年12月2日, r)菌株编号No.I-3341,保藏日期2004年12月2日。
本发明的主题还有病毒来源的核酸插入物,其特征在于它包含于上面a)-r)定义的任意菌株中。
本发明的主题还有包含了合成基因以使得S蛋白在真核细胞中获得最佳表达的核酸,其特征在于它含有SEQ ID No140序列。
本发明的主题还有包含核酸的表达载体,该核酸包含合成基因以使得S蛋白获得最佳表达,该载体包含于在CNCM于2004年12月1日保藏的No.I-3333细菌菌株中。
根据所述表达载体的一个实施方案,它是病毒颗粒形式或重组基因组形式的病毒载体。
根据此实施方案的一个优选特征,它是能够在合适的细胞系统中通过上述g)、h)和k)至r)段的质粒转染得到的重组病毒颗粒或重组病毒基因组,也就是说,例如被一个或多个其他质粒转染的细胞,意在反式互补(trancomplémenter)某些在载体中缺失而又是病毒颗粒形成所必需的病毒功能。
“S蛋白家族”的表述这里应理解为完整的S蛋白、其胞外结构域(ectodomaine)及胞外结构域的片段,它们优选在真核细胞系统中产生。
本发明的主题还有编码上述S蛋白家族的多肽的慢病毒载体。
本发明的主题还有编码上述S蛋白家族的多肽的重组麻疹病毒。
本发明的主题还有编码上述S蛋白家族的多肽的重组牛痘病毒。
本发明的主题还有根据前面e)至r)段的载体或包括上述S蛋白的合成基因的载体在真核细胞系统中生产SARS相关联冠状病毒S蛋白或其片段的用途。
本发明的主题还有在真核细胞系统中生产S蛋白的方法,包括在真核细胞培养物中用载体转染细胞的步骤,所述载体为选自上述e)至r)段中提到的菌株所包含的载体或包含了合成基因以使得S蛋白获得最佳表达的载体。
本发明的主题还有cDNA文库,其特征在于它包括上述片段,特别是克隆至重组载体(特别是表达载体)中的扩增片段或限制性片段(表达文库)。
本发明的主题还有细胞,特别是经过上述重组载体修饰的原核细胞。
本发明的主题还有经基因修饰而表达上述蛋白或多肽的真核细胞。很明显,术语“经基因修饰的真核细胞”不表示经野生型病毒修饰的细胞。
根据所述细胞的一个优选的实施方案,它可以通过上述i)至1)段的任何载体的转染而得到。
根据此实施方案的一个优选特征,该细胞为FRhK4-Ssol-30,保藏于CNCM,保藏日期2004年11月22日,编号No.I-3325。
上述重组载体和被所述表达载体转化的细胞可方便地用于相应蛋白质和肽的生产。从所述载体衍生的表达文库和用所述表达文库转化的细胞可方便地用于鉴定SARS相关联冠状病毒的蛋白的免疫原性表位(B和T表位)。
本发明的主题还有纯化的或分离的蛋白质和肽,其特征在于它们由上述多核苷酸或其一个片段所编码。
根据本发明的一个优选的实施方案,所述蛋白质选自 -具有序列SEQ ID No3的S蛋白或其胞外结构域 -具有序列SEQ ID No14的E蛋白 -具有序列SEQ ID No17的M蛋白 -具有序列SEQ ID No37的N蛋白 -由下列开放读码框所编码的蛋白分别具有序列SEQ ID No74、75、10、12、22、24、26、28、30、33和35的ORF1a、ORF1b、ORF3、ORF4、ORF7至ORF11、ORF13和ORF14。
术语“S蛋白的胞外结构域”和“S蛋白的可溶形式”在下文中可互换地使用。
根据本发明的一个优选的实施方案,所述多肽由对应于S蛋白氨基酸序列1至1193位置的氨基酸构成。
根据本发明的另一个优选的实施方案,所述肽选自 a)对应于S蛋白氨基酸序列14至1193位置和475至1193位置的肽, b)对应于M蛋白氨基酸序列2至14位置(SEQ ID No69)和100至221位置的肽,这些肽分别对应M蛋白的胞外结构域和胞内结构域(endodomaine),和 c)对应于E蛋白氨基酸序列1至12位置(SEQ ID No70)和53至76位置(SEQ ID No71)的肽,这些肽分别对应E蛋白的胞外结构域和C端,和 d)5个至50个连续氨基酸,优选10至30个氨基酸的肽,包括a)、b)或c)中定义的肽的序列或与它们部分或全部重叠的序列。
本发明的主题还有肽,其特征在于它含有7至50个氨基酸的序列,该序列含有选自以下的氨基酸残基 -位于ORF1a编码的蛋白质的氨基酸序列2552位置的丙氨酸, -位于上述SARS-CoV病毒株的S蛋白的氨基酸序列577位置的丝氨酸, -位于上述SARS-CoV病毒株的ORF3编码的蛋白质的氨基酸序列11位置的甘氨酸, -位于上述SARS-CoV病毒株的M蛋白的氨基酸序列154位置的丝氨酸。
本发明的主题还有多克隆或单克隆抗体或抗体片段,可以通过使用上述重组载体、上述cDNA文库或上述蛋白或肽对动物免疫而获得,其特征在于它与至少一个上述SARS-CoV编码的蛋白质结合。
本发明包括多克隆抗体、单克隆抗体、例如人源化抗体的嵌合抗体及它们的片段(Fab、Fv、scFv)。
本发明的主题还有生产针对N蛋白的单克隆抗体的杂交瘤细胞,其特征在于它选自下列杂交瘤细胞 -生产单克隆抗体87的杂交瘤细胞,保藏于CNCM,保藏日期2004年12月1日,编号I-3328, -生产单克隆抗体86的杂交瘤细胞,保藏于CNCM,保藏日期2004年12月1日,编号I-3329, -生产单克隆抗体57的杂交瘤细胞,保藏于CNCM,保藏日期2004年12月1日,编号I-3330,和 -生产单克隆抗体156的杂交瘤细胞,保藏于CNCM,保藏日期2004年12月1日,编号I-3331。
本发明的主题还有针对N蛋白的多克隆抗体或单克隆抗体或抗体片段,其特征在于它由上述杂交瘤细胞生产。
根据本发明的意图,嵌合抗体的表述应被理解为,对比于特定动物物种的抗体或特定类的抗体,嵌合抗体意为包括另一动物物种的抗体或另一类抗体的重链和/或轻链的全部或部分的抗体。
根据本发明的意图,人源化抗体的表述应被理解为人类的免疫球蛋白,其中构成抗原结合位点的CDR(互补决定区)的残基被具有所需要的特异性、亲和力或活性的非人类的单克隆抗体的相应部分替换。考虑到实际上人源化抗体的FR区(框架区)和恒定区(Fc)的几乎所有残基均为人类免疫球蛋白的共有序列的残基,与非人类的抗体相比,它们在人体内免疫原性较小并且有较长的半衰期,因为它们只有小部分的非人类序列。
本发明的主题还有蛋白质芯片或滤器,其特征在于它包括上述蛋白质、肽或抗体。
根据本发明的蛋白质芯片通过其本身已知的常规方法制备。在蛋白质可固定于其上的合适的支持物中,这里可以提及塑料或玻璃制做的支持物,特别是微量培养板的形式。
本发明的主题还有从得自记录号为No.031589的样本的SARS相关联冠状病毒分离株中衍生的试剂,可用于SARS相关联冠状病毒感染的研究和诊断,所述试剂选自 (a)上述引物对、探针或DNA芯片, (b)上述重组载体或经修饰的细胞, (c)上述分离的冠状病毒株或多核苷酸, (d)上述蛋白质或肽, (e)上述抗体或抗体片段,和 (f)上述蛋白质芯片。
这些不同试剂可使用例如描述于Current Protocols in MolecularBiology(Frederick M.AUSUBEL,2000,Wiley and Son Inc.,Libraryof Congress,USA)、Current Protocols in Immunology(John E.Cologan,2000,Wiley and Son Inc.,Library of Congress,USA)和AntibodiesA Laboratory Manual(E.Howell and D. Lane,ColdSpring Harbor Laboratory,1998)中的常规分子生物学和免疫学技术依照标准步骤制备和使用。
根据本发明的核酸片段也根据上述常规技术制备和使用。根据本发明的肽和蛋白质通过本领域技术人员熟知的重组DNA技术制备,特别是利用上述重组载体制备。或者,根据本发明的肽可以通过本领域技术人员已知的常规固相或液相合成技术制备。
多克隆抗体通过用上述的蛋白质或肽免疫适当的动物制备,任选地可与KLH或白蛋白偶联和/或与适当的佐剂例如(完全或不完全)福氏佐剂或氢氧化铝组合;当达到满意的抗体效价后,根据常规技术收集免疫动物的血清以收获抗体并沉淀以富集IgG,任选地在附着有所述肽和所述蛋白的合适的柱上使用亲和层析来纯化特异针对SARS-CoV蛋白的IgG,以获得单特异性的IgG制品。
单克隆抗体从杂交瘤细胞中生产,杂交瘤细胞是按照K_hler和Milstein(Nature,1975,256,495-497)的技术用被上述蛋白或肽免疫的动物的B淋巴细胞与骨髓瘤细胞融合而制得的;杂交瘤细胞可在体外培养,特别是在发酵罐中,或在体内以腹水的形式生产。或者,所述单克隆抗体可用如美国专利US 4,816,567中描述的基因工程方法生产。
人源化抗体可用如国际申请WO98/45332中描述的常规方法生产。
抗体的片段可以用从杂交瘤细胞或被免疫小鼠的脾淋巴细胞的mRNA中克隆VH和VL区的方法生产;例如依照Winter和Milstein(Nature,1991,349,293-299)的技术在丝状噬菌体表面表达Fv、scFv或Fab片段;经过一些筛选步骤之后可分离特异性针对抗原的抗体片段,并通过克隆和表达重组DNA的技术在适当的表达系统中表达抗体片段。
上述的抗体或其片段以本领域技术人员已知的常规技术纯化,例如亲和层析。
本发明的主题另外还有产物在制备用于SARS相关联冠状病毒的检测和任选地基因分型/血清分型的试剂中的用途,所述产物选自上述的引物对、探针、DNA芯片、重组载体、经修饰的细胞、分离的冠状病毒株、多核苷酸、蛋白质或肽、抗体或抗体片段和蛋白质芯片。
根据本发明的蛋白质和肽可被特异性针对SARS相关联冠状病毒的抗体识别和/或能诱导该抗体的产生,而可用于上述冠状病毒感染的诊断;使用合适的技术——特别是EIA、ELISA、RIA、免疫荧光——在从可能被感染的个体采集的生物样本中检测感染情况。
根据所述用途的一个优选特征,所述蛋白质选自上述S、E、M和/或N蛋白和肽。
上述的S、E、M和/或N蛋白和由这些蛋白衍生的肽,例如N蛋白,可用于SARS相关联冠状病毒感染的间接诊断(血清学诊断;特异性针对SARS-CoV的抗体的检测),特别是使用免疫酶学方法(ELISA)。
根据本发明的抗体和抗体片段,特别是针对上述的S、E、M和/或N蛋白和所衍生的肽的抗体和抗体片段,可用于SARS相关联冠状病毒感染的直接诊断;SARS-CoV的蛋白质的检测通过合适的技术(特别是EIA、ELISA、RIA、免疫荧光法)在从可能被感染的个体采集的生物样本中进行。
本发明的主题还有生物样本中SARS相关联冠状病毒的检测方法,该方法的特征在于它至少包括 (a)使所述生物样本与至少一种上述的抗体或抗体片段、蛋白质、肽、或蛋白质或肽的芯片或滤器相接触,和 (b)用适当的手段使(a)中形成的抗原-抗体复合物可视化,例如用EIA、ELISA、RIA或免疫荧光法。
根据所述步骤的一个优选的实施方案,步骤(a)包括 (a1)使所述生物样本与附着在适当支持物,特别是微量培养板上的至少一种第一抗体或抗体片段接触, (a2)洗涤固相,和 (a3)加入至少一种第二抗体或抗体片段,与第一抗体不同,视情况而定,所述的第二抗体或抗体片段上应被合适地标记。
这种可以捕获生物样本中存在的病毒颗粒的方法也被称为免疫捕获方法。
例如 -(a1)步骤中使用了至少一种第一单克隆或多克隆抗体或其片段,它们是针对S、M和/或E蛋白和/或对应于这些蛋白的其中一个的胞外结构域的肽的(M2-14或E1-12肽) -(a3)步骤中使用了至少一种抗体或抗体片段,它们针对的是相同蛋白的另一表位或优选地针对另一蛋白,优选地针对例如N核蛋白或E或M蛋白的胞内结构域的内部蛋白,更优选地它们是针对在病毒颗粒中含量很丰富的N蛋白的抗体或抗体片段;当使用针对内部蛋白(N)或E或M蛋白的胞内结构域的抗体或抗体片段时,所述抗体应在洗涤剂存在的条件下培养,洗涤剂的例子如Tween20,浓度约为0.1%。
-在使形成的抗原-抗体复合物可视化的步骤(b)中,可以直接使用被生物素或适当的酶如过氧化物酶或碱性磷酸酶标记的第二抗体,也可以间接使用带有上述标记的抗免疫球蛋白的血清。这样形成的复合物借助适当的底物可视化。
根据本发明这一方面的一个优选的实施方案,生物样本在与捕获单克隆抗体接触之前,先与可视化单克隆抗体混合。需要时,血清可视化抗体混合物在应用到培养板之前在室温下培养至少10分钟。
本发明的主题还有通过检测天然核蛋白(N蛋白)来检验SARS相关联冠状病毒感染的免疫捕获检测,具体而言其特征在于用于捕获天然病毒核蛋白的抗体是特异针对中心区和/或构象表位的单克隆抗体。
根据所述检测的一个实施方案,用于捕获N蛋白的抗体是单克隆抗体mAb87,它由2004年12月1日保藏于CNCM、编号I-3328的杂交瘤细胞生产。
根据所述免疫捕获检测的另一个实施方案,用于捕获N蛋白的抗体是单克隆抗体mAb86,它由2004年12月1日保藏于CNCM、编号I-3329的杂交瘤细胞生产。
根据所述免疫捕获检测的另一个实施方案,单克隆抗体mAb86和mAb87用于捕获N蛋白。
根据本发明的免疫捕获检测,在N蛋白可视化步骤中,可以使用在2004年12月1日保藏于CNCM的编号I-3330的杂交瘤细胞生产的mAb57单克隆抗体,所述抗体与可视化分子或颗粒相缀合。
根据所述免疫捕获检测,与可视化分子或颗粒相缀合的mAb57和mAb87抗体的组合用于N蛋白的可视化。
可视化分子可以为放射性原子、染料、荧光分子、荧光团、酶;可视化颗粒可以为例如胶体金、磁性颗粒或乳胶微球。
本发明的主题还有检测SARS相关联冠状病毒的试剂,其特征在于它选自 (a)上述的引物对或探针, (b)上述的重组载体或经修饰的细胞, (c)上述的分离的冠状病毒株或多核苷酸, (d)上述的抗体或抗体片段, (e)上述的包括单克隆抗体mAb86和/或mAb87,和单克隆抗体mAb57的抗体组合, (f)上述的芯片或滤器。
本发明的主题还有通过使用N蛋白的间接IgG ELISA从生物样本中检测SARS相关联冠状病毒感染的方法,该方法的特征在于用N蛋白溶液致敏培养板,N蛋白浓度在0.5和4μg/ml之间,优选为2μg/ml,溶于含0.25ml/l酚红的、pH为7.2的10mM PBS缓冲液中。
本发明的主题另外还有通过使用双表位ELISA从生物样本中检测SARS相关联冠状病毒感染的方法,其特征在于待测的血清与可视化的抗原相混合,然后将所述混合物与附着于固相支持物的抗原相接触。
根据SARS相关联冠状病毒的检测的一个变化形式,这些检测结合了使用N蛋白的ELSA和另一个使用S蛋白的ELSA,如下文所述。
本发明的主题还有由上述的多克隆或单克隆抗体或抗体片段和SARS相关联冠状病毒的蛋白质或肽形成的免疫复合物。
本发明的主题另外还有SARS相关联冠状病毒检测试剂盒,其特征在于它包括至少一种选自下列的试剂上述的引物对、探针、DNA或RNA芯片、重组载体、经修饰的细胞、分离的冠状病毒株、多核苷酸、蛋白质或肽、抗体、蛋白质芯片。
本发明的主题另外还有免疫原性组合物,其特征在于包括至少一种选自下列的产物 a)上述的蛋白质或肽, b)上述的DNA或RNA型多核苷酸或其代表性片段,其序列选自 (i)SEQ ID No1序列或其RNA等价物 (ii)可与SEQ ID No1序列在高度严紧条件下杂交的序列, (iii)与SEQ ID No1序列或可与SEQ ID No1序列在高度严紧条件下杂交的序列互补的序列, (iv)上述(i)、(ii)或(iii)中的多核苷酸的代表性片段的核苷酸序列, (v)上述(i)、(ii)、(iii)或(iv)修饰后的序列,和 c)包括b)中所述多核苷酸的重组表达载体,和 d)上述的cDNA文库, 所述的免疫原性组合物可以诱导特异性针对SARS相关联冠状病毒的保护性的体液或细胞的免疫,特别是产生针对SARS相关联冠状病毒特异表位的抗体。
上述的蛋白质和肽,特别是S、M、E和/或N蛋白及衍生的肽,以及编码所述蛋白质或所述肽的核酸分子(DNA或RNA)是良好的候选疫苗并且可在用于生产针对SARS相关联冠状病毒的疫苗的免疫原性组合物中使用。
根据本发明的组合物的一个优选的实施方案,它们另外还包括至少一种可药用的赋形剂和任选的载体物质和/或佐剂。
可药用的赋形剂、载体物质和佐剂是常规使用的。
佐剂优选地选自油状乳液、皂甙、矿物质、细菌提取物、氢氧化铝和角鲨烯。
载体物质优选地选自单层脂质体、多层脂质体、皂甙微粒或糖或含金质的固体微球。
根据本发明的组合物以常规途径给药,特别是肌内或皮下途径或局部途径,特别是鼻部(气雾剂)途径。
本发明的主题还有分离的或纯化的蛋白或肽在与特异性针对SARS相关联冠状病毒的表位的抗体形成免疫复合物中的应用,所述的蛋白或肽具有选自下列的序列SEQ ID No3、10、12、14、17、22、24、26、28、30、33、35、37、69、70、71、74和75。
本发明的主题还有免疫复合物,该免疫复合物由分离的或纯化的蛋白或肽与特异性针对SARS相关联冠状病毒的表位的抗体形成,所述的蛋白或肽具有选自下述的序列SEQ ID No3、10、12、14、17、22、24、26、28、30、33、35、37、69、70、71、74和75。
本发明的主题还有分离的或纯化的蛋白或肽在诱导产生可特异性识别SARS相关联冠状病毒的表位的抗体中的应用,所述的蛋白或肽具有选自下述的序列SEQ ID No3、10、12、14、17、22、24、26、28、30、33、35、37、69、70、71、74和75。
本发明的主题还有分离的或纯化的多核苷酸在诱导产生针对所述多核苷酸编码的蛋白和可特异性识别SARS相关联冠状病毒的表位的抗体中的应用,所述的多核苷酸具有选自下述的序列SEQ ID No1、2、4、7、8、13、15、16、18、19、20、31、36和38。
本发明的主题还有可识别SARS相关联冠状病毒的天然S蛋白的单克隆抗体。
本发明的主题还有上述的S蛋白家族的蛋白或多肽或上述的识别天然S蛋白的抗体在从生物样本中检测SARS相关联冠状病毒感染中的应用。
本发明的主题还有从生物样本中检测SARS相关联冠状病毒感染的方法,其特征在于该检测是通过使用真核细胞系统中表达的重组S蛋白的ELISA进行的。
根据所述方法的一个优选的实施方案,它是双表位ELISA方法,并且待测的血清与可视化的抗原相混合,然后将所述混合物与附着于固相支持物的抗原相接触。
本发明的主题还有免疫复合物,该免疫复合物由可识别天然S蛋白的单克隆抗体或抗体片段和SARS相关联冠状病毒的蛋白或肽构成。
本发明的主题还有免疫复合物,该免疫复合物由上述S蛋白家族的蛋白或多肽和特异性针对SARS相关联冠状病毒的表位的抗体构成。
本发明的主题另外还包括SARS相关联冠状病毒的检测试剂盒或盒子,其特征在于包括至少一种选自下述的试剂上述的S蛋白家族的蛋白或多肽、上述的编码S蛋白家族的蛋白或多肽的核酸、上述的表达S蛋白家族的蛋白或多肽的细胞或识别SARS相关联冠状病毒的天然S蛋白的抗体。
本发明的主题还有免疫原性和/或疫苗组合物,其特征在于包括在真核细胞表达系统中获得的上述S蛋白家族的多肽或重组蛋白。
本发明的主题还有免疫原性和/或疫苗组合物,其特征在于包括上述的可表达S蛋白家族的蛋白或多肽的载体或重组病毒。
除了上述的特征之外,本发明还包括在以下的描述中显现的其他特征,参考代表源自记录为031589号的样本的SARS-CoV毒株基因组的多核苷酸的应用的实施例和作为本发明主题的衍生cDNA片段的应用的实施例,表I显示序列列表 表I序列表 *PCR扩增产物(扩增子) **克隆进入保藏于CNCM的质粒中的插入物
-图1显示的是使用表达载体pIVEX的重组蛋白N、SC和SL的体外表达的蛋白质免疫印迹(Western-blot)分析结果C泳道1pIV2.3N。泳道2pIV2.3SC。泳道3pIV2.3SL。泳道4pIV2.4N。泳道5pIV2.4S1或pIV2.4SC。泳道6pIV2.4SL。使用相同载体表达GFP蛋白的表达结果用作对照。
-图2显示的是使用变性条件下的聚丙烯酰胺凝胶电泳(SDS-PAGE)和考马斯亮蓝染色对表达载体pIVEX体内表达N蛋白的分析结果。使用重组载体pIVEX转化的大肠杆菌BL21(DE3)pDIA17菌株,在30℃、LB培养基上使用或不使用诱导剂(1mM IPTG)进行培养。泳道1pIV2.3N。泳道2pIV2.4N。
-图3显示的是使用变性条件下的聚丙烯酰胺凝胶电泳(SDS-PAGE)和考马斯亮蓝染色对表达载体pIVEX体内表达SC和SL多肽的分析结果。使用重组载体pIVEX转化的大肠杆菌BL21(DE3)pDIA17菌株,在30℃、LB培养基上使用或不使用诱导剂(1mM IPTG)进行培养。泳道1pIV2.3SC。泳道2pIV2.3SL。泳道3pIV2.4S1。泳道4pIV2.4SL。
-图4显示的是使用重组载体pIVEX转化的大肠杆菌BL21(DE3)pDIA17菌株生产的重组N、SC和SL蛋白的抗原活性。A细菌溶菌产物的电泳(SDS-PAGE)。B和C来自同一个被SARS-CoV感染的患者的血清的Western-blot分析,分别采样于出现SARS症状的8天后(B血清M12)和29天后(C血清M13)。泳道1pIV2.3N。泳道2pIV2.4N。泳道3pIV2.3SC。泳道4pIV2.4S1。泳道5pIV2.3SL。泳道(6pIV2.4SL。
-图5显示的是使用载体pIV2.3N转化的大肠杆菌BL21(DE3)pDIA17菌株生产的重组N蛋白在Ni-NTA琼脂糖柱上纯化的结果。泳道1总细菌提取物。泳道2可溶性提取物。泳道3不溶性提取物。泳道4存留于Ni-NTA柱上的提取物。泳道5未结合蛋白。泳道6峰1组分。泳道7峰2组分。
-图6显示的是使用重组质粒pIV2.4S1转化大肠杆菌BL21(DE3)pDIA17菌株在包含体中产生的重组SC蛋白的纯化结果。A使用TritonX-100(2%)处理泳道1总细菌提取物。泳道2可溶性提取物。泳道3不溶性提取物。泳道4使用Triton X-100(2%)处理后的上清液。泳道5和6使用Triton X-100(2%)处理后的片状沉淀。B使用4M、5M、6M和7M的尿素处理可溶性和不溶性的提取物。
-图7表示了使用被SARS-CoV感染的细胞的裂解产物与患非典型肺炎的患者的血清产生的免疫印迹。
-图8表示了使用被SARS-CoV感染的细胞的裂解产物与特异性针对核蛋白N(A)和刺蛋白S(B)的兔免疫血清产生的免疫印迹。I.S.免疫血清。p.i.免疫前血清。抗N蛋白免疫血清以1/50000使用,抗S蛋白免疫血清以1/10000使用。
-图9显示的是针对N蛋白或S蛋白的短片段(SC)的兔单特异性多克隆抗体血清对相应的用于免疫的重组蛋白的ELISA反应性。A用纯化的重组N蛋白免疫而产生的兔P13097、P13081和P13031。B用对应于S蛋白的短片段(SC)的包含体制剂免疫而产生的兔P11135、P13042和P14001。I.S.免疫血清。p.i.免疫前血清。
-图10显示的是纯化的重组N蛋白对由SARS-CoV引起的非典型肺炎患者的血清的ELISA反应性。图10aELISA板,以浓度为4μg/ml和2μg/ml的N蛋白包被。图10bELISA板,以浓度为1μg/ml的N蛋白包被。标示为A、B、D、E、F、G、H的血清与表IV对应。
-图11显示的是数量递减的SARS-CoV N基因的合成RNA(107至1拷贝)的RT-PCR扩增结果,该扩增使用了No.1引物对(N/+/28507,N/-/28774)(A)和No.2引物对(N/+/28375,N/-/28702)(B)。T无RNA的扩增结果。MWDNA分子量标记。
-图12显示的是对于SARS-CoV N基因的合成RNA的实时RT-PCR扩增结果数量递减的合成RNA作为复本(复本泳道16至29)和稀释至1/20×10-4病毒RNA(泳道32)以实时RT-PCR的方法扩增,该扩增使用“Light Cycler RNA Amplification Kit Hybridization Probes”试剂盒和No.2系列的引物对和探针,实验条件如实施例8所述。
-图13(图13.1至13.7)代表了SEQ ID No1序列的限制性图谱,所述SEQ ID No1序列对应于来自记录号为031589的样本的SARS-CoV病毒株基因组的DNA等价物。
-图14显示的是使用间接N蛋白ELISA的SARS血清学检测结果(测试了第一系列的血清)。
-图15显示的是使用间接N蛋白ELISA的SARS血清学检测结果(测试了第二系列的血清)。
-图16代表的是使用双表位N蛋白ELISA的SARS血清学检测结果(测试了第一系列的血清)。
-图17显示的是使用双表位N蛋白ELISA的SARS血清学检测结果(测试了第二系列的血清)。
-图18显示的是使用ELISA测定的抗N蛋白单克隆抗体对SARS-CoV的天然核蛋白N的反应性结果。使用被SARS-CoV感染的Vero E6细胞的受辐射裂解物作为抗原,用间接ELISA测定了在杂交瘤细胞培养物上清液的形式中的抗体(SARS裂解曲线)。对于每种抗体,以未受感染的Vero E6细胞的裂解物作为反应性的阴性对照(阴性裂解曲线)。一些已知特异性的单克隆抗体作为阴性对照抗体针对1-3型副流感病毒抗原的para1-3抗体(Bio-Rad)和针对B型流感病毒抗原的流感B抗体(Bio-Rad)。
-图19显示的是使用ELISA测定的抗SARS-CoV的N蛋白单克隆抗体对人类冠状病毒229E(HCoV-229E)的天然抗原的反应性结果。使用被人类冠状病毒229E感染的MRC-5细胞的裂解物作为抗原,用间接ELISA测定了在杂交瘤细胞培养物上清液的形式中的抗体(229E裂解曲线)。对于每种抗体,以未受感染的MRC-5细胞的裂解物作为免疫反应性的阴性对照(阴性裂解曲线)。针对人类冠状病毒229E的S蛋白的单克隆抗体5-11H.6(Sizun et al. 1998,J.Virol. Met.72145-152)作为阳性对照抗体。在单克隆抗体的测试组中加入了针对1-3型副流感病毒抗原的para1-3抗体(Bio-Rad)和针对B型流感病毒抗原的流感B抗体(Bio-Rad)。
-图20显示的是使用蛋白质免疫印迹分析测定的抗SARS-CoV的N蛋白单克隆抗体对于变性的SARS-CoV天然核蛋白N的反应性。根据Laemmli的方法将被SARS-CoV感染的Vero E6细胞的裂解物置于加样缓冲液中并在12%SDS聚丙烯酰胺凝胶中电泳,然后将蛋白质转至PVDF膜上。被测抗N蛋白单克隆抗体以0.05μg/ml的浓度用于免疫分析。可视化过程使用过氧化物酶偶联的抗小鼠IgG(H+L)抗体(NA93IV,Amersham)和ECL+系统进行。使用了两种单克隆抗体作为反应性的阴性对照针对B型流感病毒抗原的流感B抗体(Bio-Rad)和针对1-3型副流感病毒抗原的para1-3抗体(Bio-Rad)。
-图21表示了用于在哺乳动物细胞中表达SARS-CoVS蛋白的质粒。将SARS-CoVS蛋白的cDNA插入到表达质粒pcDNA3.1(+)(Clontech)的BamH1和Xho1位点之间得到质粒pcDNA-S,将该cDNA插入到表达质粒pCI(Promega)的Nhe1和Xho1位点之间得到质粒pCI-S。将WPRE和CTE序列各自插入到质粒pcDNA-S和pCI-S的Xho1和Xba1位点之间,分别得到质粒pcDNA-S-CTE、pcDNA-S-WPRE、pCI-S-CTE和pCI-S-WPRE。
SP使用signalP v2.0软件(Nielsen et al.,1997.ProteinEngineering,101-6)预测的信号肽(氨基酸1-13) TM使用TMHMM v2.0软件(Sonnhammer et al.,1998,Proc.ofSixth Int.Conf.on Intelligent Systems for Molecular Biology,pp.175-182,AAAI Press)预测的跨膜区域(氨基酸1196-1218)。应该注意氨基酸W1194和P1195可能是跨膜区域的一部分,其概率分别是0.13和0.42 P-CMV巨细胞病毒的立即/早期启动子。BGH pA牛生长激素基因的多腺苷酸化信号 SV40晚期pASV40病毒晚期多腺苷酸化信号 SD/SA拼接供体和受体位点 WPRE土拨鼠肝炎病毒的“土拨鼠肝炎病毒转录后调控元件(Woodchuck Hepatitis Virus posttranscriptional regulatoryelement)”的序列 CTE马森-法衣扎(Mason-Pfizer)猴逆转录病毒的“组成型转运元件(constitutive transport element)”的序列 -图22显示的是在转染Vero E6细胞后S蛋白的表达。用质粒pcDNA、pcDNA-S、pCI和pCI-S转染Vero E6细胞48小时后制备细胞提取物。还用重组牛痘病毒VV-TF7.3感染和质粒pcDNA或pcDNA-S转染18小时后制备细胞提取物。在用SARS-CoV以3的感染复数感染VeroE6细胞8小时后制备细胞提取物作为对照。上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。图中显示了分子量梯度标记(kDa)。
SARS-CoV被SARS-CoV感染的Vero E6细胞的提取物 模拟物未受感染细胞的对照提取物 -图23显示的是CTE和WPRE序列转染Vero E6和293T细胞后对S蛋白表达的影响。用质粒pcDNA、pcDNA-S、pcDNA-S-CTE、pcDNA-S-WPRE、pCI-S、pCI-S-CTE和pCI-S-WPRE转染Vero E6细胞(A)或293T细胞(B)48小时后制备细胞提取物,上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。图中显示了分子量梯度标记(kDa)。
SARS-CoV用SARS-CoV以3的感染复数感染Vero E6细胞8小时后的提取物 模拟物未受感染的Vero E6细胞的对照提取物 -图24表示了用于表达SARS-CoV S蛋白的具有中心DNA瓣的缺陷型慢病毒载体。SARS-CoV S蛋白的cDNA以BamH1-Xho1片段的形式被克隆至质粒pTRIPΔ3-CMV中得到质粒pTRIP-S,所述的pTRIPΔ3-CMV质粒包含具有中心DNA瓣的缺陷型慢病毒载体TRIP(Sirven et al.,2001,Mol.Ther.,3438-448)。由CMV病毒立即/早期启动子、拼接信号、S蛋白cDNA和转录后信号CTE或WPRE组成的最适表达盒替换了具有中心DNA瓣TRIPΔU3-EF1α(Sirvenetal.,2001,Mol.Ther.,3438-448)的缺陷型慢病毒载体中的表达盒EF1α-EGFP,从而得到质粒pTRIP-SD/SA-S-CTE和pTRIP-SD/SA-S-WPRE。
SP信号肽 TM跨膜区域 P-CMV巨细胞病毒的立即/早期启动子 P-EF1αEF1α基因启动子 SD/SA拼接供体和受体位点 WPRE土拨鼠肝炎病毒的“土拨鼠肝炎病毒转录后调控元件”的序列 CTE马森-法衣扎猴逆转录病毒的“组成型转运元件”的序列 LTR“长末端重复序列” ΔU3缺失“启动子/增强子”序列的长末端重复序列 cPPT“聚嘌呤区顺式作用序列” CTS“中端序列(central termination sequence)” -图25显示的是用蛋白质免疫印迹分析将慢病毒载体TRIP-SD/SA-S-CTE和TRIP-SD/SA-S-WPRE转导入细胞系后其SARS-CoVS蛋白的表达情况。用慢病毒载体TRIP-SD/SA-S-CTE和TRIP-SD/SA-S-WPRE分别转导后建立了细胞系FrhK4-S-CTE和FrhK4-S-WPRE,并制备细胞提取物。上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体进行了蛋白质免疫印迹分析。图中显示了分子量梯度标记(kDa)。
T-FrhK-4细胞的对照提取物 T+用SARS-CoV以3的感染复数感染FrhK-4细胞24小时后的提取物 -图26涉及将慢病毒载体TRIP-SD/SA-Ssol-CTE和TRIP-SD/SA-Ssol-WPRE转导入细胞系后其Ssol多肽表达的分析。用慢病毒载体TRIP-SD/SA-Ssol-CTE和TRIP-SD/SA-Ssol-WPRE转导FRhK-4细胞后,分离了一系列的细胞克隆并测定了其上清液中的Ssol多肽的分泌。根据Laemmli的方法将5μl的上清液在加样缓冲液中稀释1/2并进行蛋白质免疫印迹分析,使用抗FLAG单克隆抗体(M2,Sigma)和过氧化物酶偶联的抗小鼠IgG(H+L)抗体缀合物进行可视化。T-亲代FRhK-4细胞系的上清液。T+用表达Ssol多肽的重组牛痘病毒感染的BHK细胞的上清液。实心箭头表示Ssol多肽,空心箭头表示细胞来源蛋白质的交叉反应。
-图27显示纯化的Ssol多肽的分析的相关结果 A.用抗FLAG亲和层析和凝胶过滤(G75)纯化的8、2、0.5和0.125μg的Ssol重组多肽在8%SDS聚丙烯酰胺凝胶上分离。Ssol多肽和不同量的分子量标记(MM)用硝酸银染色(Gelcode SilverSNAP stainkitII,Pierce)而可视化。
B.SELDI-TOF质谱分析的标准标记物 IgG牛IgG,为分子量147300的标记 ConA伴清蛋白,为分子量77490的标记 HRP辣根过氧化物酶,作为对照并为分子量43240的标记 C.重组Ssol多肽的质谱(SELDI-TOF)分析。
峰A和B分别代表带单电荷和双电荷的Ssol多肽。
D.重组Ssol多肽的N端测序。在ABI494测序仪(AppliedBiosystems)上液相中进行了5个Edman降解循环。
-图28显示的是拼接信号和CTE和WPRE序列对于使用编码SARS-CoV S蛋白的质粒DNA的基因免疫效力的影响。
A.将几组BALB/c小鼠(7只/组)用50μg的pCI、pcDNA-S、pCI-S、pcDNA-N和pCI-HA质粒DNA免疫,以4周的时间间隔免疫两次。
B.将几组BALB/c小鼠(6只/组)用2μg、10μg或50μg的pCI、pCI-S、pCI-S-CTE和pCI-S-WPRE质粒DNA免疫,以4周的时间间隔免疫两次。
在第二次免疫后3周收集免疫血清,并用被SARS-CoV感染的VeroE6细胞裂解物作为抗原进行间接ELISA分析。用过氧化物酶偶联的抗小鼠IgG多克隆抗体(NA931V,Amersham)和TMB(KPL)进行可视化后,以产生特定的OD值0.5时的抗体稀释度的倒数计算抗SARS-CoV抗体效价。
-图29显示在使用编码SARS-CoV的S蛋白质粒的基因免疫后,小鼠体内诱导的抗体对SARS-CoV的感染性的血清中和作用。在第二次免疫后3周收集各份免疫血清,用于图28所述的各组实验,并评价其对于100TCID50的SARS-CoV对FRhK-4细胞的感染性的中和能力。从1/20开始逐次二倍稀释血清,每个二倍稀释液测试4个孔。根据Reed和Munsch的方法,以可中和4个孔中的两个的感染性的血清稀释度的倒数计算血清中和效价。
A.将几组BALB/c小鼠用50μg的pCI、pcDNA-S、pCI-S、pcDNA-N和pCI-HA质粒DNA免疫,以4周的时间间隔免疫两次。□免疫前血清。■免疫血清。
B.将几组BALB/c小鼠用2μg、10μg或50μg的pCI、pCI-S、pCI-S-CTE和pCI-S-WPRE质粒DNA免疫,以4周的时间间隔免疫两次。
-图30显示的是重组Ssol多肽对于SARS患者血清的免疫反应性。用纯化的重组Ssol多肽制备固相并用间接ELISA测试患者血清的反应性。用稀释至1/400的患者的抗体与固相反应,用过氧化物酶偶联的人抗IgG(H+L)多克隆抗体(Amersham NA933V)和TMB加H2O2(KPL)使反应的抗体可视化。SARS疑似病例的血清适当地根据法国国家流感病毒文献中心(Centre National deRéférence des Virus Influenzae)的系列号和患者姓名缩写以及出现症状后经过的天数来定义。在2003年SARS流行之前于法国采集的试验者血清TV作为对照血清。
-图31显示的是在用重组Ssol多肽免疫后,针对SARS-CoV的抗体的诱导。用10μg的重组Ssol多肽及氢氧化铝佐剂(Ssol组)或作为对照单独用佐剂(模拟组)免疫两组小鼠,每组6只小鼠,免疫时间间隔为3周。连续免疫三次并在每次免疫后三周采集免疫血清(IS1、IS2、IS3)。使用SARS-CoV感染的Vero E6细胞裂解物作为抗原,用间接ELISA分析了两个组中的每份免疫血清。用过氧化物酶偶联的抗小鼠IgG多克隆抗体(Amersham)和TMB(KPL)进行可视化后,以产生特定的OD值0.5时的抗体稀释度的倒数计算抗SARS-CoV的抗体效价。
-图32表示了合成基因040530序列和SARS-CoV分离株031589的野生型基因的序列的核苷酸比对结果。I-3059对应于保藏于CNCM编号为I-3059的SARS-CoV分离株031589的核苷酸21406-25348(SEQ ID No4,质粒pSARS-S),S-040530为合成基因040530的序列。
-图33显示的是合成基因在表达SARS-CoV S蛋白中的应用。用质粒pCI、pCI-S、pCI-S-CTE、pCI-S-WPRE和pCI-Ssynth转染Vero E6细胞(A)或293T细胞(B)48小时后制备细胞提取物,上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。蛋白质免疫印迹分析通过发光法(ECL+,Amersham)和数字成像装置(FluorS,BioRad)采集而可视化。S蛋白的表达水平通过对图像上鉴定的两条显著条带的定量来测量。
-图34为构建重组牛痘病毒VV-TG-S、VV-TG-Ssol、VV-TN-S和VV-TN-Ssol的示意图。
A.将SARS-CoV的S蛋白和Ssol多肽的cDNA插入到转移质粒pTG186的BamH1和Smal酶切位点之间得到质粒pTG-S和pTG-Ssol。
B.然后用合成启动子480的序列通过互换Nde1-Pst1片段的方式替换质粒pTG186poly、pTG-S和pTG-Ssol的7.5启动子序列,得到转移质粒pTN480、pTN-S和pTN-Ssol。
C.pTN系列的转移质粒中在Nde1和Pst1酶切位点之间的合成启动子480的序列。为后续处理的方便而插入了一个Asc1酶切位点。该限制性酶切位点和启动子序列用下划线标出。
D.在pTG和pTN系列的转移质粒的TK表达盒和牛痘病毒的哥本哈根(Copenhague)毒株的TK基因之间,进行双同源体内重组,而得到重组牛痘病毒。
SP使用signalP v2.0软件(Nielsen et al.,1997. ProteinEngineering,101-6)预测的信号肽(氨基酸1-13) TM使用TMHMM v2.0软件(Sonnhammer et al.,1998,Proc.ofSixth Int. Conf. on Intelligent Systems for Molecular Biology,pp.175-182,AAAI Press)预测的跨膜区域(氨基酸1196-1218)。应该注意氨基酸W1194和P1195可能是跨膜区域的一部分,其概率分别是0.13和0.42。
TK-L、TK-R牛痘病毒胸腺嘧啶激酶基因的左手和右手部分。
MCS多克隆位点 PE早期启动子 PL晚期启动子 PL synth合成晚期启动子480 -图35显示的是经蛋白质免疫印迹分析的重组牛痘病毒S蛋白的表达。使用重组牛痘病毒VV-TG、VV-TG-S和VV-TN-S以2的感染复数感染CV1细胞,18小时后制备细胞提取物(A)。作为对照,用SARS-CoV以2的感染复数感染Vero E6细胞,8小时后制备细胞提取物。还要用重组牛痘病毒VV-TG-S、VV-TG-Ssol、VV-TN、VV-TN-S和VV-TN-Ssol感染CV1细胞,并于18小时后制备细胞提取物(B)。上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。“1μl”和“10μl”表示在凝胶中上样的细胞提取物的量。图中显示了分子量梯度标记(kDa)。
SARS-CoV被SARS-CoV感染的Vero E6细胞的提取物 模拟物未感染细胞的对照提取物 -图36显示了重组牛痘病毒分泌Ssol多肽的蛋白质免疫印迹分析结果。
A.在重组牛痘病毒VV-TN、不同克隆的VV-TN-Ssol病毒和VV-TG-Ssol或VV-TN-Sf1ag病毒以2的感染复数感染CV1细胞,感染18小时以后收集CV1细胞上清液。
B.用重组牛痘病毒VV-TN-Ssol以2的感染复数感染两次(1,2)293T、FRhK-4、BHK-1和CV1细胞,感染18小时以后收集上清液。同样收集病毒VV-TN感染CV1细胞的上清液作为对照(M)。
所有的上清液都根据Laemmli的方法在8%SDS丙烯酰胺凝胶上分离,并使用抗FLAG小鼠单克隆抗体和过氧化物酶偶联的抗小鼠IgG(H+L)多克隆抗体(NA931V,Amersham)(A)、或使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)(B)进行蛋白质免疫印迹分析。
图中显示了分子量梯度标记(kDa)。
-图37显示了对在SDS聚丙烯酰胺凝胶上纯化的Ssol多肽的分析。
用抗FLAG亲和层析纯化的10、5和2μl的重组Ssol多肽在4至15%的梯度SDS聚丙烯酰胺凝胶上分离。Ssol多肽和不同量的分子量标记(MM)用硝酸银染色(Gelcode SilverSNAP stain kit II,Pierce)而可视化。
-图38显示的是由重组牛痘病毒VV-TN-Ssol生产的重组Ssol多肽对于SARS患者血清的免疫反应性。用纯化的重组Ssol多肽制备固相并用间接ELISA测试患者血清的反应性。用稀释至1/100和1/400的患者的抗体与固相反应,用过氧化物酶偶联的人抗IgG(H+L)多克隆抗体(Amersham NA933V)和TMB加H2O2(KPL)使反应的抗体可视化。SARS疑似病例的血清适当地根据法国国家流感病毒文献中心的系列号和患者姓名缩写以及出现症状后经过的天数来定义。在2003年SARS流行之前于法国采集的试验者血清TV作为对照血清。
-图39显示的是在用重组牛痘病毒免疫后小鼠体内的抗SARS-CoV抗体应答。每组7只BALB/c小鼠分别用106pfu的重组牛痘病毒VV-TG、VV-TG-HA、VV-TG-S、VV-TG-Ssol、VV-TN、VV-TN-S、VV-TN-Ssol经静脉注射途径进行免疫,免疫二次,时间间隔为4周。
A.每一次免疫后的三周采集制备每个组中的免疫血清,并使用SARS-CoV感染的Vero6细胞裂解物作为抗原,用间接ELISA分析了每个组中的免疫血清汇合液。用过氧化物酶偶联的抗小鼠IgG多克隆抗体(NA931V,Amersham)和TMB(KPL)进行可视化后,以产生特定的OD值0.5时的抗体稀释度的倒数计算抗SARS-CoV的抗体效价。
B.评价了免疫血清汇合液对于100 TCID50的SARS-CoV对FRhK-4细胞的感染性的血清中和能力。从1/20开始逐次二倍稀释血清,每个二倍稀释液测试4个孔。根据Reed和Munsch的方法,以可中和4个孔中的两个的感染性的血清稀释度的倒数计算血清中和效价。
-图40描述了重组病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol的构建方法。
A.在麻疹病毒(MV)的Schwarz疫苗株的完整基因组中引入一个附加的转录单位构成麻疹载体(Combredet,2003,Journal of Virology,7711546-11554)。该附加的开放读码框的表达被顺式作用元件所调控,所述顺式作用元件为转录、帽的形成和转基因的多聚腺苷酸化所必需,所述转基因拷贝自存在于N/P接头处的元件。可以在两个不同的载体中插入,所述插入一方面在P(磷蛋白)和M(基质)基因之间,另一方面在H(血凝素)和L(聚合酶)基因之间。
B.麻疹病毒重组基因组MVSchw2-SARS-S和MVSchw2-SARS-Ssol的构建是将S蛋白和Ssol多肽的开放读码框插入到附加的转录单位之中,该附加转录单元位于载体的P和M基因之间。
图中显示了麻疹病毒(MV)的多个基因N(核蛋白)、PVC(V/C磷蛋白和蛋白)、M(基质)、F(融合体)、H(血凝素)、L(聚合酶)。T7=T7RNA聚合酶启动子、hh=锤头核酶、T7t=T7噬菌体RNA聚合酶终止子序列、δ=肝炎δ病毒的核酶、(2),(3)=附加转录单位(ATU)。
MV基因组大小15894个核苷酸。
SP信号肽 TM跨膜区域 FLAGFLAG标记 -图41显示的是使用重组麻疹病毒表达S蛋白的结果,使用了蛋白质免疫印迹法进行分析。
分别用不同传代的病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol和作为对照的野生型MWSchw病毒感染Vero细胞并制备胞质提取物。在SARS-CoV以感染复数3感染Vero E6细胞8小时后也根据Laemmli制备加样缓冲液中的细胞提取物。上述提取物在8%的SDS丙烯酰胺凝胶上分离,并使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。
图中显示了分子量梯度标记(kDa)。
Pn在与293-3-46和Vero细胞共培养后第n代的病毒 SARS-CoV被SARS-CoV感染的Vero E6细胞提取物 模拟物未感染的Vero E6细胞对照提取物。
-图42显示了使用重组麻疹病毒表达S蛋白的结果,使用了免疫荧光法进行分析。
用野生型MWSchw病毒(A)或MVSchw2-SARS-S(B)和MVSchw2-SARS-Ssol(C)病毒感染铺于玻璃载玻片上的单层Vero细胞。当合胞体达到30-40%(A.、B.)或90-100%(C)的汇合率后,将细胞固定、透化并用抗SARS-CoV兔多克隆抗体和FITC(Jackson)偶联的抗兔IgG(H+L)进行标记。
-图43显示的是兔血清针对肽E1-12、E53-76和M2-14的免疫反应性的蛋白质免疫印迹分析结果。编号20047的兔子使用KLH偶联的肽E1-12进行免疫。编号22234和22240的兔子使用KLH偶联的肽E53-76进行免疫。编号20013和20080的兔子使用KLH偶联的肽M2-14进行免疫。使用被SARS-CoV感染的细胞提取物(B)或表达SARS-CoV 031589分离株E蛋白(A)或M蛋白(C)的重组牛痘病毒感染的细胞提取物对免疫血清进行了蛋白质免疫印迹分析。免疫印迹使用过氧化物酶偶联的抗兔IgG(H+L)缀合物(NA934V,Amersham)进行可视化。
E和M蛋白的位置用箭头示出。
图中显示了分子量梯度标记(kDa)。
具体实施例方式 然而应当理解,给出的这些实施例仅仅是出于说明本发明主题的意图,而不以任何方式构成限制。
实施例1得自记录号为031589的样本的SARS-CoV病毒株基因组的克隆和测序 在河内(越南)的法国医院对一名SARS患者进行支气管肺泡灌洗,并在这个被记录为031589的灌洗液样本中提取SARS-CoV病毒株的RNA。
分离的RNA被用作扩增模板,以扩增对应于基因组不同开放读码框(ORF1a、ORF1b、ORF-S、ORF-E、ORF-M、ORF-N(包括ORF-13和ORF-14)、ORF3、ORF4、ORF7至ORF11)及非编码5’和3’端的cDNA。用于扩增/检测的引物和探针的序列基于可获得的SARS-CoV核苷酸序列决定。
在下文中,引物和探针定义如下字母S,后面跟有表示基因组相应区域的字母(L为包括ORF1a和ORF1b的5’端;S、M和N为ORF-S、ORF-M、ORF-N,SE和MN为相应的基因间区域),然后任选地跟有Fn、Rn,n为1至6之间,对应用于巢式PCR的引物(F1+R1为第一扩增引物对,F2+R2为第二扩增引物对,以此类推),然后后面跟有/+/或/-/对应正义或反义引物,最后面跟有参考Genbank序列AY27411.3的引物位置;仅对于正义和反义的S和N引物及其他正义引物,当示出了一个单独位置时,其对应的是约20个碱基的探针或引物的5’端的位置;对于S和N引物以外的反义引物,当示出了一个单独位置时,其对应的是约20个碱基的探针或引物的3’端的位置。
这样产生的扩增产物使用特异性引物测序以测定得自被记录为031589的样本的SARS-CoV病毒株基因组的完整序列。这些扩增产物除了对应于ORF1a和ORF1b的以外,其余的随后被克隆至表达载体中用于产生相应的病毒蛋白和针对这些蛋白的抗体,具体而言是通过基于DNA的免疫。
1.RNA的提取 根据厂商的推荐,使用QIamp病毒RNA提取微型试剂盒(QIAGEN)来提取RNA。更具体的过程如下将140μl样品和560μl AVL缓冲液剧烈混合15秒,在室温下培养10分钟,然后用最高速度短暂离心。在上清液中加入560μl的100%乙醇,将这样得到的混合物剧烈搅拌15秒。然后将630μl的混合物装于柱上。
将柱置于2ml管内,8000转/分离心1分钟,然后将剩余的上述混合物装于同一根柱上,再8000转/分离心1分钟,将柱转移至干净的2ml管内。接下来将500μl的AW1缓冲液加在柱上,8000转/分离心1分钟并弃去洗出液。将500μl的AW2缓冲液加在柱上,14000转/分离心3分钟,将柱转移至1.5ml管内。最后将60μl的AVE缓冲液加在柱上,室温下培养1至2分钟,然后8000转/分离心1分钟。收集对应于纯化的RNA的洗出液并于-20℃冻存。
2.cDNA的扩增、测序和克隆 2.1)编码S蛋白的cDNA 将从样本中提取的RNA进行反转录,所述反转录使用随机序列的六聚寡核苷酸(pdN6)以产生cDNA片段。
编码SARS-CoV的S糖蛋白的序列被扩增为两个重叠的DNA片段形式5’片段(SARS-Sa,SEQ ID No5)和3’片段(SARS-Sb,SEQ IDNo6),它们由使用巢式引物的两个连续的扩增得来。这样得到的扩增子被测序并克隆至PCR质粒载体2.1-TOPOTM(INVITROGEN)中,然后测定了克隆cDNA的序列。
a)Sa和Sb片段的克隆和测序 a.1)cDNA的合成 反应混合物包括RNA(5μl)、注射用H2O(3.5μl)、5×反转录酶缓冲液(4μl)、5mM dNTP(2μl)、pdN6 100μg/ml(4μl)、核糖核酸酶抑制剂(Rnasin)40IU/μl(0.5μl)和反转录酶AMV-RT10IU/μl,PROMEGA(1μl),将上述混合物置于热循环器中按以下条件培养42℃45分钟、55℃15分钟、95℃5分钟,然后将获得的cDNA保存于+4℃。
a.2)第一次PCR扩增 S基因的5’和3’端分别使用引物对S/F1/+/21350-21372和S/R1/-/23518-23498,S/F3/+/23258-23277和S/R3/-/25382-25363进行扩增。50μl的反应混合物包括cDNA(2μl)、50μM引物(0.5μl)、10×缓冲液(5μl)、5mM dNTP(2μl)、Taq高保真扩增酶Roche(0.75μl)和H2O(39.75μl),将上述混合物置于热循环器中按以下条件进行扩增第一步是94℃变性2分钟,然后是包括以下步骤的40个循环94℃变性30秒、55℃退火30秒、72℃延伸2分30秒、每循环再额外延伸10秒,最后一步的延伸是72℃5分钟。
a.3)第二次PCR扩增 将第一次PCR扩增的产物进行第二次PCR扩增(巢式PCR),第二次扩增的条件与第一次相同,分别使用引物对S/F2/+/21406-21426和S/R2/-/23454-23435,S/F4/+/23322-23341和S/R4/-/25348-25329扩增5’扩增子和3’扩增子。
a.4)Sa和Sb片段的克隆和测序 将这样获得的Sa(5’端)和Sb(3’端)扩增子根据厂商的说明书,使用QIAquick PCR纯化试剂盒进行纯化,然后将它们克隆至载体PCR2.1-TOPO(INVITROGEN试剂盒)中,以获得称为SARS-S1和SARS-S2的质粒。
分离Sa和Sb克隆的DNA,对相应的插入物进行测序,根据厂商说明书,测序使用了Big Dye试剂盒、Applied Biosystem_和M13正向和M13反向通用引物以及如下引物S/S/+/21867、S/S/+/22353、S/S/+/22811、S/S/+/23754、S/S/+/24207、S/S/+/24699、S/S/+/24348、S/S/-/24209、S/S/-/23630、S/S/-/23038、S/S/-/22454、S/S/-/21815、S/S/-/24784、S/S/+/21556、S/S/+/23130和S/S/+/24465;这样获得的Sa和Sb片段的序列对应于作为附件的序列表中的SEQ ID No5和SEQ ID No6的序列。
称为SARS-S1的质粒,保藏于法国微生物保藏中心,日期为2003年5月12日,编号为No.I-3020;该质粒包含上述源自记录为No.031589的样本的SARS-CoV病毒株的S基因序列的5’端片段,参照Genbank序列AY274119.3 Tor2,所述称为Sa的片段对应于21406至23454(SEQID No5)位置的核苷酸。
称为TOP10F’-SARS-S2的质粒,保藏于法国微生物保藏中心,日期为2003年5月12日,编号No.I-3019;该质粒包含上述源自记录为No.031589的样本的SARS-CoV病毒株的S基因序列的3’端片段,参照Genbank序列编号AY274119.3,所述称为Sb的片段对应于23322至25348(SEQ ID No6)位置的核苷酸。
b)完整cDNA(4kb的SARS-S克隆)的克隆和测序 通过下述方式从上述的SARS-S1和SARS-S2克隆中得到了完整的ScDNA 1)使用上述引物S/R4/-/25348-25329和引物S/S/+/24696-24715对SARS-S2克隆进行PCR扩增反应得到一个633bp的扩增子, 2)使用上述引物S/F4/+/23322-23341和引物S/S/-/24803-24784对另一个SARS-S2克隆进行另一次PCR扩增反应得到一个1481bp的扩增子。
该扩增反应在上述的扩增Sa和Sb片段反应的条件下进行,与前述反应不同的是要进行包括94℃变性20秒、72℃延伸2分30秒的30个扩增循环。
3)上述两个扩增子(633bp和1481bp)按上述的纯化Sa和Sb片段的条件进行纯化。
4)对3)中得到的纯化扩增子进行又一次的PCR扩增反应,该反应使用上述引物S/F4/+/23322-23341和S/R4/-/25348-25329。该扩增反应在上述的扩增Sa和Sb片段反应的条件下进行,与前述反应不同的是进行30个扩增循环。
将这样得到的2026bp的扩增子纯化后克隆至载体PCR2.1-TOPO中,然后使用上述的Sa和Sb片段测序所用的引物按上述方法进行测序。如此获得的克隆称为克隆3’。
5)将上面得到的SARS-S1克隆和克隆3’用EcoR I进行消化,所得的约2kb的条带在凝胶纯化后对其进行PCR扩增,所述扩增使用上述的引物S/F2/+/21406-21426和S/R4/-/25348-25329。该扩增反应在上述的扩增Sa和Sb片段反应的条件下进行,与前述反应不同的是进行30个扩增循环。大约4kb的扩增子被纯化和测序。然后将该扩增子克隆至载体PCR2.1-TOPO中以得到称为SARS-S的质粒,在此质粒中包含的插入物使用上述的Sa和Sb片段测序所用的引物按上述方法测序。该插入物的cDNA序列和编码S蛋白的扩增子的cDNA序列分别对应于作为附件的序列表中的SEQ ID No4和SEQ ID No2的序列,它们编码S蛋白(SEQ ID No3)。
对应于编码源自记录为No.031589的样本的SARS-CoV病毒株的S蛋白的cDNA的扩增子的序列分别与Tor2和Urbani分离株的相应序列相比,有下述两处突变,突变的位置参照Tor2分离株的完整基因组序列(Genbank AY274119.3)示出 -23220位置的g/t;Tor2的S蛋白的氨基酸序列中577位置的丙氨酸密码子(gct)替换为丝氨酸密码子(tct), -24872位置的c/t;这一突变不改变S蛋白的氨基酸序列,及 称为SARS-S的质粒,保藏于法国微生物保藏中心,日期为2003年6月20日,编号为No.I-3059;该质粒包含编码源自记录为No.031589的样本的SARS-CoV病毒株的S蛋白的cDNA序列,参照Genbank序列AY274119.3,所述序列对应于21406至25348(SEQ ID No4)位置的核苷酸。
2.2)编码M和E蛋白的cDNA 将源自样本031589的以上述方法提取的RNA进行反转录,该反转录反应在相同步骤中(Titan One Step RT-PCR_试剂盒,Roche)结合了PCR扩增反应,并使用了如下引物对 -S/E/F1/+/26051-26070和S/E/R1/-/26455-26436以扩增ORF-E,及 -S/M/F1/+/26225-26244和S/M/R1/-/27148-27129以扩增ORF-M。
第一反应混合物包括8.6μl的注射用H2O、1μl的dNTP(5mM)、0.2μl的每种引物(50μM)、1.25μl的DTT(100mM)和0.25μl的核糖核酸酶抑制剂(40IU/μl),第二反应混合物包括1μl的RNA、7μl的注射用H2O、5μl的5×RT-PCR缓冲液和0.5μl的酶混合物,将这两种反应混合物再混合并置于热循环器中按以下条件培养先是42℃30分钟、55℃10分钟、94℃2分钟,然后是包括以下步骤的40个循环94℃变性10秒、55℃退火30秒、68℃延伸45秒、每循环再额外增加3秒,最后一步的末端延伸68℃7分钟。
将这样获得的扩增的产物(M和E扩增子)进行第二次PCR扩增(巢式PCR),第二次扩增使用了Expand High-Fi_试剂盒(Roche),并使用如下引物对 -对于E扩增子,为S/E/F2/+/26082-26101和S/E/R2/-/26413-26394,以及 -对于M扩增子,为S/M/F2/+/26330-26350和S/M/R2/-/27098-27078。
反应混合物包括2μl的第一次PCR产物、39.25μl的注射用H2O、5μl含MgCl2的10×缓冲液、2μl的dNTP(5mM)、0.5μl的每种引物(50μM)和0.75μl的酶混合物,将上述混合物置于热循环器中按以下条件培养第一步94℃变性2分钟,然后是包括以下步骤的30个循环94℃变性15秒、60℃退火30秒、72℃延伸45秒、每循环再额外增加3秒,最后一步的末端延伸是72℃7分钟。得到的对应编码E和M蛋白的cDNA扩增产物按照上述方法并使用以下引物进行测序上述的S/E/F2/+/26082、S/E/R2/-/26394、S/M/F2/+/26330和S/M/R2/-/27078,以及引物S/M/+/26636-26655和S/M/-/26567-26548。然后将它们按照上述方法克隆并得到称为SARS-E和SARS-M的质粒。分离这些克隆的DNA并对其进行了测序,所述测序使用了M13正向和M13反向通用引物和上述的S/M/+/26636和S/M/-/26548引物。
代表编码上述源自记录为No.031589的样本的SARS-CoV病毒株的E蛋白(SEQ ID No13)的cDNA的扩增子的序列相对于AY274119.3-Tor2和AY278741-Urbani分离株的相应序列没有差异。SARS-CoV的031589病毒株的E蛋白序列对应于作为附件的序列表中的SEQ ID No14序列。
称为SARS-E的质粒,保藏于法国微生物保藏中心,日期2003年5月28日,编号No.I-3046,该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的E蛋白的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26082至26413(SEQ ID No15)位置的核苷酸。
代表编码上述源自记录为No.031589的样本的SARS-CoV病毒株的M蛋白(SEQ ID No16)的cDNA的扩增子的序列相对于AY274119.3-Tor2分离株的相应序列没有差异。但是,在26857位置上,AY278741-Urbani分离株包含一个c而源自记录为No.031589的样本的SARS-CoV病毒株的序列却包含了一个t。这一突变导致了相应蛋白质的氨基酸序列的改变在源自记录为No.031589的样本的SARS-CoV病毒株氨基酸序列的154位置上,脯氨酸(AY278741-Urbani)变成了丝氨酸。源自记录为No.031589的样本的SARS-CoV病毒株的M蛋白序列对应于作为附件的序列表中的SEQ ID No17序列。
称为SARS-M的质粒,保藏于法国微生物保藏中心,日期2003年5月28日,编号No.I-3047;该质粒包含编码上述源自记录为No.031589的样本的SARS-CoV病毒株的M蛋白的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26330至27098(SEQ ID No18)位置的核苷酸。
2.3)对应于ORF3、ORF4、ORF7至ORF11的cDNA 使用同上的扩增、克隆和测序策略来获得分别对应下述ORF的cDNA片段ORF3、ORF4、ORF7、ORF8、ORF9、ORF10和ORF11。第一次扩增使用的引物对为 -ORF3和ORF4S/SE/F1/+/25069-25088和S/SE/R1/-/26300-26281 -ORF7至ORF11S/MN/F1/+/26898-26917和S/MN/R1/-/28287-28266 第二次扩增使用的引物对为 -ORF3和ORF4S/SE/F2/+/25110-25129和S/SE/R2/-/26244-26225 -ORF7至ORF11S/MN/F2/+/26977-26996和S/MN/R2/-/28218-28199 第一次扩增(RT-PCR)的条件如下先是42℃45分钟、55℃10分钟、94℃2分钟,然后是包括以下步骤的40个循环94℃变性15秒、58℃退火30秒、68℃延伸1分钟、每循环再额外增加5秒,最后一步的末端延伸68℃7分钟。
巢式PCR的条件如下第一步94℃变性2分钟,然后是包括以下步骤的40个循环94℃变性20秒、58℃退火30秒、72℃延伸50秒、每循环再额外增加4秒,最后一步的末端延伸是72℃7分钟。
所获得的对应于分别包括ORF3和ORF4和ORF7至ORF11的cDNA的扩增产物使用如下引物测序S/SE/+/25363、S/SE/+/25835、S/SE/-/25494、S/SE/-/25875、S/MN/+/27839、S/MN/+/27409、S/MN/-/27836、S/MN/-/27799,扩增产物以上述的克隆其他OFR的方法进行克隆,以得到称为SARS-SE和SARS-MN的质粒。分离这些克隆的DNA并进行了测序,所述测序使用同样的上述引物及M13正义和M13反义通用引物。
代表包括上述源自记录为No.031589的样本的SARS-CoV病毒株的ORF3和ORF4(SEQ ID No7)区域的cDNA的扩增子的序列相对于AY274119-Tor2分离株的相应序列有一个核苷酸的差异。这个在25298位置的突变导致了相应蛋白质(ORF3)氨基酸序列的改变在源自记录为No.031589的样本的SARS-CoV病毒株氨基酸序列的11位置上,精氨酸(AY274119-Tor2)变成了甘氨酸。但是,与AY278741-Urbani分离株的相应序列相比没有发现突变。源自No.031589的样本的SARS-CoV病毒株的ORF3和4的序列分别对应于作为附件的序列表中的SEQ ID No10和12序列。
称为SARS-SE的质粒,保藏于法国微生物保藏中心,日期2003年11月13日,编号No.I-3126;该质粒包含对应于上述源自No.031589记录的样本的SARS-CoV病毒株的位于ORF-S和ORF-E之间并与ORF-E相重叠的区域的cDNA,参照Genbank序列编号AY274119.3,所述区域对应于25110至26244(SEQ ID No8)位置的核苷酸, 代表对应于包括上述源自记录为No.031589的样本的SARS-CoV病毒株的ORF7至ORF11(SEQ ID No19)区域的cDNA的扩增子的序列相对于AY274119-Tor2和AY278741-Urbani分离株的相应序列没有差异。源自No.031589的样本的SARS-CoV病毒株的ORF7至ORF11序列分别对应于作为附件的序列表中的SEQ ID No22、24、26、28和30序列。
称为SARS-MN的质粒,保藏于法国微生物保藏中心,日期2003年11月13日,编号No.I-3125;该质粒包含对应于上述采自河内的记录为No.031589的样本的SARS-CoV病毒株的位于ORF-M和ORF-N之间的区域的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于26977至28218(SEQ ID No20)位置的核苷酸。
代表对应于包括上述源自记录为No.031589的样本的SARS-CoV病毒株的ORF7至ORF11(SEQ ID No19)区域的cDNA的扩增子的序列相对于AY274119-Tor2和AY278741-Urbani分离株的相应序列没有差异。源自No.031589的样本的SARS-CoV病毒株的ORF7至ORF11序列分别对应于作为附件的序列表中的SEQ ID No22、24、26、28和30序列。
2.4)编码N蛋白并且包括ORF13和ORF14的cDNA cDNA的合成和扩增使用上述Sa和Sb片段的类似方法。更具体而言,反应混合物包括5μl的RNA、5μl注射用H2O、4μl的5×反转录酶缓冲液、2μl的dNTP(5mM)、2μl的寡核苷酸20T(5μM)、0.5μl的核糖核酸酶抑制剂(40IU/μl)和1.5μl的AMV-RT(10IU/μl,Promega),将上述混合物置于热循环器中按照下述条件培养42℃45分钟、55℃15分钟、95℃5分钟,然后置于+4℃保存。
第一次PCR扩增使用引物对S/N/F3/+/28023和S/N/R3/-/29480进行。
将上述的用于扩增S1和S2片段的反应混合物置于热循环器中并按照下述条件培养第一步94℃变性2分钟,然后是包括以下步骤的40个循环94℃变性20秒、55℃退火30秒、72℃延伸1分30秒、每循环再额外延伸10秒,最后一步的延伸是72℃5分钟。
将第一次PCR扩增得到的扩增子进行第二次PCR扩增步骤(巢式PCR),第二次扩增使用引物对S/N/F4/+/28054和S/N/R4/-/29430,反应条件与第一次扩增相同。
得到的对应于编码源自No.031589的样本的SARS-CoV病毒株的N蛋白的cDNA扩增产物使用以下引物进行测序S/N/F4/+/28054、S/N/R4/-/29430、S/N/+/28468、S/N/+/28918和S/N/-/28607,将它们按照上述克隆其它ORF的方法克隆,得到称为SARS-N的质粒。分离这些克隆的DNA并对其进行了测序,所述测序使用了M13正义和M13反义通用引物和S/N/+/28468、S/N/+/28918和S/N/-/28607引物。
代表对应于源自No.031589的样本的SARS-CoV病毒株的ORF-N和包括ORF13和ORF14(SEQ ID No36)的cDNA的扩增子的序列相对于AY274119.3-Tor2和AY278741-Urbani分离株的相应序列没有差异。源自No.031589的样本的SARS-CoV病毒株的N蛋白序列对应于作为附件的序列表中的SEQID No37序列。
源自No.031589的样本的SARS-CoV病毒株的ORF13和ORF14序列分别对应于作为附件的序列表中的SEQ ID No32和34序列。
称为SARS-N的质粒,保藏于法国微生物保藏中心,日期2003年6月5日,编号No.I-3048;该质粒包含编码上述源自No.031589的样本的SARS-CoV病毒株的N蛋白的cDNA,参照Genbank序列编号AY274119.3,所述序列对应于28054至29430(SEQ ID No38)位置的核苷酸。
2.5)非编码5’和3’端 a)非编码5’端(5’NC) a1)cDNA的合成 对按上述方法提取的源自样本031589的RNA进行按下述条件的反转录 将RNA(15μl)和引物S/L/-/443(3μl,浓度为5μM)置于75℃培养10分钟。
接着加入5×反转录酶缓冲液(6μl,INVITROGEN)、10mM dNTP(1μl)、0.1M DTT(3μl),将混合物置于50℃培养3分钟。
最后将反转录酶(3μl的Superscript_,INVITROGEN)加入先前的混合物中在50℃培养1小时30分钟,然后在90℃培养2分钟。
将这样获得的cDNA根据厂商的推荐,使用QIAquick PCR纯化试剂盒(QIAGEN)进行纯化。
a2)末端转移酶反应(TdT) 将cDNA(10μl)于100℃培养2分钟,冰上储存,然后加入下列物质H2O(2.5μl)、5×TdT缓冲液(4μl,AMERSHAM)、5Mm dATP(2μl)和TdT(1.5μl,AMERSHAM)。这样得到的混合物于37℃培养45分钟然后于65℃培养2分钟。
所得产物通过第一次PCR反应扩增,所述扩增使用的引物是S/L/-/225-206和锚定引物14T5’-AGATGAATTCGGTACCTTTTTTTTTTTTTT-3’(SEQ ID No68)。扩增条件如下第一步94℃变性2分钟,然后是包括以下步骤的10个循环94℃变性10秒、45℃退火30秒、72℃延伸30秒,再然后是包括以下步骤的30个循环94℃变性10秒、50℃退火30秒、72℃延伸30秒,最后一步的延伸是72℃5分钟。
将第一次PCR扩增的产物进行第二次扩增步骤,第二次扩增使用引物S/L/-/204-185和上述的锚定引物14T,反应条件与第一次扩增相同。所得扩增子经纯化后使用引物S/L/-/182-163进行测序,它们按照上述克隆不同ORF的方法被克隆,得到称为SARS-5’NC的质粒。分离该克隆的DNA并对其进行了测序,所述测序使用了M13正义和M13反义通用引物和上述的S/L/-/182-163引物。
代表对应于源自记录为No.031589的样本的SARS-CoV病毒株的5’NC端的cDNA的扩增子对应于作为附件的序列表中的SEQ ID No72序列。这一序列相对于AY274119.3-Tor2和AY278741-Urbani分离株的相应序列没有差异。
称为SARS-5’NC的质粒,保藏于法国微生物保藏中心,日期2003年11月7日,编号No.I-3124;该质粒包含对应于上述源自记录为No.031589的样本的SARS-CoV病毒株的基因组的非编码5’端的cDNA,参照Genbank序列编号AY274119.3,所述序列对应于1至204(SEQ ID No39)位置的核苷酸, b)非编码3’端(3’NC) b1)cDNA的合成 将按上述方法提取的源自样本031589的RNA进行按下述操作的反转录反应混合物包括RNA(5μl)、H2O(5μl)、5×反转录酶缓冲液(4μl)、5mM dNTP(2μl)、5μM寡核苷酸20T(2μl)、40IU/μl的核糖核酸酶抑制剂(0.5μl)和10IU/μl的RT-AMV(1.5μl,PROMEGA),将上述混合物置于热循环器中按照下述条件培养42℃45分钟、55℃15分钟、95℃5分钟,然后置于+4℃保存。
所得的cDNA通过第一次PCR反应扩增,所述扩增使用的引物是S/N/+/28468-28487和上述的锚定引物14T。扩增条件如下先是94℃2分钟的初始变性步骤,然后是包括以下步骤的10个循环94℃变性20秒、45℃退火30秒、72℃延伸50秒,再然后是包括以下步骤的30个循环94℃变性20秒、50℃退火30秒、72℃延伸50秒,最后一步的延伸是72℃5分钟。
将第一次PCR扩增的产物进行第二次扩增步骤,第二次扩增使用引物S/N/+/28933-28952和上述的锚定引物14T,反应条件与第一次扩增相同。所得扩增子经纯化后使用引物S/N/+/29257-29278进行测序,它们按照上述克隆不同ORF的方法被克隆,得到称为SARS-3’NC的质粒。分离这些克隆的DNA并对其进行了测序,所述测序使用了M13正义和M13反义通用引物和上述的S/N/+/29257-29278引物。
代表对应于源自记录为No.031589的样本的SARS-CoV病毒株的3’NC端的cDNA的扩增子对应于作为附件的序列表中的SEQ ID No73序列。这一序列相对于AY274119.3-Tor2和AY278741-Urbani分离株的相应序列没有差异。
称为SARS-3’NC的质粒,保藏于法国微生物保藏中心,日期2003年11月7日,编号No.I-3123;该质粒包含对应于上述源自记录为No.031589的样本的SARS-CoV病毒株的基因组的非编码3’端的cDNA序列,参照Genbank序列编号AY274119.3,所述序列对应于位于28933至29727(SEQ ID No40)之间的位置的核苷酸,结尾是一系列的核苷酸a。
2.6)ORF1a和ORF1b 对包括源自031589样本的SARS-CoV基因组的ORF1a和ORF1b的5’区域的扩增使用了与上述扩增其它ORF的相同原理的RT-PCR反应及随后的巢式PCR。扩增片段有十分之几的碱基的重叠,这样可以用计算机重新构建这部分基因组的完整序列。平均而言,扩增片段有二千个碱基。
14个被称为L0至L12的重叠片段应用以下的引物扩增 表II用于扩增5,区域(ORF1a知ORF1b)的引物 除了L0片段按照上述的ORF-M的条件扩增以外,其余所有片段按照下述条件扩增-RT-PCR42℃30分钟、55℃15分钟、94℃2分钟,然后将所得cDNA以下述条件扩增包括以下步骤的40个循环94℃变性15秒、58℃退火30秒、68℃延伸1分30秒、每循环再额外增加5秒,最后一步的延伸是68℃7分钟。
-巢式PCR第一步94℃变性2分钟,然后是包括以下步骤的35个循环94℃变性15秒、60℃退火30秒、72℃延伸1分30秒、每循环再额外延伸5秒,最后一步的延伸是72℃7分钟。
扩增产物使用在下面的表III中定义的引物进行测序 表III用于5’区(ORF1a和ORF1b)测序的引物 源自记录为No.031589的样本的SARS-CoV病毒株的L0至L12片段的序列分别对应于作为附件的序列表中的SEQ ID No41至SEQ ID No54序列。这些序列中,只有对应于L5片段的序列相对于AY278741-Urbani分离株的相应序列包括一个核苷酸的差异。这个位于7919位置的t/c突变导致了由ORF1a编码的相应蛋白氨基酸序列的改变在2552位置上,缬氨酸(gtt密码子,AY278741)在SARS-CoV的031589病毒株中变成了丙氨酸(gct密码子)。然而,没有发现相对于AY274119.3-Urbani分离株的相应序列的突变。其它片段相对于Tor2和Urbani分离株的相应序列没有显示出差异。
实施例2源自记录为No.031589的样本的SARS-CoV病毒株的重组N蛋白和S蛋白的生产和纯化 在大肠杆菌中生产了源自记录为No.031589的样本的SARS-CoV病毒株的完整N蛋白和S蛋白的两个多肽片段,所述蛋白和片段是以包括N端或C端的多组氨酸标签的融合蛋白的形式产生。在这两个S多肽中,S蛋白N端和C端的疏水序列(信号肽1至13位置和跨膜螺旋1196至1218位置)缺失而S蛋白的β螺旋(565至687位置)和卷曲螺旋型的两个基序(895至980位置和1155至1186位置)都被保留。这两个多肽由下列部分构成对应于S蛋白氨基酸序列的14至1193位置的一个长片段(SL)和对应于S蛋白氨基酸序列的475至1193位置的一个短片段(SC)。
1)将N、SL和SC的cDNA克隆至表达载体pIVEX2.3和pIVEX2.4内 对应于N蛋白、SL和SC片段的cDNA通过在标准条件下的PCR进行扩增,所述扩增使用了DNA聚合酶Platinum pfx_(INVITROGEN)。使用质粒SARS-N和SARS-S作为模板和下述寡核苷酸作为引物 5’-CCCATATGTCTGATAATGGACCCCAATCAAAC-3’(N正义引物,SEQID NO55) 5’-CCCCCGGGTGCCTGAGTTGAATCAGCAGAAGC-3’(N反义引物,SEQID NO56) 5’-CCCATATGAGTGACCTTGACCGGTGCACCAC-3’(SC正义引物,SEQ IDNO57) 5’-CCCATATGAAACCTTGCACCCCACCTGCTC-3’(SL正义引物,SEQ IDNO58) 5’-CCCCCGGGTTTAATATATTGCTCATATTTTCCC-3’(SC和SL反义引物,Seq ID NO29) 正义引物中引入了一个NdeI酶切位点(下划线部分)而反义引物中引入了一个Xam I或Sma I酶切位点(下划线部分)。这3个扩增产物经过柱纯化(QIAquick PCR纯化试剂盒,QIAGEN)后被克隆至合适的载体内。从这3个构建体中纯化(QIAFilter Midi Plasmid试剂盒,QIAGEN)的质粒DNA通过测序验证后用酶Nde I和Xam I消化。分别将对应于N、SL和SC的cDNA的3个片段在琼脂糖凝胶上纯化,然后插入到预先被同样的酶消化好的pIVEX2.3MCS(C端多组氨酸标签)和pIVEX2.4d(N端多组氨酸标签)质粒中。在经过对构建体的验证后,这样获得的6个表达载体(pIV2.3N、pIV2.3SC、pIV2.3SL、pIV2.4N、pIV2.4SC(也被称为pIV2.4S1)、pIV2.4SL)一方面用于测试体外的蛋白质表达,另一方面用于转化细菌菌株BL21(DE3)pDIA17(NOVAGEN)。这些构建体编码的蛋白质的预期分子量如下pIV2.3N(47174Da)、pIV2.3SC(82897Da)、pIV2.3SL(132056Da)、pIV2.4N(48996Da)、pIV2.4S1(81076Da)、pIV2.4SL(133877Da)。用pIV2.3N转化的菌株保藏于CNCM,日期2003年10月23日,编号I-3117,用pIV2.4S1转化的菌株保藏于CNCM,日期2003年10月23日,编号I-3118。
2)重组蛋白在体外和体内的表达的分析 首先在体外系统(RTS100,Roche)中测试了这6个重组载体的重组蛋白的表达。在RTS100系统中于30℃培养重组载体pIVEX 4小时后体外产生的蛋白质使用蛋白质免疫印迹法进行分析,所述蛋白质免疫印迹法使用的是过氧化物酶偶联的抗(his)6抗体。体外表达的结果(图1)显示无论多组氨酸标签在N端或C端位置,都仅有N蛋白获得大量的表达。第二步,在体内检测了N和S蛋白的表达,所述检测在30℃、LB培养基、存在或不存在诱导剂(1mM IPTG)的条件下进行。N蛋白在这个细菌系统中的表达很好(图2),而且在细菌裂解后主要为可溶部分。相反地,S蛋白的长片段(SL)表达很弱并且完全不可溶(图3)。短片段(SC)显示的溶解性也很差,但是其表达水平比长片段高的多。此外在C端位置融合了多组氨酸标签的SC构建体的大小比预期的要小。使用抗多组氨酸抗体的免疫检测实验显示该构建体是不完整的。总之,选择表达C端融合多组氨酸标签的完整N蛋白的pIV2.3N构建体和表达N端融合多组氨酸标签的短S蛋白的pIV2.4S1构建体来大量产生这两种蛋白以便纯化它们。质粒pIV2.3N和pIV2.4S1于2003年10月23日保藏于CNCM,编号分别是I-3117和I-3118。
3)重组蛋白质抗原活性的分析 使用蛋白质免疫印迹法测试了N、SL和SC蛋白的抗原活性,所述蛋白质免疫分析使用了从同一个感染SARS-CoV的患者,在其出现SARS症状后8天(M12)和29天(M13)采集的两种血清样本。实验步骤描述于实施例3。结果显示于图4中,(i)为患者的血清转变,(ii)显示N蛋白具有比短S蛋白高的抗原反应性。
4)来自pIV2.3N的N蛋白的纯化 按照下述步骤进行了一些纯化由载体pIV2.3N产生的N蛋白的实验。将用表达载体pIV2.3N转化的BL21(DE3)pDIA17细菌置于含0.1mg/ml氨苄青霉素的1升培养基中在30℃培养,当细胞密度相当于A600=0.8时(约3小时)用1mM的IPTG诱导,在诱导剂存在下培养2小时后,离心收集细胞(5000rpm,10分钟)并在裂解缓冲液(50mM NaH2PO4、0.3M NaCl、20mM咪唑、pH8、含有蛋白酶抑制剂混合物Complete_,Roche)中重悬,并用弗氏压碎器(12000psi)裂解细胞。将细菌裂解物离心(12000rpm,15分钟)后,将上清液(50ml)以1ml/min的流速装入以裂解缓冲液平衡好的金属螯合柱(15ml)(Ni-NTA superflow,Qiagen)上。在用200ml的裂解缓冲液洗涤柱后,用10倍柱体积的咪唑梯度(20→250mM)洗脱N蛋白。收集包括N蛋白的组分并用变性条件下的聚丙烯酰胺凝胶电泳及考马斯亮兰染色进行分析。结果显示于图5,该结果显示用这种步骤可以纯化N蛋白质至满意的纯度(95%),并且平均产率为每升培养液15mg蛋白。
5)来自pIV2.4SC(pIV2.4S1)的SC蛋白的纯化 下述纯化短S蛋白的步骤与上述的纯化步骤有很大差异,因为这种蛋白在细菌系统中高度聚集(包含体)。将用表达载体pIV2.4S1转化的BL21(DE3)pDIA17细菌置于含0.1mg/ml氨苄青霉素的1升培养基中在30℃培养,当细胞密度相当于A600=0.8时(约3小时)用1mM的IPTG诱导,在诱导剂存在下培养2小时后,离心收集细胞(5000rpm,10分钟)并在裂解缓冲液(0.1M Tris-HCl、1mM EDTA、pH7.5)中重悬,并用弗氏压碎器(1200psi)裂解细胞。将细菌裂解物离心(12000rpm,15分钟)后,将片状沉淀在含2%Triton X-100和10mM β-巯基乙醇的裂解缓冲液中重悬,然后以12000rpm离心20分钟。再将片状沉淀在含7M尿素的10mM Tris-HCl缓冲液中重悬,并在室温下温和搅拌30分钟。最后一步用7M的尿素洗涤包含体的步骤是必需的,这样可以除去大部分的与聚集的SC蛋白共沉淀的大肠杆菌膜蛋白。最后以12000rpm离心20分钟,将最后的片状沉淀在10mM Tris-HCl缓冲液中重悬。制备物的电泳分析结果(图6)显示短S蛋白被从包含体(不溶性提取物)中纯化至满意的纯度(约90%)。
实施例3N蛋白的免疫显性 通过在下述条件下进行的蛋白质免疫印迹法,分析了由SARS相关联冠状病毒(SARS-CoV)引起的非典型肺炎病人血清中存在的抗体对于这种病毒的各种蛋白的反应性。
1)材料 a)被SARS-CoV感染的细胞的裂解物 用SARS-CoV(记录号为FFM/MA104的分离株)以10-1或10-2的感染复数(M.O.I.)感染Vero E6细胞(2×106),将细胞置于含2%FCS的DMEM培养基中,在35℃、5%CO2的条件下培养。培养48小时后,用PBS洗涤细胞层并用500μl的根据Laemmli方法制备的含β-巯基乙醇的加样缓冲液裂解细胞。将样品煮沸10分钟,并用超声处理3次,每次20秒。
b)抗体 b1)非典型肺炎患者的血清 以法国国家流感病毒文献中心(北方区域)的No.20033168文献命名的血清来自一个法国的由SARS-CoV引起的非典型肺炎病人,血清采集于出现症状后的38天。SARS-CoV感染的诊断通过巢式PCR和定量PCR进行。
b2)针对N蛋白或S蛋白的单特异性兔多克隆抗体血清 血清以重组N蛋白和SC蛋白(实施例2),根据实施例4中描述的免疫方法生产;它们为兔P13097血清(抗N蛋白血清)和兔P11135血清(抗S蛋白血清)。
2)方法 将20μl的被SARS-CoV以10-1和10-2的感染复数感染的细胞的裂解物和20μl作为对照的未感染细胞(模拟物)的裂解物在10%SDS聚丙烯酰胺凝胶上分离,然后转至硝酸纤维素膜上。在用含5%奶、0.1%Tween的PBS溶液封闭并用含0.1%Tween的PBS洗涤之后,用此膜在4℃与下列血清杂交过夜(i)在含1%BSA和0.1%Tween的PBS缓冲液中稀释至1/300、1/1000和1/3000的No.20033168免疫血清,(ii)在同样的缓冲液中稀释至1/50000的兔P13097血清(抗N蛋白血清),和(iii)在同样的缓冲液中稀释至1/10000的兔P11135血清(抗S蛋白血清)。在用PBS/Tween洗涤之后进行第二次杂交,第二次杂交使用过氧化物酶偶联的针对人G免疫球蛋白重链和轻链的绵羊多克隆抗体(NA933V,Amersham),或使用过氧化物酶偶联的针对兔G免疫球蛋白重链和轻链的驴多克隆抗体(NA934V,Amersham)。结合抗体的可视化使用了ECL+试剂盒(Amersham)和Hyperfilm MP放射自显影胶片(Amersham)。图中显示了分子量梯度标记(kDa)。
3)结果 图7显示,在SARS-CoV感染的细胞的提取物中,特异性地检出了表观分子量为35、55和200kDa的三种多肽。
为鉴定这几种多肽,使用特异性针对核蛋白N(兔P13097,图8A)和刺蛋白S(兔P11135、图8B)的兔多克隆抗体,在同一样本上和同样条件下制备了另外两个免疫印迹(图8)。这一实验显示该200kDa的多肽对应SARS-CoV的刺糖蛋白S,该55kDa的多肽对应核蛋白N而该35kDa的多肽可能表示N蛋白的被截短或降解的形式。
因此,图7中的数据显示20033168血清与N蛋白强烈反应而与SARS-CoV的S蛋白的反应要弱得多,因为使用1/300、1/1000和1/3000稀释的免疫血清可以使35和55kDa的多肽显示为强的条带,而200kDa的多肽仅在血清1/300稀释时微弱可见。还可以注意到在20033168血清的稀释度大于1/300时没有其他的SARS-CoV多肽被检出。
这个实验显示特异性针对SARS-CoV的N蛋白的抗体应答优于特异性针对其他的SARS-CoV多肽的抗体应答,特别是针对S糖蛋白的抗体应答。这说明了在SARS-CoV感染人类的过程中核蛋白N的免疫显性。
实施例4针对SARS相关联冠状病毒(SARS-CoV)的N和S蛋白的单特异性多克隆抗体的制备 1)材料和方法 使用纯化的对应完整核蛋白(N)的重组多肽免疫三只兔子(P13097、P13081、P13031),所述重组多肽根据实施例2中描述的步骤制备。第一次注射为每只兔子注射0.35mg以完全福氏佐剂乳化的蛋白(皮内途径),然后间隔3周和4周再对动物进行3次加强免疫注射,每次注射0.35mg以不完全福氏佐剂乳化的重组蛋白。
使用对应S蛋白短片段(Sc)的重组多肽免疫三只兔子(P11135、P13042、P14001),所述重组多肽根据实施例2中描述的步骤制备。由于这种多肽在细菌的胞质中主要以包含体的形式存在,所以对动物以3-4周的时间间隔进行4次皮内注射,每次注射以不完全福氏佐剂乳化的、相当于0.5mg重组蛋白的包含体制剂。前三次注射使用根据实施例2中描述的步骤制备的包含体制剂,第四次注射使用根据实施例2中描述的步骤制备的、并经蔗糖梯度纯化和2%Triton X-100洗涤的包含体制剂。
对每只兔子,在第一次免疫之前制备其免疫前血清(p.i.),并在第四次免疫5周后制备免疫血清(I.S.)。
首先,使用对于类似用于免疫的重组蛋白制剂的ELISA测试了血清的反应性;所述ELISA测试按照实施例6中描述的步骤并使用该实施例中的试剂进行。
其次,使用制备被SARS-CoV感染的细胞裂解物的免疫印迹的方法(蛋白质免疫印迹法)测试了血清的反应性,所述测试按照实施例3中描述的步骤进行。
2)结果 ELISA测试的结果(图9)证明重组N蛋白制剂和S蛋白短片段(SC)的包含体制剂在动物体内具有免疫原性,并且免疫血清的效价很高(高于1/25000)。
免疫印迹结果(图8)显示兔P13097免疫血清识别存在于被SARS-CoV感染的细胞的裂解物中的两种多肽一种表观分子量(基于实验为50-55kDa)与核蛋白N(422个残基,预计分子量为46kDa)相近的多肽,和一种可能代表N蛋白的被截短或降解形式的35kDa的多肽。
这一实验还显示兔P11135血清主要识别一种多肽,其表观分子量(基于实验为180-220kDa)与S蛋白(1255个残基,139kDa的非糖基化多肽链)的糖基化形式相近,也与更轻的可能代表S蛋白的被截短或非糖基化的形式的多肽相近。
总之,所有这些试验证明表达于大肠杆菌并对应SARS-CoV的N和S蛋白的重组多肽可以在动物体内诱导多克隆抗体,所述抗体可以识别这些蛋白的天然形式。
实施例5针对SARS相关联冠状病毒(SARS-CoV)的M和E蛋白的单特异性多克隆抗体的制备 1)M和E蛋白的结构分析 a)E蛋白 SARS-CoV的E蛋白(76个氨基酸)的结构是使用例如signalP vl.1、NetNGlyc 1.0、THMM 1.0和2.0(Krogh et al.,2001,J. Mol. Biol.,305(3)567-580)或TOPPRED(von Heijne,1992,J. Mol. Biol.225,487-494)的多种软件包由计算机进行分析的。分析结果显示这种非糖基化的多肽是一种包括一个单独的跨膜螺旋(根据THMM,有12-34个氨基酸)的1型膜蛋白,其亲水结构域(42个残基)的大部分位于C端并且很可能在病毒颗粒内(胞内结构域)。可以注意到由THMM软件的1.0版(N端在外部)和2.0版(N端在内部)预测的拓扑结构是颠倒的,但是其他的算法,特别是TOPPRED和THUMBUP(Zhou et Zhou,2003,Protein Science 121547-1555),确定了E蛋白N端的外部定位。
b)M蛋白 对SARS CoV的M蛋白(221氨基酸)进行的类似的分析显示这个多肽中没有信号肽(根据signalP v1.1软件),但是有三个跨膜结构域(根据THMM2.0软件,有15-37、50-72、77-99残基)和一个大的亲水结构域(100-221氨基酸)位于病毒颗粒内部(胞内结构域)。很可能在4位的天冬酰胺被糖基化(根据NetNGlyc 1.0)。
因而,与其他冠状病毒的已知实验数据相一致,值得注意的是M和E这两个蛋白显示胞内结构域对应于大部分的多肽,而胞外结构域很小。
-E蛋白的胞外结构域可能对应于该蛋白的1至11或1至12残基MYSFVSEETGT(L),SEQ ID NO70。实际上,残基12位于跨膜区的概率是中等水平(根据THMM 2.0为0.56)。
-M蛋白的胞外结构域可能对应于该蛋白的2至14残基ADNGTITVEELKQ,SEQ ID NO69。实际上,M蛋白N端的甲硫氨酸很有可能被从成熟的多肽上切除了,因为2位的残基是一个丙氨酸(Varshavsky,1996,9312142-12149)。
此外,E蛋白的疏水性分析(Kyte&Doolittle,Hopp & Woods)证实E蛋白的胞内结构域的C端是亲水性的,所以很有可能暴露在该结构域的表面。因此对应于这一端的合成肽是很好的免疫原性候选物,它可以用于在动物体内诱导针对E蛋白胞内结构域的抗体。因此,合成了一个对应于E蛋白的24个C端残基的肽。
2)针对M和E蛋白胞外结构域和E蛋白胞内结构域的抗体的制备 通过Neosystem合成了肽M2-14(ADNGTITVEELKQ,SEQ ID NO69)、E1-12(MYSFVSEETGTL,SEQ ID NO70)和E53-76(KPTVYVYSRV KNLNSSEGVPDLLV,SEQ ID NO71)。使用MBS(m-马来酰亚胺-苯甲酰-N-羟基琥珀酰亚胺酯,m-maleimido-benzoyl-N-hydroxysuccinimide ester)通过合成过程中添加半胱氨酸,在上述合成肽的N端(对于E53-76)或C端(对于M2-14和E1-12)偶联了KLH(钥孔戚血蓝素,Keyhole LimpetHemocyanin)。
根据下述的免疫步骤,用每种缀合物对两只兔子进行免疫第一次注射为每只兔子注射0.5mg以完全福氏佐剂乳化的KLH偶联的肽(皮内途径),然后间隔3周或4周再对动物进行2至4次加强免疫注射,每次注射0.25mg以不完全福氏佐剂乳化的KLH偶联的肽。
对每只兔子,在第一次免疫之前制备其免疫前血清(p.i.),并在加强免疫注射3至5周后制备免疫血清(I.S.)。
通过蛋白质免疫印迹法分析了血清的反应性,所述免疫印迹分析使用被SARS-CoV感染的细胞提取物(图43B)或被表达SARS-CoV 031589分离株的E(VV-TG-E,图43A)或M(VV-TN-M,图43C)蛋白的重组牛痘病毒感染的细胞提取物。
以缀合物KLH-E53-76免疫兔22234和22240产生的免疫血清识别约9至10kD的多肽,在被SARS-CoV感染的细胞提取物中含有所述多肽,但未感染的细胞的提取物中则没有(图43B)。该多肽的表观分子量与预测为8.4kD的E蛋白的分子量相近。类似地,以缀合物KLH-E1-12免疫兔20047产生的免疫血清识别在被VV-TG-E病毒感染的细胞提取物中含有的多肽,其表观摩尔质量与E蛋白的相近(图43A)。
以缀合物KLH-M2-14免疫兔20013和20080产生的免疫血清识别在被VV-TN-M病毒感染的细胞提取物中含有的多肽(图43C),其表观摩尔质量(约18kD)与25.1kD的M糖蛋白相近,M糖蛋白具有高等电点(未修饰的多肽的等电点为9.1)。
这些结果证实,一方面是肽E1-12和E53-76,另一方面是肽M2-14,可以在动物体内诱导多克隆抗体,所述抗体可以分别识别SARS-CoV的E和M蛋白的天然形式。
实施例6重组N蛋白对于SARS患者血清的ELISA反应性分析 1)材料 用于制备固相的抗原是根据实施例2描述的步骤制备的纯化重组核蛋白N。
待测血清(表IV)基于它们对被SARS-CoV感染的细胞的反应性的免疫荧光分析结果(IF-SARS效价)选出。 表IV用ELISA测定的血清 *na不适用。**nt未测试。***指出的日期对应于出现SARS症状后的天数。
2)方法 将N蛋白用0.1M、pH9.6的碳酸盐缓冲液稀释至不同浓度(1、2或4μg/ml),分装至ELISA平板的各孔中(100μl),并置于实验室温度培养过夜。用PBS-Tween缓冲液洗涤平板并用PBS-脱脂牛奶-蔗糖(5%)缓冲液封闭。加入预先稀释(1/50、1/100、1/200、1/400、1/800、1/1600和1/3200)的测试血清(100μl),然后将平板置于37℃培养1小时。洗涤3次后,加入稀释至1/18000的过氧化物酶标记的抗人IgG缀合物(参考号209-035-098,JACKSON),然后将平板置于37℃培养1小时。洗涤4次后,加入色原体(TMB)和底物(H2O2),将平板置于室温避光培养30分钟。随后终止反应并在自动读数仪上测量450nm处的吸光度。
3)结果 ELISA测试的结果(图10)证实,重组N蛋白制剂可以被感染晚期(≥出现症状后17天)的SARS患者血清中的抗体特异性地识别,而不能被感染早期(出现症状后3天)的SARS患者血清中的抗体或被未感染SARS的受试者的对照血清明显地识别。
实施例7为高特异性和灵敏性地检测患者血清中的SARS相关联冠状病毒感染而准备的ELISA测试。
1)间接ELISA IgG测试 a)试剂 平板的准备 平板使用含2μg/ml的N蛋白、0.25ml/l酚红的10mM、pH7.2的PBS缓冲液致敏。每孔加入100μl溶液并置于室温培养过夜。用含0.1%Tween的10mM PBS缓冲液预洗涤,接着用25%牛奶/蔗糖的PBS封闭溶液洗涤来封闭平板。
血清稀释液 缓冲液,含0.48g/l TRIS、10mM PBS、3.7g/l EDTA、15%v/v牛奶,pH6.7 缀合物稀释液 柠檬酸盐缓冲液(15g/l),含0.5%Tween、25%牛血清、12%NaCl、6%v/v脱脂牛奶、pH6.5 缀合物 50×抗人IgG缀合物,购自Bio-Rad公司Platelia H. pylori试剂盒,参考号72778 其他溶液 洗涤液R2、与TMB R8稀释液一起用于可视化的溶液、R9色原体、R10终止液试剂购自Bio Rad公司(例如Platelia H. pylori试剂盒,参考号72778) b)步骤 将血清在样本稀释液中稀释至1/200 分装每孔100μl 37℃培养1小时 将10×洗涤液R2预先用脱矿质水稀释10倍(即1×洗涤液),洗涤3次 分装100μl的缀合物(将50×缀合物在即用前在所提供的缀合物稀释液中稀释) 37℃培养1小时 用1×洗涤液洗涤4次 分装每孔200μl的可视化溶液(即用前稀释,例如1ml的R9稀释于10ml的R8) 在暗处室温培养30分钟 以每孔100μl的R10终止反应 读取450/620nm的吸光度 可以用阈值血清的反应来解释测试的结果,高于阈值的血清可被判断为阳性。阈值血清被选出和稀释,以便产生比背景噪音强得多的信号。
2)双表位ELISA测试 a)试剂 平板的准备 平板使用含1μg/ml的N蛋白、0.25ml/l酚红的10mM、pH7.2的PBS缓冲液致敏。每孔加入100μl溶液并置于室温培养过夜。用10mM、0.1%Tween的PBS缓冲液预洗涤,接着用10mM、25%(V/V)牛奶的PBS封闭溶液洗涤来封闭平板。
血清和缀合物稀释液 50mM TRIS盐缓冲液,pH8,2%牛奶 缀合物 缀合物为根据Nakane的步骤的以各自摩尔比为1/2的过氧化物酶偶联的纯化重组N蛋白(Nakane P.K.and Kawaoi A.;(1974)Peroxydase-labeled antibody,a new method of conjugation.TheJournal of Histochemistry and Cytochemistry Vol.22,N)23,pp.1084-1091)。该ProtN POD缀合物在使用时在血清/缀合物稀释液中的浓度为2μg/ml。
其他溶液 洗涤液R2、与TMB R8一起用于可视化的溶液、稀释液、R9色原体、R10终止液试剂购自Bio-Rad公司(例如Platelia pylori试剂盒,参考号72778)。
b)步骤 第一步在“预稀释”平板中 ●在预稀释平板上将每份血清稀释至1/5(48μl稀释液+12μl血清) ●稀释了所有的血清以后,每孔分装60μl的缀合物 ●需要时,培养血清+缀合物的混合物 第二步在“反应”平板中 ●将混合物转移至反应平板中,每孔100μl ●37℃培养1小时 ●将10×洗涤液R2预先用脱矿质水稀释10倍(即1×洗涤液),洗涤5次 ●分装每孔200μl的可视化溶液(即用前稀释,例如1ml的R9稀释于10ml的R8) ●室温避光培养30分钟 ●以每孔100μl的R10终止反应 ●读取450/620nm的吸光度 与间接ELISA测试相似,可以用“阈值”血清来解释测试的结果。任何反应高于阈值血清的血清可被判断为阳性。
2)结果 使用间接IgG-N测试和双表位N测试,分析了源自越南河内的法国医院的被划分为SARS疑似病例或与河内的法国医院(JYK)有关的病人的血清。
间接IgG-N测试(图14和图15)和双表位N测试(图16和图17)的结果显示,比较血清对于感染或未感染SARS-CoV的Vero E6细胞的裂解物(ELISA-SARS-CoV裂解物,见下表V)的反应性,它们之间以及它们和间接ELISA测试之间具有很好的相关性。所有在出现症状后12天或12天以上采集的血清都是阳性的,包括那些用RT-PCR方法分析的呼吸器官样本不能确认SARS-CoV病毒感染的患者的血清,这很可能是因为在感染过程中样本采集得太晚(≥D12)。就患者TTH而言,于第七天采集的其鼻部样本在RT-PCR分析中呈阴性,样本的质量可能值得怀疑。
有些血清呈阴性而用RT-PCR方法却检出了其中SARS-CoV的存在。它们全都是出现症状不到10天时采集的早期血清(例如血清#032637)。就患者PTTH而言(血清#032673)中,在采集样本时仅仅是提出了SARS的怀疑。
总之,间接IgG-N和N双表位血清学测试对于采集于感染后12天或更长时间的血清,可以在所有的患者中确认SARS-CoV的感染。
表VELISA测试的结果 注 (1)RT-PCR分析使用巢式RT-PCR BNI、LC Artus和LC-N,对鼻部或咽部的擦拭物进行了分析。阳性表示这个患者的至少一个样本呈阳性。
(2)使用被SARS-CoV感染的细胞裂解物的ELISA测试了血清的反应性,根据被测稀释液得到的OD值划分为极高反应性(+++)、高反应性(++)、有反应性(+)和阴性。
实施例8用RT-PCR对SARS相关联冠状病毒(SARS-CoV)的检测 1)使用对于核壳蛋白基因的特异性引物的实时RT-PCR条件的开发——“光循环N蛋白(Light Cycler N)”测试 a)引物和探针的设计 使用“光循环探针设计(Roche)”程序,根据源自记录为031589的SARS-CoV病毒株基因组序列设计引物和探针。因此,选择了下列两个系列的引物和探针 -系列1(SEQ ID NO60、61、64、65) -正义引物N/+/285075’-GGC ATC GTA TGG GTT G-3’(28507-28522) -反义引物N/-/287745’-CAG TTT CAC CAC CTC C-3’(28774-28759) -探针15’-GGC ACC CGC AAT CCT AAT AAC AAT GC-荧光素3’(28561-28586) -探针25’Red705-GCC ACC GTG CTA CAA CTT CCT-磷酸盐(28588-28608) -系列2(SEQ ID NO62、63、66、67) -正义引物N/+/283755’-GGC TAC TAC CGA AGA G-3’(28375-28390) -反义引物N/-/287025’-AAT TAC CGC GAC TAC G-3’(28702-28687) -探针1SARS/N/FL5’-ATA CAC CCA AAG ACC ACA TTG GC-荧光素3’(28541-28563) -探针2SARS/N/LC7055’Red705-CCC GCA ATC CTA ATA ACA ATGCTG C-磷酸盐3’(28565-28589) b)两个引物对的效率分析 为测试这两个引物对的各自的效率,对一个合成的RNA进行了RT-PCR扩增,所述的合成RNA对应源自记录为031589的样本的SARS-CoV病毒株基因组的28054-29430核苷酸,并包括N基因的序列。
更具体而言 这个合成RNA通过体外转录制备,所述的体外转录使用了T7噬菌体RNA聚合酶,并以质粒SARS-N被BamH1酶线性化所得的DNA为模板。在用DNA酶1消化除去了DNA模板以后,用酚-氯仿抽提纯化合成的RNA,接着用乙酸铵和异丙醇连续沉淀两次。所合成的RNA通过测量260nm处的吸光度来定量分析,通过260nm和280nm处的吸光度之比和琼脂糖凝胶电泳来检验其质量。这样,用于这些研究的合成RNA制品的浓度为1.6mg/ml,相应为2.1×1015拷贝/ml的RNA。
根据供应商的说明书使用RT-PCR扩增数量递减的合成RNA,所述扩增使用的是“SuperscriptTM One-Step RT-PCR with Platinum_Taq”试剂盒和No.1(N/+/28507、N/-/28774)(图1A)和No.2(N/+/28375、N/-/28702)引物对(图1B)。使用的扩增条件如下为了合成cDNA,先是培养45℃30分钟、55℃15分钟和94℃2分钟,为了扩增cDNA,然后是包括下述步骤的5个循环94℃变性15秒、45℃退火30秒、72℃延伸30秒,再然后是包括以下步骤的35个循环94℃变性15秒、55℃退火30秒、72℃延伸30秒,每个循环再额外延伸2秒,最后一步的延伸是72℃5分钟。所得的扩增产物置于10℃保存。
图11中的结果显示,使用No.2引物对(N/+/28375、N/-/28702)可以检出甚至达10拷贝(强度弱的条带)或102拷贝(强度好的条带)的RNA,而使用No.1引物对(N/+/28507、N/-/28774)可检出的为104拷贝。扩增子分别为268bp(引物对1)和328bp(引物对2)。
c)实时RT-PCR的开发 使用No.2引物对和由SRAS/N/FL和SRAS/N/LC705构成的探针对开发了实时RT-PCR(图2)。
扩增使用了“Light Cycler RNA Amplification Kit HybridizationProbes”试剂盒(参考号2015145,Roche)并在Light CyclerTM(Roche)仪器上进行,优化的反应条件如后述。反应混合物包括H2O(6.8μl)、25mM MgCl2(0.8μl,Mg2+的终浓度为4μM)、5×反应混合物(4μl)、3μM探针SRAS/N/FL(0.5μl,终浓度为0.075μM)、3μM探针SRAS/N/LC705(0.5μl,终浓度为0.075μM)、10μM引物N/+/28375(1μl,终浓度为0.5μM)、10μM引物N/-/28702(1μl,终浓度为0.5μM)、酶混合物(0.4μl)和样本(病毒RNA,0.5μl),反应混合物的扩增根据下列程序进行 -反转录50℃10分钟,分析模式无 -变性95℃30秒×1,分析模式无 -扩增95℃2秒} 50℃15秒 分析模式定量*}×45 72℃13秒 温度变化率2.0℃/秒} -退火40℃30秒×1,分析模式无 *在退火结束时以及每一循环中均测量荧光(单独模式)。
图12中的结果显示该实时RT-PCR十分灵敏,因为它可以在被分析的5个样本中100%地检出102拷贝的合成RNA(8个实验中的29/29个样本),并可以在被分析的5个样本中100%地检出甚至达10拷贝的RNA(8个实验中的40/45个样本)。结果还显示该实时RT-PCR可以检出样本中存在的SARS-CoV基因组,并可定量存在基因组的数量。例如,在Vero E6细胞中培养的SARS-CoV病毒系的病毒RNA用“Qiamp viral RNAextraction”试剂盒(Qiagen)提取,稀释至0.05×10-14并用实时RT-PCR根据上述的步骤进行分析;图12中的分析结果显示病毒系包括6.5×109基因组-等价物/ml(geq/ml),这与使用购自Artus公司的“RealArtTMHPA-Coronavirus LC RT PCR Reagents”试剂盒测量的结果1.0×1010geq/ml的值完全近似。
2)定向于RNA聚合酶基因的巢式RT-PCR条件的开发——“CDC(疾病控制和预防中心)/IP巢式RT-PCR”测试 a)病毒RNA的提取 临床样本根据厂商的说明书使用QIAmp viral RNA Mini Kit试剂盒(QIAGEN)或同类的技术。将RNA以60μl的体积洗脱。
b)“SNE/SAR”巢式PCR 第一步“SNE”偶联的RT-PCR 使用了Invitrogen公司的“SuperscriptTM One-Step RT-PCR withPlatinum_Taq”试剂盒,然而在这里使用Roche Boehringer公司的“Titan”试剂盒也可以得到相似的结果。
寡核苷酸 -SNE-S15’GGT TGG GAT TAT CCA AAA TGT GA 3’ -SNE-AS15’GCA TCA TCA GAA AGA ATC ATC ATG 3’ →预期大小440bp 1.制备混合物 H2O 6.5μl 反应混合物2× 12.5μl 寡核苷酸SNE-S1 50μM0.2μl 寡核苷酸SNE-AS1 50μM 0.2μl 核糖核酸酶抑制剂40U/μl 0.12μl RT/Platinum Taq酶混合物 0.5μl 2.向20μl的上述混合物中加入5μl的RNA,在热循环器(ABI 9600条件)上进行扩增 2.1.45℃30分钟、55℃15分钟、94℃2分钟 2.2.(94℃15秒、45℃30秒、72℃30秒)×5个循环 2.3.(94℃15秒、55℃30秒、72℃30秒+2秒/循环)×35个循环 2.4.72℃5分钟 2.5.10℃不限时间 置于+4℃储存 使用购自Promega公司的核糖核酸酶抑制剂(N2511/N2515)作为RNA酶的抑制剂。
用合成的RNA作为阳性对照。作为对照,每个实验中扩增了103、102和10拷贝的合成RNA RSNE。
第二步“SAR”巢式PCR 寡核苷酸 -SAR1-S5’CCT CTC TTG TTC TTG CTC GCA 3’ -SAR1-AS5’TAT AGT GAG CCG CCA CAC ATG 3’ →预期大小121bp 1.制备混合物 H2O 35.8μl Taq缓冲液10× 5μl MgCl2 25mM 4μl 混合dNTP 5mM2μl 寡核苷酸SAR1-S 50μM0.5μl 寡核苷酸SAR1-AS 50μM 0.55μl Taq DNA聚合酶5U/μl0.25μl 使用了购自Applied Biosystems公司的AmpliTaq DNA聚合酶(无MgCl2的10×缓冲液,参考号27216601)。
2.向48μl的上述混合物中加入2μl第一步PCR的产物并进行扩增(ABI9600条件) 2.1.94℃2分钟 2.2.(94℃30秒、45℃45秒、72℃30秒)×5个循环 2.3.(94℃30秒、55℃30秒、72℃30秒+1秒/循环)×35个循环 2.4.72℃5分钟 2.5.10℃不限时间 3.将10μl的反应产物在含3%琼脂糖的“低解链”凝胶上(Seakem,GTG型)分析。
在上述条件下巢式PCR测试的灵敏性照例为10拷贝的RNA。
4.所得片段可用QIAquick PCR试剂盒(QIAGEN)纯化,并用寡核苷酸SAR1-S和SAR1-AS进行测序。
3)使用PCR方法从呼吸器官样本中检测SARS-CoV的RNA a)第一步比较研究 对国家流感病毒文献中心(北方区域)收集的可能包含SARS-CoV的一系列呼吸器官样本进行了比较研究。为进行此研究,使用“Qiampviral RNA extraction”试剂盒(Qiagen)从样本中提取RNA并用实时RT-PCR进行分析,一方面使用No.2系列的引物对和探针对及上述的实验条件,另一方面使用购自Roche公司的“LightCycler SARS-CoVQuantification kit”试剂盒(参考号03 604 438)。结果概括于下表VI。表中显示在26个样本中,对于这两个试剂盒均呈阴性的有18个,均呈阳性的有5个,而有1个样本仅对Roche试剂盒呈阳性,有2个样本仅对“系列2”N试剂呈阳性。此外,使用No.2系列的试剂(探针和引物)时,有3个样本(20032701、20032712、20032714)中的RNA检出量明显提高。这些结果表明“系列2”N引物和探针对于生物样本中的SARS-CoV基因组的检测比目前可用的试剂盒灵敏度更高。
表VI使用No.2系列(“系列2”N)的引物对和探针对或使用“LightCycler SARS-CoV Quantification kit”试剂盒(Roche),对从来自5个患者的一系列样本中提取的RNA进行的实时RT-PCR分析结果。两个测试中的每一个都示出了样本类型和测得的病毒基因组拷贝的数量。阴性阴性RT-PCR。
b)第二步比较研究 对来自越南河内的法国医院的SARS疑似病例的、在出现症状后第4至17天之间采集的121个呼吸器官样本进行了各种巢式PCR和实时RT-PCR并比较这些方法的效果。在这些样本中,使用针对ORF1b(编码复制酶)的巢式RT-PCR方法的第一次检验中有14个样本呈阳性,所述的巢式RT-PCR方法最初描述于Bernhard Nocht Institute(BNI巢式RT-PCR)。关于这种测试的信息可在互联网上得到,网址为http//www15.bni-hamburg.de/bni2/neu2/getfile.acgi?area engl=diagnostic&pid=4112。
在此研究中比较的各种测试如下 -根据本发明的定量RT-PCR方法,该方法使用了上述的“系列2”N引物和探针(LightCycler N column)。
-上述的针对RNA聚合酶基因的巢式RT-PCR测试,该方法由CDC、BNI和Institut Pasteur开发(CDC/IP巢式RT-PCR)。
-参考号为“HPA Corona LC RT-PCR Kit # 5601-02”的ARTUS公司的试剂盒,该试剂盒是针对ORF1b基因的实时RT-PCR测试。
-BNI巢式RT-PCR测试,该测试也是针对上述的RNA聚合酶基因的。
发明人观察到 1)同一技术中的批内变异性,这与重复融化过程中RNA制品的降解程度相关,特别是对于RNA含量极低的样品, 2)CDC/IP巢式RT-PCR与BNI巢式RT-PCR相比灵敏度较低,以及 3)根据本发明的定量RT-PCR测试(LightCycler N)与Artus公司的LightCycler(LC)测试相比,灵敏度相近。
列于下表VII的这些结果显示,根据本发明的定量RT-PCR测试为现在通用的测试提供了优异的补充或备选方案。实际上SARS相关联冠状病毒为一种可能快速变异的突发病毒。具体而言,目前大多数通用测试所针对的SARS相关联冠状病毒的RNA聚合酶基因,可能与其他非SARS相关联冠状病毒的RNA聚合酶基因发生重组。这样仅使用针对这种基因的测试就会导致假阴性的产生。
由于本发明的定量RT-PCR测试针对的是编码N蛋白的基因,它与ARTUS公司试剂盒针对的基因组区域不同。通过进行针对SARS相关联冠状病毒的两个不同基因的诊断测试,希望能因此避免因病毒基因进化而产生的假阴性型结果。
而且,针对核壳蛋白的基因有特殊的优势,因为该基因由于高选择压力而十分稳定,这种高选择压力与这种蛋白的高度结构限制有关。
表VII对来自越南河内的法国医院的SARS(2003年流行的)疑似病例的121个样本进行基因扩增分析的各种方法的比较 (1)P=咽部擦拭物 N=鼻部擦拭物 实施例9针对N蛋白的单克隆抗体的生产和鉴定 使用纯化的重组N蛋白免疫BALB/c小鼠,并根据K_hler和Milstein的技术将它们的脾细胞与合适的鼠类骨髓瘤细胞融合。
预筛选出19个分泌抗N蛋白抗体的杂交瘤株并测定了它们的免疫反应性。这些抗体以不同强度较好地识别了重组N蛋白(在ELISA测试中),并在ELISA测试和/或蛋白质免疫印迹分析中识别天然的病毒N蛋白。图18至20显示了19个单克隆抗体中的15个的上述测试结果。
将下述的高反应性克隆进行了亚克隆克隆12、17、28、57、72、76、86、87、98、103、146、156、166、170、199、212、218、219和222。使用合适的工具进行了特异性研究,以测定它们识别的表位并且确认它们对于其他人冠状病毒和某些呼吸道病毒没有反应性。
用蛋白质免疫印迹分析对天然N蛋白进行的表位图谱研究(借助15氨基酸的重叠肽在斑点膜(membrane spot)上进行)和其他研究揭示了下述的4组单克隆抗体的存在 1.特异性针对位于N端位置(75-81,序列INTNSVP)的一个主要线性表位的单克隆抗体。
这组抗体的代表是抗体156。生产这一抗体的杂交瘤细胞保藏于巴斯德研究院的法国微生物保藏中心(CNCM)(Paris,France),保藏日期2004年12月1日,编号I-3331。这同一个表位也可以被用相同N蛋白常规免疫得到的兔血清(抗N蛋白多抗)所识别。
2.特异性针对位于中心位置(217-224位置,序列ETALALL)的一个主要线性表位的单克隆抗体;这组抗体的代表是单克隆抗体87和166。生产抗体87的杂交瘤细胞保藏于CNCM,保藏日期2004年12月1日,编号I-3328。
3.特异性针对位于C端位置(403-408位置,序列DFFRQL)的一个主要线性表位的单克隆抗体,这组抗体的代表是抗体28、57和143。生产抗体57的杂交瘤细胞保藏于CNCM,保藏日期2004年12月1日,编号I-3330。
4.特异性针对一个不连续的构象表位的单克隆抗体。这组抗体不识别分布于N蛋白序列上的任何肽,但是与未变性的天然蛋白强烈地反应。这个最后一组抗体的代表是抗体86。生产这一抗体的杂交瘤细胞保藏于CNCM,保藏日期2004年12月1日,编号I-3329。
下表VII概括了表位图谱研究所得的结果 表VII单克隆抗体的表位图谱 此外,正如图18和19中具体说明的那样,这些抗体在ELISA和/或蛋白质免疫印迹分析中对于人冠状病毒229E的N蛋白不显示反应性。
实施例10用于灵敏免疫捕获检测的开发的单克隆抗体组合,该灵敏免疫捕获检测是专门用于检测被SARS-CoV病毒感染的患者血清或体液中的病毒N蛋白的。
根据抗体特性选择了下列的抗体,它们的特性适用于受试者或患者血清中的病毒N蛋白的其他捕获和检测研究。
这些抗体在小鼠的腹水中生产并用亲和层析纯化,它们可以做为捕获抗体和信号抗体单独或组合使用。
选出的抗体列出如下 -抗C端区域抗体(No.28、57、143) -抗中心区域抗体(No.87、166) -抗N端区域抗体(No.156) -抗不连续构象表位抗体(86) 1)试剂的制备 a)免疫捕获ELISA平板 平板用含5μg/ml抗体的0.1M、pH9.6的碳酸盐缓冲液致敏。每孔加100μl(单价的或多价的)抗体溶液并于室温培养过夜。然后用PBS缓冲液(10mM、pH7.4、添加0.1%Tween20)洗涤平板并用含0.3%BSA和5%蔗糖的PBS溶液封闭。干燥平板后将平板装入有干燥剂的包中待用。
b)缀合物 纯化的抗体根据Nakane的方法(Nakane et al.1974,J.of Histoand cytochemistry,vol.22,pp.1084-1091)与过氧化物酶偶联,偶联的比例为1分子的IgG对3分子的过氧化物酶。将这些缀合物用排阻层析法纯化并加入50%的甘油浓缩(浓度为1至2mg/ml)储存于-20℃。在用于分析时将它们用含1%BSA的PBS缓冲液(pH7.4)稀释至终浓度为1或2μg/ml。
c)其他试剂 -对HIV、HBV、HCV和THLV病毒的所有血清标记均呈阴性的人血清 -添加0.5% Triton X-100的阴性人血清混合物 -失活的病毒Ag病毒培养上清液用辐射的方法失活并用将其置于敏感细胞培养物中的方法确定其失活——失活前悬液的效价约为每毫升107感染性颗粒或每毫升抗原约5×109物理病毒颗粒 -Ag样品用阴性人血清稀释样品制备为1∶100的稀释然后再被5倍梯度稀释。
这些非感染性样本模拟被认为含有低浓度或极低浓度的病毒核蛋白N的人样本。该样本不适用于常规研究。
-洗涤液R2、可视化TMB R8溶液、色原体R9和终止液R10,这些试剂均为购自Bio-Rad公司的ELISA试剂盒中的普通试剂(例如Platelia pylori试剂盒,参考号72778)。
2)步骤 将加入失活病毒Ag的人血清的样品以每孔100μl直接分装至待用的平板上,然后置于37℃培养1小时(Bio-Rad IPS培养箱)。
洗涤3次以除去未与固相结合的物质(用稀释的R2洗涤液,自动LP35洗涤器洗涤)。
将稀释至1或2μg/ml的适当缀合物分装每孔100μl,然后再置于37℃培养1小时(IPS培养箱)。
连续洗涤4次以除去多余的缀合物(稀释的R2洗涤液-LP35洗涤器)。
加入100μl的用前制备的可视化溶液(1ml的R9与10mlR8),置于室温避光培养30分钟,使得附着于平板上的缀合物可视化。
在所有的孔中加入100μl的R10试剂(1N H2SO4)以最终终止酶反应。
使用适当的微量培养板读数器以双波长(450/620nm)进行读数。
测试结果可以用临时阈值来解释,临时阈值为至少两个阴性对照的平均值乘以因子2或者为100个阴性血清的平均值加上相当于6SD(由100个单个测量计算出来的标准差)的增值。
3)结果 基于选出抗体的性质测试了不同的捕获抗体和信号抗体组合,并避免在固相和缀合物中特异针对相同表位的抗体和作为缀合物的抗体的组合。
下列4个组合得到的结果最好,这些结果也重新列于下表IX中。
1.组合F/28 固相(抗体166+87中心区域)缀合物抗体28(C端) 2.组合G/28 固相(抗体86-构象表位)缀合物抗体28(C端) 3.组合H/28 固相(抗体86、166和87,中心区域和构象表位)缀合物抗体28(C端) 4.组合H/28+87 固相(抗体86、166和87,中心区域和构象表位)混合缀合物抗体28(C端)和87(中心) 5.组合G/87 固相(抗体86-构象表位)缀合物抗体87(中心) 前4个组合显示出等价的和可重复的并且比使用的其他组合(例如组合G/87)高的性能水平。当然在这些组合中,单克隆抗体可以被其他识别相同表位的抗体替代。因此也要提到下列变化形式 6.组合F/28的变化形式 固相(仅使用抗体87)缀合物抗体57(C端) 7.组合G/28的变化形式 固相(抗体86-构象表位)缀合物抗体57(C端) 8.组合H/28的变化形式 固相(抗体86和87,中心区域和构象表位)缀合物抗体57(C端) 9.组合H/28+87的变化形式 固相(抗体86和87,中心区域和构象表位)混合缀合物抗体57(C端)和87(中心) 表IX抗SARS-CoV核蛋白抗体的免疫反应性测试根据失活病毒抗原的稀释度测量的每种抗体组合的光密度 这4个实验的检出限对应于抗原在阴性血清中1∶62500的稀释度。由此可快速地推断可检出每毫升血清中少于103的感染性颗粒。
从本研究中可以显而易见的是,用于捕获天然病毒核蛋白的最合适的抗体是特异性针对中心区域和/或针对构象表位的抗体,这两类抗体还要就其对天然抗原的高亲和力进行选择。
确定了用于固相组合物的最佳抗体,优先选择特异性针对C端区域的显性表位的互补抗体作为用于检测附着于固相的抗原的抗体。使用特异性针对位于该蛋白N端区域的表位的其他任何互补抗体都会导致一般的或不好的结果。
实施例11用于表达SARS相关联冠状病毒(SARS-CoV)的刺(S)蛋白的真核表达系统 1)SARS-CoV S蛋白在哺乳动物细胞中表达条件的优化 优化了SARS-CoV刺(S)蛋白在哺乳动物细胞(293T、Vero E6)瞬时表达的条件。
为此,用PCR扩增了含有SARS-CoV S蛋白cDNA的DNA片段,所述扩增使用了来源于质粒pSARS-S(CNCM.No.I-3059)的寡核苷酸5’-ATAGGATCCA CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’和5’-ATACTCGAGTT ATGTGTAATG TAATTTGACA CCCTTG-3’,然后将扩增出的片段插入到含有慢病毒载体TRIP的质粒pTRIPΔU3-CMV(Siryen,2001,Mol.Ther.,3,438-448)的BamH1和Xho1酶切位点之间,从而得到质粒pTRIP-S。然后将含有S蛋白cDNA的BamH1和Xho1片段亚克隆到真核表达质粒pcDNA3.1(+)(Clontech)的BamH1和Xho1酶切位点之间,从而得到质粒pcDNA-S。然后将含有S蛋白cDNA的Nhe1和Xho1片段亚克隆到表达质粒pCI(Promega)的相应酶切位点之间,从而得到质粒pCI-S。将土拨鼠肝炎病毒的WPRE序列(“土拨鼠肝炎病毒转录后调控元件(Woodchuck Hepatitis Virus posttranscriptionalregulatory element)”)和马森-法衣扎猴逆转录病毒CTE序列(“组成型转运元件(constitutive transport element)”)各自插入到质粒pcDNA-S和pCI-S的Xho1和Xba1酶切位点之间,分别得到质粒pcDNA-S-CTE、pcDNA-S-WPRE、pCI-S-CTE和pCI-S-WPRE(图21)。质粒pCI-S-WPRE保藏于CNCM,保藏日期2004年11月22日,编号I-3323。所有的插入物都用BigDye Terminator vl.1试剂盒(AppliedBiosystems)和ABI377自动测序仪进行了测序。
将质粒构建体转染到Vero E6细胞后评估了它们指导SARS-CoV的S蛋白在哺乳动物细胞中表达的能力(图22)。在这个实验中,根据厂商的说明书,用下列物质与6μl Fugene6试剂(Roche)转染35mm Petri培养皿中的5×105个Vero E6细胞的单层2μg的质粒pcDNA(作为对照)、pcDNA-S、pCI和pCI-S。在37℃和5%CO2的条件下培养48小时后,根据Laemmli的方法将细胞提取物置于加样缓冲液中并在8%SDS聚丙烯酰胺凝胶上分离,然后转移至PVDF膜(BioRad)上。使用抗S蛋白兔多克隆血清(来自兔P11135的免疫血清,参见上述实施例4)和过氧化物酶偶联的抗兔IgG的驴多克隆抗体(NA934V,Amersham)进行了免疫印迹(蛋白质免疫印迹分析)检测。结合抗体的发光法可视化使用了ECL+试剂盒(Amersham)和放射自显影胶片Hyperfilm MP(Amersham)。
本实验(图22)显示质粒pcDNA-S不能指导SARS-CoV的S蛋白以可检出的水平表达,而质粒pCI-S微弱地表达,接近检出限,这种表达可以在胶片过曝光时检测到。在使用免疫荧光法观察S蛋白表达时也可以得到类似的结果(数据未示出)。检测不到S蛋白的有效表达不能归咎于所使用的检测技术,因为在被SARS-CoV感染的细胞提取物或被重组牛痘病毒VV-TF7.3感染的和被质粒pcDNA-S转染的Vero E6细胞的提取物中能够检测到预期大小(180kDa)的S蛋白。后面的实验中,病毒VV-TF7.3表达T7噬菌体的RNA聚合酶并使得无帽RNA的胞质转录产物可以被有效地翻译。这个实验显示上述的表达缺陷应归结为当在核水平进行转录至信使RNA的步骤时,由于S蛋白cDNA内在的原因使其不能有效表达。
在第二个实验中,在用与上述类似的步骤转染Vero E6(图23A)和293T(图23B)细胞后,评估了CTE和WPRE信号对于S蛋白表达的效果。在用源自pcDNA-S的质粒pcDNA-S-CTE和pcDNA-S-WPRE转染后检测不到S蛋白的表达,而在表达质粒pCI-S的背景下WPRE和CTE信号的插入却大大提高了S蛋白的表达。
为详细说明这一结果进行了又一系列的实验,以发光法和数码成像装置(FluorS,BioRad)采集的方式将免疫印迹定量地可视化。对QuantityOne v4.2.3软件(BioRad)获得的结果的分析显示WPRE和CTE序列分别使S蛋白在Vero E6细胞中的表达提高了20至42倍和10至26倍(表X)。在293T细胞中(表X),CTE序列的效果更温和些(4至5倍)。而WPRE序列的效果还是很强(13至28倍)。
表XCTE和WPRE信号对于SARS-CoV的S蛋白表达的效果的定量分析 在用质粒pCI、pCI-S、pCI-S-CTE和pCI-S-WPRE转染Vero E6或293T细胞48小时后制备细胞提取物,并用描述于图22的说明中的蛋白质免疫印迹方法来分析。以发光法(ECL+,Amersham)和数码成像装置(FluorS,BioRad)采集的方式将免疫印迹可视化。用相对水平来表示表达水平,数值1代表用质粒pCI-S转染后测得的表达水平。
对这两个细胞型的每一个进行了独立的实验。在对Vero E6细胞进行的实验1中,转染进行了两次,结果显示为测得的表达水平的平均值和标准差。
总之所有这些结果显示,若要使SARS-CoV的S蛋白cDNA在哺乳动物细胞中受RNA聚合酶II启动子序列调控的表达有效率,则需要一个拼接信号以及序列WPRE和CTE中一个的表达。
2)能获得SARS-CoV的S蛋白表达的稳定细胞系的产生 SARS-CoV的S蛋白cDNA被以BamH1-Xho1片段的形式克隆至质粒pTRIPΔU3-CMV中,获得pTRIP-S质粒(图24),pTRIPΔU3-CMV质粒含有带中心DNA瓣的缺陷型慢病毒载体TRIP(Sirven et al.,2001,Mol.Ther.,3438-448)。根据Zennou等人的方法(2000,Cell,101173-185),将上述质粒、壳体化质粒(p8.2)和表达VSV包膜糖蛋白G的质粒(pHCMV-G)瞬时共转染到293T细胞中,这样可制备包含载体TRIP-S和包膜蛋白G的假型的逆转录病毒假颗粒。这些假型TRIP-S载体被用于翻译293T和FRhK-4细胞使用蛋白质免疫印迹和免疫荧光方法在转导细胞中检测不到S蛋白的表达(数据未示出)。
用由CMV病毒立即/早期启动子、拼接信号、S蛋白cDNA和上述的转录后信号CTE或WPRE组成的最适表达盒替换具有中心DNA瓣TRIPΔU3-EF1α(Sirven et al.,2001,Mol.Ther.,3438-448)的缺陷型慢病毒表达载体中的表达盒EF1α-EGFP(图25)。这些替换通过S蛋白表达盒的一系列连续亚克隆进行,所述的S蛋白表达盒分别从质粒pCT-S-CTE(BglII-Apa1位点)或质粒pCI-S-WPRE(BglII-Sal1位点)上切除,然后分别插入到质粒TRIPΔU3-EF1α的Mlu1和Kpn1位点或Mlu1或Xho1位点之间,从而得到质粒pTRIP-SD/SA-S-CTE和pTRIP-SD/SA-S-WPRE,所得的两个质粒保藏于CNCM,保藏日期2004年12月1日,编号分别为I-3336和I-3334。假型载体根据根据Zennou等人的方法(2000,Cell,101173-185)产生,并被转导到293T细胞(10000细胞)和FRhK-4细胞(15000细胞)中,所述转导为一系列的5个连续转导循环,每一循环使用的p24载体量相当于25ng(pTRIP-SD/SA-S-CTE)或22ng(pTRIP-SD/SA-S-WPRE)。
转导的细胞通过有限稀释而被克隆,将一系列的克隆用免疫荧光法定性分析其SARS-CoV的S蛋白的表达(数据未示出),然后通过使用抗S蛋白兔多克隆血清的蛋白质免疫印迹法进行定量分析(图25)。图25中的结果显示,与在SARS-CoV感染过程中观察到的SARS-CoV的S蛋白表达相比,用TRIP-SD/SA-S-CTE转导的FRhK4-S-CTE细胞的克隆2和15以及用TRIP-SD/SA-S-WPRE转导的FRhK4-S-WPRE细胞的克隆4、9和12分别以较低或中等的水平表达SARS-CoV的S蛋白。
总之,用载体TRIP-SD/SA-S-CTE和TRIP-SD/SA-S-WPRE可以产生表达SARS-CoV的S蛋白的FRhK-4细胞和类似的293T细胞的稳定克隆,然而使用“亲代”载体TRIP-S的进行的分析还不成功,该分析证实表达S蛋白的稳定细胞克隆的产生需要拼接信号以及序列CTE和WPRE中的一个。
另外载体TRIP的这些修饰(拼接信号和例如CTE和WPRE的转录后信号的插入)可以证实在提高除S蛋白之外的其他cDNA的表达方面的优势。
3)可表达可溶形式的SARS-CoV的S蛋白的稳定细胞系的生产。这种重组抗原的纯化。
通过下述方式获得了编码S蛋白可溶形式(Ssol)的cDNA通过一个编码SG二肽的BspE1接头将编码蛋白胞外结构域(1至1193氨基酸)的序列与标记序列(FLAGDYKDDDDK)相融合。实际上,为了获得质粒pcDNA-Ssol,用寡核苷酸5’-ATAGGATCCA CCATGTTTAT TTTCTTATTATTTCTTACTC TCACT-3’和5’-ACCTCCGGAT TTAATATATT GCTCATATTTTCCCAA-3’,通过PCR从质粒pcDNA-S中扩增了编码SARS-CoV的S蛋白胞外结构域的DNA片段,然后将其插入到经修饰的真核表达质粒pcDNA3.1(+)(Clontech)的唯一的BamH1和BspE1酶切位点之间,该pcDNA3.1(+)质粒在其BamH1和Xho1位点之间包含标签序列FLAG //GGATCC...nnn...TCC GGA GAT TAT AAA GAT GAC GAC GAT AAA TAA CTCGAG // BamH1 S G D Y K D D D D K 末端 Xho1 然后从质粒pcDNA-Ssol上切除含有S蛋白cDNA的Nhe1-Xho1和BamH1-Xho1片段,并将它们分别亚克隆到质粒pTRIP-SD/SA-S-CTE和pTRIP-SD/SA-S-WPRE的相应位点中,从而得到质粒pTRIP-SD/SA-Ssol-CTE和pTRIP-SD/SA-Ssol-WPRE,这两个质粒保藏于CNCM,保藏日期2004年12月1日,编号分别为I-3337和I-3335。
假型载体根据Zennou等人的方法(2000,Cell,101173-185)产生,并被转导到FRhK-4细胞(15000细胞)中,所述转导为一系列的5个连续转导循环(15000细胞),每一循环使用的p24载体量相当于24ng(pTRIP-SD/SA-Ssol-CTE)或40ng(pTRIP-SD/SA-Ssol-WPRE)。转导的细胞通过有限稀释而被克隆,并通过使用抗FLAG的单克隆抗体的蛋白质免疫印迹法对TRIP-SD/SA-Ssol-CTE转导的一系列16个克隆和TRIP-SD/SA-Ssol-WPRE转导的一系列15个克隆进行了Ssol多肽表达分析(图26以及有数据未示出),还使用了为此目的开发的特异针对Ssol多肽的捕获ELISA进行了分析(表XI以及有数据未示出)。筛选最佳分泌克隆的过程部分显示于图26。捕获ELISA基于在固相中包被了用纯化并失活的SARS-CoV免疫的兔多克隆抗体。这样的固相可以捕获分泌至细胞上清液的Ssol多肽,然后用一系列连续步骤使得Ssol多肽可视化,这些连续步骤包括抗FLAG单克隆抗体(M2,SIGMA)的附着、抗小鼠IgG(H+L)生物素化兔多克隆抗体(Jackson)的附着、链霉亲和素-过氧化物酶缀合物(Amersham)的附着以及色原体和底物(TMB+H2O2,KPL)的加入。
表XI慢病毒载体TRIP-SD/SA-Ssol-WPRE和TRIP-SD/SA-Ssol-CTE转导的细胞系的Ssol多肽表达的分析。
在用慢病毒载体TRIP-SD/SA-Ssol-WPRE和TRIP-SD/sA-Ssol-CTE转导FRhK-4细胞后,分离了一系列的细胞克隆并测定了其上清液中Ssol多肽的分泌。上清液稀释至1/50后通过特异性针对SARS-CoV的S蛋白的捕获ELISA测试进行了分析。
在培养上清液中分泌最高量Ssol多肽的细胞系是FRhK4-Ssol-CTE3细胞系。将该细胞系用TRIP-SD/SA-Ssol-CTE载体在与上述类似的条件下进行第二系列的5个循环的转导然后克隆。使用蛋白质免疫印迹和捕获ELISA分析组合筛选出分泌最高量Ssol的亚克隆亚克隆FRhK4-Ssol-30,保藏于CNCM,保藏日期2004年11月22日,编号I-3325。
用FRhK4-Ssol-30细胞系可以定量地生产和纯化重组Ssol多肽。在一个优化了生长、产生和纯化条件的典型实验中,FRhK4-Ssol-30细胞系在标准培养基(无丙酮酸盐的DMEM培养基,含4.5g/l葡萄糖,添加5%FCS、100U/ml青霉素、100μg/ml链霉素)上以分会合单层(每100cm2106个细胞,20ml培养基)的形式接种。达到会合后,用FCS含量减为0.5%的每100cm2培养基的量减为16ml的分泌培养基替换标准培养基。在35℃、5%CO2的条件下培养4至5天后移去培养上清液。重组Ssol多肽通过下述连续步骤从上清液中纯化0.1μm聚醚砜(PES)膜过滤、用50kD分割的PES膜超滤浓缩、在抗FLAG基质上亲和层析、用含100μg/ml FLAG肽(DYKDDDDK)的TBS溶液(50mM tris、150mM NaCl、pH7.4)洗脱、在TBS溶液中在葡聚糖凝胶G-75微球柱(Pharmacia)上凝胶过滤层析。用micro-BCA测试(Pierce)测定了纯化重组Ssol多肽的浓度,然后分析了其生化特性。
用硝酸银染色的8%SDS丙烯酰胺凝胶电泳分析结果显示占优势的多肽分子量约为180kD,纯度估计为98%(图27A)。使用SELDI-TOF质谱分析仪(Cyphergen)检出了两个主要的峰它们分别对应带单电荷或双电荷的优势多肽,这样测得其分子量为182.6±3.7kD(图27B和C)。在转移至Prosorb膜并用0.1%TFA漂洗后,在液相中用Edman降解法对Ssol多肽的N端末端的5个残基进行了测序(ABI494,AppliedBiosystems),并测定它们为SDLDR(图27D)。上述结果证实,根据软件signalP v2.0分析的(Nielsen et al.,1997,ProteinEngineering,101-6)位于SARS-CoV的S蛋白N端末端、由1-13位氨基酸(MFIFLLFLTLTSG)组成的信号肽被从成熟Ssol多肽上切除了。所以该重组Ssol多肽包括了SARS-CoV的S蛋白的14至1193氨基酸,这一序列的C端与含FLAG标签(下划线部分)的序列SGDYKDDDDK相融合。裸露Ssol多肽的理论分子量(132.0kD)与成熟多肽的真实摩尔质量(182.6kD)之间的差异表明Ssol多肽是被糖基化的。
制备了纯化Ssol多肽并用micro-BCA测试测定了其蛋白浓度,这样就可以制备校准系列,从而使用捕获ELISA测试来测定培养上清液中的Ssol多肽浓度并考察分泌细胞系的特性。根据本测试,在会合培养4至5天后,FRhK4-Ssol-CT3细胞系分泌4至6μg/ml的多肽而RhK4-Ssol-30细胞系分泌9至13μg/ml的Ssol多肽。另外,使用上述的纯化步骤每升培养上清液可以常规地纯化1至2mg的Ssol多肽。
实施例12包含SARS相关联冠状病毒(SARS-CoV)的刺(S)蛋白的基因免疫 在BALB/c小鼠的基因免疫之后分析了拼接信号和转录后信号WPRE和CTE的效果。
为此,以4周的时间间隔对BALB/c小鼠进行免疫,对小鼠胫骨前肌内注射50μg的pcDNA-S和pCI-S的质粒DNA的盐溶液,并注射50μg的pcDNA-N(指导SARS-CoV的N蛋白的表达)或pCI-HA(指导流感病毒A/PR/8/34的HA的表达)的质粒DNA作为对照,在第二次注射3周后采集免疫血清。针对SARS-CoV的S蛋白的抗体的存在使用间接ELISA测定,所述间接ELISA使用被SARS-CoV感染的Vero E6细胞裂解物作为抗原,并使用未感染的Vero E6细胞裂解物作为对照。用过氧化物酶偶联的抗小鼠IgG多克隆抗体(NA931V,Amersham)和添加H2O2的TMB(KPL)进行可视化后,以产生特定的OD值0.5(被感染细胞裂解物的测量值OD与未感染细胞裂解物的测量值OD之间的差值)时的抗体稀释度的倒数计算抗SARS-CoV抗体的效价(TI)(图28A)。
在上述条件下,对6只小鼠中的3只,表达质粒pcDNA-S仅能诱导低效价的针对SARS-CoV的S蛋白的抗体(LOG10(TI)=1.9±0.6),而质粒pcDNA-N能够在所有的动物中诱导高效价的抗N蛋白抗体(LOG10(TI)=3.9±0.3),对照质粒(pCI、pCI-HA)不能诱导任何可检出的抗体(LOG10(TI)<1.7)。装配了拼接信号的质粒pCI-S能够诱导高效价的抗体(LOG10(TI)=3.7±0.2),这比用质粒pcDNA-S注射后观察到的效价高了大约60倍(p<10-5)。
转录后信号的效果是通过剂量-反应实验来研究的,研究了作为免疫原的质粒DNA(2μg、10μg和50μg)的数量与在BALB/c小鼠体内所诱导的抗S蛋白抗体效价之间的函数关系。该研究(图28B)证实转录后信号WPRE在使用小剂量DNA时可以显著改善基因免疫的效果(在2μg的DNA量时为p<10-5、在10μg的DNA量时为p<10-2),而CTE信号的效果还是很弱(在2μg的DNA量时p=0.34) 最后,基因免疫后诱导的抗体在体外中和了SARS-CoV的感染性(图29A和29B),其效价与用ELISA测得的效价相一致。
总之,使用拼接信号和土拨鼠肝炎病毒的转录后信号WPRE可明显改善在使用指导SARS-CoV的S蛋白cDNA表达的质粒DNA基因免疫后针对SARS-CoV的中和抗体的诱导。
实施例13S蛋白的诊断应用 分析了重组Ssol多肽对于来自SARS患者的血清的ELISA反应性。
来自SARS疑似病例的待测血清基于其针对SARS-CoV的天然抗原的特异反应性的分析结果(阳性或阴性)挑选,所述分析通过对于被SARS-CoV感染的Vero E6细胞的免疫荧光测试和/或以被SARS-CoV感染的Vero E6细胞的裂解物为抗原的间接ELISA测试进行。这些患者的血清以国家流感病毒文献中心的系列号和患者姓名缩写以及出现症状后经过的天数来定义。除了患者VTT的032552血清以外,所有疑似病例的血清(见表XII)均识别SARS-CoV的天然抗原,该患者VTT的SARS-CoV感染不能通过对3、8和12天的呼吸器官样本的RT-PCR来确诊。使用一组对照血清作为对照(TV血清)它们采集于2003年SARS流行前的法国。
表XIISARS疑似病例的血清 使用重组Ssol多肽致敏的固相通过含2μg/ml的纯化Ssol多肽的PBS溶液在ELISA平板孔中的吸附制备,然后平板在4℃培养过夜,再用PBS-Tween缓冲液(PBS、0.1%Tween 20)洗涤。在用PBS-10%脱脂牛奶(重量/体积)溶液封闭ELISA平板和用PBS-Tween洗涤之后,将待测血清(100μl)在PBS-脱脂牛奶-Tween缓冲液(PBS、3%脱脂牛奶、0.1%Tween)中稀释至1/400然后加至致敏的ELISA平板的孔中。平板置于37℃培养1小时。在用PBS-Tween缓冲液洗涤3次之后,加入在PBS-脱脂牛奶-Tween缓冲液中稀释至1/4000的过氧化物酶标记的抗人IgG抗体缀合物(参照号NA933V,Amersham),然后将平板置于37℃培养1小时。在用PBS-Tween缓冲液洗涤6次之后,加入色原体(TMB)和底物(H2O2)并将平板避光培养10分钟。加入1N H3PO4溶液终止反应然后在测量以620nm处为参照的450nm处的吸光度。
ELISA测试的结果(图30)证实重组Ssol多肽可被采集于感染中期或晚期(出现症状后的≥10天)的SARS患者的血清抗体特异性地识别,而却不能被采集于感染早期(出现症状后3至8天)的2个患者(JLB和JCM)的血清抗体或未感染SARS的受试者的对照血清明显地识别。患者JLB和JCM的血清抗体在出现症状后3天和27天之间出现第一次血清转变,在8天和29天之间出现第二次血清转变,这证实了这些血清对于Ssol多肽的反应性的特异性。
总之,上述结果证实重组Ssol多肽可以在SARS-CoV感染的血清学诊断的ELISA测试的开发中作为抗原使用。
实施例14重组可溶性S蛋白的疫苗应用 在小鼠体内研究了重组Ssol多肽的免疫原性。
为此,以3周的时间间隔用在PBS中稀释的10μg重组Ssol多肽和1mg氢氧化铝佐剂(Alu-gel-S,Serva)免疫了一组6只小鼠。连续进行三次免疫并在每次免疫后3周采集免疫血清(IS1、IS2、IS3)。只用氢氧化铝按照相同步骤免疫的一组小鼠(模拟组)作为对照。
将两组中每一组的免疫血清混合后用间接ELISA进行分析,所述间接ELISA使用被SARS-CoV感染的Vero E6细胞裂解物作为抗原、未感染的Vero E6细胞裂解物作为对照。用过氧化物酶偶联的抗小鼠IgG(H+L)多克隆抗体(NA931V,Amersham)和添加H2O2的TMB(KPL)进行可视化后,以产生特定的OD值0.5时的抗体稀释度的倒数计算抗SARS-CoV抗体的效价。该分析(图31)显示,从第一次免疫开始,使用Ssol多肽的免疫就可在小鼠体内诱导针对被感染的Vero E6细胞裂解物中存在的SARS-CoV刺蛋白天然形式的抗体。在2次和3次免疫之后,抗S蛋白抗体的效价变得非常高。
将两组中每一组的血清混合后分析了其血清中和SARS-CoV感染性的能力。从1/20开始逐次二倍稀释血清,每个二倍稀释液测试FRhK-4细胞(100 TCID50的SARS-CoV)的4个血清中和的孔。根据Reed和Munsch的方法,以可中和4个孔中的两个的感染性的血清稀释度的倒数计算血清中和效价。该分析显示以Ssol多肽在小鼠体内诱导的抗体是中和性的观察到的效价在2次和3次免疫后非常高(分别大于2560和5120,表XIII)。
表XIII用重组Ssol多肽免疫后针对SARS-CoV的抗体的诱导 将两组中每一组的免疫血清混合后分析了其血清中和100 TCID50的SARS-CoV对于FRhK-4细胞感染性的能力。从1/20开始逐次二倍稀释血清,每个二倍稀释液测试4个孔。根据Reed和Munsch的方法,以可中和4个孔中的两个的感染性的血清稀释度的倒数计算血清中和效价。
使用Ssol多肽免疫小鼠时观察到的中和效价达到的水平远比Yang等人在小鼠体内(2004,Nature,428561-564)和Buchholz在仓鼠体内(2004,PNAS,1019804-9809)观察到的、可分别保护小鼠和仓鼠不受SARS-CoV感染的抗体的效价高得多。所以可能在小鼠体内用Ssol多肽免疫诱导的中和抗体可以保护这些动物不受SARS-CoV的感染。
实施例15可在哺乳动物细胞中表达SARS相关联冠状病毒(SARS-CoV)刺(S)蛋白的优化合成基因 1)合成基因的设计 从031589分离株的基因(质粒pSARS-S,CNCM.No.I-3059)中设计了编码SARS-CoV刺蛋白的合成基因,以便在哺乳动物细胞,特别是人源细胞中得到高水平的表达。
为此 -修饰了分离株031589的野生型基因的密码子选择,以使其变得接近于人类中观察到的偏好并改善相应mRNA的翻译效果 -提高了基因的整体GC含量,以延长相应mRNA的半衰期 -缺失了能够干扰基因的有效表达的任选的隐含基序(拼接供体和受体位点、多聚腺苷酸化信号、高度富含(>80%)GC或GC含量很低(<30%)的序列、重复序列、参与形成二级RNA结构的序列、TATA盒) -加入了第二终止密码子以使翻译能够有效地终止。
此外,在基因中引入了CpG基序以便提高其作为DNA疫苗的免疫原性。为方便合成基因的操作,在S蛋白开放读码框的两边放置了两个BamH1和Xho1限制性酶切位点,并且在合成基因中回避了BamH1、Xho1、Nhe1、Kpn1、BspE1和Sal1限制性酶切位点。
设计的合成基因(基因040530)的序列在SEQ ID No140中给出。
合成基因040530与野生型基因的序列比对显示于图32,所述野生型基因为保藏于CNCM.的、编号I-3059的SARS-CoV分离株031589(SEQID NO4,质粒pSRAS-S)的基因。
2)质粒构建体 合成基因SEQ ID No140由合成的寡核苷酸组装并被克隆至质粒pUC-Kana的Kpn1和Sac1酶切位点之间,从而得到质粒040530pUC-Kana。用自动测序仪(Applied)确认了质粒040530pUC-Kana的插入物的核苷酸序列。
将含有合成基因040530的Kpn1-Xho1片段从质粒040530pUC-Kana上切除,并亚克隆至表达质粒pCI(Promega)的Nhe1和Xho1酶切位点之间,从而得到质粒pCI-Ssynth,该质粒pCI-Ssynth保藏于CNCM,保藏日期2004年12月1日,编号I-3333。
通过下述方式获得了编码S蛋白可溶形式的合成基因通过一个编码SG二肽的BspE1接头将编码S蛋白胞外结构域(1至1193氨基酸)的序列与标签序列(FLAGDYKDDDDK)相融合。实际上,用寡核苷酸5’-ACTAGCTAGC GGATCCACCATGTTCATCTT CCTG-3’和5’-AGTATCCGGACTTGATGTACT GCTCGTACTTGC-3’,通过PCR从质粒040530pUC-Kana中扩增了编码SARS-CoV的S蛋白胞外结构域的DNA片段,用Nhe1和BspE1消化后将其插入到质粒pCI-Ssol的唯一的Nhe1和BspE1酶切位点之间,从而得到质粒pCI-Scube,该质粒pCI-Scube保藏于CNCM,保藏日期2004年12月1日,编号I-3332。通过将从质粒pcDNA-Ssol上切除的Kpn1-Xho1片段(参见技术手册DI 2004-106)分别亚克隆至质粒pCI、pCI-S-CTE和pCI-S-WPRE的Nhe1和Xho1酶切位点之间,已经预先得到了质粒pCI-Ssol、pCI-Ssol-CTE和pCI-Ssol-WPRE(保藏于CNCM,保藏日期2004年11月22日,编号I-3324)。
质粒pCI-Scube和pCI-Ssol编码相同的重组Ssol多肽。
3)结果 在灵长类细胞(Vero E6)和人类细胞(293T)的瞬时转染之后,比较了编码S蛋白的合成基因和野生型基因的有效指导SARS-CoV的S蛋白在哺乳动物细胞中表达的能力。
在图33和表XIV显示的实验中,根据厂商说明书(Roche),用2μg的质粒pCI(对照)、pCI-S、pCI-S-CTE、pCI-S-WPRE和pCI-S-Ssynth以及6μl的Fugene6试剂转染35mm Petri培养皿中的5×105的Vero E6或7×105的293T的细胞单层。在37℃和5%CO2的条件下培养48小时后,根据Laemmli的方法将细胞提取物置于加样缓冲液中并在8%SDS聚丙烯酰胺凝胶上分离,然后转移至PVDF膜(BioRad)上。使用抗S蛋白兔多克隆血清(来自兔P11135的免疫血清,参见上述实施例4)和过氧化物酶偶联的抗兔IgG的驴多克隆抗体(NA934V,Amersham)进行了免疫印迹(蛋白质免疫印迹分析)检测。以使用ECL+试剂盒(Amersham)的发光法和数码成像装置(FluorS,BioRad)采集的方式将免疫印迹定量地可视化。
对QuantityOne v4.2.3软件(BioRad)获得的结果的分析显示,在此实验中,质粒pCI-Ssynth可使S蛋白在Vero E6和293T细胞中高水平地瞬时表达,而质粒pCI-S不能诱导足够检出量的表达。观察到的表达量达到了使用质粒pCI-S-WPRE时观察到的表达量的大约两倍。
表XIV将合成基因用于SARS-CoV的S蛋白的表达 使用质粒pCI、pCI-S、pCI-S-CTE、pCI-S-WPRE和pCI-S-Ssynth转染Vero E6或293T细胞48小时后,制备细胞提取物并在8%SDS丙烯酰胺凝胶上分离,使用抗S蛋白兔多克隆抗体和过氧化物酶偶联的抗兔IgG(H+L)的多克隆抗体(NA934V,Amersham)进行了蛋白质免疫印迹分析。蛋白质免疫印迹以发光法(ECL+,Amersham)和数码成像装置(FluorS,BioRad)采集的方式可视化。以量化图中(见图33)确定的两条显著条带的方式测量S蛋白的表达水平,并根据相对水平示出,数值1代表质粒pCI-S-WPRE转染后测得的表达水平。
在第二个例子中,在仓鼠细胞(BHK-21)和人类细胞(293T)的瞬时转染之后,比较了合成基因Scube和野生型基因的有效指导Ssol多肽由哺乳动物细胞合成和分泌的能力。
在表XV显示的实验中,根据厂商说明书(Roche),用2μg的质粒pCI(对照)、pCI-Ssol、pCI-Ssol-CTE、pCI-Ssol-WPRE和pCI-Scube以及6μl的Fugene6试剂转染35mm Petri培养皿中的6×105的BHK-21和7×105的293T的细胞单层。在37℃和5%CO2的条件下培养48小时后,收集细胞上清液并通过特异性针对Ssol多肽的捕获ELISA测试定量分析Ssol多肽的分泌。
对上述结果的分析显示,在此实验中,质粒pCI-Scube使得Ssol多肽的表达量比质粒pCI-Ssol提高了8倍(BHK-21细胞)至20倍(293T细胞)。观察到的表达水平达到了使用质粒pCI-Ssol-WPRE时观察到的表达量的大约两倍(293T细胞)至5倍(BHK-21细胞)。
表XV将合成基因用于Ssol多肽的表达 在使用质粒pCI、pCI-Ssol、pCI-Ssol-CTE、pCI-Ssol-WPRE和pCI-Scube转染BHK或293T细胞48小时之后,收集细胞上清液并通过特异性针对Ssol多肽的捕获ELISA测试定量分析Ssol多肽的分泌。转染进行了两次,结果显示为在上清液中测得的Ssol多肽的浓度(ng/ml)的平均值和标准差的形式。
总之,上述结果显示,编码SARS-CoV的S蛋白的合成基因040530在哺乳动物细胞中受RNA聚合酶II启动子序列调控的表达要比031589分离株的野生型基因的表达有效得多。所述合成基因的表达甚至比受含有土拨鼠肝炎病毒的WPRE序列的野生型基因指导的表达还要有效。
4)应用 编码SARS-CoV的S蛋白的合成基因040530或编码Ssol多肽的其Scube变异体的使用可以在很多S蛋白必须高水平表达的应用中有利地替代野生型基因。特别是为了 -改善质粒pCI-Ssynth甚或是pCI-Ssynth-CTE或pCI-Ssynth-WPRE型基因免疫的效率 -借助分别携带Ssynth基因或Scube基因的重组慢病毒载体,建立表达更多量的S蛋白或Ssol多肽的新的细胞系 -改善可表达S蛋白或Ssol多肽的重组慢病毒载体的免疫原性 -改善可表达S蛋白或Ssol多肽的活载体的免疫原性,所述活载体例如重组牛痘病毒或重组麻疹病毒(见下述实施例16和17)。
实施例16使用重组牛痘病毒的SARS相关联冠状病毒(SARS-CoV)刺(S)蛋白的表达 疫苗应用 生产可溶性刺(S)蛋白和设计SARS血清学测试的应用 1)介绍 本实施例的目的是评估表达各种SARS相关联冠状病毒(SARS-CoV)抗原的重组牛痘病毒(VV)构成新的抗SARS候选疫苗的能力,及其成为在哺乳动物细胞中生产重组抗原的手段的能力。
为此,发明人着重于SARS-CoV刺(S)蛋白,它可在对动物基因免疫后诱导中和SARS-CoV感染性的抗体;还着重于S蛋白的可溶形式和分泌形式——Ssol多肽,该多肽由S蛋白的胞外结构域(1-1193氨基酸)在其C端通过一个编码SG二肽的BspE1接头与FLAG标签(DYKDDDDK)融合而组成。该Ssol多肽显示与S蛋白相似的抗原性,并且在用纯化的蛋白和氢氧化铝佐剂注射小鼠后,可以诱导高效价的抗SARS-CoV中和抗体。
将S基因的各种形式置于7.5K基因的启动子的控制之下,并通过体内双同源重组的方式将其引入牛痘病毒哥本哈根毒株的胸腺嘧啶激酶(TK)基因座中。为改善重组牛痘病毒的免疫原性,选择了合成的晚期启动子代替7.5K启动子,以便在病毒生活史的后期提高S蛋白和Ssol的产量。
在分离了重组牛痘病毒并确认了其表达SARS-CoV的S抗原的能力之后,测试了其在小鼠体内诱导针对SARS的免疫应答的能力。在从被感染细胞的上清液中纯化了Ssol抗原后,设计了用于SARS血清学诊断的ELISA测试,并使用来自SARS疑似病例的血清评估了其效果。
2)重组病毒的构建 获得了指导SARS-CoV的031589分离株的S糖蛋白及其可溶和分泌形式Ssol多肽在7.5K启动子控制下表达的重组牛痘病毒。为提高S蛋白和Ssol多肽的表达水平,还获得了其中S蛋白和Ssol的cDNA被置于晚期合成启动子的控制之下的重组病毒。
质粒pTG186poly是用于重组牛痘病毒的构建的转移质粒(Kieny,1986,Biotechnology,4790-795)。因而,它含有VV胸腺嘧啶激酶基因,在该基因中插入了7.5K基因启动子及一个允许异源基因插入的多克隆位点(图34A)。7.5K基因启动子实际上包括两个启动子序列的串联,这两个启动子序列分别在牛痘病毒复制循环的早期(PE)和后期(PL)有活性。分别从质粒pTRIP-S和pcDNA-Ssol上切除BamH1-Xho1片段,并将其插入到质粒pTG186poly的BamH1和Sma1酶切位点之间,从而得到质粒pTG-S和pTG-Ssol(图34A)。质粒pTG-S和pTG-Ssol保藏于CNCM,保藏日期2004年12月2日,编号分别为I-3338和I-3339。
将质粒pTG186poly、pTG-S和pTG-Ssol中的含有7.5K启动子的Nde1-Pst1片段替换为含有合成晚期启动子480的DNA片段,从而分别得到质粒pTN480、pTG-S和pTG-Ssol,所述合成晚期启动子480由寡核苷酸5’-TATGAGCTTT TTTTTTTTTT TTTTTTTGGC ATATAAATAG ACTCGGCGCGCCATCTGCA-3’和5’-GATGGCGCGC CGAGTCTATT TATATGCCAA AAAAAAAAAAAAAAAAAAGC TCA-3’的杂交而得到(图34B)。该插入物使用BigDyeTerminator v1.1试剂盒(Applied Biosystems)和自动测序仪ABI377进行了测序。克隆到pTN系列的转移质粒中的晚期合成启动子480的序列示于图34C。质粒pTN-S和pTN-Ssol保藏于CNCM,保藏日期2004年12月2日,编号分别为I-3340和I-3341。
重组牛痘病毒是通过下方式获得的根据Kieny等人描述的方法(1984,Nature,312163-166),在pTG和pTN系列转移质粒的TK盒和牛痘病毒哥本哈根毒株的TK基因之间进行体内双同源重组。简而言之,用上述的牛痘病毒哥本哈根毒株的基因组DNA和每一个pTG和pTN系列的转移质粒在DOTAP试剂(Roche)的帮助下转染CV-1细胞,然后再用辅助牛痘病毒VV-ts7在33℃超转染24小时。辅助病毒通过40℃培养2天的方式反选择然后重组病毒(TK-表型)通过在含BuDr(25μg/ml)的琼脂培养基上的对143Btk-细胞的两个克隆循环而筛选。6个病毒VV-TG、VV-TG-S、VV-TG-Ssol、VV-TN、VV-TN-S和VV-TN-Ssol分别使用转移质粒pTG186poly、pTG-S、pTG-Ssol、pTN480、pTN-S和pTN-Ssol而得到。VV-TG和VV-TN病毒不表达任何异源基因从而在实验中作为T(-对照。在CV-1或BHK-21的细胞单层上进行重组病毒的制备,并根据Earl和Moss的方法(1998,Current Protocols in MolecularBiology,16.16.1-16.16.13)在CV-1细胞上测定用噬菌斑形成单位(p.f.u.)表示的效价。
3)重组病毒的鉴定 编码S蛋白和Ssol多肽的转基因的表达由蛋白质免疫印迹法测定。
使用各种重组牛痘病毒VV-TG、VV-TG-S、VV-TG-Ssol、VV-TN、VV-TN-S和VV-TN-Ssol以感染复数2感染CV-1的细胞单层。在37℃和5%CO2的条件下培养18小时后,根据Laemmli的方法将细胞提取物置于加样缓冲液中并在8%SDS聚丙烯酰胺凝胶上分离,然后转移至PVDF膜(BioRad)上。使用抗S蛋白兔多克隆血清(来自兔P11135的免疫血清,参见实施例4)和过氧化物酶偶联的抗兔IgG的驴多克隆抗体(NA934V,Amersham)进行了免疫印迹(蛋白质免疫印迹分析)检测。结合抗体的发光法可视化使用了ECL+试剂盒(Amersham)和放射自显影胶片Hyperfilm MP(Amersham)。
如图35A所示,重组病毒VV-TN-S指导的S蛋白表达水平与用SARS-CoV感染8小时后观察到的表达水平相近,而这比用VV-TG-S感染后观察到的感染水平高得多。在第二个实验中(图35B),不同量的细胞提取物的分析显示,用TN系列的病毒(VV-TN-S和VV-TN-Ssol)感染后观察到的表达水平是用TG系列的病毒(相应的VV-TG-S和VV-TG-Ssol)感染后观察到的大约10倍。此外,被VV-TN-Ssol病毒感染的CV-1细胞比被VV-TG-Ssol病毒感染的细胞能够更有效地分泌Ssol多肽至其上清液(图36A)。在此实验中,使用VV-TN-Sflag病毒作为对照,因为它能表达在C端融合FLAG标签的S蛋白的膜形式。在被VV-TN-Sflag感染的细胞上清液中没有检出Sflag蛋白,证实在用VV-TN-Ssol感染后Ssol多肽确实被活跃地分泌。
这些结果证实重组牛痘病毒是转基因的合适载体,并且可使SARS糖蛋白以其膜形式(S)或者可溶或分泌形式(Ssol)表达。携带有合成启动子480的牛痘病毒允许的S蛋白表达和Ssol分泌的水平比携带7.5K基因启动子的病毒要高得多。
4)在生产SARS-CoV的S蛋白可溶形式中的应用。这种重组抗原的纯化和诊断应用 BHK-21细胞系是所测细胞系(BHK-21、CV1、293T和FRhK-4,图36B)中在感染VV-TN-Ssol后Ssol多肽的分泌量最高的细胞系;它可以用于重组Ssol多肽的大量生产和纯化。在一个优化了感染、生产和纯化条件的典型实验中,BHK-21细胞在标准培养基(无丙酮酸盐的DMEM培养基,含4.5g/l葡萄糖,添加5%TPB、5%FCS、100U/ml青霉素、100μg/ml链霉素)上以分会合单层(每100Cm2107个细胞,25ml培养基)的形式接种。在37℃、5%CO2的条件下培养24小时后,以0.03的感染复数感染细胞,并用FCS含量减为0.5%、不含TPB的分泌培养基替换标准培养基。在35℃、5%CO2的条件下培养2.5天后移去培养上清液并加入Triton X-100(0.1%)使牛痘病毒失活。在用0.1μm聚醚砜(PES)膜过滤后,重组Ssol多肽通过下述步骤纯化在抗FLAG基质上亲和层析、用含100μg/ml FLAG肽(DYKDDDDK)的TBS溶液(50mM Tris、pH7.4、150mM NaCl)洗脱。
用硝酸银染色的8%SDS丙烯酰胺凝胶电泳分析确定占优势的多肽分子量约为180kD,纯度大于90%(图37)。纯化的Ssol重组多肽的浓度通过与分子量标记的比较而测定,估计浓度为24ng/μl。
纯化的Ssol多肽制品使得可以制备校准系列,从而使用捕获ELISA测试来测定培养上清液中的Ssol浓度。根据本测试,在上述的生产条件下,BHK-21细胞系分泌约1μg/ml的Ssol多肽。另外,使用上述的纯化步骤每升培养上清液可以纯化大约160μg的Ssol多肽。
分析了重组Ssol多肽对于来自SARS患者的血清的ELISA反应性。
来自SARS疑似病例的待测血清基于其针对SARS-CoV的天然抗原的特异反应性的分析结果(阳性或阴性)挑选,所述分析通过对于被SARS-CoV感染的Vero E6细胞的免疫荧光测试和/或以被SARS-CoV感染的Vero E6细胞的裂解物为抗原的间接ELISA测试进行。这些患者的血清以国家流感病毒文献中心的系列号和患者姓名缩写以及出现症状后经过的天数来定义。除了患者VTT的032552血清以外,所有疑似病例的血清(见表XVI)均识别SARS-CoV的天然抗原,该患者VTT的SARS-CoV感染不能通过对3、8和12天的呼吸器官样本的RT-PCR来确诊。使用一组对照血清作为对照(TV血清)它们采集于2003年SARS流行前的法国。
表XVISARS疑似病例的血清 使用重组Ssol多肽致敏的固相通过含4μg/ml的纯化Ssol多肽的PBS溶液在ELISA平板孔中的吸附制备。平板在4℃培养过夜,然后用PBS-Tween缓冲液(PBS、0.1%Tween 20)洗涤。在用PBS-Tween洗涤之后,将待测血清(100μl)在PBS-脱脂牛奶-Tween缓冲液(PBS、3%脱脂牛奶、0.1%Tween)中稀释至1/100和1/400,然后加至致敏的ELISA平板的孔中。平板置于37℃培养1小时。在用PBS-Tween缓冲液洗涤3次之后,加入在在PBS-脱脂牛奶-Tween缓冲液中稀释至1/4000的过氧化物酶标记的抗人IgG缀合物(参照号NA933V,Amersham),然后将平板置于37℃培养1小时。在用PBS-Tween缓冲液洗涤6次之后,加入色原体(TMB)和底物(H2O2)并将平板避光培养10分钟。加入1M H3PO4溶液终止反应然后在测量以620nm处为参照的450nm处的吸光度。
ELISA测试的结果(图38)证实重组Ssol多肽可被采集于感染中期或晚期(出现症状后的≥10天)的SARS患者的血清抗体特异性地识别,而却不能被未感染SARS的受试者的对照血清明显地识别。
总之,上述结果证实,重组Ssol多肽可以从被重组牛痘病毒VV-TN-Ssol感染的哺乳动物细胞上清液中被纯化,并可以在开发SARS-CoV感染的血清学诊断的ELISA测试中作为抗原使用。
5)疫苗应用 在小鼠体内研究了重组牛痘病毒的免疫原性。
为此,以4周的时间间隔以静脉注射途径对几组(每组7只)BALB/c小鼠进行了两次免疫,免疫使用了106p.f.u.的重组牛痘病毒VV-TG、VV-TG-S、VV-TG-Ssol、VV-TN、VV-TN-S和VV-TN-Ssol,并且使用了指导流感病毒A/PR/8/34毒株的血凝素表达的VV-TG-HA作为对照。在每次免疫后3周采集免疫血清(IS1、IS2)。
将各组中每一组的免疫血清混合后用间接ELISA进行分析,所述间接ELISA使用被SARS-CoV感染的Vero E6细胞裂解物作为抗原、未感染的Vero E6细胞裂解物作为对照。用过氧化物酶偶联的抗小鼠IgG(H+L)多克隆抗体(NA931V,Amersham)和添加H2O2的TMB(KPL)进行可视化后,以产生特定的OD值0.5时的抗体稀释度的倒数计算抗SARS-CoV抗体的效价(TI)。该分析(图39A)显示,从第一次免疫开始,使用VV-TG-S和VV-TN-S病毒的免疫就可在小鼠体内诱导针对被感染的Vero E6细胞裂解物中存在的SARS-CoV刺蛋白天然形式的抗体。由VV-TN-S病毒诱导的应答比VV-TG-S病毒诱导的应答强,在第一次免疫(TI分别为740和270)和第二次免疫(TI分别为3230和600)后均是如此。VV-TN-Ssol病毒在两次免疫后诱导高效价的抗SARS-CoV抗体(TI=640),而VV-TG-Ssol病毒诱导的应答仅在检出限上(TI=40)。
将各组中每一组的免疫血清混合后分析了其血清中和SARS-CoV感染性的能力。从1/20开始逐次二倍稀释血清,每个二倍稀释液测试FRhK-4细胞(100 TCID50的SARS-CoV)的4个血清中和的孔。根据Reed和Munsch的方法,以可中和4个孔中的两个的感染性的血清稀释度的倒数计算血清中和效价。该分析显示以表达S蛋白或Ssol多肽的牛痘病毒在小鼠体内诱导的抗体是中和性的,并且携带合成启动子的病毒与携带7.5K启动子的病毒相比免疫原性更强在2次使用VV-TN-S病毒免疫后观察到了最高的效价(640)(图39B)。
使用SARS-CoV攻击感染评估了在使用重组牛痘病毒免疫后在小鼠体内诱导的中和抗体的保护力。
6)其他应用 如上所述,通过将S和Ssol基因的野生型序列替换为在哺乳动物细胞中表达最优化的合成基因的方式,构建了第三代重组牛痘病毒。这些重组牛痘病毒能表达更大量的S和Ssol抗原,因此具有更高的免疫原性。
重组牛痘病毒VV-TN-Ssol可以用于Ssol抗原的大量生产和纯化,该Ssol抗原可用于诊断(ELISA血清学检验)和疫苗(亚单位疫苗)用途 实施例17表达SARS相关联冠状病毒(SARS-CoV)刺(S)蛋白的重组麻疹病毒。疫苗应用。
1)介绍 麻疹疫苗(MV)在一次单独注射后可在人体内诱导持续的保护性免疫(Hilleman,2002,Vaccine,20651-655)。所产生的保护作用相当稳定,而且该保护作用基于抗体应答和CD4和CD8细胞应答的诱导。MV基因组非常稳定并且从未观察到疫苗株致病性的逆转。麻疹病毒属于副粘病毒(Paramyxoviridae)科麻疹病毒(Morbillivirus)属;它是一种包膜病毒,其基因组为16kb单链负极性RNA(图40A),并且其唯一性的胞质复制循环也排除了其整合至宿主基因组的任何可能性。因此麻疹疫苗确实是用于人群的最有效和最安全的活疫苗之一。FrédéricTangy的研究小组最近在麻疹病毒Schwarz株的基础上开发出了一种表达载体,麻疹病毒Schwarz株是最安全的减毒株并且作为抗麻疹的疫苗被最广泛地用于人类。该疫苗毒株可以从感染性的分子克隆中分离,并保留了其在对感染敏感的灵长类和小鼠中的免疫原性。在插入附加转录单位之后,它构成了一个表达异源序列的载体(Combredet,2003,J.Virol. 7711546-11554)。此外,表达西尼罗病毒(virus West Nile,WNV)的包膜糖蛋白的重组MV Schwarz株可以诱导持续有效的抗体应答,所述抗体应答可以保护小鼠不受WNV的致命性攻击感染(Despres et al.,2004,J.Infect.Dis.,待出版)。所有上述的特性使得麻疹病毒的减毒株Schwarz成为一个非常有希望用于新重组活疫苗构建的候选载体。
本实施例的目的是评估表达各种SARS相关联冠状病毒(SARS-CoV)抗原的重组麻疹病毒(MV)构成新的抗SARS候选疫苗的能力。
为此,发明人着重于SARS-CoV刺(S)蛋白,它可在对动物基因免疫后诱导中和SARS-CoV感染性的抗体;还着重于S蛋白的可溶形式和分泌形式——Ssol多肽,该多肽由S蛋白的胞外结构域(1-1193氨基酸)在其C端通过一个编码SG二肽的BspE1接头与FLAG标签(DYKDDDDK)融合而组成。该Ssol多肽显示与S蛋白相似的抗原性,并且在用纯化的蛋白和氢氧化铝佐剂注射小鼠后,可以诱导高效价的抗SARS-CoV中和抗体。
将S基因的各种形式以P(磷蛋白)和M(基质)基因之间的附加转录单位的形式引入上述的MV Schwarz株(Combredet,2003,J.Virol.7711546-11554;2002年6月20日的欧洲专利申请No.02291551.6和2002年6月20日的欧洲专利申请No.02291550.8)的cDNA中。
在分离了重组病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol并检验了其表达SARS-CoV的S抗原的能力之后,测试了其在小鼠及猴子体内诱导抗SARS的保护性免疫应答的能力。
2)重组病毒的构建 质粒pTM-MVSchw-ATU2(图40B)含有相应于麻疹病毒(MV)Schwarz疫苗株的反基因组的感染性cDNA,在其中的P(磷蛋白)和M(基质)基因之间引入了一个附加转录单位(ATU)(Combredet,2003,Journalof Virology,7711546-11554)。麻疹病毒的重组基因组MVSchw2-SARS-S和MVSchw2-SARS-Ssol通过将S蛋白和Ssol多肽的ORF插入到MVSchw-ATU2载体的附加转录单位之中而构建。
为此,用PCR扩增了一个含有SARS-CoV的S蛋白cDNA的DNA片段,所述扩增以质粒pcDNA-S为模板,并使用了下列寡核苷酸5’-ATACGTACGA CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’和5’-ATAGCGCGCT CATTATGTGT AATGTAATTT GACACCCTTG-3’,然后将所得片段插入到质粒pCR_2.1-TOPO(Invitrogen)中,从而得到质粒pTOPO-S-MV。上面使用的两个寡核苷酸包含有限制酶切位点BsiW1和BssHII,这使得序列随后可被插入到麻疹载体内,并且上述寡核苷酸的设计使得可以生成一个包含起始和终止密码子的3774核苷酸的序列,这样就能够遵守6法则,该法则限定麻疹病毒的基因组长度必须能被6整除(Calain & Roux,1993,J. Virol.,674822-4830;Schneideretal.,1997,Virology,227314-322)。所述插入物使用BigDyeTerminator v1.1试剂盒(Applied Biosystems)和ABI377自动测序仪进行了测序。
为表达SARS-CoV的S蛋白的可溶和分泌形式,获得了包括Ssol多肽的cDNA的质粒,该cDNA对应于在C端通过一个编码SG二肽的BspE1接头与FLAG标签序列(DYKDDDDK)融合的SARS-CoV的S蛋白的胞外结构域(1-1193氨基酸)。为此,使用下列寡核苷酸从质粒pcDNA-Ssol中扩增了一个DNA片段5’-CCATTTCAAC AATTTGGCCG-3’和5’-ATAGGATCCGCGCGCTCATT ATTTATCGTC GTCATCTTTA TAATC-3’,然后将所得的片段插入到质粒pTOPO-S-MV的Sal1和BamH1酶切位点之间,从而得到质粒pTOPO-S-MV-SF。生成的序列在BsiW1和BssHII位点之间的长度为3618个核苷酸,也遵守6法则。插入物使用上述方法测序。
包括S蛋白和Ssol多肽cDNA的BsiW1-BssHII片段通过消化作用能够被从质粒pTOPO-S-MV和pTOPO-S-MV-SF上切除,并被亚克隆至质粒pTM-MVSchw-ATU2的相应位点之间,从而得到质粒pTM-MVSchw2-SARS-S和pTM-MVSchw2-SARS-Ssol(图40B)。这两个质粒保藏于CNCM.,保藏日期2004年12月1日,编号分别为I-3326和I-3327。
通过下述手段获得了对应于质粒pTM-MVSchw2-SARS-S和pTM-MVSchw2-SARS-Ssol的重组麻疹病毒使用了基于使用辅助细胞系的系统的反求遗传学方法,该方法由Radecke等人描述(1995,Embo.J.,145773-5784)并由Parks等人改进(1999,J.Virol.,733560-3566)。简而言之,根据磷酸钙方法,用5μg的质粒pTM-MVSchw2-SARS-S或pTM-MVSchw2-SARS-Ssol和0.02μg指导MV L聚合酶表达的质粒pEMC-La(由M.A.Billeter惠赠)转染辅助细胞293-3-46。在37℃培养过夜后,于43℃热击2小时,然后将转染的细胞转移至Vero细胞单层上。对于这两个质粒的每一个而言,合胞体出现于共培养的2至3天后,将合胞体连续转移至达到70%会合的Vero细胞单层上,先是在35mm的Petri培养皿中,然后转移至25和75cm2的培养瓶中。当合胞体达到80-90%的会合时,用刮刀收集细胞然后冻融细胞一次。在低速离心后将含有病毒的上清液以等分试样存于-80℃。重组病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol的效价根据在Vero细胞上的有限稀释以及感染50%的孔的剂量(TCID50)确定,根据K_rber的方法计算。
3)重组病毒的鉴定 编码S蛋白和Ssol多肽的转基因的表达由蛋白质免疫印迹法及免疫荧光法测定。
使用不同传代数的两种病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol以及作为对照的野生型病毒MWSchw以感染复数0.05感染T-25培养瓶中的Vero细胞单层。当合胞体达到80-90%的会合时,在提取缓冲液中(150mM NaCl、50mM Tris-HCl、pH7.2、1%TritonX-100、0.1%SDS、1%DOC)制备胞质提取物,然后根据Laemmli的方法在加样缓冲液中稀释胞质提取物并在8%SDS聚丙烯酰胺凝胶上分离,然后转移至PVDF膜(BioRad)上。使用抗S蛋白兔多克隆血清(来自兔P11135的免疫血清,参见实施例4)和过氧化物酶偶联的抗兔IgG的驴多克隆抗体(NA934V,Amersham)进行了免疫印迹(蛋白质免疫印迹分析)检测。结合抗体的发光法可视化使用了ECL+试剂盒(Amersham)和放射自显影胶片Hyperfilm MP(Amersham)。
使用两种病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol以及作为对照的野生型病毒MWSchw以感染复数0.05感染玻璃载玻片上的Vero细胞单层。当合胞体达到90-100%(MVSchw2-SARS-Ssol病毒)或30-40%(MVSchw2-SARS-S、MVSchw)的会合时,用4%PBS-PFA溶液固定细胞,用含0.2%Triton的PBS溶液透化处理后用兔多克隆抗体标记,该兔多克隆抗体是用纯化和失活的SARS-CoV病毒体高度免疫的,然后再用FITC偶联的山羊抗兔IgG(H+L)抗体(Jackson)缀合物进行标记。
如图41和42所示,重组病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol指导的S蛋白和Ssol多肽表达水平分别与用SARS-CoV感染8小时后观察到的表达水平相近。这些多肽的表达在细胞培养物中在重组病毒传代3代后仍然稳定。上述结果证实重组麻疹病毒是合适的转基因载体,并且可使SARS糖蛋白以其膜形式(S)或可溶形式(Ssol)表达。当用相应序列瞬时转染后,Ssol多肽在哺乳动物细胞中表达(参见上述实施例11),按照这种情况,Ssol多肽预期可由被MVSchw2-SARS-Ssol病毒感染的细胞分泌。
4)应用 在发现病毒MVSchw2-SARS-S和MVSchw2-SARS-Ssol可以表达SARS-CoV的S蛋白之后,评估了它们在小鼠体内诱导针对SARS-CoV的保护性免疫应答的能力,所述小鼠为对MV感染敏感的CD46+/-IFN-αβR-/-小鼠。使用上述的方法通过针对SARS-CoV天然抗原的ELISA测试,评估了免疫小鼠的抗体应答及其在体外中和SARS-CoV感染性的能力。在用SARS-CoV非致命性攻击感染2天后,通过测量肺部病毒载量的减少来评估应答的保护力。
根据上述实施例15中描述的方法,通过将S和Ssol基因的野生型序列替换为上述为在哺乳动物细胞中表达而优化的合成基因的方式,构建了第二代重组麻疹病毒。这些重组麻疹病毒能表达更大量的S和Ssol抗原,因此具有更高的免疫原性。
或者,编码S蛋白或Ssol多肽的野生型或合成基因可以以H和L基因之间的附加转录单位的形式被插入到麻疹载体MVSchw-ATU3中,然后以类似的方式生产和鉴定重组病毒。这种插入能够生成具有不同特性(病毒的增殖、转基因的表达水平)的重组病毒,该重组病毒与在P和N基因之间插入转基因所得的重组病毒相比,可能具有改善的免疫原性。
重组麻疹病毒MVSchw2-SARS-Ssol可以用于Ssol抗原的大量生产和纯化,该Ssol抗原可用于诊断和疫苗用途。
实施例18有关S蛋白的其他应用 a)能表达S蛋白或Ssol(甚至是S蛋白的片段)的慢病毒载体可以构成抗SARS-CoV的重组疫苗,从而用于人类或兽类的疾病预防。为证实这种疫苗的可行性,在小鼠体内研究了重组慢病毒载体TRIP-SD/SA-S-WPRE和TRIP-SD/SA-Ssol-WPRE的免疫原性。
b)使用重组Ssol多肽生产了单克隆抗体。根据上述实施例14中的结果,这些抗体或至少它们中的大部分能够识别SARS-CoV的S蛋白的天然形式,并且能够用于诊断和/或预防用途。
c)开发了以Ssol多肽为抗原和双表位方法的SARS的血清学检测方法。
序列表
<110>巴斯德研究所
国家科研中心
巴黎第七大学
S.范德 沃夫
N.埃斯克里奥
B.克瑞森佐-钱格尼
J-C.马努格拉
F.孔斯特
B.卡伦德特
J-M.贝滕
V.洛林
S.杰尔鲍德
A M.伯尔基埃
S.阿泽比
P.查尼奥
F.坦吉
C.库姆布雷迪特
J-F.德拉格尼奥
M.马丁
<120>由SARS相关联冠状病毒新病毒株的基因组编码的蛋白质和肽的用途
<130>226-111ext
<150>FR 0314152
<151>2003-12-02
<150>FR 0314151
<151>2003-12-02
<160>158
<170>PatentIn version 3.1
<210>1
<211>29746
<212>DNA
<213>冠状病毒
<400>1
atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60
ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 120
gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct 180
tctgcagact gcttacggtt tcgtccgtgt tgcagtcgat catcagcata cctaggtttc 240
gtccgggtgt gaccgaaagg taagatggag agccttgttc ttggtgtcaa cgagaaaaca 300
cacgtccaac tcagtttgcc tgtccttcag gttagagacg tgctagtgcg tggcttcggg 360
gactctgtgg aagaggccct atcggaggca cgtgaacacc tcaaaaatgg cacttgtggt 420
ctagtagagc tggaaaaagg cgtactgccc cagcttgaac agccctatgt gttcattaaa 480
cgttctgatg ccttaagcac caatcacggc cacaaggtcg ttgagctggt tgcagaaatg 540
gacggcattc agtacggtcg tagcggtata acactgggag tactcgtgcc acatgtgggc 600
gaaaccccaa ttgcataccg caatgttctt cttcgtaaga acggtaataa gggagccggt 660
ggtcatagct atggcatcga tctaaagtct tatgacttag gtgacgagct tggcactgat 720
cccattgaag attatgaaca aaactggaac actaagcatg gcagtggtgc actccgtgaa 780
ctcactcgtg agctcaatgg aggtgcagtc actcgctatg tcgacaacaa tttctgtggc 840
ccagatgggt accctcttga ttgcatcaaa gattttctcg cacgcgcggg caagtcaatg 900
tgcactcttt ccgaacaact tgattacatc gagtcgaaga gaggtgtcta ctgctgccgt 960
gaccatgagc atgaaattgc ctggttcact gagcgctctg ataagagcta cgagcaccag1020
acacccttcg aaattaagag tgccaagaaa tttgacactt tcaaagggga atgcccaaag1080
tttgtgtttc ctcttaactc aaaagtcaaa gtcattcaac cacgtgttga aaagaaaaag1140
actgagggtt tcatggggcg tatacgctct gtgtaccctg ttgcatctcc acaggagtgt1200
aacaatatgc acttgtctac cttgatgaaa tgtaatcatt gcgatgaagt ttcatggcag1260
acgtgcgact ttctgaaagc cacttgtgaa cattgtggca ctgaaaattt agttattgaa1320
ggacctacta catgtgggta cctacctact aatgctgtag tgaaaatgcc atgtcctgcc1380
tgtcaagacc cagagattgg acctgagcat agtgttgcag attatcacaa ccactcaaac1440
attgaaactc gactccgcaa gggaggtagg actagatgtt ttggaggctg tgtgtttgcc1500
tatgttggct gctataataa gcgtgcctac tgggttcctc gtgctagtgc tgatattggc1560
tcaggccata ctggcattac tggtgacaat gtggagacct tgaatgagga tctccttgag1620
atactgagtc gtgaacgtgt taacattaac attgttggcg attttcattt gaatgaagag1680
gttgccatca ttttggcatc tttctctgct tctacaagtg cctttattga cactataaag1740
agtcttgatt acaagtcttt caaaaccatt gttgagtcct gcggtaacta taaagttacc1800
aagggaaagc ccgtaaaagg tgcttggaac attggacaac agagatcagt tttaacacca1860
ctgtgtggtt ttccctcaca ggctgctggt gttatcagat caatttttgc gcgcacactt1920
gatgcagcaa accactcaat tcctgatttg caaagagcag ctgtcaccat acttgatggt1980
atttctgaac agtcattacg tcttgtcgac gccatggttt atacttcaga cctgctcacc2040
aacagtgtca ttattatggc atatgtaact ggtggtcttg tacaacagac ttctcagtgg2100
ttgtctaatc ttttgggcac tactgttgaa aaactcaggc ctatctttga atggattgag2160
gcgaaactta gtgcaggagt tgaatttctc aaggatgctt gggagattct caaatttctc2220
attacaggtg tttttgacat cgtcaagggt caaatacagg ttgcttcaga taacatcaag2280
gattgtgtaa aatgcttcat tgatgttgtt aacaaggcac tcgaaatgtg cattgatcaa2340
gtcactatcg ctggcgcaaa gttgcgatca ctcaacttag gtgaagtctt catcgctcaa2400
agcaagggac tttaccgtca gtgtatacgt ggcaaggagc agctgcaact actcatgcct2460
cttaaggcac caaaagaagt aacctttctt gaaggtgatt cacatgacac agtacttacc2520
tctgaggagg ttgttctcaa gaacggtgaa ctcgaagcac tcgagacgcc cgttgatagc2580
ttcacaaatg gagctatcgt tggcacacca gtctgtgtaa atggcctcat gctcttagag2640
attaaggaca aagaacaata ctgcgcattg tctcctggtt tactggctac aaacaatgtc2700
tttcgcttaa aagggggtgc accaattaaa ggtgtaacct ttggagaaga tactgtttgg2760
gaagttcaag gttacaagaa tgtgagaatc acatttgagc ttgatgaacg tgttgacaaa2820
gtgcttaatg aaaagtgctc tgtctacact gttgaatccg gtaccgaagt tactgagttt2880
gcatgtgttg tagcagaggc tgttgtgaag actttacaac cagtttctga tctccttacc2940
aacatgggta ttgatcttga tgagtggagt gtagctacat tctacttatt tgatgatgct3000
ggtgaagaaa acttttcatc acgtatgtat tgttcctttt accctccaga tgaggaagaa3060
gaggacgatg cagagtgtga ggaagaagaa attgatgaaa cctgtgaaca tgagtacggt3120
acagaggatg attatcaagg tctccctctg gaatttggtg cctcagctga aacagttcga3180
gttgaggaag aagaagagga agactggctg gatgatacta ctgagcaatc agagattgag3240
ccagaaccag aacctacacc tgaagaacca gttaatcagt ttactggtta tttaaaactt3300
actgacaatg ttgccattaa atgtgttgac atcgttaagg aggcacaaag tgctaatcct3360
atggtgattg taaatgctgc taacatacac ctgaaacatg gtggtggtgt agcaggtgca3420
ctcaacaagg caaccaatgg tgccatgcaa aaggagagtg atgattacat taagctaaat3480
ggccctctta cagtaggagg gtcttgtttg ctttctggac ataatcttgc taagaagtgt3540
ctgcatgttg ttggacctaa cctaaatgca ggtgaggaca tccagcttct taaggcagca3600
tatgaaaatt tcaattcaca ggacatctta cttgcaccat tgttgtcagc aggcatattt3660
ggtgctaaac cacttcagtc tttacaagtg tgcgtgcaga cggttcgtac acaggtttat3720
attgcagtca atgacaaagc tctttatgag caggttgtca tggattatct tgataacctg3780
aagcctagag tggaagcacc taaacaagag gagccaccaa acacagaaga ttccaaaact3840
gaggagaaat ctgtcgtaca gaagcctgtc gatgtgaagc caaaaattaa ggcctgcatt3900
gatgaggtta ccacaacact ggaagaaact aagtttctta ccaataagtt actcttgttt3960
gctgatatca atggtaagct ttaccatgat tctcagaaca tgcttagagg tgaagatatg4020
tctttccttg agaaggatgc accttacatg gtaggtgatg ttatcactag tggtgatatc4080
acttgtgttg taataccctc caaaaaggct ggtggcacta ctgagatgct ctcaagagct4140
ttgaagaaag tgccagttga tgagtatata accacgtacc ctggacaagg atgtgctggt4200
tatacacttg aggaagctaa gactgctctt aagaaatgca aatctgcatt ttatgtacta4260
ccttcagaag cacctaatgc taaggaagag attctaggaa ctgtatcctg gaatttgaga4320
gaaatgcttg ctcatgctga agagacaaga aaattaatgc ctatatgcat ggatgttaga4380
gccataatgg caaccatcca acgtaagtat aaaggaatta aaattcaaga gggcatcgtt4440
gactatggtg tccgattctt cttttatact agtaaagagc ctgtagcttc tattattacg4500
aagctgaact ctctaaatga gccgcttgtc acaatgccaa ttggttatgt gacacatggt4560
tttaatcttg aagaggctgc gcgctgtatg cgttctctta aagctcctgc cgtagtgtca4620
gtatcatcac cagatgctgt tactacatat aatggatacc tcacttcgtc atcaaagaca4680
tctgaggagc actttgtaga aacagtttct ttggctggct cttacagaga ttggtcctat4740
tcaggacagc gtacagagtt aggtgttgaa tttcttaagc gtggtgacaa aattgtgtac4800
cacactctgg agagccccgt cgagtttcat cttgacggtg aggttctttc acttgacaaa4860
ctaaagagtc tcttatccct gcgggaggtt aagactataa aagtgttcac aactgtggac4920
aacactaatc tccacacaca gcttgtggat atgtctatga catatggaca gcagtttggt4980
ccaacatact tggatggtgc tgatgttaca aaaattaaac ctcatgtaaa tcatgagggt5040
aagactttct ttgtactacc tagtgatgac acactacgta gtgaagcttt cgagtactac5100
catactcttg atgagagttt tcttggtagg tacatgtctg ctttaaacca cacaaagaaa5160
tggaaatttc ctcaagttgg tggtttaact tcaattaaat gggctgataa caattgttat5220
ttgtctagtg ttttattagc acttcaacag cttgaagtca aattcaatgc accagcactt5280
caagaggctt attatagagc ccgtgctggt gatgctgcta acttttgtgc actcatactc5340
gcttacagta ataaaactgt tggcgagctt ggtgatgtca gagaaactat gacccatctt5400
ctacagcatg ctaatttgga atctgcaaag cgagttctta atgtggtgtg taaacattgt5460
ggtcagaaaa ctactacctt aacgggtgta gaagctgtga tgtatatggg tactctatct5520
tatgataatc ttaagacagg tgtttccatt ccatgtgtgt gtggtcgtga tgctacacaa5580
tatctagtac aacaagagtc ttcttttgtt atgatgtctg caccacctgc tgagtataaa5640
ttacagcaag gtacattctt atgtgcgaat gagtacactg gtaactatca gtgtggtcat5700
tacactcata taactgctaa ggagaccctc tatcgtattg acggagctca ccttacaaag5760
atgtcagagt acaaaggacc agtgactgat gttttctaca aggaaacatc ttacactaca5820
accatcaagc ctgtgtcgta taaactcgat ggagttactt acacagagat tgaaccaaaa5880
ttggatgggt attataaaaa ggataatgct tactatacag agcagcctat agaccttgta5940
ccaactcaac cattaccaaa tgcgagtttt gataatttca aactcacatg ttctaacaca6000
aaatttgctg atgatttaaa tcaaatgaca ggcttcacaa agccagcttc acgagagcta6060
tctgtcacat tcttcccaga cttgaatggc gatgtagtgg ctattgacta tagacactat6120
tcagcgagtt tcaagaaagg tgctaaatta ctgcataagc caattgtttg gcacattaac6180
caggctacaa ccaagacaac gttcaaacca aacacttggt gtttacgttg tctttggagt6240
acaaagccag tagatacttc aaattcattt gaagttctgg cagtagaaga cacacaagga6300
atggacaatc ttgcttgtga aagtcaacaa cccacctctg aagaagtagt ggaaaatcct6360
accatacaga aggaagtcat agagtgtgac gtgaaaacta ccgaagttgt aggcaatgtc6420
atacttaaac catcagatga aggtgttaaa gtaacacaag agttaggtca tgaggatctt6480
atggctgctt atgtggaaaa cacaagcatt accattaaga aacctaatga gctttcacta6540
gccttaggtt taaaaacaat tgccactcat ggtattgctg caattaatag tgttccttgg6600
agtaaaattt tggcttatgt caaaccattc ttaggacaag cagcaattac aacatcaaat6660
tgcgctaaga gattagcaca acgtgtgttt aacaattata tgccttatgt gtttacatta6720
ttgttccaat tgtgtacttt tactaaaagt accaattcta gaattagagc ttcactacct6780
acaactattg ctaaaaatag tgttaagagt gttgctaaat tatgtttgga tgccggcatt6840
aattatgtga agtcacccaa attttctaaa ttgttcacaa tcgctatgtg gctattgttg6900
ttaagtattt gcttaggttc tctaatctgt gtaactgctg cttttggtgt actcttatct6960
aattttggtg ctccttctta ttgtaatggc gttagagaat tgtatcttaa ttcgtctaac7020
gttactacta tggatttctg tgaaggttct tttccttgca gcatttgttt aagtggatta7080
gactcccttg attcttatcc agctcttgaa accattcagg tgacgatttc atcgtacaag7140
ctagacttga caattttagg tctggccgct gagtgggttt tggcatatat gttgttcaca7200
aaattctttt atttattagg tctttcagct ataatgcagg tgttctttgg ctattttgct7260
agtcatttca tcagcaattc ttggctcatg tggtttatca ttagtattgt acaaatggca7320
cccgtttctg caatggttag gatgtacatc ttctttgctt ctttctacta catatggaag7380
agctatgttc atatcatgga tggttgcacc tcttcgactt gcatgatgtg ctataagcgc7440
aatcgtgcca cacgcgttga gtgtacaact attgttaatg gcatgaagag atctttctat7500
gtctatgcaa atggaggccg tggcttctgc aagactcaca attggaattg tctcaattgt7560
gacacatttt gcactggtag tacattcatt agtgatgaag ttgctcgtga tttgtcactc7620
cagtttaaaa gaccaatcaa ccctactgac cagtcatcgt atattgttga tagtgttgct7680
gtgaaaaatg gcgcgcttca cctctacttt gacaaggctg gtcaaaagac ctatgagaga7740
catccgctct cccattttgt caatttagac aatttgagag ctaacaacac taaaggttca7800
ctgcctatta atgtcatagt ttttgatggc aagtccaaat gcgacgagtc tgcttctaag7860
tctgcttctg tgtactacag tcagctgatg tgccaaccta ttctgttgct tgaccaagct7920
cttgtatcag acgttggaga tagtactgaa gtttccgtta agatgtttga tgcttatgtc7980
gacacctttt cagcaacttt tagtgttcct atggaaaaac ttaaggcact tgttgctaca8040
gctcacagcg agttagcaaa gggtgtagct ttagatggtg tcctttctac attcgtgtca8100
gctgcccgac aaggtgttgt tgataccgat gttgacacaa aggatgttat tgaatgtctc8160
aaactttcac atcactctga cttagaagtg acaggtgata gttgtaacaa tttcatgctc8220
acctataata aggttgaaaa catgacgccc agagatcttg gcgcatgtat tgactgtaat8280
gcaaggcata tcaatgccca agtagcaaaa agtcacaatg tttcactcat ctggaatgta8340
aaagactaca tgtctttatc tgaacagctg cgtaaacaaa ttcgtagtgc tgccaagaag8400
aacaacatac cttttagact aacttgtgct acaactagac aggttgtcaa tgtcataact8460
actaaaatct cactcaaggg tggtaagatt gttagtactt gttttaaact tatgcttaag8520
gccacattat tgtgcgttct tgctgcattg gtttgttata tcgttatgcc agtacataca8580
ttgtcaatcc atgatggtta cacaaatgaa atcattggtt acaaagccat tcaggatggt8640
gtcactcgtg acatcatttc tactgatgat tgttttgcaa ataaacatgc tggttttgac8700
gcatggttta gccagcgtgg tggttcatac aaaaatgaca aaagctgccc tgtagtagct8760
gctatcatta caagagagat tggtttcata gtgcctggct taccgggtac tgtgctgaga8820
gcaatcaatg gtgacttctt gcattttcta cctcgtgttt ttagtgctgt tggcaacatt8880
tgctacacac cttccaaact cattgagtat agtgattttg ctacctctgc ttgcgttctt8940
gctgctgagt gtacaatttt taaggatgct atgggcaaac ctgtgccata ttgttatgac9000
actaatttgc tagagggttc tatttcttat agtgagcttc gtccagacac tcgttatgtg9060
cttatggatg gttccatcat acagtttcct aacacttacc tggagggttc tgttagagta9120
gtaacaactt ttgatgctga gtactgtaga catggtacat gcgaaaggtc agaagtaggt9180
atttgcctat ctaccagtgg tagatgggtt cttaataatg agcattacag agctctatca9240
ggagttttct gtggtgttga tgcgatgaat ctcatagcta acatctttac tcctcttgtg9300
caacctgtgg gtgctttaga tgtgtctgct tcagtagtgg ctggtggtat tattgccata9360
ttggtgactt gtgctgccta ctactttatg aaattcagac gtgtttttgg tgagtacaac9420
catgttgttg ctgctaatgc acttttgttt ttgatgtctt tcactatact ctgtctggta9480
ccagcttaca gctttctgcc gggagtctac tcagtctttt acttgtactt gacattctat9540
ttcaccaatg atgtttcatt cttggctcac cttcaatggt ttgccatgtt ttctcctatt9600
gtgccttttt ggataacagc aatctatgta ttctgtattt ctctgaagca ctgccattgg9660
ttctttaaca actatcttag gaaaagagtc atgtttaatg gagttacatt tagtaccttc9720
gaggaggctg ctttgtgtac ctttttgctc aacaaggaaa tgtacctaaa attgcgtagc9780
gagacactgt tgccacttac acagtataac aggtatcttg ctctatataa caagtacaag9840
tatttcagtg gagccttaga tactaccagc tatcgtgaag cagcttgctg ccacttagca9900
aaggctctaa atgactttag caactcaggt gctgatgttc tctaccaacc accacagaca9960
tcaatcactt ctgctgttct gcagagtggt tttaggaaaa tggcattccc gtcaggcaaa 10020
gttgaagggt gcatggtaca agtaacctgt ggaactacaa ctcttaatgg attgtggttg 10080
gatgacacag tatactgtcc aagacatgtc atttgcacag cagaagacat gcttaatcct 10140
aactatgaag atctgctcat tcgcaaatcc aaccatagct ttcttgttca ggctggcaat 10200
gttcaacttc gtgttattgg ccattctatg caaaattgtc tgcttaggct taaagttgat 10260
acttctaacc ctaagacacc caagtataaa tttgtccgta tccaacctgg tcaaacattt 10320
tcagttctag catgctacaa tggttcacca tctggtgttt atcagtgtgc catgagacct 10380
aatcatacca ttaaaggttc tttccttaat ggatcatgtg gtagtgttgg ttttaacatt 10440
gattatgatt gcgtgtcttt ctgctatatg catcatatgg agcttccaac aggagtacac 10500
gctggtactg acttagaagg taaattctat ggtccatttg ttgacagaca aactgcacag 10560
gctgcaggta cagacacaac cataacatta aatgttttgg catggctgta tgctgctgtt 10620
atcaatggtg ataggtggtt tcttaataga ttcaccacta ctttgaatga ctttaacctt 10680
gtggcaatga agtacaacta tgaacctttg acacaagatc atgttgacat attgggacct 10740
ctttctgctc aaacaggaat tgccgtctta gatatgtgtg ctgctttgaa agagctgctg 10800
cagaatggta tgaatggtcg tactatcctt ggtagcacta ttttagaaga tgagtttaca 10860
ccatttgatg ttgttagaca atgctctggt gttaccttcc aaggtaagtt caagaaaatt 10920
gttaagggca ctcatcattg gatgctttta actttcttga catcactatt gattcttgtt 10980
caaagtacac agtggtcact gtttttcttt gtttacgaga atgctttctt gccatttact 11040
cttggtatta tggcaattgc tgcatgtgct atgctgcttg ttaagcataa gcacgcattc 11100
ttgtgcttgt ttctgttacc ttctcttgca acagttgctt actttaatat ggtctacatg 11160
cctgctagct gggtgatgcg tatcatgaca tggcttgaat tggctgacac tagcttgtct 11220
ggttataggc ttaaggattg tgttatgtat gcttcagctt tagttttgct tattctcatg 11280
acagctcgca ctgtttatga tgatgctgct agacgtgttt ggacactgat gaatgtcatt 11340
acacttgttt acaaagtcta ctatggtaat gctttagatc aagctatttc catgtgggcc 11400
ttagttattt ctgtaacctc taactattct ggtgtcgtta cgactatcat gtttttagct 11460
agagctatag tgtttgtgtg tgttgagtat tacccattgt tatttattac tggcaacacc 11520
ttacagtgta tcatgcttgt ttattgtttc ttaggctatt gttgctgctg ctactttggc 11580
cttttctgtt tactcaaccg ttacttcagg cttactcttg gtgtttatga ctacttggtc 11640
tctacacaag aatttaggta tatgaactcc caggggcttt tgcctcctaa gagtagtatt 11700
gatgctttca agcttaacat taagttgttg ggtattggag gtaaaccatg tatcaaggtt 11760
gctactgtac agtctaaaat gtctgacgta aagtgcacat ctgtggtact gctctcggtt 11820
cttcaacaac ttagagtaga gtcatcttct aaattgtggg cacaatgtgt acaactccac 11880
aatgatattc ttcttgcaaa agacacaact gaagctttcg agaagatggt ttctcttttg 11940
tctgttttgc tatccatgca gggtgctgta gacattaata ggttgtgcga ggaaatgctc 12000
gataaccgtg ctactcttca ggctattgct tcagaattta gttctttacc atcatatgcc 12060
gcttatgcca ctgcccagga ggcctatgag caggctgtag ctaatggtga ttctgaagtc 12120
gttctcaaaa agttaaagaa atctttgaat gtggctaaat ctgagtttga ccgtgatgct 12180
gccatgcaac gcaagttgga aaagatggca gatcaggcta tgacccaaat gtacaaacag 12240
gcaagatctg aggacaagag ggcaaaagta actagtgcta tgcaaacaat gctcttcact 12300
atgcttagga agcttgataa tgatgcactt aacaacatta tcaacaatgc gcgtgatggt12360
tgtgttccac tcaacatcat accattgact acagcagcca aactcatggt tgttgtccct12420
gattatggta cctacaagaa cacttgtgat ggtaacacct ttacatatgc atctgcactc12480
tgggaaatcc agcaagttgt tgatgcggat agcaagattg ttcaacttag tgaaattaac12540
atggacaatt caccaaattt ggcttggcct cttattgtta cagctctaag agccaactca12600
gctgttaaac tacagaataa tgaactgagt ccagtagcac tacgacagat gtcctgtgcg12660
gctggtacca cacaaacagc ttgtactgat gacaatgcac ttgcctacta taacaattcg12720
aagggaggta ggtttgtgct ggcattacta tcagaccacc aagatctcaa atgggctaga12780
ttccctaaga gtgatggtac aggtacaatt tacacagaac tggaaccacc ttgtaggttt12840
gttacagaca caccaaaagg gcctaaagtg aaatacttgt acttcatcaa aggcttaaac12900
aacctaaata gaggtatggt gctgggcagt ttagctgcta cagtacgtct tcaggctgga12960
aatgctacag aagtacctgc caattcaact gtgctttcct tctgtgcttt tgcagtagac13020
cctgctaaag catataagga ttacctagca agtggaggac aaccaatcac caactgtgtg13080
aagatgttgt gtacacacac tggtacagga caggcaatta ctgtaacacc agaagctaac13140
atggaccaag agtcctttgg tggtgcttca tgttgtctgt attgtagatg ccacattgac13200
catccaaatc ctaaaggatt ctgtgacttg aaaggtaagt acgtccaaat acctaccact13260
tgtgctaatg acccagtggg ttttacactt agaaacacag tctgtaccgt ctgcggaatg13320
tggaaaggtt atggctgtag ttgtgaccaa ctccgcgaac ccttgatgca gtctgcggat13380
gcatcaacgt ttttaaacgg gtttgcggtg taagtgcagc ccgtcttaca ccgtgcggca13440
caggcactag tactgatgtc gtctacaggg cttttgatat ttacaacgaa aaagttgctg13500
gttttgcaaa gttcctaaaa actaattgct gtcgcttcca ggagaaggat gaggaaggca13560
atttattaga ctcttacttt gtagttaaga ggcatactat gtctaactac caacatgaag13620
agactattta taacttggtt aaagattgtc cagcggttgc tgtccatgac tttttcaagt13680
ttagagtaga tggtgacatg gtaccacata tatcacgtca gcgtctaact aaatacacaa13740
tggctgattt agtctatgct ctacgtcatt ttgatgaggg taattgtgat acattaaaag13800
aaatactcgt cacatacaat tgctgtgatg atgattattt caataagaag gattggtatg13860
acttcgtaga gaatcctgac atcttacgcg tatatgctaa cttaggtgag cgtgtacgcc13920
aatcattatt aaagactgta caattctgcg atgctatgcg tgatgcaggc attgtaggcg13980
tactgacatt agataatcag gatcttaatg ggaactggta cgatttcggt gatttcgtac14040
aagtagcacc aggctgcgga gttcctattg tggattcata ttactcattg ctgatgccca14100
tcctcacttt gactagggca ttggctgctg agtcccatat ggatgctgat ctcgcaaaac14160
cacttattaa gtgggatttg ctgaaatatg attttacgga agagagactt tgtctcttcg14220
accgttattt taaatattgg gaccagacat accatcccaa ttgtattaac tgtttggatg14280
ataggtgtat ccttcattgt gcaaacttta atgtgttatt ttctactgtg tttccaccta14340
caagttttgg accactagta agaaaaatat ttgtagatgg tgttcctttt gttgtttcaa14400
ctggatacca ttttcgtgag ttaggagtcg tacataatca ggatgtaaac ttacatagct14460
cgcgtctcag tttcaaggaa cttttagtgt atgctgctga tccagctatg catgcagctt14520
ctggcaattt attgctagat aaacgcacta catgcttttc agtagctgca ctaacaaaca14580
atgttgcttt tcaaactgtc aaacccggta attttaataa agacttttat gactttgctg14640
tgtctaaagg tttctttaag gaaggaagtt ctgttgaact aaaacacttc ttctttgctc14700
aggatggcaa cgctgctatc agtgattatg actattatcg ttataatctg ccaacaatgt14760
gtgatatcag acaactccta ttcgtagttg aagttgttga taaatacttt gattgttacg14820
atggtggctg tattaatgcc aaccaagtaa tcgttaacaa tctggataaa tcagctggtt14880
tcccatttaa taaatggggt aaggctagac tttattatga ctcaatgagt tatgaggatc14940
aagatgcact tttcgcgtat actaagcgta atgtcatccc tactataact caaatgaatc15000
ttaagtatgc cattagtgca aagaatagag ctcgcaccgt agctggtgtc tctatctgta15060
gtactatgac aaatagacag tttcatcaga aattattgaa gtcaatagcc gccactagag15120
gagctactgt ggtaattgga acaagcaagt tttacggtgg ctggcataat atgttaaaaa15180
ctgtttacag tgatgtagaa actccacacc ttatgggttg ggattatcca aaatgtgaca15240
gagccatgcc taacatgctt aggataatgg cctctcttgt tcttgctcgc aaacataaca15300
cttgctgtaa cttatcacac cgtttctaca ggttagctaa cgagtgtgcg caagtattaa15360
gtgagatggt catgtgtggc ggctcactat atgttaaacc aggtggaaca tcatccggtg15420
atgctacaac tgcttatgct aatagtgtct ttaacatttg tcaagctgtt acagccaatg15480
taaatgcact tctttcaact gatggtaata agatagctga caagtatgtc cgcaatctac15540
aacacaggct ctatgagtgt ctctatagaa atagggatgt tgatcatgaa ttcgtggatg15600
agttttacgc ttacctgcgt aaacatttct ccatgatgat tctttctgat gatgccgttg15660
tgtgctataa cagtaactat gcggctcaag gtttagtagc tagcattaag aactttaagg15720
cagttcttta ttatcaaaat aatgtgttca tgtctgaggc aaaatgttgg actgagactg15780
accttactaa aggacctcac gaattttgct cacagcatac aatgctagtt aaacaaggag15840
atgattacgt gtacctgcct tacccagatc catcaagaat attaggcgca ggctgttttg15900
tcgatgatat tgtcaaaaca gatggtacac ttatgattga aaggttcgtg tcactggcta15960
ttgatgctta cccacttaca aaacatccta atcaggagta tgctgatgtc tttcacttgt16020
atttacaata cattagaaag ttacatgatg agcttactgg ccacatgttg gacatgtatt16080
ccgtaatgct aactaatgat aacacctcac ggtactggga acctgagttt tatgaggcta16140
tgtacacacc acatacagtc ttgcaggctg taggtgcttg tgtattgtgc aattcacaga16200
cttcacttcg ttgcggtgcc tgtattagga gaccattcct atgttgcaag tgctgctatg16260
accatgtcat ttcaacatca cacaaattag tgttgtctgt taatccctat gtttgcaatg16320
ccccaggttg tgatgtcact gatgtgacac aactgtatct aggaggtatg agctattatt16380
gcaagtcaca taagcctccc attagttttc cattatgtgc taatggtcag gtttttggtt16440
tatacaaaaa cacatgtgta ggcagtgaca atgtcactga cttcaatgcg atagcaacat16500
gtgattggac taatgctggc gattacatac ttgccaacac ttgtactgag agactcaagc16560
ttttcgcagc agaaacgctc aaagccactg aggaaacatt taagctgtca tatggtattg16620
ccactgtacg cgaagtactc tctgacagag aattgcatct ttcatgggag gttggaaaac16680
ctagaccacc attgaacaga aactatgtct ttactggtta ccgtgtaact aaaaatagta16740
aagtacagat tggagagtac acctttgaaa aaggtgacta tggtgatgct gttgtgtaca16800
gaggtactac gacatacaag ttgaatgttg gtgattactt tgtgttgaca tctcacactg16860
taatgccact tagtgcacct actctagtgc cacaagagca ctatgtgaga attactggct16920
tgtacccaac actcaacatc tcagatgagt tttctagcaa tgttgcaaat tatcaaaagg16980
tcggcatgca aaagtactct acactccaag gaccacctgg tactggtaag agtcattttg17040
ccatcggact tgctctctat tacccatctg ctcgcatagt gtatacggca tgctctcatg17100
cagctgttga tgccctatgt gaaaaggcat taaaatattt gcccatagat aaatgtagta17160
gaatcatacc tgcgcgtgcg cgcgtagagt gttttgataa attcaaagtg aattcaacac17220
tagaacagta tgttttctgc actgtaaatg cattgccaga aacaactgct gacattgtag17280
tctttgatga aatctctatg gctactaatt atgacttgag tgttgtcaat gctagacttc17340
gtgcaaaaca ctacgtctat attggcgatc ctgctcaatt accagccccc cgcacattgc17400
tgactaaagg cacactagaa ccagaatatt ttaattcagt gtgcagactt atgaaaacaa17460
taggtccaga catgttcctt ggaacttgtc gccgttgtcc tgctgaaatt gttgacactg17520
tgagtgcttt agtttatgac aataagctaa aagcacacaa ggataagtca gctcaatgct17580
tcaaaatgtt ctacaaaggt gttattacac atgatgtttc atctgcaatc aacagacctc17640
aaataggcgt tgtaagagaa tttcttacac gcaatcctgc ttggagaaaa gctgttttta17700
tctcacctta taattcacag aacgctgtag cttcaaaaat cttaggattg cctacgcaga17760
ctgttgattc atcacagggt tctgaatatg actatgtcat attcacacaa actactgaaa17820
cagcacactc ttgtaatgtc aaccgcttca atgtggctat cacaagggca aaaattggca17880
ttttgtgcat aatgtctgat agagatcttt atgacaaact gcaatttaca agtctagaaa17940
taccacgtcg caatgtggct acattacaag cagaaaatgt aactggactt tttaaggact18000
gtagtaagat cattactggt cttcatccta cacaggcacc tacacacctc agcgttgata18060
taaagttcaa gactgaagga ttatgtgttg acataccagg cataccaaag gacatgacct18120
accgtagact catctctatg atgggtttca aaatgaatta ccaagtcaat ggttacccta18180
atatgtttat cacccgcgaa gaagctattc gtcacgttcg tgcgtggatt ggctttgatg18240
tagagggctg tcatgcaact agagatgctg tgggtactaa cctacctctc cagctaggat18300
tttctacagg tgttaactta gtagctgtac cgactggtta tgttgacact gaaaataaca18360
cagaattcac cagagttaat gcaaaacctc caccaggtga ccagtttaaa catcttatac18420
cactcatgta taaaggcttg ccctggaatg tagtgcgtat taagatagta caaatgctca18480
gtgatacact gaaaggattg tcagacagag tcgtgttcgt cctttgggcg catggctttg18540
agcttacatc aatgaagtac tttgtcaaga ttggacctga aagaacgtgt tgtctgtgtg18600
acaaacgtgc aacttgcttt tctacttcat cagatactta tgcctgctgg aatcattctg18660
tgggttttga ctatgtctat aacccattta tgattgatgt tcagcagtgg ggctttacgg18720
gtaaccttca gagtaaccat gaccaacatt gccaggtaca tggaaatgca catgtggcta18780
gttgtgatgc tatcatgact agatgtttag cagtccatga gtgctttgtt aagcgcgttg18840
attggtctgt tgaataccct attataggag atgaactgag ggttaattct gcttgcagaa18900
aagtacaaca catggttgtg aagtctgcat tgcttgctga taagtttcca gttcttcatg18960
acattggaaa tccaaaggct atcaagtgtg tgcctcaggc tgaagtagaa tggaagttct19020
acgatgctca gccatgtagt gacaaagctt acaaaataga ggaactcttc tattcttatg19080
ctacacatca cgataaattc actgatggtg tttgtttgtt ttggaattgt aacgttgatc19140
gttacccagc caatgcaatt gtgtgtaggt ttgacacaag agtcttgtca aacttgaact19200
taccaggctg tgatggtggt agtttgtatg tgaataagca tgcattccac actccagctt19260
tcgataaaag tgcatttact aatttaaagc aattgccttt cttttactat tctgatagtc19320
cttgtgagtc tcatggcaaa caagtagtgt cggatattga ttatgttcca ctcaaatctg19380
ctacgtgtat tacacgatgc aatttaggtg gtgctgtttg cagacaccat gcaaatgagt19440
accgatagta cttggatgca tataatatga tgatttctgc tggatttagc ctatggattt19500
acaaacaatt tgatacttat aacctgtgga atacatttac caggttatag agtttagaaa19560
atgtggctta taatgttgtt aataaaggac actttgatgg acacgccggc gaagcacctg19620
tttccatcat taataatgct gtttacacaa aggtagatgg tattgatgtg gagatctttg19680
aaaataagac aacacttcct gttaatgttg catttgagct ttgggctaag cgtaacatta19740
aaccagtgcc agagattaag atactcaata atttgggtgt tgatatcgct gctaatactg19800
taatctggga ctacaaaaga gaagccccag cacatgtatc tacaataggt gtctgcacaa19860
tgactgacat tgccaagaaa cctactgaga gtgcttgttc ttcacttact gtcttgtttg19920
atggtagagt ggaaggacag gtagaccttt ttagaaacgc ccgtaatggt gttttaataa19980
cagaaggttc agtcaaaggt ctaacacctt caaagggacc agcacaagct agcgtcaatg20040
gagtcacatt aattggagaa tcagtaaaaa cacagtttaa ctactttaag aaagtagacg20100
gcattattca acagttgcct gaaacctact ttactcagag cagagactta gaggatttta20160
agcccagatc acaaatggaa actgactttc tcgagctcgc tatggatgaa ttcatacagc20220
gatataagct cgagggctat gccttcgaac acatcgttta tggagatttc agtcatggac20280
aacttggcgg tcttcattta atgataggct tagccaagcg ctcacaagat tcaccactta20340
aattagagga ttttatccct atggacagca cagtgaaaaa ttacttcata acagatgcgc20400
aaacaggttc atcaaaatgt gtgtgttctg tgattgatct tttacttgat gactttgtcg20460
agataataaa gtcacaagat ttgtcagtga tttcaaaagt ggtcaaggtt acaattgact20520
atgctgaaat ttcattcatg ctttggtgta aggatggaca tgttgaaacc ttctacccaa20580
aactacaagc aagtcaagcg tggcaaccag gtgttgcgat gcctaacttg tacaagatgc20640
aaagaatgct tcttgaaaag tgtgaccttc agaattatgg tgaaaatgct gttataccaa20700
aaggaataat gatgaatgtc gcaaagtata ctcaactgtg tcaatactta aatacactta20760
ctttagctgt accctacaac atgagagtta ttcactttgg tgctggctct gataaaggag20820
ttgcaccagg tacagctgtg ctcagacaat ggttgccaac tggcacacta cttgtcgatt20880
cagatcttaa tgacttcgtc tccgacgcag attctacttt aattggagac tgtgcaacag20940
tacatacggc taataaatgg gaccttatta ttagcgatat gtatgaccct aggaccaaac21000
atgtgacaaa agagaatgac tctaaagaag ggtttttcac ttatctgtgt ggatttataa21060
agcaaaaact agccctgggt ggttctatag ctgtaaagat aacagagcat tcttggaatg21120
ctgaccttta caagcttatg ggccatttct catggtggac agcttttgtt acaaatgtaa21180
atgcatcatc atcggaagca tttttaattg gggctaacta tcttggcaag ccgaaggaac21240
aaattgatgg ctataccatg catgctaact acattttctg gaggaacaca aatcctatcc21300
agttgtcttc ctattcactc tttgacatga gcaaatttcc tcttaaatta agaggaactg21360
ctgtaatgtc tcttaaggag aatcaaatca atgatatgat ttattctctt ctggaaaaag21420
gtaggcttat cattagagaa aacaacagag ttgtggtttc aagtgatatt cttgttaaca21480
actaaacgaa catgtttatt ttcttattat ttcttactct cactagtggt agtgaccttg21540
accggtgcac cacttttgat gatgttcaag ctcctaatta cactcaacat acttcatcta21600
tgaggggggt ttactatcct gatgaaattt ttagatcaga cactctttat ttaactcagg21660
atttatttct tccattttat tctaatgtta cagggtttca tactattaat catacgtttg21720
gcaaccctgt catacctttt aaggatggta tttattttgc tgccacagag aaatcaaatg21780
ttgtccgtgg ttgggttttt ggttctacca tgaacaacaa gtcacagtcg gtgattatta21840
ttaacaattc tactaatgtt gttatacgag catgtaactt tgaattgtgt gacaaccctt21900
tctttgctgt ttctaaaccc atgggtacac agacacatac tatgatattc gataatgcat21960
ttaattgcac tttcgagtac atatctgatg ccttttcgct tgatgtttca gaaaagtcag22020
gtaattttaa acacttacga gagtttgtgt ttaaaaataa agatgggttt ctctatgttt22080
ataagggcta tcaacctata gatgtagttc gtgatctacc ttctggtttt aacactttga22140
aacctatttt taagttgcct cttggtatta acattacaaa ttttagagcc attcttacag22200
ccttttcacc tgctcaagac atttggggca cgtcagctgc agcctatttt gttggctatt22260
taaagccaac tacatttatg ctcaagtatg atgaaaatgg tacaatcaca gatgctgttg22320
attgttctca aaatccactt gctgaactca aatgctctgt taagagcttt gagattgaca22380
aaggaattta ccagacctct aatttcaggg ttgttccctc aggagatgtt gtgagattcc22440
ctaatattac aaacttgtgt ccttttggag aggtttttaa tgctactaaa ttcccttctg22500
tctatgcatg ggagagaaaa aaaatttcta attgtgttgc tgattactct gtgctctaca22560
actcaacatt tttttcaacc tttaagtgct atggcgtttc tgccactaag ttgaatgatc22620
tttgcttctc caatgtctat gcagattctt ttgtagtcaa gggagatgat gtaagacaaa22680
tagcgccagg acaaactggt gttattgctg attataatta taaattgcca gatgatttca22740
tgggttgtgt ccttgcttgg aatactagga acattgatgc tacttcaact ggtaattata22800
attataaata taggtatctt agacatggca agcttaggcc ctttgagaga gacatatcta22860
atgtgccttt ctcccctgat ggcaaacctt gcaccccacc tgctcttaat tgttattggc22920
cattaaatga ttatggtttt tacaccacta ctggcattgg ctaccaacct tacagagttg22980
tagtactttc ttttgaactt ttaaatgcac cggccacggt ttgtggacta aaattatcca23040
ctgaccttat taagaaccag tgtgtcaatt ttaattttaa tggactcact ggtactggtg23100
tgttaactcc ttcttcaaag agatttcaac catttcaaca atttggccgt gatgtttctg23160
atttcactga ttccgttcga gatcctaaaa catctgaaat attagacatt tcaccttgct23220
cttttggggg tgtaagtgta attacacctg gaacaaatgc ttcatctgaa gttgctgttc23280
tatatcaaga tgttaactgc actgatgttt ctacagcaat tcatgcagat caactcacac23340
cagcttggcg catatattct actggaaaca atgtattcca gactcaagca ggctgtctta23400
taggagctga gcatgtcgac acttcttatg agtgcgacat tcctattgga gctggcattt23460
gtgctagtta ccatacagtt tctttattac gtagtactag ccaaaaatct attgtggctt23520
atactatgtc tttaggtgct gatagttcaa ttgcttactc taataacacc attgctatac23580
ctactaactt ttcaattagc attactacag aagtaatgcc tgtttctatg gctaaaacct23640
ccgtagattg taatatgtac atctgcggag attctactga atgtgctaat ttgcttctcc23700
aatatggtag cttttgcaca caactaaatc gtgcactctc aggtattgct gctgaacagg23760
atcgcaacac acgtgaagtg ttcgctcaag tcaaacaaat gtacaaaacc ccaactttga23820
aatattttgg tggttttaat ttttcacaaa tattacctga ccctctaaag ccaactaaga23880
ggtcttttat tgaggacttg ctctttaata aggtgacact cgctgatgct ggcttcatga23940
agcaatatgg cgaatgccta ggtgatatta atgctagaga tctcatttgt gcgcagaagt24000
tcaatggact tacagtgttg ccacctctgc tcactgatga tatgattgct gcctacactg24060
ctgctctagt tagtggtact gccactgctg gatggacatt tggtgctggc gctgctcttc24120
aaataccttt tgctatgcaa atggcatata ggttcaatgg cattggagtt acccaaaatg24180
ttctctatga gaaccaaaaa caaatcgcca accaatttaa caaggcgatt agtcaaattc24240
aagaatcact tacaacaaca tcaactgcat tgggcaagct gcaagacgtt gttaaccaga24300
atgctcaagc attaaacaca cttgttaaac aacttagctc taattttggt gcaatttcaa24360
gtgtgctaaa tgatatcctt tcgcgacttg ataaagtcga ggcggaggta caaattgaca24420
ggttaattac aggcagactt caaagccttc aaacctatgt aacacaacaa ctaatcaggg24480
ctgctgaaat cagggcttct gctaatcttg ctgctactaa aatgtctgag tgtgttcttg24540
gacaatcaaa aagagttgac ttttgtggaa agggctacca ccttatgtcc ttcccacaag24600
cagccccgca tggtgttgtc ttcctacatg tcacgtatgt gccatcccag gagaggaact24660
tcaccacagc gccagcaatt tgtcatgaag gcaaagcata cttccctcgt gaaggtgttt24720
ttgtgtttaa tggcacttct tggtttatta cacagaggaa cttcttttct ccacaaataa24780
ttactacaga caatacattt gtctcaggaa attgtgatgt cgttattggc atcattaaca24840
acacagttta tgatcctctg caacctgagc ttgactcatt caaagaagag ctggacaagt24900
acttcaaaaa tcatacatca ccagatgttg atcttggcga catttcaggc attaacgctt24960
ctgtcgtcaa cattcaaaaa gaaattgacc gcctcaatga ggtcgctaaa aatttaaatg25020
aatcactcat tgaccttcaa gaattgggaa aatatgagca atatattaaa tggccttggt25080
atgtttggct cggcttcatt gctggactaa ttgccatcgt catggttaca atcttgcttt25140
gttgcatgac tagttgttgc agttgcctca agggtgcatg ctcttgtggt tcttgctgca25200
agtttgatga ggatgactct gagccagttc tcaagggtgt caaattacat tacacataaa25260
cgaacttatg gatttgttta tgagattttt tactcttgga tcaattactg cacagccagt25320
aaaaattgac aatgcttctc ctgcaagtac tgttcatgct acagcaacga taccgctaca25380
agcctcactc cctttcggat ggcttgttat tggcgttgca tttcttgctg tttttcagag25440
cgctaccaaa ataattgcgc tcaataaaag atggcagcta gccctttata agggcttcca25500
gttcatttgc aatttactgc tgctatttgt taccatctat tcacatcttt tgcttgtcgc25560
tgcaggtatg gaggcgcaat ttttgtacct ctatgccttg atatattttc tacaatgcat25620
caacgcatgt agaattatta tgagatgttg gctttgttgg aagtgcaaat ccaagaaccc25680
attactttat gatgccaact actttgtttg ctggcacaca cataactatg actactgtat25740
accatataac agtgtcacag atacaattgt cgttactgaa ggtgacggca tttcaacacc25800
aaaactcaaa gaagactacc aaattggtgg ttattctgag gataggcact caggtgttaa25860
agactatgtc gttgtacatg gctatttcac cgaagtttac taccagcttg agtctacaca25920
aattactaca gacactggta ttgaaaatgc tacattcttc atctttaaca agcttgttaa25980
agacccaccg aatgtgcaaa tacacacaat cgacggctct tcaggagttg ctaatccagc26040
aatggatcca atttatgatg agccgacgac gactactagc gtgcctttgt aagcacaaga26100
aagtgagtac gaacttatgt actcattcgt ttcggaagaa acaggtacgt taatagttaa26160
tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag ccatccttac26220
tgcgcttcga ttgtgtgcgt actgctgcaa tattgttaac gtgagtttag taaaaccaac26280
ggtttacgtc tactcgcgtg ttaaaaatct gaactcttct gaaggagttc ctgatcttct26340
ggtctaaacg aactaactat tattattatt ctgtttggaa ctttaacatt gcttatcatg26400
gcagacaacg gtactattac cgttgaggag cttaaacaac tcctggaaca atggaaccta26460
gtaataggtt tcctattcct agcctggatt atgttactac aatttgccta ttctaatcgg26520
aacaggtttt tgtacataat aaagcttgtt ttcctctggc tcttgtggcc agtaacactt26580
gcttgttttg tgcttgctgc tgtctacaga attaattggg tgactggcgg gattgcgatt26640
gcaatggctt gtattgtagg cttgatgtgg cttagctact tcgttgcttc cttcaggctg26700
tttgctcgta cccgctcaat gtggtcattc aacccagaaa caaacattct tctcaatgtg26760
cctctccggg ggacaattgt gaccagaccg ctcatggaaa gtgaacttgt cattggtgct26820
gtgatcattc gtggtcactt gcgaatggcc ggacactccc tagggcgctg tgacattaag26880
gacctgccaa aagagatcac tgtggctaca tcacgaacgc tttcttatta caaattagga26940
gcgtcgcagc gtgtaggcac tgattcaggt tttgctgcat acaaccgcta ccgtattgga27000
aactataaat taaatacaga ccacgccggt agcaacgaca atattgcttt gctagtacag27060
taagtgacaa cagatgtttc atcttgttga cttccaggtt acaatagcag agatattgat27120
tatcattatg aggactttca ggattgctat ttggaatctt gacgttataa taagttcaat27180
agtgagacaa ttatttaagc ctctaactaa gaagaattat tcggagttag atgatgaaga27240
acctatggag ttagattatc cataaaacga acatgaaaat tattctcttc ctgacattga27300
ttgtatttac atcttgcgag ctatatcact atcaggagtg tgttagaggt acgactgtac27360
tactaaaaga accttgccca tcaggaacat acgagggcaa ttcaccattt caccctcttg27420
ctgacaataa atttgcacta acttgcacta gcacacactt tgcttttgct tgtgctgacg27480
gtactcgaca tacctatcag ctgcgtgcaa gatcagtttc accaaaactt ttcatcagac27540
aagaggaggt tcaacaagag ctctactcgc cactttttct cattgttgct gctctagtat27600
ttttaatact ttgcttcacc attaagagaa agacagaatg aatgagctca ctttaattga27660
cttctatttg tgctttttag cctttctgct attccttgtt ttaataatgc ttattatatt27720
ttggttttca ctcgaaatcc aggatctaga agaaccttgt accaaagtct aaacgaacat27780
gaaacttctc attgttttga cttgtatttc tctatgcagt tgcatatgca ctgtagtaca27840
gcgctgtgca tctaataaac ctcatgtgct tgaagatcct tgtaaggtac aacactaggg27900
gtaatactta tagcactgct tggctttgtg ctctaggaaa ggttttacct tttcatagat27960
ggcacactat ggttcaaaca tgcacaccta atgttactat caactgtcaa gatccagctg28020
gtggtgcgct tatagctagg tgttggtacc ttcatgaagg tcaccaaact gctgcattta28080
gagacgtact tgttgtttta aataaacgaa caaattaaaa tgtctgataa tggaccccaa28140
tcaaaccaac gtagtgcccc ccgcattaca tttggtggac ccacagattc aactgacaat28200
aaccagaatg gaggacgcaa tggggcaagg ccaaaacagc gccgacccca aggtttaccc28260
aataatactg cgtcttggtt cacagctctc actcagcatg gcaaggagga acttagattc28320
cctcgaggcc agggcgttcc aatcaacacc aatagtggtc cagatgacca aattggctac28380
taccgaagag ctacccgacg agttcgtggt ggtgacggca aaatgaaaga gctcagcccc28440
agatggtact tctattacct aggaactggc ccagaagctt cacttcccta cggcgctaac28500
aaagaaggca tcgtatgggt tgcaactgag ggagccttga atacacccaa agaccacatt28560
ggcacccgca atcctaataa caatgctgcc accgtgctac aacttcctca aggaacaaca28620
ttgccaaaag gcttctacgc agagggaagc agaggcggca gtcaagcctc ttctcgctcc28680
tcatcacgta gtcgcggtaa ttcaagaaat tcaactcctg gcagcagtag gggaaattct28740
cctgctcgaa tggctagcgg aggtggtgaa actgccctcg cgctattgct gctagacaga28800
ttgaaccagc ttgagagcaa agtttctggt aaaggccaac aacaacaagg ccaaactgtc28860
actaagaaat ctgctgctga ggcatctaaa aagcctcgcc aaaaacgtac tgccacaaaa28920
cagtacaacg tcactcaagc atttgggaga cgtggtccag aacaaaccca aggaaatttc28980
ggggaccaag acctaatcag acaaggaact gattacaaac attggccgca aattgcacaa29040
tttgctccaa gtgcctctgc attctttgga atgtcacgca ttggcatgga agtcacacct29100
tcgggaacat ggctgactta tcatggagcc attaaattgg atgacaaaga tccacaattc29160
aaagacaacg tcatactgct gaacaagcac attgacgcat acaaaacatt cccaccaaca29220
gagcctaaaa aggacaaaaa gaaaaagact gatgaagctc agcctttgcc gcagagacaa29280
aagaagcagc ccactgtgac tcttcttcct gcggctgaca tggatgattt ctccagacaa29340
cttcaaaatt ccatgagtgg agcttctgct gattcaactc aggcataaac actcatgatg29400
accacacaag gcagatgggc tatgtaaacg ttttcgcaat tccgtttacg atacatagtc29460
tactcttgtg cagaatgaat tctcgtaact aaacagcaca agtaggttta gttaacttta29520
atctcacata gcaatcttta atcaatgtgt aacattaggg aggacttgaa agagccacca29580
cattttcatc gaggccacgc ggagtacgat cgagggtaca gtgaataatg ctagggagag29640
ctgcctatat ggaagagccc taatgtgtaa aattaatttt agtagtgcta tccccatgtg29700
attttaatag cttcttagga gaatgacaaa aaaaaaaaaa aaaaaa 29746
<210>2
<211>3945
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(89)..(3853)
<223>
<400>2
ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag60
tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 112
Met Phe Ile Phe Leu Leu Phe Leu
1 5
act ctc act agt ggt agt gac ctt gac cgg tgc acc act ttt gat gat 160
Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg Cys Thr Thr Phe Asp Asp
10 15 20
gtt caa gct cct aat tac act caa cat act tca tct atg agg ggg gtt208
Val Gln Ala Pro Asn Tyr Thr Gln His Thr Ser Ser Met Arg Gly Val
25 30 35 40
tac tat cct gat gaa att ttt aga tca gac act ctt tat tta act cag256
Tyr Tyr Pro Asp Glu Ile Phe Arg Ser Asp Thr Leu Tyr Leu Thr Gln
45 50 55
gat tta ttt ctt cca ttt tat tct aat gtt aca ggg ttt cat act att304
Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly Phe His Thr Ile
60 65 70
aat cat acg ttt ggc aac cct gtc ata cct ttt aag gat ggt att tat352
Asn His Thr Phe Gly Asn Pro Val Ile Pro Phe Lys Asp Gly Ile Tyr
75 80 85
ttt gct gcc aca gag aaa tca aat gtt gtc cgt ggt tgg gtt ttt ggt400
Phe Ala Ala Thr Glu Lys Ser Asn Val Val Arg Gly Trp Val Phe Gly
90 95 100
tct acc atg aac aac aag tca cag tcg gtg att att att aac aat tct448
Ser Thr Met Asn Asn Lys Ser Gln Ser Val Ile Ile Ile Asn Asn Ser
105 110 115 120
act aat gtt gtt ata cga gca tgt aac ttt gaa ttg tgt gac aac cct496
Thr Asn Val Val Ile Arg Ala Cys Asn Phe Glu Leu Cys Asp Asn Pro
125 130 135
ttc ttt gct gtt tct aaa ccc atg ggt aca cag aca cat act atg ata544
Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gln Thr His Thr Met Ile
140 145 150
ttc gat aat gca ttt aat tgc act ttc gag tac ata tct gat gcc ttt592
Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr Ile Ser Asp Ala Phe
155 160165
tcg ctt gat gtt tca gaa aag tca ggt aat ttt aaa cac tta cga gag640
Ser Leu Asp Val Ser Glu Lys Ser Gly Asn Phe Lys His Leu Arg Glu
170 175 180
ttt gtg ttt aaa aat aaa gat ggg ttt ctc tat gtt tat aag ggc tat688
Phe Val Phe Lys Asn Lys Asp Gly Phe Leu Tyr Val Tyr Lys Gly Tyr
185 190 195 200
caa cct ata gat gta gtt cgt gat cta cct tct ggt ttt aac act ttg736
Gln Pro Ile Asp Val Val Arg Asp Leu Pro Ser Gly Phe Asn Thr Leu
205 210 215
aaa cct att ttt aag ttg cct ctt ggt att aac att aca aat ttt aga784
Lys Pro Ile Phe Lys Leu Pro Leu Gly Ile Asn Ile Thr Asn Phe Arg
220 225 230
gcc att ctt aca gcc ttt tca cct gct caa gac att tgg ggc acg tca832
Ala Ile Leu Thr Ala Phe Ser Pro Ala Gln Asp Ile Trp Gly Thr Ser
235 240 245
gct gca gcc tat ttt gtt ggc tat tta aag cca act aca ttt atg ctc880
Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr Thr Phe Met Leu
250 255 260
aag tat gat gaa aat ggt aca atc aca gat gct gtt gat tgt tct caa928
Lys Tyr Asp Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys Ser Gln
265 270 275 280
aat cca ctt gct gaa ctc aaa tgc tct gtt aag agc ttt gag att gac976
Asn Pro Leu Ala Glu Leu Lys Cys Ser Val Lys Ser Phe Glu Ile Asp
285 290295
aaa gga att tac cag acc tct aat ttc agg gtt gtt ccc tca gga gat1024
Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Val Pro Ser Gly Asp
300 305 310
gtt gtg aga ttc cct aat att aca aac ttg tgt cct ttt gga gag gtt 1072
Val Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Gly Glu Val
315 320 325
ttt aat gct act aaa ttc cct tct gtc tat gca tgg gag aga aaa aaa 1120
Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp Glu Arg Lys Lys
330 335 340
att tct aat tgt gtt gct gat tac tct gtg ctc tac aac tca aca ttt1168
Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Ser Thr Phe
345 350 355 360
ttt tca acc ttt aag tgc tat ggc gtt tct gcc act aag ttg aat gat1216
Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr Lys Leu Asn Asp
365 370 375
ctt tgc ttc tcc aat gtc tat gca gat tct ttt gta gtc aag gga gat1264
Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val Val Lys Gly Asp
380 385 390
gat gta aga caa ata gcg cca gga caa act ggt gtt att gct gat tat1312
Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val Ile Ala Asp Tyr
395 400 405
aat tat aaa ttg cca gat gat ttc atg ggt tgt gtc ctt gct tgg aat1360
Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val Leu Ala Trp Asn
410 415 420
act agg aac att gat gct act tca act ggt aat tat aat tat aaa tat1408
Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr Asn Tyr Lys Tyr
425 430 435 440
agg tat ctt aga cat ggc aag ctt agg ccc ttt gag aga gac ata tct1456
Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu Arg Asp Ile Ser
445 450 455
aat gtg cct ttc tcc cct gat ggc aaa cct tgc acc cca cct gct ctt1504
Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr Pro Pro Ala Leu
460 465 470
aat tgt tat tgg cca tta aat gat tat ggt ttt tac acc act act ggc1552
Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr Thr Thr Thr Gly
475 480 485
att ggc tac caa cct tac aga gtt gta gta ctt tct ttt gaa ctt tta1600
Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser Phe Glu Leu Leu
490 495 500
aat gca ccg gcc acg gtt tgt gga cca aaa tta tcc act gac ctt att1648
Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu Ser Thr Asp Leu Ile
505 510 515 520
aag aac cag tgt gtc aat ttt aat ttt aat gga ctc act ggt act ggt1696
Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly Leu Thr Gly Thr Gly
525 530 535
gtg tta act cct tct tca aag aga ttt caa cca ttt caa caa ttt ggc1744
Val Leu Thr Pro Ser Ser Lys Arg Phe Gln Pro Phe Gln Gln Phe Gly
540 545 550
cgt gat gtt tct gat ttc act gat tcc gtt cga gat cct aaa aca tct1792
Arg Asp Val Ser Asp Phe Thr Asp Ser Val Arg Asp Pro Lys Thr Ser
555 560 565
gaa ata tta gac att tca cct tgc tct ttt ggg ggt gta agt gta att1840
Glu Ile Leu Asp Ile Ser Pro Cys Ser Phe Gly Gly Val Ser Val Ile
570 575 580
aca cct gga aca aat gct tca tct gaa gtt gct gtt cta tat caa gat1888
Thr Pro Gly Thr Asn Ala Ser Ser Glu Val Ala Val Leu Tyr Gln Asp
585 590 595 600
gtt aac tgc act gat gtt tct aca gca att cat gca gat caa ctc aca1936
Val Asn Cys Thr Asp Val Ser Thr Ala Ile His Ala Asp Gln Leu Thr
605 610 615
cca gct tgg cgc ata tat tct act gga aac aat gta ttc cag act caa1984
Pro Ala Trp Arg Ile Tyr Ser Thr Gly Asn Asn Val Phe Gln Thr Gln
620 625 630
gca ggc tgt ctt ata gga gct gag cat gtc gac act tct tat gag tgc2032
Ala Gly Cys Leu Ile Gly Ala Glu His Val Asp Thr Ser Tyr Glu Cys
635 640 645
gac att cct att gga gct ggc att tgt gct agt tac cat aca gtt tct2080
Asp Ile Pro Ile Gly Ala Gly Ile cys Ala Ser Tyr His Thr Val Ser
650 655 660
tta tta cgt agt act agc caa aaa tct att gtg gct tat act atg tct2128
Leu Leu Arg Ser Thr Ser Gln Lys Ser Ile Val Ala Tyr Thr Met Ser
665 670 675 680
tta ggt gct gat agt tca att gct tac tct aat aac acc att gct ata2176
Leu Gly Ala Asp Ser Ser Ile Ala Tyr Ser Asn Asn Thr Ile Ala Ile
685 690 695
cct act aac ttt tca att agc att act aca gaa gta atg cct gtt tct2224
Pro Thr Asn Phe Ser Ile Ser Ile Thr Thr Glu Val Met Pro Val Ser
700 705 710
atg gct aaa acc tcc gta gat tgt aat atg tac atc tgc gga gat tct2272
Met Ala Lys Thr Ser Val Asp Cys Asn Met Tyr Ile Cys Gly Asp Ser
715 720 725
act gaa tgt gct aat ttg ctt ctc caa tat ggt agc ttt tgc aca caa2320
Thr Glu Cys Ala Asn Leu Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln
730 735 740
cta aat cgt gca ctc tca ggt att gct gct gaa cag gat cgc aac aca2368
Leu Asn Arg Ala Leu Ser Gly Ile Ala Ala Glu Gln Asp Arg Asn Thr
745 750 755 760
cgt gaa gtg ttc gct caa gtc aaa caa atg tac aaa acc cca act ttg2416
Arg Glu Val Phe Ala Gln Val Lys Gln Met Tyr Lys Thr Pro Thr Leu
765 770 775
aaa tat ttt ggt ggt ttt aat ttt tca caa ata tta cct gac cct cta2464
Lys Tyr Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu Pro Asp Pro Leu
780 785 790
aag cca act aag agg tct ttt att gag gac ttg ctc ttt aat aag gtg2512
Lys Pro Thr Lys Arg Ser Phe Ile Glu Asp Leu Leu Phe Asn Lys Val
795 800 805
aca ctc gct gat gct ggc ttc atg aag caa tat ggc gaa tgc cta ggt2560
Thr Leu Ala Asp Ala Gly Phe Met Lys Gln Tyr Gly Glu Cys Leu Gly
810 815 820
gat att aat gct aga gat ctc att tgt gcg cag aag ttc aat gga ctt2608
Asp Ile Asn Ala Arg Asp Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu
825 830 835 840
aca gtg ttg cca cct ctg ctc act gat gat atg att gct gcc tac act2656
Thr Val Leu Pro Pro Leu Leu Thr Asp Asp Met Ile Ala Ala Tyr Thr
845 850 855
gct gct cta gtt agt ggt act gcc act gct gga tgg aca ttt ggt gct2704
Ala Ala Leu Val Ser Gly Thr Ala Thr Ala Gly Trp Thr Phe Gly Ala
860 865 870
ggc gct gct ctt caa ata cct ttt gct atg caa atg gca tat agg ttc2752
Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met Ala Tyr Arg Phe
875 880 885
aat ggc att gga gtt acc caa aat gtt ctc tat gag aac caa aaa caa2800
Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu Asn Gln Lys Gln
890 895 900
atc gcc aac caa ttt aac aag gcg att agt caa att caa gaa tca ctt2848
Ile Ala Asn Gln Phe Asn Lys Ala Ile Ser Gln Ile Gln Glu Ser Leu
905 910 915 920
aca aca aca tca act gca ttg ggc aag ctg caa gac gtt gtt aac cag2896
Thr Thr Thr Ser Thr Ala Leu Gly Lys Leu Gln Asp Val Val Asn Gln
925 930 935
aat gct caa gca tta aac aca ctt gtt aaa caa ctt agc tct aat ttt2944
Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu Sar Ser Asn Phe
940 945 950
ggt gca att tca agt gtg cta aat gat atc ctt tcg cga ctt gat aaa2992
Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys
955 960 965
gtc gag gcg gag gta caa att gac agg tta att aca ggc aga ctt caa3040
Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln
970 975 980
agc ctt caa acc tat gta aca caa caa cta atc agg gct gct gaa atc3088
Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile
985 990 995 1000
agg gct tct gct aat ctt gct gct act aaa atg tct gag tgt gtt 3133
Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser Glu Cys Val
1005 1010 1015
ctt gga caa tca aaa aga gtt gac ttt tgt gga aag ggc tac cac 3178
Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly Tyr His
1020 1025 1030
ctt atg tcc ttc cca caa gca gcc ccg cat ggt gtt gtc ttc cta 3223
Leu Met Ser Phe Pro Gln Ala Ala Pro His Gly Val Val Phe Leu
1035 1040 1045
cat gtc acg tat gtg cca tcc cag gag agg aac ttc acc aca gcg 3268
His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn Phe Thr Thr Ala
1050 1055 1060
cca gca att tgt cat gaa ggc aaa gca tac ttc cct cgt gaa ggt 3313
Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro Arg Glu Gly
1065 1070 1075
gtt ttt gtg ttt aat ggc act tct tgg ttt att aca cag agg aac 3358
Val Phe Val Phe Asn Gly Thr Ser Tro Phe Ile Thr Gln Arg Asn
1080 1085 1090
ttc ttt tct cca cas ata att act aca gac aat aca ttt gtc tca 3403
Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser
1095 1100 1105
gga aat tgt gat gtc gtt att ggc atc att aac aac aca gtt tat 3448
Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr Val Tyr
1110 1115 1120
gat cct ctg caa cct gag ctt gac tca ttc aaa gaa gag ctg gac 3493
Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp
1125 1130 1135
aag tac ttc aaa aat cat aca tca cca gat gtt gat ctt ggc gac 3538
Lys Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp
1140 1145 1150
att tca ggc att aac gct tct gtc gtc aac att caa aaa gaa att 3583
Ile Ser Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile
1155 1160 1165
gac cgc ctc aat gag gtc gct aaa aat tta aat gaa tca ctc att 3628
Asp Arg Leu Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile
1170 1175 1180
gac ctt caa gaa ttg gga aaa tat gag caa tat att aaa tgg cct 3673
Asp Leu Gln Glu Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro
1185 1190 1195
tgg tat gtt tgg ctc ggc ttc att gct gga cta att gcc atc gtc 3718
Trp Tyr Val Trp Leu Gly Phe Ile Ala Gly Leu Ile Ala Ile Val
1200 1205 1210
atg gtt aca atc ttg ctt tgt tgc atg act agt tgt tgc agt tgc 3763
Met Val Thr Ile Leu Leu Cys Cys Met Thr Ser Cys Cys Ser Cys
1215 1220 1225
ctc aag ggt gca tgc tct tgt ggt tct tgc tgc aag ttt gat gag 3808
Leu Lys Gly Ala Cys Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu
1230 1235 1240
gat gac tct gag cca gtt ctc aag ggt gtc aaa tta cat tac aca 3853
Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu His Tyr Thr
1245 1250 1255
taaacgaact tatggatttg tttatgagat tttttactct tggatcaatt actgcacagc 3913
cagtaaaaat tgacaatgct tctcctgcaa gt3945
<210>3
<211>1255
<212>PRT
<213>冠状病毒
<400>3
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
1 5 10 15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
20 25 30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
35 40 45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
50 55 60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
65 70 75 80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
85 90 95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
100 105 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
115 120 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
130 135 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145 150 155 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
165 170 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
180 185 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
195 200 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
210 215 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225 230 235 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
245 250 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
260 265 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
275 280 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
290 295 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305 310 315 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
325 330 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
340 345 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
355 360 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
370 375 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385 390 395 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
405 410 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
420 425 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
435 440 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
450 455 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465 470 475 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
485 490 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
500 505 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
515 520 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
530 535 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545 550555 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
565 570 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
580 585 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
595 600 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
610 615 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625 630 635 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
645 650 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
660 665 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
675 680 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
690 695 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705 710 715 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
725 730 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
740 745 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
755 760 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
770 775 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785 790 795 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
805 810 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
820 825 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
835 840 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
850 855 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865 870 875 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
885 890 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
900 905 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
915 920 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
930 935 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945 950 955 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
965 970 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
980 985 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
995 10001005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1010 1015 1020
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala
1025 1030 1035
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln
1040 1045 1050
Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys
1055 1060 1065
Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser
1070 1075 1080
Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr
1085 1090 1095
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1100 1105 1110
Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1115 1120 1125
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1130 1135 1140
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1145 1150 1155
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1160 1165 1170
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1175 1180 1185
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile
1190 1195 1200
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys
1205 1210 1215
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly
1220 1225 1230
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1235 1240 1245
Gly Val Lys Leu His Tyr Thr
1250 1255
<210>4
<211>3943
<212>DNA
<213>冠状病毒
<400>4
ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60
atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta120
gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc180
aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc240
tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta300
ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca360
cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac420
agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat480
tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga540
tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg600
tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg660
ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg720
gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta780
gagccattct tacagccttt tcacctgctc aagacatttg gggcacgtca gctgcagcct840
attttgttgg ctatttaaag ccaactacat ttatgctcaa gtatgatgaa aatggtacaa900
tcacagatgc tgttgattgt tctcaaaatc cacttgctga actcaaatgc tctgttaaga960
gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020
atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta1080
ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt1140
actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca1200
ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag1260
atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat1320
tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt1380
caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg1440
agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc1500
ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc1560
aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg1620
gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac1680
tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg1740
gccgtgatgt ctctgatttc actgattccg ttcgagatcc taaaacatct gaaatattag1800
acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat1860
ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg1920
cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc1980
aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta2040
ttggagctgg catttgtgct agttaccata cagtttcttt attacgtagt actagccaaa2100
aatctattgt ggcttatact atgtctttag gtgctgatag ttcaattgct tactctaata2160
acaccattgc tatacctact aacttttcaa ttagcattac tacagaagta atgcctgttt2220
ctatggctaa aacctccgta gattgtaata tgtacatctg cggagattct actgaatgtg2280
ctaatttgct tctccaatat ggtagctttt gcacacaact aaatcgtgca ctctcaggta2340
ttgctgctga acaggatcgc aacacacgtg aagtgttcgc tcaagtcaaa caaatgtaca2400
aaaccccaac tttgaaatat tttggtggtt ttaatttttc acaaatatta cctgaccctc2460
taaagccaac taagaggtct tttattgagg acttgctctt taataaggtg acactcgctg2520
atgctggctt catgaagcaa tatggcgaat gcctaggtga tattaatgct agagatctca2580
tttgtgcgca gaagttcaat gggcttacag tgttgccacc tctgctcact gatgatatga2640
ttgctgccta cactgctgct ctagttagtg gtactgccac tgctggatgg acatttggtg2700
ctggcgctgc tcttcaaata ccttttgcta tgcaaatggc atataggttc aatggcattg2760
gagttaccca aaatgttctc tatgagaacc aaaaacaaat cgccaaccaa tttaacaagg2820
cgattagtca aattcaagaa tcacttacaa caacatcaac tgcattgggc aagctgcaag2880
acgttgttaa ccagaatgct caagcattaa acacacttgt taaacaactt agctctaatt2940
ttggtgcaat ttcaagtgtg ctaaatgata tcctttcgcg acttgataaa gtcgaggcgg3000
aggtacaaat tgacaggcta attacaggca gacttcaaag ccttcaaacc tatgtaacac3060
aacaactaat cagggctgct gaaatcaggg cttctgctaa tcttgctgct actaaaatgt3120
ctgagtgtgt tcttggacaa tcaaaaagag ttgacttttg tggaaagggc taccacctta3180
tgtccttccc acaagcagcc ccgcatggtg ttgtcttcct acatgtcacg tatgtgccat3240
cccaggagag gaacttcacc acagcgccag caatttgtca tgaaggcaaa gcatacttcc3300
ctcgtgaagg tgtttttgtg tttaatggca cttcttggtt tattacacag aggaacttct3360
tttctccaca aataattact acagacaata catttgtctc aggaaattgt gatgtcgtta3420
ttggcatcat taacaacaca gtttatgatc ctctgcaacc tgagcttgac tcattcaaag3480
aagagctgga caagtacttc aaaaatcata catcaccaga tgttgatctt ggcgacattt3540
caggcattaa cgcttctgtc gtcaacattc aaaaagaaat tgaccgcctc aatgaggtcg3600
ctaaaaattt aaatgaatca ctcattgacc ttcaagaatt gggaaaatat gagcaatata3660
ttaaatggcc ttggtatgtt tggctcggct tcattgctgg actaattgcc atcgtcatgg3720
ttacaatctt gctttgttgc atgactagtt gttgcagttg cctcaagggt gcatgctctt3780
gtggttcttg ctgcaagttt gatgaggatg actctgagcc agttctcaag ggtgtcaaat3840
tacattacac ataaacgaac ttatggattt gtttatgaga ttttttactc ttggatcaat3900
tactgcacag ccagtaaaaa ttgacaatgc ttctcctgca agt 3943
<210>5
<211>2049
<212>DNA
<213>冠状病毒
<400>5
ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 60
atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta 120
gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc 180
aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc 240
tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta 300
ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca 360
cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac420
agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat480
tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga540
tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg600
tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg660
ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg720
gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta780
gagccattct tacagccttt tcacctgctc aagacatttg gggcacgtca gctgcagcct840
attttgttgg ctatttaaag ccaactacat ttatgctcaa gtatgatgaa aatggtacaa900
tcacagatgc tgttgattgt tctcaaaatc cacttgctga actcaaatgc tctgttaaga960
gctttgagat tgacaaagga atttaccaga cctctaattt cagggttgtt ccctcaggag 1020
atgttgtgag attccctaat attacaaact tgtgtccttt tggagaggtt tttaatgcta 1080
ctaaattccc ttctgtctat gcatgggaga gaaaaaaaat ttctaattgt gttgctgatt 1140
actctgtgct ctacaactca acattttttt caacctttaa gtgctatggc gtttctgcca 1200
ctaagttgaa tgatctttgc ttctccaatg tctatgcaga ttcttttgta gtcaagggag 1260
atgatgtaag acaaatagcg ccaggacaaa ctggtgttat tgctgattat aattataaat 1320
tgccagatga tttcatgggt tgtgtccttg cttggaatac taggaacatt gatgctactt 1380
caactggtaa ttataattat aaatataggt atcttagaca tggcaagctt aggccctttg 1440
agagagacat atctaatgtg cctttctccc ctgatggcaa accttgcacc ccacctgctc 1500
ttaattgtta ttggccatta aatgattatg gtttttacac cactactggc attggctacc 1560
aaccttacag agttgtagta ctttcttttg aacttttaaa tgcaccggcc acggtttgtg 1620
gaccaaaatt atccactgac cttattaaga accagtgtgt caattttaat tttaatggac 1680
tcactggtac tggtgtgtta actccttctt caaagagatt tcaaccattt caacaatttg 1740
gccgtgatgt ctctgatttc actgattccg ttcgagatcc taaaacatct gaaatattag 1800
acatttcacc ttgctctttt gggggtgtaa gtgtaattac acctggaaca aatgcttcat 1860
ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 1920
cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 1980
aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 2040
ttggagctg 2049
<210>6
<211>2027
<212>DNA
<213>冠状病毒
<400>6
catgcagatc aactcacacc agcttggcgc atatattcta ctggaaacaa tgtattccag 60
actcaagcag gctgtcttat aggagctgag catgtcgaca cttcttatga gtgcgacatt120
cctattggag ctggcatttg tgctagttac catacagttt ctttattacg tagtactagc180
caaaaatcta ttgtggctta tactatgtct ttaggtgctg atagttcaat tgcttactct240
aataacacca ttgctatacc tactaacttt tcaattagca ttactacaga agtaatgcct300
gtttctatgg ctaaaacctc cgtagattgt aatatgtaca tctgcggaga ttctactgaa360
tgtgctaatt tgcttctcca atatggtagc ttttgcacac aactaaatcg tgcactctca420
ggtattgctg ctgaacagga tcgcaacaca cgtgaagtgt tcgctcaagt caaacaaatg480
tacaaaaccc caactttgaa atattttggt ggttttaatt tttcacaaat attacctgac540
cctctaaagc caactaagag gtcttttatt gaggacttgc tctttaataa ggtgacactc600
gctgatgctg gcttcatgaa gcaatatggc gaatgcctag gtgatattaa tgctagagat660
ctcatttgtg cgcagaagtt caatgggctt acagtgttgc cacctctgct cactgatgat720
atgattgctg cctacactgc tgctctagtt agtggtactg ccactgctgg atggacattt780
ggtgctggcg ctgctcttca aatacctttt gctatgcaaa tggcatatag gttcaatggc840
attggagtta cccaaaatgt tctctatgag aaccaaaaac aaatcgccaa ccaatttaac900
aaggcgatta gtcaaattca agaatcactt acaacaacat caactgcatt gggcaagctg960
caagacgttg ttaaccagaa tgctcaagca ttaaacacac ttgttaaaca acttagctct 1020
aattttggtg caatttcaag tgtgctaaat gatatccttt cgcgacttga taaagtcgag 1080
gcggaggtac aaattgacag gttaattaca ggcagacttc aaagccttca aacctatgta 1140
acacaacaac taatcagggc tgctgaaatc agggcttctg ctaatcttgc tgctactaaa 1200
atgtctgagt gtgttcttgg acaatcaaaa agagttgact tttgtggaaa gggctaccac 1260
cttatgtcct tcccacaagc agccccgcat ggtgttgtct tcctacatgt cacgtatgtg 1320
ccatcccagg agaggaactt caccacagcg ccagcaattt gtcatgaagg caaagcatac 1380
ttccctcgtg aaggtgtttt tgtgtttaat ggcacttctt ggtttattac acagaggaac 1440
ttcttttctc cacaaataat tactacagac aatacatttg tctcaggaaa ttgtgatgtc 1500
gttattggcg tcattaacaa cacagtttat gatcctctgc aacctgagct tgactcattc 1560
aaagaagagc tggacaagta cttcaaaaat catacatcac cagatgttga tcttggcgac1620
atttcaggca ttaacgcttc tgtcgtcaac attcaaaaag aaattgaccg cctcaatgag1680
gtcgctaaaa atttaaatga atcactcatt gaccttcaag aattgggaaa atatgagcaa1740
tatattaaat ggccttggta tgtttggctc ggcttcattg ctggactaat tgccatcgtc1800
atggttacaa tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc1860
tcttgtggtt cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc1920
aaattacatt acacataaac gaacttatgg atttgtttat gagatttttt actcttggat1980
caattactgc acagccagta aaaattgaca atgcttctcc tgcaagt 2027
<210>7
<211>1096
<212>DNA
<213>冠状病毒
<400>7
tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60
cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt120
acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc180
acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat240
accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt300
ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa360
gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt420
gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct480
acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc540
caagaaccca ttactttatg atgccaacta ctttgtttgc tggcacacac ataactatga600
ctactgtata ccatataaca gtgtcacaga tacaattgtc gttactgaag gtgacggcat660
ttcaacacca aaactcaaag aagactacca aattggtggt tattctgagg ataggcactc720
aggtgttaaa gactatgtcg ttgtacatgg ctatttcacc gaagtttact accagcttga780
gtctacacaa attactacag acactggtat tgaaaatgct acattcttca tctttaacaa840
gcttgttaaa gacccaccga atgtgcaaat acacacaatc gacggctctt caggagttgc900
taatccagca atggatccaa tttatgatga gccgacgacg actactagcg tgcctttgta960
agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa caggtacgtt 1020
aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag tcacactagc 1080
catccttact gcgctt 1096
<210>8
<211>1135
<212>DNA
<213>冠状病毒
<400>8
attgccatcg tcatggttac aatcttgctt tgttgcatga ctagttgttg cagttgcctc 60
aagggtgcat gctcttgtgg ttcttgctgc aagtttgatg aggatgactc tgagccagtt120
ctcaagggtg tcaaattaca ttacacataa acgaacttat ggatttgttt atgagatttt180
ttactcttgg atcaattact gcacagccag taaaaattga caatgcttct cctgcaagta240
ctgttcatgc tacagcaacg ataccgctac aagcctcact ccctttcgga tggcttgtta300
ttggcgttgc atttcttgct gtttttcaga gcgctaccaa aataattgcg ctcaataaaa360
gatggcagct agccctttat aagggcttcc agttcatttg caatttactg ctgctatttg420
ttaccatcta ttcacatctt ttgcttgtcg ctgcaggtat ggaggcgcaa tttttgtacc480
tctatgcctt gatatatttt ctacaatgca tcaacgcatg tagaattatt atgagatgtt540
ggctttgttg gaagtgcaaa tccaagaacc cattacttta tgatgccaac tactttgttt600
gctggcacac acataactat gactactgta taccatataa cagtgtcaca gatacaattg660
tcgttactga aggtgacggc atttcaacac caaaactcaa agaagactac caaattggtg720
gttattctga ggataggcac tcaggtgtta aagactatgt cgttgtacat ggctatttca780
ccgaagttta ctaccagctt gagtctacac aaattactac agacactggt attgaaaatg840
ctacattctt catctttaac aagcttgtta aagacccacc gaatgtgcaa atacacacaa900
tcgacggctc ttcaggagtt gctaatccag caatggatcc aatttatgat gagccgacga960
cgactactag cgtgcctttg taagcacaag aaagtgagta cgaacttatg tactcattcg 1020
tttcggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt gctttcgtgg 1080
tattcttgct agtcacacta gccatcctta ctgcgcttcg attgtgtgcg tactg1135
<210>9
<211>1096
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(137)..(958)
<223>
<400>9
tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60
cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt120
acrcataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tca172
Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser
1 5 10
att act gca cag cca gta aaa att gac aat gct tct cct gca agt act 220
Ile Thr Ala Gln Pro Val Lys Ile Asp Asn Ala Ser Pro Ala Ser Thr
15 20 25
gtt cat gct aca gca acg ata ccg cta caa gcc tca ctc cct ttc gga 268
Val His Ala Thr Ala Thr Ile Pro Leu Gln Ala Ser Leu Pro Phe Gly
30 35 40
tgg ctt gtt att ggc gtt gca ttt ctt gct gtt ttt cag agc gct acc 316
Tro Leu Val Ile Gly Val Ala Phe Leu Ala Val Phe Gln Ser Ala Thr
45 50 55 60
aaa ata att gcg ctc aat aaa aga tgg cag cta gcc ctt tat aag ggc 364
Lys Ile Ile Ala Leu Asn Lys Arg Trp Gln Leu Ala Leu Tyr Lys Gly
65 70 75
ttc cag ttc att tgc aat tta ctg ctg cta ttt gtt acc atc tat tca 412
Phe Gln Phe Ile Cys Asn Leu Leu Leu Leu Phe Val Thr Ile Tyr Ser
80 85 90
cat ctt ttg ctt gtc gct gca ggt atg gag gcg caa ttt ttg tac ctc 460
His Leu Leu Leu Val Ala Ala Gly Met Glu Ala Gln Phe Leu Tyr Leu
95 100 105
tat gcc ttg ata tat ttt cta caa tgc atc aac gca tgt aga att att 508
Tyr Ala Leu Ile Tyr Phe Leu Gln Cys Ile Asn Ala Cys Arg Ile Ile
110 115 120
atg aga tgt tgg ctt tgt tgg aag tgc aaa tcc aag aac cca tta ctt 556
Met Arg Cys Trp Leu Cys Trp Lys Cys Lys Ser Lys Asn Pro Leu Leu
125 130 135 140
tat gat gcc aac tac ttt gtt tgc tgg cac aca cat aac tat gac tac 604
Tyr Asp Ala Asn Tyr Phe Val Cys Trp His Thr His Asn Tyr Asp Tyr
145 150 155
tgt ata cca tat aac agt gtc aca gat aca att gtc gtt act gaa ggt 652
Cys Ile Pro Tyr Asn Ser Val Thr Asp Thr Ile Val Val Thr Glu Gly
160 165 170
gac ggc att tca aca cca aaa ctc aaa gaa gac tac caa att ggt ggt 700
Asp Gly Ile Ser Thr Pro Lys Leu Lys Glu Asp Tyr Gln Ile Gly Gly
175 180 185
tat tct gag gat agg cac tca ggt gtt aaa gac tat gtc gtt gta cat 748
Tyr Ser Glu Asp Arg His Ser Gly Val Lys Asp Tyr Val Val Val His
190 195 200
ggc tat ttc acc gaa gtt tac tac cag ctt gag tct aca caa att act 796
Gly Tyr Phe Thr Glu Val Tyr Tyr Gln Leu Glu Ser Thr Gln Ile Thr
205 210 215 220
aca gac act ggt att gaa aat gct aca ttc ttc atc ttt aac aag ctt 844
Thr Asp Thr Gly Ile Glu Asn Ala Thr Phe Phe Ile Phe Ash Lys Leu
225 230 235
gtt aaa gac cca ccg aat gtg caa ata cac aca atc gac ggc tct tca 892
Val Lys Asp Pro Pro Asn Val Gln Ile His Thr Ile Asp Gly Ser Ser
240 245 250
gga gtt gct aat cca gca atg gat cca att tat gat gag ccg acg acg 940
Gly Val Ala Asn Pro Ala Met Asp Pro Ile Tyr Asp Glu Pro Thr Thr
255 260 265
act act agc gtg cct ttg taagcacaag aaagtgagta cgaacttatg 988
Thr Thr Ser Val Pro Leu
270
tactcattcg tttcggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt1048
gctttcgtgg tattcttgct agtcacacta gccatcctta ctgcgctt 1096
<210>10
<211>274
<212>PRT
<213>冠状病毒
<400>10
Met Asp Leu Phe Met Arg Phe Phe Thr Leu Gly Ser Ile Thr Ala Gln
1 5 10 15
Pro Val Lys Ile Asp Asn Ala Ser Pro Ala Ser Thr Val His Ala Thr
20 25 30
Ala Thr Ile Pro Leu Gln Ala Ser Leu Pro Phe Gly Trp Leu Val Ile
35 40 45
Gly Val Ala Phe Leu Ala Val Phe Gln Ser Ala Thr Lys Ile Ile Ala
50 55 60
Leu Asn Lys Arg Trp Gln Leu Ala Leu Tyr Lys Gly Phe Gln Phe Ile
65 70 75 80
Cys Asn Leu Leu Leu Leu Phe Val Thr Ile Tyr Ser His Leu Leu Leu
85 90 95
Val Ala Ala Gly Met Glu Ala Gln Phe Leu Tyr Leu Tyr Ala Leu Ile
100 105 110
Tyr Phe Leu Gln Cys Ile Asn Ala Cys Arg Ile Ile Met Arg Cys Trp
115 120 125
Leu Cys Trp Lys Cys Lys Ser Lys Asn Pro Leu Leu Tyr Asp Ala Asn
130 135 140
Tyr Phe Val Cys Trp His Thr His Asn Tyr Asp Tyr Cys Ile Pro Tyr
145150 155 160
Asn Ser Val Thr Asp Thr Ile Val Val Thr Glu Gly Asp Gly Ile Ser
165 170 175
Thr Pro Lys Leu Lys Glu Asp Tyr Gln Ile Gly Gly Tyr Ser Glu Asp
180 185 190
Arg His Ser Gly Val Lys Asp Tyr Val Val Val His Gly Tyr Phe Thr
195 200 205
Glu Val Tyr Tyr Gln Leu Glu Ser Thr Gln Ile Thr Thr Asp Thr Gly
210 215 220
Ile Glu Asn Ala Thr Phe Phe Ile Phe Asn Lys Leu Val Lys Asp Pro
225 230 235 240
Pro Asn Val Gln Ile His Thr Ile Asp Gly Ser Ser Gly Val Ala Asn
245 250 255
Pro Ala Met Asp Pro Ile Tyr Asp Glu Pro Thr Thr Thr Thr Ser Val
260 265 270
Pro Leu
<210>11
<211>1096
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(558)..(1019)
<223>
<400>11
tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt 60
cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt120
acacataaac gaacttatgg atttgtttat gagatttttt actcttggat caattactgc180
acagccagta aaaattgaca atgcttctcc tgcaagtact gttcatgcta cagcaacgat240
accgctacaa gcctcactcc ctttcggatg gcttgttatt ggcgttgcat ttcttgctgt300
ttttcagagc gctaccaaaa taattgcgct caataaaaga tggcagctag ccctttataa360
gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt420
gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct480
acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc540
caagaaccca ttacttt atg atg cca act act ttg ttt gct ggc aca cac 590
Met Met Pro Thr Thr Leu Phe Ala Gly Thr His
1 5 10
ata act atg act act gta tac cat ata aca gtg tca cag ata caa ttg 638
Ile Thr Met Thr Thr Val Tyr His Ile Thr Val Ser Gln Ile Gln Leu
15 20 25
tcg tta ctg aag gtg acg gca ttt caa cac caa aac tca aag aag act 686
Ser Leu Leu Lys Val Thr Ala Phe Gln His Gln Asn Ser Lys Lys Thr
30 35 40
acc aaa ttg gtg gtt att ctg agg ata ggc act cag gtg tta aag act 734
Thr Lys Leu Val Val Ile Leu Arg Ile Gly Thr Gln Val Leu Lys Thr
45 50 55
atg tcg ttg tac atg gct att tca ccg aag ttt act acc agc ttg agt 782
Met Ser Leu Tyr Met Ala Ile Ser Pro Lys Phe Thr Thr Ser Leu Ser
60 65 70 75
cta cac aaa tta cta cag aca ctg gta ttg aaa atg cta cat tct tca 830
Leu His Lys Leu Leu Gln Thr Leu Val Leu Lys Met Leu His Ser Ser
80 85 90
tct tta aca agc ttg tta aag acc cac cga atg tgc aaa tac aca caa 878
Ser Leu Thr Ser Leu Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gln
95 100 105
tcg acg gct ctt cag gag ttg cta atc cag caa tgg atc caa ttt atg 926
Ser Thr Ala Leu Gln Glu Leu Leu Ile Gln Gln Trp Ile Gln Phe Met
110 115 120
atg agc cga cga cga cta cta gcg tgc ctt tgt aag cac aag aaa gtg 974
Met Ser Arg Arg Arg Leu Leu Ala Cys Leu Cys Lys His Lys Lys Val
125 130 135
agt acg aac tta tgt act cat tcg ttt cgg aag aaa cag gta cgt 1019
Ser Thr Asn Leu Cys Thr His Ser Phe Arg Lys Lys Gln Val Arg
140 145 150
taatagttaa tagcgtactt ctttttcttg ctttcgtggt attcttgcta gtcacactag 1079
ccatccttac tgcgctt 1096
<210>12
<211>154
<212>PRT
<213>冠状病毒
<400>12
Met Met Pro Thr Thr Leu Phe Ala Gly Thr His Ile Thr Met Thr Thr
1 5 10 15
Val Tyr His Ile Thr Val Ser Gln Ile Gln Leu Ser Leu Leu Lys Val
20 25 30
Thr Ala Phe Gln His Gln Asn Ser Lys Lys Thr Thr Lys Leu Val Val
35 40 45
Ile Leu Arg Ile Gly Thr Gln Val Leu Lys Thr Met Ser Leu Tyr Met
50 55 60
Ala Ile Ser Pro Lys Phe Thr Thr Ser Leu Ser Leu His Lys Leu Leu
65 70 75 80
Gln Thr Leu Val Leu Lys Met Leu His Ser Ser Ser Leu Thr Ser Leu
85 90 95
Leu Lys Thr His Arg Met Cys Lys Tyr Thr Gln Ser Thr Ala Leu Gln
100 105 110
Glu Leu Leu Ile Gln Gln Trp Ile Gln Phe Met Met Ser Arg Arg Arg
115 120 125
Leu Leu Ala Cys Leu Cys Lys His Lys Lys Val Ser Thr Asn Leu Cys
130 135 140
Thr His Ser Phe Arg Lys Lys Gln Val Arg
145 150
<210>13
<211>332
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(36)..(263)
<223>
<400>13
tgcctttgta agcacaagaa agtgagtacg aactt atg tac tca ttc gtt tcg 53
Met Tyr Ser Phe Val Ser
1 5
gaa gaa aca ggt acg tta ata gtt aat agc gta ctt ctt ttt ctt gct101
Glu Glu Thr Gly Thr Leu Ile Val Asn Ser Val Leu Leu Phe Leu Ala
10 15 20
ttc gtg gta ttc ttg cta gtc aca cta gcc atc ctt act gcg ctt cga149
Phe Val Val Phe Leu Leu Val Thr Leu Ala Ile Leu Thr Ala Leu Arg
25 30 35
ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca197
Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn Val Ser Leu Val Lys Pro
40 45 50
acg gtt tac gtc tac tcg cgt gtt aaa aat ctg aac tct tct gaa gga245
Thr Val Tyr Val Tyr Ser Arg Val Lys Asn Leu Asn Ser Ser Glu Gly
55 60 65 70
gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 293
Val Pro Asp Leu Leu Val
75
ttggaacttt aacattgctt atcatggcag acaacggta 332
<210>14
<211>76
<212>PRT
<213>冠状病毒
<400>14
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu Ile Val Asn Ser
1 5 10 15
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala
20 25 30
Ile Leu Thr Ala Leu Arg Leu Cys Ala Tyr Cys Cys Asn Ile Val Asn
35 40 45
Val Ser Leu Val Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn
50 55 60
Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu Val
65 70 75
<210>15
<211>332
<212>DNA
<213>冠状病毒
<400>15
tgcctttgta agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa 60
caggtacgtt aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag120
tcacactagc catccttact gcgcttcgat tgtgtgcgta ctgctgcaat attgttaacg180
tgagtttagt aaaaccaacg gtttacgtct actcgcgtgt taaaaatctg aactcttctg240
aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac300
tttaacattg cttatcatgg cagacaacgg ta 332
<210>16
<211>708
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(41)..(703)
<223>
<400>16
tattattatt attctgtttg gaactttaac attgcttatc atg gca gac aac ggt 55
Met Ala Asp Asn Gly
1 5
act att acc gtt gag gag ctt aaa caa ctc ctg gaa caa tgg aac cta 103
Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu Glu Gln Trp Asn Leu
l0 15 20
gta ata ggt ttc cta ttc cta gcc tgg att atg tta cta caa ttt gcc 151
Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met Leu Leu Gln Phe Ala
25 30 35
tat tct aat cgg aac agg ttt ttg tac ata ata aag ctt gtt ttc ctc 199
Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile Lys Leu Val Phe Leu
40 45 50
tgg ctc ttg tgg cca gta aca ctt gct tgt ttt gtg ctt gct gct gtc 247
Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe Val Leu Ala Ala Val
55 60 65
tac aga att aat tgg gtg act ggc ggg att gcg att gca atg gct tgt 295
Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala Ile Ala Met Ala Cys
70 75 80 85
att gta ggc ttg atg tgg ctt agc tac ttc gtt gct tcc ttc agg ctg 343
Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val Ala Ser Phe Arg Leu
90 95 100
ttt gct cgt acc cgc tca atg tgg tca ttc aac cca gaa aca aac att 391
Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn Pro Glu Thr Asn Ile
105 110 115
ctt ctc aat gtg cct ctc cgg ggg aca att gtg acc aga ccg ctc atg 439
Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Val Thr Arg Pro Leu Met
120 125 130
gaa agt gaa ctt gtc att ggt gct gtg atc att cgt ggt cac ttg cga 487
Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile Arg Gly His Leu Arg
135 140 145
atg gcc gga cac tcc cta ggg cgc tgt gac att aag gac ctg cca aaa 535
Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile Lys Asp Leu Pro Lys
150 155 160 165
gag atc act gtg gct aca tca cga acg ctt tct tat tac aaa tta gga 583
Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser Tyr Tyr Lys Leu Gly
170 175 180
gcg tcg cag cgt gta ggc act gat tca ggt ttt gct gca tac aac cgc 631
Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe Ala Ala Tyr Asn Arg
185 190 195
tac cgt att gga aac tat aaa tta aat aca gac cac gcc ggt agc aac 679
Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp His Ala Gly Ser Asn
200 205 210
gac aat att gct ttg cta gta cag taagt708
Asp Asn Ile Ala Leu Leu Val Gln
215 220
<210>17
<211>221
<212>PRT
<213>冠状病毒
<400>17
Met Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln Leu Leu
1 5 10 15
Glu Gln Trp Asn Leu Val Ile Gly Phe Leu Phe Leu Ala Trp Ile Met
20 25 30
Leu Leu Gln Phe Ala Tyr Ser Asn Arg Asn Arg Phe Leu Tyr Ile Ile
35 40 45
Lys Leu Val Phe Leu Trp Leu Leu Trp Pro Val Thr Leu Ala Cys Phe
50 55 60
Val Leu Ala Ala Val Tyr Arg Ile Asn Trp Val Thr Gly Gly Ile Ala
65 70 75 80
Ile Ala Met Ala Cys Ile Val Gly Leu Met Trp Leu Ser Tyr Phe Val
85 90 95
Ala Ser Phe Arg Leu Phe Ala Arg Thr Arg Ser Met Trp Ser Phe Asn
100105 110
Pro Glu Thr Asn Ile Leu Leu Asn Val Pro Leu Arg Gly Thr Ile Val
115 120 125
Thr Arg Pro Leu Met Glu Ser Glu Leu Val Ile Gly Ala Val Ile Ile
130 135 140
Arg Gly His Leu Arg Met Ala Gly His Ser Leu Gly Arg Cys Asp Ile
145 150 155 160
Lys Asp Leu Pro Lys Glu Ile Thr Val Ala Thr Ser Arg Thr Leu Ser
165 170 175
Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe
180 185 190
Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp
195 200 205
His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Gln
210 215 220
<210>18
<211>769
<212>DNA
<213>冠状病毒
<400>18
cctgatcttc tggtctaaac gaactaacta ttattattat tctgtttgga actttaacat 60
tgcttatcat ggcagacaac ggtactatta ccgttgagga gcttaaacaa ctcctggaac120
aatggaacct agtaataggt ttcctattcc tagcctggat tatgttacta caatttgcct180
attctaatcg gaacaggttt ttgtacataa taaagcttgt tttcctctgg ctcttgtggc240
cagtaacact tgcttgtttt gtgcttgctg ctgtctacag aattaattgg gtgactggcg300
ggattgcgat tgcaatggct tgtattgtag gcttgatgtg gcttagctac ttcgttgctt360
ccttcaggct gtttgctcgt acccgctcaa tgtggtcatt caacccagaa acaaacattc420
ttctcaatgt gcctctccgg gggacaattg tgaccagacc gctcatggaa agtgaacttg480
tcattggtgc tgtgatcatt cgtggtcact tgcgaatggc cggacactcc ctagggcgct540
gtgacattaa ggacctgcca aaagagatca ctgtggctac atcacgaacg ctttcttatt600
acaaattagg agcgtcgcag cgtgtaggca ctgattcagg ttttgctgca tacaaccgct660
accgtattgg aaactataaa ttaaatacag accacgccgg tagcaacgac aatattgctt720
tgctagtaca gtaagtgaca acagatgttt catcttgttg acttccagg769
<210>19
<211>1231
<212>DNA
<213>冠状病毒
<400>19
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc120
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat180
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt240
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct300
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag360
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat420
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg480
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac540
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg600
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct660
cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat720
gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt780
ctaaacgaac atgaaacttc tcattgtttt gacttgtatt tctctatgca gttgcatatg840
cactgtagta cagcgctgtg catctaataa acctcatgtg cttgaagatc cttgtaaggt900
acaacactag gggtaatact tatagcactg cttggctttg tgctctagga aaggttttac960
cttttcatag atggcacact atggttcaaa catgcacacc taatgttact atcaactgtc 1020
aagatccagc tggtggtgcg cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa 1080
ctgctgcatt tagagacgta cttgttgttt taaataaacg aacaaattaa aatgtctgat 1140
aatggacccc aatcaaacca acgtagtgcc ccccgcatta catttggtgg acccacagat 1200
tcaactgaca ataaccagaa tggaggacgc a 1231
<210>20
<211>1242
<212>DNA
<213>冠状病毒
<400>20
gcatacaacc gctaccgtat tggaaactat aaattaaata cagaccacgc cggtagcaac 60
gacaatattg ctttgctagt acagtaagtg acaacagatg tttcatcttg ttgacttcca120
ggttacaata gcagagatat tgattatcat tatgaggact ttcaggattg ctatttggaa180
tcttgacgtt ataataagtt caatagtgag acagttattt aagcctctaa ctaagaagaa240
ttattcggag ttagatgatg aagaacctat ggagttagat tatccataaa acgaacatga300
aaattattct cttcctgaca ttgattgtat ttacatcttg cgagctatat cactatcagg360
agtgtgttag aggtacgact gtactactaa aagaaccttg cccatcagga acatacgagg420
gcaattcacc atttcaccct cttgctgaca ataaatttgc actaacttgc actagcacac480
actttgcttt tgcttgtgct gacggtactc gacataccta tcagctgcgt gcaagatcag540
tttcaccaaa acttttcatc agacaagagg aggttcaaca agagctctac tcgccacttt600
ttctcattgt tgctgctcta gtatttttaa tactttgctt caccattaag agaaagacag660
aatgaatgag ctcactttaa ttgacttcta tttgtgcttt ttagcctttc tgctattcct720
tgttttaata atgcttatta tattttggtt ttcactcgaa atccaggatc tagaagaacc780
ttgtaccaaa gtctaaacga acatgaaact tctcattgtt ttgacttgta tttctctatg840
cagttgcata tgcactgtag tacagcgctg tgcatctaat aaacctcatg tgcttgaaga900
tccttgtaag gtacaacact aggggtaata cttatagcac tgcttggctt tgtgctctag960
gaaaggtttt accttttcat agatggcaca ctatggttca aacatgcaca cctaatgtta 1020
ctatcaactg tcaagatcca gctggtggtg cgcttatagc taggtgttgg taccttcatg 1080
aaggtcacca aactgctgca tttagagacg tacttgttgt tttaaataaa cgaacgaatt 1140
aaaatgtctg ataatggacc ccaatcaaac caacgtagtg ccccccgcat tacatttggt 1200
ggacccacag attcaactga caataaccag aatggaggac gc 1242
<210>21
<211>1231
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(86)..(274)
<223>
<400>21
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60
ttgctagtac agtaagtgac aacag atg ttt cat ctt gtt gac ttc cag gtt 112
Met Phe His Leu Val Asp Phe Gln Val
1 5
aca ata gca gag ata ttg att atc att atg agg act ttc agg att gct 160
Thr Ile Ala Glu Ile Leu Ile Ile Ile Met Arg Thr Phe Arg Ile Ala
10 15 20 25
att tgg aat ctt gac gtt ata ata agt tca ata gtg aga caa tta ttt 208
Ile Trp Asn Leu Asp Val Ile Ile Ser Ser Ile Val Arg Gln Leu Phe
30 35 40
aag cct cta act aag aag aat tat tcg gag tta gat gat gaa gaa cct 256
Lys Pro Leu Thr Lys Lys Asn Tyr Ser Glu Leu Asp Asp Glu Glu Pro
45 50 55
atg gag tta gat tat cca taaaacgaac atgaaaatta ttctcttcct 304
Met Glu Leu Asp Tyr Pro
60
gacattgatt gtatttacat cttgcgagct atatcactat caggagtgtg ttagaggtac364
gactgtacta ctaaaagaac cttgcccatc aggaacatac gagggcaatt caccatttca424
ccctcttgct gacaataaat ttgcactaac ttgcactagc acacactttg cttttgcttg484
tgctgacggt actcgacata cctatcagct gcgtgcaaga tcagtttcac caaaactttt544
catcagacaa gaggaggttc aacaagagct ctactcgcca ctttttctca ttgttgctgc604
tctagtattt ttaatacttt gcttcaccat taagagaaag acagaatgaa tgagctcact664
ttaattgact tctatttgtg ctttttagcc tttctgctat tccttgtttt aataatgctt724
attatatttt ggttttcact cgaaatccag gatctagaag aaccttgtac caaagtctaa784
acgaacatga aacttctcat tgttttgact tgtatttctc tatgcagttg catatgcact844
gtagtacsgc gctgtgcatc taataaacct catgtgcttg aagatccttg taaggtacaa904
cactaggggt aatacttata gGactgcttg gctttgtgct ctaggaaagg ttttaccttt964
tcatagatgg cacactatgg ttcaaacatg cacacctaat gttactatca actgtcaaga 1024
tccagctggt ggtgcgctta tagctaggtg ttggtacctt catgaaggtc accaaactgc 1084
tgcatttaga gacgtacttg ttgttttaaa taaacgaaca aattaaaatg tctgataatg 1144
gaccccaatc aaaccaacgt agtgcccccc gcattacatt tggtggaccc acagattcaa 1204
ctgacaataa ccagaatgga ggacgca 1231
<210>22
<211>63
<212>PRT
<213>冠状病毒
<400>22
Met Phe His Leu Val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Ile
1 5 10 15
Ile Ile Met Arg Thr Phe Arg Ile Ala Ile Trp Asn Leu Asp Val Ile
20 25 30
Ile Ser Ser Ile Val Arg Gln Len Phe Lys Pro Leu Thr Lys Lys Asn
35 40 45
Tyr Ser Glu Leu Asp Asp Glu Glu Pro Met Glu Leu Asp Tyr Pro
50 55 60
<210>23
<211>1231
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(285)..(650)
<223>
<400>23
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct60
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 120
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 180
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 240
agatgatgaa gaacctatgg agttagatta tccataaaac gaa atg aaa att att 296
Met Lys Ile Ile
1
ctc ttc ctg aca ttg att gta ttt aca tct tgc gag cta tat cac tat 344
Leu Phe Leu Thr Leu Ile Val Phe Thr Ser Cys Glu Leu Tyr His Tyr
5 10 15 20
cag gag tgt gtt aga ggt acg act gta cta cta aaa gaa cct tgc cca 392
Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys Glu Pro Cys Pro
25 30 35
tca gga aca tac gag ggc aat tca cca ttt cac cct ctt gct gac aat 440
Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro Leu Ala Asp Asn
40 45 50
aaa ttt gca cta act tgc act agc aca cac ttt gct ttt gct tgt gct 488
Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala Phe Ala Cys Ala
55 60 65
gac ggt act cga cat acc tat cag ctg cgt gca aga tca gtt tca cca 536
Asp Gly Thr Arg His Thr Tyr Gln Leu Arg Ala Arg Ser Val Ser Pro
70 75 80
aaa ctt ttc atc aga caa gag gag gtt caa caa gag ctc tac tcg cca 584
Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Gln Glu Leu Tyr Ser Pro
85 90 95 100
ctt ttt ctc att gtt gct gct cta gta ttt tta ata ctt tgc ttc acc 632
Leu Phe Leu Ile Val Ala Ala Leu Val Phe Leu Ile Leu Cys Phe Thr
105 110 115
att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt680
Ile Lys Arg Lys Thr Glu
120
tgtgcttttt agcctttctg ctattccttg ttttaataat gcttattata ttttggtttt 740
cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 800
tcattgtttt gacttgtatt tctctatgca gttgcatatg cactgtagta cagcgctgtg 860
catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 920
tatagcactg cttggctttg tgctctagga aaggttttac cttttcatag atggcacact 980
atggttcaaa catgcacacc taatgttact atcaactgtc aagatccagc tggtggtgcg 1040
cttatagcta ggtgttggta ccttcatgaa ggtcaccaaa ctgctgcatt tagagacgta 1100
cttgttgttt taaataaacg aacaaattaa aatgtctgat aatggacccc aatcaaacca 1160
acgtagtgcc ccccgcatta catttggtgg acccacagat tcaactgaca ataaccagaa 1220
tggaggacgc a 1231
<210>24
<211>122
<212>PRT
<213>冠状病毒
<400>24
Met Lys Ile Ile Leu Phe Leu Thr Leu Ile Val Phe Thr Ser Cys Glu
1 5 10 15
Leu Tyr His Tyr Gln Glu Cys Val Arg Gly Thr Thr Val Leu Leu Lys
20 25 30
Glu Pro Cys Pro Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro
35 40 45
Leu Ala Asp Asn Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala
50 55 60
Phe Ala Cys Ala Asp Gly Thr Arg His Thr Tyr Gln Leu Arg Ala Arg
65 70 75 80
Ser Val Ser Pro Lys Leu Phe Ile Arg Gln Glu Glu Val Gln Gln Glu
85 90 95
Leu Tyr Ser Pro Leu Phe Leu Ile Val Ala Ala Leu Val Phe Leu Ile
100 105 110
Leu Cys Phe Thr Ile Lys Arg Lys Thr Glu
115 120
<210>25
<211>1231
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(650)..(781)
<223>
<400>25
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc120
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat180
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt240
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct300
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag360
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat420
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg480
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac540
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg600
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacaga atg aat gag658
Met Asn Glu
1
ctc act tta att gac ttc tat ttg tgc ttt tta gcc ttt ctg cta ttc 706
Leu Thr Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe Leu Leu Phe
5 10 15
ctt gtt tta ata atg ctt att ata ttt tgg ttt tca ctc gaa atc cag 754
Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu Glu Ile Gln
20 25 30 35
gat cta gaa gaa cct tgt acc aaa gtc taaacgaaca tgaaacttct801
Asp Leu Glu Glu Pro Cys Thr Lys Val
40
cattgttttg acttgtattt ctctatgcag ttgcatatgc actgtagtac agcgctgtgc861
atctaataaa cctcatgtgc ttgaagatcc ttgtaaggta caacactagg ggtaatactt921
atagcactgc ttggctttgt gctctaggaa aggttttacc ttttcataga tggcacacta981
tggttcaaac atgcacacct aatgttacta tcaactgtca agatccagct ggtggtgcgc 1041
ttatagctag gtgttggtac cttcatgaag gtcaccaaac tgctgcattt agagacgtac 1101
ttgttgtttt aaataaacga acaaattaaa atgtctgata atggacccca atcaaaccaa 1161
cgtagtgccc cccgcattac atttggtgga cccacagatt caactgacaa taaccagaat 1221
ggaggacgca 1231
<210>26
<211>44
<212>PRT
<213>冠状病毒
<400>26
Met Asn Glu Leu Thr Leu Ile Asp Phe Tyr Leu Cys Phe Leu Ala Phe
1 5 10 15
Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu
20 25 30
Glu Ile Gln Asp Leu Glu Glu Pro Cys Thr Lys Val
35 40
<210>27
<211>1231
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(791)..(907)
<223>
<400>27
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc120
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat180
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt240
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct300
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag360
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat420
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg480
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac540
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg600
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct660
cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat720
gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt780
ctaaacgaac atg aaa ctt ctc att gtt ttg act tgt att tct cta tgc 829
Met Lys Leu Leu Ile Val Leu Thr Cys Ile Ser Leu Cys
1 5 10
agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 877
Ser Cys Ile Cys Thr Val Val Gln Arg Cys Ala Ser Asn Lys Pro His
15 20 25
gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca927
Val Leu Glu Asp Pro Cys Lys Val Gln His
30 35
ctgcttggct ttgtgctcta ggaaaggttt taccttttca tagatggcac actatggttc987
aaacatgcac acctaatgtt actatcaact gtcaagatcc agctggtggt gcgcttatag 1047
ctaggtgttg gtaccttcat gaaggtcacc aaactgctgc atttagagac gtacttgttg 1107
ttttaaataa acgaacaaat taaaatgtct gataatggac cccaatcaaa ccaacgtagt 1167
gccccccgca ttacatttgg tggacccaca gattcaactg acaataacca gaatggagga 1227
cgca1231
<210>28
<211>39
<212>PRT
<213>冠状病毒
<400>28
Met Lys Leu Leu Ile Val Leu Thr Cys Ile Ser Leu Cys Ser Cys Ile
1 5 10 15
Cys Thr Val Val Gln Arg Cys Ala Ser Asn Lys Pro His Val Leu Glu
20 25 30
Asp Pro Cys Lys Val Gln His
35
<210>29
<211>1231
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(876)..(1127)
<223>
<400>29
taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 60
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc120
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat180
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt240
agatgatgaa gaacctatgg agttagatta tccataaaac gaacatgaaa attattctct300
tcctgacatt gattgtattt acatcttgcg agctatatca ctatcaggag tgtgttagag360
gtacgactgt actactaaaa gaaccttgcc catcaggaac atacgagggc aattcaccat420
ttcaccctct tgctgacaat aaatttgcac taacttgcac tagcacacac tttgcttttg480
cttgtgctga cggtactcga catacctatc agctgcgtgc aagatcagtt tcaccaaaac540
ttttcatcag acaagaggag gttcaacaag agctctactc gccacttttt ctcattgttg600
ctgctctagt atttttaata ctttgcttca ccattaagag aaagacagaa tgaatgagct660
cactttaatt gacttctatt tgtgcttttt agcctttctg ctattccttg ttttaataat720
gcttattata ttttggtttt cactcgaaat ccaggatcta gaagaacctt gtaccaaagt780
ctaaacgaac atgaaacttc tcattgtttt gacttgtatt tctctatgca gttgcatatg840
cactgtagta cagcgctgtg catctaataa acctc atg tgc ttg aag atc ctt 893
Met Cys Leu Lys Ile Leu
1 5
gta agg tac aac act agg ggt aat act tat agc act gct tgg ctt tgt 941
Val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr Ser Thr Ala Trp Leu Cys
10 15 20
gct cta gga aag gtt tta cct ttt cat aga tgg cac act atg gtt caa 989
Ala Leu Gly Lys Val Leu Pro Phe His Arg Trp His Thr Met Val Gln
25 30 35
aca tgc aca cct aat gtt act atc aac tgt caa gat cca gct ggt ggt 1037
Thr Cys Thr Pro Asn Val Thr Ile Asn Cys Gln Asp Pro Ala Gly Gly
40 45 50
gcg ctt ata gct agg tgt tgg tac ctt cat gaa ggt cac caa act gct 1085
Ala Leu Ile Ala Arg Cys Trp Tyr Leu His Glu Gly His Gln Thr Ala
55 60 65 70
gca ttt aga gac gta ctt gtt gtt tta aat aaa cga aca aat 1127
Ala Phe Arg Asp Val Leu Val Val Leu Asn Lys Arg Thr Asn
75 80
taaaatgtct gataatggac cccaatcaaa ccaacgtagt gccccccgca ttacatttgg 1187
tggacccaca gattcaactg acaataacca gaatggagga cgca1231
<210>30
<211>84
<212>PRT
<213>冠状病毒
<400>30
Met Cys Leu Lys Ile Leu Val Arg Tyr Asn Thr Arg Gly Asn Thr Tyr
1 5 10 15
Ser Thr Ala Trp Leu Cys Ala Leu Gly Lys Val Leu Pro Phe His Arg
20 25 30
Trp His Thr Met Val Gln Thr Cys Thr Pro Asn Val Thr Ile Asn Cys
35 40 45
Gln Asp Pro Ala Gly Gly Ala Leu Ile Ala Arg Cys Trp Tyr Leu His
50 55 60
Glu Gly His Gln Thr Ala Ala Phe Arg Asp Val Leu Val Val Leu Asn
65 70 75 80
Lys Arg Thr Asn
<210>31
<211>21221
<212>DNA
<213>冠状病毒
<400>31
atggagagcc ttgttcttgg tgtcaacgag aaaacacacg tccaactcag tttgcctgtc 60
cttcaggtta gagacgtgct agtgcgtggc ttcggggact ctgtggaaga ggccctatcg120
gaggcacgtg aacacctcaa aaatggcact tgtggtctag tagagctgga aaaaggcgta180
ctgccccagc ttgaacagcc ctatgtgttc attaaacgtt ctgatgcctt aagcaccaat240
cacggccaca aggtcgttga gctggttgca gaaatggacg gcattcagta cggtcgtagc300
ggtataacac tgggagtact cgtgccacat gtgggcgaaa ccccaattgc ataccgcaat360
gttcttcttc gtaagaacgg taataaggga gccggtggtc atagctatgg catcgatcta420
aagtcttatg acttaggtga cgagcttggc actgatccca ttgaagatta tgaacaaaac480
tggaacacta agcatggcag tggtgcactc cgtgaactca ctcgtgagct caatggaggt540
gcagtcactc gctatgtcga caacaatttc tgtggcccag atgggtaccc tcttgattgc600
atcaaagatt ttctcgcacg cgcgggcaag tcaatgtgca ctctttccga acaacttgat660
tacatcgagt cgaagagagg tgtctactgc tgccgtgacc atgagcatga aattgcctgg720
ttcactgagc gctctgataa gagctacgag caccagacac ccttcgaaat taagagtgcc780
aagaaatttg acactttcaa aggggaatgc ccaaagtttg tgtttcctct taactcaaaa840
gtcaaagtca ttcaaccacg tgttgaaaag aaaaagactg agggtttcat ggggcgtata900
cgctctgtgt accctgttgc atctccacag gagtgtaaca atatgcactt gtctaccttg960
atgaaatgta atcattgcga tgaagtttca tggcagacgt gcgactttct gaaagccact 1020
tgtgaacatt gtggcactga aaatttagtt attgaaggac ctactacatg tgggtaccta 1080
cctactaatg ctgtagtgaa aatgccatgt cctgcctgtc aagacccaga gattggacct 1140
gagcatagtg ttgcagatta tcacaaccac tcaaacattg aaactcgact ccgcaaggga 1200
ggtaggacta gatgttttgg aggctgtgtg tttgcctatg ttggctgcta taataagcgt 1260
gcctactggg ttcctcgtgc tagtgctgat attggctcag gccatactgg cattactggt 1320
gacaatgtgg agaccttgaa tgaggatctc cttgagatac tgagtcgtga acgtgttaac 1380
attaacattg ttggcgattt tcatttgaat gaagaggttg ccatcatttt ggcatctttc 1440
tctgcttcta caagtgcctt tattgacact ataaagagtc ttgattacaa gtctttcaaa 1500
accattgttg agtcctgcgg taactataaa gttaccaagg gaaagcccgt aaaaggtgct 1560
tggaacattg gacaacagag atcagtttta acaccactgt gtggttttcc ctcacaggct 1620
gctggtgtta tcagatcaat ttttgcgcgc acacttgatg cagcaaacca ctcaattcct 1680
gatttgcaaa gagcagctgt caccatactt gatggtattt ctgaacagtc attacgtctt 1740
gtcgacgcca tggtttatac ttcagacctg ctcaccaaca gtgtcattat tatggcatat 1800
gtaactggtg gtcttgtaca acagacttct cagtggttgt ctaatctttt gggcactact 1860
gttgaaaaac tcaggcctat ctttgaatgg attgaggcga aacttagtgc aggagttgaa 1920
tttctcaagg atgcttggga gattctcaaa tttctcatta caggtgtttt tgacatcgtc 1980
aagggtcaaa tacaggttgc ttcagataac atcaaggatt gtgtaaaatg cttcattgat 2040
gttgttaaca aggcactcga aatgtgcatt gatcaagtca ctatcgctgg cgcaaagttg 2100
cgatcactca acttaggtga agtcttcatc gctcaaagca agggacttta ccgtcagtgt 2160
atacgtggca aggagcagct gcaactactc atgcctctta aggcaccaaa agaagtaacc 2220
tttcttgaag gtgattcaca tgacacagta cttacctctg aggaggttgt tctcaagaac 2280
ggtgaactcg aagcactcga gacgcccgtt gatagcttca caaatggagc tatcgttggc 2340
acaccagtct gtgtaaatgg cctcatgctc ttagagatta aggacaaaga acaatactgc 2400
gcattgtctc ctggtttact ggctacaaac aatgtctttc gcttaaaagg gggtgcacca 2460
attaaaggtg taacctttgg agaagatact gtttgggaag ttcaaggtta caagaatgtg 2520
agaatcacat ttgagcttga tgaacgtgtt gacaaagtgc ttaatgaaaa gtgctctgtc 2580
tacactgttg aatccggtac cgaagttact gagtttgcat gtgttgtagc agaggctgtt 2640
gtgaagactt tacaaccagt ttctgatctc cttaccaaca tgggtattga tcttgatgag 2700
tggagtgtag ctacattcta cttatttgat gatgctggtg aagaaaactt ttcatcacgt 2760
atgtattgtt ccttttaccc tccagatgag gaagaagagg acgatgcaga gtgtgaggaa 2820
gaagaaattg atgaaacctg tgaacatgag tacggtacag aggatgatta tcaaggtctc 2880
cctctggaat ttggtgcctc agctgaaaca gttcgagttg aggaagaaga agaggaagac 2940
tggctggatg atactactga gcaatcagag attgagccag aaccagaacc tacacctgaa 3000
gaaccagtta atcagtttac tggttattta aaacttactg acaatgttgc cattaaatgt 3060
gttgacatcg ttaaggaggc acaaagtgct aatcctatgg tgattgtaaa tgctgctaac 3120
atacacctga aacatggtgg tggtgtagca ggtgcactca acaaggcaac caatggtgcc 3180
atgcaaaagg agagtgatga ttacattaag ctaaatggcc ctcttacagt aggagggtct 3240
tgtttgcttt ctggacataa tcttgctaag aagtgtctgc atgttgttgg acctaaccta 3300
aatgcaggtg aggacatcca gcttcttaag gcagcatatg aaaatttcaa ttcacaggac 3360
atcttacttg caccattgtt gtcagcaggc atatttggtg ctaaaccact tcagtcttta 3420
caagtgtgcg tgcagacggt tcgtacacag gtttatattg cagtcaatga caaagctctt 3480
tatgagcagg ttgtcatgga ttatcttgat aacctgaagc ctagagtgga agcacctaaa3540
caagaggagc caccaaacac agaagattcc aaaactgagg agaaatctgt cgtacagaag3600
cctgtcgatg tgaagccaaa aattaaggcc tgcattgatg aggttaccac aacactggaa3660
gaaactaagt ttcttaccaa taagttactc ttgtttgctg atatcaatgg taagctttac3720
catgattctc agaacatgct tagaggtgaa gatatgtctt tccttgagaa ggatgcacct3780
tacatggtag gtgatgttat cactagtggt gatatcactt gtgttgtaat accctccaaa3840
aaggctggtg gcactactga gatgctctca agagctttga agaaagtgcc agttgatgag3900
tatataacca cgtaccctgg acaaggatgt gctggttata cacttgagga agctaagact3960
gctcttaaga aatgcaaatc tgcattttat gtactacctt cagaagcacc taatgctaag4020
gaagagattc taggaactgt atcctggaat ttgagagaaa tgcttgctca tgctgaagag4080
acaagaaaat taatgcctat atgcatggat gttagagcca taatggcaac catccaacgt4140
aagtataaag gaattaaaat tcaagagggc atcgttgact atggtgtccg attcttcttt4200
tatactagta aagagcctgt agcttctatt attacgaagc tgaactctct aaatgagccg4260
cttgtcacaa tgccaattgg ttatgtgaca catggtttta atcttgaaga ggctgcgcgc4320
tgtatgcgtt ctcttaaagc tcctgccgta gtgtcagtat catcaccaga tgctgttact4380
acatataatg gatacctcac ttcgtcatca aagacatctg aggagcactt tgtagaaaca4440
gtttctttgg ctggctctta cagagattgg tcctattcag gacagcgtac agagttaggt4500
gttgaatttc ttaagcgtgg tgacaaaatt gtgtaccaca ctctggagag ccccgtcgag4560
tttcatcttg acggtgaggt tctttcactt gacaaactaa agagtctctt atccctgcgg4620
gaggttaaga ctataaaagt gttcacaact gtggacaaca ctaatctcca cacacagctt4680
gtggatatgt ctatgacata tggacagcag tttggtccaa catacttgga tggtgctgat4740
gttacaaaaa ttaaacctca tgtaaatcat gagggtaaga ctttctttgt actacctagt4800
gatgacacac tacgtagtga agctttcgag tactaccata ctcttgatga gagttttctt4860
ggtaggtaca tgtctgcttt aaaccacaca aagaaatgga aatttcctca agttggtggt4920
ttaacttcaa ttaaatgggc tgataacaat tgttatttgt ctagtgtttt attagcactt4980
caacagcttg aagtcaaatt caatgcacca gcacttcaag aggcttatta tagagcccgt5040
gctggtgatg ctgctaactt ttgtgcactc atactcgctt acagtaataa aactgttggc5100
gagcttggtg atgtcagaga aactatgacc catcttctac agcatgctaa tttggaatct5160
gcaaagcgag ttcttaatgt ggtgtgtaaa cattgtggtc agaaaactac taccttaacg5220
ggtgtagaag ctgtgatgta tatgggtact ctatcttatg ataatcttaa gacaggtgtt5280
tccattccat gtgtgtgtgg tcgtgatgct acacaatatc tagtacaaca agagtcttct5340
tttgttatga tgtctgcacc acctgctgag tataaattac agcaaggtac attcttatgt5400
gcgaatgagt acactggtaa ctatcagtgt ggtcattaca ctcatataac tgctaaggag5460
accctctatc gtattgacgg agctcacctt acaaagatgt cagagtacaa aggaccagtg5520
actgatgttt tctacaagga aacatcttac actacaacca tcaagcctgt gtcgtataaa5580
ctcgatggag ttacttacac agagattgaa ccaaaattgg atgggtatta taaaaaggat5640
aatgcttact atacagagca gcctatagac cttgtaccaa ctcaaccatt accaaatgcg5700
agttttgata atttcaaact cacatgttct aacacaaaat ttgctgatga tttaaatcaa5760
atgacaggct tcacaaagcc agcttcacga gagctatctg tcacattctt cccagacttg5820
aatggcgatg tagtggctat tgactataga cactattcag cgagtttcaa gaaaggtgct5880
aaattactgc ataagccaat tgtttggcac attaaccagg ctacaaccaa gacaacgttc5940
aaaccaaaca cttggtgttt acgttgtctt tggagtacaa agccagtaga tacttcaaat6000
tcatttgaag ttctggcagt agaagacaca caaggaatgg acaatcttgc ttgtgaaagt6060
caacaaccca cctctgaaga agtagtggaa aatcctacca tacagaagga agtcatagag6120
tgtgacgtga aaactaccga agttgtaggc aatgtcatac ttaaaccatc agatgaaggt6180
gttaaagtaa cacaagagtt aggtcatgag gatcttatgg ctgcttatgt ggaaaacaca6240
agcattacca ttaagaaacc taatgagctt tcactagcct taggtttaaa aacaattgcc6300
actcatggta ttgctgcaat taatagtgtt ccttggagta aaattttggc ttatgtcaaa6360
ccattcttag gacaagcagc aattacaaca tcaaattgcg ctaagagatt agcacaacgt6420
gtgtttaaca attatatgcc ttatgtgttt acattattgt tccaattgtg tacttttact6480
aaaagtacca attctagaat tagagcttca ctacctacaa ctattgctaa aaatagtgtt6540
aagagtgttg ctaaattatg tttggatgcc ggcattaatt atgtgaagtc acccaaattt6600
tctaaattgt tcacaatcgc tatgtggcta ttgttgttaa gtatttgctt aggttctcta6660
atctgtgtaa ctgctgcttt tggtgtactc ttatctaatt ttggtgctcc ttcttattgt6720
aatggcgtta gagaattgta tcttaattcg tctaacgtta ctactatgga tttctgtgaa6780
ggttcttttc cttgcagcat ttgtttaagt ggattagact cccttgattc ttatccagct6840
cttgaaacca ttcaggtgac gatttcatcg tacaagctag acttgacaat tttaggtctg6900
gccgctgagt gggttttggc atatatgttg ttcacaaaat tcttttattt attaggtctt6960
tcagctataa tgcaggtgtt ctttggctat tttgctagtc atttcatcag caattcttgg7020
ctcatgtggt ttatcattag tattgtacaa atggcacccg tttctgcaat ggttaggatg7080
tacatcttct ttgcttcttt ctactacata tggaagagct atgttcatat catggatggt7140
tgcacctctt cgacttgcat gatgtgctat aagcgcaatc gtgccacacg cgttgagtgt7200
acaactattg ttaatggcat gaagagatct ttctatgtct atgcaaatgg aggccgtggc7260
ttctgcaaga ctcacaattg gaattgtctc aattgtgaca cattttgcac tggtagtaca7320
ttcattagtg atgaagttgc tcgtgatttg tcactccagt ttaaaagacc aatcaaccct7380
actgaccagt catcgtatat tgttgatagt gttgctgtga aaaatggcgc gcttcacctc7440
tactttgaca aggctggtca aaagacctat gagagacatc cgctctccca ttttgtcaat7500
ttagacaatt tgagagctaa caacactaaa ggttcactgc ctattaatgt catagttttt7560
gatggcaagt ccaaatgcga cgagtctgct tctaagtctg cttctgtgta ctacagtcag7620
ctgatgtgcc aacctattct gttgcttgac caagctcttg tatcagacgt tggagatagt7680
actgaagttt ccgttaagat gtttgatgct tatgtcgaca ccttttcagc aacttttagt7740
gttcctatgg aaaaacttaa ggcacttgtt gctacagctc acagcgagtt agcaaagggt7800
gtagctttag atggtgtcct ttctacattc gtgtcagctg cccgacaagg tgttgttgat7860
accgatgttg acacaaagga tgttattgaa tgtctcaaac tttcacatca ctctgactta7920
gaagtgacag gtgacagttg taacaatttc atgctcacct ataataaggt tgaaaacatg7980
acgcccagag atcttggcgc atgtattgac tgtaatgcaa ggcatatcaa tgcccaagta8040
gcaaaaagtc acaatgtttc actcatctgg aatgtaaaag actacatgtc tttatctgaa8100
cagctgcgta aacaaattcg tagtgctgcc aagaagaaca acataccttt tagactaact8160
tgtgctacaa ctagacaggt tgtcaatgtc ataactacta aaatctcact caagggtggt8220
aagattgtta gtacttgttt taaacttatg cttaaggcca cattattgtg cgttcttgct8280
gcattggttt gttatatcgt tatgccagta catacattgt caatccatga tggttacaca8340
aatgaaatca ttggttacaa agccattcag gatggtgtca ctcgtgacat catttctact8400
gatgattgtt ttgcaaataa acatgctggt tttgacgcat ggtttagcca gcgtggtggt8460
tcatacaaaa atgacaaaag ctgccctgta gtagctgcta tcattacaag agagattggt8520
ttcatagtgc ctggcttacc gggtactgtg ctgagagcaa tcaatggtga cttcttgcat8580
tttctacctc gtgtttttag tgctgttggc aacatttgct acacaccttc caaactcatt8640
gagtatagtg attttgctac ctctgcttgc gttcttgctg ctgagtgtac aatttttaag8700
gatgctatgg gcaaacctgt gccatattgt tatgacacta atttgctaga gggttctatt8760
tcttatagtg agcttcgtcc agacactcgt tatgtgctta tggatggttc catcatacag8820
tttcctaaca cttacctgga gggttctgtt agagtagtaa caacttttga tgctgagtac8880
tgtagacatg gtacatgcga aaggtcagaa gtaggtattt gcctatctac cagtggtaga8940
tgggttctta ataatgagca ttacagagct ctatcaggag ttttctgtgg tgttgatgcg9000
atgaatctca tagctaacat ctttactcct cttgtgcaac ctgtgggtgc tttagatgtg9060
tctgcttcag tagtggctgg tggtattatt gccatattgg tgacttgtgc tgcctactac9120
tttatgaaat tcagacgtgt ttttggtgag tacaaccatg ttgttgctgc taatgcactt9180
ttgtttttga tgtctttcac tatactctgt ctggtaccag cttacagctt tctgccggga9240
gtctactcag tcttttactt gtacttgaca ttctatttca ccaatgatgt ttcattcttg9300
gctcaccttc aatggtttgc catgttttct cctattgtgc ctttttggat aacagcaatc9360
tatgtattct gtatttctct gaagcactgc cattggttct ttaacaacta tcttaggaaa9420
agagtcatgt ttaatggagt tacatttagt accttcgagg aggctgcttt gtgtaccttt9480
ttgctcaaca aggaaatgta cctaaaattg cgtagcgaga cactgttgcc acttacacag9540
tataacaggt atcttgctct atataacaag tacaagtatt tcagtggagc cttagatact9600
accagctatc gtgaagcagc ttgctgccac ttagcaaagg ctctaaatga ctttagcaac9660
tcaggtgctg atgttctcta ccaaccacca cagacatcaa tcacttctgc tgttctgcag9720
agtggtttta ggaaaatggc attcccgtca ggcaaagttg aagggtgcat ggtacaagta9780
acctgtggaa ctacaactct taatggattg tggttggatg acacagtata ctgtccaaga9840
catgtcattt gcacagcaga agacatgctt aatcctaact atgaagatct gctcattcgc9900
aaatccaacc atagctttct tgttcaggct ggcaatgttc aacttcgtgt tattggccat9960
tctatgcaaa attgtctgct taggcttaaa gttgatactt ctaaccctaa gacacccaag 10020
tataaatttg tccgtatcca acctggtcaa acattttcag ttctagcatg ctacaatggt 10080
tcaccatctg gtgtttatca gtgtgccatg agacctaatc ataccattaa aggttctttc 10140
cttaatggat catgtggtag tgttggtttt aacattgatt atgattgcgt gtctttctgc 10200
tatatgcatc atatggagct tccaacagga gtacacgctg gtactgactt agaaggtaaa 10260
ttctatggtc catttgttga cagacaaact gcacaggctg caggtacaga cacaaccata 10320
acattaaatg ttttggcatg gctgtatgct gctgttatca atggtgatag gtggtttctt 10380
aatagattca ccactacttt gaatgacttt aaccttgtgg caatgaagta caactatgaa 10440
cctttgacac aagatcatgt tgacatattg ggacctcttt ctgctcaaac aggaattgcc 10500
gtcttagata tgtgtgctgc tttgaaagag ctgctgcaga atggtatgaa tggtcgtact 10560
atccttggta gcactatttt agaagatgag tttacaccat ttgatgttgt tagacaatgc 10620
tctggtgtta ccttccaagg taagttcaag aaaattgtta agggcactca tcattggatg 10680
cttttaactt tcttgacatc actattgatt cttgttcaaa gtacacagtg gtcactgttt 10740
ttctttgttt acgagaatgc tttcttgcca tttactcttg gtattatggc aattgctgca 10800
tgtgctatgc tgcttgttaa gcataagcac gcattcttgt gcttgtttct gttaccttct 10860
cttgcaacag ttgcttactt taatatggtc tacatgcctg ctagctgggt gatgcgtatc 10920
atgacatggc ttgaattggc tgacactagc ttgtctggtt ataggcttaa ggattgtgtt10980
atgtatgctt cagctttagt tttgcttatt ctcatgacag ctcgcactgt ttatgatgat11040
gctgctagac gtgtttggac actgatgaat gtcattacac ttgtttacaa agtctactat11100
ggtaatgctt tagatcaagc tatttccatg tgggccttag ttatttctgt aacctctaac11160
tattctggtg tcgttacgac tatcatgttt ttagctagag ctatagtgtt tgtgtgtgtt11220
gagtattacc cattgttatt tattactggc aacaccttac agtgtatcat gcttgtttat11280
tgtttcttag gctattgttg ctgctgctac tttggccttt tctgtttact caaccgttac11340
ttcaggctta ctcttggtgt ttatgactac ttggtctcta cacaagaatt taggtatatg11400
aactcccagg ggcttttgcc tcctaagagt agtattgatg ctttcaagct taacattaag11460
ttgttgggta ttggaggtaa accatgtatc aaggttgcta ctgtacagtc taaaatgtct11520
gacgtaaagt gcacatctgt ggtactgctc tcggttcttc aacaacttag agtagagtca11580
tcttctaaat tgtgggcaca atgtgtacaa ctccacaatg atattcttct tgcaaaagac11640
acaactgaag ctttcgagaa gatggtttct cttttgtctg ttttgctatc catgcagggt11700
gctgtagaca ttaataggtt gtgcgaggaa atgctcgata accgtgctac tcttcaggct11760
attgcttcag aatttagttc tttaccatca tatgccgctt atgccactgc ccaggaggcc11820
tatgagcagg ctgtagctaa tggtgattct gaagtcgttc tcaaaaagtt aaagaaatct11880
ttgaatgtgg ctaaatctga gtttgaccgt gatgctgcca tgcaacgcaa gttggaaaag11940
atggcagatc aggctatgac ccaaatgtac aaacaggcaa gatctgagga caagagggca12000
aaagtaacta gtgctatgca aacaatgctc ttcactatgc ttaggaagct tgataatgat12060
gcacttaaca acattatcaa caatgcgcgt gatggttgtg ttccactcaa catcatacca12120
ttgactacag cagccaaact catggttgtt gtccctgatt atggtaccta caagaacact12180
tgtgatggta acacctttac atatgcatct gcactctggg aaatccagca agttgttgat12240
gcggatagca agattgttca acttagtgaa attaacatgg acaattcacc aaatttggct12300
tggcctctta ttgttacagc tctaagagcc aactcagctg ttaaactaca gaataatgaa12360
ctgagtccag tagcactacg acagatgtcc tgtgcggctg gtaccacaca aacagcttgt12420
actgatgaca atgcacttgc ctactataac aattcgaagg gaggtaggtt tgtgctggca12480
ttactatcag accaccaaga tctcaaatgg gctagattcc ctaagagtga tggtacaggt12540
acaatttaca cagaactgga accaccttgt aggtttgtta cagacacacc aaaagggcct12600
aaagtgaaat acttgtactt catcaaaggc ttaaacaacc taaatagagg tatggtgctg12660
ggcagtttag ctgctacagt acgtcttcag gctggaaatg ctacagaagt acctgccaat12720
tcaactgtgc tttccttctg tgcttttgca gtagaccctg ctaaagcata taaggattac12780
ctagcaagtg gaggacaacc aatcaccaac tgtgtgaaga tgttgtgtac acacactggt12840
acaggacagg caattactgt aacaccagaa gctaacatgg accaagagtc ctttggtggt12900
gcttcatgtt gtctgtattg tagatgccac attgaccatc caaatcctaa aggattctgt12960
gacttgaaag gtaagtacgt ccaaatacct accacttgtg ctaatgaccc agtgggtttt13020
acacttagaa acacagtctg taccgtctgc ggaatgtgga aaggttatgg ctgtagttgt13080
gaccaactcc gcgaaccctt gatgcagtct gcggatgcat caacgttttt aaacgggttt13140
gcggtgtaag tgcagcccgt cttacaccgt gcggcacagg cactagtact gatgtcgtct13200
acagggcttt tgatatttac aacgaaaaag ttgctggttt tgcaaagttc ctaaaaacta13260
attgctgtcg cttccaggag aaggatgagg aaggcaattt attagactct tactttgtag13320
ttaagaggca tactatgtct aactaccaac atgaagagac tatttataac ttggttaaag13380
attgtccagc ggttgctgtc catgactttt tcaagtttag agtagatggt gacatggtac13440
cacatatatc acgtcagcgt ctaactaaat acacaatggc tgatttagtc tatgctctac13500
gtcattttga tgagggtaat tgtgatacat taaaagaaat actcgtcaca tacaattgct13560
gtgatgatga ttatttcaat aagaaggatt ggtatgactt cgtagagaat cctgacatct13620
tacgcgtata tgctaactta ggtgagcgtg tacgccaatc attattaaag actgtacaat13680
tctgcgatgc tatgcgtgat gcaggcattg taggcgtact gacattagat aatcaggatc13740
ttaatgggaa ctggtacgat ttcggtgatt tcgtacaagt agcaccaggc tgcggagttc13800
ctattgtgga ttcatattac tcattgctga tgcccatcct cactttgact agggcattgg13860
ctgctgagtc ccatatggat gctgatctcg caaaaccact tattaagtgg gatttgctga13920
aatatgattt tacggaagag agactttgtc tcttcgaccg ttattttaaa tattgggacc13980
agacatacca tcccaattgt attaactgtt tggatgatag gtgtatcctt cattgtgcaa14040
actttaatgt gttattttct actgtgtttc cacctacaag ttttggacca ctagtaagaa14100
aaatatttgt agatggtgtt ccttttgttg ttttaactgg ataccatttt cgtgagttag14160
gagtcgtaca taatcaggat gtaaacttac atagctcgcg tctcagtttc aaggaacttt14220
tagtgtatgc tgctgatcca gctatgcatg cagcttctgg caatttattg ctagataaac14280
gcactacatg cttttcagta gctgcactaa caaacaatgt tgcttttcaa actgtcaaac14340
ccggtaattt taataaagac ttttatgact ttgctgtgtc taaaggtttc tttaaggaag14400
gaagttctgt tgaactaaaa cacttcttct ttgctcagga tggcaacgct gctatcagtg14460
attatgacta ttatcgttat aatctgccaa caatgtgtga tatcagacaa ctcctattcg14520
tagttgaagt tgttgataaa tactttgatt gttacgatgg tggctgtatt aatgccaacc14580
aagtaatcgt taacaatctg gataaatcag ctggtttccc atttaataaa tggggtaagg14640
ctagacttta ttatgactca atgagttatg aggatcaaga tgcacttttc gcgtatacta14700
agcgtaatgt catccctact ataactcaaa tgaatcttaa gtatgccatt agtgcaaaga14760
atagagctcg caccgtagct ggtgtctcta tctgtagtac tatgacaaat agacagtttc14820
atcagaaatt attgaagtca atagccgcca ctagaggagc tactgtggta attggaacaa14880
gcaagtttta cggtggctgg cataatatgt taaaaactgt ttacagtgat gtagaaactc14940
cacaccttat gggttgggat tatccaaaat gtgacagagc catgcctaac atgcttagga15000
taatggcctc tcttgttctt gctcgcaaac ataacacttg ctgtaactta tcacaccgtt15060
tctacaggtt agctaacgag tgtgcgcaag tattaagtga gatggtcatg tgtggcggct15120
cactatatgt taaaccaggt ggaacatcat ccggtgatgc tacaactgct tatgctaata15180
gtgtctttaa catttgtcaa gctgttacag ccaatgtaaa tgcacttctt tcaactgatg15240
gtaataagat agctgacaag tatgtccgca atctacaaca caggctctat gagtgtctct15300
atagaaatag ggatgttgat catgaattcg tggatgagtt ttacgcttac ctgcgtaaac15360
atttctccat gatgattctt tctgatgatg ccgttgtgtg ctataacagt aactatgcgg15420
ctcaaggttt agtagctagc attaagaact ttaaggcagt tctttattat caaaataatg15480
tgttcatgtc tgaggcaaaa tgttggactg agactgacct tactaaagga cctcacgaat15540
tttgctcaca gcatacaatg ctagttaaac aaggagatga ttacgtgtac ctgccttacc15600
cagatccatc aagaatatta ggcgcaggct gttttgtcga tgatattgtc aaaacagatg15660
gtacacttat gattgaaagg ttcgtgtcac tggctattga tgcttaccca cttacaaaac15720
atcctaatca ggagtatgct gatgtctttc acttgtattt acaatacatt agaaagttac15780
atgatgagct tactggccac atgttggaca tgtattccgt aatgctaact aatgataaca15840
cctcacggta ctgggaacct gagttttatg aggctatgta cacaccacat acagtcttgc15900
aggctgtagg tgcttgtgta ttgtgcaatt cacagacttc acttcgttgc ggtgcctgta15960
ttaggagacc attcctatgt tgcaagtgct gctatgacca tgtcatttca acatcacaca16020
aattagtgtt gtctgttaat ccctatgttt gcaatgcccc aggttgtgat gtcactgatg16080
tgacacaact gtatctagga ggtatgagct attattgcaa gtcacataag cctcccatta16140
gttttccatt atgtgctaat ggtcaggttt ttggtttata caaaaacaca tgtgtaggca16200
gtgacaatgt cactgacttc aatgcgatag caacatgtga ttggactaat gctggcgatt16260
acatacttgc caacacttgt actgagagac tcaagctttt cgcagcagaa acgctcaaag16320
ccactgagga aacatttaag ctgtcatatg gtattgccac tgtacgcgaa gtactctctg16380
acagagaatt gcatctttca tgggaggttg gaaaacctag accaccattg aacagaaact16440
atgtctttac tggttaccgt gtaactaaaa atagtaaagt acagattgga gagtacacct16500
ttgaaaaagg tgactatggt gatgctgttg tgtacagagg tactacgaca tacaagttga16560
atgttggtga ttactttgtg ttgacatctc acactgtaat gccacttagt gcacctactc16620
tagtgccaca agagcactat gtgagaatta ctggcttgta cccaacactc aacatctcag16680
atgagttttc tagcaatgtt gcaaattatc aaaaggtcgg catgcaaaag tactctacac16740
tccaaggacc acctggtact ggtaagagtc attttgccat cggacttgct ctctattacc16800
catctgctcg catagtgtat acggcatgct ctcatgcagc tgttgatgcc ctatgtgaaa16860
aggcattaaa atatttgccc atagataaat gtagtagaat catacctgcg cgtgcgcgcg16920
tagagtgttt tgataaattc aaagtgaatt caacactaga acagtatgtt ttctgcactg16980
taaatgcatt gccagaaaca actgctgaca ttgtagtctt tgatgaaatc tctatggcta17040
ctaattatga cttgagtgtt gtcaatgcta gacttcgtgc aaaacactac gtctatattg17100
gcgatcctgc tcaattacca gccccccgca cattgctgac taaaggcaca ctagaaccag17160
aatattttaa ttcagtgtgc agacttatga aaacaatagg tccagacatg ttccttggaa17220
cttgtcgccg ttgtcctgct gaaattgttg acactgtgag tgctttagtt tatgacaata17280
agctaaaagc acacaaggat aagtcagctc aatgcttcaa aatgttctac aaaggtgtta17340
ttacacatga tgtttcatct gcaatcaaca gacctcaaat aggcgttgta agagaatttc17400
ttacacgcaa tcctgcttgg agaaaagctg tttttatctc accttataat tcacagaacg17460
ctgtagcttc aaaaatctta ggattgccta cgcagactgt tgattcatca cagggttctg17520
aatatgacta tgtcatattc acacaaacta ctgaaacagc acactcttgt aatgtcaacc17580
gcttcaatgt ggctatcaca agggcaaaaa ttggcatttt gtgcataatg tctgatagag17640
atctttatga caaactgcaa tttacaagtc tagaaatacc acgtcgcaat gtggctacat17700
tacaagcaga aaatgtaact ggacttttta aggactgtag taagatcatt actggtcttc17760
atcctacaca ggcacctaca cacctcagcg ttgatataaa gttcaagact gaaggattat17820
gtgttgacat accaggcata ccaaaggaca tgacctaccg tagactcatc tctatgatgg17880
gtttcaaaat gaattaccaa gtcaatggtt accctaatat gtttatcacc cgcgaagaag17940
ctattcgtca cgttcgtgcg tggattggct ttgatgtaga gggctgtcat gcaactagag18000
atgctgtggg tactaaccta cctctccagc taggattttc tacaggtgtt aacttagtag18060
ctgtaccgac tggttatgtt gacactgaaa ataacacaga attcaccaga gttaatgcaa18120
aacctccacc aggtgaccag tttaaacatc ttataccact catgtataaa ggcttgccct18180
ggaatgtagt gcgtattaag atagtacaaa tgctcagtga tacactgaaa ggattgtcag18240
acagagtcgt gttcgtcctt tgggcgcatg gctttgagct tacatcaatg aagtactttg18300
tcaagattgg acctgaaaga acgtgttgtc tgtgtgacaa acgtgcaact tgcttttcta18360
cttcatcaga tacttatgcc tgctggaatc attctgtggg ttttgactat gtctataacc 18420
catttatgat tgatgttcag cagtggggct ttacgggtaa ccttcagagt aaccatgacc 18480
aacattgcca ggtacatgga aatgcacatg tgcctagttg tgatgctatc atgactagat 18540
gtttagcagt ccatgagtgc tttgttaagc gcgttgattg gtctgttgaa taccctatta 18600
taggagatga actgagggtt aattctgctt gcagaaaagt acaacacatg gttgtgaagt 18660
ctgcattgct tgctgataag tttccagttc ttcatgacat tggaaatcca aaggctatca 18720
agtgtgtgcc tcaggctgaa gtagaatgga agttctacga tgctcagcca tgtagtgaca 18780
aagcttacaa aatagaggaa ctcttctatt cttatgctac acatcacgat aaattcactg 18840
atggtgtttg tttgttttgg aattgtaacg ttgatcgtta cccagccaat gcaattgtgt 18900
gtaggtttga cacaagagtc ttgtcaaact tgaacttacc aggctgtgat ggtggtagtt 18960
tgtatgtgaa taagcatgca ttccacactc cagctttcga taaaagtgca tttactaatt 19020
taaagcaatt gcctttcttt tactattctg atagtccttg tgagtctcat ggcaaacaag 19080
tagtgtcgga tattgattat gttccactca aatctgctac gtgtattaca cgatgcaatt 19140
taggtggtgc tgtttgcaga caccatgcaa atgagtaccg acagtacttg gatgcatata 19200
atatgatgat ttctgctgga tttagcctat ggatttacaa acaatttgat acttataacc 19260
tgtggaatac atttaccagg ttacagagtt tagaaaatgt ggcttataat gttgttaata 19320
aaggacactt tgatggacac gccggcgaag cacctgtttc catcattaat aatgctgttt 19380
acacaaaggt agatggtatt gatgtggaga tctttgaaaa taagacaaca cttcctgtta 19440
atgttgcatt tgagctttgg gctaagcgta acattaaacc agtgccagag attaagatac 19500
tcaataattt gggtgttgat atcgctgcta atactgtaat ctgggactac aaaagagaag 19560
ccccagcaca tgtatctaca ataggtgtct gcacaatgac tgacattgcc aagaaaccta 19620
ctgagagtgc ttgttcttca cttactgtct tgtttgatgg tagagtggaa ggacaggtag 19680
acctttttag aaacgcccgt aatggtgttt taataacaga aggttcagtc aaaggtctaa 19740
caccttcaaa gggaccagca caagctagcg tcaatggagt cacattaatt ggagaatcag 19800
taaaaacaca gtttaactac tttaagaaag tagacggcat tattcaacag ttgcctgaaa 19860
cctactttac tcagagcaga gacttagagg attttaagcc cagatcacaa atggaaactg 19920
actttctcga gctcgctatg gatgaattca tacagcgata taagctcgag ggctatgcct 19980
tcgaacacat cgtttatgga gatttcagtc atggacaact tggcggtctt catttaatga 20040
taggcttagc caagcgctca caagattcac cacttaaatt agaggatttt atccctatgg 20100
acagcacagt gaaaaattac ttcataacag atgcgcaaac aggttcatca aaatgtgtgt 20160
gttctgtgat tgatctttta cttgatgact ttgtcgagat aataaagtca caagatttgt 20220
cagtgatttc aaaagtggtc aaggttacaa ttgactatgc tgaaatttca ttcatgcttt 20280
ggtgtaagga tggacatgtt gaaaccttct acccaaaact acaagcaagt caagcgtggc 20340
aaccaggtgt tgcgatgcct aacttgtaca agatgcaaag aatgcttctt gaaaagtgtg 20400
accttcagaa ttatggtgaa aatgctgtta taccaaaagg aataatgatg aatgtcgcaa 20460
agtatactca actgtgtcaa tacttaaata cacttacttt agctgtaccc tacaacatga 20520
gagttattca ctttggtgct ggctctgata aaggagttgc accaggtaca gctgtgctca 20580
gacaatggtt gccaactggc acactacttg tcgattcaga tcttaatgac ttcgtctccg 20640
acgcagattc tactttaatt ggagactgtg caacagtaca tacggctaat aaatgggacc 20700
ttattattag cgatatgtat gaccctagga ccaaacatgt gacaaaagag aatgactcta 20760
aagaagggtt tttcacttat ctgtgtggat ttataaagca aaaactagcc ctgggtggtt 20820
ctatagctgt aaagataaca gagcattctt ggaatgctga cctttacaag cttatgggcc 20880
atttctcatg gtggacagct tttgttacaa atgtaaatgc atcatcatcg gaagcatttt 20940
taattggggc taactatctt ggcaagccga aggaacaaat tgatggctat accatgcatg 21000
ctaactacat tttctggagg aacacaaatc ctatccagtt gtcttcctat tcactctttg 21060
acatgagcaa atttcctctt aaattaagag gaactgctgt aatgtctctt aaggagaatc 21120
aaatcaatga tatgatttat tctcttctgg aaaaaggtag gcttatcatt agagaaaaca 21180
acagagttgt ggtttcaagt gatattcttg ttaacaacta a 21221
<210>32
<211>297
<212>DNA
<213>冠状病毒
<400>32
atggacccca atcaaaccaa cgtagtgccc cccgcattac atttggtgga cccacagatt 60
caactgacaa taaccagaat ggaggacgca atggggcaag gccaaaacag cgccgacccc120
aaggtttacc caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg180
aacttagatt ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc240
aaattggcta ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 297
<210> 33
<211>98
<212>PRT
<213>冠状病毒
<400>33
Mat Asp Pro Asn Gln Thr Asn Val Val Pro Pro Ala Leu His Leu Val
1 5 10 15
Asp Pro Gln Ile Gln Leu Thr Ile Thr Arg Met Glu Asp Ala Met Gly
20 25 30
Gln Gly Gln Asn Ser Ala Asp Pro Lys Val Tyr Pro Ile Ile Leu Arg
35 40 45
Leu Gly Ser Gln Leu Ser Leu Ser Met Ala Arg Arg Asn Leu Asp Ser
50 55 60
Leu Glu Ala Arg Ala Phe Gln Ser Thr Pro Ile Val Val Gln Met Thr
65 70 75 80
Lys Leu Ala Thr Thr Glu Glu Leu Pro Asp Glu Phe Val Val Val Thr
85 90 95
Ala Lys
<210>34
<211>213
<212>DNA
<213>冠状病毒
<400>34
atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggc ttctacgcag 60
agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt120
caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag180
gtggtgaaac tgccctcgcg ctattgctgc tag 213
<210>35
<211>70
<212>PRT
<213>冠状病毒
<400>35
Met Leu Pro Pro Cys Tyr Asn Phe Leu Lys Glu Gln His Cys Gln Lys
1 5 10 15
Ala Ser Thr Gln Arg Glu Ala Glu Ala Ala Val Lys Pro Leu Leu Ala
20 25 30
Pro His His Val Val Ala Val Ile Gln Glu Ile Gln Leu Leu Ala Ala
35 40 45
Val Gly Glu Ile Leu Leu Leu Glu Trp Leu Ala Glu Val Val Lys Leu
50 55 60
Pro Ser Arg Tyr Cys Cys
65 70
<210>36
<211>1377
<212>DNA
<213>冠状病毒
<220>
<221>CDS
<222>(67)..(1335)
<223>
<400>36
atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60
attaaa atg tct gat aat gga ccc caa tca aac caa cgt agt gcc ccc 108
Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro
1 5 10
cgc att aca ttt ggt gga ccc aca gat tca act gac aat aac cag aat156
Arg Ile Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn
15 20 25 30
gga gga cgc aat ggg gca agg cca aaa cag cgc cga ccc caa ggt tta204
Gly Gly Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu
35 40 45
ccc aat aat act gcg tct tgg ttc aca gct ctc act cag cat ggc aag252
Pro Asn Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys
50 55 60
gag gaa ctt aga ttc cct cga ggc cag ggc gtt cca atc aac acc aat300
Glu Glu Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn
65 70 75
agt ggt cca gat gac caa att ggc tac tac cga aga gct acc cga cga348
Ser Gly Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg
80 85 90
gtt cgt ggt ggt gac ggc aaa atg aaa gag ctc agc ccc aga tgg tac396
Val Arg Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr
95 100 105 110
ttc tat tac cta gga act ggc cca gaa gct tca ctt ccc tac ggc gct444
Phe Tyr Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala
115 120 125
aac aaa gaa ggc atc gta tgg gtt gca act gag gga gcc ttg aat aca492
Asn Lys Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr
130 135 140
ccc aaa gac cac att ggc acc cgc aat cct aat aac aat gct gcc acc540
Pro Lys Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr
145 150 155
gtg cta caa ctt cct caa gga aca aca ttg cca aaa ggc ttc tac gca588
Val Leu Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala
160 165 170
gag gga agc aga ggc ggc agt caa gcc tct tct cgc tcc tca tca cgt636
Glu Gly Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg
175 180 185 190
agt cgc ggt aat tca aga aat tca act cct ggc agc agt agg gga aat684
Ser Arg Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn
195 200 205
tct cct gct cga atg gct agc gga ggt ggt gaa act gcc ctc gcg cta732
Ser Pro Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu
210 215 220
ttg ctg cta gac aga ttg aac cag ctt gag agc aaa gtt tct ggt aaa780
Leu Leu Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys
225 230 235
ggc caa caa caa caa ggc caa act gtc act aag aaa tct gct gct gag828
Gly Gln Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu
240 245 250
gca tct aaa aag cct cgc caa aaa cgt act gcc aca aaa cag tac aac876
Ala Ser Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn
255 260 265 270
gtc act caa gca ttt ggg aga cgt ggt cca gaa caa acc caa gga aat924
Val Thr Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn
275 280 285
ttc ggg gac caa gac cta atc aga caa gga act gat tac aaa cat tgg972
Phe Gly Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp
290 295 300
ccg caa att gca caa ttt gct cca agt gcc tct gca ttc ttt gga atg 1020
Pro Gln Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met
305 310 315
tca cgc att ggc atg gaa gtc aca cct tcg gga aca tgg ctg act tat 1068
Ser Arg Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr
320 325 330
cat gga gcc att aaa ttg gat gac aaa gat cca caa ttc aaa gac aac1116
His Gly Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn
335 340 345 350
gtc ata ctg ctg aac aag cac att gac gca tac aaa aca ttc cca cca1164
Val Ile Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro
355 360 365
aca gag cct aaa aag gac aaa aag aaa aag act gat gaa gct cag cct1212
Thr Glu Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro
370 375 380
ttg ccg cag aga caa aag aag cag ccc act gtg act ctt ctt cct gcg1260
Leu Pro Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala
385 390 395
gct gac atg gat gat ttc tcc aga caa ctt caa aat tcc atg agt gga1308
Ala Asp Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly
400 405 410
gct tct gct gat tca act cag gca taa acactcatga tgaccacaca 1355
Ala Ser Ala Asp Ser Thr Gln Ala
415 420
aggcagatgg gctatgtaaa cg 1377
<210>37
<211>422
<212>PRT
<213>冠状病毒
<400>37
Met Ser Asp Asn Gly Pro Gln Ser Asn Gln Arg Ser Ala Pro Arg Ile
1 5 10 15
Thr Phe Gly Gly Pro Thr Asp Ser Thr Asp Asn Asn Gln Asn Gly Gly
20 25 30
Arg Asn Gly Ala Arg Pro Lys Gln Arg Arg Pro Gln Gly Leu Pro Asn
35 40 45
Asn Thr Ala Ser Trp Phe Thr Ala Leu Thr Gln His Gly Lys Glu Glu
50 55 60
Leu Arg Phe Pro Arg Gly Gln Gly Val Pro Ile Asn Thr Asn Ser Gly
65 70 75 80
Pro Asp Asp Gln Ile Gly Tyr Tyr Arg Arg Ala Thr Arg Arg Val Arg
85 90 95
Gly Gly Asp Gly Lys Met Lys Glu Leu Ser Pro Arg Trp Tyr Phe Tyr
100 105 110
Tyr Leu Gly Thr Gly Pro Glu Ala Ser Leu Pro Tyr Gly Ala Asn Lys
115 120 125
Glu Gly Ile Val Trp Val Ala Thr Glu Gly Ala Leu Asn Thr Pro Lys
130 135 140
Asp His Ile Gly Thr Arg Asn Pro Asn Asn Asn Ala Ala Thr Val Leu
145 150 155 160
Gln Leu Pro Gln Gly Thr Thr Leu Pro Lys Gly Phe Tyr Ala Glu Gly
165 170 175
Ser Arg Gly Gly Ser Gln Ala Ser Ser Arg Ser Ser Ser Arg Ser Arg
180 185 190
Gly Asn Ser Arg Asn Ser Thr Pro Gly Ser Ser Arg Gly Asn Ser Pro
195 200 205
Ala Arg Met Ala Ser Gly Gly Gly Glu Thr Ala Leu Ala Leu Leu Leu
210 215 220
Leu Asp Arg Leu Asn Gln Leu Glu Ser Lys Val Ser Gly Lys Gly Gln
225 230 235 240
Gln Gln Gln Gly Gln Thr Val Thr Lys Lys Ser Ala Ala Glu Ala Ser
245 250 255
Lys Lys Pro Arg Gln Lys Arg Thr Ala Thr Lys Gln Tyr Asn Val Thr
260 265 270
Gln Ala Phe Gly Arg Arg Gly Pro Glu Gln Thr Gln Gly Asn Phe Gly
275 280 285
Asp Gln Asp Leu Ile Arg Gln Gly Thr Asp Tyr Lys His Trp Pro Gln
290 295 300
Ile Ala Gln Phe Ala Pro Ser Ala Ser Ala Phe Phe Gly Met Ser Arg
305 310 315 320
Ile Gly Met Glu Val Thr Pro Ser Gly Thr Trp Leu Thr Tyr His Gly
325 330 335
Ala Ile Lys Leu Asp Asp Lys Asp Pro Gln Phe Lys Asp Asn Val Ile
340 345 350
Leu Leu Asn Lys His Ile Asp Ala Tyr Lys Thr Phe Pro Pro Thr Glu
355 360 365
Pro Lys Lys Asp Lys Lys Lys Lys Thr Asp Glu Ala Gln Pro Leu Pro
370 375 380
Gln Arg Gln Lys Lys Gln Pro Thr Val Thr Leu Leu Pro Ala Ala Asp
385 390 395 400
Met Asp Asp Phe Ser Arg Gln Leu Gln Asn Ser Met Ser Gly Ala Ser
405 410 415
Ala Asp Ser Thr Gln Ala
420
<210>38
<211>1377
<212>DNA
<213>冠状病毒
<400>38
atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 60
attaaaatgt ctgataatgg accccaatca aaccaacgta gtgccccccg cattacattt120
ggtggaccca cagattcaac tgacaataac cagaatggag gacgcaatgg ggcaaggcca180
aaacagcgcc gaccccaagg tttacccaat aatactgcgt cttggttcac agctctcact240
cagcatggca aggaggaact tagattccct cgaggccagg gcgttccaat caacaccaat300
agtggtccag atgaccaaat tggctactac cgaagagcta cccgacgagt tcgtggtggt360
gacggcaaaa tgaaagagct cagccccaga tggtacttct attacctagg aactggccca420
gaagcttcac ttccctacgg cgctaacaaa gaaggcatcg tatgggttgc aactgaggga480
gccttgaata cacccaaaga ccacattggc acccgcaatc ctaataacaa tgctgccacc540
gtgctacaac ttcctcaagg aacaacattg ccaaaaggct tctacgcaga gggaagcaga600
ggcggcagtc aagcctcttc tcgctcctca tcacgtagtc gcggtaattc aagaaattca660
actcctggca gcagtagggg aaattctcct gctcgaatgg ctagcggagg tggtgaaact720
gccctcgcgc tattgctgct agacagattg aaccagcttg agagcaaagt ttctggtaaa780
ggccaacaac aacaaggcca aactgtcact aagaaatctg ctgctgaggc atctaaaaag840
cctcgccaaa aacgtactgc cacaaaacag tacaacgtca ctcaagcatt tgggagacgt900
ggtccagaac aaacccaagg aaatttcggg gaccaagacc taatcagaca aggaactgat960
tacaaacatt ggccgcaaat tgcacaattt gctccaagtg cctctgcatt ctttggaatg 1020
tcacgcattg gcatggaagt cacaccttcg ggaacatggc tgacttatca tggagccatt 1080
aaattggatg acaaagatcc acaattcaaa gacaacgtca tactgctgaa caagcacatt 1140
gacgcataca aaacattccc accaacagag cctaaaaagg acaaaaagaa aaagactgat 1200
gaagctcagc ctttgccgca gagacaaaag aagcagccca ctgtgactct tcttcctgcg 1260
gctgacatgg atgatttctc cagacaactt caaaattcca tgagtggagc ttctgctgat 1320
tcaactcagg cataaacact catgatgacc acacaaggca gatgggctat gtaaacg 1377
<210>39
<211>204
<212>DNA
<213>冠状病毒
<400>39
atattaggtt tttacctacc caggaaaagc caaccaacct cgatctcttg tagatctgtt 60
ctctaaacga actttaaaat ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac120
gcagtataaa caataataaa ttttactgtc gttgacaaga aacgagtaac tcgtccctct180
tctgcagact gcttacggtt tcgt 204
<210>40
<211>809
<212>DNA
<213>冠状病毒
<400>40
actcaagcat ttgggagacg tggtccagaa caaacccaag gaaatttcgg ggaccaagac 60
ctaatcagac aaggaactga ttacaaacat tggccgcaaa ttgcacaatt tgctccaagt120
gcctctgcat tctttggaat gtcacgcatt ggcatggaag tcacaccttc gggaacatgg180
ctgacttatc atggagccat taaattggat gacaaagatc cacaattcaa agacaacgtc240
atactgctga acaagcacat tgacgcatac aaaacattcc caccaacaga gcctaaaaag300
gacaaaaaga aaaagactga tgaagctcag cctttgccgc agagacaaaa gaagcagccc360
actgtgactc ttcttcctgc ggctgacatg gatgatttct ccagacaact tcaaaattcc420
atgagtggag cttctgctga ttcaactcag gcataaacac tcatgatgac cacacaaggc480
agatgggcta tgtaaacgtt ttcgcaattc cgtttacgat acatagtcta ctcttgtgca540
gaatgaattc tcgtaactaa acagcacaag taggtttagt taactttaat ctcacatagc600
aatctttaat caatgtgtaa cattagggag gacttgaaag agccaccaca ttttcatcga660
ggccacgcgg agtacgatcg agggtacagt gaataatgct agggagagct gcctatatgg720
aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct780
tcttaggaga atgacaaaaa aaaaaaaaa 809
<210>41
<211>448
<212>DNA
<213>冠状病毒
<400>41
aatgaacaca tagggctgtt caagctgggg cagtacgcct ttttccagct ctactagacc 60
acaagtgcca tttttgaggt gttcacgtgc ctccgatagg gcctcttcca cagagtcccc120
gaagccacgc actagcacgt ctctaacctg aaggacaggc aaactgagtt ggacgtgtgt180
tttctcgttg acaccaagaa caaggctctc catcttacct ttcggtcaca cccggacgaa240
acctaggtat gctgatgatc gactgcaaca cggacgaaac cgtaagcagt ctgcagaaga300
gggacgagtt actcgtttct tgtcaacgac agtaaaattt attattgttt atactgcgta360
ggtgcactag gcatgcagcc gagcgacagc tacacagatt ttaaagttcg tttagagaac420
agatctacaa gagatcgagg ttggttgg 448
<210>42
<211>2033
<212>DNA
<213>冠状病毒
<400>42
atacctaggt ttcgtccggg tgtgaccgaa aggtaagatg gagagccttg ttcttggtgt 60
caacgagaaa acacacgtcc aactcagttt gcctgtcctt caggttagag acgtgctagt120
gcgtggcttc ggggactctg tggaagaggc cctatcggag gcacgtgaac acctcaaaaa180
tggcacttgt ggtctagtag agctggaaaa aggcgtactg ccccagcttg aacagcccta240
tgtgttcatt aaacgttctg atgccttaag caccaatcac ggccacaagg tcgttgagct300
ggttgcagaa atggacggca ttcagtacgg tcgtagcggt ataacactgg gagtactcgt360
gccacatgtg ggcgaaaccc caattgcata ccgcaatgtt cttcttcgta agaacggtaa420
taagggagcc ggtggtcata gctatggcat cgatctaaag tcttatgact taggtgacga480
gcttggcact gatcccattg aagattatga acaaaactgg aacactaagc atggcagtgg540
tgcactccgt gaactcactc gtgagctcaa tggaggtgca gtcactcgct atgtcgacaa600
caatttctgt ggcccagatg ggtaccctct tgattgcatc aaagattttc tcgcacgcgc660
gggcaagtca atgtgcactc tttccgaaca acttgattac atcgagtcga agagaggtgt720
ctactgctgc cgtgaccatg agcatgaaat tgcctggttc actgagcgct ctgataagag780
ctacgagcac cagacaccct tcgaaattaa gagtgccaag aaatttgaca ctttcaaagg840
ggaatgccca aagtttgtgt ttcctcttaa ctcaaaagtc aaagtcattc aaccacgtgt900
tgaaaagaaa aagactgagg gtttcatggg gcgtatacgc tctgtgtacc ctgttgcatc 960
tccacaggag tgtaacaata tgcacttgtc taccttgatg aaatgtaatc attgcgatga1020
agtttcatgg cagacgtgcg actttctgaa agccacttgt gaacattgtg gcactgaaaa1080
tttagttatt gaaggaccta ctacatgtgg gtacctacct actaatgctg tagtgaaaat1140
gccatgtcct gcctgtcaag acccagagat tggacctgag catagtgttg cagattatca1200
caaccactca aacattgaaa ctcgactccg caagggaggt aggactagat gttttggagg1260
ctgtgtgttt gcctatgttg gctgctataa taagcgtgcc tactgggttc ctcgtgctag1320
tgctgatatt ggctcaggcc atactggcat tactggtgac aatgtggaga ccttgaatga1380
ggatctcctt gagatactga gtcgtgaacg tgttaacatt aacattgttg gcgattttca1440
tttgaatgaa gaggttgcca tcattttggc atctttctct gcttctacaa gtgcctttat1500
tgacactata aagagtcttg attacaagtc tttcaaaacc attgttgagt cctgcggtaa1560
ctataaagtt accaagggaa agcccgtaaa aggtgcttgg aacattggac aacagagatc1620
agttttaaca ccactgtgtg gttttccctc acaggctgct ggtgttatca gatcaatttt1680
tgcgcgcaca cttgatgcag caaaccactc aattcctgat ttgcaaagag cagctgtcac1740
catacttgat ggtatttctg aacagtcatt acgtcttgtc gacgccatgg tttatacttc1800
agacctgctc accaacagtg tcattattat ggcatatgta actggtggtc ttgtacaaca1860
gacttctcag tggttgtcta atcttttggg cactactgtt gaaaaactca ggcctatctt1920
tgaatggatt gaggcgaaac ttagtgcagg agttgaattt ctcaaggatg cttgggagat1980
tctcaaattt ctcattacag gtgtttttga catcgtcaag ggtcaaatac agg 2033
<210>43
<211>2018
<212>DNA
<213>冠状病毒
<400>43
ggattgaggc gaaacttagt gcaggagttg aatttctcaa ggatgcttgg gagattctca 60
aatttctcat tacaggtgtt tttgacatcg tcaagggtca aatacaggtt gcttcagata 120
acatcaagga ttgtgtaaaa tgcttcattg atgttgttaa caaggcactc gaaatgtgca 180
ttgatcaagt cactatcgct ggcgcaaagt tgcgatcact caacttaggt gaagtcttca 240
tcgctcaaag caagggactt taccgtcagt gtatacgtgg caaggagcag ctgcaactac 300
tcatgcctct taaggcacca aaagaagtaa cctttcttga aggtgattca catgacacag 360
tacttacctc tgaggaggtt gttctcaaga acggtgaact cgaagcactc gagacgcccg 420
ttgatagctt cacaaatgga gctatcgttg gcacaccagt ctgtgtaaat ggcctcatgc 480
tcttagagat taaggacaaa gaacaatact gcgcattgtc tcctggttta ctggctacaa 540
acaatgtctt tcgcttaaaa gggggtgcac caattaaagg tgtaaccttt ggagaagata 600
ctgtttggga agttcaaggt tacaagaatg tgagaatcac atttgagctt gatgaacgtg 660
ttgacaaagt gcttaatgaa aagtgctctg tctacactgt tgaatccggt accgaagtta 720
ctgagtttgc atgtgttgta gcagaggctg ttgtgaagac tttacaacca gtttctgatc 780
tccttaccaa catgggtatt gatcttgatg agtggagtgt agctacattc tacttatttg 840
atgatgctgg tgaagaaaac ttttcatcac gtatgtattg ttccttttac cctccagatg 900
aggaagaaga ggacgatgca gagtgtgagg aagaagaaat tgatgaaacc tgtgaacatg 960
agtacggtac agaggatgat tatcaaggtc tccctctgga atttggtgcc tcagctgaaa1020
cagttcgagt tgaggaagaa gaagaggaag actggctgga tgatactact gagcaatcag1080
agattgagcc agaaccagaa cctacacctg aagaaccagt taatcagttt actggttatt1140
taaaacttac tgacaatgtt gccattaaat gtgttgacat cgttaaggag gcacaaagtg1200
ctaatcctat ggtgattgta aatgctgcta acatacacct gaaacatggt ggtggtgtag1260
caggtgcact caacaaggca accaatggtg ccatgcaaaa ggagagtgat gattacatta1320
agctaaatgg ccctcttaca gtaggagggt cttgtttgct ttctggacat aatcttgcta1380
agaagtgtct gcatgttgtt ggacctaacc taaatgcagg tgaggacatc cagcttctta1440
aggcagcata tgaaaatttc aattcacagg acatcttact tgcaccattg ttgtcagcag1500
gcatatttgg tgctaaacca cttcagtctt tacaagtgtg cgtgcagacg gttcgtacac1560
aggtttatat tgcagtcaat gacaaagctc tttatgagca ggttgtcatg gattatcttg1620
ataacctgaa gcctagagtg gaagcaccta aacaagagga gccaccaaac acagaagatt1680
ccaaaactga ggagaaatct gtcgtacaga agcctgtcga tgtgaagcca aaaattaagg1740
cctgcattga tgaggttacc acaacactgg aagaaactaa gtttcttacc aataagttac1800
tcttgtttgc tgatatcaat ggtaagcttt accatgattc tcagaacatg cttagaggtg1860
aagatatgtc tttccttgag aaggatgcac cttacatggt aggtgatgtt atcactagtg1920
gtgatatcac ttgtgttgta ataccctcca aaaaggctgg tggcactact gagatgctct1980
caagagcttt gaagaaagtg ccagttgatg agtatata2018
<210>44
<211>1442
<212>DNA
<213>冠状病毒
<400>44
ttgatgaggt taccacaaca ctggaagaaa ctaagtttct taccaataag ttactcttgt 60
ttgctgatat caatggtaag ctttaccatg attctcagaa catgcttaga ggtgaagata120
tgtctttcct tgagaaggat gcaccttaca tggtaggtga tgttatcact agtggtgata180
tcacttgtgt tgtaataccc tccaaaaagg ctggtggcac tactgagatg ctctcaagag240
ctttgaagaa agtgccagtt gatgagtata taaccacgta ccctggacaa ggatgtgctg300
gttatacact tgaggaagct aagactgctc ttaagaaatg caaatctgca ttttatgtac360
taccttcaga agcacctaat gctaaggaag agattctagg aactgtatcc tggaatttga420
gagaaatgct tgctcatgct gaagagacaa gaaaattaat gcctatatgc atggatgtta480
gagccataat ggcaaccatc caacgtaagt ataaaggaat taaaattcaa gagggcatcg540
ttgactatgg tgtccgattc ttcttttata ctagtaaaga gcctgtagct tctattatta600
cgaagctgaa ctctctaaat gagccgcttg tcacaatgcc aattggttat gtgacacatg660
gttttaatct tgaagaggct gcgcgctgta tgcgttctct taaagctcct gccgtagtgt720
cagtatcatc accagatgct gttactacat ataatggata cctcacttcg tcatcaaaga780
catctgagga gcactttgta gaaacagttt ctttggctgg ctcttacaga gattggtcct840
attcaggaca gcgtacagag ttaggtgttg aatttcttaa gcgtggtgac aaaattgtgt900
accacactct ggagagcccc gtcgagtttc atcttgacgg tgaggttctt tcacttgaca960
aactaaagag tctcttatcc ctgcgggagg ttaagactat aaaagtgttc acaactgtgg 1020
acaacactaa tctccacaca cagcttgtgg atatgtctat gacatatgga cagcagtttg 1080
gtccaacata cttggatggt gctgatgtta caaaaattaa acctcatgta aatcatgagg 1140
gtaagacttt ctttgtacta cctagtgatg acacactacg tagtgaagct ttcgagtact 1200
accatactct tgatgagagt tttcttggta ggtacatgtc tgctttaaac cacacaaaga 1260
aatggaaatt tcctcaagtt ggtggtttaa cttcaattaa atgggctgat aacaattgtt 1320
atttgtctag tgttttatta gcacttcaac agcttgaagt caaattcaat gcaccagcac 1380
ttcaagaggc ttattataga gcccgtgctg gtgatgctgc taacttttgt gcactcatac 1440
tc 1442
<210>45
<211>1050
<212>DNA
<213>冠状病毒
<400>45
atatgtctat gacatatgga cagcagtttg gtccaacata cttggatggt gctgatgtta 60
caaaaattaa acctcatgta aatcatgagg gtaagacttt ctttgtacta cctagtgatg120
acacactacg tagtgaagct ttcgagtact accatactct tgatgagagt tttcttggta180
ggtacatgtc tgctttaaac cacacaaaga aatggaaatt tcctcaagtt ggtggtttaa240
cttcaattaa atgggctgat aacaattgtt atttgtctag tgttttatta gcacttcaac300
agcttgaagt caaattcaat gcaccagcac ttcaagaggc ttattataga gcccgtgctg360
gtgatgctgc taacttttgt gcactcatac tcgcttacag taataaaact gttggcgagc420
ttggtgatgt cagagaaact atgacccatc ttctacagca tgctaatttg gaatctgcaa480
agcgagttct taatgtggtg tgtaaacatt gtggtcagaa aactactacc ttaacgggtg540
tagaagctgt gatgtatatg ggtactctat cttatgataa tcttaagaca ggtgtttcca600
ttccatgtgt gtgtggtcgt gatgctacac aatatctagt acaacaagag tcttcttttg660
ttatgatgtc tgcaccacct gctgagtata aattacagca aggtacattc ttatgtgcga720
atgagtacac tggtaactat cagtgtggtc attacactca tataactgct aaggagaccc780
tctatcgtat tgacggagct caccttacaa agatgtcaga gtacaaagga ccagtgactg840
atgttttcta caaggaaaca tcttacacta caaccatcaa gcctgtgtcg tataaactcg900
atggagttac ttacacagag attgaaccaa aattggatgg gtattataaa aaggataatg960
cttactatac agagcagcct atagaccttg taccaactca accattacca aatgcgagtt 1020
ttgataattt caaactcaca tgttctaaca1050
<210>46
<211>1995
<212>DNA
<213>冠状病毒
<400>46
tttgtgcact catactcgct tacagtaata aaactgttgg cgagcttggt gatgtcagag 60
aaactatgac ccatcttcta cagcatgcta atttggaatc tgcaaagcga gttcttaatg 120
tggtgtgtaa acattgtggt cagaaaacta ctaccttaac gggtgtagaa gctgtgatgt 180
atatgggtac tctatcttat gataatctta agacaggtgt ttccattcca tgtgtgtgtg 240
gtcgtgatgc tacacaatat ctagtacaac aagagtcttc ttttgttatg atgtctgcac 300
cacctgctga gtataaatta cagcaaggta cattcttatg tgcgaatgag tacactggta 360
actatcagtg tggtcattac actcatataa ctgctaagga gaccctctat cgtattgacg 420
gagctcacct tacaaagatg tcagagtaca aaggaccagt gactgatgtt ttctacaagg 480
aaacatctta cactacaacc atcaagcctg tgtcgtataa actcgatgga gttacttaca 540
cagagattga accaaaattg gatgggtatt ataaaaagga taatgcttac tatacagagc 600
agcctataga ccttgtacca actcaaccat taccaaatgc gagttttgat aatttcaaac 660
tcacatgttc taacacaaaa tttgctgatg atttaaatca aatgacaggc ttcacaaagc 720
cagcttcacg agagctatct gtcacattct tcccagactt gaatggcgat gtagtggcta 780
ttgactatag acactattca gcgagtttca agaaaggtgc taaattactg cataagccaa 840
ttgtttggca cattaaccag gctacaacca agacaacgtt caaaccaaac acttggtgtt 900
tacgttgtct ttggagtaca aagccagtag atacttcaaa ttcatttgaa gttctggcag 960
tagaagacac acaaggaatg gacaatcttg cttgtgaaag tcaacaaccc acctctgaag1020
aagtagtgga aaatcctacc atacagaagg aagtcataga gtgtgacgtg aaaactaccg1080
aagttgtagg caatgtcata cttaaaccat cagatgaagg tgttaaagta acacaagagt1140
taggtcatga ggatcttatg gctgcttatg tggaaaacac aagcattacc attaagaaac1200
ctaatgagct ttcactagcc ttaggtttaa aaacaattgc cactcatggt attgctgcaa1260
ttaatagtgt tccttggagt aaaattttgg cttatgtcaa accattctta ggacaagcag1320
caattacaac atcaaattgc gctaagagat tagcacaacg tgtgtttaac aattatatgc1380
cttatgtgtt tacattattg ttccaattgt gtacttttac taaaagtacc aattctagaa1440
ttagagcttc actacctaca actattgcta aaaatagtgt taagagtgtt gctaaattat1500
gtttggatgc cggcattaat tatgtgaagt cacccaaatt ttctaaattg ttcacaatcg1560
ctatgtggct attgttgtta agtatttgct taggttctct aatctgtgta actgctgctt1620
ttggtgtact cttatctaat tttggtgctc cttcttattg taatggcgtt agagaattgt1680
atcttaattc gtctaacgtt actactatgg atttctgtga aggttctttt ccttgcagca1740
tttgtttaag tggattagac tcccttgatt cttatccagc tcttgaaacc attcaggtga1800
cgatttcatc gtacaagcta gacttgacaa ttttaggtct ggccgctgag tgggttttgg1860
catatatgtt gttcacaaaa ttcttttatt tattaggtct ttcagctata atgcaggtgt1920
tctttggcta ttttgctagt catttcatca gcaattcttg gctcatgtgg tttatcatta1980
gtattgtaca aatgg 1995
<210>47
<211>1884
<212>DNA
<213>冠状病毒
<400>47
aattcttggc tcatgtggtt tatcattagt attgtacaaa tggcacccgt ttctgcaatg 60
gttaggatgt acatcttctt tgcttctttc tactacatat ggaagagcta tgttcatatc 120
atggatggtt gcacctcttc gacttgcatg atgtgctata agcgcaatcg tgccacacgc 180
gttgagtgta caactattgt taatggcatg aagagatctt tctatgtcta tgcaaatgga 240
ggccgtggct tctgcaagac tcacaattgg aattgtctca attgtgacac attttgcact 300
ggtagtacat tcattagtga tgaagttgct cgtgatttgt cactccagtt taaaagacca 360
atcaacccta ctgaccagtc atcgtatatt gttgatagtg ttgctgtgaa aaatggcgcg 420
cttcacctct actttgacaa ggctggtcaa aagacctatg agagacatcc gctctcccat 480
tttgtcaatt tagacaattt gagagctaac aacactaaag gttcactgcc tattaatgtc 540
atagtttttg atggcaagtc caaatgcgac gagtctgctt ctaagtctgc ttctgtgtac 600
tacagtcagc tgatgtgcca acctattctg ttgcttgacc aagctcttgt atcagacgtt 660
ggagatagta ctgaagtttc cgttaagatg tttgatgctt atgtcgacac cttttcagca 720
acttttagtg ttcctatgga aaaacttaag gcacttgttg ctacagctca cagcgagtta 780
gcaaagggtg tagctttaga tggtgtcctt tctacattcg tgtcagctgc ccgacaaggt 840
gttgttgata ccgatgttga cacaaaggat gttattgaat gtctcaaact ttcacatcac 900
tctgacttag aagtgacagg tgacagttgt aacaatttca tgctcaccta taataaggtt 960
gaaaacatga cgcccagaga tcttggcgca tgtattgact gtaatgcaag gcatatcaat1020
gcccaagtag caaaaagtca caatgtttca ctcatctgga atgtaaaaga ctacatgtct1080
ttatctgaac agctgcgtaa acaaattcgt agtgctgcca agaagaacaa catacctttt1140
agactaactt gtgctacaac tagacaggtt gtcaatgtca taactactaa aatctcactc1200
aagggtggta agattgttag tacttgtttt aaacttatgc ttaaggccac attattgtgc1260
gttcttgctg cattggtttg ttatatcgtt atgccagtac atacattgtc aatccatgat1320
ggttacacaa atgaaatcat tggttacaaa gccattcagg atggtgtcac tcgtgacatc1380
atttctactg atgattgttt tgcaaataaa catgctggtt ttgacgcatg gtttagccag1440
cgtggtggtt catacaaaaa tgacaaaagc tgccctgtag tagctgctat cattacaaga1500
gagattggtt tcatagtgcc tggcttaccg ggtactgtgc tgagagcaat caatggtgac1560
ttcttgcatt ttctacctcg tgtttttagt gctgttggca acatttgcta cacaccttcc1620
aaactcattg agtatagtga ttttgctacc tctgcttgcg ttcttgctgc tgagtgtaca1680
atttttaagg atgctatggg caaacctgtg ccatattgtt atgacactaa tttgctagag1740
ggttctattt cttatagtga gcttcgtcca gacactcgtt atgtgcttat ggatggttcc1800
atcatacagt ttcctaacac ttacctggag ggttctgtta gagtagtaac aacttttgat1860
gctgagtact gtagacatgg taca 1884
<210>48
<211>2020
<212>DNA
<213>冠状病毒
<400>48
cactcgttat gtgcttatgg atggttccat catacagttt cctaacactt acctggaggg 60
ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta catgcgaaag 120
gtcagaagta ggtatttgcc tatctaccag tggtagatgg gttcttaata atgagcatta 180
cagagctcta tcaggagttt tctgtggtgt tgatgcgatg aatctcatag ctaacatctt 240
tactcctctt gtgcaacctg tgggtgcttt agatgtgtct gcttcagtag tggctggtgg 300
tattattgcc atattggtga cttgtgctgc ctactacttt atgaaattca gacgtgtttt 360
tggtgagtac aaccatgttg ttgctgctaa tgcacttttg tttttgatgt ctttcactat 420
actctgtctg gtaccagctt acagctttct gccgggagtc tactcagtct tttacttgta 480
cttgacattc tatttcacca atgatgtttc attcttggct caccttcaat ggtttgccat 540
gttttctcct attgtgcctt tttggataac agcaatctat gtattctgta tttctctgaa 600
gcactgccat tggttcttta acaactatct taggaaaaga gtcatgttta atggagttac 660
atttagtacc ttcgaggagg ctgctttgtg tacctttttg ctcaacaagg aaatgtacct 720
aaaattgcgt agcgagacac tgttgccact tacacagtat aacaggtatc ttgctctata 780
taacaagtac aagtatttca gtggagcctt agatactacc agctatcgtg aagcagcttg 840
ctgccactta gcaaaggctc taaatgactt tagcaactca ggtgctgatg ttctctacca 900
accaccacag acatcaatca cttctgctgt tctgcagagt ggttttagga aaatggcatt 960
cccgtcaggc aaagttgaag ggtgcatggt acaagtaacc tgtggaacta caactcttaa1020
tggattgtgg ttggatgaca cagtatactg tccaagacat gtcatttgca cagcagaaga1080
catgcttaat cctaactatg aagatctgct cattcgcaaa tccaaccata gctttcttgt1140
tcaggctggc aatgttcaac ttcgtgttat tggccattct atgcaaaatt gtctgcttag1200
gcttaaagtt gatacttcta accctaagac acccaagtat aaatttgtcc gtatccaacc1260
tggtcaaaca ttttcagttc tagcatgcta caatggttca ccatctggtg tttatcagtg1320
tgccatgaga cctaatcata ccattaaagg ttctttcctt aatggatcat gtggtagtgt1380
tggttttaac attgattatg attgcgtgtc tttctgctat atgcatcata tggagcttcc1440
aacaggagta cacgctggta ctgacttaga aggtaaattc tatggtccat ttgttgacag1500
acaaactgca caggctgcag gtacagacac aaccataaca ttaaatgttt tggcatggct1560
gtatgctgct gttatcaatg gtgataggtg gtttcttaat agattcacca ctactttgaa1620
tgactttaac cttgtggcaa tgaagtacaa ctatgaacct ttgacacaag atcatgttga1680
catattggga cctctttctg ctcaaacagg aattgccgtc ttagatatgt gtgctgcttt1740
gaaagagctg ctgcagaatg gtatgaatgg tcgtactatc cttggtagca ctattttaga1800
agatgagttt acaccatttg atgttgttag acaatgctct ggtgttacct tccaaggtaa1860
gttcaagaaa attgttaagg gcactcatca ttggatgctt ttaactttct tgacatcact1920
attgattctt gttcaaagta cacagtggtc actgtttttc tttgtttacg agaatgcttt1980
cttgccattt actcttggta ttatggcaat tgctgcatgt 2020
<210>49
<211>2040
<212>DNA
<213>冠状病毒
<400>49
agcatttcca gcctgaagac gtactgtagc agctaaactg cccagcacca tacctctatt 60
taggttgttt aagcctttga tgaagtacaa gtatttcact ttaggccctt ttggtgtgtc 120
tgtaacaaac ctacaaggtg gttccagttc tgtgtaaatt gtacctgtac catcactctt 180
agggaatcta gcccatttga gatcttggtg gtctgatagt aatgccagca caaacctacc 240
tcccttcgaa ttgttatagt aggcaagtgc attgtcatca gtacaagctg tttgtgtggt 300
accagccgca caggacatct gtcgtagtgc tactggactc agttcattat tctgtagttt 360
aacagctgag ttggctctta gagctgtaac aataagaggc caagccaaat ttggtgaatt 420
gtccatgtta atttcactaa gttgaacaat cttgctatcc gcatcaacaa cttgctggat 480
ttcccagagt gcagatgcat atgtaaaggt gttaccatca caagtgttct tgtaggtacc 540
ataatcaggg acaacaacca tgagtttggc tgctgtagtc aatggtatga tgttgagtgg 600
aacacaacca tcacgcgcat tgttgataat gttgttaagt gcatcattat caagcttcct 660
aagcatagtg aagagcattg tttgcatagc actagttact tttgccctct tgtcctcaga 720
tcttgcctgt ttgtacattt gggtcatagc ctgatctgcc atcttttcca acttgcgttg 780
catggcagca tcacggtcaa actcagattt agccacattc aaagatttct ttaacttttt 840
gagaacgact tcagaatcac cattagctac agcctgctca taggcctcct gggcagtggc 900
ataagcggca tatgatggta aagaactaaa ttctgaagca atagcctgaa gagtagcacg 960
gttatcgagc atttcctcgc acaacctatt aatgtctaca gcaccctgca tggatagcaa1020
aacagacaaa agagaaacca tcttctcgaa agcttcagtt gtgtcttttg caagaagaat1080
atcattgtgg agttgtacac attgtgccca caatttagaa gatgactcta ctctaagttg1140
ttgaagaacc gagagcagta ccacagatgt gcactttacg tcagacattt tagactgtac1200
agtagcaacc ttgatacatg gtttacctcc aatacccaac aacttaatgt taagcttgaa1260
agcatcaata ctactcttag gaggcaaaag cccctgggag ttcatatacc taaattcttg1320
tgtagagacc aagtagtcat aaacaccaag agtaagcctg aagtaacggt tgagtaaaca1380
gaaaaggcca aagtagcagc agcaacaata gcctaagaaa caataaacaa gcatgataca1440
ctgtaaggtg ttgccagtaa taaataacaa tgggtaatac tcaacacaca caaacactat1500
agctctagct aaaaacatga tagtcgtaac gacaccagaa tagttagagg ttacagaaat1560
aactaaggcc cacatggaaa tagcttgatc taaagcatta ccatagtaga ctttgtaaac1620
aagtgtaatg acattcatca gtgtccaaac acgtctagca gcatcatcat aaacagtgcg1680
agctgtcatg agaataagca aaactaaagc tgaagcatac ataacacaat ccttaagcct1740
ataaccagac aagctagtgt cagccaattc aagccatgtc atgatacgca tcacccagct1800
agcaggcatg tagaccatat taaagtaagc aactgttgca agagaaggta acagaaacaa1860
gcacaagaat gcgtgcttat gcttaacaag cagcatagca catgcagcaa ttgccataat1920
accaagagta aatggcaaga aagcattctc gtaaacaaag aaaaacagtg accactgtgt1980
actttgaaca agaatcaata gtgatgtcaa gaaagttaaa agcatccaat gatgagtgca2040
<210>50
<211>2012
<212>DNA
<213>冠状病毒
<400>50
cttgtaggtt tgttacagac acaccaaaag ggcctaaagt gaaatacttg tacttcatca 60
aaggcttaaa caacctaaat agaggtatgg tgctgggcag tttagctgct acagtacgtc 120
ttcaggctgg aaatgctaca gaagtacctg ccaattcaac tgtgctttcc ttctgtgctt 180
ttgcagtaga ccctgctaaa gcatataagg attacctagc aagtggagga caaccaatca 240
ccaactgtgt gaagatgttg tgtacacaca ctggtacagg acaggcaatt actgtaacac 300
cagaagctaa catggaccaa gagtcctttg gtggtgcttc atgttgtctg tattgtagat 360
gccacattga ccatccaaat cctaaaggat tctgtgactt gaaaggtaag tacgtccaaa 420
tacctaccac ttgtgctaat gacccagtgg gttttacact tagaaacaca gtctgtaccg 480
tctgcggaat gtggaaaggt tatggctgta gttgtgacca actccgcgaa cccttgatgc 540
agtctgcgga tgcatcaacg tttttaaacg ggtttgcggt gtaagtgcag cccgtcttac 600
accgtgcggc acaggcacta gtactgatgt cgtctacagg gcttttgata tttacaacga 660
aaaagttgct ggttttgcaa agttcctaaa aactaattgc tgtcgcttcc aggagaagga 720
tgaggaaggc aatttattag actcttactt tgtagttaag aggcatacta tgtctaacta 780
ccaacatgaa gagactattt ataacttggt taaagattgt ccagcggttg ctgtccatga 840
ctttttcaag tttagagtag atggtgacat ggtaccacat atatcacgtc agcgtctaac 900
taaatacaca atggctgatt tagtctatgc tctacgtcat tttgatgagg gtaattgtga 960
tacattaaaa gaaatactcg tcacatacaa ttgctgtgat gatgattatt tcaataagaa1020
ggattggtat gacttcgtag agaatcctga catcttacgc gtatatgcta acttaggtga1080
gcgtgtacgc caatcattat taaagactgt acaattctgc gatgctatgc gtgatgcagg1140
cattgtaggc gtactgacat tagataatca ggatcttaat gggaactggt acgatttcgg1200
tgatttcgta caagtagcac caggctgcgg agttcctatt gtggattcat attactcatt1260
gctgatgccc atcctcactt tgactagggc attggctgct gagtcccata tggatgctga1320
tctcgcaaaa ccacttatta agtgggattt gctgaaatat gattttacgg aagagagact1380
ttgtctcttc gaccgttatt ttaaatattg ggaccagaca taccatccca attgtattaa1440
ctgtttggat gataggtgta tccttcattg tgcaaacttt aatgtgttat tttctactgt1500
gtttccacct acaagttttg gaccactagt aagaaaaata tttgtagatg gtgttccttt1560
tgttgtttca actggatacc attttcgtga gttaggagtc gtacataatc aggatgtaaa1620
cttacatagc tcgcgtctca gtttcaagga acttttagtg tatgctgctg atccagctat1680
gcatgcagct tctggcaatt tattgctaga taaacgcact acatgctttt cagtagctgc1740
actaacaaac aatgttgctt ttcaaactgt caaacccggt aattttaata aagactttta1800
tgactttgct gtgtctaaag gtttctttaa ggaaggaagt tctgttgaac taaaacactt1860
cttctttgct caggatggca acgctgctat cagtgattat gactattatc gttataatct1920
gccaacaatg tgtgatatca gacaactcct attcgtagtt gaagttgttg ataaatactt1980
tgattgttac gatggtggct gtattaatgc ca 2012
<210>51
<211>1877
<212>DNA
<213>冠状病毒
<400>51
gtacttcgcg tacagtggca ataccatatg acagcttaaa tgtttcctca gtggctttga 60
gcgtttctgc tgcgaaaagc ttgagtctct cagtacaagt gttggcaagt atgtaatcgc 120
cagcattagt ccaatcacat gttgctatcg cattgaagtc agtgacattg tcactgccta 180
cacatgtgtt tttgtataaa ccaaaaacct gaccattagc acataatgga aaactaatgg 240
gaggcttatg tgacttgcaa taatagctca tacctcctag atacagttgt gtcacatcag 300
tgacatcaca acctggggca ttgcaaacat agggattaac agacaacact aatttgtgtg 360
atgttgaaat gacatggtca tagcagcact tgcaacatag gaatggtctc ctaatacagg 420
caccgcaacg aagtgaagtc tgtgaattgc acaatacaca agcacctaca gcctgcaaga 480
ctgtatgtgg tgtgtaccta gcctcataaa actcaggttc ccagtaccgt gaggtgttat 540
cattagttag cattacggaa tacatgtcca acatgtggcc agtaagctca tcatgtaact 600
ttctaatgta ttgtaaatac aagtgaaaga catcagcata ctcctgatta ggatgttttg 660
taagtgggta agcatcaata gccagtgaca cgaacctttc aatcataagt gtaccatctg 720
ttttgacaat atcatcgaca aaacagcctg cgcctaatat tcttgatgga tctgggtaag 780
gcaggtacac gtaatcatct ccttgtttaa ctagcattgt atgctgtgag caaaattcgt 840
gaggtccttt agtaaggtca gtctcagtcc aacattttgc ctcagacatg aacacattat 900
tttgataata aagaactgcc ttaaagttct taatgctagc tactaaacct tgagccgcat 960
agttactgtt atagcacaca acggcatcat cagaaagaat catcatggag aaatgtttac1020
gcaggtaagc gtaaaactca tccacgaatt catgatcaac atccctattt ctatagagac1080
actcatagag cctgtgttgt agattgcgga catacttgtc agctatctta ttaccatcag1140
ttgaaagaag tgcatttaca ttggctgtaa cagcttgaca aatgttaaag acactattag1200
cataagcagt tgtagcatca ccggatgatg ttccacctgg tttaacatat agtgagccgc1260
cacacatgac catctcactt aatacttgcg cacactcgtt agctaacctg tagaaacggt1320
gtgataagtt acagcaagtg ttatgtttgc gagcaagaac aagagaggcc attatcctaa1380
gcatgttagg catggctctg tcacattttg gataatccca acccataagg tgtggagttt1440
ctacatcact gtaaacagtt tttaacatat tatgccagcc accgtaaaac ttgcttgttc1500
caattaccac agtagctcct ctagtggcgg ctattgactt caataatttc tgatgaaact1560
gtctatttgt catagtacta cagatagaga caccagctac ggtgcgagct ctattctttg1620
cactaatggc atacttaaga ttcatttgag ttatagtagg gatgacatta cgcttagtat1680
acgcgaaaag tgcatcttga tcctcataac tcattgagtc ataataaagt ctagccttac1740
cccatttatt aaatgggaaa ccagctgatt tatccagatt gttaacgatt acttggttgg1800
cattaataca gccaccatcg taacaatcaa agtatttatc aacaacttca actacgaata1860
ggagttgtct gatatca 1877
<210>52
<211>2051
<212>DNA
<213>冠状病毒
<400>52
tcaggtccaa tcttgacaaa gtacttcatt gatgtaagct caaagccatg cgcccaaagg 60
acgaacacga ctctgtctga caatcctttc agtgtatcac tgagcatttg tactatctta120
atacgcacta cattccaggg caagccttta tacatgagtg gtataagatg tttaaactgg180
tcacctggtg gaggttttgc attaactctg gtgaattctg tgttattttc agtgtcaaca240
taaccagtcg gtacagctac taagttaaca cctgtagaaa atcctagctg gagaggtagg300
ttagtaccca cagcatctct agttgcatga cagccctcta catcaaagcc aatccacgca360
cgaacgtgac gaatagcttc ttcgcgggtg ataaacatat tagggtaacc attgacttgg420
taattcattt tgaaacccat catagagatg agtctacggt aggtcatgtc ctttggtatg480
cctggtatgt caacacataa tccttcagtc ttgaacttta tatcaacgct gaggtgtgta540
ggtgcctgtg taggatgaag accagtaatg atcttactac agtccttaaa aagtccagtt600
acattttctg cttgtaatgt agccacattg cgacgtggta tttctagact tgtaaattgc660
agtttgtcat aaagatctct atcagacatt atgcacaaaa tgccaatttt tgcccttgtg720
atagccacat tgaagcggtt gacattacaa gagtgtgctg tttcagtagt ttgtgtgaat780
atgacatagt catattcaga accctgtgat gaatcaacag tctgcgtagg caatcctaag840
atttttgaag ctacagcgtt ctgtgaatta taaggtgaga taaaaacagc ttttctccaa900
gcaggattgc gtgtaagaaa ttctcttaca acgcctattt gaggtctgtt gattgcagat960
gaaacatcat gtgtaataac acctttgtag aacattttga agcattgagc tgacttatcc 1020
ttgtgtgctt ttagcttatt gtcataaact aaagcactca cagtgtcaac aatttcagca 1080
ggacaacggc gacaagttcc aaggaacatg tctggaccta ttgttttcat aagtctgcac 1140
actgaattaa aatattctgg ttctagtgtg cctttagtca gcaatgtgcg gggggctggt 1200
aattgagcag gatcgccaat atagacgtag tgttttgcac gaagtctagc attgacaaca 1260
ctcaagtcat aattagtagc catagagatt tcatcaaaga ctacaatgtc agcagttgtt 1320
tctggcaatg catttacagt gcagaaaaca tactgttcta gtgttgaatt cactttgaat 1380
ttatcaaaac actctacgcg cgcacgcgca ggtatgattc tactacattt atctatgggc 1440
aaatatttta atgccttttc acatagggca tcaacagctg catgagagca tgccgtatac 1500
actatgcgag cagatgggta atagagagca agtccgatgg caaaatgact cttaccagta 1560
ccaggtggtc cttggagtgt agagtacttt tgcatgccga ccttttgata atttgcaaca 1620
ttgctagaaa actcatctga gatgttgagt gttgggtaca agccagtaat tctcacatag 1680
tgctcttgtg gcactagagt aggtgcacta agtggcatta cagtgtgaga tgtcaacaca 1740
aagtaatcac caacattcaa cttgtatgtc gtagtacctc tgtacacaac agcatcacca 1800
tagtcacctt tttcaaaggt gtactctcca atctgtactt tactattttt agttacacgg 1860
taaccagtaa agacatagtt tctgttcaat ggtggtctag gttttccaac ctcccatgaa 1920
agatgcaatt ctctgtcaga gagtacttcg cgtacagtgg caataccata tgacagctta 1980
aatgtttcct cagtggcttt gagcgtttct gctgcgaaaa gcttgagtct ctcagtacaa 2040
gtgttggcaa g2051
<210>53
<211>2075
<212>DNA
<213>冠状病毒
<400>53
tgcttgtagt tttgggtaga aggtttcaac atgtccatcc ttacaccaaa gcatgaatga 60
aatttcagca tagtcaattg taaccttgac cacttttgaa atcactgaca aatcttgtga120
ctttattatc tcgacaaagt catcaagtaa aagatcaatc acagaacaca cacattttga180
tgaacctgtt tgcgcatctg ttatgaagta atttttcact gtgctgtcca tagggataaa240
atcctctaat ttaagtggtg aatcttgtga gcgcttggct aagcctatca ttaaatgaag300
accgccaagt tgtccatgac tgaaatctcc ataaacgatg tgttcgaagg catagccctc360
gagcttatat cgctgtatga attcatccat agcgagctcg agaaagtcag tttccatttg420
tgatctgggc ttaaaatcct ctaagtctct gctctgagta aagtaggttt caggcaactg480
ttgaataatg ccgtctactt tcttaaagta gttaaactgt gtttttactg attctccaat540
taatgtgact ccattgacgc tagcttgtgc tggtcccttt gaaggtgtta gacctttgac600
tgaaccttct gttattaaaa caccattacg ggcgtttcta aaaaggtcta cctgtccttc660
cactctacca tcaaacaaga cagtaagtga agaacaagca ctctcagtag gtttcttggc720
aatgtcagtc attgtgcaga cacctattgt agatacatgt gctggggctt ctcttttgta780
gtcccagatt acagtattag cagcgatatc aacacccaaa ttattgagta tcttaatctc840
tggcactggt ttaatgttac gcttagccca aagctcaaat gcaacattaa caggaagtgt900
tgtcttattt tcaaagatct ccacatcaat accatctacc tttgtgtaaa cagcattatt960
aatgatggaa acaggtgctt cgccggcgtg tccatcaaag tgtcctttat taacaacatt1020
ataagccaca ttttctaaac tctgtaacct ggtaaatgta ttccacaggt tataagtatc1080
aaattgtttg taaatccata ggctaaatcc agcagaaatc atcatattat atgcatccaa1140
gtactgtcgg tactcatttg catggtgtct gcaaacagca ccacctaaat tgcatcgtgt1200
aatacacgta gcagatttga gtggaacata atcaatatcc gacactactt gtttgccatg1260
agactcacaa ggactatcag aatagtaaaa gaaaggcaat tgctttaaat tagtaaatgc1320
acttttatcg aaagctggag tgtggaatgc atgcttattc acatacaaac taccaccatc1380
acagcctggt aagttcaagt ttgacaagac tcttgtgtca aacctacaca caattgcatt1440
ggctgggtaa cgatcaacgt tacaattcca aaacaaacaa acaccatcag tgaatttatc1500
gtgatgtgta gcataagaat agaagagttc ctctattttg taagctttgt cactacatgg1560
ctgagcatcg tagaacttcc attctacttc agcctgaggc acacacttga tagcctttgg1620
atttccaatg tcatgaagaa ctggaaactt atcagcaagc aatgcagact tcacaaccat1680
gtgttgtact tttctgcaag cagaattaac cctcagttca tctcctataa tagggtattc1740
aacagaccaa tcaacgcgct taacaaagca ctcatggact gctaaacatc tagtcatgat1800
agcatcacaa ctagccacat gtgcatttcc atgtacctgg caatgttggt catggttact1860
ctgaaggtta cccgtaaagc cccactgctg aacatcaatc ataaatgggt tatagacata1920
gtcaaaaccc acagaatgat tccagcaggc ataagtatct gatgaagtag aaaagcaagt1980
tgcacgtttg tcacacagac aacacgttct ttcaggtcca atcttgacaa agtacttcat2040
tgatgtaagc tcaaagccat gcgcccaaag gacga 2075
<210>54
<211>1891
<212>DNA
<213>冠状病毒
<400>54
aagattcacc acttaaatta gaggatttta tccctatgga cagcacagtg aaaaattact 60
tcataacaga tgcgcaaaca ggttcatcaa aatgtgtgtg ttctgtgatt gatcttttac 120
ttgatgactt tgtcgagata ataaagtcac aagatttgtc agtgatttca aaagtggtca 180
aggttacaat tgactatgct gaaatttcat tcatgctttg gtgtaaggat ggacatgttg 240
aaaccttcta cccaaaacta caagcaagtc aagcgtggca accaggtgtt gcgatgccta 300
acttgtacaa gatgcaaaga atgcttcttg aaaagtgtga ccttcagaat tatggtgaaa 360
atgctgttat accaaaagga ataatgatga atgtcgcaaa gtatactcaa ctgtgtcaat 420
acttaaatac acttacttta gctgtaccct acaacatgag agttattcac tttggtgctg 480
gctctgataa aggagttgca ccaggtacag ctgtgctcag acaatggttg ccaactggca 540
cactacttgt cgattcagat cttaatgact tcgtctccga cgcagattct actttaattg 600
gagactgtgc aacagtacat acggctaata aatgggacct tattattagc gatatgtatg 660
accctaggac caaacatgtg acaaaagaga atgactctaa agaagggttt ttcacttatc 720
tgtgtggatt tataaagcaa aaactagccc tgggtggttc tatagctgta aagataacag 780
agcattcttg gaatgctgac ctttacaagc ttatgggcca tttctcatgg tggacagctt 840
ttgttacaaa tgtaaatgca tcatcatcgg aagcattttt aattggggct aactatcttg 900
gcaagccgaa ggaacaaatt gatggctata ccatgcatgc taactacatt ttctggagga 960
acacaaatcc tatccagttg tcttcctatt cactctttga catgagcaaa tttcctctta1020
aattaagagg aactgctgta atgtctctta aggagaatca aatcaatgat atgatttatt1080
ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg1140
atattcttgt taacaactaa acgaacatgt ttattttctt attatttctt actctcacta1200
gtggtagtga ccttgaccgg tgcaccactt ttgatgatgt tcaagctcct aattacactc1260
aacatacttc atctatgagg ggggtttact atcctgatga aatttttaga tcagacactc1320
tttatttaac tcaggattta tttcttccat tttattctaa tgttacaggg tttcatacta1380
ttaatcatac gtttggcaac cctgtcatac cttttaagga tggtatttat tttgctgcca1440
cagagaaatc aaatgttgtc cgtggttggg tttttggttc taccatgaac aacaagtcac1500
agtcggtgat tattattaac aattctacta atgttgttat acgagcatgt aactttgaat1560
tgtgtgacaa ccctttcttt gctgtttcta aacccatggg tacacagaca catactatga1620
tattcgataa tgcatttaat tgcactttcg agtacatatc tgatgccttt tcgcttgatg1680
tttcagaaaa gtcaggtaat tttaaacact tacgagagtt tgtgtttaaa aataaagatg1740
ggtttctcta tgtttataag ggctatcaac ctatagatgt agttcgtgat ctaccttctg1800
gttttaacac tttgaaacct atttttaagt tgcctcttgg tattaacatt acaaatttta1860
gagccattct tacagccttt tcacctgctc a 1891
<210>55
<211>32
<212>DNA
<213>人工序列
<220>
<223>N正义引物
<400>55
cccatatgtc tgataatgga ccccaatcaa ac32
<210>56
<211>32
<212>DNA
<213>人工序列
<220>
<223>N反义引物r
<400>56
cccccgggtg cctgagttga atcagcagaa gc32
<210>57
<211>31
<212>DNA
<213>人工序列
<220>
<223>Sc正义引物
<400>57
cccatatgag tgaccttgac cggtgcacca c31
<210>58
<211>30
<212>DNA
<213>人工序列
<220>
<223>SL正义引物
<400>58
cccatatgaa accttgcacc ccacctgctc 30
<210>59
<211>33
<212>DNA
<213>Sc和SL反义引物r
<400>59
cccccgggtt taatatattg ctcatatttt ccc 33
<210>60
<211>16
<212>DNA
<213>正义系列1引物
<400>60
ggcatcgtat gggttg 16
<210>61
<211>16
<212>DNA
<213>反义系列2(28774-28759)引物
<400>61
cagtttcacc acctcc 16
<210>62
<211>16
<212>DNA
<213>正义系列2(28375-28390)引物
<400>62
ggctactacc gaagag 16
<210>63
<211>16
<212>DNA
<213>反义系列2(28702-28687)引物
<400>63
aattaccgcg actacg 16
<210>64
<211>26
<212>DNA
<213>探针1/系列1(28561-28586)
<400>64
ggcacccgca atcctaataa caatgc 26
<210>65
<211>21
<212>DNA
<213>探针2/系列1(28588-28608)
<400>65
gccaccgtgc tacaacttcc t21
<210>66
<211>23
<212>DNA
<213>探针1/系列2/探针N/FL(28541-28563)
<400>66
atacacccaa agaccacatt ggc 23
<210>67
<211>25
<212>DNA
<213>探针2/系列2/探针SARS/N/LC705(28565-28589)
<400>67
cccgcaatcc taataacaat gctgc25
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>锚定引物14T
<400>68
agatgaattc ggtacctttt tttttttttt 30
<210>69
<211>13
<212>PRT
<213>人工序列
<220>
<223>M2-14肽
<400>69
Ala Asp Asn Gly Thr Ile Thr Val Glu Glu Leu Lys Gln
1 5 10
<210>70
<211>12
<212>PRT
<213>人工序列
<220>
<223>E1-12肽
<400>70
Met Tyr Ser Phe Val Ser Glu Glu Thr Gly Thr Leu
1 5 10
<210>71
<211>24
<212>PRT
<213>人工序列
<220>
<223>E53-72肽
<400>71
Lys Pro Thr Val Tyr Val Tyr Ser Arg Val Lys Asn Leu Asn Ser Ser
1 5 10 15
Glu Gly Val Pro Asp Leu Leu Val
20
<210>72
<211>153
<212>DNA
<213>冠状病毒
<400>72
gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 60
tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta120
cgcagtataa acaataataa attttactgt cgt 153
<210>73
<211>410
<212>DNA
<213>冠状病毒
<400>73
ttctccagac aacttcaaaa ttccatgagt ggagcttctg ctgattcaac tcaggcataa 60
acactcatga tgaccacaca aggcagatgg gctatgtaaa cgttttcgca attccgttta120
cgatacatag tctactcttg tgcagaatga attctcgtaa ctaaacagca caagtaggtt180
tagttaactt taatctcaca tagcaatctt taatcaatgt gtaacattag ggaggacttg240
aaagagccac cacattttca tcgaggccac gcggagtacg atcgagggta cagtgaataa300
tgctagggag agctgcctat atggaagagc cctaatgtgt aaaattaatt ttagtagtgc360
tatccccatg tgattttaat agcttcttag gagaatgaca aaaaaaaaaa 410
<210>74
<211>4382
<212>PRT
<213>冠状病毒
<400>74
Met Glu Ser Leu Val Leu Gly Val Asn Glu Lys Thr His Val Gln Leu
1 5 10 15
Ser Leu Pro Val Leu Gln Val Arg Asp Val Leu Val Arg Gly Phe Gly
20 25 30
Asp Ser Val Glu Glu Ala Leu Ser Glu Ala Arg Glu His Leu Lys Asn
35 40 45
Gly Thr Cys Gly Leu Val Glu Leu Glu Lys Gly Val Leu Pro Gln Leu
50 55 60
Glu Gln Pro Tyr Val Phe Ile Lys Arg Ser Asp Ala Leu Ser Thr Asn
65 70 75 80
His Gly His Lys Val Val Glu Leu Val Ala Glu Met Asp Gly Ile Gln
85 90 95
Tyr Gly Arg Ser Gly Ile Thr Leu Gly Val Leu Val Pro His Val Gly
100 105 110
Glu Thr Pro Ile Ala Tyr Arg Asn Val Leu Leu Arg Lys Asn Gly Asn
115 120 125
Lys Gly Ala Gly Gly His Ser Tyr Gly Ile Asp Leu Lys Ser Tyr Asp
130 135 140
Leu Gly Asp Glu Leu Gly Thr Asp Pro Ile Glu Asp Tyr Glu Gln Asn
145 150 155 160
Trp Asn Thr Lys His Gly Ser Gly Ala Leu Arg Glu Leu Thr Arg Glu
165 170 175
Leu Asn Gly Gly Ala Val Thr Arg Tyr Val Asp Asn Asn Phe Cys Gly
180 185 190
Pro Asp Gly Tyr Pro Leu Asp Cys Ile Lys Asp Phe Leu Ala Arg Ala
195 200 205
Gly Lys Ser Met Cys Thr Leu Ser Glu Gln Leu Asp Tyr Ile Glu Ser
210 215 220
Lys Arg Gly Val Tyr Cys Cys Arg Asp His Glu His Glu Ile Ala Trp
225 230 235 240
Phe Thr Glu Arg Ser Asp Lys Ser Tyr Glu His Gln Thr Pro Phe Glu
245 250 255
Ile Lys Ser Ala Lys Lys Phe Asp Thr Phe Lys Gly Glu Cys Pro Lys
260 265 270
Phe Val Phe Pro Leu Asn Ser Lys Val Lys Val Ile Gln Pro Arg Val
275 280 285
Glu Lys Lys Lys Thr Glu Gly Phe Met Gly Arg Ile Arg Ser Val Tyr
290 295 300
Pro Val Ala Ser Pro Gln Glu Cys Asn Asn Met His Leu Ser Thr Leu
305 310 315 320
Met Lys Cys Asn His Cys Asp Glu Val Ser Trp Gln Thr Cys Asp Phe
325 330 335
Leu Lys Ala Thr Cys Glu His Cys Gly Thr Glu Asn Leu Val Ile Glu
340 345 350
Gly Pro Thr Thr Cys Gly Tyr Leu Pro Thr Asn Ala Val Val Lys Met
355 360 365
Pro Cys Pro Ala Cys Gln Asp Pro Glu Ile Gly Pro Glu His Ser Val
370 375 380
Ala Asp Tyr His Asn His Ser Asn Ile Glu Thr Arg Leu Arg Lys Gly
385 390 395 400
Gly Arg Thr Arg Cys Phe Gly Gly Cys Val Phe Ala Tyr Val Gly Cys
405 410 415
Tyr Asn Lys Arg Ala Tyr Trp Val Pro Arg Ala Ser Ala Asp Ile Gly
420 425 430
Ser Gly His Thr Gly Ile Thr Gly Asp Asn Val Glu Thr Leu Asn Glu
435 440 445
Asp Leu Leu Glu Ile Leu Ser Arg Glu Arg Val Asn Ile Asn Ile Val
450 455 460
Gly Asp Phe His Leu Asn Glu Glu Val Ala Ile Ile Leu Ala Ser Phe
465 470 475 480
Ser Ala Ser Thr Ser Ala Phe Ile Asp Thr Ile Lys Ser Leu Asp Tyr
485 490 495
Lys Ser Phe Lys Thr Ile Val Glu Ser Cys Gly Asn Tyr Lys Val Thr
500 505 510
Lys Gly Lys Pro Val Lys Gly Ala Trp Asn Ile Gly Gln Gln Arg Ser
515 520 525
Val Leu Thr Pro Leu Cys Gly Phe Pro Ser Gln Ala Ala Gly Val Ile
530 535 540
Arg Ser Ile Phe Ala Arg Thr Leu Asp Ala Ala Asn His Ser Ile Pro
545 550 555 560
Asp Leu Gln Arg Ala Ala Val Thr Ile Leu Asp Gly Ile Ser Glu Gln
565 570 575
Ser Leu Arg Leu Val Asp Ala Met Val Tyr Thr Ser Asp Leu Leu Thr
580 585 590
Asn Ser Val Ile Ile Met Ala Tyr Val Thr Gly Gly Leu Val Gln Gln
595 600 605
Thr Ser Gln Trp Leu Ser Asn Leu Leu Gly Thr Thr Val Glu Lys Leu
610 615 620
Arg Pro Ile Phe Glu Trp Ile Glu Ala Lys Leu Ser Ala Gly Val Glu
625 630 635 640
Phe Leu Lys Asp Ala Trp Glu Ile Leu Lys Phe Leu Ile Thr Gly Val
645 650 655
Phe Asp Ile Val Lys Gly Gln Ile Gln Val Ala Ser Asp Asn Ile Lys
660 665 670
Asp Cys Val Lys Cys Phe Ile Asp Val Val Asn Lys Ala Leu Glu Met
675 680 685
Cys Ile Asp Gln Val Thr Ile Ala Gly Ala Lys Leu Arg Ser Leu Asn
690 695 700
Leu Gly Glu Val Phe Ile Ala Gln Ser Lys Gly Leu Tyr Arg Gln Cys
705 710 715 720
Ile Arg Gly Lys Glu Gln Leu Gln Leu Leu Met Pro Leu Lys Ala Pro
725 730 735
Lys Glu Val Thr Phe Leu Glu Gly Asp Ser His Asp Thr Val Leu Thr
740 745 750
Ser Glu Glu Val Val Leu Lys Asn Gly Glu Leu Glu Ala Leu Glu Thr
755 760 765
Pro Val Asp Ser Phe Thr Asn Gly Ala Ile Val Gly Thr Pro Val Cys
770 775 780
Val Asn Gly Leu Met Leu Leu Glu Ile Lys Asp Lys Glu Gln Tyr Cys
785 790 795 800
Ala Leu Ser Pro Gly Leu Leu Ala Thr Asn Asn Val Phe Arg Leu Lys
805 810 815
Gly Gly Ala Pro Ile Lys Gly Val Thr Phe Gly Glu Asp Thr Val Trp
820 825 830
Glu Val Gln Gly Tyr Lys Asn Val Arg Ile Thr Phe Glu Leu Asp Glu
835 840 845
Arg Val Asp Lys Val Leu Asn Glu Lys Cys Ser Val Tyr Thr Val Glu
850 855 860
Ser Gly Thr Glu Val Thr Glu Phe Ala Cys Val Val Ala Glu Ala Val
865 870 875 880
Val Lys Thr Leu Gln Pro Val Ser Asp Leu Leu Thr Asn Met Gly Ile
885 890 895
Asp Leu Asp Glu Trp Ser Val Ala Thr Phe Tyr Leu Phe Asp Asp Ala
900 905 910
Gly Glu Glu Asn Phe Ser Ser Arg Met Tyr Cys Ser Phe Tyr Pro Pro
915 920 925
Asp Glu Glu Glu Glu Asp Asp Ala Glu Cys Glu Glu Glu Glu Ile Asp
930 935 940
Glu Thr Cys Glu His Glu Tyr Gly Thr Glu Asp Asp Tyr Gln Gly Leu
945 950 955 960
Pro Leu Glu Phe Gly Ala Ser Ala Glu Thr Val Arg Val Glu Glu Glu
965 970 975
Glu Glu Glu Asp Trp Leu Asp Asp Thr Thr Glu Gln Ser Glu Ile Glu
980 985 990
Pro Glu Pro Glu Pro Thr Pro Glu Glu Pro Val Asn Gln Phe Thr Gly
99510001005
Tyr Leu Lys Leu Thr Asp Asn Val Ala Ile Lys Cys Val Asp Ile
1010 1015 1020
Val Lys Glu Ala Gln Ser Ala Asn Pro Met Val Ile Val Asn Ala
1025 1030 1035
Ala Asn Ile His Leu Lys His Gly Gly Gly Val Ala Gly Ala Leu
1040 1045 1050
Asn Lys Ala Thr Asn Gly Ala Met Gln Lys Glu Ser Asp Asp Tyr
1055 1060 1065
Ile Lys Leu Asn Gly Pro Leu Thr Val Gly Gly Ser Cys Leu Leu
1070 1075 1080
Ser Gly His Asn Leu Ala Lys Lys Cys Leu His Val Val Gly Pro
1085 1090 1095
Asn Leu Asn Ala Gly Glu Asp Ile Gln Leu Leu Lys Ala Ala Tyr
1100 1105 1110
Glu Asn Phe Asn Ser Gln Asp Ile Leu Leu Ala Pro Leu Leu Ser
1115 1120 1125
Ala Gly Ile Phe Gly Ala Lys Pro Leu Gln Ser Leu Gln Val Cys
1130 1135 1140
Val Gln Thr Val Arg Thr Gln Val Tyr Ile Ala Val Asn Asp Lys
1145 1150 1155
Ala Leu Tyr Glu Gln Val Val Met Asp Tyr Leu Asp Asn Leu Lys
1160 1165 1170
Pro Arg Val Glu Ala Pro Lys Gln Glu Glu Pro Pro Asn Thr Glu
1175 1180 1185
Asp Ser Lys Thr Glu Glu Lys Ser Val Val Gln Lys Pro Val Asp
1190 1195 1200
Val Lys Pro Lys Ile Lys Ala Cys Ile Asp Glu Val Thr Thr Thr
1205 1210 1215
Leu Glu Glu Thr Lys Phe Leu Thr Asn Lys Leu Leu Leu Phe Ala
1220 1225 1230
Asp Ile Asn Gly Lys Leu Tyr His Asp Ser Gln Asn Met Leu Arg
1235 1240 1245
Gly Glu Asp Met Ser Phe Leu Glu Lys Asp Ala Pro Tyr Met Val
1250 1255 1260
Gly Asp Val Ile Thr Ser Gly Asp Ile Thr Cys Val Val Ile Pro
1265 1270 1275
Ser Lys Lys Ala Gly Gly Thr Thr Glu Met Leu Ser Arg Ala Leu
1280 1285 1290
Lys Lys Val Pro Val Asp Glu Tyr Ile Thr Thr Tyr Pro Gly Gln
1295 1300 1305
Gly Cys Ala Gly Tyr Thr Leu Glu Glu Ala Lys Thr Ala Leu Lys
1310 1315 1320
Lys Cys Lys Ser Ala Phe Tyr Val Leu Pro Ser Glu Ala Pro Asn
1325 1330 1335
Ala Lys Glu Glu Ile Leu Gly Thr Val Ser Trp Asn Leu Arg Glu
1340 1345 1350
Met Leu Ala His Ala Glu Glu Thr Arg Lys Leu Met Pro Ile Cys
1355 1360 1365
Met Asp Val Arg Ala Ile Met Ala Thr Ile Gln Arg Lys Tyr Lys
1370 1375 1380
Gly Ile Lys Ile Gln Glu Gly Ile Val Asp Tyr Gly Val Arg Phe
1385 1390 1395
Phe Phe Tyr Thr Ser Lys Glu Pro Val Ala Ser Ile Ile Thr Lys
1400 1405 1410
Leu Asn Ser Leu Asn Glu Pro Leu Val Thr Met Pro Ile Gly Tyr
1415 1420 1425
Val Thr His Gly Phe Asn Leu Glu Glu Ala Ala Arg Cys Met Arg
1430 1435 1440
Ser Leu Lys Ala Pro Ala Val Val Ser Val Ser Ser Pro Asp Ala
1445 1450 1455
Val Thr Thr Tyr Asn Gly Tyr Leu Thr Ser Ser Ser Lys Thr Ser
1460 1465 1470
Glu Glu His Phe Val Glu Thr Val Ser Leu Ala Gly Ser Tyr Arg
1475 1480 1485
Asp Trp Ser Tyr Ser Gly Gln Arg Thr Glu Leu Gly Val Glu Phe
1490 1495 1500
Leu Lys Arg Gly Asp Lys Ile Val Tyr His Thr Leu Glu Ser Pro
1505 1510 1515
Val Glu Phe His Leu Asp Gly Glu Val Leu Ser Leu Asp Lys Leu
1520 1525 1530
Lys Ser Leu Leu Ser Leu Arg Glu Val Lys Thr Ile Lys Val Phe
1535 1540 1545
Thr Thr Val Asp Asn Thr Asn Leu His Thr Gln Leu Val Asp Met
1550 1555 1560
Ser Met Thr Tyr Gly Gln Gln Phe Gly Pro Thr Tyr Leu Asp Gly
1565 1570 1575
Ala Asp Val Thr Lys Ile Lys Pro His Val Asn His Glu Gly Lys
1580 1585 1590
Thr Phe Phe Val Leu Pro Ser Asp Asp Thr Leu Arg Ser Glu Ala
1595 1600 1605
Phe Glu Tyr Tyr His Thr Leu Asp Glu Ser Phe Leu Gly Arg Tyr
1610 1615 1620
Met Ser Ala Leu Asn His Thr Lys Lys Trp Lys Phe Pro Gln Val
1625 1630 1635
Gly Gly Leu Thr Ser Ile Lys Trp Ala Asp Asn Asn Cys Tyr Leu
1640 1645 1650
Ser Ser Val Leu Leu Ala Leu Gln Gln Leu Glu Val Lys Phe Asn
1655 1660 1665
Ala Pro Ala Leu Gln Glu Ala Tyr Tyr Arg Ala Arg Ala Gly Asp
1670 1675 1680
Ala Ala Asn Phe Cys Ala Leu Ile Leu Ala Tyr Ser Asn Lys Thr
1685 1690 1695
Val Gly Glu Leu Gly Asp Val Arg Glu Thr Met Thr His Leu Leu
1700 1705 1710
Gln His Ala Asn Leu Glu Ser Ala Lys Arg Val Leu Asn Val Val
1715 1720 1725
Cys Lys His Cys Gly Gln Lys Thr Thr Thr Leu Thr Gly Val Glu
1730 1735 1740
Ala Val Met Tyr Met Gly Thr Leu Ser Tyr Asp Asn Leu Lys Thr
1745 1750 1755
Gly Val Ser Ile Pro Cys Val Cys Gly Arg Asp Ala Thr Gln Tyr
1760 1765 1770
Leu Val Gln Gln Glu Ser Ser Phe Val Met Met Ser Ala Pro Pro
1775 1780 1785
Ala Glu Tyr Lys Leu Gln Gln Gly Thr Phe Leu Cys Ala Asn Glu
1790 1795 1800
Tyr Thr Gly Asn Tyr Gln Cys Gly His Tyr Thr His Ile Thr Ala
1805 1810 1815
Lys Glu Thr Leu Tyr Arg Ile Asp Gly Ala His Leu Thr Lys Met
1820 1825 1830
Ser Glu Tyr Lys Gly Pro Val Thr Asp Val Phe Tyr Lys Glu Thr
1835 1840 1845
Ser Tyr Thr Thr Thr Ile Lys Pro Val Ser Tyr Lys Leu Asp Gly
1850 1855 1860
Val Thr Tyr Thr Glu Ile Glu Pro Lys Leu Asp Gly Tyr Tyr Lys
1865 1870 1875
Lys Asp Asn Ala Tyr Tyr Thr Glu Gln Pro Ile Asp Leu Val Pro
1880 1885 1890
Thr Gln Pro Leu Pro Asn Ala Ser Phe Asp Asn Phe Lys Leu Thr
1895 1900 1905
Cys Ser Asn Thr Lys Phe Ala Asp Asp Leu Asn Gln Met Thr Gly
1910 1915 1920
Phe Thr Lys Pro Ala Ser Arg Glu Leu Ser Val Thr Phe Phe Pro
1925 1930 1935
Asp Leu Asn Gly Asp Val Val Ala Ile Asp Tyr Arg His Tyr Ser
1940 1945 1950
Ala Ser Phe Lys Lys Gly Ala Lys Leu Leu His Lys Pro Ile Val
1955 1960 1965
Trp His Ile Asn Gln Ala Thr Thr Lys Thr Thr Phe Lys Pro Asn
1970 1975 1980
Thr Trp Cys Leu Arg Cys Leu Trp Ser Thr Lys Pro Val Asp Thr
1985 1990 1995
Ser Asn Ser Phe Glu Val Leu Ala Val Glu Asp Thr Gln Gly Met
2000 2005 2010
Asp Asn Leu Ala Cys Glu Ser Gln Gln Pro Thr Ser Glu Glu Val
2015 2020 2025
Val Glu Asn Pro Thr Ile Gln Lys Glu Val Ile Glu Cys Asp Val
2030 2035 2040
Lys Thr Thr Glu Val Val Gly Asn Val Ile Leu Lys Pro Ser Asp
2045 2050 2055
Glu Gly Val Lys Val Thr Gln Glu Leu Gly His Glu Asp Leu Met
2060 2065 2070
Ala Ala Tyr Val Glu Asn Thr Ser Ile Thr Ile Lys Lys Pro Asn
2075 2080 2085
Glu Leu Ser Leu Ala Leu Gly Leu Lys Thr Ile Ala Thr His Gly
2090 2095 2100
Ile Ala Ala Ile Asn Ser Val Pro Trp Ser Lys Ile Leu Ala Tyr
2105 2110 2115
Val Lys Pro Phe Leu Gly Gln Ala Ala Ile Thr Thr Ser Asn Cys
2120 2125 2130
Ala Lys Arg Leu Ala Gln Arg Val Phe Asn Asn Tyr Met Pro Tyr
2135 2140 2145
Val Phe Thr Leu Leu Phe Gln Leu Cys Thr Phe Thr Lys Ser Thr
2150 2155 2160
Asn Ser Arg Ile Arg Ala Ser Leu Pro Thr Thr Ile Ala Lys Asn
2165 2170 2175
Ser Val Lys Ser Val Ala Lys Leu Cys Leu Asp Ala Gly Ile Asn
2180 2185 2190
Tyr Val Lys Ser Pro Lys Phe Ser Lys Leu Phe Thr Ile Ala Met
2195 2200 2205
Trp Leu Leu Leu Leu Ser Ile Cys Leu Gly Ser Leu Ile Cys Val
2210 2215 2220
Thr Ala Ala Phe Gly Val Leu Leu Ser Asn Phe Gly Ala Pro Ser
2225 2230 2235
Tyr Cys Asn Gly Val Arg Glu Leu Tyr Leu Asn Ser Ser Asn Val
2240 2245 2250
Thr Thr Met Asp Phe Cys Glu Gly Ser Phe Pro Cys Ser Ile Cys
2255 2260 2265
Leu Ser Gly Leu Asp Ser Leu Asp Ser Tyr Pro Ala Leu Glu Thr
2270 2275 2280
Ile Gln Val Thr Ile Ser Ser Tyr Lys Leu Asp Leu Thr Ile Leu
2285 2290 2295
Gly Leu Ala Ala Glu Trp Val Leu Ala Tyr Met Leu Phe Thr Lys
2300 2305 2310
Phe Phe Tyr Leu Leu Gly Leu Ser Ala Ile Met Gln Val Phe Phe
2315 2320 2325
Gly Tyr Phe Ala Ser His Phe Ile Ser Asn Ser Trp Leu Met Trp
2330 2335 2340
Phe Ile Ile Ser Ile Val Gln Met Ala Pro Val Ser Ala Met Val
2345 2350 2355
Arg Met Tyr Ile Phe Phe Ala Ser Phe Tyr Tyr Ile Trp Lys Ser
2360 2365 2370
Tyr Val His Ile Met Asp Gly Cys Thr Ser Ser Thr Cys Met Met
2375 2380 2385
Cys Tyr Lys Arg Asn Arg Ala Thr Arg Val Glu Cys Thr Thr Ile
2390 2395 2400
Val Asn Gly Met Lys Arg Ser Phe Tyr Val Tyr Ala Asn Gly Gly
2405 2410 2415
Arg Gly Phe Cys Lys Thr His Asn Trp Asn Cys Leu Asn Cys Asp
2420 2425 2430
Thr Phe Cys Thr Gly Ser Thr Phe Ile Ser Asp Glu Val Ala Arg
2435 2440 2445
Asp Leu Ser Leu Gln Phe Lys Arg Pro Ile Asn Pro Thr Asp Gln
2450 2455 2460
Ser Ser Tyr Ile Val Asp Ser Val Ala Val Lys Asn Gly Ala Leu
2465 2470 2475
His Leu Tyr Phe Asp Lys Ala Gly Gln Lys Thr Tyr Glu Arg His
2480 2485 2490
Pro Leu Ser His Phe Val Asn Leu Asp Asn Leu Arg Ala Asn Asn
2495 2500 2505
Thr Lys Gly Ser Leu Pro Ile Asn Val Ile Val Phe Asp Gly Lys
2510 2515 2520
Ser Lys Cys Asp Glu Ser Ala Ser Lys Ser Ala Ser Val Tyr Tyr
2525 2530 2535
Ser Gln Leu Met Cys Gln Pro Ile Leu Leu Leu Asp Gln Ala Leu
2540 2545 2550
Val Ser Asp Val Gly Asp Ser Thr Glu Val Ser Val Lys Met Phe
2555 2560 2565
Asp Ala Tyr Val Asp Thr Phe Ser Ala Thr Phe Ser Val Pro Met
2570 2575 2580
Glu Lys Leu Lys Ala Leu Val Ala Thr Ala His Ser Glu Leu Ala
2585 2590 2595
Lys Gly Val Ala Leu Asp Gly Val Leu Ser Thr Phe Val Ser Ala
2600 2605 2610
Ala Arg Gln Gly Val Val Asp Thr Asp Val Asp Thr Lys Asp Val
2615 2620 2625
Ile Glu Cys Leu Lys Leu Ser His His Ser Asp Leu Glu Val Thr
2630 2635 2640
Gly Asp Ser Cys Asn Asn Phe Met Leu Thr Tyr Asn Lys Val Glu
2645 2650 2655
Asn Met Thr Pro Arg Asp Leu Gly Ala Cys Ile Asp Cys Asn Ala
2660 2665 2670
Arg His Ile Asn Ala Gln Val Ala Lys Ser His Asn Val Ser Leu
2675 2680 2685
Ile Trp Asn Val Lys Asp Tyr Met Ser Leu Ser Glu Gln Leu Arg
2690 2695 2700
Lys Gln Ile Arg Ser Ala Ala Lys Lys Asn Asn Ile Pro Phe Arg
2705 2710 2715
Leu Thr Cys Ala Thr Thr Arg Gln Val Val Asn Val Ile Thr Thr
2720 2725 2730
Lys Ile Ser Leu Lys Gly Gly Lys Ile Val Ser Thr Cys Phe Lys
2735 2740 2745
Leu Met Leu Lys Ala Thr Leu Leu Cys Val Leu Ala Ala Leu Val
2750 2755 2760
Cys Tyr Ile Val Met Pro Val His Thr Leu Ser Ile His Asp Gly
2765 2770 2775
Tyr Thr Asn Glu Ile Ile Gly Tyr Lys Ala Ile Gln Asp Gly Val
2780 2785 2790
Thr Arg Asp Ile Ile Ser Thr Asp Asp Cys Phe Ala Asn Lys His
2795 2800 2805
Ala Gly Phe Asp Ala Trp Phe Ser Gln Arg Gly Gly Ser Tyr Lys
2810 2815 2820
Asn Asp Lys Ser Cys Pro Val Val Ala Ala Ile Ile Thr Arg Glu
2825 2830 2835
Ile Gly Phe Ile Val Pro Gly Leu Pro Gly Thr Val Leu Arg Ala
2840 2845 2850
Ile Asn Gly Asp Phe Leu His Phe Leu Pro Arg Val Phe Ser Ala
2855 2860 2865
Val Gly Asn Ile Cys Tyr Thr Pro Ser Lys Leu Ile Glu Tyr Ser
2870 2875 2880
Asp Phe Ala Thr Ser Ala Cys Val Leu Ala Ala Glu Cys Thr Ile
2885 2890 2895
Phe Lys Asp Ala Met Gly Lys Pro Val Pro Tyr Cys Tyr Asp Thr
2900 2905 2910
Asn Leu Leu Glu Gly Ser Ile Ser Tyr Ser Glu Leu Arg Pro Asp
2915 2920 2925
Thr Arg Tyr Val Leu Met Asp Gly Ser Ile Ile Gln Phe Pro Asn
2930 2935 2940
Thr Tyr Leu Glu Gly Ser Val Arg Val Val Thr Thr Phe Asp Ala
2945 2950 2955
Glu Tyr Cys Arg His Gly Thr Cys Glu Arg Ser Glu Val Gly Ile
2960 2965 2970
Cys Leu Ser Thr Ser Gly Arg Trp Val Leu Asn Asn Glu His Tyr
2975 2980 2985
Arg Ala Leu Ser Gly Val Phe Cys Gly Val Asp Ala Met Asn Leu
2990 2995 3000
Ile Ala Asn Ile Phe Thr Pro Leu Val Gln Pro Val Gly Ala Leu
3005 3010 3015
Asp Val Ser Ala Ser Val Val Ala Gly Gly Ile Ile Ala Ile Leu
3020 3025 3030
Val Thr Cys Ala Ala Tyr Tyr Phe Met Lys Phe Arg Arg Val Phe
3035 3040 3045
Gly Glu Tyr Asn His Val Val Ala Ala Asn Ala Leu Leu Phe Leu
3050 3055 3060
Met Ser Phe Thr Ile Leu Cys Leu Val Pro Ala Tyr Ser Phe Leu
3065 3070 3075
Pro Gly Val Tyr Ser Val Phe Tyr Leu Tyr Leu Thr Phe Tyr Phe
3080 3085 3090
Thr Asn Asp Val Ser Phe Leu Ala His Leu Gln Trp Phe Ala Met
3095 3100 3105
Phe Ser Pro Ile Val Pro Phe Trp Ile Thr Ala Ile Tyr Val Phe
3110 3115 3120
Cys Ile Ser Leu Lys His Cys His Trp Phe Phe Asn Asn Tyr Leu
3125 3130 3135
Arg Lys Arg Val Met Phe Asn Gly Val Thr Phe Ser Thr Phe Glu
3140 3145 3150
Glu Ala Ala Leu Cys Thr Phe Leu Leu Asn Lys Glu Met Tyr Leu
3155 3160 3165
Lys Leu Arg Ser Glu Thr Leu Leu Pro Leu Thr Gln Tyr Asn Arg
3170 3175 3180
Tyr Leu Ala Leu Tyr Asn Lys Tyr Lys Tyr Phe Ser Gly Ala Leu
3185 3190 3195
Asp Thr Thr Ser Tyr Arg Glu Ala Ala Cys Cys His Leu Ala Lys
3200 3205 3210
Ala Leu Asn Asp Phe Ser Asn Ser Gly Ala Asp Val Leu Tyr Gln
3215 3220 3225
Pro Pro Gln Thr Ser Ile Thr Ser Ala Val Leu Gln Ser Gly Phe
3230 3235 3240
Arg Lys Met Ala Phe Pro Ser Gly Lys Val Glu Gly Cys Met Val
3245 3250 3255
Gln Val Thr Cys Gly Thr Thr Thr Leu Asn Gly Leu Trp Leu Asp
3260 3265 3270
Asp Thr Val Tyr Cys Pro Arg His Val Ile Cys Thr Ala Glu Asp
3275 3280 3285
Met Leu Asn Pro Asn Tyr Glu Asp Leu Leu Ile Arg Lys Ser Asn
3290 3295 3300
His Ser Phe Leu Val Gln Ala Gly Asn Val Gln Leu Arg Val Ile
3305 3310 3315
Gly His Ser Met Gln Asn Cys Leu Leu Arg Leu Lys Val Asp Thr
3320 3325 3330
Ser Asn Pro Lys Thr Pro Lys Tyr Lys Phe Val Arg Ile Gln Pro
3335 3340 3345
Gly Gln Thr Phe Ser Val Leu Ala Cys Tyr Asn Gly Ser Pro Ser
3350 3355 3360
Gly Val Tyr Gln Cys Ala Met Arg Pro Asn His Thr Ile Lys Gly
3365 3370 3375
Ser Phe Leu Asn Gly Ser Cys Gly Ser Val Gly Phe Asn Ile Asp
3380 3385 3390
Tyr Asp Cys Val Ser Phe Cys Tyr Met His His Met Glu Leu Pro
3395 3400 3405
Thr Gly Val His Ala Gly Thr Asp Leu Glu Gly Lys Phe Tyr Gly
3410 3415 3420
Pro Phe Val Asp Arg Gln Thr Ala Gln Ala Ala Gly Thr Asp Thr
3425 3430 3435
Thr Ile Thr Leu Asn Val Leu Ala Trp Leu Tyr Ala Ala Val Ile
3440 3445 3450
Asn Gly Asp Arg Trp Phe Leu Asn Arg Phe Thr Thr Thr Leu Asn
3455 3460 3465
Asp Phe Asn Leu Val Ala Met Lys Tyr Asn Tyr Glu Pro Leu Thr
3470 3475 3480
Gln Asp His Val Asp Ile Leu Gly Pro Leu Ser Ala Gln Thr Gly
3485 3490 3495
Ile Ala Val Leu Asp Met Cys Ala Ala Leu Lys Glu Leu Leu Gln
3500 3505 3510
Asn Gly Met Asn Gly Arg Thr Ile Leu Gly Ser Thr Ile Leu Glu
3515 3520 3525
Asp Glu Phe Thr Pro Phe Asp Val Val Arg Gln Cys Ser Gly Val
3530 3535 3540
Thr Phe Gln Gly Lys Phe Lys Lys Ile Val Lys Gly Thr His His
3545 3550 3555
Trp Met Leu Leu Thr Phe Leu Thr Ser Leu Leu Ile Leu Val Gln
3560 3565 3570
Ser Thr Gln Trp Ser Leu Phe Phe Phe Val Tyr Glu Asn Ala Phe
3575 3580 3585
Leu Pro Phe Thr Leu Gly Ile Met Ala Ile Ala Ala Cys Ala Met
3590 3595 3600
Leu Leu Val Lys His Lys His Ala Phe Leu Cys Leu Phe Leu Leu
3605 3610 3615
Pro Ser Leu Ala Thr Val Ala Tyr Phe Asn Met Val Tyr Met Pro
3620 3625 3630
Ala Ser Trp Val Met Arg Ile Met Thr Trp Leu Glu Leu Ala Asp
3635 3640 3645
Thr Ser Leu Ser Gly Tyr Arg Leu Lys Asp Cys Val Met Tyr Ala
3650 3655 3660
Ser Ala Leu Val Leu Leu Ile Leu Met Thr Ala Arg Thr Val Tyr
3665 3670 3675
Asp Asp Ala Ala Arg Arg Val Trp Thr Leu Met Asn Val Ile Thr
3680 3685 3690
Leu Val Tyr Lys Val Tyr Tyr Gly Asn Ala Leu Asp Gln Ala Ile
3695 3700 3705
Ser Met Trp Ala Leu Val Ile Ser Val Thr Ser Asn Tyr Ser Gly
3710 3715 3720
Val Val Thr Thr Ile Met Phe Leu Ala Arg Ala Ile Val Phe Val
3725 3730 3735
Cys Val Glu Tyr Tyr Pro Leu Leu Phe Ile Thr Gly Asn Thr Leu
3740 3745 3750
Gln Cys Ile Met Leu Val Tyr Cys Phe Leu Gly Tyr Cys Cys Cys
3755 3760 3765
Cys Tyr Phe Gly Leu Phe Cys Leu Leu Asn Arg Tyr Phe Arg Leu
3770 3775 3780
Thr Leu Gly Val Tyr Asp Tyr Leu Val Ser Thr Gln Glu Phe Arg
3785 3790 3795
Tyr Met Asn Ser Gln Gly Leu Leu Pro Pro Lys Ser Ser Ile Asp
3800 3805 3810
Ala Phe Lys Leu Asn Ile Lys Leu Leu Gly Ile Gly Gly Lys Pro
3815 3820 3825
Cys Ile Lys Val Ala Thr Val Gln Ser Lys Met Ser Asp Val Lys
3830 3835 3840
Cys Thr Ser Val Val Leu Leu Ser Val Leu Gln Gln Leu Arg Val
3845 3850 3855
Glu Ser Ser Ser Lys Leu Trp Ala Gln Cys Val Gln Leu His Asn
3860 3865 3870
Asp Ile Leu Leu Ala Lys Asp Thr Thr Glu Ala Phe Glu Lys Met
3875 3880 3885
Val Ser Leu Leu Ser Val Leu Leu Ser Met Gln Gly Ala Val Asp
3890 3895 3900
Ile Asn Arg Leu Cys Glu Glu Met Leu Asp Asn Arg Ala Thr Leu
3905 3910 3915
Gln Ala Ile Ala Ser Glu Phe Ser Ser Leu Pro Ser Tyr Ala Ala
3920 3925 3930
Tyr Ala Thr Ala Gln Glu Ala Tyr Glu Gln Ala Val Ala Asn Gly
3935 3940 3945
Asp Ser Glu Val Val Leu Lys Lys Leu Lys Lys Ser Leu Asn Val
3950 3955 3960
Ala Lys Ser Glu Phe Asp Arg Asp Ala Ala Met Gln Arg Lys Leu
3965 3970 3975
Glu Lys Met Ala Asp Gln Ala Met Thr Gln Met Tyr Lys Gln Ala
3980 3985 3990
Arg Ser Glu Asp Lys Arg Ala Lys Val Thr Ser Ala Met Gln Thr
3995 4000 4005
Met Leu Phe Thr Met Leu Arg Lys Leu Asp Asn Asp Ala Leu Asn
4010 4015 4020
Asn Ile Ile Asn Asn Ala Arg Asp Gly Cys Val Pro Leu Asn Ile
4025 4030 4035
Ile Pro Leu Thr Thr Ala Ala Lys Leu Met Val Val Val Pro Asp
4040 4045 4050
Tyr Gly Thr Tyr Lys Asn Thr Cys Asp Gly Asn Thr Phe Thr Tyr
4055 4060 4065
Ala Ser Ala Leu Trp Glu Ile Gln Gln Val Val Asp Ala Asp Ser
4070 4075 4080
Lys Ile Val Gln Leu Ser Glu Ile Asn Met Asp Asn Ser Pro Asn
4085 4090 4095
Leu Ala Trp Pro Leu Ile Val Thr Ala Leu Arg Ala Asn Ser Ala
4100 4105 4110
Val Lys Leu Gln Asn Asn Glu Leu Ser Pro Val Ala Leu Arg Gln
4115 4120 4125
Met Ser Cys Ala Ala Gly Thr Thr Gln Thr Ala Cys Thr Asp Asp
4130 4135 4140
Asn Ala Leu Ala Tyr Tyr Asn Asn Ser Lys Gly Gly Arg Phe Val
4145 4150 4155
Leu Ala Leu Leu Ser Asp His Gln Asp Leu Lys Trp Ala Arg Phe
4160 4165 4170
Pro Lys Ser Asp Gly Thr Gly Thr Ile Tyr Thr Glu Leu Glu Pro
4175 4180 4185
Pro Cys Arg Phe Val Thr Asp Thr Pro Lys Gly Pro Lys Val Lys
4190 4195 4200
Tyr Leu Tyr Phe Ile Lys Gly Leu Asn Asn Leu Asn Arg Gly Met
4205 4210 4215
Val Leu Gly Ser Leu Ala Ala Thr Val Arg Leu Gln Ala Gly Asn
4220 4225 4230
Ala Thr Glu Val Pro Ala Asn Ser Thr Val Leu Ser Phe Cys Ala
4235 4240 4245
Phe Ala Val Asp Pro Ala Lys Ala Tyr Lys Asp Tyr Leu Ala Ser
4250 4255 4260
Gly Gly Gln Pro Ile Thr Asn Cys Val Lys Met Leu Cys Thr His
4265 4270 4275
Thr Gly Thr Gly Gln Ala Ile Thr Val Thr Pro Glu Ala Asn Met
4280 4285 4290
Asp Gln Glu Ser Phe Gly Gly Ala Ser Cys Cys Leu Tyr Cys Arg
4295 4300 4305
Cys His Ile Asp His Pro Asn Pro Lys Gly Phe Cys Asp Leu Lys
4310 4315 4320
Gly Lys Tyr Val Gln Ile Pro Thr Thr Cys Ala Asn Asp Pro Val
4325 4330 4335
Gly Phe Thr Leu Arg Asn Thr Val Cys Thr Val Cys Gly Met Trp
4340 4345 4350
Lys Gly Tyr Gly Cys Ser Cys Asp Gln Leu Arg Glu Pro Leu Met
4355 4360 4365
Gln Ser Ala Asp Ala Ser Thr Phe Leu Asn Gly Phe Ala Val
4370 4375 4380
<210>5
<211>2695
<212>PRT
<213>冠状病毒
<400>75
Arg Val Cys Gly Val Ser Ala Ala Arg Leu Thr Pro Cys Gly Thr Gly
1 5 10 15
Thr Ser Thr Asp Val Val Tyr Arg Ala Phe Asp Ile Tyr Asn Glu Lys
20 25 30
Val Ala Gly Phe Ala Lys Phe Leu Lys Thr Asn Cys Cys Arg Phe Gln
35 40 45
Glu Lys Asp Glu Glu Gly Asn Leu Leu Asp Ser Tyr Phe Val Val Lys
50 55 60
Arg His Thr Met Ser Asn Tyr Gln His Glu Glu Thr Ile Tyr Asn Leu
65 70 75 80
Val Lys Asp Cys Pro Ala Val Ala Val His Asp Phe Phe Lys Phe Arg
85 90 95
Val Asp Gly Asp Met Val Pro His Ile Ser Arg Gln Arg Leu Thr Lys
100 105 110
Tyr Thr Met Ala Asp Leu Val Tyr Ala Leu Arg His Phe Asp Glu Gly
115 120 125
Asn Cys Asp Thr Leu Lys Glu Ile Leu Val Thr Tyr Asn Cys Cys Asp
130 135 140
Asp Asp Tyr Phe Asn Lys Lys Asp Trp Tyr Asp Phe Val Glu Asn Pro
145 150 155 160
Asp Ile Leu Arg Val Tyr Ala Asn Leu Gly Glu Arg Val Arg Gln Ser
165 170 175
Leu Leu Lys Thr Val Gln Phe Cys Asp Ala Met Arg Asp Ala Gly Ile
180 185 190
Val Gly Val Leu Thr Leu Asp Asn Gln Asp Leu Asn Gly Asn Trp Tyr
195 200 205
Asp Phe Gly Asp Phe Val Gln yal Ala Pro Gly Cys Gly Val Pro Ile
210 215 220
Val Asp Ser Tyr Tyr Ser Leu Leu Met Pro Ile Leu Thr Leu Thr Arg
225 230 235 240
Ala Leu Ala Ala Glu Ser His Met Asp Ala Asp Leu Ala Lys Pro Leu
245 250 255
Ile Lys Trp Asp Leu Leu Lys Tyr Asp Phe Thr Glu Glu Arg Leu Cys
260 265 270
Leu Phe Asp Arg Tyr Phe Lys Tyr Trp Asp Gln Thr Tyr His Pro Asn
275 280 285
Cys Ile Asn Cys Leu Asp Asp Arg Cys Ile Leu His Cys Ala Asn Phe
290 295 300
Asn Val Leu Phe Ser Thr Val Phe Pro Pro Thr Ser Phe Gly Pro Leu
305 310 315 320
Val Arg Lys Ile Phe Val Asp Gly Val Pro Phe Val Val Ser Thr Gly
325 330 335
Tyr His Phe Arg Glu Leu Gly Val Val His Asn Gln Asp Val Asn Leu
340 345 350
His Ser Ser Arg Leu Ser Phe Lys Glu Leu Leu Val Tyr Ala Ala Asp
355 360 365
Pro Ala Met His Ala Ala Ser Gly Asn Leu Leu Leu Asp Lys Arg Thr
370 375 380
Thr Cys Phe Ser Val Ala Ala Leu Thr Asn Asn Val Ala Phe Gln Thr
385 390 395 400
Val Lys Pro Gly Asn Phe Asn Lys Asp Phe Tyr Asp Phe Ala Val Ser
405 410 415
Lys Gly Phe Phe Lys Glu Gly Ser Ser Val Glu Leu Lys His Phe Phe
420 425 430
Phe Ala Gln Asp Gly Asn Ala Ala Ile Ser Asp Tyr Asp Tyr Tyr Arg
435 440 445
Tyr Asn Leu Pro Thr Met Cys Asp Ile Arg Gln Leu Leu Phe Val Val
450 455 460
Glu Val Val Asp Lys Tyr Phe Asp Cys Tyr Asp Gly Gly Cys Ile Asn
465 470 475 480
Ala Asn Gln Val Ile Val Asn Asn Leu Asp Lys Ser Ala Gly Phe Pro
485 490 495
Phe Asn Lys Trp Gly Lys Ala Arg Leu Tyr Tyr Asp Ser Met Ser Tyr
500 505 510
Glu Asp Gln Asp Ala Leu Phe Ala Tyr Thr Lys Arg Asn Val Ile Pro
515 520 525
Thr Ile Thr Gln Met Asn Leu Lys Tyr Ala Ile Ser Ala Lys Asn Arg
530 535 540
Ala Arg Thr Val Ala Gly Val Ser Ile Cys Ser Thr Met Thr Asn Arg
545 550 555 560
Gln Phe His Gln Lys Leu Leu Lys Ser Ile Ala Ala Thr Arg Gly Ala
565 570 575
Thr Val Val Ile Gly Thr Ser Lys Phe Tyr Gly Gly Trp His Asn Met
580 585 590
Leu Lys Thr Val Tyr Ser Asp Val Glu Thr Pro His Leu Met Gly Trp
595 600 605
Asp Tyr Pro Lys Cys Asp Arg Ala Met Pro Asn Met Leu Arg Ile Met
610 615 620
Ala Ser Leu Val Leu Ala Arg Lys His Asn Thr Cys Cys Asn Leu Ser
625 630 635 640
His Arg Phe Tyr Arg Lel Ala Asn Glu Cys Ala Gln Val Leu Ser Glu
645 650 655
Met Val Met Cys Gly Gly Ser Leu Tyr Val Lys Pro Gly Gly Thr Ser
660 665 670
Ser Gly Asp Ala Thr Thr Ala Tyr Ala Asn Ser Val Phe Asn Ile Cys
675 680 685
Gln Ala Val Thr Ala Asn Val Asn Ala Leu Leu Ser Thr Asp Gly Asn
690 695 700
Lys Ile Ala Asp Lys Tyr Val Arg Asn Leu Gln His Arg Leu Tyr Glu
705 710 715 720
Cys Leu Tyr Arg Asn Arg Asp Val Asp His Glu Phe Val Asp Glu Phe
725 730 735
Tyr Ala Tyr Leu Arg Lys His Phe Ser Met Met Ile Leu Ser Asp Asp
740 745 750
Ala Val Val Cys Tyr Asn Ser Asn Tyr Ala Ala Gln Gly Leu Val Ala
755 760 765
Ser Ile Lys Asn Phe Lys Ala Val Leu Tyr Tyr Gln Asn Asn Val Phe
770 775 780
Met Ser Glu Ala Lys Cys Trp Thr Glu Thr Asp Leu Thr Lys Gly Pro
785 790 795 800
His Glu Phe Cys Ser Gln His Thr Met Leu Val Lys Gln Gly Asp Asp
805 810 815
Tyr Val Tyr Leu Pro Tyr Pro Asp Pro Ser Arg Ile Leu Gly Ala Gly
820 825 830
Cys Phe Val Asp Asp Ile Val Lys Thr Asp Gly Thr Leu Met Ile Glu
835 840 845
Arg Phe Val Ser Leu Ala Ile Asp Ala Tyr Pro Leu Thr Lys His Pro
850 855 860
Asn Gln Glu Tyr Ala Asp Val Phe His Leu Tyr Leu Gln Tyr Ile Arg
865 870 875 880
Lys Leu His Asp Glu Leu Thr Gly His Met Leu Asp Met Tyr Ser Val
885 890 895
Met Leu Thr Asn Asp Asn Thr Ser Arg Tyr Trp Glu Pro Glu Phe Tyr
900 905 910
Glu Ala Met Tyr Thr Pro His Thr Val Leu Gln Ala Val Gly Ala Cys
915 920 925
Val Leu Cys Asn Ser Gln Thr Ser Leu Arg Cys Gly Ala Cys Ile Arg
930 935 940
Arg Pro Phe Leu Cys Cys Lys Cys Cys Tyr Asp His Val Ile Ser Thr
945 950 955 960
Ser His Lys Leu Val Leu Ser Val Asn Pro Tyr Val Cys Asn Ala Pro
965 970 975
Gly Cys Asp Val Thr Asp Val Thr Gln Leu Tyr Leu Gly Gly Met Ser
980 985 990
Tyr Tyr Cys Lys Ser His Lys Pro Pro Ile Ser Phe Pro Leu Cys Ala
99510001005
Asn Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys Val Gly Ser
1010 1015 1020
Asp Asn Val Thr Asp Phe Asn Ala Ile Ala Thr Cys Asp Trp Thr
1025 1030 1035
Asn Ala Gly Asp Tyr Ile Leu Ala Asn Thr Cys Thr Glu Arg Leu
1040 1045 1050
Lys Leu Phe Ala Ala Glu Thr Leu Lys Ala Thr Glu Glu Thr Phe
1055 1060 1065
Lys Leu Ser Tyr Gly Ile Ala Thr Val Arg Glu Val Leu Ser Asp
1070 1075 1080
Arg Glu Leu His Leu Ser Trp Glu Val Gly Lys Pro Arg Pro Pro
1085 1090 1095
Leu Asn Arg Asn Tyr Val Phe Thr Gly Tyr Arg Val Thr Lys Asn
1100 1105 1110
Ser Lys Val Gln Ile Gly Glu Tyr Thr Phe Glu Lys Gly Asp Tyr
1115 1120 1125
Gly Asp Ala Val Val Tyr Arg Gly Thr Thr Thr Tyr Lys Leu Asn
1130 1135 1140
Val Gly Asp Tyr Phe Val Leu Thr Ser His Thr Val Met Pro Leu
1145 1150 1155
Ser Ala Pro Thr Leu Val Pro Gln Glu His Tyr Val Arg Ile Thr
1160 1165 1170
Gly Leu Tyr Pro Thr Leu Asn Ile Ser Asp Glu Phe Ser Ser Asn
1175 1180 1185
Val Ala Asn Tyr Gln Lys Val Gly Met Gln Lys Tyr Ser Thr Leu
1190 1195 1200
Gln Gly Pro Pro Gly Thr Gly Lys Ser His Phe Ala Ile Gly Leu
1205 1210 1215
Ala Leu Tyr Tyr Pro Ser Ala Arg Ile Val Tyr Thr Ala Cys Ser
1220 1225 1230
His Ala Ala Val Asp Ala Leu Cys Glu Lys Ala Leu Lys Tyr Leu
1235 1240 1245
Pro Ile Asp Lys Cys Ser Arg Ile Ile Pro Ala Arg Ala Arg Val
1250 1255 1260
Glu Cys Phe Asp Lys Phe Lys Val Asn Ser Thr Leu Glu Gln Tyr
1265 1270 1275
Val Phe Cys Thr Val Asn Ala Leu Pro Glu Thr Thr Ala Asp Ile
1280 1285 1290
Val Val Phe Asp Glu Ile Ser Met Ala Thr Asn Tyr Asp Leu Ser
1295 1300 1305
Val Val Asn Ala Arg Leu Arg Ala Lys His Tyr Val Tyr Ile Gly
1310 1315 1320
Asp Pro Ala Gln Leu Pro Ala Pro Arg Thr Leu Leu Thr Lys Gly
1325 1330 1335
Thr Leu Glu Pro Glu Tyr Phe Asn Ser Val Cys Arg Leu Met Lys
1340 1345 1350
Thr Ile Gly Pro Asp Met Phe Leu Gly Thr Cys Arg Arg Cys Pro
1355 1360 1365
Ala Glu Ile Val Asp Thr Val Ser Ala Leu Val Tyr Asp Asn Lys
1370 1375 1380
Leu Lys Ala His Lys Asp Lys Ser Ala Gln Cys Phe Lys Met Phe
1385 1390 1395
Tyr Lys Gly Val Ile Thr His Asp Val Ser Ser Ala Ile Asn Arg
1400 1405 1410
Pro Gln Ile Gly Val Val Arg Glu Phe Leu Thr Arg Asn Pro Ala
1415 1420 1425
Trp Arg Lys Ala Val Phe Ile Ser Pro Tyr Asn Ser Gln Asn Ala
1430 1435 1440
Val Ala Ser Lys Ile Leu Gly Leu Pro Thr Gln Thr Val Asp Ser
1445 1450 1455
Ser Gln Gly Ser Glu Tyr Asp Tyr Val Ile Phe Thr Gln Thr Thr
1460 1465 1470
Glu Thr Ala His Ser Cys Asn Val Asn Arg Phe Asn Val Ala Ile
1475 1480 1485
Thr Arg Ala Lys Ile Gly Ile Leu Cys Ile Met Ser Asp Arg Asp
1490 1495 1500
Leu Tyr Asp Lys Leu Gln Phe Thr Ser Leu Glu Ile Pro Arg Arg
1505 1510 1515
Asn Val Ala Thr Leu Gln Ala Glu Asn Val Thr Gly Leu Phe Lys
1520 1525 1530
Asp Cys Ser Lys Ile Ile Thr Gly Leu His Pro Thr Gln Ala Pro
1535 1540 1545
Thr His Leu Ser Val Asp Ile Lys Phe Lys Thr Glu Gly Leu Cys
1550 1555 1560
Val Asp Ile Pro Gly Ile Pro Lys Asp Met Thr Tyr Arg Arg Leu
1565 1570 1575
Ile Ser Met Met Gly Phe Lys Met Asn Tyr Gln Val Asn Gly Tyr
1580 1585 1590
Pro Asn Met Phe Ile Thr Arg Glu Glu Ala Ile Arg His Val Arg
1595 1600 1605
Ala Trp Ile Gly Phe Asp Val Glu Gly Cys His Ala Thr Arg Asp
1610 1615 1620
Ala Val Gly Thr Asn Leu Pro Leu Gln Leu Gly Phe Ser Thr Gly
1625 1630 1635
Val Asn Leu Val Ala Val Pro Thr Gly Tyr Val Asp Thr Glu Asn
1640 1645 1650
Asn Thr Glu Phe Thr Arg Val Asn Ala Lys Pro Pro Pro Gly Asp
1655 1660 1665
Gln Phe Lys His Leu Ile Pro Leu Met Tyr Lys Gly Leu Pro Trp
1670 1675 1680
Asn Val Val Arg Ile Lys Ile Val Gln Met Leu Ser Asp Thr Leu
1685 1690 1695
Lys Gly Leu Ser Asp Arg Val Val Phe Val Leu Trp Ala His Gly
1700 1705 1710
Phe Glu Leu Thr Ser Met Lys Tyr Phe Val Lys Ile Gly Pro Glu
1715 1720 1725
Arg Thr Cys Cys Leu Cys Asp Lys Arg Ala Thr Cys Phe Ser Thr
1730 1735 1740
Ser Ser Asp Thr Tyr Ala Cys Trp Asn His Ser Val Gly Phe Asp
1745 1750 1755
Tyr Val Tyr Asn Pro Phe Met Ile Asp Val Gln Gln Trp Gly Phe
1760 1765 1770
Thr Gly Asn Leu Gln Ser Asn His Asp Gln His Cys Gln Val His
1775 1780 1785
Gly Asn Ala His Val Ala Ser Cys Asp Ala Ile Met Thr Arg Cys
1790 1795 1800
Leu Ala Val His Glu Cys Phe Val Lys Arg Val Asp Trp Ser Val
1805 1810 1815
Glu Tyr Pro Ile Ile Gly Asp Glu Leu Arg Val Asn Ser Ala Cys
1820 1825 1830
Arg Lys Val Gln His Met Val Val Lys Ser Ala Leu Leu Ala Asp
1835 1840 1845
Lys Phe Pro Val Leu His Asp Ile Gly Asn Pro Lys Ala Ile Lys
1850 1855 1860
Cys Val Pro Gln Ala Glu Val Glu Trp Lys Phe Tyr Asp Ala Gln
1865 1870 1875
Pro Cys Ser Asp Lys Ala Tyr Lys Ile Glu Glu Leu Phe Tyr Ser
1880 1885 1890
Tyr Ala Thr His His Asp Lys Phe Thr Asp Gly Val Cys Leu Phe
1895 1900 1905
Trp Asn Cys Asn Val Asp Arg Tyr Pro Ala Asn Ala Ile Val Cys
1910 1915 1920
Arg Phe Asp Thr Arg Val Leu Ser Asn Leu Asn Leu Pro Gly Cys
1925 1930 1935
Asp Gly Gly Ser Leu Tyr Val Asn Lys His Ala Phe His Thr Pro
1940 1945 1950
Ala Phe Asp Lys Ser Ala Phe Thr Asn Leu Lys Gln Leu Pro Phe
1955 1960 1965
Phe Tyr Tyr Ser Asp Ser Pro Cys Glu Ser His Gly Lys Gln Val
1970 1975 1980
Val Ser Asp Ile Asp Tyr Val Pro Leu Lys Ser Ala Thr Cys Ile
1985 1990 1995
Thr Arg Cys Asn Leu Gly Gly Ala Val Cys Arg His His Ala Asn
2000 2005 2010
Glu Tyr Arg Gln Tyr Leu Asp Ala Tyr Asn Met Met Ile Ser Ala
2015 2020 2025
Gly Phe Ser Leu Trp Ile Tyr Lys Gln Phe Asp Thr Tyr Asn Leu
2030 2035 2040
Trp Asn Thr Phe Thr Arg Leu Gln Ser Leu Glu Asn Val Ala Tyr
2045 2050 2055
Asn Val Val Asn Lys Gly His Phe Asp Gly His Ala Gly Glu Ala
2060 2065 2070
Pro Val Ser Ile Ile Asn Asn Ala Val Tyr Thr Lys Val Asp Gly
2075 2080 2085
Ile Asp Val Glu Ile Phe Glu Asn Lys Thr Thr Leu Pro Val Asn
2090 2095 2100
Val Ala Phe Glu Leu Trp Ala Lys Arg Asn Ile Lys Pro Val Pro
2105 2110 2115
Glu Ile Lys Ile Leu Asn Asn Leu Gly Val Asp Ile Ala Ala Asn
2120 2125 2130
Thr Val Ile Trp Asp Tyr Lys Arg Glu Ala Pro Ala His Val Ser
2135 2140 2145
Thr Ile Gly Val Cys Thr Met Thr Asp Ile Ala Lys Lys Pro Thr
2150 2155 2160
Glu Ser Ala Cys Ser Ser Leu Thr Val Leu Phe Asp Gly Arg Val
2165 2170 2175
Glu Gly Gln Val Asp Leu Phe Arg Asn Ala Arg Asn Gly Val Leu
2180 2185 2190
Ile Thr Glu Gly Ser Val Lys Gly Leu Thr Pro Ser Lys Gly Pro
2195 2200 2205
Ala Gln Ala Ser Val Asn Gly Val Thr Leu Ile Gly Glu Ser Val
2210 2215 2220
Lys Thr Gln Phe Asn Tyr Phe Lys Lys Val Asp Gly Ile Ile Gln
2225 2230 2235
Gln Leu Pro Glu Thr Tyr Phe Thr Gln Ser Arg Asp Leu Glu Asp
2240 2245 2250
Phe Lys Pro Arg Ser Gln Met Glu Thr Asp Phe Leu Glu Leu Ala
2255 2260 2265
Met Asp Glu Phe Ile Gln Arg Tyr Lys Leu Glu Gly Tyr Ala Phe
2270 2275 2280
Glu His Ile Val Tyr Gly Asp Phe Ser His Gly Gln Leu Gly Gly
2285 2290 2295
Leu His Leu Met Ile Gly Leu Ala Lys Arg Ser Gln Asp Ser Pro
2300 2305 2310
Leu Lys Leu Glu Asp Phe Ile Pro Met Asp Ser Thr Val Lys Asn
2315 2320 2325
Tyr Phe Ile Thr Asp Ala Gln Thr Gly Ser Ser Lys Cys Val Cys
2330 2335 2340
Ser Val Ile Asp Leu Leu Leu Asp Asp Phe Val Glu Ile Ile Lys
2345 2350 2355
Ser Gln Asp Leu Ser Val Ile Ser Lys Val Val Lys Val Thr Ile
2360 2365 2370
Asp Tyr Ala Glu Ile Ser Phe Met Leu Trp Cys Lys Asp Gly His
2375 2380 2385
Val Glu Thr Phe Tyr Pro Lys Leu Gln Ala Ser Gln Ala Trp Gln
2390 2395 2400
Pro Gly Val Ala Met Pro Asn Leu Tyr Lys Met Gln Arg Met Leu
2405 2410 2415
Leu Glu Lys Cys Asp Leu Gln Asn Tyr Gly Glu Asn Ala Val Ile
2420 2425 2430
Pro Lys Gly Ile Met Met Asn Val Ala Lys Tyr Thr Gln Leu Cys
2435 2440 2445
Gln Tyr Leu Asn Thr Leu Thr Leu Ala Val Pro Tyr Asn Met Arg
2450 2455 2460
Val Ile His Phe Gly Ala Gly Ser Asp Lys Gly Val Ala Pro Gly
2465 2470 2475
Thr Ala Val Leu Arg Gln Trp Leu Pro Thr Gly Thr Leu Leu Val
2480 2485 2490
Asp Ser Asp Leu Asn Asp Phe Val Ser Asp Ala Asp Ser Thr Leu
2495 2500 2505
Ile Gly Asp Cys Ala Thr Val His Thr Ala Asn Lys Trp Asp Leu
2510 2515 2520
Ile Ile Ser Asp Met Tyr Asp Pro Arg Thr Lys His Val Thr Lys
2525 2530 2535
Glu Asn Asp Ser Lys Glu Gly Phe Phe Thr Tyr Leu Cys Gly Phe
2540 2545 2550
Ile Lys Gln Lys Leu Ala Leu Gly Gly Ser Ile Ala Val Lys Ile
2555 2560 2565
Thr Glu His Ser Trp Asn Ala Asp Leu Tyr Lys Leu Met Gly His
2570 2575 2580
Phe Ser Trp Trp Thr Ala Phe Val Thr Asn Val Asn Ala Ser Ser
2585 2590 2595
Ser Glu Ala Phe Leu Ile Gly Ala Asn Tyr Leu Gly Lys Pro Lys
2600 2605 2610
Glu Gln Ile Asp Gly Tyr Thr Met His Ala Asn Tyr Ile Phe Trp
2615 2620 2625
Arg Asn Thr Asn Pro Ile Gln Leu Ser Ser Tyr Ser Leu Phe Asp
2630 2635 2640
Met Ser Lys Phe Pro Leu Lys Leu Arg Gly Thr Ala Val Met Ser
2645 2650 2655
Leu Lys Glu Asn Gln Ile Asn Asp Met Ile Tyr Ser Leu Leu Glu
2660 2665 2670
Lys Gly Arg Leu Ile Ile Arg Glu Asn Asn Arg Val Val Val Ser
2675 2680 2685
Ser Asp Ile Leu Val Asn Asn
2690 2695
<210>76
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L3/+/4932引物
<400>76
ccacacacag cttgtggata 20
<210>77
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L4/+/6401引物
<400>77
ccgaagttgt aggcaatgtc 20
<210>78
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L4/+/6964引物
<400>78
tttggtgctc cttcttattg 20
<210>79
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L4/-/6817引物
<400>79
ccggcatcca aacataattt 20
<210>80
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/-/7633引物
<400>80
tggtcagtag ggttgattgg 20
<210>81
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/-/8127引物
<400>81
catcctttgt gtcaacatcg 20
<210>82
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/-/8633引物
<400>82
gtcacgagtg acaccatcct 20
<210>83
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/+/7839引物
<400>83
atgcgacgag tctgcttcta 20
<210>84
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/+/8785引物
<400>84
ttcatagtgc ctggcttacc 20
<210>85
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L5/+/8255引物
<400>85
atcttggcgc atgtattgac 20
<210>86
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/-/9422引物
<400>86
tgcattagca gcaacaacat 20
<210>87
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/-/9966引物
<400>87
tctgcagaac agcagaagtg 20
<210>88
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/-/10542引物
<400>88
cctgtgcagt ttgtctgtca 20
<210>89
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/+/10677引物
<400>89
ccttgtggca atgaagtaca 20
<210>90
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/+/10106引物
<400>90
atgtcatttg cacagcagaa 20
<210>91
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L6/+/9571引物
<400>91
cttcaatggt ttgccatgtt 20
<210>92
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/-/11271引物
<400>92
tgcgagctgt catgagaata 20
<210>93
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/-/11801引物
<400>93
aaccgagagc agtaccacag 20
<210>94
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/-/12383引物
<400>94
tttggctgct gtagtcaatg 20
<210>95
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/+/12640引物
<400>95
ctacgacaga tgtcctgtgc 20
<210>96
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/+/12088引物
<400>96
gagcaggctg tagctaatgg 20
<210>97
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L7/+/11551引物
<400>97
ttaggctatt gttgctgctg 20
<210>98
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L8/-/13160引物
<400>98
cagacaacat gaagcaccac 20
<210>99
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L8/-/13704引物
<400>99
cgctgacgtg atatatgtgg 20
<210>100
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L8/-/14284引物
<400>100
tgcacaatga aggatacacc 20
<210>101
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L8/+/14453引物
<400>101
acatagctcg cgtctcagtt 20
<210>102
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L8/+/13968引物
<400>102
ggcattgtag gcgtactgac 20
<210>103
<211>19
<212>DNA
<213>人工序列
<220>
<223>S/L8/+/13401引物
<400>103
gtttgcggtg taagtgcag 19
<210>104
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L9/-/15098引物
<400>104
tagtggcggc tattgacttc 20
<210>105
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L9/-/15677引物
<400>105
ctaaaccttg agccgcatag 20
<210>106
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L9/-/16247引物
<400>106
catggtcata gcagcacttg 20
<210>107
<211>21
<212>DNA
<213>人工序列
<220>
<223>S/L9/+/16323引物
<400>107
ccaggttgtg atgtcactga t21
<210>108
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L9/+/15858引物
<400>108
ccttacccag atccatcaag 20
<210>109
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L9/+/15288引物
<400>109
cgcaaacata acacttgctg 20
<210>110
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/-/16914引物
<400>110
agtgttgggt acaagccagt 20
<210>111
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/-/17466引物
<400>111
gttccaagga acatgtctgg 20
<210>112
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/-/18022引物
<400>112
aggtgcctgt gtaggatgaa 20
<210>113
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/+/18245引物
<400>113
gggctgtcat gcaactagag 20
<210>114
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/+/17663引物
<400>114
tcttacacgc aatcctgctt 20
<210>115
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L10/+/17061引物
<400>115
tacccatctg ctcgcatagt 20
<210>116
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/-/18877引物
<400>116
gcaagcagaa ttaaccctca 20
<210>117
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/-/19396引物
<400>117
agcaccacct aaattgcatc 20
<210>118
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/-/20002引物
<400>118
tggtcccttt gaaggtgtta 20
<210>119
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/+/20245引物
<400>119
tcgaacacat cgtttatgga 20
<210>120
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/+/19611引物
<400>120
gaagcacctg tttccatcat 20
<210>121
<211>20
<212>DNA
<213>人工序列
<220>
<223>S/L11/+/19021引物
<400>121
acgatgctca gccatgtagt 20
<210>122
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/F3/+/800引物
<400>122
gaggtgcagt cactcgctat 20
<210>123
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/F4/+/1391引物
<400>123
cagagattgg acctgagcat 20
<210>124
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/F5/+/1925引物
<400>124
cagcaaacca ctcaattcct 20
<210>125
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/R3/-/1674引物
<400>125
aaatgatggc aacctcttca 20
<210>126
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/R4/-/1107引物
<400>126
cacgtggttg aatgactttg 20
<210>127
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L1/R5/-/520引物
<400>127
atttctgcaa ccagctcaac 20
<210>128
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/F3/+/2664引物
<400>128
cgcattgtct cctggtttac 20
<210>129
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/F4/+/3232引物
<400>129
gagattgagc cagaaccaga 20
<210>130
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/F5/+/3746引物
<400>130
atgagcaggt tgtcatggat 20
<210>131
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/R3/-/3579引物
<400>131
ctgccttaag aagctggatg 20
<210>132
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/R4/-/2991引物
<400>132
tttcttcacc agcatcatca 20
<210>133
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L2/R5/-/2529引物
<400>133
caccgttctt gagaacaacc 20
<210>134
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L3/F3/+/4708引物
<400>134
tctttggctg gctcttacag 20
<210>135
<211>20
<212>DNA
<213>人工序列
<220>
<223>SRAS/L3/F4/+/5305引物
<400>135
gctggtgatg ctgctaactt 20
<210>136
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L3/F5/+/5822引物
<400>136
ccatcaagcc tgtgtcgtat 20
<210>137
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L3/R3/-/5610引物
<400>137
caggtggtgc agacatcata 20
<210>138
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L3/R4/-/4988引物
<400>138
aacatcagca ccatccaagt 20
<210>139
<211>20
<212>DNA
<213>人工序列
<220>
<223>SARS/L3/R5/-/4437引物
<400>139
atcggacacc atagtcaacg 20
<210>140
<211>7788
<212>DNA
<213>人工序列
<220>
<223>合成S基因
<400>140
tcaatattgg ccattagcca tattattcat tggttatata gcataaatca atattggcta 60
ttggccattg catacgttgt atctatatca taatatgtac atttatattg gctcatgtcc120
aatatgaccg ccatgttggc attgattatt gactagttat taatagtaat caattacggg180
gtcattagtt catagcccat atatggagtt ccgcgttaca taacttacgg taaatggccc240
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat300
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc360
ccacttggca gtacatcaag tgtatcatat gccaagtccg ccccctattg acgtcaatga420
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttacgggact ttcctacttg480
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacac540
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt600
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaataaccc660
cgccccgttg acgcaaatgg gcggtaggcg tgtacggtgg gaggtctata taagcagagc720
tcgtttagtg aaccgtcaga tcactagaag ctttattgcg gtagtttatc acagttaaat780
tgctaacgca gtcagtgctt ctgacacaac agtctcgaac ttaagctgca gaagttggtc840
gtgaggcact gggcaggtaa gtatcaaggt tacaagacag gtttaaggag accaatagaa900
actgggcttg tcgagacaga gaagactctt gcgtttctga taggcaccta ttggtcttac960
tgacatccac tttgcctttc tctccacagg tgtccactcc cagttcaatt acagctctta 1020
aggctagagt acttaatacg actcactata ggctagcgga tccaccatgt tcatcttcct 1080
gctgttcctg accctgacca gcggcagcga cctggaccgg tgcaccacct tcgacgacgt 1140
gcaggccccc aactacaccc agcacaccag cagcatgcgg ggcgtgtact accccgacga 1200
gatctttcgg agcgacaccc tgtacctgac ccaggacctg ttcctgccct tctacagcaa 1260
cgtgaccggc ttccacacca tcaaccacac cttcggcaac cccgtgatcc ccttcaagga 1320
cggcatctac ttcgccgcca ccgagaagag caacgtggtg cggggctggg tgttcggcag 1380
caccatgaac aacaagagcc agagcgtgat catcatcaac aacagcacca acgtggtgat 1440
ccgggcctgc aacttcgagc tgtgcgacaa ccccttcttc gccgtgtcca aacccatggg 1500
cacccagacc cacaccatga tcttcgacaa cgccttcaac tgcaccttcg agtacatcag 1560
cgacgccttc agcctggacg tgagcgagaa gagcggcaac ttcaagcacc tgcgggagtt 1620
cgtgttcaag aacaaggacg gcttcctgta cgtgtacaag ggctaccagc ccatcgacgt 1680
ggtgagagac ctgcccagcg gcttcaacac cctgaagccc atcttcaagc tgcccctggg 1740
catcaacatc accaacttcc gggccatcct gaccgccttt agccctgccc aggacatctg 1800
gggcaccagc gccgccgcct acttcgtggg ctacctgaag cctaccacct tcatgctgaa 1860
gtacgacgag aacggcacca tcaccgacgc cgtggactgc agccagaacc ccctggccga 1920
gctgaagtgc agcgtgaaga gcttcgagat cgacaagggc atctaccaga ccagcaactt 1980
cagagtggtg cctagcggcg atgtggtgcg gttccccaat atcaccaacc tgtgcccctt 2040
cggcgaagtg ttcaacgcca ccaagttccc cagcgtgtac gcctgggagc ggaagaagat 2100
cagcaactgc gtggccgact acagcgtgct gtacaactcc accttcttca gcaccttcaa 2160
gtgctacggc gtgagcgcca ccaagctgaa cgacctgtgc ttcagcaacg tgtacgccga 2220
cagcttcgtg gtgaagggcg acgacgtgag acagatcgcc cctggccaga ccggcgtgat 2280
cgccgactac aactacaagc tgcccgacga cttcatgggc tgcgtgctgg cctggaacac 2340
ccggaacatc gacgccacaa gcaccggcaa ctacaattac aagtaccgct acctgcggca 2400
cggcaagctg cggcccttcg agcgggacat ctccaacgtg cccttcagcc ccgacggcaa 2460
gccctgcacc ccccctgccc tgaactgcta ctggcccctg aacgactacg gcttctacac 2520
caccaccggc atcggctatc agccctacag agtggtggtg ctgagcttcg agctgctgaa 2580
cgcccctgcc accgtgtgcg gccccaagct gagcaccgac ctgatcaaga accagtgcgt 2640
gaacttcaac ttcaacggcc tgaccggcac cggcgtgctg acccccagca gcaagcgctt 2700
ccagcccttc cagcagttcg gccgggatgt gagcgacttc accgacagcg tgcgggaccc 2760
caagaccagc gagatcctgg acatcagccc ctgcagcttc ggcggcgtgt ccgtgatcac 2820
ccccggcacc aacgccagca gcgaagtggc cgtgctgtac caggacgtga actgcaccga 2880
cgtgagcacc gccatccacg ccgaccagct gacccccgcc tggcggatct acagcaccgg 2940
gaacaacgtg ttccagaccc aggccggctg cctgatcggc gccgagcacg tggacaccag3000
ctacgagtgc gacatcccca ttggcgccgg aatctgcgcc agctaccaca ccgtgagcct3060
gctgcggagc accagccaga agtccatcgt ggcctacacc atgagcctgg gcgccgacag3120
cagcatcgcc tacagcaaca acaccatcgc catccccacc aacttcagca tctccatcac3180
caccgaagtg atgcccgtga gcatggccaa gacaagcgtg gattgcaaca tgtacatctg3240
cggcgacagc accgagtgcg ccaacctgct gctgcagtac ggcagcttct gcacccagct3300
gaaccgggcc ctgagcggca tcgccgccga gcaggaccgg aacaccagag aagtgttcgc3360
ccaagtgaag cagatgtata agacccccac cctgaagtac ttcgggggct tcaacttctc3420
tcagatcctg cccgaccctc tgaagcccac caagcgctcc ttcatcgagg acctgctgtt3480
caacaaagtg accctggccg acgccggctt tatgaagcag tacggcgagt gcctgggcga3540
catcaacgcc cgggacctga tctgcgccca gaagtttaac gggctgaccg tgctgccccc3600
cctgctgacc gacgacatga tcgccgccta tacagccgcc ctggtgagcg gcaccgccac3660
cgccggctgg accttcggag ccggagccgc cctgcagatc cccttcgcca tgcagatggc3720
ctaccggttc aacggcatcg gcgtgaccca gaacgtgctg tacgagaacc agaagcagat3780
cgccaaccag ttcaacaagg ccatcagcca gatccaggag agcctgacca caaccagcac3840
cgccctgggc aagctgcagg acgtggtgaa ccagaacgcc caggccctga acaccctggt3900
gaagcagctg agcagcaact tcggcgccat cagctctgtg ctgaacgaca tcctgagcag3960
gctggacaaa gtggaggccg aagtgcagat cgaccggctg atcaccggac gcctgcagtc4020
cctgcagacc tacgtgaccc agcagctgat cagagccgcc gagatccggg ccagcgccaa4080
tctggccgcc accaagatga gcgagtgcgt gctgggccag agcaagagag tggacttctg4140
cggcaagggc tatcacctga tgagcttccc ccaggccgcc ccccacggcg tggtgttcct4200
gcacgtgacc tacgtgccta gccaggagcg gaacttcacc accgccccag ccatctgcca4260
cgagggcaag gcctacttcc cccgggaggg cgtgttcgtg tttaacggca ccagctggtt4320
catcacccag cgcaacttct tcagccccca gatcatcacc acagacaaca ccttcgtgtc4380
cggcaactgt gatgtggtga tcggcatcat caataacacc gtgtacgacc ccctgcagcc4440
cgagctggac agcttcaagg aggagctgga caaatacttc aagaaccaca cctcccccga4500
cgtggacctg ggcgatatca gcggcatcaa cgcctccgtg gtgaacatcc agaaggagat4560
cgacagactg aacgaagtgg ccaagaacct gaacgagagc ctgatcgacc tgcaggagct4620
gggcaagtac gagcagtaca tcaagtggcc ctggtacgtg tggctgggct tcatcgccgg4680
cctgatcgcc atcgtgatgg tgaccatcct gctgtgctgc atgaccagct gctgtagctg4740
cctgaaaggc gcctgcagct gtggcagctg ctgcaagttc gacgaggacg acagcgagcc4800
cgtgctgaag ggcgtgaagc tgcactacac ctgataactc gagaattcac gcgtggtacc4860
tctagagtcg acccgggcgg ccgcttcgag cagacatgat aagatacatt gatgagtttg4920
gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt tgtgatgcta4980
ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac aattgcattc5040
attttatgtt tcaggttcag ggggagatgt gggaggtttt ttaaagcaag taaaacctct5100
acaaatgtgg taaaatcgat aaggatccgg gctggcgtaa tagcgaagag gcccgcaccg5160
atcgcccttc ccaacagttg cgcagcctga atggcgaatg gacgcgccct gtagcggcgc5220
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct5280
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg5340
tcaagctcta aatcgggggc tccctttagg gttccgattt agagctttac ggcacctcga5400
ccgcaaaaaa cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt5460
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg5520
aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc5580
ggcctattgg ttaaaaaatg agctgattta acaaatattt aacgcgaatt ttaacaaaat5640
attaacgttt acaatttcgc ctgatgcggt attttctcct tacgcatctg tgcggtattt5700
cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagc5760
cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc ccggcatccg5820
cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt tcaccgtcat5880
caccgaaacg cgcgagacga aagggcctcg tgatacgcct atttttatag gttaatgtca5940
tgataataat ggtttcttag acgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc6000
ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct6060
gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg6120
cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg6180
tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc6240
tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca6300
cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac6360
tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa6420
agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg6480
ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt6540
ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg6600
aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc6660
gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga6720
tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta6780
ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc6840
cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg6900
atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt6960
cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa7020
ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt7080
cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt7140
ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt7200
tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga7260
taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag7320
caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata7380
agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg7440
gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga7500
gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca7560
ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagcrt ccagggggaa7620
acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt7680
tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttsc7740
ggttcctggc cttttgctgg ccttttgctc acatggctcg acagatct 7788
<210>141
<211>23
<212>DNA
<213>人工序列
<220>
<223>SNE-S1引物
<400>141
ggttgggatt atccaaaatg tga 23
<210>142
<211>24
<212>DNA
<213>人工序列
<220>
<223>SNE-AS1引物
<400>142
gcatcatcag aaagaatcat catg 24
<210>143
<211>21
<212>DNA
<213>人工序列
<220>
<223>SAR1-S引物
<400>143
cctctcttgt tcttgctcgc a21
<210>144
<211>21
<212>DNA
<213>人工序列
<220>
<223>SAR1-AS引物
<400>144
tatagtgagc cgccacacat g 21
<210>145
<211>45
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>145
ataggatcca ccatgtttat tttcttatta tttcttactc tcact45
<210>146
<211>37
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>146
atactcgagt tatgtgtaat gtaatttgac acccttg 37
<210>147
<211>45
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>147
ataggatcca ccatgtttat tttcttatta tttcttactc tcact45
<210>148
<211>36
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>148
acctccggat ttaatatatt gctcatattt tcccaa 36
<210>149
<211>13
<212>PRT
<213>人工序列
<220>
<223>N-terminal end of SRAS-CoV S protein(amino acids 1 to 13)
<400>149
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly
1 5 10
<210>150
<211>10
<212>PRT
<213>人工序列
<220>
<223>寡肽
<400>150
Ser Gly Asp Tyr Lys Asp Asp Asp Asp Lys
1 5 10
<210>151
<211>34
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>151
actagctagc ggatccacca tgttcatctt cctg34
<210>152
<211>33
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>152
agtatccgga cttgatgtac tgctcgtact tgc 33
<210>153
<211>59
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>153
tatgagcttt tttttttttt tttttttggc atataaatag actcggcgcg ccatctgca59
<210>154
<211>53
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>154
gatggcgcgc cgagtctatt tatatgccaa aaaaaaaaaa aaaaaaaagc tca 53
<210>155
<211>45
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>155
atacgtacga ccatgtttat tttcttatta tttcttactc tcact45
<210>156
<211>40
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>156
atagcgcgct cattatgtgt aatgtaattt gacacccttg 40
<210>157
<211>20
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>157
ccatttcaac aatttggccg20
<210>158
<211>45
<212>DNA
<213>人工序列
<220>
<223>PCR引物
<400>158
ataggatccg cgcgctcatt atttatcgtc gtcatcttta taatc4权利要求
1.一种分离的和纯化的蛋白或多肽,其特征在于它是含有序列SEQID No3的S蛋白、S蛋白胞外结构域或S蛋白胞外结构域片段。
2.根据权利要求1的蛋白或多肽,其特征在于它由对应于S蛋白氨基酸序列1至1193位的氨基酸组成。
3.根据权利要求1的蛋白或多肽,其特征在于它由对应于S蛋白氨基酸序列14至1193位的氨基酸组成。
4.根据权利要求1的分离的蛋白或多肽,其特征在于它由对应于S蛋白氨基酸序列475至1193位的氨基酸组成。
5.一种核酸,所述核酸编码根据权利要求1至4任一项的蛋白或多肽。
6.根据权利要求4的核酸,其特征在于它包括编码SEQ ID No5的序列或编码SEQ ID No6的序列。
7.一种重组表达载体,其特征在于它编码根据权利要求1至4任一项的蛋白或多肽。
8.根据权利要求7的重组表达载体,其特征在于它选自在法国微生物保藏中心(CNCM),25 rue du Docteur Roux,75724 Paris Cedex
15保藏的下列细菌菌株中所包含的载体
a)菌株编号NoI-3118,保藏日期2003年10月23日,
b)菌株编号NoI-3019,保藏日期2003年5月12日,
c)菌株编号NoI-3020,保藏日期2003年5月12日,
d)菌株编号NoI-3059,保藏日期2003年6月20日,
e)菌株编号NoI-3323,保藏日期2004年11月22日,
f)菌株编号NoI-3324,保藏日期2004年11月22日,
g)菌株编号NoI-3326,保藏日期2004年12月1日,
h)菌株编号NoI-3327,保藏日期2004年12月1日,
i)菌株编号NoI-3332,保藏日期2004年12月1日,
j)菌株编号NoI-3333,保藏日期2004年12月1日,
k)菌株编号NoI-3334,保藏日期2004年12月1日,
l)菌株编号NoI-3335,保藏日期2004年12月1日,
m)菌株编号NoI-3336,保藏日期2004年12月1日,
n)菌株编号NoI-3337,保藏日期2004年12月1日,
o)菌株编号NoI-3338,保藏日期2004年12月2日,
p)菌株编号NoI-3339,保藏日期2004年12月2日,
q)菌株编号NoI-3340,保藏日期2004年12月2日,和
r)菌株编号NoI-3341,保藏日期2004年12月2日。
9.一种核酸,所述核酸包含了合成基因以使得S蛋白在真核细胞中获得最佳表达,其特征在于它含有SEQ ID No140序列。
10.一种表达载体,所述表达载体包括根据权利要求9的核酸,其特征在于它包含于在2004年12月1日保藏于CNCM编号为I-3333的细菌菌株中。
11.根据权利要求7或9的表达载体,其特征在于它是病毒颗粒形式或重组基因组形式的病毒载体。
12.根据权利要求11的载体,其特征在于它是重组病毒颗粒或重组病毒基因组,并能够通过将权利要求8的g)、h)或k)至r)段的质粒转染至合适的细胞系统中而得到。
13.一种慢病毒载体,所述慢病毒载体编码根据权利要求1至4任一项的多肽。
14.一种重组麻疹病毒,所述病毒编码根据权利要求1至4任一项的多肽。
15.一种重组牛痘病毒,所述病毒编码根据权利要求1至4任一项的多肽。
16.根据权利要求8的d)至p)段的载体或根据权利要求10的载体用于在真核细胞系统中生产SARS相关联冠状病毒S蛋白或该蛋白的片段的用途。
17.一种在真核细胞系统中生产S蛋白的方法,所述方法包括用载体转染培养的真核细胞的步骤,所述载体选自包含于权利要求8的d)至p)段中提及的细菌菌株或根据权利要求10的载体。
18.一种基因修饰的真核细胞,所述细胞表达根据权利要求1至4任一项的蛋白或多肽。
19.根据权利要求18的细胞,所述细胞能够通过用权利要求8的k)至n)段提及的任意一个载体转染而得到。
20.根据权利要求19的细胞,其特征在于它是2004年11月22日保藏于CNCM的编号为I-3325的FRhK4-Ssol-30细胞。
21.一种单克隆抗体,所述抗体识别SARS相关联冠状病毒的天然S蛋白。
22.根据权利要求1至4任一项的蛋白或多肽或根据权利要求21的抗体在从生物样本中检测SARS相关联冠状病毒感染中的用途。
23.一种从生物样本中检测SARS相关联冠状病毒的方法,其特征在于该检测通过ELISA进行,所述ELISA使用在真核细胞系统中表达的重组S蛋白或其胞外结构域或其胞外结构域的片段。
24.根据权利要求23的检测方法,另外还包括使用重组N蛋白的ELISA的检测步骤。
25.根据权利要求23或24的方法,其特征在于它是双表位ELISA方法,并且还将待测血清与可视化抗原相混合,然后将所述混合物与附着于固相支持物的抗原相接触。
26.一种免疫复合物,由根据权利要求21的单克隆抗体或抗体片段和SARS相关联冠状病毒的蛋白质或肽组成。
27.一种免疫复合物,由根据权利要求1至4任一项的蛋白或多肽和特异性针对SARS相关联冠状病毒的表位的抗体组成。
28.一种SARS相关联冠状病毒检测试剂盒,其特征在于它包括至少一种选自下述的试剂根据权利要求1至4任一项的蛋白或多肽、根据权利要求5或6任一项的核酸、根据权利要求18至20任一项的细胞或根据权利要求21的抗体。
29.一种免疫原性和/或疫苗组合物,其特征在于它包括从真核表达系统中获得的根据权利要求1至4任一项的重组蛋白或多肽。
30.一种免疫原性和/或疫苗组合物,其特征在于它包括根据权利要求7、8和10至15任一项的重组载体或病毒。
31.一种病毒来源的核酸插入物,其特征在于它包含于权利要求8的a)至h)段和k)至r)段提及的任意一个菌株中。
全文摘要
本发明涉及由严重急性呼吸综合征(SARS)相关联冠状病毒的分离的或纯化的病毒株的基因组编码的蛋白质或肽的用途,该病毒株源自一个记录号为031589的样本,具体而言为S蛋白及其衍生的抗体作为诊断试剂和疫苗的用途。
文档编号G01N33/569GK1938420SQ20048004125
公开日2007年3月28日 申请日期2004年12月2日 优先权日2003年12月2日
发明者S·范德沃夫, N·埃斯克里奥, B·克瑞森佐-钱格尼, J-C·马努格拉, F·孔斯特, B·卡伦德特, J-M·贝滕, V·洛林, S·杰尔鲍德, M·伯尔基埃 A, S·阿泽比, P·查尼奥, F·坦吉, C·库姆布雷迪特, J-F·德拉格尼奥, M·马丁 申请人:巴斯德研究所, 国家科研中心, 巴黎第七大学