专利名称:使用肽和核酸组合物诱导针对乙型肝炎病毒的细胞免疫应答的制作方法
联邦政府赞助的研究和发展本发明部分由美国政府的国立卫生研究院基金提供资助。美国政府享有本发明的某些权力。
索引I.发明背景II.发明概述III.附图简述IV.发明详述A.定义B.对抗HBV的CTL和HTL应答的刺激C.肽表位对HLA分子的结合亲和力D.肽表位结合基元和超基元1.HLA-A1超基元2.HLA-A2超基元3.HLA-A3超基元4.HLA-A24超基元5.HLA-B7超基元6.HLA-B27超基元7.HLA-B44超基元8.HLA-B58超基元9.HLA-B62超基元10.HLA-A1基元11.HLA-A2.1基元
12.HLA-A3基元13.HLA-All基元14.HLA-A24基元15.HLA-DR-1-4-7超基元16.HLA-DR3基元E.增强疫苗的人群覆盖度F.免疫应答刺激性肽类似物G.在疾病相关抗原的蛋白序列中计算机筛选含超基元或基元的肽H.肽表位的制备I.检测T细胞应答的试验J.使用肽表位估计免疫应答K.疫苗组合物1.小基因疫苗2.CTL肽与辅助细胞肽的组合L.为治疗或预防目的给予疫苗M.试剂盒V.实施例VI.权利要求VII.摘要I.发明背景乙型肝炎病毒(HBV)引起的慢性感染影响着世界人口的至少5%,是肝硬化和肝细胞癌的主要原因(Hoofnagle,J.,N.Engl.J.Med.323337,1990;Fields,B.和Knipc,D.,InFieldsVirology 22137,1990)。世界卫生组织将乙型肝炎列为全世界死亡的重要原因,紧跟慢性肺病之后,比AIDS更流行。慢性HBV感染可包括从无症状携带者到持续肝细胞坏死和炎症,并可导致肝细胞癌。
据信对HBV的免疫应答在控制乙型肝炎感染中起着重要作用。已经鉴定了对HBV不同区域,包括核壳核心,聚合酶和表面抗原的各种体液和细胞反应。据信T细胞介导的免疫,尤其包括I类人白细胞抗原限制性细胞毒性T淋巴细胞(CTL),在对抗已经建立的HBV感染中起着决定性作用。
I类人白细胞抗原(HLA)分子在几乎所有有核细胞的表面表达。CTL识别各种抗原细胞内加工得到的与I类HLA分子形成复合体形式的肽片段。这个识别事件接着直接引起携载HLA-肽复合体的细胞破坏或活化抑制病毒复制的非破坏机制,如产生干扰素。
几个研究强调自限性急性肝炎和多特异性CTL反应之间的关联(Penna,A.等,J.Exp.Med.1741565,1991;Nayersina,R.等,J.Immunol.1504659,1993)。自发的和干扰素相关的慢性HBV感染的清除也与有力的CTL反应重现相关联(Guidotti,L.G.等,Proc.Natl.Acad.Sci.USA 913764,1994)。在所有这种情况下,CTL反应是多克隆的,且对多种病毒蛋白包括HBV包膜,核心和聚合酶抗原有特异性。相比之下,慢性肝炎患者中,通常缺乏CTL活性或这种活性微弱,且抗原上受限。
使用HBV转基因小鼠的研究已经进一步强调了CTL在HBV感染消散中的决定性作用。HBV特异性CTL过继转移给HBV基因组转基因小鼠引起病毒复制的抑制。这个作用主要是由非裂解性的基于淋巴因子的机制介导的(Guidotti,L.G.等,Proc.Natl.Acad.Sci.USA913764,1994;Guidotti,L.G.,Guilhot,S.,和Chisari,F.V.J.Virol.681265,1994;Guidotti,L.G.等,J.Virol.696158,1995;Gilles,P.N.,Fey,G.,和Chisari,F.V.,J.Virol.663955,1992)。
正如I类HLA限制的反应的情况,II类HLA限制的T细胞反应通常在急性肝炎患者中检测到,且在慢性感染患者中缺乏或微弱。(Chisari,F.V.和Ferrari,C.,Annu.Rev.Immunol.1329,1995)。II类HLA反应依附于活化辅助T细胞(HTLs)。辅助T淋巴细胞,它们识别II类HLA分子,可通过分泌抑制病毒复制的细胞因子而直接有助于HBV感染的清除(Franco,A.等,J.Immunol.1592001,1997)。然而,据信它们在疾病消散中的主要作用是通过诱导病毒特异性CTL和B细胞的活化和扩充而介导的。
鉴于HBV感染观察到的多相免疫应答,看来诱导同时对抗多种表位的多特异性免疫发应对于抗HBV有效疫苗的发展很重要。需要建立引起相当于清除HBV感染的患者中见到的应答的免疫应答的疫苗方案。基于表位的疫苗看来有用。
一旦开发了适当技术,基于表位的疫苗的使用具有优于目前疫苗的几个优点。为了降低逃避突变体的可能性,在这种疫苗中包含的表位将从病毒或肿瘤关联抗原的保守区选择。基于表位的方法相对于使用完整抗原的优点是有对完整抗原的免疫应答大多针对抗原的可变区,允许由于突变造成的免疫逃避的证据。此外,使用基于表位的疫苗可避免完整抗原中可能存在的免疫抑制表位。
另外,在基于表位的疫苗方法中,能够组合所选择的表位(CTL和HTL)并另外修饰表位组成达到例如增强免疫原性。因此,针对靶疾病,可以适当地对免疫应答进行调节。传统方法不可能进行类似的应答改造。
基于表位的免疫刺激性疫苗的另一个主要益处是它们的安全性。消除了可能具有自身内在生物活性的传染物或完整蛋白抗原可能引起的病理副作用。
基于表位的疫苗也提供了指向和聚焦于针对多种从相同病原体选择的抗原的免疫应答的能力。因此,疫苗组合物中包含来自所述病原体的多种抗原的表位可以减弱患者与患者间对特定病原体的免疫应答的可变性。“病原体”可以是传染物或肿瘤相关分子。
然而,广泛有效的基于表位的免疫疗法发展的最大障碍之一是HLA分子的极度多态性。迄今为止,有效的无遗传学偏倚性的人群覆盖度(population coverage)一直是相当复杂的任务,这种覆盖需要使用的表位对对应于每个个体HLA等位基因的HLA分子是特异性的,因此,为了覆盖人种不同的人群,将不得不使用不切实际的大量表位。已经存在开发被多种HLA抗原分子结合的肽表位用于基于表位的疫苗的需要。结合的HLA抗原分子数量越大,疫苗的人群覆盖宽度就越大。
此外,如这里更详细描述的,存在调节肽结合性能的需要,例如使得结合多种HLA抗原的肽可以做到这些,而且亲和力将刺激免疫应答。以与免疫原性相关的亲和力而受限于一个以上HLA等位基因的表位的鉴定,对于提供全面人群覆盖并允许引发足够活力的应答,由此在不同人群中诱导在自限性急性肝炎中观察到的,或慢性HBV感染自发清除的自然免疫应答很重要。这种应答也可以对准广泛表位阵列。这里公开的技术提供了这种有益的免疫应答。
这个部分提供的信息旨在公开本申请申请日之时本领域目前的理解的现有技术。本申请优先权日之后产生的信息也包含在这个部分。因此,这个部分的背景不意欲以任何方式划定本发明的优先权日。II.发明概述本发明将我们关于抗原被T细胞识别的机制的知识应用于例如开发针对HBV的基于表位的疫苗。更具体的是,本申请传达了我们关于特异表位药物组合物和用于HBV感染的预防和治疗的方法的发现。
在适当技术开发后,基于表位的疫苗的使用具有优于目前疫苗的几个优点,尤其是与在疫苗组合物中使用完整抗原进行比较时。有证据表明对完整抗原的免疫应答大多针对抗原的可变区,允许由于突变造成的免疫逃避。基于表位的疫苗中包含的表位选自病毒或肿瘤关联抗原的保守区,由此降低逃避突变体的可能性。此外,使用基于表位的疫苗可避免完整抗原中可能存在的免疫抑制性表位。
基于表位的疫苗方法另外的优点是能够组合所选择的表位(CTL和HTL),并进一步修饰表位组成达到例如增强免疫原性。因此,针对靶疾病,可以适当地对免疫应答进行调节。传统方法不可能对应答进行类似的改造。
基于表位的免疫刺激性疫苗的另一个主要益处是它们的安全性。消除了可能具有自身内在生物活性的传染物或完整蛋白抗原可能引起的病理副作用。
基于表位的疫苗也提供了指导和聚焦于针对多种从相同病原体选择的抗原的免疫应答的能力。因此,疫苗组合物中包含来自所述病原体的多种抗原的表位可以减轻患者与患者间对特定病原体的免疫应答的可变性。“病原体”可以是传染物或肿瘤关联分子。
然而,广泛有效的基于表位的免疫疗法的发展的最大障碍之一是HLA分子的极度多态性。迄今为止,有效的无遗传学偏倚性的人群覆盖已经成为相当复杂的任务,这种覆盖需要使用的表位对对应于每个个体HLA等位基因的HLA分子是特异性的,因此,为了覆盖人种不同的人群,将不得不使用不切实际的大量表位。已经存在开发被多种结合的HLA抗原分子肽表位用于基于表位的疫苗的需要。结合的HLA抗原分子数量越大,疫苗的人群覆盖宽度就越大。
此外,如这里更详细描述的,存在调节肽结合性能的需要,例如使得能结合多种HLA抗原的肽可以以将刺激免疫应答的亲和力进行这种结合。以与免疫原性相关的亲和力而限制于一个以上HLA等位基因的表位的鉴定对于提供全面人群覆盖并允许引发足够强的反应,以在不同人群中预防或清除感染很重要。这种反应也可以对准广泛的表位阵列。这里公开的技术提供了这种有益的免疫应答。
在一个优选的实施方案中,本发明疫苗组合物中包含的表位是用评估已知抗原的蛋白序列中基元或超基元携载表位的存在的方法选择的。然后合成相当于基元或超基元携载表位的肽并测试其与识别所选基元的HLA分子结合的能力。进一步评估以中等或高亲和力结合,即对I类HLA分子以500nM或更低的IC50(或KD值)或对II类HLA分子以1000nM或更低的IC50结合的那些肽诱导CTL或HTL反应的能力。选择免疫原性肽用来包含在疫苗组合物中。
另外可以测试超基元携载肽结合HLA超型(supertype)家族内多种等位基因(alleles)的能力。而且,可以模拟肽表位来改变结合亲和力和/或结合HLA超型内的多种等位基因的能力。
本发明也包括一种实施方案,它包括监测HBV疫苗在具有已知HLA类型的患者中的免疫原性活性,该方法包括将来自患者的T淋巴细胞样品与含基本上由表VI至表XX或表XXII所述的氨基酸序列组成的、结合所述患者中存在的至少一个HLA等位基因之产物的HBV表位的肽组合物共同培养,和检测与该肽结合的T淋巴细胞的存在。在一个优选的实施方案中,该肽包括四聚体复合体。
定义本发明肽的可供选择的形式是描述物理性质,如长度;一级,可能的二级和/或三级结构;或电荷,它与对特定等位基因特异性HLA分子或等位基因特异性HLA分子组的结合有关。定义肽的另一个形式是列举HLA结合袋的物理性质,或几种等位基因特异性HLA结合袋共同具有的性质(如袋构型和电荷分布)和说明该肽适合和结合所述袋。
如从下面的讨论中将很显然的,本发明也包含其它方法和实施方案。此外,这里描述的任何方法制备的新合成肽也是本发明的一部分。III.附图简述
图1提供了平均人群中基因型总频率作为HLA-A和B分子结合的HBV候选表位数量的函数的图。
图2图解了实验模型小基因构建体中肽表位的位置。IV.发明详述本发明的肽和相应核酸组合物可用于通过刺激产生CTL或HTL反应刺激针对HBV的免疫应答。该肽,直接或间接来自天然HBV氨基酸序列,能够结合HLA分子并刺激对HBV的免疫应答。HBV的完整多蛋白序列及其变异体可从Genbank得到。如从下面公开将清楚知晓的,从随后发现的迄今未知HBV变异体的序列信息也可以很容易确定肽。
如下面将讨论的,很多方法已经鉴定了本发明的肽。此外,已经衍生出类似肽并且通过改变特定氨基酸残基产生显示免疫原性改变的肽类似物而调节与HLA分子的结合活性。此外,本发明提供了组合物和组合物的组合,使得能够与多种HLA抗原相互作用的基于表位的疫苗可提供比已有疫苗更广泛的人群覆盖度。
IV.A.定义参考下列按字母顺序列出的定义可更好理解本发明。
“计算机”或“计算机系统”通常包括处理器;至少一个信息存储/取回装置如,例如,硬盘驱动器,磁盘驱动器或磁带驱动器;至少一个输入装置如,例如,键盘,鼠标,触感屏或麦克风;和显示结构。另外,该计算机可以包括与网络联系的通信信道。这种计算机可以包括多于或少于上面所列的内容。
这里使用的“构建体”通常表示自然不存在的成分。通过合成技术可制备构建体,如重组DNA制备和表达或核酸或氨基酸的化学合成技术。构建体也可以通过一个物质与另一个物质的添加或连接使得不能在自然中找到那种形式的结果而制备。
“交叉反应性结合”是指肽被一个以上HLA分子结合;同义词是简并结合。
“隐蔽肽”通过用分离的肽免疫而引发应答,但是当包含该表位的完整蛋白用作抗原时,该应答不是体外交叉反应性的。
“优势表位”是用完整天然抗原免疫时诱导免疫应答的表位(如见Sercarz,等,Annu.Rev.Immunol.11729-766,1993)。这种应答与分离的肽表位有体外交叉反应。
关于特定氨基酸序列,“表位”是一组氨基酸残基,它参与被特定免疫球蛋白识别,或在T细胞背景下,是T细胞受体(TCR)蛋白和/或主要组织相容性复合体(MHC)受体识别所必需的那些残基。在免疫系统环境下,无论体内或体外,表位是分子的集合特征,如一级,二级和三级肽结构,和电荷,它们一起形成免疫球蛋白,TCR或HLA分子识别的位点。在这公开的内容中,表位和肽常可相互交换使用。
可领会到包含本发明表位以及另外的氨基酸的蛋白或肽分子仍在本发明的范围内。在某些实施方案中,对本身不是构建体的本发明肽的长度存在限制。当包含本发明表位的蛋白/肽包含与天然序列有100%等同性的区域(即连续氨基酸串)时,出现长度受限的实施方案。为了避免表位的定义例如在完整天然分子上解读,与天然肽序列具有100%等同性的任何区域的长度都有限制。因此,对于包含本发明表位和与天然肽序列100%等同的区域的肽(本身不是构建体),与天然序列100%等同的区域通常具有如下长度小于或等于600个氨基酸,常常小于或等于500个氨基酸,常常小于或等于400个氨基酸,常常小于或等于250个氨基酸,常常小于或等于100个氨基酸,常常小于或等于85个氨基酸,常常小于或等于75个氨基酸,常常小于或等于65个氨基酸,常常小于或等于50个氨基酸。在某些实施方案中,本发明的“表位”包含在具有与天然肽序列100%等同的不到51个氨基酸的区域的肽中,该区域的长度可以以任何增量(49,48,47,46,45,44,43,42,41,40,39,38,37,36,35,34,33,32,31,30,29,28,27,26,25,24,23,22,21,20,19,18,17,16,15,14,13,12,11,10,9,8,7,6,5)下降到5个氨基酸。
因此,长于600个氨基酸的肽或蛋白序列在本发明的范围内,只要它们不包含与天然肽序列100%等同超过600个氨基酸的任何连续序列(如果它们本身不是构建体)。对于具有五个或更少对应于天然序列连续残基的任何肽,为了落入本发明的范围内,对于那个肽的最大长度没有限制。目前优选CTL表位少于600个残基长,以任何增量下降到八个氨基酸残基。
“人白细胞抗原”或“HLA”是人I类或II类主要组织相容性复合体(MHC)蛋白(见Stites,等,IMMUNOLOGY,第8版,LangePublishing,Los Altos,CA(1994)。
这里使用的“HLA超型(supertype)或家族”描述基于共同的肽结合特异性分类的HLA分子组。对携带某些氨基酸基元的肽共有少许类似的结合亲和力的I类HLA分子归类为HLA超型。术语HLA超家族,HLA超型家族和HLA xx样超型分子(其中xx代表特定HLA型)是同义词。
在这里公开的内容中,结果以术语“IC50”表示。IC50是结合试验中,观察到参照肽结合50%抑制的肽浓度。给定试验进行的条件(即限制HLA蛋白和标记的肽浓度),这些值接近KD值。PCT公开号WO94/20127和WO94/03205等中详细描述了确定结合的试验。应该注意的是,如果试验条件被改变,IC50值可以改变,常常是巨大的改变,这依赖于使用的特定试剂(如HLA制剂等)。例如,HLA分子浓度过高将增加给定配体的表观测定的IC50。
可供选择地,结合可相对于参照肽来表示。尽管由于特定试验更高或更低敏感,测试的肽的IC50可以多少改变,但相对于参照肽的结合将改变不明显。例如,在使得参照肽IC50增加10倍的条件下进行的试验中,测试肽的IC50值也将变化大约10倍。因此,为了避免不明确,肽是否是很好,中等,微弱或负的结合剂的估计通常基于其相对于标准肽IC50的IC50。
也可以使用其它试验系统测定结合,包括使用以下物质或方法的那些系统活细胞(如Ceppellini等,Nature 339392,1989;Christnick等,Nature35267,1991;Busch等,Immunol.2443,1990;Hill等,J.Immunol.147189,1991;del Guercio等,J.Immunol.154685,1995),采用去污剂裂解物的无细胞系统(如,Cerundolo等,J.Immunol.212069,1991),固定的纯化MHC(如Hill等,J.Immunol.152,2890,1994;Marshal等,J.Immunol.1524946,1994),ELISA系统(如Reay等,EMBOJ.112829,1992),表面等离子体共振(如Khilko等,J.Biol.Chem.26815425,1993);高流量可溶相试验(Hammer等,J.Exp.Med.1802353,1994),和I类MHC稳定化或装配测定(如Ljunggren等,Nature 346476,1990;Schumacher等,Cell 62563,1990;Townsend等,Cell62285,1990;Parker等,J.Immunol.1491896,1992)。
这里使用的对于I类HLA分子的“高亲和力”定义为以50nM或更低的IC50或KD值结合,“中等亲和力”是以约50和约500nM之间的IC50或KD值结合。对于结合II类HLA分子的“高亲和力”定义为l00nM或更低的IC50或KD值结合,“中等亲和力”是以约100和约1000nM之间的IC50或KD值结合。
在两个或更多肽序列的上下文中,术语“等同”或百分比“等同性”是指当在比较窗口比较和比对最大对应性时,使用序列比较算法或人工比对和肉眼观察测定,相同或具有指明百分比相同氨基酸残基的两个或更多序列或亚序列。
“免疫原性肽”或“肽表位”是包含等位基因特异性基元或超基元,使得肽会结合HLA分子并诱导CTL和/或HTL反应的肽。因此,本发明的免疫原性肽能够结合适当HLA分子,其后诱导针对衍生出免疫原性肽的抗原的细胞毒性T细胞反应,或辅助T细胞反应。
短语“分离的”或“生物学纯”是指实质上或基本上不含其天然状态发现的正常伴随该物质的成分的物质。因此,优选按照本发明的分离的肽不含有在其原始环境中正常伴随肽的物质。
“连接”或“结合”是指本领域已知的功能性地连接肽的任何方法,包括但不限于重组融合,共价键接,二硫键键接,离子键键接,氢键键接和静电键键接。
“主要组织相容性复合体”或“MHC”是在控制负责生理免疫应答的细胞相互作用中起作用的一簇基因。在人类中,MHC复合体也称HLA复合体。对于MHC和HLA复合体的详细描述参见Paul,FUNDAMENTAL IMMUNOLOGY,第3版,Raven Press,New York,1993。
术语“基元”是指在确定长度的肽中残基的模式,对于I类HLA基元,通常为约8至约13个氨基酸的肽,对于II类HLA基元,通常为约6至约25个氨基酸的肽,所述肽被特定HLA分子识别。典型地,对于每个人HLA等位基因编码的每个蛋白,肽基元不同,且一级和二级固定残基的模式不同。
“负结合残基”或“有害残基”是如果存在于肽表位的某些位置(典型地不是一级固定位置),将引起肽对肽相应HLA分子的结合亲和力降低的氨基酸。不是“有害”的任何残基是“无害”残基。
“非天然”序列或“构建体”是指天然未发现的序列,即“非天然存在的”。这种序列包括,例如脂化或其它修饰的肽和含有天然蛋白序列中不相邻的表位的多表位组合物。
在本说明书中,术语“肽”与“寡肽”可交换使用,指典型地通过相邻氨基酸的氨基和羧基之间的肽键彼此连接的一系列残基,典型地是L氨基酸。在一些实施方案中,本发明优选的CTL诱导性寡肽的长度是13个残基或更少,通常由约8个至约11个残基,优选9个或10个残基组成。在一些实施方案中,优选的HTL诱导性寡肽长度少于约50个残基,通常由约6至约30个残基组成,更常约12至25个,常常是约15至20个残基。
“药物可接受的”是指一般无毒,惰性和生理相容的成分。
“一级固定残基(primary anchor residue)”是沿肽序列特定位置的氨基酸,它提供免疫原性肽和HLA分子之间的接触点。长度限定的肽内一至三个,通常是两个一级固定残基一般定义免疫原性肽的“基元”。这些残基被理解为适应与HLA分子的肽结合沟密切接触,他们的侧链埋藏在结合沟本身的特殊袋中。在一个实施方案中一级固定残基位于按照本发明的九残基肽的第2位(从氨基末端位置开始)和羧基末端位置。表I列出了每个基元和超基元的一级固定位置。例如,通过改变这些一级固定位置中特定残基的存在或缺乏可产生类似肽。这种类似物用于精细地调节包含特定基元或超基元的肽的结合亲和力。
“混杂识别”是在多HLA分子背景下由相同T细胞克隆识别不同肽的情形。混杂结合是交叉反应性结合的同义词。
“保护性免疫应答”或“治疗性免疫应答”是指针对来自传染物的抗原或肿瘤抗原的CTL和/或HTL应答,它预防或至少部分阻止疾病症状或进展。免疫应答也可以包括辅助T细胞刺激所推动的抗体应答。
术语“残基”是指通过酰胺键或酰胺键模拟物掺入到寡肽中的氨基酸或氨基酸模拟物。
“二级固定残基(Secondary anchor residue)”是在肽中处于一级固定位置以外的位置的氨基酸,它可能影响肽结合。二级固定残基在结合肽中以比在一个位置氨基酸随机分布所期望的明显高的频率出现。称二级固定残基出现在“二级固定位置”。二级固定残基可鉴定为在高亲和力结合肽中以更高频率出现的残基或以其它方式与高亲和力结合关联的残基。例如,通过改变这些二级固定位置中特定残基的存在或缺乏可产生类似肽,这种类似物用于精细地调节包含特定基元或超基元的肽的结合亲和力。
“亚优势表位”是对包含该表位的完整抗原免疫很少或不激发应答的表位,但是用分离肽免疫可获得应答,而且当整个蛋白用于体外或体内回忆该应答时可检测到这个应答(不像隐蔽表位的情况)。
“超基元(supermotif)”是由两个或更多HLA等位基因编码的HLA分子共有的肽结合特异性。优选携带超基元的表位被两个或更多HLA抗原以高或中等亲和力(如这里定义的)识别。
“合成肽”是指用化学合成或重组DNA技术等方法人工制备的肽。
这里使用的“疫苗”是含有本发明一个或更多肽的组合物。根据本发明,有很多疫苗的实施方案,如一个或更多肽的混合物;多表位肽包含的本发明一个或更多表位;或编码这种肽或多肽的核酸,如编码多表位肽的小基因。“一个或更多肽”可以包括1-150的任何整数,如至少2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,45,50,55,60,65,70,75,80,85,90,95,100,105,110,115,120,125,130,135,140,145或150或更多本发明的肽。肽或多肽可以任选地被修饰,如脂化,导向序列或其它序列的添加。本发明的I类HLA结合肽可与II类HLA结合肽混合或连接,以利于细胞毒性T淋巴细胞和辅助T淋巴细胞两者的活化。疫苗也可以包含肽脉冲的抗原呈递细胞,如,树突细胞。
用于描述肽化合物的命名法符合传统实践,其中氨基出现在每个氨基酸残基的左侧(N末端),羧基在右侧(C末端)。当在肽表位中提及氨基酸残基位置时,它们以氨基至羧基方向编号,位置1在氨基末端最近的位置。在代表所选本发明具体实施方案的式子中,尽管未特别显示,氨基和羧基末端基团是它们在生理pH值下假定的形式,除非有相反的说明。在氨基酸结构式中,每个残基一般用标准的三字母或单字母命名来表示。L型的氨基酸残基用大写单字母或三字母符号的首字母大写来表示,具有D型的那些氨基酸的D型用小写单字母或小写三字母符号表示。甘氨酸没有不对称碳原子,简单记做“Gly”或G。氨基酸符号显示如下。
单字母符号三字母符号氨基酸A Ala丙氨酸C Cys半胱氨酸D Asp天冬氨酸E Glu谷氨酸F Phe苯丙氨酸G Gly甘氨酸H His组氨酸I Ile异亮氨酸K Lys赖氨酸L Leu亮氨酸M Met甲硫氨酸N Asn天冬酰胺P Pro脯氨酸
Q Gln 谷氨酰胺R Arg 精氨酸S Ser 丝氨酸T Thr 苏氨酸V Val 缬氨酸W Trp 色氨酸Y Tyr酪氨酸IV.B.对抗HBV的CTL和HTL反应的刺激在过去十年里已经勾划了T细胞识别抗原的机制。基于我们对免疫系统的新的理解,我们产生了可在广泛人群内诱导针对HBV感染的治疗或预防性免疫应答的有效肽表位疫苗组合物。为了理解要求保护的组合物的价值和功效,提供了该技术的简要回顾。
HLA分子和肽抗原的复合体作为HLA限制性T细胞识别的配体(Buus,S.等,Cell 471071,1986;Babbitt,B.P.等,Nature317359,1985;Townsend,A.和Bodmer,H.,Annu.Rev.Immunol.7601,1989;Germain,R.N.,Annu.Rev.Immunol.11403,1993)。通过单个氨基酸置换的抗原类似物的研究和内源性结合的天然加工肽的测序,已经鉴定了对应于特异性结合HLA抗原分子所必需的基元的关键性残基,它们在这里进行了描述并在表I、II和III中列出(也参见例如,Southwood,等,J.Immunol.1603363,1998;Rammensee,等,Immunogenetics41178,1995;Rammensee等,SYFPEITHI,网址为http//134.2.96.221/scripts.hlaserver.dll/home.htm;Sette,A.和Sidney,J.Curr.Opin.Immunol.10478,1998;Engelhard,V.H.,Curr.Opin.Immunol.613,1994;Sette,A.和Grey,H.M.,Curr.Opin.Immunol.479,1992;Sinigaglia,F.和Hammer,J.Curr.Biol.652,1994;Ruppert等,Cell74929-937,1993;Kondo等,J.Immunol.1554307-4312,1995;Sidney等,J.Immunol.1573480-3490,1996;Sidney等,Human Immunol.4579-93,1996;Sette,A.和Sidney,J.Immunogenetics,出版中,1999)。
此外,HLA-肽复合体的X射线结晶分析显示了HLA分子肽结合裂口内的袋,它以等位基因特异的方式容纳肽配体携带的残基;这些残基反过来决定它们所存在的肽的HLA结合能力(如参见Madden,D.R.Annu.Rev.Immunol.13587,1995;Smith,等,Immunity4203,1996;Fremont等,Immunity8305,1998;Stern等,Structure2245,1994;Jones,E.Y.Curr.Opin.Immunol.975,1997;Brown,J.H.等,Nature36433,1993;Guo,H.C.等,Proc.Natl.Acad.Sci.USA908053,1993;Guo,H.C.等,Nature360364,1992;Silver,M.L.等,Nature360367,1992;Matsumura,M.等,Science257927,1992;Madden等,Cell 701035,1992;Fremont,D.H.等,Science257919,1992;Saper,M.A.,Bjorkman,P.J.和Wiley,D.C.,J.Mol.Biol.219277,1991.)。
因此,I类和II类等位基因特异性HLA结合基元或I类超基元的确定允许具有结合特定HLA抗原潜力的蛋白内区域的鉴定(也参见如Sette,A.和Grey,H.M.,Cure.Opin.Immunol.479,1992;Sinigaglia,F.和Hammer,J.,Curr.Biol.652,1994;Engelhard,V.H.,Curr.Opin.Immunol.613,1994;Kast,W.M.等,J.Immunol.,1523904,1994)。
此外,也已经建立了定量肽和HLA之间相互作用亲和力的各种试验。这种试验包括,例如,IC50值测定,抗原呈递抑制(Sette等,J.Immunol.1413893,1991),体外装配试验(Townsend等,Cell62285,1990),解离速率测定(Parker等,J.Immunol.1491896-1904,1992)和使用变异细胞如RMA.S的基于FACS的试验(Melief,等,Eur.J.Immunol.212963,1991)。
本发明人已经发现结合亲和力与免疫原性的相关是评价候选肽时要考虑的一个重要因素。因此,通过基元检索和HLA-肽结合试验的结合,已经鉴定了基于表位的候选疫苗。确定它们的结合亲和力之后,可实施其它证实工作,从这些候选疫苗中选择抗原性和免疫原性方面具有优选特征的表位。可利用各种策略评价免疫原性,包括1)来自正常个体的原代T细胞培养物的评价(Wentworth,P.A.等,Mol.Immunol.32603,1995;Celis,E.等,Proc.Natl.Acad.Sci.USA912105,1994;Tsai,V.等,J.Immunol.1581796,1997;Kawashima,I.等,Human Immunol.591,1998);这个方法包括在抗原呈递细胞存在下,用测试肽体外刺激正常受试者的PBL几周的时间。这段时间内,该肽特异性的T细胞被活化,并使用涉及肽致敏靶细胞的51Cr-释放试验进行检测。
2)HLA转基因小鼠的免疫(Wentworth,P.A.等,J.Immunol.2697,1996;Wentworth,P.A.等,Int.Immunol.8651,1996;Alexander,J.等,J.Immunol.1594753,1997);在这个方法中,将不完全弗氏佐剂中的肽皮下给予HLA转基因小鼠。免疫后几周,取出脾细胞并在测试肽存在下体外培养约一周。用涉及肽致敏靶细胞和表达内源产生的抗原的靶细胞的51Cr-释放试验检测肽特异性T细胞。
3)已从感染康复的免疫个体和/或慢性感染患者的回忆T细胞反应的证实(Rehennann,B.等,J.Exp.Med. 1811047,1995;Doolan,D.L.等,Immunity797,1997;Bertoni,R.等,J.Clin.Invest.100503,1997;Threlkeld,S.C.等,J.Immunol.1591648,1997;Diepolder,H.M.等,J.Virol.716011,1997)。应用这个策略时,培养已自然接触过抗原,例如通过感染接触过抗原,并因此曾产生“天然”免疫应答的受试者的PBL来检测回忆反应。在测试肽和抗原呈递细胞(APC)存在下,受试者的PBL体外培养1-2周,以允许与“幼稚”T细胞相比,“记忆”T细胞活化。在培养期末,用T细胞活性试验,包括涉及肽致敏靶细胞的51Cr-释放,T细胞增殖或淋巴因子释放来检测T细胞活性。
下面描述本发明的肽表位和相应核酸。
IV.C.肽表位与HLA分子的结合亲和力如这里指出,HLA多态性的巨大程度是用基于表位的方法进行疫苗开发要考虑的一个重要因素。为了解决这个问题,优选利用包括鉴定能够以高或中等亲和力结合多种HLA分子的肽的表位选择,更优选这些表位以高或中等亲和力结合两个或更多等位基因特异的HLA分子。
疫苗组合物的感兴趣CTL诱导性肽优选包括对I类HLA分子具有500nM或更低的IC50或结合亲和力值的那些肽。HTL诱导性肽优选包括对II类HLA分子具有1000nM或更低的IC50或结合亲和力值的那些肽。例如,通过测试候选肽体外结合纯化HLA分子的能力来评价肽结合。然后考虑显示高或中等亲和力的肽进行进一步分析。所选肽在该超型家族的其它成员中测试。在优选实施方案中,显示交叉反应性结合的肽接着被用于疫苗或细胞筛选分析。
如这里公开的,高HLA结合亲和力与高免疫原性相关。高免疫原性可以以几种不同方法证明。免疫原性对应于是否完全引起免疫应答,以及任何特定应答的活力。例如,一个肽可以在多种人群中引起免疫应答,但是在任何情况下都不产生有力的应答。根据这些原则,发现与结合亲和力中等的大约50%的肽相比接近90%的高结合肽,具有免疫原性。而且,结合亲和力更高的肽导致更有力的免疫原应答。结果,如果使用高亲和力结合的肽,引起类似生物学效果需要较少的肽。因此,在本发明的优选实施方案中,特别期望高结合的表位。
本领域中,本发明人已经首次确定了与I类HLA分子的结合亲和力和结合抗原上离散肽表位的免疫原性之间的关系。以两种不同的试验方法分析了结合亲和力和免疫原性之间的相关性(Sette,等,J.Immunol.1535586-5592,1994)。在第一个方法中,分析了HLA-A*0201转基因小鼠中HLA结合亲和力在10000倍范围内的潜在表位的免疫原性。在第二个方法中,使用急性肝炎患者的PBL(外周血淋巴细胞)估计大约100个不同的乙型肝炎病毒(HBV)来源的潜在表位的抗原性,所有表位都携带A*0201结合基元。依照这些方法,确定了大约500nM(优选500nM或更低的IC50值)的亲和力阈值确定肽表位引起CTL反应的能力。这些数据对天然加工肽和合成T细胞表位的I类结合亲和力测定是确实的。这些数据也表明决定簇的选择在T细胞应答修整中的重要作用。
也已经描述了与II类HLA DR分子背景下的免疫原性关联的亲和力阈值(Southwood等J.Immunology1603363-3373,1998,和U.S.S.N 60/087192,申请日为5/29/98)。为了定义DR结合亲和力的有生物学意义的阈值,编辑了32个DR限制性表位与其限制性元素的结合亲和力的数据库。大约一半的情况(32个表位中的15个)中,DR限制与高结合亲和力关联,即IC50值为100nM或更低的结合亲和力。在其它一半情况(32个中的16个)中,DR限制与中等亲和力(结合亲和力在100-1000nM范围)关联。32个例子中仅一个是DR限制与1000nM或更高的IC50值相关。因此,1000nM可以定义为DR分子背景中与免疫原性关联的亲和力阈值。
可如下面实施例1所述确定肽与HLA分子的结合亲和力。
IV.D.肽表位结合基元和超基元在过去几年中,已经累积证据证明大部分I类HLA和可能II类分子可归类为特征是大部分重叠的肽结合库(peptide bindingrepertoires)和主要肽结合袋的共有结构的相对较少的超型。
对于HLA分子袋分析,已经从Parham,等(Parham,P.,Adams,E.J.,和Arnett,K.L.,Immunol.Rev.143141,1995)的数据库汇编了如结晶研究(Guo,H.C.等,Nature360364,1992;Saper,M.A.,Bjorlcman,P.J.和Wiley,D.C.,J.Mol.Biol.219277,1991;Madden,D.R.,Garboczi,D.N.和Wiley,D.C.,Cell 75693,1993)中所述的包含I类HLA分子B和F袋的残基。在这些分析中,认为残基9,45,63,66,67,70和99组成了B袋,并决定对肽配体第二个位置的残基的特异性。类似地,认为残基77,80,81和116决定F袋的特异性,并决定对HLA分子结合的肽配体的C末端残基的特异性。
通过单个氨基酸置换的抗原类似物的研究和内源性结合的天然加工肽的测序,已经鉴定了等位基因特异的与HLA分子的结合所需的关键残基。这些残基的存在与对HLA分子的结合亲和力相关。与高和中等亲和力结合相关的基元和/或超基元的鉴定对于用在疫苗中的免疫原性肽表位的鉴定是一个重要问题。Kast等(J.Immunol.1523904-3912,1994)已经表明基元携载肽占与等位基因特异性I类HLA分子结合的表位的90%。在这个研究中,评价了长度是9个氨基酸并有八个氨基酸重叠的所有可能的肽(240个肽)(这些肽覆盖人乳头瘤病毒16型的E6和E7蛋白完整序列)与在不同人种群中以高频率表达的五个等位基因特异性HLA分子的结合。这个无偏倚性的肽组允许评价I类HLA基元的预测价值。这组240个肽中,鉴定了以高或中等亲和力结合等位基因特异性HLA分子的22个肽。这22个肽中,20个(即91%)是携带基元的。因此,这个研究证明了基元对于鉴定用于包含在疫苗内的肽表位的价值基于基元的鉴定技术的应用消除了90%潜在表位的筛选。
下述表中鉴定了这些肽表位。I类HLA表位的表包括90%以上的将以中等或高亲和力结合等位基因特异性I类HLA分子的肽。
本发明的肽也可以包括结合II类MHC DR分子的表位。I类和II类HLA分子之间的显著差异是,尽管对于结合I类分子的肽存在严格的大小限制,但是可证明对于II类肽配体,相对于肽的N和C末端,基元的大小和结合框架位置(binding frame position)有更大程度的不均一性。这种不均一性增加是由于II类结合沟的结构不象其I类相应物,它在两个末端是开放的。DRB*0101-肽复合体的晶体学分析(参见如Madden,D.R.Ann.Rev.Immunol.13587,1995)表明与DRB*0101复合的占据肽的位置1和位置6的残基嵌入DRBa*0101上的两个互补袋,P1位置对应于最关键的固定残基和最深的疏水袋。其它研究也指出P6位置是结合各种其它DR分子的关键固定残基。
因此,本发明的肽由几种HLA特异性氨基酸基元中任何一种来鉴定(如见表I-III)。如果基元的存在对应于结合几种等位基因特异性HLA抗原的能力,则它称做超基元。结合具有特定氨基酸超基元的肽的等位基因特异性HLA分子统称做HLA“超型”。
下述肽基元和超基元提供了鉴定和使用根据本发明的肽的指导。
表中包括了携载各个超基元或基元的肽表位的实例,如在每个基元或超基元的说明中所指定的。这些表包括对一些肽表位所列的结合亲和力比例。该比例可以使用下列公式转换为IC50标准肽的IC50/比例=测试肽(即所述肽表位)的IC50。表IV显示了用于确定I类肽的结合亲和力的标准肽的IC50值。表V显示了用于确定II类肽的结合亲和力的标准肽的IC50值。用作结合试验标准的肽是标准的例子;当进行这种分析时,也可以使用其它的标准肽。
为了得到每个表列出的肽表位序列,对自20个HBV株(HPBADR,HPBADR1CG,HPBADRA,HPBADRC,HPBADRCG,HPBCGADR,HPBVADRM,HPBADW,HPBADW1,HPBADW2,HPBADW3,HPBADWZ,HPBHEPB,HPBVADW2,HPBAYR,HPBV,HPBVAYWC,HPBVAYWCI,NAD HPBVAYWE)的蛋白序列数据评价指定超基元或基元的存在。也在它们保守性的基础上选择肽表位。保守性标准需要肽的全部序列在特定蛋白可获得的序列的75%中是完全保守的。所选肽表位的保守性百分比在表中指出。也显示了频率,即20个株中肽序列被鉴定的株的数量。表中的“第1位”栏指定HBV蛋白对应于表位第一个氨基酸残基的氨基酸位置。“氨基酸数量”表示表位序列中残基的数量。
指示CTL诱导性肽表位的I类HLA基元表I总结了下面描述的I类HLA肽表位超基元和基元的一级固定残基。表I(a)所列的I类HLA基元是与这里要求保护的发明最特别相关的基元。表II总结了一级和二级固定位置。表VI列出了包含I类HLA超型家族的等位基因特异性HLA分子。
IV.D1.HLA-A1超基元HLA-A1超基元的特征在于肽配体位置2中存在小(T或S)或疏水(L,I,V或M)一级固定残基,和该表位的C末端位置存在芳香(Y,F或W)一级固定残基。结合A1超基元的HLA分子的相应家族(即HLA-A1超型)至少由A*0101,A*2601,A*2602,A*2501和A*3201组成(如见DiBrino,M.等,J.Immunol.1515930,1993;DiBrino,M.等,J.Immunol.152620,1994;Kondo,A.等,Immunogenetics45249,1997)。表VI显示了预测是A1超家族成员的其它等位基因特异性HLA分子。在一级和/或二级固定位置置换,优选选择为该超基元所指定的各个残基,可调节结合每个HLA蛋白的肽。
所附表VII列出了含A1超基元的代表性肽表位。
IV.D.2.HLA-A2超基元已经描述了对等位基因特异性HLA A2.1分子的一级固定特异性(Falk等,Nature 351290-296,1991;Hunt等,Science2551261-1263,1992)和HLA A2家族内的交叉反应性结合(Fruci等,Human Immunol.38187-192,1993;Tanigaki等,HumanImmunol.39155-162,1994)。本发明人定义了决定与多种等位基因特异性HLA A2分子交叉反应结合的另外的一级固定残基(DelGuercio等,J.Immunol.154685-693,1995)。HLA-A2超基元包含在位置2有L,I,V,M,A,T或Q作为一级固定残基和在该表位C末端位置有L,I,V,M,A或T作为一级固定残基的肽配体。
HLA分子的相应家族(即结合这些肽的HLA-A2超型)至少由A*0201,A*0202,A*0203,A*0204,A*0205,A*0206,A*0207,A*0209,a*0214,A*6802和A*6901组成。表VI显示了预测是A2超家族成员的其它等位基因特异性HLA分子。如下详细解释的,在一级固定和/或二级固定位置置换,优选选择为该超基元所指明的各个残基,可调节与各个等位基因特异性HLA分子中每一个的结合。
所附表VIII列出了含A2超基元的代表性肽表位。在位置2含有一级固定残基V,A,T或Q和在C末端位置含有L,I,V,A或T的基元是与这里要求保护的发明最特别相关的基元。
IV.D.3.HLA-A3超基元HLA-A3超基元的特征在于在肽配体位置2中存在A,L,I,V,M,S或T作为一级固定残基,和在该表位的C末端位置(如9-mers的位置9)存在带正电荷残基R或K。结合A3超基元的HLA分子相应家族(HLA-A3超型)的示例成员至少包括A*0301,A*1101,A*3101,A*3301和A*6801。表VI显示了预测是A3超家族成员的其它等位基因特异性HLA分子。如下详细解释的,在肽的一级固定和/或二级固定位置氨基酸的置换,优选选择为该超基元所指明的各个残基,可调节与各个等位基因特异性HLA蛋白中每一个结合的肽。
所附表IX列出了包含A3超基元的代表性肽表位。
IV.D.4.HLA-A24超基元HLA-A24超基元的特征在于肽配体位置2中存在芳香残基(F,W或Y)作为一级固定残基,和在表位的C末端位置存在疏水残基(Y,F,L,I,V或M)作为一级固定残基。结合A24超基元的HLA分子相应家族(即A24超型)至少包括A*2402,A*3001和A*2301。表VI显示了预测是A24超家族成员的其它等位基因特异性HLA分子。在一级固定位置置换,优选选择为该超基元指明的各个残基,可调节与各个等位基因特异性HLA分子中每一个结合的肽。
所附表X列出了包含A24超基元的代表性肽表位。
IV.D.5.HLA-B7超基元HLA-B7超基元的特征在于肽位置2具有脯氨酸作为一级固定残基,和在表位的C末端位置具有疏水或脂肪族氨基酸(L,I,V,M,A,F,W或Y)作为一级固定残基。结合B7超基元的HLA分子相应家族(即HLA-B7超型)至少由二十六个HLA-B蛋白组成,包括B*0702,B*0703,B*0704,B*0705,B*1508,B*3501,B*3502,B*3503,B*3504,B*3505,B*3506,B*3507,B*3508,B*5101,B*5102,B*5103,B*5104,B*5105,B*5301,B*5401,B*5501,B*5502,B*5601,B*5602,B*6701,和B*7801(如见Sidney,等,J.Immunol.154247,1995;Barber,等,Curr.Biol.5179,1995;Hill,等,Nature360434,1992;Rammensee,等,Immunogenetics41178,1995)。表VI显示了预测是B7超家族成员的其它等位基因特异性HLA分子。如下详细解释的,在肽的一级固定和/或二级固定位置氨基酸的置换,优选选择为该超基元指明的各个残基,可调节与各个等位基因特异性HLA蛋白中每一个结合的肽。
所附表XI列出了包含B7超基元的代表性肽表位。
IV.D.6.HLA-B27超基元HLA-B27超基元的特征在于肽配体位置2存在带正电荷(R,H或K)残基作为一级固定残基,和在表位的C末端位置存在疏水残基(F,Y,L,W,M,I,A或V)作为一级固定残基。结合B27超基元的HLA分子相应家族(即HLA-B27超型)的示例成员至少包括B*1401,B*1402,B*1509,B*2702,B*2703,B*2704,B*2705,B*2706,B*3801,B*3901,B*3902和B*7301。表VI显示了预测是B27超家族成员的其它等位基因特异性HLA分子。在一级固定位置置换,优选选择对该超基元指明的各个残基,可调节与每个等位基因特异性HLA分子结合的肽。
所附表XII列出了包含B27超基元的代表性肽表位。
IV.D.7.HLA-B44超基元HLA-B44超基元的特征在于肽配体位置2存在带负电荷(D或E)残基作为一级固定残基,和在表位的C末端位置存在疏水残基(F,W,Y,L,I,M,V或A)作为一级固定残基。结合B44超基元的HLA分子相应家族(即HLA-B44超型)的示例成员至少包括B*1801,B*1802,B*3701,B*4001,B*4002,B*4006,B*4402,B*4403,和B*4006。通过在一级固定位置置换,优选选择为该超基元指明的各个残基,可调节与每个等位基因特异性HLA分子结合的肽。
IV.D.8.HLA-B58超基元HLA-B58超基元的特征在于肽配体位置2存在小脂肪族残基(A,S或T)作为一级固定残基,和表位的C末端位置存在芳香或疏水残基(F,W,Y,L,I,V,M或A)作为一级固定残基。结合B58超基元的HLA分子相应家族(即B58超型)的示例成员至少包括B*1516,B*1517,B*5701,B*5702和B*5801。表VI显示了预测是B58超家族成员的其它等位基因特异性HLA分子。通过在一级固定位置置换,优选选择为该超基元指明的各个残基,可调节与每个等位基因特异性HLA分子结合的肽。
所附表XIII列出了包含B58超基元的代表性肽表位。
IV.D.9.HLA-B62超基元HLA-B62超基元的特征在于肽配体位置2存在极性脂肪族残基Q或疏水脂肪族残基(L,V,M或I)作为一级固定残基,和表位的C末端位置存在疏水残基(F,W,Y,M,I,V,L或A)作为一级固定残基。结合B62超基元的HLA分子相应家族(即HLA-B62超型)的示例成员至少包括B*1501,B*1502,B*1513和B5201。表VI显示了预测是B62超家族成员的其它等位基因特异性HLA分子。通过在一级固定位置置换,优选选择为该超基元指明的各个残基,可调节与每个等位基因特异性HLA分子结合的肽。
所附表XIV列出了包含B62超基元的代表性肽表位。
IV.D.10.HLA-A1基元等位基因特异性HLA-A1基元的特征在于肽配体位置2存在T,S或M作为一级固定残基,和表位的C末端位置存在Y作为一级固定残基。可供选择的等位基因特异性A1基元(即“亚基元”)以位置3而不是位置2的一级固定残基为特征。这个亚基元以位置3存在D,E,A或S作为一级固定残基,和表位C末端位置存在Y作为一级固定残基为特征。延伸的亚基元以位置3存在D和C末端存在A,I,L或F为特征。通过在一级固定和/或二级固定位置置换,优选选择为该基元指明的各个残基,可调节与HLA-A1结合的肽。
所附表XV列出了包含任一A1基元的代表性肽表位。表VII所列的携带HLA-A1超基元的肽表位的列表中也包括在位置2含T,S或M和在C末端位置含Y的那些表位。
IV.D.11.HLA-A2.1基元首次确定等位基因特异性HLA-A2.1基元的特征在于肽配体位置2中存在L或M作为一级固定残基,和9氨基酸表位的C末端位置存在L或V作为一级固定残基(Falk等,Nature351290-296,1991)。此外,确定A2.1基元进一步包括在位置2存在I和九氨基酸肽的C末端位置存在I或A(Hunt等,Science2551261-1263,March 6,1992)。另外,发现A2.1等位基因特异性基元在C末端位置包含T(Kast等,J.Immunol.1523904-3912,1994)。后来,本发明人确定A2.1等位基因特异性基元在位置2另外包含V,A,T或Q作为一级固定残基,和在表位C末端位置包含M作为一级固定残基。因此,HLA-A2.1基元包括位置2有L,I,V,M,A,T或Q作为一级固定残基,和表位C末端位置有L,I,V,M,A或T作为一级固定残基的肽配体。表征HLA-A2.1基元一级固定位置的优选和容许的残基与A2超基元的优选残基相同(相关资料的综述,如见Del Guercio等,J.Immunol.154685-693,1995;Sidney等,Immunol.Today17261-266,1996;Sette和Sidney,Curr.Opin.in Immunol.10478-482,1998)。表征A2.1基元的二级固定残基已另外限定,如这里所公开的。这些在表II中公开。通过在一级固定和/或二级固定位置置换,优选选择为该基元指定的各个残基,可调节与HLA-A2.1分子结合的肽。
所附表VII列出了包含A2.1基元的代表性肽表位。位置2包含一级固定残基V,A,T或Q,和C末端位置包含L,I,V,A或T的A2.1基元是这里要求保护的本发明最特别相关的基元。
IV.D.12 HLA-A3基元等位基因特异性HLA-A3基元的特征在于肽配体位置2存在L,M,V,I,S,A,T,F,C,G或D作为一级固定残基,和表位的C末端位置存在K,Y,R,H,F或A作为一级固定残基。在一级固定和/或二级固定位置置换,优选选择为该基元指明的各个残基,可调节与HLA-A3结合的肽。
所附表XVI列出了包含A3基元的代表性肽表位。表IX也列出了也包含A3超基元的那些肽表位。
IV.D.13.HLA-A11基元等位基因特异性HLA-A11基元的特征在于肽配体位置2存在V,T,M,L,I,S,A,G,N,C,D或F作为一级固定残基,和表位的C末端位置存在K,R,Y或H作为一级固定残基。在一级固定和/或二级固定位置置换,优选选择为该基元指定的各个残基,可调节与HLA-A11结合的肽。
所附表XVII列出了包含A11基元的代表性肽表位。因为A3和A11基元一级固定特异性之间广泛的重叠,这个表中也存在含A3等位基因特异性基元的肽表位。此外,表IX也列出了包含A3超基元的那些肽表位。
IV.D.14.HLA-A24基元等位基因特异性HLA-A24基元的特征在于肽配体位置2存在Y,F,W或M作为一级固定残基,和表位的C末端位置存在F,L,I或W作为一级固定残基。在一级固定和/或二级固定位置置换,优选选择为该基元指明的各个残基,可调节与HLA-A24结合的肽。
所附表XVIII列出了包含A24基元的代表性肽表位。表X(HLA-A24超基元携载表位)也列出了这些表位。指示II类HLA HTL表位的基元表III总结了下面描述的II类HLA超基元和基元的一级和二级固定残基。
IV.D.15.HLA DR-1-4-7超基元也已经鉴定了结合三个共同II类HLA等位基因特异性HLA分子HLA DRB1*0401,DRB1*0101和DRB1*0701的肽的基元。总的来说,这些基元的共同残基描述了HLA DR-1-4-7超基元。结合这些DR分子的肽携带以在位置1用大芳香族或疏水残基(Y,F,W,L,I,V或M)作为一级固定残基,和在表位的位置6有小的不带电荷残基(S,T,C,A,P,V,I,L或M)作为一级固定残基为特征的超基元。也已经鉴定了这些HLA型每一个的等位基因特异性二级作用(secondaryeffects)和二级固定残基(secondary anchors)。这些在表III中列出。在一级固定和/或二级固定位置置换,优选选择为该超基元指定的各个残基,可调节结合HLA-DR4,DR1和/或DR7的肽。
保守的肽表位(即用于分析的20个HBV株中75%保守),对应于含DR-1-4-7超基元的九个残基核心(其中基元的位置1是九个残基核心的位置1),在表XIXa中列出(如见Madden,Annu.Rev.Immunol.13587-622,1995)。长度15个氨基酸残基的各个示例肽表位(每一个包含保守的九个残基核心)也在该表的“a”部分中显示。表XIXb中显示了肽编号(peptide number)表示的示例的15残基超基元携载肽的交叉反应性结合数据。
IV.D.16.HLA DR3基元两个可供选择的基元(即超基元)描述了结合HLA-DR3分子的肽表位的特性。在第一个基元(超基元DR3A)中,固定位置1存在大的疏水残基(L,I,V,M,F或Y),位置4存在D作为固定残基,朝向表位的羧基末端。
可供选择的DR3超基元要求固定位置1缺乏大的疏水残基,和/或位置4缺乏带负电荷或酰胺样固定残基,朝向表位羧基末端的位置6存在正电荷。因此,对于该可供选择的等位基因特异性DR3基元(超基元DR3B)在固定位置1存在L,I,V,M,F,Y,A或Y;固定位置4存在D,N,Q,E,S或T;和固定位置6存在K,R或H。在一级固定和/或二级固定位置置换,优选选择为该基元指定的各个残基,可调节结合HLA-DR3的肽。
保守的肽表位(即用于分析的20个HBV株中75%保守的序列),对应于含DR3A超基元的九个残基核心(其中基元的位置1在九个残基核心的位置1),在表XXa中列出。长度15个氨基酸残基的各个示例肽表位(每一个包含保守的九残基核心)也在表的“a”部分中显示。表XXb中显示了肽编号表示的示例性DR3超基元A携载肽的结合数据。
对应于含DR3B超基元的九残基核心的保守肽表位(即用于分析的20个HBV株中75%保守)和含DR3超基元B表位的各个示例15mer肽在表XXc中列出。表XXd显示了肽编号表示的示例的DR3超基元B携载肽的结合数据。
认为这里的表中列出的每个I类或II类HLA肽表位各个都是本申请的发明方面。而且,每个肽表位可以与任何其它肽表位组合使用也是本申请的发明方面。
IV.E.增加疫苗的人群覆盖度优选具有宽群体覆盖度的疫苗,因为它们更具商业活力并且通常适用于大多数人。通过选择结合从整体上考虑存在于多数人群中的HLA等位基因的肽表位,使用本发明的肽(和编码这种肽的核酸组合物)可以得到宽人群覆盖度。表XXI列出了各种种族中I类HLA超型的总频率(表XXIa)和A2-,A3-和B7超型得到的组合人群覆盖度(表XXIb)。A2-,A3-和B7超型每一个在这五个主要人种群每一个中都平均以40%以上存在。这些超基元的组合达到了超过80%的覆盖度。这些结果提示使用有限数量的交叉反应性肽可达到有效和无人种偏倚的人群覆盖度。尽管这三个主要肽特异性达到的人群覆盖度高,但是覆盖度可扩大达到95%人群覆盖度和更高,使用另外的超基元或等位基因特异性基元携载肽可更容易达到真正多特异性应答。
B44-,A1-和A24-超型平均以25%至40%的频率存在于这些主要人种人群中(表XXIa)。尽管总体上不太普遍,B27-,B58-和B62超型的每种在至少一个主要人种群中以>25%的频率存在(表XXIa)。表XXIb总结了已经鉴定的HLA超型在五个主要人种群中估计的组合流行性。显示了A1-,A24-和B44-超型包含在A2,A3和B7覆盖度内得到的,或这里描述的所有超型得到的增长的覆盖度。通过包含六个最高频率的超型的表位,五个主要人种群达到了99%的平均人群覆盖度。
这里提供的数据结合前面A2-,A3-和B7-超型的定义表明所有抗原,可能除了A29,B8和B46,可分为总共九个HLA超型。集中六个最常见超型提供了对于所有主要人种人群大于98%的人群覆盖度。
IV.F.免疫应答刺激性肽类似物尽管用上述筛选方法鉴定到了在超家族所有等位基因中具有合适交叉反应性的肽,交叉反应性并不总是完全的,在这种情况下,进一步增加肽的交叉反应性的方法可能有用;这种方法也可以用于修饰该肽的其它性能。由于已经建立了控制给定基元或超基元内肽对HLA等位基因的交叉反应性的一般规律,为了达到更广(或在其它方面修饰)HLA结合能力,可以进行特别感兴趣肽结构的修饰(即模拟(analoging))。更特别的是,可以根据这里的教导制备显示最宽交叉反应性模式的肽(在已知T细胞表位中,以及含适当超基元的更广泛肽组中)。
使用的策略利用了与结合某些HLA分子相关的基元或超基元。限定该基元或超基元具有一级固定残基,虽然二级固定残基也可以被修饰。在一级固定,二级固定,或在一级和二级固定位置置换氨基酸残基可产生类似肽。通常,类似物最适于已经携载基元或超基元的肽。表II和III分别显示了已经为I类和II类HLA结合肽限定的超基元和基元的优选二级固定残基。
对于根据本发明的大量基元或超基元,定义了对与结合各自基元或超基元的等位基因特异性HLA分子或HLA超型成员的结合有害的残基(表II和III)。因此,根据本发明,可去除对结合有害的残基。例如,在A3超型的情况下,当具有这种有害残基的所有肽从分析的肽群中去除时,交叉反应性发生率从22%增加到37%(如见Sidney,J.等,Hu.Immunol.4579,1996)。因此,改善给定超基元内肽的交叉反应性的一个策略就是简单地删除肽内存在的一个或更多有害残基并置换为小的“中性”残基如Ala(不能影响该肽的T细胞识别)。如果除去了肽内的有害残基,同时又插入与和超家族内多种等位基因以高亲和力结合关联的残基,预期交叉反应性可能增强。
为了确保类似肽用作疫苗时确实引起针对体内天然表位的CTL反应(或,在II类表位的情况下,引起与野生型肽交叉反应的辅助T细胞),类似肽也可以用于体外免疫来自适当HLA等位基因个体的T细胞。其后,评价免疫的细胞诱导野生型肽致敏的靶细胞溶解的能力。作为抗原呈递细胞,期望使用已经感染或转染适当基因的细胞,或,仅在II类表位的情况下,用已经用完整蛋白抗原脉冲的细胞,来确定内源产生的抗原是否也被相关T细胞识别。
确保足够数量交叉反应细胞结合物的本发明另一个实施方案是产生弱结合肽的类似物。显示500-50000nM结合亲和力,并在一个或两个位置携带可接受但是次佳的一级固定残基的I类肽可以通过根据各自的超型置换为优选固定残基来“调整”。接着可测试这些类似肽的交叉结合活性。
产生有效的肽类似物的另一个实施方案包括置换掉对液体环境中肽的稳定性或溶解性有不利影响的残基。这种置换可以在该肽表位的任何位置发生。例如,可以将半胱氨酸(C)置换为α-氨基丁酸。由于其化学性质,半胱氨酸具有形成二硫键桥的习性,并且足以在结构上改变肽,从而降低结合能力。α-氨基丁酸置换C不仅减轻了这个问题,而且确实在某些情况下提高了结合和交叉结合能力(综述A.Sette等,InPersistent Viral Infections,Eds.R.Ahmed和I.Chen,John Wiley & Sons,England,1999)。用α-氨基丁酸替换半胱氨酸可以发生在肽表位的任何残基处,即可在固定或非固定位置。
通常,CTL和HTL反应不能对抗所有可能的表位。而是,它们限于少数几种优势免疫决定簇(Zinkernagel,等,Adv.Immunol.275159,1979;Bennink,等,J.Exp.Med.16819351939,1988;Rawle,等,J.Immunol.1463977-3984,1991)。已经认识到免疫优势(Benacerraf,等,Science175273-279,1972)可以用给定表位选择性地结合特定HLA蛋白的能力(决定簇选择理论)(Vitiello,等,J.Immunol.1311635,1983);Rosenthal,等,Nature267156-158,1977)或被现存TCR(T细胞受体)特异性选择性地识别(库理论(repertoire theory)(Klein,J.,IMMUNOLOGY,THE SCIENCE OF SELFNONSELF DISCRIMINATION,John Wiley & Sons,New York,pp.270-310,1982)来解释。已经证明另外的因素,多数与加工事件相联,可能也在指示(除了严格的免疫原性外)许多潜在决定簇中哪些将被呈递为免疫优势者中起关键作用(Sercarz,等,Annu.Rev.Immunol.11729-766,1993)。
优势和亚优势的概念与传染性疾病和癌症的免疫治疗有关。例如,在慢性病毒疾病过程中,亚优势表位的恢复(recruitment)可能对感染的成功清除很重要,特别是如果优势CTL或HTL特异性已经由功能性耐受,抑制,病毒突变和其它机制灭活(Franco,等,Curr.Opin.Immunol.7524-531,(1995))。在癌症和肿瘤抗原的情况下,识别至少一些最高结合亲和力的肽的CTLs可能被功能性地灭活。此时最好识别较低结合亲和力的肽。
特别是,已经指出大量来自已知非病毒肿瘤相关抗原(TAA)的表位以中等亲和力(IC50在50-500nM范围)结合I类HLA。例如,已经发现被肿瘤浸润淋巴细胞(TIL)或CTL识别的15个已知TAA肽中的8个在50-500nM范围结合。(这些数据与估计90%被识别为肽的已知病毒抗原以50nM或更低的IC50结合HLA,而仅大约10%以50-500nM结合形成对照)(Sette,等,J.Immunol.,153558-5592(1994))。在癌症情况中,这个现象可能是由于识别几种最高结合肽的CTL消除或功能性抑制造成的,推测由于T细胞耐受事件。
不愿受任何理论的限制,我们认为因为针对优势表位的T细胞可能已经被克隆性删除,选择亚优势表位可能允许现存T细胞募集,接着它们将引起治疗性反应。然而,HLA分子与亚优势表位的结合常常比优势表位活力低。因此,需要能够调节特定免疫原性表位对一个或多个HLA分子的结合亲和力,并由此调节该肽引起的免疫应答。因此,存在制备引起更强应答的类似肽的需要。这个能力将大大增加基于肽的疫苗和治疗剂的有效性。
表XXII列出了代表性类似肽。这个表指出了类似肽的长度和序列,以及如果适当,还有基元或超基元。“修整名称”(FixedNomenclature)栏中的信息指出各个类似物在指明位置编号处置换的残基。
IV.G.为得到含超基元或基元的肽,计算机筛选来自疾病相关抗原的蛋白序列为了鉴定靶抗原中的超基元或基元携载表位,使用计算工具,如智能计算或计算机,筛选天然蛋白序列,如肿瘤关联抗原,或来自传染性生物体或移植的供体组织的序列,来确定序列内超基元或基元的存在。天然肽分析得到的信息可直接用于评价天然肽的状况或可以随后利用来产生肽表位。
允许快速筛选蛋白序列中主题超基元或基元的存在的计算机程序包含在本发明中;允许产生类似肽的程序也同样包括在内。执行这些程序分析任何鉴定的氨基酸序列或对未知序列进行操作并同时确定序列并鉴定其基元携载表位,也可以同时确定类似物。通常,鉴定的序列来自病原生物体或肿瘤相关肽。例如,这里考虑的靶分子包括所有的HBV蛋白(如表面,核心,聚合酶和X)。
在可以获得同一靶蛋白的多种变异体序列的情况下,也可以在肽保守性的基础上选择肽。目前优选的保守性标准定义肽的完整序列在75%用于评价特定蛋白的序列中完全保守;这里使用这个保守性定义。预测肽结合的选择标准尽可能准确以最有效地与真实结合相关是重要的。基于适当一级固定残基的存在预测结合例如HLA-A*0201的肽,大约30%比率是正确的(Ruppert,J.等Cell 74929,1993)。然而,通过分析大范围肽-HLA结合数据库,本发明人已经开发了大量等位基因特异性多项式算法(polynomial algorithms),它们比仅基于一级固定残基的存在进行的鉴定显著地增加了预中率。这些算法不仅考虑正确一级固定残基的存在或缺乏,而且考虑积极或有害二级固定残基的存在(来说明在不同位置不同氨基酸的影响)。该算法主要基于以下前提肽-HLA相互作用的总体亲和力(或ΔG)可近似认为是这种类型的线性多项函数ΔG=a1ixa2ixa3i...xani其中,aij是代表沿n个氨基酸的肽序列在给定位置(i)存在给定氨基酸(j)的作用的系数。本方法的重要假定是在每个位置的作用基本上彼此独立。证实了肽主要以延伸构象结合HLA分子和被T细胞识别的研究证明了这个假定。Gulukota等(Gulukota,K.等,J.Mol.Biol.2671258,1997)描述了具体算法系数的推导。
也利用了特定基元的鉴定优选肽序列的另外方法包括使用神经网络和分子建模(molecular modeling)程序(如见Milik等,NatureBiotechytology16753,1998;Altuvia等,Hum.Immunol.581,1997;Altuvia等,J.Mol.Biol.249244,1995;Buus,S.Curr.Opin.Immunol.11209-213,1999;Brusic,V.等,Bioinformatics14121-130,1998;Parker等,J.Immunol.152163,1993;Meister等,Vaccine13581,1995;Hammer等,J.Exp.Med.1802353,1994;Sturniolo等,NatureBiotechnol.17555 1999)。
例如,已经表明在A*0201基元肽组中,含至少一个优选的二级固定残基,又避免了任何有害二级固定残基存在的肽的69%将以低于500nM的IC50结合A*0201(Ruppert,J.等Cell74929,1993)。这些算法也可灵活运用,因为可以调节截断值选择有如期望的更高或更低预测结合性能的肽组。
在利用计算机筛选鉴定肽表位中,可以使用开发用于搜索基元的软件,例如“FINDPATTERNS”程序(Devereux,等Nucl.Acids Res.12387-395,1984)或MotifSearch 1.4软件程序(D.Brown,SanDiego,CA)来分析所有蛋白序列或翻译的序列以鉴定合适当HLA结合基元的潜在肽序列。本领域普通技术人员可以领会到有大量可以用于实现与已知或未知肽序列相关的本发明基元的软件和硬件选择。接着将使用定制的多项算法对鉴定到的肽进行打分来预测它们结合特定I类或II类HLA等位基因的能力。
按照上述方法,已经鉴定了能够结合HLA超型组或等位基因特异性HLA分子的HBV肽及其类似物(表VII-XX;表XXII)。
IV.H.肽表位的制备可以通过合成,重组DNA技术或化学合成,或从自然来源如天然肿瘤或病原生物体来制备本发明的肽。可以单个或以多表位肽合成肽表位。尽管优选该肽基本上不含其它天然存在的宿主细胞蛋白或其片段,但在一些实施方案中,肽可能通过合成偶联天然片段或颗粒。
按照本发明的肽可以是各种长度,或以其中性(不带电荷)形式或以盐的形式。按照本发明的肽或不含修饰如糖基化,侧链氧化,或磷酸化;或它们含有这些修饰,条件是修饰不破坏这里所述肽的生物活性。
可能时,最好可以优化本发明的I类HLA结合表位,如可用于多表位构建体,使长度为大约8至约13个氨基酸残基,常常是8至11个,优选9至10个。可以优化本发明的II类HLA结合肽表位使长度为大约6至约30个氨基酸,优选在大约13至约20个残基之间。优选,该肽表位在大小上与结合相关HLA分子的内源加工的病原体来源的肽或肿瘤细胞肽相当,然而,使用这里描述的技术也可以进行含本发明表位的肽的鉴定和制备。
在可供选择的实施方案中,本发明的表位可以连接成多表位肽,或编码多表位肽的小基因。
在另一个实施方案中,优选鉴定含高浓度I类和/或II类表位的天然肽区域。通常在每氨基酸长度含有最大数量的表位的基础上选择这种序列。可以领会到表位可以以嵌套或重叠方式存在,如10个氨基酸长度的肽可能含有两个9个氨基酸长的表位和一个10个氨基酸长的表位;给予这种肽后,经过细胞内加工,HLA分子可以接触和结合每个表位。这个较大的,优选多表位的肽可以合成、重组或通过从天然来源切割而产生。
各种方法可以制备本发明的肽。对于优选的相对短的长度,可以按照常规技术在溶液或在固相载体上合成该肽。商业上可获得各种自动合成仪并可以根据已知方案使用(例如,参见Stewart & Young,SOLID PHASE PEPTIDE SYNTHESIS,第2版,Pierce Chemical Co.,1984)。此外,可以使用化学连接法连接各个肽表位而制备仍在本发明范围内的较大的肽。
可供选择地,可以使用重组DNA技术,其中编码感兴趣的免疫原性肽的核苷酸序列插入到表达载体中,转化或转染到适当的宿主细胞并在适合表达的条件下培养。这些步骤是本领域通常知晓的,如Sambrook等,MOLECULAR CLONING,A LABORATORY MANUAL,ColdSpring Harbor Press,Cold Spring Harbor,New York(1989)中一般描述的。因此,含一个或多个本发明的肽序列的重组多肽可用于提供适当的T细胞表位。
这里包含的优选长度的肽表位的核苷酸编码序列可以用化学技术合成,例如,Matteucci,等,J.Am.Chem.Soc.1033185(1981)的磷酸三酯法。通过用适当和期望的核酸碱基置换编码天然肽序列的那些可简单制备肽类似物;示例核酸置换是编码这里的基元/超基元定义的氨基酸的那些。然后,可提供带适当接头的编码序列并连接到本领域通常利用的表达载体,该载体用于转化合适的宿主产生期望的融合蛋白。现在已有大量这种载体和合适的宿主系统。对于融合蛋白的表达,将给编码序列提供可操作连接的起始和终止密码子,启动子和终止区以及通常有的复制系统,以提供用于在期望细胞宿主中表达的表达载体。例如,含用于插入期望编码序列的方便的限制性酶切位点的质粒提供了与细菌宿主相容的启动子序列。将所获表达载体转化至适当细菌宿主中。当然,也可以使用酵母,昆虫或哺乳动物细胞宿主,利用合适的载体和调控序列。
IV.I.检测T细胞应答的试验一旦鉴定了HLA结合肽,可测试它们引发T细胞应答的能力。PCT出版物WO94/20127和WO94/03205描述了基元携载肽的制备和评价。简言之,合成含来自特定抗原的表位的肽并测试它们结合适当HLA蛋白的能力。这些试验可以包括评价相对于放射性参照肽的结合,本发明的肽与纯化的I类HLA分子的结合。可供选择地,对表达空I类分子(即其中缺乏肽)的细胞可以用免疫荧光染色和流动显微荧光测定法来评价肽结合。可以用于评价肽结合的其它试验包括肽依赖性I类装配试验和/或肽竞争造成的CTL识别抑制。进一步评价(典型地以500nM或更低的亲和力)结合I类分子的那些肽用作来自感染或免疫个体的CTLs目标的能力,以及它们诱导体外或体内原始CTL反应(primary CTL responses)的能力,该反应可产生能够和与疾病关联的所选靶细胞进行反应的CTL群。
采用类似的试验用于II类HLA结合肽的评价。进一步评价表现出结合,典型地以1000nM或更低的亲和力结合的II类HLA基元携载肽刺激HTL反应的能力。
用于检测T细胞反应的常规试验包括增殖试验,淋巴因子分泌试验,直接细胞毒性试验和限制性稀释试验。例如,可检测已经与肽共同培养的抗原呈递细胞诱导应答细胞群中CTL反应的能力。抗原呈递细胞可以是正常细胞如外周血单个核细胞或树突细胞。可供选择地,I类分子负载内部加工肽能力缺陷并已经用适当人I类基因转染的突变非人哺乳动物细胞系可用于测试该肽诱导体外原始CTL反应的能力。
外周血单个核细胞(PBMCs)可用作CTL前体的应答细胞来源。适当的抗原呈递细胞与肽孵育,之后负载肽的抗原呈递细胞接着在优化的培养条件下与应答细胞群孵育。通过检测培养物中杀死放射性标记的靶细胞(特异性肽脉冲靶以及表达肽序列所来源的内源加工形式的抗原的靶细胞)的CTLs的存在,可确定阳性CTL活化。
另外,已经设计了通过用荧光素标记的HLA四聚体复合物染色允许直接定量抗原特异性T细胞的方法(Altman,J.D.等,Proc.Natl.Acad.Sci.USA9010330,1993;Altman,J.D.等,Science 27494,1996)。其它新近的技术发展包括染色细胞内淋巴因子和干扰素释放试验或ELISPOT试验。四聚体染色,细胞内淋巴因子染色和ELISPOT试验看来均比更传统的试验敏感至少10倍(Lalvani,A.等,J.Exp.Med.186859,1997;Dunbar,P.R.等,Curr.Biol.8413,1998;Murali-Krishna,K.等,Immunity 8177,1998)。
使用本领域技术人员已知的技术如T细胞增殖和淋巴因子如IL-2的分泌,也可以评估HTL活化(如见Alexander等,Immunity 1751-761,1994)。
可供选择地,HLA转基因小鼠的免疫可用于确定肽表位的免疫原性。已经表征了几个转基因小鼠模型,包括含人A2.1,A11(可另外用于分析HLA-A3表位)和B7等位基因的小鼠,还正在开发其它的模型(如HLA-A1和A24转基因小鼠)。也已经开发了HLA-DR1和HLA-DR3小鼠模型。也可以在需要的时候产生带其它HLA等位基因的另外的转基因小鼠模型。可以用不完全弗氏佐剂中乳化的肽免疫小鼠,测试所得T细胞识别肽脉冲靶细胞和适当基因转染的靶细胞的能力。可以使用上述细胞毒性试验分析CTL反应。类似地,可以使用如T细胞增殖或淋巴因子分泌等试验分析HTL反应。
表XXIII列出了免疫原性肽表位。
III.J.肽表位用作诊断试剂和用于评价免疫应答在本发明的一个方面中,这里所述的I类和II类HLA结合肽可用作评价免疫应答的试剂。使用可引起识别和结合待用作所述试剂的肽表位的抗原特异性CTLs或HTLs产生的任何物质作为免疫原诱导待评价的免疫应答。该肽试剂不必须用作免疫原。用于这种分析的试验系统包括较新的技术发展如四聚体,细胞内淋巴因子染色和干扰素释放试验,或ELISPOT试验。
例如,本发明的肽用于四聚体染色(tetramer staining)试验来评价外周血单个核细胞在接触病原体或免疫原后,抗原特异性CTLs的存在。HLA-四聚体复合物用于直接显现抗原特异性CTLs(如见Ogg等,Science2792103-2106,1998;和Altman等,Science17494-96,1996)并确定外周血单个核细胞样品中抗原特异性CTL群的频率。
使用本发明肽的四聚体试剂是如下产生的结合HLA分子的肽在相应HLA重链和β2-微球蛋白存在下重折叠产生三分子复合物。该复合物在重链羧基末端在先前改造到蛋白中的一个位点被生物素化。然后添加链霉抗生物素诱导四聚体形成。依靠荧光标记链霉抗生物素,该四聚物可用于染色抗原特异性细胞。然后可很容易鉴定该细胞,例如,用流式细胞计数仪。这种方法用于诊断或预后目的。该方法鉴定的细胞也可用于治疗目的。
本发明的肽也用作评价免疫回忆反应的试剂(如见Bertoni等,J.Clin.Invest.100503-513,1997和Penna等,J.Exp.Med.1741565-1570,1991.)。例如,使用特定肽分析来自HPV感染个体的患者PBMC样品检测抗原特异性CTLs或HTLs的存在。可以培养PBMCs并用本发明的肽刺激该细胞来评价含单个核细胞的血液样品。适当培养期后,例如可以分析扩增的细胞群的CTL或HTL活性。
该肽也可以用作评价疫苗功效的试剂。使用例如上述的任何一个方法分析从免疫原接种的患者得到的PBMCs。对患者的HLA分型,选择识别那个患者中存在的等位基因特异性分子的肽表位试剂进行分析。PBMC样品中存在HPV表位特异性CTLs和/或HTLs指示疫苗的免疫原性。
使用本领域熟知的技术(如见CURRENT PROTOCOLS INIMMUNOLOGY,Wiley/Greene,NY;和Antibodies A LaboratoryManual,Harlow,Harlow和Lane,Cold Spring HarborLaboratory Press,1989),本发明的肽也可以用于制备抗体,后者可用作为诊断HPV感染的试剂。这种抗体包括HLA分子的背景下识别肽的抗体,即结合肽-MHC复合体的抗体。
IV.K.疫苗组合物含有免疫原性有效量的这里所述的一种或多种肽的疫苗和制备该疫苗的方法是本发明进一步的实施方案。一旦已定义了适当免疫原性表位,可以用各种手段对它们分选和送递,这里称作“疫苗”组合物。这种疫苗组合物可包括,例如,脂肽(见Vitiello,A.等,J.Clin.Invest.95341,1995),聚(DL-丙交酯-共-乙交酯)(″PLG″)微球体包裹的肽组合物(如见Eldridge,等,Molec.Immunol.28287-294,1991Alonso等,Vaccine12299-306,1994;Jones等,Vaccine13675-681,1995),免疫刺激复合物(ISCOMS)中含有的肽组合物(如见Takahashi等,Nature344873-875,1990;Hu等,Clin Exp Immunol.113235-243,1998),多抗原肽系统(MAPs)(如见Tam,J.P.,Proc.Natl.Acad.Sci.U.S.A.855409-5413,1988;Tam,J.P.,J.Immunol.Methods19617-32,1996),配制成多价肽的肽;用于冲击传送系统(ballisticdelivery systems)的肽,典型的是结晶肽,病毒送递载体(Perkus,M.E.等,InConcepts in vaccine development,Kaufmaim,S.H.E.,编,p.379,1996;Chakrabarti,S.等,Nature320535,1986;Hu,S.L.等,Nature320537,1986;Kieny,M.-P.等,AIDS Bio/Technology4790,1986;Top,F.H.等,J.Infect.Dis.124148,1971;Chanda,P.K.等,Virology175535,1990),病毒或合成来源的颗粒(如Kofler,N.等,J.Immunol.Methods.19225,1996;Eldridge,J.H.等,Sem.Hemato.3016,1993;Falo,L.D.,Jr.等,Nature Med.7649,1995),佐剂(Warren,H.S.,Vogel,F.R.,和Chedid,L.A.Annu.Rev.Immunol.4369,1986;Gupta,R.K.等,Vaccine 11293,1993),脂质体(Reddy,R.等,J.Immunol.1481585,1992;Rock,K.L.,Immunol.Today17131,1996),或裸露或颗粒吸附的cDNA(Ulmer,J.B.等,Science2591745,1993;Robinson,H.L.,Hunt,L.A.,和Webster,R.G.,Vaccine 11957,1993;Shiver,J.W.等,InConcepts invaccine development,Kaufmann,S.H.E.,编,p.423,1996;Cease,K.B.,和Berzofsky,J.A.,Annu.Rev.Immunol.12923,1994和Eldridge,J.H.等,Sem.Hematol.3016,1993)。也可以使用毒素靶向送递技术,也称受体介导寻靶,如Avant Immunotherapeutics,Inc.(Needham,Massachusetts)的那些技术。
本发明的疫苗组合物包括核酸介导的形式。编码一个或多个本发明肽的DNA或RNA也可以给予患者。这个方法在例如Wolff等,Science 2471465(1990)以及美国专利5,580,859;5,589,466;5,804,566;5,739,118;5,736,524;5,679,647;WO98/04720中有描述,下面更详细地说明。基于DNA的送递技术实例包括“裸露DNA”,易化(布比卡因,聚合物,肽介导)送递,阳离子脂质复合体和颗粒介导(“基因枪”)或压力介导的送递(如见美国专利5,922,687)。
为了治疗或预防性免疫目的,可用病毒或细菌载体表达本发明的肽。表达载体的实例包括减毒病毒宿主,如痘苗或禽痘。这个方法包括使用痘苗病毒,例如,作为载体表达编码本发明肽的核苷酸序列。导入急性或慢性感染宿主或未感染宿主后,该重组痘苗病毒表达免疫原性肽,由此引起宿主CTL和/或HTL反应。在如美国专利4,722,848中描述了免疫方案中有用的痘苗载体和方法。另一载体是BCG(卡介苗)。Stover等,Nature 351456-460(1991)描述了BCG载体。对本发明肽的治疗性给药或免疫有用的各种其它载体,如腺病毒和腺病毒相关病毒载体,逆转录病毒载体,伤寒杆菌载体,去毒炭疽毒素载体等等,根据这里的说明书,这些对于本领域技术人员将很明显。
此外,根据本发明的疫苗包括一个或多个请求保护的肽的组合物。肽可以单独存在于疫苗中。可供选择地,该肽可以以含相同肽多个拷贝的均聚物存在,或以各种肽的杂聚物存在。聚合物具有增加免疫应答的优点,而且如果不同的肽表位用于组成聚合物,还具有诱导与要对其引起免疫应答的病原生物体或肿瘤相关肽的不同抗原决定簇反应的抗体和/或CTLs的另外能力。该组合物可以是抗原天然存在的区域或可以是制备的,如通过重组或化学合成。
可用于本发明疫苗的载体是本领域熟知的,包括如甲状腺球蛋白,白蛋白如人血清白蛋白,破伤风类毒素,聚氨基酸如聚L-赖氨酸,聚L-谷氨酸,流感,乙型肝炎病毒核心蛋白等等。疫苗可以含有生理耐受(即可接受)稀释剂如水,或盐水,优选磷酸缓冲盐水。疫苗也典型地包括佐剂。佐剂如不完全弗氏佐剂,磷酸铝,氢氧化铝或明矾是本领域熟知物质的实例。另外,如这里公开,本发明的肽与脂类如三棕榈酰-S-甘油半胱氨酰丝氨酰-丝氨酸(P3CSS)结合可致敏CTL反应。
通过注射,气雾剂,口服,经皮,经粘膜,胸膜内,鞘内或其它合适途径用根据本发明的肽组合物免疫,宿主的免疫系统对该疫苗产生反应,产生对期望抗原特异的大量CTLs和/或HTLs。所以,宿主变得至少部分对后来感染产生免疫,或至少部分抵抗发展为进行性慢性感染,或当抗原是肿瘤关联抗原时,至少得到一些治疗益处。
在一些实施方案中,可能希望将I类肽成分与诱导或利于针对感兴趣靶抗原的中和抗体和或辅助T细胞应答的成分组合。这种成分的优选实施方案包括根据本发明的I和II类表位。这种成分的可供选择的实施方案包括根据本发明的I类和/或II类表位和PanDR分子一起,如PADRETM(Epimmune,San Diego,CA;描述于例如美国专利5,736,142)。
本发明的疫苗也可包括抗原呈递细胞(APC),如树突细胞(DC)作为呈递本发明肽的载体。可以在树突细胞活动化和收获,由此在体外发生树突细胞的负载之后在体外产生疫苗组合物。例如,用如用根据本发明的小基因转染树突细胞,或用肽脉冲之。然后树突细胞可给予患者引起体内免疫应答。
基于DNA或肽的疫苗组合物也可以与树突细胞活动化组合体内给予,由此树突细胞的负载在体内发生。
抗原肽也用于引起离体CTL和/或HTL反应。所得CTL或HTL细胞可用于治疗对其它传统形式治疗不反应,或对根据本发明的治疗疫苗肽或核酸不反应的患者的慢性感染或肿瘤。组织培养中将患者的,或遗传学相容的,CTL或HTL前体细胞与APC来源,如DC和适当免疫原性肽一起培养可诱导对特定抗原(传染性或肿瘤关联抗原)的离体CTL或HTL反应。适当培养时间(典型大约7-28天)后,前体细胞被活化和扩增为效应细胞,该细胞回输给患者,在那里它们将破坏或利于破坏它们特异性的靶细胞(感染细胞或肿瘤细胞)。转染的树突细胞也可以用作抗原呈递细胞。
本发明的疫苗组合物也可以与用于慢性病毒感染的其它治疗组合使用,包括与免疫佐剂如IFN-γ等等组合使用。
优选地,当选择用于疫苗的多表位组合物内含的表位系列时,或用于选择待包含于疫苗中和/或被核酸如小基因编码的离散表位时,利用下列原则。为了进行选择,优选平衡下列每个原则。待引入给定疫苗组合物的多种表位可以是,但不必须是,在该表位来源的天然抗原中序列相邻。
1.)选择给药时模拟已经观察到与HBV清除有关的免疫应答的表位。对于I类HLA,这包括来自至少一个HBV抗原的3-4个表位。换句话说,已经观察到在自发清除HBV的患者中,他们已经对至少一个HBV抗原上至少3个表位产生免疫应答。对于II类HLA,使用类似的原则;再次从至少一个HBV抗原中选择3-4个表位(如见Rosenberg等Science2781447-1450)。
2.)选择具有已证实与免疫原性相关的必需结合亲和力的表位对于I类HLA,500nM或更低的IC50,常常是200nM或更低;对于II类,1000nM或更低的IC50。
3.)选择足够的超基元携载肽,或足够多的等位基因特异性基元携载肽系列以得到宽的人群覆盖度。例如,优选具有至少80%的人群覆盖度。可使用本领域已知的统计学评估法-蒙特卡罗(MonteCarlo)分析来评价人群覆盖度的宽度或丰余性(redundancy)。
4.)当选择来自癌症相关抗原的表位时,选择类似物常常有效,因为患者可能已经对天然表位产生了耐受。当选择传染性疾病相关抗原的表位时,优选选择天然或类似的表位。
5.)特别有意义的是称作“嵌套表位”的表位。当在给定肽序列中至少两个表位重叠时,产生嵌套表位。嵌套肽序列可包括I类HLA和II类HLA表位。当提供嵌套表位时,一般的目的是每个序列提供最大数量的表位。因此,一个方面是避免提供比肽的氨基末端表位的氨基末端和羧基末端表位的羧基末端还长的肽。当提供多表位序列,如含嵌套表位的序列时,为了确保它不具有病理或其它有害生物性能,筛选该序列通常很重要。
6.)如果产生多表位蛋白,或当产生小基因时,一个目的是产生包含感兴趣表位的最小的肽。该原则与当选择含嵌套表位的肽时使用的原则是类似的(如果不是相同的话)。然而,对于人工多表位肽,大小最小化的目的要与多表位蛋白中表位之间整合任何间隔序列的需要相平衡。可以例如导入间隔氨基酸残基来避免接合表位(junctional epitopes)(免疫系统识别的表位,不存在于靶抗原中,仅由表位人工并列产生),或便于表位间切割并因此增强表位呈递。通常避免接合表位,因为受体可能对该非天然表位产生免疫应答。要特别关注的是“优势表位”的接合表位。优势表位可能引起减少或抑制对其它表位的免疫应答的强烈反应。
7.)在可获得同一靶蛋白的多种变异体序列的情况下,也可以在它们保守性的基础上选自潜在肽表位。例如,保守性标准可以限定I类HLA结合肽的完整序列或II类结合肽的完整9-mer核心在对特定蛋白抗原评价的指定百分比的序列中保守。
IV.K.1.小基因疫苗可利用允许多种表位同时送递的很多不同方法。编码本发明肽的核酸是本发明特别有用的实施方案。优选根据前面部分列出的指导选择小基因包含的表位。给予编码本发明肽的核酸的优选方法使用编码含一个或多个本发明表位的肽的小基因构建体。
下面和在如共同待决申请U.S.S.N.09/311,784;Ishioka等,J.Immunol.1623915-3925,1999;An,L.和Whitton,J.L.,J.Virol.712292,1997;Thomson,S.A.等,J.Immunol.157822,1996;Whitton,J.L.等,J.Virol.67348,1993;Hanke,R.等,Vaccine16426,1998中描述了多表位小基因的使用。例如,可构造编码来自一个和多个HBV抗原的多个区域的超基元和/或基元携载表位,通用辅助T细胞表位,如PADRETM,(或来自HBV抗原的多个HTL表位)和内质网移位信号序列的多表位DNA质粒。疫苗与可以包含来自其它TAAs的表位。
可测试转基因小鼠中多表位小基因的免疫原性来评价对所测试表位的CTL诱导反应的大小。而且,DNA编码表位的体内免疫原性可与特定CTL系对DNA质粒转染的靶细胞的体外反应相关联。因此,这些实验可表明小基因有助于1.)产生CTL反应和2.)诱导的CTLs识别表达编码肽的细胞。
例如,为了产生编码所选的用于人细胞中表达的表位的DNA序列(小基因),该表位的氨基酸序列可以反向翻译。人密码子使用表可用于指导每个氨基酸的密码子选择。这些编码表位的DNA序列可以直接邻接,使得当被翻译后,产生连续多肽序列。为了优化表达和/或免疫原性,可以将另外的元件引入小基因设计中。可反向翻译并包含在小基因序列中的氨基酸序列实例包括I类HLA表位,II类HLA表位,遍在蛋白化信号序列,和/或内质网靶向信号。另外,包括与CTL或HTL表位相邻的合成(如聚丙氨酸)或天然存在的侧翼序列可以提高CTL和HTL表位的HLA呈递;这些包含该表位的较大肽在本发明的范围内。
通过装配编码小基因正和负链的寡核苷酸,小基因序列可以转变为DNA。可以使用熟知技术在适当条件下合成,磷酸化,纯化和退火重叠寡核苷酸(30-100个碱基长)。寡核苷酸的末端可以,例如,使用T4 DNA连接酶连接。这个编码表位多肽的合成小基因接着可以克隆到期望的表达载体中。
优选在载体中包括本领域技术人员熟知的标准调控序列来确保在靶细胞中表达。期望的几种载体元件是含为小基因插入的下游克隆位点的启动子;为有效转录终止的多腺苷酸化信号;大肠杆菌复制起点;和大肠杆菌选择标记(如氨苄西林或卡那霉素抗性)。很多启动子可用于这个目的,如人巨细胞病毒(hCMV)启动子。如见美国专利5,580,859和5,589,466的其它合适启动子序列。
期望另外的载体修饰以优化小基因表达和免疫原性。在有些情况下,有效基因表达需要内含子,一个或多个合成或天然存在的内含子可以引入小基因的转录区。为了增加小基因表达,也可以考虑包含mRNA稳定序列和在哺乳动物复制的序列。
一旦选择了表达载体,小基因就被克隆到启动子下游的多接头区。这个质粒转化到适当的大肠杆菌株中,使用标准技术制备DNA。使用限制性制图和DNA序列分析证实载体中小基因的定向和DNA序列,以及包含的其它元件。含有正确质粒的细菌细胞可保存为原始细胞库和工作细胞库。
另外,免疫刺激性序列(ISSs或CpGs)看来在DNA疫苗的免疫原性中起着作用。如果期望增加免疫原性的话,载体中可以包含这些序列在小基因编码序列之外。
在有些实施方案中,可以使用允许产生小基因编码肽和第二蛋白(导入以增加或降低免疫原性)的双顺反子表达载体。如果共表达的话,可有益增强免疫应答的蛋白或多肽实例包括细胞因子(如IL-2,IL-12,GM-CSF),细胞因子诱导分子(如LeIF)或共刺激分子。辅助(HTL)表位可与细胞内靶向信号连接并与表达的CTL表位分开表达;这允许指导HTL表位进入与CTL表位的区室不同的细胞区室。如果需要,这可促进HTL表位更有效地进入II类HLA途径,因此改善CTL诱导。与HTL或CTL诱导相反,通过免疫抑制分子(如TGF-β)的共表达特异性降低免疫应答在某些疾病中可能有益。
治疗数量质粒DNA可以通过例如在大肠杆菌中发酵,随后纯化而制备。按照熟知技术,将工作细胞库的等分试样用于接种生长培养基,并在摇瓶或生物反应器中长至饱和。可以使用标准生物分离技术如QIAGEN,Inc.(Valencia,California)提供的固相阴离子交换树脂纯化质粒DNA。如果需要,可使用凝胶电泳或其它方法从开放环状和线性形式分离超螺旋DNA。
可使用各种制剂制备纯化质粒DNA用于注射。这些中最简单的是在无菌磷酸缓冲盐水(PBS)中重新配制冻干DNA。这个方法,也称为“裸露DNA”,目前在临床试验中正用于肌肉内(IM)注射。为了使小基因DNA疫苗的免疫治疗作用达到最大,可能期望配制纯化质粒DNA的可供选择的方法。已经描述了各种方法,而且新技术可能可以利用。在制剂中可以使用阳离子脂类(如见WO93/24640;Mannino &Gould-Fogerite,BioTechniques6(7)682(1988);美国专利5,279,833;WO9I/06309和Felgner,等,Proc.Nat’l.Acad.Sci.USA847413(1987)。另外,统称为保护性的相互作用的非缩合化合物(PINC)的糖脂,促融合脂质体,肽和化合物也可以与纯化质粒DNA复合来影响变量如稳定性,肌肉内分散,或运输到特定器官或细胞类型。
靶细胞致敏可以用作小基因编码CTL表位的表达和I类HLA呈递的功能性试验。例如,将质粒DNA导入适合作为标准CTL铬释放试验靶的哺乳动物细胞系。使用的转染方法将依赖于最终的制剂。电穿孔可用于“裸露”DNA,而阳离子脂类允许指导体外转染。可共转染表达绿色荧光蛋白(GFP)的质粒以允许使用荧光细胞激活分类术(FACS)富集转染细胞。这些细胞然后用铬-51(51Cr)标记并用作表位特异性CTL系的靶细胞;51Cr释放检测的细胞溶解表明小基因编码CTL表位的产生和HLA呈递。
体内免疫原性是小基因DNA制剂功能性测试的第二个方法。用该DNA产物免疫表达适当HLA蛋白的转基因小鼠。给予的剂量和途径是制剂依赖性的(如对于PBS中的DNA,用IM,对于脂类复合DNA,用腹膜内(IP))。免疫后二十一天,收获脾细胞并在正测试的每个表位的编码肽存在下再次刺激1周。其后,对于CTL效应细胞,使用标准技术进行试验来分析负载肽的51Cr标记的靶细胞的细胞溶解。对应于小基因编码表位的肽的HLA负载致敏的靶细胞溶解证明DNA疫苗体内诱导CTLs的功能。以类似方式估计转基因小鼠中HTL表位的免疫原性。
可供选择地,使用如美国专利5,204,253所述的冲击送递法给予核酸。使用这个技术,给予只包括DNA的颗粒。在进一步的可供选择的实施方案中,DNA可与颗粒如金颗粒粘附。
也可以使用本领域熟知的其它细菌或病毒送递系统送递小基因,如编码本发明表位的表达构建体可引入病毒载体如痘苗病毒中。
IV.K.2.CTL肽和辅助细胞肽(helper peptide)组合可以修饰含本发明CTL肽的疫苗组合物提供期望的性质,如血清半衰期提高,人群覆盖度扩大或免疫原性增强。
例如,将肽与含有至少一个能诱导T辅助细胞应答的表位的序列连接可增强该肽诱导CTL活性的能力。例如在共同未决的申请U.S.S.N.08/820,360,U.S.S.N.08/197,484和U.S.S.N.08/464,234中阐述了使用T辅助细胞表位与CTL表位结合以增强免疫原性。
尽管CTL肽可直接与T辅助细胞肽连接,但常常CTL表位/HTL表位接合物通过间隔分子连接起来。间隔典型地由相对小的中性分子组成,如氨基酸或氨基酸模拟物,在生理条件下基本不带电荷。间隔典型地选自例如Ala,Gly或非极性氨基酸或中性极性氨基酸的其它中性间隔。将理解任选存在的间隔不需要由相同的残基组成,因此可以是异型或同型低聚物。当存在时,间隔将通常是至少一个或两个残基,更通常是三个至六个残基,有时是10个或更多残基。CTL肽表位可直接或通过CTL肽的氨基或羧基末端的间隔与T辅助细胞肽表位连接。免疫原性肽或T辅助细胞肽的氨基末端可以酰化。
在某些实施方案中,T辅助细胞肽是大多数人群中存在的T辅助细胞识别的肽。这可以通过选择结合许多,大多数,或全部II类HLA分子的肽来完成。这些称作“HLA宽松限制的”或“混杂”T辅助细胞序列。混杂的氨基酸序列实例包括来自抗原的序列,如破伤风毒素830-843位(QYIKANSKFIGITE;SEQ ID NO51484),恶性疟原虫环子孢子(CS)蛋白378-398位(DIEKKIAKMEKASSVFNVVNS;SEQ ID NO51485)和链球菌18kD蛋白116位(GAVDSILGGVATYGAA;SEQ ID NO51486)。其它实例包括携带DR 1-4-7超基元或DR3基元中任何一个的肽。
可供选择地,使用自然界未发现的氨基酸序列,制备能够以宽松HLA限制模式刺激T辅助淋巴细胞的合成肽是可能的(如见PCT出版物WO95/07707)。设计这些称作泛DR结合表位(pan-DR bindingepitopes)的合成化合物(如PADRETM,Epimmune,Inc.,SanDiego,CA)最优选结合大多数HLA-DR(人II类HLA)分子。例如,已经发现具有式aKXVAAWTLKAAa的泛DR结合表位肽,其中“X”是环己基丙氨酸,苯丙氨酸或酪氨酸,a是D-丙氨酸或L-丙氨酸,结合大多数HLA-DR等位基因,并刺激大多数个体的T辅助淋巴细胞的反应,无论其HLA类型如何。泛DR结合肽的替换物包含所有“L”天然氨基酸并可提供为编码该表位的核酸形式。
也可以修饰HTL肽表位,改变其生物性能。例如,可以修饰它们以包括D-氨基酸,从而增加其对蛋白酶的抗性并因此延长其血清半衰期,或它们可以与其它分子,如脂类,蛋白,碳水化合物等等结合而增加其生物活性。例如,T辅助细胞肽可以在氨基或羧基末端与一个或多个棕榈酸链结合。
III.K.3.CTL肽与T细胞致敏剂组合在有些实施方案中,可能期望本发明的药物组合物中包括致敏细胞毒性T淋巴细胞的至少一个成分。脂类已经鉴定为能够体内致敏抗病毒抗原的CTL的物质。例如,棕榈酸残基可以与赖氨酸残基的ε和α氨基连接,然后通过如一个或多个连接残基如Gly,Gly-Gly-,Ser,Ser-Ser等连接免疫原性肽。然后,脂化肽可直接在微团或颗粒中给予,或掺入脂质体中,或乳化于佐剂如不完全弗氏佐剂中给予。在优选实施方案中,特别有效的免疫原性组合物包含与Lys的ε和α氨基连接的棕榈酸,它通过键合,如Ser-Ser,与免疫原性肽的氨基末端连接。
脂类致敏CTL反应的另一个实例,大肠杆菌脂蛋白,如三棕榈酰-S-甘油半胱氨酰丝氨酰-丝氨酸(P3CSS),当与适当肽共价连接时,可用于致敏病毒特异性CTL(如见Deres,等,Nature 342561,1989)。例如,本发明的肽可与P3CSS连接,该脂肽施用给个体,特异性致敏对靶抗原的CTL反应。而且,因为结合P3CSS的表位也可以致敏中和抗体的诱导,两个这种成分可以组合,更有效地引起体液和细胞介导的反应。
也可以通过在肽的末端添加氨基酸来修饰CTL和/或HTL肽,以便于肽彼此之间的连接,与载体支持物或较大肽的偶连,修饰肽或寡肽的物理或化学性能等等。氨基酸如酪氨酸,半胱氨酸,赖氨酸,谷氨酸或天冬氨酸等等,可导入肽或寡肽,特别是I类肽的C或N末端。然而,要指出的是在有些情况下,CTL表位的羧基末端修饰可能改变肽的结合特性。另外,通过末端-NH2酰化修饰,如烷酰基(C1-C20)或硫基乙醇酰乙酰化,末端羧基酰胺化,如氨,甲胺等,肽或寡肽序列可与天然序列不同。在有些情况下,这些修饰可以提供连接支持物或其它分子的位点。
IV.K.4.含用CTL和/或HTL肽脉冲的DC的疫苗组合物根据本发明的疫苗组合物的实施方案包括离体将表位携载肽混合物施用给来自患者血液的PBMC,或从中分离的DC。可以使用利于收获DC的药剂,如ProgenipoietinTM(Monsanto,St.Louis,MO)或GM-CSF/IL4。用肽脉冲DC后且在再输入患者前,洗涤DC去除未结合的肽。在这个实施方案中,疫苗包括肽脉冲的DCs,其在它们表面上呈递与HLA分子复合的脉冲肽表位。
可以用肽(其中一些刺激对感兴趣的一个或多个HBV抗原的CTL反应)的混合物离体脉冲DC。任选地,可以包括辅助T细胞(HTL)肽如PADRE家族分子,以利于CTL应答。因此,优选含多个HBV抗原的表位的根据本发明的疫苗可用于治疗HBV感染。
IV.L.为治疗或预防目的给予疫苗本发明的肽和本发明的药物和疫苗组合物典型地用于治疗和/或预防HBV感染。含本发明肽的疫苗组合物给予感染HBV的患者或容易罹患HBV感染的个体,或其它存在HBV感染风险的人,引起抗HBV抗原的免疫应答并因此增强患者本身的免疫应答能力。
如这里讨论的,含本发明的CTL和/或HTL表位的肽,当被HLA分子呈递并接触该肽包含的表位特异性的CTL或HTL时,诱导免疫应答。肽(或编码它们的DNA)可单独给予,或作为一个或多个肽序列的融合物给予。肽接触CTL或HTL的方式对本发明不是关键的。例如,肽可以在体内或体外接触CTL或HTL。如果接触发生在体内,肽本身可给予患者,或可以使用其它载体,如编码一个或多个肽的DNA载体,编码该肽的病毒载体,脂质体等等,如这里所述。
当肽在体外接触时,接种物可包括细胞群,如肽脉冲的树突细胞,或HPV特异性CTLs,它们通过用肽体外脉冲抗原呈递细胞或用本发明的小基因转染抗原呈递细胞已经被诱导。这种细胞群随后以治疗有效量给予患者。
在治疗应用中,肽和/或核酸组合物以足以引起对病毒抗原的CTL和/或HTL反应和足以治愈或至少部分阻止或减慢症状和/或并发症的剂量给予患者。足以完成这些目的的量定义为“治疗有效量”。这个用途的有效量将依赖于例如给予的特定组合物,给药方式,正治疗的疾病的阶段和严重性,患者的体重和一般健康状况,和主治医师的判断。
对于药物组合物,本发明的免疫原性肽,或编码它们的DNA一般施用给已经感染HBV的个体。肽或编码它们的DNA可单独给予或作为一个或多个序列的融合物给予。可用免疫原性肽独立地或与其它适当的治疗结合治疗HBV感染患者。
对于治疗用途,一般应该在首次诊断HBV感染时开始给药。这之后加强剂量直到至少症状实质上减轻并持续其后一段时间。送递给患者的疫苗组合物的实施方案(即包括但不限于实施方案,如肽混合物,多表位多肽,小基因,或HBV抗原特异性CTLs或脉冲树突细胞)可以根据疾病阶段或患者的健康状况变化。例如,对于慢性HBV感染患者,含HBV特异性CTL的疫苗可能对杀死HBV感染细胞比可供选择的其它实施方案更有效。
在感染之前或期间鉴定出易感个体的情况下,组合物可以针对他们,由此减少给予更多人群的需要。
用于治疗或预防HBV感染的肽或其它组合物可以用于,例如没有表现症状的人。在这种情况下,提供给药方式送递的肽表位的量足以有效刺激细胞毒性T细胞反应一般很重要;刺激辅助T细胞反应的组合物也可以根据本发明的这个实施方案给予。
初次治疗免疫的剂量一般在单位剂量范围,其中较低值是大约1,5,50,500或1000μg,较高值是大约10000;20000;30000或50000μg。人的剂量值典型范围是每70公斤患者大约500μg至大约50000μg。根据数周至数月内的加强方案,可以给予大约1.0μg至大约50000μg肽的加强剂量可以给予数周或数月,这依赖于患者的反应和测定从患者血液得到的CTL和HTL特异活性确定的情况。应该连续给药直到至少临床症状或实验室测试表明病毒感染已经消除或降低且其后持续一段时间。根据本领域已知的方法调整剂量、给药途径和剂量安排。
在某些实施方案中,在严重疾病状态下,即,生命受到威胁或有潜在生命威胁的情况下,使用本发明的肽和组合物。在这种情况下,由于本发明的优选组合物中含最小量外来物质和肽的相对无毒性质,治疗医师可能且可以期望给予相对于这些规定剂量相当过量的这些肽组合物。
本发明的疫苗组合物也可以纯粹用作预防剂。初次预防免疫剂量一般在以下单位剂量范围内,其中较低值大约1,5,50,500或1000μg,较高值是大约10000;20000;30000或50000μg。人的剂量值典型范围从每70公斤患者大约500μg至大约50000μg。这之后是从初次给予疫苗后以限定的间隔给予大约1.0μg至大约50000μg肽的加强剂量,间隔为大约四周至六个月。测定从患者血液样品得到的CTL和HTL的特异活性可估计疫苗的免疫原性。
治疗用的药物组合物以肠胃外,局部,口服,鞘内,或局部(如霜或局部软膏)给药。优选肠胃外给予药物组合物,如静脉内,皮下,真皮内或肌肉内。因此,本发明提供了肠胃外给予的组合物,它包括溶于或悬浮于可接受载体,优选含水载体中的免疫原性肽溶液。可以使用各种含水载体,如水,缓冲水,0.8%盐水,0.3%甘氨酸,透明质酸等等。可以用常规,熟知的灭菌技术消毒这些成分,或可以过滤灭菌。所得含水溶液可以包装就此使用,或冻干,作为给药前与无菌溶液组合的冻干制剂。该组合物可以含有接近生理条件所需的药物可接受辅助物质,如pH调节和缓冲剂,张力调节剂,湿润剂,防腐剂等等,例如,醋酸钠,乳酸钠,氯化钠,氯化钾,氯化钙,脱水山梨醇单月桂酸酯,油酸合三乙醇胺等。
药物制剂中本发明肽的浓度可以广泛变化,即,从重量低于大约0.1%,通常是或至少大约2%至20%至50%之多或更多,并将主要由液体体积,粘滞性等,根据选择给药的特定模式选择。
肽组合物的人单位剂量形式典型地包含在含人单位剂量的可接受载体,优选含水载体的药物组合物中,并以本领域技术人员所知的用于这种组合物给药的液体体积给予人(如见Remington’sPharmaceutical Sciences,第17版,A.Gennaro,Editor,Mack式Publising Co.,Easton,Pennsylvania,1985)。
本发明的肽和/或编码该肽的核酸,也可以通过脂质体给予,也可以用来将肽导向特定组织,如淋巴组织,或选择性导向感染的细胞,以及增加肽组合物的半衰期。脂质体包括乳剂,泡沫,胶束,不溶性单层,液晶,磷脂分散体,片状层等等。在这些制剂中,待送递的肽作为脂质体的一部分单独或与结合淋巴细胞中普遍存在的受体结合的分子,如结合CD45抗原的单克隆抗体,或其它治疗或免疫原性组合物结合而引入。因此,期望的本发明肽填充或修饰的脂质体可指向淋巴细胞部位,然后在那里脂质体送递肽组合物。根据本发明使用的脂质体是从标准载体形成脂类形成的,它通常包括中性和带负电荷磷脂和甾醇如胆固醇。脂类的选择通常考虑如脂质体大小,酸不稳定性和脂质体在血流中的稳定性来进行。可利用各种方法制备脂质体,如Szoka,等,Ann.Rev.Biophys.Bioeng.9467(1980),和美国专利4,235,871,4,501,728,4,837,028,和5,019,369所述。
对于导向免疫系统的细胞,待引入脂质体的配体可包括,如期望的免疫系统细胞细胞表面决定簇特异性的抗体或其片段。含肽的脂质体悬液可以通过静脉内,局部,皮肤等给予,剂量根据尤其是,给药方式,正送递的肽和正治疗疾病的阶段而变化。
对于固体组合物,可以使用常规无毒固体载体,包括例如,药物级甘露醇,乳糖,淀粉,硬脂酸镁,糖精钠,滑石粉,纤维素,葡萄糖,蔗糖,碳酸镁等等。对于口服给药,药物可接受无毒组合物是通过掺入正常使用的任何赋形剂,如前面列出的那些载体,和通常10-95%的活性成分,即,一个或多个本发明的肽而形成,所述活性成分更优选25%-75%的浓度。
对于气雾剂给药,优选免疫原性肽以与表面活性剂和抛射剂一起以精细粉碎的形式提供。肽典型的百分比是0.01%-20%的重量,优选1%-10%。表面活性剂当然应该是无毒的,优选溶于抛射剂中。这种试剂的代表是6至22个碳原子的脂肪酸例如己酸,辛酸,月桂酸,棕榈酸,硬脂酸,亚油酸,亚麻酸,油硬酸和油酸,与脂肪族多元醇或其环状酐形成的酯或偏酯。可以使用混合酯,如混合或天然甘油酯。表面活性剂可以构成组合物重量的0.1%-20%,优选0.25-5%。组合物的余量一般是抛射剂。如所期望的,也可以包括载体,如用于鼻内传递的卵磷脂。
IV.M.试剂盒本发明的肽和核酸组合物可以以试剂盒形式,连同疫苗给药的说明书一起提供。典型地,试剂盒将包括在容器中的期望肽组合物(优选以单位剂量形式)和给药说明。可供选择的试剂盒将包括在容器中带有本发明期望核酸的小基因构建体(优选以单位剂量形式)连同给药说明。试剂盒中也可以包含淋巴因子如IL-2或IL-12。也可能期望包括的其它试剂盒成分包括,例如,无菌注射器,加强剂量和其它期望的赋形剂。
根据本发明的表位已成功用于诱导免疫应答。给予各种形式的表位已诱导这些表位的免疫应答。表位以肽,核酸和含编码本发明表位的核酸的病毒载体给予。给予基于肽的表位形式后,通过表位直接负载到细胞上表达的空HLA分子上,和通过表位内在化和经I类HLA途径加工已经诱导免疫应答,在任何一个事件中,表达表位的HLA分子接着能够和CTC相互作用并诱导CTL反应。肽可以直接送递或使用试剂如脂质体。此外,可使用冲击送递来送递它们,其中肽典型地采用结晶形式。当DNA用于诱导免疫应答,它可以以裸露DNA给予,通常以大约1-5mg的剂量范围,或通过冲击“基因枪”送递,典型地以大约10-100μg的剂量范围。DNA可以以各种构象送递,如线性,环状等。也已经成功使用包含编码本发明表位的核酸的各种病毒载体。
因此,根据本发明的组合物以多种形式存在。根据本发明的这些组合物形式的每一种的实施方案已经成功用于诱导免疫应答。
根据本发明的一个组合物包含多种肽。这种多种肽或肽混合物通常与一种或多种药物可接受赋形剂混合。肽混合物(Peptidecocktail)可以包含同一肽的多个拷贝或可以包含多种肽的混合物。该肽可以是天然存在表位的类似物。该肽可以包含人工氨基酸和/或化学修饰如添加表面活性分子,如脂化;乙酰化,糖基化,生物素化,磷酸化等。该肽可以是CTL或HTL表位。在优选的实施方案中,肽混合物包含多个不同CTL表位和至少一个HTL表位。该HTL表位可以是天然或非天然的(如PADRE_Epimmune Inc.,San Diego,CA)。本发明实施方案中不同表位的数量通常是从一至一百五十的全部整数(如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100或150)。
根据本发明的组合物的另外实施方案包括多肽多表位构建体,即多表位肽。使用本领域熟知的技术制备根据本发明的多表位肽。通过使用这些已知技术,根据本发明的表位彼此连接起来。多表位肽可以是线性或非线性的,如多价的。这些多表位构建体可以包含人工氨基酸,间隔(Spacing)或间隔(Spacer)氨基酸,侧翼氨基酸或相邻表位单位间的化学修饰。多表位构建体可以是杂聚物或同聚物。该多表位构建体通常包含2-150之间任何整数(如2,3,4,5,6,7,8,9,10,11,12,1 3,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100或150)数量的表位。多表位构建体可包含CTL和/或HTL表位。可以修饰构建体中一个或多个表位,如添加表面活性物质,如脂类,或化学修饰,如乙酰化等。而且,多表位构建体中的键可以不是肽键,如共价键,酯或醚键,二硫键,氢键,离子键等。
可供选择地,根据本发明的组合物包括含与天然序列具有同源性(即对应于或与其邻近)的氨基酸系列,序列,片段等的构建体。此氨基酸段包含至少一个氨基酸序列,如果从较长系列氨基酸切割或分离的话,该氨基酸序列起根据本发明的I类HLA或II类HLA表位的作用。在这个实施方案中,使用任何数量本领域已知或待提供的技术修饰肽序列使得变为这里定义的构建体。该多表位构建体可含有与天然序列具有70-100%中的任何整数增量的同源性,如百分之70,71,72,73,74,75,76,77,78,79,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,或100。
根据本发明的组合物进一步的实施方案是含根据本发明的一个或多个表位的抗原呈递细胞。抗原呈递细胞可以是“专门的”抗原呈递细胞,如树突细胞。抗原呈递细胞可以通过本领域已知或待确定的任何方法而包含本发明的表位。这些方法包括通过给予核酸如核酸冲击送递或本领域给予核酸的其它技术,包括基于载体(如病毒载体)的核酸送递,用一个或多个表位或含多个表位的一个或多个肽脉冲树突细胞。
根据本发明的组合物进一步的实施方案包括编码本发明一个或多个肽的核酸,或编码根据本发明的多表位肽的核酸。本领域任何一个技术人员可领会到,由于遗传密码的简并性,多种核酸组合物将编码同一肽。这些核酸组合物的每一个都落在本发明的范围内。本发明的这个实施方案包括DNA或RNA,在某些实施方案是DNA和RNA的组合。可以领会到含编码本发明肽或根据本发明的其它任何基于肽的组合物的核酸的组合物落在本发明的范围内。
可以领会到本发明基于肽(以及编码它们的核酸)的形式可包括使用本领域已知或待知的原则产生的本发明表位的类似物。模拟相关的原则是本领域现在已知的,并在这里公开;此外,1999年1月6日申请的共同未决的申请系列号U.S.S.N.09/226,775公开了模拟原则(构造畸形模拟)。通常本发明的组合物是分离或纯化的。V.实施例以下将用具体实施例更详细描述本发明。下列实施例是为了说明的目的提供的,不意欲以任何方式限制本发明。本领域技术人员容易认识各种非关键参数,该参数可以根据本发明改变或改动产生可供选择的实施方案。
实施例1I类和II类HLA结合试验结合HLA分子的肽的下列实施例显示了I类和II类HLA肽的结合亲和力的定量。可用基元携载或无基元携载的肽进行结合试验。
按照已公开的方案(Sidney等,Current Protocols inImmunology 18.3.1(1998);Sidney,等,J.Immunol.154247(1995);Sette,等,Mol.Immunol.31813(1994))制备细胞溶解产物和纯化HLA分子。这些出版物中也描述了用作HLA分子来源的细胞系和用于从细胞溶解物中提取HLA分子的抗体。
非洲淋巴瘤病毒(EBV)转化的纯合细胞系,成纤维细胞,CIR或721.221转化体用作I类HLA分子的来源。用添加2mML谷氨酰胺(GIBCO,Grand Island,NY),50μM 2-ME,100μg/ml链霉素,100U/ml青霉素(Irvine Scientific)和10%热灭活FCS(IrvineScientific,Santa Ana,CA)的RPMI 1640培养基培养体外维持这些细胞。细胞在225m2的组织培养瓶中生长,对于大规模培养,在摇瓶装置中生长。
如下制备细胞溶解产物。简言之,细胞在1080个细胞/ml浓度下,在含1%Nonidet P-40(Fluka Biochemika,Buchs,瑞士),150mMNaCl,5mM EDTA和2mM PMSF的50mM Tris-HCl,pH8.5中裂解。15,000xg离心30分钟清除溶解产物中的杂质和核。
通过亲和层析从溶解产物中纯化HLA分子。溶解产物两次通过灭活Sepharose CL4-B和蛋白A-Sepharose两个预制柱。接下来,溶解产物通过结合适当抗体的Sepharose CL-4B珠柱。接着用10柱体积的在1%NP-40,PBS中的10mM Tris-HCL,pH8.0,2柱体积PBS,和含0.4%正辛基葡糖苷的2柱体积PBS洗涤抗HLA柱。最后,用含50mM二乙胺,0.4%正辛基葡糖苷,pH11.5的0.15M NaCl洗脱MHC分子。洗脱物中加入1/25体积的2.0M Tris,pH6.8使pH降低至~8.0。然后,在Centriprep30浓缩器中以2000rpm(Amicon,Beverly,MA)离心浓缩洗脱物。BCA蛋白试验(Pierce ChemicalCo.,Rockford,IL)估计蛋白含量并用SDS-PAGE证实。
用于测定肽与I类和II类MHC结合的方案的详细描述已经公开(Sette等,Mol.Immunol.31813,1994;Sidney等,见Current Protocols in Immunology,Margulies,Ed.,JohnWiley & Sons,New York,Section 18.3,1998)。简言之,纯化的MHC分子(5至500nM)与各种未标记的肽抑制剂和1-10nM125I放射性标记的探针肽在含0.05% Nonidet P-40(NP40)(或对于H-2 IA试验用20%w/v洋地黄皂甙)的PBS中,蛋白酶抑制剂混合物存在下,孵育48小时。蛋白酶抑制剂(每种来自CalBio Chem,LaJolla,CA)的终浓度是1mM PMSF,1.3nM 1.10二氮杂菲,73μM胃蛋白酶抑制剂A,8mM EDTA,6mM N-乙基马来酰亚胺(对于II类试验)和200μMN-α-p-甲苯磺酰基-L-赖氨酰氯甲酮(TLCK)。所有试验在pH7.0进行,除了DRB1*0301,它在pH4.5进行,和DRB1*1601(DR2w21 β1)和DRB4*0101(DRw53),它们在pH5.0进行。如别处(见Sidney等,于Current Protocols in Immunology,Margulies,Ed.,JohnWiley & Sons,New York,Section 18.3,1998)所述调整pH。
孵育后,在7.8mm×15cm TSK200柱(TosoHaas16215,Montgomeryville,PA)中凝胶过滤,用含0.5% NP40和0.1%NaN3的PBS pH6.5,以1.2mls/min洗脱,使MHC-肽复合体与游离肽分离。因为用于DRB1*1501(DR2w2β1)试验的放射性标记的肽的大小很大,使得在这些条件下分离结合和未结合峰更加困难,所以所有DRB1*1501(DR2w2β1)试验使用7.8mm×30cm TSK2000柱进行,以0.6mls/min洗脱。TSK柱的洗脱物经过Beckman170放射性同位素检测器,绘制放射活性并使用Hewlett-Packard 3396A积分仪积分,确定结合肽馏分。
用氯胺-T方法碘化放射性标记的肽。表IV和V总结了每个试验中使用的代表性的放射性标记探针,和试验特定的IC50nM。典型地,在初步实验中,在固定量放射性标记的肽存在下滴定每个MHC制剂,确定结合全部放射活性的10-20%所需HLA分子的浓度。用这些HLA浓度进行所有随后的抑制和直接结合试验。
由于在这些条件下[标记物]<[HLA]和IC50≥[HLA],测定的IC50值是真实KD值的合理近似值。典型地在120μg/ml至1.2ng/ml范围的浓度下测试肽抑制剂,在两个或四个完全独立的实验中测试。为了允许比较不同实验得到的数据,用每个测试肽的IC50(典型地,放射性标记探针肽的未标记形式)除抑制阳性对照的IC50计算每个肽的相对结合值。对于实验间比较,汇编相对结合值。这些值随后可通过感兴趣肽的相对结合除抑制阳性对照的IC50nM转变回IC50nM值。已经证明数据汇编的这个方法是最精确的,与比较不同天测试的肽或不同批次纯化的MHC测试一致。
因为用于HLA-DR纯化的抗体(LB3.1)是α链特异性的,β1分子不与β3(和/或β4和β5)分子分开。对于DRB1*0101(DR1),DRB1*0802(DR8w2)和DRB1*0803(DR8w3)的情况,结合试验的β1特异性是显而易见的,它们不表达β3。对于DRB1*0301(DR3)和DRB3*0101(DR52a),DRB1*0401(DR4w4),DRB1*0404(DR4w14),DRB1*0405(DR4w15),DRB1*1101(DR5),DRB1*1201(DR5w12),DRB1*1302(DR6w19)和DRB1*0701(DR7),也已经证明。DRB1*1501(DR2w2β1),DRB5*0101(DR2w2β2),DRB1*1601(DR2w21β1),DRB5*0201(DR51Dw21)和DRB4*0101(DRw53)试验的β链特异性的问题通过成纤维细胞的应用而避免。以前已经描述了关于DRβ分子特异性的试验的发展和有效性(如见Southwood等,J.Immunol.1603363-3373,1998)。
上面略述的结合试验可以用于分析超基元和/或基元携载表位,如例如实施例2所述。
实施例2.保守的HLA超基元CTL候选表位的鉴定本发明的疫苗组合物可包括含多个HLA超基元或基元的多个表位,以达到广泛的人群覆盖度。这个实施例阐述了用于包含在这种疫苗组合物内的超基元携载表位的鉴定。用下面描述的策略进行人群覆盖度的计算。然后选择携带HLA-A2,-A3或-B7超基元或HLA-A1或-A24基元的表位。
用于鉴定超基元和/或基元携载表位的计算机检索和算法如下进行携载I类或II类HLA超基元或基元的表位的计算机检索。使用文本串搜索软件程序如MotifSearch1.4(D.Brown,SanDiego)分析所有翻译的HBV分离株序列,鉴定含适当HLA结合基元的可能肽序列;考虑到这里公开的基元/超基元,根据本领域的信息容易产生可供选择的程序。此外,可以脑力进行这种计算。用多项式算法对鉴定的A2-,A3-和DR-超基元序列打分,预测它们结合特定I类或II类HLA分子的能力。这些多项式算法考虑延伸的和精细的基元(即,解释不同位置的不同氨基酸的影响),并且主要基于前提肽-HLA分子相互作用的总体亲和力(ΔG)可近似为以下类型的线性多项式函数“ΔG”=a1ixa2ixa3i...xani其中,aij是代表沿n个氨基酸的肽序列在给定位置(i)给定氨基酸(j)的存在的作用的系数。本方法的关键假设是在每个位置的作用基本上彼此独立(即各个侧链的独立结合)。当残基.j出现在肽的i位置时,假定给肽结合的自由能贡献常量ji,而不考虑肽剩余的序列。证实了肽基本上以伸展的构象结合HLA分子和被T细胞识别的我们实验室的研究证明了这个假定(这里省略了数据)。
Gulukota等,J.Mol.Biol.2671258-126,1997(也见Sidney等,Human Immunol.4579-93,1996;和Southwood等,J.Immunol.1603363-3373,1998)已经描述了具体算法系数推导的方法。简言之,对于固定和非固定样的所有i位置,计算相对于该组的剩余者而言携带j的所有肽的平均相对结合(ARB)的几何平均数,用作ji的估计值。对于II类肽,如果多比对是可能的,则在重复程序(iterative procedure)之后仅利用最高分比对。为了计算测试组中给定肽的算法分值,将对应于肽序列的ARB值乘积。如果这个乘积超过了选择的阈值,预测该肽将结合。适当的阈值选择为期望的预测严格程度的函数。
HLA-A2超型交叉反应肽的选择利用定制的计算机程序对来自20个HBV分离株的完整序列进行比对,然后扫描,鉴定含HLA-A2-超型主要固定特异性的保守的9-和10-mer序列。
鉴定到共150个保守和基元阳性序列。然后使用A*0201特异性多项式算法估计这些肽的A*0201优选的二级固定残基的存在。选择和合成了共85个保守的基元阳性序列。
接着测试这85个保守的含基元的9-和10-mer肽体外结合纯化HLA-A*0201分子的能力。发现三十四个肽是好的A*0201结合者(IC50≤500nM);15个是高度结合者(IC50≤50nM),19个是中等结合者(IC50是50-500nM)(表XXVI)。
在独立分析过程中,也合成25个保守的来自HBV的,含适当A2超型主要固定残基的8或11-mer序列并检测其对A*0201的结合。一个肽,HBV env 259 11-mer(肽1147.14),以500nM或更低的IC50结合A*0201,表XXVI已包括它。表XXVI也显示了类似肽,代表了HBV pol 538 9-mer肽的单一置换,其以5.1nM的IC50结合A*0201(见下)。
随后测试36个A*0201结合者中30个结合另外的A2超型等位基因(A*0202,A*0203,A*0206和A*6802)的能力。如表XXVI显示的,发现15/30(50%)肽是A2超型交叉反应结合者,结合所测试的5个A2超型等位基因中至少3个。选择这15个肽进一步分析。
HLA-A3超基元携载表位的选择也检测了20个相同分离株序列中含HLA-A3超基元一级固定残基的保守肽的存在。鉴定了共80个保守的9-或10-mer含基元的序列。使用A03和A11算法进一步分析鉴定到一个或两个算法中分值都高的40个序列。合成相应的三十六个肽并测试与两个最流行的A3超型等位基因-HLA-A*03和HLA-A*11的结合。鉴定了以亲和力或IC50≤500nM结合A3和/或A11的二十三个肽(表XXVII)。
在独立的系列研究过程中,选择在75%或更多的分离株中保守的30个来自HBV的8-mer和24个11-mer序列并测试A*03和A*11结合。发现四个8-mer和9个11-mer结合一个或两个等位基因(表XXVII)。最后,已经鉴定了用上面概括的检索标准没有选择、但显示出结合A*03和/或A*11的四个9-mer和一个10-mer的保守的HBV来源肽,表XXVII包括了这些肽。这些肽中的两个含有非典型固定残基(肽20.0131和20.0130),另外3个是算法阴性的(肽1142.05,1099.03,和1090.15)。
随后测试结合A*03和/或A*11的41个肽中38个与其它常见A3超型等位基因(A*3101,A*3301和A*6801)的结合交叉反应性。发现这些肽中17个是A3超型交叉反应性的,结合所测试5个A3超型等位基因中至少3个(表XXVII)。
HLA-B7超基元携载表位的选择当也分析相同20个分离株中含HLA-B7超基元的保守的9-或10-mer肽的存在时,鉴定到46个序列。合成相应的三十四个肽并测试与最普通的B7超型等位基因HLA-B*0702的结合。九个肽≤500nM的IC50值结合B*0702(表XXVIII)。然后测试这九个肽对其它普通B7超型等位基因(B*3501,B*51,B*5301和B*5401)的结合。9个B*0702结合者中五个能够结合所测试5个B7超型等位基因中的3个或更多。
在调查B7超型等位基因的二级固定必要条件的独立研究中,测试所有可得到的含B7超型的肽与所有B7超型等位基因的结合。结果,也测试上述所有34个肽与其它B7超型等位基因的结合。这些实验鉴定到另外10个肽,它们≤500nM的IC50值结合至少一个B7超型等位基因,包括结合3个或更多等位基因的2个肽。表XXVIII也显示了这10个肽。
由于与A2和A3超型比较,保守B7超型的简并的HBV来源的9-和10-mer肽的数量低,再次检测这20个分离株以鉴定保守的含基元的8-mer和11-mer。再次扫描鉴定到51个肽。合成这些中的三十一个并测试与5个最常见B7超型等位基因每一个的结合。十九个8-和11-mer肽与至少一个B7超型等位基因以高或中等亲和力(IC50≤500nM)结合(表XXVIII)。两个肽是简并结合者,结合所测试的5个等位基因中的3个。
总之,已经鉴定了共9个来自HBV、在75%或更多所分析的分离株中保守、是简并B7超型结合者的肽(表XXVIII)。
A1和A24基元携载表位的选择为了进一步增加人群覆盖度,HLA-A1和A24表位已经引入本分析中。A1平均在五个不同主要人种群体(白种人,北美黑人,中国人,日本人和西班牙人)人口的12%中存在,A24以大约29%存在。在这些相同人群中,组合这些等位基因将以39%的平均频率出现。当A1和A24与A2-,A3-和B7超型等位基因组合时,主要人种的总覆盖度>95.4%;相比之下,A2-,A3-和B7-超型组合的覆盖度是86.2%。
对于HBV的A1和A24结合者的系统分析尚未完成。然而,在独立研究过程中,已经鉴定到15个保守的来自HBV的肽,它们以低于500nM的IC50结合A*0101;这些肽中有7个IC50低于100nM。在类似情况中,也已经鉴定了14个保守的结合A*2402的来自HBV的肽,其中6个以低于100nM的IC50结合A*2402(表XXIX)。
实施例3免疫原性的证实A*0201免疫原性的估计表XXX总结了上面鉴定的15个来自HBV的HLA-A2超型交叉反应肽的免疫原性分析。用三个系统中至少一个筛查肽的免疫原性。使用人PBMC筛选肽对原始抗原特异性CTL的体外诱导(Wentworth等,Molec.Immunol.32603,1995);这个数据在表XXX中表示为“原始CTL(primary CTL)”。
Wentworth等(Wentworth等,Molec.Immunol.32603,1995)已经描述了从人PBMC体外诱导原始抗原特异性CTL的方案。已富集CD8+T细胞的来自正常供体的PBMC与负载肽的抗原呈递细胞(SAC-I活化的PBMCs)在IL-7存在下培养。七天后,用肽脉冲的辐射过的自体粘附细胞再次刺激培养物,然后七天后测试细胞毒活性。
此外,HLA转基因小鼠用于估计肽免疫原性,这个数据在表XXX中表示为“转基因CTL”。以前的研究已经表明A*0201/Kb转基因小鼠中诱导的CTL显示出类似于人中CTL诱导的特异性(Vitiello等,J.Exp.Med.1731007,1991;Wentworth等,Eur.J.Immunol.2697,1996)。
Vitiello等(Vitiello等,J.Exp.Med.1731007,1991)和Alerander等(Alexander等,J.Immunol.1594753,1997)已经描述了肽免疫后转基因小鼠的CTL诱导。简言之,合成肽(50μg/小鼠)和辅助表位HBV核心128(140μg/小鼠)乳化于不完全弗氏佐剂(IFA)中并在尾基部皮下注射。注射后十一天,在负载肽的同基因LPS母细胞存在下培养脾细胞。六天后,用肽脉冲的靶检测培养物的细胞毒活性。
也测试了在急性HBV感染患者中肽刺激回忆CTL反应(recallCTL response)的能力(Bertoni等,J.Clin.Invest.100503,1997;Rehermann等,J.Clin.Invest.971655-1665,1996;Nayersina等,J.Immunol.1504659,1993);这些数据在表XXX中表示为“患者CTL”。患者免疫原性数据特别能够提供信息,因为它表示在天然感染过程中肽被识别。这些数据证明肽被加工和呈递在将作为CTL的靶的人细胞中。而且,这个数据与疫苗设计特别相关,因为患者CTL反应诱导已经与感染消散相关。
对于回忆CTL反应的评价,如Bertoni等(Bertoni等,J.Clin.Invest.100503,1997)所述进行筛选。简言之,在10μg/ml合成肽存在下,培养来自急性HBV感染患者的PBMC。七天后,用肽再次刺激培养物。在第14天,用肽脉冲的靶细胞检测培养物的细胞毒活性。
在15个A2超型结合肽中,发现有11个在至少一个所用的系统中具有免疫原性。以前已经在急性HBV患者中鉴定了这11个肽中的5个(Bertoni等,J.Clin.Invest.100503,1997)。五个另外的简并肽(1069.06,1090.77,1147.14,927.42和927.46)诱导了HLA-A*0201转基因小鼠的CTL反应。这11个免疫原性超型交叉反应性肽由三个HBV抗原编码;核心,包膜和聚合酶。
这组11个免疫原性A2超基元携载表位包括一个类似肽1090.77。野生型肽1090.14(这个类似物来源的野生型肽)是A2超型无交叉反应性的,但已经显示在急性HBV患者的回忆CTL反应中被识别,在HLA-A*0201转基因小鼠以及原代人培养物中具有免疫原性(表XXX)。下面详细描述了探寻野生型肽1090.14和1090.77类似物交叉识别的进一步研究。
在独立分析过程中,发现表XXXb显示的14个无交叉反应性肽,包括1090.14,在至少一个系统中是免疫原性的。这些肽中的五个肽在患者中被识别;4个肽在转基因小鼠中诱导CTL。
总之,已经鉴定了11个A2超型交叉反应性肽,它们在所检测的三个系统的至少一个中能够显示出免疫原性。
A*03/A11免疫原性的评价评价了17个A3超型交叉反应性肽中7个的免疫原性(表XXXI)。如前面部分所述,用原代培养物,患者应答或HLA-A11转基因小鼠筛选A3超基元携载肽(Alexander等,J.Immunol.1594753,1997)。除了肽1.0219之外,发现插表XXXI中所列的所有保守交叉反应肽具有免疫原性。
另外,发现显示交叉反应超型结合的保守性低的肽(1150.51;40%保守)在转基因小鼠中具有免疫原性,表XXXI中已包括该肽。已经显示两个其它的保守但无交叉反应的肽在急性HBV感染患者中被识别(Bertoni等,J.Clin.Invest.100503,1997)。表XXXI显示了这些表位。
值得注意的是,对于8个保守的免疫原性的来自HBV的A3超基元携载表位中的7个,包括所有6个交叉反应肽,从患者得到了阳性数据。这些表位主要来自聚合酶蛋白序列,只有一个表位来自核心蛋白序列。尽管在X抗原中已经鉴定了大量交叉反应肽(表XXXI),迄今为止,没有筛选这些肽的免疫原性。
总之,已经鉴定了7个携带A3超基元的交叉反应肽,它位在急性感染患者中被CTL识别,或在HLA转基因小鼠中诱导CTL。
B7免疫原性的评价表XXXII总结了有关来自HBV的携带HLA-B7超基元的交叉反应肽的免疫原性研究。只在测定原代培养物或急性HBV感染患者中反应的人系统中筛选HLA-B7肽。筛选的7个简并肽中,4个显示具有免疫原性。一个无交叉反应的肽(XRN<3)1147.04也显示在急性HBV感染患者中被识别的 (Bertoni等,J.Clin.Invest.100503,1997;见表XXXII)。
总之,已经鉴定了在急性HBV感染患者中被识别的5个保守的来自HBV的B7超基元携载表位。这些表位提供了4个不同HBV抗原(核心,包膜,聚合酶和X)的覆盖度。
实施例4通过产生类似物实现延伸的超基元以提高天然肽的结合能力HLA基元和超基元(包括一级和/或二级残基)在制备高度交叉反应天然肽中有用,如这里证明的。而且,HLA基元和超基元的定义也允许人们通过鉴定天然肽序列内可被模拟或修整”的残基而改造高度交叉反应表位,赋予肽以某些特征,如在组成超型的HLA分子组内更高的交叉反应性,和/或对一些或全部那些HLA分子的更高的结合亲和力。提供了显示调节的结合亲和力的类似肽的实例。
对一级固定残基模拟已经表明I类肽配体可以被修饰,或“修整”而增加它们的结合亲和力和/或简并性(Sidney等,J.Immunol.1573480,1996)。这些修整的肽也可以证明免疫原性增加和被野生型表位特异性的T细胞交叉反应识别(Parkhurst等,J.Immunol.1572539,1996;Pogue等,Proc.Natl.Acad.Sci.USA928166,1995)。特别是,A2超型肽的主要固定残基(main archors)可以在位置2被“修整”,或模拟为L或V(或M,如果是天然的),和在C末端为V。如表XXVI指出的,14个A2超型交叉反应结合肽中的9个可以被这些标准修整”,21个无交叉反应结合者中的16个也是如此。修整的理想候选者将是以IC50≤5000nM结合至少3个A2超型等位基因特异性分子的肽。
肽1090.14的情形提供了这个产生更宽交叉反应肽策略之功效的例子(表XXVI)。以前,这个肽在所检测的每个系统中显示出高免疫原性。然而,它仅仅显示出结合单一A2超型等位基因特异性分子A*0201。这个肽无交叉反应结合能力限制人群覆盖度,所以限制这个肽包括在候选疫苗中的价值。在增加结合亲和力和交叉反应性的工作中,肽1090.14的C末端由“丙氨酸”变为A2超基元优选残基“缬氨酸”。这个改变导致对A*0201的结合亲和力急剧(40倍)增加(从200nM至5.1nM),还产生了能够结合3个其它A2超型等位基因特异性分子的肽(见肽1090.77,表XXVI)。
对HLA-A*0201转基因小鼠的研究已经表明1090.77肽免疫小鼠的CTL反应识别加载天然肽1090.14或缬氨酸置换的类似物(即1090.77)的靶细胞。事实上,不论是类似物还是野生型序列用于负载靶细胞,不能区分1090.77诱导的CTL引起的细胞溶解(B.Livingston,未发表数据)。
用有效病毒复制抑制剂拉米夫定治疗慢性HBV患者的研究表明这些观察结果与疫苗构建体设计的相关性。用拉米夫定长期治疗导致选择在1090.14肽位置2缬氨酸置换甲硫氨酸的耐药HBV株,提示用于和拉米夫定组合的基于表位的疫苗可能需要具有诱导识别野生型和突变序列两者的CTL反应的能力。
为了证明天然肽(1090.14),类似肽和拉米夫定诱导的突变M2肽之间可能交叉识别,用1090.77类似肽产生CTL。接着用野生型肽(1090.14)或拉米夫定诱导的突变M2肽刺激这些CTL培养物。然后检测这些CTL溶解负载野生型,或拉米夫定诱导的突变肽的靶细胞的能力。任何一个CTL培养物均类似地溶解了呈递二者任何一个肽的靶细胞(表XXVI)。
这些研究证明当仍允许野生型和突变表位间交叉识别时,模拟一个肽可如何引起HLA-A2超型简并性急剧增加。更特别是,这些结果表明利用类似肽1090.77的疫苗应该刺激将识别野生型和抗拉米夫定HBV株的反应。
类似地,也可以产生HLA-A3超基元携载表位的类似物。例如,可以模拟肽使得在位置2具有优选的V,和在C末端具有R或K。表XXVII鉴定的12个A3超型简并肽是主要固定残基修整的候选者,如同24个无交叉反应结合者中的19个一样。
首先测试类似肽对A*03和A*11的结合,然后将检测那些相对于亲本肽显示等同或提高的结合亲和力的那些肽的A3超型交叉反应性。然后,如果需要,进一步评价显示交叉反应性提高的类似物的免疫原性。
典型地,鉴定B7超基元携载表位更困难。如A2和A3超型表位的情况,可利用肽模拟策略产生交叉反应结合增加的另外的B7超基元携载表位。通常,应该修整B7超基元携载表位使其在位置2具有P,在它们的C末端具有I。
合成代表在两个不同B7样肽(HBV env 313和HBV pol 541)C末端用I残基置换一级固定单一氨基酸残基的类似物并测试它们的B7超型结合能力。发现I置换对两种情况的结合亲和力和/或交叉反应性都具有整体积极作用。在HBV env 313的情况下,I9(I在C末端位置9)取代对增加交叉反应性有效,依靠增加几乎400倍的B*5401结合亲和力,结合的等位基因从4个增至5个。在HBV pol541情况下,B*5401结合大大增加实现了类似的交叉反应性增加。而且,观察到HBV pol 541 I9类似物对B*0702,B51和B*5301结合亲和力明显增加。
对二级固定残基模拟此外,HLA超基元在通过鉴定与交叉反应性能关联的二级固定位置的特定残基而设计高交叉反应肽中有价值。为了证明这一点,合成代表在五个不同B7超型结合肽位置1和3独立的单一氨基酸置换的第二组肽,测试它们的B7超型结合能力。在4/4情况中,位置1用芳香残基F(“F1”置换)取代天然残基的作用引起与亲本肽相比,交叉反应性增加,且在大多数情况下,结合亲和力增加三倍或更好(表XXVIII)。更特别的是,对HBV env 313,MAGE2 170,和HBV core168,F1置换类似物达到了全部超型交叉反应性。这种结果是通过急剧增加B*5401结合亲和力实现的。而且,在HBV core 168(B*3501和B*5301)和MAGE2 170(B*3501,B51和B*5301)的情况下,注意到对其它等位基因的亲和力增加。最后,在MAGE3 196的情况下,F1替代对增加交叉反应性有效,因为B*0702结合增加。也注意到B51结合能力增加几乎70倍。
位置3用超基元阳性F置换(“F3”置换)也制备了两个类似物。在两种情况下,获得了结合亲和力和交叉反应性增加。特别是,在HBV pol 541情况下,F3置换对增加交叉反应性有效,这依靠其对B*5401结合的作用。在MAGE3 196情况下,通过增加B*0702和B*3501结合能力,达到了完全超型交叉反应性。而且,在MAGE3 196情况下,值得注意的是对B*3501,B51,B*5301和B*5401,结合能力增加了40至5000倍。
总之,这些数据证明通过使用甚至单一氨基酸置换,可能增加肽配体对HLA超型分子的结合亲和力和/或交叉反应性。
实施例5含HLA-DR结合基元的保守的HBV序列的鉴定也可以如下文所述使用实施例1-3所述的类似方法鉴定携载II类HLA超基元或基元的肽表位。
HLA-DR超基元携载表位的选择II类HLA分子典型地结合长度在12和20个残基之间的肽。然而,与I类HLA类似,相互作用的特异性和能量通常包含在大约9个残基的短核心区域中。多数DR分子在这个9-mer核心内享有重叠的特异性,其中位置1(P1)的疏水残基是主要固定残基(O’Sullivan等,J.Immunol.1472663,1991;SouthWood等,J.Immunol.1603363,1998)。位置6(P6)存在小或疏水残基对多数DR-肽相互作用也很重要。这个在9-mer核心区域重叠的P1-P6的特异性,已经定义为DR超基元。不象I类分子,DR分子在结合沟两个末端开放,并因此可容纳长度变化的更长肽。事实上,尽管看来肽-DR相互作用的多数能量由核心区域提供,但是看来侧翼残基对高亲和力相互作用很重要。而且,尽管不是MHC结合严格所需的,在大多数情况下,T细胞识别明显必需侧翼残基。
为了鉴定来自HBV的DR交叉反应HTL表位,扫描为鉴定I类HLA基元序列而扫描的相同的20个HBV多蛋白中含结合HLA-DR的基元的序列的存在。特别地,选择由含DR超基元的9-mer核心和三残基N和C末端侧翼区域组成的15-mer序列。也需要15-mer序列的100%在扫描的至少85%(17/20)的HBV株中保守。使用这些标准,鉴定到36个非冗余序列。随后合成三十五个这些肽。
也已经建立了预测结合DR分子的肽的算法(Southwood等,J.Immunol.1603363,1998)。对各个DR分子特异的这些算法允许对9-mer核心区域的打分和评级。使用选择表,已发现这些算法有效选择高几率结合适当DR分子的肽序列。另外,已发现依次运行这些算法,特别是对DR1,DR4w4和DR7的那些算法,可有效地选择DR交叉反应肽。
为了看看这些算法是否可鉴定另外的肽,重新扫描上面使用的相同HBV多蛋白中15-mer肽的存在,其中100%9-mer核心区域有385%(17/20株)保守性。接下来,用DR1,DR4w4和DR7算法对这些肽每一个的9-mer核心区域打分。结果,鉴定到8个另外的序列并进行合成。
总之,鉴定到44个15-mer肽,其中9-mer核心区域含有DR超基元或是用预测DR结合序列的算法选择的。合成了四十三个这些肽(表XXXIII)。
执行上述来自HBV的肽的分析时,也鉴定了在其DR1,DR4w4和DR7算法谱基础上预测是DR交叉反应结合肽,但具有仅80%保守的9-mer核心区域的9个肽。以前合成了含有95%保守的DR超基元核心区域的,但位于离N末端仅一个残基的另外的肽。也选择这10个肽进行进一步分析,表XXXIII显示了这些肽。
最后,考虑对含上面选择的肽(27.0280)冗余的2个肽,CF-08和1186.25作另外的分析。肽1186.25含有多个DR超基元序列。肽CF-08是嵌套27.0280和1186.25的20-mer肽。这些肽在表XXXIII中显示。
测试上面鉴定的55个来自HBV的肽结合普通HLA-DR等位基因的能力。为了使人群覆盖度以及多数DR等位基因的结合清单(repertoires)间的关系二者均最大化(见例如Southwood等J.Immunol.1603363,1998),筛选肽与DR试验的顺序板的结合。这些筛选板的成分,相关抗原的表型频率在表XXXIV中显示。首先测试所有肽与一级板DR1,DR4w4和DR7中等位基因的结合。然后在二级试验(DR2w2β1,DR2w2β2,DR6w19和DR9)中仅测试结合这3个等位基因中至少2个的肽的结合。最后,在三级试验(DR4w15,DR5w11和DR8w2)中仅筛选结合4个二级板等位基因中的至少2个,因此总共结合7等位基因中的4个的肽的结合。
测试时,发现原始的55个肽中有25个(45%)结合两个或更多一级板等位基因。当随后在二级试验中测试这25个肽时,发现有20个结合一级和二级试验板中7个DR等位基因中的至少4个。最后,在三级试验中测试通过二级筛选阶段的20个肽中18个肽的结合。结果,显示12个肽结合10个普通HLA-DR等位基因中至少7个。这12个肽的序列及其在一级至三级板中每个试验的结合能力在表XXXV中显示。也显示了肽CF-08和857.02,它们分别结合迄今测试的等位基因中的5/5和5/6。
总之,已经鉴定了能够结合多个HLA-DR等位基因的来自HBV基因组12个独立区域的14个肽。这组肽包括至少2个表位,每个来自Core(Nuc),Pol和Env抗原。
保守的DR3基元肽的选择因为HLA-DR3是白种人,黑种人和西班牙人群中流行的等位基因,DR3结合能力是选择HTL表位的重要标准。然而,以前得到的资料表明DR3仅很少与其它DR等位基因交叉反应(Sidney等,J.Immunol.1492634-2640,1992;Geluk等,J.Immunol.1525742-5748,1994;Southwood等,J.Immunol.1603363-3373,1998)。这完全不奇怪,因为DR3肽结合基元看来与多数其它DR等位基因的特异性不同。
为了有效鉴定结合DR3的肽,分析了靶蛋白中携带Geluk等(J.Immunol.1525742-5748,1994)报道的两个DR3特异性结合基元之一的保守序列。鉴定到十八个序列。这些序列中八个与表XXXVI显示的肽有很大的冗余性,3个与以前为其它研究合成的肽有冗余性。合成了7个独特的序列。
已测试了十八个肽中含有DR3基元的十七个肽的DR3结合能力。发现四个肽以1000nM或更好的亲和力结合DR3(表XXXVI)。
实施例6.来自HPV的HTL表位的免疫原性这个实施例确定了用实施例5中的方法鉴定的那些表位中免疫原性的DR超基元和DR3基元携载表位。
以类似于确定CTL表位免疫原性的方式,通过评价刺激HTL反应的能力和/或使用适当转基因小鼠模型,来评价HTL表位的免疫原性。通过筛选1.)用正常PBMC体外原始诱导或2.)癌症患者PBMCs的回忆反应来确定免疫原性。实施例7.计算HIA超型在各人种背景中的表型频率以确定人群覆盖度的宽度这个实施例阐述了包括含多个超基元和/或基元的多个表位的疫苗组合物的人群覆盖度宽度的评价。
为了分析人群覆盖度,确定了HLA等位基因的基因频率。利用二项分布公式gf=1-(SQRT(l-af))从抗原或等位基因频率计算每个HLA等位基因的基因频率(如见Sidney等,Human Immunol.4579-93,1996)。为了获得整体表型频率,计算累积基因频率,累积抗原频率使用反向公式[af=l-(l-Cgf)2]得到。
在DNA分型水平得不到频率数据时,假定对应于血清学定义的抗原频率。为了得到总的潜在超型人群覆盖度,假定没有连锁不平衡,并且仅包括证实属于每种超型的等位基因(最小估计)。通过将可以预期被所考虑的B等位基因覆盖的非A覆盖人群比例添加到A覆盖度中,进行座位间组合得到的总的潜在覆盖度的估计(如,总体=A+B*(1-A))。A3样超型的已证实成员是A3,A11,A31,A*3301和A*6801。尽管A3样超型可能潜在包括A34,A66和A*7401,但是整体频率计算中不包括这些等位基因。同样,A2样超型家族的已证实成员是A*0201,A*0202,A*0203,A*0204,A*0205,A*0206,A*0207,A*6802和A*6901。最后,B7样超型证实的等位基因是B7,B*3501-03,B51,B*5301,B*5401,B*5501-2,B*5601,B*6701和B*7801(可能还有B*1401,B*3504-06,B*4201和B*5602)。组合A2-,A3-和B7-超型得到的人群覆盖度在五个主要人种群中是大约86%(见表XXI)。通过包括携载A1和A24基元的肽可能扩大覆盖度。平均地,A1存在于五个不同主要人种群(白种人,北美黑人,中国人,日本人和西班牙人)12%的人口中,A4存在于29%的人口中。合起来,这些等位基因在这些相同人种群中以39%的覆盖频率出现。当A1和A24与A2-,A3-和B7-超型等位基因的覆盖度组合时,主要人种中的总覆盖度>95%。
基于这里公开的内容,可类似得到II类HLA分子的人群覆盖度。
候选I类和II类HLA表位的总结总之,基于上面提供的数据,选择34个保守CTL表位作为疫苗候选物(表XXXVII)。在这34个表位中,7个来自核心,18个来自聚合酶,9个来自包膜。该组表位中不包含X抗原的表位,因为这个蛋白表达量低,因此免疫学意义低。
估计这组CTL表位提供的人群覆盖度在5个主要人种群体中超过95%。使用Monte Carlo分析(图1),预测由白种人,北美黑人,中国人,日本人和西班牙人组成的人群有大约90%个体将识别五个或更多的疫苗候选表位。
虽然优选的CTL表位包括34个离散肽,但是两个肽完全嵌套在较长肽内,因此有效降低了疫苗候选物中将不得不包括的肽的数量。特别是,A2限制性肽927.15嵌套在B7限制性肽26.0570中,B7限制性肽988.05嵌套在A2限制性肽924.07中。类似地,A24限制性肽20.0136和A2限制性肽1013.01含有相同核心区域,仅第一个氨基酸不同。相关点是,A2限制性肽1090.14和B7限制性肽1147.05有两个氨基酸重叠,增加了将这两个表位作为一个连续的肽序列送递的可能性。
该肽组包括9个A2限制性CTL表位;四个聚合酶来源的表位,四个包膜来源的表位和一个核心表位。这9个肽中7个在急性患者回忆CTL试验中被识别。在患者识别的7个肽中,2个是无交叉反应的结合肽。包含这些肽作为潜在疫苗候选物源自HLA-A*0201是在所检测的所有人种中优势表达的A2超型等位基因的观察结果。据此,无交叉反应的A*0201结合肽的包括增加抗原覆盖度和人群覆盖度的冗余性。缺乏患者免疫原性数据的惟独两个A2限制性肽是肽1090.77和1069.06。1090.77肽是急性HBV患者识别的高免疫原性肽的类似物。尽管还没有测试患者回忆反应识别该类似肽的能力,但是在HLA转基因小鼠中进行的免疫原性研究已经表明1090.77诱导的CTL能够识别负载天然产生的序列的靶细胞。这些数据表明1090.77肽唤起的CTL是交叉反应性的且应该识别HBV感染细胞。1069.06肽被包含作为潜在的疫苗表位,因为其对A*6802的高结合亲和力引起更高的人群覆盖度。该肽在HLA-A2转基因小鼠和原代人培养物中具有免疫原性。
优选的CTL表位包括7个A3超型限制性肽;6个来自聚合酶抗原和一个来自核心区域。所有A3超型疫苗候选肽在患者中具有免疫原性。尽管肽1142.05是无交叉反应的A3限制性肽,但是已经表明它可被患者识别且能够结合HLA-A1。
九个B7限制性肽是实施例中鉴定的优选CTL表位。在这个组中,已经表明患者体内可识别3个表位。尽管这些肽中的一个,1147.04,是无交叉反应结合者,但是它结合主要B7超型等位基因中的2个,IC50或结合亲和力值小于100nM。基于超型结合,优选的表位包括六个B7超型表位。人体内的免疫原性研究(Bertoni等,1997;Doolan等,1997;Threlkeld等,1997)已经证明高交叉反应肽几乎总是作为表位被识别。已知这些结果,并根据可得到的有限免疫原性数据,相信使用B7超型结合亲和力作为选择标准是合适的。
类似地,有关A1和A24限制性肽的免疫原性数据很少。已经报道一个优选CTL表位1069.04在急性HBV患者的回忆反应中被识别。如前段所讨论,发现高百分比的结合亲和力<100nM的肽具有免疫原性。由于这个原因,认为结合亲和力<100nM的所有A1和A24肽是优选的CTL表位。使用这个选择标准,鉴定3个A1限制性和6个A24限制性肽作为候选表位。进一步研究发现3个来自核心的肽以中等亲和力结合A24。由于这个研究过程中鉴定了相对较少的核心表位,优选的表位组中也包括该中等A24结合核心肽以提供更大程度的抗原覆盖度冗余性(redundancy in antigen coverage)。
表XXXVII总计了优选的来自HBV的HTL表位的列表。这组HTL表位包括12个DR超基元结合肽和4个DR3结合肽。多数HTL表位来自聚合酶;该优选的HTL表位组也包括2个包膜和2个核心来源的表位。该套HTL表位代表的估计总人群覆盖度在五个主要人种群体的每一个中都超过91%(表XXXVIII)。
实施例8致敏后,内源加工抗原产生的识别这个实施例确定了如实施例1-5所述鉴定和选择的天然或模拟表位诱导的CTL识别内源合成的,即天然的抗原。
用肽包被的刺激细胞体外重复刺激从如实施例3用肽表位(例如,HLA-A2超基元携载表位)免疫的转基因小鼠分离的效应细胞。六天后,检测效应细胞的细胞毒性,进一步重复刺激含有肽特异性细胞毒活性的细胞系。再过六天后,肽缺乏或存在下,在51Cr标记的Jurkat-A2.1/Kb靶细胞上测试这些细胞系的细胞毒活性,也在携载内源合成抗原的51Cr标记的靶细胞,如HBV表达载体稳定转染的细胞上测试。
结果表明从肽表位致敏的动物得到的CTL系识别内源合成的HBV抗原。待用于这种分析的转基因小鼠模型的选择依赖于要评价的表位。除了HLA-A*0201/Kb转基因小鼠,几种其它转基因小鼠模型包括含人A11的小鼠(它也可以用于估计A3表位和B7等位基因)已被表征,其它的(如HLA-A1和A24的转基因小鼠)正在开发。也已经开发了HLA-DR1和HLA-DR3小鼠模型,它们可以用于评价HTL表位。
实施例9转基因小鼠中CTL-HTL结合表位的活性这个实施例阐述了使用HBV CTL/HTL肽结合物(conjugate)在转基因小鼠中对CTLs和HTLs的诱导。在Oseroff等Vaccine16823-833(1998)中可以发现类似研究。
该肽组合物可包括多个CTL和/或HTL表位,进一步可包括选自多个HPV靶抗原的表位。用实施例1-6所述的方法鉴定表位。例如,这种肽组合物可包括与含例如至少一个以500nM或更低的亲和力结合多个HLA家族成员的CTL表位的优选CTL表位或该表位的类似物结合的HTL表位。如果期望,肽可以脂化。
免疫步骤如文献所述免疫转基因小鼠(Alexander等,J.Immunol.1594753-4761,1997)。例如,人HLA A2.1等位基因转基因的和可用于评价HLA-A*0201基元或HLA-A2超基元携载表位的免疫原性的A2/Kb小鼠,用溶在不完全弗氏佐剂,或如果肽组合物是脂化CTL/HTL结合物,溶于DMSO/盐水,或如果该肽组合物是多肽,溶于PBS或不完全弗氏佐剂中的0.1ml肽皮下(尾巴基部)致敏。致敏后七天,用肽包被的照射过的LPS活化的同基因淋巴母细胞再次刺激从这些动物得到的脾细胞。
细胞系肽特异性细胞毒性试验的靶细胞是HLA-A2.1/Kb嵌合基因转染的Jurkat细胞(如Vitiello等,J.Exp.Med.1731007,1991)。
体外CTL活化致敏后一周,脾细胞(30×106个细胞/瓶)与同基因的经照射(3000rads)的肽包被的淋巴母细胞(10×106个细胞/瓶)在10ml的培养基/T25瓶中37℃共同培养。六天后,收获效应细胞并检测细胞毒活性。
细胞毒活性试验靶细胞(1.0-1.5×106)在200μl51Cr存在下,37℃培养。60分钟后,细胞洗涤三次并重悬于R10培养基中。需要的时候加入肽,浓度为1μg/ml。对于这个试验,向U底96孔板中不同浓度的效应细胞(终体积200μl)中加入10451Cr标记的靶细胞。37℃培养6小时后,每孔中取0.1ml量的上清并用Micromedic自动γ计数器确定放射活性。用以下公式确定特异性溶解百分比特异性释放百分比=100×(实验释放-自发释放)/(最大释放-自发释放)。为了便于比较相同条件下运行的分开的CTL试验,%51Cr释放数据表示为溶解单位/106个细胞。一个溶解单位随意定义为在6小时51Cr释放试验中10,000个靶细胞达到30%溶解所需的效应细胞数量。为了获得特异性溶解单位/106,从在肽存在时得到的溶解单位/106减去肽缺乏时得到的溶解单位/106。例如,如果肽缺乏时,以效应细胞(E)靶细胞(T)比率50∶1(即,5×105效应细胞,10,000靶)得到30%51Cr释放,而肽存在时,以5∶1(即,5×104效应细胞,10,000靶)得到30%51Cr释放,则特异性溶解单位将是[(1/50,000)-(1/500,000)]×106=18LU。
分析结果来评价免疫原性CTL/HTL结合物疫苗制剂注射的动物的CTL反应大小并与用实施例3概述的CTL表位得到的CTL反应大小比较。可以进行与此类似的分析来评价含多个CTL表位和/或多个HTL表位的肽结合物的免疫原性。根据这些方法,发现诱导了CTL反应,同时,给予这种组合物诱导了HTL反应。
实施例10.包含在HBV特异性疫苗中的CTL和HTL表位的选择这个实施例举例说明了用于本发明疫苗组合物的肽表位的选择方法。本发明组合物中的肽可以是核酸序列的形式,包括编码肽的单一或一个或多个序列(即小基因),或可以是单一和/或多表位肽。
当选择包含在疫苗组合物中的表位队列时,利用下列原则。为了进行选择,平衡下列每个原则。
选择在给予后模拟观察到与HBV清除相关的免疫应答的表位。使用的表位数量依赖于自发清除HBV的患者的观察结果。例如,如果已经观察到自发清除HBV的患者对至少一个HPB抗原上至少3个表位产生了免疫应答,那么对于I类HLA应该包括3-4个表位。用类似的原理确定II类HLA表位。
常常选择对I类HLA分子具有500nM或更低IC50的结合亲和力,或对于II类,有1000nM或更低IC50的结合亲和力的表位。
选择足够的超基元携载表位,或足够的等位基因特异性基元携载肽队列以得到宽的人群覆盖度。例如,选择表位提供至少80%的人群覆盖度。可使用本领域已知的统计学评价法——Monte Carlo分析,评价人群覆盖度的宽度和冗余度。
当构建多表位组合物如小基因时,典型地期望产生包含感兴趣表位的尽可能小的肽。采用的原则与选择含嵌套表位的肽时采用的类似,如果不是相同的话。
在可获得相同靶蛋白的多个变异体的序列的情况下,也可以基于它们的保守性选择可能的肽表位。例如,保守性的标准可以定义为在为特定蛋白抗原而评价的指定百分比的序列中I类HLA结合肽的完整序列或II类结合肽的完整9-mer核心是保守的。
例如,包含在疫苗组合物中的表位从表XXXVIIa和b所列的那些中选择。当给予所选肽组成的疫苗组合物时,是安全、有效的,且引起与清除急性HBV感染的免疫应答大小类似的免疫应答。
实施例11小基因多表位DNA质粒的构建这个实施例提供了构建小基因表达质粒的指导。小基因质粒当然可包含这里所述的各种构型的CTL和/或HTL表位或表位类似物。例如在1999年5月13日申请的共同未决的U.S.S.N.09/311,784中描述了表达质粒的构建和评价的实施例。图2显示了这种质粒的实例,阐述了小基因构建体中HBV表位的方向。这种质粒也可以包括例如多个CTL和HTL肽表位。
小基因表达质粒典型地包括多个CTL和HTL肽表位。在本实施例中,HLA-A2,-A3,-B7超基元携载肽表位和HLA-A1和A24基元携载肽表位与DR超基元携载表位和/或DR3表位结合使用(图2)。例如,表XXVI-XXXIII中鉴定了优选的表位,选择来自多个HBV抗原如核心,聚合酶,包膜和X蛋白的I类HLA超基元或基元携载肽表位,使得提供的多个超基元/基元确保宽人群覆盖度。类似地,从多个HBV抗原选择II类HLA表位以提供宽人群覆盖度,即选择HLA DR-1-4-7超基元携载表位和HLA DR-3基元携载表位包含在小基因构建体中。然后,将所选的CTL和HTL表位合并至小基因中以在表达载体中进行表达。
这个实施例举例说明了用于构建这种携带小基因的表达质粒的方法。本领域技术人员可得到并且知晓可以用于小基因组合物的其它表达载体。
小基因DNA质粒含有共有Kozak序列和共有小鼠Kappa Ig轻链信号序列,随后是根据这里公开的原则选择的CTL和/或HTL表位串。
合成和HPLC纯化重叠寡核苷酸,例如八个寡核苷酸,平均长度大约70个核苷酸,含15个核苷酸重叠。寡核苷酸编码所选肽表位以及适当的接头核苷酸。用PCR在三组反应中延伸重叠的寡核苷酸装配最后的多表位小基因。使用Perkin/Elmer 9600 PCR仪,用下列条件执行共30个循环95℃15秒,退火温度(比所计算的每个引物对最低Tm值低5℃)30秒和72℃1分钟。
对于第一个PCR反应,两个寡核苷酸每一个5μg退火和延伸在含pfu聚合酶缓冲液(lx=10mM KCL,10mM(NH4)2SO4,20mMTris-Cl,pH8.75,2mM MgSO4,0.1% Triton X-100,100μg/ml BSA),0.25mM每种dNTP和2.5U pfu聚合酶的100μl反应中混合寡核苷酸1+2,3+4,5+6和7+8。凝胶纯化全长二聚体产物,含1+2和3+4产物,及5+6和7+8产物的两个反应混合,退火并延伸10个循环。然后混合两个反应物的一半,进行5个循环的退火和延伸之后,加入侧翼引物进行25个另外的循环扩增全长产物。凝胶纯化全长产物并克隆进入pCR-blunt(Invitrogen)中,通过测序筛选各个克隆。
实施例12.质粒构建体和其诱导免疫原性的程度通过用表达表位的核酸构建体转导或转染APC后,测试APC对表位的呈递,体外评价质粒构建体,例如根据实施例11构建的质粒能够诱导免疫原性的程度。这种研究确定“抗原性”并允许使用人APC。通过定量细胞表面上的表位-I类HLA复合体的密度,该试验确定在被T细胞识别的背景下肽被APC呈递的能力。直接测定从APC洗脱的肽量可进行定量(如见Sijts等,J.Immunol.156683-692,1996;Demotz等,Nature342682-684,1989);或通过测定感染或转染的靶细胞诱导的溶解或淋巴因子释放量,然后确定得到等同水平溶解或淋巴因子释放所需的肽浓度,可估计肽-I类HLA复合体数量(如见Kageyama等,J.Immunol.154567-576,1995)。
可供选择地,通过体内注射给小鼠和随后体外估计CTL和HTL活性可评价免疫原性,所述CTL和HTL活性可分别使用细胞毒性和增殖试验分析,如5/13/99申请的共同未决的U.S.S.N.09/311,784和Alexander等,Immunity 1751-761,1994详述。
例如,为了评价含至少一个HLA-A2超基元肽的DNA小基因构建体(如U.S.S.N.09/311,784所述产生的pMin小基因构建体)体内诱导CTLs的能力,例如用100μg裸cDNA肌肉内免疫HLA-A2.1/Kb转基因小鼠。作为比较cDNA免疫诱导的CTLs水平的方法,也用含合成作为单个多肽的多个表位的真实肽组合物免疫对照组动物,就象它们由小基因编码一样。
用各组合物(小基因或多表位肽编码的肽表位)的每一个刺激免疫动物的脾细胞两次,然后以51Cr释放试验检测肽特异性细胞毒活性。结果表明针对A2限制性表位的CTL反应大小,由此表明了小基因疫苗和多表位疫苗的体内免疫原性。因此发现小基因引起了针对HLA-A2超基元肽表位的免疫应答,多表位肽疫苗也是如此。也用其它HLA-A3和HLA-B7转基因小鼠模型进行类似研究,评价HLA-A3和HLA-B7基元或超基元表位对CTL的诱导。
为了评价编码II类表位的小基因诱导体内HTLs的能力,例如用100μg质粒DNA肌肉内免疫DR转基因小鼠,或对于与适当小鼠MHC分子交叉反应的那些表位,免疫I-Ab限制性小鼠。作为比较DNA免疫诱导的HTLs水平的方法,也用乳化于完全弗氏佐剂中的真实肽组合物免疫对照组动物。从免疫动物的脾细胞纯化CD4+T细胞,即HTLs,并用相应的每个组合物(小基因编码的肽)刺激。用3H-胸腺嘧啶核苷掺入增殖试验测定HTL反应(如见Alexander等Immunity 1751-761,1994)。结果表明HLT反应大小,因此证明小基因的体内免疫原性。
如实施例11所述构建的DNA小基因也可以用致敏加强方案(prime boost protocol)与加强试剂组合作为疫苗进行评价。加强试剂可由重组蛋白(如Barnett等,Aids Res.And HumanRetroviruses 14,Supplement 3S299-S309,1998)或重组痘苗组成,例如,表达编码感兴趣的完整蛋白的小基因或DNA(如见Hanke等,Vaccine16439-445,1998;Sedegah等,Proc.Natl.Acad.Sci USA 957648-53,1998;Hanke和Mc Michael,Immunol.Letters 66177-181,1999;和Robinson等,Nature Med.5526-34,1999)。
例如,首先在转基因小鼠中评价用于致敏加强方案的DNA小基因的功效。在这个实施例中,用100μg编码免疫原性肽(包括至少一个HLA-A2超基元携载肽)的DNA小基因IM(肌肉)免疫A2.1/Kb转基因小鼠。一定培养期后(范围3-9周),用107pfu/小鼠的表达DNA小基因编码的相同序列的重组痘苗病毒IP(腹膜内)加强小鼠。用不含小基因序列的100μg DNA或重组痘苗或用编码小基因的DNA但没有痘苗加强,免疫对照小鼠。两周的另外培养期后,用ELISPOT试验立即检测小鼠脾细胞的肽特异性活性。另外,用在小基因和重组痘苗中编码的A2限制性肽表位体外刺激脾细胞,然后用IFN-γELISA检测肽特异性活性。
发现致敏加强方案利用的小基因引起的对HLA-A2超基元肽的免疫应答比单独用DNA大。也可以使用HLA-A11或HLA-B7转基因小鼠模型进行这种分析,评价HLA-A3或HLA-B7基元或超基元表位对CTL的诱导。
实施例20中描述了对人使用致敏加强方案。
实施例13预防用途的肽组合物本发明的疫苗组合物可用于预防有这种感染风险的人发生HJBV感染。例如,将含多个CTL和HTL表位(如实施例9和/或10选择的那些表位,也选择它可对准超过80%的人群)的多表位肽表位组合物(或含它们的核酸)给予有HBV感染风险的个体。
例如,基于肽的组合物可以以包含多个表位的单一多肽提供。疫苗典型地在包含佐剂,如不完全弗氏佐剂的生理溶液中给药。初次免疫的肽剂量是70kg患者约1至约50,000μg,通常100-5,000g。疫苗初次给予后跟随第4周的加强剂量,随后采用确定PBMC样品中表位特异性CTL存在的技术评价患者免疫应答的大小。如果需要,给予另外的加强剂量。发现该组合物作为抗HPV感染的预防是安全和有效的。
可供选择地,按照本领域已知和这里公开的方法,典型地包含转染试剂的组合物可用于给予基于核酸的疫苗。
实施例14来自天然HBV序列的多表位疫苗组合物优选使用定义用于每个I类和/或II类超基元或基元的计算机算法筛选天然HBV多蛋白序列,鉴定含多个表位的多蛋白“相对短”的区域并优选长度低于完整天然抗原。选择这个含有多个不同,甚至重叠的表位的相对短序列并用于产生小基因构建体。改造该构建体以表达对应于天然蛋白序列的肽。“相对短”肽通常长度少于250个氨基酸,长度常常少于100个氨基酸,优选长度少于75个氨基酸,更优选长度少于50个氨基酸。选择疫苗组合物的该蛋白序列,因为在该序列中含有最大数量的表位,即它具有高浓度的表位。如这里指出,表位基元可以嵌套或重叠(即相对于彼此,框架移动)。例如,利用f重叠表位,两个9-mer表位和一个10-mer表位可以存在于一个10个氨基酸的肽中。给予这种疫苗组合物用于治疗或预防。
疫苗组合物将包括,例如,来自至少一个HBV靶抗原的三个CTL表位和至少一个HTL表位。这个多表位的天然序列以肽或编码该肽的核酸序列给予。可供选择地,可以由这个天然序列制备类似物,其中一个或多个表位包含改变该多表位肽的交叉反应性和/或结合亲和力性能的置换。
这个实施例的实施方案提供了尚未被发现的免疫系统加工方面将作用于该天然嵌套序列并因此利于制备诱导治疗或预防性免疫应答的疫苗组合物的可能性。另外,这种实施方案提供了目前未知的HLA构造(HLA makeup)的基元携载表位的可能性。此外,这个实施方案(缺乏类似物)使免疫应答针对实际存在于天然HBV抗原中的多个肽序列,由此避免评价任何接合表位的需要。最后,这个实施方案提供了制备核酸疫苗组合物时的规模经济。
与这个实施方案相关,可以根据本领域的原则得到计算机程序,该程序鉴定在靶序列中每序列长度中最大数量的表位。
实施例15.针对多种疾病的多表位疫苗组合物本领域的HBV肽表位和与一个或多个其它疾病相关的靶抗原的肽表位结合,用于产生有效预防或治疗HBV以及另一种疾病的疫苗组合物。其它疾病的实例包括但不限于HIV,HCV和HPV。
例如,可以产生含对准超过98%的人群的多个CTL和HTL表位的多表位肽组合物给予有HBV和HIV感染风险的个体。该组合物可以以合并了来自各种疾病相关来源的多个表位的单一多肽提供,或可作为含一个或多个分开的表位的组合物给予。
实施例16.肽评价免疫应答的应用本发明的肽可以用于分析免疫应答,检测针对HBV的特异性CTL或HTL群的存在。可以以Ogg等,Science2792103-2106,1998所述方式进行这种分析。在下列实施例中,根据本发明的肽用作诊断或预后目的的试剂,不是作为免疫原。
在这个实施例中,高敏感人白细胞抗原四聚物复合体(“四聚物”)用于例如HLA A*0201阳性个体在不同感染阶段或用含A*0201基元的HBV肽免疫后的HBV HLA-A*0201特异性CTL频率的抽样分析。如(Musey等,N.Engl.J.Med.3371267,1997)所述合成四聚物复合体。简言之,用原核表达系统方法合成纯化的HLA重链(在这个实施例中是A*0201)和β2-微球蛋白。通过删除跨膜-胞质尾和COOH末端添加含BirA酶促生物素化位点的序列,修饰重链。通过稀释重折叠重链,β2-微球蛋白和肽。快速蛋白液相层析分离45-KD重折叠产物,然后在生物素(Sigma,St.Louis,Missouri),腺苷5’三磷酸和镁存在下,用BirA生物素化。以14摩尔比加入链霉抗生物素-藻红蛋白结合物,将四聚体产物浓缩到1mg/ml。所得产物称作四聚物-藻红蛋白。
对于患者血液样品的分析,大约一百万PBMCs以300g离心5分钟并重悬于50μl冷磷酸缓冲盐水中。四聚物-藻红蛋白和抗CD8-Tricolor和抗CD38一起进行Tri-color分析。PBMCs与四聚物和抗体在冰上孵育30至60分钟,然后洗涤两次后用甲醛固定。采用含>99.98%的对照样品的门(gates)。四聚物对照包括A*0201阴性个体和A*0201阳性未感染供体。然后用流式细胞计数仪确定四聚物染色的细胞百分比。结果指出PBMC样品中含表位限制性CTLs的细胞数量,由此容易指出对HBV表位的免疫应答的程度,并因此指出HBV感染阶段,接触HBV的状态,或对引起保护性或治疗性反应的疫苗的接触。
实施例17肽表位用于评价回忆反应的应用本发明的肽表位用作评价T细胞反应,如患者的急性或回忆反应的试剂。可以对从感染康复,慢性HBV感染,或已经接种HBV疫苗的患者进行这种分析。
例如,可以分析已经接种的人的I类限制性CTL反应。疫苗可以是任何HBV疫苗。从接种过疫苗的个体收集PBMC并进行HLA分型。然后使用适当的本发明肽表位,最好从携带提供与多个HLA超型家族成员的交叉反应性的超基元,用于分析从携载该HLA型的个体得到的样品。
在Ficoll-Histopaque密度梯度(Sigma Chemical Co.,St.Louis,MO)上分离接种过疫苗的个体的PBMC,在HBSS(GIBCOLaboratories)中洗涤三次,重悬于添加L-谷氨酰胺(2mM),青霉素(50U/ml),链霉素(50μg/ml)和Hepes(10mM),含10%热灭活人AB血清的RPMI-1640(GIBCO Laboratories)(完全RPMI)中并用微培养格式铺板。含本发明表位的合成肽以10μg/ml加入到每个孔中,HBV核心128-140表位以1μg/ml加入到每个孔中,作为第一周刺激过程中的T细胞辅助的来源。
在微培养格式中,用肽刺激96孔圆底板100μl/孔的完全RPMI中8个复制培养物中的4×105个PBMC。在第3和10天,向每个孔加入100ml完全RPMI和20U/ml总浓度的rIL-2。第7天,培养物转移到96孔平底板中并用肽,rIL-2和105个照射过(3000rad)的自体饲养细胞再次刺激。第14天测试培养物的细胞毒性活性。基于与如前所述的未感染对照受试者的比较,阳性CTL反应要求八复制培养物中两个或更多个显示10%以上特异性51C释放(Rehermann,等,Nature Med.21104,1108,1996;Rehermann等,J.Clin.Invest.971655-1665,1996;和Rehermann等J.Clin.Invest.981432-1440,1996)。
靶细胞系是自体和同种异体的EBV转化的B-LCL,购自美国组织相容性和免疫遗传学协会(ASHI,Boston,MA)或如文献(Guilhot,等J.Virol.662670-2678,1992)所述由患者库建立的。
以下列方式实施细胞毒性试验。靶细胞由同种异体HLA匹配或自体EBV转化B类淋巴母细胞细胞系组成,它们与10μM合成的本发明的肽表位培养过夜,用100μCi的51Cr(Amersham Corp.,Arlington Heights,IL)标记1小时,然后用HBSS洗涤四次。
使用含3000靶/孔的U底96孔板,用标准4小时分裂孔51Cr释放试验确定细胞毒性活性。第14天,以20-50∶1的效应细胞/靶细胞(E/T)比率测试受刺激的PBMC。由公式100×[(实验释放-自发释放)/最大释放-自发释放]确定细胞毒性百分比。以去污剂(2%Triton X-100;Sigma Chemical Co.,St.Louis,MO)溶解靶细胞确定最大释放。所有实验中自发试验小于最大释放的25%。
这种分析的结果表明以前接触HBV或HBV疫苗已刺激HLA限制性CTL群的程度。
也分析II类限制性HTL反应。在96孔平底板中以1.5×105个细胞/孔的密度培养纯化的PBMC并用10μg/ml的合成肽,完整抗原或PHA刺激。细胞以每种条件4-6复制孔常规接种。培养七天后,弃去培养基,用含10U/ml IL-2的新鲜培养基替换。两天后,每孔加入1μCi3H-胸苷并继续培养另外18小时。然后玻璃纤维垫上收集细胞DNA并分析3H胸苷的掺入。以缺乏抗原时3H胸苷掺入除抗原存在时3H胸苷掺入的比率计算抗原特异性T细胞增殖。
实施例18.人体内特异性CTL反应的诱导含本发明HBV CTL和HTL表位的免疫原性组合物的人临床试验设立为IND I期,剂量递增研究(5,50和500μg)并实施为随机,双盲,有安慰剂对照的试验。例如这种试验设计如下共大约27个受试者登记并分成3组I组3个受试者注射安慰剂和6个受试者注射5μg肽组合物;II组3个受试者注射安慰剂和6个受试者注射50μg肽组合物;III组3个受试者注射安慰剂和6个受试者注射500μg肽组合物。
首次注射4周后,所有受试者接受相同剂量的加强接种。
本研究测定的终点涉及该肽组合物的安全性和耐受性及其免疫原性。对该肽组合物的细胞免疫应答是这个肽组合物内在活性的指标,因此可以认为是生物功效的测定。下面总结了有关安全性和功效终点的临床和实验室数据。
安全性监测安慰剂和药物处理组中不利事件的发生率并评价程度和可逆性。
疫苗功效评价对于疫苗效力的评价,在注射前和后对受试者进行抽血。经Ficoll-Hypaque密度梯度离心从新鲜肝素化血液中分离外周血单个核细胞,等分于冰冷培养基中并冷冻保存。检测样品的CTL和HTL活性。
由此,发现疫苗安全和有效。实施例19.HBV感染患者的II期试验进行II期试验研究CTL-HTL肽组合物给予慢性HBV感染患者(男性和女性)的作用。该试验的一个主要目的是确定诱导慢性HBV感染患者的CTL的有效剂量和方案,确立诱导这些患者的CTL反应的安全性,以及看检查CTLs活化改善慢性CTL感染患者的临床症像至何种程度,这由丙氨酸转氨酶(ALT)短暂突发(transient flare),ALT正常化和HBV DNA降低来显示。例如这种试验设计如下在美国和加拿大的多个中心进行研究。试验设计是开放标记(open label),无对照的,剂量渐增方案,其中给予单一剂量的肽组合物,六周后单次加强注射相同剂量。剂量是每次注射50,500和5000微克。记录药物相关副作用。
有三个患者分组。第一个组注射50微克肽组合物,第二和第三个组分别注射500和5000微克肽组合物。每组患者年龄为21-65岁并且包括男性和女性。患者代表不同人种背景。它们全部感染HBV五年以上且HIV,HCV和HDV阴性,但是HBe抗原和HBs抗原水平阳性。
监测ALT突发的大小和发生率和血液中HBV DNA水平以评价给予肽组合物的作用。血液中HBV DNA的水平是治疗进展的间接指示。发现该疫苗组合物在治疗慢性HBV感染中安全且有效。
实施例20.用致敏加强方案诱导CTL反应致敏加强方案也可以用于将疫苗给予人。这种疫苗方案可以包括初次给予例如裸DNA,随后是使用编码该疫苗的重组病毒,或重组蛋白/多肽或肽混合物在佐剂中加强给予。
例如,可以使用表达载体,如实施例11构建的载体,进行初次免疫,采用裸核酸形式IM(或SC或ID)在多个部位给予0.5-5mg的量。也可以用基因枪给予核酸(0.1-1000μg)。3-4周的潜伏期后,给予加强剂量。加强物可以是以5-107至5×109pfu剂量给予的重组鸡痘病毒。可供选择的重组病毒,如MVA,金丝雀痘病毒,腺病毒或腺相关病毒,也可以用于加强,或也可以给予多表位蛋白或肽混合物。对于疫苗功效的评价,免疫前以及给予初次疫苗和加强剂量疫苗后每隔一段时间获得患者血液样品。用Ficoll-Hypaque密度梯度离心从新鲜肝素化血液中分离外周血单个核细胞,等分于冰冷冻培养基中并冰冻保存。检测样品的CTL和HTL活性。
结果表明产生了足以获得抵抗HBV的保护性免疫或足以治疗HBV感染的反应大小。
实施例21.用树突细胞(DC)给予疫苗组合物可以用APCs,如DC给予含本发明肽表位的疫苗。在这个实施例中,肽脉冲的DC给予患者以刺激体内CTL反应。在这个方法中,分离树突细胞,扩充,用含本发明肽CTL和HTL表位的疫苗脉冲。树突细胞回输给患者,引起体内CTL和HTL反应。然后,诱导的CTL和HTL破坏或利于破坏携载疫苗中表位所来源的蛋白的特异靶细胞。
例如,携载表位的肽的混合物离体给予PBMC,或从中分离的DC。可以使用利于收获DC的药剂,如ProgenipoietinTM(Monsanto,St.Louis,M0)或GM-CSF/IL-4。用肽脉冲DC后且在再次输给患者前,洗涤DC去除未结合的肽。
如临床上领会到和基于临床结果本领域技术人员容易确定的,再输给患者的DC数量可以改变(如见Nature Med.4328,1998;Nature Med.252,1996和Prostate 32272,1997)。尽管典型地每个患者给予2-50×106个DC,但是也可以提供更多数量DC,如107或108个。这种细胞群典型含有50-90%之间DC。
在一些实施方案中,负载肽的PBMC注射给患者,而不纯化DC。例如,用试剂如ProgenipoietinTM处理后产生的含DC的PBMC,不纯化DC,注射给患者。给予的PBMC总数量范围从108至1010。通常,注射给患者的细胞剂量基于每个患者血液中DC的百分比,如例如由特异性抗DC抗体的免疫荧光分析确定的。因此,例如,如果ProgenipoietinTM动员了给定患者外周血中2%DC,而且该患者要接受5×106个DC,则将给患者注射共2.5×108个负载肽的PBMC。估计试剂如ProgenipoietinTM动员的DC百分比典型地在2-10%之间,但如本领域技术人员领会的,可以变化。
CTL/HTL反应的离体活化可供选择地,在组织培养中将患者的,或遗传学相容的CTL或HTL前体细胞与APC源,如DC,和适当的免疫原性肽一起培养可诱导对HPV抗原的离体CTL或HTL反应。适当培养期(典型大约7-28天)后(此期间前体细胞被活化并扩充为效应细胞),细胞回输给患者,在那里它们将破坏(CTL)或利于破坏(HTL)它们特异性的靶细胞。
实施例22.鉴定基元携载肽的可供选择的方法鉴定基元携载肽的另一个方法是从携带确定的MHC分子的细胞中洗脱它们。例如,已经广泛描述了用于组织分型的EBV转化的B细胞系的特性,确定它们表达哪些HLA分子。在某些情况下,这些细胞仅表达单一类型的HLA分子。这些细胞可被病原体生物感染或被表达感兴趣抗原,如HBV蛋白的核酸转染。感染之后(或作为转染的结果)产生的肽的内源性抗原加工得到的肽将接着结合细胞内HLA分子并运输和展示在细胞表面。然后通过接触弱酸条件,从HLA分子中洗脱肽并用例如质谱分析确定氨基酸序列(如Kubo等,J.Immunol.1523913,1994)。因为大多数结合特定HLA分子的肽携载着基元,所以这是得到与细胞上表达的特定HLA分子相关的基元携载肽的可供选择的形式。
可供选择地,可用编码单一HLA等位基因的表达构建体转染不表达内源HLA分子的细胞系。这些细胞接着可以如所述使用,如它们可被病原体感染或被编码感兴趣抗原的核酸转染,来分离已在细胞表面表达的对应于感兴趣病原体或抗原的肽。这种分析得到的肽将携载相应于结合细胞中表达的单一HLA等位基因的基元。
本领域技术人员可领会到,人们可对携载一个以上HLA等位基因的细胞进行类似分析并随后确定表达的每个HLA等位基因特异性的肽。而且,本领域技术人员也将认识到除感染或转染以外的方法,如负载蛋白抗原,可用于给细胞提供抗原来源。
这里提供的实施例用来举例说明本发明,但不限制其范围。本发明的其它变型将对本领域技术人员非常明显,也包括在所附的权利要求中。在此,为了所有目的,这里引用的所有出版物、专利和专利申请引入作为参考。
表I
优选粗体残基,次优选斜体残基如果肽在每个一级固定位置具有上表所指明的基元或超基元的一级固定残基,则认为该肽是携带基元的。
表Ia
*如果2是V或Q,则C端不是L优选粗体残基,次优选斜体残基如果肽在每个一级固定位置具有上表所指明的基元或超基元的一级固定残基,则认为该肽是携带基元的。
表II 斜体残基表示次优选或“容许”残基。表II中的信息是9-mers特异的,除非另外指明。二级固定特异性是独立地为每个位置指定的。1*Anchor=一级固定残基 斜体残基表示次优选或“容许”残基。二级固定特异性是为每个位置独立指定的。1*Anchor=一级固定残基表IV I类HLA标准肽结合亲和力。
表VII类HLA标准肽结合亲和力
表VI等位基因特异性HLA超型成员HLA超型 已证实的a预测的bA1 A*0101,A*2501,A*2601,A*2602,A*3201 A*0102,A*2604,A*3601,A*4301,A*8001A2 A*0201,A*0202,A*0203,A*0204,A*0205,A*0206,A*0207, A*0208,A*0210,A*0211,A*0212,A*0213A*0209,A*0214,A*6802,A*6901A3 A*0301,A*1101,A*3101,A*3301,A*6801A*0302,A*1102,A*2603,A*3302,A*3303,A*3401,A*3402,A*6601,A*6602,A*7401A24 A*2301,A*2402A*3001 A*2403,A*2404,A*3002,A*3003B7 B*0702,B*0703,B*0704,B*0705,B*1508,B*3501,B*3502,B*3503, B*1511,B*4201,B*5901B*3503,B*3504,B*3505,B*3506,B*3507,B*3508,B*5101,B*5102,B*5103,B*5104,B*5105,B*5301,B*5401,B*5501,B*5502,B*5601,B*5602,B*6701,B*7801B27 B*1401,B*1402,B*1509,B*2702,B*2703,B*2704,B*2705,B*2706,B*2701,B*2707,B*2708,B*3802,B*3903,B*3904,B*3801,B*3901,B*3902,B*7301 B*3905,B*4801,B*4802,B*1510,B*1518,B*1503B44 B*1801,B*1802,B*3701,B*4402,B*4403,B*4404,B*4001,B*4002, B*4101,B*4501,B*4701,B*4901,B*5001B58 B*5701,B*5702,B*5801,B*5802,B*1516,B*1517B62B*1501,B*1502,B*1513,B*5201B*1301,B*1302,B*1504,B*1505,B*1506,B*1507,B*1515,B*1520,B*1521,B*1512,B*1514,B*1510a.已证实的等位基因包括其特异性已经通过库测序(pool sequencing)分析、肽结合试验、或CTL表位序列的分析被确定的等位基因。b.预测的等位基因是其特异性基于B和F袋结构预测与所述超型特异性重叠的等位基因。表VIIHBV A01超基元(及结合信息)保守性 频率 蛋白质位置 序列 字符串A*010195 19 POL 521 AICSVVRRAF XIXXXXXXXF95 19 NUC 54ALRQAILCW XLXXXXXXW80 16 ENV 108 AMQWNSTTF XMXXXXXXF100 20 POL 166 ASFCGSPY XSXXXXXY100 20 POL 166 ASFCGSPYSW XSXXXXXXXW90 18 NLC 19ASKLCLGW XSXXXXXW85 17 NUC 19ASKLCLGWLW XSXXXXXXXW80 16 POL 822 ASPLHVAW XSXXXXXW100 20 ENV 312 CIPIPSSW XIXXXXXW100 20 ENV 312 CIPIPSSWAF XIXXXXXXXF95 19 ENV 253 CLIFLLVLLDYXLXXXXXXXXY95 19 ENV 239 CLRRFIIF XLXXXXXF75 15 ENV 239 CLRRFIIFLF XLXXXXXXXF95 19 POL 523 CSVVRRAF XSXXXXXF100 20 ENV 310 CTCIPIPSSW XTXXXXXXXW90 18 NUC 31DIDPYKEF XIXXXXXF85 17 NLC 29DLLDTASALY XLXXXXXXXY 11.100095 19 ENV 196 DSWWTSLNF XSXXXXXXF95 19 NUC 43ELLSFLPSOF XLXXXXXXXF95 19 NLC 43ELLSFLPSDFFXLXXXXXXXXF95 19 POL 374 ESRLVVDF XSXXXXXF95 19 POL 374 ESRLVVDFSQFXSXXXXXXXXF80 16 ENV 248 FILLLCLIF XIXXXXXXF80 16 ENV 246 FLFILLLCLIFXLXXXXXXXXF95 19 ENV 256 FLLVLLDY XLXXXXXY95 19 POL 658 FSPTYKAF XSXXXXXF90 18 X 63FSSAGPCALRFXSXXXXXXXXXF100 20 ENV 333 FSWLSLLVPF XSXXXXXXXF95 19 POL 656 FTFSPTYKAF XTXXXXXXXF95 19 ENV 346 FVGLSPTVW XVXXXXXXW95 19 POL 627 GLLGFAAPF XLXXXXXXF95 19 POL 509 GLSPFLLAOF XLXXXXXXXF85 17 NUC 29GMDIDPYKEF XMXXXXXXXF95 19 NUC 123 GVWIRTPPAY XVXXXXXXXY 0.001775 15 POL 569 HLNPNKTKRW XLXXXXXXXW80 16 POL 491 HLYSHPIILGFXLXXXXXXXXF85 17 POL 715 HTAELLAACF XTXXXXXXXF95 19 NUC 52HTALRQAILCWXTXXXXXXXXW100 20 POL 149 HTLWKAGILY XTXXXXXXXY 0.0300100 20 ENV 249 ILLLCLIF XLXXXXXF80 16 POL 760 ILRGTSFVY XLXXXXXXY0.001790 18 ENV 188 ILTIPQSLDSWXLXXXXXXXXW90 18 POL 625 IVGLLGFAAPFXVXXXXXXXXF80 16 POL 503 KIPMGVGLSPFXIXXXXXXXXF85 17 NUC 21KLCLGWLW XLXXXXXW75 15 POL 108 KXLIMPARF XLXXXXXF75 15 POL 108 KLIMPARFY XLXXXXXXY0.001780 16 POL 610 KLPVNRPIDW XLXXXXXXXW85 17 POL 574 KTKRWGYSLNFXTXXXXXXXXF95 19 POL 55KVGNFTGLY XVXXXXXXY0.068095 19 ENV 254 LIFLLVLLDY XIXXXXXXXY 0.0084100 20 POL 109 LIMPARFY XIXXXXXY85 17 NUC 30LLDTASALY XLXXXXXXY25.000080 16 POL 752 LLGCAANW XLXXXXXW95 19 POL 628 LLGFAAPF XLXXXXXXF100 20 ENV 378 LLPIFFCLW XLXXXXXXW100 20 ENV 378 LLPIFFCLWVYXLXXXXXXXY95 19 NUC 44LLSFLPSDF XLXXXXXXF95 19 NUC 44LLSFLPSDFF XLXXXXXXXF90 18 POL 407 LLSSNLSW XLXXXXXW95 19 ENV 175 LLVLQAGF XLXXXXXF95 19 ENV 175 LLVLQAGFF XLXXXXXXF100 20 ENV 338 LLVPFQWXLXXXXXW100 20 ENV 338 LLVPFVQWF XLXXXXXXF85 17 NUC 100 LLWFHISCLTFXLXXXXXXXXF95 19 NUC 45LSFLPSOF XSXXXXXF95 19 NUC 45LSFLPSDFF XSXXXXXXF95 19 POL 415 LSLDVSAAF XSXXXXXXF95 19 POL 415 LSLDVSAAFY XSXXXXXXXY 4.2000100 20 ENV 336 LSLLVPFVQW XSXXXXXXXW100 20 ENV 336 LSVPFVQWF XSXXXXXXXXF95 19 X 53LSLRGLPVCAFXSXXXXXXXF95 19 POL 510 LSPFLLAQF XSXXXXXXXF75 15 ENV 349 LSPTVWLSVIWXSXXXXXXXXW85 17 POL 742 LSRKYTSF XSXXXXXF85 17 POL 742 LSRXYTSFPW XSXXXXXXW75 15 ENV 16LSVPNPLGF XSXXXXXXF75 15 NUC 137 LTFGRETVLEYXTXXXXXXXXY90 18 ENV 189 LTIPQSLDSW XTXXXXXXXW90 18 ENV 189 LTIPQSLDSWWXTXXXXXXXXW90 18 POL 404 LTNLLSSNLSWXTXXXXXXXXW95 19 ENV 176 LVLQAGFF XVXXXXXF100 20 ENV 339 LVPFVQWF XVXXXXXF100 20 POL 377 LVVDFSOF XVXXXXXF85 17 ENV 360 MMWYWGP5LY XMXXXXXXXY 0.081075 15 X 103 MSTTDLEAY XSXXXXXXY0.850075 15 X 103 MSTTDLEAYF XSXXXXXXXF表VIIHBV A01超基元(及结合信息)保守性 频率蛋白质 位置 序列 字符串A*010195 19 POL 42 NLGNLNVSIPW XLXXXXXXXXW90 18 POL 406NLLSSNLSW XLXXXXXXW95 19 POL 45 NLNVSIPW XLXXXXXW75 15 ENV 15 NLSVPNPLGFXLXXXXXXXF90 18 POL 738NSVVLSRKY XSXXXXXXY 0.0005100 20 ENV 380PIFFCLWVY XIXXXXXXY 0.0078100 20 ENV 314PIPSSWAF XIXXXXXF100 20 POL 124PLDKGIKPY XLXXXXXXY 0.0190100 20 POL 124PLDKGIKPYYXLXXXXXXXY0.1600100 20 ENV 377PLLPIFFCLWXLXXXXXXXW95 19 ENV 174PLLVLQAGF XLXXXXXXF95 19 ENV 174PLLVLQAGFFXLXXXXXXXF80 16 POL 505PMGVGLSPF XMXXXXXXF85 17 POL 797PTTGRTSLY XTXXXXXXY 0.770075 15 ENV 351PTVWLSVIW XTXXXXXXW85 17 POL 612PVNRPIDW XVXXXXXW95 19 POL 685QVFADATPTGXVXXXXXXXXW90 18 POL 624RIVGLLGF XIXXXXXF75 15 POL 106RLKLIMPARFXLXXXXXXXF75 15 POL 106RLKLIMPARFY XLXXXXXXXXY95 19 POL 376RLVVDFSQF XLXXXXXXF90 18 POL 353RTPARVTGGVF XTXXXXXXXXF100 20 POL 49 SIPWTHKVGNF XIXXXXXXXXF95 19 ENV 194SLDSWWTSLNF XLXXXXXXXXF95 19 POL 416SLDVSAAF XLXXXXXF95 19 POL 416SLDVSAAFY XLXXXXXXY 17.2000100 20 ENV 337SLLVPFVQW XLXXXXXXW100 20 ENV 337SLLVPFVQWFXLXXXXXXXF95 19 X 54 SLRGLPVCAFXLXXXXXXXF90 18 X 64 SSAGPCALRFXSXXXXXXXF75 15 X 104STTDLEAY XTXXXXXY75 15 X 104STTDLEAYF XTXXXXXXF75 15 ENV 17 SVPNPLGF XVXXXXXF90 18 POL 739SVVLSRKY XVXXXXXY85 17 POL 739SVVLSRKYTSF XVXXXXXXXXF90 18 ENV 190TIPQSLDSW XIXXXXXXW90 18 ENV 190TIPQSLDSWWXIXXXXXXXW100 20 POL 150TLWKAGILY XLXXXXXXY 0.001775 15 X 105TTDLEAYF XTXXXXXF85 17 POL 798TTGRTSLY XTXXXXXY80 16 NUC 16 TVQASKLCLGW XVXXXXXXXXW75 15 ENV 352TVWLSVIW XVXXXXXXW85 17 POL 741VLSRKYTSF XLXXXXXXF85 17 POL 741VLSRKYTSFPW XLXXXXXXXXW85 17 POL 740VVLSRKYTSFXVXXXXXXXF80 16 POL 759WILRGTSF XIXXXXXF80 16 POL 759WILRGTSFVYXIXXXXXXXY0.002395 19 NUC 125WIRTPPAY XIXXXXXY80 16 POL 751WLLGCAANW XLXXXXXXW95 19 POL 414WLSLDVSAAFXLXXXXXXXF95 19 POL 414WLSLDVSAAFY XLXXXXXXXXY100 20 ENV 335WLSLLVPF XLXXXXXF100 20 ENV 335WLSLLVPFVQW XLXXXXXXXXW85 17 NUC 26 WLWGMDIDPYXLXXXXXXXY0.081095 19 ENV 237WMCLRRFIIFXMXXXXXXXF85 17 ENV 359WMMWYWGPS XMXXXXXXXXY100 20 POL 52 WTHKVGNF XTXXXXXF100 20 POL 122YLPLDKGIKPY XLXXXXXXXXY90 18 NUC 118YLVSFGVW XLXXXXXW80 16 POL 493YSHPIILGF XSXXXXXXF85 17 POL 580YSLNFMGY XSXXXXXY表VIIIHBV A02超基元(及结合信息)保守性 频率 蛋白质位置 序列AA A*0201 A*0202 A*0203A*0206A*680285 17 POL 721AACFARSRSGA 1185 17 POL 431AAMPHLLV 880 16 POL 756AANWILRGT995 19 POL 632AAPFTQCGYPA 1195 19 POL 521AICSVVRRA9 0.000190 18 NUC 58 AILCWGEL 890 18 NUC 58 AILCWGELM9 0.50000.03403.3000 0.2500 0.047095 19 POL 642ALMPLYACI980 16 ENV 108AMQWNSTT 875 15 X102AMSTTDLEA9 0.001395 19 POL 516AQFTSAICSV 1095 19 POL 516AQFTSAICSVV 1195 19 POL 690ATPTGWGL 880 16 POL 690ATPTGWGLA975 15 POL 690ATPTGWGLAI 1095 19 POL 397AVPNLQSL 895 19 POL 397AVPNLQSLT9 0.000195 19 POL 397AVPNLQSLTNL 1180 16 POL 755CAANWILRGT 1095 19 X61 CAFSSAGPCA 10 0.000195 19 X61 CAFSSAGPCAL 1190 18 X69 CALRFTSA 810020 ENV 312CIPIPSSWA9 0.001080 16 ENV 312CIPIPSSWAFA 1190 18 POL 533CLAFSYMDDV 10 0.000890 18 POL 533CLAFSYMDDVV 1185 17 NUC 23 CLGWLWGM 885 17 NUC 23 CLGWLWGMDI 10 0.009310020 ENV 253CLIFLLVL 8 0.000210020 ENV 253CLIFLLVLL9 0.000695 19 ENV 239CLRRFIIFL9 0.000275 15 ENV 239CLRRFIIFLFI 11 0.000490 18 NUC 107CLTFGRET 890 18 NUC 107CLTFGRETV9 0.000180 16 X7 CQLDPARDV980 16 X7 CQLDPARDVL 1085 17 POL 622CQRIVGLL 885 17 POL 622CQRIVGLLGFA 1195 19 POL 684CQVFADAT 895 19 POL 684CQVFADATPT 1010020 ENV 310CTCIPIPSSWA 1195 19 POL 689DATPTGWGL9 0.0001表VIIIHRV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质 位置 序列80 16 POL 689 DATPTGWGLA1075 15 POL 689 DATPTGWGLAI 1190 18 NUC 31DIDPYKEFGA1085 17 NUC 29DLLDTASA 885 17 NUC 29DLLDTASAL 9 0.000195 19 POL 40DLNLGNLNV 9 0.000495 19 POL 40DLNLGNLNVSI 1180 16 NUC 32DTASALYREA1080 16 NUC 32DTASALYREAL 1195 19 X14DVLCLRPV 895 19 X14DVLCLRPVGA100.000190 18 POL 541 DVVLGAKSV 9 0.000310020 POL 17EAGPLEEEL 9 0.000180 16 X122 ELGEEIRL 890 18 POL 718 ELLAACFA 875 15 NUC 142 ETVLEYLV 895 19 POL 687 FADATPTGWGL 1185 17 POL 724 FARSRSGA 880 16 POL 821 FASPLHVA 895 19 POL 396 FAVPNLQSL 995 19 POL 396 FAVPNLQSLT100.000380 16 ENV 243 FIIFLFIL 8 0.000680 16 ENV 243 FIIFLFILL 9 0.000280 16 ENV 243 FIIFLFILLL100.001280 16 ENV 248 FILLLCLI 8 0.000380 16 ENV 248 FILLLCLIFL100.028080 16 ENV 248 FILLLCLIFLL 110.001080 16 ENV 246 FLFILLLCL 9 0.000280 16 ENV 246 FLFILLLCLI100.001375 15 ENV 171 FLGPLLVL 875 15 ENV 171 FLGPLLVLQA100.019095 19 POL 513 FLLAQFTSA 9 0.240095 19 POL 513 FLLAQFTSAI100.21000.03207.00000.11000 088095 19 POL 562 FLLSLGIHL 9 0.65000.00100.01000.11000.003580 16 ENV 183 FLLTRILT 880 16 ENV 183 FLLTRILTI 9 0.51000.04308.00000.20000.001095 19 ENV 256 FLLVLLDYQGM 1110020 POL 363 FLVDKNPHNT100.001295 19 POL 656 FTFSPTYKA 9 0.00560.01500.00310.80007.300095 19 POL 656 FTFSPTYKAFL 1195 19 POL 59FTGLYSST 890 18 POL 59FTGLYSSTV 9 0.0005表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质 位置 序列95 19 POL 635 FTQCGYPA 895 19 POL 635 FTQCGYPAL 9 0.000995 19 POL 635 FTQCGYPALM 100.002495 19 POL 518 FTSAICSV 895 19 POL 518 FTSAICSVV 9 0.009095 19 ENV 346 FVGLSPTV 895 19 ENV 346 FVGLSPTVWL 100.000890 18 X132 FVLGGCRHKL 100.003090 18 X132 FVLGGCRHKLV1195 19 ENV 342 FVQWFVGL 895 19 ENV 342 FVQWFVGLSPT1190 18 POL 766 FVYVPSAL 890 18 POL 766 FVYVPSALNPA1195 19 X50 GAHLSLRGL 9 0.000190 18 X50 GAHLSLRGLPV1185 17 POL 545 GAKSVQHL 885 17 POL 545 GAKSVQHLESL1175 15 POL 567 GIHLNPNKT 990 18 POL 155 GLYKRET890 18 POL 155 GILYKRETT 985 17 POL 682 GLCQVFADA 9 0.002485 17 POL 682 GLCQVFADAT 1095 19 POL 627 GLLGEAAPFT 100.004985 17 ENV 62 GLLGWSPQA 9 0.40000.00030.03500.28000.000595 19 X57 GLPVCAFSSA 100.000895 19 POL 509 GLSPFLLA 895 19 POL 509 GLSPFLLAQFT1110020 ENV 348 GLSPTVWL 8 0.003675 15 ENV 348 GLSPTVWLSV 100.280075 15 ENV 348 GLSPTVWLSVI110.003690 18 ENV 265 GMLPVCPL 890 18 POL 735 GTDNSVVL 875 15 ENV 13 GTNLSVPNPL 1080 16 POL 763 GTSFVYVPSA 1080 16 POL 763 GTSFVYVPSAL1180 16 POL 507 GVGLSPFL 880 16 POL 507 GVGLSPFLL 9 0.000280 16 POL 507 GVGLSPFLLA 1095 19 NUC 123 GVWIRTPPA 9 0.003090 18 NUC 104 HISCLTFGRET1180 16 POL 435 HLLVGSSGL 9 0.003190 18 X52 HLSLRGLPV 9 0.0014表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质 位置序列90 18 X52 HLSLRGLPVCA 1180 16 POL 491 HLYSHPII 880 16 POL 491 HLYSHPIIL 9 0.22000.00030.93000.17000.053085 17 POL 715 HTAELLAA 885 17 POL 715 HTAELLAACFA 1110020 NUC 52 HTALRQAI 895 19 NUC 52 HTALRQAIL 9 0.000110020 POL 149 HTLWKAGI 810020 POL 149 HTLWKAGIL 9 0.000180 16 ENV 244 IIFLFILL 8 0.000480 16 ENV 244 IIFLFILLL 9 0.000280 16 ENV 244 IIFLFILLLCL 110.000280 16 POL 497 IILGFRKI 880 16 POL 497 IILGFRKIPM1090 18 NUC 59 ILCWGELM 880 16 POL 498 ILGFRKIPM 9 0.000210020 ENV 249 ILLLCLIFL 9 0.001510020 ENV 249 ILLLCLIFLL100.01900.00010.00020.13000.001510020 ENV 249 ILLLCLIFLLV 110.005680 16 POL 760 ILRGTSFV 880 16 POL 760 ILRGTSFVYV100.016010020 NUC 139 ILSTLPET 810020 NUC 139 ILSTLPETT 9 0.000110020 NUC 139 ILSTLPETTV100.02100.00850.07700.31000.006710020 NUC 139 ILSTLPETTVV 1195 19 ENV 188 ILTIPQSL 890 18 POL 156 ILYKRETT 890 18 POL 625 IVGLLGFA 890 18 POL 625 IVGLLGFAA 9 0.000990 18 POL 153 KAGILYKRET1090 18 POL 153 KAGILYKRETT 1180 16 POL 503 KIPMGVGL 885 17 NUC 21 KLCLGWLWGM100.000195 19 POL 489 KLHLYSHPI 9 0.06900.03402.70000.5900 0.001580 16 POL 489 KLHLYSHPII1080 16 POL 489 KLHLYSHPIIL 1180 16 POL 610 KLPVNRPI 895 19 POL 653 KQAFTFSPT 995 19 POL 574 KTKRWGYSL 9 0.000185 17 POL 620 KVCQRIVGL 9 0.000385 17 POL 620 KVCQRIVGLL100.000195 19 POL 55 KVGNFTGL 8表VIIIHBV A02超基元(及结合信息)AAA*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质位置 序列85 17 X 91 KVLHKRTL 885 17 X 91 KVLHKRTLGL100.000490 18 POL 534LAFSYMDDV 9 0.000290 18 POL 534LAFSYMDDVV100.000390 18 POL 534LAFSYMDDVVL 1195 19 POL 515LAQFTSAI 895 19 POL 515LAQFTSAICSV 1110020 ENV 254LIFLLVLL 8 0.002595 19 POL 514LLAQFTSA 895 19 POL 514LLAQFTSAI 9 0.10000 27003.70000.2600 0.790010020 ENV 251LLCLIFLL 8 0.000410020 ENV 251LLCLIFLLV 9 0.004810020 ENV 251LLCLIFLLVL100.007510020 ENV 251LLCLIFLLVLL 110.001385 17 NUC 30 LLDTASAL 895 19 ENV 260LLDYQGML 8 0.000490 18 ENV 260LLDYQGMLPV100.09800.00010.02000.6700 0.000980 16 POL 752LLGCAANWI 9 0.001180 16 POL 752LLGCAANWIL100.014095 19 POL 628LLGFAAPFT 9 0.000885 17 ENV 63 LLGWSPQA 875 15 ENV 63 LLGWSPQAQGI 1110020 ENV 250LLLCLIFL 8 0.000610020 ENV 250LLLCLIFLL 9 0.006510020 ENV 250LLLCLIFLLV100.003610020 ENV 250LLLCLIFLLVL 110.000510020 ENV 378LLPIFFCL 8 0.005510020 ENV 378LLPIFFCLWV100.03200.00080.01500.8000 0.000595 19 POL 563LLSLGIHL 890 18 POL 407LLSSNLSWL 9 0.01100.07803.90000.2700 0.010090 18 POL 407LLSSNLSWLSL 1180 16 ENV 184LLTRILTI 8 0.002680 16 POL 436LLVGSSGL 895 19 ENV 257LLVLLDYQGM100.005095 19 ENV 257LLVLLDYQGML 1190 18 ENV 175LLVLQAGFFL100.03100.00370.00450.1500 0.011090 18 ENV 175LLVLQAGFFLL 110.007495 19 ENV 338LLVPFVQWFV100.67000.38001.70000.2900 0.140090 18 NUC 100LLWFHISCL 9 0.01300.00020.04200.3100 0.009885 17 NUC 100LLWFHISCLT1095 19 POL 643LMPLYACI 895 19 ENV 178LQAGFFLL 8表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率 蛋白质位置 序列95 19 ENV 178 LQAGFFLLT 980 16 ENV 178 LQAGFFLLTRI 11100 20 POL 401 LQSLTNLL895 19 NUC 108 LTFGRETV875 15 NUC 137 LTFGRETVL 990 18 POL 404 LTNLLSSNL 980 16 ENV 185 LTRILTIPQSL 1185 17 POL 99 LTVNEKRRL 9100 20 POL 364 LVDKNPHNT 9 0.000195 19 ENV 258 LVLLDYQGM 9 0.000195 19 ENV 258 LVLLDYQGML 100.000190 18 ENV 176 LVLQAGFFL 9 0.009690 18 ENV 176 LVLQAGFFLL 100.002290 18 ENV 176 LVLQAGFFLLT 1195 19 ENV 339 LVPFVQWFV 9 0.04200.01500.00480.79002.800095 19 ENV 339 LVPFVQWFVGL 1190 18 NUC 119 LVSFGVWI8 0.000490 18 NUC 119 LVSFGVWIRT 1085 17 ENV 360 MMWYWGPSL 9 0.640075 15 NUC 1MQLFHLCL8100 20 NUC 136 NAPILSTL8100 20 NUC 136 NAPILSTLPET 1195 19 POL 42 NLGNLNVSI 9 0.004790 18 POL 406 NLLSSNLSWL 100.001695 19 POL 45 NLNVSIPWT 9 0.0005100 20 POL 400 NLQSLTNL8100 20 POL 400 NLQSLTNLL 9 0.004775 15 ENV 15 NLSVPNPL890 18 POL 411 NLSWLSLDV 9 0.06500.00510.64000.16000.099090 18 POL 411 NLSWLSLDVSA 11100 20 POL 47 NVSIPWTHKV 100.0001100 20 POL 430 PAAMPHLL885 17 POL 430 PAAMPHLLV 990 18 POL 775 PADDPSRGRL 1090 18 ENV 131 PAGGSSSGT 990 18 ENV 131 PAGGSSSGTV 1095 19 POL 641 PALMPLYA895 19 POL 641 PALMPLYACI 100.000175 15 X 145 PAPCNFFT875 15 X 145 PAPCNFFTSA 1080 16 X 11 PARDVLCL875 15 X 11 PARDVLCLRPV 11表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率 蛋白质位置 序列90 18 POL 355 PARVTGGV890 18 POL 355 PARVTGGVFL 1090 18 POL 355 PARVTGGVFLV 1195 19 NUC 130 PAYRPPNA895 19 NUC 130 PAYRPPNAPI 100.000195 19 NUC 130 PAYRPPNAPIL 1185 17 POL 616 PIDWKVCQRI 100.000185 17 POL 616 PIDWKVCQRIV 11100 20 ENV 380 PIFFCLWV8100 20 ENV 380 PIFFCLWVYI 100.000485 17 POL 713 PIHTAELL885 17 POL 713 PIHTAELLA 985 17 POL 713 PIHTAELLAA 1080 16 POL 496 PIILGFRKI 9 0.000180 16 POL 496 PIILGFRKIPM 11100 20 NUC 138 PILSTLPET 9 0.0001100 20 NUC 138 PILSTLPETT 100.0001100 20 NUC 138 PILSTLPETTV 110.000180 16 ENV 314 PIPSSWAFA 995 19 POL 20PLEEELPRL 9 0.000390 18 POL 20PLEEELPRLA 100.000195 19 ENV 10PLGFFPDHQL 100.0002100 20 POL 427 PLHPAAMPHL 100.0001100 20 POL 427 PLHPAAMPHLL 11100 20 ENV 377 PLLPIFFCL 9 0.06500.00010.00180.11000.0047100 20 ENV 377 PLLPIFFCLWV 1190 18 ENV 174 PLLVLQAGFFL 110.000880 16 POL 711 PLPIHTAEL 9 0.000480 16 POL 711 PLPIHTAELL 100.000180 16 POL 711 PLPIHTAELLA 1175 15 POL 2 PLSYQHFRKL 100.000175 15 POL 2 PLSYQHFRKLL 1185 17 POL 98PLTVNEKRRL 100.000180 16 POL 505 PMGVGLSPFL 100.000180 16 POL 505 PMGVGLSPFLL 1195 19 ENV 106 PQAMQWNST 980 16 ENV 106 PQAMQWNSTT 1090 18 ENV 192 PQSLDSWWT 990 18 ENV 192 PQSLDSWWTSL 1175 15 POL 692 PTGWGLAI880 16 ENV 219 PTSNHSPT885 17 POL 797 PTTGRTSL8表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质 位置序列85 17 POL 797 PTTGRTSLYA 1080 16 NUC 15 PTVQASKL 880 16 NUC 15 PTVQASKLCL 1075 15 ENV 351 PTVWLSVI 875 15 ENV 351 PTVWLSVIWM 1095 19 X59 PVCAFSSA 885 17 POL 612 PVNRPIDWKV 100.000295 19 POL 654 QAFTFSPT 895 19 POL 654 QAFTFSPTYKA 1195 19 ENV 179 QAGFFLLT 880 16 ENV 179 QAGFFLLTRI 1080 16 ENV 179 QAGFFLLTRIL 1190 18 NUC 57 QAILCWGEL990 18 NUC 57 QAILCWGELM 1095 19 ENV 107 QAMQWNST 880 16 ENV 107 QAMQWNSTT980 16 NUC 18 QASKLCLGWL 1080 16 X8 QLDPARDV 8 0.000180 16 X8 QLDPARDVL9 0.000180 16 X8 QLDPARDVLCL 110.000190 18 NUC 99 QLLWFHISCL 100.006085 17 NUC 99 QLLWFHISCLT 1195 19 POL 685 QVFADATPT9 0.000195 19 POL 528 RAFPHCLA 880 16 ENV 187 RILTIPQSL9 0.001090 18 POL 624 RIVGLLGFA990 18 POL 624 RIVGLLGFAA 1075 15 POL 106 RLKLIMPA 890 18 NUC 56 RQAILCWGEL 1090 18 NUC 56 RQAILCWGELM 1190 18 NUC 98 RQLLWFHI 890 18 NUC 98 RQLLWFHISCL 1185 17 ENV 88 RQSGRQPT 890 18 POL 353 RTPARVTGGV 1095 19 NUC 127 RTPPAYRPPNA 1195 19 POL 36 RVAEDLNL 890 18 POL 36 RVAEDLNLGNL 1180 16 POL 818 RVHFASPL 875 15 POL 818 RVHFASPLHV 100.000175 15 POL 818 RVHFASPLHVA 1110020 POL 357 RVTGGVFL 810020 POL 357 RVTGGVFLV9 0.0041表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性 频率蛋白质 位置序列90 18 X65 SAGPCALRFT1095 19 POL 520 SAICSVVRRA100.000190 18 NUC 35 SALYREAL 810020 POL 49 SIPWTHKV 895 19 ENV 194 SLDSWWTSL 975 15 POL 565 SLGIHLNPNKT 1195 19 ENV 337 SLLVPFVQWFV 1175 15 POL 581 SLNFMGYV 875 15 POL 581 SLNFMGYVI 9 0.003895 19 X54 SLRGLPVCA 9 0.000790 18 POL 403 SLTNLLSSNL100.001475 15 ENV 216 SQSPTSNHSPT 1175 15 ENV 280 STGPCKTCT 910020 NUC 141 STLPETTV 810020 NUC 141 STLPETTVV 9 0.001980 16 ENV 85 STNRQSGRQPT 1185 17 POL 548 SVQHLESL 880 16 ENV 330 SVRFSWLSL 9 0.000180 16 ENV 330 SVRFSWLSLL100.000480 16 ENV 330 SVRFSWLSLLV 1190 18 POL 739 SVVLSRKYT 995 19 POL 524 SVVRRAFPHCL 1185 17 POL 716 TAELLAACFA1095 19 NUC 53 TALRQAIL 880 16 NUC 33 TASALYREA 980 16 NUC 33 TASALYREAL1090 18 ENV 190 TIPQSLDSWWT 1110020 NUC 142 TLPETTVV 810020 POL 150 TLWKAGIL 895 19 POL 636 TQCGYPAL 895 19 POL 636 TQCGYPALM 995 19 POL 636 TQCGYPALMPL 1185 17 POL 798 TTGRTSLYA 975 15 ENV 278 TTSTGPCKT 975 15 ENV 278 TTSTGPCKTCT 1185 17 POL 100 TVNEKRRL 880 16 NUC 16 TVQASKLCL 9 0.000275 15 ENV 352 TVWLSVIWM 9 0.000295 19 POL 37 VAEDLNLGNL100.000195 19 X15 VLCLRPVGA 9 0.001485 17 POL 543 VLGAKSVQHL100.000190 18 X133 VLGGCRHKL 9 0.0009表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性频率蛋白质位置序列9018 X 133 VLGGCRHKLV100.00018517 X 92 VLHKRTLGL 9 0.00129519 ENV 259 VLLDYQGM 89519 ENV 259 VLLDYQGML 9 0.04400.00010.02100.90000.00029018 ENV 259 VLLDYQGMLPV 110.58000.22004.90000.34000.01709519 ENV 177 VLQAGFFL 8 0.00199519 ENV 177 VLQAGFFLL 9 0.06609519 ENV 177 VLQAGFFLLT100.00118016 NUC 17 VQASKLCL 88016 NUC 17 VQASKLCLGWL 119519 ENV 343 VQWFVGLSPT109519 ENV 343 VQWFVGLSPTV 11100 20 POL 358 VTGGVFLV 89018 POL 542 VVLGAKSV 88016 POL 542 VVLGAKSVQHL 119018 POL 740 VVLSRKYT 89519 POL 525 VVRRAFPHCL100.00039519 POL 525 VVRRAFPHCLA 118016 POL 759 WILRGTSFV 9 0.02708016 POL 759 WLRGTSFVYV 118016 POL 751 WLLGCAANWI100.00538016 POL 751 WLLGCAANWIL 11100 20 POL 414 WLSLDVSA 89519 POL 414 WLSLDVSAA 9 0.0059100 20 ENV 335 WLSLLVPFV 9 1.10000.03807.20000.36000.03109519 ENV 237 WMCLRRFI 89519 ENV 237 WMCLRRFII 9 0.00059519 ENV 237 WMCLRRFIIFL 110.00198517 ENV 359 WMMWYWGPSL100.0009100 20 POL 52 WTHKVGNFT 9 0.00019519 POL 52 WTHKVGNFTGL 11100 20 POL 147 YLHTLWKA 8100 20 POL 147 YLHTLWKAGI100.01600.00050.56000.10000.0320100 20 POL 147 YLHTLWKAGIL 11100 20 POL 122 YLPLDKGI 89018 NUC 118 YLVSFGVWI 9 0.38009018 NUC 118 YLVSFGVWIRT 119018 POL 538 YMDDVVLGA 9 0.02500.00010.00240.10000.00029018 ENV 263 YQGMLPVCPL107515 POL 5 YQHFRKLL 87515 POL 5 YQHFRKLLL 97515 POL 5 YQHFRKLLLL10表VIIIHBV A02超基元(及结合信息)AA A*0201 A*0202 A*0203 A*0206 A*6802保守性频率蛋白质位置序列8517 FOL 746 YTSFPWLL87515 POL 746 YTSFPWLLGCA 119018 POL 768 YVPSALNPA 9 0.0039表IXHBV A03超基元(及结合信息)保守性 频率蛋白质位置序列 P2C-端AA A*0301 A*1101 A*3101 A*3301 A*680185 17 POL 721 AACFARSR A R 8 0.0004 0.00030.00560.00350.001495 19 P0L 521 AICSVVRR I R 8-0.0002 0.00030.0014 -0.00090.000690 18 POL 772 ALNPADDPSR L R 100.0003 0.000185 17 X 70 ALRFTSAR L R 8 0.0047 0.00090.04500.02300.000480 16 POL 822 ASPLHVAWR S R 975 15 ENV 84 ASTNRQSGR S R 9 0.0009 0.00020.00880.00080.000180 16 POL 755 CAANWILR A R 885 17 X 69 CALRFTSAR A R 9 0.0034 0.02301.50008.00000.730090 18 X 17 CLRPVGAESR L R 100.0011 0.000110020 NUC 48 CSPHHTALR S R 9 0.0029 0.00010.05200.02500.044085 17 NUC 29 DLLDTASALYRL R 110.0042 -0.0003 -0.00123.70000.041085 17 NUC 32 DTASALYR T R 8 0.0004 -0.0002 -0.00090.00180.000995 19 POL 17 EAGPLEEELPRA R 11 -0.0009 -0.0003 -0.00120.00150.011090 18 POL 718 ELLAACFAR L R 9 0.0002 0.000485 17 POL 718 ELLAACFARSRL R 110.0062 0.00160.02000.20000.160095 19 NUC 174 ETTVVRRR T R 8 0.0003 -0.0002 -0.00090.14000.002780 16 NUC 174 ETTVVRRRGR T R 100.0003 0.000180 16 POL 821 FASPLHVAWR A R 1090 18 X 63 FSSAGPCALR S R 1095 19 POL 656 FTFSPTYK T K 8 0.0100 0.01000.00230.21000.059095 19 POL 518 FTSAICSVVR T R 100.0003 0.000395 19 POL 518 FTSAICSVVRRT R 110.0065 0.00920.01700.03501.500090 18 X 132 FVLGGCRHK V K 9 0.0430 0.009075 15 POL 567 GIHLNPNK I K 875 15 POL 567 GIHLNPNKTK I K 100.0025 0.00110.00090.00090.000375 15 POL 567 GIHLNPNKTKRI R 1185 17 NUC 29 GMDIDPYK M K 8 0.0006 0.0004 -0.0009 -0.00090.000190 18 POL 735 GTDNSVVLSR T R 100.0010 0.04200.00300.00190.000890 18 POL 735 GTDNSVVLSRKT K 110.0140 0.5600 -0.0002 -0.00060.000195 19 NUC 123 GVWIRTPPAYRV R 110.1900 0.17006.80000.73000.660090 18 NUC 104 HISCLTFGR I R 9 0.0160 0.006575 15 POL 569 HLNPNKTK L K 875 15 POL 569 HLNPNKTKR L R 9 0.0025 0.000110020 POL 149 HTLWKAGILYKT K 110.5400 0.44000.03700.07200.190090 18 NUC 105 ISCLTFGR S R 8 0.0004 0.00020.0017 -0.00090.001710020 POL 153 KAGILYKR A R 8 0.0002 -0.00020.0015 -0.00090.000180 16 POL 610 KLPVNRPIDWKL K 1175 15 X 130 KVFVLGGCR V R 9 0.0420 0.0820 0.60000.07100.003085 17 POL 720 LAACFARSR A R 9 0.0058 0.006590 18 POL 719 LLAACFAR L R 8 0.0024 0.0003 0.00150.00290.006485 17 POL 719 LLAACEARSR L R 1085 17 NUC 30 LLDTASALYR L R 100.0050 0.000280 16 POL 752 LLGCAANWILRL R 1175 15 POL 564 LSLGIHLNPNKS K 1195 19 NUC 169 LSTLPETTVVRS R 11 -0.0009 0.0008-0.0012 -0.00230.007875 15 POL 3 LSYQHFRK S K 885 17 POL 99 LTVNEKRR T R 8-0.0002 -0.0002 -0.0009 -0.00090.000190 18 NUC 119 LVSFGVWIR V R 9 0.0028 0.012010020 POL 377 LVVDFSQFSR V R 100.0016 0.3600 0.02600.23000.490075 15 X 103 MSTTDLEAYFKS K 1190 18 NUC 75 NLEDPASR L R 8-0.0002 -0.0002 -0.0009 -0.00090.0001表IXHBV A03超基元(及结合信息)保守性频率 蛋白质 位置序列 P2C-端AAA*0301A*1101 A*3101A*3301 A*68019519 POL 45 NLNVSIPWTHK L K 11-0.0009 0.0005 -0.0012-0.00230.00199018 POL 738 NSVVLSRK S K 8 0.0006 0.0010 -0.0009-0.00090.0007100 20 POL 47 NVSIPWTHKV K 9 0.0820 0.05700.0002 0.01000.03209018 POL 775 PADDPSRGRA R 9 0.0008 0.00020.0004 0.00150.00028016 X11 PARDVLCLRA R 9 0.0002 0.00020.0100 0.01800.00027515 ENV 83 PASTNRQSGR A R 109018 POL 616 PIDWKVCQRI R 9 0.0002 0.00058016 POL 496 PIILGFRK I K 89519 POL 20 PLEEELPR L R 8 0.0002-0.0002 -0.0009-0.00090.0001100 20 POL 2 PLSYQHFR L R 8 -0.0002-0.0002 -0.0009-0.00090.00017515 POL 2 PLSYQHFRKL K 9 0.0011 0.00310.0006 0.00080.00028517 POL 98 PLTVNEKR L R 8 0.0002-0.0002 -0.0009-0.00090.00018517 POL 98 PLTVNEKRRL R 9 0.0008 0.00050.0004 0.00270.00029018 X20 PVGAESRGRV R 9 0.0002 0.00050.0004 0.00430.00028517 POL 612 PVNRPIDWKV K 9 0.0310 0.14000.0002 0.00060.00099519 POL 654 QAFTFSPTYK A K 10 0.0450 0.54000.0010 0.00571.20008016 ENV 179 QAGFFLLTRA R 97515 NUC 169 QSPRRRRSQSR S R 118016 POL 189 QSSGILSR S R 87515 POL 106 RLKLIMPARL R 9 0.0950 0.00023.1000 0.04900.00027515 X128 RLKVFVLGGCR L R 119519 POL 376 RLVVDFSQFSR L R 11 0.2800 3.80002.6000 1.20006.10009519 NUC 183 RSPRRRTPSPR S R 11-0.0007-0.00030.0190-0.00230.00037515 NUC 167 R9QSPRRR S R 87515 NUC 167 RSQSPRRRRS R 99519 NUC 188 RTPSPRRR T R 8 -0.0002-0.00020.0033 0.00140.00029519 NUC 188 RTPSPRRRRT R 9 0.0054 0.00050.2000-0.00160.0003100 20 POL 357 RVTGGVRVDK V K 11 0.0190 0.0290 -0.0002-0.00030.00019018X 65 SAGPCALR A R 8 -0.0002 0.00200.0029 0.00240.03609519 POL 520 SAICSVVR A R 8 -0.0002 0.00710.0280 0.00810.06909519 POL 520 SAICSVVRRA R 9 0.0058 0.21000.1500 0.06500.38009018 POL 771 SALNPADDPSR A R 11-0.0004-0.0003 -0.0012-0.00230.00037515 POL 565 SLGIHLNPNK L K 109018 X64 SSAGPCALRS R 9 0.0080 0.14000.3300 0.16000.75009519 NUC 170 STLPETTVVR T R 10 0.0007 0.06000.0080 0.02400.02509519 NUC 170 STLPETTVVRR T R 11 0.0150 1.40000.1000 0.16000.31008016 ENV 85 STNRQSGR T R 87515 X104 STTDLEAYFK T K 10 0.0066 2.70008517 POL 716 TAELLAACFAR A R 11 0.0006 0.00230.0066 0.16000.05909519 NUC 171 TLPETTVVRL R 9 0.0008 0.00020.0009 0.00240.01809519 NUC 171 TLPETTVVRR L R 10 0.0007 0.02300.0006 0.01200.04409519 NUC 171 TLPETTVVRRR L R 11 0.0005 0.01600.0061 0.07100.6400100 20 POL 150 TLWKAGILYK L K 10 5.3000 0.36000.0051 0.00100.0130100 20 POL 150 TLWKAGILYKR L R 11 0.0082 0.00950.1000 0.11000.06409519 POL 519 TSAICSVVRS R 9 0.0005 0.00080.0600 0.02000.08209519 POL 519 TSAICSVVRR S R 10 0.0018 0.00060.0030 0.00660.00487515 X105 TTDLEAYFKT K 9 0.0006 0.92000.0006 0.00120.01707515 ENV 278 TTSTGPCK T K 88016 NUC 175 TTVVRRRGRT R 9 0.0008 0.00050.2500 0.14000.00958016 NUC 176 TVVRRRGR V R 8 0.0003 0.00018016 NUC 176 TVVRRRGRSPR V R 11表IXHBV A03超基元(及结合信息)保守性 频率蛋白质 位置序列 P2 C-端AA A*0301 A*1101A*3101A*3301 A*680190 18 X133 VLGGCFHK L K 8 0.01500.0002-0.0005-0.00090.000180 16 ENV 177 VLQAGFFLLTR L R 1190 18 NUC 120 VSFGVWIR S R 8 0.00400.0290 0.0750 0.02700.036010020 POL 48 VSIPWTHK S K 8 0.01300.0170 0.0031 0.00130.000410020 POL 358 VTGGVFLVDKT K 100.03900.0920 0.0002 0.00060.002210020 POL 378 VVDFSQFSR V R 9 0.00150.0750 0.0013 0.01700.033080 16 NUC 177 VVRRRGRSPRV R 100.00270.000180 16 NUC 177 VVRRRGRSPRR V R 1195 19 NUC 125 WIRTPPAYR I R 9 0.00080.000590 18 POL 314 WLQFRNSK L K 8-0.00020.0005 0.0020 0.00520.000185 17 NUC 26 WLWGMDIDPYK L K 110.00300.0013-0.0003 0.00390.049010020 POL 122 YLPLDKGIK L K 9 0.00010.0001 0.0006 0.00060.000290 18 NUC 118 YLVSFGVWIRL R 100.00050.000290 18 POL 538 YMDDVVLGAKM K 100.03300.0043 0.0002 0.00060.000180 16 POL 493 YSHPIILGFRS R 1080 16 POL 493 YSHPIILGFRK S K 11表XHBV A24超基元(及结合信息)保守性 频率蛋白质 位置序列 字符串 A*240195 19 POL 529 AFPHCLAF XFXXXXXF95 19 POL 529 AFPHCLAFSY XFXXXXXXXY95 19 POL 529 AFPHCLAFSYMXFXXXXXXXXM95 19 X62 AFSSAGPCAL XFXXXXXXXL 0.001290 18 POL 535 AFSYMDDVVL XFXXXXXXXL 0.000995 19 POL 655 AFTFSPTY XFXXXXXY95 19 POL 655 AFTFSPTYKAFXFXXXXXXXF95 19 POL 521 AICSVVRRAF XIXXXXXXXF90 18 NUC 58 AILCWGEL XIXXXXXL90 18 NUC 58 AILCWGELM XIXXXXXXM95 19 POL 642 ALMPLYACI XLXXXXXXI95 19 NUC 54 ALRQAILCW XLXXXXXXW80 16 ENV 108 AMQWNSTTF XMXXXXXXF95 19 POL 690 ATPTGWGL XTXXXXXL75 15 POL 690 ATPTGWGLAI XTXXXXXXXI95 19 POL 397 AVPNLQSL XVXXXXXL95 19 POL 397 AVPNLOSLTNLXVXXXXXXXXL10020 NUC 131 AYRPPNAPI XYXXXXXXI0.026010020 NUC 131 AYRPPNAPIL XYXXXXXXXL 0.022075 15 POL 607 CFRKLPVNRPIXFXXXXXXXXI10020 ENV 312 CIPIPSSW XIXXXXXW10020 ENV 312 CIPIPSSWAF XIXXXXXXXF85 17 NUC 23 CLGWLGMXLXXXXXM85 17 NUC 23 CLGWLWGMDI XLXXXXXXXI10020 ENV 253 CLIFLLVL XLXXXXXL10020 ENV 253 CLIFLLVLL XLXXXXXXL95 19 ENV 253 CLIFLLVLLDYXLXXXXXXXXY95 19 ENV 239 CLRRFIIF XIXXXXXF95 19 ENV 239 CLRRFIIFL XLXXXXXXL75 15 ENV 239 CLRRFIIFLF XLXXXXXXXF75 15 ENV 239 CLRRFIIFLFIXLXXXXXXXXI10020 ENV 310 CTCIPIPSSW XTXXXXXXXW90 18 NUC 31 DIDPYXEF XIXXXXXF85 17 NUC 29 DLLDTASAL XLXXXXXXL85 17 NUC 29 DLLDTASALY XLXXXXXXXY95 19 POL 40 DLNLGNLNVSIXLXXXXXXXXI80 16 NUC 32 DTASALYREALXTXXXXXXXXL85 17 POL 618 DWKVCQRI XWXXXXXI85 17 POL 618 DWKVCQRIVGLXWXXXXXXXXL90 18 ENV 262 DYQGMLPVCPLXYXXXXXXXXL 0.000280 16 X 122 ELGEEIRL XLXXXXXL95 19 NUC 43 ELLSFLPSDF XLXXXXXXXF95 19 NUC 43 ELLSFLPSDFFXLXXXXXXXXF90 18 NUC 117 EYLVSFGVW XYXXXXXXW90 18 NUC 117 EYLVSFGVWI XYXXXXXXXI 0.034010020 ENV 382 FFCLWVYI XFXXXXXI80 16 ENV 182 FFLLTRIL XFXXXXXL80 16 ENV 182 FFLLTRILTI XFXXXXXXXI85 17 ENV 13 FFPDHCLDPAFXFXXXXXXXXF80 16 ENV 243 FIIFLFIL XIXXXXXL80 16 ENV 243 FIIFLFILL XIXXXXXXL80 16 ENV 243 FIIFLFILLL XIXXXXXXXL80 16 ENV 248 FILLLCLI XIXXXXXI80 16 ENV 248 FILLLCLIF XIXXXXXXF80 16 ENV 248 FILLLCLIFL XIXXXXXXXL80 16 ENV 248 FILLLCLIFLLXIXXXXXXXXL80 16 ENV 246 FLFILLLCL XLXXXXXXL80 16 ENV 246 FLFILLLCLI XLXXXXXXXI80 16 ENV 246 FLFILLLCLIFXLXXXXXXXXF75 15 ENV 171 PLGPLLVL XLXXXXXL95 19 POL 513 FLLAQFTSAI XLXXXXXXX95 19 POL 562 FLLSLGIHL XLXXXXXXL80 16 ENV 183 FLLTRILTI XLXXXXXXI95 19 ENV 256 FLLVLLDY XLXXXXXY95 19 ENV 256 FLLVLLDYQGMXLXXXXXXXXM95 19 POL 656 FTFSPTYKAF XTXXXXXXXF95 19 POL 656 FTFSPTYKAFLXTXXXXXXXXL95 19 POL 635 FTQCGYPAL XTXXXXXXL95 19 POL 635 FTQCGYPALM XTXXXXXXXM95 19 ENV 346 FVGLSPTVW XVXXXXXXW95 19 ENV 346 FVGLSPTVWL XVXXXXXXXL90 18 X132 FVLGGCRHKL XVXXXXXXXL95 19 ENV 342 FVQWFVGL XVXXXXXL90 18 POL 766 FVYVPSAL XVXXXXXL95 19 POL 630 GFAAPFTQCGYXFXXXXXXXXY80 16 EAV 181 GFFLLTRI XFXXXXXI80 16 ENV 181 GFFLLTRIL XFXXXXXXL80 16 ENV 181 GFFLLTRILTIXFXXXXXXXXI95 19 ENV 12 GFFPDHCL XFXXXXXL75 15 ENV 170 GFLGPLLVL XFXXXXXXL80 16 POL 500 GFRKIPMGVGLXFXXXXXXXXL95 19 POL 627 GLLGFAAPF XLXXXXXXF95 19 POL 509 GLSPFLLAXF XLXXXXXXXF表XHBV A24超基元(及结合信息)保守性频率 蛋白质 位置序列字符串 A*2401100 20ENV 348 GLSPTVWLXLXXXXXL7515ENV 348 GLSPTVWLSVI XLXXXXXXXXI8517NUC 29 GMDIDPYKEF XMXXXXXXXF9018ENV 265 GMLPVCPLXMXXXXXL9018POL 735 GTDNSVVLXTXXXXXL7515ENV 13 GTNLSVPNPL XTXXXXXXXL8016POL 763 GTSFVYVPSAL XTXXXXXXXXL8016POL 507 GVGLSPFLXVXXXXXL8016POL 507 GVGLSPFLL XVXXXXXXL9519NUC 123 GVWIRTPPAY XVXXXXXXXY8517NUC 25 GWLWGMDIXWXXXXXI8517NUC 25 GWLWGMDIDPY XWXXXXXXXXY8517ENV 65 GWSPQAQGI XWXXXXXXI0.00248517ENV 65 GWSPQAQGIL XWXXXXXXXL 0.00039519POL 639 GYPALMPLXYXXXXXL9519POL 639 GYPALMPLY XYXXXXXXY0.04909519ENV 234 GYRWMCLRRF XYXXXXXXXF 0.01109519ENV 234 GYRWMCLRRFI XYXXXXXXXXI8517POL 579 GYSLNFMGY XYXXXXXXY0.00027515POL 579 GYSLNFMGYVI XYXXXXXXXXI8016POL 820 HFASPLHVAW XFXXXXXXXW7515POL 7 HFRKLLLLXFXXXXXL8016POL 435 HLLVGSSGL XDXXXXXXL7515POL 569 HLNPNKTKRW XLXXXXXXXW8016POL 491 HLYSHPIIXLXXXXXI8016POL 491 HLYSHPIIL XLXXXXXXL8016POL 491 HLYHPIILGF XLXXXXXXXXF8517POL 715 HTAELLAACF XTXXXXXXXF100 20NUC 52 HTALRQAIXTXXXXXI9519NUC 52 HTALRQAIL XTXXXXXXL9519NUC 52 HTALRQAILCW XTXXXXXXXXW100 20POL 149 HTLWKAGIXTXXXXXI100 20POL 149 HTLWKAGIL XTXXXXXXL100 20POL 149 HTLWKAGILY XTXXXXXXXY100 20POL 146 HYLHTLWKAGI XYXXXXXXXXI100 20ENV 381 IFFCLWVYXFXXXXXY100 20ENV 381 IFFCLWVYI XFXXXXXXI0.00878016ENV 245 IFLFILLLXFXXXXXL8016ENV 245 IFLFILLLCL XFXXXXXXXL8016ENV 245 IFLFILLLCLI XFXXXXXXXXI9519ENV 255 IFLLVLLDY XFXXXXXXY8016ENV 244 IIFLFILLXIXXXXXL8016ENV 244 IIFLFLLLXIXXXXXXL8016ENV 244 IIFLFILLLCL XIXXXXXXXXXL8016POL 497 IILGFRKIXIXXXXXI8016POL 497 IILGFRKIPM XIXXXXXXXM9018NUC 59 ILCWGELMXLXXXXXM8016POL 498 ILGFRKIPM XLXXXXXXM100 20ENV 249 ILLLCLIFXLXXXXXF100 20ENV 249 ILLLCLIFL XDXXXCCCL100 20ENV 249 ILLLCLIFLL XLXXXXXXXL8016POL 760 ILRGTSFVY XLXXXXXXY9519ENV 188 ILTIPQSLXLXXXXXL9018ENV 188 ILTIPQSLDSW XLXXXXXXXXW9018POL 625 IVGLLGFAAPF XVXXXXXXXXF8517ENV 358 IWMMWYWGPS XWXXXXXXXXL 0.00049519POL 395 KFAVPNLQSL XFXXXXXXXL 0.00208016POL 503 KIPMGVGLXIXXXXXL8016POL 503 KIPMGVGLSPF XIXXXXXXXXF8517NUC 21 KLCLGWLWXLXXXXXW8517NUC 21 KLCLGWLWGM XLXXXXXXXM9519POL 489 KLHLYSHPI XLXXXXXXI8016POL 489 KLHLYSHPII XLXXXXXXXI8016POL 489 KLHLYSHPIIL XLXXXXXXXXL7515POL 108 KLIMPARFXLXXXXXF7515POL 108 KLIMPARFY XLXXXXXXY8016POL 610 KLPVNRPIXLXXXXXI8016POL 610 KLPVNRPIDW XLXXXXXXXW9519POL 574 KTKRWGYSL XTXXXXXXL8517POL 574 KTKRWGYSLNF XTXXXXXXXXF8517POL 620 KVCQRIVGL XVXXXXXXL8517POL 620 KVCQRIVGLL XVXXXXXXXL9519POL 55 KVGNFTGLXVXXXXXL9519POL 55 KVGNFTGLY XVXXXXXXY8517X91 KVLHKRTLXVXXXXXL8517X91 KVLHKRTLGL XVXXXXXXXL100 20PCL 121 KYLPLDKGI XYXXXXXXI0.00288517POL 745 KYTSFPWLXYXXXXXL8517POL 745 KYTSFPWLL XYXXXXXXL3.60008016ENV 247 LFILLLCLXFXXXXXL8016ENV 247 LFILLLCLI XFXXXXXXI8016ENV 247 LFILLLCLIF XFXXXXXXXF8016ENV 247 LFILLLCLIFL XFXXXXXXXXL表XHBV A24超基元(及结合信息)保守性 频率 蛋白质 位置序列字符串A*240110020 ENV 254 LIFLLVLLXIXXXXXL95 19 ENV 254 LIFLLVLLDY XIXXXXXXXY10020 POL 109 LIMPARFYXIXXXXXY95 19 POL 514 LLAQFTSAI XLXXXXXXI10020 ENV 251 LLCLIFLLXLXXXXXL10020 ENV 251 LLCLIFLLVL XLXXXXXXXL10020 ENV 251 LLCLIFLLVLL XLXXXXXXXXL85 17 NUC 30 LLDTASALXLXXXXXL85 17 NUC 30 LLDTASALY XLXXXXXXY95 19 ENV 260 LLDYQGMLXLXXXXXL80 16 POL 752 LLGCAANWXLXXXXXW80 16 POL 752 LLGCAANWI XLXXXXXXI80 16 POL 752 LLGCAANWIL XLXXXXXXXL95 19 POL 628 LLGFAAPFXLXXXXXF75 15 ENV 63 LLGWSPQAQGI XLXXXXXXXXI10020 ENV 250 LLLCLIFLXLXXXXXL10020 ENV 250 LLLCLIFLL XLXXXXXXL10020 ENV 250 LLLCLIFLLVL XLXXXXXXXXL10020 ENV 378 LLPIFFCLXLXXXXXL10020 ENV 378 LLPIFFCLW XLXXXXXXW10020 ENV 378 LLPIFFCLWVY XLXXXXXXXXY95 19 NUC 44 LLSFLPSDF XLXXXXXXF95 19 NUC 44 LLSFLPSDFF XLXXXXXXXF95 19 POL 563 LLSLGIHLXLXXXXXL90 18 POL 407 LLSSNLSWXLXXXXXW90 18 POL 407 LLSSNLSWL XLXXXXXXL90 18 POL 407 LLSSNLSWLSL XLXXXXXXXXL80 16 ENV 184 LLTRILTIXLXXXXXI80 16 POL 436 LLVGSSGLXLXXXXXL95 19 ENV 257 LLVLLDYQGM XLXXXXXXXM95 19 ENV 257 LLVLLDYQGML XLXXXXXXXXL95 19 ENV 175 LLVLQAGFXLXXXXXF95 19 ENV 175 LLVLQAGFF XLXXXXXXF90 18 ENV 175 LLVLQAGFFL XLXXXXXXXL90 18 ENV 175 LLVLQAGFFLL XLXXXXXXXXL10020 ENV 338 LLVPFVQWXLXXXXXW10020 ENV 338 LLVPFVQWF XLXXXXXXF90 18 NUC 100 LLWFHISCL XLXXXXXXL85 17 NUC 100 LLWFHISCLTF XLXXXXXXXXF95 19 POL 643 LMPLYACIXMXXXXXI75 15 NUC 137 LTFGRETVL XTXXXXXXL75 15 NUC 137 LTFGRETVLEY XTXXXXXXXXY90 18 ENV 189 LTIPQSLDSW XTXXXXXXXW90 18 ENV 189 LTIPQSLDSWW XTXXXXXXXXW90 18 POL 404 LTNLLSSNL XTXXXXXXL90 18 POL 404 LTNLLSSNLSW XTXXXXXXXXW80 16 ENV 185 LTRILTIPQSL XTXXXXXXXXL85 17 POL 99 LTVNEKRRL XTXXXXXXL95 19 ENV 258 LVLLDYOGM XVXXXXXXM95 19 ENV 258 LVLLDYQGML XVXXXXXXXL95 19 ENV 176 LVLQAGFFXVXXXXXF90 18 ENV 176 LVLQAGFFL XVXXXXXXL90 18 ENV 176 LVLQAGFFLL XVXXXXXXXL10020 ENV 339 LVPFVQWFXVXXXXXF95 19 ENV 339 LVPFVXWFVGL XVXXXXXXXXL90 18 NUC 119 LVSFGVWIXVXXXXXI10020 POL 377 LVVDFSQFXVXXXXXF90 18 NUC 101 LWFHISCLXWXXXXXL85 17 NUC 101 LWFHISCLTF XWXXXXXXXF85 17 NUC 27 LWGMDIDPY XWXXXXXXY10020 POL 151 LWKAGILYXWXXXXXY80 16 POL 492 LYSHPIILXYXXXXXL80 16 POL 492 LYSHPIILGF XYXXXXXXXF 1.100085 17 ENV 360 MMWYWGPSL XMXXXXXXL 0.001285 17 ENV 360 MMWYWGPSLY XMXXXXXXXY 0.000185 17 ENV 361 MWYWGPSLXWXXXXXL85 17 ENV 361 MWYWGPSLY XWXXXXXXY 0.002795 19 POL 561 NFLLSLGIXFXXXXXI95 19 POL 561 NFLLSLGIHL XFXXXXXXL 0.009995 19 POL 42 NLGNLNVSI XLXXXXXXI95 19 POL 42 NLGNLNVSIPW XLXXXXXXXXW90 18 POL 406 NLLSSNLSW XLXXXXXXW90 18 POL 406 NLLSSNLSWL XLXXXXXXXL95 19 POL 45 NLNVSIPWXLXXXXXW10020 POL 400 NLQSLTNLXLXXXXXL10020 POL 400 NLQSLTNLL XLXXXXXXL75 15 ENV 15 NLSVPNPLXLXXXXXL75 15 ENV 15 NLSVPNPLGF XLXXXXXXXF80 16 POL 758 NWILRGTSF XWXXXXXXF80 16 POL 758 NWILRGTSFVY XWXXXXXXXXY95 19 POL 512 PFLLAQFTSAI XFXXXXXXXXI95 19 POL 634 PFTQCGYPAL XFXXXXXXXL 0.000295 19 POL 634 PFTQCGYPALM XFXXXXXXXXM表XHBV A24超基元(及结合信息)保守性频率蛋白质位置序列 字符串 A*24019519 ENV 341 PFVQWFVGL XFXXXXXXL 0.00038517 POL 616 PIDWKVCQRI XIXXXXXXXI100 20 ENV 380 PIFFCLWVY XIXXXXXXY100 20 ENV 380 PIFFCLWVYI XIXXXXXXXI8517 POL 713 PIHTAELL XIXXXXXL8016 POL 496 PIILGFRKI XIXXXXXXI8016 POL 496 PIILGFRKIPMXIXXXXXXXXM100 20 ENV 314 PIPSSWAF XIXXXXXF100 20 POL 124 PLDKGIKKPY XLXXXXXXY100 20 POL 124 PLDKGIKPYY XLXXXXXXXY9519 POL 20 PLEEFLPPL XLXXXXXXL9519 ENV 10 PLGFFPDHQL XLXXXXXXXL100 20 POL 427 PLHPAAMPHL XLXXXXXXXL100 20 POL 427 PLHPAAMPHLLXLXXXXXXXXL100 20 ENV 377 PLLPIFFCL XLXXXXXXL100 20 ENV 377 PLLPIFFCLW XLXXXXXXXW9519 ENV 174 PLLVLQAGF XLXXXXXXF9519 ENV 174 PLLVLQAGFF XLXXXXXXXF9018 ENV 174 PLLVLQAGFFLXLXXXXXXXXL8016 POL 711 PLPIHTAEL XLXXXXXXL8016 POL 711 PLPIHTAELL XLXXXXXXXL7515 POL 2 PLSYQHFRKL XLXXXXXXXL7515 POL 2 PLSYQHFRKLLXLXXXXXXXXL8517 POL 98 PLTVNEKRRL XLXXXXXXXL8016 POL 505 PMGVGLSPF XMXXXXXXF8016 POL 505 PMGVGLSPFL XMXXXXXXXL8016 POL 505 PMGVGLSPFLLXMXXXXXXXXL7515 POL 692 PTGWGLAI XTXXXXXI8517 POL 797 PTTGRTSL XTXXXXXL8517 POL 797 PTTGRTSLY XTXXXXXXY8016 NLC 15 PTVQASKL XTXXXXXL8016 NUC 15 PTVQASKLCL XTXXXXXXXL7515 ENV 351 PTVWLSVI XTXXXXXI7515 ENV 351 PTVWLSVIW XTXXXXXXW7515 ENV 351 PTVWLSVIWM XTXXXXXXXM8517 POL 612 PVNRPIDW XVXXXXXW8016 POL 750 PWLLGCAANW XWXXXXXXXW8016 POL 750 PWLLGCAANWIXWXXXXXXXXI100 20 POL 51 PWTHKVGNF XWXXXXXXF 0.02908016 X 8 QLDPARDVL XLXXXXXXL8018 X 8 QLDPARDVLCLXLXXXXXXXXL9018 NUC 99 QLLWFHISCL XLXXXXXXXL9519 POL 685 QVFADATPTGWXVXXXXXXXXXW9519 ENV 344 QWFVGLSPTVWXWXXXXXXXX7515 ENV 242 RFIIFLFI XFXXXXXI7515 ENV 242 RFIIFLFIL XFXXXXXXL7515 ENV 242 RFIIFLFILL XFXXXXXXXL7515 ENV 242 RFIIFLFILLLXFXXXXXXXXL100 20 ENV 332 RFSWLSLL XFXXXXXL100 20 ENV 332 RFSWLSLLVPFXFXXXXXXXXF8016 ENV 187 RILTIPQSL XIXXXXXXL9018 POL 624 RIVGLLGF XIXXXXXF7515 POL 106 RLKLIMPARF XLXXXXXXXF7515 POL 106 RLKLIMPARFYXLXXXXXXXXY9519 POL 376 RLVVDFSQF XLXXXXXXF9018 POL 353 RTPARVTGGVFXTXXXXXXXXF9519 POL 36 RVAEDLNL XVXXXXXL9018 POL 36 RVAEDLNLGNLXVXXXXXXXXL8016 POL 818 RVHFASPL XVXXXXXL100 20 POL 357 RVTGGVFL XVXXXXXL8517 POL 577 RWGYSLNF XWXXXXXF8517 POL 577 RWGYSLNFM XWXXXXXXM8517 POL 877 RWGYSLNFMGYXWXXXXXXXXY9519 ENV 236 RWMCLRRF XWXXXXXF9519 ENV 236 RWMCLRRFI XWXXXXXXI 0.07109519 ENV 236 RWMCLRRFII XWXXXXXXXI 1.10009519 ENV 236 RWMCLRRFIIFXWXXXXXXXXF100 20 POL 167 SFCGSPYSW XFXXXXXXW 0.07109519 NUC 46 SFLPSDFF XFXXXXXF8016 POL 765 SFVYVPSAL XFXXXXXXL100 20 POL 49 SIPWTHKVGNFXIXXXXXXXXF9519 ENV 194 SLDSWWTSL XLXXXXXXL9519 ENV 194 SLDSWWTSLNFXLXXXXXXXXF9519 POL 416 SLDVSAAF XLXXXXXF9519 POL 416 SLDVSAAFY XLXXXXXXY100 20 ENV 337 SLLVPFVQW XLXXXXXXW100 20 ENV 337 SLLVPFVQWF XLXXXXXXXF7515 POL 581 SLNFMGYVI XLXXXXXXI9519 X 54 SLRGLPVCAF XLXXXXXXXF9018 POL 403 SLTNLLSSNL XLXXXXXXXL7515 X 104 STTDLEAY XTXXXXXY7515 X 104 STTDLEAYF XTXXXXXXF7515 ENV 17 SVPNPLGF XVXXXXXF表XHBV A24超基元(及结合信息)保守性频率蛋白质位置 序列 字符串A*24018517 POL 548 SVQHLESL XVXXXXXL8016 ENV 330 SVRFSWLSL XVXXXXXXL8016 ENV 330 SVRFSWLSLL XVXXXXXXXL9018 POL 739 SVVLSRKY XVXXXXXY8517 POL 739 SVVLSRKYTSFXVXXXXXXXXF9519 POL 524 SVVRRAFPHCLXVXXXXXXXXL9519 POL 413 SWLSLDVSAAFXWXXXXXXXXF100 20 ENV 334 SWLSLLVPF XWXXXXXXF 0.39009519 POL 392 SWPKFAVPNL XWXXXXXXXL 5.6000100 20 ENV 197 SWWTSLNF XWXXXXXF9519 ENV 197 SWWTSLNFL XWXXXXXXL 0.38009018 POL 537 SYMDDVVL XYXXXXXL7515 POL 4SYQHFRKL XYXXXXXL7515 POL 4SYQHFRKLL XYXXXXXXL 0.00517515 POL 4SYQHFRKLLL XYXXXXXXXL 0.06607515 POL 4SYQHFRKLLLLXYXXXXXXXXL7515 NUC 138 TFGRETVL XFXXXXXL7515 NUC 138 TFGRETVLEY XFXXXXXXXY7515 NUC 138 TFGRETVLEYLXFXXXXXXXXL9519 POL 657 TFSPTYKAF XFXXXXXXF 0.00609519 POL 657 TFSPTYKAFL XFXXXXXXXL 0.00439018 ENV 190 TIPQSLDSW XIXXXXXXW9018 ENV 190 TIPQSLDSWW XIXXXXXXXW100 20 POL 150 TLWKAGIL XLXXXXXL100 20 POL 150 TLWKAGILY XLXXXXXXY7515 X 105 TTDLEAYF XTXXXXXF8517 POL 798 TTGRTSLY XTXXXXXY8517 POL 100 TVNEKRRL XVXXXXXL8016 NUC 16 TVQASKLCL XVXXXXXXL8016 NUC 16 TVQASKLCLGWXVXXXXXXXXW7515 ENV 352 TVWLSVIW XVXXXXXW7515 ENV 352 TVWLSVIWM XVXXXXXXM9519 POL 686 VFADATPTGW XFXXXXXXXW 0.01807515 X 131 VFVLGGCRHKLXFXXXXXXXXL8517 POL 543 VLGAKSVQHL XLXXXXXXXL9018 X 133 VLGGCRHKL XLXXXXXXL8517 X 92 VLHKRTLGL XLXXXXXXL9519 ENV 259 VLLDYQGM XLXXXXXM9519 ENV 259 VLLDYQGML XLXXXXXXL9519 ENV 177 VLQAGFFL XLXXXXXL9519 ENV 177 VLQAGFFLL XLXXXXXXL8517 POL 741 VLSRKYTSF XLXXXXXXF8517 POL 741 VLSRKYTSFPWXLXXXXXXXXW8016 POL 542 VVLGAKSVQHLXVXXXXXXXXL8517 POL 740 VVLSRKYTSF XVXXXXXXXF9519 POL 525 VVRRAFPHCL XVXXXXXXXL9519 NUC 124 VWIRTPPAY XWXXXXXXY7515 ENV 353 VWLSVIWM XWXXXXXM9018 NUC 102 WFHISCLTF XFXXXXXXF 0.03009519 ENV 345 WFVGLSPTVW XFXXXXXXXW 0.01209519 ENV 345 WFVGLSPTVWLXFXXXXXXXXL8016 POL 759 WILRGTSF XIXXXXXF8016 POL 759 WILRGTSFVY XIXXXXXXXY9519 NUC 125 WIRTPPAY XIXXXXXY8016 POL 751 WLLGCAANW XLXXXXXXW8016 POL 751 WLLGCAANWI XLXXXXXXXI8016 POL 751 WLLGCAANWILXLXXXXXXXXL9519 POL 414 WLSLDVSAAF XLXXXXXXXF9519 POL 414 WLSLDVSAAFYXLXXXXXXXXY100 20 ENV 335 WLSLLVPF XLXXXXXF100 20 ENV 335 WLSLLVPFVQWXLXXXXXXXXW8517 NUC 26 WLWGMDIDPY XLXXXXXXXY9519 ENV 237 WMCLRRFI XMXXXXXI9519 ENV 237 WMCLRRFII XMXXXXXXI 0.02309519 ENV 237 WMCLRRFIIF XMXXXXXXXF 0.00139519 ENV 237 WMCLRRFIIFLXMXXXXXXXXL8517 ENV 359 WMMWYWGPSL XMXXXXXXXL 0.00058517 ENV 359 WMMWYWGPSL XMXXXXXXXXY100 20 POL 52 WTHKVGNF XTXXXXXF9519 POL 52 WTHKVGNFTGLXTXXXXXXXXL9519 ENV 198 WWTSLNFL XWXXXXXL8517 ENV 362 WYWGPSLY XYXXXXXY 0.0001100 20 POL 147 YLHTLWKAGI XLXXXXXXXI100 20 POL 147 YLHTLWKAGILXLXXXXXXXXL100 20 POL 122 YLPLDKGI XLXXXXXI100 20 POL 122 YLPLDKGIKPYXLXXXXXXXXY9018 NUC 118 YLVSFGVW XLXXXXXW9018 NUC 118 YLVSFGVWI XLXXXXXXI8517 POL 746 YTSFPWLL XTXXXXXL表XIHBV B07超基元(及结合信息)保守性频率蛋白质位置序列 P2 C-端AA B*0702 B*3501 B*5101 B*5301 B*54017515 X 146 APCNFFTSA P A 99519 POL 633 APFTQCGY P Y 8 0.00010.00120.0019 0.0002 0.00029519 POL 633 APFTQCGYPA P A 100.00290.0001 0.0002 1.40009519 POL 633 APFTQCGYPALP L 110.23000.00100.0004-0.0003 0.0093100 20 ENV 232 CPGYRWMCL P L 98016 NUC 14 CPTVQASKL P L 98016 NUC 14 CPTVQASKLCLP L 118016 X 10 DPARDVLCL P L 98016 ENV 122 DPRVRGLY P Y 89018 POL 778 DPSRGRLGL P L 9 0.01200.00010.0001 0.0001 0.00019018 NUC 33 DPYKEFGA P A 8 0.00010.00010.0019 0.0002 0.00197515 ENV 130 FPAGGSSSGTVP V 119018 ENV 14 FPDHQLDPA P A 98517 ENV 14 FPDHQLDPAF P F 100.00020.00160.0003 0.0011 0.00219519 POL 530 FPHCLAFSY P Y 9 0.00010.52500.0665 0.5400 0.01999519 POL 530 FPHCLAFSYM P M 100.09900.22000.0900 0.0790 0.04807515 POL 749 FPWLLGCA P A 87515 POL 749 FPWLLGCAA P A 97515 POL 749 FPWLLGCAANWP W 119018 X 67 GPCALRFTSA P A 100.09000.00010.0001 0.0002 0.00359519 POL 19 GPLEEELPRL P L 100.00010 00010.0002 0.0001 0.00029018 POL 19 GPLEEELPRLAP A 11 -0.00020.00010.0001-0.0003 0.00019519 ENV 173 GPLLVLQA P A 8 0.00030.00010.0110 0.0002 0.00659519 ENV 173 GPLLVLQIAGFP F 100.00010.00010.0002 0.0001 0.00029519 ENV 173 GPLLVLQAGFFP F 110.00110.00010.0001 0.0008 0.00098517 POL 97 GPLTVNEKRRLP L 110.00310.00010.0001-0.0003 0.0001100 20 POL 429 HPAAMPHL P L 8 0.06500.00040.3100 0.0037 0.0160100 20 POL 429 HPAAMPHLL P L 9 0.09800.02700.0110 0.0500 0.01208517 POL 429 HPAAMPHLLV P V 100.01600.00200.0078 0.0140 0.01708016 POL 495 HPIILGFRKI P I 10100 20 ENV 313 IPIPSSWA P A 8 0.00040.00040.0019 0.0002 0.0600100 20 ENV 313 IPIPSSWAF P F 9 0.13002.76792.3500 0.7450 0.00348016 ENV 313 IPIPSSWAFA P A 100.00130.0024 0.0014 0.45008016 POL 504 IPMGVGLSPF P F 108016 POL 504 IPMGVGLSPFLP L 119018 ENV 191 IPQSLDSW P W 89018 ENV 191 IPQSLDSWW P W 98016 ENV 315 IPSSWAFA P A 8100 20 POL 50 IPWTHKVGNF P F 100.00130.00010.00070.00010.0002100 20 ENV 379 LPIFFCLW P W 8 0.00010.00010.03600.14000.0035100 20 ENV 379 LPIFFCLWV P V 9100 20 ENV 379 LPIFFCLWVY P Y 100.00020.00790.00020.00060.0002100 20 ENV 379 LPIFFCLWVYIP I 110.00020.00010.00430.01390.00218517 POL 712 LPIHTAEL P L 88517 POL 712 LPIHTAELL P L 9 0.00400.06300.00520.31000.00058517 POL 712 LPIHTAELLA P A 100.00180.0011 0.00160.33008517 POL 712 LPIHTAELLAAP A 110.00900.0027-0.0003 0.01202.75008016 X 89 LPKVLHKRTL P L 10表XIHBV B07超基元(及结合信息)保守性频率蛋白质位置序列 P2C-端AA B*0702 B*3501 B*5101 B*5301 B*5401100 20 POL 123 LPLDKGIKPY P Y 100.00010.02900.00020.00030.0002100 20 POL 123 LPLDKGIKPYYP Y 11 -0.00020.00090.00010.00070.00019519 X 58 LPVCAFSSA P A 9 0.04800.07100.01100.000919.00008016 POL 611 LPVNRPIDW P W 98016 POL 611 LPVNRPIDWKVP V 118016 POL 433 MPHLLVGSSGLP L 11100 20 POL 1 MPLSYQHF P F 8 0.00010.00970.01200.03700.01907515 POL 1 MPLSYQHFRKLP L 119018 POL 774 NPADDPSRGRLP L 110.01200.00010.0001 -0.00030.00019519 ENV 9 NPLGFFPDHQLP L 110.00120.00210 00010.00280.00017515 POL 571 NPNKTKRW P W 87515 POL 571 NPNKTKRWGY P Y 109519 NUC 129 PPAYRPPNA P A 9 0.00010.00010.00010.00020.00039519 NUC 129 PPAYRPPNAPIP I 110.00030.00010.0001 -0.00030.00018517 ENV 58 PPHGGLLGW P W 9 0.00010.00020.00010.00030.0002100 20 NUC 134 PPNAPILSTL P L 100.00010.00010.00350.00010.00028016 POL 615 RPIDWKVCQRIP I 11100 20 NUC 133 RPPNAPIL P L 8 0.00760.00010.02800.00020.0002100 20 NLC 133 RPPNAPILSTLP L 110.13000.00010.0018 -0.00030.0001100 20 NUC 44 SPEHCSPHHTAP A 11 -0.00020.00010.0001 -0.00030.00119519 POL 511 SPFLLAQF P F 8 0.55000.00090.01800.00090.00939519 POL 511 SPFLLAQFTSAP A 110.08200.00010.0001 -0.000312.0500100 20 NUC 49 SPHHTALRQA P A 100.00120.0001 0.00020.0035100 20 NUC 49 SPHHTALRQAIP I 110.58000.00010.00040.00050.00028517 ENV 67 SPQAQGIL P L 88517 POL 808 SPSVPSHL P L 87515 ENV 350 SPTVWLSV P V 87515 ENV 350 SPTVWLSVI P I 97515 ENV 350 SPTVWLSVIW P W 107515 ENV 350 SPTVWLSVIWMP M 119519 POL 659 SPTYKAFL P L 8 0.39000.00010.00190.00020.00029018 POL 354 TPARVTGGV P V 9 0.00780.00010.00130.00010.00159018 POL 354 TPARVTGGVF P F 100.32000.10000.00010.00990.00069018 POL 354 TPARVVTGGVFL P L 110.09500.00010.00010.00050.00059519 NUC 128 TPPAYRPPNA P A 100.00010.0001 0.00020.01007515 ENV 57 TPPHGGLL P L 87515 ENV 57 TPPHGGLLGW P W 108016 POL 691 TPTGWGLA P A 87515 POL 691 TPTGWGLAI P I 99519 ENV 340 VPFVQWFV P V 8 0.00100.000119.0000 0.00020.11009519 ENV 340 VPFVQWFVGL P L 100.00110.00010.01000.00010.00259519 POL 398 VPNLQSLTNL P L 100.00060.00010.00040.00010.00029519 POL 398 VPNLQSLTNLLP L 110.00040.00010.0001 -0.00030.00029018 POL 769 VPSALNPA P A 8 0.00110.00010.00700.00021.00009519 POL 393 WPKFAVPNL P L 9 0.00540.00020.00150.00010.00159519 POL 640 YPALMPLY P Y 8 0.00040.26000.41000.04500.00569519 POL 640 YPALMPLYA P A 9 0.01800.04800.03400.014016.00009519 POL 640 YPALMPLYACIP I 110.00400.00010.04700.03200.0700表XIIHBV B27超基元(无结合数据可用)蛋白质 序列 HBV中位置 氨基酸数 序列频率 保守性(%)AYW AHLSLRGL 51 8 19 95AYW ARVTGGVF 3568 18 90AYW DHGAHLSL 48 8 19 95AYW DHQLDPAF 16 8 18 90AYW DKGIKPYY 1268 20 100AYW FHISCLTF 1038 18 90AYW FRKIPMGV 5018 16 80AYR GRETVLEY 1408 15 75AYW HHTALRQA 51 8 20 100AYW IHTAELLA 7148 17 85AYW LHKRTLGL 93 8 18 90AYW LHLYSHPI 4908 19 95AYW LRGLPVCA 55 8 19 95AYW LRGTSFVY 7618 16 80AYW LRQAILCW 55 8 19 95AYW LRRFIIFL 2408 19 95AYW NKTKRWGY 5738 15 75AYW NRPIDWKV 6148 18 90AYW NRRVAEDL 34 8 17 85AYW PHCLAFSY 5318 19 95AYW PHGGLLGW 59 8 17 85AYW PKFAVPNL 3948 19 95AYR QHFRKLLL 6 8 15 75AYW RHYLHTLW 1458 20 100AYW RKYTSFPW 7448 17 85AYW RRAFPHCL 5278 19 95AYW RRFIIFLF 2418 15 75AYW SHPIILGF 4948 16 80AYW SKLCLGWL 20 8 18 90AYW SRNLYVSL 4728 16 80AYW TKRWGYSL 5758 19 95AYW TRHYLHTL 1448 20 100AYW VRFSWLSL 3318 16 80AYW WKVCQRIV 6198 17 85AYW YRPPNAPI 1328 20 100AYW ARVTGGVFL 3569 18 90AYW EHCSPHHTA 46 9 20 100AYR GRETVLEYL 1409 15 75AYW HHTALRQAI 51 9 20 100AYW HKVGNFTGL 54 9 19 95AYW IHTAELLAA 7149 17 85AYW KRWGYSLNF 5769 17 85AYW LHLYSHPII 4909 16 80AYW LHPAAMPHL 4289 20 100AYW LHTLWKAGI 1489 20 100表XIIHBV B27超基元(无结合数据可用)蛋白质序列 HBV中位置 氨基酸数 序列频率 保守性(%)AYR LKLIMPARF 107 9 1575AYW LRGLPVCAF 55 9 1995AYW LRGTSFVYV 761 9 1680AYW LRRFIIFLF 240 9 1575AYW PHCLAFSYM 531 9 1995AYW PHHTALRQA 50 9 20100AYW PKVLHKRTL 90 9 1785AYR QHFRKLLLL 6 9 1575AYW QRIVGLLGF 623 9 1890AYW RKIPMGVGL 502 9 1680AYW RKLPVNRPI 609 9 1680AYW RKYTSFPWL 744 9 1785AYW RRAFPHCLA 527 9 1995AYW RRFIIFLFI 241 9 1575AYR RRLKLIMPA 105 9 1575AYW RRVAEDLNL 35 9 1890AYW SKLCLGWLW 20 9 1785AYW SRKYTSFPW 743 9 1785AYW TRHYLHTLW 144 9 20100AYW VHFASPLHV 819 9 1680AYW VRFSWLSLL 331 9 1680AYW VRRAFPHCL 526 9 1995AYW YRPPNAPIL 132 9 20100AYW YRWMCLRRF 235 9 1995AYW AHLSLRGLPV 51 10 1890AYW AKSVQHLESL 546 10 1785AYW ARDVLCLRPV 12 10 1575AYW ARVTGGVFLV 356 10 1890AYW EHCSPHHTAL 46 10 20100AYW FRKIPMGVGL 501 10 1680AYW FRKLPVNRPI 608 10 1680AYR GRETVLEYLV 140 10 1575AYW HHTALRQAIL 51 10 1995AYW HKVGNFTGLY 54 10 1995AYW KRWGYSLNFM 576 10 1785AYW LHLYSHPIIL 490 10 1680AYW LHPAAMPHLL 428 10 20100AYW LHTLWKAGIL 148 10 20100AYR LKLIMPARFY 107 10 1575AYW LRRFIIFLFI 240 10 1575AYW NKTKRWGYSL 573 10 1575AYW NRRVAEDLNL 34 10 1785AYW PHHTALRQAI 50 10 20100AYW PHLLVGSSGL 434 10 1680AYW QRIVGLLGFA 623 10 1890AYW RHYLHTLWKA 145 10 20100表XIIHBV B27超基元(无结合数据可用)蛋白质序列 HBV中位置 氨基酸数 序列频率 保守性(%)AYW RKYTSFPWLL 744 10 1785AYW RRAFPHCLAF 527 10 1995AYW RRFIIFLFIL 241 10 1575AYW SRKYTSFPWL 743 10 1785AYW SRLVVDFSQF 375 10 1995AYW THKVGNFTGL 5310 1995AYW TKRWGYSLNF 575 10 1785AYW TKYLPLDKGI 120 10 20100AYW TRILTIPQSL 186 10 1680AYW VHFASPLHVA 819 10 1680AYW VRFSWLSLLV 331 10 1680AYW VRRAFPHCLA 526 10 1995AYW WKVCQRIVGL 619 10 1785AYW YRWMCLRRFI 235 10 1995AYW DHGAHLSLRGL 4811 1995AYW IHLNPNKTKRW 568 11 1575AYW IHTAELLAACF 714 11 1785AYW LHPAAMPHLLV 428 11 1785AYW LHTLWKAGILY 148 11 20100AYW LRQAILCWGEL 5511 1890AYW LRRFIIFLFIL 240 11 1575AYW PHHTALRQAIL 5011 1995AYW PKFAVPNLQSL 394 11 1995AYW PKVLHKRTLGL 9011 1785AYW PRTPARVTGGV 352 11 1890AYW QRIVGLLGFAA 623 11 1890AYW RKLPVNRPIDW 609 11 1680AYW RRFIIFLFILL 241 11 1575AYR RRLKLIMPARF 105 11 1575AYW SHPIILGFRKI 494 11 1680AYW SKLCLGWLWGM 2011 1785AYW SRKYTSFPWLL 743 11 1785AYW THKVGNFTGLY 5311 1995AYW TKRWGYSLNFM 575 11 1785AYW TRHYLHTLWKA 144 11 20100AYW VHFASPLHVAW 819 11 1680AYW VRRAFPHCLAF 526 11 1995AYW WKVCQRIVGLL 619 11 1785AYW YRWMCLRRFII 235 11 1995表XIIIHBV B58超基元蛋白质序列 位置氨基酸数 序列频率 保守性(%)POL AAMPHLLV 431 817 85NUC ASALYREA 34 817 85POL ASFCGSPY 166 820 100NUC ASKLCLGW 19 818 90POL ASPLHVAW 822 816 80ENV ASVRFSWL 329 816 80POL ATPTGWGL 690 819 95X CALRFTSA 69 818 90NUC CSPHHTAL 48 820 100POL CSVVRRAF 523 819 95POL ESRLVVDF 374 819 95NUC ETVLEYLV 142 815 75POL FARSRSGA 724 817 85POL FASPLHVA 821 816 80POL FSPTYKAF 658 819 95X FSSAGPCA 63 819 95ENV FSWLSLLV 333 820 100POL FSYMDDVV 536 818 90POL FTQCGYPA 635 819 95POL FTSAICSV 518 819 95POL GAKSVOHL 545 817 85POL GTDNSVVL 735 818 90POL HTAELLAA 715 817 85NUC HTALRQAI 52 820 100POL HTLWKAGI 149 820 100POL LAQFTSAI 515 819 95NUC LSFLPSDF 45 819 95POL LSLDVSAA 415 819 95ENV LSLLVPFV 336 820 100X LSLRGLPV 53 819 95POL LSRKYTSF 742 817 85POL LSSNLSWL 408 818 90POL LSWLSLDV 412 820 100NUC LTFGRETV 108 819 95X MSTTDLEA 103 816 80NUC NAPILSTL 136 820 100POL PAAMPHLL 430 820 100POL PALMPLYA 641 819 95X PARDVLCL 11 816 80POL PARVTGGV 355 818 90NUC PAYRPPNA 130 819 95POL PSRGRLGL 779 818 90POL PTGWGLAI 692 815 75POL PTTGRTSL 797 817 85NUC PTVQASKL 15 816 80ENV PTVWLSVI 351 815 75表XIIIHBV B58超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)POLRAFPHCLA 528 8 1995X RTLGLSAM 968 24120NUCSALYREAL 358 1890X SSAGPCAL 648 1995ENVSSGTVNPV 136 8 1575ENVSSKPRQGM 5 8 1890NUCSTLPETTV 141 8 20100X STTDLEAY 104 8 1575NUCTALRQAIL 538 1995POLTSAICSVV 519 8 1995ENVTSGFLGPL 168 8 1680X TTDLEAYF 105 8 1575POLTTGRTSLY 798 8 1785POLVSWPKFAV 391 8 1995NUCVSYVNVNM 115 8 20100POLVTGGVFLV 358 8 20100ENVWSPQAQGI 668 1785POLWTHKVGNF 528 20100POLYSLNFMGY 580 8 1785POLYTSFPWLL 746 8 1785POLAAPFTQCGY 632 9 1995NUCASALYREAL 349 1785NUCASKLCLGWL 199 1890POLATPTGWGLA 690 9 1680POLCSRNLYVSL 471 9 1680POLDATPTGWGL 689 9 1995ENVDSWWTSLNF 196 9 1995POLEAGPLEEEL 179 20100POLFADATPTGW 687 9 1995POLFASPLHVAW 821 9 1680POLFAVPNLQSL 396 9 1995POLFSPTYKAFL 658 9 1995X FSSAGPCAL 639 1995POLFSYMDDVVL 536 9 1890POLFTFSPTYKA 656 9 1995POLFTGLYSSTV 599 1890POLFTQCGYPAL 635 9 1995POLFTSAICSVV 518 9 1995X GAHLSLRGL 509 1995NUCHTALRQAIL 529 1995POLHTLWKAGIL 149 9 20100POLKSVQHLESL 547 9 1785POLKTKRWGYSL 574 9 1995POLLAFSYMDDV 534 9 1890NUCLSFLPSDFF 459 1995POLLSLDVSAAF 415 9 1995表XIIIHBV B58超基元蛋白质 序列 位置氨基酸数 序列频率 保守性(%)POL LSPFLLAQF 510 9 19 95ENV LSPTVWLSV 349 9 15 75NUC LSTLPETTV 140 9 20 100ENV LSVPNPLGF 16 9 15 75POL LSYQHFRKL 3 9 15 75NUC LTFGRETVL 137 9 15 75POL LTNLLSSNL 404 9 18 90POL LTVNEKRRL 99 9 17 85X MSTTDLEAY 103 9 15 75POL NSVVLSRKY 738 9 18 90POL PAAMPHLLV 430 9 17 85POL PARVTGGVF 355 9 18 90POL PTTGRTSLY 797 9 17 85ENV PTVWLSVIW 351 9 15 75POL QAFTFSPTY 654 9 19 95NUC QAILCWGEL 57 9 18 90NUC QASKLCLGW 18 9 16 80POL RAFPHCLAF 528 9 19 95ENV RTGDPAPNM 167 9 16 80X SAGPCALRF 65 9 18 90POL SASFCGSPY 165 9 20 100POL SSNLSWLSL 409 9 18 90ENV SSSGTVNPV 135 9 15 75NUC STLPETTVV 141 9 20 100X STTDLEAYF 104 9 15 75POL TAELLAACF 716 9 17 85NUC TASALYREA 33 9 16 80POL TSFVYVPSA 764 9 16 80ENV TSGFLGPLL 168 9 15 75POL TTGRTSLYA 798 9 17 85POL VSIPWTHKV 48 9 20 100ENV WSPQAQGIL 66 9 17 85ENV WSSKPRQGM 4 9 18 90POL YSHPIILGF 493 9 16 80POL YSLNFMGYV 580 9 15 75POL ASFCGSPYSW 166 1020 100NUC ASKLCLGWLW 19 1017 85ENV ASVRFSWLSL 329 1016 80POL ATPTGWGLAI 690 1015 75X CAFSSAGPCA 61 1019 95ENV CTCIPIPSSW 310 1020 100ENV CTIPAQGTSM 298 1016 80POL DATPTGWGLA 689 1016 80ENV DSWWTSLNFL 196 1018 90NLC DTASALYREA 32 1016 80POL FAAPFTQCGY 631 1019 95表XIIIHBV B58超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)ENV FSWLSLLVPF333 1020100POL FTFSPTYKAF656 101995POL FTQCGYPALM635 1038190ENV GSSSGTVNPV134 101575ENV GTNLSVPNPL13101575POL GTSFVYVPSA763 101680POL HTAELLAACF715 101785POL HTLWKAGILY149 1020100POL LAFSYMDDVV534 101890POL LSLDVSAAFY415 101995ENV LSLLVPFVQW336 1020100X LSLRGLPVCA53101995ENV LSPTVWLSVI349 101575POL LSRKYTSFPW742 101785POL LSSNLSWLSL408 101890NUC LSTLPETTVV140 1020100POL LSWLSLDVSA412 1020100POL LSYQHFRKLL3 101575ENV LTIPQSLDSW189 101890X MSTTDLEAYF103 101575POL PADDPSRGRL775 101890ENV PAGGSSSGTV131 101890POL PALMPLYACI641 101995X PAPCNFFTSA145 101575POL PARVTGGVFL355 101890NLC PAYRPPNAPI130 101995POL PTTGRTSLYA797 101785NUC PTVQASKLCL15101680ENV PTVWLSVIWM351 1030150ENV QAGFFLLTRI179 101680NUC QAILCWGELM571036180ENV QAMQWNSTTF107 101680NUC QASKLCLGWL18101680ENV QSLDSWWTSL193 101890POL RTPARVTGGV353 101890POL SAICSVVRRA520 101995X SSAGPCALRF64101890PCL TAELLAACFA716 101785NUC TALRQAILCW53101995NUC TASALYREAL33101680POL TSFPWLLGCA747 101575POL TSFVYVPSAL764 101680ENV TSGFLGPLLV168 101575POL VAEOLNLGNL37101995POL YSLNFMGYVI580 101575POL AACFARSRSGA 721 111785表XIIIHBV B58超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)POLAAPFTQCGYPA 632 111995ENVASVRFSWLSLL 329 111680X CAFSSAGPCAL 61111995X CALRFTSARRM 691126130NUCCSPHHTALRQA 481120100ENVCTCIPIPSSWA 310 1120100POLDATPTGWGLAI 689 111575NUCDTASALYREAL 32111680POLESRLVVDFSQF 374 111995POLFADATPTGWGL 687 111995X FSSAGPCALRF 63111890ENVFSWLSLLVPFV 333 1120100POLFSYMDDVVLGA 536 111890POLFTFSPTYKAFL 656 111995X GAHLSLRGLPV 50111890POLGAKSVQHLESL 545 111785POLGTSFVYVPSAL 763 111680POLHTAELLAACFA 715 111785NUCHTALRQAILCW 52111995NUCISCLTFGRETV 105 111890POLKTKRWGYSLNF 574 111785POLLAFSYMDDVVL 534 111890POLLAQFTSAICSV 515 111995ENVLSLLVPFVQWF 336 1120100X LSLRGLPVCAF 53111995ENVLSPTVWLSVIW 349 111575POLLSRKYTSFPWL 742 111785POLLSWLSLDVSAA 412 111995POLLSYQHFRKLLL 3 111575NUCLTFGRETVLEY 137 111575ENVLTIPQSLDSWW 189 111890POLLTNLLSSNLSW 404 111890ENVLTRILTIPQSL 185 111680X PARDVLCLRPV 11111575POLPARVTGGVFLV 355 111890NUCPAYRPPNAPIL 130 111995ENVPTVWLSVIWMM 351 1128140POLQAFTFSPTYKA 654 111995ENVQAGFFLLTRIL 179 111680NUCQASKLCLGWLW 18111575POLQSLTNLLSSNL 402 111890POLRAFPHCLAFSY 528 111995POLRTPARVTGGVF 353 111890NUCRTPPAYRPPNA 127 111995POLSAICSVVRRAF 520 111995POLSASFCGSPYSW 165 1120100表XIIIHBV B58超基元蛋白质序列位置氨基酸数 序列频率 保守性(%)POL SSNLSWLSLDV 409 111890POL TSAICSVVRRA 519 111995POL TSFPWLLGCAA 747 111575ENV TSGFLGPLLVL 168 111575POL VSWPKFAVPNL 391 111995POL WTHKVGNFTGL 52 111995POL YTSFPWLLGCA 746 111575表XIVHBV B62超基元蛋白质序列 位置 氨基酸数序列频率 保守性(%)NUC AILGWGEL 58 8 1890POL APFTQCGY 633 8 1995POL AVPNLQSL 397 8 1995ENV CIPIPSSW 312 8 20100NUC CLGWLWGM 23 8 1785ENV CLIFLLVL 253 8 20100ENV CLRRFIIF 239 8 1995POL CQRIVGLL 622 8 1785NUC DIDPYKEF 31 8 1890NUC DLLDTASA 29 8 1785ENV DPRVRGLY 122 8 1680NUC DPYKEFGA 33 8 1890X DVLCLRPV 14 8 1995X FLGEEIRL 122 8 1680POL ELLAACFA 718 8 1890ENV FIIFLFIL 243 8 1680ENV FILLLCLI 248 8 1680ENV FLGPLLVL 171 8 1575ENV FLLVLLDY 256 8 1995POL FPWLLGCA 749 8 1575ENV FVGLSPTV 346 8 1995ENV FVQWFVGL 342 8 1995POL FVYVPSAL 766 8 1890POL GLSPFLLA 509 8 1995ENV GLSPTVWL 348 8 20100ENV GMLPVCPL 265 8 1890ENV GPLLVLQA 173 8 1995POL GVGLSPFL 507 8 1680POL HLYSHPII 491 8 1680POL HPAAMPHL 429 8 20100ENV IIFLFILL 244 8 1680POL IILGFRKI 497 8 1680NUC ILCWGELM 59 8 1890ENV ILLLCLIF 249 8 20100POL ILRGTSFV 760 8 1680ENV ILTIPQSL 188 8 1995ENV IPIPSSWA 313 8 20100ENV IPQSLDSW 191 8 1890ENV IPSSWAFA 315 8 1680POL IVGLLGFA 625 8 1890POL KIPMGVGL 503 8 1680NUC KLCLGWLW 21 8 1785POL KLIMPARF 108 8 1575POL KLPVNRPI 610 8 1680POL KVGNFTGL 55 8 1995X KVLHKRTL 91 8 1785ENV LIFLLVLL 254 8 20100表XIVHBV B62超基元蛋白质 序列 位置氨基酸数 序列频率 保守性(%)POL LIMPARFY 109 8 20 100POL LLAQFTSA 514 8 19 95ENV LLCLIFLL 251 8 20 100NUC LLDTASAL 30 8 17 85ENV LLDYQGML 260 8 19 95POL LLGCAANW 752 8 16 80POL LLGFAAPF 628 8 19 95ENV LLGWSPQA 63 8 17 85ENV LLLCLIFL 250 8 20 100ENV LLPIFFCL 378 8 20 100POL LLSLGIHL 563 8 19 95POL LLSSNLSW 407 8 18 90ENV LLTRILTI 184 8 16 80POL LLVGSSGL 436 8 16 80ENV LLVLQAGF 175 8 19 95ENV LLVPFVQW 338 8 20 100POL LMPLYACI 643 8 19 95ENV LPIFFCLW 379 8 20 100POL LPIHTAEL 712 8 17 85ENV LQAGFFLL 178 8 19 95POL LQSLTNLL 401 8 20 100ENV LVLQAGFF 176 8 19 95ENV LVPFVQWF 339 8 20 100NUC LVSFGVWI 119 8 18 90POL LVVDFSQF 377 8 20 100POL MPLSYQHF 1 8 20 100NUC MQLFHLCL 1 8 15 75ENV MQWNSTTF 109 8 16 80POL NLNVSIPW 45 8 19 95POL NLQSLTNL 400 8 20 100ENV NLSVPNPL 15 8 15 75POL NPNKTKRW 571 8 15 75ENV PIFFCLWV 380 8 20 100POL PIHTAELL 713 8 17 85ENV PIPSSWAF 314 8 20 100ENV PQSLDSWW 192 8 18 90XPVCAFSSA 59 8 19 95POL PVNRPIDW 612 8 17 85KQLDPARDV 8 8 16 80POL RIVGLLGF 624 8 18 90POL RLKLIMPA 106 8 15 75NUC RPPNAPIL 133 8 20 100NUC ROLLWFHI 98 8 18 90POL RVAEDLNL 36 8 19 95POL RVHFASPL 818 8 16 80POL RVTGGVFL 357 8 20 100POL SIPWTHKV 49 8 20 100表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)POL SLDVSAAF 4168 19 95POL SLNFMGYV 5818 15 75POL SPFLLAQF 5118 19 95ENV SPQAQGIL 67 8 17 85POL SPSVPSHL 8088 17 85ENV SPTVWLSV 3508 15 75POL SPTYKAFL 6598 19 95ENV SVPNPLGF 17 8 15 75POL SVQHLESL 5488 17 85POL SVVLSRKY 7398 18 90NUC TLPETTVV 1428 20 100POL TLWKAGIL 1508 20 100ENV TPPHGGLL 57 8 15 75POL TPTGWGLA 6918 16 80POL TQCGYPAL 6368 19 95POL TVNEKRRL 1008 17 85ENV TVWLSVIW 3528 15 75ENV VLLDYQGM 2598 19 95ENV VLQAGFFL 1778 19 95ENV VPFVQWFV 3408 19 95POL VPSALNPA 7698 18 90NUC VQASKLCL 17 8 16 80POL VVLGAKSV 5428 18 90POL WILRGTSF 7598 16 80NUC WIRTPPAY 1258 19 95POL WLSLDVSA 4148 20 100ENV WLSLLVPF 3358 20 100ENV WMCLRRFI 2378 19 95POL YLHTLWKA 1478 20 100POL YLPLDKGI 1228 20 100NUC YLVSFGVW 1188 18 90POL YPALMPLY 6408 19 95POL YQHFRKLL 5 8 15 75POL AICSVVRRA 5219 19 95NUC AILCWGELM 58 9 18 90POL ALMPLYACI 6429 19 95NUC ALRQAILCW 54 9 19 95ENV AMQWNSTTF 1089 16 80XAMSTTDLEA 1029 15 75XAPCNFFTSA 1469 15 75ENV CIPIPSSWA 3129 20 100ENV CLIFLLVLL 2539 20 100ENV CLRRFIIFL 2399 19 95NUC CLTFGRETV 1079 18 90ENV CPGYRWMCL 2329 20 100NLC CPTVQASKL 14 9 16 80XCQLDPARDV 7 9 16 80表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)NUC DLLDTASAL 29 9 1785POL DLNLGNLNV 40 9 1995XDPARDVLCL 10 9 1680POL DPSRGRLGL 7789 1890POL DVVLGAKSV 5419 1890ENV FIIFLFILL 2439 1680ENV FILLLCLIF 2489 1680ENV FLFILLLCL 2469 1680POL FLLAQFTSA 5139 1995POL FLLSLGIHL 5629 1995ENV FLLTRILTI 1839 1680ENV FPDHQLDPA 14 9 1890POL FPHCLAFSY 5309 1995POL FPWLLGCAA 7499 1575ENV FVGLSPTVW 3469 1995POL GLCQVFADA 6829 1785POL GLLGFAAPF 6279 1995ENV GLLGWSPQA 62 9 1785POL GVGLSPFLL 5079 1680NUC GVWIRTPPA 1239 1995POL HLLVGSSGL 4359 1680XHLSLRGLPV 52 9 1890POL HLYSHPIIL 4919 1680POL HPAAMPHLL 4299 20100ENV IIFLFILLL 2449 1680POL ILGFRKIPM 4989 1680ENV ILLLCLIFL 2499 20100POL ILRGTSFVY 7609 1680ENV IPIPSSWAF 3139 20100ENV IPQSLDSWW 1919 1890POL IVGLLGFAA 6259 1890POL KLHLYSHPI 4899 1995POL KLIMPARFY 1089 1575POL KVCQRIVGL 6209 1785POL KVGNFTGLY 55 9 1995POL LLAQFTSAI 5149 1995ENV LLCLIFLLV 2519 20100NUC LLDTASALY 30 9 1785POL LLGCAANWI 7529 1680ENV LLLCLIFLL 2509 20100ENV LLPIFFCLW 3789 20100NUC LLSFLPSDF 44 9 1995POL LLSSNLSWL 4079 1890ENV LLVLQAGFF 1759 1995ENV LLVPFVQWF 3389 20100NUC LLWFHISCL 1009 1890ENV LPIFFCLWV 3799 20100表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)POL LPIHTAELL7129 17 85XLPVCAFSSA58 9 19 95POL LPVNRPIDW6119 16 80ENV LVLLDYQGM2589 19 95ENV LVLQAGFFL1769 18 90ENV LVPFVQWFV3399 19 95ENV MMWYWGPSL3609 17 85POL NLGNLNVSI42 9 19 95POL NLLSSNLSW4069 18 90POL NLQSLTNLL4009 20 100POL NLSWLSLDV4119 18 90ENV PIFFCLWVY3809 20 100POL PIHTAELLA7139 17 85POL PIILGFRKI4969 16 80ENV PIPSSWAFA3149 16 80POL PLDKGIKPY1249 20 100POL PLEEELPRL20 9 19 95ENV PLLPIFFCL3779 20 100ENV PLLVLQAGF1749 19 95POL PLPIHTAEL7119 16 80POL PMGVGLSPF5059 16 80NUC PPAYRPPNA1299 19 95ENV PPHGGLLGW58 9 17 85XQLDPARDVL8 9 16 80ENV RILTIPQSL1879 16 80POL RIVGLLGFA6249 18 90POL RLVVDFSQF3769 19 95POL RVTGGVFLV3579 20 100ENV SLDSWWTSL1949 19 95POL SLDVSAAFY4169 19 95ENV SLLVPFVQW3379 20 100POL SLNFMGYVI5819 15 75XSLRGLPVCA54 9 19 95ENV SPTVWLSVI3509 15 75ENV SVRFSWLSL3309 16 80ENV TIPQSLDSW1909 18 90POL TLWKAGILY1509 20 100POL TPARVTGGV3549 18 90POL TPTGWGLAI6919 15 75POL TQCGYPALM6369 19 95NUC TVQASKLCL16 9 16 80ENV TVWLSVIWM3529 15 75XVLCLRPVGA15 9 19 95XVLGGCRHKL1339 18 90XVLHKRTLGL92 9 17 85ENV VLLDYQGML2599 19 95ENV VLQAGFFLL1779 19 95表XIVHBV B62超基元蛋白质 序列位置 氨基酸数 序列频率 保守性(%)POL VLSRKYTSF 7419 1785POL WILRGTSFV 7599 1680POL WLLGCAANW 7519 1680POL WLSLDVSAA 4149 1995ENV WLSLLVPFV 3359 20100ENV WMCLRRFII 2379 1995POL WPKFAVPNL 3939 1995NUC YLVSFGVWI 1189 1890POL YMDDVVLGA 5389 1890POL YPALMPLYA 6409 1995POL YQHFRKLLL 5 9 1575POL YVPSALNPA 7689 1890POL AICSVVRRAF 521101995POL APFTQCGYPA 633101995POL AQFTSAICSV 516101995ENV CIPIPSSWAF 3121020100POL CLAFSYMDDV 533101890NUC CLGWLWGMDI 23 101785ENV CLRRFIIFLF 239101575XCQLDPARDVL 7 101680POL CQRIVGLLGF 622101785NUC DIDPYKEFGA 31 101890NUC DLLDTASALY 29 101785XDVLCLRPVGA 14 101995NUC ELLSFLPSDF 43 101995ENV FIIFLFILLL 243101680ENV FILLLCLIFL 248101680ENV FLFILLLCLI 246101680ENV FLGPLLVLQA 171101575POL FLLAQFTSAI 513101995ENV FPDHQLDPAF 14 101785POL FPHCLAFSYM 530101995ENV FVGLSPTVWL 346101995XFVLGGCRHKL 132101890XGLPVCAFSSA 57 101995POL GLSPFLLAQF 509101995ENV GLSPTVWLSV 348101575NUC GMDIDPYKEF 29 101785XGPCALRFTSA 67 101890POL GPLEEELPRL 19 101995ENV GPLLVLQAGF 173101995POL GVGLSPFLLA 507101680NUC GVWIRTPPAY 123101995POL HLNPNKTKRW 569101575POL HPAAMPHLLV 429101785POL HPIILGFRKI 495101680POL IILGFRKIPM 497101680表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)ENV ILLLCLIFLL 2491020100POL ILRGTSFVYV 760101680NUC ILSTLPETTV 1391020100ENV IPIPSSWAFA 313101680POL IPMGVGLSPF 504101680POL IPWTHKVGNF 50 1020100NUC KLCLGWLWGM 21 101785POL KLHLYSHPII 489101680POL KLPVNRPIDW 610101680POL KQAFTFSPTY 653101995POL KVCQRIVGLL 620101785X KVLHKRTLGL 91 101785ENV LIFLLVLLDY 254101995ENV LLCLIFLLVL 2511020100ENV LLDYQGMLPV 260101890POL LLGCAANWIL 752101680ENV LLLCLIFLLV 2501020100ENV LLPIFFCLWV 3781020100NUC LLSFLPSDFF 44 101995ENV LLVLLDYQGM 257101995ENV LLVLQAGFFL 175101890ENV LLVPFVQWFV 338101995ENV LPIFFCLWVY 3791020100POL LPIHTAELLA 712101785X LPKVLHKRTL 89 101680POL LPLDKGIKPY 1231020100ENV LVLLDYQGML 258101995ENV LVLQAGFFLL 176101890ENV MMWYWGPSLY 360101785POL NLLSSNLSWL 406101890ENV NLSVPNPLGF 15 101575POL NPNKTKRWGY 571101575POL NVSIPWTHKV 47 1020100POL PIDWKVCQRI 616101785ENV PIFFCLWVYI 3801020100POL PIHTAELLAA 713101785POL PLDKGIKPYY 1241020100POL PLEEELPRLA 20 101890ENV PLGFFPDHQL 10 101995POL PLHPAAMPHL 4271020100ENV PLLPIFFCLW 3771020100ENV PLLVLQAGFF 174101995POL PLPIHTAELL 711101680POL PLSYQHFRKL 2 101575POL PLTVNEKRRL 98 101785POL PMGVGLSPFL 505101680NUC PPNAPILSTL 1341020100表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)POL PVNRPIDWKV6121017 85NUC QLLWFHISCL99 1018 90POL RIVGLLGFAA6241018 90POL RLKLIMPARF1061015 75NUC RQAILCWGEL56 1018 90POL RVHFASPLHV8181015 75ENV SLLVPFVQWF3371020 100X SLRGLPVCAF54 1019 95POL SLTNLLSSNL4031018 90NUC SPHHTALRQA49 1020 100ENV SPTVWLSVIW3501015 75ENV SVRFSWLSLL3301016 80ENV TIPQSLDSWW1901018 90POL TPARVTGGVF3541018 90NUC TPPAYRPPNA1281019 95ENV TPPHGGLLGW57 1015 75POL VLGAKSVQHL5431017 85X VLGGCRHKLV1331018 90ENV VPFVQWFVGL3401019 95POL VPNLQSLTNL3981019 95NUC VQASKLCLGW17 1016 80POL VVLSRKYTSF7401017 85POL VVRRAFPHCL5251019 95POL WILRGTSFVY7591016 80POL WLLGCAANWI7511016 80POL WLSLDVSAAF4141019 95NUC WLWGMDIDPY26 1017 85ENV WMCLRRFIIF2371019 95ENV WMMWYWGPSL3591017 85POL YLHTLWKAGI1471020 100ENV YQGMLPVCPL2631018 90POL YQHFRKLLLL5 1015 75POL APFTQCGYPAL 6331119 95POL AQFTSAICSVV 5161119 95POL AVPNLQSLTNL 3971119 95ENV CIPIPSSWAFA 3121116 60POL CLAFSYMDDVV 5331118 90ENV CLIFLLVLLDY 2531119 95ENV CLRRFIIFLFI 2391115 75NUC CPTVQASKLCL 14 1116 80POL CQRIVGLLGFA 6221117 85POL DLNLGNLNVSI 40 1119 95NUC ELLSFLPSDFF 43 1119 95ENV FILLLCLIFLL 2481116 80ENV FLFILLLCLIF 2461116 80ENV FLLVLLDYQGM 2561119 95ENV FPAGGSSSGTV 1301115 75表XIVHBV B62超基元蛋白质 序列位置氨基酸数 序列频率 保守性(%)POL FPWLLGCAANW 749 111575X FVLGGCRHKLV 132 111890POL FVYVPSALNPA 766 111890ENV GLSPTVWLSVI 348 111575POL GPLEEELPRLA 19 111890ENV GPLLVLQAGFF 173 111995POL GPLTVNEKRRL 97 111785X HLSLRGLPVCA 52 111890POL HLYSHPIILGF 491 111680ENV IIFLFILLLCL 244 111680ENV ILLLCLIFLLV 249 1120100NUC ILSTLPETTVV 139 1120100ENV ILTIPQSLDSW 188 111890POL IPMGVGLSPFL 504 111680POL IVGLLGFAAPF 625 111890POL KIPMGVGLSPF 503 111680POL KLHLYSHPIIL 489 111680ENV LLCLIFLLVLL 251 1120100ENV LLGWSPQAQGI 63 111575ENV LLLCLIFLLVL 250 1120100ENV LLPIFFCLWVY 378 1120100POL LLSSNLSWLSL 407 111890ENV LLVLLDYQGML 257 111995ENV LLVLQAGFFLL 175 111890NUC LLWFHISCLTF 100 111785ENV LPIFFCLWVYI 379 1120100POL LPIHTAELLAA 712 111785POL LPLDKGIKPYY 123 1120100POL LPVNRPIDWKV 611 111680ENV LQAGFFLLTRI 178 111680ENV LVPFVQWFVGL 339 111995POL MPHLLVGSSGL 433 111680POL MPLSYQHFRKL 1 111575POL NLGNLNVSIPW 42 111995POL NLSWLSLDVSA 411 111890POL NPADDPSRGRL 774 111890ENV NPLGFFPDHQL 9 111995POL PIDWKVCQRIV 616 111785POL PIILGFRKIPM 496 111680NUC PILSTLPETTV 138 1120100POL PLHPAAMPHLL 427 1120100ENV PLLPIFFCLWV 377 1120100ENV PLLVLQAGFFL 174 111890POL PLPIHTAELLA 711 111680POL PLSYQHFRKLL 2 111575POL PMGVGLSPFLL 505 111680NUC PPAYRPPNAPI 129 111995表XIVHBV B62超基元蛋白质 序列 位置 氨基酸数 序列频率 保守性(%)ENV PQAMQWNSTTF 106 11 1680ENV PQSLDSWWTSL 192 11 1890X QLDPARDVLCL 8 11 1680POL QVFADATPTGW 685 11 1995POL RLKLIMPARFY 106 11 1575POL RPIDWKVCQRI 615 11 1680NUC RPPNAPILSTL 133 11 20100NUC RQAILCWGELM 5611 1890NUC RQLLWFHISCL 9811 1890POL RVAEDLNLGNL 3611 1890POL RVHFASPLHVA 818 11 1575POL SIPWTHKVGNF 4911 20100ENV SLDSWWTSLNF 194 11 1995ENV SLLVPFVQWFV 337 11 1995NUC SPEHCSPHHTA 4411 20100POL SPFLLAQFTSA 511 11 1995NUC SPHHTALRQAI 4911 20100ENV SPTVWLSVIWM 350 11 1575ENV SVRFSWLSLLV 330 11 1680POL SVVLSRKYTSF 739 11 1785POL SVVRRAFPHCL 524 11 1995POL TPARVTGGVFL 354 11 1890POL TQCGYPALMPL 636 11 1995NUC TVQASKLCLGW 1611 1680ENV VLLDYQGMLPV 259 11 1890POL VLSRKYTSFPW 741 11 1785POL VPNLQSLTNLL 398 11 1995NUC VQASKLCLGWL 1711 1680ENV VQWFVGLSPTV 343 11 1995POL VVLGAKSVQHL 542 11 1680POL VVRRAFPHCLA 525 11 1995POL WILRGTSFVYV 759 11 1680POL WLLGCAANWIL 751 11 1680POL WLSLDVSAAFY 414 11 1995ENV WLSLLVPFVQW 335 11 20100ENV WMCLRRFIIFL 237 11 1995ENV WMMWYWGPSLY 359 11 1785POL YLHTLWKAGIL 147 11 20100POL YLPLDKGIKPY 122 11 20100POL YPALMPLYACI 640 11 1995表XVHBV A01基元及结合信息保守性 频率 蛋白质 位置 序列AA A*0101100 20POL 166 ASFCGSPY890 18POL 737 DNSVVLSRKY 10 0.000195 19POL 631 FAAPFTQCGY 10 0.068095 19POL 630 GFAAPFTQCGY 1175 15NUC 140 GRETVLEY885 17POL 579 GYSLNFMGY 9100 20POL 149 HTLWKAGILY 10 0.110095 19POL 653 KQAFTFSPTY 10 0.000185 17NUC 30LLDTASALY 912.000095 19POL 415 LSLDVSAAFY 10 0.015075 15NUC 137 LTFGRETVLEY 1185 17ENV 360 MMWYWGPSLY 10 0.081075 15X 103 MSTTDLEAY 90.850090 18POL 738 NSVVLSRKY 90.0005100 20POL 124 PLDKGIKPY 9100 20POL 124 PLDKGIKPYY 10 0.170085 17POL 797 PTTGRTSLY 90.2100100 20POL 165 SASFCGSPY 995 19POL 416 SLDVSAAFY 95.200075 15X 104 STTDLEAY885 17POL 798 TTGRTSLY895 19POL 414 WLSLDVSAAFY 1185 17ENV 359 WMMWYWGPSLY 11 0.320095 19POL 640 YPALMPLY885 17POL 580 YSLNFMGY8
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置序列 AA A*030185 17POL 721 AACFARSR 8 0.000485 17POL 721 AACFARSRSGA 1195 19POL 632 AAPFTQCGY 995 19POL 632 AAPFTQCGYPA 1185 17POL 722 ACFARSRSGA1080 16POL 688 ADATPTGWGLA 1190 18POL 776 ADDPSRGR 895 19POL 529 AFPHCLAF 895 19POL 529 AFPHCLAFSY1095 19X62 AFSSAGPCA 990 18X62 AFSSAGPCALR 1195 19POL 655 AFTFSPTY 895 19POL 655 AFTFSPTYK 9 0.260095 19POL 655 AFTFSPTYKA1095 19POL 655 AFTFSPTYKAF 1180 16ENV 180 AGFFLLTR 890 18X66 AGPCALRF 890 18X66 AGPCALRFTSA 1195 19POL 18 AGPLEEELPR100.000495 19POL 521 AICSVVRR 8-0.000295 19POL 521 AICSVVRRA 995 19POL 521 AICSVVRRAF1095 19NUC 41 ALESPEHCSPH 1190 18POL 772 ALNPADDPSR100.000385 17X70 ALRFTSAR 8 0.004780 16ENV 108 AMQWNSTTF 980 16ENV 108 AMQWNSTTFH1075 15X102 AMSITDLEA 985 17NUC 34 ASALYREA 8100 20POL 166 ASFCGSPY 8 0.046080 16POL 822 ASPLHVAWR 975 15ENV 84 ASTNRQSGR 9 0.000980 16POL 690 ATPTGWGLA 980 16POL 755 CAANWILR 895 19X61 CAFSSAGPCA1090 18X69 CALRFTSA 885 17X69 CALRFTSAR 9 0.003480 16X6 CCQLDPAR 885 17POL 723 CFARSRSGA 9
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AA A*030175 15POL 607 CFRKLPVNR 995 19POL 638 CGYPALMPLY 1095 19POL 638 CGYPALMPLYA1110020ENV 312 CIPIPSSWA 910020ENV 312 CIPIPSSWAF 1080 16EVN 312 CIPIPSSWAFA1195 19ENV 253 CLIFLLVLLDY11 0.008390 18X 17CLRPVGAESR 10 0.001195 19ENV 239 CLRRFIIF 875 15ENV 239 CLRRFIIFLF 1010020NUC 48CSPHHTALR 90.002910020NUC 48CSPHHTALRQA1195 19POL 523 CSVVRRAF 895 19POL 523 CSVVRRAFPH 1010020ENV 310 CTCIPIPSSWA1180 16POL 689 DATPTGWGLA 1090 18POL 540 DDVVLGAK 890 18NUC 31DIDPYKEF 890 18NUC 31DIDPYKEFGA 1085 17NUC 29DLLDTASA 885 17NUC 29DLLDTASALY 10 0.000185 17NUC 29DLLDTASALYR11 0.004295 19ENV 196 DSWWTSLNF 90.000685 17NUC 32DTASALYR 80.000480 16NUC 32DTASALYREA 1095 19X 14DVLCLRPVGA 1095 19POL 418 DVSAAFYH 890 18POL 541 DVVLGAKSVQH1195 19POL 17EAGPLEEELPR11 -0.000990 18NUC 40EALESPEH 890 18POL 718 ELLAACFA 890 18POL 718 ELLAACFAR 90.000285 17POL 718 ELLAACFARSR11 0.008295 19NUC 43ELLSFLPSDF 1095 19NUC 43ELLSFLPSDFF1195 19NUC 43ESPEHCSPH 995 19NUC 43ESPEHCSPHH 1095 19POL 374 ESRLVVDF 895 19POL 374 ESRLVVDFSQF11
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AAA*030195 19 NUC 174 ETTVVRRR 8 0.000380 16 NUC 174 ETTVVRRRGR10 0.000395 19 POL 631 FAAPFTQCGY1085 17 POL 724 FARSRSGA 880 16 POL 821 FASPLHVA 880 16 POL 821 FASPLHVAWR1090 18 ENV 13FFPDHQLDPA1085 17 ENV 13FFPDHQLDPAF 1175 15 NUC 139 FGRETVLEY 975 15 POL 244 FGVEPSGSGH1095 19 NUC 122 FGVWIRTPPA1095 19 NUC 122 FGVWIRTPPAY 1180 16 ENV 248 FILLLCLIF 980 16 ENV 246 FLFILLLCLIF 1175 15 ENV 171 FLGPLLVLQA1095 19 POL 513 FLLAQFTSA 9 0.000695 19 POL 562 FLLSLGIH 895 19 ENV 256 FLLVLLDY 8 0.0050100 20 POL 363 FLVDKNPH 895 19 POL 658 FSPTYKAF 895 19 X 63FSSAGPCA 890 18 X 63FSSAGPCALR1090 18 X 63FSSAGPCALRF 11100 20 ENV 333 FSWLSLLVPF10 0.000490 18 POL 536 FSYMDDVVLGA 1195 19 POL 656 FTFSPTYK 8 0.010095 19 POL 656 FTFSPTYKA 995 19 POL 656 FTFSPTYKAF10 0.000495 19 POL 635 FTOCGYPA 895 19 POL 518 FTSAICSVVR10 0.000395 19 POL 518 FTSAICSVVRR 11 0.006595 19 X 132 FVLGGCRH 890 18 X 132 FVLGGCRHK 9 0.043090 18 POL 766 FVYVPSALNPA 1180 16 POL 754 GCAANWILR 995 19 POL 630 GFAAPFTOCGY 1190 18 ENV 12GFFPDHOLDPA 1175 15 ENV 170 GFLGPLLVLOA 1185 17 ENV 61GGLLGWSPQA10
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AA A*0301100 20 POL 360GGVFLVDK 8100 20 POL 360GGVFLVDKNPH1175 15 POL 567GIHLNPNK 875 15 POL 567GIHLNPNKTK 10 0.002575 15 POL 567GIHLNPNKTKR1185 17 POL 682GLCQVFADA 90.000195 19 POL 627GLLGFAAPF 90.000685 17 ENV 62 GLLGWSPOA 995 19 X57 GLPVCAFSSA 1095 19 POL 509GLSPFLLA 895 19 POL 509GLSPFLLAQF 1085 17 NUC 29 GMDIDPYK 80.000685 17 NUC 29 GMDIDPYKEF 10 -0.000390 18 POL 735GTDNSVVLSR 10 0.001090 18 POL 735GTDNSVVLSRK11 0.014080 16 POL 763GTSFVYVPSA 1080 16 POL 245GVEPSGSGH 9100 20 POL 361GVFLVDKNPH 1080 16 POL 507GVGLSPFLLA 1095 19 NUC 123GVWIRTPPA 995 19 NUC 123GVWIRTPPAY 10 0.004795 19 NUC 123GVWIRTPPAYR11 0.1900100 20 NUC 47 HCSPHHTA 8100 20 NUC 47 HCSPHHTALR 1080 16 POL 820HFASPLHVA 980 16 POL 820HFASPLHVAWR1195 19 X49 HGAHLSLR 885 17 ENV 60 HGGLLGWSPQA1190 18 NUC 104HISCLTFGR 975 15 POL 569HLNPNKTK 875 15 POL 569HLNPNKTKR 990 18 X52 HLSLRGLPVCA1180 16 POL 491HLYSHPIILGF1185 17 POL 715HTAELLAA 885 17 POL 715HTAELLAACF 1085 17 POL 715HTAELLAACFA11100 20 POL 149HTLWKAGILY 10 0.0440100 20 POL 149HTLWKAGILYK11 0.540095 19 POL 522ICSVVRRA 8
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AAA*030195 19 POL 522 ICSVVRRAF 995 19 POL 522 ICSVVRRAFPH1190 18 NUC 32 IDPYKEFGA 990 18 POL 617 IDWKVCQR 8100 20 ENV 381 IFFCLWVY 895 19 ENV 255 IFLLVLLDY 980 16 POL 734 IGTDNSVVLSR11100 20 ENV 249 ILLLCLIF 880 16 POL 760 ILRGTSFVY 9 0.044090 18 NUC 105 ISCLTFGR 8 0.000490 18 POL 625 IVGLLGFA 890 18 POL 625 IVGLLGFAA 990 18 POL 625 IVGLLGFAAPF11100 20 POL 153 KAGILYKR 8 0.000280 16 POL 503 KIPMGVGLSPF1175 15 POL 108 KLIMPARF 875 15 POL 108 KLIMPARFY 980 16 POL 610 KLPVNRPIDWK1185 17 POL 574 KTKRWGYSLNF1175 15 X130 KVFVLGGCR 9 0.042075 15 X130 KVFVLGGCRH 1095 19 POL 55 KVGNFTGLY 9 0.210085 17 POL 720 LAACFARSR 9 0.005895 19 X16 LCLRPVGA 890 18 X16 LCLRPVGAESR1195 19 POL 683 LCQVFADA 8100 20 POL 125 LDKGIKPY 8100 20 POL 125 LDKGIKPYY 980 16 X9LDPARDVLCLR1195 19 ENV 195 LDSWWTSLNF 1085 17 NUC 31 LDTASALY 885 17 NUC 31 LDTASALYR 9 0.000480 16 NUC 31 LDTASALYREA1195 19 POL 417 LDVSAAFY 895 19 POL 417 LDVSAAFYH 980 16 ENV 247 LFILLLCLIF 1095 19 POL 544 LGAKSVQH 880 16 POL 753 LGCAANWILR 1075 15 POL 566 LGIHLNPNK 9
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列AA A*030175 15POL566 LGIHLNPNKTK 1195 19ENV172 LGPLLVLQA 995 19ENV172 LGPLLVLQAGF 1195 19EMI254 LIFLLVLLDY 100.0022100 20POL109 LIMPARFY8-0.000290 18POL719 LLAACFAR8 0.002485 17POL719 LLAACFARSR 1095 19POL514 LLAQFTSA885 17NUC30 LLDTASALY 9 0.001385 17NUC30 LLDTASALYR 100.005080 16POL752 LLGCAANWILR 1195 19POL628 LLGFAAPF885 17EMI63 LLGWSPQA8100 20ETV378 LLPIFFCLWVY 110.023095 19NUC44 LLSFLPSDF 995 19NUC44 LLSFLPSDFF 1095 19ENV175 LLVLQAGF895 19ENV175 LLVLQAGFF 9 0.0006100 20ENV336 LLVPFVQWF 985 17NUC100 LLWFHISCLTF 1195 19NUC45 LSFLPSDF895 19NUC45 LSFLPSDFF 9 0.000695 19POL415 LSLDVSAA895 19POL415 LSLDVSAAF 9 0.000495 19POL415 LSLDVSAAFY 1095 19POL415 LSLDVSAAFYII1175 15POL564 LSLGIHLNPNK 11100 20ENV336 LSLLVPFVQWF 1195 19X 53 LSLRGLPVCA 1095 19X 53 LSLRGLPVCAF 1195 19POL510 LSPFLLAQF 9958517POL742 LSRKYTSF895 19NUC169 LSTLPETTVVR 11 -0.000975 15ENV16 LSVPNPLGF 9100 20POL412 LSWLSLDVSA 100.0048100 19POL412 LSWLSLDVSAA 1195 15POL3LSYQIIFRK 875 15NLC137 LTFGRETVLEY 1185 17POL99 LTVNEKRR8-0.0002
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列AAA*030195 19ENV 176 LVLQAGFF8100 20ENV 339 LVPFVQWF8 0.002890 18NUC 119 LVSFGVWIR 9100 20POL 377 LWDFSQF 8 0.0016100 20POL 377 LWDFSQFSR 1095 19ENV 238 MCLRRFIIF 975 15ENV 238 MCLRRFIIFLF 1190 18POL 539 MDDWLGA 890 18POL 539 MDDWLGAK990 18NUC 30MDIDPYKEF 990 18NUC 30MDIDPYKEFGA 1180 16POL 506 MGVGLSPF880 16POL 506 MGVGLSPFLLA 1185 17ENV 360 MMWYWGPSLY 10 0.050080 16X 103 MSTTDLEA875 15X 103 MSTTDLEAY 9 0.000875 15X 103 MSTTDLEAYF 1075 15X 103 MSTTDLEAYFK 1195 19POL 561 NFLLSLGIH 990 18NUC 75NLEDPASR8 -0.000295 19POL 45NLNVSIPWTH 1095 19POL 45NLNVSIPWTHK 11-0.000995 15ENV 15NLSVPNPLGF 1090 18POL 411 NLSWLSLDVSA 1175 15ENV 215 NSQSPTSNH 990 18POL 738 NSVVLSRK8 0.000690 18POL 738 NSVVLSRKY 9 0.0020100 20POL 47NVSIPWVTH 8100 20POL 47NVSIPWTHK 9 0.082090 18POL 775 PADDPSRGR 9 0.000895 19POL 641 PALMPLYA875 15X 145 PAPCNFFTSA 1080 16X 11PARDVLCLR 9 0.000290 18POL 355 PARVTGGVF 975 15ENV 83PASTNRQSGR 1095 19NUC 130 PAYRPPNA890 18X 68PCALRFTSA 985 17X 68PCALRFTSAR 1075 15X 147 PCNFFTSA8
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AA A*030195 19ENV 15PDHQLDPA 890 18ENV 15PDHQLDPAF 995 19POL 512 PFLLAQFTSA1095 19POL 634 PFTQCGYPA 9100 20ENV 233 PGYRWMCLR 9 0.000895 19ENV 233 PGYRWMCLRR10 0.004895 19ENV 233 PGYRWMCLRRF 1190 18POL 616 PIDWKVCQR 9 0.0002100 20ENV 380 PIFFCLWVY 9 0.001185 17POL 713 PIHTAELLA 985 17POL 713 PIHTAELLAA1080 16POL 496 PIILGFRK 8100 20ENV 314 PIPSSWAF 880 16ENV 314 PIPSSWAFA 9100 20POL 124 PLDKGIKPY 9 0.0001100 20POL 124 PLDKGIKPYY10 0.000295 19POL 20PLEEELPR 8 0.000290 16POL 20PLEEELPRLA1090 19ENV 10PLGFFPDH 8100 20POL 427 PLHPAAMPH 9 0.001295 19ENV 174 PLLVLQAGF 995 19ENV 174 PLLVLQAGFF1080 16POL 711 PLPIHTAELLA 11100 20POL 2 PLSYQHFR 8 -0.000275 15POL 2 PLSYQHFRK 9 0.001185 17POL 98PLTVNEKR 8 0.000285 17POL 98PLTVNEKRR 9 0.000880 16POL 505 PMGVGLSPF 985 17POL 797 PTTGRTSLY 9 0.000185 17POL 797 PTTGRTSLYA1095 19X 59PVCAFSSA 890 18X 20PVGAESRGR 9 0.000285 17POL 612 PVNRPIDWK 9 0.031095 19POL 654 QAFTFSPTY 9 0.003095 19POL 654 QAFTFSPTYK10 0.045095 19POL 654 QAFTFSPTYKA 1180 16ENV 179 QAGFFLLTR 980 16ENV 107 QAMQWNSTTF1080 16ENV 107 QAMQWNSTTFH 11
表XVIHBV A03基元及结合保守性 频率 蛋白质位置 序列AA A*030195 19POL 637QCGYPALMPLY 1195 19POL 517QFTSAICSVVR 1175 15NUC 169QSPRRRRSQSR 1180 16POL 189QSSGILSR895 19POL 528RAFPHCLA895 19POL 528RAFPHCLAF 9 0.001595 19POL 528RAFPHCIAFSY 11 0.120085 17NUC 28 RDLLDTASA 985 17NUC 28 RDLLDTASALY 1195 19X 13 RDVLCLRPVGA 11100 20ENV 332RFSWLSLLVPF 1195 19X 56 RGLPVCAF895 19X 56 RGLPVCAFSSA 11100 20NUC 152RGRSPRRR880 16POL 762RGTSFVYVPSA 1190 18POL 624RNGLLGF 890 18POL 624RIVGLLGFA 990 18POL 624RIVGLLGFAA 1075 15POL 106RLKLIMPA875 15POL 106RLKLIMPAR 9 0.095075 15POL 106RLKLIMPARF 1075 15POL 106RLKLIMPARFY 1175 15X 128RLKVFVLGGCR 1195 19POL 376RLVVDFSQF 9 0.000695 19POL 376RLVVDFSQFSR 11 0.280095 19NUC 163RSPRRRTPSPR 11-0.000775 15NUC 167RSQSPRRR875 15NUC 167RSQSPRRRR 990 18POL 353RTPARVTGGVF 1195 19NUC 127RTPPAYRPPNA 1195 19NUC 188RTPSPRRR8 -0.000295 19NUC 188RTPSPRRRR 9 0.005495 16POL 818RVHFASPLH 975 15POL 818RVHFASPLHVA 11100 20POL 357RVTGGVFIVDK 11 0.019090 18X 65 SAGPCALR8 -0.000290 18X 65 SAGPCALRF 9 -0.000395 19POL 520SAICSVVR8 -0.000295 19POL 520SAICSVVRR 9 0.0058
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AA A*030195 19POL 520 SAICSWRRA 1095 19POL 520 SAICSWRRAF 1195 18POL 771 SALNPADDPSR11 -0.000490 20POI 165 SASFCGSPY 9100 18NUC 121 SFGVWIRTPPA1190 19NUC 46SFLPSDFF 895 15POL 748 SFPWLIGCA 975 15POL 740 SFPWLLGCAA 1075 16POL 765 SFVWPSA880 20POL 49SIPWTHKVGNF11100 19ENV 194 SLDSWWTSINF1195 19POL 416 SLDVSAAF 895 19POL 416 SIQVSAAFY 90.001695 19POL 416 SLDVSAAFYH 1075 15POL 565 SIGIHLNPNK 10100 20ENV 337 SLLVPFVQWF 1095 19X 54SLRGLPVCA 995 19X 54SLRGLPVCAF 10 0.000495 18X 64SSAGPCALR 90.008090 18X 64SSAGPCALRF 10 -0.000390 19NUC 170 STIPETTVVR 10 0.000795 19NUC 170 STLPETTWRR 11 0.015095 16ENV 85STNRQSGR 880 15X 104 STTDLEAY 875 15X 104 STTDLEAYF 975 15X 104 STTDLEAYFK 10 0.006675 15ENV 17SVPNPLGF 890 18POL 739 SVVLSRKY 8 -0.000285 17POL 739 SVVLSRKYTSF1195 19POL 524 SVVRRAFPH 90.110085 17POL 716 TAELLAACF 985 17POL 716 TAELLAACFA 1085 17POL 716 TAELLAACFAR11 0.000680 16NUC 33TASALYREA 9100 20ENV 311 TCIPIPSSWA 10100 20ENV 311 TCIPIPSSWAF1180 16X 106 TDLEAYFK 890 18POL 736 TDNSVVLSR 990 18POL 736 TDNSVVLSRK 10 0.0006
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置序列 AA A*030190 18POL 736 TDNSVVLSRKY1175 15NUC 138 TFGRETVLEY 1095 19POL 657 TFSPTYKA 895 19POL 857 TFSPTYKAF 910020POL 359 TGGVFLVQK 9 0.000785 17POL 799 TGRTSLYA 695 19NUC 171 TLPETTVVR 9 0.000895 19NUC 171 TLPETTVVRR 10 0.000795 19NUC 171 TLPETTVVRRR11 0.000510020POL 150 TLWKAGILY 9 0.130010020POL 150 TLWKAGILYK 10 5.300010020POL 150 TLWKAGILYKR11 0.008295 19POL 519 TSAICSVVR 9 0.000595 19POL 519 TSAICSVVRR 10 0.001895 19POL 519 TSAICSVVRRA1175 15POL 747 TSFPWLLGCA 1075 15POL 747 TSFPWLLGCAA1180 16POL 764 TSFVYVPSA 975 15X105 TTDLEAYF 875 15X105 TTDLEAYFK 9 0.000685 17POL 798 TTGRTSLY 8 0.000485 17POL 798 TTGRTSLYA 975 15ENV 278 TTSTGPCK 880 16NUC 175 TTVVRRRGR 9 0.000880 16NUC 176 TVVRRRGR 8 0.000380 16NUC 176 TVVRRRGRSPR1195 19X60 VCAFSSAGPCA1185 17POL 621 VCQRNGLLGF 1110020POL 379 VDFSQFSR 810020POL 362 VFLVDKNPH 980 16X131 VFVLGGCR 880 16X131 VFVLGGCRH 975 15X131 VFVLGGCRHK 1095 19X21 VGAESRGR 895 19POL 626 VGLLGFAA 895 19POL 626 VGLLGFAAPF 1080 16POL 508 VGLSPFLLA 980 16POL 508 VGLSPFLLAQF1195 19POL 56 VGNFTGLY 8
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列 AA A*030185 17 POL 96VGPLTVNEK 9 0.000785 17 POL 96VGPLTVNEKR1085 17 POL 96VGPLTVNEKRR 1195 19 X 15VLCLRPVGA 995 19 POL 543 VLGAKSVQH 990 18 X 133 VLGGCRHK 8 0.015080 16 ENV 177 VLQAGFFLLTR 1185 17 POL 741 VLSRKYTSF 990 18 NUC 120 VSFGVWIR 8 0.0040100 20 POL 48VSIPWTHK 8 0.0130100 20 POL 358 VTGGVFLVDK10 0.0390100 20 POL 378 VVDFSQFSR 9 0.001590 18 POL 542 VVLGAKSVQH1085 17 POL 740 VVLSRKYTSF10 0.000495 19 POL 525 VVRRAFPH 895 19 POL 525 VVRRAFPHCLA 1180 16 NUC 177 VVRRRGRSPR10 0.002780 16 NUC 177 VVRRRGRSPRR 1190 18 NUC 102 WFHISCLTF 990 16 NUC 102 WFHISCLTFGR 1185 17 NUC 28WGMDIDPY 885 17 NUC 28WGMDIDPYK 9 -0.000385 17 NUC 28WGMDIDPYKEF 1185 17 POL 578 WGYSLNFMGY1080 16 POL 759 WILRGTSF 880 16 POL 759 WILRGTSFVY10 0.007695 19 NUC 125 WIRTPPAY 8 -0.000295 19 NX 125 WIRTPPAYR 9 0.000890 18 POL 314 WLQFRNSK 8 -0.0002100 20 POL 414 WLSLDVSA 895 19 POL 414 WLSLDVSAA 995 19 POL 414 WLSLDVSAAF1095 19 POL 414 WLSLDVSAAFY 11 0.0034100 20 ENV 335 WLSLLVPF 885 17 RUC 26WLWGMDIDPY10 0.000285 17 NUC 26WLWGMDIDPYK 11 0.003095 19 ENV 237 WMCLRRFIIF10 0.000485 17 ENV 359 WMMWYWGPSLY 11 0.0009100 20 POL 52WTHKVGNF 8
表XVIHBV A03基元及结合保守性 频率 蛋白质 位置 序列AAA*0301100 20 POL147 YLHTLWKA8100 20 POL122 YLPLDKGIK 9 0.0001100 20 POL122 YLPLDKGIKPY 11 -0.000490 18 NUC118 YLVSFGVWIR 100.000590 18 POL538 YMDDVVLGA 9 0.000190 18 POL538 YMDDWLGAK 100.033080 16 POL493 YSHPIILGF 980 16 FOL493 YSHPIILGFR 1080 16 POL493 YSHIPIILGFRK1185 17 POL580 YSLNFMGY8-0.000275 15 POL746 YTSFPWLLGCA 1190 18 POL768 YVPSALNPA 9
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置 序列 AAA*110185 17POL 721 AACFARSR 895 19POL 632 AAPFTQCGY 990 18776 ADDPSRGR 895 19POL 529 AFPHCLAFSY 1090 19X 62AFSSAGPCALR1195 19POL 655 AFTFSPTY 895 19POL 655 AFTFSPTYK 980 16ENV 180 AGFFLLTR 895 19POL 18AGPLEEELPR 1095 19POL 521 AICSVVRR 895 19NUC 41ALESPEHCSPH1190 18POL 772 ALNPADDPSR 1085 17X 70ALRFTSAR 880 16ENV 108 AMQWNSTTFH 1080 8 POL 166 ASFCGSPY 880 16POL 822 ASPLHVAWR 975 15ENV 84ASTNRQSGR 980 16POL 755 CAANWILR 885 17X 69CALRFTSAR 980 16X 6 CCQLDPAR 875 15POL 607 CFRKLPVNR 995 19POL 638 CGYPALMPLY 1095 19ENV 253 CLIFLLVLLDY1190 18X 17CLRPVGAESR 10100 20NUC 48CSPHHTALR 995 19POL 523 CSVVRRAFPH 1090 18POL 540 DDVVLGAK 885 17NUC 29DLLDTASALY 1085 17NUC 29DLLDTASALYR1190 18POL 737 DNSVVLSR 890 18POL 737 DNSVVLSRK 990 18POL 737 DNSVVLSRKY 1085 17NUC 32DTASALYR 895 19POL 418 DVSAAFYH 890 18POL 541 DVVLGAKSVQH1195 19POL 17EAGPLEEELPR1190 18NUC 40EALESPEH 890 18POL 718 ELLAACFAR 985 17POL 718 ELLAACFARSR11
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置 序列 AAA*110195 19NUC 43ESPEHCSPH995 19NUC 43ESPEHCSPHH 1095 19NUC 174 ETTVVRRR 880 16NUC 174 ETTVVRRRGR 1095 19POL 631 FAAPFTQCGY 1080 16POL 821 FASPLHVAWR 1075 15NUC 139 FGRETVLEY975 15POL 244 FGVEPSGSGH 1095 19NUC 122 FGVWIRTPPAY 1195 19POL 562 FLLSLGIH 895 19ENV 256 FLLVLLDY 8100 20POL 363 FLVDKVPH 890 18X 63FSSAGPCALR 1095 19POL 656 FTFSPTYK 895 19POL 518 FTSAICSVVR 1095 19POL 518 FTSAICSVVRR 1195 19X 132 FVLGGCRH 890 18X 132 FVLGGCRHK980 16POL 754 GCAANWILR995 19POL 630 GFAAPFTQCGY 11100 20POL 360 GGVFLVDK 8100 20POL 360 GGVFLVDKNPH 1175 15POL 567 GIHLNPNK 875 15POL 567 GIHLNPNKTK 1075 15POL 567 GIHLNPNKTKR 1185 17NUC 29GMDIDPYK 895 19POL 44GNLNVSIPWTH 1190 18POL 735 GTDNSVVLSR 1090 18POL 735 GTDNSVVLSRK 1180 16POL 245 GVEPSGSGH9100 20POL 361 GVFLVDKNPH 1095 19NUC 123 GVWIRTPPAY 1095 19NUC 123 GVWIRTPPAYR 11100 20NUC 47HCSPHHTALR 1080 16POL 820 HFASPLHVAWR 1195 19X 49HGAHLSLR 890 18NUC 104 HISCLTFGR975 15POL 569 HLNPNKTK 875 15POL 569 HLNPNKTKR9
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置 序列 AA A*1101100 20POL 149 HTLWKAGILY 10100 20POL 149 HTLWKAGILYK1195 19POL 522 ICSVVRRAFPH1190 18POL 617 IDWKVCQR 8100 20ENV 381 IFFCLWVY 895 19ENV 255 IFLLVLLDY 980 16POL 734 IGTDNSVVLSR1180 16POL 760 ILRGTSFVY 990 18NUC 105 ISCLTFGR 8100 20POL 153 KAGILYKR 875 15POL 108 KLIMPARFY 980 16POL 610 KLPVNRPIDWK1175 15X 130 KVFVLGGCR 975 15X 130 KVFVLGGCRH 1095 19POL 55KVGNFTGLY 985 17POL 720 LAACFARSR 990 18X 16LCLRPVGAESR11100 20POL 125 LDKGIKPY 8100 20POL 125 LDKGIKPYY 980 16X 9 LDPARDVLCLR1185 17NUC 31LDTASALY 885 17NUC 31LDTASALYR 995 19POL 417 LDVSAAFY 895 19POL 417 LDVSAAFYH 995 19POL 544 LGAKSVQH 880 16POL 753 LGCAANWILR 1075 15POL 566 LGIHLNPNK 975 15POL 566 LGIHLNPNKTK1195 19ENV 254 LIFLLVLLDY 10100 20POL 109 LIMPARFY 890 18POL 719 LLAACFAR 885 17POL 719 LLAACFARSR 1085 17NUC 30LLDTASALY 985 17NUC 30LLDTASALYR 1080 16POL 752 LLGCAANWILR11100 20ENV 378 LLPIFFCLWVY1190 18POL 773 LNPADDPSR 990 18POL 773 LNPADDPSRGR1175 15POL 570 LNPNKTKR 8
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置 序列 AA A*110175 15POL 570 LNPNKTKRWGY 1195 19POL 46LNVSIPWTH 1195 19POL 46LNVSIPWTHK1095 19POL 415 LSLDVSAAFY1095 19POL 415 LSLDVSAAFYH 1175 15POL 564 LSLGIHLNPNK 1195 19NUC 169 LSTLPETTVVR 1175 15POL 3 LSYQHFRK 875 15NUC 137 LTFGRETVLEY 1185 17POL 99LTVNEKRR 890 18NUC 119 LVSFGVWIR 9100 20POL 377 LVVDFSQFSR1090 18POL 539 MDDVVLGAK 985 17ENV 360 MMWYWGPSLY1075 15X 103 MSTTDLEAY 975 15X 103 MSTTDLEAYFK 1195 19POL 561 NFLLSLGIH 990 18NUC 75NLEDPASR 895 19POL 45NLNVSIPWTH1095 19POL 45NLNVSIPWTHK 1175 15ENV 215 NSQSPTSNH 990 18POL 738 NSVVLSRK 890 18POL 738 NSVVLSRKY 9100 20POL 47NVSIPWTH 8100 20POL 47NVSIPWTHK 990 18POL 775 PADDPSRGR 980 16X 11PARDVLCLR 975 15ENV 83PASTNRQSGR1085 17X 68PCALRFTSAR10100 20ENV 233 PGYRWMCLR 995 19ENV 233 PGYRWMCLRR1090 18POL 616 PIDWKVCQR 9100 20ENV 380 PIFFCLWVY 980 16POL 496 PIILGFRK 8100 20POL 124 PLDKGIKPY 9100 20POL 124 PLDKGIKPYY1095 19POL 20PLEEELPR 895 19POL 10PLGFFPDH 8100 20POL 427 PLHPAAMPH 9
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置 序列 AA A*1101100 20 POL 2 PLSYQHFR 875 15 POL 2 PLSYQHFRK985 17 POL 98 PLTVNEKR 885 17 POL 98 PLTVNEKRR975 15 POL 572PNKTKRWGY985 17 POL 797PTTGRTSLY990 18 X 20 PVGAESRGR985 17 POL 612PVNRPIDWK995 19 POL 654QAFTFSPTY995 19 POL 654QAFTFSPTYK 1080 16 ENV 179QAGFFLLTR980 16 ENV 107QAMQWNSTTFH 1095 19 POL 637QCGYPALMPLY 1195 19 POL 517QFTSAICSVVR 1175 15 NUC 169QSPRRRRSQSR 1180 16 POL 189QSSGILSR 895 19 POL 528RAFPHCLAFSY 1185 17 NUC 28 RDLLDTASALY 11100 20 NUC 152RGRSPRRR 875 15 POL 106RLKLIMPAR975 15 POL 106RLKLIMPARFY 1175 15 X 128RLKVFVLGGCR 1195 19 POL 376RLVVDFSQFSR 1195 19 NUC 183RSPRRRTPSPR 1175 15 NUC 167RSQSPRRR 875 15 NUC 167RSQSPRRRR995 19 NUC 188RTPSPRRR 895 19 NUC 188RTPSPRRRR980 16 POL 818RVHFASPLH9100 20 POL 357RVTGGVFLVDK 1190 18 X 65 SAGPCALR 895 19 POL 520SAICSVVR 895 19 POL 520SAICSVVRR990 18 POL 771SALNPADDPSR 11100 20 POL 165SASFCGSPY995 19 POL 416SLDVSAAFY995 19 POL 416SLDVSAAFYH 1075 15 POL 565SLGIHLNPNK 1090 18 X 64 SSAGPCALR9
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置序列AA A*110195 19NUC 170 STLPETTVVR 1095 19NUC 170 STLPETTVVRR 1180 16ENV 85 STNRQSGR875 15X 104 STTDLEAY875 15X 104 STTDLEAYFK 1090 18POL 739 SVVLSRKY895 19POL 524 SVVRRAFPH 985 17POL 716 TAELLAACFAR 1180 16X 106 TDLEAYFK890 18POL 736 TDNSVVLSR 990 18POL 736 TDNSVVLSRK 1090 18POL 736 TDNSVVLSRKY 1175 15NUC 138 TFGRETVLEY 10100 20POL 359 TGGVFLVDK 995 19NUC 171 TLPETTVVR 995 19NUC 171 TLPETTVVRR 1095 19NUC 171 TLPETTVVRRR 11100 20POL 150 TLWKAGILY 9100 20POL 150 TLWKAGILYK 10100 20POL 150 TLWKAGILYKR 1195 19POL 560 TNFLLSLGIH 1095 19POL 519 TSAICSVVR 995 19POL 519 TSAICSVVRR 1075 15X 105 TTDLEAYFK 985 17POL 798 TTGRTSLY875 15ENV 278 TTSTGPCK880 16NUC 175 TTVVRRRGR 980 16NUC 176 TVVRRRGR880 16NUC 176 TVVRRRGRSPR 11100 20POL 379 VDFSQFSR8100 20POL 362 VFLVDKNPH 980 16X 131 VFVLGGCR880 16X 131 VFVLGGCRH 975 15X 131 VFVLGGCRHK 1095 19X 21 VGAESRGR895 19POL 56 VGNFTGLY885 17POL 96 VGPLTVNEK 985 17POL 96 VGPLTVNEKR 1085 17POL 96 VGPLTVNEKRR 11
表XVIIA11基元及结合信息保守性 频率 蛋白质 位置序列 AA A*110195 19POL 543 VLGAKSVQH990 18X 133 VLGGCRHK 880 16ENV 177 VLQAGFFLLTR 1185 17POL 613 VNRPIDWK 890 18NUC 120 VSFGVWIR 8100 20POL 48 VSIPWTHK 8100 20POL 358 VTGGVFLVDK 10100 20POL 378 VVDFSQFSR990 18POL 542 VVLGAKSVQH 1095 19POL 525 VVRRAFPH 880 16NUC 177 VVRRRGRSPR 1080 16NUC 177 VVRRRGRSPRR 1190 18NUC 102 WFHISCLTFGR 1185 17NUC 28 WGMDIDPY 885 17NUC 28 WGMDIDPYK985 17POL 578 WGYSLNFMGY 1080 16POL 759 WILRGTSFVY 1095 19NUC 125 WIRTPPAY 895 19NUC 125 WIRTPPAYR990 18POL 314 WLQFRNSK 895 19POL 414 WLSLDVSAAFY 1185 17NUC 26 WLWGMDIDPY 1085 17NUC 26 WLWGMDIDPYK 1185 17ENV 359 WMMWYWGPSLY 11100 20POL 122 YLPLDKGIK9100 20POL 122 YLPLDKGIKPY 1190 18NUC 118 YLVSFGVWIR 1090 18POL 538 YMDDVVLGAK 1080 16POL 493 YSHPIILGFR 1080 16POL 493 YSHPIILGFRK 1185 17POL 580 YSLNFMGY 8表XVIIIHBV A24基元及结合信息保守性频率蛋白质 位置序列 AA Filed A*24019519 POL 529 AFPHCLAF 89519 X62 AFSSAGPCAL10 0.00129018 POL 535 AFSYMDDVVL10 0.00099519 POL 655 AFTFSPTYKAF 118016 ENV 108 AMQWNSTTF 9100 20 NUC 131 AYRPPNAPI 9 0.0310100 20 NUC 131 AYRPPNAPIL10 0.00427515 POL 607 CFRKLPVNRPI 118517 POL 618 DWKVCQRI 88517 POL 618 DWKVCQRIVGL 119018 ENV 262 DYQGMLPVCPL 11 0.00029018 NUC 117 EYLVSFGVW 99018 NUC 117 EYLVSFGVWI10100 20 ENV 382 FFCLWVYI 88016 ENV 182 FFLLTRIL 88016 ENV 182 FFLLTRILTI108517 ENV 13 FFPDHQLDPAF 118016 ENV 181 GFFLLTRI 88016 ENV 181 GFFLLTRIL 98016 ENV 181 GFFLLTRILTI 119519 ENV 12 GFFPDHQL 87515 ENV 170 GFLGPLLVL 98016 POL 500 GFRKIPMGVGL 118517 NUC 29 GMDIDPYKEF109018 ENV 265 GMLPVCPL 88517 NUC 25 GWLWGMDI 88517 ENV 65 GWSPQAQGI 9 0.00248517 ENV 85 GWSPQAQGIL10 0.00039519 POL 639 GYPALMPL 89519 ENV 234 GYRWMCLRRF10 0.00079519 ENV 234 GYRWMCLRRFI 117515 POL 579 GYSLNFMGYVI 118016 POL 820 HFASPLHVAW107515 POL 7 HFRKLLLL 8100 20 POL 146 HYLHTLWKAGI 11100 20 ENV 381 IFFCLWVYI 9 0.00878016 ENV 245 IFLFILLL 88016 ENV 245 IFLFILLLCL108016 ENV 245 IFLFILLLCLI 118517 ENV 358 IWMMWYWGPSL 11 0.00049519 POL 395 KFAVPNLQSL10 0.0020100 20 POL 121 KYLPLDKGI 98517 POL 745 KYTSFPWL 8表XVIII HBV A24基元及结合信息保守性 频率 蛋白质 位置序列AA Filed A*240185 17 POL 745 KYTSFPWLL 9 * 5.300080 16 ENV 247 LFILLLCL880 16 ENV 247 LFILLLCLI 980 16 ENV 247 LFILLLCLIF 1080 16 ENV 247 LFILLLCLIFL 1195 19 POL 643 LMPLYACI890 18 NUC 101 LWFHISCL885 17 NUC 101 LWFHISCLTF 1080 16 POL 492 LYSHPIIL880 16 POL 492 LYSHPIILGF 10 * 1.100085 17 ENV 360 MMWYWGPSL 9 * 0.006085 17 ENV 361 MWYWGPSL8 0.000595 19 POL 561 NFLLSLGI895 19 POL 561 NFLLSLGIHL 100.009980 16 POL 758 NWILRGTSF 995 19 POL 512 PFLLAQFTSAI 1195 19 POL 634 PFTQCGYPAL 100.000295 19 ENV 341 PFVQWFVGL 9 0.000380 16 POL 505 PMGVGLSPF 980 16 POL 505 PMGVGLSPFL 1080 16 POL 505 PMGVGLSPFLL 1180 16 POL 750 PWLLGCAANW 1080 16 POL 750 PWLLGCAANWI 11100 20 POL 51 PWTHKVGNF 9 * 0.029095 19 ENV 344 QWFVGLSPTVW 1175 15 ENV 242 RFIIFLFI875 15 ENV 242 RFIIFLFIL 975 15 ENV 242 RFIIFLFILL 1075 15 ENV 242 RFIIFLFILLL 11100 20 ENV 332 RFSWLSLL8100 20 ENV 332 RFSWLSLLVPF 1185 17 POL 577 RWGYSLNF895 19 ENV 236 RWMCLRRF895 19 ENV 236 RWMCLRRFI 9 * 0.071095 19 ENV 236 RWMCLRRFII 10 * 1.100095 19 ENV 236 RWMCLRRFIIF 11100 20 POL 167 SFCGSPYSW 9 * 0.071095 19 NUC 46 SFLPSDFF880 16 POL 765 SFVYVPSAL 995 19 POL 413 SWLSLDVSAAF 11100 20 ENV 334 SWLSLLVPF 9 * 0.390095 19 POL 392 SWPKFAVPNL 10 * 5.6000100 20 ENV 197 SWWTSLNF8表XVIII HBV A24基元及结合信息保守性 频率 蛋白质 位置序列 AA Filed A*240195 19 ENV 197 SWWTSLNFL 9 * 0.380090 18 POL 537 SYMDDVVL 875 15 POL 4 SYQHFRKL 875 15 POL 4 SYQHFRKLL 9 0.005175 15 POL 4 SYQHFRKLLL10 * 0.066075 15 POL 4 SYQHFRKLLLL 1175 15 NUC 138 TFGRETVL 875 15 NUC 138 TFGRETVLEYL 1195 19 POL 657 TFSPTYKAF 9 0.006095 19 POL 657 TFSPTYKAFL10 0.004395 19 POL 686 VFADATPTGW10 * 0.018075 15 X131 VFVLGGCRHKL 1190 18 NUC 102 WFHISCLTF 9 * 0.030095 19 ENV 345 WFVGLSPTVW10 * 0.012095 19 ENV 345 WFVGLSPTVWL 1195 19 ENV 237 WMCLRRFI 895 19 ENV 237 WMCLRRFII 9 *95 19 ENV 237 WMCLRRFIIF10 0.001395 19 ENV 237 WMCLRRFIIFL 1185 17 ENV 359 WMMWYWGPSL10 *95 19 ENV 198 WWTSLNFL 8表XIXaHBV DR-超基元在HBV多蛋 示例序 示例序例蛋白质 核心序列 核心频率核心保守 示例序例 白中的位置 列频率 保守性(%)性(%)FOL FAAPFTQCG 19 95LLGFAAPFTQCGYPA62819 95POL FADATPTGW 19 95CQVFADATPTGWGLA68416 80POL FAVPNLQSL 19 95WPKFAVPNLQSLTNL39319 95NUC FGRETVLEY 15 75CLTFGRETVLEYLVS13614 70POL FGVEPSGSG 15 75RRSFGVEPSGSGHID2526 30NUC FHISCLTFG 18 90LLWFHISCLTFGRET10017 85NUC FHLCLIISC 16 80MQLFHLCLIISCSCP1 10 50ENV FILLLCLIF 16 80IFLFILLLCLIFLLV24516 80ENV FLFILLLCL 16 80FIIFLFILLLCLIFL24316 80ENV FLGPLLVLQ 15 75TSGFLGPLLVLQAGF16815 75ENV FLLTRILTI 16 80AGFFLLTRILTIPQS18016 80ENV FLLVLLDYQ 19 95CLIFLLVLLDYQGML25319 95ENV FPAGGSSSG 15 75GLYFPAGGSSSGTVN12711 55ENV FPDHQLDPA 18 90LGFFPDHQLDPAFGA22 9 45POL FPHCLAFSY 19 95RRAFPHCLAFSYMDD52719 95POL FRKIPMGVG 16 80ILGFRKIPMGVGLSP49813 65POL FRKLPVNRP 16 80KQCFRKLPVNRPIDW6169 45XFSSAGPCAL 19 95VCAFSSAGPCALRFT60 18 90ENV FSWLSLLVP 20 100 SVRFSWLSLLVPFVQ33016 80POL FTFSPTYKA 19 95KQAFTFSPTYKAFLC65312 60POL FTGLYSSTV 18 90VGNFTGLYSSTVPVF56 11 55POL FTSAICSVV 19 95LAQFTSAICSVVRRA51519 95ENV FVGLSPTVW 19 95VQWFVGLSPTVWLSV34314 70XFVLGGCRHK 18 90LKVFVLGGCRHKLVC12914 70ENV FVQWFVGLS 19 95LVPFVQWFVGLSPTV33919 95POL FVYVPSALN 18 90GTSFVYVPSALNPAD76316 80POL IDWKVCQRI 17 85NRPIDWKVCQRIVGL61416 80ENV IFLFILLLC 16 80RFIIFLFILLLCLIF24215 75ENV IFLLVLLDY 19 95LCLIFLLVLLDYQGM25219 95POL IGTDNSVVL 16 80AKLIGTDNSVVLSRK73113 65PCL IHTAELLAA 17 85PLPIHTAELLAACFA71116 80ENV IIFLFILLL 16 80RRFIIFLFILLLCLI24115 75ENV ILLLCLIFL 20 100 FLFILLLCLIFLLVL24616 80POL ILRGTSFVY 16 80ANWILRGTSFVYVPS75716 80NUC ILSTLPETT 20 100 NAPILSTLPETTVVR16519 95ENV IPIPSSWAF 20 100 CTCIPIPSSWAFARF3218 40NUC IRTPPAYRP 19 95GVWIRTPPAYRPPNA12319 95POL LAACFARSR 17 85AELLAACFARSRSGA71716 80POL LAFSYMDDV 18 90PHCLAFSYMDDVVLG53118 90POL LAQFTSAIC 19 95PFLLAQFTSAICSVV51219 95NUC LCLGWLWGM 17 85ASKLCLGWLWGMDID19 17 85ENV LCLIFLLVL 20 100 ILLLCLIFLLVLLDY24919 95XLCLRPVGAE 19 95RDVLCLRPVGAESRG13 18 90POL LCQVFADAT 19 95RPGLCQVFADATPTG68011 55ENV LDSWWTSLN 19 95PQSLDSWWTSLNFLG19217 85NUC LDTASALYR 17 85RDLLDTASALYREAL28 16 80POL LDVSAAFYH 19 95WLSLDVSAAFYHIPL42511 55ENV LDYQGMLPV 18 90LVLLDYQGMLPVCPL25818 90POL LEEELPRLA 18 90AGPLEEELPRLADEG18 13 65ENV LFILLLCLI 16 80IIFLFILLLCLIFLL24416 80表XIXaHBV DR-超基元核心保守 在HBV多蛋 示例序 示例序列蛋白质核心序列 核心频率 示例序列 白中的位置 列频率 保守性(%)性(%)POL LGAKSVQHL 1785DVVLGAKSVQHLESL 541 16 80POL LGFAAPFTQ 1995VGLLGFAAPFTQCGY 626 19 95POL LGFRKIPMG 1995PIILGFRKIPMGVGL 496 13 65POL LGNLNVSIP 1995DLNLGNLNVSIPWTH 40 19 95ENV LGPLLVLQA 1995SGFLGPLLVLQAGFF 169 15 75POL LHPAAMPHL 20100 HLPLHPAAMPHLLVG 425 945ENV LIFLLVLLD 1995LLCLIFLLVLLDYQG 251 19 95POL LKLIMPARF 1575KRRLKLIMPARFYPN 104 735X LKVFVLGGC 1575EIRLKVFVLGGCRHK 126 13 65POL LLAQFTSAI 1995SPFLLAQFTSAICSV 511 19 95NUC LLDTASALY 1785IROLLDTASALYREA 56 945POL LLGCAANWI 1680FPWLLGCAANWILRG 749 15 75POL LLGFAAPFT 1995IVGLLGFAAPFTQCG 625 18 90ENV LLGWSPQAQ 1785HGGLLGWSPQAQGIL 60 15 75ENV LLLCLIFLL 20100 LFILLLCLIFLLVLL 247 16 80NUC LLSFLPSDF 1995SVELLSFLPSDFFPS 41 11 55POL LLSLGIHLN 1995TNFLLSLGIHLNPNK 560 15 75POL LLSSNLSWL 1890LTNLLSSNLSWLSLD 404 18 90ENV LLTRILTIP 1680GFFLLTRILTIPOSL 181 16 80ENV LLVLQAGFF 1995LGPLLVLQAGFFLLT 172 18 90ENV LLVPFVQWF 20100 WLSLLVPFVQWFVGL 335 19 95NUC LLWFHISCL 1890IRQLLWFHISCLTFG 126 13 65POL LMPLYACIQ 1995YPALMPLYACIQSKQ 640 11 55POL LNLGNLNVS 1995AEDLNLGNLNVSIPW 38 19 95POL LNPNKTKRW 1575GIHLNPNKTKRWGYS 567 15 75POL LNRRVAEDL 1785DEGLNRRVAEDLNLG 30 12 60POL LNVSIPWTH 1995LGNLNVSIPWTHKVG 43 19 95NUC LPETTVVRR 1995LSTLPETTVVRRRGR 169 16 80ENV LPIFFCLWV 20100 LPLLPIFFCLWVYIZ 376 13 65POL LPIHTAELL 1785VAPLPIHTAELLAAC 709 945POL LPVNRPIDW 1680FRKLPVNRPIDWKVC 608 15 75POL LQFRNSKPC 1890CWWLQFRNSKPCSDY 312 10 50X LRGLPVCAF 1995HLSLRGLPVCAFSSA 52 18 90X LRPVGAESR 1890VLCLRPVGAESRGRP 15 18 90NUC LRQAILCWG 1890HTALRQAILCWGELM 52 18 90ENV LRRFIIFLF 1575WMCLRRFIIFLFILL 237 15 75NUC LSFLPSDFF 1995VELLSFLPSDFFPSI 42 10 50POL LSLDVSAAF 1995LSWLSLDVSAAFYHI 423 11 55ENV LSLLVPFVQ 20100 FSWLSLLVPFVQWFV 333 19 95X LSLRGLPVC 1995GAHLSLRGLPVCAFS 50 18 90POL LSPFLLAQF 1995GVGLSPFLLAQFTSA 507 16 80POL LSRKYTSFP 1785SVVLSRKYTSFPWLL 739 17 85POL LSSNLSWLS 1890TNLLSSNLSWLSLDV 405 18 90ENV LSVPNPLGF 1575GTNLSVPNPLGFFPD 13 14 70POL LSWLSLDVS 20100 SSNLSWLSLDVSAAF 409 17 85ENV LTIPQSLDS 1890TRILTIPQSLDSWWT 186 15 75POL LTNLLSSNL 1890LQSLTNLLSSNLSWL 401 18 90ENV LTRILTIPQ 1680FFLLTRILTIPQSLD 182 15 75POL LVDKNPHNT 20100 GVFLVDKNPHNTTES 372 11 55NUC LVSFGVWIR 1890LEYLVSFGVWIRTPP 145 14 70表XIXaHBV DR-超基元核心保守 在HBV多蛋 示例序 示例列蛋白质核心序列 核心频率 性(%) 示例序列 白中的位置 列频率 保守性(%)POL LVVDFSQFS 20100 ESRLVVDFSQFSRGN3749 45NUC LWFHISCLT 1785 RQLLWFHISCLTFGR98 17 85NUC LWGMDIDPY 1785 LGWLWGMDIDPYKEF24 17 85POL LWKAGILYK 20100 LHTLWKAGILYKRET14818 90NUC LYREALESP 1785 ASALYREALESPEHC34 17 85POL LYSHPIILG 1680 KLHLYSHPIILGFRK48916 80POL MDDVVLGAK 1890 FSYMDDVVLGAKSVQ53618 90POL MGVGLSPFL 1680 KIPMGVGLSPFLLAQ50316 80POL MPHLLVGSS 1785 PAAMPHLLVGSSGLS4308 40ENV MQWNSTTFH 1680 PQAMQWNSTTFHQTL1068 40X MSTTDLEAY 1575 LSAMSTTDLEAYFKD1009 45ENV MWYWGPSLY 1785 IWMMWYWGPSLYNIL3699 45X VCAFSSAGP 1995 GLPVCAFSSAGPCAL57 18 90POL VCQRIVGLL 1785 DWKVCQRIVGLLGFA61817 85POL VFADATPTG 1995 LCQVFADATPTGWGL68319 95ENV VGLSPTVWL 1995 QWFVGLSPTVWLSVI34414 70POL VGPLTVNEK 1785 QQYVGPLTVNEKRRL93 8 40POL VHFASPLHV 1680 PDRVHFASPLHVAWR81612 60X VLCLRPVGA 1995 ARDVLCLRPVGAESR12 14 70POL VLGAKSVQH 1995 DDVVLGAKSVQHLES54016 80X VLHKRTLGL 1785 LPKVLHKRTLGLSAM89 11 55POL VPNLQSLTN 1995 KFAVPNLQSLTNLLS39519 95NUC VQASKLCLG 1680 CPTVQASKLCLGWLW14 15 75ENV VRFSWLSLL 1680 WASVRFSWLSLLVPF32813 65POL VRRAFPHCL 1995 CSVVRRAFPHCLAFS52319 95POL VSIPWTHKV 20100 NLNVSIPWTHKVGNF45 19 95NUC VWIRTPPAY 1995 SFGVWIRTPPAYRPP12118 90POL VYVPSALNP 1890 TSFVYVPSALNPADD76416 80NUC WFHISCLTF 1890 QLLWFHISCLTFGRE99 17 85ENV WFVGLSPTV 1995 FVQWFVGLSPTVWLS34219 95POL WILRGTSFV 1680 AANWILRGTSFVYVP75614 70NUC WIRTPPAYR 1995 FGVWIRTPPAYRPPN12219 95POL WKAGILYKR 20100 HTLWKAGILYKRETT14918 90POL WLLGCAANW 1680 SFPWLLGCAANWILR74815 75POL WLSLDVSAA 1995 NLSWLSLDVSAAFYH41117 85ENV WLSLLVPFV 20100 RFSWLSLLVPFVQWF33220 100POL WPKFAVPNL 1995 RVSWPKFAVPNLQSL39011 55POL YMDDVVLGA 1890 AFSYMDDVVLGAKSV53518 90POL YPALMPLYA 1995 QCGYPALMPLYACIQ63719 95ENV YQGMLPVCP 1890 LLDYQGMLPVCPLIP26010 50NUC YRPPNAPIL 20100 PPAYRPPNAPILSTL12919 95ENV YRWMCLRRF 1995 CPGYRWMCLRRFIIF23219 95POL YSHPIILGF 1680 LHLYSHPIILGFRKI49016 80POL YSLNFMGYV 1575 RWGYSLNFMGYVIGS58811 55POL YVPSALNPA 1890 SFVYVPSALNPADDP76516 80ENV FFCLWVYIZ 20 382ENV MGTNLSVPN 15 12表XIXBHBV DR-超基元及结合数据核心序列 示例序列 DR1 DR2w2β1DR2w2β2DR3 DR4w4DR4w15DR5w11DR5w12DR6w19DR7 DR8w2 0R9 Drw53FAAPFTQCGLLGFAAPFTQCGYPAFADATPTGWCQVFADATPTGWGLA0.2800FAVPNLQSLWPKFAVPNLQSLTNL0.00070.0013 0.0023 0.00020.00080.0180FGRETVLEYCLTFGRETVLEYLVSFGVEPSGSGRRSFGVEPSGSGHIDFHISCLTFGLLWFHISCLTFGRETFHLCLIISCMQLFHLCLIISCSCPFILLLCLIFIFLFILLLCLIFLLV0.0005 0.0041 0.0018FLFILLLCLFIIFLFILLLCLIFLFLGPLLVLQTSGFLGPLLVLQAGFFLLTRILTIAGFFLLTRILTIPQS4.60000.0420 0.0190 0.0040 5.3000 0.15003.60000.07000.37003.10000.26001.3000FLLVLLDYQCLIFLLVLLDYQGMLFPAGGSSSGGLYFPAGGSSSGTVNFPDHQLDPALGFFPDHQLDPAFGAFPHCLAFSYRRAFPHCLAFSYMDD0.00100.0010 -0.0009 0.00100.0017FRKIPMGVGILGFRKIPMGVGLSPFRKUVNRP KQCFRKLPVNRPIDW1.50000.0022 0.0210 -0.0006 1.2000 0.85000.01300.00130.00430.40000.05800.0250FSSAGPCALVCAFSSAGPCALRFT0.21000.2600 0.0023 0.00030.02000.0150FSWLSLLVPSVRFSWLSLLVPFVQ0.9000 0.0099 0.0037FTFSPTYKAKQAFTFSPTYKAFLC0.53000.2400 0.1400 0.0090 1.1000 0.22000.24000.00240.02000.33000.12000.5400FTGLYSSTVVGNFTGLYSSTVPVF1.70000.0100 0.0016 0.0140 0.17000.0035 0.05800.58000.00440.3100FTSAICSVVLAQFTSAICSVVRRA0.01200.0065 0.1500 -0.0009 0.0150 0.02800.00760.00910.00100.02800.01500.08800.0190FVGLSPTVWVQWFVGLSPTVWLSVFVLGGCRHKLKVFVLGGCRHKLVCFVQWFVGLSLVPFVQWFVGLSPTV0.01300.6900 0.0140 -0.0013 0.1500 1.40000.38000.66000.00180.00920.66002.50002.6000FVYVPSALNGTSFVYVPSALNPAD0.35000.0140 0.0500 -0.0006 0.3800 0.41000.0470 -0.00010.00010.27000.06100.3400IDWKVCQRINRPIDWKVCQRIVGLIFLFILLLCRFIIFLFILLLCLIFIFLLVLLDYLCLIFLLVLLDYQGM0.00160.0060 0.0230 0.00170.0044IGTDNSVVLAKLIGTDNSVVLSRKIHTAELLAAPLPIHTAELLAACFA0.0046 0.0490 -0.0003IIFLFILLLRRFIIFLFILLLCLIILLLCLIFLFLFILLLCLIFLLVLILRGTSFVYANWILRGTSFVYVPSILSTLPETTNAPILSTLPETTVVR0.00090.0009 -0.0007-0.00020.00050.1600IPIPSSWAFCTCIPIPSSWAFARFIRTPPAYRPGVWIRTPPAYRPPNA0.37000.0420 7.2000 0.0120 3.4000 0.57000.48000.0140 -0.00040.22000.53000.0450LAACFARSRAELLAACFARSRSGALAFSYMDDVPHCLAFSYMDDVVLGLAQFTSAICPFLLAQFTSAICSVV0.18000.0270 0.0042 -0.0013 0.0800 0.12000.01200.00160.08000.07700.05800.0590LCLGWLWGMASKLCLGWLWGMDID0.0002 -0.0005 0.0017-0.00020.00130.0010LCLIFLLVLILLLCLIFLLVLLDY0.00260.0069 0.0320 0.00180.0047LCLRPVGAERDVLCLRPVGAESRGLCQVFADATRPGLCQVFADATPTGLDSWWTSLNPQSLDSWWTSLNFLGLDTASALYRRDLLDTASALYREAL0.0001 0.0092 0.0770LDVSAAFYHWLSLDVSAAFYHIPLLDYQGMLPVLVLLDYQGMLPVCPL0.0034-0.0013 0.0011LEEELPRLAAGPLEEELPRLADEG 0.0022LFILLLCLIIIFLFILLLCLIFLL表XIXBHBV DR-超基元及结合数据核心序列 示例序列 DR1 DR2w2β1 DR2w2β2 DR3 DR4w4 DR4w15 DR5w11 DR5w12 DR6w19 DR7 DR8w2 DR9 DRw53LGAKSVQHLDVVLGAKSVQHLESLLGFAAPFTQVGLLGFAAPFTQCGY 0.0470 0.31000.0008 -0.0014 -0.0004 -0.0001 0.0014 0.5700LGFRKIPMGPIILGFRKIPMGVGLLGNLNVSIPDLNLGNLNVSIPWTH 0.0038 0.0240 0.0010LGPLLVLQASGFLGPLLVLQAGFFLHPAAMPHLHLPLHPAAMPHLLVGLIFLLVLLDLLCLIFLLVLLDYQGLKLIMPARFKRRLKLIMPARFYPNLKVFVLGGCEIRLKVFVLGGCRHKLLAQFTSAISPFLLAQFTSAICSV 0.1200 0.02000.0085 -0.0013 0.0740 0.0190 -0.0002 -0.0013 0.0540 0.0330 0.0014 0.0380 0.2000LLDTASALYIRDLLDTASALYREALLGCAANWIFPWLLGCAANWILRGLLGFAAPFTIVGLLGFAAPFTQCG 0.0200 -0.0005-0.0007 -0.0002 0.0009 0.0067LLGWSPQAQHGGLLGWSPQAQGILLLLCLIFLLLFILLLCLIFLLVLLLLSFLPSDFSVELLSFLPSDFFPSLLSLGIHLNTNFLLSLGIHLNPNK 3.5000 0.04100.1200 0.0220 0.0360 0.0053 0.0160 0.2200 0.0032 0.3800LLSSNLSWLLTNLLSSNLSWLSLD 0.00100.0083 0.0160 0.0013 0.0019 0.0200LLTRILTIPGFFLLTRILTIPQSL 0.4300 0.01500.0110 3.1000 0.4500 2.3000 0.0780 3.5000 1.6000 0.5500LLVLQAGFFLGPLLVLQAGFFLLTLLVPFVQWFWLSLLVPFVQWFVGLLLWFHISCLIRQLLWFHISCLTFGLMPLYACIQYPALMPLYACIQSKQ 0.2400 0.0014 0.0011LNLGNLNVSAEDLNLGNLNVSIPW 0.0001 -0.0005 -0.0007 -0.0002 -0.0003 0.0170LNPNKTKRWGIHLNPNKTKRWGYSLNRRVAEDLDEGLNRRVAEDLNLGLNVSIPWTHLGNLNVSIPWTHKVGLPETTVVRRLSTLPETTVVRRRGRLPIFFCLWVLPLLPIFFCLVYYIZLPIHTAELLVAPLPIHTAELLAACLPVNRPIDWFRKLPVNRPIDWKVCLQFRNSKPCCWWLQFRNSKPCSDYLRGLPVCAFHLSLRGLPVCAFSSA 1.3000 0.00280.0130LRPVGAESRVLCLRPVGAESRGRPLRQAILCWGHTALRQAILCWGELMLRRFIIFLFWMCLRRFIIFLFILLLSFLPSDFFVELLSFLPSDFFPSILSLDVSAAFLSWLSLDVSAAFYHILSLLVPFVQFSWLSLLVPFVQWFVLSLRGLPVCGAHLSLRGLPVCAFS 0.78000.0042-0.0041 0.0011 0.00250.00770.0150LSPFLLAQFGVGLSPFLLAQFTSALSRKYTSFPSVVLSRKYTSFPWLL 0.00050.00570.2100 -0.0016 0.53000.0130LSSNLSWLSTNLLSSNLSWLSLDV 0.0016 -0.0005 0.1300 0.00060.00190.0410LSVPNPLGFGTNLSVPNPLGFFPDLSWLSLDVSSSNLSWLSLDVSAAF 0.1400 0.0030 -0.00051.5000 0.2700 0.0046 0.0180 0.1000 0.0039 0.0460 0.01106.2000LTIPQSLDSTRILTIPQSLDSWWTLTNLLSSNLLQSLTNLLSSNLSWL 2.5000 0.44000.0200 -0.0013 4.8000 0.8100 0.0680 0.7500 0.0260 0.1500 0.0880 0.1100LTRILTIPQFFLLTRILTIPQSLDLVDKNPHNTGVFLVDKNPHNTTESLVSFGWIR LEYLVSFGVWIRTPP表XIXB HBV DR-超基元及结合数据核心序列 示例序列 DR1 DR2w2β1 DR2w2β2 DR3DR4w4 DR4w15DR5w11 DR5w12 DR6w19DR7 DR8w2 DR9 DRw53LVVDFSQFSESRLVVDFSQFSRGN 0.00070.0074 -0.0010 2.6000-0.0004 0.0040 -0.00140.0029LWFHISCLTRQLLWFHISCLTFGR 0.0002 0.00090.0140 0.0011 0.00610.0096LWGMDIDPYLGWLWGMDIDPYKEF 0.0004 0.0006 0.0200 0.0280 -0.0002 0.00040.0430LWKAGILYKLHTLWKAGILYKRETLYREALESPASALYREALESPEHCLYSHPIILGKLHLYSHPIILGFRKMDDVVLGAKFSYMDDVVLGAKSVQMGVGLSPFLKIPMGVGLSPFLLAQMPHLLVGSSPAAMPHLLVGSSGLSMQWNSTTFHPQAMQWNSTTFHQTL 0.00120.0300 0.1200MSTTDLEAYLSAMSTTDLEAYFKDMWYWGPSLYIWMMWYWGPSLYNILVCAFSSAGPGLPVCAFSSAGPCALVCQRIVGLLDWKVCQRIVGLLGFA 0.0120 -0.00260.0030 0.2500 0.00180.0130VFADATPTGLCQVFADATPTGWGL 0.00200.9600 0.0013VGLSPTVWLQWFVGLSPTVWLSVIVGPLTVNEKQQYVGPLTVNEKRRLVHFASPLHVPDRVHFASPLHVAWR 0.05100.02900.00080.00080.00540.0008 0.01900.08100.00350.2400VLCLRPVGAARDVLCLRPVGAESRVLGAKSVQHDDVVLGAKSVQHLESVLHKRTLGLLPKVLHKRTLGLSAMVPNLQSLTNKFAVPNLQSLTNLLS 0.01800.0005 -0.00030.1300 0.0043 0.0088 -0.0003 0.0056VQASKLCLGCPTVQASKLCLGWLWVRFSWLSLLWASVRFSWLSLLVPFVRRAFPHCLCSVVRRAFPHCLAFS 0.10000.10240.0770 0.0032 0.0016 -0.00220.0008 -0.0013 0.05400.05900.02501.20000.0460VSIPWTHKVNLNVSIPWTHKVGNF 0.0001 -0.0005-0.0041-0.0007 -0.0002 0.00050.0009VWIRTPPAYSFGVWIRTPPAYRPP 0.00940.01100.4300-0.0009 0.07800.06300.0260 0.0071 0.00020.02400.25000.08000.0016VYVPSALNPTSFVYVPSALNPADDWFHISCLTFQLLWFHISCLTFGREWFVGLSPTVFVQWFVGLSPTVWLS 0.47000.00350.0160-0.0013 0.0130 0.0072 0.0021 0.01900.06900.01800.04100.0044WILRGTSFVAANWILRGTSFVYVP 0.09200.02400.0061 0.0023 0.05100.02500.0140 0.3700 0.02500.58000.25000.2700WIRTPPAYRFGVWIRTPPAYRPPNWKAGILYKRHTLWKAGILYKAETTWLLGCAANWSFPWLLGCAANWILRWLSLDVSAANLSWLSLDVSAAFYH 0.14000.0003 -0.0005 1.3000 0.2900 0.0033 0.0022 0.03300.00410.01500.06202.4000WLSLLVPFVRFSWLSLLVPFVQWF 0.0430 0.0009 -0.0007 0.0002 0.00050.0031WPKFAVPNLRVSWPKFAVPNLQSLYMDDVVLGAAFSYMDDVVLGAKSV 0.0027 -0.0005 0.0130 2.9000 0.0006-0.0003 -0.0005YPALMPLYAQCGYPALMPLYACIQ 0.0062 0.00180.0068 0.0023 0.0006YQGMLPVCPLLDYQGMLPVCPLIPYRPPNAPILPPAYRPPNAPILSTL 0.0056 -0.00050.0038 0.0022 0.00240.0015YRWMCLRRFCPGYRWMCLRRFIIFYSHPIILGFLHLYSHPIILGFRKI 0.02200.03400.0400 0.0040 0.68000.16000.0410 0.0310 0.00020.00060.06100.0490YSLNFMGYVRWGYSLNFMGYVIGSYVPSALNPASFVYVPSALNPADDPFFCLWVYIZMGTNLSVPN表XXaHBV DR-3A基元蛋白质 核心序列 核心频率 核心保守性(%)示例序列 在多蛋白中的位置 示例序列频率示例序列保守性(%)ENVFFPDHQLDP1995PLGFFPDHQLDPAFG10 9 95NUCFGRETVLEY1575CLTFGRETVLEYLVS13614 75POLFGVEPSGSG1575RRSFGVEPSGSGHID2416 75POLFLVDKNPHN20100 GGVFLVDKNPHNTTE36011 100POLIGTDNSVVL1680AKLIGTDNSVVLSRK73113 80POLLEEELPRLA1890AGPLEEELPRLADEG18 13 90POLLPLDKGIKP20100 TKYLPLDKGIKPYYP12020 100POLLSLDVSAAF1995LSWLSLDVSAAFYHI41211 95POLLVVDFSQFS20100 ESRLVVDFSQFSRGN3749 100NUCLYREALESP1785ASALYREALESPEHC34 17 85NUCMDIDPYKEF1785LWGMDIDPYKEFGAS27 9 85POLVAEDLNLGN20100 NRRVAEDLNLGNLNV34 17 100POLVFADATPTG1995LCQVFADATPTGWGL68319 95ENVVLLDYQGML1995FLLVLLDYQGMLPVC25618 95POLYMDDVVLGA1890AFSYMDDVVLGAKSV53518 90表XXbHCV DR 3A基元核心序列 示例序列DR1 DR2w2β1 DR2w2β2 DR3 DR4w4 DR4w15 DR5w11 DR5w12 DR6w19 DR7 DR8W2 DR9 DRW53FFPDHQLDP PLGFFPDHQLDPAFGFGRETVLEY CLTFGRETVLEYLVSFGVEPSGSG RRSFGVEPSGSGHIDFLVDKNPHN GGVFLVDKNPHNTTE 0.0790IGTDNSVVL AKLIGTDNSVVLSRKLEEELPRLA AGPLEEELPRLADEG 0.0022LPLDKGIKP TKYLPLDKGIKPYYP -0.0017LSLDVSAAF LSWLSLDVSAAFYHILVVDFSQFS ESRLVVDFSQFSRGN 0.0007 0.0074-0.0010 2.6000 -0.0004 0.4000 -0.0014 0.0029LYREALESP ASALYREALESPEHCMDIDPYKEF LWGMDIDPYKEFGASVAEDLNLGN NRRVAEDLNLGNLNV 0.1400VFADATPTG LCQVFADATPTGWGL 0.0020 0.9600 0.0013VLLDYQGML FLLVLLDYQGMLPVC 0.0170YMDDVVLGA AFSYMDDVVLGAKSV 0.0027-0.0005 0.0130 2.9000 0.0006 -0.0003 -0.0005表XXcHBV DR-3B基元蛋白质核心序列 核心频率核心保守示例序列 在HBV多蛋 示例序 示例序列性(%) 白中的位置 列频率X AHLSLRGLP18 90 DHGAHLSURGLPVCA48 18 90.00POL FSPTYKAFL19 95 AFTFSPTYKAFLCKQ65511 55.00PDL IPWTHKVGN20 100 NVSIPWTHKVGNFTG47 20 100.00POL LTVNEKRRL17 85 VGPLTVNEKRRUKLI96 12 60.00X VGAESRGRP19 95 LRPVGAESRGRPVSG18 7 35.00POL VVLSRKYTS18 90 DNSVVLSRKYTSFPW73717 85.00表XXdHBV DR-3B基元及结合信息核心序列 示例序列 DR1 DR2w2β1 DR2w2β2 DR3 DR4w4 DR4w15 DR5w11 DR5w12 DR6w19 DR7DR8w2 DR9 DRw53AHLSLRGLP DHGAHLSLRGLPVCAFSPTYKAFL AFTFSPTYKAFLCKQ 0.0035IPWTHKVGN NVSIPWTHKVGNFTGLTVNEKRRL VGPLTVNEKRRLKLI 0.0006 0.0022 0.0047 2.2000 0.0030 0.0009 -0.0014 0.0092VGAESRGRP LRPVGAESRGRPVSG -0.0017VVLSRKYTS DNSVVLSRKYTSFPW表XXI人群覆盖度及组合的HLA超型表型频率白种人北美黑人日本人 中国人 西班牙人平均值HLA超型a.单个超型A2 45.8 39.042.445.943.043.2A3 37.5 42.145.852.743.144.2B7 38.6 52.748.835.547.144.7A1 47.1 16.121.814.726.325.2A24 23.9 38.958.640.138.340.0B44 43.0 21.242.939.139.037.0B27 28.4 26.113.313.935.323.4B62 12.6 4.8 36.525.411.118.1B58 10.0 25.11.6 9.0 5.9 10.3b.组合的超型A2,A3,B7 83.0 86.187.588.486.386.2A2,A3,B7,A24,B44,A199.5 98.1100.0 99.599.499.3A2,A3,B7,A24,B44,A1, 99.9 99.6100.0 99.899.999.8B27,B62,B58表XXII HBV类似物AA序列A1 A2 A3A24 B7一级固定 类似物修整名称 基元 超基元 超基元基元 超基元残基修整10CILLLCLIFL NY N N NNo A9 RMTGGVFLVVM2.V9 NY N N N1 A9 LMPFVQWFVVM2.V9 NY N N N1 A9 RLTGGVFLVVL2.V9 NY N N N1 A9 GLCQVFADVL2.AV9 NY N N N1 A9 WLLRGTSFVIL2.V9 NY N N N1 A9 NLGNLNVSVL2.IV9 NY N N N1 A9 YLPSALNPVVL2.AV9NY N N N1 A9 GLWIRTPPVVL2.AV9NY N N N1 A9 RLSWPKFAVVL2.V9 NY N N N1 A9 ILGLLGFAVVL2.AV9NY N N N1 A9 RMLTIPQSVIM2.LV9NY N N N1 A9 SLDSWWTSVL2.LV9 NY N N N1 A10FMLLLCLIFL IM2.L10NY N Y N1 A10LMLQAGFFLV VM2.LV NY N N N1 A10SMLSPFLPLV IM2.LV1NY N N N1 A10LMLLDYQGMV VM2.LV NY N N N1 A10FLGLSPTVWV VL2.LV1NY N N N1 A8 FPAAMPHLNN N N Y A8 HPFAMPHLNN N N Y A8 HPAAMPHINN N N Y A8 FMFSPTYKNN Y N N A8 FVFSPTYKNN Y N N A9 FLLTRILTVL2.IV9 NY N N N1 A9 ALMPLYACVL2.IV9 NY N N N1 A9 LLAQFTSAVL2.IV9 NY N N N1 A9 LLPFVQWFVVL2.V9 NY N N N1 A9 FLLAQFTSVL2.AV9 NY N N N1 A9 KLHLYSHPVL2.IV9 NY N N N1 A9 KLFLYSHPI NY N N No A9 LLSSNLSWVL2.LV9 NY N N N1 A9 FLLSLGIHVL2.LV9 NY N N N1 A9 MMWYWGPSVM2.LV9 NY N N N1 A9 VLQAGFFLVL2.LV9 NY N N N1 A9 PLLPIFFCVL2.LV9 NY N N N1 A9 FLLPIFFCL NY N N NNo A9 VLLDYQGMVL2.LV9 NY N N N1 A9 YMFDVVLGA NY N N NNo A9 GLLGWSPQVL2.AV9 NY N N N1 A9 FPAAMPHLL NN N N Y A9 HPFAMPHLL NN N N Y A9 HPAAMPHLI NN N N Y A表XXII HBV类似物AA 序列A1 A2 A3 A24 B7 一级固定 类似物修整名称 基元超基元 基元 基元超基元 残基修整9FPVCAFSSA N NN NY A9LPFCAFSSA N NN NY A9LPVCAFSSI N NN NY A9FPALMPLYA N NN NY A9YPFLMPLYA N NN NY A9YPALMPLYI N NN NY A9FPSRGRLGL N NN NY A9DPFRGRLGL N NN NY A9DPSRGRLGI N NN NY A9SMICSVVRR N NY NN A9SVICSVVRR N NY NN A9KVGNFTGLK N NY NN A9KVGNFTGLR N NY NN A9VVFFSQFSR N NY NN A9SVNRPIDWK N NY NN A9TLWKAGILK N NY NN A9TLWKAGILR N NY NN A9TMWKAGILY Y NY NN A9TVWKAGILY N NY NN A9RMYLHTLWK N NY NN A9RVYLHTLWK N NY NN A9AMTFSPTYK N NY NN A9SVVRRAFPR N NY NN A9SVVRRAFPK N NY NN A9SAIXSVVRR N NY NN A9LPVXAFSSA N NN NY A10 FLLAQFTSAV L2.IV10 N YN NN 1 A10 YLFTLWKAGI N YN NN NoA10 YLLTLWKAGI N YN NN NoA10 LLFYQGMLPV N YN NN NoA10 LLLYQGMLPV N YN NN NoA10 LLVLQAGFFV L2.LV10 N YN NN 1 A10 ILLLCLIFLV L2.LV10 N YN NN 1 A10 FPFCLAFSYM N NN NY A10 FPHCLAFSYI N NN NY A10 FPARVTGGVF N NN NY A10 TPFRVTGGVF N NN NY A10 TPARVTGGVI N NN NY A10 FPCALRFTSA N NN NY A10 GPFALRFTSA N NN NY A10 GPCALRFTSI N NN NY A10 FPAAMPHLLV N NN NY A表XXII HBV类似物AA序列 A1 A2 A3 A24 B7 一级固定类似物修整名称 基元 超基元 超基元 基元超基元 残基修整10HPFAMPHLLV N NNN Y A10HPAAMPHLLI N NNN Y A10QMFTFSPTYK N NYN N A10QVFTFSPTYK N NYN N A10TMWKAGILYK N NYN N A10TVWKAGILYK N NYN N A10VMGGVFLVDK N NYN N A10VVGGVFLVDK N NYN N A10SMLPETTVVR N NYN N A10SVLPETTVVR N NYN N A10TMPETTVVRR N NYN N A10TVPETTVVRR N NYN N A10HTLWKAGILK N NYN N A10HTLWKAGILR N NYN N A10HMLWKAGILY Y NYN N A10HVLWKAGILY N NYN N A10GMDNSVVLSR N NYN N A10GVDNSVVLSR N NYN N A10GTFNSVVLSR N NYN N A10YMFDVVLGAK N NYN N A10MMWYWGPSLK N NYN N A10MMWYWGPSLR N NYN N A9 ILLLXLIFLN YNN N A9 LLLXLIFLLN YYN N A9 LLXLIFLLVN YYN N A9 PLLPIFFXLN YNN N A9 ALMPLYAXIN YNN N A9 GLXQVFADAN YNN N A9 HISXLTFGRN NYN N A9 FVLGGXRHKN NYN N A10FILLLXLIFL N YNN N A10ILLLXLIFLL N YNN N A10LLLXLIFLLV N YNN N A10LLPIFFXLWV N YNN N A10QLLWFHISXL N YNN N A10LLGXAANWIL N YNN N A10TSAIXSVVRR N NYN N A10GYRWMXLRRF N NNY N A10GPXALRFTSA N NNN Y A10FPHXLAFSYM N NNN Y A11HMLWKAGILYK N NYN N A11HVLWKAGILYK N NYN N A表XXIIHBV类似物AA序列 A1 A2 A3 A24 B7一级固定类似物修整名称 基元超基元 超基元基元 超基元残基修整11SMLPETTVVRR N NY N N A11SVLPETTVVRR N NY N N A11GMDNSVVLSRK N NY N N A11GVDNSVVLSRK N NY N N A11GTFNSVVLSRK N NY N N A8 MPLSYQHI N NN N Y A8 LPIFFCLI N NN N Y A8 SPFLLAQI N NN N Y A8 YPALMPLI N NN N Y A8 VPSALNPI N NN N Y A9 LPIFFCLWI N NN N Y A9 LPIHTAELI N NN N Y A10VPFVQWFVGIN NN N Y A11NPLGFFPDHQI N NN N Y A11LPIHTAELLAI N NN N Y A9 FLPSYFPSA L2.FY5. N YN N N Rev3A10YLHTLWKAGV L2.IV10 N YN N N 1 A11STLPETYVVRR N NY N N A9 YMDDVVLGV M2.AV9N YN N N 1 A9 FPIPSSWAF N NN N Y A9 IPITSSWAF N NN N Y A9 IPILSSWAF N NN N Y A9 FPVCLAFSY N NN N Y A9 FPHCLAFAY N NN N Y A9 FPHCLAFSL N NN N Y A9 IPIPMSWAF N NN N Y A9 FPHCLAFAL N NN N Y A10FLPSZFFPSVN YN N N No A10FLPSZFFPSVN YN N N No A9 IPFPSSWAF N NN N Y A9 IPIPSSWAI N NN N Y A9 FPFCLAFSY N NN N Y A9 FPHCLAFSI N NN N Y A9 FPHCLAFSA N NN N Y A10FQPSDYFPSVN YN N N Rev A9 YLLTRILTI N YN N N A9 FLYTRILTI N YN N N A9 FLLTYILTI N YN N N A9 FLLTRILYI N YN N N A11FLPSDFFPSVR N NY N N A9 FLPSDFFPS N NN N N A8 FLPSDFFP N NN N N A表XXII HBV类似物AA序列 A1 A2A3A24 B7一级固定 类似物修整名称 基元 超基元超基元基元超基元残基修整10FLPSDFFPSIL2.VI10 NY N N N Rev A10FLPSDYFPSV NY N N N No A12YSFLPSDFFPSVNN N N N A10YNMGLKFRQL NN N N N A9 NMGLKYRQL NY N Y N No A10FLPS(X)YFPSVNN N N N A10FLPSD(X)FPSVNN N N N A11FLPSDLLPSVR NN Y N N A12FLPSDFFPSVRDNN N N N A12LSFLPSDFFPSVNN N N N A11SFLPSDFFPSV NN N N N A8 PSDFFPSVNN N N N A9 FLMSYFPSV NY N N N No A9 FLPSYFPSV L2.FY5. NY N N N 3A10FLMSDYFPSV NY N N N No A11CILLLCLIFLL NY N N N No A10FLPNDFFPSAL2.SN4. NY N N N Rev A10FLPDDFFPSAL2.SD4. NY N N N Rev A10FLPNDFFPSV NY N N N No A10FLPSDFFPSAL2.VA10 NY N N N Rev A10FLPDDFFPSV NY N N N No A10FLPADFFPSV NY N N N No A10FLPVDFFPSV NY N N N No A10FLPADFFPSIL2.SA4. NY N N N Rev A10FLPVDFFPSIL2.SV4. NY N N N Rev A10FLPSDAFPSV NY N N N No A10FLPSAFFPSV NY N N N No A10FLPSDFAPSV NY N N N No A10FLPSDFFASV NY N N N No A10FLPSDFFPAV NY N N N No A10FLASDFFPSV NY N N N No A10FAPSDFFPSVLA2.V10 NY N N N Rev A10ALPSDFFPSV NY N N N No A10YLPSDFFPSV NY N N N No A10FMPSDFFPSVLM2.V1NY N N N 1A10FLKSDFFPSV NY N N N No A10FLPSEFFPSV NY N N N No A10FLPSDFYPSV NY N N N No A10FLPSDFFKSV NY N N N No A10FLPSDFFPKV NY N N N No AFLPSDFFPSV(CONH2)VLEYLVSFGV(NH2)表XXII HBV类似物AA序列 A1 A2A3A24 B7 一级固定 类似物修整名称 基元 超基元超基元基元超基元 残基修整ATVELLSFLPSDFFPSV-NH2TVELLSFLPSDFFPSV-NH2VELLSFLPSDFFPSV-NH2ELLSFLPSDFFPSV-NH2LLSFLPSDFFPSV-NH2LSFLPSDFFPSV-NH2SFLPSDFFPSV-NH2FLPSDFFPSV-NH2LPSDFFPSV-NH2PSDFFPSV-NH2FLPSDFFPS-NH2FLPSDFFP-NH2FLPSDFF-NH2ALPSDFFPSV-NH2SLNFLGGTTV(NH2)FLPSDFFPSVR-NH2ALFKDWEELVLGGSRHKLKIKESFRKLALMPLYASIFLSKQYLNLLLGSAANWINLNNLNVSIIIKKSEQFVALSLIVNLLRIPRTPRSV表XXIIIHBV来源肽的免疫原性免疫原性超基元 肽 序列 蛋白质 XRN原代 转基因患者 总体A2超基元 924.07 FLPSDFFPSVHBV core 185 10/106/6 25/32a+1069.06LLVPFVQWFVHBV env 3385 3/4 6/9 +1147.13FLLAQFTSAIHBV pol 5135 0/3 unk1090.77YMDDVVLGV HBV pol 5385 9/9 +777.03 FLLTRILTI HBV env 1834 14/23a+927.15 ALMPLYACI HBV pol 6424 10/123/5 2/15a+1013.01WLSLLVPFV HBV env 3354 2/6 5/9 23/29a+1069.05LLAQFTSAI HBV pol 5044 0/4 0/5 unk1132.01LVPFVQWFV HBV env 3394 0/3 0/4 unk1147.14VLLDYQGMLPV HBV env 2594 4/4 6/6 +927.41 LLSSNLSWL HBV pol 9923 0/4 0/3 unk927.42 NLSWLSLDV HBV pol 4113 2/8 +927.46 KLHLYSHPI HBV pol 4893 0/4 4/6 +1069.07FLLAQFTSA HBV pol 5033 1/2 0/3 +1168.02GLSRYVARL HBV Pol 4553 9/13a+A2超基元 927.11 FLLSLGIHL HBV pol 5622 15/2212/13 9/15a+927.47 HLYSHPIIL HBV pol 1076 2 10/14+1039.03MMWYWGPSL HBV env 3602 3/4 0/4 +1069.12YLHTLWKAGVHBV pol 1472 2/4 +1137.02LLDYQGMLPVHBV env 2602 1/2 0/4 +1142.07GLLGWSPQA HBV env 62 2 3/4 5/6 +1.0573 ILRGTSFVYVHBV pol 7731 3/7b+1013.14VLQAGFFLL HBV env 1771 0/4 5/12 +1069.10LLPIFFCLWVHBV env 3781 3/3 0/4 2/5c+1069.13PLLPIFFCL HBV env 3771 0/4 7/12 +1090.06LLVLQAGFFLHBV env 1751 1/5 0/4 +1090.12YLVSFGVWI HBV nuc 1181 9/9 +1.0518 GLSPTVWLSVHBV env 3381 3/9c+1090.14YMDDVVLGA HBV pol 5381 2/7 2/5 2/7b+A3超基元 1147.16HTLWKAGILYK HBV POL 1495 0/6 3/3 1/22 +
1083.01STLPETTVVRRHBV core 141 43/56/68/32+1150.51GSTHVSWPK HBV pol 3984 3/6+1.0219 FVLGGCRHK HBV adr"X"1550 30/4 unk1069.16NVSIPWTHK HBV pol 47 30/80/31/21+1069.20LVVDFSQFSR HBV pol 38830/46/61/22+1090.10QAFTFSPTYK HBV pol 66533/60/33/21+1090.11SAICSVVRR HBV pol 53131/4 2/22+A3超基元1069.15TLWKAGILYK HBV pol 15023/80/35/28+1142.05KVGNFTGLY HBV adr POL 62920/3 2/22+B7超基元1147.05FPHCLAFSYM HBV POL 53051/3 0/12+988.05 LPSDFFPSV HBV core 19-27 4 2/16+1145.04IPIPSSWAF HBV ENV 31340/4 1/12+1147.02HPAAMPHLL HBV POL 42940/5 0/12unk1147.06LPVCAFSSA HBV X 58 41/4 +1147.08YPALMPLYA HBV POL 6404 0/12unk1145.08FPHCLAFSYM HBV POL 54130/4 unkB7超基元1147.04TPARVTGGVF HBV POL 3542 2/12+从原代培养物、急性患者(a-Bertoni et al.,J Clin Invest 100503,b-Rehermann et al.,J.Clin.Invest971655,c-Nayersina et al.,J Immunol 1504659)或转基因小鼠得到的免疫原性评价。在这些系统之一中观察到应答时给出阳性评价(+)。Unk=未知表XXIV MHC-肽结合试验细胞系和放射性标记的配体A.I类结合试验放射性标记的肽物种 抗原1等位基因 细胞系 来源序列人 A1A*0101 Steinlin Hu.J chain 102-110 YTAVVPLVYA2A*0201 JY HBVc 18-27 F6->Y FLPSDYFPSVA2A*0202 P815(转染的) HBVc 18-27 F6->Y FLPSDYFPSVA2A*0203 FUN HBVc 18-27 F6->Y FLPSDYFPSVA2A*0206 CLA HBVc 18-27 F6->Y FLPSDYFPSVA2A*0207 721.221(转染的) HBVc 18-27 F6->Y FLPSDYFPSVA3 GM3107 非天然的(A3CONI)KVFPYALINKA11 BVR 非天然的(A3CON1)KVFPYALINKA24 A*2402 KAS116 非天然的(A24CON1) AYIDNYNKFA31 A*3101 SPACH非天然的(A3CON1)KVFPYALINKA33 A*3301 LWAGS非天然的(A3CON1)KVFPYALINKA28/68A*6801 CIR HBVc 141-151 T7->Y STLPETYVVRRA28/68A*6802 AMAI HBV pol 646-654 C4->A FTQAGYPALB7B*0702 GM3107 A2 sigal seq.5-13(L7->Y) APRTLVYLLB8B*0801 Steinlin HIVgp 586-593 Y 1->F,Q5->Y FLKDYQLLB27 B*2705 LG2 R 60s FRYNGLIHRB35 B*3501 CIR,BVR 非天然的(B35CON2) FPFKYAAAFB35 B*3502 TISI 非天然的(B35CON2) FPFKYAAAFB35 B*3503 EHM 非天然的(B35CON2) FPFKYAAAFB44 B*4403 PITOUT EF-1G6->Y AEMGKYSFYB51 KAS116 非天然的(B35CON2) FPFKYAAAFB53 B*5301 AMAI 非天然的(B35CON2) FPFKYAAAFB54 B*5401 KT3 非天然的(B35CON2) FPFKYAAAFCw4 Cw*0401 C1R 非天然的(C4CON1)QYDDAVYKLCw6 Cw*0602 721.221转染的非天然的(C6CON1)YRHDGGNVLCw7 Cw*0702 721.221转染的非天然的(C6CON1)YRHDGGNVL小鼠 DbEL4 腺病毒EIA P7->YSGPSNTYPEIKbEL4 VSV NP 52-59RGYVFQGLDdP815 HIV-IIIB ENV G4->Y RGPYRAFVTIKdP815 非天然的(KdCON1)KFNPMKTYILdP815 HBVs 28-39 IPOSLDSYWTSLB.II类结合试验放射性标记的肽物种抗原 等位基因 细胞系 来源 序列人 DR1DRBI*0101 LG2 HA Y307-319YPKYVKQNTLKLATDR2DRB1*1501 L466.1MBP 88-102YVVHFFKNIVTPRTPPYDR2DRB1*1601 L242.5非天然的(760.16) YAAFAAAKTAAAFADR3DRB1*0301 MAT MT 65kD Y3-13 YKTIAFDEEARRDR4w4 DRB1*0401 Preiss非天然的(717.01) YARFQSQTTLKQKTDR4w10 DRB1*0402 YAR 非天然的(717.10) YARFQRQTTLKAAADR4w14 DRB1*0404 BIN 40非天然的(717.01) YARFQSQTTLKQKTDR4w15 DRB1*0405 KT3 非天然的(717.01) YARFQSQTTLKQKTDR7DRB1*0701 PitoutTet.tox.830-843QYIKANSKFIGITEDR8DRB1*0802 OLL Tet.tox.830-843QYIKANSKFIGITEDR8DRB1*0803 LUY Tet.tox.830-843QYIKANSKFIGITEDR9DRB1*0901 HID Tet.tox.830-843QYIKANSKFIGITEDR11 DRB1*1101 Sweig Tet.tox.830-843QYIKANSKFIGITEDR12 DRB1*1201 Herluf未知洗脱肽 EALIHQLKINPYVLSDR13 DRB1*1302 H0301 Tet.tox.830-843 S->A QYIKANAKFIGITEDR51 DRB5*0101 GM3107 or 1416.3 Tet.tox.830-843QYIKANAKFIGITEDR51 DRB5*0201 L255.1HA 307-319 PKYVKQNTLKLATDR52 DRB3*0101 MAT Tet.tox.830-843NGQIGNDPNRDILDR53 DRB4*0101 L257.6非天然的(717.01) YARFQSQTTLKQKTDQ3.1 QA1*0301/DOR1*03 PF非天然的(ROIV) AHAAHAAHAAHAAHAA小鼠IAbDB27.4非天然的(ROIV) AHAAHAAHAAHAAHAAIAdA20 非天然的(ROIV) AHAAHAAHAAHAAHAAIAkCH-12 HEL 46-61 YNTDGSTDYGILQINSRIAsLS102.9 非天然的(ROIV) AHAAHAAHAAHAAHAAIAu91.7 非天然的(ROIV) AHAAHAAHAAHAAHAAIEdA20 Lambda阻遏蛋白12-26YLEDARRKKAIYEKKKIEkCH-12 Lambda阻遏蛋白12-26YLEDARRKKAIYEKKK表XXV MHC纯化中使用的抗体单克隆抗体 特异性W6/32 HLA-class IB123.2 HLA-B and CIVD12 HLA-DQLB3.1 HLA-DRM1/42 H-2 class I28-14-8SH-2Db and Ld34-5-8S H-2DdB8-24-3 H-2KbSF1-1.1.1 H-2KdY-3 H-2Kb10.3.6 H-2IAK14.4.4 H-2IEd,IEKMKD6H-2LAdY3JPH-2 IAb,IAs,IAu
表XXVI保守HBV来源肽与HLA-A2超型等位基因的体外结合A2超型结合能力(IC50nM)结合的等肽 AA分子第1位 序列保守性1A*0201 A*0202 A*0203 A*0206 A*6802 位基因2924.07 10Core18 FLPSDFFPSV95 2.5 2.1 6.0 3.0 3651069.06 10ENV 349LLVPFVQWFV95 7.5 115.9 13286 51147.13 10POL 524FLLAQFTSAI95 24134 1.4 34455 51013.0102 9 ENV 346WLSLLVPFV 1004.6 113 1.4 101290 43777.03 9 ENV 183FLLTRILTI 80 9.8 100 1.3 19- 4927.15 9 POL 653ALMPLYACI 95 10126 3.0 160 851 41069.05 9 POL 525LLAQFTSAI 95 50163.0 1538 5141132.01 9 ENV 350LVPFVQWFV 95 119 287 2083 463 1441147.14 11ENV 259VLLDYQGMLPV 90 8.6 202.0 132353 41090.77 9 POL 538(a) YMDDVVLGV 90 5.1 906.7 711905 41069.0719 POL 524FLLAQFTSA 95 6.0 1654 9.1 39870 3927.46 9 POL 500KLHLYSHPI 95 72126 3.7 627 26667 3927.42 9 POL 422NLSWLSLDV 90 77843 162313 404 31168.02 9 POL 455GLSRYVARL 90 79391 1812333 - 3927.41 9 POL 418LLSSNLSWL 90 455 552.6 1370 4000 31039.0319 ENV 360MMWYWGPSL 85 5.6 5375 833 112 3636 2927.11 9 POL 573FLLSLGIHL 95 7.7 4300 1000 3411429 21142.07 9 ENV 73 GLLGWSPQA 85 1314333 286 1429 - 2927.47 9 POL 502HLYSHPIIL 80 2314333 112176 755 21137.02 10ENV 271LLDYQGMLPV90 51- 500 552 - 21069.09 9 ENV 270VLLDYQGML 95 114 - 476 4111 - 21069.14 10NUC 168ILSTLPETTV100238 506 130 1194 5970 21069.11 10POL 147YLHTLWKAGI100313 8600 184000 1250 21142.01 9 NUC 129LLWFHISCL 90 385 21500 238 1194 4082 21090.12 9 NUC 147YLVSFGVWI 90 1311.0518 10ENV 359GLSPTVWLSV75 1811013.1402 9 ENV 177VLQAGFFLL 95 332389 3704 1947 6349 11069.13 9 ENV 388PLLPIFFCL 10077- 5556 3364 8511 11069.10 10ENV 389LLPIFFCLWV100156 5375 667 5000 - 11090.06 10ENV 175LLVLQAGFFL90 161 1162 2222 2467 3636 11.0895 10ENV 248FILLLCLIFL80 179 1927.24 9 POL 770WILRGTSFV 80 185 11090.14 9 POL 538YMDDVVLGA 90 200 - 4167 - - 13.0205 10ENV 171FLGPLLVLQA75 263 11069.08 10ENV 260ILLLCLIFLL100263 - -2846 26667 11.0573 10POL 773ILRGTSFVYV80 313 11.完整序列在所扫描的分离株中的频率2.结合的超型等位基因数。结合3个或更多等位基因的肽被认为是简并的。3.破折号(-)表示IC50
表XXVII保守HBV来源肽与HLA-A3超型等位基因的体外结合A3超型结合能力(IC50nM) 结合的等肽 AA分子 第1位 序列 保守性1A*03 A*11 A*3101 A*3301A*6801 位基因26.0535 11X NUC FUS299 GVWIRTPPAYR95 58 35 3.0 40 1251147.16 11pol 149 HTLWKAGILYK10020 14 486 40342526.0539 11POL 376 RLVVDFSQFSR95 39 2.0 7.0 24 1.0 526.0149 9 X69CALRFTSAR 85 3235261 12 3.61141.0993 9 X130 KVFVLGGCR 75 262 73 30 4082667 426.0153 9 X64SSAGPCALR 90 137543 55 1811141083.01 11Core 141 STLPETTVVRR95 733 4.0 180 18126420.0130 9 pol 655 AFTFSPTYK 95 42 150 310313182 296 326.0008 8 POL 656 FTFSPTYK 95 193 136 12861000 7331.0219 9 X1550 FVLGGCRHK 80 169 316 1500744103 31069.20 10POL 388 LVVDFSQFSR 100687517 692 12616331069.16 9 POL 47NVSIPWTHK 100134 105 - 2900 250 31090.10 10POL 665 QAFTFSPTYK 95 244 11 18000 5088 6.7 31090.11 9 POL 531 SAICSVVRR 95 189729 120044621320.0131 9 pol 524 SVVRRAFPH 95 100 10 621 - 500 326.0545 11X NUC FUS318 TLPETTVVRRR95 22000 375 295140813326.0023 8 X NUC FUS296 VSFGVWIR 90 2750207 240 1074 222 31142.05 9 POL 55KVGNFTGLY 95 52 353 - - - 21142.06 9 POL 623 PVNRPIDWK 85 355 43 - - 8889 21.0975 9 POL 106 RLKLIMPAR 75 116 - 5.8 592- 21.0562 10POL 576 SLGIHLNPNK 75 55 77 21069.21 10NUC 170 STLPETTVVR 95 15714 100 22501208 320 21069.22 10NUC 171 TLPETTVVRR 95 15714 261 - 2417 182 21069.15 10POL 150 TLWKAGILYK 1002.1 17 352929000 615 21.0215 9 X105 TTDLEAYFK 75 18333 6.5 - 24167 471 21069.17 10POL 369 VTGGVFLVDK 100282 65 - - 3636 21069.19 9 POL 389 VVDFSQFSR 100733380 13846 1706 242 226.0026 8 POL 168 ASFCGSPY 100239 26 - - 20000 226.0549 11ENV 389 LLPIFFCLWVY100478 10000 260964482226.055011POL528RAFPHCLAFSY95 92 15 667 263642667 21090.0410POL746GTDNSVVLSR 90 110001436000152631000011069.0410POL149HTLWKAGILY 100250 7500 - 8529 6667 11.0205 9 POL771ILRGTSFVY 80 250 - - --11090.089 NUC148LVSFGVWIR 90 3929 500 11039.0110ENV360MMWYWGPSLY 85 220 7500 - -2666711.0584 10X 104STTDLEAYFK 75 1667 2.2 11147.1711pol735GTDNSVVLSRK90 786 11 - --11147.1811pol357RVTGGVFLVDK100578 207- --11099.039 POL150TLWKAGILY 10085 7500 - --11090.1510POL549YMDDVVLGAK 90 333 1395 - --126.00248 POL50 VSIPWTHK 100846 3535806223082000011.完整序列在所扫描的分离株中的频率2.结合的超型等位基因数。结合3个或更多等位基因的肽被认为是简并的。3.破折号(-)表示IC50
` 表XXVIII保守HBV来源肽与HLA-B7超型等位基因的体外结合B7超型结合能力(IC50nM) 结合的等肽 AA 分子 第1位 序列 保守性1B*0702 B*3501. B*5101 B*5301 B*5401 位基因11147.0510 POL 541 FPHCLAFSYM95 5633 61 118 208 51145.049 ENV 324 IPIPSSWAF 100 422.62.3 122941 41147.029 POL 440 HPAAMPHLL 100 56267500 186 833 41147.069 X58LPVCAFSSA 95 115 101500 10333 0.53 41147.089 POL 651 YPALMPLYA 95 306 150162 664 0.63 4988.05 9 CORE 19LPSDFFPSV 95 1774 34390 120 4.8 431145.089 POL 541 FPHCLAFSY 95 - 14 83 17503 319.00148 POL 640 YPALMPLY 190 13750 28 13 207 1786 326.057011 pol 640 YPALMPLYACI 95 1375 - 117 291 143 31147.0410 POL 365 TPARVTGGVF90 1772 - 939 16667 215.00349 ENV 390 LPIFFCLWV 100 - - 57 2325 53220.01409 POL 723 LPIHTAELL 85 1375 11410583020000 219 00068 ENV 340 VPFVQWFV 95 5500 - 0.29- 91219.00078 ENV 379 LPIFFCLW 100 - - 153 662857 219.00108 POL 1 MPLSYOHF 100 - 742458 251 526 219.00118 POL 429 HPAAMPHL 100 8518000 18 2514 625 219.00128 POL 511 SPFLLAQF 95 108000 306 10333 1075 226.056611 pol 511 SPFLLAQFTSA 95 67- - - 0.83 21147.019 POL 789 DPSRGRLGL 90 458 - - - - 116.018210 X67GPCALRFTSA90 61- - - 2857 120.027310 POL 440 HPAAMPHLLV85 344 3600 705 664 588 115.00309 ENV 191 IPQSLDSWW 90 - - 27500 62- 115.021010 POL 123 LPLDKGIKPY100 - 24827500 - - 116.00069 ENV 25FPDHQLDPA 90 - 8000 - - 12116.017710 ENV 324 IPIPSSWAFA80 4231 3000 6643 22116.018010 POL 644 APFTQCGYPA95 1897 - - 7.1 116.018110 POL 723 LPIHTAELLA85 3056 6545 5813 30119.00038 ENV 173 GPLLVLQA 95 18333 - 500 - 1538 119.00058 ENV 313 IPIPSSWA 100 13750 18000 2895- 167 119.00098 NUC 133 RPPNAPIL 100 724 - 196 - - 119.00158 POL 659 SPTYKAFL 95 14- 2895- - 119.00168 POL 769 VPSALNPA 90 5000 - 786 - 10126.055411 pol 633 APFTQCGYPAL 95 247200 13750 - 1075 126.055911 pol 712 LPIHTAELLAA 85 611 2667 - 775 3.6 126.056111 pol 774 NPADDPSRGRL 90 458 - - - - 126.056411 Core 133 RPPNAPILSTL 100 42- 3056- - 126.056711 Core 49SPHHTALRQAI 100 9.5 - 13750 18600 - 126.056811 pol 354 TPARVTGGVFL 90 58- - 18600 20000 11.完整序列在所扫描的分离株中的频率2.结合的超型等位基因数。结合3个或更多等位基因的肽被认为是简并的。3.破折号(-)表示IC50表XXIXHBV来源的含A1和A24基元的肽a.A1基元肽HLA-A*0101肽 分子位置 序列 保守性结合(IC50 nM)1069.01Core59 LLDTASALY 752.11.0519 Core419DLLDTASALY 752.31069.02pol 427SLDVSAAFY 954.82.0239 1000 LSLDVSAAFY 956.02.0126 1521 MSTTDLEAY 75291039.06ENV 359WMMWYWGPSLY85781090.14pol 538YMDDVVLGA 90961090.09pol 808PTTGRTSLY 851191069.03pol 124PLDKGIKPYY 100 1471069.08env 249ILLLCLIFLL 100 1921069.04pol 149HTLWKAGILY 100 3811039.01360MMWYWGPSLY 853091.0774 Core416WLWGMDIDPY 7530920.0254pol 631FAAPFTQCGY 953681.0166 pol 629KVGNFTGLY 95368破折号表示IC50nMb.A24基元肽HLA-A*2402肽 分子位置 序列保守性结合(IC50 nM)20.0271POL 392 SWPKFAVPNL 952.11069.23POL 745 KYTSFPWLL 852.32.0181 POL 492 LYSHPIILGF 801120.0269ENV 236 RWMCLRRFII 951120.0136ENV 334 SWLSLLVPF 100 3120.0137ENV 197 SWWTSLNFL 953220.0135ENV 236 RWMCLRRFI 9516920.0139POL 167 SFCGSPYSW 100 1692.0173 POL 4 SYQHFRKLLL 751822.0060 1224 GYPALMPLY 9524513.0129NUC 117 EYLVSFGVWI 903531090.02core131 AYRPPNAPI 9038713.0073NUC 102 WFHISCLTF 8040020.0138POL 51PWTHKVGNF 100 414破折号表示IC50nM
表XXXaHBV来源的A2超基元交反应性肽的免疫原性免疫原性肽 序列 蛋白质 XRN 原代 转基因患者 总体1924.07 FLPSDFFPSV HBV core 18510/106/6 25/32a+1069.06 LLVPFVQWFV HBV env 33853/4 6/9 +1147.13 FLLAQFTSAI HBV pol 5135 0/3 -1090.77 YMDDVVLGV HBV pol 5385 9/9 +777.03 FLLTRILTI HBV env 1834 14/23a+927.15 ALMPLYACI HBV pol 642410/123/5 2/15a+1013.01 WLSLLVPFV HBV env 33542/6 5/9 23/29a+l069.05 LLAQFTSAI HBV pol 50440/4 0/5 -1132.01 LVPFVQWFV HBV env 33940/3 0/4 -1147.14 VLLDYQGMLPVHBV env 25944/4 6/6 +927.41 LLSSNLSWL HBV pol 99230/4 0/3 -927.42 NLSWLSLDV HBV pol 4113 2/8 +927.46 KLHLYSHPI HBV pol 48930/4 4/6 +1069.07 FLLAQFTSA HBV pol 50331/2 0/3 +1168.02 GLSRYVARL HBV pol 4553 9/13a+从原代培养物、急性患者(a-Bertoni et al.J Clin Invest 100503,b-Rehermann etal.,J.Clin.Invest 971655,c-Nayersina et al.,J Immunol 1504659)或转基因小鼠得到的免疫原性评价。在这些系统之一中观察到应答时给出阳性评价(+)。
表XXXb非交叉反应性HBV A2超基元肽的免疫原性免疫原性肽 序列 蛋白质 XRN 原代 转基因患者 总体1927.11 FLLSLGIHL HBV pol 562 215/22 12/13 9/15a+927.47 HLYSHPIIL HBV pol 1076 2 10/14 +1039.03 MMWYWGPSL HBV env 360 23/4 0/4+1069.12 YLHTLWKAGV HBV pol 147 22/4 +1137.02 LLDYQGMLPV HBV env 260 21/2 0/4+1142.07 GLLGWSPQA HBV env 62 23/4 5/6+1.0573 ILRGTSFVYV HBV pol 773 13/7b+1013.14 VLQAGFFLL HBV env 177 10/4 5/12 +1069.10 LLPIFFCLWV HBV env 378 13/3 0/4 2/5c+1069.13 PLLPIFFCL HBV env 377 10/4 7/12 +1090.06 LLVLQAGFFL HBV env 175 11/5 0/4+1090.12 YLVSFGVWI HBV nuc 118 19/9 +1.0518 GLSPTVWLSV HBV env 338 13/9c+1090.14 YMDDVVLGA HBV pol 538 12/7 2/5 2/7b+从原代培养物、急性患者(a-Bertoni et al.J Clin Invest 100503,b-Rehermann etal.,J.Clin.Invest 971655,c-Nayersina et al.,J Immunol 1504659)或转基因小鼠得到的免疫原性评价。在这些系统之一中观察到应答时给出阳性评价(+)。表XXXc用pol538类似物诱导的CTL对HBV pol 538和拉米夫定诱导的pol 538变体的交叉识别a。
第6天CTL反应(ΔLU)HBV pol538 HBV pol 538突变体刺激性肽 (YMDDVVLGA)b(YVDDVVLGA)HBV pol 538 27.8 54.2HBV pol 538突变体 35.3 27.9a.使用HBV pol 538(肽1090.14)的1090.77类似物诱导CTL。在DNA小基因pEP2、AOS中编码1090.77。b.所显示的值代表2个独立培养物的эLU的几何平均值。加载至靶细胞上的肽是1090.14(HBV pol 538)或1353.02(pol 538的拉米夫定诱导变体)。表XXXTaHBV来源的A3超基元交叉反应性肽的免疫原性免疫原性肽 序列蛋白质 XRN 原代转基因患者 总体11147.16IITLWKAGILYKHBV POL 149 50/6 3/3 1/22 +1083.01STLPETTVVRR HBV core 14143/5 6/6 8/32 +1150.51GSTHVSWPK HBV pol 398 43/6 +1.0219 FVLGGCRHK HBV adr"X"155030/4 -1069.16NVSIPWTHK HBV pol 47 30/8 0/3 1/21 +1069.20LVVDFSQFSR HBV pol 388 30/4 6/6 1/22 +1090.10QAFTFSPTYK HBV pol 665 33/6 0/3 3/21 +1090.11SAICSVVRR HBV pol 531 31/4 2/22 +1.从原代培养物,Bertoni等,J Clin Invest 100503或转基因小鼠得到的免疫原性评价。当这些系统之一中发现应答者时给出阳性评价(+)。阴性评价表示在检查时无应答者。
表XXXIb非交叉反应性HRV A3超基元肽的免疫原性免疫原性肽 序列 蛋白质 XRN原代转基因患者 总体11069.15TLWKAGILYKHBV pol 1502 3/8 0/3 5/28 +1142.05KVGNFTGLY HBV adr POL 6292 0/3 2/22 +1.从原代培养物,Bertoni等,J Clin Invest 100503或转基因小鼠得到的免疫原性评价。当这些系统之一中发现应答者时给出阳性评价(+)。阴性评价表示在检查时无应答者。
表XXXIIaHBV B7超基元交叉反应性肽的免疫原性免疫原性肽 序列 蛋白质 XRN 原代转基因患者总体11147.05FPHCLAFSYMHBV POL 5305 1/3 0/12+988.05 LPSDFFPSV HBV core 19-27 4 2/16+1145.04IPIPSSWAF HBV ENV 3134 0/4 1/12+1147.02HPAAMPHLL HBV POL 4294 0/5 0/12-1147.06LPVCAFSSA HBV X 58 4 1/4 +1147.08YPALMPLYA HBV POL 6404 0/12 -1145.08FPHCLAFSY HBV POL 5413 0/4 -1.从原代培养物,Bertoni等,J Clin Invest 100503或转基因小鼠得到的免疫原性评价。当这些系统之一中发现应答者时给出阳性评价(+)。阴性评价表示在检查时无应答者。
表XXXIIb非交叉反应性HBV B7超基元肽的免疫原性免疫原性肽序列 蛋白质 XRN 原代转基因 患者总体11147.04 TPARVTGGVFHBV POL 3542 2/12+1.从原代培养物,Betroni等,J Clin Invest 100503或转基因小鼠得到的免疫原性评价。当这些系统之一中发现应答者时给出阳性评价(+)。阴性评价表示在检查时无应答者。
表XXXIII候选的HBV来源HTL表位选择标准保守性肽 分子 第1位核心总计序列DR-超基元F107.01ENV 249 100 95 ILLLCLIFLLVLLDYF107.02ENV 252 95 95 LCLIFLLVLLDYQGM1280.17ENV 258 90 90 LVLLDYQGMLPVCPL1186.22ENV 332 100 100 RFSWLSLLVPFVQWF1186.15ENV 339 95 95 LVPFVQWFVGLSPTV1186.06ENV 342 95 95 FVQWFVGLSPTVWLS1186.03NUC 19 85 85 ASKLCLGWLWGMDID1186.12NUC 24 85 85 LGWLWGMDIDPYKEF857.02 NUC 50 90 PHHTALRQAILCWGELMTLA1186.23NUC 98 85 85 RQLLWFHISCLTFGR27.0279NUC 117 90 EYLVSFGVWIRTPPA27.0280NUC 123 95 95 GVWIRTPPAYRPPNA1186.20NUC 129 100 95 PPAYRPPNAPILSTL1186.16NUC 136 100 95 NAPILSTLPETTVVR1186.01POL 38 95 95 AEDLNLGNLNVSIPW1186.17POL 45 100 95 NLNVSIPWTHKVGNF27.0281POL 145 100 100 RHYLHTLWKAGILYK1280.13POL 406 95 95 KFAVPNLQSLTNLLS27.0283POL 409 85 VPNLQSLTNLLSSNLF107.03POL 412 90 90 LQSLTNLLSSNLSWL1186.28POL 416 90 90 TNLLSSNLSWLSLDV1186.27POL 420 100 85 SSNLSWLSLDVSAAFF107.04POL 523 95 95 PFLLAQFTSAICSVV1186.10POL 526 95 95 LAQFTSAICSVVRRA1186.04POL 534 95 95 CSVVRRAFPHCLAFSF107.05POL 538 95 95 RRAFPHCLAFSYMDD1186.02POL 546 90 90 AFSYMDDVVLGAKSV1186.05POL 629 85 85 DWKVCQRIVGLLGFA1280.21POL 637 95 95 VGLLGFAAPFTQCGY27.0278POL 643 95 AAPFTQCGYPALMPL1186.21POL 648 95 95 QCGYPALMPLYACIQ1280.14POL 694 95 95 LCQVFADATPTGWGL27.0282POL 750 85 85 SVVLSRKYTSFPWLLX13 95 90 RDVLCLRPVGAESRG1186.07X50 95 90 GAHLSLRGLPVCAFS1186.29X60 95 90 VCAFSSAGPCALRFT算法 1280.20ENV 330 100 80 SVRFSWLSLLVPFVQ1280.19NUC 28 85 80 RDLLDTASALYREAL1298.02POL 56 90 55 VGNFTGLYSSTVPVF1298.03POL 571 95 75 TNFLLSLGIHLNPNK1298.05POL 651 95 55 YPALMPLYACIQSKQ1298.06POL 664 95 60 KQAFTFSPTYKAFLC1280.181 POL 722 85 80 PLPIHTAELLAACFA1280.09POL 774 90 80 GTSFVYVPSALNPADDR3基元 795.05 ENV 10 95 PLGFFPDHQLDP35.0090ENV 312 95 90 FLLVLLDYQGMLPVCCF-03 NUC 28 85 80 RDLLDTASALYREALESPEH35.0091POL 18 90 65 AGPLEEELPRLADEG35.0092POL 34 100 85 NRRVAEDLNLGNLNV35.0093POL 96 85 6D VGPLTVNEKRRLKLI35.0094POL 120 100 100 TKYLPLDKGIKPYYP35.0095POL 371 100 55 GGVFLVDKNPHNTTE35.0096POL 385 100 45 ESRLVVDFSQFSRGN1186.18POL 422 95 85 NLSWLSLDVSAAFYH35.0099POL 666 95 55 AFTFSPTYKAFLCKQ35.0101X18 95 35 LRPVGAESRGRPVSG较低保守性 799.01 ENV 11 80 75 PLLVLQAGFFLLTRILTIPQ或混杂的 799.02 ENV 31 95 SLDSWWTSLNFLGGTTVCLG799.04 ENV 71 95 75 GYRWMCLRRFIIFLFILLLC
表XXXIII候选的HBV来源HTL表位选择标准保守性肽 分子第1位核心总计 序列1298.01 ENV 117 80 40 PQAMQWNSTTFHQTL1280.06 ENV 180 80 80 AGFFLLTRILTIPQS1280.11 ENV 245 80 80 IFLFILLLCLIFLLVCF-08NUC 120 90 VSFGVWIRTPPAYRPPNAPI1186.25 NUC 121 95 90 SFGVWIRTPPAYRPP1280.15 POL 501 80 80 LHLYSHPIILGFRKI1298.04 POL 618 80 45 KQCFRKLPVNRPIDW1298.07 POL 767 80 70 AANWILRGTSFVYVP1298.08 POL 827 80 60 PDRVHFASPLHVAWR
表XXXIV HLA-DR筛选板筛选板 代表性试验表型频率抗原 等位基因等位基因 别名 Cauc.Blk.Jpn.Chn. Hisp.Avg.一级 DR1 DRB1*0101-03 DRB1*0101 (DR1)18.5 8.4 10.74.5 10.1 0.4DR4 DRB1*0401-12 DRB1*0401 (DR4w4) 23.6 6.1 40.421.9 29.8 24.4DR7 DRB1*0701-02 DRB1*0701 (DR7)26.2 11.11.0 15.0 16.6 14.0板总计59.6 24.549.338.7 51.1 44.6二级 DR2 DRB1*1501-03DRB1*1501(DR2w2 β1) 19.9 14.830.922.0 15.0 20.5DR2 DRB5*0101 DRB5*0101(DR2w2 β2) -- - ---DR9 DRB1*09011,09012 DRB1*0901(DR9)3.6 4.7 24.519.9 6.7 11.9DR13 DRB1*1301-06DRB1*1302(DR6w19) 21.7 16.514.612.2 10.5 15.1板总计42.0 33.961.048.9 30.5 43.2三级 DR4 DRB1*0405 DRB1*0405(DR4w15) -- - ---DR8 DRB1*0801-5 DRB1*0802(DR8w2) 5.5 10.925.010.7 23.3 15.1DR11 DRB1*1101-05DRB1*1101(DR5w11) 17.0 18.04.9 19.4 18.1 15.5板总计22.0 27.829.229.0 39.0 29.4四级 DR3 DRB1*0301-2 DRB1*0301(DR3w17) 17.7 19.50.4 7.3 14.4 11.9DR12 DRB1*1201-02DRB1*1201(DR5w12) 2.8 5.5 13.117.6 5.7 8.9板总计20.2 24.413.524.2 19.7 20.4表XXXVHBV来源的交叉反应性HLA-DR结合肽保守性 HHLA-DR结合能力(IC50nM) 结合的总肽 分子 第1位 核心 总计 序列 DR1 DR2w2β1 DR2w2β2 DR3 DR4w4 DR4w15 DR5w11 DR6DR7 DR8 DR9 DR等位基因F107.03 POL 412 90 90 LQSLTNLLSSNLSWL 2.0 21 1000 -a9.4 47 294 135 167 557 682 101298.06 POL 664 95 60 KQAFTFSPTYKAFLC 9.4 38 143 - 4117383 175 76 408 139 101280.06 ENV 180 80 80 AGFFLLTRILTIPQS 11 217 1053 - 8.5 2535.69.5 8.1 188 5891280.09 POL 774 90 80 GTSFVYVPSALNPAD 14 650 400 - 118 93 426 - 93 803 221 91186.25 NUC 121 95 90 SFGVWIRTPPAYRPP 532 827 47 - 577 603769 17500 1042 196 938 827.0280 NUC 123 95 95 GVWIRTPPAYRPPNA 14 217 2.8 - 1367 42 - 114 92 1667 8CF-08 NUC 12090 VSFGVWIRTPPAYRPPNAPI 192 105 300 426124527.0281 POL 145 100 100 RHYLHTLWKAGILYK 17 5.4 35 - 2250 1462 42 7456127 174 81186.15 ENV 339 95 95 LVPFVQWFVGLSPTV 385 13 1429 - 300 27 53 1944 2717 74 30 71280.15 POL 501 80 80 LHLYSHPIILGFRKI 227 268 500 - 66238488 17500 - 803 1531 7F107.04 POL 523 95 95 PFLLAQFTSAICSVV 28 337 4762 - 563 317166744 325 845 1271 71298.04 POL 618 80 45 KQCFRKLPVNRPIDW 3.3 4136 952 - 3845 153881463845 3000 71298.07 POL 767 80 70 AANWILRGTSFVYVP 54 379 3279 - 882 1520 142914043196 278 7857.02 NUC 50 90 PHHTALROAILCWGELMTLA 70 9.1 211 - 85 263 193000 676 196 2273 7a.破折号表示IC50nM>20000。表XXXVIHBV来源的DR-3结合肽保守性肽 分子第1位核心总计序列 DR31280.14*POL 694 95 95 LCQVFADATPTGWGL6735.0096 POL 385 100 45 ESRLVVDFSQFSRGN11535.0093 POL 96 85 60 VGPLTVNEKRRLKLI1361186.27 POL 420 100 85 SSNLSWLSLDVSAAF2001186.18 POL 422 95 85 NLSWLSLDVSAAFYH231*被测试为肽35.0100表XXXVIIaHBV的优选的CTL表位肽 序列蛋白质HLA924.07 FLPSDFFPSV core 18A2777.03 FLLTRILTI env 183 A2927.15 ALMPLYACI pol 642 A21013.01 WLSLLVPFV env 335 A21090.77 YMDDVVLGV pol 538 A2/A11168.02 GLSRYVARL pol 455 A2927.11 FLLSLGIHL pol 562 A21069.10 LLPIFFCLWV env 378 A21069.06 LLVPFVOWFV env 338 A21147.16 HTLWKAGILYK pol 149 A3/A11083.01 STLPETTVVRRcore 141 A31069.16 NVSIPWTHK Pol 47A31069.20 LVVDFSQFSR pol 388 A31090.10 QAFTFSPTYK Pol 665 A31090.11 SAICSVVRR pol 531 A31142.05 KVGNFTGLY pol 629 A3/A11147.05 FPHCLAFSYM pol 530 B7988.05 LPSDFFPSV core 19B71145.04 IPIPSSWAF env 313 B71147.02 HPAAMPHLL pol 429 B726.0570 YPALMPLYACI pol 640 B71147.04 TPARVTGGVF pol 354 B71.0519 DLLDTASALY core 419 A12.0239 LSLDVSAAFY pol 1000 A11039.06 WMMWYWGPSLY env 359 A120.0269 RWMCLKRFII env 236 A2420.0136 SWLSLLVPF env 334 A2420.0137 SWWTSLNFL env 197 A2413.0129 EYLVSFGVWI core 117 A241090.02 AYRPPNAPI core 131 A2413.0073 WFHISCLTF core 102 A2420.0271 SWPKFAVPNL Pol 392 A241069.23 KYTSFPWLL pol 745 A242.0181 LYSHPIILGF pol 492 A24表XXXVIIbHBV的优选的HTL表位保守性选择标准肽 分子第1位 核心 总计 序列DR-超基元 F107.03 POL 412 90 90LQSLTNLLSSNLSWL1298.06 POL 664 95 60KQAFTFSPTYKAFLC1280.06 ENV 180 80 80AGFFLLTRILTIPQS1280.09 POL 774 90 80GTSFVYVPSALNPADCF-08 CORE12090VSFGVWIRTPPAYRPPNAPI27.0281 POL 145 100100 RHYLHTLWKAGILYK1186.15 ENV 339 95 95LVPFVQWFVGLSPTV1280.15 POL 501 80 80LHLYSHPIILGFRKIF107.04 POL 523 95 95PFLLAQFTSAICSVV1298.04 POL 618 80 45KQCFRKLPVNRPIDW1298.07 POL 767 80 70AANWILRGTSFVYVP857.02 CORE50 90PHHTALRQAILCWGELMTLADR3基元 1280.14 POL 694 95 95LCQVFADATPTGWGL35.0096 POL 385 10045ESRLVVDFSQFSRGN35.0093 POL 96 85 60VGPLTVNEKRRLKLI1186.27 POL 420 10085SSNLSWLSLDVSAAF表XXXVIII一组HBV来源的HTL表位的估计人群覆盖度代表性试验 表位数2人群覆盖度(表型频率)抗原等位基因Cauc.Blk.Jpn.Chn.Hisp. Avg.DR1DRB1*0101-03 DR1 1218.5 8.4 10.74.5 10.1 10.4DR2DRB1*1501-03 DR2W2β1 1119.9 14.830.922.015.0 20.5DR2DRB5*0101DR2w2β2 8 -- - - - -DR3DRB1*0301-2 DR3 4 17.7 19.50.407.3 14.4 11.9DR4DRB1*0401-12 DR4w41123.6 6.1 40.421.929.8 24.4DR4DRB1*0401-12 DR4w15 9 -- - - - -DR7DRB1*0701-02 DR7 9 26.2 11.11.0 15.016.6 14.0DR8DRB1*0801-5 DR8w27 5.5 10.925.010.723.3 15.1DR9DRB1*09011,09012DR9 103.6 4.7 24.519.96.7 11.9DR11 DRB1*1101-05 DR5w11 1117.0 18.04.9 19.418.1 15.5DR13 DRB1*1301-066DR6w19 7 21.7 16.514.612.210.5 15.1总计198.5 95.197.191.394.3 95.11.已修正了总人群覆盖度以解释许多人种群体中DRX的存在。已假设DRX等位基因代表的特异性的范围将反映先前表征的HLA-DR等位基因的那些。在每个基元下掺入的DRX的比例代表该基元在人群剩余者中的频率。总覆盖度还未修正来解释未知的基因型。2.表位数代表最小估计,仅考虑了表12中显示的表位。嵌套表位可能结合的其它等位基因还未计算。
权利要求
1.包含至少一个乙型肝炎病毒(HBV)肽的组合物,该肽包含由选自下组的序列组成的分离的、制备的表位ALMPLYACI,WLSLLVPFV, YMIDDVVLGA,LLPIFFCLWV, HTLWKAGILYK,NVSIPWTHK,LVVDFSQFSR, QAFTFSPTYK, SAICSVVRR,KVGNFTGLY,FPHCLAFSYM, IPIPSSWAF,HPAAMPHLL,YPALMPLYACI TPARVTGGVF,DLLDTASALY, LSLDVSAAFY, WMMWYWGPSLY,RWMCLRRFII, SWLSLLVPF, SWWTSLNFL,EYLVSFGVWI, AYRPPNAPI, WFHISCLTF,SWPKFAVPNL, KYTSFPWLL, LQSLTNLLSSNLSWL,KQAFTFSPTYKAFLC,AGFFLLTRILTIPQS,GTSFVYVPSALNPAD,VSFGVWIRTPPAYRPPNAPI,RHYLHTLWKAGILYK,LVPFVQWFVGLSPTV,LHLYSHPIILGFRKI,PFLLAQFTSAICSVV,KQCFRKLPVNRPIDW,AANWILRGTSFVYVP,PHHTALRQAILCWGELMTLA,LCQVFADATPTGWGL,ESRLVVDFSQFSRGN,VGPLTVNEKPPLKLI,和SSNLSWLSLDVSAAF。
2.权利要求1的组合物,进一步包含选自FLLSLGIHL,FLPSDFFPSV,LPSDFFPSV,FLLTRILTI,LLVPFVQWFV,LYSHPIILGF,STLPETTVVRR和GLSRYVARL的表位。
3.权利要求1的组合物,其中表位与氨基酸接头连接。
4.权利要求1的组合物,其中表位与CTL表位混合或连接。
5.权利要求1的组合物,其中表位与HTL表位混合或连接。
6.权利要求5的组合物,其中HTL表位是泛DR结合分子。
7.权利要求1的组合物,进一步包含脂质体,其中表位存在于脂质体上或内部。
8.权利要求1的组合物,其中表位与脂质连接。
9.权利要求1的组合物,其中表位是杂聚物。
10.权利要求1的组合物,其中表位是同聚物。
11.权利要求1的组合物,其中表位与HLA重链,β2-微球蛋白和链霉抗生物素复合体结合,由此形成四聚物。
12.权利要求1的组合物,进一步包括抗原呈递细胞,其中表位存在于抗原呈递细胞上或内部。
13.权利要求12的组合物,其中表位与抗原呈递细胞上的HLA分子结合,由此当限制于该HLA分子的细胞毒性T淋巴细胞(CTL)存在时,CTL的受体结合HLA分子和该表位的复合体。
14.权利要求12的组合物,其中抗原呈递细胞是树突细胞。
15.包含一个或多个肽的组合物,进一步包含至少两个表位,其中表位之一选自ALMPLYACI, WLSLLVPFV, YMDDVVLGA,LLPIFFCLWV, HTLWKAGILYK,NVSIPWTHK,LVVDFSQFSR, QAFTFSPTYK, SAICSVVRR,KVGNFTGLY, FPHCLAFSYM, IPIPSSWAF,HPAAMPHLL, YPALMPLYACI TPARVTGGVF,DLLDTASALY, LSLDVSAAFY, WMMWYWGPSLY,RWMCLRRFII, SWLSLLVPF, SWWTSLNFL,EYLVSFGVWI, AYRPPNAPI, WFHISCLTF,SWPKFAVPNL, KYTSFPWLL, LQSLTNLLSSNLSWL,KQAFTFSPTYKAFLC,AGFFLLTRILTIPQS,GTSFVYVPSALNPAD,VSFGVWIRTPPAYRPPNAPI,RHYLHTLWKAGILYK,LVPFVQWFVGLSPTV,LHLYSHPIILGFRKI,PFLLAQFTSAICSVV,KQCFRKLPVNRPIDW,AANWILRGTSFVYVP,PHHTALRQAILCWGELMTLA,LCQVFADATPTGWGL,ESRLVVDFSQFSRGN,VGPLTVNEKRRLKLI,和SSNLSWLSLDVSAAF;和其中每个所述的一个或多个肽包含与乙型肝炎病毒(HBV)的天然肽序列100%等同的少于50个的连续氨基酸。
16.权利要求15的组合物,进一步包含选自FLLSLGIHL,FLPSDFFPSV,LPSDFFPSV,FLLTRILTI,LLVPFVQWFV,LYSHPIILGF,STLPETTVVRR和GLSRYVARL的表位。
17.权利要求15的组合物,其中一个肽包含所述的至少两个表位。
18.权利要求15的组合物,其中所述的一个或多个肽中至少一个是杂聚物。
19.权利要求15的组合物,其中选自权利要求15所列表位组的表位与细胞毒性T淋巴细胞(CTL)表位连接。
20.权利要求15的组合物,其中选自权利要求15所列表位组的表位与辅助T淋巴细胞(HTL)表位连接。
21.权利要求20的组合物,其中HTL表位是泛DR结合分子。
22.权利要求15的组合物,进一步包含脂质体,其中表位存在于脂质体上或内部。
23.权利要求15的组合物,其中选自权利要求15所列表位组的表位与脂质连接。
24.权利要求15的组合物,进一步包含抗原呈递细胞,其中选自权利要求15所列表位组的表位存在于抗原呈递细胞上或内部。
25.权利要求24的组合物,其中表位与抗原呈递细胞上的HLA分子结合,由此当限制于该HLA分子的细胞毒性T淋巴细胞(CTL)存在时,CTL的受体结合HLA分子和该表位的复合体。
26.权利要求24的组合物,其中抗原呈递细胞是树突细胞。
27.权利要求15的组合物,进一步包含与所述一个或多个肽混合的另外的肽。
28.权利要求27的组合物,其中另外的肽包含CTL或HTL表位。
29.疫苗组合物,包括单位剂量的包含不到50个的与乙型肝炎病毒天然肽序列100%等同的连续氨基酸的肽,该肽包含选自下组的表位ALMPLYACI,WLSLLVPFV, YMDDVVLGA,LLPIFFCLWV, HTLWKAGILYK,NVSIPWTHK,LVVDFSQFSR, QAFTFSPTYK, SAICSVVRR,KVGNFTGLY,FPHCLAFSYM, IPIPSSWAF,HPAAMPHLL,YPALMPLYACI TPARVTGGVF,DLLDTASALY, LSLDVSAAFY, WMMWYWGPSLY,RWMCLRRFII, SWLSLLVPF, SWWTSLNFL,EYLVSFGVWI, AYRPPNAPI, WFHISCLTF,SWPKFAVPNL, KYTSFPWLL, LQSLTNLLSSNLSWL,KQAFTFSPTYKAFLC,AGFFLLTRILTIPQS,GTSFVYVPSALNPAD,VSFGVWIRTPPAYRPPNAPI,RHYLHTLWKAGILYK,LVPFVQWFVGLSPTV,LHLYSHPIILGFRKI,PFLLAQFTSAICSVV,KQCFRKLPVNRPIDW,AANWILRGTSFVYVP,PHHTALRQAILCWGELMTLA,LCQVFADATPTGWGL,ESRLVVDFSQFSRGN,VGPLTVNEKRRLKLI,和SSNLSWLSLDVSAAF;以及药物赋形剂。
30.根据权利要求29的疫苗组合物,进一步包括另外的表位。
31.权利要求30的组合物,其中另外的表位选自FLLSLGIHL,FLPSDFFPSV,LPSDFFPSV,FLLTRILTI,LLVPFVQWFV,LYSHPIILGF,STLPETTVVRR和GLSRYVARL。
32.权利要求30的疫苗组合物,其中另外的表位是泛DR结合分子。
33.权利要求29的疫苗组合物,其中药物赋形剂包含佐剂。
34.权利要求29的疫苗组合物,进一步包括抗原呈递细胞。
35.权利要求34的疫苗组合物,其中表位与抗原呈递细胞上的HLA分子结合,由此当限制于该HLA分子的细胞毒性T淋巴细胞(CTL)存在时,CTL的受体结合HLA分子和该表位的复合体。
36.权利要求34的疫苗组合物,其中抗原呈递细胞是树突细胞。
37.权利要求29的疫苗组合物,进一步包括脂质体,其中至少一个表位存在于脂质体上或内部。
全文摘要
本发明使用我们关于T细胞识别抗原的机制的知识来发展针对HBV的基于表位的疫苗。更特别的是,本申请公开了我们关于用于预防和治疗HBV感染的药物组合物和方法的发现。
文档编号A61K48/00GK1454082SQ00819941
公开日2003年11月5日 申请日期2000年9月8日 优先权日2000年9月8日
发明者J·西德尼, S·索斯伍德, M·A·威特罗, B·D·利温斯顿, E·塞里斯, R·T·库博, H·M·格利, R·W·查斯纳特, A·赛特 申请人:艾普免疫公司