抗原池
发明领域
1.本发明涉及包含两种或更多种不同的抗原的抗原池(pools)。此类抗原池用于离体刺激和/或扩增源自患有癌症(例如皮肤黑色素瘤或葡萄膜黑色素瘤)的人的t细胞。本发明还尤其涉及包含抗原池和药学上可接受的运载体的免疫原性药物组合物、制备对癌细胞、免疫细胞和外来体(exosomes)具有细胞毒性的t细胞群的方法,所述外来体装载抗原池和/或由抗原池刺激,以及其药物组合物、它们的医学用途和治疗方法,其包含施用抗原池、免疫原性药物组合物、免疫细胞和外来体。
2.发明背景
3.作为针对致病微生物的正常免疫监视的部分,全部细胞均降解胞内蛋白以产生肽,所述肽荷载到表达于全部细胞的表面上的主要组织相容性复合体(mhc)i类分子。大部分衍生自宿主细胞的这些肽被视为自我并且对适应性免疫系统保持不可见。然而,外来(非自我)的肽能够刺激初始cd8+ t细胞扩增,所述细胞编码紧密结合mhc i-肽复合体的t细胞受体(tcr)。这种扩增的t细胞群可以产生效应子cd8+ t细胞(包括细胞毒性t-淋巴细胞-ctls),其可以消除加外来抗原标签的细胞,以及记忆cd8+ t细胞,其可以在加外来抗原标签的细胞稍后在动物的一生中出现时再扩增。
4.mhc ii类分子,其表达正常情况下限于专业性抗原呈递细胞(apcs)如树突状细胞(dcs),通常荷载已经自细胞外环境内化的肽。在各种因子(包括t细胞黏附分子(cd54、cd48)和共刺激分子(cd40、cd80、cd86))存在下,来自初始cd4+ t细胞的互补性tcr与mhc ii-肽复合体的结合使成熟cd4+ t细胞诱导成效应细胞(例如,th1、th2、th17、t
fh
、t
reg
细胞)。这些效应子cd4+t-细胞可以促进b细胞分化成分泌抗体的浆细胞以及促进抗原特异性cd8+ctl分化,因而有助于诱导针对外来抗原的适应性免疫应答,所述适应性免疫应答包括短期效应子功能和更长期的免疫记忆。dc可以通过输送外源衍生的抗原(如从病原体或肿瘤细胞释放的肽或蛋白质)到其mhc i分子上,执行肽抗原的交叉呈递过程,有助于通过提供刺激初始cd8+ t细胞扩增的旁路途径产生免疫记忆。
5.免疫记忆(特别是抗原特异性b细胞/抗体和抗原特异性ctl)是控制微生物感染中的关键角色,并且已经利用免疫记忆开发了预防重要致病微生物所致疾病的众多疫苗。还已知免疫记忆在控制肿瘤形成中发挥关键作用,但几乎尚未开发有效的癌疫苗。
6.癌是第二大主导病因,占全球所有死亡例的1/6。2015年,癌症所致的8.8百万例死亡当中,夺去大部分生命的癌来自肺癌(169万例)、肝癌(788,000例)、结直肠癌(774,000例)、胃癌(754,000例)和乳腺癌(571,000例)。估计癌症在2010年的经济影响是1.16万亿美元,并且接下来的二十年期间预计新病例数升高大约70%(2017年世界卫生组织癌症现实)。
7.当前的皮肤黑色素瘤疗法各异且高度地依赖于肿瘤位置和疾病阶段。非转移性黑色素瘤的主要治疗是手术摘除肿瘤和周围组织。晚期黑色素瘤可能需要包括淋巴结清扫术、放疗或化疗的治疗。免疫检查点阻断策略,包括使用靶向负向免疫调节物如pd-1/pd-l1和ctla4的抗体,最近已经给多种恶性肿瘤(包括黑色素瘤)的治疗带来革命(ribas,a.和
wolchok,j.d.(2018)science,359:1350
–
1355)。异乎寻常的检查点阻断疗法价值和其临床获益与患者对其自身癌抗原的适应性免疫应答(基于免疫应答的特异性t细胞)的充分认可联系已经给研究有效的癌疫苗、疫苗模式和癌疫苗抗原带来革命。
8.人内源逆转录病毒(herv)是外源性传染性逆转录病毒的祖先胚系整合物的残余物。herv属于一组内源性逆转录元件,其以存在侧置于病毒基因组的长末端重复序列(ltr)为特征。这个组还包括哺乳动物表观ltr逆转座子(malr)并且因此统称称作ltr元件(此处统称为erv以意指全部ltr元件)。erv构成可观比例的哺乳动物基因组(8%),并且可以基于序列同源性,分组成大约100个家族。许多erv序列编码缺陷性前病毒,所述前病毒共有由旁侧有ltr的gag、pro、pol和env基因组成的原型逆转录病毒基因组结构。一些完好的erv orf产生与外源性传染性逆转录病毒如hiv-1编码的蛋白质共有诸特征的逆转录病毒蛋白质。这类蛋白质可以充当诱导强力免疫应答的抗原(hurst和magiorkinis,2015,j.gen.virol 96:1207-1218),显示erv编码的多肽可能逃避t细胞受体选择过程与b细胞受体选择过程和中央耐受性与外周耐受性。针对erv产物的免疫应答性可以在感染或癌症中自发地出现,并且erv产物已经作为一些自身免疫疾病的病因牵涉(kassiotis和stoye,2016,nat.rev.immunol.16:207-219)。
9.进化期间突变和重组事件积累,大部分erv衍生的序列已经丧失其一些或全部基因的有功能可读框并因此丧失其产生传染性病毒的能力。然而,这些erv元件如同其他基因那样维持在种系dna中并且仍然具有从其至少一些基因产生蛋白质的潜力。实际上,herv编码的蛋白质已经在多种的人类癌症中检出。例如,herv-k env基因即rec和np9的剪接变体只存在于恶性睾丸生殖细胞中而不存在于健康细胞中(ruprecht等人,2008,cell mol life sci 65:3366-3382)。如与健康组织相比,还已经在多种癌如那些前列腺癌中观察到升高水平的herv转录物(wang-johanning,2003,cancer 98:187-197;andersson等人,1998,int.j.oncol,12:309-313)。另外,已经显示herv-e和herv-h的过量表达有免疫抑制性,这还可能促成癌形成(mangeney等人,2001,j.gen.virol.82:2515-2518)。然而,herv可能促成癌形成或致病性的确切机理仍是未知的。
10.除对周围的相邻宿主基因的表达解除管制之外,erv调节元件的活性和转座至新基因组部位可能导致产生新转录物,其中某些可以具有致瘤特性(babaian和mager,mob.dna,2016;lock等人,pnas,2014,111:3534-3543)。
11.广泛类型的疫苗模式已知。一个充分描述的方案包括向受试者直接递送抗原性多肽,以便升高免疫应答(包括b细胞应答和t细胞应答)和刺激免疫记忆。或者,可以将多核苷酸借助载体施用至受试者,从而多核苷酸编码的免疫原性多肽在体内表达。已经充分探索使用病毒载体(例如腺病毒载体)在针对癌症的预防性接种和治疗性处理策略中递送抗原(wold等人current gene therapy,2013,adenovirus vectors for gene therapy(基因治疗的腺病毒载体),vaccination and cancer gene therapy,13:421
–
433)。免疫原性肽、多肽或编码它们的多核苷酸也可以用来荷载患者衍生的抗原呈递细胞(apc),后者随后可以作为引发治疗性或预防性免疫应答的疫苗输注至受试者中。这种方法的示例是provenge,其目前是fda核准的唯一抗癌疫苗。
12.也可以通过使用癌抗原产生多种非疫苗治疗性模式,在治疗和预防癌症中利用这些癌抗原。这些治疗药分成两个不同类别:1)抗原结合性生物制品,2)过继细胞治疗药。
13.抗原结合性生物产品一般由识别抗原修饰的癌细胞并且促进癌细胞摧毁的多价工程化多肽组成。这些生物制品的抗原结合性要素可以由基于tcr的生物制品组成,所述生物制品包括但不限于通过各种技术产生的tcr、高亲和力tcr和tcr拟似物(包括基于单克隆抗体技术的那些)。这类多价生物制品的溶细胞部分可以由促进靶向和活化免疫细胞的细胞毒性化学物、生物毒素、导引基序和/或免疫刺激基序组成,前述任一者促进治疗性摧毁肿瘤细胞。
14.过继细胞疗法可以基于患者的自身t细胞,其中取出所述t细胞并用疫苗抗原制剂离体刺激(在其他因子(包括细胞组分和非细胞组分)存在或不存在时与t细胞一起培养)(yossef等人,jci insight.2018oct 4;3(19).pii:122467.doi:10.1172/jci.insight.122467)。或者,过继细胞疗法可以基于已经过人为工程化以表达识别癌抗原的抗原结合多肽的细胞(包括患者衍生或非患者衍生的细胞)。这些抗原结合多肽属于上文对抗原结合性生物制品所述相同的类别。因此,可以将已经过遗传操作以表达癌抗原结合性多肽的淋巴细胞(自体或非自体)施用至患者,作为治疗其癌症的过继细胞疗法。
15.使用erv衍生的抗原升高针对癌症的有效免疫应答已经在鼠的癌症模型中显示出促进肿瘤消退和预后更有利的有前景结果(kershaw等人,2001,cancer res.61:7920-7924;slansky等人,2000,immunity 13:529-538)。因此,已经在人类中构思了herv抗原中心免疫治疗试验(sacha等人,2012,j.immunol189:1467-1479),不过进展已经受限,部分地已鉴定的肿瘤特异性erv抗原的重度限制。
16.wo 2005/099750鉴定了现有的针对传染性病原体的疫苗中的锚定序列,其在提高针对herv-k mel肿瘤抗原的交叉反应性免疫应答中是常见的,并赋予对黑色素瘤的保护。
17.wo 00/06598涉及优先在黑色素瘤中表达的herv-avl3-b肿瘤相关基因的鉴定,以及用于诊断和治疗以所述基因的表达为特征的病症的方法和产品。
18.wo 2006/119527提供了衍生自黑色素瘤相关内源性逆转录病毒(merv)的抗原性多肽,以及它们用于黑色素瘤的检测和诊断以及该疾病的预后的用途。还公开了抗原性多肽作为抗癌疫苗的用途。
19.wo 2007/137279公开了用于检测、预防和治疗herv-k+癌的方法和组合物,例如使用herv-k+结合抗体预防或抑制癌细胞增殖。
20.wo 2006/103562公开了一种用于治疗或预防癌症的方法,其中表达来自herv-k的env基因的免疫抑制性np9蛋白。该发明还涉及药物组合物,所述药物组合物包含能够抑制所述蛋白质的活性的核酸或抗体,或能够诱导针对所述蛋白质的免疫应答的免疫原或疫苗组合物。
21.wo 2007/109583提供通过以下方式预防或治疗哺乳动物受试者中肿瘤性疾病的组合物和方法:提供包含富集的免疫细胞群的组合物,所述免疫细胞群与肿瘤细胞上的herv-e抗原有反应性。
22.humer j,等人,2006,canc.res.,66:1658-63中鉴定了衍生自黑色素瘤相关内源性逆转录病毒的黑色素瘤标志物。
23.需要鉴定包含herv相关的抗原序列的新的抗原池,其可用于癌症(特别是黑色素瘤,尤其是皮肤黑色素瘤和葡萄膜黑色素瘤)的免疫疗法。
24.发明简述
25.发明人已经惊讶地发现某些rna转录物,其包含ltr元件或衍生自与ltr元件毗邻的基因组序列,所述转录物在皮肤黑色素瘤细胞中以高水平存在,但在正常的健康组织中不可检出或以很低水平存在(参见实施例1)。这类转录物在本文中称作癌特异性跨ltr元件转录物(clt)。进一步地,发明人已经显示,由这些clt编码的潜在多肽序列的子集(即,可读框(orf))在癌细胞中翻译、由抗原加工装置的组分加工并且在肿瘤组织中存在的细胞的表面上与i类和ii类主要组织相容性复合体(mhc i类和mhc ii类)及i类和ii类人白细胞抗原(hla i类,hla ii)类分子缔合时呈递(参见实施例2)。根据事实本身,这些结果显示这些多肽(本文中称作clt抗原)是抗原性的。因此,clt抗原的癌细胞呈递预计使这些细胞易受携带clt抗原的同族t细胞受体(tcr)的t细胞清除,并且扩增携带这些同族tcr的t细胞的基于clt抗原的接种方法/治疗方案预计引发针对癌细胞(和含有它们的肿瘤),尤其是黑色素瘤,尤其是皮肤黑色素瘤肿瘤的免疫应答。来自黑色素瘤受试者的t细胞确实与本文公开的源自clt抗原的肽反应,并扩增t细胞和扩增t细胞受体序列(参见实施例3)。本发明人已经证实,clt抗原特异性t细胞没有通过中心耐受性从正常受试者的t细胞库中删除(参见实施例4)。已经测定了健康供体t细胞的离体培养物中clt抗原特异性t细胞的存在和杀伤活性(参见实施例5)。最后,qrt-pcr研究已经证实与非黑色素瘤细胞系相比,clt在从黑色素瘤细胞系提取的rna中特异性表达(参见实施例6)。本发明人还制备了包含独特clt抗原的融合蛋白(实施例8)。
26.本发明人还惊奇地发现,某些编码clt抗原的clt以及在皮肤黑色素瘤中过表达的clt也在葡萄膜黑色素瘤中过表达。由这些clt编码的clt抗原多肽序列预期能引发抗葡萄膜黑色素瘤细胞和含有它们的肿瘤的免疫应答。
27.作为本发明主题的clt和clt抗原不是可以从癌基因组图集中存在的已知肿瘤基因组序列轻易导出的典型序列。clt是因受erv源转录控制序列驱动的复杂转录和剪接事件产生的转录物。由于clt以高水平表达并且由于clt抗原多肽序列不是正常的人蛋白质序列,故而预计其将能够引发强烈的特异性免疫应答(如确实已经确立的——参见实施例3-5)并且是因此适于癌症免疫治疗环境下的治疗性用途。
28.可以按几种模式使用在表征肿瘤细胞的高表达转录物中发现的clt抗原,本发明之前不知所述抗原在人类中存在及产生蛋白质产物。例如,可以将本发明clt抗原多肽直接输送至受试者,作为针对肿瘤细胞引发治疗性或预防性免疫应答的疫苗。而且,可以将本发明核酸(其可以经密码子优化以增强其表达编码的clt抗原)直接施用或另外插入用于体内递送的载体中,以在受试者中产生编码的蛋白质产物作为引发针对肿瘤细胞的治疗性或预防性免疫应答的疫苗。
29.本发明的包含两种或更多种不同的抗原的抗原池可用于荷载患者来源的抗原呈递细胞(apc),然后可将apc作为疫苗输注到受试者中,所述抗原池中每种抗原以多肽和/或编码所述多肽的核酸的形式存在,所述疫苗引发对肿瘤细胞的治疗性或预防性免疫应答。此外,本发明的包含两种或更多种不同的抗原的抗原池,其中每种抗原以多肽和/或编码所述多肽的核酸的形式存在,可以用于离体刺激受试者的t细胞,产生刺激的t细胞制剂,其可以作为治疗癌症的疗法施用于受试者。这些和其它应用将在下面更详细地描述。
30.因此,本发明尤其提供了包含两种或更多种不同的抗原的抗原池,其中每种抗原以多肽和/或编码所述多肽的核酸的形式存在,并且其中所述不同的抗原作为单独的多肽、
核酸、融合蛋白和/或编码所述融合蛋白的核酸存在于所述抗原池中,其中所述两种或更多种不同的抗原具有选自以下的多肽序列:
31.(a)seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段;
32.(b)seq id no:2或其变体或seq id no:2或其变体的免疫原性片段;
33.(c)seq id no:3或其变体,或seq id no:3或其变体的免疫原性片段;
34.(d)seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段;
35.(e)seq id no:5或其变体,或seq id no:5或其变体的免疫原性片段;
36.(f)seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段;
37.(g)seq id no:7或其变体,或seq id no:7或其变体的免疫原性片段;以及
38.(h)seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段。
39.(下文称为“本发明的抗原池”)。
40.本发明的抗原池以及本发明的相关方面预期可用于癌症免疫治疗和预防,特别是黑色素瘤的免疫治疗和预防的一系列实施方案中,如下文更详细讨论的。
附图说明
41.图1-38中的每一个显示了从患者的肿瘤样品获得的肽的提取的ms/ms谱(具有指定的片段离子),和显示了谱的渲染图的底部图,所述谱指示已经映射到片段离子的线性肽序列的位置或以表格形式显示的类似数据。
42.图1.从患者mel-3的肿瘤样品获得的seq id no:9的肽的谱图。
43.图2.从患者mel-3的肿瘤样品获得的seq id no:10的肽的谱图。
44.图3.从患者mel-3的肿瘤样品获得的seq id no:10的肽的谱图。
45.图4.从患者2mt3的肿瘤样品获得的seq id no:10的肽的谱图。
46.图5.从患者mel-5的肿瘤样品获得的seq id no:11的肽的谱图。
47.图6.从患者mel-16的肿瘤样品获得的seq id no:11的肽的谱图。
48.图7.从患者mel-16的肿瘤样品获得的seq id no:11的肽的谱图。
49.图8.从患者2mt3的肿瘤样品获得的seq id no:11的肽的谱图。
50.图9.从患者2mt10的肿瘤样品获得的seq id no:11的肽的谱图。
51.图10从患者mel-5的肿瘤样品获得的seq id no:12的肽的谱图。
52.图11.从患者mel-26的肿瘤样品获得的seq id no:18的肽的谱图。
53.图12.从患者mel-20的肿瘤样品获得的seq id no:19的肽的谱图。
54.图13.从患者mel-20的肿瘤样品获得的seq id no:19的肽的谱图。
55.图14.从患者2mt4的肿瘤样品获得的seq id no:19的肽的谱图。
56.图15.从患者mel-35的肿瘤样品获得的seq id no:31的肽的谱图。
57.图16.从患者2mt3的肿瘤样品获得的seq id no:31的肽的谱图。
58.图17.从患者1mt1的肿瘤样品获得的seq id no:32的肽的谱图。
59.图18.从患者mel-3的肿瘤样品获得的seq id no:36的肽的谱图。
60.图19.从患者mel-3的肿瘤样品获得的seq id no:36的肽的谱图。
61.图20.从患者2mt3的肿瘤样品获得的seq id no:36的肽的谱图。
62.图21.从患者2mt1的肿瘤样品获得的seq id no:36的肽的谱图。
63.图22.从患者mel-40的肿瘤样品获得的seq id no:37的肽的谱图。
64.图23.从患者mel-41的肿瘤样品获得的seq id no:37的肽的谱图。
65.图24.从患者2mt3的肿瘤样品获得的seq id no:37的肽的谱图。
66.图25.从患者mel-27的肿瘤样品获得的seq id no:38的肽的谱图。
67.图26.从患者mel-39的肿瘤样品获得的seq id no:38的肽的谱图。
68.图27.从患者2mt12的肿瘤样品获得的seq id no:39的肽的谱图。
69.图28.从患者mel-29的肿瘤样品获得的seq id no:45的肽的谱图。
70.图29.从患者mel-41的肿瘤样品获得的seq id no:48的肽的谱图。
71.图30.从患者mel-41的肿瘤样品获得的seq id no:49的肽的谱图。
72.图31.从患者mel-41的肿瘤样品获得的seq id no:50的肽的谱图。
73.图32.从患者mel-41的肿瘤样品获得的seq id no:51的肽的谱图。
74.图33.从患者mel-21的肿瘤样品获得的seq id no:52的肽的谱图。
75.图34.从患者2mt3的肿瘤样品获得的seq id no:52的肽的谱图。
76.图35.从患者mel-27的肿瘤样品获得的seq id no:53的肽的谱图。
77.图36.从患者mel-27的肿瘤样品获得的seq id no:54的肽的谱图。
78.图37.从患者2mt4的肿瘤样品获得的seq id no:54的肽的谱图。
79.图38-53中的每一个显示了从患者肿瘤样品获得的肽的天然ms/ms谱图(上图)与对应于相同序列的合成肽的天然谱图(下图)的比对。
80.图38显示来自患者2mt3的seq id no:10的免疫肽分析的肽片段的质谱图。
81.图39显示来自患者2mt3的seq id no:11的免疫肽分析的肽片段的质谱图。
82.图40显示来自患者2mt4的seq id no:19的免疫肽分析的肽片段的质谱图。
83.图41显示来自患者2mt3的seq id no:31的免疫肽分析的肽片段的质谱图。
84.图42显示来自患者1mt1的seq id no:32的免疫肽分析的肽片段的质谱图。
85.图43显示来自患者2mt3的seq id no:36的免疫肽分析的肽片段的质谱图。
86.图44显示来自患者2mt3的seq id no:37的免疫肽分析的肽片段的质谱图。
87.图45显示来自患者2mt12的seq id no:39的免疫肽分析的肽片段的质谱图。
88.图46显示来自患者mel-29的seq id no:45的免疫肽分析的肽片段的质谱图。
89.图47显示来自患者mel-41的免seq id no:48的疫肽分析的肽片段的质谱图。
90.图48显示来自患者mel-41的seq id no:49的免疫肽分析的肽片段的质谱图。
91.图49显示来自患者mel-41的seq id no:50的免疫肽分析的肽片段的质谱图。
92.图50显示来自患者mel-41的seq id no:51的免疫肽分析的肽片段的质谱图。
93.图51显示来自患者mel-21的seq id no:52的免疫肽分析的肽片段的质谱图。
94.图52显示来自患者mel-27的seq id no:53的免疫肽分析的肽片段的质谱图。
95.图53显示来自患者mel-27的seq id no:54的免疫肽分析的肽片段的质谱图。
96.图54小图a至c显示了响应于用特异性肿瘤抗原衍生的肽培养的患者pbmc培养物的肿瘤抗原特异性t细胞扩增。
97.图55小图a至d提供了clt抗原衍生肽(seq id no:11、13-15、19-29、33-35、40-42)的概述,所述肽能够扩增来自黑色素瘤患者pbmc的特异性的携带tcr的t细胞。
98.图56显示了来自正常供血者的针对来自clt抗原1的受hla-a*02:01-限制的肽
(seq id no:16)的cd8t细胞应答。
99.图57显示了来自正常供血者的针对来自clt抗原2的受hla-a*02:01-限制的肽(seq id no:30)的cd8t细胞应答。
100.图58显示了来自正常供血者的针对来自clt抗原4的受hla-a*02:01-限制的肽(seq id no:43)的cd8t细胞应答。
101.图59显示了来自正常供血者的针对来自clt抗原5的受hla-a*03:01-限制的肽(seq id no:47)的cd8t细胞应答。
102.图60显示了来自正常供血者的针对来自clt抗原6的受hla-b*07:02-限制的肽(seq id no:50)的cd8t细胞应答。
103.图61显示了来自正常供血者的针对来自clt抗原7的受hla-a*03:01-限制的肽(seq id no:52)的cd8t细胞应答。
104.图62显示了来自正常供血者的针对来自clt抗原8的受hla-a*02:01-限制的肽(seq id no:55)的cd8t细胞应答。
105.图63小图a至d显示了与来自相同供体的原初cd45ro阴性cd8t细胞相比,在记忆cd45ro阳性cd8t细胞中分别对来自clt抗原1和clt抗原4的受hla-b*07:02限制的肽(seq id no:17和44)的应答性。
106.图64显示扩增的五聚体分选的cd8t细胞杀伤用衍生自clt抗原4的肽(seq id no:44)脉冲的c1rb7靶细胞。
107.图65显示扩增的五聚体分选的cd8t细胞杀伤用clt抗原008(seq idno:8)的开放阅读框转染的caski细胞。
108.图66小图a至g显示了qrt-pcr测定结果以验证黑色素瘤癌细胞系或原代组织样品中编码clt抗原1的clt(seq id no:56)、编码clt抗原2的clt(seq id no:57)、编码clt抗原3和4的clt(seq id no:58)、编码clt抗原5的clt(seq id no:59)、编码clt抗原6的clt(seq id no:60)、编码clt抗原7的clt(seq id no:61)和编码clt抗原8的clt(seq idno:62)的转录。
109.图67示意性地显示了clt抗原融合蛋白1(seq id no:76)的构建,所述接头序列在clt抗原和可能的hla结合接头衍生的表位之间。fp=融合蛋白。
110.图68示意性地显示了clt抗原融合蛋白2(seq id no:77)的构建,所述接头序列在clt抗原和可能的hla结合接头衍生的表位之间。fp=融合蛋白。
111.图69示意性显示了clt抗原融合蛋白3(seq id no:78)的构建,所述接头序列在clt抗原和可能的hla结合接头衍生的表位之间。fp=融合蛋白。
112.图70示意性显示了clt抗原融合蛋白4(seq id no:79)的构建,所述接头序列在clt抗原和可能的hla结合接头衍生的表位之间。fp=融合蛋白。
113.序列描述
114.seq id no:1是clt抗原1的多肽序列
115.seq id no:2是clt抗原2的多肽序列
116.seq id no:3是clt抗原3的多肽序列
117.seq id no:4是clt抗原4的多肽序列
118.seq id no:5是clt抗原5的多肽序列
119.seq id no:6是clt抗原6的多肽序列
120.seq id no:7是clt抗原7的多肽序列
121.seq id no:8是clt抗原8的多肽序列
122.seq id no:9-17是衍生自clt抗原1的肽序列
123.seq id no:18-30是衍生自clt抗原2的肽序列
124.seq id no:31-35是衍生自clt抗原3的肽序列
125.seq id no:36-44是衍生自clt抗原4的肽序列
126.seq id no:45-47是衍生自clt抗原5的肽序列
127.seq id no:48-51是衍生自clt抗原6的肽序列
128.seq id no:52是衍生自clt抗原7的肽序列
129.seq id no:53-55是衍生自clt抗原8的肽序列
130.seq id no:56是编码clt抗原1的clt的cdna序列
131.seq id no:57是编码clt抗原2的clt的cdna序列
132.seq id no:58是编码clt抗原3和4的clt的cdna序列
133.seq id no:59是编码clt抗原5的clt的cdna序列
134.seq id no:60是编码clt抗原6的clt的cdna序列
135.seq id no:61是编码clt抗原7的clt的cdna序列
136.seq id no:62是编码clt抗原8的clt的cdna序列
137.seq id no:63是编码clt抗原1的cdna序列
138.seq id no:64是编码clt抗原2的cdna序列
139.seq id no:65是编码clt抗原3的cdna序列
140.seq id no:66是编码clt抗原4的cdna序列
141.seq id no:67是编码clt抗原5的cdna序列
142.seq id no:68是编码clt抗原6的cdna序列
143.seq id no:69是编码clt抗原7的cdna序列
144.seq id no:70是编码clt抗原8的cdna序列
145.seq id no:71-75是用于构建clt抗原融合蛋白的接头序列
146.seq id no:76为clt抗原融合蛋白1的多肽序列
147.seq id no:77为clt抗原融合蛋白2的多肽序列
148.seq id no:78为clt抗原融合蛋白3的多肽序列
149.seq id no:79为clt抗原融合蛋白4的多肽序列
150.seq id no:80是编码clt抗原融合蛋白1的cdna序列
151.seq id no:81是编码clt抗原融合蛋白2的cdna序列
152.seq id no:82是编码clt抗原融合蛋白3的cdna序列
153.seq id no:83是编码clt抗原融合蛋白4的cdna序列
154.seq id no:84是用于构建clt抗原融合蛋白的接头序列
155.seq id no:85-87是图54所示的tcr vb cdr3 aa序列
具体实施方式
156.抗原池
[0157]“抗原池”是含有两种或更多种抗原(例如,两种、三种、四种、五种、六种、七种、八种抗原等)的池,其中抗原是多肽和/或核酸的形式。抗原池可以是单独的多肽或核酸的池,或单独的多肽和核酸的池。
[0158]
抗原池中的多肽和/或核酸可分别作为融合蛋白和/或编码融合蛋白的核酸的部分存在。术语“融合蛋白”指包含至少两个多肽的任何蛋白质,所述多肽通过蛋白质合成由肽键连接在一起。融合蛋白可以通过连接两个或多个编码单独的多肽的基因来产生,所述基因已经连接,使得它们作为产生单一蛋白的单一单元转录和翻译。
[0159]
因此,本发明提供了包含两种或更多种不同的抗原的抗原池,其中每种抗原以多肽和/或编码所述多肽的核酸的形式存在,并且其中所述不同的抗原作为单独的多肽或核酸和/或作为融合蛋白或编码融合蛋白的核酸的部分存在于所述抗原池中,其中所述两种或更多种不同的抗原具有选自以下的多肽序列:
[0160]
(a)seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段;
[0161]
(b)seq id no:2或其变体或seq id no:2或其变体的免疫原性片段;
[0162]
(c)seq id no:3或其变体,或seq id no:3或其变体的免疫原性片段;
[0163]
(d)seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段;
[0164]
(e)seq id no:5或其变体,或seq id no:5或其变体的免疫原性片段;
[0165]
(f)seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段;
[0166]
(g)seq id no:7或其变体,或seq id no:7或其变体的免疫原性片段;以及
[0167]
(h)seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段。
[0168]
本发明的抗原池可包含两种或更多种、三种或更多种、四种或更多种、五种或更多种、六种或更多种、七种或更多种或八种不同的抗原。本发明的抗原池优选包含两种或更多种抗原。本发明的抗原池可以包含两种、三种、四种、五种、六种、七种或八种不同的抗原。在本发明的一个优选实施方案中,抗原池包含六种不同的抗原。在本发明的另一个优选实施方案中,抗原池包含八种不同的抗原。
[0169]
应当理解,“两种不同的抗原”是指例如抗原(a)和(b)的组合,其中抗原(a)由具有seq id no:1的序列的多肽或其变体、或seq id no:1或其变体的免疫原性片段、或编码所述多肽的多核苷酸表示,并且抗原(b)由具有seq id no:2的序列的多肽或其变体、或seq id no:2或其变体的免疫原性片段、或编码所述多肽的多核苷酸表示。每种抗原可以由一种以上的组分(例如一种以上的多肽或多核苷酸或其组合)表示。对于两种或更多种抗原的任何组合,同样如此。
[0170]
在本发明的一个实施方案中,抗原池包含两种不同的抗原。
[0171]
在本发明的一个实施方案中,抗原池包含三种不同的抗原。
[0172]
在本发明的一个实施方案中,抗原池包含四种不同的抗原。
[0173]
在本发明的一个实施方案中,抗原池包含五种不同的抗原。
[0174]
在本发明的一个实施方案中,抗原池包含六种不同的抗原。
[0175]
在本发明的一个实施方案中,抗原池包含七种不同的抗原。
[0176]
在本发明的一个实施方案中,抗原池包含八种不同的抗原。
[0177]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(a)seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段。
[0178]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(b)seq id no:2或其变体,或seq id no:2或其变体的免疫原性片段。
[0179]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(c)seq id no:3或其变体,或seq id no:3或其变体的免疫原性片段。
[0180]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(d)seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段。
[0181]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(e)seq id no:5或其变体,或seq id no:5或其变体的免疫原性片段。
[0182]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(f)seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段。
[0183]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(g)seq id no:7或其变体,或seq id no:7或其变体的免疫原性片段。
[0184]
在一个实施方案中,抗原池包含多肽(任选地以融合蛋白的形式)或编码具有以下多肽序列的多肽(任选地以融合蛋白的形式)的多核苷酸:(h)seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段。
[0185]
在本发明的一个实施方案中,其中抗原池包含六种不同的抗原,所述六种不同的抗原适当地具有(a)、(b)、(d)、(f)、(g)和(h)的多肽序列。因此,本发明的抗原池包含六种不同的抗原,其中所述抗原具有(a)、(b)、(d)、(f)、(g)至(h)的多肽序列。
[0186]
在本发明的一个实施方案中,其中抗原池包含八种不同的抗原,所述八种不同的抗原适当地具有(a)至(h)的多肽序列。因此,本发明的抗原池包含八种不同的抗原,其中所述抗原具有(a)至(h)的多肽序列。
[0187]
在本发明的一个实施方案中,每种不同的抗原以单独的多肽的形式(即不作为融合蛋白的部分)存在。
[0188]
在本发明的一个实施方案中,每种不同的抗原作为融合蛋白的部分存在。
[0189]
在本发明的一个实施方案中,每种不同的抗原以单独的核酸形式(即不是作为编码融合蛋白的多核苷酸)存在。
[0190]
在本发明的一个实施方案中,每种不同的抗原作为编码融合蛋白的核酸的部分存在。
[0191]
多肽
[0192]
术语“蛋白质”、“多肽”和“肽”在本文中互换地使用并且指任何肽连接的氨基酸
链,无论长度为多少、是否有共翻译或翻译后修饰。
[0193]
术语“氨基酸”指任何一种天然存在的氨基酸,以及按照与天然存在氨基酸相似的方式发挥作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那20种l-氨基酸,以及稍后经修饰的那些氨基酸,例如,羟脯氨酸、γ-羧谷氨酸和o-磷酸丝氨酸。术语“氨基酸类似物”指一种化合物,其具有与天然存在氨基酸相同的基本化学结构,即,与氢、羧基、氨基和r基团结合的α-碳,和r基团,但是与天然氨基酸相比,具有修饰的r基团或修饰的肽主链。示例包括高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基硫鎓和正亮氨酸。氨基酸模拟物指这样的化学化合物,它们具有与氨基酸的一般化学结构不同的结构,但是按照与天然存在氨基酸类似的方式发挥作用的化学化合物。适当地,氨基酸是天然存在的氨基酸或氨基酸类似物,尤其天然存在的氨基酸并且特别是遗传密码编码的那20种l-氨基酸之一。
[0194]
氨基酸可以在本文中通过其公知的三字母符号或通过iupac-iub生物化学命名委员会(iupac-iub biochemical nomenclature commission)推荐的单字母符号提到。同样,核苷酸可以由其通常接受的单字母代码指称。
[0195]
从总体上看,本发明抗原池中存在的抗原多肽序列的变体包含与之具有高程度序列同一性的序列。例如,变体适当地与相关的参考序列在其整个长度范围内具有至少约80%同一性、更优选地至少约85%同一性和最优选地至少约90%同一性(如至少约95%、至少约98%或至少约99%)。
[0196]
适当地,变体是免疫原性变体。某变体在如下情况视为免疫原性变体:例如在采用多肽作为抗原的pbmc或全血体外重刺激分析中(例如,重刺激持续几小时到长达1年(如长达6个月、1天至1个月或1至2周)之间的时间),它引发这样的反应,所述反应是参考序列(即变体是所述参考序列的变体)的活性的至少20%、适当地至少50%和特别地至少75%(如至少90%),其中所述体外重刺激分析借助淋巴细胞增殖(例如,t细胞增殖)、培养物上清液中细胞因子(例如,ifn-γ)产生(通过elisa测量等)或通过胞内和胞外染色(例如,使用对免疫标志物如cd3、cd4、cd8、il2、tnf-α、ifng、1型ifn、cd40l、cd69等特异的抗体),随后以流式细胞仪分析对t-细胞应答表征,测量细胞的活化。
[0197]
变体可以例如是保守性修饰的变体。“保守性修饰的变体”是这样的变体,其中更改导致某氨基酸置换成功能相似的氨基酸或置换/缺失/添加基本上不影响变体的生物学功能的残基。一般,变体的这种生物学功能将诱导针对黑色素瘤(例如皮肤黑色素瘤)癌症抗原的免疫应答。
[0198]
本领域熟知提供功能相似的氨基酸的保守性置换表。变体可以包括在其他物种中存在的多肽同源物。
[0199]
与参考序列相比时,本发明抗原池中存在的抗原可以包含具有变体序列的多肽,所述变体序列含有多个置换,例如,保守性置换(例如,1-25个,如1-10个、尤其1-5个并且尤其1个氨基酸残基可以改变)。置换(例如,保守性置换)的数目可以是参考序列的残基数目的直至20%,例如,直至10%例如,直至5%例如,直至1%。通常,保守性置换将落于下文指定的氨基酸分组之一的范围内,不过在一些情况下,其他置换可以是有可能的,同时不大幅度影响抗原的免疫原性特性。以下八个组各自含有一般彼此互为保守性置换的氨基酸:
[0200]
1)丙氨酸(a)、甘氨酸(g);
[0201]
2)天冬氨酸(d)、谷氨酸(e);
[0202]
3)天冬酰胺(n)、谷氨酰胺(q);
[0203]
4)精氨酸(r)、赖氨酸(k);
[0204]
5)异亮氨酸(我)、亮氨酸(l)、甲硫氨酸(m)、缬氨酸(v);
[0205]
6)苯丙氨酸(f)、酪氨酸(y)、色氨酸(w);
[0206]
7)丝氨酸(s)、苏氨酸(t);和
[0207]
8)半胱氨酸(c)、甲硫氨酸(m)
[0208]
(参见,例如,creighton,proteins 1984)。
[0209]
适当地,这类置换不改变表位的免疫结构(例如,它们不出现在如一级序列中所定位的表位区域内部),并且因此不显著影响抗原的免疫原性特性。
[0210]
多肽变体还包括其中与参考序列相比,插入额外氨基酸的那些变体,例如,这类插入可以涉及在1-10个位置(如1-5个位置,适当地1或2个位置,尤其1个位置),并且可以例如包括在每个位置添加50个或更少(如20个或更少、尤其10个或更少、特别地5个或更少)的氨基酸。适当地,这类插入不出现在表位的区域内,并且因此不显著影响抗原的免疫原性特性。一个插入示例包括辅助表达和/或纯化所讨论抗原的短段组氨酸残基(例如,2-6个残基)。
[0211]
多肽变体包括其中与参考序列相比,已经缺失氨基酸的那些变体,例如,这类缺失可以出现在1-10个位置(如1-5个位置,适当地1或2个位置,尤其1个位置),并且可以例如涉及在每个位置删除50个或更少(如20个或更少、尤其10个或更少、特别地5个或更少)的氨基酸。适当地,这类缺失不出现在表位的区域内,并且因此不显著影响抗原的免疫原性特性。
[0212]
本领域普通技术人员将认识到,特定的蛋白质变体可以包含置换、缺失和添加(或其任意组合)。例如,置换/缺失/添加可能增强与所需的患者hla分子结合(或对其具有中性影响),从而可能增加免疫原性(或保持免疫原性不改变)。
[0213]
本发明抗原池中存在的抗原性多肽序列的免疫原性片段一般将包含至少9个(例如,至少9或10个)来自全长多肽序列的连续氨基酸,如至少12个连续氨基酸(例如,至少15或至少20个连续氨基酸),尤其至少50个连续氨基酸,如至少100个连续氨基酸(例如至少200个连续氨基酸),这取决于clt抗原的长度。适当地,免疫原性片段将是全长多肽序列的长度的至少10%,如至少20%,如至少50%、如至少70%或至少80%。
[0214]
免疫原性片段一般包含至少一个表位。表位包括b细胞表位和t细胞表位,并且适当地,免疫原性片段包含至少一个t细胞表位如cd4+t细胞表位或cd8+t细胞表位。
[0215]
t细胞表位是与hla分子结合时为t细胞(例如,cd4+t细胞或cd8+t细胞)识别的邻接氨基酸短段。可以通过本领域技术人员充分已知的表位定位实验实现t细胞表位的鉴定(参见,例如,paul,fundamental immunology,第3版,243-247(1993);beiβbarth等人,2005,bioinformatics,21(suppl.1):i29-i37)。
[0216]
作为癌症中决定性参与t-细胞应答的结果,很明显seq id no:1-8的全长多肽的含有至少一个t细胞表位的片段可以有免疫原性并且可以有助于免疫保护。
[0217]
应当理解在多样性远系繁殖的群(如人类)中,不同的hla型意味着特定表位可以不为群的全部成员所识别。因此,为了最大限度增加识别水平和针对多肽的免疫应答的规模,通常合乎需要的是,免疫原性片段含有来自全长序列的多个表位(适当地在clt抗原内
部的全部表位)。
[0218]
seq id no:1-8的多肽的可能有用的特定片段包括那些含有至少一个cd8+ t细胞表位、适当地至少两个cd8+ t细胞表位和尤其全部cd8+ t细胞表位的片段,尤其与多个hla等位基因相关的那些片段,例如,与2、3、4、5个或更多个等位基因相关的那些片段。seq id no:1-8的多肽的可能有用的特定片段包括那些含有至少一个cd4+ t细胞表位、适当地至少两个cd4+ t细胞表位和尤其全部cd4+ t细胞表位的片段(尤其与多个hla等位基因相关的那些片段,例如,与2、3、4、5个或更多个等位基因相关的那些片段)。然而,设计疫苗的技术人员可能将外源cd4+ t细胞表位与cd8+ t细胞表位组合并且实现针对cd8+ t细胞表位的所需应答。
[0219]
如若当使用全长多肽的独立片段,则这个片段在如下情况视为有免疫原性:它引发这样的反应,所述反应是参考序列(即片段是所述参考序列的片段)的活性(例如在采用多肽作为抗原的pbmc或全血体外重刺激分析中(例如,重刺激持续几小时到长达1年(如长达6个月、1天至1个月或1至2周)之间的时间)的活性)的至少20%、适当地至少50%和尤其至少75%(如至少90%),其中所述体外重刺激分析借助淋巴细胞增殖(例如,t细胞增殖)、培养物上清液中细胞因子(例如,ifn-γ)产生(通过elisa测量等)或通过胞内和胞外染色(例如,使用对免疫标志物如cd3、cd4、cd8、il2、tnf-α、ifn-γ、1型ifn、cd40l、cd69等特异的抗体),随后以流式细胞仪分析对t-细胞应答表征,测量细胞的活化。
[0220]
在一些情况下,全长多肽的多个片段(它们可以重叠或可以不重叠并且可以覆盖或可以不覆盖全长序列整体)可以用来获得针对全长序列本身的等同生物学反应。例如,如上文所述的至少两个免疫原性片段(如三个、四个或五个),组合时提供参考序列在pbmc或全血体外重刺激分析(例如,t细胞增殖和/或ifn-γ生成分析)中的活性的至少50%、适当地至少75%和尤其至少90%。
[0221]
seq id no:1-8的抗原性多肽的示例性免疫原性片段,和因此本发明融合蛋白的示例性组分肽,包括包含seq id no:9-55的序列或由其组成的多肽。seq id no:9-12,18-19,30,31-32和37-39,45,48-54的序列通过免疫肽分析鉴定为与hla i类分子结合(参见实施例2)。通过netmhc软件预测seq idno:13-17、20-29、33-35、40-44的序列与hla i类分子结合并用于免疫学验证试验(参见实施例3、4和5)。
[0222]
本发明的抗原池中存在的抗原性多肽(a)可以包含seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:9-12中任一个或由其组成。进一步的示例性片段包含seq id no:9-12中的两个、三个或四个,进一步的示例性片段包含seq id no:13-17中的任一个或由其组成。进一步的示例性片段包含seq id no:9-17中的全部(考虑可能的序列重叠,使得任何重叠序列不需要存在多于一次)。
[0223]
本发明的抗原池中存在的抗原性多肽(b)可以包含seq id no:2或其变体,或seq id no:2或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:18或seq id no:19或由其组成。进一步的示例性片段包含seq id no:18和seq id no:19。进一步的示例性片段包含seq id no:20-30中的任何一个或由其组成。进一步的示例性片段包含seq id no:18-30的全部(考虑可能的序列重叠,使得任何重叠序列不需要存在多于一次)。
[0224]
本发明的抗原池中存在的抗原性多肽(c)可以包含seq id no:3或其变体,或seq id no:3或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:31或由其组
成。进一步的示例性片段包含seq id no:31。进一步的示例性片段包含seq id no:32-35中的任一个或由其组成。进一步的示例性片段包含seq id no:31和seq id no:32。进一步的示例性片段包含seq idno:31-35中的全部(考虑可能的序列重叠,使得任何重叠序列不需要存在多于一次)。
[0225]
本发明的抗原池中存在的抗原性多肽(d)可以包含seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:36或由其组成。进一步的示例性片段包含seq id no:37或seq id no:38或由其组成。进一步的示例性片段包含seq id no:39或由其组成。进一步的示例性片段包含seq id no:40-44中的任何一个或由其组成。进一步的示例性片段包含seq id no:36和seq id no:37或seq id no:38中的任何一个。进一步的示例性片段包含seq id no:39和seq id no:37或seq idno:38中的任何一个。进一步的示例性片段包含seq id no:36-44中的全部(考虑可能的序列重叠,使得任何重叠序列不需要存在多于一次)。
[0226]
本发明的抗原池中存在的抗原性多肽(e)可以包含seq id no:5或其变体,或seq id no:5或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:45-47中任一个或由其组成。
[0227]
本发明的抗原池中存在的抗原性多肽(f)可以包含seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:48-51或由其组成。
[0228]
本发明的抗原池中存在的抗原性多肽(g)可以包含seq id no:7或其变体,或seq id no:7或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:52或由其组成。
[0229]
本发明的抗原池中存在的抗原性多肽(h)可以包含seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段,或由其组成。示例性片段包含seq id no:53-55或由其组成。
[0230]
核酸
[0231]
提供了编码存在于本发明的抗原池中的抗原性多肽序列和/或融合蛋白的核酸(称为本发明的核酸)。
[0232]
术语“核酸”和“多核苷酸”在本文中互换地使用并且指从核苷酸单体、尤其脱氧核糖核苷酸单体或核糖核苷酸单体产生的聚合大分子。该术语涵盖含有已知的核苷酸类似物或已修饰的主链残基或键的核酸,所述核酸是天然存在和非天然存在的,具有与参考核酸相似的特性,并且意图按照与参考核苷酸类似的方式代谢或意图在系统中具有延长的半衰期。这类类似物的示例包括而不限于硫代磷酸酯、磷酰胺酯、甲基膦酸酯、手性-甲基膦酸酯、2'-o-甲基核糖核苷酸、肽核酸(pna)。适当地,术语“核酸”指脱氧核糖核苷酸单体或核糖核苷酸单体的天然存在聚合物。适当地,本发明的核酸分子是重组的。重组意指核酸分子是克隆步骤、限制酶切步骤或连接步骤中至少一者的产物或产生与自然界中存在的核酸分子迥异的核酸分子(例如,在cdna的情况下)的其他方法的产物。在一个实施方案中,本发明的核酸是人工核酸序列(例如,具有非自然存在的密码子选择的cdna序列或核酸序列)。在一个实施方案中,本发明的核酸是dna。或者,本发明的核酸是rna。
[0233]
dna(脱氧核糖核酸)和rna(核糖核酸)指具有糖部分的主链的核酸分子,所述糖部
分分别是脱氧核糖基部分和核糖基部分。糖部分可以连接于碱基,后者是4种天然碱基(dna中腺嘌呤(a)、鸟嘌呤(g)、胞嘧啶(c)和胸腺嘧啶(t)并且rna中腺嘌呤(a)、鸟嘌呤(g)、胞嘧啶(c)和尿嘧啶(u))。如本文所用,“相应rna”是除dna中的胸腺嘧啶(t)置换成rna中的尿嘧啶(u)之外,与参考dna具有相同序列的rna。糖部分也可以连接于非天然碱基如肌苷、黄苷、7-甲基鸟苷、二氢尿苷和5-甲基胞苷。糖(脱氧核糖基/核糖基)部分之间的天然磷酸二酯键可以任选地以硫代磷酸酯键替换。适当地,本发明的核酸由天然碱基组成,所述天然碱基与具有介于糖部分之间磷酸二酯键的脱氧核糖基主链或核糖基糖主链连接。
[0234]
本发明的核酸可以是dna。例如,该核酸包含选自seq id no:56-62和63-70的序列或由其组成。还提供一种核酸,其包含选自seq id no:56-62或63-70的序列的变体或由其组成,所述变体编码相同的氨基酸序列但基于遗传密码简并性,具有不同的核酸。
[0235]
因此,遗传密码简并性,众多不同的但功能相同的核酸可以编码任何给定的多肽。例如,密码子gca、gcc、gcg和gcu均编码氨基酸丙氨酸。因而,在其中丙氨酸由某个密码子指定的每个位置,可以将该密码子变成任一个所述的相应密码子,而不改变编码的多肽。这种核酸变种导致“沉默性”(有时称作“简并”或“同义”)变体,这些变体是一个种类的保守性修饰的变异。本文公开的编码多肽的每个核酸序列也使核酸的每种可能沉默变异成为可能。技术人员将认识到,可以修饰核酸中的每个密码子(例外是aug,它通常是甲硫氨酸的唯一密码子,和ugg,它通常是色氨酸的唯一密码子)以产生功能相同的分子。因此,编码多肽的核酸的每种沉默性变异内含于每个描述的序列中并且作为本发明的一个方面提供。
[0236]
还可以通过产生其中一个或多个选择的(或全部)密码子的第三位置用混合型碱基和/或脱氧肌苷残基置换的序列,实现简并密码子置换(batzer等人,1991,nucleic acid res.19:5081;ohtsuka等人,1985,j.biol.chem.260:2605-2608;rossolini等人,1994,mol.cell.probes 8:91-98)。
[0237]
与参考序列相比时,包含选自seq id no:56-62和63-70的序列或由其组成的本发明的核酸可以含有多个沉默性变异(例如,1-50个,如1-25个、尤其1-5个并且尤其1个密码子可以改变)。
[0238]
在本发明的一个实施方案中,核酸是rna,例如mrna。提供rna序列,其对应于本文提供的dna序列并且具有核糖核苷酸主链,而非脱氧核糖核苷酸主链并且具有侧链碱基尿嘧啶(u)替代胸腺嘧啶(t)。
[0239]
因此,与参考序列相比时,本发明的核酸包含选自seq id no:56-62或63-70的cdna序列的rna等同物或由其组成,并且可以含有多个沉默性变异(例如,1-50个,如1-25个、尤其1-5个并且尤其1个密码子可以改变)。“rna等同物”意指一种rna序列,其含有与参考cdna序列相同的遗传信息(即含有相同的密码子,同时具有核糖核苷酸主链,而非脱氧核糖核苷酸主链,并且具有替代胸腺嘧啶(t)的侧链碱基尿嘧啶(u))。
[0240]
本发明还包含与前述cdna序列和rna序列互补的序列。
[0241]
针对人类宿主细胞中的表达对核酸可以进行密码子优化。
[0242]
核酸可以能在dna核酸的情况下被转录和翻译成本发明的多肽,并且在rna核酸的情况下被翻译成本发明的多肽。
[0243]
多肽和核酸
[0244]
适当地,分离本发明中所用的多肽和核酸。“分离的”多肽或核酸是从其原始环境
取出的那种。例如,如果天然存在的多肽或核酸与天然体系中的一些或全部共存物质分离,则它是分离的。例如,如果将核酸克隆至不是其天然环境的部分的载体中,则核酸视为分离的。
[0245]
当提及参考多肽或核酸序列时使用时,“天然存在的”意指自然界中存在并且未按合成方式修饰的序列。
[0246]
当提及参考多肽或核酸序列时使用时,“人工”意指不在自然界中存在的序列,其中所述序列例如是天然序列的合成修饰物或含有非天然序列。
[0247]
当用于提及一个核酸或多肽与另一个核酸或多肽的关系时,术语“异源”表示两个或更多个序列并不以彼此在自然界中相同的关系存在。“异源”序列还可以意指这样的序列,其不分离自、衍生自或基于宿主生物中存在的天然存在的核酸或多肽序列。
[0248]
如上文所示,本发明的抗原池中存在的抗原性多肽序列的变体可以优选地与相关的参考序列在其整个长度范围内具有至少约80%同一性、更优选地至少约85%同一性和最优选地至少约90%同一性(如至少约95%、至少约98%或至少约99%)。
[0249]
出于比较两个密切相关的多肽序列或多核苷酸序列的目的,可以计算第一序列和第二序列之间的“序列同一性%”。如果多肽序列在其整个长度范围共有100%序列同一性,则多肽序列据称与其他多肽序列相同或同一。顺序中的残基从左至右即从多肽的n末端至c末端编号。在两个或更多个多肽序列的情况下,术语“相同”或“同一性”百分数指为了比较窗口范围内的最大对应性而比较并且对齐时,相同或具有指定百分数的相同氨基酸残基(即,在指定的区域范围内70%同一性,任选地75%、80%、85%、90%、95%、98%或99%同一性)的两个或更多个序列或子序列。适当地,在与参考序列的整个长度对应的窗口范围内进行比较。
[0250]
对于序列比较,一个序列充当与测试序列比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,或可以指定备选参数。基于程序参数,序列比较算法随后相对于参考序列计算测试序列的序列同一性百分数。
[0251]
如本文所用,“比较窗口”指一个区段,其中一个序列可以与具有相同连续位置数的参考序列在最佳对齐这两个序列后比较。本领域熟知用于比较的序列对齐方法。用于比较的最佳序列比对可以这样进行,例如通过smith和waterman,1981,adv.appl.math.2:482的局部同源性算法、通过needleman和wunsch,1970,j.mol.biol.48:443的同源性比对算法、通过pearson和lipman,1988,proc.nat’l.acad.sci.usa 85:2444的相似性搜索方法、通过这些算法的计算机化执行(wisconsin genetics软件包中的gap、bestfit、fasta和tfasta,genetics computer group,575science dr.,madison,wi)或通过手工比对和目视审查(参见,例如,current protocols in molecular biology(ausubel等人编著,1995增补))。
[0252]
一个有用算法的示例是pileup。使用累进配对比对法,pileup从一组相关的序列中产生多重序列比对结果,以显示关系和序列同一性百分数。它也绘制进化树或树状图,后者显示用来产生该比对结果的聚类关系。pileup使用feng和doolittle累进比对法(feng和doolittle,1987,j.mol.evol.35:351-360)的简化形式。所用方法类似于higgins和sharp,1989,cabios 5:151-153描述的方法。该程序可以对齐多达300个序列,每者最大长度为5,
000个核苷酸或氨基酸。多重比对程序始于两两对齐两个最相似的序列,产生两个已对齐序列的聚类。这个聚类随后与下一个最相关的序列或已对齐序列的聚类对齐。通过单纯延长两个独立序列的两两对齐结果,对齐两个序列聚类。通过一系列递进的两两对齐实现最终对齐。通过为序列比较区域指定具体序列及其氨基酸坐标并通过指定程序参数,运行该程序。使用pileup,将参考序列与其他测试序列比较以使用以下参数,确定序列同一性百分数关系:默认空位权重(3.00)、默认缺口长度权重(0.10)和加权末端空位。pileup可以从gcg序列分析软件包获得,例如,版本7.0(devereaux等人,1984,nuc.acids res.12:387-395)。
[0253]
另一个适用于确定序列同一性和序列相似性百分数的算法示例是blast算法和blast 2.0算法,它们分别在altschul等人,1977,nuc.acids res.25:3389-3402以及altschul等人,1990,j.mol.biol.215:403-410中描述。用于执行blast分析的软件是通过国家生物技术信息中心可公开获得的(网站地址:www.ncbi.nlm.nih.gov/)。这种算法涉及首先通过确定查询序列中长度为w的短字,鉴定高评分序列对(hsp),其中与数据库序列中具有相同长度的字比对时,所述短字匹配或满足某些正值阈评分t。t称作相邻字评分阈值(altschul等人,上文)。这些初始相邻字命中充当种子,所述种子用于启动检索以找到含有这些种子的更长hsp。所述字命中在两个方向沿每个序列尽可能远地延伸,只要可以提高累积比对评分。对于核苷酸序列,使用参数m(一对匹配残基的报酬评分;总是》0)和n(错配残基的惩罚评分;总是《0)计算累积评分。对于氨基酸序列,使用评分矩阵计算累积评分。字命中在每个方向上的延伸在以下情况时停止:累积比对评分从其最大实现值下降达到量x;累积评分因积累一个或更多负评分残基比对结果而达到或低于零;或抵达两个序列中任一序列的末端。对于氨基酸序列,blastp程序使用字长度3和期望(e)10,以及blosum62评分矩阵(参见henikoff和henikoff,1989,proc.natl.acad.sci.usa 89:10915)、比对结果(b)50、期望(e)10、m=5、n=-4和两条链的比较作为默认。
[0254]
blast算法也执行两个序列之间相似性的统计分析(参见,例如,karlin和altschul,1993,proc.nat’l.acad.sci.usa 90:5873-5787)。由blast算法提供的相似性的一种度量是最小总和概率(p(n)),其提供两个核苷酸序列或氨基酸序列之间的匹配会因偶然发生的概率指示。
[0255]
序列之间的“差异”指与第一序列相比,单个残基在第二序列的位置中的插入、缺失或置换。两个序列可以含有一个、两个或更多个这类差异。否则与第一序列相同(100%序列同一性)的第二序列中的插入、缺失或置换导致序列同一性%降低。例如,如果相同序列长9个残基,则第二序列中的一个置换产生88.9%的序列同一性。如果相同序列长17个氨基酸残基,则第二序列中的两个置换产生88.2%的序列同一性。
[0256]
或者,出于比较第一参考序列与第二比较序列的目的,可以确定为产生第二序列对第一序列所做的添加、置换和/或缺失的数目。添加是向第一序列中添加一个残基(包括在第一序列的任一末端添加)。置换是将第一序列中的一个残基置换成一个不同的残基。缺失是从第一序列缺失一个残基(包括在第一序列的任一末端缺失)。
[0257]
融合蛋白(融合多肽)
[0258]
术语“融合蛋白”指包含至少两个多肽的任何蛋白质,所述多肽通过蛋白质合成由肽键连接在一起。融合蛋白可以通过连接两个或多个编码单独的多肽的基因来产生,所述基因已经连接,使得它们作为产生单一蛋白的单一单元转录和翻译。
[0259]
本发明提供了包含两种或更多种不同的抗原的抗原池,其中所述不同的抗原作为融合蛋白的部分存在于所述抗原池中。预期融合蛋白具有本文所述的效用,并且与单独的组分多肽相比,可能具有优越的免疫原性或预防或治疗效果(包括增加应答的广度和深度)的优点,并且在远系繁殖的群中可能是特别有价值的。
[0260]
存在于抗原池融合蛋白中的抗原性多肽可以以从n端到c端的各种顺序排列。融合蛋白中多肽的设计和顺序描述于实施例8中。特别地,融合蛋白中多肽的顺序是重要的,因为这样的顺序在一些情况下可以导致多肽的期望免疫原性肽区域的优异加工和呈递,并且在其他情况下对于最佳融合设计是必需的,以降低以下的可能性:非天然免疫原性肽(其衍生自天然癌症特异性clt抗原之间的连接)在接种期间可能被呈递于表面展示的i类hla分子上,从而引发不希望的t细胞应答。
[0261]
融合蛋白提供了对组分clt抗原的强抗原性应答,参见实施例9和10,并且预期引发对它们的连接区的最小抗原性应答,参见实施例8。
[0262]
序列(a)至(h)中的任何一个都可能在去除起始n末端甲硫氨酸的情况下被配置。因此,一种或多种抗原性多肽可以包含缺乏n端甲硫氨酸的多肽序列。
[0263]
在一个实施方案中,其中融合蛋白包含六种抗原性多肽(a)、(b)、(d)、(f)、(g)和(h)。
[0264]
在一个实施方案中,本发明的融合蛋白可包含具有seq id no:2的多肽序列减去n-末端甲硫氨酸残基的抗原性多肽。在一个实施方案中,本发明的融合蛋白包含具有seq id no:6的氨基酸序列减去n末端甲硫氨酸残基的抗原性多肽。在一个实施方案中,本发明的融合蛋白包含具有seq id no:5的氨基酸序列减去n末端甲硫氨酸残基的抗原性多肽。在一个实施方案中,本发明的融合蛋白包含具有seq id no:2的氨基酸序列减去n末端甲硫氨酸残基的氨基酸序列的抗原性多肽、具有seq id no:6减去n末端甲硫氨酸残基的氨基酸序列的抗原性多肽和具有seq id no:5减去n末端甲硫氨酸残基的氨基酸序列的抗原性多肽。
[0265]
当融合蛋白包含六种不同的抗原,其中抗原具有多肽序列(a)、(b)、(d)、(f)、(g)和(h)时,多肽(a)、(b)、(d)、(f)、(g)和(h)可具有以下多肽序列:
[0266]
(a)具有或不具有n-末端甲硫氨酸残基的seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段;
[0267]
(b)具有或不具有n-末端甲硫氨酸残基的seq id no:2或其变体,或seq id no:2或其变体的免疫原性片段;
[0268]
(d)具有或不具有n-末端甲硫氨酸残基的seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段;
[0269]
(f)具有或不具有n-末端甲硫氨酸残基的seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段;
[0270]
(g)具有或不具有n-末端甲硫氨酸残基的seq id no:7或其变体,或seq id no:7或其变体的免疫原性片段;
[0271]
(h)具有或不具有n-末端甲硫氨酸残基的seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段。
[0272]
在一个实施方案中,六种抗原性多肽以(a)、(b)、(f)、(g)、(d)和(h)的n至c的顺序排列。
[0273]
在一个合适的实施方案中,所述六种抗原性多肽具有seq id no:1-2、4、6-8的序列,并且以seq id no:1、seq id no:2、seq id no:6、seq idno:7、seq id no:4和seq id no:8的n至c的顺序排列。如上所述,可以任选地使用其中n-末端甲硫氨酸被省略的相应序列。
[0274]
例如,本发明的融合蛋白包含六种抗原性多肽(a)、(b)、(d)、(f)、(g)和(h),其中抗原性多肽(a)、(b)、(d)、(f)、(g)和(h)具有以下氨基酸序列:
[0275]
(a)seq id no:1;
[0276]
(b)seq id no:2减去n-末端甲硫氨酸残基;
[0277]
(d)seq id no:4;
[0278]
(f)seq id no:6;
[0279]
(g)seq id no:7;以及
[0280]
(h)seq id no:8。
[0281]
因此,适当地,seq id no:1存在于n末端,且seq id no:8存在于c末端。适当地,seq id no:2的n-末端甲硫氨酸被省略。在本发明的一个实施方案中,所述融合蛋白具有seq id no:76的序列。
[0282]
在另一个实施方案中,当融合蛋白包含六种抗原性多肽(a)、(b)、(d)、(f)、(g)和(h)时,六种抗原性多肽以(f)、(h)、(g)、(b)、(d)和(a)的从n至c的顺序排列。
[0283]
在一个合适的实施方案中,所述六种抗原性多肽具有seq id no:1-2、4、6-8的序列,并以seq id no:6、seq id no:8、seq id no:7、seq id no:2、seq id no:4和seq id no:1的n至c的顺序排列。如上所述,可以任选地使用其中n-末端甲硫氨酸被省略的相应序列。因此,适当地,seq id no:6存在于n末端,而seq id no:1存在于c末端。适当地,seq id no:2的n-末端甲硫氨酸被省略。在本发明的一个实施方案中,所述融合蛋白具有seq id no:77的序列。
[0284]
在另一个实施方案中,融合蛋白包含八种抗原性多肽(a)至(h)。
[0285]
当融合蛋白包含八种不同的抗原,其中所述抗原具有多肽序列(a)至(h)时,多肽(a)至(h)可具有以下多肽序列:
[0286]
(a)具有或不具有n-末端甲硫氨酸残基的seq id no:1或其变体,或seq id no:1或其变体的免疫原性片段;
[0287]
(b)具有或不具有n-末端甲硫氨酸残基的seq id no:2或其变体,或seq id no:2或其变体的免疫原性片段;
[0288]
(c)具有或不具有n-末端甲硫氨酸残基的seq id no:3或其变体,或seq id no:3或其变体的免疫原性片段;
[0289]
(d)具有或不具有n-末端甲硫氨酸残基的seq id no:4或其变体,或seq id no:4或其变体的免疫原性片段;
[0290]
(e)具有或不具有n-末端甲硫氨酸残基的seq id no:5或其变体,或seq id no:5或其变体的免疫原性片段;
[0291]
(f)具有或不具有n-末端甲硫氨酸残基的seq id no:6或其变体,或seq id no:6或其变体的免疫原性片段;
[0292]
(g)具有或不具有n-末端甲硫氨酸残基的seq id no:7或其变体,或seq id no:7
或其变体的免疫原性片段;
[0293]
(h)具有或不具有n-末端甲硫氨酸残基的seq id no:8或其变体,或seq id no:8或其变体的免疫原性片段。
[0294]
在一个实施方案中,八种抗原性多肽以(a)、(b)、(c)、(g)、(d)、(e)、(f)和(h)的n至c的顺序排列。
[0295]
在一个合适的实施方案中,所述八种抗原性多肽具有seq id no:1-8的序列,并以seq id no:1、seq id no:2、seq id no:3、seq id no:7、seq id no:4、seq id no:5、seq id no:6和seq id no:8的n至c的顺序排列。如上所述,可以任选地使用其中n-末端甲硫氨酸被省略的相应序列。
[0296]
例如,本发明的融合蛋白包含八种抗原性多肽(a)至(h),其中抗原性多肽(a)至(h)具有以下氨基酸序列:
[0297]
(a)seq id no:1;
[0298]
(b)seq id no:2减去n-末端甲硫氨酸残基;
[0299]
(c)seq id no:3;
[0300]
(d)seq id no:4;
[0301]
(e)seq id no:5减去n-末端甲硫氨酸残基;
[0302]
(f)seq id no:6减去n-末端甲硫氨酸残基;
[0303]
(g)seq id no:7;以及
[0304]
(h)seq id no:8。
[0305]
适当地,seq id no:1存在于n-末端,且seq id no:8存在于c-末端。适当地,seq id no:2的n-末端甲硫氨酸被省略。适当地,seq id no:6的n-末端甲硫氨酸被省略。适当地,seq id no:5的n-末端甲硫氨酸被省略。在本发明的一个实施方案中,所述融合蛋白具有seq id no:78的序列。
[0306]
在另一个实施方案中,当融合蛋白包含八种抗原性多肽(a)至(h)时,八种抗原性多肽以(f)、(c)、(a)、(e)、(d)、(h)、(g)和(b)的n至c的顺序排列。
[0307]
在一个合适的实施方案中,所述八种抗原性多肽具有seq id no:1-8的序列,并以seq id no:6、seq id no:3、seq id no:1、seq id no:5、seq id no:4、seq id no:8、seq id no:7和seq id no:2的n至c的顺序排列。如上所述,可以任选地使用其中n-末端甲硫氨酸被省略的相应序列。
[0308]
例如,本发明的融合蛋白包含八种抗原性多肽(a)至(h),其中抗原性多肽(a)至(h)具有以下氨基酸序列:
[0309]
(a)seq id no:1;
[0310]
(b)seq id no:2减去n-末端甲硫氨酸残基;
[0311]
(c)seq id no:3;
[0312]
(d)seq id no:4;
[0313]
(e)seq id no:5;
[0314]
(f)seq id no:6;
[0315]
(g)seq id no:7;以及
[0316]
(h)seq id no:8。
[0317]
适当地,seq id no:6存在于n末端,且seq id no:2存在于c末端。适当地,seq id no:2的n-末端甲硫氨酸被省略。在本发明的一个实施方案中,所述融合蛋白具有seq id no:79的序列。
[0318]
本发明的融合蛋白可以与第二种或另外的多肽融合,所述多肽选自(i)其他多肽,其为黑色素瘤相关抗原;(ii)能够增强免疫应答的多肽序列(即免疫刺激物序列);和(iii)多肽序列,例如包含通用cd4辅助表位,其能够提供强cd4+帮助以增加cd8+ t细胞对抗原表位的应答。
[0319]
示例性融合多肽包含选自(a)至(h)的序列的两种或更多种(例如两种、三种、四种、五种、六种、七种或八种)序列。
[0320]
本发明还提供编码上述融合蛋白的核酸。
[0321]
接头
[0322]
本发明提供了包含两种或更多种不同的抗原的抗原池,其中所述两种或更多种不同的抗原可以作为融合蛋白和/或编码所述融合蛋白的核酸的部分存在于所述抗原池中。当存在于融合蛋白或编码所述融合蛋白的核酸中时,两种或更多种不同的抗原通过位于抗原性多肽序列之间的一个或多个肽接头或间隔区连接在一起。本发明的抗原池中存在的抗原性多肽序列可以通过一个或多个接头(例如两个、三个、四个、五个、六种或七个接头)连接在一起。接头可以分开存在于本发明的抗原池中的每种抗原性多肽序列。接头可以是“内部的”,即接头不存在于融合蛋白的第一个多肽的n末端和最后一个多肽的c末端。因此,在本发明的一个实施方案中,当两种或更多种不同的抗原存在于融合蛋白或编码融合蛋白的核酸中时,两种或更多种不同的抗原通过位于抗原性多肽序列之间的一个或多个肽接头连接在一起。
[0323]
一个或多个接头可以位于(a)和(b)、(b)和(f)、(f)和(g)、(g)和(d)、(d)和(h)之间。在本发明的另一个实施方案中,所述一个或多个接头位于(f)和(h)、(h)和(g)、(g)和(b)、(b)和(d)、(d)和(a)之间。在本发明的另一个实施方案中,接头位于(a)和(b)、(b)和(c)、(c)和(g)、(g)和(d)、(d)和(e)、(e)和(f)、(f)和(h)之间。在本发明的另一个实施方案中,接头位于(a)和(b)、(b)和(d)、(d)和(f)、(f)和(g)、(g)和(h)之间。在本发明的另一个实施方案中,接头位于(f)和(c)、(c)和(a)、(a)和(e)、(e)和(d)、(d)和(h)、(h)和(g)、(g)和(b)之间。
[0324]
接头可以指编码接头肽序列的cdna或编码的肽。通过产生单一构建体将接头置于本发明的每种融合蛋白的单个抗原之间,其中接头序列插入一个抗原性多肽的c末端和下一个抗原性多肽的n末端之间,从而将融合蛋白的抗原性多肽连接在一起。融合蛋白中使用的各个接头可以具有相同的序列,或者它们可以具有不同的序列。在本发明的一个实施方案中,所述接头包含选自seq id no:71-75和84的序列或由其组成。
[0325]
在本发明的一个实施方案中,所述融合蛋白包含选自seq id no:76-79的序列或由其组成。
[0326]
接头可以是基于甘氨酸的接头,其也可以包括赖氨酸,所述接头在长度为3至6个氨基酸的连接体中(参见seq id no:71-75和84)。本发明的接头降低了引入含有接头本身的不需要的免疫原性表位的风险;它们还防止了由单个抗原性多肽的直接融合产生的不需要的表位。
[0327]
融合蛋白可以通过连接三个或更多个编码单独的抗原性多肽序列的基因(例如三个、四个、五个、六种、七个、八个、九个、十个、十一个、十二个、十三个、十四个、十五个)和其已经被连接的编码接头的cdna来产生,使得所得的开放阅读框作为产生单一蛋白的单一单位被转录和翻译。编码本发明融合蛋白的核酸可包含选自seq id no:80-83。
[0328]
产生本发明的多肽
[0329]
可以使用例如green和sambrook 2012molecular cloning:a laboratory manual第4版cold spring harbour laboratory press中公开的技术,获得和操作本发明的抗原池中存在的抗原性多肽序列。尤其,人工基因合成法可以用来产生多核苷酸(nambiar等人,1984,science,223:1299-1301;sakamar和khorana,1988,nucl.acids res.,14:6361-6372;wells等人,1985,gene,34:315-323以及grundstrom等人,1985,nucl.acids res.,13:3305-3316),随后在合适的生物中表达以产生多肽。可以例如通过固相dna合成法,合成地产生编码本发明抗原池中存在的抗原性多肽的基因。完整基因可以从头合成,无需前体模板dna。为了获得想要的寡核苷酸,使结构单元按产物序列所要求的顺序依次偶联于生长中的寡核苷酸链。当完成链组装时,产物从固相释放至溶液,去保护,并收集。可以通过高效液相色谱法(hplc)分离产物以获得高纯度的所需寡核苷酸(verma和eckstein,1998,annu.rev.biochem.67:99-134)。通过使用多种基因扩增方法(methods mol biol.,2012;834:93-109),将这些相对短的区段轻易地组装成适合用于无数基于重组dna的表达系统中的更长dna分子。在本发明的背景下,本领域技术人员将理解,本发明中所述的编码多肽抗原的多核苷酸序列可以轻易地用于多种疫苗产生系统中,所述系统例如包括病毒载体。
[0330]
出于在微生物(例如,细菌或真菌)宿主中产生本发明的抗原池中存在的多肽的目的,本发明核酸将包含合适的调节与控制序列(包括启动子、终止信号等)和促进适于宿主中产生蛋白质的多肽分泌的序列。类似地,可以通过用本发明的核酸转导真核细胞(例如,中国仓鼠卵巢细胞或果蝇s2细胞)的培养物,产生本发明的抗原池中存在的多肽,其中所述核酸已经与合适的调节与控制序列(包括启动子、终止信号等)和促进适于这些细胞中产生蛋白质的多肽分泌的序列组合。
[0331]
可以任选地通过添加一段组氨酸残基(通称为his标签)至多肽的一个末端,促进通过重组手段产生的本发明的抗原池中存在的多肽的分离改进。
[0332]
也可以合成地产生多肽。
[0333]
载体
[0334]
包含本发明的抗原池的一种或多种核酸的遗传构建体可以离体导入细胞中,从而产生由所述核酸编码的多肽。本发明核酸(例如,dna)可以存在于本领域普通技术人员已知的多种递送系统的任一者内部,所述递送系统包括核酸表达系统、细菌表达系统和一些病毒表达系统。本领域熟知众多的基因递送技术,如rolland,1998,crit.rev.therap.drug carrier systems 15:143-198和其中所引用参考文献描述的那些技术。下文为说明目的略述这些方案中的数个。
[0335]
载体包含编码调节元件(如合适的启动子和终止信号)的核酸分子,所述调节元件适于允许有翻译活性的rna分子在人类宿主细胞中转录。“有翻译活性的rna分子”是能够由人细胞的翻译器(apparatus)翻译成蛋白质的rna分子。
[0336]
载体可以是病毒载体。病毒载体可以是腺病毒、腺相关病毒(aav)(例如,aav5型和
2型)、甲病毒(例如,委内瑞拉马脑炎病毒(veev)、辛德毕斯病毒(sin)、semliki森林病毒(sfv))、疱疹病毒、砂粒病毒(例如,淋巴细胞性脉络丛脑膜炎病毒(lcmv))、麻疹病毒、痘病毒(如改良安卡拉痘苗病毒(mva))、副黏病毒、慢病毒或弹状病毒(如水泡性口炎病毒(vsv))载体,即载体可以衍生自前述病毒的任一者。病毒载体是腺病毒。病毒载体是痘病毒,例如mva。
[0337]
腺病毒特别适合用作基因转移载体,原因在于其基因组大小中等、操纵便利、滴度高、靶细胞范围广和感染性高。病毒基因组的两个末端含有100-200碱基对的反向重复序列(itr),所述序列是病毒dna复制和包装必需的顺式元件。基因组的早期(e)区和晚期(l)区含有依照病毒dna复制启动划分的不同转录单位。e1区(e1a和e1b)编码负责调节病毒基因组和一些细胞基因转录的蛋白质。e2区(e2a和e2b)的表达导致合成用于病毒dna复制的蛋白质。这些蛋白质参与dna复制、晚期基因表达和宿主细胞关闭(renan,1990)。晚期基因的产物,包括大部分的病毒衣壳蛋白,仅在显著加工主要晚期启动子(mlp)发布的单一初级转录物后才表达。mlp在感染晚期期间特别高效,并且从这个启动子转录的全部mrna均拥有5
‘‑
三联前导(tpl)序列,所述序列使这些mrna成为翻译首选的mrna。从缺失一个或多个早期基因的病毒基因组中产生的复制缺陷腺病毒特别有用,因为它们的复制有限并且在已接种宿主内部和对已接种宿主的接触者致病性传播的可能性更小。
[0338]
用于将多核苷引入细胞的其他媒介和方法
[0339]
包含一个或多个核酸序列的表达构建体可以仅由裸的重组dna质粒组成。参见乌尔姆等人,1993,science 259:1745-1749和cohen,1993,science 259:1691-1692综述。可以进行构建体转移,例如,通过以物理或化学方式透化细胞膜的任何方法进行。这特别地适用于离体转移。
[0340]
用于将rna引入或递送入细胞的方法
[0341]
包含一个或多个多核苷酸序列的表达构建体可以由裸的重组dna衍生的rna分子组成(ulmer等人,2012,vaccine 30:4414
–
4418)。就基于dna的表达构建体而言,多种方法可以用来向细胞离体引入rna分子。可以设计基于rna的构建体以模仿简单的信使rna(mrna)分子,从而引入的生物分子由宿主细胞的翻译装置直接翻译,以在引入该生物分子的细胞中产生其编码的多肽。或者,可以按照这样的方式设计rna分子,所述方式通过向所述分子的结构中并入病毒rna依赖性rna聚合酶基因,允许它们在引入所述分子的细胞中自我扩增。因此,这些类型的rna分子,称作自我扩增型mrna(sam
tm
)分子(geall等人,2012,pnas,109:14604
–
14609),与一些基于rna的病毒载体共有特性。可以进一步修饰基于mrna的rna或sam
tm
rna(例如,通过改变其序列或通过使用修饰的核苷酸),以增强稳定性和翻译(schlake等人,rna biology,9:1319
–
1330),并且两个类型的rna均可以被配制(例如,配制于乳液(brito等人,molecular therapy,2014 22:2118
–
2129)或脂质纳米粒子(kranz等人,2006,nature,534:396-401)中),以促进稳定性和/或离体进入细胞。因此,在本发明的一个实施方案中,核酸被配制到纳米颗粒中。适当的,纳米颗粒是基于脂质的纳米颗粒,例如阳离子脂质体。修饰(和未修饰)的rna的无数制剂已经作为疫苗在模型中和人体中受测,并且多个基于rna的疫苗正用于持续进行的临床试验中。
[0342]
药物组合物
[0343]
本发明的抗原池可以配制在药物组合物如免疫原性组合物(下文“本发明的组合
物”)中用于递送。本发明的组合物适宜地包含本发明的抗原池以及药学上可接受的运载体(carrier)。
[0344]
因此,在一个实施方案中,提供了包含本发明的抗原池以及药学上可接受的运载体的免疫原性药物组合物。
[0345]
在本发明的某些优选实施方案中,提供了本发明的免疫原性药物组合物,其包含与药学上可接受的运载体组合的抗原池,所述抗原池包含两种或更多种(例如两种、三种、四种、五种、六种、七种、八种)不同的抗原,其中每种抗原以多肽的形式存在,并且其中不同的抗原作为单独的多肽存在于抗原池中。
[0346]
在本发明的某些优选实施方案中,提供了本发明的免疫原性药物组合物,其包含与药学上可接受的运载体组合的抗原池,所述抗原池包含两种或更多种(例如两种、三种、四种、五种、六种、七种、八种)不同的抗原,其中每种抗原以编码所述多肽的核酸的形式存在,并且其中不同的抗原作为单独的核酸存在于抗原池中。
[0347]
在本发明的某些优选实施方案中,提供了本发明的免疫原性药物组合物,其包含与药学上可接受的运载体组合的抗原池,所述抗原池包含两种或更多种(例如两种、三种、四种、五种、六种、七种、八种)不同的抗原,其中每种抗原以多肽的形式存在,并且其中所述不同的抗原作为融合蛋白的部分存在于所述抗原池中。
[0348]
在本发明的某些优选实施方案中,提供了本发明的免疫原性药物组合物,其包含与药学上可接受的运载体组合的抗原池,所述抗原池包含两种或更多种(例如两种)不同的抗原,其中每种抗原以编码所述多肽的核酸的形式存在,并且其中所述不同的抗原作为编码融合蛋白的核酸存在于所述抗原池中。
[0349]
在一个实施方案中,本发明的免疫原性药物组合物可包含与药学上可接受的运载体组合的抗原池,所述抗原池包含两种或更多种(例如两种、三种、四种、五种、六种、七种、八种)不同的抗原,其中每种抗原以多肽或编码所述多肽的核酸的形式存在,其中不同的抗原作为单独的多肽、核酸、融合蛋白和编码所述融合蛋白的核酸存在于抗原池中。这样的组合物可以提供增强的免疫应答。
[0350]
药学上可接受的盐
[0351]
将明显地是,本发明的组合物可以含有本文提供的核酸、多肽或融合蛋白的药学上可接受的盐。这类盐可以从药学上可接受的无毒碱制备,所述碱包括有机碱(例如,伯胺、仲胺和叔胺和碱性氨基酸的盐)和无机碱(例如,钠盐、钾盐、锂盐、铵盐、钙盐和镁盐)。
[0352]
药学上可接受的载体
[0353]
尽管本领域普通技术人员已知的许多药学上可接受的载体可以用于本发明的组合物中,但所用载体的最佳类将根据施用模式变动。可以配制本发明的组合物用于任何适宜的施用方式,施用方式例如包括肠胃外、局部、经口、经鼻、静脉内、颅内、腹膜内、皮下或肌内施用,优选地肠胃外施用例如,肌内、皮下或静脉内施用。对于肠胃外施用,载体优选地包含水并且可以含有ph控制用缓冲液、稳定剂,例如,表面活性剂和氨基酸和张力调节剂例如,盐和糖。如果组合物意在以冻干形式提供用于在使用点稀释,制剂可以含有冻干保护剂,例如,糖如海藻糖。对于口服施用、可以使用上述任一载体或固态载体、如甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖和碳酸镁。
[0354]
因此、本发明的组合物可以包含缓冲液(例如,中性缓冲盐水或磷酸盐缓冲盐水)、
糖类(例如,葡萄糖、甘露糖、蔗糖或葡聚糖)、甘露醇、蛋白质、多肽或氨基酸如甘氨酸、抗氧化剂、抑菌剂、络合剂如edta或谷胱甘肽、使制剂对受者的血液等渗、低渗或微弱低渗的溶质、助悬剂、增稠剂和/或防腐剂。或者,本发明的组合物可以配制为冻干产物。
[0355]
免疫刺激剂
[0356]
本发明的组合物还可以包含一种或多种免疫刺激剂。免疫刺激剂可以是增强或激动外源抗原免疫应答(抗体和/或细胞介导的)的任何物质。在疫苗制剂语境下经常称作佐剂的免疫刺激剂示例包括铝盐如氢氧化铝凝胶(明矾)或磷酸铝;皂苷(包括qs21)、免疫刺激性寡核苷酸如cpg、水包油乳液(例如,其中油是鲨烯)、氨烷基氨基葡糖苷4-磷酸、脂多糖或其衍生物例如3-de-o-酰化单磷酸酯类脂a和其他的tlr4配体、tlr7配体、tlr8配体、tlr9配体、il-12和干扰素。因此,适当地,本发明组合物的一种或多种免疫刺激剂选自铝盐、皂苷、免疫刺激性寡核苷酸、水包油乳液、氨烷基氨基葡糖苷4-磷酸、脂多糖及其衍生物和其他tlr4配体、tlr7配体、tlr8配体和tlr9配体。免疫刺激剂还可以包含与其他免疫组分特异性相互作用的单克隆抗体,例如阻断免疫检查点受体(包括pd-1和ctla4)相互作用的单克隆抗体。
[0357]
在重组核酸方法递送(例如,dna,rna,病毒载体)的情况下,可以将编码基于蛋白质的免疫刺激剂的基因连同编码本发明抗原池中存在的多肽的基因一起轻易地递送。
[0358]
持续释放
[0359]
本文所述的组合物可以作为实现施用后化合物缓慢/持续释放的持续释放制剂的部分施用(即,制剂如胶囊剂、海绵剂、糊剂或凝胶剂(例如由多糖组成))。
[0360]
储存和包装
[0361]
本发明的组合物可以存在于单位剂量容器或多剂量容器(如密封的安瓿或小瓶)中。这类容器优选地全密封,以保持制剂的无菌性直至使用为止。通常,制剂可以作为油质溶媒或含水溶媒中的悬液、溶液或乳液储存。或者,本发明的组合物可以在冷冻干燥状态下储存,仅需要在临用前再添加无菌液态载体(如水或注射用盐水)。
[0362]
剂量
[0363]
可以按将获得用于治疗用途的合适剂量的方式来制备本发明每种组合物中核酸、多肽或融合蛋白的量。制备这类组合物的本领域技术人员将构思诸多因素如溶解度、生物利用度、生物半衰期、施用途径、产物货架期以及其他药理学注意事项,因而,多种剂量和治疗方案可以是合乎需要的。
[0364]
一般,包含治疗有效量的组合物每次施用递送约0.1ug至约1000ug的本发明组合物中的多肽或融合蛋白,更一般每次施用递送约2.5ug至约100ug的多肽或融合蛋白。如果以短的、合成的长肽形式递送,则剂量可能是1至200ug/肽/剂量。就多核苷酸组合物而言,它们一般每次施用递送约10ug至约20mg本发明抗原池中的核酸,更一般每次施用递送约0.1mg至约10mg核酸。
[0365]
刺激的t细胞疗法
[0366]
自体或非自体t细胞可以从受试者例如从外周血、脐带血和/或通过单采血液成分术中分离,并在荷载到apc细胞的mhc分子上的肿瘤相关抗原的存在下刺激(信号1),以用对该抗原免疫特异性的tcr诱导t细胞的增殖。
[0367]
成功的t细胞活化需要共刺激性表面分子b7和cd28分别结合在抗原呈递细胞和t
细胞上(信号2)。为了实现最佳的t细胞活化,同时需要信号1和信号2。相反,在没有共刺激(信号2)的情况下,抗原肽刺激(信号1)不能诱导完全的t细胞活化,并且可导致t细胞耐受。除了共刺激分子,还有抑制分子,例如ctla-4和pd-1,所述抑制分子诱导阻止t细胞活化的信号。
[0368]
因此,自体或非自体t细胞可以在本发明的抗原池存在下被刺激,并且扩增并转移回具有癌症风险或患有癌症(所述癌症的癌细胞表达本发明的抗原池的相应多肽)的患者,条件是抗原特异性tcr将识别由患者mhc呈递的抗原,其中它们将靶向并诱导杀伤表达所述相应多肽的所述癌症的细胞。
[0369]
因此,在本发明的一个实施方案中,提供了本发明的抗原池或组合物,其用于离体刺激和/或扩增源自患癌症的人的t细胞,用于随后将所述刺激和/或扩增的t细胞再引入所述人中,以治疗所述人的所述癌症。
[0370]
在本发明的另一个实施方案中,提供了治疗人的癌症的方法,其中所述癌症的细胞表达选自(a)至(h)的多肽的序列,所述方法包含从所述人获取包含至少t细胞以及任选地包含抗原呈递细胞的白细胞群,在本发明的抗原池或组合物的存在下刺激和/或扩增所述t细胞,并将一些或所有所述包含至少刺激和/或扩增的t细胞的白细胞再引入所述人中。
[0371]
在上述实施方案的任一项中,适宜地,所述癌症是黑色素瘤,特别是皮肤黑色素瘤。
[0372]
在本发明的另一个实施方案中,提供了制备t细胞群的方法,所述t细胞群对表达选自(a)至(h)的多肽序列的癌细胞具有细胞毒性,所述方法包含(i)从癌症患者获得t细胞,任选地获得t细胞以及抗原呈递细胞,和(ii)用本发明的抗原池或组合物离体刺激和扩增t细胞群。抗原池可以含有癌细胞表达的选自(a)至(h)的相应多肽。
[0373]
本文中“相应”是指如果癌细胞表达例如seq id no:a(a是seq id no:1-8之一)或其变体或免疫原性片段,则用多肽、核酸或融合蛋白或含有前述之一的组合物形式的seq id no:a或其变体或免疫原性片段刺激并离体扩增t细胞群。
[0374]
例如,在这些方法中,培养和扩增在树突状细胞存在下进行。树突状细胞可以用核酸分子转染,并表达本发明的抗原池的多肽。
[0375]
在本发明的一个实施方案中,提供了一种可通过上述方法获得的t细胞群(下文称本发明的t细胞群)。
[0376]
在本发明的另一个实施方案中,提供了一种细胞,它是已经用本发明的抗原池或组合物刺激的t细胞(下文称本发明的t细胞)。
[0377]
在本发明的另一个实施方案中,提供了一种药物组合物,其包含本发明的t细胞群或t细胞以及药学上可接受的运载体。这样的组合物可以是例如适于肠胃外施用的无菌组合物。
[0378]
在本发明的另一个实施方案中,提供了用于医药(medicine)的本发明的t细胞群或t细胞。
[0379]
作为本发明的一个实施方案,还提供了治疗患有癌症的人的方法,其中所述癌症的细胞表达选自(a)至(h)的多肽序列,其中所述癌症的细胞可表达选自(a)至(h)的多肽序列,所述方法包括向所述人施用本发明的所述t细胞群或t细胞或包含本发明的所述t细胞群或t细胞的组合物。
[0380]
在本发明的另一个实施方案中,提供了本发明的t细胞群、本发明的t细胞或包含本发明的所述t细胞群或t细胞的组合物,其用于治疗人的癌症,其中所述癌症的细胞表达选自(a)至(h)的多肽序列。
[0381]
在上述实施方案的任一项中,适宜地,所述癌症是黑色素瘤,特别是皮肤黑色素瘤。
[0382]
t细胞群、t细胞或组合物在产生人对癌症的免疫应答中的用途取决于由癌症表达的抗原池(或它们中的一种或多种)的相应抗原序列。因此,在抗原池的设计和癌症表达或可能表达的抗原序列之间存在关系。在此上下文中,“相应”意指如果癌症表达(或可能表达),例如seq id no:a(a是seq id no:1-8中的一个)或其变体或免疫原性片段,则池将包括seq id no:a或其变体或免疫原性片段(任选地以融合蛋白的形式并作为蛋白或核酸)。因此,在抗原池、融合蛋白、核酸、载体或组合物的设计与癌症表达或可能表达的抗原序列之间存在关系。在抗原池中包含多种抗原序列潜在地使得在更广范围的患者中针对癌症的更强免疫应答或针对癌症的免疫应答成为可能。
[0383]
促进抗原体内呈递的细胞疗法
[0384]
多种细胞递送载具中任一者可以用于医药组合物内部以促进抗原特异性免疫应答产生。因此,本发明提供一种细胞,所述细胞是分离的抗原呈递细胞,所述抗原呈递细胞(下文称作“本发明的apc”)通过离体荷载本发明抗原池或本发明组合物被修饰。抗原呈递细胞(apc),如树突状细胞、巨噬细胞、b细胞、单核细胞和其他细胞可以经工程化成为高效apc。这类细胞可以,但不必要经基因修饰以增加抗原呈递能力,以改善t-细胞应答的活化和/或维持和/或免疫上相容于接受者(即,hla单倍型匹配)。apc可以通常从多种生物流体和器官中任一者分离,并且可以是自体、同种异体、同基因的或异种细胞。
[0385]
本发明的某些优选实施方案使用树突状细胞或其祖细胞作为apc。因此,在一个实施方案中,本发明的apc是树突状细胞。树突状细胞是高效力的apc(banchereau和steinman,1998,nature,392:245-251)并且已经显示作为引发预防性或治疗性免疫力的生理佐剂有效(参见timmerman和levy,1999,ann.rev.med.50:507-529)。通常,可以基于树突状细胞的典型形状(原位星状,体外可见明显胞质突起)、其高效率摄取、加工和呈递抗原的能力及其激活初始t-细胞应答的能力鉴定树突状细胞。当然,树突状细胞可以经工程化以表达在体内或离体的树突状细胞上通常不存在的特定细胞表面受体或配体,并且本发明构思了这类修饰的树突状细胞。作为树突状细胞的备选、荷载抗原的分泌型小泡(称作外来体)可以用于免疫原性组合物内部(参见zitvogel等人,1998、nature med.4:594-600)。因此,在一个实施方案中,提供一种外来体,其荷载有从荷载本发明抗原池或组合物的细胞所制备的多肽、核酸或融合蛋白。
[0386]
树突状细胞和祖细胞可以从外周血、骨髓、淋巴结、脾、皮肤、脐带血或任何其他合适的组织或流体获得。例如,可以通过向收获自外周血的单核细胞的培养物添加细胞因子(如gm-csf、il-4、il-13和/或tnfα)组合,离体分化树突状细胞。或者,可以通过向培养基添加gm-csf、il-3、tnfα、cd40配体、lps、flt3配体和/或诱导树突状细胞分化、成熟和增殖的其他化合物的组合,使从外周血、脐带血或骨髓收获的cd34阳性细胞分化成树突状细胞。
[0387]
树突状细胞便利地分类为“不成熟”细胞和“成熟”细胞,这带来在两个充分表征的表型之间区分的简单方式。然而,这种命名法不应当解释成排除全部可能的分化中间阶段。
不成熟的树突状细胞表征为抗原摄取和加工能力高的apc,这与fcγ受体和甘露糖受体高表达相关。成熟表型一般特征在于这些标志物的表达较低,但高表达负责t细胞激活的细胞表面分子,如i类和ii类mhc分子、黏附分子(例如,cd54和cd11)和共刺激分子(例如,cd40、cd80、cd86和4-1bb)。
[0388]
apc也可以经基因工程化,例如,用编码蛋白质(或其部分或其他变体)的多核苷酸转染,从而该多肽表达在细胞表面上。这种转染可以离体进行,并且包含这类已转染细胞的药物组合物随后可以使用。或者,可以将靶向树突状细胞或其他抗原呈递细胞的基因递送载具施用至患者,产生体内发生的转染。例如,可以通常使用本领域已知的任何方法(如wo 97/24447中描述的那些方法或mahvi等人,1997,immunology and cell biology 75:456-460描述的基因枪方案)进行树突状细胞体内和离体转染。可以通过将树突状细胞或祖细胞与多肽、dna(例如,质粒载体)或rna孵育;或与表达抗原的重组细菌或病毒(例如,腺病毒、腺相关病毒(aav)(例如,aav 5型和2型)、甲病毒(例如,委内瑞拉马脑炎病毒(veev)、辛德毕斯病毒(sin)、semliki森林病毒(sfv)、疱疹病毒、砂粒病毒(例如,淋巴细胞性脉络丛脑膜炎病毒(lcmv))、麻疹病毒、痘病毒(如改良安卡拉痘苗病毒(mva)或禽痘病毒)、副黏病毒、慢病毒或弹状病毒(如水泡性口炎病毒(vsv))孵育,实现树突状细胞的抗原荷载。在多肽荷载之前,多肽可以共价缀合于提供t细胞辅助的免疫配偶体(例如,载体分子)。或者,可以单独地或在抗原性多肽存在下用非缀合的免疫配偶体脉冲(pulsed)树突状细胞。
[0389]
本发明提供向抗原呈递细胞递送多肽抗原的专门设计的短的、化学合成的编码表位的片段。本领域技术人员将认识到,这些类型分子,又称作合成性长肽(slp),提供治疗性平台以使用本发明的抗原性多肽刺激(或荷载)体外细胞(gornati等人,2018,front.imm,9:1484)、或作为向体内抗原呈递细胞引入多肽抗原的方法(melief和van der burg,2008,nat rev cancer,8:351-60)。
[0390]
在一个实施方案中,提供一种包含本发明的抗原呈递细胞(其适当地是树突状细胞)连同药学上可接受的载体的药物组合物。这种组合物可以是适于肠胃外施用的无菌组合物。参见,例如,上文的药物组合物公开。
[0391]
在一个实施方案中,提供本发明的抗原呈递细胞(其适当地是树突状细胞)用于医药中。
[0392]
还提供了治疗患有癌症的人的方法,其中癌症细胞表达选自(a)至(h)的序列,其中癌症的细胞可表达选自(a)至(h)的多肽序列,该方法包含向所述人施用本发明的抗原呈递细胞(其适当地是树突状细胞)或包含本发明的所述抗原呈递细胞的组合物。
[0393]
在一个实施方案中,提供了本发明的抗原呈递细胞(其适当地是树突状细胞)或包含本发明的所述抗原呈递细胞的组合物,用于治疗人的癌症,其中所述癌症的细胞表达选自(a)至(h)的相应序列。
[0394]
向人施用的抗原呈递细胞或组合物,或用于在人中产生免疫应答的抗原呈递细胞或组合物,取决于癌症表达的序列。因此,在融合蛋白、核酸、载体或组合物的设计与癌症表达的序列之间存在关系。
[0395]
在一个实施方案中,提供了包含本发明的外来体以及药学上可接受的运载体的药物组合物。这样的组合物可以是适于肠胃外施用的无菌组合物。参见例如上述药物组合物的公开。组合物可以任选地包含免疫刺激剂-参见上述免疫刺激剂的公开。
[0396]
在一个实施方案中,提供了用于医药的本发明的外来体。
[0397]
还提供了治疗患有癌症的人的方法,其中所述癌症的细胞表达选自(a)至(h)的多肽序列,其中所述癌症的细胞可表达选自(a)至(h)的序列,所述方法包含向所述人施用本发明的所述外来体或包含本发明的所述外来体的组合物。
[0398]
在一个实施方案中,提供了本发明的外来体或包含本发明的所述外来体的组合物,其用于治疗人的癌症,其中所述癌症的细胞表达选自(a)至(h)的相应序列。
[0399]
在上述实施方案的任一项中,适宜地,所述癌症是黑色素瘤,特别是皮肤黑色素瘤。
[0400]
待治疗的疾病
[0401]
如别处所述,seq id no:1-8是对应于在皮肤黑色素瘤中过表达的clt抗原的多肽序列。
[0402]
可以产生针对表达选自(a)至(h)的相应多肽序列或其免疫原性片段或变体的癌症的免疫应答。在此上下文中,“相应”意指如果肿瘤表达(或可能表达),例如seq id no:a(a是seq id no:1-8或1-10之一)或其变体或免疫原性片段,则本发明的抗原池的多肽、核酸、融合蛋白和涉及它们的药物将基于seq idno:a或其变体或免疫原性片段。
[0403]
免疫应答可以包含cd8+ t-细胞、cd4+ t-细胞和/或抗体应答,特别是cd8+溶细胞性t-细胞应答和cd4+辅助t-细胞应答。
[0404]
可以产生针对肿瘤的免疫应答,特别是表达选自(a)至(h)的多肽序列的肿瘤。
[0405]
在优选的实施方案中,肿瘤是黑色素瘤肿瘤,例如皮肤黑色素瘤肿瘤。
[0406]
肿瘤可以是原发性肿瘤或转移性肿瘤。
[0407]
在本发明的一个实施方案中,提供了治疗人的癌症的方法,其中所述癌症的细胞表达选自(a)至(h)的多肽的序列或其免疫原性片段或变体,所述方法包含从所述人获取白细胞群,所述白细胞群包含至少t细胞以及任选地抗原呈递细胞,在本发明的抗原池或组合物存在下刺激和/或扩增所述t细胞,并将包含至少刺激和/或扩增的t细胞的所述白细胞的一些或全部再引入所述人中。
[0408]
在本发明的另一个实施方案中,提供了治疗患有癌症的人患者的方法,其中所述癌症的细胞表达选自(a)至(h)的序列或其免疫原性片段或变体,其中所述癌症的细胞可表达选自(a)至(h)的序列或其免疫原性片段或变体,所述方法包含向所述人施用本发明的t细胞群、t细胞、抗原呈递细胞、外来体或组合物。
[0409]
在本发明的另一个实施方案中,本发明涉及治疗患有癌症的人的方法,其中所述癌症的细胞表达选自(a)至(h)的序列或其免疫原性片段或变体,其中所述癌症的细胞可表达选自(a)至(h)的多肽序列或其免疫原性片段或变体,所述方法包含向所述人施用根据本发明的t细胞群、t细胞、抗原呈递细胞、外来体或组合物。
[0410]
在本发明的另一个实施方案中,提供了用于治疗人的癌症的本发明的t细胞群、t细胞、抗原呈递细胞、外来体或组合物,其中所述癌症的细胞表达选自(a)至(h)的相应序列或其免疫原性片段或变体。
[0411]
在本发明的另一个实施方案中,提供了治疗患有癌症的人的方法,包含以下的步骤:(a)确定所述癌症的细胞是否表达选自(a)至(h)的多肽序列或其免疫原性片段或变体;如果是,则(b)向所述人施用根据本发明的多肽、核酸、抗原池、组合物、t细胞群、t细胞、抗
原呈递细胞或外来体。
[0412]
在上述实施方案的任一项中,适宜地,所述癌症是黑色素瘤,特别是皮肤黑色素瘤。
[0413]
对应于seq id no:14和20的转录物也在葡萄膜黑色素瘤中过表达。因此,在一个备选实施方案中,肿瘤是葡萄膜黑色素瘤肿瘤和/或表达选自seq id no:1、3和4的序列的肿瘤。因此,本发明的融合蛋白可在葡萄膜癌受试者中显示。
[0414]
抗原组合
[0415]
本发明的抗原池、t细胞群、t细胞、抗原呈递细胞、外来体或组合物能与引起针对黑色素瘤例如皮肤或葡萄膜黑色素瘤的免疫应答的其它免疫原性抗原组合使用。这些其它免疫原性抗原可衍生自不同来源,它们可包括充分描述的黑色素瘤相关抗原,如gpr143、prame、mage-a3或pmel(gp100)。或者,它们可以包括其它类型的黑色素瘤抗原,包括患者特异性新抗原(lauss etal.(2017).nature communications,8(1),1738.http://doi.org/10.1038/s41467-017-01460-0)、保留内含子新抗原(smart等人(2018)nature biotechnology.http://doi.org/10.1038/nbt.4239)、剪接变体新抗原(hoyos等人cancer cell,34(2),181
–
183.http://doi.org/10.1016/j.ccell.2018.07.008;kahles等人(2018).cancer cell,34(2),211-224.e6./http://doi.org/10.1016/j.ccell.2018.07.001)、属于称为编码与受损肽加工相关的t细胞表位的抗原的类别的黑色素瘤抗原(tiepp;gigoux,m.,&wolchok,j.(2018).jem,215,2233,marijt等人(2018).jem 215,2325),或将要发现的新抗原(包括clt抗原)。此外,来自这些不同来源的抗原肽也可以与(i)非特异性免疫刺激剂/佐剂种类和/或(ii)例如包含通用cd4辅助表位的抗原(已知能引发强cd4辅助t细胞)(作为多肽或作为编码这些cd4抗原的多核苷酸或载体递送)进行组合,以扩增由共同施用的抗原引发的抗黑色素瘤特异性应答。
[0416]
以多肽和/或编码多肽的核酸的形式存在的不同的抗原可以配制在同一制剂中或分开的制剂中。不同的抗原可以作为单独的多肽、核酸、融合蛋白提供,其中多肽与第二或另外的多肽和/或编码融合蛋白的核酸融合。
[0417]
更一般地,当组合使用两个或更多个组分时,可以以如下呈现所述组分,例如:
[0418]
(1)作为两种或更多种单独和/或分开的抗原性多肽组分;
[0419]
(2)作为包含两种(或更多)多肽组分的融合蛋白;
[0420]
(3)作为两种或多种多肽和两种或多种多核苷酸组分;
[0421]
(4)作为两种或更多种单独的多核苷酸组分;
[0422]
(5)作为编码两种或多种单独多肽组分的单个多核苷酸;或
[0423]
(6)作为编码包含两种(或更多)多肽组分的融合蛋白的单个多核苷酸。
[0424]
为了方便起见,当存在许多组分时,它们包含在单个融合蛋白或编码单个融合蛋白的多核苷酸内。在本发明的一个实施方案中,所有组分都以多肽形式提供(例如,在单个融合蛋白中)。在本发明的一个备选实施方案中,所有组分都以多核苷酸(例如,单个多核苷酸,如编码单个融合蛋白的多核苷酸)的形式提供。
[0425]
联合疗法
[0426]
本发明的癌症治疗方法可以与其他疗法、尤其检查点抑制剂和干扰素组合下进行。
[0427]
过继细胞疗法(基于apc和t细胞)能与其他组分组合使用,旨在提高其免疫原性,例如,旨在改善引发的免疫应答的幅度和/或广度或提供其他活性(例如,激活天然或适应性免疫应答的其他方面或摧毁肿瘤细胞)。
[0428]
因此,本发明的组合物(即免疫原性组合物或药物组合物)或数种这类组合物的试剂盒可以包含本发明的抗原池、t细胞群、t细胞、抗原呈递细胞或外来体,连同药学上可接受的载体,和(i)一种或多种其他免疫原性多肽或免疫刺激多肽(例如,干扰素、il-12、检查点阻断分子或编码前者的核酸,或包含这类核酸的载体)、(ii)将增强作为本发明主题的多肽产物翻译和/或呈递的小分子(例如,hdac抑制剂或调节癌细胞表观遗传特征的其他药物)或生物制品(作为多肽或编码前者的核酸或包含这类核酸的载体递送)。
[0429]
检查点抑制剂,其阻断癌细胞上的正常蛋白质或响应于这些蛋白质的t细胞上的蛋白质,可能是一类与基于clt抗原的疗法组合的特别重要的药物,原因是这些抑制剂寻求克服癌症对抗免疫系统攻击的主要防御之一。
[0430]
因此,本发明抗原池、免疫原性或药物组合物、t细胞、t细胞群、抗原呈递细胞或外来体可以与检查点抑制剂组合施用。检查点抑制剂的示例选自pd-1抑制剂如派姆单抗(keytruda)与纳武单抗(opdivo)、pd-l1抑制剂如阿特朱单抗(tecentriq)、阿维鲁单抗(bavencio)与德瓦鲁单抗(imfinzi)和ctla-4抑制剂如伊匹木单抗(yervoy)。
[0431]
干扰素(例如,α、β和γ)是身体以极少量产生的蛋白质家族。干扰素可以减缓或终止癌细胞分裂、降低癌细胞自我保护免遭免疫系统影响的能力和/或增强适应性免疫系统的多个方面。干扰素一般作为例如在大腿或腹部中的皮下注射剂施用。
[0432]
因此,本发明的抗原池、免疫原性或药物组合物t细胞、t细胞群、抗原呈递细胞或外来体可以与干扰素例如干扰素α组合施用。
[0433]
本发明的不同模式也可以组合,例如本发明的抗原池可以与本发明的apc、t细胞、t细胞群或外来体组合(下文讨论)。
[0434]
本发明的一种或多种模式还可以与常规抗癌化疗和/或放射组合。
[0435]
实施例
[0436]
实施例1
–
clt鉴定
[0437]
目的是鉴定完全或部分地由ltr元件组成的癌特异性转录物。
[0438]
作为第一步骤,我们从头组装完整的泛癌转录组。为实现这个目的,来自768份患者样品的rna测序用读段用于基因组指导的组装,其中所述患者样品从癌症基因组图谱(the cancer genome atlas tcga)联盟获得并且代表广泛种类的癌类型(来自32个癌类型中每个类型(31例原发性黑色素瘤和1例转移性黑色素瘤)的24份性别均衡样品;表s1)。使用cutadapt(v1.13)(marcel m.,2011,embnet j.,17:3)对性别均衡样品(不包括性别特有组织)进行接头和质量(q20)修整及长度过滤(两种读段为≥35核苷酸对),并且对于分别为200和3的最大深度和最小深度,使用khmer(v2.0)(crusoe等人,2015,f1000res.,4:900)对其进行kmer归一化(k=20)。使用star(2.5.2b)连同与跨tcga所用那些设置相同的设置,将读段映射至grch38并且传送至trinity(v2.2.0)(trinity,grabherr,m.g.等人,2011,nat.biotechnol.,29:644-52)以进行基因组指导的组装,计算机上内建的深度归一化禁用。大部分组装过程在32核hpc节点上的256gb ram范围内完成,使用1.5tb ram节点复运行失败的过程。所得的重叠群接受聚腺苷酸修整(seqclean v110222内部的trimpoly)和熵过
滤(≥0.7),以移除低质量与人为重叠群(bbmap v36.2内部的bbduk)。根据癌类型,使用salmon(v0.8.2或v0.9.2)(patro,r.等人,2017,nat.methods,14:417-419),将原始24份样品准映射至净化过的组装物,移除发现按每百万(tpm)《0.1个转录物所表达的重叠群。使用gmap(v161107)(wu等人,2005,bioinf.,21:1859-1875),将剩余的那些重叠群映射至grch38,并且从组装中移除在其≥85%的长度范围内不以≥85%同一性对齐的重叠群。最后,使用gffread(cufflinks v2.2.1)(trapnell等人,2010,nat.biotech.,28:511-515),使全部癌类型的组装物一起扁平化并且复合成最长的连续转录物。由于专门设计这个组装过程以使得评估重复性元件成为可能,单外显子转录物保留,但加上标记。通过用gencode v24basic和mitranscriptome1比较,评估转录物组装完整度和质量(iye等人2015,nat.genet.,47:199-208)。我们在gencode内部编纂了唯一剪接位点清单并且检验剪接位点是否存在于转录组组装物内部的2核苷酸宽限窗口(grace window)内。这个过程导致鉴定1,001,931个转录物,其中771,006个是剪接的并且230,925个是单外显子的。
[0439]
单独地,将组装的重叠群以基因组重复序列注释叠加,以鉴定含有ltr元件的转录物。ltr元件和非ltr元件如先前所述那样注释(attig等人,2017,front.in microbiol.,8:2489)。简而言之,使用以nhmmer(wheeler等人,2013,bioinform.,29:2487-2489)配置的repeatmasker open-3.0(smit,a.,r.hubley和p.green,http://www.repeatmasker.org,1996-2010),代表已知的人重复序列家族的隐匿马尔科夫模型(hmms)(dfam 2.0library v150923)用来注释grch38。与基于blast的方法相比,基于hmm的扫描提高注释准确度(hubley等人,2016,nuc.acid.res.,44:81-89)。repeatmasker分别注释ltr和内部区域,因此剖析表格化输出结果以合并相同元件的毗邻注释。这种过程产生181,967个转录物,所述转录物含有一个或多个、完全或部分的ltr元件。
[0440]
使用salmon,对全部转录物估计百万分之转录物(tpm),并且将每个癌类型内部的表达与跨811份健康组织样品的表达比较,其中针对所有癌症类型的健康组织匹配的对照来自tcga(若可获得)并且单独地来自gtex(基因型-组织表达联盟,2015,science,348:648-60)。如果在任何样品中按多于1个tpm检出,则转录物视为在癌症中表达,并且如果满足以下标准,则视为癌特异性:i.在每个癌类型的24份样品≥6者中表达;ii.在≥90%的全部健康组织样品中按《10tpm表达;iii.在目的癌类型中的表达≥3倍任何对照组织类型的中位表达;和iv.当可获得时,在目的癌类型中的表达≥3倍相应健康组织的90百分位数。
[0441]
癌特异性转录物清单随后与含有完整或部分ltr元件的转录物清单相交以产生有5,923个满足所有标准的转录物的清单(称作癌特异性跨ltr元件转录物,clt)。
[0442]
对黑色素瘤中特异性表达的403个clt进行进一步的分析,以排除潜在的错误组装重叠和对应于细胞基因组装的那些。进行额外的手动评估,以确保来自黑色素瘤的原始rna测序读取支持剪接模式。对clt进行额外的分类使得丢弃在任何gtex正常组织中中位表达超过1tpm的那些。
[0443]
在皮肤黑色素瘤的403个clt中,97个clt通过了这些过滤。
[0444]
实施例2
–
免疫肽组学分析
[0445]
基于质谱(ms)的免疫肽组学(immunopeptidomics)分析是允许直接鉴定与hla分子(phla)缔合并且呈递在细胞表面的特定肽的有力技术。该技术包括通过抗hla抗体捕获从生物样品(如细胞或组织)中亲和纯化phla。然后将分离的hla分子和结合的肽彼此分离,
并通过纳米超高效液相色谱与质谱联用(nuplc-ms)分析洗脱的肽(freudenmann等人,2018,immunology 154(3):331-345)。在质谱仪中,选择、分离、破碎具有确定荷质比(m/z)的特定肽段,然后进行第二轮质谱(ms/ms)以揭示其产生的片段离子的m/z。然后可以查询片段谱(ms/ms)以精确鉴定产生检测到的片段离子的所选肽的氨基酸序列。
[0446]
ms/ms谱的解释和随后的肽序列鉴定依赖于实验数据与从参考数据库中存在的肽序列创建的理论谱之间的匹配。虽然通过使用与衍生自已知转录组或甚至完整基因组的全部可读框(orf)相对应的预定义清单(nesvizhskii等人,2014,nat.methods 11:1114
–
1125),可以检索ms数据,但查询这些非常庞大的序列数据库导致极高的错误发现率(fdr),后者限制对所呈递肽的鉴定。其他技术问题(例如,亮氨酸的质量=异亮氨酸的质量)和理论问题(例如,肽剪接(liepe等人,2016,science 354(6310):354
–
358))增加与使用非常庞大的数据库(如从已知转录组或完整基因组产生的那些)相关的局限性。因此,在实践中,不参考充分确定的潜在多肽序列集合情况下,执行精确的免疫肽组学分析以鉴定新抗原是异常困难的(li,等人,2016,bmc genomics 17(suppl 13):1031)。
[0447]
bassani-sternberg等(bassani-sternberg等,2016,nature commun,7:13404;database link:https://www.ebi.ac.uk/pride/archive/projects/pxd004894)针对整个人类蛋白质组报道的多肽序列,分析从25名皮肤黑色素瘤患者获得的hla结合肽样品收集的ms/ms数据。这些分析揭示了数以万计的与已知的人蛋白质匹配的肽。如所预期的,这些肽包括在多种肿瘤相关抗原(taa)中发现的肽,包括prame、magea3和trpm1(黑色素瘤基因(melastatin))。
[0448]
本发明人从6名诊断为黑色素瘤的患者获得冷冻肿瘤组织。将0.05-1g样品匀浆,高速离心裂解物,将澄清的裂解物与蛋白a(proa)珠混合,蛋白a珠与抗人hla i类单克隆抗体(w6/32)共价连接。将混合物在4℃孵育过夜以改善hla i类分子与抗体的结合(ternette等,2018proteomics18,1700465)。用10%乙酸从抗体上洗脱hla i类结合的肽,然后用反相柱层析将肽与其它高分子量组分分离(ternete等,2018)。对纯化的洗脱肽进行nuplc-ms,在质谱仪中选择具有确定的荷质比(m/z)的特异性肽,对该肽进行分离,片段化,并进行第二轮质谱(ms/ms)以揭示所得片段离子的m/z(tennette等人,2018),产生与这些肿瘤样品中每一种的免疫肽相对应的ms/ms数据集。
[0449]
通过应用免疫表位评估的详细知识,本发明人分析了来自pxd004894hla i类数据集的25个黑色素瘤患者的谱(bassani-sternberg等人,2016)和本发明人用clt衍生的orf制备的6个黑色素瘤患者的hla i类数据集的谱(实施例1)。进行三种类型的分析:
[0450]
·
分析a:将来自衍生自实施例1中鉴定的那些的大约1打clt的亚组的大于23个氨基酸残基的预测orf串联到每个clt的单个多肽文件中,并且通过使用peaks
tm
软件(v8.5,bioinformatics solutions inc)针对pxd004894hla i类数据集连同在人类蛋白质组(uniprot数据库)中发现的所有多肽一起分析这些串联orf多肽
[0451]
·
分析b:通过使用mascot软件,与在人类蛋白质组(uniprot和masdb数据库)中发现的所有多肽一起,针对25名黑色素瘤患者的pxd004894hla i类数据集对由来自实施例1中鉴定的clt的约1打clt的子集的大于23个氨基酸残基的预测orf的每一个组成的多肽文件进行分析
[0452]
·
分析c:使用peaks
tm
软件(v8.5和vx,bioinformatics solutions inc)针对
pxd004894hla i类数据集(25名黑色素瘤患者)和本发明人的hla i类数据集(6名黑色素瘤患者)连同在人类蛋白质组(uniprot)中发现的所有多肽一起,分析衍生自实施例1中鉴定的长度为10个或更多个氨基酸残基的97个clt的所有预测orf
[0453]
由于在细胞中发现的大多数i类hla结合肽来源于组成型表达的蛋白质,用uniprot蛋白质组同时分析这些数据库有助于确保我们的clt orf序列正确地分配到ms/ms谱。peaks软件,像其他ms/ms分析软件一样,给每个谱分配一个概率值(-10lgp;参见表1),以量化该分配。
[0454]
这些研究的结果鉴定出>50个单独的肽,这些肽与从来自bassani-sternberg等人检查的25名患者的肿瘤样品和本发明人的数据集中的6名黑色素瘤患者样品中免疫沉淀的hla i类分子相关,这些肽对应于clt衍生的orf的氨基酸序列,并且不对应于已知的人类蛋白质组(uniprot和/或masdb)中存在的多肽序列。
[0455]
使用peaks软件分配的肽谱的进一步人工回顾来证实对定位于8个clt衍生的orf的肽的谱分配,并因此定义为clt抗原(表1;seq id no:1-8)。
[0456]
这些与hla i类分子相关的肽的检测证实,它们所来源的8个orf首先在黑色素瘤组织中翻译,通过hla i类途径加工,最后以与hla i类分子的复合物形式呈递给免疫系统。表1显示了在clt抗原中发现的肽的性质。图1-37显示了表1所示的每种肽的代表性ms/ms谱。这些图显示了通过nuplc-ms2在个体患者skcm肿瘤中检测的指定肽序列的片段谱(由peaks
tm
软件从本发明人的内部数据集或从bassani-sternberg等储存在pride中的数据集提取的图像)。所有已被检测的片段在谱上方的肽序列中被指示,并且在每个谱中指出最丰富的片段离子。在图1-2、4-6、8-9、11-12、14-37中,图的下方图片示出了指定给ms/ms谱的肽序列,而类似的数据以表格形式显示在图3、7、10、13和19的右侧。片段离子注释如下:b:n-末端片段离子;y:c-末端片段离子;-h2o:失水;-nh3:氨的损失;[2+]:双电荷肽离子;pre:未片段化的前体肽离子。与表1中肽的高-10lgp分值一致,这些谱含有许多与我们在这些分析中发现的肽序列(seq id no:.9-12,18-19,31-32,36-39,45,48-54)精确匹配的片段。
[0457]
通过使用netmhcpan 4.0预测软件(http://www.cbs.dtu.dk/services/netmhcpan/),评估表1中所有检测到的与hla i类相关的长度为9个氨基酸残基或更长的肽,以确定它们与hla i类型a和b超型结合的预测强度。这些预测研究的结果显示预测所有17种肽(或在每个全序列中所含有的9聚体)结合至少一种测试的超型(见表2)。其中,预测许多序列以高置信度(低%秩得分)结合所检查的hla i类超型内的特定型。所有检测的肽都预期结合hla类型的标准组的事实提供了围绕它们检测的额外验证。此外,在来自本发明人数据集的肿瘤样品中发现的每个肽通过netmhcpan 4.0预测结合到我们在患者样品中检测的hla类型之一。bassani-sternberg等人(2016,nature commun.,7:13404)没有报道对于与我们发现的肽相关的每个患者的hla类型,但是在这报道后,我们发现了已知和预测的hla类型之间的匹配。
[0458]
为了进一步确定肿瘤组织衍生的ms谱与我们发现的肽序列的分配的确定性,合成具有这些发现序列的肽,并使用与在最初的研究中应用于肿瘤样品所相同的条件进行nuplc-ms2(bassani-sternberg等,2016,nature commun,7:13404;发明人的数据)。选择的肽的谱比较示于图39-54。在每幅图中上面的谱对应于肿瘤样品(来自pride数据库(bassani-sternberg等,2016,nature commun,7:13404;database link:https://
www.ebi.ac.uk/pride/archive/projects/pxd004894或在本发明人的数据库中),下面的谱对应于合成产生的相同序列的肽。检测的离子片段的选定的m/z值显示在这些ms/ms谱中每个片段峰的上方/下方。这些图揭示了片段的精确分配(实验确定的源自肿瘤与合成肽的片段离子之间的m/z值的微小差异完全在《0.05道尔顿的m/z容差范围内),这证实了每个源自肿瘤组织的谱与clt编码肽的分配的准确性。
[0459]
总之,表1和2和图1-53中所示的数据为黑色素瘤患者中相应clt抗原的翻译、加工和呈递提供了非常强的支持。
[0460]
为了进一步证实这些clt的癌症特异性,本发明人处理了37份正常组织样品(10份正常皮肤,9份正常肺和18份正常乳腺组织),并准备用于免疫肽分析。本发明人分析来自这些正常组织样品中的hla-i类数据集的谱,使用peaks
tm
软件(v8.5和x)搜索衍生自clt抗原1、2、3、4、5、6、7和8多肽序列的所有可能的肽序列,以及人类蛋白质组(uniprot)中发现的所有多肽。在正常组织样品组中没有检测到衍生自clt抗原1、2、3、4、5、6、7或8的肽(表3),这提供了clt具有癌症特异性表达的额外证据。
[0461]
总之:衍生自预测的orf的免疫肽的鉴定证明这些clt在肿瘤组织中被翻译成多肽(seq id no:1-8;称为clt抗原)。然后,这些肽被细胞的免疫监视装置处理,并且组分肽被荷载到hla i类分子上,使得细胞能够被靶向,以被识别所得到的肽/hla i类复合物的t细胞进行细胞溶解。因此,预期这些clt抗原及其片段将用在用以治疗其肿瘤表达这些抗原的患者中的黑色素瘤的多种治疗模式中。
[0462]
表1:通过黑色素瘤肿瘤样品的免疫肽分析所鉴定的肽列表,以及clt抗原名称和与seq id no的交叉参照。
[0463]
[0464]
[0465][0466]1通过质谱鉴定的hla i类肽。
[0467]2bassani-sternberg等,2016,nature comm.,7:13404(mel-3,mel-5,mel-8,mel-16,mel-21,mel-27,mel-29,mel-30,mel-36,mel-39,mel-41);inventors’dataset(1mt1,2mt1,2mt3,2mt4,2mt10,2mt12)。
[0468]3计算的肽质量。
[0469]4peaks
tm program-10lgp显示了获得多于一个谱检测的肽/患者的最高匹配的肽的值。通过使用mascot软件进行的分析b所鉴定的肽的值是不可获得的(na)。
[0470]5检测到肽的谱数量。
[0471]6观察质量与计算质量之间的偏差;显示了获得多于一个谱的肽的选择的ppm值。通过分析b所鉴定的肽的值是不可获得的(na)。
[0472]
表2:预测的netmhcpan4.0结合——质谱鉴定的肽(长度≥9个残基)与18个hla i类超型等位基因(hla-a01:01,hla-a02:01,hla-a03:01,hla-a11:01,hla-a24:02,hla-a25:01,hla-a26:01,hla-a68:01,hla-b07:02,hla-b08:01,hla-b15:01,hla-b18:01,hla-b27:05,hla-b35:01,hla-b35:03,hla-b40:01,hla-b40:02,hla-b51:01),以及clt抗原名称和与seq id no的交叉参考。
[0473]
[0474][0475]1预测的结合分析的秩得分≤5.0%得分的hla i类超型。
[0476]2预测以秩得分≤5.0%结合18个hla i类超型的数量。
[0477]3预测以秩得分≤2.0%结合18个hla i类超型的数量。
[0478]4预测以秩得分≤0.5%结合18个hla i类超型的数量。
[0479]5bassani-sternberg等,2016,nature comm.,7:13404(mel-3,mel-8,mel-16,mel-21,mel-27,mel-29,mel-30,mel-36,mel-39,mel-41);发明人的数据集(1mt1,2mt1,2mt3,2mt4,2mt10,2mt12)。
[0480]
表3在正常组织样品组中衍生自clt抗原1至8的肽的数量。
[0481]
抗原皮肤肺乳房clt抗原10/100/90/18clt抗原20/100/90/18clt抗原30/100/90/18clt抗原40/100/90/18clt抗原50/100/90/18clt抗原60/100/90/18clt抗原70/100/90/18clt抗原80/100/90/18
[0482]
实施例1和2中呈现的结果全部或部分基于癌症基因组图谱(tcga)研究网络(http://cancergenome nih.gov/)产生的数据;以及基因型-组织表达(gtex)计划(由国家卫生研究所主管办公室的共同基金支持,以及由nci、nhgri、nhlbi、nida、nimh和ninds支持)。
[0483]
实施例3-hervfest
[0484]
特异性t细胞功能扩增(fest)技术已经用于鉴定存在于癌症患者的肿瘤细胞中发现的“突变相关新抗原”(mana)库中的治疗相关的肿瘤来源的表位,其基于对与mana表位反应的患者t细胞的检测(anagnostoou等,cancer discovery 2017;le等,science 2017;forde等,nejm 2018;danilova等,cancer immunol res.2018)。通过使用实施例1和2中阐述的方法(表1-3,图1-53)发现的对clt抗原的fest技术的应用可用于鉴定癌症患者中针对clt抗原的治疗相关的t细胞应答。
[0485]
与鉴定已经经历免疫暴露的受试者中的表位特异性t细胞的其他测定(例如elispot)类似,“fest”技术通过在离体培养物中活化/扩增同族t细胞来获得它们的特异性,所述离体培养物包括抗原呈递细胞和合适的抗原肽。该技术与其它免疫学分析的不同之处在于,它利用存在于这些扩增的培养物中的t细胞受体(tcr)dna序列(具体地:靶向tcr-vβcdr3区域的tcr seq)的下一代测序来检测在用来源于一种抗原(或多种抗原)的一
组靶肽的单独肽培养的细胞中扩增的特定tcr。tcrseq在同一患者肿瘤组织中的应用也可用于证明在离体的肽刺激培养物中是否检测到tcr/t细胞也存在于在癌症组织中原位发现的肿瘤浸润淋巴细胞中。因此,manafest已被证明是鉴定由患者t细胞识别的mana表位的有效技术,允许在通过癌症患者的正常和肿瘤组织的全外显子组测序发现的大量突变肽中鉴定功能上相关的mana肽(le等,science 2017;forde等,nejm 2018;danilova等,cancer immunol res.2018;smith等,j immunother cancer 2019)。
[0486]
如下进行manafest方法学(danilova等,cancer immunol res.2018)对clt抗原的应用。我们将称为hervfest的方法由以下步骤组成:步骤1:在clt抗原中鉴定了预测含有有效结合所选hla i类等位基因的表位的肽。步骤2:来自合适的黑色素瘤患者的pbmc通过hla i类型与步骤1中选择的肽文库匹配,步骤3:将来自这些患者的pbmc分离成t细胞和非t细胞级分。将非t细胞加回患者的t细胞,然后分入20-50个孔(每个培养物含有250,000个t细胞),并用各种t细胞生长因子和各种clt抗原衍生的合成肽(在步骤1/2中选择)增殖10天。步骤4:在所有孔上进行tcrseq(tcr-vβcdr3序列的测序),鉴定在存在单独clt抗原衍生肽时扩增(但在存在对照肽或不存在肽刺激时不扩增)的tcr-vβcdr3序列。在该分析的各个孔中扩增的tcr-vβcdr3序列的存在因此鉴定了在黑色素瘤患者中引发免疫应答的clt抗原衍生肽。步骤5:tcrseq也可以在肿瘤样品上进行以确定携带clt抗原扩增的tcr的t细胞是否归巢于患者肿瘤,进而提供携带这些tcr的t细胞识别患者肿瘤内的clt抗原衍生肽的额外证据。
[0487]
用clt抗原1-4(seq id no:1-4)衍生的肽进行hervfest试验。用于这些研究的肽的组(参见以上步骤1)是基于clt抗原衍生肽的netmhc预测,所述肽被预测为强烈结合通常在可用于我们的分析的患者肿瘤样品中发现的8种hla i类型。在这些hervfest测定法中扩增一个或多个tcr的clt抗原衍生肽提供于表4中。表4还显示了用每位患者的pbmc衍生培养物测试的clt抗原肽的hla i类型。在这些研究中测试了其pbmc并在测定中扩增了一种或多种tcr的患者的hla i类型显示在表5中。
[0488]
图54a组显示了公开的数据,证明用nsclc患者特异性mana肽(forde等,nejm 2018)的tcr扩增。纵轴显示了在横轴上列出的mana或对照肽存在下培养的细胞的孔中,每个所示tcr vβcdr3 aa序列的比率。在含有mana7的孔中的扩增表明患者的t细胞库包括对该肽反应的t细胞。图54的b和c显示了来自2名黑色素瘤患者的pbmc的代表性tcr扩增数据,所述pbmc在所示clt抗原肽和对照肽存在下孵育。与图a一样,在图b&c中观察到的特异性扩增证明这些黑色素瘤患者的t细胞库包括与特异性clt抗原衍生肽反应的t细胞。b图显示了在衍生自黑色素瘤患者222b的pbmc的lmssfstlasl刺激的孔中在用来自clt抗原1、2和4的15种i类hla-a*02肽所刺激的所有孔中检测到的tcr的频率。lmssfstlasl(seq id no:23)是一种来源于clt抗原2的hla-a*02结合肽。图c显示了在mvacriktfr刺激的来自黑色素瘤患者224b的pbmc的孔中在用衍生自clt抗原1、2和4和15种i类hla-a*02肽以及来自clt抗原1、2、3和4的24种i类hla-a*03肽的所刺激的所有孔中检测到的tcr的频率。mvacriktfr(seq id no:26)是衍生自clt抗原2的hla-a*03结合肽。
[0489]
这些实验中使用的对照肽/条件如下:cef=cmv、ebv和流感病毒肽的混合物;sl9、tv9和qk1=hiv-1对照肽;无肽=在不存在肽的情况下培养;基线=培养前的t细胞。
[0490]
图55显示了clt抗原1-4的所有clt抗原肽的总结,其在用这些患者完成的研究中
扩增一个或多个tcr。每幅图显示了clt抗原1-4的氨基酸序列,其覆盖有通过免疫肽分析检测的肽(由虚下划线或粗体文字表示;参见实施例2)。在这些序列下,hervfest检测的肽(见图54)用它们被检测的黑色素瘤患者的数字标识符(表5)和靶向hla i类型进行显示。
[0491]
各hervfest检测的性质定义如下:
[0492]
·
原始文本:单个tcr的显著扩增
[0493]
·
粗体文本:多个tcr的显著扩增
[0494]
·
下划线斜体文本:在其它孔中检测到的单一tcr的显著扩增
[0495]
·
下划线粗体文本:多个tcr的显著扩增,其中至少一个tcr在其它
[0496]
孔中被检测到
[0497]
这些结果提供了强有力的证据,即clt抗原1-4存在于黑色素瘤患者中,并且衍生自这些clt抗原的肽已经在这些黑色素瘤患者中引发特异性t细胞应答,证实了这些clt抗原作为治疗黑色素瘤的治疗性干预的靶的价值。
[0498]
表4:在hervfest测定法中扩增一个或多个tcr的clt抗原衍生肽
[0499][0500][0501]
表5:hervfest测定法中使用的黑色素瘤患者pbmc的特征
[0502][0503]
实施例4-证明对clt抗原特异的高亲和力t细胞没有从正常受试者的t细胞库中缺失的测定
[0504]
elispot测定可用于显示clt抗原特异性cd8t细胞存在于健康个体的正常t细胞库中,因此在这些患者中没有由于癌特异性clt抗原在幼稚和胸腺组织中表达而导致的中心耐受而缺失。这种类型的elispot分析包括多个步骤。步骤1:cd8t-细胞和cd14单核细胞可以从正常供血者的外周血分离,这些细胞是i类hla分型的以匹配被测试的特异性clt抗原。利用针对记忆标记cd45ro的磁性标记抗体,cd8t细胞可进一步细分为原初和记忆亚型。步骤2:在与cd8t细胞共培养14天之前,用单独或合并的clt抗原肽脉冲cd14单核细胞三小时。步骤3:从这些培养物中分离扩增的cd8t细胞,用肽脉冲的新鲜单核细胞再刺激过夜。这些肽可以包括;单独的clt抗原肽、不相关的对照肽或已知引发对感染性(例如cmv、ebv、flu、hcv)或自身(例如mart-1)抗原的强效应答的肽。在抗干扰素γ(ifnγ)抗体包被的平板上进行再刺激。抗体捕获由肽刺激的t细胞分泌的任何ifnγ。过夜活化后,从板上洗涤细胞,并用另外的抗ifnγ抗体和标准比色染料检测捕获在板上的ifnγ。当产生ifnγ的细胞最初在平板上时,留下暗点。从这些测定得到的数据包括斑点计数、斑点中值大小和斑点中值强度。这些是t细胞产生ifnγ的频率和每个细胞ifnγ的量的测量。另外,对clt抗原应答大小的测量可以从刺激指数(si)得到,所述刺激指数是特异性应答,以斑点计数或斑点中值大小测量,除以对无特异性肽的单核细胞的背景应答。刺激强度的度量通过将用于斑点数量的刺激指数乘以用于斑点强度的刺激指数而得到。以这种方式,对clt抗原和对照抗原的应答的比较可以用于证明幼稚受试者含有clt抗原反应性t细胞的稳健的库,其可以通过用基于clt抗原的免疫原性制剂接种而扩增。表6提供了诱导来自hla匹配的正常供血者的显著cd8t细胞应答的clt抗原衍生肽的列表。结果示于图56-63,横条代表数据的平均值。m+ t表示没有肽的阴性对照(单核细胞和t细胞)。cef表示阳性对照(23cmv、ebv和流感肽的混合物)。统计学显著性用kruskall wallis检验单向anova测量,用dunns校正对重复测量进行校正。图56显示了来自正常供血者的cd8t细胞对受hla-a*02:01限制的来自clt抗原1(图中的clt001)的肽的显著应答。图57所示的实施例显示了也受hla-a*02:01限制的来自正常供体对衍生自clt抗原2(图中的clt002)的肽的cd8应答。图58显示了来自正常供血者的对受hla-a*02:01限制的来自clt抗原4(图中的clt004)的肽的显著cd8t细胞应答。图59显示了来自正常供血者的cd8t细胞对受hla-a*03:01限制的来自clt抗原5(图中的clt005)的肽的
显著应答。图60显示了来自正常供血者的对受hla-b*07:02限制的来自clt抗原6(图中的clt006)的肽的显著cd8t细胞应答。图61示出了来自正常供血者的对受hla-a*03:01限制的来自clt抗原7(图中的clt007)的肽的显著cd8t细胞应答。图62显示了正常供血者对受hla-a*02:01限制的来自clt抗原8(图中的clt008)的肽的显著cd8t细胞应答。图63显示了在记忆性cd45ro阳性cd8t细胞(图a和c)中缺乏对受hla-b*0702限制的来自clt抗原1和4(图中的clt001和clt004)的肽的应答。相反,来自相同供体的原初cd45ro阴性cd8t细胞对来自clt001和clt004的肽显着应答(图63,小图b和d)。
[0505]
表6:诱导来自hla匹配的正常供血者的显著cd8t细胞应答的clt抗原衍生肽
[0506][0507]
实施例5-用clt抗原肽五聚体染色反应性t细胞,并证明它们杀伤肽脉冲的或clt表达的靶细胞。
[0508]
健康供体和黑色素瘤患者中clt抗原特异性的循环cd8t细胞的存在和活性可通过使用hla i类/肽-五聚体(“五聚体”)染色和/或体外杀伤测定法来测量。因此,将这些方法学应用于使用实施例1和2(表1-3,图1-53)中阐明的方法发现的clt抗原可以用于证明癌症患者中存在对clt抗原的治疗相关t细胞应答。
[0509]
对于这些研究,使用各种培养方法(例如抗cd3和抗cd28包被的微珠加白细胞介素-2)扩增从健康供体或患者血液分离的cd8t细胞。然后可以使用clt肽五聚体,针对其t细胞受体的特异性clt抗原反应性染色扩增的细胞,所述clt肽五聚体由在hla分子的肽结合槽中结合相关clt抗原肽的hla i类分子的五聚体组成。通过用对五聚体结构的卷曲螺旋多聚化结构域特异的藻红蛋白或别藻蓝蛋白缀合的抗体片段检测来测量结合。除了五聚体染色之外,可以询问其他表面标记,例如记忆标记cd45ro和溶酶体释放标记cd107a。五聚体阳性与特异性表面标记的关联可用于推断五聚体反应性t细胞群的数目和表型(记忆&幼稚/干细胞)。
[0510]
五聚体染色的细胞也可使用荧光激活细胞分选仪(facs)分选和纯化。然后可以在体外杀伤测定法中进一步测试分选的细胞杀伤靶细胞的能力。这些测定包括cd8t细胞群和荧光标记的靶细胞群。在这种情况下,cd8群是clt抗原特异性或cd8t细胞五聚体分选的,并且对已知诱导强杀伤应答的阳性对照抗原如mart-1是特异性的。这些研究的靶细胞可以包括表达hla-a*02的肽脉冲t2细胞,用hla-a*02、03、b*07转染的肽脉冲c1r细胞,先前显示表达clt/clt抗原的黑色素瘤细胞系,用clt开放读码框转染的患者肿瘤细胞或细胞系如caski。用于脉冲t2或c1r细胞的肽包括clt抗原肽或阳性对照肽。靶细胞死亡通过摄取7aad来指示。这样,当靶细胞被cd8t细胞介导的凋亡杀死时,它们获得红色荧光。因此,将这种杀
伤测定法应用于五聚体分选的clt抗原特异性cd8t细胞可用于计算黑色素瘤患者或健康供体t细胞的离体培养物中clt抗原特异性t细胞的细胞毒性活性。
[0511]
图64显示了用衍生自clt抗原4的肽,肽applgsepl(上图)对健康供体cd8t-细胞的hla五聚体染色。底部的图显示了肽脉冲的c1r的抗原特异性杀伤。b7通过这些cd8t细胞靶向细胞。体外杀伤分析的阴性对照包括来自人巨细胞病毒(hcmv)的无关肽,但没有肽。图65显示了用衍生自clt抗原8的肽-肽slyghihnea对健康供体cd8t细胞的hla五聚体染色,然后对五聚体阳性细胞进行荧光激活细胞分选并使用抗cd3和抗cd28包被的珠加il-2扩增14天。右图显示了这些cd8t细胞对肽脉冲的a2靶细胞的非常弱的抗原特异性杀伤,但是对用clt抗原8的开放阅读框转染的caski细胞的有效的抗原特异性杀伤。该体外杀伤测定法的阴性对照包括没有肽的无关t2细胞和未转染的caski细胞。
[0512]
实施例6-验证黑色素瘤细胞中clt表达的试验
[0513]
a)黑色素瘤细胞系中clt表达的qrt-pcr验证
[0514]
定量实时聚合酶链式反应(qrt-pcr)是一种广泛使用的技术,用于确定存在于从给定生物样品提取的rna中的特定转录物的量。针对目的转录物设计特异性核酸引物序列,通过一系列热循环仪反应亚序列扩增引物之间的区域,并通过使用嵌入染料(sybr green)进行荧光定量。针对clt设计引物对,并针对从黑色素瘤细胞系或原发性患者组织提取的rna进行分析。非黑色素瘤细胞系用作阴性对照。使用的黑色素瘤细胞系包括colo 829(atcc参考crl-1974)、mewo(atcc参考htb-65)、sh-4(atcc参考crl-7724)和对照细胞系hepg2(肝细胞癌,atcc参考hb-8065)、jurkat(t细胞白血病,atcc参考tib152)和mcf7(腺癌,atcc参考htb-22)。患者来源的黑色素瘤组织获自6个原发性损害和6个转移,所有均来自至少iic期疾病的患者。从每个样品中提取rna,并按照标准方法逆转录成cdna。使用针对每个clt的两个区域设计的引物和参照基因,按照标准技术进行sybr green检测的qrt-pcr分析。相对定量(rq)计算如下:
[0515]
rq=2[ct(参考)-ct(目标)]。
[0516]
这些实验的结果示于图66中。图a显示了来自qrt-pcr测定的结果,其中使用靶向提取自三种黑色素瘤细胞系和四种非黑色素瘤细胞系的rna上的编码clt抗原1(seq id 56)的clt的不同区域的两个引物组(1+2和3+4)。图b显示了来自qrt-pcr测定的结果,其中使用靶向提取自三种黑色素瘤细胞系和四种非黑色素瘤细胞系的rna上的编码clt抗原2(seq id 57)的clt的不同区域的两个引物组(5+6和7+8)。图c显示了来自qrt-pcr测定的结果,其中使用靶向提取自三种黑色素瘤细胞系和四种非黑色素瘤细胞系的rna上的编码clt抗原3/4(seq id 58)的clt的不同区域的两个引物组(9+10和11+12)。图d显示了来自qrt-pcr测定的结果,其中使用一种引物组(88+89),其靶向在从三种黑色素瘤细胞系和四种非黑色素瘤细胞系提取的rna上的编码clt抗原5(seq id 59)的clt。图e显示了来自qrt-pcr测定的结果,其中使用靶向提取自12个黑色素瘤组织样品和一个非黑色素瘤细胞系的rna上的编码clt抗原6(seq id 60)的clt的不同区域的两个引物组(76+77和78+79)。图f显示了来自qrt-pcr测定的结果,其中使用靶向提取自12个黑色素瘤组织样品和一个非黑色素瘤细胞系的rna上的编码clt抗原7(seq id 61)的clt的不同区域的两个引物组(44+45和46+47)。图g显示了来自qrt-pcr测定的结果,其中使用靶向提取自12个黑色素瘤组织样品和一个非黑色素瘤细胞系的rna上的编码clt抗原8(seq id 62)的clt的不同区域的两个引物
组(80-81和82-83)。这些结果证实与非黑色素瘤细胞系相比,clt在从黑色素瘤细胞系或组织提取的rna中特异性表达。在分析的两个或更多个细胞系或组织样品中检测到每种clt,在非黑色素瘤对照细胞系中检测到极少表达或没有检测到表达。
[0517]
b)黑色素瘤细胞中clt表达的原位rnascope验证
[0518]
转录物表达分析的原位杂交(ish)方法使得给定转录物的存在和表达水平在标本的组织病理学背景中可见。传统的rna ish测定包括用对所需rna序列的短片段特异的寡核苷酸探针原位识别天然rna分子,这通过由抗体或基于酶的比色反应的组合产生的信号来显现。rnascope是最近开发的基于原位杂交的技术,其具有更先进的探针化学,确保产生的信号的特异性并允许靶转录物的灵敏的单分子可视化(wang等2012j mol diagn.14(1):22-29)。转录物分子的阳性染色在给定细胞中表现为小的红点,多个点指示存在多种转录物。
[0519]
设计针对clt的rnascope探针,并在12个福尔马林固定、石蜡包埋的皮肤黑色素瘤肿瘤核心的切片上进行分析。如下在来自每个核心的代表性图像上进行表达信号的评分:
[0520]
·
估计的clt探针阳性染色的%细胞,四舍五入至最接近的10
[0521]
·
跨越给定的部分的每个细胞表达的估计的水平为estimated level of per cell
[0522]
expression across the given section as:
[0523]
·
0=无染色
[0524]
·
1=每个细胞1-2个点
[0525]
·
2=每个细胞2-6个点
[0526]
·
3=每个细胞6-10个点
[0527]
·
4=每个细胞》10个点
[0528]
在许多不同的患者肿瘤核心上检测每种clt的表达,独立地验证来自肿瘤衍生的rnaseq数据的clt发现,并证实在某些样品中肿瘤组织内的表达同质性,还突出了在所分析的每个患者核心中至少一种clt的存在。
[0529]
表10
–
黑色素瘤患者组织核心中的rnascope得分
[0530][0531]
[0532][0533]
实施例7-使用clt抗原或clt抗原融合蛋白池离体刺激t细胞
[0534]
来自健康供体或患有给定癌症的患者的t细胞可以在体外(离体)刺激以激活识别特定clt抗原的t细胞克隆,随后快速扩增以产生大量clt反应性t细胞,其中可以预期所得的抗肿瘤活性。在癌症患者的情况下,这种方法可以被开发为抗癌治疗剂。使用这种方法涉及许多步骤。
[0535]
a)相关患者免疫细胞的分离
[0536]
必须分离来自供体(健康或癌症患者)的t细胞,而且可能需要自体抗原呈递细胞(apc)。免疫细胞的来源可以通过血液抽取或单采血液成分术从外周血获得。或者,可以从肿瘤浸润淋巴细胞(til)分离t细胞,所述肿瘤浸润淋巴细胞获自患者肿瘤的新鲜活组织检查或切除。apc可以是分化簇(cd)14-阳性单核细胞或树突状细胞(dc),其来源于单采血液成分术产物的单核细胞级分。dc可以通过以下方法产生,例如通过cd14捕获的阳性分离(例如,抗cd14抗体与磁珠偶联,其中cd14阳性细胞用磁珠标记并捕获在磁柱上)或通过其粘附性质的分离,例如通过用细胞培养皿孵育外周血单个核细胞(pbmc)4-48小时以允许单核细胞粘附而粘附于组织培养塑料。通过充分描述的方法,dc可从cd14阳性或粘附免疫细胞级分产生,所述方法利用细胞因子,例如但不限于:gm-csf、il-4、tnfα、il-1β、il-6、前列腺素e2。在2-7天的过程中与这样的细胞因子的孵育允许cd14+单核细胞分化成dc,通常dc将失去cd14的表达和dc标志物如cd11c的上调表达、高水平的mhc ii类等。用于选择和/或刺激的t细胞的性质可以是pbmc的单核细胞耗尽级分(在t细胞的单采血液成分术来源的情况下)、使用基于标记物(例如cd3)的表达的分离技术的全t细胞分离、或特定t细胞亚群(例如但不限于cd4、cd8、cd45ro、cd45ra、ccr7、cd62l、cd27等)的标记物的存在或不存在。
[0537]
b)识别clt抗原的t细胞选择
[0538]
在用apc刺激之前,可以采用一些方法来选择t细胞。这些方法包括肽-hla(phla)多聚体方法,如四聚体、五聚体、葡聚糖聚体或类似物,以标记表达识别给定phla的tcr的t细胞。这样的phla将基于实施例2中所述的质谱(ms)实验来定义,和/或基于预测算法来预测结合特定hla同种异型的肽。多聚体可以具有标签,例如藻红蛋白(pe),其可以使用荧光激活分选或经由缀合至磁珠的抗pe抗体来分离。或者,针对标签的抗体可以直接与磁珠缀
合。为了分离识别来自不同clt抗原的不同phla的不同t细胞,可以产生具有相同或不同标记的多聚体,或者可以将不同多聚体与磁珠缀合。
[0539]
c)t细胞的刺激
[0540]
为了来自加强癌症患者的对clt抗原的预先存在的(记忆)或刺激新的(幼稚的)t细胞应答,可以将患者的t细胞暴露于apc,所述apc在i类和ii类hla复合物的情况下将衍生自clt抗原的肽呈递到表面上。例如,多clt抗原(预期由患者的肿瘤表达)可以外源递送至黑色素瘤患者的apc以导致clt抗原衍生肽呈递在表面的hla复合物上。可以通过串联多肽递送或作为单个clt抗原,如基于合并的mrna的递送方法引入多个clt抗原。或者,apc上的hla分子可以荷载有衍生自clt抗原的外源合成肽。稳定的成熟mrna向apc递送(即转染)的方法可以包括用于将核酸递送到细胞中的经典试剂,例如聚乙烯亚胺(pei)或磷酸钙。或者,使用基于脂质的试剂转染到apc中可以实现有效转染。这些转染反应使用合成的、体外转录反应(ivt)衍生的mrna,其配制在脂质复合物中,例如脂质纳米颗粒(lnp)或基于脂质的脂质复合物(通过mrna与脂质试剂的简单混合形成)。为了产生这些mrna,可以使用重组dna构建体作为合适的编码clt抗原的mrna的ivt的模板,所述重组dna构建体含有噬菌体t7 dna依赖性rna聚合酶的充分描述的启动子元件,接着是编码高稳定性mrna 5'utr的cdna、编码clt抗原的密码子优化的开放阅读框(orf)的cdna、编码高稳定性mrna 3'utr的cdna、》20个核苷酸的多聚a序列和设计为释放功能性多聚a尾的独特限制性内切核酸酶位点。为了产生表达人apc的ivt mrna编码抗原,可与使用与cafri等,nat.comm.2019所述类似的脂质复合物方法。简言之,将apc(单核细胞或dc)铺板于组织培养瓶中,达到70-90%的汇合。将基于脂质的转染试剂(例如lipotectamine
tm messegermax
tm
或hd或类似物)在无血清培养基如opti-mem
tm
中适当稀释,与编码clt抗原的mrna混合并孵育。这可以用多种clt抗原mrna进行,用于将clt抗原的组合转染至apc。mrna与脂质试剂的孵育时间短(5-10分钟)且在室温。将得到的mrna-脂质复合物加入apc并在37℃/5% co2孵育16-72小时,这取决于编码clt的mrna分子的翻译肽的最佳呈递时间点。
[0541]
用所述方法将clt抗原递送到apc将导致clt抗原多肽在apc的细胞质中表达,这又将导致来自多肽的肽片段的细胞加工以在i类和ii类hla分子上呈递。当t细胞(如(b)中所述选择的或来自单采血液成分术或til来源的未选择的t细胞)与在细胞表面表达clt抗原衍生肽-hla复合物的apc共培养时,除了共刺激分子和来自apc的信号之外,具有对给定phla具有特异性的tcr的那些t细胞将通过与phla复合物接合而被刺激。这将导致相关t细胞的活化、分化和增殖。例如,在如上所述的方法中用编码ivt mrna的clt抗原成功转染apc之后,在含有细胞因子的培养基(例如il-6和il-12或在所用基础培养基中补充的其它细胞因子)中自体cd3+分离的t细胞将与apc以过量t细胞与apc的比例共培养,例如每1个apc对应10个t细胞(1:10)。将细胞共培养少至过夜或长达1周以刺激t细胞,但通常18-48小时,如果需要,在此之后t细胞可以在扩增之前进行富集。
[0542]
d)刺激的t细胞的富集
[0543]
如果需要,可以在扩增步骤之前进一步富集已经被表达clt抗原的apc刺激的t细胞。可以选择t细胞活化的标记(例如cd137、cd107a、cd69、ox40或与活化状态相关的其它表面标记)或t细胞功能性应答的标记(例如,t细胞分泌细胞因子例如tnfα或ifnγ),以便富集可能是clt抗原特异性的那些细胞的t细胞群。这种富集方法可包括通过facs的细胞分选
或基于珠的捕获方法,例如,使用与磁珠缀合的cd137或类似物的抗体。可以平行(例如,cd137和cd69双阳性的细胞)或顺序(例如,选择cd137阳性的细胞并随后选择cd69阳性的cd137+细胞)使用多种富集策略。这样的阳性选择应该除去那些可能不被表达clt抗原的apc刺激的t细胞。
[0544]
e)刺激的t细胞的快速扩增
[0545]
在用其中引入了clt抗原的apc刺激t细胞后,使用基于文献中描述的方法,可以快速扩增大量或富集的(参见以上(d))t细胞,以达到总数>108个细胞,并具有用于优化的潜在修饰(例如,jin等,j immunother,2012)。这些方法利用细胞因子如il-2和刺激性抗体如抗cd3以及潜在辐射的来自pbmc的自体细胞(称为“饲养”细胞)。或者,可使用针对cd3和cd28的刺激性抗体以避免使用饲养细胞。该方法可以使用专门的气体可渗透的烧瓶(例如g-rex烧瓶)或封闭的扩增系统(例如wave生物反应器)来进一步自动化或增强。根据开始时t细胞的数量,在少至7-14天内可以实现t细胞的显着扩增(100-1000倍)。
[0546]
f)测试扩增的t细胞以证明clt抗原免疫原性
[0547]
为了证明离体自体刺激方法已经扩增了识别表达clt抗原的靶细胞(包括肿瘤细胞)的t细胞,可以使用对应于特异性clt抗原肽-hla(phla)复合物的多聚体来检测具有对特定clt抗原phla的反应性的t细胞的存在。来自clt抗原组合的多个phla可以与不同的标记物一起使用,以证明离体刺激的t细胞识别超过1个clt抗原。
[0548]
功能性测定也将证明离体免疫的t细胞应答呈递来自clt抗原的肽的靶细胞的能力。这可以通过各种方法来实现。首先,可以进行细胞因子释放试验,以测试来自离体刺激的t细胞与靶细胞共培养的t细胞活化(例如,ifnγelispot试验)。或者,t细胞介导的靶细胞杀伤可以用细胞毒性测定来测量,例如基于facs的方法来评估与t细胞共培养的靶细胞的细胞死亡(例如通过7-aad测量),或其它方法,例如监测靶细胞凋亡的标记物或测量铺于特化表面上的粘附靶细胞的阻抗(细胞生存力的电测量)的那些。
[0549]
多种方法可用于产生用于此类测定的靶细胞。例如,具有与用于离体刺激的apc匹配的hla的合适的人细胞可以用衍生自clt抗原的肽脉冲,已知所述肽呈递在i类hla分子上(如从质谱实验解卷积-参见实施例2)。此外,也可以评估与apc的hla类型匹配的肿瘤细胞系。最后,可以评估原发肿瘤细胞(特别是来自相同患者供体的肿瘤细胞,用于该方法的起始t细胞和apc来源于该供体)。
[0550]
总之,这些方法可用于证明a)人t细胞能够使用自体apc用clt抗原离体“免疫”,b)免疫的t细胞相对未免疫的t细胞能够潜在地富集,c)免疫的t细胞可以快速扩增以产生高出数对数倍的总细胞数,和d)快速扩增的免疫的t细胞保留识别表达它们针对其免疫的相同hla和clt抗原的靶细胞的能力。这些数据将支持应用于具有一种或多种clt抗原的癌症患者的离体刺激方案在控制癌症中具有治疗价值的可能性。
[0551]
实施例8-clt抗原融合蛋白设计的方法
[0552]
促进多多肽抗原混合物递送的一种方法是通过将多组分抗原的orf组合到单个orf中,导致合成抗原融合蛋白。此外,不是将组成多肽直接连接在一起,而是可以通过肽接头区域将它们连接以:1)降低在模拟正常人蛋白的融合连接处产生新表位的潜在风险(增加安全性)和2)确保以模拟当从由肿瘤组织编码的单独orf表达时clt抗原t细胞表位呈递的方式加工与融合体/接头邻接的clt抗原t细胞表位(增加效力)。为了实现连接以便于设
计安全有效的融合蛋白,开发了一种算法。在该算法中使用简单的短接头,因为这些接头对于实现上述目标是优越的。为此,选择多个基于gly的接头,其中一些还含有lys残基以消除与正常人蛋白质的同一性并促进在组分clt抗原末端的加工(ggg、gggg、kgg、ggkgg、gggkgg、ggk;分别为seq id no:71-75、84)。
[0553]
为了该实施例的目的,将该算法应用于两组不同的clt抗原,clt抗原1、2、4、6、7和8(clt抗原融合蛋白1和2)和clt抗原1-8(clt抗原融合蛋白3和4)。
[0554]
为了实现上述需要,在四个单独的融合蛋白(针对六-clt抗原刺激的clt抗原融合蛋白1/clt抗原融合蛋白2和针对八-clt抗原刺激的clt抗原融合蛋白3/clt抗原融合蛋白4)的每一个的设计中考虑六种标准。这些被逐一应用,然后根据需要以迭代方式重复以确保最终融合蛋白候选物满足所有标准。
[0555]
首先,设计融合蛋白序列,使得含有连接肽的任何部分的9聚体肽不能与人类蛋白质组相同,如通过standalone blast ver2.9.0进行的blastp搜索所确定的(altschul等,j.mol.biol.1990)。为了完整起见,针对从ensemble数据库提取的三个蛋白质组子数据库进行该blast搜索(www.ensembl.org);swissprot人类蛋白质组、trembl ensembl人类up000005640蛋白质组和trembl全人类蛋白质组(创建于14/08/2019)。
[0556]
第二,设计融合蛋白序列,使得含有接头肽的任何部分的9聚体肽不能成为由netmhcpan 4.0(andratata&nielsen,bioinformatics 2016)预测的mhc i类超型(见下文)的强效结合物(秩≤0.5)。为了产生编码适用于黑色素瘤治疗的clt抗原的融合蛋白,对黑色素瘤患者的靶群重要的mhc i类hla是关键驱动因素,导致选择下列超型:hla-a*01:01、hla-a*02:01、hla-a*03:01、hla-a*11:01、hla-a*24:02、hla-a*25:01、hla-a*26:01、hla-a*68:01、hla-b07:02、hla-b*08:01、hla-b*18:01、hla-b*27:05、hla-b*35:01、hla-b*35:03、hla-b*40:01、hla-b*40:02、hla-b51:01、hla-c*07:01、hla-c*07:02。
[0557]
第三,设计融合蛋白序列,以便发现hla结合肽(见实施例2)与其c-末端精确对齐的clt抗原优先定位在融合蛋白设计的c-末端,以帮助确保c-末端锚定残基(当在肿瘤组织中表达时通常由终止密码子释放)在融合蛋白的情况下类似地产生。当对于这样的clt抗原不可能进行c-末端放置时,基于用netchop 3.1server(nielsen等,immunogenetics 2005)进行的蛋白酶体切割位点预测进一步优化接头序列以选择预期产生在真实的(终止密码子产生的)cta抗原多肽中发现的c-末端的接头序列。
[0558]
第四,设计融合蛋白序列,以便通过调节接头或在某些情况下通过从组分clt抗原中除去n-末端甲硫氨酸,改变含有预测为所选mhc i类超型(见上文)的弱结合物(秩得分≤2.0)的接头肽的任何部分的所有9-mer肽序列,以消除或减少结合。采用截短n-末端甲硫氨酸作为消除预计弱结合选定mhc i类分子的9聚体的策略,因为甲硫氨酸很少发现于mhc i类结合肽的n-末端位置(abelin等,immunity 2017;alvarez等,molecular&cell proteomics 2019)。预测为高频hla i类的弱结合者的肽序列(hla-a*02:01、hla-a*03:01、hla-b*07:02)的消除/减少优先进行改变。尽可能地,通过使用相同的程序实现预测为对所有其它所选超型(见上文)的弱结合剂的肽序列的消除/减少。
[0559]
第五,由于融合蛋白的一个应用是在初免/加强抗原刺激方案中,设计用于该目的融合蛋白对的设计,以便不允许直接重复clt抗原连接以减少表位重复。
[0560]
第六,融合蛋白对被精制以除去在初免和加强构建体之间重复的预测的弱结合表
位(对clt抗原融合蛋白3和4实施)。这是通过排除n-末端甲硫氨酸残基(参见上述n-末端甲硫氨酸去除的基本原理)或通过使用替代接头(参见上文)来实现的。
[0561]
clt抗原设计的实施
[0562]
上述融合蛋白设计策略的结果是图67-70中以图解形式显示的四种构建体(clt抗原融合蛋白1(seq id no:76),clt抗原融合蛋白2(seq id no:77),clt抗原融合蛋白3(seq id no:78),clt抗原融合蛋白4(seq id no:79))。
[0563]
实施例9-clt抗原或clt抗原融合蛋白的集合的抗原性
[0564]
如实施例1-6中所述发现和验证的单个clt抗原和如实施例8中所述设计的clt抗原融合蛋白预期在胞质溶胶中翻译、蛋白水解加工,并与hla i类分子结合呈递在细胞表面上。将编码单个clt抗原的cdna构建体或编码融合蛋白盒的cdna构建体的集合(2个或更多个)转导入人细胞,免疫沉淀hla i类分子,并进行实施例2中描述的ms分析以发现clt抗原。这样做是为了证明多个外源插入的个体clt抗原和/或clt抗原融合蛋白盒维持与先前在肿瘤组织中鉴定的组分clt抗原相似的抗原呈递特性(显示实施例2)。
[0565]
基于ms的免疫表位分析是一种允许直接检测与hla i类分子相关的特异性肽的有效技术。然而,检测单个肽的能力受其生物物理性质的影响,其受到细胞中存在的蛋白水解活性和用于这些研究的细胞系中表达的hla等位基因的限制。因此,该方法不大可能发现组织或细胞样品中所有先前鉴定的hla结合肽。然而,检测的hla i类结合肽的库将证实组合多个clt抗原的价值,作为单独clt抗原编码构建体的池或作为在递送来自clt抗原的肽表位中测试的融合蛋白设计的部分。
[0566]
为了完成多个外源插入的单个clt抗原和/或clt抗原融合蛋白设计的基于ms的研究,用在合适的polii启动子和5'和3'utr控制下编码单个clt抗原或clt抗原融合蛋白盒的池的质粒dna转导培养的人细胞。扩增后,裂解培养的细胞,并通过抗hla i类抗体捕获来亲和纯化hla i类-肽复合物。然后将分离的hla分子和结合的肽彼此分离,并通过nuplc-ms/ms分析洗脱的肽。然后,通过使用peaks
tm
软件(v8.5和vx,bioinformatics solutions inc)分析从这些hla i类下拉获得的ms/ms谱。对于ms/ms解释,软件用相关的单个clt抗原或clt抗原融合蛋白的多肽并行评估在人类蛋白质组中含有的多肽的所有理论谱。对于这些研究,所分析的序列的库含有相关clt抗原和人类蛋白质组的序列是必要的,因为在细胞中发现的绝大多数i类hla结合肽来源于组成型表达的蛋白质。
[0567]
这些研究的结果鉴定了由转导细胞的hla i类库加工和呈递的单个clt抗原衍生肽。这些数据的分析用于证明多clt抗原的组合,作为单个cdna的混合物和/或作为clt抗原融合蛋白设计的部分,已经导致来自clt抗原的肽的有效呈递。此外,这些研究的结果显示,来自所测试的蛋白融合物的接头区的表位不能有效地呈递在融合蛋白cdna转导的细胞中。
[0568]
总之,这些数据可以为来自组合使用的多个clt抗原的clt抗原表位的翻译、加工和呈递提供强有力的支持。这支持了设计用于刺激和扩增t细胞的治疗模式的开发,所述t细胞识别患者中发现的肿瘤上的clt抗原肽/hla i类复合物。
[0569]
实施例10:clt抗原表达细胞系的杀伤。
[0570]
抗原的免疫原性可以使用与实施例5中描述的clt-肽-反应性t细胞组合的转染的细胞系来证明,所述抗原来源于表达多clt抗原的细胞,或者来源于多个单独clt抗原的池或者clt抗原融合蛋白开放阅读框。通过clt抗原-特异性cd8t细胞对用多clt抗原转染的细
胞系的杀伤用于证明在癌症患者中存在针对clt抗原组合的治疗相关t-细胞应答。
[0571]
使用实施例8中所述的构建体转染的caski细胞作为实施例5中所述的杀伤测定法的靶细胞。对使用衍生自clt抗原1、2、3、4、5、6、7和8的hla五聚体从健康供体和黑色素瘤患者分离的相关cd8t细胞系分别进行这些被转染的靶细胞的杀伤能力的测试,所述被转染的靶细胞被多种clt抗原或clt抗原融合蛋白转染。阴性对照细胞是未转染的caski或用无关构建体转染的caski细胞。
[0572]
序列表
[0573]
seq id no:1(clt抗原1的多肽序列)
[0574]
mwnffrreltsngfpenfsldvpantynalksrlcdpnadhtscpspcslhaagalpgtgrqrwrvelahladrklslrdvsrlrqggerrsgiavkvvrggagfaarlqgsvtlvqqgwffprlggcqawwrmgavvwcgelltcts
[0575]
seq id no:2(clt抗原2的多肽序列)
[0576]
mtgvlirrgdlvtdmvacriktfrghtekaaicktrkessaetspadslildfqplqlmssfstlasldk
[0577]
seq id no:3(clt抗原3的多肽序列)
[0578]
mntpnivslrahqpevgiipsvllmrplrikgvfhhihsplhgenqgftlclqgappsssv
[0579]
seq id no:4(clt抗原4的多肽序列)
[0580]
maktkgslsvfrelhpaaafdravhflflelwlpepmlsssppsstapllgseplrhweaslsr
[0581]
seq id no:5(clt抗原5的多肽序列)
[0582]
mlprtprpdlillqllpaglrqllqtsgpdneqpieqdlicnvc
[0583]
seq id no:6(clt抗原6的多肽序列)
[0584]
mwnslearspksrccstgpweavqenllwasllapggatifpdpwllkaspsslphlhrtspcaclcpnfpfykdtvllhqgpr
[0585]
seq id no:7(clt抗原7的多肽序列)
[0586]
mamgqrtpslaelrkssatfltcnlgaqaekrsrapgkltyvstivldapvtkleqglvmkrykivtqgfdytsves
[0587]
seq id no:8(clt抗原8的多肽序列)
[0588]
mcalqgrgaspagaglfhwtmspfllgslyghihneav
[0589]
seq id no:9(来自clt抗原1的肽序列)
[0590]
vqqgwffpr
[0591]
seq id no:10(来自clt抗原1的肽序列)
[0592]
vvrggagfaar
[0593]
seq id no:11(来自clt抗原1的肽序列)
[0594]
hladrklsl
[0595]
seq id no 12(来自clt抗原1的肽序列)
[0596]
arlqgsvtl
[0597]
seq id no:13(来自clt抗原1的肽序列)
[0598]
vpantynalk
[0599]
seq id no:14(来自clt抗原1的肽序列)
[0600]
rlggcqawwr
[0601]
seq id no:15(来自clt抗原1的肽序列)
[0602]
antynalksr
[0603]
seq id no:16(来自clt抗原1的肽序列)
[0604]
rlqgsvtlv
[0605]
seq id no:17(来自clt抗原1的肽序列)
[0606]
vpantynal
[0607]
seq id no:18(来自clt抗原2的肽序列)
[0608]
adslildf
[0609]
seq id no:19(来自clt抗原2的肽序列)
[0610]
ssfstlasldk
[0611]
seq id no:20(来自clt抗原2的肽序列)
[0612]
lvtdmvacri
[0613]
seq id no:21(来自clt抗原2的肽序列)
[0614]
lildfqplql
[0615]
seq id no:22(来自clt抗原2的肽序列)
[0616]
mssfstlasl
[0617]
seq id no:23(来自clt抗原2的肽序列)
[0618]
lmssfstlasl
[0619]
seq id no:24(来自clt抗原2的肽序列)
[0620]
lmssfstla
[0621]
seq id no:25(来自clt抗原2的肽序列)
[0622]
qlmssfstla
[0623]
seq id no:26(来自clt抗原2的肽序列)
[0624]
mvacriktfr
[0625]
seq id no:27(来自clt抗原2的肽序列)
[0626]
vtdmvacrik
[0627]
seq id no:28(来自clt抗原2的肽序列)
[0628]
spadslil
[0629]
seq id no:29(来自clt抗原2的肽序列)
[0630]
slildfqpl
[0631]
seq id no:30(来自clt抗原2的肽序列)
[0632]
qlmssfstl
[0633]
seq id no:31(来自clt抗原3的肽序列)
[0634]
ntpnivslr
[0635]
seq id no:32(来自clt抗原3的肽序列)
[0636]
rplrikgvf
[0637]
seq id no:33(来自clt抗原3的肽序列)
[0638]
ntpnivslra
[0639]
seq id no:34(来自clt抗原3的肽序列)
[0640]
vllmrplrik
[0641]
seq id no:35(来自clt抗原3的肽序列)
[0642]
mrplrikgvf
[0643]
seq id no:36(来自clt抗原4的肽序列)
[0644]
ktkgslsvfr
[0645]
seq id no:37(来自clt抗原4的肽序列)
[0646]
aafdravhf
[0647]
seq id no:38(来自clt抗原4的肽序列)
[0648]
afdravhf
[0649]
seq id no:39(来自clt抗原4的肽序列)
[0650]
ktkgslsvf
[0651]
seq id no:40(来自clt抗原4的肽序列)
[0652]
flflelwl
[0653]
seq id no:41(来自clt抗原4的肽序列)
[0654]
svfrelhpa
[0655]
seq id no:42(来自clt抗原4的肽序列)
[0656]
sppsstapl
[0657]
seq id no:43(来自clt抗原4的肽序列)
[0658]
flelwlpepml
[0659]
seq id no:44(来自clt抗原4的肽序列)
[0660]
apllgsepl
[0661]
seq id no:45(来自clt抗原5的肽序列)
[0662]
lprtprpdlil
[0663]
seq id no:46(来自clt抗原5的肽序列)
[0664]
tprpdlill
[0665]
seq id no:47(来自clt抗原5的肽序列)
[0666]
rpdlillql
[0667]
seq id no:48(来自clt抗原6的肽序列)
[0668]
atifpdpwllk
[0669]
seq id no:49(来自clt抗原6的肽序列)
[0670]
fpfykdtvl
[0671]
seq id no:50(来自clt抗原6的肽序列)
[0672]
fpfykdtvll
[0673]
seq id no:51(来自clt抗原6的肽序列)
[0674]
tifpdpwllk
[0675]
seq id no:52(来自clt抗原7的肽序列)
[0676]
ivldapvtk
[0677]
seq id no:53(来自clt抗原8的肽序列)
[0678]
ghihneav
[0679]
seq id no:54(来自clt抗原8的肽序列)
[0680]
slyghihneav
[0681]
seq id no:55(来自clt抗原8的肽序列)
[0682]
slyghihnea
[0683]
seq id no:56(编码clt抗原1的clt的cdna序列)
[0684]
cggggccagtctttcccgtgctattctcgtgatagtgaataagtctcacaagatctgatgggtttatcaggggttttcattttgcttcttcctcattttcttttgctgctgtaatgtaagaaacgccttttgcctcctgccataattctgaggcctcacagccatgtggaacttcttcaggagagaattaacatccaatggattcccagaaaacttttccctcgatgtaccagcaaacacctacaatgccctgaaaagccgcctctgcgaccccaatgcagatcacacgtcctgtcccagcccctgcagcctccacgcggcgggtgcactgccaggcacgggaaggcagcgctggcgagtagaactggcccatctcgcagataggaagctgagcctcagggacgtttcacgccttcgtcaaggtggtgagaggaggagcgggattgccgtgaaggtggtgagaggaggagcggggtttgctgcccgacttcagggatctgtcaccctcgtccagcagggttggttcttcccgaggctgggaggatgccaagcctggtggaggatgggggcggtggtgtggtgtggggagcttctgacttgcacatcctgagggaaccttctgcagctgatgtgtgaactggaccccaggccgtgcctccgaggaatccccaaggctatggcccctcaggtcctgctggggtgttggcccccacctctgcctcagaatgcaggggttctgcagggaagccgcagaccagcctgctgccttgggccctagggacactgcagccccagaaagtactgtgggggacaaaagagttgtttctcgggggagaaaacacctgtgaggaaatgcaggtgccacagagggaaatcctcctggggaggagggtacctgttccatcctcggccgacacgggactgcctggtgcctggtacccacagccgctacctgccgcacgcatctctccatggtttgctaattacttccattagttttaaacaaacttgacaagagacagaagggtccagagagaaattaaatctaactgtttaaacatgt
[0685]
seq id no:57(编码clt抗原2的clt的cdna序列)
[0686]
cacctccatcactgcgaattataattcgacatgagatttgggagatgacacaaaaccaaaccatatcagtctttaaagagttaagttaaaataagctctttaaagtgggccctaatccagtatgactggtgttcttataagaagaggagatttggtcacagacatggttgcatgcagaataaagacttttcgaggacacactgagaaggcagccatctgcaaaacaaggaaagagtcctcagcagaaaccagtcctgcagactccttgatcttggacttccagccactgcaattgatgtcaagcttcagcacccttgcatctctggataaatgaaatgtcaccccagctgccgtccttgttcagatctgtgcaataaagagcaaagcataaaaccaagtcaaggctttgagggagtgacctacaaaatgcataatgtgaaacaatgcaaaagcgaaaggtgcaaaatccccatcaaagagctggaggctgacagatgcgccagtgataattcccatcttccaacacaggagcacagcttccattttccataacagaacaacagccagagcagctggaaggcagggccgcatcccagacttccaccaacaatgggatgagacttgacatctggaatcacaaccacaacagacctgagagacccaccagcttgatgacaagcttcttctttcaaagaaaggtatcagtctgggggacctagtgctgcaaaccatgacaaattaagtgtggcatccctcacttgcataatggaactcagtgatattttttaattaacaagagttatttttatgtaagcttctctcattcctccactgtgcgtgctcgggggctggtggtgaggaaaaagaaaacagctgtgcgggaagcatcaagaaaaggcaagtcatgaagtcttagagatcagtgacatgtaagaaaaagagtgaggagaaaaatattcctactaaagttttccatttgtttaccttccttgtcacatagacttccaagagttagaagtctaggatttgatctccaaatcttcctggcagattactcatcttcatttcattcatatagtccaggggtttgtacaaaggaagatgccagttcttccccaatcataactaagatatcaagagatattcttttgaaatgtaacaaaggagatctgaagttcatctgaaaaaaataaatggttttaggcggtcatgaccatgggatgctggaccaggatggtaagcttcaggaaacagaatctggagaatgcccagctgctcccacaggaagcatcagggaagaagaagaagaggtgtgaagtctgccttctgctctgctgggatccctttcacatctcctttgcctccaggcagttttggt
tcctggccatttccaggtgtgactcactcaggatggtaagcatcttctctcctacccagagtagaggatgaagacctcatctcagaggttgaagggagctccagagagaggtctcaaacttccagcattaactgctaaagaagcttcatgagctgctggagaacctgggaaatgaccaattatagggacagagctcaaatactctgggacactctagtagctgagaaagttccaactccagggtgatagaggactgcctggcaaaccatcatcaaagcagaagacctgatactaacatcacaggctatggtttattactgaagatcagtgcttacaccctgccagaggttcagaagcaaacttatcattgttctccctggagatgttggcccacattctgaaaagtgtggtcagtagtagcaacagaaagcaattgtgcttgccaagcacaatgtcactgtccccagcccttcccccaacacaacccagtaggtgcttcctggctgcaaacttgggaaagtcacttgacctgtctgaggttccacttcctaatctggcctggcgaagataagaaaaacagtttatttaaagtgtctagcaaagtgcttggaccaaaataggacctctgaaatggttatggtagtgctgttaaggtgatgttttaagtgctgatgagcacaaagatgggtaagatattccttctgttaaaatctacagtctaatgagagagaacaagatgaatgcacaataactgtcattcagaacaggattatgagaaggtgtgaatttctgtgaaaaatcagaacagggagtaatatgatcccaggtgattggcagggggtgggggtctggattcaactggagagggagctggcagggaaggcttcctggaggatgagagttcaacaaggggcaggtgtaggatgtgggtggccaagtgactgggcagaaggagctgcagaagtaagaccccaaatcaggaagacaagggcctgctgagaaacacgagctacaaagtgcaagtgcaggaagagttgggatgagattagaagggggtctggggccagactgtggaaggcccaaatgccgggctaaggagtttgtacttaattcagtggtcaacggggagtcattggaggctgttgagcaggagagttgctttctttacagctgtgccagactaaattaaacctaaacagtactttatagctggaaagggaaggcccaggaatagctcttgactcagaaacaggcattggggaaggtaatgagaaacagccgtgactgatcaaagcagagaggttaattaaatttgtaattattgtgaaaggccattaaaaaccctagttcactagagataactgctctagtggggcttcaaagacaaacgcttcttttaaccttgaatagggggatgtttgcttctctgtggaggagatatgattaagatacttaataaatggtagataaaca
[0687]
seq id no:58(编码clt抗原3和4的clt的cdna序列)
[0688]
aaacacactaagggctttgttatggactgaaatgtgtcctctccccagagtcacaggattatgaagccataatcctcaatgtgactatatttggagcaggggcctttacagacataattaaattaaatgaggtcataagagtggggccctagtctgataggactggtgtccttacaagaagagggagagtcctcagagagtcctctctctcggcatggacacaaaagaaaagccatgtgaggacacagagagaaggtggctgtctacgagctaggaagaaaggcctcaccggaaaccaaccctcacagcagctccatcttggacttccagcctccggaactgtgagaaaataaatgtttgcaattcaggtcggttgtattttgtgaaggccatcctagcaaatgaatactcctaacattgtctctttaagagctcaccagcctgaggtaggaatcattccatctgtgttactaatgagaccgctgaggatcaaaggggttttccaccacatccactcacctctacatggcgaaaaccaagggttcactctctgtcttcagggagctccacccagcagcagcgtttgacagagctgttcacttcctcttcctggagctgtggcttccagagcccatgctcagcagttcccctccttcttcgactgctcctctcttaggctcagagccactcagacattgggaagcaagtttgtcaagatgacagagaaccgaggtaatggattcgagtgatgaaacaggaagttcattcatgagtttttggccacacctccaaagtgacgacttagccagaaatgggataactgggtttccctacttctcttttatcatcctcaatgagagtgaccaaatattagagctagatggaaccttagtgaaaatctggctactcgtcccgtcccaccagcctgccacccatttcaagtttgaagagacaaagacacatggaccttatgtaattactggggattaccccaggagtctgtggcaaaagtcagcttcttccctccctgcttccccgccctgtctctggtactttctaccaacactgggctgtttctgtgatcacacttaagcgtacctaacctgcgaatgctgtatagaaggtgctaatgaacatgatttagctttaacactcagttttctaaagggacacgtgggggcagcaaatgtttaggcaaaaacaattccagttctagcctctactgtctacatatgtgtatacatttgggaaacgtttgggaaagggatatttgagagcttctttttcttttttgtggtttagttatttgatgatattgagattgtttctgagccatgtgcttcaacatcggattggggatttcagaaaaagttttagt
cactgtgattccatttagcttccaaatgtgtctctgctaagagacttaaaagcactcataaatagcacgtgtgtcttctttgcagtgtttgctaattttgagtcacatctttttagaaaatcatgagatttggtgtcacagagactggaataaatatagtcaaacttattggtgaagatttcctttagctgttttcataatccatttccattgttatgattattgatgaataaaacattttctttaggtagatacttcttttttccccccaccttgatttaatgtttccactcttattgtcaagtttcttattactccctaataactctcaataaaataatgattcctgggagattattcctgctttcctactatcacctgttgatttgaaaagacagaacaataccgtagaagcttcactaatacattgaaagataaaatgataatactaaatactaaaatatgaaaagtgatactaaaagtggagtcctggcactagtatttttttttttgagtctttaaattttatttatttatttttgaattttttaaaattatatgttatgttctgggatacatgtgcagaacgtgcaggtttgttacataggtatacaggtctggcactagtattttgttgccacaaaatatcaagcatgtatccaaactgctcaagacacattaaagacacaggtaatctgtaggcatattcaggcttgtagtttgcattttttggttttcttgtggctttcagtgcaagttgaggtaattcatgggaaacagtcaccaaagaagtgccagtattagaaatccaagagccatttctctagcttcttccagaatcaagactttagaggtaatttctatcaacactggacatttcctgtctgcaattaacaatgaacacatagcattatgtttaattgcaacctgtttaaagcagattggatgctaaggtttaagaacactcttcagtcaaaaaggtcttttaatcaggtttttaatcttgagcacaatctaggacacagcatcatagactaactcattcgagaataggtgttgtcatctaatcctaaccacccccaccaccaacaagctgaatagctctgggctcagtatatacatttgtactgggctcagtacacacacctaagctgggttcagtatatgccactttatagtgagaggcattttgtaatgagagctctgggttcactatatacatttgtactgggctca
[0689]
seq id no:59(编码clt抗原5的clt的cdna序列)
[0690]
ctttcatctttaatttgaccaaaatggaaaccaggatcatgagaattcctcggggctggtgttgaaaggaatttcccctgctcttgccagagtctcgaggggtggcctccttccacgggtgagtaaccacaagtccatgtgaccgaacaaacagcatattcttttgttcaaaagagaaaaacaacattgaaggaaatcagctgaagaaaattgagatgaaagccagtccacgcctcagcatcctgaggaaatgttcttccttgatgctctgagctctctaagaagttaccacaaaaccaaacccatcagaagtttgcaggacgtccttgtttagagctgggaaataaaccacgaaacagcgcaaaggagagtccaggcctgccaatgcttccgcgaactcctcgccccgacctcatccttctccagctcctacctgcaggcctcagacaacttttgcagacctctggtccggacaatgaacaacccatagaacaagatctgatttgtaatgtttgctgatctccaaagtgtaaatactcccaccatgaccaattggaagccactgacaagtcctcactaaatgcagaattgagaagaaacacgaatagcacatcattgtatggtatttccactctaccaatggatgtgaataacctcaagaacacataatgttgagatgtggaaaaatcatcaggaagcctctccccttcaccctgcagtgtctctgcaatgctggtagagtgggctggcacagcccccgcctctggcctggtccgggtccaacctgcctgcctcctggggcagcagctccctgaacgaagagccgcggagaccgaagaactcagtgaatcagcagttctcccagatgaaacgctggcctgaaagcagcctcaagagctttggcccgtcaccttgccttgccttctcttccttcctcgtcctctgtttgttcatctttcctgaaaaaattaagtcagctgttccccttaaccaatttccctggcattctgaagggtaggccacatggcccacctgccagctactcccacctgccaagccttcctgactatatttaccctggtactcccatgtcccggggctgcttcagcagagccaaggacacacccaggtgtttgttttctaggtcagatttcctcagccatgggtgtatctgtgcttgtccctcaaaatcctcatagctcctttccccaccccaacttccaggccagacggggttcaggggtgtctcagctaaggttcccctgaagcagacacaaattagtacaaaagggacttattaggaggtgatccttaaaaatttgggcaggagaatggaaagggtggacacagacaaaaaggatgccaagtgagaatgtgatgattactgctgcagttttctacagctgcctgtcaaactatcccaacacagtggcattgaccagcagccattttcgctatgcccacagcttctgtgggtcaggcgtttggacagggcaatgggaacagcttgtttctgttccatagtgtgtgagggaggcctcaactggaaaactcaaagaccggggtggcttgatgactggaggctggaaccatccggaagcttcttgaa
gctgggttgacttacatgtggtcttgcatgtgagttgggcttttcacatcatggctgttgggttccaagaggcagtgtctggggaacaagagttccaagacaccaaggcagaagctgctagaccttttttgacctcgcttcggatgtcagcaatgaagttctgtggattcaactgcattctattggttaccagcagtcgcttgaatctgattagctccaaaactgagtgagcctctggcaagagtgcattgcagaagggcacatccaatgagaggcgctgctgtagtaacagggacctctccaatggcctgtttgagtgctctcagaatatggcacctgggttcctccagagcaagtgatctgagagagagcaaggagaaggccactctgcctttcatgactcatctcagaagtcacacactatcacaggttctgttctgttcattggaagtgagtcatgaagtccggcccacactcaagagaaaggaaattatgctccttcttttgaaatgagtgtaagaaagtaaaactttgtcaaatgtgtatgtgtgtgtgtgtgtgtg
[0691]
seq id no:60(编码clt抗原6的clt的cdna序列)
[0692]
gaggcctcacagccatgtggaactctctggaggccagaagtccaaaatcaagatgttgcagcactggtccctgggaggctgtgcaggagaatctgctctgggcgtctctcctggctcctggtggtgccacaatcttccctgatccttggcttttgaaggcatcccccagctctctgcctcatcttcacaggacttctccctgtgcctgtctgtgcccaaatttccccttctataaggacacagtcctactgcatcagggcccacgctaatcacttcttcttcactaattacatcggcaaaccccctatttccaagttaagtcatgttctgaggttaggatttcaatacctgaattttaggggacatagttcagcccaaaggacctggggggacagaaacacccaggaaagtccacaggtcagcgcctggacccgcctggccgtgggacattgctcggccgagttcatcctcataaacgctgacgtgtgctagaagatacaatattagtttcataaacaacagtttctttttttgcaaaccatacccacaggtcctattgccacttttcagtgctgcagcagctagtcagatgacaactgggtgagagcttggtctcgagtgtttcctgtgaggccagaatattgctctgattcctcaggggtgactcagccctccggtgggaaatatgtgacctcatttgcatttcctaattgaattgctatcagctttcctgcaagactgcaccaaaaaacagttcttccagattccagcactgcctgcattgcccacagaaaggctgcttttaaatagttgctaagagagggcgacaaaagaaggagaaaagttgccaaatttttatggttcatctaactgtaaagctgtcagttttacccagctccccagagtcgctaaaataatggacagaggaggcggcacttgaagaaacctcgacataagagaaatgaaatttacagaaccaggaaattaggggtccccatgcacctgccctggcagaatctgcttccaggctcctctcaataaacactgccctgggactcccagcgctctgtaaactgatgctttgaaggaggccatttgtttctccagaaccttctgccagcagaactcttgcttaccacgtgcccccatcagaactcccaccttctctaaacacagttaggtagccctctgcatgcatttgtttaaaaaaattaaattgtgagtaatagactataagtacaacagcgtacagaacaccagctaaaaaaatgatggcagaatgagcacctgtcttgccacaagactccctcccaccctctggtgtcccccagcatggcttcctgctgccccctgaaaggaaccctcaaccgactgtaactctgcacctcagtgccacccgaatttggacttcatgggagtgcggtcactcggctgacacgtgttcctgctgccaggcacctgcctgctctccttctttggtctgtttgtgagattcgctggctttgttgcttctagctgcagtttgttcacttttactgccgtataatattccactttaggagcccactgcaatttattgactcattgcaatggtgagggcatgtgtgttgtttccagcttttggtgattatgcgtaagatttctcttaacgtcccgtacagagttcttggtattacctgcctatactgctatgggcatacaccaaaaacgaggcatatgtatatttgactttaatagtaattctgaattgctgtctaaagtgtttgtaccattgtacactcccatcaagagtatacgagtgctgcaaatgtcctttcccagactctgccttattgtctcatttttaagatatatgttttgatgatcagaagttctttttttttttttttttttttgacaggcttttgctctgttgcccaggctggagtgcagtggcatgatctcagctcactgcaacctctacctctcgggctcaagtgattctcctgtttgagactccctagtagctgggattacaggtgtgcaccaccatgcctagctaatttttgtatttttagtggagacagggtttcaccatgttagccaggctggtctcgaactcctgaccttgggtgatctgcccaccttggcctcccaaagtgctgggattacaggcgtgagccaccgcacctggcagaagttcttatttttaataaagtccagtgatcattctttcccgtgtttcacgcttcacgtgccatgtgcgaggaagctttccacacccgggggtcagttcactcccagctgcattgctttgcctttc
ctgtttaggttttcagtccacctcaaatggattttggttgtggtgtgaggtaggggtcattttacttttttcttaaagatgccccattggcccagcatcatttattgaaaagacagtctttcctctgttgtttctgtagaaatgggcaaactttcccccaaatggccagatggtaaatattttaggcatctcaggttaaggggcaaaattgaggacatcgtataggtacttacataaccctttaaaatggaaccatttaaaaatgtaaaaaccagtcttagcttgctggccataaaaggcctgtgggctacagcatgctggcacctgctctacagcactgctcttataataaaaaatcaagcgtctgcaccctgggcatttgacaaggctcatcagattgtaaagatgaactgggtggattttgtagtatgagagttatacgtccatgaagctgatttttaaacacattacatgtctttttctgggctcattatttttgttccaagtgtctatctaatcatctttgcttcaaaatgacaccgttttaatggctgtagttcagtggttctcaaaagggggcagttttgccccccagggaacatttggcagtggctggaaagagctttggttgcatatggaggttatggggctttacctggcgtttagtgggtagaggccaggagtctggcttactatcctgtagcacacaggacagccccaacaacttgtctggaaggatgtgtcctcccatctttttcttgttctaggctaccttcgccctttccatttccattaaaaaat
[0693]
seq id no:61(编码clt抗原7的clt的cdna序列)
[0694]
gtgtgccctttgcagcaaagagcgtggttcctcctcttcctgggtgtaaactgcgattcaaaaagccaggtgggaagccctgtagtagggactctggctttgtccctgtttcccccttttcttcctcttcacccactaaaaccctgttttactcacggttcaaattgtttggcagcctgaattttcatggccatgggacaaagaaccccgtctttagctgaattaaggaaaagttctgcaacatttttgacgtgcaacttgggggctcaagcggagaagcgaagcagagcccctggaaaactcacatatgtgtcaacaatagtccttgatgcccctgtaacaaaacttgagcaaggcctggtgatgaagagatacaagattgtcacccaaggatttgattatacctctgttgaaagttaatgcacactcaaccgaatatggcaattggtactctcaattctatattctcaacaattacagtgaagatacaagtagaatacaatcactgccacattttttgaaattctgtgtaaactgtaatattctgtcaacattaatgacatttgaagtgtcctgtcaaaacaattgcagctactttatgtataaaacatattaaataggctcatccaacttgcattctttattaagcttattttcatattttttcctatggatgaacttaaaaataattttgtttcttaattaagattctatgcatgaagatgctgaataatttaagacaattgttcattcaaatagttgctaattacaccctcctggcatagttattgtattattactacatttaggaataatatgctgtactacttggacttgaaaatgtttctgacattttaatgaacacactacttagttatattttacaagggttttcagtgaaccacagaggattaaaaaatgtcattcaagggttgtagataattaaactgactgaatataagaagcctcatatggaagtgaaaattatgtatgaattttgttgagctggaaatgtgttttactaaatgacttcagatttgttacttttaaatacaagatgaagggaatcaaggggatactttcttctcacctcaatttgttccatttgcataagctattttatctttcaatatcccttttgatatttcattttggcccttgaatacactaaagattatttaaaataaataaatgttgactttgaaatactgctatatatattcattgcaatacatcaggtgggaaattggtgcaattcagtcacacacacaacctcatagatcagatttccagttaagttttaatagaaagagattttagatagacatgactttcaataaaatggaagaatttttattagtttcaaaataatgattttacttgcttatcaacacagttgacctttccccacagtactatgatcttcttagtacctctgctataattatattaatgtcttcctatatctagaaatttgattattattctatttttatggatcattaaatttttctattcaagaatgatccctatagtcaacttcctgagggatttctgcttgctattttctgtttcaattgtgtgcatttcatatttactattaaagattttaaataatgacacattgtttaagcggttgtaagtctgattgttataaagctctctggagaattctgtaagctttcacatctgatggagaacttcaatgagaacatctttaatgtggaattcttggacaagaaactacagattatccatggttcagaagatatgatgaattagtaactatttttccgtacataaaaagtcaatcttcctaaccagtttgttgttttagctaaatgaatcggtcaaatattttagttatattagcaatattttgtctctaaaatatcttgacataaaac
[0695]
seq id no 62(编码clt抗原8的clt的cdna序列)
[0696]
gggtccctggctcggctctacccccatggatctaggtgaggacaggcgctcctgctttcccgcccaaat
gttgtattttccaagcctacccttgccggccacgcccccaacctgggcctataaaaaccgccccccgcaggccctagcgggcagacacactgaagtcgctagacatttgaggaacacatccggggaagaagacacaggtggctggtcatggagagcccgctgggggaagagcacacagacaggcaccggcaggccattgaccagcgggacaaggtggagtttggctggggcagtgggaggagagctggggccgccgagctgccctactccaggggaaaaccacctcccttctcgctcccccatcaccggagagctacttccactcaatacaactttgcactcattctccaagccacgtgtgaccaatttttccggtacaccaaggcgagaaatccggggatacagaaagccctctgtccttgcgataaggtagagggtccaattgagctaacacaagctgcctatagacggcaaactaagagagcacccagtaacacacgcctgctggggcttcaggagcacacacgtccactggggcttcgggagctgtaaacagtcagccctagacactgtcgtgggatcggagccccacagcctgcctgtctgtatgctcctctagaggtctgagcagcggggcgctgaagaaacgagccacactcccatcacacgccctgagaggaggacaagggaacccgtaccgtttcacttgtgatagagataaagttattattgttgtaattttaacttatagaactataatataatggtacaatgatatatattgacaatattcctctttcacccacattttgtatctgtgttcaagattaaatgaaaaaggatattctcaaaaagctagcaaaaccaaaagcaagacgttatgccaaatgtaaacatatttctgtttagcaaatagcaggagtgtataaaacatttctcttttcacataacagaatgttctatgcttactgtattagttaacaaattcaagtctgtttattttgtttgaaattccacttcatccataaattacagcattacacaataacaccagaaggacaatatcaccattgtttgcttttacagtcatctcagcccacaaaatgcttcccattgtcagcttgctatcatcaagctattgttgttttcctctttctggggtcttgtattaatatcattcaaattatttagacactcaacagtgtttttgctatcagtgcaaacctctaaagagctggagccccagcgtgatgaccaaataacccttgactatttatcttgccgtaagtcattatttcctgaggccctggagaagctgtgttgccatgtgtgcactgcagggacggggagcttctcctgccggagctggtttgttccactggacaatgagcccttttctgcttggctctctgtatgggcacatacacaatgaggcggtttagggaagaggggtgatgtgggtcattgataacaacaatccccgaacttcttaaagaattgttgagccccctaaaaatatgttgtctttatgaattatccttaaccctttttaattgcataaaaacttcaggcacttgaaaaaaattaaaaaacgaaaagtaagtctgtctctagtatccctcttctcctttgtagaattacatcctttattcactctgccactatttattatgtgcctcctgtgtgtaagacatactgttagtcattggaaatacagaaatgaatgggacagacacacttcttgccctcatggaacttagggcctaatgggagatacaatgttaaggttgtttctagtgtttttttttttttttaagaatatgttctacatgtatacatgtaatatgtattctctcccatttttaaaaaacataaatggtggtttactatgtgtacgctttttggttttgcattattcttttaacagtatgtagaggatgcattttctactgtatagtgttctgtcccccttaaatagcactctgattttattttgggggggaatcacgactttctaattttgcatactccttgtgggattgtaaatcaggtcccctgtcctcaagtagccaatggttaggtatgcaacccagcttatctctctttagactcaatctcaagcagatccagagttactcaggatcagaacaatatttgaaaggcattaccagaatccagacaagatgatggagcaatacctgatgcccagtggtctagggtagccgattcctgttctgctctccaggctcctgtccattctgtggatcaactcatattgctccaattcattttgttttgcttgcataagccagaattaacttctgttgcttgtaaacaaagagagttaaccaaagacatacagtatatcagagtatagagacctactttactctcggtcattgcctgcatgagtcttctttatatggatgtatcacagtttatttaaccactcccttgtaagtggacatttaagtctagtgttctgtaaataaaaggtcagaatatacgtctgtatacagtatatattcttgcatatccacctttggacagatgtgtgaatgtgttttgtagaaatacatttgtagaaatgcaactgctgggtcaaagaattagtagatttttaataacatcaaacagcgttgaaggcccccatataagaataacaactactgactgaagacataactaattaaaaaaattaattacagcttatttgtaataacttcttattgtcactgagtgaaaaggtaattctcgttgaatttacgaaaagtgactaataggaaatttagaaaactcagagaatatataaaaacacaaagaaaagccagccaccaagtcgcttataattctctcaccaacagtggcagaattacatttagtcatcatcattattcttacatccagttttatagttatttttgaagaggattattatcaactatcaactctgtcatagctggaagtagaggccactaaaacagatttcttaaactccaagta
ctgtatatggattttctac
[0697]
seq id no:63(编码clt抗原1的cdna序列)
[0698]
atgtggaacttcttcaggagagaattaacatccaatggattcccagaaaacttttccctcgatgtaccagcaaacacctacaatgccctgaaaagccgcctctgcgaccccaatgcagatcacacgtcctgtcccagcccctgcagcctccacgcggcgggtgcactgccaggcacgggaaggcagcgctggcgagtagaactggcccatctcgcagataggaagctgagcctcagggacgtttcacgccttcgtcaaggtggtgagaggaggagcgggattgccgtgaaggtggtgagaggaggagcggggtttgctgcccgacttcagggatctgtcaccctcgtccagcagggttggttcttcccgaggctgggaggatgccaagcctggtggaggatgggggcggtggtgtggtgtggggagcttctgacttgcacatcc
[0699]
seq id no:64(编码clt抗原2的cdna序列)
[0700]
atgactggtgttcttataagaagaggagatttggtcacagacatggttgcatgcagaataaagacttttcgaggacacactgagaaggcagccatctgcaaaacaaggaaagagtcctcagcagaaaccagtcctgcagactccttgatcttggacttccagccactgcaattgatgtcaagcttcagcacccttgcatctctggataaa
[0701]
seq id no:65(编码clt抗原3的cdna序列)
[0702]
atgaatactcctaacattgtctctttaagagctcaccagcctgaggtaggaatcattccatctgtgttactaatgagaccgctgaggatcaaaggggttttccaccacatccactcacctctacatggcgaaaaccaagggttcactctctgtcttcagggagctccacccagcagcagcgtt
[0703]
seq id no:66(编码clt抗原4的cdna序列)
[0704]
atggcgaaaaccaagggttcactctctgtcttcagggagctccacccagcagcagcgtttgacagagctgttcacttcctcttcctggagctgtggcttccagagcccatgctcagcagttcccctccttcttcgactgctcctctcttaggctcagagccactcagacattgggaagcaagtttgtcaaga
[0705]
seq id no:67(编码clt抗原5的cdna序列)
[0706]
atgcttccgcgaactcctcgccccgacctcatccttctccagctcctacctgcaggcctcagacaacttttgcagacctctggtccggacaatgaacaacccatagaacaagatctgatttgtaatgtttgctga
[0707]
seq id no:68(编码clt抗原6的cdna序列)
[0708]
atgtggaactctctggaggccagaagtccaaaatcaagatgttgcagcactggtccctgggaggctgtgcaggagaatctgctctgggcgtctctcctggctcctggtggtgccacaatcttccctgatccttggcttttgaaggcatcccccagctctctgcctcatcttcacaggacttctccctgtgcctgtctgtgcccaaatttccccttctataaggacacagtcctactgcatcagggcccacgctaa
[0709]
seq id no:69(编码clt抗原7的cdna序列)
[0710]
atggccatgggacaaagaaccccgtctttagctgaattaaggaaaagttctgcaacatttttgacgtgcaacttgggggctcaagcggagaagcgaagcagagcccctggaaaactcacatatgtgtcaacaatagtccttgatgcccctgtaacaaaacttgagcaaggcctggtgatgaagagatacaagattgtcacccaaggatttgattatacctctgttgaaagttaa
[0711]
seq id no:70(编码clt抗原8的cdna序列)
[0712]
atgtgtgcactgcagggacggggagcttctcctgccggagctggtttgttccactggacaatgagcccttttctgcttggctctctgtatgggcacatacacaatgaggcggtttag
[0713]
seq id no:71(接头序列,用于clt抗原融合蛋白1,2,3和4)
[0714]
ggg
[0715]
seq id no:72(接头序列,用于clt抗原融合蛋白1,2和4)
[0716]
gggg
[0717]
seq id no:73(接头序列,用于clt抗原融合蛋白1和3)
[0718]
kgg
[0719]
seq id no:74(接头序列,用于clt抗原融合蛋白1,3和4)
[0720]
ggkgg
[0721]
seq id no:75(接头序列,用于clt抗原融合蛋白1,2,3和4)
[0722]
gggkgg
[0723]
seq id no:76(clt抗原融合蛋白1的多肽序列)
[0724]
mwnffrreltsngfpenfsldvpantynalksrlcdpnadhtscpspcslhaagalpgtgrqrwrvelahladrklslrdvsrlrqggerrsgiavkvvrggagfaarlqgsvtlvqqgwffprlggcqawwrmgavvwcgelltctsgggtgvlirrgdlvtdmvacriktfrghtekaaicktrkessaetspadslildfqplqlmssfstlasldkggkggmwnslearspksrccstgpweavqenllwasllapggatifpdpwllkaspsslphlhrtspcaclcpnfpfykdtvllhqgprgggkggmamgqrtpslaelrkssatfltcnlgaqaekrsrapgkltyvstivldapvtkleqglvmkrykivtqgfdytsveskggmaktkgslsvfrelhpaaafdravhflflelwlpepmlsssppsstapllgseplrhweaslsrggggmcalqgrgaspagaglfhwtmspfllgslyghihneav
[0725]
seq id no:77(clt抗原融合蛋白2的多肽序列)
[0726]
mwnslearspksrccstgpweavqenllwasllapggatifpdpwllkaspsslphlhrtspcaclcpnfpfykdtvllhqgprgggkggmcalqgrgaspagaglfhwtmspfllgslyghihneavgggkggmamgqrtpslaelrkssatfltcnlgaqaekrsrapgkltyvstivldapvtkleqglvmkrykivtqgfdytsvesggggtgvlirrgdlvtdmvacriktfrghtekaaicktrkessaetspadslildfqplqlmssfstlasldkgggmaktkgslsvfrelhpaaafdravhflflelwlpepmlsssppsstapllgseplrhweaslsrggggmwnffrreltsngfpenfsldvpantynalksrlcdpnadhtscpspcslhaagalpgtgrqrwrvelahladrklslrdvsrlrqggerrsgiavkvvrggagfaarlqgsvtlvqqgwffprlggcqawwrmgavvwcgelltcts
[0727]
seq id no:78(clt抗原融合蛋白3的多肽序列)
[0728]
mwnffrreltsngfpenfsldvpantynalksrlcdpnadhtscpspcslhaagalpgtgrqrwrvelahladrklslrdvsrlrqggerrsgiavkvvrggagfaarlqgsvtlvqqgwffprlggcqawwrmgavvwcgelltctsggktgvlirrgdlvtdmvacriktfrghtekaaicktrkessaetspadslildfqplqlmssfstlasldkgggmntpnivslrahqpevgiipsvllmrplrikgvfhhihsplhgenqgftlclqgappsssvggkggmamgqrtpslaelrkssatfltcnlgaqaekrsrapgkltyvstivldapvtkleqglvmkrykivtqgfdytsveskggmaktkgslsvfrelhpaaafdravhflflelwlpepmlsssppsstapllgseplrhweaslsrkgglprtprpdlillqllpaglrqllqtsgpdneqpieqdlicnvcgggwnslearspksrccstgpweavqenllwasllapggatifpdpwllkaspsslphlhrtspcaclcpnfpfykdtvllhqgprgggkggmcalqgrgaspagaglfhwtmspfllgslyghihneav
[0729]
seq id no:79(clt抗原融合蛋白4的多肽序列)
[0730]
mwnslearspksrccstgpweavqenllwasllapggatifpdpwllkaspsslphlhrtspcaclcpnfpfykdtvllhqgprggggmntpnivslrahqpevgiipsvllmrplrikgvfhhihsplhgenqgftlclqgappsssvgggkggmwnffrreltsngfpenfsldvpantynalksrlcdpnadhtscpspcslhaagalpgtgrqrwrvelahladrklslrdvsrlrqggerrsgiavkvvrggagfaarlqgsvtlvqqgwffprlggcqawwrmgavvwcgelltctsggggmlprtprpdlillqllpaglrqllqtsgpdneqpieqdlicnvcggggmaktkgslsvfrelhpaaafdr
avhflflelwlpepmlsssppsstapllgseplrhweaslsrggggmcalqgrgaspagaglfhwtmspfllgslyghihneavgggkggmamgqrtpslaelrkssatfltcnlgaqaekrsrapgkltyvstivldapvtkleqglvmkrykivtqgfdytsvesggggtgvlirrgdlvtdmvacriktfrghtekaaicktrkessaetspadslildfqplqlmssfstlasldk
[0731]
seq id no:80(密码子优化的cdna序列,编码clt抗原融合蛋白1)
[0732]
atgtggaatttcttccggcgcgagctgaccagcaacggcttccctgagaacttcagcctggacgtgcccgccaacacctacaatgccctgaagtccagactgtgcgaccccaacgccgatcacaccagctgtccatctccatgttctctgcatgccgctggcgctctgcctggaacaggcagacaaagatggcgcgtggaactggcccatctggccgatagaaagctgagcctgagggatgtgtcccggctgagacaaggcggcgagagaagatctggaatcgccgtgaaggtcgtcagaggcggagctggatttgccgctagactgcagggaagcgtgaccctggttcagcaaggctggttcttccctagactcggcggttgtcaagcctggtggcgaatgggagctgttgtttggtgcggcgagctgctgacctgtacatctggcggaggaacaggcgtgctgatcagaagaggcgacctggtcacagacatggtggcctgcagaatcaagaccttcagaggccacacagagaaggccgccatctgcaagacccggaaagagtctagcgccgagacaagccctgccgactctctgatcctggacttccagcctctgcagctgatgagcagctttagcacactggctagcctggacaaaggcggaaaaggcggcatgtggaacagcctggaagccagatctcccaagagccggtgttgtagcacaggcccttgggaagctgtgcaagagaatctgctgtgggcctctctgcttgctcctggcggagccaccatctttccagatccttggctgctgaaggctagccccagctctctgcctcatctgcacagaacaagcccctgcgcctgcctgtgtcctaacttcccattctacaaggacaccgtgctgctgcatcagggccctagaggtggtggaaaaggtggaatggccatgggccagagaacaccttctctggctgagctgagaaagagcagcgccaccttcctgacctgcaatctgggagcccaggccgagaagagatctagagcccctggcaagctgacctacgtgtccaccattgtgctggacgcccctgtgaccaagctcgaacagggactcgtgatgaagcggtacaagatcgtgacccagggcttcgactacaccagcgtggaatctaaaggcggaatggctaagaccaagggcagcctgagcgtgttcagagaactgcatcctgccgccgctttcgacagagccgtgcacttcctgtttctggaactgtggctgcccgagcctatgctgtctagcagccctcctagctctacagcccctctgctgggatctgagcctctgagacactgggaagccagcctgtctagaggcggtggcggaatgtgtgctctgcaaggcagaggcgcttctcctgctggtgccggactgttccactggacaatgagcccatttctgctggggagcctgtacggccacatccacaatgaggccgtctga
[0733]
seq id no:81(密码子优化的cdna序列,编码clt抗原融合蛋白2)
[0734]
atgtggaactccctagaagcgagatccccgaaatctagatgttgttctactggaccgtgggaagccgtacaagaaaatctactatgggcctctctactagcaccaggtggtgcaacaatttttccagatccgtggctattgaaggcctcgccatcttctttaccgcatctacacagaacatccccgtgtgcttgtctatgtccgaactttccgttctacaaggacaccgtactactacatcaaggaccaagaggtggtggaaaaggtggaatgtgtgcactacaaggaagaggtgctagtccagctggtgctggattattccattggacaatgtccccgttcctactaggatctctatacggacacatccacaacgaagctgtcggaggtggaaaaggtggaatggctatgggacaaagaacaccatctctagcggagctaagaaagtcctctgcgacattcctaacctgtaacttgggagcgcaagcggagaaaagatctagagcacctggaaagctaacctatgtctccaccatagtactagatgcgccggtcacaaagctagaacagggactagtaatgaagagatacaagatcgtcacccagggattcgactacacctctgtagaatctggtggtggtggaaccggtgtcctaattagaagaggagatctagtcaccgatatggtcgcgtgtagaatcaagacattcagaggacatacagagaaggcggcgatctgcaagacaagaaaagaatcttctgcggaaacctctccggcggactctctaatcttagattttcagccgctacagctaatgtcctccttctctacattggcctcgctagacaaaggtggtggaatggcgaaaacgaagggatccttgtccgtattcagagaactacatccagctgcggctttcgatagagcggtacatttcctattcctagagctatggctaccggaaccgatgctatcttctagtccaccatct
tctacagcgccgctattaggatctgaaccgctaagacattgggaagcgagtctatctagaggtggtggtggaatgtggaacttcttcagaagagagctaacctccaacggattccccgagaacttctctttagatgtaccggcgaacacctacaacgcgctaaagtctagattgtgtgatccgaacgcggaccatacttcttgtccatctccgtgttctttacatgctgctggtgctttacctggaacgggtagacaaagatggagagtagaactagcgcacctagcggacagaaagctatccctaagagatgtctccagactaagacaaggtggagagagaagatctggaatcgcggtcaaagtagtcagaggtggtgcaggatttgctgcgagattacagggatctgtaaccttggtacagcaaggatggttcttcccaagacttggaggatgtcaagcttggtggagaatgggagctgtagtttggtgcggagaactattgacatgtacatcttga
[0735]
seq id no:82(密码子优化的cdna序列,编码clt抗原融合蛋白3)
[0736]
atgtggaatttcttccggcgcgagctgaccagcaacggcttccctgagaacttcagcctggacgtgcccgccaacacctacaatgccctgaagtccagactgtgcgaccccaacgccgatcacaccagctgtccatctccatgttctctgcatgccgctggcgctctgcctggaacaggcagacaaagatggcgcgtggaactggcccatctggccgatagaaagctgagcctgagggatgtgtcccggctgagacaaggcggcgagagaagatctggaatcgccgtgaaggtcgtcagaggcggagctggatttgccgctagactgcagggaagcgtgaccctggttcagcaaggctggttcttccctagactcggcggttgtcaagcctggtggcgaatgggagctgttgtttggtgcggcgagctgctgacatgtacaagcggcggaaaaaccggcgtgctgatcagaagaggcgacctggtcacagacatggtggcctgcagaatcaagaccttcagaggccacacagagaaggccgccatctgcaagacccggaaagagtctagcgccgagacaagccctgccgactctctgatcctggacttccagcctctgcagctgatgagcagctttagcacactggctagcctggacaaaggcggcggaatgaacacccctaacatcgtgtccctgagagcccaccagcctgaagtgggaatcatccctagcgtgctgctgatgcggcccctgagaatcaaaggcgtgttccaccacattcacagccctctgcacggcgagaatcagggcttcaccttgtgtctgcaaggcgcccctcctagcagttctgttggtggcaaaggcggaatggccatgggccagagaacaccatctctggccgagctgagaaagagcagcgccaccttcctgacctgtaacctgggagcccaggccgagaagagatctagagcccctggcaagctgacctacgtgtccaccattgtgctggacgcccctgtgaccaagctcgaacagggactcgtgatgaagcggtacaagatcgtgacccagggcttcgactacaccagcgtggaatctaaaggtggcatggccaagaccaagggcagcctgtccgtgttcagagagctgcatcctgccgccgctttcgatagagccgtgcacttcctgtttctggaactgtggctgcccgagcctatgctgtctagcagccctccatctagcacagccccactgctgggatctgagcctctgagacactgggaagccagcctgagcagaaaaggcggcctgcctagaacacccagacctgacctgattctgctgcagctgctgcctgctggactgagacaactgctgcagacaagcggccctgacaacgagcagcctatcgagcaggacctgatctgcaatgtgtgcggaggcggctggaacagcctggaagccagatctcctaagagccggtgctgtagcacaggcccttgggaagctgtgcaagagaatctgctgtgggcctctctgcttgctcctggcggagccaccatctttccagatccttggctgctgaaggctagcccctctagcctgcctcatctgcacagaacaagcccctgcgcctgcctgtgtcctaacttcccattctacaaggacacagtgctgctgcatcagggccctcgaggtggcggaaaaggtggaatgtgtgcccttcaaggcagaggcgcttctcctgctggtgccggactgttccactggacaatgagcccatttctgctggggagcctgtacggccacatccacaatgaagccgtctga
[0737]
seq id no:83(密码子优化的cdna序列,编码clt抗原融合蛋白4)
[0738]
atgtggaactccctagaagcgagatccccgaaatctagatgttgttctactggaccgtgggaagccgtacaagaaaatctactatgggcctctctactagcaccaggtggtgcaacaatttttccagatccgtggctattgaaggcctcgccatcttctttaccgcatctacacagaacatccccgtgtgcttgtctatgtccgaactttccgttctacaaggacaccgtactactacatcaaggaccaagaggtggtggtggaatgaatactccgaacatcgtatctctaagagcgcatcaaccggaagttggaattatcccgtccgtcctactaatgagaccgctaagaatcaagggagtgttccaccatatccactctccactacacggagaaaaccagggattcaccctatgtttacaaggtgctccaccgtcctctagtgttggaggtg
gaaaaggtggaatgtggaatttcttcagaagagagctaacctccaacggattccccgagaacttctctttagatgtaccggcgaacacctacaacgcgctaaagtctagattgtgtgatccgaacgcggaccatacttcttgtccatctccatgttctctacatgctgctggtgctttacctggaactggtagacaaagatggagagtagaactagcgcacctagcggacagaaagctatccctaagagatgtctccagactaagacaaggtggagagagaagatctggaatcgcggtcaaagtagttagaggtggtgcaggatttgcggcgagattacaaggatctgtaaccctagtacagcaaggatggttcttcccaagacttggaggatgtcaagcttggtggagaatgggagctgtagtttggtgcggagaactactaacatgtacctctggtggtggtggaatgctaccaagaacaccaagaccggacctaatcctactacaactactaccagcgggattgagacagctactacaaacatctggaccggataacgaacagccgatcgaacaggatctaatctgtaacgtatgcggaggtggtggaatggcgaaaacaaagggatccttgtccgtgttcagagaactacatccagctgcggcttttgatagagcggtacacttcctattcctagagctatggctaccggaaccgatgttatcttcttccccaccatcttctacagcgccgttattaggatctgaaccgttgagacattgggaagcgagtctatctagaggtggtggtggaatgtgtgcgttacaaggaagaggtgctagtccagctggtgccggattatttcattggacaatgtccccgttcctactaggatctctatacggacacatccacaacgaagctgtcggtggtggaaaaggtggaatggctatgggacaaagaacaccatctctagcggagctaagaaagtcctctgcgacattcctaacctgtaacttgggagcgcaagcggagaaaagatctagagcacctggaaagctaacctatgtctccaccatagtactagatgcgccggtcacaaagctagaacagggactagtaatgaagagatacaagatcgtcacgcagggattcgactacacctctgtagaatccggtggtggtggtacaggtgtcctaattagaagaggagatctagtcaccgatatggtcgcgtgtagaatcaagacattcagaggacatacagagaaggcggcgatctgcaagacaagaaaagaatcttctgcggaaacctctccggcggactctctaatcttagattttcagccgctacagctaatgtcctccttctctactttggcctccttggataagtga
[0739]
seq id no:84(接头序列,用于clt抗原融合蛋白3)
[0740]
ggk
[0741]
seq id no:85(tcr vb cdr3 aa序列)
[0742]
cassltggytgelff
[0743]
seq id no:86(tcr vb cdr3 aa序列)
[0744]
casnklgyqpqhf
[0745]
seq id no:87(tcr vb cdr3 aa序列)
[0746]
cassllenqpqhf