可溶性多肽的制作方法【专利摘要】本发明一般地涉及表现出高稳定性和溶解度的多肽(例如抗体分子)。特别地,本发明涉及包含在还原性或细胞内环境中表现出可溶性表达和折叠之成对VL和VH结构域的多肽。本发明还涉及编码所述多肽的多核苷酸,涉及所述多肽或多核苷酸的文库,以及涉及在研究、诊断和治疗应用中使用所述多肽的方法。【专利说明】可溶性多肽【
技术领域:
】[0001]本发明一般地涉及表现出高稳定性和溶解度的多肽(例如抗体分子)。特别地,本发明涉及包含在还原性或细胞内环境中表现出可溶性表达和折叠的成对\和Vh结构域的多肽。本发明还涉及编码所述多肽的多核苷酸,涉及所述多肽或多核苷酸的文库,以及涉及在研究、诊断和治疗应用中使用所述多肽的方法。例如所述多肽可用于筛选方法以鉴定与特定靶分子相结合的多肽。【
背景技术:
】[0002]脊椎动物抗体谱(antibodyrepertoire)通过对两种免疫球蛋白(Ig)折叠之异二聚体的祖先基因(ancestralgene)进行复制和多样化而形成。由免疫系统产生的多样性不仅依赖于Ig基因的种系基因(germlinegene)家族,而且来自B细胞和T细胞发育过程中亚结构域外显子的体内重组以形成在外显子边界处具有额外多样性的众多独特的谱系,这发生于Ig蛋白的表面暴露环(surface-exposedloop)。这一重组过程称为V(D)J重组,在两个可变轻(')外显子和三个可变重(Vh)外显子分别重组以形成抗体之轻链和重链的N端抗原结合结构域之后这样称呼。然而,由于经复制的基因偏离其祖先配对(ancestralpair),突变的累积效应导致了可变结构域的异二聚体单元之间不那么完美的界面契合(interfacialfit)。选择压力不是对任一基因施加,而是对作为整体的家族施加。这样,最大的多样性(其对于免疫系统来说是好事)可导致对于个体家族成员来说不那么理想的折叠稳定性。此外,该结合结构域本身可具有不同的折叠稳定性。由众多偏离的亚单位形成功能性异二聚体的需要通过在结构域的β_片层之间存在保守二硫键来补偿。然而,界面可仍然是不稳定的契合,需要ER中的折叠检查点。[0003]通过抗体可变结构域施加的蛋白质契合,作为“共有序列”方法的结果,一些配对具有低折叠稳定性并且倾向于在细菌/哺乳动物宿主中较差地表达,以及倾向聚集。此外,在几乎所有情况下,对于将在'和Vh结构域内形成片层间二硫键有总的需要。这就需要对于在细菌宿主(例如大肠杆菌)中表达抗体文库来说,抗体在细胞的周质(具有二硫化物分子伴侣的氧化性空间)中表达,并且经常作为\和Vh结构域之间的融合(单链抗体;scFv)。然而,输出至周质需要通过内膜排泄,这在对于抗体之高表达所期望的水平下饱和,导致远低于胞质表达的产率。[0004]除了在大肠杆菌胞质中较便宜地产生scFv抗体的优势之外,能够在还原性环境中折叠的抗体支架也将能够用作哺乳动物胞质中的亲和试剂。这将能够扩展抗体作为科学试剂在胞质或细胞核中用于成像或阻断蛋白质功能以及类似地在治疗和诊断中的用途。[0005]由于几乎所有哺乳动物抗体在胞质中是不可溶的,一些团队已经寻找折叠形成稳定异二聚体的罕见基因组合以用作支架从而构建进一步的多样性。所采用的寻找胞质可溶性抗体的方法是对抗体克隆在胞质中稳定表达的偶然事件的观察(Tavladoraki等,1999;Vaccaix)等,2006),其可以形成细胞内抗体(“胞内抗体”)支架的基础,或者作为替代地,采用进化方法来使scFv基因向稳定性进化,无论体内(Martineau等,1998;Visintin等,1999;AufderMaur等,2002;Fisher和DeLisa,2009)或体外(Contreras-Martinez和Delisa,2007JermutusL.,等2001)。此外,已经证明单结构域抗体(其中仅单个的、未成对的、可变结构域与靶抗原结合)在胞质中是可溶且稳定的。已经描述了当在胞质中表达两种骆§它科(camelid)单结构域抗体时,所述抗体是折叠且可溶的(KirchhoferAl.,等,2010;Saerens等,2005)。[0006]用于在细菌胞质溶胶中产生细胞内抗体的另一策略是使用大肠杆菌突变体,所述大肠杆菌突变体具有将胞质中蛋白质的氧化还原状态从还原改变为氧化的突变。这产生了在大肠杆菌胞质中折叠的且部分地和/或完全地氧化的scFv(He等,1995;JuradoP.,等,2002)。[0007]使用酵母双杂交(Y2H)系统来从scFv文库体内筛选与抗原相结合之scFv的两个团队编译了用于其可溶性克隆的序列。第一团队(Tse等,2002)发现VH3进化枝(clade)与进化枝VLkI和4配对。通过对多种可溶性scFv进行比对,他们编译了用于可溶性'和Vh基因的共有序列,其几乎准确地匹配家族VH3和VLκI的MorphosysHuCAL?文库编译的家族共有序列(Knappik等,2000)。使用Y2H的第二团队在W003/097697中报道了其可溶性scFv是与VH3、VHla或VHlb进化枝之成员最密切地相关的序列,其与VLκI或VLλI或VLA3进化枝最密切相关的成员相组合。然而,其最优的构造是与VHlb配对的VLA3。然而,关键要注意的是,没有一个报道的序列与最接近的同源免疫球蛋白基因之种系序列的翻译准确地匹配,在整个序列中具有多个突变。推测这是由于这两个团队使用预筛选的噬菌体文库以在酵母转化的限制步骤之前富集抗原结合克隆。然而,这意味着在每个基因中,一个或更多个突变可对胞质中的scFv折叠赋予稳定化作用。[0008]目前为止,还没有发表关于具有准确鉴别对应于VL和VH基因之人种系氨基酸序列的细胞内抗体的报道。这样的抗体将会是有利于建造多样性的支架,因为这允许胞质表达的高产率,将以氧化的形式提供较高的稳定性,将提供更高的结构稳定性以确保环多样性的更大耐受性,以及将包含完全天然的序列,通过产生全抗体来产生较低的患者排斥。[0009]我们在此报道了应用先前描述于W02011/075761的蛋白质展示方法来筛选人scFv文库以及分离与人种系序列具有相同骨架区的可溶性scFv基因。此外,我们证明了显著的热稳定性和移植到scFv支架上之⑶R3的耐受性。[0010]发明概沭[0011]在一个方面,本发明提供了包含多种不同多肽的多肽文库,其包含:[0012]i)抗体重链可变区(VH),其包含与如SEQIDNO:3所示IGHV3-23的支架区(scaffoldregion)具有至少90%同一丨生的支架区;以及[0013]ii)抗体轻链可变区('),其包含与以下任一种的支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1-44(如SEQIDN0:21所示)、IGLV1-47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);[0014]其中所述Vh和所述Vlj能够形成抗原结合位点(antigen-bindingsite);并且[0015]其中至少两种多肽在所述V1^P/或'可变区中一个或更多个互补性决定区(CDR)中存在的氨基酸序列上彼此不同。[0016]优选地,所述V1^P/或'可变结构域的一个或更多个CDR中氨基酸的序列是随机或半随机的,或来自人抗体。[0017]在另一方面中,本发明提供了构建多肽文库的方法,所述方法包括制备多种不同的多肽,所述多肽包含:[0018]i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及[0019]ii)抗体轻链可变区(VJ,其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40GnSEQIDNO:18所示)、IGLV1-44(如SEQIDNO:21所示)、IGLV1-47(如SEQIDN0:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3_21(如SEQIDNO:9所示)、IGLV6_57(如SEQIDN0:12所示);其中所述Vh和所述'能够形成抗原结合位点;并且[0020]其中至少两种多肽在所述Vh和/或\可变区中一个或更多个CDR中存在的氨基酸序列上彼此不同。[0021]在另一方面中,本发明提供了包含多种不同多核苷酸的多核苷酸文库,[0022]其中每种多核苷酸编码多肽,所述多肽包含:[0023]i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及[0024]ii)抗体轻链可变区(VJ,其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40GnSEQIDNO:18所示)、IGLV1-44(如SEQIDNO:21所示)、IGLV1-47(如SEQIDN0:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27`所示)、IGLV3_21(如SEQIDNO:9所示)、IGLV6_57(如SEQIDNO:12所示);[0025]其中所述Vh和所述\能够形成抗原结合位点;并且[0026]其中至少两种多核苷酸彼此的不同在于编码下述多肽:所述多肽在所述Vh和/或Vl可变区中包含一个或更多个不同的⑶R。[0027]优选地,所述多核苷酸编码的所述Vh和/或\可变结构域的一个或更多个CDR中的氨基酸序列是随机或半随机的,或者来自人抗体。[0028]在另一方面中,本发明提供了构建多核苷酸文库的方法,所述方法包括制备编码多肽的多种不同多核苷酸,所述多肽包含:[0029]i)抗体重链可变区(VH),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及[0030]ii)抗体轻链可变区(VJ,其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40GnSEQIDNO:18所示)、IGLV1-44(如SEQIDNO:21所示)、IGLV1-47(如SEQIDN0:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3_21(如SEQIDNO:9所示)、IGLV6_57(如SEQIDNO:12所示);[0031]其中所述Vh和所述\能够形成抗原结合位点;并且[0032]其中至少两种多核苷酸彼此的不同在于编码下述多肽:所述多肽在所述Vh和/或Vl可变区中包含一个或更多个不同⑶R的多肽。[0033]在另一方面中,本发明提供分离的和/或重组的多肽,所述多肽包含:[0034]i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及[0035]ii)抗体轻链可变区(VJ,其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40GnSEQIDNO:18所示)、IGLV1-44(如SEQIDNO:21所示)、IGLV1-47(如SEQIDN0:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3_21(如SEQIDNO:9所示)、IGLV6_57(如SEQIDNO:12所示);[0036]其中所述Vh和所述\能够形成抗原结合位点。[0037]所述\优选地包含与如SEQIDN06所示IGLV3-1的支架区具有至少90%同一性的支架区。[0038]优选地,所述多肽是可变片段(Fv),例如Fab片段、Fab’片段、F(ab’)片段、scFv、双抗体(diabody)、三抗体(triabody)、四抗体(tetrabody)或更高阶的(higherorder)多肽复合物。更优选地,所述多肽是scFv并且所述Vh和\通过肽接头连接在一起。[0039]优选地,本发明的多肽中V1^P/或'可变区的支架区与任一给定序列的支架区具有至少95%、96%、97%、98%或99%的同一性。[0040]本发明的多肽优选地在还原性条件下可溶。此外,本发明的多肽优选地在还原性条件下产生时可溶并且能够稳定地形成抗原结合位点。[0041]在另一个优选的实施方案中,本发明的多肽与化合物缀合。所述化合物可以选自:放射性同位素、可检测的标签、治疗性化合物、胶体、毒素、核酸、肽、蛋白质、提高所述多肽在对象中之半衰期的化合物、及其混合物。[0042]在另一方面中,本发明提供了分离的或外源的多核苷酸,其编码本发明的多肽或其重链或轻链可变区之多肽。[0043]在另一方面中,本发明提供了包含本发明之多核苷酸的载体(vector)。[0044]在另一方面中,本发明提供了包含本发明之多肽、本发明之多核苷酸或本发明之载体的宿主细胞。[0045]在另一方面中,本发明提供了用于筛选与靶分子相结合之多肽的方法,所述方法包括将本发明的多肽与靶分子相接触,并且确定所述多肽是否与所述靶分子相结合。在这样的一些方法中,优选如果编码所述多肽的多核苷酸在宿主细胞中或在无细胞表达系统中表达以产生所述多肽。当在细胞内表达所述多肽时,这种表达可发生在宿主细胞(例如细菌细胞、酵母细胞或哺乳动物)的胞质和/或周质(periplasm)中。[0046]在一个优选的实施方案中,所述宿主细胞是细菌细胞并且所述方法包括:[0047]a)培养包含编码本发明多肽之多核苷酸的细菌细胞,从而产生所述多肽,[0048]b)透化所述细菌细胞,其中所述多核苷酸和所述多肽保留在经透化细菌细胞内,[0049]c)将经透化的细菌细胞与靶分子相接触,从而使所述靶分子扩散到所述经透化的细菌细胞中,以及[0050]d)确定本发明的多肽是否与所述靶分子相结合。[0051]本发明的筛选方法可以使用本文中所描述的任意多肽进行。优选地,本发明的筛选方法包括筛选本发明的文库。这样,所述筛选方法可包括表达本发明的多肽或多核苷酸文库以及在这些文库中鉴定与靶分子相结合的多肽。优选地,这样的筛选方法在还原性条件下进行。例如,这样的方法可以在宿主细胞中进行。在一个优选的实施方案中,这样的方法在宿主细胞的胞质中进行。优选地,所述宿主细胞是细菌细胞,例如革兰氏阴性细菌细胞。在一个优选的实施方案中,所述细菌是大肠杆菌细胞。[0052]在另一方面中,本发明提供包含多种宿主细胞的宿主细胞文库,所述宿主细胞包含本发明的多肽,其中至少一种宿主细胞包含这样的多肽,其与文库中另一种宿主细胞中存在的多肽在Vh和/或'可变结构域中一个或更多个CDR中存在的氨基酸序列不同。在本发明的宿主细胞文库中的一种或更多种宿主细胞可以包含一种或更多种编码本发明之多肽的多核苷酸。例如,在所述宿主细胞文库中的宿主细胞可以含有一种编码Vh的多核苷酸和另一种编码\的多核苷酸。[0053]在另一方面中,本发明提供组合物,其包含本发明之多肽、多核苷酸和/或载体、以及可药用载剂(pharmaceuticallyacceptablecarrier)。[0054]在另一方面中,本发明提供试剂盒(kit),其包含本发明之多肽、本发明之多核苷酸和/或本发明、以及能够透化细菌细胞的试剂(agent)。[0055]在另一方面中,本发明提供了本发明之多肽在治疗或诊断应用中的用途。[0056]如将是显而易见的那样,根据情况作适当变动后,本发明的一个方面中优选的特性和特征可适用于本发明的任何其他方面。[0057]贯穿本说明书的词“包括”或变体例如“包含”或“含有”将被理解为意指包括所陈述的要素、整数或步骤或者要素、整数或步骤的组,但不排除任何其他元素、整数或步骤或者要素、整数或步骤的组。[0058]在下文中通过以下非限制性实施例并参照附图的方式描述本发明。[0059]附图简沭[0060]图1示出良好表达的可溶性scFv克隆的典型外观(1A,以及插图),以及良好表达但不可溶性scFv克隆(1B,以及插图)。[0061]图2示出所选择的与VL基因IGLV3-1、IGLV3-21和IGLV6-57具有高度相似性(similarity)或总同一性(totalidentity)的可溶性克隆的多重比对(multiplealignment)。[0062]图3展示出两个克隆(一个IGLV3-1和一个IGLV3-21)在提高的温度下表达的行为。[0063]图4展示出当在25°C下于大肠杆菌胞质溶胶中表达时IGLV3-1克隆溶解性。scFv::127::FLAG融合蛋白完整地在可溶性(S)级分中。[0064]图5展示出具有用Jl或J2替换λJ区之初始克隆(#8.93)的热稳定性行为。[0065]图6Α展示出具有多样化IGLV3-1⑶R3的4个独立克隆的溶解性和高表达。[0066]图6Β展示出具有多样化IGHV3-23⑶R3克隆之完整群体的样品。[0067]图7举例说明在本文中描述的优选可变区中的示例性CDR(用粗体和/或下划线表不)。[0068]图8举例说明编码具有可变⑶R3区之IGLV3-1:JGHV3-23支架的多核苷酸序列以及响应的经翻译氨基酸序列的实例。CDR用下划线和粗体表示。肽接头序列用斜体表示。[0069]图9示出SNAP配体标记的IGLV3-1::1GHV3_23scFv文库,展示出可溶性文库成员的高频率。[0070]图10示出通过RED筛选分离结合mAG的scFv。克隆34对于mAG结合是阳性的。克隆25是阴性的。[0071]图11举例说明具有通过RED筛选分离之完整a-mAGscFv的IGLV3-1::IGHV3-23scFV支架,其作为存在于可溶性级分(S)中的C-端His6FLAG融合蛋白而克隆,且在不可溶性级分(P)中没有蛋白质。使用a-FLAG单克隆抗体进行检测。[0072]图12示出与IMACNi琼脂糖结合的a-mAGscFvHis6FLAG对mAG的结合。[0073]图13展示出a-mAGscFv与mAG相互作用的特异性(通过从大肠杆菌裂解物“拉下(pull-down)”未经纯化的mAG)。a-mAGscFvHis6FLAG与IMACN1-琼脂糖树脂相结合,添加在总大肠杆菌细胞裂解物中的mAG(泳道6和7)导致具有mAG预期大小(约26KD)之蛋白质的结合。[0074]图14示出来自使用封装裂解缺陷型噬菌体展示gpD::a-mAGscFv融合蛋白的“掺杂的(doped)”mAG文库筛选的FACS阶段的抓屏(screen-grab)(上图)。含有经封装噬菌体的mAG阳性细胞在右侧门(gate)中。使用RED方法诱导从FACS筛选回收的噬菌体用于复制和gpD::a-mAG表达以及用mAG标记(下图)。[0075]序列表要点[0076]SEQIDNO:1_编码IGHV3-23的多核苷酸序列(NCBIRef.NT_026437.12)。[0077]SEQIDNO:2_编码IGHV3-23的多核苷酸序列,排除内含子。[0078]SEQIDNO:3-1GHV3_23的氨基酸序列[0079]SEQIDNO:4_编码IGLV3-1的多核苷酸序列(NCBIRef.NT_011520.12)。[0080]SEQIDNO:5_编码IGLV3-1的多核苷酸序列,排除内含子。[0081]SEQIDNO:6-1GLV3_l的氨基酸序列[0082]SEQIDNO-J-编码IGLV3-21的多核苷酸序列(NCBIRef.NT_011520.12)。[0083]SEQIDNO:8_编码IGLV3-21的多核苷酸序列,排除内含子。[0084]SEQIDNO:9_IGLy3_21的氨基酸序列[0085]SEQIDNO:10_编码IGLV6-57的多核苷酸序列(NCBI参考:NW_001838745.1)。[0086]SEQIDNO:11_编码IGLV6-57的多核苷酸序列,排除内含子。[0087]SEQIDNO:12-1GLV6-57的氨基酸序列[0088]SEQIDNO:13_编码IGLV1-51的多核苷酸序列(NCBI参考序列:ΝΤ_011520.12)[0089]SEQIDNO:14_编码IGLV1-51的多核苷酸序列,排除内含子。[0090]SEQIDNO:15-1GLV1_51的氨基酸序列[0091]SEQIDNO:16_编码IGLV1-40的多核苷酸序列(NCBI参考序列:ΝΤ_011520.12)[0092]SEQIDNO:17_编码IGLV1-40的多核苷酸序列,排除内含子。[0093]SEQIDNO:18-1GLV1-40的氨基酸序列[0094]SEQIDNO:19_编码IGLV1-44的多核苷酸序列(NCBI参考序列:ΝΤ_011520.12)。[0095]SEQIDNO:20_编码IGLV1-44的多核苷酸序列,排除内含子。[0096]SEQIDNO:21-1GLV1_44的氨基酸序列[0097]SEQIDNO:22_编码IGLV1-47的多核苷酸序列(NCBI参考序列:ΝΤ_011520.12)[0098]SEQIDNO:23_编码IGLV1-47的多核苷酸序列,排除内含子。[0099]SEQIDNO:24-1GLVl_47的氨基酸序列[0100]SEQIDNO:25-编码IGLV3-19的多核苷酸序列(NCBI参考序列:ΝΤ_011520.12)[0101]SEQIDNO:26_编码IGLV3-19的多核苷酸序列,排除内含子。[0102]SEQIDNO:27-1GLV3-19的氨基酸序列[0103]SEQIDNO:28_优选的肽接头[0104]SEQIDNO:29_CDR变体序列[0105]SEQIDNO:30_作为替代的CDR变体序列[0106]SEQIDNO:31_引物HVKlFl[0107]SEQIDNO:32_引物HVK1F2[0108]SEQIDNO:33_引物HVK2F[0109]SEQIDNO:34_引物HVK3F[0110]SEQIDNO:35_引物HVK4F[0111]SEQIDNO:36-引物HVK5F[0112]SEQIDNO:37-引物HVK6F[0113]SEQIDNO:38_引物HVKCLR[0114]SEQIDNO:39_引物HVLlFl[0115]SEQIDNO:40-引物HVL1F2[0116]SEQIDNO:41_引物HVL2F[0117]SEQIDNO:42-引物HVL3F1[0118]SEQIDNO:43_引物HVL3F2[0119]SEQIDNO:44~引物HVL4F1[0120]SEQIDNO:45_引物HVL4F2[0121]SEQIDNO:46_引物HVL5F[0122]SEQIDNO:47~引物HVL6F[0123]SEQIDN0:48_引物HVL7/8F[0124]SEQIDN0:49_引物HVL9/IOF[0125]SEQIDNO:50_引物01115HVLCLR[0126]SEQIDNO:51-引物01116HVLCLR2[0127]SEQIDNO:52~引物HVK12F1[0128]SEQIDNO:53_引物HVK12F2[0129]SEQIDNO:54_引物HVK22F[0130]SEQIDNO:55_引物HVK32F[0131]SEQIDNO:56_引物HVK42F[0132]SEQIDNO:57~引物HVK52F[0133]SEQIDNO:58_引物HVK62F[0134]SEQIDNO:59~引物HVKCL2R[0135]SEQIDNO:60_引物HVL12F1[0136]SEQIDNO:61_引物HVL12F2[0137]SEQIDNO:62~引物HVL22F[0138]SEQIDNO:63-引物HVL32F1[0139]SEQIDNO:64-引物HVL32F2[0140]SEQIDNO:65-引物HVL42F1[0141]SEQIDNO:66-引物HVL42F2[0142]SEQIDNO:67-引物HVL52F[0143]SEQIDNO:68-引物HVL62F[0144]SEQID勵:69_引物讯^7/82F[0145]SEQID勵:70_引物讯^9/102F[0146]SEQIDNO:71-引物HVLCL2R[0147]SEQIDNO:72_λJ区Jl[0148]SEQIDNO:73_λJ区J2[0149]SEQIDNO:74_λJ区J3[0150]SEQIDN0:75_AJgJ4[0151]SEQIDNO:76_λJ区J5[0152]SEQIDNO:77_λJ区J6[0153]SEQIDNO:78_λJ区J7[0154]SEQIDNO:79-杂合J区序列[0155]SEQIDNO:80_PCR引物[0156]SEQIDNO:81-翻译的序列[0157]SEQIDNO:82_PCR引物[0158]SEQIDNO:83-翻译的序列[0159]SEQIDNO:84-编码具有可变CDR3区之IGLV3-1::1GHV3_23支架的多核苷酸序列[0160]SEQIDNO:85_由SEQIDNO:84之多核苷酸编码的氨基酸序列[0161]SEQIDNO:86_模板CDR3序列[0162]SEQIDNO:87_作为替代的模板CDR3序列[0163]SEQIDNO:88-1GLV3_l的骨架序列和IGHV3-23的J区[0164]SEQIDNO:89_间插序列[0165]SEQIDN0:90_简并引物I[0166]SEQIDN0:91_简并引物2[0167]SEQIDNO:92_CDR3环LI[0168]SEQIDNO:93_CDR3环Hl[0169]SEQIDNO:94_CDR3环L2[0170]SEQIDNO:95-CDR3环H2[0171]SEQIDNO:96-CDR3环L3[0172]SEQIDNO:97_CDR3环H3[0173]SEQIDNO:98_CDR3环L4[0174]SEQIDNO:99_CDR3环H4[0175]SEQIDNO:100-CDR3环L5[0176]SEQIDNO:101-CDR3环H5[0177]SEQIDNO:102-CDR3环L6[0178]SEQIDNO:103-CDR3环H6[0179]SEQIDNO:104-CDR3环L8[0180]SEQIDNO:105-CDR3环H8[0181]SEQIDNO:106-CDR3环L9[0182]SEQIDNO:107-CDR3环H9[0183]SEQIDNO:108-CDR3环LlO[0184]SEQIDNO:109-CDR3环HlO[0185]SEQIDNO:1IOiAG-BioHis6蛋白[0186]SEQIDNO:lll-Ant1-mAG_BioHis6scFv序列[0187]SEQIDNO:112-gpD::a-mAGscFv融合构建体多核苷酸序列[0188]SEQIDNO:113-gpD::a-mAGscFv融合蛋白序列[0189]SEQIDNO:114-野生型人IGLV3-1`[0190]SEQIDNO:115-可溶性克隆8.93[0191]SEQIDNO:116-可溶性克隆8.184[0192]SEQIDNO:117-可溶性克隆8.174[0193]SEQIDNO:118-可溶性人IGLV3-21克隆8.186[0194]SEQIDNO:119-可溶性人IGLV3-21克隆8.39[0195]SEQIDNO:120-野生型人IGLV3-21[0196]SEQIDNO:121-可溶性人IGLV3-21克隆9.19[0197]SEQIDNO:122~野生型人IGLV6-57[0198]SEQIDNO:123_可溶性克隆16.26[0199]SEQIDNO:124-可溶性克隆16.1[0200]SEQIDNO:125~可溶性克隆16.121[0201]发明详沭[0202]一般技术和定义[0203]除非另外特别地定义,本文中所使用的所有技术和科学术语应当采用与本【
技术领域:
】(例如,在蛋白质化学、生物化学、细胞培养、分子遗传学、微生物学和免疫学中)普通技术人员通常理解的相同含义。[0204]除非另有说明,在本发明中使用的重组蛋白质、细胞培养和免疫学技术是本领域技术人员公知的标准操作。这样的技术通过例如以下来源的文献描述和阐明:J.Perbal,APracticalGuidetoMolecularCloning,JohnWileyandSons(1984);J.Sambrook等,MolecularCloning:ALaboratoryManual,第3版,ColdSpringHarbourLaboratoryPress(2001);R.Scopes,ProteinPurification-PrincipalsandPractice,第3版,Springer(1994);Τ.A.Brown(编辑),EssentialMolecularBiology:APracticalApproach,卷I和2,IRLPress(1991);D.M.Glover和B.D.Hames(编辑),DNACloning:APracticalApproach,卷1-4,IRLPress(1995和1996);以及EM.Ausubel等(编辑),CurrentProtocolsinMolecularBiology,GreenePub.AssociatesandWiley-1nterscience(1988,包括到目前为止所有的更新);EdHarlow和DavidLane(编辑),Antibodies:ALaboratoryManual,ColdSpringHarbourLaboratory,(1988);以及J.E.Coligan等(编辑),CurrentProtocolsinImmunology,Johnffiley&Sons(包括到目前为止所有的更新)。[0205]术语“多肽”、“蛋白质”、“肽”在本文中通常可互换使用。本文中使用的术语“外源性多肽”是指由外源性多核苷酸编码的多肽。本文中使用的术语“外源性多核苷酸”是指多核苷酸序列对于其所引入的细胞来说是外来的,或者序列与其所引入的细胞中的序列是同源的,但是处于宿主细胞核酸中通常不出现所述多核苷酸的位置。[0206]本文中使用的术语“抗体”、“抗体分子”包括多克隆抗体、单克隆抗体、双特异性抗体、双抗体、三抗体、多抗体(multibody)、异缀合(heteroconjugate)抗体、嵌合抗体(包括完整分子及其片段,例如Fab、F(ab')2、Fv和scFv以及其他抗体样分子)。技术人员将会知晓,抗体通常被认为是包含由多个多肽链构成之可变区(例如轻链可变区(')和重链可变区(Vh))的蛋白质。抗体还可以包含恒定结构域,其可以设置成恒定区或恒定片段或可结晶片段(fragmentcrystallisable,Fe)。抗体可以与一个或几个密切相关的抗原特异性地结合。全长抗体通常包含共价连接的两个重链(约50至70kD)和两个轻链(各约23kD)。轻链通常包含可变区和恒定结构域,并且在哺乳动物中是κ轻链或λ轻链。重链通常包含可变区和通过铰链区与另外的恒定结构域相连的一个或两个恒定结构域。哺乳动物的重链是下列类型之一:α、δ、ε、y或μ。每个轻链还与重链之一共价相连。例如,两个重链以及重链与轻链可以通过链间二硫键和/或通过非共价相互作用连在一起。链间二硫键(如果存在)的数目可根据抗体的不同类型而变化。每个链具有N端可变区(Vh或',其中每个长度为约110个氨基酸)以及在C端的一个或更多个恒定结构域。轻链的恒定结构域(长Q,其长度为约110个氨基酸)经常与重链的第一恒定结构域(Ch,其长度为约330至340个氨基酸)对齐并且通过二硫键与其键合。轻链可变区经常与重链可变区对齐。抗体重链可以包含2个或更多个另外的Ch结构域(例如Ch2、Ch3等)并且可包含可在ChI和Cm恒定结构域之间确认的铰链区。抗体可以是任意类型(例如,IgG,IgE,IgM,IgD,IgA和IgY)、类别(例如,IgG1、IgG2、IgG3、IgG4、Igk,和IgA2)或亚类。优选地,所述抗体是鼠(小鼠或大鼠)抗体或灵长类(优选人)抗体。术语“抗体”还包括人源化抗体、灵长化(primatized)抗体、人抗体和嵌合抗体。[0207]本文中使用的术语“可变区”是指如本文中所定义之抗体的轻链和重链的一部分,其包含CDR(即,CDR1、CDR2和CDR3)和骨架区(frameworkregion,FR)的氨基酸序列。Vh是指重链的可变区。'是指轻链的可变区。[0208]本文中使用的术语“支架区”是指除了CDR残基之外的所有可变区残基。[0209]本文中使用的术语“骨架区”(FR)将被理解为意指除了⑶R残基之外的可变区残基的连续序列。这样,所有FR—起构成“支架区”。天然抗体的每个可变区通常具有四个FR,确定为FRl、FR2、FR3和FR4。如果CDR是根据Kabat定义的,示例性轻链FR(LCFR)残基定位于约残基I至23(LCFRl)、35至49(LCFR2)、57至88(LCFR3)和98至107(LCFR4)。注意λLCFRl不包含残基10,其包含于κLCFR1。示例性重链FR(HCFR)残基定位于约残基I至30(HCFRl)、36至49(HCFR2)、66至94(HCFR3)和103至113(HCFR4)。[0210]本文中使用的术语“互补性决定区”(⑶R,即⑶R1、⑶R2和⑶R3或高变区)是指免疫球蛋白可变区的氨基酸残基,其存在对于抗原结合是必要的。每个可变区通常具有被确定为⑶RlXDR2和⑶R3的三个⑶R区。每个⑶R可以包含来自如由Kabat(1987和/或1991)定义的“互补性决定区”的氨基酸残基。例如,在重链可变区中,⑶RHl在残基31至35之间,⑶RH2在残基50至65之间并且⑶RH3在残基95至102之间。在轻链中,⑶RLl在残基24至34之间,⑶RL2在残基50至56之间并且⑶RL3在残基89至97之间。这些⑶R还可包含大量插入,例如Kabat(1987和/或1991)中所述。[0211]本文中使用的术语“恒定区”(CR或可结晶片段或Fe)是指抗体的一部分,其包含至少一个恒定结构域并且其通常(尽管不是必须)被糖基化并且其与一个或更多个受体和/或补体级联的组分(例如赋予效应子功能)相结合。重链恒定区可选自以下五种亚型中的任一种:α、δ、ε、gamma或μ。此外,多种亚类(例如重链的IgG亚类)的重链负责不同的效应子功能,并且因此通过选择期望的重链恒定区,可产生具有期望效应子功能的蛋白质。优选的重链恒定区是YI(IgGl)、Y2(IgG2)和Y3(IgG3)0[0212]“恒定结构域”是抗体中的结构域,其序列在相同类型(例如,IgG或IgM或IgE)的抗体中高度相似。抗体的恒定区通常包含多个恒定结构域,例如Υ、α和δ重链的恒定区包含三个恒定结构域并且Υ、α和δ重链的Fe包含两个恒定结构域。μ和ε重链的恒定区包含四个恒定结构域并且Fe区包含两个恒定结构域。[0213]本文中使用的术语“Fv”应当被理解为任意蛋白质,无论包含多种多肽还是单一多肽,其中'和合并形成具有抗原结合位点(即能够特异性地与抗原相结合)的复合物。Vh和'可以以单一多肽链或以不同多肽链形成抗原结合位点。此外本发明的Fv(以及本发明的任意多肽)可以具有多个抗原结合位点,所述多个抗原结合位点可以或不可以与相同的抗原结合。术语“Fv”应当理解为包括直接衍生于抗体的片段以及对应于使用重组方式产生的此类片段的蛋白质。在一些优选的实施方案中,所述Vh不与重链恒定区(Ch)I相连和/或所述'不与轻链恒定区(CJ相连。含有多肽或蛋白质的示例性Fv包括Fab片段、Fab’片段、F(ab’)片段、scFv、双抗体、三抗体、四抗体、或更高阶的复合物,或者与恒定区或其结构域(例如Ch2或Ch3结构域)相连的上述任一种。“Fab片段”由抗体的单价抗原结合片段组成,并且可以例如通过用木瓜蛋白酶消化整个抗体以产生完整轻链和重链的一部分组成的片段来产生或者可以通过重组方式产生。可以例如通过用胃蛋白酶处理整个免疫球蛋白,随后还原以产生由完整轻链和重链的一部分组成的分子来获得抗体的“Fab'片段”。以这种方式处理每个抗体获得的两个Fab'片段。Fab'片段也可通过重组方式产生。抗体的“F(ab')2片段”由两个Fab'片段通过两个二硫键连在一起形成的二聚体组成,并且通过用胃蛋白酶处理整个抗体分子获得,无需后续的还原。“Fab2”片段是重组片段,其包含使用例如亮氨酸拉链或Ch3结构域连接的两个Fab片段。[0214]“单链Fv”或“scFv”是含有免疫球蛋白之可变区片段(Fv)的重组分子,其中轻链的可变区和重链的可变区通过合适的柔性多肽接头共价连接。下文提供了落入该术语范围内的含有多肽之示例性Fv的详细讨论。[0215]本文中使用的术语“抗原结合位点”应当被理解为意指由能够与抗原特异性结合的多肽形成的结构。抗原结合位点不需要是连续的氨基酸,甚至不需要是在单一多肽链中。例如,由两条不同多肽链产生的Fv中,抗原结合位点由一些列与抗原相互作用的\和Vh之区域构成,并且其通常(但不总是)在每个可变区的一个或更多个CDR中。[0216]本文中被命名为⑶R和FR的任意氨基酸位置根据Kabat(1987和1991)定义。技术人员将能够容易地在本发明的进行中使用其他编号系统,例如Chothia和Lesk(1987和/或1989)和/或Al-Lazikani等(1997)的高变换编号系统。[0217]技术人员将会知晓,“二硫键”是通过巯基偶联形成的共价键。所述键也被成为SS-键或二硫桥(disulfidebridge)。在多肽中,二硫键通常发生在两个半胱氨酸残基的巯基之间。[0218]技术人员还将会知晓,术语“非还原性条件”包括足以使蛋白质中的巯基(-SH)基团氧化的条件,例如容许二硫键形成。因此,术语“还原性条件”包括不足以使蛋白质中的巯基(-SH)基团氧化的条件,例如不容许二硫键形成。[0219]本文中使用的术语“抗原”应当被理解为意指主要针对其可使抗体应答出现的任意的物质组合物。示例性抗原包括蛋白质、肽、多肽、碳水化合物、磷酸基团、磷光体肽(phosphor-peptide)或多肽,糖基化肽或肽等。[0220]本文中对可变区及其一部分、免疫球蛋白、抗体及其片段的描述和定义可以进一步通过Kabat(1987和/或1991)、Bork等(1994)和/或Chothia和Lesk(1987和1989)或Al-Lazikani等(1997)中的讨论来阐明,。[0221]本文中使用的术语“缀合”、“缀合的”或其变化形式广泛地用于指可用于本文中公开的方法中的化合物与其他试剂之间任意形式的共价键或非共价键缔合。[0222]术语“和/或”(例如“X和/或Y”)应当被理解为意指“X和Y”或“X或Y”并且应当对两种含义或对含义之一提供清楚的支持。[0223]本文中使用的术语“约”是指指定值`+/-5%的范围。[0224]如将通过以下描述理解的,本发明人应用了蛋白质展示方法以鉴别可在细胞的胞质中以可溶性形式表达并且展示出出乎意料水平的可溶性、热稳定性、以及对CDR多样化之耐受的多肽(例如抗体)。本发明人进一步证明,仅使用抗体可变结构域之骨架区中的种系序列,人免疫球蛋白谱(immunoglobulinrepertoire)具有用于胞质可溶性和稳定性的潜力。[0225]保留封装展TK(RetainedEncapsulatedDisplay,RED):[0226]本发明人已经鉴别了可以在细胞的胞质中以可溶性形式表达并且使用保留封装展示(RED)的方法展示出出乎意料水平的可溶性、热稳定性、以及对CDR多样化之耐受的多肽。RED是用于革兰氏阴性细菌的蛋白质展示平台,这描述于W02011/075761(其内容通过引用整体并入本文)。在RED中待展示的蛋白质在细胞的周质或胞质中表达。然后用去污剂或有机溶剂透化细胞膜,同时完整的留下细胞壁。展示蛋白质通过细胞壁被保留,通过与蛋白质融合将其分子量提高至高于细胞壁的孔隙率限制(例如与四聚体单体融合),或者通过与蛋白质结构域融合(所述蛋白质结构域与DNA、细胞壁自身或这二者结合)。通过在经透化细胞的细胞壁内共保留质粒和基因组DNA提供对于展示系统所需的表型-基因型连锁。[0227]多狀:[0228]人抗体谱含有功能性和假基因可变区(由Lefranc总结,2000)。这些可以作为外显子从非免疫谱系中基因组DNA或者从免疫细胞(其已经经历了V(D)J重排)来源的mRNA克隆,以准备可以用于表达抗体的遗传构建体。在这样的过程期间,轻链和重链的可变结构域可以作为单体scFv或以形成二价或更高价的排列被克隆。还可以从可变结构域的下游克隆恒定区以产生Fab或全长抗体。[0229]在所有形式中,为了获得正确折叠并且在抗体的产生期间维持稳定性和可溶性,编码抗体的遗传构建体必须几乎总是在使得结构域内二硫键可以在β片层之间形成的条件下(即在非还原性条件下)表达。这样,在哺乳动物中,抗体插入内质网(ER)和高尔基体用于分泌或膜插入。如果在细菌宿主(例如大肠杆菌)中表达,其必须引导至二硫键伴侣DsbA、B和C存在的周质空间。如果抗体在非氧化性环境中(例如在细胞的胞质中),稳定化二硫键的缺乏导致错误折叠和降解,或者如果在大肠杆菌胞质中以高水平表达,作为亚细胞包涵体(inclusionbody)而聚集。[0230]本发明人已经鉴别了包含抗体可变区支架的多肽,其甚至在多肽于非氧化(还原)性环境中表达时能够形成抗原结合位点。[0231]因此,本发明提供了分离的和/或重组的多肽,所述多肽包含通过肽接头与免疫球蛋白可变结构域之\λ1、3或6家族的抗体轻链可变区(')相连的免疫球蛋白可变结构域之Vh3家族的抗体重链可变区(Vh),其中所述Vh和所述\能够形成抗原结合位点。[0232]本发明的多肽可以以任意已知形式的抗体或抗体片段来提供。因而,本发明的多肽可以是:(i)抗体;(ii)单一结构域抗体;(iii)单链Fv(scFv);(iv)双抗体、三抗体、四抗体;(V)融合蛋白,其包含(ii)-(iv)中任一种和抗体的Fe结构域或其结构域;(vi)融合蛋白,其包含(ii)-(iv)中任一种和能够与免疫效应细胞或任意其他已知形式的抗体相结合的蛋白质。[0233]优选地,本发明的多肽是Fv。例如,本发明的多肽优选地是Fab片段、Fab'片段、Fiab1)片段、scFv、双抗体、三抗体、四抗体或更高阶的多肽复合物。[0234]最优选地,本发明的多肽是scFv。scFv包含在单多肽链中的VdP'区。优选地,所述多肽链还在V1^P'之间还包含多肽接头,其使得SCFv能够形成期望的用于抗原结合的结构(即,用于所述单多肽链的Vh和'彼此相互缔合以形成抗原结合位点)。这与本发明的双抗体或更高阶的多聚物截然不同,其中来自不同多肽链的可变区彼此相互缔合或结合。所述肽接头可以包含12个或更多个氨基酸残基。例如,所述肽接头可以包含12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个氨基酸或更多个。优选地,所述肽接头包含超过12个氨基酸残基,且(Gly4Ser)3(即GGGGSGGGGSGGGGS(SEQIDNO:28))是用于scFv的更偏好的接头之一。另一些合适的多肽在本领域中是已知的。本发明的多肽优选地包含免疫球蛋白可变区之Vh3家族的Vh的支架区和/或免疫球蛋白可变结构域之'λ1、3或6家族的\的支架区。这样,本发明的多肽优选地包含本文中公开的任意可变区的所有氨基酸残基,不包括CDR残基。CDR残基可以由本领域技术人员容易地鉴定,参考Kabat(1987和/或1991)、Bork等(1994)和/或Chothia和Lesk(1987和1989)或Al-Lazikani等(1997)中的讨论。这样本发明的多肽可包含本文中公开的任意可变区的所有FR。所述多肽还可以包含一个或更多个本文中公开的可变区之⑶R。所述多肽还可以包含一个或更多个未在本文中公开的可变区中存在的CDR。因此,一个或更多个来自不同来源的CDR可以插入到本文中公开的可变区的支架区。这种可能性的进一步讨论包含于下文中。[0235]在一个优选的实施方案中,本发明的scFv包含通过肽接头与免疫球蛋白可变结构域之'λ1、3或6家族的八相连接的免疫球蛋白可变结构域之Vh3家族的Vh的支架区。在更优选的一些实施方案中,本发明的scFv包含IGHV3-23的支架区和IGLV1-40、IGLV1-44、IGLV1-47、IGLV1-51、IGLV3-1、IGLV3-19、IGLV3-21和IGLV6-57中任一种的支架区。最优选地,本发明的scFv包含IGHV3-23的支架区和IGLV3-1的支架区。[0236]本发明的多肽可以用其与参考序列的百分比同一性来定义。这一百分比同一性可以通过本领域中已知的任意合适的方法计算。用于比较经比对序列的数种算法是已知的,并且可以用于确定本发明之多肽与参考序列的百分比同一性。例如,氨基酸和多核苷酸序列可以手动比较或通过利用基于计算机的序列比较和鉴定工具进行比较,其使用例如BLAST(BasicLocalAlignmentSearchTool;Altschul等,1993)的算法;还参见www.ncb1.nlm.nih.gov/BLAST/),比对的Clustal方法(HigginsandSharp,1989)等,其中用于每个特定序列比较的合适的参数可按照本领域技术人员将会理解的方式来选择。[0237]优选地,本发明的多肽是分离的和/或重组的多肽。本文中使用的术语“分离的”或“纯化的”旨在意指这样的多肽,其通常已经从脂质、核酸、其他多肽和肽、以及在其天然状态中与其相关的污染分子分离。优选地,所述分离的多肽至少60%没有、优选地至少75%没有、以及更优选地至少90%没有与其天然相关的组分。[0238]在多肽的上下文中,术语“重组”是指这样的多肽,当通过细胞或在无细胞表达系统中产生时,所述多肽与天然状态相比具有改变的量或改变的速率。在一个实施方案中,所述细胞是不天然产生所述多肽的细胞。然而,所述细胞可以是包含非内源性基因(其导致改变的,优选提高量的待产生之肽)的细胞。如本文中所描述的重组多肽包括未从转基因(重组)细胞或无细胞表达系统(所述多肽在其中产生)的其他组分分离的多肽,并且在这样的细胞或无细胞体系中产生的多肽随后被纯化以除去至少一些其他组分。[0239]本发明的多肽优选地包含来自鼠(小鼠或大鼠)抗体或灵长类(优选人)抗体的氨基酸序列。因此在本发明的多肽中包含的可变区和/或支架区可以是鼠(小鼠或大鼠)或灵长类(优选人)可变区和/或支架区。[0240]优选地,本发明的多肽是可溶性的。用于确定多肽之可溶性的方法是本领域中公知的,例如J.Sambrook等,MolecularCloning:ALaboratoryManual,3rd版,ColdSpringHarbourLaboratoryPress(2001)中的描述。多肽如果(例如)不能从经裂解的和/或经透化的细胞级分中通过物理分离(例如通过离心)分离,则所述多肽可以被确定为是可溶性的。此外,如果本发明的多肽在细胞的胞质中不形成包涵体,则所述多肽可以被确定是可溶性的。因此,如果当多肽在宿主细胞中表达时,所述多肽保留在通过任何合适的机械、去污剂和/或酶方法裂解宿主细胞后产生的可溶性级分中,则所述多肽可以被认为是可溶性的。合适的机械方法包括例如使用声处理。合适的去污剂方法包括例如使用η-辛基-β-D-硫代葡糖苷(8TGP)。合适的酶方法包括例如使用溶菌酶。优选地,本发明的多肽可在细胞裂解物的可溶性级分中保留的水平为至少25%,例如至少50%、至少75%、至少90%、至少95%、或至少95%。[0241]本发明的多肽优选地能够稳定地形成抗原结合位点。因此,所述多肽优选地能够在足以允许检测多肽抗原复合物的水平上与靶抗原相结合。这样的检测可以在合适的实验条件下进行,例如在温度为至少5°C、至少10°C、至少15°C、至少20°C、至少25°C、至少30°C、至少35°C、至少40°C、至少45°C或至少50°C。[0242]缀合物[0243]本发明的多肽可以使用本领域中已知的任意方法与一个或更多种化合物缀合。多肽可以与之缀合的化合物实例选自:放射性同位素、可检测的标签、治疗性化合物、胶体、毒素、核酸、肽、蛋白质、提高所述多肽在对象中之半衰期的化合物及其混合物。示例性治疗剂包括但不限于抗血管发生剂(ant1-angiogenicagent)、抗新血管形成剂(ant1-neovascularization)和/或其他血管形成剂(vascularizationagent)、抗增殖剂、促凋亡剂、化疗剂或治疗性核酸。[0244]毒素包括对细胞有害的(例如杀死细胞)任意试剂。多这些类药物的描述是本领域中已知的,并且其作用的机理参见Goodman等,Goodman和Gilman'sThePharmacologicalBasisofTherapeutics,第8版,MacmillanPublishingC0.,1990。与制备免疫球蛋白-免疫毒素缀合物相关的另一些技术在例如Vitetta(1993)和US5,194,594中提供。示例性毒素包括白喉A链、白喉毒素的非结合活性片段、外毒素A链(来自铜绿假单孢菌(Pseudomonasaeruginosa))、蓖麻毒蛋白(ricin)A链、相思豆毒蛋白(abrin)A链、蒴莲根毒蛋白(modeccin)A链、α-帚曲霉素(alfa-sarcin)、油桐(Aleuritesfordii)蛋白质、香石竹毒蛋白(dianthinprotein)、美洲商陆(Phytolacaamericana)蛋白质(PAP1、PAPII和PAP-S),苦瓜(momordicacharantia)抑制因子、麻疯树毒蛋白(curcin)、巴豆毒蛋白(crotin)、肥阜草(sapaonariaofficinalis)抑制因子、多花白树毒蛋白(gelonin)、米托菌素(mitogellin)、局限曲菌素(restrictocin)、酹霉素(phenomycin)、依诺霉素(enomycin)和单端孢霉烯类(tricothecenes)。参见例如W093/21232。[0245]用于形成包含本发明之多肽的免疫缀合物的合适的化疗剂包括:auristatin和美登素(maytansine)、泰素(taxol)、细胞松弛素B(cytochalasinB)、短杆菌肽D(gramicidinD)、溴化乙锭、吐根碱(emetine)、丝裂霉素、依托泊苷、替尼泊苷、长春新碱、长春碱、秋水仙碱、多柔比星、柔红霉素、二羟基炭疽菌素二酮(dihydroxyanthracindione)、米托蒽醌(mitoxantrone)、光神霉素、放线菌素D、1-去氢睾酮(Ι-de-hydrotestosterone)、糖`皮质激素、普鲁卡因、丁卡因、利多卡因、普萘洛尔和嘌呤霉素、抗代谢物类(例如甲氨蝶呤、6-巯基嘌呤、6-硫鸟嘌呤、阿糖胞苷、氟达拉滨、5-氟尿嘧啶、达卡巴嗪、羟基脲、天冬酰胺酶、吉西他滨、克拉屈滨)、烷化剂(例如氮芥、塞替派、苯丁酸氮芥、美法仑、卡莫司汀(BSNU)、洛莫司汀(CCNU)、环磷酰胺、白消安、二溴甘露醇、链脲霉素、达卡巴嗪(DTIC)、丙卡巴肼)、丝裂霉素C、顺钼和其他钼衍生物例如卡钼)、抗生素类(例如更生霉素(以前称为放线菌素)、博来霉素、柔红霉素(以前称为道诺霉素)、多柔比星、伊达比星、光神霉素、丝裂霉素、米托蒽醌、普卡霉素(plicamycin)、氨茴霉素(AMC))。[0246]合适的血管发生抑制剂(抗血管发生剂)的实例包括但不限于:尿激酶抑制剂、基质金属蛋白酶抑制剂(例如马立马司他(marimastat)、新伐司他(neovastat)、BAYl2-9566、AG3340、BMS-275291和类似药剂)、内皮细胞迁移和增殖的抑制剂(例如TNP-470、角藍胺(squalamine)、2甲氧基雌二醇、康普瑞汀(combretastatins)、内皮抑素(endostatin)、血管抑素、青霉胺、SCH66336(Schering-PloughCorp,Madison,NJ)、R115777(JanssenPharmaceutica,Inc,Titusville,NJ)和类似药剂)、血管发生性生长因子拮抗剂(例如ZD6474、SU6668、针对血管发生剂的抗体和/或其受体(例如VEGF、bFGF和血管生成素-1)、沙立度胺、沙立度胺类似物(例如CC5013)、Sugen5416、SU5402、抗血管发生核酶(例如angiozyme)、干扰素α(例如干扰素a2a)、苏拉明(suramin)和类似药剂)、VEGF-R激酶抑制剂和其他抗血管发生的酪氨酸激酶抑制剂(例如SU011248)、内皮细胞特异性整合素/生存信号的抑制剂(如vitaxin和类似药剂)、铜拮抗剂/螯合剂(如四硫钥酸盐(tetrathiomolybdate)、卡托普利和类似药剂)、羧胺三唑(carboxyamido-triazole,CAI)、ABT-627、CMlOl、白介素-12(IL-12)、IM862.PNU145156E以及抑制血管发生的核苷酸分子(例如反义-VEGF-cDNA、编码血管抑素的cDNA、编码p53的cDNA和编码缺陷型VEGF受体-2的cDNA)和类似药剂。血管发生、新血管形成和/或其他血管形成之抑制剂的另一些实例是抗血管发生的肝素衍生物和相关分子(例如,肝素酶IIlQieperinaseIII))、替莫唑胺、NK4、巨噬细胞迁移抑制因子(MIF)、环氧合酶-2抑制剂、低氧诱导因子I的抑制剂、抗血管发生的大豆异黄酮类、奥替普拉(oltipraz)、烟曲霉素及其类似物、生长抑素类似物、多硫酸戍聚糖(pentosanpolysulfate)、替可加兰钠(tecogalansodium)、达肝素(dalteparin)、肿瘤抑素(tumstatin)、血小板反应蛋白(trombospondin)、NM-3、卡贝塔汀(combrestatin)、血管能抑素(canstatin)、阿瓦斯汀(avastatin)、针对其他相关祀标的抗体(例如抗α-V/β-3整合素和抗高分子激肽原(kininostatin)mAb)和类似药剂。[0247]在一个实例中,如本文所描述的根据任意实施方案的多肽与其他多肽缀合或连接,所述其他多肽包括本发明的其他多肽或者包含免疫球蛋白可变区的多肽,例如免疫球蛋白或从其衍生的多肽(例如,如本文中所述的多肽)。不排除其他蛋白质。另外的蛋白质对技术人员来说将是显而易见的,包括例如免疫调节剂或延长半衰期的蛋白质或多肽或者与血清白蛋白相结合的其他蛋白质等。[0248]示例性的免疫调节剂包括细胞因子和趋化因子。术语“细胞因子”是从一个细胞群释放的、在另一细胞发挥作用的、作为细胞间介质的蛋白质或肽的通用术语。细胞因子的实例包括淋巴因子、单核因子、生长因子和传统的多肽激素。细胞因子中包括生长激素,例如人生长激素、N-甲硫氨酰基人生长激素、和牛生长激素;甲状旁腺激素、甲状腺素、胰岛素、胰岛素原、松弛素、松弛素原、糖蛋白激素例如促卵泡激素(FSH)、促甲状腺激素(TSH)和促黄体激素(LH)、肝生长因子;前列腺素、成纤维细胞生长因子、催乳素、胎盘催乳激素、OB蛋白、肿瘤坏死因子-α和肿瘤坏死因子-β,缪勒氏抑制物质(mullerian-1nhibitingsubstance)、促性腺激素相关肽、抑制素(inhibin)、激活蛋白(activin)、血管内皮生长因子、整合素、血小板生成素(TPO)、神经生长因子例如NGF-B、血小板生长因子、转化生长因子(TGF)例如TGF-α和TGF-β、胰岛素样生长因子-1或胰岛素样生长因子-11、促红细胞生成素(EPO)、骨诱导因子、干扰素如干扰素-α、干扰素-β或干扰素-Y;集落刺激因子(CSF)例如巨噬细胞-CSF(M-CSF)、粒细胞-巨噬细胞CSF(GM-CSF)和粒细胞-CSF(G-CSF),白介素(IL)例如IL-UIL-1α、IL-2、IL-3、IL-4、IL-5、IL-6,IL-7、IL-8、IL-9、IL-10、IL-1UIL-12,IL-13、IL-14、IL-15、IL-16、IL-17、IL-18、IL-21和LIF。[0249]趋化因子通常作为化学引诱物来将免疫效应细胞募集至趋化因子表达的部位。趋化因子包括但不限于RANTES、MCAF、MIPl-a或MIPl-β。技术人员将意识到已知某些细胞因子具有化学引诱作用并且可以归类为术语趋化因子。[0250]示例性血清白蛋白结合肽或蛋白质描述于US20060228364或US20080260757。[0251]多种放射性核素可用于放射性缀合蛋白的产生。实例包括但不限于低能量辐射原子核(例如适合用于诊断目的),例如13C、15N、2H、1251、1231、"Tc、43K、52Fe、67Ga、68Ga、mIn等。优选地,放射性核素是发射Y、光子或正电子的放射性核素,具有半衰期适合于在施用和定位至成像部位之间的时间流逝之后允许放射性或检测。本发明还涵盖高能量放射性核(例如用于治疗目的),例如125K131Ki23KmIrK1c15RK153SnK67Ciu67GaJ66HcK177Liu186Re和188Re0这些同位素通常产生具有短的路径长度的高能量α-或β-粒子。这样的放射性核素杀死与其非常靠近的细胞,例如缀合物已经附着或者进入的肿瘤细胞。它们对未定位的细胞影响很小的或没有影响并且基本上没有免疫原性。或者,高能量同位素可以通过其他稳定同位素的热辐射产生,例如在硼中子俘获治疗中(Guan等,1998)。[0252]在另一个实施方案中,所述多肽与用于在细胞中预靶标的“受体”(例如链霉亲和素)缀合,其中缀合物施用于患者,随后通过使用清除剂从循环移除未结合的缀合物并且随后施用与治疗剂(例如放射性核素)缀合的“配体”(例如亲和素)。[0253]本发明的蛋白质可以被修饰以含有另外的非蛋白质部分,其在本领域中是已知的并且可容易地获得。优选地,适合用于蛋白质之衍生的部分是水溶聚合物。水溶性聚合物的非限制性实例包括但不限于聚乙二醇(PEG)、聚乙烯醇(PVA)、乙二醇/丙二醇的共聚物、羧甲基纤维素、葡聚糖、聚乙烯醇、聚乙烯吡咯烷酮、聚-1,3-二氧戊环(dioxolane)、聚-1,3,6-三,:烷、乙烯/马来酸酐共聚物、聚氨基酸(无论是均聚物或随机共聚物)、以及聚(η-乙烯吡咯烷酮)聚乙二醇、丙二醇(PPG)均聚物、聚环氧丙烷/环氧乙烷共聚物、聚氧乙烯化多元醇(例如,甘油、P0G)、聚乙烯醇、及其混合物。聚乙二醇丙醛由于其在水中的稳定性可以在生产中具有优势。[0254]聚合物分子通常特征为具有例如约2个至约1000个或约2个至约300个重复单JLiο[0255]例如,水可溶性聚合物(包括但不限于PEG、聚(氧化乙烯)(PEO)、聚氧乙烯(POE)、聚乙烯醇、羟乙基纤维素或葡聚糖)通常与蛋白质缀合以提高蛋白质的稳定性或尺寸等。[0256]PEG、PE0或POE是指环氧乙烷的寡聚物或聚合物。在聚乙二醇的情况中,这些寡聚物或聚合物通过例如环氧乙烷的阴离子开环聚合产生,这是与通过氢氧根离子在环氧化物环上的亲核攻击。用于蛋白质修饰的PEG之更加有用的形式之一是单甲氧基PEG(mPEG)。[0257]用于与本发明的多肽缀合的特别优选的化合物列在表1中。[0258]表1:用于缀合的优选化合物[0259]【权利要求】1.包含多种不同多肽的多肽文库,所述多肽包含:i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及ii)抗体轻链可变区('),其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1_44(如SEQIDNO:21所示)、IGLV1_47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);其中所述Vh和所述\能够形成抗原结合位点;并且其中所述多肽的至少两种在所述%和/或'可变区中一个或更多个互补性决定区(OTR)中存在的氨基酸序列上彼此不同。2.权利要求1所述的文库,其中在所述V1^P/或'可变结构域的一个或更多个CDR中的氨基酸序列是随机或半随机的或者来自人抗体。3.构建多肽文库的方法,所述方法包括制备多种不同的多肽,所述多肽包含:i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及ii)抗体轻链可变区('),其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1_44(如SEQIDNO:21所示)、IGLV1_47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);其中所述Vh和所述\能够形成抗原结合位点;并且其中所述多肽的至少两种在所述Vh和/或\可变区中一个或更多个CDR中存在的氨基酸序列上彼此不同。4.多核苷酸文库,其包含多种不同的多核苷酸,其中每种多核苷酸编码多肽,所述多肽包含:i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及ii)抗体轻链可变区('),其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1_44(如SEQIDNO:21所示)、IGLV1_47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);其中所述Vh和所述\能够形成抗原结合位点;并且其中所述多核苷酸的至少两种彼此的不同在于编码下述多肽:所述多肽在所述Vh和/或\可变区中包含一个或更多个不同的CDR。5.权利要求4所述的文库,其中所述多核苷酸编码的所述Vh和/或\可变结构域的一个或更多个CDR中的氨基酸序列是随机或半随机的或者来自人抗体。6.构建多核苷酸文库的方法,所述方法包括制备编码多肽的多种不同多核苷酸,所述多肽包含:i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及ii)抗体轻链可变区('),其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1_44(如SEQIDNO:21所示)、IGLV1_47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);其中所述Vh和所述\能够形成抗原结合位点;并且其中所述多核苷酸的至少两种彼此的不同在于编码下述多肽:所述多肽在所述Vh和/或\可变区中包含一个或更多个不同的CDR。7.分离的和/或重组的多肽,所述多肽包含:i)抗体重链可变区(Vh),其包含与如SEQIDNO:3所示IGHV3-23的支架区具有至少90%同一性的支架区;以及ii)抗体轻链可变区('),其包含与以下任一种支架区具有至少90%同一性的支架区:IGLVl-40(如SEQIDNO:18所示)、IGLV1_44(如SEQIDNO:21所示)、IGLV1_47(如SEQIDNO:24所示)、IGLV1-51(如SEQIDNO:15所示)、IGLV3-1(如SEQIDNO:6所示)、IGLV3-19(如SEQIDNO:27所示)、IGLV3-21(如SEQIDNO:9所示)、IGLV6-57(如SEQIDNO:12所示);其中所述Vh和所述'能够形成抗原结合位点。8.权利要求7所述的多肽,其中所述\包含与如SEQIDN0.6所示IGLV3-1的支架区具有至少90%同一性的支架区。9.权利要求7或权利要求8所述的多肽,其是可变片段(Fv)。10.权利要求7至9中任一项所述的多肽,其是Fab片段、Fab’片段、F(ab’)片段、scFv、双抗体、三抗体、四抗体或更高阶的多肽复合物。`11.权利要求10所述的多肽,其中所述多肽是SCFv并且所述Vh和所述'通过肽接头连接在一起。12.权利要求7至11中任一项所述的多肽,其中所述Vh和/或\可变区的支架区与任一给定序列的支架区具有至少95%、96%、97%、98%或99%的同一性。13.权利要求7至12中任一项所述的多肽,其在还原性条件下可溶。14.权利要求7至13中任一项所述的多肽,当在还原性条件下产生时所述多肽可溶并且能够稳定地形成抗原结合位点。15.权利要求7至14中任一项所述的多肽,其与化合物缀合。16.权利要求15所述的多肽,其中所述化合物选自:放射性同位素、可检测的标签、治疗性化合物、胶体、毒素、核酸、肽、蛋白质、提高所述多肽在对象中之半衰期的化合物、及其混合物。17.分离的和/或外源的多核苷酸,其编码权利要求7至16中任一项所述的多肽或其重链或轻链可变区。18.载体,其包含权利要求17所述的多核苷酸。19.宿主细胞,其包含权利要求7至16中任一项所述的多肽、权利要求17所述的多核苷酸或权利要求18所述的载体。20.筛选与靶分子相结合之多肽的方法,所述方法包括将权利要求7至16中任一项所述的多肽或权利要求1、2、4和5中任一项所述的文库与靶分子相接触,以及确定权利要求7至16中任一项所述的多肽是否与所述靶分子相结合。21.权利要求20所述的方法,其中编码权利要求7至16中任一项所述之多肽的多核苷酸在宿主细胞中或在无细胞表达系统中表达以产生权利要求7至16中任一项所述的多肽。22.权利要求21所述的方法,其中所述多核苷酸在宿主细胞的胞质和/或周质中表达。23.权利要求22所述的方法,其中所述宿主细胞是细菌细胞、酵母细胞或哺乳动物细胞。24.权利要求23所述的方法,其中所述宿主细胞是细菌细胞,并且所述方法包括:a)培养包含编码权利要求7至16中任一项所述多肽之多核苷酸的细菌细胞,从而产生所述多肽,b)透化所述细菌细胞,其中所述多核苷酸和所述多肽保留在经透化的细菌细胞内,c)将所述经透化的细菌细胞与靶分子相接触,从而使所述靶分子扩散到所述经透化的细菌细胞中,以及d)确定权利要求7至16中任一项所述的多肽是否与所述靶分子相结合。25.权利要求21所述的方法,其中所述无细胞表达系统包括核糖体展示系统、mRNA展示系统或顺式展示系统。26.宿主细胞文库,其包含多种宿主细胞,所述宿主细胞包含权利要求7至16中任一项所述的多肽,其中至少一种宿主细胞包含这样的多肽,其与文库中另一宿主细胞中存在的多肽在Vh和/或\可变结构域中一个或更多个CDR中存在的氨基酸序列上不同。27.组合物,其包含权利要求7至16中任一项所述的多肽、权利要求17所述的多核苷酸和/或权利要求18所述的载体,以及可药用载剂。28.试剂盒,其包含权利要求7至16中任一项所述的多肽、权利要求17所述的多核苷酸和/或权利要求18所述的载体,以及能够透化细菌细胞的试剂。29.权利要求7至16中任一项所述多肽在治疗或诊断应用中的用途。【文档编号】C12N15/13GK103890246SQ201280047892【公开日】2014年6月25日申请日期:2012年8月17日优先权日:2011年8月18日【发明者】马修·大卫·贝亚斯利,基思·菲利普·尼文,本·罗斯·基费尔申请人:亲和生物科学公司