生产高度多样性肽文库和促进蛋白质折叠的方法
交叉引用
1.本技术要求2019年1月4日提交的美国临时申请第62/788,673号的权益,该申请通过引用全文纳入本文。
背景技术:2.体外蛋白质生产允许表达和制造少量功能性蛋白质用于研究和治疗目的。通过引用纳入
3.本技术中引用的每篇专利、出版物和非专利文献通过引用全文纳入本文,就如同各自单独通过引用纳入。发明概述
4.本公开提供文库组合物,制备文库的方法,和促进肽折叠的方法。
5.在一些实施方式中,本公开提供文库,其包含编码多种肽的多种核酸构建体,其中多种核酸构建体的核酸构建体包含:a)编码选自多种肽的肽的第一核苷酸序列;和b)编码可切割部分的第二核苷酸序列,其中可切割部分的位置使得选自多种肽的肽的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内;其中当使用对可切割部分特异的内切蛋白酶切割可切割部分时,多种肽包含超过1000种肽多样性,从而切割该肽的初始氨基酸残基。
6.在一些实施方式中,本公开提供包含多种肽的文库,其中多种肽的肽包含:a)肽的至少一个n
‑
末端氨基酸残基;b)可切割部分;和c)肽的剩余部分,其中肽的至少一个n
‑
末端氨基酸残基是在可切割部分之前或之内;其中当使用对可切割部分特异的内切蛋白酶切割可切割部分时,多种肽包括超过1000种肽多样性,从而切割该肽的至少一个n
‑
末端氨基酸残基。
7.在一些实施方式中,本公开提供制备肽文库的方法,该方法包括:a)提供编码多种肽的多种核酸构建体,其中多种核酸构建体的核酸构建体包含:i)编码来自多种肽的肽的第一核苷酸序列;以及ii)编码可切割部分的第二核苷酸序列,其中可切割部分的位置使得选自多种肽的肽的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内;b)转录和翻译,或翻译,多种核酸构建体;c)使用内切蛋白酶切割可切割部分,可选地,与(b)同时进行,从而从肽的剩余部分切割肽的至少一个n
‑
末端氨基酸残基,其中来自该肽的至少一个n
‑
末端氨基酸残基的切割产生肽文库的恰当折叠肽。
8.在一些实施方式中,本公开提供用于表达蛋白质表位的dna构建体,该dna构建体包含:a)编码蛋白质表位的第一核苷酸序列;和b)编码蛋白质表位的n
‑
末端处的可切割部分的第二核苷酸序列,其中可切割部分的位置使得蛋白质表位的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内,其中,该dna构建体转录和翻译后,使用对可切割部分特异的内切蛋白酶切割可切割部分,从而切割蛋白质表位的至少一个n
‑
末端氨基酸残基,且其中蛋白质表位是肽文库的部分。
9.在一些实施方式中,本公开提供用于表达蛋白质表位的rna构建体,该rna构建体
包含:a)编码蛋白质表位的第一核苷酸序列;和b)编码蛋白质表位的n
‑
末端处的可切割部分的第二核苷酸序列,其中可切割部分的位置使得蛋白质表位的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内,其中rna构建体翻译后,使用对可切割部分特异的内切蛋白酶切割可切割部分,从而切割蛋白质表位的至少一个n
‑
末端氨基酸残基,且其中蛋白质表位是肽文库的部分。
10.在一些实施方式中,本公开提供折叠肽的方法,该方法包括:a)提供编码肽的核酸构建体,该核酸构建体包含:i)编码肽的第一核苷酸序列;以及ii)编码可切割部分的第二核苷酸序列,其中可切割部分的位置使得肽的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内;b)转录和翻译,或翻译,核酸构建体;和c)使用内切蛋白酶切割可切割部分,可选地,与(b)同时进行,从而从肽的剩余部分切割肽的至少一个n
‑
末端氨基酸残基,其中该肽的至少一个n
‑
末端氨基酸残基的切割产生折叠的肽。
11.在一些实施方式中,本公开提供制备构象蛋白质表位文库的方法,该方法包括:a)获得由多种核酸构建体编码的多种蛋白质表位,其中多种核酸构建体中的核酸构建体进一步编码蛋白质表位n
‑
末端处的可切割部分,其中可切割部分的位置使得蛋白质表位的初始氨基酸残基在可切割部分之前或之内;b)可选地转录多种核酸构建体,其中多种核糖核酸分子被从多种核酸构建体中转录出来;c)翻译多种核糖核酸分子,其中多种蛋白质表位被从多种核糖核酸分子中翻译出来;和d)使用蛋白酶切割可切割部分,可选地,与(c)同时进行,从而从候选蛋白质表位的剩余部分切割候选蛋白质表位的初始氨基酸残基。
12.为了更好地理解本发明的本质和优势,参考以下与附图结合的详细说明。本发明能够在不偏离本发明的情况下进行各个方面的修改。因此,这些实施方式的附图和描述不是限制性的。附图简要说明
13.所附权利要求书中具体说明了本发明的新特征。可参考以下详述更好地理解本发明的特征和优点,这些详述阐述了利用本发明原理的说明性实施方式和附图,其中:
14.图1表示实施例1中生成的肽被消化以去除切割结构域。
15.图2显示使用本文所述方法制备的肽中切割sumo结构域。
16.图3提供了使用本文所述方法制备的肽的正确折叠的定量。
17.图4提供了使用本文所述方法制备的肽的流式细胞术分析。发明详述定义
18.如本文所用,术语“可切割部分”指的是可切割的基序或序列。在一些实施方式中,可切割部分包含蛋白质,例如,酶促、可切割位点。在一些实施方式中,可切割部分包含化学可切割位点,例如,通过暴露于氧化/还原条件,光/声、温度、ph、压力等。
19.如本文所用,术语“内切蛋白酶”指的是切割非末端氨基酸的肽键的蛋白酶。
20.如本文所用,术语“高度多样性”指的是具有高度的多变性。
21.如本文所用,术语“文库肽”指的是文库内的单个肽。
22.如本文所用,术语“n
‑
末端氨基酸残基”指的是位于多肽的n
‑
末端的一个或多个氨基酸。
23.如本文所用,术语“肽多样性”指的是两种或更多肽之间的变化或可变性。
24.如本文所用,术语“肽文库”指的是多种肽。在一些实施方式中,文库包含具有独特序列的一种或多种肽。在一些实施方式中,文库中的每种肽具有不同的序列。在一些实施方式中,文库包含具有相同和不同序列的肽的混合物。
25.如本文所用,术语“高度多样性肽文库”指的是具有高度肽多变性的肽文库。例如,高度多样性肽文库包含约103种、约104种、约105种、约106种、约107种、约108种、约109种、约10
10
种、约10
11
种、约10
12
种、约10
13
种、约10
14
种、约10
15
种、约10
16
种、约10
17
种、约10
18
种、约10
19
种、约10
20
种或更多种不同的肽。
26.如本文所用,术语“蛋白质表位”指的是预测与配偶体互作的肽序列或结构。
27.如本文所用,术语“蛋白质折叠”指的是肽的空间组构。在一些实施方式中,氨基酸序列影响肽的空间组构或折叠。在一些实施方式中,肽可能以功能性构象折叠。在一些实施方式中,折叠的肽具有一种或多种生物学功能。在一些实施方式中,折叠的肽获得三维结构。
28.如本文所用,术语“小泛素样修饰部分”或“sumo结构域”或“sumo部分”可互换使用,指的是特定蛋白酶识别部分。
29.本公开提供,例如,用于体外蛋白质生产的方法。通常,体外蛋白质生产不需要基因转染、细胞培养或大量的蛋白质纯化,但会导致蛋白质表达的多样性低。相反地,与体外方法相比,基于哺乳动物的表达系统允许增加蛋白质表达的多样性,但基于哺乳动物的表达系统缓慢且费力。因此,本发明提供用于高通量高多样性肽生产的体外蛋白质表达方法,用于,例如,肽文库。
30.此外,本发明提供用于使用本文所述的体外蛋白质生产的方法生成蛋白质之后,增加恰当的蛋白质折叠的方法。在一些情况下,体外细菌系统中的初始甲硫氨酸残基、n
‑
甲酰甲硫氨酸(fmet)阻碍恰当的肽折叠并影响肽功能。本文公开的体外方法可用于翻译后切割初始甲硫氨酸残基,其允许恰当的蛋白质折叠。
31.如本文所用,l
‑
对映体和d
‑
对映体氨基酸的缩写如下:丙氨酸(a,ala);精氨酸(r,arg);天冬酰胺(n,asn);天冬氨酸(d,asp);半胱氨酸(c,cys);谷氨酸(e,glu);谷氨酰胺(q,gln);甘氨酸(g,gly);组氨酸(h,his);异亮氨酸(i,ile);亮氨酸(l,leu);赖氨酸(k,lys);甲硫氨酸(m,met);苯丙氨酸(f,phe);脯氨酸(p,pro);丝氨酸(s,ser);苏氨酸(t,thr);色氨酸(w,trp);酪氨酸(y,tyr);缬氨酸(v,val)。在一些实施方式中,氨基酸是l
‑
对映体。在一些实施方式中,氨基酸是d
‑
对映体。体外转录/翻译
32.本公开的方法包括用于进行体外转录/翻译(ivtt)的方法。例如,本公开的方法包括用于进行体外转录/翻译(ivtt)以生产高多样性的肽文库并允许正确的蛋白质折叠的方法。
33.ivtt可以允许在无细胞环境下直接从dna或rna模板生产蛋白质。ivtt可用于创建,例如,mrna展示文库、肽、抗体、核糖体展示、dna展示、cis展示和所需蛋白质。
34.可以使用例如pcr产物、线性dna质粒、环状dna质粒或具有核糖体结合位点(rbs)序列的mrna模板进行本文使用的ivtt方法。合适的模板被分离后,可以将转录组分加入到模板中,其包括,例如,三磷酸核糖核苷酸,和rna聚合酶。转录完成后,可以加入翻译组分,其可在,例如,兔网织红细胞裂解液或小麦胚芽提取物中找到。在一些方法中,转录和翻译
可在单个步骤中发生,其中,例如,在兔网织红细胞裂解液中或小麦胚芽提取物中找到的纯化的翻译组分与转录组分同时添加到核酸模板中。蛋白质折叠。
35.本文公开的方法可用于促进用公开的ivtt方法生产的肽的恰当蛋白质折叠,以生产具有高肽多样性的肽文库。
36.肽的无细胞蛋白质合成(cfps)可允许生产肽。通过cfps获得高产量可能需要利用细菌系统,其中翻译序列的第一个氨基酸为n
‑
甲酰甲硫氨酸(fmet)。fmet与甲硫氨酸的不同在于其包含中性甲酰基团(hco)而不是带正电荷的氨基末端(nh
3+
)。尽管细菌可以使用内源性氨肽酶来切割fmet,但fmet的去除可能不完全或被取消,这取决于序列中第二个氨基酸的种类。例如,甲硫氨酸氨肽酶的作用在fmet和天冬酰胺之间可能是低效的。
37.由cfps生产的肽的一个实例为cmv
‑
衍生肽,其包含氨基酸序列:fmet
‑
nlvpmvatv(seq id no.:1)。由于保留了fmet残基,此肽的不恰当的蛋白质折叠可能影响蛋白质结合相关t细胞受体的能力。如果蛋白质是在由粗细胞提取物制成的细菌cfps系统中产生的,就会出现这种结果。此外,在肽文库的情况下,如果处理效率低,单独模板可能会产生有或没有fmet的肽,或两者的混合物。
38.然而,在仅由纯化组分构成且完全缺乏甲硫氨酸氨肽酶的重构cfps系统中,所有文库变体可以由fmet残基起始,然后该残基可以如本文方法中所述被均匀切割。因此,使用本文所述ivtt方法,除去初始甲硫氨酸氨基酸允许成功的肽折叠。
39.更具体地,如本文所述的方法可以使用无细胞合成并随后或同时进行切割步骤。无细胞肽合成可以通过使用ivtt系统进行。可以使用ivtt系统合成肽,该系统既可以转录,例如,dna构建体转录为rna,也可以将rna翻译为蛋白质。在用于合成肽的无细胞系统中,核苷酸序列可编码存在于肽n
‑
末端的甲硫氨酸残基和可切割部分。可切割部分的位置可使得该肽的至少一个n
‑
末端氨基酸残基在可切割部分之前或之内。在一些实施方式中,该方法包括编码可切割部分,其位置使得肽的一个n
‑
末端氨基酸残基在可切割部分之前或之内。在一些实施方式中,一个n
‑
末端氨基酸残基是甲硫氨酸残基。可以使用对可切割部分特异的蛋白酶切割可切割部分,该蛋白酶也可以从肽的剩余部分切掉可切割部分。
40.可切割部分的切割可通过使用例如氨基
‑
肽酶发生。在一些实施方式中,氨基酸残基的切割通过使用甲硫氨酸氨基
‑
肽酶发生。当第二位的氨基酸残基为,例如,甘氨酸、丙氨酸、丝氨酸、半胱氨酸或脯氨酸时,甲硫氨酸氨基
‑
肽酶可从肽中切割甲硫氨酸。
41.如本文所述的dna或rna构建体中编码的可切割部分的实例包括任何可被蛋白酶切割的可切割部分。在一些实施方式中,可切割部分可以是小泛素样修饰(sumo)蛋白质。可以使用对sumo特异的蛋白酶从肽中切割下sumo结构域。在一些实施方式中,可切割部分可以是肠激酶切割位点:asp
‑
asp
‑
asp
‑
asp
‑
lys(seq id no.:2)。蛋白酶可以是,例如,ulp1蛋白酶或肠激酶。通过识别sumo的三级结构而非氨基酸序列,ulp1蛋白酶可以特定的方式切下sumo。肠激酶(肠肽酶)也可用于在以下切割位点的赖氨酸后切割:asp
‑
asp
‑
asp
‑
asp
‑
lys(seq id no.:2)。肠激酶还可以在其他碱性氨基酸处切割,取决于蛋白质底物的序列。
42.在编码肽的构建体翻译期间或之后,n
‑
末端氨基酸残基可被高效地切割以产生恰当折叠的肽。在一些实施方式中,至少一个n
‑
末端氨基酸残基被切割以产生肽。在一些实施方式中,切割一个、两个、三个、四个、五个六个、七个、八个、九个、十个或更多n
‑
末端氨基酸
残基以产生肽。该n
‑
末端氨基酸可以是任何氨基酸残基。该n
‑
末端氨基酸残基可以是甲硫氨酸氨基酸残基。因此该恰当折叠的肽不局限于具有n
‑
末端甲硫氨酸,还可以是通过无细胞体外方法产生的高多样性肽文库的部分。
43.本公开提供,例如,可编码可使用本文所述方法正确折叠的肽的dna或rna构建体。该肽可以是任何多肽、蛋白质、融合蛋白或其片段。例如,可编码蛋白质表位的dna或rna构建体。dna或rna构建体可编码蛋白质多聚体,例如,二聚体、三聚体、四聚体等。在一些实施方式中,多聚体是同源多聚体,例如,相同亚基或同源寡聚体。在一些实施方式中,多聚体是异源多聚体,例如,不同的亚基。
44.如本文所述的蛋白质表位可以指编码预测与蛋白质(例如,受体)结合的肽的特定核苷酸序列。蛋白质,例如受体,可具有对蛋白质表位的任意水平的亲和力。蛋白质,例如受体,可具有对蛋白质表位的高亲和力。蛋白质,例如受体,可具有对蛋白质表位的低亲和力。蛋白质,例如受体,可以对蛋白质表位无亲和力。蛋白质,例如受体,可以对蛋白质表位有或无特异性。
45.又例如,可以使用ivtt系统合成蛋白质表位,该系统既可以转录,例如,dna构建体转录为rna,也可以将rna翻译为蛋白质。由于使用无细胞系统以合成蛋白质表位,核苷酸序列可以在蛋白质表位的n
‑
末端编码甲硫氨酸残基。如前所述,可以从蛋白质表位的剩余部分切割n
‑
末端甲硫氨酸残基。本文所述方法的使用可允许从这些dna构建体和/或rna构建体恰当折叠蛋白质。肽文库。
46.可以使用如本文所述的ivtt系统产生肽文库。肽文库可用于一系列筛选试验,以识别潜在的诊断或治疗靶点或试剂。例如,肽文库可用于筛选疾病特异性或器官特异性肽、筛选具有治疗应用的肽、筛选具有诊断应用的肽、筛选肿瘤靶向肽、筛选抗体表位或抗原、筛选t细胞表位或抗原、筛选抗微生物肽,或其任何组合。因此,具有适当质量的多种肽文库具有许多有价值的用途。
47.可以使用如本文所述的ivtt系统产生高多样性肽文库。可以使用如本文所述的ivtt系统通过高通量方法产生高多样性肽文库。如上所述,产生的高多样性肽文库可包含正确折叠的肽。
48.可基于例如直接测量在特定文库中存在的不同类型的肽来评估肽多样性。也可以通过测定样品中单氨基酸和双肽的分布来测量肽多样性。高多样性肽文库可以是包含不少于103种彼此独特的肽的文库。可以通过例如,对文库中的单独的肽进行测序,或通过使用质谱测量文库中不同物质来测定肽多样性。
49.使用本文所公开的方法创建的肽文库可具有肽多样性,例如,约103、约104、约105、约106、约107、约108、约109、约10
10
、约10
11
、约10
12
、约10
13
、约10
14
、约10
15
、约10
16
、约10
17
、约10
18
、约10
19
、约10
20
或更多种肽。在一些实施方式中,本文所述的肽文库具有大于或等于约109种肽多样性。
50.本文公开的方法可用于使用,例如,无细胞方法创建肽文库。无细胞文库合成可以通过使用ivtt系统进行。可以使用ivtt系统合成肽,该系统既可以转录,例如,dna构建体转录为rna,也可以将rna翻译为蛋白质。编码肽的n
‑
末端甲硫氨酸残基和可切割部分的核苷酸序列可在dna构建体或rna构建体中被编码。可切割部分的位置使得该肽的至少一个n
‑
末
端氨基酸残基在可切割部分之前或之内。在一些实施方式中,该方法包括编码可切割部分,其位置使得肽的一个n
‑
末端氨基酸残基在可切割部分之前或之内。在一些实施方式中,一个n
‑
末端氨基酸残基是甲硫氨酸残基。可以使用对可切割部分特异的蛋白酶切割可切割部分,该蛋白酶也可以从肽的剩余部分切掉可切割部分。
51.可切割部分的切割可通过使用例如氨基
‑
肽酶发生。在一些实施方式中,氨基酸残基的切割通过使用甲硫氨酸氨基
‑
肽酶发生。当第二位的氨基酸残基为,例如,甘氨酸、丙氨酸、丝氨酸或脯氨酸时,甲硫氨酸氨基
‑
肽酶可从肽中切割甲硫氨酸。
52.如本文所述的dna或rna构建体中编码的可切割部分的实例包括任何可被蛋白酶切割的可切割部分。在一些实施方式中,可切割部分可以是小泛素样修饰(sumo)蛋白质。可以使用对sumo特异的蛋白酶从肽中切割下sumo结构域。在一些实施方式中,可切割部分可以是肠激酶切割位点:asp
‑
asp
‑
asp
‑
asp
‑
lys(seq id no.:2)。蛋白酶可以是,例如,ulp1蛋白酶或肠激酶。通过识别sumo的三级结构而非氨基酸序列,ulp1蛋白酶可以特定的方式切下sumo。肠激酶(肠肽酶)也可用于在以下切割位点的赖氨酸后切割:asp
‑
asp
‑
asp
‑
asp
‑
lys(seq id no.:2)。肠激酶还可以在其他碱性氨基酸处切割,取决于蛋白质底物的序列。
53.在编码文库肽的构建体翻译期间或之后,n
‑
末端氨基酸残基可被切割以产生用于高多样性肽文库的肽。在一些实施方式中,至少一个n
‑
末端氨基酸残基被切割以产生肽。在一些实施方式中,切割一个、两个、三个、四个、五个六个、七个、八个、九个、十个、二十个、三十个、四十个、五十个、六十个、七十个、八十个、九十个、一百个或更多n
‑
末端氨基酸残基以产生文库肽。该n
‑
末端氨基酸可以是任何氨基酸残基。该n
‑
末端氨基酸残基可以是甲硫氨酸氨基酸残基。
54.肽文库可用于,例如,鉴定肽
‑
靶蛋白相互作用,例如鉴定受体/配体相互作用,进行蛋白质构象研究,开发高亲和力和低抗体,鉴定肽模拟物,鉴定免疫原性肽,鉴定肽之间的结合模式(例如,在单个肽、免疫原性肽或肽模拟物之间),鉴定免疫细胞受体/抗原对,开发疫苗,进行蛋白激酶研究,进行蛋白酶研究,和进行药物设计研究。因此,肽文库中拥有多种肽的阵列可用于确保鉴定准确的靶标,并确保进行所产生的生物测定以获得准确的结果。
55.在一些实施方式中,本文公开的方法可用于增加肽文库的肽多样性以鉴定蛋白质
‑
蛋白质相互作用。蛋白质表位可结合,例如,受体,抗体,免疫细胞受体(bcr、mhc、tcr),细胞表面蛋白,激酶,蛋白酶,药物或其他。
56.本公开提供,例如,可编码文库肽的dna或rna构建体。该文库肽可以是任何多肽、蛋白质、融合蛋白或其片段。例如,dna或rna构建体可编码包含蛋白质表位的文库肽。dna或rna构建体可编码包含文库肽的蛋白质多聚体,例如,二聚体、三聚体、四聚体等。在一些实施方式中,多聚体是同源多聚体,例如,相同亚基或同源寡聚体。在一些实施方式中,多聚体是异源多聚体,例如,不同的亚基。
57.如本文所述的包含蛋白质表位的文库肽可以指编码预测与特定蛋白质(例如,受体)结合的文库肽的特定核苷酸序列。蛋白质,例如受体,可具有对蛋白质表位的任意水平的亲和力。蛋白质,例如受体,可具有对蛋白质表位的高亲和力。蛋白质,例如受体,可具有对蛋白质表位的低亲和力。蛋白质,例如受体,可以对蛋白质表位无亲和力。蛋白质,例如受体,可以对蛋白质表位有或无特异性。
58.又例如,可以使用ivtt系统合成包含蛋白质表位的文库肽,该系统既可以转录,例如,dna构建体转录为rna,也可以将rna翻译为蛋白质。由于使用无细胞系统以合成蛋白质表位,核苷酸序列可以在蛋白质表位的n
‑
末端编码甲硫氨酸残基。如前所述,可以从蛋白质表位的剩余部分切割n
‑
末端甲硫氨酸残基。用于检测蛋白质表位结合的方法。
59.如本文所述的dna或rna构建体的ivtt之后,可以确定蛋白质表位与,例如,靶受体的结合。可以使用facs评估结合。如本文所述的dna或rna构建体的翻译之后,可以将蛋白质表位暴露于,例如,表达靶受体的细胞的样品。然后可以用荧光染料对细胞染色,该染料可以对,例如,蛋白质表位特异。然后,基于荧光信号的强度,使用facs分选染色的细胞。用于facs分析的染色剂可以是,例如,藻红蛋白(pe)、异硫氰酸荧光素(fitc)、7
‑
氨基放线菌素d(7
‑
aad)、别藻蓝蛋白(apc)或前述物质的任意组合或修饰。
60.如本文所述的dna或rna构建体翻译之后,肽文库可被暴露于,例如,靶受体的样品,例如,多种受体,例如,不同受体的库。然后可以用荧光染料对相互作用的文库肽和受体染色,该染料可以对,例如,蛋白质表位特异。本领域中用于检测蛋白质相互作用的其他方法包括但不限于elisa、蛋白质印迹、免疫共沉淀、免疫电泳、亲和纯化、质谱等。构建体。
61.本文所述构建体可以是,例如,dna或rna构建体。构建体还可以包含人工核酸。构建体的核酸可包括,例如,基因组dna、cdna、trna、mrna、rrna、修饰的rna、mirna、grna和sirna或其他rnai分子。
62.如本文所述的构建体,长度可以是至少约20个核苷酸、至少约30个核苷酸、至少约40个核苷酸、至少约50个核苷酸、至少约75个核苷酸、至少约100个核苷酸、至少约200个核苷酸、至少约300个核苷酸、至少约400个核苷酸、至少约500个核苷酸、至少约1,000个核苷酸、至少约2,000个核苷酸、至少约5,000个核苷酸、至少约6,000个核苷酸、至少约7,000个核苷酸、至少约8,000个核苷酸、至少约9,000个核苷酸、至少约10,000个核苷酸、至少约12,000个核苷酸、至少约14,000个核苷酸、至少约15,000个核苷酸、至少约16,000个核苷酸、至少约17,000个核苷酸、至少约18,000个核苷酸、至少约19,000个核苷酸或至少约20,000个核苷酸。接头。
63.本文所述的构建体可包含构建体的不同结构域之间的接头。接头可以是化学键,例如,一个或多个共价键或非共价键。在一些实施方式中,接头是共价键。在一些实施方式中,接头是非共价键。在一些实施方式中,接头是肽接头。这种接头可以介于2
‑
30个氨基酸之间,或更长。在一些实施方式中,接头可用于,例如,将水凝胶和目标分子隔开。在一些实施方式中,例如,接头可以位于目标分子和另一个目标分子之间。在一些实施方式中,接头可以位于目标分子的结构域之间,例如,以提供二级和三级结构的分子柔性。接头可包括柔性、刚性和/或可切割接头,如本文所述。在一些实施方式中,接头包含至少一个甘氨酸、丙氨酸和丝氨酸氨基酸以提供柔性。在一些实施方式中,接头是疏水性接头,例如包括带负电荷的磺酸根基团、聚乙二醇(peg)基团或焦磷酸二酯基团。在一些实施方式中,接头是可切割的,以选择性地从水凝胶中释放目标分子,但足够稳定以防止过早切割。
64.最常用的柔性接头具有主要由gly和ser残基片段组成的序列(“gs”接头)。柔性接
头可用于连接需要一定程度运动或相互作用的结构域,并且可以包括小的、非极性(例如gly)或极性(例如ser或thr)氨基酸。ser或thr的纳入还可以通过与水分子形成氢键来维持接头在水溶液中的稳定性,从而减少接头和蛋白质部分之间不利的相互作用。
65.刚性接头可用于在构建体的结构域之间保持固定距离,并维持各个结构域的独立功能。刚性接头可具有,例如,α螺旋结构或富含pro的序列(xp)n,其中x表示任何氨基酸。
66.可切割接头可以在体内释放游离的功能域。在一些实施方式中,接头可以在特定情况下被切割,例如存在还原剂或蛋白酶。体内可切割接头可利用二硫键的可逆性质。一个例子包括两个cys残基之间的凝血酶敏感序列(例如,prs)。cprsc的体外凝血酶处理导致凝血酶敏感序列的切割,而可逆的二硫键接头保持完整。这种接头是已知的并描述于,例如,chen等.2013.融合蛋白接头:特性、设计和功能。(fusion protein linkers:property,design and functionality.)adv drug deliv rev.65(10):1357
–
1369。融合体中接头的体内切割还可以通过在某些条件、特定细胞或组织中、或限制在某些细胞隔室中体内表达的蛋白酶进行。许多蛋白酶的特异性提供了在限制的隔室中较慢的接头切割。
67.接头的实例包括亲水或疏水接头,例如带负电荷的磺酸根基团;脂质,例如聚(
‑‑
ch2
‑‑
)烃链,例如聚乙二醇(peg)基团,其不饱和变体,其羟基化变体,其酰胺化或其他含n变体,非碳接头;碳水化合物接头;磷酸二酯接头,或能够共价连接促进剂的两个或多个组分(例如两个多肽)的其他分子。非共价接头也包括在内,例如通过多肽的疏水区或多肽的疏水延伸部分连接目标分子的疏水脂质小球,例如富含亮氨酸、异亮氨酸、缬氨酸,或者也可能是丙氨酸、苯丙氨酸,甚至酪氨酸、甲硫氨酸、甘氨酸或其他疏水残基的一系列残基。目标分子或水凝胶的组分可使用基于电荷的化学连接,使得目标分子或水凝胶的带正电荷的组分与另一个分子的负电荷相连。肽或蛋白质。
68.本公开提供,例如,可编码肽的dna或rna构建体。该肽可以是任何多肽、蛋白质或其片段。
69.翻译后的肽的长度范围可为从约3至约40,000个氨基酸、约15至约35,000个氨基酸、约20至约30,000个氨基酸、约25至约25,000个氨基酸、约50至约20,000个氨基酸、约100至约15,000个氨基酸、约200至约10,000个氨基酸、约500至约5,000个氨基酸、约1,000至约2,500个氨基酸或它们之间的任何范围。在一些实施方式中,多肽的长度小于约40,000个氨基酸、小于约35,000个氨基酸、小于约30,000个氨基酸、小于约25,000个氨基酸、小于约20,000个氨基酸、小于约15,000个氨基酸、小于约10,000个氨基酸、小于约9,000个氨基酸、小于约8,000个氨基酸、小于约7,000个氨基酸、小于约6,000个氨基酸、小于约5,000个氨基酸、小于约4,000个氨基酸、小于约3,000个氨基酸、小于约2,500个氨基酸、小于约2,000个氨基酸、小于约1,500个氨基酸、小于约1,000个氨基酸、小于约900个氨基酸、小于约800个氨基酸、小于约700个氨基酸、小于约600个氨基酸、小于约500个氨基酸、小于约400个氨基酸、小于约300个氨基酸或更少可能是有用的。在一些实施方式中,肽的长度可以是约5至约200个氨基酸、约15至约150个氨基酸、约20至约125个氨基酸、约25至约100个氨基酸或其中的任何范围。翻译后的蛋白质表位长度可以是约5至约200个氨基酸、约15至约150个氨基酸、约20至约125个氨基酸、约25至约100个氨基酸或其中任何的范围。
70.本文所述的肽文库可包含阵列平台,其包含阵列表面上的多个单独特征。每个特
征可包含多种在阵列表面原位或体外或点在表面上合成的单独的肽,其中,分子在特征内是相同的,但分子的序列或种类在特征之间不同。这种阵列分子包括大型合成肽阵列的合成。
71.肽阵列可包含已知结合例如细胞受体的对照序列。测量与对照序列和文库肽的结合模式以定量阵列和测定过程。
72.在一些实施方式中,肽文库包含约100种、约500种、约1000种、约2000种、约3000种、约4000种、约5,000种、约6000种、约7000种、约8000种、约9000种、约10,000种、约15,000种、约20,000种、约30,000种、约40,000种、约50,000种、约100,000种、约200,000种、约300,000种、约400,000种、约500,000种或更多种具有不同序列的肽。
73.本文的平台也可以包含在微量滴定板中的肽,用于测定本文提供的蛋白表位的蛋白互作。在一些实施方式中,微量滴定板包括但不限于96孔板、384孔板、1536孔板、3456孔板和9600孔板。在一些实施方式中,在微量滴定板的每个孔中存在多于一种肽,即,汇集肽,并通过本试验中的阳性孔和阴性孔的解卷积来测定与目标蛋白相互作用的单个肽。
实施例
74.以下实施例被包括以进一步描述本公开的一些方面,不应用于限制本发明的范围。实施例1:肽文库的体外翻译
75.该实施例证明了蛋白质的无细胞合成(cfps)。
76.肽文库的cfps能够产生范围广泛的各种肽。通过cfps获得高产量需要使用细菌系统,其中翻译序列的第一个氨基酸是n
‑
甲酰甲硫氨酸(fmet)。该残基与甲硫氨酸的不同之处在于包含中性甲酰基团(hco)而不是带正电荷的氨基
‑
末端(nh
3+
)。尽管细菌可以使用内源性氨肽酶来切割fmet,但fmet的去除可能不完全或被取消,这取决于序列中第二个氨基酸的种类。例如,甲硫氨酸氨肽酶在fmet和天冬氨酸之间的切除效率低。因此,cmv衍生肽,该系统中的模型肽,最终将在单链hla或mhc设计中生产为fmet
‑
nlvpmvatv(seq id no.:1);因此,整个分子将不会正确地折叠,且不会识别其同源t细胞受体。如果蛋白质是在由粗细胞提取物制成的细菌cfps系统中产生的,预期是这样的结果。此外,在文库的情况下,如果处理效率低,单独模板可能会产生有或没有fmet的肽,或两者的混合物。在一个仅由纯化的组分构成且完全缺乏甲硫氨酸氨肽酶的重构cfps系统中,所有文库变体都将由fmet残基起始。
77.为了解决这个问题,构建体被工程改造为包括编码酶促切割结构域和文库肽的基因。去除至少初始甲硫氨酸氨基酸允许肽文库的上限包括更大的多样性,例如,20
x
,其中x是肽的长度,而包含甲硫氨酸残基会将文库多样性限制为20
(x
‑
1)
。此外,去除初始甲硫氨酸氨基酸允许成功的肽折叠和可测量水平的肽表达。
78.在无细胞条件下合成肽。将所有cfps组分在冰上解冻并混合,然后移至相关温度以启动反应。向一个试管中加入以下试剂:40%(v/v)purexpress溶液a,30%(v/v)of purexpress溶液b(e6800l,新英格兰生物实验室公司(new england biolabs,inc.)),0.8u/μl rna酶反应抑制剂(10777019,赛默飞世尔科技公司(thermofischer scientific)),4%(v/v)每种二硫化物增强剂1和2(e6820l,新英格兰生物实验室公司),
0.004u/μl于pbs(12588018,英杰公司(invitrogen))中稀释的sumo
‑
蛋白酶的反应(选择切除后完全去除切除突出端(无疤)),无核酸酶水和20ng/μl编码所需cfps产物的相应质粒dna的反应。试验了四种不同的cfps温度:20℃、25℃、30℃和37℃。在每个指定的时间点,取样并通过将试管置于冰上并添加edta至终浓度2mm来停止反应。
79.图1表示消化肽以去除切割结构域以增加多样性。泳道对1
‑
2、3
‑
4、5
‑
6、7
‑
8和9
‑
10分别表示在没有sumo结构域的模板、具有未添加蛋白酶的sumo结构域的模板、具有反应完成后添加蛋白酶的sumo结构域的模板、具有反应期间存在蛋白酶的sumo结构域的模板上进行cfps反应以及缺乏dna模板的反应。在加入100mm dtt的还原条件下制备奇数泳道中的样品用于凝胶电泳。在室温下4小时后,通过将试管置于冰上来终止所有反应。将4u/反应的sumo蛋白酶添加到样品3
‑
8中。在泳道5
‑
6上样的反应中,将管置于冰上后将蛋白酶与10mm edta一起加入,然后转移到室温3.5小时,然后再次置于冰上。
80.当通过蛋白质印迹评估时,肽之前的具有肠激酶切割结构域的单独构建体也显示蛋白质产生和切割。
81.进行蛋白质印迹以确定总蛋白质产量。每个cfps样品与水、4x样品缓冲液和1m dtt混合,在95℃下煮沸5分钟,然后加载到10%sds
‑
page凝胶上。使用hrp
‑
抗
‑
flag抗体对样品进行印迹。
82.图2显示了来自cfps反应的样品,其中包含具有或不具有sumo结构域的模板。在室温下4小时后,通过将试管置于冰上来终止反应。如上所述制备样品用于蛋白质印迹,但不包括95℃煮沸步骤。这些结果表明,当且仅当存在sumo结构域时,sumo蛋白酶才能切割cfps产物。实施例2:评估体外翻译蛋白质的3
‑
d结构
83.本实施例证明实施例1中制备的cfps蛋白质折叠成为可识别的三维结构。
84.测试cfps蛋白的抗体构象识别。错误折叠或未折叠的蛋白质不被抗体识别。具有切割的酶促结构域的cfps蛋白质折叠并被构象特异性抗体识别。
85.通过elisa测量蛋白表达。用在100mm碳酸氢盐/碳酸盐包被缓冲液中稀释的抗链霉亲和素抗体(410501,白乐津公司(biolegend))包被板,并在4℃下孵育过夜。然后,通过用洗涤缓冲液(补充有0.05%吐温
‑
20的pbs)填充孔将板洗涤3次,并通过用封闭缓冲液(补充有2%(v/v)bsa的洗涤缓冲液)填充孔在室温下封闭2小时。然后用封闭缓冲液中每种cfps蛋白质的系列稀释液填充孔,然后在室温下孵育1小时。然后,用洗涤缓冲液洗涤板三次,并用含有0.15μg/ml在封闭缓冲液稀释的对蛋白质特异性的辣根过氧化物酶抗体室温下孵育1小时。
86.再洗涤三次后,通过向每个孔中加入3,3’,5,5’四甲基联苯胺底物显色,并通过加入市售终止溶液终止反应。使用酶标仪测量450nm处的吸光度。吸光值一式两份取平均值。平板用粘性塑料覆盖并在所有孵育期间在旋转器上轻轻搅拌。每个样品的浓度是从阳性对照蛋白质的标准曲线中内推的。
87.图3显示了线性表位或构象表位的elisa检测,从中计算正确地折叠的百分比。sumo蛋白酶被添加到两个cfps反应中。图3表明通过构象表位抗体的识别证明了sumo切割的肽或fmet产物是否为正确折叠。
88.富含cmv的t细胞(供体153,astarte 3835fe18,目录号1049)被用于facs染色。96
孔圆底微量滴定板的孔中充满t细胞,细胞用冰冷的facs缓冲液(d
‑
pbs、2mm edta和2%(v/v)胎牛血清)洗涤一次,以300g在4℃离心,去除上清液。然后,将相应孔用fc受体封闭液在4℃温和搅拌下封闭30分钟,用facs缓冲液洗涤,去除上清液。将facs缓冲液添加到补偿对照孔中。
89.在下一步中,将细胞与20nm阳性对照或取自指定cfps反应的样品稀释液在4℃下孵育30分钟,然后用facs缓冲液洗涤一次。将在facs缓冲液中稀释的100nm检测抗体加入每个孔中,将板在4℃下避光孵育30分钟,然后用pbs洗涤两次,并用可固定活力染料apc
‑
efluor780(1:8000稀释,50μl/孔)染色,在室温下放置15分钟。然后将板用facs缓冲液洗涤两次,并用固定缓冲液pbs、3.7%甲醛(v/v)、2%fbs(v/v))固定。最后,将样品转到facs管中进行分析。
90.图4显示了sumo切割后多聚体蛋白的右移。