专利名称:经工程改造的酶活性改善的聚唾液酸转移酶的制作方法
技术领域:
本发明涉及溶解性和活性改善的的聚_唾液酸转移酶(PST)多肽,以及利用该 聚-唾液酸转移酶产生聚唾液酸终末产物,如寡糖、糖蛋白和糖脂的方法。
背景技术:
哺乳动物细胞的细胞表面存在糖蛋白、糖脂和多糖,在许多生物学活动中是中心 分子。它们参与了整个生物学过程中的细胞间识别、细胞分化和各种受体-配体相互作用。 这些生物学活性聚糖中许多都含有必需的9-碳糖,称为唾液酸或N-乙酰基_神经氨酸
(NeuAc)。 某些细菌病原体能入侵哺乳动物宿主是利用了宿主中存在的含唾液酸的糖偶联 物。这些细菌的细胞表面显示有某些相同的糖链,业已证明这些糖在致病机制中的确具有 作用。参见例如,Kahler, C. M和St印hens, D. S. , Crit RevMicrobiol, 24 :281-334(1998) 禾口Moran,A.P.等,FEMS Immunol Med Microbiol, 16 :105-115 (1996)。认为存在的这类 糖模拟物能使病原菌逃脱免疫系统的监测,因为这些分子不被认为是异物。另外,存在的 这些糖提供了阻止血清补体杀伤作用的物理屏障。参见例如,Vogel, U等,Med Microbiol Immunol (Brel) , 185 :81-87(1996)。最后,有可能某些病原体能利用识别其表面糖结构的 人正常受体作为帮助其传播(或寄居宿主,虽然对于许多这些病原菌而言这种机制未被证 实)的工具。参见例如,Preston,A等,Crit Rev Microbiol, 22 :139-180(1996)和Harvey, H.A.等,Mol Microbiol, 36 :1059-1070(2000)。 B群奈瑟脑膜炎球菌和大肠杆菌K1的夹膜多糖连接键中具有唾液酸,是主要 见于哺乳动物神经细胞粘附分子,一种整合了神经原功能的脑特异性蛋白中的聚唾液酸 (PSA)结构的分子模拟物。发现它们是a-2,8-连接的Neu5Ac的均聚体,也是a-2,9-连 接残基的均聚体,是混合的a -2, 8/ a -2, 9连接键的共聚体,最后是包含在Y群和W群奈 瑟脑膜炎球菌中的其它糖的聚合物。对于大肠杆菌、奈瑟脑膜炎球菌和溶血性巴斯德菌 (P.haemolytica),神经侵入性疾病需要这些聚唾液酸夹膜。参见例如,Silver, R. P.和 E. R. Vimr. 1990,"大肠杆菌Kl的聚唾液酸夹膜",刊登在B. H. Iglewski和V. L. Clark主编 的《微生物发病机制的分子基础》("Molecular basis of Microbial Pathogensis"),第 39-60页,哈里弗圣地亚哥的学术出版社(Academic Press, San Diego, Calif)。重要的是 须注意,因为许多这些病原菌是人宿主特异性的,故动物感染模型获得的数据不能显示这 些糖偶联物所具有的真实功能。 迄今对细菌病原体唾液酸转移酶的酶学基础方面的详细研究极少。已有可能表 达、纯化和结晶负责L0S唾液酸化的一些酶。参见例如,Gilbert, M.等,J Biol Chem,271 ;28271-28276(1996) ;Gilbert, M.等,J Biol Chem,275 ;3896-3906(2000) ;Chiu, CP.等,Nat. Struct. Mol. Biol. ,11 :163-170(2004)和Yu, H.等,J. Am. Chem. Soc. , 127 :
17618-17619(2005)。然而,这些都没有对参与唾液酸均聚体夹膜生成的那些酶进行研究。
已在大肠杆菌和奈瑟脑膜炎球菌中鉴定到产生PSA夹膜的基因位点,并对大肠杆 菌Kl和K92重组酶(NeuS)做了一些研究。参见例如,以Cho, J.和Troy FA, I. I. , PNAS, 91 :11427-11431(1994)和Shen,G. J.等,J. Biol. Chem. ,274 :35139-35146(1999)。但也还 没有关于分离的唾液酸转移酶的详细酶学研究报告。该酶的溶解性差防碍了体外产生聚唾 液酸偶联物因而阻碍了其酶学研究。本发明解决了此问题和其它需要。
发明概述 本发明提供可将唾液酸分子从供给底物转移到合适的接受底物的截短的聚唾液 酸转移酶(PST)多肽。在一实施方式中,该截短PST多肽包含的氨基酸序列与SEQ ID No: 1的氨基酸33-495有95%相同。在另一实施方式中,该截短PST多肽包含的氨基酸序列与 SEQ ID No :1的氨基酸20-495有95%相同。优选地,该截短PST多肽比SEQ ID No :1的 氨基酸1-495构成的全长PST多肽更易溶解。本发明的截短PST多肽不包含SEQ ID No :1 的氨基酸1-495构成的氨基酸序列。 —方面,该截短PST多肽包含MBP标签。另一方面,该截短PST多肽唾液酸化的接 受底物是例如糖肽、糖蛋白、糖脂或神经节苷脂。另一方面,所述接受底物是糖蛋白,如因子 IX、红细胞生成素(EPO)、转铁蛋白和胎球蛋白。在优选实施方式中,所述糖蛋白底物是人蛋白。 本发明提供产生聚唾液酸化产物糖的方法,该方法包括使接受底物如寡糖或糖接 触截短的PST多肽和含唾液酸部分的供给底物,以及使唾液酸部分转移给接受糖,从而产 生聚唾液酸化的产物糖。 本发明提供产生聚唾液酸化蛋白或肽的方法,该方法包括使接受底物如合适的蛋 白或肽接触截短的PST多肽和含唾液酸部分的供给底物,以及使唾液酸部分转移给接受 糖,从而产生聚唾液酸化的蛋白或肽。 本发明提供产生聚唾液酸化糖脂或神经节苷脂的方法,该方法包括使接受底物如 合适的糖脂或神经节苷脂接触截短的PST多肽和含唾液酸部分的供给底物,以及使唾液酸 部分转移给接受糖,从而产生聚唾液酸化糖脂或神经节苷脂。
附图简要说明
图1是N-末端截短的PST的SDS-PAGE分析。分析了 PST-13 (MalE-全长PST)、 PST-29 (MalE-PST-A 19)和PST-30 (MalE-PST-A 32)的溶解性。"P"表示颗粒组分,"S"表 示上清液(可溶性)组分。 图2提供PST唾液酸转移酶反应的代表性毛细管电泳(CE)的电泳图。分析了 PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST- A 19)和PST-30 (MalE-PST- A 32)经27, 000x g离心后的上清液(S)和颗粒(P)。转化百分比指所述底物转化为任何唾液酸化形式的百 分比。 图3提供 了 PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST-A 19)禾口 PST-30 (MalE-PST-A 32)经27, OOOx g离心后1/10稀释上清液的代表性CE分析。转 化百分比指所述底物转化为任何唾液酸化形式的百分比。CE线的顺序从上到下与PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST- A 19)和PST-30 (MalE-PST- A 32)相对应。
图4显示纯化的PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST-A 19)和PST-30 (MalE-PST-A 32)的代表性SDS-PAGE。箭头指出的是纯化蛋白条带大概预计的迁移点。 图5为显示50ng纯化的MalE-Pst融合构建物PST_13 (MalE-全长PST)、PST-29 (MalE-PST-A 19)和PST-30 (MalE-PST-A 32)活性的代表性CE分析。转化百分比指底物转化为唾液酸化产物的百分比。 图6显示PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST-A 19)禾口PST-30 (MalE-PST- A 32)经100, OOOx g离心后的SDS-PAGE分析。"S"表示上清液(可溶性)组分,"P"表示颗粒组分。 图7显示PST-13 (MalE-全长PST) 、 PST-29 (MalE-PST-A 19)禾口PST-30 (MalE-PST- A 32)经100, OOOx g离心试验后的代表性CE分析。"S"表示上清液(可溶性)组分,"P"表示颗粒组分。转化百分比指底物转化为其唾液酸化产物的百分比。
图8提供了显示PST-13(MalE-全长PST)稳定性试验结果的图。试验所用的PST-13 (MalE-全长PST)浓度为0. 35mg/ml 。 X轴为时间(天),Y轴为残留活性(% )。
图9提供了显示PST-30 (MalE-PST- A 32)稳定性试验结果的图。所用的PST-30 (MalE-PST-A 32)浓度为1.63mg/ml。 X轴为时间(天),Y轴为残留活性(% )。
图10提供了显示PST-30 (MalE-PST- A 32)稳定性试验结果的图。所用的PST-30 (MalE-PST-A 32)浓度为1.56mg/ml。 X轴为时间(天),Y轴为残留活性(% )。
图11提供了在含双功能唾液酸转移酶CST-89和PST-13 (MalE-全长PST)或PST-30 (MalE-PST- A 32)的反应中,因子IX被聚唾液酸化的代表性SDS-PAGE分析。"T"表示反应进行的时间(分钟)。 图12提供了细菌聚唾液酸转移酶使胎球蛋白聚唾液酸化的结果。测试了以下酶奈瑟球菌的PST-13 (MalE-全长PST)和PST-30 (MalE-PST- A 32)酶及大肠杆菌的PST-5酶。膜曝光2秒或5秒。泳道编号如下泳道1是无胎球蛋白的对照;泳道2是无CMP唾液酸的对照;泳道3为1. 0 ii g PST ;泳道4为5 ii gPST ;泳道5为10 y g PST ;泳道6为15 y gPST。
图13提供了各种糖蛋白与PST-30 (MalE-PST-A 32)和CMP-唾液酸培育后的SDS-PAGE分析。测试了以下糖蛋白因子IX、红细胞生成素(EPO)、转铁蛋白和胎球蛋白。培育0. 5小时、2小时、5小时和16小时。泳道1是无糖蛋白的底物对照;泳道2无CMP-唾液酸的对照;泳道3为5. 0 ii g PST ;泳道5为15 ii g PST。 图14为各种糖蛋白与PST-30 (MalE-PST- A 32)和CMP-唾液酸培育后被聚唾液酸化的结果。测试了以下糖蛋白因子IX、红细胞生成素(EPO)、转铁蛋白和胎球蛋白。培育0. 5或16小时。泳道1是无糖蛋白的底物对照;泳道2是无CMP-唾液酸的对照;泳道3为5. 0 ii g PST ;泳道4为15 ii g PST。 图15提供了提高胎球蛋白浓度对聚唾液酸链长的结果。此图显示与PST-30 (MalE-PST-A 32)和CMP-唾液酸培育指定的时间后聚唾液酸化胎球蛋白产物的蛋白印迹图(曝光2次),所述时间即0.5小时、1小时和过夜。泳道编号如下泳道l是无胎球蛋白的对照;泳道2是无CMP唾液酸的对照;泳道3为1. Omg/ml胎球蛋白;泳道4为2. 5mg/ml胎球蛋白;泳道5为5. Orng/ml胎球蛋白。
5
发明详述
I.引言 业已构建了能有效产生聚唾液酸化产物,如含有聚唾液酸基团的寡糖、糖蛋白和糖脂的聚唾液酸转移酶(PST)多肽。截短PST的N-末端导致其溶解性和活性提高。因此,本发明的截短PST比未修饰的PST蛋白能更有效地以a -2,8或a _2,9构型偶联唾液酸残基。 II.定义 本文采用了以下简写 Ara二阿拉伯糖基; Fru =果糖基; Fuc =岩藻糖基; Gal =半乳糖基; GalNAc = N-乙酰半乳糖基; Glc =葡萄糖基; GlcNAc = N_乙酰葡糖胺基; Man =甘露糖基;禾口 NeuAc =唾液酸(N_乙酰神经氨酸基)。 糖基化转移酶,如聚唾液酸转移酶的"接受底物"或"接受糖",是可用作特定糖基化转移酶接受者的寡糖。如果使接受底物与相应的糖基化转移酶和糖基供给底物及其它必需的反应混合物组分接触,并培育该反应混合物足够时间后,糖基化转移酶能将糖残基从供者糖底物转移给接受底物。接受底物随具体糖基化转移酶的类型不同而不同。因此,术语"接受底物"在本文中与具体的感兴趣糖基化转移酶一起作特定应用。聚唾液酸转移酶蛋白和其它糖基化转移酶的接受底物在下文中描述。 糖基化转移酶的"供给底物"是活化的核苷酸糖。这种活化糖通常包括糖的尿苷、鸟苷和胸苷单磷酸衍生物(分别是UMP、GMP和CMP)或糖的二磷酸衍生物(分别是UDP、GDP和CDP),其中的核苷单磷酸或二磷酸作用是离去基团。聚唾液酸化酶蛋白的供给底物包括,例如含所需唾液酸的活化的糖核苷酸。例如,以NeuAc为例,活化的糖是CMP-NeuAc。细菌、植物和真菌系统有时可利用其他活化的核苷酸糖。 寡糖被认为具有还原末端和非还原末端,而不论还原末端的糖事实上是否是还原糖。按照已接受的命名法,本文所述的寡糖左边为非还原末端、右边为还原末端。本文描述的所有寡糖表示为非还原糖的名称或简写(如Gal),然后是糖苷键的构型(a或P),环键,键中包含的还原糖在环中的位置,然后是还原糖的名称或简写(如GlcNAc) 。 二个糖基之间的连接键可表示为,例如2,3,2 — 3或(2,3)。各糖指吡喃糖或呋喃糖。
本文中"唾液酸部分"用于指包括唾液酸的分子或衍生自唾液酸的分子。唾液酸部分通常是单糖,如CMP-唾液酸。 本文中"唾液酸部分的聚合物"用于指多个(即一个以上)偶联的唾液酸部分。这种唾液酸聚合物包括全部以相同构型连接的唾液酸的均聚物,如"a _2,8-连接的唾液酸部分的均聚体"或"a -2, 9-连接的唾液酸部分的均聚体"。唾液酸聚合物也包括"a -2, 8/a _2,9-连接的唾液酸部分的共聚体"。唾液酸聚合物的连接键取决于聚唾液酸转移酶蛋白中包含的聚唾液酸转移酶成分。 本文中"聚唾液酸化产物或产物糖"用于指与包含至少三个唾液酸部分的糖脂或糖蛋白(例如生物分子)非偶联或偶联的寡糖、多糖或糖基。在聚唾液酸化产物或产物糖的优选实施方式中,第一个唾液酸部分以a-2,3构型偶联于接受底物或生物分子;第二个唾液酸部分以a-2,8构型偶联于第一个唾液酸部分,并且一个或多个唾液酸部分与第二个唾液酸部分偶联。聚唾液酸化产物或产物糖包含至少3个唾液酸部分。在其它实施方式中,聚唾液酸化产物或产物糖包含至少5、7、12、25、45、80、100、150、200、250或500个唾液酸部分。在其他实施方式中,聚唾液酸化产物或产物糖包含至少3-12、3-25、3-45、3-80、3-100、3-150、3-200、3-250或3-500个唾液酸部分。在还有其它的实施方式中。聚唾液酸化产物或产物糖包含最多达12、25、45、80、100、150、200、250或500个唾液酸部分。
在某些实施方式中,也通过其它糖基化转移酶的作用将其它糖部分,例如果糖、半乳糖、GalNAc、葡萄糖或GlcNAc加入到接受底物以产生聚唾液酸化产物糖。在某些实施方
式中,接受底物包含半乳糖部分,可用双功能唾液酸转移酶蛋白将第一个单一的唾液酸部分以a-2,3构型加入到半乳糖部分;然后聚唾液酸转移酶将第二个单一的唾液酸部分以a _2,8构型加入到第一个唾液酸部分;并将一个或多个唾液酸部分加入到第二个单一的唾液酸部分,产生聚唾液酸化产物糖。在其它实施方式中,接受底物包含a-2,3构型的第一唾液酸部分,用聚唾液酸转移酶蛋白将第二个单一的唾液酸部分以a-2,8构型加入到该第一唾液酸部分;并将一个或多个唾液酸部分加入到第二个单一的唾液酸部分,产生聚唾液酸化产物糖。在还有的实施方式中,接受底物包含a-2,3构型的第一唾液酸部分以及偶联的以a-2,8构型连接于第一唾液酸部分的第二个单一的唾液酸部分;用聚唾液酸转移酶蛋白可将一个或多个唾液酸部分加入到该第二个单一的唾液酸部分上,产生聚唾液酸化产物糖。 术语"唾液酸"或"唾液酸部分"指该9碳羧化糖家族的任何成员。唾液酸家族最常见的成员是N-乙酰神经氨酸(2-酮基-5-乙酰氨基-3, 5- 二脱氧-D-甘油基-D-半乳壬酮卩比卩南糖+酸(2_keto_5_£icet£imido_3, 5_dideoxy_D_glycero_D_g£il£ictonoruilopyranos-l-onic acid),常简写为Neu5Ac、 NeuAc或NANA)。该家族的第二个成员是N-乙醇酰基神经氨酸(Neu5Gc或NeuGc),其中NeuAc的N_乙酰基被羟基化。唾液酸家族第三个成员是2-酮基-脱氧-壬酮糖酸(no皿losonic acid) (KDN) (Nadano等,(1986)J. Biol. Chem. 261 :11550-11557 ;Kanamori等,J. Biol. Chem. 265 :21811-21819(1990)。也包括9-取代的唾液酸,例如9-0-C「Ce酰基-Neu5Ac如9_0_乳酰基_Neu5Ac或9_0_乙酰基-Neu5Ac、9-脱氧-9-氟-Neu5Ac和9-叠氮-9-脱氧-Neu5Ac。唾液酸家族的综述可参见例如Varki, Glycobiology 2 :25-40(1992);《唾液酸化学特征、代谢和功能》,R. Schauer主编(Springer-Verlag,纽约(1992))。 1992年10月1日公开的国际专利申请W092/16640报告了唾液酸化合物的合成和在唾液酸化方法中的用途。 此种用途所需的命名和通用的实验室方法有许多可在Sambrook等的《分子克隆实验室手册》第2版,第l-3巻,冷泉港实验室(Cold Spring HarborLaboratory),冷泉港,纽约,1989中找到。该手册在下文中称为"Sambrook等"。 术语"唾液酸转移酶"或编码"唾液酸转移酶"的核酸指,能催化第一个唾液酸分子转移给接受底物的核酸和多肽多形性变体、等位基因、突变体和种间同源物。已知道细菌和哺乳动物的唾液酸转移酶。可利用各种连接键,如a-2, 3、 a-2, 6和a-2,8将唾液酸残 基偶联于接受分子。唾液酸转移酶具有一种或多种活性。许多唾液酸转移酶是单功能的。 例如,CST-I和CST-III是空肠弯曲杆菌的单功能唾液酸转移酶,能催化a-2,3连接键的 唾液酸转移。参见例如,美国专利号6,689,604和美国专利号6,699, 705。其它示范性的单 功能唾液酸转移酶来自奈瑟球菌,如美国专利号6, 096, 529所公开的唾液酸转移酶。
其它的唾液酸转移酶具有一种以上的酶活性,即可将唾液酸以一种以上的连接键 加到底物中。例如,空肠弯曲杆菌的CST-II能利用以下至少一种键a-2,3或a-2,8将 唾液酸加至接受分子。某些CST-II酶能将多个唾液酸以a-2,8构型加至接受分子。来自 不同空肠弯曲杆菌株的CST-II酶的活性可能不同。例如美国专利6, 699, 705 ;Gilbert等, J Biol Chem. 277 :327-37(2002);和Gilbert等,J BiolChem. 275 :3896-906(2000)报告了 各种CST-II酶、核酸和活性的检测方法。也描述了来自嗜血菌属的多功能唾液酸转移酶。 参见例如,Fox等,J Biol Chem. 281 :40024-32(2006)。 术语"聚唾液酸转移酶"或"PST"及其多肽多形性变体、等位基因、突变体和种间 同源物具有以下性质(l)氨基酸序列与聚唾液酸转移酶核酸编码的氨基酸序列或与聚唾 液酸转移酶蛋白的氨基酸序列(例如聚唾液酸转移酶蛋白序列,参见例如SEQ ID No :1)至 少有60%氨基酸序列相同,优选在至少约25、50、100、200、500、1000或更多个氨基酸的区 域中有65%、70%、75%、80%、85%、90%相同,优选有91 %、92%、93%、94%、95%、96%、 97%、98%或99%或更高的氨基酸序列相同,和(2)能结合抗体,如结合用含聚唾液酸转移 酶蛋白的氨基酸序列和及其保守性修饰变体的免疫原产生的多克隆抗体。PST的活性结构 域与例如SEQ ID No :1的聚唾液酸转移酶的活性结构域至少90%,优选至少91%、92%、 93%、94%、95%、96%、97%、98%、99%的氨基酸相同。聚核苷酸和多肽序列通常来自细 菌,包括但不限于奈瑟球菌属、空肠弯曲杆菌属、嗜血杆菌属、曼海姆菌属(ma皿heimia) 和巴斯德菌属。本发明的核酸和蛋白质包括天然产生的分子和重组分子。聚唾液酸转移酶 蛋白通常具有聚唾液酸转移酶的活性,包括产生a-2,8连接键、a-2,9连接键或a-2, 8/ a-2,9连接键的活性。可按照该领域技术人员已知的方法,采用本文所述的合适供给底物 和接受底物进行聚唾液酸转移酶试验。通常,PST酶能将多个唾液酸残基加到事先已偶联 于接受底物的唾液酸残基上。 本文中"截短的PST多肽"或其语法变体用于指,经过操作已除去了天然产生的野 生型PST多肽至少一个氨基酸残基的PST多肽,只要该截短的PST多肽保留了酶活性。野 生型或天然产生的PST蛋白的例子包括,例如SEQ IDNo :1。优选的PST截短物在SEQ ID No :1的N-末端删除了 19个或32个氨基酸。其它优选的截短PST蛋白例子是SEQ ID No : 3和SEQ ID No:5,或与SEQID No:l或SEQ ID No :5有至少80% 、85% 、90% ,优选有91 % 、 92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同的氨基酸序列。在 其它优选实施方式中,将该截短的PST蛋白与例如Mal-E蛋白或唾液酸转移酶融合。
本发明的"融合PST多肽"或"融合聚唾液酸转移酶多肽"是含有活性PST结构域 的多肽。该融合多肽能催化聚唾液酸转移反应。该融合多肽的催化结构域通常与获得该催 化结构域的PST和融合蛋白的那些结构域至少基本相同。在某些实施方式中,可以构建由 聚唾液酸转移酶与唾液酸转移酶融合产生的重组蛋白,得到"自身-引发的PST"。在某些
实施方式中,该自身-引发的聚唾液酸转移酶蛋白通过其唾液酸转移酶活性,能将第一个
8单一的唾液酸部分偶联于接受底物中的非唾液酸糖残基,通常是a-2,3构型。在其它实 施方式中,该自身-引发的聚唾液酸转移酶蛋白也能通过其多功能唾液酸转移酶的活性, 将第二个单一的唾液酸部分偶联于先前已加入的第一个单一的唾液酸部分,通常为a _2,8 构型。在另一实施方式中,该自身-引发的聚唾液酸转移酶蛋白能将唾液酸残基加入到先 前已用a-2,3构型唾液酸化的接受底物上。 一旦将合适数量的唾液酸加到接受底物上以 "引发"聚唾液酸转移酶活性,该自身-引发的聚唾液酸转移酶蛋白可通过聚唾液酸转移酶 的活性,将一个或多个唾液酸部分偶联于唾液酸部分。在某些实施方式中,这种聚唾液酸转 移酶的活性可产生唾液酸部分的聚合物。 可构建本发明的重组蛋白并使其表达为分子一端含有有利于蛋白质的纯化或 鉴定的"纯化标签"的融合蛋白。也可利用该标签在糖基化反应期间固定感兴趣的蛋白 质。合适的标签包括"表位标签",它是一种能被抗体特异性识别的蛋白质序列。通常 将表位标签掺入到融合蛋白中以便利用易于得到的抗体来明确检测或分离该融合蛋白。 "FLAC标签"是常用的能被单克隆抗-FLAG抗体特异性识别的表位标签,此标签的序列是 AspTyrLysAspAspAspAspLys或其基本相同的变体。该领域技术人员已知的其它合适的标 签包括例如,能结合金属离子如镍或钴离子的亲和标签,如六组氨酸肽,或myc标签。含纯 化标签的蛋白质可用能结合该纯化标签的结合伙伴,如结合该纯化标签的抗体、镍或钴离 子或树脂、以及直链淀粉、麦芽糖或环糊精进行纯化。纯化标签也可包含麦芽糖结合结构 域和淀粉结合结构域。该领域技术人员知道含麦芽糖结合结构域的蛋白的纯化方法。本 文引用作为参考的W099/15636中描述了淀粉结合结构域。利用P -环糊精(BCD)-衍生 树脂亲和纯化含淀粉结合结构域的融合蛋白的描述可参见2005年2月17日公开的WO 2005/014779,其内容本文引用作为参考。 本文中的"附属酶"指,参与催化反应,例如聚唾液酸转移酶反应形成核苷酸糖的 酶,例如唾液酸合酶。"催化结构域"或"活性结构域"指,酶中通常为该酶所执行的足以催化酶反应的那 部分结构。例如,PST多肽的催化结构域包括PST中足以催化唾液酸转移至底物的部分。催 化结构域可能包括整个酶,其子序列,或可包含天然不连接于该酶或其子序列的额外的氨 基酸序列。"商品化规模"指单次反应能产生克级聚唾液酸化产物的规模。在优选实施方式 中,商品化规模指产生大于约50克、75克、80克、90克、100克、125克、150克、175克或200
克的聚唾液酸化产物。"保守性修饰变体"可用于氨基酸和核酸序列。相对于特定的核酸序列,保守性修 饰变体指编码相同或基本相同氨基酸序列的那些核酸,或者如果核酸不编码氨基酸序列, 指基本相同的序列。因为遗传密码子的简并性,许多功能相同的核酸可编码任意给定的蛋 白质。例如,密码子GCA、GCC、GCG和GCU均编码氨基酸丙氨酸。因此,在密码子指定丙氨酸 的每个位置,可将该密码子变为上述任何相应的密码子而不会改变所编码的多肽。这种核 酸变体是"沉默变体",是一种保守性修饰变体。本文描述的各种编码某多肽的核酸序列也 可能有该核酸的各种可能的沉默变体。技术人员知道可以修饰核酸中的各个密码子(例外 是,AUG通常是甲硫氨酸的唯一密码子,TGG通常是色氨酸的唯一密码子)来产生功能相同 的分子。因此,与表达产物有关但与真实探针序列无关的各所述序列中内含了编码某多肽
9的核酸的各种沉默变体。 关于氨基酸序列,技术人员知道可对核酸、肽、多肽或蛋白质序列进行各种取代、 删除或添加,改变、添加或删除该编码序列中的单个氨基酸或小百分比的氨基酸,如果这种 改变导致氨基酸被化学性质类似的氨基酸取代,则获得"保守性修饰变体"。提供功能相似 的氨基酸的保守性取代表是本领域众所周知的。这种保守性修饰变体是对本发明的多形性 变体、种间同源物和等位基因变体的补充且并不排斥这些形式。 技术人员知道,蛋白质中的许多氨基酸可被另一种氨基酸取代而不会影响该蛋 白质的功能,即保守性取代可以是某蛋白质,如所述的聚唾液酸转移酶蛋白和其衍生物保 守性修饰变体的基础。保守性氨基酸取代的不完全名单如下。以下8组每组包含彼此可 保守性取代的氨基酸l)丙氨酸(A),甘氨酸(G) ;2)天冬氨酸(D),谷氨酸(E) ;3)天冬
酰胺(N),谷氨酰胺(Q) ;4)精氨酸(R),赖氨酸(K) ;5)异亮氨酸(I),亮氨酸(L),甲硫氨 酸(M),缬氨酸(V),丙氨酸(A) ;6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W) ;7)丝氨酸(S), 苏氨酸(T),半胱氨酸(C);和8)半胱氨酸(C),甲硫氨酸(M)(参见例如,Creighton., Proteins(1984))。 本发明的细胞和方法可用于产生聚唾液酸化产物,通常通过将供给底物的唾液酸 部分转移到接受分子。本发明的细胞和方法也可用于产生包含额外糖残基的聚唾液酸化产 物糖,通常通过将供给底物的额外单糖或硫酸酯基团转移到接受分子。通常这种添加发生 在糖脂或糖蛋白(如生物分子)的寡糖、多糖(如肝素、角叉菜胶等等)或糖部分的非还原 端。这里定义的生物分子包括但不限于有生物学意义的分子,如糖、寡糖、肽(如糖肽)、蛋 白质(如糖蛋白)和脂质(如糖脂、磷脂、鞘脂和神经节苷脂)。 术语"核酸"指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,除非另有 限制,其包括能以类似于天然核苷酸方式与核酸杂交的已知的天然核苷酸的类似物。除非 另有说明,具体的核酸序列包括其互补序列。术语"核酸"、"核酸序列"和"聚核苷酸"在本 文中可互换使用。 术语"操作性相连"指核酸表达调控序列(如启动子、信号序列或转录因子结合位 点阵列)与第二核酸序列之间的功能性连接,其中表达调控序列能影响与第二序列相对应 的核酸的转录和/或翻译。 术语"重组"当用于指细胞时,表示该细胞使异源核酸复制,或使异源核酸编码的 肽或蛋白质表达。重组细胞可含有该细胞的天然(非重组)形式中不存在的基因。重组细 胞也可包含该细胞的天然形式中存在的基因,其中所述基因经人工方法修饰后重新引入细 胞。该术语也包括含有经过修饰但没有从该细胞中除去的细胞内源性核酸的细胞;这种修 饰包括基因置换、定点突变和相关技术获得的那些修饰。"重组核酸"指人工构建的(例如连接二个天然或合成核酸片段形成的)核酸。此 术语也用于指通过核酸置换或转录人工构建产生的核酸。重组核酸(即非细胞天然形式 的核酸或其天然形式经修饰产生的核酸)转录,然后翻译产生的转录物可表达为"重组多 肽"。 本文所用的"异源聚核苷酸"或"异源核酸"是对于特定宿主细胞为外物来源的, 或同一来源但其原来形式经过修饰的核酸。因此,原核宿主细胞中的异源聚唾液酸转移酶 基因包括特定宿主细胞的内源性但经过修饰的聚唾液酸转移酶基因。可通过例如,用限制性酶处理DNA产生能操作性连接启动子的DNA片段来修饰异源序列。也可用例如定点诱变 技术来修饰异源序列。"子序列"分别指构成较长核酸或氨基酸序列(如多肽)的一部分的核酸或氨基酸 序列。"重组表达盒"或简写成"表达盒",是通过重组或合成产生的含有能影响结构基因 在与该序列相容的宿主中的表达的核酸元件的核酸构建物。表达盒至少包含启动子和任选 的转录终止信号。重组表达盒通常包含待转录的核酸(如编码所需多肽的核酸)和启动子。 也可采用本文所述的能影响表达的其它必需或辅助因子。例如,表达盒可包含编码信号序 列的核苷酸序列,该信号序列能介导宿主细胞分泌所表达的蛋白。表达盒也可包含转录终 止信号、增强子和能影响基因表达的其它核酸序列。 术语"分离的"指基本或大致没有干扰酶活性成分的材料。对于本发明的细胞、 糖、核酸和多肽,术语"分离的"指基本或大致没有在天然状况下正常与其相伴成分的材料。 用测定纯度的银染色凝胶条带强度或其它方法检测,本发明的分离的糖、蛋白质或核酸一 般至少约50%、55%、60%、65%、70%、75%、80%或85%纯,常常至少约90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%纯。可用本领域熟知的许多方法,例如蛋白质或核 酸样品的聚丙烯凝胶电泳,然后染色观察来显示纯度或均一度。对于某些目的,需采用高分 辨方法,HPLC或类似的纯度测定方法。对于寡糖或其它半乳糖基化产物,可用例如薄层色 谱、HPLC或质谱测定纯度。 在二种或多种核酸或多肽序列的内容中,术语"相同"或"百分相同性"指用以下 序列比对算法或目视观察测量作最大一致性比较和排列对比时,这二种或多种序列或子序 列相同,或特定百分比的氨基酸残基或核苷酸相同。 在二种或多种核酸或多肽的内容中,短语"基本相同"指用以下序列比对算法或目 视观察测量作最大一致性比较和排列对比时,这二种或多种序列或子序列的至少60%,优 选80%或85%,更优选至少90% 、91 % 、92% 、93% 、94% 、95% 、96% 、97% 、98%或99%的 核苷酸或氨基酸残基相同。优选在至少长约50个残基的区域内,更优选在至少约100个残 基的区域内基本相同,最优选在至少约150个残基的区域内序列基本相同。在一最优选的 实施方式中,编码区的全长基本上相同。 为进行序列比较,一般取一条序列作参比序列,与测试序列进行比较。当采用序列 比较算法时,将测试和参比序列输入计算机,如果需要,指定子序列坐标,并指定序列算法 程序参数。然后序列比较算法根据指定的程序参数,算出测试序列相对于参比序列的序列 相同性百分比。 通过以下方法使用于比较的序列实现最佳排列,例如采用Smith和Waterman, Adv. Appl. Math. 2 :482(1981)的局部同源性算法,Needlman和Wunsch, J. Mo. 1 Biol. 48 : 443(1970)的同源性排列对比算法,Pearson和Lipman, Proc. Nat' 1. Acad. Sci. USA 85 : 2444(1988)的相似性检索方法,用计算机执行这些算法(威斯康星遗传学(Wisconsin Genetics)软件包,遗传学计算机基团(GeneticsComputer Group) , 575Science Dr.Madison, WI中的GAP、 BESTFIT、 FASTA禾P TFASTA),或通过目视观察(通常参见"分子 生物学现行方案(Current Protocolsin Molecular Biology) ", F. M. Ausubel等编写, Current Protocols,格林出版联合有限公司(Greene Publishing Associates)与约翰威
11尔利父子公司(John Wiley &Sons)的合资企业(1995增补本)(Ausubel))。
适合测定序列相同性和序列相似性百分比的算法的例子是BLAST和BLAST 2. 0算 法,分别在Altschuel等(1990), J. Mol. Biol. 215 :403-410和Altschuel等(1977) Nucleic Acids Res. 25 :3389-3402中描述。进行BLAST分析的软件公众可从国家生物技术信息中 心(皿ncbi. nlm. nih. gov/)获得。此算法包括先鉴定询问序列中长W的短字与数据库 中长度相同的字排列对比时,是否匹配或能满足某些阳性域值评分T,以鉴定高评分序列对 (HSP)。 T指相邻字评分域值(Altschuel等,同上)。这些最初的相邻字若命中则起着种子 作用启动搜索寻找含该字的更长HPS。然后命中的字沿各序列双向延伸尽可能远以提高累 计比对评分。核苷酸序列用参数M(匹配残基对的奖分;总是X))和N(错配残基的罚分, 总是< 0)计算累计评分。氨基酸序列用评分矩阵计算累计评分。当累计对比评分从其达到
的最大值跌落X量;由于一个或多个负评分残基比对的累积,累计评分下降到零或以下;或
延伸到达任一序列的末端时,命中字各向延伸受阻。BLAST算法的参数W、T和X决定了比对 的灵敏度和速度。BLASTN程序(对于核苷酸序列)采用以下默认值字长(W) = 11,期望 值(e) = 10,m = 5,n = -4,以及两条链比较。对于氨基酸序列,BLASTP程序采用以下默认 值字长(W) = 3,期望值(E) = 10以及BL0SUM62评分矩阵(参见Henikof f和Henikof f. Proc. Nat. 1 Acad. Sci. USA. 89 :10915, 1989)。 除了计算序列相同性百分比之外,BLAST算法也能对二条序列的相似性作统计学 分析(参见例如,Karlin和Aitschuel, Proc. Natl. Acad. Sci. USA90 :5873—5877, 1993)。 BLAST算法提供的一种相似性测量法是最小总和概率(sum probability) (P(N)),表明二条 核苷酸或氨基酸序列偶然匹配的概率。例如,如果测试核酸与参比核酸比较时的最小总和 概率低于约0. l,更优选低于约0. Ol,最优选低于约0. OOl,就认为该核酸与参比核酸相似。
二条核酸序列或二条多肽基本上相同的另一种表现是第一条核酸编码的多肽能 与第二条核酸编码的多肽发生免疫交叉反应,见下文所述。例如,当二条多肽只是含有保守 性取代而不同时,通常第一多肽与第二多肽基本上相同。二条核酸基本上相同的另一种表 现是在严谨条件下两个分子能互相杂交,见下文所述。 短语"特异性杂交"指,当序列以复杂混合物(如全细胞)DNA或RNA存在时,分子 在严谨条件下只能与特定的核苷酸序列结合、形成双链体或杂交。 术语"严谨条件"指探针只与其靶序列杂交而不与其它序列杂交的条件。严谨条 件有序列依赖性并且随环境不同而不同。较长序列在较高温度下特异性杂交。在指定的离 子强度和pH下,对于特定序列而言,严谨条件通常选择温度低于其热解链点(Tm)大约5t:。 Tm是(在指定的离子强度,pH和核酸浓度条件下)平衡时与靶序列互补的探针有50%与 靶序列杂交的温度。(由于靶序列通常过量存在,在Tm时平衡占据了 50%的探针)。通常 的严谨条件是盐浓度低于约1. 0M Na+离子,通常约为0. 01-1. 0M Na+离子浓度(或其它 盐),pH7. 0-8. 3,对于短探针(例如10-50个核苷酸)而言,温度至少约为3(TC,对于长探 针(如多于50个核苷酸)则至少约为6(TC。添加去稳定剂如甲酰胺也能达到严谨条件。 高严谨性PCR扩增的温度通常约为62°C ,虽然高严谨性的退火温度约为50°C _65°C ,这取决 于引物长度和特异性。高严谨和低严谨扩增的典型循环条件包括90-95t:变性30-120秒, 退火持续30-120秒和约72t:延伸1-2分钟。高严谨和低严谨扩增反应的方法和指南可得 自,例如I皿is等,(1990)PCR方案方法与应用指南(PCR Protocols :A Guideto Methodsand Applicationa)纽约的学术出版社(Academic Press, N. Y)。 短语"与之特异性结合"或"与之起特异性免疫反应"当用于抗体时,指在存在异 源蛋白、糖和其它生物物质条件下,测定所存在的蛋白质或其它抗原的结合反应。因此,在 设定的免疫试验条件下,特异性抗体优先与样品中存在的特定抗原结合而不与显著高含量 的其它分子结合。在这种条件下与抗原的特异性结合要求所选择的抗体对特定抗原有特异 性。可采用各种免疫试验方法来选择能与特定抗原起特异性免疫反应的抗体。例如,常规 用固相ELISA免疫试验来选择能与抗原起特异性免疫反应的单克隆抗体。参见Harlow和 Lane (1988)《抗体实验室手册》冷泉港出版社(Cold Spring Harbor Publication),纽约, 可用其中描述的免疫试验方法和条件来检测特异性反应。"抗体"指含有免疫球蛋白基因或其片段的框架区、能特异性结合和识别抗原的多 肽。已知的免疫球蛋白基因包括k、A、a、Y、S、e禾Pii恒定区编码基因,及无数的免 疫球蛋白可变区编码基因。在一优选的实施方式中,制备了能特异性结合自身-引发的聚 唾液酸转移酶蛋白的抗体。轻链有k或A 二类,重链有Y 、 、 a 、 S或e几类,它们进 而分别确定了免疫球蛋白类型,IgG、 IgM、 IgA、 IgD和IgE。抗体中的抗原结合区通常是结 合特异性和亲和力的最重要区域。 —示范性的免疫球蛋白(抗体)结构单元为四聚体。每个四聚体由二对相同的多 肽链组成,每对链包含一条"轻链"(约25kD)和一条"重链"(约50-70kD)。各链的N_末端 确定了主要负责结合识别的长约100-110个或更多个氨基酸的可变区。术语可变轻链(、) 和可变重链(VH)分别指这些轻链和重链。 存在的抗体,例如可以是完整的免疫球蛋白,或是用各种肽酶消化产生的许多特 性明确的抗体片段。因此,例如胃蛋白酶可在绞链区的二硫键下方消化抗体产生F(ab)、, 一种其本身为通过二硫键与VH_CH1连接的轻链的Fab的二聚体。可在温和条件下还原 F(ab) ' 2以断裂绞链区的二硫键,从而使F(ab) ' 2 二聚体转变为Fab'单体。Fab'单体为 Fab加绞链区部分(参见"基础免疫学(Fundamental Immunology) ", Paul主编,第3版, 1993)。虽然消化完整的抗体可产生各种抗体片段,但技术人员知道,也可体外化学合成或 用重组DNA方法合成这种片段。因此,本文所用的术语抗体也包括修饰全抗体产生的,或用 重组GNA方法体外合成的抗体片段(如单链Fv)或用噬菌体展示库鉴定的那些片段(参见 例如McCafferty等,Nature 348 :552-554, 1990)。 可用该领域已知的许多技术制备抗体,如重组的单克隆或多克隆抗体(参见 例如Kohler禾口 Milstein, Nature 256 :495-497(1975) ;Kozbor等,I匪nologyToday 4:72(1983) ;Cole等,《单克隆抗体与癌症治疗》(Monoclonal Antibodies andCancer Ther即y),第77-96页,ARL有限公司(Alan R. Liss. Inc.) (1985) ;Coligan,《免疫学现行 方案》(Current Protocol in Immunology) (1991) ;Harlow禾口 Lane, Antibodies,《实验室 手册》(A Laboratory Mannal) (1998);禾口 Goding,《单克隆抗体原理与实践》(Monoclonal Antibodies Principles and Practice)(第2版,1986))。可克隆细胞编码感兴趣抗 体的重链和轻链的基因,例如,克隆杂交瘤编码单克隆抗体的基因,用于制备重组的单克 隆抗体。也可由杂交瘤或浆细胞制备编码单克隆抗体的重链和轻链的基因文库。重链 和轻链产物的随机组合产生具有各种抗原特异性的抗体大库(参见例如,Kuby,《免疫 学》(Immunology)(第3版,1997))。可采取制备单链抗体或重组抗体的技术(美国专利4, 946, 778,美国专利4, 816, 567)来制备本发明多肽的抗体。另外,可采用转基因小鼠或 其它生物(如其它哺乳动物)来表达人源化或人抗体(参见例如美国专利5,545,807; 5, 545, 806 ;5, 569, 825 ;5, 625, 126 ;5, 633, 425 ;5, 661, 016 ;Marks等,Bio/TechnologylO : 779-783(1992) ;Lonberg等,Nature 368 :856-859(1994) ;Morrison, Nature368 : 812-12(1994)Fishwild等,Nature Biotechnology 14:845-51(1996) ;Neuberger, Nature Biotechnology 14:826(1996)禾口 Lonberg & Huszar, Intern. Rev. Immunol.13 : 65-93 (1995))。或者,可用噬菌体展示技术鉴定能特异性结合所选择抗原的抗体和异质Fab 片段(参见例如Mccafferty等,Nature 348 :552-554(1990) ;Marks等,Biotechnology 10 :779-783, 1992)。制备的抗体也可以是双特异性,即能识别二种不同抗原(参见例如W0 93/08829, Traunecker等,EMB0 J. 10 :3655-3659, 1991和Suresh等,《酶学方法》(Methods in Enzymology)121 :210, 1986)。所述抗体也可以是异质偶联物,如共价连接的二种抗体或 免疫毒素(参见例如美国专利4, 676, 980 ;W0 91/00360 ;W0 92/200373和EP 03089)。
在一实施方式中,将抗体偶联于"效应"分子。效应分子可以是用于诊断试验的包 含标记,如放射性标记或荧光标记的任何分子。 短语与抗体"特异性(或选择性)结合"或"与之起特异性(或选择性)免疫反 应"当用于某蛋白质或肽时,指常常在蛋白和其它生物物质的异质群中检测该蛋白质存在 的结合反应。因此,在设定的免疫试验条件下,与特定蛋白结合的特异性抗体至少是背景的 二倍,更常高于背景10-100倍。在这种条件下与抗体特异性结合要求所选择的抗体对特定 蛋白具有特异性。例如,可在抗IgE蛋白的多克隆抗体,及其多态性变体、等位基因、直向同 源和保守性变体,或剪接变体,或其一部分中选择,以获得仅仅能与IgE起特异性免疫反应 而不与其它蛋白反应的那些多克隆抗体。可通过除去与其它分子起交叉反应的抗体实现这 种选择。可用各种免疫试验方法来选择只与特定蛋白起特异性免疫反应的抗体。例如,常 规采用固相ELISA免疫试验来选择与蛋白起特异性免疫反应的抗体(参见例如,Harlo和 Lane,《抗体实验室手册》(1988)中用于检测特异性免疫反应的免疫试验方法和条件的描 述)。 抗体识别和结合的分子称"抗原",如肽、糖、有机分子或更复杂的分子,如糖脂和 糖蛋白。抗原的抗体结合靶标部分是抗原决定簇,与一个抗原决定簇相对应的小功能基团 称为半抗原。"标记"是可用分光、光化学、生物化学、免疫化学或化学方法检测的组分。例如,可 用的标记包括32 、1251、荧光染料、密电子试剂、酶(如ELISA中常用的酶)、生物素、地高辛, 或可得到其抗血清或单克隆抗体的半抗原及蛋白质(例如制备可检测的SEQ ID No:2多肽 时,在该肽中掺入放射标记,用于检测与该肽特异性反应的抗体)。 术语"免疫试验"是利用抗体与抗原特异性结合的试验。免疫试验的特点是利用 特定抗体的结合特异性来分离、靶向和/或定量测定抗原。 术语"载体分子"指含有T细胞所识别的抗原决定簇的免疫原性分子。载体分子 可以是蛋白质或脂类。将载体蛋白与某多肽偶联可赋予该多肽免疫原性。载体蛋白包括匙 槭血兰蛋白、鲎血兰蛋白和牛血清白蛋白。 术语"佐剂"指能非特异性增强对抗原的免疫应答反应的物质。佐剂包括完全和 不完全弗氏佐剂、Titermax金佐剂、明矾(alum)和细菌LPS。
14
术语"接触"在本文中可与以下词与之联合、加入、与之混合、通过、与之共培育、
流过等互换使用。 III.唾液酸转移酶 聚唾液酸转移酶是能将唾液酸残基加到接受底物的酶。通常聚唾液酸转移酶将唾 液酸残基加到"引发底物",即含有已连接于底物的唾液酸残基的那种底物。利用加入的唾 液酸转移酶加入合适的唾液酸残基而"引发"该接受底物的PST活性。
A.PST多月太 先前已鉴定过的PST蛋白在本领域技术人员看来是可鉴别的。例如,PST可 与pfam07388, a-2,8-聚ST, a _2,8_聚唾液酸转移酶的共有序列对齐。参见例如, Marchler-Bauer等,Nucleic Acids Res. 33 :D192-6 (2005)。 显示与pfam07388对齐 的其它PST蛋白也可用于本发明。a-2,8-聚ST, a-2, 8_聚唾液酸转移酶蛋白家族是 经过序列比较鉴定的一组蛋白质。参见例如,Steenbergen和Vimr, JBiol Chem. 278 : 15349-15359(2003)。在其它实施方式中,截短的PST蛋白包含的PST蛋白序列是CAZy家 族GT38的成员。参见例如,Coutinho,P.M和Henrissat,B. (1999),"糖-活化的酶",服务 器URL :afmb. cnrs. fr/CAZY八PST蛋白包括合成a -2, 8-连接的唾液酸残基均聚物、a -2, 9-连接的唾液酸残基均聚物、或a -2,8/2,9_连接的唾液酸残基共聚物的蛋白质。
可从奈瑟脑膜炎球菌和大肠杆菌分离得到示范性的PST蛋白。这二种PST蛋白都 来自只含细菌成分的聚唾液酸转移酶家族GT-38。参见例如,Coutinho,P. M等,Journal of molecular Biology, 328 :307-317(2003)。虽然示范性的奈瑟脑膜炎球菌和大肠杆菌蛋白 的体内结构相同,这二种蛋白的相同性为33 % 。
B.唾液酸转移酶 某些唾液酸转移酶至少具有a-2,3或a_2,8唾液酸转移酶活性之一。例子可 参见例如,为所有目的本文引用作为参考的美国专利6, 503, 744和美国专利6, 699, 705。 这类唾液酸转移酶蛋白是CAZy家族42的成员。参见例如,Coutinho, P.M & Henrissat, B. (1990),"糖-活化的酶",服务器URL :afmb. cnrs. fr/CAZY八这些细菌唾液酸转移酶多 肽包含二个基序唾液酸转移酶基序A, DVFRCNQFYFED/E及该序列的保守性修饰变体,和唾 液酸转移酶基序B, RITSGVYMC及该序列的保守性修饰变体。在某些实施方式中,唾液酸转 移酶多肽包含唾液酸转移酶基序A, DVFRCNQFYFED或DVFRCNQFYFEE和唾液酸转移酶基序B, RITSGV预C。参见例如,为所有目的本文引用作为参考的PCT/CA2005/001432。通过分析多 种细菌唾液酸转移酶鉴定到这种保守的唾液酸转移酶基序。对比了 18种唾液酸转移酶的 氨基酸序列,通过目视观察鉴定到保守的唾液酸转移酶序列基序A和B。
—种示范性的唾液酸转移酶是空肠弯曲杆菌的Cst-II蛋白。可从以下空肠弯 曲杆菌菌株分离得到此唾液酸转移酶家族成员的蛋白或核酸0H4384, GenBank登录号 AR271700 ;0H4382 ;0 :10, GenBank登录号AR271701 ;0 :23, GenBank登录号AF401529 ;0 : 41, GenBank登录号AR271702和HB93-13, GenBank登录号AY297047。也参见例如,为所有 目的本文引用作为参考的美国专利6, 503, 744和美国专利6699705。 在某些实施方式中,唾液酸转移酶多肽也包含看来对酶活性至关重要的其它氨基 酸残基。例如,已解析空肠弯曲杆菌菌株0H4383的Cst-II结构。(参见例如,Chiu等, Nat. Struc.Mol. Biol. 11 :163-170,2004)。 Cst—II酶的突变试验证明,例如唾液酸转移酶
15基序B的精氨酸残基是其活性所必需的。已列出了 0H4383蛋白的残基;其它Cst-II蛋 白的相应残基可用序列比对进行确定。参见例如,为所有目的本文引用作为参考的PCT/ CA2005/001432。唾液酸转移酶基序B的精氨酸残基指Cst-II中的R129,与图1唾液 酸转移酶共有序列中的R165相关。看来对催化活性至关重要的其它氨基酸残基包括 Cst-II Y156、 Cst-II Y162和Cst-II H188。能影响蛋白活性的其它氨基酸参见PCT/ CA2005/001432。 IV.分离编码PST多肽的核酸 编码PST多肽的核酸包括编码上述全长天然PST多肽和具有酶活性的那些序列截 短多肽的核酸。本发明的PST多肽能催化唾液酸部分从供给底物转移给接受底物,并且本 文描述了检测其活性的试验。 根据本文公开的信息,编码其他PST多肽的核酸和获得这种核酸的方法是本领域 技术人员已知的。可将合适的核酸(如cDNA、基因组或子序列(探针))克隆,或通过体外 方法扩增,例如聚合酶链反应(PCR)、连接酶链反应(LCR)、基于转录的扩增系统(TAS)或 自维持的序列复制系统(SSR)。各种克隆和体外扩增方法是本领域技术人员熟知的。足以 指导技术人员通过多次克隆实践掌握这些技术的文献例子可参见Berger和Kimmel的"分 子克隆技术指南",《酶学方法》(Methods in Enzymology) 152.加利福尼亚州圣地亚哥的 学术出版有限公司(Academic Press. Inc. San Diego, CA) (Berger) ;Sambrook等(1989), "分子克隆实验室手册"第2版,1-3巻,冷泉港实验室,冷泉港出版社,纽约;(Sambrook 等);F.M.Ausubel等编写的《分子生物学现行方案》(Current Protocols inMolecular Biology) , Current Protocols,格林出片反联合有限公司(Greene PublishingAssociates) 与约翰威尔利父子公司(John Wiley & Sons)的合资企业(1995增补本)(Ausubel); Cashion等,美国专利5, 017, 478和Carr,欧洲专利0, 246, 864。
可采用标准分子生物学方法,如PCR来产生任何已知的PST截短序列。
制备编码PST多肽或其子序列或截短序列的DNA可通过上述任何适当的方法进 行,包括例如,用限制酶克隆和限制消化合适的序列。在一实施方式中,用常规克隆方法 分离得到编码PST多肽的核酸。例如,编码聚唾液酸转移酶多肽的核苷酸序列是编码SEQ ID No:l所示PST的核酸序列。可利用该核酸序列提供能与基因组DNA样品中编码PST多 肽基因;或能与总RNA样品中编码PST多肽的mRNA特异性杂交的探针(如Southern或 Northern印迹法)。 一旦鉴定到编码PST多肽的靶核酸,可按照本领域技术人员已知的标 准方法分到(参见例如,Sambrook等(1989),"分子克隆;实验室手册"第2版,第1_3巻, 冷泉港实验室;Berger和Kimmel (1987),《酶学方法》(Methods in Enzymology),第152巻, "分子克隆技术指南",圣地亚哥的学术出版公司或Ausubel等(1987)的"分子生物学现行 方案(Current Protocols in Molecular Biology)",格林_威尔利联合出版公司(Greene Publishing and Wiley-Interscience),纽约)。另外。可用限制酶切割该分离的核酸,产 生编码全长PST多肽或其子序列或截短变体的核酸,如含有至少编码PST多肽催化结构域 子序列的截短序列。然后连接编码PST多肽或其子序列的这些限制性酶切片段。
可通过检测表达产物以特征分析编码PST多肽可其子序列的核酸。可采用基于 表达蛋白质的物理、化学或免疫学性质的检测试验。例如,可通过检测所述核酸编码的蛋 白催化唾液酸从供给底物转移给适当的接受底物的能力来鉴定克隆的PST多肽。 一种方法是用毛细管电泳来检测反应产物。这种高灵敏度试验涉及采用荧光标记的糖或二糖氨基 苯基衍生物,参见Wakarchuk等(1996) J. Biol. Chem. 271 (45) :28271-276中所述。为检测 聚唾液酸转移酶活性,可用Lac-FCHASE、 Gal-P -1, 3_GalNAc-a -FCHASE (T-Ag-FCHASE)或 NeuAc- a -2, 3-Gal- P -1, 3-GalNAc- a -FCHASE作为底物。参见例如本文引用作为参考的美 国专利6, 503, 744。在一些实施方式中,采用其他唾液酸转移酶引发反应。检测寡糖反应产 物的其它方法包括薄层色谱和GC/MS,参见本文引用作为参考的美国专利6. 503, 774。
另外,可化学合成编码PST多肽或其子序列的核酸。合适的方法包括Narang 等(1979)Meth. Enzymol. 68 :90-99的磷酸三酯法;Brown等(1979)Meth. Enzymol. 68 : 109-151的磷酸二酯法;Beaucage等(1981)和Tetra Lett. ,22 :1859-1862的二乙基亚磷 酰胺(diethylphosphoramidite)法和美国专利4, 458, 066的固相载体法。化学合成可产 生单链寡核苷酸。这可通过与互补序列杂交,或用一条链作模板用DNA聚合酶聚合,将单链 转变成双链DNA。技术人员知道,虽然化学合成的DNA常常限于约IOO个碱基的序列,但通 过连接较短序列可获得更长的序列。 可用DNA扩增方法,如聚合酶链反应(PCR)克隆编码PST多肽或其子序列的核酸。 因此,例如,用含一个限制酶位点(如NdeI)的正义引物和含另一限制酶位点(如HindIII) 的反义引物,对核酸序列或子序列作PCR扩增。这将产生编码所需PST多肽或子序列并含有 末端限制酶位点的核酸。然后不难将此核酸连接于含适当的相应限制酶位点的表达载体。 本领域技术人员能利用GenBank或其它来源提供的序列信息来确定合适的PCR引物。也可 通过定点诱变将合适的限制酶位点加入到编码PST多肽或其子序列蛋白的核酸中。用合适 的限制性内切酶切割含PST多肽编码的核苷酸序列或子序列,然后连接入合适的载体按照 标准方法扩增和/或表达。足以指导技术人员利用体外扩增方法的技术文献例子可参见 Berger,Sambrook和Ausubel及Mullis等(1987)美国专利4, 683, 202 ;PCR方案一种方法 与应用指南(PCR Protocol A Guide to Methodsand Applicayions) (Innis等编),圣地亚 哥的学术出版有限公司,CA(1990) (Innis) ;Arnheim & Levinson (1990年10月1日)C&EN 36-47 ;The Journal of NIHResearch (1991) 3 :81-94 ; (Kwoh等(1989) Proc Natl Acad Sci USA 86 :1173 ;Guatelli等(1990)Proc Natl Acad Sci USA 87 :1874 ;Lomell等(1989) J. Clin. Chem. ,35 :1826 ;Landegren等,(1988)Science 241 :1077-1080 ;Van Brunt(1990) Biotechnology 8 :291-294 ;Wu和Wallace (1989)Gene 4 :560 ;和Barringer等(1990)Gene 89 :117。 可通过扩增合适的DNA序列,如细菌染色体的DNA序列分离得到PST蛋白。可用 于扩增编码PST蛋白核酸的PCR引物的例子包括以下的引物对,例如用于扩增大肠杆菌PST 的引物 5' -AAGGTATAAGACATATGATATTTGATGCTAGTTTAAAGAAA禾卩
3' -CCTAGGTCGACTTACTCCCCCAAGAAAATCCTTTTATCATGC 。 将特定核酸表达的重组PST多肽的其它物理性质与已知PST多肽的性质作比较, 提供了另一种方法鉴定该PST多肽有无明确的接受底物特异性和/或催化活性的合适序列 或结构域。或者,可突变某假定的PST多肽,并检测未突变的天然PST多肽或对照多肽正常 产生的糖结构中的变异来确定所建立的特定序列或结构域作为PST的功能或功能。本领 域技术人员知道,采用操纵编码双功能唾液酸转移酶多肽或PST多肽的分子生物学技术如PCR,有利于对本发明PST多肽的突变或修饰。
V.在宿主细胞中表达PST多肽 可在各种宿主细胞,包括大肠杆菌、其它细菌宿主和酵母菌中表达本发明的PST 蛋白。所述宿主细胞优选微生物,例如酵母菌细胞、细菌细胞或丝状真菌细胞。合适的宿 主细胞包括,例如,固氮菌属(如维涅兰德固氮菌)、假单胞菌属、根瘤菌属、欧文菌属、大肠 杆菌属(如大肠杆菌)、芽胞杆菌属、假单胞菌属、变形杆菌属、沙门菌属、沙雷菌属、志贺菌 属、根瘤菌、透明颤菌属(vitreoscilla)、副球菌属和克雷伯菌属等等。所述细胞可以是 这几种菌属的任何一种,包括酿酒酵母菌属(如啤酒酵母)、假丝酵母菌属(如产朊假丝 酵母菌、近平滑假丝酵母菌、克鲁斯假丝酵母菌、丁字状(versatilis)假丝酵母菌、解脂假 丝酵母菌、涎沫假丝酵母菌、季也蒙假丝酵母菌、白色假丝酵母菌、腐质假丝酵母菌);毕赤 酵母菌属(如粉状毕赤酵母菌和奥默毕赤酵母菌);球拟酵母菌属(如白色球拟酵母菌、 园球形球拟酵母菌、木质球拟酵母菌、无名球拟酵母菌(T. famata)和丁字状球拟酵母菌 (T. versatilis));德巴利酵母菌属(如亚球形德巴利酵母菌、肯塔利(cantarellii)德巴 利酵母菌、球形德巴利酵母菌、汉逊德巴利酵母菌和日本德巴利酵母菌);接合糖酵母菌属 (如鲁氏接合糖酵母菌和拜礼(bacilii)接合糖酵母菌);克鲁维酵母菌属(如马克斯克鲁 维酵母菌);汉逊酵母菌属(如异常汉逊酵母菌和杰丁汉逊酵母菌)及酒香酵母菌属(如郎 比可酒香酵母菌和异常酒香酵母菌)。有用细菌的例子包括但不限于大肠杆菌、肠球菌、 固氮菌、欧文菌、克雷伯菌、变形杆菌、假单胞菌和沙门菌。 —旦宿主细胞表达了PST多肽,可用其制备聚唾液酸化产物。例如,可用标准的蛋 白纯化技术分离得到PST多肽,用于上述体外反应中以制备聚唾液酸化产物。也可在体外 反应中用部分纯化的PST多肽制备聚唾液酸化产物,因为其可渗透入宿主细胞。也可在体 内系统(如发酵生产)采用宿主细胞来制备聚唾液酸化产物。 通常将编码PST多肽的多聚核苷酸置于在所需宿主细胞中具有功能的启动子控 制下。熟知有极其广泛种类的启动子可用于本发明的表达载体,这取决于具体应用。通常, 启动子的选择是根据该启动子在细胞中是否有活性。也任选可包含其它表达调控序列,如 核糖体结合位点、转录终止位点等。包含这些调控序列的一种或几种的构建物称为"表达 盒"。因此,本发明提供的表达盒中掺入了能在所需宿主细胞中高水平表达编码融合蛋白的 核酸。 适合用于特定宿主细胞的表达调控序列常常通过克隆在该细胞中表达的基因 而获得。如本文所定义,包括引起转录的启动子,任选包含操纵子和核糖体结合位点序 列的常用的原核调控序列包括常用的启动子如P-内酰胺酶(青霉素酶)和乳糖(lac) 启动子系统(Chang等,Nature (1977) 198 :1056),色氨酸(trp)启动子系统(Goeddel 等,Necleic Acids Rea. (1980)8 :4057), tac启动子(DeBoer等,Proc. Natl. Acad. Sci. USA(1983) 80 :21-25);和A -衍生的PL启动子及N_基因核糖体结合位点(Shimatake等, Nature (1981) 292 :128)。具体的启动子系统对本发明并不重要,可以采用在原核细胞中具 有功能的任何可得到的启动子。 对于在大肠杆菌以外的原核细胞中表达PST多肽,需要在具体原核种类细胞中具 有功能的启动子。这类启动子可获自已从该种细胞克隆的基因,或可采用异源启动子。例 如,在大肠杆菌以外的芽胞杆菌中具有功能的杂交trp-lac启动子。
在本发明的表达盒中可方便地包含核糖体结合位点(RBS)。例如,大肠杆 菌的RBS由长3-9个核酸苷的核苷酸序列组成,位于起始密码子上游3-11个核苷酸 (Shine和Dalgarno, Nature (1975) 254 :34 ;Steitz,"生物学调节和发育基因表达"(R. F. Goldberger编写),第1巻,349页,1979,普勒姆出版社(Ple皿mPublishing),纽约)。
对于在酵母菌中表达PST蛋白,方便的启动子包括GALl-lO (Johnson和 Davies(1984)Mo1. Cell. Biol. 4 :1440-1448) 、 ADH2 (Russell等(1983) J. Biol. Chem. 258 : 2674-2682) 、 PH05 (EMB0 J. (1982)6:675-680)和MF a (Herkowitz和Oshima (1982)"酿酒 酵母菌的分子生物学"(Strathern, Jones和Broach编写),冷泉港实验室;冷泉港,纽约, 181-209页)。酵母菌中用的另一种启动子是Cousens等,Gena 61 :265-275 (1987)所述 的ADH2/GAPDH杂交启动子。对于丝状真菌,例如曲霉真菌菌株((Mcknight等,美国专利 4, 935, 349),有用启动子的例子包括构巢曲霉菌糖酵解基因衍生的启动子,如ADH3启动子 (McKnight等,EMB0 J. 4 :2093-2099(1985)和tpiA启动子。合适终止子的例子是ADH3终 止子(McKnight等)。 本发明可采用组成型或调控型启动子。调控启动子具有优点,因为可在宿主细胞 生长至高密度后再诱导融合蛋白表达。在某些情况下高水平表达异源蛋白导致细胞生长缓 慢。可诱导启动子是通过环境因素或发育因子,如温度、PH、需氧或厌氧条件、光、转录因子 和化学物质的改变导致基因表达水平改变的启动子。这类启动子本文称为"可诱导"启动 子,从而控制糖基转移酶或参与核苷酸糖合成的酶的表达周期。本领域技术人员知道大肠 杆菌和其它宿主细菌细胞的可诱导启动子。这些启动子包括,例如lac启动子、噬菌体入P^ 启动子、杂交trp-lac启动子(Amann等.(1983)Gene. 25 :167 ;de Boer等,(1983)Proc. Nat,l.Acad. Sci. USA 80:21)和噬菌体T7启动子(Studier等(1986) J. Mol. Biol. , Tabor 等(1985)Proc.Natl.Acad. Sci. USA 82:1074-8)。关于这些启动子及其用途的讨论参见 Sambrook等,同上。原核表达的特别优选的可诱导启动子有一种二元启动子,其包含的tac 启动子连接于获自编码参与半乳糖代谢酶基因(如UDP半乳糖酶4-表异构酶基因(galE)) 的启动子组分。PCT专利申请
发明者E·维利斯, M·吉尔伯特, W·瓦卡丘克 申请人:加拿大国家研究院