专利名称:用于微生物细胞的细胞通透肽和多肽的制作方法
技术领域:
本发明涉及将抑制分子递送至微生物细胞,具体说是产甲烷菌细胞的组合物和方 法。具体说,本发明涉及信号肽和包含这些肽的多肽,以及编码这些肽或多肽的多核苷酸。 本发明还涉及用于产生这些肽或多肽的表达载体和宿主细胞。本发明还涉及使用所公开的 肽或多肽、多核苷酸、表达载体和宿主细胞来检测、靶向、通透并抑制微生物细胞,尤其是产 甲烷菌细胞的方法。
背景技术:
在新西兰,农业活动是温室气体排放的主要来源。因此,减少农业温室气体排放对 于新西兰完成京都议定书的义务是重要的。议定书要求在首次承诺期(2008-2012)结束前 温室气体减排至1990年水平。为此,农业部门和新西兰政府成立了田园温室气体研究联合 会(PGGRC)寻求降低新西兰的农业温室气体排放的方法。PGGRC活动的一个重要部分是研究减少来自新西兰放牧反刍动物的甲烷排放量。 出于两个原因,减少反刍动物甲烷排放量具有商业利益。首先,不履行京都议定书承诺将迫 使政府购买碳排放额度。目前预计该项将花费三亿五千万美金。第二,甲烷的产生导致瘤 胃中产生的总能量损耗8-12%。可利用这种能量来提高反刍动物的生产性能。甲烷在瘤胃中由称为产甲烷菌的微生物产生,这种微生物属于古细菌(Archaea) 界广古菌门(euryarchaeota)的一部分。多数产甲烷菌依靠CO2和H2作为它们唯一的能 量来源,但是一些能使用乙酸或甲基化合物生长。瘤胃中中存在多种不同属的产甲烷古菌, 但是甲烷短杆菌属中的种,尤其是反刍甲烷短杆菌(M. ruminantium)和史氏甲烷短杆菌 (M. smithii)被认为是新西兰反刍动物中主要的产甲烷菌,反刍甲烷短杆菌目前是PGGRC 基金资助基因组测序项目的研究对象。该项目第一次对于瘤位产甲烷菌的基因组进行测 序,旨在对甲烷短杆菌(Methanobrevibacter)的生物学建立更好的理解,以发现抑制甲烷 产生的靶点。减少瘤胃中甲烷产生需要抑制产甲烷菌或使其甲烷生成通路失活。一种抑制甲烷 产生的方法是将特异性抑制分子递送至产甲烷菌细胞中。这可通过(例如)将抑制分子偶 联于细胞通透肽来实现。在微生物细胞中,信号肽介导胞外蛋白从细胞内到细胞外的易位, 并且适合运输抑制分子。因此,鉴定能够通透产甲烷菌细胞和递送抑制剂的信号肽是有用 的。信号肽或信号序列通常出现在原核和真核细胞分泌的前体蛋白中。信号肽是该前 体蛋白N末端上细胞通透延伸的一部分。除信号肽酶切割位点外,信号肽的一级氨基酸序 列不保守(von Hei jne,1985)。但是,信号肽共有某些结构相似性。信号肽通常包含1_5个
4带正电的N末端氨基酸残基(η区),后接10-15个疏水性氨基酸残基(h区)。甘氨酸和脯 氨酸残基通常位于疏水结构域内,苏氨酸和/或丝氨酸残基在切割位点附近形成极性结构 域(c 区)(Inouye 和 Halegoua, 1980 ;Vlasuk 等,1983 ;von Heijne, 1985)。曾提出信号肽易位的环模型(Inouye等,1977 ;Inouye和Halagoua,1980),其中信 号肽带正电的N末端与细胞膜带负电的内表面相互作用。然后,通过形成环将疏水结构域 拉入膜的疏水性脂质双层内部。该环最终包含切割位点,其暴露于信号肽酶以便除去信号 肽。抑制或限制甲烷形成的一种屏障是将抑制性化合物递送到产甲烷菌细胞内的能力。因 此,需要鉴定能够附着于细胞膜并能跨脂质双层运输分子的信号肽,作为有用的细胞抑制 剂载体。
发明内容
本发明涉及一种分离的信号肽或包含此种肽的多肽,其包含选自SEQID NO 1-172的至少一个氨基酸序列。在一个具体方面,所述肽或多肽包含至少一个氨基酸序列 KKLIIILLLLILLLSI (SEQ ID NO :117),或至少一个氨基酸序列 KKIIIILLLLILLLISI (SEQ ID N0:119)。在另一方面,所述肽或多肽包含某片段,该片段包含,例如至少一个含有SEQ ID NO 117的氨基酸3-14、3-16或2-16的氨基酸序列或至少一个含有SEQ ID NO: 119的氨基 酸3-15、3-17或2-17的氨基酸序列。在另一方面,所述肽或多肽包含某片段,该片段包含 如本文所述的SEQ ID NO: 1-172的至少一个保守性核心序列。在又一方面,所述肽或多肽 由选自SEQ ID NO 173-341或SEQID NO :342_533的多核苷酸的至少一个片段编码。本发明也涉及一种分离的多核苷酸,其包含至少一个信号肽或包含此种肽 的多肽的编码序列。在一个方面,该多核苷酸包含选自SEQ ID N0:l-172的至少 一个氨基酸序列的编码序列。在一个具体方面,所述多核苷酸包含至少一个氨基 酸序列KKLII ILLLLILLLSI (SEQ ID NO 117)的编码序列,或至少一个氨基酸序列 KKIIIILLLLILLLISI (SEQ ID NO 119)的编码序列。在另一方面,所述多核苷酸包含某编码 序列的片段,该编码序列是,例如含有SEQ ID NO 117的氨基酸3-14、3-16或2-16的至少 一个氨基酸序列的编码序列或是含有SEQ ID NO 119的氨基酸3_15、3_17或2_17的至少 一个氨基酸序列的编码序列。另一方面,该多核苷酸包含某编码序列的片段,该编码序列 是,例如编码如本文所述的SEQ ID NO 1-172的至少一个保守性核心序列的核苷酸序列。另一方面,本发明涉及一种分离的多核苷酸,该多核苷酸包含选自SEQID N0 173-341或SEQ ID NO :342_533的核酸序列。在一个具体方面,所述多核苷酸包含核酸序列 SEQ ID NO :531、532或533。在另一方面,所述多核苷酸是某片段或寡核苷酸,其包含,例如 由SEQ ID NO :531、532或533的核苷酸7-42、7-48或4-48延伸的核酸序列。此外,本发明 包括一种分离的多核苷酸或其片段,它们能与SEQ ID N0:173-341或SEQ ID NO :342_533 中的任何一种核酸序列杂交。本发明还包括一种分离的多核苷酸,该多核苷酸包含编码信 号肽或包含此种肽的多肽的任何一种核酸序列的互补物、反向互补物、反向序列或其片段。本发明涉及一种包括某多核苷酸的表达载体,该多核苷酸包含至少一种信号 肽或包含此种肽的多肽的编码序列。在一个方面,该表达载体包含选自SEQ ID N0 1-172的至少一个氨基酸序列的编码序列。在一个具体方面,所述表达载体包含至少一 个氨基酸序列KKLIIILLLLILLLSI (SEQ IDNO 117)的编码序列,或至少一个氨基酸序列KKIIIILLLLILLLISI (SEQ IDNO :119)的编码序列。在另一方面,所述表达载体包含由SEQ ID NO 117的氨基酸3-14、3-16或2-16延伸的至少一个氨基酸序列的编码序列或含有SEQ ID N0:119的氨基酸3-15、3-17或2-17的至少一个氨基酸序列的编码序列。在另一方面, 本发明涉及一种宿主细胞,例如微生物宿主细胞,其包含至少一种表达载体。本发明具体涉及本文所述的肽、多肽或多核苷酸的抗体。在某些方面,所述抗体针 对选自SEQ ID NO :1-172的至少一种信号肽序列或其修饰序列。在其它方面,所述抗体针 对信号肽序列的至少一个片段,例如选自SEQID N0:l-172的序列的保守性核心序列。在 另一方面,所述抗体结合包含SEQ ID N0:l-172中任一项的信号肽序列的多肽。在其它方 面,所述抗体针对选自SEQ ID NO 173-341或SEQ ID NO :342_533的多核苷酸的至少一个 片段,或者其互补序列或修饰序列。另一方面,所述抗体包括与至少一种细胞抑制剂形成的 一种或多种融合物或偶联物,所述细胞抑制剂包括例如,抗甲烷生成化合物(如溴代乙磺 酸)、抗体和抗体片段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗生素。本发明也涉及修饰的信号肽和包含这些肽的多肽,以及这些肽和多肽的抗体,包 括本文所述的生物学活性变化形式、片段、变体和衍生物。也涉及编码这些修饰的肽或多肽 的多核苷酸,所述多核苷酸的变化形式、片段、变体和衍生物,含有这些核酸序列的表达载 体,以及含有这些载体的宿主细胞。在具体方面,本发明的组合物和方法采用这些修饰的多 核苷酸、多肽或抗体,或相应的表达载体或宿主细胞。在特定方面,所述肽或多肽被改造成 与至少一种细胞抑制剂形成的融合物或偶联物,所述细胞抑制剂包括例如,抗甲烷生成化 合物(如溴代乙磺酸)、抗体和抗体片段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗 生素。本发明还涉及一种组合物,该组合物包含分离的信号肽(例如SEQ IDNO :1_172中 的至少一种或其修饰序列)或含有此种肽的多肽,或者此种肽或多肽的抗体。本发明还涉 及一种组合物,该组合物包含分离的多核苷酸(例如,SEQ ID NO: 173-341或SEQ ID NO: 342-533中的至少一种或其互补或修饰序列)。本发明还涉及一种组合物,该组合物包含表 达载体或包含表达载体的宿主细胞。所述组合物可包含本文所述的生物学活性变化形式、 片段、变体和衍生物中的任何一种。所述组合物还可包含至少一种细胞抑制剂,可配制成 (例如)药物组合物或食品补充剂,具体是反刍动物饲料组分。在一个具体方面,本发明涉及作为按照所公开方法检测和/或测定,或靶向、通透 和/或抑制微生物细胞,特别是产甲烷菌细胞的试剂盒的一部分的本发明组合物。该试剂 盒包括a)至少一种本文所述的组合物;和b)任选地包括,用其(例如)靶向或通透细胞 或抑制产甲烷菌或其他微生物的细胞生长或复制的使用说明书。在某些具体方面,所述肽 或多肽包含选自SEQID NO 1-172的至少一个氨基酸序列或其修饰序列。本发明涉及产生信号肽和包含此种肽的多肽的方法,所述方法包括a)在适合表 达肽或多肽的条件下培养表达载体或包含表达载体的宿主细胞,该表达载体包含至少一种 信号肽或包含此种肽的多肽的编码序列;和b)从培养物中回收所述肽或多肽。本发明也涉 及产生所述组合物的方法。在某些具体方面,所述肽或多肽包含选自SEQ ID N0:l-172的 至少一个氨基酸序列或其修饰序列。本发明也涉及产生信号肽或包含此种肽的多肽的方法,所述肽或多肽包括与至 少一种细胞抑制剂形成的融合物或偶联物,所述细胞抑制剂包括例如,抗甲烷生成化合物
6(如溴代乙磺酸)、抗体和抗体片段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗生 素。这种方法包括a)在适合表达肽或多肽的条件下培养表达载体或包含表达载体的宿主 细胞,所述表达载体包含至少一种肽或多肽的编码序列;b)形成融合物或偶联物(例如,通 过表达融合序列或与细胞抑制剂化学偶联);和C)回收所述融合物或偶联物。在某些具体 方面,所述信号肽或多肽包含选自SEQ ID NO: 1-172的至少一个氨基酸序列或其修饰序列。本发明涉及一种通透微生物细胞,具体是产甲烷菌细胞的方法,所述方法包括a) 任选地产生或分离至少一种信号肽或包含此种肽的多肽;和b)使所述细胞与所述信号肽 或多肽相接触。在一个具体方面,所述肽或多肽包含选自SEQ ID N0:l-172的至少一个氨 基酸序列或其修饰序列。另一方面,所述肽或多肽包括与至少一种细胞抑制剂形成的融合 物或偶联物,所述细胞抑制剂包括例如,一种或多种抗甲烷生成化合物(如溴代乙磺酸)、 抗体和抗体片段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗生素。本发明还涉及一种抑制微生物细胞(例如抑制生长或复制),具体是产甲烷菌细 胞的方法,所述方法包括a)任选地产生或分离至少一种信号肽或包含此种肽的多肽,这 种肽或多肽还包含至少一种细胞抑制剂;和b)使所述细胞与所述信号肽或多肽相接触。在 一个具体方面,所述肽或多肽包含选自SEQ ID NO: 1-172的至少一个氨基酸序列或其修饰 序列。另一方面,所述细胞抑制剂选自抗甲烷生成化合物(如溴代乙磺酸)、抗体和抗体片 段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗生素。本发明还涉及一种抑制微生物细胞(例如抑制生长或复制),具体是产甲烷菌细 胞的方法,所述方法包括a)任选地产生或分离至少一种信号肽或包含此种肽的多肽,这 种肽或多肽还包含至少一种细胞抑制剂;和b)使所述细胞与所述信号肽或多肽相接触。在 一个具体方面,所述肽或多肽包含选自SEQ ID NO: 1-172的至少一个氨基酸序列或其修饰 序列。另一方面,所述细胞抑制剂选自抗甲烷生成化合物(如溴代乙磺酸)、抗体和抗体片 段、裂解酶、肽核酸、抗微生物肽和本文详述的其他抗生素。本发明还涉及一种检测和/或测定信号肽水平或对应的多肽或多核苷酸水平的 方法,该方法包括1)将来自对象的样品与抗体接触,所述抗体针对信号肽(如SEQ ID NO 1-172中至少一种或其修饰序列)或对应的多肽或多核苷酸;和2)检测与样品中信号肽或 对应多肽或多核苷酸形成的抗体复合物的存在或水平。此类方法还可用于检测和/或测定 微生物细胞,具体是产甲烷菌细胞的水平。本发明还涉及一种检测和/或测定信号序列多核苷酸(如信号肽编码序列或对应 的多肽编码序列)水平的方法,所述方法包括1)将来自对象的样品与互补多核苷酸(如 与SEQ ID NO 173-341中任一项或其修饰序列互补的序列)接触;以及2)测定与样品中信 号序列多核苷酸形成的杂交复合物的存在或水平。此类方法还可用于检测和/或测定微生 物细胞,具体是产甲烷菌细胞的水平。在特定方面,本发明的方法使用体内或体外表达组件。在其它方面,本发明方法使 用重组、合成或半合成方法产生的肽或多肽,或内源性方法产生的肽或多肽。本发明的其它方面和实施方式如下文所述。附图简要说明用本发明特定实施方式和附图作为参考对本发明进行描述。
图1A-1C:甲烷杆菌基因组比较(图1A);反刍甲烷短杆菌基因组统计数据(图1B);预测参与甲烷杆菌目细菌的甲烷生成的基因(图1C)。图2 反刍甲烧短杆菌(Methanobrevibacter ruminantium)信号肽比对。用粗体 表示每种肽的核心保守区。图3A 用LogoBar产生的102种序列的蛋白序列标识。图3B 用LogoBar产生102 种序列的蛋白序列标识,显示出最保守的氨基酸残基。图3C 反刍甲烷短杆菌的核心共有 信号肽序列。图3D =N末端添加有赖氨酸_荧光素的反刍甲烷短杆菌的细胞通透肽的氨基 酸序列。图4 用荧光素标记肽通透反刍甲烷短杆菌。图5 用反刍甲烷短杆菌信号M10930RF组(orfeome)的3个不同模型显示SignalP 3. O-HMM的信号肽预测的维恩图。图6 反刍甲烷短杆菌基因和相应的信号肽评分。图7 反刍甲烷短杆菌基因和相应的信号肽。图8 :图7的信号肽的编码序列。图9:为了用大肠杆菌(E.coli)表达而进行密码子优化的图7信号肽的编码序 列。
具体实施例方式定义如本文所述,“改变的”编码信号肽的核酸序列包括那些具有不同的氨基酸缺失、 插入或取代,得到编码相同或功能等同肽的多核苷酸的核酸。编码的肽也可以是“改变的”, 并包含氨基酸残基的缺失、插入或取代,产生沉默改变并得到功能等同的肽。只要肽的生物 学活性(如细胞结合或细胞通透)或免疫原性得以保留,可在残基的极性、电荷、溶解性、疏 水性、亲水性和/或两亲特性相似的基础上,有意进行氨基酸取代。例如,带负电的氨基酸 可以包括天冬氨酸和谷氨酸;带正电的氨基酸可以包括赖氨酸和精氨酸;具有亲水性值相 似的不带电极性头部基团的氨基酸包括亮氨酸、异亮氨酸和缬氨酸,甘氨酸和丙氨酸,天冬 酰胺和谷胺酰胺,丝氨酸和苏氨酸以及苯丙氨酸和酪氨酸。如本文所用“氨基酸序列”指寡肽、肽、多肽或蛋白质序列及其片段,并且指天然产 生的、重组的、合成或半合成的分子。本发明序列(如SEQ IDN0:1-172)包含至少5、6、7、 8、9、10、11、12、15、17、19 或 22 个氨基酸,优选至少 5_10、5_15、10—15、12—15、15—17、17—19 或17-22个氨基酸,优选保持来源序列的生物学活性(如细胞结合或细胞通透)或免疫学 活性(如至少一个抗原结合位点)。当本文引用“氨基酸序列”指代天然产生的肽或多肽分 子的氨基酸序列、氨基酸序列,以及类似术语时,并不意于将氨基酸序列限制为与全长分子 相关的完整天然氨基酸序列。本文所用“扩增”指产生核酸序列的其它拷贝,通常使用本发明熟知的聚合酶链反 应(PCR)技术操作(Dieffenbach,C. W.和G. S. Dveksler (1995)《PCR引物,实验室手册,冷 泉港出版社,纽约普莱恩维尤》(PCR Primer, a Laboratory Manual, Cold Spring Harbor Press, Plainview, NY))。术语“抗体”应理解为最广泛的可能含义,并意于包含完整的单克隆抗体和多克隆 抗体。也意于覆盖抗体片段和衍生物,只要其显示生物学活性。抗体包括免疫球蛋白分子
8和免疫球蛋白(Ig)分子的活性部分,即包含特异性结合抗原(与其免疫反应)的抗原结合 位点的分子。这些包括但不限于多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fe、Fab、 Fab,和Fab2片段和Fab表达文库。抗体分子涉及IgG、IgM、IgA、IgE和IgD的任何种类,它们之间的差异在于分子中 重链的特性。它们也包括亚类,如IgGl、IgG2和其它。轻链可以是κ链或λ链。本文提 到抗体时包括所有类、亚类和类型。还包括嵌合抗体,例如对于不止一种来源如一种或多种 小鼠、人或反刍动物序列具有特异性的单克隆抗体或其片段。还包括羊驼抗体或纳米抗体。 应理解,本文中提到“抗体”或任何类似术语包括完整抗体,及其任何片段、变化形式、衍生 物或变体。如本文所用术语“生物学活性”或“功能性”指保持天然产生序列的一种或多种结 构、免疫原性或生物化学功能(如细胞结合或细胞通透)的肽或多肽。例如,功能性序列可 包含至少一个本文所述的核心保守区。本文所用术语“细胞抑制剂”或“抑制剂”指降低或阻碍微生物细胞,尤其是产甲 烷菌细胞生长或复制的试剂。细胞抑制剂可用于降低或阻碍如细胞分裂。抑制剂可减少或 阻断例如DNA合成、RNA合成、蛋白质合成或翻译后修饰。抑制剂也可降低或阻断参与甲烷 生成通路的酶的活性。抑制剂还可靶向细胞,以便免疫系统组件识别。抑制细胞还包括细 胞杀伤和细胞死亡,例如通过裂解、凋亡、坏死等实现。有用的抑制剂包括但不限于如本文 详述的抗甲烷生成化合物(如溴代乙磺酸)、抗体和抗体片段、裂解酶、肽核酸、抗微生物肽 和其他抗生素。本文所用术语“互补的”或“互补性”指在允许的盐和温度条件下多核苷酸通过 碱基配对自然结合。对于序列A-G-T,互补序列是T-C-A,反向互补是A-C-T而反向序列是 T-G-A0两条单链分子间的互补性可以是部分的,即仅有一些核酸结合,或者为完全互补,即 当单链分子间存在完全互补性时。核酸链间的互补程度对于核酸链间杂交的效率和强度有 显著性影响。这对于依赖核酸链结合的扩增反应以及PNA分子的设计和使用尤其重要。本文所用术语“衍生物”指信号肽的编码核酸或与之互补的核酸的化学修饰形式。 此类修饰包括例如,用烷基、酰基或氨基取代氢。在优选方面,核酸衍生物编码的肽保留天 然分子的生物学或免疫学功能。衍生肽是通过糖基化、peg化或任何相似过程修饰的肽,它 保留了其来源序列的一种或多种生物学功能(如细胞结合或细胞通透)或免疫学功能。本文所用术语“同源”指一定程度的互补性。可以是部分同源(即,相同性小于 100% )或完全同源(即,100%相同)。使用功能性术语“基本同源”指代至少部分抑制相 同序列与靶核酸杂交的部分互补序列。可在低严谨性条件下使用杂交实验(Southern或 northern印迹,溶液杂交等)检验对完全互补序列与靶序列杂交的抑制。基本同源的序列 或杂交探针在低严谨性条件下将竞争并抑制完全同源序列与靶序列的结合。这并不是说 低严谨性条件允许非特异性结合;低严谨性条件需要两条序列的相互结合是特异性(选择 性)相互作用。如本文所用术语“杂交”指核酸链通过碱基配对与互补链结合的任何过程。本文所用“插入”或“加入”指对氨基酸或核苷酸序列进行改变,与天然产生的分 子相比,导致加入一个或多个氨基酸残基或核苷酸。本文所用“产甲烷菌”指产生甲烷气体的微生物,包括甲烷短杆M (Methanobrevibacter) > 甲;^ 口耆热杆菌(Methanothermobacter) > ψ ' λ W M (Methanomicrobium)、甲烧杆菌(Methanobacterium)禾口 甲烧乂V叠球菌(Methanosarcina)。 具体的产甲烷菌包括但不限于反刍甲烷短杆(Methanobrevibacter ruminantium)、史 氏甲烧短杆菌(Methanobrevibactersmithii)、酸个生甲烧短杆菌(Methanobrevibacter acididurans)、巢氏甲烧短杆菌(Methanobrevibacter thaueri)、布氏甲烧杆菌 (Methanobacterium bryantii) > ¥ St ¥ !^υ If lif (Methanobacterium formicicum) > 马尔堡甲烧嗜热杆菌(Methanothermobacter marburgensis)、沃氏甲烧嗜热杆菌 (Methanothermobacter wolfeii)、 f 氏甲;求(Methanosphaerastadtmanae) ¥ 烧微菌(Methanomicrobium mobile)、巴氏甲烧八叠球菌(Methanosarcina barkeri)、梅氏 甲烧W叠球菌(Methanosarcina mazei)、布氏拟甲烧球菌(Methanococcoides burtonii) 和泰氏甲烷叶菌(Methanolobustaylorii)。所有产甲烷菌的属和种均在此术语涵盖范围 内。本文所用“微生物细胞”指天然产生或遗传修饰的微生物细胞,包括古细菌如产甲 烷菌、嗜盐微生物和嗜酸嗜热菌,以及真细菌,如蓝藻、螺旋体、变形细菌以及革兰阳性和革 兰阴性细菌。术语“修饰的”指如本文所述的更改的序列和序列片段、变体和衍生物。本文所用“核酸序列”或“核苷酸序列”指多核苷酸序列、寡核苷酸或其片段,以及 天然、重组、合成或半合成来源的DNA或RNA,它们可以是单链或双链,并可代表正义或反以 链以及编码或非编码区。本发明序列最优选包含多肽编码序列(如SEQ ID N0:173-341或 342-533,或其互补序列或修饰序列),其包含至少15、18、21、24、27、30、33、36、39、45、51、 57 或 66 个核苷酸,优选至少 15-30、15-45、30-45、36-45、45-51、51-57 或 51-66 个核苷酸, 或至少100个核苷酸,或至少1000个核苷酸。应理解的是本文中每一处提及“核酸序列”或 “核苷酸序列”将包括天然、全长序列(如SEQ ID NO: 173-341或342-533),及其任何互补 序列、片段、变化形式、衍生物或变体。术语“寡核苷酸”指包含至少6、8、10、12、15、18、21、25、27、30或36个核苷酸或至 少12-36个核苷酸或至少15-30个核苷酸(例如,SEQID NO 173-341或342-533或其互补 序列的至少一个片段)的核酸序列,可用于PCR扩增、测序或杂交实验。如本文所用,“寡核 苷酸”基本等同于“扩增物”、“引物”、“寡聚物”、“寡核苷酸”以及“探针”,如本领域通常定 义的那样。本文中所用单数或复数形式的术语“多核苷酸” 一般指任何核酸序列,例如,任何 聚核糖核苷酸或聚脱氧核糖核苷酸,它可以是未修饰的RNA或DNA,或者修饰的RNA或DNA。 包括但不限于单链和双链DNA,包括单链和双链区的DNA,单链和双链RNA以及包括单链和 双链区的RNA,包含DNA和RNA的杂交分子(可为单链或(更典型的)双链或包含单链和双 链区)。也包括含有RNA或DNA或者RNA和DNA的三链区。具体说,包括mRNA、cDNA和基因 组DNA及其任何片段。该术语包括含有一个或多个修饰碱基如含氚碱基或非常见碱基如肌 苷的DNA和RNA。本发明的多核苷酸可涵盖编码或非编码序列,或正义或反义序列或iRNA 如siRNA。应理解的是本文中每一处提及“多核苷酸”或类似术语将包括全长序列,及其任 何互补序列、片段、变化形式、衍生物或变体。本文所用“肽核酸”或“PNA”指反义分子或抗_基因试剂,其包含通过肽主链连接
10的碱基。本文所用术语“反刍动物”指具有瘤胃作为特殊类型消化器官的动物。反刍动物 包括但不限于牛、绵羊、山羊、水牛、麋鹿、羚羊、北美驯鹿和鹿。本文所用“信号肽”指本发明的分离肽,其获自任何物种,优选微生物,以及任 何天然、合成、半合成或重组的来源。具体说,信号肽可获自产甲烷菌细胞,如甲烷短杆 菌(Methanobrevibacter)细胞,具体是反刍甲烷短杆菌或史氏甲烷短杆菌细胞。对于重 组产生,本发明信号肽可获自微生物或真核细胞,例如大肠杆菌(Escherichia)、链球菌 (Str印tomyces)、芽孢杆菌(Bacillus)、沙门菌(Salmonella)、酵母、昆虫细胞如果蝇细 胞、动物细胞如COS和CHO细胞或植物细胞。应理解的是本文中每一处提及“肽”将包括全 长序列(如SEQ ID NO :1-172),及其任何变化形式、片段、衍生物或变体。本文所用术语“严谨条件”或“严谨性”指核酸、盐和温度限定的杂交条件。这些条 件为本领域所熟知,可更改这些条件以鉴定或检测相同或相关的多核苷酸序列。参见例如 Sambrook, J.等(1989)《分子克隆,实验室手册》冷泉港出版社,纽约普莱恩维尤(Molecular Cloning,A LaboratoryManual,Cold Spring Harbor Press,Plainview,NY),以及Ausubel, F. Μ.等(1989)新编分子生物学实验指南,约翰韦利森出版社,纽约(CurrentProtocols in Molecular Biology, John Wiley & Sons,New York,NY)。数种包含低或高严谨性的相等条 件取决于以下因素,如序列的长度和特性(DNA、RNA、碱基组成)、靶点特性(DNA、RNA、碱基 组成)、环境(在溶液中或固定于固体基材上)、盐和其它成分(如甲酰胺、硫酸右旋糖苷和 /或聚乙二醇)的浓度和反应温度(从低于探针解链温度5°C至低于解链温度约20°C-25°C 的范围内)。可改变一种或多种因素以产生不同于或等同于上述条件的低或高严谨性。术语“对象”包括人或非人动物。非人动物包括但不限于鸟类和哺乳动物,如反 刍动物,具体是小鼠、兔、猫、狗、猪、绵羊、山羊、牛和马。本文所用术语“基本纯化”或“分离”指从细胞、重组或合成环境中移出的核酸或氨 基酸序列,并且至少至少60%,优选75%并最优选至少90%或至少99%不含它们在细胞、 重组或合成环境中相关联的其它组分。本文所定义“转化”指外源DNA进入并改变接受细胞的过程。可使用本领域所熟知 多种方法在天然或人工条件下进行转化。转化可依赖将外源核酸序列插入原核或真核宿主 细胞的任何已知方法。基于需转化的宿主细胞类型选择方法,可包括但不限于病毒感染、电 穿孔、热休克、脂质转染和粒子轰击。此类“转化”细胞包括稳定转化细胞,其中插入的DNA 能够作为自主复制质粒或作为宿主染色体的一部分进行复制。它们还包括在限定时间期间 瞬时表达插入的DNA或RNA的细胞。如本文所用肽或多肽“变体”指一个或多个氨基酸改变的氨基酸序列。改变变体 多核苷酸的一个或多个核苷酸。变体可导致“保守性”改变,其中取代的氨基酸具有相似结 构或化学特性,如用异亮氨酸取代亮氨酸。更少见的,变体可导致“非保守性”变化,如用色 氨酸替换甘氨酸。类似的小变异还可包括氨基酸缺失或插入或两者均有。使用本领域熟知 计算机程序如LASERGENE软件(DNASTAR)可发现如何确定可对哪一氨基酸取代、插入或缺 失而不破坏生物学或免疫学活性的指南。本发明还涵盖保留肽或多肽的至少一种生物学活性(如细胞结合或细胞通透)或 功能活性的变体。优选变体是与公开序列具有至少80%,更优选至少90%序列相同性的
11变体。最优选的变体是与本文公开序列至少95%,至少97%,至少98%,至少99%,至少 99.5%,至少99. 8%或至少99. 9%序列相同的变体。如下所述通过对需比较的两条序列比 对、确定比对部分的相同残基数目、除以本发明(查询)序列总残基数并乘以100,从而确定 相同性百分数。有用的比对程序是AlignX(载体NTI)。发明详述甲烷在反刍动物前肠中由产甲烷菌产生,它是瘤胃系统中碳的终末还原产 物。已对甲烷产生通路的多个步骤进行了阐述,主要来自于对非瘤胃产甲烷菌的研究, 但是尚不了解对于使产甲烷菌在瘤胃中生长和持续存在的适应性。反刍甲烷短杆菌 (Methanobrevibacter ruminantium)是新西兰反刍动物体内主要的产甲烧菌。如本文所 述,反刍甲烷短杆菌的基因组草图序列大小约为3.0Mb,GC含量为33.68%。一项重要的发 现是反刍甲烷短杆菌基因组包含用于靶向和通透细胞的信号肽序列。因此,本发明包括信 号肽,包括含有SEQ ID NO :1-172的肽以及包含这些肽的多肽,以及它们的变化形式、片段、 变体和衍生物。本发明包括这些肽或多肽在靶向和通透微生物细胞,尤其是产甲烷菌细胞中的应 用。本发明还包括这些肽或多肽在抑制此类细胞生长或复制中的应用。可表达本发明的肽 和多肽并用于不同的实验以测定其生物学活性。这些肽和多肽可用于大规模合成和分离实 验方案,例如,用于商业生产。可使用此类肽和多肽产生抗体,以分离相应的氨基酸序列和 对氨基酸序列水平进行定量测定。本发明的多肽还可用作组合物,例如药物组合物和食品补充剂,如反刍动物饲料 组分。本发明的肽或多肽还具有健康益处。例如,在健康相关方面,产甲烷菌抑制剂可用于 恢复通常以甲烷形式从个体流失的能量。在特定方面,缓释瘤胃装置可与本发明的肽、多肽 和组合物(如药物组合物和食品补充剂)联用。本发明的肽和多肽包含选自下组的至少一个序列(a)包含至少一个选自SEQ ID NO 1-172或其变化形式、片段、变体或衍生物的氨基酸序列的肽或多肽;(b)包含至少一个 选自SEQ ID NO :1-172和其变化形式、片段、变体的氨基酸序列的功能性结构域(如本文所 述的核心保守区)的肽或多肽;以及(c)包含选自SEQ ID N0:l-172或其变化形式、片段、 变体或衍生物的至少一个氨基酸序列的至少一定数目的毗连残基的肽或多肽。所有这些序 列统称本发明的肽或多肽。在一个实施方式中,本发明包括含有SEQID NO 1-172中至少一 个氨基酸序列的分离的肽或多肽。本发明还包括编码至少一个信号肽,包括SEQ ID NO :1_172的肽和包含这些肽的 多肽,以及它们的变化形式、片段、变体或衍生物的多核苷酸。本发明包括这些多核苷酸在制备靶向和通透微生物细胞尤其是产甲烷菌细胞的 表达载体和宿主细胞中的用途。本发明还包括多核苷酸在抑制此类细胞生长或复制中的用 途。本发明的分离的多核苷酸还可用于对或多或少的相关细菌进行基因组作图、物理作图 和基因克隆。通过本领域熟知技术如狭缝印迹技术或微阵列技术,可使用根据本发明多核 苷酸设计的探针在细胞中具有充分同源DNA和RNA序列的任何生物体中检测基因的存在和 表达模式。使用本发明多核苷酸设计的引物可用于测序和PCR扩增。本发明的多核苷酸还可用作组合物,例如药物组合物和食品补充剂,如反刍动物 饲料组分。本发明的多核苷酸还具有健康益处。对于此类益处,多核苷酸可作为表达载体或含表达载体的宿主细胞提供。在特定方面,缓释瘤胃装置可与本发明的多核苷酸、载体、 宿主细胞和组合物(如药物组合物和食品补充剂)联用。本发明多核苷酸包含选自下组的至少一个序列(a)包含至少一个选自SEQ ID NO 1-172或其变化形式、片段、变体或衍生物的氨基酸序列的编码序列的序列;(b)至少一 个选自SEQ ID NO :1-172或其变化形式、片段、变体或衍生物的氨基酸序列的编码序列的 互补序列、反向序列以及反向互补序列;(c)至少一个选自SEQ ID N0:l-172或其变化形 式、片段、变体或衍生物的氨基酸序列的编码序列中所含的开放阅读框;(d)至少一个选自 SEQID NO 1-172或其变化形式、片段、变体或衍生物的氨基酸序列的编码序列的功能性结 构域(如本文所述的核心保守区);以及(e)含有至少一个选自SEQID N0:l-172或其变化 形式、片段、变体或衍生物的氨基酸序列的编码序列的至少一定数目的毗连残基的序列。也 提供寡核苷酸探针和引物。所有这些多核苷酸、寡核苷酸探针和引物在本文中统称为本发 明的多核苷酸。在一个方面,本发明包括包含至少一个选自SEQ ID N0:l-172的氨基酸序 列的编码序列的分离多核苷酸。本领域熟练技术人员应当理解的是,作为遗传密码简并性的结果,可产生大量本 发明肽的编码核苷酸序列,其中某些序列与任何已知和天然产生的基因的核苷酸序列同源 性很小。因此,本发明考虑到各个和每个可能的核苷酸序列变异,这些变异可通过根据可能 密码子选择密码子组合而产生。根据应用于天然产生的氨基酸序列的标准三联遗传密码产 生这些组合,所有此类变异都被视作已具体公开。编码信号肽或多肽或其修饰序列的核苷酸序列优选在适当选择的严谨条件下能 够与天然产生序列的核苷酸序列杂交。然而,具有优势的是产生编码肽或其衍生物的、具有 明显不同密码子使用的核苷酸序列。根据宿主使用特定密码子的频率,可选择密码子以提 高特定原核或真核宿主中的肽表达速率。例如,可根据在大肠杆菌(E. coli)中的表达优化 密码子,例如SEQID NO :342-533。改变肽及其衍生物的编码核苷酸序列而不改变编码的氨 基酸序列的其它原因包括产生具有更有利特性,如比天然产生序列产生的转录物具有更长 半衰期的RNA转录物。本发明还包括完全通过合成化学产生编码肽或多肽,或其修饰序列的DNA序列 或其片段。在合成序列产生后,利用本领域熟知试剂,可将其插入到任何可用的表达载体 和细胞系统中。而且,可使用合成化学在编码肽或多肽,或其任何变化形式、变体、衍生物 或片段的序列中引入突变。本发明还包括在如Wahl,G.M和S. L. Berger(1987 ;Methods Enzymol. 152 :399_407)以及 Kimmel,A. R. (1987 ;Methods Enzymo 1. 152 :507_511)所教导 的各种严谨条件下,能与要求权利的核苷酸序列杂交的多核苷酸序列,尤其是SEQ ID NO 173-341或342-533中显示的那些及其互补序列。本领域熟知并常用的DNA测序方法可用于实践本发明的任何实施方式。这类方法 可使用如DNA聚合酶I的克列诺片段,SEQUENASE (美国生物化学集团(U. S. Biochemical Corp.),俄亥俄州克里富兰)(U. S. BiochemicalCorp, Cleveland, 0H),Taq 聚合酶(珀金 埃尔默MPerkin Elmer),热稳定T7聚合酶(安法马西亚生物技术公司,新泽西州皮斯 卡塔韦)(AmershamPharmacia Biotech Piscataway, NJ),或者聚合酶和校对核酸外切酶 的组合,如生命技术公司(Life Technologies)(马里兰州盖瑟斯堡)销售的EL0NGASE 扩增系统中找到的那些。优选地,该方法通过机器自动化进行,如汉密尔顿微型实验室2200 (Hamilton Micro Lab 2200)(内华达州雷诺汉密尔顿)(Hamilton, Reno, NV),派而特 热循环仪(Peltier Thermal Cycler) (PTC200 ;MJ 研究公司,麻省沃特敦)(MJ Research, Watertown, ΜΑ) ;ABI催化仪(ABI Catalyst)以及373和377DNA测序仪(珀金埃尔默) (Perkin Elmer)或基因组测序仪20 (罗氏诊断公司)(Roche Diagnostics)。可使用部分核苷酸序列并使用本领域所知方法将编码肽的核酸序列延伸,以检测 上游序列如启动子和调节元件。例如,可使用的一种方法“位点限制性"PCR使用通用引物以 获取与已知基因座相邻的未知序列(Sarkar, G. (1993)PCR Methods Applic. 2 :318_322)。 具体说,在接头序列引物和已知区域特异性引物存在的条件下对基因组DNA进行首次扩 增。然后对扩增序列进行第二轮PCR,其中使用相同的接头引物和在第一引物内的另一特异 性引物。用合适的RNA聚合酶对每一轮PCR产物进行转录,用逆转录酶进行测序。市售毛细管电泳系统可用于分析测序或PCR产物的核苷酸序列的大小或对其进 行确认。具体说,毛细管测序可使用可流动聚合物进行电泳分离,激光激发的四种不同荧光 染料(每种对应一种核苷酸),用电荷耦合器件照相机探测发射波长。使用合适的软件(如 基因组分型和序列导航者,珀金埃尔默公司)(GEN0TYPER and Sequence NAVIGATOR, Perkin Elmer)可将输出/光强度转化为电信号,从上样到计算机分析和电子数据显示均可在计算 机控制下进行。毛细管电泳尤其优选用于对特定样品中少量存在的小片段DNA进行测序。在本发明的另一实施方式中,编码肽或多肽的多核苷酸或其片段可用于重组DNA 分子以在合适宿主细胞中指导肽、多肽或其修饰序列的表达。由于遗传编码的固有简并性, 可产生编码基本相同或功能等同的氨基酸序列的其它DNA序列,这些序列可用于克隆和表 达信号肽或多肽。可使用本领域通常所知方法对本发明的核苷酸序列进行工程改造以根据 多种原因改变氨基酸编码序列,包括但不限于为了改变克隆、加工和/或基因产物表达而 进行的变化。可使用通过随机片段化进行的DNA改组以及对基因片段和合成寡核苷酸的 PCR组装对核苷酸序列进行工程改造。例如,可使用定位诱变插入新的限制性位点,改变糖 基化形式,改变密码子偏好,引入突变等等。在本发明的另一实施方式中,可将天然、修饰或重组的编码肽或多肽的核酸序列 连接至异源序列以编码融合蛋白。例如,编码可被市售抗体识别的嵌合序列可能是有用的。 也可工程改造融合蛋白使其在本发明的肽或多肽和异源蛋白序列间含有切割位点,以便于 切割并纯化该肽或多肽,与异源部分分离。在另一实施方式中,可使用本领域熟知化学方法合成完整或部分形式的肽或多肽 编码序列(参见 Caruthers,M. H.等(1980)Nucl. Acids Res. Symp. Ser. 215-223, Horn, Τ.等(1980) Nucl. Acids Res. Symp. Ser. 225-232)。或者,可使用合成氨基酸序列或其片段 的化学方法产生肽或多肽本身。例如,可使用多种固相合成技术(RobergeJ.Y.等(1995) Science 269 202~204 ;Merrifield J. (1963) J. Am. Chem. Soc. 85 2149-2154)进行月太合 成,使用例如ABI 431A肽合成仪(珀金埃尔默公司)进行自动合成。可用化学方法合成肽 或多肽的各种片段,并用化学方法组合产生全长分子。可用制备型高效液相色谱分离新合成的肽或多肽(如,Creighton, T. (1983) 蛋白质结构和分子原则,WH富瑞曼公司,纽约(Proteins Structuresand Molecular Principles,WH Freeman and Co.,New York,NY))。通过氨基酸分析和测序可确认合成的肽 或多肽的组成(如,埃得曼降解步骤(Edmandegradation procedure ;Creighton),同上)。此外,肽或多肽或其任何部分的氨基酸序列可在直接合成中更改和/或通过化学方法与来 自其它蛋白质或其部分的序列组合以产生修饰分子。为了表达生物学活性肽,可将编码肽或功能等同物的核苷酸序列插入合适的表 达载体,即包含插入序列转录和翻译必需元件的载体。可用本领域熟练技术人员熟知的 方法构建包含肽编码序列以及合适的转录和翻译控制元件的表达载体。这些方法包括体 外重组DNA技术、合成技术和体内遗传重组。Sambrook,J.等(1989)《分子克隆,实验室 手册》冷泉港出版社,纽约普莱恩维尤(Molecular Cloning, A Laboratory Manual, Cold SpringHarbor Press,Plainview,NY),以及 Ausubel,F. M.等(1989)新编分子生物学实验 指南,约翰韦利森出版社,纽约(Current Protocols in Molecular Biology, John Wiley & Sons,New York, NY)对此类技术进行了描述。可使用多种表达载体/宿主系统包含并表达本发明肽的编码序列。它们包括但 不限于微生物体如重组噬菌体、质粒或粘粒DNA表达载体转化的细菌;酵母表达载体转化 的酵母;病毒表达载体(如杆状病毒)转化的昆虫细胞系统;病毒表达载体(如,花椰菜花 叶病毒CaMV ;烟草花叶病毒TMV)或细菌表达载体(如,Ti或pBR322质粒)转化的植物细 胞;或动物细胞系统。对于细菌,有用的质粒包括英骏公司(Invitrogen)的pET、pRSET、 pTrcHis2和pBAD质粒;诺瓦基公司(Novagen)的pET和ρ⑶F质粒以及西格玛奥德里奇公 司(Sigma-Aldrich)的Director 质粒。对于产甲烷菌,有用的质粒包括但不限于ρΜΕ2001、 pMV15和pMPl。具体说,可将大肠杆菌(Escherichiacoli)与表达载体pET—起使用。所 用表达载体或宿主细胞并不限制本发明。“控制元件”和“调节序列”是载体的非翻译区_增强子、启动子、5'和3'非翻译 区一它们与宿主细胞蛋白质相互作用,进行转录和翻译。此类元件的强度和特异性可能不 同。根据所使用载体系统和宿主,可使用任何数量的合适的转录和翻译元件,包括组成型和 诱导型启动子。例如,当克隆进细菌系统时,可使用诱导型启动子,如BLUESCRIPT噬菌粒 (司查塔基公司,加州拉霍亚)(Stratagene, LaJolla, CA)或ρSP0RT1质粒(生命技术公 司)(Life Technologies)的杂交IacZ启动子等。可在昆虫细胞中使用杆状病毒多角体蛋 白启动子。可将来源于植物细胞基因组(如,热休克、RUBISC0和存储蛋白质基因)的启动 子或增强子或来自于植物病毒的启动子或增强子(如病毒启动子或前导序列)克隆到载体 中。在细菌系统中,可根据肽的指定应用对许多表达载体进行选择。例如,当需要大量 肽时,可使用指导高水平表达易于纯化的融合蛋白的载体。此类载体包括但不限于多功能 大肠杆菌克隆和表达载体如BLUESCRIPT (司查塔基公司),其中可将肽编码序列连接入载 体,与β-半乳糖苷酶的氨基末端Met和后续7个残基在相同读框内,从而产生杂合蛋白; pIN 载体(VanHeeke, G.和 S. M. Schuster (1989) J. Biol. Chem. 264 :5503_5509)等。也可采用pGEX载体(普洛麦格公司,威斯康星州麦迪逊)(Promega,Madison, WI)表达外源肽与谷胱甘肽-S-转移酶(GST)的融合蛋白。通常,这类融合蛋白可溶, 并容易通过以下方法由裂解细胞纯化吸附于谷胱甘肽琼脂糖珠上,然后在游离谷胱 甘肽的存在下洗脱。可设计此类系统产生的蛋白质以使其包含肝素、凝血酶或Xa因 子蛋白酶切割位点,从而使感兴趣的克隆肽可按需从GST部分释放出来。在酿酒酵母 (Saccharomycescerevisiae)中,可使用包含组成型或诱导型启动子的多种载体,如α因子、醇氧化酶禾口 PGH0 参见 Ausubel 等(同上)和 Grant 等(1987)Methods Enzymo 1. 153 516-544的综述。也可使用特异性起始信号达到更有效的翻译本发明肽编码序列的目的。此类信 号包括ATG启动密码子和相邻序列。当肽编码序列、其起始密码子和上游序列插入到合适 表达载体的情况下,无需另外的转录或翻译控制信号。然而,当仅插入编码序列或其片段 时,需提供外源的翻译控制信号包括ATG起始密码子。而且,起始密码子应当位于正确的阅 读框中,以保证完整插入物的翻译。外源翻译控制元件和起始密码子可有多种天然或合成 来源。通过包括适合所用特定细胞体系的增强子可增强表达效率,如文献中所述(Scharf, D.等,(1994)Results Probl. Cell Differ. 20 125-162) 此外,可根据宿主细胞株调节插入序列表达或以所期望的方式加工表达的肽或 多肽的能力对其进行选择。此类序列的修饰包括但不限于乙酰化、羧化、糖基化、磷酸 化、脂化和酰基化。也可使用切割肽或多肽“前体”形式的翻译后加工以利于正确的插入、 折叠和/或功能。可从美国典型培养物保藏中心(马里兰州贝塞斯达MAmerican Type Culture Collection(ATCC ;Bethesda, MD)获取具有特定细胞机器或翻译后活性的特征性 机制的不同宿主细胞,选择以保证正确的序列修饰和加工。具体宿主细胞包括但不限于 产甲烷菌细胞,如产甲烷短杆菌细胞,具体说,反刍甲烷短杆菌或史氏甲烷短杆菌细胞。感 兴趣的宿主细胞还包括例如,红酵母(Rhodotorula)、短梗霉菌(Aureobasidium)、酿酒酵 母(Saccharomyces)、掷孢酵母(Sporobolomyces)、假单胞菌(Pseudomonas)、欧文氏菌 (Erwinia)和黄杆菌(Flavobacterium);或其它此类有机体如埃希菌(Escherichia)、乳酸 杆菌(Lactobacillus)、芽胞杆菌(Bacillus)、链霉菌(Streptomyces)等。特定的宿主细 胞包括尤其适于本发明使用的大肠杆菌(Escherichia coli)、酿酒酵母(Saccharomyces cerevisiae)、苏云金芽 包杆菌(Bacillus thuringiensis)、才古草芽 包杆菌(Bacillus subtilis)、变青链霉菌(Streptomyces lividans)等。数种技术可将核酸引入体外培养的真核细胞中。它们包括化学方法(Feigner等, Proc. Natl. Acad. Sci.,USA, 84 74137417 (1987) ;Bothwell 等,真核基因克隆和分析方法 (Methods for Cloning and Analysis ofEukaryotic Genes),编,约翰和巴特勒出版公司, 麻省波士顿(Jones andBartlett Publishers Inc.,Boston, Mass. ) (1990) ;Ausubel 等, 分子生物学简明实验方案(Short Protocols in Molecular Biology),约翰韦利森公司, 纽约(JohnWiley and Sons, New York, NY) (1992);以及 Farhood,Annal· NY Acad. Sci., 716 :2334 (1994)),使用原生质体(Bothwell,同上)或电脉冲(Vatteroni 等,Mutn. Res., 291 163 169(1993) ;Sabelnikov, Prog. Biophys.Mol. Biol. ,62 119152(1994) ;Bothwell 等,同上;以及Ausubel等,同上),使用减毒病毒(Davis等,J. Virol. 1996,70 (6), 37813787 ;Brinster 等 J. Gen. Virol. 2002,83(Pt 2),369 381 ;Moss,Dev.Biol. Stan.,82 5563(1994);以及Bothwell等,同上),以及物理方法(Fynan等,同上Johnston等,Meth. Cell Biol. ,43 (PtA) 353365 (1994) ;Bothwell 等,同上;以及 Ausubel 等,同上)。可通过以下方法将核酸成功递送至动物组织使用阳离子脂质体(Watanabe等, Mol. Reprod. Dev.,38 =268274 (1994)),直接将裸露的DNA或RNA注射入动物肌肉组织 (Robinson 等,Vacc.,11 957960 (1993) ;Hoffman 等,Vacc. 12 15291533 (1994) ;Xiang 等, Virol.,199 132140 (1994) ;Webster 等,Vacc.,12 1495 1498(1994) ;Davis 等,Vacc.,12:1503 1509(1994) ;Davis 等,Hum. Molec. Gen.,2 1847 1851 (1993) ;DaIemans 等, AnnNY Acad. Sci. 1995,772,255256. Conry 等,Cancer Res. 1995,55 (7),1397-1400)和 胚胎(Naito 等,Mol. R印rod. Dev.,39 153 161(1994);和 Burdon 等,Mol. R印rod. Dev., 33:436442(1992)),肌肉内注射自我复制的 RNA 疫苗(Davis 等,J Virol 1996,70(6), 37813787 ;Balasuriya 等,Vaccine 2002,20 (1112),16091617)或者用“基因枪”技术皮内 注射DNACJohnston等,同上)。用蛋白质特异性多克隆或单克隆抗体检测和测定本发明肽或多肽表达的各种实 验方案为本领域所知。例子包括酶联免疫吸附实验(ELISA)、放射性免疫(RIA)和荧光激活 的细胞分选(FACS)。可使用与肽或多肽上两个非干扰表位具有反应性的单克隆抗体进行双 位点单克隆免疫实验,也可使用竞争结合实验。这些和其它实验参见Hampton,R.等(1990 ; 血清学方法,实验室手册(Serological Methods, a laboratory Manual),APS出版社,明尼 苏达州圣保罗)以及 Maddox,D. E.等(1983 J. Exp. Med. 158 1211-1216)等。本领域熟练技术人员了解多种标记和偶联技术,可用于多种核酸和氨基酸实验。 产生标记的杂交或PCR探针用于探测多核苷酸相关序列的方法包括寡核苷酸标记、缺口平 移、末端标记或使用标记核苷酸进行PCR扩增。或者,可将编码该肽、包含该肽的任何多肽 或其任何修饰序列的序列克隆到载体中用于产生mRNA探针。此类载体为本领域所知并 可购得,可在加入合适RNA聚合酶如T7、T3或SP6以及标记的核苷酸后用于体外合成RNA 探针。可利用安法马西亚生物技术公司、普洛麦格公司和美国生物化学公司(Amersham Pharmacia Biotech, Promega and US Biochechemical)生产的多种市售试剂盒进行这些 步骤。易于探测的合适报告分子或标记包括放射性核素、酶、荧光物质、化学发光物质或发 色剂以及底物、辅因子、抑制剂、磁性颗粒等。可在适于表达和从培养物中回收肽或多肽的条件下,培养表达载体或用表达载体 转化的宿主细胞。培养物可包含体外或体内表达组件。体外表达组件包括兔网织红细胞 裂解物、大肠杆菌裂解物和麦芽提取物的体外表达组件,例如,英骏公司(Irwitrogen)的 Expressway 或 RiPs 系统,英特龙生物技术公司(iNtRON Biotechnology)的 Genelator 系统,诺瓦基公司(Novagen)的EcoPro 或STP3 系统,普洛麦格公司(Promega)的TNT ‘ 快速偶联系统和凯杰公司(QIAGEN)的EasyXpress系统。产自培养物的肽或多肽可以是分 泌的或细胞内包含的多肽,这取决于序列和/或所用载体。本领域技术人员应理解,优选将 编码肽或多肽的表达载体设计成包含指导肽通过原核或真核细胞膜分泌的信号序列的形 式。其它构建物可包含利于肽或多肽纯化的氨基酸结构域。此类结构域包括但不限 于可在固化金属上进行纯化的金属螯合肽如组氨酸-色氨酸(如6X-HIS(SEQ ID NO 514))模块,可在固定免疫球蛋白上进行纯化的蛋白质A结构域,以及在FLAG 扩展/亲 和纯化系统(因缪耐斯集团,华盛顿州西雅图)(Immunex Corp.,Seattle, WA)中所用结构 域。可用的表位标签包括3XFLAG 、HA、VSV-G, V5、HSV、GST、GFP、MBP、GAL4 和 β -半乳 糖苷酶。有用的质粒包括含有生物素标签的质粒(如,普洛麦格公司的PinPoint 质粒), 含有钙调蛋白结合蛋白的质粒(如司查塔基公司的PCAL质粒),含有链霉亲和素结合肽的 质粒(如司查塔基公司的InterPlay 质粒),含有c-myc或FLAG 标签的质粒(如西格 玛奥德里奇公司的免疫沉淀质粒)或含有组氨酸标签的质粒(如凯杰公司的QIAExpress
17质粒)。为了利于纯化,可使用可切割的接头序列,如Xa因子或肠激酶(英骏公司,加州圣 地亚哥)的特异性接头序列。例如,载体在纯化结构域和肽或多肽间可包含一个或多个接 头。一方面,此类表达载体可用于表达包含本发明肽或多肽的融合蛋白,并提供编码硫氧 还蛋白或肠激酶切割位点前6组氨酸残基(SEQ ID NO 514)的核酸。组氨酸残基利于在 IMAC (固定金属离子亲和色谱柱,如Porath,J等(1992) Prot. Exp. Purif. 3 :263_281所述) 上纯化,而肠激酶切割位点则提供一种从融合蛋白中纯化肽或多肽的方法。Kroll,D.J.等 (1993 ;DNA Cell Biol. 12 :441_453)提供了关于包含融合蛋白的载体的讨论。可使用本领域通常所知方法产生本发明抗体,用于纯化或诊断技术。具体说,可根 据已知方法使用纯化的肽、多肽或多核苷酸产生抗体。此类抗体可包括但不限于多克隆、 单克隆、嵌合和单链抗体、Fab片段和Fab表达文库产生的片段。本发明尤其优选使用中和 抗体(即抑制功能的那些抗体)。为了产生抗体,可将具有免疫原性的肽、多肽、多核苷酸或其任何片段注射入不同 的宿主,包括山羊、兔、大鼠、人等,以进行免疫。根据宿主种类,可使用不同的佐剂以提高免 疫应答。此类佐剂包括但不限于福氏佐剂、矿物凝胶如氢氧化铝和表面活性物质如溶血卵 磷脂、普流罗尼克多元醇、聚阴离子、肽、油乳剂、钥孔血蓝素和二硝基酚。用于人的佐剂中, 尤其优选BCG (卡介苗)和短小棒状杆菌(Corynebacterium parvum)。用于诱导抗体的肽、多肽或片段优选具有包含至少5个氨基酸,更优选10个氨基 酸的氨基酸序列。优选的是,它们与天然蛋白质氨基酸序列的一部分相同,以及它们可包含 小的天然产生分子的完整氨基酸序列。可将氨基酸短臂与另一蛋白质如钥孔血蓝素以及抗 嵌合分子的抗体的短臂融合。使用通过连续培养细胞系产生抗体分子的任何技术制备单克隆抗体。这些技术包 括但不限于杂交瘤技术、人B细胞杂交瘤技术以及EBV杂交瘤技术(Kohler,G.等(1975) Nature 256 :495_497 ;Kozbor, D.等(1985)J.Immunol. Methods 81:31_42 ;Cote, R.J.等 (1983)Proc. Natl. Acad. Sci. 80 2026-2030 ;Cole, S. P.等(1984)Mol. Cell Biol. 62 109-120)。也可通过在淋巴细胞群中诱导体内产生或通过如文献所述方法筛选免疫球蛋白 文库或高特异性结合试剂板块产生抗体(Orlandi, R.等(1989) Proc. Natl. Acad. Sci. 86 3833-3837 ;Winter,G.等(1991)Nature 349 :293_299)。此外,也可使用某些技术产生“嵌合抗体”,如将抗体基因组合以获得具有合适 抗原特异性和生物学活性的分子(Morrison, S. L.等(1984)Proc. Natl. Acad. Sci. 81 6851-6855 ;Neuberger, M. S.等(1984)Nature 312 :604_608 ;Takeda, S.等(1985)Nature 314 452-454)。或者,可通过本领域所知方法改进用于产生单链抗体的技术,以产生特异性 单链抗体。具有相关特异性但独特型组成不同的抗体可通过随机组合免疫球蛋白文库的链 改组产生(BurtonD. R. (1991) Proc. Natl. Acad. Sci. 88 11120-3)。本发明相关领域的技术人员理解术语“双抗体”和“三抗体”。存在包含重链可变 结构域(VH)通过短肽接头与轻链可变结构域(VL)连接的分子,该短肽接头太短以至相同 链上的两个结构域间无法配对。这促使与一条或多条其它链的互补结构域配对,并促进形 成具有两个或多个功能性抗原结合位点的二聚体或三聚体分子。所得的抗体分子可以是单 特异性或多特异性的(如,双抗体的情况下具有双重特异性)。使用本发明涉及领域的标
18准方法,如Todorovska等(在癌症靶向中双抗体、三抗体和四抗体的设计和应用(Design and application of diabodies, triabodies and tetrabodies for cancertargeting). J. Immunol. Methods. 2001年2月1日;248(1-2) :47_66)所述,从两种或多种抗体产生此类 抗体分子。也可产生包含特异性结合位点的抗体片段。例如,此类片段包括但不限于可通过 胃蛋白酶消化抗体分子产生的F(ab' )2片段,以及通过还原F(ab' )2片段的二硫桥产生 的Fab片段。或者,可构建Fab表达文库以快速简便的鉴定具有所需特异性的单克隆Fab 片段(Huse, W. D.等(1989) Science254 1275-1281)。可使用不同免疫实验来筛选鉴定具有结合特异性的抗体。本领域熟知使用具有确 定特异性的多克隆或单克隆抗体进行竞争结合或免疫放射实验的多种实验方法。此类免疫 实验通常包括测定肽、多肽或多核苷酸和其特异性抗体间形成的复合物。优选使用与两个 非干扰表位具有反应性的单克隆抗体的双位点单克隆免疫实验,但也可使用竞争性结合实 验(Maddox,同上)。本文所述的信号肽能够进入细胞,因此可用作载体分子将抑制性分子递送到微生 物细胞中。将化合物偶联至氨基酸的化学方法已经得以很好的发展,可将多种不同的分子 类型与信号肽连接。最常见的偶联方法依赖于游离氨基(α-氨基或Lys)、巯基(Cys)或 羧酸基团(Asp、Glu或α-羧基)的存在。可使用偶联方法通过羧基-或氨基-末端残基 将肽连接至细胞抑制剂。在一些情况下,序列包含多个可与所选化学物质进行反应的残基。 可使用该方法生产包含多于一种细胞抑制剂的多聚物。或者,可缩短或选择肽或多肽,使反 应性残基位于序列的氨基或羧基末端。例如,在肽合成中可使用N- α -Fmoc-N ε -1- (4,4_ 二甲基_2,6 二氧代环亚 己-1-基-3-甲基丁基)-L-赖氨酸,将报告分子如荧光素特异性掺入到赖氨酸残基(Ono 等,1997)。合成后用胼处理去除4,4- 二甲基-2,6- 二氧代环亚己-1-基,偶联5-和6-羧 基荧光素琥珀酰亚胺酯。因此,通过在通透序列中包含赖氨酸残基,然后与合适的衍生化细 胞抑制剂反应,能够完成抑制剂分子与信号肽或多肽的偶联。还可使用EDC (盐酸1-乙基-3-(3-二甲基氨基丙基)碳二亚胺)或碳二亚胺偶 联方法。碳二亚胺可激活天门冬氨酸和谷氨酸的侧链羧基基团,以及羧基末端基团,使其成 为伯胺偶联的反应性位点。将活化的肽与细胞抑制剂混合以产生最终的偶联物。如果细胞 抑制剂首先被活化,那么EDC法将通过N末端α胺并且可能通过Lys侧链中的胺(如果存 在的话)偶联细胞抑制剂。间-马来酰亚胺基苯甲酰基-N-羟基琥珀酰亚胺酯(MBS)是异双功能试剂,可通 过半胱氨酸将肽连接于细胞抑制剂。半胱氨酸残基的硫醇基团参与偶联。如果所选序列不 包含Cys,通常将Cys残基放置于N-或C-末端以便在高度控制条件下连接肽与细胞抑制 剂。出于合成的目的,将半胱氨酸置于肽的N末端是有帮助的。MBS尤其适合用于本发明。戊二醛可用作通过其氨基将两个化合物连接的双功能偶联试剂。戊二醛在肽和细 胞抑制剂之间提供了高度灵活的间隔物,以利于呈现。戊二醛是反应性非常高的化合物,与 Cys、Tyr和His进行有限程度的反应。当肽在其氨基末端仅包含一个游离氨基时,戊二醛 偶联方法尤其有用。当肽包含不止一个游离氨基时,可形成大型多聚复合物。在一个方面,本发明的肽或多肽可融合于(如通过框内克隆)或连接于(如通过化学偶联)细胞抑制剂,如抗微生物试剂。其中包括抗微生物肽,例如杀菌/通透性增 加蛋白、阳离子抗微生物蛋白、溶菌酶、乳铁蛋白和犬科抗菌肽(cathelicidins)(如来 自中性粒细胞,参见例如 Hancock 禾口 Chappie,1999,Antimicrob. Agents Chemother. 43 1317-1323 ;Ganz 禾口 Lehrer,1997,Curr.Opin. Hemato1. 453-58 ;Hancock 等,1995,Adv. Microb. Physiol. 37 135-175)。抗微生物肽还包括防御素(如,来自上皮细胞或中性 粒细胞)和血小板杀微生物蛋白(参见例如,Hancock和Chappie,1999,Antimicrob. Agents Chemother. 43 :1317_1323)。其它抗微生物肽包括但不限于短杆菌肽S、杆菌肽、 多粘菌素B、鲎素、白细胞抗菌肽(bactenecin)(如,牛白细胞抗菌肽),牛蛙皮肤抗菌肽 (ranalexin)、天蚕素A(cecropin Α)、尹杜抗菌肽(indolicidin)(如牛尹杜抗菌肽)和乳 酸链球菌素(如细菌乳酸链球菌素)。抗微生物试剂还包括离子载体(ionophores),它利于离子(如钠)的穿越脂质屏 障如细胞膜进行传播。尤其适合本发明的两个离子载体化合物是RUMENSIN (礼来公司) (Eli Lilly)和拉沙里菌素(Lasalocid)(罗氏公司)(Hoffman LaRoche)。其它离子载体包 括但不限于盐霉素、阿伏霉素、阿瑞辛(aridcin)和阿克拉宁(actaplanin)。其他抗微生 物剂包括青霉素、莫能菌素 和阿奇霉素、甲硝唑、链霉素、卡那霉素和青霉素,以及β -内 酰胺类、氨基糖苷类、大环内酯类、氯霉素、新生霉素、利福平和氟喹诺酮(参见例如Horn 等,2003, Applied Environ. Microbiol. 69 74-83 ;Eckburg 等,2003, Infection Immunity 71 591-596 ;Gijzen 等,1991,Applied Environ. Microbiol. 57 1630-1634 ;Bonelo 等, 1984,FEMS Microbiol. Lett. 21 :341_345 ;Huser 等,1982,Arch. Microbiol. 132 :1_9 ; Hilpert 等,1981,Zentbl. Bakteriol. Mikrobiol. Hyg. IAbt Orig. C 2 :21_31)。尤其有用的抑制剂是阻断或干扰甲烷生成的化合物,包括溴代乙磺酸,如,2-溴代 乙磺酸(BES)或其盐,例如钠盐。钼酸钠(Mo)是硫酸还原抑制剂,可与溴代乙磺酸一起使 用。其它抗甲烷生成化合物包括但不限于硝酸、甲酸、甲基氟、三氯甲烷、水合氯醛、亚硫 酸钠、乙烯和不饱和烃、乙炔,脂肪酸如亚油酸,顺式油酸,饱和脂肪酸,如山嵛酸(behenic) 和硬脂酸,以及陆马嗪(lumazineM例如,2,4-二羟基蝶啶)。其它化合物包括3-溴丙磺 酸盐(BPS)、丙炔酸和2- 丁炔酸乙酯。抗微生物剂还包括裂解酶,包括溶菌酶、内溶素、溶菌酶、溶素、噬菌体溶素、溶肠 壁素、胞壁质酶和病毒溶素。有用的酶具有水解细菌细胞壁中特定键的能力。特定的裂解 酶包括但不限于葡萄糖苷酶,它水解肽聚糖中氨基糖(如N-乙酰基胞壁酸和N-乙酰基葡 糖胺)间的糖苷键;酰胺酶,它切割多糖链和交联肽之间的N-乙酰胞壁酰-L-丙氨酸的酰 胺连接;以及内肽酶,它水解肽间连接(如,半胱氨酸内肽酶),和内异肽酶,它攻击来自甲 烷杆菌科(Methanobacteriacaea)的产甲烷菌的假胞壁质。此外,PNA也包括作为抗微生物试剂。PNA是肽-核酸杂交物,其中磷酸主链被 获自N-(2-氨基乙基)-甘氨酸单位的非手性中性主链取代(参见例如优卡生物科学系 列(Eurekah Bioscience Collection)。人端粒酶的PNA和寡核苷酸抑制剂(PNA and Oligonucleotide Inhibitors of HumanTelomerase) · G. Gavory 禾口 S. Balasubramanian, 兰登生物科学公司(LandeSBiOSCience),2003)。通过亚甲羰基连接将A、G、Τ、C碱基连接 于主链的氨基氮上(P. Ε. Nielsen 等,Science 1991. 254 1497-1500 ;M. Egholm 等,Nature 1993. 365 566-568)。PNA以高特异性与互补序列结合,并且相对类似的DNA或RNA,PNA具有更高亲合力(M. Egholm等,同上)。与对应的DNA/DNA或DNA/RNA双链体相比,PNA/ DNA或PNA/RNA杂交物具有更高的热稳定性(M. Egholm等,同上)。由于非天然酰胺主链不 被核酶或蛋白酶识别,因而PNA还具有高的化学和生物学稳定性(V. Demidov等,Biochem Pharmacol 1994. 48 1310-1313)。通常PNA的长度至少为5个碱基,并包含末端赖氨酸。 可将 PNA PEG 化以进一步延长其寿命(Nielsen, P. Ε.等(1993) Anticancer Drug Des. 8 53-63)。在一个特定方面,本发明的肽或多肽可与细胞抑制剂如抗体或其片段融合(如通 过框架内克隆)或连接(如通过化学偶联)。抗体或抗体片段可靶向微生物细胞,或者特别 是产甲烷菌细胞,或一种或多种细胞组件。例如,可靶向细胞表面蛋白质,如受体。包括免 疫球蛋白分子和免疫球蛋白(Ig)分子的免疫活性部分,即包含特异性结合抗原(与其免疫 反应)的抗原结合位点的分子。本发明的肽或多肽在靶向微生物细胞,具体说是产甲烷菌细胞中尤其有用。在某 些方面,所述肽和多肽可用于结合细胞壁或细胞膜,和/或通透细胞。同样,可使用该肽或 多肽瞬时或长时间附着于细胞,或通透细胞壁或膜和/或在胞内环境中累积。应当理解的 是,本发明的肽、多肽,以及对应的多核苷酸、表达载体、宿主细胞和抗体可用于靶向多种微 生物,例如,反刍甲烷短杆菌和史氏甲烷短杆菌,前者是反刍动物中的常见产甲烷菌,后者 是人体的常见产甲烷菌。为了实施靶向,可将微生物细胞与信号肽或包含该肽的多肽接触, 如本文详述,所述肽或多肽可分离自一种或多种天然资源,或产自表达载体和/或宿主细 胞,或来自于合成或半合成化学方法。在特定方面,将该肽或多肽以本文详述的组合物形式 递送给对象,例如通过用于反刍动物的缓释装置递送。在某些实施方式中,将该多肽与细胞抑制剂融合或连接,所述细胞抑制剂包括例 如,抗-产甲烷生成化合物(如溴代乙磺酸),抗体或抗体片段,裂解酶,肽核酸,抗微生物肽 或其它抗生素。肽抑制剂或多肽抑制剂以组合物的形式递送给对象以抑制微生物细胞,具 体是产甲烷菌细胞的生长或复制。该组合物包含,例如a)分离的信号肽或包含此肽的多 肽,或其变化形式、片段、变体或衍生物;b)分离的多核苷酸,或其变化形式、片段、变体或 衍生物;c)包含此种多核苷酸的表达载体;或d)包含此种表达载体的宿主细胞。根据公开 的方法,本发明的组合物可专门包装为试剂盒的一部分,用于靶向、通透和/或抑制微生物 细胞,尤其是产甲烷菌细胞。该试剂盒包括至少一种本文所列组合物;以及用于通透产甲烷 菌或其它微生物细胞,或抑制其细胞生长或复制的使用说明。在另一实施方式中,本发明涉及上述任何方法所用的与药学上可接受载体联用的 药物组合物。此类药物组合物可包含信号肽或包含此肽的多肽和细胞抑制剂的组合。或 者,药物组合物可包含本文详述的表达载体或宿主细胞。可单独给予该组合物或与至少一 种其它药剂,如稳定化合物联合给予,可利用任何无菌的生物相容性药学载体,包括但不限 于盐水、缓冲盐水、右旋糖和水给与该组合物。该组合物可单独给予对象或与其它药剂、药 物(如抗微生物药物)或激素联合给予。除了活性成分,这些药物组合物还可包含合适的药学上可接受的载体,包括利 于将活性化合物加工成药学可用制剂的赋形剂和辅助剂。在最新版的雷明顿药物科学 (Remington' s Pharmaceutical Sciences)(宾夕法尼亚州伊斯顿的麦克出版公司(Maack Publishing Co. ,Easton,PA))可找到制剂和给药技术的更多细节。本发明使用的药物组合物可通过任何途径给予,包括但不限于口服、静脉内、肌肉内、动脉内、髓内、鞘内、心室内、 透皮、皮下、腹膜内、鼻内、肠内、局部、舌下或直肠方式。可使用本领域熟知的药学上可接受的载体,以口服给药合适剂量,配制用于口服 给药的药物组合物。此类载体使药物组合物可以配制为片剂、丸剂、糖衣剂、胶囊剂、液体、 凝胶剂、糖浆、浆液、混悬剂等,便于对象摄取。可通过以下方法获得口服用途的药物制剂 将活性化合物与固定赋形剂混合,任选将所得混合物研磨,在加入合适的辅助剂后将该混 合物加工成颗粒,获得片剂或糖衣剂芯体。合适的赋形剂是糖或蛋白质填充物,如糖,包括 乳糖、蔗糖、甘露醇或山梨糖醇;来自玉米、小麦、稻米、土豆或其它植物的淀粉;纤维素,如 甲基纤维素、羟丙基甲基-纤维素或羧甲基纤维素钠;胶质物,包括阿拉伯胶和黄芪胶;以 及蛋白质如明胶和胶原。需要的话,可加入崩解剂或增溶剂,如交联聚乙烯吡咯烷酮、琼脂、 藻酸或其盐,如藻酸钠。可口服使用的其它药物制剂包括明胶制成的压接(push-fit)胶囊,以及明胶和 包衣剂(coating)(如甘油或山梨糖醇)制成的密封软胶囊。压接胶囊可包含与填充剂或 粘合剂,如乳糖或淀粉;润滑剂,如滑石粉或硬脂酸镁以及任选稳定剂混合的活性组分。在 软胶囊中,活性化合物可溶解或悬浮于含有或不含稳定剂的合适液体,如脂肪油、液体或液 体聚乙二醇中。糖衣剂芯体可与合适的包衣剂,如浓缩糖溶液联合使用,其中还可包含阿拉 伯胶、滑石粉、聚乙烯吡咯烷酮、卡波姆凝胶、聚乙二醇和/或二氧化钛、漆溶液和合适的有 机溶剂或溶剂混合物。可将染料或颜料加入片剂或糖衣剂包衣中,用于标示产品或表征活 性化合物的量,即剂量。可用水性溶液,优选生理相容性缓冲液,如汉克斯溶液、林格溶液或生理缓冲盐水 配制适合胃肠道外给药的药物制剂。水性注射悬液可包含增加悬液粘度的物质,如羧甲基 纤维素钠、山梨糖醇或右旋糖苷。此外,活性化合物的悬液可制备为合适的油性注射悬液。 合适的亲脂性溶剂或运载体包括脂肪油如芝麻油,或合成脂肪酸酯如油酸乙酯或甘油三 酯,或脂质体。也可使用非脂质聚阳离子氨基酸聚合物进行递送。悬液可任选包含合适的 稳定剂或增加化合物溶解度以制备高浓缩溶液的试剂。对于局部或鼻腔给药,在制剂中使 用适合要渗透的特定屏障的渗透剂。本领域通常了解此类渗透剂。本发明的药物组合物可以本领域所知方式制造,如,通过常规的混合、溶解、造粒、 制造糖衣剂、水飞、乳化、包胶、包封或冻干工艺的方法。可以盐的形式提供药物组合物,所 述盐可用多种酸形成,包括但不限于盐酸、硫酸、乙酸、乳酸、酒石酸、苹果酸、琥珀酸等。在 水性或其它质子溶剂中盐比对应的游离碱形式更易于溶解。在其它情况下,优选制剂可以 是包含下列任何或所有成分的冻干粉末l_50mM组氨酸、0. 1% -2%蔗糖和2_7%甘露醇, PH范围为4. 5-5. 5,在使用前与缓冲液组合。药物组合物制备后,可将其放置于合适的容器 中,并贴上用于治疗所示病症的标签。对于本发明组合物的给药,此标签可包含给药量、频 率和方法。适用于本发明的药物组合物包括包含有效量活性组分以达到预期目的的组合物。 对于任何化合物,最初可在细胞实验中,如微生物细胞或具体说,在产甲烷菌细胞中,或在 动物模型中,通常是小鼠、兔、狗或猪或反刍动物如绵羊、牛、鹿或山羊中估计治疗有效剂 量。还可使用动物模型确定合适的浓度范围和给药途径。此类信息还可用于确定可用于某 对象的给药剂量或途径。通常给药剂量可以是0.1-100,000微克,甚至总剂量约为lg,这取
22决于给药途径。文献中提供了有关具体剂量和递送方法的指南,本领域实施人员可获得这 些指南。与递送肽或多肽相比,本领域熟练技术人员将使用不同制剂递送多核苷酸。相似 地,多核苷酸或多肽的递送对于特定细胞、病症、位置等而言是不同的。基于肽和多肽的疗法众所周知,并且本领域已建立此类组合物的制备方法。示范 性的肽和多肽疗法及其制备方法已有记载,例如白介素融合毒素(denileukin difitox)、 奥曲肽、伐普肽、兰瑞肽、RC-3940系列肽、达必佳、醋酸亮丙瑞林(Iupron)、瑞林、西曲 瑞克(参见例如,Lu等,2006,AAPSJ 8 :E466_472),亥莫西汀(hemocidins),司他弗平 (staphopains)(参见例如,Dubin 等,2005,Acta Biochemical Polonica, 52 :633_638),以 及吲哚西汀(indolicidin),防御素,羊毛硫抗生素,微西汀B17 (microcidin B17),富组蛋 白(histatins)禾口吗力口宁(maganin)(参见例如,Yeaman禾口 Yount,2003,Pharmacol Rev 55 27-55)。在 Degim 等,2007,Curr Pharm Des 13 :99_117 和 Shai 等,2006,Curr Prot Pept Sci, 7:479-486中能够找到肽和多肽疗法的一般性指南。最近批准的基于肽的药物包括 Hematide (合成的基于肽的红细胞生成刺激剂,埃非麦克司公司(Affymax,Inc.)),艾塞 那肽(Exenatide)(合成的肠促胰岛素类似物(exendin) _4,爱麦林/礼来公司(Amylin/Eli Lilly), Natrecor (奈西立肽(nesiritide),奈西立肽,司可奥斯公司(Scios)),普来纳西 (Plenaxis)(阿巴瑞克,普瑞西斯制药公司(PraecisPharmaceuticals))和 SecreFlo (促胰 液素,瑞普里根公司(R印Iigen))。实施者根据需要治疗对象相关的因素确定准确剂量。对剂量和给药进行调整以提 供足够水平的活性试剂或维持所需效果。需要考虑的因素包括疾病状况的严重性、对象的 总体健康状况、对象的年龄、体重和性别、饮食、给药的时间和频率、联合用药、对治疗的反 应敏感性以及耐受/响应。根据特定制剂的半衰期和清除率,长效药物组合物可每3-4天, 每周或每两周给予一次。本发明组合物(如药物组合物)尤其有用的是缓释配方或原理。例如,瘤胃内装 置包括但不限于新西兰埃格瑞饲料公司(Agri-Feeds Ltd.,NewZealand)时间胶囊 丸 范围,最初由新西兰爱吉研究公司开发(AgResearchLtd.,New Zealand),如WO 95/19763 和NZ 278977所公开的,以及新西兰奥克兰的纽法姆公司的分支机构纽法姆健康和科 学公司的 CAPTEC(Nufarm Health&Sciences, a division of Nufarm Ltd. , Auckland, NewZealand),如 AU 35908178, PCT/AU81/100082 和 Laby 等,1984,Can. J. Anim. Sci. 64 (增 刊)337-8所公开的,将所有这些参考文献纳入本文作参考。作为特定的例子,该装置可包 括弹簧和柱塞,迫使组合物穿过同末端的孔。作为另一实施方式,本发明涉及作为水补充物的组合物如进水组合物,和食物补 充剂如反刍动物饲料组分,用于上述任何方法。在特定方面,食物补充剂包含至少一种可食 用的植物材料以及本发明的肽或多肽。或者,食物补充剂包含至少一种可食用的植物材料 以及本文公开的肽或多肽,或编码本文公开的肽或多肽的多核苷酸,例如,表达载体或含有 表达载体的宿主细胞的形式。具体说,组合物还包含与所得序列融合或连接的细胞抑制剂。 优选的植物材料包括干草、草、谷物或粗磨粉中的任一种,例如,豆科干草、禾本科干草、玉 米青贮、禾本青贮、豆科青贮、玉米粒、燕麦、大麦、酿酒谷物、啤酒谷物、大豆粗磨粉和棉籽 粗磨粉。具体说,禾本青贮可用作反刍动物的食物组合物。可对植物材料进行遗传改造,使 其包含本发明的一种或多种组分,如一种或多种多肽或肽、多核苷酸或载体。
在另一实施方式中,特异性结合本发明肽、多肽或多核苷酸的抗体可在监测微生 物水平的实验种用于测定该微生物,尤其是产甲烷菌的存在。同上所述可以相同的方法制 备用于诊断目的的抗体。诊断实验包括使用抗体和标签检测人体体液或细胞或组织提取物 中肽或多肽的方法。可使用修饰或未修饰的抗体,通过共价或非共价方式将报告分子与其 结合进行标记。可使用本领域所知的多种不同的报告分子,上文对其中几个进行了描述。本领域已知用于测量肽、多肽或多核苷酸水平的多种实验方案(如ELISA、RIA、 FACS和印迹),为测定微生物,尤其是产甲烷菌的存在或水平提供了基础。通过在适合形成 复合物的条件下将来自正常对象如正常人或反刍动物的体液或细胞提取物与抗体组合,从 而确定正常或标准水平。利用各种方法可对标准复合物的形成量进行定量,但优选分光光 度法。将对象、对照和治疗样品(如来自治疗对象的样品)中表达的肽、多肽或多核苷酸的 量与标准值进行比较。标准值和对象值之间的偏差确定了用于测定微生物存在或水平的参 数。在本发明的一个特定实施方式中,通过使用特定杂交和/或扩增技术,可将多核 苷酸用于诊断目的。可使用的多核苷酸包括寡核苷酸、互补RNA和DNA分子和PNA。多核苷 酸可用于检测或定量测定样品中的基因表达,其中表达与微生物的存在或水平相关。可使 用诊断实验区分微生物水平的不存在、存在和改变,并在治疗干预中监测水平。在一个方面,可利用与PCR探针的杂交鉴定核酸序列,尤其是基因组序列,其编码 本发明的肽或多肽。无论探针产生于高度特异性的区域,如5’调节区的10个独特核苷酸, 或者较低特异性的区域,如3'编码区,探针的特异性以及杂交或扩增的严谨性(最大、高、 中等或低)将决定该探针是否仅仅识别天然产生的序列、等位基因或相关序列。探针也可 用于检测相关序列,并应该优选包含来自任何编码序列的至少50%核苷酸。本发明的杂交 探针可以是DNA或RNA,并来源于核苷酸序列SEQ ID NO 173-341或342-533或其互补或 修饰序列,或来自于包含天然产生序列的启动子、增强元件和内含子的基因组序列。用于产生特异性DNA杂交探针的方法包括将核酸序列克隆入载体以产生mRNA探 针。本领域了解此类载体,它们可购得,并且通过加入合适的RNA聚合酶和合适的标记核苷 酸可将它们用于体外合成RNA探针。可通过多种报告基团对杂交探针进行标记,这些报告 基团例如放射性核素如32P或35S,或酶标记,如通过亲和素/生物素偶联系统偶联至探针的 碱性磷酸酶等。多核苷酸可用于Southern或northern分析,点印迹或其它基于膜的技术; 用于PCR技术;或者用于试纸条、狭缝、ELISA实验或微阵列,用来自对象活检的液体或组织 检测微生物的存在和水平。本领域熟知此类定性或定量的方法。在一个特定方面,核酸序列可用于各种标准方法标记的实验,并在适合杂交和/ 或扩增的条件下加入来自对象的液体或组织。孵育合适的时间后,洗涤样品,对信号进行定 量并与标准值比较。如果受试样品的信号量与可比较的对照样品的信号量相比发生了显著 的改变,那么样品中出现核苷酸序列水平的改变表明微生物的出现或水平。还可使用此类 实验评价特定治疗方案在动物研究、临床实验或者监测对象治疗中的效果。为了提供微生物出现或水平的诊断基础,需确定表达的正常或标准特征。通过在 适合杂交和/或扩增的条件下,将来自正常对象的体液或细胞提取物与多核苷酸或其片段 混合,来完成这项实验。通过比较获自正常对象的值与获自使用已知量基本纯化多核苷酸 的实验中的值,可对标准水平进行定量。可将来自正常样品的标准值与来自针对微生物生长进行治疗的对象的值进行比较。利用标准值和对象值之间的偏差测定微生物的存在或水平。一旦鉴定了微生物并开始了治疗方案,则在常规基础上进行重复的杂交和/或扩 增实验以评价相对于正常对象中观察到的表达水平,对象中的表达水平是否开始降低。来 自连续实验的结果可用于显示从数天到数月的治疗期间的效果。由核酸序列设计的寡核苷酸的特定诊断用途可包括使用PCR。此类寡聚体可以是 化学合成、酶学方法产生或体外产生的。寡聚体优选由两个核苷酸序列组成,一个为正义方 向(5' ->3'),另一个为反义方向(3' ->5'),在为鉴定具体基因或条件的优化条 件下使用。在用于检测和/或定量测定紧密相关的DNA或RNA序列的较低严谨性条件下, 使用相同的两种寡聚物,巢式寡聚物集合或寡聚物简并库。可用于定量测定表达的方法包括放射性标记或生物素化核苷酸,对照核酸共 扩增以及可通过插值获得实验结果插值的标准曲线(Melby,P. C.等(1993) J. Immunol. Methods,159 :235-244 ;Duplaa,C.等(1993) Anal. Biochem. 229-236)。可通过以 ELISA 形 式进行实验加快多个样品的定量速度,其中感兴趣的寡聚物以各种稀释度出现,通过分光 光度法或比色法进行快度定量。在另外的实施方式中,源自本发明所述任何多核苷酸的寡核苷酸或更长的片段可 用作微阵列中的靶点。可使用微阵列同时监测大量基因的表达水平(产生转录物图像), 并鉴定遗传变体、突变和多态性。可使用该信息确定基因功能,了解疾病的遗传学基础, 诊断疾病,开发并监测治疗剂活性。在一个实施方式中,根据本领域所知方法制备和使用 微阵列,如 PCT 申请 WO 95/11995 (Chee 等),Lockhart, D. J.等(1996 ;Nat. Biotech. 14: 1675-1680)以及 Schena,M.等(1996 ;Proc. Natl. Acad. Sci. 93 10614-10619)所述。在一个方面,可使用化学偶联步骤和喷墨打印应用设备,如PCT申请WO 95/251116 (Baldeschweiler等)所述在微阵列表面合成寡核苷酸。在另一方面, 可使用类似于斑点或狭缝印迹的“网状”阵列(HYBRID0T设备,生命科技公司(Life Technologies)),利用真空系统、热、UV、机械或化学连接步骤将cDNA片段或寡核苷酸安置 和连接至基材表面。在另一方面,可手工或利用可获得的设备、材料或机器(包括多道移液 器或机器人仪器;布林克曼公司,韦斯特伯里,纽约州(Brinkmarm,ffestbury, N. Y.))生产 阵列,该阵列可包含例如8、24、96、384、1536或6144个寡核苷酸,或从2_1,000, 000的任何 倍数,以便充分利用市售仪器。为了用微阵列进行样品分析,从生物制品中抽提多核苷酸。可从任何体液(血液、 尿液、唾液、痰、胃液等),培养细胞,活检物或其它组织制备物中获取生物样品。为了生产探 针,使用抽提自样品的多核苷酸产生与阵列上核酸互补的核酸序列。如果微阵列由cDNA组 成,则反义RNA是合适的探针。因此,在一个方面,使用mRNA产生cDNA,进而在荧光核苷酸 存在下用cDNA产生片段或反义RNA探针。将这些荧光标记的探针与微阵列孵育,以使探针 序列与微阵列的cDNA寡核苷酸杂交。在另一方面,用作探针的核酸序列可包含使用杂交技 术领域熟知的限制酶、PCR技术和寡聚物标记试剂盒(安法马西亚生物技术公司(Amersham Pharmacia Biotech))产生的多核苷酸、片段和互补或反义序列。在本发明的另一实施方式中,可利用本发明的肽或多肽、或其功能性或免疫原性 片段或寡肽通过任何药物筛选技术筛选化合物文库。此类筛选所用片段可在溶液中游离,
25附加于固体支持物、携带于细胞表面或定位于细胞内部。可检测肽或多肽和受试物间的结 合复合物的形成。公开的PCT申请WO 84/03564描述了一种药物筛选技术,它可用于高通量筛选对 感兴趣肽或多肽具有合适亲和力的化合物。在该方法中,在固体基质如塑料针或一些其它 表面上合成大量不同的小受试化合物。受试化合物与肽或多肽或其片段反应,然后洗涤。然 后利用本领域熟知方法检测结合的肽或多肽。还可将纯化的肽或多肽直接包被在板上,用 于上述药物筛选技术。或者,可使用非中和抗体捕获肽并将其固定到固体支持物上。在另一项技术中,可使用竞争性药物筛选实验,其中能够结合肽或多肽的中和抗 体与受试化合物特异性竞争结合所述肽或多肽。以此方式,可使用该抗体检测与该抗体具 有相同的一个或多个抗原结合位点的受试化合物的存在。实施例本文所述实施例用以解释本发明的实施方式。其它实施方式、方法和分析类型在 分子诊断领域的一般技术人员技术范围内,无需在此赘述。其它本领域范围内的实施方式 也应作为本发明的一部分。实施例1 材料和方法基因组大小估测反刍甲烷短杆菌(Methanobrevibacter ruminantium)菌株 MIt(DSM1093)生长 于BY+培养基中(基本培养基,Joblin等,1990),该培养基由[g/l]NaCl (1)、KH2PO4 (0. 5)、 (NH4) 2S04 (0. 25)、CaCl2. 2H20 (0. 13)、MgSO4. 7H20 (0. 2)、K2HPO4(I)、澄清反刍液(300ml)、 dH20 (360ml)、NaHCO3 (5)、刃天青(0. 2ml)、L-盐酸半胱氨酸(0. 5)、酵母提取物(2)以 及巴赫微量元素溶液(IOml)(加入微量元素;Balch等,1979)组成,由(g/Ι)三乙酸腈 (1. 5)、MgSO4. 7H20(3)、MnSO4. H2O (0. 5)、NaCl (1)、FeSO4. 7H20(0. 1)、CoCl2. 6H20(0. 1)、 CaCl2 (0. 1)、ZnSO4. 7Η20(0· 1)、CuSO4. 5Η20(0· 01)、AlK(SO4)2. 12Η20(0· 01)、H3BO3 (0. 01)、 Na2MoO4. 2Η20(0. 01) ,NiSO4. 6Η20(0. 03) ,Na2SeO3(0. 02)和 Na2WO4. 2Η20(0. 02)组成。用冷冻 研磨法提取基因组DNA。离心收集细胞,将细胞团块放置在预冷的研钵中,用液氮冻结,然 后用预冷的无菌研钵和杵温和研磨成细粉。将细胞勻浆液包埋于琼脂糖塞中,后续操作在 栓中进行以减少对基因组DNA的物理剪切。用限制性核酸内切酶进行消化,用脉冲场电泳 (PFGE)分离DNA片段。DNA克隆和测序安进科生物科学公司(美国麻省)(Agencourt Biosciences Corporation (Massachusetts, USA))使用随机鸟枪克隆方案(Fleischmann 等,1995),马克 基因公司(美国马里兰州洛克维尔)(Macrogen Corporation(Rockville,MD,USA))使用焦 磷酸测序对反刍甲烷短杆菌的基因组DNA进行测序。通过随机物理破坏基因组DNA和电泳 分离片段在大肠杆菌中构建反刍甲烷短杆菌的DNA文库。从凝胶中回收40Kb范围内的大 片段,并用于产生大的插入f粘粒文库。回收2-4kb范围的DNA片段并用于产生小的插入 质粒文库。培养大和小的插入文库所得的克隆,回收其f粘粒或质粒DNA并用高通量测序 技术进行测序。对足够数量的克隆进行测序以达到对反刍甲烷短杆菌基因组理论上8倍的 覆盖。在随机剪切的基因组DNA片段上进行焦磷酸测序,并达到理论上10倍的覆盖。序列组装和分析
26
比对DNA序列以找到交叠序列,并利用帕拉赛基因组组装者(ParaceIGenome Assembler)(帕拉赛公司,加利福尼亚州,美国)(Paracel Inc, CA, USA)和Staden软件 包(Staden等,1998),与来自标准和反向PCR的序列组合组装成毗连序列(毗连群)。使 用开放阅读框(ORF)寻找器GLIMMER (基因定位插值马尔可夫模型ER) (Gene Locator Interpolated Markov Model ER, Salzberg 等,1998)分析毗连群,利用 BLAST (基础本地比 对搜索工具(gasicLocal Alignment Search Tool) (Altschul 等,1997)在国家生物技术信 息中心(National Center for Biotechnology Information) (NCBI)的非冗余核苷酸和蛋 白质数据库中对每一 ORF进行分析。通过以随机方式人工连接来自8倍草图噬菌体序列的毗连群产生“假分子”,并 提交给基因组研究所(The Institute for Genomic Research) (TIGR,美国华盛顿特区) (TIGR, DC, USA)进行自动注释。用GLIMMER对来自10倍焦磷酸测序组装的毗连群再次 进行分析,并且用GAMOLA(复杂现场Blast DNA序列全局注释(Global Annotation of Multiplexed On-site BlastedDNA sequences) ;Altermann 禾口 Klaenhammer, 2003)对 ORF 进行自动注释。随后对自动注释进行人工校验。利用直系同源蛋白聚类(COG)数据库,根 据功能对ORF分类(阈值le-02) (Tatusov等,2001)。分别利用全局和局部比对(http //pfam. wustl. edu)以及标准和片段模式 TIGRFAM HMM 模型(http://www. tigr. org/TIGRFAMs)(阈值 le_02),使用 PFAM HMM 和 TIGRFAM文库通过HMMER(http://hmmer. wustl. edu)对蛋白基序进行确定。用 TRNASCAN-SE 鉴定tRNA(Lowe和Eddy, 1997),用K0D0N软件包(应用数学公司,美国得克萨斯州奥斯 汀)(Applied Maths, Austin, TX, USA)禾Π REPUTER(Kurtz 禾Π Schleiermacher,1999)鉴 定核苷酸重复。用GENEWIZ构建基因组图谱(Jensen等,1999)。利用内部开发的软件 (PathwayVoyager ;Altermann 和 Klaenhammer,2005),从预测的反刍甲烷短杆菌 ORF 组 和 KEGG(京都基因与基因组百科全书)(KyotoEncyclopedia of Genes and Genomes, Kanehisa等,2004)在线数据库重建通路。信号肽鉴定迄今为止,尚未出现古细菌(archaea)的信号肽模型。由于经实验验证的可用于 古细菌的分泌蛋白数量太少,使得难以训练特定模型。因此,用格兰阳性菌、格兰尹相杰和 真核模型训练的SignalP 3. O版(Bendtsen等,2004)分析开放阅读框(ORF)序列中是否 存在信号肽。利用SignalP-HMM(隐马尔可夫模型)区别信号肽和非信号肽0RF,而利用 SignalP-NN(神经网络)预测切割位点,如Emanuelsson等,2007所述。SignalP预测来自不同生物体的氨基酸序列中信号肽切割位点的存在和位置。该 方法根据几种人工神经网络和隐马尔可夫模型,引入对切割位点的预测和信号肽/非信号 肽预测。比对从革兰阳性数据组鉴定的信号肽序列,用Vector NTI的AlignX程序(9. 1. O 版,英骏公司(Invitrogen Corporation))计算共有序列。通过分析氨基酸疏水性鉴定保 守性疏水核心。由全部3个SignalP模型鉴定共有数据组,用ClustalW比对相应的信号肽序列 (Larkin 等,2007)并用 BioEdit (http://www. mbio. ncsu. edu/BioEdit/bioedit. html)进 行编辑。用LogoBar产生蛋白序列标识(图3A) (Perez-Bercoff等,2006),以表现这种多 序列比对中产生的信息。在本研究中,含有信号肽和三个或多个跨膜结构域的ORF被认为是膜蛋白并且不进行进一步分析。3个模型各自的最佳Y-评分被视为推定切割位点(图 6)。根据大肠杆菌(Escherichia coli)K12密码子表,用内嵌perl脚本opt_codons. Pl (Altermann, Ε)计算优化的密码子使用(图9)。肽合成和荧光素标记可利用英骏公司(Invitrogen)为市场提供的定制肽服务(英骏有限公司 (Invitrogen NZ Ltd))合成核心共有肽。用Fmoc化学方法小规模(10-12mg)合成肽,通过 HPLC纯化至纯度>95%。用荧光素在该肽的N末端赖氨酸(K)上进行标记。细胞通透实验用荧光实验跟踪标记肽进入反刍甲烷短杆菌的过程。在IOml BY+培养基中培养 反刍甲烷短杆菌,通过4°C、10,OOOxg离心10分钟收集细胞。将细胞转移至1. 5ml聚丙烯 EP管中,用Iml TE缓冲液(IOmM Tris_HCl,ImM乙二胺四乙酸,pH 8)洗涤,在微型离心机 中以13,000xg、4°C离心10分钟收集细胞。将细胞(约1 X IO8)重悬于总体积200 μ 1的TE 缓冲液中,加入20 μ g荧光素标记肽。37°C培育该混合物30分钟,然后以13,000xg、4°C离 心10分钟。细胞团块上方残留的液体构成上清液组分。用200 μ 1 TE缓冲液洗涤细胞团 块3次(用缓冲液重复重悬细胞),以13,000xg、4°C离心10分钟。汇集洗液,其构成细胞洗液组分。将第三次洗涤后剩余的细胞团块重悬于200μ 1 含有十二烷基硫酸钠的TE缓冲液中。以13,000xg、4°C离心细胞10分钟以沉淀细胞,收 集细胞团块上方的液体,其构成细胞相连组分。用液氮冻结剩余的细胞团块,用玻璃棒研磨 冻结的细胞团块以便物理破碎细胞。所得细胞勻浆物以20,000xg、4°C离心30分钟。收集 细胞团块上方的液体,其构成细胞内组分,而将其余的沉淀物质重悬于TE缓冲液,其构成 细胞壁/膜组分。将每种组分的样品密封在玻璃毛细管中,并利用光循环器(Lightcycler) (罗氏公司(Roche))的荧光检测器(通道1)根据荧光素标记肽标准品在510-533nm测定 发射荧光,从而测定这些组分各自的荧光。实施例2:实验结果通过限制性酶消化基因组DNA和通过PFGE测定片段大小进行反刍甲烷短杆 菌基因组大小的估测,表明单条染色体大小约2. 5-2. 9Mb。大和小插入克隆的初始测序 (6倍草图覆盖)以及将序列组装为毗连群表明基因组中40Kb的区域出现频率非常高 (over-r印resented) (> 20倍),特别是在小插入物文库中。因为这种巨大序列偏向,所以 仅对大插入克隆进行再次测序(2倍理论基因组覆盖),从Sanger测序中产生最终的8倍 覆盖。将8倍草图阶段(phase)序列组装为通过105个支架连接的756个毗连群。进一步 进行焦磷酸测序,以实现额外约10倍的覆盖,将这些序列掺入组装物使毗连群的数目降至 27。使用反向和长范围PCR技术的后续缺口连接过程使毗连群数目降至14。该14-毗连群序列的合并长度表明,该基因组略大(2,937,347bp)于PFGE估计的 大小(图1A),显著大于其最接近的亲缘菌史氏甲烷短杆菌(M. smithii) (1. 9Mb)。32. 64% 的% G+C接近反刍甲烷短杆菌菌株的报道范围27. 5%-31.6% (Balch等,1979)。序列分 析预测到2,239个0RF,图IB报道蛋白质家族命中(TIGRFam和PFam)和直向同源组类群 (COG)的总数。这里列出了预测参与由吐+0)2和甲酸生成甲烷的所有基因(图1C)。然而, 反刍甲烷短杆菌的草图序列缺少甲基辅酶还原酶II (mcr II或mrt)系统。在其它产甲烷 菌中,mcrll类群编码甲基CoM还原酶I酶的同工酶,它在H2分压较高的生长条件下上调
28(Reeve等,1997)。H2在瘤胃中快速使用,不会累积至高水平,因此反刍甲烷短杆菌似乎能 适应只通过mcr I系统利用低水平的H2。在反刍甲烷短杆菌基因组中共鉴定到169个含信号肽的ORF (图7)。其中,通过所 有三个SignalP模型鉴定了 102种信号肽,并比对了这些信号肽的氨基酸序列(图2),产 生和蛋白质序列标识(图3A)。鉴定到17个疏水氨基酸的核心序列(KKIIIILLLLILLLISI ; SEQ ID N0:119)。用SignalP-HMM计算某序列是否含有信号肽的概率。此信号肽概率是介 于0和1之间的值,0.5定义为该分析区分信号肽和非信号肽的截止值。SignalP-NN Y-评 分给出切割掉SP时的最佳估计值(图6)。Y-评分定义为SignalP-NN产生的C-评分(原 始切割位点评分)的几何平均值和S-评分(信号肽评分)的平滑斜率。Y评分是介于0和 1之间的值,该评分越高,表明切割位点预测结果越好。合成共有氨基酸序列(图3C)并通过额外的N末端赖氨酸残基将其偶联于荧光标 签荧光素(图3D),得到最终长度为17个氨基酸的肽。监测纯化的FITC-肽通透反刍甲烷 短杆菌的能力(图4)。在反刍甲烷短杆菌细胞通透实验中,37°C培育30分钟后,23.5%的 肽保留在未连接于细胞的上清液组分中。可通过3次缓冲液洗涤从细胞获得另外3. 4%的 肽。用SDS提取细胞后回收到约62. 9%的肽,这表明大部分肽是细胞相连的。在其余 肽中,在细胞内组分中发现5.8%,在细胞壁/膜组分中发现4.4%。因此,初始肽中5. 8% (等于1. 16 μ g)能够结合反刍甲烷短杆菌并穿过细胞膜进入细胞质,对每个细胞而言,这 类肽约有2. 3 X IO6个分子。实施例3:概述选择反刍甲烷短杆菌进行基因组测序是因为它在各种饲养条件下的反刍动物瘤 胃中广泛存在(基于培养和分子检测数据),容易获得培养物,易于进行实验室常规培养以 及可获得关于这种有机体的大量的前期研究数据和背景文献。已经为反刍甲烷短杆菌内大 量序列指定功能,从而对瘤胃内此种有机体的生活方式进行详细描述。反刍甲烷短杆菌对 简单底物(H2+co2,甲酸)的依赖性以及它通过表面蛋白和外泌多糖与瘤胃环境的相互作用 是重要的抑制靶点。这些序列数据阐明了此种生物体的代谢机制和它与其它微生物相互作 用的方式,并且指出产甲烷菌中的保守性系统和组件,可对这些系统和组件进行灭活以消 除或减少瘤胃中形成的甲烷。参考文献Altermann E,Klaenhammer TR(2005)通路探险人用京都基因和基因组(KEGG) 百禾斗全书数据库进行通路作图(PathwayVoyager :pathwaymapping using the Kyoto Encyclopedia of Genes and Genomes (KEGG) database). BMC Genomics 6:60-66。Altermann, E.和 Τ. R. Klaenhammer. 2003. GAMOLA 序列注释以及对原核基因 组草图和完成序列进行分析的新的本地解决方案(GAM0LA :anew local solution for sequence annotation and analyzing draft and finishedprokaryotic genomes),Qmics 7 :161-169oAltschul SF, Madden TL, Schaffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ(1997),缺口 BLAST和PSI-BLAST 新一代的蛋白数据库检索程序(Gapped BLAST and PSI-BLAST a new generation of protein databasesearch programs). Nucleic Acids Research 25,3389-3402。
Balch WE, Fox GE, Magrum LJ, Woese CR, Wolfe RS (1979)产甲烷菌一个独特 生物学群体的重新评估(Methanogens :reevaluation of a uniquebiological group). Microbiological Reviews 43,260-296。Baresi, L.和Bertani,G. 1984.分离一种产甲烧菌的细菌噬菌体(Isolation of a bacteriophage for a methanogenic bacterium),干丨」于〈〈美国微生物协会年会摘要〉〉 (Abstracts of the Annual Meeting of the American Society forMicrobiology),华盛 顿特区,美国微生物协会(Washington DC =AmericanSociety for Microbiology),第 133 页。Bendtsen, J. D.,Nielsen, H.,von Heijne, G.和 Brunak,S. 2004.改良的信号月太 预 贝Ij方法SignalP 3. O (Improved prediction of signal peptides :SignalP3. 0). J Mol Biol. 16(4) :783-95oBickle, T. A.禾Π D. H. Kruger. 1993,DNA 限制性生物学(Biology of DNArestriction). Microbiol. Rev. 57 :434_450。Bult CJ等(1996)产甲烷古细菌詹氏产甲烷菌的完整基因组序列(Complete genome sequence of the methanogenic archaeon, Methanococcusjannaschii). Science 273,1058-1073。Coutinho PM, Henrissat B(1999)碳水化合物-活性酶整合数据方案.“碳
工iiMifii皿,,(Carbohydrate-active enzymes :anintegrated database approach. 'Recent Advances in CarbohydrateBioengineering')(HJ Gilbert,G Davies, B Henrissat禾口B Svensson编)3-12皇家化学会,剑桥(The Royal Society of Chemistry, Cambridge) ( Wi /K it ya ^ ^ ^MWiM W- (Carbohydrate Active Enzymes database), http://www, cazy. org/)。Delcher AL, Harmon D, Kasif S, White O, Salzberg SL (1999)用 GLIMMER 提高微 生物基因识别(Improved microbial gene identification withGLIMMER). Nucleic Acids Research 27,4636-4641。Emanue Is son, 0. , Brunak, S. , von Heijne, G.禾口 Nielsen, H. 2007.用 TargetP、 SignalP和相关工具在细胞中定位蛋白质(Locating proteins in thecell using TargetP, SignalP and related tools). Nat Protoc.2 (4) :953_71。Fleischmann等,1995,流感嗜血杆菌Rd的全基因组测序和组装(Whole-genome random sequencing and assembly of Haemophilus infIuenzaeRd). Science 269, 496-512。Fricke WF,Seedorf H,Henne A,Kruer M, Liesegang H, Hedderich R,Gottschalk G,Thauer RK(2006)斯氏甲烷球形菌基因组序列揭示为什么人小肠古菌仅限于用甲醇和 H2 形成甲焼禾口合成 ATP (The genome sequenceof Methanosphaera stadtmanae reveals why this human intestinal archaeon isrestricted to methanol and H2 for methane formation and ATP synthesis). Journal of Bacteriology 188,642_658。Galagm等2002.醋酸甲烷八叠球菌基因组揭示出广泛的代谢和生理多样 性(The genome of Methanosarcina acetivorans reveals extensivemetabolic and physiological diversity). Genome Res. 12 :532_5420
Godde JS, Bickerton A(2006)称为CRISPR的重复性DNAe及其相关基因原核 动物间水平转移的证据(The repetitive DNAe called CRISPRs andtheir associated genes-evidence of horizontal transfer among prokaryotes. )Journal of Molecular Evolution 62,718-729。Haft DH, Selengut J, Mongodin EF, Nelson KE(2005)原核基因组中 45 个CRISIS相关(Cas)蛋白质家族和多种CRISPR/Cas亚型的指南(a guild of45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cassubtypes exist in prokaryotic genomes). PLoS Computational Biologyl :474_483。Hamilton,P. T.和J. N. Reeve. 1985.由嗜温和嗜热产甲烷菌克隆的古菌基因的序 列差异性(Sequence divergence of an archaebacterial gene clonedfrom a mesophilic and a thermophilic methanogen) · J. Mol. Evol. 22 :351_360oJansen R,Embden JD, Gaastra W, Schouls LM(2002)原核细胞中 DNA 重复相 关基因的鉴定(Identification of genes that are associated with DNArepeats in prokaryotes). Molecular Microbiology 43,1565-1575。Jansen R, van Embden JD, Gaastra W, Schouls LM(2002)在原核细胞中鉴定 新颖序歹ll重复家族(Identification of a novel family of sequence repeatsamong prokaryotes). OMICS :A journal of integrative biology 6,23—33。Jensen, L. J.,Friis, C.和 Ussery,D. W. 1999 微生物基因组的三种观点(Three views of microbial genomes) · Res. Microbiol. 150,773-777。Joblin KN, Naylor GE, Williams AG(1990)史氏甲烷短杆菌对厌氧反刍真 菌木聚糖水解活性的景i 响(Effect of Methanobrevibacter smithii onxylanolytic activity of anaerobic ruminal fungi). Applied and EnvironmentalMicrobiology 56, 2287-2295。Kanehisa M,Goto S, Kawashima S, Okuno Y, Hattori M(2004)解密基因组的KEGG 资源(The KEGG resource for deciphering the genome). NucleicAcids Research 32, D277-D280。Kiener, A. , Konig, H. , Winter, J.和 Leisinger,T. 1987.纯化并利用沃氏甲烷杆 菌的假胞质壁内肽酶裂解热自养甲烷杆菌(Purification and use ofMethanobacterium wo 1 f e i ρ s eudomure i η endopeptidase for lysis ofMethanobacterium thermoautotrophicum.)J. Bacteriol. 169,1010-1016。Knox, M. R.和Harris,J. E. 1986.分离并表征史氏甲烷短杆菌 白勺 UM 胃 {φ (Isolation and characterisation of a bacteriophage of Methanobrevibactersmithi i.)第十四届国际微生物大会摘要(Abstracts of the XIV InternationalCongress on Microbiology),曼彻斯特国际微生物协会联盟 (Manchester !International Union of Microbiological Societies)。Kurtz S, Schleiermacher C(1999)REPuter 完整基因组最大重复的快速 计 算(REPuter fast computation of maximal repeats in complete genomes). Bioinformatics 15,426-427。Larkin, Μ. A. , Blackshields, G. , Brown, N. P. , Chenna, R. , McGettigan, P. A.,Mcffilliam, H. , Valentin, F. , Wallace, I. Μ. , Wilm, Α. , Lopez, R. , Thompson, J. D. , Gibson, Τ. J.和Higgins,D.G.,Clustal W和 Clustal X 2.0版(Clustal W and Clustal X version 2.0).Bioinformatics 23(21) :2947_8。Lowe TM, Eddy SR (1997) tRNAscan-SE 改进对基因组序列中转移RNA基因进行检 贝Ij白勺禾呈序(tRNAscan-SE -.a program for improved detectionof transfer RNA genes in genomic sequence). Nucleic Acids Research 25,955-964。Loenen,W.和N. Murray. 1986.噬菌体g的限制性缓解蛋白(Ral)增强 修 饰(Modification enhancement by restriction alleviation protein (Ral) ofbacteriophage lambda. )J. Mol. Biol. 190 :11_22。Lucchini, S.,F. Desiere,禾口 H. Brussow. 1999.嗜热链球菌噬菌体种类的比较基 因组学支持模块化进化理论(Comparative genomics of StreptococcusthermophiIus phage species supports a modular evolution theory) · J. Virol. 73 :8647_8656。Luo, Y. N.,Pfister, P.,Leisinger, Τ.和 Wasserfallen,Α. 2002.假胞壁质内 异肽酶PeiW和PeiP,甲烷嗜热杆菌菌株产生的新颖蛋白酶家族的两个中度相关的成员 (Pseudomurein endoisopeptidases PeiW and PeiP, twomoderately related members of a novel family of proteases produced inMethanothermobacter strains), FEMS Microbiol. Lett. 208,47-510MakarovaiK. S. ,AravindiL.和 Koonin,E. V. 1999.与动物转谷氨酰胺酶同源的古 细菌、细菌禾口真核蛋白的超家方矣(A superfamily of archaeal,bacterial,and eukaryotic proteins homologous to animal transglutaminases). Protein Sci·8,1714_17190Makarova KS,Grishin NV,Shabalina,SA,Wolf YI,Koonin EV(2006)原核细 胞中推定的基于RNA干扰的免疫系统用计算机分析预测酶机器、真核RNAi功能类推和 假拟作用机制(A putative RNA-interference-basedimmune system in prokaryotes computational analysis of the predictedenzymatic machinery, functional analogies with eukaryotic RNAi, andhypothetical mechanisms of action). Biology Direct 1:7_32。新西兰统计 2005 (www, stats, govt, nz)。新西兰温室气体目录(New Zealand,s Greenhouse Gas Inventory) 1990-2004。 国家目录 艮告禾口一般 艮告格式(The National Inventory Report andCommon Reporting Format). (2006)环境部(Ministry for the Environment). http://www. mfe. govt, nz/ publications/climate/nir-apr06/nir-apr06. pdf。Nielsen, H. Engelbrecht, J. Brunak S.和 von Hei jne,G. 1997 鉴定原核和真 核信号月太并予页测其切害Ij位点(Identification of prokaryotic and eukaryoticsignal peptides and prediction of their cleavage sites) · Prot· Eng.,10 :l_6o0no,M·,Wada, Y.,Wu, Y.,Nemori,R.,Jinbo,Y.,Wang, H.,Lo, K. Μ.,Yamaguchi,N.,Brunkhorst,B., OtomoiH.等(1997)FP-21399阻断HIV包膜蛋白介导的膜融合并在淋巴结内浓缩(FP-21399 blocks HIV envelope proteinmediated membrane fusion and concentrates in lymph nodes). Nat. Biotechnol. 15,343-348。Perez-BercoffiA., Koch, J.禾P BUrglin,T. R. 2006. LogoBar 利用柱状图观察
32胃白MfeiRiO^rD (LogoBar :bar graph visualization of protein logoswith gaps). Bioinformatics 22(1) :112_4。Rawlings, N. D.,Morton, F. R.禾Π Barrett, A. J. 2006. MEROPS 肽酶数据库 (MER0PS :the peptidase database). Nucleic Acids Res. 34,D270—D272。Reeve JN, Nolling J Morgan RM, Smith DR(1997)甲烷生成基因、基因组、 谁是第一yIv (Methanogenesis :genes, genomes and who' s on frst ? ) Journal of Bacteriology 179,5975-5986。Samuel BS, Hansen EE, Manchester JK, Coutinho PM, Henrissat B, Fulton R, Latreille P,Kim K,Wilson RK,Gordon JI (2007)史氏甲烷短杆菌对人肠道的基因组适应 (Genomic adaptations of Methanobrevibacter smithiito the human gut). Proceedings of the National Academy of Sciences USA 104,10643—10648。Salzberg等,1998.利用内插马尔可夫模型进行微生物基因鉴定(Microbial gene identification using interpolated Markov models). NucleicAcids Res. 26 :544_8。Smith等,1997,热自养甲烷杆菌ΔΗ的完整基因组序列功能分析和比较基 13 ^IL (Methanobacterium thermoautotrophicum deltaH :functionalanalysis and comparative genomics)J. Bacteriol. 179 :7135_7155。Smith PH, Hungate RE(1958)反刍甲烧短杆菌的分离和表征(Isolationand characterization of Methanobacterium ruminantium η. sp.)Journal ofBacteriology 75,713-718。Staden R,Beal KF, Bonfield JK (1998)司塔登软件包(The StadenPackage) · 分子生物学方法生物信息学方法和实验指南(Methods inMolecular Biology Bioinformatics Methods and Protocols)132,115-130。Tatusov RL,Natale DA,Garkavtsev IV,Tatusova ΤΑ,Shankavaram UT,Rao BS, Kiryutin B, Galperin MY, Fedorova ND, Koonin EV (2001) COG 数据库来自完整基因组的 M&M^MMMW^-^^MMM (The COGdatabase :new developments in phylogenetic classification of proteins fromcomplete genomes)Nucleic Acids Research 29, 22-28。von Heijne,G. 1985.信号序列变异范围(Signal sequences :The limitsof variation)J. Mol. Biol. 184,99-105。将上述说明书提及的所有公开物和专利全文纳入本文作参考。如果参考上述说明书中提及具有已知等同形式的内容,那么将这些等同形式也纳 入本文,就好像在本文中单独列出那样。虽然已结合具体的优选实施方案对本发明作了描述,但应了解,如权利要求所述, 本发明不应过分地受限于这些具体实施方案。应当理解的是在不背离本发明的构思和范围的情况下,可对本发明作进一步的修 改。
3权利要求
一种分离的多肽或肽,其包含氨基酸序列SEQ ID NO117或118。
2.一种分离的多肽或肽,其包含氨基酸序列SEQ ID N0:119。
3.一种分离的多肽或肽,其包含选自SEQ ID NO :1-116和120-172的氨基酸序列。
4.一种分离的多肽或肽,其包含与SEQ ID NO :117或118具有至少90%相同性的氨基 酸序列。
5.一种分离的多肽或肽,其包含与SEQ ID NO :119具有至少90%相同性的氨基酸序列。
6.一种分离的多肽或肽,其包含与选自SEQ ID N0:l-116和120-172的氨基酸序列具 有至少90%相同性的氨基酸序列。
7.一种分离的多肽或肽,其包含SEQ ID NO 117或118的至少15个氨基酸。
8.一种分离的多肽或肽,其包含SEQ ID NO :119的至少15个氨基酸。
9.一种分离的多肽或肽,其包含选自SEQ ID NO :1-116和120-172的氨基酸序列的至 少15个氨基酸。
10.如权利要求1-9中任一项所述的分离的多肽或肽,其特征在于,所述多肽或肽融合 或偶联于另一分子。
11.一种分离的多核苷酸,其编码氨基酸序列SEQ ID NO 117或118。
12.—种分离的多核苷酸,其编码氨基酸序列SEQ ID N0:119。
13.一种分离的多核苷酸,其编码与SEQ ID NO :117或118具有至少90%相同性的氨 基酸序列。
14.一种分离的多核苷酸,其编码与SEQ ID NO :119具有至少90%相同性的氨基酸序列。
15.一种分离的多核苷酸,其编码与选自SEQ ID NO :1-116和120-172的氨基酸序列 具有至少90%相同性的氨基酸序列。
16.一种分离的多核苷酸,其编码包含SEQ ID NO :117或118的至少15个氨基酸的氨基酸序列。
17.一种分离的多核苷酸,其编码包含SEQ ID NO :119的至少15个氨基酸的氨基酸序列。
18.一种分离的多核苷酸,其编码包含选自SEQ ID N0:l-116和120-172的氨基酸序 列的至少15个氨基酸的氨基酸序列。
19.一种分离的多核苷酸,其包含核苷酸序列SEQ ID N0:531。
20.一种分离的多核苷酸,其包含核苷酸序列SEQ ID N0:532或533。
21.一种分离的多核苷酸,其包含选自SEQ ID NO 173-341的核苷酸序列。
22.—种分离的多核苷酸,其包含选自SEQ ID N0:342-533的核苷酸序列。
23.如权利要求11-22中任一项所述的分离的多核苷酸,其特征在于,所述多核苷酸融 合或偶联于另一分子。
24.一种载体,其包含权利要求11-23中任一项所述的分离的多核苷酸。
25.一种宿主细胞,其包含权利要求24所述的载体。
26.—种经遗传修饰包含权利要求1-10中任一项所述的多肽或肽的宿主细胞。
27.一种经遗传修饰包含权利要求11-23中任一项所述多核苷酸的宿主细胞。
28.如权利要求25-27中任一项所述的宿主细胞,其特征在于,所述细胞是原核细胞。
29.如权利要求28所述的宿主细胞,其特征在于,所述细胞是大肠杆菌。
30.如权利要求25-27中任一项所述的宿主细胞,其特征在于,所述细胞是产甲烷菌。
31.如权利要求30所述的宿主细胞,其特征在于,所述细胞是反刍甲烷短杆菌。
32.如权利要求31所述的宿主细胞,其特征在于,所述细胞是反刍甲烷短杆菌菌株 M1T(DSM1093)。
33.一种偶联物分子,其包含权利要求1-9中任一项所述的多肽或肽。
34.如权利要求33所述的偶联物分子,其特征在于,所述分子还包含抗甲烷生成化合 物、抗体或抗体片段、裂解酶、肽核酸、抗微生物肽或抗生素。
35.一种融合分子,其包含权利要求1-9中任一项所述的多肽或肽。
36.如权利要求35所述的融合分子,其特征在于,所述分子还包含抗甲烷生成化合物、 抗体或抗体片段、裂解酶、肽核酸、抗微生物肽或抗生素。
37.一种通透微生物细胞的方法,所述方法包括a)任选地产生或分离权利要求1-10 中任一项所述的多肽或肽;和b)将所述细胞与所述多肽或肽相接触。
38.如权利要求37所述的方法,其特征在于,所述细胞是产甲烷菌。
39.如权利要求38所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌。
40.如权利要求39所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌菌株 M1T(DSM1093)。
41.一种通透微生物细胞的方法,所述方法包括a)任选地产生或分离权利要求33或 34所述的偶联物分子;和b)将所述细胞与所述偶联物分子相接触。
42.如权利要求41所述的方法,其特征在于,所述细胞是产甲烷菌。
43.如权利要求42所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌。
44.如权利要求43所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌菌株 M1T(DSM1093)。
45.一种通透微生物细胞的方法,所述方法包括a)任选地产生或分离权利要求35或 36所述的融合分子;和b)将所述细胞与所述融合分子相接触。
46.如权利要求45所述的方法,其特征在于,所述细胞是产甲烷菌。
47.如权利要求46所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌。
48.如权利要求47所述的方法,其特征在于,所述细胞是反刍甲烷短杆菌菌株 M1T(DSM1093)。
全文摘要
本发明包括信号肽和包含这些肽的多肽,以及编码这些肽或多肽的多核苷酸。本发明还提供包含这些多核苷酸的表达载体和包含这些载体的宿主细胞。本发明还提供使用所公开的肽、多肽、多核苷酸、表达载体或宿主细胞来检测、靶向、通透并抑制微生物细胞,尤其是产甲烷菌细胞的组合物和方法。
文档编号C07K7/06GK101918431SQ200880109364
公开日2010年12月15日 申请日期2008年9月25日 优先权日2007年9月25日
发明者E·H·特曼, G·T·爱特伍德, W·J·凯利 申请人:田园温室气体研究有限公司