专利名称:一种人免疫因子相关蛋白及其编码序列的制作方法
技术领域:
本发明涉及分子生物学、免疫学、生理学以及基因工程等领域。具体地,本发明涉及一种在人类肝癌细胞中表达的hBop-m蛋白及其核酸序列。本发明还涉及该蛋白和核酸序列的制备方法和用途。
CD8分子复合物是成熟T细胞表达的一簇糖蛋白,被认为是I类主要组织相容性复合物(class I major histocompatibility complex,MHC I)的受体分子之一。(Eur J Immunol 1988 Apr;18(4)613-9)。而在CD8beta链的启动子上游600个核苷酸中,人们又发现了新的基因,其启动子引导转录的方向与CD8beta正好相反,于是命名为Bop(CD8b opposite,Bop)。进一步研究发现,Bop基因与CD8b“头碰头”排列,两者的表达是一致的,说明两者在相同的免疫功能途径中起作用。(Immunogenetics 1995;42(5)353-61)。目前观察到Bop基因在多种组织中有表达,比如胸腺、心脏、骨骼肌等。(J Immunol 1997 Feb 1;158(3)1165-74)。
本发明中,我们在人类肝癌细胞中克隆到家鼠骨骼肌中表达的Bop基因的同源基因hBop-m。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的人类hBop-m蛋白序列及其核酸序列。
本发明的第一目的就是提供一种新的人基因hBop-m(Genbank AccessionNo.AF226053),该基因是一个人hBop-m蛋白基因。
本发明的第二目的是提供一种新的人蛋白hBop-m。
本发明的第三目的是提供一种利用重组技术生产上述的新的人hBop-m蛋白和核酸序列的方法。
本发明还提供了这种人hBop-m蛋白多肽和编码序列的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有人hBop-m蛋白质活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第4-1305位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列。
在本发明的另一方面,提供了一种分离出的人hBop-m蛋白质多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.7序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在一个实例中该宿主细胞是大肠杆菌;在另一实例中,该宿主细胞是真核细胞。
在本发明的另一方面,还提供了一种产生具有人hBop-m蛋白质活性的多肽的方法,其步骤如下(1)将编码具有人hBop-m蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人hBop-m蛋白表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人hBop-m蛋白的重组细胞;(3)在适合表达人hBop-m蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人hBop-m蛋白活性的多肽。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.6中第4-1305位的序列。
本发明还提供了与hBop-m蛋白多肽特异性结合的抗体。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人hBop-m蛋白(或多肽)编码序列”指编码具有人hBop-m蛋白活性的多肽的核苷酸序列,如SEQ ID NO.6中第4-1305位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.6序列的编码框第4-1305位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.6中第4-1305位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.7所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的人hBop-m相同功能的蛋白的、SEQ ID NO.6中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“人hBop-m蛋白或多肽”指具有人hBop-m蛋白活性的SEQ IDNO.7序列的多肽。该术语还包括具有与天然人hBop-m相同功能的、SEQ ID NO.7序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人hBop-m蛋白的活性片段和活性衍生物。
本发明的人hBop-m多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与人hBop-m DNA杂交的DNA所编码的蛋白、以及利用抗人hBop-m多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人hBop-m多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括人hBop-m多肽的可溶性片段。通常,该片段具有人hBop-m多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“人hBop-m保守性变异多肽”指与SEQ ID NO.7的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
发明还包括人hBop-m蛋白或多肽的类似物。这些类似物与天然人hBop-m多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的人hBop-m多肽时,可以将人hBop-m编码序列可操作地连于表达调控序列,从而形成人hBop-m蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
本发明还提供了对人hBop-m特异性结合的抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对人hBop-m特异的抗体。例如,将提纯的人hBop-m基因产物或它的抗原片段注射入动物体内以产生多克隆抗体。同样,表达人hBop-m或它的抗原片段的细胞也可以用来对动物致免疫而产生抗体。根据本发明制备的抗体也可以是单克隆抗体,这些单克隆抗体可以用杂交瘤技术制备(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本发明的抗体包括可以阻抑人hBop-m功能的抗体,也可以是不影响人hBop-m功能的抗体。每一类抗体都可以通过对人hBop-m基因产物的片段或功能域致免疫而产生,而人hBop-m基因产物及其片段可以用重组方法产生或用多肽合成仪进行合成。与非修饰形式的人hBop-m基因产物结合的抗体,可以通过用在原核细胞例如E.coli中产生的基因产物来免疫动物而得到。与翻译后修饰形式如糖基化或磷酸化蛋白或多肽结合的抗体,可以通过用在真核细胞如酵母或昆虫细胞中产生的基因产物的来免疫动物而得到。
本发明的人hBop-m抗体可以用来鉴定表达人hBop-m蛋白或多肽的细胞,如Jurkat T细胞。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记人hBop-m特异抗体,然后让人hBop-m特异抗体与细胞样品接触,再用荧光显微镜或流式细胞仪检测出与人hBop-m特异抗体结合的细胞。
除了在细胞表面检测人hBop-m外,还可以用Western印迹技术分析该蛋白质。细胞裂解液可以从培养细胞或取自病人的组织标本如肝癌细胞中提取,并溶解在含有去污剂的裂解缓冲液中。然后用SDS聚丙烯酰胺凝胶电泳分离细胞提取物(同时将提纯的人hBop-m多肽作为阳性对照),接着通过电泳杂交将其转移到硝酸纤维素上。为了用Western印迹免疫探测人hBop-m多肽,可以使用典型的抗体结合检测方法,例如放射自显影或碱性磷酸酶检测方法。并可使用免疫接种血清或不相关的单克隆抗体作为非特异反应的对照。
还可用Nothern印迹法技术分析人hBop-m基因产物的表达,即分析人hBop-m的RNA转录物在细胞中的存在与否和数量。
人hBop-m DNA的Nothern印迹分析和人hBop-m特异抗体的Western印迹分析可以联合使用,以证实人hBop-m在生物样本中的表达。人hBop-m DNA还可以用于Southern印迹分析或原位杂交分析,以将该基因定位于染色体上,并可进行遗传连锁分析以找出其它可能的疾病相关基因。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有人hBop-m核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码人hBop-m的核酸分子。
本发明还提供了检测样品中是否存在人hBop-m核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人hBop-m核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的人hBop-m核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选人hBop-m同源基因或同源蛋白。
为了得到与人hBop-m基因相关的人cDNAs或基因组DNAs的点阵,可以用DNA探针筛选人cDNA或基因组DNA文库,这些探针是在低严紧条件下,用32P对人hBop-m的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自人肝癌细胞的文库。来自参与内分泌的其它人体组织或特定人体细胞株的cDNA文库也可用于筛选目的。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Palo Alto,Cal.。这种筛选方法可以识别与人hBop-m相关的基因家族的核苷酸序列。
根据核苷酸相似性筛选人hBop-m同源物可以按如下方法完成。人体肝癌细胞cDNA文库,例如Clontech Cat. #74XX(Clontech,Palo Alto,Cal.)可以使用一段包含人hBop-m基因序列的全部或部分的随机引物化DNA探针筛选。要完成对与人hBop-m序列至少有70%同源性的DNA插入序列的克隆的鉴定,可以使用杂交温度为55℃的杂交液,然后用0.5×SSC和0.1%SDS清洗。用这种方法识别的克隆的DNA插入序列可以进一步用DNA限制性内切酶分析和DNA测序来评价它与人hBop-m基因的相似性。组织表达的分布可以用上述的Northern印迹法技术分析。
人hBop-m同源物也可以用针对人hBop-m蛋白或多肽的抗体来识别。例如,可以用标准的方法对商品化的或者用已知方法构建的,来自细胞或者组织例如肝癌细胞的表达文库进行筛选。将文库倒入平皿,菌落转移到一张硝化纤维素膜上,使表达的重组蛋白结合到膜上。然后就可以用特异性的人hBop-m抗体进行典型的抗体结合和检测。用这种方法所识别出克隆中的DNA插入序列,可以进一步用DNA限制性内切酶分析和DNA测序进行分析以评价它与人hBop-m基因的相似性。新识别的基因的组织表达分布可以同样地按上述方法进行分析。
本发明的人hBop-m核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工化学合成的方法来合成有关序列。在本申请之前,现有技术已完全可以通过先合成多个多核苷酸小片段,然后再进行连接而获得编码本发明人hBop-m蛋白的核酸序列。然后,可将该核酸序列引入本领域中各种现有的DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH FreemanCo.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85;2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
本发明蛋白的编码序列可用于基因定位。例如,通过荧光原位杂交技术(FISH),将cDNA克隆与分裂中期的染色体进行杂交,可以准确地进行染色体定位。该技术可以使用短至约500bp的cDNA;也可以使用长至约2000bp或者更长的cDNA。对于该技术,可参见Verma等人,Human ChromosomesA Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位于染色体上的某个精确位置,将可以将序列在染色体上的物理位置与遗传图谱数据相关联。这些遗传图谱数据是可以获得的,例如通过孟德尔(Mendelian)人遗传数据库(可通过Johns Hopkins University Welch Medical Library在网上获得)。然后,通过连锁分析来鉴定基因与已定位于同一染色体区域的疾病之间的相关性。
接着,有必要确定患病个体和健康个体之间的cDNA或基因组序列方面的差异。如果某一突变存在于部分或全部患病个体但不存在于正常个体,那么该突变可能就是该疾病的致病因素。
利用本发明的人hBop-m蛋白,通过各种常规筛选方法,可筛选出与人hBop-m发生相互作用的物质,或者受体、抑制剂或拮抗剂等。
本发明人hBop-m蛋白及其抗体、抑制剂、拮抗剂或受体等,当在治疗上进行施用(给药)时,可提供不同的效果。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中pH通常为约5-8,较佳地pH约为6-8,尽管pH值可随被配制物质的性质以及待治疗的病症而有所变化。配制好的药物组合物可以通过常规途径进行给药,其中包括(但并不限于)肌内、腹膜内、皮下、皮内、或局部给药。
以本发明的人hBop-m蛋白为例,可以将其与合适的药学上可接受的载体联用。这类药物组合物含有治疗有效量的蛋白质和药学上可接受的载体或赋形剂。这类载体包括(但并不限于)盐水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。药物制剂应与给药方式相匹配。本发明的人hBop-m蛋白可以被制成针剂形式,例如用生理盐水或含有葡萄糖和其他辅剂的水溶液通过常规方法进行制备。诸如片剂和胶囊之类的药物组合物,可通过常规方法进行制备。药物组合物如针剂、溶液、片剂和胶囊宜在无菌条件下制造。活性成分的给药量是治疗有效量,例如每天约1微克/千克体重—约5毫克/千克体重。此外,本发明的多肽还可与其他治疗剂一起使用。
当本发明的人hBop-m蛋白多肽被用作药物时,可将治疗有效剂量的该多肽施用于哺乳动物,其中该治疗有效剂量通常至少约10微克/千克体重,而且在大多数情况下不超过约8毫克/千克体重,较佳地该剂量是约10微克/千克体重—约1毫克/千克体重。当然,具体剂量还应考虑给药途径、病人健康状况等因素,这些都是熟练医师技能范围之内的。
表2为本发明的人hBop-m蛋白与家鼠Bop蛋白的核苷酸序列(GenBankAccession No.U76374)的同源比较(FASTA)表。
表3为本发明的人hBop-m蛋白与家鼠Bop蛋白的氨基酸序列(GenPeptAccession No.AAC53022)的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出,相似的氨基酸用“+”标出。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkCold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1人hBop-m基因的克隆1.组织分离(肝癌细胞isolation)肝癌细胞来源于5个正常成年男性供体,在死后四小时内取出肝癌细胞,立即置于液氮中冷冻保存。
2.mRNA的分离(mRNA isolation)取出组织,用研钵研碎,加入盛有裂解液的50ml管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至50ml新管,抽提总RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛变性胶电泳鉴定总RNA质量。用带Oligo d(T)的纤维素柱分离总RNA中的mRNA,定量。
3.cDNA文库的构建(Construction of cDNA library)以mRNA为模板,合成双链cDNA,反转录引物见SEQ ID NO.1。补平末端后,加含EcoRI切点的接头,接头序列分别见SEQ ID NO.2和3。磷酸化EcoRI末端后,用XhoI限制性内切酶消化1.5小时,再进行片段分离。过柱筛选长度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,无菌水溶解,连接至Uni-ZAP XR载体(Stratagene,CA9203,USA),以Zap-cDNA Gigapack III Gold Cloning Kit(Stratagene,CA9203,USA)进行包装,宿主菌使用XL 1-Blue MRF(Stratagene,CA9203,USA)细菌。涂板并测定滴度。
4.测序及数据库建立(Seqencing and Database Constructing)挑选文库中有外源片段插入的克隆,扩增后抽提质粒(Qiagen,Germany),用T3和T7作为3’端和5’端的通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行EST大规模测序。测序结果用FACTURA软件去除载体序列,传输到SUN Ultra 450 Server上进行下一步的处理。所有的序列信息再用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),将无同源性或同源性低于95%的序列视为新基因建立数据库。
5.基因的全长克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基础上,进行cDNA全长克隆,分两阶段进行(1)“电子克隆”(Electronic Cloning)以新基因片段序列作为探针搜寻dbEST数据库,将重叠序列>50bp,同源性在98%以上的表达序列标签(Expressed Sequence Tag,简称“EST”)序列认为同一序列(consensus sequence),取出并用AUTOASSEMBLER软件进行拼接,部分EST可以延伸探针序列。再用STRIDER软件分析被延伸的序列是否具有完整的开放阅读框架(Open Reading Frame,ORF),用BLAST搜寻Genbank或SwissProt以确定该序列在核苷酸和氨基酸水平上是否与其他物种有同源性,以帮助判别所得到的基因全长完整性如何。通过电子克隆的方法,通常可获取人hBop-m基因的全长序列。
(2)cDNA末端快速扩增(Rapid Amplification of cDNA Ends,RACE)如果通过“电子克隆”方法仍未得到完整的cDNA全长,则在已有序列的5’或3’端设计引物,在人类肝癌细胞Marathon-Ready cDNA文库(Clontech Lab,Inc,USA)中进行长距离PCR反应。然后对PCR产物克隆、测序。用AUTOASSEMBLER及STRIDER软件分析被延长的序列有无完整的ORF,如无,重复上述过程直至获得全长。
(3)RT-PCR对于5’和3’端已知的序列,如果中间尚有一段间隙(gap)无法从已有的公共数据库或自身数据库获得,可考虑采用RT-PCR的方法。在序列5’端设计引物,3’端引物采用Oligo-dT,在肝癌细胞总RNA库中进行扩增。然后对产物进行克隆、测序。最后拼接并获得全长。
通过组合使用上述3种方法,获得了候选的人hBop-m蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物R15’-ACCATGAGGGCCGAGGG-3’(SEQ ID NO.4)为正向引物,寡核苷酸R25’-TGTTCAGAACATTACAAGAGGCATG-3’(SEQ ID NO.5)为反向引物,以肝癌细胞的总RNA为模板,进行RT-PCR扩增,R1/R2的PCR条件为94℃5分钟,随之以94℃30秒、60℃30秒和72℃1分钟进行35个循环,最后以72℃延伸5分钟。电泳检测PCR扩增产物,获得扩增片段长度为1612bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.6所示的序列。
实施例2人hBop-m基因的序列信息与同源性分析本发明新的人hBop-m全长cDNA(GenBank Accession No.AF226053。在本申请之前未公开过)的长度为1612bp,详细序列见SEQ ID NO.6,其中开放读框位于4-1305位核苷酸。根据全长cDNA推导出人hBop-m的氨基酸序列,共433个氨基酸残基,分子量49760.12,pI为6.18。详细序列见SEQ ID NO.7。
将hBop-m的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与家鼠的Bop基因存在一定的同源性。在核苷酸水平上,它与家鼠Bop基因的mRNA全编码序列(GenBank Accession No.U76374)有52.3%的相同性(附表2),在氨基酸水平上,它与家鼠Bop蛋白(GenPept Accession No.AAC53022)的第1-423位氨基酸残基有31.9%的相同性和65.9%的相似性(附表3)。由上可见,hBop-m基因与家鼠Bop基因无论从核酸还是蛋白水平上都存在较高的同源性,可以认为两者在功能上也有很高相似性。
本发明的人hBop-m除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明的人hBop-m还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明的人hBop-m蛋白的N端与家鼠Bop蛋白的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人hBop-m的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
此外,本发明人hBop-m核酸(编码序列或反义序列)可以被引入细胞,以提高人hBop-m的表达水平或者抑制人hBop-m的过度表达。本发明的人hBop-m蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人hBop-m缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
由于本发明的人hBop-m蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种(如家鼠)的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
实施例3人hBop-m蛋白的结构和功能研究1.将人hBop-m蛋白的氨基酸序列在blocks数据库(网址为http//www.blocks.fhcrc.org)中检索结构域,得到以下结果
1 MRAEGLGGLE RFCSPGKGRG LRALQPFQVG DLLFSCPAYA YVLTVNERGN51 HCEYCFTRKE GLSKCGRCKQ AFYCNVECQK EDWPMHKLEC SPMVVFGENW101 NPSETVRLTA RILAKQKIHP ERTPSEKLLA VKEFESHLDK LDNEKKDLIQ151 SDIAALHHFY SKHLEFPDND SLVVLFAQVN CNGFTIEDEE LSHLGSAIFP201 DVALMNHSCC PNVIVTYKGT LAEVRAVQEI KPGEEVFTSY IDLLYPTEDR251 NDRLRDSYFF TCECQECTTK DKDKAKVEIR KLSDPPKAEA IRDMVRYARN301 VIEEFRRAKH YKSPSELLEI CELSQEKMSS VFEDSNVYML HMMYQAMGVC351 LYMQDWEGAL QYGQKIIKPY SKHYPLYSLN VASMWLKLGR LYMGLEHKAA401 GEKALKKAIA IMEVAHGKDH PYISEIKQEI ESH(1)在氨基酸序列中,存在以下结构域区加框区(65-90)MYND型锌指蛋白功能模块(MYND finger)(2)功能分析在该基因氨基酸序列中存在MYND型锌指蛋白功能模块(MYND finger),类似于家鼠Bop蛋白,可以推测hBop-m也具有相同或者相近的功能。
实施例4人hBop-m基因的组织表达谱电子Northern表达谱。按Ton C.等人的方法(Ton C et al.,Biochem BiophysRes Commun 1997 Dec 18;241(2)589-594;Hwang DM,et al.,Circulation 1997Dec 16;96(12)4146-4203),将人hBop-m cDNA序列在GCG软件包中的humanEST数据库中做BLAST检索,在得到的人类EST中,概率值<10e-10、相同性>95%的EST有上百个,可视为该基因在组织中的转录表达本,由此得出表达该基因的组织谱,发现其在肝脏、脾脏、视网膜、成纤维细胞、胎盘、婴儿心脏、胎儿肝脏、睾丸、胎脑等等组织中有表达,表明它在人体这些组织器官中发挥着重要作用。
实施例5人hBop-m多肽的制备和提纯在该实施例中,将全长的人hBop-m编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将人hBop-m多肽以GST融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌根据人hBop-m的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物(分别对应于编码序列5’和3’端的约20个以上核苷酸),并在正反引物上分别引入限制性内切酶位点(这根据选用的pGEX-2T载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人hBop-m基因在保证阅读框正确的前提下克隆至pGEX-2T载体(Pharmacia,Piscataway,NJ)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌DH5α,筛选鉴定得到含有pGEX-2T-hBop-m表达载体的工程菌DH5α-pGEX-2T-hBop-m。
表达GST-hBop-m重组蛋白的工程菌的分离鉴定挑取单菌落的DH5α-pGEX-2T-hBop-m工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达GST-hBop-m融合蛋白的工程菌。
GST-hBop-m融合蛋白的提取纯化按上述方法诱导表达GST-hBop-m融合表达蛋白的工程菌DH5α-pGEX-2T-hBop-m。诱导后的细菌离心沉淀,按每400ml菌加入20ml PBS重悬细菌,超声破碎细菌。破菌完全的超声液按每毫升加入20微升的量加入PBS饱和的50%谷胱苷肽Sepharose4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了GST-hBop-m的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液所得沉淀加入100μl PBS的量清洗两次,而后按每毫升超声液所得沉淀加入10μl还原型谷胱苷肽洗脱液,室温置10分钟,10000rpm离心10分钟,上清即为洗脱的融合蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在50kDa处的蛋白质条带即为人hBop-m蛋白。
实施例6人hBop-m蛋白或多肽在昆虫细胞中进行真核细胞表达1.人hBop-m杆状病毒表达载体的构建及转染Sf9昆虫细胞株根据人hBop-m的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人hBop-mcDNA在保证阅读框架的前提下克隆至pVL1392载体(Invitrogen,Carlsbad,CA)。鉴定好的表达载体3μg,野生型线性杆状病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml无血清的昆虫培养基中,振荡15秒混匀,室温孵育15分钟备用。取1ml(2×106)Sf9昆虫细胞悬液于60mm组织培养板中,贴壁1小时后换转染培养基,室温孵育15分钟后弃培养基,加入前面制备好的DNA载体转染混合物,Parafilm密封培养板,于室温27℃振摇培养4小时,而后换完全培养基培养3天,收集上清备用。
2.转入重组表达载体的昆虫细胞株的筛选鉴定转染3天后的昆虫细胞用新鲜培养基制成细胞悬液(2×106/1ml),取1ml细胞悬液置于60mm组织培养皿中,加入3ml培养基,100μl收集的培养上清,贴壁1小时,弃2ml培养基,继续室温培养1小时,弃去所有的培养基,加入预热的含20μl4%X-gal的3ml半固体培养基,培养5-7天后挑取白色细胞克隆于96孔培养板中培养3-5天,而后吸取上清感染Sf9昆虫细胞。
收集感染的细胞进行Western鉴定。将细胞裂解后进行SDS-PAGE电泳,电泳后的胶于Pharmacia的Multiphor II半干电转移仪中将蛋白质转印到硝酸纤维膜上,将硝酸纤维膜置于封闭液中封闭1小时,而后于抗人hBop-m的抗体溶液中封闭1小时,TBS液振摇清洗5分钟共2次,而后将膜置于生物素标记的抗人hBop-m一抗的第二抗体溶液中振摇1小时,TBS清洗,加入亲和素-碱性磷酸酶复合物反应30分钟,TBS清洗2次,加入新鲜配制的显色液显色观察蛋白条带。
挑取高表达人hBop-m的Sf9细胞克隆。
3.人hBop-m蛋白的提取纯化用高表达人hBop-m的Sf9细胞克隆的上清大量感染Sf9细胞,感染48小时后收集细胞,PBS洗涤。每2×108细胞加入20ml细胞裂解液(0.5%Triton X-100,20mM Na3PO4(磷酸钠,pH7.8),500mM NaCl,1mM Na3VO4(钒酸钠),1mM Pefabloc,1μg/ml胃蛋白酶抑制剂,亮抑蛋白酶肽和抑蛋白酶肽)破细胞,12000×g离心20min去除细胞碎片,上清按每2×108的细胞加入2ml NTA-琼脂糖(Qiagen,Germany),4℃吸附1小时。而后用含100nM咪唑的His缓冲液洗涤两次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的缓冲液洗脱以得到纯化的蛋白。洗脱液保存于4℃,并进行SDS-PAGE电泳检测提取的人hBop-m蛋白的纯度。在50kDa处的蛋白质条带即为人hBop-m蛋白。
实施例7抗人hBop-m抗体的制备1.免疫小鼠和脾细胞的制备将实施例5和实施例6中获得的人hBop-m蛋白用层析法进行分离后备用,也可以用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中割下,并用等体积的完全Freund’s佐剂乳化。取6-8周龄Balb/C雌鼠,用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量再加强免疫一次,3-5天后用于融合。其中,脾细胞制备见鄂征主编,《组织培养和分子细胞学技术》,北京出版社,第210页。
2.按《组织培养和分子细胞学技术》(同上),第371页中的方法,制备饲养细胞。
3.按《组织培养和分子细胞学技术》(同上),第213页中的方法,进行细胞融合。
4.抗体的检测在细胞融合10-15天后,需逐孔进行检查,一旦发现旺盛的杂交细胞集落生长,就应用人hBop-m蛋白做抗体活性的初步筛选,常用的方法有免疫荧光试验、发射免疫试验(RIA)、酶联免疫吸附试验(ELISA)。检查出抗体活性的孔后,立刻进行克隆培养,并分离出抗体。
本发明涉及的序列及记号分列如下(1)SEQ ID NO.1的信息(i)序列特征(A)长度50bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(iii)序列描述SEQ ID NO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT 50(2)SEQ ID NO.2的信息(i)序列特征(A)长度13bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸
(iii)序列描述SEQ ID NO.2AATTCGGCAC GA G13(3)SEQ ID NO.3的信息(i)序列特征(A)长度9bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(iii)序列描述SEQ ID NO.3GCCGTGCTC 9(4)SEQ ID NO.4的信息(i).序列特征(A)长度17bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.4ACCATGAGGGCCGAGGG 17(5)SEQ ID NO.5的信息(i).序列特征(A)长度25bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii).分子类型寡核苷酸(iii).序列描述SEQ ID NO.5TGTTCAGAACATTACAAGAGGCATG 25(6)SEQ ID NO.6的信息(i)序列特征(A)长度1612bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ii)分子类型核苷酸(iii)序列描述SEQ ID NO.61 ACCATGAGGG CCGAGGGCCT CGGCGGCCTG GAGCGCTTCT GCAGCCCGGG51 CAAAGGCCGG GGGCTGCGGG CTCTGCAGCC CTTCCAGGTG GGGGACTTGC101 TGTTCTCCTG CCCGGCCTAT GCCTACGTGC TCACGGTCAA CGAGCGGGGC151 AACCACTGCG AGTACTGCTT CACCAGGAAA GAAGGATTGT CCAAATGTGG201 AAGATGCAAG CAGGCATTTT ACTGCAATGT GGAGTGTCAG AAAGAAGATT251 GGCCCATGCA CAAGCTGGAA TGTTCTCCCA TGGTTGTTTT TGGGGAAAAC301 TGGAATCCCT CGGAGACTGT AAGACTAACA GCAAGGATTC TGGCCAAACA351 GAAAATCCAC CCAGAGAGAA CACCTTCGGA AAAATTGTTA GCTGTGAAGG401 AGTTTGAATC ACATCTGGAT AAGTTAGACA ATGAGAAGAA GGATTTGATT451 CAGAGTGACA TAGCTGCTCT CCATCACTTT TACTCCAAGC ATCTCGAATT501 CCCTGACAAT GATAGCCTCG TAGTACTCTT TGCACAGGTT AACTGTAATG551 GCTTCACAAT TGAAGATGAA GAACTTTCTC ATTTGGGATC AGCGATATTT601 CCTGATGTTG CATTGATGAA TCATAGCTGT TGCCCCAATG TCATTGTGAC651 CTACAAAGGG ACCCTGGCAG AAGTCAGAGC TGTACAGGAA ATCAAGCCGG701 GAGAGGAGGT TTTTACCAGC TATATTGATC TCCTGTACCC AACGGAAGAT751 AGAAATGACC GGTTAAGAGA TTCTTATTTC TTTACCTGTG AGTGCCAGGA801 GTGTACCACC AAGGACAAGG ATAAGGCCAA GGTGGAAATC CGGAAGCTCA851 GCGATCCCCC AAAGGCAGAA GCCATCCGAG ACATGGTCAG ATATGCACGC901 AACGTCATTG AAGAGTTCCG GAGGGCCAAG CACTATAAAT CCCCTAGTGA951 GCTGCTGGAG ATCTGCGAGC TCAGCCAGGA GAAGATGAGC TCTGTGTTTG1001 AGGACAGTAA CGTGTACATG TTGCACATGA TGTACCAGGC CATGGGTGTC1051 TGCTTGTACA TGCAGGACTG GGAAGGAGCC CTGCAATATG GACAGAAAAT1101 CATTAAGCCC TACAGTAAGC ACTATCCTTT GTACTCCCTC AACGTGGCCT
1151 CCATGTGGTT GAAGCTAGGG AGACTCTACA TGGGCCTGGA ACACAAAGCC1201 GCAGGGGAGA AAGCCCTGAA GAAGGCCATT GCAATCATGG AAGTAGCTCA1251 CGGCAAAGAT CATCCATATA TTTCTGAGAT CAAACAGGAA ATTGAAAGCC1301 ACTGAAACTA TGCAGCATTT CAGTTTTCAT TTAAACACTT AGTTCAGAAA1351 CCTTAAAGGA TTTGAATATT TCAAATTGCA CACGTCACTC CAGCATCTCT1401 GTAAAATAAT TGGAATGAAA ATACTTCTTG CACTTAAACA CTGCACATGC1451 CGTACTTTGA GGTTAGTCTG AATCTTGAAC TTTAATACCA AATTAATTTT1501 GAATGCTTTT GTTTCCTAAG AGATAATGGC ATGGTTTCAT ATGTTATACT1551 TTGGACAGAG TTTTAAAAAT GGAATTATTT TTTCTTTCAT GCCTCTTGTA1601 ATGTTCTGAA CA(7)SEQ ID NO.7的信息(i)序列特征(A)长度433氨基酸(B)类型氨基酸(C)链性单链(D)拓扑结构线性(ii)分子类型多肽(iii)序列描述SEQ ID NO.71 MRAEGLGGLE RFCSPGKGRG LRALQPFQVG DLLFSCPAYA YVLTVNERGN51 HCEYCFTRKE GLSKCGRCKQ AFYCNVECQK EDWPMHKLEC SPMVVFGENW101 NPSETVRLTA RILAKQKIHP ERTPSEKLLA VKEFESHLDK LDNEKKDLIQ151 SDIAALHHFY SKHLEFPDND SLVVLFAQVN CNGFTIEDEE LSHLGSAIFP201 DVALMNHSCC PNVIVTYKGT LAEVRAVQEI KPGEEVFTSY IDLLYPTEDR251 NDRLRDSYFF TCECQECTTK DKDKAKVEIR KLSDPPKAEA IRDMVRYARN301 VIEEFRRAKH YKSPSELLEI CELSQEKMSS VFEDSNVYML HMMYQAMGVC351 LYMQDWEGAL QYGQKIIKPY SKHYPLYSLN VASMWLKLGR LYMGLEHKAA401 GEKALKKAIA IMEVAHGKDH PYISEIKQEI ESH表252.3% identity in 1176 nt overlap1020304050h.seqACCATGAGGGCCGAGGGCCTCGGCGGCCTGGAGCGCTTCTGCAGCCCGGGCAAAGG
| ||||| ||||| |||||||||m.seqCTCTGAGATGACAATAGGCAGCATGGAGAACGTGGAGGTCTTCACTTCCGAGGGCAAAGG5060708090 10060 708090 100 110h.seqCCGGGGGCTGCGGGCTCTGCAGCCCTTCCAGGTGGGGGACTTGCTGTTCTCCTGCCCGGC| | || ||| |||| | || ||| || | ||| | | || | |||m.seqCAGAGGTCTGAAGGCTACGAAGGAGTTCTGGGCTGCGGATGTCATCTTTGCGGAGAGGGC110 120 130 140 150 160120 130 140 150 160 170h.seqCTATGCCTACGTGCTCACGGTCAACGAGCGGGGCAACCACTGCGAGTACTGCTTCACCAG||| |||| || || || | ||| | |||||||| ||m.seqTTATTCTGCAGTGGTTTTTGACAGCCTCATTAACTTCGTGTGCCACACCTGCTTCAAGAG170 180 190 200 210 220180190 200 210 220 230h.seqGAAAGAAGGATTGTCCA--AATGTGGAAGATGCAAGCAGGCATTTTACTGCAATGTGGAG| | || || |||||| |||||||| ||||||||| | |m.seqGCAGGA--GAAGCTCCATCGCTGCGGGCAGTGCAAGTTCGCCCATTACTGGGACCGCACG230 240 250 260 270 280240 250 260 270 280 290h.seqTGTCAGAAAGAAGATTGGCCCATGCACAAGCTGGAATGTTCTCCCATGGTTGTTTTTGGG|| ||||| || | ||||| | |||||| || || || |||| | ||||m.seqTGCCAGAAGGATGCTTGGCTGAATCACAAGAACGAGTGCGCTGCCATCAAGAAATATGGG290 300 310 320 330 340300 310 320 330 340350h.seqGAAAACTGGAATCCCTCGGAGACTGTAAGACTAACAGCAAGGATTCTG-GCCAAACAGAA||| ||||| |||| | || || | || | || || | | ||m.seq--AAAGTG----CCCAACGAGAACATCAGGCTGGCCGCCCGCATCATGTGGCGGGTGGAG350 360 370 380 390360 370 380 390 400 410h.seqAATCCACCCAGAGAGAACACCTTCGGAAAAATTGTTAGCTGTGAAGGAGTTTGAATCACA| || | | || | || || | | ||| | || || |||m.seqAGAGAGGGCACTGGGCTCA-CAGAGGGCTGCCTGGTGTCCGTGGATGACTTACAGAACCA400 410420 430 440 450420 430 440 450460 469h.seqTCTGGATAAGTT---AGACAATGAGAAGAAGGATTTGATTCAGAGT-GACATAGCTGCTC|||| | |||| | || |||||||| || |||| ||| | | |m.seqCGTGGAGCACTTTGGGGAGGAGGAGCAGAAGGA----ACTCCGAGTAGACGTGGACACGT460 470 480 490 500470 480 490 500 510 520h.seqTCCATCACT--TTTACTCCAAGCATCTCGAATTCC--CTGACAATGATAGCCTCGTAGTA|| || | | | ||| | | | | | | | || | ||| || |m.seqTCTTGCAGTACTGGCCACCACAGAGCCAGCAGTTCAGCATGCAGT-ATA---TCTCACAC510 520 530 540 550 560530 540 550 560 570580h.seqCTCTTTGCACAGGTTAACTGTAATGGCTTCAC---AATTGAAGATGAAGAACT-TTCTCA||||||| | ||||| || || |||||| ||| | || || ||m.seqATCTTTGGTGTGATCAACTGCAACGGTTTCACTCTCAGTGACCAGAGAGGGCTACAGGCA
570 580 590 600 610 620590 600 610 620 630 640h.seqTTTGGGATCAGCGATATTTCCTGATGTTGCATTGATGAATCATAGCTGTTGCCCCAATGT| || | || || || || | | | || |||| ||| || || || ||m.seqGTAGGTGTGGGC-ATCTTCCCCAACCTGGGCCTGGTGAACCATGATTGCTGGCCAAACTG630640 650 660 670 680650660670680690699h.seqCATTGTGACCTACAAAGGGACCCTGGCAGAAGTCAGAG--CTGTACAGGAAATCAAGCCG|| ||| | | ||| | | || || | | ||| || || |||m.seqCACTGTCATATTCAACAATGGCAAGATTGAGCTCCGGGCCCTGGGCAAGATCTCA--GAA690 700 710 720 730 740700 710 720 730 740 750h.seqGGAGAGGAGGTTTTTACCAGCTATATTGATCTCCTGTACCCAACGGAAGATAG-AAATGA|| |||||| | | ||| || || ||||| ||| | || || | | |m.seqGGCGAGGAGCTGACTGTGTCCTACATAGACTTCCTGCACCTCAGTGAGGAGCGCAGGCGG750 760 770 780 790 800760 770780 790 800 810h.seqCCGGTTAAGAGA---TTCTTATTT--CTTTACCTGTGAG---TGCCAGGAGTGTACCACC| | | |||| | | || ||| || |||||||| |||||| || ||m.seqCAGCTGAAGAAACAGTACTACTTTGACTGCTCCTGTGAGCACTGCCAGAAGGGGCTGAAG810 820 830 840 850 860820 830 840 850 860 869h.seqAAGGACAAGGATAAGGCCAAGGTGGAAATCCGGAAGCTCAGCGATCCCCCAAAG-GCAGA| |||||| | |||| || |||| | |||| ||| | ||m.seqGACGACCTCTTCCTGGCAGCGAAGGAAGACCCCAAGCCC-----TCCCAGGAAGTGGTGA870 880 890 900910870 880890900 910 920h.seqAGCCATCCGAGAC-ATGGTCAGA-TATGCACGCAACGTCATTGAAGAGTTCCGGAGGGCC|| | || || || ||| | || ||| ||| || || || ||m.seqAG-GAGATGATACAATTCTCAAAGGATACACTGGAAAAAATAGACAAGGCTC---GCTCC920 930 940 950 960 970930 940 950 960 970 980h.seqAAGCACTATAAATCCCCTAGTGAGCTGCTGGAGATCTGCGAGCTCAGCCAGGAGAAG-AT|| | | ||| | ||| | || || | || |||| ||||||| |m.seqGAG-GGTTTGTATCAC-----GAGGTTGTGAAGCTGTGTCGGGAGTGCCTGGAGAAGCAG980 990 1000 1010 1020990 1000 1010 1020 1030 1040h.seqGAGCTCTGTGTTTGAGGACAGTAACGTGTACATGTTGCACATGATGTACCAGGCCATGGG|||| | ||||| | |||| ||| | ||| || | | || | | |||m.seqGAGC-CAGTGTTCGCCGACACCAACCTCTACGTGCTTCGGCTGCTCAGCATTGCATCAGA1030 1040 1050 1060 1070 10801050 1060 1070 1080 1090 1100h.seqTGTCTGCTTGTACATGCAGGACTGGGAAGGAGCCCTGCAATATGGACAGAAAATCATTAA||| || ||| | |||| || || | |||| || |||||| || || |m.seqGGTCCTCTCCTACCTCCAGGCCTATGAGGAAGCCTCACATTATGCCAGGAGGATGGTTGA1090 1100 1110 1120 1130 1140
1110 11201130 1140 1150 1160h.seqGCCCTACAGTAAGCACTA--TCCTTTGTACTCCCTCAACGTGGCCTCCATGTGGTTGAAG||||| || | ||| || | | | || |||| ||| | ||| | ||| |m.seqTGGCTACATGAAACTCTACCACCATAACAATGCC-CAACTGGGCATGGCTGT-GATGAGG1150 1160 1170 1180 1190 12001170 1180 1190 1200 1210 1220h.seqCTAGGGAGACTCTACATGGGCCTGGAACACAAAGCCGCAGGGGAGAAAGCCCTGAAGAAG||||m.seqGCAGGGCTTACCAACTGGCATGCTGGTCACATCGAAGTGGGGCATGGGATGATCTGCAAA1210 1220 1230 1240 1250 1260h.seq人hBop-m蛋白的核酸序列(GenBank Accession No.AF226053)m.seq家鼠Bop蛋白的核酸序列(GenBank Accession No.U76374)表331.9% identity in 423 aa overlap,65.9% similarity in 423 aa overlap102030405060h.pepMRAEGLGGLERFCSPGKGRGLRALQPFQVGDLLFSCPAYAYVLTVNERGNHCEYCFTRKE+| | | ||||||+| + | ++|++|+ ||+ |+ + + |+ || |+|m.pep MENVEVFTSEGKGRGLKATKEFWAADVIFAERAYSAVVFDSLINFVCHTCFKRQE1020304050708090 100 110 120h.pepGLSKCGRCKQAFYCNVECQKEDWPMHKLECSPMVVFGENWNPSETVRLTARILAKQKIHP| +||+|| | ||+ |||+ | || ||+ + +|+ |+|++||+|||+ + + +m.pepKLHRCGQCKFAHYCDRTCQKDAWLNHKNECAAIKKYGKV--PNENIRLAARIMWRVEREG60708090 100 110130 140 150 160 170 180h.pepERTPSEKLLAVKEFESHLDKLDNEKKDLIQSDIAALHHFYSKHLEFPDNDSLVVLFAQVN|++| ++++|++++ +|++ ++ |+ ++ +++ + + + + + +|+ +|m.pepTGLTEGCLVSVDDLQNHVEHFGEEEQKELRVDVDTFLQYWPPQSQQFSMQYISHIFGVIN120 130 140 150 160 170190200 210 220 230 239h.pepCNGFTIEDEE-LSHLGSAIFPDVALMNHSCCPNVIVTYKGTLAEVRAVQEIKPGEEVFTS|||||+ |++ |+ +| +|||+++|+||+| || | +++ |+||+ +|+ |||+ +|m.pepCNGFTLSDQRGLQAVGVGIFPNLGLVNHDCWPNCTVIFNNGKIELRALGKISEGEELTVS180 190 200 210 220 230240 250 260 270 280290h.pepYIDLLYPTEDRNDRLRDSYFFTCECQECTTKDKDKAKVEIRKLSDP-PKAEATRDMVRYA|||+|+ +|+| +|+ +|+| | |++||| + ++ || |+ |++++|++++m.pepYIDFLHLSEERRRQLKKQYYFDCSCEHCQKGLKDDLFLAAKE--DPKPSQEVVKEMIQFS240 250 260 270 280 290300 310 320 330 340 350h.pepRNVIEEFRRAKHYKSPSELLEICELSQEKMSSVFEDSNVYMLHMMYQAMGVCLYMQDWEG++++|++ +|+ |++++|+ ||+ || |+|+|+|+++ | | |+| +|m.pepKDTLEKIDKARSEGLYHEVVKLCRECLEKQEPVFADTNLYVLRLLSIASEVLSYLQAYEE300 310 320 330 340 350
360 370 380 390 400 410h.pep ALQYGQKIIKPYSK--HYPLYSLNVASMWLKLGRLYMGLEHKAAGEKALKKAIAIMEVAH| +|+++++ | | |+ +|++| | | + | | +|+ + || ||+ |+|m.pep ASHYARRMVDGYMKLYHHNNAQLGMAVMRAGLTNWHAG--HIEVGHGMICKAYAILLVTH360 370 380 390 400420 430h.pep GKDHPYISEIKQEIESH| +|| ++++m.pep GPSHPITKDLEAMRMQTEMELRMFRQNEFMYHKMREAALNNQPMQVMAEPSNEPAPALFH410 420 430 440 450 460h.pep人hBop-m蛋白氨基酸序列m.pep家鼠Bop蛋白氨基酸序列(GenBank Accession No.AAC53022)
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人hBop-m蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.7所示的氨基酸序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列。
4.一种分离出的人hBop-m蛋白多肽,其特征在于,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.7序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞,其特征在于它包括原核细胞和真核细胞。
8.一种产生具有人hBop-m蛋白质活性的多肽的方法,特征在于其步骤如下(1)将编码具有人hBop-m蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人hBop-m蛋白表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第4-1305位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人hBop-m蛋白的重组细胞;(3)在适合表达人hBop-m蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人hBop-m蛋白活性的多肽。
9.一种能与权利要求7所述的人hBop-m蛋白多肽特异性结合的抗体,其特征在于它包括多克隆抗体和单克隆抗体。
10.一种核酸分子,其特征在于,它包含权利要求1所述的DNA分子中8-100个连续核苷酸。
11.一种用于检测样品中是否存在人hBop-m核苷酸序列的方法,其特征在于它包括用权利要求10所述探针与样品进行杂交,然后检测探针是否发生了结合,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人hBop-m核苷酸编码序列,并可位于该编码序列的两侧或中间,引物长度为15~50个核苷酸。
全文摘要
本发明提供了一种在人体肝癌细胞中表达的新的人hBop-m蛋白及其编码序列,本发明还提供了该蛋白和核酸序列的制备方法,以及在样品中检测人hBop-m核酸序列和多肽的方法。
文档编号C07K16/18GK1272540SQ0011536
公开日2000年11月8日 申请日期2000年4月11日 优先权日2000年4月11日
发明者杨义生, 钱斌治, 张新, 高馨, 陈竺, 韩泽广 申请人:国家人类基因组南方研究中心