一种人肝癌相关抑癌蛋白及其编码序列的制作方法

文档序号:3535096阅读:357来源:国知局
专利名称:一种人肝癌相关抑癌蛋白及其编码序列的制作方法
技术领域
本发明涉及分子生物学、肿瘤学、酶学、生理学以及基因工程等领域。具体地,本发明涉及一种在人类肝中表达的hALC蛋白及其核酸序列。本发明还涉及该蛋白和核酸序列的制备方法和用途。
人们在研究急性淋巴白血病(acute lymphocytic leukemias,ALL)的过程中发现,约20%的情形中这种病与一个融合蛋白E2a-Pbx1紧密相关。将这个融合蛋白转入家鼠的一个成纤维细胞株中表达,进一步研究发现E2a-Pbx1在其中作用于12个靶基因。这些靶基因被命名为EF-1到EF-12(E2a-Pbx1 target gene in fibroblasts1 to 12)。(Mol Cell Biol.1997 Mar;17(3):1503-12.)。
本发明中,我们在人类肝中克隆到家鼠EF-9基因的同源基因。进一步研究后我们发现,这个新的人类基因不但与家鼠EF-9基因完全同源,而且与人类肝癌的发生有紧密的联系,故命名为hALC基因(human Antioncogene involved in LiverCancer)。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的人类hALC蛋白序列及其核酸序列。
本发明的第一目的就是提供一种新的人基因hALC(Genbank AccessionNo.AY013707),该基因是一个人hALC蛋白基因。
本发明的第二目的是提供一种新的人蛋白hALC。
本发明的第三目的是提供一种利用重组技术生产上述的新的人hALC蛋白和核酸序列的方法。
本发明还提供了这种人hALC蛋白多肽和编码序列的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有人hALC蛋白质活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第31-1671位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列。
在本发明的另一方面,提供了一种分离出的人hALC蛋白质多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.7序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在一个实例中该宿主细胞是大肠杆菌;在另一实例中,该宿主细胞是真核细胞。
在本发明的另一方面,还提供了一种产生具有人hALC蛋白质活性的多肽的方法,其步骤如下(1)将编码具有人hALC蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人hALC蛋白表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人hALC蛋白的重组细胞;(3)在适合表达人hALC蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人hALC蛋白活性的多肽。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.6中第31-1671位的序列。
本发明还提供了与hALC蛋白多肽特异性结合的抗体。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人hALC蛋白(或多肽)编码序列”指编码具有人hALC蛋白活性的多肽的核苷酸序列,如SEQ ID NO.6中第31-1671位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.6序列的编码框第31-1671位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.6中第31-1671位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.7所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的人hALC相同功能的蛋白的、SEQ ID NO.6中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“人hALC蛋白或多肽”指具有人hALC蛋白活性的SEQ ID NO.7序列的多肽。该术语还包括具有与天然人hALC相同功能的、SEQ ID NO.7序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人hALC蛋白的活性片段和活性衍生物。
本发明的人hALC多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与人hALC DNA杂交的DNA所编码的蛋白、以及利用抗人hALC多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人hALC多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括人hALC多肽的可溶性片段。通常,该片段具有人hALC多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“人hALC保守性变异多肽”指与SEQ ID NO.7的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1
发明还包括人hALC蛋白或多肽的类似物。这些类似物与天然人hALC多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的人hALC多肽时,可以将人hALC编码序列可操作地连于表达调控序列,从而形成人hALC蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
本发明还提供了对人hALC特异性结合的抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对人hALC特异的抗体。例如,将提纯的人hALC基因产物或它的抗原片段注射入动物体内以产生多克隆抗体。同样,表达人hALC或它的抗原片段的细胞也可以用来对动物致免疫而产生抗体。根据本发明制备的抗体也可以是单克隆抗体,这些单克隆抗体可以用杂交瘤技术制备(例如,Kohler et al.,Nature 256:495,1975;Kohler et al.,Eur.J.Immunol.6:511,1976;Kohler et al.,Eur.J.Immunol.6:292,1976)。本发明的抗体包括可以阻抑人hALC功能的抗体,也可以是不影响人hALC功能的抗体。每一类抗体都可以通过对人hALC基因产物的片段或功能域致免疫而产生,而人hALC基因产物及其片段可以用重组方法产生或用多肽合成仪进行合成。与非修饰形式的人hALC基因产物结合的抗体,可以通过用在原核细胞例如E.coli中产生的基因产物来免疫动物而得到。与翻译后修饰形式如糖基化或磷酸化蛋白或多肽结合的抗体,可以通过用在真核细胞如酵母或昆虫细胞中产生的基因产物的来免疫动物而得到。
本发明的人hALC抗体可以用来鉴定表达人hALC蛋白或多肽的细胞,如Jurkat T细胞。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记人hALC特异抗体,然后让人hALC特异抗体与细胞样品接触,再用荧光显微镜或流式细胞仪检测出与人hALC特异抗体结合的细胞。
除了在细胞表面检测人hALC外,还可以用Western印迹技术分析该蛋白质。细胞裂解液可以从培养细胞或取自病人的组织标本如肝中提取,并溶解在含有去污剂的裂解缓冲液中。然后用SDS聚丙烯酰胺凝胶电泳分离细胞提取物(同时将提纯的人hALC多肽作为阳性对照),接着通过电泳杂交将其转移到硝酸纤维素上。为了用Western印迹免疫探测人hALC多肽,可以使用典型的抗体结合检测方法,例如放射自显影或碱性磷酸酶检测方法。并可使用免疫接种血清或不相关的单克隆抗体作为非特异反应的对照。
还可用Nothern印迹法技术分析人hALC基因产物的表达,即分析人hALC的RNA转录物在细胞中的存在与否和数量。
人hALC DNA的Nothern印迹分析和人hALC特异抗体的Western印迹分析可以联合使用,以证实人hALC在生物样本中的表达。人hALC DNA还可以用于Southern印迹分析或原位杂交分析,以将该基因定位于染色体上,并可进行遗传连锁分析以找出其它可能的疾病相关基因。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有人hALC核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码人hALC的核酸分子。
本发明还提供了检测样品中是否存在人hALC核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人hALC核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的人hALC核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选人hALC同源基因或同源蛋白。
为了得到与人hALC基因相关的人cDNAs或基因组DNAs的点阵,可以用DNA探针筛选人cDNA或基因组DNA文库,这些探针是在低严紧条件下,用32P对人hALC的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自人肝的文库。来自参与内分泌的其它人体组织或特定人体细胞株的cDNA文库也可用于筛选目的。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Palo Alto,Cal.。这种筛选方法可以识别与人hALC相关的基因家族的核苷酸序列。
根据核苷酸相似性筛选人hALC同源物可以按如下方法完成。人体肝cDNA文库,例如Clontech Cat.#74XX(Clontech,Palo Alto,Cal.)可以使用一段包含人hALC基因序列的全部或部分的随机引物化DNA探针筛选。要完成对与人hALC序列至少有70%同源性的DNA插入序列的克隆的鉴定,可以使用杂交温度为55℃的杂交液,然后用0.5×SSC和0.1%SDS清洗。用这种方法识别的克隆的DNA插入序列可以进一步用DNA限制性内切酶分析和DNA测序来评价它与人hALC基因的相似性。组织表达的分布可以用上述的Northern印迹法技术分析。
人hALC同源物也可以用针对人hALC蛋白或多肽的抗体来识别。例如,可以用标准的方法对商品化的或者用已知方法构建的,来自细胞或者组织例如肝的表达文库进行筛选。将文库倒入平皿,菌落转移到一张硝化纤维素膜上,使表达的重组蛋白结合到膜上。然后就可以用特异性的人hALC抗体进行典型的抗体结合和检测。用这种方法所识别出克隆中的DNA插入序列,可以进一步用DNA限制性内切酶分析和DNA测序进行分析以评价它与人hALC基因的相似性。新识别的基因的组织表达分布可以同样地按上述方法进行分析。
本发明的人hALC核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工化学合成的方法来合成有关序列。在本申请之前,现有技术已完全可以通过先合成多个多核苷酸小片段,然后再进行连接而获得编码本发明人hALC蛋白的核酸序列。然后,可将该核酸序列引入本领域中各种现有的DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH FreemanCo.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
本发明蛋白的编码序列可用于基因定位。例如,通过荧光原位杂交技术(FISH),将cDNA克隆与分裂中期的染色体进行杂交,可以准确地进行染色体定位。该技术可以使用短至约500bp的cDNA;也可以使用长至约2000bp或者更长的cDNA。对于该技术,可参见Verma等人,Human Chromosomes:A Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位于染色体上的某个精确位置,将可以将序列在染色体上的物理位置与遗传图谱数据相关联。这些遗传图谱数据是可以获得的,例如通过孟德尔(Mendelian)人遗传数据库(可通过Johns Hopkins University Welch Medical Library在网上获得)。然后,通过连锁分析来鉴定基因与已定位于同一染色体区域的疾病之间的相关性。
接着,有必要确定患病个体和健康个体之间的cDNA或基因组序列方面的差异。如果某一突变存在于部分或全部患病个体但不存在于正常个体,那么该突变可能就是该疾病的致病因素。
利用本发明的人hALC蛋白,通过各种常规筛选方法,可筛选出与人hALC发生相互作用的物质,或者受体、抑制剂或拮抗剂等。
本发明人hALC蛋白及其抗体、抑制剂、拮抗剂或受体等,当在治疗上进行施用(给药)时,可提供不同的效果。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中pH通常为约5-8,较佳地pH约为6-8,尽管pH值可随被配制物质的性质以及待治疗的病症而有所变化。配制好的药物组合物可以通过常规途径进行给药,其中包括(但并不限于)肌内、腹膜内、皮下、皮内、或局部给药。
以本发明的人hALC蛋白为例,可以将其与合适的药学上可接受的载体联用。这类药物组合物含有治疗有效量的蛋白质和药学上可接受的载体或赋形剂。这类载体包括(但并不限于)盐水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。药物制剂应与给药方式相匹配。本发明的人hALC蛋白可以被制成针剂形式,例如用生理盐水或含有葡萄糖和其他辅剂的水溶液通过常规方法进行制备。诸如片剂和胶囊之类的药物组合物,可通过常规方法进行制备。药物组合物如针剂、溶液、片剂和胶囊宜在无菌条件下制造。活性成分的给药量是治疗有效量,例如每天约1微克/千克体重-约5毫克/千克体重。此外,本发明的多肽还可与其他治疗剂一起使用。
当本发明的人hALC蛋白多肽被用作药物时,可将治疗有效剂量的该多肽施用于哺乳动物,其中该治疗有效剂量通常至少约10微克/千克体重,而且在大多数情况下不超过约8毫克/千克体重,较佳地该剂量是约10微克/千克体重-约1毫克/千克体重。当然,具体剂量还应考虑给药途径、病人健康状况等因素,这些都是熟练医师技能范围之内的。
表2为本发明的人hALC蛋白与家鼠EF-9蛋白的核苷酸序列(GenBank AccessionNo.U72678)的同源比较(FASTA)表。
表3为本发明的人hALC蛋白与家鼠EF-9蛋白的氨基酸序列(GenPept AccessionNo.AAB51038)的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出,相似的氨基酸用“+”标出。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(NewYork:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1人hALC基因的克隆1.组织分离(肝isolation)肝来源于5个正常成年男性供体,在死后四小时内取出肝,立即置于液氮中冷冻保存。
2.mRNA的分离(mRNA isolation)取出组织,用研钵研碎,加入盛有裂解液的50ml管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至50ml新管,抽提总RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛变性胶电泳鉴定总RNA质量。用带Oligo d(T)的纤维素柱分离总RNA中的mRNA,定量。
3.cDNA文库的构建(Construction of cDNA library)以mRNA为模板,合成双链cDNA,反转录引物见SEQ ID NO.1。补平末端后,加含EcoRⅠ切点的接头,接头序列分别见SEQ ID NO.2和3。磷酸化EcoRⅠ末端后,用XhoⅠ限制性内切酶消化1.5小时,再进行片段分离。过柱筛选长度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,无菌水溶解,连接至Uni-ZAP XR载体(Stratagene,CA9203,USA),以Zap-cDNA Gigapack Ⅲ Gold Cloning Kit(Stratagene,CA9203,USA)进行包装,宿主菌使用XL1-Blue MRF’(Stratagene,CA9203,USA)细菌。涂板并测定滴度。
4.测序及数据库建立(Seqencing and Database Constructing)挑选文库中有外源片段插入的克隆,扩增后抽提质粒(Qiagen,Germany),用T3和T7作为3’端和5’端的通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行EST大规模测序。测序结果用FACTURA软件去除载体序列,传输到SUN Ultra 450 Server上进行下一步的处理。所有的序列信息再用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),将无同源性或同源性低于95%的序列视为新基因建立数据库。
5.基因的全长克隆(cloning of Full-length cDNA)在得到的新基因片段序列信息基础上,进行cDNA全长克隆,分两阶段进行
(1)“电子克隆”(Electronic Cloning)以新基因片段序列作为探针搜寻dbEST数据库,将重叠序列>50bp,同源性在98%以上的表达序列标签(Expressed Sequence Tag,简称“EST”)序列认为同一序列(consensus sequence),取出并用AUTOASSEMBLER软件进行拼接,部分EST可以延伸探针序列。再用STRIDER软件分析被延伸的序列是否具有完整的开放阅读框架(Open Reading Frame,ORF),用BLAST搜寻Genbank或SwissProt以确定该序列在核苷酸和氨基酸水平上是否与其他物种有同源性,以帮助判别所得到的基因全长完整性如何。通过电子克隆的方法,通常可获取人hALC基因的全长序列。
(2)cDNA末端快速扩增(Rapid Amplification of cDNA Ends,RACE)如果通过“电子克隆”方法仍未得到完整的cDNA全长,则在已有序列的5’或3’端设计引物,在人类肝Marathon-Ready cDNA文库(Clontech Lab,Inc,USA)中进行长距离PCR反应。然后对PCR产物克隆、测序。用AUTOASSEMBLER及STRIDER软件分析被延长的序列有无完整的ORF,如无,重复上述过程直至获得全长。
(3)RT-PCR对于5’和3’端已知的序列,如果中间尚有一段间隙(gap)无法从已有的公共数据库或自身数据库获得,可考虑采用RT-PCR的方法。在序列5’端设计引物,3’端引物采用Oligo-dT,在肝总RNA库中进行扩增。然后对产物进行克隆、测序。最后拼接并获得全长。
通过组合使用上述3种方法,获得了候选的人hALC蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物R1:5’-TCCAGTGTTTCTGGCAGTTG-3’(SEQ ID NO.4)为正向引物,寡核苷酸R2:5’-TTGTGGTCTGATTGCACCAT-3’(SEQ ID NO.5)为反向引物,以肝的总RNA为模板,进行RT-PCR扩增,R1/R2的PCR条件为94℃5分钟,随之以94℃30秒、60℃30秒和72℃1分钟进行35个循环,最后以72℃延伸5分钟。电泳检测PCR扩增产物,获得扩增片段长度为1988bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.6所示的序列。
实施例2人hALC基因的序列信息与同源性分析本发明新的人hALC全长cDNA(GenBank Accession No.AY013707。在本申请之前未公开过)的长度为1988bp,详细序列见SEQ ID NO.6,其中开放读框位于31-1671位核苷酸。根据全长cDNA推导出人hALC的氨基酸序列,共546个氨基酸残基,分子量59987.88,pI为5.49。详细序列见SEQ ID NO.7。
将hALC的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与家鼠的EF-9基因存在一定的同源性。在核苷酸水平上,它与家鼠EF-9基因的mRNA全编码序列(GenBank Accession No.U72678)有86.4%的相同性(附表2),在氨基酸水平上,它与家鼠EF-9蛋白(GenPept Accession No.AAB51038)的第1-154位氨基酸残基有92.9%的相同性和92.0%的相似性(附表3)。由上可见,hALC基因与家鼠EF-9基因无论从核酸还是蛋白水平上都存在较高的同源性,可以认为两者在功能上也有很高相似性。
本发明的人hALC除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明的人hALC还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明的人hALC蛋白的N端与家鼠EF-9蛋白的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人hALC的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
此外,本发明人hALC核酸(编码序列或反义序列)可以被引入细胞,以提高人hALC的表达水平或者抑制人hALC的过度表达。本发明的人hALC蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人hALC缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
由于本发明的人hALC蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种(如家鼠)的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
实施例3人hALC蛋白的功能研究1、家鼠EF-9基因的表达情况实验证据表明,家鼠EF-9基因在家鼠体内只在肝脏中特异性表达。进一步研究后我们发现,家鼠EF-9基因在家鼠胚胎发育晚期开始表达。
2、人hALC基因的表达情况通过对hALC基因在大量人体组织中的表达情况进行研究,我们发现hALC基因也仅在人体肝脏特异性表达。但是,在肝癌组织中,hALC基因表达丢失。
分析
通过对上述实验结果的对比分析,我们可以得出结论hALC基因可能与组织分化相关,是一种潜在的肝癌疾病检测标记(marker),并且有望在基因治疗中得以应用。
实施例4人hALC多肽的制备和提纯在该实施例中,将全长的人hALC编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将人hALC多肽以GST融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌根据人hALC的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物(分别对应于编码序列5’和3’端的约20个以上核苷酸),并在正反引物上分别引入限制性内切酶位点(这根据选用的pGEX-2T载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人hALC基因在保证阅读框正确的前提下克隆至pGEX-2T载体(Pharmacia,Piscataway,NJ)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌DH5α,筛选鉴定得到含有pGEX-2T-hALC表达载体的工程菌DH5α-pGEX-2T-hALC。
表达GST-hALC重组蛋白的工程菌的分离鉴定挑取单菌落的DH5α-pGEX-2T-hALC工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达GST-hALC融合蛋白的工程菌。
GST-hALC融合蛋白的提取纯化按上述方法诱导表达GST-hALC融合表达蛋白的工程菌DH5α-pGEX-2T-hALC。诱导后的细菌离心沉淀,按每400ml菌加入20ml PBS重悬细菌,超声破碎细菌。破菌完全的超声液按每毫升加入20微升的量加入PBS饱和的50%谷胱苷肽Sepharose4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了GST-hALC的谷胱苷肽Sepharose4B,弃上清。按每毫升超声液所得沉淀加入100μl PBS的量清洗两次,而后按每毫升超声液所得沉淀加入10μl还原型谷胱苷肽洗脱液,室温置10分钟,10000rpm离心10分钟,上清即为洗脱的融合蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在60kDa处的蛋白质条带即为人hALC蛋白。
实施例5人hALC蛋白或多肽在昆虫细胞中进行真核细胞表达1.人hALC杆状病毒表达载体的构建及转染Sf9昆虫细胞株根据人hALC的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人hALC cDNA在保证阅读框架的前提下克隆至pVL1392载体(Invitrogen,Carlsbad,CA)。鉴定好的表达载体3μg,野生型线性杆状病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml无血清的昆虫培养基中,振荡15秒混匀,室温孵育15分钟备用。取1ml(2×106)Sf9昆虫细胞悬液于60mm组织培养板中,贴壁1小时后换转染培养基,室温孵育15分钟后弃培养基,加入前面制备好的DNA载体转染混合物,Parafilm密封培养板,于室温27℃振摇培养4小时,而后换完全培养基培养3天,收集上清备用。
2.转入重组表达载体的昆虫细胞株的筛选鉴定转染3天后的昆虫细胞用新鲜培养基制成细胞悬液(2×106/1ml),取1ml细胞悬液置于60mm组织培养皿中,加入3ml培养基,100μl收集的培养上清,贴壁1小时,弃2ml培养基,继续室温培养1小时,弃去所有的培养基,加入预热的含20μl4%X-gal的3ml半固体培养基,培养5-7天后挑取白色细胞克隆于96孔培养板中培养3-5天,而后吸取上清感染Sf9昆虫细胞。
收集感染的细胞进行Western鉴定。将细胞裂解后进行SDS-PAGE电泳,电泳后的胶于Pharmacia的MultiphorⅡ半干电转移仪中将蛋白质转印到硝酸纤维膜上,将硝酸纤维膜置于封闭液中封闭1小时,而后于抗人hALC的抗体溶液中封闭1小时,TBS液振摇清洗5分钟共2次,而后将膜置于生物素标记的抗人hALC一抗的第二抗体溶液中振摇1小时,TBS清洗,加入亲和素-碱性磷酸酶复合物反应30分钟,TBS清洗2次,加入新鲜配制的显色液显色观察蛋白条带。
挑取高表达人hALC的Sf9细胞克隆。
3.人hALC蛋白的提取纯化用高表达人hALC的Sf9细胞克隆的上清大量感染Sf9细胞,感染48小时后收集细胞,PBS洗涤。每2×108细胞加入20ml细胞裂解液(0.5%Triton X-100,20mMNa3PO4(磷酸钠,pH7.8),500mM NaCl,1mM Na3VO4(钒酸钠),1mM Pefabloc,1μg/ml胃蛋白酶抑制剂,亮抑蛋白酶肽和抑蛋白酶肽)破细胞,12000×g离心20min去除细胞碎片,上清按每2×108的细胞加入2ml NTA-琼脂糖(Qiagen,Germany),4℃吸附1小时。而后用含100nM咪唑的His缓冲液洗涤两次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的缓冲液洗脱以得到纯化的蛋白。洗脱液保存于4℃,并进行SDS-PAGE电泳检测提取的人hALC蛋白的纯度。在60kDa处的蛋白质条带即为人hALC蛋白。
实施例6抗人hALC抗体的制备1.免疫小鼠和脾细胞的制备将实施例5和实施例6中获得的人hALC蛋白用层析法进行分离后备用,也可以用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中割下,并用等体积的完全Freund’s佐剂乳化。取6-8周龄Balb/C雌鼠,用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量再加强免疫一次,3-5天后用于融合。其中,脾细胞制备见鄂征主编,《组织培养和分子细胞学技术》,北京出版社,第210页。
2.按《组织培养和分子细胞学技术》(同上),第371页中的方法,制备饲养细胞。
3.按《组织培养和分子细胞学技术》(同上),第213页中的方法,进行细胞融合。
4.抗体的检测在细胞融合10-15天后,需逐孔进行检查,一旦发现旺盛的杂交细胞集落生长,就应用人hALC蛋白做抗体活性的初步筛选,常用的方法有免疫荧光试验、发射免疫试验(RIA)、酶联免疫吸附试验(ELISA)。检查出抗体活性的孔后,立刻进行克隆培养,并分离出抗体。
本发明涉及的序列及记号分列如下(1)SEQ ID NO.1的信息(ⅰ)序列特征(A)长度50bp
(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅲ)序列描述SEQ ID NO.1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT 50(2)SEQ ID NO.2的信息(ⅰ)序列特征(A)长度13bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅲ)序列描述SEQ ID NO.2AATTCGGCAC GA G 13(3)SEQ ID NO.3的信息(ⅰ)序列特征(A)长度9bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅲ)序列描述SEQ ID NO.3GCCGTGCTC 9(4)SEQ ID NO.4的信息(ⅰ).序列特征(A)长度20bp(B)类型核苷酸(C)链性单链
(D)拓扑结构线性(ⅱ).分子类型寡核苷酸(ⅲ).序列描述SEQ ID NO.4TCCAGTGTTTCTGGCAGTTG 20(5)SEQ ID NO.5的信息(ⅰ).序列特征(A)长度20bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ⅱ).分子类型寡核苷酸(ⅲ).序列描述SEQ ID NO.5TTGTGGTCTGATTGCACCAT 20(6)SEQ ID NO.6的信息(ⅰ)序列特征(A)长度1988bp(B)类型核苷酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型核苷酸(ⅲ)序列描述SEQ ID NO.61 TCCAGTGTTT CTGGCAGTTG GTCCAGAAGG ATGCCTCCAT TCCTGCTTCT51 CACCTGCCTC TTCATCACAG GCACCTCCGT GTCACCCGTG GCCCTAGATC101 CTTGTTCTGC TTACATCAGC CTGAATGAGC CCTGGAGGAA CACTGACCAC151 CAGTTGGATG AGTCTCAAGG TCCTCCTCTA TGTGACAACC ATGTGAATGG201 GGAGTGGTAC CACTTCACGG GCATGGCGGG AGATGCCATG CCTACCTTCT251 GCATACCAGA AAACCACTGT GGAACCCACG CACCTGTCTG GCTCAATGGC301 AGCCACCCCC TAGAAGGCGA CGGCATTGCG CAACTGCCAG GCTTGTGCCA351 CGCTTCAATG GGAACTGCTG TCTCTGGAAC ACCACGGTGG AAGTCAAGGC401 TTGCCCTTGG AGGCTACTAT GTGTATCGTC TGACCAAGCC CAGCGTCTGC451 TTCCACGTCT ACTGTGGTCA TTTTTATGAC ATCTGCGACG AGGACTGCCA501 TGGCAGCTGC TCAGATACCA GCGAGTGCAC ATGCGCTCCA GGAACTGTGC551 TAGGCCCTGA CAGGCAGACA TGCTTTGATG AAAATGAATG TGAGCAAAAC601 AACGGTGGCT GCAGTGAGAT CTGTGTGAAC CTCAAAAACT CCTACCGCTG651 TGAGTGTGGG GTTGGCCGTG TGCTAAGAAG TGATGGCAAG ACTTGTGAAG701 ACGTTGAAGG ATGCCACAAT AACAATGGTG GCTGCAGCCA CTCTTGCCTT751 GGATCTGAGA AAGGCTACCA GTGTGAATGT CCCCGGGGCC TGGTGCTGTC801 TGAGGATAAC CACACTTGCC AAGTCCCTGT GTTGTGCAAA TCAAATGCCA851 TTGAAGTGAA CATCCCCAGG GAGCTGGTTG GTGGCCTGGA GCTCTTCCTG901 ACCAACACCT CCTGCCGAGG AGTGTCCAAC GGCACCCATG TCAACATCCT951 CTTCTCTCTC AAGACATGTG GTACAGTGGT CGATGTGGTG AATGACAAGA1001 TTGTGGCCAG CAACCTCGTG ACAGGTCTAC CCAAGCAGAC CCCGGGGAGC1051 AGCGGGGACT TCATCATCCG AACCAGCAAG CTGCTGATCC CGGTGACCTG1101 CGAGTTTCCA CGCCTGTACA CCATTTCTGA AGGATACGTT CCCAACCTTC1151 GAAACTCCCC ACTGGAAATC ATGAGCCGAA ATCATGGGAT CTTCCCATTC1201 ACTCTGGAGA TCTTCAAGGA CAATGAGTTT GAAGAGCCTT ACCGGGAAGC1251 TCTGCCCACC CTCAAGCTTC GTGACTCCCT CTACTTTGGC ATTGAGCCCG1301 TGGTGCACGT GAGCGGCTTG GAAAGCTTGG TGGAGAGCTG CTTTGCCACC1351 CCCACCTCCA AGATCGACGA GGTCCTGAAA TACTACCTCA TCCGGGATGG1401 CTGTGTTTCA GATGACTCGG TAAAGCAGTA CACATCCCGG GATCACCTAG1451 CAAAGCACTT CCAGGTCCCT GTCTTCAAGT TTGTGGGCAA AGACCACAAG1501 GAAGTGTTTC TGCACTGCCG GGTTCTTGTC TGTGGAGTGT TGGACGAGCG1551 TTCCCGCTGT GCCCAGGGTT GCCACCGGCG AATGCGTCGT GGGGCAGGAG1601 GAGAGGACTC AGCCGGTCTA CAGGGCCAGA CGCTAACAGG CGGCCCGATC1651 CGCATCGACT GGGAGGACTA GTTCGTAGCC ATACCTCGAG TCCCTGCATT1701 GGACGGCTCT GCTCTTTGGA GCTTCTCCCC CCACCGCCCT CTAAGAACAT1751 CTGCCAACAG CTGGGTTCAG ACTTCACACT GTGAGTTCAG ACTCCCAGCA1801 CCAACTCACT CTGATTCTGG TCCATTCAGT GGGCACAGGT CACAGCACTG1851 CTGAACAATG TGGCCTGGGT GGGGTTTCAT CTTTCTAGGG TTGAAAACTA1901 AACTGTCCAC CCAGAAAGAC ACTCACCCCA TTTCCCTCAT TTCTTTCCTA1951 CACTTAAATA CCTCGTGTAT GGTGCAATCA GACCACAA(7)SEQ ID NO.7的信息(ⅰ)序列特征(A)长度546氨基酸(B)类型氨基酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型多肽(ⅲ)序列描述SEQ ID NO.7:1 MPPFLLLTCL FITGTSVSPV ALDPCSAYIS LNEPWRNTDH QLDESQGPPL51 CDNHVNGEWY HFTGMAGDAM PTFCIPENHC GTHAPVWLNG SHPLEGDGIA101 QLPGLCHASM GTAVSGTPRW KSRLALGGYY VYRLTKPSVC FHVYCGHFYD151 ICDEDCHGSC SDTSECTCAP GTVLGPDRQT CFDENECEQN NGGCSEICVN201 LKNSYRCECG VGRVLRSDGK TCEDVEGCHN NNGGCSHSCL GSEKGYQCEC251 PRGLVLSEDN HTCQVPVLCK SNAIEVNIPR ELVGGLELFL TNTSCRGVSN301 GTHVNILFSL KTCGTVVDVV NDKIVASNLV TGLPKQTPGS SGDFIIRTSK351 LLIPVTCEFP RLYTISEGYV PNLRNSPLEI MSRNHGIFPF TLEIFKDNEF401 EEPYREALPT LKLRDSLYFG IEPVVHVSGL ESLVESCFAT PTSKIDEVLK451 YYLIRDGCVS DDSVKQYTSR DHLAKHFQVP VFKFVGKDHK EVFLHCRVLV501 CGVLDERSRC AQGCHRRMRR GAGGEDSAGL QGQTLTGGPI RIDWED附表2 h.seq人hALC蛋白的核酸序列(GenBank Accession No.AY013707)m.seq家鼠EF-9蛋白的核酸序列(GenBank Accession No.U72678)附表3 h.pep人hALC蛋白氨基酸序列m.pep家鼠EF-9蛋白氨基酸序列(GenBank Accession No.AAB51038)
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人hALC蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.7所示的氨基酸序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列。
4.一种分离出的人hALC蛋白多肽,其特征在于,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.7序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞,其特征在于它包括原核细胞和真核细胞。
8.一种产生具有人hALC蛋白质活性的多肽的方法,特征在于其步骤如下(1)将编码具有人hALC蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人hALC蛋白表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第31-1671位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人hALC蛋白的重组细胞;(3)在适合表达人hALC蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人hALC蛋白活性的多肽。
9.一种能与权利要求7所述的人hALC蛋白多肽特异性结合的抗体,其特征在于它包括多克隆抗体和单克隆抗体。
10.一种核酸分子,其特征在于,它包含权利要求1所述的DNA分子中8-100个连续核苷酸。
11.一种用于检测样品中是否存在人hALC核苷酸序列的方法,其特征在于它包括用权利要求10所述探针与样品进行杂交,然后检测探针是否发生了结合,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人hALC核苷酸编码序列,并可位于该编码序列的两侧或中间,引物长度为15~50个核苷酸。
全文摘要
本发明提供了一种在人体肝中表达的新的人hALC蛋白及其编码序列,本发明还提供了该蛋白和核酸序列的制备方法,以及在样品中检测人hALC核酸序列和多肽的方法。
文档编号C07H21/00GK1316515SQ01105340
公开日2001年10月10日 申请日期2001年2月15日 优先权日2001年2月15日
发明者徐志刚, 许相儒, 肖华胜, 张新, 程志红, 陈竺, 韩泽广 申请人:国家人类基因组南方研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1