专利名称:一种新的人基因序列、其编码的多肽及制备方法
技术领域:
本发明涉及一种新的多核苷酸,由该多核苷酸编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产。更具体地说,本发明的多肽被鉴定为rho基因家族的一个新成员。
哺乳动物的ras基因编码长约189个氨基酸的GTP结合蛋白,该蛋白在体内的多种细胞中表达,调节膜上受体和生物学反应之间的信号传递途径。不同的生长因子、细胞因子与各自受体作用后,最终激活ras通道,通过ras-GTP和ras-GDP的活性转换,将胞外一系列促生长信号转导到胞内,使胞内的一系列蛋白激酶磷酸化,最终使得核内转录因子磷酸化,从而调控细胞迁移、增殖和胞内物质转运(Satoch T et al.,J.Biol.Chem.,1992,267(34),24149)。
一些与ras同源的基因与ras共同组成了ras基因超家族。ras家族成员之间的同源性通常较低,但是保守区却较为一致。ras家族成员有四个同源性最显著的与鸟嘌呤核苷酸的结合和水解有关的区域,一旦这些区域突变,可能使细胞发生形态变化(Barbacod M.,Anne.Rev.Biochem.,1987(56),779-827)。很多ras相关蛋白如H-、K-和N-ras蛋白,在C端还有第五个保守域,与膜上的定位和生物活性有关(Fujayama A.et al,Proc.Nat.Acad.Sci.USA.,1986(83),1266-1270)。
ras家族的蛋白在真核生物中广泛存在,与多种癌症的发生有关,已经证实,ras基因发生突变(如蛋白结构发生改变,或基因表达水平提高)会引发癌症(ChangEH et al..Nature,1982(297),479-483),人的肿瘤中有10~20%与ras的突变有关(Macaba IG.et al.,FASEB J.,1996(10),625-630)。
目前,哺乳动物中,ras基因超家族的成员已经超过50个,可以根据结构分为几类(Macaba IG.et al.,FASEB.J.,1996(10),625-630)1)H-ras、K-ras和N-ras原癌基因,与细胞分化和生长有关。
2)rab基因,与细胞不同区室之间的出芽和囊泡运输有关。
3)ARF和ARL基因,与细胞不同区室之间的出芽和囊泡运输有关。
4)rho基因,与肌动蛋白细胞骨架的重建和形成有关。
5)ran基因,与核蛋白通过核孔的运输有关其中,rho基因家族是一族小的GTP激酶,其成员(哺乳动物中)包括十种蛋白,如rhoA,rac1,cdc42和TC10等(Boguski MS et al.,Nature,1993(366),643-654)。最早发现的rhoA是在雨虎属(Aplysia)的腹腔神经节中发现的,之后,在包括人在内的其他真核生物中都发现了一些rho基因,而且在不同的生物中以非常保守的形式存在(Madaule P.et al.,Cell,1985(41),31-40)。rho家族成员之间的同源性为50~55%,与ras之间的同源性为30%。除了TC10有组织特异性外,其它蛋白均在体内广泛表达。
rho家族的蛋白具有重要的生理功能,它们参与了形态发生和细胞骨架的形成、嗜中性白细胞的活化、细胞分裂和形态变化、蛋白激酶级联反应及磷脂代谢和转录后调控(Macaba IG.et al.,FASEB J.,1996(10),625-630)。首先发现rho蛋白的功能,是因为发现细菌的C3转移酶可以使动物细胞的rho蛋白的天冬酰胺残基ADP核糖基化,使之失活,进而使动物细胞失去它们的肌动蛋白应力而发生弯曲(Chardin P.et al,EMBO J.,1989(8),1087-1092)。目前已确定,在rho家族成员中,cdc42诱导线状伪足的形成,rac激活片状伪足的形成,rho则诱导应力纤维和粘着斑的生成(Nobes CD.et al.,Biochem.Soc.Trans.,1995(23),456-459)。在各种GTP激酶之间存在有序的相互作用,如Rac可以决定Rho的活力,Cdc42可以决定Rac的活力。在各个蛋白之间存在反馈抑制,但机理尚不详(Cantor SB et al.,Mol.Cell.Biol.,1995(15),4578-4584)。在Rac和Rho之间没有直接的关联,但Rac激活的磷脂酶A2能引起前列腺素的形成和释放,而前列腺素通过与细胞表面特定受体的相互作用,可以激活Rho(Peppelenboasch MP.et al.,Cell,1995(81),849-856)。
1989年,Davis GR等人在人的畸胎瘤(teratocarcinoma,简称TC)的cDNA文库的一个克隆中发现人的TC10,它是由2.3kb的cDNA编码了一个205~213个氨基酸的蛋白,分子量约为24kD(Davis GR.et al.,Mol.Cell.Biol,1990,Vol10(4),463-468)。
然而,在本申请之前没有公开或发表过本发明涉及的这种新的rho家族成员。
本发明的一个目的是提供一种新的多核苷酸,该多核苷酸编码rho基因家族的一个新成员,本发明中新的人rho家族的基因被命名为TC10H基因。
本发明的另一个目的是提供一种新的rho基因蛋白家族成员,该蛋白被命名为TC10H蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人TC10多肽的方法。
本发明还涉及这种人TC10基因序列和多肽的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括编码具有人TC10H蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。更佳地,该序列是SEQ ID NO.3中从核苷酸46-690位的核苷酸序列。
在本发明的另一方面,提供了一种分离的TC10H蛋白多肽,它包括具有SEQID NO.4氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.4序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有人TC10H蛋白活性的多肽的方法,该方法包括(a)将编码具有TC10H蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成TC10H蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成TC10H蛋白的重组细胞;(c)在适合表达TC10H蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有TC10H蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为760个核苷酸,其详细序列见SEQ ID NO.3,其中开放读框位于46-690位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“TC10H蛋白(或多肽)编码序列”指编码具有人TC10H蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中46-690位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框46-690位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中46-690位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.4所述的序列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下,与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列杂交的核苷酸序列。此外,该术语还包括与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%的核苷酸序列。
该术语还包括能编码具有与人TC10H相同功能的蛋白的、SEQ ID NO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“TC10H蛋白多肽”指具有人TC10H蛋白活性的SEQ ID NO.4序列的多肽。该术语还包括具有与人TC10蛋白相同功能的、SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括TC10H蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与TC10H DNA杂交的DNA所编码的蛋白、以及利用抗TC10H多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含TC10H多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还提供了TC10H多肽的可溶性片段。通常,该片段具有TC10H多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供TC10H蛋白或多肽的类似物。这些类似物与天然TC10H多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还可以包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸、磷酸丝氨酸、磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,“TC10H保守性变异多肽”指与SEQ ID No.4的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。较佳地,这些保守性变异多肽根据表1进行替换而产生。
表1
<p>本发明还包括TC10H多肽编码序列及其片段的反义序列。这种反义序列可用于抑制细胞内TC10H的表达。
本发明还包括一种可用作探针或引物的核苷酸分子,该分子通常具有TC10H核苷酸序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码TC10H的核酸分子。
本发明还包括检测TC10H核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于TC10H多肽的编码序列,可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。比如,选用市售的载体,然后将编码本发明多肽的核苷酸序列可操作地连于表达调控序列,可以形成蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻近,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对TC10H DNA或是其片段编码的多肽具有特异性抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于TC10H基因产物或片段。较佳地,指那些能与TC10H基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制TC10H蛋白的分子,也包括那些并不影响TC10H蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的TC10H基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的TC10H基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达TC10H或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断TC10H功能的抗体以及不影响TC10H功能的抗体。本发明的各类抗体可以利用TC10H基因产物的片段或功能区,通过免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与TC10H基因产物的未修饰形式结合的抗体,可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的人TC10H核苷酸序列全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按已知方法制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
在本发明的一个实施方案中,本发明获得的多核苷酸全长为760个核苷酸,其详细序列见SEQ ID NO.3,其中开放读框位于46-690位核苷酸。该多核苷酸是如此获得的,以人胎脾λgt11cDNA文库(购自Clontech公司)为模板,合成正向引物A15′-GAGAAGCAATAGCAGCAGGAGTC-3′和反向引物B15′-TGGAGCTTGGCC ACAGAGATTGG-3′进行PCR,获得760bp的目的片段。测序后得到SEQ ID NO.3的全长cDNA序列。
根据同源比较的结果,本发明的核苷酸序列及其编码的蛋白质序列与不同来源的rho基因显示了显著的同源性,因此,这表明它是rho基因家族的一个新成员,并且具有rho基因家族蛋白的一些重要功能。
rho家族成员能调控肌动蛋白的聚合,进而调控肌动蛋白细胞骨架的生成(Pollard TD.et al.,Guidebook to the Cytoskeletal and Motor Proteins,OxfordUniversity Press,3-11)。此外,rho家族成员还与多种粘着结构如病灶复合物,粘着连接和紧密连接的形成有关,而这些特化的粘着复合物的形成为表型变化和迁移等功能提供了分子基础。由于细胞增殖的时候,涉及细胞骨架的重组,因此rho家族成员还可以控制细胞的繁殖(Symons M,TIBS,1996(21),178-181)。由于rho家族的蛋白参与了形态发生和细胞骨架的形成、嗜中性白细胞的活化、细胞分裂和形态变化、蛋白激酶级联反应、磷脂代谢和转录后调控,因而具有重要的生理功能,并在癌症的发病机理中有着极其重要的作用(Macaba IG.et al.,FASEBJ.,1996(10),625-630)。研究揭示,本发明的TC10H与肌动蛋白和细胞骨架密切相关,并可能与癌症的发病有关。
在附图中,
图1为本发明的人TC10H与TC10的核酸序列的同源比较图。其中,相同的核苷酸用“|”标出。
图2为本发明的人TC10H与TC10的氨基酸序列的同源比较图。其中,相同的氨基酸在两个序列之间用“|”标出,相似的氨基酸用“·”标出。相似的氨基酸是A,S,T;D,E;N,Q;R,K;I,L,M,V;F,Y,W。
图3为本发明的人TC10H蛋白(PTC10H)与人TC10蛋白(PTC10)、人的H-ras蛋白(HRAS)和人rhoA1蛋白(PRHOA1)的氨基酸序列的同源比较图。其中,完全保守的氨基酸在序列下方用“*”标出,保守性较高的氨基酸用“·”标出。在ras家族和rho家族中保守的4个功能域用下划线标出。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkCold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1人TC10H的cDNA序列的克隆和测定
1.引物扩增以人胚脾λgt11cDNA文库(购自Clontech公司)为模板,用一对寡核苷酸为引物——A5′-GAGAAGCAATAGCAGCAGGAGTC-3′(SEQ ID NO.1)为正向引物,寡核苷酸B5′-TGGAGCTTGGCCACAGAGATTGG-3′(SEQ ID NO.2)为反向引物,进行PCR。PCR条件为93℃4分钟,随之以93℃1分钟、68℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。电泳检测得到的PCR片断为760bp的目的片段。
2.PCR产物的测序将如上获得的PCR扩增产物与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTMDNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共760bp,详细序列见SEQ ID NO.3,其中开放读框位于46-690位核苷酸。
根据得到的全长cDNA序列推导出TC10H的氨基酸序列,共214个氨基酸残基,其氨基酸序列详见SEQ ID NO.4。
实施例2同源比较用实施例1中获得的本发明人TC10H基因的全长cDNA序列及其编码蛋白,在Non-redundant GenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBankCDS translations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST软件进行核酸和蛋白同源检索。结果发现,与rho蛋白家族的成员具有较高的同源性,其中与人TC10(GenBank编号M31470)在核酸水平上达到72%同一性(图1),蛋白水平上达到75%同一性(identity),81%相似性(图2);与人的rhoA基因在核酸水平上达到51%同一性,蛋白水平上达到50%同一性,63%相似性。
经研究发现,本发明的TC10H蛋白具有如下结构特征1)本发明的TC10H有ras蛋白的四个保守的功能域。研究表明,ras家族成员之间的同源性较低,但是与功能有关的保守区是较为一致的。ras蛋白H-ras有10-17,57-62,113-120和143-147位氨基酸等四个保守功能域。这四个功能域与鸟嘌呤核苷酸的结合和水解有关(Drivas GT.et al,Mol.Cell.Biol.,1990,Vol10(4),463-468)。本发明的TC10H也存在类似的4个功能域,它们分别是SEQ ID NO.4中第28-35,75-80,130-137和174-178位氨基酸序列,并与H-ras的上述四个功能域有63%、100%、50%和60%的同一性(参见图3),与TC10的这4个相应的功能域的同一性为100%、100%、100%和100%(参见图3)。这表明,本发明的TC10H是rho家族的一员。
2)本发明的TC10H的C末端为CAAX结构,其中C代表半胱氨酸,A代表脂肪族的氨基酸(包括甘氨酸、丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰胺、谷酰胺、天冬氨酸、谷氨酸、赖氨酸和精氨酸等),X代表C末端的氨基酸。研究表明,CAAX结构是ras家族成员的另一个重要的结构特征,与膜上的定位和生物活性有关(Powers S.et al..Cell,1984(36),607-612)。因为ras蛋白的可溶性前体合成后,将转移到细胞膜的内叶(inner leaflet),并与脂类紧密结合。C末端该结构的缺失,将抑制脂类的附加和ras蛋白与膜的结合,使细胞失去变化表型的能力(Madaule P.et al.,Cell,1985(41),31-40)。在本发明的TC10H蛋白中,CAAX结构为CSII,即半胱氨酸-丝氨酸-异亮氨酸-异亮氨酸。这表明,本发明的TC10H蛋白也具有与膜上定位有关的活性。
3)研究表明,ras家族成员有一重要特点,即具有较为一致的分子量,约为21KD。这是因为ras家族成员均是作为蛋白质复合物中的一个亚基发挥功能,因此分子的大小将直接影响其功能。本发明的TC10H编码的蛋白分子量约为23~24KD(与TC10蛋白长度相差一个氨基酸),与此特征基本符合。
这些结构特征表明,本发明的TC10H蛋白具有与ras超家族(尤其rho家族)其它成员相同或相近的生化反应活性,如与鸟嘌呤核苷酸的结合和GTP酶反应活性。
研究表明,rho家族的蛋白与Ras蛋白一样,是一种“分子开关”结合GTP时,为活化状态(“开”);结合GDP时,为失活状态(“关”)。在两种状态之间的转换由一系列蛋白控制,如鸟嘌呤核苷酸交换因子(Guanine nucleotide exchangefactors,GEFs)、GTP酶激活蛋白(GTPase activating proteins,GAPs)和GDP解离抑制因子(GDP-dissociation inhibitory factors,GDIs)(Takuya S.et al.,Biochem.Biophy.Res.Commun.,1998(245),641-645)。rho家族的蛋白参与了形态发生和细胞骨架的形成、嗜中性白细胞的活化、细胞分裂和形态变化、蛋白激酶级联反应、磷脂代谢和转录后调控,因而具有重要的生理功能(Macaba IG.etal.,FASEB J.,1996(10),625-630)。
rho家族成员与肌动蛋白有密切的关系。动物细胞的肌动蛋白细胞骨架能够维持细胞形状,在细胞运动、吞噬作用和胞质分裂中发挥重要作用。由ras基因和其它癌基因引起的细胞表型变化总是伴随着肌动蛋白细胞骨架组织的显著变化,尤其是应力纤维的生成明显减少。在分子水平上,这些变化表现为与肌动蛋白细胞骨架有关的蛋白(如α-肌动蛋白、粘着斑蛋白和某些原肌球蛋白)的合成减少。如果这些蛋白中任何几种甚至一种的正常水平得到了恢复,细胞的表型变化将被抑制,致瘤性将减少,说明细胞的表型变化必须经过肌动蛋白细胞骨架的重组(Symaons M,Curr.Opin.Biotech.,1995(6),668-674)。因此,肌动蛋白细胞骨架成为许多抗癌药物的作用对象,任何能有效的影响肌动蛋白聚合形成肌动蛋白细胞骨架或起解离的物质均有可能成为抗癌药物,如cytochalasins和stypoldione等(Mary AJ.et al.,Curr.Opin.Cell.Biol.,1998(10),123-130)。
研究表明,rho家族成员可调控肌动蛋白的聚合。已发现,细胞中的丝状肌动蛋白(filamentous actin)通常形成三种结构(1)肌动蛋白应力纤维,为长束的肌动蛋白纤维,能横贯细胞,通过整联蛋白受体和粘着斑与细胞外基质相联,因而多见于粘着斑附近的质膜上;(2)高度密集的肌动蛋白纤维网眼,位于片状伪足和膜上皱褶中的细胞的前缘处,成褶皱状突起的片状伪足,可能与细胞迁移有关;(3)短束的肌动纤维如线状伪足,多突出于游走细胞和神经元生长圆锥的表面,与对细胞外环境的识别有关(Nobes CD.et al.,Biochem.Soc.Trans.,1995(23),456-459)。上述三种肌动蛋白结构的生成均受rho家族成员调控,如rho蛋白诱导肌动蛋白应力纤维和粘着斑的装配,rac蛋白激活肌动蛋白多聚化形成片状伪足,cdc42蛋白控制线状伪足的生成(Nobes CD.et al.,Biochem.Soc.Trans.,1995(23),456-459)。在其他类型的细胞中,rho家族成员控制了另一些以肌动蛋白为基础形成的结构。如在果蝇中,翅原基发育的几个阶段都需要Dcdc42蛋白调控极化细胞的形态变化。在动物体内,cdc42则可以调控TH细胞向抗原递呈细胞发生极化(Stowers L.et al.Proc.Natl.Acad.Sci.USA.,1995(92),5027-5031)。
rho家族成员调控肌动蛋白结构生成的机制,是因为它们能调控肌动蛋白的聚合。细胞内的肌动蛋白在单体和多聚体两种形式间迅速转变,转变的速度主要决定于两类肌动蛋白结合蛋白,一类为螯合蛋白,可以与单体结合,从而抑制聚合;另一类为肌动蛋白加帽蛋白,与形成中的纤维聚合较快的一端结合,从而抑制聚合(Pollard TD.et al.,Guidebook to the Cytoskeletal and Motor Proteins,OxfordUniversity Press,3-11)。rac、rho蛋白可以去除加帽蛋白,促进聚合,或通过一种新发现的WASP蛋白,促进聚合(机制尚不明)(Symons M,TIBS,1996(21),178-181)。
此外,rho家族成员与多种粘着结构如病灶复合物,粘着连接和紧密连接的形成有关,而这些特化的粘着复合物的形成为表型变化和迁移等功能提供了分子基础。由于细胞增殖的时候,涉及细胞骨架的重组,因此rho家族成员还可以控制细胞的繁殖(Symons M,TIBS,1996(21),178-181)。
rho家族成员对肌动蛋白细胞骨架的形成和重组的调控作用,使它们在癌症的发病机理中有着极其重要的作用。本发明蛋白的发现,有助于对该家族成员结构和功能的深入了解,有利于阐明癌症的病理发展,为研制抗癌新药提供新思路。
本发明的人TC10H除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人TC10H还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人TC10H的N端与人TC10的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人TC10H的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员,如TC10蛋白)。
例如,本发明人TC10H核酸(编码序列或反义序列)可以被引入细胞,以提高人TC10H的表达水平或者抑制人TC10H的过度表达。本发明的人TC10H蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人TC10H缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
实施例3人TC10H在大肠杆菌中的表达编码TC10H的cDNA序列是用对应于该DNA序列的5′和3′端的PCR寡核苷酸为引物,用实施例1中的PCR产物为模板进行扩增而得到。
5′寡核苷酸引物序列为5′-TTGCGGATCCATGAACTGCAAAGAGGGAAC-3′(SEQ ID NO.5),该引物含有BamHI限制性内切酶的酶切位点,接之是由起始密码子开始的TC10H编码序列的20个核苷酸;3’寡核苷酸引物序列为5,-GTTCGTCGACTCAGATAATTGAACATCAG-3’(SEQ ID NO.6),该引物含有SalI限制性内切酶的酶切位点,一个翻译终止子和TC10H的编码序列。
限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和SalI消化pQE-9载体及插入片段,随后将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。抽提质粒,用SacII酶切鉴定插入片段大小及方向,测序验证结果表明TC10H的cDNA插入片段已正确装入载体。
过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞生长至600光密度(OD600)为0.4-0.6时,加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的TC10H。用6M盐酸胍(pH5.0)从柱中洗脱TC10H。可用几种方法从盐酸胍中变性沉淀蛋白。首先,使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出的纯化蛋白可以结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的蛋白质用PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为24KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例4TC10H在真核细胞(CHO细胞株)中的表达在该实施例中,将编码TC10H的cDNA序列用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物,用实施例1中的PCR产物为模板进行扩增,以合成插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-TTGCAAGCTTATGAACTGCAAAGAGGGAAC-3′(SEQ ID NO.7),
该引物含有HindIII限制性内切酶的酶切位点,接之是由起始密码子开始的TC10H编码序列的20个核苷酸;3′端引物序列为5’-GTTCGGATCCTCAGATAATTGAACATCAG-3’(SEQ ID NO.8)该引物含有BamHI限制性内切酶的酶切位点、一个翻译终止子和TC10H的编码序列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(f1 ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
用HindIII、BamHI消化pcDNA3载体及插入片段,随后将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,测序验证结果表明TC10H的cDNA插入片段已正确装入载体。
质粒转染是采用脂转染法,用Lipofectin试剂盒(GiBco Life)进行的。转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mM Tris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mM Tris.HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mMTris.HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活性峰。然后以PBS(pH7.4)为透析液对表达蛋白溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为24KDa。
此外,用常规方法对表达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例5制备抗体将如上获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组分子用层析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀TC10H基因翻译产物的能力加以评估。结果发现,抗体可特异性地与本发明蛋白发生沉淀。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(1)一般信息(i)申请人复旦大学(ii)发明名称一种新的人基因序列、其编码的多肽及制备方法(iii)序列数目8(2)SEQ ID NO.1的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.1GAGAAGCAAT AGCAGCAGGA GTC 23(2)SEQ ID NO.2的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO2TGGAGCTTGGCCACAGAGATTGG23(2)SEQ ID NO.3的信息(i)序列特征
(A)长度760bp(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO.3GAGAAGCAAT AGCAGCAGGA GTCCCCAGCA GCTGGAGCCG CAAGAATGAA CTGCAAAGAG 60GGAACTGACA GCAGCTGCGG CTCAGGGGGC AACGACGAGA AGAAGATGTT GAAGTGTGTG 120GTGGTGGGGG ACGGTGCCGT GGGGAAAACC TGCCTGCTGA TGAGCTACGC CAACGACGCC 180TTCCCAGAGG AATACGTGCC CACTGTGTTT GACCACTATG CAGTTACTGT GACTGTGGGA 240GGCAAGCAAC ACTTGCTCGG ACTGTATGAC ACCGCGGGAC AGGAGGACTA CAACCAGCTG 300AGGCCACTCT CCTACCCCAA CACGGATGTG TTTTTGATCT GCTTCTCTGT CGTAAACCCT 360GCCTCTTACC ACAATGTCCA GGAGGAATGG GTCCCCGAGC TCAAGGACTG CATGCCTCAC 420GTGCCTTATG TCCTCATAGG GACCCAGATT GATCTCCGTG ATGACCCAAA AACCTTGGCC 480CGTTTGCTGT ATATGAAAGA GAAACCTCTC ACTTACGAGC ATGGTGTGAA GCTCGCAAAA 540GCGATCGGAG CACAGTGCTA CTTGGAATGT TCAGCTCTGA CTCAGAAAGG TCTCAAAGCG 600GTTTTTGATG AAGCAATCCT CACCATTTTC CACCCCAAGA AAAAGAAGAA ACGCTGTTCT 660GAGGGTCACA GCTGCTGTTC AATTATCTGA GGTTGTCTGG GACCTGCCTC CACCCCATCC 720AGGGATGAGA ATGGCAGCCA ATCTCTGTGG CCAAGCTCCA 760(2)SEQ ID NO.4的信息(i)序列特征(A)长度214个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型多肽(xi)序列描述SEQ ID NO.4Met Asn Cys Lys Glu Gly Thr Asp Ser Ser Cys Gly Ser Gly Gly 15Asn Asp Glu Lys Lys Met Leu Lys Cys Val Val Val Gly Asp Gly 30Ala Val Gly Lys Thr Cys Leu Leu Met Ser Tyr Ala Asn Asp Ala 45Phe Pro Glu Glu Tyr Val Pro Thr Val Phe Asp His Tyr Ala Val 60Thr Val Thr Val Gly Gly Lys Gln His Leu Leu Gly Leu Tyr Asp 75Thr Ala Gly Gln Glu Asp Tyr Asn Gln Leu Arg Pro Leu Ser Tyr 90Pro Asn Thr Asp Val phe Leu Ile Cys Phe Ser Val Val Asn Pro 105Ala Ser Tyr His Asn Val Gln Glu Glu Trp Val Pro Glu Leu Lys 120Asp Cys Met Pro His Val Pro Tyr Val Leu Ile Gly Thr Gln Ile 135Asp Leu Arg Asp Asp Pro Lys Thr Leu Ala Arg Leu Leu Tyr Met l50Lys Glu Lys Pro Leu Thr Tyr Glu His Gly Val Lys Leu Ala Lys 165Ala Ile Gly Ala Gln Cys Tyr Leu Glu Cys Ser Ala Leu Thr Gln 180Lys Gly Leu Lys Ala Val Phe Asp Glu Ala Ile Leu Thr Ile Phe 195His Pro Lys Lys Lys Lys Lys Arg Cys Ser Glu Gly His Ser Cys 210Cys Ser Ile Ile 214(2)SEQ ID NO.5的信息(i)序列特征(A)长度30碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.5TTGCGGATCC ATGAACTGCA AAGAGGGAAC30(2)SEQ ID NO.6的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.6GTTCGTCGAC TCAGATAATT GAACATCAG 29(2)SEQ ID NO.7的信息(i)序列特征(A)长度30碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.7TTGCAAGCTT ATGAACTGCA AAGAGGGAAC 30(2)SEQ ID NO.8的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.8GTTCGGATCC TCAGATAATT GAACATCAG 29
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人TC10H蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.3中从核苷酸46-690位的核苷酸序列。
4.一种分离的TC10H蛋白多肽,其特征在于,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.4序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有TC10H蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有TC10H蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成TC10H蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸46-690位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成TC10H蛋白的重组细胞;(c)在适合表达TC10H蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有TC10H蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.3中从核苷酸46-690位。
12.一种能与权利要求4所述的TC10H蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-100个连续核苷酸。
全文摘要
本发明涉及了一种新的rho基因家族的成员TC10H。本发明提供了该新基因TC10H的cDNA编码序列、该序列编码的多肽,以及利用重组技术生产所述的新的人TC10H多肽的方法。本发明还提供了这种新人TC10H核酸序列和多肽的应用。
文档编号C07K16/18GK1252447SQ9812196
公开日2000年5月10日 申请日期1998年10月22日 优先权日1998年10月22日
发明者余龙, 张宏来, 傅强, 赵勇, 赵寿元 申请人:复旦大学