专利名称:人hsdhml编码序列、其编码的多肽及制备方法
技术领域:
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及人HSDHML的cDNA序列,该蛋白是鼠Dhm1的同系物。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
Dhm1、dhp1、RAT1和SEP1是小鼠及酵母中发现的几个基因,它们被认为与同源重组和RNA加工有关。同源重组是所有真核和原核生中都存在的一个普遍现象。尤其是在真核生物中的配子发生过程中,同源重组是一个关键的步骤。RNA加工则对于蛋白的合成有重要作用。在本发明中,HSDHML基因与小鼠的Dhm1高度同源,同时与dhp1、RAT1、SEP1的同源性也较高,因而我们认为它是Dhm1在人中的一个同源基因,并且与Dhm1(以及dhp1、RAT1、Sep1)有着相似的生物学功能,这些功能包括RNA的加工代谢、同源重组、配子发生、微管联系核融合、端粒保持以及细胞衰老等方面。
Dhm1是小鼠中发现的一个基因。它是由日本东京大学Shobuike T等人于1995年从小鼠精母细胞cDNA文库中克隆得到的一个基因(Nucleic Acid Reserch,1995,23(3),357-361),它与酵母中的基因dhp1,RAT1和SEP1具有较高的同源性并具有相似的功能。SEP1是于1991年由Tishkoff DX等人从栗酒裂殖酵母(Schizosaccharomyces pombe)克隆的(Mol Cell Biol,1991,11,2593-2608)。其后不久,Amberg DC等运用遗传学和组织化学的方法研究酿酒酵母(Schizosaccharomyces cerebisiae)中与RNA运输有关的基因时发现了RAT1基因,该基因的编码产物具有与SEP1较高同源性的区段,并被证实具有5’外切核酸酶和催化DNA链交换的活性(Genes Dev 1992,6(7),1173-1189)。dhp1则是Sugano S等在低严谨条件下以DST2(=SEP1)的PstI-HindIII酶切片段为探针从S.pombe找到的SEP1的一个同源基因(Mol Gen Genet,1994,243,1-8)。
本发明的一个目的是提供一种新的多核苷酸序列,该多核苷酸序列编码人的一种与小鼠DHM1同源的蛋白,本发明的人的小鼠DHM1同源基因被命名为HSDHML(GenBank Accession No.AF064257)。因申请保密一段时期,所以在本申请之前该登录的序列未对公众公开。
本发明的另一个目的是提供一种新的蛋白,该蛋白被命名为HSDHML。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人HSDHML蛋白的方法。
本发明还提供了这种人HSDHML基因序列和蛋白的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括编码具有人HSDHML蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.6所示的序列。更佳地,该序列具有SEQ ID NO.5中69-2921位的核苷酸序列。
在本发明的另一方面,提供了一种分离的HSDHML蛋白多肽,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.6序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有HSDHML蛋白活性的多肽的方法,该方法包括(a)将编码具有HSDHML蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HSDHML蛋白表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HSDHML蛋白的重组细胞;(c)在适合表达HSDHML蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HSDHML蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为3170个核苷酸,其详细序列见SEQ ID NO.5,其中开放读框位于69-2921位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“HSDHML蛋白(或多肽)编码序列”指编码具有HSDHML蛋白活性的多肽的核苷酸序列,如SEQ ID NO.5中69-2921位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.5序列的编码框69-2921位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.5中69-2921位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.6所述的序列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列杂交的核苷酸序列。还术语还包括与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%的核苷酸序列。
该术语还包括能编码具有与人HSDHML相同功能的蛋白的、SEQ ID NO.5序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“HSDHML蛋白多肽”指具有HSDHML蛋白活性的SEQ IDNO.6序列的多肽。该术语还包括具有与HSDHML相同功能的、SEQ ID NO.6序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括HSDHML蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与HSDHML DNA杂交的DNA所编码的蛋白、以及利用抗HSDHML多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含HSDHML多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括HSDHML多肽的可溶性片段。通常,该片段具有HSDHML多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供HSDHML蛋白或多肽的类似物。这些类似物与天然HSDHML多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明还包括HSDHML多肽编码序列的反义序列。这种反义序列可用于抑制细胞内HSDHML的表达。
本发明还包括一种探针分子,该分子通常具有HSDHML多肽编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码HSDHML的核酸分子。
本发明还包括检测HSDHML核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于HSDHML多肽的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对HSDHML DNA或是其片段编码的多肽具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于HSDHML基因产物或片段。较佳地,指那些能与HSDHML基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制HSDHML蛋白的分子,也包括那些并不影响HSDHML蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的HSDHML基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的HSDHML基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达HSDHML或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断HSDHML功能的抗体以及不影响HSDHML功能的抗体。本发明的各类抗体可以利用HSDHML基因产物的片段或功能区,通过常规免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与HSDHML基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
在本发明中,人HSDHML的cDNA核苷酸序列是如此获得的,以人睾丸λgt11cDNA文库(购自Clontech公司)为模板,合成正向引物A15′-CCGCATGCTCCCGTATCTTTGG -3′、B15′-AAGAGAAAGGATGATGAGGACAG-3′和反向引物A25′-GGTTCACTGTCACTGTCTTCTG-3′、B25′-AAACCCGGACCTCCTATTCCTC-3’,进行PCR,分别获得1576bp(A1A2)和1886bp(B1B2)的目的片段。测序后得到SEQ ID NO.5的全长cDNA序列。
Dhm1、dhp1、RAT1和SEP1被认为与同源重组和RNA加工有关。同源重组是所有真核和原核生中都存在的一个普遍现象。尤其是在真核生物中的配子发生过程中,同源重组是一个关键的步骤。RNA加工则对于蛋白的合成有重要作用。在本发明中,HSDHML基因与小鼠的Dhm1高度同源,同时与dhp1、RAT1、SEP1的同源性也较高,因而我们认为它是Dhm1在人中的一个同源基因,并且与Dhm1(以及dhp1、RAT1、Sep1)有着相似的生物学功能,这些功能包括RNA的加工代谢、同源重组、配子发生、微管联系核融合、端粒保持以及细胞衰老等方面。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1HSDHML的cDNA序列的克隆和测定1.引物扩增以人睾丸λgt11cDNA文库(购自Clontech公司)为模板,用两对寡核苷酸为引物——A15′-CCGCATGCTCCCGTATCTTTGG-3′(SEQ ID NO1)和B15′-AAGAGAAAGGATGATGAGGACAG-3′(SEQ ID NO2)为正向引物,寡核苷酸A25′-GGTTCACTGTCACTGTCTTCTG-3’(SEQ ID NO3)和B25′-AAACCCGGACCTCCTATTCCTC-3’(SEQ ID NO4)为反向引物,进行PCR。A1、A2引物对的PCR条件为93℃4分钟,随之以93℃1分钟、66℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟;B1、B2引物对的PCR条件为93℃4分钟,随之以93℃1分钟、66℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。电泳检测得到的PCR片断,以A1、A2为引物对扩增出的目的片段长1576bp,以B1、B2为引物对扩增出的目的片段长1886bp。
2.PCR产物的测序将这两段PCR扩增产物分别与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTMDNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共3170bp,详细序列见SEQ ID NO.5,其中开放读框位于69-2921位核苷酸。
根据得到的全长cDNA序列推导出HSDHML的氨基酸序列,共950个氨基酸残基,其氨基酸序列详见SEQ ID NO.6。
实施例2同源比较用HSDHML的全长cDNA序列及其编码蛋白在Non-redundantGenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST进行核酸和蛋白同源检索。结果发现它们与小鼠Dhm1基因及其编码蛋白具有极高同源性,在核酸和蛋白水平上的同一性和相似性都达到了90%左右,所以,HSDHML是Dhm1在人中的一个同系物。除了与小鼠Dhm1间具有高度的同源性,HSDHML与酵母中的dhp1、RAT1(=TAP1=HKE1)和SEP1(=XRN1=RAR5=KEM1)之间也有较高同源性(在蛋白质水平上分别达到了40%、36%、25%同一性和48%、44%、32%相似性),特别是一些互补实验证明DHM1、dhp1、RAT1和SEP1间在功能上存在一定的相似性(Mol Cell Biol 1997,6122-6130),所以这些基因可能构成一个家族。根据结构决定功能,结构相似功能相似的原理,可以从这些基因或蛋白的功能来推测HSDHML的功能。
研究发现,SEP1编码了酿酒酵母(Saccharomyces cerevisiae)的5’外切核糖核酸酶DST2,(但实验同时证实它也有5’脱氧核糖核酸酶的活性)(J.Biol.Chem.1991,266,14046-14054;Cell 1994,77,1083-1092;Gene 1990,95,85-90),它在在RNA的降解中起重要作用(Cell 1995,81,179-183);RAT1则编码了酿酒酵母又一个5’外切核糖核酸酶(Mol.Cell.Biol.1993,13,341-350);值得注意的是,在同源检索中还可以发现HSDHML与小鼠的5’外切核酸酶(emb|x91617)间的同源度较高。以上事实暗示HSDHML很可能也具有5’外切酶脱氧核酸酶活性或5’外切核糖核酸酶活性。
DST2和RAT1还与RNA的加工、运输等过程有关。DST2参与了RNA的剪切(Gene 1990,95,85-90);而RAT1则被认为与mRNA的运输,rRNA的加工以及rRNA和tRNA的合成等RNA的代谢过程有关(Gene Dev.1992,6,1173-1189;Mol.Cell.Biol.13,3424-3433;Mol.Cell.Biol.13,3444-3444)。这说明HSDHML同样可能在RNA代谢中扮演了重要角色。
众所周知,RNA加工代谢则对于蛋白的合成有重要作用,因此HSDHML在生物体内起着重要作用。。
除此之外,研究还发现在SEP1基因缺陷型菌株中,同源重组的频率大大降低了,并且其孢子形成变为温度敏感型(Mol.Cell.Biol 1991,11,2583-2592;Mol.Cell.Biol.11,2593-2608),这说明SEP1对同源重组和孢子形成有重要作用,特别是小鼠Dhm1基因在睾丸中高表达,暗示我们该基因可能与配子形成有关(Nucleic Acids Research 1995,23(3),357-361)。DST2还有G4-DNA依赖的核酸酶活性。在SEP1无义突变的酵母品系中,还观察到了细胞衰老和端粒缩短两种表型(Proc.Natl Acad Sci.USA 1995 92(13),6002-6006)。端粒是染色体端部一段富含鸟嘌呤的顺序,对防止染色体融合、缺失,保持染色体稳定有重要作用。并且,广泛的研究发现,端粒的缩短与细胞衰老间有着密切的联系(Nippon Rinsho1993,51(7),1899-1906)。另外,在一些丧失了SEP1功能的酵母品系中,显示了多种与微管功能相联系的表型,如对导致微管不稳定药物(如benomyl)的敏感性增强、核配合缺陷(karyogamy defect)、纺锤体两极分离缺陷、核转移缺陷等。生化、遗传上的证据也都显示了SEP1与微管间的联系。上述结果说明SEP1在包括同源重组、孢子(配子)发生、端粒保持、细胞衰老和微管功能等多种细胞过程中起作用,同时也提示本发明的HSDHML也可能有这些方面的类似功能。
实施例3HSDHML在大肠杆菌中的表达在该实施例中,将在实施例1中获得的两个片段分别用EcoRV酶切,混合并加入连接酶连接,连接完成后走电泳,鉴定并回收正确连接的全长片段。在该实施例中,编码HSDHML的cDNA序列(GenBank Accession No.AF064257),用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得HSDHML cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-AACGGGATCCATGGGAGTCCCGGCGTTCT-3′(SEQ ID NO.7),该引物含有BamHI限制性限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的HSDHML编码序列的19个核苷酸;3′端引物序列为5’-CTAGGTCGACTTAATTCCAATTGTATCTT-3’(SEQ ID NO.8),该引物含有SalI限制性限制性内切酶的酶切位点、翻译终止子和HSDHML的部分编码序列。
引物上的限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和SalI消化pQE-9载体以及插入片段,随后将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,抽提质粒,测序验证HSDHML的cDNA片段已正确插入了载体。
在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞至600光密度(OD600)为0.4-0.6,随后加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的HSDHML。用6M盐酸胍(pH5.0)从柱中洗脱HSDHML。可用几种方法从盐酸胍中变性沉淀蛋白。或者,使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出纯化蛋白。纯化后的蛋白质被结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的蛋白质用PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为约109KDa。
此外,用常规方法对达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.6的序列一致。
实施例4HSDHML在真核细胞(CHO细胞株)中的表达在该实施例中,将在实施例1中获得的两个片段分别用EcoRV酶切,混合并加入连接酶连接,连接完成后走电泳,鉴定并回收正确连接的全长片段。在该实施例中,编码HSDHML的cDNA序列(GenBank Accession No.AF064257)用对应于该DNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得HSDHML cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-AACGGGATCCATGGGAGTCCCGGCGTTCT-3′(SEQ ID NO.7)该引物含有BamHI限制性限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的HSDHML编码序列的19个核苷酸;3′端引物序列为5’-CTAGGGATCCTTAATTCCAATTGTATCTT-3’(SEQ ID NO.9)该引物含有BamHI限制性限制性内切酶的酶切位点、一个翻译终止子和HSDHML的部分编码序列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(f1 ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
用BamHI消化pcDNA3载体以及插入片段,随后将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,用KpnI酶切鉴定插入片段大小及方向,并测序验证HSDHML的cDNA片段已正确插入了载体。
质粒转染CHO细胞是采用脂转染法,用Lipofectin试剂盒(GiBco Life)进行的。转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mM Tris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mM Tris·HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活性峰。然后以PBS(pH7.4)为透析液对表达蛋白溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为109KDa。
此外,用常规方法对达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.6的序列一致。
实施例5制备抗体将实施例3或4中获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组分子用层析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原,对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀HSDHML基因翻译产物的能力加以评估。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(2)SEQ ID NO1的信息(i)序列特征(A)长度22碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO1CCGCATGCTC CCGTATCTTT GG22(2)SEQ ID NO2的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO2AAGAGAAAGG ATGATGAGGA CAG 23(2)SEQ ID NO3的信息(i)序列特征(A)长度22碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO3GGTTCACTGT CACTGTCTTC TG22(2)SEQ ID NO4的信息(i)序列特征(A)长度22碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO4AAACCCGGAC CTCCTATTCC TC 22(2)SEQ ID NO.5的信息(i)序列特征(A)长度3170bp(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO.51 CCGCATGCTCCCGTATCTTTGGTTACGCTCGTCAGCCGGTCGGCCGCCGCCTCCAGCCGT61 GTGCCGCTATGGGAGTCCCGGCGTTCTTCCGCTGGCTCAGCCGCAAGTACCCGTCCATCA121 TAGTCAACTGCGTGGAAGAGAAGCCAAAAGAATGCAATGGTGTAAAGATTCCAGTTGATG181 CCAGTAAACCTAATCCAAATGATGTGGAGTTTGATAATCTGTATTTGGATATGAATGGAA241 TCATCCATCCCTGTACTCATCCTGAAGACAAACCAGCACCAAAAAATGAAGATGAAATGA301 TGGTTGCAATTTTTGAGTACATTGACAGACTTTTCAGTATTGTAAGACCAAGAAGACTTC361 TCTACATGGCAATAGATGGAGTGGCACCACGTGTAAAAATGAACCAGCAGCGTTCAAGGA421 GGTTCAGGGCCATCAAAAGAGGAATGGAAGCAGCAGTCGAGAAGCAGCGAGTCAGGGAAG481 AAATATTGGCAAAAGGTGGCTTTCTTCCTCCAGAAGAAATAAAAGAAAGATTTGACAGCA541 ACTGTATTACACCAGGAACTGAATTCATGGACAATCTTGCTAAATGCCTTCGCTATTACA601 TAGCTGATCGTTTAAATAATGACCCTGGGTGGAAAAATTTGACAGTTATTTTATCTGATG661 CTAGTGCTCCTGGTGAAGGAGAACATAAAATCATGGATTACATTAGAAGGCAAAGAGCCC721 AGCCTAACCATGACCCAAATACTCATCATTGTTTATGTGGAGCTGATGCTGATCTCATTA781 TGCTTGGCCTTGCCACACATGAACCGAACTTTACCATTATTAGAGAAGAATTCAAACCAA841 ACAGGCCCAAACCATGTGGTCTTTGTAATCAGTTTGGACATGAGGTCAAAGATTGTGAAG901 GTTTGTCAAGAGAAAAGAAGGGAAAGCATGATGAACTTGCCGATAGTCTTCCTTGTGCAG961 AAGGAGAGTTTATCTTCCTTCGGCTTAATGTTCTTCGTGAGTATTTGGAAAGAGAACTCA1021 CAATGGCCAGCCTACCATTCACATTTGATGTTGAGAGGAGCATTGATGACTGGGTTTTCA1081 TGTGCTTCTTTGTGGGAAATGACTTCCTCCCTCATTTGCCATCGTTAGAGATTAGGGAAA1141 ATGCAATTGACCGTTTGGTTAACATATACAAAAATGTGGTACACAAAACTGGGGGTTACC1201 TTACAGAAAGTGGTTATGTCAATCTGCAAAGAGTACAGATGATCATGTTAGCAGTTGGTG1261 AAGTTGAGGATAGCATTTTTAAAAAGAGAAAGGATGATGAGGACAGTTTTAGAAGACGAC1321 AGAAAGAAAAAAGAAAGAGAATGAAGAGAGATCAACCAGCTTTCACTCCTAGTGGAATAT1381 TAACTCCTCATGCCTTGGGTTCAAGAAATTCACCAGGTTCTCAAGTAGCCAGTAATCCGA1441 GACAAGCAGCCTATGACATGAGGATGCAGAATAACTCTAGTCCTTCGATATCTCCTAATA1501 CGAGTTTCACATCTGATGGCTCCCCGTCTCCATTAGGAGGAATTAAGCGAAAAGCAGAAG1561 ACAGTGACAGTGAACCTGAGCCAGAGGATAATGTCAGGTTATGGGAAGCTGGCTGGAAGC1621 AGCGGTACTACAAGAACAAATTTGATGTGGATGCAGCTGATGAGAAATTCCGTCGGAAAG1681 TTGTGCAGTCGTACGTTGAAGGACTTTGCTGGGTTCTTAGATATTATTACCAGGGCTGTG1741 CTTCCTGGAAGTGGTATTATCCATTTCATTATGCACCATTTGCTTCAGACTTTGAAGGCA1801 TTGCAGACATGCCATCTGAATTTGAAAAGGGTACGAAACCGTTTAAACCACTAGAACAAC1861 TTATGGGGGTATTTCCAGCTGCAAGTGGTAATTTTCTACCTCCATCATGGCGGAAGCTCA1921 TGAGTGATCCTGATTCTAGTATAATTGACTTCTATCCTGAAGATTTTGCTATTGATTTGA1981 ATGGGAAGAAATATGCATGGCAAGGTGTTGCTCTCTTGCCATTCGTGGATGAGCGAAGGC2041 TACGAGCTGCCCTAGAAGAGGTATACCCAGACCTCACTCCAGAAGAGACCAGAAGAAACA2101 GCCTTGGAGGTGATGTCTTATTTGTGGGGAAACATCACCCACTCCATGACTTCATTTTAG2161 AGCTGTACCAGACAGGTTCCACAGAGCCAGTGGAGGTACCCCCTGAACTATGTCATGGGA2221 TTCAAGGAAAGTTTTCTTTGGATGAAGAAGCCATTCTTCCAGATCAAATAGTATGTGCTC2281 CTGTTCCTATGTTAAGGGATCTGACACAGAACACTGTAGTCAGTATTAATTTTAAAGACC2341 CACAGTTTGCTGAAGATTACATTTTTAAAGCTGTAATGCTTCCAGGAGCAAGAAAGCCAG2401 CAGCAGTACTGAAACCTAGTGACTGGGGAAAATCCAGCAATGGACGGCAGTGGAAGCCTC2461 AGCTTGGCTTTAACCGTGACCGGAGGCCTGTGCACCTGGATCAGGCAGCCTTCAGGACTT2521 TGGGCCATGTGATGCCAAGAGGCTCAGGAACTGGCATTTACAGCAATGCTGCACCACCAC2581 CTGTGACTTACCAGGGAAACTTATACAGGCCGCTTTTGAGAGGACAAGCCCAGATTCCAA2641 AACTTATGTCAAATATGAGGCCCCAGGATTCCTGGCGAGGTCCTCCTCCCCTTTTCCAGC2701 AGCAAAGGTTTGACAGAGGCGTTGGGGCTGAACCTCTGCTCCCATGGAACCGGATGCTGC2761 AAACCCAGAATGCAGCCTTCCAGCCAAACCAGTACCAGATGCTAGCTGGGCCTGGTGGGT2821 ATCCACCCAGACGAGATGATCGTGGAGGGAGACAGGGATATCCCAGAGAAGGAAGGAAAT2881 ACCCTTTGCCACCACCCTCAGGAAGATACAATTGGAATTAAGCTTTTGTAAAGCTTTCCC2941 AAATCCTTTCATCATTCTACAGTTTTATGCTATTTGTGGAAAGATTTCTTTCTCAAGTAG3001 TAGTTTTTAATAAAACTACAGTACTTTGTGTATTTCTTTTAACTGTGTATATTTCTACTG3061 ATCTGATCTCACTGTTTATGTTGCTTTCCAAAGATGTATGTTGCATAATACAGTGGATCT3121 GAATTTATTAATGCTTATAAACACATTTGAGGAATAGGAGGTCCGGGTTT(2)SEQ ID NO.6的信息(i)序列特征(A)长度950个氨基酸(B)类型氨基酸(C)拓扑结构线性(ii)分子类型多肽(xi)序列描述SEQ ID NO.61 Met Gly Val Pro Ala Phe Phe Arg Trp Leu Ser Arg Lys Tyr Pro16 Ser Ile Ile Val Asn Cys Val Glu Glu Lys Pro Lys Glu Cys Asn31 Gly Val Lys Ile Pro Val Asp Ala Ser Lys Pro Asn Pro Asn Asp46 Val Glu Phe Asp Asn Leu Tyr Leu Asp Met Asn Gly Ile Ile His61 Pro Cys Thr His Pro Glu Asp Lys Pro Ala Pro Lys Asn Glu Asp76 Glu Met Met Val Ala Ile Phe Glu Tyr Ile Asp Arg Leu Phe Ser91 Ile Val Arg Pro Arg Arg Leu Leu Tyr Met Ala Ile Asp Gly Val106 Ala Pro Arg Val Lys Met Asn Gln Gln Arg Ser Arg Arg Phe Arg121 Ala Ile Lys Arg Gly Met Glu Ala Ala Val Glu Lys Gln Arg Val136 Arg Glu Glu Ile Leu Ala Lys Gly Gly Phe Leu Pro Pro Glu Glu151 Ile Lys Glu Arg Phe Asp Ser Asn Cys Ile Thr Pro Gly Thr Glu166 Phe Met Asp Asn Leu Ala Lys Cys Leu Arg Tyr Tyr Ile Ala Asp181 Arg Leu Asn Asn Asp Pro Gly Trp Lys Asn Leu Thr Val Ile Leu196 Ser Asp Ala Ser Ala Pro Gly Glu Gly Glu His Lys Ile Met Asp211 Tyr Ile Arg Arg Gln Arg Ala Gln Pro Asn His Asp Pro Asn Thr226 His His Cys Leu Cys Gly Ala Asp Ala Asp Leu Ile Met Leu Gly241 Leu Ala Thr His Glu Pro Asn Phe Thr Ile Ile Arg Glu Glu Phe256 Lys Pro Asn Arg Pro Lys Pro Cys Gly Leu Cys Asn Gln Phe Gly271 His Glu Val Lys Asp Cys Glu Gly Leu Ser Arg Glu Lys Lys Gly286 Lys His Asp Glu Leu Ala Asp Ser Leu Pro Cys Ala Glu Gly Glu301 Phe Ile Phe Leu Arg Leu Asn Val Leu Arg Glu Tyr Leu Glu Arg316 Glu Leu Thr Met Ala Ser Leu Pro Phe Thr Phe Asp Val Glu Arg331 Ser Ile Asp Asp Trp Val Phe Met Cys Phe Phe Val Gly Asn Asp346 Phe Leu Pro His Leu Pro Ser Leu Glu Ile Arg Glu Asn Ala Ile361 Asp Arg Leu Val Asn Ile Tyr Lys Asn Val Val His Lys Thr Gly376 Gly Tyr Leu Thr Glu Ser Gly Tyr Val Asn Leu Gln Arg Val Gln391 Met Ile Met Leu Ala Val Gly Glu Val Glu Asp Ser Ile Phe Lys406 Lys Arg Lys Asp Asp Glu Asp Ser Phe Arg Arg Arg Gln Lys Glu421 Lys Arg Lys Arg Met Lys Arg Asp Gln Pro Ala Phe Thr Pro Ser436 Gly Ile Leu Thr Pro His Ala Leu Gly Ser Arg Asn Ser Pro Gly451 Ser Gln Val Ala Ser Asn Pro Arg Gln Ala Ala Tyr Asp Met Arg466 Met Gln Asn Asn Ser Ser Pro Ser Ile Ser Pro Asn Thr Ser Phe481 Thr Ser Asp Gly Ser Pro Ser Pro Leu Gly Gly Ile Lys Arg Lys496 Ala Glu Asp Ser Asp Ser Glu Pro Glu Pro Glu Asp Asn Val Arg511 Leu Trp Glu Ala Gly Trp Lys Gln Arg Tyr Tyr Lys Asn Lys Phe526 Asp Val Asp Ala Ala Asp Glu Lys Phe Arg Arg Lys Val Val Gln541 Ser Tyr Val Glu Gly Leu Cys Trp Val Leu Arg Tyr Tyr Tyr Gln556 Gly Cys Ala Ser Trp Lys Trp Tyr Tyr Pro Phe His Tyr Ala Pro571 Phe Ala Ser Asp Phe Glu Gly Ile Ala Asp Met Pro Ser Glu Phe586 Glu Lys Gly Thr Lys Pro Phe Lys Pro Leu Glu Gln Leu Met Gly601 Val Phe Pro Ala Ala Ser Gly Asn Phe Leu Pro Pro Ser Trp Arg616 Lys Leu Met Ser Asp Pro Asp Ser Ser Ile Ile Asp Phe Tyr Pro631 Glu Asp Phe Ala Ile Asp Leu Asn Gly Lys Lys Tyr Ala Trp Gln646 Gly Val Ala Leu Leu Pro Phe Val Asp Glu Arg Arg Leu Arg Ala661 Ala Leu Glu Glu Val Tyr Pro Asp Leu Thr Pro Glu Glu Thr Arg676 Arg Asn Ser Leu Gly Gly Asp Val Leu Phe Val Gly Lys His His691 Pro Leu His Asp Phe Ile Leu Glu Leu Tyr Gln Thr Gly Ser Thr706 Glu Pro Val Glu Val Pro Pro Glu Leu Cys His Gly Ile Gln Gly721 Lys Phe Ser Leu Asp Glu Glu Ala Ile Leu Pro Asp Gln Ile Val736 Cys Xaa Pro Val Pro Met Leu Arg Asp Leu Thr Gln Asn Thr Val751 Val Ser Ile Asn Phe Lys Asp Pro Gln Phe Ala Glu Asp Tyr Ile766 Phe Lys Ala Val Met Leu Pro Gly Ala Arg Lys Pro Ala Ala Val781 Leu Lys Pro Ser Asp Trp Gly Lys Ser Ser Asn Gly Arg Gln Trp796 Lys Pro Gln Leu Gly Phe Asn Arg Asp Arg Arg Pro Val His Leu811 Asp Gln Ala Ala Phe Arg Thr Leu Gly His Val Met Pro Arg Gly826 Ser Gly Thr Gly Ile Tyr Ser Asn Ala Ala Pro Pro Pro Val Thr841 Tyr Gln Gly Asn Leu Tyr Arg Pro Leu Leu Arg Gly Gln Ala Gln856 Ile Pro Lys Leu Met Ser Asn Met Arg Pro Gln Asp Ser Trp Arg871 Gly Pro Pro Pro Leu Phe Gln Gln Gln Arg Phe Asp Arg Gly Val886 Gly Ala Glu Pro Leu Leu Pro Trp Asn Arg Met Leu Gln Thr Gln901 Asn Ala Ala Phe Gln Pro Asn Gln Tyr Gln Met Leu Ala Gly Pro916 Gly Gly Tyr Pro Pro Arg Arg Asp Asp Arg Gly Gly Arg Gln Gly931 Tyr Pro Arg Glu Gly Arg Lys Tyr Pro Leu Pro Pro Pro Ser Gly946 Arg Tyr Asn Trp Asn(2)SEQ ID NO7的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO7AACGGGATCC ATGGGAGTCC CGGCGTTCT 29(2)SEQ ID NO8的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链
(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO8CTAGGTCGAC TTAATTCCAA TTGTATCTT29(2)SEQ ID NO9的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO9CTAGGGATCC TTAATTCCAA TTGTATCTT29
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人HSDHML蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.6所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.5中69-2921位的核苷酸序列。
4.一种分离的HSDHML蛋白多肽,其特征在于,它包括具有SEQ ID NO.6氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.6序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有HSDHML蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有HSDHML蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成HSDHML蛋白表达载体,所述的核苷酸序列与SEQ ID NO.5中从核苷酸69-2921位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成HSDHML蛋白的重组细胞;(c)在适合表达HSDHML蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有HSDHML蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.5中从核苷酸69-2921位。
12.一种能与权利要求4所述的HSDHML蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-100个连续核苷酸。
全文摘要
本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及人HSDHML的cDNA序列,该蛋白是鼠Dhml的同系物。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
文档编号C12N1/21GK1246531SQ9811103
公开日2000年3月8日 申请日期1998年8月31日 优先权日1998年8月31日
发明者余龙, 张民, 赵勇, 屠强, 赵寿元 申请人:上海新黄浦复旦基因工程有限公司