专利名称:人hZNFshgc基因序列、其编码蛋白及制备方法
技术领域:
本发明涉及一种新的人基因和蛋白,尤其涉及一种人hZNFshgc基因的核酸序列、其编码蛋白;此外,本发明还涉及该基因编码蛋白的制备方法。
背景技术:
锌指结构是指肽链上结合DNA的特定短序列,通过结合DNA来调控基因的转录与表达,因而包含有锌指结构的蛋白广泛参与了转录调控的生理过程(J Mol Biol 1999Oct 22;293(2)215-8)。ZNF140是Kruppel锌指蛋白超家族的成员之一。ZNF140包含有一个KRAB(Kruppel-associated box)片段,抑制基因的表达(Genomics 1995May20;27(2)259-64,FEBS Lett 1995 Aug 7;369(2-3)153-7)。
本发明中,hZNFshgc是一个新的锌指蛋白,它与ZNF140同源。蛋白结构决定了它的生理功能,本发明的hZNFshgc可能具有与ZNF140相似或者相同的功能。
在本发明之前,还没有出现涉及本发明的人hZNFshgc蛋白的公开报道。
发明内容
本发明要解决的技术问题之一是提供一种新的人基因hZNFshgc(GenbankAccession No.AF155656),该基因是一个hZNFshgc锌指蛋白基因。
本发明要解决的技术问题之二是提供一种新的人hZNFshgc蛋白。
本发明要解决的技术问题之三是提供一种利用基因重组技术生产上述新的人hZNFshgc蛋白的方法。
为了解决上述技术问题,本发明通过如下技术方案实现在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有人锌指蛋白hZNFshgc活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第214-1449位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.7所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列。
在本发明的另一方面,提供了一种分离出的人锌指蛋白hZNFshgc多肽,它包括具有SEQ ID NO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.7序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在一个实例中该宿主细胞是大肠杆菌;在另一实例中,该宿主细胞是真核细胞。
在本发明的另一方面,还提供了一种产生具有人锌指蛋白hZNFshgc活性的多肽的方法,该方法包括(1)将编码具有人锌指蛋白hZNFshgc活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人锌指蛋白hZNFshgc表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人锌指蛋白hZNFshgc的重组细胞;(3)在适合表达人锌指蛋白hZNFshgc多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人锌指蛋白hZNFshgc活性的多肽。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.6中第214-1449位的序列。
本发明还提供了与锌指蛋白hZNFshgc多肽特异性结合的抗体。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人锌指蛋白bZNFshgc(或多肽)编码序列”指编码具有人锌指蛋白hZNFshgc活性的多肽的核苷酸序列,如SEQ ID NO.6中第214-1449位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.6序列的编码框第214-1449位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.6中第214-1449位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.7所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列杂交的核苷酸序列。其中,“严紧条件”是指核苷酸序列在膜上杂交后的洗膜条件。例如,在本领域中,低严紧度洗膜可以在杂交管中倒入150ml左右洗液,放入杂交膜,室温持续摇动20分钟左右,而高严紧度洗膜可以是在杂交管中倒入200ml左右洗液,放入杂交膜,50℃摇床中持续摇动20分钟左右。该术语还包括与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与人锌指蛋白hZNFshgc相同功能的蛋白的、SEQ ID NO.6中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“人锌指蛋白hZNFshgc或多肽”指具有锌指蛋白hZNFshgc活性的SEQ ID NO.7序列的多肽。该术语还包括具有与人锌指蛋白hZNFshgc相同功能的、SEQ ID NO.7序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括锌指蛋白hZNFshgc的活性片段和活性衍生物。
本发明人锌指蛋白hZNFshgc多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与人锌指蛋白hZNFshgc DNA杂交的DNA所编码的蛋白、以及利用抗人锌指蛋白hZNFshgc多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人锌指蛋白hZNFshgc多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括人锌指蛋白hZNFshgc多肽的可溶性片段。通常,该片段具有人锌指蛋白hZNFshgc多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“锌指蛋白hZNFshgc保守性变异多肽”指与SEQ ID NO.7的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。
本发明还包括人锌指蛋白hZNFshgc或多肽的类似物。这些类似物与天然人锌指蛋白hZNFshgc多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的人锌指蛋白hZNFshgc多肽时,可以将锌指蛋白hZNFshgc编码序列可操作地连于表达调控序列,从而形成人锌指蛋白hZNFshgc表达载体。
在本发明中,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
本发明还提供了对人锌指蛋白hZNFshgc特异的抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对锌指蛋白hZNFshgc特异的抗体。例如,将提纯的人锌指蛋白hZNFshgc基因产物或它的抗原片段注射入动物体内以产生多克隆抗体。同样,表达人锌指蛋白hZNFshgc或它的抗原片段的细胞也可以用来对动物致免疫而产生抗体。根据本发明制备的抗体也可以是单克隆抗体,这些单克隆抗体可以用杂交瘤技术制备(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本发明的抗体包括可以阻抑锌指蛋白hZNFshgc功能的抗体,也可以是不影响人锌指蛋白hZNFshgc功能的抗体。每一类抗体都可以通过对人锌指蛋白hZNFshgc基因产物的片段或功能域致免疫而产生,而人锌指蛋白hZNFshgc基因产物及其片段可以用重组方法产生或用多肽合成仪进行合成。与非修饰形式的锌指蛋白hZNFshgc基因产物结合的抗体,可以通过用在原核细胞例如E.coli中产生的基因产物来免疫动物而得到。与翻译后修饰形式如糖基化或磷酸化蛋白或多肽结合的抗体,可以通过用在真核细胞如酵母或昆虫细胞中产生的基因产物的来免疫动物而得到。
本发明的人锌指蛋白hZNFshgc抗体可以用来鉴定表达人锌指蛋白hZNFshgc或多肽的细胞,如Jurkat T细胞。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记锌指蛋白hZNFshgc特异抗体,然后让人锌指蛋白hZNFshgc特异抗体与细胞样品接触,再用荧光显微镜或流式细胞仪检测出与锌指蛋白hZNFshgc特异抗体结合的细胞。
除了在细胞表面检测人锌指蛋白hZNFshgc外,还可以用Western印迹技术分析该蛋白质。细胞裂解液可以从培养细胞或取自病人的组织标本如肾上腺中提取,并溶解在含有去污剂的裂解缓冲液中。然后用SDS聚丙烯酰胺凝胶电泳分离细胞提取物(同时将提纯的人锌指蛋白hZNFshgc多肽作为阳性对照),接着通过电泳杂交将其转移到硝酸纤维素上。为了用Western印迹免疫探测锌指蛋白hZNFshgc多肽,可以使用典型的抗体结合检测方法,例如放射自显影或碱性磷酸酶检测方法。并可使用免疫接种血清或不相关的单克隆抗体作为非特异反应的对照。
还可用Nothern印迹法技术分析锌指蛋白hZNFshgc基因产物的表达,即分析人锌指蛋白hZNFshgc的RNA转录物在细胞中的存在与否和数量。
人锌指蛋白hZNFshgc DNA的Nothern印迹分析和人锌指蛋白hZNFshgc特异抗体的Western印迹分析可以联合使用,以证实人锌指蛋白hZNFshgc在生物样本中的表达。人锌指蛋白hZNFshgc DNA还可以用于Southern印迹分析或原位杂交分析,以将该基因定位于染色体上,并可进行遗传连锁分析以找出其它可能的疾病相关基因。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有锌指蛋白hZNFshgc核苷酸编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码锌指蛋白hZNFshgc的核酸分子。
本发明还提供了检测样品中是否存在锌指蛋白hZNFshgc核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于锌指蛋白hZNFshgc核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的锌指蛋白hZNFshgc核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选锌指蛋白hZNFshgc同源基因或同源蛋白。
为了得到与锌指蛋白hZNFshgc基因相关的人cDNAs或基因组DNAs的点阵,可以用DNA探针筛选人cDNA或基因组DNA文库,这些探针是在低严紧条件下,用32P对锌指蛋白hZNFshgc的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自人肾上腺组织的文库。来自参与内分泌的其它人体组织或特定人体细胞株的cDNA文库也可用于筛选目的。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Palo Alto,Cal.。这种筛选方法可以识别与锌指蛋白hZNFshgc相关的基因家族的核苷酸序列。
根据核苷酸相似性筛选锌指蛋白hZNFshgc同源物可以按如下方法完成。人体肾上腺cDNA文库,例如Clontech Cat.#7430-1(Clontech,Palo Alto,Cal.)可以使用一段包含锌指蛋白hZNFshgc基因序列的全部或部分的随机引物化DNA探针筛选。要完成对与锌指蛋白hZNFshgc序列至少有70%同源性的DNA插入序列的克隆的鉴定,可以使用杂交温度为55℃的杂交液,然后用0.5×SSC和0.1%SDS清洗。用这种方法识别的克隆的DNA插入序列可以进一步用DNA限制性内切酶分析和DNA测序来评价它与锌指蛋白hZNFshgc基因的相似性。组织表达的分布可以用上述的Northern印迹法技术分析。
锌指蛋白hZNFshgc同源物也可以用针对锌指蛋白hZNFshgc或多肽的抗体来识别。例如,可以用标准的方法对商品化的或者用已知方法构建的,来自细胞或者组织例如肾上腺的表达文库进行筛选。将文库倒入平皿,菌落转移到一张硝化纤维素膜上,使表达的重组蛋白结合到膜上。然后就可以用特异性的人锌指蛋白hZNFshgc抗体进行典型的抗体结合和检测。用这种方法所识别出克隆中的DNA插入序列,可以进一步用DNA限制性内切酶分析和DNA测序进行分析以评价它与锌指蛋白hZNFshgc基因的相似性。新识别的基因的组织表达分布可以同样地按上述方法进行分析。
本发明的人锌指蛋白hZNFshgc核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
通过同源检索发现,本发明的新基因具有与已发表并被确认为人ZNF140蛋白的基因高度同源的序列,并且本发明的新蛋白具有人ZNF140蛋白高度保守的氨基酸序列。所以,本发明的锌指蛋白hZNFshgc是人ZNF140蛋白基因的一个同源基因而可能具有相似的功能。
本发明的人hZNFshgc蛋白可以施用于病人,以治疗或减轻因人hZNFshgc缺失、无功能或异常而导致的有关病症,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
图1是本发明的人锌指蛋白hZNFshgc与人ZNF140基因核酸序列(GenBankAccession No.NM_003440)的同源比较(FASTA)图。其中,相同的核苷酸用“|”标出。
图2是本发明的人锌指蛋白hZNFshgc与人ZNF140蛋白的氨基酸序列(GenPeptAccession No.4507991)的同源比较(FASTA)图。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出,相似的氨基酸用“+”标出。
具体实施例方式
下面结合附图和实施例对本发明作进一步详细的说明。
以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkCold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1锌指蛋白hZNFshgc基因的克隆1.组织分离(Tissue isolation)肾上腺来源于5个正常成年男性供体,在死后四小时内取出肾上腺组织,立即置于液氮中冷冻保存。
2.mRNA的分离(mRNA isolation)取出组织,用研钵研碎,加入盛有裂解液的50ml管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至50ml新管,抽提总RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛变性胶电泳鉴定总RNA质量。用带Oligo d(T)的纤维素柱分离总RNA中的mRNA,定量。
3.cDNA文库的构建(Construction of cDNA library)以mRNA为模板,合成双链cDNA,反转录引物见SEQ ID NO.1。补平末端后,加含EcoRI切点的接头,接头序列分别见SEQ ID NO.2和3。磷酸化EcoRI末端后,用XhoI限制性内切酶消化1.5小时,再进行片段分离。过柱筛选长度>500bp的片段,用酚-氯仿抽提,乙醇沉淀,无菌水溶解,连接至Uni-ZAP XR载体(Stratagene,CA9203,USA),以Zap-cDNA Gigapack III Gold Cloning Kit(Stratagene,CA9203,USA)进行包装,宿主菌使用XL 1-Blue MRF’(Stratagene,CA9203,USA)细菌。涂板并测定滴度。
4.测序及数据库建立(Seqencing and Database Constructing)挑选文库中有外源片段插入的克隆,扩增后抽提质粒(Qiagen,Germany),用T3和T7作为3’端和5’端的通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI 377测序仪(Perkin-Elmer,USA)上进行EST大规模测序。测序结果用FACTURA软件去除载体序列,传输到SUN Ultra 450 Server上进行下一步的处理。所有的序列信息再用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),将无同源性或同源性低于95%的序列视为新基因建立数据库。
5.基因的全长克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基础上,进行cDNA全长克隆,分两阶段进行(1)“电子克隆”(Electronic Cloning)以新基因片段序列作为探针搜寻dbEST数据库,将重叠序列>50bp,同源性在98%以上的表达序列标签(Expressed Sequence Tag,简称“EST”)序列认为同一序列(consensus sequence),取出并用AUTOASSEMBLER软件进行拼接,部分EST可以延伸探针序列。再用STRIDER软件分析被延伸的序列是否具有完整的开放阅读框架(OpenReading Frame,ORF),用BLAST搜寻Genbank或GenPept以确定该序列在核苷酸和氨基酸水平上是否与其他物种有同源性,以帮助判别所得到的基因全长完整性如何。通过电子克隆的方法,通常可获取锌指蛋白hZNFshgc基因的全长序列。
(2)cDNA末端快速扩增(Rapid Amplification of cDNA Ends,RACE)如果通过“电子克隆”方法仍未得到完整的cDNA全长,则在已有序列的5’或3’端设计引物,在人类肾上腺Marathon-Ready cDNA文库(Clontech Lab,Inc,USA)中进行长距离PCR反应。然后对PCR产物克隆、测序。用AUTOASSEMBLER及STRIDER软件分析被延长的序列有无完整的ORF,如无,重复上述过程直至获得全长。
(3)RT-PCR对于5’和3’端已知的序列,如果中间尚有一段间隙(gap)无法从已有的公共数据库或自身数据库获得,可考虑采用RT-PCR的方法。在序列5’端设计引物,3’端引物采用Oligo-dT,在肾上腺总RNA库中进行扩增。然后对产物进行克隆、测序。最后拼接并获得全长。
通过组合使用上述3种方法,获得了候选的人锌指蛋白hZNFshgc的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物R15’-CTTCCAAGCTAAGGAACGGTTT-3’(SEQ ID NO.4)为正向引物,寡核苷酸R25’-GGGATGCACTTGGAACTGG-3’(SEQ ID NO.5)为反向引物,以肾上腺组织的总RNA为模板,进行RT-PCR扩增,R1/R2的PCR条件为94℃5分钟,随之以94℃30秒、58℃30秒和72℃1分钟进行35个循环,最后以72℃延伸5分钟。电泳检测PCR扩增产物,获得扩增片段长度为2180bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ IDNO.6所示的序列。
实施例2锌指蛋白hZNFshgc基因的序列信息与同源性分析本发明新的人锌指蛋白hZNFshgc全长cDNA(GenBank Accession No.AF155656。因申请保密,故在本申请之前未对公众公开)的长度为2180bp,详细序列见SEQ IDNO.6,其中开放读框位于214-1449位核苷酸。根据全长cDNA推导出锌指蛋白hZNFshgc的氨基酸序列,共411个氨基酸残基,分子量47066.13,pI为9.01。详细序列见SEQ ID NO.7。
将锌指蛋白hZNFshgc的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank +EMBL+DDBJ+PDB和Non-redundant GenBank CDStrans-lations+PDB+GenPept+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与人的一个已知基因ZNF140存在一定的同源性。在核苷酸水平上,它与人ZNF140基因的mRNA全编码序列(GenBank Accession No.NM_003440)的738-1695位碱基有65.6%的相同性(图1),在氨基酸水平上,它与人ZNF140蛋白(GenPept Accession No.4507991)的第1-450位氨基酸残基有44.4%的相同性和64.6%的相似性(图2)。由上可见,锌指蛋白hZNFshgc基因与人ZNF140基因无论从核酸还是蛋白水平上都存在较高的同源性,可以认为两者在功能上也可能有很高相似性。
本发明的人锌指蛋白hZNFshgc除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人锌指蛋白hZNFshgc还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人锌指蛋白hZNFshgc的N端与人ZNF140蛋白的N端进行交换,以产生新的活性更高或具有新特性的蛋白。针对本发明人锌指蛋白hZNFshgc的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
此外,本发明人锌指蛋白hZNFshgc核酸(编码序列或反义序列)可以被引入细胞,以提高人锌指蛋白hZNFshgc的表达水平或者抑制人锌指蛋白hZNFshgc的过度表达。由于本发明的人锌指蛋白hZNFshgc具有源自人的天然氨基酸序列,因此,预计在施用于人时将具有较高的活性和/或较低的副作用(例如在人体内的免疫原性更低或没有)。
实施例3锌指蛋白hZNFshgc的结构和功能研究1.将锌指蛋白hZNFshgc的氨基酸序列在blocks数据库(网址为http://blocks.fhcrc.org/blocks-bin/blocks_search)中检索,得到以下结果1 MSQVTFSDVA IDFSHEEWAC LDSAQRDLYK DVMVQNYENL VSVGLSVTKP51 YVIMLLEDGK EPWMMEKKLS KDWESRWENK ELSTKKDIYD EDSPQPVTME101 KVVKQSYEFS NSNKNLEYTE CDTFRSTFHS KSTLSEPQNN SAEGNSHKYD151 ILKKNLSKKS VIKSERINGG KKLLNSNKSG AAFNQSKSLT LPQTCNR 201 YE CRE 251 STHT GEKPYECMNC GKSFSRVSLL301 IQHLRIHTQE KRYECRICGK AFIHSSSLIH HQKSHTGEKP YECRECGKAF351 CCSSHLTQHQ RIHSMKKKYE CHKCLKGFSS FSFLGQHQSI HTGEKPLKFR401 NAGNPSTSLN H(1)在氨基酸序列中,存在以下功能基序(i)加框区蛋白DNA结合锌指结构功能模块(PROTEIN DNA-BINDING ZINC-FINGERMETAL);(ii)黑体区C2H2型锌指结构功能模块(Zinc finger,C2H2 type,domainproteins)。
(2)功能分析由上可知本发明中的锌指蛋白hZNFshgc存在多个锌指结构,也同样有相关功能。由于蛋白质结构决定了功能特异性的生物化学原理,因此本发明中的人锌指蛋白hZNFshgc可能具有人ZNF140相似或相同的功能。
实施例4锌指蛋白hZNFshgc基因的组织表达谱1.电子Northern表达谱。按Ton C.等人的方法(Ton C et al.,Biochem BiophysRes Commun 1997 Dec 18;241(2)589-594;Hwang DM,et al.,Circulation 1997Dec 16;96(12)4146-4203),将锌指蛋白hZNFshgc cDNA序列在GCG软件包中的dbEST数据库中做BLAST检索,在得到的人类EST中,概率值<10e-10、相同性>95%的EST有42个,可视为该基因在组织中的转录表达本,由此得出表达该基因的组织谱,发现其在松果体、肾上腺、脑、心脏、肾、肝、肺、卵巢、神经上皮细胞等等中均有表达,表明它在人体许多组织器官中都发挥着重要作用。
实施例5锌指蛋白hZNFshgc多肽的制备和提纯在该实施例中,将全长的锌指蛋白hZNFshgc编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
1.将锌指蛋白hZNFshgc多肽以GST融合蛋白的形式在大肠杆菌中进行原核表达。
(a)原核表达载体的构建,以及转化大肠杆菌根据人锌指蛋白hZNFshgc的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物(分别对应于编码序列5’和3’端的约20个以上核苷酸),并在正反引物上分别引入限制性内切酶位点(这根据选用的pGEX-2T载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将锌指蛋白hZNFshgc基因在保证阅读框正确的前提下克隆至pGEX-2T载体(Pharmacia,Piscataway,NJ)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌DH5α,筛选鉴定得到含有pGEX-2T-锌指蛋白hZNFshgc表达载体的工程菌DH5α-pGEX-2T-锌指蛋白hZNFshgc。
(b)表达GST-锌指蛋白hZNFshgc重组蛋白的工程菌的分离鉴定挑取单菌落的DH5α-pGEX-2T-锌指蛋白hZNFshgc工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达GST-锌指蛋白hZNFshgc融合蛋白的工程菌。
(c)GST-锌指蛋白hZNFshgc融合蛋白的提取纯化按上述方法诱导表达GST-锌指蛋白hZNFshgc融合表达蛋白的工程菌DH5α-pGEX-2T-锌指蛋白hZNFshgc。诱导后的细菌离心沉淀,按每400ml菌加入20ml PBS重悬细菌,超声破碎细菌。破菌完全的超声液按每毫升加入20微升的量加入PBS饱和的50%谷胱苷肽Sepharose 4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了GST-锌指蛋白hZNFshgc的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液所得沉淀加入100μl PBS的量清洗两次,而后按每毫升超声液所得沉淀加入10μl还原型谷胱苷肽洗脱液,室温置10分钟,10000rpm离心10分钟,上清即为洗脱的融合蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在47kDa处的蛋白质条带即为锌指蛋白hZNFshgc。
实施例6锌指蛋白hZNFshgc或多肽在昆虫细胞中进行真核细胞表达1.锌指蛋白hZNFshgc杆状病毒表达载体的构建及转染Sf9昆虫细胞株根据人锌指蛋白hZNFshgc的全长编码序列(SEQ ID NO.6),设计扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将锌指蛋白hZNFshgc cDNA在保证阅读框架的前提下克隆至pVL1392载体(Invitrogen,Carlsbad,CA)。鉴定好的表达载体3μg,野生型线性杆状病毒DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml无血清的昆虫培养基中,振荡15秒混匀,室温孵育15分钟备用。取1ml(2×106)Sf9昆虫细胞悬液于60mm组织培养板中,贴壁1小时后换转染培养基,室温孵育15分钟后弃培养基,加入前面制备好的DNA载体转染混合物,Parafilm密封培养板,于室温27℃振摇培养4小时,而后换完全培养基培养3天,收集上清备用。
2.转入重组表达载体的昆虫细胞株的筛选鉴定转染3天后的昆虫细胞用新鲜培养基制成细胞悬液(2×106/1ml),取1ml细胞悬液置于60mm组织培养皿中,加入3ml培养基,100μl收集的培养上清,贴壁1小时,弃2ml培养基,继续室温培养1小时,弃去所有的培养基,加入预热的含20μl4%X-gal的3ml半固体培养基,培养5-7天后挑取白色细胞克隆于96孔培养板中培养3-5天,而后吸取上清感染Sf9昆虫细胞。
收集感染的细胞进行Western鉴定。将细胞裂解后进行SDS-PAGE电泳,电泳后的胶于Pharmacia的Multiphor II半干电转移仪中将蛋白质转印到硝酸纤维膜上,将硝酸纤维膜置于封闭液中封闭1小时,而后于抗锌指蛋白hZNFshgc的抗体溶液中封闭1小时,TBS液振摇清洗5分钟共2次,而后将膜置于生物素标记的抗锌指蛋白hZNFshgc一抗的第二抗体溶液中振摇1小时,TBS清洗,加入亲和素-碱性磷酸酶复合物反应30分钟,TBS清洗2次,加入新鲜配制的显色液显色观察蛋白条带。
挑取高表达锌指蛋白hZNFshgc的Sf9细胞克隆。
3.锌指蛋白hZNFshgc的提取纯化用高表达锌指蛋白hZNFshgc的Sf9细胞克隆的上清大量感染Sf9细胞,感染48小时后收集细胞,PBS洗涤。每2×108细胞加入20ml细胞裂解液(0.5%Triton X-100,20mM Na3PO4(磷酸钠,pH7.8),500mM NaCl,1mM Na3VO4(钒酸钠),1mM Pefabloc,1μg/ml胃蛋白酶抑制剂,亮抑蛋白酶肽和抑蛋白酶肽)破细胞,12000×g离心20min去除细胞碎片,上清按每2×108的细胞加入2ml NTA-琼脂糖(Qiagen,Germany),4℃吸附1小时。而后用含100nM咪唑的His缓冲液洗涤两次,用含20mM N,N’-二哌嗪,500mM NaCl,300mM咪唑的缓冲液洗脱以得到纯化的蛋白。洗脱液保存于4℃,并进行SDS-PAGE电泳检测提取的锌指蛋白hZNFshgc的纯度。在47kDa处的蛋白质条带即为锌指蛋白hZNFshgc。
实施例7抗人锌指蛋白hZNFshgc抗体的制备1.免疫小鼠和脾细胞的制备将实施例5和实施例6中获得的锌指蛋白hZNFshgc用层析法进行分离后备用,也可以用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中割下,并用等体积的完全Freund’s佐剂乳化。取6-8周龄Balb/C雌鼠,用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量再加强免疫一次,3-5天后用于融合。其中,脾细胞制备见鄂征主编,《组织培养和分子细胞学技术》,北京出版社,第210页。
2.按《组织培养和分子细胞学技术》(同上),第371页中的方法,制备饲养细胞。
3.按《组织培养和分子细胞学技术》(同上),第213页中的方法,进行细胞融合。
4.抗体的检测在细胞融合10-15天后,需逐孔进行检查,一旦发现旺盛的杂交细胞集落生长,就应用锌指蛋白hZNFshgc做抗体活性的初步筛选,常用的方法有免疫荧光试验、发射免疫试验(RIA)、酶联免疫吸附试验(ELISA)。检查出抗体活性的孔后,立刻进行克隆培养,并分离出抗体。
序列表<110>上海人类基因组研究中心<120>人hZNFshgc基因序列、其编码蛋白及制备方法<130>NP-10002<160>7<210>1<211>50<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>1GAGAGAGAGAGAGAGAGAGAACTAGTCTCGAGTTTTTTTTTTTTTTTTTT 50<210>2<211>13<212>DNA<213>人工序列<220>
<221>misc_feature<223>接头序列<400>2
AATTCGGCAC GA G 13<210>3<211>9<212>DNA<213>人工序列<220>
<221>misc_feature<223>接头序列<400>3GCCGTGCTC 9<210>4<211>22<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>4CTTCCAAGCTAAGGAACGGTTT22<210>5<211>19<212>DNA<213>人工序列
<220>
<221>misc_feature<223>引物<400>5GGGATGCACTTGGAACTGG19<210>6<211>2180<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(214)..(1449)<400>61 CTTCCAAGCT AAGGAACGGT TTGGGGCAGT GTCGTTCCCG GAGGTCGGCC51 GCCGTTACCC GCTCACCAGC TACGCGGCGC GTCAGGTCCG CGAAGGCGCG101 GGCTCGGGGC GCCTGCGGGA CGGTGAGGCC CTGCTGAGGA CTCCGGACAC151 TGCCCATCTC TAAGATAAGA ACCTGGAAAG GGGACTCTGT TGGCCATTGG201 AAATTGCAGA ATAATGTCTC AGGTGACATT TAGTGATGTG GCTATAGACT251 TCTCTCATGA AGAGTGGGCA TGCCTAGATT CTGCTCAGAG GGACTTATAC301 AAGGATGTGA TGGTCCAGAA TTATGAGAAC CTGGTCTCTG TAGGTCTTTC351 CGTAACTAAG CCATATGTGA TCATGTTATT GGAGGATGGA AAAGAGCCCT401 GGATGATGGA GAAAAAACTG TCAAAAGATT GGGAATCAAG ATGGGAAAAC451 AAGGAATTAT CAACAAAGAA GGATATTTAT GATGAAGATT CACCCCAACC501 AGTAACAATG GAAAAAGTTG TAAAACAAAG TTATGAATTT TCAAATTCTA551 ATAAGAATTT GGAATATACA GAATGCGACA CATTTAGAAG CACCTTTCAT
601 TCAAAGTCTA CTCTTTCTGA ACCACAAAAC AATTCTGCTG AAGGGAATTC651 ACACAAATAT GATATATTAA AGAAGAATTT ATCAAAAAAG TCAGTTATAA701 AAAGTGAGAG AATAAATGGT GGAAAGAAAC TTTTAAATTC TAATAAAAGT751 GGGGCAGCCT TCAACCAGAG CAAATCTCTT ACCCTTCCCC AGACTTGTAA801 TAGAGAGAAA ATCTATACAT GCAGTGAATG TGGGAAAGCC TTTGGCAAAC851 AGTCAATCCT CAGTCGCCAC TGGAGAATTC ATACAGGAGA GAAGCCCTAT901 GAATGTCGTG AATGTGGGAA GACTTTTAGC CATGGTTCAT CCCTTACACG951 ACATCAGATA AGCCATAGTG GAGAGAAACC TTACAAATGC ATTGAATGTG1001 GGAAGGCCTT TAGCCATGGC TCATCACTTA CTAACCATCA GAGCACTCAC1051 ACGGGAGAGA AACCGTATGA ATGTATGAAC TGTGGAAAGT CTTTTAGTCG1101 TGTGTCCCTT CTCATTCAGC ATCTAAGAAT TCATACGCAA GAAAAACGCT1151 ATGAGTGTCG TATATGTGGA AAGGCCTTCA TTCATAGTTC GTCTCTCATT1201 CACCATCAGA AAAGCCATAC TGGAGAGAAG CCTTATGAAT GTAGAGAATG1251 TGGGAAAGCT TTCTGCTGTA GCTCACACCT TACTCAACAT CAAAGAATTC1301 ACAGTATGAA GAAAAAATAT GAATGCCACA AATGTCTCAA GGGCTTTAGT1351 AGCTTCTCAT TTCTTGGTCA ACATCAGAGT ATTCATACTG GAGAAAAACC1401 GTTGAAGTTT AGAAATGCAG GAAATCCTTC AACCAGCTTG AATCACTGAA1451 TATGCATTTG AGAAATCACA TTAGATTGAA ACCCTACGAA TGCAGTATAT1501 GTGGGAAAGC CTTTAGTCAT AGGTCGTCCC TGCTTCAACA TCACAGTATT1551 CATACTGGAG AGAAACCTTA CGAATGTATT AAATGTGGGA AGACCTTCAG1601 CTGTAGTTCA AACCTTACTG TACATCAGAG AATTCATACT GGAGAAAAGC1651 CATATAAATG TAGTGAGTGT GGGAAAGCTT TTAGCAAAGG CTCGAATCTT1701 ACTGCCCATC AAAGAGTACA TAATGGAGAG AAACCCAATA GTGTGGTAAG1751 TGTGGAAAAG CCTTTAGATC ATATGAATCC CTATACATGT GAGAAATCTT1801 ACAGAAGAGA AGCAGTGTTT ATCACGGTAA ACTTCATTCA TAGATCCTCC1851 CTTATTTAAC ATCAGAAAAA TGTATACTGG GGAAAAGTTG TATGAAGGTG1901 GTGAACATGG GAGACTTTTA GCAATGATGC AGATTTTTTT ATTAGAGTTT1951 ATACTGTAGA GAAATCATAT GAAGTCAATA AATGTGGGAA AGCCTTTGTC2001 AGTATTAATC CCTTAATTGA CCNTAAGTAT ACTCACACTA GGAAAAATCT2051 GTGTACATGT AGCAAATGTG GGAAAGACTA TAGGCAATAG GAATCTCCTG2101 CAAACTCCTA CAGGAGAAAA GTTGTATGAA TGTGGAAACT TTAGAAATTG
2151 AAGGAATTTT TCCAGTTCCA AGTGCATCCC<210>7<211>411<212>PRT<213>智人(Homo sapiens)<400>71 MSQVTFSDVA IDFSHEEWAC LDSAQRDLYK DVMVQNYENL VSVGLSVTKP51 YVIMLLEDGK EPWMMEKKLS KDWESRWENK ELSTKKDIYD EDSPQPVTME101 KVVKQSYEFS NSNKNLEYTE CDTFRSTFHS KSTLSEPQNN SAEGNSHKYD151 ILKKNLSKKS VIKSERINGG KKLLNSNKSG AAFNQSKSLT LPQTCNREKI201 YTCSECGKAF GKQSILSRHW RIHTGEKPYE CRECGKTFSH GSSLTRHQIS251 HSGEKPYKCI ECGKAFSHGS SLTNHQSTHT GEKPYECMNC GKSFSRVSLL301 IQHLRIHTQE KRYECRICGK AFIHSSSLIH HQKSHTGEKP YECRECGKAF351 CCSSHLTQHQ RIHSMKKKYE CHKCLKGFSS FSFLGQHQSI HTGEKPLKFR401 NAGNPSTSLN H
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人锌指蛋白hZNFshgc活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.7所示的序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,所述的序列具有SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列。
4.一种分离出的人锌指蛋白hZNFshgc多肽,其特征在于,它包括具有SEQ IDNO.7氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.7序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.一种产生具有人锌指蛋白hZNFshgc活性的多肽的方法,其特征在于,该方法包括(1)将编码具有人锌指蛋白hZNFshgc活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人锌指蛋白hZNFshgc表达载体,所述的核苷酸序列与SEQ ID NO.6中从核苷酸第214-1449位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人锌指蛋白hZNFshgc的重组细胞;(3)在适合表达人锌指蛋白hZNFshgc多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人锌指蛋白hZNFshgc活性的多肽。
9.一种能与权利要求4所述的人锌指蛋白hZNFshgc多肽特异性结合的抗体。
10.一种探针分子,其特征在于,它包含权利要求1所述的DNA分子中8-100个连续核苷酸。
全文摘要
本发明公开了一种在人体正常肾上腺组织中表达的新的人锌指蛋白hZNFshgc的基因序列及其编码蛋白,本发明还公开了该蛋白的制备方法,以及提供了与hZNFshgc蛋白多肽特异性结合的抗体。本发明的人hZNFshgc蛋白可以施用于病人,以治疗或减轻因人hZNFshgc蛋白缺失、无功能或异常而导致的有关病症。
文档编号C07K16/18GK1948492SQ200510030558
公开日2007年4月18日 申请日期2005年10月14日 优先权日2005年10月14日
发明者韩泽广, 黄健 申请人:上海人类基因组研究中心