一种与狐精子顶体蛋白fsa-1同源的基因(cbcald05)的制作方法

文档序号:3525381阅读:435来源:国知局
专利名称:一种与狐精子顶体蛋白fsa-1同源的基因(cbcald05)的制作方法
技术领域
本发明涉及新鉴定的多核苷酸,由这些多核苷酸编码的多肽和上述多核苷酸和多肽的用途及它们的制备。更具体而言,本发明的多核苷酸和多肽涉及含顶体蛋白的基因家族,在此以后称为CBCALD05。本发明还涉及上述多核苷酸和多肽功能的抑制或激活。
背景技术
狐FSA-1是一种膜蛋白,位于顶体膜上,在许多哺乳动物中它有几种配偶体(partner),并且它可能与精子活性和/或生育作用有关。该蛋白的新型人候选者与已知的人精子顶体蛋白几乎无同源性。这表明含顶体蛋白的该基因家族有已确立且证实作为治疗靶点的历史。显然有必要鉴定含顶体蛋白的该基因家族的进一步成员并描述其特征,这些蛋白可能在预防改善或校正包括但不限于不育症和生育有关的疾病或功能失调中起作用。
发明小结在一个方面,本发明涉及CBCALD05多肽和重组物质和制备它们的方法。本发明的另一方面涉及应用上述CBCALD05多肽和多核苷酸的方法。这些用途包括治疗不育症和生育有关的其他疾病。仍是另一方面,本发明涉及使用本发明提供的物质鉴定激动剂和拮抗剂的方法,和用鉴定出的化合物治疗与CBCALD05失衡有关的病情。而本发明的另一方面涉及检测和CBCALD05不合适的活性或水平有关疾病的诊断方法。
发明描述定义提供下列定义以便于理解在本发明中经常使用的一些术语。
包括其他情况下,“CBCALD05”一般指具有在SEQ ID NO2中给出的氨基酸序列的多肽或其等位变异体。
“CBCALD05活性或CBCALD05多肽活性”或“CBCALD05或CBCALD05多肽的生物学活性”指所述的CBCALD05的代谢或生理功能,包括相似的活性或改进的活性或具有降低非所需副作用的这些活性。也包括所述的CBCALD05的抗原性活性和免疫原性。
“CBCALD05基因”指一种具有在SEQ ID NO1中给出的核苷酸序列的多核苷酸或其等位变体和/或它们的互补体。
在此所用的“抗体”包括多克隆和单克隆抗体、嵌合、单链和人源化抗体,以及Fab片段,包括Fab或其他免疫球蛋白表达文库的产物。
“分离的”意味着“通过人手工方法”改变来自天然的状态。如果“分离”的组合物或物质在天然中出现,它已被从其原来的环境改变或移去,或二者均有之。例如,天然存在于活动物中的一种多核苷酸或多肽,不是“分离的”,但从其天然状态共同存在的材料中分开得到的相同多核苷酸或多肽,如在此所用的术语一样,为“分离的”。
“多核苷酸”一般指任何的多核糖核苷酸或多脱氧核糖核苷酸,它可以是未修饰的RNA或DNA或修饰过的RNA或DNA。“多核苷酸”包括而不限于单一和双链DNA(一种单一和双链区的混合物的DNA)、单和双链区的混合物的RNA(包含可以单链,或更具体来说,双链或一种单和双链区混合物的DNA和RNA的杂交分子)。此外,“多核苷酸”指的是包含RNA或DNA或RNA和DNA二者的三链区。术语多核苷酸也包括含有1个或多个修饰碱基的DNAs和RNAs以及具有为稳定性或其它原因而修饰的骨架的DNAs或RNAs。“修饰”的碱基包括例如三苯甲基化的(tritylated)碱基和稀有碱基如次黄嘌呤核苷。各种修饰方法针对DNA和RNA进行,因此,“多核苷酸”包括如在天然中一般可找到的化学、酶学或代谢修饰形式的多核苷酸,以及病毒和细胞特征性的DNA和RNA的化学形式。“多核苷酸”也包括相对短的多核苷酸,常称为寡核苷酸。
“多肽”指的是任何包含通过肽键或修饰过的肽键即肽等配体(isosteres)互相连接而成的2个或更多个氨基酸的肽或蛋白。“多肽”指短链(一般称为肽、寡肽或寡聚体)和较长的链(一般称为蛋白)。多肽可含有除了20基因编码的氨基酸以外的氨基酸。“多肽”包括通过天然方法如翻译后加工修饰或本领域众所周知的化学修饰方法修饰的氨基酸序列。上述修饰方法在基础课程和更详细的专题文章以及大量的研究文献中完整地描述过。修饰可发生在多肽的任何部位,包括肽骨架,氨基酸侧链和氨基或羧基末端。值得称道的是相同类型的修饰可以相同或不同程度存在于指定多肽的几个位点上。另外,一个指定的多肽可含有许多种类型的修饰。多肽可由于遍在蛋白化而分枝,并且它们可以为具有或没有分枝的环化。环形分枝的和分枝环形的多肽可能是翻译后天然加工的结果或通过合成方法得到。修饰包括乙酰化、酰化、ADP-核糖化、酰胺化、黄素的共价附着、血红素组分的共价附着、核苷酸或核苷酸衍生物的共价附着、脂类或脂类衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环化、二硫键形成、去甲基化、共价交联的形成、胱氨酸的形成、焦谷氨酸盐的形成、甲酰化、伽马羧基化、糖基化、GPI锚定物形成、羧化、碘化、甲基化、肉豆蔻酰化、氧化、蛋白水解加工、磷酸化、异戊二烯化、外消旋化、硒化(selenoylation)、硫酸化、转运RNA介导的向蛋白添加氨基酸如精氨酰化(arginylation)和遍在蛋白化。例如见,蛋白结构和分子特性,第二版,T.E.Creighton,W.H.Freeman and Company,纽约,1993和Wold F.,蛋白翻译后修饰前景和展望,1-12页,出自,蛋白的翻译后修饰,B.C.Johnson主编,学术出版社,纽约,1983;Seifter等,“蛋白修饰和非蛋白辅助因子的分析”,酶学方法(1990)182626-646和Ratten等,“蛋白合成翻译后修饰和老化”,纽约科学院年评(1992)66348-62。
在此作为术语使用的“变体”,是一种分别与参照多核苷酸或多肽不同的多核苷酸或多肽。一种典型的多核苷酸变体与另一种参照多核苷酸的核苷酸序列不同。变体的核苷酸序列变化可能或不能改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸变化,正如以下讨论的一样,可导致由参照序列编码的多肽中的氨基酸替换、添加、缺失、融合和截短。一种典型的多肽变体与另一种参照多肽的氨基酸序列不同。一般来说,差异是有限的,结果参照多肽和变体的序列在整个序列中非常相似,并且在许多区域完全一致。变体和参照多肽在氨基酸序列方面的差异可由一个或多个替换、添加、缺失的任何组合引起。一个替换或插入的氨基酸残基可以或不可以是由该遗传密码所编码的一个氨基酸。一种多核苷酸或多肽的变体可以是天然产生的如等位变体,或者可以是未知的天然产生的变体。多核苷酸和多肽的非天然产生的变体可通过诱变技术或直接合成方法获得。
“一致性”是一种测定核苷酸序列或氨基酸序列一致性的方法。总的来说,将序列进行比较结果得到最高等级的匹配。“一致性”本身有本领域公认的意义,能用发表的技术计算。如见(计算分子生物学,Lesk A.M.编著,牛津大学出版社,纽约,1988;生物计算信息学和基因组计划Smith,D.W.编著,学术出版社,纽约,1993;计算机分析序列数据,第一部分,Griffin,A.M.,和Griffin,H.G.编著,Humana出版社,New Jersey,1994;分子生物学中的序列分析,von Heinje,G.,学术出版社,1987;和序列分析引物,Gribskov.M和Devereux,J.编著,M Stockton出版社,纽约,1991)。尽管存在许多方法测定2个多核苷酸或多肽序列之间的一致性,但术语“一致性”对技术人员来说众所周知(Carillo,H和Lipton,D.,SIAM应用数学杂志(SIAM J AppliedMath)(1988)481073)。常用于测定2个序列之间一致性或相似性的方法,包括但不限于在巨型计算机指南,Martin J.Bishop编著,学术出版社,圣地亚哥,1994,和Carillo,H,和Lipton,D.,SIAM J AppliedMath(1988)481073中所公开的方法。测定一致性和相似性的方法编码在计算机程序中,测定2个序列之间一致性和相似性的优选计算机程序方法包括但不限于,GCS程序软件包(Devereux,J.,等,核酸研究(1984)12(1)387),BLASTP,BLASTN,FASTA(Atschul,S.F.等,分子生物学杂志(1990)215403)。
作为说明,例如具有与SEQ ID NO1的参照核苷酸序列至少95%“一致性”的核苷酸序列的多核苷酸,可认为该多核苷酸的核苷酸序列与参照序列相比,除了该核苷酸序列可包括SEQ ID NO1的参照核苷酸序列的每100个核苷酸达5个点突变以外是一致的。换句话说,为了获得具有与参照核苷酸序列至少95%一致核苷酸序列的多核苷酸,在参照序列中多达5%的核苷酸可缺失或用另一个核苷酸取代,或者在参照序列中直至总核苷酸5%的多个核苷酸可插入到参照序列中。参照序列的这些突变可在参照核苷酸序列的5或3末端部位产生或在这些末端部位之间的任何位置产生,可单个分散于参照序列核苷酸之中或以一个或多个毗连序列群分散于参照序列之中。
相似地,例如一个具有与SEQ ID NO2的参照氨基酸序列至少有95%“一致性”氨基酸序列的多肽,可认为该多肽的氨基酸序列与该参照序列相比,除了该多肽序列可能包括SEQ ID NO2的参照氨基酸的每100个氨基酸中达5个改变以外是一致的。换句话说,为获得一种具有与参照氨基酸序列至少95%一致氨基酸序列的多肽,在参照序列中多达5%的氨基酸残基可缺失或用别的氨基酸取代,或者在参照序列中直至总氨基酸残基的5%的多个氨基酸可插入到参照序列中。参照序列的这些改变可以在参照氨基酸序列的氨基或羧基末端部位产生或这些末端部位的任何部位产生,可单个分散于参照序列的残基之间或以一个或更多个毗连序列群分散于参照序列之中。
本发明多肽在一方面,本发明涉及CBCALD05多肽(或CBCALD05蛋白)。CBCALD05多肽包括SEQ ID NO2多肽;和包括SEQ ID NO2的氨基酸序列的多肽以及包括下列氨基酸序列的多肽,这些氨基酸序列就其全长来说与SEQ ID NO2的序列至少有80%一致性,更为优选具有至少90%的一致性以及甚至更为优选的至少95%一致性。而且,那些至少97-99%(一致性)的序列是高度优选的。CBCALD05多肽中还包括具有下列氨基酸序列的多肽,这些多肽就其全长来说与具有SEQ IDNO2的氨基酸序列的多肽至少有80%一致性,更为优选的是至少90%一致性以及甚至更为优选的是与SEQ ID NO2至少95%一致性。此外,那些至少97-99%(一致性)的多肽是高度优选的。优选地,CBCALD05多肽表现至少CBCALD05的一种生物学活性。CBCALD05多肽可以是“成熟”蛋白的形式或为较大蛋白例如融合蛋白的一部分。包括含分泌或引导序列的另外氨基酸序列,前序列,有助于纯化如多组氨酸残基的序列或使重组体产生过程中利于稳定的序列,这些常是有利的。
CBCALD05多肽的片段也包括在本发明之中。片段是具有就整体而言与前面提到的CBCALD05多肽的氨基酸序列部分相同,但不是全部相同的氨基酸序列多肽。至于CBCALD05多肽,片段可以是“自由出现”或包括在一个较大的多肽中,在该多肽中所述的片段形成一部分或一个区域,最优选的是作为单个连续区域。本发明多肽片段的代表性实施例包括例如从大约氨基酸数目1-20、21-40、41-60、61-80、81-100和101至CBCALD05多肽末端的片段。在本文中“大约”包括在任一端或两端数个、5、4、3、2或1个更多或更少氨基酸的具体列举范围。
优选的片段包括例如具有CBCALD05多肽的氨基酸序列的截短多肽,除了缺失包括氨基末端的连续系列残基或包括羧基末端的连续系列残基或缺失包括氨基末端和包括羧基末端的2个连续系列残基的多肽以外。优选的还有其特征为如下结构或功能特性的片段,如包含α螺旋和α螺旋形成区、β折叠和β折叠形成区、转角和转角形成区、卷曲和卷曲形成区、亲水区、疏水区、α两亲区、β两亲区、柔性区、表面形成区、底物结合区和高抗原指示区的片段。其他优选的片段是生物学活性片段。生物学活性片段是那些介导CBCALD05活性的片段,包括具有相似活性或改进的活性或降低非所需的活性的那些片段。还包括那些在动物尤其在人中有抗原性或免疫原性的片段。
任选地,全部这些多肽片段保留CBCALD05的生物学活性,包括抗原性活性。所定义的序列和片段的变体也形成本发明的部分。优选的变体是那些由保守氨基酸替换与参照体不同的种类,即用一个相似特性的残基替换的变体。上述典型的替换是在A1a、Val、Leu和Ile之间;Ser和Thr之间;酸性残基Asp和Glu之间;Asn和Gln之间和碱性残基Lys和Arg之间;或芳香族残基Phe和Tyr之间进行。尤其优选的是其中数个、5-10、1-5或1-2个氨基酸以任何组合被替换、缺失或添加的变体。
本发明的CBCALD05多肽能用任何合适的方法制备。上述多肽包括分离自天然产生的多肽、重组制备的多肽、合成制备的多肽或由这些方法的组合制备的多肽。制备上述多肽的方法在本领域完全了解。
本发明多核苷酸本发明的另一方面涉及CBCALD05多核苷酸。CBCALD05的多核苷酸包括分离的编码CBCALD05多肽和片段的多核苷酸和与其密切相关的多核苷酸。更具体而言,本发明的CBCALD05多核苷酸包括在SEQID NO1中含有的编码SEQ ID NO2的CBCALD05多肽的核苷酸序列的多核苷酸和具有SEQ ID NO1的特定序列的多核苷酸。CBCALD05多核苷酸进一步包括就其全长而言包含与编码SEQ ID NO2的CBCALD05多肽的核苷酸序列至少有80%一致性的核苷酸序列多核苷酸,和就其全长而言包含与SEQ ID NO1的核苷酸序列至少80%一致的多核苷酸。就此而言,至少90%一致性的多核苷酸是尤为优选的、而那些具有至少95%一致性的种类是特别优选的。此外,至少97%一致性的那些是高度优选的,且至少98-99%一致性的那些是最为高度优选的,至少99%的那些是最为优选的。在CBCALD05多核苷酸之下还包括与SEQ ID NO1中含有的核苷酸序列足够一致性的核苷酸序列,该序列在用于扩增或用作探针或标记物的条件下能杂交。本发明还提供与上述CBCALD05多核苷酸互补的多核苷酸。
如表1(SEQ ID NO1)编码人CBCALD05的cDNA测序结果所示,本发明的CBCALD05结构上与含有顶体蛋白的基因家族的其他蛋白有关。SEQ ID NO1的cDNA序列含有开放阅读框架(核苷酸数目11~879),其编码SEQ ID NO2的293个氨基酸的多肽。表2的氨基酸序列(SEQ ID NO2)与狐顶体蛋白FSA-1在236氨基酸中具有约82.2%的一致性(用FASTA)(S Beaton等,Reprod.Fertil Dev.6761-770,1994)。表1的核苷酸序列(SEQ ID NO1)与狐精子顶体蛋白FSA-1在574个核苷酸中具有大约88.5%的一致性(用FASTA)(S Beaton等,Reprod.Fertil.Dev.6761-770,1994)。因此,本发明的CBCALD05多肽和多核苷酸可期望特别与它们同源的多肽和多核苷酸拥有相似的生物学功能/特性,并且它们的用途对本领域的任何技术人员是显而易见的。
表1a
a人CBCALD05的核苷酸序列(SEQ ID NO1)表2b
b人CBCALD05的氨基酸序列(SEQ ID NO2)本发明编码CBCALD05的一种多核苷酸可用标准克隆筛选法,利用表达序列标签(EST)分析来源于人脐带血的细胞mRNA的cDNA文库中得到(Adams,M.D.等,科学(1991)2521651-1656;Adams,M.D.等,自然,(1992)355632-634;Adams,M.D.等,自然(1995)377增刊(Supp)3-174)。本发明的多核苷酸也能从天然来源如基因组DNA文库中得到或能用众所周知和商业可购得的技术合成。
编码SEQ ID NO2的CBCALD05多肽的核苷酸序列可以与表1中(SEQ ID NO1核苷酸数11~879)含有的编码多肽序列一致,或者作为遗传密码的丰度(简并性)的结果,也可以是编码SEQ ID NO2的多肽的序列。
当本发明的多核苷酸用于重组制备CBCALD05多肽时,多核苷酸可包括成熟多肽或其片段本身的编码序列,在阅读框架中具有其他编码序列的编码序列,这其它编码序列如那些编码引导或分泌序列,前蛋白或原蛋白或前原蛋白序列,或其他融合多肽部分。例如,可编码便于融合多肽纯化的标记序列。在本发明这方面的一些优选实施方案中,标记序列是六组氨酸肽或是HA标签,六组氨酸肽在pQE载体(QiagenInc.)中提供和在Gentz等,美国自然科学院院报(1989)86821-824中描述。多核苷酸也可含有非编码5′和3′序列,如转录不翻译的序列,剪接和聚腺苷化信号,核糖体结合位点和稳定mRNA的序列。
进一步优选的实施方案是编码包括表2(SEQ ID NO2)的氨基酸序列CBCALD05多肽的CBCALD05变体的多核苷酸,其中数个、5-10、1-5、1-3、1-2或1个氨基酸残基以任何组合被置换、缺失或添加。
本发明进一步涉及与在本文中上面描述过的序列杂交的多核苷酸。在此方面,本发明特别涉及在严紧条件下能与在本文中上面描述过的多核苷酸杂交的多核苷酸。正如在此所用的,术语“严紧条件”意味着仅在序列之间的一致性至少80%和优选至少90%,更优选至少95%,而甚至更优选97-99%的情况下杂交才会发生。
与SEQ ID NO1中含有的核苷酸序列或其片段一致或充分一致的本发明多核苷酸,可以用作cDNA和基因组DNA的杂交探针,以分离编码CBCALD05多肽的全长cDNAs和基因组克隆和分离与CBCALD05基因具有高度序列相似性的其他基因(包括编码来源于非人类的种的同系物和直向同源物(ortholog)的基因)的cDNA和基因组克隆。上述杂交技术在本领域的技术人员中众所周知。一般地,这些核苷酸序列与参照体的序列具有80%一致性,优选90%一致性,更为优选95%一致性。一般来说这些探针包括至少15个核苷酸。优选地,上述探针有至少30个核苷酸和可以有至少50个核苷酸。特别优选的探针在30和50个核苷酸范围之间。
在一个实施方案中,得到编码CBCALD05多肽的多核苷酸包括来自非人类的物种的同系物和直向同源物包括了如下步骤,在严紧杂交条件下用具有SEQ ID NO1或其片段标记的探针筛选合适的文库,然后分离到含有所述多核苷酸序列的全长cDNA和基因组克隆。因此在另一方面,本发明的CBCALD05多核苷酸进一步包括这样的核苷酸序列,该核苷酸序列包含有在严紧条件与具有SEQ ID NO1的核苷酸序列或其片段杂交的核苷酸序列。也包括进CBCALD05多肽的是包含通过上述杂交条件下获得的核苷酸序列编码的氨基酸序列。上述杂交技术在本领域的技术人员中众所周知。杂交严紧条件如上定义。或者作为选择在含50%甲酰胺,5×SSC(150 mM NaCl,15mM柠檬酸三钠),50mM磷酸钠(pH7.6),5×Denhardt’s溶液,10%硫酸葡聚糖和20μg/ml变性剪切过的鲑精DNA的溶液中,42℃温育过夜,然后在大约65℃用0.1×SSC洗杂交膜的条件。
本发明的多核苷酸和多肽可用作研究试剂和材料,以发现对动物和人类疾病治疗和诊断的方法。
载体、宿主细胞、表达本发明还涉及包含本发明的多核苷酸或多肽的载体和宿主细胞,所述的宿主细胞用本发明的载体进行遗传工程操作及通过重组技术制备本发明的多肽。也可使用无细胞翻译系统用来源于本发明的DNA构建体的RNAs制备上述蛋白。
为了重组体的制备,宿主细胞可进行遗传工程操作以掺入本发明的多核苷酸表达系统或其一部分。多核苷酸导入到宿主细胞中可通过在许多标准的实验室手册中描述的方法进行,如Davis等,分子生物学的基本方法(1986)和Sambrook等,分子克隆实验室手册,第二版,冷泉港实验室出版社,冷泉港,纽约(1989)如用磷酸钙转染、DEAE-葡聚糖介导的转染、转位(transvection)、显微注射、阳离子脂介导的转染、电穿孔、转导、划痕负载(Scrape loading)、轰击导入或感染。
合适宿主的代表性实例包括细菌细胞,如链球菌、葡萄球菌、大肠杆菌、链霉菌和枯草芽孢杆菌细胞、真菌细胞,如酵母细胞和曲霉细胞;昆虫细胞如果蝇S2和草地夜蛾Sf9细胞;动物细胞如CHO、COS、HeLa、C127、3T3、BHK、HEK 293和Bowes黑色素瘤细胞和植物细胞。
大量的表达系统可资利用。上述系统包括下述系统及其他系统,染色体、附加体和病毒衍生的系统,如以下来源的载体细菌质粒、细菌噬菌体、转座子、酵母附加体、插入元件、酵母染色体元件,病毒如杆状病毒、乳多空病毒如SV40、牛痘病毒、腺病毒、禽痘病毒、假性狂犬病毒和逆转录病毒,以及来源于其组合的载体,如来源于质粒和嗜菌体遗传元件的那些种类,如粘粒和嗜菌粒。表达系统可含有调节和引起表达的控制区。一般来说,可使用任一种适于在宿主中维持、增殖或表达多核苷酸以制备多肽的系统或载体。合适的核苷酸序列可通过各种众所周知和常规技术的任一种插入到表达载体中,例如在Sambrook等分子克隆,实验室手册(同上)中给出的那些技术。
为了把翻译蛋白分泌进内质网腔、外周质间隙或细胞外环境,合适的分泌信号可插入到需要的多肽中。这些信号可以是对该多肽内源性的或它们可以是异源信号。
如果CBCALD05多肽表达用于筛选方法中,一般来说,制备的多肽在细胞表面是优选的。在这方面,细胞可在筛选测定使用前收获。如果CBCALD05多肽被分泌到培养基中,为了重新获得和纯化多肽可回收培养基;如果在细胞内制备,回收多肽前,细胞首先必须被裂解。CBCALD05多肽可通过众所周知的方法从重组细胞培养物中回收和纯化,这些技术包括硫酸铵或乙醇沉淀、酸抽提、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟磷灰石层析和凝集素层析。最为优选地,使用高效液相层析纯化。当多肽在分离和/或纯化过程中被变性时,众所周知的重新折叠蛋白的技术可用于再生活性构象。
诊断分析法本发明还涉及用作诊断试剂的CBCALD05多核苷酸。检测和功能异常有关的CBCALD05基因突变形式将提供一种诊断工具,该诊断工具能增加或确定疾病的诊断或对疾病的易感性,该疾病由于CBCALD05的表达不足、过度表达或改变表达引起。在CBCALD05基因中携带突变的个体可通过各种技术在DNA水平检测到。
诊断用的核苷酸可从受试者的细胞中获得,例如从血液、尿、唾液、组织活检或尸检材料中得到。基因组DNA可直接用于检测或分析前用PCR或其他扩增法进行酶促扩增。RNA或cDNA也可以相似的方式使用。通过与正常基因型比较其扩增产物的大小变化能检测到缺失和插入。点突变能通过扩增的DNA与标记的CBCALD05核苷酸序列杂交鉴别。通过RNase消化或解链温度的差异完全配对序列能与错配的双链体区别开来。通过在有或没有变性剂的凝胶中DNA片段的电泳迁移率的改变或直接DNA测序如见,Myers等,科学(1985)2301242也可检出DNA序列的差异。特殊位置的序列变化也可通过核酸酶保护分析如RNase和S1保护或化学裂解方法显示。见Cotton等,美国自然科学院院报(1985)854397-4401。在另一实施方案中,包含CBCALD05核苷酸序列或其片段的寡核苷酸探针阵列可被构建以进行有效筛选如基因突变。阵列技术方法已众所周知并且具有普遍的应用性,能用于说明许多分子遗传学中的问题,包括基因表达、遗传谱系和遗传变异性(如见M.Chee等,科学,274卷610-613页(1996))。
诊断方法提供通过用描述过的方法检测在CBCALD05基因中的突变而诊断或测定对不育症的易感性及与生育有关的疾病的方法。
此外,通过包括测定来自受试者的样品其CBCALD05多肽或CBCALD05 mRNA的异常降低或增加水平的方法,可诊断不育症及与生育有关的疾病。可用本领域熟知的测定多核苷酸的量的任一种方法在RNA水平测定降低或增加表达的程度,例如用PCR、RT-PCR、RNA酶保护、Northern印迹和其他杂交方法。可用于测定来源于宿主样品的蛋白(例如CBCALD05多肽)水平的分析技术在本领域技术人员中众所周知。上述分析法包括放射免疫测定、竞争结合测定、Western印迹分析和ELISA分析法。
因而在另一方面,本发明涉及对疾病或对疾病易感性尤其是不育症和生育有关的疾病的诊断试剂盒,它包括(a)CBCALD05多核苷酸,优选的是SEQ ID NO1的核苷酸序列或其片段;(b)一种与(a)的序列互补的核苷酸序列;(c)CBCALD05多肽,优选的是SEQ ID NO2多肽或其片段;或(d)针对CBCALD05多肽的抗体,优选地针对SEQ ID NO2多肽的抗体。可以理解在任一种上述试剂盒中(a),(b),(c)或(d)可包括一种基本的组分。
染色体分析本发明的核苷酸序列也对染色体的鉴别有价值。该序列特异地靶向到在单个人染色体上的一个特定位置中并与之杂交。根据本发明对染色体相关序列的作图是将那些序列和基因有关疾病联系起来的重要的第一步。一旦一个序列被作图到精确的染色体位置,在染色体上该序列的物理位置能与遗传图数据相关联。例如,上述数据能在V.McKusick,人类孟德尔式遗传(在线通过Johns Hopkins大学Welch医学图书馆得到)中找到。然后通过谱系分析(物理性邻接基因的共遗传)能鉴别已被作图在相同染色体区的基因和疾病的关系。
在受影响和不受影响的个体之间cDNA或基因组序列的差异也可测定。如果一种突变在一些或所有受影响的个体中观察到但不在任何正常个体中观察到,那么该突变可能是引起该疾病的因素。
抗体本发明的多肽或其片段或其类似物或表达它们的细胞也能用作免疫原,以制备对CBCALD05多肽免疫特异性的抗体。术语“免疫特异性的”意为那些抗体拥有对本发明的多肽的亲和性比以前领域的其他相关多肽的亲和性基本上更大。
所制备的抗CBCALD05多肽的抗体能用常规方法给动物优选地非人类施用多肽或带有表位的片段、类似物或细胞得到。为制备单克隆抗体,可用任何提供由连续细胞系培养制备抗体的技术。实例包括杂交瘤技术(Kohler G.和Milstein,C.自然(1975)256 495-497)、trioma技术、人B细胞杂交瘤技术(Kozbor等,当代免疫学(1983)472)和EBV杂交瘤技术(Cole等,单克隆抗体和癌症治疗,pp.77-96,Alan R.Liss,Inc.,1985)。
制备单链抗体的技术(美国专利号4,946,778)也能适合于制备针对本发明的多肽的单链抗体。另外,转基因小鼠或包括其他哺乳动物的转基因其他生物可用于表达人源化的抗体。
以上所述的抗体可用于分离或鉴定表达此多肽的克隆或通过亲和层析纯化该多肽。
抗CBCALD05多肽的抗体也可用于治疗不育症和其他与生育有关的疾病。
疫苗本发明的另一方面涉及一种在哺乳动物中诱导免疫应答的方法,该方法包括用CBCALD05多肽或其片段接种到哺乳动物中,从而足以产生抗体和/或T细胞免疫应答以保护所述的动物不患不育症和其他与生育有关的疾病。而本发明的另一方面涉及在哺乳动物中诱导免疫应答的以下方法,该方法包括通过指导CBCALD05多核苷酸在体内表达的载体运送CBCALD05多肽,以便诱导这样的免疫应答产生抗体以保护所述的动物不患病。
本发明的进一步方面涉及一种免疫学/疫苗的制剂(组合物),当导入到哺乳动物宿主中时,该制剂在该哺乳动物中诱导对CBCALD05多肽的免疫应答,其中组合物包括CBCALD05多肽或CBCALD05基因。疫苗制剂可进一步包括合适的载体。由于CBCALD05多肽可在胃中断裂,优选地是肠胃道外施用(包括皮下、肌肉内、静脉内、真皮内等注射)。适合于肠胃道外施用的制剂包括水状和非水状的无菌注射溶液,它可含有抗氧化剂、缓冲液、制菌剂和用接受者的血液使该制剂等渗溶质和可包括悬浮剂或粘稠剂的水状和非水状无菌悬浮液。此制剂可存在于单位单剂量或多剂量的容器中,例如密封的安瓿和小瓶中,并且可贮存在冷冻干燥的条件中,使用前只需要马上加无菌的液状载体。该疫苗制剂也可包括增强制剂免疫原性的佐剂系统,例如本领域已知的水包油系统和其他系统。剂量将依赖于疫苗的比活性并能通过常规的实验容易确定。
筛选测定法本发明的CBCALD05多肽可用在筛选化合物的方法中,这些化合物活化本发明的CBCALD05多肽(激动剂)或抑制其活化(拮抗剂、或另外称为抑制剂)。因此,本发明的多肽也可用于评价和鉴别来源于例如细胞、无细胞的制品、化学文库和天然产物混合物的激动剂或拮抗剂。这些激动剂或拮抗剂可以是本发明多肽的天然或修饰的底物、配基、受体、酶等,视具体情况而定;或可以是本发明多肽的结构或功能模拟物。见Coligan等,免疫学中的现代方法1(2)第5章(1991)。
CBCALD05多肽担负有许多生物学功能,包括许多病理学的作用。因此,有必要寻找一方面刺激CBCALD05多肽而另一方面能抑制CBCALD05多肽功能的化合物和药物。一般来说,激动剂用于对诸如不育症和生育有关的疾病的病情的治疗和预防目的。拮抗剂也可用于对诸如不育症和生育有关的疾病的病情的各种治疗和预防目的。
一般来说,上述筛选方法可包括应用合适的表达CBCALD05多肽的细胞或对本发明的CBCALD05多肽起反应的细胞。上述细胞包括来源于哺乳动物、酵母、果蝇或大肠杆菌的细胞。然后,表达CBCALD05多肽(或含所表达的多肽细胞膜)或对CBCALD05多肽起反应的细胞与测试化合物接触,以观察结合或功能性反应的刺激作用或抑制作用。将与候选化合物接触细胞的能力与没有CBCALD05活性接触的相同细胞相比较。
测定可简单地检测候选化合物的结合情况,其中粘附到带有CBCALD05多肽的细胞通过直接或间接地和候选化合物有关的标记的方法或涉及用标记过的竞争物的竞争测定中检出。进一步,这些测定可用对带有CBCALD05多肽的细胞适合的检测系统,检测候选化合物是否导致由CBCALD05多肽活化产生的信号。一般来说在一种已知的激动剂存在下测定活化作用的抑制剂并观察因存在候选的化合物存在对激动剂活化的影响。
进一步,测定可简单地包括如下步骤,把含有CBCALD05多肽的溶液与候选化合物混合以形成混合物,在混合物中测定CBCALD05的活性并把混合物的CBCALD05的活性与标准进行比较。
CBCALD05 cDNA、蛋白和针对所述蛋白的抗体也可用于设计检测所加的化合物对细胞中产生的CBCALD05 mRNA和蛋白的影响的测定方法。例如,可建立ELISA方法,用单克隆和多克隆抗体通过本领域熟知的标准方法测定分泌的或与细胞有关的CBCALD05蛋白的水平,并且这种方法可用于发现抑制或增强从适当操作过的细胞或组织的CBCALD05(分别亦称为拮抗剂或激动剂)产量的药剂。
通过本领域熟知的标准受体结合技术,CBCALD05蛋白可用于鉴别膜结合或可溶性的受体及如果存在的任何受体。这些技术包括但不限于配基结合和交联测定法,在该方法中,CBCALD05用放射性同位素(如125I)、化学修饰(如生物素化)或者与适于检测或纯化的肽序列融合而标记,然后和假定受体的来源(细胞、细胞膜、细胞上清液、组织提取液、体液)温育。其他方法包括生物物理技术如表面质子共振质谱。除了用于纯化和克隆受体外,这些结合测定法可用于鉴定与CBCALD05结合其受体(如果存在的话任何受体)结合过程中竞争的CBCALD05的激动剂和拮抗剂。进行筛选测定的标准方法在本领域中已众所周知。
潜在的CBCALD05多肽拮抗剂的实例包括抗体或在某些情况下的寡核苷酸或蛋白,这些蛋白与CBCALD05多肽的配基、底物、受体、酶等(视具体情况而定)密切相关,例如配基、底物、受体、酶等的片段,或者结合到本发明的多肽上但不能引起反应的小分子,结果多肽的活性被阻止。
因此在另一方面,本发明涉及一种试剂盒,该试剂盒用于鉴定针对CBCALD05多肽的激动剂、拮抗剂、配基、受体、底物、酶等;或者降低或增加CBCALD05多肽产量的化合物,该试剂盒包括(a)CBCALD05多肽,优选的是SEQ ID NO2的多肽;(b)表达CBCALD05多肽的重组细胞,优选表达的是SEQ ID NO2的多肽;(c)表达CBCALD05多肽的细胞膜;优选的是SEQ ID NO2的多肽;或(d)针对CBCALD05多肽优选是SEQ ID NO2的多肽的抗体。应当理解在任一种上述试剂盒(a)、(b)、(c)或(d)中可组成基本组分。
预防和治疗方法本发明提供治疗异常病情的方法,例如与CBCALD05多肽活性过度和不足量有关的不育症和生育有关的疾病。
如果CBCALD05多肽的活性过度,几种方法可以采用。一种方法包括以有效地抑制CBCALD05多肽的功能的量施用在此上面描述过的抑制剂化合物(拮抗剂)和药用可接受的载体给患者,例如通过阻断配基、底物、受体、酶等的结合或抑制第二信号实现,因而减轻异常病情。在另一方法中,可以施用可溶形式的CBCALD05多肽,该多肽仍能和与内源性的CBCALD05多肽竞争的配基、底物、酶、受体等结合。上述竞争剂的典型实施方案包括CBCALD05多肽的片段。
在另一方法中,编码内源CBCALD05多肽的基因表达能用表达阻断技术抑制。已知的这些技术包括应用内部产生或分别施用的反义序列。例如见O’Connor神经化学杂志(J Neurochem(1991)56560作为基因表达的反义抑制剂的寡脱氧核糖核苷酸,CRC出版社,Boca RatonFL(1988)。或者,也可提供和基因形成三股螺旋的寡核苷酸。例如见,Lee等,核酸研究(1979)63073Cooney等,科学(1988)241456;Dervan等,科学(1991)2511360。这些寡聚物本来可以施用或者有关的寡聚物可在体内表达。
为了治疗与CBCALD05和其活性的表达不足有关的异常病情,也可采用多种方法。一种方法包括给患者施用治疗有效量的活化CBCALD05多肽的化合物,即如上面描述的激动剂,该化合物与药用可接受的载体组合使用,因而减轻异常病情。作为选择,亦可采用基因治疗,通过患者中相关的细胞内源产生CBCALD05。例如,本发明的多核苷酸可进行加工以在复制有缺陷的逆转录病毒载体中表达,如上述讨论那样。然后分离逆转录病毒表达构建体,导入到包装细胞中,该包装细胞用含有编码本发明多肽的RNA的逆转录病毒质粒载体转导,从而该包装细胞现能产生含有目的基因的感染性病毒颗粒。这些产生细胞作为工程化细胞在体内施用给患者并在体内表达所述的多肽。关于基因治疗的综述,见20章,基因治疗和其他基于分子遗传学的治疗方法(在此引入作为参考)书名人类分子遗传学,T Strachan和A P Read,BIOSScientific Publishers Ltd(1996)。另一种方法是治疗量的CBCALD05多肽与合适的药用载体组合在一起施用。
制剂和施用肽如CBCALD05多肽的可溶形式和激动剂及拮抗剂多肽或小分子可与合适的药用载体组合成制剂。上述制剂包括药用有效量的多肽或化合物和药用可接受的受体或赋形剂。上述载体包括但不限于盐水、缓冲盐水、葡萄糖、水、甘油、乙醇和其组合。制剂应适于施用方式,在本领域的技术人员中完全掌握。本发明进一步涉及药用包装和试剂盒,其包括1或多个充填有1或多种以上提到的本发明组合物组分的容器。
本发明的多肽和其他化合物可单独使用或和其他化合物例如治疗化合物结合使用。
优选的药用组合物的全身施用方式包括注射,一般通过静脉内注射。其他注射途径如皮下、肌肉内或腹膜内注射也可采用。另外全身施用的其它方法包括透粘膜和透皮施用,使用如胆盐或梭链孢酸或其他去垢剂的渗透剂进行。另外,如果适当地制成以肠道或胶囊制剂形式,口腔施用也是可能的。这些化合物的施用也可表面和/或局部以软膏、糊剂、凝胶等方式使用。
所需的剂量范围依赖于选择的肽、施用途径、制剂的性质、患者病情的特点和参加治疗医生的判断。然而适当的剂量为0.1~100μg/kg患者的范围。然而鉴于各种可得到的化合物和各种施用途径不同效率,可期望所需的剂量广泛的变化。例如,预期口腔施用比通过静脉内注射施用需要更高的剂量。在这些剂量水平的变化可用标准经验性最优化途径调整,这些方法在本领域完全掌握。
用于治疗的多肽在常称为“基因治疗”的以上描述的治疗方式中也可在患者中内源产生。因此,例如,来自患者的细胞可用多核苷酸如DNA或RNA加工以在体外编码多肽和例如,使用逆转录病毒质粒载体加工。然后将细胞回输到患者体内。
在本发明说明书中引用的所有出版物包括但不局限于专利和专利申请书在此引入仅作参考,尽管完全列出,但似乎每种单独的出版物具体和单独地标出以作为参考。
序列表(1)序列信息(i)申请者上海第二医科大学(ii)发明题目一种与狐精子顶体蛋白FSA-1同源的基因(CBCALD05)(iii)序列数目2(iv)通信地址(A)地址BATNER & PRESTIA(B)街道P.O.BOX 980(C)城市VALLEY FORGE(D)州名PA(E)国家美国(F)邮编19482(v)计算机可读形式(A)介质类型磁盘(B)计算机IBM兼容机(C)操作系统DOS(D)软件FastSEQ for Windows 2.0版(vi)目前申请资料(A)申请号待授予(B)提交日期(C)分类未知(vii)在先申请资料(A)申请号(B)中请日期(viii)代理人/代理机构资料(A)姓名PRESTA,PAUL F(B)登记号23,031(C)参考/存档号GP-70355(ix)电信信息(A)电话610-407-0700(B)传真610-407-0701(C)电报846169(2)SEQ ID NO1的信息(i)序列特征
(A)长度1027碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO1GACTCCCAAG ATGGCGGACC TACTGGGCTC CATCCTGAGC TCCATGGAGA AGCCACCCAG 60CCTCGGTGAC CAGGAGACTC GGCGCAAGGC CCGAGAACAG GCCGCCCGCC TGAAGAAACT 120ACAAGAGCAA GAGAAACAAC AGAAAGTGGA GTTTCGTAAA AGGATGGAGA AGGAGGTGTC 180AGATTTCATT CAAGACAGTG GGCAGATCAA GAAAAAGTTT CAGCCAATGA ACAAGATCGA 240GAGGAGCATA CTACATGATG TGGTGGAAGT GGCTGGCCTG ACATCCTTCT CCTTTGGGGA 300AGATGATGAC TGTCGCTATG TCATGATCTT CAAAAAGGAG TTTGCACCCT CAGATGAAGA 360GCTAGACTCT TACCGTCGTG GAGAGGAATG GGACCCCCAG AAGGCTGAGG AGAAGCGGAA 420GCTGAAGGAG CTGGCCCAGA GGCAAGAGGA GGAGGCAGCC CAGCAGGGGC CTGTGGTGGT 480GAGCCCTGCC AGCGACTACA AGGACAAGTA CAGCCACCTC ATCGGCAAGG GAGCAGCCAA 540AGACGCAGCC CACATGCTAC AGGCCAATAA GACCTACGGC TGTGTGCCCG TGGCCAATAA 600GAGGGACACA CGCTCCATTG AAGAGGCTAT GAATGAGATC AGAGCCAAGA AGCGTCTGCG 660GCAGAGTGGG GAAGAGTTGC CGCCAACCTC TAGGCGCCCC GCCCAGCTCC CTTTGACCCC 720TGGGGCAGGG CAGGGGGCAG GGAGAGACAA GGCTGCTGCT ATTAGAGCCC ATCCTGGAGC 780CCCACCTCTG AACCACCTCC TACCAGCTGT CCCTCAGGCT GGGGGAAAAC AGGTGTTTGA 840TTTGTCACCG TTGGAGCTTG GATATGTGCG TGGCATGTGT GTGTGTGTGT GAGAGTGTGA 900ATGCACAGGT GGGTATTTAA TCTGTATTAT TCCCCGTTCT TGGAATTTTC TTCCCCATGG 960GGCTGGGGTA CTTTACATTC AATAAATACT GTTTAACCCA AAAAAAAAAA AAAAAAAAAA 1020AAAAAAA 1027(2)SEQ ID NO2的信息(i)序列特征(A)长度293氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白(xi)序列描述SEQ ID NO2Met Ala Asp Leu Leu Gly Ser Ile Leu Ser Ser Met Glu Lys Pro Pro1 5 10 15Ser Leu Gly Asp Gln Glu Thr Arg Arg Lys Ala Arg Glu Gln Ala Ala20 25 30Arg Leu Lys Lys Leu Gln Glu Gln Glu Lys Gln Gln Lys Val Glu Phe35 40 45Arg Lys Arg Met Glu Lys Glu Val Ser Asp Phe Ile Gln Asp Ser Gly50 55 60Gln Ile Lys Lys Lys Phe Gln Pro Met Asn Lys Ile Glu Arg Ser Ile65 70 75 80Leu His Asp Val Val Glu Val Ala Gly Leu Thr Ser Phe Ser Phe Gly85 90 95Glu Asp Asp Asp Cys Arg Tyr Val Met Ile Phe Lys Lys Glu Phe Ala100 105 110Pro Ser Asp Glu Glu Leu Asp Ser Tyr Arg Arg Gly Glu Glu Trp Asp115 120 125Pro Gln Lys Ala Glu Glu Lys Arg Lys Leu Lys Glu Leu Ala Gln Arg130 135 140Gln Glu Glu Glu Ala Ala Gln Gln Gly Pro Val Val Val Ser Pro Ala145 150 155 160Ser Asp Tyr Lys Asp Lys Tyr Ser His Leu Ile Gly Lys Gly Ala Ala165 170 175Lys Asp Ala Ala His Met Leu Gln Ala Asn Lys Thr Tyr Gly Cys Val180 185 190Pro Val Ala Asn Lys Arg Asp Thr Arg Ser Ile Glu Glu Ala Met Asn195 200 205Glu Ile Arg Ala Lys Lys Arg Leu Arg Gln Ser Gly Glu Glu Leu Pro210 215 220Pro Thr Ser Arg Arg Pro Ala Gln Leu Pro Leu Thr Pro Gly Ala Gly225 230 235 240Gln Gly Ala Gly Arg Asp Lys Ala Ala Ala Ile Arg Ala His Pro Gly245 250 255Ala Pro Pro Leu Asn His Leu Leu Pro Ala Val Pro Gln Ala Gly Gly260 265 270Lys Gln Val Phe Asp Leu Ser Pro Leu Glu Leu Gly Tyr Val Arg Gly275 280 285Met Cys Val Cys Val290
权利要求
1.一种分离的多核苷酸,包括就其全长来说与编码SEQ ID NO2的CBCALD05多肽的核苷酸序列至少有80%一致的核苷酸序列;或者一种与所述分离的多核苷酸互补的核苷酸序列。
2.权利要求1的多核苷酸,其中所述的多核苷酸包括SEQ ID NO1的编码SEQ ID NO2的CBCALD05多肽的核苷酸序列。
3.权利要求1的多核苷酸,其中所述的多核苷酸包括就其全长来说与SEQ ID NO1的序列至少80%是一致的核苷酸序列。
4.权利要求3的多核苷酸,它是SEQ ID NO1的多核苷酸。
5.权利要求1的多核苷酸,为DNA或RNA。
6.一种包括表达系统的DNA或RNA分子,其中当所述的表达系统在相容的宿主细胞中存在时,所述的表达系统能产生一种包括与SEQID NO2的多肽有至少80%一致性氨基酸序列的CBCALD05多肽。
7.一种包括权利要求6的表达系统的宿主细胞。
8.一种制备CBCALD05多肽的方法,该方法包括把权利要求7的宿主在足以制备所述的多肽并从培养物中回收多肽的条件下进行培养。
9.一种制备能产生CBCALD05多肽细胞的方法,该方法包括用权利要求6的表达系统转化或转染宿主细胞,结果该宿主细胞在合适的培养条件下产生CBCALD05多肽。
10.一种包括就其全长来说与SEQ ID NO2的氨基酸序列至少80%一致氨基酸序列的CBCALD05多肽。
11.权利要求10的多肽,它包括SEQ ID NO2的氨基酸序列。
12.一种对权利要求10的CBCALD05多肽免疫特异的抗体。
13.一种治疗需要增强权利要求10的多肽的活性或表达的患者的方法,包括(a)给患者施用治疗有效量的所述的多肽的激动剂;和/或(b)提供患者一种分离的多核苷酸,该核苷酸包括就其全长来说与编码SEQ ID NO2的CBCALD05多肽的核苷酸序列至少有80%的一致性核苷酸序列;或者给患者提供一种对所述的核苷酸序列互补的核苷酸序列形式从而完成在体内产生所述的多肽活性。
14.一种治疗需要抑制权利要求10的CBCALD05多肽的活性或表达的患者的方法,包括(a)给患者施用治疗有效量的所述的多肽的拮抗剂;和/或(b)给患者施用抑制编码所述的多肽的核苷酸序列表达的核酸分子;和/或(c)给患者施周治疗有效量的与所述的多肽的配基、底物或受体竞争的多肽。
15.一种诊断与权利要求10的CBCALD05多肽的表达或活性有关患者中的疾病或对该疾病的易感性的方法,包括(a)测定在所述的患者基因组中编码所述的CBCALD05多肽的核苷酸序列中存在突变与否;和/或(b)分析在来源于所述患者的样品中CBCALD05多肽表达的存在或量。
16.一种鉴别抑制(拮抗)或激动权利要求10的CBCALD05多肽的化合物的方法,该方法包括(a)将候选化合物与表达CBCALD05多肽(或表达CBCALD05多肽的细胞膜)的细胞或对CBCALD05多肽有反应的细胞接触;然后(b)观察结合,或刺激或抑制功能性反应;或者比较与候选化合物接触的细胞(或细胞膜)与相同的没有接触化合物的细胞CBCALD05多肽活性的能力。
17.一种通过权利要求16的方法鉴定的激动剂。
18.一种通过权利要求16的方法鉴定的拮抗剂。
19.由权利要求9的方法制备的表达CBCALD05多肽的重组宿主细胞或其膜。
全文摘要
公开了CBCALD05多肽和多核苷酸以及通过同组技术制备这些多肽的方法。还公开应用CBCALD05多肽和多核苷酸设计治疗不育症和生育有关的其他疾病方法以及对这些病情诊断方法。
文档编号C07K14/435GK1250478SQ98803409
公开日2000年4月12日 申请日期1998年1月19日 优先权日1998年1月19日
发明者茅予, 傅刚, 张庆华, 周隽 申请人:上海第二医科大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1