专利名称:表达雄激素受体复合物相关蛋白的转基因动物的制作方法
相关申请本申请是2001年2月12日提交的美国专利申请09/781,693的专利申请和2001年1月17日提交的美国临时申请60/262,312的部分继续申请,因此该申请要求上述两项的优先权,它们的内容也一并纳入本文作参考。
背景技术:
目前已鉴定出相对于健康细胞而言在肿瘤细胞中过表达的多种基因。人们期望这些基因的鉴定可为抗癌药物的开发和癌症的诊断提供药物标靶。在肝脏肿瘤细胞中,类固醇受体(例如雄激素受体)的数量显示高于它们邻近的健康的肝细胞。
类固醇激素通常通过与它们的特异性核受体结合形成复合物,并由该复合物作为转录因子而发挥生理作用。所述复合物结合类固醇应答基因启动子中的特定核苷酸序列(类固醇反应元件),从而促进这些基因的转录。
发明简述本发明的是基于编码雄激素受体复合物相关蛋白(ARCAP)的小鼠基因的发现,该基因有85%与人ARCAP相同。已发现人ARCAP在肝细胞癌细胞中过表达(与邻近的正常细胞相比),并与雄激素受体结合,从而增强该受体反式激活(transactivate)雄激素应答基因的能力。作为人ARCAP基因的同系物,小鼠ARCAP基因能用来产生可用作开发癌症(例如肝癌)治疗药物的动物模型的转基因小鼠。
小鼠ARCAP的全长cDNA(称为SEQ ID NO1)如下所示,其中的起始和终止密码子用下划线标示GAGAGTATGAGGCGAGCCGTGGCCCGGGTGCCTCTCCGCTCCCGGGGAGAAGGCGCGGCCGTGGCTGCCGCCCTCTGAGTCGCGGCGCCGGCGAGGCCCCGGGGCGCGCGCATGGTGCTGGTGCCGCTCGGGTGTTGATCGGCCTGTCCCCTCCCTCTCTTCCCCTCCCCACCCCCCGCGGTGGTCTCCCCTTTCCCACCCCAGCCCTTGCGGAGCCATGGCTCGGAGTGGCTCCTGCCCGCACCTGTTGTGGGACGTGAGGAAAAGGTCCCTTGGGCTGGAGGACCCGTCCCGGCTGAGGAGCCGCTACCTGGGAAGAAGAGAATTTATCCAAAGATTAAAACTTGAAG
CAACTTTAAATGTGCATGATGGCTGTGTTAATACAATCTGTTGGAATGACACTGGAGAATATATTTTATCTGGCTCTGATGACACTAAACTTGTAATTAGTAATCCATACAGCAGAAAGGTTTTGACAACCATCCGTTCAGGGCATCGAGCAAATATATTTAGTGCAAAGTTTTTGCCGTGCACAGATGATAAGCAGATTGTGTCTTGCTCTGGAGATGGAGTCATATTTTATACTAACATTGAGCAAGATGCAGAAACTAACAGACAGTGCCAATTTACGTGCCATTATGGAACTACTTATGAGATTATGACTGTACCAAACGACCCTTACACCTTTCTGTCCTGTGGTGAAGATGGAACTGTTAGGTGGTTTGACACACGCATCAAAACCAGTTGCACAAAAGAAGACTGTAAAGATGATATTTTAATCAACTGTAGGCGTGCTGCCACATCTGTGGCTATTTGTCCCCCAGTACCATATTACCTTGCTGTGGGTTGTTCTGACAGCTCAGTACGGATTTATGATCGGCGAATGCTGGGCACAAGAGCTACAGGGAATTATGCAGGCCGAGGAACTACTGGAATGGTTGCTCGATTTATACCTTCTCATCTTAGTAACAAATCATGCAGAGTGACATCACTGTGTTACAGTGAAGATGGTCAAGAGATTCTTGTCAGTTATTCTTCAGACTACATCTATCTTTTTGACCCCAAAGATGATACTGCACGAGAACTTAAAACTCCTTCTGCAGAGGAGAGGCGAGAAGAGTTACGACAGCCTCCAGTTAAGCGCTTGAGACTTCGTGGTGATTGGTCAGATACTGGTCCCAGAGCACGGCCAGAAAGTGAACGAGAACGAGATGGAGAGCAAAGTCCCAATGTGTCACTGATGCAGAGAATGTCTGATATGTTATCAAGGTGGTTTGAAGAAGCAAGTGAAGTTGCACAAAGCAACAGAGGAAGAGGAAGACCTCGGCCCAGAGGTGGAACAAATCAGCCAGATGTTTCAACTCTTCCTACGGTTCCATCAAGTCCTAATTTGGAAGTGTGTGAAACTGCAATGGATGTAGACATGCCAGCTGCACTTCTTCAGCCTTCTACATCCTCTACAGATCCAGTTCAGGCTCAGGCAGCCACAGCCGCCATAGAAAGCCCTCGTTCCAGCTCGTTGCTGTCTTGCCCAGACAGTGAACCGAGGCAGTCTGTTGAGGCGTCTGGACACCATGCACATCATCAGTCAGATTCTCCTTCTTCTGTGGTTAACAAACAGCTGGGATCCATGTCACTTGATGAGCAACAGGATAACAGTAATGAGAGGCTGAGCCCCAAACCAGGGACAGGTGAACCCGTTTTAAGTTTGCACTACAGCACAGAAGGAACAACTACAAGCACAATAAAACTGAACTTTACAGATGAATGGAGCAGTACAGCCTCAAGTTCCAGAGGAAATGGGAGCCATTGCAAATCTGAGGGTCAGGAAGAATGCTTGGTCCCTCCGAGCTCTGTGCAGCCACCGGAAGGAGACAGTGAAACAAGAGCTCCTGAAGAACTATCAGAGAAAGGAACACTTCCAGAAAACCTCACTCAAAACCAGATAGATACAGCACAACTTGATAACTTCCCAGCTGAGCCATTGGATTCTAACTCAGGAGAGAAGAATAACCCAAGTCAGGACAGCCCTTGTGGGCTTCCAGAAGAAGGCACTTTGTCTGAAACAGACAGGGAGACTTGTGAGCAGGCCAGCACTGAGAGTGCTACCAGGCATGCTAGCACCAAGCCTGAACTCCCATCCCAGACAGAAGCCATTGAGCAGGCCAGCACTGAGAGTGCTACCAGGCATACCAGTGCC
AATCCTGAACTCCCATCCCAGACAGAAGCCATAGCACCTTTAGCTCATGAAGACCCATCTGCCAGGGACTCTGCTCTCCAGGACACAGATGACAGCGATGATGATCCGGTCTTGATCCCTGGTGCAAGATACCGAACAGGACCTGGTGATAGACGCTCCGCTGTTGCCCGCATTCAGGAGTTCTTCAGGAGGAGAAAAGAAAGGAAAGAAATGGAAGAGCTGGATACTTTGAACATTAGGAGGCCACTAGTAAAGATGGTTTATAAGGGCCACCGCAACTCCCGGACAATGATAAAAGAAGCCAATTTCTGGGGTGCTAACTTTGTAATGAGCGGTTCCGATTGTGGCCATATCTTCATCTGGGACCGGCACACTGCGGAGCATTTGATGCTTCTGGAAGCTGATAATCATGTGGTCAACTGCCTGCAGCCCCATCCGTTTGACCCAATTCTAGCCTCATCTGGCATAGATTATGACATAAAGATCTGGTCGCCACTAGAAGAGTCAAGAATTTTTAATCGAAAACTTGCTGATGAAGTTATAACTCGGAATGAACTCACGCTGGAAGAGACTCGGAACACCATCACCGTCCCAGCCTCTTTCATGTTGAGGATGTTGGCGTCACTGAATCATATCCGAGCTGACCGTCTGGAGGGTGACAGATCAGAAGGTTCAGGTCAGGAGAATGAAAATGAGGATGAAGAATAAAGAACTCCTTGGCAAGCACTTAGATGTTCTGAGATTTGTATACGACATTTATTATATTTTTTTTCTTTACAGAACTTTAGTGCAATTTAAGGCTATGGGTTTTTTTTTTTCTTTTTTTTTGGAGTTCTTCCCTATTTTGGGGATAACCAAACATTGGTTTGGAATGAGTGTGTGCATGAGTTGGGAGAGTGTGTAAAACAAAGTAAGCAAAATGTTTTTTGAAACCTTTTGCCGTGTATGGAGTCCCAAAAAAAAAAAAAAAAAAAAAAAAAAGCAAAGTGCAATACTTCCTGACCCTCCGCTGTGGGAGCTTGGATCAATGCTGAAGTCATTTTCATTGTAGTGAAAACGTTGGTTCAAATAAATTTCTACACTTGCCATTTGCAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGCGGCCGCTGAATTCTAG(SEQ ID NO1)编码小鼠ARCAP蛋白的核苷酸序列(即SEQ ID NO1中从ATG起始密码子至终止密码子之前紧接的密码子)命名为SEQ ID NO2。由上述cDNA编码的小鼠ARCAP蛋白(命名为SEQ ID NO3)如下所示Met ala arg ser gly ser cys pro his leu leu trp asp val arg lys arg ser leu glyleu glu asp pro ser arg leu arg ser arg tyr leu gly arg arg glu phe ile gln argleu lys leu glu ala thr leu asn val his asp gly cys val asn thr ile cys trp asnasp thr gly glu tyr ile leu ser gly ser asp asp thr lys leu val ile ser asn protyr ser arg lys val leu thr thr ile arg ser gly his arg ala asn ile phe ser alalys phe leu pro cys thr asp asp lys gln ile val ser cys ser gly asp gly val ilephe tyr thr asn ile glu gln asp ala glu thr asn arg gln cys gln phe thr cys histyr gly thr thr tyr glu ile met thr val pro asn asp pro tyr thr phe leu ser cysgly glu asp gly thr val arg trp phe asp thr arg ile lys thr ser cys thr lys gluasp cys lys asp asp ile leu ile asn cys arg arg ala ala thr ser val ala ile cyspro pro val pro tyr tyr leu ala val gly cys ser asp ser ser val arg ile tyr asparg arg met leu gly thr arg ala thr gly asn tyr ala gly arg gly thr thr gly metval ala arg phe ile pro ser his leu ser asn lys ser cys arg val thr ser leu cys
tyr ser glu asp gly gln glu ile leu val ser tyr ser ser asp tyr ile tyr leu pheasp pro lys asp asp thr ala arg glu leu lys thr pro ser ala glu glu arg arg gluglu leu arg gln pro pro val lys arg leu arg leu arg gly asp trp ser asp thr glypro arg ala arg pro glu ser glu arg glu arg asp gly glu gln ser pro asn val serleu met gln arg met ser asp met leu ser arg trp phe glu glu ala ser glu val alagln ser asn arg gly arg gly arg pro arg pro arg gly gly thr asn gln pro asp valser thr leu pro thr val pro ser ser pro asn leu glu val cys glu thr ala met aspval asp met pro ala ala leu leu gln pro ser thr ser ser thr asp pro val gln alagln ala ala thr ala ala ile glu ser pro arg ser ser ser leu leu ser cys pro aspser glu pro arg gln ser val glu ala ser gly his his ala his his gln ser asp serpro ser ser val val asn lys gln leu gly ser met ser leu asp glu gln gln asp asnser asn glu arg leu ser pro lys pro gly thr gly glu pro val leu ser leu his tyrser thr glu gly thr thr thr ser thr ile lys leu asn phe thr asp glu trp ser serthr ala ser ser ser arg gly asn gly ser his cys lys ser glu gly gln glu glu cysleu val pro pro ser ser val gln pro pro glu gly asp ser glu thr arg ala pro gluglu leu ser glu lys gly thr leu pro glu asn leu thr gln asn gln ile asp thr alagln leu asp asn phe pro ala glu pro leu asp ser asn ser gly glu lys asn asn proser gln asp ser pro cys gly leu pro glu glu gly thr leu ser glu thr asp arg gluthr cys glu gln ala ser thr glu ser ala thr arg his ala ser thr lys pro glu leupro ser gln thr glu ala ile glu gln ala ser thr glu ser ala thr arg his thr serala asn pro glu leu pro ser gln thr glu ala ile ala pro leu ala his glu asp proser ala arg asp ser ala leu gln asp thr asp asp ser asp asp asp pro val leu ilepro gly ala arg tyr arg thr gly pro gly asp arg arg ser ala val ala arg ile glnglu phe phe arg arg arg lys glu arg lys glu met glu glu leu asp thr leu asn ilearg arg pro leu val lys met val tyr lys gly his arg asn ser arg thr met ile lysglu ala asn phe trp gly ala asn phe val met ser gly ser asp cys gly his ile pheile trp asp arg his thr ala glu his leu met leu leu glu ala asp asn his val valasn cys leu gln pro his pro phe asp pro ile leu ala ser ser gly ile asp tyr aspile lys ile trp ser pro leu glu glu ser arg ile phe asn arg lys leu ala asp gluval ile thr arg asn glu leu thr leu glu glu thr arg asn thr ile thr val pro alaser phe met leu arg met leu ala ser leu asn his ile arg ala asp arg leu glu glyasp arg ser glu gly ser gly gln glu asn glu asn glu asp glu glu(SEQID No3)因此,本发明的特征在于基本纯的多肽或蛋白,它们包括与SEQ IDNO3至少70%(例如至少75,80,85,90,95,98或100%)相同的氨基酸序列。如果该多肽包括与SEQ ID NO3 100%相同的序列,那么该多肽可包含多至30个保守氨基酸取代。本发明也包括基本纯的由在严谨条件下能与具有SEQ ID NO2所示序列的探针杂交的核酸编码的多肽。所述多肽与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。这些多肽可用于制备ARCAP抗体(单克隆抗体或多克隆抗体)。这些抗体可用来检测组织或细胞区室中ARCAP的存在和分布。例如,这样的抗体可通过确定ARCAP蛋白在组织中是否表达或过表达来诊断癌性肝组织。它们也可如下所述用于治疗癌症(例如肝癌)本发明的特征还在于分离的编码本发明多肽的核酸,包含本发明核酸的载体以及包含本发明核酸的细胞(在动物模型中或在培养物中)。本发明范围内的核酸的实例包括下述的分离的核酸,该核酸具有在严谨条件下与序列为SEQ ID NO2或SEQ ID NO2的互补体的单链探针杂交的链,该核酸的长度至少是15(例如至少是30,50,100,200,500或1000)个核苷酸。上述这些核酸,载体和细胞可用于制备动物模型,诊断癌症(例如肝癌),或制备本发明的多肽。例如,本发明的核酸可通过确定组织或细胞中ARCAPmRNA是否表达或过表达来诊断肝癌。该核酸还可用作基于PCR的检测方法中的探针,或在核酸印迹(例如Northern印迹)中用作带标记的探针。
本发明的特征还在于转基因动物(例如,啮齿类动物,如小鼠),其基因组包括含有本发明核酸的转基因,这种动物与野生型动物相比对雄激素的应答增强。该转基因动物可这样产生,即将本发明的核酸导入细胞,使得从该核酸产生转录物,并将该转录物翻译成蛋白。这些转基因动物可用作开发癌症(例如肝癌)治疗药物的模型。
此外,本发明的特征还在于制备本发明多肽的方法,即培养上述细胞,在该细胞中表达所述多肽,并从培养物中分离出这种多肽。
本发明的特征也在于检测动物样品(例如血样品)中是否包含癌细胞的方法。该方法涉及提供来自动物(例如,啮齿类动物,如小鼠)的样品,检测该样品中ARCAP基因的表达水平。如果该样品中ARCAP基因的表达水平高于正常样品中的水平,便表明该动物样品中含有癌细胞(例如肝癌细胞)。这种方法可用于诊断癌症或监控动物模型中癌症的治疗。
治疗动物(例如,啮齿类动物,如小鼠)的癌症(例如肝癌)的方法也包括在本发明的范围之内。所述方法涉及鉴定具有表达ARCAP基因的癌细胞的动物,并用可阻断ARCAP与雄激素受体的结合或降低雄激素受体反式激活雄激素应答基因的能力的组合物治疗所述动物。该组合物可包含本发明的抗体或本发明的反义核酸。这种方法也可用于筛选药物(包括用于基因治疗的药物)和测试它们在动物模型中的效力。
本文针对给定多肽所用的术语“基本纯的”是指该多肽基本不含有其他生物大分子。基本纯的多肽是干重为至少75%(例如至少80,85,95或99%)纯。纯度可通过任何适当的标准方法来检测,例如柱层析,聚丙烯酰胺凝胶电泳或HPLC分析。
“保守氨基酸取代”是指一种氨基酸残基被另一种具有化学相似侧链的氨基酸残基所取代。本领域已确定了具有类似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链的氨基酸(例如,赖氨酸,精氨酸,组氨酸),具有酸性侧链的氨基酸(例如天冬氨酸,谷氨酸),具有不带电荷的极性侧链的氨基酸(例如甘氨酸,天冬酰胺,谷氨酰胺,丝氨酸,苏氨酸,酪氨酸,半胱氨酸),具有非极性侧链的氨基酸(例如丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,苯丙氨酸,蛋氨酸,色氨酸),具有β分支侧链的氨基酸(例如苏氨酸,缬氨酸,异亮氨酸)以及具有芳香族侧链的氨基酸(例如酪氨酸,苯丙氨酸,色氨酸,组氨酸)。
在“严谨条件下”杂交是指在65℃,0.5×SSC杂交,然后在45℃,0.1×SSC洗涤。
两个氨基酸序列或核苷酸序列的“同一性百分比”利用Karlin和Altschul的算法(Proc.Natl.Acad.Sci.USA 872264-2268,1990),经Karlin和Altschul修改后的算法(Proc.Natl.Acad.Sci.USA 905873-5877,1993)确定。这种算法被纳入到Altschul等的NBLAST和XBLAST程序中(J.Mol.Biol.215403-410,1990)。BLAST核苷酸检索用NBLAST程序进行,分值(score)=100,字段长(wordlength)=12。用XBLAST程序进行BLAST蛋白的检索,分值=50,字段长=3。两序列间存在缺口时,使用Altschul等所述的GappedBLAST(Nucleic Acids Res.253389-3402,1997)。当使用BLAST和GappedBLAST程序时,采用各自程序(例如XBLAST和NBLAST)的默认参数,参见www.ncbi.nlm.nih.gov。
“分离的核酸”是这样一种核酸,其结构与任何天然核酸的结构不同,或与跨越3个以上被分隔的基因(separate gene)的天然基因组核酸的任何片段不同。因此,该术语包括,例如,(a)一种核酸,其具有天然基因组DNA分子的部分序列,但其侧翼并非天然生物基因组中该分子所述部分的侧翼编码序列;(b)掺入到载体或原核或真核生物基因组DNA中的核酸,其掺入方式致使所得分子与任何天然载体或基因组DNA都不同;(c)分离的分子如cDNA,基因组片段,由聚合酶链反应(PCR)制备的片段,或限制性片段;以及(d)重组核苷酸序列,其是杂合基因(即编码融合蛋白的基因)的一部分。特别排除在此定义之外的是存在于不同的(i)DNA分子,(ii)经转染的细胞或(iii)细胞克隆组成的混合物中的核酸,例如,DNA文库,如cDNA或基因组DNA文库中的核酸。
本发明的其他特征或优点可从以下详细说明以及权利要求中明显看出。
发明详述本发明涉及表达ARCAP基因的非人转基因动物,以及利用所述动物开发治疗或预防肝癌的药物的方法。
本文所用的“非人转基因动物”包括起始的(founder)非人转基因动物,其后代以及来源于所述动物的细胞和组织。非人转基因动物可以是农场动物(farm animals),如猪,山羊,绵羊,牛,马和兔,啮齿类动物如大鼠,豚鼠和小鼠,以及非人灵长类动物如狒狒(baboon),猴子(monkey)和黑猩猩(chimpanzee)。转基因的猪和小鼠尤其有用。
本发明的非人转基因动物包含整合到其基因组中的编码ARCAP蛋白的核酸。本文所用的“ARCAP蛋白”是指野生型ARCAP蛋白或功能等价的变体,例如全长蛋白的片段。
本发明认为鉴定基因组中的内含子序列(如果有),并把它们包括在编码ARCAP蛋白的核酸中是有利的。
在本发明的非人转基因动物中,所述核酸可操作连接于促进ARCAP基因在,例如,肝脏中表达的调控元件。本文所用术语“可操作连接”是指调控元件和核酸所处的位置关系,它能使所述核酸被转录。所述调控元件可以是肝特异的启动子,如PEPCK和清蛋白启动子。
本发明的特征还在于适于产生本发明非人转基因动物的表达载体。所述表达载体包括能介导肝脏表达并与上述编码ARCAP蛋白的核酸可操作连接的启动子。
可用本领域已知的各种技术将表达载体导入到非人动物中,以产生非人转基因动物的起始动物。所述技术包括但不限于,原核显微注射(美国专利4,873,191),反转录病毒介导的基因向生殖系(germ line)中转移(Van derPutten et al.,Proc.Natl.Acad.Sci.USA,826148,1985),基因靶向进入胚胎干细胞(Thompson et al.,Cell,56313,1989),胚胎电穿孔(Lo,Mol.Cell.Biol.,31803,1983),和体外体细胞转化及后续的核移植(Wilmut et al.,Nature,385(6619)810-813,1997;and Wakayama et al.,Nature,394369-374,1998)。在一个实施例中,表达载体被显微注射到非人动物的卵或胚胎中,或显微注射到非人动物的胚胎干细胞中。
一旦制备出非人转基因动物,(例如依照Current Protocol(Wiley,USA)和Manuplate the Mouse Embryo(Hogan Beddington and Costantini Lacy,CSHL Press)所述制备出转基因小鼠),就可采用标准技术评估ARCAP基因的表达。用Southern印迹分析或PCR技术进行最初的筛选以确定转基因是否已发生了整合。参见,例如,Sambrook等1989年所著的"Molecular Cloning,A Laboratory Manual"第二版,Cold Spring Harbor Press Plainview;NY,9.37-9.52章节中对Southern分析的描述。编码ARCAP蛋白的核酸在非人转基因动物组织中的表达可利用多种技术来评估,所述技术包括但不限于,对获自所述动物的组织样品进行Northern印迹分析,原位杂交分析和逆转录酶的PCR(RT-PCR)。
本发明的非人转基因动物可用作肝癌模型。这些动物尤其可用于鉴定对肝癌的治疗或预防有效的化合物或组合物。所述化合物或组合物可如下鉴定,即对本发明的非人转基因动物给药待测化合物或组合物,或使待测化合物或组合物与来源于所述非人转基因动物的器官,组织(例如肝脏)或细胞(例如肝细胞)接触。然后评价待测化合物或组合物对非人转基因动物,器官,组织或细胞的肝癌的影响。例如,可评估非人转基因动物中通过临床病理学鉴定的肿瘤的大小。能缓解癌症症状的待测化合物或组合物可有效治疗或预防肝癌。
可将待测化合物配制成药物组合物,方法是将所述化合物与药学上可接受的无毒性赋形剂或载体混合,然后通过任何给药途径将其给药于本发明的非人转基因动物。例如,可采用肠胃外给药途径,如皮下给药,肌肉内给药,血管内给药,皮内给药,鼻内给药,吸入给药,鞘内给药或腹膜内给药,以及肠道途径给药如舌下,口腔或直肠给药。
即使不作进一步的详述,相信本领域技术人员也能够在本文描述的基础上最完整地利用本发明。本文中所引用的出版物在此都以其全部内容纳入本文作参考。
其它实施方案该说明书中公开的所有特征都可以以任何形式组合。本说明书所公开的每一特征都可以由达到相同,等价或类似目的的另一特征代替。因此,除非另有说明,本文所公开的每一特征仅仅是这类等价或类似特征中的一个实例。
从以上说明中,本领域技术人员能非常容易地发现本发明的特征,且能在不脱离本发明精神和范围的情况下,对本发明进行各种变动和修改,以使其适应各种用途和条件。因此,其它的实施方案也包括在以下权利要求的范围内。
序列表<110>行政院退除役官兵辅导委员会台北荣民总医院创盛基因科技股份有限公司<120>表达雄激素受体复合物相关蛋白的转基因动物<130>14321-003001<140>US 10/206,566<141>2002-07-2 5<150>US 09/781,693<151>2001-02-12<150>US 60/262,312<151>2001-01-17<160>3<170>FastSEQ for Windows Version 4.0<210>1<211>3340<212>DNA<213>小鼠(Mus musculus)<220>
<221>CDS<222>(218)...(2905)<400>1gagagtatga ggcgagccgt ggcccgggtg cctctccgct cccggggaga aggcgcggcc 60gtggctgccg ccctctgagt cgcggcgccg gcgaggcccc ggggcgcgcg catggtgctg 120gtgccgctcg ggtgttgatc ggcctgtccc ctccctctct tcccctcccc accccccgcg 180gtggtctccc ctttcccacc ccagcccttg cggagcc atg gct cgg agt ggc tcc 235Met Ala Arg Ser Gly Ser1 5tgc ccg cac ctg ttg tgg gac gtg agg aaa agg tcc ctt ggg ctg gag283Cys Pro His Leu Leu Trp Asp Val Arg Lys Arg Ser Leu Gly Leu Glu
10 15 20gac ccg tcc cgg ctg agg agc cgc tac ctg gga aga aga gaa ttt atc331Asp Pro Ser Arg Leu Arg Ser Arg Tyr Leu Gly Arg Arg Glu Phe Ile25 30 35caa aga tta aaa ctt gaa gca act tta aat gtg cat gat ggc tgt gtt379Gln Arg Leu Lys Leu Glu Ala Thr Leu Asn Val His Asp Gly Cys Val40 45 50aat aca atc tgt tgg aat gac act gga gaa tat att tta tct ggc tct427Asn Thr Ile Cys Trp Asn Asp Thr Gly Glu Tyr Ile Leu Ser Gly Ser55 60 65 70gat gac act aaa ctt gta att agt aat cca tac agc aga aag gtt ttg475Asp Asp Thr Lys Leu Val Ile Ser Asn Pro Tyr Ser Arg Lys Val Leu75 80 85aca acc atc cgt tca ggg cat cga gca aat ata ttt agt gca aag ttt523Thr Thr Ile Arg Ser Gly His Arg Ala Asn Ile Phe Ser Ala Lys Phe90 95 100ttg ccg tgc aca gat gat aag cag att gtg tct tgc tct gga gat gga571Leu Pro Cys Thr Asp Asp Lys Gln Ile Val Ser Cys Ser Gly Asp Gly105 110 115gtc ata ttt tat act aac att gag caa gat gca gaa act aac aga cag619Val Ile Phe Tyr Thr Asn Ile Glu Gln Asp Ala Glu Thr Asn Arg Gln120 125 130tgc caa ttt acg tgc cat tat gga act act tat gag att atg act gta667Cys Gln Phe Thr Cys His Tyr Gly Thr Thr Tyr Glu Ile Met Thr Val135 140 145 150cca aac gac cct tac acc ttt ctg tcc tgt ggt gaa gat gga act gtt715Pro Asn Asp Pro Tyr Thr Phe Leu Ser Cys Gly Glu Asp Gly Thr Val155 160 165agg tgg ttt gac aca cgc atc aaa acc agt tgc aca aaa gaa gac tgt763Arg Trp Phe Asp Thr Arg Ile Lys Thr Ser Cys Thr Lys Glu Asp Cys170 175 180aaa gat gat att tta atc aac tgt agg cgt gct gcc aca tct gtg gct811
Lys Asp Asp Ile Leu Ile Asn Cys Arg Arg Ala Ala Thr Ser Val Ala185 190 195att tgt ccc cca gta cca tat tac ctt gct gtg ggt tgt tct gac agc859Ile Cys Pro Pro Val Pro Tyr Tyr Leu Ala Val Gly Cys Ser Asp Ser200 205 210tca gta cgg att tat gat cgg cga atg ctg ggc aca aga gct aca ggg907Ser Val Arg Ile Tyr Asp Arg Arg Met Leu Gly Thr Arg Ala Thr Gly215 220 225 230aat tat gca ggc cga gga act act gga atg gtt gct cga ttt ata cct955Asn Tyr Ala Gly Arg Gly Thr Thr Gly Met Val Ala Arg Phe Ile Pro235 240 245tct cat ctt agt aac aaa tca tgc aga gtg aca tca ctg tgt tac agt1003Ser His Leu Ser Asn Lys Ser Cys Arg Val Thr Ser Leu Cys Tyr Ser250 255 260gaa gat ggt caa gag att ctt gtc agt tat tct tca gac tac atc tat1051Glu Asp Gly Gln Glu Ile Leu Val Ser Tyr Ser Ser Asp Tyr Ile Tyr265 270 275ctt ttt gac ccc aaa gat gat act gca cga gaa ctt aaa act cct tct1099Leu Phe Asp Pro Lys Asp Asp Thr Ala Arg Glu Leu Lys Thr Pro Ser280 285 290gca gag gag agg cga gaa gag tta cga cag cct cca gtt aag cgc ttg1147Ala Glu Glu Arg Arg Glu Glu Leu Arg Gln Pro Pro Val Lys Arg Leu295 300 305 310aga ctt cgt ggt gat tgg tca gat act ggt ccc aga gca cgg cca gaa1195Arg Leu Arg Gly Asp Trp Ser Asp Thr Gly Pro Arg Ala Arg Pro Glu315 320 325agt gaa cga gaa cga gat gga gag caa agt ccc aat gtg tca ctg atg1243Ser Glu Arg Glu Arg Asp Gly Glu Gln Ser Pro Asn Val Ser Leu Met330 335 340cag aga atg tct gat atg tta tca agg tgg ttt gaa gaa gca agt gaa1291Gln Arg Met Ser Asp Met Leu Ser Arg Trp Phe Glu Glu Ala Ser Glu345 350 355
gtt gca caa agc aac aga gga aga gga aga cct cgg ccc aga ggt gga1339Val Ala Gln Ser Asn Arg Gly Arg Gly Arg Pro Arg Pro Arg Gly Gly360 365 370aca aat cag cca gat gtt tca act ctt cct acg gtt cca tca agt cct1387Thr Asn Gln Pro Asp Val Ser Thr Leu Pro Thr Val Pro Ser Ser Pro375 380 385 390aat ttg gaa gtg tgt gaa act gca atg gat gta gac atg cca gct gca1435Asn Leu Glu Val Cys Glu Thr Ala Met Asp Val Asp Met Pro Ala Ala395 400 405ctt ctt cag cct tct aca tcc tct aca gat cca gtt cag gct cag gca1483Leu Leu Gln Pro Ser Thr Ser Ser Thr Asp Pro Val Gln Ala Gln Ala410 415 420gcc aca gcc gcc ata gaa agc cct cgt tcc agc tcg ttg ctg tct tgc1531Ala Thr Ala Ala Ile Glu Ser Pro Arg Ser Ser Ser Leu Leu Ser Cys425 430 435cca gac agt gaa ccg agg cag tct gtt gag gcg tct gga cac cat gca1579Pro Asp Ser Glu Pro Arg Gln Ser Val Glu Ala Ser Gly His His Ala440 445 450cat cat cag tca gat tct cct tct tct gtg gtt aac aaa cag ctg gga1627His His Gln Ser Asp Ser Pro Ser Ser Val Val Asn Lys Gln Leu Gly455 460 465 470tcc atg tca ctt gat gag caa cag gat aac agt aat gag agg ctg agc1675Ser Met Ser Leu Asp Glu Gln Gln Asp Asn Ser Asn Glu Arg Leu Ser475 480 485ccc aaa cca ggg aca ggt gaa ccc gtt tta agt ttg cac tac agc aca1723Pro Lys Pro Gly Thr Gly Glu Pro Val Leu Ser Leu His Tyr Ser Thr490 495 500gaa gga aca act aca agc aca ata aaa ctg aac ttt aca gat gaa tgg1771Glu Gly Thr Thr Thr Ser Thr Ile Lys Leu Asn Phe Thr Asp Glu Trp505 510 515agc agt aca gcc tca agt tcc aga gga aat ggg agc cat tgc aaa tct1819Ser Ser Thr Ala Ser Ser Ser Arg Gly Asn Gly Ser His Cys Lys Ser520 525 530
gag ggt cag gaa gaa tgc ttg gtc cct ccg agc tct gtg cag cca ccg1867Glu Gly Gln Glu Glu Cys Leu Val Pro Pro Ser Ser Val Gln Pro Pro535 540 545 550gaa gga gac agt gaa aca aga gct cct gaa gaa cta tca gag aaa gga1915Glu Gly Asp Ser Glu Thr Arg Ala Pro Glu Glu Leu Ser Glu Lys Gly555 560 565aca ctt cca gaa aac ctc act caa aac cag ata gat aca gca caa ctt1963Thr Leu Pro Glu Asn Leu Thr Gln Asn Gln Ile Asp Thr Ala Gln Leu570 575 580gat aac ttc cca gct gag cca ttg gat tct aac tca gga gag aag aat2011Asp Asn Phe Pro Ala Glu Pro Leu Asp Ser Asn Ser Gly Glu Lys Asn585 590 595aac cca agt cag gac agc cct tgt ggg ctt cca gaa gaa ggc act ttg2059Asn Pro Ser Gln Asp Ser Pro Cys Gly Leu Pro Glu Glu Gly Thr Leu600 605 610tct gaa aca gac agg gag act tgt gag cag gcc agc act gag agt gct2107Ser Glu Thr Asp Arg Glu Thr Cys Glu Gln Ala Ser Thr Glu Ser Ala615 620 625 630acc agg cat gct agc acc aag cct gaa ctc cca tcc cag aca gaa gcc2155Thr Arg His Ala Ser Thr Lys Pro Glu Leu Pro Ser Gln Thr Glu Ala635 640 645att gag cag gcc agc act gag agt gct acc agg cat acc agt gcc aat2203Ile Glu Gln Ala Ser Thr Glu Ser Ala Thr Arg His Thr Ser Ala Asn650 655 660cct gaa ctc cca tcc cag aca gaa gcc ata gca cct tta gct cat gaa2251Pro Glu Leu Pro Ser Gln Thr Glu Ala Ile Ala Pro Leu Ala His Glu665 670 675gac cca tct gcc agg gac tct gct ctc cag gac aca gat gac agc gat2299Asp Pro Ser Ala Arg Asp Ser Ala Leu Gln Asp Thr Asp Asp Ser Asp680 685 690gat gat ccg gtc ttg atc cct ggt gca aga tac cga aca gga cct ggt2347Asp Asp Pro Val Leu Ile Pro Gly Ala Arg Tyr Arg Thr Gly Pro Gly
695 700 705 710gat aga cgc tcc gct gtt gcc cgc att cag gag ttc ttc agg agg aga2395Asp Arg Arg Ser Ala Val Ala Arg Ile Gln Glu Phe Phe Arg Arg Arg715 720 725aaa gaa agg aaa gaa atg gaa gag ctg gat act ttg aac att agg agg2443Lys Glu Arg Lys Glu Met Glu Glu Leu Asp Thr Leu Asn Ile Arg Arg730 735 740cca cta gta aag atg gtt tat aag ggc cac cgc aac tcc cgg aca atg2491Pro Leu Val Lys Met Val Tyr Lys Gly His Arg Asn Ser Arg Thr Met745 750 755ata aaa gaa gcc aat ttc tgg ggt gct aac ttt gta atg agc ggt tcc2539Ile Lys Glu Ala Asn Phe Trp Gly Ala Asn Phe Val Met Ser Gly Ser760 765 770gat tgt ggc cat atc ttc atc tgg gac cgg cac act gcg gag cat ttg2587Asp Cys Gly His Ile Phe Ile Trp Asp Arg His Thr Ala Glu His Leu775 780 785 790atg ctt ctg gaa gct gat aat cat gtg gtc aac tgc ctg cag ccc cat2635Met Leu Leu Glu Ala Asp Asn His Val Val Asn Cys Leu Gln Pro His795 800 805ccg ttt gac cca att cta gcc tca tct ggc ata gat tat gac ata aag2683Pro Phe Asp Pro Ile Leu Ala Ser Ser Gly Ile Asp Tyr Asp Ile Lys810 815 820atc tgg tcg cca cta gaa gag tca aga att ttt aat cga aaa ctt gct2731Ile Trp Ser Pro Leu Glu Glu Ser Arg Ile Phe Asn Arg Lys Leu Ala825 830 835gat gaa gtt ata act cgg aat gaa ctc acg ctg gaa gag act cgg aac2779Asp Glu Val Ile Thr Arg Asn Glu Leu Thr Leu Glu Glu Thr Arg Asn840 845 850acc atc acc gtc cca gcc tct ttc atg ttg agg atg ttg gcg tca ctg2827Thr Ile Thr Val Pro Ala Ser Phe Met Leu Arg Met Leu Ala Ser Leu855 860 865 870aat cat atc cga gct gac cgt ctg gag ggt gac aga tca gaa ggt tca2875
Asn His Ile Arg Ala Asp Arg Leu Glu Gly Asp Arg Ser Glu Gly Ser875 880 885ggt cag gag aat gaa aat gag gat gaa gaa taaagaactc cttggcaagc2925Gly Gln Glu Asn Glu Asn Glu Asp Glu Glu890 895acttagatgt tctgagattt gtatacgaca tttattatat tttttttctt tacagaactt2985tagtgcaatt taaggctatg ggtttttttt tttctttttt tttggagttc ttccctattt3045tggggataac caaacattgg tttggaatga gtgtgtgcat gagttgggag agtgtgtaaa3105acaaagtaag caaaatgttt tttgaaacct tttgccgtgt atggagtccc aaaaaaaaaa3165aaaaaaaaaa aaaaaagcaa agtgcaatac ttcctgaccc tccgctgtgg gagcttggat3225caatgctgaa gtcattttca ttgtagtgaa aacgttggtt caaataaatt tctacacttg3285ccatttgcaa aaaaaaaaaa aaaaaaaaaa aaaaaaagcg gccgctgaat tctag 3340<210>2<211>2688<212>DNA<213>小鼠(Mus musculus)<400>2atggctcgga gtggctcctg cccgcacctg ttgtgggacg tgaggaaaag gtcccttggg60ctggaggacc cgtcccggct gaggagccgc tacctgggaa gaagagaatt tatccaaaga120ttaaaacttg aagcaacttt aaatgtgcat gatggctgtg ttaatacaat ctgttggaat180gacactggag aatatatttt atctggctct gatgacacta aacttgtaat tagtaatcca240tacagcagaa aggttttgac aaccatccgt tcagggcatc gagcaaatat atttagtgca300aagtttttgc cgtgcacaga tgataagcag attgtgtctt gctctggaga tggagtcata360ttttatacta acattgagca agatgcagaa actaacagac agtgccaatt tacgtgccat420tatggaacta cttatgagat tatgactgta ccaaacgacc cttacacctt tctgtcctgt480ggtgaagatg gaactgttag gtggtttgac acacgcatca aaaccagttg cacaaaagaa540gactgtaaag atgatatttt aatcaactgt aggcgtgctg ccacatctgt ggctatttgt600cccccagtac catattacct tgctgtgggt tgttctgaca gctcagtacg gatttatgat660cggcgaatgc tgggcacaag agctacaggg aattatgcag gccgaggaac tactggaatg720gttgctcgat ttataccttc tcatcttagt aacaaatcat gcagagtgac atcactgtgt780tacagtgaag atggtcaaga gattcttgtc agttattctt cagactacat ctatcttttt840gaccccaaag atgatactgc acgagaactt aaaactcctt ctgcagagga gaggcgagaa900gagttacgac agcctccagt taagcgcttg agacttcgtg gtgattggtc agatactggt960cccagagcac ggccagaaag tgaacgagaa cgagatggag agcaaagtcc caatgtgtca1020ctgatgcaga gaatgtctga tatgttatca aggtggtttg aagaagcaag tgaagttgca1080caaagcaaca gaggaagagg aagacctcgg cccagaggtg gaacaaatca gccagatgtt1140tcaactcttc ctacggttcc atcaagtcct aatttggaag tgtgtgaaac tgcaatggat1200gtagacatgc cagctgcact tcttcagcct tctacatcct ctacagatcc agttcaggct1260caggcagcca cagccgccat agaaagccct cgttccagct cgttgctgtc ttgcccagac1320
agtgaaccga ggcagtctgt tgaggcgtct ggacaccatg cacatcatca gtcagattct1380ccttcttctg tggttaacaa acagctggga tccatgtcac ttgatgagca acaggataac1440agtaatgaga ggctgagccc caaaccaggg acaggtgaac ccgttttaag tttgcactac1500agcacagaag gaacaactac aagcacaata aaactgaact ttacagatga atggagcagt1560acagcctcaa gttccagagg aaatgggagc cattgcaaat ctgagggtca ggaagaatgc1620ttggtccctc cgagctctgt gcagccaccg gaaggagaca gtgaaacaag agctcctgaa1680gaactatcag agaaaggaac acttccagaa aacctcactc aaaaccagat agatacagca1740caacttgata acttcccagc tgagccattg gattctaact caggagagaa gaataaccca1800agtcaggaca gcccttgtgg gcttccagaa gaaggcactt tgtctgaaac agacagggag1860acttgtgagc aggccagcac tgagagtgct accaggcatg ctagcaccaa gcctgaactc1920ceatcccaga cagaagccat tgagcaggcc agcactgaga gtgctaccag gcataccagt1980gccaatcctg aactcccatc ccagacagaa gccatagcac ctttagctca tgaagaccea2040tctgccaggg actctgctct ccaggacaca gatgacagcg atgatgatcc ggtcttgatc2100cctggtgcaa gataccgaac aggacctggt gatagacgct ccgctgttgc ccgcattcag2160gagttcttca ggaggagaaa agaaaggaaa gaaatggaag agctggatac tttgaacatt2220aggaggccac tagtaaagat ggtttataag ggccaccgca actcccggac aatgataaaa2280gaagccaatt tctggggtgc taactttgta atgagcggtt ccgattgtgg ccatatcttc2340atctgggacc ggcacactgc ggagcatttg atgcttctgg aagctgataa tcatgtggtc2400aactgcctgc agccccatcc gtttgaccca attctagcct catctggcat agattatgac2460ataaagatct ggtcgccact agaagagtca agaattttta atcgaaaact tgctgatgaa2520gttataactc ggaatgaact cacgctggaa gagactcgga acaccatcac cgtcccagcc2580tctttcatgt tgaggatgtt ggcgtcactg aatcatatcc gagctgaccg tctggagggt2640gacagatcag aaggttcagg tcaggagaat gaaaatgagg atgaagaa 2688<210>3<211>896<212>PRT<213>小鼠(Mus musculus)<400>3Met Ala Arg Ser Gly Ser Cys Pro His Leu Leu Trp Asp Val Arg Lys1 5 10 15Arg Ser Leu Gly Leu Glu Asp Pro Ser Arg Leu Arg Ser Arg Tyr Leu20 25 30Gly Arg Arg Glu Phe Ile Gln Arg Leu Lys Leu Glu Ala Thr Leu Asn35 40 45Val His Asp Gly Cys Val Asn Thr Ile Cys Trp Asn Asp Thr Gly Glu50 55 60Tyr Ile Leu Ser Gly Ser Asp Asp Thr Lys Leu Val Ile Ser Asn Pro65 70 75 80Tyr Ser Arg Lys Val Leu Thr Thr Ile Arg Ser Gly His Arg Ala Asn85 90 95Ile Phe Ser Ala Lys Phe Leu Pro Cys Thr Asp Asp Lys Gln Ile Val
100 105 110Ser Cys Ser Gly Asp Gly Val Ile Phe Tyr Thr Asn Ile Glu Gln Asp115 120 125Ala Glu Thr Asn Arg Gln Cys Gln Phe Thr Cys His Tyr Gly Thr Thr130 135 140Tyr Glu Ile Met Thr Val Pro Asn Asp Pro Tyr Thr Phe Leu Ser Cys145 150 155 160Gly Glu Asp Gly Thr Val Arg Trp Phe Asp Thr Arg Ile Lys Thr Ser165 170 175Cys Thr Lys Glu Asp Cys Lys Asp Asp Ile Leu Ile Asn Cys Arg Arg180 185 190Ala Ala Thr Ser Val Ala Ile Cys Pro Pro Val Pro Tyr Tyr Leu Ala195 200 205Val Gly Cys Ser Asp Ser Ser Val Arg Ile Tyr Asp Arg Arg Met Leu210 215 220Gly Thr Arg Ala Thr Gly Asn Tyr Ala Gly Arg Gly Thr Thr Gly Met225 230 235 240Val Ala Arg Phe Ile Pro Ser His Leu Ser Asn Lys Ser Cys Arg Val245 250 255Thr Ser Leu Cys Tyr Ser Glu Asp Gly Gln Glu Ile Leu Val Ser Tyr260 265 270Ser Ser Asp Tyr Ile Tyr Leu Phe Asp Pro Lys Asp Asp Thr Ala Arg275 280 285Glu Leu Lys Thr Pro Ser Ala Glu Glu Arg Arg Glu Glu Leu Arg Gln290 295 300Pro Pro Val Lys Arg Leu Arg Leu Arg Gly Asp Trp Ser Asp Thr Gly305 310 315 320Pro Arg Ala Arg Pro Glu Ser Glu Arg Glu Arg Asp Gly Glu Gln Ser325 330 335Pro Asn Val Ser Leu Met Gln Arg Met Ser Asp Met Leu Ser Arg Trp340 345 350Phe Glu Glu Ala Ser Glu Val Ala Gln Ser Asn Arg Gly Arg Gly Arg355 360 365Pro Arg Pro Arg Gly Gly Thr Asn Gln Pro Asp Val Ser Thr Leu Pro370 375 380Thr Val Pro Ser Ser Pro Asn Leu Glu Val Cys Glu Thr Ala Met Asp385 390 395 400Val Asp Met Pro Ala Ala Leu Leu Gln Pro Ser Thr Ser Ser Thr Asp405 410 415Pro Val Gln Ala Gln Ala Ala Thr Ala Ala Ile Glu Ser Pro Arg Ser420 425 430Ser Ser Leu Leu Ser Cys Pro Asp Ser Glu Pro Arg Gln Ser Val Glu435 440 445
Ala Ser Gly His His Ala His His Gln Ser Asp Ser Pro Ser Ser Val450 455 460Val Asn Lys Gln Leu Gly Ser Met Ser Leu Asp Glu Gln Gln Asp Asn465 470 475 480Ser Asn Glu Arg Leu Ser Pro Lys Pro Gly Thr Gly Glu Pro Val Leu485 490 495Ser Leu His Tyr Ser Thr Glu Gly Thr Thr Thr Ser Thr Ile Lys Leu500 505 510Asn Phe Thr Asp Glu Trp Ser Ser Thr Ala Ser Ser Ser Arg Gly Asn515 520 525Gly Ser His Cys Lys Ser Glu Gly Gln Glu Glu Cys Leu Val Pro Pro530 535 540Ser Ser Val Gln Pro Pro Glu Gly Asp Ser Glu Thr Arg Ala Pro Glu545 550 555 560Glu Leu Ser Glu Lys Gly Thr Leu Pro Glu Asn Leu Thr Gln Asn Gln565 570 575Ile Asp Thr Ala Gln Leu Asp Asn Phe Pro Ala Glu Pro Leu Asp Ser580 585 590Asn Ser Gly Glu Lys Asn Asn Pro Ser Gln Asp Ser Pro Cys Gly Leu595 600 605Pro Glu Glu Gly Thr Leu Ser Glu Thr Asp Arg Glu Thr Cys Glu Gln610 615 620Ala Ser Thr Glu Ser Ala Thr Arg His Ala Ser Thr Lys Pro Glu Leu625 630 635 640Pro Ser Gln Thr Glu Ala Ile Glu Gln Ala Ser Thr Glu Ser Ala Thr645 650 655Arg His Thr Ser Ala Asn Pro Glu Leu Pro Ser GlnThr Glu Ala Ile660 665670Ala Pro Leu Ala His Glu Asp Pro Ser Ala Arg Asp Ser Ala Leu Gln675 680 685Asp Thr Asp Asp Ser Asp Asp Asp Pro Val Leu Ile Pro Gly Ala Arg690 695 700Tyr Arg Thr Gly Pro Gly Asp Arg Arg Ser Ala Val Ala Arg Ile Gln705 710 715 720Glu Phe Phe Arg Arg Arg Lys Glu Arg Lys Glu Met Glu Glu Leu Asp725 730 735Thr Leu Asn Ile Arg Arg Pro Leu Val Lys Met Val Tyr Lys Gly His740 745 750Arg Asn Ser Arg Thr Met Ile Lys Glu Ala Asn Phe Trp Gly Ala Asn755 760 765Phe Val Met Ser Gly Ser Asp Cys Gly His Ile Phe Ile Trp Asp Arg770 775 780His Thr Ala Glu His Leu Met Leu Leu Glu Ala Asp Asn His Val Val
785 790 795 800Asn Cys Leu Gln Pro His Pro Phe Asp Pro Ile Leu Ala Ser Ser Gly805 810 815Ile Asp Tyr Asp Ile Lys Ile Trp Ser Pro Leu Glu Glu Ser Arg Ile820 825 830Phe Asn Arg Lys Leu Ala Asp Glu Val Ile Thr Arg Asn Glu Leu Thr835 840 845Leu Glu Glu Thr Arg Asn Thr Ile Thr Val Pro Ala Ser Phe Met Leu850 855 860Arg Met Leu Ala Ser Leu Asn His Ile Arg Ala Asp Arg Leu Glu Gly865 870 875 880Asp Arg Ser Glu Gly Ser Gly Gln Glu Asn Glu Asn Glu Asp Glu Glu885 890 89权利要求
1.一种基本纯的多肽,其包含与SEQ ID NO3至少70%相同的氨基酸序列,其中所述多肽与雄激素受体结合并增强雄激素受体反式激活雄激素应答基因的能力。
2.权利要求1的多肽,其中所述氨基酸序列与SEQ ID NO3至少80%相同。
3.权利要求2的多肽,其中所述氨基酸序列与SEQ ID NO3至少90%相同。
4.权利要求3的多肽,其中所述氨基酸序列与SEQ ID NO3至少95%相同。
5.权利要求4的多肽,其中所述氨基酸序列是SEQ ID NO3。
6.一种基本纯的多肽,其包含具有多至30个保守氨基酸取代的SEQ ID NO3的氨基酸序列,该多肽能与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。
7.一种基本纯的由在严谨条件下与具有SEQ ID NO2所示序列的探针杂交的核酸编码的多肽,其中所述多肽能与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。
8.一种分离的核酸,其编码权利要求1的多肽。
9.权利要求8的核酸,其中所述氨基酸序列是SEQ ID NO3。
10.编码权利要求6的多肽的分离的核酸。
11.一种分离的核酸,其包含在严谨条件下能与单链探针杂交的链,该探针的序列为SEQ ID NO2所示序列或SEQ ID NO2序列的互补体。
12.权利要求11的核酸,其中所述核酸编码多肽,该多肽能与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。
13.权利要求12的核酸,其中所述多肽的氨基酸序列包括SEQ IDNO3。
14.权利要求11的核酸,其中所述链的长度至少是15个核苷酸。
15.包含权利要求8的核酸的载体。
16.权利要求15的载体,其中所述氨基酸序列是SEQ ID NO3。
17.包含权利要求10的核酸的载体。
18.包含权利要求11的核酸的载体。
19.权利要求18的载体,其中所述核酸编码多肽,该多肽能与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。
20.包含权利要求8的核酸的细胞。
21.权利要求20的细胞,其中所述氨基酸序列是SEQ ID NO3。
22.包含权利要求10的核酸的细胞。
23.包含权利要求11的核酸的细胞。
24.权利要求23的细胞,其中所述核酸编码多肽,该多肽能与雄激素受体结合,并增强雄激素受体反式激活雄激素应答基因的能力。
25.一种在其基因组中包含转基因的转基因动物,所述转基因包含权利要求8的核酸,该转基因动物与野生型动物相比对雄激素的应答增强。
26.权利要求25的转基因动物,其中所述动物是啮齿类动物。
27.权利要求26的转基因动物,其中所述动物是小鼠。
28.权利要求25的转基因动物,其中所述氨基酸序列是SEQ IDNO3。
29.权利要求28的转基因动物,其中所述动物是啮齿类动物。
30.权利要求29的转基因动物,其中所述动物是小鼠。
31.一种在其基因组中包含转基因的转基因动物,所述转基因包含权利要求10的核酸,该转基因动物与野生型动物相比对雄激素的应答增强。
32.权利要求31的转基因动物,其中所述动物是啮齿类动物。
33.权利要求32的转基因动物,其中所述动物是小鼠。
34.一种在其基因组中包含转基因的转基因动物,所述转基因包含权利要求11的核酸,该转基因动物与野生型动物相比对雄激素的应答增强。
35.权利要求34的转基因动物,其中所述动物是啮齿类动物。
36.权利要求35的转基因动物,其中所述动物是小鼠。
37.一种制备多肽的方法,其包括培养权利要求20的细胞,在该细胞中表达所述多肽,和从培养物中分离这种多肽。
38.一种制备转录物的方法,包括将权利要求11的核酸导入到细胞中,从该核酸制备转录物。
39.一种分离的抗体,其能与包含SEQ ID NO3所示氨基酸序列的多肽结合。
40.一种确定动物样品中是否包含癌细胞的方法,该方法包括提供来自动物的样品,和检测样品中雄激素受体复合物相关蛋白的基因的表达水平,样品中雄激素受体复合物相关蛋白基因的表达水平高于正常样品中的水平时,指示该动物样品中包含癌细胞。
41.权利要求40的方法,其中所述样品是血样品。
42.权利要求40的方法,其中所述癌细胞是肝癌细胞。
43.权利要求40的方法,其中所述动物是啮齿类动物。
44.权利要求43的方法,其中所述动物是小鼠。
45.一种治疗动物癌症的方法,其包括鉴定含有癌细胞的动物,所述癌细胞表达雄激素受体复合物相关蛋白基因,以及用能阻断雄激素受体复合物相关蛋白与雄激素受体的结合的组合物或能减弱雄激素受体反式激活雄激素应答基因的能力的组合物治疗所述动物。
46.权利要求45的方法,其中所述组合物包含权利要求39的抗体。
47.权利要求45的方法,其中所述组合物包含权利要求11的核酸。
48.权利要求45的方法,其中所述癌症是肝癌。
49.权利要求45的方法,其中所述动物是啮齿类动物。
50.权利要求49的方法,其中所述动物是小鼠。
全文摘要
本发明涉及表达雄激素受体复合物相关蛋白基因的转基因动物。这些动物可以作为开发治疗癌症,例如肝癌的药物的动物模型。
文档编号C12N15/12GK1495195SQ0314361
公开日2004年5月12日 申请日期2003年7月25日 优先权日2002年7月25日
发明者张泰階, 张泰 申请人:台北荣民总医院, 创盛基因科技股份有限公司