专利名称:一种卵巢癌相关基因及其编码的蛋白质的制作方法
技术领域:
本发明涉及一种与癌症相关的基因及其编码的蛋白质,特别是涉及一种与卵巢癌相关的基因及其编码的蛋白质。
据估计在人类基因组中大约有5000个潜在的药物靶点,迄今为止成功应用于药物开发的人类药物靶标约有500种,仅占潜在药物靶点的十分之一,因此该领域具有巨大的开发潜力。重要疾病相关基因的研究和成功开发将有助于这一巨大潜在市场的开发和利用。
一种与卵巢癌相关的基因,它是下列核苷酸序列之一1)序列表中序列1的DNA序列;2)与序列表中序列1限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列。
所述与卵巢癌相关基因的完整开放读码框为序列表中序列1的第236至949共714个碱基。
一种与卵巢癌相关的蛋白质,它具有序列表中序列2的氨基酸序列或将序列2的氨基酸序列经过一个或几个氨基酸残基的取代、缺失或添加且具有与序列2的氨基酸序列相同活性的由序列2衍生的蛋白质。
利用NCBI的Genbank数据库对本发明基因进行检索,结果表明数据库中没有基因与此基因序列完全相同。进一步利用STS数据库对所获得的基因序列进行比较分析,结果表明本发明基因中含有一个编号为WI-13139的STS,应用GDB的数据库进行进一步的检索,结果表明,本发明基因应定位于9号染色体的长臂2区2带1至3亚带(9q22.1-22.3)。
由于本发明所提供的基因在包括卵巢在内的人体正常组织中均无表达,而在上皮性的卵巢癌组织中表达阳性率高达53%,因此本发明的基因及其编码的蛋白质有望为临床卵巢癌的诊断和治疗提供有意义的生物学指标,并为抗肿瘤药物的设计提供新的作用靶点和新思路,将会带来巨大的社会效益及经济效益,而且,对于基因不同研究阶段所开发的不同产品,包括新抗体、生物芯片的靶基因、筛选出的新药等,也将促进形成新兴的人类基因产业。
图2为本发明基因在正常卵巢组织中的原位杂交结果。
图3为本发明基因在卵巢癌组织中的原位杂交结果。
图4为本发明基因在卵巢癌细胞OVC3中的原位杂交结果。
图5为本发明基因在胚胎发育组织中的反转录结果。
实施例2、Northern Blot鉴定随机引物方法用地高辛标记所得基因(DIG DNA Labeling and Detection Kit,Boehringer Mannheim公司,德国),与来源于OVC3的总RNA进行Northern Blot杂交,杂交结果如
图1所示,从图中可以看出在4300个碱基对左右处具有一条明显的谱带。
实施例3、用原位杂交方法检测本发明基因在人体卵巢组织中的表达利用原位杂交法检测本发明的基因在正常人体卵巢组织中的表达,结果如图2所示,从图中可以看出,本发明的基因在正常人体卵巢组织中没有表达。
实施例4、用原位杂交方法检测本发明基因在肿瘤组织中的表达利用原位杂交法检测本发明基因在肿瘤组织中的表达,实验结果表明,本发明基因在子宫癌、胃癌、肾癌、肾上腺癌、脑癌、肝癌、肠癌组织中均无表达,但在上皮性的卵巢癌组织中表达阳性率高达53%(76/144),图3、图4显示出,本发明基因在卵巢癌组织及卵巢癌细胞OVC3中明显扩增,呈显著的阳性反应。
实施例5、用反转录-PCR检测本发明基因在胚胎发育中的表达用反转录-PCR方法检测人14周胎龄组织和人32周胎龄组织中本发明基因的表达,以β-肌动蛋白(β-actin1)为对照,检测结果如图5所示,其中A1组为14周胎龄组织中本发明基因的表达;B1组为14周胎龄组织中β-actin1的表达;A2组为32周胎龄组织中本发明基因的表达;B2组为32周胎龄组织中β-actin1的表达;1为卵巢癌细胞系OVC3;2为卵巢;3为胃;4为子宫;5为脾;6为胸腺;7为肾;8为肾上腺;9为脑;10为肝;11为小肠;从图中的结果可以看出,本发明基因在14周胎龄早期胚胎的卵巢组织和肾上腺组织中有表达,但是随着胚胎发育的成熟,本发明基因的表达消失。因此说明本发明基因应该是胚胎早期表达基因家族的成员。
序列表<160>2<210>1<211>4375<212>DNA<213>人属人种(Homo sapiens)<400>1agagtgcttg tgatttcacg tatttttgct gaactcgtaa aagagacact 50tggatggtgg attaaccaga acactaacat tctgtgaaaa gtttcaaatt 100ggagaatatt gaattttcac cctagtccag cagctccgct gctcacttaa 150atacagatga atgaagaccc cattcggaaa gacacctggc cagcggtcca 200gagctgatgc aggccatgct ggagtatctg ccaacatgat gaaaaagagg 250acgtcccaca agaagcatcg gagcagtgtg ggtccgagca aacctgtttc 300ccagccccgg cggaacatcg taggctgcag gattcagcat gggtggaaag 350aggggaatgg ccctgttacc cagtggaaag gaaccgttct ggaccaggtg 400cctgtaaatc cttctttgta tcttataaaa tacgatggat ttgactgtgt 450ttatggacta gaacttaata aagatgaaag agtttctgcg cttgaagtcc 500tccctgatag agttgcgaca tctcgaatca gcgatgcaca cttggcagac 550acaatgattg gcaaagcagt ggaacatatg tttgagacag aggatggttc 600taaagatgag tggaggggaa tggtcttagc acgtgcacct gtcatgaaca 650catggtttta cattacctat gagaaagacc ctgtcttgta catgtaccaa 700ctcttagatg attacaaaga aggcgacctt cgcattatgc ctgattccaa 750tgattcacct ccagcagaaa gggaaccagg agaagttgtg gacagcctgg 800taggcaaaca agtggaatat gccaaagaag atggctcgaa aaggactggc 850atggtcattc atcaagtaga agccaagccc tccgtctatt tcatcaagtt 900tgatgatgat ttccatattt atgtctacga tttggtgaaa acatcctaga 950tgtcatcaca aactctgcca aatttgtgga actatgaaat gtattatttg 1000tagacataaa gacttgattg ctttccagtt taatgaaagc ttaaatgtcc 1050ctgcgaaccc acaatctctg ccagcagaac tggttttgtt ctgaatagta 1100cagattgatg tgaacacaaa gcattttgtg taaggagaac ccctttcttt 1150taaaagaagt ctgtctattt cgaggggagt tacaggcaag tttggtaaaa 1200gttaagctag tatcatagtc atttaaaatt gtaatagatc ttaaccattt 1250tccccctcac cctaactctc ttattctgcc gccacaatgc aagcatagtt 1300tgatgttttc gttattgcct tttttgagat gtatgtatct gtatctacct 1350atatctatat gtgtgtatac atatataata tatacacaca gatacaagtg 1400tacacacaca caccacacac cacacacacc ccactggcag tctttgtgga 1450ttaggatggg ggtgacataa ttttcttgag tttaacagga gtgctttacc 1500caagtcagtc atggatatga tatcactgct ctttatttaa aagtaaactt 1550tgggcacagg aaccatatgg gaacattcag cttgtttaaa aaaaaaaaat 1600cagaagttca gagcaccttt tcaatctgga gcccttaaac cataagtcca 1650aatatgaatt atttgtgaac agttaatgac ccatattaga attttacaat 1700ctggtgaaca atctgggtaa aaggctacct ttaattctaa gcttcatttt 1750tttttggggg ggggttacat tttaatcata aattcttttt tgcaaagccc 1800aggttcttgt tccacacagt gtaatgtagg tgtattttgg acagcacata 1850tggtccattg tgtacaagtc agtaatctgg atttcagtac atggatttaa 1900aaggcaacaa tccatcactg gtttgtgtgt ttttggttaa gtttctggaa 1950gaatacaatg cttttatatt ggaagtataa gttttgagtg gcattgttgc 2000cttctaacaa gctctctggg acttttaaag ttttattact attattgcta 2050atgtatgatt atggtcagag actttcaacc caccccttcc tgcctacccc 2100tggcttttcc tcacaaagaa tgtctagaca aacagcagct tagtctcctg 2150acacctcttg tggggtgcat gttcctgctc caggtatgct gttcatgtgg 2200attcattcca ttcagtggcc ccttggggtt tgcatgccag tgaagcgtta 2250ccatagaaga gccagccgtt tgtgttcgct tggtaggtgt aagtaatagc 2300agcccttagc cacggagtct ttatgtggtt tattcctgca aggttgtttt 2350aaactgaaat agaactgcta gtgtgattgg ttgatcagca aaacagctgc 2400tctcattttg ttttggagga accctggtgg tttgacagcc aggagaaagg 2450ccatatgtga aaccagtctc ttgtggagat tggaaatcct ccctgatatt 2500tgggcagagc ctaaacgtgc atgcttgtca ctcaaacacc agaagtttga 2550atcagaggtc tgagtgacct cttttgtggc tgttcttgat ggtttccagg 2600cctcgttatg catggtttgc ttgatgccca ttttttgtgc cttgtgctgt 2650tggatggtaa cgaccactca ccatgtaaac acagtacctc agttttctgt 2700ccacagctgc agtcgctctg tccctcgtgc ttcactgtgg gcagccaggg 2750acaagcttct gaaagcagtg tgatacccaa gtcataggtg cttctcgtat 2800gtgaacaggt gtcattctac agatctgtta tgtgttttcc tgttgactct 2850taagagtccc tgcatgtaaa tctcaaagct gagcctggct cccagagtcc 2900agactgacat tacagcgcaa gagtttgcaa gtgtgtccag catgcaccaa 2950ctgtgcagaa cttggctcgg taactttgcg tggaaaaata aagtacattt 3000tgaagtatct tgagggttgg gtcaattgag acatttctag cattacttaa 3050tgacttgcat tgtggttttt ctgcaagcaa ctttaatgac tttttttata 3100ccacatggtc tcccagtttc tagatgaatg caacatgatg atggtgatga 3150tgacgatgag tttaatcatt gttcatttat tgcctttagg gctgagggaa 3200agggaaggtt tgtttttttt tctccccatt ttcccccatt ctgtctttct 3250tttggtgact tacaccacat gtaatgacgc tatgactaat tctgctccca 3300agcccttgta tcttgggctt cattttaggc tcatgtgtca gatctgcatg 3350cattgcttgc atttttctgg tatctgaatg ttggttcctt gttccaggaa 3400ttcaacatta atttccaaaa gtatcatggg acttgtgaca atacaagaca 3450tgaatctatg tataaaattt atcggccttt ctcatttacc tgctctagta 3500ttattgtatt gtgtgtgcgt gcgtgtgtga tgtcaggctg ccacgtaaaa 3550cttcagagaa aaatcttaaa agcagaccat ccttttttgc atgctctatt 3600ctaagtagaa tgttcaatgt aactgactaa aattgcatgt taaagatatt 3650taggtttttt tgttttcttt atttttattt gttttcagtt tcctgtatat 3700ttgcttactg tgccgtttta gtggttttag gataaaaatg cactggtgaa 3750gcaaatgtag tgccaacaga aggtgatttt ccagttgtaa atgtcatgca 3800gcatttgaag ggactgtgtt ttcttaaaaa aaaatcacag ttacttctaa 3850accagatttc atttctttta ttgttttatg tgccaaacca cgaagtgcat 3900tgggcttcaa tctctgaaca ctgtagaccc attagaagac tgttccgatt 3950gttacaaatt gtagtgcctg aaaacactct taagctgatt gtcttaacaa 4000aatgaaagtt ctccaaagac aaaacagaac aattattata acaaaataat 4050tatggttgaa atgtctgtgg ttccttggaa atgctgcgct ctttgtgttt 4100ttccatcatt agtgcagttg gaatgaatgt gtataggtca gaggtcttcg 4150tgttcacatt ttaaaattag gtaaatgacc tcatctttca agcttgaatt 4200catttttaat tttaatttta ttttatacaa tgtgtagaca gttccctgtt 4250ctctgcattt agaagtatac acaatataaa tctgttaatt ctgtaagtaa 4300tttttataat tatgatgtaa ctctatctta tccttaaaac atttaaaata 4350aaccctttat gtgcaaaaaa aaaaa 4375<210>2<211>237<212>PRT<213>人属人种(Homo sapiens)<400>2Met Met Lys Lys Arg Thr Ser His Lys Lys His Arg Ser Ser Val1 5 10 15Gly Pro Ser Lys Pro Val Ser Gln Pro Arg Arg Asn Ile Val Gly20 25 30Cys Arg Ile Gln His Gly Trp Lys Glu Gly Asn Gly Pro Val Thr35 40 45Gln Trp Lys Gly Thr Val Leu Asp Gln Val Pro Val Asn Pro Ser50 55 60Leu Tyr Leu Ile Lys Tyr Asp Gly Phe Asp Cys Val Tyr Gly Leu65 70 75Glu Leu Asn Lys Asp Glu Arg Val Ser Ala Leu Glu Val Leu Pro80 85 90Asp Arg Val Ala Thr Ser Arg Ile Ser Asp Ala His Leu Ala Asp95 100 105Thr Met Ile Gly Lys Ala Val Glu His Met Phe Glu Thr Glu Asp110 115 120Gly Ser Lys Asp Glu Trp Arg Gly Met Val Leu Ala Arg Ala Pro125 130 135Val Met Asn Thr Trp Phe Tyr Ile Thr Tyr Glu Lys Asp Pro Val140 145 150Leu Tyr Met Tyr Gln Leu Leu Asp Asp Tyr Lys Glu Gly Asp Leu
155 160 165Arg Ile Met Pro Asp Ser Asn Asp Ser Pro Pro Ala Glu Arg Glu170 175 180Pro Gly Glu Val Val Asp Ser Leu Val Gly Lys Gln Val Glu Tyr185 190 195Ala Lys Glu Asp Gly Ser Lys Arg Thr Gly Met Val Ile His Gln200 205 210Val Glu Ala Lys Pro Ser Val Tyr Phe Ile Lys Phe Asp Asp Asp215 220 225Phe His Ile Tyr Val Tyr Asp Leu Val Lys Thr Ser230 235 23权利要求
1.一种与卵巢癌相关的基因,它是下列核苷酸序列之一1)序列表中序列1的DNA序列;2)与序列表中序列1限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列。
2.根据权利要求1所述的基因,其特征在于所述与卵巢癌相关的基因是序列表中序列1的DNA序列。
3.根据权利要求1或2所述的基因,其特征在于所述与卵巢癌相关基因的完整开放读码框为序列表中序列1的第236至949共714个碱基。
4.一种与卵巢癌相关的蛋白质,它具有序列表中序列2的氨基酸序列或将序列2的氨基酸序列经过一个或几个氨基酸残基的取代、缺失或添加且具有与序列2的氨基酸序列相同活性的由序列2衍生的蛋白质。
5.根据权利要求4所述的蛋白质,其特征在于所述蛋白质具有序列表中序列2的氨基酸序列。
全文摘要
本发明公开了一种卵巢癌相关基因及其编码的蛋白质。本发明涉及一种与癌症相关的基因及其编码的蛋白质,特别是涉及一种与卵巢癌相关的基因及其编码的蛋白质。本发明的目的是提供一种与卵巢癌发生发展进程相关的基因及其编码的蛋白质。本发明所提供的与卵巢癌相关的基因是序列表中序列1的DNA序列;本发明所提供的蛋白质具有序列表中序列2的氨基酸序列。本发明的基因及其编码的蛋白质有望为临床卵巢癌的诊断和治疗提供有意义的生物学指标,并为抗肿瘤药物的设计提供新的作用靶点和新思路,将会带来巨大的社会效益及经济效益。
文档编号C12N15/11GK1463978SQ02120838
公开日2003年12月31日 申请日期2002年6月5日 优先权日2002年6月5日
发明者岳 文, 李春海, 孙丽亚, 裴雪涛, 张立新, 李海民 申请人:中国人民解放军军事医学科学院野战输血研究所