一个与神经系统发育相关的人类新基因netrin-g2的制作方法

文档序号:3548691阅读:612来源:国知局
专利名称:一个与神经系统发育相关的人类新基因netrin-g2的制作方法
技术领域
本发明涉及人类基因,具体是与层粘连蛋白相关的NETRIN家族成员的人类新基因NETRIN-G2的cDNA全长克隆,在人体胚胎大脑发育过程中和成年时期的详细表达。
背景技术
神经系统是一个由神经元相互连接而成的精细而复杂的网络系统。每一个神经元是怎样迁移、生长到达其最终的位点是人们非常关心的问题。脊椎动物和无脊椎动物的胚胎学实验证明在某些信号蛋白及其受体的相互作用下,产生吸引或排斥的引导信息,使神经轴突延正确方向生长,到达最终位点(Tessier-lavigne and Goodman,1996)。NETRIN家族被认为是能指导轴突生长的家族之一。它是一个具有较大分子量(70-80KD)分泌型可溶蛋白家族,其氨基酸序列与细胞外基质分子(层粘连蛋白)有较高同源性,在轴突生长、细胞迁移和细胞调亡中有重要作用(Livesey FJ,1999)。
NETRIN家族蛋白广泛分布于脊椎动物和无脊椎动物中,线虫、果蝇、非洲爪蟾、鸡、小鼠和人中都有相关基因的报导。NETRIN蛋白从N-末端到C-末端依次由信号肽、LamNT(VI domain),三个类似于EGF的重复序列(LEdomain)和C结构域(C domain)等结构域组成。其中LamNT结构域被认为是在胚胎发育过程中与其他细胞外基质组分相互作用而介导细胞的固着、迁移和机体建成;C结构域可能和蛋白的定位相关。由于C结构域的氨基酸序列的差异,通常人们将NETRIN家族分为两个亚家族,即经典的NETRIN亚家族和NETRIN-G亚家族。NETRIN-G的C结构域一般称为C′结构域,因其含有一个GPI(glycosyl phoshatidylinositol)的锚定信号而命名为NETRIN-G亚家族。经典的NETRIN亚家族通过与其受体的相互作用而对轴突产生吸引和排斥作用。与其发生作用的受体可分为两大类DCC(deleted incolorectal carcinoma)家族和UNC-5家族。而NETRIN-G亚家族只在小鼠和人中发现,由于它通过GPI锚定在细胞膜上,而且不与经典NETRIN亚家族的两类受体结合,因此它的功能与经典NETRIN蛋白有一定的差异。
NETRIN家族的mRNA主要在中枢神经系统中表达,如NETRIN-1在小鼠的脊髓中强烈表达。NETRIN-1缺陷型小鼠表现出脊椎缝合处轴突投射的缺陷,这与它强表达的部位是吻合的。NETRIN-G亚家族则主要是在胚胎和成体的大脑中表达。另外,小鼠的离体实验表明,固定化的重组NETRIN-G1或NETRIN-G2能够使丘脑和新脑皮神经元轴突延长,促其生长。虽然NETRIN-G亚家族的功能还不是很清楚,但它与大脑和中枢神经系统的发育和生长有密切关系,可能与某些神经系统疾病相关。

发明内容
本发明的目的在于提供一个与神经系统发育相关的人类新基因NETRIN-G2,并分析该基因在人体胚胎(特别是大脑)发育过程中和成年时期的表达及其在染色体上的定位,以探索其对神经系统发育的功能,进而揭示其与人类神经疾病的关系,开发相关神经系统疾病的基因治疗的新药物。
在研究神经系统发育的分子调节机理时,我们得到了本发明,即从人类早期胚胎大脑cDNA文库中分离得到一新的NETRIN-G亚家族成员,我们把它命名为NETRIN-G2。
本发明根据NETRIN-G亚家族LamNT结构域氨基酸序列设计兼并引物NGs和NGas,以20周的胚胎大脑文库为模板进行PCR扩增,扩增产物经琼脂糖凝胶电泳分离,克隆到pUCm-T(SANGON)载体,转化的克隆子任意挑选测序,把所得的序列用Blastn去搜索dbEST发现是EST BF791911的部分序列,把EST BF791911用blastn nr去搜索Genbank,发现BF791911属于一个新基因,再根据EST BF791911和该新基因的一个EST BM126382设计一对基因特异引物Els和Elas,以20周的胚胎大脑文库为模板进行PCR扩增,得到一条特异带,经测序,此片段长1761bp,是该基因的部分序列。再以从20周胚胎大脑中提取的mRNA为模板,分别用五条引物NRp(此条引物为5′磷酸化引物),N5Ros,N5Roas,N5Ris和N5Rias,以及N3R和3sites Adaptor Primer(TaKaRa 3′-Full RACE Core Set试剂盒提供)分别进行5′-RACE和3′-RACE快速扩增末端。RACE反应分别得到了372bp和844bp的目的片段,经T-载体克隆、测序,它们为该基因的5′端和3′端,将它们拼接为全长cDNA,共2428 bp即为NETRIN-G2基因的全长cDNA。
NETRIN-G2全长为2428bp,编码530个氨基酸,大约60 kD,起始密码子ATG开始于核苷酸86,终止密码子TGA在核苷酸1678的位置,SAMRT程序分析表明NETRIN-G2从N-末端到C-末端依次含有含信号肽、LamNT(VIdomain),三个类似于EGF的重复序列(LE domain)和C′结构域(C domain)。其中C′结构域含有GPI的锚定信号。(图1)。
用DNASTAR程序的CLUSTAL分析其与经典的NETRIN亚家族以及NETRIN-G亚家族其他蛋白相似性发现,人的NETRIN-G2与小鼠的同名蛋白相似性非常高,整个蛋白质序列的相似性达到94.5%,与小鼠NETRIN-G1的相似性大约为50%左右,而与经典NETRIN亚家族的相似性只有20%-30%(图1)。说明NETRIN-G2应属于NETRIN-G亚家族,而且在功能上应与小鼠NETRIN-G2有很高的相似性,可能也与丘脑、新脑皮等处的神经元轴突生长相关。
用全长cDNA检索GenBank的Blastn nr,发现人类基因组序列中ACCESSION number为AL353631和AL159997的两段基因组序列中包含了该基因,整个基因序列大约为71Kb,定位于9q34的细胞学位点上。该基因含有7个外显子和6个内含子,外显子的大小由24bp-956bp不等,其中第1、2个外显子编码LamNT结构域。
8种正常成人组织mRNA的Northern杂交分析表明2.4kb的NETRIN-G2mRNA在成人大脑中非常特异的表达(图2A),此结果表明NETRIN-G2在成体的表达具有细胞特异性,可能对大脑的晚期发育和功能发挥起重要作用。
进行19周,21周,24周的人体胚胎各种组织总RNA膜的Northern杂交分析,结果表明该基因在人体不同发育时期的胚胎的表达情况与在成人的表达情况略有不同。NETRIN-G2在胚胎各时期的大脑中强烈表达(图2B-2D),另外在胚胎的肺中也有一定量的表达,但在成人中却检测不到,说明该基因可能也参与了肺的早期发育。
本发明的优点1.提供了一个人类新基因NETRIN-G2基因的全长cDNA序列,并描述了其编码的蛋白产物与其他NETRIN家族蛋白的相似性,推测到其可能的功能。
2.该基因编码的蛋白产物为可溶性分泌蛋白,可能是一种神经轴突生长诱导因子,并且在成人及胚胎组织中大量限制在大脑表达,有可能成为神经系统疾病治疗的基因工程药物。
本发明通过以下附图和具体实施方式
作进一步阐述,但并不限制本发明的范围。


图1.NETRIN-G2的氨基酸与NETRIN家族氨基酸的同源比较图中黑色阴影表示氨基酸同源部分,各个结构域都用线段和箭头分别表示出来图2.NETRIN-G2在人类组织的Northern杂交2-A成人组织2-B 19周胚胎组织2-C 21周胚胎组织2-D 24周胚胎组织图中1心脏 2脑 2′颞叶 2″额叶 3胎盘 4肺 5肝6骨骼肌 7肾 8胰腺 9胃 10小肠 11皮肤 12舌 13脾
具体实施例方式NETRIN-G2基因的克隆,测序及其表达。
1.利用NETRIN家族LamNT结构域设计兼并引物NGs sense5′-ACSTGYGGAGACCCYCCTGARNGasantisense5′-CTGRTAGGGCTGCCAKGTPCR反应以脑cDNA文库为模板,反应条件为94℃变性4分钟;然后94℃30秒,50℃30秒,72℃60秒共25个循环;最后72℃延伸7分钟,扩增的带,进行T-载体连接,转化,任意挑选转化子去测序。测序结果去进行dbEST检索,发现该片段是EST BF791911的部分片段,用此EST进行Blastn nr检索得到一新基因,再进行dbEST检索。根据EST BF791911和该新基因的EST BM126382设计引物
Els sense5′-CGAGTCCCGCCTGACCCCGTElasantisense5′-CCGCACCCTTCTCACCGCCC以大脑文库为模板进行PCR扩增。PCR产物经纯化,T-载体连接,转化,测序,得到了该基因的部分序列,长共1761bp。
2.NETRIN-G2全长cDNA的克隆和测序以检索获得的cDNA序列设计RACE引物NRp5′-CCATGCAGTCCTCGGCGTN5Rossense 5′-CATCACCCTTTCGTGGAACAN5Roas antisense 5′-GTAGCGGCTCCAGGTGATGN5Rissense 5′-GACGACGTGGTGATGACCTTN5Riasantisense 5′-CCCTCCTCCTCCTTGTCGAN3R5′-TGCGACCCCGCCGACGATG3sites Adaptor 5′-CTGATCTAGAGGTACCGGATCC本实验中取大脑组织mRNA 0.5ug为模板,利用TaKaRa公司的5′和3′RACE试剂盒做5′端和3′端RACE。具体操作按该公司protocol进行。将RACE产物克隆入T载体并测序获得NETRIN-G2的5′端和3′端序列。将它们拼接为全长cDNA共2824bp。
3.Northern杂交(1)组织总RNA的提取(按王雁云,罗开梅等,一种快速的总RNA提取方法,《生命科学研究》,5(1)88-90(2001)进行)。
(2)总RNA的电泳及转膜,均按《现代分子生物学实验技术》介绍的方法进行(卢圣栋主编,第二版)。
(3)Northern杂交将从CLONTECH公司买的成人组织mRNA膜和转有20ug人体胚胎多种组织的总RNA尼龙膜,放入培养皿中,加入经68℃预热的快速杂交液(Clontech公司)10ml,68℃预杂交30分钟,加入变性的同位素标记的NETRIN-G2的cDNA片段,68℃杂交过夜。用2XSSC,0.05%SDS,65℃洗两次,15分钟/次;0.1XSSC,0.1%SDS,65℃洗两次,15分钟/次。
(4)-80℃曝光几天,洗X光片。
(5)用0.1×SSC和0.5%SDS在95℃洗10分钟膜用β-actin cDNA重新标记,做Northern杂交进行阳性对照。
NETRIN-G2 cDNA的核苷酸序列和编码的氨基酸序列ccatgctgaggccgc gagtcccgcc tgaccccgtc 35gctgcctctc cagggcttct ctgggccgcg cctctgcaga ctgcgcagcc 85atg ctg cat ctg ctg gcg ctc ttc ctg cac tgc ctc cct ctg gcc 130Met Leu His Leu Leu Ala Leu Phe Leu His Cys Leu Pro Leu Ala1 5 10 15tct ggg gac tat gac atc tgc aaa tcc tgg gtg acc aca gat gag 175Ser Gly Asp Tyr Asp Ile Cys Lys Ser Trp Val Thr Thr Asp Glu16 20 25 30ggc ccc acc tgg gag ttc tac gcc tgc cag ccc aag gtg atg cgc 220Gly Pro Thr Trp Glu Phe Tyr Ala Cys Gln Pro Lys Val Met Arg31 35 40 45ctg aag gac tac gtc aag gtg aag gtg gag ccc tca ggc atc aca 265Leu Lys Asp Tyr Val Lys Val Lys Val Glu Pro Ser Gly Ile Thr46 50 55 60tgt gga gac ccc cct gag agg ttc tgc tcc cat gag aat ccc tac 310Cys Gly Asp Pro Pro Glu Arg Phe Cys Ser His Glu Asn Pro Tyr61 65 70 75cta tgc agc aac gag tgt gac gcc tcc aac ccg gac ctg gcc cac 355Leu Cys Ser Asn Glu Cys Asp Ala Ser Asn Pro Asp Leu Ala His76 80 85 90ccg ccc agg ctc atg ttc gac aag gag gag gag ggc ctg gcc acc 400Pro Pro Arg Leu Met Phe Asp Lys Glu Glu Glu Gly Leu Ala Thr91 95 100 105tac tgg cag agc atc acc tgg agc cgc tac ccc agc ccg ctg gaa 445Tyr Trp Gln Ser Ile Thr Trp Ser Arg Tyr Pro Ser Pro Leu Glu106 110 115 120gcc aac atc acc ctt tcg tgg aac aag acc gtg gag ctg acc gac 490Ala Asn Ile Thr Leu Ser Trp Asn Lys Thr Val Glu Leu Thr Asp121 125 130 135gac gtg gtg atg acc ttc gag tac ggc cgg ccc acg gtc atg gtc 535Asp Val Val Met Thr Phe Glu Tyr Gly Arg Pro Thr Val Met Val136 140 145 150ctg gag aag tcc ctg gac aac ggg cgc acc tgg cag ccc tac cag 580Leu Glu Lys Ser Leu Asp Asn Gly Arg Thr Trp Gln Pro Tyr Gln151 155 160 165ttc tac gcc gag gac tgc atg gag gcc ttc ggt atg tcc gcc cgc 625Phe Tyr Ala Glu Asp Cys Met Glu Ala Phe Gly Met Ser Ala Arg166 170 175 180cgg gcc cgc gac atg tca tcc tcc agc gcg cac cgc gtg ctc tgc 670Arg Ala Arg Asp Met Ser Ser Ser Ser Ala His Arg Val Leu Cys181 185 190 195acc gag gag tac tcg cgc tgg gca ggc tcc aag aag gag aag cac 715
Thr Glu Glu Tyr Ser Arg Trp Ala Gly Ser Lys Lys Glu Lys His196 200 205 210gtg cgc ttc gag gtg cgg gac cgc ttc gcc atc ttt gcc ggc ccc760Val Arg Phe Glu Val Arg Asp Arg Phe Ala Ile Phe Ala Gly Pro211 215 220 225gac ctg cgc aac atg gac aac ctc tac acg cgg ctg gag agc gcc805Asp Leu Arg Asn Met Asp Asn Leu Tyr Thr Arg Leu Glu Ser Ala226 230 235 240aag ggc ctc aag gag ttc ttc acc ctc acc gac ctg cgc atg cgg850Lys Gly Leu Lys Glu Phe Phe Thr Leu Thr Asp Leu Arg Met Arg241 245 250 255ctg ctg cgc ccg gcg ctg ggc ggc acc tat gtg cag cgg gag aac895Leu Leu Arg Pro Ala Leu Gly Gly Thr Tyr Val Gln Arg Glu Asn256 260 265 270ctc tac aag tac ttc tac gcc atc tcc aac atc gag gtc atc ggc940Leu Tyr Lys Tyr Phe Tyr Ala Ile Ser Asn Ile Glu Val Ile Gly271 275 280 285agg tgc aag tgc aac ctg cat gcc aac ctg tgc tcc atg cgc gag985Arg Cys Lys Cys Asn Leu His Ala Asn Leu Cys Ser Met Arg Glu286 290 295 300ggc agc ctg cag tgc gag tgc gag cac aac acc acc ggc ccc gac1030Gly Ser Leu Gln Cys Glu Cys Glu His Asn Thr Thr Gly Pro Asp301 305 310 315tgc ggc aag tgc aag aag aat ttc cgc acc cgg tcc tgg cgg gcc1075Cys Gly Lys Cys Lys Lys Asn Phe Arg Thr Arg Ser Trp Arg Ala316 320 325 330ggc tcc tac ctg ccg ctg ccc cat ggc tct ccc aac gcc tgt gcc1120Gly Ser Tyr Leu Pro Leu Pro His Gly Ser Pro Asn Ala Cys Ala331 335 340 345gct gca ggt tcc ttt ggc aac tgc gaa tgc tac ggt cac tcc aac1165Ala Ala Gly Ser Phe Gly Asn Cys Glu Cys Tyr Gly His Ser Asn346 350 355 360cgc tgc agc tac att gac ttc ctg aat gtg gtg acc tgc gtc agc1210Arg Cys Ser Tyr Ile Asp Phe Leu Asn Val Val Thr Cys Val Ser361 365 370 375tgc aag cac aac acg cga ggt cag cac tgc cag cac tgc cgg ctg1255Cys Lys His Asn Thr Arg Gly Gln His Cys Gln His Cys Arg Leu376 380 385 390ggc tac tac cgc aac ggc tcg gca gag ctg gat gat gag aac gtc1300Gly Tyr Tyr Arg Asn Gly Ser Ala Glu Leu Asp Asp Glu Asn Val391 395 400 405tgc att gag tgt aac tgc aac cag ata ggc tcc gtg cac gac cgg1345Cys Ile Glu Cys Asn Cys Asn Gln Ile Gly Ser Val His Asp Arg406 410 415 420tgc aac gag acc ggc ttc tgc gag tgc cgc gag ggc gcg gcg ggc1390
Cys Asn Glu Thr Gly Phe Cys Glu Cys Arg Glu Gly Ala Ala Gly421 425 430 435ccc aag tgc gac gac tgc ctc ccc acg cac tac tgg cgc cag ggc1435Pro Lys Cys Asp Asp Cys Leu Pro Thr His Tyr Trp Arg Gln Gly436 440 445 450tgc tac ccc aac gtg tgc gac gac gac cag ctg ctg tgc cag aac1480Cys Tyr Pro Asn Val Cys Asp Asp Asp Gln Leu Leu Cys Gln Asn451 455 460 465gga ggc acc tgc ctg cag aac cag cgc tgc gcc tgc ccg cgc ggc1525Gly Gly Thr Cys Leu Gln Asn Gln Arg Cys Ala Cys Pro Arg Gly466 470 475 480tac acc ggc gtg cgc tgc gag cag ccc cgc tgc gac ccc gcc gac1570Tyr Thr Gly Val Arg Cys Glu Gln Pro Arg Cys Asp Pro Ala Asp481 485 490 495gat gac ggc ggt ctg gac tgc gac cgc gcg ccc ggg gcc gcc ccg1615Asp Asp Gly Gly Leu Asp Cys Asp Arg Ala Pro Gly Ala Ala Pro496 500 505 510cgc ccc gcc acc ctg ctc ggc tgc ctg ctg ctg ctg ggg ctg gcc1660Arg Pro Ala Thr Leu Leu Gly Cys Leu Leu Leu Leu Gly Leu Ala511 515 520 525gcc cgc ctg ggc cgc tga gccccgc ccggaggacg ctccccgcac1705Ala Arg Leu Gly Arg526 530ccggaggccg ggggtcccgg ggtcccgggg cggggccggc gtccgaggcc1755gggcggtgag aagggtgcgg cccgaggtgc tcccaggtgc tactcagcag1805ggccccccgc ccggcccgcg ctcccgcccg cactgccctc cccccgcagc1855aggggcgcct tgggactccg gtccccgcgc ctgcgatttg gtttcgtttt1905tcttttgtat tatccgccgc ccagttcctt ttttgtcttt ctctctctct1955cttttttttt tttttttctg gcggtgagcc agagggtcgg gagaaacgct2005gctcgcccca caccccgtcc tgcctcccac cacacttaca cacacgggac2055tgtggccgac accccctggc ctgtgccagg ctcacgggcg gcggcggacc2105ccgacctcca gttgcctaca attccagtcg ctgacttggt cctgttttct2155attctttatt tttcctgcaa cccaccagac cccaggcctc accggaggcc2205cggtgaccac ggaactcacc gtctggggga ggaggagaga aggaaggggt2255ggggggcctg gaaacttcgt tctgtagaga actatttttg tttgtattca2305ctgtcccctg caagggggac ggggcgggag cactggtcac cgcgggggcc2355gatggtggag aatccgagga gtaaagagtt attccagtcg tgctcactgc2405tgcaaaaaaa aaaaaaaaaa aaaaaaaa 2428
NETRIN-G2的部分核苷酸序列。
gagtcccgcc tgaccccgtc gctgcctctc cagggcttct ctgggccgcg cctctgcaga 61ctgcgcagcc atgctgcatc tgctggcgct cttcctgcac tgcctccctc tggcctctgg 121ggactatgac atctgcaaat cctgggtgac cacagatgag ggccccacct gggagttcta 181cgcctgccag cccaaggtga tgcgcctgaa ggactacgtc aaggtgaagg tggagccctc 241aggcatcaca tgtggagacc cccctgagag gttctgctcc catgagaatc cctacctatg 301cagcaacgag tgtgacgcct ccaacccgga cctggcccac ccgcccaggc tcatgttcga 361caaggaggag gagggcctgg ccacctactg gcagagcatc acctggagcc gctaccccag 421cccgctggaa gccaacatca ccctttcgtg gaacaagacc gtggagctga ccgacgacgt 481ggtgatgacc ttcgagtacg gccggcccac ggtcatggtc ctggagaagt ccctggacaa 541cgggcgcacc tggcagccct accagttcta cgccgaggac tgcatggagg ccttcggtat 601gtccgcccgc cgggcccgcg acatgtcatc ctccagcgcg caccgcgtgc tctgcaccga 661ggagtactcg cgctgggcag gctccaagaa ggagaagcac gtgcgcttcg aggtgcggga 721ccgcttcgcc atctttgccg gccccgacct gcgcaacatg gacaacctct acacgcggct 781ggagagcgcc aagggcctca aggagttctt caccctcacc gacctgcgca tgcggctgct 841gcgcccggcg ctgggcggca cctatgtgca gcgggagaac ctctacaagt acttctacgc 901catctccaac atcgaggtca tcggcaggtg caagtgcaac ctgcatgcca acctgtgctc 961catgcgcgag ggcagcctgc agtgcgagtg cgagcacaac accaccggcc ccgactgcgg1021caagtgcaag aagaatttcc gcacccggtc ctggcgggcc ggctcctacc tgccgctgcc1081ccatggctct cccaacgcct gtgccgctgc aggttccttt ggcaactgcg aatgctacgg1141tcactccaac cgctgcagct acattgactt cctgaatgtg gtgacctgcg tcagctgcaa1201gcacaacacg cgaggtcagc actgccagca ctgccggctg ggctactacc gcaacggctc1261ggcagagctg gatgatgaga acgtctgcat tgagtgtaac tgcaaccaga taggctccgt1321gcacgaccgg tgcaacgaga ccggcttctg cgagtgccgc gagggcgcgg cgggccccaa1381gtgcgacgac tgcctcccca cgcactactg gcgccagggc tgctacccca acgtgtgcga1441cgacgaccag ctgctgtgcc agaacggagg cacctgcctg cagaaccagc gctgcgcctg1501cccgcgcggc tacaccggcg tgcgctgcga gcagccccgc tgcgaccccg ccgacgatga1561cggcggtctg gactgcgacc gcgcgcccgg ggccgccccg cgccccgcca ccctgctcgg1621ctgcctgctg ctgctggggc tggccgcccg cctgggccgc tgagccccgc ccggaggacg1681ctccccgcac ccggaggccg ggggtcccgg ggtcccgggg cggggccggc gtccgaggcc1741gggcggtgag aagggtgcgg c 175权利要求
1.一个与神经系统发育相关的人类新基因NETRIN-G2,其特征在于该基因的cDNA的核苷酸序列和编码氨基酸序列如下ccatg ctgaggccgc gagtcccgcc tgaccccgtc 35gctgcctctc cagggcttct ctgggccgcg cctctgcaga ctgcgcagcc 85atg ctg cat ctg ctg gcg ctc ttc ctg cac tgc ctc cct ctg gcc 130Met Leu His Leu Leu Ala Leu Phe Leu His Cys Leu Pro Leu Ala1 5 10 15tct ggg gac tat gac atc tgc aaa tcc tgg gtg acc aca gat gag 175Ser Gly Asp Tyr Asp Ile Cys Lys Ser Trp Val Thr Thr Asp Glu16 20 25 30ggc ccc acc tgg gag ttc tac gcc tgc cag ccc aag gtg atg cgc 220Gly Pro Thr Trp Glu Phe Tyr Ala Cys Gln Pro Lys Val Met Arg31 35 40 45ctg aag gac tac gtc aag gtg aag gtg gag ccc tca ggc atc aca 265Leu Lys Asp Tyr Val Lys Val Lys Val Glu Pro Ser Gly Ile Thr46 50 55 60tgt gga gac ccc cct gag agg ttc tgc tcc cat gag aat ccc tac 310Cys Gly Asp Pro Pro Glu Arg Phe Cys Ser His Glu Asn Pro Tyr61 65 70 75cta tgc agc aac gag tgt gac gcc tcc aac ccg gac ctg gcc cac 355Leu Cys Ser Asn Glu Cys Asp Ala Ser Asn Pro Asp Leu Ala His76 80 85 90ccg ccc agg ctc atg ttc gac aag gag gag gag ggc ctg gcc acc 400Pro Pro Arg Leu Met Phe Asp Lys Glu Glu Glu Gly Leu Ala Thr91 95 100 105tac tgg cag agc atc acc tgg agc cgc tac ccc agc ccg ctg gaa 445Tyr Trp Gln Ser Ile Thr Trp Ser Arg Tyr Pro Ser Pro Leu Glu106 110 115 120gcc aac atc acc ctt tcg tgg aac aag acc gtg gag ctg acc gac 490Ala Asn Ile Thr Leu Ser Trp Asn Lys Thr Val Glu Leu Thr Asp121 125 130 135gac gtg gtg atg acc ttc gag tac ggc cgg ccc acg gtc atg gtc 535Asp Val Val Met Thr Phe Glu Tyr Gly Arg Pro Thr Val Met Val136 140 145 150ctg gag aag tcc ctg gac aac ggg cgc acc tgg cag ccc tac cag 580Leu Glu Lys Ser Leu Asp Asn Gly Arg Thr Trp Gln Pro Tyr Gln151 155 160 165ttc tac gcc gag gac tgc atg gag gcc ttc ggt atg tcc gcc cgc 625Phe Tyr Ala Glu Asp Cys Met Glu Ala Phe Gly Met Ser Ala Arg166 170 175 180cgg gcc cgc gac atg tca tcc tcc agc gcg cac cgc gtg ctc tgc 670Arg Ala Arg Asp Met Ser Ser Ser Ser Ala His Arg Val Leu Cys181 185 190 195acc gag gag tac tcg cgc tgg gca ggc tcc aag aag gag aag cac 715Thr Glu Glu Tyr Ser Arg Trp Ala Gly Ser Lys Lys Glu Lys His196 200 205 210gtg cgc ttc gag gtg cgg gac cgc ttc gcc atc ttt gcc ggc ccc 760Val Arg Phe Glu Val Arg Asp Arg Phe Ala Ile Phe Ala Gly Pro211 215 220 225gac ctg cgc aac atg gac aac ctc tac acg cgg ctg gag agc gcc 805Asp Leu Arg Asn Met Asp Asn Leu Tyr Thr Arg Leu Glu Ser Ala226 230 235 240aag ggc ctc aag gag ttc ttc acc ctc acc gac ctg cgc atg cgg 850Lys Gly Leu Lys Glu Phe Phe Thr Leu Thr Asp Leu Arg Met Arg241 245 250 255ctg ctg cgc ccg gcg ctg ggc ggc acc tat gtg cag cgg gag aac 895Leu Leu Arg Pro Ala Leu Gly Gly Thr Tyr Val Gln Arg Glu Asn256 260 265 270ctc tac aag tac ttc tac gcc atc tcc aac atc gag gtc atc ggc 940Leu Tyr Lys Tyr Phe Tyr Ala Ile Ser Asn Ile Glu Val Ile Gly271 275 280 285agg tgc aag tgc aac ctg cat gcc aac ctg tgc tcc atg cgc gag 985Arg Cys Lys Cys Asn Leu His Ala Asn Leu Cys Ser Met Arg Glu286 290 295 300ggc agc ctg cag tgc gag tgc gag cac aac acc acc ggc ccc gac 1030Gly Ser Leu Gln Cys Glu Cys Glu His Asn Thr Thr Gly Pro Asp301 305 310 315tgc ggc aag tgc aag aag aat ttc cgc acc cgg tcc tgg cgg gcc 1075Cys Gly Lys Cys Lys Lys Asn Phe Arg Thr Arg Ser Trp Arg Ala316 320 325 330ggc tcc tac ctg ccg ctg ccc cat ggc tct ccc aac gcc tgt gcc 1120Gly Ser Tyr Leu Pro Leu Pro His Gly Ser Pro Asn Ala Cys Ala331 335 340 345gct gca ggt tcc ttt ggc aac tgc gaa tgc tac ggt cac tcc aac 1165Ala Ala Gly Ser Phe Gly Asn Cys Glu Cys Tyr Gly His Ser Asn346 350 355 360cgc tgc agc tac att gac ttc ctg aat gtg gtg acc tgc gtc agc 1210Arg Cys Ser Tyr Ile Asp Phe Leu Asn Val Val Thr Cys Val Ser361 365 370 375tgc aag cac aac acg cga ggt cag cac tgc cag cac tgc cgg ctg 1255Cys Lys His Asn Thr Arg Gly Gln His Cys Gln His Cys Arg Leu376 380 385 390ggc tac tac cgc aac ggc tcg gca gag ctg gat gat gag aac gtc 1300Gly Tyr Tyr Arg Asn Gly Ser Ala Glu Leu Asp Asp Glu Asn Val391 395 400 405tgc att gag tgt aac tgc aac cag ata ggc tcc gtg cac gac cgg 1345Cys Ile Glu Cys Asn Cys Asn Gln Ile Gly Ser Val His Asp Arg406 410 415 420tgc aac gag acc ggc ttc tgc gag tgc cgc gag ggc gcg gcg ggc 1390Cys Asn Glu Thr Gly Phe Cys Glu Cys Arg Glu Gly Ala Ala Gly421 425 430 435ccc aag tgc gac gac tgc ctc ccc acg cac tac tgg cgc cag ggc 1435Pro Lys Cys Asp Asp Cys Leu Pro Thr His Tyr Trp Arg Gln Gly436 440 445 450tgc tac ccc aac gtg tgc gac gac gac cag ctg ctg tgc cag aac 1480Cys Tyr Pro Asn Val Cys Asp Asp Asp Gln Leu Leu Cys Gln Asn451 455 460 465gga ggc acc tgc ctg cag aac cag cgc tgc gcc tgc ccg cgc ggc 1525Gly Gly Thr Cys Leu Gln Asn Gln Arg Cys Ala Cys Pro Arg Gly466 470 475 480tac acc ggc gtg cgc tgc gag cag ccc cgc tgc gac ccc gcc gac 1570Tyr Thr Gly Val Arg Cys Glu Gln Pro Arg Cys Asp Pro Ala Asp481 485 490 495gat gac ggc ggt ctg gac tgc gac cgc gcg ccc ggg gcc gcc ccg 1615Asp Asp Gly Gly Leu Asp Cys Asp Arg Ala Pro Gly Ala Ala Pro496 500 505 510cgc ccc gcc acc ctg ctc ggc tgc ctg ctg ctg ctg ggg ctg gcc 1660Arg Pro Ala Thr Leu Leu Gly Cys Leu Leu Leu Leu Gly Leu Ala511 515 520 525gcc cgc ctg ggc cgc tgagccccgc ccggaggacg ctccccgcac 1705Ala Arg Leu Gly Arg527 530ccggaggccg ggggtcccgg ggtcccgggg cggggccggc gtccgaggcc 1755gggcggtgag aagggtgcgg cccgaggtgc tcccaggtgc tactcagcag 1805ggccccccgc ccggcccgcg ctcccgcccg cactgccctc cccccgcagc 1855aggggcgcct tgggactccg gtccccgcgc ctgcgatttg gtttcgtttt 1905tcttttgtat tatccgccgc ccagttcctt ttttgtcttt ctctctctct 1955cttttttttt tttttttctg gcggtgagcc agagggtcgg gagaaacgct 2005gctcgcccca caccccgtcc tgcctcccac cacacttaca cacacgggac 2055tgtggccgac accccctggc ctgtgccagg ctcacgggcg gcggcggacc 2105ccgacctcca gttgcctaca attccagtcg ctgacttggt cctgttttct 2155attctttatt tttcctgcaa cccaccagac cccaggcctc accggaggcc 2205cggtgaccac ggaactcacc gtctggggga ggaggagaga aggaaggggt 2255ggggggcctg gaaacttcgt tctgtagaga actatttttg tttgtattca 2305ctgtcccctg caagggggac ggggcgggag cactggtcac cgcgggggcc 2355gatggtggag aatccgagga gtaaagagtt attccagtcg tgctcactgc 2405tgcaaaaaaa aaaaaaaaaa aaaaaaaa 2428
全文摘要
一个与神经系统发育相关的人类新基因NETRIN-G2涉及人类基因,该基因的cDNA全长2428bp,位于染色体9q34,编码的蛋白质为530个氨基酸,大约60KD,该基因在胚胎各时期和成人的大脑中表达,有望开发成为神经系统疾病治疗的基因药物。
文档编号C07K14/435GK1490324SQ0213975
公开日2004年4月21日 申请日期2002年11月12日 优先权日2002年11月12日
发明者吴秀山, 刘明耀, 李大力, 王跃群, 李永青, 朱传炳, 袁婺洲 申请人:湖南师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1