专利名称:对dna损伤敏感的抑癌基因序列的制作方法
技术领域:
本发明涉及生物技术领域,具体是人类和小鼠的对DNA损伤敏感的抑癌基因全长 mRNA序列,分别编码一个进化上高度同源的蛋白质。
背景技术:
肿瘤细胞的特征是基因组不稳定性(genomic instability),DNA损伤修复异常 和细胞周期调控异常是造成基因组不稳定性的原因。以基因组DNA为研究对象的微阵列比 较基因组杂交(microarray-basedcomparative genomic hybridization, Array-CGH)技 术是目前国际上发现肿瘤相关新基因的强有力手段。Array-CGH技术将覆盖全基因组且已 知顺序的DNA克隆做成微阵列,代替传统CGH检测中将中期染色体作为杂交靶,大大提高了 检测DNA拷贝数异常位点的分辨率;再分别提取肿瘤组织和正常组织的基因组DN A,用cy3 和cy5荧光染料分别标记肿瘤组织和正常组织的DNA,进行杂交检测,在杂交系统中加入 Cotl-DNA用于抑制基因组中重复序列的干扰,并用自动化的扫描仪分析杂交靶上荧光信号 的相对强弱,最后用自动化分析软件进行定量分析。Array-CGH不仅使检测染色体异常的分 辨率提高,而且还可以确定肿瘤相关基因并提供精确的定位。小分子RNA干扰(RNAi)是多数真核细胞本身固有的一种自我保护现象,既能对抗 病毒基因或人工转基因所表达的mRNA等外源基因的侵害,又能降解自身异常基因产生的 mRNA,使靶向基因的转录水平降低或沉默,对含有其同源序列的基因表达进行干涉。RNAi过 程中,由双链RNA分子加工成的19-23个核苷酸的RNAs就称为siRNA,是诱导基因沉默的第 一步,它与RNAi特异性酶结合,形成沉默复合物,特异降解与siRNA同源的靶mRNA,针对同 一个靶mRNA的多种siRNA可以协同起作用。近年来,人们利用这一现象特异性阻断要研究 的基因,从而产生相应的功能缺失表型,形成RNAi技术。染色体脆性位点(fragile site)是正常基因组中位点特异的不稳定区域,包括 39个稀有型脆性位点(rare fragile site)和88个普通型脆性位点(common fragile site, CFS)。正常细胞培养条件下不出现染色体脆性位点;当细胞中DNA复制被部分抑制 时,在有丝分裂中期染色体中形成缺口或断裂区。CFS位点基因具有进化上保守、与癌症发 生密切相关、可能参与DNA损伤反应信号调控等特征,极有可能是肿瘤发生早期起关键调 控作用的候选分子标志物。寻找确定CFS位点基因的新途径、发掘和鉴定新的CFS基因并 阐明其重要功能和分子作用机制,不仅能发现癌症的新型生物标志物,并用于癌症的风险 预测和分子诊断研究,探索癌症防治新方法,还能为抗癌新药的创制提供具有市场开发前 景的分子靶标。因此发掘、鉴定和克隆有重要功能的癌症相关新基因具有高科技研究和应 用的双重价值,是当今生物医学研究的制高点。
发明内容
本发明就是通过建立小鼠肿瘤模型,利用Array-CGH技术分析小鼠淋巴瘤基因组 中的DNA缺失和扩增区域,提供一个功能未知的定位于小鼠七号染色体末端一个高频率缺失的普通型脆性位点的对DNA损伤敏感的抑癌基因序列,并将该基因编码一个新蛋白,为候选抑癌基因。为抗癌新药的创制提供具有市场开发前景的分子靶标。本发明所述一段对DNA损伤敏感的抑癌基因序列,其编码蛋白的氨基酸序列在进 化上高度保守,在肿瘤基因组中缺失频率高达70%,在多种癌细胞中表达沉默,并参与DNA 损伤反应信号传导,具有维持细胞周期节点的功能,并具有抗肿瘤活性,其鼠与人的核酸序 列分别见序列表1和序列表2。所述的一段对DNA损伤敏感的抑癌基因序列,该基因序列在SKBR3,MCF-7, MDA-MB-468,神经胶质瘤细胞系,肺癌细胞系,卵巢癌细胞系,宫颈癌细胞系,以及结肠癌细 胞系中表达沉默。所述的一段对DNA损伤敏感的抑癌基因序列,该编码蛋白的氨基酸序列人与鼠相 同氨基酸比例达65.4%。正常细胞存在细胞周期节点控制功能,在DNA损伤后被激活,阻止细胞在DNA损伤 修复完成之前进入有丝分裂(M期)。但我们研究发现用RNAi技术干扰FATS基因的正常 表达后,在DNA损伤后细胞进入M期的比例显著上升,表明细胞周期G2节点功能严重受损, 证明FATS基因对于维持基因组稳定性有重要作用。上述本发明提供一个与肿瘤发生相关的对DNA损伤敏感的抑癌基因序列,为进一 步的肿瘤基因治疗和分子机制研究、以及与FATS蛋白三维结构为基础的抗癌药物开发提 供了一个新的基础。
图1是小鼠的抑癌基因核酸序列;图2是人源的抑癌基因核酸序列;图3是蛋白质氨基酸顺序比对图;图4是RT-PCR实验分析结果;图5是有丝分裂细胞数统计图。
具体实施例方式下面结合附图及实施对本发明进行详细的说明。一.实验材料来源小鼠模型用p53杂合子近交系C57BL/6小鼠建立。用Y -射线(4Gy)单剂量照射, 4-6月后收集胸腺淋巴瘤组织,提取基因组DNA。人癌细胞系MDA-MB-231,SKBR3, MCF-7, MDA-MB-468, U20S, H1299, SK0V3/ip-l, HeLa,以及HCT116 购自美国 American Type Culture Collection (ATCC) Cotl-DNA 购自 Invitrogen 公司。二.实施方法1. Array-CGH 实验用覆盖小鼠全基因组的BAC文库DNA制备DNA芯片,每张玻璃芯片含19000个 微阵列BAC克隆。提取小鼠胸腺淋巴瘤组织DNA,以正常小鼠的基因组DNA作为对照, 分别用cy3和cy5荧光染料分别标记肿瘤组织和正常组织的DNA,进行杂交检测,在杂交 系统中加入Cotl-DNA用于抑制基因组中重复序列的干扰,并用自动化的扫描仪ImaGene4.0(BiODiSCOVery公司)分析杂交靶上荧光信号的相对强弱,最后周自动化分析软件 Excel-Macro进行定量分析。如图1所示,图中划线处分别为蛋白质翻译起始密码和终止密码。阴影部分是小 鼠FATS基因的最大外显子序列。基因库(Genbank)收录号码为NM-001081331。
该新基因的人源序列位于人类10号染色体10q26. 2区,恰好位于一个普通型 染色体脆性位点FARlOF内,我们将其命名为FATS (Fragile-site Associated Jumor Suppressor)。如图2所示,图中划线处分别为FATS蛋白质翻译起始密码和终止密码,蓝色 区域为不同外显子间隔,大写字母区为蛋白翻译区。基因库(Genbank)收录号码为 NM-OO1004298。2.生物信息学分析通过比较基因组学分析,用美国国家国家卫生研究所网上提供的分析软件(// www. ncbi. nlm. nih. gov)分析CGH结果,确认FATS基因定位和mRNA核酸序列,并用上述软 件将人FATS基因和小鼠FATS基因的mRNA表达序列进行比对。氨基酸顺序比对结果如图3所示,黑底白字区为氨基酸残基完全相同区,深灰色 区为氨基酸残基保守区,淡灰色区为氨基酸残基半保守区;FATS蛋白质氨基酸序列在人和 小鼠中高度保守。3. RT-PCR 实验利用美国麻省理工大学在网上提供的设计软件(//frodo. wi. mit. edu)选择针对 人FATS基因的引物序列,合成以下FATS特异的引物5,-CAATAAGCGAAGCCCTGAAG-3,禾口 5’ -TTGGAGAGCTATCCCCAATG-3’。用Trizol试剂提取细胞的总RNA,电泳检测质量,紫外分光定量。以相同量RNA作 为起始模板,逆转录反应合成cDNA。用PCR仪GeneAmp9700上进行PCR反应,反应体系为 94°C预变性2min,94°C变性30s,56°C退火30s,72°C延伸30s,循环30次。用琼脂糖凝胶电 泳分析结果,参见图4,mRNA表达水平,以GAPDH管家基因的mRNA表达水平作为对照,图4 中1. FATS 基因在乳腺癌细胞系(MDA-MB-231)、2. SKBR3、3. MCF-7、4. MDA-MB-468、5.神经 胶质瘤细胞系(U20S)、6.肺癌细胞系(H1299)、7.卵巢癌细胞系(SK0V3/ip_l)、8.宫颈癌 细胞系(HeLa),9.结肠癌细胞系(HCT116)。FRA10F所在的10q26q区域与肿瘤有很强的相关性,证据表明10q26在黑色素瘤、 神经胶质瘤和子宫内膜癌中均是高频率杂合子丢失(loss ofheterozygosity, L0H)位点。 RT-PCR检测结果还表明FATS基因在多种癌细胞系中的表达水平显著下降或不表达。以上 结果证实FATS不仅是脆性位点新基因,而且与肿瘤发生密切相关。4.制备针对FATS基因的特异性干扰RNAFATS 特异性干扰 RNA(siRNA)用 Block-iT RNAi topo 转录试剂盒(Invitrogen 公司)制备。首先用聚合酶链反应扩增一段160bp FATS特异性序列,所用引物顺序为 (5' -CTCAGCCTCCGCTGTAGTTC-3‘和 5' -CCTTCCAGTGACCACCTTGT-3‘),模板来自小鼠心 脏cDNA。PCR产物与T7启动子linkers连接,进行转录分别产生正义和反义的RNA模板 并进行退火形成双链RNA。最后经Dicer酶消化和纯化,得到FATS_siRNA混合物。稀释至 0. 1 μ g/ μ 1并分装储存于-80C。
5.用RNA干扰技术分析FATS基因表达缺陷对基因组稳定性影响用FATS特异小分子干扰RNA(SiRNA)转染正常胚胎成纤维细胞,对照组细胞 用非特异性siRNA转染,24小时后,用Y-射线(IOGy)照射细胞引入DNA损伤,接着与 nocodazole (0. 2 μ g/ml)孵育24h,在荧光显微镜下观察进入分裂期的细胞数,至少分析 200个细胞(P < 0.01),参见图5。SEQUENCE LISTING〈110〉天津医科大学附属肿瘤医院〈120〉对DNA损伤敏感的抑癌基因序列
<130>DNA<160>1<170>PatentIn version 3.1<210>1<211>2425<212>DNA<213>2 Ambystoma laterale χ Ambystoma jeffersonianum〈220〉〈221〉鼠〈222〉⑴·· (2425)〈223〉〈400〉1tacagaagaa gagaggccct gacagggtca gaatgctgaa gtcagagctg gtggccagcc 60ttccagtgtt caacacactc ctgggagcct tacctccaca agcccaggct gagagacact 120ggcatcacag aacacaagaa tgatatcacc tgtggtcatt tcccggctga ttgatgaaaa 180gaaatctatg gaaaatggag caatattgcc acaagccatt gctcagcctc agctgtgtcc 240cacaaagcca gctttggcca ggcgcgatgg agtgagcatg cacaggcgat ttgctttatc 300tccagacaga ctgggaattt tgactccatc agatgatcaa ggactggaga cagaaccgct 360gtctacaggg gacaatctag gcaaaggttc ccacagcggt ttctcgtcta tcaccattac 420tgcccgacgt gtgggccctc cagccagcag cttggtatgg gacactttta gggacccact 480gtgtcccaag tgcaaagcca aggatgctct gttccaagag cccccagttc tggctggtga 540tgcccatctc tgtcagcaca atagaccctt cacctgtaca gagtccccca gcaatggctc 600cgtagagggg atgaaggttt tccaggctca ctcaaggctg agtgcaaggc aggactactg 660ggtcacccac acgaatgaca atgaggacag tttttcttca gacaattcac catcgagaaa 720agtcccactg gtgttcagtt cttgtgtcca cttccgggtg tctcagcagt gtcccaatgc 780catttactat ttggacaagt ctctttctgt tccccttgag cgacctcaaa ttgctagccc 840caaaatgcac aggtctgtcc tgtctctcag cctccgctgt agttcccacc agttaacagc 900agatggagta gacagctcag ctaatggaga gccaatcagc acagctctat cacaggaact 960ctcggaggga aagcaggacc tcctaggtcc acaatggggc cagccacaag gtggtcactg 1020gaaggagagc ccagcattgg tgccagtaca tttggggagt ggcacatgcc ctcggactgg 1080ctcccctcca ctggaaaatg tcaaatttgc agacgtggga aggaaccagg tcccagtacg 1140aaaggagaaa gaggaccatg caacatgtac cagtagcagc cacaccaacc aactctccat 1200
ccatattccc ggctggagtt acagggctga aacaaaagta ctttctggaa gcaagaagca1260gcagcaagaa gcacaaagaa ctcttcctgc tttcccagtg ggacagaaga ccattaaaca1320cttccctcct gaaggggaca gttcaccaag cagtgatggt caacctagca tcctttcaga1380gtccaatgag aggcaacacc catacttcat gatacccaga gtccctctgc ctgggtttta1440ttgcccttta caaactgggt gtgcctctct gcaggaagat ggtgctgttc agatagaaac1500acacttcccc aaagattaca cgtgctgtga cttggttgta aaactaaagg aatgtgagaa1560gaacgaagac cccactgtca cccctgagcc ctcaccagca accccctctc catcaacccc1620agagggagca cagagctctg acccatcaga agatagttac gagcctctgc tggcaagttc1680tatgactttg caggaagcac tggaagtcca tagacctcag ttcatttctc gctcacaaga1740acggctgcaa aagcttaagc gcatggtaca gcaaaggaaa acccaacaaa aggagagcct1800ggggcagaag cagagcctac ttcctgtccg cgccaacaag aagcagttca ccattcccca1860tcctcttagt gataacttgt tcaaacccaa agaaagatgc atttcagaga aggagatgca1920tatgagatct aaaagaatct ataataattt gccggaagtt aaaaagaaaa aagaagagca1980gaagaaaaga atgatcttac agagtaaccg gctccgagca gaagtcttca aaaagcaatt2040actggaccag ctccttcaaa ggaatgcagt ttgatcccag gtggctctgc tagccctgga2100tctgggaaca cttctgacga cgacgctgga tggatgaacc attacattta acactatctc2160cacacgtgca agacaccttt actttactcc tgatttttct ttttcccaca aaggaaatgt2220cactttctga atgtcccaaa cagaagcaac agtccggcag gcaatggatc agcagtccat2280tgctgggact tcaacacctc gggacctacc agatttagtc ccttccaact tccttggctt2340gtgaatttta cccattgctt ctgaagtttc cattgtacca attccaccca agcaggaaag2400cttcatatac tcacgtgtgc ttgga2425<160>2<170>PatentIn version 3. 1<210>2<211>3097<212>DNA<213>2Ambystoma laterale χ Ambystoma jeffersonianum〈220〉〈221〉人〈222〉⑴·· (3097)〈223〉<400>1attactggcc tagccacaga ggtaaactcc ggacattttt ttctttcatg tcgccaaata60catccttgtc attaaaagac ctttgaaact gagtaaaatg gctttgaaac ctcagtagaa120tatgctcaaa ctgtctggag aaggattacg ggacagctac cacagtagaa gagatcaaat180tgcccttaaa aatctccagt ctgatgtcac agaggcaaaa tctgacttca ccaaggagac240cctggcatca aaatgatttc at catagtc atctcccaga tgattgatga300gaataagtca agagaaaaca gggcctcctt gcccctaccg tgtgccattg ctcagtctcg 360tgcacatcac gccaagcaat ctctggctaa ccgcagcgga gtcaacattc acagagcatt420
tgcgttacttccgggcagat taggaatccc ggcaccgtca gatgagcgag gacctgaggc480agagctgccg cccaaagagg agagaccctg tgggggcccc cgcagagggt ttgcatccat540caccatcacg gccagacgcg tgggcccccc agcccgcgcc ctggtgtggg ggactgctgg600ggactctctg tgccccaagt gcagggctga ggacacactg ttccaggcgc ccccggctct660ggccaatggcgcccatccag gtcggcatca gagatctttt gcctgcacag agttctccag720aaacagctccgtggtgcggc tgaaggttcc cgaggcccac actgggttgt gtgagagacg780caagtactgg gtcacccatg cagacgacaa agagaccagt ttttctccag acaccccact840gtcaggaaag agcccgctgg tgttcagttc ctgtgtccac ctcagggtgt ctcagcagtg900tccagattca atctattacg tagacaagtc tctctccgtc cccattgagc cacctcaaat960tgccagccccaaaatgcaca gatccgtcct gtcgctcaac ctcaattgta gttcccacag1020attaacagca gatggagtag atggcctagt gaacagagag ccaataagcg aagccctgaa1080gcaggagctcctggagggag accaggacct cgtaggccag cgctggaacc caggtttaca1140agaaagtcacttgaaggaaa ccccatcgtt gaggcgggtg catttgggga ccggcgcttg1200tccttggagtggttcttttc cattggaaaa cacagaattg gcaaatgtgg gagctaacca1260agtcactgtaagaaaagggg aaaaggacca tacaactcat tgtcacgcca gcgatcatgc1320caaccaactgtccattcaca ttcctggctg gagttacagg gcagtacaca caaaagtatt1380ttctggaagcagcaagaggc aacaaggaga agtatgtatg actgtgtctg ctcctccagt1440ggaacagaagcccactagac atttccttcc cattggggat agctctccaa gcgatgactg1500tctgtctagagacctttctg agcccacaga gagacgacat caaagcttcc tgaaacccag1560aatcctttttcctgggtttc tttgcccctt acaagatgta tgtgcatctc tgcaggaaga1620caatggtgttcagatagaaa gcaagttccc caaaggagat tacacatgct gtgacttggt1680tgtaaaaataaaggaatgta agaagagtga ggaccccacc acacctgagc cctccccagc1740agcaccctcgccagcacccc gcgatggagc agggagccct ggcctgtccg aagactgttc1800tgagtctcagcaaacgcctg caagatcttt gaccttgcaa gaagcactgg aagttcgtaa1860gcctcagttcatttctcgct cacaagaacg gctgaagaag cttgaacaca tggtccagca1920gaggaaagcccagcggaagg aggacctgag gcagaagcag agcctccttc ccatccgcac1980cagcaagaagcagttcacga ttccccatcc tctgagtgat aacttgttca aacccaaaga2040acggtgcatttcagagaagg agatgcatat gcgatctaag agaatctatg ataacttgcc2100ggaagttaaaaagaaaaaag aagaacaaag gaaaagggtg atcttacaaa gtaacagact2160ccgtgccgaagtcttcaaaa agcaattact ggaccagctc cttcaaagga atgcggtcta2220accacaggctgccctgctga ccacactacc tggacctggg aggacttcga atgctggata2280agccattaaacttagcatta tcttcatcat gggaaaacac ttattttact ttcgattttt2340tttttccataaaggaaaaca tcacttcctg aattactgac ccaagccaaa cagaaacaat2400aaccctcgagaaaataggtc aacaatctgt tgtggggaaa ccacctccat gtaacccact2460ggatacagtccccttaatgt ttttgcttct aaattgtacc ttttgcttct gatttcttct2520cccctgctgtttcctgccca tcagagaggc ctgatacaag caagtttgtt tacatccctg2580gggaatcttttacatcaaac ttttgggatc caaatccatc tccttttaaa tttcaatctc2640agcacctgccagttatgcaa atgccaaaat gtgggtcatc atatagtata tttgaaacct2700
ttctgaacatgtacaccacc caatgctaga ggctgacttg gaaaccggtg ggtgcaatgc2760
ccgaggctgtggaacaatcagcccatctct
gtcaccccgccccattcctcaccagagaaa
acttcagtgttttctacaatactcctcctg
agaaatagcctaatggtccaactttgctgt
atttataaatatgtctgtttgggaagctaa
aataaatgcaattattataa
ttgtgacctg gagcagtcag agggccctca2820
agaatccatt tctatggaag ctctgacgta2880
ccccgcccca ttaaaacagt tcttttgtta2940
ctgttcttcc aaatgtttat aatacacatt3000
gaacaagcta gtttttacaa cacaaatgga3060
aaaaaaa309权利要求
一段对DNA损伤敏感的抑癌基因序列,其特征是该编码蛋白的氨基酸序列在进化上高度保守,在肿瘤基因组中缺失频率高达70%,在多种癌细胞中表达沉默,并参与DNA损伤反应信号传导,具有维持细胞周期节点的功能,并具有抗肿瘤活性,其人与鼠核酸序列分别见序列表1和序列表2。
2.根据权利要求1所述一段对DNA损伤敏感的抑癌基因序列,其特征是该基因序列 在SKBR3,MCF-7,MDA-MB-468,神经胶质瘤细胞系,肺癌细胞系,卵巢癌细胞系,宫颈癌细胞 系,以及结肠癌细胞系中表达沉默。
3.根据权利要求1所述一段对DNA损伤敏感的抑癌基因序列,其特征是该编码蛋白 的氨基酸序列人与鼠相同氨基酸比例达65.4%。
全文摘要
本发明公开了一段对DNA损伤敏感的抑癌基因序列,属于生物技术领域。该序列位于肿瘤基因组中的一个高频缺失区域,在多种癌细胞中表达异常。该编码蛋白的氨基酸序列在进化上高度保守,在肿瘤基因组中缺失频率高达70%,在多种癌细胞中表达沉默,并参与DNA损伤反应信号传导,具有维持细胞周期节点的功能,并具有抗肿瘤活性,用小分子RNA干扰技术抑制FATS基因的表达后,导致正常细胞的基因组稳定性被破坏,表现为DNA损伤后细胞周期G2节点功能受损。本发明为进一步的肿瘤基因治疗和分子机制研究、以及与FATS蛋白三维结构为基础的抗癌药物开发提供了一个新的基础。
文档编号C12N15/12GK101798572SQ200910067829
公开日2010年8月11日 申请日期2009年2月6日 优先权日2009年2月6日
发明者李政 申请人:天津医科大学附属肿瘤医院