专利名称:一种人白血病相关逆转录病毒基因组核酸序列及其应用的制作方法
技术领域:
本发明涉及一种新的逆转录病毒基因组核酸序列,其基因组结构组成从5′端到3′端依次包含5′端长末端重复序列(5′LTR)、5′端非编码区(UTR)、GAG基因编码区、POL基因编码区、ENV基因编码区和3′端长末端重复序列(3′LTR)。本发明还提供了用于检测生物学样本中是否存在人白血病相关逆转录病毒基因组核酸序列以及分析样本中人白血病相关逆转录病毒基因组表达情况的方法;以及用于阻抑人白血病相关逆转录病毒的方法。本发明还涉及本发明所述逆转录病毒基因组核酸序列用于鉴别、治疗和预防人白血病的用途。
本发明人首次从白血病患者原代白血病细胞中分离和克隆到一种人白血病相关的全长逆转录病毒前病毒基因组。实验证实,该病毒基因组不仅存在于大多数白血病患者中,表达相应的病毒RNA和病毒蛋白,而且具有恶性转化正常细胞的功能。由此,为鉴定、治疗和/或预防人类白血病提供了一条新的途径。
本发明的另一方面,提供了一种用于检测生物学样本中是否存在人白血病相关逆转录病毒基因组核酸序列的方法,其特征在于,利用了根据权利要求1所述的逆转录病毒全长基因组所设计的引物。
本发明的另一方面,提供了一种用于分析样本中人白血病相关逆转录病毒基因组表达情况的方法,其特征在于,利用了根据权利要求1所述的逆转录病毒全长基因组所设计的或杂交探针。
本发明的又一个方面,公开了一种用于阻抑人白血病相关逆转录病毒的方法,其特征在于,利用了根据如权利要求1所述的逆转录病毒全长基因组设计的反义寡核苷酸片段来封闭该病毒基因组上的活性位点。
本发明的再一个方面,提供了如权利要求1所述的逆转录病毒全长基因组用于治疗和/或预防白血病的用途。发明详述在本发明中,术语“人白血病相关逆转录病毒基因组”是指人白血病细胞中含有功能性长末端重复序列LTR和具有编码生物学功能GAG、POL、ENV病毒蛋白的逆转录病毒基因组。该术语还包括与SEQ ID NO.1所述的核苷酸序列同源性在90%以上的所有具有生物学功能的变体或衍生物。
“分离的”指“通过人工”从天然状态改变和/或从天然环境分离。这样,如果存在于自然界的“分离的”组合物或物质被“分离”,那么它已被改变或已被从其最初的环境移走,或两者都有。例如,天然存在于活的动物内的多核苷酸或多肽不是“分离”的,但从其天然状态的共存物质中分离的同一多核苷酸或多肽是“分离的”,正如此处所用的该术语。
此处所用的术语“变体”是指多核苷酸或多肽,其分别不同于参考的多核苷酸或多肽,但保留了基本的特性,如基本的生物特性、结构特性、调节特性或生化特性。多核苷酸的一般变体之核苷酸序列不同于另一个,参考核苷酸。变体核苷酸序列的变化可改变或不改变多肽的氨基酸序列,其中所述的多肽由参考多核苷酸编码。核苷酸的变化可导致参考序列所编码的多肽中氨基酸的替换、添加、删除、融合和截短,对此将在下面讨论。多肽的一般变体之氨基酸序列不同于另一个,参考多肽。通常,差异是有限的,以使参考多肽之序列与变体总体上非常相似,并且在许多区域是相同的。变体和参考多肽氨基酸序列上的差异可以是一个或多个氨基酸以任一组合的替换、添加和删除。替换或插入的氨基酸残基可由遗传密码编码,也可不由遗传密码编码。多核苷酸或多肽的变体可以自然产生(如等位基因变体),或者它可以是非自然产生的变体。多核苷酸和多肽之非自然产生的变体可通过诱变技术或直接合成而产生。
“同源性”是对核苷酸序列或氨基酸序列之同源性的量度。通常将序列排列起来,以获得最大限度的匹配。“同源性”本身具有本领域认知的意义并且可用公开的技术计算。见例如(计算分子生物学(COMPUTATIONAL MOLECULAR BIOLOGY),Lesk,A.M.,ed.,牛津大学出版社,纽约,1988;生物计算机学资讯学和基因组计划(BIOCOMPUTINGINFORMATICS AND GENOMEPROJECTS),Smith,D.W.,ed.,学术出版社,纽约,1993;序列数据的计算机分析,第一部分(COMPUTER ANALYSIS OF SEQUENCEDATA,PART I),Griffin,A.M.,和Griffin,H.G.,eds.,Humana Press,新泽西,1994;分子生物学中的序列分析(SEQUENCE ANALYSISIN MOLECULAR BIOLOGY),von Heinje,G.,学术出版社,1987;以及序列分析导引(SEQUENCE ANALYSIS PRIMER),Gribskov,M.和Devereux,J.,eds.,M Stockton Press,纽约,1991)。虽然存在许多可用于测量两个多核苷酸或多肽间同源性的方法,该术语“同源性”为技术人员周知(Carillo,H.,和Lipton,D.,工业与应用数学会应用数学杂志(SIAM J.Applied Math.)(1988)481073)。测定两个序列间的同源性或相似性的常用方法包括(但不限于)公开于超大计算机指南(Guide to Huge Computers),Martin J.Bishop,ed.,学术出版社,圣地亚哥,1994和Carillo,H.,和Lipton,D.,工业与应用数学会应用数学杂志(1988)481073中的方法。测定同源性或相似性的方法已按规则编在计算机程序中。优选的、用于测定两个序列间的同源性或相似性的计算机程序方法包括(但不限于)GCG程序包(Devereux,J.,等人,核酸研究(Nucleic Acids Research)(1984)12(1)387)、BLASTP、BLASTN、FASTA(Atschul,S.F.等人,分子生物学杂志(J.Molec.Biol.)(1990)215403)。
通过一种多核苷酸进行说明,其所具有的核苷酸序列例如与SEQID NO1的参考核苷酸序列至少具95%的“同源性”是指在SEQ IDNO1的参考核苷酸序列之每100个核苷酸中,该多核苷酸的核苷酸序列除了含有多达5个核苷酸的不同外,该多核苷酸之核苷酸序列与参考序列相同。换句话说,为了获得核苷酸序列与参考核苷酸序列至少95%相同的多核苷酸,参考序列中多达5%的核苷酸可被删除或被另一核苷酸替代;或可将一些核苷酸插入参考序列中,其中插入的核苷酸可多达参考序列之总核苷酸的5%;或在一些核苷酸中,存在删除、插入和替换的组合,其中所述核苷酸多达参考序列之总核苷酸的5%。参考序列的这些突变可发生在参考核苷酸序列的5或3末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的核苷酸中,或以一个或多个邻近的组存在于参考序列中。
类似地,一种多肽,其所具有的氨基酸序列例如与SEQ ID NO2的参考氨基酸序列至少具95%的“同源性”是指在SEQ ID NO2的参考氨基酸序列之每100个氨基酸中,该多肽之氨基酸序列除了含有多达5个氨基酸的变化外,该多肽之氨基酸序列与参考序列相同。换句话说,为了获得氨基酸序列与参考氨基酸序列至少95%相同的多肽,参考序列中多达5%的氨基酸残基可被删除或被另一氨基酸替代;或可将一些氨基酸插入参考序列中,其中插入的氨基酸多达参考序列之总氨基酸残基的5%。参考序列的这些突变可发生在参考氨基酸序列的氨基或羧基末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的残基中,或以一个或多个邻近的组存在于参考序列中。
本发明的一个方面,提供了一种分离的人白血病相关逆转录病毒全长基因组,其特征在于,其基因组结构组成从5′端到3′端依次包含5′端长末端重复序列(5′LTR)、5′端非编码区(UTR)、GAG基因编码区、POL基因编码区、ENV基因编码区和3′端长末端重复序列(3′LTR)。本发明人首次发现,该病毒基因组是一种与人白血病发病有关的逆转录病毒前病毒DNA基因组。
特别地,本发明所述分离的人白血病相关逆转录病毒全长基因组中所述长末端重复序列可为与SEQ ID NO.1中的长末端重复序列同源性在95%以上的变体或其衍生物;所述5′端非编码区(UTR)序列为与SEQ ID NO.1中的5′端非编码区核苷酸同源性在95%以上的变体或其衍生物;所述GAG基因编码区为与SEQ ID NO.1核苷酸序列中所述编码具有GAG病毒蛋白和多肽的核苷酸序列其同源性在95%以上的变体或衍生物;所述POL基因编码区为与SEQ IDNO.1核苷酸序列中所述的编码具有POL病毒蛋白和多肽的核苷酸序列同源性在95%以上的变体或衍生物;所述ENV基因编码区为与SEQ ID NO.1核苷酸序列中所述的编码具有ENV病毒蛋白和多肽的核苷酸序列同源性在95%以上的变体或衍生物;优选的,所述逆转录病毒全长基因组为与SEQ ID NO.1核苷酸序列同源性在95%以上的具有相同或相似生物学功能或活性的变体或其衍生物更特别地,本发明所述的逆转录病毒全长基因组中,所述5′LTR和3′LTR核苷酸组成完全一致,其中5′LTR具有SEQ ID NO1中第1-492位核苷酸编码的序列,3′LTR具有SEQ ID NO1中第8333-8824位核苷酸编码的序列;所述5′端非编码区(UTR)具有SEQ ID NO1中第493-1074位核苷酸编码的序列;所述GAG基因编码区具有SEQ ID NO1中第1 075-2644位核苷酸编码的序列;所述POL基因编码区具有SEQ ID NO1中第2680-6229位核苷酸编码的序列;ENV基因编码区具有SEQ ID NO1中第6254-8300位核苷酸编码的序列。
在本发明的一个实施方案中,提供了一种新的人白血病相关的逆转录病毒全基因组序列(见SEQ ID NO.1),该病毒基因组序列由8824个核苷酸组成,包括5′端和3′端两个长末端重复序列(5′LTR和3′LTR)、5′端非编码区、及中间三个大开放阅读框架GAG、POL和ENV组成。5′LTR和3′LTR核苷酸组成完全一致,共有492个核苷酸。5′端非编码区(UTR)有582核苷酸。GAG基因编码区有1570个核苷酸。POL基因编码区有3550个核苷酸。ENV基因编码区有2047个核苷酸。具体排列为从核苷酸第1-492位为5′端长末端重复序列(5′LTR),第8333-8824位为3′端长末端重复序列(3′LTR)、第493-1074位核苷酸为5′端非编码区、第1075-2644位核苷酸为GAG基因编码区、第2680-6229位核苷酸为POL基因编码区、第6254-8300位核苷酸为ENV基因编码区。
在本发明的又一个实施方案中,所述新的人源性逆转录病毒全基因组核酸序列为SEQ ID NO.1所编码的序列(GenBank AccessionNo.AF499232),
本发明的又一方面,提供了一种利用基于PCR方法的技术直接从人白血病细胞中分离和克隆该病毒基因组及构成病毒基因组的各种病毒基因(包括结构基因和调节基因)及相应的调控元件序列的方法。
具体地,本领域技术人员知晓,根据本发明所公开的人白血病相关的逆转录病毒全基因组序列(SEQ ID NO.1),可设计多种适用的引物对,以用于通过基于PCR方法的技术,从人白血病细胞中分离和克隆该病毒基因组,及构成病毒基因组的多种病毒基因(包括结构基因和调节基因)及相应的调控元件序列。
在本发明的一个实施方案中,本发明所述方法包括的操作步骤如下1)设计相应PCR引物对;2)从人白血病细胞中提取基因组DNA;3)PCR扩增病毒基因组全长序列或病毒结构基因或调节基因;4)琼脂糖凝胶电泳分离PCR扩增的DNA条带,并纯化PCR产物;5)用T-A克隆试剂盒克隆PCR产物;和6)全自动DNA序列测定仪对所得产物进行测序分析。
本发明的另一方面,提供了一种用于检测生物学样本中是否存在人白血病相关逆转录病毒基因组核酸序列的方法,其特征在于,利用了根据权利要求1所述的逆转录病毒全长基因组所设计的引物。
本发明的再一方面,提供了一种用于分析样本中人白血病相关逆转录病毒基因组表达情况的方法,其特征在于,利用了根据权利要求1所述的逆转录病毒全长基因组所设计的或杂交探针。
在本发明的一个实施方案中,本发明还提供了多种可用作探针的核酸分子,用于检测和分析该病毒基因组转录产物(病毒RNA)在细胞中的表达、分布及其它特性。这种核酸分子可以根据SEQ IDNO.1提供的序列用PCR扩增法、重组法或人工合成的方法获得。
在本发明的又一个实施方案中,如上述本发明提供的多种可用作探针的核酸分子与Southern印迹技术和原位杂交技术相结合,用于分析该病毒基因组在细胞染色体基因组中的定位和分布情况。
本发明的又一方面,提供了一种用于阻抑人白血病相关逆转录病毒的方法,其特征在于,利用了根据如权利要求1所述的逆转录病毒全长基因组设计的反义寡核苷酸片段来封闭该病毒基因组上的活性位点。
本发明的又一方面,提供了如本发明前面所述的逆转录病毒全长基因组用于治疗和/或预防白血病的用途。
具体的,本发明提供的该病毒基因组核酸序列(见SEQ ID NO.1)可以直接用作抗病毒药物靶分子或靶位点。这种药物靶分子或靶位点可以是与病毒基因组核酸序列SEQ ID NO.1中一段或多段互补的反义寡核苷酸或反义RNA分子,包括经过修饰过的反义寡核苷酸如硫代化寡核苷酸和反义RNA。这种反义寡核苷酸和反义RNA分子可以用人工合成方法获得,也可以用重组技术获得。
在本发明的另一方面,还提供一种载体,它包含了该病毒基因组中GAG基因全长表达序列。
在本发明的另一方面,还提供一种载体,它包含了该病毒基因组中ENV基因全长表达序列。
在本发明的一个实施方案中,提供了该病毒基因组序列SEQ IDNO.1,还可以利用其中的一些调控元件和序列,优选为长末端重复序列(LTR),用重组技术设计和构建多种逆转录病毒载体,用于核酸分子克隆、蛋白表达、基因治疗等领域。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人编著的《分子克隆实验手册》中所述的实验条件,或按照试剂或试剂盒制造商提供的实验条件。实施例1 逆转录病毒基因组全长序列的制备应用PCR技术分离和克隆该病毒基因组全长序列。其操作步骤如下1)PCR引物上游引物5′-TGA GAC CAC CAC TTC TCC TGT TGT CCTTCC CA-3′(SEQ ID NO2),下游引物5′-TGT AGC AGG ATG AGT CGC AGA CAA AACTCC TC-3′(SEQ ID NO3)。2)从人白血病细胞中提取基因组DNA,取1μg纯化基因组DNA,加入50μl PCR反应体系中,依次加入上述引物、dNTP、Taq酶、MgCl2、PCR缓冲液等。3)PCR循环参数94℃ 2′;94℃ 20″/62℃ 30″/68℃ 10′×35个循环;68℃延伸7′;4℃保存。4)0.8%琼脂糖凝胶电泳分离8.824kb大小DNA带,用Spin Column纯化PCR产物。5)用T-A克隆试剂盒克隆PCR产物。6)全自动DNA序列测定仪测序分析。实施例2 GAG基因全长序列的制备应用PCR技术分离和克隆该病毒基因组中GAG基因全长序列。其操作步骤如下1)设计PCR引物上游引物5′-ATG TTG AAA AAT TTT AAG AAG GGA TTTAAC-3′(SEQ ID NO4),下游引物5′-CCT GGC CAT AGG CTC TTT GGG GGC CCTTGA-3′(SEQ ID NO5)。2)从人白血病细胞中提取基因组DNA,取1μg纯化基因组DNA,加入50μl PCR反应体系中,依次加入上述引物、dNTP、Taq酶、MgCl2、PCR缓冲液等。3)PCR循环参数94℃ 2′;94℃ 20″/62℃ 30″/72℃ 2′×35个循环;72℃延伸7′;4℃保存。4)1.0%琼脂糖凝胶电泳分离1.6kb大小DNA带,用Spin Column纯化PCR产物。5)用T-A克隆试剂盒克隆PCR产物。6)全自动DNA序列测定仪测序分析。实施例3ENV基因全长序列的制备应用PCR技术分离和克隆该病毒基因组中ENV基因全长序列。其操作步骤如下1)设计PCR引物上游引物5′-ATG AGG AAG CTC ATC GTG GGA TTC ATT TTTC-3′(SEQ ID NO6),下游引物5′-CTA TTT CCC CCC TTT GAG AAT TTT CAC TTTTTA G-3′(SEQ ID NO7)。2)从人白血病细胞中提取基因组DNA,取1μg纯化基因组DNA,加入50μl PCR反应体系中,依次加入上述引物、dNTP、Taq酶、MgCl2、PCR缓冲液等。3)PCR循环参数94℃ 2′;94℃ 20″/62℃ 30″/72℃ 2′×35个循环;72℃延伸7′;4℃。4)1.0%琼脂糖凝胶电泳分离2.0kb大小DNA带,用Spin Column纯化PCR产物。5)用T-A克隆试剂盒克隆PCR产物。6)全自动DNA序列测定仪测序分析。实施例4 Northern杂交技术对本发明所述逆转录病毒基因组在细胞中转录情况的分析利用Northern杂交技术,对本发明所述逆转录病毒基因组在细胞中转录情况加以分析。其操作步骤如下1)目前常用方法(如Trizol法)提取细胞或组织RNA或mRNA;2)用甲醛变性0.8%琼脂糖凝胶电泳将纯化的细胞RNA或mRNA进行分离;3)将步骤(2)凝胶中的RNA转印到尼龙膜上;4)用紫外交联法或80℃烘靠法固定步骤(3)中的RNA;5)根据SEQ ID NO.1提供的序列用PCR扩增法获取该病毒基因组3′端含ENV基因核酸序列;6)制备杂交探针用随机引物法标记步骤(5)中获得的3′端含ENV基因核酸序列,标记物可用同位素32P,也可用非同位素标记法如生物素;7)按目前常用的Northern杂交法用步骤(6)获得的探针与步骤(4)中的尼龙膜进行杂交,洗膜,显影;8)结果分析。
SEQUENCE LISTING<110>养生堂有限公司浙江大学医学院第二附属医院<120>一种新的人白血病相关逆转录病毒基因组核酸序列及其应用<130>IDC020021<160>7<170>PatentIn version 3.1<210>1<211>8824<212>DNA<213>Homo sapiens<400>1ggaatgagac caccacttct cctgttgtcc ttcccagttc ctccccaacc tccccttttc 60cctagtttat aagacaggag aaaagggaga aagcaaaaag ttggaaagaa acagaagtaa 120gataaatagc tagacgacct tggcgccacc acctggccct ggtggttaaa atgataataa 180tattaacccc tgaccaaaac gactggtgtt atctgtaaat cccagacatt gtgtgagaaa 240ggaccgtaaa actttttgtc ctattagctg atgtgtgtag cccccagtca cgttcctcac 300gcttacttga tctattatga ccctttcacg tggacccctt agagttgtaa gctcttaaaa 360gggctaggaa tttctttttc ggggagctcg gctcttaaga cgcgagtctg ccgacgctcc 420cggccgaata aaaacctctt ccttctttaa tccggtgtct gaggagtttt gtctgggact 480catcctgcta catttcttgg ttccctggcc aggaagcaag gtaattgacg gacggtcgag 540gcggcccctt aggcggctta ggcctgccct gtggagcatc cctgcggggg actctggcca 600gcttgagcta cgcagatcct gagagcactc ccgggtaggc aatgctcttg acgggtggaa 660cacctcgtca gagcagtgtg tggcaggccc ccgtggagga tcagcacagt ggctgaagga 720acgggcactt ggagcccgga catctgaaac ttggtaagac tggtctttgg aacttgccca 780ctccatttga gtggaagcat gtcctgatca cccacggtgt gcctgtaccg gcactttggt 840ttttgttttt gacttgactt gaattgcttg atactttggt tttggttttg acctggcttg 900gatttctgga tactctgggt ttggttttga ttctggtttg gtgtaaactg aaaaagtgtg960tgtgtgccct ttttacccat tctttgttct gtggtgtgcg tgcggtgtga gcttggtgtt1020ttgtctcaag gaaacacggg tcagacacaa ggtaagccta ctccgctagg aactatgttg1080aaaaatttta agaagggatt taacggagac tatggggtta ctatgacacc agggaaactt1140agaattttgt gtgaaataga ttggccaaca ttagaagtgg gttggccatc agaaggaagc1200ctggacaggt cccttgtttc taaggtatgg cacaaggtaa ctggtaagtc aggacactca1260gaccagttcc catacataga cacttggtta ctacagctgg tgcaagaccc cccacagtgg1320ctaagagggc aggcagcagc agtgctagta gcaaagggac agatagccaa ggaaggatcc1380cgctctaccc actgggggaa atcaactcct gaagttctgt tcgacccaac atcagaagat1440ccattgcagg agatggcacc agtgatccca gtgctgccct ccccttacca ggcagagagg1500ctccctactt ttgagcccac agtgcttgtg cctccgcaag acaaacatat ccctaggcca1560cccagagtag acaagagagg aggtgaagcc tcaggagaaa cccctccctt ggcagcttgt1620ttaagaccca aaactgggat acaaatgccc ctgagagagc agcggtatac tgggatagag1680gaggatggtc acatggtgga gaagcgtgtt tttgtgtacc agcccttcac ctctgccaac1740cttctcaatt ggaaaaacaa taccctgtcc tatactgaaa aaccacaagc tctaattgat1800ttgctccaaa ctattatcca gacccataac tccactaggg ctgattgcca ccagttgctc1860atgttcctct ttaacacaga tgaaaggcag agagtgctcc aagcagcaac taagtgggta1920caggaacatg caccggctga ttaccaaaac ccccaagagt gtgtaaggac ccagttacca1980ggaactgacc cccagtggga tccaaatgaa agagaggata tgcaaaggct aaaccgagac2040agggaagctg tcttggaagg attaaagagg ggagcccaga aggccacaaa cgttaacaag2100gtctctgagg tcattcgggg aaaagaagaa agtccagcac aattctacca gagactgtgt2160gagggctatc gtatgtatac tccctttgat cccgttagcc ctgaaaatca gcgaatggtt2220aacatggctt tagttagtca aagcgcagaa gacattagaa gaaaactgca gaaacaggat2280gggtttgcag ggacgaacac atcacagtta ttagaagtag ctaaccaggt gtttgtaaac2340agggatgcag taagccctaa ggaaaaccgc agagagaatg aacgtcaggc ccggcgaaac2400gccgagctgt tagctgcagc agtcggaggg gtctcctcaa agaggcaagg gaagggggga 2460cccgggaaag agactcagcc tggctgtcag agcttgcagt gtaaccagtg tgcttattgt 2520aaagaaatag gatattggaa gaacaaatgc ccccagctaa aaggaaaaca aggtgacttg 2580gagcaggagg ttccagacaa ggaggaaggg gccctgctca acctggcaga agagttattg 2640gactgagggg gaccgggctc aagggccccc aaagagccta tggccaggat gacagtcggg 2700ggtaaagaca ttgattttct tgtagatact ggtgctgaac attcggtagt aaccgccccg 2760gtcgccccct tatccaaaaa gactattgac atcatcggag ccatgggggt ttcagcaaaa 2820caagctttct gcttgccccg gacttgtact gtaggaggac ataaagtgat tcatcagttt 2880ttgtatatgc ctgactgtcc cttgcccttg ttgggaaggg acttgcttag caagctgaga 2940gccactatct cttttacaga gcatggctct ttgctgctaa agttacctgg aacgggagtc 3000attatgaccc ttacggtccc ccgagaggag gaatggagac ttttcttaac tgagtcaggc 3060caagagataa gaccagctct ggctaagcgg tggccaagag tgtgggcgga agacaaccct 3120ccagggttgg cagtcaacca agcccccgta cttatagaag ttaagcctgg ggcccagcca 3180gttaggcaaa aacagtaccc ggtccccaga gaagctcttg aaggtattca ggtccctctc 3240aagtgcctaa gaacctttgg aatgatagtt ccttgtcagt ctccatggaa cactcccctc 3300ctgcctgttc ccgagcctaa gaccaaggac tactggccgg gacaggattt gcgcttggtt 3360aagcaggcta cagtgacttt acatccagca gtacctaacc cgtacacatt gctggggttg 3420ctgccagctg aggacagctg cttcacctgc ttggacctga aagatgcttt ctttagcatc 3480agattcgccc ctgagagcca gaagctgttt gcctttcagt gggaagatcc ggagtcaggt 3540gtcactactc agtacacttg gacctggctt cctcaagggt tcaagaactc ccccaccatc 3600ttcggggagg agttggctcg agacctccag aagtgtccca ccagagacct aggctgcgtg 3660ttgctccagt acgttgatga ccttttgctg ggacacccca cggcagtcgg gtgcgccaag 3720ggaacggatg ctctactccg gcatctggag gactgtgggt ataaggtgtc caagaaaaaa 3780gctcagatct gccgaccgca ggtacgttac ttgggattta ctatccgaca gggggagcgc 3840agcctgggat cagaaagaaa gcaggtcatt tgcactctac cggagcctaa gagcagaaag 3900caggtgagaa aattcttagg agctgcgggg ttttgcagac tgtggatccc aaactttgca 3960gtattagcca agcctttgta tgaggtcaca aagtgggggg accgggaacc tttcgaatgg 4020ggatcccaac aacagcaagc ctttcgtgag ttaaaggaaa aacttatgtc agccccagcc 4080ctggggctac ccaatctgac aaagcctttt acattgtatg tgtcagagag agaaaagatg 4140gcagttagag ttttaaccca aactgtgggg ccctggccga ggccagtggc ctacctctct 4200aaacaactag atggggtttc taaaggatgg cccccatgtt tgagggcctt ggcagcaact 4260gccctgctag tacaagaagc agttaagctg actcttgggc aaaacctgaa cataaaggcc 4320ccccatgcta tggtgacttt aataaatact aaaggacatc attggctaac aaatgctaga 4380ctcaccaagt accaaagttt gctctgtgaa aatccccgta taaccattga aatttgtaac 4440accctgaacc ccactacctt gcttctggta tcagagggcc ctgtcgagca tgactgtgta 4500gaagtgttgg actcagttta ctctagcaga cctgacctcc aggaccagcc ttgggcacca 4560gtagactggg aactatacat ggatgggggc agcttcatca acccacaagg agagagaggt 4620gcagggtatg cagtggtaac cctggacact gttgttgaag ccaggtcgtt gccccaggcc 4680acttcagccc agaaagctga actcattgct ttcattcggg ccttagaact cagtgaaggt 4740gagactgtaa acatttacac tgactctcgg tatccctttt taacccttca agtgcatgaa 4800gcatcatata aagaaaaggg cctattgaac tctgggggaa aggacataaa atatcaacaa 4860gaaatcttgc aattattaga agccgtatgg aaaccccaca aggtggcagt tatgcattgc 4920agaggacacc agcgagcttc caccttggtg ggcttgggga attcccgtgc tgacgctcga 4980aaagcagcat ctgccccctt ccgggcatca gtcacagcac ccctgctccc tcaagcgcct 5040gatcttttac ctacttattc taaagaagaa aaggactttc tccaggcaga gggaggacaa 5100gtgatggagg aaggatggat tcggttacca gatgggagag aagctgtgcc acagctgcta 5160ggagccgcag ttgtgctggc tgtgcataaa accacccatc taggccagga gtcacttgaa 5220aagttgttag tccggtattt ctacatettg catttgtcag cccttgccaa aacggtgacg 5280cagcggtgtg ttacctgccc aaagcataat gcgaagcaag gtccagctgt tccgcccgtc 5340atacaagctt atggagcagc cccctttgaa gatgtccagg tggacttcac agagatgcca 5400aagtgtggag gtaacaagta tttactagtt cttgtgtgta cctactctgg tgggtggagg 5460cttatccagc acaaactgag aaagctcgtg aagctaacct gtgtgcttct tcgagatcct 5520attcctagat ttggactgcc cttacggatc ggctcagata atgggccagc atttgtggct 5580gacttggtac agaagagggc aaaggtattg gggaacacat ggaaactgca tgctgcctac 5640cggcctcaga gttccggaaa ggtagagcag atgaattgga ctatcaaaaa tagtaaaggg 5700aaagtatgtc aggaaacagg attaaaatgg atacaggctc tccctatggt attatttaaa 5760attagatgta ccccttctaa aagaacagga tattcccctt atgaaatatt gtatcatagg 5820ccccctccca tattgcgggg acttccaggc actccccgag agttaggtga aattgagtta 5880cagcgacagc tacaggcttt aggaaaaatt acacaaacaa tctcagcctg ggtaaatgag 5940agatgccctg ttagcttatt ctccccagtt caccctttct ccccaggtaa tcgagtgtgg 6000atcaaggact ggaacgtagc ctctttgtgc ccacggtgga aaggacccca gactgtcatc 6060ctgaccactc ccaccgctgt gaaggtagaa ggagtcccag cctggatcca ccacagccgt 6120gtaaaacctg cagtgcctga aacctcagag gtaagaccaa gcccagagga cccttgcaga 6180gtgaccctga agaaaacgac aagccctgct ccagtcacgc ccggaagctg actggtccac 6240gcacggccaa agcatgagga agctcatcgt gggattcatt tttcttacat tttggactta 6300cacagtaagg gcttcaactg accttactca aactggggac tgttcccaga gtattcatca 6360ggtcaccgag gtaggacagc aaattaaaac aaactttctg ttctatagtt attatgaatg 6420tatgggaaca ttaaaagaaa cttgtttgta taatgccact cagtacaagg tatgtagccc 6480aggaaatgac cgacccgatg tgtgttataa cccatctgag ccccctgcaa ccaccgtttt 6540tgaaataaga ttaagaactg gccttttcct aggtgacaca agtaaaataa taactagaac 6600agtagaaaaa ggaatcccca aacaaataac tttaagattt gatgctcgtg cagccattaa 6660tagtaacaag ttaggaacac gatgtggttc tcttaactgg gaaaggagct acacagtaca 6720aaataaatat gtttgtcatg agtcaggggt ttgtgaaaat tgtgcctttt ggccatgtgt 6780tatttgggct acttggaaaa agaacaaaaa ggaccctgtt catcttcaga agggggaagc 6840caacccctcc tgtgctgccg gtcactgtaa cccactagaa ctaataatta ccaatcccct 6900agatcctcct tggaaaaagg gagaacgtgt aaccctgggg atcgatggga cagggttaaa 6960cccccaagtt gccattttag ttagagggga agtccacaag cgctctccca aaccagtgtt 7020tcaaaccttt tatgaggagc tgaatctgcc agcaccagaa cttccgaaaa agacaaaaag 7080tttgtttctc caattagcag gaaatgtagc tcattcactt aatgttactt cctgttatgt 7140atgcagggga accactatcg gagaccgatg gccttgggaa gcccgagagt tggtgcctac 7200tgatccagct cctgatataa ttccagttca gaaggcccaa gctagcaact tctgggtcct 7260aaaaacctca attattggac aatactgtat agctagagaa gggaaagaat ttatcgtccc 7320tgtaggaaag cttaattgta taggacagaa gttgtacaac agcacaacaa agacaattac 7380ttggtggggc ctaaaccaca ctgaaaagaa cccatttagt aaattttcta aattaaaaac 7440tgcctgggct catccagaat ctcatcagga ctggacggct cccaccggac tataccggat 7500atgtgggcac acagcctaca ttcagttacc taataaatgg gcaggcagtt gtgttattgg 7560cactattaag ctgtcctttt tcttattacc cataaaaacg ggtgagctcc taggtttccg 7620tgtctatacc tcccgagaaa agagaggcat agttatagga aactggaaag ataatgagtg 7680gccccctgaa aggatcatac aatattatgg gcctgccaca tgggtacaag acggctcatg 7740gggataccaa acccccatct acatgctcaa tcagatcata cggttgcaga ccgtcttaga 7800aataattact aatgaaactg gcagagcttt gactgtttta gctcggcagg aaacccaaat 7860gaggaatgct atctatcaga atagactggc cttggactac ttgctggcag ctgaaggagg 7920agtttgtgga aaatttaact taaccaattg ctgcctacaa atagatgatc aaggacaggt 7980gattgaaaac atagtcaggg acatgacaaa gttggcacac acgcctatac aggtttggca 8040caagtttgat cctgagtctt tatttggaaa atggtttcca gctataggag gatttaaaac 8100cctcattgta ggtgtattgc tagtaataag aacttgcttg ctgctcccct gtgtattacc 8160cttgcttttt caaatgataa aaggtattgt tgctactttg gttcatcaga aaacttcagc 8220acacgtgaat tatatgaatc actatcgctc tatctcgcaa agagactcaa aaagtgagga 8280tgagagtgag aactcccact aaaaagtgaa aattctcaaa ggggggaaat agggaatgag 8340accaccactt ctcctgttgt ccttcccagc ttctccccaa cctccccttt tccctagttt 8400ataagacggg agaaaaggga gaaagcaaaa agctggaaag aaacagaagt aagataaata 8460gctagacgac cttggcgcca ccacctggcc ctggtggtta gaatgataat aatattaacc 8520cctgaccaaa acgactggtg ttatccgtaa attccagaca ttgtgtgaga aagcaccgta 8580aaactttttg tcctgttagc tgatgtgtgt agcccccagt cacgttcctc acgcttactt 8640gatctattat gaccctttca cgtggacccc ttagagttgt aagctcttaa aagggctagg 8700agtttctttc tcggggagct cggctcttaa gacgcgagtc tgctgacgct cccggccgaa 8760taaaaacctc ttccttcttt aatctggtgt ctgaggagtt ttgtctgcga ctcatcctgc 8820taca8824<210>2<211>32<212>DNA<213>Artificial<400>2tgagaccacc acttctcctg ttgtccttcc ca 32<210>3<211>32<212>DNA<213>Artificial<400>3tgtagcagga tgagtcgcag acaaaactcc tc 32<210>4<211>30<212>DNA<213>Artificial<400>4atgttgaaaa attttaagaa gggatttaac30<210>5<211>30<212>DNA<213>Artificial<400>5cctggccata ggctctttgg gggcccttga 30<210>6<211>31<212>DNA<213>Artificial<400>6atgaggaagc tcatcgtggg attcattttt c31<210>7<211>34<212>DNA<213>Artificial<400>7ctatttcccc cctttgagaa ttttcacttt ttag 3权利要求
1.一种分离的人白血病相关逆转录病毒全长基因组,其特征在于,其基因组结构组成从5′端到3′端依次包含5′端长末端重复序列(5′LTR)、5′端非编码区(UTR)、GAG基因编码区、POL基因编码区、ENV基因编码区和3′端长末端重复序(3′LTR)。
2.如权利要求1所述的逆转录病毒全长基因组,其特征在于,所述5′LTR和3′LTR核苷酸组成完全一致,其中5′LTR具有SEQ IDNO1中第1-492位核苷酸编码的序列,3′LTR具有SEQ ID NO1中第8333-8824位核苷酸编码的序列;所述5′端非编码区(UTR)具有SEQ ID NO1中第493-1074位核苷酸编码的序列;所述GA G基因编码区具有SEQ ID NO1中第1075-2644位核苷酸编码的序列;所述POL基因编码区具有SEQ ID NO1中第2680-6229位核苷酸编码的序列;ENV基因编码区具有SEQ ID NO1中第6254-8300位核苷酸编码的序列。
3.如权利要求1所述的逆转录病毒全长基因组,其特征在于,所述长末端重复序列为与SEQ ID NO.1中的长末端重复序列同源性在95%以上的变体或其衍生物;所述5′端非编码区(UTR)序列为与SEQ ID NO.1中的5′端非编码区核苷酸同源性在95%以上的变体或其衍生物;所述GAG基因编码区为与SEQ ID NO.1核苷酸序列中所述编码具有GAG病毒蛋白和多肽的核苷酸序列其同源性在95%以上的变体或衍生物;所述POL基因编码区为与SEQ ID NO.1核苷酸序列中所述的编码具有POL病毒蛋白和多肽的核苷酸序列同源性在95%以上的变体或衍生物;所述ENV基因编码区为与SEQ IDNO.1核苷酸序列中所述的编码具有ENV病毒蛋白和多肽的核苷酸序列同源性在95%以上的变体或衍生物;优选的,所述逆转录病毒全长基因组为与SEQ ID NO.1核苷酸序列同源性在95%以上的具有相同或相似生物学功能或活性的变体或其衍生物。
4.一种用于检测生物学样本中是否存在人白血病相关逆转录病毒基因组核酸序列以及分析样本中人白血病相关逆转录病毒基因组表达情况的方法,其特征在于,利用了根据权利要求1所述的逆转录病毒全长基因组所设计的引物或杂交探针。
5.一种用于阻抑人白血病相关逆转录病毒的方法,其特征在于,利用了根据如权利要求1所述的逆转录病毒全长基因组设计的反义寡核苷酸片段来封闭该病毒基因组上的活性位点。
6.如权利要求1所述的逆转录病毒全长基因组用于治疗和/或预防白血病的用途。
全文摘要
本发明涉及一种新的逆转录病毒基因组核酸序列,其基因组结构组成从5′端到3′端依次包含5′端长末端重复序列(5′LTR)、5′端非编码区(UTR)、GAG基因编码区、POL基因编码区、ENV基因编码区和3′端长末端重复序(3′LTR)。本发明还提供了用于检测生物学样本中是否存在人白血病相关逆转录病毒基因组核酸序列以及分析样本中人白血病相关逆转录病毒基因组表达情况的方法;以及用于阻抑人白血病相关逆转录病毒的方法。本发明还涉及本发明所述逆转录病毒基因组核酸序列用于鉴别、治疗和/或预防人白血病的用途。
文档编号C12N15/11GK1461806SQ0212179
公开日2003年12月17日 申请日期2002年5月31日 优先权日2002年5月31日
发明者徐荣臻, 郑树, 钟睒睒 申请人:浙江养生堂天然药物研究所有限公司, 浙江大学医学院附属第二医院