本发明属于生物信息学及分子细胞遗传学领域,具体而言,涉及一种毛果杨(populustrichocarpa)着丝粒特异的line型反转录转座子序列及其应用。
背景技术:
着丝粒是真核生物细胞有丝分裂和减数分裂时,保障染色体稳定并正确分离的一个重要功能元件,由所在区域的染色体dna和多种蛋白质分子组成。着丝粒区dna通常包含两类高丰度的重复序列:着丝粒特异的卫星dna重复序列和反转录转座子序列(gongetal.,2012;zhangetal.,2014;zhuetal.,2016;lietal.,2018)。反转录转座子由于具有在基因组中转座和复制的模式,所以在进化过程中成为真核生物基因组中分布最多的一类dna,通常占植物细胞核基因组的50%以上(leeetal.,2005)。
反转录转座子根据序列完整性而分为自主型和非自主型两类,自主型反转录转座子又可分为ty1/copia和ty3/gypsy两种类型,非自主型反转录转座子可分为长散在元件(longinterspersedelement,line)和短散在元件(shortinterspersedelement,sine)。ty3/gypsy是着丝粒特异的一类反转录转座子家族(centromericretrotransposonfamily)(jiangetal.,2003),禾本科植物着丝粒反转录转座子的衍生序列中大多数与ty3/gypsy类反转录转座子在系统进化上具有高度保守性(langdonetal.,2000)。
杨树由于其自身的生物学特性及重要地位而成为林木研究的模式树种。尽管早在2006年,美国科学杂志就报道了毛果杨的全基因组测序结果(tuskanetal.,2006),胡杨、新疆杨的基因组测序结果也相继发表(maetal.,2013;maetal.,2019),由于着丝粒区dna含有大量的高度重复序列,这加大了着丝粒区序列组装的难度,目前对杨树着丝粒区的序列信息还知之甚少。因此,开展杨树着丝粒dna序列研究,不仅可以发掘杨树着丝粒区的典型重复序列,探究其进化模式及意义,并为杨树的分子细胞遗传学研究奠定基础,同时也能完善杨树基因组信息。鉴于此,特提出本发明。
主要参考文献:
gongz,wuy,
jiangj,birchkerja,parrottwa,etal.amolecularviewofplantcentromeres.trendsinplantscience,2003,8(12):570-575.
langdont,seagoc,mendem,etal.retrotransposonevolutionindiverseplantgnomes.genetics,2000,156(1):313-325.
leehr,zhangw,langdont,etal.chromatinimmunoprecipitationcloningrevealsrapidevolutionarypattemsofcentromericdnainoryzaspecies.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica,2005,102(33):11793-11798.
liy,zuos,zhangz,etal.centromericdnacharacterizationinthemodelgrassbrachypodiumdistachyonprovidesinsightsontheevolutionofthegenus.plantjoumal,2018,93(6):1088-1101.
mat,wangjy,zhougk,etal.genomicinsightsintosaltadaptationinadesertpoplar.naturecommunications,2013,4:2797.
majc,wands,duanbb,etal.genomesequenceandgenetictransformationofawidelydistributedandcultivatedpoplar.plantbiotechnologyjournal,2019,17(2):451-460.
tuskanga,difazios,janssons,etal.thegenomeofblackcottonwood,populustrichocarpa(torr.&gray).science,2006,313(5793):1596-1604.
zhangh,koblizkovaa,wangk,etal.boom-bustturnoversofmegabase-sizedcentromericdnainsolanumspecies:rapidevolutionofdnasequencesassociatedwithcentromeres.plantcell,2014,26(4),1436-1447.
zhuz,guis,jinj,etal.thenncenh3proteinandcentromericdnasequenceprofilesofnelumbonuciferagaertn.(sacredlotus)revealthednastructuresanddynamicsofcentromeresinbasaleudicots.plantjournal,2016,87(6),568-582.。
技术实现要素:
针对现有技术存在的上述问题,本发明所要解决的技术问题在于提供一种毛果杨着丝粒特异的line型反转录转座子序列。本发明所要解决的另一技术问题在于提供所述毛果杨着丝粒特异的line型反转录转座子序列的应用。
为了解决上述技术问题,本发明所采用的技术方案如下:
一种毛果杨着丝粒特异的line型反转录转座子序列,其核苷酸序列如seqidno.1所示。
所述的毛果杨着丝粒特异的line型反转录转座子序列在构建杨树核型图中标记杨树着丝粒的应用。
所述的应用中,所述的杨树为毛果杨、小叶杨、美洲黑杨、胡杨或大叶杨。
扩增所述的毛果杨着丝粒特异的line型反转录转座子序列的引物对:
f:5′-ttagggaaaccaatacaaccag-3′,
r:5′-acgaggcagtcaaatcagaagt-3′。
相比于现有技术,本发明的有益效果为:
本发明通过对毛果杨着丝粒dna高通量测序数据的生物信息学分析,筛选出一种着丝粒特异的line型反转录转座子序列。依据该序列设计引物,以毛果杨基因组dna为模板,经pcr扩增、切胶回收获得目的片段。通过探针标记、染色体制片、荧光原位杂交验证了该序列位于着丝粒区。本发明提供的着丝粒特异的line型反转录转座子序列不仅可以准确标记杨树着丝粒的位置,以构建高质量核型图,也为开展杨树着丝粒的结构、功能及进化研究奠定基础,在杨树分子细胞遗传学及基因组学研究领域具有广阔的应用前景。
附图说明
图1为毛果杨着丝粒特异的line型反转录转座子pcr扩增产物的琼脂糖凝胶电泳图;左侧泳道为dnamarker,右侧泳道为pcr产物电泳的结果;
图2为毛果杨中期染色体荧光原位杂交结果,红色为毛果杨着丝粒特异的line型反转录转座子序列的信号,可见该序列特异的位于每条染色体的着丝粒位置。
具体实施方式
下面结合具体实施例对本发明进一步进行描述。实施例中没有注明的温度均为室温,没有注明的试剂均为常规化学试剂。
实施例1:着丝粒line型反转录转座子的发掘
(1)利用杨树着丝粒特异抗体进行染色质免疫共沉淀(chip),富集毛果杨的着丝粒dna。分别构建chipdna和inputdna的文库。
(2)基于illuminahiseq2000测序平台,采用125bp双末端测序技术对建库dna测序,获得毛果杨着丝粒的chip-seq数据以及input-seq数据。
(3)对质控后的数据利用repeatexplorer分析平台进行毛果杨着丝粒重复序列发掘,先从inputreads中随机选取5百万条reads,将其上传到分析平台,通过序列相似性进行聚类分析得到基因组的重复序列clusters。然后利用blast比对工具,再将chip-seq数据和input数据分别比对到clusters上,计算chip/input的比值。根据比值的大小判断重复序列在着丝粒区域的富集程度。
(5)数据分析结果显示:共有9个cluster的chip/input的数值大于9,对这9个cluster的类型进行分析时发现,cluster45属于line类型逆转子,这类逆转座子在着丝粒中鲜有报道,序列信息如seqidno.1所示。
实施例2:着丝粒特异的line型反转录转座子序列扩增及探针标记
(1)收集毛果杨的幼嫩叶片,分别在液氮中研磨成粉末,依据植物总dna提取试剂盒(tiangendp320)中的说明书提取各样品的dna,使用nanodrop1000(美国)对提取的dna质量及浓度进行测定。
(2)使用primerpremier5软件对着丝粒特异的line型反转录转座子序列设计引物,根据引物的分值我们选择了分值较高的2对引物委托南京擎科生物技术有限公司合成,以毛果杨基因组总dna为模板,通过pcr体系优化,凝胶电泳后观测目标条带,发现引物对f:5′-ttagggaaaccaatacaaccag-3′和r:5′-acgaggcagtcaaatcagaagt-3′可以在毛果杨基因组总dna中扩增出目标条带(图1)。
pcr反应体系为50μl,其中包含25μlpremixtaqtm(takararr902),正向和反向引物各0.4μm,模板dna55ng,ddh2o补至50μl。pcr反应程序为:94℃预变性3min;94℃变性30s,58℃退火30s,72℃延伸2min30s,32个循环;72℃延伸10min。
将pcr反应扩增产物,采用1%琼脂糖凝胶电泳,使用凝胶成像系统拍照检测。图1左侧泳道为dnamarker,右侧泳道为pcr产物电泳的结果,可见在毛果杨基因组总dna中扩增出特异的2500bp左右的目标条带(图1)。
(3)根据胶回收试剂盒(qiagen28704)中的说明书对目标条带进行切胶回收,使用nanodrop1000(美国)对回收的dna质量及浓度进行测定,采用缺刻平移法将回收的dna用地高辛标记成探针。
实施例3:荧光原位杂交(fish)验证
(1)染色体制片
1)取材:晴天上午收集长约5mm的毛果杨幼嫩根尖;
2)预处理:将根尖放入0.7mm的环己酰胺中25℃处理3h;
3)固定:将根尖转移至卡诺固定液中(无水乙醇与冰乙酸体积比3∶1)室温固定24h以上;
4)酶解:将固定好的根尖置于纯水中彻底冲洗干净,然后切取根尖分生组织,并放入4%纤维素酶和2%果胶酶的混合酶液中,37℃的培养箱中酶解1h;
5)涂片法制片:先将根尖分生组织转移到纯水中,再从纯水中转移至载玻片上,接着用镊子轻轻挤压出根尖分生组织细胞,滴加20μl60%的乙酸,用解剖针混合搅匀。将载玻片置于温度为55℃的烤片机(hi1220,leica)上,用解剖针涂抹,然后立即用新鲜的卡诺固定液冲洗并气干。在相差显微镜下选择有良好分裂相的制片,-20℃保存备用。
(2)制片变性及杂交
1)将制片加100μl70%dfa,放置在85℃变性3min;
2)将制片立即用70%,90%,100%的冰乙醇逐级脱水,每级5min;
3)晾干备用;
4)每张制片配制20μl杂交液,杂交液组成为:10μldfa+2μl20×ssc+4μl50%ds+2μl探针+2μlddh2o;
5)探针加到制片上,盖好盖玻片,放入湿盒,37℃杂交过夜。
(3)抗体检测
将杂交过夜的制片按照如下步骤清洗、抗体孵育、dapi套染,从第(4)步加入抗体开始需要避光操作。
1)2×ssc泡掉盖玻片,并用2×ssc洗制片5min;
2)42℃的2×ssc洗制片20min;
3)1×tnt洗制片5min;
4)每张制片配制二抗孵育液约100μl,37℃在湿盒中孵育1h,二抗孵育液组成为:100μl1×tnb+1μlami-digoxigeninrhodamine(roche,11207750910);
5)1×tnt洗制片三次,每次5min;
6)1×pbs洗制片5min;
7)纯水洗制片1min;
8)晾干后,每张制片加20μl含有dapi的vectashield(vectorlabs,h-1200)胶封片。
(4)镜检并拍照
在olympusbx51型荧光显微镜下观察制片,选择理想的分裂相拍照。图2为毛果杨中期染色体的荧光原位杂交结果,红色为着丝粒特异的line型反转录转座子序列的信号,可见该序列特异的位于每条染色体的着丝粒位置(图2)。
为了进一步验证毛果杨着丝粒line型反转录转座子序列的适用性,我们在小叶杨(青杨派)、美洲黑杨(黑杨派)、胡杨(胡杨派)及大叶杨(大叶杨派)中进行了fish实验,结果表明:本发明提供的着丝粒特异的line型反转录转座子序列可以准确标记小叶杨、美洲黑杨、胡杨及大叶杨着丝粒的位置,为杨树高质量核型图谱构建,杨树着丝粒的结构、功能及进化研究奠定了基础,在杨树分子细胞遗传学及基因组学研究领域具有广阔的应用前景。
序列表
<110>南京林业大学
南京农业大学
<120>一种毛果杨着丝粒特异的line型反转录转座子序列及其应用
<130>100
<160>3
<170>siposequencelisting1.0
<210>1
<211>2816
<212>dna
<213>populustrichocarpa
<400>1
ttttgtatcaggccgtaccctttttttttttttggtaagttgacgtatgtattaaaagaa60
gaagatacaaacattataaggggcataccccagatttacaatgataacagaaacataaaa120
caacagatggctacaggctagccaccgaccgtaaaactgaaacctcactagattcgttag180
ggaaaccaatacaaccagctaactaacagattaagaatctatggtattcaccctccaagc240
tcgttggatccttgtgttttcatttgttggtacgacattcctcatcaaatcaagcttatc300
acgaatgatacattcgatttgattaaggaccaaattcggagttctagacattccagcaaa360
gatccttgcattccgttcttgccatacatgatacactgtagctgcaaaactcagtttacg420
agaaaaattgacgaaactcttgccatgccaagagacagtggcccatcgaatccattcatc480
ccagccttttgtcattcttggaatgtcgcatctgtcacaaacatcccaccagatcgcttt540
agtataggagcattcaaagaacaagtggttgtgatcctcattgttgcggagacagagtga600
gcatctattgggaccatgtataccaaaccgatgaagtttatcttgagttgtgagtttctg660
ttggacagccatccatagaagaaatgaatgtcttggaacagcattcttgaaccacacaat720
gtcatgccattcaaccatctgacgatgacgtcttagttgttcccaagctactttgaccga780
gaatctgtgatttggcgaatccaaccaaactatctcatccttttgccccatcttaggatt840
agaattggaaggaatagcttctataatggggtgccagccaatagcttgggtggtaggagt900
tttccattctgagttctgaattagcacattcaccttcgcgttcttggccatacctgaatc960
atagatgaatctttccccgtaagaatccgcgagtgggctgtgaggatgccaattatcaaa1020
ccatagagaggttgtcattccatctcctatgatgtacttcatcttcggccatgctaagga1080
tctgagctttagaatctttccccaagcccaagagcaattctgtggcgtcttgattgtcca1140
gaaattcctacctcgcaacagattggatctgatccaagtagaccatattgagccatctga1200
gtcattgcacaggttccaaatgtgtttcaacaaagcaatcttgttccattctgttatcct1260
ttttattcctagccccccctccttttttggaagacatacctgatcccaagccactttagc1320
cccagtagttctcatatctgaacctgaccaaagaaaggatttcataatttgctccacatt1380
tttaattacttgcccaggtaagagaaagagagatgcccaatagacctgtatggaaaataa1440
gactgaattaatcagttgtacccgtcctgcatacgagagtgttctacaagtccaatgtcg1500
aactttagaggtgattcgatccacgaggcccttacaataaatagcctttagtctggacga1560
gagaagaggtactcccaaatatttcatagggagctccccctctctaaacccaagaatatg1620
aataatttgttccctctcagcatttaacacaccgctcaagaagatgtcacttttgtttgg1680
atttggatacagacctgatagatcttgaaactttgtgagcacagttctgatcatacgaat1740
tgagtttacatccccgttgctaaaaatcatcaagtcatcagcaaaacaaagatgagaaat1800
tttgtccttcttgcatctccagtggaacttgaattcttggttggcactcatcttgcagaa1860
tagccccgacaggatttccatacataggacaaacaaatatggggacaatggatccccttg1920
tctcagccctcttcccccttgaaagtaacctgcaagctcaccattgacgttgatagagaa1980
ttgacatgatgtaacacaaaccatgatccaatcaatgactgttctagggaatcccatttt2040
tattaacatagcgtcaacgaaatcccaccgcaccgagtcataagccttcatcagatcaac2100
tttcatagcacaacgagcaggtcccgtagatttatgatagcctttcattagttcctgaga2160
caaaagaatgttatcactgattctccgtcctgagataaaagcagtctgatatggaccaac2220
taaggatggcaaaacaactttgattctcccagctagaatcttagcgatgcatttgtacac2280
tgtattgcagcaagatataggacgaaaatctgtcaaccttgtaggattagcaactttagg2340
aataagggaaatggatgtagcattcatttctttaagcattctacgagtctgaaagaagga2400
tctaacagcgttgattacatcttccccaactatgtgccacattcttttgaagaaacctgc2460
gttaaagccatccggaccaggggctttgttgttcttcaaactaaacatagcatgcttaat2520
ctcctcccttgttacatcttgtgcgagtacatgctgttgcgttgaagacagtttcaagtt2580
aattgccgattccatcacttcctcgttcagaaccctaggcatctgatcaactcctaacac2640
acgatggaagtatgcaattacttctgatttgactgcctcgtgtccttcgacaacctctcc2700
atcctcccttgtaagtgatagaagcttatttctattctgtcttccatttactgatttgtg2760
aaagtagctagtattctgatcccccaagctaagccattgtatccttgccttctgtt2816
<210>2
<211>22
<212>dna
<213>f(artificial)
<400>2
ttagggaaaccaatacaaccag22
<210>3
<211>22
<212>dna
<213>r(artificial)
<400>3
acgaggcagtcaaatcagaagt22