本发明属于生物技术领域,尤其涉及一种调控番茄果实颜色的基因、snp、分子标记及应用。
背景技术:
条斑表型是自然界植物中的一种常见现象,例如在蝴蝶、玉米、苹果、西瓜和花卉中。但是现有技术中对造成这种色彩差异分布的机理研究很少。目前科学家们对色彩差异分布的机理主要归功于功能基因突变、rna沉默、转座子跳跃和基因启动子甲基化。拟南芥突变体(immutans)(aluruetal.,2007)和番茄突变体(ghost)(shahbazietal.,2007)中质体末端氧化酶的基因突变导致杂色叶的产生。通过干扰花青素生物合成途径中查尔酮合酶(chs)可以获得多彩斑斓的花朵(nakatsukaetal.,2007;moritaetal.,2012)。玉米中ac/ds转座子跳跃使玉米籽粒呈斑点表型,这个玉米的转座系统理论获得1983的诺贝尔生理学奖(ravindran,2012)。大丽花花瓣橘红色的杂色是由于dvivs基因中转座子的插入造成的(ohnoetal.,2011)。最近的研究表明,基因启动子甲基化也是果实着色多样化的原因。苹果表皮myb10基因启动子甲基化差异直接导致myb10基因表皮差异性表达,进而差异化花色苷生物合成相关的基因的表达,最终导致花青苷在苹果表面差异化积累形成黄条纹和红条纹(teliasetal.,2011)。同样的,梨表皮的斑点和斑纹也是由于myb10基因启动子甲基化差异造成的(qianetal.,2014)。至今,除了玉米籽粒杂色形成的ac/ds转座系统理论外,植物杂色形成的内在遗传机制仍是未知的。
dna甲基化是一种重要的表观遗传修饰,调控基因的表达进而影响植物的发育(choi&sano,2007;wangetal.,2013)。rna介导dna甲基化(rddm)是一种重要的小rna参与的表观修饰。在细胞核中,小rna以同源序列匹配的方式靶向基因组区域并诱导表观遗传修饰,例如胞嘧啶甲基化和组蛋白甲基化(matzke&mosher,2014)。通过对玉米抗旱性的全基因组关联分析,发现zmnac111基因启动子82-bpmite的插入与玉米抗旱性显著相关,此mite可以产生sirna通过rddm途径影响zmnac111基因的表达(maoetal.,2015)。番茄成熟延迟突变体cnr是由于sbp-box基因启动子高度甲基化,但甲基化潜在的机理尚未清楚(manningetal.,2006)。利用crispr/cas9系统敲除番茄中sldml2基因(拟南芥中ros1的同源基因),获得的突变体中tagl1甲基化水平升高,最终延迟了番茄果实成熟(langetal.,2017)。综上,dna甲基化在植物生长发育中扮演重要的角色。
编码mads-box转录因子的tagl1基因调节果实的器官发生和发育。通过rnai技术抑制番茄tagl1的表达,可以使转基因番茄果皮变薄(vrebalovetal.,2009)。在tagl1–srdx超量转基因番茄中,乙烯含量下降,叶绿素含量增加,果实成熟延迟。tagl1被认为可以结合acs2(乙烯合成途径中的限速酶)基因的启动子,并激活acs2的表达。tagl1超量系的萼片可以积累番茄红素(itkinetal.,2009)。利用rnai获得的tagl1干涉系的果实表现为薄的角质层和薄而坚硬的表皮,同时,在tagl1干涉系中角质中组分含量显著性下调,相反,tagl1超量系果实的角质厚度增加而且组分也发生的改变(gimenezetal.,2015)。tagl1也调控果实的营养成分。利用vigs沉默tagl1的果实中,氨基酸和有机酸的含量下调(zhaoetal.,2018)。tagl1通过细胞分裂,赤霉素代谢和生长素信号转导的基因表达,使番茄适应盐胁迫(ribellesetal.,2019)。
番茄(solanumlycopersicum)是一种重要的蔬菜作物,为全球消费者提供丰富的营养物质。果实色泽作为番茄果实一种重要的感观品质,直接影响果实的商品性。在番茄常规育种中,条斑番茄是自然发生的突变体,类似于“家传宝”番茄,具有独特而迷人的果实颜色。番茄果实表面在特定情况下不均匀着色表明其具有复杂而精细的调控。果实表面多样的着色方式引起育种家注意,更有意义的是,这种多彩斑斓的果实能吸引鸟类取食,反而有利于种质传播。番茄全基因组测序及不同番茄品种简化基因组数据可以共享(http://solgenomics.net/),全基因组关联技术和图位克隆技术在很多物种得到应用。
技术实现要素:
针对现有技术存在的问题,本发明提供了一种调控番茄果实颜色的基因、snp、分子标记及应用,目的在于解决现有技术中的一部分问题或至少缓解现有技术中的一部分问题。
本发明利用全基因组关联分析和图位克隆技术获得调控番茄条斑形成的基因gs,该基因在果实表皮浅绿条斑和绿条斑中差异表达是产生条斑的原因。利用转基因技术验证了gs调控番茄条斑的形成。
本发明是这样实现的,一种调控番茄果实颜色的基因,其特征在于:所述基因为gs基因,序列见ncbi登录号:nm_001313930或ncbi登录号:np_001300859。
进一步地,所述gs基因调控番茄叶绿素差异化积累。
进一步地,所述gs基因调控番茄条斑形成。
一种番茄果实颜色相关的snp,所述snp标记为sl2.50ch07_63842838。
针对上述的snp开发的分子标记,正向引物序列:5′-gtctctatttttttttgggcatctttgcagctagtaaatttttctctctcttccgaatt-3′,反向引物序列:5'-actgagtaactccctctagtcagaaaga-3'。
一种番茄果实颜色性状检测方法,以上述的分子标记对番茄基因组进行pcr扩增,扩增产物利用ecori酶切;若酶切能够产生59bp和355bp两个片段,则为条斑性状样品;若不能被酶切,则为非条斑性状样品。
进一步地,所述检测方法能够条斑性状进行检测。
进一步地,所述pcr扩增的体系(20μl)为:10×taqbuffer2μl,dntps0.4μl,fw引物0.5μl,rv引物0.5μl,dna模板1μl,taq酶0.1μl,ddh2o15.5μl。所述pcr扩增的程序为94℃预变性3min,94℃变性30s,56℃退火30s,72℃延伸1min,进行36个循环,72℃延伸10min,4℃保存10min。
进一步地,所述ecori酶切条件为:pcr产物在37℃下通过ecori(thermoscientific)酶切2h,酶切体系为10μl:5μlpcr产物,1μl10×bufferecori,0.3μlecori(10units/ml),补ddh2o。
如上述的gs基因或snp在调控番茄叶绿素含量中的应用。
如上述的gs基因或snp在调控番茄育种中的应用。
如上述的gs基因或snp在调控番茄条斑性状中的应用。
综上所述,本发明的优点及积极效果为:
本申请中通过对515份番茄重测序材料进行全基因组关联分析,定位到一个控制番茄条斑形成的qtl,构建f2连锁群体进行图位克隆,进一步确定候选基因gs。通过生物信息学、遗传学和分子生物学解析gs启动子甲基化差异是叶绿素和类胡萝卜素在番茄不均匀分布的原因,解析了gs调控果实颜色形成的机理。该发明中解析的果实条斑机制将为番茄品质遗传改良奠定基础。
本发明通过条斑突变体gs与m82(果实表面颜色均匀)构建f2分离群体,针对条斑性状进行图位克隆,最后通过表达分析、测序分析和转基因技术确定调控番茄条斑形成的基因gs,gs基因的序列见ncbi登录号:nm_001313930或ncbi登录号:np_001300859,属于mads-box转录因子家族基因。gs第二内含子中的snp(sl2.50ch07_63842838)与番茄核心种质和商业材料的条斑表型完全连锁,该snp影响gs第二内含子中可以转录出的长链非编码rna二级结构,同时小ran测序表明来源于gs第二内含子mite中的小干扰rna(sirna)在绿条斑的表达量高于浅绿条斑中的表达,本发明解析了此snp通过影响rddm途径来影响gs启动子的甲基化,进而促使gs在果实表面的差异性表达。针对条斑番茄内含子中保守的snp(sl2.50ch07_63842838),本发明开发了基因标记用于番茄育种中的辅助选择。
附图说明
图1是条斑突变体gs的表型;
图2是在不同发育阶段gs果实的表型;
图3是通过gwas结合bsa技术克隆gs;
图4是不同番茄品种snp1和snp2的分布情况;
图5是gs的结构特征及亚细胞定位;
图6是gs在条斑突变体gs中功能验证;
图7是gs的超量系和gs的红熟果实的表型;
图8是gs的特殊表达模式;
图9是在gs中浅绿条斑和绿条斑的gs启动子甲基化差异性检测;
图10是浅绿条斑和绿条斑中rna-seq分析;
图11是gs调控叶绿体发育相关基因的表达;
图12是在红条斑和黄条斑中gs和psy1的相对表达量;
图13是针对gs第二内含子中保守snp1(sl2.50ch07_63842838)开发的共显性dcaps标记及其在番茄商业品种中的应用。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明,各实施例及试验例中所用的设备和试剂如无特殊说明,均可从商业途径得到。此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明披露了一种调控番茄果实颜色的基因、snp、分子标记及应用,具体如下各实施例所示。本发明涉及的番茄材料:本实验室收集的515份番茄核心种质资源、条斑突变体gs、la3530、7份条斑表型的商业番茄品种。
条斑突变体gs的表型见图1所示,其中(a)绿条斑和浅绿条斑在gs绿熟期果实的表面随机分布,红条斑和绿条斑在在gs红熟期果实的表面随机分布。mg,绿熟期;rr,红熟期;lgs,浅绿条斑;gs,绿条斑;rs,红条斑;ys,黄条斑;(b)果肉和上表皮从m82和gs的绿熟期果实分割;(c)利用共聚焦荧光显微镜观察浅绿条斑和绿条斑的叶绿素荧光,叶绿素自发荧光呈红色;(d)通过透射电子显微镜观察细胞和叶绿体的显微结构,chl代表叶绿体,cw代表细胞壁;(e)在透射电子显微镜视野中,每个细胞中叶绿体的数量;(f)是分别在m82和gs的果肉、m82和gs的上果皮、绿条斑和浅绿条斑中叶绿素含量测定;(g)是在透射电子显微镜下,有色体的结构和质体小球的大小及密度的观察,p代表质体小球,ce代表有色体包膜;(h)是在透射电子显微镜视野中,每个有色体中质体小球的数量;(i)利用色差仪测定条斑果实红条斑和黄条斑的色差值a*和b*。不同发育阶段gs果实的表型见图2所示。
本发明中涉及的gs基因组序列(gdna)见seqidno.1;cdna序列见seqidno.2;cds序列见seqidno.3;氨基酸序列见seqidno.4;启动子序列(atg上游5kb)见seqidno.5。
实施例1控制条斑性状基因的定位
本发明利用515份番茄核心种质(包括7份果实呈条斑的番茄品种)重测序开发了9349975个高质量snp,对番茄条斑表型进行关联分析,gwas使用emmax软件中的混合线性模型完成,本发明使用的参考基因组参考sl2.50(http://solgenomics.net/)。最显著性的snp(t/c)是sl2.50ch07_63842838(p=2.672960472e-256),落在了gs第二内含子中(见图3b,i)。
图3是通过gwas结合bsa技术克隆gs的相关结果,其中(a)核心种质资源中7份番茄品种呈现条斑表型。(b)番茄条斑表型全基因组关联马哈顿图,采用混合线性模型的方法,最高的snp在sl2.50ch07_63842838(p=2.672960472e-256)。(c)呈现绿条斑的品种在核心种质资源中所占的比例及在sl2.50ch07_63842838位置的基因型。(d)m82与gs构建f2群体,杂交f1代的果实呈现均匀颜色。(e)f2群体中30棵果实呈均匀表型的dna池与30棵果实呈绿条斑表型的dna池的等位基因频率差异。x轴代表番茄的12条染色体。y轴代表两个池中等位基因频率差异。绿色线代表90%的置信域。橘红色的线代表95%的置信域。超过95%的置信区间在7号染色体60.9m和64.7m之间。(f)控制条斑表型的基因的精细定位,将目标基因锁定在m63825和m63919两个标记之间,两个标记距离是93-kb。(g)在候选区段内有11个候选基因。箭头代表基因的方向。(h)10个候选基因在绿条斑和浅绿条斑中的相对表达分析。(i)orf1的基因结构。黑色的框子代表外显子,细线代表内含子。
在本发明中,条斑突变体gs为父本与m82(果实呈均匀色)为母本进行杂交,f1代果实呈现均匀的颜色,说明条斑为隐性性状(见图3d)。f1自交产生f2分离群体(627个单株),其中460个单株果实呈均匀颜色,167个单株果实呈条斑表型,经过卡方检验,f2代中颜色均匀果实的单株数与条斑果实的单株数比例符合孟德尔分离比3:1(χ2=0.8086),可见条斑性状是由单基因控制。在f2代中随机挑选30棵颜色均匀果实的单株和30棵条斑果实的单株,使用ctab法加纯化dna的方法分别从60棵单株幼嫩叶片提取高质量dna,通过凝胶电泳检测dna的质量(主要观察dna是否降解),然后使用nanodrop2000测定dna的浓度,将30棵颜色均匀果实的单株的dna进行等质量混合成显性池,将30棵条斑果实的单株的dna进行等质量混合成隐性池。将两个混池保存于干冰中,送于诺禾致源生物信息科技有限公司进行dna测序,每个池测序深度为30层。使用burrows-wheeleraligner(bwa)47软件将测序的reads比对到参考基因组sl2.50(http://solgenomics.net/),然后通过samtools48筛选两个混池中的snp。以heinz1706为参考序列,在两个池中分别进行基因型频率计算(index),显性池中snpindex值与隐性池中snpindex值之差为delta(snpindex)。以1mb长度为滑动窗口,以10kb为窗口一次滑动距离,马哈顿图每个点的snpindex为一次窗口内部delta(snpindex)的均值。根据两个池中等位基因频率的差异,申请人将控制番茄条斑性状基因锁定在七号染色体60.9mb到64.7mb之间(超过99%的置信区间)(见图3e),gwas中最显著点sl2.50ch07_63842838(p=2.672960472e-256)在此区间内。
为了精确定位控制条斑的基因,扩大到1600个单株的f2群体。基于m82与gs基因组snp,开发了9个新的标记(m59885、m60966、m63665、m63825、m63919、m64035、m64166、m64769、m65244)。利用这9个标记在条斑单株中进行图位克隆,将控制条斑的基因进一步定位在m63825和m63919之间(见图3f和g),在m63825和m63919标记位置各有一个重组事件。根据番茄sl2.5版本参考基因组序列,m63825与m63919之间的物理距离约为93kb,涵盖11个预测的开放阅读框(orf1-11),将这11个候选基因分别在绿条斑和浅绿条斑中进行qpcr,结果显示只有orf1基因在绿条斑中的表达量显著低于浅绿条斑,因此,orf1被认为是最可能控制条斑的基因(见图3h)。从m82和gs中扩增并测序了orf1,结果显示orf1的3kb启动子和1kb长度3'utr没有差异,只在orf1的第2和第5的内含子中各存在一个snp,存在于orf1第二内含子的snp称为snp1,存在于orf1第五内含子的snp称为snp2(见图3i)。本申请中搜集了7份商业品种呈现条斑表型,从美国番茄遗传资源中心(http://tgrc.ucdavis.edu/)引进ailsacraig背景的la3530品种呈现条斑表型,利用这些材料进一步确定控制条斑表型形成基因的变异位点。通过对orf1基因测序和序列比对,snp1在条斑品种中保守,snp2在条斑品种中不保守(见图3c和图4),这些结果表明orf1是控制条斑性状的候选基因。orf1是solyc07g055920(gs),它编码一个mads-box蛋白,一类特异性调控番茄果实发育的核转录因子(见图5),snp1在染色体上的位置是sl2.50ch07_63842838;snp2在染色体上的位置是sl2.50ch07_63848537。
图4是不同番茄品种snp1和snp2的分布情况,其中,(a)通过pcr扩增及桑格测序来验证snp1和snp2在heinz1706,、m82、ac和条斑番茄的碱基;snp1与条斑表型完全连锁,snp2与条斑表型不完全连锁;(b)snp2在核心种质资源中分布情况。
图5是gs的结构特征及亚细胞定位,其中(a)ncbi公布的gs的保守结构域;(b)gs::yfp融合蛋白的亚细胞定位。
实施例2gs的超量载体构建及遗传转化
1、超量载体构建
sgn网站sl2.50(http://solgenomics.net/)公布gs的gdna长度为9.7kb,gs的cdna长度为1.2kb。利用primer5软件对gs基因进行引物设计,包括完整的orf,正向引物:5'catttggagaggacacgctcgagagctctcctgttcaaacctatacaaaat3',反向引物:5'tctcattaaagcaggactctagattctgaagatgaagagccttgacc3',以m82cdna为模板,用phanta酶(购自南京诺唯赞生物科技有限公司)进行pcr扩增。pcr扩增的体系(20μl)为:10×taqbuffer2μl,dntps0.4μl,fw引物0.5μl,rv引物0.5μl,cdna模板1μl,taq酶0.1μl,ddh2o15.5μl。pcr扩增程序为:94℃预变性3min,94℃变性45s,55℃退火1min,72℃延伸2min,30个循环,72℃延伸10min,4℃终止反应。产物经过1%浓度琼脂糖凝胶电泳检测,在紫外灯下切下目的条带,使用胶回收试剂盒对目的条带进行回收,获得较纯净的pcr产物。
超量载体骨架:用xhoi+xbai双酶切phellsgate8空载,回收大约1.3kb的目的条带。酶切体系为:20μl体系,包括xbai酶1μl,xbai1μl,10×buffer2μl,质粒5μl,ddh2o11μl,反应条件为37℃3h。纯净的pcr产物与酶切过的phellsgate8载体骨架进行同源重组。同源重组反应体系(10μl):1μlexnase,2μl5×cebuffer,2μlphellstage8载体,3μlpcr产物,2μlddh2o,所用的试剂购自南京诺唯赞生物科技有限公司。体系混好后轻轻吸打几次,于37℃恒温箱反应30min立即冰浴5min。
将10μl同源重组产物加入25μl大肠杆菌感受态transt1,混合体系冰浴30min,42℃水浴锅中反应55s立即冰浴2min,然后加入500μl空白lb,放入37℃摇床复苏1h,均匀涂在100mg/l的spec固体lb培养基上,37℃恒温箱培养18h,挑取单克隆于100mg/l的spec液体lb培养基,放入37℃摇床培养8h,经过pcr检测,呈正确条带的菌液送公司测序(由武汉天一辉远生物科技有限公司完成),通过multalin(http://multalin.toulouse.inra.fr/multalin/multalin.html)网站将测序结果与参考序列进行比对分析。测序结果正确的菌液在37℃摇床培养,提取质粒,载体构建已经完成。
2、遗传转化
将构建好的载体质粒电激转入农杆菌感受态c58,对单克隆菌落进行pcr鉴定,阳性单克隆的菌液加入10ml的80mg/lspec+25mg/lrif的液体lb培养基进行扩繁活化,通过农杆菌侵染番茄子叶的方法获得转基因番茄,本发明中受体材料为条斑突变体gs(见图6a和图7)。对获得的t0代植株进行阳性检测,首先提取t0代植株的dna,载体上特异引物作为正向引物:5'acgcacaatcccactatccttc3',gs基因引物作为反向引物:5'tctcattaaagcaggactctagattctgaagatgaagagccttgacc3',以t0代植株的dna为模板进行pcr扩增。pcr反应体系(20μl):0.1μltaq酶(5u/μl),2.0μl10×pcrbuffer,0.4μldntp(10mmol/μl),正反引物(10ng/μl)10各0.4μl,1.0μldna(50-600ng/μl),15.7μlddh2o(引物由北京擎科生物科技有限公司合成,buffer,dntp和taq酶由北京全式金生物技术有限公司提供);混好的体系用液体石蜡密封,以800r/min转速离心,放入pcr仪进行扩增,pcr反应程序:94℃预变性3min,94℃变性30s,56℃退火30s,72℃延伸1.5min,进行36个循环,72℃延伸10min,4℃保存10min。pcr产物进行凝胶电泳检测,用1%琼脂糖(加入溴化乙锭)在120v电压条件下电泳20min,用凝胶成像系统来检测pcr产物条带,最终确定转基因番茄植株的阳性。
图7是gs的超量系和gs的红熟果实的表型图。
通过荧光定量pcr(qpcr)方法检测gs基因表达水平。提取相关材料果实特定组织rna,用反转录试剂盒将rna反转录成cdna。利用lightcycler480sybrgreenimasterkit,根据试剂盒步骤进行qpcr检测gs基因的相对表达量。构建gs启动子驱动gus基因表达载体,通过农杆菌介导转化番茄,通过gus染色检测gs启动子表达模式。
图8是gs的特殊表达模式,其中,(a)gs在m82和gs的果肉和整个外果皮中表达量没有显著性差异。(b)半定量pcr检测gs在m82外果皮、gs的浅绿条斑和绿条斑中的表达量。actin作为上样对照。(c)f2群体中随机挑选5棵有条斑果实的植株,检测gs在浅绿条斑和绿条斑中的相对表达量。(d)在核心种质资源7份有条斑番茄品种中检测gs在浅绿条斑和绿条斑中的相对表达量。(e)通过qpcr检测gs在ac不同组织中的相对表达水平,rna分别从根、茎、叶、花、幼果、绿熟期果实、破色期果实、红熟期果实中提取。(f)gs的启动子驱动gus基因转化番茄,对转基因番茄各器官进行x-gluc染色。
实施例3gs基因cripsr/cas9基因敲除
cripsr/cas9系统敲除载体的构建:本发明中敲除载体为ptx,是一种把番茄u6启动子(sequenceid:x51447.1)和2×35szcas9的序列添加到pbin19载体(genbankaccessionnumber:u09365.1)上而得到的crispr/cas9双元载体(xingetal.,crispr/cas9toolkitformultiplexgenomeeditinginplants.2014)。利用在线软件(http://crispr.dbcls.jp/)设计两个sgrna引物,正向引物:5'aatctaacagtgtagtttgtctcagttgagaaaaacaaggttttagagctagaaatagc3',反向引物:5'ctatttctagctctaaaactttctacgcttgcagaacgtcaaactacactgttagattc3'(划线部分表示gs第一外显子上的两个靶点)。载体构建及遗传转化等的方法同本发明的实施例2。在t0代转基因番茄中,用ptx特异性引物,正向引物:5'cggcctcgatattgggactaactct3',反向引物:5'cttatctgtggagtccacgagcttc3',来检测cas9蛋白是否存在于转基因番茄中。在t1代转基因番茄中,用双靶点侧翼的gs基因引物,正向引物:5'gttgttttttcttcttttggatgctac3';反向引物:5'caaacctgttattggcatattcataga3',来检测转基因植株中gs的突变类型(见图6c),检测方法同本发明的实施例2。
图6是gs在条斑突变体gs中功能验证,其中,(a)在gs受体材料中,超量表达和敲除gs转基因系果实的表型。(b)t1代gs超量表达量系果实表皮中gs的相对表达量。(c)三个crispr/cas9敲除t1株系中gs靶点处突变类型(d)在gs、gs超量系和敲除系表皮中叶绿素的含量。
实施例4gs基因调控番茄果实叶绿素含量
rna-seq:本发明中以条斑突变体gs为研究材料,获取绿熟阶段的条斑果实,浅绿条斑和绿条斑分别从gs果实外果皮切割,包含两个生物学重复,立即放入液氮中并保存于-80℃,提取总rna。总rna送于华大基因进行测序,使用的是bgiseq-500的测序系统。测序后所得的reads比对到sl2.50版本的基因组(http://solgenomics.net/)。如果基因在浅绿条斑和绿条斑中表达差异高于2倍且p值小于0.05,则将该基因归为差异表达基因。利用david软件对差异表达的基因进行kegg分析,然后利用r包ggplot2和hmisc做出气泡图(见图10a)。
图10是浅绿条斑和绿条斑中rna-seq分析,其中,(a)浅绿条斑和绿条斑中rna-seq数据kegg分析,点的大小表示基因数量,点的颜色表示富集代谢通路的p值。(b)通过qpcr验证rna-seq的结果。分别从浅绿条斑和绿条斑提取总rna。选取了10个与光合作用、叶绿素合成和叶绿体发育相关的基因进行定量pcr,qpcr结果与rna-seq结果一致。
图11是gs调控叶绿体发育相关基因的表达,其中,(a)rna-seq结合chip-seq来鉴定gs的靶基因。蓝色的韦恩图表示浅绿条斑和绿条斑的501个差异表达基因(来源于rna-seq数据)。红色韦恩图表示gs直接靶向9689个基因启动子(来源于chip-seq数据);(b)rna-seq和chip-seq重叠的172个基因进行kegg分析。点的颜色代表172个基因富集代谢通路的p值,点的大小代表基因的数量;(c)3个与叶绿体发育相关基因(slmpec、slpsbq和slcab)在浅绿条斑和绿条斑中表达。定量pcr结果与rna-seq中基因差异表达一致。(d)双荧光素酶实验表明gs调控slmpec、slpsbq和slcab基因的表达。gs的orf连接效应载体(pgreenii62-sk),slmpec、slpsbq和slcab基因的启动子连接报告载体。通过农杆菌转化烟草,两种载体在烟草叶片中瞬时表达,来测定luc(荧光素酶)与rlu(海肾蛋白)的比值。
通过qpcr方法检测gs和类胡萝卜素相关基因psy1表达水平。提取相关材料果实特定组织rna,用反转录试剂盒将rna反转录成cdna。利用lightcycler480sybrgreenimasterkit,根据试剂盒步骤进行荧光定量pcr(qpcr)检测gs和psy1基因的相对表达量。图12是在红条斑和黄条斑中gs和psy1的相对表达量,其中,(a)gs在gs和f2群体中3个隐性单株中红条斑和黄条斑中相对表达量;(b)psy1在gs和f2群体中3个隐性单株中红条斑和黄条斑中相对表达量;(c)双荧光素酶实验表明gs正向调控psy1基因的表达。
叶绿素含量测定:分割条斑突变体gs绿熟期果实的浅绿条斑和绿条斑(见图1f),gs、gs超量系和gs敲除系绿熟期果实的外表皮(见图6d)。称取经液氮研磨成粉状的样品0.2g于2ml离心管中,加入1.5ml80%的丙酮溶液,立即混匀并放置于暗处抽提至样品白色,抽提好的样品以12000r/min离心10min,取200μl的上清液于酶标板中,利用酶标仪测定在波长646nm和663nm下的吸光值。叶绿素含量测定与计算参考公开报道的方法(lichtenthaler,1987),计算公式如下:
叶绿素总含量(mg/g)=(17.32a646+7.18a663)×1.5÷m÷1000
实施例5gs启动子在gs的浅绿条斑(红条斑)和绿条斑(黄条斑)中甲基化检测
重硫酸盐测序:重亚硫酸盐处理浅绿条斑和绿条斑的基因组dna,未甲基化的胞嘧啶变成尿嘧啶,发生甲基化的胞嘧啶不会发生变化,经过pcr扩增连接载体进行单克隆测序,精确定量检测gs启动子区段在浅绿条斑和绿条斑中甲基化情况。具体地是,选择绿熟期条斑果实,精细地把浅绿条斑和绿条斑从条斑果实分离出来,使用qiaampdnaminikit(qiagen51304)提取高质量地dna,利用
mcrbc-pcr:采用ctab法从gs的浅绿条斑和绿条斑、红条斑和黄条斑中提取高质量的dna。每个样本的dna分两份,一份加gtp,另一份不加gtp,dna在37℃下通过mcrbc(takarabio)酶切6h,mcrbc酶切反应体系(20μl):2μl的mcrbc(10u/l),2μl的10xmcrbcbuffer,4μl的0.1%bsa,0.4μl的100mmgtp(100x),100ngdna,用ddh2o补足至20μl,然后65℃孵育20min,使酶变性。以mcrbc酶切处理过的dna为模板,引物还是重硫酸盐测序所用的引物,通过pcr扩增产物经过琼脂糖凝胶电泳,在凝胶成像系统上显示条带亮度,来评估gs启动子在浅绿条斑和绿条斑、红条斑和黄条斑中甲基化程度。pme(solyc03g123630)启动子没有被甲基化;cnr(solyc02g077920)启动子高度甲基化,这些启动子可以作为正反对照来评估mcrbc对甲基化dna消化情况(见图9c)。利用primer5软件对pme和cnr基因启动子进行引物设计,ppme的正向引物:5'aaactagaccatgagtgttgaga3',ppme的反向引物:5'ttttagagtgaattacagagaagc3';pcnr的正向引物:5'tgagcatcaaccactcctaata3';pcnr的反向引物:5'cagacttagtaataactccgat3'。
通过检测果实不同颜色(深绿色和浅绿色)区域外果皮,可以看出gs启动子pro-1和pro-2具有不同的甲基化差异水平。其中深绿区域中pro-1和pro-2启动子片段cg型、chg型的甲基化水平高于浅绿区域甲基化水平,深绿区域中pro-2的chh型甲基化水平高于浅绿区域。总体甲基化水平而言,深绿区域亦高于浅绿区域(图9b)。这种甲基化差异水平进一步通过mcrbc-pcr验证(图9c)。进一步研究表明,这种甲基化差异与启动子区域的hc-sirna有关(图9d,e),深绿区域中hc-sirna表达丰度高(图9f),可能招募甲基化相关因子,促进甲基化水平。图9是在gs中浅绿条斑和绿条斑的gs启动子甲基化差异性检测,其中,(a)gs的简易结构图,数字代表距离atg的相对位置,gs启动子选取两个区段(进行甲基化分析),启动子1:-2138到-1777;启动子2:-947到-629。小rna测序检测到719到966区段有小rna的富集;(b)进行重硫酸盐测序实验并计算在二个区段中三种甲基化类型(cg、chg和chh)的甲基化的百分率;(c)通过mcrbc-pcr方法,分别在浅绿条斑和绿条斑(绿熟阶段)和红条斑和黄条斑(红熟阶段)中检测gs的二个片段的甲基化水平。+”表示加了gtp用于mcrbc消化甲基化的dna;“-”表示不加入gtp,甲基化的dna无法被mcrbc消化。pme(solyc03g123630)启动子没有被甲基化;cnr(solyc02g077920)启动子高度甲基化。这些启动子作为正反对照来评估mcrbc对甲基化的dna消化;(d)浅绿条斑和绿条斑进行小rna全基因组测序,分布在sl2.50ch07_63842389到sl2.50ch07_63842636位置中小rna的reads数,最下面的黑线代表24-ntsirna(hc-sirna);(e)最高reads数对应于24-ntsirna的序列;(f)通过qpcr验证hc-sirna在浅绿条斑和绿条斑中相对表达量,u6基因作为内参基因。
实施例6针对gs基因snp1开发dcaps标记gssnp1与应用
本发明中分子标记gssnp1的开发:针对gs基因第二内含子保守的snp1(sl2.50ch07_63842838)开发共显性标记gssnp1,此标记也在商业条斑番茄品种(紫五彩、花绣球、大果五彩、多彩罗汉果、黄皮球、一品多彩、多彩番茄)得到验证。snp1所在位置没有酶切位点,通过在正向引物3'第5个碱基引入突变(g→c),这样从条斑番茄品种扩增的410-bp可以被ecori酶切成59bp和355bp两个片段,从非条斑番茄品种扩增的410-bp不能被ecori酶切(比如m82)。扩增引物如下:正向引物:5′-gtctctatttttttttgggcatctttgcagctagtaaatttttctctctcttccgaatt-3′,反向引物:5'-actgagtaactccctctagtcagaaaga-3'。pcr扩增的体系(20μl)为:10×taqbuffer2μl,dntps0.4μl,正向引物0.5μl,反向引物0.5μl,dna模板1μl,taq酶0.1μl,ddh2o15.5μl。pcr反应程序:94℃预变性3min,94℃变性30s,56℃退火30s,72℃延伸1min,进行36个循环,72℃延伸10min,4℃保存10min。pcr产物在37℃下通过ecori(thermoscientific)酶切2h,酶切体系为10μl:5μlpcr产物,1μl10×bufferecori,0.3μlecori(10units/ml),补ddh2o;用2%琼脂糖凝胶在120v电压下电泳在35分钟分离不同长度的dna片段,通过在凝胶成像系统观察片段大小(见图13)。
图13是针对gs第二内含子中保守snp1(sl2.50ch07_63842838)开发的共显性dcaps标记及其在番茄商业品种中的应用。用特异引物从非条斑番茄品种(比如m82)扩增的片段不能被ecori酶切,但从条斑番茄扩增的片段能被ecori酶切成59bp和355bp的两个片段。7个商业条斑番茄品种:紫五彩、花绣球、大果五彩、多彩罗汉果、黄皮球、一品多彩、多彩。
图13的结果说明,本发明开发的分子标记可以用于番茄育种的辅助选择上。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
序列表
<110>华中农业大学
<120>一种调控番茄果实颜色的基因、snp、分子标记及应用
<160>5
<170>siposequencelisting1.0
<210>1
<211>9410
<212>dna
<213>基因组gdna(gsgdna)
<400>1
attttctgcaagctctcctgttcaaacctatacaaaataggaacaaatttgaagagaaaa60
aaataaaaaaaatctctaaggtagattttctttctttctttctatacccaatctttgcta120
tatcgccatttttttcttaattttaataatgaaaattgttgttttttcttcttttggatg180
ctacaaacacatacacaaaaatatttttaatttttttttgttagactataatttccctga240
ttgagtgtgtaatttagctaacgagatcgcgatatttgttttgcttttttcagttttttt300
tttcttcttttcgatacaagacgatatggtttttcctattaatcaggaattacttgtcga360
tgagtcgtcttctcagttgagaaaaacaagtggaggaactggtggaggaggtagagggaa420
gattgaaattaaaaggatcgaaaatacgacaaatcgacaagttacgttctgcaagcgtag480
aaatgggctattgaaaaaagcttatgaactttctgttctttgtgatgctgaagtttcact540
aattgtattttccagccgcggccgtctctatgaatatgccaataacaggtttgtttattt600
aattctttttttctctaacaagatctgtttttaaccctaatgaaaaaaaaaaatgtgatt660
ctgcagatctttgccttttgtgtatgtttttttttgatttgggtatttttgtaatcgggg720
attgcttagatgataagcactcttaagattatgagttcgtgtcaatataggagctcgtaa780
cgattgatctatgtcagtctagatatatttgtgtgttaaaaagagggtgactatggtgtt840
tatttaagttaaaagattgagtttcttccatcacaaagatttgcttgtctaatccataat900
ttttttttgtttcctttctttatgagcttcaaaaacaccaaattttcctttgattctaca960
aatagatccgttgatttgagtcgagaaatcggttattaatattggttctaaacttgtttg1020
gagtacgattctttctagaattttgattaaacagagatattttgtgtgtcgactatctag1080
atatagattcttatcggtataatacatatattggatcctaaacgtggctttaattttaac1140
tttgatctccaactttcataatgcagcacattaataatccaatttttttttaaaataaac1200
acatgagtcctacatgaaacaatacacgtaagacaccatgtaggacaaaaaatgacttgt1260
aggacatgtgtgtctatttgttcaactttatacaaatttaagtatttatttgtatacatt1320
caaaattaaagaatataaatgtaattcgaaaaatcttgataaatttacaagtagggttaa1380
agagagatagggaaaaatcttaagcttacaaaatttatttccccttttctctctgtctct1440
atttttttttgggcatctttgcagctagtaaatttttctctctcttcccaattttttttg1500
tttgtctgtaagctgtcaagttctgatttattttcaatcaactcttccaattgatgcttc1560
cttaatatatataacatgtcatttcagacatcacacaagcaatagcctatcagattacag1620
attagggtttcaggtacaccaaaagagtcaagttgctttttctttttcaaagttaggatt1680
ttttttttctttggtgaagcgaagggatcgaactctcagtaataaagtgaaagttaagat1740
agttctttggaaaaaaagagaaactttttcaactcgtcataattgaattaggattatttt1800
tacaagcaaagcaatttctttctgactagagggagttactcagttggtaaacattcttca1860
ctttcaattttaatattgttttgcctttgtttttaccattatagcctttcaataacagag1920
atagaaattttttgtttctaggttatatatatatatatatatatccaaaattttaaacac1980
aaaaacaaactttaagtaaaagaattactaaattttatcgaacccatttgtatctcctct2040
caccctccttactttgtaattgaggtaaggacaaatagtccccttctctttgatttggtg2100
atatatataattttatcaaatatataaggctcaattaaaattattgaattctaataaact2160
cataccatttctttagaattcagtaattttaattgagccttatatatttgataaaactac2220
cccgttgtctcaatttatgcaaagaggctcaaaatacaatagttcaaatatttattttta2280
attaaattatgaattaaagtatatattttttaaaatatacaaaatataaatcaacatatt2340
gaatattcaaaatatttaacaaattagtttgagaaaattacactaaaaagaaaaaatctg2400
tcaaactctcctagttataacaccttcgtataaaatgggatagaaaaaatataaataatt2460
aatttcaaactcaatataaatcaaataagtgatagtcaaaagtcgaaaagttagaaaggc2520
atgatgtagaacttatttaacttccaatttcatggtagtcaaaaattatttatttatttc2580
taaaataattttttaataatttcttgaaatgtggggttgaaatataggggttagggtttc2640
atgtgattatgagtataatacatcatataatagggagttagacaagcatatttggtcacg2700
tcacatacgaatttttcagttttgagctaaacaacaacaatattttgtcatatatttttt2760
ttctcgacggttcaaaaatatcaaattttcctggggtttccaacaagccaaactttcaac2820
gaattttgtcaaaaaaattcaattggaaatgtacactttatgcaattatgatatagtgtc2880
acgcaaattaaaattaaaattctttaggtatttgatatttcctccttacttacatatctc2940
ttgggttctagctcaaccttgtcaactttgacattgaatctaatgcttattacctaatct3000
agttctataagagtttgattttttatatggtcattaaactaataattgttatcttaaaaa3060
tcacctctcttttttattttgagatacttcttccatttcaatttgtttgtcttattaaaa3120
cttgttacggagtttaagaaagtaaaaaagaataatttaaatcttgtaattttaaattac3180
agatatgtcaaatgtaccaaaagtagatttttacttttaacctactaagaaaagataact3240
gttattttcctatttatcctcaatattagttcctaactattcttcaaaattgtttcttaa3300
aattaaagactatacatcaattaatatgatatgagtactatgaaaatgtattcatattaa3360
ttattgtttttccagaggcatacaaaatataaaataaataaaaataattatattaataat3420
taattaagtgattatatgagaaattaagtggtagcagtaaagagttacatttatgaagac3480
ctagtcaaactaaaagcttattaattaatttttggtatcctattttttcaccatttcttg3540
gtgaattttagtagagagggagtacggaaaaaaaagagtcactgcactttcctttcttac3600
atagggaagaatgacttttgactgtctgcaattttttcgtcgaaaattatatcgtataaa3660
taaattagtacataagttgttgaatctcttttaattttagtgttaaagaatgttttaagt3720
tatgaattttgaattatagaataatataacatttcattgagtagagaatagattttatgt3780
atatatgctaatgtgaatttcttcaacataaatacatgatttaggctaatgctatcaaac3840
acctaattgatattgtagattcctacctttaggagtttaggggtgggttagattttaggt3900
attatatttttttaaaaaaattcatatataaatttctgattccgtcattattgaggtgga3960
tttagggcataagcaggtttatgaaaatcgaatacctcttgtacatatctattaaaaaaa4020
tcattccgaaatcataatttgaactcattattattattatatatattttttatttttatc4080
tttacgatttattattatataaatcttcttttcaattgtctgttttacttcttttttctt4140
gtttgtttcttaaagaatgtctcttttcttattttgacaaatattttaacttgaactttt4200
cgttttcatatgatatgtttaaaatcataagataaataatttgtgataaaataacgagat4260
cacaaatcaaaatcagacaaataaattgtagaatttatttttgggatgtttgcggggata4320
aaagggttttcgttgggggtattattcaatgggtaaaattaagaaacattgtagccaatc4380
atgttgttggatcttgagccaacgtggcagggaacaaccaatcactagctcgatgaaatt4440
aaggttacataatgcttcaattcttcttactgtaagtgcagaaaggattacttgttcatc4500
cttttaacccagaggataaaagaagactcacaaatcacatttgatgcgacattgtttgac4560
ttaacatgatgtttaagaaaaaaaaaagattattcttttaaattttgtggtttaaaaaca4620
ttattttgtagttataaattatttttatcaagagtgaaaggaattttgaaattgaattat4680
ttctacatagtagggacagatttaataagaaatgtgccacataatatagagagtataatc4740
tttaggtagaaagaatttaacttttgattttgactttttgagaggaatgtacaaccgtca4800
aaaatactctttgaattttttagttctaaaagtatggaaacataacattcttttaaacaa4860
atattaaaaagttttaaaaaatcacttcaccttgactttttacctagatcaaaatcagtt4920
tcaggctatccaaactttttgaaaggttattacttgtaattataatagtctatgttattc4980
ggatttatcaaaaatatagacggataagtaagattctttaaaagtaaagcatttttagtg5040
attccgacatagatgcggcaacatttattttgtcgtaggcgtccacatctaaaagattga5100
caagacattttgtgtagtttttttttttcttttgattaaaaaagttaaatttatttatat5160
gtaatatgcatccatacaagacctgtggcctgaagcattacattcaaaagaaatatttac5220
taagttataaacatagttcatacatactatctgataataaggttaaaaattgctctttcc5280
tcgtctgcattgacgattttcaaaacgaatacaggattgctcttgtttgtatcatcatca5340
tcatcaacaatttctccgtcttttggattgcaattccacattctaggtcgaaaatacata5400
gaattgtgacatctgaaaaatgatttgttttgtatttgtgtgtatttgcagtgttagggc5460
aactattgataggtacaagaaacaccatgctgattccactagtactggatctgtttctga5520
agctaacactcaggtaaacttgtttatataaatcattatttttagatgtaatttttttat5580
atttaatcgtccacctagggttttacctctcgtgcatcaaagcaaaagactaaacaaaaa5640
tatctttagcactatctatatcaaggattttttaacctcgcggttagctcaagattcgac5700
acataggccgtgggctcgtggcttcccttcttaatgaggatagaggctaaggccgaggtt5760
gagtcaaaacagataataacatgaaatttgggggctaggatgttaaaataggtaataaag5820
tttgtacctttatgatggggcaaacctcaacaaagacctgtttctaaaaaggaggatggg5880
gagggaagtgttacaacctacaaacaattactaattgttgaactctattgttgagacgtc5940
ttttcatttaaaccttagacaaaatcgtgaggtttaaaagccttaattaaaaacataaaa6000
aatacttaactagttgacctagaccattccacttacattttgttttagtatcaatcgcac6060
agagaactagattttttctaatcatcacaaaaatgattaaattgactcaaacttttatat6120
attcctcagtactaccagcaagaagcatccaaactgcgacgacaaattcgagatatacag6180
acttataacaggtcagtccaaagtggacttctctaatataaatcattgtgtactatcaga6240
aaatcactaatttttattgaatttttttgttggaatttaacagaatatggaatgtcgaaa6300
attagagattttctagtagtgaccaaagttgtagtaattatgattttttgttttgtttag6360
gcaaatagttggagaggcattgggcagtttaagccctagagacctcaagaatttggaagg6420
gaaacttgaaaaggccattggtagagtccgttccaaaaaggtaaataattcaactttttg6480
ttagctgattttcactgttttcttcttattattacaaaggtaaaaaactgacattttttt6540
attttatcattttccagaatgaattgcttttctcagaaatagagctcatgcaaaagaggg6600
taaaactactaatttatgtgctttccttaattatatatttataatcatgatgttcaggtc6660
agtttgcgtgcacttaaattaattttacaagatatctgctacctttcactagcaataaat6720
tacctagtagttttgcctcatctgtattcgaacatgaaacatcatgaacttaatattcag6780
ttttattaatcagtaaaccacccccttaaatgcaaaatatagacgacatacttcaatcaa6840
ctttacgtttagatgagtcaagataaattgagctaataaataaatagatcattaattaac6900
ttatccaaattttataaattttattttcatgaactaatcttatcacttgacaggagattg6960
agctgcagaacgccaacatgtatctacgcgcaaaggtcctattattttctctatgccttt7020
atgttacgataggactctactagtatctggacgtttgaccatgttacattgtgaaatttt7080
tttttaaaaaaatttttgtttttaaaattgaaaatgatatttcaaaattgaaattgtgtt7140
tgaccatgtcaaattaaagttgttttctactttgtgtgagtgatttggagtgaatagtca7200
aaaacacattttcgttgtttttcaaattcttgaattcaactatgacgaaacgtgcttttt7260
cagagttcaactccggaaaaattgaaaatttttcatgatcaaacgcctccttgatcattt7320
taacttgaaaattaatccttgaaatgtacatatgtagcagatagcagaggtagagagagc7380
acaagagcaaatgaacttgatgcctggaggcggaggcggaggcggaggcggaggaggagg7440
aggatctgatcatcaataccatcatcagccaaattacgaagatgctcgcaataacttcct7500
gcctgtaaatctcctggaaccaaatcctcattactctcgtcgcgacaatggtgaccaaac7560
tcctctccagcttgtgtatgcctctcttccttcttaattataattttgtaatttattagt7620
tagactcacatgagtgataaattttactaaaaacttattaaggttttaagtatggattga7680
gattttataccatgaaacaaaaacttgtcatggaaggggaggtgtgaacgtttagctccc7740
gataatagagagttgttcagatggtaaatattccttactttcaattctaaagatgagtta7800
tcaagagagcaaaacgggtggaagctctctgaggaggggtagaaaaaaaaggaaatttta7860
ccttttagtacaattagaatatgaaactcgagaaaaaataatagttgaaatatgtttttt7920
tttttgactattttctctaaaacttcaattagtggagtctttgttatatcaaagctggga7980
taaactaatcccataatagctttgatagtccaaaaaacctggaacttcattttaggttta8040
tagaattgtttttggtgttcttaccaaaaccagggtcaaagctacaactttgcccacaga8100
tttggtaaaatctaataattttggctcaaatcatatatttgtgtttaaaagtttaaacta8160
aaatgtattcaataatttgttgaggacccagtaaacaacagattatgcctcactaaaaat8220
tactttatgtgaagacggtgattcattatgtgcttttaacctaactcaagccaaaaaaaa8280
tatttattcaatagtcaccacttgccacttttgctcccaaatctttctggttgttctttt8340
caaaaaacattggttacatctttttacgtcattcattaccaataaccagtttatagatga8400
gtgttcttgaagtagtcagtctagatctgaacctacatgctaagtagatgacttgctagg8460
cgagcggagcggaacctaagatttcttgtaaatattttcagtcaatccacccattgcctt8520
aatgttttgtgtccaatgctcaaaactttcttactttttgtcttcatttatatgtgttgt8580
aaagagattgtcagaatcttaaagaaagacaagaaactttgtcaaatctaagaagaacta8640
agtctatggtcaggggaagattaactgatgggagtttgcggaacacaataacattagcgt8700
gaatttcgtatttgtgttaagaaattcacttaatagacataaataatcttatgtagaaca8760
aagtgatccaaaattcattactttagctagcgtttggctataaattttggatcaaatttt8820
aagaaaattccactttcactactagaaataaaagggttttttccattgcaaatcaatcga8880
aaatttgtgttacaaaatatgatttttccaccaaagcagttcattgtgaaaacacacggt8940
ggagaaacaaattgtcacggaaatattatgaaacttcctaacttttccttgcgaaaacat9000
tactgttttttattttcgttcaatcaaaatatatgtggaaatagctactgaaaagtgatt9060
cttagtagtgcttaattacttcaattatttttaactgattatttctccatttttgtcttg9120
gctggttttatttatgcagctgataatcatggagcaggtattctgaaatttggggtcaag9180
gctcttcatcttcagaaaaatgtgtactacaatttttaacctatagtgttgtaaatcata9240
atcataattattgccactgagatttaaactgtttatttttaagcaatattattcagtcat9300
ctgttaattaaggaatgaaaaatcttgtttgttatattatgactacttctatatactttt9360
acagccttatataaataatatgctattgaactatacatacaacattctct9410
<210>2
<211>1184
<212>dna
<213>基因组cdna(gscdna)
<400>2
attttctgcaagctctcctgttcaaacctatacaaaataggaacaaatttgaagagaaaa60
aaataaaaaaaaatctctaagttttttttttcttcttttcgatacaagacgatatggttt120
ttcctattaatcaggaattacttgtcgatgagtcgtcttctcagttgagaaaaacaagtg180
gaggaactggtggaggaggtagagggaagattgaaattaaaaggatcgaaaatacgacaa240
atcgacaagttacgttctgcaagcgtagaaatgggctattgaaaaaagcttatgaacttt300
ctgttctttgtgatgctgaagtttcactaattgtattttccagccgcggccgtctctatg360
aatatgccaataacagtgttagggcaactattgataggtacaagaaacaccatgctgatt420
ccactagtactggatctgtttctgaagctaacactcagtactaccagcaagaagcatcca480
aactgcgacgacaaattcgagatatacagacttataacaggcaaatagttggagaggcat540
tgggcagtttaagccctagagacctcaagaatttggaagggaaacttgaaaaggccattg600
gtagagtccgttccaaaaagaatgaattgcttttctcagaaatagagctcatgcaaaaga660
gggagattgagctgcagaacgccaacatgtatctacgcatagcagaggtagagagagcac720
aagagcaaatgaacttgatgcctggaggcggaggcggaggcggaggcggaggaggaggag780
gatctgatcatcaataccatcatcagccaaattacgaagatgctcgcaataacttcctgc840
ctgtaaatctcctggaaccaaatcctcattactctcgtcgcgacaatggtgaccaaactc900
ctctccagcttgtctgataatcatggagcaggtattctgaaatttggggtcaaggctctt960
catcttcagaaaaatgtgtactacaatttttaacctatagtgttgtaaatcataatcata1020
attattgccactgagatttaaactgtttatttttaagcaatattattcagtcatctgtta1080
attaaggaatgaaaaatcttgtttgttatattatgactacttctatatacttttacagcc1140
ttatataaataatatgctattgaactatacatacaacattctct1184
<210>3
<211>804
<212>dna
<213>基因组cds(gscds)
<400>3
atggtttttcctattaatcaggaattacttgtcgatgagtcgtcttctcagttgagaaaa60
acaagtggaggaactggtggaggaggtagagggaagattgaaattaaaaggatcgaaaat120
acgacaaatcgacaagttacgttctgcaagcgtagaaatgggctattgaaaaaagcttat180
gaactttctgttctttgtgatgctgaagtttcactaattgtattttccagccgcggccgt240
ctctatgaatatgccaataacagtgttagggcaactattgataggtacaagaaacaccat300
gctgattccactagtactggatctgtttctgaagctaacactcagtactaccagcaagaa360
gcatccaaactgcgacgacaaattcgagatatacagacttataacaggcaaatagttgga420
gaggcattgggcagtttaagccctagagacctcaagaatttggaagggaaacttgaaaag480
gccattggtagagtccgttccaaaaagaatgaattgcttttctcagaaatagagctcatg540
caaaagagggagattgagctgcagaacgccaacatgtatctacgcatagcagaggtagag600
agagcacaagagcaaatgaacttgatgcctggaggcggaggcggaggcggaggcggagga660
ggaggaggatctgatcatcaataccatcatcagccaaattacgaagatgctcgcaataac720
ttcctgcctgtaaatctcctggaaccaaatcctcattactctcgtcgcgacaatggtgac780
caaactcctctccagcttgtctga804
<210>4
<211>267
<212>prt
<213>氨基酸(gs)
<400>4
metvalpheproileasnglngluleuleuvalaspgluserserser
151015
glnleuarglysthrserglyglythrglyglyglyglyargglylys
202530
ilegluilelysargilegluasnthrthrasnargglnvalthrphe
354045
cyslysargargasnglyleuleulyslysalatyrgluleuserval
505560
leucysaspalagluvalserleuilevalpheserserargglyarg
65707580
leutyrglutyralaasnasnservalargalathrileaspargtyr
859095
lyslyshishisalaaspserthrserthrglyservalsergluala
100105110
asnthrglntyrtyrglnglnglualaserlysleuargargglnile
115120125
argaspileglnthrtyrasnargglnilevalglyglualaleugly
130135140
serleuserproargaspleulysasnleugluglylysleuglulys
145150155160
alaileglyargvalargserlyslysasngluleuleupheserglu
165170175
ilegluleumetglnlysarggluilegluleuglnasnalaasnmet
180185190
tyrleuargilealagluvalgluargalaglngluglnmetasnleu
195200205
metproglyglyglyglyglyglyglyglyglyglyglyglyglyser
210215220
asphisglntyrhishisglnproasntyrgluaspalaargasnasn
225230235240
pheleuprovalasnleuleugluproasnprohistyrserargarg
245250255
aspasnglyaspglnthrproleuglnleuval
260265
<210>5
<211>5000
<212>dna
<213>启动子序列(gspromoter)
<400>5
gcaaaatatgctcaaagtatgcgaaattgaactagctatgcttattcttttcaccattgt60
ttcgattgtccctttattatcatgaaattaaataattaaggcctttcgtgattcttataa120
aataaaaaagaaaaaaaaatacatacttaagggatcgatgcggttggtagttcaataatt180
tttttggtttatgatctggtgttcgatattttattataatttaattatatttcgatttga240
aaaaattacttgaatgaatgccttttaataatgtaaaagaactaattaaatgcatacaag300
ttccctaataatactagttgtaattgtacaatgttaaagatgtaaatatagttagttagt360
tagttagaatatgtcagtaaattagttagaggatattagtcatgacatgttgttatatat420
aggtttatatgtatcattgaagaggcagttttgatatagaaattttcttctcttcttcat480
tacttctctgtttctctctaccactcttcaatggagttttacttcttttaattcactttc540
ttaacatggtatcagagcagggtctgtctcacccgatgttggggtttccaaaattaaaat600
tgcccacgcatcagatgctaagcactgggcgtggggtgggtgttaaagaatgacaaaagt660
cccacatctgtgattaatgagatgagtagactatttataaggcttgagcaatcctcctcc720
ctttgagctaacttttggggtgtgagttaggcctaagacctaatttcacaaataaataat780
tattgattttaggatactttttatttattaccatttatagcaatattatattaaatctgc840
aagtgaattaagtatgcaatatagagtatatgtattataactattttaaaaatatattat900
gcttgttaggtaagaagttgacacattgtattataagggtgttaattaaaatgtgtgata960
aatatattatccatcaataaaatgtattatatgtgaataataaatttgtttttgtaatat1020
gaattaaaagtgtattataaatgtattaaaagtggtaaagtgaaaaaaaaatgttgttac1080
tataaaaagtaaatattttttgtttgttgtatatttatataagtttcccctaattttgtt1140
tcatggtcccaatacaattttcttttttccatttatagaagcctaaatttaatatcttta1200
aataaggataaagaaatttcaattatttgtattcaaaagtgtgacctagtagttaatgaa1260
gtgactgagaatccaagatcttacgttcaaaacttatatgagaaaatatgaagtgattct1320
ttcaatcagtcctaatcttgattgacagagttatctgatacgttttgttagagttctatc1380
ataccatttacaaatagagtatacctgaagtttgtcgatgtgtgtgatatgtcctttaat1440
tagagaaagcgactttgacatagataggtatccactagcataaatgcaacccaaataatt1500
taatgccaccatctacctgaaaacatgtaaccctaattcttataccacatattttgtttc1560
ttataagttgaatcttagactaaaattgctatatatatgctccaattttgtctaattaag1620
atgttacacaaacttctttcattttactgaatcccaaattggaagcaataaaaatgaggt1680
actaattagacacagtgaaaacaaaatagttgttttgtagttttttttaaaaaaataaaa1740
ataaatttatgaaatttttacgggaaaatcttcatttatacatataaacagatcggaaaa1800
ggctcaattttcttctatttattttatagttgcctaagaaatcctattttttcagaaaaa1860
aatgtgattttcagcaaattcttatatatactcgacgtttacactaactatattaattta1920
caatagttgagtgatataataaaagaaataacatgcattttaaaccataatttaggtgag1980
aaaagttcatgtacatatacatatcttttatctatcgatttagggaaaatacacaagtac2040
cttcctagattatgaccgaaatcccagagacacaccttaactaaactaaggtcctattat2100
cctcccgaacctttatttatttatttttttgtaattttgtacacctttttggcttatgtg2160
gcaacaaaaatatctcccacgcgcctcaattgcgtgtataccacacgtaagacaaaaagt2220
gtacaaaattacaaaaaaataagttcaaggataatgagacattagtttagttaaagtatg2280
tatgagagattgccatcatagtctacgaggtacttgtgcatgttcccaaatattataaat2340
gttgaatgcaaataaattttcaaaccttgtgaaaaatgctcacctagctagctagtgtaa2400
cttttttaaatcaaactaggtaaaccctaaacaaaagaatttggtactaattacatgtag2460
gggtcacaagtcacaacctaataaaacccccactacatggagggattttaattttttaat2520
taaaattttcttgtattttaattggaatttgttaatttcatatagttagtggggagtaaa2580
ttttggctacacaagatgaaaaagtttcacacaaacatatggtcctagagtgatagatag2640
taaccaaatatagcaaagtgtatcatgaggtttcccctacccctttaccataaaagaatt2700
gagtaatgggtgatggtgaataggacatcacatgggagtcttgttcctatgaatcacaac2760
ttcaagagatcatggaaggaaaaaaaaacctaataatttaagagagagaagtacttttag2820
gtatggggagacttttttttttcctttttttctcgatttgatcatctgatatatgaaatt2880
tattgaatttgataaatcaggatttacactaaaaaatcatcttaagaatagaagattcaa2940
ttatcgaaaggtttggcaatcttaagaatcgcacgagacagctaataaagagttgagaga3000
gatatcgattgatcatctcatgcctatcttgctcagactttccaaaaaaaataatgtggt3060
acacgtgttagatcctctaataatgcattaatgctattggaggattcagatatgtattca3120
gtcgcaatttcaaaaaatctgagcaatagttaatagtctctcactcaaagatcaacgatg3180
acggtagagtagaaggtggggtttagtgctgaattcaatatcttaactacgtgttcacat3240
gaaccaaatagcttttgttcatatcttatatgtgtattaaaatattttatttattgtgaa3300
cccaaaaaacattaaaattttgaatcaacgcctctagtgagaattcgatcggtaagacac3360
aattataactttagttcagactcatttaacatatacaaatccttaatttaattgaataac3420
tcaaaaatagagaaaatcttagtcggttagtttattgaccacctctacattcacgttgtt3480
tattagatttcaatttttatctagtaatcccttctcctaacttcatttttttttttaaaa3540
aaaaagctttaaaataaaactcaaaatgacaataacaacttgaatagtctctacagctgc3600
aaaattgaaagtaaaaaaaaaaaattatacataaaaagggttttgctagttttatatttc3660
tatactctatatttaaactgaaggttgactgcacttacaacaatattactcaatttccat3720
tagttgtcacttttcaaaagagactctcattgtcccttttccccatacttatagaaaaat3780
ggataattaaatggagtttgatcaaactatacacctaaaattttacaccctccttttgct3840
acttccattgagtaccacttacctacatttccataaaaaatagaatataaaaaatatact3900
ctttgtctcaaataaattatcatgattttctttttatacgttcaaatttcatttgtgaat3960
ttatatatttttttttgatttttcattcggtgtcccatacctgcatagaagtttgattat4020
ttcagatttcgcgatgcataggcaccatttcgagaggggggaaggttccctacaatgaat4080
tttttcatactagggctcagatttcagacctctgtttaatggatgagcaaccccatccgc4140
tgtacatcatcctttggtggtggatctaccgactacactaattaattttaaaaacaaagt4200
tttttttatcacaaatcagtgagaaatttatgctataaaacatgatttcccacaaaacta4260
gctttacgtgtaaaatacatgatgaaaatactaaattttcactgtaatagtgaaaaactt4320
cttaatatttccatatgaaatgattattattttttcttttgtcactgattcaattaaaat4380
atctacaaaaataatcactgaatatctttcaatgagaaatttagtgcaagaataatgatt4440
ttctagtagtataactaagtatattgttgttgtttttcatttacacgtctcttaagaaac4500
attaattaatagaaatattgaactattttaccctttataatatcacgataactaatttga4560
gacgaagaatagtttagtagtgtatagatatacactcaaaaagtagtatattttagttgg4620
acggtccaattttttcctatctataactatcctccagcttgttcaactcacttccatttt4680
ctgcaagctctcctgttcaaacctatacaaaataggaacaaatttgaagagaaaaaaata4740
aaaaaaatctctaaggtagattttctttctttctttctatacccaatctttgctatatcg4800
ccatttttttcttaattttaataatgaaaattgttgttttttcttcttttggatgctaca4860
aacacatacacaaaaatatttttaatttttttttgttagactataatttccctgattgag4920
tgtgtaatttagctaacgagatcgcgatatttgttttgcttttttcagttttttttttct4980
tcttttcgatacaagacgat5000