罗汉果环氧化物水解酶Sgeph5基因的应用的制作方法

文档序号:17068462发布日期:2019-03-08 23:06阅读:296来源:国知局
罗汉果环氧化物水解酶Sgeph5基因的应用的制作方法

本发明属于植物生物技术领域,具体涉及葫芦科植物育种方法,包括提高甜甙含量和改善口感,更具体地涉及一种甜甙含量调控基因sgeph5的核酸分子及其分子育种材料及其在葫芦科果实改良育种工作中的应用。

技术背景

罗汉果(siraitiagrosvenorii(swingle)c.jeffrey)作为中药使用已有几个世纪的历史。中国传统医学用其治疗高血压,肺结核,胃炎,哮喘,百日咳,急慢性气管炎和急慢性扁桃体炎等。近年研究还发现罗汉果含有抗癌成分,已引起国内外医学界的高度重视。罗汉果富含甜甙、黄酮、维生素、蛋白质、氨基酸、甘露醇、scavenger物质、多种微量元素等有效成分,营养价值高,天然风味浓郁,醇香甘甜,亦能广泛用于食品、保健品。罗汉果中甜苷v是世界最强甜味物质之一,甜度是甜菊苷的2倍,甘草甜素的6倍,蔗糖甜度的300倍,最大的优点是不含热量,理化性能稳定,水溶性好,无任何毒副作用,适合所有人群长期食用。罗汉果主要产于桂林市临桂县和永福县的山区,是桂林名贵的土特产,在湖南南部、贵州、广东和江西等省区亦有分布。

罗汉果的组织培养研究始于1980年,林荣等以罗汉果胚轴、茎尖等为外植体,进行了离休培养的初步研究。至今关于罗汉果的组织培养研究主要集中在离体快繁和脱病毒培养。罗汉果转基因研究几乎是空白。罗汉果抗虫和代谢基因工程研究进展包括:

1.抗虫基因工程

根结线虫病是罗汉果的一种重要病害,对生产威胁极大,导致植物开花结果推迟,结果少,果实小,甚至不开花,严重时主根腐烂,植物整体枯死,严重制约着罗汉果产业的快速健康发展。使用化学药品抗病能取得一些成效和收益,但长期使用易产生抗药性和农残问题,不能从根本上解决病害,应用现代分子育种和基因工程等高新技术将为罗汉果的发展打开新天地。

2.代谢基因工程

罗汉果的主要活性成分包括三萜及其苷类,还含有黄酮、多糖、氨基酸、甘露醇、维生素等。罗汉果甙属是葫芦烷三萜类,早在上世纪七、八十年代日本学者就对罗汉果的三萜类成分进行了较为系统的研究,从干燥果实中分离得到赛门苷ⅰ(sianenosideⅰ)、罗汉果苷ⅱe、(mogrosideⅱe)、罗汉果苷(mogrosideⅲ)、罗汉果苷ⅲe(mogrosideⅲe)、罗汉果苷ⅳ(mogrosideⅳ)、罗汉果苷ⅴ(mogrosideⅴ)等葫芦烷型三萜类化合物。其中的罗汉果苷ⅴ是罗汉果干果的主要成分,约占干果的0.5%。罗汉果苷ⅳ、罗汉果苷ⅴ、赛门苷ⅰ的万分之一浓度的水溶液分别是5%蔗糖水溶液甜度的392倍、425倍、563倍。此后经过多位学者的努力,又从罗汉果中分离鉴定了大量的三萜皂苷、三萜酯等成分30多个。鲨烯是所有三萜皂苷、白桦酸、植物激素类化合物的共同前体,是由鲨烯合成酶(squalencesynthase,ss)催化两分子的焦磷酸金合欢酯(farnesyldiphosphate,fpp)尾尾缩合而成的。因此,克隆代谢过程中关键酶是提高罗汉果中甜甙的有效途径。

知识产权方面主要集中在产品饮料配方方面较多,国外大公司以饮料配方为主要研究方向,国内研究主要在栽培种植及一些罗汉果茶饮方面。

罗汉果的主要活性成分包括三萜及其苷类,还含有黄酮、多糖、氨基酸、甘露醇、维生素等。罗汉果甙属是葫芦烷三萜类,早在上世纪七、八十年代日本学者就对罗汉果的三萜类成分进行了较为系统的研究,从干燥果实中分离得到赛门苷ⅰ(sianenosideⅰ)、罗汉果苷ⅱe(mogrosideⅱe)、罗汉果苷(mogrosideⅲ)、罗汉果苷ⅲe(mogrosideⅲe)、罗汉果苷ⅳ(mogrosideⅳ)、罗汉果苷ⅴ(mogrosideⅴ)等葫芦烷型三萜类化合物。其中的罗汉果苷ⅴ是罗汉果干果的主要成分,约占干果的0.5%。罗汉果苷ⅳ、罗汉果苷ⅴ、赛门苷ⅰ的万分之一浓度的水溶液分别是5%蔗糖水溶液甜度的392倍、425倍、563倍。罗汉果中罗汉果苷的生物合成途径尚不完全清楚。基于对其他植物中三萜类皂苷(类异戊二烯途径)合成途径的了解,以及关于罗汉果苷合成的有限报道,经过多位学者的努力,又从罗汉果中分离鉴定了大量的三萜皂苷、三萜酯等成分30多个。以前的研究提出了一种罗汉果甜甙生物合成途径(见图1),在上游途径中通过甲羟戊酸(mva)和质体2-c甲基-d-角豆醇-4-磷酸酯(mep)合成三萜类化合物并且涉及法呢基二磷酸酯(fpp)转化为角鲨烯,然后到2,3-氧化角鲨烯,然后依次进行环化,氧化等修饰。角鲨烯合成酶(sqs)催化两种fpp转化为角鲨烯,这是甾醇,三萜和油菜素类固醇(brs)生物合成的第一个步骤。这种酶促反应发生在内质网(er)的膜上,甾醇和brs在膜的流动性和渗透性中起重要作用,也可作为信号传导植物生长发育中的分子。环氧化物水解酶(epoxidehydrolases,eph)普遍存在于自然界的植物、动物和微生物中,在它的作用下环氧化物通过选择性开环可以制备具有光学活性的手性醇类化合物及选择性保留具有重要价值的环氧化物。

为了开展罗汉果基因工程的工作以及阐明罗汉果甜甙代谢机制,罗汉果基因克隆和功能鉴定的工作非常重要,是罗汉果分子育种的研究和应用基础。eph已经在很多物种中鉴定,过度表达可能会增加植物甾醇和三萜类化合物。

本发明通过研究利用pacbiorsii平台(pacficbiosciences;usa)对罗汉果基因组进行精细的单分子测序,并通过smrt技术进行基因组组装。此外,利用illuminahiseqx-ten平台(illumina;ca,usa)对罗汉果根、叶和果实进行rna-seq测序,并结合基因家族遗传进化分析,筛选甜甙合成相关基因,成功定位并克隆了一个新的环氧化物水解酶(epoxidehydrolases,eph)基因sgeph5。在进化过程中eph基因所承担的功能非常重要,在罗汉果甜甙合成过程中eph基因的表达产物可能通过控制中间产物的合成调节甜甙的合成。eph产物具有多方面功能,对底物的催化有着很高的特异性,在不同发育时期和不同组织细胞中高度特异表达。eph在罗汉果甜甙合成中由葫芦烯醇到罗汉果甜甙的过程中发挥着重要作用,能够决定不同种类甜甙的数量,影响最后的甜度。该基因在果实中的表达量显着高于其他组织,这表明果实中甜甙合成中前体的竞争中,可以通过调节该基因的表达促进果实中甜甙含量的改善。本发明还提供了一种获得高甜甙含量罗汉果品种的方法,对罗汉果育种工作具有重要的意义和应用价值。



技术实现要素:

本文提到的所有参考文献都通过引用并入本文。

除非有相反指明,本文所用的所有技术和科学术语都具有与本发明所属领域普通技术人员通常所理解的相同的含义。除非有相反指明,本文所使用的或提到的技术是本领域普通技术人员公知的标准技术。材料、方法和例子仅作阐述用,而非加以限制。

本发明提供了一个改善果实中甜甙含量的调节基因sgeph5,所述该基因的过量表达可影响其对罗汉果果实罗汉果甜甙的含量,其核苷酸序列选自下列组的序列之一:

(a)如seqidno:1或2所示的核苷酸序列;

(b)其编码氨基酸序列如seqidno:3所示的核苷酸序列。

本领域技术人员应该知晓,本发明所述的改善果实中甜甙含量的调节基因sgeph5还包括与sgeph5基因的核苷酸序列或蛋白序列高度同源,并且具有同样的通过调节该基因表达促进果实中甜甙含量的改善功能等高度同源的价体序列。所述高度同源的功能等价体序列包括在严谨条件下能够与具有seqidno:1或2所示序列的dna杂交的dna序列,或是其编码的氨基酸序列与seqidno:3所示的蛋白氨基酸序列具有85%以上相似性的核苷酸序列。

功能等价体序列还包括与本发明所公开的sgeph5基因所示的序列有至少80%、85%、90%、95%、98%、或99%序列相似性,且具有调控罗汉果甜甙含量功能的dna序列,可以从任何植物中分离获得。其中,序列相似性的百分比可以通过公知的生物信息学算法来获得,包括myers和miller算法、needleman-wunsch全局比对法、smith-waterman局部比对法、pearson和lipman相似性搜索法、karlin和altschul的算法,这对于本领域技术人员来说是公知的。

本发明所述的基因序列可以从任何植物中分离获得,包括但不限于芸苔属、玉米、小麦、高粱、两节荠属、白芥、蓖麻子、芝麻、棉籽、亚麻子、大豆、拟南芥属、菜豆属、花生、苜蓿、燕麦、油菜籽、大麦、燕麦、黑麦(rye)、粟、蜀黍、小黑麦、单粒小麦、斯佩尔特小麦(spelt)、双粒小麦、亚麻、格兰马草(grammagrass)、摩擦禾、假蜀黍、羊茅、多年生麦草、甘蔗、红莓苔子、番木瓜、香蕉、红花、油棕、香瓜、苹果、黄瓜、石斛、剑兰、菊花、百合科、棉花、桉、向日葵、芸苔、甜菜、咖啡、观赏植物和松类等。优选地,植物包括玉米、大豆、红花、芥菜、小麦、大麦、黑麦、稻、棉花和高粱。

本发明还提供了一种表达盒,所述表达盒含有本发明所公开的育性调节基因sgeph5的dna序列,所述甜甙含量调节基因的核苷酸序列选自下列组的序列之一:

(a)如seqidno:1或2所示的核苷酸序列;

(b)其编码氨基酸序列如seqidno:3所示的核苷酸序列。

具体地,上述表达盒中的罗汉果鲨烯合成酶基因还可操作性的连有一个可驱动其表达的启动子,所述启动子包括但不限于组成型表达启动子、诱导型启动子、果实特异表达启动子、时空特异表达启动子等。本发明所述的组成型启动子的基因表达不具有组织和时间特异性,外界因素对组成型启动子启动的外源基因表达几乎没有影响。所述组成型启动子包括但不限于camv35s、fmv35s、水稻肌动蛋白(actin1)启动子、玉米泛素(ubiquitin)启动子等。本发明所述的组织特异性启动子除包含应有的一般启动子元件外,还具有增强子以及沉默子的特性,该类启动子的优点在于可启动基因在植物特定组织部位的表达,避免外源基因的不必要表达,从而节约植物体的整体能量消耗。本发明所述的诱导型启动子是指在某些特定的物理或化学信号的刺激下,可以大幅度地提高基因的转录水平的启动子,目前已经分离的诱导型启动子包括但不限于逆境诱导表达启动子、光诱导表达启动子、热诱导表达启动子、创伤诱导表达启动子、真菌诱导表达启动子和共生细菌诱导表达启动子等。本发明采用罗汉果环氧化物水解酶基因的自身启动子,其核苷酸序列如seqidno:4所示。

本发明上述表达盒,还进一步的可以包含一个筛选基因,所述筛选基因可以用于将含有该表达盒的植株、植物组织细胞或载体筛选出来。所述筛选基因包括但不限于抗生素抗性基因、或是抗除草剂基因、或是荧光蛋白基因等。具体地,所述筛选基因包括但不限于:氯霉素抗性基因、潮霉素抗性基因、链霉素抗性基因、奇霉素抗性基因、磺胺类抗性基因、草甘磷抗性基因、草丁膦抗性基因、bar基因、红色荧光基因dsred、mcherry基因、青色荧光蛋白基因、黄色荧光蛋白基因、荧光素酶基因、绿色荧光蛋白基因等。

本发明还提供了一种调高罗汉果甜甙含量的方法,通过影响sgeph5基因的核苷酸序列或者调控sgeph5基因的转录表达来调控植物的育性。所述影响罗汉果甜甙含量是指通过调控sgeph5基因的表达,从而使所述植株的次生代谢发生改变,如导致植株甜甙合成途径中底物的量。具体地,取决于具体应用需求,可以通过多种方法来影响sgeph5基因在植物体内的表达,从而达到调控甜甙含量的效果。更具体地,调控sgeph5基因的表达可以使用许多本领域普通技术人员可获得的工具进行,例如,通过突变、诱变、反义基因的转入、共抑制或发夹结构的引入、基因的互补等。

本发明还提供一种获得sgeph5果实口感突变体材料的方法,所述方法通过突变植物内源的次生代谢调控基因sgeph5,或突变与其高度同源的基因的核苷酸序列,使该植物体次生代谢产物成分组成改变的过程。所述次生代谢调控基因sgeph5的核苷酸序列如seqidno:1或2所示,所述育性调控基因sgeph5的氨基酸序列如seqidno:3所示。所述“突变”包括但不限于以下方法,如用物理或化学的方法所导致的基因突变,化学方法包括用ems等诱变剂处理所导致的诱变,所述突变还可以是点突变,也可以是dna缺失或插入突变,也可以是通过rnai等基因沉默手段或者通过基因定点突变的方法,所述基因定点突变的方法包括但不限于zfn定点突变方法、talen定点突变方法、和/或crispr/cas9等基因编辑方法。

本发明上述突变体材料的应用,还包括上述dna序列或突变体材料在以下(a)至(b)中任一项中的应用:

(a)培育罗汉果品种或品系;

(b)培育葫芦科其它植物品种或品系。

本发明还提供了一个sgeph5基因的启动子,相应启动子的序列为sgeph5基因从atg到上游大约1500bp核苷酸组成的序列,更具体地,在水稻中,所述sgeph5基因启动子的核苷酸序列如seqidno:4所示。含有seqidno:4所示的核苷酸序列,或包含与seqidno:4中所列核苷酸序列具有90%以上相似性的核苷酸序列,或包含来源于seqidno:4序列上的500个及500以上连续的核苷酸片段,并且可以驱动与该启动子操作性连接的核苷酸序列在植物不同组织中的表达。含有上述序列的表达载体、转基因细胞系以及宿主菌等均属于本发明的保护范围。扩增本发明所公开的seqidno:4启动子的任一核苷酸片段的引物对也在本发明的保护范围之内。

本发明所提供的启动子核苷酸序列还可用于从罗汉果以外的其它植物中分离相应序列,尤其是从其他葫芦科植物中进行同源克隆。根据这些相应序列与本文所列启动子序列间的序列同源性,或与本启动子基因的同源性,使用如pcr、杂交等技术来鉴别分离这些相应序列。因此,根据它们与本发明所列的seqidno:4启动子序列(或其片段)间的序列相似性而分离的相应片段,也包括在实施方案中。

本发明所述的“启动子”是指一种dna调控区域,其通常包含能指导rna聚合酶ii在特定编码序列的合适转录起始位点起始rna合成的tata盒。启动子还可包含其它识别序列,这些识别序列通常位于tata盒的上游或5’端,通常被称为上游启动子元件,起调控转录效率的作用。本领域技术人员应该知晓,虽然已经鉴定了针对本发明公开的启动子区域的核苷酸序列,但是分离和鉴定处于本发明鉴定的特定启动子区域的tata盒上游区域的其它调控元件也在本发明的范围内。因此,本文公开的启动子区域通常被进一步界定为包含上游调控元件,例如用于调控编码序列的组织表达性和时间表达功能的那些元件、增强子等。以相同的方式,可以鉴定、分离出使得能在目的植株中进行表达的启动子元件,将其与其它核心启动子一起使用,以验证其在目的植株的表达。

所述基因启动子的功能可以通过以下方法进行分析:将启动子序列与报告基因可操作性连接,形成可转化的载体,再将该载体转入植株中,在获得转基因后代中,通过观察报告基因在植物各个组织器官中的表达情况来确认其表达特性;或者将上述载体亚克隆进用于瞬时表达实验的表达载体,通过瞬时表达实验来检测启动子或其调控区的功能。

用来测试启动子或调控区域功能的适当表达载体的选择将取决于宿主和将该表达载体引入宿主的方法,这类方法是本领域普通技术人员所熟知的。对于真核生物,在载体中的区域包括控制转录起始和控制加工的区域。这些区域被可操作地连接到报告基因,所述报告基因包括yfp、uida、gus基因或荧光素酶。包含位于基因组片段中的推定调控区的表达载体可以被引入完整的组织,例如阶段性花粉,或引入愈伤组织,以进行功能验证。

此外,本发明的启动子还可与并非sgeph5基因的核苷酸序列相连,以表达其它异源核苷酸序列。本发明的启动子核苷酸序列及其片段和变体可与异源核苷酸序列一起组装在一个表达盒中,用于在目的植株中表达。所述表达盒有合适的限制性酶切位点,用于插入所述启动子和异源核苷酸序列。这些表达盒可用于对任何植株进行遗传操作,以获得想要的相应表型。

本发明所述的将核苷酸序列、载体或表达盒转入植株或引入植株或对植株进行转化,均指通过常规的转基因方法,将核苷酸序列、载体或表达盒转入到受体细胞或受体植株中。植物生物技术领域技术人员已知的任何转基因方法均可被用于将重组表达载体转化进植物细胞中,以产生本发明的转基因植物。转化方法可包括直接和间接的转化方法。合适的直接方法包括聚乙二醇诱导的dna摄入、脂质体介导的转化、使用基因枪导入、电穿孔、以及显微注射。所述转化方法也包括农杆菌介导的植物转化方法等。

本发明还提供了一种高甜甙罗汉果的生产方法,其包括:

(a)构建本发明所提供的表达盒;

(b)将步骤(a)获得的表达盒导入植物细胞;

(c)再生出转基因植物;和

(d)选择出转基因植物;并且

(e)任选地,增殖步骤(d)获得的植物以获得后代。

本发明的转基因植物使用植物生物技术领域技术人员已知的转化方法制备。任何方法可被用于将重组表达载体转化进植物细胞中,以产生本发明的转基因植物。转化方法可包括直接和间接的转化方法。合适的直接方法包括聚乙二醇诱导的dna摄入、脂质体介导的转化、使用基因枪导入、电穿孔、以及显微注射等。在本发明的具体实施方式中,本发明使用了基于土壤杆菌的转化技术(可参见horschrb等(1985)science225:1229;whiteff,vectorsforgenetransferinhigherplants,transgenicplants,第1卷,engineeringandutilization,academicpress,1993,pp.15-38;jenesb等.techniquesforgenetransfer,transgenicplants,第1卷,engineeringandutilization,academicpress,1993,pp.128-143,等)。土壤杆菌菌株(例如根瘤土壤杆菌或毛根土壤杆菌)包含质粒(ti或ri质粒)和t-dna元件,所述质粒和元件在用土壤杆菌转染后被转移至植物,而t-dna被整合进植物细胞的基因组中。t-dna可位于ri-质粒或ti-质粒上,或独立地包含在所谓的双元载体中。土壤杆菌介导的转化方法描述于例如中。土壤杆菌介导的转化最适合双子叶植物,但是也适合单子叶植物。土壤杆菌对植物的转化描述于例如中。转化可导致瞬时或稳定的转化和表达。尽管本发明的核苷酸序列可被插入落入这些广泛种类中的任何植物和植物细胞中,但是其尤其适用于作物植物细胞。

与现有技术相比,本发明具有如下的有益效果:本发明提供了一种罗汉果环氧物水解酶基因及其启动子,该基因的调控表达体系用来调高罗汉果甜甙含量或改变葫芦科植物果实口感的育种生产,对于突破并改良罗汉果和其它葫芦科植物有重要意义。

附图说明

图1为罗汉果甜甙的生物合成途径示意图。

图2为罗汉果的实验材料生长于湖南省怀化市中方县,根据实验要求按时采摘。图中包括:正在开花的雄株;正在开花的雌株;罗汉果果实生长;罗汉果的生长环境。

图3为通过单分子测序技术对罗汉果全基因组进行测序,获得了一个新的高品质的罗汉果基因组。组装使用了31gb(~73.8x)长单分子实时测序(smrt)读取。最后的基因组组装约467.1mb,contign50长度为556347bp。

图4为罗汉果基因组组装评估,即利用不同组织器官的rna-seq得到的est序列对基因组进行的评估。

图5为在果实显著高表达转录本的表达热图。通过果实特异基因的富集,发现与甜甙合成相关的次生代谢途径基因。

图6为候选功能转录本kegg通路富集分析。

图7为罗汉果环氧化物水解酶与葫芦科植物黄瓜、西葫芦和山葫芦的进化比较,其中绿色为黄瓜;红色为西葫芦;黄色为山葫芦;蓝色为罗汉果。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1、罗汉果全基因组三代测序

罗汉果样品的种苗购自广西省桂林市永福地区,为最为广泛种植的青皮果品种。种苗种植在湖南省怀化市中方县(如图2所示)。于8-10月期间采集了罗汉果根、芽、叶、雄花和雌花、授粉后不同时期的果实。样品液氮冷冻后储存在-80摄氏度的冰箱内。罗汉果茎尖由于提取基因组dna,用于基因组测序试验。

本研究提取了高质量的dna,构建了2个插入片段为20kb的pacbiorsii文库,利用第三代测序平台pacbiorsii对dna进行非扩增长片段测序,总共44个smrtcells,获得罗汉果基因组原始测序数据。

本研究中,44个smrt(单分子实时)cells中获得了大约31gb的rawdata数据量,覆盖深度约达到73.8倍,rawreads的平均长度为11401bp,而n50长度为15754bp。原始reads通过去除低质量reads、接头污染之后,subreads平均长度可达7781bp,而subreadsn50长度为11898bp。去除低质量碱基以及测序接头以后,最终保留了82%的rawdata数据量,共约25.42gb,平均覆盖深度达到60.52倍。对于罗汉果品种青皮果基因组进行了超过100x的重测序,然后利用约50g的双端测序的读段进行了k-mer分析。通过kmergene软件对读长进行最佳k值估计,得到最佳k值为112,并对112-mer的序列进行分布分析。

通过单分子测序技术对罗汉果全基因组进行测序,获得了一个新的高品质的罗汉果基因组(如图3所示)。组装使用了31gb(~73.8x)长单分子实时测序(smrt)读取。最后的基因组组装约467.1mb,contign50长度为556347bp。

利用不同组织器官的rna-seq得到的est序列对基因组进行了评估(如图4所示)。在多数样品中reads的同源覆盖率超过80%,整体平均达到84%,错误率在千分之一以下。超过80%的est序列覆盖度,表明大部分编码区很好的体现在基因组组装的结果中。罗汉果基因组具有较高的完整性和准确度。蛋白数据库中存在植物中的1440个直系同源基因,有1167个(81%)可以在拼接的基因组中找到,其中包括877个单拷贝基因和290和多拷贝基因。

实施例2、罗汉果转录组的测序、组装与分析

罗汉果转录组测序的品种与基因组测序品种一致(如图5所示),均为青皮果,从广西省永福县引进,在湖南省怀化市中方县种植。在不同的生长发育阶段,分别采取雌性植株的叶片、雄性植株的叶片,邻近果实的叶片,新鲜的幼根、受精三天后的果实(3daa),以及受精20天的果实(20daa)共6个样品,每一个样品,至少有两个生物学重复。所有样品采集后,使用ddh2o清洗三次,而后用吸水纸擦干后迅速包好放于液氮中存储备用。

rna提取按照试剂盒所示步骤进行,样品检测合格后,每个样品取3μg总rna作为起始原料来构建转录组测序文库。根据ultratmrnalibraryprepkitfor(#e7530l,neb)的操作说明分别选取不同的index标签建库,并使用hiseqx-ten测序仪进行转录组测序。在本研宄中,我们使用trimmomatic(v0.33)软件对原始的测序数据进行质量控制。在获得基因的表达水平以后,我们采用deseq软件进行差异表达基因的分析。基因差异表达分析的输入数据为基因表达水平分析中得到的readcount数据,首先对readcount进行归一化(normalization),然后根据模型进行假设检验概率(pvalue)的计算,最后进行多重假设检验校正,得到fdr值(错误发现率)。在kegg富集分析中,用黄瓜基因组注释作为背景对这一时期叶片和果实基因表达与代谢途径的关系进行了初步分析。果实发育初期主要是果实的发育过程,授粉以后多种植物激素信号在果实中合成、传导,开始了果实和种子的构建过程,大量新的代谢过程被激活或代谢途径被增强。有16类代谢途径基因明显上调。其中planthormonesignaltransduction途径的基因表达明显上调,同时与罗汉果甜甙合成相关的代谢途径,包括phenylpropanoidbiosynthesis、phenylalaninemetabolism、glycolysis/gluconeogenesis、biosynthesisofsecondarymetabolites等,已经也明显上调,说明相关基因表达增强,次生代谢产物开始增加合成。在这一时期有些代谢途径还没有开始或不再需要因而基因表达已经下调,如种子内储藏物质的积累还没有开始,fattyacidmetabolism、fattyacidbiosynthesis、cysteineandmethioninemetabolism等与脂肪、蛋白质积累相关的代谢途径基因表达还处于下调阶段。植物体内代谢相关基因的表达调控与细胞组织的发育密切相关,基因表达的上调与下调在植物不同发育阶段有其特殊性。

候选功能转录本kegg通路富集分析(如图6所示)显示,在罗汉果的果实中有12类代谢途径基因明显上调。其中planthormonesignaltransduction途径的基因表达明显上调,同时与罗汉果甜甙合成相关的代谢途径,包括phenylpropanoidbiosynthesis、phenylalaninemetabolism、glycolysis/gluconeogenesis、biosynthesisofsecondarymetabolites等,已经也明显上调,说明相关基因表达增强,次生代谢产物开始增加合成。由于罗汉果中的甜甙是葫芦烷三萜烯类化合物,在其合成途径中涉及到一系列与类倍半萜烯和三萜烯化合物相关的基因,所以此结果与kegg通路富集分析结果相一致。

实施例3、罗汉果环氧化物水解酶基因(sgeph5)的克隆

全基因组测序和转录组测序,分别得到罗汉果环氧化物水解酶基因(sgeph5)序列信息。提取提取罗汉果成熟果实的基因组dna和rna,通过pcr技术分别合成引物,克隆了该基因的片段、cdna片段和启动子,将其基因命名为sgeph5。其中包括启动子dna片段(seqidno:4);cdna序列(seqidno:2)、基因组序列(seqidno:1)和氨基酸序列(seqidno:3)。

图7为罗汉果环氧化物水解酶与葫芦科植物黄瓜、西葫芦和山葫芦的进化比较,其中绿色为黄瓜;红色为西葫芦;黄色为山葫芦;蓝色为罗汉果。罗汉果的eph基因与黄瓜、西葫芦及山葫芦等葫芦科植物的eph基因亲缘关系比较复杂。罗汉果eph基因在染色体上常有亲缘关系很近的拷贝,同时也有特殊的小的聚类;大部分的小的聚类中葫芦科的4种植物都有各自的拷贝,但也有一些小聚类中没有罗汉果的拷贝。这说明在进化过程中eph基因高度重复和歧化,在各种植物中所承担的功能更加特异化。

实施例4、sgeph5基因在罗汉果果实中的表达分析

根据sgeph5基因的cdna序列设计引物,同时以罗汉果ubiquitin基因作为内参对照设计引物。分别提取罗汉果材料不同组织的总rna并合成cdna模板,再利用实时荧光定量pcr方法,分析sgeph5基因分别在罗汉果不同器官组织或时期的表达水平,其中包括:根、茎、叶、不同时期果实、雌蕊和雄花。sgeph5基因在花期的根、茎、叶、雌蕊以及雄花各发育阶段中均未检测到,但在罗汉果果实中相对较高,该实验表明sgeph5基因的表达与罗汉果果实次生代谢紧密联系。

实施例5、罗汉果环氧化物水解酶基因(sgeph5)的与甜甙合成关联实验

取不同发育阶段的罗汉果果实,定量pcr检测sgeph5基因的表达,同时提取相对应阶段罗汉果果实中罗汉果甜甙v,并检测含量。实验表明在果实发育早期(授粉后1-50天)sgeph5基因的表达与甜甙含量呈正相关。

序列表

<110>怀化兴科创生物技术有限公司

<120>罗汉果环氧化物水解酶sgeph5基因的应用

<160>4

<170>siposequencelisting1.0

<210>1

<211>2875

<212>dna

<213>罗汉果(siraitiagrosvenorii(swingle)c.jeffrey)

<400>1

atggcgaaaggcgggttttttgtcgataagattcggagatgtctaaggacgttgttcttt60

atggtggcgatggtggcgtcactgctcgtgtcgtcgttgccagtgcttgtggccatcgga120

gacatgttggtgccctgtattttgatctccagctttacgtgcgttacgtgctacggcttc180

aaagagcatttgcatcgatacgctttcaaaagttctttgactgatatccctttcgtttcg240

atgatcagatctctcattattatctgtacgattccgatttccgatcatcctgctatttcg300

tctatttaaacctgcatctctcaatctttaacaaacagattccctcgagcatttcttcct360

tcaattttgtatgctgggtcgttgagaaatgagagatattagatgttaattcgattatca420

tcatcagggtttcagtttttcgcttgttggtgatgtttctggttttgatcgcaggtgttt480

attcaatgtgtgatggccctgctctttcaaatggtccttacctgggaacagtgactttat540

gttccttcatctccattcttgttctttctattaaggtttgtgtctttacagtaaactccc600

aaatcgaggctgaagcttcgtcttccccctcaaggcagaagcttcacttaaaaaaatcat660

gggggatgccagttttgtttctatcttcagtagcctttgcccttggccatacggtggtgg720

cttacagaacaagctgcagagcacgtagaaagcttctattgcatcgagttgacccagaag780

ctgtaagttttaaagctttaactacaaaaaagaagaaaatggcttgttcctgtttttaaa840

ttttgtagttgagcctgctctaataaacctccaatttgacttggcaggccctttcttgca900

aaaatgtattctctggctaccagaagatcccacgatcccccactccttctggatccaaaa960

ccccaaagagtgacagtgaaatcaagtggaaggcttcaggcaatgctcgcgacgagagtg1020

aactgccggttagattgctcgctgacattgatagtttattcatcacatgtcaaggtctta1080

ccatccattacaagatcagcttgcccgggtcaccaccacggtcgttgtcctccgccgctt1140

ttctcgaacccggttatagttgcaactccccaaagaaggccataggaaggccggtagttg1200

acaggcatccatttagtgttttatcaaaaaaccaacacaacatccacaggagctatagca1260

accagtttcacagttcatccctctatgatccactattggatggttctgcaacaacttctc1320

cagttctttgtgatgaaatcccagtgataagtctagatgaagttgaagaagaggaattga1380

gcaaagatagcatagatggaaactcagagagcaacgggcaattcggtatcgtgttggtgc1440

atggtttcggtggaggagtgttctcgtggagacatgtgatgggggtgcttgcaaggcaga1500

ctggttgcagagttgctgcttacgaccggcctggttggggattaacttcaaggctgcgtg1560

cagaagactgggaagaaaaagaattgcctaacccctacaagcttgaaagtcaggtaacta1620

aagtcgtgcatttttctctcttttttcttttttggtagagccactccttgtgtttgggta1680

ggcactatgcatttttcttctgaccttttattgtcttttgcagtgaaagggaaggggtct1740

atgatttgaaatctagatcattttgcctgttacattgtttttcctatgttttccatccct1800

tgtatagttcctaaaattccaaattcttgtttagtccctaaaccttgcattaccgtagat1860

ggcatagtgatatgagagtatatggattattggttgtttggtgttttttcaggtggagct1920

gctgctttcattttgctcggagatggggttttcttcagtggtgctggtgggtcatgatga1980

cggaggtctgctagctctcaaggcagcgcaaaggcttcaaggatcaatgaactcattcaa2040

tgtaagtttgtttttgtgtttaattgaacaaagtagtaatgaatttgttgggtttgatgt2100

caatggtgatggtgatggtgatggtgatggtgatggggggcaggtttcgatcagaggagt2160

ggtgttgctgagtgtaagcttatcaagagaggtggttcctgggtttgcgaggattctgct2220

acgaacatcgctggggaagaagcacttggttcgtcctctgctgcgaaccgaaataactca2280

ggtggtgaaccggcgtgcctggtacgatgccaccaagttaacaaccgaggtcctaaatct2340

ctataaggtaacgccatattacattcacgaaacctcgtccttgtactcaagatatgccct2400

ctgcctggctgctgtttgaatttattatcaattatttgtttgtttgtgaatgaagcagag2460

ggcgttgtgtgtggaagggtgggatgaagcgttgcatgagatagcgagattatcgtacga2520

gaccctgctttctccaacaaatgcagaatcgttgctgaaggctgttgaagagatgccggt2580

gttggtggtgggtggtgttgaggatgccctcgtctccctcaaatcttctcaagcaatggc2640

ctccaaactcccaaattctgtaaggcttcattctctcctcatcctatttttcttataata2700

atgatgattacaataacaataataaataataatgcaaatgcagagactgattacgatatc2760

tggatgcggacatctcccacacgaggaatgccccagcgccttgcttgctgcagtatcccc2820

cttcatcaccagaattttgcaaaacccaccacaccacttcctccaaacccaatag2875

<210>2

<211>1965

<212>dna

<213>罗汉果(siraitiagrosvenorii(swingle)c.jeffrey)

<400>2

atggcgaaaggcgggttttttgtcgataagattcggagatgtctaaggacgttgttcttt60

atggtggcgatggtggcgtcactgctcgtgtcgtcgttgccagtgcttgtggccatcgga120

gacatgttggtgccctgtattttgatctccagctttacgtgcgttacgtgctacggcttc180

aaagagcatttgcatcgatacgctttcaaaagttctttgactgatatccctttcgtttcg240

atgatcagatctctcattattatctgtgtttattcaatgtgtgatggccctgctctttca300

aatggtccttacctgggaacagtgactttatgttccttcatctccattcttgttctttct360

attaaggtttgtgtctttacagtaaactcccaaatcgaggctgaagcttcgtcttccccc420

tcaaggcagaagcttcacttaaaaaaatcatgggggatgccagttttgtttctatcttca480

gtagcctttgcccttggccatacggtggtggcttacagaacaagctgcagagcacgtaga540

aagcttctattgcatcgagttgacccagaagctgccctttcttgcaaaaatgtattctct600

ggctaccagaagatcccacgatcccccactccttctggatccaaaaccccaaagagtgac660

agtgaaatcaagtggaaggcttcaggcaatgctcgcgacgagagtgaactgccggttaga720

ttgctcgctgacattgatagtttattcatcacatgtcaaggtcttaccatccattacaag780

atcagcttgcccgggtcaccaccacggtcgttgtcctccgccgcttttctcgaacccggt840

tatagttgcaactccccaaagaaggccataggaaggccggtagttgacaggcatccattt900

agtgttttatcaaaaaaccaacacaacatccacaggagctatagcaaccagtttcacagt960

tcatccctctatgatccactattggatggttctgcaacaacttctccagttctttgtgat1020

gaaatcccagtgataagtctagatgaagttgaagaagaggaattgagcaaagatagcata1080

gatggaaactcagagagcaacgggcaattcggtatcgtgttggtgcatggtttcggtgga1140

ggagtgttctcgtggagacatgtgatgggggtgcttgcaaggcagactggttgcagagtt1200

gctgcttacgaccggcctggttggggattaacttcaaggctgcgtgcagaagactgggaa1260

gaaaaagaattgcctaacccctacaagcttgaaagtcaggtggagctgctgctttcattt1320

tgctcggagatggggttttcttcagtggtgctggtgggtcatgatgacggaggtctgcta1380

gctctcaaggcagcgcaaaggcttcaaggatcaatgaactcattcaatgtttcgatcaga1440

ggagtggtgttgctgagtgtaagcttatcaagagaggtggttcctgggtttgcgaggatt1500

ctgctacgaacatcgctggggaagaagcacttggttcgtcctctgctgcgaaccgaaata1560

actcaggtggtgaaccggcgtgcctggtacgatgccaccaagttaacaaccgaggtccta1620

aatctctataagagggcgttgtgtgtggaagggtgggatgaagcgttgcatgagatagcg1680

agattatcgtacgagaccctgctttctccaacaaatgcagaatcgttgctgaaggctgtt1740

gaagagatgccggtgttggtggtgggtggtgttgaggatgccctcgtctccctcaaatct1800

tctcaagcaatggcctccaaactcccaaattctagactgattacgatatctggatgcgga1860

catctcccacacgaggaatgccccagcgccttgcttgctgcagtatcccccttcatcacc1920

agaattttgcaaaacccaccacaccacttcctccaaacccaatag1965

<210>3

<211>654

<212>prt

<213>罗汉果(siraitiagrosvenorii(swingle)c.jeffrey)

<400>3

metalalysglyglyphephevalasplysileargargcysleuarg

151015

thrleuphephemetvalalametvalalaserleuleuvalserser

202530

leuprovalleuvalalaileglyaspmetleuvalprocysileleu

354045

ileserserphethrcysvalthrcystyrglyphelysgluhisleu

505560

hisargtyralaphelysserserleuthraspileprophevalser

65707580

metileargserleuileileilecysvaltyrsermetcysaspgly

859095

proalaleuserasnglyprotyrleuglythrvalthrleucysser

100105110

pheileserileleuvalleuserilelysvalcysvalphethrval

115120125

asnserglnileglualaglualaserserserproserargglnlys

130135140

leuhisleulyslyssertrpglymetprovalleupheleuserser

145150155160

valalaphealaleuglyhisthrvalvalalatyrargthrsercys

165170175

argalaargarglysleuleuleuhisargvalaspproglualaala

180185190

leusercyslysasnvalpheserglytyrglnlysileproargser

195200205

prothrproserglyserlysthrprolysseraspsergluilelys

210215220

trplysalaserglyasnalaargaspglusergluleuprovalarg

225230235240

leuleualaaspileaspserleupheilethrcysglnglyleuthr

245250255

ilehistyrlysileserleuproglyserproproargserleuser

260265270

seralaalapheleugluproglytyrsercysasnserprolyslys

275280285

alaileglyargprovalvalasparghispropheservalleuser

290295300

lysasnglnhisasnilehisargsertyrserasnglnphehisser

305310315320

serserleutyraspproleuleuaspglyseralathrthrserpro

325330335

valleucysaspgluileprovalileserleuaspgluvalgluglu

340345350

glugluleuserlysaspserileaspglyasnsergluserasngly

355360365

glnpheglyilevalleuvalhisglypheglyglyglyvalpheser

370375380

trparghisvalmetglyvalleualaargglnthrglycysargval

385390395400

alaalatyraspargproglytrpglyleuthrserargleuargala

405410415

gluasptrpgluglulysgluleuproasnprotyrlysleugluser

420425430

glnvalgluleuleuleuserphecysserglumetglypheserser

435440445

valvalleuvalglyhisaspaspglyglyleuleualaleulysala

450455460

alaglnargleuglnglysermetasnserpheasnvalserilearg

465470475480

glyvalvalleuleuservalserleuserarggluvalvalprogly

485490495

phealaargileleuleuargthrserleuglylyslyshisleuval

500505510

argproleuleuargthrgluilethrglnvalvalasnargargala

515520525

trptyraspalathrlysleuthrthrgluvalleuasnleutyrlys

530535540

argalaleucysvalgluglytrpaspglualaleuhisgluileala

545550555560

argleusertyrgluthrleuleuserprothrasnalagluserleu

565570575

leulysalavalgluglumetprovalleuvalvalglyglyvalglu

580585590

aspalaleuvalserleulysserserglnalametalaserlysleu

595600605

proasnserargleuilethrileserglycysglyhisleuprohis

610615620

gluglucysproseralaleuleualaalavalserpropheilethr

625630635640

argileleuglnasnproprohishispheleuglnthrgln

645650

<210>4

<211>1500

<212>dna

<213>罗汉果(siraitiagrosvenorii(swingle)c.jeffrey)

<400>4

ctcctccccccttttgcttccacttctctttctccgccgcacctattatttttacttttt60

ttttttctcttacacttttattcagatcatttcaaatatatatgtaaaactaaaagatta120

aattacatgttaaatatctaaatttttataattatatttaatatattcataaatttttat180

ttttatttttaataaatttagaaattttaaaaaatttctaatatattaagaatcaattca240

atgacatattaaacacaaaatttaaagtttaaaaatctattagacactttttaaagttag300

aaaacttattaaacacaattttaaaagttcatagatcaaatttgtagtttaacctaacta360

aaaatattaatacaaaaatataccttaattggttaagaaatccagtaatctccttaaaga420

ttgaaatctgcctactctcttgttgaaatatatataaattgaatgaaaataaagaactac480

gaaatcaagggttgtcaaattatatttatctacttaaacaaaatttctttgttttgtatt540

ctactattttcataagtaaattatacatcttgaaaaccaatataataatttatcaaaaat600

atacttttttttttctttgatttcagttaagattttaaatgtgtcttcaaagtaaaagat660

atttttttaaaaaaaaatgtatgactgtttaatatatcaaatttctatttttacactaaa720

tatttagtaataattttgttgttatcaattattatttcctaacaaaaggaccatttattg780

agcgagaaatcttaccttagagattgaattacattattaataattaagggccacttcgaa840

tttagagagagagagcgctggatgtaaaaagggtattttggtaaaatggaaaatggtgcc900

aggtttgcaacgggttgggcactggattaattaatatttttaatataaaagatttttctt960

ttttgcgaataccgtcctatgatcctcacgatgcttacgaagaatccctaattttcaaat1020

attattttaattaaaaaagagagagagagagagagagggagacagagggagagaattcaa1080

aatccaacatcaacatctttcaggaaacgcacacaaggaaaagggaaggttttttatttc1140

aaagctttcaatacctattgatctcctctccgctcatccctctctgtaagagaaggaccc1200

cttttgaagccctagccatttcccgtccatggcgttcctattggcttccacccacctttt1260

ccggcttctttaagatcgtcgtcttgcttttttaagtcgccgccgggaaatggccgataa1320

gccgcctgcagatgggttcttcttaacctcgccgccaccggctagggtttcactgtgctc1380

tcggaatcccacataactttttttgttgggattgccttctgacgatttgtccgatcaatc1440

ggaggcatttggagcattaaagggccgtgggttggttggttggttggtttcgtcgttttc1500

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1