专利名称:基因表达的抑制的制作方法
技术领域:
本发明涉及一种抑制基因表达、具体是抑制植物中基因表达的方法。本发明也涉及一种用于该方法的核苷酸序列。此外,本发明涉及一种可用于表达该核苷酸序列的启动子。
在植物、尤其是高等植物中,淀粉是主要的贮存糖类之一。淀粉的结构包括直链淀粉和支链淀粉。直链淀粉基本上是由α-1-4-连接的糖残基的直链组成的。支链淀粉包括具有一些α-1-6分支的α-1-4-连接的糖残基的链。支链淀粉分支的性质是通过其中一种通常称作淀粉分支酶(“SBE”)的酶的作用来实现的。通过在α-1,6-糖苷分支键中加入α-1,4葡聚糖,SBE催化支链淀粉分子中分支点的形成。在
图1中示意性地显示出直链淀粉和支链淀粉的生物合成,而在图2中显示出α-1-4-键和α-1-6键。
已知淀粉是一种重要的原材料。淀粉广泛用于食品、造纸以及化学工业。但是为了得到具有某种所需功能特性的淀粉,用于这些工业应用中的大部分淀粉均是通过化学、物理或者酶的方法采后修饰的。
在过去的几年里,制成能够生产出与采后修饰(modified)淀粉相同的修饰淀粉的遗传修饰植物正是人们所需要的。也已知通过表达反义核苷酸的编码序列可能可以制备出上述经遗传修饰的植物。在这一方面,JuneBourque提供了一个在植物中进行遗传操作的反义方案的详细摘要(Bourque 1995植物科学105 pp 125-149)。
虽然已知酶的活性受到具体的核苷酸序列的表达影响(例如参阅Finnegan和McElroy《生物技术》12 883-888以及Matzke和MatzkeTIG 11 1-3的教导),仍需要一种可以更可靠和/或更有效和/或更具体地影响酶活性的方法。
根据本发明的第一方面,本发明提供了一种在植物(或其细胞,组织或者器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地编码(是)以有义取向的内含子;并且其中所说的核苷酸序列不含有通常与该内含子有关的有义外显子序列这样的序列。
根据本发明的第二方面,本发明提供了一种在生产淀粉的生物体(或其细胞,组织或者器官)中影响酶活性的方法,该方法包括在生产淀粉的生物体(或其细胞,组织或者器官)中表达核苷酸序列,其中所示的核苷酸序列部分或者完整地编码(是)以有义取向的内含子;其中所说的核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列;并且其中淀粉分支酶的活性受到影响和/或支链淀粉的含量受到影响和/或改变了淀粉的组成。
根据本发明的第三方面,本发明提供了一种包括如SEQ.I.D.No.1至SEQ.I.D.No.13之任一所示的核苷酸序列的序列或其变体、衍生物或者同系物。
根据本发明的第四方面,本发明提供了一种包括如SEQ.I.D.No.14所示序列的启动子或其变体、衍生物或者同系物。
根据本发明的第五方面,本发明提供了一种能够包括或者表达本发明的构建体。
根据本发明的第六方面,本发明提供了一种包括或者表达本发明的载体。
根据本发明的第七方面,本发明提供了一种包括或者表达本发明的细胞、组织或者器官。
根据本发明的第八方面,本发明提供了一种包括或者表达本发明的转基因的生产淀粉的生物体。根据本发明的第九方面,本发明提供了一种从本发明得到的淀粉。
根据本发明的第十方面,本发明提供了pBEA11(NCIMB 40754)。根据本发明的第十一方面,本发明提供了一种可以从λ-SBE 3.2(NCIMB40751)或λ-SBE 3.4(NCIMB 40752)得到的有义核苷酸序列或其变体、衍生物或者同系物。
本发明主要的优点在于它提供了一种用于制备修饰淀粉的方法,而该方法不需要进行淀粉的采后修饰。因此本发明的方法避免了对通常用于淀粉采后修饰的危险化学物质使用的需要。
此外,本发明还提供了经遗传修饰的植物,该植物可以生产出其特性将满足不同的工业需要的修饰的和/或新的和/或改进的淀粉。
因此,本发明提供了一种在植物中制备特制(tailor-made)淀粉的方法,其中该淀粉可以代替采后修饰的淀粉。
本发明也提供了一种可以通过与已知的采后修饰方法相比对环境的影响更为有益的方法来制备修饰淀粉的方法,其中的采后修饰方法要求使用危险的化学物质以及大量的能量。
本发明另一个主要的优点在于与已知的影响酶活性的方法相比,它提供了一种可能更可靠和/或更有效和/或更特异地影响酶活性的方法。关于本发明的这一优点,应当指出在SBEs的编码区之间存在一定程度的同源性。但与SBEs的内含子序列存在极少的或者不存在同源性。因此,有义内含子的表达提供了选择性地影响具体的SBE表达的机制。这一有利方面例如可以用来减少或者除去一种具体的SBE酶以及用另一种酶来代替该酶,其中的另一种酶可以是另一种分支酶或者甚至为受到影响的酶的重组形式或者甚至为一种比如可以包括来自一个来源的SBE酶的一部分以及至少来自另一来源的另一SBE酶的至少一部分的杂种酶。以下更详细地讨论本发明组合的几个方面将包括本发明的这一具体特征。
因此本发明提供了一种选择性地影响SBE活性的机制,这与现有技术中取决于使用例如反义外显子表达的方法形成对比,通过现有技术的方法是不可能引入新的SBE的活性而又不影响原有活性的。
优选关于本发明的第一方面,淀粉分支酶的活性受到影响和/或其中支链淀粉的含量受到影响和/或改变了淀粉的组成。
优选关于本发明的第一或第二方面,所说的核苷酸序列不含有外显子序列的有义序列。
优选关于本发明的第四方面,所说的启动子与一个感兴趣的基因(“GOI”)组合。
优选地,降低或者去除了所说的酶的活性。
优选地,所说的核苷酸序列至少基本上编码以有义取向的至少一个内含子的全部。
优选地,所说的核苷酸序列部分或者完整地编码2个或者多个内含子并且其中的每个内含子均以有义取向。
优选地,所说的核苷酸序列包括至少350个核苷酸(例如350 bp),更优选包括至少500个核苷酸(例如500 bp)。
优选地,所说的核苷酸序列包括如SEQ.I.D.No.1至SEQ.I.D.No.13之任一所示的序列或其变体、衍生物或者同系物,其中也包括其组合。
优选地,所说的核苷酸序列是通过具有如SEQ.I.D.No.14所示序列的启动子或其变体、衍生物或者同系物表达的。
优选地,转基因的生产淀粉的生物体为植物。
因此,本发明一个优选的方面涉及一种在植物(或其细胞,组织或者器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地编码以有义取向的内含子;其中所说的核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列;并且其中淀粉分支酶的活性受到影响和/或其中支链淀粉的含量受到影响和/或改变了淀粉的组成。
因此,本发明一个更优选的方面涉及一种在植物(或其细胞,组织或者器官)中影响酶的活性的方法,该方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地编码以有义取向的内含子;其中所说的核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列;其中淀粉分支酶的活性受到影响和/或其中支链淀粉的含量受到影响和/或改变了淀粉的组成;并且其中所说的核苷酸序列包括如SEQ.I.D.No.1至SEQ.I.D.No.13之任一所示的序列或其变体、衍生物或者同系物,其中也包括其组合。
与本发明有关的术语“核苷酸”包括DNA和RNA。优选地,该术语是指DNA,更优选地是指通过使用重组DNA技术制备的DNA。
在常规意义上,使用术语“内含子”来表示核苷酸的一个区段,它通常为DNA,并且它不编码部分或者全部所表达的蛋白质或酶。
在常规意义上,使用术语“外显子”来表示核苷酸的一个区段,它通常为DNA,并且它编码部分或者全部所表达的蛋白质或酶。
因此,术语“内含子”是指被转录成RNA分子但在把该RNA翻译成蛋白质之前从RNA中剪接掉的基因区。相反地,术语“外显子”是指被转录成RNA,随后又翻译成蛋白质的基因区。
与本发明的核苷酸序列有关的术语“变体”或“同系物”或“片段”包括各个核苷酸序列的一个(或多个)核酸的任意的取代、变化、修饰、置换、缺失或者添加,只要所得到的核苷酸序列可以影响植物或其细胞或者组织中的酶的活性即可,优选其中所得到的核苷酸序列至少与如SEQ.I.D.No.s 1-13所示的有义序列的任意一个序列具有相同的效果。更具体地讲,术语“同系物”包括与结构相似性和/或功能相似性有关的同源性,只要所得到的核苷酸序列具有影响本发明的酶活性的能力即可。就序列同源性(即相似性)而言,优选存在大于80%的同源性,更优选至少有85%的同源性,更优选至少有90%的同源性,甚至于更优选至少有95%的同源性,更优选至少有98%的同源性。以上的术语与序列的等位变异也是同义的。
类似地,与本发明的启动子有关的术语“变体”或“同系物”或“片段”包括各个启动子序列的一个(或多个)核酸的任意的取代、变化、修饰、置换、缺失或者添加,只要所得到的启动子序列允许GOI的表达即可,优选其中所得到的启动子序列至少与SEQ.I.D.No.14具有相同的效果。更具体地讲,术语“同系物”包括与结构相似性和/或功能相似性有关的同源性,只要所得到的启动子序列具有允许诸如本发明的一个核苷酸序列GOI表达的能力即可。就序列同源性(即相似性)而言,优选存在大于80%的同源性,更优选至少有85%的同源性,更优选至少有90%的同源性,甚至于更优选至少有95%的同源性,更优选至少有98%的同源性。以上的术语与序列的等位变异也是同义的。
本发明的内含子序列可以是任意一个或者全部的本发明的内含子序列,其中也包括了其部分序列,只要使用了部分的有义序列(即并非或者不包括如SEQ.I.D.No.1-13所示的任意一个或多个的完整的序列),该部分序列就会影响酶的活性。部分序列的合适的例子包括短于如SEQ.I.D.No.s 1至13所示的任意一个完整的有义序列的序列,但该序列包括邻接的外显子或多个外显子的核苷酸。
对于本发明的第二方面而言(即特异性地影响SBE活性),本发明的核苷酸序列可以包括SBE基因的一个或者多个有义或反义外显子序列(但不包括天生就与所说的内含子序列有关的有义外显子序列),其中也包括其完整的或者部分的序列,而只要该核苷酸序列可以影向SBE活性即可,优选其中所说的核苷酸序列降低或者去除了SBE活性。优选地,本发明第二方面的核苷酸序列不包括有义外显子序列。
术语“载体”包括表达载体和转化载体。术语“表达载体”是指能够在体内或体外进行表达的构建体。术语“转化载体”是指能够从一个物种转移至另一物种的构建体-诸如从大肠杆菌质粒转移至真菌或者植物细胞中,或者从农杆菌转移至植物细胞中。
与本发明的有义核苷酸序列方面有关的术语“构建体”包括直接或间接地附着到一个启动子上的本发明的核苷酸序列,该术语与诸如“偶联物”、“序列盒”和“杂种分子”之类的术语是同义的。间接附着的实例为提供了一种诸如内含子序列(诸如Sh1-内含子或ADH内含子)的合适的间隔序列来间隔本发明的启动子及核苷酸序列。对于与本发明有关的包括直接或间接附着的术语“融合的”而言,情况同样属实。该术语不包括在自然环境下与野生型SBE基因启动子有关的野生型SBE基因的自然组合。
所说的构建体甚至可以包括或表达一种可用于选择转移了遗传构建体的植物细胞的标记物,其中的标记物已被转化至该植物细胞中。存在多种可用于例如植物的标记物-诸如甘露糖。其它标记物的实例包括那些提供了抗生素抗性的标记物-例如对G418、潮霉素、博来霉素、卡那霉素及庆大霉素的抗性。
本发明的构建体优选包括一个启动子。术语“启动子”按照本领域的通常意义来使用,例如在基因表达的Jacob-Monod理论中RNA聚合酶的结合位点。合适的启动子的例子为那些可以指导本发明的核苷酸序列有效表达和/或在特异细胞类型中指导有效表达的启动子。在WO 92/11375中公开了对组织具有特异性的启动子的一些实例。
该启动子还可以包括如Pribnow盒或TATA盒之类的保守区。该启动子甚至可以包含影响(诸如维持、提高、降低)本发明的核苷酸序列表达水平的其它序列。上述序列的合适的例子包括Sh1-内含子或ADH内含子。其它序列包括可诱导元件-诸如温度,化学药剂,光或者应激可诱导元件。而且可以存在适于提高转录或翻译的元件。一个在后元件的实例为TMV 5’前导序列。(参见Sleat Gene 217217-225;以及Dawson植物分子生物学2397)。
正如所述,本发明的构建体和/或载体可以包括能够提供受调控的或者组成型表达的转录起始区。任意合适的用于转录起始区的启动子为patatin启动子或E35S启动子。另一方面,优选启动子为SBE启动子。
例如,如果生物体为植物的话,那么启动子可以是一种影响在种子、块茎、茎、新芽、根及叶片组织的任意一种或多种中的核苷酸序列表达的启动子,其中优选块茎。举例来说,用于本发明核苷酸序列的启动子可以为如我们在1994年10月21日提交的共同未决的英国专利申请No.9421292.5中所述的α-Amy 1启动子(此处称作Amy 1启动子,Amy637启动子或α-Amy 637启动子)。另外,用于本发明核苷酸序列的启动子可以为如我们在1994年10月21日提交的共同未决的英国专利申请No.9421286.7中所述的α-Amy 3启动子(此外称作Amy 3启动子,Amy351启动子或α-Amy 351启动子)。
本发明也包括使用启动子以表达本发明的核苷酸序列,其中使该启动子的一部分失活但其中该启动子仍能起到一个启动子的作用。在某些情况下,一个启动子的部分失活是有利的。尤其对以前提到的Amy 351启动子而言,使该启动子的一部分失活从而该部分失活的启动子以更为特异的方式,诸如仅以一种特异的组织类型或器官,来表达本发明的核苷酸序列是可能的。术语“失活的”是指在改进了启动子的表达模式但其中部分失活的启动子仍起到一个启动子作用的意义上而言的部分失活。但是如上所述,经修饰的启动子能够在原始启动子的至少一种(但并非全部)特异的组织中表达编码本发明的酶的基因。部分失活的实例包括改变启动子序列的折叠模式或者改变与部分核苷酸序列的结合种类,以便于该核苷酸序列的一部分不为例如RNA聚合酶所识别。另外并且优选地,使启动子部分失活的方式是截短启动子以形成其片段。另一种方式为使该序列的至少一部分突变,以便于RNA聚合酶无法结合到该部分或另一部分上。另一种修饰为突变调节蛋白(例如从丝状真菌中已知的CreA蛋白)的结合位点以产生碳的分解代谢物的阻遏并从而消除天然启动子的分解代谢物的阻遏。
本发明的构建体和/或载体可以包括转录的终止区。
本发明的核苷酸可以与额外的构建体组合(但不必同时)加以表达。因此本发明也提供了构建体的一种组合,该组合包括含有可操作地连接到第一启动子上的本发明的核苷酸序列的第一构建体;以及含有可操作地连接到第二启动子上(该启动子不必与第一启动子相同)的GOI的第二构建体。就本发明的这一方面而言,构建体的这种组合可以存在于同一载体、质粒、细胞、组织、器官或生物体中。本发明的这一方面也包括表达上述物质的方法,其中优选在生物体的特异的细胞或组织中表达,诸如仅在生物体的一种特异的细胞或组织中表达,而生物体一般为植物。就本发明的这一方面而言,当通常与野生型基因的启动子有关的编码酶的基因与该野生型基因的启动子均处于其自然状态时,所说的第二构建体不包括这种天然组合。
合适的组合的实例为包括本发明的核苷酸序列和启动子,诸如本发明的启动子,的第一构建体以及包括启动子,诸如本发明的启动子,和GOI的第二构建体,其中GOI以有义或者反义取向来编码另一种淀粉分支酶。
以上有关于针对本发明的有义核苷酸的术语“构建体”的注释同样可用于针对本发明启动子的术语“构建体”。在这一方面,该术语包括直接或间接附着到GOI上的本发明的启动子。
就本发明的启动子方面或本发明的组合方面而言的术语“GOI”是指任何感兴趣的基因,如下所述,该基因不必编码蛋白质或酶。GOI可以是讨论中的生物体,例如植物,外源或者天然的任意核苷酸序列。
GOI的典型实例包括编码改进了代谢及分解代谢途径的其它蛋白质或者酶的基因。GOI可以编码用于引入或者提高病原体抗性的试剂。
GOI甚至可以为用于改进存在于相关组织中的天然转录物表达的反义构建体。上述GOI的实例为本发明的核苷酸序列。
GOI甚至可以编码宿主生物体,例如植物,的非天然蛋白质。GOI可以编码有利于动物或者人类的化合物。例如,GOI能编码具有药物活性的蛋白质或酶,诸如治疗化合物胰岛素、干扰素、人血清白蛋白、人生长因子以及凝血因子中的任意一种。GOI甚至可以编码给食品或饲料或作物提供额外的营养价值的蛋白质。典型的实例包括可以抑制抗-营养因子形成的植物蛋白以及具有更为人所需的氨基酸的组成,例如比非转基因植物具有更高的赖氨酸含量,的植物蛋白。GOI甚至可以编码可用于食品加工中的酶,诸如木聚糖酶和α-半乳糖苷酶,GOI可以为编码任意一种害虫毒素的基因,可以为一种诸如针对α-淀粉酶、蛋白酶或葡聚糖酶的反义转录物。此外,GOI可以为本发明的核苷酸序列。
GOI可以是编码阿拉伯呋喃糖苷酶的核苷酸序列,而这是我们共同未决的英国专利申请9505479.7的主题。GOI可以是编码葡聚糖酶的核苷酸序列,而这是我们共同未决的英国专利申请9505475.5的主题。GOI可以是编码α-淀粉酶的核苷酸序列,而这是我们共同未决的英国专利申请9413439.2的主题。GOI可以是编码α-淀粉酶的核苷酸序列,而这是我们共同未决的英国专利申请9421290.9的主题。GOI可以是编码α-glucanlyase的任意一种核苷酸序列,而这在我们共同未决的PCT专利申请PCT/EP94/03397中已有描述。
一方面,GOI甚至可以是可操作地连接到一个不同的启动子的本发明的核苷酸序列。
GOI可以包括编码木聚糖酶、arabinase、乙酰酯酶、鼠李糖半乳糖醛酸聚糖酶(rhamnogalacturonase)、葡聚糖酶、果胶酶、分支酶或另一种糖类修饰酶或蛋白酶的一种或多种酶的序列。此外,GOI可以是任意一种上述序列的反义序列。
如上所述,本发明提供了一种选择性地影响特有的酶活性的机制。
就本发明一个重要的应用而言,目前可能通过表达特有的基因组的蛋白质或酶的有义内含子构建体以及(例如同时)表达该酶或蛋白质的重组形式,换言之即GOI为编码该基因组的酶或蛋白质的重组核苷酸序列,来减少或消除编码该基因组的蛋白质或酶的基因组核苷酸序列的表达。这一应用使得可以在缺乏各自的基因组酶及蛋白质(或者该酶及蛋白质的含量降低)的条件下表达所需的重组酶或蛋白质。因此,所需的重组酶及蛋白质可以容易地从宿主生物体中分离和纯化。本发明这一特有的方面明显优越于现有技术的方法,例如现有技术的方法取决于使用了反义外显子的表达,而该方法也影响重组酶的表达。
因此,本发明另一方面涉及在一个宿主生物体中表达重组蛋白或酶的方法,该方法包括表达编码该重组蛋白或酶的核苷酸序列;以及表达另一个核苷酸序列,其中所说的另一个核苷酸序列部分或者完整地以有义取向编码内含子;其中所说的内含子为通常与编码相应于重组蛋白或酶的蛋白或酶的基因组基因有关的内含子;并且其中所说的另一个核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列。另一方面包括上述核苷酸序列的组合,其中包括所说序列在构建体、载体、细胞、组织、及转基因生物体中的插入。
因此,本发明也涉及核苷酸序列的组合,该组合包括编码重组酶的第一核苷酸序列;以及对应于以有义取向的内含子的第二核苷酸序列;其中所说的内含子为与编码对应于重组酶的酶的基因组基因有关的内含子;并且其中所说的第二核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列。
GOI甚至可以编码一个或多个但以反义取向的内含子,诸如在所附序列表中提供的任意一个或多个反义内含子序列。例如,本发明也包括与如一个反义内含子组合的一个有义内含子(例如SEQ.I.D.No.1)的表达,其中优选该反义内含子不互补于所说的有义内含子序列(如SEQ.I.D.No.16)。
术语“细胞”、“组织”和“器官”包括其自身及存在于生物体内的细胞、组织和器官。
与本发明有关的术语“生物体”包括可以含有本发明的核苷酸序列和/或其中当本发明的核苷酸序列存在于该生物体中时可以表达所说序列的任意的生物体。所说的生物体优选为生产淀粉的生物体,诸如任意一种植物、藻类、真菌、酵母、细菌及其细胞系。所说的生物体优选为植物。
术语“生产淀粉的生物体”包括能够生物合成淀粉的任意的生物体。优选地,该生产淀粉的生物体为植物。
如本文所使用的术语“植物”包括任何适宜的被子植物,裸子植物,单子叶植物及双子叶植物。合适的植物的典型实例包括如马铃薯等的蔬菜;如小麦、玉米及大麦等的谷物;水果;树木;花卉;以及其它的植物作物。该术语优选是指“马铃薯”。
与本发明有关的术语“转基因生物体”包括含有本发明的核苷酸序列和/或从中得到产物的任意的生物体,和/或在其中可以表达本发明的核苷酸序列生物体。优选在该生物体的基因组中插入本发明的核苷酸序列。该转基因生物体优选为植物,更优选为马铃薯。
为了制备宿主生物体,人们可以使用原核或真核生物体。适宜的原核宿主的实例包括大肠杆菌和枯草芽孢杆菌。关于转化原核宿主的教导在现有技术中已进行了详尽地报道,例如可参阅Sambrook等人(Sambrook等人,《分子克隆实验室手册》,第2版,1989,冷泉港实验室出版社)。
尽管在EP-B-0470145与CA-A-2006454中没有公开本发明的酶和编码该酶的核苷酸序列,但这两篇文献均就可用于制备本发明的转基因植物的技术类型方面提供了一些有用的背景技术的解释。目前,在以下的解释中包括了上述背景技术的一些教导。
在构建遗传修饰的植物中的基本原则为在植物基因组中插入遗传信息以便于达到稳定地维持被插入的遗传材料。
存在多种用于插入遗传信息的技术,其中两个主要的原则为直接地引入该遗传信息以及通过使用载体系统来引入遗传信息。在Potrykus(植物生理植物分子生物学年度回顾42205-225)与Christou(农业-食品-工业高技术进步/1994年4月17-27)的文章中可以找到上述常规技术的综述。
因此一方面,本发明涉及一种携带本发明的核苷酸序列或构建体并且能够向生物体(诸如植物)的基因组中引入该核苷酸序列或构建体的载体系统。
所说的载体系统可以包括一个载体,但该系统也可以包括两个载体。在两个载体的情况中,该载体系统通常称作二元载体系统。Gynheung An等人(1980)在《植物分子生物学手册A3》第1-19页的“二元载体”中进一步详细地描述了二元载体系统。
一种用于以给定的启动子或核苷酸序列或构建体来转化植物细胞而广泛使用的系统基于使用来自根瘤农杆菌的Ti质粒或来自毛根农杆菌的Ri质粒(An等人(1986)植物生理81,301-305以及Butcher D.N.等人(1980),适于植物病理学家的组织培养方法,版本D.S.Ingrams与J.P.Helgeson,203-208)。已经构建了适于构建上述植物或植物细胞构建体的几种不同的Ti与Ri质粒。上述Ti质粒的一个非限制性的实例为pGV3850。
应当优选把本发明的核苷酸序列或构建体在介于T-DNA的末端序列之间或靠近T-DNA序列处插入Ti-质粒中,从而避免紧邻T-DNA边界序列破裂,这是因为对于向植物的基因组中插入修饰的T-DNA而言,上述区域中至少有一个区域似乎是必不可少的。
这正如从上面的解释中理解的那样,如果所说的生物体为植物的话,本发明的载体系统优选为一个含有为感染植物所必需的序列(例如Vir区)以及T-DNA序列的至少一个边界部分的系统,所说的边界部分与遗传构建体位于同一载体上。
另外,所说的载体系统优选为根瘤农杆菌Ti-质粒或者毛根农杆菌Ri-质粒或其衍生物。由于这些质粒是人们熟知的并且广泛用于构建转基因植物,所以存在许多基于上述质粒或其衍生物的载体系统。
在转基因植物的构建中,可以先在微生物中构建本发明的核苷酸序列或构建体,其中载体可以在该微生物中复制并且在插入植物之前该微生物是易于操作的。一种有用的微生物的实例为大肠杆菌,但也可以使用具有以上特性的其它微生物。当在大肠杆菌中已经构建了如上定义的载体系统的载体时,如有需要的话把该载体转化到一种合适的农杆菌菌株中(例如根瘤农杆菌)。因而,优选把包含本发明的核苷酸序列或构建体的Ti-质粒转化至一种合适的农杆菌菌株中(例如根瘤农杆菌),以便于获得含有本发明的启动子或核苷酸序列或构建体的农杆菌细胞,随后把该DNA转化至待修饰的植物细胞中。
例如如果为了转化而使用了所说植物细胞的Ti-或Ri-质粒的话,那么至少可以把Ti-与Ri-质粒T-DNA的右边界、但通常是其右边界和左边界,作为引入基因的侧翼区,连接起来。在EP-A-120516中、Hoekema在《二元植物载体系统》Offset-drukkerij Kanters B.B.,Alblasserdam,1985,第五章中、Fraley等人在Crit.Rev.Plant Sci.,41-46中以及An等人在EMBO J.(1985)4277-284中已经深入地研究并描述了用于转化植物细胞而使用的T-DNA。
由农杆菌直接侵染植物组织是一种现已广泛使用并在Butcher D.N.等人(1980)《适于植物病理学家的组织培养方法》版本D.S.Ingrams与J.P.Helgeson,203-208中有所描述的简单的技术。就这一主题的进一步的教导可参阅Potrykus(植物生理植物分子生物学年度回顾42205-225)和Christou(农业-食品-工业高技术进步/1994年4月17-27)。就该技术而言,可以在植物的某一部分或组织之中或之上(即在叶、根、茎的一部分上或在该植物的另一部分上)进行植物的侵染。
一般说来,由携带GOI(诸如本发明的核苷酸序列)以及选择性地携带启动子的农杆菌直接侵染植物组织,例如通过以剃刀刀片切割植物或用针刺植物或用研磨料摩擦植物来使待侵染的植物受伤。然后用所说的农杆菌接种该伤口。随后在合适的培养基上培养接种的植物或植物的部分并使其发育为成熟的植株。
当构建植物细胞时,可以根据熟知的组织培养方法来培养和维持上述细胞,诸如通过在提供了如氨基酸、植物激素、维生素等必须的生长因子的合适的培养基上培养细胞。
采用用于从细胞或组织培养物中再生植物的已知方法可以实现转化细胞再生为遗传修饰的植物,例如通过采用抗生素来选择转化的幼苗并且通过在含有合适的营养物、植物激素等的培养基上传代培养上述幼苗。
在EP-A-0449375中可以找到有关植物转化的进一步的教导。
正如在CA-A-2006454中所报道的,可以得到大量含有大肠杆菌中的复制系统并且能够选择转化细胞的标记物的克隆载体。所说的载体例如包括pBR 322,pUC系列,M13mp系列,pACYC184等。通过这种方式,可以把本发明的核苷酸或构建体引入位于载体中的合适的限制性位点上。然后使用这种被包含的质粒在大肠杆菌中进行转化。在合适的营养培养基中培养上述大肠杆菌细胞,然后获得细胞并裂解。随后回收上述质粒。作为分析方法,有常用的序列分析、限制酶切分析、电泳以及进一步的生物化学-分子生物学方法。在每种操作之后,所使用的DNA序列可以进行限制性消化并与接下来的DNA序列连接起来。每种序列均可以在同样的或不同的质粒中克隆。
在植物中引入本发明的核苷酸序列或构建体后,进一步的DNA序列的操作和/或插入可能是必须的-诸如为了建立如上提及的组合系统(例如包含构建体的组合的生物体)。
以上用于以本发明的核苷酸序列转化原核生物和植物的解释同样可用于以本发明的启动子转化上述生物体。
总而言之,本发明涉及通过表达有义内含子序列来影向酶的活性。
而且,本发明也涉及对上述有义内含子序列的表达有用的启动子。
下面的样品已按照布达佩斯条约于1995年7月13日保藏在位于英国苏格兰Aberdeen AB2 1RY 23 St Machar Drive的国立工业及海洋细菌有限保藏公司(NCIMB)这一公认的保藏机构中NCIMB 40754(是指如本文所述的pBEA 11);NCIMB 40751(是指如本文所述的λ-SBE3.2),以及NCIMB 40752(是指如本文所述的λ-SBE3.4)。
因此,本发明的一个高度优选的实例涉及一种影响植物(或其细胞,组织或者器官)中酶的活性的方法,该方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以有义取向编码内含子;其中所说的核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列;其中淀粉分支酶的活性受到影响和/或支链淀粉的含量受到影响和/或改变了淀粉的组成;并且其中所说的内含子的核苷酸序列可以从NCIMB 40751、NCIMB 40752或NCIMB 40754或其变体、衍生物或同系物得到。
因此,本发明的一个更为高度优选的方面涉及一种影响植物(或其细胞,组织或者器官)中酶的活性的方法,该方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以有义取向编码内含子;其中所说的核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列;其中淀粉分支酶的活性受到影响和/或支链淀粉的含量受到影响和/或改变了淀粉的组成;其中所说的核苷酸序列包括如SEQ.I.D.No.1至SEQ.I.D.No.13之任一所示的序列或其变体、衍生物或者同系物,其中也包括其组合;并且其中所说的内含子的核苷酸序列可以从NCIMB 40751、NCIMB 40752或NCIMB 40754或其变体、衍生物或同系物得到。
现在,仅通过实施例的方式来描述本发明,其中参考了以下所附的附图图1为直链淀粉及支链淀粉生物合成的示意表示;图2为支链淀粉α-1-4-键及α-1-6-键的图解表示;图3为基因组SBE克隆的外显子-内含子结构的图解表示;图4为pPATA1的质粒图,其大小为3936bp;图5为pABE7的质粒图,其大小为5106bp;图6为pVictorIV Man的质粒图,其大小为7080bp;图7为pBEA11的质粒图,其大小为9.54kb;图8显示出包括启动子、外显子及内含子的完整的SBE基因组的核苷酸序列;图9为pVictor5a的质粒图,其大小为9.12kb;以及图10为pBEP2的质粒图,其大小为10.32kb。
图1和图2可以参阅以上关于淀粉的一般介绍性的描述。正如所提及的,图3为基因组SBE克隆的外显子-内含子结构的图解表示,图8中所显示的为其序列。这一具有大约11.5k碱基对的克隆包括14个外显子和13个内含子。从5’末端至3’末端以升序的方式来编号上述内含子并且这些内含子分别对应于SEQ.I.D.No.s 1-13。它们各自的反义内含子序列如SEQ.I.D.No.s 15-27所示。
图3和图8更加详细地提供了有关马铃薯SBE基因的11468个碱基对的信息。自第1至第2082个核苷酸的5’区含有SBE基因的启动子区。位于第2048至2051个核苷酸的TATA盒的候选物用方框表示。在马铃薯SBE cDNA克隆(Poulsen与Kreiberg(1993)植物生理1021053-1054)与外显子DNAs之间的同源性起始于第2083bp并终止于第9666bp。在cDNA与外显子DNA之间的同源性是通过以大写字母表示的核苷酸来表示的,而翻译成的氨基酸序列则以单字母密码显示在该外显子DNA的下面。内含子序列是以小写字母表示的。
图7为pBEA7的质粒图,其大小为9.54k碱基对。质粒pBEA11包括马铃薯SBE基因的第一内含子序列。这种具有1177个碱基对的第一内含子序列示于图3并且位于第一外显子与第二外显子之间。
现在将更加详细地讨论本发明的一些实验及方面。
实验方案分离,在质粒中亚克隆以及基因组SBE克隆的测序使用放射性标记的马铃薯SBE cDNA(Poulsen与Kreiberg(1993)植物生理1021053-1054)作探针从Desiree马铃薯基因组文库(克隆技术实验室公司,Palo Alto CA,USA)中分离出含有马铃薯SBE基因的多种克隆。通过Southern分析来鉴别被分离的含有SBE DNA的λ-噬菌体的片段(λSBE 3.2-NCIMB 40751-与λSBE-3.4-NCIMB 40752),然后将该片段亚克隆至pBluescript II载体中(克隆技术实验室公司,Palo AltoCA,USA)。λSBE 3.2含有15kb的马铃薯DNA插入片段,λSBE-3.4含有13kb的马铃薯DNA插入片段。所得到的质粒称作pGB3,pGB11,pGB15,pGB16和pGB25(参见以下的讨论)。然后使用Pharmacia自动读数测序试剂盒(Pharmacia,Uppsala)和A.L.F.DNa测序仪(Pharmacia,Uppsala)对各个插入片段测序。
总计一共对SBE基因的一段11.5kb的序列进行了测序。所说的序列可以从上述质粒中推导出来,其中pGB25含有从1bp至836bp的序列,pGB15含有从735bp至2580bp的序列,pGB16含有从2580bp至5093bp的序列,pGB11含有从3348bp至7975bp的序列,并且pGB3含有从7533bp至11468bp的序列。
更详细地讲,通过把从λSBE 3.2分离出来的一段4kb的EcoRI片段插入pBluescript II SK(+)的EcoRI位点来构建pGB3。通过把从λSBE 3.4分离出来的一段4.7kb的Xho I片段插入pBluescript II SK(+)的XhoI位点来构建pGB11。通过把从λSBE 3.4分离出来的一段1.7kb的SpeI片段插入pBluescript II SK(+)的SpeI位点来构建pGB15。通过把从λSBE 3.4分离出来的一段2.5kb的SpeI片段插入pBluescript II SK(+)的SpeI位点来构建pGB16。为了构建pGB25,采用引物5’GGA ATT CCA GTC GCA GTC TAC ATT AC 3’和5’CGG GAT CCA GAG GCA TTA AGA TTT CTG G 3’并以λSBE 3.4作模板来生产PCR片段。
用BamHI和EcoRI消化上述PCR片段并将该片段插入以同一限制酶消化的pBluescript II SK(+)中。
构建质粒pBEA11通过PCR使用寡核苷酸5’CGG GAT CCA AAG AAA TTC TCG AGG TTA CAT GG 3′和5’CGG GAT CCG GGG TAA TTT TTA CTA ATT TCA TG 3’
并以含有SBE基因的λSBE 3.4噬菌体作模板扩增SBE内含子1。
用BamHI消化上述PCR产物并将该产物以有义取向插入介于patatin启动子与35S终止子之间的质粒pPATA1(在WO 94/24292中有所描述)的BamHI位点。以KpnI消化构建体pABE7,分离出2.4kb的“patatin启动子-SBE内含子1-35S终止子”的KpnI片段并将该片段插入植物转化载体pVictorIV Man的KpnI位点,从而生成质粒pBEA11。
转基因马铃薯植株的生产纯性原种培养物于25℃及16小时光照/8小时黑暗下,将马铃薯’Bintje’和’Dianella’的幼苗培养物维持在根据Linsmaier,E.U.与Skoog,F.(1965)在《植物生理学》18100-127中配制的培养基(LS)上,此外该培养基还含有2μM的硫代硫酸银。
大约40天后,传代培养上述培养物。然后从幼苗上切下叶子,并将其切成每段含有一个节的节切片(segment)(大约0.8厘米)。
接种马铃薯组织把来自培养了大约40天的幼苗培养物的幼苗(高度约为5-6厘米)切成内部节的切片(大约0.8厘米)。将该切片放入含有转化的根瘤农杆菌的液体LS-培养基中,其中的根瘤农杆菌含有感兴趣的二元载体。在含有合适的抗生素(对应于农杆菌菌株的抗性基因)的YMB-培养基(三水合磷酸氢二钾(0.66g/l);七水合硫酸镁(0.20g/l);氯化钠(0.10g/l);甘露糖醇(10.0g/l);和酵母提取物(0.40g/l))中培养上述农杆菌过夜,直至在660nm下的光密度(OD-660)约为0.8,将上述农杆菌离心并重新悬浮于LS-培养基至OD-660为0.5。
在农杆菌的悬浮液中保留该切片30分钟,然后通过在无菌滤纸上吸干该切片来除去过量的细菌。
共培养直接在含有琼脂(8.0g/l)、2,4-二氯苯氧乙酸(2.0mg/l)和反式-玉米素(0.5mg/l)的LS-培养基上与细菌一起共培养幼苗的切片48小时。用无菌滤纸覆盖上述培养基还有外植体,在25℃与16小时光照/8小时黑暗下放置培养皿。
“洗涤”步骤在共培养的培养基上经48小时后,把上述切片转移至含有液体LS-培养基的容器中,其中的培养基含有800mg/l的羧苄青霉素。轻轻地振荡该容器,通过这一步骤,农杆菌的主要部分或从切片中洗去和/或被杀死。
选择在洗涤步骤之后,将上述切片转移至平板,该平板含有LS-培养基、琼脂(8g/l)、反式-玉米素(1-5mg/l)、赤霉素(0.1mg/l)、羧苄青霉素(800mg/l)和硫酸卡那霉素(50-100mg/l)或者取决于所使用的载体构建的膦基麦黄酮(1-5mg/l)或甘露糖(5g/l)。每隔3-4周,将上述切片传代培养至新鲜培养基上。在3至4周内,从上述切片发育成幼苗,并且新的幼苗的形成将持续3-4个月。
再生幼苗的生根把再生的幼苗转移至由LS-培养基、琼脂(8g/l)和羧苄青霉素(800mg/l)组成的生根培养基中。
通过测试在含有硫酸卡那霉素(200mg/l)的上述培养基上的生根能力,通过进行NPTII测定(Radke,S.E.等人,应用遗传学原理(1988)75685-694)或者根据Wang等人(1993,NAR 21 pp4153-4154)进行PCR分析来验证再生幼苗的转基因的基因型。把在上述任意一种测定中均不呈阳性的植物弃去或用作对照物。另一方面,通过进行根据Hodal,L.等人(植物科学(1992)87115-122)有关共同引入的β-葡糖醛酸酶的基因的GUS测定也可以验证上述转基因植物。
转移至土壤把新生根的植物(高度约为2-3厘米)从生根培养基移植入土壤并放置在生长室中(21℃,16小时光照200-400uE/m2/sec)。当植物很好地生长时,将这些植物移入温室,在温室中培养该植物直至块茎已经发育并且该植物的上部开始衰老。
收获在大约3个月后收获这些马铃薯,然后进行分析。
分支酶的分析采用由Blennow与Johansson(植物化学(1991)30437-444)所送的SBE测定并且通过标准的Western方法采用定向的抗马铃薯SBE的抗体来测定转基因马铃薯系中SBE的表达。
淀粉分析从马铃薯块茎中分离出淀粉,该淀粉用于分析直链淀粉与支链淀粉之比(Hovenkamp-Hermelink等人(1988)马铃薯研究31241-246)。此外,通过在Dionex HPAEC上分析异淀粉酶消化的淀粉来测定支链淀粉的链长分布。通过N.Nelson(1944)在《生物化学杂志》153375-380中所述的方法来测定异淀粉酶消化的淀粉中还原端的数目。
上述结果表明SBE合成的水平和/或SBE活性的水平和/或转基因植物中淀粉SBE的组成有所下降。
构建SBE启动子构建体使用引物5’CCA TCG ATA CTT TAA GTG ATT TGA TGG C 3’和5’CGG GAT CCT GTT CTG ATT CTT GAT TTC C 3’.
从λ-SBE 3.4中扩增一段SBE启动子片段。用ClaI与BamHI消化该PCR产物。然后将得到的1.2kb的片段插入用ClaI和BglII线性化的pVictor 5a中(参见图9),从而生成pBEP2(参见图10)。
马铃薯块茎的淀粉分支酶的测量把来自用pBEA11转化的马铃薯植株的马铃薯切成小块并使用Ultra-Turax匀浆器在提取缓冲液(50 mM Tris-HCl pH 7.5,连二亚硫酸钠(0.1g/l)和2mM DTT)中进行匀浆;向每10克的块茎中加入1克Dowex xl。将粗的匀浆物通过Miracloth过滤器进行过滤并在4℃、24,700g下离心10分钟。上清液用于淀粉分支酶的测定。
淀粉分支酶的测定是在25℃下、体积为400μl的容器中进行的,上述溶液是由0.1M柠檬酸钠缓冲液pH 7.0、0.75mg/ml直链淀粉、5mg/ml牛血清白蛋白和马铃薯提取物组成的。在0、15、30和60分钟时,从上述反应中取走50μl的等分试样至20μl的3N HCl中。加入1ml碘溶液并用ELISA分光光度计测量620nm处吸光度的下降。
从以质粒pBEA11转化的24株转基因Dianella马铃薯植株中测量块茎提取物中的淀粉分支酶(SBE)的含量。
上述结果表明pBEA11的转基因系生产出SBE含量仅为在未转化的Dianella植株中SBE含量的10%至15%的块茎。
小结上述实施例涉及马铃薯SBE的基因的分离和测序。这些实施例进一步阐明可能可以制备出SBE的内含子的构建体。可以把这些SBE的内含子的构建体引入诸如马铃薯之类的植物中。在引入后,可以实现SBE合成水平和/或SBE活性的水平和/或植物中淀粉组成的降低。
人们认为本发明所表达的有义内含子的核苷酸序列通过共同抑制和/或反式激活来影响酶的活性,而这并不希望与理论相结合。有关这些机理的综述已由Finnegan和McElroy(1994生物技术12 pp883-887)以及Matzke和Matzke(1995 TIG 11 No.1 pp1-3)公开。通过上述机理,人们认为本发明的有义内含子降低了植物的酶活性(更具体地讲是SBE活性)的水平,反过来人们认为SBE活性又影响了直链淀粉与支链淀粉的比例并从而影响支链淀粉的分支模式。
因此,本发明提供了一种可能通过使用有义内含子序列降低SBE活性水平来控制植物或其组织或者细胞(诸如马铃薯块茎)中的淀粉组成的方法。
因此总而言之,本发明涉及以影响植物中酶的活性的方法来令人吃惊地使用有义内含子序列。
在不偏离本发明的范围的情况下,本发明的其它改进对本领域的普通技术人员而言是显而易见的。例如,可能可以使用反义启动子序列来影响酶的活性,比如反义SBE启动子-诸如包括如SEQ.I.D.No.28所示的核苷酸序列或其变体、衍生物或者同系物的核苷酸序列。
下面几页提供了已从SEQ.I.D.No.1至SEQ.I.D.No.29顺序排号的许多序列表。简而言之,SEQ.I.D.No.1至SEQ.I.D.No.13表示有义内含子序列(基因组DNA);SEQ.I.D.No.14表示SBE启动子序列(基因组序列);SEQ.I.D.No.15至SEQ.I.D.No.27表示反义内含子序列;并且SEQ.I.D.No.28表示互补于SBE启动子序列的序列-即以反义取向的SBE启动子序列。包括启动子、外显子和内含子的SBE的完整的基因组核苷酸序列如SEQ.I.D.No.29所示(参见突出了具体的基因特征的图3和图8)。序列信息SEQ.I.D.No.1内含子1的序列(1167bp).GTAATTTTTACTAATTTCATGTTAATTTCAATTATTTTTAGCCTTTGCATTTCATTTTCCAATATATCTGGATCATCTCCTTAGTTTTTTATTTTATTTTTTATAATATCAAATATGGAAGAAAAATGACACTTGTAGAGCCATATGTAAGTATCATGTGACAAATTTGCAAGGTGGTTGAGTGTATAAAATTCAAAAATTGAGAGATGGAGGGGGGGTGGGGGBARAGACAATATTTAGAAAGAGTGTTCTAGGAGGTTATGGAGGACACGGATGAGGGGTAGAAGGTTAGTTAGGTATTTGAGTGTTGTCTGGCTTATCCTTTCATACTAGTAGTCGTGGAATTATTTGGGTAGTTTCTTGTTTTGTTATTTGATCTTTGTTATTCTATTTTCTGTTTCTTGTACTTCGATTATTGTATTATATATCTTGTCGTAGTTATTGTTCCTCGGTAAGAATGCTCTAGCATGCTTCCTTTAGTGTTTTATCATGCCTTCTTTATATTCGCGTTGCTTTGAAATGCTTTTACTTTAGCCGAGGGTCTATTAGAAACAATCTCTCTATCTCGTAAGGTAGGGGTAAAGTCCTCACCACACTCCACTTGTGGGATTACATTGTGTTTGTTGTTGTAAATCAATTATGTATACATAATAAGTGGATTTTTTACAACACAAATACATGGTCAAGGGCAAAGTTCTGAACACATAAAGGGTTCATTATATGTCCAGGGATATGATAAAAATTGTTTCTTTGTGAAAGTTATATAAGATTTGTTATGGCTTTTGCTGGAAACATAATAAGTTATAATGCTGAGATAGCTACTGAAGTTTGTTTTTTCTAGCCTTTTAAATGTACCAATAATAGATTCCGTATCGAACGAGTATGTTTTGATTACCTGGTCATGATGTTTCTATTTTTTACATTTTTTTGGTGTTGAACTGCAATTGAAAATGTTGTATCCTATGAGACGGATAGTTGAGAATGTGTTCTTTGTATGGACCTTGAGAAGCTCAAACGCTACTCCAATAATTTCTATGAATTCAAATTCAGTTTATGGCTACCAGTCAGTCCAGAAATTAGGATATGCTGCATATACTTGTTCAATTATACTGTAAAATTTCTTAAGTTCTCAAGATATCCATGTAACCTCGAGAATTTCTTTGACAGSEQ.I.D.No.2内含子2的序列(321bp)GTATGTTTGATAATTTATATGGTTGCATGGATAGTATATAAATAGTTGGAAAACTTCTGGACTGGTGCTCATGGCATATTTGATCTGTGCACCGTGTGGAGATGTCAAACATGTGTTACTTCGTTCCGCCAATTTATAATACCTTAACTTGGGAAAGACAGCTCTTTACTCCTGTGGGCATTTGTTATTTGAATTACAATCTTTATGAGCATGGTGTTTTCACATTATCAACTTCTTTCATGTGGTATATAACAGTTTTTAGCTCCGTTAATACCTTTCTTCTTTTTGATATAAACTAACTGTGGTGCATTGCTTGCBKKKSEQ.I.D.No.3内含子3的序列(504bp)GTAACAGCCAAAAGTTGTGCTTTAGGCAGTTTGACCTTATTTTGGAAGATGAATTGTTTATACCTACTTTGACTTTGCTAGAGAATTTTGCATACCGGGGAGTAAGTAGTGGCTCCATTTAGGTGGCACCTGGCCATTTTTTTGATCTTTTAAAAAGCTGTTTGATTGGGTCTTCAAAAAAGTAGACAAGGTTTTTGGAGAAGTGACACACCCCCGGAGTGTCAGTGGCAAAGCAAAGATTTTCACTAAGGAGATTCAAAATATAAAAAAAGTATAGACATAAAGAAGCTGAGGGGATTCAACATGTACTATACAAGCATCAAATATAGTCTTAAAGCAATTTTGTAGAAATAAAGAAAGTCTTCCTTCTGTTGCTTCACAATTTCCTTCTATTATCATGAGTTACTCTTTCTGTTCGAAATAGCTTCCTTAATATTAAATTCATGATACTTTTGTTGAGATTTAGCAGTTTTTTCTTGTGTAAACTGCTCTCTTTTTTTGCAGSEQ.I.D.No.4内含子4的序列(146bp).GTAGGTCCTCGTCTACTACAAAATAGTAGTTTCCATCATCATAACAGATTTTCCTATTAAAGCATGATGTTGCAGCATCATTGGCTTTCTTACATGTTCTAATTGCTATTAAGGTTATGCTTCTAATTAACTCATCCACAATGCAGSEQ.I.D.No.5内含子5的序列(218bp).GTTTTGTTATTCATACCTTGAAGCTGAATTTTGAACACCATCATCACAGGCATTTCGATTCATGTTCTTACTAGTCTTGTTATGTAAGACATTTTGAAATGCAAAAGTTAAAATAATTGTGTCTTTACTAATTTGGACTTGATCCCATACTCTTTCCCTTAACAAAATGAGTCAATTCTATAAGTGCTTGAGAACTTACTACTTCAGCAATTAAACAGSEQ.I.D.No.6内含子6的序列(198bp).GTATTTTAAATTTATTTCTACAACTAAATAATTCTCAGAACAATTGTTAGATAGAATCCAAATATATACGTCCTGAAAGTATAAAAGTACTTATTTTCGCCATGGGCCTTCAGAATATTGGTAGCCGCTGAATATCATGATAAGTTATTTATCCAGTGACATTTTTATGTTCACTCCTATTATGTCTGCTGGATACAGSEQ.I.D.No.7内含子7的序列(208bp)GTTTGTCTGTTTCTATTGCATTTTAAGGTTCATATAGGTTAGCCACGGAAAATCTCACTCTTTGTGAGGTAACCAGGGTTCTGATGGATTATTCAATTTTCTCGTTTATCATTTGTTTATTCTTTTCATGCATTGTGTTTCTTTTTCAATATCCCTCTTATTTGGAGGTAATTTTTCTCATCTATTCACTTTTAGCTTCTAACCACAGSEQ.I.D.No.8内含子8的序列(293bp).GTATGTCTTACATCTTTAGATATTTTGTGATAATTACAATTAGTTTGGCTTACTTGAACAAGATTCATTCCTCAAAATGACCTGAACTGTTGAACATCAAAGGGGTTGAAACATAGAGGAAAACAACATGATGAATGTTTCCATTGTCTAGGGATTTCTATTATGTTGCTGAGAACAAATGTCATCTTAAAAAAAACATTGTTTACTTTTTTGTAGTATAGAAGATTACTGTATAGAGTTTGCAAGTGTGTCTGTTTTGGAGTAATTGTGAAATGTTTGATGAACTTGTACAGSEQ.I.D.No.9内含子9的序列(376bp).GTTCAAGTATTTTGAATCGCAGCTTGTTAAATAATCTAGTAATTTTTAGATTGCTTACTTGGAAGTCTACTTGGTTCTGGGGATGATAGCTCATTTCATCTTGTTCTACTTATTTTCCAACCGAATTTCTGATTTTTGTTTCGAGATCCAAGTATTAGATTCATTTACACTTATTACCGCCTCATTTCTACCACTAAGGCCTTGATGAGCAGCTTAAGTTGATTCTTTGAAGCTATAGTTTCAGGCTACCAATCCACAGCCTGCTATATTTGTTGGATACTTACCTTTTCTTTACAATGAAGTGATACTAATTGAAATGGTCTAAATCTGATATCTATATTTCTCCGTCTTTCCTCCCCCTCATGATGAAATGCAGSEQ.I.D.No.10内含子10的序列(172bp).GTAAAATCATCTAAAGTTGAAAGTGTTGGGTTTATGAAGTGCTTTAATTCTATCCAAGGACAAGTAGAAACCTTTTTACCTTCCATTTCTTGATGATGGATTTCATATTATTTAATCCAATAGCTGGTCAAATTCGGTAATAGCTGTACTGATTAGTTACTTCACTTTGCAGSEQ.I.D.No.11内含子11的序列(145bp).GTATATATGTTTTACTTATCCATGAAATTATTGCTCTGCTTGTTTTTAATGTACTGAACAAGTTTTATGGAGAAGTAACTGAAACAAATCATTTTCACATTGTCTAATTTAACTCTTTTTTCTGATCCTCGCATGACGAAAACAGSEQ.I.D.No.12内含子12的序列(242bp).GTAAGGATTTGCTTGAATAACTTTTGATAATAAGATAACAGATGTAGGGTACAGTTCTCTCACCAAAAAGAACTGTAATTGTCTCATCCATCTTTAGTTGTATAAGATATCCGACTGTCTGAGTTCGGAAGTGTTTGAGCCTCCTGCCCTCCCCCTGCGTTGTTTAGCTAATTCAAAAAGGAGAAAACTGTTTATTGATGATCTTTGTCTTCATGCTGACATACAATCTGTTCTCATGACAGSEQ.I.D.No.13内含子13的序列(797bp).GTACAGTTCTTGCCGTGTGACCTCCCTTTTTATTGTGGTTTTGTTCATAGTTATTTGAATGCGATAGAAGTTAACTATTGATTACCGCCACAATCGCCAGTTAAGTCCTCTGAACTACTAATTTGAAAGGTAGGAATAGCCGTAATAAGGTCTACTTTTGGCATCTTACTGTTACAAAACAAAAGGATGCCAAAAAAATTCTTCTCTATCCTCTTTTTCCCTAAACCAGTGCATGTAGCTTGCACCTGCATAAACTTAGGTAAATGATCAAAAATGAAGTTGATGGGAACTTAAAACCGCCCTGAAGTAAAGCTAGGAATAGTCATATAATGTCCACCTTTGGTGTCTGCGCTAACATCAACAACAACATACCTCGTGTAGTCCCACAAAGTGGTTTCAGGGGGAGGGTAGAGTGTATGCAAAACTTACTCCTATCTCAGAGGTAGAGAGGATTTTTTCAATAGACCCTTGGCTCAAGAAAAAAAGTCCAAAAAGAAGTAACAGAAGTGAAAGCAACATGTGTAGCTAAAGCGACCCAACTTGTTTGGGACTGAAGTAGTTGTTGTTGTTGAAACAGTGCATGTAGATGAACACATGTCAGAAAATGGACAACACAGTTATTTTGTGCAAGTCAAAAAAATGTACTACTATTTCTTTGTGCAGCTTTATGTATAGAAAAGTTAAATAACTAATGAATTTTGCTAGCAGAAAAATAGCTTGGAGAGAAATTTTTTATATTGAACTAAGCTAACTATATTCATCTTTCTTTTTGCTTCTTCTTCTCCTTGTTTGTGAAGSEQ.I.D.No.14SBE基因启动子区的DNA序列ATCATGGCCAATTACTGGTTCAAATGCATTACTTCCTTTCAGATTCTTTCGAGTTCTCAT 60GACCGGTCCTACTACAGACGATACTAACCCGTGGAACTGTTGCATCTGCTTCTTAGAACT 120CTATGGCTATTTTCGTTAGCTTGGCGTCGGTTTGAACATAGTTTTTGTTTTCAAACTCTT 180CATTTACAGTCAAAATGTTGTATGGTTTTTGTTTTCCTCAATGATGTTTACAGTGTTGTG 240TTGTCATCTGTACTTTTGCCTATTACTTGTTTTGAGTTACATGTTAAAAAAGTGTTTATT 300TTGCCATATTTTGTTCTCTTATTATTATTATCATACATACATTATTACAAGGAAAAGACA 360AGTACACAGATCTTAACGTTTATGTTCAATCAACTTTTGGAGGCATTGACAGGTACCACA 420AATTTTGAGTTTATGATTAAGTTCAATCTTAGAATATGAATTTAACATCTATTATAGATG 480CATAAAAATAGCTAATGATAGAACATTGACATTTGGCAGAGCTTAGGGTATGGTATATCC 540AACGTTAATTTAGTAATTTTTGTTACGTACGTATATGAAATATTGAATTAATCACATGAA 600CGGTGGATATTATATTATGAGTTGGCATCAGCAAAATCATTGGTGTAGTTGACTGTAGTT 660GCAGATTTAATAATAAAATGGTAATTAACGGTCGATATTAAAATAACTCTCATTTCAAGT 720GGGATTAGAACTAGTTATTAAAAAAATGTATACTTTAAGTGATTTGATGGCATATAATTT 780AAAGTTTTTCATTTCATGCTAAAATTGTTAATTATTGTAATGTAGACTGCGACTGGAATT 840ATTATAGTGTAAATTTATGCATTCAGTGTAAAATTAAAGTATTGAACTTGTCTGTTTTAG 900AAAATACTTTATACTTTAATATAGGATTTTGTCATGCGAATTTAAATTAATCGATATTGA 960ACACGGAATACCAAAATTAAAAAGGATACACATGGCCTTCATATGAACCGTGAACCTTTG1020ATAACGTGGAAGTTCAAAGAAGGTAAAGTTTAAGAATAAACTGACAAATTAATTTCTTTT1080ATTTGGCCCACTACTAAATTTGCTTTACTTTCTAACATGTCAAGTTGTGCCCTCTTAGTT1140GAATGATATTCATTTTTCATCCCATAAGTTCAATTTGATTGTCATACCACCCATGATGTT1200CTGAAAAATGCTTGGCCATTCACAAAGTTTATCTTAGTTCCTATGAACTTTATAAGAAGC1260TTTAATTTGACATGTTATTTATATTAGATGATATAATCCATGACCCAATAGACAAGTGTA1320TTAATATTGTAACTTTGTAATTGAGTGTGTCTACATCTTATTCAATCATTTAAGGTCATT1380AAAATAAATTATTTTTTGACATTCTAAAACTTTAAGCAGAATAAATAGTTTATCAATTAT1440TAAAAACAAAAAACGACTTATTTATAAATCAACAAACAATTTTAGATTGCTCCAACATAT1500TTTTCCAAATTAAATGCAGAAAATGCATAATTTTATACTTGATCTTTATAGCTTATTTTT1560TTTTAGCCTAACCAACGAATATTTGTAAACTCACAACTTGATTAAAAGGATTTACAACAA1620GATATATATAAGTAGTGACAAATCTTGATTTTAAATATTTTAATTTGGAGGTCAAAATTT1680TACCATAATCATTTGTATTTATAATTAAATTTTAAATATCTTATTTATACATATCTAGTA1740AACTTTTAAATATACGTATATACAAAATATAAAATTATTGGCGTTCATATTAGGTCAATA1800AATCCTTAACTATATCTGCCTTACCACTAGGAGAAAGTAAAAAACTCTTTACCAAAAATA1860CATGTATTATGTATACAAAAAGTCGATTAGATTACCTAAATAGAAATTGTATAACGAGTA1920AGTAAGTAGAAATATAAAAAAACTACAATACTAAAAAAAATATGTTTTACTTCAATTTCG1980AAACTAATGGGGTCTGAGTGAAATATTCAGAAAGGGGAGGACTAACAAAAGGGTCATAAT2040GTTTTTTTATAAAAAGCCACTAAAATGAGGAAATCAAGAATCAGAACATACAAGAAGGCA2100GCAGCTGAAGCAAAGTACCATAATTTAATCAATGGAAATTAATTTCAAAGTTTTATCAAA2160ACCCATTCGSEQ.I.D.No.15内含子1的反义序列 (1167bp).CTGTCAAAGAAATTCTCGAGGTTACATGGATATCTTGAGAACTTAAGAAATTTTACAGTATAATTGAACAAGTATATGCAGCATATCCTAATTTCTGGACTGACTGGTAGCCATAAACTGAATTTGAATTCATAGAAATTATTGGAGTAGCGTTTGAGCTTCTCAAGGTCCATACAAAGAACACATTCTCAACTATCCGTCTCATAGGATACAACATTTTCAATTGCAGTTCAACACCAAAAAAATGTAAAAAATAGAAACATCATGACCAGGTAATCAAAACATACTCGTTCGATACGGAATCTATTATTGGTACATTTAAAAGGCTAGAAAAAACAAACTTCAGTAGCTATCTCAGCATTATAACTTATTATGTTTCCAGCAAAAGCCATAACAAATCTTATATAACTTTCACAAAGAAACAATTTTTATCATATCCCTGGACATATAATGAACCCTTTATGTGTTCAGAACTTTGCCCTTGACCATGTATTTGTGTTGTAAAAAATCCACTTATTATGTATACATAATTGATTTACAACAACAAACACAATGTAATCCCACAAGTGGAGTGTGGTGAGGACTTTACCCCTACCTTACGAGATAGAGAGATTGTTTCTAATAGACCCTCGGCTAAAGTAAAAGCATTTCAAAGCAACGCGAATATAAAGAAGGCATGATAAAACACTAAAGGAAGCATGCTAGAGCATTCTTACCGAGGAACAATAACTACGACAAGATATATAATACAATAATCGAAGTACAAGAAACAGAAAATAGAATAACAAAGATCAAATAACAAAACAAGAAACTACCCAAATAATTCCACGACTACTAGTATGAAAGGATAAGCCAGACAACACTCAAATACCTAACTAACCTTCTACCCCTCATCCGTGTCCTCCATAACCTCCTAGAACACTCTTTCTAAATATTGTCTYTVCCCCCACCCCCCCTCCATCTCTCAATTTTTGAATTTTATACACTCAACCACCTTGCAAATTTGTCACATGATACTTACATATGGCTCTACAAGTGTCATTTTTCTTCCATATTTGATATTATAAAAAATAAAATAAAAAACTAAGGAGATGATCCAGATATATTGGAAAATGAAATGCAAAGGCTAAAAATAATTGAAATTAACATGAAATTAGTAAAAATTACSEQ.I.D.No.16内含子2的反义序列 (321bp).MMMVGCAAGCAATGCACCACAGTTAGTTTATATCAAAAAGAAGAAAGGTATTAACGGAGCTAAAAACTGTTATATACCACATGAAAGAAGTTGATAATGTGAAAACACCATGCTCATAAAGATTGTAATTCAAATAACAAATGCCCACAGGAGTAAAGAGCTGTCTTTCCCAAGTTAAGGTATTATAAATTGGCGGAACGAAGTAACACATGTTTGACATCTCCACACGGTGCACAGATCAAATATGCCATGAGCACCAGTCCAGAAGTTTTCCAACTATTTATATACTATCCATGCAACCATATAAATTATCAAACATACSEQ.I.D.No.17内含子3的反义序列 (504bp).CTGCAAAAAAAGAGAGCAGTTTACACAAGAAAAAACTGCTAAATCTCAACAAAAGTATCATGAATTTAATATTAAGGAAGCTATTTCGAACAGAAAGAGTAACTCATGATAATAGAAGGAAATTGTGAAGCAACAGAAGGAAGACTTTCTTTATTTCTACAAAATTGCTTTAAGACTATATTTGATGCTTGTATAGTACATGTTGAATCCCCTCAGCTTCTTTATGTCTATACTTTTTTTATATTTTGAATCTCCTTAGTGAAAATCTTTGCTTTGCCACTGACACTCCGGGGGTGTGTCACTTCTCCAAAAACCTTGTCTACTTTTTTGAAGACCCAATCAAACAGCTTTTTAAAAGATCAAAAAAATGGCCAGGTGCCACCTAAATGGAGCCACTACTTACTCCCCGGTATGCAAAATTCTCTAGCAAAGTCAAAGTAGGTATAAACAATTCATCTTCCAAAATAAGGTCAAACTGCCTAAAGCACAACTTTTGGCTGTTACSEQ.I.D.No.18内含子4的反义序列 (146bp).CTGCATTGTGGATGAGTTAATTAGAAGCATAACCTTAATAGCAATTAGAACATGTAAGAAAGCCAATGATGCTGCAACATCATGCTTTAATAGGAAAATCTGTTATGATGATGGAAACTACTATTTTGTAGTAGACGAGGACCTACSEQ.I.D.No.19内含子5的反义序列 (218bp).CTGTTTAATTGCTGAAGTAGTAAGTTCTCAAGCACTTATAGAATTGACTCATTTTGTTAAGGGAAAGAGTATGGGATCAAGTCCAAATTAGTAAAGACACAATTATTTTAACTTTTGCATTTCAAAATGTCTTACATAACAAGACTAGTAAGAACATGAATCGAAATGCCTGTGATGATGGTGTTCAAAATTCAGCTTCAAGGTATGAATAACAAAACSEQ.I.D.No.20内含子6的反义序列 (198bp).CTGTATCCAGCAGACATAATAGGAGTGAACATAAAAATGTCACTGGATAAATAACTTATCATGATATTCAGCGGCTACCAATATTCTGAAGGCCCATGGCGAAAATAAGTACTTTTATACTTTCAGGACGTATATATTTGGATTCTATCTAACAATTGTTCTGAGAATTATTTAGTTGTAGAAATAAATTTAAAATACSEQ.I.D.No.21内含子7的反义序列 (208bp)CTGTGGTTAGAAGCTAAAAGTGAATAGATGAGAAAAATTACCTCCAAATAAGAGGGATATTGAAAAAGAAACACAATGCATGAAAAGAATAAACAAATGATAAACGAGAAAATTGAATAATCCATCAGAACCCTGGTTACCTCACAAAGAGTGAGATTTTCCGTGGCTAACCTATATGAACCTTAAAATGCAATAGAAACAGACAAACSEQ.I.D.No.22内含子8的反义序列 (293bp).CTGTACAAGTTCATCAAACATTTCACAATTACTCCAAAACAGACACACTTGCAAACTCTATACAGTAATCTTCTATACTACAAAAAAGTAAACAATGTTTTTTTTAAGATGACATTTGTTCTCAGCAACATAATAGAAATCCCTAGACAATGGAAACATTCATCATGTTGTTTTCCTCTATGTTTCAACCCCTTTGATGTTCAACAGTTCAGGTCATTTTGAGGAATGAATCTTGTTCAAGTAAGCCAAACTAATTGTAATTATCACAAAATATCTAAAGATGTAAGACATACSEQ.I.D.No.23内含子9的反义序列 (376bp).CTGCATTTCATCATGAGGGGGAGGAAAGACGGAGAAATATAGATATCAGATTTAGACCATTTCAATTAGTATCACTTCATTGTAAAGAAAAGGTAAGTATCCAACAAATATAGCAGGCTGTGGATTGGTAGCCTGAAACTATAGCTTCAAAGAATCAACTTAAGCTGCTCATCAAGGCCTTAGTGGTAGAAATGAGGCGGTAATAAGTGTAAATGAATCTAATACTTGGATCTCGAAACAAAAATCAGAAATTCGGTTGGAAAATAAGTAGAACAAGATGAAATGAGCTATCATCCCCAGAACCAAGTAGACTTCCAAGTAAGCAATCTAAAAATTACTGATTATTTAACAAGCTGCGATTCAAAATACTTGAACSEQ.I.D.No.24内含子10的反义序列 (172bp).CTGCAAAGTGAAGTAACTAATCAGTACAGCTATTACCGAATTTGACCAGCTATTGGATTAAATAATATGAAATCCATCATCAAGAAATGGAAGGTAAAAAGGTTTCTACTTGTCCTTGGATAGAATTAAAGCACTTCATAAACCCAACACTTTCAACTTTAGATGATTTTACSEQ.I.D.No.25内含子11的反义序列 (145bp).CTGTTTTCGTCATGCGAGGATCAGAAAAAAGAGTTAAATTAGACAATGTGAAAATGATTTGTTTCAGTTACTTCTCCATAAAACTTGTTCAGTACATTAAAAACAAGCAGAGCAATAATTTCATGGATAAGTAAAACATATATACSEQ.I.D.No.26内含子12的反义序列 (242bp).CTGTCATGAGAACAGATTGTATGTCAGCATGAAGACAAAGATCATCAATAAACAGTTTTCTCCTTTTTGAATTAGCTAAACAACGCAGGGGGAGGGCAGGAGGCTCAAACACTTCCGAACTCAGACAGTCGGATATCTTATACAACTAAAGATGCATGAGACAATTACAGTTCTTTTTGGTGAGAGAACTGTACCCTACATCTGTTATCTTATTATCAAAAGTTATTCAAGCAAATCCTTACSEQ.I.D.No.27内含子13的反义序列 (797bp).CTTCACAAACAAGGAGAAGAAGAAGCAAAAAGAAAGATGAATATAGTTAGCTTAGTTCAATATAAAAAATTTCTCTCCAAGCTATTTTTCTGCTAGCAAAATTCATTAGTTATTTAACTTTTCTATACATAAAGCTGCACAAAGAAATAGTAGTACATTTTTTTGACTTGCACAAAATAACTGTGTTGTCCATTTTCTGACATGTGTTCATCTACATGCACTGTTTCAACAACAACAACTACTTCAGTCCCAAACAAGTTGGGTCGCTTTAGCTACACATGTTGCTTTCACTTCTGTTACTTCTTTTTGGACTTTTTTTCTTGAGCCAAGGGTCTATTGAAAAAATCCTCTCTACCTCTGAGATAGGAGTAAGTTTTGCATACACTCTACCCTCCCCCTGAAACCACTTTGTGGGACTACACGAGGTATGTTGTTGTTGATGTTAGCGCAGACACCAAAGGTGGACATTATATGACTATTCCTAGCTTTACTTCAGGGCGGTTTTAAGTTCCCATCAACTTCATTTTTGATCATTTACCTAAGTTTATGCAGGTGCAAGCTACATGCACTGGTTTAGGGAAAAAGAGGATAGAGAAGAATTTTTTTGGCATCCTTTTGTTTTGTAACAGTAAGATGCCAAAAGTAGACCTTATTACGGCTATTCCTACCTTTCAAATTAGTAGTTCAGAGGACTTAACTGGCGATTGTGGCGGTAATCAATAGTTAACTTCTATCGCATTCAAATAACTATGAACAAAACCACAATAAAAAGGGAGGTCACACGGCAAGAACTGTACSEQ.I.D.No.28SBE基因启动子区的反义DNA序列CGAATGGGTTTTGATAAAACTTTGAAATTAATTTCCATTGATTAAATTATGGTACTTTGC 60TTCAGCTGCTGCCTTCTTGTATGTTCTGATTCTTGATTTCCTCATTTTAGTGGCTTTTTA120TAAAAAAACATTATGACCCTTTTGTTAGTCCTCCCCTTTCTGAATATTTCACTCAGACCC180CATTAGTTTCGAAATTGAAGTAAAACATATTTTTTTTAGTATTGTAGTTTTTTTATATTT240CTACTTACTTACTCGTTATACAATTTCTATTTAGGTAATCTAATCGACTTTTTGTATACA300TAATACATGTATTTTTGGTAAAGAGTTTTTTACTTTCTCCTAGTGGTAAGGCAGATATAG360TTAAGGATTTATTGACCTAATATGAACGCCAATAATTTTATATTTTGTATATACGTATAT420TTAAAAGTTTACTAGATATGTATAAATAAGATATTTAAAATTTAATTATAAATACAAATG480ATTATGGTAAAATTTTGACCTCCAAATTAAAATATTTAAAATCAAGATTTGTCACTACTT540ATATATATCTTGTTGTAAATCCCTTTTAATCAAGTTGTGAGTTTACAAATATTCGTTGGT600TAGGCTAAAAAAAATAAGCTATAAAGATCAAGTATAAAATTATGCATTTTCTGCATTTAA660TTTGGAAAAATATGTTGGAGCAATCTAAAATTGTTTGTTGATTTATAAATAAGTCGTTTT720TTGTTTTTAATAATTGATAAACTATTTATTCTGCTTAAAGTTTTAGAATGTCAAAAAATA780ATTTATTTTAATGACCTTAAATGATTGAATAAGATGTAGACACACTCAATTACAAAGTTA840CAATATTAATACACTTGTCTATTGGGTCATGGATTATATCATCTAATATAAATAACATGT900CAAATTAAAGCTTCTTATAAAGTTCATAGGAACTAAGATAAACTTTGTGAATGGCCAAGC960ATTTTTCAGAACATCATGGGTGGTATGACAATCAAATTGAACTTATGGGATGAAAAATGA 1020ATATCATTCAACTAAGAGGGCACAACTTGACATGTTAGAAAGTAAAGCAAATTTAGTAGT 1080GGGCCAAATAAAAGAAATTAATTTGTCAGTTTATTCTTAAACTTTACCTTCTTTGAACTT 1140CCACGTTATCAAAGGTTCACGGTTCATATGAAGGCCATGTGTATCCTTTTTAATTTTGGT 1200ATTCCGTGTTCAATATCGATTAATTTAAATTCGCATGACAAAATCCTATATTAAAGTATA 1260AAGTATTTTCTAAAACAGACAAGTTCAATACTTTAATTTTACACTGAATGCATAAATTTA 1320CACTATAATAATTCCAGTCGCAGTCTACATTACAATAATTAACAATTTTAGCATGAAATG 1380AAAAACTTTAAATTATATGCCATCAAATCACTTAAAGTATACATTTTTTTAATAACTAGT 1440TCTAATCCCACTTGAAATGAGAGTTATTTTAATATCGACCGTTAATTACCATTTTATTAT 1500TAAATCTGCAACTACAGTCAACTACACCAATGATTTTGCTGATGCCAACTCATAATATAA 1560TATCCACCGTTCATGTGATTAATTCAATATTTCATATACGTACGTAACAAAAATTACTAA 1620ATTAACGTTGGATATACCATACCCTAAGCTCTGCCAAATGTCAATGTTCTATCATTAGCT 1680ATTTTTATGCATCTATAATAGATGTTAAATTCATATTCTAAGATTGAACTTAATCATAAA 1740CTCAAAATTTGTGGTACCTGTCAATGCCTCCAAAAGTTGATTGAACATAAACGTTAAGAT 1800CTGTGTACTTGTCTTTTCCTTGTAATAATGTATGTATGATAATAATAATAAGAGAACAAA 1860ATATGGCAAAATAAACACTTTTTTAACATGTAACTCAAAACAAGTAATAGGCAAAAGTAC 1920AGATGACAACACAACACTGTAAACATCATTGAGGAAAACAAAAACCATACAACATTTTGA 1980CTGTAAATGAAGAGTTTGAAAACAAAAACTATGTTCAAACCGACGCCAAGCTAACGAAAA 2040TAGCCATAGAGTTCTAAGAAGCAGATGCAACAGTTCCACGGGTTAGTATCGTCTGTAGTA 2100GGACCGGTCATGAGAACTCGAAAGAATCTGAAAGGAAGTAATGCATTTGAACCAGTAATT 2160GGCCATGATSEQ.I.D.No.29基因组SBE基因ATCATGGCCA ATTACTGGTT CAAATGCATT ACTTCCTTTC AGATTCTTTC GAGTTCTCAT 60GACCGGTCCT ACTACAGACG ATACTAACCC GTGGAACTGT TGCATCTGCT TCTTAGAACT 120CTATGGCTAT TTTCGTTAGC TTGGCGTCGG TTTGAACATA GTTTTTGTTT TCAAACTCTT 180CATTTACAGT CAAAATGTTG TATGGTTTTT GTTTTCCTCA ATGATGTTTA CAGTGTTGTG 240TTGTCATCTG TACTTTTGCC TATTACTTGT TTTGAGTTAC ATGTTAAAAA AGTGTTTATT 300TTGCCATATT TTGTTCTCTT ATTATTATTA TCATACATAC ATTATTACAA GGAAAAGACA 360AGTACACAGA TCTTAACGTT TATGTTCAAT CAACTTTTGG AGGCATTGAC AGGTACCACA 420AATTTTGAGT TTATGATTAA GTTCAATCTT AGAATATGAA TTTAACATCT ATTATAGATG 480CATAAAAATA GCTAATGATA GAACATTGAC ATTTGGCAGA GCTTAGGGTA TGGTATATCC 540AACGTTAATT TAGTAATTTT TGTTACGTAC GTATATGAAA TATTGAATTA ATCACATGAA 600CGGTGGATAT TATATTATGA GTTGGCATCA GCAAAATCAT TGGTGTAGTT GACTGTAGTT 660GCAGATTTAA TAATAAAATG GTAATTAACG GTCGATATTA AAATAACTCT CATTTCAAGT 720GGGATTAGAA CTAGTTATTA AAAAAATGTA TACTTTAAGT GATTTGATGG CATATAATTT 780AAAGTTTTTC ATTTCATGCT AAAATTGTTA ATTATTGTAA TGTAGACTGC GACTGGAATT 840ATTATAGTGT AAATTTATGC ATTCAGTGTA AAATTAAAGT ATTGAACTTG TCTGTTTTAG 900AAAATACTTT ATACTTTAAT ATAGGATTTT GTCATGCCAA TTTAAATTAA TCGATATTGA 960ACACGGAATA CCAAAATTAA AAAGGATACA CATGGCCTTC ATATGAACCG TGAACCTTTG1020ATAACGTGGA AGTTCAAAGA AGGTAAAGTT TAAGAATAAA CTGACAAATT AATTTCTTTT1080ATTTGGCCCA CTACTAAATT TGCTTTACTT TCTAACATGT CAAGTTGTGC CCTCTTAGTT1140GAATGATATT CATTTTTCAT CCCATAAGTT CAATTTGATT GTCATACCAC CCATGATGTT1200CTGAAAAATG CTTGGCCATT CACAAAGTTT ATCTTAGTTC CTATGAACTT TATAAGAAGC1260TTTAATTTGA CATGTTATTT ATATTAGATG ATATAATCCA TGACCCAATA GACAAGTGTA1320TTAATATTGT AACTTTGTAA TTGAGTGTGT CTACATCTTA TTCAATCATT TAAGGTCATT1380AAAATAAATT ATTTTTTGAC ATTCTAAAAC TTTAAGCAGA ATAAATAGTT TATCAATTAT1440TAAAAACAAA AAACGACTTA TTTATAAATC AACAAACAAT TTTAGATTGC TCCAACATAT1500TTTTCCAAAT TAAATGCAGA AAATGCATAA TTTTATACTT GATCTTTATA GCTTATTTTT1560TTTAGCCTAA CCAACGAATA TTTGTAAACT CACAACTTGA TTAAAAGGGA TTTACAACAA1620GATATATATA AGTAGTGACA AATCTTGATT TTAAATATTT TAATTTGGAG GTCAAAATTT1680TACCATAATC ATTTGTATTT ATAATTAAAT TTTAAATATC TTATTTATAC ATATCTAGTA1740AACTTTTAAA TATACGTATA TACAAAATAT AAAATTATTG GCGTTCATAT TAGGTCAATA1800AATCCTTAAC TATATCTGCC TTACCACTAG GAGAAAGTAA AAAACTCTTT ACCAAAAATA1860CATGTATTAT GTATACAAAA AGTCGATTAG ATTACCTAAA TAGAAATTGT ATAACGAGTA1920AGTAAGTAGA AATATAAAAA AACTACAATA CTAAAAAAAA TATGTTTTAC TTCAATTTCG1980AAACTAATGG GGTCTGAGTG AAATATTCAG AAAGGGGAGG ACTAACAAAA GGGTCATAAT2040GTTTTTTTAT AAAAAGCCAC TAAAATGAGG AAATCAAGAA TCAGAACATA CAAGAAGGCA2100GCAGCTGAAG CAAAGTACCA TAATTTAATC AATGGAAATT AATTTCAAAG TTTTATCAAA2160ACCCATTCGA GGATCTTTTC CATCTTTCTC ACCTAAAGTT TCTTCAGGGG TAATTTTTAC2220TAATTTCATG TTAATTTCAA TTATTTTTAG CCTTTGCATT TCATTTTCCA ATATATCTGG2280ATCATCTCCT TAGTTTTTTA TTTTATTTTT TATAATATCA AATATGGAAG AAAAATGACA2340CTTGTAGAGC CATATGTAAG TATCATGTGA CAAATTTGCA AGGTGGTTGA GTGTATAAAA2400TTCAAAAATT GAGAGATGGA GGGGGGGTGG GGGBARAGAC AATATTTAGA AAGAGTGTTC2460TAGGAGGTTA TGGAGGACAC GGATGAGGGG TAGAAGGTTA GTTAGGTATT TGAGTGTTGT2520CTGGCTTATC CTTTCATACT AGTAGTCGTG GAATTATTTG GGTAGTTTCT TGTTTTGTTA2580TTTGATCTTT GTTATTCTAT TTTCTGTTTC TTGTACTTCG ATTATTGTAT TATATATCTT2640GTCGTAGTTA TTGTTCCTCG GTAAGAATGC TCTAGCATGC TTCCTTTAGT GTTTTATCAT2700GCCTTCTTTA TATTCGCGTT GCTTTGAAAT GCTTTTACTT TAGCCGAGGG TCTATTAGAA2760ACAATCTCTC TATCTCGTAA GGTAGGGGTA AAGTCCTCAC CACACTCCAC TTGTGGGATT2820ACATTGTGTT TGTTGTTGTA AATCAATTAT GTATACATAA TAAGTGGATT TTTTACAACA2880CAAATACATG GTCAAGGGCA AAGTTCTGAA CACATAAAGG GTTCATTATA TGTCCAGGGA2940TATGATAAAA ATTGTTTCTT TGTGAAAGTT ATATAAGATT TGTTATGGCT TTTGCTGCAA3000ACATAATAAG TTATAATGCT GAGATAGCTA CTGAAGTTTG TTTTTTCTAG CCTTTTAAAT3060GTACCAATAA TAGATTCCGT ATCGAACGAG TATGTTTTGA TTACCTGGTC ATGATGTTTC3120TATTTTTTAC ATTTTTTTGG TGTTGAACTG CAATTGAAAA TGTTGTATCC TATGAGACGG3180ATAGTTGAGA ATGTGTTCTT TGTATGGACC TTGAGAAGCT CAAACGCTAC TCCAATAATT3240TCTATGAATT CAAATTCAGT TTATGGCTAC CAGTCAGTCC AGAAATTAGG ATATGCTGCA3300TATACTTGTT CAATTATACT GTAAAATTTC TTAAGTTCTC AAGATATCCA TGTAACCTCG3360AGAATTTCTT TGACAGGCTT CTAGAAATAA GATATGTTTT CCTTCTCAAC ATAGTACTGG3420ACTGAAGTTT GGATCTCAGG AACGGTCTTG GGATATTTCT TCCACCCCAA AATCAAGAGT3480TAGAAAAGAT GAAAGGGTAT GTTTGATAAT TTATATGGTT GCATGGATAG TATATAAATA3540GTTGGAAAAC TTCTGGACTG GTGCTCATGG CATATTTGAT CTGTGCACCG TGTGGAGATG3600TCAAACATGT GTTACTTCGT TCCGCCAATT TATAATACCT TAACTTGGGA AAGACAGCTC3660TTTACTCCTG TGGGCATTTG TTATTTGAAT TACAATCTTT ATGAGCATGG TGTTTTCACA3720TTATCAACTT CTTTCATGTG GTATATAACA GTTTTTAGCT CCGTTAATAC CTTTCTTCTT3780TTTGATATAA ACTAACTGTG GTGCATTGCT TGCBKKKATG AAGCACAGTT CAGCTATTTC3840CGCTGTTTTG ACCGATGACG ACAATTCGAC AATGGCACCC CTAGAGGAAG ATGTCAAGAC3900TGAAAATATT GGCCTCCTAA ATTTGGATCC AACTTTGGAA CCTTATCTAG ATCACTCAG 3960ACACAGAATG AAGAGATATG TGGATCAGAA AATGCTCATT GAAAAATATG AGGGACCCCT4020TGAGGAATTT GCTCAAGGTA ACAGCCAAAA GTTGTGCTTT AGGCAGTTTG ACCTTATTT 4080GGAAGATGAA TTGTTTATAC CTACTTTGAC TTTGCTAGAG AATTTTGCAT ACCGGGGAGT4140AAGTAGTGGC TCCATTTAGG TGGCACCTGG CCATTTTTTT GATCTTTTAA AAAGCTGTTT4200GATTGGGTCT TCAAAAAAGT AGACAAGGTT TTTGGAGAAG TGACACACCC CCGGAGTGTC4260AGTGGCAAAG CAAAGATTTT CACTAAGGAG ATTCAAAATA TAAAAAAAGT ATAGACATAA4320AGAAGCTGAG GGGATTCAAC ATGTACTATA CAAGCATCAA ATATAGTCTT AAAGCAATTT4380TGTAGAAATA AAGAAAGTCT TCCTTCTGTT GCTTCACAAT TTCCTTCTAT TATCATGAGT4440TACTCTTTCT GTTCGAAATA GCTTCCTTAA TATTAAATTC ATGATACTTT TGTTGAGATT4500TAGCAGTTTT TTCTTGTGTA AACTGCTCTC TTTTTTTGCA GGTTATTTAA AATTTGGATT4560CAACAGGGAA GATGGTTGCA TAGTCTATCG TGAATGGGCT CCTGCTGCTC AGTAGGTCCT4620CGTCTACTAC AAAATAGTAG TTTCCATCAT CATAACAGAT TTTCCTATTA AAGCATGATG4680TTGCAGCATC ATTGGCTTTC TTACATGTTC TAATTGCTAT TAAGGTTATG CTTCTAATTA4740ACTCATCCAC AATGCAGGGA AGCAGAAGTT ATTGGCGATT TCAATGGATG GAACGGTTCT4800AACCACATGA TGGAGAAGGA CCAGTTTGGT GTTTGGAGTA TTAGAATTCC TGATGTTGAC4860AGTAAGCCAG TCATTCCACA CAACTCCAGA GTTAAGTTTC GTTTCAAACA TGGTAATGGA4920GTGTGGGTAG ATCGTATCCC TGCTTGGATA AAGTATGCCA CTGCAGACGC CACAAAGTTT4980GCAGCACCAT ATGATGGTGT CTACTGGGAC CCACCACCTT CAGAAAGGTT TTGTTATTCA5040TACCTTGAAG CTGAATTTTG AACACCATCA TCACAGGCAT TTCGATTCAT GTTCTTACTA5100GTCTTGTTAT GTAAGACATT TTGAAATGCA AAAGTTAAAA TAATTGTGTC TTTACTAATT5160TGGACTTGAT CCCATACTCT TTCCCTTAAC AAAATGAGTC AATTCTATAA GTGCTTGAGA5220ACTTACTACT TCAGCAATTA AACAGGTACC ACTTCAAATA CCCTCGCCCT CCCAAACCCC5280GAGCCCCACG AATCTATGAA GCACATGTCG GCATGAGCAG CTCTGAGCCA CGTGTAAATT5340CGTATCGTGA GTTTGCAGAT GATGTTTTAC CTCGGATTAA GGCAAATAAC TATAATACTG5400TCCAGTTGAT GGCCATAATG GAACATTCTT ACTATGGATC ATTTGGATAT CATGTTACAA5460ACTTTTTTGC TGTGAGCAGT AGATATGGAA ACCCGGAGGA CCTAAAGTAT CTGATAGATA5520AAGCACATAG CTTGGGTTTA CAGGTTCTGG TGGATGTAGT TCACAGTCAT GCAAGCAATA5580ATGTCACTGA TGGCCTCAAT GGCTTTGATA TTGGCCAAGG TTCTCAAGAA TCCTACTTTC5640ATGCTGGAGA GCGAGGGTAC CATAAGTTGT GGGATAGCAG GCTGTTCAAC TATGCCAATT5700GGGAGGTTCT TCGTTTCCTT CTTTCCAACT TGAGGTGGTG GCTAGAAGAG TATAACTTTG5760ACGGATTTCG ATTTGATGGA ATAACTTCTA TGCTGTATGT TCATCATGGA ATCAATATGG5820GATTTACAGG AAACTATAAT GAGTATTTCA GCGAGGCTAC AGATGTTGAT GCTGTGGTCT5880ATTTAATGTT GGCCAATAAT CTGATTCACA AGATTTTCCC AGATGCAACT GTTATTGCCG5940AAGATGTTTC TGGTATGCCG GGCCTTGGCC GGCCTGTTTC TGAGGGAGGA ATTGGTTTTG6000TTTACCGCCT GGCAATGGCA ATCCCAGATA AGTGGATAGA TTATTTAAAG AATAAGAATG6060ATGAAGATTG GTCCATGAAG GAAGTAACAT CGAGTTTGAC AAATAGGAGA TATACAGAGA6120AGTGTATAGC ATATGCGGAG ACCCATGATC AGGTATTTTA AATTTATTTC TACAACTAAA6180TAATTCTCAG AACAATTGTT AGATAGAATC CAAATATATA CGTCCTGAAA GTATAAAAGT6240ACTTATTTTC GCCATGGGCC TTCAGAATAT TGGTAGCCGC TGAATATCAT GATAAGTTAT6300TTATCCAGTG ACATTTTTAT GTTCACTCCT ATTATGTCTG CTGGATACAG TCTATTGTTG6360GTGACAAGAC CATTGCATTT CTCCTAATGG ACAAAGAGAT GTATTCTGGC ATGTCTTGCT6420TGACAGATGC TTCTCCTGTT GTTGATCGAG GAATTGCGCT TCACAAGGTT TGTCTGTTTC6480TATTGCATTT TAAGGTTCAT ATAGGTTAGC CACGGAAAAT CTCACTCTTT GTGAGGTAAC6540CAGGGTTCTG ATGGATTATT CAATTTTCTC GTTTATCATT TGTTTATTCT TTTCATGCAT6600TGTGTTTCTT TTTCAATATC CCTCTTATTT GGAGGTAATT TTTCTCATCT ATTCACTTTT6660AGCTTCTAAC CACAGATGAT CCATTTTTTC ACAATGGCCT TGGGAGGAGA GGGGTACCTC6720AATTTCATGG GTAACGAGGT ATGTCTTACA TCTTTAGATA TTTTGTGATA ATTACAATTA6780GTTTGGCTTA CTTGAACAAG ATTCATTCCT CAAAATGACC TGAACTGTTG AACATCAAAG6840GGGTTGAAAC ATAGAGGAAA ACAACATGAT GAATGTTTCC ATTGTCTAGG GATTTCTATT6900ATGTTGCTGA GAACAAATGT CATCTTAAAA AAAACATTGT TTACTTTTTT GTAGTATAGA6960AGATTACTGT ATAGAGTTTG CAAGTGTGTC TGTTTTGGAG TAATTGTGAA ATGTTTGATG7020AACTTGTACA GTTTGGCCAT CCTGAGTGGA TTGACTTCCC TAGAGAGGGC AATAATTGGA7080GTTATGACAA ATGTAGACGC CAGTGGAACC TCGCGGATAG CGAACACTTG AGATACAAGG7140TTCAAGTATT TTGAATCGCA GCTTGTTAAA TAATCTAGTA ATTTTTAGAT TGCTTACTTG7200GAAGTCTACT TGGTTCTGGG GATGATAGCT CATTTCATCT TGTTCTACTT ATTTTCCAAC7260CGAATTTCTG ATTTTTGTTT CGAGATCCAA GTATTAGATT CATTTACACT TATTACCGCC7320TCATTTCTAC CACTAAGGCC TTGATGAGCA GCTTAAGTTG ATTCTTTGAA GCTATAGTTT7380CAGGCTACCA ATCCACAGCC TGCTATATTT GTTGGATACT TACCTTTTCT TTACAATGAA7440GTGATACTAA TTGAAATGGT CTAAATCTGA TATCTATATT TCTCCGTCTT TCCTCCCCCT7500CATGATGAAA TGCAGTTTAT GAATGCATTT GATAGAGCTA TGAATTCGCT CGATGAAAAG7560TTCTCATTCC TCGCATCAGG AAAACAGATA GTAAGCAGCA TGGATGATGA TAATAAGGTA7620AAATCATCTA AAGTTGAAAG TGTTGGGTTT ATGAAGTGCT TTAATTCTAT CCAAGGACAA7680GTAGAAACCT TTTTACCTTC CATTTCTTGA TGATGGATTT CATATTATTT AATCCAATAG7740CTGGTCAAAT TCGGTAATAG CTGTACTGAT TAGTTACTTC ACTTTGCAGG TTGTTGTGTT7800TGAACGTGGT GACCTGGTAT TTGTATTCAA CTTCCACCCA AAGAACACAT ACGAAGGGTA7860TATATGTTTT ACTTATCCAT GAAATTATTG CTCTGCTTGT TTTTAATGTA CTGAACAAGT7920TTTATGGAGA AGTAACTGAA ACAAATCATT TTCACATTGT CTAATTTAAC TCTTTTTTCT7980GATCCTCGCA TGACGAAAAC AGGTATAAAG TTGGATGTGA CTTGCCAGGG AAGTACAGAG8040TTGCACTGGA CAGTGATGCT TGGGAATTTG GTGGCCATGG AAGAGTAAGG ATTTGCTTGA8100ATAACTTTTG ATAATAAGAT AACAGATGTA GGGTACAGTT CTCTCACCAA AAAGAACTGT8160AATTGTCTCA TCCATCTTTA GTTGTATAAG ATATCCGACT GTCTGAGTTC GGAAGTGTTT8220GAGCCTCCTG CCCTCCCCCT GCGTTGTTTA GCTAATTCAA AAAGGAGAAA ACTGTTTATT8280GATGATCTTT GTCTTCATGC TGACATACAA TCTGTTCTCA TGACAGACTG GTCATGATGT8340TGACCATTTC ACATCACCAG AAGGAATACC TGGAGTTCCA GAAACAAATT TCAATGGTCG8400TCCAAATTCC TTCAAAGTGC TGTCTCCTGC GCGAACATGT GTGGTACAGT TCTTGCCGTG8460TGACCTCCCT TTTTATTGTG GTTTTGTTCA TAGTTATTTG AATGCGATAG AAGTTAACTA8520TTGATTACCG CCACAATCGC CAGTTAAGTC CTCTGAACTA CTAATTTGAA AGGTAGGAAT8580AGCCGTAATA AGGTCTACTT TTGGCATCTT ACTGTTACAA AACAAAAGGA TGCCAAAAAA8640ATTCTTCTCT ATCCTCTTTT TCCCTAAACC AGTGCATGTA GCTTGCACCT GCATAAACTT8700AGGTAAATGA TCAAAAATGA AGTTGATGGG AACTTAAAAC CGCCCTGAAG TAAAGCTAGG8760AATAGTCATA TAATGTCCAC CTTTGGTGTC TGCGCTAACA TCAACAACAA CATACCTCGT8820GTAGTCCCAC AAAGTGGTTT CAGGGGGAGG GTAGAGTGTA TGCAAAACTT ACTCCTATCT8880CAGAGGTAGA GAGGATTTTT TCAATAGACC CTTGGCTCAA GAAAAAAAGT CCAAAAAGAA8940GTAACAGAAG TGAAAGCAAC ATGTGTAGCT AAAGCGACCC AACTTGTTTG GGACTGAAGT9000AGTTGTTGTT GTTGAAACAG TGCATGTAGA TGAACACATG TCAGAAAATG GACAACACAG9060TTATTTTGTG CAAGTCAAAA AAATGTACTA CTATTTCTTT GTGCAGCTTT ATGTATAGAA9120AAGTTAAATA ACTAATGAAT TTTGCTAGCA GAAAAATAGC TTGGAGAGAA ATTTTTTATA9180TTGAACTAAG CTAACTATAT TCATCTTTCT TTTTGCTTCT TCTTCTCCTT GTTTGTGAAG9240GCTTATTACA GAGTTGATGA ACGCATGTCA GAAACTGAAG ATTACCAGAC AGACATTTGT9300AGTGAGCTAC TACCAACAGC CAATATCGAG GAGAGTGACG AGAAACTTAA AGATTCGTTA9360TCTACAAATA TCAGTAACAT TGACGAACGC ATGTCAGAAA CTGAAGTTTA CCAGACAGAC9420ATTTCTAGTG AGCTACTACC AACAGCCAAT ATTGAGGAGA GTGACGAGAA ACTTAAAGAT9480TCGTTATCTA CAAATATCAG TAACATTGAT CAGACTGTTG TAGTTTCTGT TGAGGAGAGA9540GACAAGGAAC TTAAAGATTC ACCGTCTGTA AGCATCATTA GTGATGTTGT TCCAGCTGAA9600TGGGATGATT CAGATGCAAA CGTCTGGGGT GAGGACTAGT CAGATGATTG ATCGACCCTT9660CTACCGATTG GTGATCGCTA TCCTTGCTCT CTGAGAAATA GGTGAGGCGA AACAAAAAAT9720AATTTGCATG ATAAAAAGTC TGATTTTATG ATCGCTATCC TCGCTTTCTG AGAAAGAAGC9780GAAACAAAGG CGACTCCTGG ACTCGAATCT ATAAGATAAC AAAGGCGACT CCTGGGACTC9840GAATCTATAA GATAACAAAG GCAATTCCAA GACTTGAATC TATAAAAAAT TTAGTTAAGA9900ATGATTAACG TCCGATCCTA ATTCGAATCG AGGCATCTTA CCACTCCATT GATAATTATA9960TAAGTCAATA AGTCATATAA WAGTATTAAA AACTAAATTG ACTTGATCGG TCTATCAAAA 10020ATMAGATMAA ATTGTGTTCA TATGTAACAT TTTTGTTGTC ACAATTAGCT TAATTACATC 10080TTTCATGTGC AATAACAAAG AAATGATAGG AATTTAGAGA TTCCAATTTT TTTGTTGCCA 10140CAATTAACTT AATTACATCT TTCATTTGCA ATAACAAAGA AATGATAGGA ATTTAGAGAT 10200CCAGTGTCAA TACACAACCT AGGCCAACAT CGAAAGCATA ACTGTAAACT CATGCATGAA 10260GAAATCAGTC GTAAAAATGA ATAAATGCGA CATAAAAACA AATTGCATGT ATCATTAATG 10320TGACTTAACT ACAAGTAAAA ATAAATTTAA CAAATGTAAC TTAACTACAA GTAAAAATAA 10380ATTGCTTCTA TCATTAACAA ACAAACAGAA TTAAAAAGAA AAAAACATAC TAAATCTTAC 10440CGTCATTCGA TAAAAAAAAA TACCAAATTC ATAATGCAAG GAAAACGAAA CGCGTCCTGA 10500TCGGGTATCA ACGATGAAAT GGACCAGTTG GATCGACTGC CTGCACAACG TTAGGTATGC 10560CAAAAAAAAG AACACGATCC TTTGCACCCG TTCGATGATT ATCAGTATGT TCACAAAAAA 10620AACTTAAGTT CATCCCAGTG TACAACAGCC CCAACATCTG CCCCAAGTAA CAAAAAACAA10680CCAATTTATC TTATTCTTAT CTGCCACAAA ATAATCGGTT TCACACTATT CTCTTGTTAT10740ACAAAATTGA CAAGTAGGAA GGAGAGGAGT CATCCAAATA AACGGTGCAC GTTCTTTGAG10800AAAAGTCTTA TTTTTCGTAA GATCCAATTT CAACAAACTT TTCTTCAAGT CAAAATTCCT10860GATAGTGTAT CTCCTCTCGA CGACCTCTTG CATTGAACGA TCTCCGCTTA TCATGAAAAG10920TTGCTTGGAT AACAAGTATT GCAAGGGGGG GACAGTAGCT ATTAAGTTAG TCGGCCCAAG10980GAAATGGAGG AGTGATAGTC TCGAATATTA TTCACCTCTT TAGCATTACC CGGTCTGGCT11040TTAAGGAGTT ACGTCTTTTA CGCTCGCCAA TTTCTTTTTT TAGAATGGTT GGTGTCAAAA11100TCGCGAGTTG TGGAAGGTTC AAGTTACTCG ATTCGTGATT TTCAAGTATG AGTGGTGAGA11160GAGATTCGAT ATTTTCACGA GGTGTATTCG AGGTCTAGTA GAACGAAGGG TGTCACTAAT11220GAAAGTTTCA AGAGTTCATC ATCATCTTCT TCTAGTAGAT TTTCGCTTTC AAATGAGTAT11280GAAAATTCTT CCTCTTTTCT ATTGATTTTC TTCATTGTTT TCTTCATTGT TGTGGTTGTT11340ATTGAAAAGA AAGAAAATTT ATAACAGAAA AAGATGTCAA AAAAAAGGTA AAATGAAAGA11400GTATCATATA CTTAAAGAGT TGCGTAGAGA TAAGTCAAAA GAAACAGAAT TATAGTAATT11460TCAGCTAAGT TAGAATTC 11478
权利要求
1.一种影响植物(或其细胞,组织或者器官)中酶的活性的方法,该方法包括在所说的植物(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地以有义取向编码内含子;并且其中所说的核苷酸序列不含有通常与所说的内含子有关的外显子序列的有义序列。
2.一种根据权利要求1的方法,其中淀粉分支酶的活性受到了影响和/或其中支链淀粉的含量受到了影响和/或改变了淀粉的组成。
3.一种影响生产淀粉的生物体(或其细胞,组织或者器官)中酶活性的方法,该方法包括在所说的生产淀粉的生物体(或其细胞,组织或者器官)中表达核苷酸序列,其中所说的核苷酸序列部分或者完整地编码以有义取向的内含子;其中所说的核苷酸序列不含有通常与所说的内含子有关的外显子序列的有义序列;并且其中淀粉分支酶的活性受到了影响和/或其中支链淀粉的含量受到了影响和/或改变了淀粉的组成。
4.一种根据权利要求1至3至任一的方法,其中所说的核苷酸序列不含有外显子序列的有义序列。
5.一种根据前述权利要求之任一的方法,其中降低或去除了所说的酶活性。
6.一种根据前述权利要求之任一的方法,其中所说的核苷酸序列至少基本上以有义取向编码至少一种内含子的全部。
7.一种根据前述权利要求之任一的方法,其中所说的核苷酸序列以有义取向编码至少一种内含子的全部。
8.一种根据前述权利要求之任一的方法,其中所说的核苷酸序列包括如SEQ.I.D.No.1至SEQ.I.D.No.13之任一所示的序列或其变体、衍生物或者同系物,也包括其组合。
9.一种根据前述权利要求之任一的方法,其中所说的核苷酸序列由具有如SEQ.I.D.No.14所示序列的启动子或其变体、衍生物或者同系物来表达。
10.一种包括如在权利要求8中定义的核苷酸序列的有义序列或其变体、衍生物或者同系物。
11.一种具有如SEQ.I.D.No.14所示序列的启动子或其变体、衍生物或者同系物。
12.一种根据权利要求11的启动子,该启动子结合了一种感兴趣的基因(“GOI”)。
13.一种能够包括或者表达根据权利要求10至12之任一权利要求的本发明的构建体。
14.一种包括或者表达根据权利要求10至13之任一权利要求的本发明的载体。
15.一种核苷酸序列的组合,该组合包括编码重组酶的第一核苷酸序列;以及以有义取向对应于内含子的第二核苷酸序列;其中所说的内含子为一种与编码对应于所说重组酶的酶的基因组基因有关的内含子;并且其中所说的第二核苷酸序列不含有通常与所说的内含子有关的外显子序列的有义序列。
16.一种包括或者表达根据权利要求10至15之任一权利要求的本发明的细胞、组织或器官。
17.一种包括或者表达根据权利要求10至16之任一权利要求的本发明的转基因生产淀粉的生物体。
18.一种根据权利要求17的转基因生产淀粉的生物体,其中所说的生物体为植物。
19.一种从根据前述权利要求之任一权利要求的本发明中获得的淀粉。
20. pBEA11(NCIMB 40754)。
21.一种内含子的核苷酸序列,该核苷酸序列可以从λ-SBE 3.2(NCIMB 40751)或λ-SBE 3.4(NCIMB 40752)或其变体、衍生物或同系物得到。
22.一种在宿主生物体中表达重组蛋白或酶的方法,该方法包括表达编码所说的重组蛋白或酶的核苷酸序列;以及表达另一个核苷酸序列;其中所说的另一个核苷酸序列部分或者完整地以有义取向编码内含子;其中所说的内含子为一种通常与编码对应于所说的重组蛋白或酶的蛋白或酶的基因组基因有关的内含子;并且其中所说的另一个核苷酸序列不含有通常与所说的内含子有关的外显子序列的有义序列。
全文摘要
本发明描述了一种抑制基因表达的方法。这种影响植物中酶的活性的方法包括在植物(或其细胞,组织或者器官)中表达核苷酸序列,其中该核苷酸序列部分或者完整地以有义取向编码内含子;并且其中该核苷酸序列不含有通常与该内含子有关的外显子序列的有义序列。
文档编号C12N5/10GK1196092SQ96196982
公开日1998年10月14日 申请日期1996年7月12日 优先权日1995年7月14日
发明者P·抛尔森 申请人:丹尼斯科有限公司