专利名称:棉子糖合成酶基因、棉子糖的制备方法及其转化的植物的制作方法
技术领域:
本发明涉及棉子糖合成酶,应用棉子糖合成酶或含有棉子糖合成酶的细胞提取物合成棉子糖的方法,编码棉子糖合成酶的DNA以及该DNA在植物中的利用。棉子糖可作为具有双岐杆菌增殖活性的食品原料,或者作为脏器保存液等医药品在多种领域中应用。
背景技术:
棉子糖是棉子糖家族寡糖的一种,它的半乳糖通过α-1,6连键与蔗糖的葡萄糖基连接。除棉子糖之外棉子糖家族寡糖还有2个半乳糖基连接的水苏糖、3个半乳糖基连接的毛蕊糖等。这些糖广泛存在于植物中,如以贮存糖存在于豆类、油菜子、棉子等各种植物中,以转移糖存在于黄瓜和甜瓜等葫芦科植物中,或者存在于获得耐冷性的玫瑰叶、甜菜(サトウダイコン)等植物中。
棉子糖家族寡糖的生物合成如下UDP-半乳糖+肌醇→肌醇半乳糖苷+UDP…(a)肌醇半乳糖苷+蔗糖→棉子糖+肌醇 …(b)肌醇半乳糖苷+棉子糖→水苏糖+肌醇 …(c)在反应中(a)用肌醇半乳糖苷合成酶(GSEC2.4.1.123)进行催化,(b)用棉子糖合成酶(RSEC2.4.1.82)进行催化,(c)用水苏糖合成酶(STSEC2.4.1.67)进行催化。
现在棉子糖可从甜菜提取,在蔗糖的纯化过程中进行分离纯化。但是,因为棉子糖降低了蔗糖的结晶性,所以以降低棉子糖含量为目的对甜菜进行了育种、改良,甜菜中棉子糖的含量降低到0.03%到0.16%(酶微生物学技术,第4卷,5月刊130-135(1982))。因此从这样低含量的甜菜中不容易有效地得到棉子糖。
如上所述,棉子糖包含在以大豆为代表的豆科植物的成熟种子中,以及甜菜或黄瓜等葫芦科植物中。作为大豆寡糖,大豆的成熟种子中含有蔗糖(含量约5%)、水苏糖(约4%)、棉子糖(大约1%),这些大豆寡糖从脱脂大豆的脱蛋白级分回收,浓缩后可用于功能性食品,但是在总的寡糖中棉子糖为10%,其量很少。
另一方面,棉子糖的酶合成方法也有报道(糖科学和糖技术的发展趋势,7.34,149-158(1995))。这就是通过α-半乳糖苷酶的缩合反应合成半乳二糖,然后该半乳二糖作为半乳糖基的供体,通过半乳糖基转移反应转移到蔗糖,从而合成棉子糖。但是,该反应中,由1.9kg乳糖水解物合成350g半乳二糖,由190g半乳二糖和760g蔗糖可得到100g棉子糖,所生成的棉子糖的产量低,并非有效的合成方法。
除如上所述的方法外,可考虑通过生物合成系统的酶基因的转化来培育棉子糖含量高的植物。例如,Kerr等克隆了肌醇半乳糖苷合成酶基因,转化了油菜子(WO 93/02196)。但是,其结果为GS活性增加,棉子糖家族寡糖却降低,这没有达到通过导入肌醇半乳糖苷合成酶基因来增加棉子糖家族寡糖生成的目的。因此,未提供能增加植物棉子糖家族寡糖含量的方法。
另一方面,也要求减低棉子糖家族的寡糖。如上所述,棉子糖家族的寡糖主要以贮存糖广泛存在于豆类、油菜子、棉子等各种植物的种子中,以转移糖存在于黄瓜和甜瓜等葫芦科植物中,或者广泛存在于获得耐冷性的玫瑰叶、甜菜等植物中,大豆、油菜子、棉子等榨油后的粗粉中含有这些棉子糖家族的寡糖。几乎所有这些粗粉都用作饲料,但不具备α-半乳糖苷酶的人和动物不能直接消化棉子糖家族寡糖。而且,已知由于肠内细菌对它的同化作用产生气体,棉子糖家族寡糖降低了饲料的代谢能效率。有这样的报道,因去除了饲料中的棉子糖家族寡糖,提高了鸟的饲料效率(Coo,Proceeding Soybean Utilization Alternatives.University ofMinnesota,203-211(1989))。由此,期望棉子糖家族寡糖减少的饲料作物,如大豆、油菜籽、棉子等。
此外,在这些植物中能培育出油含量增多的植物。光合成产物分布于油脂、蛋白质、含有棉子糖家族寡糖的糖。有报道大豆中油脂含量与糖含量呈负相关。期望在具有同一光合成能力的大豆中,通过抑制棉子糖家族寡糖的生成能增加油脂含量。
据报道,根据以上观点,Kerr等通过交配选育制备了棉子糖族寡糖降低了80%-90%的低棉子糖家族寡糖的大豆品种(WO93/00742)。但是这种品种的制备不能应用于与栽培适应性、抗病性等相对应的不同品种。另外,也不能广泛应用于多种植物。
已知甜菜、甘蔗等中含有的棉子糖能降低砂糖的结晶性。因此期待,若不生成棉子糖能提高这些植物中砂糖的生成效率,但是制备不出不含有棉子糖的甜菜。
如上所述,目前纯化出的棉子糖合成酶只能确证其酶活性,未鉴定出酶体。而且其活性也低,期待高活性的棉子糖合成酶。此外,到目前为止,棉子糖的制造方法回收效率低,期待高效率的棉子糖制造方法。另一方面,也期待培育出棉子糖族寡糖降低了的植物。
发明内容
本发明是在上述观点的基础上形成的,其目标是获得高活性的棉子糖合成酶及编码该酶的DNA,提供有效的棉子糖的酶合成方法,以及编码棉子糖合成酶的DNA在植物中的利用方法。
本发明者们为了解决上述问题进行了努力研究,结果成功地从黄瓜中纯化出棉子糖合成酶。此外,为了克隆编码该棉子糖合成酶的基因,本发明者们进行了努力研究。结果得到棉子糖合成酶基因特异的DNA片段,它是以根据黄瓜棉子糖合成酶肽片段的氨基酸序列推断出的核苷酸序列为基础化学合成单链DNA,以这一合成的单链DNA作引物,以用从黄瓜提取出的poly(A)+RNA制备的cDNA作模板进行PCR而得到的。然后以该DNA片段作探针对黄瓜来源的cDNA文库进行杂交,采用分离棉子糖合成酶基因的方法分离棉子糖合成酶基因。此外,为了在黄瓜的棉子糖合成酶基因信息的基础上克隆出大豆的棉子糖合成酶基因,进行了刻苦研究,结果分离出大豆来源的棉子糖合成酶基因。应用这一分离的棉子糖合成酶基因片段制作在植物中能表达的有调控区域的嵌合基因,转化植物。然后由于导入了棉子糖合成基因就可制备出棉子糖族寡糖降低了的植物。
也就是说本发明提供具有能由蔗糖和肌醇半乳糖苷生成棉子糖这一活性的棉子糖合成酶。
优选地,本发明提供下面(A)、(B)、(C)或(D)中所示棉子糖合成酶蛋白质。
(A)具有序列表中序列号5所记载的氨基酸序列的蛋白质。
(B)一种蛋白质,它含有序列表的序列号5中记载的氨基酸序列中1个或几个氨基酸发生替换、缺失、插入、添加或倒位的氨基酸序列,且它具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序列。
(D)一种蛋白质,它包含序列表的序列号24所记载的氨基酸序列中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有由蔗糖和肌醇半乳糖苷合成棉子糖的活性。
另外,本发明提供具有下列性质的棉子糖合成酶。
(1)作用及底物特异性由蔗糖和肌醇半乳糖苷生成棉子糖;(2)最适pH约6~8;(3)最适温度约35~40℃;(4)分子量①凝胶过滤色谱所测定的分子量为约75kDa~95kDa;②用聚丙烯酰胺凝胶电泳(非变性PAGE)测定的分子量约90kDa~100kDa;③还原条件下进行的SDS-聚丙烯酰胺电泳(SDS-PAGE)测定的分子量约90kDa~100kDa;(5)抑制被碘乙酰胺、N-乙基马来酰乙胺、肌醇抑制。
作为上述棉子糖合成酶的具体形式,本发明提供氨基酸序列中包含序列表序列号28-30所示的各氨基酸序列的棉子糖合成酶。
另外,本发明提供下面(C)或(D)所示的棉子糖合成酶蛋白质(C)具有序列表的序列号24中记载的氨基酸序列的蛋白质。
(D)一种蛋白质,它包含序列表中序列号24记载的氨基酸序列中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
另外,本发明提供棉子糖的制造方法,其特征在于在上述棉子糖合成酶的作用下由蔗糖和肌醇半乳糖苷生成棉子糖。
此外,本发明还提供编码上述棉子糖合成酶的DNA,以及,尤其是编码下面(A)、(B)、(C)或(D)中所示蛋白质的DNA(A)具有序列表的序列号5中记载的氨基酸序列的蛋白质。
(B)一种蛋白质,它包含序列表序列5中记载的氨基酸序列中有1个或几个氨基酸发生替换、缺失、插入、添加或倒位的氨基酸序列,且具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
(C)具有序列表序列号24中记载的氨基酸序列的蛋白质。
(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
作为上述DNA的具体实施方案,本发明提供下面(a)、(b)、(c)或(d)中所示的DNA(a)一种DNA,它至少包含序列表的序列号4所记载的核苷酸序列中56~2407号核苷酸的核苷酸序列;(b)一种DNA,在严格条件下,它能与至少包含序列表序列号4中记载的核苷酸序列中56~2407号核苷酸的核苷酸序列进行杂交,且能够编码具有能从蔗糖和肌醇半乳糖苷生成棉子糖这一活性的蛋白质;(c)一种DNA,它至少包含序列表序列号23记载的核苷酸序列中第156~2405号核苷酸的核苷酸序列;(d)一种DNA,在严格条件下,它能与至少包含序列表序列号23记载的核苷酸序列中第156~2405号核苷酸的核苷酸序列进行杂交,且它编码的蛋白质具有能从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
另外,本发明提供能用于表达棉子糖合成酶反义RNA或有义RNA的DNA,即提供下面(e)或(f)中所示的DNA。
(e)一种DNA,在严格条件下,它能与至少包含序列表序列号4记载的核苷酸序列中第56~2407号核苷酸的核苷酸序列或其互补核苷酸序列进行杂交;
(f)一种DNA,在严格条件下,它能与至少包含序列表序列号23记载的核苷酸序列中第156~2405号核苷酸的核苷酸序列或者其互补序列进行杂交。
此外,本发明提供包含棉子糖合成酶基因或其一部分和能在植物细胞中表达的转录调控区域的嵌合基因,以及用该嵌合基因转化的植物。
另外,本发明提供一种方法,它是用上述的嵌合基因转化植物,通过在植物细胞中表达该基因来改变前述的植物的棉子糖族寡糖的含量。
以下将具有上述(1)~(5)中性质的棉子糖合成酶,或者上面(A)、(B)、(C)和(D)的蛋白质的棉子糖合成酶简单地称作“棉子糖合成酶”。而将编码棉子糖合成酶的DNA或者编码棉子糖合成酶并含有非翻译区的DNA叫做“棉子糖合成酶基因”。
以下对本发明进行详细说明。<1>本发明的棉子糖合成酶本发明的棉子糖合成酶是下面(A)、(B)、(C)或(D)中所示的蛋白质。
(A)一种蛋白质,它含有序列表的序列号5记载的氨基酸序列;(B)一种蛋白质,它包含序列表序列号5记载的氨基酸序列中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性;(C)一种蛋白质,它具有序列表序列号24中记载的氨基酸序列;(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有从蔗糖和肌醇半乳糖苷合成棉子糖的活性。
本发明的棉子糖合成酶包含具有下述性质的物质。
(1)作用及底物特异性从蔗糖和肌醇半乳糖苷生成棉子糖;(2)最适pH约6~8;(3)最适温度约35~40℃;
(4)分子量①用凝胶过滤色谱测定的分子量约75kDa~95kDa;②用聚丙烯酰胺凝胶电泳(非变性PAGE)测定的分子量约90kDa~100kDa;③还原条件下进行的SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)测定的分子量约90kDa~100kDa;(5)抑制被碘乙酰胺、N-乙基马来酰乙胺、肌醇所抑制。
具有上述性质的棉子糖合成酶是从黄瓜的叶中分离、纯化出的,是由本发明者初次鉴定出的。如后面的实施例所示,这种来源于黄瓜的棉子糖合成酶,其蛋白质的氨基酸序列中含有序列表序列号1-3,或者28-30中所示的各种氨基酸序列。另外,其全部氨基酸序列在序列表序列号5中显示。
棉子糖合成酶可从葫芦科植物,例如从甜瓜(Cucumis melo)、黄瓜(Cucumis sativus)等植物中得到。特别是这些植物的叶、尤其是叶脉部分,以及种子等组织中棉子糖合成酶的含量高。
下面说明从黄瓜分离、纯化棉子糖合成酶的方法,以作为本发明棉子糖合成酶的制造方法的例子。
从播种后6~10周的黄瓜叶部分收集其叶脉部分,在液氮下用乳钵等研磨,加入缓冲液提取蛋白质。在这一过程中可加入防止棉子糖合成酶分解、失活的物质,如PMSF(苯甲基磺酰氟)等蛋白酶抑制剂和ポリクテ-ルAT(ヤルバ(Serva)公司制造)。通过过滤和离心可从提取液中除去不溶物,得到粗提液。
可应用常规的蛋白质纯化方法对如上所得的粗提液进行纯化,例如组合应用阴离子交换色谱,羟磷灰石色谱,凝胶过滤、盐析等方法进行分级,可纯化棉子糖合成酶。
阴离子交换色谱可这样进行,例如应用填充了HiTrapQ(ファルマシア公司)等强碱性阴离子交换体和DEAE-TOYOPEARL(东ソ-公司)等弱碱性阴离子交换体的柱子进行。让含有棉子糖合成酶的提取液通过该柱,酶吸附于柱上,洗涤柱子后用高盐浓度的缓冲液洗脱出酶。这时盐浓度可阶段性升高,或可应用浓度梯度。例如,应用HiTrapQ柱的时候可用0.3M的NaCl洗脱吸附于柱上的棉子糖合成酶活性。另外,在用DEAE-TOYOPEARL时优选应用0.05M~0.35M的NaCl浓度梯度作为洗脱液,用羟磷灰石色谱时优选0.01M~0.3M的磷酸浓度梯度作洗脱液。
上述的操作顺序无特殊限制,各操作可重复2次或更多。另外,期望在样品液通过各种柱子之前,通过透析等将样品液与适当的缓冲液进行交换。在各阶段可对样品液进行浓缩。
在纯化的各阶段中,测定各级分中所含有的棉子糖合成酶活性,优选收集高活性的级分供下面的阶段进行测试。测定棉子糖合成酶活性的方法,例如可应用Lehle,H等报道的放射性同位素方法(欧洲生化杂志,38,103-110(1973))。另外作为其变更方法可改变反应温度和底物浓度。例如向含有终浓度为10mM14C-蔗糖、20mM肌醇半乳糖苷、25mM HEPES(2-(4-(2-羟乙基)-1-哌嗪基)乙烷磺酸)-NaOH,pH 7.0、0.5mM DTT(二硫苏糖醇)的反应液中加入10μl的酶液使之达到50μl。32℃培养1小时进行反应,加入200μl的乙醇,95℃加热30秒,停止反应。将该反应液的离心上清点到ワットマン3mM滤纸上,用正丙醇∶醋酸乙酯∶水=4∶1∶2进行展开。检测棉子糖中摄入的14C,以之作为棉子糖合成酶活性(nmol/小时)。
本发明者们开发了一种测定棉子糖合成酶活性的方法以取代上述的方法,它是通过HPLC(高效液相色谱)对棉子糖合成反应中生成的棉子糖进行定量。与Lehle.H等的方法进行比较,该方法能简便且迅速地进行测定,尤其适于纯化操作中活性级分的检测。以下说明本方法。
棉子糖合成反应是向按照终浓度如下的组分配备的反应液中加入10~50μl棉子糖合成酶液,使之达到100μl,32℃反应60分钟。[反应液组成(终浓度)]2.5mM蔗糖5mM 肌醇半乳糖苷5mM DTT20mM Tris-盐酸缓冲液(pH 7.0)
如上进行反应后,加入反应液4倍体积的乙醇,95℃加热30秒终止反应。将之离心,离心上清进行减压干燥后,溶解到蒸馏水中,由HPLC对反应生成物中的棉子糖进行定量,以估测棉子糖酶活性。HPLC可应用,例如糖分析系统DX500(CarboPac PAI柱,脉冲电级分析检测器(ダイオネクス公司))进行。
用上述方法所测定的当反应时间变化时生成的棉子糖含量的结果如
图1所示。从图中可以看出,该方法可线性且简便地测定棉子糖合成酶活性。
可用凝胶电泳,凝胶过滤色谱等方法来确定纯化的棉子糖合成酶的纯度及测定其分子量。另外可通过测定改变反应温度或反应pH时的酶活性,或者向反应液中加入各种酶抑制剂和金属离子等测定残存的酶活性来研究酶学性质。另外通过测定棉子糖合成酶在各种pH条件下或温度条件下作用一段时间后的酶活性,可检测出稳定pH范围和稳定的温度范围。
虽然可如下测定上述棉子糖合成酶的性质,但值得注意的是在不同条件下得到不同的结果。例如用凝胶过滤色谱测定分子量时受所用凝胶过滤载体和缓冲液的种类,或分子量标志物的影响。另外许多情况下,虽然为同一pH值,但酶活性因缓冲液的种类或盐浓度不同而不同。因此,在鉴定棉子糖合成酶时,不要仅限于个体的性质而优选进行综合检测。
本发明的棉子糖合成酶可如上所述从黄瓜中分离、纯化,但是也可应用异种蛋白质发酵生产中常用的方法,通过将后面所述的编码来源于黄瓜、大豆或其它植物的棉子糖合成酶的DNA导入适当的宿主并使之表达来进行制备。
可应用以大肠杆菌(Escherichia coli)为代表的各种原核细胞和以酿酒酵母(Saccharomyces cerevisiae)为代表的各种真核细胞作为表达棉子糖合成酶基因的宿主,但期望应用植物细胞,尤其是来源于烟草、黄瓜、拟南芥等植物的细胞。
用于转化的重组质粒可通过将编码棉子糖合成酶的DNA插入到与表达用的细胞种类相对应的表达载体中来制备,植物的表达载体含有在植物中起作用的启动子DNA序列或者这些启动子的数个组合,以及在植物中起作用的终止DNA序列,若其间含有能插入外来基因的序列更好。
这样的启动子有,例如在整个植物体中表达的CaMV 35S RNA启动子,CaMV 19S RNA启动子、胭脂碱合成酶启动子等,在绿色组织中表达的RubisCO小亚基启动子等,在种子等部位特异表达的ナピン(napin)、菜豆蛋白等基因的启动子。作为上述的终止子可例举胭脂碱合成酶终止子,RubisCO小亚基3′端部位等。
作为植物用的表达载体可应用市售的pBI 121、p35S-GFP(CLONTECH公司)等。应用表达病毒RNA的载体可将其编码外被膜蛋白质等的基因替换为棉子糖合成酶基因。
可应用转化中所常用的方法转化宿主细胞,如土壤杆菌法、粒子枪法、电穿孔法、PEG法等。棉子糖合成酶活性的检测可应用在进行棉子糖合成酶纯化时应用的方法。这一过程中,希望通过将样品通过阴离子交换柱预先去除α-半乳糖苷酶。
编码黄瓜来源的棉子糖合成酶基因,只要是在表达时产生具有棉子糖合成酶活性的物质,均包括在内,但是优选这样的基因,它含有编码序列表中序列号5记载的氨基酸序列的DNA,或含有编码序列表的序列号4记载的核苷酸序列的DNA。另外,作为编码大豆来源的棉子糖合成酶的基因,包含所有哪些表达时产生具有棉子糖合成酶活性物质的基因,但优选这样的基因,它含有编码序列表的序列号24记载的氨基酸序列的DNA,或含有编码序列表的序列号23记载的核苷酸序列的DNA,尚需指出的是编码序列表中序列号5或24记载的氨基酸序列的基因包括考虑到发生密码简并的各种核苷酸序列。也就是说,在考虑了基因表达系统各要素的基础上从这些各种核苷酸序列中选择,如依赖于宿主细胞种类的优先密码子,避免因转录RNA造成的高级结构等要素。所选择的核苷酸序列既可是从自然界克隆出的DNA,也可是人工化学合成的DNA。<2>编码本发明的棉子糖合成酶的DNA编码棉子糖合成酶的DNA可这样获得,从黄瓜等植物分离出poly(A)+RNA,用它制备cDNA文库,通过与该cDNA文库进行杂交来进行筛选。可通过应用以棉子糖合成酶蛋白质的部分氨基酸序列为基础合成的寡核苷酸作引物所进行的PCR(聚合酶链反应)扩增反应获得杂交用的探针。
以下将具体说明从来源于黄瓜的poly(A)+RNA获取本发明的DNA的方法。
只要是表达棉子糖合成酶基因,那么黄瓜的任一部分均可用作poly(A)+RNA的提取部位,如可从不同生长阶段的叶、茎、蕾、果实、种子等部位获得poly(A)+RNA,但希望应用结果后的展开叶尤其是叶脉部分作材料。
从黄瓜组织提取总RNA的方法没有特定的限制,只要是能有效地、很少损伤的得到RNA即可,例如可应用酚/SDS法、胍异硫氰酸盐/氯化铯法等任一种众所周知的方法。用Oligo(dT)载体可从所得的总RNA分离出poly(A)+RNA。另外,也可不用提取总RNA而使用能得到poly(A)+RNA的试剂盒(MPG Direct mRNA Purification Kit,CPG,INC.公司等)。
在cDNA文库的筛选中应用的探针DNA片段可通过进行PCR而获得。化学合成单链DNA,它拥有的核苷酸序列是根据已知肽片段的氨基酸序列,例如依据序列表序列号1~3所示的氨基酸序列来推定,以该链作引物进行PCR。所得肽片段的氨基酸序列的任一部分均可用作引物,但希望选择密码简并少、未形成复杂的高级结构的序列。另外,亦可进行RACE(cDNA末端快速扩增PCR PROTOCOLSA Guide to Methods and Applications,ACADEMIC press INC.p28~38)。
希望应用cDNA文库、单链cDNA作为PCR的模板。PCR中应用具有逆转录酶活性的耐热性DNA聚合酶时,可应用poly(A)+RNA,某些情况下可应用总RNA。
为了制备cDNA文库,首先要以poly(A)+RNA为模板,应用Oligo(dT)引物、随机引物等,通过逆转录酶合成单链cDNA,然后应用グブラ-ボフマン(Gubler and Hoffman)法、オカヤマ-バ-グ(Okayama-Berg法)(分子克隆第2版,冷泉港出版,1989)合成双链cDNA,当棉子糖合成酶基因的表达量少的时候可应用利用PCR的cDNA文库制作试剂盒(Capfinder PCR cDNA LibraryConstrution Kit(CLONTECH)等),通过PCR扩增cDNA。将这样合成的cDNA平端化,添加接头,用PCR添加限制性酶切位点后可克隆到噬菌体载体,质粒等克隆载体中。
可从上面的PCR中得到的DNA片段中选择棉子糖合成酶cDNA特征的部分用作杂交的探针。另外希望选择靠近5′末端的DNA片段。可从PCR反应液中纯化出如此选择的扩增DNA片段。这时应用质粒亚克隆扩增的DNA片段,大量制备质粒后用限制性酶酶切,然后从电泳后的胶中切出,进行纯化。另外,可以质粒为模板进行PCR,只扩增应用目的部分。此外,当最初扩增的DNA片段的量很多时,可不对扩增的DNA片段进行亚克隆而进行电泳,切出含有目的DNA片段带的凝胶片段,从中进行纯化。
为了从cDNA文库获得目的克隆而进行的筛选通过杂交进行。可标记上述方法中所得的DNA片段用作杂交的探针,可用放射性同位素、生物素等多种物质进行标记,但希望应用随机引物法进行标记,另外,筛选时可用PCR而不进行杂交,也可将杂交与PCR联合应用。
序列表序列号4中显示了如上得到的编码黄瓜的棉子糖合成酶的DNA核苷酸序列以及由该核苷酸序列推断的氨基酸序列。只有该氨基酸序列在序列号5中显示。根据布达佩斯条约,携带有质粒pMossIoxCRS的大肠杆菌JM 109的转化体AJ 13263,于1996年11月19日保藏于通商产业省工业技术院生命工学工业技术研究所(邮编305日本国茨城县つくば市东一丁目1番3号),保藏号为FERMBP-5748,该质粒含有后面实施例3中获得的包含编码棉子糖合成酶DNA的DNA片段。
此外,利用如上面所述的从一植物获得的棉子糖合成基因可从其它植物获得棉子糖合成酶基因。作为用于获得棉子糖合成酶的植物,只要是如前所述的能合成棉子糖的植物均可,例如大豆、蚕豆、油菜子、向日葵、棉花、甜菜等。可以应用编码来源于黄瓜的棉子糖合成酶的DNA来获得编码大豆棉子糖合成酶的DNA为例进行说明。
大豆棉子糖合成酶基因的获得是从大豆的poly(A)+RNA制备cDNA文库,应用以编码黄瓜棉子糖合成酶的DNA核苷酸序列为基础而选择的探针对cDNA文库进行筛选。
只要是能表达棉子糖合成酶那么大豆植株的任一部分均可作为RNA的提取部位,但希望应用种子,尤其是棉子糖族寡糖生成时期的开花后未成熟种子。
对于从大豆未成熟种子提取总RNA的方法没有特殊限定,只要是能有效地得到低损伤的RNA即可,前面所述的与黄瓜相关的任何一种方法均可应用。
杂交的探针具有与大豆的棉子糖合成酶基因高度同源的序列是必要的。杂交中应用的探针可以是来源于黄瓜的棉子糖合成酶基因,但希望是该基因中棉子糖合成酶保守的区域作探针。但是,从来源于黄瓜的棉子糖合成酶基因的信息来看,未确定出如上的序列。有必要参照如下的任一种方法来得到具有如此序列的杂交探针。简便地是,用适当的限制性酶酶切从黄瓜中得到的棉子糖合成酶基因,将所得片段分别与大豆的RNA进行Northern杂交,将与之杂交的DNA片段用作探针。另外,也可以黄瓜棉子糖合成酶的氨基酸序列为基础合成引物,应用此引物,以大豆RNA作模板,通过RT-PCR来获得探针。另外,也可在与编码黄瓜棉子糖合成酶的DNA具有同源性的拟南芥EST序列的基础上合成寡核苷酸,以此作用引物,通过拟南芥RNA的RT-PCR来获得。
优选如下来获得与目的基因具有高同源性的序列。首先,用Genetix Mac软件从GenBank数据库检索对黄瓜棉子糖合成酶基因具有同源性的拟南芥等的EST序列。所得序列与黄瓜棉子糖合成酶基因间的高同源性区域包含在各种种子来源的棉子糖合成酶间保守的序列。该区域DNA片段的获得是,例如,以由拟南芥RNA制备的单链DNA为模板,以在高度同源性区域序列的基础上合成的寡核苷酸作引物,通过PCR进行扩增而得到。分析该扩增片段的核苷酸序列,选择与黄瓜具有高度同源性序列的片段。如前面所记载的,标记所得的DNA片段,作为探针应用。
为了从cDNA文库获得目的克隆所进行的筛选,可按黄瓜基因克隆的方法进行杂交。
如上所得到的编码大豆来源的棉子糖合成酶的DNA核苷酸序列,以及从该核苷酸序列推出的氨基酸序列显示于序列表序列号23中。序列号24中只显示了氨基酸序列。在考虑缺口的情况下,通过最大匹配,上述方法中取得的大豆来源的棉子糖合成酶与黄瓜来源的棉子糖合成酶的氨基酸序列的同源性为38%,核苷酸序列的同源性为50%。携带有质粒pMOSSloxSRS的大肠杆菌JM 109的转化体AJ 13379于1997年10月20日按照布达佩斯条约保藏于通商产业省工业技术院生命工学工业技术研究所(邮编305日本国茨城县つくば市东一丁目1番3号),保藏号为FERM BP-6149,而该质粒包含后面实施例4中得到的含有编码棉子糖合成酶的DNA的DNA片段。
利用黄瓜来源的棉子糖合成酶和大豆来源的棉子糖合成酶的有关信息可从其它植物获得棉子糖合成酶基因。可合成这样的单链DNA,它含有的核苷酸序列是从在两种蛋白质中保存的氨基酸序列推断出的,例如从序列表序列号28(序列号24的氨基酸序号199~208)、29(序列号24的氨基酸序号302~314)、30(序列号24的氨基酸序号513~527)等推断出;也可合成具有与推断的核苷酸序列互补的核苷酸序列的单链DNA,用它们作引物进行RT-PCR。上述序列的任一部分均可用作引物,但希望选择密码简并少、未形成复杂的高级结构的序列。可用要获得基因的植物的总RNA,某些情况下用poly(A)+RNA合成cDNA,以此作模板进行PCR。将所得DNA片段克隆到适宜的载体中,分析其核苷酸序列,确证该核苷酸序列与黄瓜或大豆来源的棉子糖合成酶基因是否有同源性,或者翻译的氨基酸序列与黄瓜和大豆来源的棉子糖合成酶的氨基酸序列是否有同源性。所得的DNA片段可用于cDNA文库的筛选。另外,也可用要获得基因的植物的总RNA合成单链cDNA,某些情况下用poly(A)+RNA合成,以cDNA作模板进行RACE。
本发明的DNA能编码棉子糖合成酶蛋白质,只要具有棉子糖合成酶活性,即由蔗糖和肌醇半乳糖苷生成棉子糖的活性不被破坏,可包含在1个或多个位置有1个或数个氨基酸发生置换、缺失、插入、添加或倒位的蛋白质。这里的“数个”依据氨基酸残基在蛋白质三维结构中的位置和种类而有所不同。如同异亮氨酸和缬氨酸,氨基酸间存在相似性高的氨基酸,象这些氨基酸的差异对蛋白质的三维结构不会有很大的影响。因此只要是与构成黄瓜来源的棉子糖合成酶的总共784个氨基酸有35~40%以上的同源性,且具有棉子糖合成酶活性的均可,优选的是与510~610号氨基酸间有65%以上同源性的。再有“数个”为2-40个,优选2-20个,更优选2-10个。另外,与构成大豆来源的棉子糖合成酶的750个氨基酸同样有35-40%以上的同源性且具有棉子糖合成糖合成酶活性的亦可。优选的是与478-577号氨基酸间有65%以上同源性的。这里所讲的同源性是考虑到缺口进行最大匹配的数值。
本发明包括基因全长中约有50%以上的同源性,且其中300个核苷酸的区域具有65%以上同源性的基因。象这样的基因,可应用GenBank等数据库,通过检索与黄瓜来源的棉子糖合成酶基因具有同源性的基因而得到其核苷酸序列的信息。可应用采纳了Lipman-Pearson法的GENETIX-MAC(基因情报处理软件,软件开发公司)进行同源性分析,也可应用在因特网上公开的程序。用这样的方法所得到的核苷酸序列有包含基因全长的时候,也有不包含基因全长的时候。当不含有基因全长的时候,可以从目的植物组织中提取出的RNA为模板,与黄瓜来源的棉子糖合成酶基因同源性高的区域相对应的部分作引物,应用5′RACE法、3′RACE法,可容易地获得全长基因。按前面所讲的,将所得的全长基因重组到Soluble Protein ExpressionSystem(INVITROGEN公司)、Tight Control Expression System(INVITROGEN公司)和QIAexpress System(QIAGEN公司)等试剂盒提供的适宜表达载体中,使基因表达,用记载的方法测定棉子糖合成酶活性,选择有活性的克隆。关于基因的表达方法,在《植物分子生物学,实验手册》(Melody S.Clark(Ed.),Springer)中有详细记载。
编码与该棉子糖合成酶基本上为同一蛋白质的DNA可通过改变核苷酸序列而获得,例如,应用位点特异的诱变法使特定部位的氨基酸发生置换、缺失、插入、添加等。另外也可应用目前已知的突变处理来获得如上面改变的DNA。作为突变处理的方法可例举用羟胺体外处理编码棉子糖合成酶的DNA的方法,以及应用紫外线照射或N-甲基-N′-硝基-亚硝基胍(NTG)或亚硝酸等在通常的人工突变中应用的突变剂处理携带有编码棉子糖合成酶DNA的埃希氏菌属细菌的方法。
上面所讲的核苷酸置换、缺失、插入、添加或倒位等情况也包含自然发生的突变,如基于黄瓜或大豆的个体差异、品种间差异、基因的多拷贝化、各器官组织的差异而形成的突变。
在适当的细胞中表达具有上述变异的DNA,通过检测表达产物的棉子糖合成酶活性得到编码与棉子糖合成酶基本上为同一蛋白质的DNA。或者,通过在严格条件下与含有序列表序列号4记载的核苷酸序列中的56~2407号核苷酸序列或序列表序列号23记载的核苷酸序列中的156~2405号核苷酸序列的DNA进行杂交,并且分离出编码具有棉子糖合成酶活性的蛋白质的DNA,可从具有突变的编码棉子糖合成酶的DNA或携带它的细胞中获得编码与棉子糖合成酶蛋白质基本上为同一蛋白质的DNA。这里所讲的“严格条件”是指形成所谓的特异杂交,而不形成非特异杂交。该条件很难明确用数值表示,但如果用一例来表示的话就是同源性高的DNA,如同源性达50%以上的DNA彼此杂交,而同源性低的DNA间不进行杂交,或者在相当于通常Southern杂交洗涤条件60℃,1×SSC,0.1%SDS,优选0.1×SSC、0.1%SDS的盐浓度下进行杂交。在该条件下进行杂交的基因中包含中间位置生成终止密码的基因,和因活性中心的突变而失活的基因,但通过用前面所述的方法测定与市售的活性表达载体连接的棉子糖合成酶活性可容易地去除这些基因。
当本发明的DNA用于表达棉子糖合成酶的反义RNA时,该DNA没有必要编码有活性的棉子糖合成酶,应用反义RNA能抑制具有同源性的内源性基因的功能。这种情况下,DNA不必要编码有活性的棉子糖合成酶基因,而且也可不含有其全长。优选同源性达60%以上的翻译区有500个核苷酸对。例举下面(e)或(f)的DNA作为这样DNA的例子。
(e)在严格条件下能与序列表序列号4记载的核苷酸序列中至少由56~2407号核苷酸组成的核苷酸序列或其互补核苷酸序列进行杂交的DNA;(f)在严格条件下能与序列表序列号23记载的核苷酸序列中至少由156~2405号核苷酸组成的核苷酸序列或其互补序列进行杂交的DNA。
如上介绍了本发明者们从黄瓜或大豆成功地克隆棉子糖合成酶的目的cDNA的方法,下面介绍其它的方法。
(1)分离纯化黄瓜或大豆来源的棉子糖合成酶,在所测定的氨基酸序列或在序列号5或24中所示的氨基酸序列的基础上化学合成全部核苷酸序列。
(2)从黄瓜或大豆植株中制备染色体DNA,应用质粒载体制备染色体DNA文库,通过杂交或PCR从该文库中获得棉子糖合成酶基因。此外,预想到来源于染色体的棉子糖合成酶基因,其编码区域中含有内含子,如此被内含子隔断的DNA只要能编码棉子糖合成酶也包含在本发明的DNA中。
(3)根据分子量对poly(A)+RNA进行分级,用小麦胚或兔网织红细胞提供体外翻译系统,确定存在编码具有棉子糖合成酶活性的多肽的mRNA的级分,由它来制备,获得目的cDNA片段。
(4)制备抗黄瓜棉子糖合成酶抗体或抗大豆棉子糖合成酶抗体,将cDNA文库装载到蛋白质表达载体中,感染适当的宿主,表达cDNA所编码的蛋白质,用前面的抗体筛选目的cDNA。
(5)根据肽片段的氨基酸序列合成适当的引物,通过RACE法扩增包含末端的序列,将之克隆化。
棉子糖合成酶基因的表达,就是将编码酶区域的DNA重组到各种表达载体中使基因表达,详细地记载于《植物分子生物学—实验手册》(M.S.Clark(eds.),Springer)中。可应用市售的表达载体作载体。可根据本说明书中描述的方法通过检测活性来确定表达情况。
作为例子对由大豆来源的棉子糖合成酶基因产生的棉子糖合成酶的活性表达方法进行说明。应用为包含各限制性酶位点而设计的引物进行PCR,以在包含pMOSS lox SRS的棉子糖合成酶基因的第156位核苷酸ATG的正上游加入NdeI限制性酶位点,或在第2405号核苷酸的下游加入BamHI位点。然后用NdeI、BamHI消化用酚-氯仿纯化的棉子糖合成酶基因和pET3a。通过琼脂糖凝胶电泳纯化消化的各种DNA。因为大豆来源的棉子糖合成酶基因的内部存在BamHI位点,所以通过PCR等预先导致了突变,或通过琼脂糖电泳可选择目的大小的片段。将纯化的棉子糖合成酶片段与载体连接,用凝胶电泳进行确认。然后通过核苷酸序列分析来确认棉子糖合成酶基因是从ATG密码开始的。将该载体转化E.ColiBL21(DE3)pLysE,在含有氯霉素和氨苄西林的LB培养基上进行选择。通过PCR等来确认转化体中插入的片段,在LB培养基上培养目的转化体,得到菌体。在含有SDS的凝胶加样缓冲液中将菌体于100℃温育3分钟,进行SDS聚丙烯酰胺凝胶电泳,确认目的大小的蛋白质的带。培养这样选出的菌体,用超声波等破坏菌体,提取蛋白质。用本说明书中记载的方法来测定该蛋白质提取液的棉子糖合成酶活性。<3>本发明棉子糖的制造方法在本发明的棉子糖的制造方法中,将上述的棉子糖合成酶作用于蔗糖和肌醇半乳糖苷以生成棉子糖。棉子糖合成酶作用于蔗糖和肌醇半乳糖苷的时候,构成肌醇半乳糖苷的半乳糖残基转移到蔗糖,生成棉子糖。此时生成构成肌醇半乳糖苷的肌醇。
棉子糖的制造中所使用的棉子糖合成酶,既可以是从植物中提取出的酶,也可以是应用本发明的DNA通过基因重组法而制造的酶。
为使棉子糖合成酶作用于蔗糖和肌醇半乳糖苷,可将棉子糖合成酶或有棉子糖合成酶生产能力的细胞固定于藻酸胶和聚丙烯酰胺凝胶等载体上,用固定了的酶或细胞填充柱子,让含有蔗糖和肌醇半乳糖苷的溶液通过柱子。载体和将棉子糖合成酶或细胞固定于载体的方法可应用在普通的生物反应中所应用的材料和方法。
棉子糖合成反应可这样进行,例如向含有蔗糖和肌醇半乳糖苷的水溶液或缓冲液等溶液中加入棉子糖合成酶。上述溶液的pH约在6~8的范围内,尤其优选的是调整到pH 7左右。另外,反应温度为大约28-42℃,优选35-40℃的范围内,特别优选的是在38℃左右。此外,本发明的棉子糖合成酶在pH 5-8的范围特别是在pH 6附近稳定。本酶至少在大约40℃以下的温度范围内稳定。
因为本发明的棉子糖合成酶其酶活性能被碘乙酰胺、N-乙基马来酰亚胺、MnCl2、ZnCl2、NiCl2等所抑制,所以希望反应液中不含有这些物质。
反应液中加入的肌醇半乳糖苷和蔗糖的浓度为,肌醇半乳糖苷在5mM以上、蔗糖在1.5mM以上为宜。另外反应液中加入的棉子糖合成酶的量可根据底物的量而进行添加。
从反应液中包含的未反应的蔗糖、肌醇半乳糖苷以及酶反应生成的肌醇中分离棉子糖的方法可应用,例如凝胶过滤色谱法。<4>本发明的嵌合基因及转基因植物本发明的嵌合基因包含棉子糖合成酶基因或其一部分和在植物细胞中能表达的转录控制区域。可例举前面<2>中记载的编码本发明的棉子糖合成酶的DNA作为棉子糖合成酶基因。另外当应用本发明的嵌合基因作为反义基因的时候,除编码棉子糖合成酶的DNA之外,也可应用棉子糖合成酶基因的非翻译区或其一部分。非翻译区包括,例如序列表序列号4中的1~55号核苷酸(5′非翻译区)、或2407~2517号序列(3′非翻译区),或者序列表序列号23中的1~155号核苷酸或2406~2765号核苷酸。
本发明的嵌合基因中,当转录控制区域与编码棉子糖合成酶的DNA连接以表达与该DNA编码链同源的mRNA(有义RNA)的时候,导入了该嵌合基因的植物细胞表达棉子糖合成酶,棉子糖家族寡糖的含量增高。另一方面,当为了表达有前述的DNA编码链互补序列的RNA(反义RNA),前述的转录控制区域与前述的DNA连接的时候,以及为了表达与棉子糖合成酶基因的一部分片段,优选与上游编码区约200个核苷酸对以上的区域相对应的有义RNA而进行连接的时候,导入了这些嵌合基因的植物细胞,其内源性棉子糖合成酶的表达受到抑制,棉子糖家族寡糖降低。
如上所述,用本发明的嵌合基因转化植物,通过让该基因在植物细胞内表达可改变上述植物中棉子糖家族寡糖的含量。
适于本发明应用的植物可例举,油类作物,如大豆、油菜子、棉花、生产砂糖的甜菜、甘蔗,以拟南芥为代表的模型植物等。
另外在植物细胞中能表达的转录控制区域可例举如前所述的在整个植物中表达的CaMV 35S RNA启动子、CaMV 19S RNA启动子、胭脂碱合成酶启动子等,在绿色植物中表达的Rubis Co小亚基启动子等,在种子等部位特异表达的ナピン(napin)、菜豆蛋白等基因的启动子区域。另外,嵌合基因的3′末端可连接胭脂碱合成酶的终止子、Rubis CO小亚基3′侧部位的终止子。
可用通常应用的方法,如土壤杆菌法、粒子枪法、电穿孔法、PEG法等,用嵌合基因转化植物,要根据宿主细胞进行选用。
作为将嵌合基因导入植物的转化法可例举土壤杆菌法、粒子枪法、电穿孔法、PEG法等。
具体地讲,土壤杆菌法是应用双载体的方法。也就是说,用含有来源于Ti质粒的T-DNA、在大肠杆菌等微生物中发挥作用的复制起点、和用于选择保持有载体的植物细胞或微生物细胞的标记基因的载体转染植物,采集植物的种子使其发育,以标记基因的表达为指标来选择导入了载体的植物。对所得植物测定其棉子糖合成酶活性,或通过选择棉子糖家族寡糖含量发生变化的植物来获得目的性转化植物。
以下对将嵌合基因导入大豆的方法进行说明。大豆的转化可应用粒子枪法(美国国家科学院院刊,86,145(1989);TIBTECH,8,145(1990);生物/技术,6,923,(1988);植物生理,87,671(1988);发育遗传学,11,289(1990);植物细胞组织和器官培养,33,227(1993);土壤杆菌法(植物生理学,91,1212(1989);WO 94/02620;植物分子生物学,9,135(1987);生物/技术,6,915(1988));电穿孔法(植物生理学,99,81(1992);植物生理学,84,856(1989);植物细胞报道,10,97(1991))中的任何一种方法。
粒子枪方法中优选应用胚胎(embryogenic)组织或开花后30~40天未成熟种子的胚轴。将大约1g的胚胎组织铺展到皮氏平皿中,发射包被了目的嵌合基因的金粒子、钨粒子等。1小时~2小时后将组织移入液体培养基进行培养。2周后移到为选择转化体而加入了抗生素的培养基中,进行培养。6周后因得到了绿色的耐性不定胚,所以将之移到新培养基中进行培养,再生成植物体。或者在应用胚轴的时候,无菌条件下取出胚轴,用粒子枪处理后,在含有高浓度细胞因子的MS培养基(Murashige and Skoog,Physiologia Plantrum,15,473-497(1962))中进行培养。在黑暗中培养2周后,再在细胞因子含量降低了的MS培养基上,在光线照射的条件下于室温培养12~16小时。此时优选向培养基中加入作为选择标记应用的抗生素。当多芽体从移植组织形成后,移行到未添加激素的培养基中,在其中生根。将该幼体植株移到温室中进行培养。
在应用土壤杆菌的方法中,优选应用子叶节作为植物组织。土壤杆菌可应用市售的LBA4404、C58、Z707等,但优选应用Z707。载体可应用pMON530(Monsanto Co.)中插入了目的基因的质粒等。可根据直接冻融(Direct freeze thaw)法(An等,植物分子生物学手册A31-19,1988)将质粒导入根瘤土壤杆菌(Agrobacteriumtumefaciens)Z707(Hepburn等,普通微生物学杂志,131,2961(1985))。将用该嵌合基因转化的土壤杆菌培养一晚,5000rpm离心5分钟,悬浮于B5悬浮培养基中。将大豆种子在灭菌的1/10浓度的B5培养基中培养3天,使之发芽。切出子叶,在土壤杆菌的悬浮液中培养2小时。将子叶移到B5培养基(含有ガンボルグ(Gamborg)B5盐(Exp.Cell.Res.,50,151(1968),ガンボルグB5维生素,3%蔗糖,5μM苄氨基嘌呤,10μM IBA,10μM乙酰基丁香酮),25℃,光照23小时(60μEm-2S-1)的条件下培养3天。然后,为了去除土壤杆菌,在B5培养基(5μM苄氨基嘌呤、100mg/L羧苄西林、100mg/L万古霉素、500mg/L头孢噻肟)中25℃培养4天,每天更换培养基。然后在B5培养基(200mg/L卡那霉素)上培养。1-2个月形成多个幼芽。在B5培养基(0.58mg/L赤霉素,50mg/L卡那霉素)中使幼芽延伸。然后移到B5培养基(10μM IBA)中使其生根。驯化生根的幼植株,通过在温室中栽培获得转化体。
导入了棉子糖合成酶基因的转化体植物的确认可通过从转化体中提取DNA,以棉子糖合成酶基因作探针进行Southern杂交来很容易地进行确认。
附图简述图1表示由棉子糖合成反应而生成的棉子糖的生成量与反应时间的关系。
图2表示棉子糖合成酶的SDS-聚丙烯酰胺凝胶电泳的结果。M表示分子量标记,S表示含有棉子糖合成酶的样品。数字表示分子量(kDa)。
图3表示反应温度对棉子糖合成酶活性的影响。
图4表示反应pH对棉子糖合成酶活性的影响。
图5表示肌醇对棉子糖合成酶活性的影响。
图6表示棉子糖合成酶的稳定pH范围。
图7表示合成引物与肽的氨基酸序列的关系。R表示A或G,Y代表C或T,M代表A或C,K代表G或T,D代表G、A、或T,H代表A、T或C,B代表G、T或C,N代表G、A、T或C,I代表肌醇。
实施本发明的最佳方式以下通过实施例对本发明进行具体说明。
首先,说明棉子糖合成酶活性的测定方法,在以下的实施例中,它用于确定各纯化步骤中的活性级分以及检测酶的特性。<棉子糖合成酶活性测定法>
棉子糖合成酶的活性通过应用HPLC(高效液相色谱)对棉子糖合成反应中生成的棉子糖进行定量来测定。应用糖分析系统DX 500(CarboPac PAI柱,脉冲电级分析检测器,ダイオネクス公司)进行HPLC。
棉子糖合成反应是用终浓度如下的各组分配制反应液,向反应液中加入10~50μl的棉子糖合成酶溶液,使体积达100μl,32℃反应进行60分钟。[反应液组成(终浓度)]2.5mM蔗糖5mM 肌醇半乳糖苷5mM DTT20mM Tris-盐酸缓冲液(pH 7.0)如上进行反应后,向反应液中加入4倍体积的乙醇,95℃加热30秒终止反应。离心,将离心上清减压干燥后溶解到蒸馏水中,用糖分析系统对反应生成物中的棉子糖进行定量,作为棉子糖酶活性。实施例1从黄瓜纯化棉子糖合成酶<1>从黄瓜提取棉子糖合成酶从播种后6~10周的黄瓜(品种“SUYOU”)实叶收集叶脉部分,液氮中冻结,-80℃保存。在液氮中用乳钵将200g冻结的叶脉研磨碎,加入缓冲液1(40mM Tris-盐酸缓冲液(pH 7.0),5mMDTT,1mM PMSF(苯甲基磺酰氟),1%ポリクラ-ルAT;ヤルバ公司),提取蛋白质。用纱布和ミラクロス(カルバイオケム-ノボバイオケム(Calbiochem-Novobiochem)公司)等滤器将提取液过滤,将滤液于4℃、30,000×g离心60分钟。所得离心上清为粗提液。<2>阴离子交换色谱(1)将上面所得到的粗提取液约560ml加到用缓冲液2(20mM Tris盐酸缓冲液(pH 7.0)、5mM DTT)平衡的5个连结的强碱性阴离子交换色谱柱(HiTrapQ;ファルマシア公司,1.6cm×2.5cm)上,将棉子糖合成酶活性吸附到柱上。接着用5倍柱体积的缓冲液3(20mM Tris-盐酸缓冲液(pH 7.0),0.2M NaCl,5mM DTT)洗涤柱子,洗出非吸附的蛋白质之后,用50ml的缓冲液4(20mMTris-HCl缓冲液(pH 7.0),0.3M NaCl,5mM DTT)从柱上洗脱棉子糖合成酶活性。<3>阴离子交换色谱(2)将上面的洗脱液约75ml放置到透析管(PormembranesMWCO10,000;スペクトラ(Spectra)公司),对10L的缓冲液5(20mM Tris-HCl缓冲液(pH 7.0)、0.05M NaCl,5mM DTT)于4℃透析一晚。将透析的样品加到用缓冲液5平衡的弱碱性阴离子交换色谱柱(DEAE-TOYOPEARL;东-ン,2.2×20cm),棉子糖合成酶活性吸附于柱上。接着用5倍柱体积的缓冲液5洗涤柱子,洗出非附着的蛋白质后,用20倍柱体积的0.05M~0.35M线性NaCl浓度梯度洗脱出酶活性级分。<4>凝胶过滤色谱用浓缩器(ヤントリプレップ10,Amicon公司)将上面得到的洗脱液约160ml浓缩为6.5ml。每3ml上样于凝胶过滤色谱柱(Superdex×200pgファルマシア公司,2.6cm×60cm)。用缓冲液6(20mM Tris-HCl缓冲液(pH 7.0)、0.1M NaCl,5mMDTT,0.02%吐温20)平衡和洗脱柱子。从分级的各部分中收集具有棉子糖合成酶活性的部分。<5>羟磷灰石色谱用ヤントリプレップ10浓缩凝胶过滤中分级出的棉子糖合成酶活性部分约25ml,再用缓冲液7(0.01M磷酸钠缓冲液(pH 7.0)、5mM DTT,0.02%吐温20)交换缓冲液。将所得的浓缩液约1.2ml上样于预先用同一缓冲液平衡了的羟磷灰石色谱柱(Bio-ScaleCHT-1,バイオラッド公司,0.7×5.2),吸附棉子糖合成酶活性。用5倍柱体积(10ml)的同一缓冲液洗涤柱子后,用20倍柱体积的线性0.01M~0.3M磷酸浓度梯度洗脱柱子得到酶活性部分。<6>羟磷灰石再次色谱法对如上由羟磷灰石色谱法得到的活性部分进行同样的色谱分析,得到纯化的棉子糖合成酶级分(约2ml)。
本活性部分的蛋白质量约200μg。另外,总活性为5700nmol/小时,平均的蛋白质比活性约28μmol/小时/mg。该活性部分只含有蛋白质,该蛋白质在后面所述的电泳上显示分子量约90kDa~100kDa的单一带。所得纯化酶标准品的比活性大约为粗提取液的2000倍,相对于用HiTrapQ进行强碱性阴离子交换色谱后的酶量,其回收率为12%。纯化的结果总结于表1。
表1总蛋白质 总活性 比活性 产率mgnmol/h nmol/h/mg%粗提取液 1915 20700 11-HiTrapQ1092 48800 45100DEAE-TOYOPERAL 54033000 6168Superdex 200pg 1.79 26500 14800 54羟磷灰石色谱(1)0.51 12600 24700 26羟磷灰石色谱(2)0.20 5700 28500 12实施例2棉子糖合成酶特性的研究研究实施例1中得到的纯化棉子糖合成酶的特性。<1>分子量的测定(1)凝胶过滤色谱法取10μl纯化的棉子糖合成酶,将该样品及分子量标记(凝胶过滤用分子量标记试剂盒ファルマシア公司)上样于凝胶过滤色谱柱(Superdex 200pg;ファルマシア公司)。用缓冲液6(20mMTris-HCl缓冲液(pH 7.0)、0.1M NaCl,5mM DTT,0.02%吐温20)平衡和洗脱柱子。结果推定棉子糖合成酶的分子量约为75kDa~95kDa。(2)聚丙烯酰胺凝胶电泳(非变性PAGE)取10μl纯化的棉子糖合成酶,加入等量的样品缓冲液(0.0625M Tris-HCl(pH 6.8)、15%甘油,0.001%BPB)作为电泳样品。将该样品10μl加到10%聚丙烯酰胺凝胶(第一化学制品厂,マルチゲル10),在0.025M Tris-0.192M甘氨酸缓冲液(pH 8.4)中,40mA电泳60分钟。电泳后,用シルベストステイン银染色试剂盒(ナカライテスク公司)进行染色。结果,推定其分子量约90kDa~100kDa。(3)SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)取10μl纯化的棉子糖合成酶,加入等量的样品缓冲液(0.0625Tris-HCl(pH 6.8),2%SDS,10%甘油,5%巯基乙醇,0.001%BPB),沸水浴中加热1分钟,作为电泳样品。将该样品10μl加到10-20%梯度聚丙烯酰胺凝胶(第一化学药品厂),在含有0.1%SDS的0.025M Tris-0.192M甘氨酸缓冲液(pH 8.4)中,40mA电泳70分钟。电泳后用シルベストステイン银染色试剂盒(ナカライテスク公司)进行染色。结果如图2所示。结果推定分子量约为90kDa~100kDa。<2>反应的最适温度按照前面的棉子糖合成酶活性的测定方法,在不同温度条件下(28℃、32℃、36℃、40℃、44℃、48℃、52℃)测定棉子糖合成酶活性。各反应液中加入的酶液为2μl。把32℃的酶活性作为100时,各温度的相对活性如图3所示。结果表示棉子糖合成酶在25~42℃范围内显示活性,反应的最佳温度为35~40℃。<3>最佳反应pH按照前面所讲的棉子糖合成酶活性测定法测定不同pH条件下(pH 4~11)棉子糖合成酶活性。各反应中应用50mM柠檬酸缓冲液(pH 4~6),50mM磷酸钾缓冲液(pH 5.5~7.5),50mMBis-Tris缓冲液(pH 6~7),20mM Tris-HCl缓冲液(pH 7~8.5),50mM甘氨酸-NaOH缓冲液(pH 9~11)。另外,各反应液中加入的酶液为2μl。结果如图4所示。
结果显示棉子糖合成酶在pH 5~10的范围内具有活性,反应的最佳pH根据所用缓冲液的种类而不同,为6~8左右。<4>抑制剂及金属离子的研究向纯化的棉子糖合成酶的反应液中加入终浓度为1mM的各种酶抑制剂或金属离子,与前面同样地测定棉子糖合成酶活性。相对于未添加抑制剂或金属离子时的酶活性的残存活性如表2所示。碘乙酰胺显著抑制酶活性,N-乙基马来酰亚胺也有抑制效果。另外,CaCl2、CuCl2、MgCl2几乎无抑制效果,而MnCl2、ZnCl2、NiCl2显示抑制效果。
表2抑制剂或金属离子 残存活性(%)未加入100碘乙酰胺 0N-乙基马来酰亚胺 40CaCl2115CuCl2101MgCl296MnCl232ZnCl242NiCl268<5>肌醇的抑制检测棉子糖合成反应的反应生成物-肌醇引起的抑制。向反应液中加入各种浓度的肌醇,测定棉子糖合成酶活性。结果如图5所示。随添加肌醇浓度的升高酶活性受到抑制。<6>稳定pH将在前面阴离子交换色谱(2)中得到的棉子糖合成酶级分在50mM Bis-Tris HCl缓冲液(pH 5~8,含有0.5mM DTT)或20mMTris-HCl缓冲液(pH 7~8,含0.5mM DTT)中,4℃培养4小时后测定棉子糖合成酶活性。相对于培养中所用缓冲液pH的酶活性如图6所示。在任一培养条件下均可看到棉子糖合成酶活性,尤其在pH 5~7.5的范围内稳定。<7>稳定温度在20mM Tris-HCl缓冲液(pH7,含有5mM DTT)中培养在前面阴离子交换色谱(2)中得到的棉子糖合成酶级分,28℃、32℃、37℃或40℃培养60分钟后测定棉子糖合成酶活性。结果,与上述未进行培养处理的对照相比,在28-40℃范围内,本酶具有80%~100%活性,在该范围内稳定。<8>氨基酸序列的分析将纯化棉子糖合成酶的半胱氨酸残基还原吡啶乙基化后,脱盐。用赖氨酸肽链内切酶(无色杆菌蛋白酶1,和光纯药)将之消化,37℃消化12小时,形成肽片段。将所得肽片段混合液上样于反相HPLC(柱ウオ-タ-ズμBondasphere(Φ2.1×150mm,C18,300A),ウォ-タ-ズ公司(ミリポア)),分离,获得各肽片段。用0.1%TFA(三氟醋酸)作溶剂,用乙腈的浓度梯度进行洗脱。用蛋白质测序仪对所得肽片段中的3个片段测定其氨基酸序列。测定的各肽段的氨基酸序列显示于序列表序列号1~3中。以下按顺序将这些肽分别叫做肽1,2和3。实施例3从黄瓜获得编码棉子糖合成酶的DNA<1>通过PCR法分离棉子糖合成酶cDNA的部分片段在液氮中用乳钵将22g黄瓜的主叶脉磨碎。将研磨物加入到预热到80℃的提取缓冲液(100mM氯化锂,100mM Tris-HCl(pH8.0),10mM EDTA,1%SDS)与等体积酚的混合液中,搅拌后加入酚和等量的氯仿∶异戊醇(24∶1)的混合物,再进行搅拌,将该混合液于4℃,9250×g离心15分钟,吸取上清。对该上清反复进行酚处理,氯仿∶异戊醇处理,离心,得到上清。向上清中加入等量的4M氯化锂,-70℃静置1小时。
室温解冻后,于4℃ 9250×g离心30分钟,得到沉淀。用2M氯化锂、80%乙醇洗涤沉淀物各1次,干燥后溶解到2ml焦碳酸二乙酯处理水中,作为总RNA。所得总RNA为2.38mg。
将全部总RNA用于应用Oligo(dT)纤维素柱的poly(A)+RNA纯化试剂盒(STRATAGENE CLONING SYSTEMS公司),纯化poly(A)+RNA,得到42.5μg的poly(A)+RNA。
应用逆转录酶Super Script lI(GIBCO BRL公司)从上面所得的poly(A)+RNA合成单链cDNA。为了从该cDNA混合物分离出棉子糖合成酶cDNA,用PCR法进行扩增。PCR中应用的引物是在实施例2中测定的黄瓜来源的棉子糖合成酶的肽片段氨基酸序列的基础上,按图7所示合成单链寡核苷酸(序列号6~22)。各引物的序列中,各字母分别代表R为A或G,Y为C或T,M为A或C,K为G或T、D为G、A或T,H为A、T或C,B为G、T或C,N为G、A、T或C,I为肌醇(核苷酸为次黄嘌呤)。
当5′端引物为A(A1(序列号6)、A2(序列号7)、A3(序列号8)、A4(序列号9))和3′引物为D′(D′1(序列号21)、D′2(序列号22)),联合应用时,或5′引物为C2(序列号14)),3′引物为B′1(序列号18)或B′2(序列号19)时,可扩增出大约540个核苷酸对。用TA克隆试剂盒(INVITROGENBV公司制)将该片段克隆到质粒pCRII中,分析核苷酸序列后发现,编码肽1、2氨基酸序列的核苷酸序列存在于两末端引物序列的内侧,由此可知前面的扩增片段为来源于棉子糖合成酶基因的DNA片段。
为了明确克隆的上述PCR扩增的DNA片段在棉子糖合成酶基因上的位置,用RACE试剂盒(3′Ampifinder RACE Kit(CLONTECH公司制))进行3′RACE。
以前面的cDNA混合物作模板,应用C作5′引物(C1(序列号13),C2(序列号14)),应用含有Oligo(dT)和锚定序列的引物为3′引物进行PCR,然后再以如此所得的扩增片段作模板,应用位于C内侧的D(D1(序列号15)、D2(序列号16))作5′引物,应用Oligo(dT)-锚定引物作3′引物,进行PCR。结果,只有应用用C1(序列号13)或C2(序列号14)和Oligo(dT)-锚定引物扩增出的DNA作模板,用D2(序列号16)和Oligo(dT)-锚定引物进行PCR时,扩增出约2400个核苷酸对的DNA片段。再应用C(C1(序列号13)、C2(序列号14)作5′引物,应用Oligo(dT)-锚定引物作3′引物进行PCR,再将所得的扩增片段作模板,用E(序列号17)作5′引物,用Oligo(dT)-锚定引物作3′引物进行PCR。结果,无论在哪种情况均扩增出约300bp的DNA片段。
同样以前面的cDNA混合物作模板,用A(A1(序列号6)、A2(序列号7)、A3(序列号8)或A4(序列号9))作5′引物,用含有Oligo(dT)和锚定序列的引物作3′引物进行PCR,再以所得扩增片段作模板,用位于A内侧的B(B1(序列号10)、B2(序列号11)或B3(序列号12))作5′引物,用同一Oligo(dT)锚定引物作3′引物进行PCR。结果应用任一种A引物的同时应用B2引物的时候可得到大约2000bp的DNA片段。因此克隆应用A2、B2引物扩增出的DNA片段。对核苷酸序列进行分析时发现5′端存在编码肽片段1的氨基酸序列的核苷酸序列,而该片段用于制备引物。另外,在3′端存在poly(A)序列和与其上游的肽片段3相对应的核苷酸序列。
结合先前的PCR结果发现棉子糖合成酶肽片段从N末端以2、1、3的顺序排列,先前PCR中所得的约540bp的DNA片段是接近棉子糖合成酶基因5′末端的部分。为了筛选含有棉子糖合成酶基因全长的cDNA克隆,希望应用能检测出接近5′末端部分的DNA作探针,因此用所得DNA片段作探针进行cDNA文库的筛选。<2>棉子糖合成酶cDNA编码区全长的克隆首先,如下制作cDNA文库。应用Time Saver cDNA合成试剂盒(Pharmacia Biotech公司制),由<1>中得到的poly(A)+RNA 3.8μg合成双链cDNA。将所得cDNA插入到λ噬菌体载体λMOSSlox(Amersham公司制)的EcoR I限制性酶切位点后,应用Gigapack IIGold包装试剂盒(STRATAGENE CLONING SYSTEM公司制)包装进噬菌体蛋白质中,制备成黄瓜的cDNA文库。该文库的滴度为1.46×107pfu/μg载体。
用上述黄瓜cDNA文库中相当于1.4×105pfu的噬菌体感染宿主细胞大肠杆菌ER1647后,以每平皿1.0×104pfu铺到14枚直径90mm的琼脂板上。37℃培养6.5小时后,将板上形成的噬菌斑转移到尼龙膜上(Amersham公司Hybond-N+)。
接着,用碱处理上述尼龙膜,将转移的DNA变性、中和后洗净。然后于80℃将该尼龙膜处理2小时,使DNA固定于膜上。
用<1>中所得的约540bp的DNA片段作探针在所得的尼龙膜上筛选阳性克隆。用限制性酶EcoRI消化上述的约540bp的DNA片段后进行电泳,只切出约540bp的插入部分并进行纯化。用DNA标记和检测系统(Gene Images标记、检测系统(Amersham公司制)),使用荧光素进行标记,用作探针。将前面的尼龙膜60℃预杂交30分钟,然后加入标记的探针,60℃杂交16小时。将用于检测标记的DNA的抗体(碱性磷酸酶标记的抗荧光素抗体)稀释50000倍后应用。这次筛选中得到阳性克隆的候补株。将所得候补株同上再重复筛选2次,得到纯化的阳性克隆。
用上述的阳性克隆感染大肠杆菌BM 25.8,在含有羧苄西林的选择培养基上进行培养,切出含有cDNA的质粒载体pMOSSlox-CRS。该质粒的插入cDNA的长度约2.5kb。再用该质粒转化大肠杆菌JM109,从转化体中制备质粒DNA,作为用于分析核苷酸序列的样品。
应用Taq DyeDeoxy Terminator Cycle Sequencing Kit(Perkin-Elmer公司制),用目前已知的方法分析插入cDNA的核苷酸序列。
结果阐明了如序列表序列号4所示的由2352对核苷酸构成的核苷酸序列。该序列中存在与本发明者们应用的DNA探针核苷酸序列一致的部分。另外,由核苷酸序列翻译的氨基酸序列显示于序列号4及序列号5中。该氨基酸序列中存在与本发明者们得到的黄瓜来源的棉子糖合成酶的肽1(序列号5中,氨基酸序号215~244)、2(序列号5中,氨基酸序号61~79)和3(序列号5中,氨基酸序号756~769)相一致的部分,由此可以证实它编码棉子糖合成酶。
携带质粒pMOSSIoxCRS的大肠杆菌JM109的转化体AJ13263(该质粒包含编码如上所得的棉子糖合成酶的DNA)于1996年11月19日根据布达佩斯条约保藏于通商产业省工业技术院生命工学工业技术研究所(邮编号305日本国茨城县つくば市东-丁目1番3号),保藏号FERM BP-5748。实施例4从大豆获得编码棉子糖合成酶的DNA<1>检索用于克隆大豆来源的棉子糖合成酶基因的探针用黄瓜来源的棉子糖合成酶基因的全长作探针,对大豆总RNA进行Northern杂交。探针是含有黄瓜来源的棉子糖合成酶基因的DNA片段,其获得是用限制性酶NotI消化实施例3中得到的质粒pMOSSlox CRS,进行琼脂糖凝胶电泳,分离插入的片段,用α-P32dCTP标记分离的DNA片段。总RNA是应用SDS-酚法从大豆的未成熟种子(开花后5~6周)制备的30μg总RNA。预杂交30分钟后,加入探针,42℃杂交一晚上。1×SSC、0.1%SDS,60℃的条件下洗涤。可以看到作为对照的黄瓜来源的棉子糖合成酶的信号,但未得到与大豆来源的RNA相对的明确信号。由此可以判断希望应用更保守区域作探针而非用黄瓜基因全长作探针。<2>分离拟南芥棉子糖合成酶基因的部分片段在液氮中用乳钵将拟南芥开花后17~20日的荚125mg研碎。向该研碎物中加入3ml 2×CTAB(2%三甲基十六烷基溴化铵,0.1MTris-HCl(pH 9.5),1.4M NaCl,0.5%巯基乙醇)使之扩散,65℃振荡10分钟。将之移到フアルコンチュ-ブ的ブル-マッウス(50ml)中。加入3ml的氯仿∶异戊醇(24∶1(v/v)轻轻混和,12000rpm离心10分钟。用3ml氯仿∶异戊醇(24∶1 v/v)再将上清抽提,10000rpm离心25分钟。1.8ml离心上清中加入1.5ml异戊醇,混和,12000rpm,4℃离心15分钟得到沉淀。用70%乙醇洗涤沉淀后,将沉淀干燥,溶解到1ml TE缓冲液中。加入1/4的10M氯化锂溶液,混和,冰中静置4小时,12000rpm,4℃离心15分钟。用2M氯化锂、70%乙醇将沉淀洗涤、干燥后,溶解到100μl的TE缓冲液中。加入酚∶氯仿(1∶1(v/v)),搅拌,12000rpm,4℃离心15分钟,得到水相。乙醇沉淀水相,用70%乙醇洗涤沉淀后干燥,溶解于10μl焦碳酸二乙酯处理水中,作为总RNA。所得总RNA为18.7μg。用逆转录酶Super Script II(GIBCO BRL公司制)由总RNA合成单链cDNA。
为了通过PCR从该cDNA混和物中扩增棉子糖合成酶基因部分片段,合成引物。在GenBank中检索与黄瓜棉子糖合成酶基因具有同源性的DNA,在保守区域的基础上合成单链寡核苷酸(序列号25、26)作探针。以前面的单链cDNA作模板,应用该引物进行PCR,扩增出约250bp的DNA片段。用TA克隆试剂盒(INVITROGEN BV公司制)将该片段克隆到质粒pCR2.1中,分析其核苷酸序列,结果得到序列号27所示的核苷酸序列。由此断定得到与黄瓜棉子糖合成酶具有同源性的拟南芥棉子糖合成酶cDNA的部分片段。<3>大豆棉子糖合成酶cDNA的克隆在液氮中用乳钵研磨大豆开花后5-6周的种子4.5g。用SDS-酚法从研磨物中提取出1.3mg的总RNA。将提取物过Oligo-dT纤维素柱(poly(A)+RNA纯化试剂盒STRATAGENE CLONINGSYSTEM公司制),分离出约6μg的poly(A)+RNA。应用Time SavercDNA合成试剂盒(Pharmacia biotech公司制),通过应用Oligo-dT引物,从其中的2μg poly(A)+RNA合成双链cDNA。将所得cDNA整合到λ噬菌体载体λMOSS lox(Amersham公司制)的EcoRI限制性酶切位点后,用Gigapack II Gold包装试剂盒(STRATAGENECLONING SYSTEM公司)包装入噬菌粒中,制备大豆的cDNA文库。本文库的效价为1.42×107pfu/μg载体DNA。
将大豆的cDNA文库中,相当于1.5×105pfu的噬菌体,与黄瓜cDNA文库同样地转移固定到尼龙膜(Hybond-N+;Amersham公司)上。一块板转移2块膜以制备2组。用<2>中得到的拟南芥棉子糖合成酶基因cDNA的部分片段对尼龙膜进行筛选,用Gene Images标记检测系统(Amersham公司)对该DNA片段进行荧光素标记。杂交及检测与黄瓜cDNA文库的筛选相同。但是膜的洗涤是1组用1×SSC、0.1%SDS,一组用0.1×SSC、0.1%SDS,60℃进行。两种条件下得到15个阳性克隆候补株,对候补株进行与上面同样的筛选,再重复1次,得纯化的克隆5株。
用上述阳性克隆感染E.coli BM 25.8,切出含cDNA的质粒。再用该质粒转化E.coli JM109,从转化体制备质粒DNA,作为核苷酸序列分析用的样品。核苷酸序列的分析与黄瓜棉子糖合成酶基因的相同。对5克隆中的一个—pMOSS lox SRS进行了核苷酸序列分析,结果证实它含有大豆来源的棉子糖合成酶基因全长。
pMOSS lox SRS的插入片段含有如序列号23所示的2780对核苷酸构成的序列,编码由750个氨基酸构成的棉子糖合成酶。其它克隆的插入片段较pMOSS lox SRS的短,缺失棉子糖合成酶基因的5′端。
携带质粒pMOSS lox SRS的大肠杆菌JM109的转化体AJ 13379(该质粒含有编码如上所得的棉子糖合成酶的DNA的片段)于1997年10月20日,按照布达佩斯条约保藏于通商产业省工业技术院生命工学工业技术研究所(邮编305,日本国茨城县つくば市东-丁目1番3号),保藏号为FERM BP-6149。实施例5含有编码棉子糖合成酶的DNA的嵌合基因及其转化植物<1>含有嵌合基因质粒的构建用LBA 4404作土壤杆菌,用pBI 121(CLONTECH公司)作双载体,将棉子糖合成酶的DNA片段导入拟南芥。pBI 121是来源于pBIN19的质粒,连接有胭脂碱合成酶基因启动子、新霉素磷酸转移酶结构基因(NPT II)、胭脂碱合成酶终止子(Nos-ter)、CaMV35S启动子、GUS(β-葡糖苷酸酶)基因、及Nos-ter,其两侧有可转座进入植物的序列。CaMV 35S启动子的下游有SmaI位点,插入该位点的插入子在该启动子的调控下表达。
将实施例3中得到的黄瓜棉子糖合成酶基因片段插入双载体pBI121。用DraI消化棉子糖合成酶基因,通过琼脂糖凝胶电泳可制备出含有序列表序列号4中1382~2529号核苷酸的DNA片段。将该片段连接到pBI 121的Sma I位点。用该连接反应液转化大肠杆菌HB101,由转化体制备重组质粒。从所得重组质粒中选择2种棉子糖合成酶DNA片段与CaMV 35S启动子逆向连接的质粒(反义),正向连接的质粒(有义),分别命名为pBIcRS1和pBIcRS9。
另外,构建含有表达棉子糖合成酶的嵌合基因的质粒。用NotI消化含有棉子糖合成酶的pMOSS lox CRS,通过琼脂糖凝胶电泳制备棉子糖合成酶基因片段。用dNTP,通过Taq聚合酶反应补齐该DNA片段的NotI酶切位点,得到3′端A核苷酸突出的CRS片段。另一方面,用Sma I消化pBI121,通过琼脂糖凝胶电泳纯化直链DNA,用dTTP,通过Taq聚合酶反应得到3′端添加了T核苷酸的pBI121/SmaI。纯化后,将CRS片段连接到pBI121/Sma I。用该连接反应液转化大肠杆菌HB 101。从所得转化体中制备质粒DNA,分别用限制性酶EcoRI、BamHI、XhoI或联合应用进行消化。用琼脂糖电泳测定所得片段的分子量,制成物理图。在制备的物理图的基础上,从重组质粒中选择棉子糖合成酶基因与CaMV 35S启动子正向连接的质粒,命名为pBIs RS1。
通过含有如上所得质粒的大肠杆菌HB101与土壤杆菌LBA 4404的三亲交配,将该质粒导入土壤杆菌LBA 4404中。<2>转化拟南芥的转化如下进行。将拟南芥(Arabidopsis thaliana)的种子进行吸水处理后,在含有1%吐温20的80%乙醇中处理5分钟,在同样含有1%吐温20的10%次氯酸钠中处理10分钟,用灭菌水洗涤5次进行灭菌。将之悬浮到1%低融点琼脂糖中,铺到MS培养基(MS基本培养基(Murashige and Skoog,Physiologia Plantrum,15,473-497(1962))、维生素B5,10g/L蔗糖,0.5g/L MES,pH8.5)。在22℃光照16小时,黑暗8小时的条件下,在培养室中培养1周,当双叶展开的时候,用ロツクウ-ル固定植株。在同样的条件下继续培养3周,植物抽苔,当苔的高度达数厘米的时候,摘心。摘心后1周,植物培育至伸长的侧枝最初的花开花的状态。
在2ml LB培养基上预培养导入了含有棉子糖合成酶基因的重组质粒的土壤杆菌。将之接种到含有50mg/L卡那霉素、25mg/L链霉素的LB培养基上,28℃培养1日左右。室温下收集细菌,悬浮到浸润用的悬浮培养基(1/2 MS盐,1/2ガンボルゲ(Gamborg)维生素B5,5%蔗糖,0.5g/L MES,pH5.7(KOH),使用前加入终浓度为0.044μM的苄氨基嘌呤和シルウェット(Silwet L77),200μ/L(终浓度为0.02%),使菌液的OD600为0.8。
从植株上摘下开花并结果的花进行浸润。颠倒ロックウ-ル,将未结果实的花浸到上述土壤杆菌悬浮液中,加到干燥器中,40mmHG下减压15分钟。2-4周后收集种子。在干燥器中保存收集的种子。
接着在选择培养基上选择转化体。按先前所述的方法对种子进行灭菌,在选择培养基(MS盐,ガンボルゲ维生素B5,1%蔗糖,0.5g/L MES,pH 5.8、0.8%琼脂;高压灭菌后加入选择用的抗生素羧苄西林(终浓度100mg/L),卡那霉素(终浓度50mg/L))中22℃进行培养,选择抗性植物。将抗性植物移到新培养基上,培育到真叶展开。从这些植物收获种子。重复同样的选择,获得T3种子。按前面讲述的方法测定T3种子中棉子糖的含量,结果如表3所示。
表3植物(质粒) 棉子糖含量(mg/g)野生株 0.20转化体(pBIcRS1) 0.00转化体(pBIcRS9) 0.00转化体(pBIsRS1) 0.22工业实用性本发明提供纯化的棉子糖合成酶,棉子糖合成酶基因,含有棉子糖合成酶基因和能在植物中表达的调控区域的嵌合基因,以及导入了该嵌合基因的植物。
通过应用本发明的棉子糖合成酶可从蔗糖和肌醇半乳糖苷有效地合成棉子糖,另外,通过应用本发明的棉子糖合成酶基因或嵌合基因可改变植物中棉子糖家族寡糖的含量。
序列表(1)一般情况(i)申请人味の素株式会社(ii)发明名称棉子糖合成酶基因、棉子糖的制备方法及其转化的植物(iii)序列数30(iv)联络地址(A)收信人味の素株式会社(B)街道京桥一丁目15番1号(C)市中央区(D)州东京都(E)国日本国(F)ZIP104(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn(vi)本申请数据(A)申请号(B)申请日期24.10.97(C)分类(D)参考号B368AW20P628(vii)在先申请数据(A)申请号JP 1997111124(B)申请日期28.04.97(2)与序列1相关的情报(i)序列的性质(A)长度30(B)种类氨基酸(D)拓扑学直链
(ii)序列的种类肽(v)片段类型中间的肽(xi)序列序列编号1Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Leu Thr Val His Pro Gln1 5 10 15Gly Val Ile Glu Gly Val Arg His Leu Val Asp Gly Gly Cys20 25 30(2)与序列2相关的情报(i)序列的性质(A)长度19(B)种类氨基酸(D)拓扑学直链(ii)序列的种类肽(v)片段类型中间的肽(xi)序列序列编号2Pro Val Ser Val Gly Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp1 5 10 15Ser Arg His(2)与序列3相关的情报(i)序列的性质(A)长度14(B)种类氨基酸(D)拓扑学直链(ii)序列的种类肽(v)片段类型中间的肽(xi)序列序列编号3Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp Pro1 5 10(2)与序列4相关的情报(i)序列的性质(A)长度2569(B)种类核酸(C)链数双链(D)拓扑学直链(ii)序列的种类cDNA到mRNA(vi)起源(A)生物名黄瓜(Cucumis sativus)(ix)序列的特征(A)表示特征的符号CDS(B)存在位置56..2407(xi)序列序列编号4AAAAAACAAC CCTTCTTTTA GTTTTTTGGG TTTGTTTCTT CTTTTCTTCT CACAA ATG 58Met1GCT CCT AGT TTT AAA AAT GGT GGC TCC AAC GTA GTT TCA TTT GAT GGC 106Ala Pro Ser Phe Lys Asn Gly Gly Ser Asn Val Val Ser Phe Asp Gly5 10 15TTA AAT GAC ATG TCG TCA CCG TTT GCA ATC GAC GGA TCG GAT TTC ACT 154Leu Asn Asp Met Ser Ser Pro Phe Ala Ile Asp Gly Ser Asp Phe Thr20 25 30GTG AAC GGT CAT TCG TTT CTG TCC GAT GTT CCT GAG AAC ATT GTT GCT 202Val Asn Gly His Ser Phe Leu Ser Asp Val Pro Glu Asn Ile Val Ala35 40 45TCT CCT TCT CCG TAC ACT TCG ATA GAC AAG TCC CCG GTT TCG GTT GGT 250Ser Pro Ser Pro Tyr Thr Ser Ile Asp Lys Ser Pro Val Ser Val Gly50 55 60 65TGC TTT GTT GGA TTC GAC GCG TCG GAA CCT GAT AGC CGA CAT GTT GTT 298Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp Ser Arg His Val Val70 75 80TCG ATT GGG AAG CTG AAG GAT ATT CGG TTT ATG AGT ATT TTC AGG TTT 346Ser Ile Gly Lys Leu Lys Asp Ile Arg Phe Met Ser Ile Phe Arg Phe85 90 95AAG GTT TGG TGG ACT ACA CAC TGG GTT GGT CGA AAT GGT GGG GAT CTT 394Lys Val Trp Trp Thr Thr His Trp Val Gly Arg Asn Gly Gly Asp Leu100 105 110GAA TCG GAG ACT CAG ATT GTG ATC CTT GAG AAG TCA GAT TCT GGT CGA 442Glu Ser Glu Thr Gln Ile Val Ile Leu Glu Lys Ser Asp Ser Gly Arg115 120 125CCG TAT GTT TTC CTT CTT CCG ATC GTT GAG GGA CCG TTC CGA ACC TCG 490Pro Tyr Val Phe Leu Leu Pro Ile Val Glu Gly Pro Phe Arg Thr Ser130 135 140 145ATT CAG CCT GGG GAT GAT GAC TTT GTC GAT GTT TGT GTC GAG AGT GGT 538Ile Gln Pro Gly Asp Asp Asp Phe Val Asp Val Cys Val Glu Ser Gly150 155 160TCG TCG AAA GTT GTT GAT GCA TCG TTC CGA AGT ATG TTG TAT CTT CAT 586Ser Ser Lys Val Val Asp Ala Ser Phe Arg Ser Met Leu Tyr Leu His165 170 175GCT GGT GAT GAT CCC TTT GCA CTT GTT AAA GAG GCG ATG AAG ATC GTG 634Ala Gly Asp Asp Pro Phe Ala Leu Val Lys Glu Ala Met Lys Ile Val180 185 190AGG ACC CAT CTT GGA ACT TTT CGC TTG TTG GAG GAG AAG ACT CCA CCA 682Arg Thr His Leu Gly Thr Phe Arg Leu Leu Glu Glu Lys Thr Pro Pro195 200 205GGT ATC GTG GAC AAA TTC GGT TGG TGC ACG TGG GAC GCG TTT TAC CTA 730Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Leu210 215 220 225ACG GTT CAT CCA CAG GGC GTA ATA GAA GGC GTG AGG CAT CTC GTC GAC 778Thr Val His Pro Gln Gly Val Ile Glu Gly Val Arg His Leu Val Asp230 235 240GGC GGT TGT CCT CCC GGT TTA GTC CTA ATC GAC GAT GGT TGG CAA TCC 826Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp Asp Gly Trp Gln Ser245 250 255ATC GGA CAC GAT TCG GAT CCC ATC ACC AAA GAA GGA ATG AAC CAA ACC 874Ile Gly His Asp Ser Asp Pro Ile Thr Lys Glu Gly Met Asn Gln Thr260 265 270GTC GCC GGC GAG CAA ATG CCC TGC CGT CTT TTG AAA TTC CAA GAG AAT 922Val Ala Gly Glu Gln Met Pro Cys Arg Leu Leu Lys Phe Gln Glu Asn275 280 285TAC AAA TTC CGT GAC TAC GTC AAT CCC AAG GCC ACC GGC CCC CGA GCC 970Tyr Lys Phe Arg Asp Tyr Val Asn Pro Lys Ala Thr Gly Pro Arg Ala290 295 300 305GGC CAG AAG GGG ATG AAG GCG TTT ATA GAT GAA CTC AAA GGA GAG TTT 1018Gly Gln Lys Gly Met Lys Ala Phe Ile Asp Glu Leu Lys Gly Glu Phe310 315 320AAG ACT GTG GAG CAT GTT TAT GTT TGG CAT GCT TTG TGT GGA TAT TGG 1066Lys Thr Val Glu His Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp325 330 335GGT GGC CTT CGC CCG CAG GTG CCT GGC TTG CCT GAG GCA CGT GTG ATT 1114Gly Gly Leu Arg Pro Gln Val Pro Gly Leu Pro Glu Ala Arg Val Ile340 345 350CAG CCA GTG CTT TCA CCA GGG CTG CAG ATG ACG ATG GAG GAT TTG GCG 1162Gln Pro Val Leu Ser Pro Gly Leu Gln Met Thr Met Glu Asp Leu Ala355 360 365GTG GAT AAG ATT GTT CTT CAT AAG GTC GGG CTG GTC CCG CCG GAG AAG 1210Val Asp Lys Ile Val Leu His Lys Val Gly Leu Val Pro Pro Glu Lys370 375 380 385GCT GAG GAG ATG TAC GAA GGA CTT CAT GCT CAT TTG GAA AAA GTT GGG 1258Ala Glu Glu Met Tyr Glu Gly Leu His Ala His Leu Glu Lys Val Gly390 395 400ATC GAC GGT GTT AAG ATT GAC GTT ATC CAC CTA TTG GAG ATG TTG TGT 1306Ile Asp Gly Val Lys Ile Asp Val Ile His Leu Leu Glu Met Leu Cys405 410 415GAA GAC TAT GGA GGG AGA GTG GAT TTG GCA AAG GCA TAT TAC AAA GCA 1354Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala Tyr Tyr Lys Ala420 425 430ATG ACC AAA TCA ATA AAT AAA CAT TTT AAA GGA AAT GGA GTC ATT GCA 1402Met Thr Lys Ser Ile Asn Lys His Phe Lys Gly Asn Gly Val Ile Ala435 440 445AGT ATG GAA CAT TGT AAC GAC TTC ATG TTC CTT GGC ACG GAA GCT ATC 1450Ser Met Glu His Cys Asn Asp Phe Met Phe Leu Gly Thr Glu Ala Ile450 455 460 465TCT CTT GGT CGT GTT GGT GAT GAC TTT TGG TGC ACG GAC CCC TCT GGT 1498Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro Ser Gly470 475 480GAT CCA AAC GGT ACG TTT TGG CTC CAA GGA TGT CAC ATG GTT CAT TGT 1546Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His Met Val His Cys485490 495GCC AAC GAC AGC TTG TGG ATG GGG AAC TTC ATC CAC CCT GAC TGG GAT 1594Ala Asn Asp Ser Leu Trp Met Gly Asn Phe Ile His Pro Asp Trp Asp500 505 510ATG TTC CAA TCC ACC CAC CCT TGT GCC GCC TTC CAT GCT GCC TCT CGA 1642Met Phe Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg515 520 525GCC ATC TCT GGT GGC CCG ATC TAT GTT AGT GAT TCT GTG GGA AAG CAT 1690Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Lys His530 535 540 545AAC TTT GAT CTT CTG AAA AAA CTA GTG CTT CCT GAT GGA TCG ATC CTT 1738Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Ile Leu550 555 560CGA AGT GAG TAC TAT GCA CTC CCG ACT CGC GAT TGT TTG TTT GAA GAC 1786Arg Ser Glu Tyr Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp565 570 575CCT TTG CAT AAT GGA GAA ACT ATG CTT AAG ATT TGG AAT CTC AAC AAG 1834Pro Leu His Asn Gly Glu Thr Met Leu Lys Ile Trp Asn Leu Asn Lys580 585 590TTC ACT GGA GTG ATT GGT GCA TTC AAC TGC CAA GGA GGA GGA TGG TGT 1882Phe Thr Gly Val Ile Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Cys595 600 605CGT GAG ACA CGC CGC AAC CAA TGC TTT TCA CAA TAC TCA AAA CGA GTG 1930Arg Glu Thr Arg Arg Asn Gln Cys Phe Ser Gln Tyr Ser Lys Arg Val610 615 620 625ACA TCC AAA ACT AAC CCA AAA GAC ATA GAA TGG CAC AGT GGA GAA AAC 1978Thr Ser Lys Thr Asn Pro Lys Asp Ile Glu Trp His Ser Gly Glu Asn630 635 640CCT ATC TCT ATT GAA GGC GTT AAA ACC TTT GCG CTT TAC CTC TAT CAA 2026Pro Ile Ser Ile Glu Gly Val Lys Thr Phe Ala Leu Tyr Leu Tyr Gln645 650 655GCC AAA AAA CTT ATC CTC TCC AAG CCC TCT CAA GAT CTT GAC ATA GCT 2074Ala Lys Lys Leu Ile Leu Ser Lys Pro Ser Gln Asp Leu Asp Ile Ala660 665 670CTT GAC CCA TTC GAA TTC GAG CTC ATC ACT GTT TCA CCA GTG ACC AAA 2122Leu Asp Pro Phe Glu Phe Glu Leu Ile Thr Val Ser Pro Val Thr Lys675 680 685CTC ATC CAA ACT TCT CTA CAC TTT GCC CCA ATT GGG CTG GTG AAC ATG 2170Leu Ile Gln Thr Ser Leu His Phe Ala Pro Ile Gly Leu Val Asn Met690 695 700 705CTT AAC ACT AGT GGA GCC ATC CAA TCT GTG GAC TAT GAC GAT GAC CTA 2218Leu Asn Thr Ser Gly Ala Ile Gln Ser Val Asp Tyr Asp Asp Asp Leu710 715 720AGC TCA GTC GAG ATT GGT GTC AAA GGG TGT GGT GAG ATG CGA GTA TTT 2266Ser Ser Val Glu Ile Gly Val Lys Gly Cys Gly Glu Met Arg Val Phe725 730 735GCA TCG AAA AAA CCA AGG GCT TGT CGT ATT GAT GGG GAG GAT GTT GGG 2314Ala Ser Lys Lys Pro Arg Ala Cys Arg Ile Asp Gly Glu Asp Val Gly740 745 750TTC AAG TAT GAT CAG GAC CAA ATG GTG GTG GTT CAA GTG CCA TGG CCA 2362Phe Lys Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp Pro755 760 765ATT GAT TCT TCA TCG GGT GGC ATT TCG GTT ATC GAG TAC TTG TTT 2407Ile Asp Ser Ser Ser Gly Gly Ile Ser Val Ile Glu Tyr Leu Phe770 775 780TAATTTTTAT TTATGTARAG CTCAATGATT GTTGTTGTTG TCGCTGTTGT TGCTATCAAT 2467GTATTTCTCT CCAAAAGAAA ATTATGTGTA ATTTGGAGAG TAATTAAGTG AGTKAAATTT 2527TAAATAARAC TACTTTTAAT TATTTATCAA AAAAAAAAAA AA 2569(2)与序列5相关的情报(i)序列的性质(A)长度784(B)种类核酸(D)拓扑学直链(ii)序列的种类蛋白质(xi)序列序列编号5Met Ala Pro Ser Phe Lys Asn Gly Gly Ser Asn Val Val Ser Phe Asp1 5 10 15Gly Leu Asn Asp Met Ser Ser Pro Phe Ala Ile Asp Gly Ser Asp Phe20 25 30Thr Val Asn Gly His Ser Phe Leu Ser Asp Val Pro Glu Asn Ile Val35 40 45Ala Ser Pro Ser Pro Tyr Thr Ser Ile Asp Lys Ser Pro Val Ser Val50 55 60Gly Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp Ser Arg His Val65 70 75 80Val Ser Ile Gly Lys Leu Lys Asp Ile Arg Phe Met Ser Ile Phe Arg85 90 95Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Arg Asn Gly Gly Asp100 105 110Leu Glu Ser Glu Thr Gln Ile Val Ile Leu Glu Lys Ser Asp Ser Gly115 120 125Arg Pro Tyr Val Phe Leu Leu Pro Ile Val Glu Gly Pro Phe Arg Thr130 135 140Ser Ile Gln Pro Gly Asp Asp Asp Phe Val Asp Val Cys Val Glu Ser145 150 155 160Gly Ser Ser Lys Val Val Asp Ala Ser Phe Arg Ser Met Leu Tyr Leu165 170 175His Ala Gly Asp Asp Pro Phe Ala Leu Val Lys Glu Ala Met Lys Ile180 185 190Val Arg Thr His Leu Gly Thr Phe Arg Leu Leu Glu Glu Lys Thr Pro195 200 205Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr210 215 220Leu Thr Val His Pro Gln Gly Val Ile Glu Gly Val Arg His Leu Val225 230 235 240Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp Asp Gly Trp Gln245 250 255Ser Ile Gly His Asp Ser Asp Pro Ile Thr Lys Glu Gly Met Asn Gln260 265 270Thr Val Ala Gly Glu Gln Met Pro Cys Arg Leu Leu Lys Phe Gln Glu275 280 285Asn Tyr Lys Phe Arg Asp Tyr Val Asn Pro Lys Ala Thr Gly Pro Arg290 295 300Ala Gly Gln Lys Gly Met Lys Ala Phe Ile Asp Glu Leu Lys Gly Glu305 310 315 320Phe Lys Thr Val Glu His Val Tyr Val Trp His Ala Leu Cys Gly Tyr325 330 335Trp Gly Gly Leu Arg Pro Gln Val Pro Gly Leu Pro Glu Ala Arg Val340 345 350Ile Gln Pro Val Leu Ser Pro Gly Leu Gln Met Thr Met Glu Asp Leu355 360 365Ala Val Asp Lys Ile Val Leu His Lys Val Gly Leu Val Pro Pro Glu370 375 380Lys Ala Glu Glu Met Tyr Glu Gly Leu His Ala His Leu Glu Lys Val385 390 395 400Gly Ile Asp Gly Val Lys Ile Asp Val Ile His Leu Leu Glu Met Leu405 410 415Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala Tyr Tyr Lys420 425 430Ala Met Thr Lys Ser Ile Asn Lys His Phe Lys Gly Asn Gly Val Ile435 440 445Ala Ser Met Glu His Cys Asn Asp Phe Met Phe Leu Gly Thr Glu Ala450 455 460Ile Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro Ser465 470 475 480Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His Met Val His485 490 495Cys Ala Asn Asp Ser Leu Trp Met Gly Asn Phe Ile His Pro Asp Trp500 505 510Asp Met Phe Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser515 520 525Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Lys530 535 540His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Ile545 550 555 560Leu Arg Ser Glu Tyr Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu565 570 575Asp Pro Leu His Asn Gly Glu Thr Met Leu Lys Ile Trp Asn Leu Asn580 585 590Lys Phe Thr Gly Val Ile Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp595 600 605Cys Arg Glu Thr Arg Arg Asn Gln Cys Phe Ser Gln Tyr Ser Lys Arg610 615 620Val Thr Ser Lys Thr Asn Pro Lys Asp Ile Glu Trp His Ser Gly Glu625 630 635 640Asn Pro Ile Ser Ile Glu Gly Val Lys Thr Phe Ala Leu Tyr Leu Tyr645 650 655Gln Ala Lys Lys Leu Ile Leu Ser Lys Pro Ser Gln Asp Leu Asp Ile660 665 670Ala Leu Asp Pro Phe Glu Phe Glu Leu Ile Thr Val Ser Pro Val Thr675 680 685Lys Leu Ile Gln Thr Ser Leu His Phe Ala Pro Ile Gly Leu Val Asn690 695 700Met Leu Asn Thr Ser Gly Ala Ile Gln Ser Val Asp Tyr Asp Asp Asp705 710 715 720Leu Ser Ser Val Glu Ile Gly Val Lys Gly Cys Gly Glu Met Arg Val725 730 735Phe Ala Ser Lys Lys Pro Arg Ala Cys Arg Ile Asp Gly Glu Asp Val740 745 750Gly Phe Lys Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp755 760 765Pro Ile Asp Ser Ser Ser Gly Gly Ile Ser Val Ile Glu Tyr Leu Phe770 775 780(2)与序列6相关的情报(i)序列的性质(A)长度23(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号6TTYTAYCTBA CHGTNCAYCC TCA 23(2)与序列7相关的情报(i)序列的性质(A)长度23(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号7TTYTAYCTBA CHGTNCAYCC CCA 23(2)与序列8相关的情报(i)序列的性质(A)长度23(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号8TTYTAYCTBA CHGTNCAYCC ACA23(2)与序列9相关的情报(i)序列的性质(A)长度23(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其他核酸(A)说明合成DNA(xi)序列序列编号9TTYTAYCTBA CHGTNCAYCC GCA23(2)与序列10相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及11号的核苷酸N为肌醇,其它的N代表A、G、C或T。(xi)序列序列编号10GARGGNGTNM GNCAYCTRGT NGAYGG 26(2)与序列11相关的情报(i)序列的性质
(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及11号的核苷酸N为肌醇,其它的N代表A、G、C或T。(xi)序列序列编号11GARGGNGTNM GNCAYCTYGT NGAYGG 26(2)与序列12相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及11号的核苷酸N为肌醇,其它的N代表A、G、C或T。(xi)序列序列编号12GARGGNGTNM GNCAYTTRGT NGAYGG 26(2)与序列13相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)他の情报3号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号13GTNGGNTGYT TYGTNGGYTT YGAYGC 26(2)与序列14相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类肽(v)片段类型其它核酸(A)说明合成DNA(ix)序列特征(D)他の情报3号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号14GTNGGNTGYT TYGTNGGRTT YGAYGC 26(2)与序列15相关的情报(i)序列的性质(A)长度29(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征
(D)其他情报9号及11号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号15TTYGAYGCNT CNGARCCHGA YTCDCGNCA 29(2)与序列16相关的情报(i)序列的性质(A)长度30(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报9号及11号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号16TTYGAYGCNT CNGARCCHGA YTCDAGYCAY 30(2)与序列17相关的情报(i)序列的性质(A)长度20(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号17GAYCARGAYC TRATGGTNGT20(2)与序列18相关的情报(i)序列的性质
(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及15号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号18CCRTCNACYA GRTGNCKNAC NCCYTC 26(2)与序列19相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及15号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号19CCRTCNACRA GRTGNCKNAC NCCYTC 26(2)与序列20相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报6号及15号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号20CCRTCNACYA TRTGNCKNAC NCCYTC 26(2)与序列21相关的情报(i)序列的性质(A)长度29(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报3号及18号的核苷酸N为肌醇,其它的N为A、G、C或T。(xi)序列序列编号21TGNCGHGART CDGGYTCNGA NGCRTCRAA 29(2)与序列22相关的情报(i)序列的性质(A)长度30(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(ix)序列特征(D)其他情报19号的核苷酸N为肌醇,其它的N
为A、G、C或T。(xi)序列序列编号22RTGRCTHGAR TCDGGYTCNG ANGCRTCRAA 30(2)与序列23相关的情报(i)序列的性质(A)长度2780(B)种类核酸(C)链数双链(D)拓扑学直链(ii)序列的种类cDNA到mRNA(vi)起源(A)生物名大豆(Glycine max cv.Clark63)(ix)序列特征(A)表示特征的符号CDS(B)存在位置156..2405(xi)序列序列编号23TCTTCCATTG GAGGACCATT TCCTCCTGGA ATAGAAATAC TACCACACTT TTCTTTTTTC60ACTTCTCTAA GTTGCTAAGT TAATTGCTCC TTCATTTTTT CACTCTTCGT TCTCGCGTAC 120CCGTGTCACG GTAACTCGTG GTGAAGTGTT CGAAA ATG ACT GTC ACA CCT AAG 173Met Thr Val Thr Pro Lys1 5ATC TCA GTT AAC GAT GGG AAA CTT GTT GTC CAT GGT AAG ACC ATT CTG 221Ile Ser Val Asn Asp Gly Lys Leu Val Val His Gly Lys Thr Ile Leu10 15 20ACT GGA GTG CCA GAC AAC GTT GTG CTG ACT CCA GGT TCT GGA AGG GGT 269Thr Gly Val Pro Asp Asn Val Val Leu Thr Pro Gly Ser Gly Arg Gly25 30 35CTT GTG ACT GGT GCT TTT GTT GGT GCC ACA GCT TCA CAC AGC AAA AGT 317Leu Val Thr Gly Ala Phe Val Gly Ala Thr Ala Ser His Ser Lys Ser40 45 50CTC CAT GTG TTT CCA ATG GGT GTT TTA GAG GGG CTC CGG TTC ATG TGT 365Leu His Val Phe Pro Met Gly Val Leu Glu Gly Leu Arg Phe Met Cys55 60 65 70TGT TTC CGG TTC AAG TTA TGG TGG ATG ACT CAG AGA ATG GGA ACT TGT 413Cys Phe Arg Phe Lys Leu Trp Trp Met Thr Gln Arg Met Gly Thr Cys75 80 85GGG AGG GAT GTT CCT CTG GAG ACT CAA TTC ATG CTT ATT GAG AGC AAA 461Gly Arg Asp Val Pro Leu Glu Thr Gln Phe Met Leu Ile Glu Ser Lys90 95 100GAG AGT GAA ACT GAT GGG GAG AAT TCT CCA ATC ATC TAC ACT GTC TTG 509Glu Ser Glu Thr Asp Gly Glu Asn Ser Pro Ile Ile Tyr Thr Val Leu105 110 115CTT CCT CTC CTC GAA GGT CAA TTC CGA GCT GTT CTT CAA GGC AAT GAC 557Leu Pro Leu Leu Glu Gly Gln Phe Arg Ala Val Leu Gln Gly Asn Asp120 125 130AAG AAC GAG ATA GAG ATT TGC CTC GAG AGT GGG GAT AAT GCA GTT GAG 605Lys Asn Glu Ile Glu Ile Cys Leu Glu Ser Gly Asp Asn Ala Val Glu135 140 145 150ACT GAC CAA GGC CTT CAC ATG GTT TAC ATG CAT GCT GGG ACC AAT CCC 653Thr Asp Gln Gly Leu His Met Val Tyr Met His Ala Gly Thr Asn Pro155 160 165TTT GAA GTC ATC AAT CAA GCT GTC AAG GCT GTG GAA AAA CAC ATG CAA 701Phe Glu Val Ile Asn Gln Ala Val Lys Ala Val Glu Lys His Met Gln170 175 180ACT TTT CTT CAT CGT GAG AAG AAA AGG TTG CCA TCT TGT CTT GAC TGG 749Thr Phe Leu His Arg Glu Lys Lys Arg Leu Pro Ser Cys Leu Asp Trp185 190 195TTT GGA TGG TGC ACA TGG GAT GCT TTC TAT ACT GAT GTC ACA GCT GAG 797Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Thr Asp Val Thr Ala Glu200 205 210GGT GTT GAG GAA GGC CTG AAA AGT CTA TCA CAG GGA GGT ACA CCT CCA 845Gly Val Glu Glu Gly Leu Lys Ser Leu Ser Gln Gly Gly Thr Pro Pro215 220 225 230CGA TTC CTC ATC ATA GAT GAT GGT TGG CAA CAG ATT GAA AAT AAA GCA 893Arg Phe Leu Ile Ile Asp Asp Gly Trp Gln Gln Ile Glu Asn Lys Ala235 240 245AAG GAT GCT ACT GAA TGT TTG GTA CAA GAA GGA GCA CAG TTT GCT ACT 941Lys Asp Ala Thr Glu Cys Leu Val Gln Glu Gly Ala Gln Phe Ala Thr250 255 260AGG TTG ACT GGT ATT AAA GAG AAT ACT AAA TTT CAA AAG AAA TTA CAG 989Arg Leu Thr Gly Ile Lys Glu Asn Thr Lys Phe Gln Lys Lys Leu Gln265 270 275AAC AAT GAG CAG ATG TCA GGT CTG AAG CAT CTA CTA CAT GGA GCA AAG 1037Asn Asn Glu Gln Met Ser Gly Leu Lys His Leu Val His Gly Ala Lys280 285 290CAG CAT CAC AAT GTG AAA AAT GTA TAT GTA TGG CAT GCA CTA GCT GGT 1085Gln His His Asn Val Lys Asn Val Tyr Val Trp His Ala Leu Ala Gly295300 305 310TAT TGG GGT GGA GTG AAG CCA GCA GCA ACC GGC ATG GAA CAT TAT GAC 1133Tyr Trp Gly Gly Val Lys Pro Ala Ala Thr Gly Met Glu His Tyr Asp315 320 325ACT GCC TTG GCA TAT CCA GTG CAG TCA CCA GGC GTG CTA GGA AAC CAA 1181Thr Ala Leu Ala Tyr Pro Val Gln Ser Pro Gly Val Leu Gly Asn Gln330 335 340CCA GAC ATT GTC ATG GAC AGC TTG GCT GTA CAT GGC CTT GGC CTA GTG 1229Pro Asp Ile Val Met Asp Ser Leu Ala Val His Gly Leu Gly Leu Val345 350 355CAC CCA AAG AAG GTT TTC AAT TTC TAC AAC GAG CTC CAT GCT TAC TTA 1277His Pro Lys Lys Val Phe Asn Phe Tyr Asn Glu Leu His Ala Tyr Leu360 365 370GCT TCT TGT GGA GTA GAT GGA GTG AAG GTT GAT GTG CAG AAC ATT ATT 1325Ala Ser Cys Gly Val Asp Gly Val Lys Val Asp Val Gln Asn Ile Ile375 380 385 390GAG ACC CTT GGT GCG GGA CAT GGT GGC CGA GTG TCA CTT ACT CGC AGC 1373Glu Thr Leu Gly Ala Gly His Gly Gly Arg Val Ser Leu Thr Arg Ser395 400 405TAT CAT CAC GCG CTT GAG GCT TCC ATT GCT AGC AAT TTT ACT GAT AAC 1421Tyr His His Ala Leu Glu Ala Ser Ile Ala Ser Asn Phe Thr Asp Asn410 415 420GGA TGC ATT GCG TGT ATG TGT CAC AAC ACT GAT GGA CTT TAT AGT GCT 1469Gly Cys Ile Ala Cys Met Cys His Asn Thr Asp Gly Leu Tyr Ser Ala425 430 435AAG CAG ACT GCT ATT GTG AGA GCT TCT GAT GAT TTT TAC CCT CGT GAT 1517Lys Gln Thr Ala Ile Val Arg Ala Ser Asp Asp Phe Tyr Pro Arg Asp440 445 450CCT GCT TCC CAT ACC ATC CAT ATT TCT TCT GTT GCA TAC AAC TCA CTA 1565Pro Ala Ser His Thr Ile His Ile Ser Ser Val Ala Tyr Asn Ser Leu455 460 465 470TTC CTT GGA GAA TTC ATG CAA CCT GAC TGG GAC ATG TTT CAT AGT TTA 1613Phe Leu Gly Glu Phe Met Gln Pro Asp Trp Asp Met Phe His Ser Leu475 480 485CAC CCA GCA GCA GAT TAT CAT GCT GCA GCT CGT GCA ATT GGT GGA TGT1661His Pro Ala Ala Asp Tyr His Ala Ala Ala Arg Ala Ile Gly Gly Cys490 495 500CCT ATT TAT GTT AGT GAC AAG CCA GGC AAT CAC AAT TTT GAT CTT CTT1709Pro Ile Tyr Val Ser Asp Lys Pro Gly Asn His Asn Phe Asp Leu Leu505 510 515AAG AAG CTG GTT CTC CCG GAT GGT TCG GTT CTC CGT GCT CAG TTA CCT1757Lys Lys Leu Val Leu Pro Asp Gly Ser Val Leu Arg Ala Gln Leu Pro520 525 530GGC AGG CCA ACT CGT GAT TCT CTA TTT GTG GAT CCA GCC AGA GAT AGG1805Gly Arg Pro Thr Arg Asp Ser Leu Phe Val Asp Pro Ala Arg Asp Arg535 540 545 550ACT AGC TTG CTC AAA ATA TGG AAC CTG AAC AAA TGC TCT GGA GTT GTT1853Thr Ser Leu Leu Lys Ile Trp Asn Leu Asn Lys Cys Ser Gly Val Val555 560 565GGT GTA TTT AAC TGC CAA GGT GCT GGA TGG TGC AAG ATA GAG AAG AAA1901Gly Val Phe Asn Cys Gln Gly Ala Gly Trp Cys Lys Ile Glu Lys Lys570 575 580ACC CGC ATC CAT GAT ACA TCT CCT GGT ACA CTC ACC GCC TCT GTC TGC1949Thr Arg Ile His Asp Thr Ser Pro Gly Thr Leu Thr Ala Ser Val Cys585 590 595GCC TCT GAT GTT GAC CTC ATC ACA CAA GTA GCA GGT GCT GAA TGG CTT1997Ala Ser Asp Val Asp Leu Ile Thr Gln Val Ala Gly Ala Glu Trp Leu600 605 610GGA GAT ACA ATT GTT TAT GCT TAC AGA TCA GGT GAG GTG ATT CGG CTA2045Gly Asp Thr Ile Val Tyr Ala Tyr Arg Ser Gly Glu Val Ile Arg Leu615 620 625 630CCA AAA GGG GTT TCA ATT CCA GTG ACA CTA AAA GTT CTG GAG TTT GAG2093Pro Lys Gly Val Ser Ile Pro Val Thr Leu Lys Val Leu Glu Phe Glu635 640 645CTT TTC CAC TTC TGT CCA ATC CAA GAA ATA GCT CCA AGT ATA TCA TTT2141Leu Phe His Phe Cys Pro Ile Gln Glu Ile Ala Pro Ser Ile Ser Phe650 655 660GCA GCA ATA GGG CTA CTG GAT ATG TTC AAC ACT GGA GGA GCA GTG GAG2189Ala Ala Ile Gly Leu Leu Asp Met Phe Asn Thr Gly Gly Ala Val Glu665 670 675CAG GTT GAG ATT CAT AAC CGA GCA GCA ACG AAA ACA ATA GCT CTT AGT2237Gln Val Glu Ile His Asn Arg Ala Ala Thr Lys Thr Ile Ala Leu Ser680 685 690GTA AGG GGA AGA GGC AGA TTT GGA GTT TAC TCC TCC CAG AGA CCA CTG2285Val Arg Gly Arg Gly Arg Phe Gly Val Tyr Ser Ser Gln Arg Pro Leu695 700 705 710AAG TGT GTG GTA GGT GGC GCT GAA ACC GAC TTC AAC TAT GAC TCA GAG2333Lys Cys Val Val Gly Gly Ala Glu Thr Asp Phe Asn Tyr Asp Ser Glu715 720 725ACC GGG TTG ACA ACC TTC TCC ATT CCA GTT TCT CCA GAG GAG ATG TAC2381Thr Gly Leu Thr Thr Phe Ser Ile Pro Val Ser Pro Glu Glu Met Tyr730 735 740AGA TGG TCA ATA GAG ATC CAA GTT TGAGTCCTTT TTAAGACTTG GTGTTTGATG 2435Arg Trp Ser Ile Glu Ile Gln Val745 750CATTGTTGTA TCAGGAGAAG GGTTTTGTTG TAATTAAGCA TTGAGGGAAT TGTTGGAGTC 2495AGGCAGAGAG AGAGGGGGGA GGTTTGTTGT AAGACACCTA GTATTAGTAT CATGTAGTGG 2555AGAAAAAGGG TTGTTGATCC TAATAGCTAG ACAAGGCATG TTGTAGTAGT CATGGGGTGG 2615GGAAGTCCTT TTGTTGTAGC ATGTAATTTG GTTTAGACTT GTAGTATGTC ATCAATTAGA 2675TGGATAAAGA GAGAATATTG TTATCTACCC GAGGATGTAA CAATGTTTGT TTCTCTGAAT 2735AAAAAGTTCA CATCTGTCTT TTGGAATAAT AAAAAAAAAA AAAAA 2780(2)与序列24相关的情报(i)序列的性质(A)长度750(B)种类氨基酸(D)拓扑学直链(ii)序列的种类蛋白质(xi)序列序列编号24Met Thr Val Thr Pro Lys Ile Ser Val Asn Asp Gly Lys Leu Val Val1 5 10 15His Gly Lys Thr Ile Leu Thr Gly Val Pro Asp Asn Val Val Leu Thr20 25 30Pro Gly Ser Gly Arg Gly Leu Val Thr Gly Ala Phe Val Gly Ala Thr35 40 45Ala Ser His Ser Lys Ser Leu His Val Phe Pro Met Gly Val Leu Glu50 55 60Gly Leu Arg Phe Met Cys Cys Phe Arg Phe Lys Leu Trp Trp Met Thr65 70 75 80Gln Arg Met Gly Thr Cys Gly Arg Asp Val Pro Leu Glu Thr Gln Phe85 90 95Met Leu Ile Glu Ser Lys Glu Ser Glu Thr Asp Gly Glu Asn Ser Pro100 105 110Ile Ile Tyr Thr Val Leu Leu Pro Leu Leu Glu Gly Gln Phe Arg Ala115 120 125Val Leu Gln Gly Asn Asp Lys Asn Glu Ile Glu Ile Cys Leu Glu Ser130 135 140Gly Asp Asn Ala Val Glu Thr Asp Gln Gly Leu His Met Val Tyr Met145 150 155 160His Ala Gly Thr Asn Pro Phe Glu Val Ile Asn Gln Ala Val Lys Ala165 170 175Val Glu Lys His Met Gln Thr Phe Leu His Arg Glu Lys Lys Arg Leu180 185 190Pro Ser Cys Leu Asp Trp Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr195 200 205Thr Asp Val Thr Ala Glu Gly Val Glu Glu Gly Leu Lys Ser Leu Ser210 215 220Gln Gly Gly Thr Pro Pro Arg Phe Leu Ile Ile Asp Asp Gly Trp Gln225 230 235 240Gln Ile Glu Asn Lys Ala Lys Asp Ala Thr Glu Cys Leu Val Gln Glu245 250 255Gly Ala Gln Phe Ala Thr Arg Leu Thr Gly Ile Lys Glu Asn Thr Lys260 265 270Phe Gln Lys Lys Leu Gln Asn Asn Glu Gln Met Ser Gly Leu Lys His275 280 285Leu Val His Gly Ala Lys Gln His His Asn Val Lys Asn Val Tyr Val290 295 300Trp His Ala Leu Ala Gly Tyr Trp Gly Gly Val Lys Pro Ala Ala Thr305 310 315 320Gly Met Glu His Tyr Asp Thr Ala Leu Ala Tyr Pro Val Gln Ser Pro325 330 335Gly Val Leu Gly Asn Gln Pro Asp Ile Val Met Asp Ser Leu Ala Val340 345 350His Gly Leu Gly Leu Val His Pro Lys Lys Val Phe Asn Phe Tyr Asn355 360 365Glu Leu His Ala Tyr Leu Ala Ser Cys Gly Val Asp Gly Val Lys Val370 375 380Asp Val Gln Asn Ile Ile Glu Thr Leu Gly Ala Gly His Gly Gly Arg385 390 395 400Val Ser Leu Thr Arg Ser Tyr His His Ala Leu Glu Ala Ser Ile Ala405 410 415Ser Asn Phe Thr Asp Asn Gly Cys Ile Ala Cys Met Cys His Asn Thr420 425 430Asp Gly Leu Tyr Ser Ala Lys Gln Thr Ala Ile Val Arg Ala Ser Asp435 440 445Asp Phe Tyr Pro Arg Asp Pro Ala Ser His Thr Ile His Ile Ser Ser450 455 460Val Ala Tyr Asn Ser Leu Phe Leu Gly Glu Phe Met Gln Pro Asp Trp465 470 475 480Asp Met Phe His Ser Leu His Pro Ala Ala Asp Tyr His Ala Ala Ala485 490 495Arg Ala Ile Gly Gly Cys Pro Ile Tyr Val Ser Asp Lys Pro Gly Asn500 505 510His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Val515 520 525Leu Arg Ala Gln Leu Pro Gly Arg Pro Thr Arg Asp Ser Leu Phe Val530 535 540Asp Pro Ala Arg Asp Arg Thr Ser Leu Leu Lys Ile Trp Asn Leu Asn545 550 555 560Lys Cys Ser Gly Val Val Gly Val Phe Asn Cys Gln Gly Ala Gly Trp565 570 575Cys Lys Ile Glu Lys Lys Thr Arg Ile His Asp Thr Ser Pro Gly Thr580 585 590Leu Thr Ala Ser Val Cys Ala Ser Asp Val Asp Leu Ile Thr Gln Val595 600 605Ala Gly Ala Glu Trp Leu Gly Asp Thr Ile Val Tyr Ala Tyr Arg Ser610 615 620Gly Glu Val Ile Arg Leu Pro Lys Gly Val Ser Ile Pro Val Thr Leu625 630 635 640Lys Val Leu Glu Phe Glu Leu Phe His Phe Cys Pro Ile Gln Glu Ile645 650 655Ala Pro Ser Ile Ser Phe Ala Ala Ile Gly Leu Leu Asp Met Phe Asn660 665 670Thr Gly Gly Ala Val Glu Gln Val Glu Ile His Asn Arg Ala Ala Thr675 680 685Lys Thr Ile Ala Leu Ser Val Arg Gly Arg Gly Arg Phe Gly Val Tyr690 695 700Ser Ser Gln Arg Pro Leu Lys Cys Val Val Gly Gly Ala Glu Thr Asp705 710 715 720Phe Asn Tyr Asp Ser Glu Thr Gly Leu Thr Thr Phe Ser Ile Pro Val725 730 735Ser Pro Glu Glu Met Tyr Arg Trp Ser Ile Glu Ile Gln Val740 745 750(2)与序列25相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号25ATSCAVCCTG ACTGGGATAT GTTCCA 26(2)与序列26相关的情报(i)序列的性质(A)长度26(B)种类核酸(C)链数单链(D)拓扑学直链(ii)序列的种类其它核酸(A)说明合成DNA(xi)序列序列编号26CGAAGGAYYG AWCCATCAGG AARHAM 26(2)与序列27相关的情报(i)序列的性质
(A)长度253(B)种类核酸(C)链数双链(D)拓扑学直链(ii)序列的种类cDNA到mRNA(vi)起源(A)生物名拟南芥(Arabidopsis thaliana)(xi)序列序列编号27GGCTTATGCA ACCTGACTGG GAATGTTCCA TAGTCTACAC CCAACTGCAG AGTACCATGC 60TGCAGCGCGT GCAGTGGGTG GATGCGCAAT CTATGTCAGT GATAAGCCAG GCAACCACAA 120CTTTGATCTA TTGAGGAAGC TGGTTCTTCC TGATGGTTCA GTTCTTCGGG CTAAGCTCCC 180GGGTAGGCCT ACCCGTGACT GCTTATTCGC TGATCCAGCT AGAGATGGGA TCAGCTTGCT 240CAAGATCTGG AAC 253(2)与序列28相关的情报(i)序列的性质(A)长度10(B)种类氨基酸(D)拓扑学直链(ii)序列的种类肽(xi)序列序列编号28Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr1 5 10(2)与序列29相关的情报(i)序列的性质(A)长度13(B)种类氨基酸(D)拓扑学直链(ii)序列的种类肽(ix)序列特征(D)他の情报8号的氨基酸Xaa代表Ala或Cys。(xi)序列序列编号29Val Tyr Val Trp His Ala Leu Xaa Gly Tyr Trp Gly Glyl 5 10(2)与序列30相关的情报(i)序列的性质(A)长度15(B)种类氨基酸(D)拓扑学直链(ii)序列的种类肽(xi)序列序列编号30His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser1 5 10 1权利要求
1.一种棉子糖合成酶,它具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
2.一种棉子糖合成酶,它是如下面(A)、(B)、(C)或(D)所示的蛋白质(A)一种蛋白质,它具有序列表序列号5记载的氨基酸序列;(B)一种蛋白质,它包含序列表序列号5记载的氨基酸序列中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性;(C)一种蛋白质,它具有序列表序列号24记载的氨基酸序列;(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序列,且具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
3.权利要求1的棉子糖合成酶,它具有下述性质(1)作用及底物特异性由蔗糖和肌醇半乳糖苷生成棉子糖;(2)最适pH约6~8;(3)最适温度约35~40℃;(4)分子量①用凝胶过滤色谱法测定的分子量大约75kDa~95kDa②用聚丙烯酰胺凝胶电泳测定的分子量大约为90kDa~100kDa;③由还原条件下进行的SDS-聚丙烯酰胺凝胶电泳测定的分子量约为90kDa~100kDa;(5)抑制能被碘乙酰胺、N-乙基马来酰亚胺、肌醇所抑制。
4.权利要求1的棉子糖合成酶,它的氨基酸序列中含有序列表序列号28~30所示的各氨基酸序列。
5.一种棉子糖合成酶,它为下面(C)或(D)中所示的蛋白质(C)一种蛋白质,它具有序列表的序列号24记载的氨基酸序列;(D)一种蛋白质,它的氨基酸序列包含序列表的序列号24记载的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
6.一种棉子糖的制造方法,其特征在于将权利要求1-5任一权项中的棉子糖合成酶作用于蔗糖和肌醇半乳糖苷以生成棉子糖。
7.一种DNA,它编码权利要求1~5任一权项的棉子糖合成酶。
8.一种DNA,它编码下面(A)、(B)、(C)或(D)中所示的蛋白质(A)一种蛋白质,它具有序列表中序列号5记载的氨基酸序列;(B)一种蛋白质,它的氨基酸序列包含序列表的序列号5中记载的氨基酸序列有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的序列,并且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性;(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序列;(D)一种蛋白质,它的氨基酸序列包含序列表的序列号24记载的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
9.一种DNA,它编码下面(C)或(D)中所示的蛋白质(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序列;(D)一种蛋白质,它的氨基酸序列包含序列表序列号24记载的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
10.权利要求8的DNA,它是下面(a)、(b)、(c)或(d)中所示的DNA(a)一种DNA,它至少含有序列表序列号4记载的核苷酸序列中的56~2407号核苷酸序列;(b)一种DNA,在严格条件下它能与至少包含序列表序列号4记载的核苷酸序列中56~2407号核苷酸的核苷酸序列进行杂交,并且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性;(c)一种DNA,它至少包含序列表序列号23记载的核苷酸序列中的156~2405号核苷酸序列;(d)一种DNA,在严格条件下它能与至少包含序列表序列号23记载的核苷酸序列中156~2405号核苷酸的核苷酸序列进行杂交,并且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
11.权利要求9的DNA,它是下面(c)或(d)中所示的DNA(c)一种DNA,它至少含有序列表序列号23记载的核苷酸序列中的156~2405号核苷酸序列;(d)一种DNA,在严格条件下,它能与至少包含序列表序列号23记载的核苷酸序列中156~2405号核苷酸的核苷酸序列进行杂交,并且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
12.如下面(e)或(f)所示的DNA(e)一种DNA,在严格条件下,它能与至少包含序列表序列号4记载的核苷酸序列中的56~2407号核苷酸的核苷酸序列或其互补核苷酸序列进行杂交;(f)一种DNA,在严格条件下,它能与至少包含序列表序列号23记载的核苷酸序列中的156~2405号核苷酸的核苷酸序列或其互补核苷酸序列进行杂交。
13.一种嵌合基因,它包含棉子糖合成酶基因或其一部分,以及能在植物细胞中表达的转录调控区域。
14.权利要求12的嵌合基因,其中的棉子糖合成酶基因是权利要求7~11任一权项中的DNA。
15.权利要求13或14的嵌合基因,其中转录调控区域与前述的DNA相连接,以表达含有前述DNA编码链互补序列的反义RNA。
16.用权利要求13-15任一权项的嵌合基因转化的植物。
17.一种改变前述植物棉子糖家族寡糖含量的方法,它是通过用权利要求13~15任一权项的嵌合基因转化植物,在植物细胞中表达该基因而实现的。
全文摘要
通过具有下列性质的棉子糖合成酶作用于蔗糖和肌醇半乳糖苷来生成棉子糖。(1)作用及底物特异性:由蔗糖和肌醇半乳糖苷生成棉子糖。(2)最适pH:约6~8(3)最适温度:约35~40℃(4)分子量:①通过凝胶过滤色谱测定的分子量:约75kDa~95kDa②用聚丙烯酰胺凝胶电泳(非变性PAGE)测定的分子量:大约90kDa~100kDa③还原条件下SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)所测定的分子量为:大约90kDa~100kDa(5)抑制:它能被碘乙酰胺、N-乙基马来酰亚胺、肌醇抑制。
文档编号C12N15/54GK1259996SQ97182260
公开日2000年7月12日 申请日期1997年10月24日 优先权日1997年4月28日
发明者大住千荣子, 野崎甚司, 木田隆夫 申请人:味之素株式会社 被以下专利引用 (1),