具有改变的油、蛋白或纤维含量的植物的生产的制作方法

文档序号:387251阅读:468来源:国知局

专利名称::具有改变的油、蛋白或纤维含量的植物的生产的制作方法
技术领域
:本公开涉及具有改变的油、蛋白和/或纤维含量的经修饰的植物,以及制造具有改变的油、蛋白和/或纤维含量的经修饰的植物的方法和从这样的植物生产油的方法。
背景技术
:操纵作物种子的成分、特别是种子油和蛋白的含量和组成、以及家畜的种子粗粉中的可用的可代谢能量("AME")的能力,在农业工业中具有重要的应用,涉及加工的食物油和动物饲料。农业作物的种子含有多种有价值的成分,包括油、蛋白和淀粉。工业加工可以分离某些或所有这些成分,单独销售用于特定的应用。例如,美国大豆作物的接近60%被大豆加工工业碾碎。大豆加工产生以高价值销售的纯化的油,同时剩余的种子粗粉作为家畜饲料销售(U.S.SoybeanBoard,2001SoyStats(美国大豆委员会,2001年大豆状况))。低芥子酸油菜(canola)籽也被碾碎以生产油和副产品低芥子酸油菜籽粗粉(CanolaCouncilofCanada(加拿大低芥子酸油菜籽理事会))。低芥子酸油菜籽粗粉含有高百分率的蛋白并具有良好的氨基酸配比,但是因为它含有高纤维和肌醇六磷酸盐含量,不容易被家畜消化(Slominski,B.A.等,1999Proceedingsofthe10thInternationalRapeseedCongress,Canberra,Australia),比大豆粗粉的价值要低。在美国生产的玉米,55%以上被用作动物饲料(爱荷华州玉米种植者协会(IowaCornGrowersAssociation))。玉米的价值与其被家畜消化的能力直接相关。因此,希望能够最大化种子的油含量和粗粉的AME。对于被加工的含油种子例如大豆和低芥子酸油菜籽来说,增加种子的绝对油含量将增加这些谷物的价值,而增加粗粉的AME将增加其价值。对于被加工的玉米来说,油含量的增加或减少都可能是所需的,这取决于其它主要成分将被如何使用。减少油可以通过减少不需要的与油的氧化有关的味道而改进分离到的淀粉的质量。或者,当淀粉被用于乙醇生产时,味道是不重要的,增加油含量可以增加整体价值。在许多饲料谷物例如玉米和小麦中,希望增加种子油含量,因为油比其它的种子成分例如碳水化合物具有更高的能量含量。种子油加工,和大多数谷类加工商业一样,是资本密集型商业,因此,产品的分布从低价值的成分向高价值的油类成分的小的迁移,对于谷类加工者来说可能具有明显的经济学影响。此外,通过调整种子蛋白和纤维的含量和组成而不降低种子的油含量来增加粗粉的AME,可以增加动物饲料的价值。对于油类的生物技术操作,已经显示出提供了组成的改变和油产量的提高。组成的改变包括高油酸大豆和玉米油(美国专利Nos.6,229,033和6,248,939),以及含有月桂酸酯的种子(美国专利No.5,639,790)等。在组成的改变中进行的工作主要集中于加工的油类种子,但是可以容易地扩展到非油类种子作物,包括玉米。尽管对于增加油含量存在着相当大的兴趣,但目前在该领域唯一实施的生物技术是高油玉米(High-OilCorn)(HOC)技术(DuPont,美国专利No.5,704,160)。HOC在被称为顶交(TopCross)的生产系统中使用了通过经典筛选育种开发的高油授粉者以及原种(elite)(雄性不育)杂种雌性。顶交高油系统将在玉米中收获的谷物油含量从大约3.5%提高到大约7%,增加了谷物的能量含量。尽管富有成果,但HOC生产系统具有固有的局限性。首先,这种低百分率的授粉者负责整块田的结实率的系统包含了内在的风险,特别是在干旱年份。其次,现有的HOC田中的油含量还没能达到种子油含量超过9%。最后,高油玉米主要不是生物化学的改变,而是具有增加油含量的间接结果的解剖学突变体(胚尺寸的增加)。因为这些原因,可选的替代性高油策略、特别是源自于生物化学结果改变的高油策略,将是特别有价值的。对种子成分的操作已经鉴定到了几种改进种子粗粉的营养质量、可消化性和AME的成分。在低芥子酸油菜籽和大豆中增加赖氨酸的含量(Falco等,1995肠/rec/mo/ogy13:577-582)增加了这种必需氨基酸的可利用性,并降低了对营养添加剂的需要。具有增加的种子蛋白的大豆变异体与常规变异体相比显示出含有明显更多的可代谢能量(Edwards等,1999,尸缠/^ySc/.79:525-527)。降低玉米种子的肌醇六磷酸盐含量已经显示出增加了动物饲料中氨基酸的生物可利用性(Douglas等,2000,尸冊/^ySc/.79:1586-1591),降低大豆粗粉中的寡糖含量增加了粗粉中的可代谢能量(Parsons等,2000,Powfe^79:1127-1131)。大豆和低芥子酸油菜是加工油和种子粗粉市场最明显的靶作物,因为两种作物都被碾碎搾油,剩余的粗粉作为动物饲料销售。大规模的商业工作(例如美国专利No.5,952,544;PCT申请No.W09411516)证实,拟南芥(^ra6Wo/w^)是这些作物中油类代谢的良好模型。种子油成分的生物化学筛选已经鉴定了拟南芥中许多关键的生物合成酶类的基因,并导致鉴定了农业上重要的基因的直系同源物。例如,使用化学诱变的群体进行的筛选己经鉴定了其种子显示出改变的脂肪酸组成的脂类突变体(Lemieux等,1990,T7z,.柳/.G騰t80:234-240;James和Dooner,1990,77zeor.^c^/.80:241-245)。检测改变的脂肪酸组成的T-DNA诱变筛选(Feldmann等,1989,243:1351-1354)鉴定到了去饱和酶(/^Z)"禾卩A-12去饱和酶(FAD2)基因(美国专利No5952544;Yadav等,1993,P/aW103:467-476;Okuley等,1994,P/a"rCW/6(1):147隱158)。一项集中于油含量而不是油质量的筛选,分析了化学诱导的突变体的皱缩的种子或改变的种子密度,从中推断出种子油含量的改变(Focks和Benning,1998,尸/flW尸/yw'o/.118:91-101)。另一项被设计用于鉴定参与非常长链脂肪酸的生产的酶的筛选,鉴定到了负责降低种子中的三酰基甘油累积的二酰基甘油酰基转移酶(DGAT)的编码基因中的突变(KatavicV等,1995,尸/a"f尸/z,Zo/.108(1):399-409)。进一步显示出,DGATcDNA的种子特异性的过表'达与增加的种子油含量有关(Jako等,2001,P/a"f户/7^s/0/.126(2):861-74)。拟南芥也是用于理解影响粗粉质量的种子成分的积累的模型。例如,拟南芥含有在许多双子叶植物包括低芥子酸油菜和大豆中发现的白蛋白和球蛋白种子贮藏蛋白"hewry1995,尸/fl"ZCW/7:945-956)。用于合成纤维的成分例如纤维素和木质素的生物化学途径,在维管植物中是保守的,影响了这些成分的拟南芥突变体已经被分离出来(综述在Chapel禾nCarpita1998,Cwrre"ZOp/"/o"户/crW1:179-185中)。植物中的激活标签是指通过在植物基因组中插入含有调控序列(例如增强子)的异源核酸构建物而产生随机突变的方法。调控序列可以起到增强一个或多个天然植物基因的转录的作用;因此,激活标签是用于产生获得功能的、一般来说显性的突变体的富有成果的方法(参见例如Hayashi等,1992,Sc/e"ce258:1350-1353;WeigelD等,2000,尸/o;^尸/zj^/o/ogy,122:1003-1013)。插入的构建物提供了用于其错误表达引起了突变表现型的天然植物的快速鉴定的分子标签。激活标签也可以导致缺失功能的表现型。插入可以导致天然植物基因的破坏,在这种情况下表现型一般是隐性的。激活标签已经被用于多种物种中,包括烟草和拟南芥,以鉴定许多不同种类的突变体表现型以及与这些表现型有关的基因(Wilson等,1996,尸/fl^Ce〃8:659-671;Schaffer等,1998,Ce〃93:1219-1229;Fridborg等,1999,P/aWCe〃11:1019-1032;Kardailsky等,1999,286:1962-1965;禾口ChristensenS等,1998,9rt/",erm^,o"a/Cow/erewceowArabidopsisi^earc/z,Univ.ofWisconsin-Madison,6月,24-28,Abstract165)。
发明内容本申请提供了具有改变的表现型的修饰的植物。具有改变的表现型的修饰的植物,可以包括改进的油数量和/或改进的粗粉质量的表现型。修饰的植物中的改变的表现型也可以包括在修饰的植物的任何部分中、例如种子中、改变的油、蛋白和/或纤维含量。在修饰的植物的某些实施方案中,改变的表现型是种子的油含量的增加(高油表现型)。在其它实施方案中,改变的表现型可以是种子中蛋白含量的增加,和/或种子的纤维含量的减少。还提供了从修饰的植物的种子产生的种子粗粉,其中种子具有改变的蛋白含量和/或改变的纤维含量。还提供了从修饰的植物的种子产生的油,其中种子具有改变的油含量。任何这些变化可以导致与对照或野生型植物相比,来自修饰的植物的种子或种子粗粉的AME增加。本文还提供了从具有改变的表现型的修饰的植物的任何部分产生的粗粉、词料或食物。在某些实施方案中,公开的修饰的植物包括具有含有HIO核苷酸序列(或别名HIO基因)的转化载体的转基因植物,该核苷酸序列编码"HIO"多肽或与编码该多肽的序列互补。在特定实施方案中,HIO多肽在转基因植物中的表达,在转基因植物中引起了改变的油含量、改变的蛋白含量和/或改变的纤维含量。在优选实施方案中,转基因植物选自芸苔属(Brassica)的植物包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。还提供了生产油或种子粗粉的方法,包括培育转基因植物,并从该植物回收油和/或种子粗粉。本公开还提供了含有编码HIO多肽的核酸序列的饲料、粗粉、谷物或种子。本公开内容还提供了含有HIO多肽或其直系或旁系同源物的饲料、粗粉、谷物或种子。公开的转基因植物的例子通过下面的方法生产,方法包括将含有编码HIO多肽的HIO核苷酸序列或与编码HIO多肽的序列互补的序列的植物转化载体导入到植物的祖细胞中,以及培育转化的祖细胞以产生转基因植物,HIO多核苷酸序列表达在该转基因植物中,在转基因植物中引起了改变的表现型。在某些特定的、非限制性的实施例中,该方法产生的转基因植物中,HIO多肽的表达在转基因植物中,与对照的、非转基因的或野生型植物相比,导致了高(增加的)油、高(增加的)蛋白和/或低(降低的)纤维的表现型。本文还公开了用于产生具有改变的表现型的植物的其它方法,其中鉴定到了在其HIO核酸序列中具有突变或等位基因的植物,这些突变或等位基因导致与缺少突变或等位基因的植物相比改变了的表现型。突变的植物可以使用一种或多种诱变剂产生,例如化学诱变剂、辐射或紫外线。在方法的某些实施方案中,繁育植物,以产生遗传有等位基因并表现出改变的表现型的后代。在方法的特定实施方案中,方法使用了候选基因/QTL方法或TILLING方法。本文还提供了具有改变的表现型的修饰的植物细胞。在某些实施方案中,修饰的植物细胞包含转化载体,该载体含有编码HIO多肽的HIO核苷酸序列或与编码该多肽的序列互补的序列。在优选实施方案中,转基因植物细胞选自芸苔属(Brassica)的植物包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。在其它实施方案中,植物细胞是种子、花粉、繁殖体或胚细胞。本公开还提供了来自从该祖细胞培育出来的植物的直接后代或间接后代的植物细胞。发明详述术语除非特别指明,在本文中使用的所有技术和科学术语具有与本公开所属
技术领域
的专业人员所理解的相同的含义。对于本
技术领域
的定义和术语,从业人员可以具体参考Sambrook等(Mo/ecw/arC/o"/"g:爿丄a6ora,oo;Mam^l(SecondEdition),《分子克隆实验指南》(第二版),ColdSpringHarborPress,Plainview,N.Y.,1989)禾口AusubelFM等(CwreWiV^oco/W"A/o/ecw/ar5Zo/og少,《分子生物学现代方法》,JohnWiley&Sons,NewYork,N.Y.,1993)。应该理解,本公开不限于所描述的具体的方法、方案和试剂,因为这些是可以改变的。本文使用的术语"改变的表现型"是指植物或植物的任何部分(例如种子,或从种子生产的粗粉)具有改变的油、蛋白和/或纤维含量(表现型)。正如本文提供的,改变的油、蛋白(例如可消化的蛋白)和/或纤维含量,包括植物、种子或种子粗粉中油、蛋白(例如可消化的蛋白)和/或纤维含量的增加的或降低的水平。这些变化的任何组合可以导致改变的表现型。例如,在一个特定的非限制性的例子中,改变的表现型可以指增加的油和降低的纤维含量。在另一个特定的非限制性的例子中,改变的表现型可以指未改变的蛋白和降低的纤维含量。在另一个特定的非限制性的例子中,改变的表现型可以指增加的油和蛋白以及降低的纤维。在其它非限制性的例子中,改变的表现型可以指增加的油和蛋白和未改变的纤维含量,未改变的油、增加的蛋白和降低的纤维含量,或增加的油、增加的蛋白和降低的纤维含量。还提供了可以导致种子或从种子产生的粗粉的AME(可利用的可代谢能量)的增加的任何这些变化的组合。改变的表现型还包括改进的种子质量(ISQ)表现型或改进的种子粗粉质量表现型。本文使用的术语"可利用的可代谢能量"(AME)是指饲料中可以通过在动物中消化而提取出来的、并与动物粗粉中可利用的可消化的蛋白和油的量有关的能量的量。AME通过估算喂食前在饲料中的能量的量,以及测量在消费了词料后动物的排泄物中能量的量来确定。在一个特定的非限制性的例子中,具有增加的AME的修饰的植物,包括具有改变的种子油、可消化蛋白、总蛋白和/或纤维含量,导致从该种子衍生的动物饲料的价值增加的修饰的植物。本文使用的术语"含量"是指例如种子或种子粗粉成分的种类和相对量。本文使用的术语"种子油"是指种子中油的总量。本文使用的术语"种子纤维"是指植物种子的不能消化的成分,包括细胞成分例如纤维素、半纤维素、果胶、木质素和酚醛物质。本文使用的术语"粗粉"是指在从种子提取油之后剩余的种子成分。粗粉的成分的例子包括蛋白和纤维。本文使用的术语"种子总蛋白"是指种子内蛋白的总量。本文使用的术语"种子可消化蛋白"是指能够被动物消化道中的酶消化的种子蛋白。它是总蛋白含量的一部分。本文使用的术语"载体"是指被设计用于在不同宿主细胞之间进行转移的核酸构建物。"表达载体"是指具有将异源DNA片段导入外源细胞并在其中进行表达的能力的载体。许多原核和真核表达载体是可商购的。适合的表达载体的选择在本
技术领域
的专业人员的知识范围内。"异源的"核酸构建物或序列具有对于它在其中表达的植物细胞来说不是本身具有的一部分序列。对于控制序列来说,异源的是指控制序列(即启动子或增强子)本身的功能不是调节它目前正在调节的同样基因的表达。一般来说,异源的核酸序列对于它们出现在其中的细胞或基因组的一部分来说不是内源的,而是通过感染、转染、微注射、电穿孔等方法加入到细胞中的。"异源的"核酸构建物可以含有与在天然植物中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码序列组合。异源的核酸序列的特定的、非限制性的例子包括HIO核酸序列、或其片段、衍生物(变异体)或直系或旁系同源物。本文使用的术语"基因"是指参与生产多肽链的DNA区段,它可以包含也可以不包含编码区域之前或之后的区域,例如5'非翻译(5'UTR)或"前导"序列和3'UTR或"尾部"序列,以及在单个编码区段(外显子)之间的间插序列(内含子)和不转录的调控序列。术语"同源物"是指通过从共同的祖先DNA序列遗传下来而与参比基因相关的任何基因。术语"直系同源物"是指不同物种中通过物种形成而从共同的祖先基因进化而来的同源物。典型情况下,直系同源物保留了同样的或相似的功能,尽管它们的主要结构有区别(突变)。术语"旁系同源物"是指相同物种中通过共同祖先基因的遗传复制进化而来的同源物。在许多情况下,旁系同源物表现出相关的(但不总是相同的)功能。在本文中使用的术语同源物包含了直系同源物和旁系同源物。在某种程度上,当特定的物种从与另外的物种共有的祖先DNA序列进化出多个相关的基因时,术语直系同源物包含了术语旁系同源物。本文使用的"重组体"包括了指称已经通过导入异源核酸序列进行了修饰的细胞或载体,或从这样修饰的细胞衍生的细胞。因此,例如,重组体细胞表达的是与细胞中发现的天然(非重组的)形式具有不同形式的基因,或者表达的是天然基因,而细胞本身的天然基因由于精心设计的人类干预而表达异常、表达过低或完全不表达。本文使用的术语"基因表达"是指基于基因的核酸序列生产多肽的过程。该过程包括转录和翻译;因此,"表达"可以是指多核苷酸或多肽序列,也可以是指两者。有时,多核苷酸序列的表达不导致蛋白的翻译。"过表达"是指多核苷酸和/或多肽序列的表达相对于它在野生型(或其它参比[例如非转基因的])植物中的表达来说增加了,可以涉及天然存在的或非天然存在的序列。"异位表达"是指以在未被修饰的或野生型植物中不天然发生的时间、地点和/或增加的水平进行的表达。"低表达"是指多核苷酸和/或多肽序列、一般为内源基因、相对于它在野生型植物中的表达来说,降低的表达。术语"错误表达"和"改变的表达"包括过表达、低表达和异位表达。在将核酸序列插入到细胞中的上下文中,术语"导入"包含了"转染"、"转化"和"转导",并包括指称将核酸序列引入到真核或原核细胞中,在那里核酸序列可以整合到细胞的基因组中(例如染色体、质粒、质体或线粒体DNA),转化成自主复制子,或短暂表达(例如转染的mRNA)。本文中使用的"植物细胞"是指任何源自于植物的细胞,包括来自于未分化的组织(例如愈伤组织)以及来自于植物种子、花粉、繁殖体和胚的细胞。本文使用的术语"天然的"和"野生型"相对于给定的植物性状或表现型来说,是指在自然界中同样种类的植物中发现的性状或表现型的形式。在一个实施方案中,野生型或天然植物也是对照植物。在另一个实施方案中,野生型或天然植物是非转基因的或未突变的植物。在另一个实施方案中,野生型或天然植物是未修饰的植物。本文使用的术语"修饰的"对于植物来说,是指具有改变的表现型的植物(例如通过遗传工程、诱变或育种方法产生的植物)。遗传工程植物也可以是转基因植物。在特定实施方案中,通过育种方法产生的修饰的植物首先使用多种诱变剂,例如化学诱变剂,辐射或紫外线中的任何一种进行诱变。修饰的植物可以在转基因植物的任何部分例如种子中,具有与类似的未修饰的植物相比,改变的油含量、改变的蛋白含量和/或改变的纤维含量的任何组合。本文使用的术语"改变的"是指在修饰的植物中,与类似的未修饰的植物相比,植物的性状或表现型(例如油含量、蛋白含量和/或纤维含量)的改变(增加或降低)。在一个特定的、非限制性的例子中,具有改变的性状的修饰的植物包括相对于类似的未修饰的植物来说,具有增加的油含量、增加的蛋白含量和/或降低的纤维含量的植物。在另一个特定的、非限制性的例子中,具有改变的性状的修饰的植物包括相对于类似的未修饰的植物来说,未改变的油含量、增加的蛋白含量和/或降低的纤维含量。在另一个特定的、非限制性的例子中,具有改变的性状的修饰的植物包括相对于类似的未修饰的植物来说,增加的油含量、增加的蛋白含量和/或未改变的纤维含量。对于修饰的植物来说,"感兴趣的表现型(性状)"是指通过T1和/或后续世代的植物证实的可观察到的或可测量到、没有被相应的未修饰的植物(即在类似条件下培育或分析的基因型相似的植物)所显示出的表现型。感兴趣的表现型可以代表植物中的改进(例如,植物种子中增加的油含量,增加的蛋白含量,禾t!/或降低的纤维含量),或可以提供在其它植物中产生改进的手段。"改进"是通过给植物提供独特的和/或新的表现型或品质,从而可以改进植物物种或品种的用途的特点。这样的修饰的植物可以具有改进的表现型,例如改变的油、蛋白和/或纤维表现型。从具有改进的表现型的修饰的植物的种子产生的粗粉,可以具有改进的(增加的)粗粉质量。在特定的、非限制性的具有改进的(增加的)质量表现型的粗粉的例子中,粗粉从修饰的植物的种子产生,其中种子相对于类似的未修饰的植物来说,具有增加的蛋白含量和/或降低的纤维含量。词组"改变的油含量的表现型"是指修饰的植物的可测量到的表现型,其中植物表现出与类似的但是未修饰的(例如非转基因的或未突变的)植物相比,总的油含量(即种子质量中油所占的百分率)的统计学显著的增加或降低。高油表现型是指总的油含量的增加。在各种不同的实施方案中,油含量的增加包括油含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。同样,油含量的降低在各种不同实施方案中包括油含量降低大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4,0%、4.5%、5.0%、7.5%、10%或以上。词组"改变的蛋白含量的表现型"是指修饰的植物的可测量到的表现型,其中植物表现出与类似的但是未修饰的(例如非转基因的或未突变的)植物相比,总的蛋白含量(即种子质量中蛋白所占的百分率)的统计学显著的增加或降低。高蛋白表现型是指总的蛋白含量的增加。在各种不同的实施方案中,蛋白含量的增加包括总蛋白含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5°/。、10%或以上。同样,在各种不同的实施方案中,可消化的蛋白含量的增加包括可消化的蛋白含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。蛋白含量的降低在各种不同实施方案中包括总蛋白含量降低大约1.0%、1,5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。同样地,可消化的蛋白含量的降低在各种不同实施方案中包括可消化的蛋白含量降低大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。词组"改变的纤维含量的表现型"是指修饰的植物的可测量到的表现型,其中植物表现出与类似的但是未修饰的(例如非转基因的或未突变的)植物相比,总的纤维含量(即种子质量中纤维所占的百分率)的统计学显著的增加或降低。低纤维表现型是指总的纤维含量的降低。纤维含量的增加包括纤维含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。同样,纤维含量的降低包括纤维含量降低大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。本文使用的"突变体"或"突变的"多核苷酸序列或基因与相应的野生型多核苷酸序列或基因在序列或表达上不同,其中的差异造成了改变的植物表现型或性状。相对于植物或植物株系来说,术语"突变体"或"突变的"是指植物或植物株系具有改变的植物表现型或性状,其中改变的表现型或性状与野生型多核苷酸序列或基因的改变的表达有关。突变的多核苷酸序列或基因可以通过遗传工程方法(例如激活标签或转化)产生,或通过使用一种或多种诱变剂(例如化学诱变剂、辐射或紫外线)产生,或通过使用改变DNA序列的方法(例如易错PCR、DNA改组分子育种、定点突变,或将基因导入引起诱变的生物体,例如DNA修复活性缺陷的大肠杆菌或酵母菌株)来产生。本文使用的术语"T1"是指从TO植物的种子产生的植物的世代。Tl世代是第一组修饰的植物,可以通过使用筛选药剂例如抗生素或除草剂进行筛选,而修饰的植物含有相应的抗性基因。术语"T2"是指以前被选择作为是修饰的Tl植物的花自体受精而产生的植物的世代。T3植物是从T2植物产生的,依此类推。本文使用的给定植物的"直接后代"源自于该植物的种子(或有时是其它组织),并且是立即的后续世代;例如,对于给定谱系来说,T2植物是T1植物的直接后代。给定植物的"间接后代"源自于该植物直接后代的种子(或其它组织),或源自于该谱系中后续世代的种子(或其它组织);例如,T3植物是Tl植物的间接后代。本文使用的"植物部分"包括任何植物器官或组织,包括但不限于种子、胚、分生组织区域、愈伤组织、叶、根、枝条、配子体、孢子体、花粉和小孢子。植物细胞可以从任何植物器官或组织以及从其制备的培养物获得。本文提供了具有改变的表现型的修饰的植物细胞。在特定实施方案中,修饰的植物细胞是转基因植物细胞。转基因植物细胞包含转化载体,转化载体含有编码HIO多肽的HIO核苷酸序列或与编码该多肽的序列互补的序列。在优选实施方案中,转基因植物细胞选自芸苔属(Brassica)的植物包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。在其它实施方案中,植物细胞是种子、花粉、繁殖体或胚细胞。本公开还提供了来自作为从该祖细胞培育的植物的直接后代或间接后代的植物的植物细胞。可用于本发明的方法的植物的类别总的来说与可进行转化技术的高等植物的类别一样广泛,包括单子叶和双子叶植物。本文使用的"转基因植物"包括在其基因组中含有异源多核苷酸的植物。异源多核苷酸可以被稳定地整合到基因组中,也可以在染色体之外。优选情况下,本发明的多核苷酸被稳定地整合到基因组中,使得多核苷酸被传递到后续的世代中。其中已经导入了异源多核苷酸的植物细胞、组织、器官或植株,被认为是"转化的"、"转染的"或"转基因的"。转化的植物或植物细胞的也含有异源多核苷酸的直接和间接后代,也被认为是转基因的。本文公开了具有改变的表现型的修饰的植物。具有改变的表现型的修饰的植物,与相似的但未修饰的(例如非转基因的或未突变的)植物相比,可以含有改进的(增加的)油量和/或改进的(增加的)粗粉质量。具有改变的表现型的修饰的植物,与相似的但未修饰的(例如非转基因的或未突变的)植物相比,可以在修饰的植物的任何部分中、例如种子中、含有改变的油、蛋白和/或纤维含量。在修饰的植物的某些实施方案中,例如在具有改进的或增加的油含量表现型的植物中,改变的表现型包括与相似的但未修饰的(非转基因的或未突变的)植物相比,植物的种子的油含量的增加(高油表现型)。在各种不同的实施方案中,油含量的增加包括油含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。改变的表现型可以是一种或多种脂肪酸例如油酸的增加,同时其它脂肪酸例如亚油酸或亚麻酸降低。脂肪酸含量的变化包括特定脂肪酸增加大约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或以上。在修饰的植物的其它实施方案中,例如在具有改进的或增加的粗粉质量表现型的植物中,改变的表现型可以是种子中蛋白含量的增加和/或种子的纤维含量的降低。蛋白含量的增加包括蛋白含量、例如总蛋白含量或可消化蛋白的含量增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。种子蛋白含量的这种改变可以是种子贮藏蛋白例如白蛋白、球蛋白、醇溶谷蛋白和谷蛋白的量改变的结果。纤维含量的降低包括纤维含量降低大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。这种纤维含量的改变可以是纤维质成分例如纤维素、半纤维素、木质素和果胶的量改变的结果。还提供了从修饰的植物的种子衍生的种子粗粉,其中种子具有改变的(例如增加的)蛋白(例如可消化的)含量和/或改变的(例如降低的)纤维含量。还提供了从修饰的植物的种子衍生的油,其中种子具有改变的油含量。任何这些变化,可以导致相对于对照的、非转基因的或野生型植物来说,来自修饰的植物的种子或种子粗粉的AME的增加。AME的增加,在各种不同的实施方案中,包括种子或种子粗粉中AME增加大约1.0%、1.5%、2.0%、2.5%、3.0%、3.5%、4.0%、4.5%、5.0%、7.5%、10%或以上。本文还提供了从具有改变的表现型的修饰的植物的任何部分生产的粗粉、词料或食物。在某些实施方案中,公开的转基因植物含有转化载体,该载体含有编码"HIO"多肽的HIO核苷酸序列或与编码该肽的序列互补的序列。在特定的实施方案中,HIO多肽在转基因植物中的表达,导致了转基因植物中改变的油含量、改变的蛋白含量和/或改变的纤维含量。在优选实施方案中,转基因植物选自芸苔属(Brassica)的植物包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。还提供了生产油或种子粗粉的方法,包括培育转基因植物以及从该植物回收油和/或种子粗粉。本公开进一步提供了含有编码HIO多肽的核酸序列的饲料、粗粉、谷粒或种子。本公开还提供了含有HIO多肽或其直系同源物或旁系同源物的词料、粗粉、谷粒或种子。将编码所需蛋白的所需多核苷酸序列导入到植物细胞中的各种方法都可加以利用,并且对于本
技术领域
的专业人员来说是已知的,包括但不限于(1)物理方法例如微注射、电穿孔和微粒介导的投送(生物弹或基因枪技术);(2)病毒介导的投送方法;以及(3)农杆菌"gro6a"e".謂)介导的转化方法。最常用的转化植物细胞的方法是农杆菌介导的DNA转化方法和生物弹或微粒轰击介导的方法(即基因枪)。典型情况下,希望进行核转化,但是,当希望特异性转化质体例如叶绿体或淀粉质体时,可以利用所需多核苷酸的微粒介导的投送转化植物的质体。农杆菌介导的转化通过使用属于农杆菌属(^gro6fl"en、m)的遗传工程改造的土壤细菌来完成。许多带有Ti或Ri质粒的根癌农杆菌(Jgro6a"e〃'wmf"me/ac/e附)禾口发根农杆菌(v4gro6a"eWwwWz/zogewes)的野生型和可转化态(disamied)菌株可用于将基因转入到植物中。基因转移经过被称为"T-DNA"的特定DNA的转移来进行,该DNA可以被遗传工程改造,以将任何DNA的目标片段携带到植物物种中。农杆菌介导的植物的遗传转化包括几个步骤。第一个步骤,一般被称为"接种",在其中首先使有毒的农杆菌与植物细胞彼此相互接触。在接种后,使农杆菌和植物细胞/组织在适合生长和T-DNA转移的条件下,一起生长几个小时到几天或以上的一段时间。该步骤被称为"共培养"。在共培养和T-DNA投送后,将植物细胞用杀菌或抑菌剂进行处理,以杀死或限制仍然与外植体接触和/或在含有外植体的容器中的农杆菌的生长。如果该步骤在不存在任何选择性药剂的情况下进行以促进转基因对非转基因植物细胞的择优生长,那么它一般被称为"延迟"步骤。如果在存在有利于转基因植物细胞的选择性压力的情况下进行,那么它被称为"选择"步骤。当使用"延迟"步骤时,一般在随后进行一个或多个"选择"步骤。对于微粒轰击(美国专利No.5,550,318,美国专利No.5,538,880,美国专利No.5,610,042和PCT公开WO95/06128;每个专利特别在此以其全文引为参考)来说,将颗粒用核酸包被,然后通过推进力投送到细胞中。示例性的颗粒包括含有钩、铂以及优选金的颗粒。用于通过加速将DNA投送到植物细胞中的方法的说明性的实施方案是生物弹颗粒投送系统(BioRad,Hercules,CA),它可用于推动包被有DNA的颗粒或细胞通过筛网,例如不锈钢或Nytex筛网,到达覆盖有在悬浮液中培养的单子叶植物细胞的滤膜表面上。微粒轰击技术具有广泛的适用性,可用于实际上转化任何植物物种。已经通过微粒轰击进行转化的物种的例子包括单子叶植物物种例如玉米(PCT公开No.WO95/06128)、大麦、小麦(美国专利No.5,563,055,在此以其全文引为参考)、水稻、燕麦、黑麦、甘蔗和高梁,以及许多双子叶植物包括烟草、大豆(美国专利No.5,322,783,在此以其全文引为参考)、向日葵、花生、棉花、西红柿和普遍来说的豆科植物(美国专利No.5,563,055,在此以其全文引为参考)。不论使用何种转化方法,为了对转化的植物细胞进行选择或评分,被转入到细胞中的DNA含有在可再生的植物组织中起作用的基因,以产生赋予植物组织对有毒性的化合物的抗性的化合物。用作可选择的、可筛选的或可记分的标记物的目标基因包括但不限于GUS、绿色荧光蛋白(GFP)、荧光素酶(LUX)、抗生素或除草剂耐受基因。抗生素抗性基因的例子包括青霉素、卡那霉素、新霉素、G418、博来霉素、氨甲蝶呤(以及三甲氧苄胺嘧啶)、氯霉素和四环素。编码涉及除草剂耐受的蛋白的多核苷酸分子在本
技术领域
是已知的,包括但不限于在美国专利No.5,627,061、美国专利No5,633,435和美国专利No6,040,497中描述的编码5-烯醇式丙酮基莽草酸-3-磷酸合成酶(EPSPS)的多核苷酸分子,以及在美国专利No.5,094,945中描述的用于耐受草甘膦(glyphosate)的aroA的编码多核苷酸分子;在美国专利No.4,810,648中描述的编码用于耐受溴苯腈的溴苯腈腈水解酶(Bxn)的多核苷酸分子;在Misawa等,(尸/a^J.4:833-840,1993)和Misawa等,(尸』,6:481-489,1994)中描述的编码用于耐受哒草伏(norflurazon)的八氢番茄红素去饱和酶(crtl)的多核苷酸分子;在Sathasiivan等,(A^c/.18:2188-2193,19卯)中描述的编码用于耐受磺酰脲类除草剂的乙酰羟酸合酶(AHAS,也称为ALS)的多核苷酸分子;以及在DeBlock等,CE7kffiO丄6:2513-2519,1987)中描述的用于耐受草胺磷和双丙氨膦的bar基因。从各种不同的转化的外植体再生、发育和培育植物,在本
技术领域
中己经有完善的记录。这种再生和生长过程典型地包括选择转化的细胞,以及对那些个性化的细胞通过胚发育的通常阶段通过生根的小苗阶段进行栽培的步骤。转基因胚和种子类似地被再生。随后,将获得的转基因的生根的苗种植在适合的植物生长培养基例如土壤中。在暴露于选择性药剂的情况下存活的细胞、或在筛选分析中被评分为阳性的细胞,可以培养在支持植物再生的培养基中。发育的小苗被转移到含有较低植物生长混合物的土壤中,使其受冷而变得耐寒,然后转移到温室或生长室中发育成熟。本发明可使用任何可转化的细胞或组织。本文中使用的可转化,是指细胞或组织能够进一步繁殖而产生植株。本
技术领域
的专业人员将会认识到,有许多植物细胞或组织是可转化的,在插入外源DNA并经过适当的培养条件后,植物细胞或组织可以形成分化的植物。适合于这些目的的组织可以包括但不限于未成熟的胚、小盾片组织、悬浮细胞培养物、未成熟的花序、茎分生组织、节外植体、愈伤组织、下胚轴组织、子叶、根和叶。可以使用任何适合的植物培养基。适合的培养基的例子包括但不限于基于MS的培养基(Murashige和Skoog,Physiol,Plant,15:473-497,1962)或基于N6的培养基(Chu等,ScientiaSinica18:659,1975),其中添加有其它植物生长调节剂,包括但不限于植物生长素、细胞分裂素、ABA和赤霉素。本
技术领域
的专业人员熟悉各种不同的组织培养基,它们在经过适当的添加后,可以支持植物组织的生长和发育,并适合于植物转化和再生。这些组织培养基或者作为商业制备物购买,或者定制配制和修饰。本
技术领域
的专业人员将会意识到,在转化和再生中使用的培养基和培养基添加物例如营养物质和生长调节剂,以及其它的培养条件例如孵育过程中的光强度、pH和孵育温度,对于具特定的目标品种来说,可以被最适化。本领域技术人员将会认识到,在将表达盒稳定地导入转基因植物并证实其可操作之后,可以通过有性杂交将其导入其它的植物中。取决于被杂交的物种,可以使用许多标准的育种技术中的任何一种。具有改变的表现型的植物的鉴定使用拟南芥"ra6Wop&)激活标签筛选(ACTTAG)来鉴定1)具有改变的油、蛋白和/或纤维含量的ACTTAG植物株系(分别参见下面表1中的第4、5和6列)与2)在表2和3的第3列中鉴定的核酸序列之间的关联性,其中每个核酸序列被提供有基因别名或HIO命名(HIO#,参见表1、2和3中的第1列)。HIO命名是任意的,并不必定涉及具有高油(HIO)表现型的植物。简单来说,正如在实施例中进一步描述的,将大量拟南芥植物用pSKI015载体突变,该载体含有来自根癌农杆菌的Ti质粒的T-DNA,病毒的增强子元件,以及选择性标记物基因(Weigd等,2000,P/a"/尸/z"/o/ogy,122:1003-1013)。当T-DNA插入到被转化的植物的基因组中时,增强子元件可以导致在附近、一般在增强子的大约9千碱基(kb)之内的基因被上调。将T1植物暴露于选择性试剂,以便特异性回收表达了选择性标记物、因此带有T-DNA插入片段的转化的植物。允许T1植物生长至成熟,自体受精并产生种子。收获T2种子、标记并储存。为了增加种子储备,将大约18个T2播种在土壤中,待发芽后暴露于选择性药剂,以回收转化的T2植物。从这些植物收获T3种子,并合并。按照实施例中的描述使用近红外光谱(NIR)估算种子的油、蛋白和纤维素含量。通过对表1第3列中鉴定的ACTTAG株系中T-DNA插入片段两侧的基因组DNA序列进行分析,发现了HIO核酸序列与改变的表现型之间的关联性。ACTTAG株系是用含有4个串联的CaMV35S增强子拷贝的T-DNA元件转化的单植株衍生而来的植株家族。因此,公开的HIO核酸序列和/或多肽可用于开发具有改变的、例如高油表现型的转基因植物。HIO核酸序列可用于产生转基因植物例如含油种子作物,以提供从含油种子加工获得的改进的油产量,并导致从转基因植物的种子回收的油量的增加。HIO核酸序列也可用于产生转基因植物例如词料谷类作物,以提供改变的表现型,导致用于动物饲养的能量的增加,例如具有改变的蛋白和/或纤维含量、导致AME增加的种子或种子粗粉。HIO核酸序列还可用于增加特种油料作物的油含量,以便增加所需的不常见脂肪酸的产率和/或回收率。不常见的脂肪酸的具体的非限制性的例子是蓖麻油酸、斑鸠菊酸和非常长链的多不饱和脂肪酸二十二碳六烯酸(DHA)和二十碳五烯酸(EPA)。已经被遗传修饰以表达HIO多肽的转基因植物可用于生产种子,其中使用标准的方法来培育转基因植物,并从植物的部分(例如种子)获得油和种子粗粉。HIO核酸和多肽在本文描述的激活标签筛选中发现的每个HIO核酸序列的HIO命名列于下面的表1-3的第1列中。公开的HIO多肽列于下面的表2和3的第4列中。HIO命名是任意的,不一定涉及具有高油(HIO)表现型的植物。本文使用的基因别名或HIO命名,是指任何当在植物中表达时导致植物的任何部分例如种子中改变的表现型的多肽序列(或编码它的核酸序列)。在一个实施方案中,HIO多肽是指全长的HIO蛋白,或其具有"功能活性"的片段、衍生物(变异体)或直系同源物或旁系同源物,使得蛋白的片段、衍生物或直系同源物或旁系同源物表现出与一个或多个公开的全长HIO多肽相关的一种或多种功能活性,这些公开的全长HIO多肽例如在表2和3的第4列中引用的GenBank登记号中提供的、对应于SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列的氨基酸序列,或其直系同源物或旁系同源物。在一个优选实施方案中,功能活性的HIO多肽在转基因植物中导致改变的表现型。在另一个实施方案中,功能活性的HIO多肽,当在植物中错误表达时,导致改变的油、蛋白和/或纤维含量表现型(例如改变的种子粗粉含量表现型)。在其它优选实施方案中,HIO多肽的错误表达导致植物中高油(例如增加的油)、高蛋白(例如增加的总蛋白或可消化蛋白)和/或低纤维(例如降低的纤维)表现型。在其它优选实施方案中,HIO多肽的错误表达导致植物中未改变的油、高蛋白(例如增加的总蛋白或可消化蛋白)禾口/或低纤维(例如降低的纤维)表现型。在另一个实施方案中,HIO多肽的错误表达导致了粗粉的改进的AME。在另一个实施方案中,功能活性的HIO多肽当在植物或植物细胞中表达时,能够拯救缺陷的(包括缺失的)内源HIO多肽活性;拯救多肽可以来自于与具有缺陷的多肽活性的物种相同或不同的物种。本公开还提供了含有HIO多肽、或其片段、衍生物(突变体)或直系同源物或旁系同源物的词料、粗粉、谷物、食物或种子。在另一个实施方案中,全长HIO多肽的功能活性片段(例如具有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列的天然多肽的功能活性片段,或其天然存在的直系同源物或旁系同源物)保留了与全长HIO多肽相关的一种或多种生物学特性,例如信号转导活性、结合活性、催化活性或细胞或细胞外定位活性。mo片段优选含有HIO结构域例如C-或N-末端或催化结构域等,并优选含有HIO蛋白的至少10个、优选至少20个、更优选至少25个、最优选至少50个连续的氨基酸。HIO基因的功能性结构域列于表2的第6列中,可以使用PFAM程序(BatemanA等,1999,AAwc/e/c^c/A27:260-262)或INTERPRO(Mulder等,2003,M/c/e/cJc/&細.31,315-318)程序来鉴定。全长HIO多肽或其片段的功能活性变异体,包括具有氨基酸插入、缺失或取代的、保留了与全长HIO多肽有关的一种或多种生物学特性的多肽。在某些情况下,产生了改变HIO多肽的翻译后加工的变异体。例如,与天然多肽相比,变异体可以具有改变的蛋白运输或蛋白定位特征、或改变的蛋白半衰期。本文使用的术语"HIO核酸"是指任何当在植物中表达时导致在植物的任何部分例如种子中改变的表现型的多核苷酸。在一个实施方案中,HIO多核苷酸包括具有表2和3的第3列中引用的GenBank登记号中提供的、对应于SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13中显示的核酸序列的序列或与其互补的序列的核酸,及其功能活性片段、衍生物或直系同源物或旁系同源物。本公开的HIO核酸可以是源自于基因组DNA的DNA,或cDNA或RNA。在一个实施方案中,功能活性的HIO核酸编码功能活性的HIO多肽或与编码该多肽的核酸互补。功能活性的HIO核酸还包括用作在编码功能活性的HIO多肽之前需要加工、例如剪接的原始RNA转录本(即mRNA前体)的模板的基因组DNA。HIO核酸可以包括其它的非编码序列,它们可以被转录也可以不被转录;这样的序列包括5'和3'UTRs、多聚腺苷化信号和控制基因表达的调控序列等,正如本
技术领域
中已知的。某些多肽需要加工事件,例如蛋白裂解、共价修饰等,以便变成具有完全的活性。因此,功能活性核酸可以编码成熟的或加工前的HIO多肽或中间的形式。HIO多核苷酸也可以包含异源编码序列,例如编码被包含以促进融合多肽的纯化的标记物或转化标记物的序列。在另一个实施方案中,功能活性的HIO核酸能够被用于产生失去功能的HIO表现型,例如通过反义抑制、共抑制等。本公开还提供了含有编码HIO多肽的核酸序列的饲料、粗粉、谷物、食物或种子。在一个优选实施方案中,在本公开的方法中使用的HIO核酸含有编码HIO多肽的核酸序列,或与编码该多肽的序列互补的核酸序列,该HIO多肽与公开的HIO多肽序列、例如在SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列具有至少50%、60%、70%、75%、80%、85%、卯%、95%、97%、98%或99%的序列同一性。在另一个实施方案中,HIO多肽含有与公开的HIO多肽序列(例如SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列)具有至少50%或60%同一性的多肽序列,并且可以与公开的HIO多肽序列具有至少70%、80%、85%、90%、95%、97%、98%或99%的序列同一性。在另一个实施方案中,HIO多肽与公开的HIO多肽序列具有50%、60%、70%、80%、85%、90%、95%、97%、98%或99%的序列同一性,可以含有HIO多肽的保守蛋白结构域(例如在表2的第6列中列出的蛋白结构域)。在另一个实施方案中,HIO多肽含有与表2的第4列中引用的多肽的功能活性片段具有至少50%、60%、70%、80%、85%、90%、95%、97%、98%或99%的序列同一性的多肽序列。在另一个实施方案中,HIO多肽包含了在其整个长度上与表2的第4列中引用的GenBank登记号的多肽序列具有至少50%、60%、70%、80%、90%、95%、97%、98°/。或99%的同一性、并含有表2的第6列中列出的保守蛋白结构域的多肽序列。在另一方面,HIO多核苷酸序列在其整个长度上与公开的HIO核酸序列、例如SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13中显示的核酸序列、或与这样的HIO序列互补的核酸序列具有至少50%到60%的同一性,并且可以与公开的HIO序列或其功能活性片段或互补序列具有至少70%、80%、85%、卯%、95%、97%、98%或99%的序列同一性。在另一个实施方案中,公开的HIO核酸含有SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13中显示的核酸序列,或与这样的HIO序列互补的核酸序列,以及与这样的HIO序列具有显著的序列同源性的核酸序列。本文使用的词组"显著的序列同源性"是指与这样的HIO序列具有轻微的或不重要的序列变异的核酸序列,即序列以基本上相同的方式起作用并编码HIO多肽。本文使用的"百分(%)序列同一性"对于具体的对象序列或其特定部分来说,被定义为在将序列进行比对,以及如果需要获得最大的百分序列同一性而引入缺口后,在被鉴定的序列中与对象序列(或其特定部分)中的核苷酸或氨基酸相同的核苷酸或氨基酸的百分率,正如通过程序WU-BLAST-2.0al9(Altschul等,JM/.5/o/.,1990,215:403-410)使用被设定为缺省值的搜索参数所产生的那样。HSPS和HSPS2参数是动态值,由程序自身根据具体序列的组成和目标序列搜索所使用的具体数据库的组成来建立。"百分(%)同一性值"通过用匹配一致的核苷酸或氨基酸的数量,除以被报告的百分同一性的序列的长度来确定。"百分(%)氨基酸序列相似性"通过执行与确定%氨基酸序列同--性时使用的计算相同的计算来确定,但是在计算中除了一致的氨基酸之外还包含了保守的氨基酸取代。保守的氨基酸取代是一个氨基酸被取代成另一个具有相似特性的氨基酸,使得蛋白的折叠或活性不受显著影响的取代。可以互相取代的芳香族氨基酸是苯丙氨酸、色氨酸和酪氨酸;可互换的疏水性氨基酸是亮氨酸、异亮氨酸、甲硫氨酸和缬氨酸;可互换的极性氨基酸是谷氨酰胺和天冬酰胺;可互换的碱性氨基酸是精氨酸、赖氨酸和组氨酸;可互换的酸性氨基酸是天冬氨酸和谷氨酸;可互换的小氨基酸是丙氨酸、丝氨酸、苏氨酸、半胱氨酸和甘氨酸。对象核酸分子的衍生的核酸分子包括与公开的HIO核酸序列(例如SEQIDNO:l、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13中显示的核酸序列)选择性杂交的序列。杂交的严紧性可以通过杂交和清洗过程中的温度、离子强度、pH和变性剂例如甲酰胺的存在来控制。通常使用的条件是众戶万周知的(参见例如C^reW/Votoco/Mo/era/"r历o/ogy,《分子生斗勿学现代方法》,Vol.1,Chap.2.10,JohnWiley&Sons,Publishers(1994);Sambrook等,1989,MolecularCloning:ALaboratoryManual(SecondEdition),《分子克隆实验指南》(第二版),ColdSpringHarborPress,Plainview,N.Y.,)。在某些实施方案中,本公开的核酸分子能够与含有公开的核苷酸序列的核酸分子在严紧的杂交条件下杂交,严紧的杂交条件是将含有核酸的滤膜在含有6X单浓度的柠檬酸盐(SSC)(1XSSC是0.15MNaCl、0.015M柠檬酸钠;pH7.0)、5XDenhardt's溶液、0.05%焦磷酸钠和100|ig/ml鲱鱼精子DNA的溶液中在65°C下预杂交8小时到过夜;在含有6XSSC、IXDenhardt's溶液、100pg/ml酵母tRNA和0.05%焦磷酸钠的溶液中在65°C下杂交18-20小时;以及在含有0.1XSSC和0.1%SDS(十二烷基硫酸钠)的溶液中将滤膜在65。C下清洗1小时。在其它实施方案中,使用了中等严紧的杂交条件,条件为将含有核酸的滤膜在含有35%甲酰胺、5XSSC、50mMTris-HCl(pH7.5)、5mMEDTA、0.1%PVP、0.1%Ficoll、1%BSA和500|ig/ml变性的鲑鱼精子DNA的溶液中在40°C下预处理6小时;在含有35%甲酰胺、5XSSC、50mMTris-HCl(pH7.5)、5mMEDTA、0.02%PVP、0.02%Ficoll、0.2%BSA、100pg/ml鲑鱼精子DNA和10%(wt/vol)硫酸葡聚糖的溶液中在40°C下杂交18-20小时;然后在含有2XSSC和0.1%SDS的溶液中在55°C下进行两次1小时的清洗。或者,可以使用低严紧条件,包括在含有20%甲酰胺、5xSSC、50mM磷酸钠(pH7.6)、5XDenhardt's溶液、10%硫酸葡聚糖和20ng/ml变性的剪切过的鲑鱼精子DNA的溶液中在37。C下温育8小时到过夜;在同样的缓冲液中杂交18到20小时;以及在1xSSC中在大约37°C下清洗滤膜1小时。作为遗传密码简并性的结果,可以产生编码HIO多肽的大量多核苷酸序列。例如,可以选择符合特定宿主生物体要求的最适密码子用法(参见例如Nakamura等,1999,c/e,c版27:292)的密码子,以增加在特定的宿主物种中发生的多肽的表达的速度。这样的序列变异体可以用在本文公开的方法中。公开的方法可以使用公开的拟南芥HIO核酸序列的直系同源物(和/或旁系同源物)。每个公开的拟南芥HIO基因的代表性的推测的直系同源物(和/或旁系同源物)被鉴定在下面的表3的第5列中。在其它植物物种中鉴定直系同源物的方法在本
技术领域
中是已知的。一般来说,不同物种中的直系同源物,由于存在一个或多个蛋白基序和/或三维结构而保留了同样的功能。在进化中,当在物种形成后发生基因复制事件时,一个物种例如拟南芥中的单个基因,可能对应于另一个物种中的多个基因(旁系同源物)。当特定的植物物种的序列数据可获得时,一般通过序列同源性分析例如BLAST分析,通常使用蛋白诱馆序列来鉴定直系同源物。如果从正向BLAST结果得到的最佳命中序列在进行反向BLAST中检索到了最初的询问序列时,序列被指定为可能的直系同源物(HuynenMA和BorkP,1998,尸roc.Wa//.^c^/.<Sc/.,95:5849-5856;Huy織MA等,2000,Ge"画ie雄rc/z,10:1204-1210)。用于多个序列比对的程序,例如CLUSTAL(ThompsonJD等,1994,Wwc/e/c爿c/^/w.22:4673-4680),可用于突出同源的(直系同源的和/或旁系同源的)蛋白的保守区域和/或残基,并产生系统发生树。在代表了多个来自不同物种的同源序列(例如通过BLAST分析检索到的)的系统发生树中,来自两个物种的直系同源序列,相对于来自这两个物种的所有其它序列来说,一般表现为在树上最为接近。结构串线(structuralthreading)或其它蛋白折叠的分析(例如使用ProCeryon,Biosciences,Salzburg,Austria的软件)也可以鉴定可能的直系同源物。核酸杂交方法也可用于发现直系同源的基因,当不能获得序列数据时优选使用这种方法。简并PCR和cDNA或基因组DNA文库的筛选是常用的用于发现相关基因序列的方法,在本
技术领域
中是众所周知的(参见例如Sambrook,1989,M/ecw/<aTC7om'wg.'^Zfl6ora旨yMw"fl/(SecondEdition),《分子克隆实验指南》(第二版),ColdSpringHarborPress,Plainview,N.Y.;Dieffenbach禾0Dveksler,1995,尸C7ZV/me厂^丄a6oratoo^Mawwa/,《PCR弓l物实验指南》ColdSpringHarborLaboratoryPress,NY)。例如,用于从目标植物物种产生cDNA文库、以及使用部分同源的基因探针探测文库的方法,被描述在Sambrook等中。拟南芥HIO编码序列的高度保守的部分可以用作探针。HIO直系同源的核酸可以与SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13的核酸,在高度、中度或低严紧条件下进行杂交。在扩增或分离了假设的直系同源物的区段后,可以将该区段克隆并通过标准技术测序,并用作探针来分离完整的cDNA或基因组DNA克隆。此外,有可能开始EST计划以产生目标植物物种的序列信息的数据库。在另一种方法中,与已知HIO多肽特异性结合的抗体被用于直系同源物(和/或旁系同源物)分离(参见例如Harlow和Lane,1988,1999,Jw"6oJ/es:丄a6orafo^A/a/wa/,《抗体实验指南》,ColdSpringHarborLaboratoryPress,NewYork)。Western印迹分析可以确定特定植物物种的粗提液中HIO直系同源物(即与公开的HIO多肽直系同源的蛋白)的存在。当观察到反应性时,可以通过筛选代表特定植物物种的表达文库来分离编码候选直系同源物的序列。表达文库可以在各种不同的可商购载体中构建,包括Xgtll,正如在Sambrook等,1989中描述的。一旦通过任何这些方法鉴定到候选直系同源物后,可以使用候选直系同源序列作为诱饵("询问"),针对拟南芥或其它其中HIO核酸和/或多肽序列已经被鉴定的物种的序列进行反向BLAST。HIO核酸和多肽可以使用任何可用的方法获得。例如,正如以前描述的,通过筛选DNA文库或通过使用聚合酶链反应(PCR)来分离目标cDNA或基因组DNA序列的技术,在本
技术领域
中是众所周知的。或者,可以合成核酸序列。任何已知的方法,例如定点突变(KunkelTA等,1991,Mef/2o^£"z_ymo/.204:125-39),可用于将所需的变化导入到克隆的核酸中。总的来说,本文公开的方法包括将所需形式的HIO核酸导入到用于转化植物细胞的植物表达载体中,以及在宿主植物中表达HIO多肽。表达HIO多肽的转化的植物和植物细胞表现出改变的表现型,并且在一个特定的非限制性的例子中,可以具有高的(增加的)油、高的(增加的)蛋白和/或低的(降低的)纤维含量。"分离的"HIO核酸分子与它在自然情况下被发现的形式或状态(setting)不同,并且己经被鉴定并与在自然来源的HIO核酸中通常伴随它的至少一种污染的核酸分子分离开。但是,分离的HIO核酸分子包括含在通常表达HIO多肽的细胞中的HIO核酸分子,其中核酸分子位于例如与天然细胞中不同的染色体位置上。具有改变的表现型的遗传修饰的植物的产生公开的HIO核酸和多肽可用于产生具有修饰的或改变的表现型、例如改变的油、蛋白和/或纤维含量表现型的转基因植物。本文使用的"改变的油含量(表现型)"可以是指植物的任何部分中的改变的油含量。在优选的实施方案中,植物中mo基因的改变的表达被用于产生具有高的油含量(表现型)的植物。本文使用的"改变的总蛋白含量(表现型)"或"改变的可消化蛋白含量(表现型)"可以是指植物的任何部分中改变的蛋白(总的或可消化的)含量。在优选实施方案中,HIO基因在植物中的改变的表达被用于产生具有高的(或增加的)总的或可消化的蛋白含量(表现型)的植物。本文使用的"改变的纤维含量(表现型)"可以是指植物的任何部分中的改变的纤维含量。在优选实施方案中,植物中HIO基因的改变的表达被用于产生具有低的(或降低的)纤维含量(表现型)的植物。改变的油、蛋白和/或纤维含量通常在种子中被发现。转基因植物的例子包括含有植物转化载体的植物,转化载体中具有编码HIO多肽的核苷酸序列或与编码该多肽的序列互补的核苷酸序列,该HIO多肽具有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列,或其直系同源物或旁系同源物。含有公开的核酸序列的转基因植物、例如玉米、大豆和低芥子酸油菜,可用于生产植物油和粗粉。植物油被用于各种不同食品中,而来自种子的粗粉被用作动物饲料。在从转基因植物收获种子后,清理种子以除去植物的柄茎和其它物质,然后在滚筒辗粉机中去皮以破碎外壳。将压碎的种子加热到75-100°C,使水解酶变性,裂解未破碎的含油细胞,并使小的油滴合并。然后通过在螺旋压榨机压搾种子原料取出(并且可以回收)大部分油。剩余的油通过用有机溶剂例如己烷进行抽提而从压滤饼中取出。通过将粗粉加热到大约100°C来除去溶剂。在干燥后,将粗粉粒化成均一的形式。含有种子的蛋白、可消化的碳水化合物和纤维的粗粉,在用作动物饲料之前,可以与其它材料相混合。本文描述的用于产生转基因植物的方法一般来说适用于所有植物。尽管激活标签和基因鉴定是在拟南芥中进行的,但HIO核酸序列(或其直系同源物、旁系同源物、变异体或片段)可以表达在任何类型的植物中。在优选实施方案中,产油植物在特定器官、主要是种子中产生和储存三酰基甘油。这样的物种包括大豆(Gfyc/wemax)、油菜籽和低芥子酸油菜(包括甘蓝型油菜Mraw/cfl,及campes/Ws)、向日葵(//e/^w/^z^a朋z^)、棉花(Gaw,/wm/>^"&附)、玉米(ZeamajAsO、可—可豆(77zeo6romacacao)、会工花(C"aWAamwsZ/w"or^)、油掠(£7ae/>yg"/weew^)、柳子(Cocayww"y^"a)、亚麻(Zi"wmM57'to"M/wwm)、蓖麻(iZc/"wcomm"m.s)禾口花生(jrac/n's/^pogaea),以及小麦、水稻和燕麦。产水果和蔬菜的植物、产谷粒的植物、产坚果的植物、快速循环的芸苔属(Brassica)、苜蓿(MW/c化osa"va)、烟草(Mco"a"a)、草坪草(禾本科O^acead)、其它的饲料作物以及野生物种,也可用作独特的脂肪酸的来源。在其它实施方案中,任何表达HIO核酸序列的植物在特定的植物部分或器官、例如种子中,也可以表达增加的蛋白和/或降低的纤维含量。本领域技术人员将会认识到,在本
技术领域
中存在广泛的不同的转化技术,同时新的技术正不断变得可用。任何适合于靶宿主植物的技术都可以在本发明的范围内使用。例如,构建物可以各种不同的形式导入,包括但不限于作为DNA链、在质粒中或在人工染色体中。将构建物导入靶植物细胞,可以通过各种不同的技术来完成,包括但不限于异源核酸的农杆菌介导的转化、电穿孔、微注射、微粒轰击、磷酸,丐-DNA共沉淀或脂质体介导的转化。植物的转化优选是永久性的,即通过将导入的表达构建物整合到宿主植物基因组中,以便导入的构建物传递到后续的植物世代中。取决于应用目标,含有HIO多核苷酸的异源核酸构建物可以编码完整的蛋白或其生物活性部分。在一个实施方案中,基于Ti的二元载体系统可用于转移多核苷酸。标准的农杆菌二元载体对于本领域技术人员来说是已知的,并且许多是可商购的(例如pBI121ClontechLaboratories,PaloAlto,CA)。构建物或载体可以含有植物启动子以表达所选的核酸分子。在优选的实施方案中,启动子是植物启动子。用农杆菌载体转化植物的最适步骤依赖于被转化的植物的类型而变化。农杆菌介导的转化的示例性方法包括转化下胚轴的外植体、苗尖、源自于不孕秧苗或小植株的茎或叶的组织。这样的转化的植物可以有性繁殖,或者通过细胞或组织培养来繁殖。农杆菌转化以前已经被描述用于大量不同类型的植物,用于这样的转化的方法可以在科学文献中发现。特别有关联的是转化商业上重要的作物的方法,例如芸苔属物种的植物包括低芥子酸油菜和油菜籽(DeBlock等,1989,P/a^尸/z"/o/"91:694-701)、玉米(Ishida等,1996M^m"历Wec/mo/.14:745-750,Zhang等,2002尸/"WCe〃.21:263-270)、向日葵(Everett等,1987,5/o/rec/z"o/,,5:1201)、大豆(Christou等,1989,尸麼.淑/.JcadSc/86:7500-7504;Kline等,1987,A^wre,327:70)、小麦、水稻和燕麦。HIO核酸序列的表达(包括转录和翻译)可以根据表达的水平、表达所发生的组织类型和/或表达的发育阶段进行调控。有许多异源调控序列(例如启动子和增强子)可用于控制HIO核酸序列的表达。这些包括了组成性的、可诱导的和可调控的启动子,以及以组织或时间特异性的方式控制表达的启动子和增强子。示例性的组成性启动子包括覆盆子E4启动子(美国专利Nos.5,783,393和5,783,394)、胭脂碱合酶(NOS)启动子(Ebert等,/Voc.A^/.Jcad(T/UJW:5745-5749,1987)、章鱼碱合酶(OCS)启动子(携带在根癌农杆菌的诱导肿瘤的质粒上)、花椰菜花叶病毒启动子例如花椰菜花叶病毒(CaMV)19S启动子(Lawton等,尸/a打f編,肠/.9:315-324,1987)和CaMV35S启动子(OdelI等,7V"/""3":810-812,1985和JonesJD等,1992,rra"化e"/cie&,1:285-297)、玄参花叶病毒35S启动子(美国专利No.5,378,619)、来自核酮糖-1,5-二磷酸羧化酶小亚基(ssRUBISCO)的光诱导的启动子、Adh启动子(Walker等,Proc.A^/.^7."J狄6624-6628,1987)、蔗糖合酶启动子(Yang等,ZVoc.Wa".v4cadSc/.(T/U.」S7:4144-4148,1990)、R基因复合物启动子(Chandler等,T7zei3』Ce//7:1175-1183,1989)、叶绿素a/b结合蛋白基因启动子、CsVMV启动子(VerdaguerB等,1998,尸/朋?Mo/万Zo/.,37:1055-1067),以及甜瓜肌动蛋白启动子(已公开的PCT申请WO0056863)。示例性的组织特异性启动子包括西红柿E4和E8启动子(美国专利No.5,859,330)和西红柿2AII基因启动子(VanHaarenMJJ等,1993,尸/虚Mo/版,21:625-640)。在一个优选实施方案中,HIO核酸序列的表达在其表达与早期种子和/或胚的发育相关的基因的调控序列的控制之下。事实上,在优选实施方案中,使用的启动子是种子增强的启动子。这样的启动子的例子包括来自例如下列基因的5'调控区:napin(Kridl等,&WSc/.L1:209:219,1991)、球蛋白(Belanger和Kriz,G匿t,129:863-872,1991,GenBank登记号No.L22295)、y玉米蛋白Z27(Lopes等,Mo/247:603-613,1995)、L3油质蛋白启动子(美国专利No.6,433,252)、菜豆蛋白(Bustos等,尸/fl"rCe〃,1(9):839-853,1989)、表壳蛋白5(arcelin5)(美国专利申请No.2003/0046727)、大豆7S启动子、7Sa启动子(美国专利申请No.2003/0093828)、大豆7Sa,(3-伴球蛋白启动子、7Sa,启动子(Beachy等,E7kffiO/.,4:3047,1985;Schuler等,iVwc/e/c^cWi仏,10(24):8225-8244,1982)、大豆月夷蛋白酶抑制剂(Riggs等,尸/flWCW/1(6):609-621,1989)、ACP(Baerson等,尸/a"fMo/.5fo/.,22(2):255-267,1993)、硬脂酰基-ACP去饱和酶(Slocombe等,P/aW尸/z,Zo/.104(4):167-176,1994)大豆卩-伴球蛋白a'亚基(Chen等,/Voc.淑/.^cfldSc/.83:8560-8564,1986)、蚕豆(K/c/a,6fl)USP(P-Vf.Usp,美国专利申请No.2003/229918中的SEQIDNO:1、2禾tl3)以及玉米(Zeama")L3油质蛋白启动子(Hong等,P/aWMo/.34(3):549-555,1997)。还包括玉米蛋白,这是在玉米胚乳中发现的一类贮藏蛋白。玉米蛋白基因的基因组克隆已经被分离(Pedersen等,Ce〃,29:1015-1026,1982;以及Russell等,7>wwgem'ci仏6(2):157-168),来自这些克隆、包括15kD、16kD、19kD、22kD、27kD和基因的启动子,也可以使用。其它已知在例如玉米中起作用的启动子包括下列基因的启动子wax_y、5r/W/e、S&w^:e"2、分支酶I和II、淀粉合酶、脱支酶、油质蛋白、谷蛋白和蔗糖合酶。豆科植物的其启动子与早期种子和胚的发育有关的基因,包括蚕豆豆球蛋白(Baumlein等,1991,Mo/.Ge".225:121-8;Baumlein等,1992,尸』丄2:233-9)、泰豆鄉(Fiedler等,1993,尸』油/.肠/.22:669-79)、豌豆麵W"'〃w(Bown等,1988,飾c/缀251:717-26)、豌豆外源凝集素(dePater等,1993,尸/朋,Ce〃5:877-86)、菜豆(P,vM/g"〃、)p-菜豆蛋白(Bustos等,1991,五MSO,10:1469-79)、菜豆DZ五C2禾卩尸/fS[(3](Bobb等,1997,7Vwc/e/c爿c/cfa25:641-7)和大豆卩-伴球蛋白、7S贮藏蛋白(Chamberland等,1992,P/tmfAfo/.19:937-49)。其启动子与早期种子和胚的发育相关的谷类基因包括水稻谷蛋白("GluA-3",Yoshihara和Takaiwa,1996,尸/Ce//P—W,37:107-11;"GluB-l",Takaiwa等,1996,尸/a^7kfo/.30:1207-21;Washida等,1999,尸/朋?Mo/.肠/.40:1-12;"Gt3",Leisy等,1990,P/爐Mo/.14:41-50)、水稻醇溶谷蛋白(Zhou&Fan,1993,7Vmwgem'c2:141-6)、小麦醇溶谷蛋白(Hammond-Kosack等,1993,五MS(912:545-54)、玉米的玉米蛋白(Z4,Matzke等,1990,尸/""ZMo/.14:323-32)、以及大麦S-大麦醇溶蛋白(Entwistle筝'1991,尸/耐她/.17:1217-31)。其它其启动子与早期种子和胚的发育有关的基因包括油棕GL07A(7S球蛋白,Morcillo等,2001,尸/a"n12:233-243)、甘蓝型油菜(Sra"/c""a;n^)"a/n'"、2S贮藏蛋白禾BnapA基因(Josefsson等,1987,S/o/.C/zem.262:12196-201;Stalberg1993,P/cwfMo/.S/o/.199323:671-83;Ellerstrom等,1996,尸/a"fAfo/.5/o/.32:1019-27)、甘蓝型油菜油质蛋白(Keddie等,1994,P/挺Mo/.肠/.24:327-40)、拟南芥油质蛋白(Plant等,1994,尸/a^Afo/.25:193-205)、拟南芥FAE1(Rossak等,2001,P/fl",A/o/.S/o/.46:717-25)、刀豆conA(Yamamoto等,1995,尸/a^A/o/.历o/.27:729-41)和长春花胡豆苷合酶(Str,O丽erkerk禾口M匿link,1999,M/.G饥G匿/.261:635-43)。在另一个优选实施方案中,使用了在油生物合成过程中表达的基因的调控序列(参见例如美国专利No.5,952,544)。可选的启动子来自植物贮藏蛋白基因(Bevan等,1993,7>謹.Soc.Zo"t/.5.肠/.Sc/.342:209-15)。其它可以使用的启动子描述在例如美国专利Nos.5,378,619、5,391,725、5,428,147、5,447,858、5,608,144、5,608,144、5,614,399、5,633,441、5,633,435禾口4,633,436中。在另一个实施方案中,可以将内源的HIO基因置于转基因转录因子的控制之下,或用于设计调节其表达的结合位点。一类这样的转录因子是Cys2-His2-锌指蛋白(ZFPs)。ZFPs是常见的DNA结合蛋白,可以被设计成与特定的DNA序列特异性结合(Beerli&Barbas,NatBiotechnol.,2002,20:135-141;Gommans等,JMolBiol"2005,354:507-519)。单独的锌指结构域由大约30个氨基酸组成,是结构上保守的,可以与DNA的3-4bp相互作用。可以合成含有多个被设计与HIO基因启动子中的特定DNA序列结合的锌指结构的多肽。设计与特定DNA序列相互作用的锌指结构域的原则,已经描述在Segal等(Segal等,ProcNatlAcadSciUSA.,1999,96:2758-2763)、Dreier等(Dreier等,JMolBiol"2000,303:489-502)、以及Beerli禾口Barbas(Beerli&Barbas,NatBiotechnol.,2002,20:135-141)中。这些DNA结合结构域可以与效应结构域融合以形成合成的ZFP,它们可以调控与它们结合的基因的转录。可以活化转录的效应结构域包括但不限于单纯性疱疹病毒蛋白VP16(Sadowski等,Nature.,1988,335:563-564)和VP64(Beerli等,ProcNatlAcadSciUSA.,1998,95:14628-14633)的酸性部分,以及NF-kB转录因子p65结构域(Bae等,NatBiotechnol.,2003,21:275-280.;Liu等,JBiolChem.,2001,276:11323-11334)。可以抑制转录的效应结构域包括但不限于mSIN3和KRAB(Ayer等,MolCellBiol"1996,16:5772-5781;Beerli&Barbas,NatBiotechnol"2002,20:135-141;Beerli等,ProcNatlAcadSciUSA,1998,95:14628-14633;Margolin等,ProcNatlAcadSciUSA.,1994,91:4509-4513)。这些方法已经显示出能在植物中起作用(Guan等,ProcNatlAcadSciUSA.,2002,99:13296-13301;Stege等,PlantJ.,2002,32:1077-1086;VanEe腿naam等,MetabEng.,2004,6:101-108)。在另一个方面,在某些情况下可能希望抑制内源HIO核酸序列在宿主细胞中的表达。实现本发明的这个方面的示例性的方法包括但不限于反义抑制(Smith等,1988,yVa&re,334:724-726;vanderKrol等,1988,所orec/mz々"M,6:958-976)、共抑制(Napoli等,1990,尸/fl"rCe〃,2:279-289)、核酶(PCT公开WO97/10328)和正义和反义的组合(Waterhouse等,1998,爿cadOS^,95:13959-13964)。在宿主细胞中抑制内源序列的方法,典型情况下利用了至少一部分被抑制的序列的转录或转录和翻译。这样的序列可以与内源序列的编码以及非编码区同源。反义抑制可以使用整个cDNA序列(Sheehy等,1988,ZVoc.淑/.JcfldSc/.85:8805-8809)、部分cDNA序列包括5'编码序列的片段(Cannon等,1990,尸/虚Mo/,万/o/"15:39-47)或3'非编码序列的片段(Ch'ng等,1989,A^/.爿cac/.C7&4,86:10006-10010)。共抑制技术可以使用完整的cDNA序列(Napoli等,1990,尸/虚CW/,2:279-289;窗derKrol等,1990,尸/赠CW/,2:291-299)或部分cDNA序列(Smith等,1990,M/.G復224:477-481)。可以进行标准的分子和遗传学测试以进一步分析核酸序列与观察到的表现型之间的关联性。示例性的技术描述如下。1.DNA/RNA分析可以通过例如原位杂交测定突变株和野生型株系中的阶段和组织特异性基因的表达图谱。可以进行基因、特别是调节区域两翼的基因的甲基化状态分析。其它适合的技术包括过表达、异位表达、在其它植物物种中表达和基因敲除(反基因组学、定向敲除、病毒诱导的基因沉默(VIGS;参见BaulcombeD,1999,Jn:/7.J^>o/.S"/p/.15:189-201))。在优选的应用中,一般通过微阵列分析获得的表达分布情况,被用于同时测量许多不同基因表达的差异或诱导的变化。用于微阵列分析的技术在本
技术领域
中是众所周知的(SchenaM等,Sc/e"ce1995270:467-470;BaldwinD等,1999,C(9p/".尸/a"f所o/.2(2):96-103;DangondF,P/zj^'o/Ge"om/"(2000)2:53-58;vanHalNL等,/肠/e由o/.(2000)78:271-280;RichmondT禾口SomervilleS,C群..尸/fl^历o/.20003:108-116)。可以对每个带标签的株系进行表达情况分析。这样的分析可以鉴定出作为目标基因过表达的结果被协同调控的其它基因,这可以帮助将未知基因放置到特定的途径中。2.基因产物分析基因产物分析可以包括重组蛋白的表达、抗血清的生产、免疫定位、催化或其它活性的生物化学分析、磷酸化状态的分析、以及通过酵母双杂交分析来分析与其它蛋白的相互作用。3.途径分析途径分析可以包括根据基因或基因产物错误表达的表现型、或通过与相关基因的序列同源性,将基因或基因产物放置在特定的生物化学、代谢或信号转导途径中。或者,分析可以包括与野生型株系或其它突变株系的遗传杂交(产生双突变体),以确定基因在途径中的次序,或确定突变对途径中下游的"报告"基因的表达的影响。具有改变的表现型的突变植物的产生本文描述了产生具有改变的表现型的植物的其它方法,其中植物被鉴定为在其HIO核酸序列中具有突变或等位基因,导致了与缺少突变或等位基因的植物相比改变的表现型。突变的植物可以使用一种或多种诱变剂产生,例如化学诱变剂(例如甲基磺酸乙酯、甲基磺酸甲酯、硫酸二乙酯、和硝基胍或5-溴-脱氧尿苷)、辐射或紫外线。在方法的某些实施方案中,突变的植物可以被繁殖以产生后代,它们遗传了突变或等位基因,并具有改变的表现型。例如,本文提供了在内源HIO核酸序列中具有一个或多个赋予了改变的表现型的突变的植物的鉴定方法,以及产生这些具有这样的表现型的非转基因的突变植物的后代的方法。具有改变的表现型的突变的植物,可以具有改变的油、蛋白和/或纤维含量,或改变的种子粗粉含量。在被称为"TILLING"(在基因组中靶向诱导的局部病变)方法的一个特定实施方案中,使用例如EMS(甲基磺酸乙酯)处理,在目标植物的种子中诱导突变。将得到的植物进行培育和自体受精,并将后代用于制备DNA样品。使用了HIO核酸序列的PCR扩增和测序来鉴定突变的植物在HIO核酸序列中是否具有突变。然后可以测试具有HIO突变的植物的改变的油、蛋白和/或纤维含量。为了证实HIO突变引起修饰的表现型,可以通过遗传杂交来进行将修饰的基因的存在与修饰的表现型相关联的实验。TILLING可以鉴定到改变了特定基因的表达或改变了由这些基因编码的蛋白的活性的突变(参见Colbert等,2001,尸/滅/■126:480-484;McCallum等,2000,淑,肠fec/zwo/ogy18:455-457)。在方法的另一个特定实施方案中,可以在标记物辅助的育种程序中使用候选基因/数量性状位点(QTLs)方法,来鉴定HIO核酸序列或HIO核酸序列的直系同源物(和/或旁系同源物)中可以赋予改变的油、蛋白和/或纤维含量的等位基因或突变(参见Bert等,7Tzeor^^/Ge"",2003Jun;107(l):181-9;禾卩Lionneton等,Ge"ome,2002Dec;45(6):1203-15)。因此,在本公开的另一方面,HIO核酸被用于鉴定具有改变的油、蛋白和/或纤维含量的植物在内源HIO核酸序列中是否具有突变,或是否具有在植物中导致改变的油、蛋白和/或纤维含量的等位基因。尽管己经参考具体的方法和实施方案对本公开进行了描述,但应该认识到,在不背离本公开的情况下可以对其进行各种不同的修改和变化。所有本文中引用的出版物,出于描述和公开可以与本公开的内容结合使用的组合物和方法的目的,在此明确引为参考。所有引用的专利、专利申请和参考的公共数据库中的序列信息,也引为参考。实施例实施例1通过用激活标签构建物进行转化来产生具有HIO表现型的植物本实施例描述了具有改变的油、蛋白和/或纤维含量的转基因植物的产生。使用激活标签"ACTTAG"载体pSKI015(GI#6537289;WeigelD等,2000,尸/fl,"尸/zj^Wogy,122:1003-1013)来产生突变。基本上按照已公开的申请PCTW00183697中的描述,使用了标准方法来产生拟南芥转基因植物。简单来说,将T0拟南芥(Col-0)植物用携带有pSKI015载体的农杆菌进行转化,该载体含有来自农杆菌Ti质粒的T-DNA、除草剂抗性选择标记基因和4XCaMV35S增强子元件。在Tl世代根据除草剂抗性来选择转基因植物。收获T2种子(从T1植物),并播种在土壤中。将T2植物暴露于除草剂中,以杀死缺少ACTTAG载体的植物。将T2植物培育至成熟,允许其自体受精并结子。对于每个株系大量收获T3种子(从T2植物)。在收获时通过近红外光谱(NIR)分析T3种子。使用Bruker22近红外光谱仪捕获NIR光谱。使用Bruker软件,利用来自NIR分析的数据并按照制造商的说明书上的参考方法,估算了总的种子油、总的种子蛋白和总的种子纤维的含量。按照《美国油类化学家学会官方方法和推荐用法》(第五版)(OfficialMethodsandRecommendedPracticesoftheAmericanOilChemistsSociety,5thEd.,AOCS,Champaign,111.)中的AOCS步骤Aml-92的通用方法,开发了油含量预测校正方法。按照Dumas步骤AOAC968.06的通用方法(《AOAC分析的官方方法》(AOAC国际版第17版),(OfficialMethodsofAnalysisofAOACInternational17thEditionAOAC),Gaithersburg,MD),使用种子样品的总氮含量数据开发了NIR总蛋白含量预测校正方法。按照AOAC官方方法962.09的通用方法(《AOAC分析的官方方法》(AOAC国际版第17版),(OfficialMethodsofAnalysisof.152:141-145)的方法,使用种子样品的油酸含量数据开发了NIR油酸含量预测校正方法。通过在一组种子样品中测量可消化蛋白的含量,开发了用于预测可消化蛋白含量的NIR校正曲线。在已知质量的种子中总蛋白的含量通过使用Dumas方法(AOAC官方方法968.06)测量种子的总氮含量来确定。种子纤维从独立的种子样品中使用Honig禾BRackis的方法(1979,Foot/C/zem.,27:1262-1266)来提取。残留的与纤维相关的未消化的蛋白通过Dumas方法(AOAC官方方法968.06)来测量。可消化蛋白含量通过从种子中蛋白的总量中减去与纤维有关的未消化的蛋白的量来确定。对82,274个独立的ACTTAG株系的来自NIR光谱的油、蛋白和纤维预测值进行了比较。在种子组成分析之后,通过反向PCR和测序确定了每个株系中ACTTAG元件在基因组中的位置。在该分析中考虑了37,995个具有回收到的两翼序列的株系。通过NIR光谱法确定了82,274个株系中的种子油和蛋白值并进行了归一化,以允许对在不同时间培育的植物中的种子成分值进行比较。通过对在同一天种植的所有植物(包括大量其它ACTTAG植物,包括对照、野生型或非转基因植物)的种子中的平均油、蛋白和纤维值进行计算,对油、蛋白和纤维值进行了归一化。每个株系的种子成分被表示成"百分相对值",它通过用每个株系的成分值除以同一天种植的所有株系的平均成分值(将大约等于对照、野生型或非转基因植物中的值)来计算。"百分相对蛋白"和"百分相对纤维"的计算类似。使用反向PCR来回收T-DNA插入片段两侧的基因组DNA。对PCR产物进行序列分析,并使用碱基BLASTN搜索和/或搜索拟南芥信息资源(TAIR)数据库(可以在公开可用的网点获得)来定位在基因组上的位置。一般来说,位于ACTTAG元件中的增强子的9kb范围内的启动子被认为是在"活化空间"内。在编码序列中带有T-DNA插入片段的基因不被认为是在"活化空间"内。鉴定到的ACTTAG株系列于表1的第3列中。在某些情况下,一个以上的ACTTAG株系与基因相关。通过将第3列中鉴定到的植物与在同样时间生长的、但没有显示出性状的其它植物中种子的成分进行比较,确定了分别在第4、5、6和7列中显示的相对的油、蛋白、纤维和油酸的值。表11.别名2.TAIRID3.植物1D4.相对油(o/o)5.相对蛋白(%)6.相对纤维(%)7.相对油酸HIO2019AA"g17920IN081493"8.9995.25100.45102.12HIO2019AAt1g179201,6312109.0595.89108.83■05HIO2046AAt5g59010IN089660128.91142.446.44HIO2046AAt5g59010IN047347102.37104.8996.13106.83HIO2079AAt1g71410,83604131.0183.8599.94139.75HIO2079AAt1g71410,07461107.4299.8196.7597.89HIO2080CAt1g73660IN086720127.9386.29117.27HIO2080CAt1g73660,86720127.9386.29117.27HIO2080CAt1g73660IN068250109.3192.95104.37109.68HIO2091DAt1g098701,6447139.97124.8665.1HIO2091DAt1g09870陽37425100.8892.75101.5698.12HIO2097AAt5g43250IN086712123.39107.4798.3HIO2097AAt5g43250國86698119.6394.3103.68203,11HIO2105AAt3g0722QIN0056251098591.2154.61101.54表2<table>tableseeoriginaldocumentpage46</column></row><table>表3<table>tableseeoriginaldocumentpage46</column></row><table><table>tableseeoriginaldocumentpage47</column></row><table>1.位点2,TairID3.核酸序列GI#4.多肽序列5.直系同源物核酸GI#多肽Gl#物种(japonicacultivar-group))Gl:51965035"51965036水稻(Oryzasativa(j3ponic3cultivsr-group))Gl:183978903i|15231433拟南芥(Arabidopsisthaliana)实施例2拟南芥HIO序列的分析序歹U分析使用BLAST(Altschul等,1990,/.Mo/.B/o/.215:403-410)、PFAM(Bateman等,1999,A^c/e/c爿c/心i仏27:260-262)、INTERPRO(Mulder等,20037V"c/e/ci仏31,315-318)、PSORT(NakaiK禾口HortonP,1999,7>em^24:34-6)、禾口/或CLUSTAL(ThompsonJD等,1994,to.22:4673-4680)进行。实施例3重演实验为了测试表1和2中过表达的基因是否改变的种子成分的表现型,将表达这些基因的转基因植物的种子中的蛋白、可消化蛋白、油和纤维的含量,与来自非转基因的对照植物的种子中的蛋白、可消化蛋白、油和纤维的含量进行了比较。为此,将基因克隆到植物转化载体中,置于强的组成性CsVMV启动子和种子特异性PRU启动子之后。使用floraldip方法将这些构建物转化到拟南芥植物中。植物转化载体含有提供了对有毒化合物的抗性并用作选择标记的基因。将转化的植物的种子铺在含有有毒化合物的琼脂培养基上。7天后,鉴定为健康的绿色植物的转基因植物,并移植到土壤中。将非转基因的对照植物在琼脂培养基上萌发,允许其生长7天,然后移植到土壤中。转基因的小苗和非转基因的对照植物被移植到2英寸的花盆中,放置在10英寸乘20英寸的培养盘中随机的位置上。将植物培育至成熟,允许其自体受精并结子。从每株植物收获种子,使用前面描述的方法通过近红外(NIR)光谱法估算油的含量。每种构建物对种子成分的影响在至少两个实验中评估。表4列出了通过双因子方差分析(ANOVA)检验,以p-值50.05鉴定到的被测试能够导致油、蛋白、可消化蛋白的显著增加或纤维的显著降低的构建物。这些构建物列于表4中。对于蛋白、油、可消化蛋白和纤维的ANOVAp-值分别列于第4-7列中。具有显著p-值的构建物用粗体列出。蛋白、油、可消化蛋白和纤维的平均值分别列于第8-11列中,它们通过将每个实验中测定的转基因植物的平均值进行平均来计算。表4ANOVA平均值1.别名12.Tair3.构建物咖紫6.可消化蛋白7.纤维inhinto6紫IO.可消化蛋白11.纤维HIO2019AA"g17920CsVMV::At1g179200.0700.0010.2470.00997.9%105.3%■8%97.0%HIO2019AAt1g17920Pru::At1g179200.0990.7120.4750.782102.4%99.5%100.7%99.6%HIO2046AAt5g59010CsVMV::At5g590100.5960.2580.0060.051徵7。/0101.4%102,4%97.4%HIO2046AAt5g59010Pm::At5g590100.7570.1650.0610.02999.4%101.9%101.8%97.3%HIO2079AAt1g71410CsVMV::At1g714100.2970.0330.0830.05899.0%104.1%103.1%95.5%HIO2079AAt1g71410Pru::At1g714100.8520.1940.0970.03699.8%102.0%101.7%97.1%HIO2080CAt1g73660CsVMV::夠736600.7550.1730.0800.044100.5%101.9%101.8%97.6%HIO2080CAt1g73660Pru::At1g736600.0120.1660.0620.05895.9%103.0%102.6%97.5%HIO2091DAt1g09870CsVMV::At1g098700.6850.0420,0060.58299.6%102.8%101.9%98.0%HIO2091DAt1g09870Pru::At1g098700.3200.1030.0100.002101.3%102.0%102.0%96.9%HIO2097AAt5g43250CsVMV::At5g4325。0.1850.Q990.1080.18098.1%102.5%101.6%98.2%HIO2097AAt5g43250Pru::At5g432500.1400.0560.3530.993103.6%98.8%102.1。/。98.2%HIO2105AAt3g07220CsVMV::At3g072200.2250.3480.2800.751101.7%99.0%徹8。/099.6%HIO2105AAt3g07220Pru::At3g072200.6550.0340.0290.000靈7%102.1%101.5%96.7%权利要求1.含有植物转化载体的转基因植物,该载体含有编码HIO多肽的核苷酸序列或与编码该多肽的序列互补的核苷酸序列,该HIO多肽含有SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、SEQIDNO10、SEQIDNO12或SEQIDNO14中显示的氨基酸序列,或其直系同源物或旁系同源物,由此该转基因植物相对于对照植物具有增加的油含量表现型或改进的粗粉质量表现型。2.权利要求l的转基因植物,是选自芸苔属(5ra^ica)的植物,包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。3.从权利要求1的植物获得的植物部分。4.权利要求3的植物部分,是种子。5.从权利要求4的种子生产的粗粉、饲料或食物。6.生产油的方法,包括培育权利要求1的转基因植物,以及从该植物回收油。7.权利要求6的方法,其中从植物的种子回收油。8.在植物中产生增加的油含量的方法,该方法包括将含有编码HIO多肽的核苷酸序列或与编码HIO多肽的序列互补的核苷酸序列的植物转化载体导入到植物的祖细胞中,该HIO多肽含有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列,或其直系同源物或旁系同源物,以及培育转化的祖细胞以产生转基因植物,在所述转基因植物中表达该多核苷酸序列,并且该转基因植物相对于对照植物来说表现出增加的油含量表现型。9.通过权利要求8的方法获得的植物。10.权利要求9的植物,是选自芸苔属(Brassica)的植物,包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。11.权利要求9的植物,其中植物选自从该祖细胞培育而来的植物、作为从该祖细胞培育而来的植物的直接后代的植物、以及作为从该祖细胞培育而来的植物的间接后代的植物。12.产生具有增加的油含量的植物的方法,包括鉴定在其HIO基因中具有等位基因的植物,该等位基因导致与缺少该等位基因的植物相比增加的油含量,以及产生该被鉴定的植物的后代,其中产生的后代遗传了该等位基因并具有高油表现型。13.权利要求12的方法,使用了候选基因/QTL方法。14.权利要求12的方法,使用了TILLING方法。15.含有由SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11或SEQIDNO:13中显示的核酸序列编码的多肽的词料、粗粉、谷物、食物或种子。16.含有多肽的饲料、粗粉、谷物、食物或种子,该多肽含有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列,或其直系同源物或旁系同源物。17.权利要求1的转基因植物,其中改进的粗粉质量表现型包括在从转基因植物的种子生产的粗粉中,与对照植物相比,可用的可代谢能量的增加。18.权利要求17的转基因植物,其中可用的可代谢能量的增加包括转基因植物的种子中改变的蛋白和/或纤维含量。19.权利要求18的转基因植物,其中蛋白含量增加和/或纤维含量降低。20.权利要求17的转基因植物,其中可用的可代谢能量的增加包括转基因植物的种子中降低的纤维含量。21.生产粗粉的方法,包括培育权利要求1的转基因植物以及从该植物回收粗粉,从而产生粗粉。22.权利要求21的方法,其中粗粉从植物的种子生产。23.在植物中产生改进的粗粉质量表现型的方法,该方法包括a)将含有编码HIO多肽的核苷酸序列或与编码HIO多肽的序列互补的核苷酸序列的植物转化载体导入到植物的祖细胞中,该HIO多肽含有SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12或SEQIDNO:14中显示的氨基酸序列,或其直系同源物或旁系同源物,以及b)培育转化的祖细胞以产生转基因植物,在所述转基因植物中表达该多核苷酸序列,并且该转基因植物相对于对照植物表现出改进的24.通过权利要求23的方法获得的植物。25.权利要求24的植物,是选自芸苔属(Brassica)的植物,包括低芥子酸油菜和油菜籽、大豆、玉米、向日葵、棉花、可可、红花、油棕、椰子、亚麻、蓖麻、花生、小麦、燕麦和水稻。26.权利要求24的植物,其中植物选自从该祖细胞培育而来的植物、作为从该祖细胞培育而来的植物的直接后代的植物、以及作为从该祖细胞培育而来的植物的间接后代的植物。27.产生具有改进的粗粉质量表现型的植物的方法,包括鉴定在其HIO基因中具有等位基因的植物,该等位基因导致与缺少该等位基因的植物相比增加的粗粉质量,以及产生该被鉴定的植物的后代,其中产生的后代遗传了该等位基因并具有改进的粗粉质量,由此产生具有改进的粗粉质量表现型的植物。28.权利要求27的方法,使用了候选基因/QTL方法。29.权利要求27的方法,使用了TILLING方法。全文摘要本发明涉及由于HIO核酸的改变的表达而表现出改进的油量表现型或改进的粗粉质量表现型的植物。本发明还涉及产生具有改进的油量表现型或改进的粗粉质量表现型的植物的方法。文档编号A01H1/00GK101600342SQ200780051171公开日2009年12月9日申请日期2007年12月13日优先权日2006年12月15日发明者海因·措恩格·额,约翰·P·戴维斯申请人:农业经济有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1