专利名称::Eg8798和eg9703多核苷酸和其用途的制作方法
技术领域:
:本发明涉及用于鉴定祖先植物和培育的植物中相应于商业相关性状例如产量的多核苷酸和多肽序列的分子和进化技术、鉴定的多核苷酸和多肽序列以及使用经鉴定的多核苷酸和多肽序列的方法。
背景技术:
:人类已繁育植物和动物数千年,选择某些具有商业价值和/或美学意义的性状。培育的植物在这样的性状如产量、短日长开花、蛋白质和/或油的含量、收割的容易性、味道、抗病性和抗旱性上与它们的野生型祖先或家族成员不同.驯化的动物在这样的性状如脂肪和/或蛋白质的含量、奶产量、顺从性、生殖力和成熟时间上与它们的野生型祖先或家族成员不同.目前,潜在于上述差异之下的大部分基因是未知的,尽管重要,同样未知的是已在这些基因中发生从而提供这些能力的特定改变.理解培育的植物和动物与它们的祖先或家族成员之间的这些差异的基础将为保持和强化这些性状提供有用的信息。在农作物植物的情况下,控制想要的性状的特定基因的鉴定使得能够以之前不可能的方式直接和快速地进行改善.培育的物种中已进化出提供与同源祖先基因相比独特的、增强的或改变的功能的基因的鉴定可用于开发调节这些功能的试剂.已进化的潜在的培育的物种基因和特定核苷酸的变化以及由这些进化的基因编码的蛋白质的物理和生物化学的改变的进一步鉴定可提供关于想要的性状的背后机制的有价值的信息.该有价值的信息可用于DNA标记辅助育种或DNA标记辅助选择.可选择地,该信息可用于开发进一步增强靶蛋白质的功能的试刑.可选择地,负责基因的进一步基因工程改造可改变或增强想要的性状.此外,可发现已鉴定的基因在控制其他培育的植物的目标性状中发挥作用。人,通过人工选择,已对农作物植物提供了强选择压。该压力反化意:的变化上,已发现每物种只有少^例如io-i;^控制培育的农作物植物的商业目标性状。这些少数基因一直以来非常难以通过标准的植物分子生物学方法来进行鉴定。用于鉴定由于培育而发生改变的基因的方法描述于上面所列相关专利和申请中.用于DNA标记辅助育种(MAB)和DNA标记辅助选樹MAS)的方法对于本领域技术人员来说是熟知并且已在许多出版物(参见例如Peleman和vanderVoort,BreedingbyDesign,TRENDSinPlantScience8(7):330-334)中进行了描述.此类方法可通过在新的植物变种的发展过程中增加选择和整合与想要的表型相关的特定等位基因的能力来更有效地进行植物育种.关于目前普遍使用的标记的一个问题是它们可通过重組与靶基因或性状产生分离(参见HollandinProceedingsofthe4thInternationalCropScienceCongress26Sep-lOct2004,Brisbane,Australia),事实上,Holland引述了其中标记的使用好于常规育种的实例和其中常规育种产生比标记辅助育种更好的结果的其他实例.Holland提出"标记将不可能在很短的时间内在操纵复杂性状如产量上得到广泛使用".用于控制复杂性状如产量所需要的标记是这些复杂性状背后的特定基因而不是只在一些时候与这些复杂性状关联的标记,发明概述在一个实施方案中,本发明包括用于鉴定与植物的产量相关的多核苷酸序列方法,其包括步稞将植物多核苷酸序列的至少部分与至少一个多核苷酸(所述多核苷酸包含选自EG8798多核苷酸序列和EG9703多核苷酸序列的多核苷酸的至少部分)比较;和鉴定植物中的至少一个多核苷酸序列,所述多核普酸序列与包含选自包含EG8798多核苷酸序列和EG9703多核苷酸序列的多核苷酸序列的至少部分的多核苷酸序列相比,包含至少一个多核苷酸的改变,其中所述鉴定的12多核苷酸与植物的产量相关.在另一个实施方案中,本发明还提供了来自普通野生稻(汉/7//7/o《o")、水稻("、普通小麦(r.aes"VwJ7)、大麦(AFfz/gsre)、玉蜀黍(么咖/s鹏j^)、珍珠粟(户,OvAo/^)两色蜀黍(&Wco/or)和甘蔗(&oZ77"'/7i"咖)的EG8798和EG9703的多核苷酸和多肽序列,和包括转染的宿主细胞、转染的植物细胞和包含这些序列的转基因植物.在另一个实施方案中,本发明包括确定植物是否具有任意地使得能够预测植物的产量的特定的EG8798或EG9703多核苷酸或多肽的方法,和使用本发明的EG8798或EG9703多核苷酸或多肽进行标记辅助育种的方法.附图概述图1显示就线路效应(lineeffect)修正的显示EG9703或EG8798的等位基因对表型性状的影响的单因素添加模型(singlefactoradditivemodel)(R2>.20表示主要的基因效应)。图2显示4个正向选择的基因(包括EG9703和EG8798)的表达特征.发明详述根据本发明,本发明者已鉴定了相应于EG9703(对于水稻(培育的稻谷)和普通野生稻(祖先稻谷(ancestralrice))的基因、多核苷酸和多肽,和相应于EG8798(对于水稻(培育的稻谷)和普通野生稻(祖先稻谷)、小麦、大麦、髙粱、玉米、珍珠粟和甘蔗)的多核苷酸,本发明的多核苷酸和多肽用于各种方法例如鉴定与植物的产量相关的多核苷酸序列的方法;确定植物是否具有一个或更多个包含EG8798或EG9703序列的多核苷酸序列的方法;和用于就特定的EG8798或EG9703序列进行的植物的标记辅助育种的方法。本发明的多核苷酸和多肽也用于产生植物细胞、繁殖材料、转基因植物和转染的宿主细胞.13此外,本发明的多核苷酸和多肽可用作用于改进的标记辅助选择或标记辅助育种的标记.此外,这些多核苷酸和多肽可用于在共有共同祖先或家族成员的其他物种中鉴定同源基因,以在所述其他物种中用作标记。例如,玉米、稻谷、小麦、粟、高粱和其他谷类植物共有共同的祖先或家族成员,稻谷中鉴定的基因可直接导致这些其他的草类中的同源基因。同样,番茄和马铃薯共有共同的祖先或家族成员,通过本方法在番茄中鉴定的基因预期在马铃募中具有同源物,反之亦然。除非另外指出,本发明的实践使用分子生物学、遗传学和分子进化的常规技术,所述技术在本领域技术人员的能力范围之内.在丈献例如"MolecularCloning:ALaboratoryManual",第2版(Sambrook等人,1989);"OligonucleotideSynthesis"(M.J.Gait,ed.,1984);"CurrentProtocolsinMolecularBiology"(F.M.A訓bel等人,eds.,1987);"PCR:ThePolymeraseChainReaction",(Mullis等人,eds.,1994);"MolecularEvolution",(Li,1997)中详尽地解释了这些技术。定义要指出的是,"a"或"an"实体是指一个或更多个该实体;例如,a基因是指一个或更多个基因或至少一个基因。这样,术语"a"(或"an")、"一个或更多个"和"至少一个"此处可互换使用.还要指出术语"包含"、"包括"和"具有"可互换使用.如此上所用的,"多核普酸"是指任何长度的核苷酸(核糖核苷酸或脱氣核糖核苷酸)或其类似的聚合物形式.该术语是指分子的一级结构,从而包括双链和单链DNA以及双链和单链RNA.其还包括经修饰的多核苷酸例如甲基化和/或加帽的多核苷酸、包含修饰碱基、主链修饰的多核苷酸等.术语"多核苷酸"和"核苷酸序列"可互换使用,如此处所用的,"基因"涉及包含编码蛋白质的序列的多核普酸或多核苷酸的部分.在本领域内,基因也理解为包含非编码序列,例如5'和3'侧翼序列(例如启动子、增强子、抑制剂和其他调控序列)和内含子。术语"多肽"、"肽"和"蛋白质"此处可互换使用,表示任何长度的氨基酸聚合物.这些术语还包括作为通过包括糖基化、乙酰化和磷酸化的反应接受翻译后修饰的蛋白质.术语"培育的生物"是指已经历人工选择压并且发展出商业或美学相关性状的个体活生物或所述个体的群体、种类、亚种、变种、栽培种或品系.在一些优选实施方案中,培育的生物是选自具有商业意义的玉米、小麦、稻谷、高粱、番茄或马铃薯的植物或任何其他培育的植物,其祖先或家族成员是已知的."植物"是处于任何发育阶段的任何植物特别是种子植物.术语"野生型祖先或家族成员"或"祖先或家族成员"是指培育的生物、物种、亚种、变种、栽培种或品系从其进化而来的祖先或前辈生物、物种、亚种、变种、栽培种或品系.培育的生物可具有一个或多个祖先或家族成员.通常,培育的植物可具有一个或许多个祖先或家族成员,然而驯化的动物通常只具有单个祖先或家族成员。术语"商业或美学相关性状"此处用于指培育的生物例如植物或动物中展示的性状,所述性状的分析可提供关于改良的生物或试剂(所述试剂可调节负责该性状的多肽或各自的多核苷酸)的开发的信息(例如物理或生物化学数据).商业或美学相关性状相对于祖先或家族成员可以是独特的、增强的或改变的."改变的",是指在质量或数量上与在祖先或家族成员中观察到的性状不同的相关性状.优选的商业或美学相关性状是产量.术语"L/Ks型方法"是指评估同源基因中非同义置换和同义置换的数目之间的差异(通过(但不总是)表示为比率)的方法(包括确定非同义和同义位点(synonymoussite)的更严格的方法).使用几个术语命名系统包括但不限于L/Ks、dN/ds、Dk/Ds命名逸些方法。术语"进化意义的变化(evolutionarilysignificantchange)"和"适应进化的变化"是指可归因于选择压或正向选择压的緩解的两种生物、物种、亚种、变种、栽培种和/或品系之间的一个或更多个核苷酸或肽序列的变化.用于确定进化意义的变化存在的一个方法是使用Ka/Ks型分析法例如測量Ka/Ks比率。通常,L/Ks比率为1.0或更大被认为是进化意义的变化。严格地讲,正好为1.0的KA/Ks比率表示选择压的緩解(中性进化(neutralevolution))),大于1.0的KA/KS比率表示正向选择,然而,通常接受GenBank和其他公共数据库中的EST通常遭到一定程度的测序错误,甚至少数不正确的核苷酸可以影响Ka/Ks比率.因此,可对具有低至0.75的KA/Ks比率的多核苷酸仔细地进行再测序,然后重新评价选择压的緩解(中性进化意义的变化)、正选择压(正进化意义的变化)或负选择压(进化上保守的改变)。术语"正进化意义的变化"是指特定生物、物种、亚种、变种、栽培种或品系中导致与其他相关生物相比为正的适应性改变的进化意义的变化。正进化意义的变化的实例是已导致农作物植物的增加的产量的改变.如上所述,正选择用大于l.0的Ka/Ks比率表示。随着偏向增加,L/Ks值大于1.25、1.5和2.0,术语"中性进化意义的变化"是指相对于其祖先生物出现在培育的生物中的和在中性条件下发生的多核苷酸或多肽的改变.中性进化变化由大约0.75至1.25,优选大约0.9至1.1和最优选等于大约1.0的L"s证明.同样,在中性进化的情况下,不能推断出"方向性"。基因可以不受限制地积累改变,因此祖先形式和培育形式相对彼此都在发生改变.术语"同源性"或"同源物"或"直系同源"在本领域内是已知的和被充分理解的,其是指共有共同祖先或家族成员的相关基因,并且基于序列同一性的程度来进行确定,这些术语描述了在一个物种、亚种、变种、栽培种或品系中发现的基因与另一个物种、亚种、变种、栽培种或品系中发现的相应的或等同的基因之间的关系.为了本发明的目的,比较同源序列.据认为,据信或已知"同源序列"或"同源物"或"直系同源物"为功能上相关的.可以以许多方式中的任一种表现功能关系,所述方式包括但不限(a)序列同一性的程度;(b)相同的或相似的生物学功能.优选(a)和(b)都要表明.序列同一性的程度可以是变化的,但优选为至少50%(当使用本领域内已知的标准序列比对程序时),更优选至少60%,更优选至少大约75%,更优选至少大约85%.可使用本领域内容易获得的软件程序例如Ci/rr加f户rofoco/s#o/ecw/srA/o/o^7(F.M.Ausubel等人,eds.,1987)增补本30,7.718节,表7.71中描述的程序来确定同源性.优选比对程序是MacVector(OxfordMolecularLtd,Oxford,U丄)和ALIGNPlus(ScientificandEducationalSoftware,Pennsylvania),另一个优选比对程序是Sequencher(GeneCodes,AnnArbor,Michigan),使用缺省参数.术语"核苷酸变化"是指核苷酸的置换、缺失和/或插入,这在本领域内是广为理解的."管家基因"在本领域内被广为理解,是指与普遍的细胞功能包括但不限于生长、分裂、停滞、代谢和/或死亡相关的基因."管家"基因通常进行在多种细胞类型中发现的功能.相反地,细胞特异性基因通常执行特定细胞类型和/或种类中的功能.术语"试剂",如此处所用的,是指调节多核苷酸或多肽的功能的生物学或化学化合物例如简单的或复杂的有机或无机分子、肽、蛋白质或寡核苷酸.可分析许多种化合物,例如寡聚物,例如寡肽和寡核苷酸,和基于不同核心结构的合成的有机或无机化合物,这些化合物也包含在术语"试刑"中.此外,各种天然来源可提供用于筛选的化合物例如植物或动物提取物等.可单一地检测化合物或将其与另一种化合物一起进行检测.术语"调节多核苷酸或多肽的功能"是指当与不加入试刑相比时,多核苷酸或多肽的功能被改变.调节可在影响功能的任何水平上发生.多核苷酸或多肽的功能可以是直接的或是间接的,并且可直接或间接测量。"多核苷酸的功能"包括但不限于复制、翻译、表达模式.多核苷酸功能不包括与多核苷酸内编码的多肽相关的功能.例如,作用于多核苷酸和影响蛋白质的表达、构象、折叠(或其他物理特性)、对其他部分(例如配体)的结合、活性(或其他功能特征)、蛋白质结能。、'''''''"多肽的功能"包括但不限于构象、折叠(或其他物理特征)、对其他部分(例如配体)的结合、活性(或其他功能特征)和/或蛋白质结构或功能的其他方面.例如,作用于多肽并且影响其构象、折叠(或其他物理特性)、对其他部分(例如配体)的结合、活性(或其了多肽的功能,有效试剂可进行调节多肽的功能的方式包括但不限于1)改变构象、折叠或其他物理特征;2)改变对其天然配体的结合强度或改变对配体的结合的特异性;和3)改变多肽的活性。术语"靶位点"是指多肽中可以是单个氨基酸和/或结构的部分和/或功能性基元的位置,例如,结合位点、二聚体化结构域或催化活性位点。靶位点可用于与试剂例如治疗剂直接或间接相互作用。术语"分子差异"包括任何结构和/或功能差异.在下面描述检测此类差异的方法以及这些差异的实例,"功能效应"是本领域内熟知的术语,其表示在任何活性水平上展示的任何效应(无论是直接还是间接的)。术语"收割的容易性"是指有利于用于消费或其他商业加工的结构或部分(例如,果实、叶子、根)的人工或自动化采集的植物特征或性质.术语"产量"是指可获得的供人用于食物、医疗、善医或其他市场的植物或动物组织或材料的量.术语"提高的经济生产力"是指调节商业或美学相关性状以改善想要的特征的能力.增加的产量和提髙的抗压性是提高的经济生产力的两个实例,18本领域内已知的一般方法为了本发明的目的,来自培育的植物或其祖先或家族成员的多核苷酸的来源可以是任何合适的来源,例如,基因组序列或cDNA序列。优选,比较cDNA序列。可从可获得的私人的、公共的和/或商业数据库例如此处描述的数据库获得编码蛋白质的序列,这些数据库用作通过正在进行的研究努力产生的分子序列数据的库.可选择地,可按照本领域熟知的方法,从例如cDNA(所述cDNA是从细胞中表达的mRNA逆转录的或PCR扩增后获得的)的测序获得蛋白质编码序列.可选择地,基因组序列可用于序列比较。可从可获得的公共、私人和/或商业数据库或根据基因组DNA文库的测序或在PCR后从基因组DNA获得基因组序列.在一些实施方案中,从获自处于确定的发育阶段的組织或在生物已经历某些环境条件后获得的组织的mRNA制备cDNA.可使用在本领域的文献中详尽解释的常规cDNA文库构建技术构建用于本发明的序列比较的cDNA文库.将总mRNA用作反转录cDNA的模板,将转录的cDNA亚克隆入合适的栽体以建立cDNA文库.可就全长cDNA的含量最大化已建立的cDNA文库,尽管可使用小于全长的cDNA。此外,可按照例如Bonaldo等人(1996)(7郎o边e6:791-806标准化序列频率。可使用标准的自动化测序技术测定随机选自构建的cDNA文库的cDNA克隆.优选将全长cDNA克隆用于测序.可对全部或大部分来自cDM文库的cDNA克隆测序,尽管也可能通过对少至1个cDNA克隆或几个cDNA克隆进行测序来实施本发明的一些实施方案.在本发明的一个优选实施方案中,可根据其表达的特异性预先选择待测序的cDNA克隆.为了选择相应于特异性表达的活性基因的cDNA,可使用获自相同生物的其他器官、組织或细胞的mRNA对cDNA进行差减杂交(subtractionhybridization)在某些具有合适的严紧度和浓度的杂交条件下,与非组织特异性mRNA杂交,从而可能代表"管家"基因的cDNA将从cDNA文库中排除掉.因此,剩余的待测序的cDNA更可能与組织特异性功能相关.为了进行差减杂交,可从一个19组织或优选从不同組织和细胞的组合获得非组织特异性mRM。使非组织特性mRNA的量最大化以饱和组织特异性cDNA。可选择地,可使用在线数据库的信息来选择或给予更可能与特定功能相关的cDNA优先权。例如,可使用根据候选培育的生物的cDNA序列设计的引物通过PCR选择用于测序的祖先cDNA候选物.候选培育的生物cDNA序列是例如只在植物特定部分发现的或相应于可能在特定功能中是非常重要的基因的cDNA序列。可通过搜索在线序列数据库获得这样的cDM序列,在所述数据库中可能详细说明关于cDNA序列的表达特征和/或生物学活性的信息。可使用本领域内的标准方法例如PCR方法(使用例如,GeneAmpPCRSystem9700热循环仪(AppliedBiosystems,Inc.))获得已知的培育的生物的基因的祖先同源物的序列.例如,可使用根据候选培育的生物的cDNA序列设计的引物通过PCR选择用以测序的祖先cDNA候选序列.对于PCR,可使用本领域内标准的方法(包括公开可获得的引物设计程序例如PRIMER(WhiteheadInstitute))从培育的生物的序列产生引物。然后可使用本领域内的标准方法和设备例如自动测序仪(AppliedBiosystems,Inc.)对扩增的祖先序列进行测序。同样,可使用祖先或家族成员基因模拟物获得培育的生物中的相应基因.培育的生物中的正选择的多核苷酸的鉴定在优选实施方案中,可将此处描述的方法用于鉴定在农业上重要的培育的植物中控制目标性状的基因。人类已繁殖培育的植物数千年而无控制这些性状的基因的知识.涉及的特定遗传机制的知识将使得能够在分子水平上进行更快速和直接的干预,从而产生具有想要的或增强的性状的植物.人类,通过人工选择,已对农作物植物提供了强选择压.该压力反应在培育的生物与其野生型祖先或家族成员的基因之前的进化意义的变化.已发现只有少数基罔例如每物种10至15个基因控制培育的农作物植物中的商业目标性状.这些少数基因极其难以通过植物分子生物学的标准方法来筌定.此处描述的KA/Ks和相关分析可鉴定控制目20标性状的基因。对于任何目标农作物植物,可从培育的物种或亚种和其野生型祖先或家族成员构建cDNA文库.如1999年1月29日提交的USSN09/240,915中所描述的,各自的cDNA文库是针对彼此以鉴定同源多核苷酸的"BLASTed"。可选择地,本领域技术人员可进入商业和/或公共可获得的基因组或cDNA数据库而不是构建cDNA文库.然后,可进行KA/Ks或相关分析以鉴定选择的在选择压下已快速进化的基因.然后使用标准的分子和转基因植物的方法评估这些基因以鉴定它们是否在商业或美学目的的性状中起作用.通过使用本发明的方法,本发明者已鉴定了相应于基因EG8798或EG9703(其为产量相关基因)的多核苷酸和多肽.可通过随机或定向诱变操作目标基因,从而发展新的、改良的变种、亚种、品系或栽培种.通常,在本发明的一个实施方案中,从培育的生物和野生型祖先或家族成员获得核苷酸序列。将培育的生物的和祖先或家族成员的核苷酸序列相互之间进行比较以鉴定为同源的序列.分析同源序列以鉴定在培育的生物和祖先或家族成员之间具有核酸序列差异的序列,然后进行分子进化分析以在质量和数量上评估差异进化的意义。对于正选择的基因,可进行外类群分析(outgroupanalysis)来鉴定在培育的生物中(或在野生或家族成员中)正选择的基因.然后,就分子/基因本体和生物学功能表征序列.最后,可使用该信息鉴定可调节由基因编码的多肽的生物学功能的试剂.本发明的一般方法使得比较祖先和培育的生物的蛋白质编码核苷酸序列成为必需.生物信息学用于比较,选择包含为进化意义的变化的核苷酸变化的序列.本发明使得能够鉴定已进化至赋予一些进化有利方面的基因和筌定特定的进化变化.例如,培育的生物可以是水稻(Oj7W^f/ra),而野生型祖先或家族成员为普通野生稻(&丁幼ri//7po#o/2).在本发明的情况下,通过标准的测序技术从植物克隆获得编码蛋白质编码核苷酸序列.将培育的生物和其祖先或家族成员的蛋白质编码序列进行比较以鉴定同源序列.本发明涉及完成该比较的任何合适的机制.可人工或通过软件(合适的比对软件的实例在本领域内是已知的)进行比对。优选,通过数据库搜索如BLAST搜索将来自祖先或家族成员的蛋白质编码序列与培育的物种的序列比较。重新获得(retrieved)和分析高评分"击中(hit)",即,在BLAST分析后显示显著相似性的序列.显示显著相似性的序列可以是具有至少大约60%、至少大约75%、至少大约80°/。、至少大约85%或至少大约90%的序列同一性的序列.休选,进一步分析显示大于大约80%的同一性的序列.可使用已知的和本领域内可获得的序列比对方法和程序例如由Higgins等人(1992)"AT^y8:189-191提供的通用的简单比对程序CLUSTALV在整体上比对通过数据库搜索鉴定的同源序列.例如,可将从普通野生稻获得的核苷酸序列在GenBank中进行的水稻EST的搜索中用作查寻序列(querysequence)来鉴定同源序列。应当指出不需要完全蛋白质编码核苷酸序列.事实上,可比较部分cDNA序列.在通过下面描述的方法鉴定目标序列后,可使用进一步的克隆和/或生物信息学方法获得目标基因或蛋白质的整个编码序列。可选择地,可通过使用序列测定芯片技术进行培育的生物和其祖比较.参见,例如,Rava等人美国专利5,545,531,分析培育的生物和祖先或家族成员的比对的蛋白质编码序列以鉴定特定位点上的核苷酸序列的差异.此外,本发明涉及用于获得该分析的任何合适的方法.如果不存在核苷酸序列差异,通常不进一步分析祖先或家族成员或家族成员蛋白质编码序列.检测到的序列变化通常且优选地就准确度进行初始检查.优选,初始检查包括进行一个或更多个下列步猓(其任何一个或所有步稞在本领域内是已知的)(a)发现在祖先和培育的生物序列之间存在变化的位点;(b)检查序列荧光显影困(sequencefluorogram)(色谦图)以确定对祖先或家族成员或培育的生物表现独特的碱基是否相应于对于所述碱基来说是强的、清晰的信号特异性;(c)检查培育的生物击中以判断是否存在多个相应于22序列变化的培育的生物序列。针对相同基因的多个培育的生物的序列的输入,所述相同基因在一个位点上具有相同的核苷酸而在祖先或家族成员序列中是不同核苷酸,提供了培育的序列是准确的独立的支持且该变化是很显著的.使用数据库信息和遗传密码检查这些变化以确定这些核苷酸序列变化是否导致编码的蛋白质的氨基酸序列的变化。正如"核苷酸变化"的定义明确表示的,本发明包括培育的生物的蛋白质编码多核苷酸序列中的至少一个核苷酸变化(与来自祖先或家族成员的相应序列相比),置换、缺失或插入。优选,变化是核苷酸置换.更优选,多个置换存在于已鉴定的序列中并接受分子进化分析.在一个实施方案中,本发明包括用于鉴定与植物的产量相关的多核苷酸序列。该方法包括将植物的多核苷酸序列的至少部分与至少一个EG8798多核苷酸序列和/或EG9703多核苷酸序列比较的步驟.该方法还包括在植物中鉴定至少一个多核苷酸序列,所述多核普酸序列与选自EG8798多核苷酸序列和EG9703多核苷酸序列的多核苷酸相比,包含至少一个核苷酸变化,其中所述鉴定的多核苷酸序列与植物的产量相关.优选EG9703和EG8798多核苷酸序列包括包含下列序列的至少部分的多核苷酸序列,所述下列序列是SEQIDN0:1、SEQIDNO:2、SEQIDN0:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SBQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有与上迷SEQIDNos中的任一序列至少70%的序列同一性的多核苷酸.优选植物多核苷酸序列包括来源于基因组DNA或来源于植物的表.达基因即为cDNA的植物序列.进行该鉴定的方法在本领域内是已知的并且在本说明书的其他部分进行了描述.优选,EG9703或EG8798多核苷酸序列与植物中增加的产量相关。确定和定量产量的方法在本领域是已知的,并且在本说明书的其他地方进行了描述.最优选,可通过确定相对于第二植物产量是否增加来定量产量,所述第二植物来自共同祖先、属或家族成员植物,更优选相同物种,更优选相同栽培种,其具有相对于来自植物的EG9703或EG8798多核苷酸序列具有至少一个核苷酸变化的第二EG9703或EG8798多核苷酸序列.在本发明的所有实施方案中,优选多核苷酸序列包括对具有本发明的EG9703或EG8798多核苷酸至少大约60%的序列同一性的多核苷酸并且具有基本上与此处命名的SEQIDNO相同的对产量的效应.优选,本发明的多核苷酸将具有对包含SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SBQIDNO:40和SEQIDNO:41的至少部分的多核苷酸序列中的任一序列至少大约65%的同一性、至少大约66%的同一性、至少大约67%的同一性、至少大约68%的同一性、至少大约69%的同一性、至少大约70%的同一性、至少大约71%的同一性、至少大约72%的同一性、至少大约73%的同一性、至少大约74%的同一性、至少大约75%的同一性、至少大约76%的同一性、至少大约77%的同一性、至少大约78%的同一性、至少大约79%的同一性、至少大约80%的同一性、至少大约81%的同一性、至少大约82%的同一性、至少大约83%的同一性、至少大约84%的同一性、至少大约85%的同一性、至少大约86%的同一性、至少大约87%的同一性、至少大约88%的同一性、至少大约89%的同一性、至少大约90%的同一24性、至少大约91%的同一性,更优选至少大约92%的同一性、至少大约93%的同一性、至少大约94%的同一性、至少大约95°/。的同一性和更优选至少大约95.5%的同一性、至少大约96%的同一性、至少大约96.5%的同一性、至少大约97%的同一性、至少大约97.5%的同一性、至少大约98%的同一性、至少大约98.5%的同一性、至少大约99%的同一性、至少大约99.5%的同一性,或与所述多核苷酸相同。在本发明的所有实施方案中,优选多肽序列包括具有对本发明的EG9703或EG8798多肽至少大约60%的序列同一性的多肽并且具有基本上与此处命名的SEQIDNO相同的对产量的效应.优选,本发明的多肽具有对包含SEQIDNO:3、SEQIDNO:6、SEQIDNO:9和SEQIDNO:12的至少部分的多肽序列中的任一多肽序列至少大约65%的同一性、至少大约66。/。的同一性、至少大约67%的同一性、至少大约68%的同一性、至少大约69%的同一性、至少大约70%的同一性、至少大约71。/。的同一性、至少大约72%的同一性、至少大约73%的同一性、至少大约74%的同一性、至少大约75%的同一性、至少大约76%的同一性、至少大约77%的同一性、至少大约78%的同一性、至少大约79%的同一性、至少大约80%的同一性、至少大约81%的同一性、至少大约82%的同一性、至少大约83%的同一性、至少大约84%的同一性、至少大约85%的同一性、至少大约86%的同一性、至少大约87%的同一性、至少大约88%的同一性、至少大约89%的同一性、至少大约90%的同一性、至少大约91%的同一性,更优选至少大约至少大约92%的同一性、至少大约93%的同一性、至少大约94%的同一性、至少大约95%的同一性,和更优选至少大约95.5%的同一性、至少大约96%的同一性、至少大约96.5%的同一性、至少大约97%的同一性、至少大约97.5%的同一性、至少大约98%的同一性、至少大约98.5%的同一性、至少大约99%的同一性、至少大约99.5%的同一性,或与所述多肽序列相同.在本发明的所有实施方案中,本发明的培育的植物优选包括玉蜀黍(Zeamaysmays)、水稻(0ryzasativa)、普通小麦(Triticumaestivum)、大麦(Hordeumvulgare)、甘廉(Saccharumofficinarum)、两色蜀黍(Sorghumbicolor)和珍珠粟(Pennisetumtyphoides),在本发明的所有实施方案中,野生型祖先或家族成员植物优选包括选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟的培育的植物的野生型祖先或家族成员植物.特别优选的野生型祖先或家族成员植物是普通野生稻。任何植物EG9703或EG8798多肽是本发明的合适的多肽.从其分离EG9703或EG8798多肽(包括分离天然多肽或通过重组或合成的技术产生多肽)的合适的植物包括玉米、小麦、大麦、棵麦、粟、鹰嘴豆、小扁豆、亚麻、橄榄、无花果、杏仁、阿月浑子树、胡桃、甜菜、欧洲防风根、柑橘属水果包括但不限于橙、柠檬、酸柚、葡萄柚、红橘、橘柚(minneola)和蜜柑与柚子杂交所产生的植物或其果实(tangelo)、甘薯、大豆、豌豆、菊苣、莴苣、巻心菜、花椰菜、西兰花、萝卜、小红萝卜、菠菜、芦笋、洋葱、大蒜、胡椒、斧菜、南瓜、西葫声、大麻、西葫芦、苹果、梨、温悖、甜瓜、梅、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、酪梨、木瓜、芒果、香蕉、大豆、西红柿、高梁、甘蔗、甜菜、向日葵、油菜籽、三叶草、烟草、胡萝卜、棉花、苜蓿、稻谷、马铃薯、茄子、黄瓜、拟南芥和木本植物例如针叶树和阔叶树,玉米、高粱、甘蔗和小麦是特别想要的.本发明的实施方案包括用于鉴定本发明的序列的等位基因变体的方法.如此处所用的,"标记"包括染色体上用于鉴定染色体上的独特位置的基因座.本发明的该实施方案包括用于鉴定本发明的序列的等位基因变体的方法.如此处所用的,"标记"包括染色体上用于鉴定染色体上的独特的位置的基因座。"多态性标记"包括以多个形式(等位基因)呈现的标记,从而当它们存在于同源对(homologouspair)上时,使得该同源对中的染色体中的每一个染色体的传递能够被跟踪.可通过使用一个或多个标记定义基因型.本发明还提供了包含在基因转录的检测、定量或分离中用作探针或扩增引物的分离的核酸,所述核酸包含长度足够且对本发明的基因26互补的多核苷酸,例如,本发明的分离的核酸可用作探针,所述探针用于在筛选想要的转基因植物中检测mRNA的水平的不足,检测基因中的突变(例如,置换、缺失或添加),监测表达的上调或化合物的筛选实验中酶活性的变化、检测基因的许多等位基因变体(多态性)或在植物育种程序中用作分子标记。此外,本发明还提供了分离的核酸,所述分离的核酸包含编码多肽/多核苷酸的一个或多个多态性(等位基因)变体的多核苷酸.多态性变体经常用于在例如用于农作物改良的标记辅助选择方法中跟踪染色体区域的分离.本发明提供了确定利用本发明的多核苷酸的植物的基因型的方法.确定基因型提供了区分染色体对的同源物的方法,其可用于区分植物群体中的分离子.分子标记方法可用于系统发育研究,表征农作物变种间的遗传关系,鉴定杂种或体细胞杂交体,定位影响单基因性状的染色体片段、基于克隆的作图和数量遗传学的研究.参见,例如,PELEMAN和VANDERV00RT,(2003)TRENDSINPLANTSCIENCEV0L8(7):330-334ANDHOLLAND(2004)PROCEEDINGSOFTHE4thINTERNATIONALCROPSCIENCECONGRESS26SEP-1OCT2004,BRISBANE,AUSTRALIA,本发明中确定基因型的特定方法可使用许多分子标记分析技术例如但不限于限制性片段长度多态性(RFLP).RFLP是由核苷酸序列变异造成的DNA限制性片段之间的等位基因差异的产物.正如对于本领域技术人员来说是熟知的,通常通过基因組DNA的提取和使用限制性酶的降解来检测RFLP.—般地,根据大小分离所得的片段,然后将其与探针杂交;单拷贝探针是适合的.显示来自同源染色体的限制性片段.等位基因间片段大小的差异代表RFLP.因此,本发明还提供了通过使用技术例如RFLP分析跟踪本发明的基因或核酸以及在遣传学上与这些基因或核酸遗传连锁的染色体序列的分离.连锁的染色体序列在本发明的基因的50厘摩(cM)之内,通常在40或30cM之内,在一些情况下在20或10cM之内,和在一些情况下在5、3、2或lcM之内.在本发明中,用于植物细胞核基因组的分子标记作围的核酸探针27在选择的杂交条件下选择性地与编码本发明的多核苷酸的基因杂交.在一些实施方案中,探针选自本发明的多核苷酸.通常,这些探针是cDNA探针或PstI基因组克隆.对探针的长度将进行更详细的描述,同上,但长度通常为至少15个碱基,在一些情况下长度为至少20、25、30、35、40或50个碱基。然而,通常探针在长度上小于大约1千碱基。在一些实施方案中,探针是与单倍染色体組中的唯一基因座杂交的单拷贝探针。用于RFLP作图的一些示例性限制性内切酶是EcoRI、EcoRV和Sstl.如此处所用的,术语"限制性内切酶"包括识别和单独地或与另一种组合物一起在特定的核苷酸序列上进行切割的组合物。检测RFLP的方法包括步猓(a)用限制性酶降解植物的基因组DNA;(b)在选择的杂交条件下将核酸探针杂交至所述基因組DNA的存在的多核苷酸的序列;(c)由此检测RFLP.可通过使用本领域技术人员熟知的分子标记技术进行区分本发明的多核苷酸的多态性(等位基因)变体的其他方法,所述分子标记技术包括技术例如l)单链构象分析(SSCP);2)变性梯度凝胶电泳法(DGGE);3)核糖核酸酶保护测定;4)等位基因特异性寡核苷酸(AS0s);5)识别核苷酸错配的蛋白例如大肠杆菌(E.coli)咖tS蛋白的使用;和6)等位基因特异性PCR。基于两个互补DNA链之间的错配的检测的其他方法包括箝位(clamped)变性凝胶电泳(CDGE);异源双链分析(HA);和化学错配裂解法(CMC).因此,本发明还提供了确定基因型的方法,其包括在严紧杂交条件下将怀疑包含本发明的多核苷酸的样品与核酸探针接触.通常样品是植物样品;怀疑包含本发明的多核香酸的样品(例如,基因、mRNA或EST).核酸探针在严紧条件下对本发明的多核苷酸的亚序列杂交,所述亚序列包舍多态性标记.核酸探针对多态性标记核酸序列的选择性杂交产生杂交复合物.杂交复合物的检测表明该多态性标记存在于杂交复合物中.在一些实施方案中,核酸探针包括本发明的多核苷酸.对于本领域技术人员技术人员很明显的是可通过测定这些基因的序列鉴定EG9703和EG8798的多态性变体.对于本领域技术人员很清楚的是可通过测定更多玉米品系和杂种、更多稻谷品系和杂种、更多高粱、大麦、小麦品系、粟或甘蔗品系的序列来鉴定EG9703和EG8798的其他多态性变体或等位基因,可进行关联性分析(associationtest)来发现这两个基因的各基因的等位基因,所述等位基因与产量性状(例如总产量、粒重、粒长或其他产量相关性状)或质量性状(例如ASV、白垩(chalk)、或其他质量性状)的最佳表型相关.这些额外的等位基因的关联性分析将指出与特定性状的想要的表型相关的等位基因.然后就等位基因(或被诊断的想要的等位基因的部分)的存在筛选有想要的亲本近交系,所述等位基因与产量性状(例如产量、粒重、粒长或每植物粒数等)的最佳表现或数量性状(例如ASV或白垩等)的最佳表现相关.与产量性"想要的等位基因".;在优选实施方案中,本发明提供了用于在农作物物种中鉴定EG9703或EG8798的等位基因的方法;用于确定植物是否包含EG9703或EG8798的优选等位基因的方法和用于就EG9703或EG8798的等位基因筛选植物的方法.EG9703和EG8798的等位基因包括例如多核苷酸,所述多核苷酸包含下列序列中的任一序列的至少部分SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有对上述SEQIDNos中任一序列至少大约70%的序列同一性的多核苷对于鉴定EG9703或EG8798的其他等位基因的方法,方法包括一个步骤,使用来自本发明的多核苷酸序列的任何序列的至少部分扩增农作物物种中的一种或更多种植物中相应的EG9703或EG8798序列.在另一个步骤中,这些方法包括确定扩增序列的核苷酸序列.在另一个步骤中,这些方法包括将扩增序列与本发明的多核苷酸序列比较,从而在农作物物种的受试植物中鉴定EG9703或EG8798的任何等位基因。一般地,这些方法还包括用于鉴定或确定优选等位基因(例如,与想要的性状相关的等位基因)的方法.在一个步稞中,使用来自本发明的多核苷酸的任何序列的至少部分扩增至少两种植物中的相应的EG9703或EG8798序列,对于所迷植物已测量或可测量性状的特定参数.所述性状包括例如产量.在另一个步猓中,这些方法包括确定各植物中的EG9703或EG8798的序列。在另一个步骤中,这些方法包括鉴定EG9703或EG8798的优选等位基因或多核苷酸序列.可通过确定位基因。可在实施例中发现此类确定基因型的分析的实例.一般地,这些方法还包括就优选等位基因或多核苷酸序列筛选植物的方法.此类方法包括使用优选等位基因(例如,与想要的性状相关的等位基因)的至少部分扩增植物中相应的EG9703或EG8798序列,和选择包含想要的等位基因(或多核苷酸序列)的植物.本发明还提供了产生EG9703或EG8798多舦的方法,其包括a)提供用编码定位在细胞中表达的EG9703或EG8798多肽的多核苷酸转染的细胞;b)在适合表达多核苷酸的条件下培养转染的细胞;和c)分离EG9703或EG8798多肽.本发明还提供了从重组植物细胞库分离产量相关基因的方法.方法包括提供植物细胞DNA的制刑或重組植物细胞库;在假定检测具有50%或更大的序列同一性的基因的杂交条件下将所迷制刑或植物细胞库与可检测地标记的EG9703或EG8798的保守寡核苷酸(如本说明书中其他部分所描述的,从本发明的EG9703或EG8798多核苷酸序列产生的)接触;和通过其与可检测的标记的结合来分离产量相关基因.本发明还提供了从植物细胞DNA分离产量相关基因的方法.方法包括提供植物细胞DNA的样品;提供成对的具有对EG9703或EG8798基因的寡核苷酸(如本说明书中他部分所描述的,从本发明的EG9703或EG8798多核苷酸序列产生的)的保守区域的序列同源性的寡核普酸;在适合于聚合酶链式反应介导的DNA扩增的条件下将寡核苷酸对与植物细胞DNA样品混合;然后分离扩增的产量相关基因或其片段.由此处描述的方法鉴定的序列可用于鉴定试剂,所述试剂用于调节培育的生物的独特的、增强的或政变的功能能力和/或使用这些序列矫治这些能力的缺陷,这些方法使用例如本领域已知的筛选技术例如体外系统、基于细胞表达的系统和转基因动物和植物。由本发明提供的方法不仅快速鉴定进化的基因而且还显示可对蛋白进行的调控,因为所述蛋白存在于另一种品种中所以其毒性不可能太大。本发明还提供了产生EG9703或EG8798多肽的方法.步骤包括提供用编码定位在细胞中表达的EG9703或EG8798多肽的多核苷酸转染的细胞;和在适合表达多核苷酸的条件下培养转染的细胞;和c)分离EG9703或EG8798多肽.本发明还提供了检测植物细胞中增加产量的基因或增加产量的等位基因的变体的方法,其包括下列步骤.步骤包括将EG9703或EG8798多核苷酸或其大于12个核苷酸(在一些情况下长度大于30个核苷酸)的部分与来自植物细胞的基因组DNA的制剂在假定检测具有对本发明的EG9703或EG8798多核脊酸大约50%或更大的序列同一性的核酸分子序列的杂交条件下接触,所迷本发明的EG9703或EG8798多核苷酸是例如包含选自下列序列的多核苷酸的至少部分的多核苷酸,所迷下列序列是SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQID31NO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41;和具有对上述SEQIDNo中的任一序列至少大约70%的序列同一性的多核苷酸;然后检测杂交,由此可鉴定增加产量的基因。本发明还提供了检测植物细胞中增加产量的基因或基因的特定的增加产量的等位基因变体的方法.该方法包括将增加产量的基因EG9703或EG8798或这些基因中的任一基因的大于12个核苷酸的部分(在一些情况下长度大于30个核苷酸)与来自植物的基因组DNA的制述的)大约50%或更大的序列同一性的核酸分子序列的杂交条件下接触;然后检测杂交,由此鉴定增加产量的基因或基因的特定的增加产量的等位基因变体.通过此处描述的方法鉴定的序列可用于鉴定试剂,所述试剂用于调节培育的生物的独特的、增强的或改变的功能能力和/或使用这些序列矫治这些能力中的缺陷.这些方法使用例如本领域内已知的筛选技术例如体外系统、基于细胞的表达系统和转基因动物和植物.由本发明提供的方法不仅鉴定了快速进化的基因,而且显示了可对蛋白进行的调节,所述蛋白毒性不可能太大,因为它们存在于另外的品种中.在一个实施方案中,本发明包括确定植物是否具有包含EG9703序列的特定的多核苷酸序列的方法.该方法包括下列步稞.一个步骤包括将所述植物的编码多肽的核苷酸序列的至少大约部分与本发明的EG9703多核苷酸的多核苷酸序列的至少部分接触,所述EG9703多核苷酸是例如包含选自下列序列的多核苷酸的至少部分的多核苷酸,所述下列序列是(i)选自SEQIDNO:l、SEQIDNO:2、SEQIDNO:4、SEQIDN0:5的多核苷酸;和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且提供与(i)的多核苷酸基本上相同的产量的多核苷酸.可选择上面列举的多核苷酸中的一个作为特定的多核苷酸(即,目标多核苷酸,用于确定植物是否包含该多核苷酸或相关的多核苷酸).在另一个步骤中,方法包括鉴定植物是否包含特定的多核苷酸。优选,植物多核苷酸序列是基因组DNA或cDNA。在另一个实施方案中,本发明包括确定植物是否具有包含EG8798序列的特定多核苷酸序列的方法,该方法包括步骤将所述植物的多核苷酸序列的至少大约部分与本发明的EG8798多核苷酸序列的至少部分进行比较,所述EG8798多核苷酸序列是例如包含选自下列序列的多核苷酸的多核苷酸,所述下列序列是(i)包含选自SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDN0:41的多核苷酸的至少部分的多核苷酸,和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且提供与(i)的多核苷酸基本上相同的产量的多核苷酸的至少部分.可选择上面列举的一个多核苷酸作为特定的多核苷酸(即,目标多核苷酸,用于确定植物是否包含该多核苷酸或相关多核苷酸).在另一个步骤中,方法包括鉴定植物是否包含特定的多核苷酸。优选,植物多核苷酸序列是基因组DNA或cDNA.优选,EG9703或EG8798多核苷酸序列与植物中增加的产量相关.确定和定量产量的方法在本领域内是已知的,并且在本说明书中的其他地方进行了描述.例如,增加的产量可以是相对于来自具有第二EG9703多核苷酸序列的共同祖先、属或家族成员植物的笫二植物的增加的产量,所迷笫二EG9703多核苷酸序列与来自植物的EG9703多核苷酸序列相比具有至少一个核苷酸变化.本发明还提供了改变植物群体中谷粒产量基因的频率的方法,和用于标记辅助育种或标记辅助选择、包括下列步稞的方法.一个步骤包括使用寡核苷酸作为标记以确定个体植物中存在或不存在谷粒饱满基因(grainfillinggene)来筛选大量植物,寡核苷酸由包含选自下列序列的多核苷酸序列的至少部分的多核苷酸序列的不超过300个碱基组成,所述下列序列是SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有对上述SEQIDNo至少大约70%的序列同一性的多核苷酸的至少部分。另一个步骤包括基于谷粒产量基因的存在或不存在选择至少一个用于育种的个体植物;和另一个步骤包括培育至少一林所选择的植物以产生具有改变的谷粒产量基因的频率的植物群体。在一个实施方案中,用于标记辅助育种的方法包括就针对特定的EG8798多核苷酸序列进行的植物的标记辅助育种的方法.该实施方案包括下列步骤.一个步骤包括将至少一株植物、所述植物的核苷酸序列的至少部分与本发明的特定EG8798多核苷酸序列进行比较,所述特定的EG8798多核苷酸序列是例如选自下列序列的多核苷酸序列的至少部分,所述下列序列是(i)包含选自SEQIDNO:7;SEQIDNO:8;SEQIDNO:10;SEQIDNO:11;SEQIDNO:13;SEQIDNO:14;SEQIDNO:15;SEQIDNO:16;SEQIDNO:17;SEQIDNO:18;SEQIDNO:19;SEQIDNO:20;SEQIDNO:21;SEQIDNO:22;SEQIDNO:23;SEQIDNO:24;SEQIDNO:25;SEQIDNO:26;SEQIDNO:27;SEQIDNO:28;SEQIDNO:29;SEQIDNO:30;SEQIDNO:31;SEQIDNO:32;SEQIDNO:33;SEQIDNO:34;SEQIDNO:35;SEQIDNO:36;SEQIDNO:37;SEQIDNO:38;SEQIDNO:39;SEQIDNO:40和SEQIDNO:41的多34核苷酸的多核苷酸;和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且提供与(i)的多核普酸基本上相同的产量的多核苷酸.该方法还包括鉴定植物是否包含特定的多核苷酸序列的步骤;和培育包含特定多核苷酸序列的植物从而产生后代的步骤.用于标记辅助育种的方法还包括针对特定的EG9703多核苷酸序列的植物的标记辅助育种的方法。步骤包括将至少一林植物、所述植物的核苷酸序列的至少部分与本发明的特定EG9703进行比较,所述特定的EG9703是例如选自下列序列的多核苷酸序列的至少部分,所述下列序列是(i)包含选自SEQIDN0:1、SEQIDNO:2、SEQIDNO:4和SEQIDN0:5的多核苷酸的多核苷酸;和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且提供与(i)的多核苷酸基本上相同的产量的多核苷酸,鉴定植物是否包含特定的多核苷酸序列的步骤;和培育包含特定多核苷酸序列的植物以产生后代的步骤.这些标记辅助育种方法包括选择具有改变的产量的植物例如谷类(包括,但不限于玉米、小麦、大麦和禾本科植物的其他成员)或豆科植物(例如,大豆)的方法,其包括从待逸择的植物获得核酸分子,将所述核酸分子与在严紧或高度严紧条件下与包含本发明的EG9703和EG8798多核苷酸的核酸序列选择性杂交的一种或多种探针接触;检测一种或多种探针对核酸序列的杂交,其中杂交的存在表明与改变的产量相关的基因存在;和基于该杂交的存在或不存在选择植物.在一个实施方案中在稻谷中进行标记辅助选择.在另一个实施方案中,使用一种或更多种在严紧或高度严紧条件下对包含本发明的EG9703和EG8798多核苷酸的序列选择性杂交的探针在小麦中进行标记辅助选择.在另一个实施方案中,使用一种或更多种在严紧或高度严紧条件下对包舍本发明的EG9703和EG8798多核苷酸的多核苷酸序列选择性杂交的探针在玉米(maize)或谷物中进行标记辅助选择.在另一个实施方案中,使用一种或更多种在严紧或高度严紧条件下对包含本发明的EG9703和EG8798多核苷酸的序列选择性杂交的探针在高粱中进行标记辅助选择.在另一个实施方案中,使用一种或更多种在严紧或高度严紧条件下对包含本发明的EG9703和EG8798多核苷酸的序列选择性杂交的探针在大麦中进行标记辅助选择.在各情况下,可使用针对单一序列或多个序列的探针进行标记辅助选择,如果使用多个序列,可同时或顺序地使用它们.也可在育种过程中使用分子标记进行质量性状的选择。例如,可使用与等位基因紧密连锁的标记或包含实际的目标等位基因内的序列的标记选择植物,所述植物在回交育种程序期间包含目标等位基因。标记还可用于针对供方亲本的标记选择轮回亲本的基因组。使用该方法可使保留在选择的植物内的来自供方亲本的基因的量减少至最少。其还可用于减少回交程序所需的轮回亲本的回交次数.选择过程中分子标记的使用通常称为遗传标记增强选择(GeneticMarkerEnhancedSelection)e在另一个实施方案中,本发明包括分离的多核苷酸,所述多核普酸包含含有一个或更多个下列多核苷酸的多核苷酸SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有对上面列举的多核苷酸序列(即,任何序列)至少大约70%的序列同一性并且提供与上面列举的任何多核苷酸序列相同的产量的多核苷酸序列.本发明的一个实施方案是在严紧杂交条件下与至少一个下列基因EG9703或EG8798基因的至少部分杂交的分离的植物多核苷酸.迄今描迷了鉴定此类基因的特征.本发明的多核苷酸可包括分离的天然植物EG9703或EG8798基因或其片段,在下面更详细地描述其后者.36本发明的多核苷酸可包括一个或更多个调控区、全长或部分编码区或其组合。本发明的多核苷酸的最小大小是可与上述基因中的一个基因在严紧杂交条件下形成稳定的杂交体的最小大小.上面公开了合适的植物。根据本发明,分离的多核苷酸是已从其天然环境中取出的(即,已接受了人工操作的)多核苷酸.这样,"分离的"不反映多核苷酸已纯化达到的程度。分离的多核苷酸可包括DNA、RNA或DNA或RNA的衍生物.本发明的分离的植物EG9703或EG8798多核苷酸可以以整个(即,完整的)基因或其的能够与该基因形成形成稳定的杂交体的部分从其天然来源获得.还可使用重組DNA技术(例如,聚合酶链式反应(PCR)扩增,克隆)或化学合成产生分离的植物EG9703或EG8798多核苷酸.包括但不限于其中以这样的方式插入、缺失、置换和/或颠换核苷酸的天然等位基因变体或经修饰的多核苷酸,即该修饰不显著干扰多核苷酸编码本发明的EG9703或EG8798多肽的能力或与天然基因分离物在严紧条件下形成稳定的杂交体.在已分离想要的DNA后,可用已知的方法对其进行测序.在本领域认识到此类方法会发生错误,这样相同区域的多次测序是常规的,并且仍然预期在所得的推导序列中,特别是在具有重复的结构域、大量的二级结构或稀有碱基组成(例如具有高GC碱基含量的区域)的区域中导致可测量的错误率.当差异产生时,可进行重新测序,重新测序列可使用专门的方法.专门的方法可包括通过使用不同的温度、不同的酶、改变寡核苷酸形成高能结构的能力的蛋白、改变的核苷酸例如ITP或甲基化的dGTP、不同的凝胶組合物例如加入甲酖胺、位于与问题区域不同距离的不同引物或不同的模板例如单链DNA来改变测序条件.还可使用mRNA的测序.可使用许多本领域内技术人员已知的方法(参见,例如Sambrook等人,同上)产生植物EG9703或EG8798多核苷酸同源物.例如,可使37用多种技术包括但不限于经典诱变技术和重组DNA技术修饰多核苷酸,所述技术是例如定向诱变、诱导突变的对多核苷酸的化学处理、核酸片段的限制性酶的切割、核酸片段的连接、聚合酶链式反应(PCR)扩增和/或核酸序列的选择区域的诱变、寡核苷酸混合物的合成和混合物组群的连接(以"建立"多核苷酸的混合物)和其组合.可通过筛选由核酸编码的多肽的功能(例如,引发针对EG9703或EG8798多肽的至少一个表位的免疫应答的能力、增加包含EG9703或EG8798基因来选择多核苷酸同源物。本发明的分离的多核苷酸可包括编码至少一种本发明的植物EG9703或EG8798多肽,此处公开此类多肽的实例.尽管短语"多核苷酸"主要是指物理多核苷酸,短语"核酸序列"主要是指多核苷酸上的核苷酸的序列,但两个短语可互换使用,特别是对于能够编码EG9703或EG8798多肽的多核苷酸或核酸序列.如迄今已公开的本发明的植物EG9703或EG8798多肽包括但不限于具有全长植物EG9703或EG8798编码区的多肽、具有部分植物EG9703或EG8798编码区的多肽、融合多肽、多价体保护性多肽和其组合本发明的至少某些多核苷酸编码可对来源于动物的免疫血清选择性结合的多肽,所述动物已用其多核苷酸已被分离的EG9703或EG8798多肽免疫.包含本发明的多核苷酸的多核苷酸,当在合适的植物中表达时,能够增加植物的产量.如下面更详细公开的,这样的多核苷酸可以是或可编码反义RNA、能够形成三螺旋的分子、核酶或或其他基于核酸的化合物,本发明的一个实施方案是在严紧杂交条件下与本发明的EG9703或EG8798多核苷酸杂交的或与EG9703或EG8798多核苷酸的同源物杂交的、或与所述多核苷酸的互补序列杂交的植物EG9703或EG8798多核苷酸.本发明的任何核酸序列的多核苷酸互补序列是指与其序列被引用的链互补(即,可与形成双螺旋的)的多核苷酸的核酸序38列.要指出的是,已确定了其中一条单链的核酸序列(由SEQIDNO表示)的本发明的双链核酸分子还包含具有为该SEQIDNO的互补序列的序列的互补链.这样,可以是双链或单链的本发明的多核普酸包括在严紧杂交条件下与此处指出的给定的SEQIDNO和/或可在此处指出或不指出的该SEQIDNO的互补序列形成稳定的杂交体的多核苷酸。推导互补序列的方法对于本领域技术人员来说是已知的。在一些实施方案中,EG9703或EG8798多核苷酸能够编码天然存在于植物中的EG9703或EG8798多肽的至少部分。在一些实施方案中,本发明的EG9703或EG8798多核苷酸在严紧杂交条件下与至少一个下列多核苷酸的至少部分杂交,所述下列多核苷酸是SEQIDN0:1、SBQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有对上述SEQIDNo中的任一序列或对该多核苷酸的同源物或互补物至少大约70%的序列同一性的多核苷酸.知道本发明的某些植物EG9703或EG8798多核苷酸的核酸序列允许本领域扶术人员例如(a)产生这些多核苷酸的拷贝,(b)获得包含此类多核苷酸(例如,包括全长基因、全长编码区、调控序列、截短的编码区的多核苷酸),和(c)获得其他植物的EG9703或BG8798多核苷酸.可以各种方法获得此类多核苷酸,所述方法包括用本发明的抗体筛选合适的表达文库;使用本发明的寡核苷酸探针筛选合适的文库或DM的常规克隆技术;和使用本发明的寡核苷酸引物PCR扩增合适的文库或DNA.筛选或从其扩增多核苷酸的的合适的文库包括文库例如从分离的植物組织制备的基因组DNA文库、BAC文库、YAC文库、cDNA文库,所述组织包括但不限于茎、生殖结构/组织、叶、根和分莱;以及从混合的cDM(来自上面列举的任一组织或所有组织)构建的文库.在稻谷和玉米的情况下,可使用可从ClemsonUniversity获得的BAC文库.类似地,筛选或从其扩增多核苷酸的DNA来源包括植物基因组DNA。在例如Sambrook等人,同上和在Galun&Brei迈an,TransgenicPlants,ImperialCollegePress,1997中'>开了克隆和扩增基因的技术。本发明还包括多核苷酸,所述多核苷酸是能够在严紧杂交条件下与本发明的其他(有时更长的)多核苷酸(例如包含植物EG9703或EG8798基因或其他植物的EG9703或EG8798多核苷酸的多核香酸)的互补区域杂交的多核苷酸.本发明的寡核苷酸可以是RNA、DNA或任一种的衍生物.该寡核苷酸的最小大小是形成给定的寡核苷酸和本发明的另一个多核苷酸上的互补序列之间的稳定杂交体所需的大小.此处描述了最小的大小的特征.寡核苷酸的大小必须对于本发明的遥寡核苷酸的用途也是足够的.可以以多种用途(包括但不限于作为鉴定另外的多核苷酸的探针、作为扩增或延伸多核苷酸的引物、作为表达分析的靶、作为被靶向诱变和/或回收的候选物或在农业用途中改变EG9703或BG8798多肽产量或活性)使用本发明的寡核苷酸.所述农业用途包括所述寡核苷酸在例如基于反义、基于三螺旋形成(triplexformation)、基于核糖体和/或基于RNA药物的技术中的用途.因此,本发明包括所述寡核苷酸和通过使用一种或更多种所述技术增加植物的经济生产率的方法.本发明还包括分离的多肽,所迷多肽包含(舍有)一种或更多种由多核苷酸编码的多肽的至少部分,所述多核苷酸是SEQIDN0:1、SEQIDN0:2、SEQIDN0:4、SEQIDN0:5、SEQIDN0:7、SEQIDN0:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和具有对上述SEQIDNo中任一序列至少大约70%的序列同一性的多核苷酸;和由对上面列举的多核苷酸至少大约70%的序列同一性的并且提供与上面列举的多核苷酸基本相同的产量的多核苷酸编码的多肽,本发明的分离的多肽还包含SEQIDNO:3、SEQIDNO:6、SEQIDNO:9和SEQIDNO:12;和具有对上面举例的任何多肽至少大约75%的序列同一性和赋予与上面列举的任一多肽基本相同的产量的多肽,根据本发明,分离的或生物学上纯的多肽是已从其天然环境中取出的多肽,这样,"分离的"和"生物学上纯的"不必反映多肽被纯化的程度。本发明的分离的EG9703或EG8798多肽可从其天然来源获得,可使用重组DNA技术产生或可通过化学合成产生.可通过其在功能测定中进行天然EG9703或EG8798的功能来鉴定本发明的EG9703或EG8798多肽."天然EG9703或EG8798多肽",其是指全长EG9703或EG8798多肽.短语"能够在功能测定中进行天然EG9703或EG8798的功能"意指多肽在功能测定中具有至少大约10%的天然多肽的活性.在其他实施方案中,EG9703或EG8798多肽在功能测定中具有至少大约20%的天然多肽的活性.在一个实施方案中,EG9703或EG8798多肽在功能测定中具有至少大约30%的天然多肽的活性,在其他实施方案中,EG9703或EG8798多肽在功能测定中具有至少大约40%的天然多肽的活性.在其他实施方案中,EG9703或EG8798多肽在功能测定中具有至少大约50%的天然多肽的活性.在其他实施方案中,多肽在功能测定中具有至少大约60%的天然多肽的活性。在其他实施方案中,多肽在功能测定中具有至少大约70%的天然多肽的活性.在其他实施方案中,多肽在功能测定中具有至少大约80%的天然多肽的活性.在其他实施方案中,多肽在功能测定中具有至少大约90%的天然多肽的活性.功能测定的实例包括本说明书中其他地方详细描述的抗体结合测定或产量增加测定.如此处所用的,分离的植物EG9703或EG8798多肽可以是全长多肽或所述多肽的任何同源物.EG9703或EG8798同源物的实例包括这样的EG9703或EG8798多肽,即在所述EG9703或EG8798多肽中氨基酸发生缺失(例如,多肽的截短形式,例如肽)、插入、颠换、置换和/或衍生(例如,通过糖基化、磷酸化、乙酰化、十四烷基化、异戊烯化、棕榈酰化、酰胺化和/或甘油磷脂酰肌醇的加入)从而使同源物具有天然的EG9703或EG8798活性.在一个实施方案中,当使用本领域技术人员已知的技术将同源物作为免疫原对动物施用时,动物将产生抗EG9703或EG8798多肽的至少一个表位的体液和/或细胞免疫应答.还可通过其在功能测定中进行EG9703或EG8798的功能的能力选择EG9703或EG8798同源物。植物EG9703或EG8798多肽同源物可以是天然等位基因变异或天然突变的结果.还可使用本领域内已知的技术产生本发明的EG9703或EG8798多肽同源物,所述技术包括,但不限于对多肽的直接修饰或使用例如经典的或重組DNA技术进行随机或定向突变进行的对编码多肽的基因的修饰.根据本发明,模拟表位(mi迈etope)是指能够模拟本发明的分离的植物EG9703或EG8798多肽在功能测定中进行本发明的EG9703或EG8798多肽的功能的能力的任何化合物.模拟表位的实例包括抗独特型抗体或其片段,所述抗独特型抗体或其片段包含但不限于包含至少一个模拟本发明的分离的多肽的一个或多个表位的结合位点;分离的多肽的non-polypeptideaceous免疫原部分(例如,糖结构)j和合成的或天然的有机分子包括核酸,所述分子具有与本发明的分离的多肽的至少一个表位相似的结构.可使用计算机产生的本发明的多肽的结构来设计所i^拟表位.还可通过产生分子例如寡核苷酸、肽或其他有机分子的随机样品,然后使用相应的结合模式通过亲和层析技术筛选所述样品来获得模拟表位.本发明的EG9703或EG8798多肽同源物的最小大小是足以由多核苷酸编码的大小,所述多核苷酸能够与编码相应的天然多肽的多核苷42酸的互补序列形成稳定的杂交体.这样,编码此类多肽同源物的多核苷酸的大小依赖于核酸组合物和多核苷酸与互补序列之间的百分数同源性以及依赖于本身的杂交条件(例如温度、盐浓度和甲酰胺浓度)。也应当指出,形成稳定的杂交体所需的同源性的程度可视同源序列是分散在整个多核苷酸上还是在多核苷酸上的不同区域中簇集(即,局部化)而变化。所述多核苷酸的最小大小通常是长度至少大约12至大约15个核酸(如果多核苷酸是富含GC的)和长度至少大约15至17个碱基(如果它们是富含AT的),在一些实施方案中,多核苷酸长度为至少12个碱基.本发明的植物EG9703或EG8798多核苷酸是当在植物中表达或调节时能够增加植物的产量的化物。本发明的一个实施方案是包含附着至融合片段的包含BG9703或EG8798多肽的结构域的整合多肽,以本发明的EG9703或EG8798多肽的部分的形式包含融合片段可增强多肽在生产、贮存和/或使用期间的稳定性.依赖于片段的特征,融合片段还可用作免疫增强刑以增强由用包含该融合片段的EG9703和EG8798多肽免疫的动物产生的免疫应答.此外,融合片段可用作简化EG9703或EG8798多肽的纯化(例如使得能够使用亲和层析纯化所得的融合多肽)的工具。合适的融合片段可以是任何大小的具有想要的功能(例如,赋予增加的稳定性、赋予增加的对多肽的免疫原性和/或简化多肽的純化)的结构域.使用一个或多个融合片段在本发明的范闺之内.可将融合片段与多肽的包含EG9703或EG8798的结构域的氨基和/或羧基末端连接,融合片段和融合多肽的包含EG9703或EG8798的结构域之间的连接可以易于切割以使能够直接回收所述多肽的包含BG9703或BG8798的结构城.在一些实施方案中通过培养用融合多核苷酸转化的重组细胞来产生融合多肽,所迷融合多核苷酸编码多肽,所迷多肽包含附着至包舍EG9703或EG8798的结构域的羧基和/或氛基末端的融合片段.用于本发明的一些融合片段包括谷胱苷肽结合结构域、金属结合结构域例如能够结合二价金属离子的多聚组氨酸片段、免疫球蛋白结合结构域例如多肽A(PolypeptideA)、多舦G、T细胞、B细胞、Fc受体或补体多肽抗体结合结构域、糖结合结构域例如来自麦芽糖结合多肽的麦芽糖结合结构域,和/或"标签"结构域(例如,p-半乳糖苷酶的至少部分、strep标签肽、可使用结合所述结构域的化合物例如单克隆抗体纯化的其他结构域).其他融合片段包括金属结合结构域例如多聚组氨酸片段、麦芽糖结合结构域、str印标签肽,如此处所用的,多核苷酸或多肽的"至少部分"意指具有此处描述的所述序列的最小大小特征的部分或全长分子的任何更大的片段(多至包含全长分子)。例如,多核苷酸的部分可以是12个核苷酸、13个核苷酸、14个核苷酸、15个核香酸等,多至全长多核苷酸.类似地,多肽的部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,多至全长多肽.使用的部分的长度将依赖于特定的用途.如上所述,用作杂交探针的多核苷酸的部分可短至12个核苷酸.用作表位的多肽的部分可短至4个氨基酸.进行全长多肽的功能的多肽的部分长度通常超过4个氨基酸,本发明的其他植物EG9703或EG8798多肽是这样的多肽,即所述多肽包括但不限于编码的多肽、全长多肽、加工的多肽、融合多肽和其多价体多肽以及作为多肽的截短同源物的多肽,所述截短的同源物包含上述SEQIDNO的至少部分.本发明的命名的序列描述于表I中.表I显示序列识别号码、基因、从其分离基因的物种.本申请中所有命名的序列是产量相关基因并且能够改变植物的产量,例如,命名的序列能够增加植物的产量和/或减少植物的产量.估量产量的方法描述于本说明书的其他地方.表I<table>tableseeoriginaldocumentpage44</column></row><table><table>tableseeoriginaldocumentpage45</column></row><table>关于EG9703或EG8798,一些重组细胞是植物细胞."植物细胞"是指任何由半透膜包围的并且包含质体的自我繁殖的细胞.如果希望进一步的增殖,则所述细胞也需要细胞壁.此处所用的植物细胞包括但不限于藻类、蓝细菌(cyanobacteria)、种子、悬浮培养物、胚胎、分生组织区、愈伤组织、叶、根、枝条(shoot)、配子体、孢子体、花粉和小孢子.重组细胞和转基因植物的特征和合适的方法描述于WO03/062382以及美国专利6,040,497,它们均以其全文在此引用作为参考.例如,玉米中基因的表达在本领域是已知的,合适的启动子是已知的并且可由有知识的本领域技术人员选择.例如,使用已知的玉米表达栽体例如可从RhonePoulencAgrochimie获得的表达栽体构建植物表达栽体.构建表达构建体和转化栽体的方法包括标准的体内基因重组和操作。参见,例如,Weissbach和Weissbach,1988,MethodsForPlantMolecularBiology,AcademicPress,Chapters26—28中描述的技术.可从本领域内已知的任何植物转化栽体产生本发明的转化栽体,所述植物转化栽体包括但不限于众所周知的来負土壤杆菌(Agrobacterium)的Ti质粒家族和其衍生物,包括整合载体和二元栽体,包括但不限于pBIB-KAN、pGA471、pEND4K、pGV38SO和pM0NS0S。还包括DNA和RNA植物病毒,包括但不限于CaMV、复染色体病毒(geminiviruse)、烟草花叶病毒,和它们的通过基因工程改造的衍生物,其中的任一种可有效地用作栽体以将编码序列或其功能等同物和相关调控元件一起递送入植物细胞和/或自主地保持转移的序列。此外,转座因子可与任何栽体一起使用以将编码序列和调控序列转移入植物细胞。为帮助转化子和转染子的选择,优选可修饰转化栽体以包含受体基因产物或选择标记的编码序列。这样的受体或选择标记的编码序列应当优选与上文中描述的调控元件编码序列有效连接.可用于本发明的报告基因包括但不限于'3-葡糖苷酸酶(GUS)基因(Jefferson等人,Proc.Natl.Acad.Sci.USA,83:8447(1986))和荧光素酶基因(Ow等人,Science234:856(1986))。编码可用于本发明的选择标记的编码序列包括但不限于编码赋予对抗生素、抗代谢物或除草剂(包括但不限于卡那審素、潮審素、链霉素、膦丝菌素、庆大霉素、氨甲喋呤、草甘辨和磺酰脲类除草剂)的抗性的基因产物的序列,包括但不限于编码酶例如新霉素磷酸转移酶II(NPTII)、氯霉素乙跣转移酶(CAT)和潮霉素磷酸转移酶I(HPT,HYG)的编码序列.46可使用许多种植物表达系统表达编码序列或其功能等同物.特定的植物物种可选自任何双子叶、单子叶物种、裸子植物、低等维管束植物或无维管植物,包括任何谷类农作物或其他农业上重要的农作物。此类植物包括,但不限于,苜蓿、拟南芥、小麦、甘蔗、珍珠粟(pearlmillet)、髙粱、大麦、巻心茱、胡萝卜、芽菜、玉米、棉花、黄瓜、亚麻、莴苣、油菜、梨、豌豆、牵牛花、白杨、马铃薯、稻谷、甜菜、向日葵、烟草、番茄、小麦和白三叶草.借以转化或转染植物的方法对于本领域技术人员来说是熟知的.参见,例如,PlantBiotechnology:1989,Kung&Arntzen,eds.,ButterworthPublishers,ch.1,2。可有效用于本发明的转化方法的实例包括但不限于土壤杆菌介导的叶盘或其他植物组织的转化、DNA直接至植物细胞内的显微注射、DM至植物细胞原生质体内的电穿孔、脂质体或质体融合、微粒轰击和使用合适的基因工程改造的植物病毒进行的植物细胞或组织的转染.实施本发明所必需的植物组织培养方法对于本领域技术人员来说是熟知的,参见,例如,Dixon,1985,PlantCellCulture:APracticalApproach,IRLPress.可有效用于实施本发明的组织培养方法包括植物原生质体和细胞悬浮液的产生和培养、叶盘或其他植物组织在包含经基因工种改造的转染剂林系(例如土壤杆菌或植物病毒林系)的培养基上的无菌培养增殖以及从原生质体、细胞悬浮液和愈伤组织再生整个转化的植物.通过用包含表达构建体(包含序列的编码序列)的转化栽体转化或转染植物或植物细胞,然后选择表达该序列的转化子或转染子来实施本发明.可通过本领域技术人员熟知的技术选择转化的或转染的植物细胞,所述技术包括但不限于检测报告基因产物或基于上文中描述的选择标记中的一种的存在来进行选择.然后培养转化的或转染的植物细胞或組织,从其再生整个植物.可使用标准技术例如使用Southern杂交分析、PCR分析(包括逆转录酶PCR(RT-PCR))或对预期的蛋白质产物的免疫学测定来确认编码序列在植物基因组中的整合和保持.当所述植物转化子或转染子被鉴定后,本发明的非限定性实施方案包括克隆表达和将该转化子或转染子用于序列的产生.47可用于表达构建体的调控元件包括对于植物细胞可以是异源的或同源的启动子。启动子可以是能够驱动植物细胞和植物中的连锁序列的高水平转录的植物启动子或非植物启动子.可有效用于实施本发明的植物启动子的非限定性例子包括花椰菜花叶病毒(CaMV)19S或35S、rbcS、叶绿素a/b结合蛋白、Adhl、N0S和HMG2的启动子或其修饰物或衍生物,启动子可以是組成型的或诱导型的.例如,非限制性地,诱导型启动子可以是在植物、植物组织或植物细胞的机械基因激活(mechanicalgeneactivation)(MGA)后启动本发明的多核普酸的表达或增加的表达的启动子.这样的MGA诱导型植物启动子的实例是MeGA.可按照本领域技术人员已知的方法额外地修饰表达栽体以增强或最优化异源基因在植物或植物细胞中的表达,所述修饰包括但不限于突变DNA调控元件以增加启动子的强度或改变编码序列本身.其他修饰包括缺失内含子序列或来自编码序列的5'和/或3'末端的过剩非编码序列,从而通过使信使失稳序列减少至最小或消除来使对蛋白质表达的序列或距离相关性负效应减少至最低.还可按照本领域技术人员已知的方法加入、除去或修饰肽信号序靶向来修饰表达构建体.例如,但不限于,可对表达构建体进行特定基因工程改造来将多肽靶向分泌或液泡定位(vacuolarlocalization)或保留在内质网(ER).本发明还包括能够选择性结合本发明的EG9703或EG8798多肽的至少部分或其模拟表位的分离的抗体.重組细胞和转基因植物的特征和合适的方法描述于WO03/062382,本发明还包括包含编码EG8798或EG9703多舦的至少部分的异源DNA的植物细胞.此类多肽能够改变植物的产量.例如,最优选多肽能够增加植物的产量,较不优逸多肽能够减少植物的产量.植物细胞包含本说明书中其他地方描述的本发明的多肽.此外,本发明包括包含上迷转基因植物细胞的转基因植物的繁殖材料.本发明还包括包含异源DNA的转基因植物,所述异源DNA编码在植物组织中表达的EG8798或EG9703多肽,所述多肽能够改变植物的产量。转基因植物包括本说明书中其他地方描述的本发明的多肽.本发明还包括包含分离的多核苷酸,所述多核苷酸包含与编码植物组织中的EG8798或EG9703多肽的至少部分的多核苷酸有效连接的启动子.所述多肽能够改变植物的产量.转基因植物包含本说明书中其他地方描述的本发明的多肽。所述多核苷酸可以是重组多核苷酸,和可以包含任何启动子包括对于EG8798或EG9703基因是天然的启动子。本发明还包括转染的宿主细胞,所述宿主细胞包括用构建体转染的宿主细胞,所述构建体包含与编码报告蛋白的多核苷酸有效连接的来自EG8798或EG9703多核苷酸的启动子、增强子或内含子多核苷酸或任何組合。所述构建体能够改变植物的产量.转染的宿主细胞包括本说明书中其他地方描述的本发明的多肽.本发明还包括重组载体,所述栽体包含插入能够将多核苷酸递送入宿主细胞的任何载体的至少一种本发明的植物EG9703或EG8798多核苷酸的至少部分.在WO03/062382中描述了重组分子的特征和合适的方法.包含在本发明的重组表达栽体内的合适的多核苷酸是此处公开的合适的植物EG9703或EG8798多核普酸本身的多核苷酸.包含在重组栽体中,特别是本发明的重组分子中的多核苷酸包括本发明的EG9703和EG8798多核苷酸。如此处所用的,严紧杂交条件是指这样的标准杂交条件,即在该杂交条件下使用多核苷酸包括寡核苷酸鉴定具有相似核酸序列的分子,在夯ij如Sambrook等人,MolecularCloning:ALaboratoryManual,ColdSpringHarborLabsPress,1989中公开了这样的标准条件.在本申请的实施例部分提供所述条件的实例.如此处所用的,来自植物的特定物种的EG9703或EG8798基因包括涉及天然的EG9703或EG8798基因的所有核酸序列,例如控制由该基因编码的EG9703或EG8798多肽的产生的调控区(例如但不限于转录、翻译或翻译后控制区)以及编码序列本身.在一个实施方案中,EG9703或EG8798基因包含多核苷酸序列例如SEQIDNO:l、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SBQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和对上述SEQIDNO中任一序列至少大约70%的序列同一性的多核苷酸的至少部分.在另一个实施方案中,EG9703或EG8798基因可以是包含与本发明的EG9703或EG8798相似但不相同的序列的等位基因变体,可以是基于与包括本发明的EG9703或EG8798基因的基因基本上相同的基因座上的基因,但是由于例如突变或重组导致的天然变异的原因,其具有相似但不相同的序列.因为基因组可进行重排,所以等位基因的物理排列并不总是相同.等位基因变体通常编码具有与由基因(所述基因是与所迷等位基因变体进行比较的基因)编码的多肽相似的活性的多肽.等位基因变体还可包含基因的5'或3'非翻译区(例如,在调控区)的变化。等位基因变体对于本领域技术人员来说是熟知的并且预期在给定的栽培种或品系中发现,因为基因组是多倍体和/或在群体中包含2个或更多个栽培种或品系.等位基因可定义为与第二EG8798或EG9703多核苷酸序列相比具有至少一个核苷酸变化的EG8798或EG9703多核苷酸序列.同样,用于编码本发明的EG9703或EG8798多肽同源物的多核苷酸的最小大小为长度大约12至大约18个.除了实践的限制外,对所述多核苷酸的最大大小没有限制,因为多核苷酸可包含基因的部分、整个基因或多个1^因或其部分.类似地,本发明的EG9703或EG879850多肽同源物的最小大小为长度大约4至大约6个氨基酸,想要的大小依赖于所述多肽的全长多肽、融合体、多价体或功能性部分是否是想要的。在一些实施方案中,多肽长度至少为30个氨基酸.如此处所用的,EG9703或EG8798基因包括涉及天然EG9703或EG8798基因的所有核酸序列例如控制由基因编码的EG9703或EG8798多肽的产生的调控区(例如但不限于,转录、翻译或翻译后控制区)以及编码区本身。在一个实施方案中,EG9703或EG8798基因包括本发明的EG9703或EG8798多核苷酸.在另一个实施方案中,玉米EG9703但不相同的等位基因变体.如此处所用的,EG9703或EG8798基因包括涉及天然EG9703或EG8798基因的所有核酸序列,例如控制由基因编码的EG9703或BG8798多肽的产生的调控区(例如但不限于,转录、翻译或翻译后控制区)以及编码区本身.EG9703或EG8798基因可以优选包含本发明的EG9703或EG8798多核苷酸.在检查其的下列不希望受限定的实施方案后,本发明的另外的目的、有利方面和新特性对本领域技术人员来说变得更显然.实施例1.EG9703的发现从普通野生稻组织的mRNA的组织制备cDNA文库,^f吏用Amersham4000测序系统以高通量方式测定随机cDNA的序列.将来自该测序努力的EST对公共可获得的数据库例如GenBank中的稻谷DNA序列进行BLASTed.进行在美国专利6,274,319中更详尽描述的使用Ka/Ks分析的配对比较.发现一个同源对,普通野生稻EST克隆编号9703和已知的数据库中的稻谷,具有为1.5的Ka/Ks比率,表明为正选择.相应于普通野生稻克隆编号BG9703的多核苷酸编码序列是核酸序列SEQIDNO:1,称为普通野生稻EG9703多核苷酸,也称为BG9703的祖先等位基因.同源物稻谷多核苷酸的多核苷酸编码序列是核酸序列SEQIDNO:2,称为稻谷多核苷酸,也在下面的实施方案中和本申请的其他地方称为EG9703的衍生的等位基因或培育的等位基因.预测的由SEQIDN0:1编码的多肽序列是多肽SEQIDNO:3,同源性稻谷多肽是多肽SEQIDNO:6.GenBank中发现的部分玉米EST显示为SBQIDNO:41。实施例2.EG8798的发现。鉴定为实施例1中描述的正选择的另一个同源序列对是普通野生稻EST克隆编号8798和已知的数据库中的稻谷,发现其具有为3.7的Ka/Ks比率.相应于普通野生稻克隆编号8798的部分基因的多核苷酸编码序列是核酸序列SEQIDNO:7,称为普通野生稻EG8798多核苷酸,也在下面的实施例中称为祖先等位基因.编码序列发现为SEQIDNO:8,相应的多肽为SEQIDNO:9,同源稻谷多核苷酸的多核苷酸编码序列是核酸序列SEQIDNO:10,称为水稻EG8798多核苷酸,也在下面的实施方案中和本申请的其他地方称为衍生的等位基因或培育的等位基因.相应于SEQIDNO:10的编码序列是SEQIDNO:11,相应的肽是多肽SEQIDNO:12.实施例3.进行BLAST以鉴定另外的同源物。将普通野生稻和稻谷的EG8798多核苷酸用于进一步的BLASTGenBank以鉴定其他植物中的同源基因.通过该方法,鉴定了普通小麦EG8798基因、栽培大麦(AEG8798基因、高粱EG8798基因、甘蔗EG8798基因和珍珠栗EG8798基因.实施例4.确定稻谷品系和杂种中的EG9703和EG8798的基因型和统计分析从稻谷品系和杂种PCR扩增EG9703和EG8798多核苷酸,确定其核酸序列.通常,发现高产品系和杂种具有EG9703的衍生等位基因,发现低产品系和杂种具有EG9703的祖先等位基因.发现被分析的所有品系和杂种具有EG8798的衍生的等位基因,表明该等位基因已固定在稻谷的培育的品系和杂种中.亊实上,除了普通野生稻外我们发现具有祖先等位基因的唯一的稻谷品种是非洲栽培稻(0.Wa6e/r/鹏),该品种是在非洲培育的,独立于基于亚洲水稻培育的。实施例5.统计学计算我们计算R2,通过就线路效应(lineeffect)修正的单因素添加模型解释的变异的比例。对于主要的正效应,112对于产量在60%的范围内变化,对于高度在46%的范围内变化,对于倒伏在37%的范围内变化,对于整粒在45%的范围内变化,对于脱壳粒重在34%的范围内变化,对于宽度在18%的范围内变化,对于ASV在30%(碱性扩散值,当与%直链淀粉酶组合时,产生淀粉指数)和对于白垩在22%的范围内变化。这提供证据^^7W确实影响产量,即其是所谓的"产量"基因。实施例6.小麦、大麦、高粱、珍珠粟和甘蔗中EG8798的鉴定使用水稻EG8798序列通过BLAST在GenBank中搜索小麦、大麦、高粱和甘蔗基因组序列鉴定了表现为同源的至少7个小麦EST(包括目录号CA742308、AL827514、CV762022、CA655855、CA689037、CA681856和CA734626)、几个大麦EST(包括目录号CD057439、BI950276、CA007363和BE216284)、6个高粱EST(包括目录号CF431925、BM323835、BG605827、CD428819、C429277和BG412520)、一个珍珠粟EST(目录号CD725289)和5个甘蔗EST(目录号CA268008、CA181888、CA281730、CA264659和CA275998)。通过标准方法设计允许成功扩增小麦、大麦、高梁和甘蔗同源物的引物。小麦、大麦、高粱和甘蔗和玉米同源物的序列提供为SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDNO:41。现代面包小麦(Modernbreadwheat)是由3个基因组组成六倍体,因此可检测到多于1个的EG8798表达拷贝。实施例7.表达特征通过使用RTPCR,我们在来自在生长过程中22个时间点上采集的稻谷植物的叶子样品中测量了相应于EG9703、EG8798、EG307和EG1117的mRNA水平。图1显示许多正性状例如产量、高度、倒伏、整粒(wholemill)、粒重、ASV、直链淀粉酶、白垩、宽度、开花期、L/W与EG9703和EG8798相关。图2显示在这些基因的表达在生长的圆锥花序初始期期间协同增加,此时谷粒正在形成。图2.4个正选择的基因的表达特征。在图2中,x轴代表植物生长期(丫=营养期,PI-圆锥花序初始期或生殖期)。y轴代表相对表达水平。这4个正选择的基因的表达在生殖期期间最高,此时谷粒正在形成。该发现与这些基因在统计学上与谷粒产量相关以及它们是产量基因相符。实施例8.确定稻谷品系和杂种中的EG9703和EG8798的基因型和统计学分析从稻谷品系和杂种对EG9703和EG8798多核苷酸进行PCR扩增,确定其核酸序列。通常,发现高产品系和杂种具有EG9703的衍生等位基因,发现低产品系和杂交具有EG9703的祖先等位基因。发现被分析的所有品系和杂种具有EG8798的衍生等位基因,表明该等位基因已固定在稻谷的培育的品系和杂种中。事实上,除了普通野生稻外,我们发现具有祖先等位基因的的唯一稻谷品种是非洲栽培稻,其是在非洲培育的,独立于基于亚洲的稻谷培育的。数据显示于表II中。下列缩写用于表II:Sdwtplot种子重量/plotpltcount植物计数(plantcount)Wtfilsd饱满种子的重量Panclp圆锥花序/植物Til,分蘖数/植物Paneltil圆锥花序/分蘖Wtsd种子重量Fillsd饱满种子的%sdwtlOOOiooo粒种子重量Totsd总种子Pctsd种子计数/圆锥花序Plength圆锥花序长度sdlOOOdh1000粒种子重量(脱粒的)height植物高度adjyield调整的产量totwgt总重量tomilyld总的粒产量wmilyld整粒产量ERGT是指稻谷品系名称。实施例9.确认产量候选基因的有效性稻谷中的关联分析。(重复的田间试验)如W003/062382的实施例17中所描述的,关联分析包括测定大量详尽表征的稻谷品系中的各候选基因的序列以了解基因的某些等位基因是否与表型性状相关。在104个稻谷品系中确定4个基因EG307、EG1117、EG9703和EG8798的基因型。所有104个稻谷品系和杂种以一式三份重复在一个生长季节种植在一块田中,经历相同的天气和生长条件。机械化收割植物。通过标准的统计学方法计算^值以确定各基因的特定等位基因与性状的相关性。数据示于表II中。实施例10.使用基因型作为标记以进行标记辅助育种55在杂交中,使用当地品种(landrace)品系以试图将更好的抗旱性或抗虫性引入优良杂种(elitehybrid),但不损失产量,篩选来自所述杂交的秧苗,只选择包含EG8798或EG9703的最佳等位基因的秧苗。在低产近交系和高产近交系的杂交中,筛选来自该杂交的秧苗并且只选择包含EG8798、EG9703的最佳等位基因的秧苗。表II<table>tableseeoriginaldocumentpage57</column></row><table><table>tableseeoriginaldocumentpage58</column></row><table><table>tableseeoriginaldocumentpage59</column></row><table><table>tableseeoriginaldocumentpage60</column></row><table><table>tableseeoriginaldocumentpage61</column></row><table><table>tableseeoriginaldocumentpage62</column></row><table><table>tableseeoriginaldocumentpage63</column></row><table><table>tableseeoriginaldocumentpage64</column></row><table><table>tableseeoriginaldocumentpage65</column></row><table>输入#白垩开花期:高度倒伏产量总的粒*,整粒9,00083,60095.200o,ooo8877.0000,625EGRT-2012,00083,50D86,900o,ooo日5B2,0310,632EGRT-212-66*776,667104.333o,ooo10218.3330,70B0,630EGRT-220,0008C,667103,0000,0008421,3330,7080,633EGRT-236,40090,00096,8570.0007501.B750-5S8EGRT"24EGRT-25EGRT-260.00078-66783*3330,0008009*3330,7050,6S7EGHT-27EGRT-28EGRT-2S28.00076,25090,000o,ooo852CK2S00.7050.566EGRT-30EGRT-3159.00088,333105,00063,0008209,7500.S390.457EGRT-322,6€7100-6670.00010931,3330,SB90*559EGRT-3325,33376,333108.33375.0008634,OOO0,7050*576EGRT-34is,ooo82.667116.33330.0007921,0000JO60-622EGRT-350.000S4,5€739-333O,OOO10094,000(KS800.635EGRT-36B0,S6710S.667o,ooo10387,6670,7150-57066<table>tableseeoriginaldocumentpage67</column></row><table>67输入#>白垩开花期高度.倒伏,产量'总的粒,整粒EGRT-554*OO073,66778*33312.0004266,6670-6"0,51760.SOOBS,OOO84,5000*0000,6150,"7EGRT-57",42985,S0074,0000,0005337-S450,576"76,20t)*70,&00o,ooo5109,45S0,7100,594EGRT-599*33373-66731,5007702,6670,590EC5RT-603"8682,6S77B-8330.0000-S97O,SOlEGRT-61103,00336,481S020,7140,6730.521EGRT-621S*S1276-617113,SSS13,B759654,3650-527EGRT-63lfl*73882,424104,7773,3123S64,B300.70S0,572EGRT-6420*26782,643107,50010,154115S1*7BSo,*m0.583EGRT-6527,93885*03110S,2673*41510842,8840.554EGRT-6615,12273,5737,1028310,7920,6340.5861B-"484,2524,27610585,右060,7020.60368输々#白垩开花期高度.倒伏总的粒整粒;EGRT-6817.63480.003101.3803,74010482*2860.6940,547EGRT-S9EGRT-7022,13776-578103,3598,39610"5,47Q0,6950,560EGRT-7118,13180,042107.8613,2161065B,43S0,7110.601EGRT-723,808100,4664,4087SS1,0470*6790.580EGRT-73EGRT-74EGRT-75EGRT-76EGRT-7715,13379.543110,25911380.0230*7090-609EGRT-7B69<table>tableseeoriginaldocumentpage70</column></row><table>输入#1白垩开花期高度倒伏产量总的粒,整粒.EGRT、30EGRT-31EGRT-$5EGRT-S6EGRT-S7EGRT-9BEGRT-9SEGRT-10071<table>tableseeoriginaldocumentpage72</column></row><table>权利要求1.用于鉴定与植物的产量相关的多核苷酸序列的方法,其包括步骤a)将植物多核苷酸序列的至少部分与至少一个包含选自EG8798多核苷酸序列和EG9703多核苷酸序列的多核苷酸的至少部分的多核苷酸进行比较;和b)鉴定植物中的至少一个多核苷酸序列,所述多核苷酸序列与包含选自EG8798多核苷酸序列和EG9703多核苷酸序列的多核苷酸的至少部分的多核苷酸相比,具有至少一个核苷酸变化,其中所述鉴定的多核苷酸序列与植物的产量相关。2.权利要求1的方法,其中EG8798多核苷酸序列和EG9703多核苷酸序列选自a)SEQIDNO:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41和b)具有对a)中的多核苷酸序列至少大约70%的序列同一性的多核苷酸.3.权利要求l的方法,其中植物多核苷酸序列是基因组DNA。4.权利要求l的方法,其中植物多核苷酸序列是cDNA,5.权利要求1的方法,其中EG9703或EG8798多核苷酸序列与植物的增加的产量相关.6.权利要求5的方法,其中所迷增加的产量是相对于来自相同属的具有第二EG9703或EG8798多核苷酸序列的第二植物的增加的产量,所述笫二EG9703或EG8798多核苷酸序列与来自植物的EG9703或EG8798多核苷酸序列相比具有至少一个核苷酸变化,7.权利要求l的方法,其中植物选自玉蜀黍(Zeamaysmays)、水稻(Oryzasativa)、普通小麦(Triticumaestivum)、大麦(Hordeumvulgare)、甘蘼(Saccharumofficinarum)、两色蜀黍(Sorghumbicolor)和珍珠栗(Pennisetumtyphoides),8.权利要求l的方法,其中植物选自培育的植物的野生型祖先植物,所述培育的植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠栗.9.权利要求8的方法,其中植物是普通野生稻(Oryzarufipogon)。10.—种分离的多核苷酸,其选自a)包含选自SEQIDNO:1、SEQIDN0:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41的多核苷酸的至少部分的多核苷酸,和b)具有对a)的多核苷酸至少大约70%的同源性、并且赋予与a)的多核苷酸基本上相同的产量的多核苷酸.11.一种分离的多舦,其选自a)由包含选自SEQIDNO:1;SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDNO:41的多核苷酸的至少部分的多核苷酸编码的多肽;b)由具有对a)中的多核苷酸的至少部分至少大约70%的序列同一性、并且赋予与a)的多核苷酸基本上相同的产量的多核苷酸编码的多肽;c)包含选自SEQIDNO:3、SEQIDNO:6、SEQIDNO:9和SEQIDNO:12的多肽的至少部分的多肽;和d)包含具有对c)的多肽至少大约75%的序列同一性的多肽的至少部分并且赋予与c)的多肽基本上相同的产量的多肽.12.植物细胞,其包含编码EG8798或EG9703多肽的异源DNA,其中所述多肽能够增加植物的产量,其中所述多肽选自a)包含由选自SEQIDNO:1;SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDNO:41的多核苷酸编码的多肽的至少部分的多肽;b)由具有对a)中的多核苷酸的至少部分至少大约70%的序列同一性的多核苷酸编码的多肽;c)包含选自SEQIDNO:3、SEQIDNO:6、SEQIDNO:9和SEQIDNO:12的多肽的至少部分的多肽;和d)包含具有对c)的多肽的至少部分至少大约75%的序列同一性的多肽的多肽.13.包含权利要求12的转基因植物细胞的转基因植物的繁殖材料。14.包含编码在植物组织中表达的EG8798或EG9703多肽的异源DNA的转基因植物,其中所述多核苷酸能够增加植物的产量,其中所述多肽选自;a)包含由选自SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDNO:41的多核苷酸编码的多肽的至少部分的多肽;b)由具有对a)中的多核苷酸的至少部分至少大约70%的序列同一性的多核苷酸编码的多肽;c)包含选自SEQIDNO:3、SEQIDNO:6、SEQIDNO:9和SEQIDNO:12的多肽的至少部分的多肽;和d)包舍具有对c)的多肽的至少部分至少大约75%的序列同一性的多肽的多肽.15.包含与编码植物組织中的EG8798或EG9703基因的多核苷酸有效连接的启动子的分离的多核苷酸,其中所述多核苷酸能够增加植物的产量,其中所述多核苷酸选自a)包含选自SEQIDNO:1;SEQIDNO:2;SEQIDNO:4;SEQIDNO:5;SEQIDNO:7;SEQIDNO:8;SEQIDNO:10;SBQIDNO:11;SEQIDNO:13;SEQIDNO:14;SEQIDNO:15;SEQIDNO:16;SEQIDNO:17;SEQIDNO:18;SEQIDNO:19;SEQIDNO:20;SEQIDNO:21;SEQIDNO:22;SEQIDNO:23;SEQIDNO:24;SEQIDNO:25;SEQIDNO:26;SEQIDNO:27;SEQIDNO:28;SEQIDNO:29;SEQIDNO:30;SEQIDNO:31;SEQIDNO:32;SEQIDNO:33;SEQIDNO:34;SEQIDNO:35;SEQIDNO:36;SEQIDNO:37;SEQIDNO:38;SEQIDNO:39;SEQIDNO:40;SEQIDNO:41的多核苷酸的至少部分的多核苷酸;和b)具有对a)中的多核苷酸的至少部分至少大约70%的序列一致性的多核苷酸。16.权利要求15的分离的多核苷酸,其中所述多核苷酸是重组多核普酸。17.权利要求16的多核苷酸,其进一步包含对于EG8798或EG9703基因是天然的启动子.18.转染的宿主细胞,其包括用构建体转染的宿主细胞,所述构建体包含与编码报告蛋白的多核苷酸有效连接的、来自EG8798或EG9703多核苷酸的启动子、增强子或内含子多核苷酸或其任何组合,其中所述EG8798和EG9703多核苷酸能够增加植物的产量,其中所述EG8798或EG9703多核苷酸选自a)包含选自SBQIDNO:l、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5、SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41的多核苷酸的至少部分的多核苷酸,和b)具有对a)中的多核苷酸的至少部分至少大约70%的序列同一性的多核苷酸.19.确定植物是否具有包含EG8798序列的特定多核苷酸序列的方法,其包括步骤a)将所述植物的多核苷酸序列的至少部分与包含选自下列序列的多核苷酸的多核苷酸比较,所述下列序列是(i)包含选自SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SBQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40和SEQIDNO:41的多核苷酸的至少部分的多核苷酸;和(ii)包含具有对(i)的多核苷酸的至少部分至少大约70%的序列同一性的多核苷酸并且赋予与(i)的多核苷酸基本上相同的产量的多核苷酸,其中一种或更多种a)的多核苷酸是特定的多核苷酸;和b)鉴定植物是否包含特定的多核苷酸。20.权利要求19的方法,其中植物多核苷酸序列是基因组DNA.21.权利要求19的方法,其中植物多核苷酸序列是cDNA,22.权利要求19的方法,其中EG8798多核苷酸序列与植物的增加的产量相关.23.权利要求22的方法,其中所述增加的产量是相对于来自相同属的具有笫二EG8798多核苷酸序列的第二植物的增加的产量,所述第二EG8798多核苷酸序列与来自植物的EG8798多核苷酸序列相比具有至少一个核苷酸变化.24.权利要求22的方法,其中植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟.25.权利要求23的方法,其中第二植物选自培育的植物的野生型祖先植物,所述培育的植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟.26.确定植物是否具有包含EG9703序列的特定多核苷酸序列的方法,其包括步猓a)将所述植物的多肽编码核苷酸序列的至少大约部分与选自下列序列的多核苷酸序列比较以获得特定的多核苷酸序列,所述下列序列是(i)包含选自SEQIDN0:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5的多核苷酸的至少部分的多核苷酸;和(ii)具有对(i)的多核苷酸的至少部分至少大约70。/。的序列同一性并且赋予与(i)的多核苷酸基本上相同的产量的多核苷酸;和b)鉴定植物是否包含特定的多核苷酸。27.权利要求26的方法,其中植物多核苷酸序列是基因组DM。28.权利要求26的方法,其中植物多核苷酸序列是cDNA。29.权利要求26的方法,其中EG9703多核苷酸序列与植物的增加的产量相关.30.权利要求29的方法,其中所述增加的产量是相对于来自相同属的具有笫二EG9703多核苷酸序列的第二植物的增加的产量,所述第二EG9703多核苷酸与来自植物的EG9703多核苷酸序列相比具有至少一个核苷酸变化.31.权利要求26的方法,其中植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟。32.权利要求31的方法,其中笫二植物选自培育的植物的野生型祖先植物,所述培育的植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟。33.就特定的EG8798多核苷酸序列进行的植物的标记辅助育种的方法,其包括步猓a)对于至少一林植物,将所述植物的核苷酸序列的至少部分与特定的BG8798多核脊酸序列的至少部分比较,所述EG8798多核苷酸序列包含选自下列序列的多核苷酸序列(U选自SEQIDNO:7、SEQIDNO:8、SEQIDNO:10、SEQIDNO:11、SEQIDNO:13、SEQIDNO:14、SEQIDNO:15、SEQIDNO:16、SEQIDNO:17、SEQIDNO:18、SEQIDNO:19、SEQIDNO:20、SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24、SEQIDNO:25、SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41的多核苷酸,和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且赋予与(i)的多肽基本上相同的产量的多核苷酸;b)鉴定植物是否包含特定的多核苷酸序列;和c)培育包含特定的多核苷酸序列的植物以产生后代.34.权利要求33的方法,其中植物多核苷酸序列是基因组DNA。35.权利要求33的方法,其中植物多核苷酸序列是cDM.36.权利要求33的方法,其中EG8798多核苷酸序列与植物的增加的产量相关.37.权利要求36的方法,其中所述增加的产量是相对于来自相同属的具有笫二EG8798多核苷酸序列的第二植物的增加的产量,所述笫二EG8798多核苷酸序列与来自植物的EG8798多核苷酸序列相比具有至少一个核苷酸变化。38.权利要求33的方法,其中植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟.39.权利要求37的方法,其中第二植物选自培育的植物的野生型祖先植物,所述培育的植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟,40.针对特定的EG9703多核苷酸序列的植物的标记辅助育种的方法,其包括步骤a)对于至少一林植物,将所迷植物的核苷酸序列的至少部分与特定的EG9703多核苷酸序列的至少部分比较,所述EG9703多核苷酸序列选自(i)包含选自SEQIDNO:1、SEQIDNO:2、SEQIDNO:4、SEQIDNO:5的多核苷酸的多核苷酸;和(ii)具有对(i)的多核苷酸至少大约70%的序列同一性并且赋予与(i)的多肽基本上相同的产量的多核苷酸;b)鉴定植物是否包含特定的多核苷酸;和c)培育包含特定的多核苷酸序列的植物以产生后代.41.权利要求38的方法,其中植物多核苷酸序列是基因组DNA.42.权利要求38的方法,其中植物多核苷酸序列是cDM。43.权利要求38的方法,其中EG9703多核苷酸序列与植物的增加的产量相关.44.权利要求41的方法,其中所述增加的产量是相对于来自相同属的具有第二EG9703多核苷酸序列的笫二植物的增加的产量,所述第二EG9703多核苷酸与来自植物的EG9703多核苷酸序列相比具有至少一个核苷酸变化。45.权利要求38的方法,其中植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟.46.权利要求14的方法,其中第二植物选自培育的植物的野生型祖先植物,所述培育的植物选自玉蜀黍、水稻、普通小麦、大麦、甘蔗、两色蜀黍和珍珠粟。全文摘要本发明提供了用于鉴定可以与植物的商业相关性状相关的多核苷酸和多肽序列(特别地,所鉴定的稻谷、玉米、小麦、大麦、高粱和甘蔗的产量相关基因EG9703和EG8798的多核苷酸和多肽序列)的方法。所鉴定的序列用于增强培育的植物或野生型祖先植物的商业想要的性状、鉴定相关的多核苷酸序列、确定植物的基因型和标记辅助育种。所鉴定的序列还可用于产生异源DNA、转基因植物和转染的宿主细胞。文档编号C12N15/113GK101501192SQ200680040699公开日2009年8月5日申请日期2006年9月5日优先权日2005年9月2日发明者W·梅西尔申请人:进化基因组学公司