专利名称::序列指导的分子育种方法
技术领域:
:本发明属于植物育种领域。更具体而言,本发明涉及高通量测序技术在与种质改良有关的活动中的应用。
背景技术:
:植物育种的主要目的是选择一对最佳的亲本进行杂交,然后选择一个或多个该杂交产生的优良后代。在杂种作物中,第三个目的是鉴定测交系(tester)以形成高表现的杂种种子。传统的植物育种依赖于植物或品系的目视观察和表现数据,以作出满足上述目的之一的选择。最近几年,已经证明分子育种在改进育种方法和提高遗传获得率方面大有希望。在分子育种中,分子标记为亲本、后代或测交系的选择提供基础;该方法也可以与基于表型的选择结合使用。与仅基于表型数据获得的结果相比,在育种计划中包括遗传标记加速了有价值的性状的鉴定和向种质库中的积累。在此,“种质”包括育种种质、育种群体、优良近交系的集合、随机杂交个体的群体和双亲杂交体。为使分子育种有效,标记基因型的差异必须与一个或多个表型或表现性状可遗传地相关联。这些关联是通过将标记基因型与一种或多种性状分离的品系或群体进行关联而建立的。遗传标记等位基因(“等位基因”是一个基因座处的替代序列)用来鉴定在一个或多个基因座处含有希望的基因型并且预期将该希望的基因型与一种或多种性状的希望的表型一起转移给其后代的植物。与表型高度相关的标记推定与该性状遗传连锁,因此,该标记然后可以代替评价该性状本身,用作选择决定的基础。不相关的标记将独立于性状遗传,并且对于选择无用,但是在比较品种和品系之间的相似性和/或测量它们的遗传距离方面可能具有价值。理想地,该标记将代表负责性状的实际基因组变异,因此总是与性状分离,尽管相关性可能被诸如环境相互作用或上位效应等现象所掩蔽。最初用于分子育种的标记平台不需要预先知道相关序列。这些标记基于限制片段长度多态性(RFLP)。随机或定向DNA探针在Southern杂交方案中使用,用来鉴定其大小随一对限制酶识别位点的位置和之间的距离而不同的靶片段。大小上的这些差异可能与测试群体中的性状有关。DNA探针然后用作能够检测相关限制片段长度多态性的标记,随后又可用于预测相关的性状。曾经使用了其它类型的标记,它们需要预先知道相关序列,并且包括但不限于使用扩增片段长度多态性(AFLP)或通用PCR引物(即RICE引物)的指纹分析。最近几年,已经基于相关序列的知识开发了标记。例如,微卫星或简单序列重复(SSR)标记依靠PCR和凝胶电泳来阐明DNA重复序列长度的变化。如果目标重复片段与相关性状遗传连锁,这些标记所揭示的重复片段长度的差异可能与该性状有关。但是,传统的标记平台不是最佳的,因为它们不适合自动化或高通量技术。另外,传统的标记平台易获得假的标记_性状相关性,其中两个品系之间基因型的同一性可能不反映共同的亲本,而是反映趋同序列(convergentsequence),对于在多代中追踪特定标记等位基因来说,这是一个问题。可用作传统标记的其它类型的变异有单核苷酸多态性(SNP)。它们是在两个品系之间不同并且与遗传连锁的性状分离的单碱基变化。SNP可以通过多种商业上可获得的标记技术来检测。基于SNP的标记受到欢迎,因为其检测容易且精确、与信息系统兼容并且成本较低。但是,SNP标记仍然是查询相关序列的间接工具,并且SNP标记只限于检测两个等位基因,而不是可以在任意给定核苷酸位置处发现的四个可能的核苷酸。因此,本领域需要为了推动植物育种活动从至少一个植物基因组快速且精确地确定直接序列信息的方法,所述植物育种活动例如是品系开发、种质多样性分析、罕见等位基因挖掘、纯度测定、质量保证、特定基因组区域的渗入、基因组区域的堆积(stacking)、品系表现的预测以及杂种表现的预测。
发明内容本发明描述了利用高通量测序和分子育种方法以便能够在分子植物育种中使用直接测序信息的新方法。本发明还包括在序列测定之前选择性靶向特定基因座和DNA标签样品的手段。结合起来,本发明的方法能够为植物育种者提供用于亲本选择、后代选择、选择测交系组合、开发系谱、样品指纹分析、单元型多样性筛选、保证质量、评估种质多样性、检测育种进展、提供品种或品系说明和建立序列与性状和表现数据的关联数据库的更好的工具。这些数据库为计算一种或多种性状的核酸效应估计值提供了基础,其中可以从头进行关联或者通过梳理(leveraging)历史核酸序列-性状相关数据进行关联。本发明提供序列指导的选择(SDS)、序列指导的育种(SDB)和序列指导的指纹分析(SDF)的方法,及其在进行亲本选择、后代选择、测交系组合、等位基因变体渗入和至少两份种质、指纹、系谱之间至少一个变体的定向选择中以及在建立单元型和表型信息数据库中的新应用,该信息可用于计算核酸序列效应估计值,并最终可用于计算育种值。这种先验信息有助于为序列指导的预测育种(SDPB)所作的决定。在本发明中,育种选择在序列基础上直接进行,而不是在标记基础上间接进行,其中第一植物与第二植物杂交,该第二植物含有与第一植物的一种或多种序列不同的至少一种序列;通过检测第一植物的序列或序列组选择至少一个后代植物,其中该后代植物在其基因组中包含第一植物的一种或多种目标序列和第二植物的至少一种目标序列;并且在与种质改良有关的活动中使用该后代植物,与种质改良有关的活动在此被定义为包括使用植物进行品系和品种开发、杂种开发、转基因事件选择、进行育种杂交、通过自体受精测试和开发植物、纯化品系或亚系、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、以及使用植物或其部分进行诱变。本发明包括植物育种方法,该植物例如是玉米(Zeamays)、大豆(Glycinemax)、棉花(陆地棉(Gossypiumhirsutum))、花生(Arachishypogaea)、大麦(Hordeumvulgare);(Avenasativa);^(Dactylisglomerata);/JCfS(Oryzasativa,^括籼稻(indica)和粳稻(japonica)变种);高粱(双色高粱(Sorghumbicolor));甘蔗7(甘蔗属的种(Saccharumsp));高羊茅(Festucaarundinacea);草皮草物种(例如物种四季青(Agrostisstolonifera)、草地早熟禾(Poapratensis)、钝叶草(Stenotaphrumsecundatum));小麦(Triticumaestivum)、苜猜(Medicagosativa)、芸苔属的成员、花莲甘蓝、卷心菜、胡萝卜、花椰菜、大白菜、黄瓜、干豆、茄子、茴香、青刀豆、葫芦、韭菜、莴苣、甜瓜、秋葵、洋葱、豌豆、胡椒、南瓜、萝卜、菠菜、笋瓜(squash)、甜玉米、蕃茄、西瓜、观赏植物以及其它水果、蔬菜、块茎、油籽和块根农作物,其中油籽作物包括大豆、芸苔(Canola)、油菜、油棕、向日葵、橄榄、玉米、棉籽、花生、亚麻籽、红花和椰子,它们具有增强的性状,包括至少一种目的序列,进一步定义为赋予优选的性质,该性质选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状,其中所述性状可以是非转基因的或转基因的。在一个实施方案中,本发明涉及一种植物育种方法。该方法包括确定育种群体中至少一个或多个植物的基因组内的多个核酸的序列;将每个核酸序列与一个数值关联起来,其中该数值与一个或多个表型性状相关;和基于这种关联为一个或多个植物作出植物育种决定。在另一个实施方案中,本发明涉及一种植物育种方法。该方法包括提供包括一个或多个植物的育种群体,其中对该群体中每个植物的至少一个基因座处的至少一个核酸进行测序;利用历史标记_表型性状相关性确定基因座处核酸序列的核酸序列效应估计值;和基于对任意给定表型性状所确定的核酸序列效应估计值对核酸序列进行排序。然后利用排序作出植物育种决定。在另外一个实施方案中,本发明涉及一种植物育种方法。该方法包括建立定义育种群体基因组内的多个基因座的指纹图谱;将已知图谱位置的QTL等位基因与作图群体中的表型性状相关联;和测定该多个基因座内QTL等位基因和至少一个核酸序列的存在,以预测作图群体以外的群体中表型性状的表达。在另外一个实施方案中,本发明涉及一种标记辅助的育种方法。该方法包括提供包括至少两个植物的育种群体,以及将至少一个表型性状与该植物的基因组的基因座相关联,条件是该基因座被至少一个核酸序列限定。然后测定该群体中该基因座的至少一个核酸序列的存在,以预测该育种群体的后代植物中至少一个表型性状的表达。在另外一个实施方案中,本发明涉及一种选择用于育种计划的育种群体的方法。该方法包括提供至少两个不同的育种群体;为每个育种群体建立可达10厘摩的至少两个基因座的育种值数据库;对每个育种群体的等位基因的育种值进行排序;以及选择具有较高综合育种值的育种群体。下面在详述中更具体地描述了应用性的进一步的方面。应当理解,说明书和具体实施例只是用于说明目的,而非意在限制本公开内容的范围。图1是说明高通量核酸测序的分子方法的一般流程图。图2说明一种降低选择性消化产生的模板核酸的复杂性的方法。8图3说明一种转录组复杂性定向降低方法。图4说明一种通过扩增至少一个目标基因组区域定向降低复杂性的方法。图5说明一种通过等位基因特异性延伸/连接定向降低复杂性的方法,包括样品标记。图6说明一种使用通过连接附着到模板核酸上的DNA标签复合(multiplexing)样品的方法。图7说明一种使用通过PCR附着到模板核酸上的DNA标签复合样品的方法。图8显示高通量核酸测序的工作流程。图9说明一种为SNP和indel的序列指导的选择而制备样品的方法。图10是对于如实施例1所述对Fad3bSNP使用高通量测序进行的序列指导的选择,基因型分型结果的散布图。图11是对于如实施例1所述对Fad3cindel使用高通量测序进行的序列指导的选择,基因型分型结果的散布图。图12显示如实施例4所述利用等位基因特异性延伸/连接添加样品DNA标签的策略。图13显示如实施例4所述对96个大豆品种中的1536个SNP使用高通量测序技术进行指纹分析的成功率。发明详述此处提供的定义和方法定义了本发明,并对本领域技术人员实施本发明起到指导作用。除非特别说明,根据相关领域普通技术人员的常规使用来理解这些术语。分子生物学的常见术语的定义还可以参见Alberts等人,MolecularBiologyofTheCell,5thEdition,GarlandSciencePublishing,Inc.:NewYork,2007;Rieger等人,GlossaryofGenetics!ClassicalandMolecular,5thedition,Springer-Verlag:NewYork,1991;King等人,ADictionaryofGenetics,6thed,OxfordUniversityPress:NewYork,2002;和Lewin,GenesIX,OxfordUniversityPress:NewYork,2007。使用37CFR§1.822规定的DNA碱基命名法。“等位基因”是指在特定基因座处的替代序列;等位基因的长度可以短至1个核苷酸碱基。等位基因序列可表示为核酸序列或由该核酸序列编码的氨基酸序列。“基因座”是通常由参照点(pointofreference)发现的基因组序列上的位置;例如,作为基因或基因部分或基因间区域的短DNA序列。基因座可以指染色体上参照点处的核苷酸位置,如来自染色体末端的位置。特定基因组已知的基因座的有序排列被称为遗传图谱。特定基因座处DNA序列的变体被称为等位基因,基因座处的变异,即两个或多个等位基因,构成多态性。任何核酸序列的多态性位点可以通过比较两份或多份种质中一个或多个基因座处的核酸序列来确定。本文使用的“核酸序列”包括基因组内基因座处核苷酸的连续区域。此外,本文使用的“核酸序列”可以包括一个或多个单元型、一个或多个单元型的部分、一个或多个基因、一个或多个基因的部分、一个或多个QTL和一个或多个QTL的部分。另外,多个核酸序列可以包含一个或多个单元型、一个或多个单元型的部分、一个或多个基因、一个或多个基因的部分、一个或多个QTL和一个或多个QTL的部分。该序列可以直接或间接来源于DNA或RNA模板(即,从mRNA的逆转录获得的cDNA)。本文使用的“多态性”是指在一个或多个个体的群体中,在一个或多个基因座处存在核酸序列的一种或多种变异。这种变异可以包括但不限于一个或多个碱基改变、一个或多个核苷酸的插入或一个或多个核苷酸的缺失。多态性可能产生自核酸复制中的随机过程、通过诱变、移动基因组元件的结果、拷贝数变化以及可能在减数分裂的过程产生,例如不等交换、基因组复制以及染色体断裂和融合。这种变异可以是常见的,或者可能在群体中以低频率存在,前者在普通植物育种中具有更大的应用,后者可能与罕见的但是重要的表型变异相关。有用的多态性可以包括单核苷酸多态性(SNP)、DNA序列中的插入或缺失(Indel)、DNA序列的简单序列重复(SSR)、限制性片段长度多态性和标签SNP。遗传标记、基因、DNA衍生序列、单元型、RNA衍生序列、启动子、基因的5’非翻译区、基因的3’非翻译区、微RNA、siRNA,QTL、卫星标记、转基因、mRNA、dsmRNA、转录模式和甲基化模式可以包含多态性。此外,上述这些的存在、不存在或拷贝数的变化可以包含多态性。本文使用的“核酸效应估计值”是指反映与一个或多个表型性状的关联性的预测的核酸序列的效应估计值,其中所述关联可以从头进行或者通过梳理历史核酸序列_性状相关性数据来进行。本文使用的“育种值”是指基于核酸序列效应估计值和核酸序列频率值的计算值,也可以确定在相同基因座(即单元型窗口)处或在基因座(即单元型窗口)中特定核酸序列相对于其它核酸序列的育种值。换句话说,通过固定所述核酸序列确定群体平均值的变化。另外,在评价通过基因渗入或转基因事件置换基因组中的特定区域的效果时,育种值为比较特定核酸序列的置换效果提供基础。另外,在杂种作物中,核酸序列的育种值可以在用来产生杂种的测交系的核酸序列中进行计算。本文使用的“基因型”是个体植物中基因座处的实际核酸序列。不同于其中基因型包含单核苷酸的遗传标记如SNP,本发明鉴定的基因型是多个核苷酸,其中基因型长度取决于核酸序列长度。特别是,本领域已知的遗传标记分析(例如通过TaqMan的SNP检测)只检测两个等位基因。本发明的一个优点是能够同时直接查询任一个核苷酸位置处的全部4种核苷酸(腺嘌呤,A;胸腺嘧啶,T;胞嘧啶,C;和鸟嘌呤,G)。S卩,对于任一个碱基对位置,与遗传标记分析相比,使用直接核酸测序将获得两倍的信息。在确定两个品系是否共有来源相同的DNA时,这可能是非常重要的。使用SNP基因型,可以只估计一对替代核酸碱基是否存在于一个核苷酸基因座处。例如,可以查询两个品系在一个核苷酸基因座处是具有C还是T,以及发现一个品系具有C而另一个都不含。但是,不同于直接估计单核苷酸基因座处的序列,遗传标记分析不能区别失败的反应或在该基因座处是否存在替代碱基,如腺嘌呤或鸟嘌呤。因此,本发明通过观察该区域的核酸序列提供了关于给定区域是否来源相同的更大的确定性。本文使用的核酸序列可以包含1个或更多的核苷酸(例如2个或更多的核苷酸,25个或更多的核苷酸,250个或更多的核苷酸,1000个或更多的核苷酸,甚至20000个或更多的核苷酸)。在某些实施方案中,相邻的核酸序列片段可以在体外连接或者在计算机上(insilico)对齐,以获得更长的核酸序列。本文使用的来自两个或多个个体植物中每一个的相同基因组区域(可能与一个或多个表型性状值相关或可能不相关)的核酸序列为与种质改良活动有关的决定提供了基础,其中可以评估一个或多个基因座。知道基因座处的两个序列是否完全相同或者它们是否含有相同和不同基因座的组合可以帮助确定该基因座是否具有相同的性状值并且与相同的性状连锁或者来源相同。因此,在另一方面,与表型性状值相关的来自一个或多个个体植物的一个或多个核酸序列可以为与种质改良活动有关的决定提供基础。本文使用的术语“单元型”是指单元型窗口内的染色体区域。典型地,每个单元型窗口中独特的标记指纹组合定义和区别该窗口的各个单元型。本文使用的单元型由“单元型窗口”内一个或多个基因座处的一个或多个核酸序列限定和区别。本文使用的术语“单元型窗口”是指通过本领域技术人员所知的统计分析建立的、处于连锁不平衡的染色体区域。在本领域中,两个近交个体(或两个配子)之间在位于该区域内的一个或多个分子标记基因座处的状态同一性作为整个区域的来源同一性的证据,其中每个单元型窗口包括至少一个多态性分子标记。本文使用的单元型窗口由两个或多个核酸序列基因型定义。单元型窗口可以沿基因组中的每个染色体定位,并且不一定需要是连续的。单元型窗口本身不是固定的,并且如果核酸序列信息量不断增加,本发明预期单元型窗口的数目和大小将会发展,即窗口数目增加而其相应大小减小,从而导致在基因型状态同一性的基础上确定来源同一性的置信度不断增大。单元型窗口可用于绘制目的核酸序列,因为这些基因组区域倾向于作为连锁域(linkageblock)遗传,因此对于相关性作图和多代追踪提供信息。本文使用的“表型”是指细胞或生物体的可受基因型影响的可检测的特征。本文使用的“标记”是指可以用来区别生物体的可检测的特征。这些特征的例子可以包括遗传标记、蛋白质组成、蛋白质水平、油组成、油水平、碳水化合物组成、碳水化合物水平、脂肪酸组成、脂肪酸水平、氨基酸组成、氨基酸水平、生物聚合物、药物、淀粉组成、淀粉水平、可发酵的淀粉、发酵产率、发酵效率、能量产率、次级化合物、代谢物、形态特征和农学特征。本文使用的“遗传标记”是指多态性核酸序列或核酸特征。本文使用的“标记分析”是指使用特定方法检测特定基因座处的多态性的方法,例如检测至少一个表型(如种子颜色、花颜色或者其它可目视检测的性状)、限制性片段长度多态性(RFLP)、单碱基延伸、电泳、序列比对、等位基因特异性寡核苷酸杂交(ASO)、随机扩增多态性DNA(RAPD)、基于微阵列的技术和核酸测序技术等。本文使用的“共有序列”是指构建的DNA序列,其确定基因座处等位基因中的单核苷酸和Indel多态性。共有序列可以基于基因座处DNA的任一链,并且表示基因座中的各SNP中任一个的核苷酸碱基及基因座中的所有Indel的核苷酸碱基。因此,虽然共有序列可能不是一个实际的DNA序列的拷贝,但共有序列可用于精确设计用于基因座中的实际多态性的引物和探针。本文使用的“连锁”是指杂交中产生配子类型的相对频率。例如,如果基因座A具有基因“A”或“a”,基因座B具有基因“B”或“b”,具有AABB的亲本I与具有aabb的亲本B之间的杂交将产生4种可能的配子,其中基因分离为AB、Ab、aB和ab。空预期是会独立相等地分离成4个可能的基因型中的每一个,S卩,如果没有连锁,每个基因型将会有1/4的配子。配子向基因型的分离不同于1/4是由于连锁。本文使用的“连锁不平衡”在一代的许多个体的群体中配子类型的相对频率的文字环境中定义。如果等位基因A的频率是p,a是ρ',B是q,b是q',那么基因型AB的预期频率(没有连锁不平衡)是pq,Ab是pq’,aB是p’q,ab是p’q’。相对于预期频率的任何偏差被称为连锁不平衡。当两个基因座处于连锁不平衡时,它们被称为是“遗传连锁的”。本文使用的“数量性状基因座(QTL)”是指控制通常连续分布的在一定程度上可用数值表示的性状的基因座。本文使用的“复杂性降低”是指降低核酸样品的复杂性的方法,例如通过限制酶消化、逆转录、通过PCR方法的靶向扩增、或通过PCR方法的随机扩增。复杂性降低可以对总基因组核酸或其亚组进行。在一个优选方面,将采用具有可重复结果的方法。复杂性降低方法包括在WO06/137734,WO06/137733和EP0534858中,它们特别在此全文引用作为参考。本文使用的“DNA标签”是指用作核酸样品标识物的短DNA区段。DNA标签也被称为分子条码,其长度可以从大约2个到大约20个碱基对不等,并且可以在模板核酸样品的复杂性降低过程中添加。例如,DNA标签组可以在美国专利7,157,564中获得。标签可以通过如EP1724348所述的测序或微阵列方法鉴定。在其它实施方案中,例如在寡核苷酸质量标签的情况下,使用质谱法区分标签(Zhang等人PNAS2007104:3061-3066)。此外,如美国专利申请2007/0054288所述,已经开发了用于通过其它成像平台检测的分子条码,这些成像平台包括表面等离子体共振、荧光或拉曼光谱法。在另外一个实施方案中,使用了RNA或蛋白质的掺入(spike-in)标签,它们与靶样品的分子不同,并且为了样品鉴别目的与多种样品共分析,样品鉴别方法包括在WO03/052101中。在本发明的一个优选实施方案中,通过在性状基因座测序之前或之后立即测序来估计标签的身份。这样,标签的序列偶联到基因座的序列上,并且可以用来保持基因座序列和样品来源之间的连锁。在另外一个实施方案中,标签可以是组合的或分级的。例如,标签的一部分可以指示多种核酸来源于同一样品,而该标签的另一部分可以指示核酸来源于不同的亚样品。分级水平的数量或标签的组合只受测序量的限制,测序可以用于DNA标签对比性状基因座。本文使用的“标记样品,,是指相同的标签已经连接到样品中的每个个体核酸上的核酸样品。本文使用的标记样品包括用分级或组合标签标记的样品,其中至少该标签的一部分是相同的,并且连接到样品中的每个核酸序列上。本文使用的“等位基因特异性标签”是对应于靶序列中的特定等位基因的DNA标签。在一个优选实施方案中,只有除多态性加任何连锁的DNA标签以外的等位基因特异性标签需要测序,以能够将相应的多态性进行基因型分型。本文使用的“核酸测序”是指确定核酸样品中核苷酸的顺序,其中核酸包括DNA和RNA分子。“高通量核酸测序”是指用于确定核酸样品中的核苷酸的自动化的和大规模并行的方法,其中高通量核酸测序技术的例子包括但不限于454LifeSciences,AgencourtBioscience、AppliedBiosystems、LI—CORBiosciences、MicrochipBiotechnologies、NetworkBiosystems、NimbleGenSystems、Illumina禾口VisiGenBiotechnologies提供的平台,包括但不限于如Service(Science2006311=1544-1546)综述的如下形式平行珠阵列、合成测序、连接测序、毛细管电泳、电子微芯片、“生物芯片”、微阵列、平行微芯片和单分子阵列。本文使用的两个或多个核酸序列的“比对”是在同一基因座处发现的核酸序列的比较。几种比对方法是本领域公知的,包括在大多数常用的生物信息学包中。本文使用的术语“引物”是指合成的寡核苷酸的单链,优选地为大约10个至大约120个核苷酸,它可以化学合成或者由几种化学合成的寡核苷酸装配而成。如本文使用的,引物可以用来启动测序反应和聚合酶反应,如缺口填补反应和PCR。如本文使用的,引物在测定条件下将与希望的靶序列特异性杂交。如本文使用的,引物可以用来引入DNA标签,弓丨入化学修饰的碱基,如生物素标记的碱基,或者引入杂交序列,该杂交序列随后可以用于捕获,例如捕获到测序基质上或者含有抗生物素蛋白的表面上。本文使用的术语“连接体(adapter)”是指组成已知的双链核酸分子,长度一般是大约10-120个碱基对,设计为能够例如通过使用DNA连接酶连接到第二核酸分子的一个或两个末端上。连接体可以设计为连接到核酸的平端上(平端连接体)或者通过首先与特定突出端序列退火然后连接。在该实施方案中,连接体可以用来提供引物位点,用DNA标签标记核酸,为了捕获目的提供能够杂交的序列,以及添加化学修饰的核酸序列如含有生物素的连接体。本文使用的术语“连接”是指由连接酶催化的生物化学反应,其中两个DNA分子共价连接。本文使用的“DNA扩增”是指通过使用DNA聚合酶体外合成双链DNA。一般地,这在聚合酶链反应(PCR)试验中实现,但是也可包括其它方法,如缺口填补反应、错配修复、Klenow反应等。DNA扩增用来提供可检测的或过量的特定DNA。它也可以用来向靶核酸中引入杂交探针、退火的衔接体和引物,它们可以包括特定功能性或信息。本文使用的术语“转基因”是指DNA如cDNA或基因组DNA形式的核酸分子,以及RNA如mRNA或微RNA形式的核酸分子,它们可以是单链或双链。本文使用的术语“近交系”是指为了遗传同质性而选育的品系。本文使用的术语“杂种”是指至少两个遗传上不同的亲本之间杂交的后代。杂交方案的例子包括但不限于单杂交、、改良单杂交、双改良单杂交、三源杂交、改良的三源杂交和双杂交,其中改良的杂交中的至少一个亲本为姐妹系间杂交的后代。本文使用的术语“测交系”是指在与另一品系的测交中使用的品系,其中测交系和测试的品系来自不同的种质库。测交系可以是同基因的或非同基因的。本文使用的术语“玉米”是指玉米(Zeamays)或玉米,并包括可用玉米选育的所有植物品种,包括野生玉米种。更具体而言,来自玉米种和ZeamaysL.ssp.mays玉米亚种的玉米植物可通过使用本发明的组合物和方法进行基因型分型。另一方面,玉米植物来自ZeamaysL.subsp.maysIndentata组,也被称为马齿型玉米。另一方面,玉米植物来自ZeamaysL.subsp.maysIndurata组,也被称为硬质玉米。另一方面,玉米植物来自ZeamaysL.subsp.maysSaccharata组,也被称为甜玉米。另一方面,玉米植物来自ZeamaysL.subsp.maysAmylacea组,也被称为面粉玉米。另一方面,玉米植物来自ZeamaysL.subsp.maysEverta组,也被称为爆粒玉米。可以使用此处所述的组合物和方法进行基因型分型的玉米属或玉米植物包括杂种、近交系、部分近交系或或确定的或未确定的群体的成员。本文使用的术语“大豆”是指大豆(Glycinemax),包括可用大豆选育的所有植物品种,包括野生大豆种。更具体而言,来自大豆种和大豆max亚种(GlycinemaxL.ssp.max)或扁豆莢大豆(GlycinemaxL.ssp.formosana)的大豆植物可使用本发明的组合物和方法进行基因型分型。另一方面,大豆植物来自野生大豆(Glycinesoja)种,也被称为野生大豆,可以使用这些组合物和方法进行基因型分型。或者,来自大豆、大豆max亚种、扁豆莢大豆和/或野生大豆的大豆种质可以使用在此提供的组合物和方法进行基因型分型。本文使用的术语“包括”是指“包括但不限于”。本文使用的术语“优良品系”是指针对优良的农学表现进行育种和选择获得的任何品系。优良植物是来自优良品系的任何植物。根据本发明,申请人发现了基于核酸序列本身在基因型上作出育种决定的方法。例如,本发明的方法提供直接的、基于序列的分析,代替使用遗传标记作为选择目的基因座的间接工具。此外,本发明的方法允许在育种计划中使用核酸信息的提高的灵活性,其中可以查询植物或动物的完整基因组,而不依赖预先确定的遗传标记和遗传标记检测分析的发展。另外,可以调节来自任何基因座的序列的任何长度,以1)确定基因型-性状关联性,2)鉴别两种或多种品系,3)预测品系表现或杂种表现,和最终,4)为与种质改良有关的活动中的决定提供基础。分子育种通常被称为标记-辅助的选择(MAS)和标记辅助的育种(MAB),其中MAS是指基于至少一个基因座的分子标记基因型作出育种决定,MAB是表示在植物育种中使用分子标记的一般术语。在这些类型的分子育种计划中,遗传标记等位基因可以用来鉴定在一个标记基因座、几个基因座或单元型处含有希望的基因型的植物,并且因此预期将希望的基因型连同希望的相关表型一起转移给它们的后代。标记在植物育种中非常有用,因为一旦建立,它们就不经受环境或上位相互作用。此外,某些类型的标记适合高通量检测,能够以节省成本的方式快速鉴定。作物中的标记发现和开发为应用于MAB提供了最初的框架(美国专利5,437,697;美国专利申请2005000204780、2005000216545、2005000218305和2006000504538)。产生的“遗传图谱”是表征的基因座(DNA标记或可以对其鉴定等位基因的其它任何基因座)沿染色体的相对位置的表示。该图谱上距离的测量是相对于减数分裂时姐妹染色单体之间交换事件的频率。作为一组,多等位基因标记已作为有用的工具用于植物的指纹分析,以获得品系或品种的同一性程度(美国专利6,207,367)。这些标记构成确定与表型的相关性的基础,并且可以用来促进遗传增益。其中选择决定基于标记基因型的MAS的实现依赖于检测个体之间的相关遗传差异的能力。由于这些分子标记中的等位基因差异,可通过分离群体的基因型和表型的统计学评价来鉴定QTL。QTL定位方法已经很好地描述(W090/04651;美国专利5,492,547、5,981,832,6,455,758;在Flint-Garcia等人2003Ann.Rev.PlantBiol.54:357_374中综述)。在这些情况中使用标记来推断表型,由于将昂贵、时间密集的表型分型替换为基因型分型,从而导致育种计划节约化。标记方法允许在植物达到成熟之前进行选择,从而节省了时间,并且导致更有效的田地使用。实际上,选择可以在种子水平上均勻地进行,因此只种植优选的种子(美国专利申请2005000213435和2007000680611)。此外,育种计划可以设计为通过针对特定基因型而明确推动特定的、有利的表型的频率(美国专利6,399,855)。可以连续监测这些关联性的保真度,以确保保持的预测性能力,并且因而有助于育种决定(美国专利申请2005/0015827)。该方法已经发展为使用标记作为工具,如统计学分析所确定的,通过优选基因座的渗入选择“新的优良植物”(美国专利6,219,964)。标记辅助的基因渗入包括将一个或多个标记限定的染色体区从一个种质转移给第二种质。该方法中的初始步骤是通过基因作图定位基因组区域或转基因,基因作图是通过连锁分析确定基因或基因组区域相对于其它基因和遗传标记的位置的过程。连锁作图的基本原则是两个基因在染色体上越紧密地靠近,它们一起遗传的可能性就越大。简要地说,通常在两个遗传学匹配但是相对于目的性状不同的亲本之间进行杂交。然后可以利用遗传标记追踪这些性状在杂交(通常为回交(BCl))后代F2或重组近交群体中的分离。从历史上看,遗传标记不适合区分状态同一性或来源同一性。长期以来一直认为,基因和基因组序列可以是状态相同的(即,独立起源相同;IBS)或来源相同的(即,通过来自共同祖先的历史遗传;IBD),这对于连锁不平衡研究、且最终对定位研究具有重大的意义(Nordborg等人2002TrendsGen.18:83_90)。特别是,较新的标记类型,如SNP(单核苷酸多态性),更能说明起源。特定SNP等位基因源自特定物种的现存群体中的独立来源的可能性非常低。连锁基因中出现的多态性以缓慢但可预测的速度随机分类,由连锁不平衡的衰减或连锁平衡的方法描述。这种良好建立的科学发现的后果是由多态性的特定组合确定的一长段编码DNA是非常独特的,并且除了通过连锁不平衡以外,非常不可能重复存在,这指示来自共同祖先的最近的共祖先。由一些等位基因组合定义的特定基因组区域表示整个间插遗传序列的绝对同一性的可能性取决于该基因组区域中连锁的多态性的数量,除非在该区间中最近发生了突变。这些基因座也被称为单元型窗口。该窗口内的每个单元型由等位基因的特定组合定义;等位基因的数量越大,潜在的单元型的数目就越大,而且该区域中状态同一性是来源同一性的结果的确定性就越大。本发明允许通过使用直接核酸序列信息直接确定IBD,而不是通过标记信息推断。在新品系的开发过程中,祖先单元型通过这一过程保留,并且一般被认为是作为单元通过谱系遗传的‘连锁区组’。此外,如果特定的单元型具有已知的效应或表型,可以推断它在具有相同单元型的其它品系中的效应。目前,使用一个或多个用于该单元型窗口的诊断标记在种质中鉴定和追踪单元型。本发明提供一种通过使用核酸序列信息直接鉴定单元型的方法。此外,通过使用直接序列信息,与只使用遗传标记相比,可以鉴定更多的在任何基因组区域内的多态性,因此导致其它单元型的鉴定。也可以更好地估计可能具有来源同一性的单元型。通过在较深的水平上区别单元型,可以获得单元型-表型相关性的更高保真度。在另一方面,可以使用直接序列信息查询外来种质的新单元型,从而能够鉴定及随后调节独特的单元型。在另外一种方法中,可以在至少一个种质库中查询IBD的区域,以估计遗传多样性。例如,为了推断作物驯化中的遗传瓶颈,曾经查询了等位基因变体(Doebley等人2006Cell127:1309-1321综述)。但是,使用标记平台查询多样性可能是有限制的,因为一种标记只能查询序列中的一个位置。进一步地,一种杂种优势理论预测了用来产生杂种的雄性和雌性品系之间的IBD区域将会降低杂种的表现。来源同一性在历史上从不同品系中的标记等位基因的模式来推断,其中在一系列相邻基因座处的相同的一串标记可以被认为是来源相同的,如果它不可能偶然独立发生的话。雄性和雌性品系中标记指纹的分析可以确认IBD区。在本发明中,可以对基因组直接查询基因组内的至少一个基因座,以评价品系之间的IBD。对这些区域的了解有助于杂种亲本的选择,因为在杂种中避免IBD可能提高表现。这种了解也可能有助于育种计划,因为杂交可以设计为产生显示很少或没有IBD的近交系对(一个为雄性,一个为雌性)。在本发明的一个方面,评价至少一个基因组区域的杂种优势,其中如基于等位基因确定的杂交亲本之间的杂合性可以推定为赋予表型优势。在本发明的另一方面,提供了在基因组同线性(synteny)方面评价杂种优势的方法,其中至少一个基因座的非同线性可以在杂种中导致杂种优势和提高的表现。标记传统上用于对品系进行指纹分析,因而提供遗传纯度的估计值,促进QA/QC操作,以及评估遗传多样性。本发明提供了直接评估碱基对序列的方法,代替传统标记方案中从单碱基位点估计相关序列同一性的方法,从而对传统标记方案进行了改进。例如,一种典型的双等位基因SNP标记只提供了关于一个碱基对位置的信息,并且它可能只区别2个而不是4个核苷酸。本发明的方法利用最近在高通量测序中的突破来提供新型分子育种方法。最近已经开发了高通量(HT)测序方法,利用该方法可以在一个测序仪运行中产生100MB或更多序列的信息。预期可以使用任何商业上可获得的HT测序技术或任何其它可能在将来开发出来的商业上可获得的核酸测序平台,只要该平台能够确定单核酸分子的序列。商业上可获得的HT测序技术的非限制性的例子由454LifeSciences(Branford,CT)、AgencourtBioscience(Beverly,ΜΑ)>AppliedBiosystems(FosterCity,CA)、LI-CORBiosciences(Lincoln,NE)、NimbleGenSystems(Madison,WI)、Illumina(SanDiego,CA)禾口VisiGenBiotechnologies(Houston,TX)提供(也参见www.solexa.com>www.454.com或www.abi.com)。商业上可获得的HT测序技术也在Service(Science20063111544-1546)中综述,其在此全文引入作为参考。实质上,IlluminaGenomeAnalyzer、454Flex和ABISolidtechnology能够确定单DNA分子的序列,尽管该分子可能在该过程中扩增。这些例子中的一些采用合成测序,尽管这不是必要的。优选的HT测序平台将在每个运行中产生100兆碱基、1千兆碱基或甚至更多的序列信息。非常优选的HT测序平台将同时对最大量的个体DNA分子确定序列。这些系统被称为是高度并行的。基于这个原因,IlluminaGenomeAnalyzer平台通常是优选的,因为由于每个分子只产生小读数,它可以对更多的DNA分子进行测序。对较少的序列产生较长读数的平台将是有效的,但是可能存在额外的时间和成本效率的挑战。多态性核苷酸的直接确定比标记技术有重要的优点。尽管标记技术通常是可靠的,但是它们仍然可能不正确地报告相关序列、具有噪音、并且经历失败。此外,标记可能不会横跨实际的目的基因组区域,并且取决于与目的基因组区域的连锁程度,由于重组和连锁丧失而在育种群体中丧失价值。核酸序列的直接确定通过不只是对目的核苷酸测序,而且也对周围序列测序,克服了基于标记的系统固有的限制。另外,本发明提供了“间接”多态性检测方法,其中使用与SNP直接相邻的等位基因特异性标签(图5),因此测序反应只需要完成至标签处,这对于产生短读数的技术是特别有用的。间接测序同样克服了典型的标记相对于包含原因性多态性更倾向于连锁的缺点,因为该标签与SNP基本上物理连接。核酸测序的应用也提供了更多的关于与重要性状相关的基因座的序列信息,这些信息将帮助育种者更好地理解和利用基因座或性状。此外,核酸序列的直接确定可以不需要为标记开发进行大量的预先测序。在一个实施方案中,本发明的方法包括对一个植物的全基因组进行测序,比较被测序的基因组与第二植物的基因型,然后作出使它们杂交的决定,选择一个或两个进行发展,或者测试这两个的组合。或者,可以利用全基因组信息通过将具有相似性的品系分组,并且基于遗传差异分离品系,以调节杂种优势,来发展谱系。全基因组序列提供了多态性核苷酸的完全列表和单元型的完全列表。如公开领域所述的HT测序技术可能仍然在应用于植物基因型分型方面具有固有的限制,即使其具有每个样品测序100兆碱基或者甚至1千兆碱基的序列的能力。这种限制是由于需要对支持现代育种计划所需的数千万个个体或品系进行测序。鉴定两个基因座之间的罕见的重组体或者在多个基因座处具有最高频率的有利等位基因的亚群需要大量的个体或品系。对这样大量的个体的全基因组进行测序的能力仍然是无法实现的。需要能将基因组简化到少量信息性多态性区域的手段,以及将来自多个个体的样品组合到少量的测序运行或反应中的手段。本发明的一个方面是使用可重复的方法将全基因组的复杂性降至可以分析、比较并用于植物育种决定的代表性的序列亚组。本发明的另一方面是应用DNA标记的能力,使得多个样品可以组合到一个测序运行中。然后可以解析(deconvolute)来自在一个运行中平行测定的组合样品的序列,并追溯到它们所起源的个体植物或植物库。一方面,本发明提供用于核酸测序的总基因组DNA或RNA亚组,使得获得简化的样品(reducedrepresentationsample),以将测序目标缩小至(即)包括至少一个目的多态性的一个或多个编码区。这些亚组有时可以被称为复杂性降低的样品或文库。在本发明的另一方面,简化的样品针对或者限于基因组中选择的一个或多个区域或基因座。选择的基因座可以基于与一种或多种性状或表现特征之间的一种或多种关联性而选择,或者它们可以是基因组内所有基因座的代表性亚组,例如沿染色体均勻间隔并且在目标育种群体中分离的亚组。一个优选的基因座亚组是多态性基因座。多态性基因座由在一对或多个个体或品系之间变化的一个或多个核苷酸限定。该技术可以使用任何类型的多态性基因座,包括但不限于序列长度多态性、重复序列长度多态性、限制位点多态性和单核苷酸多态性。在本发明的一个优选实施方案中检测单核苷酸多态性。目标基因座的序列可以通过引发基因座以合成互补寡核苷酸,然后直接对互补寡核苷酸测序来确定。靶区域可以通过缺口填补反应、引物延伸反应、聚合酶链反应或这些反应的组合来合成。或者,对于多态性靶向的基因座,可以利用错配修复酶或核酶或其它这样的核苷酸特异性酶特异性修复在多态性核苷酸处错配的互补寡核苷酸。一旦互补核苷酸延伸、扩增、修复或者填补缺口,体外产生的寡核苷酸的序列就可以被确定,并且代表多态性基因座的序列。可以使用这些方法中的任何一种直接确定一个或多个核苷酸区的一条或两条链的核苷酸序列。由于高通量测序方法可以在一个运行中产生大于100MB的序列信息,来自大量基因座的寡核苷酸可以合并并且同时测序,使得大量基因座的序列可以在一个测序反应中平行确定。在这种实施方案中,本发明提供高通量的和成本有效的直接确定多态性或非多态性核苷酸的方法。在另一方面,可以制备由特定的一类基因组片段组成的简化的样品。在一个优选的实施方案中,使用限制酶制备样品。为了比较一个物种的至少两种植物,通过用一种或多种限制性内切核酸酶消化,基于核苷酸序列的大小分级分离消化的DNA片段,并且比较级分中片段的序列,来制备每个样品。更具体地,鉴定基因组DNA中至少一个基因座的方法包括使用对甲基化敏感的内切核酸酶消化来自真核物种的至少两个变体的总基因组DNA,以提供一组消化的DNA片段。对于以较低的5-甲基化胞嘧啶百分比为特征的DNA区,片段的平均核苷酸长度较小。这些片段可以基于核苷酸长度例如通过凝胶电泳分离。具有小于平均核苷酸长度的DNA的级分从消化的DNA的集合中分离。与编码序列相比,重复序列更可能包含5-甲基化的胞嘧啶,例如在-CG-和-CNG-序列区段中。在该方法的一个优选方面,来自作物的至少两个不同近交品种的基因组DNA用选自AciI.ApaI.AgeI.BsrFI、BssHIKEagI、EaeI、HhaI、HinPlI、HpaII、MspI、MspMII、NarI、NotI、PstI、PvuI、SacII、SmaI、StuI和XhoI的甲基化敏感性内切核酸酶消化,以提供一组可以通过例如凝胶电泳物理分离的消化的DNA。相当的DNA大小级分从所述品种中每一种的消化的DNA获得,然后测序。在另一个实施方案中,可以使用RNA作为简化的基因组,即表达的基因组的亚组。RNA可以是polyARNA、小RNA或其它RNA组分,它们可以在提取后直接使用,或者通过实验处理以进一步降低复杂性或提高再现性。在测序之前,通过逆转录法将RNA转化为cDNA,该cDNA可以直接测序或者通过实验处理以进一步降低复杂性或提高再现性。在本发明的一个优选实施方案中,多个核酸样品可以组合为样品复合体,即集合,并且在同一运行中平行测序,以使每个测序运行的样品通量达到最大。为了实现这一点,将包含该样品特有的一个或多个核苷酸的DNA标签添加到从个体样品制备的核酸上。典型的DNA标签包含1-10个核苷酸,但是可以延伸到任意长度,只要该标签不干扰确定样品序列的能力。例如,2个核苷酸的DNA标签可以用来分离16个样品的混合物。3、4、5或6个核苷酸的DNA标签可以用来分离64、256、1024或4096个样品的混合物,等等。较短的DNA标签对序列读取长度有较小的限制,但是限制了可以混合的样品数。在本发明的一个实施方案中,DNA标签作为一个或两个PCR引物的一部分简单地合成,然后引入到PCR反应中。在另一方面,可以使用DNA连接酶将DNA标签连接到样品核酸上。将DNA标签完全引入到核酸样品中后,可以复合(即合并或组合)多个DNA制品,每一个DNA制品具有独特的标签。复合的混合物然后进行一个HT测序反应。复合的样品的数目基于最佳地利用一次测序运行的全部测序能力。影响样品混合物复杂性的参数包括所评估的基因座的数目、基因座的大小、HT平台每个运行的信息含量、DNA标签的长度、连接体或引物序列的存在(如果有的话)和给定序列的读取长度。可以平衡复合水平,以达到每个样品的最佳成本、每个序列读取的冗余。单个序列读取的最小长度需要足以读取样品DNA标签(例如,2-5个核苷酸,取决于合并的样品数)、序列特异性标签(6-20个核苷酸)和一个或多个相邻的核苷酸。在HT测序反应后,首先将具有相同DNA标签的序列在逻辑上分离为单独的集合,这些集合代表提取其DNA的个体或品系或集合。然后可以读取具有相同DNA标签的序列,以确定被选择进行查询的基因座内的核苷酸身份。在本发明中,核酸的序列可以与目的性状或植物表现相关联,然后用来进行亲本、后代或测交系的选择。如果序列与性状或表现特征遗传连锁,则它们将是有用的。典型地,如果它们是性状或表现特征的原因或者与性状或表现基因座密切物理连接,则它们是遗传连锁的。对于物理连接的序列,不需要知道基因和/或作为原因的变异的性状或表现信息。只需要确定物理连接的核苷酸的序列。一旦序列与性状或表现特征遗传连锁,可以直接利用核酸序列选择显示该性状或表现的亲本、后代或测交系,而不需要预先测定性状或表现特征。关于核苷酸序列的知识也可以用来对植物或品系进行指纹分析,并且用来测定植物或品系之间的遗传相似性/距离,和建立系谱。然后可以利用系谱进行亲本的选择或者控制种质库中的多样性。在另外一个实施方案中,可以使用高通量、非破坏性的种子采样,针对一个或多个标记如核酸序列筛选植物。在一个优选方面,以这种方式对种子采样,并且只发展具有至少一个目标基因型的种子。已经描述了用于高通量、非破坏性种子采样的装置和方法,它们通过允许单个种子分析可以克服统计样本的障碍。例如,公开的美国专利申请US2006/0042527、US2006/0046244、US2006/0046264、US2006/0048247、US2006/0048248,US2007/0204366和US2007/0207485(在此全文引入作为参考)公开了用于种子自动采样的装置和系统以及采样、测试和膨胀(bulking)种子的方法。如本发明所提供的,对核酸序列的了解可以用于在育种计划的多个阶段作出决定a)在分离的后代之间,作为预选择方法,提高选择指数和推动育种群体中有利核酸序列的频率,其中预选择定义为基于如通过HT测序确定的、育种杂交后代在一个或多个基因座处选择的一组两个或多个核酸序列的基因型,在育种杂交的后代之间进行选择,并且梳理在以前的育种杂交中确定的核酸序列_性状相关性。b)在来自育种群体的分离的后代之间,为了品系或品种的开发提高有利核酸序列的频率。c)在来自育种群体的分离的后代之间,在该育种群体内QTL定位之前提高有利核酸序列的频率。d)对于杂种作物,在来自不同杂种优势群的亲本品系之间,预测不同杂种的表现潜力。在另外一个实施方案中,本发明提供通过在种质中积累目的核酸序列改良植物种质的方法,包括确定植物种的基因组中至少两个基因座的核酸序列,以及将该核酸序列与至少一种性状相关联,并且使用该核酸序列效应估计值指导育种决定。这些核酸序列效应估计值可以使用历史核酸序列-性状相关性获得或者从作图群体从头获得。一种或多种性状的核酸序列效应估计值为在育种计划中作决定提供了基础。本发明还基于估计的种质中核酸序列的效应和频率,使用育种值计算为决定的作出提供替代基础。可以使用核酸序列育种值将特定一组核酸序列排序。在特定一组核酸序列中,这些育种值构成了计算指数以对基因座之内和之间的等位基因进行排序的基础。例如,在每个染色体具有不同核酸序列的群体中,任何给定的染色体区段可以在给定群体中由许多核酸序列表示,这些核酸序列可以从1(区域固定)到群体大小相比该物种倍性水平的倍数(在二倍体物种中为2)变化。非固定群体中多个个体携带的核酸序列之间的来源同一性将会导致中等数目的不同核酸序列和不同核酸序列之间可能不同的频率。新的核酸序列可以通过杂合祖先中存在的核酸序列之间的减数分裂重组而产生。每个核酸序列的频率可以通过几种本领域技术人员所知的方法来估计(例如通过直接计数,或者通过使用EM算法)。让我们假定已知“k”不同的核酸序列,其中核酸序列代表至少一个核苷酸,并且可以构成等位基因或单元型,确定为“n/’(i=1,...,k),它们在群体中的频率是“fi”(i=l,...,k),对于这些核酸序列中的每一种,我们的效应估计值为“Est/’(i=1,...,k)。如果我们称“育种值”(BVi)为固定该核酸序列对该群体的影响,则该育种值对应于该群体的目的性状的平均值在该窗口处单元型分布的原始状态与核酸序列“η/’以100%的频率遇到它自身时的最终状态之间的变化。该群体中的育种值Iii可以如下计算<formula>formulaseeoriginaldocumentpage20</formula>本领域技术人员应当认识到,在其效应被估计的群体中罕见的核酸序列倾向于精确度较低地被估计,这种置信度的差异可导致计算的调节。例如,通过在调节其频率后计算较熟知的核酸序列的育种值(通过将其除以较熟知的核酸序列的频率总和),人们可以忽略罕见核酸序列的效应。人们也可以为每个核酸序列的育种值提供置信区间。该育种值将作为核酸序列频率差异的函数,随所计算的群体而变化。术语群体于是可以假定为不同的含义,以下是特殊情况的两个例子。第一,它可以是单一近交系,其中意图将其当前的核酸序列Hj替换为新的核酸序列叫,在该情况下<formula>formulaseeoriginaldocumentpage20</formula>第二,可以是F2群体,其中两个亲本核酸序列Iii和η」最初以相等的频率(50%)存在,在该情况下<formula>formulaseeoriginaldocumentpage20</formula>这些统计方法能够使核酸序列效应估计值在多种情况下促进育种决定。其它计算育种值的统计方法是本领域技术人员所知的,并且可以在不背离本发明的精神和范围的情况下替换使用。此外,确定表型与基因型(在此情况下为核酸序列)之间相关性的统计学显著性的方法可以通过本领域所知的任何统计学检验来确定,并且需要任何公认的统计学显著性阈值。特定方法和显著性阈值的应用是本领域普通技术人员公知的。核酸序列效应估计值和/或一个或多个目的性状的育种值为与两个或多个核酸序列相比确定一个或多个目的核酸序列提供了基础。使用这种先验信息,在核酸序列基础上而不是在标记基础上进行育种选择,其中第一植物与含有至少一个基因座的第二植物杂交,其中第二植物的核酸序列不同于第一植物的核酸序列;并且通过检测第一植物的核酸序列或核酸序列组选择至少一个后代植物,其中该后代植物在其基因组中包含第一植物的一种或多种目的核酸序列和第二植物的至少一种目的核酸序列;并且在与种质改良有关的活动中使用该后代植物,与种质改良有关的活动在此定义为包括使用植物进行品系和品种开发、杂种开发、转基因事件选择、进行育种杂交、通过自体受精测试和发展植物、纯化品系或亚系、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、以及使用植物或其部分进行诱变。在一个方面,本发明提供高通量测序,以鉴定植物基因组的一个或多个区域中的大核酸区段,这为比较两份或多份种质提供了基础。这些连续核酸序列区域表明来自共同祖先的所有间插基因的遗传同一性的保守。在保守序列区段与已经鉴定QTL的区段一致的情况中,可以高可能性地推断QTL推断可以扩展到其它在该基因座中具有相同序列的种质。这种先验信息为在给定群体内QTL定位之前选择有利QTL提供了基础。例如,植物育种决定可以包括a)在新育种群体之间选择,以确定哪些群体具有最高的有利核酸序列频率,其中序列基于与以前的QTL定位一致而被称为有利的;或者b)在该群体内QTL定位之前,或者代替该QTL定位,在育种群体中选择含有所述有利核酸序列的后代,其中选择可以在任何育种阶段进行,并且也可以用来推动多代轮回选择;或者c)预测特定育种杂交的后代表现;或者d)基于所述有利的单元型选择用于种质改良活动的品系,所述种质改良活动包括品系开发、杂种开发、基于插入转基因的单元型的育种值在转基因事件之间选择、进行育种杂交、通过自体受精测试和发展植物、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、以及使用植物或其部分进行诱变。本发明的另一个独特方面是选择特定基因或等位基因的能力,因为它们被高通量测序定向。例如,在核酸序列与已鉴定基因的区段一致的情况中,可以高可能性地推断基因推断可以扩展到其它在该基因座中具有相同基因型的种质。这种先验信息为基于给定群体内的核酸测序选择有利基因或等位基因提供了基础。例如,植物育种决定可以包括a)在新育种群体之间选择,以确定哪些群体具有最高的有利核酸序列频率,其中序列基于与以前的基因定位一致而被称为有利的;或者b)在育种群体中选择含有所述有利核酸序列的后代,其中选择能够在基因水平上有效进行,其中选择可以在任何育种阶段进行,并且也可以用来推动多代轮回选择;或者c)预测特定育种杂交的后代表现;或者d)基于所述有利的单元型选择用于种质改良活动的品系,所述种质改良活动包括品系开发、杂种开发、基于插入转基因的单元型的育种值在转基因事件之间选择,进行育种杂交、通过自体受精测试和发展植物、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、以及使用植物或其部分进行诱变。此外,在本发明的另一个优选实施方案中,关于育种群体中有利核酸序列的频率的先验信息使得能够进行预选择。即,为了同时推动多种性状的有利核酸频率,基于历史基因型-表型相关性信息选择亲本品系。在预选择中,育种者可以基于该品系的指纹信息预测任何品系的多种性状的表型贡献,该信息对应于预定义的序列的组成。这种多性状序列选择方法通过在选择亲本杂交的开始阶段启动选择而使育种计划经济化,并且它也减少了对昂贵的、费时的后代表型分型的需要。当通过标记方法或表型方法选择时,一种优选的序列为亲本植物和亲本的后代提供了优选的性质。本发明的方法提供优选序列或目的序列的选择,以及这些序列在育种群体中的积累。在另一个实施方案中,本发明使得能够基于至少一个核酸序列效应估计值,通过对至少一个核酸序列的选择决定进行间接选择,从而基于其它表型性状的另外的核酸序列效应估计值间接选择另外的表型。本发明的另一个优选实施方案是通过选择核酸序列的组成建立另外的值,其中每个序列具有估计的相关表型,该表型相对于产量不为负,或者相对于成熟度不为正,或者相对于成熟度为零,或者与一组种质中相同基因座处其它任何核酸序列相比在农学性状、转基因和/或多个性状指数方面最好的50%中,或者与一组种质中整个基因组上其它任何基因座相比在农学性状、转基因和/或多个性状指数方面最好的50%中,或者在育种群体或一组种质中以75%或更高频率存在的核酸序列可以被作为其高值的证据,或者它们的任意组合。本发明预期通过杂交含有不同核酸序列即不同基因型的亲本植物或品系,将来自至少两个基因座的核酸序列堆积到植物或品系中。在其基因组中包含来自两个或多个基因座的堆积核酸序列的植物或品系的值可以通过综合育种值来估计,综合育种值取决于性状值和与该性状连锁的核酸序列值的组合。本发明进一步预期植物或品系的综合育种值可以通过改变一个或每个核酸序列的成分来改进。另外,本发明预期另外的值可以加入植物或品系的综合育种值,其实现方法是通过选择至少一个具有优选核酸序列效应估计值的接受核酸序列,或者与所述核酸序列在种质库中的频率一起,与其它核酸序列中的一个或任一个连锁的育种值,或者通过育种选择用于堆积来自两个或多个基因座的两个或多个核酸序列的植物或品系。本发明的另一个实施方案是一种通过在种质中在一个或多个基因座中积累一个或多个核酸序列增强育种群体的方法。基因座包括遗传信息,并且给植物提供表型性状。遗传信息中的变异可以导致表型性状的变异,并且表型的值可以测定。核酸序列的遗传作图允许确定序列之间的连锁。目的核酸序列在后代植物的基因组中是新型的,并且其本身可以作为目的基因座的遗传标记。特别是,该核酸序列还可以用作基因或QTL的标识物。例如,如果有与核酸序列相关的多种性状或性状效应,只有一个标记是选择目的所必需的。另夕卜,目的基因座可以提供选择具有连锁基因座的植物的工具。在另外一个实施方案中,本发明的至少一个优选核酸与至少一个转基因堆积。在另一方面,基于与优选核酸的连锁或在其中的插入发展至少一个转基因事件,如公开的美国专利申请US2006/0282911所公开的,该专利申请在此全文引入作为参考。在再另一个实施方案中,本发明承认可以发展通过此处所述的方法鉴定的优选核酸作为包含在表达构建体中的候选基因,即转基因。通过与在植物中具有功能的启动子可操作地连接,目的核酸可以在植物细胞中表达。在另一方面,目的核酸的表达可以被双链RNA介导的基因抑制改变,后者也被称为RNA干扰(“RNAi"),包括小干扰RNA(“siRNA")、反式作用小干扰RNA(“ta-siRNA")或微RNA("miRNA")介导的抑制。适合用于植物的RNAi技术的例子在美国专利申请公开2006/0200878和2007/0011775中详细描述。装配构建体和将其引入细胞中的方法在本领域中已知,该方法使得性状的核酸分子被转录为功能性mRNA分子,该功能性mRNA分子可翻译和表达为蛋白质产物。为了实施本发明,用于制备和使用构建体和宿主细胞的常规组合物和方法是本领域技术人员公知的,参见例如MolecularCloning:ALaboratoryManual,3rdedition第1、2、3卷(2000)J.F.Sambrook,D.W.Russell,andN.Irwin,ColdSpringHarborLaboratoryPress。特别适合植物转化的制备转化构建体的方法包括但不限于美国专利4,971,908,4,940,835、4,769,061和4,757,011中描述的方法,所有这些专利都全文引入作为参考。用于向植物内引入表达单元的转化方法是本领域中已知的,包括如美国专利5,384,253所述的电穿孔;如美国专利5,015,580,5,550,318,5,538,880,6,160,208,6,399,861和6,403,865所述的微粒轰击;美国专利5,508,184所述的原生质体转化;和美国专利5,635,055,5,824,877、5,591,616,5,981,840和6,384,301所述的土壤杆菌介导的转化。本发明也提供筛选后代植物的目的基因座和使用核酸效应估计值作为用于育种计划的选择的基础,以增强优选核酸序列的积累。使用这种方法,本发明涉及从大植物群体中选择目的核酸序列。另外,这些核酸序列可以在描述的育种方法中使用,以积累其它有益的和优选的基因座,并且在育种群体中维持它们,以增强植物的整体种质。考虑用于该方法的植物包括但不限于玉米、大豆、棉花、小麦、水稻、芸苔、油菜、甜菜、高粱、粟、苜蓿、饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物(turfcrops)、糖料作物、饮料作物、块茎作物、块根作物和森林作物。总之,本发明描述了高通量测序和分子育种方法的新型组合,以能够使用直接核酸序列信息进行分子植物育种。本发明也包括在序列确定之前选择性靶向多态性核苷酸位点和DNA标记样品的方法。结合起来,本发明使得植物育种者能够在亲本选择、后代选择、选择测交系组合、开发系谱、样品指纹分析、筛选单元型多样性和建立序列与性状和表现数据之间关联性的数据库中使用序列信息。实施例实施例1.序列指导的选择任何育种计划的一个重要目的是将经济学上或其它方面重要的性状引入到育种品系或群体中。直接确定与性状连锁的区域的序列或直接确定作为该性状原因的基因座的序列的能力将使育种者能够确定群体中哪些个体或品系有可能显示该目的性状,从此有利于开发决定。用于高通量测序的样品工作流程在图1中显示。本实施例证明本发明的用于进行序列指导的选择的方法。该方法与传统标记辅助的选择的不同在于它使用直接核酸序列信息进行选择而不是使用标记。低亚麻酸含量的大豆油在商业上是重要的,因为它在加工和使用过程中不产生反式脂肪,因此对于人类消费而言更加健康。亚麻酸生物合成必需的一种基因是fad3基因。在大豆中,存在至少三种fad3基因,并且fad3b和fad3c两种基因中的突变可能导致低亚麻酸含量。用于检测这些基因中的突变的示例性的引物和探针在公开的美国专利申请20060107348中描述,在此全文引入作为参考。在一个方面,序列指导的选择的第一步可以是降低基因组复杂性,其中不同的策略在图2-5中说明。即,通过使用本领域所知的酶进行选择性消化和纯化可以获得简化形式的文库(图2)。在其它方面,可以从转录组定向该文库(图3)。在另外其它方面,使用等位基因特异性延伸/连接分离含有SNP的区域(图5)。在其它方面,选择性扩增序列靶向的基因组区域(图4)。在本实施例中,使用用于插入和缺失的特异性引物扩增Fad3cindel区。当目的区域含有indel时该方法是有用的,并且特别可用于筛选转基因。可替代地,扩增横跨目的核酸的区域。在本实施例中,使用第二复杂性降低策略,其中为了测序目的,利用Fad3b区域的SNP分析扩增含有SNP的区域。通常,该方法特别可用于梳理已有的SNP的基于PCR的分析文库,并且使用已知的引物组作为复杂性降低的工具。本发明涉及使用公开的美国专利申请US2005/0204780、US2005/0216545、US2005/0218305和US2006/0504538提供的SNP,作为测序靴标,以及在此处所述的基因组复杂性降低中使用。可用于序列指导的选择的第二步是使用DNA标签以允许样品复合。在本实施例中,给复合组中的每种样品分配独特的DNA标签,即,与该组中的其它条码有至少一个碱基对不同的序列标签。在一个优选方面,平衡G和C碱基的百分比,以使测序过程中的偏差减至最小。DNA标签的长度可以从大约2bp到大约20bp。在本实施例中,对于代表分析Fad3bSNP和Fad3cindel的192份种质的384个PCR样品,使用6bp序列,对每个样品的SNP和indel区域进行测序。在一方面,如图7所示向PCR引物中添加DNA标签。或者,如图5所示,它们可以引入到等位基因特异性延伸/连接中,利用PCR将条码与等位基因特异性延伸/连接产物连接,或者添加到产物中。在本实施例中,DNA标签包含在PCR引物中。图9显示了将用于测序的产生的模板的示意图,显示Fad3bSNP和Fad3cindel。具体地,合成一对寡核苷酸以帮助fad3b基因座的序列测定。合成正向寡核苷酸引物,其包含6个核苷酸的DNA标签(表1)和与位于已知影响基因功能的fad3b突变5'侧的核苷酸序列匹配的序列。对于本发明,突变与多态性核苷酸相同,并且代表多态性基因座。合成反向寡核苷酸引物,其为与位于fad3a突变3'侧的区域互补的序列。第二对正向和反向PCR引物以类似的方式产生,以与缺失了已知减少大豆油中的亚麻酸的fad3c基因的突变相匹配。由于该缺失延伸到fad3基因的边界以外,在基因编码区内设计一对引物,以确定fad3c基因的序列(如果该基因存在的话),并且设计第二组引物,其横跨fad3c基因座的缺失(如果该基因不存在的话)。核苷酸对之间的距离设计为10-200个核苷酸,并且该突变邻近正向引物的末端,因此紧靠DNA标签。引物之间的距离越相似,多个基因座上模板的PCR扩增越可能无偏差,但是,在某些实施例中可能需要较长的距离来发现适合有效引物设计的核苷酸段,例如不含重复序列、不存在的序列结构和平衡的GC含量。三对引物中的正向引物可以使用相同的DNA标签。这三对代表可以用于一个样品的基因型分型或指纹分析组。具体地,在本实施例中使用以下引物对:Fad3B(SNPNS0193115),192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA标签+CATTGGCACCCATGTTATCC;单Fad3B反向引物CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+GACTTAGATCACATAGGCAGACATAC;Fad3C插入,192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA标签+TAAGTGACACTGGAGATGTGG;Fad3C缺失,192正向引物ACACTCTTTCCCTACACGACGCTCTTCCGATCT+192DNA标签+CAGAAAGTATTGGTAAAGTACTGGTA;单Fad3C反向引物CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+TAAATATTCCATTGAGGCCCACTA,其中混合等摩尔量的引物。表1.用于在本实施例中基因型分型的192个大豆品种的示例性的6核苷酸DNA标签<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table><table>tableseeoriginaldocumentpage27</column></row><table>然后产生另外的192个基因型分型组,其中除了三对寡核苷酸的正向引物中的DNA标签更换来自4096个可能标签列表的独特标签以外,每个组是相同的。然后以以下方式确定192个大豆品种群体的fad3b和fad3c突变的序列。从192个品系中的每一个上采样一个种子,除去一部分种子组织而保留种子的生存力,例如如US2006/0046264和US2007/0204366所述,该专利均在此引用作为参考。为了制备用于测序的模板,为每个组织样品制备DNA,然后将IOng分配到2个96孔微量滴定板中。按照厂商的推荐(Roche,ABI)向每个孔中加入PCR主混合物以及Taq聚合酶。最后,向每孔中加入ΙΟΟμΜ选择的基因型分型引物组,其包括匹配的DNA标签。将板加热到95°C保持9分钟,以变性DNA。然后使用以下条件完成20个循环的PCR:94°C30sec,55°C30sec,72°C2min,最后72°C延伸10分钟。PCR后,将所有192个品系合并到一个孔中,然后根据厂商的说明(IlluminaGenomeAnalyzer)进行HT测序反应。简言之,混合等量的384个PCR产物,然后使用本领域已知的PCR纯化法纯化。约5-10ng纯化的模板按照IlluminaGenomeAnalyzer的说明利用富集PCR扩增。如果连接体未引入到引物中的话,富集PCR也添加下游桥连PCR反应所需的连接体。再次使用本领域所知的PCR纯化方法纯化富集PCR产物,按照IlluminaGenomeAnalyzer的说明对产生的模板进行测序。从测序反应获得的序列根据DNA标签序列装箱(binned)。在每个箱(bin)内,通过与SNP和indel正向引物对齐分析序列,以确定已知的突变、任何其它变异或野生型核苷酸是否靠近3'互补寡核苷酸存在。SNP基因型基于SNP位置处的序列检出(call)(获得的散布图见图10)。Indel基因型通过与两条正向引物序列的匹配来确定(获得的散布图见图11)。匹配序列计数可以作图以处理背景。可以使用/开发用于标准化/校正和更可靠的基因型检出的高级评分工具。如果突变序列和野生型序列都鉴定到,则预测样品为杂合的。如果只存在对应于野生型序列的核苷酸序列,则样品被分类为正常亚麻酸。如果鉴定到已知的突变序列,则样品被分类为低亚麻酸。鉴定和分类fad3b基因座、fad3c基因座和fad3c缺失基因座处的序列允许育种者筛选植物,以表征低亚麻酸相关的基因型,然后决定选择哪种低亚麻酸品种进行测试。实施例2.序列指导的基因渗入植物育种中一种有效的工具是回交。回交允许育种者提取供体品系中的一个或多个最佳特征,并将其系统渗入到回归亲本品系中。实质上,将一个或多个选择的供体DNA基因座处的基因组区域系统渗入到回归亲本基因组中,代替回归亲本基因组中相应基因座处的核酸。一般渗入到品系之间的特征类型包括但不限于转基因、抗病性、害虫抗性、质量性状、农学性状等。传统上,这种过程可以进行5代或更多代,以在显示与回归亲本等同并且具有回归亲本的农学表现的后代中获得目的性状。如果转变的品系的表现不等于回归亲本加新性状预测的表现,则可能通常非常难以理解该问题以及不知如何修正。序列指导的回交(SDBC)可以极大地加速该过程并且导致更可定量的结果。使用序列,检查来自每一回交代的后代中编码目的特征或与目的特征连锁的供体亲本核酸序列和回归亲本基因组中的核酸序列。该检查考虑序列之间的差异(多态性)和同一性。基于其核酸序列组成选择和发展回交后代,其核酸序列组成包括编码目标性状或与目标性状连锁的核酸序列和与回归亲本序列匹配的最高百分比的核酸序列。通过使用序列而不是标记信息指导该过程,该过程可以在较少的几代内完成,具有较高的回归亲本回收率。SDBC的一个具体实例是转基因从供体品系向回归亲本品系中的定向渗入,转基因的一个例子编码除草剂抗性,也被称为细菌CP4基因,它是RoundupReady性状所需序列的关键部分。在该实施例中,供体系在CP4基因方面是固定的或者是纯合的,并且希望将CP4渗入到回归亲本品系中。育种者在靠近CP4供体亲本的一行15个种子的一行中种植回归亲本的15个种子。通过用来自回归亲本的花粉对供体的穗授粉进行四个杂交。得到的种子是Fl种子。种植三行,回归亲本行种植在两行从一个或两个外观最佳的Fl穗获得的Fl种子之间。在花粉散播时,用回归亲本对侧面每一行中的4个Fl授粉(总共8个杂交)。从每行收获最好的两个BCl穗,并且膨胀BCl种子。平均起来,预期BCl种子含有25%的供体基因组和75%的回归亲本基因组,但是,任一个体植物的提取物含量在正常分布内变化。通过选择具有最高回归亲本基因组并且含有转基因的种子亚组加强随后的回交工作。BCl种子也将是CP4转基因分离的,利用测序确定93个BCl植物中哪些具有最高含量的回归亲本核酸序列并且含有转基因。希望的亚组可以通过观察在许多基因座(例如96)处的序列来确定,其中所述基因座之一是CP4基因座。将来自每个亲本、Fl批和93个BCl中的每一个的种子种植在行中,并栽培植物。在V4阶段(第4叶阶段),从每个植物上取叶液(leaftear),并且置于96孔板的一个孔中。按照Dellaporta等人,1983PlantMolBiolRep119-21(在此全文引入作为参考)所述的方法制备DNA。来自96个基因座中每一个的DNA进一步使用初始扩增来制备。在该实施例中,利用扩增引入DNA标签和连接体,但是其它方法也是已知的和适用的。设计基因座特异性正向引物,其在将与靶基因座的5'杂交的3'末端含有18个核苷酸。正向引物的5'末端也含有与通用正向PCR引物3'端的15个核苷酸匹配的15个核苷酸。以类似的方式设计反向PCR引物,其中3'末端的18个碱基与靶基因座3'核苷酸互补。反向引物在与通用反向引物的3'末端匹配的5'末端上也含有15个碱基对。在该实施例中,靶基因座为6-10个核苷酸,但是它们可以在从恰好2个核苷酸到几百个或更多核苷酸的范围内变化。对96个基因座中的每一个重复该方法,其中一个基因座是CP4基因座。选择95个基因座覆盖每个染色体的每个臂,并且包括少数位于CP4基因座侧翼的额外的标记。除了基因特异性引物以外,也设计通用引物。合成正向通用引物,其在正向基因特异性引物的5'末端含有15个核苷酸。合成反向通用引物,其与反向基因特异性引物上的通用PCR核苷酸杂交,并且另外在5'末端含有5个核苷酸的标签。合成九十六(96)个不同的通用反向引物,每个引物含有独特的标签序列,该标签序列选自在5个核苷酸位置的每一个处由4个碱基之一提供的1024种可能的组合。样品使用标准条件进行PCR。开始几轮PCR的目的是将通用引物和DNA标签引入有限拷贝数的每个基因座中。将96个基因特异性正向和反向引物对稀释,然后组合形成复合的、等摩尔的贮备溶液,终浓度为每升溶液10μmol总寡核苷酸。PCR测定含有IXPCR缓冲液、2.5mMMgCl2、0.2mMdNTP混合物、IUTaqDNA聚合酶、1μM正向通用引物、IOOnM复合引物和1μ1DNA提取物。另外,对于ΙμΜ的终浓度,向每个独特样品中加入独特标记的反向通用引物。循环在ABI7900中进行,采用以下循环程序94°C初始变性90秒;然后94°C30秒、55°C30秒和72°C30秒的4个循环;然后94°C30秒和72°C60秒22个循环。通过PCR或连接引入DNA标签是该方法的关键,后来的扩增不一定是必要的,但是可以有利于准备测序中的下游样品处理步骤。PCR后,通过在2%琼脂糖凝胶上进行琼脂糖凝胶电泳,然后用溴化乙锭染色以证实单一产物的存在,检测2μ1的扩增产物。具有阳性PCR反应的分析组合为单一集合,并使用Qiagen试剂盒(Qiagen,USA)纯化。纯化的产物然后按照厂商方案(IlluminaGenomeAnalyzerIG分析仪,Illuminhlnc.)进行高通量测序。从每个测序的分子获得两个读数。第一个读数使用对应于正向通用PCR引物序列的引物获得。该测序引物导致在对其设计引物的基因座处和给定样品内的序列为短读数,如根据标签所确定的。使用短运行从设计为与反向通用引物序列杂交的测序引物读取标签。该第二序列读数在完成基因座序列的读取后重新开始。从测序反应获得的序列根据DNA标签序列装箱。这通过将第二序列读数修剪为DNA标签然后在一个运行内彼此blast标签而进行。在每个样品箱内,序列聚类以组合同一基因座的多个读数。然后将给定基因座处的序列与回归亲本和供体亲本和CP4基因的预期序列比较(使用BLAST)。如果所有序列读数都与回归亲本匹配,则该基因座被称为对于回归亲本是固定的。如果所有序列都与供体亲本匹配,则该基因座对于供体亲本是固定的,并且需要一个或多个另外的回交向该群体内重新引入该基因座的回归亲本核酸。如果回归亲本和供体亲本序列都被观察到,则该基因座被称为杂合的,并且该品系可以自交或进一步回交,以对回归亲本固定。所有95个基因座和CP4基因座都遵循这一逻辑。选出具有最大数目的回归亲本基因座并且含有CP4基因座的后代进一步回交,以进一步在所有基因座处渗入和固定回归亲本核酸,除了CP4基因座处的供体核酸以外。本发明进一步涉及使用此处描述的方法渗入2个或更多的基因组区域,该区域可以是转基因的或常规的(即QTL)。实施例3.使用HT测序的分子指纹分析(序列指导的指纹分析)核苷酸序列是个体植物的遗传组成和植物品种/品系之间遗传相似性的最后估计和量度。基于核苷酸谱的分子指纹可以提供基因组中的一般信息,该信息在各种应用中尤其可以用于评估种质多样性、帮助选择高表现的亲本和测交系、针对可能的渗入靶标查询新的种质库、针对与至少一个目标表型相关的基因组区域查询新的或已有的种质库,以及保护种质的知识产权。如果两个品系足够不同,它们可能处在不同的杂种优势群中。即,它们可能彼此互补,并且当杂交时,具有产生生产性育种杂交或杂种组合的高可能性。另一方面,品系之间的相似性可以提示潜在的亚最佳杂交。此外,指纹相似性为评价知识产权侵权提供了基础。分子指纹可以集中于选择的基因组区域,并且揭示特定基因座处的序列信息,包括但不限于引起经济学上重要的性状或者与之连锁的那些基因座。在一个或多个基因座处是否存在特定核苷酸序列或特定核苷酸序列变体可能与目标性状相关,并且用来预测这些性状的表现,以及选择高表现的品系代替直接基因型分型。分子指纹可以基于整个基因组序列产生,这是高成本的和费时的,并且通常不实用。在测序之前可以使用各种方法降低基因组复杂性以产生基于基因组一小部分(选择的区域或基因座)的指纹。本发明提供比现有技术更有效的和更经济的方法,该方法涉及多种遗传多态性的基于PCR的检测。其中,通过PCR扩增选择的多态性区域/基因座,然后利用HT测序直接基因型分型。可以利用多重PCR同时扩增多达数十万个这样的区域/基因座。使用DNA标签复合样品可以进一步利用每轮通过HT测序方法产生的大量序列信息。对于分子指纹分析,第一步是选择多态性区域或基因座,以用来产生基于核苷酸序列的分子指纹。SNP是候选基因座的一个来源,尽管它们不是唯一的来源。使用的基因座数目取决于多种因素,包括但不限于该计划的目标和预算以及所研究的基因组的结构。例如,我们选择384个玉米SNP来证明分子指纹分析方法,尽管单HT测序运行的能力允许使用更大的一组SNP。IlluminaGenomeAnalyzer流动池的一个通道在每一测序运行中能够产生大约600万个序列读数。因此可以同时对大约300,000个基因座进行基因型分型,具有大约20X的序列冗余度。如果需要较少量的基因座,则通过复合样品可以同时对来自96个不同样品的大约3,000个基因座进行测序(见下文)。在最大化信息含量的尝试中,基于包括玉米基因组中的平均分布和大于3.0的多态性信息含量(PIC)值的特征从较大的SNP集合中选择这384个SNP。SNP的一部分与玉米中的重要表现相关特征连锁。第二步是使用多重PCR扩增选择的基因座。为每个SNP合成一对寡核苷酸,其中之一与SNP中多态性核苷酸5'的核苷酸序列匹配,另一个与多态性核苷酸3'的区域互补。对于最佳测序结果,尽管不是必需的,但两个寡核苷酸之间分离与HT测序方法建议的片段大小相匹配的长度(对于IlluminaGenomeAnalyzer为50-150个核苷酸),其中之一与多态性核苷酸相邻但是不重叠。为了提高多重PCR的效率,设计用于384个基因座的寡核苷酸,使得它们彼此干扰最小,并且产生的384个PCR产物具有相似的长度和GC含量。使用含有基因组特异性序列的由两部分构成的寡核苷酸和通用PCR引物的两阶段PCR也可以帮助提高多重PCR的效率。当使用两阶段PCR时,使用的HT测序方法需要能够通过通用PCR引物和基因组特异性寡核苷酸测序,以达到目标多态性核苷酸。否则,需要处理PCR产物,以确保测序读入多态性核苷酸。另一个选择是使用测序引物作为通用PCR引物的一部分(参见实施例2),以减少测序引物和将要测序的核苷酸之间的核苷酸数。尽管能够基于实验目的和/或给定样品群体中各个基因座的信息量“如希望地”集合基因座,但是对于分子指纹分析,选择的基因座通常用作固定组。384对寡核苷酸(每个选择的基因座一对)在水中稀释,并且合并在一起达到每种寡核苷酸5nM的终浓度。使用标准提取方案从每个将要进行指纹分析的玉米品系制备DNA。根据实验中品系的数目和样品复合形式,将大约各IOOngDNA(根据使用的基因座数目和基因组的大小而变化)分配到96孔或384孔微量滴定板中。在该实施例中,我们指纹分析了96个玉米近交系。按照标准PCR方案将PCR主混合物连同高保真度DNA聚合酶一起添加到每个孔中。最后,向每个孔中添加384对寡核苷酸的混合物至终浓度为每种寡核苷酸为0.5nM并且终体积为10μL。PCR条件的一个例子是94°Clmin,55°C2min,在7分钟内从55°C升至72°C共25个循环,然后72°C7min。可以使用任何PCR方案,只要其能够产生足以用于HT测序的来自所有选择的基因座的特异性产物。为了最小化PCR扩增错误和基因座之间的不均勻扩增,通过减少循环数和/或寡核苷酸的量控制扩增。目的是产生相当于HT测序方法建议的起始DNA的PCR产物量。然后在与测序连接体连接之前按照HT测序的要求纯化PCR产物。由于基因组DNA较大,在下游测序反应中,PCR中使用的模板基因组DNA将不与PCR产物明显竞争。为了获得最佳结果,可以使用本领域已知的方法从PCR产物中除去模板DNA。实际上,如果为了连接使用Qiagen纯化柱纯化PCR产物,将除去大多数基因组DNA。在该实施例中,使用QiagenPCR纯化试剂盒(96孔形式,根据厂商说明书)纯化PCR产物并且除去模板基因组DNA(基因组DNA由于其大小而与柱子非常紧密地结合,并且难以洗脱)。最后,PCR产物与用于IlluminaGenomeAnalyzerHT测序的测序连接体连接。其它方法是本领域已知的,并且在本发明的精神和范围内。实际上,如果在两阶段PCR方案中使用通用引物,并且使用连接体序列作为通用引物,PCR产物与连接体的连接不是必需的,因为它们已经通过PCR引入。为了利用IlluminaGenomeAnalyzer测序技术产生的大量序列信息,在测序反应中集合多个样品,然后使用DNA标签序列解析。DNA标签通常是2-6个核苷酸(用于复合的16-4096个独特标签),尽管希望更长的序列,使得样品的区别为一个以上的核苷酸差异,以减少错误。在各种因素中,样品复合水平尤其取决于每个运行产生的测序读数的数目、使用的基因座的数目和希望的冗余水平。可以应用各种方法将DNA标签引入测序模板(在该例子中为PCR产物)中,包括实施例2中的方法,S卩,在PCR引物中包含DNA标签序列。或者可以合成不同形式的连接体,每种形式在3'末端添加一个独特的DNA标签序列;然后每种形式用于复合组中的一个样品。在该实施例中,我们使用IlluminaGenomeAnalyzer提供的一组96个连接体,并且每个连接体根据厂商的说明在PCR板的96个孔之一中与PCR产物连接,这96个孔对应于样品复合形式中的96个样品之一。然后将96个孔中的连接产物合并到一个孔中,用于根据IlluminaGenomeAnalyzer的测序方案进行HT测序反应。384个SNP的相同的寡核苷酸混合物可以用来扩增更多的样品,来自每板96个样品的PCR产物可以与96种形式的连接体连接,并且合并到一个孔中进行HT测序。每个IlluminaGenomeAnalyzer流动池在每个测序运行中可以加工最多8个这样的集合。从HT测序反应获得的序列首先根据DNA标签序列装箱,将序列分配给集合中的96个样品。在每个箱内,基于与多态性核苷酸相邻的寡核苷酸序列对序列进一步分组,并且用于扩增PCR产物。每个箱中应当有384组序列,每一组对应于384个SNP基因座中的每一个。然后分析该序列,以确定在96个样品中每一个中,在384个基因座的每一个处存在哪个等位基因。利用序列信息确定可以用来与经济学上重要的性状的表现相关联的基因座处特定核苷酸序列或该核苷酸序列的特定变体的存在或不存在。一旦建立这种关联,使用作为目的性状的原因或与之紧密连锁的特定序列或序列变体,可以利用该序列预测这些性状的表现,并且选择高表现的亲本、测交系或后代以代替直接基因型分型。该序列或序列变体也可以用来估计以及用于提高有利的序列或序列变体的频率。有时,多个基因座处的几种核苷酸序列或核苷酸序列的变体的组合更能预测某些性状。在紧密连锁的基因座处使用该序列或变体的组合,即,在预定的单元型窗口内定义单元型,比个别处理基因座能提供更多的信息和预测。在连锁的基因座处使用序列组合的其它优点是只需要有一亚类基因座具有关于整个基因组的信息,因为染色体在连锁不平衡区组(单元型窗口)中遗传,并且来自一个区组的选择的基因座(标记基因座)处的序列信息能够提供关于该区组上所有基因座的信息。实施例4.使用HT测序的分子指纹分析(序列指导的指纹分析)本发明提供比现有技术更有效和更经济的方法,其涉及多个遗传多态性的基于PCR的检测。在此,扩增选择的大豆多态性区域/基因座,然后直接使用HT测序进行基因型分型。在本实施例中,使用IlluminaGenomeAnalyzerHT测序技术评价了1536个基因座。本实施例也提供了间接测序方法,其中将等位基因特异性标签引入相应的模板中,使得只需要对标签进行测序以推断多态性。如图2-5所示,有多种策略用于降低基因组复杂性。为了指纹分析,可以使用本领域已知的一个或多个复杂性降低方法。在本实施例中,调节现有的基于PCR的SNP分析,以靶向已知的多态性,其中如图4所示使用对应于SNP的PCR引物(直接指纹分析),或者如图5所示使用等位基因特异性延伸/连接(间接指纹分析)。调节现有的SNP文库对于参考一个或多个含有一组核心SNP的历史基因型信息的数据库特别有利。然后,为了能够复合样品掺入DNA标签。在本实施例中,复合组中的每个样品被分配有独特的DNA标签,即,与该组中的其它条码有至少一个碱基对不同的序列标签。在一个优选方面,平衡G和C碱基的百分比,以使测序过程中的偏差减至最小。DNA标签的长度可以在大约2bp到大约20bp的范围内。在本实施例中,对于96个样品(种质样品),5bp序列用于DNA标签,每个DNA标签有2个或更多的核苷酸不同(表2)。将这些样品DNA标签引入等位基因特异性标签中,并且利用PCR将这些等位基因特异性寡核苷酸加入到等位基因特异性延伸/连接计划中。在另一方面,可以使用连接反应将等位基因特异性标签加入到延伸/连接产物中。表2.用于96个样品的示例性的5核苷酸DNA标签。?L密码孔密码孔密码孔密码~~ΠAAGCT~~Α4CAAGA~~Α7CTGTC~~AlOGTTCA~~ACACA~~Β4CACAG~~Β7CTTAG~~BlOGTTTC~~ClACAGC~~C4CACGT~~C7CTTCT~~ClOTACCT~D1ACCAG~~D4CACTC~~D7GAACA~~DlOTACGC~~ElACCTA~~E4CAGAC~~E7GAATC~~ElOTACTG~~FlACGAA~~F4CAGCA~~F7GACAT~~FlOTAGGT~~GlACGGT~~G4CAGTG~~G7GACGA~~GlOTAGTC~~HlACGTC~~H4CATCC~~H7GAGAG~~HlOTATCG~~A2ACTAC~~A5CCAAG~~A8GATAC~~AllTCATCB2ACTCT~~B5CCCAA~~B8GATGT~~BllTCCACC2AGACTC5CCTATC8GATTGCllTCCCAD2AGCAC~~D5CCTGA~~D8GCAAC~~DllTCGAT<table>tableseeoriginaldocumentpage34</column></row><table>该指纹分析实施例包括1536个大豆SNP,其中将每个SNP处理为二等位基因的,因此具有两个等位基因特异性寡核苷酸(等位基因特异性标签加样品DNA标签)和一个基因座特异性寡核苷酸(图7)。基因座特异性寡核苷酸在3'末端包含通用连接体序列,在此为GTCTGCCTATAGTGAG,通用连接体序列也可以是下游测序所需的引物的一部分(即,11IuminaPCR2.1引物)。等位基因特异性寡核苷酸的长度大约为15个核苷酸,具有平衡的解链温度。为了制备用于测序的模板,如上所述对每个组织样品制备DNA。为了产生等位基因特异性延伸/连接产物,将等位基因特异性标签和基因座特异性寡核苷酸与模板混合,开始时在70°C加热,然后逐渐冷却,接着对于DNA聚合酶和连接酶反应45°C15分钟,如图5所示。延伸/连接后,使用本领域已知的磁珠纯化产物。随后进行PCR以添加样品DNA标签,样品DNA标签紧靠等位基因特异性标签添加,如图12所示。使用96个(x2)正向引物,对应于96个种质样品。另外,向5'末端添加IlluminaGenomeAnalyzer基因组测序引物,其中该序列的5'末端为ACACTCTTTCCCTACACGACGCTCTTCCGATCT+5-nt样品条码(96种形式)+15/16-nt等位基因密码(2种形式)。使用一种反向引物,其对应于通用连接体序列,并且向该反向引物的5'末端添加IlluminaGenomeAnalyzerPCR引物2.1,其中该序列的3'末端为CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT+CTCACTATAGGCAGAC。按照标准PCR方案,将PCR主混合物连同0.3U高保真度DNA聚合酶一起添加到5μL延伸/连接产物中,反应终浓度为0.16μM引物,0.ImMdNTP,终体积为25μL。将板于95°C加热9分钟以变性DNA。然后使用以下条件完成15个PCR循环94°C30sec,50°C30sec,72°C2min,最后在72°C下延伸10分钟。按照IlluminaGenomeAnalyzer的说明使用富集PCR扩增大约5-lOng纯化的模板。如果连接体没有被引入引物中的话,富集PCR也添加下游桥连PCR反应所需的连接体。再次使用本领域所知的PCR纯化方法纯化富集PCR产物,并且按照IlluminaGenomeAnalyzer的说明对产生的模板进行测序。从测序反应获得的序列根据DNA标签序列和等位基因特异性标签序列进行装箱。图13显示标记和大豆样品的成功率,几乎90%的标记和种质具有90-100%的检出率(callrate)。本实施例使用等位基因特异性标签,其在序列解析具有优点,使得样品的基因型可以根据前20个碱基对分配,因为前5个碱基对确定种质样品,而后来的15个碱基对代表等位基因。在其它实施方案中,DNA标签可以短至2个碱基对,并且等位基因特异性标签可以短至两个碱基对,以进一步减少基因型分型所需的序列读数。在一个优选实施方案中,本发明的方法涉及根据复合程度,基于恰好2个碱基对的标签推断基因型。在另一方面,本发明的方法涉及基于单碱基对推断基因型。同时产生大量指纹数据的能力,加上用连续序列饱和特定区域或者调节单元型、染色体或者甚至基因组中已知多态性位点的指纹数据的灵活性,为种质改良活动、确定目标基因组区域的实验工作、质量保证和控制和监测IP保护提供了有价值的工具。实施例5.使用DNA标记的随机引物的复杂性降低测序本发明的一个方面是同时对多个核酸模板进行测序的能力,该多个核酸模板可以包括来自不同个体或集合个体的样品以及多个基因座。在该实施例中,我们使用用编码系统标记的随机引物(六聚体到十聚体,这取决于计划)。该编码系统由从2个核苷酸到随机引物长度的一半不等的一系列非天然核苷酸序列组成。产生用至少两个DNA标签标记的随机引物的混合物,以扩增和鉴定任何数目的基因组或基因组部分。然后通过任何测序方法确定扩增的序列,这些方法包括但不限于使用ABI3730或类似平台的Sanger测序、使用454或类似平台的焦磷酸测序,以及使用IlluminaGenomeAnalyzer测序设备或类似平台的合成测序。预期该方法将在新测序技术出现时用在这些技术上面。本发明此方面允许研究人员合并DNA样品,这为测序节约了有价值的金钱和时间资源。为了同时评价多个基因组或基因组区域,使用一组不同的DNA标记的随机引物独立扩增每个模板。随机引物的长度取决于基因组的复杂性水平;重复序列越多,选择性排除这些区域就需要越长的引物。一旦基因组被扩增,它们就可以通过给定测序技术特定的标准方法纯化。为了使后面的步骤更容易,随机引物也可以用捕获分子如生物素标记。扩增后,纯化的DNA可以通过任何核酸测序方法测序,并且进行比较,以确定基因组多样性以及是哪些特定基因组导致多样性。本发明的使用可以不使用DNA标签,但是一旦为了测序而合并,就没有办法将序列“分开”,并且需要通过测序或特定基因型分型反应进行进一步的评价。该方法提供将序列标签应用于多重基因组测序和基因型分型的非常新型的方法。实施例6.挖掘罕见等位基因使用直接核酸序列数据能够检测植物基因组中的罕见等位基因或单元型。对于在育种计划中寻找罕见但是重要的基因组区域来说,这是特别重要的,例如来自外来的或未适应的(imadapted)种质的抗病性基因座,其中罕见的等位基因被定义为在种质库内低频率出现,并且可能以前在该种质库内未检测到。本实施例提供罕见等位基因的检测方法、实验设计(即选择外来种质、具有已知目的表型的种质、筛选非优良gp)和应用(即,特定性状的有益罕见变体的渗入计划和/或在一个或多个特定种质库中如每个成熟度区域扩大种质多样性)。提供包含至少2份种质的一组种质。影响纳入至少一个基因座的测序计划中的非限制性因素包括种质来源或地理、至少一个目的基因型、至少一个目的表型、杂种杂交中的表现、转基因的表现、和种质或关于种质及其表现的预测的其它发现。使用此处提供的方法,对至少2份种质的至少一个碱基对进行测序。使用本领域已知的序列比对和计算机评价方法,确定差异和相似性并与来源种质进行关联。确定目的等位基因后,可以作出选择决定。在罕见等位基因的挖掘中,罕见等位基因可以与已知的表型相关联。另外,罕见等位基因的确定可以为其它的表型分型、关联研究和其它试验提供基础,以评价罕见等位基因对植物表型和育种表现的影响。此外,罕见等位基因的直接核酸序列可以通过本领域已知的和此处描述的方法立即确定,以用作标记,以在其它种质中检测该罕见等位基因,用作选择的基础,以及促进该罕见等位基因向缺乏该罕见等位基因的种质中渗入。在其它方面,使用本领域已知的方法分离罕见等位基因,并且将分离的核酸转化到植物中,以赋予接受植物优选的表型。接受植物随后可以用作转换程序的供体,以为了性状整合目的与优良种质杂交。罕见等位基因的鉴定可用于挖掘任何种质库(S卩,一组2份或更多份种质)的全部遗传潜力。这可用于确定育种杂交策略、提高2个或多个种质库之间的多样性、评价杂种优势库、以及帮助作出育种决定。高通量测序既加速了等位基因的鉴定又允许同时检测罕见等位基因和鉴定相关标记。权利要求一种植物育种方法,包括确定育种群体中至少一个或多个植物的基因组内多个核酸的序列;将每个核酸序列与一个数值相关联;和基于该数值对所述一个或多个植物作出至少一个植物育种决定。2.权利要求1的方法,其中所述植物选自饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物、糖料作物、饮料作物、块茎作物、块根作物和森林作物。3.权利要求1的方法,其中所述数值是核酸序列效应估计值。4.权利要求1的方法,其中所述数值是育种值。5.权利要求1的方法,其中所述数值是核酸频率。6.权利要求1的方法,其中所述表型性状选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、不育性、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状。7.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括基于所述至少一个数值在育种群体中选择。8.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括基于所述至少一个数值在一个或多个育种群体中选择后代。9.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括预测亲本品系的后代表现,和基于预测的后代表现选择亲本品系。10.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括为杂种种子生产选择测交系。11.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括基于所述至少一个数值在种质改良活动中发展品系。12.权利要求11的方法,其中所述种质改良活动选自品系和品种开发、杂种开发、转基因事件选择,进行育种杂交、通过自体受精测试和发展植物、品系或亚系的纯化、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、和使用植物或其部分进行诱变。13.权利要求1的方法,其中所述作出至少一个植物育种决定的步骤包括基于至少一个与另一表型性状相关的数值选择至少一个表型性状。14.一种植物育种方法,该方法包括;提供至少两个植物,其中已经对该至少两个植物中的每一个确定了至少一个基因座的至少一个核酸的序列信息;对所述至少一个基因座的至少两个核酸序列确定对于至少一个表型性状的核酸序列效应估计值;和基于确定的对于至少一个表型性状的核酸序列效应估计值作出至少一个植物育种决定。15.权利要求14的方法,其中所述植物选自饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物、糖料作物、饮料作物、块茎作物、块根作物和森林作物。16.权利要求14的方法,其中所述表型性状选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、不育性、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状。17.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括基于一个或多个确定的核酸效应估计值在育种群体中选择。18.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括基于一个或多个确定的核酸效应估计值在一个或多个育种群体的后代中选择。19.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括基于一个或多个确定的核酸效应估计值选择亲本品系的预测的后代表现,和基于预测的后代表现在亲本品系中选择。20.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括为杂种种子生产选择测交系。21.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括基于一个或多个确定的核酸效应估计值在种质改良活动中发展品系。22.权利要求21的方法,其中所述种质改良活动选自品系和品种开发、杂种开发、转基因事件选择,进行育种杂交、通过自体受精测试和发展植物、品系或亚系的纯化、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、和使用植物或其部分进行诱变。23.权利要求14的方法,其中所述作出至少一个植物育种决定的步骤包括基于至少一个与另一表型性状相关的数值选择至少一个表型性状。24.一种植物育种方法,该方法包括建立定义育种群体基因组内的多个基因座的指纹图谱;将具有已知图谱位置的QTL等位基因与作图群体中的表型性状相关联;使用与表型性状相关联的多个基因座中的至少一个的至少一个核酸序列检测至少一个其它植物中QTL等位基因的存在。25.权利要求24的方法,其中所述植物选自饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物、糖料作物、饮料作物、块茎作物、块根作物和森林作物。26.权利要求24的方法,其中所述表型性状选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、不育性、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状。27.权利要求24的方法,其中该方法进一步包括基于预测的表型性状的表达在育种群体中选择。28.权利要求24的方法,其中所述植物育种决定包括在一个或多个育种群体中的后代中选择。29.权利要求24的方法,其中所述植物育种决定包括预测亲本品系的后代表现,和基于预测的后代表现在亲本品系中选择。30.权利要求24的方法,其中所述植物育种决定包括为杂种种子生产选择测交系。31.权利要求24的方法,其中所述植物育种决定包括在种质改良活动中发展品系。32.权利要求31的方法,其中所述种质改良活动选自品系和品种开发、杂种开发、转基因事件选择,进行育种杂交、通过自体受精测试和发展植物、品系或亚系的纯化、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、和使用植物或其部分进行诱变。33.权利要求24的方法,其中所述植物育种决定包括基于至少一个与另一表型性状相关联的数值选择至少一个表型性状。34.权利要求24的方法,其中所述检测的核酸序列是等位基因特异性标签。35.一种标记辅助的育种方法,包括提供包括至少两个植物的育种群体;将至少一个表型性状与育种群体的植物的基因组的至少一个基因座相关联,其中该基因座由至少一个核酸序列定义;和检测该育种群体的后代植物中与至少一个表型性状相关联的该至少一个基因座的至少一个核酸序列的存在;和对该育种群体的一个或多个后代作出植物育种决定。36.权利要求35的方法,其中所述植物选自饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物、糖料作物、饮料作物、块茎作物、块根作物和森林作物。37.权利要求35的方法,其中所述表型性状选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、不育性、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状。38.权利要求35的方法,其中所述植物育种决定包括在育种群体中选择。39.权利要求35的方法,其中所述植物育种决定包括在育种群体的后代中选择。40.权利要求35的方法,其中所述植物育种决定包括预测后代表现和基于预测的后代表现在亲本品系中选择。41.权利要求35的方法,其中所述植物育种决定包括为杂种种子生产选择测交系。42.权利要求35的方法,其中所述植物育种决定包括在种质改良活动中发展品系。43.权利要求42的方法,其中所述种质改良活动选自品系和品种开发、杂种开发、转基因事件选择,进行育种杂交、通过自体受精测试和发展植物、品系或亚系的纯化、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、和使用植物或其部分进行诱变。44.权利要求35的方法,其中所述植物育种决定包括基于至少一个与另一表型性状相关联的数值选择至少一个表型性状。45.权利要求35的方法,其中所述检测的核酸序列是等位基因特异性标签。46.一种选择用于育种计划的育种群体的方法,包括提供至少两个不同的育种群体;对所述育种群体的至少一个基因座的至少两个核酸使用对于至少一个表型性状的多个育种值;和基于至少一个育种值选择至少一个育种群体。47.权利要求46的方法,其中所述育种群体包括选自饲料作物、油籽作物、谷类作物、水果作物、观赏植物、蔬菜作物、纤维作物、香料作物、坚果作物、草料作物、糖料作物、饮料作物、块茎作物、块根作物和森林作物的植物。48.权利要求46的方法,其中对至少一个表型性状计算所述育种值,所述表型性状选自除草剂耐受性、抗病性、昆虫或害虫抗性、改变的脂肪酸、蛋白质或碳水化合物代谢、增加的谷物产量、增加的油、增加的营养成分含量、提高的生长速度、增强的应激耐受性、优选的成熟度、增强的感官特性、改变的形态特征、不育性、其它农学性状、用于工业应用的性状、或对消费者有提高的吸引力的性状。49.权利要求46的方法,其中所述育种群体在种质改良活动中使用。50.权利要求49的方法,其中所述种质改良活动选自品系和品种开发、杂种开发、转基因事件选择,进行育种杂交、通过自体受精测试和发展植物、品系或亚系的纯化、使用植物或其部分进行转化、使用植物或其部分作为表达构建体的候选物、和使用植物或其部分进行诱变。全文摘要本发明提供利用直接核酸序列信息提高植物种质的育种方法和组合物。所述方法描述了植物育种群体的种质中优选的核酸序列的鉴定和积累。文档编号A01H1/04GK101802219SQ200880024977公开日2010年8月11日申请日期2008年6月9日优先权日2007年6月8日发明者F·董,F·阿查德,N·陶,S·埃辛顿,S·多森,Z·玛卡丁申请人:孟山都技术公司