推。
[0139] 如本文所用,术语"连锁"用于描述一个标记基因座与另一个标记基因座或一些其 它基因座(例如热带锈病基因座)相关联的程度。分子标记和表型(例如增强的热带锈病 抗性)之间的连锁关系用"概率"或"调整概率"表示。连锁可以用期望的限度或范围表达。 例如在一些实施方案中,当标记分离距离为小于50、40、30、25、20、或15图谱单位(或〇]?) 时,任何标记与任何其它标记连锁(基因上和物理上)。在一些方面,限定加括号的连锁范 围是有利的,例如介于10cM和20cM之间,介于10cM和30cM之间,或者介于10cM和40cM之 间。标记与第二基因座的连锁越紧密,标记对第二基因座的指示效果越好。因此,"紧密连锁 的基因座"如标记基因座和第二基因座显示10%或更低,优选约9%或更低,更优选约8% 或更低,更优选约7 %或更低,更优选约6 %或更低,更优选约5 %或更低,更优选约4 %或更 低,更优选约3%或更低,更优选约2%或更低的基因座内重组频率。在高度优选的实施方 案中,关联基因座显示约1 %或更低的重组频率,例如约〇. 75%或更低,更优选约0. 5%或 更低,更优选约〇. 25%或更低的重组频率。位于相同染色体上,并且它们间的距离使得两 个基因座间的重组发生频率小于10% (例如约9%、8%、7%、6%、5%、4%、3%、2%、1%、 0. 75%、0. 5%、0. 25%、或更低)的两个基因座也称为彼此"接近"。因为一 cM是显示出1% 的重组频率的两个标记之间的距离,任何标记与接近的任何其它标记紧密连锁(基因上和 物理上),例如等于或小于10cM的距离。相同染色体上的两个紧密连锁的标记可被彼此定 位于 9、8、7、6、5、4、3、2、1、0.75、0.5或0.25〇]?或更小。
[0140] 术语"连锁不平衡"指基因座或性状(或者两者都有)非随机地分离。在任一情 况下,连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近,以便它们以大 于随机(即非随机)的频率一起分离(在共分离性状的情况下,产生该性状的基因座彼此 足够接近)。显示连锁不平衡的标记被认为是连锁的。连锁基因座在超过50 %的情况下共 分离,例如约51%至约100%的情况。换句话说,共分离的两个标记具有小于50% (并且 根据定义,在相同连锁群上分离距离小于50cM)的重组频率。如本文所用,连锁可存在于两 个标记或者标记和表型之间。标记基因座可与性状"相关联"(连锁),例如对热带锈病的 抗性。测量分子标记与表型性状的连锁程度,例如分子标记与表型共分尚的统计学概率。
[0141] 连锁不平衡最常见地用量度r2测量,它通过Hill,W.G?和Robertson,A,Theor. Appl. Genet. 38 :226-231 (1968)。当r2= 1时,两个标记基因座间存在完全的LD,意味着标 记还未进行重组分离并且具有相同的等位基因频率。r2值大于1/3指示足够强的LD将被 用于作图(Ardlie 等人,Nature Reviews Genetics 3 :299_309(2002))。因此,当成对标记 基因座间的r2值大于或等于0. 33、0. 4、0. 5、0. 6、0. 7、0. 8、0. 9、或1. 0时,等位基因处于连 锁不平衡。
[0142] 如本文所用,"连锁平衡"描述其中两个标记独立地分离的情况,即,在子代中随机 分离。认为显示连锁平衡的标记不连锁(无论它们是否位于相同染色体上)。
[0143] "基因座"是基因或标记位于染色体上的位点。
[0144] "优势对数(L0D)值"或 "L0D 评分"(Risch,Science 255 :803-804 (1992))用于 区间作图以描述两个标记基因座之间的连锁程度。两个标记间L0D评分为三指示连锁概率 比无连锁的概率高1000倍,而L0D评分为二指示连锁概率比无连锁的概率高100倍。大于 或等于二的L0D评分可用于检测连锁。
[0145] "玉米"指玉米属(Zea mays L. ssp. mays)植株,也称为玉蜀黍。
[0146] 术语"玉米植株"包括:整个玉米植株、玉米植株细胞、玉米植株原生质体、可从其 中再生玉米植株的玉米植株细胞或玉米组织培养物、玉米植株愈伤组织和玉米植株中的完 整玉米植株细胞或玉米植株部分,如玉米种子、玉米芯、玉米花、玉米子叶、玉米叶、玉米茎、 玉米芽、玉米根、玉米根尖等。
[0147] "标记"是用作参考点的核苷酸序列或其编码产物(例如蛋白)。标记能够来源于 基因组核苷酸序列或表达的核苷酸序列(例如来源于剪接的RNA或cDNA),或来源于编码 的多肽。该术语也指与标记序列互补或侧接标记序列的核酸序列,如用作探针或能够扩增 标记序列的引物对的核酸。
[0148] 对应于种群成员之间的遗传多态性的标记能够通过本领域已建立的方法进行检 测。这些方法包括例如DNA测序、基于PCR的序列特异性扩增方法、限制性片段长度多态性 检测(RFLP)、同功酶标记检测、通过等位基因特异性杂交(ASH)进行的多核苷酸多态性检 测、植株基因组的扩增可变序列检测、自主序列复制检测、简单重复序列检测(SSR)、单核苷 酸多态性检测(SNP)、或扩增片段长度多态性检测(AFLP)。已经建立的方法也已知用于检 测表达序列标签(EST)和来源于EST序列的SSR标记以及随机扩增的多态性DNA(RAPD)。
[0149] "标记等位基因"或者"标记基因座的等位基因"可以指种群中位于标记基因座的 多个多态性核苷酸序列的其中一个,它就标记基因座而言是多态的。
[0150] "标记辅助选择"(MAS)是基于标记基因型选择个体植株的方法。
[0151] "标记辅助反选"是一种通过它将标记基因型用于鉴定植株的方法,所述植株将不 被选择,使得它们被从育种程序或种植中除去。
[0152] "标记基因座"是物种基因组中的特定染色体位点,其中可存在特定标记。"标记基 因座"可用于追踪存在的第二连接基因座,例如编码或有助于表达表型性状的连接的基因 座。例如标记基因座能够用于监控等位基因在某一基因座的分离,如基因或QTL,它们与标 记基因座在遗传上或在物理上连锁。
[0153] "标记探针"是可用于通过核酸杂交鉴定标记基因座存在与否的核酸序列或分子, 例如与标记基因座序列互补的核酸分子探针。包含标记基因座的30个或更多连续的核苷 酸("全部或部分"标记基因座序列)的标记探针可用于核酸杂交。作为另外一种选择,在 某些方面标记探针指能够区别(即基因型)存在于标记基因座上的特定等位基因的任何类 型的探针。当核酸在溶液中特异性"杂交"或配对时,例如根据Watson-Crick碱基配对原 则杂交,核酸是"互补的"。
[0154] 如上所述,当鉴定连锁基因座时,术语"分子标记"可用于指遗传标记,或其用作参 照点的编码产物(例如,蛋白质)。标记能够来源于基因组核苷酸序列或表达的核苷酸序 列(例如来源于剪接的RNA、cDNA等),或来源于编码的多肽。该术语也指与标记序列互补 或侧接标记序列的核酸序列,如用作探针或能够扩增标记序列的引物对的核酸。"分子标记 探针"是可用于通过核酸杂交鉴定标记基因座存在与否的核酸序列或分子,例如与标记基 因座序列互补的核酸分子探针。作为另外一种选择,在某些方面分子探针指能够区别(即 基因型)存在于标记基因座上的特定等位基因的任何类型的探针。当核酸在溶液中特异性 "杂交"时,例如根据Watson-Crick碱基配对原则杂交,核酸是"互补的"。本文所述的一些 标记当位于插入缺失区域例如本文所述的非共线区域时也称为杂交标记。这是因为插入区 域根据定义是相对无插入序列的植株的多态性。因此,所述标记仅需要指示插入缺失区域 是否存在。任何合适的标记检测技术可用于鉴定此类杂交标记,例如在本文提供的实例中 使用SNP技术。
[0155] "热带锈病"是由病原体玉米壳锈菌(Physopella zeae(Mains) Cummins&Ramachar)(与Angiopsora zeae Mains同义)引起的病害。该病害特征在于在 玉米叶片上形成小的黄色圆形脓疱。这些夏孢子阶段脓疱常常以小群存在并且叶片表皮 层覆盖发展中的夏孢子。倒卵球形至椭圆形的夏孢子通过在表皮层中形成的小缝或小孔 释放。虽然夏孢子是几乎无色的,它们的释放使得脓疱具有白色或奶油色的外观。一些 玉米基因型显示具有较暗颜色(红色至略带紫色的颜色)的脓疱,其与较传统的白色/ 奶油色夏孢子不同。在夏孢子阶段形成后也可发展成具有水泡状外观的冬孢子阶段。冬 孢子(褐色至黑色)可在冬孢子堆内发育,所述冬孢子堆围绕着现有的夏孢子脓疱形成。 (Donald G. White,ed. 1999. Compendium of corn diseases。第三版,APS Press,ISBN 0-89054-234-1) 〇
[0156]"南方锈病"是由病原体多堆柄锈菌(Puccinia polysora Underw)引起的病害。该 病害特征在于主要在叶片上表面上、但是偶尔会在叶片下表面上形成小的黄色圆形脓疱, 夏孢子最常见地在靠近叶中脉处形成。这些夏孢子脓疱包含倒卵球形至椭圆形的夏孢子, 其颜色通常为橙色至橙红色。脓疱通常为圆形至椭圆形并且在叶片上非常多。这种病原体 也可在穗壳、穗柄和叶鞘上形成夏孢子脓疱。已知存在冬孢子阶段,在冬孢子堆中形成暗褐 色至黑色的冬孢子,所述冬孢子堆存在于围绕现有夏孢子堆的半圆至圆形内。
[0157]"核苷酸序列"、"多核苷酸"、"核酸序列"和"核酸片段"可互换使用,并且指作为 单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。"核苷 酸"是构成DNA或RNA聚合物的单体单元,它由嘌呤或嘧啶碱基、戊糖和磷酸基组成。核苷 酸(通常以它们的5'-单磷酸形式存在)通过它们下述的单字母命名法指:"A"指腺苷酸 或脱氧腺苷酸(分别用于RNA或DNA),"C"指胞苷酸或脱氧胞苷酸,"G"指鸟苷酸或脱氧鸟 苷酸,"U"指尿苷酸,"T"指脱氧胸苷酸,"R"指嘌呤(A或G),"Y"指嘧啶(C或T),"K"指G 或T,"H"指A或C或T," I "指肌苷,"N"指任何核苷酸。
[0158] 表型关系图是基于许多特性的总体相似度、不考虑进化史或特定特性的假定显著 性来描绘生物体间的分类学关系的图,通常由计算机产生。
[0159] 术语"表型"或"表型性状"或"性状"指生物的一个或多个性状。表型能够用肉眼 或者本领域已知的任何其它评价手段观察到,例如显微镜法、生物化学分析、或电装置检测 分析法。在某些情况下,表型由单个基因或基因座直接控制,即"单基因性状"。在其它情况 下,表型是若干个基因的结果。
[0160] "系统发育树"是显示不同生物物种或实体间的推断进化关系的图,所述推断基于 它们的物理和/或基因特性的相似度和差异。可使用多种方法构建它们,包括但不限于距 离-矩阵法如连续法或UPGMA,它们从多重序列比对中计算遗传距离。
[0161] 基因组的"物理图谱"是显示染色体DNA上可辨认的界标(包括基因、标记等)的 线性顺序的图谱。然而与基因图谱相比,界标间的距离是绝对的(例如以碱基对测量的或 分离的或重叠的连续基因片段)并且不基于基因重组。
[0162] "植株"可为整个植株、其任何部分、或来源于植株的细胞或组织培养物。因此,术 语"植株"可指代以下任何一种材料:整个植株、植株部分或器官(例如叶片、茎、根等)、植 株组织、种子、植株细胞、和/或子代的相同材料。植株细胞是从植株中获取的细胞或来源 于从植株中所获取细胞经培养出的细胞。
[0163] "多态性"是DNA中的变型,它过于常见而不仅仅由突变产生。多态性在种群中必 须具有至少1%的频率。多态性可以是单核苷酸多态性或SNP、或插入/缺失多态性,所述 插入/缺失多态性本文也称为"插入缺失"。
[0164] "概率值"或"p值"是表型的特定组合和特定标记等位基因的存在或不存在是否 随机的统计学概率。因此,概率评分越低,表型和特性标记将共分离的可能性越大。在某些 方面,认为概率评分是"显著的"或"不显著的"。在一些实施方案中,认为随机分离的概率 评分为〇. 05(P= 0. 05,或5 %的概率)是共分离的显著性指示。然而,可接受的概率可为 小于50% (p = 0. 5)的任何概率。例如,显著概率可小于0. 25、小于0. 20、小于0. 15、小于 0. 1、小于0. 05、小于0. 01、或小于0. 001。
[0165] 每个"PHM"标记代表当用于扩增特定DNA片段的巢式PCR时的两组引物(外部引 物和内部引物)。一组外部引物用于第一轮PCR,之后内部序列用于对第一轮PCR的产物进 行第二轮PCR。这提高了反应的特异性。本文所述的全部PHM标记在表2中列出,并且这些 引物的退火温度为55°C。
[0166] "产品标记"或"生产SNP标记"是已经为高通量目的而开发的标记。开发生产SNP 标记以使用PHM标记和巢式PCR分析鉴定特定多态性(参见例如表1中的PHM1192-26-U)。 设计生产SNP标记以与Invader P〗us:fc (Third Wave Technologies)平台一起使用。
[0167] "参考序列"是用作序列比对基准的限定序列。参考序列通过基因分型在该基因座 的多个品系、在序列比对程序中比对核苷酸序列(例如Sequencher)、然后获取比对的共有 序列而获得。因此,参考序列鉴定在基因座等位基因中的多态性。参考序列可以不是实际 DNA序列的拷贝;然而,设计引物和探针用于基因座中的实际多态性是有用的。
[0168] 术语"子代"指杂交产生的后代。
[0169] "子代植株"从两个植株间的杂交生成。
[0170] 术语"数量性状基因座"或"QTL"指在至少一种遗传背景下(例如在至少一个育 种种群中),具有与表型性状的差异表达关联的DNA区域。QTL与基因或引起所讨论的性状 的基因紧密连锁。
[0171]"顶交测试"是用来源于每个亲本与相同测试者(通常是纯合品系)杂交的子代进 行的测试。测试亲本可为自由授粉的品种、杂交品系或自交系。
[0172] 短语"在严格条件下"指在该条件下探针或多核苷酸将与特定核酸序列杂交,杂交 通常在核酸混合物中进行,但是基本上无其它序列。严格条件是序列依赖性的并将因不同 的环境而异。
[0173]标记的"不利等位基因"是与不利植株表型共分离的标记等位基因,因此提供鉴定 能从育种程序或栽培中移除的植株的有益效果。
[0174]较长序列具体地在较高温度下杂交。特定序列在限定离子强度、pH的情况下,严 格条件通常选择比热解链温度(Tm)低约3-5°C。Tm是(在限定离子强度、pH和核酸浓度 的情况下)50%与靶互补的探针平衡杂交到靶序列上(因为存在的靶序列过多,在Tm 50% 的探针被平衡占用)的温度。严格条件将是如下那些条件:在pH为7. 0-8. 3下盐浓度低于 约1. 0M钠离子,通常约0. 01-1. 0M钠离子浓度(或其它盐),并且对于短探针(例如10-50 个核苷酸)温度为至少约30°C,而对于长的探针(例如多于50个核苷酸)温度为至少约 60°C。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。就选择性杂交或特 异性杂交而言,阳性信号是至少两倍于背景,优选10倍于背景杂交。示例性的严格杂交条 件通常是:50%的甲酰胺,5x SSC,和1%的SDS,在42°C下孵育,或者5x SSC,1%的SDS,在 65°C下孵育,并用0. 2x SSC以及0. 1%的SDS在65°C下洗涤。就PCR而言,约36°C的温度 是典型的低严格扩增,而退火温度取决于引物长度,其可介于约50°C和65°C之间。决定杂 交参数的附加准则在多个参考文献中被提供。
[0175]序列比对和百分比同一性可用设计用于检测同源序列的多种比较方法来测定,这 些方法包括但不限于LASEROEME1^物信息计算包(DNASTAR? Inc.,Madison, WI)的MEGALIGW程序。除非另行指出,本文提供的序列的多重比对用Clustal V比对 方法(Higgins和Sharp,CABI0S. 5 :151-153 (1989))采用默认参数(空位罚分=10,空位 长度罚分=10)执行。成对比对和使用Clustal V方法的蛋白序列百分比同一性计算的默 认参数是KTUPLE = 1,空位罚分=3,窗=5,DIAGONALS SAVED = 5。就核酸而言,这些参 数为 KTUPLE = 2,空位罚分=5,窗=4,DIAGONALS SAVED = 4。在使用 Clustal V 程序的 序列比对后,观看相同程序上的"序列距离"表可能获得"百分比同一性"和"趋异度"值;除 非另行指出,本文提供的和申明的百分比同一性和趋异度是以该方式计算。
[0176]"Clustal V序列比对方法"对应于Clustal V标记的比对方法(描述于Higgins and Sharp,CABI0S. 5:151-153 (1989) ;Higgins,D.G?等人(1992) Comput.Appl.Biosci. 8: 189-191)并存在于LASERGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的MegAlignTM 程序中。对于多重比对,默认参数对应于空位罚分=10和空位长度罚分=10。成对比对 和使用Clustal V方法的蛋白序列百分比同一性计算的默认参数是KTUPLE = 1,空位罚分 =3,窗=5, DIAGONALS SAVED = 5。就核酸而言,这些参数是KTUPLE = 2,空位罚分=5, 窗=4, DIAGONALS SAVED = 4。在使用Clustal V程序的序列比对后,观看相同程序中的 "序列距离"表可能获得"百分比同一性"值。
[0177]本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中 有更全面的描述:Sambrook,J.,Fritsch,E.F?和 Maniatis,T. "Molecular Cloning: A Laboratory Manual',;Cold Spring Harbor Laboratory Press :Cold Spring Harbor, 1989 (下文称为 "Sambrook")。
[0178] 在详述本发明之前,应当了解本发明不受特定实施方案的限制。也应当了解本文 所用的术语仅是为了描述特定实施方案,而不旨在进行限制。当在本文和所附权利要求中 使用时,除非内容清楚地表明,单数和单数形式的术语包括复数指代。因此,例如术语"一个 植株"也包括多个植株;取决于上下文,使用的术语"植株"也可包括该植株遗传相似或相同 的子代;使用的术语"核酸"任选地包括该核酸分子的多个拷贝。
[0179] 热带锈病抗件
[0180] 热带锈病是由病原体玉米壳锈菌(Physopella zeae)引起的玉米真菌病害。与热 带锈病抗性相关联的分子标记和等位基因的鉴定仅基于子代的基因组成进行选择。本文提 供了通过评价基因组成(使用分子标记和它们的等位基因进行评价)鉴定并选择具有增强 热带锈病抗性的玉米植株的方法。
[0181] 基_作图
[0182] 在相当一段时间内已经认识到生物基因组中与特定表型如热