本申请是申请日为2015年9月21的中国专利申请201580051730.7“小麦ms1多核苷酸、多肽以及使用方法”的分案申请。
本发明涉及植物分子生物学领域,更具体地讲,涉及影响雄性能育性。
以电子方式提交的序列表的引用
通过efs-web以电子方式将序列表的正式文本作为ascii格式的序列表文件提交,该文件名称为rts20250d-pct_st25.txt,最后修改日期为2015年9月21日,文件大小为79kb,并且该文件与本说明书同时提交。在该ascii格式的文件中包含的序列表是本说明书的一部分,并且全文以引用方式并入本文。
背景技术:
杂交植物育种的发展已使产生的作物在质量和数量方面取得相当大的进展成为可能。由于经过了杂交过程,故收率增加,所需特性的组合诸如对病害和虫害的抗性、耐热性和耐旱性,以及植物组成发生变化都可能出现。这些过程在很多情况下主要依赖于提供向雌性亲本贡献花粉的雄性亲本以产生所得的杂交体。
大田作物通过利用植物的授粉方法的技术进行育种。如果来自植物的一朵花的花粉转移到同一植物或遗传上相同的植物的同一朵花或另一朵花,则植物自花授粉。如果花粉来自遗传上不同的植物的花,则植物异花授粉。
在某些物种中,诸如芸苔(brassicacampestris),植物通常自体不育,并且只能够异花授粉。在主要为自花授粉的物种(诸如大豆、小麦和棉花)中,雄性和雌性植物处于解剖学上的并置关系,使得在天然授粉过程中,给定花的雄性繁殖器官对同一朵花的雌性繁殖器官授粉。
普通小麦(triticumaestivum)是具有限定基因组a、b和d的三对同源染色体的六倍体植物。小麦籽粒的胚乳包括来自母本细胞的两个单倍体补体和来自父本细胞的一个单倍体补体。小麦籽粒的胚包括来自母本细胞和父本细胞中的每一者的一个单倍体补体。六倍性被认为是研究和开发小麦的可用变体的过程中的重大障碍。实际上,人们对小麦的同源基因如何相互作用、如何调控这些同源基因的表达、以及由同源基因产生的不同蛋白质如何独立或协同地发挥作用方面知之甚少。操纵雄性能育性多核苷酸在小麦中的表达的策略将需要考虑各个小麦品种的倍性水平。普通小麦是包含被指定为a、b和d的三个基因组的六倍体(n=21);每个基因组包含七对非同源染色体。单粒小麦品种是二倍体(n=7),而二粒小麦品种是四倍体(n=14)。
用遗传性雄性不育体系进行的大部分工作的必要方面是鉴定影响雄性能育性的基因。这种基因可以在包括本文所述的那些体系在内的多种体系中使用以控制雄性能育性。
技术实现要素:
本发明提供了用于调节植物中的雄性能育性的组合物和方法。该组合物包含表达盒,该表达盒包含可操作地连接至启动子的一个或多个雄性能育性多核苷酸或者其片段或变体中,其中该多核苷酸的表达调节植物的雄性能育性。本发明提供了各种方法,其中影响雄性能育性的多核苷酸或多肽的水平和/或活性在植物或植物部分中受到调节。本发明还提供了用于鉴定和/或选择对于诱导核隐性雄性不育的突变是纯合的或杂合的小麦植物的方法。
具体地,本发明涉及以下方面:
1.一种表达盒,所述表达盒包含可操作地连接至异源启动子的第一多核
苷酸,其中所述多核苷酸包含选自以下的核苷酸序列:
(a)包含seqid1、2、4、7或9的核苷酸序列;
(b)编码包含seqidno:3、5、39或40的氨基酸序列的核苷酸序列;
(c)与seqidno:1、2、4、7或9的全长具有至少85%序列同一性的核苷酸序列,其中所述多核苷酸编码调节雄性能育性的多肽;
(d)包含seqidno:1、2、4、7或9的至少500个连续核苷酸的核苷酸序列,其中所述多核苷酸编码调节雄性能育性的多肽;以及
(e)编码与seqidno:3、5、39或40的全长具有至少85%同一性的多肽的核苷酸序列,其中所述多肽调节雄性能育性。
2.根据项目1所述的表达盒,其中所述表达盒包含含有选自以下的核苷酸序列的第一多核苷酸:
(a)包含seqidno:2或4的核苷酸序列;
(b)与seqidno:2或4的全长具有至少95%序列同一性的核苷酸序列;
(c)编码包含seqidno:3、5、39或40的氨基酸序列的核苷酸序列;以及
(d)编码与seqidno:3、5、39或40的全长具有至少95%序列同一性的氨基酸序列的核苷酸序列。
3.根据项目1或2所述的表达盒,其中所述异源启动子为组成型启动子、诱导型启动子、组织优选的启动子、组织特异性启动子或生长期优选的启动子。
4.根据项目3所述的表达盒,其中所述异源启动子是雄性组织优选的启动子。
5.根据项目1至4中任一项所述的表达盒,所述表达盒还包含可操作地连接至第二启动子的第二多核苷酸,所述第二启动子驱动植物中的表达。
6.根据项目5所述的表达盒,其中所述第二多核苷酸编码干扰雄性配子的功能、形成或传播的多核苷酸或多肽。
7.根据项目6所述的表达盒,其中所述第二多核苷酸编码芽孢杆菌rna酶、dam-甲基化酶、淀粉酶或adp核糖基化酶。
8.根据项目5至7中任一项所述的表达盒,所述表达盒还包含可操作地连接至启动子的第三多核苷酸,其中所述第三多核苷酸编码标记基因产物。
9.根据项目8所述的表达盒,其中所述标记基因产物包括抗生素抗性标记基因产物或可视标记基因产物。
10.一种分离的多肽,所述分离的多肽包含选自以下的氨基酸序列:
(a)包含seqidno:3、5、39或40的氨基酸序列;
(b)与seqidno:3、5、39或40的全长具有至少85%序列同一性的氨基酸序列,其中所述多肽调节雄性能育性;以及
(c)包含seqidno:3、5、39或40的至少200个连续氨基酸的氨基酸序列,其中所述多肽调节雄性能育性。
11.根据项目10所述的分离的多肽,所述分离的多肽包含选自seqidno:3和5的氨基酸序列。
12.一种载体,所述载体包含项目1至9中任一项所述的表达盒。
13.一种植物细胞,所述植物细胞包含根据项目1至2中任一项所述的表达盒。
14.一种植物细胞,所述植物细胞包含根据项目5至9中任一项所述的表达盒。
15.根据项目13至14中任一项所述的植物细胞,其中所述植物细胞来自单子叶植物或双子叶植物。
16.根据项目13所述的植物细胞,其中所述植物是玉米、大麦、粟、小麦、稻、高粱、裸麦、大豆、卡诺拉油菜、苜蓿、向日葵、红花、甘蔗、烟草、拟南芥或棉花。
17.一种植物,所述植物包含根据项目13至16中任一项所述的植物细胞。
18.根据项目17所述的植物,其中当与对照植物比较时,所述植物的雄性能育性受到调节。
19.根据项目18所述的植物,其中当与对照植物比较时,所述植物具有增强的雄性能育性。
20.根据项目17至19中任一项所述的植物,其中所述多核苷酸的表达赋予雄性不育植物雄性能育性。
21.根据项目17至20中任一项所述的植物,其中所述植物是雌性能育植物。
22.根据项目17至21中任一项所述的植物,其中当与对照植物比较时,所述植物的至少一种雄性组织的形成受到调节。
23.根据项目22所述的植物,其中所述雄性组织包括雄蕊、花粉囊、花丝或花粉。
24.根据项目22或23所述的植物,其中至少一种雄性组织的所述受到调节的形成包括至少一种雄性组织的形成增加。
25.根据项目17至24中任一项所述的植物,其中所述第一多核苷酸被稳定地掺入所述植物的基因组中。
28.一种根据项目19至25中任一项所述的植物的种子,其中所述种子包含所述第一异源多核苷酸。
29.一种用于增加植物中的多肽的活性和/或水平的方法,所述方法包括向所述植物提供根据项目10或项目11所述的多肽。
30.一种增加植物中的多肽的活性和/或水平的方法,所述方法包括向所述植物中引入可操作地连接至在所述植物中有活性的启动子的多核苷酸,所述多核苷酸包含选自以下的核苷酸序列:
(a)包含seqidno:1、2、4、7或9的核苷酸序列;
(b)编码包含seqidno:3、5、39或40的氨基酸序列的核苷酸序列;
(c)与seqidno:1、2、4、7或9的全长具有至少85%序列同一性的核苷酸序列,其中所述多核苷酸编码调节雄性能育性的多肽;
(d)包含seqidno:1、2、4、7或9的至少500个连续核苷酸的核苷酸序列,其中所述多核苷酸编码调节雄性能育性的多肽;以及
(e)编码与seqidno:3、5、39或40的全长具有至少85%序列同一性的多肽的核苷酸序列,其中所述多肽调节雄性能育性。
31.根据项目30所述的方法,其中所述多核苷酸包含seqidno:1、2、4、7或9中示出的核苷酸序列。
32.根据项目30至31中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节所述植物中的雄性能育性。
33.根据项目32所述的方法,其中当与对照植物比较时,所述多核苷酸的表达增强所述植物中的雄性能育性。
34.根据项目30至33中任一项所述的方法,其中所述多核苷酸的表达赋予雄性不育植物雄性能育性。
35.根据项目30至34中任一项所述的方法,其中所述植物是雌性能育植物。
36.根据项目30至35中任一项所述的方法,其中所述启动子是组成型启动子、诱导型启动子、组织优选的启动子、组织特异性启动子或生长期优选的启动子。
37.根据项目36所述的方法,其中所述启动子是雄性组织优选的启动子。
38.根据项目30至37中任一项所述的方法,其中当与对照植物比较时,所述多核苷酸的表达调节至少一种雄性组织的形成。
39.根据项目38所述的方法,其中所述雄性组织包括雄蕊、花粉囊、花丝或花粉。
40.根据项目38或39所述的方法,其中至少一种雄性组织的所述受到调节的形成包括至少一种雄性组织的形成增加。
41.一种表达盒,所述表达盒包含可操作地连接至异源多核苷酸的调控元件,其中所述调控元件是包含选自以下的核苷酸序列的多核苷酸:
(a)包含seqidno:6或8的核苷酸序列;
(b)与seqidno:6或8的全长具有至少95%同一性的核苷酸序列,并且所述核苷酸序列驱动可操作地连接的多核苷酸的表达;以及
(c)包含seqidno:6或8的至少约1250个连续核苷酸的核苷酸序列,并且所述核苷酸序列驱动可操作地连接的多核苷酸的表达。
42.一种调控多核苷酸表达的方法,所述方法包括将所述多核苷酸可操作地连接至调控元件,其中所述调控元件是包含选自以下的核苷酸序列的多核苷酸:
(a)包含seqidno:6或8的核苷酸序列;
(b)与seqidno:6或8的全长具有至少95%同一性的核苷酸序列,并且所述核苷酸序列能够驱动可操作地连接的多核苷酸的表达;
以及
(c)包含seqidno:6或8的至少约1250个连续核苷酸的核苷酸序列,并且所述核苷酸序列能够驱动可操作地连接的多核苷酸的表达。
43.一种下调多核苷酸表达的方法,所述方法包括靶向与所述多核苷酸相关联的调控元件,其中所述调控元件是包含选自以下的核苷酸序列的多核苷酸:
(a)包含seqidno:6或8的核苷酸序列;
(b)与seqidno:6或8的全长具有至少95%同一性的核苷酸序列,并且所述核苷酸序列能够驱动可操作地连接的多核苷酸的表达;
以及
(c)包含seqidno:6或8的至少约1250个连续核苷酸的核苷酸序列,并且所述核苷酸序列能够驱动可操作地连接的多核苷酸的表达。
44.一种用于鉴定和/或选择对于ms1基因中的突变是纯合或杂合的小麦植物的方法,其中所述突变诱导核隐性雄性不育,所述方法包括:
a.检测至少一个标记等位基因,所述标记等位基因连接至ms1中的突变并与其相关联;以及
b.选择具有所述至少一个标记等位基因的植物。
45.根据项目44所述的方法,其中所述标记等位基因连接至ms1基因中的突变并以5cm与其相关联。
46.根据项目44所述的方法,其中所述标记等位基因连接至ms1基因中的突变并以1cm与其相关联。
47.根据项目44所述的方法,其中所述突变是msld、msle或mslf。
48.根据项目44所述的方法,其中连接至ms1中的突变并与其相关联的所述标记等位基因是在标记et0487、et0488、et0489、et0490、et0491、et0495、007-0033.1或007-0046.1处的等位基因。
49.一种用于繁殖雄性不育植物的方法,所述方法包括用保持系植物对所述雄性不育植物授粉,其中所述保持系植物包含dna构建体,所述dna构建体包括
(a)将恢复雄性能育性的第一核苷酸构建体;
(b)抑制所述保持系植物的雄性配子的形成、功能或传播的第二核苷酸构建体。
50.根据项目49所述的方法,其中所述雄性不育植物对于msl是纯合的。
51.根据项目50所述的方法,其中所述保持系植物的所述第一核苷酸构建体包含与seqidno:1、2、4、7、9、42、43、44或45的全长具有至少95%同一性的多核苷酸。
52.根据项目50所述的方法,其中所述保持系植物的dna构建体还包含编码种子颜色标记的多核苷酸。
53.一种产生杂交子代的方法,其中通过根据项目50所述的方法产生的植物由携带ms1等位基因的近交植物授粉。
54.根据项目53所述的方法,其中所述植物是小麦。
附图说明
图1示出了大麦(seqidno:3)和小麦(seqidno:5)ms1氨基酸序列的比对结果。
图2示出了msld、msle和mslf的等位基因系列序列踪迹。坐标数对应于seqidno:7中的位置。
图3是小麦ms1(也称为taltpg1)的结构的图示。
图4是多棱大麦(hordeumvulgare)(seqidno:3)、普通小麦(seqidno:5)、二穗短柄草(brachypodiumdistachyon)(seqidno:39)和水稻(oryzasativa)(seqidno:40)的ms1同系物的比对结果。
具体实施方式
现在将在下文中更全面地描述本发明;示出了本发明的一些但不是所有实施方案。事实上,这些发明内容可以多种不同形式呈现,并且不应理解为受限于本文陈述的实施方案;相反,提供这些实施方案的目的是使本公开满足适用的法律要求。同样的编号在全文中是指同样的要素。
借助前文的描述和随附的附图中给出的教导内容,本发明所属领域的技术人员将会想到本文示出的本发明的多种修改形式和其它实施方案。因此,应当理解,本发明不限于所公开的具体实施方案,旨在将修改形式和其它实施方案包括在所附权利要求的范围内。虽然本文中采用特定术语,但这些术语仅在一般性和描述性意义上使用,而并非用于限制目的。
i.雄性能育性多核苷酸
本文所公开的组合物包含影响雄性能育性的多核苷酸和多肽。具体地讲,本发明提供了分离的多核苷酸,其包含编码seqidno:3、5、39或40示出的氨基酸序列或者它们的活性片段或变体的核苷酸序列。本发明还提供了具有由本文所述的多核苷酸编码的氨基酸序列(例如,seqidno:3、5、39或40示出的氨基酸序列或者它们的活性片段或变体)的多肽。
有性繁殖植物发育出用于产生雄性配子和雌性配子的特化组织。雄性配子的成功产生依赖于雄性繁殖组织的正确形成。体现植物的雄性繁殖器官的雄蕊包含各种细胞类型,包括例如花丝、花粉囊、绒毡层和花粉。如本文所用,“雄性组织”是指有性繁殖植物中的负责产生雄性配子的特化组织。雄性组织包括但不限于雄蕊、花丝、花粉囊、绒毡层和花粉。
成熟花粉粒形成的过程始于小孢子发生,其中性母细胞形成于花粉囊的造孢组织中。随后是小配子发生,其中小孢子核发生不对称有丝分裂,以形成小配子体或花粉粒。“雄性能育性”或“雄性能育”的状态是指产生成熟花粉粒的那些植物,成熟花粉粒能够使雌性配子受精以产生后代的后续世代。如本文所用,术语“影响雄性能育性”或“调节雄性能育性”是指在与合适的对照比较时植物产生成熟花粉粒的能力的任何增强或下降。“成熟花粉粒”或“成熟花粉”是指任何能够使雌性配子受精以产生后代的的后续世代的花粉粒。同样,术语“雄性能育性多核苷酸”或“雄性能育性多肽”是指调节雄性能育性的多核苷酸或多肽。雄性能育性多核苷酸可例如编码参与小孢子发生或小配子发生过程的多肽。
某些雄性不育基因诸如macl、emsl或gne2(sorensenetal.(2002)plantj.29:581-594(sorensen等人,2002年,《植物杂志》,第29卷,第581-594页))阻止四分孢子阶段中的细胞生长。sporocyteless/nozzle基因中的突变在发育早期起作用,但不仅影响花粉囊形成而且影响胚珠形成,使得植物为雄性不育和雌性不育。拟南芥属(arabidopsis)的sporocyteless基因是孢子发生的起始所必需的,并且编码新型的核蛋白(genesdev.1999aug15;13(16):2108-17(《基因与发育》,1999年8月15日,第13卷,第16期,第2108-2117页))。
本文所公开的雄性能育性多核苷酸包括被示出影响雄性能育性的多核苷酸的同源物和直系同源物。例如,本文所公开的雄性能育性多核苷酸及其活性片段和变体包括ms1的同源物和直系同源物。缺乏功能性ms1的植物在繁殖组织发育中表现出生理变化,并且是雄性不育的。msl突变体的表型分析使用本领域已知的技术进行。例如,在gladius小麦中筛选雄性不育表型如下进行:为了防止开放式授粉的种子形成,在开花之前用纸袋覆盖穗,并用纸夹固定。每株植物覆盖至少三个穗,用于定量分析能育性得分。为了确定定量分析能育性得分,对每个穗的小花数和每个穗的种子数进行计数,并表示为每朵小花形成的种子数。
如在本文别处所公开的,seqidno:4提供了小麦ms1编码序列。seqidno:7提供了天然小麦ms1基因组序列。seqidno:9提供了变体ms1基因组序列。seqidno:39提供了来源于短柄草属的ms1同系物。seqidno:40提供了来自稻的ms1同系物。
染色体臂4bs上的普通小麦msl基因座的突变体包括:
·pugsley(msla);参见
○pugsley,a.t.andr.n.oram(1959)genicmalesterilityinwheat.aust.pl.breed.genet.newsl.no.14:10-11(pugsleya.t.和r.n.oram,1959年,“小麦基因雄性不育”,《aust.pl.breed.genet.newsl.》,第14卷,第10-11页);
○suneson,c.a.(1962)useofpugsley’ssterilewheatincrossbreeding.cropsci.2:534-535(sunesonc.a.,1962年,“pugsley不育小麦在杂交育种中的用途”,《作物科学》,第2卷,第534-535页);以及
○waninge,j.andzeven,a.c.(1968)chromosomenumbersinpugley’s(sic)malesterilewheat.euphytica17:378-380(waningej.和zevena.c.,1968年,“pugley(sic)雄性不育小麦中的染色体数”,《euphytica》,第17卷,第378-380页)。
·probus(mslb);参见fossati,a.andm.ingold(1970)amalesterilemutantintriticumaestivum.wheatinformationservice(kyoto)30:3-10(fossatia.和m.ingold,1970年,“普通小麦中的雄性不育突变体”,《wheatinformationservice》(京都),第30卷,第3-10页)。
·cornerstone(mslc);参见driscoll,c.j.andk.k.barlow(1976)malesterilityinplants:induction,isolationandutilization.pp.123-131ininducedmutationincross-breeding,iaea,vienna,austria(driscollc.j.和k.k.barlow,1976年,“植物中的雄性不育”,《在杂交育种中诱导突变-诱导、分离与利用》,第123-131页,奥地利维也纳,iaea)。
probus和cornerstone中的突变是辐射诱导的,并且据推测是由染色体臂4bs的末端缺失引起的。pugsley突变体被单独归为自发突变体。已将msl基因的位置物理地映射到包含16%的远端4bs染色体臂的区域(endoetal.(1991)thejapanesejournalofgenetics66(3):291-295(endo等人,1991年,《日本遗传学杂志》,第66卷,第3期,第291-295页);klindworthetal.(2002)cropsci.42:1447-1450(klindworth等人,2002年,《作物科学》,第42卷,第1447-1450页);cencietal.(2003)theor.appl.genet107(5):931-9(cenci等人,2003年,《理论与应用遗传学》,第107卷,第5期,第931-939页))。
本文提供了ms1突变msld、msle、mslf和mslh的因果变化,以及与染色体4bs上的ms1基因紧密连接的标记。标记包括et0487、et0488、et0489、et0490、et0491、et0495、007-0033.1和007-0046.1;参见seqidno:24-29和32-33。这些标记可用于在随后的含有msld、msle、mslf或mslh突变的小麦品系的自交和杂交中追踪msld、msle、mslf或mslh,从而确保雄性不育性状有利地在小麦育种程序中得以遗传。
ms1突变msld、msle和mslf是使用甲磺酸乙酯在chris小麦品种中诱导的ms1基因的隐性突变(klindworthetal.2002.cropsci.42:1447-1450(klindworth等人,2002年,《作物科学》,第42卷,第1447-1450页))。外显子1中的mslh突变是通过tilling(靶向诱导基因组局部突变技术)(mccallumetal.(2000)nat.biotechnol.18:455-457(mccallum等人,2000年,《自然生物技术》,第18卷,第455-457页))产生的。
有利的是,植物育种人员可使用分子标记通过鉴定标记等位基因来鉴定含有ms1突变的个体,所述标记等位基因显示与雄性不育共分离的统计学显著的概率,表现为连锁不平衡。这被称为标记辅助选择(mas)。因此,本发明还提供了用于选择对于ms1基因的突变(诸如但不限于msld、msle和mslf)是纯合的或杂合的突变体小麦植物的方法。
为了进行mas,在来自待选择植物的生物样品中检测对应于标记核酸等位基因的核酸。这种检测可采取探针核酸与标记等位基因或其扩增子进行杂交的形式,例如使用等位基因特异性杂交、southern分析、northern分析、原位杂交、引物杂交然后对标记区域进行pcr扩增、对pcr扩增产物进行dna测序等。对于本文所述的任何标记序列,本领域普通技术人员将理解如何使用已知的dna扩增和测序技术在特定小麦品系或品种的标记基因座处获得等位基因。出于本文所述的目的,所用的品系或品种是公众可获得的。因此,可以获得dna,并且本领域普通技术人员可使用所提供的引物或从所提供的参考序列研发引物,以在每个品系或品种的每个标记基因座处扩增和获得序列。
在验证生物样品中存在(或不存在)特定标记等位基因之后,选择植物并与第二植物(任选地来自优良品系的小麦植物)杂交。可对由杂交产生的子代植物中的特定标记等位基因进行评估,并且将只选择具有所需标记等位基因的那些子代植物。
通过标记辅助选择,植物育种人员可通过控制杂交来跟踪雄性不育性状的存在,以在需要时获得在纯合或杂合状态含有ms1突变的新植物,从而维持ms1突变。此外,标记辅助选择可用于产生将用作雌株(即需要花粉供体植物授粉的植物)的突变体雄性不育种子亲本,以产生具有商业价值的种子。或者,标记辅助选择可用于产生在杂合状态含有ms1突变的f1杂交体。
本文提供的任何标记,以及与任何这些标记连接并关联的任何标记,均可用于雄性不育性状的标记辅助选择。
术语“连锁”用于描述一个标记基因座与另一个标记基因座或某个其它基因座(例如,雄性不育基因座)“相关联”的程度。连锁的常见量度是性状共分离的频率。这可表示为共分离百分比(重组频率),或用厘摩(cm)表示。cm是基因重组频率的量度单位。1cm等于由于在一个世代中的交换导致的在一个基因座上的性状将与在另一个基因座上的性状分离的概率为1%(意味着性状在99%的情况下共分离)。
连锁可表示为所期望的界限或范围。例如,在一些实施方案中,当标记的间隔距离小于50、40、30、25、20或15个图距单位(或cm)时,任何标记与任何其它标记(或基因座诸如ms1)连接(遗传上和物理上)。进一步的连锁可通过间隔14、13、12、11、10、9、8、7、6、5、4、3、2、1个图距单位(或cm)来描述。在某些方面,限定相等范围的连锁(例如介于10cm和20cm之间、介于10cm和30cm之间、或者介于10cm和40cm之间)是有利的。
标记与第二基因座连接越紧密,标记越可能变成第二基因座的指示。因此,“紧密连接的基因座”(诸如标记基因座和第二基因座)显示的基因座问重组频率为10%或更低、或者约9%或更低、或者约8%或更低、或者约7%或更低、或者约6%或更低、或者约5%或更低、或者约4%或更低、或者约3%或更低、或者约2%或更低。在其它实施方案中,关联基因座显示的重组频率为约1%或更低,例如约0.75%或更低、或者约0.5%或更低,或者约0.25%或更低。如果两个基因座位于同一染色体上,并且它们间的距离使得两个基因座间的重组发生频率小于10%(例如约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更低),那么也说这两个基因座彼此“邻近”。因为1cm是重组频率为1%的两个遗传标记之间的距离,所以任何标记以例如等于或小于10cm的距离与紧邻的任何其它标记紧密连接(遗传上和物理上)。在同一染色体上的两个紧密连接的标记可定位为彼此相距9、8、7、6、5、4、3、2、1、0.75、0.5、0.25、0.1、0.075、0.05、0.025或0.01cm或更近。
尽管特定标记等位基因可显示与雄性不育表型共分离,但需要注意的是,标记不一定是负责表达雄性不育的基因座的一部分。例如,并没有要求标记多核苷酸序列是ms1基因的一部分。特定标记等位基因和雄性不育表型之间的关联,是由于在ms1突变起源的小麦品系中,标记等位基因和ms1突变之间的最初“偶联”连锁相。因为msld、msle和mslf起源于品种chris,所以ms1区域内的chris中的标记等位基因可用于追踪后续世代中的msld、msle和mslf突变。
本文公开了分离的或实质上纯化的核酸分子或蛋白质组合物。“分离的”或“纯化的”核酸分子、多核苷酸、多肽或蛋白质,或者它们的生物活性部分,实质上或基本上不含通常在该多核苷酸或蛋白质的天然存在的环境中存在的、与该多核苷酸或蛋白质相伴随或相互作用的组分。因此,分离的或纯化的多核苷酸或多肽或蛋白质,当通过重组技术产生时实质上不含其它细胞物质或培养基,或者当通过化学法合成时实质上不含化学前体或其它化学品。最优的是,“分离的”多核苷酸不含在衍生该多核苷酸的生物体的基因组dna中天然位于该多核苷酸的旁侧的序列(即,位于该多核苷酸的5′和3′端的序列)(最佳的是蛋白质编码序列)。例如,在各种实施方案中,分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在衍生该多核苷酸的细胞的基因组dna中天然位于该多核苷酸的旁侧的核苷酸序列。实质上不含细胞物质的蛋白质包括具有小于约30%、20%、10%、5%或1%(以干重计)的污染性蛋白质的蛋白质制备物。当本文所公开的多肽或其生物活性部分用重组法产生时,最佳的是,培养基具有少于约30%、20%、10%、5%或1%(以干重计)的化学前体或非目的蛋白质的化学品。
“受试植物”或“受试植物细胞”是其中已针对目的基因实现了遗传改变(诸如转化)的植物或植物细胞,或者是从经如此改变的植物或细胞遗传下来并包含该改变的植物或植物细胞。“对照”、“对照植物”或“对照植物细胞”提供用于测量受试植物或植物细胞的表型变化的基准点。
对照植物或植物细胞可包括例如:(a)野生型植物或植物细胞,即具有与用于进行遗传改变的起始材料相同的基因型的植物或植物细胞,该遗传改变得到受试植物或细胞;(b)具有与起始材料相同的基因型但已用无效构建体(即用对目的性状不具有已知效果的构建体,诸如包含标记基因的构建体)转化的植物或植物细胞;(c)为受试植物或植物细胞的子代中的非转化分离子的植物或植物细胞;(d)在遗传上与受试植物或植物细胞相同但不暴露于会诱导目的基因的表达的条件或刺激因素的植物或植物细胞;或者(e)处于目的基因不被表达的条件下的受试植物或者植物细胞本身。
还提供了本发明所公开的多核苷酸的片段和变体以及由其编码的蛋白质。所谓“片段”,意指多核苷酸的一部分或由其编码的氨基酸序列从而由其编码的蛋白质的一部分。多核苷酸的片段可编码保留该天然蛋白质的生物活性从而影响雄性能育性的蛋白质片段;这些片段在本文中可被称为“活性片段”。或者,可用作杂交探针或在下调或靶向序列修饰的构建体和策略中有用的多核苷酸片段通常不编码保留生物活性的蛋白质片段,但仍可影响雄性能育性。因此,核苷酸序列的片段的范围可为本文所公开的编码多肽的至少约20个核苷酸、约50个核苷酸、约100个核苷酸、直至全长多核苷酸。
编码影响雄性能育性的多肽的生物活性部分的多核苷酸的片段将编码至少15、25、30、50、100、150或200个连续氨基酸,或最多编码存在于影响雄性能育性的全长多肽(例如,seqidno:3、5、39或40)中的氨基酸总数。可用作杂交探针或pcr引物或者在下调构建体或靶向修饰方法中可用的雄性能育性多核苷酸的片段通常不需要编码多肽的生物活性部分,但可影响雄性能育性。
因此,本文所公开的雄性能育性多核苷酸的片段可编码雄性能育性多肽的生物活性部分,或者其可以是可使用本领域已知的或下文所公开的方法被用作杂交探针或pcr引物或者在下调构建体或靶向修饰方法中可用的片段。雄性能育性多肽的生物活性部分可通过以下过程制备:分离本文所公开的雄性能育性多核苷酸中的一者的一部分,表达雄性能育性蛋白质的编码部分(例如,通过体外重组表达),并且评估雄性能育性多肽的编码部分的活性。作为雄性能育性多核苷酸的片段的多核苷酸包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1000、1200、1400、1600、1800、2000、2200、2400、2600、2800、3000、3200、3400、3600、3800或4000个核苷酸,或最多包含存在于本文所公开的全长雄性能育性多核苷酸(例如,seqidno:1、2、4、7、42、43、44或45,或者编码seqidno:39或40的多核苷酸)中的核苷酸数。
“变体”旨在意指实质上相似的序列。对于多核苷酸,变体包含在天然多核苷酸内的一个或多个位点处发生一个或多个核苷酸的缺失和/或添加,和/或在天然多核苷酸中的一个或多个位点处发生一个或多个核苷酸的置换。如本文所用,“天然”或“野生型”多核苷酸或多肽分别包含天然存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包括由于遗传密码的简并性而编码本文所公开的雄性能育性多肽的氨基酸序列的那些序列。天然等位基因变体(如这些)可用熟知的分子生物学技术进行鉴定,例如用下文所述的聚合酶链反应(pcr)和杂交技术来鉴定。变体多核苷酸还包括合成来源的多核苷酸,诸如那些例如通过使用定点诱变产生并且可编码雄性能育性多肽的多核苷酸。通常,本文所公开的特定多核苷酸的变体将与该特定多核苷酸(例如,seqidno:1、2、4、7、42、43、44或45)具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这是通过本文别处所述的或本领域已知的序列比对程序和参数确定的。
本文所公开的特定多核苷酸(即,参考多核苷酸)的变体还可通过比较变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的百分比序列同一性来进行评估。因此,例如分离的多核苷酸可编码与seqidno:3、5、39或40的多肽具有给定百分比序列同一性的多肽。任何两种多肽之间的百分比序列同一性可用本文别处描述的序列比对程序和参数来计算。在本文所公开的任何给定的多核苷酸对通过比较它们编码的两种多肽所共享的百分比序列同一性来进行评估,这两种编码的多肽之间的百分比序列同一性为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
“变体”蛋白质旨在意指通过在天然蛋白质中的一个或多个位点处缺失或添加一个或多个氨基酸和/或在天然蛋白质中的一个或多个位点处置换一个或多个氨基酸而从该天然蛋白质衍生的蛋白质。本文所公开的变体蛋白质具有生物活性,即它们仍然具有天然蛋白质的生物活性,即本文所述的雄性能育性活性。这类变体可例如由遗传多态性或人类操纵而得到。本文所公开的雄性能育性蛋白质的生物活性变体将与该天然蛋白质的氨基酸序列(例如,seqidno:3、5、39或40)具有至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这是通过本文别处所述的或本领域已知的序列比对程序和参数确定的。本文所公开的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基,少至1-10个(诸如6-10个)、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。
本文所公开的蛋白质可通过各种方式(包括氨基酸置换、缺失、截短和插入)进行改变。用于此类操纵的方法是本领域公知的。例如,雄性能育性多肽的氨基酸序列变体和片段可通过在dna中进行突变来制备。用于诱变和多核苷酸改变的方法是本领域熟知的。参见,例如kunkel(1985)proc.natl.acad.sci.usa82:488-492(kunkel,1985年,《美国国家科学院院刊》,第82卷,第488-492页);kunkeletal.(1987)methodsinenzymol.154:367-382(kunkel等人,1987年,《酶学方法》,第154卷,第367-382页);美国专利4,873,192;walkerandgaastra,eds.(1983)techniquesinmolecularbiology(macmillanpublishingcompany,newyork)(walker和gaastra编辑,1983年,《分子生物学技术》(纽约麦克米兰出版公司))以及其中引用的参考文献。有关不影响目的蛋白质的生物活性的适当氨基酸置换的指导可在以下文献所述的模型中找到:dayhoffetal.(1978)atlasofproteinsequenceandstructure(natl.biomed.res.found.,washington,d.c.)(dayhoff等人,1978年,《蛋白序列和结构图表集》(美国国家生物医学研究基金会,华盛顿特区)),该文献以引用方式并入本文。保守置换,诸如将一个氨基酸用另一个具有相似性质的氨基酸进行交换,可能是最佳的。
因此,本文所公开的基因和多核苷酸包括天然存在的序列以及dna序列变体两者。同样,雄性能育性多肽和蛋白质涵盖天然存在的多肽以及其变型形式和修饰形式两者。这种多核苷酸和多肽变体可仍然具有所需的雄性能育性活性,在这种情况下,将在编码变体的dna中进行的突变不应将序列置于阅读框之外,并且最好不形成可产生二级mrna结构的互补区域。参见ep专利申请公开75,444。
本文所涵盖的蛋白质序列的某些缺失、插入和置换预期不产生该蛋白质特性的根本变化。然而,当在进行置换、缺失或插入之前难以预测其确切效应时,本领域技术人员将认识到该效应将通过常规的筛选测定法进行评估。即,该活性可通过测定雄性能育性活性来评估。
雄性能育性的增强或下降可以以多种方式来测定。本领域普通技术人员可通过以下过程容易地评估变体或片段的活性:将多核苷酸引入对于多核苷酸的稳定雄性不育等位基因而言为纯合的植物中,随后观察植物中的雄性组织发育。例如,为了测定由seqidno:1、2、4、7、42、43、44或45的片段或变体赋予的雄性能育性活性,本领域技术人员可通过鉴定表达msl表型的植物或通过构建对于天然ms1基因的突变而言为纯合的植物来开始,从而导致雄性不育。随后,技术人员可通过以下过程对突变进行弥补:提供ms1多核苷酸或者其片段或变体,随后观察植物的雄性组织是否正常发育以及是否能够产生成熟花粉。
变体功能性多核苷酸和蛋白质还涵盖由诱变和重组过程(诸如dna改组)获得的序列和蛋白质。利用这种过程,可操纵一种或多种不同的雄性能育性序列以产生具有所需性质的新雄性能育性多肽。这样,从一组相关的序列多核苷酸生成重组多核苷酸的文库,该相关的序列多核苷酸包含具有显著序列同一性且可在体外或体内发生同源重组的序列区域。例如,使用该方法,可将编码目的结构域的序列基序在本文所公开的雄性能育性多核苷酸与其它已知的雄性能育性多核苷酸之间进行改组,以获得编码具有改善的目的性质(诸如,在酶的情况中为提高的km)的蛋白质的新基因。这种dna改组的策略是本领域已知的。参见例如stemmer(1994)proc.natl.acad.sci.usa91:10747-10751(stemmer,1994年,《美国国家科学院院刊》,第91卷,第10747-10751页);stemmer(1994)nature370:389-391(stemmer,1994年,《自然》,第370卷,第389-391页);cramerietal.(1997)naturebiotech.15:436-438(crameri等人,1997年,《自然生物技术》,第15卷,第436-438页);mooreetal.(1997)j.mol.biol.272:336-347(moore等人,1997年,《分子生物学杂志》,第272卷,第336-347页);zhangetal.(1997)proc.natl.acad.sci.usa94:4504-4509(zhang等人,1997年,《美国国家科学院院刊》,第94卷,第4504-4509页);cramerietal.(1998)nature391:288-291(crameri等人,1998年,《自然》,第391卷,第288-291页);以及美国专利5,605,793和5,837,458。
ii.序列分析
如本文所用,“序列同一性”或“同一性”在两个多核苷酸或多肽序列的情形中是指当在指定的比较窗口上进行比对以获得最大对应时两个序列中相同的残基。当序列同一性百分比用于蛋白质时,应当认识到不相同的残基位置往往差别在于保守氨基酸置换,其中氨基酸残基由具有相似化学性质(例如电荷或疏水性)的其它氨基酸残基置换,因此不会改变分子的功能性质。当序列差别在于保守置换时,则可以上调百分比序列同一性以校正置换的保守性质。差别在于这种保守置换的序列被称为具有“序列相似性”或“相似性”。用于作出这个调整的手段是本领域技术人员公知的。通常,这涉及将保守置换评定为部分错配而不是完全错配,从而增加百分比序列同一性。因此,例如,如果相同的氨基酸给予1分,非保守置换给予0分,则保守置换给予0至1之间的分数。保守置换的评分是例如在程序pc/gene(美国加利福尼亚州山景城(mountainview,california)的intelligenetics公司)中所执行那样进行计算。
本文所用的“序列同一性百分比”意指通过在比较窗口上比较两个最佳比对的序列所确定的数值,其中多核苷酸序列在该比较窗口中的部分与参考序列(不包含添加或缺失)相比可包含添加或缺失(即,空位),以便两个序列的最佳比对。通过以下方式计算该百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分比。
除非另外指明,否则本文提供的序列同一性/相似性值是指使用采用以下参数的gap版本10或其任何等同程序获得的值:核苷酸序列的同一性百分比和相似性百分比采用gap权重50和长度权重3以及nwsgapdna.cmp计分矩阵;氨基酸序列的同一性百分比和相似性百分比采用gap权重8和长度权重2以及blosum62计分矩阵。所谓“等同程序”意指任何这样的序列比较程序,其对于任何两条所考虑的序列,相比于gap版本10所产生的对应的比对,能产生具有相同的核苷酸或氨基酸残基匹配和相同的百分比序列同一性的比对。
术语“多核苷酸”的使用并不旨在将本公开局限于包含dna的多核苷酸。本领域的普通技术人员将认识到,多核苷酸可包含核糖核苷酸以及具有核糖核苷酸与脱氧核糖核苷酸的组合。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子,也包括合成的类似物。本文所公开的多核苷酸还涵盖所有形式的序列,包括但不限于单链形式、双链形式、发夹结构、茎-环结构等。
iii.表达盒
本文所公开的雄性能育性多核苷酸可在表达盒中提供,以用于在目的生物体中表达。表达盒可包含可操作地连接至本文所公开的雄性能育性多核苷酸的5′和3′调控序列。“可操作地连接”旨在意指两个或更多个元件之间的功能性连接。例如,目的多核苷酸与调控序列(例如,启动子)之间的可操作地连接是可使该目的多核苷酸得以表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用来指两个蛋白质编码区域的连接时,所谓可操作地连接,是指所述编码区域处于同一阅读框中。
本文所公开的表达盒在5′-3′转录方向上可包含在宿主细胞(例如,植物细胞)中起作用的转录和翻译起始区(即,启动子)、目的多核苷酸以及转录和翻译终止区(即,终止区)。表达盒还设置有多个限制性位点和/或重组位点,以使雄性能育性多核苷酸的插入处于本文别处所述的调控区的转录调控之下。调控区(即,启动子、转录调控区和翻译终止区)和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是天然的/相似的。或者,调控区和/或目的多核苷酸对于宿主细胞而言或彼此之间可以是异源的。如本文所用,关于多核苷酸或多肽序列的“异源”是起源于外来物种的序列,或者,如果起源于相同物种的话,则为通过蓄意的人为干预从其天然形式在组成和/或基因座方面进行实质性修饰得到的序列。例如,可操作地连接至异源多核苷酸的启动子来自与衍生该多核苷酸的物种不同的物种,或者,如果来自相同/相似的物种,那么一方或双方实质上由它们的源形式和/或基因组修饰得到,或者该启动子不是可操作地连接的多核苷酸的天然启动子。如本文所用,除非另外指明,否则嵌合多核苷酸包括与转录起始区可操作地连接的编码序列,该转录起始区对于该编码序列是异源的。
在某些实施方案中,本文所公开的多核苷酸可与本文别处所公开的或本领域已知的目的多核苷酸序列的任何组合或表达盒堆叠。例如,本文所公开的雄性能育性多核苷酸可与本文别处所公开的或本领域已知的编码雄性配子破坏性多核苷酸或多肽、细胞毒素、标记、或其它雄性能育性序列的任何其它多核苷酸堆叠。堆叠的多核苷酸可操作地连接至与雄性能育性多核苷酸相同的启动子,或者可操作地连接至单独的启动子多核苷酸。
如本文别处所述,表达盒可包含可操作地连接至目的多核苷酸的启动子,连同对应的终止区。终止区对于转录起始区可以是天然的,对于可操作地连接的目的雄性能育性多核苷酸或雄性能育性启动子序列可以是天然的,对于植物宿主可以是天然的,或者可以源自另一来源(即,外来的或异源的)。易得的终止区可获自根瘤农杆菌(a.tumefaciens)的ti质粒,诸如章鱼碱合酶和胭脂碱合酶终止区。还可参见guerineauetal.(1991)mol.gen.genet.262:141-144(guerineau等人,1991年,《分子遗传学与普通遗传学》,第262卷,第141-144页);proudfoot(1991)cell64:671-674(proudfoot,1991年,《细胞》,第64卷,第671-674页);sanfaconetal.(1991)genesdev.5:141-149(sanfacon等人,1991年,《基因与发育》,第5卷,第141-149页);mogenetal.(1990)plantcell2:1261-1272(mogen等人,1990年,《植物细胞》,第2卷,第1261-1272页);munroeetal.(1990)gene91:151-158(munroe等人,1990年,《基因》,第91卷,第151-158页);ballasetal.(1989)nucleicacidsres.17:7891-7903(ballas等人,1989年,《核酸研究》,第17卷,第7891-7903页);以及joshietal.(1987)nucleicacidsres.15:9627-9639(joshi等人,1987年,《核酸研究》,第15卷,第9627-9639页)。
如适当的话,可对目的多核苷酸进行优化以使其在转化的植物中的表达提高。也就是说,可使用植物优选的密码子来合成或改变多核苷酸,以便提高其表达。有关宿主优选的密码子用法的讨论,参见例如campbellandgowri(1990)plantphysiol.92:1-11(campbell和gowri,1990年,《植物生理学》,第92卷,第1-11页)。合成植物优选基因的方法是本领域可得的。参见例如美国专利5,380,831和5,436,391,以及murrayetal.(1989)nucleicacidsres.17:477-498(murray等人,1989年,《核酸研究》,第17卷,第477-498页),将其以引用方式并入本文。
已知增强细胞宿主中的基因表达的另外的序列修饰。这些序列修饰包括消除以下序列:编码假聚腺苷酸化信号、外显子-内含子剪接位点信号、转座子样重复序列,以及其它此类得到充分表征的可能对基因表达有害的序列。可将序列的g-c含量调整到给定的细胞宿主的平均水平,该平均水平通过参考在宿主细胞中表达的已知基因计算得到。当可能时,修饰序列以避免可预见的发夹二级mrna结构。
表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的,包括:小核糖核酸病毒前导序列,例如emcv前导序列(脑心肌炎5′非编码区)(elroy-steinetal.(1989)proc.natl.acad.sci.usa86:6126-6130(elroy-stein等人,1989年,《美国国家科学院院刊》,第86卷,第6126-6130页);马铃薯y病毒组前导序列,例如tev前导序列(烟草蚀纹病毒)(gallieetal.(1995)gene165(2):233-238(gallie等人,1995年,《基因》,第165卷,第2期,第233-238页))、mdmv前导序列(玉米矮花叶病毒)(johnson,etal.,(1986)virology154:9-20(johnson等人,1986年,《病毒学》,第154卷,第9-20页))和人免疫球蛋白重链结合蛋白(bip)(macejak,etal.,(1991)nature353:90-94(macejak等人,1991年,《自然》,第353卷,第90-94页));来自苜蓿花叶病毒的外壳蛋白mrna的非翻译前导序列(amvrna4)(joblingetal.(1987)nature325:622-625(jobling等人,1987年,《自然》,第325卷,第622-625页));烟草花叶病毒前导序列(tmv)(gallieetal.(1989)inmolecularbiologyofrna,ed.cech(liss,newyork),pp.237-256(gallie等人,1989年,载于《rna的分子生物学》,cech编辑(liss,纽约),第237-256页));以及玉米枯黄斑点病毒前导序列(mcmv)(lommeletal.(1991)virology81:382-385(lommel等人,1991年,《病毒学》,第81卷,第382-385页))。还可参见della-cioppaetal.(1987)plantphysiol.84:965-968(della-cioppa等人,1987年,《植物生理学》,第84卷,第965-968页)。也可利用其它已知的用于增强翻译的方法,例如内含子等等。
在制备表达盒时,可对多个dna片段进行操纵,以提供处于正确取向的dna序列,且适当时提供处于正确的阅读框的dna序列。为此目的,可应用衔接子或接头将dna片段连接在一起,或者可涉及其它的操纵以提供便利的限制性位点、去除多余的dna、去除限制性位点等。出于这个目的,可能涉及体外诱变、引物修复、限制性酶切、退火、再置换(例如转换和颠换)。
在特定实施方案中,本文所公开的表达盒包含可操作地连接至雄性能育性多核苷酸的启动子或者其片段或变体,如本文所公开。在某些实施方案中,雄性能育性启动子可操作地连接至本文所公开的雄性能育性多核苷酸,诸如seqidno:1、2、4、7、42、43、44或45示出的多核苷酸,或其活性片段或变体。
在某些实施方案中,植物启动子可优先地在某些组织(诸如雄蕊、花粉囊、花丝和花粉)或发育生长阶段(诸如造孢组织、小孢子和小配子体)中起始转录。这种植物启动子被称为“组织优选的”、“细胞类型优选的”或“生长阶段优选的”。仅在某些组织中起始转录的启动子被称为“组织特异性的”。同样,仅在某些生长阶段起始转录的启动子被称为“生长阶段特异性的”。“细胞类型特异性”启动子仅在一种或多种器官中的某些细胞类型中驱动表达,例如雄蕊细胞,或雄蕊内的单独细胞类型诸如花粉囊、花丝或花粉细胞。
“雄性能育性启动子”可唯一地或优先地在涉及小孢子发生或小配子发生的过程的细胞或组织中起始转录。本文所公开的雄性能育性多核苷酸及其活性片段和变体可操作地连接至雄性组织特异性的或雄性组织优选的启动子,包括例如雄蕊特异性的或雄蕊优选的启动子、花粉囊特异性的或花粉囊优选的启动子、花粉特异性的或花粉优选的启动子、绒毡层特异性的启动子或绒毡层优选的启动子,等等。可基于所需的结果来选择启动子。例如,目的多核苷酸可操作地连接至组成型启动子、组织优选的启动子、生长阶段优选的启动子或其它启动子,以在植物中表达。
在一个实施方案中,启动子可以是唯一地或优先地在植物的雄性组织中表达可操作地连接的目的多核苷酸的那些启动子。在该过程中不必使用特定雄性能育性组织优选的或组织特异性的启动子;并且可使用本领域技术人员已知的多种此类启动子中的任何一种。一个这种启动子为5126启动子,其优先地将其所连接的多核苷酸的表达引导至植物的雄性组织,如在美国专利5,837,851和5,689,051中所述。其它示例包括美国专利6,037,523中描述的玉米ms45启动子;美国专利6,452,069中描述的sf3启动子;wo02/063021中描述的bs92-7启动子;以及美国专利5,470,359中描述的sgb6调控元件;ta29启动子(koltunow,etal.,(1990)plantcell2:1201-1224(koltunow等人,1990年,《植物细胞》,第2卷,第1201-1224页);nature347:737(1990)(《自然》,第347卷,第737页,1990年);goldberg,etal.,(1993)plantcell5:1217-1229(goldberg等人,1993年,《植物细胞》,第5卷,第1217-1229页)以及美国专利6,399,856);sb200基因启动子(wo2002/26789)、pg47基因启动子(美国专利5,412,085;美国专利号5,545,546;plantj3(2):261-271(1993)(《植物杂志》,第3卷,第2期,第261-271页,1993年))、g9基因启动子(美国专利号5,837,850;5,589,610);2型金属硫蛋白样基因启动子(charbonnel-campaa,etal.,gene(2000)254:199-208(charbonnel-campaa等人,《基因》,2000年,第254卷,第199-208页));芸苔属bca9启动子(lee,etal.,(2003)plantcellrep.22:268-273(lee等人,2003年,《植物细胞报告》,第22卷,第268-273页));zm13启动子(hamilton,etal.,(1998)plantmol.biol.38:663-669(hamilton等人,1998年,《植物分子生物学》,第38卷,第663-669页));肌动蛋白解聚因子启动子(诸如zmabp1、zmabp2;参见例如lopez,etal.,(1996)proc.natl.acad.sci.usa93:7415-7420(lopez等人,1996年,《美国国家科学院院刊》,第93卷,第7415-7420页));玉米果胶甲酯酶样基因的启动子zmc5(wakeley,etal.,(1998)plantmol.biol.37:187-192(wakeley等人,1998年,《植物分子生物学》,第37卷,第187-192页));抑制蛋白基因启动子zmprol(kovar,etal.,(2000)theplantcell12:583-598(kovar等人,2000年,《植物细胞》,第12卷,第583-598页));硫酸化五肽phytosulphokine基因zmpsk1(lorbiecke,etal.,(2005)journalofexperimentalbotany56(417):1805-1819(lorbiecke等人,2005年,《实验植物学杂志》,第56卷,第417期,第1805-1819页));钙调蛋白结合蛋白的启动子mpcbp(reddy,etal.,(2000)j.biol.chem.275(45):35457-70(reddy等人,2000年,《生物化学杂志》,第275卷,第45期,第35457-35470页))。
如本文所公开,组成型启动子包括例如rsyn7启动子的核心启动子和wo99/43838和美国专利6,072,050中公开的其它组成型启动子;camv35s核心启动子(odelletal.(1985)nature313:810-812(odell等人,1985年,《自然》,第313卷,第810-812页));稻肌动蛋白(mcelroyetal.(1990)plantcell2:163-171(mcelroy等人,1990年,《植物细胞》,第2卷,第163-171页));泛素(christensenetal.(1989)plantmol.biol.12:619-632(christensen等人,1989年,《植物分子生物学》,第12卷,第619-632页)和christensenetal.(1992)plantmol.biol.18:675-689(christensen等人,1992年,《植物分子生物学》,第18卷,第675-689页));pemu(lastetal.(1991)theor.appl.genet.81:581-588(last等人,1991年,《理论与应用遗传学》,第81卷,第581-588页));mas(veltenetal.(1984)emboj.3:2723-2730(velten等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第2723-2730页));als启动子(美国专利5,659,026),等等。其它组成型启动子包括例如美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142、和6,177,611。
“种子优选的”启动子包括在种子发育期间活跃的那些启动子(诸如种子贮藏蛋白的启动子)以及在种子发芽期间活跃的那些启动子。参见thompsonetal.(1989)bioessays10:108(thompson等人,1989年,《生物学论文集》,第10卷,第108页),该文献以引用方式并入本文。这类种子优选的启动子包括但不限于ciml(细胞分裂素诱导信息);cz19b1(玉米19kda玉米醇溶蛋白);milps(肌醇-1-磷酸合酶)(参见wo00/11177和美国专利6,225,529;所述专利以引用方式并入本文)。γ-玉米醇溶蛋白基因启动子是胚乳特异性启动子。球蛋白-1(glob-1)基因启动子是代表性的胚特异性启动子。对于双子叶植物而言,种子特异性启动子包括但不限于菜豆β-菜豆蛋白基因启动子、油菜籽蛋白(napin)基因启动子、β-伴大豆球蛋白基因启动子、大豆凝集素基因启动子、十字花科蛋白基因启动子等。对于单子叶植物而言,种子特异性启动子包括但不限于玉米15kda玉米醇溶蛋白、22kda玉米醇溶蛋白、27kda玉米醇溶蛋白、γ-玉米醇溶蛋白、糯性蛋白基因(waxy)、超甜蛋白1(shrunken1)、超甜蛋白2(shrunken2)、球蛋白1等。还可参见wo00/12733,其中公开了来自end1和end2基因的种子优选的启动子。另外的胚特异性启动子在如下文献中公开:satoetal.(1996)proc.natl.acad.sci.93:8117-8122(sato等人,1996年,《美国国家科学院院刊》,第93卷,第8117-8122页);nakaseetal.(1997)plantj12:235-46(nakase等人,1997年,《植物杂志》,第12卷,第235-246页);以及postma-haarsmaetal.(1999)plantmol.biol.39:257-71(postma-haarsma等人,1999年,《植物分子生物学》,第39卷,第257-271页)。另外的胚乳特异性启动子在如下文献中公开:albanietal.(1984)embo3:1405-15(albani等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第1405-1415页);albanietal.(1999)theor.appl.gen.98:1253-62(albani等人,1999年,《理论与应用遗传学》,第98卷,第1253-1262页);albanietal.(1993)plantj.4:343-55(albani等人,1993年,《植物杂志》,第4卷,第343-355页);menaetal.(1998)theplantjournal116:53-62(mena等人,1998年,《植物杂志》,第116卷,第53-62页)和wuetal.(1998)plantcellphysiology39:885-889(wu等人,1998年,《植物细胞生理学》,第39卷,第885-889页)。
分裂细胞或分生组织优选的启动子已在如下文献中公开:itoetal.(1994)plantmol.biol.24:863-878(ito等人,1994年,《植物分子生物学》,第24卷,第863-878页);reyadetal.(1995)mo.gen.genet.248:703-711(reyad等人,1995年,《分子遗传学与普通遗传学》,第248卷,第703-711页);shauletal.(1996)proc.natl.acad.sci.93:4868-4872(shaul等人,1996年,《美国国家科学院院刊》,第93卷,第4868-4872页);itoetal.(1997)plantj.11:983-992(ito等人,1997年,《植物杂志》,第11卷,第983-992页);以及trehinetal.(1997)plantmol.biol.35:667-672(trehin等人,1997年,《植物分子生物学》,第35卷,第667-672页)。
胁迫诱导型启动子包括盐/水胁迫诱导型启动子,诸如p5cs(zangetal.(1997)plantsciences129:81-89(zang等人,1997年,《植物科学》,第129卷,第81-89页));冷诱导型启动子,诸如corl5a(hajelaetal.(1990)plantphysiol.93:1246-1252(hajela等人,1990年,《植物生理学》,第93卷,第1246-1252页))、cor15b(wlihelmetal.(1993)plantmolbiol23:1073-1077(wlihelm等人,1993年,《植物分子生物学》,第23卷,第1073-1077页))、wsc120(ouelletetal.(1998)febslett.423-324-328(ouellet等人,1998年,《欧洲生化学会联合会快报》,第423卷,第324-328页))、ci7(kirchetal.(1997)plantmolbiol.33:897-909(kirch等人,1997年,《植物分子生物学》,第33卷,第897-909页))、ci21a(schneideretal.(1997)plantphysiol.113:335-45(schneider等人,1997年,《植物生理学》,第113卷,第335-345页));干旱诱导型启动子,诸如trg-31(chaudharyetal(1996)plantmol.biol.30:1247-57(chaudhary等人,1996年,《植物分子生物学》,第30卷,第1247-1257页))、rd29(kasugaetal.(1999)naturebiotechnology18:287-291(kasuga等人,1999年,《自然生物技术》,第18卷,第287-291页));渗透诱导型启动子,诸如rab17(vilardelletal.(1991)plantmol.biol.17:985-93(vilardell等人,1991年,《植物分子生物学》,第17卷,第985-993页))和渗透蛋白(raghothamaetal.(1993)plantmolbiol23:1117-28(raghothama等人,1993年,《植物分子生物学》,第23卷,第1117-1128页));以及热诱导型启动子,诸如热休克蛋白(barrosetal.(1992)plantmol.19:665-75(barros等人,1992年,《植物分子生物学》,第19卷,第665-675页);marrsetal.(1993)dev.genet.14:27-41(marrs等人,1993年,《发育遗传学》,第14卷,第27-41页))和smhsp(watersetal.(1996)j.experimentalbotany47:325-338(waters等人,1996年,《实验植物学杂志》,第47卷,第325-338页))。其它胁迫诱导型启动子包括rip2(美国专利5,332,808和美国专利公开2003/0217393)和rd29a(yamaguchi-shinozakietal.(1993)mol.gen.genetics236:331-340(yamaguchi-shinozaki等人,1993年,《分子遗传学与普通遗传学》,第236卷,第331-340页))。
如本文别处所述,包含雄性能育性多核苷酸的表达盒可与其它目的多核苷酸堆叠。任何目的多核苷酸均可与雄性能育性多核苷酸堆叠,包括例如雄性配子破坏性多核苷酸和标记多核苷酸。
本文所公开的雄性能育性多核苷酸可堆叠在包含可操作地连接至具有雄性配子破坏性的多核苷酸(即,干扰雄性配子的功能、形成或传播的多核苷酸)的启动子的表达盒中,或与该表达盒堆叠。可通过多种方法中的任一种来操作雄性配子破坏性多核苷酸以阻止雄性配子的功能、形成或传播。以举例而非限制的方式,这可包括使用这样的多核苷酸,其编码基因产物诸如dam-甲基化酶或芽孢杆菌rna酶(参见例如,美国专利5,792,853或5,689,049,pct/ep89/00495);编码干扰淀粉累积、降解淀粉或影响花粉中的渗透平衡的基因产物,诸如α-淀粉酶(参见例如美国专利7,875,764、8,013,218、7,696,405、8,614,367);抑制对于雄性配子的功能、形成或传播而言重要的基因产物的形成(参见例如,美国专利5,859,341、6,297,426);编码与另一种基因产物结合以阻止雄性配子的形成或功能的基因产物(参见例如美国专利6,162,964、6,013,859、6,281,348、6,399,856、6,248,935、6,750,868、5,792,853);与对雄性配子的功能、形成或传播至关重要的基因反义,或导致对所述基因的共抑制(参见例如美国专利6,184,439、5,728,926、6,191,343、5,728,558、5,741,684);通过使用发夹式形成物干扰雄性能育性多核苷酸的表达(参见例如smithetal.(2000)nature407:319-320(smith等人,2000年,《自然》,第407卷,第319-320页)、wo99/53050和wo98/53083),等等。
雄性配子破坏性多核苷酸包括显性负基因,诸如甲基化酶基因和生长抑制基因。参见美国专利6,399,856。显性负基因包括白喉毒素a链基因(czakoandan(1991)plantphysiol.95687-692(czako和an,1991年,《植物生理学》,第95卷,第687-692页);greenfieldetal.(1983)pnas80:6853(greenfield等人,1983年,《美国国家科学院院刊》,第80卷,第6853页));细胞周期分裂突变体,诸如玉米中的cdc(colasantietal.(1991)pnas88:3377-3381(colasanti等人,1991年,《美国国家科学院院刊》,第88卷,第3377-3381页));wt基因(farmeretal.(1994)mol.genet.3:723-728(farmer等人,1994年,《分子遗传学》,第3卷,第723-728页));以及p68(chenetal.(1991)pnas88:315-319(chen等人,1991年,《美国国家科学院院刊》,第88卷,第315-319页))。
雄性配子破坏性多核苷酸的另外的示例包括但不限于来自菊欧氏菌(erwiniachrysanthermi)的果胶裂解酶基因pele(kennetal(1986)j.bacteriol.168:595(kenn等人,1986年,《细菌学杂志》,第168卷,第595页));来自苏云金芽孢杆菌(bacillusthuringiensis)以色列亚种的cyta毒素基因(mcleanetal(1987)j.bacteriol.169:1017(1987)(mclean等人,1987年,《细菌学杂志》,第169卷,第1017页)、美国专利4,918,006);dna酶、rna酶、蛋白酶或表达反义rna的多核苷酸。雄性配子破坏性多核苷酸可编码涉及抑制花粉和柱头的相互作用、花粉管生长、受精或它们的组合的蛋白质。
本文所公开的雄性能育性多核苷酸可与本文所公开的表达盒堆叠,所述表达盒包含可操作地连接至编码报道基因或标记产物的目的多核苷酸的启动子。本领域已知的合适报道基因多核苷酸的示例可见于例如以下文献:jeffersonetal.(1991)inplantmolecularbiologymanual,ed.gelvinetal.(kluweracademicpublishers),pp.1-33(jefferson等人,1991年,载于《植物分子生物学手册》,gelvin等人编辑,克吕维尔学术出版社,第1-33页);dewetetal.mol.cell.biol.7:725-737(1987)(dewet等人,1987年,《分子细胞生物学》,第7卷,第725-737页);goffetal.emboj.9:2517-2522(1990)(goff等人,1990年,《欧洲分子生物学组织杂志》,第9卷,第2517-2522页);kainetal.biotechniques19:650-655(1995)(kain等人,1995年,《生物技术》,第19卷,第650-655页);以及chiuetal.currentbiology6:325-330(1996)(chiu等人,1996年,《当代生物学》,第6卷,第325-330页)。在某些实施方案中,目的多核苷酸编码选择性报道基因。这些多核苷酸可包括赋予抗生素抗性或除草剂抗性的多核苷酸。合适的选择性标记多核苷酸的示例包括但不限于编码对氯霉素、甲氨蝶呤、潮霉素、链霉素、壮观霉素、博来霉素、磺酰胺、溴苯腈、草甘膦和草胺膦的抗性的基因。
在一些实施方案中,本文所公开的表达盒包含编码可记录或可筛选标记的目的多核苷酸,其中多核苷酸的存在产生可测量的产物。示例包括β-葡糖苷酸酶或uida基因(gus),其编码针对其的各种显色底物是已知的酶(例如,美国专利5,268,463和5,599,670);氯霉素乙酰转移酶和碱性磷酸酶。其它可筛选的标记包括花青苷/类黄酮多核苷酸,包括例如编码调控植物组织中花青苷色素(红色)的产生的产物的r-基因座多核苷酸,控制类黄酮色素的生物合成的基因,诸如玉米c1和c2、b基因、p1基因和bronze基因座基因等。由目的多核苷酸编码的合适的标记的另外的示例包括青色荧光蛋白(cyp)基因、黄色荧光蛋白基因、编码荧光素酶的发光基因(其存在可使用例如,x光片、闪烁计数、荧光光度法、微光摄像机、光子计数照相机或多孔发光测定法来检测)、绿色荧光蛋白(gfp)和dsred2(美国加利福尼亚州山景城的克隆实验室公司(clontechlaboratories,inc.,mountainview,california)),其中用标记基因转化的植物细胞发出红色荧光,因而可从视觉上选择。另外的示例包括编码其各种显色底物(例如,padac、显色头孢菌素)已知的酶的p-内酰胺酶基因、编码可转化显色儿茶酚的儿茶酚双加氧酶的xyle基因和编码能够将酪氨酸氧化为多巴和多巴醌(其继而缩合以形成易于检测的化合物黑素)的酶的酪氨酸酶基因。
表达盒还可包含用于选择转化的细胞的选择性标记基因。选择性标记基因用于选择经转化的细胞或组织。标记基因包括编码抗生素抗性的基因,诸如那些编码新霉素磷酸转移酶ii(neo)和潮霉素磷酸转移酶(hpt)的基因,以及赋予对除草化合物的抗性的基因,所述除草化合物诸如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-d)。另外的选择性标记包括表型标记诸如β-半乳醣苷酶和荧光蛋白诸如绿色荧光蛋白(gfp)(suetal.(2004)biotechnolbioeng85:610-9(su等人,2004年,《生物技术和生物工程》,第85卷,第610-619页)和fetteretal.(2004)plantcell16:215-28(fetter等人,2004年,《植物细胞》,第16卷,第215-228页))、青色荧光蛋白(cyp)(bolteetal.(2004)j.cellscience117:943-54(bolte等人,2004年,《细胞科学杂志》,第117卷,第943-954页)和katoetal.(2002)plantphysiol129:913-42(kato等人,2002年,《植物生理学》,第129卷,第913-942页))和黄色荧光蛋白(来自evrogen公司的phiyfptm,参见bolteetal.(2004)j.cellscience117:943-54(bolte等人,2004年,《细胞科学杂志》,第117卷,第943-954页))。对于另外的选择性标记,通常参见yarranton(1992)curr.opin.biotech.3:506-511(yarranton,1992年,《生物技术新见》,第3卷,第506-511页);christophersonetal.(1992)proc.natl.acad.sci.usa89:6314-6318(christopherson等人,1992年,《美国国家科学院院刊》,第89卷,第6314-6318页);yaoetal.(1992)cell71:63-72(yao等人,1992年,《细胞》,第71卷,第63-72页);reznikoff(1992)mol.microbiol.6:2419-2422(reznikoff,1992年,《分子微生物学》,第6卷,第2419-2422页);barkleyetal.(1980)intheoperon,pp.177-220(barkley等人,1980年,载于《操纵子》,第177-220页);huetal.(1987)cell48:555-566(hu等人,1987年,《细胞》,第48卷,第555-566页);brownetal.(1987)cell49:603-612(brown等人,1987年,《细胞》,第49卷,第603-612页);figgeetal.(1988)cell52:713-722(figge等人,1988年,《细胞》,第52卷,第713-722页);deuschleetal.(1989)proc.natl.acad.aci.usa86:5400-5404(deuschle等人,1989年,《美国国家科学院院刊》,第86卷,第5400-5404页);fuerstetal.(1989)proc.natl.acad.sci.usa86:2549-2553(fuerst等人,1989年,《美国国家科学院院刊》,第86卷,第2549-2553页);deuschleetal.(1990)science248:480-483(deuschle等人,1990年,《科学》,第248卷,第480-483页);gossen(1993)ph.d.thesis,universityofheidelberg(gossen,1993年,德国海德尔堡大学博士论文);reinesetal.(1993)proc.natl.acad.sci.usa90:1917-1921(reines等人,1993年,《美国国家科学院院刊》,第90卷,第1917-1921页);labowetal.(1990)mol.cell.biol.10:3343-3356(labow等人,1990年,《分子细胞生物学》,第10卷,第3343-3356页);zambrettietal.(1992)proc.natl.acad.sci.usa89:3952-3956(zambretti等人,1992年,《美国国家科学院院刊》,第89卷,第3952-3956页);baimetal.(1991)proc.natl.acad.sci.usa88:5072-5076(baim等人,1991年,《美国国家科学院院刊》,第88卷,第5072-5076页);wyborskietal.(1991)nucleicacidsres.19:4647-4653(wyborski等人,1991年,《核酸研究》,第19卷,第4647-4653页);hillenand-wissman(1989)topicsmol.struc.biol.10:143-162(hillenand-wissman,1989年,《分子结构生物学主题》,第10卷,第143-162页);degenkolbetal.(1991)antimicrob.agentschemother.35:1591-1595(degenkolb等人,1991年,《抗微生物剂和化学治疗》,第35卷,第1591-1595页);kleinschnidtetal.(1988)biochemistry27:1094-1104(kleinschnidt等人,1988年,《生物化学》,第27卷,第1094-1104页);bonin(1993)ph.d.thesis,universityofheidelberg(bonin,1993年,德国海德尔堡大学博士论文);gossenetal.(1992)proc.natl.acad.sci.usa89:5547-5551(gossen等人,1992年,《美国国家科学院院刊》,第89卷,第5547-5551页);olivaetal.(1992)antimicrob.agentschemother.36:913-919(oliva等人,1992年,《抗微生物剂和化学治疗》,第36卷,第913-919页);hlavkaetal.(1985)handbookofexperimentalpharmacology,vol.78(springer-verlag,berlin)(hlavka等人,1985年,《实验药理学手册》,第78卷,柏林斯普林格出版社);gilletal.(1988)nature334:721-724(gill等人,1988年,《自然》,第334卷,第721-724页)。这些公开内容以引用的方式并入本文。以上选择性标记基因的列表并不意指是限制性的。任何选择性标记基因均可用于本文所公开的组合物和方法中。
在一些实施方案中,本文所公开的表达盒包含编码可操作地连接至第一启动子多核苷酸的雄性能育性多核苷酸的第一目的多核苷酸,该第一目的多核苷酸与编码可操作地连接至雄性组织优选的启动子多核苷酸的雄性配子破坏性基因产物的第二目的多核苷酸堆叠。在某些实施方案中,本文所述的表达盒还可与编码可操作地连接至启动子多核苷酸的标记多核苷酸的第三目的多核苷酸堆叠。
在特定实施方案中,本文所公开的表达盒包含编码本文所公开的可操作地连接至组成型启动子(诸如花椰菜花叶病毒(camv)35s启动子)的雄性能育性基因(诸如小麦或大麦ms1)的第一目的多核苷酸。表达盒还可包含编码可操作地连接至雄性组织优选的启动子的雄性配子破坏性基因产物的第二目的多核苷酸。在某些实施方案中,本文所公开的表达盒还可以包含编码可操作地连接至组成型启动子(诸如花椰菜花叶病毒(camv)35s启动子)的标记基因(诸如来自产绿色链霉菌(streptomycesviridochomagenes)的草胺膦乙酰转移酶(pat)基因)的第三目的多核苷酸。
iv.植物
a.具有改变的雄性能育性多肽水平活性的植物
还提供了具有改变的雄性能育性多肽水平和/或活性和/或改变的雄性能育性水平的植物。在一些实施方案中,本文所公开的植物已在它们的基因组中稳定地掺入了如本文所公开的异源雄性能育性多核苷酸或其活性片段或变体。因此,提供了这样的植物、植物细胞、植物部分和种子,它们包含seqidno:1、2、4、7、42、43、44或45中任一者示出的至少一种异源雄性能育性多核苷酸,或者它们的任何活性片段或变体。
还提供了包含本文所公开的表达盒的植物,该表达盒包含可操作地连接至在植物中有活性的启动子的雄性能育性多核苷酸。在一些实施方案中,雄性能育性多核苷酸的表达调节植物的雄性能育性。在某些实施方案中,雄性能育性多核苷酸的表达增强植物的雄性能育性。例如,提供了包含这样的表达盒的植物,该表达盒包含可操作地连接至组成型启动子(诸如camv35s启动子)的seqidno:1、2、4、7、42、43、44或45示出的ms1多核苷酸,或者它们的活性片段或变体。在ms1多核苷酸表达时,植物的雄性能育性增强。
在某些实施方案中,向雄性不育植物提供表达盒,该表达盒包含本文所公开的可操作地连接至在植物中有活性的启动子的异源雄性能育性多核苷酸或者其活性片段或变体。在异源雄性能育性多核苷酸表达时,赋予雄性能育性;这可被称为恢复植物的雄性能育性。在特定实施方案中,本文所公开的植物包含具有如本文所公开的可操作地连接至启动子的异源雄性能育性多核苷酸、或其活性片段或变体的表达盒,该表达盒与包含可操作地连接至在植物中有活性的启动子的目的多核苷酸的一个或多个表达盒堆叠。例如,堆叠的目的多核苷酸可包括雄性配子破坏性多核苷酸和/或标记多核苷酸。
本文所公开的植物还可以包含本文所述的具有至少两种多核苷酸的堆叠表达盒,使得所述至少两种多核苷酸在超过50%的减数分裂中(即,不是随机地)被一起遗传。因此,当包含具有两种多核苷酸的堆叠表达盒的植物或植物细胞发生减数分裂时,所述两种多核苷酸分离到同一个子代(子系)细胞中。这样,堆叠的多核苷酸将很可能在它们被呈递至的任何细胞中一起表达。例如,植物可包含具有雄性能育性多核苷酸的表达盒,该表达盒与包含雄性配子破坏性多核苷酸的表达盒堆叠,使得雄性能育性多核苷酸和雄性配子破坏性多核苷酸被一起遗传。具体地讲,雄性不育植物可包含具有本文所公开的可操作地连接至组成型启动子的雄性能育性多核苷酸的表达盒,该表达盒与包含可操作地连接至雄性组织优选启动子的雄性配子破坏性多核苷酸的表达盒堆叠,使得所述植物产生成熟的花粉粒。然而,在这种植物中,包含雄性能育性多核苷酸的花粉的发育将被雄性配子破坏性多核苷酸的表达抑制。
b.植物和引入方法
如本文所用,术语“植物”包括植物细胞、植物原生质体、从中可再生出植物的植物细胞组织培养物、植物愈伤组织、在植物或植物部分中完好的植物块和植物细胞如胚、花粉、胚珠、种子、叶、花、枝、果实、仁、穗、穗轴、壳、茎、根、根尖、花粉囊、谷粒等。如本文所用,所谓“谷粒”意指商业种植者出于栽培或繁殖物种以外的目的生产的成熟种子。再生植物的子代、变体和突变体也包括在本公开的范围内,前提条件是这些部分包含所引入的核酸序列。
本文所公开的方法包括将多肽或多核苷酸引入植物细胞中。“引入”旨在意指以使得多核苷酸或多肽的序列得以进入细胞内部的方式将多核苷酸或多肽呈递到植物。本文所公开的方法不依赖于将序列引入宿主细胞中的具体方法,只要多核苷酸或多肽进入宿主的至少一个细胞的内部即可。用于将多核苷酸或多肽引入宿主细胞(即,植物细胞)中的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。
“稳定转化”旨在意指被引入宿主(即,植物)中的核苷酸构建体整合进植物的基因组中,并能够由其子代遗传。“瞬时转化”旨在意指将多核苷酸或多肽引入宿主(即,植物)中并进行瞬时表达。
转化规程以及用于将多肽或多核苷酸序列引入植物中的规程,可根据要进行转化的植物或植物细胞的类型(例如,单子叶植物或双子叶植物)而异。将多肽和多核苷酸引入植物细胞中的合适方法包括微注射(crosswayetal.(1986)biotechniques4:320-334(crossway等人,1986年,《生物技术》,第4卷,第320-334页))、电穿孔(riggsetal.(1986)proc.natl.acad.sci.usa83:5602-5606(riggs等人,1986年,《美国国家科学院院刊》,第83卷,第5602-5606页))、农杆菌(agrobacterium)介导的转化(townsend等人,美国专利5,563,055;zhao等人,美国专利5,981,840)、直接基因转移(paszkowskietal.(1984)emboj.3:2717-2722(paszkowski等人,1984年,《欧洲分子生物学组织杂志》,第3卷,第2717-2722页))和弹道粒子加速(参见例如sanford等人,美国专利4,945,050;tomes等人,美国专利5,879,918;tomes等人,美国专利5,886,244;bidney等人,美国专利5,932,782;tomesetal.(1995)″directdnatransferintointactplantcellsviamicroprojectilebombardment,″inplantcell,tissue,andorganculture:fundamentalmethods,ed.gamborgandphillips(springer-verlag,berlin)(tomes等人,1995年,“通过微粒轰击直接将dna转移进完整植物细胞中”,载于《植物细胞、组织和器官培养:基本方法》,gamborg和phillips编辑,柏林施普林格出版社);mccabeetal.(1988)biotechnology6:923-926(mccabe等人,1988年,《生物技术》,第6卷,第923-926页));以及lecl转化(wo00/28058)。还可参见weissingeretal.(1988)ann.rev.genet.22:421-477(weissinger等人,1988年,《遗传学年评》,第22卷,第421-477页);sanfordetal.(1987)particulatescienceandtechnology5:27-37(sanford等人,1987年,《颗粒科学与技术》,第5卷,第27-37页)(洋葱);christouetal.(1988)plantphysiol.87:671-674(christou等人,1988年,《植物生理学》,第87卷,第671-674页)(大豆);mccabeetal.(1988)bio/technology6:923-926(mccabe等人,1988年,《生物技术》,第6卷,第923-926页)(大豆);finerandmcmullen(1991)invitrocelldev.biol.27p:175-182(finer和mcmullen,1991年,《体外细胞发育生物学》,第27p卷,第175-182页)(大豆);singhetal.(1998)theor.appl.genet.96:319-324(singh等人,1998年,《理论与应用遗传学》,第96卷,第319-324页)(大豆);dattaetal.(1990)biotechnology8:736-740(datta等人,1990年,《生物技术》,第8卷,第736-740页)(稻);kleinetal.(1988)proc.natl.acad.sci.usa85:4305-4309(klein等人,1988年,《美国国家科学院院刊》,第85卷,第4305-4309页)(玉米);kleinetal.(1988)biotechnology6:559-563(klein等人,1988年,《生物技术》,第6卷,第559-563页)(玉米);tomes,美国专利5,240,855;buising等人,美国专利5,322,783和5,324,646;tomesetal.(1995)″directdnatransferintointactplantcellsviamicroprojectilebombardment,″inplantcell,tissue,andorganculture:fundamentalmethods,ed.gamborg(springer-verlag,berlin)(tomes等人,1995年,“通过微粒轰击直接将dna转移到完整植物细胞中”,载于《植物细胞、组织和器官培养:基本方法》,gamborg编辑,柏林施普林格出版社)(玉米);kleinetal.(1988)plantphysiol.91:440-444(klein等人,1988年,《植物生理学》,第91卷,第440-444页)(玉米);frommetal.(1990)biotechnology8:833-839(fromm等人,1990年,《生物技术》,第8卷,第833-839页)(玉米);hooykaas-vanslogterenetal.(1984)nature(london)311:763-764(hooykaas-vanslogteren等人,1984年,《自然》(伦敦),第311卷,第763-764页);bowen等人,美国专利5,736,369(谷类);bytebieretal.(1987)proc.natl.acad.sci.usa84:5345-5349(bytebier等人,1987年,《美国国家科学院院刊》,第84卷,第5345-5349页)(百合科);dewetetal.(1985)intheexperimentalmanipulationofovuletissues,ed.chapmanetal.(longman,newyork),pp.197-209(dewet等人,1985年,载于《胚珠组织的实验操纵》,chapman等人编辑,纽约朗文出版社,第197-209页)(花粉);kaeppleretal.(1990)plantcellreports9:415-418(kaeppler等人,1990年,《植物细胞报告》,第9卷,第415-418页)和kaeppleretal.(1992)theor.appl.genet.84:560-566(kaeppler等人,1992年,《理论与应用遗传学》,第84卷,第560-566页)(颈须介导的转化);d′halluinetal.(1992)plantcell4:1495-1505(d′halluin等人,1992年,《植物细胞》,第4卷,第1495-1505页)(电穿孔);lietal.(1993)plantcellreports12:250-255(li等人,1993年,《植物细胞报告》,第12卷,第250-255页)和christouandford(1995)annalsofbotany75:407-413(christou和ford,1995年,《植物学年鉴》,第75卷,第407-413页)(稻);osjodaetal.(1996)naturebiotechnology14:745-750(osjoda等人,1996年,《自然生物技术》,第14卷,第745-750页)(玉米,通过根瘤农杆菌转化);以上所有文献以引用方式并入本文。
在具体的实施方案中,可使用多种瞬时转化方法为植物提供本文所公开的雄性能育性多核苷酸或表达盒。这种瞬时转化方法包括但不限于直接向植物中引入雄性能育性多肽或其变体和片段,或者向植物中引入雄性能育性转录物。这类方法包括例如显微注射法或粒子轰击法。参见例如crosswayetal.(1986)molgen.genet.202:179-185(crossway等人,1986年,《分子遗传学与普通遗传学》,第202卷,第179-185页);nomuraetal.(1986)plantsci.44:53-58(nomura等人,1986年,《植物科学》,第44卷,第53-58页);hepleretal.(1994)proc.natl.acad.sci.91:2176-2180(hepler等人,1994年,《美国国家科学院院刊》,第91卷,第2176-2180页)以及hushetal.(1994)thejournalofcellscience107:775-784(hush等人,1994年,《细胞科学杂志》,第107卷,第775-784页),以上所有文献以引用方式并入本文。或者,可使用本领域已知的技术将本文所公开的雄性能育性多核苷酸或表达盒瞬时转化到植物中。此类技术包括利用病毒载体系统,和将多核苷酸以避免dna随后释放的方式沉淀。因此,虽然仍可能从粒子结合的dna开始转录,但这种dna释放继而整合到基因组中的频率会大大降低。此类方法包括使用包被有聚乙基亚胺(pei,sigma#p3143)的粒子。
在其它实施方案中,通过使植物与病毒或病毒核酸接触,可将本文所公开的雄性能育性多核苷酸或表达盒引入植物中。一般来讲,此类方法涉及将本文所公开的核苷酸构建体掺入在病毒dna或rna分子内。应当认识到,本文所公开的雄性能育性序列可最初作为病毒聚蛋白的一部分来合成,其随后可通过体内或体外蛋白水解进行加工,由此产生所需的重组蛋白。涉及病毒dna或rna分子的用于将多核苷酸引入植物中并表达其中所编码的蛋白质的方法是本领域已知的。参见例如美国专利5,889,191、5,889,190、5,866,785、5,589,367、5,316,931,以及portaetal.(1996)molecularbiotechnology5:209-221(porta等人,1996年,《分子生物技术》,第5卷,第209-221页);以上文献以引用方式并入本文。
用于在植物基因组中特定位置处靶向插入多核苷酸的方法是本领域已知的。在一个实施方案中,在期望的基因组位置插入多核苷酸是使用位点特异性重组系统实现的。参见例如wo99/25821、wo99/25854、wo99/25840、wo99/25855和wo99/25853,这些专利全部以引用方式并入本文。简而言之,本文所公开的多核苷酸可包含在旁侧分布有两个不相同的重组位点的转移盒中。将转移盒引入在其基因组中稳定掺入这样的靶标位点的植物中,该靶标位点在旁侧分布有与该转移盒的所述位点对应的两个不相同的重组位点。提供适当的重组酶,并且将转移盒整合在该靶标位点处。目的多核苷酸因此被整合在植物基因组中的特定染色体位置处。
可依据常规方式将已转化的细胞培育成植株。参见例如mccormicketal.(1986)plantcellreports5:81-84(mccormick等人,1986年,《植物细胞报告》,第5卷,第81-84页)。然后可用相同的转化植株或不同的植株对这些植物进行授粉,并且所得的子代具有所鉴定的所需表型特征的所需表达。可以培育两代或更多世代,以确保所需表型特征的表达得到稳定保持和遗传,然后收获种子,以确保已实现所需表型特征的表达。以此方式,本公开提供在其基因组中稳定掺入了本文所公开的雄性能育性多核苷酸(例如本文所公开的表达盒)的转化种子(也称为“转基因种子”)。
术语“靶位点”、“靶序列”、“靶dna”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、和“基因组靶基因座”在本文中可互换使用,并且是指在细胞基因组(包括叶绿体和线粒体dna)中诱导双链断裂的位置处的细胞的基因组中的多核苷酸序列。靶位点可以是细胞或生物体的基因组中的内源位点,或者靶位点对于细胞或生物体可以是异源的,因而并非天然存在于基因组中,或者与在自然界中存在的位置相比,靶位点可在异源基因组位置中存在。如本文所用,术语“内源靶序列”和“天然靶序列”在本文中可互换使用,是指对于细胞或生物体的基因组是内源的或天然的并且在细胞或生物体的基因组中位于该靶序列的内源或天然位置的靶序列。细胞包括植物细胞以及通过本文所述的方法产生的植物和种子。
在一个实施方案中,与正在使用的特定基因编辑系统相关的靶位点可与通过双链断裂诱导剂特异性识别和/或结合的dna识别位点或靶位点相似,所述双链断裂诱导剂为诸如但不限于锌指内切核酸酶、大范围核酸酶、talen内切核酸酶、crispr-cas向导rna或其它多核苷酸指导的双链断裂试剂。
术语“人工靶位点”和“人工靶序列”在本文中可互换使用,是指已经引入细胞或生物体的基因组中的靶序列。这种人工靶序列可在序列上与细胞基因组中的内源或天然靶序列相同,但可位于细胞或生物体的基因组中的不同位置(即,非内源或非天然位置)。
术语“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”和“修饰的靶序列”在本文中可互换使用,是指与未改变的靶序列相比包括至少一个改变的如本文所公开的靶序列。这种“改变”包括,例如:(i)替换至少一个核苷酸,(ii)缺失至少一个核苷酸,(iii)插入至少一个核苷酸,或者(iv)(i)-(iii)的任何组合。例如,已经证实msld、msle、mslf或mslh的点突变导致雄性不育;类似的突变可定向发生在ms1的外显子内,以提供导致雄性不育的替代等位基因。此外,可组合使用多个突变。
某些实施方案包括使用内切核酸酶修饰的本文所公开的多核苷酸。内切核酸酶是裂解多核苷酸链内的磷酸二酯键的酶,并且包括在特定位点裂解dna而不损伤碱基的限制性内切核酸酶。限制性内切核酸酶包括i型、ii型、iii型和iv型内切核酸酶,它们进一步包括亚型。在i型和iii型系统中,甲基化酶活性和限制酶活性两者都包含在单一复合物中。
内切核酸酶还包括大范围核酸酶,也称为归巢内切核酸酶(hease)。与限制性内切核酸酶类似,hease在特异性识别位点结合和切割。但大范围核酸酶的识别位点通常更长,约为18bp或更长。(参见2012年3月22日提交的专利公开wo2012/129373)。基于保守序列基序,已经将大范围核酸酶分类为四个家族(belfortm,andperlmanpsj.biol.chem.1995;270:30237-30240(belfortm和perlmanps,《生物化学杂志》,1995年,第270卷,第30237-30240页))。这些基序参与金属离子的配位和磷酸二酯键的水解。hease的显著之处在于它们的识别位点长,并且能容忍它们的dna底物中有一定的序列多态性。
大范围核酸酶的命名规范与其它限制性内切核酸酶的规范相似。对于分别由自立式(free-standing)orf、内含子和内含肽编码的大范围核酸酶,它们还通过前缀f-、i-或者pi-进行表征。重组过程中的一个步骤涉及在识别位点之处或者附近进行多核苷酸裂解。该裂解活性可用于产生双链断裂。有关位点特异性重组酶及其识别位点的综述,参见sauer(1994)curr.op.biotechnol.5:521-7(sauer等人,1994年,《生物技术当前述评》,第5卷,第521-527页);以及sadowski(1993)faseb7:760-7(sadowski,1993年,《美国实验生物学学会联合会》,第7卷,第760-767页)。在一些示例中,重组酶来自整合酶或者解离酶家族。
tal效应子核酸酶是一类序列特异性核酸酶,可用于在植物或者其它生物体的基因组中的特定靶序列处产生双链断裂(milleretal.(2011)naturebiotechnology29:143-148(miller等人,2011年,《自然生物技术》,第29卷,第143-148页))。锌指核酸酶(zfn)是工程改造的双链断裂诱导剂,由锌指dna结合结构域和双链断裂诱导剂结构域构成。识别位点特异性由锌指结构域赋予,锌指结构域通常包含两个、三个或者四个例如具有c2h2结构的锌指;但是其它锌指结构也是已知的并已被工程化。锌指结构域易于设计特异性结合选定的多核苷酸识别序列的多肽。zfn包括连接到非特异性内切核酸酶结构域的工程改造的dna结合锌指结构域,所述非特异性内切核酸酶结构域例如来自ii型内切核酸酶(诸如foki)的核酸酶结构域。可将另外的功能性融合到锌指结合结构域,包括转录激活因子结构域、转录阻遏蛋白结构域和甲基化酶。在一些示例中,核酸酶结构域的二聚化为裂解活性所需。每个锌指识别靶dna中的三个连续碱基对。例如,一个3锌指结构域识别9个连续核苷酸的序列;由于该核酸酶要求二聚化,使用两组锌指三联体来结合一条18个核苷酸的识别序列。
crispr基因座(clusteredregularlyinterspacedshortpalindromicrepeats,规律成簇间隔短回文重复序列)(也称spidr——spacerintersperseddirectrepeats,间隔区散在同向重复序列)构成最近描述的dna基因座的家族。crispr基因座由短且高度保守的dna重复序列(通常24bp至40bp,重复1至140次,也称crispr重复序列)组成,所述dna重复序列是部分回文的。重复的序列(通常是物种特异性的)被恒定长度的可变序列(通常20至58,取决于crispr基因座(2007年3月1日公布的wo2007/025097))间隔。
crispr基因座首先在大肠杆菌中识别(ishinoetal.(1987)j.bacterial.169:5429-5433(ishino等人,1987年,《细菌学杂志》,第169卷,第5429-5433页);nakataetal.(1989)j.bacterial.171:3553-3556(nakata等人,1989年,《细菌学杂志》,第171卷,第3553-3556页))。在地中海富盐菌(haloferaxmediterranei)、酿脓链球菌(streptococcuspyogenes)、鱼腥藻属(anabaena)和肺结核分枝杆菌(mycobacteriumtuberculosis)中已鉴定出类似的散在短序列重复序列(groenenetal.(1993)mol.microbiol.10:1057-1065(groenen等人,1993年,《分子微生物学》,第10卷,第1057-1065页);hoeetal.(1999)emerg.infect.dis.5:254-263(hoe等人,1999年,《新兴传染病》,第5卷,第254-263页);masepohletal.(1996)biochim.biophys.acta1307:26-30(masepohl等人,1996年,《生物化学与生物物理学学报》,第1307卷,第26-30页);mojicaetal.(1995)mol.microbiol.17:85-93(mojica等人,1995年,《分子微生物学》,第17卷,第85-93页))。crispr基因座与其它ssr不同之处在于重复序列的结构,该重复序列也被命名为短规则间隔重复序列(srsr)(janssenetal.(2002)omicsj.integ.biol.6:23-33(janssen等人,2002年,《0mics:整合生物学杂志》,第6卷,第23-33页);mojicaetal.(2000)mol.microbiol.36:244-246(mojica等人,2000年,《分子微生物学》,第36卷,第244-246页))。重复序列是成簇出现的短元件,其通常被恒定长度的可变序列规则地间隔(mojicaetal.(2000)mol.microbiol.36:244-246(mojica等人,2000年,《分子微生物学》,第36卷,第244-246页))。
cas基因是指通常与侧翼crispr基因座偶联、相关或接近或在侧翼crispr基因座附近的基因。术语“cas基因”、“crispr相关(cas)基因”在本文中可互换使用。cas蛋白家族的综述在haftetal.(2005)computationalbiology,ploscomputbiol1(6):e60.doi:10.1371/journal.pcbi.0010060(haft等人,2005年,“计算生物学”,《数学与计算生物学》,第1卷,第6期,第e60页,doi:10.1371/journal.pcbi.0010060)中呈现。如该文献中所描述,除了四个之前已知的基因家族外,还描述了41个crispr相关(cas)基因家族。该文献表明,crispr系统属于不同的类别,具有不同的重复序列模式、不同组的基因以及不同物种范围。给定的crispr基因座中的cas基因的数目可随物种而不同。
cas内切核酸酶涉及由cas基因编码的cas蛋白,其中所述cas蛋白能够将双链断裂引入dna靶序列中。cas内切核酸酶由向导多核苷酸导向以在特定靶位点处识别并任选地将双链断裂引入细胞基因组中(提交于2014年7月11日的美国临时申请62/023239)。向导多核苷酸/cas内切核酸酶系统包括cas内切核酸酶和能够将双链断裂引入dna靶序列中的向导多核苷酸的复合物。cas内切核酸酶解开基因组靶位点附近的dna双链体,如果正确的前间区序列邻近基序(pam)大致定向在靶序列的3′端,那么在向导rna识别靶序列后,该cas内切核酸酶裂解两条dna链。
cas内切核酸酶基因可以是cas9内切核酸酶或其功能片段,诸如但不限于2007年3月1日公布的wo2007/025097中的seqidno:462、474、489、494、499、505和518所列的cas9基因。cas内切核酸酶基因可以是植物、玉米或大豆优化的cas9内切核酸酶,诸如但不限于植物密码子优化的酿脓链球菌(streptococcuspyogenes)cas9基因,其可识别n(12-30)ngg形式的任何基因组序列。cas内切核酸酶可通过本领域已知的任何方法直接引入细胞中,所述方法例如但不限于瞬时引入法、转染和/或局部施用。
如本文所用,术语“向导rna”是指crrna(crisprrna)(其包含可变靶向结构域)和tracrrna这两种rna分子的合成融合体。在一个实施方案中,向导rna包含12至30个核苷酸序列的可变靶向结构域和可与cas内切核酸酶相互作用的rna片段。
如本文所用,术语“向导多核苷酸”是指可与cas内切核酸酶形成复合物并且使cas内切核酸酶能够识别并任选地裂解dna靶位点的多核苷酸序列(2014年7月11日提交的美国临时申请62/023239)。向导多核苷酸可以是单分子或双分子。向导多核苷酸序列可以是rna序列、dna序列或它们的组合(rna-dna组合序列)。任选地,向导多核苷酸可包含至少一个核苷酸、磷酸二酯键或连接修饰,诸如但不限于锁核酸(lna)、5-甲基脱氧胞嘧啶、2,6-二氨基嘌呤、2′-氟腺嘌呤、2′-氟尿嘧啶、2′-o-甲基rna、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔区18(六乙二醇链)分子的连接或者导致环化的5′至3′共价连接。仅包含核糖核酸的向导多核苷酸也被称为“向导rna”。
向导多核苷酸可以是双分子(也称为双链体向导多核苷酸),其包含与靶dna中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或vt结构域)和与cas内切核酸酶多肽相互作用的第二核苷酸序列结构域(称为cas内切核酸酶识别结构域或cer结构域)。双分子向导多核苷酸的cer结构域包含沿着互补区域杂交的两个单独分子。两个单独分子可以是rna、dna和/或rna-dna组合序列。在一些实施方案中,包含连接到cer结构域的vt结构域的双链体向导多核苷酸的第一分子被称为“crdna”(当由连续dna核苷酸区段组成时)或“crrna”(当由连续rna核苷酸区段组成时)或“crdna-rna”(当由dna和rna核苷酸的组合组成时)。cr核苷酸可包含天然存在于细菌和古细菌中的crna的片段。在一个实施方案中,存在于本文所公开的cr核苷酸中的天然存在于细菌和古细菌中的crna的片段的大小的范围可为但不限于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在一些实施方案中,包含cer结构域的双链体向导多核苷酸的第二分子被称为“tracrrna”(当由连续rna核苷酸区段组成时)或“tracrdna”(当由连续dna核苷酸区段组成时)或“tracrdna-rna“(当由dna和rna核苷酸的组合组成时)。在一个实施方案中,导向rna/cas9内切核酸酶复合物的rna是包含双链体crrna-tracrrna的双链体rna。
向导多核苷酸还可以是单分子,其包含与靶dna中的核苷酸序列互补的第一核苷酸序列结构域(称为可变靶向结构域或vt结构域)和与cas内切核酸酶多肽相互作用的第二核苷酸结构域(称为cas内切核酸酶识别结构域或cer结构域)。所谓“结构域”,是指可以是rna、dna和/或rna-dna组合序列的连续核苷酸区段。单向导多核苷酸的vt结构域和/或cer结构域可包含rna序列、dna序列或rna-dna组合序列。在一些实施方案中,单向导多核苷酸包含连接到tracr核苷酸(包含cer结构域)的cr核苷酸(包含连接到cer结构域的vt结构域),其中该连接是包含rna序列、dna序列或rna-dna组合序列的核苷酸序列。由来自cr核苷酸和tracr核苷酸的序列组成的单向导多核苷酸可被称为“单向导rna”(当由连续rna核苷酸区段组成时)或“单向导dna”(当由连续dna核苷酸区段组成时)或“单指导rna-dna”(当由rna和dna核苷酸的组合组成时)。在本公开的一个实施方案中,单向导rna包含可与ii型cas内切核酸酶形成复合物的ii型/cas系统的crna或crna片段以及tracrrna或tracrrna片段,其中所述向导rna/cas内切核酸酶复合物可将cas内切核酸酶引导至植物基因组靶位点,使cas内切核酸酶能够将双链断裂引入基因组靶位点中。与双链体向导多核苷酸相比,使用单向导多核苷酸的一个方面在于,仅需制备一个表达盒就能表达单向导多核苷酸。
术语“可变靶向结构域”或“vt结构域”在本文中可互换使用,并且包括与双链dna靶位点的一条链(核苷酸序列)互补的核苷酸序列。第一核苷酸序列结构域(vt结构域)与靶序列之间的互补百分比可为至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、63%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。可变靶向结构域的长度可为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸。在一些实施方案中,可变靶向结构域包含12至30个核苷酸的连续区段。可变靶向结构域可由dna序列、rna序列、修饰的dna序列、修饰的rna序列或它们的任何组合组成。
向导多核苷酸的术语“cas内切核酸酶识别结构域”或“cer结构域”在本文中可互换使用,并且包括与cas内切核酸酶多肽相互作用的核苷酸序列(诸如,向导多核苷酸的第二核苷酸序列结构域)。cer结构域可由dna序列、rna序列、修饰的dna序列、修饰的rna序列(参见例如本文所述的修饰)或它们的任何组合组成。
连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含rna序列、dna序列或rna-dna组合序列。在一个实施方案中,连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列的长度可为至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸。在另一个实施方案中,连接单向导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可包含四环序列,诸如但不限于gaaa四环序列。
向导多核苷酸、vt结构域和/或cer结构域的核苷酸序列修饰可选自但不限于由5′帽、3′多聚腺苷酸尾、核糖开关序列、稳定性控制序列、形成dsrna双链体的序列、将向导多核苷酸靶向亚细胞位置的修饰或序列、提供追踪的修饰或序列、提供蛋白质结合位点的修饰或序列、锁核酸(lna)、5-甲基脱氧胞嘧啶核苷酸、2,6-二氨基嘌呤核苷酸、2′-氟腺嘌呤核苷酸、2′-氟尿嘧啶核苷酸;2′-o-甲基rna核苷酸、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔区18分子的连接、5′至3′共价连接或它们的任何组合。这些修饰可导致至少一个另外的有益特征,其中所述另外的有益特征选自经修饰的或调控的稳定性、亚细胞靶向、追踪、荧光标记、蛋白质或蛋白质复合物的结合位点、修饰的对互补靶序列的结合亲和力、修饰的对细胞降解的抗性以及增加的细胞通透性。
在某些实施方案中,待修饰的核苷酸序列可以是调控序列,诸如启动子,其中启动子的编辑包括用不同启动子(也称为替换启动子)或启动子片段(也称为替换启动子片段)替换启动子(也称为“启动子更换”或“启动子替换”),其中启动子替换导致以下中的任一项,或以下项的任意组合:启动子活性增加、启动子组织特异性增加、启动子活性降低、启动子组织特异性降低、新的启动子活性、诱导型启动子活性、扩展基因表达的窗口、相同细胞层或其它细胞层中基因表达的时间选择或发育进展的改变(诸如但不限于延长玉米花粉囊的绒毡层中基因表达的时间选择;参见例如1998年11月17日公布的us5,837,850)、dna结合元件突变和/或dna结合元件缺失或添加。待修饰的启动子(或启动子片段)可以是对于正被编辑的细胞而言是内源的、人工的、预先存在的或转基因的启动子(或启动子片段)。替换启动子(或替换启动子片段)可以是对于正被编辑的细胞而言是内源的、人工的、预先存在的或转基因的启动子(或启动子片段)。
待插入的启动子元件可为但不限于启动子核心元件(诸如但不限于caat盒、ccaat盒、pribnow盒和/或tata盒)、翻译调控序列和/或可诱导表达的阻遏物系统(诸如tet操纵子阻遏物/操纵子/诱导物元件或磺酰脲(su)阻遏物/操纵子/诱导物元件)。脱水应答元件(dre)首先被鉴定为干旱应答基因rd29a的启动子中的顺式作用启动子元件,其含有9bp保守核心序列taccgacat(yamaguchi-shinozaki,k.,andshinozaki,k.(1994)plantcell6,251-264(yamaguchi-shinozaki,k.和shinozaki,k,1994年,《植物细胞》,第6卷,第251-264页))。将dre插入内源性启动子可赋予下游基因的干旱诱导表达。另一个示例是aba应答元件(abre),其含有发现存在于许多aba和/或胁迫调控基因中的(c/t)acgtggc共有序列(buskp.k.,pagesm.(1998)plantmol.biol.37:425-435(buskp.k.、pagesm.,1998年,《植物分子生物学》,第37卷,第425-435页))。将35s增强子或mmv增强子插入内源性启动子区域将增加基因表达(美国专利5196525)。待插入的启动子(或启动子元件)可以是对于正被编辑的细胞而言是内源的、人工的、预先存在的或转基因的启动子(或启动子元件)。
本文所公开的雄性能育性多核苷酸和表达盒可用于任何植物物种的转化,包括但不限于单子叶植物和双子叶植物。目的植物物种的示例包括但不限于玉米(corn/maize,zeamays)、芸苔属物种(brasslcasp.)(例如甘蓝型油菜(b.napus)、芜菁(b.rapa)、芥菜(b.juncea)),苜蓿(medicagosativa)、稻(oryzasativa)、裸麦(secalecereale)、高粱(sorghumbicolor、sorghumvulgare)、粟(例如珍珠粟(pennisetumglaucum)、黄米(panicummiliaceum)、谷子(setariaitalica)、龙爪稷(eleusinecoracana))、向日葵(helianthusannuus)、红花(carthamustinctorius)、小麦(参见下文了解物种)、大豆(glycinemax)、烟草(nicotianatabacum)、马铃薯(solanumtuberosum)、花生(arachishypogaea)、棉花(海岛棉(gossypiumbarbadense)、陆地棉(gossypiumhirsutum))、甘薯(ipomoeabatatus)、木薯(manihotesculenta)、咖啡(coffeaspp.)、椰子(cocosnucifera)、菠萝(ananascomosus)、柑橘(citrusspp.)、可可(theobromacacao)、茶(camelliasinensis)、香蕉(musaspp.)、鳄梨(perseaamericana)、无花果(ficuscaslca)、番石榴(psidiumguajava)、芒果(mangiferaindica)、橄榄(oleaeuropaea)、木瓜(caricapapaya)、腰果(anacardiumoccidentale)、澳洲坚果(macadamiaintegrifolia)、杏仁(prunusamygdalus)、糖用甜菜(betavulgaris)、甘蔗(saccharumspp.)、燕麦(avenasativa)、大麦(hordeumvulgare)、蔬菜类、观赏植物类、草类和针叶树类。
在特定实施方案中,将小麦植物用于本文所公开的方法和组合物中。如本文所用,术语“小麦”是指小麦属(triticum)的任何物种,包括其亲代以及通过与其它物种进行杂交而得到的其子代。小麦包括“六倍体小麦”和“四倍体小麦”,前者具有aabbdd的基因组结构、由42条染色体构成,后者具有aabb的基因组结构、由28条染色体构成。六倍体小麦包括普通小麦(t.aestivum)、斯佩耳特小麦(t.spelta)、摩卡小麦(t.mocha)、密穗小麦(t.compactum)、印度圆粒小麦(t.sphaerococcum)、瓦维洛夫小麦(t.vavilovii),以及它们的种间杂交品种。四倍体小麦包括硬粒小麦(t.durum)(也称为硬质小麦或triticumturgidumssp.durum)、野生二粒小麦(t.dicoccoides)、栽培二粒小麦(t.dicoccum)、波兰小麦(t.polonicum),以及它们的种间杂交品种。此外,术语“小麦”包括六倍体或四倍体小麦属物种的可能亲代,诸如提供a基因组的乌拉尔图小麦(t.uartu)、栽培一粒小麦(t.monococcum)或野生一粒小麦(t.boeoticum),提供b基因组的拟斯卑尔托山羊草(aegilopsspeltoides),以及提供d基因组的粗山羊草(t.tauschii)(也称为节节麦(aegilopssquarrosa)或aegilopstauschii)。用于本公开中的小麦栽培种可属于但不限于上文列出物种中的任一种。还涵盖了通过常规技术使用小麦属物种作为亲本与非小麦属物种进行有性杂交产生的植物,所述非小麦属物种诸如裸麦(secalecereale),包括但不限于黑小麦。在一些实施方案中,小麦植物适用于具有本领域技术人员已知的合适农学特性的谷物(诸如六倍体小麦或硬质小麦的商业品种)的商业生产。
蔬菜包括番茄(lycopersiconesculentum)、莴苣(例如lactucasativa)、青豆(phaseolusvulgaris)、利马豆(phaseoluslimensis)、豌豆(香豌豆属物种(lathyrusspp.))和黄瓜属(cucumis)的成员诸如黄瓜(c.sativus)、香瓜(c.cantalupensis)和甜瓜(c.melo)。观赏植物包括杜鹃(杜鹃花属物种(rhododendronspp.))、八仙花(macrophyllahydrangea)、木槿(hibiscusrosasanensis)、玫瑰(蔷薇属物种(rosaspp.))、郁金香(郁金香属物种(tulipaspp.))、水仙(水仙属物种(narcissusspp.))、矮牵牛(petuniahybrida)、康乃馨(dianthuscaryophyllus)、一品红(euphorbiapulcherrima)和菊花。
可用于实践本发明的方法和组合物的针叶树包括例如松树诸如火炬松(pinustaeda)、湿地松(pinuselliotii)、西黄松(pinusponderosa)、美国黑松(pinuscontorta)和辐射松(pinusradiata);花旗松(pseudotsugamenziesii);异叶铁杉(tsugacanadensis);北美云杉(piceaglauca);红杉(sequoiasempervirens);冷杉,诸如银枞(abiesamabilis)和胶枞(abiesbalsamea);以及雪松,诸如西岸红雪松(thujaplicata)和阿拉斯加黄雪松(chamaecyparisnootkatensis)。在特定实施方案中,本文所公开的植物是作物植物(例如玉米、苜蓿、向日葵、芸苔属、大豆、棉花、红花、花生、高粱、小麦、粟、烟草等等)。其它目的植物包括提供目的种子的谷物植物、油料种子植物和豆科植物。目的种子包括谷物种子,诸如玉米、小麦、大麦、稻、高粱、裸麦等。油料种子植物包括棉花、大豆、红花、向日葵、芸苔属、玉米、苜蓿、棕榈、椰子等。豆科植物包括菜豆和豌豆。菜豆包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、兵豆、鹰嘴豆等。
通常,中间宿主细胞将被用于实施本文所公开的方法和组合物,以增加克隆载体的拷贝数。随着拷贝数增加,可分离极大数量的含有目的核酸的载体以引入所需的植物细胞中。在一个实施方案中,采用不会引起所述多肽在细菌中表达的植物启动子。
原核生物最常用各种大肠杆菌菌株代表;然而,也可使用其它微生物菌株。在本文中定义为包括用于转录起始的启动子(任选地具有操纵子)以及核糖体结合序列的常用原核控制序列,包括诸如β-内酰胺酶(青霉素酶)启动子系统和乳糖(lac)启动子系统(changetal.(1977)nature198:1056(chang等人,1977年,《自然》,198卷,第1056页))、色氨酸(trp)启动子系统(goeddeletal.(1980)nucleicacidsres.8:4057(goeddel等人,1980年,《核酸研究》,第8卷,第4057页))和λ衍生pl启动子之类的常用启动子,以及n-基因核糖体结合位点(shimatakeetal.(1981)nature292:128(shimatake等人,1981年,《自然》,第292卷,第128页))。在转染进大肠杆菌中的dna载体中包含选择标记也是有用的。这种标记的示例包括特异于对氨苄青霉素、四环素或氯霉素的抗性的基因。
选择载体以使得能引入适当的宿主细胞中。细菌载体通常是质粒或噬菌体起源的。将适当的细菌细胞用噬菌体载体颗粒感染或用裸噬菌体载体dna转染。如果使用质粒载体,则将细菌细胞用质粒载体dna转染。使用芽孢杆菌属(bacillussp.)和沙门氏菌属(salmonella)来表达本文所公开的蛋白质的表达系统(palvaetal.(1983)gene22:229-235(palva等人,1983年,《基因》,第22卷,第229-235页);mosbachetal.(1983)nature302:543-545(mosbach等人,1983年,《自然》,第302卷,第543-545页))。
在一些实施方案中,本文所公开的表达盒或雄性能育性多核苷酸在植物中维持半合子状态。半合子状态为当仅存在基因(或基因组)的一个拷贝,而没有对应等位基因时存在的遗传状态。在某些实施方案中,本文所公开的表达盒包含可操作地连接至雄性能育性多核苷酸的第一启动子,该雄性能育性多核苷酸与可操作地连接至雄性组织优选启动子的雄性配子破坏性多核苷酸堆叠,并且将此类表达盒引入处于半合子状态的雄性不育植物中。当雄性能育性多核苷酸表达时,由于雄性能育性多核苷酸使该植物恢复到能育状态,故该植物能够成功地产生成熟的花粉粒。鉴于表达盒处于半合子状态,故在花粉粒形成过程中,只有某些子细胞将遗传该表达盒。由于堆叠的被编码的雄性配子破坏性基因产物的雄性组织优选的表达,遗传了包含雄性能育性多核苷酸的表达盒的子细胞将不会发育为成熟的花粉粒。未遗传该表达盒的那些花粉粒将继续发育为成熟的花粉粒并具有功能性,但它们将不包含该表达盒的雄性能育性多核苷酸,因此将不会通过花粉将雄性能育性多核苷酸传递到子代。
v.调节雄性能育性多肽的浓度和/或活性
提供了用于调节植物中的本文所公开的雄性能育性多肽的浓度和/或活性的方法。本文针对雄性能育性多肽的浓度和/或活性所用的术语“影响”或“调节”,是指当与适当的对照比较时,雄性能育性多肽的浓度和/或活性的任何增大或减小。一般来讲,本文所公开的雄性能育性多肽的浓度和/或活性相对于对照植物、植物部分或细胞增大或减小至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%或90%。本文所公开的调节可在植物生长至具体的发育阶段之前、过程中和/或之后进行。在特定实施方案中,在单子叶植物(特别是小麦)中对本文所公开的雄性能育性多肽进行调节。
可采用多种方法来测定雄性能育性多肽的浓度和/或活性受到的调节。例如,雄性能育性多肽的表达水平可例如通过测定植物中雄性能育性多肽或rna的水平来直接测量(即,蛋白质印迹法或rna印迹法),或者例如通过测定植物中雄性能育性多肽的雄性能育性活性来间接测量。用于测量雄性能育性活性的方法在本文别处描述或是本领域已知的。在特定实施方案中,对雄性能育性多肽浓度和/或活性的调节包括对植物中的雄性能育性多肽的水平的调节(即,增大或减小)。测量雄性能育性多肽的水平和/或活性的方法在本领域中是已知的并且在本文别处进行讨论。在其它实施方案中,对营养组织中、繁殖组织中、或营养组织和繁殖组织两者中的雄性能育性多肽的水平和/或活性进行调节。
在一个实施方案中,通过将多肽或相应的雄性能育性多核苷酸引入植物中来增大雄性能育性多肽的活性和/或浓度。随后,使用本领域技术人员已知的方法选择具有引入的雄性能育性序列的植物,所述方法诸如但不限于southern印迹分析、dna测序、pcr分析或表型分析。在某些实施方案中,将标记多核苷酸与雄性能育性多核苷酸一起引入,以便帮助选择具有或缺乏本文所公开的雄性能育性多核苷酸的植物。将经前述实施方案改变或修饰的植物或植物部分在形成植物的条件下培育足以调节雄性能育性多肽在该植物中的浓度和/或活性的时间。形成植物的条件在本领域中是熟知的。
如本文别处所讨论,许多用来将多肽提供给植物的方法是本领域已知的,包括但不限于将多肽直接引入植物中,或者将编码雄性能育性多肽的多核苷酸构建体引入植物中(瞬时引入或稳定引入)。还应认识到,本文所公开的方法可采用不能够在转化的植物中指导蛋白质或rna的表达的多核苷酸。雄性能育性多肽的水平和/或活性可例如通过改变编码雄性能育性多肽的基因或其启动子来增大。参见例如,kmiec的美国专利5,565,350;zarling等人,pct/us93/03868。因此提供了在雄性能育性基因中携带突变的经诱变处理的植物,其中所述突变调节雄性能育性基因的表达或调节被编码的雄性能育性多肽的活性。
在某些实施方案中,通过向植物引入如本文别处所公开的包含雄性能育性多核苷酸(例如,seqidno:1、2、4、7、42、43、44或45,或者其活性片段或变体)的表达盒来增大雄性能育性多肽的浓度和/或活性。雄性能育性多核苷酸可操作地连接至对于植物是异源的或者对于植物是天然的启动子。通过增大植物中的雄性能育性多肽的浓度和/或活性,植物的雄性能育性也增大。因此,可通过增大雄性能育性多肽的浓度和/或活性来增大植物的雄性能育性。例如,通过增大雄性能育性多肽的浓度和/或活性,可使雄性不育植物恢复雄性能育性。
还应认识到,可通过采用不能够在转化的植物中指导蛋白质或rna的表达的多核苷酸,来调节该多肽的水平和/或活性。例如,本文所公开的多核苷酸可用来设计可在用于改变或诱变生物体中的基因组核苷酸序列的方法中采用的多核苷酸构建体。此类多核苷酸构建体包括但不限于:rna:dna载体、rna:dna突变载体、rna:dna修复载体、混合双链体寡核苷酸、自身互补rna:dna寡核苷酸和引起重组的寡核苷酸。此类核苷酸构建体和使用方法是本领域已知的。参见美国专利5,565,350、5,731,181、5,756,325、5,760,012、5,795,972、和5,871,984,以上所有专利以引用方式并入本文。还可参见wo98/49350、wo99/07865、wo99/25821和beethametal.(1999)proc.natl.acad.sci.usa96:8774-8778(beetham等人,1999年,《美国国家科学院院刊》,第96卷,第8774-8778页),以上文献以引用方式并入本文。在一些实施方案中,可采用病毒诱导的基因沉默;参见例如,ratcliffetal.(2001)plantj.25:237-245(ratcliff等人,2001年,《植物杂志》,第25卷,第237-245页);dinesh-kumaretal.(2003)methodsmol.biol.236:287-294(dinesh-kumar等人,2003年,《分子生物学方法》,第236卷,第287-294页);luetal.(2003)methods30:296-303(lu等人,2003年,《方法》,第30卷,第296-303页);burch-smithetal.(2006)plantphysiol.142:21-27(burch-smith等人,2006年,《植物生理学》,第142卷,第21-27页))。因此应认识到,本文所公开的方法并不依赖于将完整多核苷酸掺入基因组中,只要将该多核苷酸引入细胞中而使植物或其细胞被改变即可。
在其它实施方案中,通过不需要将多核苷酸引入植物中的方法(诸如,通过将dsrna外源应用于植物表面)来调节多肽的水平和/或活性;参见例如wo2013/025670。
在一个实施方案中,基因组可在将该多核苷酸引入细胞中之后被改变。例如,可将多核苷酸或其任何部分掺入植物的基因组中。本文所公开的基因组的改变包括但不限于基因组中核苷酸的添加、缺失和置换。虽然本文所公开的方法并不依赖于任何具体数目的核苷酸的添加、缺失和置换,但应认识到此类添加、缺失或置换包含至少一个核苷酸。
vi.定义
术语“等位基因”指在特定基因座处出现的两个或更多个不同核苷酸序列中的一个。
在核酸扩增的情况下术语“扩增”是其中产生附加拷贝的所选核酸(或其转录形式)的任何过程。典型的扩增方法包括基于多种聚合酶的复制方法,包括聚合酶链反应(pcr)、连接酶介导的方法诸如连接酶链反应(lcr)以及基于rna聚合酶的扩增(例如通过转录)方法。
“bac”或细菌人工染色体是源自大肠杆菌天然存在的f因子的克隆载体,其本身是可作为环状质粒存在或可整合到细菌染色体中的dna元件。bac可接受较大的dna序列插入。
厘摩(“cm”)是重组频率的量度单位。1cm等于由于在一个世代中的杂交导致的在一个基因座处的标记将与在第二基因座处的标记分离的概率为1%。
“染色体”是包含许多基因的一段盘绕dna,这些基因在细胞分裂过程中作为一个单元起作用和移动并因此可被称为是连接的。“染色体”也可被称为“连锁群”。
“基因图谱”是对给定物种中一个或多个染色体(或连锁群)上的基因座间的基因连锁关系的描述,一般以图表或表格形式描述。对于各个基因图谱,基因座之间的距离通过在种群中它们的等位基因在一起出现的频繁程度(即,它们的重组频率)而测量。利用dna或蛋白质标记或可观察的表型,能够检测等位基因。基因图谱是作图的种群、使用的标记的类型以及不同种群间各个标记的多态性潜力的产物。一个基因图谱与另一个基因图谱在基因座之间的遗传距离可以不同。然而,使用共同标记能够将一个图谱与另一个图谱的信息关联。本领域的普通技术人员能够使用共同的标记位置来鉴定每个单独基因图谱上的目的标记和其它基因座的位置。基因座的顺序在图谱之间应当是不变的,然而由于例如标记在不同的群体中检测替代性的重复基因座、用于对标记排序的统计学方法的差异、新的突变或实验误差,经常存在标记顺序的小的变化。
“基因图谱位置”是在相同连锁群上,相对于围绕的遗传标记在基因图谱上的位置,其中能够在给定物种中发现指定标记。
“基因作图”是限定基因座的连锁关系的方法,该方法通过使用遗传标记、标记的种群分离以及重组频率的标准遗传原则进行。
“遗传标记”是种群中的多态核酸,并且其中可通过一种或多种分析方法检测并区分出它们的等位基因,例如rflp、aflp、同功酶、snp、ssr、hrm等。该术语也指与基因组序列互补的核酸序列,诸如用作探针的核酸。对应于种群成员之间的遗传多态性的标记能够通过本领域已建立的方法进行检测。这些方法包括例如基于pcr的序列特异性扩增方法、限制性片段长度多态性检测(rflp)、同功酶标记检测、通过等位基因特异性杂交(ash)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、自主序列复制检测、简单重复序列检测(ssr)、单核苷酸多态性检测(snp)或扩增片段长度多态性检测(aflp)。已经建立的方法也已知用于检测表达序列标签(est)和来源于est序列的ssr标记以及随机扩增的多态性dna(rapd)。
“基因组”指染色体或染色体组携带的总dna或整组基因。
术语“基因型”是个体(或个体组)的基因组成,其由个体从其亲本遗传的一个或多个已知基因座的等位基因限定。更一般地说,术语“基因型”可用于指个体在其基因组中的所有基因的基因构成。
“基因座”是染色体上的位置,例如核苷酸、基因、序列或标记所位于的地方。
“标记”是发现基因或物理图谱上的位置或发现标记与性状基因座(影响性状的基因座)之间的连锁的手段。标记所检测的位置可通过检测多态性等位基因及其基因作图而获知,或通过对已经进行物理标测的序列进行杂交、序列匹配或扩增而获知。标记可以是dna标记(检测dna多态性)、蛋白质(检测所编码多肽的变异)或简单遗传表型(诸如“蜡质”表型)。可通过基因组核苷酸序列或表达的核苷酸序列(例如,通过剪接的rna或cdna)开发dna标记。根据dna标记技术,所述标记将由侧接所述基因座的互补引物或与该基因座处的多态性等位基因杂交的互补探针组成。dna标记,或遗传标记,还能够被用于描述其自身染色体上的基因、dna序列或核苷酸(而不是用于检测基因或dna序列的组分),并且当该dna标记与人类遗传学中的特定性状相关联时经常被使用(例如,针对乳腺癌的标记)。术语标记基因座是指该标记所检测的基因座(基因、序列或核苷酸)。
检测种群成员之间的遗传多态性的标记在本领域中是已建立的。标记可由其所检测的多态性的类型以及用于检测所述多态性的标记技术所限定。标记类型包括但不限于,例如,限制性片段长度多态性检测(rflp)、同功酶标记检测、随机扩增的多态性dna(rapd)、扩增片段长度多态性检测(aflp)、简单重复序列检测(ssr)、植物基因组的扩增可变序列检测、自主序列复制检测或单核苷酸多态性检测(snp)。snp可通过以下方法检测:例如dna测序、基于pcr的序列特异性扩增方法、通过等位基因特异性杂交(ash)对多核苷酸多态性的检测、动态等位基因特异性杂交(dash)、竞争性等位基因特异性聚合酶链反应(kaspar)、分子信标、微阵列杂交、寡核苷酸连接酶测定、flap内切核酸酶、5’内切核酸酶、引物延伸、单链构象多态性(sscp)或温度梯度凝胶电泳(tgge)。dna测序(诸如焦磷酸测序技术)具有能够检测组成单倍型的一系列连接的snp等位基因的优点。单倍型倾向于比snp更具信息性(检测更高水平的多态性)。
“标记等位基因”或者“由标记检测的等位基因”或“在标记基因座处的等位基因”可指在群体中的标记基因座处发现的一个或多个多态性核苷酸序列。
“标记基因座”是由特定标记检测的物种的基因组中的特定染色体位置。标记基因座可用于追踪第二连接基因座的存在情况,例如影响表型性状表达的基因座。例如,标记基因座可用于监控在遗传上或物理上连接的基因座处的等位基因的分离,诸如qtl。
“标记探针”是可用于通过核酸杂交鉴定标记基因座处的等位基因的存在与否的核酸序列或分子,例如与标记基因座序列互补的核酸探针。包含标记基因座的30个或更多个连续核苷酸(“所有或部分”的标记基因座序列)的标记探针可用于核酸杂交。或者,在某些方面,标记探针指能够区别(即基因分型)存在于标记基因座处的特定等位基因的任何类型的探针。当核酸在溶液中特异性杂交或配对时,例如根据watson-crick碱基配对原则杂交或配对,核酸是“互补的”。
如上所述,当鉴定连接基因座时,术语“分子标记”可用于指如上所定义的遗传标记,或其用作参照点的编码产物(例如,蛋白质)。标记能够来源于基因组核苷酸序列或来源于表达的核苷酸序列(例如来源于剪接的rna、cdna等),或来源于编码的多肽。该术语也指与标记序列互补或侧接标记序列的核酸序列,诸如用作探针或能够扩增标记序列的引物对的核酸。“分子标记探针”是能够被用于鉴定标记基因座的存在的核酸序列或分子,例如与标记基因座序列互补的核酸探针。或者,在某些方面,分子探针指能够区别(即基因分型)存在于标记基因座处的特定等位基因的任何类型的探针。当核酸在溶液中特异性杂交时,例如根据watson-crick碱基配对原则杂交,核酸是“互补的”。当本文所述的一些标记位于插入缺失区域时,这些标记也被称为杂交标记。这是因为,根据定义,插入区域是关于无插入的植物的多态性。因此,标记仅需要指明插入缺失区域是否存在。任何合适的标记检测技术都可用于鉴定此类杂交标记,例如snp技术被用于本文提供的示例。
基因组的“物理图谱”是显示染色体dna上可鉴定的界标(包括基因、标记等)的线性顺序的图谱。然而与基因图谱相比,界标间的距离是绝对的(例如以碱基对测量的或分离的和重叠的邻接基因片段)并且不基于基因重组(所述基因重组可在不同的种群中有所变化)。
“植物”可为整个植物、其任何部分,或者来源于植物的细胞或组织培养物。因此,术语“植物”可指如下中的任何一种:整个植物、植物组分或器官(例如叶、茎、根等)、植物组织、种子、植物细胞和/或它们的子代。植物细胞是从植物中获得的植物细胞或来源于从植物中所获得的细胞的培养物。
“多态性”是群体内的两个或更多个个体之间dna的变化。多态性在种群中优选地具有至少1%的频率。可用的多态性可包括单核苷酸多态性(snp)、简单重复序列(ssr)、或插入/缺失多态性,本文也称为“插入缺失”。
“参考序列”或“共有序列”是用作序列比对基准的定义序列。
表1.seqidno汇总
本文所用的冠词“一个”和“一种”指一个(种)或多于一个(种)(即,指至少一个(种))所述冠词的语法对象。举例而言,“一个要素”意指一个或多个要素。
在本说明书中提及的所有出版物和专利申请指示本公开所属领域的技术人员的水平,并且所有此类出版物和专利申请以引用方式并入本文,如同每个单独的出版物或专利申请被具体地和单独地指出以引用方式并入。
虽然为了理解清晰目的已经通过举例说明和实施例方式较详细地描述了本发明,但显然可以在所附权利要求书范围内实施一些改变和修改。
实施例
提供以下实施例来进行说明,但不限制所附权利要求。应当理解,本文所述的实施例和实施方案仅出于举例说明的目的,本领域技术人员将认识到在不脱离本发明的实质或所附权利要求书的范围的情况下可改变多种试剂或参数。
实施例1:ms1的基因作图
本实施例证明通过使用野生型和雄性不育小麦的重组作图群体,小麦msl的雄性不育表型的致病基因座可映射到b基因组的染色体4的短臂上的1cm区域。
将携带fs2突变基因(也称为msld)的雄性不育(msms)异质小麦(品种chris)与品种gladius的植物杂交,以产生f2作图群体。根据与小麦染色体4al(hernandezetal.2011.plantjournal69(3):377-386(hernandez等人,2011年,《植物杂志》,第69卷,第3期,第377-386页))、大麦染色体4hs(mayeretal.2011.plantcell23(4):1249-1263(mayer等人,2011年,《植物细胞》,第23卷,第4期,第1249-1263页))、短柄草染色体1和水稻染色体3或bin映射小麦est(sorrellsetal.,2003genomeresearch13:1818-1827(sorrells等人,2003年,《基因组研究》,第13卷,第1818-1827页);larota&sorrells,2004functintegrgenomics4:34-46)(larota和sorrells,2004年,《功能基因组学和整合基因组学》,第4卷,第34-46页))的同线性,来鉴定染色体4bs上的ms1区域中的序列。通过blast将来自参考合成序列(例如,大麦snp标记11_21056,seqidno:10代表其参考序列)或bin映射est(例如,bf292015,seqidno:14代表其参考序列)的对应小麦序列重叠群鉴定为染色体4bs衍生的iwgsc(国际小麦基因组测序协会)研究组装序列(mayer,2014science345(6194):1251788(mayer,2014年,《科学》,第345卷,第6194期,第1251788页))。iwgsc重叠群是针对高分辨率熔解(hr)标记发展或基于插入位点的多态性(isbp-hrm)标记发展的。使用isbpfinder工具(pauxetal.,2010plantbiotechnologyjournal8:196-210(paux等人,2010年,《植物生物技术杂志》,第8卷,第196-210页))设计isbp-hrm引物。
使用来自以下各项的dna进行聚合酶链反应(pcr)扩增:作图群体的亲本、4b缺对染色体品系以及辐射诱导的缺失probus和cornerstone。因为遗传和物理作图研究表明cornerstone和probus在末端缺失大小和端粒修复程度方面可能不同,所以对其进行比较分析来鉴定ms1侧翼标记(barlow&driscoll(1981)genetics.98(4):791-799(barlow和driscoll,1981年,《遗传学》,第98卷,第4期,第791-799页);zhong-an&darvey(1999)actaagriculturaeboreali-occidentalissinica.cnki:issn:1004-1389.0.1999-04-006(zhong-an和darvey,1999年,《西北农业学报》,cnki:issn:1004-1389.0.1999-04-006))。侧接ms1的引物通过缺乏具有以下特征的pcr产物以实验方式确定:该pcr产物来自染色体4b的dna缺对染色体,并且对于辐射诱导的缺失突变体cornerstone是纯合的,但呈现为纯合辐射诱导的缺失突变体probus。将符合上述标准的hrm标记用于作图。
通过在开花前用密封的白色纸袋牢固地覆盖每株植物的至少三个穗来进行遗传性雄性不育的表型分析,然后通过对每个穗的小花数量和每个穗的种子数量计数并且将得分表示为每朵小花形成的种子数来确定定量能育性得分。
首先用被鉴定为侧接染色体4bs上的ms1区域且在chris与gladius之间呈现多态性的标记来筛选509个f2个体。使用前述过程在表型方面对f2个体进行遗传性雄性不育评估。鉴定了21个重组体,并且发现ms1基因座位于hrm标记21056(seqidno:11是参考序列)与bf2920l5(seqidno:15是参考序列)之间。将hrm标记21056和bf292015分别指定为4bs衍生的iwgsc序列重叠群lcl|4bs_4947956和lcl|4bs_4925422(mayer,2014science345(6194):1251788(mayer,2014年,《科学》,第345卷,第6194期,第1251788页))。确定该区域在90k的共有图谱上覆盖14cm的遗传距离。
然后在标记21056和bf292015之间的区域中形成标记,并测试该标记与遗传性雄性不育表型的关联。使用9k的共有小麦单核苷酸多态性(snp)图谱(cavanaghetal.2013pnas110:8057-8062(cavanagh等人,2013年,《美国国家科学院院刊》,第110卷,第8057-8062页))来鉴定含有snp的序列以及在遗传上位于小麦中染色体4bs的短臂上的ms1区域中的相应iwgsc重叠群(mayer2014.science345(6194):1251788(mayer,2014年,《科学》,第345卷,第6194期,第1251788页))。含有snp的序列或染色体4bs衍生的iwgsc重叠群是针对hrm标记发展或基于插入位点的多态性(isbp-hrm)标记物发展的。总共筛选了3000个f2个体,鉴定了54个重组体,同时将含有ms1的区域缩窄到由标记wsnp_ex_c18318_27140346(seqidno:18是参考序列)和wsnp_ku_c7153_12360198(seqidno:21是参考序列)界定的区域。标记wsnp_ex_c18318_27140346和wsnp_ku_c7153_12360198分别对应于4bs衍生的iwgsc序列重叠群lcl|4bs_4920499和lcl|4bs_4954867(mayer,2014science345(6194):1251788(mayer,2014年,《科学》,第345卷,第6194期,第1251788页))。根据9k的共有小麦snp图谱,该区域跨越0.5cm的遗传区间。
实施例2:鉴定用于ms1测序的4bsbac
使用与短柄草和水稻的同线性,在由标记wsnp_ex_c18318_27140346(seqidno:18)和wsnp_ku_c7153_12360198(seqidno:21)所界定的0.5cm区域内设计了18个探针。根据靶序列的blast分析,将探针设计为非重复的。然后对探针进行pcr扩增并通过琼脂糖凝胶电泳进行分离,使用qiaquickgelextraction试剂盒(美国马里兰州德国镇的快而精公司(qiagen,germantown,md.,usa))从凝胶中洗脱所需大小的片段。将pcr片段合并至等摩尔浓度,然后使用制造商的方案,通过neblot试剂盒(新英格兰生物实验室(newenglandbiolabs))进行32p-datp放射标记。将标记的探针在sephadexg50柱(通用电气医疗集团(gehealthcare))中纯化,并在100℃下变性10分钟。将用于杂交到hybondn+尼龙膜(美国新泽西州皮斯卡特维的通用电气医疗集团(gehealthcare))上的28个高密度bac克隆菌落过滤器用于杂交。这表示来自硬质小麦品种langdon的5.1-基因组等同物的覆盖情况(cencietal.2003.theorapplgenet107(5):931-9)(cenci等人,2003年,《理论与应用遗传学》,第107卷,第5期,第931-939页))。就预杂交而言,在65℃下,在旋转的玻璃管中完成以下过程:将菌落过滤器在杂交溶液(2×sspe,0.5%sds,5×denhardt试剂(sambrook&russel(2001)molecularcloning:alaboratorymanual,coldspringharborlaboratorypress,newyork,ny,usa(sambrook和russel,2001年,《分子克隆实验指南》,美国纽约的冷泉港实验室出版社))、40μg/ml鲑鱼精子dna)中过夜温育。将标记的探针与5ml杂交溶液混合,并将菌落过滤器在65℃下过夜温育。为了除去未结合的探针,将过滤器在含有2×sspe和0.5%sds的洗涤溶液中洗涤两次,并用1×ssc冲洗。根据信号强度将洗涤后的过滤器暴露于x射线胶片一至三天,以鉴定阳性克隆。
从板中分离出显示阳性信号的bac。使用限制性作图、利用与上文所用标记对应的引物进行的pcr实验以及从每个bac的端部获得的序列,来确定覆盖目的区域的bac的顺序。从langdon文库中选择跨越ms1区域的三个bac(占251kb)用于测序。此外,对专有bac进行测序,以覆盖关键区域。使用标准鸟枪测序技术对这些bac进行测序,并且使用phred/phrap/consed软件包(ewingetal.(1998)genomeresearch,8:175-185(ewing等人,1998年,《基因组研究》,第8卷,第175-185页))组装序列。组装之后,根据作图数据,对被认为在区域中位于最接近基因座的序列进行注释,意味着推断可能的基因编码区和表示重复元件的区域。使用fgenesh软件包(美国纽约芒特基斯科的softberry公司(softberry,mountkisco,newyork,usa))寻找编码(基因)区的基因。
实施例3:候选ms1基因的鉴定
通过对来源于小麦根、叶和花粉囊组织的cdna进行作图,在251kb序列内检测到10个潜在编码区。表2提供了这10个可能的编码序列及其推定肽功能的物理位置。
表2.
在这10个开放阅读框中,鉴定了与非特异转脂蛋白(nsltp)(edstametal.,2014physiologiaplantarumdoi:10.1111/ppl.12156(edstam等人,2014年,《植物生理学》,doi:10.1111/ppl.12156))具有相似性的三个编码的多肽。在检查来自雄性不育纯合mslcornerstone植物的花粉囊转录物时,未观察到对应于seqidno:4的cdna。缺乏来自seqidno:4的转录物表明msl不育表型与该cdna之间具有紧密的相关性。预测该特定序列编码糖基磷脂酰肌醇(gpi)锚定的nsltp(ltpg)多肽(seqidno:5是编码的蛋白质的氨基酸序列),并且该特定序列已被命名为taltpg1,也被称为ms1。
ms1多肽(seqidno:5)的分析结果表明信号肽位于位置1-23处;ltp结构域位于位置24-108处;并且gpi锚定结构域位于位置195-220处。使用初级多肽序列的结构模拟表明,通过二硫键(cys-cys)在ltp结构域内形成的疏水口袋可能结合脂肪酸,而预测gpi锚定结构域会将taltpg1固定到细胞表面。
在合适晶体结构模板的proteinhomology/analogyrecognitionenginev2.0(phyre2;kelleyetal.(2015)natureprotocols10:845-858(kelley等人,2015年,《自然研究步骤》,第10卷,第845-858页))搜索中,使用c-末端通过穿过ltp结构域(即,位置24至位置120)的12个氨基酸直接连接到信号肽的编码的初级多肽序列。该搜索鉴定了在96%置信度下具有29%同一性的dirl蛋白(pdb:c2rkna)。对使用的ms1多肽序列的48个残基部分进行建模,其中对模板c2rkna具有96.2%置信度。
通过fpocket2程序(schmidtkeetal.,(2011)bioinformatics27(23):3276-3285(schmidtke等人,2011年,《生物信息学》,第27卷,第23期,第3276-3285页))和3dligandsite(3dligandsite:使用类似的结构预测配体结合位点(wassetal.(2010)nucleicacidsres.38:w469-73(wass等人,2010年,《核酸研究》,第38卷,第w469-w473页)))的组合来检测通过二硫键在ltp结构域内形成的疏水口袋。使用具有表面疏水性的标准pdb查看器使ms1、mslf和mslh的结构模型可视化并对其进行注释,并使用colony方法进行计算。使用与测定疏水口袋相同的技术以及二硫键在三级构象中的重要性的相关知识对msld、msle、mslf和mslh突变体的ltp结构域的结构进行分析。(参见例如josé-estanyoletal.(2004)plantphysiologyandbiochemistry42:355-365(josé-estanyol等人,2004年,《植物生理学和生物化学》,第42卷,第355-365页))。
根据big-pi植物预测器推断gpi锚定结构域和细胞表面聚集的预测。(eisenhaberetal.(2003)plantphysiology133(4):1691-701(eisenhaber等人,2003年,《植物生理学》,第133卷,第4期,第1691-1701页))
实施例4:小麦突变体msl等位基因的分离和序列
使用来自从雄性不育纯合的甲磺酸乙酯(ems)诱导的突变体msld、msle和mslf分离的基因组dna的高保真校对酶(klindworthetal.2002.cropsci.42:1447-1450(klindworth等人,2002年,《作物科学》,第42卷,第1447-1450页))以及野生型(ms1)雄性能育基因型(栽培品种chris),对来自染色体4bs的taltpg1的全长编码序列进行pcr扩增。使用用于富含gc的产物的标准sanger测序技术对两条pcr扩增子的链进行测序。对获得的msl与ms1sanger测序色谱图进行比较,结果表明每个msl突变体等位基因(包括来源于tilling的mslh)和野生型序列之间存在snp(图2、图3)。序列分析预测,每个这些突变体的蛋白质功能受到破坏。
当与野生型ms1基因组dna序列(seqidno:7)比较时,msld在位置1856(g1856a)处表现snp。预测该snp会消除第一外显子/内含子剪接连接,从而导致第一内含子内的提前终止密码子的通读,因此会消除所编码的多肽内的保守c末端gpi锚定结构域。
当与野生型ms1基因组dna序列(seqidno:7)比较时,msle在位置2962处表现snp并且在位置2963处表现1bp缺失(g2962a、c2963del)。预测msle中的1bp缺失会引起所编码的多肽内的移码以及保守c末端gpi锚定结构域的消除。
当与野生型ms1基因组dna序列(seqidno:7)比较时,mslf在位置1682(g1682a)处表现snp。预测该snp会在所编码的野生型ms1多肽(seqidno:5)内将保守的半胱氨酸转变为酪氨酸(c52y)。预测该氨基酸变化会破坏由二硫键介导的成熟蛋白的三级构象。
当与野生型ms1基因组dna序列(seqidno:7)比较时,mslh在位置1705(g1705a)处表现snp。预测该snp会在所编码的野生型ms1多肽(seqidno:5)内将天冬氨酸转变为天冬酰胺。预测该氨基酸变化会破坏所编码的ms1多肽的功能或活性。
实施例5:ms1和msl花粉的细胞学和代谢物分析
对msl花粉囊的细胞学检查显示出破碎的绒毡层细胞表面局部球状体和具有缺陷外壁结构和纹饰的塌缩花粉。能育与不育花粉囊的代谢分析显示出c16-c22脂肪酸的累积,与ms1在孢粉素生物合成和/或向发育中小孢子的运输中的作用一致。
细胞学检查
对于透射电子显微镜(tem)或扫描电子显微镜(sem),将来自减数分裂后期的不育(msld)和能育(ms1)成熟花粉囊固定于二胞花粉。将tem样品用3%戊二醛在ph7.4的磷酸盐缓冲盐水(pbs)中的溶液在4℃下渗透16小时,而sem样品则用4%多聚甲醛、1.25%戊二醛和4%蔗糖在ph7.4的磷酸盐缓冲盐水(pbs)中的溶液在4℃下渗透16小时。将tem样品用lrwhiteresin缓慢渗透并包埋在明胶胶囊中。用pbsph7.4冲洗sem样品两次,每次5分钟,然后使用一系列分级乙醇溶液(30%、50%、70%、85%、90%和95%)分别脱水60分钟。然后将sem样品在100%乙醇中渗透3次,每次60分钟。在超薄切片机(emuc6,德国徕卡公司(leica,germany))上制备70nm的超薄切片,将其安放在铜网格上,并且根据bozzola和russell1999用4%乙酸双氧铀水溶液染色,再用柠檬酸铅染色(specimenstainingandcontrastmethodsfortransmissionelectronmicroscopy.electronmicroscopy:principlesandtechniquesforbiologists.thejonesandbartlettseriesinbiology,pp.120-147.jonesandbartlettpublishers,boston,ma(用于透射电子显微镜法的样本染色和造影方法。电子显微镜:适用于生物学的原理和技术。jonesandbartlett生物学系列,第120-147页。jonesandbartlett出版公司,美国马萨诸塞州波士顿))。观察超薄切片,并在80kv的加速电压下用tem(philipscm100,阿德莱德大学显微镜研究中心(theuniversityofadelaidemicroscopy))采集图像。切割sem样品,然后进行临界点干燥并用铂溅射涂布(balteccpd030临界点干燥仪(balteccpd030criticalpointdryer))。在10kv的加速电压(philipsxl20sem,edaxeds,阿德莱德大学显微镜研究中心(theuniversityofadelaidemicroscopy))下进行sem观察和图像采集。
糖磷脂酰肌醇(gpi)锚定的脂质转移蛋白通常是角质层蜡累积或输出到茎和长角果表面上所必需。(borneretal.(2003)plantphysiology132:568-577(borner等人,2003年,《植物生理学》,第132卷第568-577页);kimetal.(2012)plantandcellphysiology53:1391-1403(kim等人,2012年,《植物与细胞生理学》,第53卷,第1391-1403页)外角质层蜡具有与花粉外膜的主要成分孢粉素相同的脂质前体,花粉外壁在花粉囊的孢子体组织中产生并在称为球状体的结构中运输至发育中的小孢子。通过tem和sem分析不育msld花粉囊,与能育ms1花粉囊相比,结果显示出破碎的绒毡层细胞表面局部球状体和具有缺陷外壁结构和纹饰的塌缩花粉。
代谢物分析
在3个发育阶段(减数分裂早期至单核期后期)从2个不育(msld/msld)和1个能育(ms1/ms1)植株中分离花粉囊,包括3个生物学重复样,并在干冰上快速冷冻。使用气相色谱-质谱联用法(gc-ms),分析氯仿可萃取蜡的组成和数量。(jungetal.(2006)plantcell18:3015-3032(jung等人,2006年,《植物细胞》,第18卷,第3015-3032页)通过用酯交换试剂meth-prepii进行提取物处理以衍生脂肪酸,并与样品加标脂肪酸标准品进行比较。
在三个发育阶段分析不育msld花粉囊与能育ms1花粉囊,结果表明,棕榈酸(c16∶0)、棕榈油酸(c16∶1)、油酸(c18∶1n9c)、反油酸(c18∶1n9t)、亚油酸(c18∶2n6c)、γ-亚油酸(c18:3n6)、α-亚油酸(c18∶3n6)、花生酸(c20∶0)、二十烯酸(c20∶1)、二十碳二烯酸(c20∶2)和二十二烷酸(c22∶0)增加超过2倍。突变花粉囊中的长链(c16-c22)脂肪酸的增加是孢粉素生物合成中的破坏和/或其向发育中小孢子的运输的典型表现。
实施例6:ms1区域的标记及其在鉴定和选择含有ms1突变的小麦植株中的用途
据发现,ms1基因紧密连接至位于ms1区域中的标记et0487、et0488、et0489、et0490、et0491、et0495、007-0033.1和007-0046.1。参见seqidno:24-29、32和33。由于雄性不育性状由单个核隐性基因控制,因此雄性不育突变体与野生型授粉媒介之间的所有杂交将导致100%雄性能育f1子代(ms1msl),而f2和bc1子代将分离这种性状。希望确定子代的基因型,这样可以评估植株本身是否存在突变,或者是否存在连接至ms1基因中的突变并与其相关联的一个或多个等位基因(即,与突变连锁不平衡)。例如,可以检测在标记物et0487、et0488、et0489、et0490、et0491、et0495、007-0033.1或007-0046.1处的一个或多个等位基因以确定植株是否具有纯合或杂合状态的msl突变。对于msld、msle或mslf,突变在chris品种中出现;这样,位于ms1基因附近的chris等位基因与因果突变处于连锁不平衡,因此可以评估存在情况以确定是否存在msld、msle或mslf。通过标记辅助选择,植物育种人员将能够通过受控的杂交跟进雄性不育性状的存在情况,以便在需要时获得含有纯合或杂合状态的msl突变的新植株,从而保持msl突变。植物育种人员还可以利用ms1区域中的标记来产生将用作雌性的突变雄性不育种子亲本,即需要花粉供体植株授粉的植株,以产生具有商业利益的种子或产生含有杂合状态的msl突变的f1杂交体。
实施例7:小麦转化
本领域技术人员可获知小麦转化方案。参见例如he,etal.,(2010)j.exp.botany61(6):1567-1581(he等人,2010年,《实验植物学杂志》,第61卷,第6期,第1567-1581页);wu,etal.,(2008)transgenicres.17:425-436(wu等人,2008年,《转基因研究》,第17卷,第425-436页);nehra,etal.,(1994)plantj.5(2):285-297(nehra等人,1994年,《植物杂志》,第5卷,第2期,第285-297页);rasco-gaunt,etal.,(2001)j.exp.botany52(357):865-874(rasco-gaunt等人,2001年,《实验植物学杂志》,第52卷,第357期,第865-874页);razzaq,etal.,(2011)africanj.biotech.10(5):740-750(razzaq等人,2011年,《非洲生物技术杂志》,第10卷,第5期,第740-750页);tamás-nyitrai,etal.,(2012)plantcellcultureprotocols.methodsinmolecularbiology877:357-384(tamás-nyitrai等人,2012年,《植物细胞培养实验指南-分子生物学方法》,第877卷,第357-384页);和美国专利公布2014/0173781。
实施例8:通过表达ms1基因或直系同源物的转化拷贝为小麦msl纯合隐性植株恢复雄性能育性。
在前一实施例中,在对应于来自msld、msle和mslf植株的ms1候选基因的dna区域内检测到核苷酸序列差异。在本实施例中,描述了用于为纯合隐性msld植株恢复雄性能育性的各种策略。当用包含ms1基因的功能性拷贝的dna载体进行转化时,含有msl突变的雄性不育小麦植株恢复为雄性能育性。这表明候选ms1基因在为导致雄性不育表型的msl突变提供补充方面是有效的。
虽然小麦是含有三个具有相似基因含量的相关基因组(abd)的异源六倍体,但它在减数分裂过程中表现为二倍体。通常相关的小麦基因组包含具有相似基因结构和功能的同源基因,需要三重突变体才能得到功能丧失表型。然而,在msld突变体中观察到的小麦雄性不育表型以3:1的能育与不育植株比率分离。这表明在该突变体中,在纯合条件下的单个隐性基因座诱导雄性不育表型,并且该基因座根据孟德尔遗传定律分离。与ms1的其它同源物缺乏功能冗余性,表明该基因的a和d基因组拷贝的功能已经存在差异。
标记开发和评估显示,杂合的msl基因座以1∶2∶1的纯合野生型与杂合突变体与纯合突变体的比例分离。表型数据和基因型数据的相关性支持msl突变遵循孟德尔遗传定律。
msl突变的孟德尔性质将促使雄性不育性状渗入不同的遗传背景中。
恢复msl植株的雄性能育性的一种策略是表达可以克服由ms1突变或缺失导致的功能或活性丧失的一个或多个基因。来自小麦或来自具有与ms1相同或相似功能的另一植物物种的基因用于恢复转化的小麦植株中的基因活性。例如,如图1所示,来自大麦的基因编码与小麦ms1基因产物具有高氨基酸序列相似性并具有约79%序列同一性的蛋白质。将存在于seqidno:1中的大麦基因引入小麦msl突变植物中以恢复雄性能育性。该大麦基因可以使用其天然启动子(参见seqidno:1、核苷酸1-902、seqidno:41)或非天然启动子(例如组织优选的启动子、组成型启动子或条件启动子)来表达,以恢复雄性能育性。其它单子叶植物或双子叶植物也可以作为补充基因和启动子的来源,为msl突变雄性不育小麦植株恢复雄性能育性。基因和启动子可以来自一种来源或来自多种源物种的组合,例如来自小麦、大麦、水稻和短柄草中的一种或多种。
在另一策略中,野生型小麦ms1基因或其变体(参见例如seqidno:1、2、4、7、9、42、43、44或45)用于恢复纯合隐性msl植株的雄性能育性。变体ms1基因包含一个或多个dna限制性位点的改变以允许与用于植物转化的dna载体相容。参见例如seqidno:9,其包含在第2、3、1209和1301位处引入的核苷酸变化,以促进载体构建。通过已知的植物转化方法将ms1基因引入msl植株中,产生含有稳定整合形式的ms1基因的植株以用于能育性补充。作为使用天然ms1启动子(seqidno:6)的替代,使用启动子变体(例如参见seqidno:8,其包含引入以促进载体构建的核苷酸变化)或其它植物(例如seqidno:41)或非植物组成型启动子、条件启动子或组织优选的启动子表达野生型或变体形式的ms1基因或cdna,以恢复纯合隐性msl小麦植株的雄性能育性。基因和启动子可以来自一种源物种或来自多种源物种的组合。在一些实施例中,启动子是来自小麦、水稻、大麦或短柄草的ms1启动子。翻译终止密码子3′的基因组ms1序列包含功能性终止子区域;参见seqidno:7第3384-4335位的utr(seqidno:46)。还参见seqidno:1第2838-3838位的utr(seqidno:47)。
构建体和转化
为了恢复msld/msld纯合突变体的能育性,将在天然小麦ms1启动子和终止子控制下的小麦ms1基因连接到在大麦ltp2启动子控制下并且还携带pinii终止子序列(tams1-dsred)的dsred2基因(参见例如美国专利5,525,716)。通过本文别处所引用的农杆菌介导的转化方法将该构建体直接转化到从ms1/msld杂合子植株收获的小麦胚中。获得了包含tams1-dsred的若干独立的t-dna插入事件,用于在msld植株中进行构建体评估。
t0植株生成和分析
鉴定含有单拷贝tams1-dsred盒的t0小麦植株,并将其基因分型为对于msld突变为纯合或杂合的。将来自这些单个植株的自交种子计数为雄性能育性的定性量度。如表4所示,在缺乏tams1-dsred盒的msld/msld纯合植株中没有观察到结籽。相比之下,当msld/msld纯合植株含有tams1-dsred盒的转化拷贝时,观察到结籽。这些结果表明,tams1的转化拷贝是功能性的,能够恢复msld/msld纯合雄性不育植株的能育性。
表3:含有tams1互补t-dna插入的t0小麦植株中的结籽。
t1植株分析;分子和表型
tams1t-dna插入的互补的遗传通过分析来自具有独立t-dna插入(事件1和事件7)的两个单独t0植株的t1植物来证实。一组t1子代衍生自对于具有tams1-dsred盒(事件1)的msld突变(msld/msld)为纯合的t0植株。第二组t1子代衍生自具有tams1-dsred盒(事件7)的对msld突变(ms1/msld)为杂合的t0植株。来自这两组的植株被基因分型用于msld和t-dna插入。在两组t1子代中,具有基因型msld/msl和t-dna插入(事件1或事件7)的所有植株都是通过产生种子来确定能育的(表5)。具有基因型msld/msld而没有t-dna插入的所有子代是雄性不育的并且不产生种子。这清楚地表明,tams1互补t-dna插入能够恢复msld/msld突变植株的能育性,并且这种能力会传递给子代。
表4:具有或不具有tams1互补t-dna插入的t1植株的能育性。
总之,用含有天然小麦ms1基因的t-dna插入分析t0和t1植株显示该基因能够恢复msld/msld纯合隐性突变的育性。该实施例进一步证明了msld突变位于小麦ms1基因中。
实施例9:使用半合保持系进行小麦msl雄性不育植株的近交系保持和增加。
该实施例证实,使用连接至种子标记基因和花粉抑制基因的ms1的功能性拷贝,可以将msl的纯合隐性小麦植株保持为雄性不育植株。
产生雄性不育植株的纯系以便用不同的近交系小麦品种进行异花授粉来产生杂种种子,这将是有利的。通常,整合隐性雄性不育的策略导致不能自花授粉的植株。为了完成自花授粉和产生用于异花授粉的纯系雄性不育植株,构建了表达盒(ms1-aa-red),其包含的ms1功能性拷贝连接至表达功能性α淀粉酶基因的玉米pg47启动子(参见例如seqidno:30),并且进一步连接至在大麦ltp2启动子(参见例如美国专利5,525,716)的控制下并且还携带pinii终止子序列的颜色标记基因(例如,编码红色荧光蛋白)。使用生物弹道或农杆菌介导的转化,将该构建体直接转化到来自自花授粉的ms1/msl小麦植株的胚中。将转化的胚再生成植株。可以使用如上所述的msl基因座侧翼的标记鉴定的含有单拷贝ms1-aa-red盒的小麦植物(msl/msl)是雄性能育的并且允许自花授粉。由于pg47:aa抑制花粉功能并因此阻止ms1-aa-red表达盒通过花粉传输的作用,来自这一代子代的种子将以1:1红色荧光和非荧光的频率分离。从红色荧光种子生长的子代对于ms1-aa-red是半合子的,对于msl是纯合的,并且是雄性能育的;这些用于繁殖(即,“保持”)雄性不育近交系。非荧光种子的子代不含有ms1互补基因的转化拷贝,对于msl是纯合的并且是雄性不育的。这些雄性不育近交系作为雌性近交系用于在与ms1基因的野生型雄性近交小麦植株相邻种植时用于产生杂种种子。
实施例10:基因的靶向调控或诱变。
对于雄性能育性应用,突变内源性ms1基因或改变其表达可能是有利的,例如通过本实施例中所述的方法。
已经证明将rna引入活细胞中抑制该细胞中靶基因的表达。(baeetal.(2010)plantbreeding129(6):647-651(bae等人,2010年,《植物育种》,第129卷,第6期,第647-651页);beethametal.(1999)proceedingsofthenationalacademyofsciences96(15):8774-8778,doi:10.1073/pnas.96.15.8774(beetham等人,1999年,《美国国家科学院院刊》,第96卷,第15期,第8774-8778页,doi:10.1073/pnas.96.15.8774);cigan等人,2010年,美国专利7696405;ciganetal.(2005)theplantjournal43(6):929-940(cigan等人,2005年,《植物杂志》,第43卷,第6期,第929-940页);dalakourasetal.(2009)theplantjournal60(5):840-851,doi:10.1111/j.1365-313x.2009.04003.x(dalakouras等人,2009年,《植物杂志》,第60卷,第5期,第840-851页,doi:10.1111/j.1365-313x.2009.04003.x);fireetal.(1998)nature391(6669):806-811(fire等人,1998年,《自然》,第391卷,第6669期,第806-811页);fire等人,1999年,wo1999032619a1;metteetal.(2000)emboj19(19):5194-5201(mette等人,2000年,《欧洲分子生物学组织杂志》,第19卷,第19期,第5194-5201页);okuzakiandtoriyama(2004)plantcellreports22(7):509-512.doi:10.1007/s00299-003-0698-2(okuzaki和toriyama,2004年,《植物细胞报告》,第22卷,第7期,第509-512页,doi:10.1007/s00299-003-0698-2);tang,2013年,wo2013025670a1;timmonsandfire(1998)nature395:854(timmons和fire,1998年,《自然》,第395卷,第854页);yuetal.(2002)pnas99(9):6047-6052(yu等人,2002年,《美国国家科学院院刊》,第99卷,第9期,第6047-6052页)。技术人员应当理解,rna可以在细胞内表达或外源应用(tangwo2013025670a1)。
干扰rna可以靶向转录、翻译或mrna稳定性,从而改变靶基因的表达。在该实施例中,ms1基因的表达通过在植物中单独地或组合地表达靶向启动子区域的rna(如先前在包括小麦(美国专利申请14/203,698)在内的单子叶植物中证实的那样(cigan等人,2010年))或靶向所表达的mrna的rna来减少或沉默。对于启动子反向重复方法,ms1启动子区域的一部分可以在相反方向上串联复制、并置和定向,并且置于植物转化载体中的组成型组织优选的启动子或条件启动子的控制下,以在植物细胞中表达启动子反向重复rna以使可操作地连接至靶启动子的基因沉默。
技术人员还将理解,可通过核酸序列的突变引入变化,从而导致编码的mrna的表达或编码的ms1多肽的氨基酸序列发生变化,导致mrna和/或蛋白的生物活性的改变。参见例如在2014年8月20日提交的美国专利申请14/463,687中描述的方法,该专利申请全文以引用方式并入本文。因此,可以通过将一个或多个核苷酸的置换、添加和/或缺失引入本文公开的相应核酸序列或周围序列中来产生变体核酸分子。此类变体核酸序列也被本发明涵盖。
变体核酸序列可以通过沿着ms1基因区域的全部或部分随机引入序列改变来制备,包括但不限于化学或辐照诱变和寡核苷酸介导的诱变(omm)(beetham等人,1999年;okuzaki和toriyama,2004年)。另选地或作为补充,可以使用双链断裂技术,例如但不限于znf、定制设计的归巢内切核酸酶、talen、crispr/cas(也称为向导rna/cas内切核酸酶系统(2014年8月20日提交的美国专利申请14/463,687)),或其它基于蛋白质、或多核苷酸、或偶联的多核苷酸-蛋白质的诱变技术,在具体选定位点引入序列变化。可以筛选所得变体的改变后的ms1活性。应当理解,这些技术通常不是相互排它性的。实际上,各种方法可以单独或组合使用、并行或串联使用,以产生或获得多样的序列变体。
实施例11:通过taltpg1的转录后基因沉默诱导雄性不育
多核苷酸片段(seqidno:38)从taltpgl的3′utr中分离,并且在rnai盒(zmubi::taltpg1-ir:sbactin项)内亚克隆至组成型表达载体php1中。
将用于转化供体材料的植株以每6l(8英寸直径)装有土壤混合物的盆5-6株植株进行播种。土壤混合物由75%(v/v)椰子泥、25%(v/v)苗圃切割砂(锋利)、750mg/lcaso4.2h2o(石膏)、750mg/lca(h2po4)2.h20(过磷酸盐)、1.9g/lfeso4、125mg/lfeedta、1.9g/lca(no3)2、750mg/lscottsmicromax微量营养素和2.5g/losmocoteplus缓释肥料(16∶3∶9)(scottsaustraliapty.ltd.)组成。使用2份农用石灰与1份熟石灰将ph调节至6.0至6.5。盆栽植物在23℃(白天)和16℃(夜)的受控环境生长室中生长,使用400w高压钠灯与金属卤化物灯组合延长的光周期在冬季月份达12小时。
根据公布的方法进行具有组成型表达的hpt选择性标记基因序列的rnai盒的共轰击。ismaguletal.incropbreedingvol.1145methodsinmolecularbiology(edsd.fleury&r.whitford)ch14,239-252(springer,2014)(ismagul等人,《作物育种》,第1145卷,分子生物学方法,d.fleury和r.whitford编辑,第14章,第239-252页,施普林格出版社,2014年)。通过在含有100mg/l潮霉素b的ms培养基上选择来回收t0再生植株。
对从开裂前的各个植株的不同小穗收集的成熟花粉囊进行花粉粒活力试验。将花粉囊放置在培养皿中的润湿滤纸上以运送到实验室,在那里将它们在干净的载玻片上在一滴2%的碘化钾溶液中粉碎。通过用澄清的指甲油包围盖玻片边缘来保护位于载玻片与盖玻片之间的花粉颗粒免于干燥。使用连接至axiocammrm3s/n5669相机的axioimagerm2显微镜检查和记录样品。
通过在开花前在每个植株头上放置玻璃纸袋来评估单个植株的自体能育性。收集每株植株3至10植株头用于种子计数。每植株头的两个基部和两个顶尖小穗由于其不完全的发育从分析中移除。以每植株头为基础对总种子集和小花数进行计数。每个穗或植株的能育性百分比计算如下:
使用苯酚氯仿或冷冻干燥提取方案进行来自所有转基因再生植株的dna提取。(kovalchuk,n.incropbreedingvol.1145methodsinmolecularbiology(edsd.fleury&r.whitford)239-252(springer,2014)(kovalchuk,n.,《作物育种》,第1145卷,分子生物学方法,d.fleury和r.whitford编辑,第239-252页,施普林格出版社,2014年))。将来自2周龄植株的15cm叶片在液氮中冷冻,并使用1个大滚珠(9mm)和3个小滚珠(3mm)以及涡旋机将组织研磨成细粉末。向每个样品中加入700μl提取缓冲液(1%sarkosyl,100mmtris-hclph8.5,100mmnacl,10mmedta,2%pvpp),将样品在旋转振荡器上混合20min。加入700μl苯酚/氯仿/异戊醇(25∶24∶1),将提取物转移到二氧化硅基质管中并以4000rpm旋转10min。通过加入60μl3m醋酸钠ph4.8和600μl异丙醇沉淀dna,并以13000rpm离心10分钟。用1ml70%乙醇洗涤dna沉淀,在13000rpm下离心2分钟,空气干燥20分钟。将纯化的dna重悬于50μlr40(1×te,40μg/mlrna酶a)中。通过使用转基因特异性引物的pcr评估t0再生小植株中rnai盒的存在。
鉴定出九十九种t0再生小植株对潮霉素具有抗性,其中73个被认为含有rnai盒。在73个pcr阳性t0转基因植株中,当评估自体能育性时,观察到26个(约36%)是完全不育的或表达部分不育。这些结果表明taltpg1特异性转录后基因沉默可以诱导不育。
实施例12:使用基因组taltpgl恢复msld纯合子的能育性。
通过生物弹道转化将载体php2中taltpgl的基因组片段引入基因型msld×gladius(f2/f3代)中。
按照实施例11进行转化。通过kaspar分析使用ms1连接的标记et0292(seqidno:34)、et0294(seqidno:35)、007-0042.1(seqidno:36)、007-0046.1(seqidno:33)以及007-0182.1(seqidno:37)对再生t0小植株进行基因分析,所述标记靶向来自seqidno:8的ms14bs变体启动子(人工)。根据实施例11的方法评估被鉴定为msld纯合子并含有ms14bs变体启动子的植株的自体能育性。
鉴定出八十个t0再生小植株对潮霉素具有抗性,通过kasp分析用007-0182.1鉴定出其中69个被认为含有转基因衍生的ms14bs变体启动子。在这69个t0转基因植株中,使用007-0009.1、007-0011.1、007-0042.1和007-0046.1标记通过kasp分析鉴定出4个植株对于chris单倍型(msld/msld)是纯合的。开花前装袋的穗的分析显示三个品系是自体能育的。这些研究结果表明taltpg1的基因组片段可以恢复msld纯合子的能育性。
实施例13:ms1启动子反向重复表达影响小麦的能育性
该实施例证明可以通过ms1启动子特异性反向重复序列(启动子反向重复序列,pir)分子的表达来改变植物的能育性。这提供了ms1基因的表达是小麦中雄性能育所需的进一步证据。
通过将泛素启动子与靶向小麦ms1启动子的一部分的反向重复序列连接,来产生pir构建体(seqidno:6),包括反向重复序列之间的nos间隔区段。用于制备载体的核酸分子和方法之前已有描述(ciganetalplantjournal(2005)43,929-940(cigan等人,《植物杂志》,2005年,第43卷,第929-940页))。使用本领域已知的和本文别处提到的方法,通过农杆菌介导的转化将该构建体引入小麦fielder品种中。
使植株在温室中生长。通过定量聚合酶链式反应(qpcr)测定转基因拷贝数。将植株栽培至成熟,记录雄性能育性表型。
抑制足以造成在100%的事件中呈雄性不育。单拷贝和多拷贝t-dna插入事件都是雄性不育的,这表明单拷贝和多拷贝插入事件都是有效的。该实施例进一步证实,ms1基因是小麦中的雄性能育基因,并且其抑制导致雄性不育。
序列表
<110>先锋国际良种公司
<120>小麦ms1多核苷酸、多肽和使用方法
<130>rts20250d-us-np
<140>us14866078
<141>2015-09-25
<150>us62/056365
<151>2014-09-26
<150>us62/187591
<151>2015-07-01
<160>51
<170>patentin版本3.5
<210>1
<211>3838
<212>dna
<213>多棱大麦(hordeumvulgare)
<220>
<221>启动子
<222>(1)..(902)
<400>1
cgcacatcaacataaactcatcagatgggaataatcggatctacgaaggacataaaactc60
tttaatctcatgacaacgccagaagagcaagagtaaatatattctcataaaaaacaatga120
acactagatgatgacgaagaacataagattcttcaaggagaaattgcggcagcggagatg180
gcagccggaggcgagggggccaaaaactctgttgcggcggcagcggtagccttggtgaaa240
cccacacgtttgcacaccatataagttgtttgcaagggttacatgggcctcgctctcgtg300
aaaaagaaggtcatacatgggtcttggtctcgtgcaaaacgaaaggtcagcagtccatgg360
gccggaggaaaaaccgggcaacaacacgccatgtgtgttttcgcgggaacccaattccga420
aatcactcaccggcacctcgtcccgatgccttccagaacgttctacgtgcttccacaggg480
ccagcccagccgtgggatcagatcaggatcagcacgaacattgaagctagcgcggcgata540
tttttcccagcctccgcctcgctcgacgactgcatttcatttcgaaaacaaaaaaaagag600
ctttctccttctcatcccgagcgccagaggagcaccagaaaggccacccacccaccctca660
cgtaccgccctcgcacccgcgcggccacatctgggccgtccacttgggcagctggccgtt720
ccattcccgaactgacgggcaggatcgagcgagcggcgcgcccacggctcctccggctat780
ataacccgccacccacaccactcccctccggcgttccaccagagccttcctccctccacc840
gcaccaccaccaccaccgcgccaaaaaccctagggagcgagcgagctcacctcgccccgc900
ccatggagagatcccgccgcctgctgctcgtggcggggctcctcgccgcgctgctcccgg960
cggcggccgccaccttcgggctgcagcagggggcgcagtgcgaccccacgttcctggcga1020
cgcaggccgcgctcttctgcgcccccgacatgcccacggcccagtgctgcgagcccgtcg1080
tcgccgccttcgacctcgggggcggcgtcccctgcctctgccgcgtcgccgccgagccgc1140
agctggtcatggcggggctcaacgccacccacctcttcgcgctgtacacctcctgcggcg1200
gcatccgtcccggtggcgcccacctcgccgccgcctgccaaggtacgttcacgttcaccg1260
cctccctccctctccttctctctttgcacctgtaccagccgattcggcgttcgctttcgc1320
gtttcccggtagttttgatggtttctcgagtcgccagtgctccgatttgggttcggtttc1380
cttgcgttgtaccggatctgcctgtacggcgcgcggcgtcggggttctcgttgtttcccg1440
tggcgagcatccccgcgcgcccacggcctagctagcttaccttcagatacgcggagcgat1500
ttaggatcagtatgaggagttcgtcgtagaagaatgcatgcggaacgcgcgattgtttgt1560
ttcatcgattttggatctgtgataggcctgcttgttcccgagtttttgcacgtagaagaa1620
tcatgtgcagaacccctggtccattatttgttatgtatatacacgattacttgtgcatat1680
gcagaagtcttagttatctgctacccttccagaattattcgtggtgtttttgttcctcta1740
gttaaacttcagatgatctttcgttcgagtttattttcctgcctgtaactgagatcgata1800
tacctatcaccgtgactgtgagagagacagagagttgttgccgtttaactgctatatata1860
tgtacgttttctgctactgtttaatcgactgctccatcccgttcgcgataggacttgttt1920
caaaccgtcacgcagctctgcttcctgcagtgtcttttgtcttcgtttggtcaaaactga1980
aaacgcttgctatcgaggccagaggcagggcaaaagctccccgtacttttcgctttgcag2040
tggcatctctttctttttttttgccgaaaattgtttccacgttcatccccgggtgtcgta2100
ctacttaattatctgcatgcagttttcgtgtccttcctccgtcgtgaaaaaaaggttggg2160
tcaaatgaatcaaccgtgtatgcagggcagcagcaacagagatagagtagctggctgtcg2220
cagctttaacaaaagcagtctgtggcctgccacagttttcctgatttttgtttaatctgg2280
cctgggcttcttttcttgttgcgcacgtcgtcgcctccttcttttttcccaattttttga2340
tttcttttgagataaggacacgaacggctggtaactgacttttcttgttgttttttactg2400
tgggttttggacgcaggaccggctcccccggccgccgtcgtcagcagccccccgccacca2460
tcgccagcacctcgccgcaaacaggcagcgcgtacgaacctctcgctctctctctctccc2520
tctcgcctgcatctcgctctgtacataacctattgggttcatatgctgatcagcgttgac2580
atactaacttgttcatttgattctcagacgacgcgcctccaccgccgccgtccagcgaga2640
agccatccccgccgccccaggagcatgacggcgccgcacacgccaagagcgcccccgccc2700
tcgcggctcctaccccgctcgcgcccgctgccgctactgccccgccgcccgaggcgccac2760
actccgccgcgtcgtcgtccgattcggccttcatcttcatcgccgcggccatgctcgcca2820
tttacatcgtcctctgaatggccgacccccaaggcagcagagtacttgtcatctgattcc2880
gtttcatgcttgtcgccgtttgttgaggttcgtttctgcagtccgaacaagacggtgggg2940
ttttgatcgggtacccagatttctatgtcgatcgcgcgtactagtactagtagttgctta3000
gcagatgaacgaacattgggttttgggattcctctagctgatgaaccactgctattttcc3060
atgtgatcgatggatatgatctgaatggatggatgaagttttggtttctgatgctgatga3120
tgtgctgcttcttcatttgcatgctcgatctattccttcaattttgtggagcaacagttt3180
gtttagcttctgttctgctatgaataatgccgcttgcatcttgtcattgctgataatctg3240
cttaatgcagacattgcttccgtcccaaacaatctgttgcttaccaggtaatgcatataa3300
tctgtacctcaccttcgcacaacaacagaagctaccctgctaaaaaaacacacacacaca3360
cacaaaaaaaacagaagctggtctcacacggaagccgcttcggggactgtttgcagcttt3420
ttattgccattttgtttttcatgcaggtacaaatcgagggtgttgcttgatttgatcatg3480
gatgatcacttagagcaacatgtgtgttttgtctgtgttttattcgttgctcgtccatcc3540
aatttaaacttgaaatggatcgtgtgtggataaaagaagacgtgcgtcagtttgaatcga3600
cgcgttgggttatattttgtgtctgtgacgaccgaaacgaagacaaaatatatcgtccgg3660
ttagaattgctctaatgctagctttctctcctaccatcgcattccgtggtaggaaaaagt3720
actagaaccacaggaaactggaacgcaagaaaagcatatctaccgttggccgttgatctt3780
gtttcacattcggtatggctccggtcatattgttggagattcacattcatgcacgcaa3838
<210>2
<211>642
<212>dna
<213>多棱大麦(hordeumvulgare)
<400>2
atggagagatcccgccgcctgctgctcgtggcggggctcctcgccgcgctgctcccggcg60
gcggccgccaccttcgggctgcagcagggggcgcagtgcgaccccacgttcctggcgacg120
caggccgcgctcttctgcgcccccgacatgcccacggcccagtgctgcgagcccgtcgtc180
gccgccttcgacctcgggggcggcgtcccctgcctctgccgcgtcgccgccgagccgcag240
ctggtcatggcggggctcaacgccacccacctcttcgcgctgtacacctcctgcggcggc300
atccgtcccggtggcgcccacctcgccgccgcctgccaaggaccggctcccccggccgcc360
gtcgtcagcagccccccgccaccatcgccagcacctcgccgcaaacaggcagcgcacgac420
gcgcctccaccgccgccgtccagcgagaagccatccccgccgccccaggagcatgacggc480
gccgcacacgccaagagcgcccccgccctcgcggctcctaccccgctcgcgcccgctgcc540
gctactgccccgccgcccgaggcgccacactccgccgcgtcgtcgtccgattcggccttc600
atcttcatcgccgcggccatgctcgccatttacatcgtcctc642
<210>3
<211>214
<212>prt
<213>多棱大麦(hordeumvulgare)
<400>3
metgluargserargargleuleuleuvalalaglyleuleualaala
151015
leuleuproalaalaalaalathrpheglyleuglnglnglyalagln
202530
cysaspprothrpheleualathrglnalaalaleuphecysalapro
354045
aspmetprothralaglncyscysgluprovalvalalaalapheasp
505560
leuglyglyglyvalprocysleucysargvalalaalagluprogln
65707580
leuvalmetalaglyleuasnalathrhisleuphealaleutyrthr
859095
sercysglyglyileargproglyglyalahisleualaalaalacys
100105110
glnglyproalaproproalaalavalvalserserpropropropro
115120125
serproalaproargarglysglnalaalahisaspalapropropro
130135140
proproserserglulysproserproproproglngluhisaspgly
145150155160
alaalahisalalysseralaproalaleualaalaprothrproleu
165170175
alaproalaalaalathralaproproproglualaprohisserala
180185190
alaserserseraspseralapheilepheilealaalaalametleu
195200205
alailetyrilevalleu
210
<210>4
<211>660
<212>dna
<213>普通小麦(triticumaestivum)
<400>4
atggagagatcccgcgggctgctgctggtggcggggctgctggcggcgctgctgccggcg60
gcggcggcgcagccgggggcgccgtgcgagcccgcgctgctggcgacgcaggtggcgctc120
ttctgcgcgcccgacatgccgacggcccagtgctgcgagcccgtcgtcgccgccgtcgac180
ctcggcggcggggtgccctgcctctgccgcgtcgccgccgagccgcagctcgtcatggcg240
ggcctcaacgccacccacctcctcacgctctacagctcctgcggcggcctccgccccggc300
ggcgcccacctcgccgccgcctgcgaaggacccgctcccccggccgccgtcgtcagcagc360
cccccgcccccgcctccaccgtccgccgcacctcgccgcaagcagccagcgcacgacgca420
ccaccgccgccaccgccgtcgagcgagaagccgtcgtccccgccgccgtcccaggaccac480
gacggcgccgccccccgcgccaaggccgcgcccgcccaggcggccacctccacgctcgcg540
cccgccgccgccgccaccgccccgccgccccaggcgccgcactccgccgcgcccacggcg600
ccgtccaaggcggccttcttcttcgtcgccacggccatgctcggcctctacatcatcctc660
<210>5
<211>220
<212>prt
<213>普通小麦(triticumaestivum)
<400>5
metgluargserargglyleuleuleuvalalaglyleuleualaala
151015
leuleuproalaalaalaalaglnproglyalaprocysgluproala
202530
leuleualathrglnvalalaleuphecysalaproaspmetprothr
354045
alaglncyscysgluprovalvalalaalavalaspleuglyglygly
505560
valprocysleucysargvalalaalagluproglnleuvalmetala
65707580
glyleuasnalathrhisleuleuthrleutyrsersercysglygly
859095
leuargproglyglyalahisleualaalaalacysgluglyproala
100105110
proproalaalavalvalserserproproproproproproproser
115120125
alaalaproargarglysglnproalahisaspalapropropropro
130135140
proproserserglulysproserserproproproserglnasphis
145150155160
aspglyalaalaproargalalysalaalaproalaglnalaalathr
165170175
serthrleualaproalaalaalaalathralaproproproglnala
180185190
prohisseralaalaprothralaproserlysalaalaphephephe
195200205
valalathralametleuglyleutyrileileleu
210215220
<210>6
<211>1527
<212>dna
<213>普通小麦(triticumaestivum)
<400>6
agacttaaaccatttagttacaaatatcgatgcacaccttcggtggggcgttgtgaaaaa60
gcatgttttttgggtcgacaagccccttttgcaacgtatcctcttctaatcctattcaga120
tcattaacatcataagctgcaattgacatgctcttctgaggatcaggttcatgcaattaa180
acatcataaactgcatctttgatgtcatccttttcctatattttttccagattattggct240
tgcttcgttttcaatatcaggttctatgattcgacttctgttgttgccagtaataatttg300
tagttgctgcggaatatgaactcaaggagagctgatggtgctatgaagttgatttgatgg360
gaggttgttctacacctgcacttgctgctcgacttaaatacatgccttggatttcttccc420
agctctagtacataatatttttcaaattaatgttccacgacataaaatttaaatccacaa480
acatatttttagtacatgaacaattttctaatatagggcaaacatttttcatatacaaac540
cgatcattttaatatatggtgaaaatcagtgtaatatatgctgaaatgttttcaaataca600
tattgaacatatttataataaatggtgaacattttttttaataattgatgaccattttta660
aaatgcatattgaacattttataatatacactgtacagttttataataatcgacgaacat720
cttttggagttctgaacatttttttcaaaaacacaagccattttccaggaagaatacaaa780
tgcaaaagaaatgagatatccaaaaagcaaaaaagaaaaacaaaacaaaacagagaaacc840
tacaggaaaatccaaacagaaaaggcaaagaaagaacccgaactgggccaggcaatgttt900
ccaacggcctcgctcttcctgaacaagaaggccagtcagcccatgggctgctcccagtac960
tcgggccccgctgtggcagcacgccatgtaatagttttcgcgggaatccaacgccgaaat1020
cgcccgcagcgggaacccgacgtcggtctggtgcgttctggcgccttccagaactctcca1080
caggctcccgcagccgtccgatcagatcagcacgaagcacgaacattggcgcgcggcgat1140
attttctttcctcgcccgacgacggccgcactgcatttcattttgaatttcaaaattcgg1200
aaacggaaaagctttctcgcatcccgaggcgaggcggttacgggcgccagaggggccacc1260
ccacccacccacccccgccctcacgtgccccgcgcggccgcatccgggccgtccgcgcgg1320
acagctggccgcgcccagcccgaaccgacgcccaggatcgagcgagggcggcgcgcccgg1380
ggcttggcttagcgtccacgccacctccggctatataagccgccccacacccgctccccc1440
tccggcattccattccgccaccgcaccaccaccaccaccaaaccctagcgagcgagcgag1500
ggagagagagaccgccccgccgcgacg1527
<210>7
<211>4335
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>外显子
<222>(1528)..(1855)
<220>
<221>外显子
<222>(2925)..(3008)
<220>
<221>外显子
<222>(3133)..(3380)
<400>7
agacttaaaccatttagttacaaatatcgatgcacaccttcggtggggcgttgtgaaaaa60
gcatgttttttgggtcgacaagccccttttgcaacgtatcctcttctaatcctattcaga120
tcattaacatcataagctgcaattgacatgctcttctgaggatcaggttcatgcaattaa180
acatcataaactgcatctttgatgtcatccttttcctatattttttccagattattggct240
tgcttcgttttcaatatcaggttctatgattcgacttctgttgttgccagtaataatttg300
tagttgctgcggaatatgaactcaaggagagctgatggtgctatgaagttgatttgatgg360
gaggttgttctacacctgcacttgctgctcgacttaaatacatgccttggatttcttccc420
agctctagtacataatatttttcaaattaatgttccacgacataaaatttaaatccacaa480
acatatttttagtacatgaacaattttctaatatagggcaaacatttttcatatacaaac540
cgatcattttaatatatggtgaaaatcagtgtaatatatgctgaaatgttttcaaataca600
tattgaacatatttataataaatggtgaacattttttttaataattgatgaccattttta660
aaatgcatattgaacattttataatatacactgtacagttttataataatcgacgaacat720
cttttggagttctgaacatttttttcaaaaacacaagccattttccaggaagaatacaaa780
tgcaaaagaaatgagatatccaaaaagcaaaaaagaaaaacaaaacaaaacagagaaacc840
tacaggaaaatccaaacagaaaaggcaaagaaagaacccgaactgggccaggcaatgttt900
ccaacggcctcgctcttcctgaacaagaaggccagtcagcccatgggctgctcccagtac960
tcgggccccgctgtggcagcacgccatgtaatagttttcgcgggaatccaacgccgaaat1020
cgcccgcagcgggaacccgacgtcggtctggtgcgttctggcgccttccagaactctcca1080
caggctcccgcagccgtccgatcagatcagcacgaagcacgaacattggcgcgcggcgat1140
attttctttcctcgcccgacgacggccgcactgcatttcattttgaatttcaaaattcgg1200
aaacggaaaagctttctcgcatcccgaggcgaggcggttacgggcgccagaggggccacc1260
ccacccacccacccccgccctcacgtgccccgcgcggccgcatccgggccgtccgcgcgg1320
acagctggccgcgcccagcccgaaccgacgcccaggatcgagcgagggcggcgcgcccgg1380
ggcttggcttagcgtccacgccacctccggctatataagccgccccacacccgctccccc1440
tccggcattccattccgccaccgcaccaccaccaccaccaaaccctagcgagcgagcgag1500
ggagagagagaccgccccgccgcgacgatggagagatcccgcgggctgctgctg1554
metgluargserargglyleuleuleu
15
gtggcggggctgctggcggcgctgctgccggcggcggcggcgcagccg1602
valalaglyleuleualaalaleuleuproalaalaalaalaglnpro
10152025
ggggcgccgtgcgagcccgcgctgctggcgacgcaggtggcgctcttc1650
glyalaprocysgluproalaleuleualathrglnvalalaleuphe
303540
tgcgcgcccgacatgccgacggcccagtgctgcgagcccgtcgtcgcc1698
cysalaproaspmetprothralaglncyscysgluprovalvalala
455055
gccgtcgacctcggcggcggggtgccctgcctctgccgcgtcgccgcc1746
alavalaspleuglyglyglyvalprocysleucysargvalalaala
606570
gagccgcagctcgtcatggcgggcctcaacgccacccacctcctcacg1794
gluproglnleuvalmetalaglyleuasnalathrhisleuleuthr
758085
ctctacagctcctgcggcggcctccgccccggcggcgcccacctcgcc1842
leutyrsersercysglyglyleuargproglyglyalahisleuala
9095100105
gccgcctgcgaaggtacgttgtccgcctcctcccctccctccctccctccctc1895
alaalacysglu
tctctctacgtgctcgctttcctgcttacctagtagtacgtagtttcccatgccttcttg1955
actcgctagaagtgctccggtttgggtctgttaatttcctcgctgtactaccggatctgt2015
cgtcggcacggcgcgcggcgtcgggtcctcgccttctcccgtggcgaccgacctgcgcag2075
cgcgcgcgcggcctagctagcttcataccgctgtacctcgacatacacggagcgatctat2135
ggtctactctgagtatttcctcatcgtagaacgcatgcgccgctcgcgattgtttcgtcg2195
attctagatccgtgcttgttcccgcgagttagtatgcatctgcgtgcatatgccgtacgc2255
acgcagatgcagagtctgttgctcgagttatctactgtcgttcgctcgaccatatttgcc2315
tgttaatttcctgttcatcgtgcatgcagtagtagtagccatgtccacgccttcttgttt2375
tgaggcgatcatcgtcgagatccatggctttgctttctgcactatcttctgccttgtttt2435
gttctccgcagtacgtacgtcttgcttggtcaaaactgaaaaacgctttgctgtttgttt2495
gatcggcaagagctggccgtgcttttggcaccgcagtgcgtcgcctctgccgcttttgcg2555
aaacatttccatgttgatcctctggcggaactactttttcgcgtgcggtttgcgtggcct2615
tcctctctcgtgaaaagaggtcgggtcaaaccaaatggatcgcctcttggcagagcagcg2675
gcagcagatagctggccgtctcgcagctttggcagaaccggtctgtggccatctgtcgcc2735
gcctgccaccgtttccctgatgtttgtttctctctcgcctgccactgtttcttttcttgt2795
tgcgcacgtacgtcgtcacctcctcctacttttttgccagttttgtttacttttgatgaa2855
atatacggatgaatcggctggtgattaactttggctgctgctgttaattactgtggattt2915
tggatgcaggacccgctcccccggccgccgtcgtcagcagccccccgccc2965
glyproalaproproalaalavalvalserserpropropro
110115120
ccgcctccaccgtccgccgcacctcgccgcaagcagccagcgc3008
proproproproseralaalaproargarglysglnproala
125130135
gtaagaacctctccctctccctctctctctccctctcgcctgcatctcgctatgtttatc3068
catgtccatatgttgatcagccttgtttagttactaacatgtgcaccggatcgggttctc3128
gcagacgacgcaccaccgccgccaccgccgtcgagcgagaagccgtcg3176
hisaspalaproproproproproproserserglulysproser
140145150
tccccgccgccgtcccaggaccacgacggcgccgccccccgcgccaag3224
serproproproserglnasphisaspglyalaalaproargalalys
155160165
gccgcgcccgcccaggcggccacctccacgctcgcgcccgccgccgcc3272
alaalaproalaglnalaalathrserthrleualaproalaalaala
170175180
gccaccgccccgccgccccaggcgccgcactccgccgcgcccacggcg3320
alathralaproproproglnalaprohisseralaalaprothrala
185190195200
ccgtccaaggcggccttcttcttcgtcgccacggccatgctcggcctc3368
proserlysalaalaphephephevalalathralametleuglyleu
205210215
tacatcatcctctgagtcgcgcgccgaccccgcgagagaccgtggtccgtcc3420
tyrileileleu
220
agtcgcagtagagtagagcgctcgtcgtctcgttccgtttcgtgcctgtcgccgttcgag3480
gttcgtttctgcgtgcagtccggtcgaagaagccggtgggttttgagtactagtggtagt3540
agtagcagcagctatcgtttctgtccgctcgtacgtgtttgcgtggtcgcggagaacaat3600
taattgggtgtttgcgagtcctctggttaagatgaaccactgatgctatgtgatcgatcg3660
atcggtatgatctgaatggaaatggatcaagttttgcgttctgctgatgatgtgatccat3720
ttggatctgtgtggggcaacagtttcgcttgcttttgctctgcgatgaacgaatgcttct3780
tgcatgcatcttgtctttgcttaatttgaactgtagaacggatgcagtactgatttctgc3840
ttatgatgtgacgattcgtcgtacgcatatcatctcttcaaatttgtgtagcagctgttt3900
gtagcttccattctgctatggacgaatgcctgtttttcacggagaaccgcgcgcggggac3960
cgatgcggctttgtgttgccatgttgttttccacgccaggacaaaatagatggtgcggtt4020
ttgatccccaatcccaccatcaccatgttccggagagccacatggaactcacgtcaagcg4080
gtcactttttgcagaatcactcttaccattttacccttttgttgaaacctctctcctcat4140
ccccaaaagttgatgcaacagtgctatgcgcgcccacccatgctttttcatatgattgta4200
aaatttggatcgattttatcttttgaaccctaagtccggtttacaatctgtttgcatgtt4260
tatgttccttgcggcgaggaccattaaacaagactactattggatatatttcgacaggct4320
ttgaaatccgaattc4335
<210>8
<211>1527
<212>dna
<213>人工序列
<220>
<223>合成
<400>8
aagcttaaaccatttagttacaaatatcgatgcacaccttcggtggggcgttgtgaaaaa60
gcatgttttttgggtcgacaagccccttttgcaacgtatcctcttctaatcctattcaga120
tcattaacatcataagctgcaattgacatgctcttctgaggatcaggttcatgcaattaa180
acatcataaactgcatctttgatgtcatccttttcctatattttttccagattattggct240
tgcttcgttttcaatatcaggttctatgattcgacttctgttgttgccagtaataatttg300
tagttgctgcggaatatgaactcaaggagagctgatggtgctatgaagttgatttgatgg360
gaggttgttctacacctgcacttgctgctcgacttaaatacatgccttggatttcttccc420
agctctagtacataatatttttcaaattaatgttccacgacataaaatttaaatccacaa480
acatatttttagtacatgaacaattttctaatatagggcaaacatttttcatatacaaac540
cgatcattttaatatatggtgaaaatcagtgtaatatatgctgaaatgttttcaaataca600
tattgaacatatttataataaatggtgaacattttttttaataattgatgaccattttta660
aaatgcatattgaacattttataatatacactgtacagttttataataatcgacgaacat720
cttttggagttctgaacatttttttcaaaaacacaagccattttccaggaagaatacaaa780
tgcaaaagaaatgagatatccaaaaagcaaaaaagaaaaacaaaacaaaacagagaaacc840
tacaggaaaatccaaacagaaaaggcaaagaaagaacccgaactgggccaggcaatgttt900
ccaacggcctcgctcttcctgaacaagaaggccagtcagcccatgggctgctcccagtac960
tcgggccccgctgtggcagcacgccatgtaatagttttcgcgggaatccaacgccgaaat1020
cgcccgcagcgggaacccgacgtcggtctggtgcgttctggcgccttccagaactctcca1080
caggctcccgcagccgtccgatcagatcagcacgaagcacgaacattggcgcgcggcgat1140
attttctttcctcgcccgacgacggccgcactgcatttcattttgaatttcaaaattcgg1200
aaacggaatagctttctcgcatcccgaggcgaggcggttacgggcgccagaggggccacc1260
ccacccacccacccccgccctcacgtgccccgcgcggccgaatccgggccgtccgcgcgg1320
acagctggccgcgcccagcccgaaccgacgcccaggatcgagcgagggcggcgcgcccgg1380
ggcttggcttagcgtccacgccacctccggctatataagccgccccacacccgctccccc1440
tccggcattccattccgccaccgcaccaccaccaccaccaaaccctagcgagcgagcgag1500
ggagagagagaccgccccgccgcgacg1527
<210>9
<211>4335
<212>dna
<213>人工序列
<220>
<223>合成
<400>9
aagcttaaaccatttagttacaaatatcgatgcacaccttcggtggggcgttgtgaaaaa60
gcatgttttttgggtcgacaagccccttttgcaacgtatcctcttctaatcctattcaga120
tcattaacatcataagctgcaattgacatgctcttctgaggatcaggttcatgcaattaa180
acatcataaactgcatctttgatgtcatccttttcctatattttttccagattattggct240
tgcttcgttttcaatatcaggttctatgattcgacttctgttgttgccagtaataatttg300
tagttgctgcggaatatgaactcaaggagagctgatggtgctatgaagttgatttgatgg360
gaggttgttctacacctgcacttgctgctcgacttaaatacatgccttggatttcttccc420
agctctagtacataatatttttcaaattaatgttccacgacataaaatttaaatccacaa480
acatatttttagtacatgaacaattttctaatatagggcaaacatttttcatatacaaac540
cgatcattttaatatatggtgaaaatcagtgtaatatatgctgaaatgttttcaaataca600
tattgaacatatttataataaatggtgaacattttttttaataattgatgaccattttta660
aaatgcatattgaacattttataatatacactgtacagttttataataatcgacgaacat720
cttttggagttctgaacatttttttcaaaaacacaagccattttccaggaagaatacaaa780
tgcaaaagaaatgagatatccaaaaagcaaaaaagaaaaacaaaacaaaacagagaaacc840
tacaggaaaatccaaacagaaaaggcaaagaaagaacccgaactgggccaggcaatgttt900
ccaacggcctcgctcttcctgaacaagaaggccagtcagcccatgggctgctcccagtac960
tcgggccccgctgtggcagcacgccatgtaatagttttcgcgggaatccaacgccgaaat1020
cgcccgcagcgggaacccgacgtcggtctggtgcgttctggcgccttccagaactctcca1080
caggctcccgcagccgtccgatcagatcagcacgaagcacgaacattggcgcgcggcgat1140
attttctttcctcgcccgacgacggccgcactgcatttcattttgaatttcaaaattcgg1200
aaacggaatagctttctcgcatcccgaggcgaggcggttacgggcgccagaggggccacc1260
ccacccacccacccccgccctcacgtgccccgcgcggccgaatccgggccgtccgcgcgg1320
acagctggccgcgcccagcccgaaccgacgcccaggatcgagcgagggcggcgcgcccgg1380
ggcttggcttagcgtccacgccacctccggctatataagccgccccacacccgctccccc1440
tccggcattccattccgccaccgcaccaccaccaccaccaaaccctagcgagcgagcgag1500
ggagagagagaccgccccgccgcgacgatggagagatcccgcgggctgctgctggtggcg1560
gggctgctggcggcgctgctgccggcggcggcggcgcagccgggggcgccgtgcgagccc1620
gcgctgctggcgacgcaggtggcgctcttctgcgcgcccgacatgccgacggcccagtgc1680
tgcgagcccgtcgtcgccgccgtcgacctcggcggcggggtgccctgcctctgccgcgtc1740
gccgccgagccgcagctcgtcatggcgggcctcaacgccacccacctcctcacgctctac1800
agctcctgcggcggcctccgccccggcggcgcccacctcgccgccgcctgcgaaggtacg1860
ttgtccgcctcctcccctccctccctccctccctctctctctacgtgctcgctttcctgc1920
ttacctagtagtacgtagtttcccatgccttcttgactcgctagaagtgctccggtttgg1980
gtctgttaatttcctcgctgtactaccggatctgtcgtcggcacggcgcgcggcgtcggg2040
tcctcgccttctcccgtggcgaccgacctgcgcagcgcgcgcgcggcctagctagcttca2100
taccgctgtacctcgacatacacggagcgatctatggtctactctgagtatttcctcatc2160
gtagaacgcatgcgccgctcgcgattgtttcgtcgattctagatccgtgcttgttcccgc2220
gagttagtatgcatctgcgtgcatatgccgtacgcacgcagatgcagagtctgttgctcg2280
agttatctactgtcgttcgctcgaccatatttgcctgttaatttcctgttcatcgtgcat2340
gcagtagtagtagccatgtccacgccttcttgttttgaggcgatcatcgtcgagatccat2400
ggctttgctttctgcactatcttctgccttgttttgttctccgcagtacgtacgtcttgc2460
ttggtcaaaactgaaaaacgctttgctgtttgtttgatcggcaagagctggccgtgcttt2520
tggcaccgcagtgcgtcgcctctgccgcttttgcgaaacatttccatgttgatcctctgg2580
cggaactactttttcgcgtgcggtttgcgtggccttcctctctcgtgaaaagaggtcggg2640
tcaaaccaaatggatcgcctcttggcagagcagcggcagcagatagctggccgtctcgca2700
gctttggcagaaccggtctgtggccatctgtcgccgcctgccaccgtttccctgatgttt2760
gtttctctctcgcctgccactgtttcttttcttgttgcgcacgtacgtcgtcacctcctc2820
ctacttttttgccagttttgtttacttttgatgaaatatacggatgaatcggctggtgat2880
taactttggctgctgctgttaattactgtggattttggatgcaggacccgctcccccggc2940
cgccgtcgtcagcagccccccgcccccgcctccaccgtccgccgcacctcgccgcaagca3000
gccagcgcgtaagaacctctccctctccctctctctctccctctcgcctgcatctcgcta3060
tgtttatccatgtccatatgttgatcagccttgtttagttactaacatgtgcaccggatc3120
gggttctcgcagacgacgcaccaccgccgccaccgccgtcgagcgagaagccgtcgtccc3180
cgccgccgtcccaggaccacgacggcgccgccccccgcgccaaggccgcgcccgcccagg3240
cggccacctccacgctcgcgcccgccgccgccgccaccgccccgccgccccaggcgccgc3300
actccgccgcgcccacggcgccgtccaaggcggccttcttcttcgtcgccacggccatgc3360
tcggcctctacatcatcctctgagtcgcgcgccgaccccgcgagagaccgtggtccgtcc3420
agtcgcagtagagtagagcgctcgtcgtctcgttccgtttcgtgcctgtcgccgttcgag3480
gttcgtttctgcgtgcagtccggtcgaagaagccggtgggttttgagtactagtggtagt3540
agtagcagcagctatcgtttctgtccgctcgtacgtgtttgcgtggtcgcggagaacaat3600
taattgggtgtttgcgagtcctctggttaagatgaaccactgatgctatgtgatcgatcg3660
atcggtatgatctgaatggaaatggatcaagttttgcgttctgctgatgatgtgatccat3720
ttggatctgtgtggggcaacagtttcgcttgcttttgctctgcgatgaacgaatgcttct3780
tgcatgcatcttgtctttgcttaatttgaactgtagaacggatgcagtactgatttctgc3840
ttatgatgtgacgattcgtcgtacgcatatcatctcttcaaatttgtgtagcagctgttt3900
gtagcttccattctgctatggacgaatgcctgtttttcacggagaaccgcgcgcggggac3960
cgatgcggctttgtgttgccatgttgttttccacgccaggacaaaatagatggtgcggtt4020
ttgatccccaatcccaccatcaccatgttccggagagccacatggaactcacgtcaagcg4080
gtcactttttgcagaatcactcttaccattttacccttttgttgaaacctctctcctcat4140
ccccaaaagttgatgcaacagtgctatgcgcgcccacccatgctttttcatatgattgta4200
aaatttggatcgattttatcttttgaaccctaagtccggtttacaatctgtttgcatgtt4260
tatgttccttgcggcgaggaccattaaacaagactactattggatatatttcgacaggct4320
ttgaaatccgaattc4335
<210>10
<211>241
<212>dna
<213>多棱大麦(hordeumvulgare)
<220>
<221>变型
<222>(121)..(121)
<223>a或c
<400>10
ttttacagcagcaacaacaacaacaaaacccaagtcaccagtaagagcttacacgcagcc60
tgagggcgggcacgacacaaacgggtataaggttgacacgtacatccaacacagggcaaa120
maagttccgtttcaaggggtcgcgagcccggagttccaccgctggaatcggtcaatccgg180
ttctgcacacacacagccgttacactgcctacaaacaagtttaagggatacatacacact240
g241
<210>11
<211>274
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(34)..(34)
<223>c(chris)或t(gladius)
<220>
<221>变型
<222>(54)..(54)
<223>g(chris)或t(gladius)
<220>
<221>变型
<222>(83)..(83)
<223>t(chris)或c(gladius)
<220>
<221>变型
<222>(130)..(130)
<223>g(chris)或a(gladius)
<220>
<221>变型
<222>(165)..(165)
<223>a(chris)或空位(gladius)
<220>
<221>变型
<222>(174)..(174)
<223>a(chris)或t(gladius,第173位)
<220>
<221>变型
<222>(186)..(186)
<223>t(chris)或g(gladius,第185位)
<220>
<221>变型
<222>(253)..(253)
<223>t(chris)或c(gladius,第252位)
<400>11
atgatggatggacggatgatgctctgtggtgccytgtatttatatttgttgagktctttg60
atacaggatgatatgtctccaaygtatctataattttttgttgttccatgttgttatatt120
atcattttgratgttttacaatcattttataatcattctatatcattttttgtwactaac180
ctattkacatagtgccaagtgctagttgttgttttctgcttgttttttacatcgcaggaa240
atcaataccaaayggagtccaaacgcagcaaaac274
<210>12
<211>273
<212>dna
<213>普通小麦(triticumaestivum)
<400>12
atgatggatggacggatgatgctctgtggtgccttgtatttatatttgttgagttctttg60
atacaggatgatatgtctccaacgtatctataattttttgttgttccatgttgttatatt120
atcattttgaatgttttacaatcattttataatcattctatatcttttttgttactaacc180
tattgacatagtgccaagtgctagttgttgttttctgcttgttttttacatcgcaggaaa240
tcaataccaaacggagtccaaacgcagcaaaac273
<210>13
<211>274
<212>dna
<213>普通小麦(triticumaestivum)
<400>13
atgatggatggacggatgatgctctgtggtgccctgtatttatatttgttgaggtctttg60
atacaggatgatatgtctccaatgtatctataattttttgttgttccatgttgttatatt120
atcattttggatgttttacaatcattttataatcattctatatcattttttgtaactaac180
ctatttacatagtgccaagtgctagttgttgttttctgcttgttttttacatcgcaggaa240
atcaataccaaatggagtccaaacgcagcaaaac274
<210>14
<211>415
<212>dna
<213>拟斯卑尔托山羊草(aegilopsspeltoides)
<400>14
accaggcctcccgaccccaccgtgagcatgcgcttcgcgtgcacggcggcaccactccgc60
tacggcctcggcccttcttcttccttctccgacaacgccgcctcctcgtgttgttcttct120
tcgtctcggattctatctacaaggagctagctagctagcgcgattcactgatctctagct180
ggggaggggtacaaccgtacaagcatggagcccggagctttagcgacgtgcggggcggtg240
gccttctcctgggagcaggagccgggggtgtccaaggagagcccggcggccgaggcgagg300
aagccctccggtggaaggacgccggacagcaccaggaaggtggaggtgcagacggacagg360
ctgctcgtgccccctccaccgggagggcccggagcgccgtctctgtcgccggtga415
<210>15
<211>281
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(224)..(224)
<223>t(chris)或a(gladius)
<220>
<221>变型
<222>(229)..(229)
<223>c(chris)或a(gladius)
<220>
<221>变型
<222>(253)..(253)
<223>a(chris)或c(gladius)
<400>15
ttaatagtgttccgccctgcgtggcacagaccgtaacgaatgattgtacgaacgtttttc60
actaatcattacataggtgtggtttaagaaaaaatcaaccaccttaacgccgtaatcccc120
tctacagaataaccacacaagtcatgaaaaggaactattaacaaaaatagatgataaaat180
aaatctcaaatccaaattcataaagcacctctagtctataaacwcgacmaatctagctat240
gtttagtacttcmtccgttccaaaatacttgtcgtggtttt281
<210>16
<211>281
<212>dna
<213>普通小麦(triticumaestivum)
<400>16
ttaatagtgttccgccctgcgtggcacagaccgtaacgaatgattgtacgaacgtttttc60
actaatcattacataggtgtggtttaagaaaaaatcaaccaccttaacgccgtaatcccc120
tctacagaataaccacacaagtcatgaaaaggaactattaacaaaaatagatgataaaat180
aaatctcaaatccaaattcataaagcacctctagtctataaacacgacaaatctagctat240
gtttagtacttcctccgttccaaaatacttgtcgtggtttt281
<210>17
<211>281
<212>dna
<213>普通小麦(triticumaestivum)
<400>17
ttaatagtgttccgccctgcgtggcacagaccgtaacgaatgattgtacgaacgtttttc60
actaatcattacataggtgtggtttaagaaaaaatcaaccaccttaacgccgtaatcccc120
tctacagaataaccacacaagtcatgaaaaggaactattaacaaaaatagatgataaaat180
aaatctcaaatccaaattcataaagcacctctagtctataaactcgaccaatctagctat240
gtttagtacttcatccgttccaaaatacttgtcgtggtttt281
<210>18
<211>199
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(101)..(101)
<223>t(gladius)或c(chris)
<400>18
atgctcatggtgcacgcgacgagaagtggccagagacaatccttgaccatgatcgaataa60
tatggctcggggatttgaattaccggatagcgctttcctaycgctctgtgaaggctttgg120
ttgagatgcacaattggaaacaattgttggaaaaagatcagcttcgtatagagcaaaggt180
ttggtcgggtattcgcggg199
<210>19
<211>199
<212>dna
<213>普通小麦(triticumaestivum)
<400>19
atgctcatggtgcacgcgacgagaagtggccagagacaatccttgaccatgatcgaataa60
tatggctcggggatttgaattaccggatagcgctttcctatcgctctgtgaaggctttgg120
ttgagatgcacaattggaaacaattgttggaaaaagatcagcttcgtatagagcaaaggt180
ttggtcgggtattcgcggg199
<210>20
<211>199
<212>dna
<213>普通小麦(triticumaestivum)
<400>20
atgctcatggtgcacgcgacgagaagtggccagagacaatccttgaccatgatcgaataa60
tatggctcggggatttgaattaccggatagcgctttcctaccgctctgtgaaggctttgg120
ttgagatgcacaattggaaacaattgttggaaaaagatcagcttcgtatagagcaaaggt180
ttggtcgggtattcgcggg199
<210>21
<211>198
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(101)..(101)
<223>a(gladius)或g(chris)
<220>
<221>变型
<222>(165)..(165)
<223>c(gladius)或t(chris)
<400>21
tatatgaattaggctttgcggaccggaagtacaacgccaacttgcttggtgttcctgcac60
tgctgcttgagaccttgatgtgcaaagttatgaacatatcrgcgtaactagggaaagtga120
atatgtataatactagcaaacaagttagattaggctaaatcgcgytattttccggtgagc180
tgggatttcctggccagt198
<210>22
<211>198
<212>dna
<213>普通小麦(triticumaestivum)
<400>22
tatatgaattaggctttgcggaccggaagtacaacgccaacttgcttggtgttcctgcac60
tgctgcttgagaccttgatgtgcaaagttatgaacatatcagcgtaactagggaaagtga120
atatgtataatactagcaaacaagttagattaggctaaatcgcgctattttccggtgagc180
tgggatttcctggccagt198
<210>23
<211>198
<212>dna
<213>普通小麦(triticumaestivum)
<400>23
tatatgaattaggctttgcggaccggaagtacaacgccaacttgcttggtgttcctgcac60
tgctgcttgagaccttgatgtgcaaagttatgaacatatcggcgtaactagggaaagtga120
atatgtataatactagcaaacaagttagattaggctaaatcgcgttattttccggtgagc180
tgggatttcctggccagt198
<210>24
<211>58
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(22)..(22)
<223>t(chris)或c(gladius)
<400>24
atgtggaccttggcaagatttyatatgcattttgagagaaatagaagtaatgtgattg58
<210>25
<211>56
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(27)..(27)
<223>g(chris)或a(gladius)
<400>25
ggttttgggtttactttgagtcatagragaagccatactataaagagggggttgct56
<210>26
<211>53
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(31)..(31)
<223>t(chris)或g(gladius)
<400>26
acttgattgtactttttggttagcaacaatkgcaatgacttgacaagggaaag53
<210>27
<211>50
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(30)..(30)
<223>g(chris)或c(gladius)
<400>27
ctcgccttggctatagggtcctctgtgagsaaggaaaaggtcgaggaggc50
<210>28
<211>59
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(38)..(38)
<223>a(chris)或g(gladius)
<400>28
caacgctatcccttaaaacggatacactatccatccgrgaagcatgttcggatgtgttg59
<210>29
<211>39
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(20)..(20)
<223>a(chris)或g(gladius)
<400>29
ctcgccgccgcctgcgaagrtacgttgtccgcctcctcc39
<210>30
<211>1618
<212>dna
<213>玉米(zeamays)
<220>
<221>cds
<222>(108)..(1430)
<400>30
ggcacgagccggcgagcccactcggcagtcggcacaaccacacacacctccacccactct60
ctgagataagtgaagcatctcgcgcactgtcgcagtcgcagacggagatgatgaag116
metmetlys
1
cactcgagcagcttgtgcttgctcttcctcttggcgctctgcaccacc164
hisserserserleucysleuleupheleuleualaleucysthrthr
51015
ctgctggcctgcggcctggtccaggcacaagtcctcttccaggggttt212
leuleualacysglyleuvalglnalaglnvalleupheglnglyphe
20253035
aactgggagtcgtgcaagcagcagggaggctggtacaacaggctcaag260
asntrpglusercyslysglnglnglyglytrptyrasnargleulys
404550
gcccaggtcgacgacatcgccaaggccggcgtcacgcacgtctggctg308
alaglnvalaspaspilealalysalaglyvalthrhisvaltrpleu
556065
cctccaccctcgcactccgtctcgccacaaggctacatgccaggccgc356
proproproserhisservalserproglnglytyrmetproglyarg
707580
ctatacgacctggacgcgtccaagtacggcacggcggcggagctcaag404
leutyraspleuaspalaserlystyrglythralaalagluleulys
859095
tccctgatagcggcgttccacggcaggggcgtgcagtgcgtggcggac452
serleuilealaalaphehisglyargglyvalglncysvalalaasp
100105110115
atcgtcatcaaccaccggtgcgcggaaaagaaggacgcgcgcggcgtg500
ilevalileasnhisargcysalaglulyslysaspalaargglyval
120125130
tactgcatcttcgagggcgggactcccgacgaccgcctggactggggc548
tyrcysilephegluglyglythrproaspaspargleuasptrpgly
135140145
cccgggatgatctgcagcgacgacacgcagtactcggacgggacgggg596
proglymetilecysseraspaspthrglntyrseraspglythrgly
150155160
caccgcgacacgggcgaggggttcgcggcggcgcccgacatcgaccac644
hisargaspthrglygluglyphealaalaalaproaspileasphis
165170175
ctcaacccgcgcgtgcagcgggagctctccgcctggctcaactggctc692
leuasnproargvalglnarggluleuseralatrpleuasntrpleu
180185190195
aggtccgacgccgtggggttcgacggctggcgcctcgacttcgccaag740
argseraspalavalglypheaspglytrpargleuaspphealalys
200205210
ggctactcgccggccgtcgccagaatgtacgtggagagcacggggccg788
glytyrserproalavalalaargmettyrvalgluserthrglypro
215220225
ccgagcttcgtcgtcgcggagatatggaactcgctgagctacagcggg836
proserphevalvalalagluiletrpasnserleusertyrsergly
230235240
gacggcaagccggcgcccaaccaggaccagtgccggcaggagctgctg884
aspglylysproalaproasnglnaspglncysargglngluleuleu
245250255
gactggacgcgggccgtcggcgggcccgccatggcgttcgacttcccc932
asptrpthrargalavalglyglyproalametalapheaspphepro
260265270275
accaagggcctgctgcaggcgggcgtgcagggggagctgtggcggctg980
thrlysglyleuleuglnalaglyvalglnglygluleutrpargleu
280285290
cgcgacagctccggcaacgcggccggcctgatcgggtgggcgcccgag1028
argaspserserglyasnalaalaglyleuileglytrpalaproglu
295300305
aaggccgtcaccttcgtcgacaaccatgacaccgggtcgacgcagaag1076
lysalavalthrphevalaspasnhisaspthrglyserthrglnlys
310315320
ctctggccgttcccatccgacaaggtcatgcagggctacgcctacatc1124
leutrppropheproserasplysvalmetglnglytyralatyrile
325330335
ctcacccatccaggagtcccctgcattttctacgaccacatgttcgac1172
leuthrhisproglyvalprocysilephetyrasphismetpheasp
340345350355
tggaacctgaagcaggagatatccacgctgtctgccatcagggcgcgg1220
trpasnleulysglngluileserthrleuseralaileargalaarg
360365370
aacggcatccgcgccgggagcaagctgcggatcctcgtggcggacgcg1268
asnglyileargalaglyserlysleuargileleuvalalaaspala
375380385
gacgcgtacgtggccgtcgtcgacgagaaggtcatggtgaagatcggg1316
aspalatyrvalalavalvalaspglulysvalmetvallysilegly
390395400
acaaggtacggcgtgagcagcgtggtcccgtcggatttccacccggcg1364
thrargtyrglyvalserservalvalproseraspphehisproala
405410415
gcgcacggcaaggactactgcgtctgggagaaagcgagcctccgcgtc1412
alahisglylysasptyrcysvaltrpglulysalaserleuargval
420425430435
ccggcggggcgccacctctagcagctcagattgctcagtcttgtgctg1460
proalaglyarghisleu
440
cattgcaaacacagcagcacgacactgcataacgtcttttccttaatttcctgaatttta1520
ccttttcctagttcaatttcatatatgtatttctacatgtacacactatcacaatcagat1580
aaataaacaagcttggtcaaaaaaaaaaaaaaaaaaaa1618
<210>31
<211>441
<212>prt
<213>玉米(zeamays)
<400>31
metmetlyshisserserserleucysleuleupheleuleualaleu
151015
cysthrthrleuleualacysglyleuvalglnalaglnvalleuphe
202530
glnglypheasntrpglusercyslysglnglnglyglytrptyrasn
354045
argleulysalaglnvalaspaspilealalysalaglyvalthrhis
505560
valtrpleuproproproserhisservalserproglnglytyrmet
65707580
proglyargleutyraspleuaspalaserlystyrglythralaala
859095
gluleulysserleuilealaalaphehisglyargglyvalglncys
100105110
valalaaspilevalileasnhisargcysalaglulyslysaspala
115120125
argglyvaltyrcysilephegluglyglythrproaspaspargleu
130135140
asptrpglyproglymetilecysseraspaspthrglntyrserasp
145150155160
glythrglyhisargaspthrglygluglyphealaalaalaproasp
165170175
ileasphisleuasnproargvalglnarggluleuseralatrpleu
180185190
asntrpleuargseraspalavalglypheaspglytrpargleuasp
195200205
phealalysglytyrserproalavalalaargmettyrvalgluser
210215220
thrglyproproserphevalvalalagluiletrpasnserleuser
225230235240
tyrserglyaspglylysproalaproasnglnaspglncysarggln
245250255
gluleuleuasptrpthrargalavalglyglyproalametalaphe
260265270
asppheprothrlysglyleuleuglnalaglyvalglnglygluleu
275280285
trpargleuargaspserserglyasnalaalaglyleuileglytrp
290295300
alaproglulysalavalthrphevalaspasnhisaspthrglyser
305310315320
thrglnlysleutrppropheproserasplysvalmetglnglytyr
325330335
alatyrileleuthrhisproglyvalprocysilephetyrasphis
340345350
metpheasptrpasnleulysglngluileserthrleuseralaile
355360365
argalaargasnglyileargalaglyserlysleuargileleuval
370375380
alaaspalaaspalatyrvalalavalvalaspglulysvalmetval
385390395400
lysileglythrargtyrglyvalserservalvalproseraspphe
405410415
hisproalaalahisglylysasptyrcysvaltrpglulysalaser
420425430
leuargvalproalaglyarghisleu
435440
<210>32
<211>55
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(30)..(30)
<223>c(gladius)或a(chris)
<400>32
atcacattgcacaagttaatagtccggtamtgggtaattacctttggactttcca55
<210>33
<211>61
<212>dna
<213>普通小麦(triticumaestivum)
<220>
<221>变型
<222>(27)..(27)
<223>a(gladius)或t(chris)
<400>33
tgtttctgctgcttgctctgcttatawaatgataatgatatgtgcgaatggtctgttcat60
g61
<210>34
<211>45
<212>dna
<213>人工序列
<220>
<223>侧翼标记扩增子
<400>34
ggttttccctagtagtgtgaggrgaacgcctcatcccactcgctc45
<210>35
<211>61
<212>dna
<213>人工序列
<220>
<223>侧翼标记007-0011.1扩增子
<400>35
gtatatactagtaaatcaataaggtcgatrctaaagatagaaaaatacctgaagtggtgc60
c61
<210>36
<211>44
<212>dna
<213>人工序列
<220>
<223>扩增子
<400>36
ggcctaaaatttgagcccgaaggttgrgccgggcttgggcttga44
<210>37
<211>79
<212>dna
<213>人工序列
<220>
<223>扩增子
<400>37
tcattttgaatttcaaaattcggaaacggaawagctttctcgcatcccgaggcgaggcgg60
ttacgggcgccagaggggc79
<210>38
<211>196
<212>dna
<213>普通小麦(triticumaestivum)
<400>38
tgtcgccgttcgaggttcgtttctgcgtgcagtccggtcgaagaagccggtgggttttga60
gtactagtggtagtagtagcagcagctatcgtttctgtccgctcgtacgtgtttgcgtgg120
tcgcggagaacaattaattgggtgtttgcgagtcctctggttaagatgaaccactgatgc180
tatgtgatcgatcgat196
<210>39
<211>228
<212>prt
<213>二穗短柄草(brachypodiumdistachyon)
<400>39
metgluargserhishisleuleuleuvalleuglyleuleualaala
151015
leuleuproalaalaalaalathrpheglythrthrglnproglupro
202530
glyalaprocysgluprothrleuleualathrglnvalserleuphe
354045
cysalaproaspmetprothralaglncyscysgluprovalvalala
505560
servalaspleuglyglyglyvalprocysleucysargvalalaala
65707580
gluproglnleuvalmetalaglyleuasnalathrhisleuleuthr
859095
leutyrthrsercysglyglyleuargproglyglyalahisleuala
100105110
alaalacysgluglyproalaproproalaalavalvalseralapro
115120125
proproseralaalaproargarglysglnproalahisglualapro
130135140
proproproproserthrglulysproserproproproglnglnasp
145150155160
asnvalthralahisglylysalaileprothrhisalaalathrser
165170175
proleualaproalaalasermetilehismetserproproproala
180185190
cysasnprocysserglyseralaalaserseralagluglyproleu
195200205
leuilealaalaleuleuleuvalilethralaileilevalglythr
210215220
leuaspasplys
225
<210>40
<211>228
<212>prt
<213>水稻(oryzasativa)
<400>40
metgluargserhisleualavalleuleuglyleuleualapheala
151015
alaglyvalproalaalaalaalaalathralavalgluglyalagln
202530
alaalathralaglualasercysgluproserileleualathrgln
354045
valserleuphecysalaproaspmetprothralaglncyscysglu
505560
provalvalalaservalaspleuglyglyglyvalprocysleucys
65707580
argvalalaalagluproglnleuileileserglyleuasnalathr
859095
hisleuleuthrleutyralaalacysglyglyleuargproglygly
100105110
alaargleualaalaalacysgluglyproalaproproalaserile
115120125
valthralaproproproprovalalapheargarglysproproala
130135140
argglualaproproproproproalaalaglulysleuserpropro
145150155160
proglnglnhisaspaspserasphisasnlysargvalglyproleu
165170175
proargglyserproproprotyralaglnservalprovalglypro
180185190
alaalaalaproproproproargserglyalaserserserleugln
195200205
alaproleualaalathrthrthrilevalalailethrleuileala
210215220
alaalaglntyr
225
<210>41
<211>902
<212>dna
<213>多棱大麦(hordeumvulgare)
<400>41
cgcacatcaacataaactcatcagatgggaataatcggatctacgaaggacataaaactc60
tttaatctcatgacaacgccagaagagcaagagtaaatatattctcataaaaaacaatga120
acactagatgatgacgaagaacataagattcttcaaggagaaattgcggcagcggagatg180
gcagccggaggcgagggggccaaaaactctgttgcggcggcagcggtagccttggtgaaa240
cccacacgtttgcacaccatataagttgtttgcaagggttacatgggcctcgctctcgtg300
aaaaagaaggtcatacatgggtcttggtctcgtgcaaaacgaaaggtcagcagtccatgg360
gccggaggaaaaaccgggcaacaacacgccatgtgtgttttcgcgggaacccaattccga420
aatcactcaccggcacctcgtcccgatgccttccagaacgttctacgtgcttccacaggg480
ccagcccagccgtgggatcagatcaggatcagcacgaacattgaagctagcgcggcgata540
tttttcccagcctccgcctcgctcgacgactgcatttcatttcgaaaacaaaaaaaagag600
ctttctccttctcatcccgagcgccagaggagcaccagaaaggccacccacccaccctca660
cgtaccgccctcgcacccgcgcggccacatctgggccgtccacttgggcagctggccgtt720
ccattcccgaactgacgggcaggatcgagcgagcggcgcgcccacggctcctccggctat780
ataacccgccacccacaccactcccctccggcgttccaccagagccttcctccctccacc840
gcaccaccaccaccaccgcgccaaaaaccctagggagcgagcgagctcacctcgccccgc900
cc902
<210>42
<211>4504
<212>dna
<213>水稻(oryzasativa)
<220>
<221>外显子
<222>(1001)..(1363)
<220>
<221>外显子
<222>(3093)..(3164)
<220>
<221>外显子
<222>(3253)..(3505)
<400>42
gaacagtgcactggttgggataacaagaagttagaaattgggcatatatatagaagggta60
agacacctctaatggatagggtggacaatccatcaaagatgactattttggcacctctga120
ggccgtgacaagttgcctatcttcgcacccttcacaagtgactccctacttgtgatgggt180
cgtgagatgtgagccggtgatctttctcagatgtaaatttcggcctctcacaagtgactc240
cttatctgtgataggtcttgccctcacagcctcatctgtaacggcctctaattcaatccg300
ttacagattaaatcattcatgacaagacactttgacccatcataggtgggttgttaatgt360
tgaaccgaggtagcgtggtggtggcttctttgattgttgagcgggttgtgttcttcatca420
cttggtaggaagtaggaacccaagaaggttagaagcccacaactattatatcgtcggcct480
cattggtaaatgggctagaagcctagaggcaatctgattcaatagtgtcggaaatttgtg540
gatgggccagagacgttgcgtcgtcttcgactcttcgagtgcctggcctacggatctgca600
cgaatcttagagcaagtagaaaatcgcatatcgtcgtgtagagcgcagcacaaattcgag660
ttgcttttccctttttcgcagccaaatcttacctgctcacgtgccgtgctgcccggtgtg720
cagagcccacgcgccacggcgccagtgtactacaccgaatcggcaccatccatcgccaca780
gctggccggtcccccctaagacggacgctccggatcaatccacgttggcatggcttcccc840
gcatcgccttctccgcgcccccgcctatataatggcgctctcgcttctcttccccatttc900
gtcttccccttctctagagccttcctctcacagagcacacacaaaaccctagagtaggaa960
gcgagcgagagagagagagagagagagagagaccacacccatggagcgctcccac1015
metgluargserhis
15
ctcgccgtcctgctcggcctcctcgccttcgccgccggggtcccggcc1063
leualavalleuleuglyleuleualaphealaalaglyvalproala
101520
gcagcggcggccaccgccgtggagggagcgcaggcggccacggcggag1111
alaalaalaalathralavalgluglyalaglnalaalathralaglu
253035
gcgtcgtgcgagccctccatcctcgccacccaggtctcgctcttctgc1159
alasercysgluproserileleualathrglnvalserleuphecys
404550
gcgcccgacatgcccaccgcgcagtgctgcgagccggtggtggcctcc1207
alaproaspmetprothralaglncyscysgluprovalvalalaser
556065
gtcgacctcggcggcggcgtaccctgcctctgccgcgtcgccgccgag1255
valaspleuglyglyglyvalprocysleucysargvalalaalaglu
70758085
ccgcagctcatcatctccggcctcaacgccacccacctcctcacgctg1303
proglnleuileileserglyleuasnalathrhisleuleuthrleu
9095100
tacgccgcctgcggaggcctccgccctggaggcgctcgcctcgccgcc1351
tyralaalacysglyglyleuargproglyglyalaargleualaala
105110115
gcctgtgaaggtacgtacatgcataacctcctcctcctcctcctcctctctc1403
alacysglugly
120
tctctctctctctctctctctctctctctctctctctctctctctctctctctctctctc1463
tctctctctctctctctctctctctctctctctctctctctctcggttggggttgctgcc1523
ttgcgtttttggttggtttttcgtgggttgggcgagatccttcgagttgcttgtgttttg1583
tggtatgctaggcttcgaacgagttgccggcgttgctgtgtcgaccaactctcgtatgct1643
tatctttcagcacatgagttttggcctcgtttttactcggttgttgtatgctacttctga1703
gatttgagttcatccactgctaaactgacatcatagatgaagaatagcagcggcgtttgg1763
tcgattttgattcctttctctggatgttcgagctgatcttgtggttattgctcgaagcct1823
cgaaacgcttgcgcacatgcaagatccagcaacgtatagatctatagtggtgttgtgctt1883
ttattcggatttgtggttcagtgtttacgtgcgaagtcacgcgttcgatgtttccgcttg1943
agctccatatctatagcacaaatcaatcatgtgcgttgcgcgagttcaagctcgagagaa2003
aagaaaagcatcaaggccacggggggtttttgggccaggtcgtgattctcccttgaactc2063
cgaatataccgagtttattatcttttgagcggatttggtgttgaactggcaggactcaaa2123
acccacccgtgggacgatcgttttcttttcctttcgctttgtgttctctgtctcctttcc2183
gtgaaatctctgcgtttcccttctggtgcttgttatagatgattctggatcgagccgtgt2243
atgctcgtgcagtggtacgacttggcgatgaacgtgcttgcggagctagtcgcagttcat2303
ctttcttttttttttccctcgtttcttttctcggcgtttcattctctacacctcttctac2363
tcgccatgcatgttcatctctctccgtgttggtcctcatttggagccgattcgaaccggg2423
cagcacagtgctttttttctgtttcgttttggaggtttccactttcgtgaaaaggaaagg2483
gtcaaatcgaatcgccccctgaaccatcctttgcagagcttttttggacgtttccgcctt2543
tcgtcagagaccatctgcactgcgcgtttctccccaactcgatcgattttgcagctttta2603
atcactttttagaaaaagtttttaatcactcgtcatcgatgtgatctcttgctctaattg2663
catcttctccgtaggattagcacttccatgcttcttgttttgtctgttcaattagccaag2723
aaacgagtcagtataccttcaagatgcatgcagatttaaaatcggcactgctctttatct2783
tgttcttgtttttgcaagttttggttggttcaaaacttatctcttctgcagcattgcctg2843
ctgtgtacagaaagttggcaggggcatcgtgcagcttttttgcctgctgtgtgtaacgtt2903
ttctttccgtacgttgcgttccgtttcacgtcgcttacctctgtttcttggggcgcaagt2963
tatggcagtacagccgttgtttccacgttggaaggacggttttgccccttcgcttccaga3023
agcttccagagatttttcgagtttttctaatgtgtttgttattgctgtaactcgttctaa3083
cgtgcaggtcccgccccaccggcctccatcgtcactgccccgccgcccccg3134
proalaproproalaserilevalthralapropropropro
125130135
gttgcttttcgccgcaagccgccggcacgtaaggctgattgattcccctt3184
valalapheargarglysproproalaarg
140145
catccactgattgttaatgcgcgtgtaatctttgtgattactaacttgctgctggatgct3244
ttgcaggcgaggcacctcccccaccgccggcggccgagaagctctccccg3294
glualaproproproproproalaalaglulysleuserpro
150155
ccgcctcagcagcacgacgactccgaccacaacaagcgcgtcggccca3342
proproglnglnhisaspaspserasphisasnlysargvalglypro
160165170175
ctcccgagaggctctcctcccccgtatgcccagtccgtcccggtcggc3390
leuproargglyserproproprotyralaglnservalprovalgly
180185190
cccgccgccgctcccccgccaccacgctccggcgcctcctcgtcgctc3438
proalaalaalaproproproproargserglyalaserserserleu
195200205
caggcgcccctcgccgccaccaccaccatcgttgccatcaccctcatc3486
glnalaproleualaalathrthrthrilevalalailethrleuile
210215220
gccgccgcccagtactgaggacacgccgccgccggcgcccgctccccag3535
alaalaalaglntyr
225
agccatgattcgttcgcagtatttttcatcctgttcttttgcttctctctctggctaccc3595
atgtatatgagtttggaagacgatgatttgatctagtagcgcgttaccaagtttgcctag3655
attcgagtagtagctgtggtactatgctgatgtctctttgatcgcgtcgtctctagagcg3715
tccgccgtttttgatcgatcactagcatggccgatgtgagtccagcatgaaaagtggtcg3775
aggagaacattgttgctaagttttttttttgctttctatctccagtagctgaacaagtat3835
gtcaactgaatgctgcaatgaagtgaatggatgcagtcttaaatttagcctttctgttgc3895
caacttcttcctctgttctgtacggttcagatgctgcttgttctgtttatgcgatggtgt3955
tgcattgttgtgatgtgtgaagtgcgcccaattctgggtgaactctgcagtattggcaag4015
ctctgatcgatacataaagaactgaaatgtgccggcttctccgcctcccgttgcatgctc4075
ttgtgcgcgagctgcacagcgcaaccgcgccctcctctgcacatccatcgacacaaagtc4135
tcaagttgttgcgcgtgtgctctaccaggcaccgtggctcctgcgggcgtgcacgggtca4195
cattcacatcgcacccaagttgcggacgtttcagctgagcacctaccatccgcaatgttt4255
gcccacagcttgctcgatgaaatgactggttcatgtcaaaaggtaaaaactgacattctc4315
acgcggtaaattcccctaagcttcatagaccaccgcactgtcatccactcgacctgccac4375
gacacccgccaccgcagaacgcgacaccctgtgcccacggccacctaccctggcacgcac4435
cgagccgaagccggataagcacccgagttgatccccatgagacgtggcgactcggctgcc4495
ctctgccac4504
<210>43
<211>684
<212>dna
<213>水稻(oryzasativa)
<400>43
atggagcgctcccacctcgccgtcctgctcggcctcctcgccttcgccgccggggtcccg60
gccgcagcggcggccaccgccgtggagggagcgcaggcggccacggcggaggcgtcgtgc120
gagccctccatcctcgccacccaggtctcgctcttctgcgcgcccgacatgcccaccgcg180
cagtgctgcgagccggtggtggcctccgtcgacctcggcggcggcgtaccctgcctctgc240
cgcgtcgccgccgagccgcagctcatcatctccggcctcaacgccacccacctcctcacg300
ctgtacgccgcctgcggaggcctccgccctggaggcgctcgcctcgccgccgcctgtgaa360
ggtcccgccccaccggcctccatcgtcactgccccgccgcccccggttgcttttcgccgc420
aagccgccggcacgcgaggcacctcccccaccgccggcggccgagaagctctccccgccg480
cctcagcagcacgacgactccgaccacaacaagcgcgtcggcccactcccgagaggctct540
cctcccccgtatgcccagtccgtcccggtcggccccgccgccgctcccccgccaccacgc600
tccggcgcctcctcgtcgctccaggcgcccctcgccgccaccaccaccatcgttgccatc660
accctcatcgccgccgcccagtac684
<210>44
<211>5291
<212>dna
<213>二穗短柄草(brachypodiumdistachyon)
<220>
<221>外显子
<222>(2069)..(2419)
<220>
<221>外显子
<222>(3818)..(3887)
<220>
<221>外显子
<222>(4026)..(4288)
<400>44
cccttaaaagggggtaatgatggctcatattgaggaattgacatgcaccccttaaaggag60
gtaatgatggctcatattgatttgaggaaactccttccataaggacatctccaacaagac120
acagtcagcggtactataaagcacggcacctggatcagttctcgtcgagggtgcagacga180
cgattgcagtgaatatgatgactatcgcggcgacgaggagggggggcagtggggacggct240
gaggtgcatcctctgccaaattaaagcacgcgcgcgtgccacgcgagtcagatcaaggac300
acgcaaaacagataacatattaacaggaagcaacgcatagatttttagaatcgagtaaaa360
gaatagcagcagcattttttttagcgaaatagtagcagcaattagatcaagcgaaatgta420
aaggttgttcacataccaacaagggcggcggtgtggggcgggacattgacctccggggcc480
tcctccagggcctgcggcgcctgctgggcctcgacaaatgcagtcaggctgcaagatatg540
agggtaaaaaaacagatgtacagtccggtcaagaaaaacaacaaacatgcagactactta600
gatctgccaagactaaattacctaacgattccaagtccagtgatggttgcatcgcgatga660
atttcagccatgctgcgtgcccgcctggttaccggacgcgcgggaaggggagcaagccca720
atcagagcgggtgcagccgggcggcgtgtgttattgcgataatactcgacggtatgcttc780
caccgcaggtacagtctcaggaaggcatccgattgacccaccagatcatctatcaccaag840
gtagccattctgccacccatctaaacacaaactgagagtaagaaagcagtttgaccgcga900
ttgtttatcacaaaaggcaacacaaaaaaactgctagcttcgtgtcagaaaatcaacatg960
catggtgcgcgacagtacaacagaaacatggggagacatagcagaaacgtccaaaccaaa1020
aatccaaaaaaagaaggagatgcactgcgtaagaaaacagcacgggaagcgctcttcacc1080
gtgtgagactgcacaagtccaagagacgacaatagcagaaaagaactgcagaaaggagag1140
ctgctttcgggggtcaaagtactagcacggcttcgatcaatcggtcgattaaatccctcg1200
tgccaccgagatcctcacagtgctcgaggggacactctaagtcggctttgtcacatccaa1260
cccaaacaacacgctcttgtctaaggtgctcaacaaaggtgatgtgttcgcacgcaggca1320
cagtggaacaacaaactagcgtcgatcgaccacgtccctcccccagaaaagtgctcccaa1380
catgatcgcatcgaagtaatcgtagagatagatcttacagaataaaaaataaacccaaac1440
caaaggaggagttctgcactactagatccgaaccaaagccaggaaatagcaaactaaaca1500
caaaagatatcgatgaaatcatacatcgtccaaacgtttcggattacaccttctggtcgc1560
aactctcgtgctcaccgcgcagacagatcttctgtacgtaccttggctccagcccgagga1620
gagcgagcactccaggaaacggcggtctcgagcgagcagtctaggaaatggcggtcgcga1680
tggaaaagccttcaagagatatcgggtgatgccccctatttctagagctctggcctttac1740
agttcaccacttcaccctgcgccatcccgattcccagtacctatgacgagcgacgaccct1800
cacgtgcctggccagcatcacgggagagaatcttgctcagcatctcaaccgcccaaacag1860
acagctgtccggtcccacccaaatggacgcacaggatcgatcgggccgccggtggcctgt1920
ccttggctaacccttcacgcctcttcgtcccctccgcctatataatcccaccccgctccg1980
cttcttcccccaccgcgctctcttcctctggactcacaccaactcgcctagccctagcgg2040
taggaagcgaaagcgagagatcccacccatggagagatcccaccacctcctc2092
metgluargserhishisleuleu
15
ctcgtgctcggcctcctcgccgcgctgctcccggcggccgcggctacc2140
leuvalleuglyleuleualaalaleuleuproalaalaalaalathr
101520
ttcgggacgacgcagccggagcctggggccccatgcgagcccaccctc2188
pheglythrthrglnprogluproglyalaprocysgluprothrleu
25303540
ctcgccacccaggtctcgctcttctgcgcgccggacatgccgaccgcg2236
leualathrglnvalserleuphecysalaproaspmetprothrala
455055
cagtgctgcgagcctgtggtggcctccgtcgacctcgggggtggcgtc2284
glncyscysgluprovalvalalaservalaspleuglyglyglyval
606570
ccctgcctctgccgtgtcgccgccgagccgcagctcgtcatggccggc2332
procysleucysargvalalaalagluproglnleuvalmetalagly
758085
ctcaacgccacccacctcctcacgctctacacctcctgcggtggactc2380
leuasnalathrhisleuleuthrleutyrthrsercysglyglyleu
9095100
cgccccggaggcgcccacctcgccgccgcctgtgaaggtacgcgacgcc2429
argproglyglyalahisleualaalaalacysglugly
105110115
tgcgtctctctctctctctgcgtctctctctgcgtctctcccatgacgagcaactcgcga2489
tacgccttactgccttattttttttgaagatatgtgtctgcttggtccactgtatttggg2549
ttcttctttcgagaagttcatccgtaggcatctataatccgacgagttcggatgagatca2609
aacagtgacacgcgcgacaccaacgttttcaacgatctcttgctgtttggtttgatattt2669
cctgcttcccatgatctattttcaaccttttttgtatggctttcgctccaatctcgtgca2729
gaaccatatttcatcttgggtttatgctgttctgtaagatctagcgccatgcagaggtca2789
tttctgctgttccagaccccctacgtgacatttgctgtttttcctctttgttgccatggc2849
cacgggttggtttttacgaaagatactttgatatgtcaagatctgcgagcactttgaaac2909
cccaacgcattttctatgtgttttgtgctgtttgatcgaccgattgatcgaggccgtgct2969
agtactttgacacccgaaagcatctctcctttctgcagtatcttttctgttcttgtcgtc3029
tcttgggcttgtgcagtttaccatggtgaagagcgcttcatacacgatctgccgcgaggc3089
cagagcaaaagcttcccgtgctttttcttgcacagtgcatctccttcttttttgcctttt3149
tcgtttggacgtttctgcttcgtctccccatgtttctgttgtactgtcgcgcaccatgca3209
tgttgattttctgatacgaagctagtactgctctgcagtttttgtgtagccttcctcttt3269
cgtgataaagaacgtggtcaaactgctctctgactctgttcgtctaaatctttttctcgc3329
aggaaaattttcgttgcagatctcctttaccctcgtcctccgcatctgtttgctttacct3389
gctgtagttgcgttcttcgtttgaatcaaattcttgtttccttcttttatcccatcgctc3449
gtttagttaccttttctttttattgaactttagttcattggtgtagtaggcagtagtatg3509
ctttgcgttgtttgcggagtagcaattgaattgctctccggtctctgcagagcggcccgc3569
tgaacagatagctggctgcagcagctttaccagaatcggtcggttacgaacttacgatta3629
tacccttcgtcttgctttcatttactggtagcctgctagtcttttcttgttgcgcacgta3689
atcgtacccagtactgtacgcttagataaaatagacgggtctggccttaaattatttcgt3749
tgcgttttcgaattttgaattccggaagttaactttattttgtgctctgtttggacgcat3809
gtgcaggtccagctcctcccgccgccgtcgtcagtgcccctcccccctcc3859
proalaproproalaalavalvalseralaproproproser
120125130
gccgcacctcgccgcaagcagccagcacgtacgaacaaccttttacac3907
alaalaproargarglysglnproala
135140
ttcgcttgatctaattgctgctgctatactctcttactcgattctaaatctatgttttgc3967
tcattattaatatgttgatctgactcgtgtggcacgcgcgcgtgctttgatttcgcag4025
acgaggcacctccgcctccgccgtcgactgagaagccgtccccgccg4072
hisglualaproproproproproserthrglulysproserpropro
145150155
cctcagcaggacaacgtcaccgcccacggcaaggcaatccccacccat4120
proglnglnaspasnvalthralahisglylysalaileprothrhis
160165170
gcggccacatccccgctcgcgccggctgcttccatgatccacatgtcc4168
alaalathrserproleualaproalaalasermetilehismetser
175180185
ccaccgcccgcatgcaatccatgctccggctccgccgcttcctcagcc4216
proproproalacysasnprocysserglyseralaalaserserala
190195200
gaggggcccctcctcatcgccgcgctcctcctcgtcatcaccgccatc4264
gluglyproleuleuilealaalaleuleuleuvalilethralaile
205210215220
atcgtcggcaccctcgacgataagtgatccaggagccgtccgccccctccgact4318
ilevalglythrleuaspasplys
225
caccaacgtccgactatgatccagttgcagtagtggtcttgttctgtttcatgtttctcg4378
ccatttggttccgagatttctatatcgtgcctagtcgtagctgtagcagtcagtatgttc4438
atgtgtccacaagatgtggtcgagtataacattgggtttcatgattcctctagcagatga4498
aacactatgtgatgtgatctgaatggatgcagttttgctaccttttctgctgctatgata4558
tgcttatccatatgtttatctttcattcccttaatttgtgcggtttagcgttgtgttgcc4618
atgaatgcctcttgctctgctttgcgggttgcattttgtcttcgttctgctgtatatttg4678
attctgaatttgcatgctgtgagtactaagtactgactacaatctctggatggttttgaa4738
atttgaatgatgttataaaggagagctagctggggaattgcctcacctctaaactccaaa4798
acacagagcagaagttggcctcaagatccaacttggtcactttgcatgtcggagcattgt4858
agcaattctgcaataaacggagtagttctgttagcatgttgtttttacactgtcagtaca4918
agtagaggtcgatgattaattatattccggttgtttgctgctggcttcccagttccctcc4978
aggtaggaaggaaccgtatccgggtagtagccagtagtagccaggaagctactagcagaa5038
cagtcttctggtgctctttttttggagtaacgtcttctcgcgatctttttcgagtaattc5098
aaatccgggtataccgagccttgtatcagtgagagccgatagtcttaattatctccagca5158
caggcacaggaacaaccacgtttgtttttcagaatgcacagcaacattttttttaagagc5218
atggcacagctactttttttttttttaaggaaacatggcacagctacatttttttttaga5278
ggaacatggcaca5291
<210>45
<211>684
<212>dna
<213>二穗短柄草(brachypodiumdistachyon)
<400>45
atggagagatcccaccacctcctcctcgtgctcggcctcctcgccgcgctgctcccggcg60
gccgcggctaccttcgggacgacgcagccggagcctggggccccatgcgagcccaccctc120
ctcgccacccaggtctcgctcttctgcgcgccggacatgccgaccgcgcagtgctgcgag180
cctgtggtggcctccgtcgacctcgggggtggcgtcccctgcctctgccgtgtcgccgcc240
gagccgcagctcgtcatggccggcctcaacgccacccacctcctcacgctctacacctcc300
tgcggtggactccgccccggaggcgcccacctcgccgccgcctgtgaaggtccagctcct360
cccgccgccgtcgtcagtgcccctcccccctccgccgcacctcgccgcaagcagccagca420
cacgaggcacctccgcctccgccgtcgactgagaagccgtccccgccgcctcagcaggac480
aacgtcaccgcccacggcaaggcaatccccacccatgcggccacatccccgctcgcgccg540
gctgcttccatgatccacatgtccccaccgcccgcatgcaatccatgctccggctccgcc600
gcttcctcagccgaggggcccctcctcatcgccgcgctcctcctcgtcatcaccgccatc660
atcgtcggcaccctcgacgataag684
<210>46
<211>951
<212>dna
<213>普通小麦(triticumaestivum)
<400>46
tcgcgcgccgaccccgcgagagaccgtggtccgtccagtcgcagtagagtagagcgctcg60
tcgtctcgttccgtttcgtgcctgtcgccgttcgaggttcgtttctgcgtgcagtccggt120
cgaagaagccggtgggttttgagtactagtggtagtagtagcagcagctatcgtttctgt180
ccgctcgtacgtgtttgcgtggtcgcggagaacaattaattgggtgtttgcgagtcctct240
ggttaagatgaaccactgatgctatgtgatcgatcgatcggtatgatctgaatggaaatg300
gatcaagttttgcgttctgctgatgatgtgatccatttggatctgtgtggggcaacagtt360
tcgcttgcttttgctctgcgatgaacgaatgcttcttgcatgcatcttgtctttgcttaa420
tttgaactgtagaacggatgcagtactgatttctgcttatgatgtgacgattcgtcgtac480
gcatatcatctcttcaaatttgtgtagcagctgtttgtagcttccattctgctatggacg540
aatgcctgtttttcacggagaaccgcgcgcggggaccgatgcggctttgtgttgccatgt600
tgttttccacgccaggacaaaatagatggtgcggttttgatccccaatcccaccatcacc660
atgttccggagagccacatggaactcacgtcaagcggtcactttttgcagaatcactctt720
accattttacccttttgttgaaacctctctcctcatccccaaaagttgatgcaacagtgc780
tatgcgcgcccacccatgctttttcatatgattgtaaaatttggatcgattttatctttt840
gaaccctaagtccggtttacaatctgtttgcatgtttatgttccttgcggcgaggaccat900
taaacaagactactattggatatatttcgacaggctttgaaatccgaattc951
<210>47
<211>1000
<212>dna
<213>多棱大麦(hordeumvulgare)
<400>47
tggccgacccccaaggcagcagagtacttgtcatctgattccgtttcatgcttgtcgccg60
tttgttgaggttcgtttctgcagtccgaacaagacggtggggttttgatcgggtacccag120
atttctatgtcgatcgcgcgtactagtactagtagttgcttagcagatgaacgaacattg180
ggttttgggattcctctagctgatgaaccactgctattttccatgtgatcgatggatatg240
atctgaatggatggatgaagttttggtttctgatgctgatgatgtgctgcttcttcattt300
gcatgctcgatctattccttcaattttgtggagcaacagtttgtttagcttctgttctgc360
tatgaataatgccgcttgcatcttgtcattgctgataatctgcttaatgcagacattgct420
tccgtcccaaacaatctgttgcttaccaggtaatgcatataatctgtacctcaccttcgc480
acaacaacagaagctaccctgctaaaaaaacacacacacacacacaaaaaaaacagaagc540
tggtctcacacggaagccgcttcggggactgtttgcagctttttattgccattttgtttt600
tcatgcaggtacaaatcgagggtgttgcttgatttgatcatggatgatcacttagagcaa660
catgtgtgttttgtctgtgttttattcgttgctcgtccatccaatttaaacttgaaatgg720
atcgtgtgtggataaaagaagacgtgcgtcagtttgaatcgacgcgttgggttatatttt780
gtgtctgtgacgaccgaaacgaagacaaaatatatcgtccggttagaattgctctaatgc840
tagctttctctcctaccatcgcattccgtggtaggaaaaagtactagaaccacaggaaac900
tggaacgcaagaaaagcatatctaccgttggccgttgatcttgtttcacattcggtatgg960
ctccggtcatattgttggagattcacattcatgcacgcaa1000
<210>48
<211>54
<212>dna
<213>普通小麦(triticumaestivum)
<400>48
cctgcgaaggtacgttgtagccccccgcccccgcgcccagtgctgcgagcccgt54
<210>49
<211>54
<212>dna
<213>普通小麦(triticumaestivum)
<400>49
cctgcgaagatacgttgtagccccccgcccccgcgcccagtgctgcgagcccgt54
<210>50
<211>53
<212>dna
<213>普通小麦(triticumaestivum)
<400>50
cctgcgaaggtacgttgtagccccccaccccgcgcccagtgctgcgagcccgt53
<210>51
<211>54
<212>dna
<213>普通小麦(triticumaestivum)
<400>51
cctgcgaaggtacgttgtagccccccgcccccgcgcccagtgctacgagcccgt54