选择性控制基因表达的植物调节序列的制作方法

文档序号：3563469阅读：831来源：国知局

专利名称：选择性控制基因表达的植物调节序列的制作方法
技术领域：
本发明涉及控制植物中基因表达的核酸分子的分离和用途，特别是新型植物启动子。本发明要求1999年9月1日提交的美国临时申请60/151,892的优先权，在此引入其完整内容作为参考。
背景技术：
植物基因工程的目标之一是产生具有农业上重要的特征或性状的植物。基因工程最近的发展为将植物转化为包含并表达外来基因提供了必备的工具(Kahl et al.(1995)World Journal of Microbiology andBiotechnology 11449-460)。植物基因工程特别需要的性状或感兴趣的特性应该包括，但不限于抗昆虫和其它害虫及致病剂、耐受除草剂、增加的稳定性、产量或储存期、环境耐受和营养增强。植物转化和再生技术的发展使研究者可以从异源来源或修饰为有不同的或改进的特性的原生来源取出DNA片段，如基因，并将外源性DNA整合进植物基因组。然后基因可以在植物细胞中表达，显示添加的特征或性状。在一种方法中，正常情况下在特定植物或植物组织不表达的新型基因的表达可以赋予需要的表型效果。在另一种方法中，以反义方向进行的基因或基因一部分的转录可以通过防止或抑制内源性基因的表达产生需要的作用。
分离植物启动子对通过基因工程修饰植物而产生需要的表型特征是有用的。为产生这样的转基因植物，将包括在植物中表达时赋予需要表型的异源基因序列的载体引入植物细胞。此载体也包括可操作连接到异源基因序列的植物启动子，通常启动子在正常情况下与异源基因不相关联。然后将载体引入植物细胞而产生转化的植物细胞，并将转化植物细胞再生到转基因植物内。启动子控制引入的与启动子可操作连接的DNA序列的表达并因此影响DNA序列赋予的所需特征。
由于启动子是在基因的总体表达中不可或缺的5’调节元件，具有多种启动子而适应基因表达使得基因在植物生长和发育过程中的恰当时间、在植物的最佳位置和以产生所需效果的必要量有效转录是有利的。例如，在一种情况下，基因产物的组成型表达在植物的一个位置可能是有益的，而在植物的另一个部分可能无益。在其它情况下，使基因产物在植物的某个发育阶段或应答于某种环境或化学刺激而产生是有益的。遗传改进种质的商业发展也已经进展到将多种性状引入农作物，也称作基因堆积法。在这种方法中，赋予不同感兴趣特征的多种基因可以被引入植物。当把多种基因引入植物时，重要的是每种植物被调节或控制进行最优表达以及调节元件为多样的，从而减少可以由同源序列重组导致的潜在基因沉默。根据这些和其它考虑，很明显的是，基因表达的最优控制和调节元件多样性在植物生物技术中是很重要的。
适当的调节序列必需出现在感兴趣的DNA序列的适当位置，使新插入的DNA转录并且如果需要，可以在植物细胞中翻译为蛋白质。这些调节序列包括但不限于启动子，5’非翻译前导序列和3’端聚腺苷酸化序列。选择转录这种外来DNA的组织的能力和获得这种外来DNA转录的植物生长时间的能力通过选择控制这些基因转录的适当启动子序列而成为可能。
许多不同类型的启动子可以用于植物基因工程。启动子可以根据范围或组织特异性分类。例如，被称作组成型启动子的启动子可以有效转录操作连接的DNA序列并在多种组织中表达该DNA序列。组织增强型或组织特异性启动子可以在DNA序列上游并与其操作连接，这些DNA序列正常情况下以高水平在某些植物组织或特异性在某些植物组织中转录。其它启动子类型包括，但不限于诱导型启动子，它可以被外部刺激如化学试剂、发育刺激或环境刺激触发。这样，所需不同类型的启动子可以通过分离以组成、组织增强或可诱导的方式转录和表达的DNA序列上游5’端调节区而获得。
高流通量测序和生物信息学的技术发展为启动子发现提供了额外的分子工具。可以将处在特定发育阶段，或在特定化学、环境或生理状况下的特定靶植物细胞、组织或器官作为来源物质而分离mRNA和构建cDNA文库。迅速测序cDNA文库并电子分类表达序列。使用序列分析软件，可以在短时间内分析成千上万的序列，并且可以对比所选cDNA文库中的序列。实验室和基于计算机的扣除法的结合允许研究者扫描和对比cDNA文库并识别有所需表达形态的序列。例如，可以通过对比一种组织的cDNA文库与其它组织的cDNA文库并电子“扣除”共同序列从而找到只在感兴趣的靶组织中表达的序列而识别优先在一种组织中表达的序列。然后组织增强序列可以用于探针和引物而克隆对应的全长cDNA。然后靶植物的基因组文库可以用于分离对应基因和相关调节元件，包括启动子序列。
可以通过选择性对比cDNA靶胚发生或愈伤组织文库与非靶或本底cDNA文库如叶和根组织文库而找到与靶文库中的被表达序列相关的5’调节区，从而分离赋予所需表达形态的多种启动子序列如胚发生或愈伤组织增强或特异性启动子。分离的启动子序列可以在基因堆积法中用于选择性调节任何操作连接基因的表达并在植物表达载体中提供额外的调节元件多样性。
发明概述本发明提供了包含位于植物DNA结构编码序列5’端上游的调节序列的核酸序列，这些序列在胚发生或愈伤组织中转录，如SEQ IN NOS36-51所示。
一方面，本方面提供了包含选自SEQ ID NOS36-51或此序列的任何片段、区域或顺式元件的可以调节可操作连接的DNA序列的转录的核酸序列。
本发明也提供了包含选自启动子序列SEQ ID NOS36-51之一的序列的核酸序列。
本发明的另一方面涉及公开的5’启动子序列的至少一种顺式元件，或片段或区域的用途，它们可以结合起来建立新型启动子或应用于与另一种异源调节序列的新颖结合而建立可以调节可操作连接的DNA序列的转录的嵌合启动子。
所以，本发明涉及公开于SEQ ID NOS36-51，或当与DNA序列可操作连接时可以调节DNA序列转录的该公开序列的任何片段、区域或顺式元件的用途。所以，本发明不仅包括公开于SEQ ID NOS36-51的序列，也包括可以作为启动子独立行使功能的其任何截短或缺失衍生物，或其片段或区域，包括当可操作连接到可转录序列时可以与一种或更多调节序列结合作为调节序列行使功能的顺式元件。
因此本发明包括含公开于SEQ ID NOS36-51的核酸序列的新型启动子，或嵌合或杂合启动子。嵌合或杂合启动子可以由与其它任何有转录活性的最小或全长启动子结合的公开序列SEQ ID NOS36-51的任何长度的片段、区域或顺式元件组成。例如，选自SEQ ID NOS36-51的启动子序列可以与CaMV 35S或其它启动子结合而构建新型启动子。最小启动子也可以与本发明的核酸序列结合使用。新型启动子也可以包含任何由以足够转录可操作连接的DNA序列的方式制造公开于SEQ IDNOS36-51的序列或公开序列的任何片段、区域或顺式元件而构建的启动子。
本发明的另一方面涉及启动子序列SEQ ID NOS36-51，或其片段、区域或顺式元件调节胚发生或愈伤组织中可操作连接的可转录序列的能力。在某些组织能够调节可操作连接的SEQ ID NOS36-51的片段、区域或顺式元件可以从核酸序列SEQ ID NOS36-51分离出来并用于制造赋予可操作连接DNA序列胚发生增强或愈伤组织增强表达或与其它异源调节序列结合的新型启动子。
本发明也包括含SEQ ID NOS36-51所表示的公开序列或其任何片段、区域或顺式元件的DNA构建体，包括用公开序列或公开序列的片段、区域或顺式元件产生的新型启动子。
本发明也包括任何含公开于SEQ ID NOS36-51所表示的DNA或其任何片段、区域或顺式元件的细胞和转基因植物。
本发明也提供了一种调节DNA序列转录的方法，包括将DNA序列可操作连接到任何包含选自SEQ ID NOS36-51的序列的所有或任何片段、区域或顺式元件。
本发明的另一种实施方案提供了一种通过可操作连接选自SEQ IDNOS36-51的序列，或公开序列的任何片段、区域或顺式元件到可转录DNA序列而赋予胚发生或愈伤组织增强或特异性表达的方法。以SEQID NOS36-51表示的，赋予可操作连接的DNA序列在胚发生或愈伤组织增强表达的公开启动子的片段、区域或顺式元件可以被工程改造并独立用于包括多聚体，或截短的衍生物的新组合，并且新型启动子可以与可转录DNA序列可操作连接。可以赋予可操作连接的DNA序列在胚发生或愈伤组织中增强表达的公开序列的公开片段、区域或顺式元件可以与包括最小启动子的异源启动子结合而建立新型启动子或杂合启动子。
本发明也提供了一种通过将含(i)包含含有选自SEQ ID NOS36-51，或其片段、区域或顺式元件的序列并操作连接到启动子的核酸的启动子，(ii)可转录DNA序列和(iii)3’非转录区的DNA构建体引入植物细胞中产生转基因植物的方法。
本发明也提供了一种从感兴趣的靶植物分离所需表达图谱的至少一个5’调节序列的方法，包含通过评价源于由感兴趣的植物细胞类型制备的至少一种cDNA文库的ESTs核酸序列集合，比较至少一种靶植物cDNA文库的EST序列和至少一种不同植物细胞类型中的非靶cDNA文库的ESTs，扣除在靶和非靶文库中共同的EST序列，从扣除后剩余的代表靶表达序列的ESTs设计基因特异性引物，并分离至少一种对应的5’侧翼和调节序列，它包括用基因特异性引物从靶植物制备的基因组文库中得到的至少一种启动子序列。
从下面的发明详述和附图将更明显得到本发明前面的内容和其它方面。
附图简述

图1是pMON19469的质粒2是pMON39721的质粒3是pMON51002的质粒4是pMON51008的质粒5是pMON51001的质粒6是pMON51009的质粒7是pMON51003的质粒8是pMON51010的质粒图质粒pMON19469是由下列基因成分组成的表达载体P-CaMV.35S是CaMV的35S RNA的启动子，含有-90到-300区的一个串联重复(美国专利No.5,322,938，在此引入其完整内容作为参考)；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；ori-M13和ori-pUC为复制起点；AMP为氨苄青霉素选择的编码区。
质粒pMON39721为双边(右(RB)和左(LB)T-DNA边)植物转化载体，由下列基因成分组成P-CaMV.35S是CaMV 35S启动子(美国专利No.5,352,605，在此引入其完整内容作为参考)；AGRTU.npt II为根癌土壤杆菌的编码序列，赋予卡那霉素抗生素的耐药性；T-AGRTU.nos为从根癌土壤杆菌分离的胭脂碱合成酶基因的3’终止序列；ori322和oriV为复制起点，aad为赋予放线菌素和链霉素抗生素耐药性的编码序列。
质粒pMON51002为下列基因成分组成的表达载体ZM-70025861是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；ori-M13和ori-pUC为复制起点；AMP为氨苄青霉素选择的编码区。
质粒pMON51008为双边，右(RB)和左(LB)T-DNA边，植物转化载体，由下列基因成分组成ZM-70025861是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；P-CaMV.35S是CaMV35S启动子(美国专利No.5,352,605，在此引入其完整内容作为参考)；AGRTU.npt II为根癌土壤杆菌的编码序列，赋予卡那霉素抗生素的耐药性；T-AGRTU.nos为从根癌土壤杆菌分离的胭脂碱合成酶基因的3’终止序列；ori322和oriV为复制起点，aad为赋予放线菌素和链霉素抗生素耐药性的编码序列。
质粒pMON51001为下列基因成分组成的表达载体ZM-700267629是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；ori-M13和ori-pUC为复制起点；AMP为氨苄青霉素选择的编码区。
质粒pMON51009为双边，右(RB)和左(LB)T-DNA边，的植物转化载体，由下列基因成分组成ZM-700267629是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；P-CaMV.35S是CaMV 35S启动子(美国专利No.5,352,605，在此引入其完整内容作为参考)；AGRTU.npt II为根癌土壤杆菌的编码序列，赋予卡那霉素抗生素的耐药性；T-AGRTU.nos为从根癌土壤杆菌分离的胭脂碱合成酶基因的3’终止序列；ori322和oriV为复制起点，aad为赋予放线菌素和链霉素抗生素耐药性的编码序列。
质粒pMON51001为下列基因成分组成的表达载体ZM-700263624是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；ori-M13和ori-pUC为复制起点；AMP为氨苄青霉素选择的编码区。
质粒pMON51009为双边，右(RB)和左(LB)T-DNA边，的植物转化载体，由下列基因成分组成ZM-700263624是从玉米胚基因组文库中分离的进行胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；P-CaMV.35S是CaMV 35S启动子(美国专利No.5,352,605，在此引入其完整内容作为参考)；AGRTU.npt II为根癌土壤杆菌的编码序列，赋予卡那霉素抗生素的耐药性；T-AGRTU.nos为从根癌土壤杆菌分离的胭脂碱合成酶基因的3’终止序列；ori322和oriV为复制起点，aad为赋予放线菌素和链霉素抗生素耐药性的编码序列。
发明详述本申请要求99年9月1日提交的美国临时申请60/151,892的权益。
感兴趣的基因(GOI)赋予除草剂或抗生素耐受，例如，杀昆虫蛋白基因，抗疾病基因，影响植物生长、代谢或发育、产油或修饰油的基因和编码药物蛋白的基因，被考虑为本发明的各方面。这里公开的组合物和方法可以用于任何可以通过植物生物技术方法进行遗传修饰的植物。这里描述的组合物和方法描述对植物胚和植物种子中转基因产物的表达有用的DNA序列。
为在本发明实施过程更好地定义本发明和指导本领域的普通技术人员，提供了下列定义和方法。除非有其它注解，应根据相关领域中普通技术人员的常规用法理解各名词。使用了阐述于37 CFR§1.882的DNA碱基命名。使用了氨基酸残基的标准1和3字母命名。
“核酸(序列)”或“多核苷酸(序列)”是指基因组或合成来源的单链或双链DNA或RNA，即分别为脱氧核糖核苷酸或核糖核苷酸碱基的聚合物，从5’(上游)端到3’(下游)端。核酸可以表示有意义或互补(反义)链。
“天然的”是指天然存在的(“野生型”)核酸序列。
“异源性”序列是指从外部来源或物种起源的序列，如果来自于相同来源，其原始形式经过了修饰。
“分离的”核酸序列基本与在核酸天然存在的生物细胞中与其正常相关的其它核酸序列即其它染色体或染色体外DNA分开或从中被纯化出来。此名词包含了生化上被纯化，因而基本去掉污染核酸和其它细胞成分的核酸。此名词也包括了重组核酸和化学合成核酸。
这里使用的名词“基本纯化的”是指基本与在其天然状态下与其正常相关的其它分子分离的分子。更优选地，基本纯化的分子是在制剂中的主要种类。基本纯化的分子可以是大于60％，优选70％，更优选90％从其它存在于天然混合物中的分子(除溶剂)分离开。名词“基本纯化的”不准备包括以天然状态存在的分子。
如果第一个核酸序列显示“基本等同”于一个参照核酸序列，当与另一条核酸(或其互补链)进行最优对比(有适当核苷酸插入或缺失，在比较窗中总共小于20％)时，在至少20个核苷酸位置，优选至少50个核苷酸位置，更优选至少100个核苷酸位置，最优选在第一个核酸的全长的比较窗中有至少约75％的核苷酸序列等同性，优选至少约80％的等同性，更优选至少约85％的等同性，最优选约90％的等同性。可以通过Smith and Waterman局部同源性算法，Adv.Appl.Math.2482,1981；通过Needleman and Wunsch同源性算法，J.Mol.Biol.48443，1970；通过Pearson and Lipman相似性搜索法，Proc.Natl.Acad.Sci.USA 852444，1988；优选通过这些算法的计算机实现(GAP，BBSTFIT，FASTA，and TFASTA in the Wisconsin Genetics SoftwarePackage Release 7.0，Genetics Computer Group，575 Science Dr.，Madison，WI.)进行对比比较窗的序列最优对比。参照核苷酸可以是全长分子或更长分子的一部分。另外，如果一个核酸与另一个核酸在下面定义的严格条件下杂交，那么两个核酸具有基本等同性。
当序列排列为第一个核酸序列影响第二个核酸序列的功能时，第一个核酸序列与第二个核酸序列“可操作连接”。优选地，这两个序列是单个连续核酸序列的一部分并优选邻近。例如，如果启动子调节或介导细胞中基因的转录，启动子可操作连接于此基因。
“重组”核酸由两个分开的序列片段的人工结合，如通过化学合成或通过用基因工程技术操作核酸的分离片段而产生。核酸操作的技术是熟知的(见如Sambrook et al.，1989，和Ausubel et al.，1992)。核酸的化学合成方法讨论于，例如，Beaucage and Carruthers，Tetra.Letts.221859-1862，1981，和Matteucci et al.，JAm.Chem.Soc.1033185，1981。核酸的化学合成可以用例如可以买到的自动寡核苷酸合成器进行。
为在特定宿主细胞中增强表达和克隆到适当载体中的目的，可以设计并化学合成“合成的核酸序列”。宿主细胞通常显示优选的密码子使用模式(Murray et al.，1989)。设计为在特定宿主细胞中增强表达的合成DNA因此应该反映宿主细胞中的密码子使用模式。可以用于这些目的的计算机程序包括但不限于序列分析软件包的“BestFit”或“Gap”程序，Genetics Computer，Inc.University of Wisconsin BiotechnologyCenter，Madison，WI 53711。
核酸“扩增”或“核酸复制”是指生成核酸序列的额外拷贝并用聚合酶链式反应(PCR)技术执行。许多扩增方法是本领域中公知的，描述于美国专利4,683,195和4,683,202及描述于PCR方案A Guide toMethods and Applications，ed.Innis et al.，Academic Press，San Diego，1990。在PCR中，引物是指序列确定的短寡聚核苷酸，与DNA模板退火以起始聚合酶链式反应。
“转化的”、“转染的”或“转基因的”是指引入了外来核酸，如重组载体的细胞、组织、器官或生物体。优选地，引入的核酸被整合到接受细胞、组织、器官或生物体的基因组DNA中，使得引入的核酸由以后的后代遗传。“转基因的”或“转化”的细胞或生物体也包括由在杂交中使用这种“转基因”植物作为亲代的杂交程序产生并表现出由于重组结构或载体存在导致的改变表型的细胞或生物体或后代的后代。
名词“基因”是指编码肽、多肽、蛋白质或RNA分子的染色体DNA、质粒DNA、cDNA、合成DNA、或其它DNA，和参与表达调节的编码序列侧翼区。一些基因可以被转录为mRNA并翻译为多肽(结构基因)；其它基因可以被转录为RNA(如rRNA，tRNA)；另外一些类型的基因作为表达的调节物(调节物基因)。
基因的“表达”是指基因的转录而产生对应的mRNA及此mRNA的翻译而产生对应的基因产物，即肽、多肽或蛋白质。基因表达由包括5’调节元件如启动子的调节元件控制或调节。
“基因成分”是指也可以作为表达载体的成分或部分的任何核酸序列或基因元件。基因成分的例子包括，但不限于启动子区、5’非翻译先导序列、内含子、基因、3’非翻译区和其它调节序列或影响一种或更多核酸序列转录或翻译的序列。
名词“重组DNA构建体”、“重组载体”、“表达载体”或“表达盒”是指来自于任何来源、可以进行基因组整合或自主复制的任何介质如质粒、粘粒、病毒、BAC(细菌人工染色体)、自主复制序列、噬菌体或线性或环形单链或双链DNA或RNA核苷酸序列，包含一个或更多DNA序列以功能操作方式连接的DNA分子。
“互补的”是指核酸序列通过碱基配对(A-G-T与互补序列T-C-A配对)天然相关。如果只有一些核酸对是互补的，两个单链分子间的互补性可以是部分的；如果所有碱基对是互补的，互补性是完全的。互补性的程度影响杂交和扩增反应的效率和强度。
“同源性”是指分别以核苷酸或氨基酸位置等同性百分比表示的核酸或氨基酸序列间的相似性水平，即序列的相似性或等同性。同源性也指不同核酸或蛋白质之间相似的功能特性的概念。
“ESTs”或表达序列标记是从cDNA(或互补DNA)文库中随机选择的代表随机选择克隆的cDNA插入物的短序列(McCombie，et al.，Nature Genetics，1124，1992；Kurata，et al.，Nature Genetics，8365,1994；Okubo，et al.，Nature Genetics，2173，1992)。
名词“电子Northern”是指一种基于计算机的序列分析，它允许多个cDNA文库中的序列以研究者指定的参数包括多个cDNA文库的EST群或专门由一种或多种文库的结合建立的EST的丰度进行电子对比。
“Subsetting”是指一种对比不同或多种来源的核酸序列的方法，可以用于估计反应在特定组织、特定时间或在特定条件下的基因转录活性和信息稳定性的核酸序列的表达图谱。
“启动子”是指基因中位于开放读框(或蛋白编码区)翻译起始密码子上游或5’的核酸序列，它参与识别和结合RNA聚合酶II和其它蛋白而起始转录。“植物启动子”是一种在植物细胞中起作用的天然或非天然启动子。组成型启动子在植物发育中的大多数或所有植物组织中起作用。组织、器官或细胞特异性启动子分别只在或主要在特定组织、器官或细胞类型中表达。除了在某些组织、器官或细胞类型中“特异性”表达，与植物其它部分相比，启动子可以在植物一部分表现出“增强的”表达，即高水平表达。时间调节的启动子仅仅或主要在植物发育中的某些时间段或在一天中的某些时间起作用，例如，与昼夜节律相关的基因。诱导型启动子应答于内源性或外源性刺激，例如化学化合物(化学诱导剂)或应答于环境、激素、化学和/或发育信号而选择性表达可操作连接的DNA序列。诱导或调节型启动子包括，例如，由光、热、压力、洪水或干旱、植物激素、创伤、或化学物质如乙醇、茉莉酮酸酯、水杨酸或安全剂调节的启动子。
植物启动子可以用作调节特定基因表达的5’调节序列。一种优选的启动子将是植物RNA聚合酶II启动子。与其它高等真核生物的启动子相似，植物RNA聚合酶II启动子具有复杂的结构并由一些不同的元件组成。这种元件之一是TATA盒或Goldberg-Hogness盒，是正确体外表达真核基因并准确、有效起始体内转录所需要的。TATA盒一般位于约-25到-35，即位于确定为+1位置的转录起始位点或帽位点上游(5’)25到35碱基对(bp)的位置。(Breathnach and Chambon，Ann.Rev.Biochem.50349-383，1981；Messing et al.，InGenetic Engineering ofPlants，Kosuge et al.，eds.，pp.21 1-227，1983)。另一种常见的元件，CCAAT盒，位于-70和-100bp之间。在植物中，CCAAT盒可以与哺乳动物启动子的功能相似物序列有不同的共有序列(植物相似物曾命名为“AGGA盒”，使其区分于动物相似物；Messing et al.，InGeneticEngineering of Plants，Kosuge et al.，eds.，pp.211-227，1983)。另外，几乎所有启动子都包括附加的上游激活序列或增强子(Benoist and Chambon，nature 290304-310，1981；Gruss et al.，Proc.Nat.Acad.Sci.USA78943-947，1981；及Khoury and Gruss，Cell 27313-314，1983)，从约-100bp伸展到-1,000bp或在转录起始位点的更上游。
当与异源DNA序列融合时，这种启动子一般使融合序列以与启动子天然相关的基因序列的转录方式相似的方式转录。包括调节序列的启动子片段可以添加到(例如，与5’端融合，或插入)有自己的部分或完整的调节序列的活性的启动子(Fluhr et al.，Science 2321106-1112，1986；Ellis et al.，EMBO J.611-16，1987；Strittmatter and Chua，Proc.Nat.Acad.Sci.USA 848986-8990，1987；Poulsen and Chua，Mol.Gen.Genet.21416-23，1988；Comal Ct al.，Plant Mol.Biol.15373-381，1991)。另外，异源调节序列可以添加到无活性、截短的启动子如仅包括核心TATA和有时包括CCAAT元件的启动子的5’上游区(Flukir et al.，Science2321106-1112，1986；Strittmatter and Chua，Proc.Nat.Acad.Sci.USA848986-8990，1987；Aryan et al.，Mol.Gen.Genet.22565-71，1991)。
启动子一般由多种不同的“顺式作用转录调节元件”，或简称为“顺式元件”组成，每种可以赋予基因表达总体控制的不同方面(Stritttnatterand Chua，Proc.Nat.Acad.Sci.USA 8439g6-g990，1987；Ellis et al.，EMBO J.611-16，1987；Benfey et al.，EMBO J.91677-1684，1990)。“顺式元件”与调节转录的反式作用蛋白因子结合。一些顺式元件与一个以上的因子结合，反式转录因子可以以不同的亲和性与一个以上顺式元件相互作用(Johnson and McKnight，Ann.Rev.Biocliem.58799-839，1989)。对应于顺式元件的植物转录因子及它们的相互作用的分析讨论于，例如Martin，Curr.Opinions Biotech.7130-138，1996；Murai，InMethods in Plant Biochemistry and Molecular Biology，Dashek，ed.，CRCPress，1997，pp.397422；and Methods in Plant Molecular Biology，Maligaet al.，eds.，Cold Spring Harbor Press，1995，pp.233-300。本发明的启动子可以包含可以调节基因表达的“顺式元件”。
可以用许多技术，包括缺失分析即从启动子5’端或内部去除一个或更多核苷酸；使用DNA酶I印迹的DNA结合蛋白分析，甲基化干扰分析、电泳迁移率变异分析、通过连接介导PCR进行的体内基因组印迹及其它常规分析法；或通过常规序列比较法得到与已知顺式元件基序的相似性来鉴定顺式元件。可以通过诱变(或替换)一个或更多核苷酸或通过其它常规方法进一步研究顺式元件的适当结构。见，如，Method inPlant Biochemistry and Molecular Biology，Dashek，ed.，CRC Press，1997，pp.397-422；和Methods in Plant Molecular Biology，Maliga et al.，eds.，Cold Spring Harbor Press，1995，pp.233-300。
顺式元件可以通过化学合成或通过从包括这些元件的启动子克隆，它们可以用包含有用的限制性内切酶位点的额外的侧翼序列合成而促进后续操作。在一种实施方案中，启动子由多种不同的“顺式作用转录调节元件”或简称为“顺式元件”组成，每一个可以调节基因表达总体控制中的不同方面(Strittmatter and Chua，Proc.Nat.Acad.Sci.USA848986-8990，1987；Ellis et al.，EMBO J.611-16，1987；Benfey et al.，EMBO J.91677-1684，1990)。例如，顺式元件区或35S启动子的片段的结合可以表现出组织特异性表达模式(见美国专利5,097,025，在此引入其完整内容作为参考)。在一种实施方案中，可以用设计为通过比较已知顺式元件而特异性识别顺式元件、结构域或基序或可以用于对比多个5’调节序列而识别新型顺式元件的计算机程序识别包含SEQ IDNOS36-51的核酸序列中的“顺式元件”的序列区。
本发明包括SEQ ID Nos36-51的顺式元件或已知影响基因调节，表现出与本发明的核酸序列的同源性的顺式元件同系物。许多这种元件是文献中已知的，如由许多因子如光、热或应激调节的元件，由病原体或化学物质调节或诱导的元件等。这些元件可以正或负调节基因表达，这取决于条件。顺式元件的例子可以包括但不限于氧反应元件(Cowen etal.，3.Biol.Chem.268(36)26904，1993)，光调节元件(见例如，Bruceand Quajil，Plant Cell 2(11)1081.1990，及Bruce et al.，EMBO J.103015，1991)，应答于茉莉酮酸甲酯处理的顺式元件(Beaudoin andRothstein，Plant Mol.Biol.33835，1997)，水杨酸反应元件(Strange et al.，Plant 3.111315，1997)，热休克反应元件(Pelham et al.，Trends Genet131，1985)，应答于创伤和应激的元件(Loace et al.，Proc.Nati.Acad.Sci.U.S.A.899230，1992；Mhiri et al.，Plant Mol.Biol.33257，1997)，低温元件(Baker et al.，Plant Mol.Biol.24701，1994；Jiang et al.，Plant Mol.Biol.30679，1996；Nordin et al.，Plant Mol.Biol.21641，1993；Zhou etal.，3.Biol.Chem.26723515，1992)，和干旱反应元件(Yamaguchi et al.，Plant Cell 6251-264，1994；Wang et al.，Plant Mol.Biol.28605，1995；Bray E.A.Trends in Plant Science 248，1997)。
所以本发明包括公开核酸分子的区域、结构域、片段或“顺式元件”，并且核酸片段可以包括公开序列的任何连续区域。以SEQ IDNos36-51表示的本发明的启动子区域可以包含一个或更多包括但不限于“顺式元件”或可以调节植物种子和植物种子组织中可操作连接的DNA序列的转录的调节元件。植物种子组织包括由胚细胞和胚组织如盾片、胚乳、aluerone、和种皮组成的胚。
植物启动子可以包括通过操作已知启动子而产生合成、嵌合或杂合的启动子。这种启动子可以结合来自一个或更多启动子的顺式元件，例如，通过添加一个异源调节序列到有自己的部分或完全的调节序列的活性启动子(Ellis et al.，EMBO J.611-16，1987；Strittmatter and Chua，Proc.Nat.Acad.Sci.USA 848986-8990，1987；Poulsen and Chua，Mol.Gen.Genet.21416-23，1988；Comai et al.，Plant.Mol.Biol.15373-381，1991)。通过添加异源性调节序列到无活性的、截短的启动子，即仅包括核心TATA和选用CCAAT元件的5’上游区可以产生嵌合启动子(Fluhr et al.，Science 2321106-1112，1986；Strittrnatter and Chua，Proc.Nat.Acad.Sci.USA 848986-8990，1987；Aryan et al.，Mol.Gen.Genet.22565-71，1991)。所以包含至少一种调节可操作连接的核酸序列表达的SEQ ID Nos36-51的顺式元件的嵌合或杂合启动子的设计、构建和用途包括在本发明的范围中。
SEQ ID Nos36-51的启动子序列、片段、区域或顺式元件可以在胚发生或愈伤组织中转录DNA序列并因此可以选择性调节这些组织中的基因表达。优选在胚发生或愈伤组织中调节基因表达的启动子序列在转化和选择性表达母体组织基因中有用。例如，愈伤组织增强的或胚增强的启动子可以可操作连接到可测量(scorable)标记如GUS或GFP。当这些分别为编码葡糖醛酸糖苷酶和绿色荧光蛋白的报道基因与本发明的5’调节序列可操作连接时，可以提供胚发生组织的转化潜能的指示和为最优化转化和再生参数提供指示。本发明的5’调节序列也可用于选择性转录任何基因或感兴趣的基因，包括，但不限于那些增强种子质量性状的基因。
包括分子和生物信息技术的基因组学的出现，产生了对来自于大量目标，包括但不限于农业上重要的植物种的大量DNA样品的迅速测序和分析。为从cDNA序列数据库或集合中识别本发明的核酸序列，第一步包括从感兴趣的植物组织目标中构建cDNA文库。简言之，首先从那些在特定发育阶段或在特定环境条件下收获的组织建立cDNA文库。通过识别在不同发育阶段或不同条件下在植物组织中不同表达的基因，可以识别并分离那些基因的对应调节序列。转录成像使以从cDNA文库中得到的核苷酸序列的特异性成像为基础的对组织优选序列的识别成为可能。这里使用的转录成像是表示比较在一个或更多文库中表达的基因丰度的分析。包含在cDNA文库中的克隆被测序，与此序列比较的序列来自于公共数据库。基于计算机的方法允许研究者提供查询序列，它从多个文库中比较序列。与本领域中的技术人员公知的常规杂交扣除方法相比，此方法使迅速识别感兴趣的克隆成为可能。
使用常规的方法学，可以用聚dT引物和反转录酶从某种组织或生物体的mRNA(信使RNA)构建cDNA文库(Efstmtiadis，et al.，Cell 7279，1976；Higuchi，et al.，Proc.Nati.Acad.Sci.U.S.A.)733146，1976；Maniatis，et al.，Cell 8163，1976；Land et al.，Nucleic Acids Res.92251，1981；Okayama，et al.，Mol.Cell.Biol.2161，1982；Gubler，et al.，Gene25263，1983)。
可以使用一些方法获得全长cDNA构建体。例如，可以用末端转移酶将dC残基的同聚物尾添加到游离的3’羟基基团(Land，et al.，NucleicAcids Res.92251，1981)。这个尾然后可以与作为全长的第二条cDNA链的合成引物的寡聚dG杂交。Okayama和Berg报道了一种获得全长cDNA构建体的方法。此方法通过使用合成的引物-连接物而简化，合成的引物-连接物具有引发第一和第二条合成和克隆到质粒(Coleclough，et al.，Gene 34305，1985)和噬菌体载体(Krawinkel，et al.，Nucleic Acids Res.141913，1986；and Han，et al.，Nucleic Acids Res.156304，1987)的限制性位点的聚合物尾。
这些策略可以配合其它分离稀少mRNA群的策略。例如，典型的哺乳动物细胞包含10,000-20,000个不同的mRNA序列。Davidson，GeneActivity in Early Development，2nd ed.，Academic Press，New York，1976。获得低丰度mRNA出现在cDNA文库中的某个概率的要求克隆数为N＝(ln(1-P)/ln(1-1/n))，其中N为要求的克隆数，P为需要的概率，1/n为以一条稀有mRNA为单位表示的总mRNA的分数部分(Sambrook，et al.，1989)。
一种富集mRNA制剂中感兴趣序列的方法是根据大小区分。一种方法是通过琼脂糖凝胶电泳区分(Pennica，et al.，Nature 301214，1983)。另一种方法在一种试剂如变性RNA二级结构的羟化甲基汞存在时使用蔗糖梯度离心(Schweinfest，et al.，Proc.Nati.Acad.Sci.(U.S.A.)794997-5000，1982)。
一种经常采纳的方法是构建均等化或标准化的cDNA文库(Ko，Nucleic Acids Res.185705，1990；Patanjali，S.R.et al.，Proc.Nati.Acad.Sci.(U.S.A.)881943，1991)。一般说来，cDNA群通过扣除杂交法而标准化(Schinid，et al.，J.Neurochem.48307，1987；Fargnoli，et al.，Anal.Biochem.187364 1990 Travis，et al.，Proc.Nati.Acad.Sci(U.S.A.)851696，1988；Kato，Bur.J.Neurosci.2704 1990 and Schweinfest，et al.，Genet.Anal.Tech.Appi.764，1990)。扣除代表了另一种减少cDNA文库中某些序列群的方法。(Swaroop，et al.，Nucleic Acids Res.191954，1991).标准化文库可以用Soares程序构建(Soares et al.，Proc.Nati.Acad.Sci.(U.S.A.)919228，1994)。这种方法的设计是为了减少个体cDNA频率的初始10,000倍改变而获得在一个数量级中的丰度并同时保持文库的总体序列复杂性。在标准化程序中，高丰度cDNA克隆剧减，中间水平丰度的克隆相对未受影响，稀少转录克隆的丰度有效增加。
ESTs可以用许多方法测序。两种基本方法可以用于DNA测序，即Sanger et al.，Proc.Nati.Acad.Sci.U.S.A 745463，1977中描述的链终止法和Maxam and Gilbert，Proc.Nat.Acad.Sci.U.S.A.74560，1977中描述的化学降解法。技术的自动化和发展如用基于荧光的测序替代放射性同位素法减少了测序DNA要求的努力(Craxton，Methods，220，1991；Ju et al.，Proc.Nati.Acad.Sci.(U.S.A.)924347，1995；Tabor andRichardson，Proc.Nati.Acad.Sci.(U.S.A.)926339，1995)。从许多生产商可以获得自动测序仪，例如，Pharmacia Biotech，Inc.，Piscataway，New Jersey(Pharmacia ALF)，LI-COR，Inc.，Lincoln，Nebraska (LI-COR 4,000)and Millipore，Bedford，Massachusetts(MilliporeBaseStation)。
已经发现长于150bp的ESTs对相似性搜索和作图很有用(Adams，et al.，Science 2521651，1991)。EST序列一般为150-450个碱基。用单次运行序列数据可以常规并可靠产生序列长度信息。一般说来，从cDNA文库只获得单次运行序列数据，Adams，et al.，Science 2521651，1991。自动化的单次运行测序一般产生约2-3％错误或碱基混淆率(Boguski，et al.，Nature Genetics，4332，1993)。
EST数据库由例如(McCombrie，et al.，Nature Genetics 1124，1992)；人肝细胞系HepG2(Okubo，et al.，Nature Genetics 2173，1992)；人脑RNA(Adams，et al.，Science 2521651，1991；Adams，et al.，Nature355632，1992)；Arabidopsis，(Newnian，et al.，Plant Physiol.1061241，1994)；以及小鼠(Kurata，et al.，Nature Genetics 8365，1994)构建或部分构建。本发明使用从许多从玉米胚和愈伤组织制备的文库中分离的ESTs作为识别与在这些需要的组织中表达的基因相关的启动子序列的工具，然后它促进调节基因的5’调节序列如启动子的分离。
基于计算机的序列分析可以用于识别不同表达的序列，包括但不限于与另一种组织相比在一种组织中表达的序列。例如，从根组织和叶组织中分离的植物组织中分离的cDNA中可以发现不同系列的序列。因此，可以从在不同环境或生理条件下生长的植物制备的cDNA文库中比较序列。当从感兴趣的cDNA文库中识别出优选序列时，可以从植物组织制备的基因组文库中分离基因组克隆，对应的调节序列包括但不限于5’调节序列可以被识别并分离。
在一种优选实施方案中，从许多cDNA文库中得到的表达序列标记(EST)序列在序列数据库中分类。该数据库用于从特定感兴趣的组织中识别启动子目标。为随后的启动子分离而进行的表达序列标记的筛选反映了在从单个cDNA文库或cDNA文库集合中的随机取样得到的代表性ESTs中一种或更多序列的存在。例如，调节胚发生或愈伤组织中转录物表达的调节序列的识别是通过识别出现在从胚发生或愈伤组织中制备的cDNA文库中并在数据库中的其它cDNA文库中不存在或低丰度ESTs而进行的。然后估计被识别的EST先导序列在文库中的相对丰度以及被估计的某种EST的表达图谱。这里使用的丰度表示克隆或克隆簇在文库中出现的次数。在特定组织或器官中被增强或高丰度，代表靶表达图谱的序列是以这种方式被识别并可以从所识别的EST序列设计引物。一种基于PCR的方法可以用于从感兴趣的靶植物基因组文库中扩增侧翼区。许多用于扩增邻近已知序列核心区的未知DNA序列的方法是本领域技术人员公知的。这些方法包括，但不限于反相PCR(IPCR)，vectorette PCR，Y形PCR和基因组步行法。
在一种优选的实施方案中，与连接物连接的基因组DNA用基因特异性引物和与连接物序列退火的引物进行第一轮PCR扩增。然后将PCR产物作为模板用基因特异性引物和第二种连接物进行嵌套的PCR扩增。然后将从嵌套PCR反应得到的片段分离、纯化并亚克隆到适当的载体。当从截短的cDNA得到EST时，将片段测序并识别翻译起点。然后可以将片段作为与报道基因如β葡糖醛酸糖苷酶(GUS)的融合克隆到植物表达载体中。然后可以在瞬时分析中检验这些构建体并随后在适当的植物转化载体中将5’调节区可操作连接到其它基因，然后通过许多本领域技术人员公知的方法分析转化植物中感兴趣基因的表达。
可以选择任何植物进行基因和调节序列识别。分离基因和调节序列的适当植物目标将包括但不限于金合欢、紫花苜蓿、苹果、杏、拟南芥、洋蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆角、甜菜、黑莓、蓝莓、椰菜、抱子甘蓝、卷心菜，canola，哈密瓜、胡萝卜、木薯、蓖麻、花椰菜、芹菜、樱桃、菊苣、芫荽、柑橘、克莱门小柑橘、苜蓿、椰子、咖啡、玉米、棉花、黄瓜、道格拉斯冷杉、茄子、菊苣、苣荬菜、桉树、茴香、无花果、大蒜、葫芦、葡萄、葡萄果、蜜瓜、凉薯、猕猴桃、莴苣、韭菜、柠檬、酸橙、火炬松、亚麻子、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕榈、油菜、黄秋葵、橄榄、洋葱、桔子、观赏植物、棕榈、番木瓜、欧芹、欧洲防风草、豌豆、桃、花生、梨、胡椒、柿子、松树、菠萝、车前草、李子、石榴、白杨、土豆、西葫芦、温柏、radiatapine、radiscchio、萝卜、油菜籽、覆盆子、大米、黑麦、高梁、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、橘子、茶叶、烟草、番茄、黑小麦、草、芜箐、藤本植物、西瓜、小麦、山药、夏季产南瓜，特别优选的植物目标应包括玉米、棉花、大豆和小麦。
本发明的核酸分子从玉米(Zea mays)中分离。玉米发育约20-21个叶，在发芽后约65天抽丝，在发芽后约121天成熟。正常的玉米植物遵循普通的发育模式，但不同阶段间的时间间隔和形态在不同杂交、生长和环境条件间是不同的。
在玉米植物发育中有许多可识别的阶段。这些阶段被定义为营养期(V)和生殖(R)期。V期的细分按数字指定为V1，V2，V3等到V(n)，(n)表示抽穗前的最后一个出叶期，第一个V阶段为发芽(VE)期。例如，VE是幼苗叶从土壤中突出，V1表示第一片真叶，V2表示第二片叶，等。生殖阶段包括第一条丝的出现到成熟的种子，按如下表示R1为抽丝，R2为发疱，R3为乳熟期，R4为腊熟期、R5为dent期，R6为生理成熟期(见，例如Ritchie SW et al.(1986)How a Corn PlantDevelops，Iowa State University of Science and Technology CooperativeExension Service，Ames，IA 481-21)。
任何植物组织类型都可用作识别基因和相关调节序列包括但不限于启动子序列的靶组织。对于本发明，使用了玉米组织。更优选地，玉米胚发生或愈伤组织为识别启动子序列的靶组织。玉米cDNA文库用从传粉后21天(21-DAP)和传粉后13天(13-DAP)的玉米分离的胚组织和II型玉米愈伤组织构建。
任何允许在不同类型序列之间进行示差比较的方法都可以用于分离感兴趣的基因或调节序列。例如，在一种示差筛选方法中，可以用买到的克隆试剂盒在噬菌体宿主中制备从特定组织mRNA得到的cDNA文库。将斑片铺展到含细菌宿主如大肠杆菌菌苔的平皿上产生噬菌体斑。只有DNA结合膜可以产生105-106个噬斑。用靶组织和非靶组织产生的探针探测复制膜，从而判断靶组织和非靶或本底组织的差别表达。探针被标记，从而促进杂交和发育后的检测。与靶组织来源的探针杂交但不与非靶组织来源的探针杂交，表现出所需差别表达模式的噬斑可以选作进一步分析。也可以通过用限制性酶部分消化和在特定大小范围内对DNA片段进行大小筛选而从选择物种制备基因组DNA文库。基因组DNA可以被克隆到适当的载体，包括但不限于噬菌体，并用前面所描述的适当试剂盒制备(见例如，Stratagene，La Jolla，CA or Gibeo BREGaithersburg，MD)这里使用的示差杂交技术是本领域技术人员公知的并可以用于分离需要的序列类型。这里使用的序列类型表示以共同的识别物包括但不限于可以以从共同靶植物中分离的序列、共同文库或共同植物组织类型为基础而分成组的序列。在一种优选实施方案中，感兴趣的序列是以序列分析和查询不同组织类型的文库中的不同cDNA序列集合而识别的。公开的方法提供了以从不同cDNA文库中得到的植物ESTs的电子序列分析为基础的示差筛选的一个例子。
许多用于评估基因表达的方法是以测量器官、组织或细胞样品中的mRNA水平为基础的。典型的方法包括但不限于RNA印迹、核糖核酸酶保护测定和RT-PCR。在另一种优选实施方案中，使用了高流通量的方法从转录作图(transcript profiling)法中识别调节序列。cDNA微阵列(microarray)技术的发展使系统监测成千上万基因的基因表达图谱成为可能(Schena et al，Science，270467，1995)。这种以DNA芯片为基础的技术将成千上万的cDNA序列排列在支持面上。同时将这些阵列与许多从不同细胞或组织类型的RNA样品制备的标记cDNA探针杂交，允许直接的表达比较分析。此技术首先是通过分析48个拟南芥基因在根和芽的差别表达而证明的(Schena et al，Science，270467，1995)。更近一些，用cDNA微阵列技术监测了超过1400个基因的表达图谱(Ruan et al，The Plant Journal 15821，1998)。微阵列提供了高产量、定量的和可再生的方法而分析基因表达和鉴定基因功能。这样使用微阵列的转录作图法为分离调节序列如与这些基因相关的启动子提供了另一种有价值的工具。
本发明使用高产量的序列分析而形成感兴趣序列的迅速的计算机识别的基础。本领域的技术人员了解序列分析可用的资源。可以通过判断检验或询问序列与公共或私有数据库中序列的相似性(“相似性分析”)或通过搜索某些基序(内在序列分析)(如顺式元件)而进行序列比较(Coulson，Trends in Biotechnology，1276，1994；Birren，et al.，Genome Analysis，1543，1997)。
SEQ ID Nos36-51或其片段提供的核酸序列或其互补序列，或至少90％等同于，优选95％等同于甚至更优选99％或100％等同于SEQ IDNos36-51或其片段提供的序列或其互补序列的核苷酸序列，可以“被提供”于许多介质中。这种介质也可以以允许本领域技术人员检验序列的形式提供其亚型。
在此实施方案的一种应用中，本发明的核苷酸序列可以被记录在计算机可读的介质上。这里使用的“计算机可读介质”是指任何可以由计算机直接读入和存取的介质。这种介质包括，但不限于磁性存储介质，如软盘、硬盘、存储介质和磁带；光学存储介质如CD-ROM；电子存储介质如RAM和ROM；以及这些类别的杂合物如磁性/光学存储介质。本领域的技术人员可以很容易了解目前已知的计算机可读介质如何创建包含记录本发明核苷酸序列的计算机可读介质的产品。
通过提供一种或更多本发明的核酸序列，本领域中的技术人员可以为多种目的而常规存取序列信息。可以通过许多方法分析序列，如通过在没有为这种目的而设计的软件的帮助下分析序列。计算机软件也是公共的，允许本领域中的技术人员存取提供于计算机可读介质中的序列信息。公共数据库的例子包括但不限于日本DNA数据库(DDBJ)(http//www.ddbj.nig.ac.jp/)；基因库(http//www.ncbi.nlm.nih.gov/web/Genbank/Index.html)；以及欧洲分子生物实验室核酸序列数据库(EMBL)(http//www.ebi.ac.uk/ebi_docs/embl_db.html)或其译本。已经开发了许多不同的搜索算法，包括但不限于称作BLAST程序的一套程序。有五种BLAST执行，三种是为核苷酸序列查询而设计(BLASTN，BLASTX和TBLASTX)，两种是为蛋白序列查询而设计(BLASTP and TBLASTN)(Coulson，Trends in Biotechnology，1276-80，1994；Birren，et al.，Genome Analysis 1543.l997)。
为基序搜索而设计的程序在本发明中也有用。为基序搜索而设计的序列分析程序可以用于识别顺式元件。优选的计算机程序可以包括但不限于MEME，SIGNAL SCAN和GENESCAN。Meme是一个在一组未对比序列中识别保守基序(核酸或肽)的程序。Meme将这些基序保存为一系列分布图。这些分布图可以用于搜索序列数据库。MEME算法(2.2版)可以在GCG软件包10.0版中找到；MEME(T.Bailey and C.Elkan，Machine Learning，21(1-2)51-80，1995)站点位置如下(http/Iwww.sdsc.edu/MEMEImeme/website/COPYRIGHT.html.)。SignalScan是一个用其它数据库中的信息识别检验序列的已知基序的程序(Prestridge，D.S.，CABIOS 7，203-206(1991)。SignalScan 4.0信息在以下站点可以找到http//biosci.cbs.umn.edu/software/sigscan.html。用于SignalScan的ftp站点为ftp//biosci.cbs.umn.edu/sofiw～e/sig5can.html。Signal Scan使用的数据库包括PLACE(http//www.dna.affrc.go.ip/htdocs/PLACE(Higo et al.，Nucleic AcidsResearch 27(1)297-300(1999)和TRANSFAC(Heinemeye，X.et al.，Nucleic Acid Research 27(1)318-322)，可以在如下站点找到http//taansfac.gbf.deA。GeneScan是另一个适合基序搜索的程序(Burge，C and Karlin，S.J.Mol.Biol.268，78-94(1997)，1.0版的信息在以下站点可以找到http//gnomic.stanford.edu/GENESCANW.html.。这里用到的“靶结构基序”或“靶基序”是指任何合理选择的序列或序列结合，其中序列是以靶基序折叠而形成的三维构象为基础而选择的。许多靶基序是本领域中的技术人员所公知的。蛋白的靶基序包括但不限于酶活性位点和信号序列。本发明的优选靶基序包括但不限于启动子序列、顺式元件、发夹结构和其它表达元件如蛋白结合序列。
这里使用的“搜索”是指在基于计算机的系统中运行而比较靶序列或靶结构基序与储存在数据储存设备中的序列信息的一种或更多程序。搜索方法是用于识别与特定靶序列或靶基序匹配的本发明的序列片段或区域。也可以比较多个序列以便识别负责特定功能的共同区域或基序。例如，当用某些软件包对比和分析相似类型启动子的多个启动子区域时，可以识别赋予特定表达图谱的顺式元件或序列结构域。
本发明还提供了包含这里所描述的序列信息的系统，特别是基于计算机的系统。这里使用的“基于计算机的系统”是指用于分析本发明核苷酸序列信息的硬件设备、软件设备和数据存储设备。本发明的最低硬件设备包括中央处理单元(CPU)、输入设备、输出设备和数据储存设备。本领域的技术人员可以理解任何数量的基于计算机的系统都适合用于本发明，这种程序与没有计算机系统辅助的检查相比提供了有效的序列数据分析手段。
SEQ ID Nos6-35是从基于计算机的序列比较而识别的cDNA序列设计的引物。这些序列是用于用聚合酶链式反应(PCR)扩增技术延伸核酸序列(见，例如，Mullis et al.，Cold Spring Harbor Symp.Quant.Biol.51263，1986；Erlich等，欧洲专利申请50,424；欧洲专利申请84,796，欧洲专利申请258,017；欧洲专利申请237,362；Mullis，欧洲专利申请201,184；Mullis等，美国专利4,683,202；Erlich，美国专利4,582,788；和Saiki等，美国专利4,683,194)。许多PCR扩增方法是本领域中的技术人员所公知的，并用于识别邻近于已知序列的核酸序列。例如，描述了扩增邻近于已知序列的核心区的未知DNA序列的反相PCR(IPCR)方法。也提供了其它方法，如捕捉PCR(Lagerstrom M.，et al.，PCR Methods Applic.1111，1991)，及步行PCR(Parker，JD et al.，Nucleic Acids Res 193055，1991)。为识别感兴趣的序列，许多生产商也开发了以这些方法的修饰为基础的试剂盒。技术的发展包括引物和连接物的改进、聚合酶的改进和温度循环能力促进了分离感兴趣序列的更快和更有效的方法。
在一种优选实施方案中，用基因组步行方法(UniversalGenomeWalkerTMKit，CLONTECH Laboratories，Inc.，Palo，Alto，CA)分离含有本发明的5’调节元件的侧翼序列。简言之，使纯化的基因组DNA接受限制性内切酶消化，产生末端与GenomeWalkerTM连接物连接的基因组DNA片段。GenomeWalkerTM引物与基因特异性引物一起在两个连续的PCR反应中使用(初级和嵌套PCR反应)，从而产生含有随后被克隆和测序的5’调节序列的PCR产物。
除了用于调节基因表达，本发明的启动子序列也具有在核酸杂交实验中作为探针和引物的应用。本发明的核酸探针和引物可以在严格条件下与靶DNA序列杂交。名词“严格的杂交条件”定义为探针或引物与靶序列特异性杂交但不与非靶序列杂交的条件，可以由经验判断。名词“严格条件”是关于核酸探针与靶核酸(即与感兴趣的特定核酸序列)通过讨论于Sambrook et al.，1989，9.52-9.55的特异性杂交程序而杂交的功能性定义。也见Sambrook et al.，1989 at 9.47-9.52，9.56-9.58；Kanehisa，Nucl.Acids Res.12203-213，1984；及Wetmur and Davidson，J Mol.Biol.31349-370，1968。促进DNA杂交的适当严格条件为，例如，在约45℃下6.0x氯化钠/柠檬酸钠(SSC)，然后是在50℃下用2.0xSSC洗涤，这是本领域中技术人员公知的，或可以在Current Protocols inMolecular Biology，John Wiley & Sons，N.Y.，1989，6.3.1-6.3.6中找到。例如，洗涤步骤中的盐浓度可以选用50℃下约2.0xSSC的低严格性到50℃下约0.2xSSC的高严格性。另外，洗涤步骤中的温度可以从在室温下的约22℃的低严格性条件到约65℃的高严格杂交条件。温度和盐都可以改变，或当其它变量改变时温度和盐浓度可以保持恒定。
例如，对于高严格性，用DNA或RNA探针或引物进行的杂交可以在65℃下，6x SSC，0.5％SDS，5x Denhardt试剂，100ug/mL非特异性DNA(如超声波降解的鲑鱼精子DNA)下进行，在65℃下，0.5xSSC，0.5％SDS洗涤。
考虑到了如果保留了探针或引物对靶序列的结合特异性，较低严格的杂交条件如更低的杂交和/或洗涤温度可以用于识别具有更低度序列相似性的相关序列。因此，由于它们选择性与DNA片段互补链形成双螺旋分子的能力，可以使用本发明的核苷酸序列。通过杂交检测DNA节段是本领域的技术人员公知的，因此根据本申请所预见的，将需要使用不同杂交条件而获得探针对靶序列的不同程度的选择性，选择方法将取决于所需的结果。
SEQ ID Nos36-51的核酸序列和任何其变体可以在适当选择的严格条件下与其它核酸序列杂交。如这里所用到的，如果两个分子可以形成反向平行的、双链核酸结构那么两个核酸分子就称为可以特异性互相杂交。如果两个核酸分子表现出完全互补，那么就称一个核酸分子与另一个核酸分子“互补”。如这里所用到的，当一个分子的所有核苷酸每个核苷酸都与另一个分子的核苷酸互补，那么就称这两个分子表现出“完全互补”。如果两个分子的互相杂交有充分的稳定性而允许它们在至少常规“低严格”条件下互相退火，那么就称它们是“最小互补”的。如果两个分子的互相杂交有充分的稳定性而允许它们在至少常规“高严格”条件下互相退火，那么就称它们是“互补的”。常规的严格杂交条件描述于Sambrook，et al.，Molecular Cloning，A Laboratory Manual，2nd Ed.，Cold Spring Harbor Press，Cold Spring Harbor，New York，1989，and by Haymes et al.，Nucleic Acid Hybridization，A Practical Approach，IRL Press，Washington，DC，1985。
在一种优选实施方案中，核酸序列SEQ ID Nos36-51或这些序列的片段、区域、顺式元件或寡聚物，可以用于其它植物组织的杂交分析而识别密切相关或同源的基因和相关调节序列。这些包括但不限于在任何底物包括但不限于适当制备的植物组织、纤维素、尼龙或组合过滤器、芯片或载玻片上进行的DNA或RNA杂交分析。这些方法学是本领域中公知的，可以从销售商提供的试剂盒或制剂中得到。
当然，也可以通过其它技术如通过化学方法直接合成片段而获得片段，通常用自动寡核苷酸合成器执行。也可通过核酸复制技术，如通过分子生物学领域技术人员公知的重组DNA技术进行的PCRTM(聚合酶链式反应)技术获得片段。关于用特定扩增引物对扩增靶核酸序列(如通过PCR)，“严格PCR条件”是指允许引物对仅仅与靶核酸序列杂交的条件，靶核苷酸序列将与具有对应野生型序列(或其互补序列)的引物结合并优选产生唯一的扩增产物。
这里使用的核酸片段是指小于全长的任何核酸部分。片段也可以包含至少一个可以在前面定义的严格杂交条件下特异性与天然核酸杂交的最小长度。这种最小片段的长度优选为天然核酸序列的至少8个连续核苷酸，更优选为15个连续核苷酸，更优选为至少20个连续核苷酸，最优选为至少30个连续核苷酸。
本发明的核酸序列也可以用于探针和引物。可以根据天然基因序列制备核酸探针和引物。“探针”是常规可检测标记物或受体分子，如放射活性同位素、配体、化学发光剂或酶连接的分离核酸。“引物”是通过核酸杂交而退火到互补靶DNA链的分离核酸，从而形成引物和靶DNA链的杂交物，然后通过聚合酶，如DNA聚合酶沿靶DNA链延伸。引物对可以用于如通过聚合酶链式反应(PCR)或其它常规核酸扩增方法扩增核酸序列。
探针和引物一般为15个核苷酸或更长，优选20个核苷酸或更多，更优选25个核苷酸，最优选30个核苷酸或更多。这种探针和引物在高严格杂交条件下特异性与靶DNA或RNA序列杂交，并在低严格条件下特异性与另一物种的靶天然序列杂交。尽管可以用常规方法设计与天然序列不同并保持与靶天然序列杂交的能力的探针，本发明的探针和引物优选与天然序列有完全的序列相似性。制备和使用探针和引物的方法描述于，例如Molecular CloningA Laboratory Manual，2nd ed.，vol.1-3，ed.Sambrook et al.，Cold Spring Harbor Laboratory Press，Cold SpringHarbor，NY，1989(以下称为，″Sambrook et al.，1989″)；CurrentProtocols in Molecular Biology，ed.Ausubel et al.，Greene Publishing andWiley-Interscience，New York，1992(有定期更新)(以下为，″Ausubel etal.，1992)；and Innis et al.，PCR ProtocolsA Guide to Methods andApplications，Academic PressSan Diego，1990。PCR引物对可以，例如，通过使用针对该目的如引物的计算机程序(Version 0.5，1991，Whitehead Institute for Biomedical Research，Cambridge，MA)可以从已知序列得到引物对。这里公开的以天然启动子序列为基础的引物和探针可以用于证实，如果需要，用于通过常规方法如通过再克隆和再测序而修饰公开序列。
在另一种实施方案中，这里公开的启动子核苷酸序列可以被修饰。本领域中的技术人员可以建立核苷酸序列有改变的DNA分子。以SEQ ID NOS36-51表示的本发明的核苷酸序列可以被修饰或改变而增强它们的控制特征。一种改变核酸序列的优选方法是用PCR修饰选定的核苷酸或序列区。这些方法是本领域中的技术人员公知的。可以通过以PCR为基础的DNA修饰法例如插入、去除或替代模板序列而修饰序列。“变体”DNA分子为含有天然序列的一个或更多核苷酸被去除、添加和/或替代的改变的DNA分子，优选基本保持启动子功能。在启动子片段的情况下，“变体”DNA可以包括影响与其可操作连接的最小的启动子转录的改变。可以通过例如，标准DNA诱变技术或通过化学合成变体DNA分子或其部分而产生变体DNA分子。
在另一种实施方案中，以SEQ ID NOS36-51表示的核苷酸序列包括可以调节可操作连接的DNA序列的任何长度的序列。例如，公开于SEQ ID NOS36-51的序列可以被截短或去除并仍然保持可以调节可操作连接的DNA序列的转录。在一种相关的实施方案中，公开序列的顺式元件可以赋予特定的特异性如赋予胚发生或愈伤组织中可操作连接的DNA序列增强的表达并因此也可以调节转录。所以，公开序列的任何序列片段、部分或区域可以用于调节序列，包括，但不限于顺式元件或基序。例如，可以将一个或更多碱基对从启动子序列的5’或3’端去除而产生“截短的”启动子。也可以将一个或更多碱基对插入、去除或内部替代到启动子序列。可以将启动子构建为使启动子片段或元件被可操作连接，例如，通过将这种片段放置在最小启动子的上游。最小或基本启动子是可以募集并结合基本转录机构的DNA片段。真核细胞中的基本转录机构是RNA聚合酶II复合物和它的辅助蛋白。这种基本转录机构的酶成分可以利用最小或基本启动子起始和延长某种基因的转录。也就是说，在启动子区没有可以募集和结合调节转录，如增强、阻遏、导致转录激素依赖性等的转录因子的添加的顺式作用序列。替代、去除、插入或其结合可以结合而产生终末构建体。
本发明的天然或合成核酸可以掺入重组核酸构建体，一般是DNA构建体，可以导入宿主细胞并在其中复制。在一种优选实施方案中，以SEQ ID NOS36-51表示的核苷酸序列或其片段、变体或衍生物被掺入包括可操作连接到基因成分如可选择、可筛选或可测量的标记基因的本发明的启动子区的表达载体盒中。本发明的公开核酸序列优选可以可操作连接到基因成分如赋予与所需与植物形态、生理、生长和发育、产量、营养增强、抗疾病或抗害虫、或环境或化学耐受相关的特征的核酸。这些基因成分如标记基因或感兴趣的农业基因可以在识别转化植物细胞或植物中起作用，或产生有农业应用的产品。本发明的启动子序列可以用于调节任何可操作连接的可转录序列的表达。特别优选的可操作连接的可转录序列将包括但不限于那些优选在胚发生或愈伤组织中表达的序列。
在一种优选的实施方案中，一种基因成分产生作为选择设备和作用于可再生植物组织中产生可以赋予植物组织耐受其它毒性化合物的化合物的产物。用作可选择的、可筛选或可测量标记的感兴趣基因可以包括但不限于GUS(β-葡糖醛酸糖苷酶的编码区)、GFP(绿色荧光蛋白的编码序列)或抗生素或除草剂耐受基因。转座子和相关的抗生素耐药基因包括Tns(bla)，Tn5(npt II)，Tn7(dhfr)，青霉素，卡那霉素(以及新霉素、G418、博莱霉素)；氨甲喋呤(以及甲氧苄氨嘧啶；氯霉素；卡那霉素和四环素转座子。
对植物中可选择的标记有用的特征在一项关于微生物的使用的报告中有概述(Advisory Committee on Novel Foods and Processes，July1994)。这些特征包括最小数目的未转化组织的严格选择，大量独立转化事件而没有对再生的严重干扰，应用于大量物种，存在一种为组织中标记的存在评分的测定。
许多可选择的标记基因是本领域中公知的，并且一些抗生素耐药标记满足这些标准，包括耐卡那霉素(npt II)、潮霉素(aph IV)和庆大霉素(aac3和aac4)的标记。有用的显性可选择标记基因包括编码抗生素耐药基因的基因(如耐潮霉素、卡那霉素、博莱霉素、G418、链霉素或奇放线菌素)；以及除草剂抗性基因(如膦丝菌素乙酰转移酶)。选择抗除草剂的转化突变型的一种有用的策略描述于如，Vasil，Cell Cultureand Somatic Cell Genetics of Plants，Vols.I-III，Laboratory Proceduresand Their Applications Academic Press，New York，1984。用于本发明的特别优选的可选择标记将包括赋予抗化合物如抗生素如卡那霉素以及除草剂如草甘膦(Della-Cioppa et al.，Bioffechnology 5(6)，1987，U.S.Patent 5,463,175，U.S.Patent 5,633,435)。也可执行其它选择装置并仍处在本发明的范围中。
对于本发明的实施，使用了制备和使用载体的常规组合物和方法及宿主细胞，如Sambrook et al.，1998等所讨论的。在一种优选实施方案中，宿主细胞为植物细胞。许多适于稳定转染植物细胞或建立转基因植物的载体描述于如，Pouwels et al.，Cloning VectorsA LaboratoryManual，1985，supp.1987；Weissbach and Weissbach，Methods for PlantMolecular Biology，Academic Press，1989；Gelvin et al.，Plant MolecularBiology Manual，Kluwer Academic Publishers，1990；and R.R.D.Croy，Plant Molecular Biology LabFax，BIOS Scientific Publishers，1993。植物表达载体可以包括，如在5’和3’调节序列转录控制下的一种或更多克隆植物基因。这种植物表达载体也可以含启动子调节区(如，控制诱导型或组成型，环境或发育调节的或细胞或组织特异性表达的调节区域)，转录起始位点，核糖体结合位点，RNA加工信号、转录终止位点和聚腺苷酸化信号。在表达载体中视为基因成分的其它类型的调节序列包括但不限于可以与启动子偶联的非翻译先导序列。在一种特别优选的实施方案中，宿主细胞为植物细胞，植物表达载体包含SEQ ID Nos36-51的启动子区域。植物表达载体也可以包含额外序列，包括但不限于用于克隆目的的限制性酶位点。
任何感兴趣基因的许多对植物基因表达有用的启动子包括但不限于可选择标记，可测量标记，耐受害虫、耐受疾病、营养增强的基因或其它农业上感兴趣的基因。对植物基因表达有用的组成型启动子的例子包括但不限于，赋予在大多数植物组织中组成型、高水平表达的花椰菜花叶病毒(CaMV)35S启动子(见，如，Odel et al.，Nature 313810，1985)，包括单子叶植物(见如Dekeyser et al.，Plant Cell 2591，1990；Teradaand Shimamoto，Mol.Gen.Genet.220389，1990)；胭脂碱合成酶启动子(An et al.，Plant Physiol.88547，1988)及章鱼碱合成酶启动子(Fromm etal.，Plant Cell 1977，1989)和玄参花叶病毒(FMV)启动子(美国专利No.5,378,619，是一种双边，右(RB)和左(LB)T-DNA边的植物转化载体，由下列基因成分组成ZM-700267629是从玉米胚基因组文库中分离的进行玉米胚增强表达的启动子；I-Zm.Hsp70内含子是玉米热休克蛋白的间插序列，如美国专利5,593,874和5,859,347所描述，在此引入其完整内容作为参考)；Ec.GUS1为大肠杆菌β葡糖醛酸糖苷酶的编码区；T-AGRTU.nos是胭脂碱合成酶基因的终止信号；P-CaMV.35S是CaMV 35S启动子(美国专利No.5,352,605，在此引入其完整内容作为参考)。
许多植物启动子是应答于环境、化学和/或发育信号而调节的，可以用以表达植物细胞中可操作连接的基因，包括由(1)热(Callis et al.，Plant Physiol.88965，1988)，(2)光(如，pea rbcS-3A promoter，Kuhlemeier et al.，Plant Cell 1471，1989；maize rbcS promoter，Schaffner and Sheen，Plant Cell 3997，1991；或chlorophyll a/b-bindingprotein promoter，Simpson et al.，EMBO J.42723，1985)，(3)激素如脱落酸(M & cotte et al.，Plant Cell 1969，1989)，(4)创伤(如，wuni，Siebertz etal.，Plant Cell 1961，1989)；或(5)化学物质如茉莉酸、水杨酸或安全剂调节的启动子。使用(6)器官特异性启动子(如，Roshal et al.，EMBO J.61155，1987；Schernthaner et al.，EMBO J.71249，1988；Bustos et al.，Plant Cell 1839，1989)也可以是有益的。本发明的启动子是胚细胞增强的和胚发生组织增强的或愈伤组织增强的植物启动子，可以可操作连接到表达载体中的任何感兴趣基因。
植物表达载体可以包括RNA加工信号，如内含子，可以位于转基因的多肽编码序列的上游或下游。另外，表达载体可以包括植物基因3’非翻译区的额外调节序列(Thomburg et al.，Proc.Nati.Acad.Sci.USA84744(1987)；An et al.，Plant Cell 1115(1989)，如增加mRNA的mRNA稳定性的终止子区，如土豆的PI-II终止子区或章鱼碱或胭脂碱合成酶3’终止子区。mRNA的5’非翻译区可以在翻译起始中起重要作用并且也可以是植物表达载体的基因成分。例如，已经证明从热休克蛋白基因得到的非翻译5’先导序列可以增强植物中的基因表达(见，例如美国专利5,352,865，在此引入其完整内容作为参考)。这些额外的上游和下游调节序列可以源于与存在于表达载体中的其它元件的天然或异源的来源。
本发明的启动子序列被用于控制植物细胞中的基因表达。更优选将此启动子序列用于控制植物种子中的基因表达。甚至更优选将此启动子序列用于控制植物胚中的基因表达。公开的启动子序列是用于植物转化的载体的一部分的基因成分。本发明的启动子序列可以与任何适当的含可选择或可筛选标记和相关调节元件的植物转化质粒或载体，以及如本文所述的以足够赋予特别需要的性状的方式表达的一种或更多核酸一起使用。本发明预见的适当有农业益处的基因包括但不限于一种或更多昆虫耐受基因如B.t.，害虫耐受如真菌疾病控制基因，除草剂耐受如授予草甘膦耐受的基因，以及改进质量的基因如产量、增强营养如维生素、油和氨基酸组成、环境或压力耐受或植物生理、生长、发育、形态或植物产品的任何需要的改变。
另外，DNA编码序列可以通过编码例如通过反义或共抑制介导机制导致定向抑制内源性基因表达的非翻译RNA分子影响这些表型(见，例如，Bird et al.，Biotech.Gen.Engin.Rev.9207，1991)。RNA也可以是经加工而切除需要的内源性mRNA产物的催化性RNA分子(即核酶)(见例如Gibson and Shillitoe，Mol.Biotech.7125，197)。这样，任何产生表达感兴趣的表型或形态改变的蛋白或mRNA的基因对实施本发明都是有用的。
除了位于DNA序列上游(5’)或内部的调节元件或序列，还有影响基因表达的下游序列，因此这里使用的名词调节序列是指任何位于DNA序列上游、内部或下游，与细胞的蛋白合成装置结合控制、介导或影响基因产物表达的核苷酸序列。
例如，为在其它植物系统中表达本发明的启动子序列，可以修饰本发明的启动子序列。在另一种方法中，可以通过许多方法设计或加工新颖的嵌合或杂合启动子。许多启动子包含激活、增强或定义强度和/或启动子特异性的上游序列(Atchison，Ann.Rev.Cell Biol.4127，1988)。T-DNA基因，如含有定义转录起始位点的TATA盒和位于转录起始位点上游的其它上游元件调节转录水平(Gelvin，In TransgenicPlants(Kung，S.-D.And Us，R.，eds)，San DiegoAcademic Press，pp.49-87，1988)。另一种嵌合启动子将章鱼碱合成酶(ocs)激活剂三聚体结合到甘露碱合成酶(mas)激活剂与启动子，并报道了报道基因表达的增加(Min Ni et al.，The Plant Joumal 7661，1995)。本发明的上游调节序列可以用于构建这种嵌合或杂合启动子。用于构建本发明的变异启动子的方法包括但不限于将不同启动子的控制元件或启动子的复制部分或区域结合起来(见例如美国专利5,110,732，在此引入其完整内容作为参考，以及美国专利5,097,025，在此引入其完整内容作为参考)。本领域的技术人员熟悉描述构建、操作和分离大分子(如DNA分子，质粒等)的特定条件和程序，产生重组生物体和筛选及分离基因的标准来源物质(见例如Sambrook et al.，Molecular CloningA Laboratory Manual，ColdSpring Harbor Press，1989；Mailga et al.，Methods in Plant MolecularBiology，Cold Spring Harbor Press，1995；Birren et al.，Genome Analysisvolume 1，Analyzing DNA，(1997)；volume 2，Detecting Genes，(1998)；volume 3，Cloning Systems，(1999)，volume 4，Mapping Genomes，(1999)，Cold Spring Harbor，New York)。
如文中所描述可以用可筛选或可测量的标记将本发明的启动子序列插入表达载体中并在提供稳定植物系统中的基因表达的指示的瞬时测定中对其进行检验。在瞬时测定中检验基因表达的方法是本领域中的技术人员公知的。用许多植物、组织和DNA运送系统报道了标记基因的瞬时表达。例如，瞬时分析的类型可以包括但不限于在使用任何感兴趣的植物种的瞬时测定中通过电穿孔或粒子轰击组织而指导基因运送。这种瞬时系统包括但不限于从小麦悬浮液培养物中得到的原生质体(Zhou et al.，Plant Cell Reports 12612.1993)，小麦叶原生质的电穿孔(Sethi et al.，J.Crop Sci.52152，1983)；从玉米组织制备的原生质的电穿孔(Sheen，J.The Plant Cell 3225，1991)，或感兴趣的特定组织的粒子轰击。本发明包含用任何瞬时表达系统评估操作连接到选择的报道基因，标记基因或感兴趣的农业基因的调节序列。预备通过适当的运送系统在瞬时系统中检验的植物组织的例子包括但不限于叶基组织、愈伤组织、子叶、根、胚乳、胚发生组织、花组织、花粉和表皮组织。
任何可测量或可筛选的标记都可以用于瞬时测定。瞬时分析本发明的启动子或5’调节序列的优选标记基因包括GUS基因(β葡糖醛酸糖苷酶的编码序列)或GFP(绿色荧光蛋白编码序列)。将含有与标记基因可操作连接的5’调节序列的表达载体运送到组织中，并用适当的机制根据标记分析组织。数量或质量分析被用作评估当启动子序列在稳定植物中与农业上感兴趣的基因操作连接时的潜在表达图谱。最终，将本发明的5’调节序列直接掺入适当的植物转化表达载体中，将本发明的5’调节序列操作连接到可选择的标记和感兴趣的基因，转化到植物中，并分析转化植物及其后代中由5’调节序列赋予的表达图谱。本领域的技术人员已知适于植物转化的载体。适当的载体将包括但不限于用于土壤杆菌介导方法的disarmed Ti质粒。这些载体可以含抗性标记、1-2个T-DNA边和大肠杆菌和土壤杆菌的复制起点以及一种或更多感兴趣的基因及相关调节区。本领域的技术人员已知对于土壤杆菌介导途径，可以使用许多菌株和方法。这些菌株包括但不限于土壤杆菌株C58，LBA44O4，EHAIOl和EHAl05。特别优选的株为根癌土壤杆菌株。其它用于植物转化的DNA运送系统也是本领域技术人员公知的并包括但不限于选定植物组织的粒子轰击。其它用于植物转化的DNA运送系统也是本领域技术人员公知的并包括但不限于一般为感兴趣的特定植物宿主优化的选定植物组织的粒子轰击。
可以用本发明范围中的方法引入的核酸的例子包括，例如从另一物种得到的DNA序列或基因，或甚至是同一物种起源或存在于同一物种中，但是是通过经典复制或杂交技术以外的基因工程方法掺入受体细胞的序列。然而，名词外源性的，也意欲指通常在被转化细胞中不存在，或也许仅仅是不以转化DNA片断或基因中的形式、结构等存在的基因或通常存在，但需要如过度表达的基因。这样，名词“外源性”基因或DNA意欲指任何引入受体细胞的任何基因或DNA片段，不管此细胞中是否已经有相似的基因。包括在外源性DNA中的DNA类型可以包括已经存在于植物细胞中的DNA，另一种植物的DNA，不同生物体的DNA，或外部产生的DNA，如含基因反义信息的DNA序列，或编码基因的合成或修饰版本的DNA序列。
可以通过植物转化方法将包含本发明的启动子序列的植物转化载体引入植物。有一些方法可以将DNA序列引入植物细胞并且是本领域中熟知的。适当的方法包括细菌感染，二元细菌人工染色体载体，直接运送DNA(如通过PEG介导的转化)，干燥/抑制介导的DNA摄取，电穿孔，用氧化硅纤维搅拌，以及加速DNA包被的颗粒(综述于Potrykus，Ann.Rev.Plant Physiol.Plant Mol.Biol.，42205，1991)。
特异性转化双子叶植物的方法主要使用根癌土壤杆菌。例如，报道过的转基因植物包括但不限于棉花(美国专利5,004,863；美国专利5,159,135；美国专利5,518,908，WO 97/43430)，大豆(美国专利5,569,834；美国专利5,416,011；McCabe et al.，Bio/Technology，6923，1988；Christou et al.，Plant Physiol.，87671，1988)；芸苔(美国专利5,463,174)，和花生(Cheng et al.，Plant Cell Rep.，15653，1996)。
在单子叶植物转化中报道了相似的方法。已经描述了许多农作物包括但不限于芦笋(Asparagus officinalis；Bytebier et al.，Proc.Natl.Acad.Sci.U.S.A.，845345，1987)；大麦(Hordeum vulgarae；Wan and Lemaux，Plant Physiol.，10437，1994)；玉米(Zea mays；Rhodes，C.A.，et al.，Science，240204，1988；Gordon-Kamni，et al.，Plant Cell，2603，1990；Fromm，et al.，Bio/Teclinology，8833，1990；Koziel，et al.，Bio/Technology，11194，1993)；燕麦(Avena sativa；Somers，et al.，Bio/Technology，101589，1992)；鸭茅(Dactylis glomerata；Horn，et al.，Plant Cell Rep.，7469，1988)；大米(Oryza sativa，including indica andjaponica varieties，Toriyama，et al.，Bio/Technology，610，1988；Zhang，et al.，Plant Cell Rep.，7379，1988；Luo and Wu，Plant Mol.Biol.Rep.，6165，1988；Zhang and Wu，Theor.AppI.Genet.，76835，1988；Christou，et al.，Bio/Technology，9957，1991)；高梁(Sorghum bicolor；Casas，A.M.，et al.，Proc.Nati.Acad.Sci.U.S.A.，9011212，1993)；甘蔗(Saecharumspp.Bower and Birch，Plant 3.，2409，1992)；高羊茅(Festucaarundinacea；Wang，Z.Y.et al.，Bioffechnology，10691，1992)；草(Agrostis palustris；Zhong et al.，Plant Cell Rep.，131，1993)；小麦(Triticum aestivum；Vasil et al.，Biotechnology，10667，1992；Weeks T.，et al.，Plant Physiol.，1021077，1993；Becker，et al.，Plant，J.5299，1994)，以及紫花苜蓿(Masoud，S.A.，et al.，Transgen.Res.，5313，1996)。对本领域中的技术人员很明显的是，为从任何感兴趣的靶农作物产生稳定的转基因植物，可以使用或修饰许多转化方法。
分析了转化植物中感兴趣基因的存在和表达水平和/或由本发明的启动子序列赋予的形态。本领域中的技术人员已知有很多方法可以用于分析转化植物。使用了许多方法估计基因表达和判断引入基因是否按照预期目标恰当整合、作用及遗传。对于本发明，可以通过判断操作连接了启动子的基因的表达水平而评价启动子。对启动子功能的初步分析可以通过使用报道基因的瞬时测定方法而判断，但更权威性的启动子评估可以通过稳定植物的分析而判断。植物分析的方法包括但不限于DNA或RNA印迹，基于PCR的方法，生化分析，表型筛选法，大田评估和免疫诊断测定。
本发明的方法包括但不限于本领域技术人员公知的cDNA文库制备、基因组文库制备、测序、序列分析、PCR技术、载体构建、瞬时测定和植物转化方法，并用标准技术或其修饰执行。
下面的实施例是为了证明本发明的优选实施方案而引入的。本领域的技术人员应该理解，遵照发明者发现的代表技术的实施例中公开的技术在本发明的实施中可以正常行使作用。然而，本领域中的技术人员按照本公开内容应该理解在公开的特定实施方案中可以进行许多改变而仍然获得相似或相同的结果，并且不离开本发明的精神和范围。所以在附图中阐述或表示的内容应该解释为说明而不是限制意义。
实施例选用了许多组织和植物发育阶段制备玉米文库。本领域中的技术人员已知组织选择和制备中一种组织样品与另一种组织样品会有不同。下面是靶文库的条件。
实施例1分别用传粉后13天的玉米胚(13-DAP)(SATMON033文库)或传粉后21天的玉米胚(21-DAP)(SATMON017文库)作为胚-13-DAP或胚-21-DAP cDNA文库的来源物质。这些文库是从玉米产生的(DK604，Dekalb Genetics，Dekalb，Illinois U.S.A.)。将种子种植在含Metro 200生长培养基的2″-3″的罐中约3厘米深度的土壤并在2-3周之后移植到含同样土壤的更大的10″的罐中。在移植后每周使用Peters 15-16-17肥料3次，浓度为150ppm，植物从移植到开花的生命中共2-3次。每个罐中添加总共约900mg铁，在植物从移植到开花的生命周期中共添加2到3次。玉米植物以白天15小时/夜晚9小时的循环在温室中生长。白昼温度为约80°F，夜晚温度为约70°F。用1000W的钠蒸汽灯提供补充的光照。
选择的玉米植物超过了V10期，在抽丝前将准备进行受精的穗芽包在纸袋中阻止花粉。传粉后13天(13-DAP)或传粉后21天(21-DAP)，抽出谷穗并将谷粒从谷穗上摘下。解剖谷粒的胚和胚乳并去除糊粉层。解剖后将胚在液氮中冷冻并在RNA制备前在-80℃下储存。
为制备再生的HI II II型愈伤组织文库(SATMON025)，制备了含愈伤组织起始培养基的培养皿。此培养基含N6盐和维生素，3％的蔗糖，2.3g/l的脯氨酸，0.1g/l的酪蛋白水解产物，2mg/l的2，4-D，15.3mg/l的AgNO3和0.8％的Bacto-Agar(商品名，细菌培养用琼脂)，并在高压灭菌前将培养基调节为pH6.0。在传粉后9-11天，选择具有测量为约1-2mm长的未成熟胚的谷穗。去除谷壳和丝，将谷穗分成两半并将其放置于高压灭菌的Clorox/tween 20溶液。用去离子水冲洗谷穗并将每个胚从谷粒中提取出来。将完整的胚放置于与培养基接触，去除盾片。将多个胚放置于每个平皿上并在黑暗中25℃下孵育(所有培养基成分都是可以买到的，大多数是从Sigma Chemical Co.，St.Louis，MO购买的)。将形成的易碎的II型愈伤组织转移到没有AgNO3的培养基中并且每7-10天进行一次传代培养。在胚分离后约4周，将愈伤组织从平皿中取出并在液氮中冷冻。在RNA制备前将收获的组织在-80℃下储存。
使用从Life Technologies公司(Gaithersburg，Maryland)购买的Trizol试剂基本按生产商所推荐的从收获组织中纯化出RNA。用磁性寡dT珠基本按生产商所推荐的(Dynabeads，Dynal Corporation，LakeSuccess，New York)纯化聚腺苷酸+RNA(mRNA)。
构建cDNA文库是本领域中熟知的，并且存在许多克隆策略。可以买到许多cDNA文库构建试剂盒。按生产商建议的条件使用SuperscriptTM质粒系统用于cDNA合成和质粒克隆(Gibco BRL，LifeTechnologies，Gaithersburg，MD)。
将cDNA文库平铺于含适当用于选择的抗生素的LB琼脂上并在37℃下孵育充足时间，以便允许个体克隆的生长。将单个克隆逐个置于含包括选择性抗生素的LB液体的96孔微量滴定板的每个加样孔中。在约37℃将这些滴定板孵育过夜并轻轻振荡促进培养物生长。用Qiaprep质粒分离试剂盒(Qiagen Inc.，Santa Clara，CA)，采用生产商推荐的条件将质粒DNA从每个克隆分离。
将模板质粒DNA克隆用于随后的测序。为进行测序，使用ABIPRISM dRhodamine Terminator Cycle Sequencing Ready Reaction试剂盒与AmpliTaqDNA聚合酶(PE Applied Biosystems，Foster City，CA)。
实施例2
从源于各种玉米组织包括胚细胞和胚发生组织增强的或愈伤组织增强的mRNA制备的cDNA文库的EST序列的数据库中识别启动子。此序列也用作对包含前面识别和注释序列的GenBank的询问序列并用BLAST程序搜索同源区。用于随后的启动子分离的表达序列标记(EST)的选择反映了个体cDNA文库或cDNA文库集合中随机取样得到的代表性EST中一种或更多序列的存在。为识别调节玉米胚中的转录序列表达的调节序列，运行了subsetting函数，要求所有ESTs在靶胚文库中找到并且在数据库中的其它非靶EST文库不存在或以低丰度存在。使产生的候选EST接受电子northern函数，其中显示了特定EST的假定组织表达图谱和文库中的丰度水平。识别出具有需要的组织表达图谱和丰度的靶ESTs，并以识别的EST序列为基础设计基因特异性引物。产物得分是指感兴趣的EST克隆和GenBank序列的BLAST匹配程度。百分比丰度是指一组相关表达的序列在得到EST文库中出现的次数。可以执行任何数目的查询而获得需要的ESTs并将取决于EST数据库和可用于序列分析的计算机程序。对于本发明，通过选择相对丰度，严格性和/或产物得分的需要值识别序列。对于SEQ ID Nos36-51启动子序列，在本底≤0，严格性≥50和产物得分≤100的情况下，选择靶丰度≥1。
以这些数据库查询为基础识别代表具有靶表达图谱的cDNA的感兴趣的EST序列的克隆IDs。表1为用于随后分离SEQ ID Nos36-51启动子序列的ESTs提供了本底克隆ID(EST)信息，文库来源和Genbank识别(gi)信息。为基于以10-8P值截止的GenBank BLAST查询的克隆IDs列出序列注释。当向序列数据库提交新序列时信息接受改变。ESTs的注解如下，注解信息在括号中克隆700614347(印度稻胚特异性蛋白(Ose731)基因，完整cds).；克隆700257959(稻类球蛋白mRNA，克隆Ose709，部分cds).；克隆700265029(玉米肌醇-1磷酸合成酶mRNA，完整cds).；克隆700321659(第3组Lea蛋白MGL3的玉米RNA).；克隆700616085(印度稻胚特异性蛋白(Ose731)基因，完整cds)。表1.启动子概括信息序列ID No.克隆ID文库来源GenBank识别器(gi)36 700264271胚，21-DAP无37 700265872胚，21-DAP无38 700263624胚，21-DAP无39 700267629胚，21-DAP无40 700258061胚，21-DAP无41 700614347胚，13-DAPg410569142 700257959胚，21-DAPg409709943 700265029胚，21-DAPg310805244 700266438胚，21-DAP无45 700259522胚，21-DAP无46 700321659玉米愈伤组织 g44404451 700266176胚，21-DAP无47 700257969胚，21-DAP无48. 700613864胚，13-DAP无49，50 700260279胚，21-DAP无实施例3从使用根据Ausubel et al.，1992的CsCl纯化方案，或通过CTAB纯化方法(Rogers and Bendich，Plant Mol.Biol.，569(1985)分离的玉米DNA(从玉米杂交物Fr27 x FrMo 17得到)制备基因组文库。可以买到试剂(例如，Sigma Chemical Co.，St.Louis，MO)。根据生产商的说明(GENOME WALKER，是CLONTECH Laboratories，Inc，Palo Alto，CA的商标)制备文库。在单独的反应中，用下列钝端内切核酸酶使DNA在37℃下接受限制性酶过夜消化EcoRV，Scal，Dral，PvuII，or StuI(CLONThCH Laboratories，Inc.Palo Alto，CA)。用苯酚氯仿萃取反应混合物，用乙醇沉淀，并重新悬浮于Tris-EDTA缓冲液中。然后将纯化的钝端基因组片段连接于GenomeWalkerTM连接物，根据生产商的方案完成产生的DNA片段与连接物的连接。等分GenomeWalkerTM亚文库并在-20℃下储存。
用基因特异性引物1(GSPI)和退火为连接物序列的引物，SEQ IDNO1表示的连接物引物1(AP1)使与GenomeWalkerTM连接物(前面所述)连接的DNA基因组接受初级PCR。将稀释的(1∶50)初级PCR反应的等分物作为嵌套轮PCR扩增的输入DNA，这一轮使用基因特异性引物2(GSP2)和SEQ ID NO2表示的连接物引物2(AP2)，或SEQ IDNO3表示的连接物引物3(AP3)。Genome Walker第一引物(AP1)和嵌套引物(AP2)的退火温度分别为59℃和71℃。一般说来，基因特异性引物被设计为有下列特性26-30个核苷酸长，40-60％的GC含量，对于大多数基因特异性引物，产生温度为60℃范围的高温或约70℃。使用的Taq聚合酶为Amplitaq GoldTM，可以从Perkin-Elmer Biosystems(Branchbury，New Jersey)得到。为进行PCR实验，许多温度循环仪器和试剂盒可以从许多生产商购买，如PE Biosystems(Foster City，CA)，Strategene(La Jolla，CA)，and MJ Research Inc.(Watertown，MA)。在初级PCR之后，用等分物(10-15μg)进行琼脂糖凝胶分析。每一种未知序列从5亚基因组文库和阴性对照组(无DNA)扩增。
PCR成分和条件如下初级PCR成分要求量/体积亚文库等分物 1μl基因特异性引物1 1μl(100pmol)GenomeWalkerTM连接物引物1(AP1) 1μldNTP混合物(每种dNTP 10mM) 1μlDMSO 2.5μl(或2-5％终浓度)10X PCR缓冲液(含MgCl2) 5μl(终浓度为1X)Amplitaq GoldTM0.5μl蒸馏水到50μl的终反应体积初级PCR的反应条件A.在95℃下9分钟B.94℃下2秒，70℃下3分钟；重复94℃/70℃循环共7次C.94℃下2秒，65℃下3分钟；重复94℃/65℃循环共36次D.65℃下4分钟作为最终延长E.10℃下延长孵育嵌套PCR(二级PCR反应)成分要求量/体积初级PCR反应物的1∶50稀释液1μl基因特异性引物2 1μl(100pmol)GenomeWalkerTM连接物引物2或3(AP2或AP3) 1μldNTP混合物(每种dNTP 10mM) 1μlDMSO 2.5μl(或2-5％终浓度)10X PCR缓冲液(含MgCl2)5μl(终浓度为1X)Amplitaq GoldTM0.5μl蒸馏水到50μl的终反应体积嵌套PCR的反应条件A.在95℃下9分钟B.94℃下2秒，70℃下3分钟；重复94℃/70℃循环共5次C.94℃下2秒，65℃下3分钟；重复94℃/65℃循环共24次D.65℃下4分钟作为最终延长E.10℃下延长孵育为分离启动子序列SEQ ID NO36(克隆ID 700264271)，在初级PCR反应中将SEQ ID NO1(A)与SEQ ID NO6结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO7结合。
为分离启动子序列SEQ ID NO37(克隆ID 700265872)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO8结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO9结合。
为分离启动子序列SEQ ID NO38(克隆ID 700263624)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO10结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO11结合。
为分离启动子序列SEQ ID NO39(克隆ID 700267629)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO12结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO1与SEQ ID NO13结合。
为分离启动子序列SEQ ID NO40(克隆ID 700258061)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO14结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO15结合。
为分离启动子序列SEQ ID NO41(克隆ID 700614347)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO16结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO17结合。
为分离启动子序列SEQ ID NO42(克隆ID 700257959)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO18结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO19结合。
为分离启动子序列SEQ ID NO43(克隆ID 700265029)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO20结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO21结合。
为分离启动子序列SEQ ID NO44(克隆ID 700266438)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO22结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO23结合。
为分离启动子序列SEQ ID NO45(克隆ID 700259522)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO24结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO25结合。
为分离启动子序列SEQ ID NO46(克隆ID 700321659)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO26结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO27结合。
为分离启动子序列SEQ ID NO47(克隆ID 700257969)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO28结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO29结合。
为分离启动子序列SEQ ID NO48(克隆ID 70061864)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO30结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ ID NO31结合。
为分离启动子序列SEQ ID NO49(克隆ID 700260279-PvuII文库)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO32结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO2与SEQ IDNO33结合。
为分离启动子序列SEQ ID NO50(克隆ID 700260279-Dral文库)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO32结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO3与SEQ ID NO34结合。
为分离启动子序列SEQ ID NO51(克隆ID 700266176)，在初级PCR反应中将SEQ ID NO1与SEQ ID NO34结合。为进行嵌套PCR反应，在二级PCR反应中将SEQ ID NO3与SEQ ID NO35结合。
实施例4分离并凝胶纯化从嵌套PCR扩增得到的DNA片段。在琼脂糖凝胶中电泳二级PCR的40μl的等分物。按生产商建议的条件使用BIO101Geneclean II试剂盒(Midwest Scientific，Valley Park，MO)将DNA片段将二级PCR产物从琼脂糖凝胶中纯化出来。按生产商建议的条件将纯化DNA与pGEM-T Easy载体(pGEM-T Easy Vector System I，PromegaCorp.，Madison，WI)连接。将连接反应的等分物转化到适当的大肠杆菌宿主如DH10B并将细胞平铺于选择培养基(对于DH10B，100μg/ml羧苄青霉素)。选择细菌转化株，在液体培养基中生长并用可买到的试剂盒如Qiaprep Spin Microprep试剂盒(Qiagen Corp.，Valencia，CA)分离质粒DNA。用SEQ ID NO4(M13向前引物)和SEQ ID NO5(M13反向引物)所表示的M13向前和反向引物的向两个方向的染色终止子方法测序含根据限制性酶分析预测插入大小的纯化质粒。使用的限制性酶也可以从许多生产商处买到(例如，Boehringer Mannheim(Indianapolis，IN)。判断含启动子序列的5′侧翼区并以SEQ ID NOS36-51表示。用于克隆启动子片段到适当载体的工程化限制位点一般是用本领域技术人员公子的PCR方法完成的。
实施例5为进行瞬时表达分析，将启动子片段克隆到表达载体。如果识别了靶启动子的起始密码子(AUG)，则将启动子片段克隆到图1(pMON19469)所示的载体，替代P-CaMV.35S基因元件。如果没有识别AUG，则将启动子片段克隆到允许报道基因如GUS或GFP翻译融合的表达载体。
在瞬时植物测定中检验表达构建体。可以使用许多本领域技术人员公知的测定。为进行GUS活性的组化分析，在13-DAP收集胚并与II型胚发生愈伤组织一起放置于培养基如MS培养基(PhysiologiaPlantarum 15473(1962)。为在瞬时测定中分析启动子，使用适当粒子枪设备用表达载体DNA轰击13-DAP谷粒胚乳的切片和受精(DAG)后14天的幼苗的黄化叶片段(见例如Clrristou et al.，Plant Physiol.，87671(1989)；Klein et al.，Proc.Natl.Acad.Sci.USA，854305(1988)；Ye，G.-N.，et al.，Plant Mol.Biol.，15809(1990)。每个表达载体被轰击到两个独立的平皿上。允许组织恢复48小时然后用X-Gluc(5-溴-4-氯-3-碘β-D-葡糖醛酸糖苷酶)染色检测GUS基因在感兴趣组织中的表达(Jefferson et al.，EMBO J.，63901(1987)。
实施例6
为进行稳定植物转化，将启动子序列克隆到图2所示(pMON39721)转化载体并通过适当运送系统如土壤杆菌介导的转化(见例如美国专利5,569,834，5,416,011，5,631,152，5,159,135和5,004,863，在此引入其全部内容作为参考)或粒子轰击方法(见例如专利申请WO 92/15675，WO97/48814和欧洲专利586,355，以及美国专利5,120,657，5,503,998，5,830,728和5,015,580，在此引入其全部内容作为参考)转化到感兴趣的靶农作物。
为玉米的稳定转化，分离包括驱动Ec.GUS基因表达的启动子Zm.700258061(SEQ ID NO40)的pMON51002(图3)的NotI片段，并将其克隆到植物转化载体pMON39721(图2)的NotI位点产生pMON51008(图4)。为玉米的稳定转化，分离包括驱动Ec.GUS基因表达的启动子Zm.700267629(SEQ ID NO39)的pMON51001(图5)的NotI片段，并将其克隆到植物转化载体pMON39721的NotI位点产生pMON51009(图9)。为玉米的稳定转化，分离包括驱动Ec.GUS基因表达的启动子Zm.700263624(SEQ ID NO38)的pMON51003(图7)的NotI片段，并将其克隆到植物转化载体pMON39721的NotI位点产生pMON51010(图8)。在构建这些植物转化构建体时使用了分子生物学领域中公知的方法，如内切核酸酶消化、DNA片段纯化、连接、细菌转化、抗生素选择、质粒纯化(Sambrook et al.，1989)。用三亲代交配程序(Ditta et al.Proc.Natl Acad.Sci USA 777347(1980)将植物转化构建体转移到根癌土壤杆菌。
使用根癌土壤杆菌(ABI株)并在27℃下将其在含100mg/L卡那霉素、50mg/L奇放线菌素和25mg/L氯霉素的(Sigma-Aldrich，St.Louis，MO)LB液体培养基(每250ml的烧瓶中50ml)中培养约24小时(在150-160rpm的旋转台上)。在3400rpm离心培养物并在250ml的烧瓶中将其重新悬浮于含用于LB的1/2水平的奇放线菌素和卡那霉素以及200μM乙酰丁香酮(AS；用于引入毒性)的AB液体培养基(在660nm下将OD调节为0.2)。在与LB培养物相同的条件下培养15-16小时后。收获土壤杆菌悬浮液并将其在含AS的1/2 VI培养基中洗涤并离心，然后重新悬浮于1/2 MS PL培养基(也含同样水平的AS)。土壤杆菌的终浓度为约1×109cfu/ml(等于660nm下OD为1.0)。
在我们的实验中的转化使用了玉米三倍杂合体(Pa9 1xH99)xA188。无菌收集大小为0.5mm到2.0mm长的玉米不成熟胚并浸入含土壤杆菌和200μM AS的1/2 MS PL的液体培养基中。在一页纸上干燥不成熟胚，然后将其放置于含3.0mg/L 2，4-D，200μM乙酰丁香酮，2％蔗糖，1％葡萄糖，12mM脯氨酸和20μM硝酸银的1/2 MS协同培养基在23℃下培养2或3天。然后将不成熟胚转移到由15AA大分子和小分子盐，1mg/L 2，4-D，12mM脯氨酸和500mg/l羧苄青霉素组成的15AA延迟培养基并在27℃下培养5天。将胚转移到含有含1.0mg/L2，4-D，12mM脯氨酸，750mg/l羧苄青霉素和50mg/L巴龙霉素的15AA培养基的首选培养基并在27℃下培养2周。然后将胚转移到同样的但含更高水平选择试剂(100mg/L巴龙霉素)的培养基中培养2周，然后将这些胚转移到含200mg/L巴龙霉素的培养基中再进行一次或两次选择。将所选的愈伤组织放入MS 6BA再生培养基约2周，然后将它们再转移到MS OD培养基并在照明室中培养。选择有旺盛生长的根和茎的幼苗并将其置于土壤中健化7天，然后放置于温室中。
将温室中的转基因植物与H99杂交，在传粉后13天和21天收获它们的不成熟胚进行GUS染色(表2)和MUG(表3)活性测定。转基因植物组织的GUS染色测定(Jefferson et al.，EMl30 J.，63901(1987)为判断玉米叶、根、胚、胚乳和种皮组织的表达模式提供了本发明玉米胚增强型启动子的定性分析。不检测叶中本发明启动子序列的GUS表达，而且不经常检测根组织中发明启动子序列的GUS表达。检测种子中特别是种子胚中的GUS表达。这些启动子表现出在种子和与根、叶或其它植物组织中的表达相关的种子相关组织中增强的表达。
表2.在转基因玉米组织提取物中的定性GUS活性Zm.700258061Zm.700267629 Zm.700263624pMON51008 pMON51009 pMON51010叶中的GUS- - -活性根中的GUS 15％+/85％-*18％+/82％-*16％+/84％-*活性胚中的GUS+ + +活性胚乳中的GUS 糊粉中的部分+- 糊粉中的部分+活性其它部分- 其它部分-
种皮中的GUS +/-+ +/-活性+有GUS活性-没有可检测的GUS活性+/-不确定或阴性*一些植物的根组织是阳性的MUG测定提供了转基因种子中胚和胚乳表达的定性分析。从解剖转基因玉米植物的每一半穗得到的10个胚和10个胚乳中提取蛋白。在13dpp的时间点测定阴性对照PHxA/CK野生型玉米组织。MUG测定使用加入组织的500μl GUS提取缓冲液，在1.5ml的eppendorf管中用聚四氟乙烯杵研磨组织并在4℃下以10K RPM离心5分钟(BeckmanGS-15R)。将400μl上清液转移到96个深加样孔的新滴定板。在干冰上冷冻提取物并在使用前在-80℃下储存。MUG测定由一下步骤组成，用4-甲基伞形酮(SIGMA Ml 381)进行从31.2pmol到2000pmol的连续稀释产生活性的标准曲线。在预读植物将本底调零后以双份将5μl的每种提取物加入平底96孔滴定板(Falcon 3872)。将200μl GUS测定溶液(0.1M KPO4 pH7.8，1.0mM EDTA，5％甘油，1.0mM DDT，2mM 4-甲基伞形酮葡糖醛酸糖苷酶Fluka 69602)加入每个加样孔并用加样头与样品混合。在37℃下用过滤器对在F-max(分子设备)上动态读取滴定板激活-655/散射460。典型的读数由以3分钟为间隔持续1小时读出的21个读数组成。根据每个样品的MUG结果和蛋白结果计算GUS活性(pmol/min/μg蛋白)。用Bio-Rad蛋白测定试剂盒测定总蛋白。将BSA蛋白连续稀释为0.05mg/ml到0.5mg/ml，用于制造标准曲线。将双份1.5μl的提取物加入平底96孔滴定板(Falcon)。加入200μl稀释染色试剂并与样品混合。在室温下孵育5分钟后在室温下Spectromax 250(分子设备)中测量595nm下的吸收。MUG分析证明了前面描述的本发明分离的启动子在玉米种子组织中表达并且在胚和胚乳组织中的表达不同。可以从本发明的启动子转化的，在种子中胚和胚发育的不同阶段表达的植物群中选择独立转化的玉米系。表3.MUG测定/pmol/min/μg蛋白构建体启动子植物#胚/ 胚乳/ 胚/ 胚乳/13dpp13dpp21dpp21dpppMON51008 700258061 s1281150.4 00.3 0.1s1282223.3 0s128230.4 0.1 8.6 0.3s12824 0 0s128292.7 019.1 0.6s128320.2 046.9 2.4s128349.8 0.3s128365.4 1.412 0.3s128260.9 0 210 0s128281.9 0135.9 0s128336.6 0.2 135.5132.9s1281372.22.70.8 0.5s128356.7 0.266.2 1.8pMON51009 700267629 s13745 0 1s137460.9 0 20.3 1.1s13747 0 0.2 0.7 0.9s13750 0 0.1s13752 0 0s13753 0 0s13754 0 0s13755 0 0 0 0s13756 0 0s137570.2 0.2s137591.6 0 1.2s13760 0 0 0s13761 0s13763 0 0 0 0s13764 0 0s13766 0 0s13767 0 0s13768 0 0s138110.6s13813 0 0s13814 0 1.4s13815 0 0.3s13816 0.7 0.6
s13817 0 2.7s13818 0.8 0 5.2s13819 3.8 0s13820 0.1 0.4s13821 0 0.1构建体启动子植物#胚/ 胚乳/胚/ 胚乳/13dpp13dpp21dpp21dpppMON51010700263624 s13769 00s13770 00s1377100s13772 00s13773 5.6 0s13774 00s13775 00s13776 6.4s13777 00 6.6s13778 00s13779 00 27.3 1.8s13780 3.3 0s13781 00s13782 00s13783 00 5.4s13785 0.5 2.3 0s13786 3.6s13789 00s13791 00s13792 2.8 0 23.4 0s13793 005s13794 00 4.3s13795 0 3.8 0s13797 00 4.1 0s13799 00s13801 1.8 0 5.9s13802 00 47.5 6.1s13805 00 5.1s13806 00s13807 00s13809 00s13810 00s13826 00s13827 0.4 050s13828 00 0.4 0PhxA/CK-00
许多转化和再生系统和方法都是可用的并且是本领域技术人员公知的。随后用任何数目的本领域技术人员公知的分子、免疫诊断、生化和/或大田评价方法分析稳定转化植物和后代中基因在感兴趣的组织中的表达。
实施例7适当的启动子调节所必需的顺式作用调节元件可以用许多方法识别。在一种方法中，执行缺失分析而去除启动子区域并测定产生的启动子片段的启动子活性。如果截短的启动子活性与原始启动子片段的活性相比有改变，那么就认为DNA片段是启动子调节所必需的。通过这种缺失分析，可以识别哪些小的DNA区域是转录的正或负调节所必需的。也可识别启动子序列基序和制造为含这些调节可操作连接的转录序列的表达的顺式元件的新型启动子。见例如，美国专利5,223,419，在此引入其完整内容作为参考，美国专利4,990,607，在此引入其完整内容作为参考，以及美国专利5,097025，在此引入其完整内容作为参考。
另一种方法是寻找有相似表达图谱的启动子之间的相似序列。有重叠活性模式的启动子可以有共同的调节机制。一些计算机程序可以用于识别启动子之间的保守序列基序，包括但不限于MEME，SIGNALSCAN，或GENE SCAN。这些基序可以代表调节启动子的转录因子的结合位点。当识别了序列基序后，可以测定它们的功能。例如，可以将基序序列从启动子去除从而判断此基序是否是正确启动子功能所必需的。此外，可以将基序添加到最小启动子而检验它是否足够激活转录。可以通过添加活性启动子并寻找启动子活性减少而检验怀疑的阴性调节元件的丰度。一些顺式作用调节元件可能要求其它元件的作用。所以，可以以任何数目的本领域中技术人员公知的方法的结合检验多种元件。
当识别了功能性的启动子元件后，可以在核苷酸水平修饰启动子元件而影响蛋白结合。这些修饰可以导致更高或更低的亲和结合，这将影响启动子的转录水平。
启动子元件可以补充或协同作用而影响总体启动子活性。在这点上，可以将不同5’调节区的启动子元件置于一前一后的位置，从而获得有不同表达谱或更高水平表达的启动子。另外，可以将启动子元件多聚化，从而增加特异性以该启动子元件影响的模式的表达水平。
构建含新型的工程化的5’调节元件的表达载体所需要的技术方法是本领域技术人员所公知的。在表达载体中检验工程化的启动子并通过将新型启动子与适当报告基因如GUS可操作连接并在瞬时植物测定中进行瞬时检验。将新型启动子与一种或更多感兴趣的基因与一种或更多额外的调节元件插入植物转化载体并用适当的DNA运送系统转化到感兴趣的靶植物中。用任何数目的适合评估所需农业特征的分子、免疫诊断、生化、表型或大田方法评估稳定转化的植物和后代。
按照这里公开的方法，植物分子生物学领域的技术人员可以分离能够调节与启动子异源的可操作连接的DNA序列转录的DNA启动子序列。这些启动子对增强植物种子、植物胚发生组织核植物愈伤组织中转基因的表达有用，这种表达与这些启动子可以在其它植物细胞和组织，如根和叶中指导的表达水平相关。作为本发明的启动子序列的DNA分子包含各种顺式作用元件，它们是从具有已知启动子序列的DNA分子中分离并与其融合建立杂合启动子序列。这些杂合启动子将有不同于已知启动子序列和通过本领域中的方法分离的启动子的表达模式。在植物中行使功能的熟知的启动子包括，但不限于花椰菜花叶病毒35S和19S启动子，玄参花叶病毒35S启动子，甘蔗杆状病毒启动子和其它植物病毒启动子，植物肌动蛋白启动子如大米肌动蛋白启动子和拟南芥肌动蛋白启动子和植物泛素启动子。这些启动子具有识别用于指导在转基因植物细胞中转录的最小序列。这些最小序列是本发明DNA分子的顺式作用元件的杂合启动子的成分。
已经举例说明并描述了本发明的原则，对本领域的技术人员应该很明显的是，可以在不离开这些原则的前提下对本发明的安排合细节进行修饰。我们要求保护所有在所附权利要求精神和范围内的所有修饰。
在此引入在本说明中引用的所有出版物和公开的专利文献作为参考，其范围与特定和个别指出引入作为参考的每个个别出版物或专利申请相同。
序列表<110>T.W.康纳(Conner，Timothy W)I.察夫里尔(Tzafrir，Iris)<120>选择性控制基因表达的植物调节序列<130>06009.0019.NPUS00(RENN019)<140>US/09/651,169<141>2000-08-30<160>51<170>PatentIn version 3.0<210>1<211>22<212>DNA<213>人工序列<220><223>人工序列说明引物<400>1gtaatacgac tcactatagg gc 22<210>2<211>19<212>DNA<213>人工序列<220><223>人工序列说明引物<400>2actatagggc acgcgtggt 19<210>3<211>30<212>DNA<213>人工序列<220><223>人工序列说明引物<400>3agggcaagct tggtcgacgg cccgggctgg30<210>4<211>23<212>DNA<213>人工序列<220><223>人工序列说明引物<400>4cggcagggtt ttcccagtca cga 23<210>5<211>24<212>DNA<213>人工序列<220><223>人工序列说明引物<400>5agcggataac aatttcacac agga 24<210>6<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>6cagaaagcct ccattcctta tcaggca27<210>7<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>7cgagaggaag tgcctggcgt aatcaaa 27<210>8<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>8gctcatcaga gttgccgtcg ttgcta26<210>9<211>44<212>DNA<213>人工序列<220><223>人工序列说明引物<400>9cgcggatcca gatctactcg tctgacccat ccgttatcac tccg44<210>10<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>10agtgaggcga tccattcacg cgccta 26<210>11<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>11gatcgcttgc actctctgcc tctctg 26<210>12<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>12tctccccgca aggcgcgtat ctgatga 27<210>13<211>42<212>DNA<213>人工序列<220><223>人工序列说明引物<400>13cgcggatcca gatctggcgc gtcggggcac cggccggcgc ag 42<210>14<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>14ttgccgaccc ctccttcacc ttctcct 27<210>15<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>15tgtccttcgc cttcaccttc gctgtct 27<210>16<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>16ggaatctcca cgttctggca cgacga 26<210>17<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>17tgtctctcgc aaagtcgcaa tgtctg 26<210>18<211>28<212>DNA<213>人工序列<220><223>人工序列说明引物<400>18tgaggctgga cggtttgatc tcccactt28<210>19<211>42<212>DNA<213>人工序列<220><223>人工序列说明引物<400>19cgcggatcca gatctgaaga agaagaaccc gagtcgccac cc 42<210>20<211>29<212>DNA<213>人工序列<220><223>人工序列说明引物<400>20agctctcgat gaacatcttg cctttcctc 29<210>21<211>43<212>DNA<213>人工序列<220><223>人工序列说明引物<400>21cgcggatcca gatctgaatg gaatgcgaag cgaggtagcg agc43<210>22<211>29<212>DNA<213>人工序列<220><223>人工序列说明引物<400>22acgacacctc tcgccatagc aaactctcc 29<210>23<211>44<212>DNA<213>人工序列<220><223>人工序列说明引物<400>23cgcggatcca gatctcattc atctgatcca tccgtcacca ctcc 44<210>24<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>24ggagatgtgg ttgagcgcca tcatcgg 27<210>25<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>25agtctcagtc ctggcctctt tggggtg 27<210>26<211>30<212>DNA<213>人工序列<220><223>人工序列说明引物<400>26caaatcactc ggagaaagaa atatgcttgg 30<210>27<211>29<212>DNA<213>人工序列<220><223>人工序列说明引物<400>27ggctactact gactgtgacg atggtgctc 29<210>28<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>28ccagaagcag gaggaggacg aagaagg27<210>29<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>29gaaacgaact ccagagcttg ccgagg26<210>30<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>30acaagacgat tcccagacaa gggacca 27<210>31<211>26<212>DNA<213>人工序列<220><223>人工序列说明引物<400>31gcccacacct cacggcatcc atattt26<210>32<211>29<212>DNA<213>人工序列<220><223>人工序列说明引物<400>32acgagcgcca cttgtcttga acttgttgg 29<210>33<211>41<212>DNA<213>人工序列<220><223>人工序列说明引物<400>33cgcggatcca gatctagcgc gaactgccgg cggcgctgct c 41<210>34<211>27<212>DNA<213>人工序列<220><223>人工序列说明引物<400>34gtcggttaga ccgaacaaaa attcagc 27<210>35<211>43<212>DNA<213>人工序列<220><223>人工序列说明引物<400>35cgcggatcca gatctgtcgg ttagaccgaa caaaaattca gcc 43<210>36<211>654<212>DNA<213>玉米(Zea Mays)<400>36ctgcccatcg tcgcgcgccg gaggcccgac ggccgaggat ggtccttcgt gtgggacgac 60gactcgytty tgctccagct ccgcgacggc attcccgagg atatggaggt gytcttcgtc 120ggytccctcc gcgccgatgt ccccgtagcc gagcaggacg aggtgtcgca ggcgttgctc 180gaccggttcc gytgcgcgcc ggtcttcctc cctgaccgcc tcaacgaccg cttctaccac 240ggcttctgca agcgccaact ctggcctctg ttccactaca tgctcccctt ctcctcatcc 300gcgtccgccg ccggcaccac ctcttcctcc tccgccgcca cttgcaacgg tcgcttcgac 360cgcagcgctt gggaggcgta cgtgctcgcc aacaagttct tcttcgagaa ggtcgtcgag 420gtaatcaacc cggaggatga ctacgtttgg gttcacgact accatctcat ggcgctgcct 480accttcctcc gccgctgctt caaccgcctc cgcatcggat tcttcctcca cakccccttc 540ccctcgtccg agatctaccg caccctccct gttcgggagg agatactcaa ggcgctgctc 600aactgtgacc taattggctt ccacactttt gattacgcca ggcacttcct ctcg654<210>37<211>277<212>DNA<213>玉米(Zea Mays)<400>37ctgggacgac ggttcgtgag cgactttccc atatacgatg gccgtggctc cggcgcccgc 60ctcgtcgctc gcttgcaggg agtcactgtc caaatcggca gctcgcacta gctagtcagc 120atcgtcttcg aggccgagag gtagttaaat gtatgcatgc atgcatgtag tatatatata 180atgcatgtgc gattcattca ttggttcatc gtcgtctgca ggcttaaggg ctccacgctg 240ctcaccaacg gagtgataac ggatgggtca gacgagt 277<210>38<211>476<212>DNA<213>玉米(Zea Mays)<400>38aaaaaatata gtttctaaac tagcccttag aagatactta aataagtatt gtttcttatt 60tttacgggat gctatgcgga ggggtctact acacatattt actatctcat ctcccatttt 120attctatatt atatatatat aaatttgcaa acattgttat acatcgtcat ttccagtgag 180acacagcggt cgtgtcatca gaaaagcgga cacgcgtcgc gtcgcgaggc caggtgggtt 240atgcacggac ctgctatgct agccatgctc caggctccag ctccacccgt ccaccgactt 300ctcttctcaa cgagactgcg tcctcaccat gcacgacgac acgtgcgatg ccatcacaca 360tccacactca cctgttgcct ctatatccac cgccccaccg ccgtagcacc agaaagaaat 420gtacagtcta cagtctacac acaagctgac cagagaggca gagagtgcaa gcgatc 476<210>39<211>344<212>DNA<213>玉米(Zea Mays)<400>39atcaggttag actaacttcc tttctctgtt atgcatatgc atgtgtgtat gccttttgat 60ttcttggtat gatggaataa tcaggggtgg atctgcaccc tgaaccaccc tgtcgtggcc 120cagggtttga tccatgtaat cctttataag tctatttaat ccagtataaa atgacttaga 180taaaaggtag agaagaaaat ttagtgccga gctaccaagg caccttcttt attccgtcct 240tgctcagtca cacctcgctc tcgctcactc tcgccgtccg cacagccgct catcgtctcc 300cactgcctgc cctctccctg cgccggccgg tgccccgacg cgcc 344<210>40<211>547<212>DNA<213>玉米(Zea Mays)<400>40aaaaattttt tagtctaaac gtgattttac ttctgtttaa gtttaagggc taaawtaaaa 60aaaaattcgg cagaagaaac tacgcgcgga cagagaaata cgatcggcca agccgtatac 120ggagacgtgg cgtgatcctc tcagcacagc attccctagg tggtggtgat gtctgccttc 180accactatca gatttgcaca cgcagccacg caggacatct gctacagggc acgcggcggc 240tcagaacgaa gctacgagca cagcgaggtc gccacctcac ggtgcgacgt gcagctccag 300ctgctcaccg accactgcat gtcgcccacg taagattcaa ccagtccgcc actccaagat 360ccaagactcc agagaccggc cggcctggcc gctagctttt atatacttcc ggcagccatg 420caccctcatg tccagcatat cgacgcagag tcgcagtcgc agcacacact gaattctctt 480tagctagcta agagarggta gccacaccaa gacaggatgc agacarcgaa ggtgaaggcg 540aaggaca547<210>41<211>856<212>DNA<213>玉米(Zea Mays)<400>41actttagtta gggttcggtc tttaattctt ttgctgggca gcagtaaacg gagatgagaa 60gcgcgagctg atcattgttg ccattctgtg caacgaagct aggggaccaa tgctgactcg 120cacgagggca tagttgctga tggtcataga cgacgcgttc acttaaaata ataaagaatt 180ataaattgtt gtcataagtc gtgcagccta atataggaga gtgcggcatt gctgtagcta 240attaagagag tattccggtc atgcttgagc ttggagaatt tttgaggscc cgttcgcttg 300gagagtcgga gatttttgag ggcccgtttc gcttgcacaa tawtaaacaa agatttgttc 360tagctcatcc aaatctatat aaattaaaga agtaattcgg ttaggaatca atccaagagc 420tctaattctt aaaaaccgaa cagggcctga gttgtttgtc tagacgacat tatctgatta 480agttattttc atcttcaatt tcaaatgtga tctarcagca taaaacttgt tgtctgacag 540atatttgact tccacacggg ccacagctca attacaaaca tacttcaaac atcaggcaga 600ggcagagcac tagcagcatt cgctacgtgg cggtgggcag cagtggccag cacattcgac 660aactgccacg gatcccgtac tacttcaaac acgtatcgct tccagaatcc agagtcacac 720gtgtgcagct gcatgaaccc agctcactcc cttaagaaca gctcgacgct cacctgtcta 780gtctagctcg tgcatgccgc cctgagcgcc actgcacaga cgcgcagaga cagacattgc 840gactttgcga gagaca 856<210>42<211>1137<212>DNA<213>玉米(Zea Mays)<400>42ctgcacggat gcggccgagt gcggcagcac agcagcgcgc gcgcgctcca catcgccttc 60gctagttcgc tccgccacgt acgcggcccg gcctccacct ggcggcgcgc atggctgcga 120ccctcgccgc gccacctctt catatacgct gcagctcgcc tcgaaccctc gcatcgaacg 180cacactcgca ctcgcacgta caccacacta gttaccacag acgacgggcg ccatgaaagt 240cccggtgctt cttctcctgg tctccctgtg cttctcgctc gcgctcgcgt ggcaaacgga 300cacggaatcg ggctcaggca ggccgtacca ctacggcgag gagagtttcc ggcactggac 360gcgctcccgg cagggccggt tcagggtgct ggaacggttc acccacgagc tgctggagga 420cgccgtcggc aactaccgcg tcgccgagct ggaggccgcg ccgcgcgcgt tcctgcagcc 480cagccactac gatgccgacg aggtgatgtt cgtgaaggaa ggcgagggcg tcatcgtgct 540gctccgcggc gggaagaggg agtcgttctg cgtcagggag ggcgacgtca tggtcatccc 600cgcgggcgcc gtcgtgtact cggccaacac gcaccagtcg gagtggttcc gcgtcgtctt 660gctcctcagc cccgtcgtct ccacgtctgg acgcttcgag gttcgctttg cttctcgtgc 720tttaatcttg catgcaaata gatggaggtg acggaaactt ctgttctctt cgtgatttcg 780gcaggagttc ttccccatcg gaggcgagag ccccgagtcc ttcctcagcg tcttcagcga 840cgacgttatc caggcgtcgt tcaacgtatg catgcccttc atcgtcctca cggccgggtt 900tcttctctta tacatcgatt tttcgctagc tagctagcaa actaacccag atttgaacac 960gaccatgcat gtgtcctaga ctcgccggga ggagtgggag aaagtgttcg agaagcagag 1020caagggggag atcacgacgg cgtccgagga acagatccgg gagctgagca ggtcctgctc 1080acgtggtggc cgcagcagcc gcagcgaggg tggcgactcg ggttcttctt cttcaga 1137<210>43<211>753<212>DNA<213>玉米(Zea mays)<400>43atcactacag tttataatgc ttcagttttc gaatactaca atatccaata cataaaggtg 60tttgggaaaa actttggttg agaccaatca gccagagcgg gaccaagctg tcgctctctt 120tacagagaaa aactttggtg agaccaaagt tttcaaaact gcaaaacaag tacagtattt 180acaatattat agtttagtat acagaaattt cagataaatt ttcaaacacc tcaaaatata 240taataccaca gtattactca atactataat attactataa tactacagaa aaactttgtt 300ctcaaacacc tcttccatcg gtatgtcctc cgtcatcccg aaagccttca ttcggctcgc 360tgtcttcttt ctatcgctca caacacaacc atagcccaca ggccgccggc ggccgccagc 420cgacgtcctc ccatttcgct ccccctcctc cgctgcggtc gagcaaaagt tccggccatc 480cggcaatccc cccgcacccg gcggttcaaa ccgtatcttt ctgacctgac gcggctacga 540cgtcgctcct ccggtccctt cgatccggtg gggtccgttt ctttcaagcg cggcctcgct 600ggccgcctcg tggcagtgac cgtcgaaccc tctataaatc ccgtgccccg agcacccttc 660ctcgatcaca caacccaaag cagccacagc agcctccttc ctcctctcac tctcgctcgc 720gctgcgctcg ctacctcgct tcgcattcca ttc 753<210>44<211>684<212>DNA<213>玉米(Zea Mays)<400>44gtgttgtcca aactggacat cagacaagca cgacaatgac aggcgttcgc caagtgtacg 60tacaggagac gaacacgaca agtagcaccg tcctggccga gagcccgtca tgctcatgca 120tgcatgctga tcatctcgat aaatatacag cagagagctg agctacgtac acaaacaaga 180agcttgcatt gttcgtttgc tcgatcgttg cagataatgg agaaccctgc tccgagtatc 240gtagcgcccc ccattgccgc acctgtatca gcgaacttca gcagactcgc cttccgcaac 300ctgtacatcc gacggacggg tccagacagc agggagatgg tgactgtgga gggaagaaga 360ggctctagtg atcagacagg cgacatgagg tacgtgagtg acttccccgt ctacgatggc 420cgtggctccg acgccgtcct ggtggctcgc gtgcagggcg tcacaaccac gttcgggaac 480tccaaccagt tcttcaccgt cgccttcgag gccggcaggt tcttcgttta gacagatata 540tagctagata gatgctagct tgtggttcat atatagcaga tagatatatg catccgccat 600tgatcgtcca tcgtcatcga tcagcaggct caagggctcc acgctcctta ccgaaggagt 660ggtgacggat ggatcagatg aatg 684<210>45<211>1025<212>DNA<213>玉米(Zea Mays)<400>45actccgtact tctaaagggt gggttattta tgtacatggt ccttgcgtta cggagtttga 60ataaacaaaa acaaaaaaat atatagatga ataaacaaat cagtcacaaa aacaaaaaaa120atctagatga gaaataaatc tggacggaca aatcagcaac ataaacaaaa aatatggaca180acaaaaaaca aatttgtgac aaagacaaaa aagaaaacta ttaaacgccc accatgagac240ttgaacccac aacctcaagg ttaaaaacct tatactctac cgactaagct agatgagttt300tgtcattaca tattcgagct cggcggcata gatcttggcg ccgagctcgg tgccacgttg360gcgccacgtc gtctaggttg tgccagcgca acacgttctt cggcgtcata gcctatggcg420ccgagatgtg ttacctcggc gctataggct atgacgccga gtaaagggtc caaaagtgac480attaaaattt tttaaggtct aaacgtgaat ttttttcaga gaaacggaca aaatacaaaa540agttcgggcg catgcatggg tggggtgacg gtggcgctcg caactcagta actcacacgt600gcccgctcgg actcaagggg ctggggcacg ggcatgggca tgggcgcatg gcatgcctgc660aagcagagtg tagcagacgg cgtcagcacg ccaccttggc cgcttggcgg ccacacggtg720ccgacctgac aggggcgcgc gctctcgagt cccagtccca ggctactgcc gtggcgggcc780ttacggccgc cacgtcggcc gaggccaccc atccatgcaa gcggcgcatg ggaacgtggc840attccggcgc gacggcacga ccgcgctccc gcgccatgcg tcacggtcac gtgcacgcag900agccccgctc gccttctata ggtagcgccg cgcgggtggc gtcgcttctg gtctgtggcg960gatcggatcg acacccagcc agcgcgtgga gagtagaaca ccccaaagag gccaggactg 1020agact 1025<210>46<211>910<212>DNA<213>玉米(Zea Mays)<400>46aaatttgtgc ccttagtttt agtggtgtgc tcacatataa cctcagtcgt gtttttttct 60cagctgtgct cacatacgag cacgtacaat gagactgaca aacgagcgtg aatgggtagg120gagttttgtt ggagatacga ataattacac aaatcgtata aaatacggat gctaagttta180atagggtgat tgttaaagtt ggtctaagtg gataaagcag ctcaatagta gaaccgaggc240aaccccggtg aagaaaacaa gcgctcgata agcgcatgta tgggcatggg tgcaccgtgc300atgtccaggc cacctggagc tcgctcgcgc gtattgctcc actccaccgc atcaccacca360ccaagtggca tgcatatcga gcagagggaa accacatcca acttgtactc gatcgccact420gtcgacattt ccctatcgtc cgtctgaacc gatcaacagg tgatgagatc gatcgtgatc480gtcatctggt accgttcgtg caccatcgcg tcgagacgag agcaacgcac tcgatttgta540ctccactact agttcttccg gccggcctac gggttctctc tcaaacgtgg cgagtgcctt600gcacatggtg gtggtccggt gaccagctga ccgacgccta tgggcgtgcg cgcgcgcgaa660tcagctccat cgacatgggc aggcttcgcg aaggtacgga cctcgtgaca caacacagcg720cgtggcgtgt cctttctacg tggccgtcat gtgggaggct gggagcccgg ccacgctacg780tggcccgggg actgcctcgc tgctgctgct tataaatatt ccccgctgga aaagccccca840gccatcatca gtagctagct gttcgaagct ttcagccgat cgagcaccat cgtcacagtc900agtagtagcc 910<210>47<211>734<212>DNA<213>玉米(Zea Mays)<400>47actcggcaaa gagaccgctg gcgatgtaca gttcgccgaa cgttctttgc caagtgttac 60actcggcaaa tcttttgccg agtgtaaaat arcctttgcc gagtgtctga gacacatggc120aaaggagctg attccggtag tgatgtatta cttgtgatca ttttggagat gaagagaggc180cactaatgct tcattttgaa tgtttgtgtc actatttgtt tttcttcagc ttcattttga 240tccgattcaa aaagaaaagt tttattttga taaaactcta acattttgta tttttgtttg 300tctaatgtgc agttgaagaa gcgcatgavc cgkttaagag gaagcstaga aagatgaggc 360agargtcaag tacacatcga gggagatyca wggrgtgtcc ccgccarccc ttgcsttgga 420ttgccytgcy ggkgtagtac aaacagtttc attttccytt gcgtggtckt gggcccamam 480cgtcgtcstg twtaacmaag cggctcawkc araccaacac gcggsgartc ccarcgctty 540camagcawta mcgccgccyc ytycamatka rgsktyaatt caargsgccc aatgcaactc 600ccttttctct tgtccctgtc ctttccgcaa cagagcttgt gagcttgacc agcgagaggc 660gagtggctag gacctaggcc tccgatccat gcaggtccct gtgggtttcc tcggcaagct 720ctggagttcg ttttc 734<210>48<211>1129<212>DNA<213>玉米(Zea Mays)<220><221>misc_feature<222>(1)..(1129)<223>N＝任何核苷酸<400>48cctctttcct ttagaggggg aatacaatta tatgtcttgc ttaccttcaa tgcttgctga60atcaagatct ctgtaatgtg ctaccatgct attttaactt aggggacagt atgatccagc 120cttatgggct ggcaaagtgg gcaatagttg gcgtacaact gacgacataa cggatacatg 180gaaaaggtaa cccatgttct tttcagagga aaaaagagat agaacattag ctctgtcgat 240gtgctctcaa actgacttat ttatgtatct ggtgaaaaca agcatgacag acattgctga 300taagaacaac aagtgggcat catatgctgg acctggtggt tggaatggta attatgttag 360tgatgagttc aagctgtctg caatttgctg tgctttgtgg agctgttcag tatactgtta420ctctgttatt gaacctctgc ttttctgcag acccagatat gctggaagta ggcaatggtg480acatgacctt aacagagtat cggctcacat tttagcatat gggytctcat gaaggtaagt540tttcactgar aattggaccc gatgttgtat gktcatattt tgagtaagga ggttcgacca600angagttttg aaaattaaaa actgtagttc attgaagatg atggttggca tgtaagtatt660acagttattg attctccact tactgatgtt acatttggat gcgagaaagg agatatccta720ctcntaatgg gttaactgct accttatata ctgttgtgct tcaggcccct ctattaattg780gctgtgatgt cagaaacatg acttctgaaa caatggaaat actgagcaac aaagaagtaa840ttcaagtaaa ccaaggtatt attctgattc ttctttcgga gagaacatgt tatcctggtt900tagtatcaca ggctacaaaa atatgttttt acatagaaac tgacaacctt cttatttttg960tatataattt cccaacatat cttatatggc agaacaattt aaattcgtaa tgctcatata 1020atcacataaa ctcttgagtt gcatgtgttt tattttctgc agatcctctt ggagttcaag 1080gaagaaaaat tttaggacaa ggaaaatatg gatgccgtga ggtgtgggc 1129<210>49<211>571<212>DNA<213>玉米(Zea Mays)<220><221>misc_feature<222>(1)..(571)<223>N＝任何核苷酸<400>49tnacagaatg atcaaantgg attttgnatt gatcaagggg gnaagtgttn caattttttt 60gttgaccaat ccaaaggggc tcgacgaaat acattcctaa agggacacac ccctagggca120agcttggtcg acggcccggg ctggtataag tctgtcttcc ctgcaataaa gcgaatacaa 180cttgccattc tctcgagtct cgttttcact gcgctttaac aagagctaaa aagtgcgaga 240ccgcgagaga aatccagcag gtgtacgtac gtaaagcgag agtcgacgcg tgggcgcggc 300agacgcgagc ctcccgccac gttggcctcg ttcccgcgcc acgcggccac gcctgcctgc 360ctcctcacct tgtttatatg cctcgcgcct ccctcaccgt gccaatgcca tgcgcgcgct 420actgcatctg cggctcatca atccgtgcag tcccagagca ccccgtcttc ccgctactcc 480cgcaagggcg ctcgtcgctt ccttctccgg ggcgtggcag gcaccttctg gtagagcgag 540agcgagagca gcgccgccgg cagttcgcgc t571<210>50<211>579<212>DNA<213>玉米(Zea mays)<400>50aaatattaga tactactgat aaaaaagata aacaccatta gctatattac caccctctcc 60aactgttttc tgaactaatt gtaaatgggc ccatagtgta gtcgtcaagc atggaggccc 120gctcgaccga cctcctcgat cgctcaaatt tggaaacagc ggttgctact gaccggggtg 180agtgctgcgt tgttggcgac tgccctgttt tttaatggat tcagtgagag ctaaaaagtg 240cgagactgcg agagaaatcc agcaggtgta cgtacgtaaa gcgagagtcg acgcgtgggc 300gcggcagacg cgagcctccc gccacgttgg cctcgttccc gcgccacgcg gccacgcctg 360cctgctccta ccttgtttat atgcctcgcg cctcctcacc gtgccaatgc catgcgcgcg 420ctactgcatc tgcggctcat caatccgtgc agtcccagar caccccgtct tcccgctact 480cccgcaaggg cgctcgtcgc tttccttctt ccggggcgtg gcaaggcacc tttttggtaa 540aagcgagagc caagagcagc gccgccggca gttcgcgct579<210>51<211>193<212>DNA<213>玉米(Zea Mays)<400>51ctgtttcagg catatctgcc acctcggtca catgccgtcc gccacgtcga gaccgcgagc 60tccatacgtg tcacgcgcag ccattcccga cgtctccggt gccgtgtttt aaagaacgcg120ccgtagcgca gcgcactgcg ccactcatct gatgccgtaa cacaaggctg aatttttgtt180cggtctaacc gac 19权利要求
1.一种分离DNA分子，包含选自SEQ ID NOS36-51或具有至少20个核苷酸的其片段的多核苷酸。
2.权利要求1的分离DNA分子，进一步包含与该DNA分子连接的第二种多核苷酸分子。
3.权利要求2的分离DNA分子，其中多核苷酸使得转基因植物胚发生组织或植物愈伤组织或植物种子中第二种多核苷酸分子的表达增强。
4.权利要求2的分离DNA分子，其中多核苷酸分子为杂合启动子。
5.权利要求4的分离DNA分子，进一步包含最小启动子序列。
6.一种分离DNA构建体，包含选自SEQ ID NOS36-51或具有至少20个核苷酸的其片段的分离多核苷酸，其中该分离DNA分子，其中该分离DNA构建体与第二种多核苷酸和3’非翻译区可操作连接。
7.一种转基因植物或植物细胞，包含权利要求6的分离DNA构建体。
8.权利要求7的转基因植物，其中该植物为单子叶植物。
9.一种制造转基因植物的方法，包括(i)将包含(a)包含选自SEQ IDNOS36-51或具有至少20个核苷酸的其片段的多核苷酸的启动子，其中启动子被可操作连接到(b)第二种多核苷酸以及(c)3’非翻译区的DNA构建体引入植物细胞；(ii)选择该植物细胞；(iii)将该植物细胞再生成植物。
10.一种从植物中分离赋予可操作连接的多核苷酸在胚、胚发生或愈伤组织中增强表达的启动子的方法，包括(i)评估源于一个或更多从靶植物胚、胚发生或愈伤细胞类型制备的cDNA文库的ESTs的集合；及(ii)比较来自于至少一个靶植物cDNA文库的ESTs和一种或更多来自于非胚、非胚发生或愈伤植物细胞类型的非靶cDNA文库的ESTs；及(iii)扣除在靶和非靶文库中共同的ESTs；及(iv)在该扣除后从剩余ESTs设计基因特异性引物；及(v)使用该引物从靶植物制备的基因组文库中分离对应的5’侧翼和调节区。
全文摘要
本发明涉及调节植物中基因表达的核酸序列。具体地说,本发明涉及对调节植物中异源DNA表达有用的5’调节序列和识别当可操作连接到DNA序列时赋予特定表达图谱的5’调节序列的方法。本发明也涉及含5’调节序列的表达载体和含有表达载体的转基因植物。
文档编号C07K14/415GK1387572SQ00815225
公开日2002年12月25日申请日期2000年8月30日优先权日1999年9月1日
发明者T·W·康纳, I·察夫里尔申请人:孟山都技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｔ.Ｗ.康纳;Ｉ.察夫里尔
技术所有人：孟山都技术有限公司
我是此专利的发明人

上一篇：具有中孔或复合的中孔和微孔的无机氧化物及其制备方法
上一篇：一种硬脂酸镁的生产配方及新工艺的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
2、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
3、赵老师：1.电化学离子储存和分离技术 2.工业结晶
4、廖老师：1. 晶面可控氧化铝、碳基载体及催化剂等高性能、新结构催化材料研究 2. 乙烯环氧化催化剂的研究与开发 3. 低碳不饱和烯烃的选择性氧化催化剂及工业技术开发
5、李老师：1. 加氢精制 2. 选择加氢 3. 加氢脱氧 4. 介孔及介微孔分子筛合成及催化应用
如您是高校老师，可以点此联系我们加入专家库。