专利名称::赋予草甘膦抗性的epsp合酶结构域的制作方法赋予草甘膦抗性的EPSP合酶结构域发明领域本发明涉及植物分子生物学,特别涉及赋予对于除草剂草甘膦的抗性的新型种别的EPSP合酶。
背景技术:
:N-膦酰甲基甘氨酸,通常称为草甘膦,是重要的农艺学化合物。草甘膦抑制将磷酸烯醇丙酮酸(PEP)和3-磷酸莽草酸(S3P)转化成5-烯醇丙酮酰-3-磷酸莽草酸的酶。这种酶(5-烯醇丙酮酸莽草酸-3-磷酸合酶(5-enolpyruvylshikimate-3-phosphatesynthase)',在本文中称为"EPSP合酶"或"EPSPS")的抑制通过关闭莽草酸途径从而抑制芳香族酸的生物合成而杀死植物细胞。因为草甘膦类除草剂抑制芳香族氨基酸的生物合成,所以它们不仅杀死植物细胞,而且对于细菌细胞也有毒性。草甘膦抑制许多细菌的EPSP合酶,因此对这些细菌有毒。然而,某些细菌的EPSP合酶对草甘膦具有高耐受性。对草甘膦毒性有抵抗力的植物细胞可以通过转化植物细胞以表达草甘膦抗性细菌EPSP合酶来产生。值得注意的是,来自根瘤土壤杆菌(々,。6a"er/w迈f画尸ac/,)菌林CP4的细菌基因已用于在植物中在表达后赋予植物细胞以除草剂抗性。来自鼠伤寒沙门氏菌(^//Z70"e"a07^y顶盯y咖)菌林CT7的突变的EPSP合酶在细菌细胞中赋予草甘膦抗性,并且将草甘膦抗性赋予植物细胞(美国专利号4,535,060;4,769,061;和5,094,945)。美国专利6,040,497报告了突变型玉蜀黍EPSP合酶,其具有在位置102处的苏氨酸至异亮氨酸的置换和在位置106处的脯氨酸至丝氨酸的置换("TIPS"突变)。此类改变将草甘膦抗性赋予该玉蜀黍酶。来自鼠伤寒沙门氏菌(5^//Z70"e77307力^訂/咖)菌林CT7的突变的EPSP合酶在细菌细胞中赋予草甘膦抗性,并且被报告将草甘膦抗性赋予植物细胞(美国专利号4,535,060;4,769,061;和5,094,945)。He等人((2001)A/oc力//37ef^/opA/s/caJcfa1568:l—6)已通过诱变以及在大肠杆菌(Aco7/)和鼠伤寒沙门氏菌EPSP合酶基因之间的重组开发出了具有增加的草甘膦耐受性的EPSP合酶,并且提出在位置42(T42M)和位置230(Q230K)处的突变可能是造成所观察到的抗性的原因。后续工作(He等人(2003)Wayc/.5/ofec力.5/oc力e瓜67:1405-1409)显示,T42M突变(苏氨酸至曱硫氨酸)足以改善大肠杆菌和鼠伤寒沙门氏菌的酶的耐受性。由于除草剂抗性植物提供许多优点,所以用于鉴定具有草甘膦抗性活性的除草剂抗性基因的方法是希望的。发明概述提供了用于在细菌、植物、植物细胞、组织和种子中赋予对于草甘膦的抗性或耐受性的组合物和方法。组合物包括具有极性增加的Q-环区域的EPSP合酶,和编码此类酶的核酸分子,包含那些核酸分子的载体,和包含所述载体的宿主细胞。本发明的EPSP合酶包含至少一种选自下列的序列结构域D-C-X「X广S-G(SEQIDNO:29),其中Xi表示甘氨酸、丝氨酸、丙氨酸或天冬酰胺,和X2表示天冬酰胺或谷氨酸;或D-A-X「X广S-G(SEQIDNO:30),其中X!表示丙氨酸或精氨酸,和X2表示天冬酰胺或谷氨酸;或K-L-K-X广S-A(SEQIDNO:31),其中Xi表示甘氨酸、天冬酰胺或谷氨酸;或W-C-E-D-A-G(SEQIDNO:32)。本发明的核苷酸序列可以在DNA构建体或表达盒中使用以用于转化生物体并在其中表达,所述生物体包括微生物和植物。组合物还包括转化的细菌、植物、植物细胞、组织和种子,它们通过将本发明的组合物引入所述生物体的基因组中而是草甘膦抗性的。当生物体是植物时,所述序列的引入允许将包含草甘膦的除草剂施用于植物,以选择性地杀死草甘膦敏感的杂草或其他未转化的植物,而不杀死转化的生物体。此外,还提供了用于鉴定具有草甘膦抗性活性的EPSP合酶的方法。所述方法包括获得EPSP合酶的氨基酸序列,和分析Q-环区域的增加的极性。此外,还可以分析氨基酸序列以确定该氨基酸序列是否包含至少一种本发明的序列结构域。附图简述图l显示了相应于本文描述的Q-环区域的氨基酸区域的比对。所述比对显示了GRGl(SEQIDNO:2的氨基酸残基80-100);产气荚膜梭菌(C/0"r2V/u迈per/V/z^e/^)EPSPS(SEQIDNO:3的氨基酸残基80-100);GRG10(SEQIDNO:6的氨基酸残基80-100);GRG21(SEQIDNO:8的氨基酸残基80-100);GRG22(SEQIDNO:10的氨基酸残基80-100);GRG20(SEQIDNO:12的氨基酸残基80-100);GRG23(SEQIDNO:14的氨基酸残基80-100);GRG15(SEQIDNO:15的氨基酸残基80-100);GRG5(SEQIDNO:16的氨基酸残基80-100);GRG12(SEQIDNO:17的氨基酸残基80-100);GRG6(SEQIDNO:18的氨基酸残基80-100);GRG7(SEQIDNO:19的氨基酸残基80-100);GRG8(SEQIDNO:20的氨基酸残基80-100);GRG9(SEQIDNO:21的氨基酸残基80-100);大肠杆菌AroA(SEQIDNO:22的氨基酸残基85-106);鼠伤寒沙门氏菌EPSPS(SEQIDNO:23的氨基酸残基85-106);玉蜀黍(Zea鹏/s)EPSPS(SEQIDNO:24的氨基酸残基85-106);根瘤土壤杆菌(v^ro^"eW咖r羅Ac/面)菌林CP4EPSPS(SEQIDNO:25的氨基酸残基85-106);枯草芽孢杆菌("acy〃i^s由/7/s)AroA(SEQIDNO:26的氨基酸残基85-106);和肺炎克雷伯氏菌(^7e&/e//ap/3e"迈0/2/ae)EPSPS(SEQIDNO:27的氨基酸残基85-106)。发明详述/.逸合#提供了用于在生物体中赋予除草剂抗性或耐受性,特别是草甘膦抗性或耐受性的组合物和方法。所述方法涉及用编码草甘膦耐受性基因的核苦酸序列转化生物体,其中所述基因编码具有Q-环的多肽,所述Q-环包含具有增加的极性的氨基酸序列。Q-环的区域可以通过使具有在相应于SEQIDNO:22的位置90-105的氨基酸区域中的保守精氨酸的氨基酸序列进行比对来鉴定。如本文所使用的,短语"相应于",当涉及氨基酸(或核苷酸)位置编号时,意指一个或多个氨基酸(或核苷酸)序列与参考序列于在参考序列中指定的位置编号处进行比对。例如,为了鉴定氨基酸序列中相应于SEQIDNO:22的氨基酸90-105的Q-环区域,可以使用本文其他地方讨论的比对方法来使所研究的氨基酸序列与SEQIDNO:22的氨基酸序列进行比对,并且鉴定与SEQIDNO:22的氨基酸残基90-105进行比对的所述氨基酸序列的区域。应认识到,氨基酸编号可以通过在Q-环的任一侧上加上或减去大约20、15、10、9、8、7、6、5、4、3、2或1个氨基酸而改变。该区域据信参与底物PEP的识别。特别地,本发明认出了赋予草甘膦抗性或耐受性的一类酶,和编码此类酶的核苷酸序列。此类酶还可以通过具有至少一种本发明的序列结构域来鉴定。"本发明的序列结构域"意指至少一种选自下列的结构域D-C-X广X2-S-G(SEQIDNO:29),其中X!表示甘氨酸、丝氨酸、丙氨酸或天冬酰胺,和X2表示天冬酰胺或谷氨酸;或D-A-X广X广S-G(SEQIDNO:30),其中X,表示丙氨酸或精氨酸,和X2表示天冬酰胺或谷氨酸;或K-L-K-X广S-A(SEQIDNO:31),其中X,表示甘氨酸、天冬酰胺或谷氨酸;或W-C-E-D-A-G(SEQIDNO:32)。在另一个实施方案中,本发明的序列结构域进一步包含在相应于SEQIDNO:22的残基98的氨基酸位置处的丝氨酸或苏氨酸。"Q-环区域的增加的极性"意指,当与不包含本发明的序列结构域的EPSP合酶的相同区域相比较时,Q-环内的一个或多个氦基酸具有增加的极性。所述序列可用于制备显示出增加的对于除草剂草甘膦的抗性的植物。因此,提供了转化的细菌、植物、植物细胞、植物組织和种子。A釘尸会雜在本发明中,赋予草甘膦抗性的酶的种类是EPSP合酶。如本文所使用的,术语"EPSP合酶"指天然EPSP合酶或其变体或片段。EPSP酸途径中的倒数第二个步骤,所述次生代谢产物包括四氢叶酸酯、泛酉昆和维生素K(Gruys等人(1999)/"力2.6/forsrrj7^0/Aa/7,/^e/z/a/<3i2//2e,7>ros//2eAiosj7tAes/sasZTer6/c2'des(Dekker,NewYork))。EPSP合酶将磷酸烯醇丙酮酸(PEP)和卜磷酸莽草酸(S3P)转化成5-烯醇丙酮酰-h磷酸莽草酸(Amrhein等人(l980)尸/aW尸Ars/0/.66:830-834)。单体EPSP合酶是烯醇丙酮酰转移酶类别中的两种酶之一。这类多肽共享包含2个球状结构域的独特结构,所述球状结构域由P折叠和oc螺旋(形成类似于反oc/P桶的事物)组成。这2个结构域通过2条链进行连接,所述链如同铰链一样发挥作用以使上面和下面的结构域聚集在一起,从而将底物夹在活性位点中。^i照"秀导契A冲几告寸(induced—fitmechanism)的才莫式,西己^结^使该酶从开放状态转变成紧密填充的闭合状态(Sch6nbrunn等人(2001)尸roc.Aa〃.Jcad.Sc/.〃W90:1376-1380,Stauffer等人(2001)A/oc力e历/Wr/40:3951-3957)。已从植物、细菌和真菌中分离出了EPSP合酶,包括大肠杆菌(Duncan等人(1984)/^,A^Ze〃.170:59-63)、金黄色葡萄球菌(5Ya/^7/ococci7Saureus)(Horsburgh等人(1996)#/cro6/c>/c^142(Part10):2943-2950)、肺炎链球菌(iYre一coc面/歸麵/ae)(Du等人(2000)/."/'oc力e瓜267(1):222-227)和伤寒沙门氏菌(^3//27072e//a(Chatfield等人(1990)yVuc/e/c爿c/c^18(20):6133)。已分离了野生型EPSP合酶的变体,其由于EPSP合酶氨基酸编码序列中的改变而是草甘膦耐受性的(Kishore和Shah(1988)^2"i/.ier.5/oc力e迈.57:627-63;Wang等人(2003)/.尸/s/7f116:455—60;Eschenburg等人(2002)户7a/2ta216:129-35)。已表征了EPSP合酶序列,并且已鉴定了在这类多肽中常常保守的残基。例如,Lys-22、Arg-124、Asp-313、Arg-344、Arg-386和Lys-411是来自大肠杆菌的EPSP合酶的保守残基(Sch5nbrunn等人(2001)户roc.JcaASc/〃W98:1376-1380)。影响EPSP合酶活性的另外残基还包括Arg-100、Asp-242和Asp-384(Selvapandiyan等人(1995)尸五A9Ze〃ers374:253-256)。Arg-27已显示与S3P结合(Shuttleworth等人(1999)"/oc力e迈2.〃ir38:296-302)。及卓##戎'^^^户合雄EPSP合酶是广谱除草剂草甘膦的靶标。"草甘膦"意指N-膦酰曱基甘氨酸(包括其任何盐)的任何除草剂形式以及导致产生草甘膦阴离子的其活性衍生物。已显示,草甘膦对EPSP合酶的抑制通过形成EPSP合酶-S3P-草甘膦三元复合物来进行,并且这种结合是有顺序的,在二元EPSP合酶-S3P复合物形成之后草甘膦才与酶结合。草甘膦与EPSP合酶的结合已显示出与PEP是竟争性的并且就S3P而言是非竟争性的(Kishore等人(1988)J//".Wey."/oc力e瓜57:627—663)。通过与EPSP合酶结合,草甘膦关闭莽草酸途径,从而导致芳香族氨基酸生物合成的耗竭和植物的死亡或严重的生长下降。已鉴定了草甘膦抗性EPSP合酶多肽并用于增加植物中的草甘膦耐受性。"草甘膦抗性多肽"或"草甘膦耐受性多肽,,包括将下述能力赋予细胞的多肽比不表达该多肽的细胞耐受更高浓度的草甘膦,或比不表达该多肽的细胞更长时间地耐受某一草甘膦浓度。"耐受,,或"耐受性,,意指存活或者以不容易与未经处理的细胞相区分的方式执行基本的细胞功能例如蛋白质合成和呼吸。天然存在的草甘膦抗性EPSP合酶的例子包括来自根瘤土壤杆菌菌林CP4的细菌基因,其已用于在植物中表达后将除草剂抗性赋予植物细胞。已通过随机诱变和就除草剂抗性进行选择而鉴定出了突变的EPSP合酶多肽,包括来自鼠伤寒沙门氏菌菌林CT7的突变的EPSP合酶,其在细菌细胞中赋予草甘膦抗性,和将草甘膦抗性赋予植物细胞(美国专利号4,535,060;4,769,061;和5,094,945;以及美国申请号60/669,686和20040177399)。这些酶包含有在其活性位点中的氨基酸置换,所述氨基酸置换阻止草甘膦的结合而不影响PEP或S3P的结合。在EPSP合酶而非PEP的结合亲和力(He等人(2003)5/osc/.胁fe由o人飾c細.67(6):1405-1409)。因此,此类酶即使在草甘膦存在下也具有高的催化活性。本发明的EPSP合酶的特征在于具有极性增加的Q-环区域。此外,所述酶可以通过具有至少一种选自下面列出的结构域的结构域来进行表征D-C-X1-X2-S-G(SEQIDNO:29),其中Xi表示甘氨酸、丝氨酸、丙氨酸或天冬酰胺,和X2表示天冬酰胺或谷氨酸;或D-A-X1-X2-S-G(SEQIDNO:30),其中X:表示丙氨酸或精氨酸,和X2表示天冬酰胺或谷氨酸;或K-L-K-X1-S-A(SEQIDNO:31),其中X,表示甘氨酸、天冬酰胺或谷氨酸;或W-C-E-D-A-G(SEQIDNO:32)。<formula>formulaseeoriginaldocumentpage13</formula>各种方法可以用于测量EPSP合酶活性。例如,Lewendon等人((1983)"/oc力e迈/.213:187-191)描述了2种测定法,它们将EPSP合酶反应与产生可检测产物的其他酶相偶联。在正方向中,EPSP合酶可以与分支酸合酶相偶联,所述分支酸合酶是莽草酸途径中将EPSP转化成分支酸的酶;当EPSP合酶产生EPSP时,分支酸合酶可以将EPSP转化成分支酸,所述分支酸可以在275nm处进行检测。因为EPSP合酶还可以反方向进行,所以活性还可以通过与丙酮酸激酶和乳酸脱氬酶相偶联来进行测定,所述丙酮酸激酶和乳酸脱氢酶在丙酮酸的断裂中氧化NADH,从而允许在340認处检测NADH的损失,这相应于经由EPSP合酶的丙酮酸发展。EPSP合酶活性还可以通过如下方式来测定测量当草甘膦抗性EPSP合酶存在时植物对草甘膦的抗性的增加,或者测量当表达草甘膦敏感性和/或耐受性EPSP合酶时植物产量的增加。<formula>formulaseeoriginaldocumentpage13</formula>在某些实施方案中,本发明包括与SEQIDN0:1、3、5、11、13、38或40的多核苷酸(或任何其他已知或公开的编码包含本发明的一种或多种结构域的多肽(例如SEQIDNO:46-52)的多核苷酸序列)不同的分离的或纯化的多核苷酸,其编码具有极性增加的Q-环的多肽。进一步的实施方案包括编码多肽的多核苷酸,所述多肽包含上文描述的一种或多种结构域。"分离的"或"纯化的"多核苷酸或者多肽或其生物学活性部分,基本上不含其他细胞材料或培养基(当通过重组技术生产时),或者基本上不含化学前体或其他化学制品(当以化学方法合成时)。"生物学活性的,,意指具有天然多肽的所需生物活性,即保留了除草剂抗性或耐受性活性。"分离的"多核苷酸可以不含在该多核苷酸所源自的生物体的基因组DNA中天然地位于该核酸侧翼的序列(即,位于该核酸的5'和3'末端处的序列)(例如,蛋白质编码序列)。对本发明而言,当用于指多核苷酸时,"分离的"不包括分离的染色体。例如,在各种实施方案中,分离的编码草甘膦抗性的多核苷酸可以包含少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该多核苷酸所源自的细胞的基因组DNA中天然地位于该多核苷酸侧翼的核苷酸序列。本发明的多核苷酸包括编码这样的多肽的那些多核苷酸,所述多肽的特征在于具有极性增加的Q-环或至少一种本发明的结构域。用于鉴定这些结构域的信息包括在本文其他地方描述的EPSP合酶的序列些EPSP合酶所特征性的结构域。在某些实施方案中,本发明的结构域用于鉴定具有草甘膦抗性的EPSP合酶。本发明进一步考虑了本文描述的多核苷酸的变体和片段。多核苷酸的"片段,,可以编码多肽的生物学活性部分,或者它可以是通过使用本文其他地方公开的方法而可以用作杂交探针或PCR引物的片段。取决于预期用途,作为多核苷酸的片段的多核苷酸包含至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950个邻接核苷酸,或高至在本文公开的全长多核苷酸中存在的核苷酸的数目。"邻接"核苷酸意指彼此紧邻的核苷酸残基。本发明的多核苷酸的片段一般将编码保留全长草甘膦抗性蛋白质的生物活性即除草剂抗性活性的多肽片段。"保留除草剂抗性活性"意指该片段将具有本文公开为SEQIDNO:1的全长草甘膦抗性蛋白质的至少约30%、至少约50%、至少约70%或至少约80%的除草剂抗性活性。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如,美国专利号4,535,060和5,188,642,所述专利中的每一个通过提及而整体合并入本文。编码本发明多肽的生物学活性部分的多核苷酸的片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400个邻接氨基酸,或高至在本发明的全长多肽中存在的氨基酸的总数目。本发明还包括变体多核苷酸。多核苷酸的"变体"包括编码本文公开的多肽但由于遗传密码的简并性而保守性地不同的那些序列,以及具有足够同一性的那些序列。术语"具有足够同一性"意指这样的多肽或多核苷酸序列,即通过使用比对程序之一并采用标准参数,所述序列与参照序列相比较具有至少约60%或65%的序列同一性,约70%或75%的序列同一性,约80%或85%的序列同一性,约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。本领域技术人员将会认识到,这些值可以适当地进行调整以通过考虑密码子简并性、氨基酸相似性、读码框定位等来确定由两个多核苷酸所编码的多肽的相应的同一性。为了确定2个氨基酸序列或2个多核苷酸的同一性百分比,就最佳比较目的来对序列进行比对。2个序列之间的同一性百分比是由所述序列共有的相同位置的数目的函数(即,同一性百分比-相同位置的数目/位置(例如,重叠位置)的总数目x100)。在一个实施方案中,2个序列具有相同的长度。2个序列之间的同一性百分比可以使用与下文描述的那些类似的技术来进行确定,其中允许或不允许缺口。在计算同一性百分比中,通常计数准确的匹配。2个序列之间的同一性百分比的确定可以使用数学算法来完成。用于2个序列比较的数学算法的非限制性例子是Karlin和Altschul(1990)尸roc.yVa〃Jcs《87:2264的算法,其在Karlin和Altschul(1993)户roc.A"a〃.JcaASc/.90:5873—5877中进行了修改的。将此类算法整合入AUschul等人(l"0)/.S/o人215:403的BLASTN和BLASTX程序中。BLAST核苷酸搜索可以用BLASTN程序(得分=100、字长=12)来进行,以荻得与本发明的方法中使用的编码除草剂抗性的多核苷酸同源的多核苷酸。BLAST多肽搜索可以用BLASTX程序(得分-50、字长=3)来进行,以获得与使用本发明方法来表达的多肽分子同源的氨基酸序列。为了获得用于比较目的的有缺口的比对,可以使用如Altschul等人(1997)肠7eicJc油25:3389中所描述的GappedBLAST。备选地,PSI-Blast可以用于执^f亍可检测分子间的远距离关系的迭代搜索。参见A11schu1等人(1997)(同上)。当利用BLAST、GappedBLAST和PSI-Blast程序时,可以使用各个程序(例如,BLASTX和BLASTN)的缺省参数。参见www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一个非限制性例子是ClustalW算法(Higgins等人(1994)#wc7e/cWes.22:4673-4680)。ClustalW比较序列并比对氨基酸或DNA序列的整体,因此可以提供关于整个氨基酸序列的序列保守性的数据。ClustalW算法在几个商购可得的DNA/氨基酸分析软件包中使用,例如VectorNTIProgramSuite(InvitrogenCorporation,Carlsbad,CA)的ALIGNX模块。在用ClustalW比对氨基酸序列后,可以评估氨基酸同一性百分比。可用于ClustalW比对分析的软件程序的非限制性例子是GeneDoc。GeneDoc(Kar1Nicholas)允许评估多个多肽之间的氨基酸(或DM)相似性和同一性。用于序列比较的数学算法的另一个非限制性例子是Myers和Miller(1988)"扁S4:11-17的算法。此类算法被整合入ALIGN程序(版本2.0)中,所述ALIGN程序是GCG序列比对软件包的一部分。当利用ALIGN程序来比较氨基酸序列时,可以使用PAM120权重残基表、12的缺口长度罚分和4的缺口罚分。除非另有说明,采用Needleman和Wunsch(l970)(同上)的算法的GAPVersion10将被用于测定序列同一性或相似性,其中使用下述参数关于核苷酸序列的同一性%和相似性%,使用5Q的缺口权重和3的长度权重,以及nwsgapdna.cmp评分矩阵;关于氨基酸序列的同一性%或相似性%,使用8的缺口权重和2的长度权重,以及BLOSUM62评分矩阵。还可以使用等价的程序。"等价的程序,,意指任何这样的序列比较程序,即对于所研究的任何2个序列,当与由GAPVersion10产生的相应比对相比较时,产生具有相同的核苷酸残基匹配和相同的序列同一性百分比的比对。天然存在的等位基因变体可以使用众所周知的分子生物学技术来鉴定,例如如下所述的聚合酶链式反应(PCR)和杂交技术。变体多核苷酸还包括合成衍生的多核苷酸,其例如通过使用定点诱变产生但仍编码具有所需生物活性的多肽。技术人员将会进一步意识到,可以通过突变将改变引入本发明的多核苷酸内,从而导致所编码的多肽的氨基酸序列中的改变,而不改变该多肽的生物活性。因此,分离的多核苷酸变体可以通过下述方式来制备将一个或多个核苷酸置换、添加或删除引入本文公开的相应的多核苷酸中,从而使得将一个或多个氨基酸置换、添加或删除引入所编码的多肽中。可以通过标准技术来引入突变,例如通过定点诱变和PCR介导的诱变,或基因改組技术。此类变体多核苷酸也包括在本发明内。可以通过沿着全部或部分编码序列随机引入突变,例如通过饱和诱变,来制备变体多核苷酸,并且可以就赋予除草剂抗性活性的能力来筛选所得到的突变体,以鉴定保留了活性的突变体。在诱变后,所编码的多肽可以重组地表达,并且多肽的活性可以通过4吏用标准测定法技术来测定。基因改组或有性PCR操作(sexualPCRprocedure)(例如,Smith(1994)^s"re370:324—325;美国专利号5,837,458;5,830,721;5,811,238;和5,733,731,所述参考文献各自通过提及而合并入本文)可以用于鉴定编码多肽的另外多核苷酸,所述多肽执行与本文描述的那些多肽相似的功能(例如,赋予草甘膦抗性的多肽)。基因改组涉及几种突变体DNA的随机片段化,随后通过PCR装配成全长分子。各种基因改组操作的例子包括但不限于,DM酶处理后的装配、交错延伸过程(STEP)和随机引发体外重组。在DNA酶介导的方法中,将从阳性突变体库中分离出的DM区段用DNA酶I切割成随机片段,并且经历多轮PCR而不添加引物。随着PCR循环进行,随机片段的长度接近未切割的区段的长度,从而导致在不同克隆中的突变,所述突变变得是混合的并在某些所得序列中积聚。多个循环的选择和改组已导致几种酶的功能增强(Stemmer(1994)Nature370:389-391;StemmerU994)Proc.Nat1.Acad.Sci.USA91:10747-10751;Crameri等人(1996)Nat.Biltechno1.14:315-319;Zhang等人(1997)Proc.Nat1.Acad.Sci.USA94:4504-4509;和Crameri等人(1997)Nat.Biotechno1.15:436-438)。此类操作例如可以对编码具有极性增加的Q-环区域的EPSP合酶或包含本发明的结构域的多肽的多核苷酸进行,以产生赋予草甘膦抗性的多肽。使用诸如PCR、杂交等的方法可以通过寻找本发明的保守结构域来鉴定出相应的除草剂抗性序列。参见,例如,Sambrook和Russell(2001)MolecularCloning:ALaboratoryManual(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY);和Innis等人(1990)PCRPrcotocols:AGuidetoMethodsandApplications(AcademicPress,NY)。在杂交方法中,全部或部分除草剂抗性多核苷酸序列或编码本发明的结构域的序列可以用于筛选cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法是本领域通常已知的,并且在Sambrook和Russell,2001(同上)中公开。所谓的杂交探针可以是基因组DM片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用可检测基团例如32P或任何其他可检测标记例如其他放射性同位素、荧光化合物、酶或酶辅因子进行标记。可以基于本文公开的已知的编码除草剂抗性的多核苷酸,通过对合成的寡核苷酸进行标记来制备用于杂交的探针。可以另外使用基于在所述多核苷酸序列或所编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的简并引物。探针通常包含这样的核苷酸序列区域,所述核苷酸序列区域在严格条件下与本发明的编码除草剂抗性的多核苷酸或其片段或变体的至少约12个,至少约25个,至少约50、75、100、125、150、175、200、250、300、350、400、500、600、700、800、900、1000、1200、1400、1600或1800个连续核苷酸杂交。用于制备用于杂交的探针的方法是本领域通常已知的,并且公开于Sambrook和Russell(2001)(同上)以及Sambrook等人(1989)#o/ecw/ar"0/7/.wjZa6or"or/勸/7wa7(第二版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork)中,所述2个参考文献通过提及而合并入本文。此类序列的杂交可以在严格条件下进行。"严格条件"或"严格杂交条件"意指这样的条件,即在所述条件下探针将与其靶序列杂交,达到相比与其他序列来说可检测地更大的程度(例如,为背景的至少2倍)。严格条件是序列依赖性的并且在不同情况下是不同的。通过控制杂交和/或洗涤条件的严格性,可以荟定出与探针100%互补的靶序列(同源探测)。备选地,可以调整严格条件以允许序列中的一些错配,从而使得检测出较低程度的相似性(异源探测)。一般地,探针长度为小于约1000个核苷酸,或长度为小于约500个核苷酸。严格条件是这样的条件,其中在pH7.0-8.3下盐浓度小于约1.5MNa离子,或约0.01-1.0MNa离子浓度(或其他盐),以及温度对于短探针(例如,10-50个核苷酸)为至少约3(TC,和对于长探针(例如,超过50个核苷酸)为至少约60匸。严格条件还可以用添加去稳定剂如甲酰胺来达到。示例性的低严格性条件包括于37'C用30-35%甲酰胺、1MNaCl、1%SDS(十二烷基石克酸钠)的緩沖溶液进行杂交,和于50-55。C在1X-2XSSC(20XSSC=3.0MNaC1/0.3M种檬酸三钠)中进行洗涤。示例性的中等严格性条件包括于37匸在40-45%甲酰胺、l.OMNaCl、1%SDS中进行杂交,和于55-60。C在0.5X-1XSSC中进行洗涤。示例性的高严格性条件包括于37'C在50%甲酰胺、1MNaCl、1%SDS中进行杂交,和于60-65。C在0.IXSSC中进行洗涤。任选地,洗涤緩沖液可以包含约0.1%-约1%SDS。杂交的持续时间一般少于约24小时,通常为约4-约12小时。特异性通常是杂交后洗涤的函数,关键因素是离子强度和最终洗涤溶液的温度。对于DM-DNA杂交物,Tm可以从Meinkoth和WahK1984)細7.胁c力e迈.138:267-284的等式中进行估计:Tm-81.5°C+16.6(logM)+0.41(%GC)-0.61(%form)-500/L;其中M是一价阳离子的摩尔浓度,%GC是多核苷酸序列中鸟苷和胞嘧啶核苷酸的百分比,Q/。form是杂交溶液中甲酰胺的百分比,和L是以碱基对计的杂交物的长度。L是这样的温度,在该温度下50%的互补靶序列与完全匹配的探针杂交(在限定的离子强度和pH下)。对于每1%的错配,乙减少约rc;因此,可以调整L、杂交和/或洗涤条件,以与所需同一性的序列杂交。例如,如果寻求具有>90%同一性的序列,那么L可以减少10。C。一般地,严格条件被选择为在限定的离子强度和pH下比关于特定序列和其互补物的热解链点(Tm)低约5'C。然而,极端严格条件可以利用在比热解链点(Tm)低1、2、3或4。C下的杂交和/或洗涤;中等严格条件可以利用在比热解链点(Tm)低6、7、8、9或10。C下的杂交和/或洗涤;低严格条件可以利用在比热解链点(TJ低11、12、13、14、15或20。C下的杂交和/或洗涤。使用该等式、杂交和洗涤条件以及所需的L,普通技术人员应当理解,内在地描述了杂交和/或洗涤溶液的严格性中的改变。如果所希望的错配程度导致低于45°C(水性溶液)或32。C(甲酰胺溶液)的Tm,那么可以增加SSC浓度,从而使得可以使用更高的温度。关于核酸杂交的详细指导可见下述参考文献Tijssen(1993)Z^6oraforyTec/w/gwes//2万2'oc/e迈/str7第I部分,笫2章(Elsevier,NewYork);和A画bel等人,编辑,(1995)Cwrre/2f户rotoco/s//2¥o/ecu/ar5/0/og7,第2章(GreenePublishingandWiley-Interscience,NewYork)。参见Sambrook等人(1989)#o/ecu/<2rC7o///^v爿L360rafoiT(第二版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)。E,分离的蛋白质及其变体和片段在某些实施方案中,本发明包括与SEQIDN0:2、4、7、12、14、39和41(或任何其他已知或公开的包含本发明的一种或多种结构域的多肽,例如SEQIDNO:46-52)不同的分离的或纯化的除草剂抗性多肽。基本上不含细胞材料的"分离的"或"纯化的"除草剂抗性多肽包括具有少于约30%、20%、10%或5%(干重)的非除草剂抗性多肽(在本文中也称为"污染蛋白质,,)的多肽制剂。在本发明中,"除草剂抗性蛋白质"意指具有极性增加的Q-环区域,或具有至少一种本发明的结构域的EPSP合酶。还提供了其片段、生物学活性部分和变体,并且可以用于实践本发明的方法。"片段"或"生物学活性部分"包括这样的多肽片段,所述多肽片段包含编码除草剂抗性蛋白质的氨基酸序列的部分,并保留除草剂抗性活性。除草剂抗性蛋白质的生物学活性部分可以是例如长度为10、25、50、100或更多个氨基酸的多肽。此类生物学活性部分可以通过重组技术来制备,并且就除草剂抗性活性来进行评估。"变体"意指这样的蛋白质或多肽,其具有与下列多肽至少约60%、65%,约70%、75%,约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列具有极性增加的Q-环区域的EPSP合酶多肽,或具有本发明的结构域的EPSP合酶多肽。本领域技术人员将会认识到,这些值可以适当地进行调整以通过考虑密码子简并性、氨基酸相似性、读码框定位等来确定由两个多核苷酸所编码的多肽的相应的同一性。例如,保守氨基酸置换可以在一个或多个非必需氨基酸残基处进行。"非必需,,氨基酸残基是可以从多肽的野生型序列中进行改变而基本上不改变所得到的肽的生物活性的残基,而"必需,,氨基酸残基是无法基本上不影响生物活性而进行置换的残基。"保守氨基酸置换"是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。在本领域中已定义了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸、组氨酸),具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸),具有不带电荷的极性侧链的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸),具有非极性侧链的氨基酸(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),具有P-分枝的侧链的氨基酸(例如,苏氨酸、缬氨酸、异亮氨酸)和具有芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。氨基酸置换可以在保留功能的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是多肽活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守残基中的保守或非保守改变。本发明还包括为增加用于PEP和草甘膦的EPSP合酶结合袋(在本文中称为"Q-环")的极性和/或体容度(bulkiness)而进行的氨基酸置换。这个环形成了用于PEP和草甘膦的结合袋的一部分,并包含已知与PEP的磷酸直接氲键键合的不变的精氨酸(Shuttleworth等人(1999)^f'0C力e/z7/^/738:296-302)。就本发明而言,这个区域的极性的增加涉及相对于大肠杆菌AroA(SEQIDNO:22)的这个区域中的多肽序列而言,给定多肽序列中的极性和/或带电荷的氨基酸的数目或相对组成百分比的增加,所述大肠杆菌AroA是不含本发明的结构域的EPSP合酶的例子。尽管不希望受任何作用^L制的束縳,但例如,在SEQIDNO:33和34(其相应于在Q-环区域中的实例序列)的位置1处用天冬氨酸残基置换苯丙氨酸残基可以导致该环和草甘膦的带负电荷的膦酸残基之间的电荷排斥。用于估计特定氨基酸组成的净电荷和/或净极性的方法和算法是本领域已知的。尽管不希望受任何作用机制的束缚,但该环的体积的增加(例如通过分别在SEQIDNO:31的位置1和3处置换为体积更大的赖氨酸残基,以代替在其他EPSP合酶中存在的体积较小的苯丙氨酸和甘氨酸残基)可以导致空间效应,从而导致这个环进一步向下移动到结合袋中,从而减少了活性位点袋的尺寸。本发明还包括这样的多肽(以及编码其的多核苷酸),其中已通过用体积更大的残基置换Q-环中的一个或多个残基而引起了Q-环体积的增加。在本发明的另一个实施方案中,本文鉴定的结构域可以与其他酶的氨基酸序列一起进行改造或重組,例如通过用具有极性增加的Q-环的多肽或用包含本发明的结构域的多肽替代大肠杆菌打"基因的I类EPSP合酶基序。备选地,可以将这些多肽中的一种或多种插入,以代替不包含极性增加的Q-环区域的多肽或包含本发明的结构域的多肽,这可以包含或不包含或者导致或不导致改善的性质。变体还包括由这样的多核苷酸编码的多肽,所述多核苷酸在严格条件下与编码具有Q-环区域的酶的多核苷酸或其互补序列杂交,所述Q-环区域具有增加的极性或本发明的结构域。变体包括由于诱变而在氨基酸序列方面不同的多肽。本发明所包括的变体蛋白质是生物学活性的,即它们继续具有天然蛋白质的所需生物活性,即保留了除草剂抗性活性。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如,美国专利号4,535,060和5,188,642,所述专利各自通过提及而整体合并入本文。细菌基因在开放读码框的起始点附近经常具有多个曱硫氨酸起始密码子。通常,在这些起始密码子中的一个或多个处的翻译起始将导致产生功能性蛋白质。这些起始密码子可以包括ATG密码子。然而,诸如芽孢杆菌属物种(&"//^)的细菌还将密码子GTG识别为起始密码子,并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处包含甲硫氨酸。此外,通常事先无法确定这些密码子中的哪一些天然地在细菌中使用。因此,应当理解,备选的甲硫氨酸密码子之一的使用可能导致产生赋予除草剂抗性的变体。这些除草剂抗性蛋白质包括在本发明中,并且可以在本发明的方法中使用。还包括了针对本发明的多肽或者其变体或片段的抗体。用于产生抗体的方法是本领域众所周知的(参见,例如Harlow和Lane(1988)爿/7〃6ofZ/w"a6or"or/她"ua/,ColdSpringHarborLaboratory,ColdSpringHarbor,NY;美国专利号4,196,265)。在本发明的方法和组合物中使用的多核苷酸可以进行修饰,以获得或增强在植物细胞中的表达。编码本发明的结构域的多核苷酸可以在用于在目的植物中表达的表达盒中提供。"植物表达盒"包括能够导致多核苷酸在植物细胞中表达的DNA构建体。所述盒可以以5'-3'的转录方向包括与一种或多种目的多核苷酸可操作地连接的转录起始区(即,启动子),以及在植物中具有功能的翻译和转录终止区(即,终止区)。所述盒可以另外还包含至少一种待引入生物体中的至少一种另外的多核苷酸,例如选择标记基因。备选地,所述另外的多核苷酸可以在多个表达盒上提供。此类表达盒具有多个限制位点,所述限制位点用于插入一种或多种多核苷酸以处于调节区的转录调节之下。"异源的"一般指这样的多核苷酸或多肽,所述多核苷酸或多肽对于它们所存在于其中的细胞来说不是内源的,或者对于它们所存在于其中的天然基因组中的位置来说不是内源的,并且已通过感染、转染、显微注射、电穿孔、微粒轰击等加入细胞中。"可操作地连接"意指两个多核苷酸之间的功能连接。例如,当启动子与DM序列可操作地连接时,启动子序列起始并介导DM序列的转录。应认识到,可操作地连接的多核苷酸可以是邻接的或不是邻接的,并且在用于涉及两个多肽编码区的连接时,所述多肽在同一读码框中进行表达。启动子可以是在所选择的植物细胞、植物部分或组织中显示出转录活性的任何多核苷酸序列。启动子对于植物宿主和/或本发明的DNA序列来说可以是天然的或同源的,或者外源的或异源的。当启动子对于植物宿主是"天然的,,或"同源的,,时,意指所述启动子在该启动子所引入的天然植物内存在。当启动子对于本发明的DNA序列是"外源的,,或"异源的"时,意指所述启动子对于可操作地连接的本发明DNA序列来说不是天然的或天然存在的启动子。启动子可以是诱导型或组成型的。它可以是天然存在的,可以由各种天然存在的启动子的部分組成,或可以是部分或全部合成的。用于设计启动子的指导通过启动子结构的研究来提供,例如Harley和Reynolds(1987)vVwc/e/c」c/"Wes.15:2343-2361的研究。此外,启动子相对于转录起始点的位置可以进行优化。参见,例如Roberts等人(I"9)户roc.仍j,76:760-764。用于在植物中使用的许多合适的启动子是本领域众所周知的。例如,用于在植物中使用的合适的组成型启动子包括来自植物病毒的启动子,例如花生褪绿条死病花椰菜花叶病毒(PC1SV)启动子(美国专利号5,850,019);来自花椰菜花叶病毒(CaMV)的35S启动子(Odell等人(1985)iV""re313:810-812);小球藻病毒曱基转移酶基因的启动子(美国专利号5,563,328)和来自玄参花叶病毒(FMV)的全长转录启动子(美国专利号5,378,619);来自诸如下列的基因的启动子,稻肌动蛋白(McElroy等人(1990)戶/aWCe//2:163-171);遍在蛋白(Christensen等人(1989)尸/a^A/o厶12:619-632,和Christensen等人(1992)7aW#。人18:675-689);pEMU(Last等人(1991j"/."威.81:581-588);MAS(Velten等人(1984)/.3:2723-2730);玉蜀黍H3组蛋白(Lepetit等人(1992)#。人Ce".231:276-285,和Atanassova等人(1992/.2(3):291-300);欧洲油菜(Ara^/ca/a;i^)ALS3(PCT申请WO97/41228);和各种土i裏杆菌基因的启动子(参见美国专利号4,771,002;5,102,796;5,182,200;和5,428,147)。用于在植物中使用的合适的诱导型启动子包括对铜作出响应的来自ACE1系统的启动子(Mett等人(1993)户US90:4567-4571);对苯磺酰胺除草剂安全剂作出响应的玉蜀黍In2基因的启动子(Hershey等人(1991)#o7.^几6^/2e〃"227:229-237,和Gatz等人(1994)#o/.243:32-38);和来自TnlO的Tet阻抑物的启动子(Gatz等人(1991Ce/z."e"eL227:229-237)。用于在植物中使用的另一种诱导型启动子是对诱导剂作出响应的启动子,而对于所述诱导剂植物通常不作出响应。这种类型的示例性诱导型启动子是来自类固醇激素基因的诱导型启动子,其转录活性通过糖皮质类固醇激素(Schena等人(1991)户roc.iVa〃.^ca^/.5^2'W^88:10421),或通过近期应用嵌合转录激活剂XVE(其用于在由雌二醇激活的基于雌激素受体的诱导型植物表达系统中使用)(Zuo等人(2000)户/aW/.,24:265-273)来诱导。用于在植物中使用的其他诱导型启动子在EP332104、PCTW093/21334和PCTWO97/06269中得到描述,所述专利通过提及而整体合并入本文。还可以使用由其他启动子的部分组成的启动子和部分或全部合成的启动子。参见,例如,描述了用于在植物中使用的此类启动子的Ni等人(1995)/VaW/.7:661-676和PCTW095/14098。启动子可以包括或进行修饰以包括一种或多种增强子元件。在某些实施方案中,启动子可以包括多个增强子元件。与不包括它们的启动子相比较,包含增强子元件的启动子提供更高水平的转录。用于在植物中使用的合适的增强子元件包括PC1SV增强子元件(美国专利号5,850,019)、CaMV35S增强子元件(美国专利号5,106,739和5,164,316)和FMV增强子元件(Maiti等人(1997)r環,/2/ck6:143-156)。还参见PCTW096/23898。通常,此类构建体可以包含5'和3'非翻译区。此类构建体可以包含"信号序列,,或"前导序列",以有助于目的肽的共翻译或翻译后运输至某些细胞内结构,例如叶绿体(或其他质体)、内质网或高尔基体,或者被分泌。例如,构建体可以经改造以包含信号肽从而有助于将肽转移至内质网。"信号序列"意指已知或怀疑导致穿过细胞膜的共翻译或翻译后肽运输的序列。在真核生物中,这种运输通常涉及分泌到高尔基体内,其中具有某些发生的糖基化。"前导序列"意指当被翻译时导致足以引发肽链共翻译运输至亚细胞器的氨基酸序列的任何序列。因此,这包括通过进入内质网内,进入液泡、质体(包括叶绿体、线粒体)等中来对运输和/或糖基化实施靶向的前导序列。还可以优选改造植物表达盒以包含内含子,从而使得内含子的mRNA加工是表达所需的。y非翻译区"意指位于编码序列下游的多核苷酸。多腺苷酸化信号序列和编码能够影响向mRNA前体的3'末端添加多腺苷酸束的调节信号的其他序列是3'非翻译区。"5'非翻译区"意指位于编码序列上游的多核苷酸。其他上游或下游非翻译元件包括增强子。增强子是用于增加启动子区的表达的多核苷酸。增强子是本领域众所周知的,并且包括但不限于,SV40增强子区和35S增强子元件。终止区可以对于转录起始区来说是天然的,可以对于本发明的序列来说是天然的,或可以衍生自另一种来源。方便的终止区可从根瘤土壤杆菌的Ti质粒中获得,例如章鱼碱合酶和胭脂碱合酶的终止区。还可参见Guerineau等人(1991)Ce/z.Ce/2eL262:141-144;Proudfoot(1991)Ce〃64:671-674;Sanfacon等人(1991)Ce,齡.5:141-149;Mogen等人(1990)尸/a;U2:1261-1272;Munroe等人(1990)Ge/7e91:151-158;Ballas等人(1989)iW;c7e/cJc油ies.17:7891-7903;和Joshi等人(1987)iY"c/e/cJc/d紋15:9627-9639。在适当时,可以就在转化的宿主细胞中的表达增加来优化编码本发明的多肽结构域的一种或多种多核苷酸。即,可以使用宿主细胞偏爱的密码子来合成所述序列以获得改善的表达,或者可以通过以宿主偏爱的密码子使用频率使用密码子来合成所述序列。一般地,将增加多核苷酸的GC含量。关于宿主偏爱的密码子使用的讨论,可参见例如Campbell和Gowri(1990)尸/a/3f户力/s/o人92:1-11。用于合成宿主偏爱的多核苷酸的方法是本领域已知的。参见,例如,美国专利号6,320,100;6,075,185;5,380,831;和5,436,391,美国公开申请号20040005600和20010003849,和Murray等人(1989)肠/e/cJc油Aes.17:477-498,其通过提及而合并入本文。在一个实施方案中,目的多核苷酸被靶向叶绿体以进行表达。以这种方式,当目的多核苷酸不直接插入叶绿体内时,表达盒将另外包含编码转运肽的多核苷酸以将目的核苷酸导向叶绿体。此类转运肽是本领域已知的。参见,例如VonHeijne等人(1991)/Va/^Vo/."/o厶雖9:104-126;Clark等人(1989)/.5/o/.C力復264:17544-17550;Della-Cioppa等人(1987)F"/U尸/z"/o人84:965-968;Romer等人(1993)A/oc力e迈."/o/7//i.Wes.Co/s迈w/2.196:1414—1421;和Shah等人(1986)5We/ce233:478-481。可以就在叶绿体中的表达来优化被靶向叶绿体的目的多核苷酸,以解决植物细胞核和这种细胞器之间的在密码子使用方面的差异。以这种方式,可以使用叶绿体偏爱的密码子来合成目的多核苷酸。参见,例如,美国专利号5,380,831,通过提及而合并入本文。这种"植物表达盒"可以被插入植物转化载体中。"转化载体"意指允许细胞的转化的DM分子。此类分子可以由一个或多个表达盒组成,或可以组织入超过一个的载体DNA分子中。例如,二元载体是植物转化载体,其利用2个非邻接DNA载体来编码用于植物细胞转化的所有必需的顺式和反式作用功能(Hellens和Mullineaux(2000)7><3/7&h户A2/^Sc2'e"ce5:446-451)。"栽体,,指设计用于在不同宿主细胞之间进行转移的多核苷酸构建体。"表达栽体"指具有将异源DNA序列或片段引入、整合入外源细胞中并在其中表达该异源DNA序列或片段的能力的载体。植物转化载体包含一个或多个用于实现植物转化的DNA载体。例如,利用包含超过一种邻接DNA区段的植物转化栽体是本领域中常见的实践。这些载体在本领域中通常称为二元载体。二元载体以及具有辅助质粒的载体最常用于土壤杆菌介导的转化,其中对于实现有效转化所需的DM区段的大小和复杂性相当大,并且将功能分散到分开的DNA分子上是有利的。二元载体通常包括质粒载体,所述质粒载体包含对于T-DNA转移所需的顺式作用序列(例如左边界和右边界)、经改造从而能够在植物细胞中表达的选择标记、和"目的多核苷酸"(经改造从而能够在对于其希望产生转基因植物的植物细胞中表达的多核苷酸)。在这种质粒载体上还存在有细菌复制所需的序列。顺式作用序列以允许有效转移到植物细胞内并在其中表达的方式排列。例如,选择标记序列和目的序列位于左和右边界之间。通常,第二质粒载体包含介导T-DNA从土壤杆菌转移到植物细胞的反式作用因子。这种质粒通常包含毒力功能(Vir基因),其允许用土壤杆菌感染植物细胞,并通过在边界序列处进行切割和vir介导的DNA转移来转移DNA,如本领域中所了解的(Hellens和Mullineaux(2000)7Ye"cTsi"尸7aW5We腦,5:446-451)。几类土壤杆菌属菌林(例如,LBA4404、GV3101、EHAIOI、EHA105等)可以用于植物转化。第二质粒载体不是通过其他方法例如微粒轰击、显微注射、电穿孔、聚乙二醇等将多核苷酸引入植物内所必需的。".控參和控#部为、"植物"意指整个植林、植物器官(例如,叶、茎、根等)、种子、植物细胞、繁殖体、胚胎及其后代。植物细胞可以是分化的或未分化的(例如,愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。本发明可以用于将多核苷酸引入任何植物种类内,包括但不限于,单子叶植物和双子叶植物。目的植物的例子包括但不限于,玉米(玉蜀黍)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒属植物、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦和油籽油菜、芸苔属物种(Sr"Wca)、苜蓿、黑麦、粟、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑橘类树、可可、茶、香蕉、聘梨、无花果、番石榴、芒果、橄榄、番木瓜、腰果、澳洲坚果、杏树、燕麦、蔬菜、观赏植物和针叶树。蔬菜包括但不限于,番茄、莴苣、青豆、利马豆、豌豆,以及甜瓜属(CwcM/"的成员,例如黄瓜、罗马甜瓜和香瓜。观赏植物包括但不限于,杜鹃花、綉球、木槿、玫瑰花、郁金香、水仙花、矮牵牛、康乃馨、一品红和菊花。农作物植物也是感兴趣的,包括例如,玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒属植物、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦、油籽油菜等。本发明适合于单子叶植物家族的任何成员,包括但不限于,玉蜀黍、稻、大麦、燕麦、小麦、高粱、黑麦、甘蔗、菠萝、薯蓣、洋葱、香蕉、椰子和枣椰子。11方法A植物转化本发明的方法涉及将一种或多种与SEQIDNO:1、13和38(或任何其他已知或公开的编码包含本发明的一种或多种结构域的多肽(例如SEQIDNO:46-52)的多核苷酸序列)不同的多核苷酸引入植物内。"引入"意指以使得该多核苷酸进入植物细胞内部的方式将多核苷酸呈递给植物。本发明的方法不要求使用用于将多核苷酸引入植物的具体方法,只要求使该多核苷酸进入植物的至少一个细胞的内部。多核苷酸引入植物细胞内通过本领域已知的数种技术之一来完成,所述技术包括但不限于电穿孔或化学转化(参见,例如Ausubel,编辑(1994)Ci/rre/2f尸rotoco7s#o7ecw_/ar(JohnWileyandSons,Inc.,Indianapolis,IN))。赋予针对有毒物质的抗性的标记可用于从未转化的细胞(不包含或不表达所述测试多核苷酸序列的那些细胞)中鉴定出转化的细胞(已摄取并表达所述测试多核苷酸序列)。在本发明的一个方面中,基因可用作标记以评估DM引入植物细胞中。"转基因植物"或"转化的植物"或"稳定转化的"植物、细胞或组织指已将外源多核苷酸并入或整合到植物细胞内的植物。"稳定的转化"意指,引入植物内的多核苷酸构建体整合到植物的基因组中并能够由其后代遗传。一般而言,植物转化方法涉及将异源DM转移到靶植物细胞(例如,未成熟或成熟的胚胎、悬浮培养物、未分化的愈伤组织、原生质体等)中,随后施加最大阈值水平的合适选择(取决于选择标记基因),以从未转化的细胞群体中回收转化的植物细胞。通常将外植体转移到新鲜供应的相同培养基中并进行常规培养。随后,在置于补充有最大阈值水平的选择因子(即,温度和/或除草剂)的再生培养基上后,使转化的细胞分化成幼芽。然后将幼芽转移至选择性生根培养基中以用于回收生根的幼芽或小植物。然后,使转基因小植物生长为成熟植物并产生能育的种子(例如,Hiei等人(1994)/.6:271-282;Ishida等人(1996)AW.W"ec細/.14:745-750)。用于产生转基因植物的技术和方法的概括性描述可以在Ayres和Park(1994)"CCr化紐尸/a/7"c/.13:219-239以及Bommineni和Jauhar(1997)船7fl7ca42:107-120中找到。因为转化的材料包含许多细胞;所以转化的和未转化的细胞存在于受试靶愈伤组织或组织或细胞群的任何部分中。杀死未转化的细胞并允许转化的细胞增殖的能力导致产生转化的植物培养物。通常,去除未转化的细胞的能力是快速回收转化的植物细胞和成功产生转基因植物的限制条件。分子和生物化学方法可以用于证实转基因植物的基因組中存在整合的一种或多种目的多核苷酸。转基因植物的产生可以通过几种方法之一来进行,包括但不限于,通过土壤杆菌将异源DNA引入植物细胞内(土壤杆菌介导的转化),用与粒子附着的异源外源DNA轰击植物细胞,和用于转移DNA的各种其他非粒子直接介导的方法(例如,Hiei等人(1994)P/a/2f/.6:271-282;Ishida等人(1996)肠fe由o/.14:745-750;Ayres和Park(1994)户/a力^Sc入13:219-239;Bomminerd和Jauhar(1997)42:107-120)。存在3种用土壤杆菌转化植物细胞的常见方法。第一种方法是土壤杆菌与培养的分离的原生质体的共培养。这种方法需要已建立的培养系统,其允许培养原生质体和由培养的原生质体进行植物再生。第二种方法是用土壤杆菌转化细胞或组织。这种方法需要(a)植物细胞或组织可以通过土壤杆菌进行转化,和(b)转化的细胞或组织可以被诱导以再生成整个植物。第三种方法是用土壤杆菌转化种子、顶端或分生组织。这种方法需要微型繁殖。通过土壤杆菌的转化效率可以通过使用本领域已知的许多方法得到增强。例如,已显示,在土壤杆菌培养物中包括天然的创伤应答分子例如乙酰丁香酮(AS)增强了使用根瘤土壤杆菌的转化效率(Shah1a等人(1987)F/a/^#o/ec.5/o7.8:291-298)。备选地,转化效率可以通过使待转化的耙组织受创而得到增强。植物组织的受创可以例如通过打孔、浸软、用^L粒轰击等来实现。参见,例如,Bidney等人(1992)户/a/f"/o人18:301—313。在更进一步的实施方案中,经由粒子轰击(即,用基因枪)用载体转染植物细胞。粒子介导的基因转移方法是本领域已知的,是商购可得的,并且包括但不限于,美国专利号5,584,807中描述的气体驱动的基因递送设备,所述专利的整体内容通过提及而合并入本文。这种方法涉及将目的多核苷酸序列包被在重金属颗粒上,并且在压缩气体的压力下使包被的粒子加速以便递送给靼组织。其他粒子轰击法也可用于将异源多核苷酸序列引入植物细胞内。一般地,这些方法涉及将目的多核苷酸序列沉积在小的、密集的材料(例如金、钼或鴒)颗粒的表面上。然后,将经包被的粒子自身包被在刚性表面例如金属平板上,或者包被在由脆性材料例如聚酯薄膜制成的载片上。然后,将经包被的片朝向耙生物组织进行加速。扁平的片的使用造成加速的粒子的均匀散布,这使在一致条件下接受粒子的细胞的数目达到最大,从而导致多核苷酸样品引入靶组织内。特别的起始信号也可以用于达到编码目的多肽的序列的更有效翻译。此类信号包括ATG起始密码子和邻近序列。在编码目的多肽的序列、它的起始密码子和上游序列插入到合适的表达栽体中的情况下,可以不需要另外的转录或翻译控制信号。然而,在仅插入了编码序列或其部分的情况下,应提供外源的翻译控制信号,包括ATG起始密码子。此外,起始密码子应在正确的读码框中以确保整个插入片段的翻译。外源翻译元件和起始密码子可以具有各种起源,包括天然和合成的起源。表达效率可以通过包括增强子而得到增强,所述增强子对于所使用的具体细胞系统是合适的,例如文献中描述的那些增强子(Scharf等人(1994)AeiTi/7"户r"/.Ce7/"Vyer.20:125)。已用编码本发明多肽结构域的与SEQIDNO:1、13和38(或任何其他已知或公开的编码包含本发明的一种或多种结构域的多肽(例如SEQIDNO:46-52)的多核苷酸序列)不同的多核苷酸转化的细胞可以依照常规方法成长为植物。参见,例如,McCormick等人(I9")刃aWCe//We/.5:81-84。然后,可以使这些植物进行生长,并用相同的转化品系或不同品系进行授粉,并且鉴定所得到的具有所需表型特征的组成型表达的杂合体。可以生长2代或更多代以确保所需表型特征的表达被稳定维持和遗传,然后收获种子以确保已达到所需表型特征的表达。以这种方式,本发明提供了经转化的种子(也称为"转基因种子"),其具有稳定地合并到其基因组中的编码本发明多肽结构域的多核苷酸(例如本发明的表达盒)。及控參餘化的^估在将DNA引入植物细胞中后,通过各种方法来确认多核苷酸已转化或整合入植物基因组中,所述方法例如为分析与整合的序列相关的多核苷酸、多肽和代谢产物。PCR分析是用于在移植到土壤中之前的较早阶段时就整合的基因的存在来筛选细胞、组织或幼芽的快速方法(Sambrook和Russell(2001)¥o7ecw/2rC7o/3//2g.'JL360rafor/¥a/2t/a/(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY))。使用对目的核苷酸或土壤杆菌载体背景等特异的寡核苷酸引物来进行PCR。可以通过基因组DNA的Southern印迹分冲斤来确认DNA的引入(Sambrook和Russell(2001),同上)。一般而言,从细月包或生物体中提取总DNA,用合适的限制酶消化,在琼脂糖凝胶中进行分级,并转移至硝酸纤维素或尼龙膜上。随后,根据标准技术(Sambrook和Russell(2001),同上),例如用经放射标记的靶DM片段来探测膜或"印迹",以确认引入的DNA整合到植物基因組中。在Northern分析中,根据本领域常规使用的标准操作程序(Sambrook和Russell(2001),同上),从细胞或生物体的特定组织中分离RNA,在甲醛琼脂糖凝胶中进行分级,并印迹到尼龙滤纸上。然后,通过采用本领域已知的方法(Sambrook和Russell(2001),同上)将滤纸与衍生自目的序列的放射性探针杂交,来测试由本发明的多核苷酸编码的RNA的表达。可以对转基因才直物进行Wastern印迹法、生物化学测定法等,以通过标准操作程序(Sambrook和Russell(2001),同上)来确定由目的多核苷酸编码的多肽的存在,其中使用与在除草剂抗性多肽上存在的一种或多种表位结合的抗体。C.^f^^^"^皮^#逸##她控辨染草#才法还提供了用于在包含植物的田地中选择性地控制杂草的方法。在一个实施方案中,植物种子或植物由于多核苷酸插入植物种子或植物中而是草甘膦抗性的,所述多核苷酸为与SEQIDNO:1、13和38(或任何其他已知或公开的编码包含本发明的一种或多种结构域的多肽(例如SEQIDNO:46-52)的多核苷酸序列)不同并且编码具有极性增加的Q-环结构域的多肽的多核苷酸,或编码包含本发明的EPSP合酶结构域的多肽的多核苷酸。在具体方法中,植物用有效浓度的除草剂进行处理,其中除草剂的施用导致杂草或其他未转化的植物的选择性控制。"有效浓度"意指这样的浓度,其控制杂草或其他未转化的植物的生长或散布而不显著影响草甘膦抗性植物或植物种子。关于目的除草剂的此类有效浓度一般是本领域已知的。可以依照用于除草剂施用的常规技术,在种子芽前或芽后将除草剂施用于包含植物或植物种子的田地,所述植物或植物种子已被赋予了对除草剂的抗性。".由#/{/銜豸蛋冷{甜然使用本发明的方法和鉴定的结构域,可以鉴定出赋予草甘膦耐受性的另外的多肽(例如,SEQIDN0:8和10)。这些另外的多肽可以通过下述方式来鉴定搜索包含EPSP合酶序列的序列数据库,和/或结构域的存在。这些多肽包括已知的多肽以及新近鉴定的多肽。应当理解,这些结构域的某些修饰在性质上是可以容忍的,不会破坏这些结构域赋予草甘膦抗性的性质,并因此等价于本文列出的结构域。一般而言,存在4个水平的蛋白质结构一级结构,其由氨基酸的线性链,或多肽序列组成;二级结构,其由蛋白质所折叠成的a-螺旋、p-链和转角给出;三级结构,其由简单的基元构成,所述简单的基元已进行组合从而形成紧凑的球状结构域;和四级结构,其可以包含几条氨基酸链或几个亚单位。当由序列预测功能时,重要的是鉴定在功能上重要的基元或模式。具有类似折叠的蛋白质结构域通常共有相同的分子功能(Hegyi和Gerstein(1999)/.紋飾/.288:147-164;Moult和Melamud(2000)—'刀.^藩L飾7.10:384-389;Shakhnovich等人(2003)/.326:1-9)。对于蛋白质功能重要的结构域的鉴定可以通过使用例如本文其他地方描述的比对程序进行多重序列比对来完成。三维结构可以通过同源性建模来进行预测,即通过使用具有经实验测定的3D结构的序列同系物(>25%的序列同一性)。例如大肠杆菌EPSP合酶(AroA)的三维结构是众所周知的(Sh5nbrunn等人(2001)尸roc.^ca《Sc/yW98:1375-1380)。这种结构基于AroA与草甘膦和莽草酸3-磷酸一起结晶。提供了下述实施例,这是为了举例说明而不是为了限制。实验实施例1.草甘膦抗性EPSP合酶的鉴定GRG1是将草甘膦抗性赋予细菌和植物的EPSP合酶。GRG1氨基酸序列(SEQIDNO:2)与其他草甘膦抗性EPSP合酶的氨基酸序列的比较暗示,在相应于SEQIDNO:2的氨基酸90-105的区域中GRG1明显不同于这些酶。这个区域已知参与底物PEP的识别(Sch5nbrunn等人(2001)户,.hA5W.編90:1376-1380,Stauffer等人(2001)Woc力e历/"/y40:3951-3957)。值得注意的是,GRG1在不同于其他已知的草甘膦抗性EPSP合酶的这个区域中具有基序DCxES和基序PI。gix开放读码框的DM编码序列(SEQIDNO:1)和氨基酸序列(SEQIDNO:2)在于2003年12月18日提交的美国专利申请号10/739,610中提供。GRG1与其他EPSP合酶的比对和这个Q-环区域中的氨基酸的比对分析鉴定出了在这个目的区域中与GRG1共享显著同源性的EPSP合酶的小亚群。值得注意的是,来自产气荚膜梭菌、丙酮丁醇梭菌(C/o"r/V/咖ac"o6z/0^/c咖)、具核梭杆菌(,wso^s"ery咖嬉7e"咖)和坎氏甲烷嗜热菌(¥"力廳/7/,h/^7eW)的EPSP合酶(分别为SEQIDN0:4、6、8和10)在这个区域中与GRG1同源。这些蛋白质的比对在图1中提供。为了测试这种新型结构域在预测草甘膦抗性,和鉴定新型草甘膦抗性EPSP合酶的有用性,用公开的EPSP合酶氨基酸序列的大集合来比较在GRG1的这个区域中的氨基酸序列,并鉴定了几种其他公开的在这个区域中具有与GRG1类似的氨基酸组成的EPSP合酶。实施例2.在"Q-环区域"中与GRG1具有同源性的EPSP合酶的草甘膦抗性在Genbank登记号NC—003030中鉴定的丙酮丁醇梭菌EPSP合酶基因的编码序列(SEQIDNO:5)使用下述引物进行PCR扩增CAGGGATCCGCCATGAATTGTGTTAAAATAAATCCATG(上游)(SEQIDNO:42)和CAGGGCGCGCCTTATTCCCCCAAACTCCACTC(下游)(SEQIDNO:43)。上游引物将起始密码子从TTG变成ATG,如其天然发生的一样。所得到的1.3kb产物用5a/z^I和heI进行消化,并连接到修饰形式的pUC18的相同位点中,并且转化到大肠杆菌菌林DH5ct内。通过限制性消化来鉴定包含EPSP合酶插入片段的阳性克隆,并命名为pAX714。将pAX714菌落在包含IPTG,羧苄青霉素和0、20、50或100mM草甘膦的M63基本培养基上进行划线培养,并且使平板于"X:进行温育。包含pAX714的细胞在测试的所有草甘膦浓度上生长非常良好,这表明所编码的EPSP合酶对于至少100mM是草甘膦抗性的。所编码的EPSP合酶(SEQIDNO:6)命名为grW。。实施例3.从石充磺矿石克化叶菌(5Ty!To7o6^yso/尸a"r/cus)中克隆EPSP合酶基因使用下述引物,从石危磺矿石危化叶菌的基因组DNA(ATCC35092D和SEQIDNO:11)中PCR扩增出EPSP合酶编码序列CAGGGATCCGCCATGATTGTAAAGATTTATCCATC(上游)(SEQIDNO:44)和CAGGGCGCGCCGGTCTCATTCAATAGAAATCTTCGC(下游)(SEQIDNO:45)。上游引物将起始密码子从TTG变成ATG以有助于在大肠杆菌中的翻译。所得到的1.3kbPCR产物用和heI进行消化,连接到已用和I进行消化的经修饰的pUC18(pAX700骨架)中,随后转化到DH5oc细胞内。通过限制性消化和DNA测序来鉴定包含EPSP合酶插入片段的阳性克隆,并命名为pAX716。所编码的EPSP合酶命名为^rg2。(SEQIDNO:12)。实施例4.就对于草甘膦的抗性来测试gr^^和^rg2〃将分别包含rW。和《/^"的质粒pAX714和pAX716转化到大肠杆菌细胞内,并且在包含IPTG、羧节青霉素和各种浓度的草甘膦的M63琼脂培养基上进行划线培养。将pAX701(包含野生型大肠杆菌aroj基因)的菌落用作草甘膦敏感型对照。结果呈现于下表中,并且证实《r^^和^^^的表达赋予了对于高水平的草甘膦的抗性。在草甘膦存在下,表达^^"和^^"的大肠杆菌的生长<table>tableseeoriginaldocumentpage37</column></row><table>实施例5.草甘膦抗性EPSP合酶的分子建模为了进一步鉴定预示草甘膦抗性的关键结构域,基于公开的大肠杆菌EPSP合酶的晶体结构来分析分子建模数据。首先,将GRG1的氨基酸序列对大肠杆菌EPSP合酶(AroA)的三维结构进行拟合,所述三维结构基于其与草甘膦和莽草酸3-磷酸进行结晶(Shonbrunn等人(2001)/WJS98:1375-1380;蛋白质数据库编码(pdb)1G6T)。就对草甘膦结合的影响或底物结合袋的改变来分析本发明的每种结构域的改变的结果。这种分析揭示出在该环中的目的区域,其形成用于PEP及其抑制剂草甘膦的结合袋的一部分,并且包含已知与PEP的磷酸直接氢键键合的不变的精氨酸。这个区域包含极性增加的氨基酸序列和至少一种选自下列的序列结构域D-C-X「X广S-G(SEQIDNO:29),其中X:表示甘氨酸、丝氨酸、丙氨酸或天冬酰胺,和X2表示天冬酰胺或谷氨酸;或D-A-X广X广S-G(SEQIDNO:30),其中X!表示丙氨酸或精氨酸,和X2表示天冬酰胺或谷氨酸;或K-L-K-X,-S-A(SEQIDNO:31),其中X,表示甘氨酸、天冬酰胺或谷氨酸;或W-C-E-D-A-G(SEQIDNO:32)。在某些实施方案中,结构域残基天冬氨酸、半胱氨酸、谷氨酸和丝氨酸各自具有增加这个Q-环区域的极性的效应。尽管不希望受任何作用机制的束缚,但是,相对于其他类别的EPSP合酶,在包含这些结构域的EPSP合酶的区域中极性的变化可以导致该环和草甘膦的带负电荷的膦酸残基之间的电荷排斥。同样地,在某些例子中,这个区域中的残基看起来增加了这个环的体积,并可以导致这样的空间效应,其引起这个环进一步向下移动到结合袋中,从而减少了活性位点袋的尺寸。这种效应可以促成在具有本发明的一种或多种结构域的EPSP合酶中观察到的减少的对于草甘膦的亲和力。例如,GRG20(SEQIDNO:12)在这个环中包含2个赖氨酸残基的置换。这种置换导致极性的净增加,并且由于赖氨酸残基的长侧链还导致增加的体积。使用分子建模数据鉴定了其他目的区域。这些区域包括PX(SEQIDNO:35),其中X是异亮氨酸或亮氨酸。这个区域存在于具有本发明的一种或多种结构域的许多EPSP合酶中。在Q-环区域的oc螺旋的顶端处插入脯氨酸使oc螺旋部分展开。这种插入可能导致相对于结合袋而言的该环的向下移动或其他运动,从而影响相对于PEP而言的草甘膦的结合。D-A-X广X广C-P-D-X3-X广P(SEQIDNO:36),其中t是丝氨酸或苏氨酸,X2是谷氨酰胺或天冬氨酸,X3是丙氨酸、亮氨酸、曱疏氨酸、异亮氨酸或缬氨酸,和L是苯丙氨酸、丙氨酸、亮氨酸、甲疏氨酸、异亮氨酸或缬氨酸,和其中D是在所有EPSP合酶中高度保守的残基。GRG1和GRG10都具有在EPSP合酶的关键天冬氨酸残基附近的氨基酸保守区块。在大肠杆菌结构上这些残基的置换暗示,这些残基可能影响这个关键的天冬氨酸残基与草甘膦的羰基末端的距离相互作用。这个结构域与约169种EPSP合酶的氨基酸序列的比较暗示,尽管相应于SEQIDNO:36的位置6的脯氨酸残基经常在EPSP合酶序列中发现,但与脯氨酸相组合的相应于SEQIDNO:36的位置5的半胱氨酸残基对于GRG1、GRG10和产气荚膜梭菌EPSP合酶来说是独特的。因此,这个结构域的存在也似乎与草甘膦抗性相关。込(SEQIDNO:37)包含具有增加的极性的Q-环区域或本发明的结构域的几种草甘膦抗性EPSP合酶(包括,例如,GRG1、GRG10以及来自产气荚膜梭菌和具核梭杆菌的EPSP合酶)还包含保守的LK结构域。经由在大肠杆菌晶体结构上的拟合来分析这个序列的位置显示出,这个序列暴露于该分子的外部表面上。因为这个序列不接近EPSP合酶的任何已知的关键区域,并且看起来不直接参与PEP、草甘膦或莽草酸3-磷酸的结合,所以这个序列对于草甘膦抗性的贡献仍是未知的。此外,因为这个结构域在与包含本发明结构域的那些EPSP合酶不同的许多EPSP合酶中发现,所以在不存在具有增加的极性的Q-环区域或现在描述的结构域的情况下,这个序列可能对草甘膦抗性有很少的影响或无影响。然而,它可能影响蛋白质的其他性质。实施例6.包含本发明的结构域的另外草甘膦抗性酶的预测考虑到这些关键结构域的发现,能够预测几种草甘膦抗性EPSP合酶的存在。来自具核梭杆菌和坎氏甲烷嗜热菌的EPSP合酶在Q-环区域中与GRG1和GRG10都是高度同源的,并且因此被预测为将草甘膦抗性赋予细胞。实施例7.从具核梭杆菌具核亚种(A歸6a"er/"yg/7"g/e"咖subsp,/7"c/e""/z)中克隆EPSP合酶基因具核梭杆菌EPSP合酶的公开的氨基酸序列(SEQIDNO:7)得自GENBANK,并且通过回译(backtranslation)在合成上进行设计并使用DNA2.G在体外进行合成。所得到的DNA序列被设计为包括侧翼的"a迈y71和AcI位点以促进亚克隆。使用和I从DNA2.O,s供体载体中切出该合成基因,进行凝胶纯化,连接到已用化/z^I和hcl进行消化的经修饰的pUC18的相同位点中,然后转化到DH5oc细胞内。通过限制性消化和DNA测序来鉴定包含EPSP合酶插入片段的阳性克隆,并命名为pAX723(synFusoII)。所编码的EPSP合酶命名为(SEQIDNO:8)。实施例8.从坎氏甲烷嗜热菌中克隆EPSP合酶基因坎氏甲烷嗜热菌EPSP合酶的公开的氨基酸序列得自GENBANK,并且通过回译在合成上进行设计并使用DNA2.0在体外进行合成。所得到的DM序列(SEQIDNO:9)设计为包括側翼的A諸^I和heI位点以促进亚克隆。使用&迈#I和heI从DNA2.O,s供体栽体中切出该合成基因,进行凝胶纯化,连接到已用和heI进行消化的经修饰的pUC18的相同位点中,然后转化到DHSa细胞内。通过限制性消化和DNA测序来鉴定包含EPSP合酶插入片段的阳性克隆,并命名为pAX724(synMethll)。所编码的EPSP合酶命名为^"(SEQIDNO:10)。实施例9.就对于草甘膦的抗性来测试《rg"和将分别包含和gwi^的质粒pAX723和pAX724转化到大肠杆菌细胞内,并且在包含IPTG、羧节青霉素和各种浓度的草甘膦的M63琼脂培养基上进行划线培养。将pAX701(包含野生型大肠杆菌基因)的菌落用作草甘膦敏感型对照。结果呈现于下表中。^rg"和grgW的表达赋予了对于高水平的草甘膦的抗性。在草甘膦存在下,表达^rgW和^^22的大肠杆菌的生长<table>tableseeoriginaldocumentpage41</column></row><table>实施例10.GRG23包含草甘膦抗性EPSP合酶结构域。从显示出强草甘膦抗性的细菌菌林中分离GRGU(于2005年l2月1日提交的美国专利申请号60/741,166;和SEQIDN0:14)。GRG23包含本发明的EPSP合酶结构域,其相对于不包含本发明的结构域的EPSP合酶而言在Q-环区域中具有增加的极性。这种酶将草甘膦耐受性赋予用表达GRG23的表达构建体转化的生物体。实施例11.具有结构域组合的蛋白质的可能性本文提供的结构域与先前定义的II类(美国专利号5,627,061)或III类(于2005年6月29日提交的美国专利申请号60/695,193)EPSP合酶结构域不重叠。因此,可以设想在自然界中可能存在这样的蛋白质,其包含本发明的结构域和II类或III类结构域的所有或一些元件(例如,衍生自石皮伤风梭菌(C/o"r/(//w/^e"/2/)的EPSP合酶(Swissprot登记号Q894D2和SEQIDNO:28)包含II类和本发明的结构域)。在本发明的某些实施方案中,本发明的结构域在EPSP合酶中的存在预示着草甘膦抗性。在进一步的实施方案中,那种结构域的全部或部分的存在与酶活性或功能的增加或增强相关。在另一个实施方案中,本文鉴定的结构域可以与其他酶的氨基酸序列一起进行改造或重组,例如通过用具有极性增加的Q-环区域的多肽或用本发明结构域的全部或部分替代大肠杆菌ar"基因的I类EPSP合酶基序。备选地,可以将本发明的一种或多种结构域插入,以代替不包含本发明的结构域的多肽(包括I类和II类EPSP合酶多肽),这可以包含或不包含或者导致或不导致改善的性质。实施例12.另外的新型EPSP合酶的鉴定使用本发明的方法,通过下述方式可以鉴定出另外的草甘膦抗性EPSP合酶搜索包含EPSP合酶的数据库,和/或比对EPSP合酶的氨基酸序列,并分析包含具有增加的极性的Q-环区域或本发明的结构域的蛋白质。应当理解,这个Q-环区域或这些结构域的某些修饰在性质上是可以容忍的,不会破坏这些区域赋予草甘膦抗性的性质,并因此等价于本文列出的结构域。因此,应认识到与本发明的结构域具有约90%、约91%、约92%、约93%、约94°/。、约95%、约96%、约97%、约98%、约99%或更高同源性的酶可以赋予草甘膦耐受性。由于本发明,现在可以产生在赋予草甘膦抗性的Q-环区域中具有改变的另外的EPSP合酶,在某些情况下不产生与本文描述的具体结构域残基的基本氨基酸相似性。例如,一般而言,可以增加Q-环区域中的极性,和/或增加这个区域中的残基的体容度,和达到相似的草甘膦抗性EPSP合酶。通过使用本发明产生的这些改变中的一些可能改善所得到的蛋白质的草甘膦耐受性,并且合并入本文。因此,本发明包括EPSP合酶氨基酸序列的修饰以增加极性、体容度,或以包含本发明的结构域。在本发明的另一个实施方案中,本文鉴定的结构域可以与其他EPSP合酶的氨基酸序列一起进行改造或重组。例如,本文描述的一种或多种结构域序列可以插入到不包含本发明的结构域的EPSP合酶序列中。所得到的蛋白质可以具有改变的以及改善的性质。实施例13.经由粒子轰击的植物转化最好在授粉后8-12天收集玉蜀黍穗。从穗中分离胚胎,并且大小0.8-1.5mm的那些胚胎优选用于转化。将胚胎以盾盖侧向上的方式放置在合适的温育培养基上,例如DN62A5S培养基(3.98g/LN6盐;1ml/L(1000x母液)N6维生素;800mg/LL-天冬酰胺;100mg/L肌醇;1.4g/LL-脯氨酸;100mg/L酪蛋白氨基酸;50g/L蔗糖;1ral/L(lmg/ml母液)2,4-D)。然而,除DN62ASS外的培养基和盐也是合适的并且是本领域已知的。将胚胎在黑暗中于25。C温育过夜。然而,本来不必使胚胎温育过夜。将所得到的外植体转移至网眼方阵(30-40个/平板),转移至渗透培养基上并保持30-45分钟,随后转移至束射平板(beamingplate)(参见,例如,PCT发明者B·卡尔,B·范德比尔格,P·E·哈莫尔,T·K·欣森申请人:阿则耐克斯公司