提高的植物中的蛋白质表达的制作方法

文档序号:29974239发布日期:2022-05-11 11:55阅读:120来源:国知局
提高的植物中的蛋白质表达1.本技术是申请号为201580004736.9(申请日:2015年1月16日,发明名称:提高的植物中的蛋白质表达)的中国专利申请的分案申请。2.优先权声明3.本技术要求获得于2014年1月17日提交的题为″提高的植物中的蛋白质表达″(increasedproteinexpressioninplants)美国临时专利申请系列号/61/928,852的利益。
技术领域
:4.本公开涉及用于提高多核苷酸在植物细胞内的表达的方法和组合物。在一些实施方案中,多核苷酸的蛋白质编码区被修饰以反映来自宿主生物体的密码子使用偏好,同时保留天然基因中的某些多聚腺苷酸化序列。5.背景6.遗传密码由三核苷酸单位(″密码子″)构成。有64个可能的密码子,每一个密码子指定20种氨基酸中的一种氨基酸,或者指示转录的终止(即″终止密码子″)。因此,至少有一些密码子是冗余的。在绝大多数生物使用的编码系统中,有两种氨基酸是由单个密码子编码的,而所有其他种的氨基酸是由2、3、4或6个密码子编码的,还有3个终止密码子。对于具有2、3、或4个密码子的氨基酸,其各个密码子在第三个核苷酸位置上不同。对于3种具有6个密码子的氨基酸,它们有一组4个密码子遵循这一模式,同时还有另一组2个密码子则在第二个核苷酸位置上不同。对于由6个密码子代表的两种氨基酸(arg和leu),它们分别由一组在第2个核苷酸位置不同的密码子所代表。丝氨酸(ser)的密码子表示是不同寻常的:两组密码子都非常相似。对于由2个密码子表示的氨基酸,在两种情况下第三位都是嘌呤(a,g)或嘧啶(c,t)。7.遗传密码的简并性为构建编码参考多核苷酸多肽产物的可替代多核苷酸提供了机会。例如,密码子简并性允许人们制造这样的合成dna序列:其编码感兴趣的蛋白质,但是使用的密码子与原始dna编码序列中的不同。对于一种特定的氨基酸而言,给定的生物体对可能的密码子的使用不是均等的。每种生物在密码子使用上都有偏好。对于生物体及其近亲而言,整个基因组上密码子使用偏好的模式是独特的。例如,在链霉菌属中,常用密码子一般在第三核苷酸位置上包括g或c。稀有密码子一般在第三核苷酸位置上包括a或t。在其它生物中,a或t是第三位置优选的。在特定的物种内,某些独特类别的基因可能具有其自身的密码子偏好。例如在大肠杆菌中大致有三类基因,它们各自具有独特的密码子使用特征。一类多见于大量表达的重要蛋白中;第二类包括以相对低水平表达的蛋白质;而第三类包括可能是近期从其他物种获得的蛋白质。8.为了在转基因植物中实现异源蛋白质的期望表达水平,已经发现以各种方式改变天然(有时被称为野生型或原始)dna编码序列,从而使例如密码子使用更密切地匹配宿主植物物种的密码子使用,和/或使编码序列的g+c含量更密切地匹配宿主植物物种编码序列中通常发现的g+c水平,和/或除去某些使mrna不稳定的序列,是有利的。例如,使用一种或多种这样的方法已经提高了苏云金芽孢杆菌(bt)晶体蛋白昆虫毒素在植物中的表达。参见例如美国专利5,380,301;美国专利5,625,136;美国专利6,218,188;美国专利6,340,593;美国专利6,673,990;和美国专利7,741,118。9.在大多数合成基因的设计策略中,过程试图使合成基因的密码子组成与待表达该合成基因的宿主的基因的密码子组成相匹配。参见,例如,美国专利公开no.us2007/0292918a1。这样的策略在某些情况下可能导致合成基因在宿主中的表达提高。例如,酵母中的密码子优化可以最小化例如限制氨基酰-trna以及富at序列处的转录终止等的影响,由此显著提高异源基因转录本的翻译。参见例如dalyandheam(2004)j.mol.recognition18:119-38。10.然而,尽管在本领域中公认某种形式的密码子优化是必要的,但是从业者对于优化应当采用的一般策略并未达成一致。某些人喜欢的一种策略是在异源基因的设计过程中最大限度地使用表达宿主物种中的常用密码子。另外一些人更喜欢这样一种策略,即对特定密码子的上下文给予最大重视,从而使在表达宿主中经常出现的密码子对(codonpairs)的使用最大化。第三种策略是使新物种中新编码序列的密码子使用与原始物种中参考编码序列的密码子使用相似。该第三种策略高度重视发现对稀有密码子的可能需求,以确保转录本rna分子具有适当的二级结构。此外,在异源序列中简单地重复使用同一种高频密码子预期最终会产生与选用稀有密码子相同的后果,例如,过度使用相应的trna会限制该trna的可用性。试图为在宿主生物体中表达而优化基因序列的密码子的人必须平衡这些策略和它们背后的关注点,才能找到具体的方法。11.优化编码异源表达蛋白的核苷酸序列的过程对于提高表达产量可能是一个重要步骤。然而,有一些潜在问题限制了特定基因的表达优化的用处。例如,经优化的转录本的二级结构可能会限制转录本的翻译。griswoldetal.(2003)proteinexpressionandpurification27:134-42。此外,有许多序列基序在用于异源表达的合成序列中是期望避免的,包括:大肠杆菌中的i类和ii类转录终止位点(对于由t7启动子控制的基因而言);shine-dalgamo样序列;潜在的剪接信号;促进核糖体移框和序列暂停的序列;和多聚腺苷酸化信号。welchetal.(2010)j.r.soc.interface6:s467-76。特别地,本领域中的观点是,为了提高合成基因在植物中的表达,应当减少多聚腺苷酸化信号序列。美国专利7,741,118。12.公开13.与本领域的观点相反(参见例如美国专利7,741,118),我们最近发现,减少多聚腺苷酸化信号序列(例如aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa)的数目对于提高合成基因在植物内的表达既不是必要的也不是充分的。本文的实施方案将一个令人惊讶并且出人意料的结果投入了现实应用,该结果是:在基因优化过程中,这些多聚腺苷酸化序列在合成编码序列中的保留(就它们在天然序列中的出现而言)可以利用来增加异源蛋白质表达。14.本文的实施方案包括编码至少一种感兴趣多肽的合成核酸。在实施方案中,根据特定基因设计参数的约束设计了编码至少一个感兴趣多肽的合成核酸,这些基因设计参数一般性地增加宿主(例如植物细胞、植物组织和植物)中来自该核酸的该感兴趣多肽的表达。合成核酸序列可以从参考核酸序列设计而得,以便,例如,优化该核酸序列在宿主生物体中的异源表达。15.在一些实施方案中,编码感兴趣多肽的合成核酸已被工程化用于在宿主细胞中表达异源多肽,其中该多肽在不同于宿主细胞的物种的非遗传工程化的细胞中产生,并且被其中的参考多核苷酸所编码。在一些实施方案中,合成核酸经密码子优化,用于在宿主细胞中表达,例如,通过改变参考多核苷酸的核苷酸序列,使其中基本上全部的密码子成为宿主生物体中的优选(最优选)密码子。在一些实施方案中,可以对密码子优化的合成核酸进行进一步的分析和工程化,以便,例如,确认不存在不期望的核酸基序(例如,在从其转录的rna分子中会形成不良二级结构的核酸基序),确认不存在限制性内切酶识别位点,和/或确保密码子和序列多样性。16.在一些实施方案中,编码感兴趣多肽的合成核酸包括:经密码子优化以便在异源细胞中表达的编码序列;和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列在编码序列中位于与在参考多核苷酸中对应的位置。在特定的实施方案中,合成核酸包括与在参考多核苷酸中出现的相同数目的前述多聚腺苷酸化序列。在特定的实施方案中,合成核酸包括与参考多核苷酸中出现的相同数目的前述多聚腺苷酸化序列,并且每一个多聚腺苷酸化序列在编码序列中的位置与在参考多核苷酸中的相应。17.一些实施方案包括制造编码感兴趣多肽的合成核酸的方法,其中该方法包括:提供感兴趣多肽的氨基酸序列,所述感兴趣多肽在非遗传工程化的细胞中由参考多核苷酸编码,所述参考多核苷酸包括至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa;并产生编码该感兴趣多肽的合成核酸,其在编码序列中的与在所述参考多核苷酸中对应的位置上含有至少一个所述的多聚腺苷酸化序列。在特定的实施方案中,产生合成核酸,使其包含与在参考多核苷酸中出现的相同数目的前述多聚腺苷酸化序列,并且每个多聚腺苷酸化序列在该合成核酸编码序列中的位置与在参考多核苷酸中的位置对应。18.其他实施方案包括含有至少一个前述合成核酸的载体(例如植物转化载体)。特定的实施方案包括这样的载体,所述载体含有转录单元,所述转录单元包括编码感兴趣多肽的合成核酸,所述合成核酸包含:经密码子优化以便在异源细胞中表达的编码序列,和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列在编码序列中处于与在参考多核苷酸中的位置对应的位置。在一些实例中,这样的载体可包括,例如但不仅限于:5’非翻译序列(例如,包括植物启动子);合成dna序列;和3’非翻译区(例如,包括转录终止信号)。19.特定的实施方案包括产生表达感兴趣多肽(例如,感兴趣的异源多肽)的植物、植物部分、植物器官、植物种子和/或植物细胞的方法。特定实施方案的方法包括:用至少一个编码感兴趣多肽的合成核酸转化植物、植物部分、植物器官、植物种子和/或植物细胞,该合成核酸包括:经密码子优化以便在异源细胞中表达的编码序列,和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列在编码序列中处于与在参考多核苷酸中对应的位置;和表达该核酸从而产生由其编码的感兴趣多肽。在实例中,用前述合成核酸转化的植物、植物部分、植物器官、植物种子和/或植物细胞相比于用参考多核苷酸转化的相同物种的植物、植物部分、植物器官、植物种子和/或植物细胞可表达更大量的感兴趣多肽。20.一些实施方案包括含有编码感兴趣多肽的合成核酸的植物、植物部分、植物器官、植物种子和/或植物细胞,该合成核酸包括经密码子优化以便在异源细胞中表达的编码序列,和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列位于该编码序列的与在非遗传工程化修饰的生物体中编码所述感兴趣天然多肽的参考多核苷酸中相应的位置。21.其它实施方案包括在植物中获得期望的表达表型的方法。一些实施方案的方法包括用至少一个编码感兴趣多肽的合成核酸转化植物、植物部分、植物器官、植物种子和/或植物细胞,该合成核酸包括:经密码子优化以便在异源细胞中表达的编码序列、和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列位于该编码序列的与在参考多核苷酸中相应的位置,并且其中该感兴趣多肽在该植物、植物部分、植物器官、植物种子和/或植物细胞中表达,借此赋予或者强化其表型。在特定实施方案中可以获得或强化的表型的实例包括,例如但不仅限于:害虫抗性和/或除草剂抗性;改变的油谱(modifiedoilprofile);和胁迫耐性。22.例如,一些实施方案中的方法包括通过在植物细胞中表达至少一种合成多核苷酸来控制植物、谷粒(grain)和/或种子内的害虫(pest),其中该合成多核苷酸编码昆虫毒素(例如苏云金芽孢杆菌cry蛋自);通过提供获自从合成多核苷酸表达昆虫毒素的转基因植物的谷粒粗粉(meal)或面粉来控制谷粒粗粉或面粉中的害虫;通过在植物中表达至少一个合成多核苷酸来提高植物的除草剂耐受性,其中该合成多核苷酸编码除草剂耐受性多肽(例如,芳氧基链烷酸酯双加氧酶(aad1);膦丝菌素乙酰转移酶;5-烯醇式丙酮酰莽草酸-3-磷酸合酶);通过在植物中表达至少一个合成多核苷酸来修改植物的油谱,其中该合成多核苷酸编码用于修改植物油谱的多肽(例如,脂肪酸去饱和酶);和通过在植物中表达至少一个合成多核苷酸增加植物的胁迫耐受性(例如,水和/或热胁迫耐受性),其中该合成多核苷酸编码胁迫耐受性基因的产物(例如,胁迫相关蛋白(sap1)和/或1-cys过氧化物酶(perl)蛋白)。特定的实施方案包括通过在植物中表达合成多核苷酸来将报告基因引入到植物中的方法,其中该合成多核苷酸编码转化标志物蛋白(例如,gfp和/或β-葡糖醛酸酶)。23.一些实施方案还包括从包含合成核酸的转基因植物或其部分或材料产生的组合物(例如,商业产品),该合成核酸编码感兴趣的多肽,并且包括经密码子优化以便在异源细胞中表达的编码序列,和至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,其中该至少一个多聚腺苷酸化序列位于编码序列的与在参考多核苷酸中相应的位置。在特定的实施方案中,该组合物是选自下组的商品:谷物粗粉、面粉、蛋白浓缩物,和油。24.通过参考附图的下面数个实施方案的详细说明书,前述和其它特征将更加显而易见。25.附图简述26.图1包括三个示例性二元质粒的描述,它们被用于cry1ab玉米转化。所有质粒除了cry1ab多核苷酸之外是相同的。27.图2包括由用于cry1ab转化的构建体估计的转化频率。pdab109812是阴性对照,该质粒含有yfp代替cry1ab,但是调节元件和选择标志物盒是相同的。28.图3包括使用jmp统计学分析软件对每个背景的t0转化事件的统计学分析汇总。对于每个背景,平均值是绿色菱形的中心线。29.图4包括在v5发育期收集的玉米叶组织的western印迹图像。泳道的内容:泳道1=阴性对照;泳道2=bioradmwm,20μl;泳道3=107645[1]-021.001aj.016;泳道4=107645[1]-021.001aj.021;泳道5=107645[1]-021.001aj.006;泳道6=111447[1]-002.001;泳道7=111447[1]-003.001;泳道8=111447[1]-033.001;泳道9=111448[1]-030.001;泳道10=111448[1]-013.001;泳道11=111448[1]-032.001;泳道12=111449[1]-020.001;泳道13=111449[1]-009.001;泳道14=111449[1]-018.001;泳道15=纯化的细菌cry1ab标准(1ng)。107645事件为含有在昆虫生物测定中被确定为有活性的全长cry1ab的t1事件。[0030]图5包括各构建体对玉米穗蛾(cew)的百分比伤害的tukey-kramer单因素分析的总结。对照材料——109812(yfp)、b104(非转化对照)和hx1与cry1ab事件并行评估。所有三种含有cry1ab的背景均提供了与相等的针对cew的保护。[0031]图6包括各构建体对欧洲玉米螟(ecb)的百分比伤害的tukey-kramer单因素分析的总结。对照材料——109812(yfp)、b104(非转化对照)和hx1与cry1ab事件并行评估。所有三种含有cry1ab的背景均提供了与相等的针对ecb的保护。[0032]图7包括各构建体对cry1fa抗性的欧洲玉米螟(recb)的百分比伤害的tukey-kramer单因素分析的总结。对照材料——109812(yfp)、b104(非转化对照)和hx1与cry1ab事件并行评估。所有三种含有cry1ab的背景均提供了针对recb的保护。[0033]图8包括在cry1fa玉米转化实验中使用的12种二元质粒的图。除了pdab110842之外的所有质粒在除编码cry1fa的多核苷酸之外的区域均相同。二元质粒pdab110842的基因盒与产品最相似,包括zmubi1启动子v6和atuorf25/263’utrv1。[0034]图9包括的图片显示,来自pdab111436和pdab11437背景的植物表现负面农艺学表型。茎和叶材料检测到红的变色点,且叶和茎组织严重弯曲。[0035]图10包括使用jmp统计学软件对每种背景的t0事件的统计学分析的总结。检测到产品在这些温室条件下以60ng/cm2表达cry1fa。每种背景的绿色菱形的中心线是平均值。刚好低于40ng/cm2的线是所有背景的所有事件的总平均值。[0036]图11包括在发育的v5期收集的玉米叶组织的western印迹图像。泳道的内容如下:泳道1=阴性对照;泳道2=bioradmwm,20μl;泳道3=111434[1]-010.001;泳道4=111434[1]-004.001;泳道5=111434[1]-013.001;泳道6=111435[1]-003.001;泳道7=111435[1]-006.001;泳道8=111435[1]-012.001;泳道9=细菌纯化的cry1fa标准(2ng);和泳道10=纯化的细菌cry1fa标准(20ng)。[0037]序列列表[0038]附加序列列表中列举的核酸序列用如37c.f.r.§1.822所定义的核苷酸碱基的标准缩写显示。仅显示了每条核酸序列的一条链,但是应当理解,对所显示的链的指称也包含了该互补链。在附加序列列表中;[0039]seqidno:1显示在本文的一些位置处被称作irdig.1471.2的多核苷酸序列:[0040][0041][0042]seqidno:2显示在本文的一些位置处被称作irdig.1471.3的多核苷酸序列:[0043][0044][0045]seqidno:3显示在本文的一些位置处被称作irdig.1471.4的多核苷酸序列:[0046][0047][0048]seqidno:4显示的多核苷酸序列在本文的一些位置处被称作irdig.586.34:[0049][0050][0051]seqidno:5显示在本文的一些位置处被称作irdig.586.35的多核苷酸序列:[0052][0053][0054][0055]seqidno:6显示在本文的一些位置处被称作irdig.586.36的多核苷酸序列:[0056][0057][0058]seqidno:7显示在本文的一些位置处被称作irdig.586.37的多核苷酸序列:[0059][0060][0061]seqidno:8显示在本文的一些位置处被称作irdig.586.38的多核苷酸序列:[0062][0063][0064][0065]seqidno:9显示在本文的一些位置处被称作irdig.586.39的多核苷酸序列:[0066][0067][0068]seqidno:10显示在本文的一些位置处被称作irdig.586.40的多核苷酸序列:[0069][0070][0071]seqidno:11显示在本文的一些位置处被称作irdig.586.41的多核苷酸序列:[0072][0073][0074]seqidno:12显示在本文的一些位置处被称作irdig.586.42的多核苷酸序列:[0075][0076][0077]seqidno:13显示在本文的一些位置处被称作irdig.586.43的多核苷酸序列:[0078][0079][0080]seqidno:14显示在本文的一些位置处被称作cry1ftrunchx的多核苷酸序列:[0081][0082][0083]seqidno:15-29显示了在本文的某些实施方案中使用的示例性引物和探针。[0084]实施本发明的模式[0085]i.若干实施方案的概览[0086]本文提供了用于工程化合成基因以便提高其编码蛋白产物的表达的组合物和方法。本文公开了一个出人意料并且有普遍应用性的发现,即通过工程化合成基因的核苷酸序列使之包含在天然基因中存在的多聚腺苷酸化序列,可以提高异源蛋白质在植物细胞内的表达。在一些实施方案中,合成基因中包含的多聚腺苷酸化序列的数目和位置与它们存在于天然基因中的数目和位置相同。在一些实例中令人惊讶并且出人意料地发现,与使用常规方法设计的合成基因相比,这些合成基因证明可以增加在v5叶组织中的平均蛋白表达(例如,大约0.5倍-大约17倍)。[0087]工程化编码多肽的合成多核苷酸的方法可以包括,例如但不仅限于:用优选密码子(例如,最优选的密码子)取代稀有密码子;除去已知的失稳因子;除去预测会形成二级茎环结构的序列;除去非预期的开放阅读框;和除去不想要的内部限制性酶识别序列。在本文的实施方案中,所得的编码多肽的多核苷酸被额外地修饰,使之包含至少一个特定的多聚腺苷酸化序列,所述多聚腺苷酸化序列在编码相同多肽的天然基因中相同的核苷酸位置上存在,从而保持该特定多聚腺苷酸化序列的位置和总数目。[0088]本文的具体实施例用9种不同的编码杀虫bt蛋白的基因和一种草甘膦耐受基因证实了前述的玉米中的发现。在本文的特定实施例中,使用前述的方法和组合物工程化合成多核苷酸,使之在作物植物(例如,玉米和大豆)中表达异源多肽。例如,在t0代的转基因玉米中评估了三种截短cry1ab基因构型的表达。研究确定,这些cry1ab多核苷酸中的一个,其中保留了天然的多聚腺苷酸化序列,与其它被评估的多核苷酸相比以显著更高的水平产生了稳定的cry1ab蛋白。作为进一步的实例,还在t0代的转基因玉米中评估了12个截短cry1fa基因构型的表达。有2个cry1fa多核苷酸与所有其它被评估的多核苷酸相比以显著更高的水平产生了稳定的cry1fa蛋白。[0089]ii.缩写[0090]btꢀꢀꢀꢀꢀꢀꢀꢀ苏云金芽孢杆菌[0091]玉米穗蛾ꢀꢀ℃ew[0092]ecbꢀꢀꢀꢀꢀꢀꢀ欧洲玉米螟[0093]fawꢀꢀꢀꢀꢀꢀꢀ秋粘虫[0094]gfpꢀꢀꢀꢀꢀꢀꢀ绿色荧光蛋白[0095]ncbiꢀꢀꢀꢀꢀꢀ美国国家生物技术信息中心[0096]pcrꢀꢀꢀꢀꢀꢀꢀ聚合酶链式反应[0097]recbꢀꢀꢀꢀꢀꢀcry1fa抗性的欧洲玉米螟[0098]iii.术语[0099]除非在内容中清晰地指明,否则单数形式″一″、″一个″和″该″的使用包括复数指代。例如,指称″一个多核苷酸″包括多个多核苷酸,指称″一个底物″包括多个这样的底物,指称″一种变异体″包括多种这样的变异体,等。[0100]在述及数值范围时,应当理解,所述及的范围上限和下限之间的每个中间整数值及其分数也被具体公开,并包括这些数值之间的每个子范围。任何范围的上限和下限可以被独立地包括在该范围之内,或者排除在该范围之外,并包含任一个、两个或者0个界限的范围也涵盖在本发明之内。当所讨论的数值具有内在界限时(例如,成分可能的浓度为0-100%,或者水溶液的ph范围可能为1-14),那些内在界限被具体公开。[0101]当述及数值时,应当理解,与所述及的数值的量大约相同的数值也包含在本发明的范围内。当公开一个组合时,该组合元素的每一个子组合也被具体公开,并且在本发明的范围内。相反,当个别地公开不同的要素或要素组时,它们的组合也被包含在内。当公开了本发明的任何要素具有多种可替换形式时,也公开了该发明中每个可替换物被单独排除的实例,或者每个替换物与其它可替换物任意组合的实例(发明的多于一个要素可以具有此类排除,并且具有此类排除的要素的所有组合均被公开)。[0102]除非另外提供,否则本文所用的全部技术和科学术语均具有与遗传学、生物信息学和基因设计领域普通技术人员所公知的相同的含义。包含在本公开中使用的许多术语的综合性词典有:singletonetal.(1994)dictionaryofmicrobiologyandmolecularbiology,第2版,johnwileyandsons,newyork;和haleandmarham(1991)theharpercollinsdictionaryofbiology,harperperennial,newyork。与本文公开者相似或等同的方法和材料可以在本发明的实施方案的实践或测试中使用,尽管某些方法和材料在本文公开那些中已被举例说明。[0103]密码子使用偏好:如本文所使用的,术语″密码子使用偏好″,或简称″密码子使用″,是指在某种生物体中编码某种氨基酸的某种特定密码子的高频率优先使用(相对于其它同义密码子而言)。密码子使用偏好可以表达为在特定生物体的基因组中特定密码子的使用率(例如,相比于编码相同氨基酸的其它密码子)的定量量度。[0104]本领域技术人员已知有各种方法用于确定密码子使用偏好。在一些实施方案中,密码子使用偏好可以通过密码子适应指数(cai)方法加以确定,密码子适应指数实质上是某个基因的密码子使用与预先定义的一组高表达基因的密码子使用的距离的量度。sharpandli(1987)nucleicacidsres.15:1281-95。用于确定密码子使用偏好的备选方法包括milc(measureindependentoflengthandcomposition,独立于长度和组成的测量)(supekandvlahovicek(2005)bmcbioinformatics6:182),和相对同义密码子使用(rscu),后者是用特定密码子的观察频率除以预期该氨基酸所有同义密码子等同使用时的频率。sharpetal.(1986)nucleicacidsres.14:5125-43。rscu值接近1.0,表明特定密码子缺少偏好性,而偏离1.0则反映密码子使用偏好。[0105]因此,密码子使用偏好包括编码相同氨基酸的密码子(″同义密码子″)使用的相对频率。偏好可能自然发生;例如,一个生物体基因组的密码子偏好反映了该生物体中所有基因的同义密码子的相对总体使用。偏好也可以在计算机算法中使用,在其中,例如,它可以用于确定不同同义密码子被选用于设计多核苷酸序列的相对频率。类似地,用于编码多肽的任何序列元件在多核苷酸中的″相对″频率是该序列元件被用于编码该多肽的特征(feature)的频率,除以该序列元件能够编码的特征的给定阅读框在多肽中的出现次数。[0106]密码子使用偏好还可以从特定表达宿主生物体的密码子使用表推知。许多表达宿主生物体的密码子使用表是容易获得的。参见例如nakamuraetal.(2000)nucleicacidsres.28:292(″密码子使用数据库″,可以在kazusa.or.jp/codon获得更新版本)。当密码子使用表不可得时,可以从公共生物遗传数据库中编集而得,公共生物遗传数据库例如由ncbi维护的那些(可以在ncbi.nlm.nih.gov/sites/genome访问)。在一些实施方案中,密码子使用表可以由获自特定表达宿主生物的一系列编码区编集而得。在一些实例中,一系列编码区包括至少100,至少200,至少300,至少400,至少500,至少550,至少600,或者更多个获自特定表达宿主生物的编码区。[0107]术语″密码子使用表″或″密码子偏好表″或″密码子频率表″可互换使用,描述这样的表:该表将可用于编码特定氨基酸的每种密码子与每种密码子在特定生物中、该生物的规定类型的基因中、或者一个或多个合成多核苷酸中被用于编码氨基酸的频率相关联。[0108]绝对密码子频率:如本文所使用的,术语″绝对密码子频率″是指在给定阅读框(例如,用于编码感兴趣多肽的阅读框)的多核苷酸或一系列多核苷酸中,密码子相对于密码子总数(例如,同义和非同义密码子)的出现频率。类似地,用于编码多肽的任何序列元件在多核苷酸中的″绝对″频率是该序列元件用于编码该多肽的某个特征(例如,氨基酸,氨基酸对,等)的频率,除以与该序列元件能够编码的特征大小相同的特征在多肽中的出现次数。[0109]如本文关于密码子偏好和密码子频率所使用的,″稀有密码子″是在感兴趣生物中的使用小于10%的密码子。在一些实施例中,″稀有密码子″是在生物体中的使用小于5%的密码子。如本文所使用的,″优选密码子″是在感兴趣生物体中的使用大于5%的密码子。在一些实施例中,″最优选的密码子″是在生物体中的使用大于10%的密码子,例如在生物体中在编码特定氨基酸时具有最高使用率的密码子。[0110]密码子空间(codonspace):如本文所使用的,术语″密码子空间″是指能够用于编码特定多肽的全部可能多核苷酸序列,差异在于改变同于编码多肽内氨基酸的密码子。[0111]密码子替换:如本文所使用的,术语″密码子替换″是指通过改变被编码多肽的一个或多个氨基酸的一个或多个密码子来改变核苷酸编码序列,而不改变被编码多肽的氨基酸序列。[0112]密码子优化:如本文所使用的,术语″密码子优化″是指用于修饰现有编码序列,或者最初对编码序列进行设计,以便例如提高来自该编码序列的转录本rna分子在表达宿主细胞或生物体内的翻译,或者提高编码序列的转录的过程。密码子优化包括,但不仅限于,如下处理:包括选择用于编码序列的密码子,使之适合表达宿主生物体的密码子优选。密码子优化还包括,例如,有时被称作″密码子协调(codonharmonization)″的过程,其中在源生物体中被识别为低使用密码子的密码子序列的密码子被改变成在新表达宿主中被识别为低使用的密码子。这个过程可以通过在翻译/延伸期间引入天然且适当的暂停而帮助被表达多肽的正常折叠。birkholtzetal.(2008)malariaj.7:197-217。[0113]应当理解,由于遗传编码的冗余性,多个dna序列可以被设计成编码单个氨基酸序列。因此,可以设计优化的dna序列,用于例如除去多余的限制位点和非期望的rna二级结构,同时优化编码区的核苷酸序列,从而使密码子组成与待表达该dna的宿主的总体密码子组成相似。关于合成dna序列的设计和制作的指导可以在例如下列文献中找到:pct国际专利申请nos.wo2013016546,wo2011146524,和wo1997013402;和美国专利6,166,302和5,380,831。[0114]修饰:如本文所使用的,术语″修饰″或者″改变″或者其任何形式,意思是修饰、改变、代替、删除、替换、除去、变化、或转化。[0115]回交:回交方法可用于将核酸序列引入到植物中。回交技术已经广泛使用了数十年,用于将新性状引入到植物中。jensen,n.编辑.plantbreedingmethodology,johnwiley&sons,inc.,1988。在典型的回交方案中,将原始的感兴趣栽培品种(轮回亲本)与携带待转移感兴趣基因的第二栽培品种(非轮回亲本)杂交。然后,将该杂交所得的子代再次与轮回亲本杂交,重复这个过程直到获得如下的植物,其中不但来自非轮回亲本的被转移基因,轮回植物基本上全部的期望形态和生理特征也均在被转换的植物中复原。[0116]分离的:″分离的″生物组分(例如核酸或蛋白质)已经与该组分天然存在的生物体细胞中的其它生物组分(即,其它染色体和染色体外dna和rna和蛋白质)实质上分开,与所述其他生物组分分开产生,或者自所述其他生物组分纯化出来,同时导致该组分中的化学上或功能上的改变(例如,可以通过断裂染色体中连接某核酸与其余dna的化学键而从染色体中分离该核酸)。已″分离″的核酸分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。该术语还包括通过在宿主细胞中重组表达制备的核酸和蛋白质,以及化学合成的核酸分子、蛋白质和肽。[0117]核酸分子:如本文所使用的,术语″核酸分子″可以指核苷酸的聚合物形式,其同时包括rna的有义链和反义链、cdna、基因组dna,和上述的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸、或任一类型核苷酸的修饰形式。如本文所使用的,″核酸分子″与″核酸″和″多核苷酸″是同义的。除非另有规定,否则核酸分子的长度通常是至少10个碱基。该术语包括dna的单链和双链形式。核酸分子可以包括自然发生的和/或修饰的核苷酸,它们通过自然发生的和/或非自然发生的核苷酸连接键连接在一起。[0118]核酸分子可以被化学或生物化学修饰,或者可以含有非自然的或衍生的核苷碱基,这是本领域技术人员容易意识到的。这些修饰包括,例如,标记物、甲基化、用类似物取代一个或多个天然存在的核苷酸,核苷酸间修饰(例如,不带电的连接:例如,甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等;带电荷的连接:例如,硫代磷酸酯、二硫代磷酸酯等;侧基部分:例如,肽;嵌入剂:例如,吖啶、补骨脂素,等;螯合剂;烷化剂;和经修饰的连接:例如,α-异头核酸等)。术语″核酸分子″还包括任何拓扑构象,包括单链、双链、部分双链、三重复、发夹化(hairpinned)、圆形和挂锁构象。[0119]可操作连接:当第一核酸序列与第二核酸序列有功能上的关系时,第一核酸序列与第二核酸序列可操作连接。当重组产生时,可操作连接的核酸序列一般是毗邻的,并且当需要连接两个蛋白质编码区时,处于同一阅读框内。然而,可操作连接的元件不必是毗邻的。[0120]在用于指称调节序列和编码序列时,术语″可操作连接″的意思是调节序列影响所连接的编码序列的表达。″调节序列″或″控制元件″是指这样的核苷酸序列,其可影响相关编码序列的转录时机和水平/量、rna加工或稳定性、或翻译。调节序列可以包括启动子;翻译前导序列;内含子;增强子;茎环结构;阻遏物结合序列;终止序列;和多聚腺苷酸化序列。具体的调节序列可以位于与之可操作连接的编码序列的上游和/或下游。另外,与编码序列可操作连接的具体调节序列可以位于双链核酸分子的相关互补链上。[0121]启动子:如本文所使用的,术语″启动子″是指一段dna区域,其可以位于转录起点的上游,并且可以参与rna聚合酶和其它蛋白质的识别和结合,以触发转录。启动子可以和用于在细胞内表达的编码序列可操作连接,或者,启动子可以和编码信号序列的核苷酸序列可操作连接,该信号序列可以与用于在细胞内表达的编码序列可操作连接。″植物启动子″可以是能够在植物细胞内起始转录的启动子。处于发育控制下的启动子的实例包括优先在某些组织(例如叶,根,种子,纤维,木质部导管,管胞或厚壁组织)中起始转录的启动子。这类启动子被称作″组织优选的″。仅在某些组织中起始转录的启动子称作″组织特异的″。″细胞类型特异的″启动子主要在一个或多个器官的特定细胞类型中,例如在根和叶的维管细胞中驱动表达。″诱导型″启动子可以是可以处于环境控制下的启动子。可以通过诱导型启动子起始转录的环境条件包括缺氧条件和光的存在。组织特异性、组织优选型、细胞类型特异性和诱导型启动子构成了″非组成型″启动子类别。″组成型″启动子是在生物体的大多数细胞中在大多数环境条件下均可以有活性的启动子。[0122]在本发明的一些实施方案中,可以使用任何诱导型启动子。参见wardetal.(1993)plantmol.biol.22:361-66。使用诱导型启动子,转录速度会响应诱导剂而增加。示例性诱导型启动子包括,但不仅限于:来自acei系统的启动子,其响应铜;来自玉米的in2基因,其响应苯磺酰胺除草剂安全剂;来自tn10的tet阻遏物;和来自类固醇激素基因的诱导型启动子,其转录活性可以被糖皮质激素诱导(schenaetal.(1991)proc.natl.acad.sci.usa88:10421-5)。[0123]示例性的组成型启动子包括,但不仅限于:来自植物病毒的启动子,例如来自camv的35s启动子;来自水稻肌动蛋白基因的启动子;泛素启动子;pemu;mas;玉米h3组蛋白启动子;和als启动子,欧洲油菜(brassicanapus)als3结构基因5′的xba1/ncoi片段(或者与所述xba1/ncoi片段相似的核苷酸序列)(pct国际专利公开no.wo96/30530)。[0124]此外,任何组织特异性或组织优选的启动子均可以在本发明的一些实施方案中使用。用包含与组织特异性启动子可操作连接的编码序列的核酸分子转化的植物可以排他性地或者优先地在特定的组织中产生编码序列的产物。示例性的组织特异性或组织优选启动子包括,但不仅限于:根优选的启动子,例如来自菜豆蛋白基因的启动子;叶特异性且光诱导的启动子,例如来自cab或rubisco的启动子;花药特异性启动子,例如来自lat52的启动子;花粉特异性启动子,例如来自zm13的启动子;孢子优选的启动子,例如来自apg的启动子;和种子特异性启动子(例如,pvdlec2,lfkcs3,fae1,boacp,或bnnapinc的启动子)。[0125]异源的:术语″异源的″在本文中应用于核酸(例如,多核苷酸、dna、rna和基因)时,意味着不同的来源。例如,如果宿主细胞用天然不存在于非转化宿主细胞内的核酸转化,那么该核酸对宿主细胞是异源的(和外源的)。而且,转化核酸的不同元件(例如,启动子、增强子、编码序列、终止子,等)彼此之间可以是异源的和/或对被转化的宿主可以是异源的。[0126]天然的:如本文所使用的,术语″天然的″是指多核苷酸或基因(与其自身的调节序列,如果存在的话)处于它在自然界中所出现的生物体或生物体基因组的天然位置中的形式。[0127]内源的:如本文所使用的,术语″内源的″是指多核苷酸、基因或多肽处于在自然界中正常包含该分子的生物体或基因组中。[0128]转化:如本文所使用的,术语″转化″是指将一个或多个核酸分子转移到细胞中。当转导到细胞中的核酸分子开始被细胞稳定复制时——或是由于核酸分子组入细胞基因组中或者是由于附加体复制——细胞被核酸分子″转化″。如本文所使用的,术语″转化″涵盖所有能够将核酸分子引入到这样的细胞内的技术。实例包括,但不仅限于,用病毒载体转染,用质粒载体转化,电穿孔(frommetal.(1986)nature319:791-3),脂质体转染(felgneretal.(1987)proc.natl.acad.sci.usa84:7413-7),显微注射(muelleretal.(1978)cell15:579-85),土壤杆菌介导的转移(fraleyetal.(1983)proc.natl.acad.sci.usa80:4803-7),直接dna摄取,和微粒轰击(kleinetal.(1987)nature327:70)。[0129]转基因:整合到宿主基因组内且编码产物的外源核酸序列。在一些实例中,转基因可以含有与转基因的编码序列可操作连接的调节序列(例如启动子)。[0130]载体:被引入细胞中以便例如产生被转化细胞的核酸分子。载体可以包括允许它在宿主细胞中复制的核酸序列,例如复制起点。载体的实例包括,但不仅限于:携带外源dna进入细胞内的质粒、粘粒、噬菌体或病毒。载体还可以包括一个或多个基因、反义分子、和/或选择标志物基因,和本领域已知的其它遗传元件。载体可以转导、转化或感染细胞,从而导致细胞表达由该载体编码的核酸分子和/或蛋白质。载体任选地包括可帮助它将核酸分子引入细胞内的材料(例如脂质体和蛋白包层)。[0131]表达:如本文所使用的,术语″表达″可以指由多核苷酸编码的mrna的转录和稳定积累,或者指这种mrna翻译成多肽。如本文所使用的,术语″过表达″是指比相同或密切相关的基因的内源表达更高的表达。如果异源基因的表达高于密切相关的内源基因(例如,同源物)的表达,则异源基因被过表达。[0132]外源的:术语″外源的″在本文中应用于核酸(例如,多核苷酸、dna、rna和基因)时,是指一个或多个通常不存在于其特定环境或背景中的核酸。例如,如果用在自然界中不存在于非转化宿主细胞内的核酸转化宿主细胞,那么该核酸对宿主细胞是外源的。如本文所使用的,术语″外源″还指一个或多个在序列上与宿主细胞中已经存在的核酸相同,但是与宿主细胞中已经存在的具有相同序列的核酸相比,位于不同的细胞或基因组背景中的核酸。例如,与具有相同序列的核酸所通常整合在宿主细胞基因组内的位置相比,整合在宿主细胞基因组的不同位置处的核苷酸对于宿主细胞是外源的。而且,当具有相同序列的核酸通常仅存在于宿主细胞的基因组内时,存在于宿主细胞内的质粒或载体中的核酸(例如,dna分子)对宿主细胞是外源的。[0133]序列同一性:如本文中所使用的,术语″序列同一性″或″同一性″在两个核酸或多肽序列的语境中,可以指当两个序列经过比对从而在特定比较窗口上具有最大对应度时,两个序列中相同的残基(分别是核苷酸或氨基酸)。[0134]如本文所使用的,术语″百分比序列同一性″可以指通过在比较窗口上比较两个最佳比对的序列(例如,核酸序列和氨基酸序列)确定的数值,其中比较窗口中的序列部分与参考序列(其不含有添加或缺失)相比可以包含添加或缺失(即,缺口),以实现两个序列的最佳比对。百分比的计算是通过确定两个序列中存在的相同核苷酸或氨基酸残基的位置数目从而产生匹配位置数目,该匹配位置数目除以比较窗口内的位置总数,并将该结果乘以100从而产生百分比序列同一性。[0135]用于比对比较序列的方法是本领域众所周知的。在下列文献中描述了各种程序和比对算法,例如:smithandwaterman(1981)adv.appl.math.2:482;needlemanandwunsch(1970)j.mol.biol.48:443;pearsonandlipman(1988)proc.natl.acad.sci.u.s.a.85:2444;higginsandsharp(1988)gene73:237-44;higginsandsharp(1989)cabios5:151-3;corpetetal.(1988)nucleicacidsres.16:1088190;huangetal.(1992)comp.appl.biosci.8:155-65;pearsonetal.(1994)methodsmol.biol.24:307-31;tatianaetal.(1999)femsmicrobiol.lett.174:247-50。序列比对方法和同源性计算的详细讨论可以参见例如altschuletal.(1990)j.mol.biol.215:40310。[0136]美国国家生物技术信息中心(ncbi)基本局部比对搜索工具(blasttm;altschuletal.(1990))可在几个来源访问,包括美国国家生物技术信息中心(bethesda,md)和在互联网上,与多种序列分析程序联合使用。如何使用这一程序确定序列同一性的描述可以在互联网上获得,在blasttm的″帮助″一节中。对于核酸序列的比较,可以用缺省参数来使用blasttm(blastn)程序的″blast2sequences″功能。当使用这种方法进行评估时,与参考序列具有较大相似性的核酸序列将显示较大的百分比同一性。strategyofnucleicacidprobeassays,”收录于laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes,第i部分,第2章,elsevier,ny,1993;和ausubel等编辑,currentprotocolsinmolecularbiology,第2章,greenepublishingandwiley-interscience,ny,1995。[0143]如本文所使用的,″严格条件″包括只有当杂交分子与dna靶之间的错配小于25%时才会发生杂交的条件。″严格条件″包括更特定水平的严格度。因此,如本文所使用的,″轻度严格″条件是指序列配错大于25%的分子不会杂交的的条件;″中等严格″条件是指序列配错大于15%的分子不会杂交的的条件;和″高严格″条件是指序列配错大于10%的分子不会杂交的的条件。″极高严格″条件是指序列配错大于6%的分子不会杂交的的条件。[0144]在特定的实施方案中,严格条件是在下列条件杂交:65℃的6x盐水-柠檬酸钠(ssc)缓冲液,5xdenhardt溶液,0.5%sds和100μg剪切的鲑鱼睾dna,随后在65℃的2xssc缓冲液和0.5%sds,然后是1xss℃缓冲液和0.5%sds,最后是0.2xssc缓冲液和0.5%sds中顺次清洗15-30分钟。[0145]关于上文所讨论的全部探针,探针可以包含额外的核酸序列,例如,启动子、转录信号和/或载体序列。[0146]蛋白质/多肽:术语″蛋白质″和″多肽″在本文中可互换使用。该术语是指通过肽键连接的氨基酸的连续分子链。该术语不指产物的特定长度。因此,″肽″、″寡肽″和″蛋白质″均包括在多肽的定义内。该术语包括这样的多肽,该多肽含有在体内或体外对该多肽进行的共翻译和/或翻译后修饰,例如但不仅限于:糖基化,乙酰化,磷酸化,peg化和硫酸化。此外,蛋白质片段、类似物(包括不是由遗传密码编码的氨基酸,例如,高半胱氨酸、鸟氨酸、对乙酰基苯丙氨酸、d-氨基酸和肌酸),天然或人工的突变体,变异体,融合蛋白,衍生的残基(例如,氨基的烷基化,羧基的乙酰化或酯化),以及上述的任何组合,均包括在多肽的含义内。[0147]通常,蛋白质具有功能。然而,蛋白质也包含不具有功能活性的寡肽和更小的连续氨基酸序列。功能性蛋白质的非限制性实例包括:受体、受体配体、细胞因子、抗体、免疫调节分子、信号分子、荧光蛋白,具有杀虫或杀生物活性的蛋白质,和酶。有用的酶的大类包括,但不仅限于:蛋白酶,纤维素酶,氧化还原酶,脂肪酶,裂合酶,连接酶,半纤维素酶,漆酶,淀粉酶,葡糖淀粉酶,酯酶,脱氢酶,乳糖酶,多聚半乳糖醛酸酶,半乳糖苷酶,木质素酶,氧化酶,过氧化物酶,转移酶,葡萄糖异构酶,腈水解酶,羟化酶,水解酶,聚合酶和解聚酶。除了酶之外,可以由本文公开的合成核酸分子编码蛋白质包括但不仅限于:转录因子,抗体,受体,生长因子(pdgf,egf,fgf,scfhgf,tgf,tnf,胰岛素,igf,lif,制瘤素,csf等中的任何一种),免疫调节剂,肽类激素,细胞因子,整联蛋白,白细胞介素,粘附分子,血栓调节分子,蛋白酶抑制剂,血管增生抑制素,防御素,分化抗原簇(clusterofdifferentiationantigen),干扰素,趋化因子,抗原(包括来自感染性病毒和生物的抗原),癌基因产物,血小板生成素,红细胞生成素,组织纤溶酶原激活剂,和任何其它期望用于临床、诊断或兽医情境的生物活性蛋白质。所有这些蛋白质都已在文献中被良好定义(例如,通过示例性的氨基酸序列),并且在本文中也被如此定义。还包括这类蛋白的缺失突变体,这些蛋白的各个结构域,和从这些蛋白制成的融合蛋白,以及这些蛋白质的混合物。[0148]保守取代:如本文关于多肽使用的,术语″保守取代″是指氨基酸残基被属于相同类型的另一种氨基酸取代。非保守性氨基酸取代是残基不属于相同类型的取代,例如用碱性氨基酸取代中性或非极性氨基酸。可为用于实施保守取代的目的而定义的氨基酸类型是本领域已知的。[0149]在一些实施方案中,保守取代包括用第一种脂肪族氨基酸取代第二种不同的脂肪族氨基酸。例如,如果第一氨基酸是gly;ala;pro;ile;leu;val;和met中之一,则该第一个氨基酸可以被选自gly;ala;pro;ile;leu;val;和met的第二种不同的氨基酸替代。在特定的实施方案中,如果第一氨基酸是gly;ala;pro;ile;leu;和val中之一,则该第一氨基酸可以被选自gly;ala;pro;ile;leu;和val的第二种不同的氨基酸替代。在涉及疏水性脂肪族氨基酸取代的特定实例中,如果第一氨基酸是ala;pro;ile;leu;和val其中之一,则该第一氨基酸可以被选自ala;pro;ile;leu;和val的第二种不同的氨基酸替代。[0150]在一些实施方案中,保守氨基酸取代包括用第一种芳香族氨基酸取代第二种不同的芳香族氨基酸。例如,如果第一氨基酸是his;phe;trp;和tyr其中之一,则该第一氨基酸可以被选自his;phe;trp;和tyr的第二种不同的氨基酸替代。在涉及不带电芳香族氨基酸取代的特定实例中,如果第一氨基酸是phe;trp;和tyr其中之一,则该第一氨基酸可以被选自phe;trp;和tyr的第二种不同的氨基酸替代。[0151]在一些实施方案中,保守氨基酸取代包括用第一种疏水性氨基酸取代第二种不同的疏水性氨基酸。例如,如果第一氨基酸是ala;val;ile;leu;met;phe;tyr;和trp中之一,则该第一氨基酸可以被选自ala;val;ile;leu;met;phe;tyr;和trp的第二种不同的氨基酸替代。在涉及非芳香族疏水性氨基酸取代的特定实例中,如果第一氨基酸是ala;val;ile;leu;和met中之一,则该第一氨基酸可以被选自ala;val;ile;leu;和met的第二种不同的氨基酸替代。[0152]在一些实施方案中,保守氨基酸取代包括用第一种极性氨基酸取代第二种不同的极性氨基酸。例如,如果第一氨基酸是ser;thr;asn;gln;cys;gly;pro;arg;his;lys;asp;和glu中之一,则该第一氨基酸可以被选自ser;thr;asn;gln;cys;gly;pro;arg;his;lys;asp;和glu的第二种不同的氨基酸替代。在涉及非带电极性氨基酸取代的特定实施例中,如果第一氨基酸是ser;thr;asn;gln;cys;gly;和pro中之一,则该第一氨基酸可以被选自ser;thr;asn;gln;cys;gly;和pro的第二种不同的氨基酸替代。在涉及带电极性氨基酸取代的特定实例中,如果第一氨基酸是his;arg;lys;asp;和glu中之一,则该第一氨基酸可以被选自his;arg;lys;asp;和glu的第二种不同的氨基酸替代。在进一步的涉及带电极性氨基酸取代的特定实例中,如果第一氨基酸是arg;lys;asp;和glu中之一,则该第一氨基酸可以被选自arg;lys;asp;和glu的第二种不同的氨基酸替代。在进一步的涉及带正电(碱性)极性氨基酸取代的特定实例中,如果第一氨基酸是his;arg;和lys中之一,则该第一氨基酸可以被选自his;arg;和lys的第二种不同的氨基酸替代。在进一步的涉及带正电极性氨基酸取代的特定实例中,如果第一氨基酸是arg或lys,则该第一氨基酸可以被arg或lys的另一种氨基酸替代。在进一步的涉及带负电(酸性)极性氨基酸取代的特定实例中,如果第一氨基酸是asp或glu,则该第一氨基酸可以被asp或glu的另一种氨基酸替代。[0153]在备选的实施方案中,保守取代包括用第一种电中性氨基酸取代第二种不同的电中性氨基酸。例如,如果第一氨基酸是gly;ser;thr;cys;asn;gln;和tyr其中之一,则该第一氨基酸可以被选自gly;ser;thr;cys;asn;gln;和tyr的第二种不同的氨基酸替代。[0154]在另外的实施方案中,保守取代包括用第一种非极性氨基酸取代第二种不同的非极性氨基酸。例如,如果第一氨基酸是ala;val;leu;ile;phe;trp;pro;和met其中之一,则该第一氨基酸可以被选自ala;val;leu;ile;phe;trp;pro;和met的第二种不同的氨基酸替代。[0155]在许多实例中,可以对在保守取代中用于代替第一氨基酸的特定第二氨基酸进行选择,以便使该第一和第二氨基酸尽可能多地属于相同的前述类型。因此,如果第一氨基酸是ser(极性、非芳香族、电中性氨基酸)时,第二氨基酸可以是另一种极性氨基酸(即,thr;asn;gln;cys;gly;pro;arg;his;lys;asp;或glu);另一种非芳香族氨基酸(即,thr;asn;gln;cys;gly;pro;arg;his;lys;asp;glu;ala;ile;leu;val;或met),或另一种电中性氨基酸(即gly;thr;cys;asn;gln;或tyr)。然而,优选的是,在这种情况下,第二氨基酸是thr;asn;gln;cys;和gly中之一,因为这些氨基酸在极性、非芳香性和电中性这些类别上全部相同。其它可任选用于选择在保守取代中使用的第二种氨基酸的标准是本领域中已知的。例如,当thr;asn;gln;cys;和gly可供选用于保守取代ser时,可以从选择中淘汰cys,以避免形成不良的交联键和/或二硫键。类似地,可以从选择中淘汰gly,因为它缺少烷基侧链。在这种情况下,可以选择thr,以便,例如,保留侧链羟基的功能性。然而,用于在保守取代中使用的特定第二氨基酸的选择最终取决于本领域技术人员的裁量。[0156]植物:如本文所使用的,术语″植物″包括任何后代、细胞、组织、种子、种子油或其部分。[0157]性状或表型:术语″性状″和″表型″在本文中可互换使用。出于本公开的目的,感兴趣的特定性状包括农艺学上重要的性状,可以例如在作物植物中表达(例如,杀虫蛋白的表达)。[0158]iv.编码感兴趣多肽的合成多核苷酸[0159]本公开提供了用于设计编码感兴趣多肽的合成多核苷酸(以便例如增加该感兴趣多肽在异源宿主细胞或生物体内的表达)的方法。在本文的一些实施方案中,编码感兴趣多肽的合成多核苷酸被工程化,其中该合成多核苷酸来自含有至少一个多聚腺苷酸化序列(例如,至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa)的参考基因。例如,该合成多核苷酸可以包括至少一个来自参考基因的多聚腺苷酸化序列,多聚腺苷酸化序列的量以及在编码序列中的位置与参考基因相同。[0160]本文的实施方案提供了已根据前文被工程化的编码感兴趣多肽的合成多核苷酸。这些合成多核苷酸可能特别适用于在转基因植物细胞、或包含这些植物细胞的转基因植物组织或植物中表达感兴趣的多肽。[0161]出于本领域技术人员已知的各种原因,例如为了增加表达、使核酸序列适合于在新的宿主细胞或生物体中表达、或者在编码的多肽中引入功能性和/或非功能性突变,可利用本文特定实施方案的方法对合成核酸序列进行工程化。通常,在感兴趣多肽是天然存在的基因产物,或者是天然存在的基因产物的一部分(例如,分离的蛋白结构域)的实施方案中,可以通过,例如,搜索基因组数据库或从源基因组克隆而获得编码该多肽的天然存在的参考多核苷酸。在许多情况下,也可能在其它生物体的基因组中发现这些天然存在的参考多核苷酸的同源物或直系同源物。在实施方案中,可以根据编码感兴趣的任何多肽的参考dalgarno序列);修改多核苷酸以对应宿主细胞的密码子使用;和删除使转录本失稳的序列。[0167]可能会影响合成期间感兴趣编码多肽的翻译延长速度的因素包括,例如,负载trna的水平(elfetal.(2003)science300:1718-22),其取决于trna浓度、trna负载速率、和氨基酸可得性。例如,由稀有(非优选)密码子(根据宿主生物的密码子使用偏好)诱导的翻译暂停可能会降低异源蛋白质表达的速度。稀有密码子诱导的翻译暂停包括,感兴趣多核苷酸中存在的密码子在在宿主生物体中极少使用,并可能由于其在可用的trna池中的稀缺性而对蛋白质翻译产生负面影响。这些因素还包括核糖体trna的选择速度(解码速度),其取决于:密码子-反密码子相互作用的强度;在先密码子(precedingcodon)(p位点密码子);在先密码子的摆动碱基;和被读密码子的摆动碱基。可能会影响核糖体保真度的因素包括那些会影响核糖体框架迁移的因素,例如同聚物段,g/c岛,a/t岛,和暂停位点附近的同聚物延伸段。而且,一些多肽可能被阻滞在核糖体出口通道中,这部分地取决于多肽最初10-20个氨基酸的序列。鉴于上述情况,一种提高宿主生物体中最佳翻译的方法包括实施密码子优化,这可以导致合成多核苷酸中稀有宿主密码子被修改。[0168]因此,除了除去不好的多聚腺苷酸化信号序列和shaw-kamen序列之外,可以对本文的合成多核苷酸进行工程化,使其密码子的利用频率大体上与该合成多核苷酸将要表达的植物物种中自然存在的基因中的平均频率相同。在一些实施方案中,合成多核苷酸工程化处理包括对密码子序列进行优化,用优选密码子代替序列中的稀有密码子,并保留编码序列中的某些多聚腺苷酸化序列。[0169]表1提供了在预期用于玉米和大豆的合成基因的示例性目标密码子使用百分比。这些百分比可以在,例如,没有更具体的密码子使用数据时使用,以及在双子叶植物中或者在植物中一般地使用。[0170]表1.合成植物基因的示例性目标重调(rescaled)密码子组成[0171][0172][0173]在一些实施方案中,公开的方法涉及对多核苷酸的核苷酸序列进行优化,但不会使所编码的多肽的一级结构发生改变。被编码多肽的结构在最大程度上是由多肽的氨基酸序列确定的。因此,被编码多肽的期望结构对其多核苷酸编码序列会施加限制,这些限制是由遗传编码的简并性和标准密码子使用决定的。在本发明的一些实施方案中,合成多核苷酸通过计算机模拟(insilico)工程化,使该多核苷酸包括从密码子空间中选出的特定密码子优化序列,该序列编码感兴趣多肽的全部或部分,其中合成多核苷酸保留了天然多核苷酸中的某些多聚腺苷酸化序列的数目和位置。与仅仅通过例如参考表达宿主生物体的密码子使用偏好而进行密码子优化的多核苷酸相比,纳入选定的特定多核苷酸序列可以避免某些与编码多肽的异源核苷酸序列相关的问题,并可以获得一种或多种期望的性质(例如,提高表达)。[0174]有许多方法可供本领域技术人员用于根据预定的参数对核酸分子的编码序列(例如,编码感兴趣多肽的多核苷酸)进行优化。例如,本领域技术人员可以通过目视检验对编码序列进行优化,以便例如更好地符合表达宿主生物体的密码子使用偏好。更常见地,可以使用计算机实现的软件程序对编码序列进行优化。这样的软件程序可以包括一种或多种算法,对选自下组的因素进行优化:可能影响感兴趣编码多肽表达的因素;可能影响转录本翻译起始速度的因素;和可能影响编码多肽或其前体的翻译延伸速度的因素。因此,在一些实施方案中,可以将参考多核苷酸导入到能够根据预定的参数对编码序列进行优化的计算机实现的软件程序中。这些软件程序的特定实例包括,但不仅限于:optgenetm(ocimumbiosolutions),accelrysgcgtm(accelrys公司软件),optimizertm(可以在万维网genomes.urv.es/optimizer公众访问),和optimumgenetm(genscript)。[0175]在一些实施方案中,感兴趣多肽的氨基酸序列可以直接用于获得密码子优化的多核苷酸序列。在特定的实施方案中,感兴趣多肽的氨基酸序列(例如,直接提供的)可用于推断编码氨基酸序列的密码子优化多核苷酸(例如,在计算机模拟逆向翻译),例如,通过使用能够根据预定参数优化编码序列的计算机实现软件程序。在具体的实例中,密码子优化的多核苷酸可以使用标准遗传密码和用于表达宿主生物体的适当的密码子使用偏好表(codonusagebiastable)推导出来。在一些实施方案中,推导出多个密码子优化的多核苷酸来编码每一种感兴趣的多核苷酸可能是理想的。因此,在特定的实例中,感兴趣的多肽可被用于推导一组1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,或更多个编码感兴趣多肽的密码子优化的核酸序列。在一些实施方案中,推导的编码感兴趣多肽的密码子优化多核苷酸可以由计算机实现的软件程序导出为文本文件,或者以其他方式记录供从业者使用。例如,计算机实现的软件程序可以编码单个感兴趣多肽的一整套推导密码子优化多核苷酸导出为相应数目的文本文件。[0176]在其它实施方案中,可以根据序列同源性对编码感兴趣多肽的多个密码子优化多核苷酸进行比对。在特定的实例中,将对应于感兴趣多肽的全部多聚腺苷酸化序列的一个或多个推导密码子优化多核苷酸与编码该感兴趣多肽的天然多核苷酸进行比对。在特定的实例中,推导的密码子优化核酸序列与蛋白编码区区段相对应,并可以在不允许有″缺口″的条件下进行比对。[0177]根据前文,本文的方法可用于提供单个编码感兴趣多肽的密码子优化的多核苷酸。在特定的实例中,可使用某种方法来提供一组单一的密码子优化的多核苷酸,其中每一个多核苷酸编码所述感兴趣的多肽。[0178]在一些实施方案中,选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,可以以这样的方式整合到编码整个感兴趣多肽的优化多核苷酸中,使得选定的多聚腺苷酸化序列整合在该特定多聚腺苷酸化序列在编码该感兴趣多肽的天然核酸序列中的天然位置,同时保持该感兴趣多肽的正确阅读框。例如,选自下组的天然多聚腺苷酸化序列集合的全部成员均可以整合到编码整个感兴趣多肽的优化多核苷酸中,使得该集合的所有成员均被整合在特定多聚腺苷酸化序列在整个多核苷酸内的天然位置处。因此,本文的一些实施方案可用于产生编码感兴趣多肽的合成多核苷酸,其中天然多核苷酸的每个多聚腺苷酸化序列都存在于经过比对的合成优化多核苷酸的相同位置。[0179]核酸的优化可以包括,例如,用于提高宿主产生异源蛋白质的能力的步骤,以及用于帮助研究人员高效地设计表达构建体的步骤。在核酸优化过程中可以考虑的因素可以包括,但不仅限于:可能影响感兴趣编码多肽的表达的因素;可能影响转录本翻译起始的因素;和可能影响编码多肽或其前体的翻译延长速度的因素。这些因素中哪些在设计密码子优化序列集合时要选择加以考虑取决于技术人员的裁量。[0180]可能影响由多核苷酸编码的感兴趣多肽的表达的因素,可能受到被选择用于编码多肽氨基酸的特定密码子的影响。影响从模板核酸序列产生mrna的速度的因素可能包括:用于转录的rna聚合酶的类型;rna聚合酶在表达系统中的存在水平;和所用的转录启动子序列。mrna水平还可能受到mrna降解速度的影响,后者进一步受到mrna失稳基序、rna酶识别序列和polya添加信号的影响。影响mrna水平的还可能有:mrna在翻译起始位点、在核糖体结合位点、在起始密码子、和/或在编码序列最初大约10-50个密码子(或者在开放阅读框内部或之后的某处)的结构;开放阅读框之前或之内存在的转录终止基序;以及被转录序列内的信号,例如那些指导、改变或修饰mrna剪接和/或细胞核导出的信号。影响从模板序列产生mrna的速度的因素的一个具体实例是核苷酸重复所诱导的聚合酶滑移。核苷酸重复所诱导的聚合酶滑移涉及的核苷酸序列重复已经显示会导致dna聚合酶滑移或者断续移动(stuttering),从而可能导致移码突变。这样的核苷酸重复还会导致rna聚合酶滑移。例如,在具有高g+c含量偏好的生物体中,可能有更高程度的g或c核苷酸重复。因此,减少诱发rna聚合酶滑移的可能性的一种方法包括改变g或c核苷酸的长重复。[0181]可能影响特定转录本翻译起始速度的因素的具体实例包括替代翻译起始(alternatetranslationalinitiation)和干扰性的mrna二级结构。若合成多核苷酸序列意外地含有一个或多个能够发挥核糖体结合位点(rbs)功能的基序,就可能发生替代翻译起始。这些位点能够导致从基因内部的位点起始翻译截短的蛋白质。减少产生截短蛋白质(其在纯化过程中可能难以除去)的可能性的一个方法包括修改优化的多核苷酸中假定的内部rbs序列。干扰性二级结构可能会隔离rbs序列或起始密码子,人们已经将干扰性二级结构与蛋白质表达降低关联起来。茎环结构也能够导致转录暂停和减弱。因此,优化的多核苷酸在rbs和基因编码区中可能含有最少的二级结构,以便为提高转录和翻译提供条件。[0182]另一类可能影响异源蛋白表达的多核苷酸序列元件包括限制位点。因此,本文的多核苷酸的优化可以包括对限制位点进行修饰,所述限制位点可能,例如,干扰后续将转录单元亚克隆到宿主表达载体内。[0183]可以优化多核苷酸序列的全部或一部分。在一些实例中,期望的表达调制可以通过优化基本上整个基因,同时保留天然基因中的某些多聚腺苷酸化序列来实现。在其它实例中,期望的调制可以通过优化基因的一部分,而非全部,而实现。这种优化的起点可以是这样的编码序列,其仅由遵从表达宿主密码子使用偏好的常用或优选密码子组成,或者这样的编码序列,其含有常用和非常用密码子的混合。优化多核苷酸可能对基因表达和蛋白质产生具有负面或正面的影响。例如,用更常用的密码子代替稀有或非优选密码子可能影响从包含该替换密码子的序列转录出来的mrna分子的半衰期,或者通过导入二级结构而改变其结构,而影响其翻译。因此,在某些情况下,必须进一步对优化的多核苷酸进行改变。[0184]在一些实施方案中,包含编码感兴趣的多肽、同时保留天然基因的某些多聚腺苷酸化序列的密码子优化序列的合成多核苷酸可以包含超过一个优化序列。例如,这样的多核苷酸可以编码下述的融合多肽:其包括多个如本文所述的多肽,或者包括至少一个如本文所述的多肽和无关序列。融合多肽可以用标准技术,包括化学缀合来加以制备,以便允许翻译成保留两个组分多肽的至少一种生物活性的单一的融合多肽。可利用肽接头(1inker)序列将融合多肽的多肽组分分隔一定的距离,其足以确保每个多肽折叠成适当的二级和三级结构。这样的肽接头序列可以用本领域众所周知的标准技术整合到融合多肽中。[0185]在许多实施方案中,包含编码感兴趣多肽的多核苷酸的核酸分子的非编码区也可以加以优化。例如,可能期望在合成多核苷酸的上游、下游或内部(例如内含子)包含某些非编码序列。因此,在一些实施方案中,本文的方法可以考虑在包括合成多核苷酸的核酸分子中所含的任何非编码序列的序列。[0186]包含编码感兴趣多肽的合成多核苷酸的核酸可以被表达用于各种应用,例如产生重组多肽;开发新的表达系统;与其它核酸序列比较表达性质;和用于诊断应用。[0187]v.多样化的、密码子优化的核酸序列的表达[0188]本文的一些实施方案提供了通过包括将编码感兴趣多肽的合成多核苷酸引入到植物细胞中而在该细胞中表达该感兴趣的多肽的过程,在植物细胞、植物组织、植物材料和/或整个植物内获得期望的表型或性状的方法。在特定的实施方案中,感兴趣的多肽是在细胞内通常不会出现的异源多肽。[0189]在特定的实施方案中,可以用包含编码感兴趣多肽的合成多核苷酸的核酸构建体(例如载体)转化表达宿主,其中该构建体可整合到表达宿主的基因组中。构建体可以包含至少一个转录和翻译起始和终止区,并且该合成多核苷酸可以位于起始区和终止区之间并且受其调节控制。构建体可以进一步包括选择标志物和/或其它功能序列,例如但不仅限于,用于整合到宿主基因组内的同源序列;与pcr引物杂交的序列;和限制位点。[0190]在一些实施方案中,表达宿主可以是植物细胞,例如,植物组织培养物或完整植物中的植物细胞。本发明的实施方案可以包括来自任何组织或者任何部位一包括但不仅限于胚,分生组织细胞,愈伤组织,花粉,叶,花药,根,根尖,花,种子,荚果,茎和组织培养一的植物细胞。合成多核苷酸可以通过本领域技术人员已知的任何方法整合到合适的载体中并引入到植物细胞中。例如,核酸分子可以通过包括但不仅限于下列的方法引入到植物细胞中:用病毒载体转染,用质粒载体转化,电穿孔(frommetal.(1986)nature319:791-3),脂质转染(felgneretal.(1987)proc.natl.acad.sci.usa84:7413-7),显微注射(muelleretal.(1978)cell15:579-85),土壤杆菌介导的转移(fraleyetal.(1983)proc.natl.acad.sci.usa80:4803-7),直接dna摄取,和微粒轰击(kleinetal.(1987)nature327:70)。[0191]在其它实施方案中,可以把包含合成多核苷酸的载体引入到植物细胞的特定部分内(例如,通过纳米颗粒轰击)。可以引入核酸分子的植物细胞的特定部分的实例包括,但不仅限于;胞质溶胶,细胞核,液泡膜,质体,黄化质体,有色体,白色体,造油体,蛋白质体,造粉体,叶绿体,以及双层膜的内腔。[0192]细胞转化(包括植物细胞转化)可能涉及在特定细胞中具有功能的表达载体的构建。此类载体可以包括这样的dna:其包括在调节元件(例如启动子)控制下或与之可操作连接的基因。表达载体可以含有一个或多个此类可操作连接的基因/调节元件的组合。载体可以处于脂质体的形式,并且能够单独使用或者与其它质粒组合使用,通过本文所述的转化方法将转基因掺入植物细胞的遗传材料中,从而提供转化细胞。[0193]植物细胞表达载体可以包括至少一个与调节元件(例如,启动子)可操作连接的遗传标志物,该标志物使得含有该标志物的转化细胞可以通过负选择(即,抑制不含选择标志物基因的细胞的生长)或者正选择(即,筛选由该遗传标志物编码的产物)得以回收。许多适合于植物转化的选择标志物基因是转化领域中众所周知的,包括例如:编码可将选择性化学试剂(其可以是抗生素或除草剂)代谢性脱毒的酶的基因,或者编码对抑制剂不敏感的变异靶物的基因。有若干正选择方法也是本领域已知的。在一些实施方案中,适用于植物转化的选择标志物基因可包括:在植物调节信号控制下的新霉素磷酸转移酶ii(nptii)基因,其赋予对卡那霉素的抗性(参见,例如,fraleyetal.(1983)proc.natl.acad.sci.u.s.a.80:4803);潮霉素磷酸转移酶基因,其赋予对抗生素潮霉素的抗性(参见,例如,vandenelzenetal.(1985)plantmol.biol.,5:299);细菌来源的赋予对抗生素的抗性的标志物基因,包括庆大霉素乙酰转移酶、链霉素磷酸转移酶、氨基糖苷-3′‑腺苷酸转移酶,和博来霉素抗性决定簇(参见hayfordetal.(1988)plantphysiol.86:1216;jonesetal.(1987)mol.gen.genet.210:86;svabetal.(1990)plantmol.biol.14:197;和hilleetal.(1986)plantmol.biol.7:171);赋予对除草剂诸如草甘膦、草铵膦或溴苯腈的抗性的标志物基因(参见comaietal.(1985)nature317:741-744;gordon-kammetal.(1990)plantcell2:603-618;andstalkeretal.(1988)science242:419-423);和非细菌来源的标志物基因,包括例如,小鼠二氢叶酸还原酶,植物-5-烯醇式丙酮酰莽草酸-3-磷酸合酶,和植物乙酰乳酸合酶(参见eichholtzetal.(1987)somaticcellmol.genet.13:67;shahetal.(1986)science233:478;andcharestetal.(1990)plantcellrep.8:643)。[0194]另一类适用于植物转化的标志物基因需要筛选推定的转化植物细胞,而不是对转化细胞直接遗传选择对毒性底物例如抗生素的抗性。这些基因可以特别有用于在特定组织中定量或可视化基因的空间表达模式,它们经常被称为报告基因,因为它们可以和基因或基因调节序列融合,用于研究基因表达。供筛选转化细胞的常用基因包括β-葡糖醛酸酶(gus),β-半乳糖苷酶,萤光素酶和氯霉素乙酰转移酶。参见jefferson(1987)plantmol.biol.rep.5:387;teerietal.(1989)emboj.8:343;konczetal.(1987)proc.natl.acad.sci.u.s.a.84:131;和deblocketal.(1984)emboj.3:1681。有多种方法可供用于在体内可视化gus活性,而不需要破坏植物组织。molecularprobespublication2908(1993)imagenegreentm,1-4页;和nalewayetal.(1991)j.cellbiol.115:151。编码荧光蛋白的基因(例如gfp,egfp,ebfp,ecfp,和yfp)也已被用作原核生物和真核生物细胞中基因表达的标志物。参见chalfieetal.(1994)science263:802。因此,荧光蛋白和突变的荧光蛋白也可以用作筛选标志物。[0195]植物表达载体中包含的合成多核苷酸的表达可以被包含调节元件(例如启动子)的核苷酸序列所驱动。在转化
技术领域
:中,现在公知有多种类型的用于植物细胞的启动子,以及其它可以单独使用或者与这类启动子组合使用的调节元件。[0196]术语″启动子″是指一段dna区域,其可以位于转录起点的上游,并且可以参与rna聚合酶和其它蛋白质的识别和结合,以触发转录。″植物启动子″可以是能够在植物细胞内引发转录的启动子。处于发育控制下的启动子的实例包括优先在某些组织中引发转录的启动子,例如叶,根,种子,纤维,木质部导管,管胞或厚壁组织。这类启动子被称作″组织优选的″。仅在某些组织中引发转录的启动子被称作″组织特异的″。″细胞类型特异的″启动子主要在一个或多个器官的某些细胞类型中驱动表达,例如在根和叶的维管细胞中。″诱导型″启动子可以是处于环境控制下的启动子。可以通过诱导型启动子引发转录的环境条件包括,但不仅限于,缺氧条件和光的存在。组织特异性、组织优选型、细胞类型特异性和诱导型启动子构成了一类″非组成型″启动子。″组成型″启动子是在生物体的大多数细胞中在大多数环境条件下均激活的启动子。[0197]诱导型启动子可以和本发明的用于在细胞内表达的优化核苷酸序列可操作连接。任选地,诱导型启动子可以和编码信号序列的核苷酸序列可操作连接,后者可以和本发明的用于在细胞内表达的核苷酸序列可操作连接。与诱导型启动子可操作连接的核苷酸序列的转录速度会响应诱导剂而增加。在本发明中可以使用任何诱导型启动子。参见wardetal.(1993)plantmol.biol.22:361-366。示例性诱导型启动子包括,但不仅限于:来自acei系统的启动子,其响应铜(mettetal.(1993)proc.natl.acad.sci.u.s.a.90:4567-71);来自玉米的in2基因,其响应苯磺酰胺除草剂安全剂(hersheyetal.(1991)mol.gengenetics227:229-37;和gatzetal.(1994)mol.gen.genetics243:32-8);和来自tn10的tet阻遏物(gatzetal.(1991)mol.gen.genetics227:229-37)。特别有用的诱导型启动子可以是响应植物通常不响应的诱导剂的启动子。示例性诱导型启动子可以是来自类固醇激素基因的诱导型启动子,其转录活性可以被糖皮质激素诱导(schenaetal.(1991)proc.natl.acad.sci.usa88:10421-5)。[0198]作为备选,组成型启动子可以和用于在细胞内表达的合成多核苷酸可操作连接,或者,组成型启动子可以和编码信号序列的核苷酸序列可操作连接,后者可以和用于在细胞内表达的合成多核苷酸可操作连接。在本发明中可以使用不同的组成型启动子。示例性组成型启动子包括,但不仅限于:来自植物病毒的启动子,例如来自camv的35s启动子(odelletal.(1985)nature313:810-2);来自水稻肌动蛋白基因的启动子(mcelroyetal.(1990)plantcell2:163-71);泛素启动子(christensenetal.(1989)plantmol.biol.12:619-32;和christensenetal.(1992)plantmol.biol.18:675-89);pemu(lastetal.(1991)theor.appl.genet.81:581-8);mas(veltenetal.(1984)emboj.3:2723-30);玉米h3组蛋白启动子(lepetitetal.(1992)mol.gen.genetics231:276-85;和atanassovaetal.(1992)plantjournal2(3):291-300)。als启动子,甘蓝型油菜als3结构基因5′侧的xbal/ncoi片段(或者与所述xba1/ncoi片段相似的核苷酸序列)是特别有用的组成型启动子。参见pct国际专利公开no.wo96/30530。[0199]组织特异性启动子可以和用于在细胞内表达的合成多核苷酸可操作连接。任选地,组织特异性启动子可以和编码信号序列的核苷酸序列可操作连接,其可以和用于在细胞内表达的合成多核苷酸可操作连接。用组织特异性启动子可操作连接的合成多核苷酸转化的植物可以排他性地或者优先地在特定的组织中产生合成多核苷酸的蛋白产物。在特定的实施方案中可以使用任何组织特异性或组织优选的启动子。示例性组织特异性或组织优选的启动子包括,但不仅限于:根优选的启动子,例如来自菜豆蛋白基因的启动子(muraietal.(1983)science23:476-82;和sengupta-gopalanetal.(1985)proc.natl.acad.sci.u.s.a.82:3320-4);叶特异性且光诱导的启动子,例如来自cab或rubisco的启动子(simpsonetal.(1985)emboj.4(11):2723-9;和timkoetal.(1985)nature318:579-82);花药特异性启动子,例如来自lat52的启动子(twelletal.(1989)mol.gen.genetics217:240-5);花粉特异性启动子,例如来自zm13的启动子(guerreroetal.(1993)mol.gen.genetics244:161-168);和孢子优选的启动子,例如来自apg的启动子(twelletal.(1993)sex.plantreprod.6:217-224)。[0200]将合成多核苷酸表达的多肽转运到亚细胞区室,例如叶绿体、液泡、过氧化物酶体、乙醛酸循环体、细胞壁,或线粒体,或者分泌到质外体,可以通过将编码信号序列的核苷酸序列可操作连接到编码该多肽的合成多核苷酸的5’和/或3’区而实现。在蛋白质合成和加工期间,结构基因5′和/或3′端的靶向序列可以确定编码蛋白会最终被区室化到何处。或者,可以将亚细胞区室靶向蛋白直接连接到纳米颗粒上,将涂覆有感兴趣分子的纳米颗粒导向到期望的亚细胞区室。许多信号序列是本领域已知的。参见,例如,beckeretal.(1992)plantmol.biol.20:49;close,p.s.(1993)master′sthesis,iowastateuniversity;knoxetal.(1987)plantmol.biol.9:3-17;lerneretal.(1989)plantphysiol.91:124-129;fontesetal.(1991)plantcell3:483-496;matsuokaetal.(1991)proc.natl.acad.sci.u.s.a.88:834;gouldetal.(1989)j.cell.biol.108:1657;creissenetal.(1991)plantj.2:129;kalderonetal.(1984)cell39:499-509;和steifeletal.(1990)plantcell2:785-793。[0201]在表达宿主是多细胞生物体(例如植物)的实施方案中,可以将载体或dna构建体引入到多细胞生物体的一个或多个细胞中,并在其中表达。在一些实例中,可以从包含被引入的载体或dna构建体的多细胞生物体的一个或多个细胞产生整个生物体。例如,从用感兴趣的核酸分子转化的植物细胞再生整个植物,随后选择将核酸分子整合到其基因组内的植物的方法,是本领域中已知的。[0202]在一些实施方案中,应当理解,除了多细胞生物体之外,用于本文实施方案的表达宿主可以是单细胞原核生物或真核生物。有多种表达系统可用于从本发明的优化核酸序列表达多肽。表达宿主可以,例如,从下组中选出:细菌;藻类;真菌(例如,酵母);昆虫细胞;动物细胞;杆状病毒;和哺乳动物组织培养物。[0203]在特定的实施方案中,表达系统可以是,例如但不仅限于:细菌表达系统,例如大肠杆菌、沙门氏菌属某些种、芽孢杆菌属菌种、链霉菌属菌种、假单胞菌属菌种(例如,荧光假单胞菌)、富养罗尔斯通氏菌,衣藻属;酵母表达系统,包括酵母属,毕赤酵母属,克雷伯氏菌属和假丝酵母属,酿酒酵母,巴斯德毕赤酵母,甲醇毕赤酵母,和乳酸克鲁维酵母;真菌表达系统,包括隐孢子虫属和木霉属菌种;丝状真菌蛋白质生产体系;原生动物表达系统,包括恶性疟原虫和利什曼原虫;模式生物,包括秀丽隐杆线虫,黑腹果蝇和非洲爪蟾;植物细胞(包括,例如,大豆,矮菜豆,玉米,棉花,烟草和拟南芥);组织培养物表达系统,包括cos细胞,中华仓鼠卵巢细胞,和成纤维细胞如3t3细胞;被腺病毒感染的细胞系;昆虫细胞系,例如用于培植杆状病毒的来自夜蛾属的昆虫细胞系;用于疾病研究和dna疫苗功效测试的模式生物,例如猕猴,小鼠,大鼠,豚鼠,绵羊,山羊和兔;从活细胞提取物制备的体外表达系统,例如大肠杆菌提取物,小麦胚芽提取物,兔网织红细胞裂解物;和通过组装纯化的单独组分而制备的体外表达系统。[0204]用于在经过遗传修饰的生物体(包括例如但不仅限于植物)中进行基因表达的方法是本领域已知的。一些实施方案包括重组载体(例如,质粒),其包含一个或多个编码感兴趣异源多肽的异源多核苷酸。重组载体是工程化的(例如,人工制作的)核酸分子,用作操纵选定的核酸和/或将这样的核酸导入宿主细胞的工具。因此,重组载体适用于克隆、测序、和/或以其他方式操纵其中的多核苷酸,例如通过表达和/或递送多核苷酸到宿主细胞内以形成重组细胞。载体可以包含这样的多核苷酸,它们在自然中不与要克隆或递送的多核苷酸毗邻。载体还可以包含这样的调控核酸序列(例如,启动子,非翻译区),它们天然出现在该多核苷酸毗邻或者对多核苷酸的表达有用。整合的多核苷酸可以在染色体启动子的控制之下,在天然启动子或质粒启动子的控制之下,或者在多个启动子的组合控制之下。载体可以是rna或dna,并且可以是原核或真核的。载体可以被保持为染色体外元件(例如质粒),或者它可以整合到重组生物体(例如,微生物,酵母和植物细胞)的染色体中。完整载体可以保持定位在宿主细胞中,或在某些条件下,外源dna(例如,不必要的质粒序列)可以被删除,留下一个或多个编码感兴趣异源多肽的异源多核苷酸。异源多核苷酸的单个或多个拷贝可以整合到宿主基因组中。本发明的重组载体可以包含至少一个选择标志物。[0205]在一些实施方案中,包含一个或多个编码感兴趣的异源多肽的异源多核苷酸的重组载体是表达载体,例如,植物表达载体。在这样的实施方案中,至少一个编码要生产的产物的多核苷酸可以按照一定方式插入在重组载体中,使得该多核苷酸与载体内的调节序列可操作连接,从而让该核酸序列能够在重组宿主细胞内转录和翻译。可用于转化各种宿主生物体和细胞的载体是本领域中已知的。典型地,载体含有选择标志物,和允许在期望的宿主中自主复制或染色体整合的序列。[0206]用于转化宿主细胞的合适方法包括任何可以将dna引入到细胞内的方法,例如通过原生质体转化(参见例如美国专利5,508,184),通过干燥/抑制介导的dna摄取(参见例如potrykusetal.(1985)mol.gen.genet.199:183-8),通过电穿孔(参见例如美国专利5,384,253),通过用碳化硅纤维搅拌(参见例如美国专利5,302,523和5,464,765),通过土壤杆菌介导的转化(参见例如美国专利5,563,055;5,591,616;5693512;5824877;5,981,840;和6,384,301),和通过加速dna包被的颗粒(参见例如美国专利5,015,580;5,550,318;5,538,880;6,160,208;6,399,861;和6,403,865)。通过应用这些技术,几乎任何种类的细胞均可以被稳定地转化,包括单子叶植物和双子叶植物。在一些实施方案中,转化dna被整合到宿主细胞的基因组中。在多细胞物种的情况下,转基因细胞可以再生为转基因生物。任何这些技术均可以用于产生转基因单子叶植物或双子叶植物,例如,在转基因植物的基因组中包含一个或多个编码感兴趣异源多肽的异源多核苷酸。[0207]最广泛采用的将表达载体引入到植物内的方法是基于土壤杆菌的自然转化系统。根癌土壤杆菌和发根土壤杆菌是可以遗传转化植物细胞的植物致病性土壤细菌。根癌土壤杆菌的ti质粒和发根土壤杆菌的ri质粒分别携带负责植物遗传转化的基因。ti(肿瘤诱导性)质粒含有一个大区段,称作t-dna,t-dna被转移到转化植物。ti质粒的另一个区段,vir区,负责t-dna转移。t-dna区以末端重复为边界。在经过修饰的二元载体中,肿瘤诱导性基因已被删除,利用vir区的功能来转移被t-dna边界序列包围的外来dna。t区还可以包含用于高效回收转基因植物和细胞的选择标志物,和用于插入转移序列例如dsrna编码核酸的多克隆位点。[0208]因此,在特定的实施方案中,植物转化载体源自根癌土壤杆菌的ti质粒(参见例如美国专利no.4,536,475,4,693,977,4,886,937,和5,501,967;和欧洲专利ep0122791)或发根土壤杆菌的ri质粒。额外的植物转化载体包括,例如但不仅限于,在下列文献中描述的那些:herrera-estrellaetal.(1983)nature303:209-13;bevanetal.(1983)nature304:184-7;kleeetal.(1985)bio/technol.3:637-42;和欧洲专利ep0120516,以及来自任何前述文献的那些。其它天然与植物相互作用的细菌,例如费氏中华根瘤菌、根瘤菌和慢生根瘤菌,可以被修饰,以介导基因转移至多种不同的植物中。这些植物相关的共生细菌可以通过获得去甲的ti质粒和合适的二元载体而获得基因转移的能力。[0209]在向受体细胞提供了外源dna之后,一般鉴定转化细胞,用于进一步的培养和植物再生。为了提高鉴定转化细胞的能力,可以与用于产生转化子的转化载体一起使用如前文所述的可选择或可筛选的标志物基因。在使用可选择标志物的情况下,通过将细胞暴露于选择性试剂或多种试剂,从可能的转化细胞群体中鉴定出转化细胞。在使用可筛选标志物的情况下,可以根据期望的标志物基因性状对细胞进行筛选。[0210]对于在暴露于选择剂时存活的细胞,或者在筛选测定中得分为阳性的细胞,可以在支持植物再生的培养基中进行培养。在一些实施方案中,任何合适地植物组织培养基(例如ms和n6培养基)均可以通过加入其他物质,例如生长调节剂,来加以修改。可以将组织保持在具有生长调节剂的基础培养基中,直到获得足够的组织用于开始植物再生工作,或者进行重复轮次的人工选择,直到组织的形态适合于再生(例如,至少2厨),然后转移到有助于芽形成的培养基中。周期性地转移培养物,直到有足够的芽形成。一旦形成了芽,便将它们转移到有助于根形成的培养基中。一旦形成了足够的根,便将植物转移到土壤中用于进一步的生长和成熟。[0211]为了确认再生植物中感兴趣核酸分子(例如,编码感兴趣异源多肽的异源多核苷酸)的存在,可以进行多种测定。这些测定包括,例如:分子生物学测定,例如southern和northern印迹、pcr和核酸测序;生物化学测定,例如检测蛋白产物的存在,例如通过免疫学手段(elisa和/或western印迹),或者通过酶功能;植物部分测定,例如叶或根测定;和整个再生植物的表型分析。[0212]整合事件可以通过例如pcr扩增进行分析,pcr扩增使用例如特异针对感兴趣核酸分子的寡核苷酸引物。pcr基因分型可以理解包括,但不仅限于,聚合酶链式反应(pcr)扩增来自预测含有整合到基因组内的感兴趣核酸分子的分离宿主植物愈伤组织的基因组dna,随后进行标准克隆和pcr扩增产物的序列分析。pcr基因分型的方法已经多有描述(例如,rios,g.etal.(2002)plantj.32:243-53),并可应用于来自任何植物物种(例如玉米或大豆)或组织类型(包括细胞培养物)的基因组dna。[0213]使用土壤杆菌依赖的转化方法形成的转基因植物通常含有被插入到一个染色体内的单个重组多核苷酸。该单个重组多核苷酸被称作″转基因事件″或″整合事件″。这样的转基因植物就插入的外源序列而言是杂合的。在一些实施方案中,可以通过使含有单个外源基因序列的独立分离的转基因植物,例如t0植物,与自身有性交配(自交)而获得就转基因而言为纯合的转基因植物,以产生t1种子。所产生的t1种子有1/4就转基因而言将是纯合的。对萌发t1种子产生的植物可测试其杂合性,这通常使用能够区分杂合子和纯合子snp测定或热扩增测定(即,接合性测定)来实现。[0214]除了用重组核酸分子直接转化植物之外,还可以通过将具有至少一个转基因事件的第一植物与缺少这一事件的第二植物杂交而制备转基因植物。例如,可以将包含一个或多个编码感兴趣异源多肽的异源多核苷酸的重组核酸分子引入到适于转化的第一植物系中而产生转基因植物,可以将该转基因植物与第二植物系杂交,以将所述多核苷酸渗入到第二植物系中。[0215]前述对重组宿主的遗传操作可以使用标准的遗传技术和筛选来实现,并能够在任何适合遗传操作的宿主细胞中进行。在一些实施方案中,重组宿主是高等植物,包括双子叶植物和单子叶植物,以及可消费的植物,包括作物植物和植物。因此,任何植物物种或植物细胞均可被选择。[0216]本文的特定实施方案提供了用于在细胞的细胞质和/或周质中产生感兴趣的异源多肽的方法。一些实施方案使用经过优化以便在宿主生物体(例如,细菌宿主生物体)中进行异源表达的合成多核苷酸。在特定的实施方案中,这样的优化的合成多核苷酸可以连接到表达载体中,并且可将包含该优化多核苷酸的表达载体引入到表达宿主细胞中(例如,通过转化),在那里多肽从优化的合成核酸序列中表达。[0217]包含编码感兴趣多肽的合成多核苷酸的核酸分子可以通过本领域技术人员已知的方法产生。例如,在一些实施方案中,可以可靠地合成期望核酸序列的相对短的区段,随后将它们串联。随着dna合成领域的进步,不但能够可靠地合成相对较短的多核苷酸,也能够可靠地合成较长的多核苷酸。合成技术能够以合理的准确度合成300个碱基或更多的寡核苷酸。因此,在其它实施方案中,可以合成更长的多核苷酸,从而无需串联。然而,藉由合成化学产生的寡核苷酸的长度通常为20-100bp。在一些实施方案中,可以使用pcr,以退火并延伸合成的有义寡核苷酸和反义寡核苷酸(例如,长度90-110bp)的分步方式来制备合成基因或基因片段,所述有义寡核苷酸和反义寡核苷酸是交替且重叠的,并被设计为编码最终的期望序列。[0218]产生寡核苷酸可以包括按照,例如,固相合成的磷酰胺(phosporamidite)方案实施来寡合成(oligo-synthesis)。简而言之,可以将5’‑oh功能基团被dmt基团保护的第一核苷酸和作为固相的聚苯乙烯珠子偶联。接着,可以通过酸处理除去dmt基团,产生游离的5’‑oh基。然后,可以添加选定的磷酰胺,选定的磷酰胺在弱酸条件下转变成反应性中间产物,并与上述游离的5’‑oh基偶联,产生新的亚磷酸连接键。这些反应可以在thf或dmso中发生。因为所添加的核苷酸的5’‑oh保持被保护的状态,只有一个核苷酸被添加到生长的链上。对不反应的5’‑oh基可以加帽,使它们无法继续参与合成过程而产生具有缺失的寡核苷酸。这可以通过用乙酸和1-甲基咪唑处理之后的乙酰化而实现。最后可以添加水和碘,将亚磷酸连接键氧化成磷酸二酯键。在各步骤中间,可以用合适的溶剂洗涤来预处理生产系统。在根据需要重复这一系列步骤之后,可以最终将寡核苷酸从柱子上切下,并用氢氧化铵在高温下处理,以除去所有剩余的保护基团。通过使用光蚀刻手段,例如nimblegentm(febit,germany)所提供的,可以提高该方法的效率。[0219]在短寡核苷酸已通过固态合成产生之后,寡核苷酸可以被组装成较大的dna片段,例如,大小为大约500bp。这通常是通过各种酶辅助方法之一来实现。例如,可以利用短的重叠寡核苷酸对通过klenow延伸反应产生更长的双链dna分子。相应的寡核苷酸可以混合,杂交,然后通过pca转变成更大的组装件。在pca反应中,合起来代表靶双链dna片段的各个寡核苷酸全部存在。通过反复的熔解和再杂交,寡核苷酸被逐步延伸成更长的区段,直到有某个群体达到期望的长度。应当注意,此反应是在没有过量的末端寡核苷酸的条件下进行的,因此它不是扩增反应。相反,每一个全长片段由寡核苷酸及其延伸构成,从而减少了由于聚合酶作用引入错误的机会。pca的一种替代方法是聚合酶组装复合扩增(polymeraseassemblymultiplexing)(pam),其中末端引物被添加到寡核苷酸池中,使得只有特定子集的寡核苷酸被扩增。在第二轮pam反应中,可以通过使用一个组新的引物将多个寡核苷酸重新组合成一个单一的dna分子。[0220]大的寡核苷酸(例如,通过pca、pma等产生的寡核苷酸)可以通过例如限制性消化和连接组装成更大的dna分子。[0221]在包含氨基酸重复区的感兴趣多肽在原核细胞或表达系统中表达的实施方案中,可以首先将具有复制原点和用于插入核酸序列的适宜的限制性位点(其可以包含多接头)的载体线性化,以便将编码感兴趣多肽的优化多核苷酸克隆到原核生物载体中。该载体可以具有用于选择的标志物基因,其可赋予抗生素抗性,或者获得另一种区分特征(例如,发色团或荧光团形成)。有各种抗生素试剂(例如,四环素,氯霉素,放线菌素,新霉素,氨苄青霉素,潮霉素,重金属等)可用于标志物辅助选择。其他标志物包括β-半乳糖苷酶,其在表达时可以转变底物x-gal从而提供蓝色。有许多种载体可以商购用于在细菌中进行克隆,并且这些载体是本领域技术人员众所周知的。在一些实施方案中,然后可通过任何方便的方法,包括但不限于磷酸钙沉淀dna、融合、转染、和接合,将包含一个或多个编码感兴趣多肽的合成多核苷酸的原核载体引入到合适的克隆宿主中。然后,可以在合适的选择性培养基中培育细胞。可以收获存活的细胞、裂解并分离质粒。[0222]原核表达载体的特征可以是:具有在合适的表达宿主中可发挥功能的复制起点,其通常用于染色体外保持,以及用于选择的标志物。对于非整合型的载体或构建体,复制起点通常提供多个拷贝,例如,平均至少约5个拷贝。表达载体还通常具有可在表达宿主中发挥功能的启动子。有大量的启动子可供使用,特定的启动子可以例如提供高水平的诱导型或组成型转录。在一些实施方案中可以使用的例证性启动子包括,但不仅限于:β-内酰胺酶;β-半乳糖苷酶;pl或pr启动子;trpe启动子;trp-lac启动子;t7启动子(特别是基因9和10);和cits。[0223]包含优化多核苷酸的核酸分子可以通过杂交,例如,连接作用,与线性化的载体组合。当优化多核苷酸不具有起始密码子时,可以添加这种密码子。在一些实施方案中,多核苷酸可以插入到载体中存在的编码序列中(符合适当的阅读框),置于某启动子的转录控制之下。编码序列的5′末端可以包含信号序列,以允许多肽产物分泌到周质空间。一般地,产物将在细胞内产生。[0224]包含引入的载体或dna构建体的表达宿主细胞可以在合适的培养基中培育(例如,发酵)。在培育细胞到合适的密度之后,可以收获细胞,裂解,并根据其物理和化学特性分离表达产物。在一些实施方案中,表达产物可以是在水性介质中在中等温度下不溶的,并可以通过在适当升高的温度下用去污剂提取加以纯化。参见美国专利5,235,041。然后可以视需要使用粗的或纯化的表达产物用于其预期的目的。[0225]本文的实施方案允许表达任何感兴趣的多肽。在一些实施例中,感兴趣的多肽自身可能是适合于应用的(例如,聚合物)。在其它实例中,可以在宿主中表达感兴趣的多肽,以便产生其他理想的多肽、小分子或其他物质(例如,酶),或者以便在宿主中引入期望的表型。在特定的实例中,感兴趣的多肽可以是:通常表达宿主的细胞中不会发现的蛋白质;农艺学基因产物;赋予对害虫或疾病抗性的多肽:苏云金芽孢杆菌蛋白;凝集素;维生素结合蛋白(例如,亲和素);酶抑制剂;昆虫特异性激素或信息素;对特定生物体特异的肽或神经肽;毒液;负责单萜、倍半萜烯、类固醇、羟肟酸、苯丙素衍生物或其他非蛋白分子的超积累的酶;参与生物活性分子修饰(包括翻译后修饰)的酶(例如,参与ω-3脂肪酸合成的酶);信号转导分子或刺激信号转导的分子(例如,钙调蛋白);疏水运动肽;膜通透酶、转运蛋白、或通道;通道形成物或通道阻断剂;病毒侵入蛋白或从其衍生的复合毒素;抗体或免疫毒素(例如,病毒特异性抗体);发育阻滞蛋白;赋予对除草剂、杀真菌剂或其它有害小分子抗性的多肽;支架蛋白;和设计具有特定功能(例如,可归因于氨基酸重复区域的功能,例如结合性质或物理特性)的合成多肽。在一些实施方案中,感兴趣的多肽可以从自然界获取。在其他实施方案中,感兴趣的多肽可以是在自然界中通常不会发现的多肽;例如,突变的多肽,其包含感兴趣的天然多肽的氨基酸序列中的保守突变。[0226]在特定的实施方案中,可以制备通过使用不同参数对序列进行优化而产生的两个或多个不同的候选序列(例如,在其密码子使用上有不同的序列),并进行测试以确定它们是否具有期望的性质。可以评估候选序列,以便,例如,搜索调节元件(诸如沉默子或增强子)的存在,或者搜索编码序列中如下所述的区域的存在:通过密码子使用的改变,该区域可以被转变成上述的调节元件。其它标准可以包括特定核苷酸的富集(例如,对于特定氨基酸的a,c,g或u密码子偏好),特定mrna二级或三级结构的存在或不存在,和/或额外多聚腺苷酸化序列的存在或不存在。根据这样的标准,可以对候选序列进行的调节以供进一步的表达。[0227]有希望的候选序列可以实验地构建和评估。可以彼此独立地对多个候选物进行评估,或者这个过程可以迭代,以最有希望的候选物作为新的起点或者组合两个或多个候选物的区域来产生新的杂交体。可能期望更多轮次的修饰和评估。[0228]本文中的其它实施方案提供了用于在植物细胞、植物组织、植物材料和/或整个植物中获得期望的表型或性状的方法,其中期望的表型是,例如,昆虫毒素的表达,并且其中期望的性状可以是害虫耐受性和/或抗性。在一些实例中,用于在植物中控制害虫的方法包括在植物细胞中表达编码编码感兴趣多肽的合成多核苷酸,其中该合成多核苷酸编码昆虫毒素;例如但不限于,苏云金芽孢杆菌cry蛋自。用于在粗粉或面粉中控制害虫的方法的特定实例包括从含有合成多核苷酸的植物获得谷粒或种子,其中该植物表达昆虫毒素。表达昆虫毒素的转基因植物可能由于该植物的细胞中存在控制量的主题杀虫蛋白(或其变异体)而对昆虫靶害虫的攻击具有抗性。例如,通过在植物基因组中组入编码具有bt杀昆虫毒素杀虫特性的多肽的多核苷酸,昆虫靶害虫(例如,成体或幼虫)在摄入该植物材料之后会死亡。[0229]本文的特定实施方案提供了用于在植物细胞、植物组织、植物材料和/或整个植物中获得期望表型或性状的方法,其中期望的表型是,例如,除草剂耐受性和/或抗性基因的表达,并且其中该期望性状可以是除草剂耐受性和/或抗性。在一些实例中,用于向植物提供除草剂耐受性的方法包括在植物细胞中表达编码感兴趣多肽的合成多核苷酸,其中该合成多核苷酸编码除草剂耐受性酶,例如但不仅限于:芳基氧基链烷酸双加氧酶(aad1)(参见pct国际专利公开no.wo2005/107437);膦丝菌素乙酰转移酶(pat),或5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(epsp合成酶)酶。[0230]本文的特定实施方案提供了用于在植物细胞、植物组织、植物材料和/或整个植物中获得期望表型或性状的方法,其中期望的表型是,例如,参与植物油性状的基因的表达,并且其中该期望性状可以是植物中(例如植物的种子中)改变的油谱。在一些实例中,用于改变植物油谱的方法包括在植物细胞中表达编码感兴趣多肽的合成多核苷酸,其中该合成多核苷酸编码一种或多种用于改变植物中的油谱的酶,例如但不仅限于,脂肪酸去饱和酶(例如fad2和fad3)。[0231]本文的特定实施方案提供了用于在植物细胞、植物组织、植物材料和/或整个植物中获得期望表型或性状的方法,其中期望的表型是,例如,胁迫耐受基因的表达,并且其中该期望性状可以是对例如水和/或热胁迫的增加的耐受性。在一些实例中,用于向植物提供胁迫耐受性的方法包括在植物细胞中表达编码感兴趣多肽的合成多核苷酸,其中该合成多核苷酸编码一种或多种胁迫耐受蛋白;例如但不仅限于,胁迫相关蛋白(sap1)(美国专利公开no.2010/0275327)和1-cys过氧化物氧化还原(1-cysprx)蛋白(mowlaetal.(2002)planta215:716-26)。[0232]本文的特定实施方案提供了用于在植物细胞、植物组织、植物材料和/或整个植物中获得期望表型或性状的方法,其中期望的表型是,例如,标志物蛋白的表达,并且其中该期望性状可以是标志物选择。在一些实例中,用于向植物提供标志物选择的方法包括在植物细胞中表达编码感兴趣多肽的合成多核苷酸,其中该合成多核苷酸编码一种或多种转化标志物蛋白;例如但不仅限于,绿色荧光蛋白(gfp)或β-葡萄糖醛酸酶。[0233]vi.包含感兴趣多肽的转基因植物[0234]本公开还提供了包含编码感兴趣多肽的异源合成多核苷酸的遗传修饰生物体。本文的一些实施方案提供了包含编码感兴趣多肽的异源合成多核苷酸的转基因植物,例如可以通过从用包含合成多核苷酸的核酸转化的植物细胞再生植物而产生。编码感兴趣多肽的合成多核苷酸可以和适合于该生物体的调节序列(例如,启动子)可操作连接,如前所述。在特定的实施方案中,生物体可以表达感兴趣的多肽。在本文的某些实施方案中,感兴趣的多肽自优化的多核苷酸表达的水平可以是没有类似优化的编码相同多肽的多核苷酸的表达水平的至少110%,150%,200%,500%,1,000%,5,000%或者甚至11,000%;所述没有类似优化的编码相同多肽的多核苷酸例如有这样的多核苷酸:其为了在相同的宿主生物中表达进行了密码子优化,但是其中选自下组的多聚腺苷酸化序列没有保留:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa。[0235]在一些实施方案中,包含编码感兴趣多肽的异源合成多核苷酸的遗传修饰生物体是遗传修饰的植物,其中遗传修饰植物的至少一些细胞包含一个或多个异源合成多核苷酸。在实施方案中的一个实例中,将包含编码感兴趣多肽的异源合成多核苷酸以及选择标志物的质粒通过例如任何本文先前所列举的方法被引入到植物细胞中。从此类植物中可以选出稳定整合了合成多核苷酸和/或选择标志物的合适转化子。在其他实施方案中,可以繁殖包含合成多核苷酸的植物细胞(例如,已被选出的稳定转化子),以产生包含该合成多核苷酸的新植物细胞。包含合成多核苷酸的植物细胞可以是可再生的细胞,其可以用于再生完整的植物。这类植物细胞和由其产生的整个植物可以表达由合成多核苷酸编码的感兴趣多肽。[0236]在这些和进一步的实施方案中,可以提供创建包含合成多核苷酸的可再生植物细胞的方法(例如,供组织培养中使厨)。组织培养能够再生出与可再生细胞具有基本上相同基因型的植物。这样的组织培养物中的可再生细胞可以是胚、原生质体、分生细胞、愈伤组织、花粉、叶、花药、根、根尖、花、种子、荚果或茎。本发明的一些实施方案提供了从本发明的组织培养物再生的植物。[0237]本文还提供了用于产生包含编码感兴趣多肽的稳定化植物系的方法,其中稳定化植物系的细胞可以表达由该多核苷酸编码的感兴趣多肽。产生稳定化植物系的方法是本领域普通技术人员已知的,可以包括例如但不仅限于如下技术:自交、回交、杂种产生、群体杂交。所有包含编码如本文中所述的感兴趣多肽的合成多核苷酸的植物和植物细胞不存在于自然界中,并且例如与包含没有被类似优化的编码感兴趣多肽的合成多核苷酸的植物或植物细胞相比,它们可以显示感兴趣异源多肽的有利表达性质。包含合成多核苷酸的植物细胞可以在杂交中用于和其他不同植物细胞杂交,产生具有优异的或期望的特性的第一代(f1)杂交细胞、种子和/或植物。[0238]特定实施方案中包括任何从根据本文所述方法优化的合成多核苷酸表达感兴趣的多肽的植物或植物细胞,或包含此类多肽的植物材料。在特定的实施方案中,合成多核苷酸用于产生遗传修饰的欧洲油菜(brassicanapus)植物。在进一步的实施方案中,使用合成多核苷酸产生的遗传修饰植物可以是,例如但不仅限于:高等植物;双子叶植物;单子叶植物;消费植物(例如,作物和油用植物):大豆、油菜、亚麻、玉米、红花、向日葵、烟草、豆科植物(豆科,豆科植物,豆科,豆类家族(beanfamily),或豆类(pulsefamily));豆属植物(例如g.albicans,g.aphyonota,g.arenari,g.argyrea,g.canescens,g.clandestine,g.curvata,g.cyrtoloba,g.falcate,g.gracei,g.hirticaulis,g.hirticaulissubsp.leptosa,g.lactovirens,g.latifolia,g.latrobeana,g.microphylla,g.montis-douglas,g.peratosa,g.pescadrensis,g.pindanica,g.pullenii,g.rubiginosa,g.stenophita,g.syndetika,g.tabacina,g.tomentella,野生大豆(g.soja)和栽培大豆(g.max)(大豆));花生、菜豆、蚕豆和豌豆。[0239]在一些实施方案中,遗传修饰的植物是这样的植物,其已知会产生用作药物制剂、调味剂、营养剂、功能性食品成分或美容活性剂的化合物,或者是被基因工程化而产生这些化合物/作用剂的植物。[0240]在其它实施方案中,遗传修饰的植物是油料种子植物,其中油料种子和/或从其获得的油与相同物种的野生型植物相比,含有经过修饰的油谱(例如,表达不寻常量的lc-pufa、ω油含量和增加的油含量)。[0241]在备选的实施方案中,包含如本文所述的编码感兴趣多肽的异源合成多核苷酸的转基因植物或种子在其基因组中还可以包含至少一种其它的转基因事件,包括但不仅限于:编码杀虫蛋白(例如,苏云金芽孢杆菌杀虫蛋白)的基因;除草剂耐受性基因(例如,提供草甘膦耐受的基因);和有助于在转基因植物中产生期望表型,例如增加产量、改变脂肪酸代谢、或恢复细胞质雄性不育,的基因。在特定的实施方案中,通过重组dna技术或者与已经包含这样的附加转基因的植物进行常规育种,将编码感兴趣多肽的合成多核苷酸与这样的附加转基因组合。[0242]在一些实施方案中还包括包含如本文所述的编码感兴趣多肽的异源合成多核苷酸的植物的部分。这些植物部分包括植物的任何部分,包括例如但不仅限于,种子(包括成熟的种子和未成熟的种子);组织;花粉;胚;花;果实;芽;叶;根;茎;和外植体。特定的实施方案包括含有如本文所述的编码感兴趣多肽的异源合成多核苷酸的植物的后代。[0243]提供下面的实施例用于例证某些特定的特征和/或实施方案。实施例不应当被解释为将本公开限制于所举例的特定特征和/或实施方案。实施例[0244]实施例1:评估多种编码截短的cry1ab蛋白的dna序列对t0玉米中基因表达的影响[0245]对编码相同截短型cry1ab蛋白的三种不同dna序列进行评估。用用统一的二元植物转化载体测试了cry1ab基因的3种不同版本。将基因克隆到具有相同选择标志物盒的相同基因表达盒中。各个质粒中唯一的变量是编码截短cry1ab基因的实际dna序列。[0246]材料和方法[0247]合成cry1abdna序列的设计本研究中使用的截短型cry1ab蛋白由对应于在天然cry1ab全长蛋白1-619位所见的氨基酸组成。对编码氨基酸1-619的天然cry1ab基因的截短形式分析16个不同的多聚腺苷酸化序列的存在。表2。记录这16个序列在天然cry1ab基因中鉴定出的位置和组成,并将它们纳入被评估的cry1ab截短型序列的设计中。[0248]使用基因重设计的不同理念设计并创建了3种不同的dna序列。修剪cry1ab基因的每一个版本以产生由氨基酸1-619构成的相应蛋白质,并且改变dna组成,以包含16个前述在天然基因中发现的多聚腺苷酸化序列,消除额外的推定不稳定序列,并在设计中添加了从碱基1639开始的第17个多聚腺苷酸化序列。这个序列在本文中被称作″irdig.1471.4″。[0249]设计了该基因的两个新的版本用以测试不同的重设计假说。将编码cry1ab核心毒素的野生型dna序列翻译成相应的氨基酸序列,然后用optgenetm2.0软件(ocimumbiosolutions,banjarahillshyderabad,india)使用每个氨基酸的优选密码子进行逆向翻译。对所得的dna序列进行分析,视需要对密码子进行改变,以恢复在表2中鉴定的序列、去除不想要的开放阅读框、除去不想要的限制性位点、并且在可能时,通过碱基取代破坏g+c或a+t密码子的连续串以除去g+c和a+t的长段(extendedruns)。所得的编码氨基酸序列对应于天然的氨基酸序列。这个序列在本文中被称为"irdig.1471.2″。[0250]第二种序列设计是基于玉米密码子分布表,该分布表涵盖超过800个玉米基因的氨基酸密码子分布。使用氨基酸密码子分布表翻译核心cry1ab蛋白的相应氨基酸序列,所述氨基酸密码子分布表对应每个密码子在普通玉米基因中存在的水平。稀有密码子(即,密码子的出现机会小于10%或更低)未包括在内。对所得dna序列进行分析,在必要的时候改变密码子以去除不想要的开放阅读框,除去不想要的限制性位点,恢复在表2中鉴定的序列,并且在可能的情况下除去g+c和a+t的长段。所得的编码氨基酸序列对应于天然的氨基酸序列。这个序列在本文中被称为″irdig.1471.3″。[0251]表2.在天然cry1ab基因中发现的序列被包含在本实验中评估的重建基因中。在表的1639(aatcaa)处有一个额外的多聚腺苷酸位点,其不包含在天然序列中而是被工程化到重建体中的,因为它可以消除额外的假定失稳序列。[0252][0253]对3种不同截短型cry1ab版本的总g+c含量进行评估。总含量范围在50.9%至59.5%g+c。表3。分别合成了上述截短型cry1ab基因的3种版本的每一个(dna2.0;menlopark,ca)。[0254]表3.cry1ab的3个不同版本各自的g+c含量[0255][0256][0257]植物表达载体构建使用标准克隆方法构建含有cry1ab表达盒的入门载体。使用(invitrogen,carlsbad,ca)工程化含有cry1ab表达盒的二元质粒,并用于土壤杆菌介导的植物转化。限制性内切酶购自newenglandbiolabs(ipswich,ma),dna连接使用t4dna连接酶(invitrogen)进行。使用酶预混物(invitrogen)进行反应,以组装一个入门载体和一个目的载体。使用质粒试剂盒(macherey-nagelinc.,bethlehem,pa)或plasmidmidi试剂盒(qiagen)按照供应商的使用说明进行质粒制备。dna片段在琼脂糖tris-乙酸凝胶电泳之后用凝胶提取试剂盒(qiagen)进行分离。[0258]在质粒dasdna441-dasdna443中获得了具有前述dna设计的编码截短型cry1ab蛋白的三种合成基因。植物表达载体的构建首先是将每种合成cry1ab基因插入pdab101557中bamhi/saci片段上的zmubi1启动子与zmper53’非翻译区(3’utr)之间,从而创建入门载体pdab111444-pdab111446。使用技术将入门载体pdab111444-pdab111446分别与目的载体pdab109805组合,pdab109805含有选择标志物盒scbv(mam)启动子v2/aad-1v3/zmlip3’utrv1,从而分别创建了最终的二元载体pdab111447-pdab111449。[0259]对于所有组装质粒的菌落,首先通过对小提dna限制性酶切进行筛选。选定克隆的质粒dna通过与商业测序供应商(eurofinstmmwgoperon,huntsville,al)定约进行测序。装配序列数据,并使用sequenchertm软件(genecodescorp.,annarbor,mi)分析之。质粒图反映了正确的序列。图1。[0260]根癌土壤杆菌菌株产生表4提供了用于开发供植物转化用的根癌土壤杆菌菌株的大肠杆菌来源质粒dna的细节。dat13192,一种reca-三元根癌土壤杆菌菌株,是选用于开发这些植物转化菌株的基础菌株。这些菌株的开发中使用标准转化方案。开发了具有感兴趣二元载体的新的稳定转化的根癌土壤杆菌之后,通过对每种菌株的限制性消化加以确认,结果每个构建体验证了至少一个菌落。[0261]表4.大肠杆菌来源的质粒dna,用于从dat13192菌株开发用于植物转化的根癌土壤杆菌[0262][0263]土壤杆菌培养起始获得了宿主根癌土壤杆菌菌株dat13192(reca-三元菌株)的项目载体的甘油储,将土壤杆菌培养物从甘油储划线到ab基本培养基上,并在20℃黑暗温育2-3天。然后将土壤杆菌培养物划线到yep培养基平板上,并在20℃黑暗温育1天。[0264]在实验当天,制备适合于实验中构建体数目的体积的接种培养基与乙酰丁香酮混合物。表5。将接种培养基移液到无菌的一次性250ml烧瓶中。向含有接种培养基的烧瓶中加入溶于100%二甲基亚砜中的1m乙酰丁香酮储液,加入的体积适合于制作200μm最终乙酰丁香酮浓度。[0265]表5.根据所制备构建体的数目制成的接种培养基/乙酰丁香酮混合物的量[0266]制备的构建体数接种培养基(ml)1m乙酰丁香酮储液(μl)15010210020315030420040525050[0267]对于每个构建体,将yep平板上的1-2环土壤杆菌悬浮在置于无菌的一次性50ml离心管内的15ml接种培养基/乙酰丁香酮混合物中,并用分光光度计测量溶液的600nm光密度(od600)。然后,使用额外的接种培养基/乙酰丁香酮混合物将混悬物稀释到0.25-0.35od600。然后,将土壤杆菌混悬液的试管水平置于平台摇床上,设定为大约75rpm,在使用之前室温震荡1-4小时。[0268]穗灭菌和胚分离玉米栽培种b104的穗在温室设施内产生,并在授粉10-12天后收获。将收获的穗去壳并进行表面灭菌:浸没在20%市售漂白剂(ultragermicidalbleach,6.15%次氯酸钠)和2滴吐温tm20的溶液中20分钟,随后在层流罩内用无菌去离子水漂洗3次。在无菌条件下从每个穗切下未成熟的合子胚(1.8-2.2mm长),并分配到一个或多个微离心管中,所述微离心管中含有2.0ml土壤杆菌混悬液,混悬液中已经添加了2μl10%s233表面活性剂。[0269]土壤杆菌共培养在完成胚分离活动之后,密封装有胚的管子,并置于摇动平台上5分钟。然后将管中的内容物倒在共培养培养基平板上,用无菌的一次性移液吸头除去液体土壤杆菌混悬液。使用显微镜使胚的盾片朝上。然后,将具有胚的共培养平板放置在层流罩的后部,盖半开再放置15分钟。然后盖上平板,用3m微孔胶带密封,并置于培养箱中,25℃,光照24小时/日,光强约60μmolm-2s-1。[0270]愈伤组织选择和转基因事件的再生在共培养期之后,将胚转移到静息培养基(restingmedium)上。每个平板转移不超过36个胚。用3m微孔胶带包裹平板,并在27℃,光照24小时/日,光强约为50μmolm-2s-1的条件下温育7-10天。然后,将愈伤的胚转移到选择i培养基上。每个选择i平板转移不超过18个愈伤胚。用3m微孔胶带包裹平板,并在27℃,光照24小时/日,光强大约为50μmolm-2s-1的条件下温育7天。然后,将愈伤胚转移到选择ii培养基上。每个选择ii平板转移不超过12个愈伤胚。用3m微孔胶带包裹平板,并在27℃,光照24小时/日,光强约为50μmolm-2s-1的条件下温育14天。[0271]在这个阶段,将抗性愈伤组织转移到预再生培养基。每个预再生培养基平板转移不超过9个胚。用3m微孔胶带包裹平板,并在27℃,光照24小时/日,光强约为50μmolm-2s-1的条件下温育7天。然后,将再生的愈伤组织转移到phytatraystm的再生培养基上,并在25.5℃,16小时光照/8小时黑暗/日,光强大约为90μmolm-2s-1的条件下温育7-14天,或者直至生发出芽。每个phytatraytm放置不超过5个愈伤组织。然后,分离具有主根的小芽,并转移到芽伸长培养基中。将约6em或更高的生根小植物转移到土壤中,并移到生长室进行炼苗(hardeningoff)。[0272]从植物组织分离基因组dna用于pcr.将组织样品(叶撕片(leaftear),相当于用标准纸张打孔器打2个冲孔块)收集到96孔收集平板(qiagen#19560)中。用kleckotm组织粉碎器(garciamanufacturing,visalia,ca),在biosprint96tmap1裂解缓冲液中用一粒不锈钢珠进行组织破碎。在组织浸泡之后,使用biosprint96tm植物试剂盒(qiagen,#69181)利用biosprint96tm提取机器人以高通量模式分离基因组dna。在建立qpcr反应之前,将基因组dna以2∶3dna/h2o稀释,以获得合适的cp值。[0273]qpcr.使用480系统(rocheappliedscience)通过实时pcr利用水解探针测定进行转基因检测。使用primerexpresstm设计针对aad-1的测定,使用深针设计软件2.0设计针对zmubi1启动子的3’区(zmubilnk)和壮观霉素抗性基因(specr)的测定。各测定以转化酶为内参多重化,以确保每个测定中存在gdna。为了扩增,将480探针主预混物(rocheappliedscience,#04707494001)制备成1x终浓度,10μl体积多重反应中含有0.4μm引物和0.2μm的探针。表6。执行两步骤扩增反应,60℃延伸40秒并进行荧光捕捉。表6。[0274]利用cp值,即使用拟合点算法(软件发布版1.5)和relativequanttm(基于δδct方法)模块得到的荧光信号与背景阈值的交叉点,对实时pcr数据进行分析。[0275]表6.用于hp测定的引物和探针[0276]名称序列探针zmubilnkftgcagcagctatatgtggatt(seqidno:15)zmubilnkrtccatggtgtcgtgtgg(seqidno:16)zmubilnk-探针aacaacagggtgagcatcgac(seqidno:17)fam/bhqzmubiv5lnkrtccattgttggatcctctagag(seqidno:27)gaad1ftgttcggttccctctaccaa(seqidno:18)gaad1rcaacatccatcaccttgactga(seqidno:19)gaad1-探针cacagaaccgtcgcttcagcaaca(seqidno:20)fam/mgbivf-taqtggcggacgacgacttgt(seqidno:21)ivr-taqaaagtttggaggctgccgt(seqidno:22)iv-probecgagcagaccgccgtgtacttctacc(seqidno:23)hex/bhqspc1sgaccgtaaggcttgatgaa(seqidno:24)spc1acttagctggataacgccac(seqidno:25)tqspc-探针cgagattctccgcgctgtaga(seqidno:26)cy5/bhq[0277]表7.用于t0分析的反应组分和条件[0278][0279][0280]蛋白提取在v3-v5期的某个生物测定采集日采样植物叶组织。将两个6cm直径的叶样品保存在96孔排管中,置于-80℃直到分析日。向每个管中加入2个daisytm钢bb和300μl提取缓冲液(含有0.05%tweentm20和5μl/ml蛋白酶抑制剂(sigmatm目录号9599)的pbs溶液)。用kleckotm组织粉碎器以最大设定将样品研磨3分钟。向每个样品管加入85μlnupagetm变性样品缓冲液和15μldtt。将样品轻柔混合,90℃加热5分钟,然后3,000rcf离心。除去上清液,并于同一天进行测试。[0281]产生western印迹.使用invitrogentm设备和基本试剂实施常规的电泳和印迹方法(gallagheretal.(2008)curr.prot.immolunol.8(10):1-28)。使用化学发光检测系统,以兔抗-cry1ab核心抗体作为第一抗体。[0282]定量方法.在本研究中,用于cry1ab定量的elisa为envirologixtm目录号ap003,以cry1ab纯化蛋白作为标准。[0283]t0昆虫生物测定.用鳞翅目新生幼虫进行生物测定测试含有单个bt基因的转基因植物的杀虫活性,测定在来自转基因植物的叶片上进行。测试的鳞翅目物种是欧洲玉米螟(ostrinianubilalishübner)(ecb),和玉米穗蛾(helicoverpazea)(cew)。[0284]32孔托盘(c-dinternational,pitman,nj)用2%琼脂溶液部分填充,并让琼脂凝固。从每个植物获取叶切片(大约1英寸2),并单独置于32孔托盘的孔中。每个孔中放置一个叶片,每个植物和每种昆虫测试2个叶片。昆虫用画笔集中播布,每个孔置入10个新生幼虫。托盘用带孔的粘性盖密封,其允许在测试过程中通气。将托盘置于28℃,40%rh,16:8小时光照:黑暗下3天。在测试的全程之后,对每个叶片计算百分比损伤评分。将每个测试的损伤评分取平均值,并与蛋白质表达分析一起进行相关性分析。[0285]t1种子产生.根据基因的拷贝数、通过elisa测得的蛋白表达水平、在叶片生物测定中的保护情况、和整体植物健康状况,从全部3个背景中鉴定出选定事件,用于推进到下一代。注意含有壮观霉素抗性基因(specr)的事件,但是不一定不推进;将这些事件在温室中进行测试,但用到冬季育苗或田间试验中。[0286]将选择用于推进的事件转移到18.92升盆中。定期观察以跟踪任何异常的表型。在出须之前在芽上套芽袋,以防止被杂散花粉交叉污染。注意任何在覆盖之前产生了须的芽,并将此芽除去。然后,覆盖第二芽并用于授粉。将产生异常芽或不生芽的植物记录在数据库中。在授粉的前一天剪短须,以提供平齐的刷(brush)供接受花粉。全部授粉均使用来自近交栽培种b104的花粉。在可能的情况下,进行互交。为跟踪目的,将授粉信息记录在数据库中。在授粉21天后,将穗壳揭起以增强籽粒脱水(drydown),随后在授粉42天后完成收获(将穗从植物摘下)。将穗置于干燥器中1周,随后进行种子处理(去壳,计数,和包装在预先打印的信封中)。[0287]表8描述了在前述方案中使用的各种培养基的组分。[0288]表8.植物培养基组分[0289][0290][0291]结果和讨论[0292]转化结果.为每个构建体估计转化频率。表9。每个构建体的转化频率通过用产生了至少一个可分离植物的事件的数目(总再生事件)除以土壤杆菌感染的全部胚的总和(处理胚总数)进行估算。此外,表9列出了测试的总数中具有阴性qpcr结果的植物的数目。估算的转化频率有很大程度的变差,范围从4.9%-30.0%,如图2所示。[0293]表9.各构建体的估计转化频率总结。每个构建体产生至少25个事件[0294][0295]用于拷贝数检测的qpcr测定.借助设计为鉴定aad-1基因的拷贝数的实时pcr测定,实施了基于水解探针测定的转基因检测。因为完成了3种不同的dna序列,所以cry1ab基因不是水解探针测定的靶。取而代之的是使用在所有背景中均存在的cry1ab基因盒的一个区域。鉴定了这个区域位于cry1ab基因上游,由包含zmubi1内含子1的一部分(帮助克隆的多接头和位于翻译起始位点之前的kozak序列)组成。确认这个区域的存在表明cry1ab基因盒的存在;它不用于确定拷贝数,只是用于确定这个区域的存在与否。[0296]将这两个测定(aad-1和cry1ab连接子)与内参蔗糖转换酶测定多重化,以确保每个测定中存在gdna。此外,设计测定来鉴定specr基因的存在,从而确定哪个事件不应被推进到下一代用于在田间试验中使用。在该实验的整个过程中实施分子数据分析,以从群体中除去阴性事件或者含有3个或多个aad-1基因拷贝的事件,并且确保只有含有cry1ab与aad-1基因二者的低拷贝事件被推进到convirontm和温室接受进一步试验。所有背景产生了至少20个低(1-2)拷贝事件。然而,pdab111447背景产生了最高百分比的单拷贝事件(即32.3%)。表10。[0297]表10.对于各事件使用水解探针测定分析:aad-1的拷贝数确定;一个在所有背景中均出现的、位于玉米泛素启动子和cry1ab的atg起点之间的接头区域的存在与否;specr基因的存在与否;以及阴性玉米基因一转换酶一的相对信号强度。[0298][0299]蛋白分析对所有来自三种背景的每一种、通过了分子分析筛选的低拷贝事件,分析cry1ab蛋白水平。高gc背景,pdab111447,与另外两种背景相比,显示了显著更高的cry1ab平均表达水平,数值为45.3ng/cm2。玉米密码子偏好的背景pdab111448的平均表达为23.8ng/cm2,而美国专利公开no.us2012/0266335a1(pdab111449)中描述的蛋白的平均表达水平为5.8ng/cm2。在来自每种背景的t0事件中检测到的cry1ab蛋白水平的统计学分析如图3所示,并总结在表11中。[0300]表11.在cry1ab蛋白表达的定量elisa确定中包含的每个背景的事件的数目。不同背景的平均表达范围是5.8-45.3ng/cm2。[0301][0302][0303]对来自每个背景的选定事件进行western印迹,以保证蛋白是稳定的并且具有正确的大小。图4描述了一幅代表性的western印迹,其由下述样品组成:来自含有全长cry1ab的t1对照的样品(pdab107645),和来自pdab111447、pdab111448、和pdab111449的t0事件。在来自每个背景的事件中均可检测到截短的cry1ab蛋白,以及大小为20和18kd的断裂(breakdown)产物。全长cry1abt1对照已知在生物测定中有活性,并且表达的cry1ab低于抗体的检测水平。[0304]t0事件的生物测定结果.在发育的v5期收集来自代表pdab111447;pdab111448;和pdab111449背景的事件的叶材料,并用cew、ecb、以及cry1fa抗性欧洲玉米螟(recb)幼虫攻击之。测定历时3天,并且当t0事件到达v5发育期时对其进行评估。然后,根据叶组织的损伤对样品进行分级。图5-7分别含有cew、ecb、和recb的生物测定结果。来自三种构建体的事件对所有三种害虫的性能同样好。每一个事件对cew和ecb的性能均和对照一样好,且每一种对recb的叶损伤均小于20%。[0305]授粉.通过aad-1分析确定的高表达单拷贝事件还被为确定对cry1ab基因盒呈阳性,考虑将它们推进到t1代。含有specr基因的事件从推进程序中省去。将来自每种背景的10个事件推进到t1代。植物以互交的方式与b104供体事件交叉授粉,以确保在t1代可回收种子用于评估。推进到t1种子产生的事件如表12所示。[0306]表12.进展到t1种子产生的每个事件的数据总结。所有事件均对zmubi1接头检测呈阳性,并对specr检测呈阴性。每个事件与b104交叉授粉。[0307][0308][0309]结论[0310]对多个可以编码截短的cry1ab蛋白的dna序列进行了评估,发现pdab111447(其被额外修饰以包含一组特定的多聚腺苷酸化序列,该组多聚腺苷酸化序列是在天然基因dna组成中与重建基因中相同的核苷酸位置处鉴定出来的)是一个出人意料的优秀基因,它以后会用于地上鳞翅目控制基因堆叠。在玉米的t0代评估了三种不同的dna序列,它们涵盖了不同的dna设计方法学。将全部三种dna序列与用于表达cry1ab蛋白的由相同组分构成的二元植物转化质粒组合。各构建体之间只有dna序列自身不同。[0311]在t0群体中蛋白表达的变化范围是:平均表达低至5.8ng/cm2(在pdab111449背景下观察的),高至45.3ng/cm2(在pdab111447背景下观察到的)。因此,pdab111447提供了8倍增加。在pdab111447背景下记录的个别事件表达cry1ab蛋白的量高达68ng/cm2。与其它两个背景相比,pdab111447还产生了最高百分比的单拷贝事件。然而,pdab111447的转化效率(4.5%)比其它两种背景(均为大约25%)要低得多。[0312]在来自pdab111447背景的事件中测得的cry1ab蛋白的总体表达,以及在昆虫叶生物测定中针对cew、ecb和recb的活性,是将这种dna序列推广用于地上鳞翅目害虫基因堆叠的关键因素。在一些示例性基因堆叠中,将把这个版本的截短型cry1ab与cry1fa基因组合。[0313]实施例2:评估编码截短型cry1fa蛋白的多种dna序列对t0玉米中基因表达的影响[0314]这个实验评估了编码相同截短型cry1fa蛋白的11种不同dna序列。在统一的二元植物转化载体中测试了这11种不同版本的截短型cry1fa基因。将各基因克隆到具有相同选择标志物盒的相同基因表达盒中。每个质粒中唯一的变量是编码截短型cry1fa蛋白的实际dna序列。[0315]材料和方法[0316]合成cry1fa基因的设计.在本研究中使用的截短型cry1fa蛋白由对应于天然cry1fa全长蛋白1-605位出现的氨基酸构成。对编码氨基酸1-605的截短形式的天然cry1fa基因进行分析,考察16个独特的多聚腺苷酸化序列的存在。表13。记录这22个序列的位置和组成,并纳入被评估的cry1fa截短型基因序列的设计中。[0317]设计了11个不同的cry1fa基因序列来测试不同的重设计假说。先前存在的cry1fa的版本包括一种玉米密码子偏好的序列、两种植物密码子偏好的序列,和美国专利公开no.us2012/0266335a1中所述的一种序列。修剪每个版本的cry1fa基因以产生由氨基酸1-605构成的相应蛋白质,并改变dna组成从而包含22个前述在天然基因中发现的多聚腺苷酸化序列。[0318]设计了数个新版本的基因,以测试不同的重设计假说。将编码cry1fa核心毒素的野生型dna序列翻译成相应的氨基酸序列,然后使用optgenetm2.0软件(ocimumbiosolutions,banjarahillshyderabad,india)使用每个氨基酸最优选的密码子对其进行逆向翻译。分析所得的dna序列,并在必要时替换密码子,以恢复在表13中标示的序列、除去不想要的开放阅读框、和除去不想要的限制性位点。在这项初步基因设计中忽略g+c和a+t长段。保留氨基酸序列,所得的dna序列在本文中称作″irdig.586.34″。对irdig.586.34进行进一步的修饰,在可能的情况下,通过碱基替换破坏g+c或a+t密码子的连续字符串来消除延伸6个碱基或更长的g+c和a+t长段。和先前一样,保持氨基酸序列的组成。所得的dna序列在本文中被称作″irdig.586.35″。[0319]对于预先存在的玉米密码子偏好的cry1fa基因,通过恢复在表13中标明的序列,同时保持氨基酸序列不变,来进行修饰。所得的dna序列在本文中被称作″irdig.586.36″。对于irdig.586.36,通过分析dna并视需要改变密码子以除去不想要的开放阅读框和除去不想要的限制性位点,同时保持氨基酸序列不变,来加以进一步的修饰。所得的dna序列在本文中被称作″irdig.586.37″。[0320]对2种预先存在的玉米密码子偏好版本的cry1fa基因进行修饰,同样是通过恢复在表13中标明的序列,同时保留其各自的氨基酸序列。所得的dna序列在本文中分别称作"irdig.586.38″和"irdig.586.42"。对于irdig.586.38,通过分析dna并视需要改变密码子以除去不需要的开放阅读框和除去不需要的限制性位点,同时保留氨基酸序列,来加以进一步的修饰。所得的dna序列在本文中称作″irdig.586.39″。[0321]利用美国专利公开no.us2012/0266335a1中描述的截短型cry1fa序列进行比较。这个序列在本文中称作″irdig.586.40″。对irdig.586.40进行进一步的修饰,在可能的情况下,通过碱基替换破坏g+c或a+t密码子的连续串,同时保持编码产物的氨基酸序列不变,来消除延伸6个碱基或更长的g+c和a+t段。所得的dna序列在本文中称作″irdig.586.41″。[0322]利用氨基酸密码子分布表进行逆向翻译特别设计了另外一条序列,该密码子分布表对应于每个密码子在普通玉米基因中存在的平均水平。不纳入稀有密码子(即,出现10%或者更少的密码子)。对所得的dna序列进行分析,视需要改变密码子以除去不想要的开放阅读框,除去不想要的限制性位点,恢复表13中标明的序列,并且在可能的情况下除去g+c和a+t的长段。所得的dna序列在本文中称作″irdig.586.43″。[0323]表13.在本实验中评估的重建基因中所含的天然cry1fa基因中发现的序列。天然基因中发现的起始于426和582位核苷酸的aataaa序列在重建基因中被改变成相同位置上的aatcaa。[0324][0325]对这11个不同版本的截短型cry1fa基因的总g+c含量进行评估。总g+c含量的范围低至irdig.586.38中的46.9%g+c,高至irdig.568.36中的64.1%g+c。基因的每个版本的g+c含量,包括cry1fa基因(即,“cry1ftrunchx”),可见于表14中。[0326]表14.11个不同版本cry1fa各自的g+c含量[0327]cry1fa序列g+c含量irdig.568.3461.40%irdig.568.3559.80%irdig.568.3664.10%irdig.568.3760.80%irdig.568.3846.90%irdig.568.3948.30%irdig.568.4048.70%irdig.568.4149.10%irdig.568.4248.50%irdig.568.4353.80%cry1ftrunchx48.50%[0328]合成了上述10种截短型cry1fa基因的每一种(irdig.568.34-irdig.568.43)(dna2.0;menlopark,ca)。[0329]植物表达载体构建.使用标准克隆方法构建含有cry1fa表达盒的入门载体。参见例如sambrooketal.(1989)molecularcloning:alaboratorymanual,第2版,coldspringharborlaboratorypress,coldspringharbor,ny。使用(invitrogen,carlsbad,ca)工程化含有cry1fa表达盒的土壤杆菌二元质粒,用于土壤杆菌介导的植物转化。限制性核酸内切酶购自newenglandbiolabs(nebtm;ipswich,ma),t4dna连接酶(invitrogen)用于dna连接。pcr扩增用phusiontm高保真dna聚合酶(neb)和由integrateddnatechnologies公司(idttm;coralville,ia)合成的引物来实施。使用lr酶预混物(invitrogen)实施反应,以组装一个入门载体和一个目的载体。质粒制备使用质粒试剂盒(macherey-nagelinc.,bethlehem,pa)或plasmidmidi试剂盒(qiagen)遵照供应商的使用说明。在琼脂糖tri-乙酸凝胶电泳之后用凝胶提取试剂盒(qiagen)分离dna片段。[0330]在质粒dasdna426-dasdna435中获得了10个根据前述dna设计的编码cry1fa的合成基因。植物表达载体的构建首先是将每个合成cry1fa基因插入到pdab101557中位于bamhi/saci片段上的zmubi1启动子与zmper53’非翻译区(3’utr)之间,分别创建了入门载体pdab111424-pdab111433。使用技术将入门载体pdab111424至pdab111433中的每一个与目的载体pdab109805重组,该目的载体含有选择标志物盒scbv(mam)启动子v2/aad-1v3/zmlip3’utrv1,从而分别创建了最终的二元载体pdab111434至pdab111443。[0331]用来自pmyc2405的截短型cry1fa基因组装了两个额外的植物表达载体。其中的第一个包括一个含有cry1fa的片段,该片段是用引物pmyc2405f(gatcataccatggagaacaacatacagaatcagtgc;seqidno:28)和pmyc2405r(gatctcgagctcgcgaaagcttggc;seqidno:29)从pmyc2405中pcr扩增出来的。将1869bp的扩增片段用ncoi/saci消化,并插入到pdab101557中,创建入门载体pdab110830,随后用技术将其与目的载体pdab109805重组,从而创建pdab1l0839。通过将saci-平末端化(blunted)的ecori片段从pmyc2405插入到pdab110831中来组装最终的质粒,从而创建入门载体pdab110833。用pdab110833和pdab109805进行重组反应,产生了pdab110842。[0332]对所有组装质粒的菌落,首先通过小量制备dna的限制性酶切进行筛选。对选定的额克隆的质粒dna进行测序(eurofinstmmwgoperon,huntsville,al),并使用sequenchertm软件(genecodescorp.,annarbor,mi)对序列数据进行组装和分析。质粒图反映了正确的序列。图8。[0333]根癌土壤杆菌菌株产生.表15中提供了用于开发植物转化用根癌土壤杆菌菌株的大肠杆菌来源的质粒dna的细节。dat13192,一种reca-三元根癌土壤杆菌菌株,被选用作为基础菌株通过标准转化方案来开发这些植物转化菌株。开发了具有感兴趣二元载体的新的稳定转化的根癌土壤杆菌之后,通过对每种菌株的限制性消化加以确认,结果每个构建体验证了至少一个菌落。[0334]表15.用于开发植物转化用根癌土壤杆菌的大肠杆菌来源的质粒dna[0335][0336][0337]根癌土壤杆菌培养起始,穗灭菌,胚分离,以及接种和共培养基本上如实施例1所述进行。[0338]愈伤组织选择和转基因事件的再生在共培养期之后,将胚转移到静息培养基(restingmedium)上。每个平板转移不超过36个胚。用3m微孔胶带包裹平板,并在27℃、光照24小时/日、光强约50μmolm-2s-1的条件下温育7-10天。然后,将愈伤的胚转移到选择i培养基上。每个选择i平板转移不超过18个愈伤胚。用3m微孔胶带包裹平板,并在27℃、光照24小时/日、光强约50μmolm-2s-1的条件下温育7天。然后,将愈伤胚转移到选择ii培养基上。每个选择ii平板转移不超过12个愈伤胚。用3m微孔胶带包裹平板,并在27℃,光照24小时/日,光强约50μmolm-2s-1的条件下温育14天。[0339]在这个阶段,将抗性愈伤组织转移到预再生培养基。每个预再生培养基平板转移不超过9个胚。用3m微孔胶带包裹平板,并在27℃、光照24小时/日、光强约50μmolm-2s-1的条件下温育7天。然后,将再生愈伤组织转移到phytatraystm中的再生培养基上,并在25.5℃、16小时光照/8小时黑暗/日,光强约90μmolm-2s-1的条件下温育7-14天,或者直至发育出芽。每个phytatraytm放置不超过6个愈伤组织。然后,分离具有主根的小芽,并转移到芽/根培养基中。将大约6cm或更高的生根小植物移栽到土壤中,并置于生长室中。[0340]在温室中t0植物的转移和建立.给转基因植物指定唯一的标识(每个事件一个植物),并定期转移到温室中。将植物从phytatraytm转移到装满生长培养基(premiertechhorticulture,promixbx,0581p)的小花盆(t.o.plastics,3.5”svd,700022c)中,用保湿盖(humidome)覆盖,帮助植物适应温室环境(光暴露类型:光照或同化;高光极限:1200par;16小时日长;27℃昼/24℃夜)。[0341]基因组dna分离;qpcr(见表7);蛋白提取;western印迹产生;和定量分析基本上如实施例1所述进行。[0342]t1种子产生.根据基因的拷贝数、通过elisa测得的蛋白表达水平、和整体植物健康状况,选择含有12种质粒中的每一种的选定事件,推进到下一代。含有specr基因的事件在温室中测试,但在冬季育苗或田间试验中不使用。将选用于推进的事件转移到18.92升盆中。定期观察以跟踪任何异常的表型。在出须之前在芽上套置芽袋,以防止被杂散花粉交叉污染。注意任何在覆盖之前产生了须的芽,并将该芽除去。然后,覆盖第二芽并用于授粉。将产生异常芽或不生芽的植物记录在数据库中。在授粉的前一天剪短须,以提供平齐的刷(brush)供接受花粉。全部授粉均使用来自近交栽培种b104的花粉。在可能的情况下,进行互交。为跟踪目的,将授粉信息记录在数据库中。在授粉21天后,将穗壳揭起以增强籽粒脱水,随后在授粉42天后完成收获(将穗从植物摘下)。将穗置于干燥器中1周,随后进行中子处理(去壳,计数,和包装在预先打印的信封中)。[0343]结果和讨论[0344]转化.为每个构建体计算转化频率并汇总在表16中。转化频率具有很大程度的变差,范围从4%-23%。pdab111434和pdab111436背景具有最低的转化频率(分别是5%和4%),而pdab111435和pdab110839背景显示最高的转化率(均达到了23%)。从pdab111436和pdab111437萌发的小植物展现了芽和小叶的褪色,以及叶和茎的偏上生长。图9。这些事件的大部分没有存活,并且没有通过分子分析进行分析。[0345]表16.各个质粒的转化频率(调整为aad-1)的总结。为每一种背景产生了至少25个事件。然而,来自pdab11436背景的许多小植物含有红色色素沉着,并展示了茎和叶的卷曲,其健康程度不足以进一步分析。[0346][0347][0348]比较各个含有cry1f的背景,以确定dna序列对转化的影响的统计学显著性。比较所产生的事件数目占处理的胚的总数的百分比,得出转化频率。使用jmptm统计软件进行偶发事件分析(contingencyanalysis),结果确定,背景pdab111435、pdab110839、和pdab111442的转化频率在0.05的显著性水平下是统计学相等的。pdab110842,pdab111440,pdab111443,pdab111437,pdab111438,和pdab111439的转化频率均统计学相等。此外,pdab111441,pdab111434和pdab111436统计学上相等,都是提供最低转化频率的dna序列。[0349]用于拷贝数检测的qpcr测定.通过实时pcr利用水解探针测定进行转基因检测。这些测定设计用于鉴定aad-1基因的拷贝数。由于使用了11种不同的dna序列,所以cry1fa基因不是水解探针测定的靶。取而代之的是使用在所有背景中均存在的cry1fa基因盒的一个区域。鉴定了这个区域位于cry1fa基因上游,由包含zmubi1内含子1的一部分(帮助克隆的多接头和位于翻译起始位点之前的kozak序列)组成。确认这个区域的存在表明cry1fa基因盒的存在;它不用于确定拷贝数。这两种测定(aad-1和cry1fa接头)与内参测定基因转化酶多重化,以确保在每个测定中存在gdna。此外,设计测定来鉴定specr基因的存在,以确定哪些事件不应被推进到下一代以供田间试验。从群体中除去阴性事件和含有3个或更多个aad-1基因拷贝的事件,以确保只有含有cry1fa和aad-1基因二者的低拷贝事件推进到convirontm和温室以供进一步测试。表17包含对来自每个背景的事件实施的分析的总结。[0350]来自pdab111435背景的事件(23%转化率)还具有最高的单拷贝和低拷贝事件百分比(分别为51.4%和91.9%),其中24%的事件对壮观霉素抗性基因呈阳性。pdab111436具有最低的单拷贝事件百分比(5.3%,1个事件),且骨架污染事件百分比最高(52.6%)。[0351]表17.使用水解探针测定分析各事件的:aad-1拷贝数;一个在所有背景中均发现的玉米泛素启动子和cry1faatg起始之间的接头区的存在与否;specr基因的存在与否;以及天然玉米基因转化酶的相对信号强度[0352][0353]比较各种含有cry1f的背景,以确定dna序列对单拷贝事件生成的影响的统计学显著性。比较通过水解探针测定测得的含有单拷贝aad-1的事件数目,作为事件总数的百分比,并使用jmptm统计软件完成偶发事件分析(contingencyanalysis)。偶发事件分析确定,由背景pdab111435、pdab110839、pdab111434、pdab111438、pdab111441和pdab111442产生的单拷贝事件的数目在0.05的显著性水平是统计学上相等,虽然单拷贝事件的百分比在51.4%到21.9%不等。[0354]蛋白分析.对于来自12种背景的所有通过了分子分析的低拷贝事件,借助定量cry1faelisa测定评估蛋白表达水平。图10描述了来自12种背景中每一种的事件的平均蛋白表达。在温室中的中的cry1fa表达水平被确定为60ng/cm2。两个背景(pdab111434和pdab111435)为所有t0事件提供的平均表达水平等于的水平,其中数个事件表达cry1fa的水平高得多。pdab110839和pdab110842分别是含有版本cry1fa的背景和基因盒的背景,它们分别提供了43.8ng/cm2和45.1ng/cm2的cry1fa平均表达水平。来自所有其他背景的t0事件的cry1fa平均表达水平低于在pdab110839和pdab110842中发现的水平,尽管来自pdab111437、pdab111438、和pdab111439的特定事件被确定具有高于60ng/cm2的表达水平。表18。[0355]表18.来自各种背景的cry1fa蛋白表达的elisa确定,范围是4ng/cm2-62.8ng/cm2。[0356][0357]对来自每个背景的选定事件完成了western印迹,以确保蛋白质是稳定的并且具有正确的大小。在来自大多数背景,包括对照的事件中能够检测到两个独特的蛋白条带。较大的条带(68kda)对应于截短的cry1fa蛋白,较小的产物(66kda)对应于完全加工的活性cry1fa核心毒素。图11提供了由来自pdab111434和pdab111435事件的样品组成的代表性western印迹。[0358]授粉.对于通过aad-1pcr分析确定为高表达单拷贝,且还被确定为cry1fa基因盒阳性的事件,考虑推进到t1代。在大多数背景中,含有specr基因的事件被略去。然而,在pdab111437、pdab111442和pdab111443背景中没有足够的无specr的单拷贝事件,因此包含了来自每个背景的单独一个含有specr的事件。来自这些事件的植物没有纳入任何类型的田间试验中,而是仅限于在温室中测试。另外,pdab111436背景仅有单独一个1拷贝事件可用,因此选择了4个多拷贝事件加以推进。除上述情况之外,将来自每个背景的5个事件推进到t1代,以互交的方式与b104供体事件交叉授粉。[0359]结论[0360]对多个可以编码截短的cry1fa蛋白的dna序列进行了评估,鉴定了一条cry1fadna序列是出人意料的优秀基因,其将被用于地上鳞翅目控制基因堆叠。在玉米的t0代对11种不同的dna序列,它们涵盖了各种dna设计方法学,进行了评估。全部11种dna序列与由相同的cry1fa蛋白表达用组分组成的二元植物转化质粒组合。只有dna序列自身变化。[0361]数种参数受到cry1fadna序列影响。就蛋白表达而言,t0群体中的平均表达从低至4ng/cm2(pdab111440背景)到高至62.6ng/cm2(pdab111434背景)不等,其呈现15倍的表达提高。在pdab111434和pdab111435背景中均记录有高达120ng/cm2的cry1fa蛋白表达的个别事件。转化频率分别从4%(pdab111436)到23%不等(pdab110839和pdab111435均是)。转化频率的这种差异是统计学显著的。选择中的另一个因素是质量事件的数目,特别是具有单拷贝cry1fa基因盒的事件的数目。具有单拷贝事件的背景的范围分别为5%(pdab111436)到51%(pdab111435)。这种宽范围的转化频率、dna拷贝数(高质量事件)和蛋白表达,提供了3个独特的领域用来鉴定单一背景以推进到进一步的堆叠实验。[0362]在来自pdab111434和pdab111435背景的事件中测得的cry1fa蛋白的总表达大于所有其他背景。而且,这两个背景均有个别事件具有最高的cry1fa蛋白表达水平。来自这两个背景的dna序列非常相似;来自pdab111434的dna序列被修饰以减少长度为6个碱基以上的g+c和a+t段,从而创建了pdab111435。pdab111434和pdab111435的cry1fa基因之间有总共32个碱基差异,并且dna98.2%相同。所得的蛋白质表达几乎相同(分别为62.6和60.8ng/cm2)。然而,这两个背景之间的转化效率有显著差异(5%和23%)。此外,如通过水解探针测定检测到的,在质量单拷贝事件产生方面的差异也是统计学显著的;pdab111434中是32.3%,pdab111435中是51.4%。[0363]含有版本的cry1fa基因的两个背景,pdab110839(仅含基因)和pdab110842(基因盒),表达了相对相等水平的cry1fa蛋白,分别为43.8和45.1ng/cm2。这两个背景具有相同版本的dna序列,但与该基因相关的调节元件不同。与pdab110839相比,pdab110842的位于启动子之前的多接头含有24个碱基对的缺失。各个背景使用了不同版本的玉米泛素1启动子,不同版本的序列之间有7个碱基的差异。将启动子和atg翻译起始位点连接的前导序列具有5个碱基对差异,而且在pdab110839背景中19个额外的碱基。最后,两个基因盒的3’utr区不同;pdab110839背景具有玉米per53’utr,而pdab110842具有根癌土壤杆菌orf253’utr。[0364]除了结构差异之外,在两个背景中检测到的转化频率和单拷贝事件百分比也不同。pdab110839背景具有统计学上更高的转化效率(23%)和单拷贝事件频率(30.6%),与之相比,pdab110842背景分别是14%和19%。[0365]其余背景表达的平均cry1fa表达均低于对照。在pdab111436和pdab111437的情况下,在愈伤组织和小植物阶段的高表达有可能从群体中淘汰了单拷贝高表达事件,结果导致较低的转化率和具有较低cry1fa表达的群体。来自这些事件的一些小植物被报告在叶和茎中具有红色失色,叶和茎结构具有严重弯曲,最终导致植物健康不良。与这些序列联合使用的启动子比玉米泛素1更弱可能是总体表达较低的原因,就蛋白表达而言,pdab111436和pdab111437可能是理想的dna序列。[0366]在特定宿主中具有适于转基因表达的优化dna序列对于实现表达目的可能是关键的。来自不同背景的平均蛋白表达从低至4ng/cm2(在pdab111440中观察到)到高至62.8ng/cm2(在pdab111434中测得)不等。单一事件的表达从0ng/cm2(在所有背景中检出)到高至120ng/cm2(在pdab111434和pdab111435中)不等,这证明整合到玉米基因组的不利位置可能会导致不表达,无论基因设计如何。然而,如果整合发生在有利于基因表达的位置,则设计用于在宿主中优化表达的基因与次优的基因相比,表达水平可能显著更高,如被本文的特定实施例所证明的,范围从10ng/cm2(pdab111440)到120ng/cm2(pdab11434和pdab111435)。[0367]综上所述,本发明包括但不限于以下各项:[0368]1.一种用于在植物的细胞中表达感兴趣的异源多肽的系统,该系统包括:[0369]参考多核苷酸,其来自不同于该植物的生物的基因组且编码所述感兴趣多肽;和[0370]合成多核苷酸,其具有这样的序列,该序列包含:[0371]编码所述感兴趣多肽的序列,其中该序列已经过密码子优化而除去了所有根据该植物的密码子偏好为稀有的密码子,[0372]至少一个选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa,[0373]其中该多腺苷酸序列以与所述参考多核苷酸中相同的数目及相同的位置存在,并且[0374]其中该合成多核苷酸序列不以与所述参考多核苷酸中相异的数目或位置包含任何选自下组的多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa。[0375]2.项1的系统,其中该合成多核苷酸不包含下组之外的任何多聚腺苷酸化序列:aataaa,aataat,aaccaa,atataa,aatcaa,atacta,ataaaa,atgaaa,aagcat,attaat,atacat,aaaata,attaaa,aattaa,aataca,和cataaa。[0376]3.项1的系统,其中感兴趣的多肽是选自下组的蛋白质:杀虫蛋白,除草剂耐性蛋白,胁迫耐性相关蛋白,和油谱改变蛋白。[0377]4.项3的系统,其中感兴趣的多肽是杀虫蛋白。[0378]5.项3的系统,其中感兴趣的多肽是芳基氧基链烷酸双加氧酶(aad1)蛋白。[0379]6.项1的系统,其中植物是大豆或玉米植物。[0380]7.项1的系统,其中合成多核苷酸包含5’非翻译序列和3’非翻译区,其中该5’非翻译序列包含与编码感兴趣多肽的序列可操作连接的植物启动子,并且其中该3’非翻译序列包含转录终止序列。[0381]8.项1的系统,其中合成多核苷酸是植物转录单元。[0382]9.项8的系统,其中合成多核苷酸在植物表达载体中。[0383]10.一种转基因植物,其含有项1的合成多核苷酸。[0384]11.来自项16的转基因植物的植物材料,其中该植物材料包含可检测水平的所述感兴趣的异源多肽。[0385]12.一种多核苷酸,其包含选自下组的核苷酸序列:seqidno:1;seqidno:4;和seqidno:5。[0386]13.包含项12的多核苷酸的植物细胞、植物组织、植物材料或植物,其中该植物是大豆或玉米。[0387]14.一种将感兴趣的多肽引入植物细胞的方法,该方法包括:[0388]提供项1的系统;和[0389]用所述合成多核苷酸转化所述植物的细胞。[0390]15.通过如项14所述的方法产生的植物细胞。[0391]16.一种在植物中表达感兴趣的多肽的方法,该方法包括从项15的植物细胞再生植物。[0392]17.一种将感兴趣多肽引入植物的方法,该方法包括:[0393]提供项1的系统;和[0394]用所述合成多核苷酸转化所述植物。[0395]18.如项17所述的方法,其中转化所述植物包括转化该植物的细胞;以及从转化细胞再生植物。[0396]19.通过如项所述17的方法产生的植物。[0397]20.项19的植物,其中,与用不以与参考多核苷酸中相同的数目及相同的位置包含所述多聚腺苷酸化序列的合成多核苷酸转化的相同物种植物相比,该植物包含更大量的所述感兴趣的异源多肽。[0398]21.项17的方法,其中感兴趣的多肽是选自下组的蛋白质:杀虫蛋白,除草剂耐性蛋白,胁迫耐性相关蛋白,和油谱改变蛋白。[0399]22.一种控制害虫的方法,该方法包括从通过如项21所述的方法产生的植物获得谷粒,其中所述感兴趣的多肽是杀虫蛋白。[0400]23.一种控制害虫的方法,该方法包括从通过如项21所述的方法产生的植物中获得种子,其中所述感兴趣的多肽是杀虫蛋白。[0401]24.如项23所述的方法,其中该方法进一步包括使所述种子萌发。[0402]25.一种来源于项19的转基因植物的组合物,其中该组合物是选自下组的商业产品:粗粉、面粉、蛋白浓缩物、和油。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1