专利名称::克隆来自烟草的细胞色素p450基因的制作方法克隆来自烟草的细胞色素P450基因本发明涉及烟草(Nicotiana)植物中编码细胞色素P450酶(下文中称为P450和P450酶)的核酸序列以及使用这些核酸序列来改变植物表型的方法。背景细胞色素P450催化多范围的化学上不同底物的酶反应,包括内源和生物异源底物的氧化、过氧化和还原代谢。在植物中,P450参与的生化途径包括植物产物合成,如类苯丙醇(phenylpr叩anoid)、生物碱、类萜、脂类、生氰糖苷和硫配糖体(glycosinolate)(Chappel,Annu.Rev.PlantPhysiol.PlantMol.Biol.198,49:311-343)。细胞色素P450也称为P450-硫醇血红素蛋白,通常作为多成分电子转移链中的末端氧化酶,此转移链称为含P450的单加氧酶系统。特异催化反应包括脱甲基、羟基化、环氧化、N-氧化、磺氧化、N-、S-和0-脱烷基、脱硫、脱氨基以及氮、硝基和N-氧化基团的还原。烟草植物P450酶的不同作用包括影响多种植物代谢物如类苯丙醇、生物碱、类萜、脂类、氰糖苷、硫配糖体和其它化学实体的宿主。近几年中,显然一些P450酶可影响植物的植物代谢物组成。例如,长期以来需要改进某些植物的风味和香味,这是通过育种改变其所选脂肪酸的分布;然而对于参与控制这些叶组成水平的机制所知甚少。下调与脂肪酸修饰相关的P450酶可促进所需脂肪酸的积聚,所需脂肪酸提供更优选的叶表型品质。P450酶的功能和它们在植物组成中的广泛作用仍有待发现。例如,发现一类特殊P450酶催化脂肪酸分解成不稳定的C6-和C9-醛和-醇,它们是水果和植物"清新(freshgreen)"气味的主要贡献者。可改变其它新靶向的P450水平以提高叶组成的性质,这是通过修饰烟草叶中的脂类组合物和相关分解代谢物。一些这类叶组成受衰老影响,衰老刺激叶品质性质的成熟。其它报导显示P450酶在改变脂肪酸中发挥功能性作用,这些脂肪酸参与植物-病原体相互作用和疾病抗性。在其它例子中,暗示P450酶参与生物碱的生物合成。降烟碱是烟草(7Wco"朋s"力3CW/7)中发现的次要生物碱。假定其生成是通过P450调节的烟碱脱甲基,接着在N位置酰化和亚硝基化,从而产生一系列N-酰基降烟碱(acylnonicotine)和N-亚硝基降烟碱。认为由推断的P450脱甲基酶催化的N-脱甲基是烟草中降烟碱生物合成的主要来源。认为酶是微粒体的,因此迄今为止没有成功纯化烟碱脱甲基酶,也没有分离参与的基因。此外,假设但没有证明P450酶的活性受遗传控制并也受环境因素的强烈影响。例如,当植物到达成熟阶段时,认为烟草中烟碱的脱甲基显著增加。另外,认为脱甲基酶基因包含转座因子,转座因子存在时可抑制RNA翻译。在本发明前,P450酶的多样性、它们不同的结构和功能使烟草P450酶的研究很困难。此外,克隆P450酶至少部分受到阻碍,因为这些膜定位的蛋白质一般存在丰度低且通常对于纯化不稳定。因此,需要鉴定植物中的P450酶和与这些P450酶相关的核酸序列。在烟草中仅特别报道了几种细胞色素烟草P450蛋白。本文所述发明包括发现了大量细胞色素P450片段,它们在其序列同一性基础上对应于几组P450种类。概述本发明涉及植物P450酶。本发明进一步涉及来自烟草的植物P450酶。本发明也涉及在植物中表达受乙烯和/或植物衰老诱导的P450酶。本发明更涉及植物中有酶活性的核酸序列,例如加氧酶、脱甲基酶等或其它,以及使用这些序列以使这些酶的表达减少或沉默。发明同样涉及植物中发现的P450酶,其所含降烟碱水平高于降烟碱水平较低的植物。一方面,发明涉及核酸序列,它们示于SEQ.ID.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145和147。在第二个相关方面中,这些核酸序列同一性超过75%的片段被分组,这取决于它们的区域同一性,区域对应于细胞色素P450基序GXRXCX(G/A)后第一个核酸到终止密码子。代表核酸组和各种类示于表I。第三方面,发明涉及氨基酸序列,它们示于SEQ.ID.2、4、6、8、10、12、14、16、18、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146和148。在第四个相关方面中,这些氨基酸序列同一性超过71%的片段被分组,这取决于它们彼此的区域同一性,区域对应于细胞色素P450基序GXRXCX(G/A)后第一个氨基酸到终止密码子。代表氨基酸组和各种类示于表n。发明的第五个方面是使用核酸序列,它们示于SEQ.ID.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145和147。在第六个相关方面中,减少或去除烟草植物中的P450酶可用RNA病毒系统暂时完成。评估所得转化或感染植物的表型变化,包括但不限于分析内源P450RNA转录本、P450表达肽和植物代谢物浓度,使用本领域普通技术人员通常可用的技术。在第七个重要方面中,本发明也涉及产生P450酶活性水平改变的转基因烟草品系。根据发明,这些转基因品系包括核酸序列,序列有效使某些酶的表达减少或沉默,从而导致烟草中的表型效果。这种核酸序列包括SEQ.ID.l、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145和147。在发明非常重要的第八个方面中,植物栽培品种包括下调本发明核酸的性能,会改变相对对照植物的代谢物分布。第九方面,本发明涉及筛选植物,更优选烟草,植物所含基因与教授的核酸序列有显著的核酸同一性。使用发明的优势是鉴定和选择植物,植物包含具精确或显著同一性的核酸序列,其中这种植物是常规或转基因品种育种程序、突变程序或天然产生的不同植物群的一部分。筛选有显著同一性的植物可通过评估植物核酸物质来完成,使用核酸探针,结合核酸检测操作,包括但不限于核酸杂交和PCR分析。核酸探针可以由教授的核酸序列或其片段组成,它们对应于SEQ.ID.l、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145和147。第十方面,本发明涉及鉴定植物基因,更优选烟草,对应教授的核酸序列具有显著的氨基酸同一性。对植物基因的鉴定包括cDNA和那些cDNA的基因组克隆(genomicclans),基因组克隆(优选来自烟草)可通过筛选植物cDNA文库来完成,筛选使用核酸探针并结合核酸检测操作,核酸监测操作包括但不限于核酸杂交和PCR分析。核酸探针包括核酸序列或其片段,它们对应于SEQ.ID.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145和147。在另外的第十一个方面中,可筛选表达肽的cDNA表达文库,所用抗体针对部分或全部教授的氨基酸序列。这种氨基酸序列包括SEQ.ID.2、4、6、8、10、12、14、16、18、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146和148。附图简述图1显示核酸SEQ.ID.NO.图2显示核酸SEQ.ID.NO.图3显示核酸SEQ.ID.NO.图4显示核酸SEQ.ID.NO.图5显示核酸SEQ.ID.NO.图6显示核酸SEQ.ID.NO.:1和氨基酸SEQ.ID.NO.:2。:3和氨基酸SEQ.ID.NO.:4。:5和氨基酸SEQ.ID.NO.:6。:7和氨基酸SEQ.ID.NO.:8。:9和氨基酸SEQ.ID.NO.:10。:11和氨基酸SEQ.ID.NO.:12。图7显示核酸SEQ.ID.NO.:13和氨基酸SEQ.ID.NO.:14。图8显示核酸SEQ.ID.NO.:15和氨基酸SEQ.ID.NO.:16。图9显示核酸SEQ.ID.NO.:17和氨基酸SEQ.ID.NO.:18。图10显示核酸SEQ.ID.NO.:19和氨基酸SEQ.ID.NO.:20。图11显示核酸SEQ.ID.NO.:21和氨基酸SEQ.ID.NO.:22。图12显示核酸SEQ.ID.NO.:23和氨基酸SEQ.ID.NO.:24。图13显示核酸SEQ.ID.NO.:25和氨基酸SEQ.ID.NO.:26。图14显示核酸SEQ.ID.NO.:27和氨基酸SEQ.ID.NO.:28。图15显示核酸SEQ.ID.NO.:29和氨基酸SEQ,ID.NO.:30。图16显示核酸SEQ.ID.NO.:31和氨基酸SEQ.ID.NO.:32。图17显示核酸SEQ.ID.NO.:33和氨基酸SEQ.ID.NO.:34。图18显示核酸SEQ.ID.NO.:35和氨基酸SEQ.ID.NO.:36。图19显示核酸SEQ.ID.NO.:37和氨基酸SEQ.ID.NO.:38。图20显示核酸SEQ.ID.NO.:39和氨基酸SEQ.ID.NO.:40。图21显示核酸SEQ.ID.NO.:41和氨基酸SEQ.ID.NO.:42。图22显示核酸SEQ.ID,NO.:43和氨基酸SEQ.ID,NO.:44。图23显示核酸SEQ.ID.NO.:45和氨基酸SEQ.ID.NO.:46。图24显示核酸SEQ.ID.NO.:47和氨基酸SEQ.ID.NO.:48。图25显示核酸SEQ.ID.NO.:49和氨基酸SEQ.ID.NO.:50。图26显示核酸SEQ.ID.NO.:51和氨基酸SEQ.ID.NO.:52。图27显示核酸SEQ.ID.NO.:53和氨基酸SEQ.ID.NO.:54。图28显示核酸SEQ.ID.NO.:55和氨基酸SEQ.ID.NO.:56。图29显示核酸SEQ.ID.NO.:57和氨基酸SEQ.ID.NO.:58。图30显示核酸SEQ.ID.NO.:59和氨基酸SEQ.ID.NO.:60。图31显示核酸SEQ.ID.NO.:61和氨基酸SEQ.ID.NO.:62。图32显示核酸SEQ.ID.NO.:63和氨基酸SEQ.ID.NO.:64。图33显示核酸SEQ.ID.NO.:65和氨基酸SEQ.ID.NO.:66。图34显示核酸SEQ.ID.NO.:67和氨基酸SEQ.ID.NO.:68。图35显示核酸SEQ.ID.NO.:69和氨基酸SEQ.ID.NO.:70。图36显示核酸SEQ.ID.NO.:71和氨基酸SEQ.ID.NO.:72。图37显示核酸SEQ.ID.NO.:73和氨基酸SEQ.ID.NO.:74。图38显示核酸SEQ.ID.NO.图39显示核酸SEQ.ID.NO.图40显示核酸SEQ.ID.NO.图41显示核酸SEQ.ID.NO.图42显示核酸SEQ.ID.NO.图43显示核酸SEQ.ID.NO.图44显示核酸SEQ.ID.NO.图45显示核酸SEQ.ID.NO.图46显示核酸SEQ.ID.NO.图47显示核酸SEQ.ID.NO.图48显示核酸SEQ.ID.NO.图49显示核酸SEQ.ID.NO.图50显示核酸SEQ.ID.NO.:图51显示核酸SEQ.ID.NO.:图52显示核酸SEQ.ID.NO.:图53显示核酸SEQ,ID.NO.:图54显示核酸SEQ.ID.NO.:图55显示核酸SEQ.ID.NO.:图56显示核酸SEQ.ID.NO.:图57显示核酸SEQ.ID.NO.:图58显示核酸SEQ.ID.NO.:图59显示核酸SEQ.ID.NO.:图60显示核酸SEQ.ID.NO.:图61显示核酸SEQ.ID.NO.:图62显示核酸SEQ.ID.NO.:图63显示核酸SEQ.ID.NO.:图64显示核酸SEQ.ID.NO.:图65显示核酸SEQ.ID.NO.:图66显示核酸SEQ.ID.NO.:图67显示核酸SEQ.ID.NO.:图68显示核酸SEQ.ID.NO,::75和氨基酸SEQ.ID.NO.:76。:77和氨基酸SEQ.ID.NO.:78。:79和氨基酸SEQ.ID.NO.:80。:81和氨基酸SEQ.ID.NO.:82。:83和氨基酸SEQ.ID.NO.:84。:85和氨基酸SEQ.ID.NO.:86。:87和氨基酸SEQ.ID.NO.:88。:89和氨基酸SEQ.ID.NO.:90。:91和氨基酸SEQ.ID.NO.:92。:93和氨基酸SEQ.ID.NO.:94。:95和氨基酸SEQ.ID.NO.:96。:97和氨基酸SEQ.ID.NO.:98。:99和氨基酸SEQ.ID.NO.:100。:101和氨基酸SEQ.ID.NO.:102。:103和氨基酸SEQ.ID.NO.:104。:105和氨基酸SEQ.ID.NO.:106。:107和氨基酸SEQ.ID.NO.:108。:109和氨基酸SEQ.ID.NO.:110。:111和氨基酸SEQ.ID.NO.:112。:113和氨基酸SEQ.ID.NO.:114。:115和氨基酸SEQ.ID.NO.:116。:117和氨基酸SEQ.ID.NO.:118。:119和氨基酸SEQ.ID.NO.:120。:121和氨基酸SEQ.ID.NO,:122。:123和氨基酸SEQ.ID.NO.:124。:125和氨基酸SEQ.ID.NO.:126。:127和氨基酸SEQ.ID.NO.:128。:129和氨基酸SEQ.ID.NO.:130。:131和氨基酸SEQ.ID.NO.:132。:133和氨基酸SEQ.ID.NO.:134。:135和氨基酸SEQ.ID.NO.:136。图69显示核酸SEQ.ID.NO.:137和氨基酸SEQ.ID.NO.:138。图70显示核酸SEQ,ID.NO.:139和氨基酸SEQ,ID.NO.:140。图71显示核酸SEQ.ID.NO.:141和氨基酸SEQ.ID.NO.:142。图72显示核酸SEQ.ID.NO.:143和氨基酸SEQ.ID.NO.:144。图73显示核酸SEQ.ID.NO.:145和氨基酸SEQ.ID.NO.:146。图74显示核酸SEQ.ID.NO.:147和氨基酸SEQ.ID.NO.:148。图75显示用于通过PCR克隆细胞色素P450cDNA片段的过程。显示SEQ.ID.NO.149-156。图76阐述组号的氨基酸同一性。详细描述定义除非另有定义,本文所用的全部技术和科学术语与本发明所述领域普通技术人员通常理解的意义相同。Singleton等,(1994)《微生物和分子生物词典》Sons(NewYork)提供有许多本发明所用术语的综合词典给技术人员。本文所指的全部专利和出版物纳入本文供参考。为了本发明目的,下面定义下列术语。"酶活性"用于包括脱甲基、羟基化、环氧化、N-氧化、磺氧化、N-、S-和O-脱垸基、脱硫、脱氨基以及氮、硝基和N-氧化基团的还原。术语"核酸"指脱氧核糖核苷酸或核糖核苷酸聚合物,以单或双链形式或者正义或反义,除非另有限制,包括天然核苷酸的已知类似物,其与核酸的杂合方式类似于天然产生的核苷酸。除非另有说明,特定核酸序列包括其互补序列。术语"可操作连接"、"可操作结合"和"以可操作顺序"指核酸表达控制序列(如启动子、信号序列或转录因子结合位置的排列)与第2种核酸序列间的功能性连接,其中表达控制序列影响对应于第2种序列的核酸转录和/或翻译。当关于细胞使用时,术语"重组体"表示细胞复制异源核酸,表达所述核酸或表达肽、异源肽或由异源核酸编码的蛋白质。重组细胞可表达正义或反义形式的基因或基因片段,这些形式不在天然细胞形式(非重组)中发现。重组细胞也能表达天然细胞形式中发现的基因,但其中基因被修饰和通过人工方式再导入细胞。"结构基因"是基因部分,包括编码蛋白、多肽或其部分的DNA区段,去除推动转录起始的5'序列。结构基因可另外编码不能翻译的产物。结构基因可以是细胞中正常发现的或者细胞或其导入的细胞位置中不常发现的,在导入情况中它称为"异源基因"。异源基因可全部或部分获得自本领域已知的任何来源,包括细菌基因组或附加体,真核、核或质粒DNA、cDNA、病毒DNA或化学合成的DNA。结构基因可包含一种或多种修饰,修饰能影响生物活性或其特征、表达产物的生物活性或化学结构、表达速度或表达控制的方式。这种修饰包括但不限于突变、插入、缺失和一个或多个核苷酸的取代。结构基因能构成不间断的编码序列或它可包括一个或多个内含子,由适当剪接界结合。结构基因可翻译或不能翻译,包括反义方向。结构基因可以是区段组合,获得自多种来源和基因序列组合(天然产生或合成,其中合成指化学合成的DNA)。"获得自"用于指取、获得、接受、追踪、复制或遗传自来源(化学和/或生物)。生成衍生物可通过化学或生物操作(包括但不限于取代、加入、插入、缺失、提取、分离、突变和复制)原始来源。涉及DNA序列的"化学合成"指部分组成核苷酸在体外装配。手工化学合成DNA可用较好确立的过程(Caruthers,《DNA和RNA测序的方法》(MethodologyofDNAandRNASequencing),(1983),Weissman(编),PraegerPublishers,NewYork,第1章)完成;自动化学合成能用一些商业购买的机器之一进行。进行用于比较的最佳序列比对可通过Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482(1981)、通过Needleman和Wunsch的同源性比对算法,J.Mol.Biol.48:443(1970)、通过Pearson和Lipman的检索类似性方法,Proc.Natl.Acad.Sci.(U.S.A.)85:2444(1988)、通过这些算法(WisconsinGenetics软件包中的GAP、BESTFIT、FASTA禾口TFASTA,GeneticsComputerG扁p,575ScienceDr.,Madison,Wis.)的计算机化实现、或通过检查进行。NCBI局部序列比对基本检索工具(BLAST)(Altschul等,1990)获得自一些来源,包括国家生物信息中心(NCBI,Bethesda,Md.)和因特网,用于结合序列分析程序blastp、blastn、blastx、tblastn和tblastx。它可在http:〃ww.ncbi.nlm.nih.gov/BLAST/访问。如何用此程序确定序列同一性的描述可获得自http:〃www.ncbi.nlm.nih.gov/BLAST/blast.help,html。应用于氨基酸序列和本文使用的术语"显著的氨基酸同一性"或"显著的氨基酸序列同一性"表示多肽特征,其中肽包括的序列与参考组相比,在对应于细胞色素P450基序GXRXCX(G/A)后第一个氨基酸到翻译肽终止密码子的区域上具有至少百分之70的序列同一性,优选百分之80的氨基酸序列同一性,更优选百分之90的氨基酸序列同一性,最优选至少百分之99到100的序列同一性。应用于核酸序列和本文使用的术语"显著的核酸同一性"或"显著的核酸序列同一性"表示多核苷酸序列特征,其中多核苷酸包括的序列与参考组相比,在对应于细胞色素P450基序GXRXCX(G/A)后第一个核酸到翻译肽终止密码子的区域上具有至少百分之75的序列同一性,优选百分之81的氨基酸序列同一性,更优选百分之91到99的序列同一性,最优选至少百分之99到100的序列同一性。核苷酸序列显著相同的另外指示是如果2个分子在严格条件下彼此杂交。严格条件取决于序列且不同环境下会不同。一般,严格条件选择为约5'C到约20'C,通常约10,'C到约15°C,,低于特定序列在确定离子强度邻pH的热熔点(Tm)。Tra是50y。靶序列与匹配探针杂交的温度(在确定离子强度和pH下)。通常,严格条件中盐浓度在pH7约为0.02摩尔且温度为至少约60'C。例如,在标准Southern杂交过程中,严格条件包括开始在6xSSC中42'C洗,接着于至少约55'C的温度在0.2xSSC中另外洗一次或多次,一般约60'C且通常约65°C。当多肽和/或它们编码的蛋白质显著相同时,核苷酸序列也显著相同,用于本发明目的。因此,一种核酸序列编码与第2种核酸序列几乎相同的多肽时,这两种核酸序列显著相同,即使它们由于遗传密码子允许的简并性而在严格条件下不杂交(参见Darnell等,(1990)《分子细胞生物》(MolecularCellBiology),第2版,ScientificAmericanBooksW.H.Freeman禾口CompanyNewYork关于密码子简并性和遗传密码的解释)。蛋白质纯度或均一性可通过本领域熟知的一些方法指示,如蛋白样品的聚丙烯酰胺凝胶电泳,接着由染色呈现。为了某些目的,需要高分辨率并使用HPLC或类似纯化方法。如本文所用,术语"载体"关于核酸分子使用,核酸分子将DNA区段转移到细胞中。载体作用于复制DNA且可在宿主细胞中独立复制。术语"媒介"有时与"载体"交换使用。如本文所用,术语"表达载体"指重组DNA分子,分子包含所需编码序列和在特定宿主生物体中表达可操作连接编码序列所需的适当核酸序列。在原核生物中表达所需的核酸序列通常包括启动子、操纵子(任选)、常与其它序列一起的核糖体结合位置。己知真核细胞使用启动子、增强子、终止与聚腺苷酸化信号。'为了再生有根的完整遗传工程植物,核酸可插入植物细胞,例如通过任何技术如体内接种或任何己知体外组织培养技术以生成能在完整植物中再生的转化植物细胞。因此,例如插入植物细胞可通过体外接种致病或非致病根瘤土壤杆菌(A"/^/a"'朋S)。也能使用其它这种组织培养技术。"植物组织"包括植物的分化和未分化组织,但不限于根、茎干、叶、花粉、种子、肿瘤组织及多种培养细胞形式如单细胞、原生质体、胚和愈合组织。植物组织可以在植物中或者在器官、组织或细胞培养中。如本文所用,"植物细胞"包括植物中的植物细胞及培养的植物细胞和原生质体。"cDNA"或"互补DNA"—般指单链DNA分子,其核酸序列与RNA分子互补。cDNA通过反转录酶对RNA模板作用来形成。获得核酸序列的方法根据本发明,RNA提取自转变和非转变烟草品系的烟草组织。随后提取的RNA用于产生cDNA。然后本发明核酸序列用2种方法生成。在第一种方法中,多聚A丰富的RNA通过反转录PCR提取自植物组织和cDNA。随后单链cDNA用于产生P450特异PCR群,使用简并引物加寡d(T)反向引物。引物设计以P450的高保守基序为基础。特定简并引物的例子示于图1。进一步分析来自质粒的序列片段,质粒含适当大小的插入。这些大小插入一般范围从约300到约800个核苷酸,这取决于所用引物在第二种方法中,初始构建了一个cDNA文库。随后质粒中的cDNA用于产生P450特异PCR群,使用简并引物加质粒上的T7引物作为反向引物。如在第l种方法中,进一步分析来自质粒的序列片段,质粒含适当大小的插入。已知产生高水平降烟碱(转变体)的烟草植物品系和降烟碱水平不能检测的植物品系可用作起始材料。然后叶可从植物中取出并用乙烯处理以活化本文定义的P450酶活性。总RNA用本领域已知技术提取。随后cDNA片段用PCR(RT-PCR)和寡d(T)引物产生,如图l所述。接着可构建cDNA文库,这在本文的例子中更充分描述。P450类酶的保守区能用作简并引物的模板(图75)。使用简并引物,P450特异带可通过PCR扩增。指示P450类似酶的带可通过DNA测序鉴定。确定PCR片段特征能用BLAST检索、比对或其它工具以鉴定适当候选。来自鉴定片段的序列信息可用于发展PCR引物。这些引物用于从转变和非转变的乙烯处理植物组织的RNA中构建定量PCR引物。仅来自转变品系的适当大小DNA带(300-800bp)或具更高密度的带用于进一步特征确定,更高密度指示转变品系中的更高表达。进行大规模Southern反向分析以检测所得全部克隆的不同表达。在发明的此方面,可进行这些大规模反向Southern分析,使用来自不同组织的标记总cDNA作为与克隆DNA片段杂交的探针以筛选所有克隆插入。非放射性Northern印迹测定也用于确定克隆P450片段的特征。如上鉴定的核酸序列可用病毒诱导的基因沉默技术检测(VIGS,Baulcombe,《植物生物的当前观点》(CurrentOpinionsinPlantBiology),1999,2:109-113)。在发明的另一方面,干扰RNA技术(RNAi)用于进一步确定本发明烟草植物中细胞色素P450酶活性的特征。下列描述此技术的参考文献纳入本文供参考,Smith等,Nature,2000,407:319-320;Fir等,Nature,1998,391:306-311;Waterhouse等,PNAS,1998,95:13959-13964;Setalberg等,PlantMolecularBiology,1993,23:671-683;Baul固be,《植物生物的当前观点》,1999,2:109-113;Brigneti等,EMB0Journal,1998,17(22):6739-6746。植物可用RNAi技术、反义技术或所述多种其它方法转化。存在一些用于将外源遗传物质导入植物细胞、获得稳定维持和表达导入基因的植物。这种技术包括加速包被于微粒上的遗传物质直接进入细胞(Cornell的美国专利4,945,050和DowElanco的5,141,131)。植物可用农杆菌技术转化,参见UniversityofToledo的美国专利5,177,010;TexasA&M的5,104,310;欧洲专利申i青0131624BK欧洲专利申i青120516、159418B1;欧洲专利申i青120516、159418B1和Schilperoot的176,112;美国专利5,149,645、5,469,976、5,464,763和4,940,838以及Schilperoot的4,693,976;MaxPlanck的欧洲专利申i胄116718、290799、320500;JapanNicotiana的欧洲专利申请604662和627752;CibaGeigy的欧洲专利申请0267159、0292435和美国专利5,231,019;Calgene的美国专利5,463,174和4,762,785以及Agracetus的美国专利5,004,863和5,159,135。其它转化技术包括噬菌体颈须技术(whiskerstechnology),参见Zeneca的美国专利5,302,523和5,464,765。电穿孔技术也用于转化植物,参见BoyceThompsonInstitute的W087/06614,Dekalb的5,742,869、5,384,253,PGS的W09209696和W09321335。所有这些转化专利和出版物纳入供参考。除了许多用于转化植物的技术,接触外源基因的组织类型也能变化。这种组织包括但不限于胚发生组织、愈合组织I和II型、胚轴、分裂组织等。几乎所有植物组织可在去分化中转化,使用技术人员掌握的合适技术。导入植物的外源遗传物质包括可选择标记。对特定标记的优选在于技术人员的判断力,但任何下列可选择标记能与本文未列出但作为可选择标记能发挥功能的任何其它基因一起使用。这种可选择标记包括但不限于编码对抗生素卡那霉素、新霉素和G418抗性的转座子Tn5的氨基糖苷磷酸转移酶基因(AphII)以及编码对草甘膦;潮霉素;氨甲蝶呤;膦丝菌素(bar);咪唑啉酮、磺脲和三唑嘧啶除草剂如chlorosuluron;溴苯腈、茅草枯等抗性或耐受的基因。除了可选择标记,需要使用报告基因。在一些情况中,可使用报告基因而没有可选择标记。报告基因是一般不存在或表达于受体生物体或组织的基因。报告基因通常编码提供一些表型变化或酶特性的蛋白质。这种基因的例子提供于K.Weising等,Ann.Rev.Genetics,22,421(1988),它纳入本文供参考。优选的报告基因没有限制的包括葡糖苷酸酶(GUS)基因和GFP基因。一旦导入植物组织,结构基因的表达可用任何本领域已知方法测定,表达可测量为转录的mRNA、合成蛋白质或产生的基因沉默量(参见美国专利号5,583,021,纳入本文供参考)。技术已知用于体外培养植物组织,在一些情况中,用于在完整植物中再生(EP申请号88810309.0)。将导入的表达复合体转移到商业有用栽培品种的过程对本领域技术人员已知。一旦获得表达所需P450酶水平的植物细胞,植物组织和完整植物可由此再生,使用本领域熟知的方法和技术。随后再生植物通过常规方法再生且导入基因能通过常规植物育种技术转移到其它品系和栽培品种。下列例子阐述完成发明的方法并应理解为阐明而非限制发明范围,发明范围在附加权利要求中定义。实施例实施例l:植物组织发育和乙烯处理植物生长植物接种于盆中并在温室中生长4周。4周大的苗移植到单独盆中并在温室中生长2个月。植物在生长中每天浇2次水,水含150ppmNPK肥料。展开的绿叶与植物分离以进行下述乙烯处理。细胞系78379烟草品系78379是由肯塔基大学(UniversityofKentucky)发表的伯莱芋叶品系,用作植物物质来源。按烟草栽培领域标准培养100株植物并以不同数(1-100)移植和标记。施肥和田地管理如推荐进行。100株植物中四分之三将20和100%间的烟碱转变成降烟碱。100株植物中四分之一使小于5%的烟碱转变成降烟碱。植物号87转变最低(2%)而植物号21转变100%。转变小于3%的植物分类为非转变体。植物号87和植物号21的自花授粉种子以及杂交(21x87和87x21)种子用于研究遗传和表型差异。来自自花授粉21的植物是转变体,9讽来自87的自花授粉体是非转变体。来自87的其它1%显示低转变(5-15%)。来自正反交的植物都是转变体。细胞系4407烟草品系4407是用作植物物质来源的伯莱芋叶品系。选择统一和代表性的植物(100)并标记。100株植物中97株是非转变体且3株是转变体。植物号56转变量最低(1.2%)且植物号58转变水平最高(96%)。自花授粉种子和正反交种子用2种植物获得。来自自花授粉-58的植物以约3:1的转变体与非转变体比例分离。58-33和58-25分别鉴定为纯合转变体和非转变体植物品系。58-33的稳定转变通过分析其下一子代确定。乙烯处理过程绿叶从温室生长2-3个月的植物中分离并用0.3先乙烯溶液(Pr印牌乙烯磷(Rhone-Poulenc))喷淋。各喷涂叶悬于晾架,晾架装有增湿器且有塑料覆盖。在处理中,样品叶用乙烯溶液定期喷淋。乙烯处理后约24-48小时,收集叶用于RNA提取。取另一种小样品用于代谢构成分析以确定叶代谢物浓度和更特定的感兴趣构成如多种生物碱。例如,生物碱分析可如下进行。样品(O.lg)与0.5ml2NNa0H、5ml提取溶液在150rpin振荡,提取溶液含作为内部标准的喹啉及甲基t-丁基醚。样品在装有FID检测器的HP6890GC上分析。250°C的温度用于检测器和注射器。HP柱(30m-0.32nm-lm)由熔融石英组成,石英与5%苯酚和95%甲基硅交联,柱在110-185r的温度梯度以IO'C每分钟使用。柱在IO(TC以1.7cm3分钟-1的流速操作,分裂比例为40:1,注射体积为2.1,氦用作载体气体。实施例2:RNA分离对于RNA提取,来自2个月大温室生长植物的中等叶用所述乙烯处理。0和24-48小时样品用于RNA提取。在一些情况中,衰老过程下的叶样品取自去除头花序10天后的植物。这些样品也用于提取。总RNA用Rneasy植物小型试剂盒(Qiagen,Inc.,Valencia,California)遵循厂商操作分离。组织样品在液氮下研磨至精细粉末,使用DEPC处理的研钵和杵。约100mg碾碎的组织转移到无菌1.5ml离心管。此样品管置于液氮直到收集了所有样品。随后,试剂盒中提供的45(^1缓冲液RLT(加有e-巯基乙醇)加入各单独管。样品充分涡旋并在56'C孵育3分钟。然后裂解物应用到置于2-ml收集管中的QIAshredder旋转柱,以最高速离心2分钟。收集通过的流且0.5体积乙醇加入清澈裂解物中。样品较好的混合并转移到置于2-ml收集管中的Rneasy微旋转柱。样品以10,000rpm离心1分钟。接着,700nl缓冲液RW1吸到新收集管中的Rneasy柱上且以10,000rpm离心1分钟。再次加入缓冲液RPE到Rneasy旋转柱并以最高速离心2分钟以干燥膜。为去除任何乙醇携带,膜置于单独的收集管中且以最高速另外离心1分钟。Rneasy柱转移到新的1.5ml收集管,4(^1无RNA酶的水直接吸到Rneasy膜上。此终洗脱管以10,000rpm离心1分钟。总RNA的性质和量通过变性甲醛胶和分光光度计分析。多聚(A)RNA用Oligotex多聚ARNA纯化试剂盒(QiagenInc.)遵循厂商操作分离。使用250nl最大体积中的约200ng总RNA。250nl体积的缓冲液0BB和15plOligotex悬液加入250nl总RNA。通过抽吸充分混合内含物并在加热块上7(TC孵育3分钟。然后样品置于室温约20分钟。oligotex:mRNA复合体通过最高速离心2分钟来沉淀。除了50pl悬液,所有都从微离心管中取出。样品进一步用0BB缓冲液处理。0ligotex:mRNA沉淀通过涡旋重悬浮于400pl缓冲液0W2。此混合物转移到置于新管中的小旋转柱并以最高速离心1分钟。旋转柱转移到新管且另外加入40(Hd缓冲液0W2到柱中。随后管以最高速离心l分钟。旋转柱转移到最终的1.5ml微离心管。样品用60^1热(70C)缓冲液0EB洗脱。多聚A产物通过变性甲醛胶和分光光度计分析。实施例3:反转录-PCR第1条cDNA链用Superscript反转录酶遵循厂商操作(Invitrogen,Carlsbad,California)生成。多聚A丰富的RNA/寡dT引物混合物由少于5pg的总RNA、lpl10mMdNTP混合物、1^1寡(dT)12-18(0.5吗/pl)和多至10plDEPC-处理水组成。各样品在65'C孵育5分钟,然后置于冰上至少1分钟。制备反应混合物通过顺序加入下列各成分2^110XRT缓冲液、4^125mMMgC12、2^10.1MDTT和lpl去除RNA酶的重组RNA酶抑制剂。加入9^1反应混合物,吸到各RNA/引物混合物上并温和混合。它在42。C孵育2分钟且lnlS叩erScriptIIRT加入各管。管在42'C孵育5分钟。反应在72'C终止15分钟并在冰上冷冻。样品由离心收集,lplRNA酶H加入各管且在37'C孵育20分钟。完成第2次PCR用200皮摩尔正向引物(图75中的简并引物,SEQ.ID.149-156)和100皮摩尔反向引物(18个核苷酸寡d(T)的混合物,接着是l个随机碱基)。反应条件是94'C2分钟,随后进行40个PCR循环94°C1分钟、45到6CTC2分钟、72°C3分钟,72'C另外延伸IO分钟。扩增样品微升通过电泳用1%琼脂糖胶分析。正确大小的片段从琼脂糖胶纯化。实施例4:产生PCR片段群来自实施例3的PCR片段遵循厂商说明连接到pGEM-TEasy载体中(Promega,Madison,Wisconsin)。连接产物转化入JM109感受态细胞且在LB平板上培养用于蓝/白选择。选择菌落并在有1.2mlLB培养基的96孔板中37'C过夜生长。产生冷冻储存液用于所有选择的菌落。来自平板的质粒DNA用BeckmanBiomeck2000minipr印机器人技术和WizardSVMinipr印试剂盒(Promega)纯化。质粒DNA用lOOpl水洗脱并保存于96孔板。质粒用EcoRl消化且通过1%琼脂糖胶分析以确定DNA量和插入大小。含400-600bp插入的质粒用CEQ2000测序仪(Beckman,Fullerton,California)测序。序列用GenBank数据库通过BLAST检索比对。鉴定了P-450相关片段且进一步分析。实施例5:构建CDNA文库cDNA文库通过如下从乙烯处理叶中制备总RNA来构建。首先,总RNA提取自烟草品系58-33的乙烯处理叶,使用修改的酸性苯酚和氯仿提取操作。修改操作以使用l克组织,组织被研磨且随后在5ml提取缓冲液(100mMTris-HC1,pH8,5;200mMNaCl;lOmMEDTA;0.5SDS)中涡旋,缓冲液加入5ml苯酚(pH5.5)和5ral氯仿。离心提取样品,保存上清。此提取步骤再重复2-3次直到上清呈现清澈。加入约5ml氯仿以去除痕量苯酚。RNA从混合上清部分沉淀,这是通过加入3倍体积ETOH和1/10体积3MNa0Ac(pH5.2)并在-2(TC保存1小时。转移到Corex玻璃容器后,它在4r以9,000RPM离心45分钟。沉淀用70%乙醇洗,在4'C以9,000RPM旋转5分钟。沉淀干燥后,沉淀的RNA溶于0.5ml无RNA酶的水。总RNA的性质和量分别通过变性甲醛胶和分光光度计分析。所得总RNA通过下列操作分离多聚A+RNA,使用寡d(T)纤维素操作(Invitrogen)和微离心旋转柱(Invitrogen)。约20mg总RNA进行2次纯化以获得高质量多聚A+RNA。分析多聚A+RNA产物,通过变性甲醛胶和随后RT-PCR已知全长基因以确保高质量mRNA。另外,对来自乙烯处理非转变体叶、零小时乙烯处理转变体叶和乙烯处理转变体叶的多聚A+RNA进行Northern分析,使用全长p450作为探针。方法以厂商说明提供的操作(KPLRNA检测器Northern印迹试剂盒,Gaithersburg,Maryland)为基础,各样品使用1.8pg多聚A+RNA。含胶的RNA过夜转移,使用20XSSC作为转移缓冲液。其次,多聚A+RNA用作模板以生成cDNA文库,使用cDNA合成试剂盒、ZAP-cDNA合成试剂盒、ZAP-cDNAGigapackIII金克隆试剂盒(Stratagene,LaJolla,California)。方法包括遵循详细说明的厂商操作。约8网多聚A+RNA用于构建cDNA文库。分析初级文库显示约2.5X106-lX107pfu。文库的质量背景测试通过互补测定完成,使用IPTG和X-gal,其中重组斑以高于背景反应100倍表达。通过随机PCR定量分析文库显示插入cDNA的平均大小约为1.2kb。方法使用如下的两步骤PCR方法。对于第l个步骤,设计反向引物是以获得自P450片段的初步序列信息为基础。设计的反向引物和T3(正向)引物用于从cDNA文库扩增对应基因。PCR反应进行琼脂糖电泳,对应高分子量的带被切下、纯化、克隆和测序。在第2个步骤中,如正向引物从P4505'UTR或起始编码区设计的新引物与反向引物(从P4503,UTR设计)一起用于随后的PCR以获得全长P450克隆。P450片段通过PCR扩增从构建的cDNA文库中生成,如实施例3所述,除了反向引物不同。位于cDNA插入下游质粒的T7引物(见图5)用作反向引物。PCR片段被分离、克隆和测序,如实施例4所述。预期本领域技术人员在实践发明中会根据上述发明的详细说明作出许多修改和变化。结果,这些修改和变化包括在下列权利要求范围中。实施例6:确定克隆片段的特征-反向SOUTHERN印迹分析对上面例子中鉴定的所有P450克隆进行非放射性大规模反向southern印迹分析以检测差异表达。观察到不同P450簇间的表达水平很不同。对高表达的进行进一步实时检测。非放射性southern印迹过程如下进行。1)总RNA提取自乙烯处理转变体(58-33)和非转变体叶,使用QiagenRnaeasy试剂盒,如实施例2所述。2)探针通过生物素末端标记单链cDNA来生成,cDNA获得自上面步骤的多聚A丰富的RNA。产生此标记单链cDNA是通过RT-PCR转变体和非转变体总RNA(Invitrogen),如实施例3所述,除了使用生物素化的寡dT作为引物(Promega);这些用作探针以与克隆DNA杂交。3)质粒DNA用限制性酶EcoRl消化且跑琼脂糖胶。胶同时干燥并转至2张尼龙膜(BiodyneB)。1张膜与转变体探针杂交,另1张膜与非转变体探针杂交。杂交前UV-交联膜(自动交联设置,254nm,Stratagene,Stratalinker)。另外,插入从各质粒PCR扩增,使用位于p-GEM质粒、T3和SP6两臂的序列作为引物。PCR产物通过跑96孔现成(ready-to-run)琼脂糖胶分析。确认的插入点在2张尼龙膜上。l张膜与转变体探针杂交,另1张膜与非转变体探针杂交。4)杂交膜并遵循厂商说明洗,修改了洗的严格性(EnzoDiagnostics,Inc,Farmingdale,NY)。膜用杂交缓冲液(2xSSC缓冲甲酰胺,含去垢剂和杂交增强剂)在42'C预杂交30分钟且用1(^1变性探针在42'C杂交。随后膜在IX杂交洗涤缓冲液中室温洗1次10分钟和在65'C洗4次15分钟。膜可用于检测。5)检测洗过的膜,这是通过碱性磷酸酶标记,接着NBT/BCIP比色(?colometric)检测,如厂商检测过程所述(EnzoDiagnostics,Inc.)。膜用lx封闭溶液室温封闭1小时,用IX检测试剂洗3次10分钟,用lx预显色反应缓冲液洗2次5分钟,然后在显色溶液中显色印迹30-45分钟直到出现点。所有试剂由厂商提供(EnzoDiagnostics,Inc.)。在一些情况中,1步骤RT-PCR(Gibco试剂盒,Carlsbad,California)在来自非转变体(58-25)和转变体(58-33)系的总RNA上进行,使用特异于P-450片段的引物。比较RT-PCR如下进行1)提取来自乙烯处理转变体(58-33)和非转变体(58-25)植物叶的总RNA,如实施例2所述。2)来自总RNA的多聚(A)RNA用Qiagen试剂盒提取,如实施例2所述。3)1步骤RT-PCR用特异于克隆P-450的引物遵循厂商过程(Invitrogen)进行。多聚A丰富的RNA加入反应混合物,与之一起的是25nl2X反应混合物、1^110mM正义引物、1^110^M反义引物、lplRT/Platinumtaq混合物和补至50^1的水。反应条件是5(TC20分钟,随后94。C2分钟,进行40个PCR循环94°C30秒、55'C30秒、70'C1分钟,72'C另外延伸10分钟。10微升扩增样品通过电泳用1%琼脂糖胶分析。实施例7:确定克隆片段的特征-NORTHERN印迹分析除了Southern印迹分析,杂交一些膜并如Northern印迹分析的例子所述来检测。Northern杂交用于如下检测烟草中差异表达的mRNA。第1步,探针制备随机引物方法用于从克隆p450DNA片段中制备探针(随机引物DNA生物素化的试剂盒,KPL)。混合下列成分0.5网DNA模板(在水浴中煮沸5-10分钟且使用前冰上冷冻);1X随机引物溶液;1XdNTP混合物;10单位Klenow和水加入以使反应达到50pl。混合物在37'C孵育1-4小时。反应用2^1200mMEDTA终止。探针通过在使用前95。C孵育5分钟来变性。第2步,样品制备RNA样品制备自乙烯处理和非处理的新鲜叶及衰老叶。在一些情况中,使用多聚A丰富的RNA。约15pg总RNA或1.8吗mRNA(RNA和mRNA的提取方法描述于实施例5)用DEPCH20(5-l(^l)变成等体积。加入相同体积的上样缓冲液(lxM0PS;18.5%甲醛;50%甲酰胺;4%Ficoll400;溴酚蓝)和0.5^1EtBr(0.5pgAi1)。样品在9(TC加热5分钟,冰上冷冻。第3步,通过电泳分离RNA:样品在甲醛胶(1%琼脂糖,lxM0PS,0.6M甲醛)上进行电泳,用1XM0P缓冲液(0.4M吗啉代丙垸磺酸;0.1M乙酸钠-3xH20;10mMEDTA;用Na0H调至pH7.2)。RNAs转至Hybond-N+膜(尼龙,AmershamPharmaciaBiotech),这是通过毛细管方法在10XSSC缓冲液(1.5MNaCl;0.15柠檬酸钠)中转移。有RNA样品的膜在杂交前UV-交联(自动交联设置,254nm,Stratagene,Stratalinker)。第4步,杂交膜用5-10ml预杂交缓冲液(5xSSC;50%甲酰胺;5xDenhardt溶液;1%SDS;100Hg/ml热变性剪切的非同源DNA)在42'C预杂交1-4小时。弃去旧的预杂交缓冲液,加入新的预杂交缓冲液和探针。杂交在42。C过夜完成。膜用2xSSC室温洗15分钟,接着用2xSSC、0.1%SDS在65。C洗2次,最后用0.lxSSC洗,或用O.1SDS在65'C再洗(任选)。第5步,检观ij:AP-链霉抗生物素蛋白和CDP-Star用于检测杂交信号(KPLDNA检测器Northern印迹试剂盒)。膜用IX检测器封闭溶液室温封闭30分钟。弃去封闭缓冲液且膜在有1:10,000AP-SA的新IX检测器封闭溶液中室温孵育1小时。膜在IX磷酸酶洗液中洗3次,接着用IX磷酸酶测定缓冲液洗2次。信号用CDP-Star化学发光底物检测。湿的膜在莎伦TM包装膜下对X光胶片曝光。分析结果并记录。发明的主要焦点是发现了新基因,基因可由乙烯处理而导入或在烟草叶性质和构成中发挥关键作用。如下表所示,Northern印迹用于确定相对非诱导植物,哪些基因被乙烯处理诱导。有趣的是,不是所有片段在转变体和非转变体中所受影响类似。部分测序感兴趣的细胞色素P450片段以确定它们的结构相关性。此信息用于随后分离和测序全长基因克隆。用下调方法的功能分析在有片段基因的完整植物中进行。<table>tableseeoriginaldocumentpage22</column></row><table>实施例8:分离核酸片段的核酸同一性和结构相关性超过100个克隆P450片段结合Northern印迹分析测序以确定它们的结构相关性。所用方法使用正向引物,引物以位于P450基因羧基末端附近的2个共同P450基序之一为基础。正向引物对应于细胞色素P450基序FXPERF或GRRXCP(A/G),如图1所示。反向引物使用来自质粒或多聚A尾部的标准引物,质粒SP6或T7位于pGEM质粒两臂。所用操作如下所述。分光光度测定法用于估计起始双链DNA浓度,遵循厂商操作(BeckmanCoulter)。模板用水稀释到合适浓度,95'C加热2分钟来变性,随后置于冰上。测序反应在冰上准备,使用0.5到10pl变性DNA模板、2^11.6皮摩尔正向引物、8^1DTCSQuickStartMaster混合物,总体积用水加至20pl。热循环程序由30个下列循环组成96°C20秒,5(TC20秒,60'C4分钟,接着保持于4。C。终止序列通过加入5^1终止缓冲液(等体积3MNaOAc和100mMEDTA和1^120mg/ml糖原)。样品用6(^1冷的95%乙醇沉淀并在6000g离心6分钟。弃乙醇。沉淀用200^1冷的70%乙醇洗。沉淀干燥后,加入40plSLS溶液且重悬浮沉淀。覆盖一层矿物油。随后样品置于CEQ8000自动测序仪上用于进一步分析。为检验核酸序列,核酸序列以2个方向重测序,使用相对P450基因FXPERF或GRRXCP(A/G)区的正向引物和相对质粒或多聚A尾部的反向引物。所有测序以2向方面至少进行2次。相互比较细胞色素P450片段核酸序列的编码区,编码区对应于编码GRRXCP(A/G)基序的区后第一个核酸到终止密码子。选择此区作为P450蛋白间遗传多样性的指示。观察到大量遗传不同的P450基因类似于其它植物属的基因,超过70个基因。在比较核酸序列上,发现基因可在其序列同一性基础上置于不同序列组。发现P450成员的最佳独特分组确定为核酸同一性为75%或更高的序列(示于表1)。减少同一性百分比产生显著更大的组。对核酸同一性为81%或更高的序列观察到优选分组,更优选分组为91%核酸同一性或更高,最优选分组为99%核酸同一性或更高。大部分组包含至少2个成员且常为3个或多个成员。没有重复发现其它,暗示采用的方法能分离所用组织中的低和高表达mRNA。在75%核酸同一性或更高的基础上,发现2个细胞色素P450组包含相对前面烟草细胞色素基因的核酸序列同一性,烟草细胞色素基因与组间基因在遗传上不同。组23分别显示与前面Czernic等的GenBank序列GI:1171579(CAA64635)和Ralston等的GI:14423327(或AAK62346)的核酸同一性,在表I所用参数内。GI:1171579与组23成员的核酸同一性范围从96.9%到99.5%,而GI:14423327与此组的同一性范围从95.4%到96.9%。组31成员与Ralston等报导的GenBank序列GI:14423327(AAK62346)的核酸同一性范围从76.7%到97.8%。没有其它表1的P450同一性组包含相对烟草P450s基因的参数同一性,如表1所用,烟草P450s基因由Ralston等、Czernic等、Wang等或LaRosa和Smigocki报导。如图76所示,能获得具适当核酸简并探针的共有序列,用于组以优选鉴定和分离来自烟草植物各组的另外成员。表I:烟草P450核酸序列同一性组组片段_1D58-BG7(SEQIDNO.:1),D58-ABl(SEQIDNO.:3),D58-BE4(SEQIDNO.:7)2D56-AH7(SEQIDNO.:9);D13a-5(SEQIDNO.:11)3D56-AG10(SEQIDNO.:13);D35-33(SEQIDNO.:15);D34-62(SEQIDNO.:17)4D56-AA7(SEQIDNO.:19);D56-AEl(SEQIDNO.:21);185-BD3(SEQIDNO.:143)5D35-BB7(SEQIDNO.:23);D177-BA7(SEQIDNO.:25);D56A-AB6(SEQIDNO.:27);D144-AE2(SEQIDNO.:29)6D56-AG11(SEQIDNO.:31);D179-Ml(SEQIDNO.:33)7D56-AC7(SEQIDNO.:35);D144-AD1(SEQIDNO.:37)8D144-AB5(SEQIDNO.:39)9D181-AB5(SEQIDNO.:41);D73-Ac9(SEQIDNO.:43)10D56-AC12(SEQIDNO.:45)11D58-AB9(SEQIDNO.:47);D56-AG9(SEQIDNO.:49);D56-AG6(SEQIDNO.:51);D35-BG11(SEQIDNO.:53);D35-42(SEQIDNO.:55);D35-BA3(SEQIDNO.:57);D34-57(SEQIDNO.:59);D34-52(SEQIDNO.:61);D34-25(SEQIDNO,:63)12D56-ADIO(SEQIDNO.:65)1356-Mil(SEQIDNO.:67)14D177-BD5(SEQIDNO.:69);D177-BD7(SEQIDNO.:83)15D56A-AGIO(SEQIDNO.:71);D58-BC5(SEQIDNO.:73);D58-AD12(SEQIDNO.:75)16D56-ACll(SEQIDNO.:77);D35-39(SEQIDNO.:79);D58-BH4(SEQIDNO.:81);D56-AD6(SEQIDNO.:87)17D73A-AD6(SEQIDNO.:89);D70A-BAll(SEQIDNO.:91〉;D70A-BB5(SEQIDNO,:93)18D70A-AB5(SEQIDNO.:95);D70A-M8(SEQIDNO.:97)19D70A-AB8(SEQIDNO.:99);D70A-BH2(SEQIDNO.:101);D70A—AA4(SEQIDNO.:103)20D70A-BAl(SEQIDNO.:105);D70A-BA9(SEQIDNO.:107);D176-BG2(SEQIDNO.:141)21D70A-BD4(SEQIDNO.:109)22D18卜AC5(SEQIDNO.:111);D144-AHl(SEQIDNO.:113);D34-65(SEQIDNO.:115)23D35-BG2(SEQIDNO.:117)24D73A-AH7(SEQIDNO.:119)25D58-AA1(SEQIDNO.:121);D185-3C1(SEQIDNO.:133);D185-BG2(SEQIDNO.:135)26D73-AE10(SEQIDNO.:123)27D56-AC12(SEQIDNO.:125)28D177-BF7(SEQIDNO.:127);D185-BE1(SEQIDNO.:137);185-BD2(SEQIDNO.:139)29D73A-AG3(SEQIDNO.:129)30D70A-AA12(SEQIDNO.:131):D176-BF2(SEQIDNO.:85)31D176-BC3(SEQIDNO.:145)32D176-BB3(SEQIDNO.:147)33D186-AH4(SEQIDNO.:5)实施例9:分离核酸片段的氨基酸序列同一性推断来自实施例8细胞色素P450片段核酸序列的氨基酸序列。推断区对应于GXRXCP(A/G)序列基序后紧接的氨基酸到羧基末端或终止密码子。在比较片段序列同一性上,对氨基酸同一性为70%或更高的序列观察到独特分组。对氨基酸同一性为80%或更高的序列观察到优选分组,更优选90%氨基酸同一性或更高,最优选分组为99%氨基酸同一性或更高。组和组成员的对应氨基酸序列示于图2。发现一些独特核酸序列与其它片段有完全的氨基酸同一性,因此仅报导了1个有相同氨基酸的成员。表II组19的氨基酸同一性在其核酸序列基础上对应于3个不同组。各组成员的氨基酸序列和其同一性示于图77。氨基酸区别被适当标记。各氨基酸同一性组的至少1个成员被选择用于基因克隆和使用植物的功能研究。另外,受乙烯处理影响不同的组成员或其它由Northern和Southern分析评估的生物差异被选择用于基因克隆和功能研究。为协助基因克隆,表达研究和完整植物评估、肽特异抗体在序列同一性和差异序列基础上制备。表II:烟草P450氨基酸序列同一性组组片段_1D58-BG7(SEQIDNO.:2),D58-AB1(SEQIDNO.:4)2D58-BE4(SEQIDNO.:8)3D56-AH7(SEQIDNO.:10);D13a-5(SEQIDNO.:12)4D56-AGIO(SEQIDNO.:14);D34-62(SEQIDNO.:18)5D56-AA7(SEQIDNO.:20);D56-AE1(SEQIDNO.:22);185-BD3(SEQIDNO.:144)6D35-BB7(SEQIDNO.:24);D177-BA7(SEQIDNO.:26);D56A-AB6(SEQIDNO.:28);D144-AE2(SEQIDNO.:30)7D56-AGll(SEQIDNO.:32);D179-AAl(SEQIDNO.:34)8D56-AC7(SEQIDNO.:36);D144-ADl(SEQIDNO.:38)9D144-AB5(SEQIDNO.:40)10D181-AB5(SEQIDNO.:42);D73-Ac9(SEQIDNO.:44)11D56-AC12(SEQIDNO.:46)12D58-AB9(SEQIDNO.:48);D56-AG9(SEQIDNO.:50);D56-AG6(SEQIDNO.:52);D35-BG11(SEQIDNO.:54);D35-42(SEQIDNO,:56);D35-BA3(SEQIDNO.:58);D34-57(SEQIDNO.:60);D34-52(SEQIDNO.:62)13D56AD10(SEQIDNO.:66)1456-Mil(SEQIDNO.:68)15D177-BD5(SEQIDNO.:70);D177-BD7(SEQIDNO.:84)16D56A-AGIO(SEQIDNO.:72);D58-BC5(SEQIDNO.:74);D58-AD12(SEQIDNO,:76)17D56-ACll(SEQIDNO.:78);D56-AD6(SEQIDNO.:88)18D73A-AD6(SEQIDNO.:90);D70A-BB5(SEQIDNO.:94)19D70A-AB5(SEQIDNO.:96);D70A-AB8(SEQIDNO.:100);D70A-BH2(SEQIDNO.:102);D70A-AA4(SEQIDNO.:104);D70A-BAl(SEQIDNO.:106);訓A-BA9(SEQIDNO.:108);D176-BG2(SEQIDNO.:142)20D70A-BD4(SEQIDNO.:110)21D181-AC5(SEQIDNO.:112);D144-AH1(SEQIDNO.:114);D34-65(SEQIDNO.:116)22D35-BG2(SEQIDNO.:118)23D73A-AH7(SEQIDNO,:120)24D58-AA1(SEQIDNO.:122);D185-BCl(SEQIDNO.:134);D185-BG2(SEQIDNO.:136)25D73-AEIO(SEQIDNO.:124)26D56-AC12(SEQIDNO.:126)27D177-BF7(SEQIDNO.:128);185-BD2(SEQIDNO.:140)28D73A-AG3(SEQIDNO.:130)29D70A-AA12(SEQIDNO.:132);D176-BF2(SEQIDNO.:86)30D176-BC3(SEQIDNO.:146)31D176-BB3(SEQIDNO.:148)32D186-AH4(SEQIDNO.:6)实施例10:克隆全长cDNAP450克隆cDNA文库通过如下从乙烯处理叶中制备总RNA来构建。首先,总RNA提取自乙烯处理叶,使用修改的酸性苯酚和氯仿提取操作。修改操作以使用1克组织,组织被研磨且随后在5ml提取缓冲液(100mMTris-HCl,pH8.5;200raMNaCl;10mMEDTA;0.5%SDS)中涡旋,缓冲液加入5ml苯酚(pH5.5)和5ml氯仿。离心提取样品,保存上清。此提取步骤再重复2-3次直到上清呈现清澈。加入约5ml氯仿以去除痕量苯酚。RNA从混合上清部分沉淀,这是通过加入3倍体积ETOH和1/10体积3MNaOAc(pH5.2)并在-2(TC保存1小时。转移至ljCorex玻璃容器后,它在4'C以9,000RPM离心45分钟。沉淀用70%乙醇洗,在4'C以9,000RPM旋转5分钟。沉淀干燥后,沉淀的RNA溶于0.5ml无RNA酶的水。总RNA的性质和量分别通过变性甲醛胶和分光光度计分析。所得总RNA通过下列操作分离多聚A+RNA,使用寡d(T)纤维素操作(Invitrogen)和微离心旋转柱(Invitrogen)。约20mg总RNA进行2次纯化以获得高质量多聚A+RNA。分析多聚A+RNA产物,通过变性甲醛胶和随后RT-PCR已知全长基因以确保高质量mRNA。另外,对来自乙烯处理非转变体叶、零小时乙烯处理转变体叶和乙烯处理转变体叶的多聚A+RNA进行Northern分析,使用全长p450作为探针。方法以厂商说明提供的操作(KPLRNA检测器Northern印迹试剂盒)为基础,各样品使用1.8pg多聚A+RNA。含胶的RNA过夜转移,使用20XSSC作为转移缓冲液。其次,多聚A+RNA用作模板以生成cDNA文库,使用cDNA合成试剂盒、ZAP-cDNA合成试剂盒、ZAP-cDNAGigapackIII金克隆试剂盒(Stratagene)。方法包括遵循详细说明的厂商操作。约8ng多聚A+RNA用于构建cDNA文库。分析初级文库显示约2.5X106-lX107pfu。文库的质量背景测试通过a-互补完成,使用IPTG和X-gal,其中重组斑以高于背景反应100倍表达。通过随机PCR更定量分析文库显示插入cDNA的平均大小约为1.2kb。方法使用如下的两步骤PCR方法。对于第l个步骤,设计反向引物是以获得自P450片段的初步序列信息为基础。设计的反向引物和T3(正向)引物用于从cDNA文库扩增对应基因。PCR反应进行琼脂糖电泳,对应高分子量的带被切下、纯化、克隆和测序。在第2个步骤中,如正向引物从P4505,UTR或起始编码区设计的新引物与反向引物(从P4503'UTR设计)一起用于随后的PCR以获得全长p450克隆。全长p450基因通过PCR方法从构建的cDNA文库中分离。2个PCR步骤用于克隆全长基因。在第1个PCR步骤中,非特异反向引物(T3)和特异正向引物(产生自P450s下游序列)用于从cDNA文库克隆P450s的5'末端。PCR片段被分离、克隆和测序,用于设计下一步PCR的正向引物。2个特异引物用于在第2个PCR步骤中克隆全长p450克隆。随后测序克隆。预期本领域技术人员在实践发明中会根据上述发明的详细说明作出许多修改和变化。结果,这些修改和变化包括在下列权利要求范围中。权利要求1.一种分离的核酸分子,其特征在于,所述核酸分子包括的核酸序列选自SEQ.ID.1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147或149。2.如权利要求1所述的分离核酸分子,其特征在于,所述核酸分子包括细胞色素P450基因的片段。3.—种分离的核酸分子,其特征在于,所述核酸分子与权利要求1所述的核酸分子有至少75%的同一性。4.一种分离的核酸分子,其特征在于,所述核酸分子与权利要求1所述的核酸分子有至少91%的同一性。5.—种分离的核酸分子,其特征在于,所述核酸分子与权利要求1所述的核酸分子有至少99%的同一性。6.—种转基因植物,其特征在于,所述转基因植物包括权利要求l、2、3、4或5所述的核酸分子。7.如权利要求1所述的转基因植物,其特征在于,所述植物是烟草植物。8.—种制造转基因植物的方法,其特征在于,所述方法包括以下步骤-(i)将权利要求1、2、3、4或5所述核酸分子与所述植物中有功能的启动子可操作连接以产生植物转化载体;和(ii)用步骤(i)的所述植物的转化载体转化所述植物;(iii)选择被所述转化载体转化的植物细胞;以及(iv)从步骤(m)的所述植物细胞再生植物。9.如权利要求8所述的方法,其特征在于,所述核酸分子为反义方向。10.如权利要求8所述的方法,其特征在于,所述核酸分子为正义方向。11.如权利要求8所述的方法,其特征在于,所述核酸分子是以RNA干扰方向。12.如权利要求11所述的方法,其特征在于,所述核酸分子表达为双链RNA分子。13.如权利要求11所述的方法,其特征在于,所述双链RNA分子长度约为15到25个核苷酸。14.如权利要求8所述的方法,其特征在于,所述植物是烟草植物。15.—种选择含核酸分子的植物的方法,其特征在于,分析所述植物核酸序列的存在情况,其中所述核酸序列选自SEQ.ID.l、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145或147。16.如权利要求15所述的选择植物的方法,其特征在于,所述植物通过DNA杂交分析。17.如权利要求15所述的选择植物的方法,其特征在于,所述植物通过PCR检测分析。18.如权利要求16所述的方法,其特征在于,所述DNA杂交包括核酸探针,所述核酸探针选自SEQ.ID.l、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145或147。19.如权利要求15所述的选择植物方法,其特征在于,所述植物是转基因植物。20.如权利要求15所述的选择植物方法,其特征在于,所述植物选自突变群体。21.如权利要求15所述的选择植物方法,其特征在于,所述植物选自繁殖种群。全文摘要本发明涉及烟草的P450酶和编码P450酶的核酸序列以及使用这些酶和核酸序列来改变植物表型的方法。文档编号A01H1/00GK101166824SQ03805747公开日2008年4月23日申请日期2003年3月12日优先权日2002年3月12日发明者D·徐申请人:美国无烟烟草公司