专利名称:具有改变的生长特征的植物及其制备方法
技术领域:
本发明涉及的是改变植物生长特征的方法。更具体地,本发明涉及的是通过改变植物中seedyl核酸的表达和/或seedyl蛋白的水平和/或活性,改变植物生长特征的方法。本发明还涉及相对于相应的野生型植物具有改变的生长特征、改变的seedyl核酸表达和/或改变的seedyl蛋白水平和/或活性的植物。
背景技术:
不断增加的世界人口以及用于农业的可耕种土地供应的减少推动了提高农业效率的研究。用于作物和园艺改良的传统方法使用选择性育种技术确定具有合意特征的植物。但是,这种选择性育种技术具有几个缺点,即这些技术通常是劳动密集型的,产生的植物通常含有异源遗传组分,这些遗传组分不一定总是能够导致从亲本植物向后代传递合意性状。分子生物学的进展使人类能够对动物和植物的种质进行改变。植物的遗传工程需要对遗传物质(通常是以DNA或RNA的形式)进行分离和操作,接下来将该遗传物质引入植物中。这种技术能够提供具有各种不同的改良的经济、农艺或园艺性状的作物或植物。产量是一种具有特别经济意义的性状。产量通常定义为自作物产生的可测量的经济价值。这可以用量和/或质来确定。不仅仅可以通过抵御作物或植物通常经受的胁迫,而且还可以通过改变植物的固有生长特征,提高作物产量。产量直接取决于几个生长特征,例如,生长速率、生物量的生产、植物的构造、器官的数目和大小(例如分支、分蘖、茎、花的数目)、种子的生产等等。根的发育和营养物质的摄取可能也是确定产量的重要的因素。
改变一种或者多种植物生长特征的能力在作物改进、植物育种、装饰植物的生产、树木栽培、园艺、林学、藻类或植物的生产等领域有许多应用(例如用作生物反应器、用于药物、抗体或疫苗等物质的生产,或者用于有机废物的生物转化或者对于高产量的藻类和植物而言用作燃料)。
发明内容
现在已经发现在植物中改变seedyl核酸的表达和/或改变植物中seedyl蛋白的水平和/或活性可以产生相对于相应的野生型植物具有改变的生长特征的植物。
这里seedyl蛋白质定义为从N端到C端按照以下顺序包含下列各项的蛋白质(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
seedyl核酸/基因在这里定义为编码seedyl蛋白的核酸或基因。术语“seedyl基因”、“seedyl核酸”和“编码seedyl蛋白的核酸”在这里可以交换使用。正如这里定义的,术语seedyl核酸/基因还包括该序列的互补序列以及相应的RNA、DNA、cDNA或基因组DNA。seedyl核酸可以全部或者部分合成,它可以是双链核酸或者单链核酸。该术语还包括由于遗传密码子的简并性产生的变体以及被一个或多个间插序列中断的变体。
seedyl核酸/基因或者seedyl蛋白质可以是野生型的,即天然或者内源核酸或蛋白质。该核酸可以来自相同或不同的物种,该核酸通过例如转化作为转基因引入。通过有意的人工操作,可以使该基因在组成和/或基因组环境方面与其天然形式相比有显著改变。因此只要核酸在植物中表达时导致改变的植物生长特征,该核酸可以来自任何来源(或者直接或者间接(如果接下来被改变的话))。核酸可以从微生物来源例如细菌、酵母或者真菌中,或者从植物、藻类、昆虫或者动物(包括人)来源中分离。优选地,seedyl核酸分离自植物。该核酸可以从双子叶植物物种中分离,优选来自茄科(Solanaceae),更优选来自烟草属(Nicotiana)。更为优选地,seedyl核酸编码如以上描述的seedyl蛋白。最优选地,seedyl核酸是SEQ ID NO1或者其一部分表示的核酸,或者是能够与SEQ ID NO1表示的序列杂交的核酸,或者是编码SEQ ID NO2表示的氨基酸或者其同源衍生物或者其活化片段的核酸,其中的同源物与SEQ ID NO 2表示的序列具有至少20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%98%或者99%的序列一致性,优选的级别随一致性的增加而增加。
本发明提供了改变植物生长特征的方法,包括改变植物中seedyl蛋白的编码核酸的表达和/或改变植物中seedyl蛋白的水平和/或活性,其中所述的seedyl蛋白从N端到C端按照以下顺序包含下列各项(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,其中的生长特征相对于相应野生型植物的生长特征被改变。
本发明还提供了迄今未知的seedyl蛋白,该seedyl蛋白从N端到C端按照以下顺序包含下列各项(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,条件是seedyl蛋白不是保存于GenBank中具有NCBI登录编号AL161572的拟南芥属(Arabidopsis)蛋白(SEQ ID NO 12)。
根据特定的实施方案,根据SEQ ID NO15的基序是由(P/X)X((V/L/H)(Q/H)(V/I)W(N/X)NA(A/P)(F/C)D表示的基序,其中X可以是任何氨基酸,且其中(P/X)优选是P或者是A或T或Q或者另一种氨基酸(V/L/H)优选是V或L或H(Q/H)是Q或H(V/I)是V或者是T或S或者另一种氨基酸(A/P)优选是A或者是P(F/C)优选是F或者是C。
根据特定的实施方案,根据SEQ ID NO 17的基序是由(I/V/A)(D/E)XE(I/M)XX(I/V)(E/Q)XE(I/X)XRL(S/X)(S/X)(R/K)LXXLR(L/V/T/I)X(K/Q)表示的基序,其中X可以是任何氨基酸,且其中(I/V/A)优选是I或V或者是A(D/E)是D或E(I/M)优选是I或者是M(I/V)优选是I或者是V
(E/Q)优选是E或者是Q(I/X)优选是I或者是M或者是V或者任何其他氨基酸(S/X)优选是S或者是T或者任何其他氨基酸(S/X)优选是S或者是T或L或I或A(R/K)优选是R或者是K(L/V/T/I)优选是L或T或V或I(K/Q)优选是K或Q且该基序是卷曲螺旋基序。
根据特定的实施方案,根据SEQ ID NO 18的基序是由LP(R/K)I(R/X)(T/I)(M/X)(P/R)XX(D/X)(E/G)(S/T)(P/L)RDSG(C/X)(A/X)KR(V/X)(A/I)(D/E)(L/R)(V/X)(G/A)K表示的基序,其中X可以是任何氨基酸,且其中(R/K)是R或K(R/X)优选是R或者是S或K(T/I)优选是T或是I(M/X)优选是M或L或A或V(P/R)是P或R(D/X)优选是D或者是G或T或N(E/G)优选是E或者是G(S/T)优选是S或者是T(P/L)优选是P或者是L(C/X)优选是C或者是P或A(A/X)优选是A或者是V或I(A/I)优选是A或是I(D/E)是D或E(L/R)优选是L或者是R(V/X)优选是V或者是Q或N或I(G/A)优选是G或者是A。
本发明还提供了迄今未知的分离的seedyl核酸/基因,其选自(i)SEQ ID NO1,5或7中的任何一个表示的核酸或者上述任何一个的互补核酸;(ii)SEQ ID NO2,4,6,8或10表示的氨基酸序列的编码核酸;(iii)上述(i)或(ii)的同源物、衍生物或者活性片段的编码核酸;(iv)能够与上述(i)、(ii)或(iii)的核酸杂交的核酸;(v)由于遗传密码的原因而与上述(i)到(iv)中任何一个核酸简并的核酸;(vi)属于上述(i)到(v)中任何一个核酸的等位变体的核酸;(vii)属于上述(i)到(vi)中任何一个核酸的可变剪接变体的核酸;(viii)与上述(i)到(vii)中定义的任何一个或多个序列具有至少21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,60%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%(优选的级别随一致性的增加而增加)序列一致性的蛋白质的编码核酸。
(ix)根据上述(i)到(viii)任何一项的核酸的一部分;其中上述(i)到(ix)的核酸编码如上定义的seedyl蛋白,条件是该分离的核酸不是保存于GenBank中具有登录编码AK063941的稻cDNA(SEQ ID NO 3)、以AC144618,AC139356,AC144482或AC135566保存的苜蓿属植物(Medicago)BAC克隆、以AL61572保存的拟南芥属植物(Arabidopsis)cDNA(SEQ ID NO 11)或者以AY108162保存的玉蜀黍(Zea mays)EST(SEQ ID NO 9)。
可以通过在特定的细胞或组织中改变基因的表达和/或改变基因产物(即,多肽)的活性和/或水平,实现对seedyl核酸表达的改变和/或对seedyl蛋白的活性和/或水平的改变。如这里所使用的,术语“改变”(在改变表达、活性和/或水平的上下文中)指的是增加、降低或者时间或地点的改变。所述的seedyl基因或蛋白质的改变的表达、活性和/或水平与相应的野生型植物中seedyl基因或蛋白质的表达、活性和/或水平相比是改变的。改变的基因表达可以由内源seedyl基因的表达水平改变所致和/或可以由于引入植物中的seedyl基因的表达水平改变所致。类似地,seedyl蛋白质的水平和/或活性可以由于内源seedyl核酸/基因的表达改变和/或由于引入植物中的seedyl核酸/基因的表达改变而被改变。可以通过提高Seedyl蛋白质自身的水平来提高seedyl蛋白的活性。在seedyl蛋白水平没有任何提高甚至seedyl蛋白水平下降的情况下活性也可以被提高。当多肽的固有性质被改变时(例如通过制备比野生型更具活性的突变体)这种情况就可能出现。突变可以导致蛋白质构象的改变,从而导致蛋白质活性和/或水平更高。可以通过例如引入遗传改变(优选在seedyl基因座处)实现基因/核酸表达的改变和/或基因产物/蛋白质的活性和/或水平的改变。如这里所定义的,基因的基因座指的是包括目标基因以及编码区域上或下游10kb的基因组区域。
可以通过例如以下方法的任何一个(或多个)引入遗传改变TDNA激活,TILLING、定点诱变、同源重组,或者在植物中引入和表达编码seedyl蛋白或者其同源物、衍生物或者活化片段的核酸。在引入遗传改变之后,接着是对seedyl蛋白表达和/或活性和/或水平的增加的筛选,其中所述表达和/或活性和/或水平的增加导致产生具有改变的生长特征的植物。
T-DNA激活标签(Hayashi et al.Science(1992)1350-1353)涉及将通常含有启动子(也可以是翻译增强子或者内含子)的T-DNA插入到目标基因或者基因编码区域上或下游10kb的基因组区域中,插入方式使启动子指导所述靶基因的表达。通常靶基因天然启动子对靶基因表达的调控被破坏,基因受到新引入的启动子的控制。启动子通常被嵌入T-DNA中。该T-DNA通过例如农杆菌(Agrobacterium)感染随机插入植物基因组中,使靠近该插入的T-DNA的基因过表达。产生的转基因植物由于靠近该引入的启动子的基因的过表达而表现出显性表型。要引入的启动子可以是任何能够指导基因在期望生物体(在本例中是植物)中表达的启动子。例如,组成型的、组织偏好的、细胞类型偏好的以及诱导型的启动子都适宜用于T-DNA激活。
还可以使用TILLING技术(在基因组中定向诱导局部损伤))在seedyl基因的基因座中引入遗传改变。这是一种诱变技术,它可用于seedyl核酸的诱变变体的产生和/或鉴定以及分离中。TILLING还允许对携带这种突变变体的植物进行筛选。与处于天然形式的基因相比,这些突变体可以甚至表现出更高的seedyl活性。TILLING将高密度诱变与高通量筛选方法组合在一起。TILLING通常的步骤是(a)EMS诱变(Redei and Koncz,1992;Feldmann et al.,1994;Lightner andCaspar,1998);(b)个体的DNA制备和合并;(c)目标区域的PCR扩增;(d)变性和退火形成异源双链;(e)DHPLC,其中合并物中存在的异源双链作为色谱图中额外的峰被检测出来;(f)鉴定突变体个体;以及(g)对突变体PCR产物进行测序。TILLING的方法在本领域内是众所周知的(McCallum Nat Biotechnol.2000 Apr;18(4)455-7,综述见Stemple 2004(TILLING--a high-throughput harvest forfunctional genomics.Nat Rev Genet.2004 Feb;5(2)145-50.))。
可以使用定点诱变产生seedyl核酸或者其部分的变体。有几种方法实现定点诱变;最为常见的方法是基于PCR的方法(currentprotocols in molecular biology.Wiley Eds.http://www.4ulr.com/products/currentprotocols/index.html)。
TDNA激活、TILLING和定点诱变是能够产生在本发明的方法中有用的新等位基因和seedyl核酸变体的技术的示例。
同源重组可以将选定的核酸引入基因组中规定的选定位置。同源重组是在生物科学中常规用于低等生物体例如酵母或苔藓(例如剑叶藓属(physcomitrella))的标准技术。在植物中进行同源重组的方法不仅仅在模式植物中有所描述(Offringa et al.Extrachromosomalhomologous recombination and gene targeting in plant cellsafter Agrobacterium-mediated transformation,1990 EMBO J.1990Oct;9(10)3077-84),而且对于作物植物,例如稻也有所描述(Terada R,Urawa H,Inagaki Y,Tsugane K,Iida S.Efficient genetargeting by homologous recombination in rice.Nat Biotechnol.2002.Iida and TeradaA tale of two integrations,transgeneand T-DNAgene targeting by homologous recombination in rice.Curr Opin Biotechnol.2004 Apr;15(2)132-8)。靶核酸不必被定向到seedyl基因的基因座,而可以引入到例如高表达的区域。靶核酸可以是用于替代内源基因的改良的等位基因或者可以在内源基因之外另外引入。
引入遗传改变的优选方法是在植物中引入和表达seedyl核酸/基因或者其一部分,或者能够与seedyl核酸/基因杂交的序列,其中所述核酸编码seedyl蛋白或者其同源物、衍生物或者活性片段。在本例中,遗传改变不必位于seedyl基因的基因座中。核酸可以通过例如转化引入植物中。
因此,本发明提供了改变植物生长特征的方法,包括在植物中引入和表达seedyl核酸/基因或者其一部分,或者能够与seedyl核酸/基因杂交的序列,其中该核酸编码seedyl蛋白或者其同源物、衍生物或者活性片段。
有利地,还可以分别使用SEQ ID NO 1或2的变体核酸和变体氨基酸实施根据本发明的方法。术语seedyl核酸或者seedyl蛋白质包括了变体核酸和变体氨基酸。变体核酸编码如上描述的seedyl蛋白,即那些从N端到C端按照以下顺序包含下列各项的蛋白(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,变体seedyl蛋白质是那些从N端到C端按照以下顺序包含下列各项的蛋白(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
在实施根据本发明的方法时有用的适宜变体核酸以及氨基酸序列包括(i)seedyl核酸/基因的部分;(ii)能够与seedyl核酸/基因杂交的序列;(iii)seedyl核酸/基因的可变剪接变体;(iv)seedyl核酸/基因的的等位变体;(v)seedyl蛋白的同源物、衍生物以及活性片段。
变体seedyl核酸的示例是seedyl核酸的部分。可以有利地使用seedyl核酸的功能部分实施根据本发明的方法。部分指的是从原始(较大的)DNA分子制备或者来源的DNA片段,该DNA部分在引入植物中并表达后使植物具有改变的生长特征,且该部分编码如上描述的seedyl蛋白。该部分可以包含许多基因,并含有或者不含有其他控制元件或者可以含有间隔序列。可以通过在核酸中进行一个或多个缺失和/或截短制备核酸的部分。向核酸中引入截短和缺失的技术在本领域内是众所周知的。适宜用于根据本发明方法中的核酸部分可以根据实施例部分中描述的方法,通过简单地使用待测功能的核酸部分替换实际实施例中使用的序列即可确定。
另一变体seedyl核酸的示例是能够与如上所述的seedyl核酸(例如SEQ ID NO 1,3,5,7,9或11中的任何一个表示的seedyl核酸)杂交的序列。这些杂交序列是如上定义的seedyl蛋白的编码序列。适宜用于根据本发明方法中的杂交序列可以根据实施例部分中描述的方法,通过简单地使用杂交序列替换实际实施例中使用的序列即可确定。
如这里使用的,术语“杂交”是一个过程,其中实质上同源互补的核苷酸序列互相退火。杂交过程可以完全在溶液中进行,即两条互补核酸都在溶液中。分子生物学中依赖于这一过程的工具包括聚合酶链式反应(PCR;以及所有基于PCR的方法),差式杂交、随机引物延伸、核酸酶S1作图、引物延伸、逆转录、cDNA合成、RNA差异显示以及DNA序列测定。杂交过程还可以这样进行将互补核酸中的一个固定在基质(例如磁性小珠、Sepharose小珠或者任何其他树脂)上。分子生物学中依赖于这一过程的工具包括多聚(A+)mRNA的分离。杂交过程还可以这样进行将互补核酸中的一个固定在固相支持物,例如硝化纤维素或尼龙膜上,或者通过例如影印技术固定在例如硅质玻璃支持物上(后者被称为核酸阵列或者微阵列或者核酸芯片)。分子生物学中依赖于这一过程的工具包括RNA和DNA凝胶印迹分析,菌落杂交、噬菌斑杂交、原位杂交以及微阵列杂交。为了使杂交出现,核酸分子一般通过热或者化学方式变性以熔解双链成为两条单链和/或从单链核酸中除去发夹或者其他二级机构。杂交的严谨性受到温度、盐浓度以及杂交缓冲液组成等条件的影响。用于杂交的高严谨性条件包括高温和/或低盐浓度(盐包括NaCl和柠檬酸三钠)和/或在杂交缓冲液中含有甲酰胺和/或降低杂交缓冲液中化合物例如SDS(去污剂)的浓度和/或从杂交缓冲液中除去化合物如硫酸葡聚糖或聚乙二醇(促进分子聚集)。常规的杂交条件在例如Sambrook(2001)Molecular Cloninga laboratory manual,3rd Edition Cold Spring Harbor LaboratoryPress,CSH,New York中有描述,但是技术人员应当理解可以根据已知或者预期的同源性和/或核酸长度设计多种不同的杂交条件。在分离与前面描述的本发明DNA序列异源的核酸时特别优选的是足够低的严谨性杂交条件(至少开始是这样的)。低严谨性条件的示例包括4-6xSSC/0.1-0.5%w/v SDS,37-45℃ 2-3小时。根据参与杂交的核酸的来源和浓度,可以使用其他严谨性条件,例如中等严谨性条件。中等严谨性条件的示例包括1-4x SSC/0.25%w/v SDS,≥45℃ 2-3小时。高严谨性条件的示例包括0.1-1x SSC/0.1%w/v SDS,60℃1-3小时。技术人员应当知道在杂交和漂洗过程中可以被改变的以及可能会保持或者改变严谨性条件的各种不同参数。可以从低的严谨性条件开始逐渐增加直至出现了如上描述的杂交seedyl核酸。造成异源性的因素包括等位性、遗传密码的简并性以及偏好密码子使用的差异。
变体seedyl的另一个示例是seedyl核酸/基因的可变剪接变体。还可以使用seedyl核酸的可变剪接变体实施根据本发明的方法。如这里所使用的,术语“可变剪接变体”包括如下核酸变体,在该变体中,内含子和/或外显子被选择切除、替换或者添加。这种剪接变体可以在自然界中找到或者可以使用本领域众所周知的技术人工制备。剪接变体优选是SEQ ID NO 1,3,5,7,9或11中任何一个所表示的序列的剪接变体。适宜用于根据本发明方法中的剪接变体可以例如根据实施例部分中描述的方法,通过简单地使用剪接变体替换实际实施例中使用的序列而容易地确定。
seedyl变体的另一个示例是等位变体。便利地,还可以使用seedyl核酸的等位变体(优选为SEQ ID NO 1,3,5,7,9或11中任何一个所表示的seedyl核酸序列的等位变体)实施根据本发明的方法。在自然界中存在等位变体且本发明的方法包括在根据本发明的方法中使用这些分离的天然等位基因。等位变体包括单核苷酸多态性(SNPs),以及小插入/缺失多态性(INDELs)。INDELs的大小通常小于100bp。在大多数生物体的天然存在的多态品系中,SNP和INDEL形成最大的一组序列变体。适宜用在根据本发明方法中的等位变体可以根据实施例部分中描述的方法,通过简单地使用等位变体替换实际实施例中使用的序列而容易地确定。
seedyl氨基酸变体的示例包括seedyl蛋白,优选SEQ ID NO 2,4,6,8,10或12中的任何一个表示的seedyl蛋白的同源物、衍生物和活性片段。seedyl蛋白的同源物、衍生物和活性片段是那些从N端到C端按照以下顺序包含以下各项的蛋白(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序。
优选的seedyl的同源物、衍生物和活性片段具有卷曲螺旋结构域,优选位于蛋白的N端半部分,更优选位于氨基酸位置25和250之间,更优选位于位置50和150之间。卷曲螺旋结构域通常决定了蛋白质的折叠。
seedyl蛋白的“同源物”包括相对于所讨论的未改变蛋白具有氨基酸替代、缺失和/或插入,且与其所来源的未改变蛋白相比具有相似生物学和功能活性的肽、寡肽、多肽、蛋白质和酶。为了制备这些同源物,可以使用具有类似性质(例如类似的疏水性、亲水性、抗原性、形成或者中断α-螺旋结构或β-折叠结构的倾向性)的其他氨基酸代替蛋白质的氨基酸。保守替代表格在本领域内是众所周知的(参见例如Creighton(1984)Proteins.W.H.Freeman and Company)。
seedyl蛋白同源物与SEQ ID NO 2,4,6,8,10或12中的任何一个具有20%和99.99%之间数值的百分比一致性,即按照优选度增加的顺序,与未改变的蛋白具有至少20%,21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,或50%的序列一致性或相似性(功能一致性),或者与未改变的蛋白具有至少60%的序列一致性或相似性,或者与未改变的蛋白具有至少70%的序列一致性或相似性。通常,同源物与未改变的蛋白具有至少75%或80%的序列一致性或相似性,优选至少85%,86%,87%,88%,89%的序列一致性或相似性,更优选与未改变的蛋白具有至少90%,91%,92%,93%,94%的序列一致性或相似性,最优选与未改变的蛋白具有至少95%,96%,97%,98%或99%的序列一致性或相似性。百分比一致性是比较全序列得到的。适宜用于根据本发明方法中的同源物可以例如根据实施例部分中描述的方法,通过简单地使用同源序列替换实际实施例中使用的序列而容易地确定。
可以使用比对程序计算百分比一致性,本领域内众所周知这些比对程序。例如,可以使用程序GAP或者needle(EMBOSS程序包)或stretcher(EMBOSS程序包)或者比对程序X(作为Vector NTI 5.5软件包的一个组件),使用标准的参数(例如空位罚分5,空位开放罚分15,空位扩展罚分6.6),计算百分比一致性。
用于搜索和鉴定seedyl同源物或者编码seedyl同源物的DNA序列的方法在本领域技术人员掌握的范围内。这些方法包括使用本发明的SEQ ID NO 1和2或3到10提供的序列(优选是计算机可读形式的本发明的核酸)筛选序列数据库。这些序列信息可以例如从公共数据库中得到,公共数据库包括但是不止限于Genbank(http://www.ncbi.nlm.nih.gov/web/Genbank),欧洲分子生物学实验室核酸数据库(EMBL)(http://www.ebi.ac.uk/ebi-docs/embl-db.html)或者它们的版本或者MIPS数据库(http://mips.gsf.de/)。用于比对和比较序列的不同搜索算法和软件在本领域内是众所周知的。这些软件包括GAP,BESTFIT,BLAST,FASTA和TFASTA。GAP使用Needleman和Wunsch(J.Mol.Biol.48443-453,1970)的算法,通过使匹配最大化,并使缺口的数目最小,找到两个完整序列的比对。BLAST算法计算百分比序列一致性,并且对两个序列之间的相似性进行统计分析。被称为BLAST程序的程序组有5个不同的执行程序三个用于核苷酸序列查询(BLASTN,BLASTX,和TBLASTX),两个用于蛋白质序列查询(BLASTP和TBLASTN)(Coulson,Trends inBiotechnology76-80,1994;Birren et al.,GenomeAnalysis,1543,1997)。用于进行BLAST分析的软件可以从国家生物信息中心公开获得。
SEQ ID NO2的同源物可以在许多不同生物中找到。最近的同源物在植物界中找到。例如,从烟草(SEQ ID NO 2),稻(SEQ ID NO 4),苜蓿(medicago)(SEQ ID NO 6),甘蔗(SEQ ID NO 8),玉米(SEQ IDNO 10)以及拟南芥属(Arabidopsis)(SEQ ID NO 12)中分离出seedyl蛋白。此外,来自其他生物体的EST已经存放于GenBank中,例如来自葡萄(Vitis vinifera)(登录编号CA816066),来自火炬松(Pinustaeda)(登录编号BM903108),来自Saccharus sp.(登录编号CA228193和CA256020),来自甜橙(Citrus sinsensis)(登录编号CF833583),白雪花(Plumbago zeylanica)(登录编号CB817788),来自玉米(Zea mays)(登录编号CF637447,AW282224,CD058812,AY108162,CD059048,CF041861,AW067243),来自普通小麦(Triticum aestiyum)(CA727065,BJ264506,BJ259034),来自大麦(Hordeum vulgare)(登录编号BU997034,CA727065,CA031127,BQ762011),来自欧洲油菜(Brassica napus)(CD817460),来自树棉(Gossypium arboreum)(BG446106,BM360339),来自花菱草(Eschscholzia californica)(CD478368),来自欧洲山杨(Populustremula)(BU821376)和来自甜菜(Beta vulgaris)(BQ594009)的EST。随着更多基因组的测序,将鉴定到许多其它的seedyl同源物。
确定结构域或者基序也是本领域技术人员所掌握的,涉及例如计算机可读形式的本发明的核酸,使用比对软件程序以及使用可以公开获得的关于蛋白质结构域、保守基序和盒子的信息。蛋白质结构域信息在PRODOM(http://www.biochem.ucl.ac.uk/bsm/dbbrowser/jj/prodomsrchjj.html),PIR(http://pir.georgetown.edu/)或pFAM(http://pfam.wustl.edu/)数据库中可以获得。用于基序搜索的序列分析程序可以用于以上提到的片段、区域和保守结构域的鉴定。优选的计算机程序包括但是不止限于,MEME,SIGNALSCAN和GENESCAN。MEME算法(3.0版)可以在GCG程序包中找到;或者在因特网站点http://www.sdsc.edu/MEME/meme上找到。SIGNALSCAN4.0版信息可以从因特网站点http://biosci.cbs.umn.edu/software/sigscan.html上获得。GENESCAN可以从因特网站点http://gnomic.stanford.edu/GENESCANW.html上找到。
两种特殊形式的同源性,直向同源和平行进化同源是用于描述基因的祖先关系的进化概念。术语“平行进化同源”涉及物种基因组内的基因重复。术语“直向同源”涉及的是由于祖先关系以及不同物种的形成而致的在不同生物体中的同源基因。这里的术语“同源物”也包括平行进化同源物和直向同源物。
在例如单子叶植物物种中,直向同源物可以通过进行所谓的相互Blast搜索容易地找到。这可以通过第一Blast检索来实现,第一Blust检索涉及用所讨论的序列(例如SEQ ID NO1或SEQ ID NO2)对任何序列数据库例如可以公开获得的NCBI数据库(可以在http://www.ncbi.nlm.nih.gov上找到)进行Blast搜索。如果找到稻中的直向同源物,则用所讨论的序列对例如可从NCBI获得的来自稻(Oryza sativa Nipponbare)的28,469个全长cDNA克隆进行Blast搜索。如果从核苷酸开始,则可以使用BLASTn或tBLASTX,从蛋白质开始则可以使用BLASTP或TBLASTN,其中使用标准的缺省值。可以对Blast搜索的结果进行过滤。然后将过滤后的结果或者未过滤的结果中的全长序列针对所讨论序列的来源生物体的序列进行返回Blast搜索(第二Blast搜索)。然后比较第一和第二Blast搜索的结果。如果第二Blast搜索的结果以具有最高相似性的命中形式给出seedyl核酸或蛋白,则找到直向同源物;如果生物体中的一个是烟草,则找到平化进行同源物。对于大家族,可以使用ClustalW,接下来做邻接树(neighbour joining tree),以辅助观察聚类。
根据SEQ ID NO2的seedyl蛋白的示例同源物包括SEQ ID NO 4(稻),SEQ ID NO 8(甘蔗)和SEQ ID NO 10(玉米),SEQ ID NO 6(苜蓿)以及SEQ ID NO 12(拟南芥)表示的的seedyl蛋白。SEQ IDNO 8(甘蔗)和SEQ ID NO 10(玉米)表示的蛋白只是部分的,但是本领域的技术人员可以使用常规技术例如cDNA文库的菌落杂交或者使用基于特异引物和简并引物的组合的PCR,容易地确定蛋白质及编码cDNA的相应全长序列。
在本发明的方法中有用的另一个seedyl变体是seedyl衍生物。术语“衍生物”指的是与天然存在形式的蛋白质的氨基酸序列例如SEQID NO2表示的氨基酸序列相比,可以包含天然和非天然氨基酸残基的替代、缺失或者添加的肽、寡肽、多肽、蛋白质和酶。seedyl蛋白的“衍生物”包括与多肽天然形式的氨基酸序列相比,可以包含天然存在的改变的、糖基化的、酰化的氨基酸残基或者非天然存在的氨基酸残基的肽、寡肽、多肽、蛋白质和酶。与其来源的氨基酸序列相比,衍生物还可以包含一个或多个非氨基酸替代物,例如与氨基酸序列共价或非共价结合的报告分子或者其他配基,例如结合以促进衍生物的检测的报告分子,以及与天然蛋白质的氨基酸序列有关的非天然存在的氨基酸残基。
蛋白质的“替代变体”是那些在氨基酸序列中至少一个残基已被去掉并且一个不同的残基代替它插入的蛋白质。氨基酸替代通常是单个残基的,但是也可以成簇出现,这取决于对多肽施加的功能限制;插入通常是大约1到10个氨基酸残基左右,缺失的范围大致从1到20个残基。优选地,氨基酸替代包含保守氨基酸替代。
蛋白质的“插入变体”是那些一个或多个氨基酸残基被引入到蛋白质中预先确定位置的蛋白。插入可以包含氨基端和/或羧基端的融合以及单个或多个氨基酸的序列内插入。一般地,氨基酸序列内的插入小于氨基或者羧基端的融合,其大约是1到10个残基左右。氨基或羧基端融合蛋白或肽的示例包括在酵母双杂交系统中使用的转录激活物的结合结构域或激活结构域,噬菌体外壳蛋白、(组氨酸)6标签、谷胱甘肽S转移酶标签、蛋白A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、FLAG-表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白C表位和VSV表位。
蛋白质的“缺失变体”被表征为蛋白质的一个或多个氨基酸被去掉。蛋白质的氨基酸变体可以使用本领域内众所周知的肽合成技术(例如固相肽合成等)或者通过重组DNA操作容易地制备。操作DNA序列以产生蛋白质的替代、插入或者缺失变体的方法是本领域内众所周知的。例如在DNA中预先确定的位置进行替代突变的技术对于本领域内的技术人员是众所周知的,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或者其他定点诱变方案。
在本发明的方法中有用的另一个seedyl蛋白质/氨基酸变体是seedyl蛋白的活性片段。seedyl蛋白的“活性片段”包括seedyl蛋白的连续氨基酸残基,这些残基保持了与天然存在的蛋白相似的生物和/或功能活性。有用的片段是那些属于以上所述的seedyl蛋白定义范围内的片段。优选地,这些片段起始于第二或第三或更内部的甲硫氨酸残基之一。这些片段来自从内部ATG密码子开始的蛋白质翻译。
为了确定保守基序的存在,使用适宜的软件例如Align X或clustal X比对序列,用于指明保守残基(参加例如图3)。软件包例如MEME3.0版也可以用于确定序列中的基序。该软件可以在http://meme.sdsc.edu/meme/从UCSD,SDSC和NBCR获得。可以使用软件Coils 2.0,鉴定卷曲螺旋结构域。该软件可以从http://www.ch.embnet.org/software/COILS_form.html获得。在SEQID NO 15,16,17和18表示的基序中“X”表示任何氨基酸。
根据本发明的一个优选方面,涉及在植物或者植物部分中提高或者增加seedyl核酸的表达。使基因或者基因产物表达提高的方法在本领域中有详细书面记载,包括例如由(强)启动子驱动的过表达,及使用转录增强子或者翻译增强子。如这里所使用的,术语”过表达“指的是附加于原来野生型表达水平上的任何形式的表达。优选地,seedyl核酸相对于与其有效连接的启动子是有义的方向。或者可以通过植物育种技术选择具有更好表现的野生型seedyl核酸的等位基因。
seedyl基因的表达可以通过对细胞提取物进行Northern或者Southern印迹分析而研究。细胞中seedyl蛋白的水平可以通过对细胞提取物进行Western印迹分析而研究。
根据本发明的另一个实施方案,提供了促进可用于根据本发明的方法中的核苷酸序列引入和/或表达的遗传构建体和载体。因此,本发明提供了包含下列的遗传构建体(i)编码如上定义的seedyl蛋白的seedyl核酸。
(ii)一个或多个能够调控(i)的核酸表达的控制序列;以及任选地(iii)转录终止序列。
根据本发明的方法,这种遗传构建体被引入到植物或者植物部分中。
在根据本发明的方法中有用的构建体可以使用本领域内技术人员众所周知的重组DNA技术构建。基因构建体可以插入到载体中,载体可以是商业化的,适于转化植物且适于在被转化的细胞中表达目标基因。
遗传构建体可以是表达载体,其中所述的核酸与一个或多个控制序列有效连接,从而允许核酸在原核和/或真核宿主细胞中表达。
根据(i)的核酸可以是任何如上定义的seedyl核酸,优选地是由SEQ ID NO 1,3,5,7,9或者11中任何一个表示的seedyl核酸。(ii)的控制序列优选是种子偏好的启动子,例如谷醇溶蛋白(prolamin)启动子。
使用包含目标序列(该序列与一个或多个控制序列(至少有启动子)有效连接)的载体转化植物。术语“调控元件”、“控制序列”全部在这里可以互换使用,并且从广义理解为指的是能够使与其相连接(即有效连接)的序列表达的调控核酸。上面提到的术语包括了启动子。“启动子”包括来自经典真核基因组基因的转录调控序列(包括精确转录起始所需的TATA盒子,具有或者没有CCAAT盒子序列)以及响应于发育和/或外界刺激或者以组织特异的形式改变基因表达的其他调控元件(即上游激活序列、增强子和沉默子)。该术语还包括经典原核基因的转录调控序列,其中其可以包括-35盒子序列和/或-10盒子转录调控序列。术语“调控元件”也包括合成的融合分子或者衍生物,其使核酸分子在细胞、组织或者器官中表达或者使表达激活或提高。如这里使用的,术语“有效连接”指的是启动子序列和目标基因之间的功能性连接,这样使启动子序列能够起始目标基因的转录。
便利地,可以使用任何类型的启动子来驱动seedyl核酸的表达。优选地,能够改变seedyl基因表达的核酸与来自植物的启动子(优选来自植物的组织偏好启动子)有效连接。如这里描述的,术语“组织偏好的”指的是主要在至少一种组织或者器官中表达的启动子。优选地,组织偏好的启动子是种子偏好启动子或者种子特异启动子,更优选是胚乳偏好启动子,更优选是从编码种子贮存蛋白的基因中分离出的启动子,最优选是从谷醇溶蛋白基因中分离的启动子,例如SEQ ID NO 14表示的稻谷醇溶蛋白启动子或者与稻谷醇溶蛋白启动子有相似强度的启动子和/或具有相似表达模式的启动子。可以将启动子与报告基因偶联并且检查报告基因在植物组织中的功能,从而对相似强度和/或相似的表达模式进行分析。一个众所周知的报告基因是β葡糖醛酸糖苷酶,使用显色的GUS染色呈现β葡糖醛酸糖苷酶在植物组织中的活性。
优选的种子特异启动子和其他组织特异启动子的示例示于表A中,这些启动子或者其衍生物在实施本发明的方法中是有用的。
表A
任选地,还可以在引入植物的构建体中使用一个或多个终止序列。术语“终止子”包括如下控制序列,该序列是位于转录单位末端的DNA序列,传递对初级转录物进行3′加工和多聚腺苷酸化及终止转录的信号。其它调控元件可以包括转录和翻译增强子。本领域内的技术人员应当知道终止子和增强子序列,它们可能适用于实施本发明。这些序列是已知的或者可以被本领域技术人员容易地获得。
本发明的遗传构建体还可以包含复制起点序列,这是在特定细胞类型中进行维持和/或复制所需要的。一个示例是当遗传构建体需要在细菌细胞中作为附加体遗传元件(例如质粒或柯斯质粒分子)维持时。优选的复制起点包括,但是不止限于,fl-ori和colE1。
遗传构建体可以任选地包含选择标记基因。如这里使用的,术语“选择标记基因”包括如下任何赋予细胞表型的基因,其中该基因在细胞中的表达将有助于鉴定和/或筛选使用本发明的核酸构建体转染或者转化的细胞。适宜的标记可以选自赋予抗生素抗性或者除草剂抗性的标记,引入新的代谢性状或者允许目测筛选的标记。选择标记基因的示例包括赋予抗生素抗性的基因(例如使新霉素和卡那霉素磷酸化的nptII或者使潮霉素磷酸化的hpt),赋予抗除草剂抗性的基因(例如提供对Basta的抗性的bar;提供抗草甘膦(glyphosate)抗性的aroA或者gox),或者提供代谢性状的基因(例如使植物可以用甘露糖作为唯一碳源的manA)。可视的标记基因导致颜色(例如β-葡糖醛酸糖苷酶,GUS),发光(例如萤光素酶)或者荧光(绿色荧光蛋白,GFP以及其衍生物)的形成。
在优选的实施方案中,遗传构建体包含来自稻的谷醇溶蛋白启动子,其以有义方向与seedyl核酸有效连接。这种还包含终止序列的表达盒子的一个示例是SEQ ID NO 13。
根据本发明另一个实施方案,提供了制备具有改变的生长特征的植物的方法,包括改变植物中seedyl核酸或者seedyl蛋白的表达和/或活性和/或水平。
根据一个特定的实施方案,本发明提供了制备具有改变的生长特征的转基因植物的方法,该方法包括(i)向植物或者植物部分中引入编码seedyl蛋白的seedyl核酸;(ii)在促进再生和成熟植物生长的条件下培养植物细胞。
有利地,(i)的核酸可以是任何上面提到的seedyl核酸。
蛋白质自身和/或核酸自身可以被直接引入植物细胞或者植物自身(包括引入组织、器官或者任何其他植物部分)。根据本发明的优选特性,核酸优选地通过转化引入植物中。
如这里提到的,术语“转化”包括外源多核苷酸向宿主细胞内的转移,而不考虑转移所使用的方法。可以使用本发明的遗传构建体转化接下来能够进行克隆增殖(不论是通过器官发生或者胚胎发生)的植物组织,然后从转化的植物组织再生出整株植物。根据对于所转化的特定物种可以获得的并且是最为适宜的克隆增殖系统,所选择的特定组织可以有所不同。示例性的组织靶标包括叶盘、花粉、胚胎、子叶、下胚轴、雌配子体、愈伤组织、已有的分生组织(例如顶端分生组织、腋芽以及根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。多核苷酸可以瞬时或者稳定引入到宿主细胞中,并且可以以非整合形式例如作为质粒维持。备选地并且优选地,转基因可以稳定整合在宿主基因组中。然后可以以本领域技术人员知道的方式将产生的转化植物细胞再生为转化植物。
植物物种的转化现在是相当常规的技术。便利地,可以使用几种转化方法中的任何一种将目标基因引入适宜的祖先细胞。转化方法包括使用增加自由DNA摄取的化学药品、脂质体、电穿孔、将DNA直接注射到植物中,粒子枪轰击、使用病毒或者花粉的转化以及微粒轰击。可以从下列方法中选择用于原生质体的钙/聚乙二醇方法(Krens,F.A.et al.,1882,Nature 296,72-74;Negrutiu I.et al.,June1987,Plant Mol.Biol.8,363-373);原生质体电穿孔(Shilto R.D.et al.,1985 Bio/Technol 3,1099-1102);向植物材料中的微注射(Crossway A.et al.,1986,Mol.Gen Genet 202,179-185);DNA或者RNA包被的粒子轰击(Klein T.M.et al.,1987,Nature 327,70);使用(非整合的)病毒感染等。
优选通过农杆菌介导的转化,使用用于稻转化的任何众所周知的方法,例如下列中的任何一项中描述的方法,制备表达seedyl基因的转基因稻植物发表的欧洲专利申请EP 1198985 A1,Aldemita andHodges(Planta,199,612-617,1996);Chan et al.(Plant Mol.Biol.22(3)491-506,1993),Hiei et al.(Plant J.6(2)271-282,1994),这些公开材料在这里全部引用作为参考。就玉米转化而言,优选的方法是Ishida et al.(Nat.Biotechnol.1996 Jun;14(6)745-50)或Frame et al.(Plant Physiol.2002 May;129(1)13-22)描述的方法,这些公开材料在这里全部引用作为参考。
一般在转化之后,基于植物可表达基因(与目标基因共转移)所编码的一个或多个标记的存在,对植物细胞或者细胞分组进行筛选,之后将转化的材料再生为整株植物。
在DNA转移和再生之后,可以对推断为转化的植物进行研究,例如使用Southern分析,以检查目标基因的存在、拷贝数和/或基因组的组织结构。备选地或者另外地,可以使用Northern和/或Western分析对新引入的DNA的表达水平进行监测,这两种技术对于本领域中具有普通技术的人员是众所周知的。
可以使用各种不同的方法例如克隆增殖或者经典的育种技术,对再生的转化植物进行增殖。例如第一代(或者T1)转化植物可以自交产生纯合的第二代(或者T2)转化体,T2植物再通过经典育种技术进行繁殖。
产生的转化生物体可以采取多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆转化体(例如所有细胞都被转化而含有表达盒子);转化和未转化组织的嫁接物(例如在植物中,转化的根状茎嫁接到未转化的接穗上)。
本发明还包括可以通过本发明的方法获得的植物。因此本发明提供了可以通过本发明的方法获得的植物,与野生型植物相比,该获得的植物具有改变的生长特征。
本发明显然延及通过这里描述的任何方法产生的任何植物细胞或者植物以及其所有的植物部分和繁殖体。本发明还延及通过上述方法中的任何一种产生的原代转化或者转染的细胞、组织、器官或者整株的后代,唯一的要求是后代的表型和/或基因型特征与通过本发明的方法产生的亲本中出现的表型和/或基因型特征相同,即具有改变的生长特征。
因此本发明还包括包含如上定义的分离的seedyl核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞或者来自昆虫、动物、酵母、真菌、藻类或细菌的细胞。本发明还涉及植物的可收获部分,例如但是不止限于种子、花、雄蕊、叶、花瓣、果实、茎、茎培养物、根状茎、根、块茎和球茎。
如这里所使用的,术语“植物”包括整株植物,植物的祖先和后代以及植物部分,包括种子、枝条、茎、根(包括块茎)以及植物细胞、组织和器官。因此术语“植物”还包括悬浮培养物、胚胎、分生组织区域、愈伤组织、叶、配子体、孢子体、花粉以及小孢子。在根据本发明的方法中特别有用的植物包括属于绿色植物界(Viridiplantae)超家族的所有植物,特别是单子叶和双子叶植物,包括用作饲料或者草料的豆科植物、装饰植物、食物作物、树或者灌木,选自金合欢属(Acacia spp.),槭树属(Acer spp.),猕猴桃属(Actinidia spp.),七叶树属(Aesculus spp.),新西兰贝壳杉(Agathis australis),阿马拉合欢(Albizia amara),Alsophilatricolor,须芒草属(Andropogon spp.),落花生属(Arachis spp),槟榔(Areca catechu),Astelia fragrans,鹰嘴紫云英(Astragaluscicer),多小叶红苏木(Baikiaea plurijuga),桦木属(Betulaspp.),芸苔属(Brassica spp.),木榄(Bruguiera gymnorrhiza),非洲柚木(Burkea africana),紫铆(Butea frondosa),面包果树(Cadaba farinose),朱缨花属(Calliandra spp),大叶茶(Camelliasinensis),美人蕉(Canna indica),辣椒属(Capsicum spp.),决明属(Cassia spp.),Centroema pubescens,木瓜属(Chaenomelesspp.),肉桂(Cinnamomum cassia),小果咖啡(Coffea arabica),Colophospermum mopane,Coronillia varia,栒子木(Cotoneasterserotina),山楂属(Crataegus spp.),甜瓜属(Cucumis spp.),柏木属(Cupressus spp.),新西兰银蕨(Cyathea dealbata),榲桲(Cydonia oblonga),日本柳杉(Cryptomeria japonica),香茅属(Cymbopogon spp.),新西兰银蕨(Cynthea dealbata),榲桲(Cydonia oblonga),黄檀(Dalbergia monetaria),大叶骨碎补(Davallia divaricata),山马蝗属(Desmodium spp.),树蕨(Dicksonia squarosa),Diheteropogon amplectens,Dioclea spp,镰扁豆属(Dolichos spp.),Dorycnium rectum,塔钟稗(Echinochloapyramidalis),Ehrartia spp.,龙爪稷(Eleusine coracana),麸属(Eragrestis spp.),刺桐属(Erythrina spp.),桉属(Eucalyptusspp.),希氏假乌木(Euclea schimperi),金茅(Eulalia villosa),荞麦属(Fagopyrum spp.),费约果(Feijoa sellowiana),草莓属(Fragaria spp.),千斤拔属(Flemingia spp),蔓露兜(Freycinetiabanksii),老鹳草(Geranium thunbergii),银杏(Ginkgo biloba),爪哇大豆(Glycine javanica),南洋樱属(Gliricidia spp),陆地棉(Gossypium hirsutum),银桦属(Grevillea spp.),非洲红木(Guibourtia coleosperma),岩黄芪属(Hedysarum spp.),Hemarthiaaltissima,扭黄茅(Heteropogon contortus),大麦(Hordeumvulgare),泰国苞茅(Hyparrhenia rufa),小连翘(Hypericumerectum),Hyperthelia dissoluta,野生木蓝(Indigo incamata),鸢尾属(Iris spp.),Leptarrhena pyrolifolia,胡枝子属(Lespediza spp.),Lettuca spp.,银合欢(Leucaena leucocephala),Loudetia simplex,Lotonus bainesii,百脉根属(Lotus spp.),Macrotyloma axillare,苹果属(Malus spp.),木薯(Manihotesculenta),紫苜蓿(Medicago sativa),水杉(Metasequoiaglyptostroboides),大蕉(Musa sapientum),烟草属(Nicotianumspp.),驴食豆属(Onobrychis spp.),Ornithopus spp.,稻属(Oryzaspp.),非洲盾柱树(Peltophorum africanum),狼尾草属(Pennisetum spp.),鳄梨(Perseag ratissima),碧冬茄属(Petuniaspp.),菜豆属(Phaseolus spp.),槟榔竹(Phoenix canariensis),新西兰剑麻(Phormium cookianum),石楠属(Photinia spp.),白云杉(Picea glauca),松属(Pinus spp.),碗豆(Pisum sativum),新西兰罗汉松(Podocarpus totara),Pogonarthria fleckii,Pogonarthria squarrosa,杨属(Populus spp.),牧豆树(Prosopiscineraria),花旗松(Pseudotsuga menziesii),Pterolobiumstellatum,西洋梨(Pyrus communis),栎属(Quercus spp.),伞形花石斑木(Rhaphiolepsis umbellate),美味棒花棕(Rhopalostylissapida),火炬树(Rhus natalensis),欧洲醋栗(Ribesgrossularia),茶藨子属(Ribes spp.),洋槐(Robiniapseudoacacia),蔷薇属(Rosa spp.),悬钩子属(Rubus spp.),柳属(Salix spp.),Schyzachyrium sanguineum,金松(Sciadopitysverticillata),北美红杉(Sequoia sempervirens),巨杉(Sequoiadendron giganteum),两色蜀黍(Sorghum bicolor),菠菜属(Spinacia spp.),鼠尾草(Sporobolus fimbriatus),Stiburusalopecuroides,Stylosanthos humilis,葫芦茶属(Tadehagi spp),落羽杉(Taxodium distichum),阿拉伯黄背草(Themeda triandra),车轴草属(Trifolium spp.),小麦属(Triticum spp.),异叶铁杉(Tsuga heterophylla),越桔属(Vaccinium spp.),野豌豆属(Viciaspp.),葡萄(Vitis vinifera),锥穗沃森花(Watsonia pyramidata),马蹄莲(Zantedeschia aethiopica),玉米(Zea mays),苋,洋蓟,芦笋,嫩茎花椰菜,孢子甘蓝,卷心菜,canola,胡萝卜,花椰菜,芹菜,collard greens,亚麻,羽衣甘蓝,小扁豆,油籽油菜,秋葵,洋葱,马铃薯,稻,大豆,草莓,甜菜,甘蔗,向日葵,番茄,南瓜,茶,树木。或者,藻类和其他非绿色植物界可以用于本发明的方法。根据本发明的优选实施方案,植物是作物植物例如大豆、向日葵、canola、紫花苜蓿、油菜、棉花、番茄、马铃薯或者烟草。再优选地,植物是单子叶植物例如甘蔗。更优选地,植物是谷物例如稻、玉米、小麦、大麦、粟、黑麦、高粱或者燕麦。
便利地,本发明提供了改变植物生长特征的方法,所述改变的生长特征选自增加的产量、增加的生物量、改变的植物结构(plantarchitecture)中的任何一项或多项。
再优选地,增加的产量是增加的种子产量。
术语“增加的产量”包括在植物的一种或多种可收获部分中生物量与相应的野生型植物的总生物量相比增加。该术语还包括种子产量的增加,种子产量的增加包括相对于相应的野生型植物而言下列各项的增加种子生物量(种子重量)和/或种子(饱满的)数量和/或种子大小和/或种子体积。种子大小和/或体积的增加也可能影响种子的组成。种子产量的增加可能是由于花的数目和/或大小的增加所致。产量的增加也可能使收获指数增加,收获指数表示为总生物量与可收获的部分例如种子的产量之比。
使用本发明的方法可以提高植物的种子产量,因此本发明方法特别适合应用于作物植物,优选为种子作物和谷物。因此,本发明的方法对于例如油菜、向日葵、豆科(例如大豆、豌豆、蚕豆)、亚麻、羽扇豆(lupinus)、canola以及谷物例如稻、玉米、小麦、大麦、粟、燕麦和黑麦等植物特别有用。
再优选地,增加的生物量包括增加的地上植物组织生物量(在这里定为地上植物面积)。
备选地或另外,与相应的野生型植物相比,根据本发明的植物具有增加的地上面积。
再优选地,所述改变的植物结构包括与相应的野生型植物相比增加的复总状花序数量以及增加的生物量。
本发明还涉及使用seedyl核酸和/或蛋白用于改变植物的生长特征。
根据本发明的另一个方面,seedyl核酸和/或seedyl蛋白可以用于育种程序。在这种育种程序的一个示例中,鉴定可以与seedyl核酸/基因遗传连接的DNA标记。然后该DNA标记可以用于育种程序,以筛选相对于相应的野生型植物具有改变的生长特征的植物。
根据本发明的方法产生如上面所描述的具有改变的生长特征的植物。这些有利的特征还可以与其他经济上有益的性状(例如其它提高产量的性状,对各种不同胁迫的耐受,改变各种不同结构特性和/或生化和/或生理特性的性状)相组合。
现在参考以下的附图对本发明进行描述,其中图1示意表示了入口克隆,在pDONR201骨架中于用于Gateway克隆的AttL1和AttL2位点内含有CDS0689。CDS0689是烟草(Nicotiana tabacum)BY2 CDS0689 seedyl编码序列的内部代码。该载体还含有细菌的卡那霉素抗性盒子以及细菌的复制起点。
图2是用于在稻(Oryza satiua)中表达烟草BY2 seedyl基因(CDS0689)的二元载体的图谱,所述基因在稻的谷醇溶蛋白RP6启动子(PRO0090)控制下。该载体含有来自Ti质粒的T-DNA,该T-DNA由左边界(LB重复,LB Ti C58)和右边界(RB重复,RB Ti C58)限定。从左边界到右边界,该T-DNA含有用于抗生素筛选转化植物的可选择标记盒子;用于目测筛选转化植物的可筛选标记盒子;用于表达烟草BY2 seedyl基因(CDS0689)的PRO0090-CDS0689-玉米醇溶蛋白和rbcS-deltaGA双终止子盒子。该载体还含有来自pBR322的复制起点用于细菌复制,以及含有选择标记(Spe/SmeR)用于使用壮观霉素和链霉素对细菌进行筛选。
图3显示了seedyl氨基酸和从EST推导出来的氨基酸(均来自植物)的N端和C端比对。使用VNTI软件包的Align X程序进行该比对。用条指示基序1,2,3和4。
图4显示了根据本发明的核酸、蛋白和基序的序列。
实施例现在参考以下的实施例对本发明进行描述,实施例仅仅用于举例说明。
除非有其他说明,否则根据Sambrook(2001)Molecular Cloninga laboratory manual,第三版,Cold Spring Harbor LaboratoryPress,CSH,New York;或者Ausubel et al.(1988),CurrentProtocols in Molecular Biology,Current Protocols中卷1和2中描述的标准实验方案实施重组DNA技术。用于植物分子工作的标准材料和方法在R.D.D.Croy所著,BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK)出版的PlantMolecular Biology Labfase(1993)中有描述。
实施例1seedyl编码基因的克隆对同步化的烟草BY2细胞培养物(Nicotiana tabacum L.cv.Bright Yellow-2)进行cDNA-AFLP,鉴定了受到细胞周期调节的BY2已表达序列标签并且选出进行进一步克隆。接下来使用这些已表达序列标签筛选烟草cDNA文库,分离全长的目标cDNA,即编码本发明seedyl蛋白的cDNA(CDS0689)。
BY2细胞的同步化按照下面的方法使用蚜栖菌素将细胞阻断在早S期,从而使烟草BY2(Nicotiana tabacum L.cv.Bright Yellow-2)培养细胞悬液同步化。根据描述(Nagata et al.Int.Rev.Cytol.132,1-30,1992)的方法维持培养的Nicotiana tabacum L.cv.Bright Yellow-2细胞悬液。将7日龄的静置培养物用添加蚜栖菌素(Sigma-Aldrich,St.Louis,MO;5mg/l)的新鲜培养基10倍稀释,由此进行同步化,蚜栖菌素是DNA聚合酶α的抑制药物。24小时后,使用新鲜培养基洗几次以解除对细胞的阻断,并使细胞继续它们的细胞周期进程。
RNA提取和cDNA合成使用LiCl沉淀(Sambrook et al,2001)制备总DNA,使用Oligotex柱(Qiagen,Hilden,Germany)根据生产商的说明从500mg的总RNA中提取poly(A+)RNA。使用生物素化的oligo-dT25引物(Genset,Paris,France)和SuperscriptII(Life Technologies,Gaithersburg,MD),通过逆转录从1mg的poly(A+)RNA合成第一链cDNA。使用大肠杆菌连结酶(Life Technologies)和DNA聚合酶I(USB,Cleveland,OH)以及RNAse-H(USB)进行链置换,以进行第二链的合成。
cDNA-AFLP分析500ng的双链cDNA用于根据描述(Vos et al.,Nucleic Acids Res.23(21)4407-4414,1995;Bachem et al.,Plant J.9(5)745-53,1996)进行AFLP分析。使用的限制酶是BstYI和MseI(Biolabs),消化分两步进行。在使用一个酶进行第一次限制消化后,3′末端片段利用其生物素化的尾巴收集在Dyna小珠(Dynal,Oslo,Norway)上,而其他的片段被洗掉。使用第二个酶消化之后,收集释放的限制片段用作接下来的AFLP步骤中的模板。使用无选择性核苷酸的MseI引物与最3′端核苷酸是T或者C的BstYI引物组合进行预扩增。PCR的条件如以前的描述(Vos et al.,1995)。得到的扩增混合物稀释600倍,取5ml使用P33标记的BstYI引物和Amplitaq-Gold聚合酶(RocheDiagnostics,Brussels,Belgium)进行选择性扩增。扩增产物使用Sequigel系统(Biorad)在5%聚丙烯酰胺凝胶上分离。干燥的凝胶对Kodak Biomax底片进行曝光,并且用phospholmager(AmershamPharmacia Biotech,Little Chalfont,UK)扫描。
AFLP片段的表征从凝胶中分离对应于差异表达的转录物的条带(其中的(部分)转录物对应CDSO689),洗脱的DNA在与选择性扩增的相同条件下进行再扩增。使用选择性BstYI引物或者将片段克隆到pGEM-Teasy(Promega,Madison,WI)中后对再扩增的聚合酶链式反应产物进行直接测序,或者对单个的克隆进行测序,获得序列信息。使用BLSAT序列比对(Altschul et al.,Nucleic Acids Res.25(17)3389-3402 1997)将获得的序列与公众可以获得的数据库中的核苷酸和蛋白质序列进行比较。在可以获得的情况下,用更长的EST或者分离的cDNA序列代替标签序列以提高找到显著同源性的机会。接下来从商品化烟草cDNA文库中扩增出对应于CDS0689的物理cDNA克隆,操作如下。
烟草CDS0689 seedyl基因(CDS0689)的克隆使用从正在活跃分裂中的未同步化的BY2烟草细胞中分离的poly(A+)RNA制备平均插入物为1400bp的cDNA文库。这些文库插入物克隆到包含attB gateway盒子(Life Technologies)的载体pCMVSPORT6.0中。从该文库中选出46000个克隆,排列于384孔微量滴定板中,接下来一式两份点样在尼龙滤膜上。使用几百个放射性标记的标签的混合物作为探针(其中BY2-标签对应于CDS0689序列)筛选排列的克隆。分离阳性克隆(其中与BY2-标签反应的克隆对应于CDS0689序列)、测序并且与标签序列比对。或者,如果与标签杂交失败,则按照下述通过PCR扩增筛选对应于标签的全长cDNA。使用primer3程序(http://www-genome.wi.mit.edu/genome_software/other/primer3.html)设计标签特异的引物,并且与通用载体引物组合扩增出部分cDNA插入物。来自50.000,100.000,150.000,和300.000个cDNA克隆的DNA混合物用作PCR扩增的模板。从琼脂糖凝胶中分离扩增产物,克隆、测序并且与标签进行比对。按照以上的描述得到的包含CDS0689序列的载体,被称为入口克隆(entryclone)。
实施例2具有PRO0090-CDS0689盒子的用于转化的载体构建体接下来用入口克隆与p0830进行GatewayTMLR反应,p0830是用于稻转化的目的载体。该载体在T-DNA边界内含有如下功能性元件植物选择标记;植物筛选标记;以及用于与已经克隆在入口克隆中的目标序列进行LR体内重组的Gateway盒子。用于胚乳特异表达的稻谷醇溶蛋白RP6启动子(PRO0090)位于该Gateway盒子的上游。
在LR重组步骤后,产生的如图2所示的表达载体转化到农杆菌中,接下来转化到稻植物中。使转化的稻植物生长并且检查如实施例3中描述的各种不同的参数。
实施例3对使用谷醇溶蛋白::seedyl(PRO0090-CDS0689)转化的稻植物进行评价以及结果产生了大约15到20株独立的T0稻转化体。将初级转化体从组织培养室中转移至温室进行生长,收获T1种子。保留四个转化事件(其中的T1后代中转基因的存在/不存在按照3∶1的比例分离)。对于这些事件中的每一个,通过监测筛选标记的表达选择大约10株含有转基因(杂合子和纯合子)的T1幼苗以及大约10株没有转基因(零合子(nullizygote))的T1幼苗。
选择在T1中已具有改进农艺参数的两个事件(每个事件60株植物,30株是转基因阳性,30株是转基因阴性)在T2中进行重新评价。T1和T2植物转移到温室中,对营养生长参数和种子参数进行评价,见如下描述。
统计分析t检验和F检验双因子ANOVA(方差分析)用作统计模型,对植物的表型特征进行整体评价。对于使用目标基因转化的所有事件的所有植物,对所有测定的参数进行F检验。进行F检验以检查基因对全部转化事件的影响并且确定基因的整体影响或者”整体基因影响“。由F检验的数值确定的显著性数据表明”基因“的影响,意味着观察到的表型不仅仅由基因的存在或者位置导致。对于F检验而言,整体基因影响的显著性阈值设定在5%可能性水平。
营养生长测定选择的转基因植物生长在温室中。给每株植物予独特的条码标记,使表型数据与相应的植物清楚地相互联系起来。选择的转基因植物在10cm直径的小盆中在以下的环境设置条件下生长于土壤中光周期=11.5小时,日光强度=300001ux或者更高,日间温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。转基因植物和对应的零合子在随机的位置并肩生长。从播种阶段直至成熟阶段每株植物几次通过数码成像间并且照相。每个时间点从至少6个不同角度对每株植物进行数码成像(2048×1536像素,16万色)。以下描述的参数是使用图像分析软件从所有植物的所有数字图像中自动产生的。
(a)地上植物面积通过计数区别于背景的地上植物部分的像素的总数,确定植物的地上面积。针对在同一时刻从不同角度拍摄的照片,对该数值进行平均,通过标化将其转化为用平方毫米表示的物理面积数值。实验显示用这种方法测定的地上植物面积与植物地上部分的生物量是相关的。
(b)原发复总状花序(primary panicles)的数目手工计数最高的复总状花序以及在垂直比对时与最高的复总状花序重合的所有复总状花序,将其作为原发复总状花序。
与种子相关的参数的测定将T1和T2植物的成熟的初级复总状花序收获、装袋、条码标记,然后在烤箱中37℃干燥3天。然后使复总状花序脱粒,收集所有的种子并且计数。使用鼓风装置将饱满的谷壳与空的谷壳分开。弃掉空的谷壳,对剩余的级分再次计数。在分析天平上对饱满的谷壳称重。这个步骤产生了下述的一组与种子相关的参数。
(c)饱满种子的数目通过计数分离步骤后剩余的饱满的谷壳,确定饱满种子的数目。
(d)每株植物总的种子产量对从植物收获的所有饱满的谷壳进行称重,测定总的种子产量。
结果显示了转基因品系的阳性植物和相应零合子(阴性)植物的%差异。在表1到4中给出的数值表示的是两株T1品系的平均值和两株T2品系的平均值。
表1seedyl转基因T1和T2植物的地上面积的表型数据概况
表2seedyl转基因T1和T2植物的第一级复总状花序数目的表型数据概况
表3seedyl转基因T1和T2植物的饱满种子数目的表型数据概况
表4seedyl转基因T1和T2植物的每株植物种子总重量的表型数据概况
序列表<110>CropDesign N.V.
<120>具有改变的生长特征的植物及其制备方法<130>CD-105-PCT<150>US 60/528,113<151>2003-12-09<150>EP 03104280.7<151>2003-11-19<160>18<170>PatentIn version 3.3<210>1<211>1428<212>DNA<213>烟草<220>
<221>misc_feature<223>seedyl编码序列(CDS0689)<400>1atgagtgtgt tacaataccc agaagggatt gacccagcag atgttcagat atggaacaat 60gcagcatttg ataatggaga ttctgaagat ttgtcttcgc tgaaacgttc ttggtctcct 120ctgaaacccc tttcggttag gccatcagat tcctttgaat ctgatttgtc aagtaaggaa 180aatcaaactc ctttatttga gaattcatct gttaatctct catctccgtt acccataaag 240ccacttaacc ctaatggggc tctggaaaat tcaagactca agccgaacaa gcccaattcc 300aaacagagtc ttgatgagat ggcggctaga aagagcggaa agggaaatga tttccgtgat 360gagaagaaaa tagacgagga aattgaagaa attcagatgg agattagtag gttgagttca 420agattagagg ctttgagaat tgaaaaggct gagaaaactg ttgctaagac tgttgaaaag 480cgaggaaggg ttgtggcagc aaagtttatg gagccaaaac aaagtgttat taagattgaa 540gagcgtatat caatgagtgc aagaacaaag gtggagcaga gaaggggtct tagtttagga 600ccatctgaga tttttactgg aacgcggcgg cgagggttga gtatggggcc atcagatatt 660ctagcaggga caacaaaggc acggcaattg ggaaagcaag agatgattat tactcctatt 720cagccaatac aaaacaggcg aaagtcgtgt ttttggaagc ttcaagagat tgaagaagag 780ggaaaaagtt caagccttag tcctaaatca agaaaaactg ctgcaagaac aatggttaca 840acaaggcagg cagttactac aattgcatca aagaagaatt tgaaaaaaga tgatggactt 900ttgagttcag ttcagccaaa gaagttgttt aaagatctcg aaaagtctgc tgctgctaat 960aagaagcccc agaggccggg gagggttgtg gctagtaggt ataatcagag tacaattcag 1020tcatcagtag tgagaaagag gtctttacct gaaaatgata aggatgagag taagagaaat 1080gataagaaac ggtcgttatc tgtagggaaa acgcgtgtgt ctcaaactga gagcaagaat 1140ttgggtactg aaagtagggt gaaaaagaga tgggaaattc ctagtgagat tgtagttcat 1200ggaaacacag agagtgagaa atctccacta agcattattg tgaagcctga tttgcttccg 1260cgaattagga ttgctcggtg tgtgaatgag actcttaggg attctggacc tgctaaaaga 1320atgatagagt tgataggcaa gaaatcgttt ttcagtagtg atgaagataa ggagccacct 1380gtctgtcaag ttttaagttt tgcagaggaa gatgctgaag aggaataa 1428<210>2<211>475<212>PRT<213>烟草
<220>
<221>MISC_FEATURE<223>seedyl蛋白(CDS0689)<400>2Met Ser Val Leu Gln Tyr Pro Glu Gly Ile Asp Pro Ala Asp Val Gln1 5 10 15Ile Trp Asn Asn Ala Ala Phe Asp Asn Gly Asp Ser Glu Asp Leu Ser20 25 30Ser Leu Lys Arg Ser Trp Ser Pro Leu Lys Pro Leu Ser Val Arg Pro35 40 45Ser Asp Ser Phe Glu Ser Asp Leu Ser Ser Lys Glu Asn Gln Thr Pro50 55 60Leu Phe Glu Asn Ser Ser Val Asn Leu Ser Ser Pro Leu Pro Ile Lys65 70 75 80Pro Leu Asn Pro Asn Gly Ala Leu Glu Asn Ser Arg Leu Lys Pro Asn85 90 95Lys Pro Asn Ser Lys Gln Ser Leu Asp Glu Met Ala Ala Arg Lys Ser100 105 110Gly Lys Gly Asn Asp Phe Arg Asp Glu Lys Lys Ile Asp Glu Glu Ile115 120 125Glu Glu Ile Gln Met Glu Ile Ser Arg Leu Ser Ser Arg Leu Glu Ala130 135 140Leu Arg Ile Glu Lys Ala Glu Lys Thr Val Ala Lys Thr Val Glu Lys145 150 155 160Arg Gly Arg Val Val Ala Ala Lys Phe Met Glu Pro Lys Gln Ser Val165 170 175Ile Lys Ile Glu Glu Arg Ile Ser Met Ser Ala Arg Thr Lys Val Glu180 185 190Gln Arg Arg Gly Leu Ser Leu Gly Pro Ser Glu Ile Phe Thr Gly Thr195 200 205Arg Arg Arg Gly Leu Ser Met Gly Pro Ser Asp Ile Leu Ala Gly Thr210 215 220Thr Lys Ala Arg Gln Leu Gly Lys Gln Glu Met Ile Ile Thr Pro Ile225 230 235 240Gln Pro Ile Gln Asn Arg Arg Lys Ser Cys Phe Trp Lys Leu Gln Glu245 250 255Ile Glu Glu Glu Gly Lys Ser Ser Ser Leu Ser Pro Lys Ser Arg Lys260 265 270Thr Ala Ala Arg Thr Met Val Thr Thr Arg Gln Ala Val Thr Thr Ile275 280 285
Ala Ser Lys Lys Asn Leu Lys Lys Asp Asp Gly Leu Leu Ser Ser Val290 295 300Gln Pro Lys Lys Leu Phe Lys Asp Leu Glu Lys Ser Ala Ala Ala Asn305 310 315 320Lys Lys Pro Gln Arg Pro Gly Arg Val Val Ala Ser Arg Tyr Asn Gln325 330 335Ser Thr Ile Gln Ser Ser Val Val Arg Lys Arg Ser Leu Pro Glu Asn340 345 350Asp Lys Asp Glu Ser Lys Arg Asn Asp Lys Lys Arg Ser Leu Ser Val355 360 365Gly Lys Thr Arg Val Ser Gln Thr Glu Ser Lys Asn Leu Gly Thr Glu370 375 380Ser Arg Val Lys Lys Arg Trp Glu Ile Pro Ser Glu Ile Val Val His385 390 395 400Gly Asn Thr Glu Ser Glu Lys Ser Pro Leu Ser Ile Ile Val Lys Pro405 410 415Asp Leu Leu Pro Arg Ile Arg Ile Ala Arg Cys Val Asn Glu Thr Leu420 425 430Arg Asp Ser Gly Pro Ala Lys Arg Met Ile Glu Leu Ile Gly Lys Lys435 440 445Ser Phe Phe Ser Ser Asp Glu Asp Lys Glu Pro Pro Val Cys Gln Val450 455 460Leu Ser Phe Ala Glu Glu Asp Ala Glu Glu Glu465 470 475<210>3<211>1336<212>DNA<213>稻<220>
<221>misc_feature<223>seedyl编码序列<400>3atggaggagg acccgctcat cccgctggtc cacgtctgga acaacgccgc cttcgacgac 60tcctcgtgtt ccagatcggc ttggctcccc caaagccccg ccgtcgcggc cgtccgcaag 120ggcgacaagg agaatcaccg ccccgaggtt gttgatgtcg ccgccggcta cgacgtcgag 180gccgagatcg gccacatcga ggcggagatc ctgcgcctct cgtcccggct ccaccatctc 240cgcgtctcca agcagccgga gcccaaccgc gacgacgctc cgatggggga gatggtcgcg 300aaggtgaggc cccggccgag gggcctcagc ctcgggcccc tggatgtgat ctccatcgtc 360aatcgtgaga agcatccgct gcgcaccaag cagcctccgg cgacgcgggg cagggggctc 420agcctcgggc ccatggagat cgccgcggcg aaccctaggg tgcccgcggc ggcgcagcat 480cagcaacagc aacgcgctgg cacggcgcgg atcctgaagc caatcaagga gcctccggtg 540cagcgtcgca ggggcgtcag cctcgggccg ttggagatcc accacggcgt cggcagcaag 600gcaccagcgg cggcgcgagc caagccgttc accaccaagc tcaacgccat tcgagaagaa 660acccgaccct ccaagcaatt cgccgtcccc gccaagccat ggccgtcgag caatacaagg 720cagacactgg actcgaggca aggaacagca gcaagtcgag cgaaggcgag gagcccgagc 780
cccaggccca ggaggcaatc caatggcaag gctactgaca caaggggagg caacaaggtg 840gtggatgagc tcaagcccaa aggtgcgtcg tcaagtcaga gcggcagcgc cgccgccgcc 900gccactgcca agaggatggc ggggagctcc aagatgaggg tcatcccgag ccgctacagc 960ctcactcctg gcgcttccct tggaagcagt ggagcacagg agaggcgacg caagcagtct 1020ctcccaggat catcagggga tgcgaaccag aatgaggaaa tcagagcgaa ggtcatcgag 1080ccttccaatg atccactctc tcctcaaacg atctccaagg ttgctgaaat gctcccaaag 1140atcaggacca tgccgcctcc tgacgagagc cctcgcgatt ccggatgcgc caagcgggtt 1200gccgaattgg tcgggaagcg ctcgttcttc acggctgcag ccgaggacgg gcgggcgctc 1260gacgtcgaag cacccgaggc ggtcgcagaa gcttgagatg aaccaccatg gtttgatccg 1320ttccttccat cagctc 1336<210>4<211>431<212>PRT<213>稻<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>4Met Glu Glu Asp Pro Leu Ile Pro Leu Val His Val Trp Asn Asn Ala1 5 10 15Ala Phe Asp Asp Ser Ser Cys Ser Arg Ser Ala Trp Leu Pro Gln Ser20 25 30Pro Ala Val Ala Ala Val Arg Lys Gly Asp Lys Glu Asn His Arg Pro35 40 45Glu Val Val Asp Val Ala Ala Gly Tyr Asp Val Glu Ala Glu Ile Gly50 55 60His Ile Glu Ala Glu Ile Leu Arg Leu Ser Ser Arg Leu His His Leu65 70 75 80Arg Val Ser Lys Gln Pro Glu Pro Asn Arg Asp Asp Ala Pro Met Gly85 90 95Glu Met Val Ala Lys Val Arg Pro Arg Pro Arg Gly Leu Ser Leu Gly100 105 110Pro Leu Asp Val Ile Ser Ile Val Asn Arg Glu Lys His Pro Leu Arg115 120 125Thr Lys Gln Pro Pro Ala Thr Arg Gly Arg Gly Leu Ser Leu Gly Pro130 135 140Met Glu Ile Ala Ala Ala Asn Pro Arg Val Pro Ala Ala Ala Gln His145 150 155 160Gln Gln Gln Gln Arg Ala Gly Thr Ala Arg Ile Leu Lys Pro Ile Lys165 170 175Glu Pro Pro Val Gln Arg Arg Arg Gly Val Ser Leu Gly Pro Leu Glu180 185 190Ile His His Gly Val Gly Ser Lys Ala Pro Ala Ala Ala Arg Ala Lys195 200 205
Pro Phe Thr Thr Lys Leu Asn Ala Ile Arg Glu Glu Thr Arg Pro Ser210 215 220Lys Gln Phe Ala Val Pro Ala Lys Pro Trp Pro Ser Ser Asn Thr Arg225 230 235 240Gln Thr Leu Asp Ser Arg Gln Gly Thr Ala Ala Ser Arg Ala Lys Ala245 250 255Arg Ser Pro Ser Pro Arg Pro Arg Arg Gln Ser Asn Gly Lys Ala Thr260 265 270Asp Thr Arg Gly Gly Asn Lys Val Val Asp Glu Leu Lys Pro Lys Gly275 280 285Ala Ser Ser Ser Gln Ser Gly Ser Ala Ala Ala Ala Ala Thr Ala Lys290 295 300Arg Met Ala Gly Ser Ser Lys Met Arg Val Ile Pro Ser Arg Tyr Ser305 310 315 320Leu Thr Pro Gly Ala Ser Leu Gly Ser Ser Gly Ala Gln Glu Arg Arg325 330 335Arg Lys Gln Ser Leu Pro Gly Ser Ser Gly Asp Ala Asn Gln Asn Glu340 345 350Glu Ile Arg Ala Lys Val Ile Glu Pro Ser Asn Asp Pro Leu Ser Pro355 360 365Gln Thr Ile Ser Lys Val Ala Glu Met Leu Pro Lys Ile Arg Thr Met370 375 380Pro Pro Pro Asp Glu Ser Pro Arg Asp Ser Gly Cys Ala Lys Arg Val385 390 395 400Ala Glu Leu Val Gly Lys Arg Ser Phe Phe Thr Ala Ala Ala Glu Asp405 410 415Gly Arg Ala Leu Asp Val Glu Ala Pro Glu Ala Val Ala Glu Ala420 425 430<210>5<211>1860<212>DNA<213>Medicago trunculata<220>
<221>misc_feature<223>seedyl编码序列<400>5aaaaacgtta aggactaaaa atataataaa atttaagtag ggattcataa tggaagcacc 60cctatttaca gggatcttaa atataattaa ccctaatatt tatgacagaa acccttttga 120aatcacatcg gagcgtgtat gagtagccgt ttcacatcca acggccagta agagcgtaac 180tttatttctt ccctcttcaa tctccaacgg tcacataatc tcttccaaat acaaataatt 240ccctctttca acctcactct tcatttcttc aacccaaacc caaaaaacta atcagattct 300tcttaaatct tgaaaccttt ctcccaaaag cacttaaata aaaaagcact taaccatgaa 360
taacacaaac aacaacaaca ttcttcttca ttccacacag gttcaagtgt ggaacaacgc 420agcattcgat ggtgaagatt tcgccatgaa ttcatcttct gattccatca aagagaatct 480aaacccatcc gcattcaaca ttgttccttc ttcaaacaaa agaactattg atgatgaaat 540tgcggaaatt gaaagtgaaa ttaagcgatt aacttcgaag ctggaattgc ttcgtgttga 600aaaagctgaa agaaaaatcg cttctgaaaa gcgtgttagt ggaattggta ctggaagaat 660agtagcagcg aagtttatgg aaccgaagaa aaacgttaca ccgaaacgaa acggtgtcgt 720tttcaaggag gagacaccga aacgaaacgg tgtcgtttcg gatacgccga aatctagggt 780taattggaga agagggatga gtttaggtcc gatggagatt gccgggaaag tgatggcacc 840gccggcgatg acgattactc cggcgacggt gaatcggagg aagtcttgtt tctggaaacc 900gcaggaaagt tgtgaagtaa tgccgtcggg gattactccg gcgacggtga ataggaggaa 960atcttgtttt ttgaaacctc aagaaagttg tgaagaaaat cgaagaaaaa cgatttgcaa 1020accgaatttg aatttgaatt caaattcagt taattctgcg gttggatcga ttaagcgtgt 1080gaagaagaaa gatgaagaaa ttgctcaggt tcaaccgaag aagctgtttg aaggtgaaaa 1140atcagtgaag aaatcgttga aacaaggtag aattgttgca agccggtata attccggtgg 1200tggtggtggt gatgcgagga aaagatcgtt ttcggagaat aataagggtt tagggagtga 1260aatcagggct aagaagagat gggagatacc aattgaagaa gtggatgtga gtggttttgt 1320tatgttaccg aagatttcga caatgaggtt tgttgatgag agtcctagag attctggtgc 1380tgttaaaaga gttgctgaat tgaatggaaa aagatcttac ttttgtgatg aagatgagga 1440ggagagagtg atggtggagg aagaaggtgg ttctgtttgt caggttttga attttgctga 1500agatgatgat gatgatgatg attatggtga acaagggtaa ttgtggaaat tggaattgat 1560ttgtttttgt ggggttgtgt ggaactggct atgttctgct tgattctttt gcattttggt 1620gtgaaactaa agatgaggtg aaaagtttat gcttgttaaa ttggattggt ttatatgttt 1680tgaaataata acaacaagca tgtgtcttgc ttaataattg tatattgttt tgtttgtttt 1740ataatgatat ggatttaatt tgtatacaca atataatata gtatgcattg agagagtttt 1800tcgttcagta ttcattctga ttttagtgtt tatctcattc tagaagattg tattttgttg 1860<210>6<211>394<212>PRT<213>Medicago trunculata<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>6Met Asn Asn Thr Asn Asn Asn Asn Ile Leu Leu His Ser Thr Gln Val1 5 10 15Gln Val Trp Asn Asn Ala Ala Phe Asp Gly Glu Asp Phe Ala Met Asn20 25 30Ser Ser Ser Asp Ser Ile Lys Glu Asn Leu Asn Pro Ser Ala Phe Asn35 40 45Ile Val Pro Ser Ser Asn Lys Arg Thr Ile Asp Asp Glu Ile Ala Glu50 55 60Ile Glu Ser Glu Ile Lys Arg Leu Thr Ser Lys Leu Glu Leu Leu Arg65 70 75 80Val Glu Lys Ala Glu Arg Lys Ile Ala Ser Glu Lys Arg Val Ser Gly85 90 95Ile Gly Thr Gly Arg Ile Val Ala Ala Lys Phe Met Glu Pro Lys Lys100 105 110Asn Val Thr Pro Lys Arg Asn Gly Val Val Phe Lys Glu Glu Thr Pro115 120 125
Lys Arg Asn Gly Val Val Ser Asp Thr Pro Lys Ser Arg Val Asn Trp130 135 140Arg Arg Gly Met Ser Leu Gly Pro Met Glu Ile Ala Gly Lys Val Met145 150 155 160Ala Pro Pro Ala Met Thr Ile Thr Pro Ala Thr Val Asn Arg Arg Lys165 170 175Ser Cys Phe Trp Lys Pro Gln Glu Ser Cys Glu Val Met Pro Ser Gly180 185 190Ile Thr Pro Ala Thr Val Asn Arg Arg Lys Ser Cys Phe Leu Lys Pro195 200 205Gln Glu Ser Cys Glu Glu Asn Arg Arg Lys Thr Ile Cys Lys Pro Asn210 215 220Leu Asn Leu Asn Ser Asn Ser Val Asn Ser Ala Val Gly Ser Ile Lys225 230 235 240Arg Val Lys Lys Lys Asp Glu Glu Ile Ala Gln Val Gln Pro Lys Lys245 250 255Leu Phe Glu Gly Glu Lys Ser Val Lys Lys Ser Leu Lys Gln Gly Arg260 265 270Ile Val Ala Ser Arg Tyr Asn Ser Gly Gly Gly Gly Gly Asp Ala Arg275 280 285Lys Arg Ser Phe Ser Glu Asn Asn Lys Gly Leu Gly Ser Glu Ile Arg290 295 300Ala Lys Lys Arg Trp Glu Ile Pro Ile Glu Glu Val Asp Val Ser Gly305 310 315 320Phe Val Met Leu Pro Lys Ile Ser Thr Met Arg Phe Val Asp Glu Ser325 330 335Pro Arg Asp Ser Gly Ala Val Lys Arg Val Ala Glu Leu Asn Gly Lys340 345 350Arg Ser Tyr Phe Cys Asp Glu Asp Glu Glu Glu Arg Val Met Val Glu355 360 365Glu Glu Gly Gly Ser Val Cys Gln Val Leu Asn Phe Ala Glu Asp Asp370 375 380Asp Asp Asp Asp Asp Tyr Gly Glu Gln Gly385 390<210>7<211>674<212>DNA<213>甘蔗属物种<220>
<221>misc_feature
<223>seedyl编码序列(部分5’端)<220>
<221>misc_feature<222>(362)..(362)<223>n可以是a,c,g或t<220>
<221>misc_feature<222>(372)..(372)<223>n可以是a,c,g或t<220>
<221>misc_feature<222>(674)..(674)<223>n可以是a,c,g或t<400>7cgcaccgcga gtttcgaaaa accaacctat cgcgcctcag atcacgcgag gacgcgaggg 60gaagcaggaa tccctccgct cccagccgcc tcctccgctc acccatcgat cgatcgtccg 120tccggtccag ggggctctcc ggcggcggtg gcgatggagg aggacccgct catcccgctg 180gtgcacgtct ggaacaacgc cgccttcgac cacgcctcct cctccgcgtg gcacgcccac 240tcccctgtgc ccgcgagcgc acgtcgcgag gcggaggggg acaaggagaa ccaccgcccc 300gaccccgacc ccgacgtcga ggcggagatc ggccacatcg aggcggagat cctgcgcctg 360tnctcccgcc tncaccacct tcgcacctcc aagcagtcgg agccgtccaa gcgcggagag 420gtcgcgcccg cgcccgcggc gaaggcgaaa gcggcggcgg cggcgcggct gcggacgcgg 480gggctcagcc tgggcccgct cgacgtcgcc gctgccggta accccaaccc gctcaccacc 540gacaaccagc agcagcagcc gcgtgccgcg cagggtctga agccgatcaa gcaggccacg 600gcggcggcgg gcaagggcgt aagacttggg ccccttcgac atggtcggcg cgaaccctag 660ggtccctccg cccn674<210>8<211>166<212>PRT<213>甘蔗属物种<220>
<221>MISC_FEATURE<223>seedyl蛋白<220>
<221>MISC_FEATURE<223>seedyl蛋白(部分N端)<220>
<221>MISC_FEATURE<222>(70)..(70)<223>Xaa可以是任何氨基酸<400>8Met Glu Glu Asp Pro Leu Ile Pro Leu Val His Val Trp Asn Asn Ala1 5 10 15Ala Phe Asp His Ala Ser Ser Ser Ala Trp His Ala His Ser Pro Val20 25 30Pro Ala Ser Ala Arg Arg Glu Ala Glu Gly Asp Lys Glu Asn His Arg35 40 45
Pro Asp Pro Asp Pro Asp Val Glu Ala Glu Ile Gly His Ile Glu Ala50 55 60Glu Ile Leu Arg Leu Xaa Ser Arg Leu His His Leu Arg Thr Ser Lys65 70 75 80Gln Ser Glu Pro Ser Lys Arg Gly Glu Val Ala Pro Ala Pro Ala Ala85 90 95Lys Ala Lys Ala Ala Ala Ala Ala Arg Leu Arg Thr Arg Gly Leu Ser100 105 110Leu Gly Pro Leu Asp Val Ala Ala Ala Gly Asn Pro Asn Pro Leu Thr115 120 125Thr Asp Asn Gln Gln Gln Gln Pro Arg Ala Ala Gln Gly Leu Lys Pro130 135 140Ile Lys Gln Ala Thr Ala Ala Ala Gly Lys Gly Val Arg Leu Gly Pro145 150 155 160Leu Arg His Gly Arg Arg165<210>9<211>876<212>DNA<213>玉蜀黍<220>
<221>misc_feature<223>seedyl编码序列(部分3’端)<220>
<221>misc_feature<222>(869)..(869)<223>n=a,c,g或t<400>9ccacgcgtcc ggccgttcga gaggaggaag gccagcgttc caaggagcac gccgtccccg 60ccagaccgtg gccatccagc aatgccaggc acccactgga tgccaggcaa ggcaccgcag 120caagcagagc caaggcgagg agcgggagca taagccccag caggttcagg aggcagtcca 180cttccaaggc tgccgagaca agagcgggaa atgccaagcc tacagaggcg acgaggggag 240ggagcgaagc ggtcaatcac accagcaatg tagccacgac gaagaggccg gcggggagct 300ccaaggtcag ggttgtcccg agccgctaca gcatcccacc tggctcctcc ctagcagctg 360tgacacaagg caaccgatgc aagcagtctc tcccaggatc ggctactgag accagagtaa 420atctcactga gccgccgaac gacgagttgt ctcctgaaga acttgccaag gttgcagagc 480tgctcccaag gattaggacc atgccgcctt ctgatgagag cccgcgtgac tcgggatgtg 540ccaagcgtgt tgctgatttg gtcgggaagc gatccttctt cactgctgca ggggacgatg 600gcaatctcgt tacgccctac caggcacggg tggttgaact tgaatcaccc gaggcagcag 660cagaagaagc agaagcttga gaagtttgtc tttgatcaat tccgaagtgg cttgcatctg 720ggcgtggcct ctttttgcag tgtgtgctac tacatagtct actgttacat tcatatcata 780tcacatttcc tattttttcc cccttgagac attgcttagt acttttgtgt tgccttgtga 840aaagagagtg gaaggttcat ctgctgatnc cttgtt876<210>10<211>224<212>PRT<213>玉蜀黍
<220>
<221>MISC_FEATURE<223>seedyl蛋白(部分C端)<400>10Thr Arg Pro Ala Val Arg Glu Glu Glu Gly Gln Arg Ser Lys Glu His1 5 10 15Ala Val Pro Ala Arg Pro Trp Pro Ser Ser Asn Ala Arg His Pro Leu20 25 30Asp Ala Arg Gln Gly Thr Ala Ala Ser Arg Ala Lys Ala Arg Ser Gly35 40 45Ser Ile Ser Pro Ser Arg Phe Arg Arg Gln Ser Thr Ser Lys Ala Ala50 55 60Glu Thr Arg Ala Gly Asn Ala Lys Pro Thr Glu Ala Thr Arg Gly Gly65 70 75 80Ser Glu Ala Val Asn His Thr Ser Asn Val Ala Thr Thr Lys Arg Pro85 90 95Ala Gly Ser Ser Lys Val Arg Val Val Pro Ser Arg Tyr Ser Ile Pro100 105 110Pro Gly Ser Ser Leu Ala Ala Val Thr Gln Gly Asn Arg Cys Lys Gln115 120 125Ser Leu Pro Gly Ser Ala Thr Glu Thr Arg Val Asn Leu Thr Glu Pro130 135 140Pro Asn Asp Glu Leu Ser Pro Glu Glu Leu Ala Lys Val Ala Glu Leu145 150 155 160Leu Pro Arg Ile Arg Thr Met Pro Pro Ser Asp Glu Ser Pro Arg Asp165 170 175Ser Gly Cys Ala Lys Arg Val Ala Asp Leu Val Gly Lys Arg Ser Phe180 185 190Phe Thr Ala Ala Gly Asp Asp Gly Asn Leu Val Thr Pro Tyr Gln Ala195 200 205Arg Val Val Glu Leu Glu Ser Pro Glu Ala Ala Ala Glu Glu Ala Glu210 215 220<210>11<211>1257<212>DNA<213>拟南芥<220>
<221>misc_feature<223>seedyl编码序列<400>11atgacatcaa ttgaggcaac agaaacgctt aacgctcctc caaagcttca gatctggaac 60
aacgctgcct tcgacgatgg agattctcaa atcacttccg ccatcgaagc ttcttcttgg 120tctcacctca acgaatcatt cgattccgat tgtagcaagg agaatcagtt tccgatttcg 180gtttcctctt cgctccaatc ctcagtctcg atcaccgaag ctccgtcagc aaaatccaag 240accgtgaaga ccaaatccgc cgcagatcgg agtaaaaagc gagatatcga tgcagagatc 300gaagaagtag agaaggagat cggacgatta tcgacgaaat tggagtcgct ccgattagag 360aaggcggagc aaaccgcaag aagcattgct atacgtggaa gaatcgttcc ggcgaagttc 420atggaatcat ctcagaaaca agtgaaattc gacgattcgt gttttacagg atcgaaatca 480agagccactc gtagaggcgt tagtcttgga ccagcggaga tattcaattc cgcgaagaaa 540tctgaaactg tgactcctct tcaatcagct cagaatcgac gcaagtcttg tttctttaag 600cttcctggaa tcgaagaagg tcaagtgacg acacgaggta aaggaagaac gagtttgagt 660ctgagtccga gatctcgcaa agcgaaaatg acggcagctc agaagcaagc agctacgacg 720gtggggtcaa agagagctgt gaagaaagaa gaaggagttc tcttaacaat ccagcctaag 780aggctattca aagaagatga aaagaatgtt tctttaagga aaccattgaa accaggaaga 840gttgtggcta gtaggtacag tcaaatgggt aaaacgcaga ctggagagaa agatgttagg 900aaaaggtcgt tgcctgagga tgaagagaaa gagaatcata agaggtcgga gaagagaaga 960gcttctgatg aaagtaacaa gagtgaaggg agagtgaaga agagatggga gattccaagt 1020gaagttgatc tgtatagcag tggtgagaac ggtgacgagt ctcctatagt taaggagcta 1080cctaagatca gaacgcttcg tcgtgtggga gggagccctc gtgattcagg tgctgctaag 1140agagttgcag aattacaagc caaggatcgt aacttcactt tttgccagct tctgaagttt 1200gaagaatgaa tgatccgctt atcaatttga gtaaaatcca caactcttgt tgtggtt 1257<210>12<211>402<212>PRT<213>拟南芥<220>
<221>MISC_FEATURE<223>seedyl蛋白<400>12Met Thr Ser Ile Glu Ala Thr Glu Thr Leu Asn Ala Pro Pro Lys Leu1 5 10 15Gln Ile Trp Asn Asn Ala Ala Phe Asp Asp Gly Asp Ser Gln Ile Thr20 25 30Ser Ala Ile Glu Ala Ser Ser Trp Ser His Leu Asn Glu Ser Phe Asp35 40 45Ser Asp Cys Ser Lys Glu Asn Gln Phe Pro Ile Ser Val Ser Ser Ser50 55 60Leu Gln Ser Ser Val Ser Ile Thr Glu Ala Pro Ser Ala Lys Ser Lys65 70 75 80Thr Val Lys Thr Lys Ser Ala Ala Asp Arg Ser Lys Lys Arg Asp Ile85 90 95Asp Ala Glu Ile Glu Glu Val Glu Lys Glu Ile Gly Arg Leu Ser Thr100 105 110Lys Leu Glu Ser Leu Arg Leu Glu Lys Ala Glu Gln Thr Ala Arg Ser115 120 125Ile Ala Ile Arg Gly Arg Ile Val Pro Ala Lys Phe Met Glu Ser Ser130 135 140Gln Lys Gln Val Lys Phe Asp Asp Ser Cys Phe Thr Gly Ser Lys Ser
145 150 155 160Arg Ala Thr Arg Arg Gly Val Ser Leu Gly Pro Ala Glu Ile Phe Asn165 170 175Ser Ala Lys Lys Ser Glu Thr Val Thr Pro Leu Gln Ser Ala Gln Asn180 185 190Arg Arg Lys Ser Cys Phe Phe Lys Leu Pro Gly Ile Glu Glu Gly Gln195 200 205Val Thr Thr Arg Gly Lys Gly Arg Thr Ser Leu Ser Leu Ser Pro Arg210 215 220Ser Arg Lys Ala Lys Met Thr Ala Ala Gln Lys Gln Ala Ala Thr Thr225 230 235 240Val Gly Ser Lys Arg Ala Val Lys Lys Glu Glu Gly Val Leu Leu Thr245 250 255Ile Gln Pro Lys Arg Leu Phe Lys Glu Asp Glu Lys Asn Val Ser Leu260 265 270Arg Lys Pro Leu Lys Pro Gly Arg Val Val Ala Ser Arg Tyr Ser Gln275 280 285Met Gly Lys Thr Gln Thr Gly Glu Lys Asp Val Arg Lys Arg Ser Leu290 295 300Pro Glu Asp Glu Glu Lys Glu Asn His Lys Arg Ser Glu Lys Arg Arg305 310 315 320Ala Ser Asp Glu Ser Asn Lys Ser Glu Gly Arg Val Lys Lys Arg Trp325 330 335Glu Ile Pro Ser Glu Val Asp Leu Tyr Ser Ser Gly Glu Asn Gly Asp340 345 350Glu Ser Pro Ile Val Lys Glu Leu Pro Lys Ile Arg Thr Leu Arg Arg355 360 365Val Gly Gly Ser Pro Arg Asp Ser Gly Ala Ala Lys Arg Val Ala Glu370 375 380Leu Gln Ala Lys Asp Arg Asn Phe Thr Phe Cys Gln Leu Leu Lys Phe385 390 395 400Glu Glu<210>13<211>3074<212>DNA<213>人工序列<220>
<223>[PRO00090-CDS0689-终止子]表达盒的序列
<400>13cttctacatc ggcttaggtg tagcaacacg actttattat tattattatt attattatta 60ttattttaca aaaatataaa atagatcagt ccctcaccac aagtagagca agttggtgag 120ttattgtaaa gttctacaaa gctaatttaa aagttattgc attaacttat ttcatattac 180aaacaagagt gtcaatggaa caatgaaaac catatgacat actataattt tgtttttatt 240attgaaatta tataattcaa agagaataaa tccacatagc cgtaaagttc tacatgtggt 300gcattaccaa aatatatata gcttacaaaa catgacaagc ttagtttgaa aaattgcaat 360ccttatcaca ttgacacata aagtgagtga tgagtcataa tattattttc tttgctaccc 420atcatgtata tatgatagcc acaaagttac tttgatgatg atatcaaaga acatttttag 480gtgcacctaa cagaatatcc aaataatatg actcacttag atcataatag agcatcaagt 540aaaactaaca ctctaaagca accgatggga aagcatctat aaatagacaa gcacaatgaa 600aatcctcatc atccttcacc acaattcaaa tattatagtt gaagcatagt agtaatttaa 660atcaactagg gatatcacaa gtttgtacaa aaaagcaggc tggtaccggt ccggaattcc 720cgggatatcg tcgacccacg cgtccgctga cgcgtgggtt ccactacatc aagacatcta 780ctacactcat cttttttgca cttattgggt gtaaattttt gaaacccagt tgagaaaaat 840gagtgtgtta caatacccag aagggattga cccagcagat gttcagatat ggaacaatgc 900agcatttgat aatggagatt ctgaagattt gtcttcgctg aaacgttctt ggtctcctct 960gaaacccctt tcggttaggc catcagattc ctttgaatct gatttgtcaa gtaaggaaaa 1020tcaaactcct ttatttgaga attcatctgt taatctctca tctccgttac ccataaagcc 1080acttaaccct aatggggctc tggaaaattc aagactcaag ccgaacaagc ccaattccaa 1140acagagtctt gatgagatgg cggctagaaa gagcggaaag ggaaatgatt tccgtgatga 1200gaagaaaata gacgaggaaa ttgaagaaat tcagatggag attagtaggt tgagttcaag 1260attagaggct ttgagaattg aaaaggctga gaaaactgtt gctaagactg ttgaaaagcg 1320aggaagggtt gtggcagcaa agtttatgga gccaaaacaa agtgttatta agattgaaga 1380gcgtatatca atgagtgcaa gaacaaaggt ggagcagaga aggggtctta gtttaggacc 1440atctgagatt tttactggaa cgcggcggcg agggttgagt atggggccat cagatattct 1500agcagggaca acaaaggcac ggcaattggg aaagcaagag atgattatta ctcctattca 1560gccaatacaa aacaggcgaa agtcgtgttt ttggaagctt caagagattg aagaagaggg 1620aaaaagttca agccttagtc ctaaatcaag aaaaactgct gcaagaacaa tggttacaac 1680aaggcaggca gttactacaa ttgcatcaaa gaagaatttg aaaaaagatg atggactttt 1740gagttcagtt cagccaaaga agttgtttaa agatctcgaa aagtctgctg ctgctaataa 1800gaagccccag aggccgggga gggttgtggc tagtaggtat aatcagagta caattcagtc 1860atcagtagtg agaaagaggt ctttacctga aaatgataag gatgagagta agagaaatga 1920taagaaacgg tcgttatctg tagggaaaac gcgtgtgtct caaactgaga gcaagaattt 1980gggtactgaa agtagggtga aaaagagatg ggaaattcct agtgagattg tagttcatgg 2040aaacacagag agtgagaaat ctccactaag cattattgtg aagcctgatt tgcttccgcg 2100aattaggatt gctcggtgtg tgaatgagac tcttagggat tctggacctg ctaaaagaat 2160gatagagttg ataggcaaga aatcgttttt cagtagtgat gaagataagg agccacctgt 2220ctgtcaagtt ttaagttttg cagaggaaga tgctgaagag gaataatgtg taataaaggg 2280agctgctaac tcttttcatg ctctttcaat tttcaatcct gccttttaat ttttgttcat 2340tcgtgccttt taattgaatg gggaagcatt cttttgcttc ctcaaactgg tattctagct 2400tctgaattac attgtatggt acaatatgaa taaggttttg tcttccggca ggttgtccaa 2460gttagttttt agcttaaaat agatgcggca gcggccgctc tagagtatcc ctcgaggggc 2520ccaagcttac gcgtacccag ctttcttgta caaagtggtg atatcacaag cccgggcggt 2580cttctaggga taacagggta attatatccc tctagatcac aagcccgggc ggtcttctac 2640gatgattgag taataatgtg tcacgcatca ccatgggtgg cagtgtcagt gtgagcaatg 2700acctgaatga acaattgaaa tgaaaagaaa aaaagtactc catctgttcc aaattaaaat 2760tcattttaac cttttaatag gtttatacaa taattgatat atgttttctg tatatgtcta 2820atttgttatc atccgggcgg tcttctaggg ataacagggt aattatatcc ctctagacaa 2880cacacaacaa ataagagaaa aaacaaataa tattaatttg agaatgaaca aaaggaccat 2940atcattcatt aactcttctc catccatttc catttcacag ttcgatagcg aaaaccgaat 3000aaaaaacaca gtaaattaca agcacaacaa atggtacaag aaaaacagtt ttcccaatgc 3060cataatactc gaac3074<210>14<211>668<212>DNA<213>稻
<220>
<221>misc_feature<223>谷醇溶蛋白RP6启动子序列<400>14ccttctacat cggcttaggt gtagcaacac gactttatta ttattattat tattattatt 60attattttac aaaaatataa aatagatcag tccctcacca caagtagagc aagttggtga 120gttattgtaa agttctacaa agctaattta aaagttattg cattaactta tttcatatta 180caaacaagag tgtcaatgga acaatgaaaa ccatatgaca tactataatt ttgtttttat 240tattgaaatt atataattca aagagaataa atccacatag ccgtaaagtt ctacatgtgg 300tgcattacca aaatatatat agcttacaaa acatgacaag cttagtttga aaaattgcaa 360tccttatcac attgacacat aaagtgagtg atgagtcata atattatttt tcttgctacc 420catcatgtat atatgatagc cacaaagtta ctttgatgat gatatcaaag aacattttta 480ggtgcaccta acagaatatc caaataatat gactcactta gatcataata gagcatcaag 540taaaactaac actctaaagc aaccgatggg aaagcatcta taaatagaca agcacaatga 600aaatcctcat catccttcac cacaattcaa atattatagt tgaagcatag tagtagaatc 660caacaaca 668<210>15<211>7<212>PRT<213>人工序列<220>
<223>基序1核心序列<220>
<221>MISC_FEATURE<222>(2)..(2)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(5)..(6)<223>Xaa可以是任何氨基酸<400>15Trp Xaa Asn Ala Xaa Xaa Asp1 5<210>16<211>6<212>PRT<213>人工序列<220>
<223>基序2核心序列<220>
<221>MISC_FEATURE<222>(4)..(5)<223>Xaa可以是任何氨基酸<400>16Lys Glu Asn Xaa Xaa Pro1 5<210>17<211>15
<212>PRT<213>人工序列<220>
<223>基序3(卷曲螺旋)核心序列<220>
<221>MISC_FEATURE<222>(2)..(2)<223>Xaa可以是1至6个氨基酸的链<220>
<221>MISC_FEATURE<222>(4)..(5)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(8)..(10)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(12)..(13)<223>Xaa可以是任何氨基酸<400>17Glu Xaa Glu Xaa Xaa Arg Leu Xaa Xaa Xaa Leu Xaa Xaa Leu Arg1 5 10 15<210>18<211>15<212>PRT<213>人工序列<220>
<223>基序4核心序列<220>
<221>MISC_FEATURE<222>(3)..(3)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(5)..(5)<223>Xaa可以是1至10个氨基酸的链<220>
<221>MISC_FEATURE<222>(10)..(11)<223>Xaa可以是任何氨基酸<220>
<221>MISC_FEATURE<222>(14)..(14)<223>Xaa可以是1至6个氨基酸的链<400>18
Leu Pro Xaa Ile Xaa Arg Asp Ser Gly Xaa Xaa Lys Arg Xaa Lys1 5 10 1权利要求
1.相对于相应野生型植物改变植物的生长特征的方法,包括改变在植物中seedy1核酸的表达和/或改变植物中seedy1蛋白的水平和/或活性。
2.根据权利要求1的方法,其中所述的表达和/或活性和/或水平的改变可以通过在seedy1基因的基因座中引入遗传修饰而实现。
3.根据权利要求2的方法,其中所述的遗传修饰通过下列中的任何一项或者多项实现T-DNA激活、tilling、定点诱变、同源重组或者在植物中引入和表达seedy1核酸/基因或者其部分或者能够与seedy1核酸/基因杂交的序列,所述的核酸编码seedy1蛋白或者其同源物、衍生物或活性片段。
4.根据权利要求2或3的方法,其中所述的seedy1核酸/基因或者其部分或者能够与所述seedy1核酸/基因杂交的序列在植物中过表达。
5.根据权利要求1到4的任何一项的方法,其中所述的seedy1核酸来自植物,优选来自双子叶植物,更优选来自茄科,更优选来自烟草属。
6.根据权利要求1到5的任何一项的方法,其中所述的seedy1核酸与种子偏好启动子有效连接。
7.根据权利要求6的方法,其中所述的种子偏好启动子是谷醇溶蛋白启动子。
8.根据权利要求1到7的任何一项的方法,其中所述的改变的生长特征选自下列中的任何一项或者多项增加的产量、增加的生物量以及改变的植物结构,其中每一项均相对于相应的野生型植物而言。
9.根据权利要求8的方法,其中所述的增加的产量是增加的种子产量。
10.根据权利要求8的方法,其中所述的改变的结构包含增加的生物量和增加的复总状花序数目。
11.通过根据权利要求1-10中任何一项的方法可以获得的植物或者植物细胞。
12.遗传构建体,其包含(i)编码seedy1蛋白的seedy1核酸;(ii)能够调控(i)的核酸表达的一个或多个控制序列;以及任选的(iii)转录终止序列。
13.根据权利要求12的构建体,其中所述的控制序列是启动子,优选是种子偏好的启动子。
14.用根据权利要求12或13的构建体转化的植物或者植物细胞。
15.产生具有改变的生长特征的转基因植物的方法,该方法包括(i)向植物或者植物部分中引入编码seedy1蛋白的seedy1核酸;(ii)在促进再生和成熟植物生长的条件下培养植物细胞。
16.相对于相应野生型植物或者植物细胞具有改变的生长特征的转基因植物或者植物细胞,其中所述改变的生长特征由引入所述植物或植物细胞中的seedy1核酸引起。
17.根据权利要求11、14或16中任何一项的转基因植物或植物细胞,其中所述的植物是单子叶植物例如甘蔗,或者其中所述的植物是作物植物例如大豆、向日葵、canola、紫花苜蓿、油菜籽(rapeseed)、棉花、番茄、马铃薯或者烟草,或者其中植物是谷物例如稻、玉米、小麦、大麦、粟、黑麦、高粱或者燕麦。
18.根据权利要求11、14、16或17中任何一项的植物的可收获部分,其中所述的可收获部分优选是种子。
19.分离的seedy1核酸和/或seedy1蛋白用于改变植物的生长特征的用途,其中所述生长特征选自下列中的任何一个或多个增加的产量、增加的生物量以及改变的植物结构。
20.分离的seedy1核酸和/或seedy1蛋白用于植物育种的用途。
21.分离的seedy1蛋白,其从N端到C端按照下面的顺序包含下面各项(i)与SEQ ID NO 15表示的序列具有至少80%序列一致性的基序;以及(ii)与SEQ ID NO 16表示的序列具有至少80%序列一致性的基序;以及(iii)与SEQ ID NO 17表示的序列具有至少80%序列一致性的基序,其中该基序是卷曲螺旋基序;以及(iv)与SEQ ID NO 18表示的序列具有至少80%序列一致性的基序,条件是所述seedy1蛋白不是保存于GenBank中具有NCBI登录编号AL161572的拟南芥属植物蛋白(SEQ ID NO 12)。
22.根据权利要求21的分离的seedy1蛋白,其中根据SEQ ID NO15的基序是由(P/X)X((V/L/H)(Q/H)(V/I)W(N/X)NA(A/P)(F/C)D表示的基序,其中X可以是任何氨基酸,且其中(P/X)优选是P或者是A或T或Q或者另一种氨基酸(V/L/H)优选是V或L或H(Q/H)是Q或H(V/I)是V或者是T或S或者另一种氨基酸(A/P)优选是A或者是P(F/C)优选是F或者是C。
23.根据权利要求21的分离的seedy1蛋白,其中根据SEQ ID NO17的基序是由(I/V/A)(D/E)XE(I/M)XX(I/V)(E/Q)XE(I/X)XRL(S/X)(S/X)(R/K)LXXLR(L/V/T/I)X(K/Q)表示的基序,其中X可以是任何氨基酸,且其中(I/V/A)优选是I或V或者是A(D/E)是D或E(I/M)优选是I或者是M(I/V)优选是I或者是V(E/Q)优选是E或者是Q(I/X)优选是I或者是M或者是V或者任何其他氨基酸(S/X)优选是S或者是T或者任何其他氨基酸(S/X)优选是S或者是T或L或I或A(R/K)优选是R或者是K(L/V/T/I)优选是L或T或V或I(K/Q)优选是K或Q并且该基序是卷曲螺旋基序。
24.根据权利要求21的分离的seedy1蛋白,其中根据SEQ ID NO18的所述基序是由LP(R/K)I(R/X)(T/I)(M/X)(P/R)XX(D/X)(E/G)(S/T)(P/L)RDSG(C/X)(A/X)KR(V/X)(A/I)(D/E)(L/R)(V/X)(G/A)K表示的基序,其中X可以是任何氨基酸,且其中(R/K)是R或K(R/X)优选是R或者是S或K(T/I)优选是T或I(M/X)优选是M或L或A或V(P/R)是P或R(D/X)优选是D或者是G或T或N(E/G)优选是E或者是G(S/T)优选是S或者是T(P/L)优选是P或者是L(C/X)优选是C或者是P或A(A/X)优选是A或者是V或I(A/I)优选是A或是I(D/E)是D或E(L/R)优选是L或者是R(V/X)优选是V或者是Q或N或I(G/A)优选是G或者是A。
25.分离的seedy1核酸/基因,其选自(i)SEQ ID NO1,5或7中的任何一个表示的核酸或者上述任何一个的互补核酸;(ii)SEQ ID NO2,4,6,8或10表示的氨基酸序列的编码核酸;(iii)上述(i)或(ii)的同源物、衍生物或者活性片段的编码核酸;(iv)能够与上述(i)、(ii)或(iii)的核酸杂交的核酸;(v)上述(i)到(iv)核酸中任何一个的遗传密码简并核酸;(vi)属于上述(i)到(v)中任何一个核酸的等位变体的核酸;(vii)属于上述(i)到(vi)中任何一个核酸的可变剪接变体的核酸;(viii)与上述(i)到(vii)中定义的任何一个或多个序列具有至少21%,22%,23%,24%,25%,26%,27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,46%,47%,48%,49%,50%,60%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%序列一致性的蛋白质的编码核酸,其中优选的级别随一致性的增加而增加;(ix)根据上述(i)到(viii)任何一项的核酸的部分;其中上述(i)到(ix)的核酸编码seedy1蛋白,条件是该分离的核酸不是保存于GenBank中具有登录号AK063941的稻cDNA(SEQ ID NO3)、以AC144618,AC139356,AC144482或AC135566保存的苜蓿属植物BAC克隆、以AL61572保存的拟南芥属植物cDNA(SEQ ID NO 11)或者以AY108162保存的玉蜀黍EST(SEQ ID NO 9)。
全文摘要
本发明涉及的是相对于相应野生型植物改变植物的生长特征的方法,包括改变植物中seedyl核酸的表达和/或改变植物中seedyl蛋白的水平和/或活性。本发明还涉及新的构建体和新的seedyl核酸和蛋白序列。
文档编号C12N15/82GK1902219SQ200480039892
公开日2007年1月24日 申请日期2004年11月19日 优先权日2003年11月19日
发明者V·弗兰卡德, V·米洛诺夫 申请人:作物培植股份有限公司