来源于拟南芥的重组修复基因mim的制作方法

文档序号:560440阅读:517来源:国知局
专利名称:来源于拟南芥的重组修复基因mim的制作方法
技术领域
本发明涉及编码促进植物细胞中DNA损伤重组修复的蛋白质的DNA。
所有生物的细胞都形成了一系列对抗DNA损伤的有害作用的DNA修复途径,并由复杂的信号级联放大引发。植物中的同源重组通过修复损伤的染色体稳定基因组,同时通过产生新基因和新的遗传连锁产生遗传变异性。通过重组修复DNA损伤对于处于外源和内源基因毒性应激下的细胞特别有意义,因为这能消除大量的DNA损伤。目前对引起植物中减数分裂重组和体细胞重组和DNA修复的遗传组成与分子组成的认识还很有限。为了能用基因技术修饰或改善DNA修复,鉴定参与该途径或级联的关键蛋白质是必要的。因此,本发明的主要目的在于提供含有一种编码这种关键蛋白质的开放阅读框的DNA。
在本发明说明书中,所提及的基因被理解为与调节序列有关的DNA编码序列,它使该编码序列能转录为RNA如mRNA、rRNA、tRNA、snRNA、有义RNA或反义RNA。调节序列的实例包括启动子序列、5’和3’非翻译序列、内含子和终止序列。
启动子是指一种起始相关DNA序列转录的DNA序列,也可包括作为基因表达调节物的元件,如激活物、增强子或阻抑物。
基因的表达是指其在活细胞中转录为RNA或其转录随后翻译为蛋白质。
术语细胞的转化是指核酸向宿主细胞中的引入,特别是DNA分子向该细胞基因组中的稳定整合。本发明描述了-含有一种开放阅读框的DNA,该开放阅读框编码特征在于与SEQID NO:3有30%或更高同一性的氨基酸序列的蛋白质,-该开放阅读框所编码的蛋白质,和
-一种聚合酶链反应,其中至少一种使用的寡核苷酸包含代表SEQID NO:1的15个或更多碱基对的核苷酸序列。
本发明特别公开了·含有一种开放阅读框的DNA,该开放阅读框编码一种含有与SMC蛋白家族蛋白质成员的一段对比氨基酸有50%或更高序列同一性的一段100个或更多氨基酸的蛋白质;·DNA,其中该开放阅读框编码一种特征在于SEQ ID NO:3的氨基酸序列的蛋白质;·特征在于SEQ ID NO:1或SEQ ID NO:2的核苷酸序列的DNA;·DNA,其中该开放阅读框编码一种促进植物细胞中DNA损伤重组修复的蛋白质;·DNA,其中该开放阅读框编码一种提供对甲磺酸甲酯(MMS)处理超敏感性的蛋白质;·DNA,其中该开放阅读框编码一种提供对X射线、紫外线或丝裂霉素C处理超敏感性的蛋白质;·DNA,其中该开放阅读框编码一种蛋白质,该蛋白质含有一个NTP结合区,随后是第一个卷曲螺旋区,一个绞链区或间隔区,和第二个卷曲螺旋区,随后是具有一个Walker B型NTP结合域的C末端DA盒;和·一种产生所述DNA的方法,其包括-筛查DNA文库,筛选能与SEQ ID NO:1所示DNA片段杂交的克隆,其中该片段具有至少15个核苷酸的长度;-将杂交的克隆测序;-纯化克隆的载体DNA,其含有一种编码与SEQ ID NO:3有超过40%序列同一性的蛋白质的开放阅读框;-任选地进一步处理纯化的DNA。
根据本发明的DNA含有一种开放阅读框,其编码一种特征在于与SEQ ID NO:3有30%或更高总体同一性的氨基酸序列的蛋白质。借助于对甲磺酸甲酯(MMS)显示超敏感性的T-DNA标记的拟南芥突变体,追踪特征在于SEQ ID NO:3的蛋白质。该突变体也对X射线、紫外线和丝裂霉素C敏感,这进一步支持了相应的野生型基因参与DNA损伤修复的观点。最后,发现该突变体对升高的温度比野生型更敏感。由于这种成倍提高的敏感性,该突变体被称为mim(对MMS、辐照、丝裂霉素C敏感)。相应的野生型基因被称为MIM。野生型植物与突变mim基因纯合的植物的F1杂种不显示突变表型,表明为隐性突变。与野生型回交产生的F2幼苗群体的分离表明该突变作为隐性孟德尔性状而遗传。
动态编程算法产生不同种类的序列对比。通常存在两种方法用于序列对比。Needleman和Wunsch及Sellers提出的算法可对比两种全长序列,假如这些序列的总体对比产生总体序列同一性的百分值。另一方面,Smith-Waterman算法产生局部对比。局部对比用来在选择评分矩阵和罚区间时对比最相似的序列中的区域对。这使得数据库搜索能集中于最高度保守的序列区域。这也使得能鉴定序列中的相似结构域。为了用Smith-Waterman算法加速对比,BLAST(基本局部对比搜索工具)和FASTA对序列对比有另外的限制。
在本发明说明书中,序列对比用BLAST常规进行,BLAST是一组相似性搜索程序,用于探查所有可得到的序列数据库,而不论查询是蛋白质还是DNA。该搜索工具的BLAST 2.0版(缺口BLAST)已在因特网上公开(当前http://www.ncbi.nlm.nih.gov/BLAST/)。与总体对比相反它使用搜索局部的试探性算法,因此能探明共有分离区的序列之间的关系。BLAST搜索中分配的得分有明确的统计学解释。在本发明范围内特别有用的是可在局部序列对比中引入缺口的blastp程序和PSI-BLAST程序,这两种程序都能将氨基酸查询序列与蛋白质序列数据库相比较,而blastp变化程序只允许两种序列的局部对比。优选地将可选参数设置为缺省值运行这些程序。
使用可商业获得的基于众所周知的序列同一性或相似性探索算法的计算机程序对SEQ ID NO:3的序列对比显示,具有106个氨基酸长度的一段SEQ ID NO:3显示与对比的一段粟酒裂殖酵母(S.pombe)rad18基因-SMC(染色体结构保持)蛋白质家族的一个成员一有高达47%的序列同一性。尽管SMC蛋白之间的总体同一性或同源性通常较低,但在SMC蛋白和MIM之间,N端或C端的保守基序显示明显的同一性或同源性,MIM与包括也参与DNA修复的RHC18和rad18的一个SMC蛋白新亚家族有最高同一性。
SEQ ID NO:3的总体对比得到低于30%的序列同一性。因此,本发明定义了一种新的蛋白质家族,其成员在总体对比后显示与SEQ ID NO:3有30%或更高的氨基酸序列同一性。优选地,总体氨基酸序列同一性高于55%,甚至高于70%。最优选的是总体同一性高于90%。
在本发明的一个优选实施方案中,这种新蛋白质家族含有与SMC蛋白家族的蛋白质成员(如SEQ ID NO:3所示蛋白质的一段对比氨基酸)有50%或更高序列同一性的一段100个或更多的氨基酸。
SEQ ID NO:1描述了根据本发明的DNA的一个实例。所编码的蛋白质的氨基酸序列与SEQ ID NO:3相同。在与酿酒酵母(S.cerevisiae)RHC18氨基酸序列对比后,53个氨基酸的一段显示与对比的RHC18序列有54%的序列同一性。因此,根据本发明,能定义一种与SMC蛋白相关的蛋白质家族,其成员在一段超过50个氨基酸长度的序列对比后,显示与SEQ ID NO:3有55%或更高的氨基酸序列同一性。优选地,氨基酸序列同一性高于70%,甚至高于80%。当进行多重序列对比时,某些算法如BLAST除序列同一性之外还可能考虑序列相似性,例如,单个氨基酸的相同净电荷或相当的疏水性/亲水性。因此,它们评价用一种氨基酸代替另一种氨基酸是能保留保持蛋白质结构和功能所必需的物理和化学性质,还是更可能破坏蛋白质的基本结构和功能特征。通过与相同氨基酸的百分数相比,根据阳性氨基酸的百分数定量这种序列相似性。与序列同一性相比得到的序列相似性的值能有助于在临界情况下将一种蛋白质分配于正确的蛋白质家族。
能从单子叶植物和双子叶植物中分离编码属于根据本发明的新蛋白质家族的蛋白质的DNA。优选的来源是玉米、甜菜、向日葵、油籽芸苔(winter oilseed rape)、大豆、棉花、小麦、稻、马铃薯、花茎甘蓝、花椰菜、卷心菜、黄瓜、甜玉米、日本萝卜、四季豆、莴苣、甜瓜、胡椒、南瓜、番茄或西瓜。可使用下列普通方法,本领域技术人员通常将其用于具体工作。由至少15个,优选地20-30个,甚至超过100个连续核苷酸组成的SEQ ID NO:1或SEQ ID NO:2的单链片段作为探针,用来筛查DNA文库,以筛选可与该片段杂交的克隆。杂交因素描述于Sambrook等人,《分子克隆实验室指南》,冷泉港实验室出版社,9.47-9.57章和11.45-11.49章,1989。将杂交的克隆测序,并纯化含有完整编码区的克隆的DNA,其编码一种与SEQ ID NO:3有超过30%总体序列同一性的蛋白质。然后可用多种常规重组DNA技术进一步处理该DNA,如限制酶切消化、连接或聚合酶链反应分析。这些基因向突变细胞系mim中的转化导致MMS、紫外线、温度抗性的野生型水平和根生长野生型水平的恢复。
SEQ ID NO:1的公开内容使本领域技术人员能设计用于聚合酶链反应的寡核苷酸,以从含有一种核苷酸序列的模板中扩增DNA片段,该序列的特征在于SEQ ID NO:1中15个,优选地20-30个,甚至更多碱基对的任一连续序列。该核苷酸含有一种代表SEQ ID NO:1的15个,优选地20-30个,或甚至更多碱基对的核苷酸序列。用至少一种这样的寡核苷酸进行的聚合酶链反应及其扩增产物组成了本发明的另一个实施方案。
用pMIM3’8.1上所含并假定覆盖T-DNA插入位点的1.6kb限制片段对从野生型和突变(mim)拟南芥中分离的基因组DNA的EcoRⅠSouthern印迹分析证实,在突变(mim)基因组DNA中,杂交的限制性片段实际上含有T-DNA插入。
在用从野生型植物的愈伤组织、悬浮培养细胞或花蕾中提取的RNA进行的Northern印迹分析中,能检测到与该片段杂交的转录物,但用从突变(mim)植物物质中提取的相应RNA样品则检测不到杂交片段。MIM cDNA对基因组克隆pMIM3’8.1的4.2kb EcoRⅠ限制片段进行32p随机引物标记(Feinberg等人,分析生物化学132:6-13,1983),并如Elledge等人,美国国家科学院院刊88:1731-1735,1991所述用它来筛查拟南芥cDNA文库。鉴定出代表相同基因的4个部分cDNA克隆;全部都缺乏预测的全长cDNA(~3.7kb)的5’末端。因此,用RT-PCR和5’RACE技术分离丢失的MIM cDNA5’末端。RT-PCR根据已知的基因组DNA序列,为RT-PCR设计下列正向PCR引物(FP):
FP1:5’-CTG GGT CGG GTT CGA TTC TGA G-3’(SEQ IDNO:6)FP2:5’-GGT AAG AGT GCA ATA CTG ACT GC-3’(SEQ IDNO:7)FP3:5’-GCA GCT ATG CCG TTG TCC AAG TAG-3’(SEQ IDNO:8)根据可从部分cDNA克隆获得的序列信息,设计下列两种特异反向引物(SP)SP1(反向):5’-AAT GAC TCT GTC CCC TCC AAA TG-3’(SEQ IDNO:9)SP2(反向)5’-ATG TTC GAG GTT ATG AAT CTT TG-3’(SEQ IDNO:10)用Qiagen植物RNeasy试剂盒从活跃分裂的悬浮培养细胞中提取总RNA。根据使用说明书,使用反向引物SP1,在脱氧核苷酸混合物(Boehringer Mannheim)的存在下,用AMV反转录酶反转录5μm总RNA。用High PCT纯化试剂盒(Boehringer Mannheim)纯化cDNA产物,随后使用FP1和SP2引物进行第一轮PCR扩增。1∶20稀释第一轮的PCR产物,用FP2和SP2再次扩增。凝胶提取该PCR产物,将其克隆到pCR2.1 TA克隆载体(Invitrogen)中。测序和与基因组序列的对比显示朝向5’末端的1.2kb cDNA仍然缺乏5’末端。
PCR条件包括94℃5分钟的初始变性步骤,随后是25个循环的94℃30秒钟变性、55℃40秒钟退火和72℃1分钟延伸,随后是72℃7分钟的最后延伸步骤。5’RACE为了鉴定MIM cDNA的丢失的5’部分,使用5’RACE(cDNA末端快速扩增)技术。用反向引物RP1(5’-GAC TCA GTT ATC CTG CGTTCG-3’;SEQ ID NO:11)反转录从拟南芥悬浮培养细胞中提取的2.5μg总RNA。在2mM dATP存在下,用末端转移酶对得到的cDNA 5’末端添加同聚A尾。用加尾寡核苷酸特异的引物(Oligo dT-锚定引物5’-GACCAC GCG TAT CGA TGT CGA CTT TTT TTT TTT TTT TTV-3’;SEQ ID NO:12;Boehringer Mannheim)和反向引物RP2(5’-GGA CAACGG CAT AGC TGC ATC CAG-3’;SEQ ID NO:13)扩增加尾的cDNA。1∶20稀释PCR产物,并用PCR锚定引物(5’-GAC CAC GCG TATCGA TGT CGA C-3’;SEQ ID NO:14;Boehringer Mannheim)和反向引物RP3(5’-GGC AGC ACG CTG AGT CCC TCT CGC-3’;SEQ IDNO:15)再次扩增。凝胶提取特异的PCR产物,并将其克隆到pCR2.1载体中。
PCR条件包括第一轮的cDNA PCR扩增,其中包括5分钟的初始变性步骤,随后是25个循环的94℃30秒钟变性、35℃40秒钟退火和72℃40秒钟延伸,随后是72℃3分钟的最后延伸。第二轮PCR的条件与RT-PCR的条件相同。根据使用说明书(Invitrogen,TA-克隆试剂盒)将扩增产物克隆到pCR2.1载体中。实施例3序列分析与对比MIM cDNA(SEQ ID NO:2)含有一个开放阅读框,其具有横跨核苷酸位点73-75的起始密码子和横跨核苷酸位点3238-3240的终止密码子。该开放阅读框能编码一种预测分子量为121.3kD、理论pI为8.3的1055个氨基酸的蛋白质。与基因组序列的对比显示有28个内含子。mim突变体中的T-DNA插入到开始于野生型基因组序列核苷酸位点7835处的第22个内含子中。拯救的序列对应于基因组序列位点7804-7835处的内含子序列,其开始标记为PstⅠ限制位点(CTGCAG)。MIM开放阅读框编码一种推断的SMC样蛋白质(SEQ ID NO:3),其在氨基末端(氨基酸位点49-56)有一个NTP结合域,随后是第一个卷曲螺旋区(氨基酸位点184-442),一个绞链区或间隔区(氨基酸位点443-627),第二个卷曲螺旋区(氨基酸位点628-909),随后是被称为DA盒的也具有WalkerB型NTP结合域的保守基序(氨基酸位点971-1007)。根据Lupas等人,科学252:1162-1164,1991方法分析MIM开放阅读框的结构组织的卷曲螺旋区,并根据其编码的蛋白质形成卷曲螺旋的可能性描绘MIM开放阅读框中的卷曲螺旋区。
用TFASTA程序(Wisconsin Package 9.1版,遗传计算机集团(GCG),Madison,Wisc.)搜索数据库后显示,编码的蛋白质与粟酒裂殖酵母(Schizosaccharomyces pombe)的rad 18及酿酒酵母中的同源区(RHC 18)有明显的相似性。得分最高的同源区是粟酒裂殖酵母rad 18和酿酒酵母RHC 18基因(Lehmann等人,1995),它们显示与超过1000个氨基酸长度的重叠段有大约25%的同一性。推断的MIM蛋白与酵母的RAD50基因也有20.6%的总体同一性。应用MIM开放阅读框氨基端和羧基端序列的系统发育分析(Wisconsin Package 9.1版,遗传计算机集团(GCG),Madison,Wisc.)证明,编码的蛋白质不同于属于SMC的其他蛋白质。数据库中最紧密相关的是粟酒裂殖酵母rad 18和酿酒酵母RHC 18基因(Lehmann等人,1995)。
应用BLAST程序(Wisconsin Package 9.1版,遗传计算机集团(GCG),Madison,WI)对SWISSPROT和NCBI数据库的搜索显示,在NTP结合位点周围的一段121个氨基酸中,当与酿酒酵母RHC 18基因相比时有42%的同一性,而在DA盒周围的一段53个氨基酸中有47%的同一性。与粟酒裂殖酵母rad 18基因的类似对比显示,在蛋白质氨基端的一段106个氨基酸中有47%的同一性,而在蛋白质羧基端区域周围的DA盒保守基序的一段53个氨基酸中有54%的同一性。在搜索的数据库中未发现有来源于高等植物的同源序列。实施例4互补与过量表达实验互补通过用包含其启动子和聚腺苷酸化信号的野生型MIM基因转化突变拟南芥系进行mim突变体的互补。
突变mim拟南芥系含有T-DNA,其包含分别处于nos和CaMV35S启动子控制下的nptⅡ和bar标记基因。因此用一种新的二元载体p1’hygi6进行转化,该载体由p1’hygi经多克隆位点的修饰而产生。该载体是p1’barbi的衍生物,证明其在拟南芥转化中非常有效(Mengiste等人,植物杂志(Plant J)12:945-948,1997),并含有潮霉素选择性标记。p1’hygi能通过下列方法获得。在p1’barbi中,通过用EcoRⅠ消化质粒并再连接,使含有1’启动子、bar基因编码区和CaMV 35S聚腺苷酸化信号的EcoRⅠ片段相对于T-DNA边界颠倒。在产生的质粒中,1’启动子(Velten等人,EMBO J 3:2723-2730,1984)指向T-DNA的右边界。用BamHⅠ和NheⅠ限制酶切消化该质粒,并将bar基因和CaMV 35S聚腺苷酸化信号替换为含有BamHⅠ、HpaⅠ、ClaⅠ、StuⅠ和NheⅠ限制位点的合成多接头序列。用BamHⅠ和HpaⅠ限制酶切消化产生的质粒,并连接于pROB1(Bilang等人,1991)的BamHⅠ-PvuⅡ片段,其含有与CaMV 35S聚腺苷酸化信号连接的潮霉素B抗性基因hph。产生的二元载体p1’hygi的T-DNA含有处于1’启动子控制下的潮霉素抗性标记基因和位于标记基因与右边界序列之间的单克隆位点ClaⅠ、StuⅠ和NheⅠ。向p1’hygi载体的NheⅠ位点插入带有NheⅠ、SpeⅠ、XhoⅠ和Afl Ⅱ限制位点的寡核苷酸接头,产生质粒p1’hygi6,用来插入野生型MIM基因。
用SexAⅠ和KpnⅠ限制酶切消化具有MIM基因组克隆3’末端的pBluescript噬菌粒pMIM3’8.1。将酶切的基因组片段插入含有MIM 5’基因组序列的质粒(pMIM5’#1)中,产生pMIM5’#1.2。将pMIM3’8.1中其余的MIM基因3’末端酶切为KpnⅠ-ApaⅠ片段,并插入pMIM5’1.2中产生质粒pMIM,该质粒含有包括大约2kb上游序列的MIM基因组序列。用SalⅠ限制酶切消化pMIM,经琼脂糖凝胶电泳纯化含有MIM序列的片段,随后连接于XhoⅠ酶切并去磷酸化的p1’hygi6的XhoⅠ位点。经直接转化将得到的构建体引入含有非致癌Ti质粒(pGV3101)的根瘤农杆菌(Agrobacterium tumefaciens)C58CIRifR株中(Van Larebeke等人,自然252:169-170,1974)。利用农杆菌植物介导的基因转移法(Bechtold等人,C R Acad Sci Paris,Life Sci 316:1194-1199,1993)将含有野生型MIM基因的T-DNA引入mim突变植物中。被引入的植物的种子在含潮霉素的培养基上生长,并筛选转化子。对自交的潮霉素抗性植物的子代分析其潮霉素抗性的分离。观察到3∶1分离比的家族用于分离在单基因座处插入了新引入的T-DNA的纯合系。用Northern印迹分析法分析获得的潮霉素抗性系的MIM表达恢复。检测其MMS、紫外线、温度抗性野生型水平和根生长野生型水平的恢复。针对mim表型检查抗潮霉素且具有新引入的T-DNA的17个独立转化子的子代。在MMS、紫外线、X射线和MMC敏感性试验中,这些系中有12个系的表型回复为野生型。也恢复了正常的根生长和耐热性,这进一步证明mim表型是由MIM基因产物的缺乏引起的。过量表达使用标准克隆技术将用不同方法获得的MIM cDNA克隆组合为一种载体(pCR2.1,Invitrogen),使完整MIM cDNA构建于单一DNA片段中。
为了在野生型拟南芥植物中过量表达MIM cDNA,在35S CaMV启动子和NOS终止信号控制下克隆完整MIM开放阅读框。用二元载体p1’hygi6.1以相对于CaMV 35S启动子的有义方向插入含MIM cDNA的NheⅠ-XbaⅠ片段。用该构建体转化野生型拟南芥植物。研究过量表达MIM蛋白的植物的表型。分析对使用35S∷MIM cDNA构建体产生的16个独立系进行的Northern印迹分析。与在幼苗中观察到的MIM表达的野生型水平相比,在选择的3个系中转录水平升高。进一步分析这些系的同源重组活性。实施例5突变体中重组的分析使用一种能显示染色体内同源重组事件的非选择性测定系统。该测定系统使用一种破坏的嵌合β-葡糖醛酸糖苷酶(uidA)(GUS)基因(Jefferson等人,EMBO J 6:3901-3907,1987)作为基因组重组底物,其含有直线方向的1213bp重叠GUS序列。该底物被稳定整合于用于重组测定的拟南芥系中,另外被称为N1DC1。染色体内同源重组后,GUS基因的表达恢复。在对整个植物幼苗组织化学染色后,能评价发生重组事件的细胞。
使mim突变系与重组底物为转基因的拟南芥C24生态型(N1DC1 11号)系杂交(Swoboda等人,EMBO J 13:481-489,1994)。N1DC1 11号系在单个基因座处含有两个拷贝的重组底物。使杂交的F1植物自花传粉。将这些F1植物的子代接种于营养培养基上,选择具有短根的植物,即mim突变纯合的植物,使之生长成熟。在10mgl-1膦丝菌素(ppt)和10mgl-1潮霉素上筛选这些F2植物的子代。ppt抗性纯合的系,即mim突变纯合的植物,和潮霉素抗性系,即重组底物纯合的植物,用于染色体内重组测定。为了比较,也对下列植物测定重组事件(a)野生型(Wassilewskija生态型),(b)N1DC1 11号系(C24生态型),和(c)上述相同杂交产生的分离的F3植物,其具有N1DC1 11号系的基因型和突变体(Wassilewskija)的野生型亲代生态型,以消除生态型对重组的影响。如Jefferson等人,同上所述进行组织化学(X-gluc)测定。发现突变体(mim)背景的重组频率比野生型遗传背景低3.9倍。
序列表<110>Novartis AG<120>重组修复基因<130>S-30568A<140><141><150>9815485.9(GB)<151>1998-07-16<150>9900760.1(GB)<151>1999-01-14<160>15<170>PatentIn Ver.2.1<210>1<211>10156<212>DNA<213>拟南芥<400> 1gattttcatc agaatctatt tcgatatagt tttcagtatc ttttcttttt cgagttgata 60ccaaactatc aatcgatttc agattctgaa gatattctga catgttgtca tccttcattt 120gtaaaagaca taaagcactt tcttcaatag ttatatcgct ttcagactct atcgaatttt 180cctcttccaa atccacgacg atctttttct tgacagttgt tcgttgctca gcttctttgt 240ttagatctgg ctttggacca ccaacaactt cactggtgtg gacaaatctc gccagaactg 300tttcattagg tcttctaaag cttgctccaa ggttgttgca tgatcgtagt gatggagtga 360tcgagccagt tgatgaagat gatccaggga aaaatttcaa agtgtgagct ctcatgtgac 420caccaagagt tttccccgtt tngaaattgt tttctttgca caccttgnca ggtttttgtt 480ttcctaggan gtgantacat tttggacggt tgaaaaaccc aaaaaaaaaa ctaccaaatt 540tttaggcgtt aaagattttg attgcttttt aatgcggaaa agtgtttgtg aatattatgt 600gattttgaat ccagtggaga tactcatata tatatatagg atgcatgaga gggaggaaca 660caatttctgt tcaaaaggag ttaaccactt aacataagtg tttgttcatt atgttctcac 720atttagttac aagcatattt tattctggtc aaaaaaaaca aagtcaacaa ttatatacaa 780gctaatcttt tattttctta ctctcttttt tttaaaatag tcgtcgttta ggatttttac 840ataaaagtta agaaaacaat taaatttttt atttattttt attggttacg acattgaaca 900ataaggatat tattgaaagt tttatcaaat atttatattg aaaatctaaa atgacgatta 960ttacgaatta aaatttttag tgttaggaag gacaatccaa attaaaacgg aaaaagtata 1020taaaaaaagt aacagtagtt ttttcgtgtt ttatacaaat aactatagat aatttaacgt 1080ataaattata atcgaatgta tttgaatcga acaacgtgaa catgatagga atgtgcatga 1140tatttccgga aaattatgca caatatctga aaatctattt aatcacaccg taaaacaaat 1200acacttttgt agtataaaat tattttaatt tagttaagat tttaattttt tttctttctt 1260acagtgaaca ctactgttga ccaaaagaaa aagggtctat tgggctaaaa acaactgtag 1320ctaatgggcc atattagggg gactttaagg cccattggtg ttcggtcaat aagatcttgg 1380agatcatcat catcgtacgg taaaagacaa gcggaatata caacggggaa cgaacaatag 1440caatctcttt cccgccctaa gcagtcgcat caatggagct tgctctattc taatttgttt 1500caaccgagtg agagaagaaa ccctagaacg cgaaaagcca tggtaaaatc tggagctcga 1560gccagtgatt cattcatcaa acaacgttct gggtcgggtt cgattctgag gatcaaagtt 1620gagaatttca tgtgccatag ttatctccag attgagtttg gcgagtgggt taatttcatc 1680accggccaaa acggaagtaa gtcttctcct tctgtttaaa aaaatgtttt ttagagctct 1740gattgactga atttaatcac gcatgcctta ttgggaattg ggtttcgcct aattttgata 1800tcccagattt ttcaatttga ttcaattgtg ttcaactatt caggttagga ggtagtggaa 1860agtctttttt atttatttag aattggtttn tncacagtca atgaccaaga gttttaatnt 1920ggacttttga ttaaaaatct taggtggtaa gagtgcaata ctgactgcac tatgtattgc 1980atttggatgt cgagcgagag ggactcagcg tgctgccact ctaaaggatt tcattaaaac 2040tggatgcagg ttttgtacac ttgcactgtg ttttgtctaa atatcagatt tgcagattgg 2100aagtgaaaat aggacatgtt tagtggcgct tattcttctt tcttaaattt tttagattgt 2160ctcttgtcat tgattaggag atgactaatg ataagagtga ctgaaattcc tttccaattt 2220ggttggattt ctttgcagct atgccgttgt ccaagtagaa atgaaaaaca gtggagagga 2280tgcttttaag tctgaaattt atggtggcgt tataattatc gaacgcagga taactgagtc 2340tgctacagct actgttctca aagattatct aggttaattc attgtactct ctataataat 2400ttatagtttg acttacagtt tatctcatag cccccgtgtt tgttgtgatg cctgtctccg 2460ttcttatttt cttctccaac aactctatct ttgtgttatg tgcatatata taaaactatt 2520gatttaaaat gtttttctga tttcttattt tctgcaggaa aaaaagtaag taacaaaagg 2580gacgagctac gggaacttgt tgaacatttt aatgtgagtt ttggccgttc attcaaaatt 2640ttagaaagta ttaagtgata tcagatactt ggcatactca gtactgtatt cttattatat 2700tttacatgtg tagattgatg ttgaaaatcc gtgtgtggta atgagtcaag acaaagcagg 2760gagttcttac attctggaat gcaaaggtaa attcaaggta tgtcacgtga attgatatat 2820atatcaaagt caaccatgtt gttattatgg ctgaaaattt tcgctctcaa gttctttttt 2880aaggaacctt cttcagcaag tcaatgatct tctccaaagt atctacgaac acttgacaaa 2940agcaactgct atagtcgatg aattggagaa cacaattaaa ccaatagaaa aggagatcag 3000tgagttgcgt ggaaagataa agaatatgga acaagttgaa gaaatagctc aaaggttgca 3060gcagttgaag aagaaactgg cttggtcatg ggtatatgat gtgggtaggc agctccagga 3120acagactgag aagattgtga agcttaaaga acgtataccg acttgccaag ctaaaataga 3180ttgggaactg gtaagtaata catactttcc ttcatccgaa atttggatgg ctacaaaaat 3240cgaaaggtaa agatgctggg tgcattacaa gttgtaactt ctctctgata tcctacctgg 3300ccatcataag ataaaaatgg agtttttagc tgtataaaag agagagtttg attatgtaga 3360gtcttgtggt attcctaacg taaactcctc attgggcata gttaatgtgt gccatattgg 3420ttccatatgt ttatgtgagg ttttgcctct aacatgttca attttcttag agcgcaaacc 3480ttcgcctgcc ttactgtagg ggtctactga tgagtgaatg attgcttaat tcatgtttcg 3540agctcagact ggttgattat cattgacctt tttgtaggga aaagtggaat cattaaggga 3600tacgttgacc aagaagaaag ctcaagttgc gtgtctgatg gatgaatcaa ctgcaatgaa 3660gagagagata gagagttttc accaatcagc caagacggtt tgtaaactta gttttaagag 3720ggatctagtg ggtggaattt tgcctaaaga attgacaaat tatcttccct tatttaacaa 3780aatatatttt cttgttcagt gtgaancaaa taaaaatnct ggattttggc aaatgggctg 3840caaggctcta atatgcttat tattagttta nattaatttt gaaaagttgc tttcgggtat 3900aanttaattg tccacatctt gttatgttgt gttccttgaa aaaatctttg tgtgttccta 3960ttttaaggct gtacgagaaa aaattgccct acaagaagaa ttcaatcata agtgcaatta 4020tgttcaaaag attaaggatc gtgttagaag gcttgaacgg caagttggag atatcaatga 4080acagacaatg aagaacacac aggtccccaa tatcagtcac atatcttaaa aaggaaaaac 4140tatgtcatgt ttcttttgtg ctgagtgtct tggcttaacg atcaagatat tgtgaaggtg 4200tgtatacatg gacagatata cttgtgcata tttctcatag gttgataatt atgtaggctg 4260aacaatctga aatcgaggag aaactaaaat atttggagcg ggaggttgag aaagttgaaa 4320cattgcgttc caggttatga tcttaagttt tctgtttcct tttcgtctgc ttagcatttc 4380ggagtcttct ctctcgtctt taaacatgtt ttaaagattg atactttaga ttgaaagagg 4440aagagaactg cttcttggaa aaagcgtttg aagggaggaa aaagatggaa cacatcgagg 4500atatggtaca actataccta ttacttacac atgaatctga agtctttttt ttcaatcagt 4560ttcgcaggtt gtttacaatt gcaattaaca cctcaatctt ttcgttgtcc tttttttgct 4620tctagattaa aaaccatcaa aagaggcaaa gattcataac ctcgaacatt aatgatctga 4680agaaacatca aacaaataag gtgcatcata gttatttcat cacaaaatat agtgtttcaa 4740ctggatcttg tcaagcctct ttcggaaata tctaagaggc atacaaatac atacatgctc 4800accaggttac tgcatttgga ggggacagag tcattaatct tctgcaggct attgagagaa 4860atcatcgtag atttagaaaa ccaccaattg gtcctattgg ctcccatgtg gtaagtttct 4920actcgtttcg tttgcaatct gtgcaccaaa caaactattt cacttgttat cttatattga 4980catgtgcaac tgttgctgta acaatctttt gatgtgaaca ttttgtgggt taaaaagtct 5040cttctaatgg tgtgatgttc tgcagacttt agtcaatggc aataaatggg cttcttcagt 5100tgaacaagct cttggaaccc tattaaatgc cttcattgtg actgatcaca aagattctct 5160cactctaaga ggctgtgcga atgaagctaa ctatagaaat cttaagatta tcatctatga 5220cttttcgaga ccaaggttca aactcgaaat aagcattttc atatttcctt ttaaccatct 5280gcattgatga atgggttnct ttataacgca aatatttgct atctcttcat ttatgcaggt 5340taaatatacc aaggcacatg gtgcctcaga cagaacaccc aactatattc tctgtcatag 5400actctgataa cccaaccttc cttaatgtct tggtggatca ggtttgtact ttcaaatttt 5460ccctccactt actaaatttc ttcattctta cagcctttta tgacggtgtt catattttag 5520tcttgttttc tgaatatttc agagtggtgt tgagaggcaa gtgcttgcag aaaattatga 5580ggagggaaag gcggttgcat ttgggaaaag gctctcaaat ctgaaggagg tttacacttt 5640agacggatac aaaatgtaag taatttgtta gatttggcat ggacaatccc gctatatctc 5700tccccttgca aacaaaaaca aatcctttgc atggcggggg ataatctttt cttttgaaat 5760agaattttga acaatgacat gcacccctct ttctgtatcc tggctctgga tttctccaat 5820atcaattttc caccataaga caaacaaaaa gcttcaaaca atagaacttt ttgtttgata 5880tatttcattt tcaaaatccc ttcaacttat ctttgaaggg acccagaata tganatatcc 5940cgactgtctt tgcatctaca acatctacaa tatcttagtc cttgttaaaa taaaattcat 6000ttttaattta aaanggattt gacttgaaaa cntctaaggg atataagaat atccnccccc 6060atccataacc ctaatttttc taattnttac cccaggtttt tttcgtgggc cagttcagac 6120tactcttcct cctctttctc gtagaccttc gcgactctgt gcttcttttg atgaccagat 6180caaggatctt gaaatagagg cttcaaaaga acaaaacgag ataaatcaat gcatgagacg 6240taagagggag gcagaggaga atcttgagga acttgagttg aaagtgcgcc aactggaggt 6300attgtctcat tgattaatcc agtagaaact agagttccca gtctttatat atcttaactg 6360aaatgattag cttgaattta caaagcttta gttcgctagt atccataacc gtttccatat 6420ttttctttgt tcggcttgtg aagaagcacc gcagccaagc agagaaggtt ttgacgacaa 6480aggaacttga gatgcacgat ttgaagaata cagtcgctgc tgagatcgaa tcattacctt 6540cttcaagtgt taatgagctt caacgtgaaa tcatggttag tttgttggaa tttttcttta 6600ttgttactgt tttcgccttc tcctcatgta ttttttcttc ttttctaatt aatatgccag 6660aaagacctag aagagataga tgagaaagaa gctttccttg agaagctcca aaactgcttg 6720aaagaagctg agctaaaggc taataaactt acagctttat ttgagaacat gcgtggtatg 6780tgtgtgatag accactgttt ctgaaacacc tgtatctttt tcttgtggtg tggtcgaaca 6840tgaatagatc ttcttgattg agtggccgac tctattctta ctttttctca aaacgtgcat 6900gtagagtcag ccaagggtga aattgatgcc tttgaggaag cagagaatga gctaaagaag 6960attgagaaag accttcagtc tgccgaagcg gtaccccttc ttttttcgac gtgaagattt 7020tttttacttg gtttgcatgt agaatgtaag cttgattctg tttcaggaga aaatccatta 7080cgagaacata atgaaaaaca aggtcctacc tgatattaag aatgctgagg ctaactacga 7140ggagcttaaa aataagcgaa aggtacatat aataagcaat tactcagaaa tttttcgaaa 7200tgacatttgc aacttctttc cgttgtatac aacacacaca cacacaatat atatatatat 7260atatatatag atacctctct taatctcttg taaaccctct ctaaggaaat ggccagtttg 7320aaacccggta tgacatgttg tctagtctat ggaacttagc tactggagta atgtgtatta 7380gctgtagaat ttttttatct tgtaggttat tattgcccag ggttcatttt tctgtggtta 7440tgaattgcat gtgctgaaat ttcaggaaag tgaccagaag gcctctgaaa tttgtcctga 7500gagtgagata gaatctttgg gtccctggga tgggagtact cctgagcaac tcagtgctca 7560gattaccaga atgaatcaga gacttcatcg agagaatcag cagtgcgtat tttaatattg 7620cctttcagct tttttccttc acacagaaac gacctgtgac agtaaattac gtgcttcaat 7680tttgttcgtg caggttttct gaatcaattg atgaccttag gatgatgtat gagagcctag 7740aacgaaagat tgcaaagaag cgcaaatcct atcaagacca tcgagaaaaa ctcatggttg 7800agtctgcaga tctgtttatg ttaaagctct ttgtgttgtt atcgtattat cgtttaatgt 7860attcatcact atttgatcag gcctgcaaaa atgctctaga ttcacggtgg gccaaatttc 7920aaagaaatgc atctcttctt cggcgccagt taacatggca gtaagagtcg ctttccccat 7980tgccacctac atagataaat ctgtagttcg gttgtctctt gagattagta tgattttttt 8040ttccatatgg agctttcttt gacgttaatc ttctaagcag attcaacgct cacttgggaa 8100agaaaggtat cagcggacac atcaaagtca gttatgaaaa taaaactttg tccatagaag 8160ttaattgaca ctgccatggt acggtttttg ctactagcgt gcccatatta ttacgtcatc 8220tgattgatat cgttctttat gacaggttaa aatgcctcaa gacgcaacaa gcaatgtcgt 8280tcgagacacc aaaggtcttt caggtactgc atccttccac actcttaaaa atcatacatc 8340tgattcattg ccatataaag acatttccta tgtgtaacgc tcttctcatt atactaggcg 8400gagaacgttc tttctcaact ttatgttttg cactagctct tcacgagatg acagaagccc 8460cgtttcgagc aatggatgag tttgatgtgt ttatggtatt atgtcctttt aagaattctc 8520tcttttacga gctttacgtt gggatgagac taacattttt aactttctga ttctgaaata 8580taggatgcag tcagtcggaa aattagcttg gacgcactgg tggattttgc aattggagaa 8640ggatcgcagt ggatgttcat cacccctcat gatatcaggt aaccaaccga tcaatttcaa 8700aaaccatgga actcagtctg tgaagtgaat aacttggatg aaactcttta tctcttgtgc 8760tcttttacag catggtgaag tcgcacgaga ggataaagaa acagcaaatg gctgctcctc 8820gttcttgaaa acaaaaaaaa actctccttg tatagctcca taaaggaaca cacaattttg 8880cttggcatga cccattcaag cattttatgt tttgtgtctg catttttcgc cagttctcac 8940ttatgtgttt ctttacggga ctcatcaggg catcctcggc tttgagtcaa tactacgacg 9000agctgatggg aagtttgaga agagctttgt catccatggt catggtgtat tgatttgaat 9060ttacaggtgc tgagtgagac ccttttttgt tttctctcat ttctttttat gacatttata 9120tattgtcaaa ctttgatttt aaaactgtat tatatatcat ttttattgac ttataattat 9180catttttaga tcgaccaagt gtgacagatt actttcctag tgataaagac tagtgattga 9240ggacaatagc agaaagacta agtaactttt aagcttcgga ttaagaaatg tccatagttt 9300ctgattcttt ttggcaagtt taagtacatc ctgaatgttc gataaaggct agtgtcatca 9360acatctctaa tacatatgac agccaaggag catccattga aaaatgaggc aataaaattg 9420agtacttata aactgttcgg gggntgggtt attcgnaatt anttcgnttt aaaggntatt 9480tncatccaac taatttggat ccagggccct gccaaaaaat ggtttttagg attncacggn 9540ggggcccaaa attttcaaaa ggaaatgcat ttnttttttc gggcgccagt taaacatggc 9600agtaagagtc gctttccccc attgccacct aacatagata aatctgtagt tcggttgtct 9660tcttgagatt agtatgattt ttttttccca tatggagctt tctttgacgt taatcttcta 9720agcagattca acgctcactt gggaaagaaa ggtatcagcg gacacatcaa agtcagttat 9780gaaaataaaa ctttgtccat agaggtaatt gacactgcca tggtacggtt tttgctacta 9840gcgtgcccat attattacgt catctgattg atatcgttct ttatgacagg ttaaaatgcc 9900tcaagacgca acaagcaatg tcgttcgaga caccaaaggt ctttcaggta ctgcatcctt 9960ccacactctt aaaaatcata catctgattc attgccatat aaagacattt cctatgtgta 10020acgctcttct cattatacta ggcggagaac gttctttctc aactttatgt tttgcactag 10080ctcttcacga gatgacagaa gccccgtttc gagcaatgga tgagtttgat gtgtttatgg 10140tattatgtcc ttttaa 10156<210>2<211>3668<212>DNA<213>拟南芥<400> 2catcaatgga gcttgctcta ttctaatttg tttcaaccga gtgagagaag aaaccctaga 60acgcgaaaag ccatggtaaa atctggagct cgagccagtg attcattcat caaacaacgt 120tctgggtcgg gttcgattct gaggatcaaa gttgagaatt tcatgtgcca tagttatctc 180cagattgagt ttggcgagtg ggttaatttc atcaccggcc aaaacggaag tggtaagagt 240gcaatactga ctgcactatg tattgcattt ggatgtcgag cgagagggac tcagcgtgct 300gccactctaa aggatttcat taaaactgga tgcagctatg ccgttgtcca agtagaaatg 360aaaaacagtg gagaggatgc ttttaagtct gaaatttatg gtggcgttat aattatcgaa 420cgcaggataa ctgagtctgc tacagctact gttctcaaag attatctagg aaaaaaagta 480agtaacaaaa gggacgagct acgggaactt gttgaacatt ttaatattga tgttgaaaat 540ccgtgtgtgg taatgagtca agacaaagca gggagttctt acattctgga atgcaaaggt 600aactcaagtt cttttttaag gaaccttctt cagcaagtca atgatcttct ccaaagtatc 660tacgaacact tgacaaaagc aactgctata gtcgatgaat tggagaacac aattaaacca 720atagaaaagg agatcagtga gttgcgtgga aagataaaga atatggaaca agttgaagaa 780atagctcaaa ggttgcagca gttgaagaag aaactggctt ggtcatgggt atatgatgtg 840ggtaggcagc tccaggaaca gactgagaag attgtgaagc ttaaagaacg tataccgact 900tgccaagcta aaatagattg ggaactggga aaagtggaat cattaaggga tacgttgacc 960aagaagaaag ctcaagttgc gtgtctgatg gatgaatcaa ctgcaatgaa gagagagata 1020gagagttttc accaatcagc caagacggct gtacgagaaa aaattgccct acaagaagaa 1080ttcaatcata agtgcaatta tgttcaaaag attaaggatc gtgttagaag gcttgaacgg 1140caagttggag atatcaatga acagacaatg aagaacacac aggctgaaca atctgaaatc 1200gaggagaaac taaaatattt ggagcgggag gttgagaaag ttgaaacatt gcgttccaga 1260ttgaaagagg aagagaactg cttcttggaa aaagcgtttg aagggaggaa aaagatggaa 1320cacatcgagg atatgattaa aaaccatcaa aagaggcaaa gattcataac ctcgaacatt 1380aatgatctga agaaacatca aacaaataag gttactgcat ttggagggga cagagtcatt 1440aatcttctgc aggctattga gagaaatcat cgtagattta gaaaaccacc aattggtcct 1500attggctccc atgtgacttt agtcaatggc aataaatggg cttcttcagt tgaacaagct 1560cttggaaccc tattaaatgc cttcattgtg actgatcaca aagattctct cactctaaga 1620ggctgtgcga atgaagctaa ctatagaaat cttaagatta tcatctatga cttttcgaga 1680ccaaggttaa atataccaag gcacatggtg cctcagacag aacacccaac tatattctct 1740gtcatagact ctgataaccc aaccttcctt aatgtcttgg tggatcagag tggtgttgag 1800aggcaagtgc ttgcagaaaa ttatgaggag ggaaaggcgg ttgcatttgg gaaaaggctc 1860tcaaatctga aggaggttta cactttagac ggatacaaaa tgttttttcg tgggccagtt 1920cagactactc ttcctcctct ttctcgtaga ccttcgcgac tctgtgcttc ttttgatgac 1980cagatcaagg atcttgaaat agaggcttca aaagaacaaa acgagataaa tcaatgcatg 2040agacgtaaga gggaggcaga ggagaatctt gaggaacttg agttgaaagt gcgccaactg 2100aagaagcacc gcagccaagc agagaaggtt ttgacgacaa aggaacttga gatgcacgat 2160ttgaagaata cagtcgctgc tgagatcgaa tcattacctt cttcaagtgt taatgagctt 2220caacgtgaaa tcatgaaaga cctagaagag atagatgaga aagaagcttt ccttgagaag 2280ctccaaaact gcttgaaaga agctgagcta aaggctaata aacttacagc tttatttgag 2340aacatgcgtg agtcagccaa gggtgaaatt gatgcctttg aggaagcaga gaatgagcta 2400aagaagattg agaaagacct tcagtctgcc gaagcggaga aaatccatta cgagaacata 2460atgaaaaaca aggtcctacc tgatattaag aatgctgagg ctaactacga ggagcttaaa 2520aataagcgaa aggaaagtga ccagaaggcc tctgaaattt gtcctgagag tgagatagaa 2580tctttgggtc cctgggatgg gagtactcct gagcaactca gtgctcagat taccagaatg 2640aatcagagac ttcatcgaga gaatcagcag ttttctgaat caattgatga ccttaggatg 2700atgtatgaga gcctagaacg aaagattgca aagaagcgca aatcctatca agaccatcga 2760gaaaaactca tggcctgcaa aaatgctcta gattcacggt gggccaaatt tcaaagaaat 2820gcatctcttc ttcggcgcca gttaacatgg caattcaacg ctcacttggg aaagaaaggt 2880atcagcggac acatcaaagt cagttatgaa aataaaactt tgtccataga ggttaaaatg 2940cctcaagacg caacaagcaa tgtcgttcga gacaccaaag gtctttcagg cggagaacgt 3000tctttctcaa ctttatgttt tgcactagct cttcacgaga tgacagaagc cccgtttcga 3060gcaatggatg agtttgatgt gtttatggat gcagtcagtc ggaaaattag cttggacgca 3120ctggtggatt ttgcaattgg agaaggatcg cagtggatgt tcatcacccc tcatgatatc 3180agcatggtga agtcgcacga gaggataaag aaacagcaaa tggctgctcc tcgttcttga 3240aaacaaaaaa aaactctcct tgtatagctc cataaagggc atcctcggct ttgagtcaat 3300actacgacga gctgatggga agtttgagaa gagctttgtc atccatggtc atggtgtatt 3360gatttgaatt tacaggtgct gagtgagacc cttttttgtt ttctctcatt tctttttatg 3420acatttatat attgtcaaac tttgatttta aaactgtatt atatatcatt tttattgact 3480tataattatc atttttagat cgcccaagtg tgacagatta ctttcctagt gataaagact 3540agtgattgag gacaatagca gaaagactaa gtaactttta agcttcggat taagaaatgt 3600ccatagtttc tgaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3660aaaaaaaa 3668<210>3<211>1055<212>PRT<213>拟南芥<400>3Met Val Lys Ser Gly Ala Arg Ala Ser Asp Ser Phe Ile Lys Gln Arg1 5 10 15Ser Gly Ser Gly Ser Ile Leu Arg Ile Lys Val Glu Asn Phe Met Cys20 25 30His Ser Tyr Leu Gln Ile Glu Phe Gly Glu Trp Val Ash Phe Ile Thr35 40 45Gly Gln Asn Gly Ser Gly Lys Ser Ala Ile Leu Thr Ala Leu Cys Ile50 55 60Ala Phe Gly Cys Arg Ala Arg Gly Thr Gln Arg Ala Ala Thr Leu Lys65 70 75 80Asp Phe Ile Lys Thr Gly Cys Ser Tyr Ala Val Val Gln Val Glu Met85 90 95Lys Asn Ser Gly Glu Asp Ala Phe Lys Ser Glu Ile Tyr Gly Gly Val100105 110Ile Ile Ile Glu Arg Arg Ile Thr Glu Ser Ala Thr Ala Thr Val Leu115 120 125Lys Asp Tyr Leu Gly Lys Lys Val Ser Asn Lys Arg Asp Glu Leu Arg130 135 140Glu Leu Val Glu His Phe Asn Ile Asp Val Glu Asn Pro Cys Val Val145 150 155160Met Ser Gln Asp Lys Ala Gly Ser Ser Tyr Ile Leu Glu Cys Lys Gly165 170 175Asn Ser Ser Ser Phe Leu Arg Asn Leu Leu Gln Gln Val Asn Asp Leu180 185 190Leu Gln Ser Ile Tyr Glu His Leu Thr Lys Ala Thr Ala Ile Val Asp195 200 205Glu Leu Glu Asn Thr Ile Lys Pro Ile Glu Lys Glu Ile Ser Glu Leu210 215 220Arg Gly Lys Ile Lys Asn Met Glu Gln Val Glu Glu Ile Ala Gln Arg225 230 235 240Leu Gln Gln Leu Lys Lys Lys Leu Ala Trp Ser Trp Val Tyr Asp Val245 250 255Gly Arg Gln Leu Gln Glu Gln Thr Glu Lys Ile Val Lys Leu Lys Glu260265270Arg Ile Pro Thr Cys Gln Ala Lys Ile Asp Trp Glu Leu Gly Lys Val275 280 285Glu Ser Leu Arg Asp Thr Leu Thr Lys Lys Lys Ala Gln Val Ala Cys
290295300Leu Met Asp Glu Ser Thr Ala Met Lys Arg Glu Ile Glu Ser Phe His305 310 315 320Gln Ser Ala Lys Thr Ala Val Arg Glu Lys Ile Ala Leu Gln Glu Glu325 330 335Phe Asn His Lys Cys Asn Tyr Val Gln Lys Ile Lys Asp Arg Val Arg340 345 350Arg Leu Glu Arg Gln Val G1y Asp Ile Asn Glu Gln Thr Met Lys ASh355 360 365Thr Gln Ala Glu Gln Ser Glu Ile Glu Glu Lys Leu Lys Tyr Leu Glu370 375 380Arg Glu Val Glu Lys Val Glu Thr Leu Arg Ser Arg Leu Lys Glu Glu385 390 395 400Glu Ash Cys Phe Leu Glu Lys Ala Phe Glu Gly Arg Lys Lys Met Glu405 410 415His Ile Glu Asp Met Ile Lys Asn His Gln Lys Arg Gln Arg Phe Ile420 425 430Thr Ser Asn Ile Asn Asp Leu Lys Lys His Gln Thr Asn Lys Val Thr435 440 445Ala Phe Gly Gly Asp Arg Val Ile Asn Leu Leu Gln Ala Ile Glu Arg450 455 460Asn His Arg Arg Phe Arg Lys Pro Pro Ile Gly Pro Ile Gly Ser His465 470 475 480Val Thr Leu Val Asn Gly Asn Lys Trp Ala Ser Ser Val Glu Gln Ala485 490 495Leu Gly Thr Leu Leu Ash Ala Phe Ile Val Thr Asp His Lys Asp Ser500 505 510Leu Thr Leu Arg Gly Cys Ala Asn Glu Ala Asn Tyr Arg Asn Leu Lys515 520 525Ile Ile Ile Tyr Asp Phe Ser Arg Pro Arg Leu Asn Ile Pro Arg His530 535 540Met Val Pro Gln Thr Glu His Pro Thr Ile Phe Ser Val Ile Asp Ser545 550 555 560Asp Ash Pro Thr Phe Leu Asn Val Leu Val Asp Gln Ser Gly Val Glu565 570 575Arg Gln Val Leu Ala Glu Ash Tyr Glu Glu Gly Lys Ala Val Ala Phe580 585 590Gly Lys Arg Leu Ser Asn Leu Lys Glu Val Tyr Thr Leu Asp Gly Tyr595 600 605Lys Met Phe Phe Arg Gly Pro Val Gln Thr Thr Leu Pro Pro Leu Ser610 615 620Arg Arg Pro Ser Arg Leu Cys Ala Ser Phe Asp Asp Gln Ile Lys Asp625 630 635 640Leu Glu Ile Glu Ala Ser Lys Glu Gln Asn Glu Ile Asn Gln Cys Met645 650 655Arg Arg Lys Arg Glu Ala Glu Glu Asn Leu Glu Glu Leu Glu Leu Lys660 665 670Val Arg Gln Leu Lys Lys His Arg Ser Gln Ala Glu Lys Val Leu Thr675 680 685Thr Lys Glu Leu Glu Met His Asp Leu Lys Ash Thr Val Ala Ala Glu690 695 700Ile Glu Ser Leu Pro Ser Ser Ser Val Ash Glu Leu Gln ArG Glu Ile705 710 715 720Met Lys Asp Leu Glu Glu Ile Asp Glu Lys Glu Ala Phe Leu Glu Lys725 730 735Leu Gln Asn Cys Leu Lys Glu Ala Glu Leu Lys Ala Asn Lys Leu Thr740 745 750Ala Leu Phe Glu Asn Met Arg Glu Ser Ala Lys Gly Glu Ile Asp Ala755 760 765Phe Glu Glu Ala Glu Asn Glu Leu Lys Lys Ile Glu Lys Asp Leu Gln770 775 780Ser Ala Glu Ala Glu Lys Ile His Tyr Glu Ash Ile Met Lys Asn Lys785 790 795 800Val Leu Pro Asp Ile Lys Asn Ala Glu Ala Asn Tyr Glu Glu Leu Lys805 810 815Asn Lys Arg Lys Glu Ser Asp Gln Lys Ala Ser Glu Ile Cys Pro Glu820 825 830Ser Glu Ile Glu Ser Leu Gly Pro Trp Asp Gly Ser Thr Pro Glu Gln835 840 845Leu Ser Ala Gln Ile Thr Arg Met Asn Gln Arg Leu His Arg Glu Asn850 855 860Gln Gln Phe Ser Glu Ser Ile Asp Asp Leu Arg Met Met Tyr Glu Ser865 870 875 880Leu Glu Arg Lys Ile Ala Lys Lys Arg Lys Ser Tyr Gln Asp His Arg885 890 895Glu Lys Leu Met Ala Cys Lys Asn Ala Leu Asp Ser Arg Trp Ala Lys900 905 910Phe Gln Arg Asn Ala Ser Leu Leu Arg Arg Gln Leu Thr Trp Gln Phe915 920 925Asn Ala His Leu Gly Lys Lys Gly Ile Ser Gly His Ile Lys Val Ser930 935 940Tyr Glu Asn Lys Thr Leu Ser Ile Glu Val Lys Met Pro Gln Asp Ala945 950 955 960Thr Ser Asn Val Val Arg Asp Thr Lys Gly Leu Ser Gly Gly Glu Arg965 970 975Ser Phe Ser Thr Leu Cys Phe Ala Leu Ala Leu His Glu Met Thr Glu980 985 990Ala Pro Phe Arg Ala Met Asp Glu Phe Asp Val Phe Met Asp Ala Val99510001005Ser Arg Lys Ile Ser Leu Asp Ala Leu Val Asp Phe Ala Ile Gly Glu1010 1015 1020Gly Ser Gln Trp Met Phe Ile Thr Pro His Asp Ile Ser Met Val Lys1025 103010351040Ser His Glu Arg Ile Lys Lys Gln Gln Met Ala Ala Pro Arg Ser104510501055<210>4<211>21<212>DNA<213>人工序列<220>
<223>人工序列描述T-DNA寡核苷酸<400>4ggtttctaca ggacgtaaca t 21<210>5<211>32<212>DNA<213>人工序列<220>
<223>人工序列描述T-DNA邻接32核苷酸
<400>5ctgcagatct gtttatgtta aagctctttg tg 32<210>6<211>22<212>DNA<213>人工序列<220>
<223>人工序列描述FP1<400>6ctgggtcggg ttcgattctg ag22<210>7<211>23<212>DNA<213>人工序列<220>
<223>人工序列描述FP2<400>7ggtaagagtg caatactgac tgc 23<210>8<211>24<212>DNA<213>人工序列<220>
<223>人工序列描述FP3<400>8gcagctatgc cgttgtccaa gtag 24<210>9<211>23<212>DNA<213>人工序列<220>
<223>人工序列描述SP1<400>9aatgactctg tcccctccaa atg23<210>10
<211>23<212>DNA<213>人工序列<220>
<223>人工序列描述SP2<400>10atgttcgagg ttatgaatct ttg23<210>11<211>21<212>DNA<213>人工序列<220>
<223>人工序列描述RP1<400>11gactcagtta tcctgcgttc g21<210>12<211>39<212>DNA<213>人工序列<220>
<223>人工序列描述Oligo-dT锚定引物<400>12gaccacgcgt atcgatgtcg actttttttt ttttttttv39<210>13<211>24<212>DNA<213>人工序列<220>
<223>人工序列描述RP2<400>13ggacaacggc atagctgcat ccag24<210>14<211>22<212>DNA<213>人工序列<220>
<223>人工序列描述PCR锚定引物
<400>14gaccacgcgt atcgatgtcg ac 22<210>15<211>24<212>DNA<213>人工序列<220>
<223>人工序列描述RP3<400>15ggcagcacgc tgagtccctc tcgc2权利要求
1.含有一种开放阅读框的DNA,该开放阅读框编码一种特征在于与SEQ ID NO:3有30%或更高同一性的氨基酸序列的蛋白质。
2.根据权利要求1的DNA,其含有一种开放阅读框,该开放阅读框编码一种含有与SMC蛋白家族蛋白质成员的一段对比氨基酸有50%或更高序列同一性的一段100个或更多氨基酸的蛋白质。
3.根据权利要求1的DNA,其中该开放阅读框编码一种特征在于SEQID NO:3的氨基酸序列的蛋白质。
4.根据权利要求1的DNA,其特征在于SEQID NO:1或SEQ ID NO:2的核苷酸序列。
5.根据权利要求1的DNA,其中该开放阅读框编码一种促进植物细胞中DNA损伤重组修复的蛋白质。
6.根据权利要求1的DNA,其中该开放阅读框编码一种提供对甲磺酸甲酯(MMS)处理超敏感性的蛋白质。
7.根据权利要求6的DNA,其中该开放阅读框编码一种提供对X射线、紫外线或丝裂霉素C处理超敏感性的蛋白质。
8.根据权利要求1的DNA,其中该开放阅读框编码一种蛋白质,该蛋白质含有一个NTP结合区,随后是第一个卷曲螺旋区,一个绞链区或间隔区,和第二个卷曲螺旋区,随后是具有一个Walker B型NTP结合域的C末端DA盒。
9.权利要求1-8中任一项的开放阅读框所编码的蛋白质。
10.一种产生根据权利要求1的DNA的方法,其包括-筛查DNA文库,筛选能与SEQ ID NO:1所示DNA片段杂交的克隆,其中该片段具有至少15个核苷酸的长度;-将杂交的克隆测序;-纯化克隆的载体DNA,其含有一种编码与SEQ ID NO:3有超过40%序列同一性的蛋白质的开放阅读框;-任选地进一步处理纯化的DNA。
11.一种聚合酶链反应,其中至少一种使用的寡核苷酸含有代表SEQID NO:1的15个或更多碱基对的核苷酸序列。
全文摘要
本发明涉及编码促进植物细胞中DNA损伤重组修复的蛋白质的DNA。该DNA含有一种开放阅读框,其编码一种特征在于与SEQ ID NO:3有30%或更高同一性的氨基酸序列的蛋白质。
文档编号C12Q1/68GK1309713SQ99808698
公开日2001年8月22日 申请日期1999年7月14日 优先权日1998年7月16日
发明者T·曼吉斯特, J·帕兹科斯基 申请人:辛根塔参与股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1