专利名称:一种高分子量谷蛋白亚基基因及其启动子核酸序列与应用的制作方法
技术领域:
本发明属于生物基因工程技术领域,尤其涉及一种具有表达活性的高分子量谷蛋白亚基基因1Ay及其胚乳特异性表达启动子的核酸序列及其应用。
背景技术:
小麦是最重要的粮食作物之一,约占全世界粮食作物栽培面积的17%,是人类食物和营养的基本来源。小麦胚乳储藏蛋白可分为两大类谷蛋(Glutenin)和醇溶蛋白(Gliadin)。按照SDS-PAGE电泳迁移率的不同,谷蛋白又可分为高分子量谷蛋白亚基(High molecular weight glutenin subunits,HMW-GS)和低分子量谷蛋白亚基(Low molecular weight glutenin subunits,LHW-GS)。高分子量谷蛋白亚基是小麦种子内的一类重要储藏蛋白,是决定小麦面粉的加工和烘烤品质的主要因素。高分子谷蛋白亚基是由位于小麦第1部分同源群染色体长臂的3个基因位点所控制,分别称为Glu-A1、Glu-B1和Glu-D1。在每一个HMW-GS基因位点上都含有2个相距很近、紧密连锁的基因,分别控制分子量较高的x-型亚基和分子量较低的y-型亚基。从理论上讲,六倍体栽培小麦就应该有6条高分子谷蛋白亚基,但是由于部分基因处于沉默不表达状态,在SDS-PAGE电泳图谱上,大多数小麦品种只有3~5条带。在普通小麦中只有1Bx、1Dx和1Dy基因经常表达,而1Ax和1By经常不表达、1Ay基因根本不表达。启动子区域核苷酸序列的改变或编码区域类转座子的插入以及编码区提前终止密码子可能是导致1Ay基因不表达的主要原因。
高分子谷蛋白亚基变异对小麦面粉品质具有重要的作用。面粉中添加单个高分子量谷蛋白亚基基因表达产物和转基因试验均表面高分子量谷蛋白亚基对于面粉的面包烘烤品质具有重要的影响作用。不同高分子谷蛋白亚基组成及其相对含量是决定小麦面包烘烤品质或糕点烘烤品质好坏的主要因素。
SDS-PAGE和PCR技术已经成为鉴定和克隆高分子量谷蛋白亚基基因的主要技术手段,具有灵敏度度和特异性高,方便快捷等优点。D’ovidio et al(1995)首次报道了用PCR技术扩增普通小麦全部6个HMW-GS基因的方法。基于该方法,对于HMW-GS基因多态性的、分子量的分析和估计。由于在普通小麦中,1Ay基因不表达,对于该基因对于小麦面粉加工品质的影响的还没有报道。SDS-PAGE分析表明,在普通小麦二倍体亲缘物种乌拉尔图小麦(Triticum.urartu)存在表达的高分子量谷蛋白亚基1Ay,为研究1Ay基因的沉默与表达机制,以及1Ay亚基对小麦面粉品质的影响提供了前提和基础。从乌拉尔图小麦(Triticum.urartu)中分离表达的1Ay基因并通过基因工程技术转入普通小麦栽培品种对于改善小麦面粉加工品质和研究普通小麦中1Ay沉默机制具有重要的现实意义。
发明内容
本发明的目的在于,以小麦二倍体近缘物种乌拉尔图小麦(Triticum.urartu,2n=2x=14,AA)为材料,提供了具有表达活性的高分子量谷蛋白亚基基因Ay1.8,其编码基因序列如下agggaaagac aatggacatg cagaggggcg ggggcgagga agaaacacat ggagatcata 60gaagaacata agaggttaaa cataggagga ggatataatg gacaattaaa tccacattac 120ttgaactcat ttgggaagtg gaaaaatccc ctattctggt gtaaatcaaa ctaattgacg 180cgagttttct ctcaagatcc tatgttaatt ttagacatga atgaccaaag gtttcagtta 240gttgagtctt gtcatcgaaa ggtgtttaca taagcccaaa aattctacca gcttttggta 300cggtgcgtca tagcacacat aaatgttgcg agtcattgga tagatattgt gagtcatagc 360atgcatttgt gttgcctaaa aattcaacta catgaaaaga aacaaaacat aaatgtgatt 420ttgaaagatg atttatcaac tttccttatc catgcaagct accttccact gcataaccac 480ttcttttaga taaaaatagc agatcgatat acaaacgtct acacttctgt aaacagtacc 540caaaagccag aattaggatt gaactgatta cgtggcttta gcagaccgtc caaaaatctg 600ttttgcaaag ctccaattgc tccttgctta tccagcttct tttgtgttgg caaattgctc 660ttttacaact gactttattc ttctcgtgtt tcttcttagg ctgaactaac atcaccgtac 720acacaaccat tgtcatgaac cttcaccacg tccctataaa agcccaacca atccccacaa 780tctcatcatc acccacaaca ccgagcacca caaaatagag atcaattcac tgacagtcca 840ccgaaatggc taagcggttg gtcctctttg cgacagtagt cattggcctc gtggctctca 900ccgtcgctga aggtgaggcc tctaggcaac tacagtgcga gcgcgagctc caggagagct 960cgcttgaggc atgccggctg gtcgtggacc aacagttggc cggccggctg ccatggagca1020cggggctcca gatgcggtgc tgccagcagc tccgagatat tagtgccaag tgtcgccccg1080acgccgtcag ccaagtcgca agacaatatg ggcaaaccgc ggtgccgccc aagggcggat1140ccttctactc tcgcgagacc acgccactac agcaactcca acaaggaata tttgggggaa1200catcttcaca aacagtacaa gggtattacc caagtgtaat atctcctcag caggggtcat1260attatccagg ccaagcttct ccacaacagc caggaaaatg gcaagaacta ggacaagggc1320aacaagggta ctatccaact tctctgcagc agccaggaca agggcaacaa gggtactacc1380gaacttctct gcagcagcca ggacaagggc aacaagggta ctaccgaact tctctgcagc1440agccaggaca agggcaacag ataggacaat ggcaacaagg gtactaccca acttctccgc1500agcacccagg acaagggcaa caaccaggac aagtgcaaaa aataggacaa gggcaacaac1560
cagaaaaagg gcaacaacta ggacaagagc aacaaatagg acaagggcaa caaccagaac1620aagggcaaca accaggacaa gggcaacaac caggacaagg gcaacaaggg tactacccaa1680cttctccgca gcagccaaga caagggcaac aaccaggaca atggcaacaa ccaggacaag1740ggcaaaaagg gtactaccca acttctctgc agcagccagg acaagggcaa caagggcact1800acccagcttc tcagcaccag ccagggcagg ggcaacaagg gcaccaccca gcttctctgc1860agcagtcagg acaagggcaa caagggcacc acccagcttc tctgcagcag ccaggacaag1920gaaaacaaac aggacagcga gaacaaaggc aacaaccagg acaagggcaa caaacaggac1980aagggcaaca accagaacaa gagcaacaac caggacaagg gcaacaaggg tactatccaa2040cttatccgca acagccagga caagggcaac agccagaaca atggcaacaa ccaggacaag2100gtcaacagag gcactaccca gcttctctac agcagtcagg acaaggacaa caagggcact2160acccagcttc tctgcagcag ccaggacaag gacaaccagg acaaacacaa caaccaggac2220aagggcaaca tccagaacaa gaggaacaac caggacaagg gcaacaaggg tactatccaa2280cttctccaca gcaaccagga caagggcaac aaccaggaca agggcaacaa gggcacttcc2340caacttctgg acaggcgcaa caaccaggac aaggccaaca aataggacaa gcgcaacaac2400taggacaagg gcaacaagga tactacccaa cttccctgca gcagccagga caagagcaac2460agtcaggaca agggcaacag ttaggacaag gacaccaacc aggacaaggg caacaatcag2520gacaagagca acaaggctac gacagcccat accatgttag cgtggagcag caagcggcca2580gcccaaaggt ggcaaaggcg caccatccgg tggcacagct gccgacaatg tgccagatgg2640aggggggcga cgcattgtcg gctagccagt gatag 2675以上序列为具有表达活性的高分子量谷蛋白亚基基因(Ay1.8),该序列具有核苷酸组成的基因完整编码区以及胚乳特异性启基因表达启动子调控区,该启动子调控区的编码基因序列如下agggaaagac aatggacatg cagaggggcg ggggcgagga agaaacacat ggagatcata 60gaagaacata agaggttaaa cataggagga ggatataatg gacaattaaa tccacattac 120ttgaactcat ttgggaagtg gaaaaatccc ctattctggt gtaaatcaaa ctaattgacg 180cgagttttct ctcaagatcc tatgttaatt ttagacatga atgaccaaag gtttcagtta 240gttgagtctt gtcatcgaaa ggtgtttaca taagcccaaa aattctacca gcttttggta 300cggtgcgtca tagcacacat aaatgttgcg agtcattgga tagatattgt gagtcatagc 360atgcatttgt gttgcctaaa aattcaacta catgaaaaga aacaaaacat aaatgtgatt 420ttgaaagatg atttatcaac tttccttatc catgcaagct accttccact gcataaccac 480ttcttttaga taaaaatagc agatcgatat acaaacgtct acacttctgt aaacagtacc 540caaaagccag aattaggatt gaactgatta cgtggcttta gcagaccgtc caaaaatctg 600ttttgcaaag ctccaattgc tccttgctta tccagcttct tttgtgttgg caaattgctc 660ttttacaact gactttattc ttctcgtgtt tcttcttagg ctgaactaac atcaccgtac 720acacaaccat tgtcatgaac cttcaccacg tccctataaa agcccaacca atccccacaa 780tctcatcatc acccacaaca ccgagcacca caaaatagag atcaattcac tgacagtcca 840ccgaa 845运用基因工程的方法可对上述编码基因序列的结构进行改造,得到具有表达活性的高分子量谷蛋白亚基基因(Ay1.8)的衍生序列,该衍生序列包括新分离的具有与以上所述结构同样基本结构的基因序列及使用体外DNA操作技术通过碱基的置换、插入、缺失获得的该基因序列的各种变构体。
根据具有表达活性的高分子量谷蛋白亚基基因(Ay1.8),得到其氨基酸序列,该序列如下MAKRLVLFAT VVIGLVALTV AEGEASRQLQ CERELQESSL EACRLVVDQQ LAGRLPWSTG 60LQMRCCQQLR DISAKCRPDA VSQVARQYGQ TAVPPKGGSF YSRETTPLQQ LQQGIFGGTS120SQTVQGYYPS VISPQQGSYY PGQASPQQPG KWQELGQGQQ GYYPTSLQQP GQGQQGYYRT180SLQQPGQGQQ GYYRTSLQQP GQGQQIGQWQ QGYYPTSPQH PGQGQQPGQV QKIGQGQQPE240KGQQLGQEQQ IGQGQQPEQG QQPGQGQQPG QGQQGYYPTS PQQPRQGQQP GQWQQPGQGQ300KGYYPTSLQQ PGQGQQGHYP ASQHQPGQGQ QGHHPASLQQ SGQGQQGHHP ASLQQPGQGK360QTGQREQRQQ PGQGQQTGQG QQPEQEQQPG QGQQGYYPTY PQQPGQGQQP EQWQQPGQGQ420QRHYPASLQQ SGQGQQGHYP ASLQQPGQGQ PGQTQQPGQG QHPEQEEQPG QGQQGYYPTS480PQQPGQGQQP GQGQQGHFPT SGQAQQPGQG QQIGQAQQLG QGQQGYYPTS LQQPGQEQQS540GQGQQLGQGH QPGQGQQSGQ EQQGYDSPYH VSVEQQAASP KVAKAHHPVA QLPTMCQMEG600GDALSASQ 608本发明所述的具有表达活性的高分子量谷蛋白亚基基因Ay1.8及其胚乳特异性启动子核酸序列是指(1)序列表中SEQ ID NO.1的DNA序列;(2)编码序列表中SEQ ID NO.2氨基酸序列;(3)序列表中SEQ ID NO.3中非编码区的胚乳特异性表达的启动子DNA序列;目前利用PCR方法克隆高分子量谷蛋白基因已经成为非常成熟的技术手段。利用SDS-PAGE分析,从乌拉尔图小麦中鉴定了表达的高分子量谷蛋白亚基Ay。通过基因组PCR,分离和测序获得了Ay1.8的完整编码区及启动子调控区序列。该基因不同于普通小麦中已发表的Ay序列,编码区内没有提前终止密码子,能够正常表达蛋白质产物,是具有表达活性功能的基因;并且有6个半胱氨酸,比普通y型亚基少一个半胱氨酸。这种半胱氨酸数目上的变化将影响谷蛋白聚合体的空间结构和大小,可能对面团的粘弹性和延展性产生新的影响。有报道认为半胱氨酸数目的变化包括减少都可能引起面粉加工品质的改善。
通过序列分析的结果表明,基因Ay1.8由845bp的启动子调控序列和1830bp的编码区序列组成。启动子序列包括一系列典型的谷蛋白基因调控元件,如位于翻译起始密码子ATG上游-63bp的转录起始位点(TTATCA),-93bp的TATA框(CTATAAAAG),以及-186--149的增强子序列,约在-300bp处缺失一段78bp的部分增强子序列。这些元件共同调节高分子量谷蛋白亚基基因Ay1.8的胚乳特异性和时间特异性表达。
Ay1.8的编码区由1830bp组成,编码608个氨基酸,末端有两个连续的终止密码子,不含有内含子。由DNA序列推导的氨基酸序列如序列表中SEQ IDNO.2所示。氨基酸序列分析表明,Ay1.8具有典型的高分子量谷蛋白亚基的一级结构特征,包括由21个氨基酸组成的信号肽,104个氨基酸组成的N-端保守区,441个氨基酸组成的中部重复区和42个氨基酸组成的C-端保守区。中部重复区主要有重复的短肽(PGQGQQ和GYYPTSGQQ)组成。Ay1.8总共有6个半胱氨酸,N-端5个,C-端1个,中部重复区的半胱氨酸突变(Cys-Phe),本发明的积极性效果在于(1)Ay1.8编码区内不同于沉默的Ay基因,不含有提前终止密码子,能够正常表达。
(2)具有与不同的半胱氨酸数目,半胱氨酸数目比普通y型高分子量谷蛋白亚基少1个。
(3)Ay1.8上述两个特征将影响谷蛋白聚合体的结构和大小,对改善面粉加工品质提供积极性影响。
大量的研究已经证明高分子量谷蛋白亚基对于小麦面粉的烘烤和加工品质具有十分重要的作用。高分子量谷蛋白亚基的组成和数目是影响面团特性的主要因素,因此,改善和调整小麦栽培品种的高分子量谷蛋白亚基组成是改善其面粉品质的主要方向。目前,还没有关于利用有表达活性Ay亚基研究其对小麦面粉品质影响的深入研究。可通过构建胚乳特异性表达的转基因载体,利用基因枪法、农杆菌介导法和花粉管通道法等方法向普通小麦转化该基因,培育品质优良的转基因小麦。
图1乌拉尔图小麦高分子量谷蛋白亚基的SDS-PAGE分析。TU为乌拉尔图小麦,CS为对照中国春,表达的Ay亚基由箭头标出。
图2乌拉尔图小麦高分子量谷蛋白亚基基因编码区和启动子区的PCR扩增。
M为1kb DNA Marker,1为启动子区扩增产物,2为编码区扩增产物具体实施方式
以下结合实施例对本发明作进一步的详细描述,但并非对本发明的限制,凡依照本发明公开内容所作的任何本领域的等同替换,均属于本发明的保护范围。
实施例1.乌拉尔图小麦高分子量谷蛋白亚基的SDS-PAGE分析(1)植物材料乌拉尔图小麦,普通小麦品种中国春(2)谷蛋白样品制备取半粒种子,称重,用样品钳夹碎,放入1.5ml离心管中,然后按1mg加25μl的比例加入样品提取液,室温下2hr,沸水中煮2.5min,8000r/min离心5min,取上清液7~10μl,点样分析。蛋白提取缓冲液包括62.5mMTris-HCl pH6.8,2%(W/V)SDS,10%(V/V)甘油,1.5%(W/V)DTT,0.002%(W/V)溴酚蓝。
(3)电泳分析以中国春(亚基组合nul1,7+8,2+12)作为对照,恒流15~20mA电泳,待指示剂跑出分离胶30min后,取下胶染色过夜,脱色液脱色至凝胶背景清晰后,保存于固定液中,照相保存SDS-PAGE结果。结果如图1所示,表达的Ay1.8亚基迁移率略快于Dy12。
实施例2.乌拉尔图小麦高分子量谷蛋白亚基基因的分离与鉴定(1)引物设计根据已发表的高分子量谷蛋白亚基基因的编码区和启动子区序列信息,分别设计了扩增高分子量谷蛋白亚基基因编码区和特异性扩增y型亚基基因启动子区的引物,具体如下扩增编码区引物P15′-AGCTGCAGAGAGTTCTATCA-3′P25′-ATCACCCACAACACCGAGCA-3′扩增启动子区引物P35′-AGGGAAAGACAATGGACATG-3′P45′-CATCTGGAGCCCCGTGCTC-3′(2)CTAB法提取基因组DNAa)取2g新鲜幼嫩叶片,液氮研磨成细粉后加预热至65℃的CTAB提取液(2%CTAB;1.4M NaCl;0.1M Tris-HCl,pH=8.0;0.1M EDTA,pH=8.0;使用前加2%β-巯基乙醇)15ml,混匀。
b)65℃水浴30-45min,其间轻摇混匀。
c)冷却至室温后加等体积的氯仿∶异戊醇(24∶1),轻轻混匀至上清液呈牛奶状,4000r/min离心10min。
d)取上清液,加等体积异丙醇,置于冰浴沉淀DNA。
e)勾出DNA,用70%酒精洗2次,无水乙醇洗一次,气干DNA,溶于适量pH=8.0的1×TE溶液中。加入RNA酶至终浓度100μg/μL。
f)琼脂糖凝胶电泳检测DNA浓度及质量。
(3)高分子量谷蛋白亚基基因Ay1.8编码区及启动子区的PCR扩增a).Ay1.8编码区的PCR扩增PCR反应组成模板DNA 200-300ngdNTPs 200μM10×Ex Taq PCR缓冲液 5μl引物P1(50μM) 1.5μl引物P2(50μM) 1.5μlEx Taq酶 2.5UddH2O 加至终体积50μlPCR反应程序94℃ 5min 68℃ 15minb).Ay1.8启动子区的PCR扩增PCR反应组成模板DNA200-300ngdNTPs 200μM10×Ex Taq PCR缓冲液5μl引物P3(50μM) 1.5μl引物P4(50μM) 1.5μlEx Taq酶2.5UddH2O 加至终体积50μlPCR反应程序94℃ 4min
(4)高分子量谷蛋白亚基基因Ay1.8编码区及启动子区产物T-载体克隆PCR扩增产物用胶回收a)连接反应组成pMD18-T载体 1μl10×T4 DNA连接酶缓冲液 2μlT4 DNA连接酶350U回收PCR产物 加至终反应体积至20ul反应液于16℃过夜b)热击感受态的制备i.取在无抗生素平板上生长良好的单个DH10B菌斑,接种于2ml LB液体培养基中,37℃震荡培养过夜ii.取1ml活化过夜的菌液于100mlLB液体培养基中,37℃震荡培养至OD600=0.3iii.将菌液倒入2个50ml离心管中,冰上放置10miniv.在预冷至4℃的离心机中4000r/min离心10min去掉上清收集菌体v.加入20ml冰冷的0.1M CaCl2于每个50ml离心管中,均匀悬浮菌体后,放入冰中30分钟vi.6、4000r/min离心10min再次去掉上清收集菌体,在每管中加入2ml冰冷的0.1M CaCl2均匀悬浮菌体后,放入冰中待用c)转化大肠杆菌i.将连接产物加入200μl感受态细胞中,充分混匀,放于冰上30minii.2、42℃热击1min30s,冰上放1-2min后加入预热至37℃的LB液体培养基400μliii.3、37℃低速震荡培养40miniv.4、每个LB固体培养基平板(加入抗生素,氨苄青霉素50μg/ml)加入200μl菌液、10μl 0.1M IPTG和40μl 20mg/ml的x-gal均匀涂于平板上v.5、37℃培养箱中过夜培养d)阳性克隆筛选在20μl裂解液中加入少许白斑菌体,以相应的兰斑为对照,涡旋后离心,点样于0.8%琼脂糖凝胶上,根据阳性质粒在琼脂糖凝胶上比空载体的迁移率更慢获得阳性克隆,阳性克隆再经PCR检测,PCR反应的体系和参数除模板为质粒DNA外其余同基因组DNA的PCR扩增。
e)测序将筛选到的获得的编码区和启动子区的阳性克隆各5个送到商业公司(TAKARA)进行序列测定。获得的序列如序列表中SEQ ID NO.1所示的完整序列,包括上游启动子序列845bp和编码区序列1830bp。
序列表<110>四川农业大学<120>一种高分子量谷蛋白亚基基因及其启动子核酸序列与应用<130>061129<160>3<170>PatentIn version 3.3<210>1<211>2675<212>DNA<213>乌拉尔图小麦(Triticum.urartu)<400>1agggaaagac aatggacatg cagaggggcg ggggcgagga agaaacacat ggagatcata 60gaagaacata agaggttaaa cataggagga ggatataatg gacaattaaa tccacattac120ttgaactcat ttgggaagtg gaaaaatccc ctattctggt gtaaatcaaa ctaattgacg180cgagttttct ctcaagatcc tatgttaatt ttagacatga atgaccaaag gtttcagtta240gttgagtctt gtcatcgaaa ggtgtttaca taagcccaaa aattctacca gcttttggta300cggtgcgtca tagcacacat aaatgttgcg agtcattgga tagatattgt gagtcatagc360atgcatttgt gttgcctaaa aattcaacta catgaaaaga aacaaaacat aaatgtgatt420ttgaaagatg atttatcaac tttccttatc catgcaagct accttccact gcataaccac480ttcttttaga taaaaatagc agatcgatat acaaacgtct acacttctgt aaacagtacc540caaaagccag aattaggatt gaactgatta cgtggcttta gcagaccgtc caaaaatctg600ttttgcaaag ctccaattgc tccttgctta tccagcttct tttgtgttgg caaattgctc660ttttacaact gactttattc ttctcgtgtt tcttcttagg ctgaactaac atcaccgtac720acacaaccat tgtcatgaac cttcaccacg tccctataaa agcccaacca atccccacaa780tctcatcatc acccacaaca ccgagcacca caaaatagag atcaattcac tgacagtcca840ccgaaatggc taagcggttg gtcctctttg cgacagtagt cattggcctc gtggctctca900ccgtcgctga aggtgaggcc tctaggcaac tacagtgcga gcgcgagctc caggagagct960cgcttgaggc atgccggctg gtcgtggacc aacagttggc cggccggctg ccatggagca 1020cggggctcca gatgcggtgc tgccagcagc tccgagatat tagtgccaag tgtcgccccg 1080acgccgtcag ccaagtcgca agacaatatg ggcaaaccgc ggtgccgccc aagggcggat 1140
ccttctactc tcgcgagacc acgccactac agcaactcca acaaggaata tttgggggaa 1200catcttcaca aacagtacaa gggtattacc caagtgtaat atctcctcag caggggtcat 1260attatccagg ccaagcttct ccacaacagc caggaaaatg gcaagaacta ggacaagggc 1320aacaagggta ctatccaact tctctgcagc agccaggaca agggcaacaa gggtactacc 1380gaacttctct gcagcagcca ggacaagggc aacaagggta ctaccgaact tctctgcagc 1440agccaggaca agggcaacag ataggacaat ggcaacaagg gtactaccca acttctccgc 1500agcacccagg acaagggcaa caaccaggac aagtgcaaaa aataggacaa gggcaacaac 1560cagaaaaagg gcaacaacta ggacaagagc aacaaatagg acaagggcaa caaccagaac 1620aagggcaaca accaggacaa gggcaacaac caggacaagg gcaacaaggg tactacccaa 1680cttctccgca gcagccaaga caagggcaac aaccaggaca atggcaacaa ccaggacaag 1740ggcaaaaagg gtactaccca acttctctgc agcagccagg acaagggcaa caagggcact 1800acccagcttc tcagcaccag ccagggcagg ggcaacaagg gcaccaccca gcttctctgc 1860agcagtcagg acaagggcaa caagggcacc acccagcttc tctgcagcag ccaggacaag 1920gaaaacaaac aggacagcga gaacaaaggc aacaaccagg acaagggcaa caaacaggac 1980aagggcaaca accagaacaa gagcaacaac caggacaagg gcaacaaggg tactatccaa 2040cttatccgca acagccagga caagggcaac agccagaaca atggcaacaa ccaggacaag 2100gtcaacagag gcactaccca gcttctctac agcagtcagg acaaggacaa caagggcact 2160acccagcttc tctgcagcag ccaggacaag gacaaccagg acaaacacaa caaccaggac 2220aagggcaaca tccagaacaa gaggaacaac caggacaagg gcaacaaggg tactatccaa 2280cttctccaca gcaaccagga caagggcaac aaccaggaca agggcaacaa gggcacttcc 2340caacttctgg acaggcgcaa caaccaggac aaggccaaca aataggacaa gcgcaacaac 2400taggacaagg gcaacaagga tactacccaa cttccctgca gcagccagga caagagcaac 2460agtcaggaca agggcaacag ttaggacaag gacaccaacc aggacaaggg caacaatcag 2520gacaagagca acaaggctac gacagcccat accatgttag cgtggagcag caagcggcca 2580gcccaaaggt ggcaaaggcg caccatccgg tggcacagct gccgacaatg tgccagatgg 2640aggggggcga cgcattgtcg gctagccagt gatag 2675<210>2<211>608<212>PRT
<213>乌拉尔图小麦(Triticum.urartu)<400>2Met Ala Lys Arg Leu Val Leu Phe Ala Thr Val Val Ile Gly Leu Val1 5 10 15Ala Leu Thr Val Ala Glu Gly Glu Ala Ser Arg Gln Leu Gln Cys Glu20 25 30Arg Glu Leu Gln Glu Ser Ser Leu Glu Ala Cys Arg Leu Val Val Asp35 40 45Gln Gln Leu Ala Gly Arg Leu Pro Trp Ser Thr Gly Leu Gln Mer Arg50 55 60Cys Cys Gln Gln Leu Arg Asp Ile Ser Ala Lys Cys Arg Pro Asp Ala65 70 75 80Val Ser Gln Val Ala Arg Gln Tyr Gly Gln Thr Ala Val Pro Pro Lys85 90 95Gly Gly Ser Phe Tyr Ser Arg Glu Thr Thr Pro Leu Gln Gln Leu Gln100 105 110Gln Gly Ile Phe Gly Gly Thr Ser Ser Gln Thr Val Gln Gly Tyr Tyr115 120 125Pro Ser Val Ile Ser Pro Gln Gln Gly Ser Tyr Tyr Pro Gly Gln Ala130 135 140Ser Pro Gln Gln Pro Gly Lys Trp Gln Glu Leu Gly Gln Gly Gln Gln145 150 155 160Gly Tyr Tyr Pro Thr Ser Leu Gln Gln Pro Gly Gln Gly Gln Gln Gly165 170 175Tyr Tyr Arg Thr Ser Leu Gln Gln Pro Gly Gln Gly Gln Gln Gly Tyr180 185 190Tyr Arg Thr Ser Leu Gln Gln Pro Gly Gln Gly Gln Gln Ile Gly Gln195 200 205
Trp Gln Gln Gly Tyr Tyr Pro Thr Ser Pro Gln His Pro Gly Gln Gly210 215 220Gln Gln Pro Gly Gln Val Gln Lys Ile Gly Gln Gly Gln Gln Pro Glu225 230 235 240Lys Gly Gln Gln Leu Gly Gln Glu Gln Gln Ile Gly Gln Gly Gln Gln245 250 255Pro Glu Gln Gly Gln Gln Pro Gly Gln Gly Gln Gln Pro Gly Gln Gly260 265 270Gln Gln Gly Tyr Tyr Pro Thr Ser Pro Gln Gln Pro Arg Gln Gly Gln275 280 285Gln Pro Gly Gln Trp Gln Gln Pro Gly Gln Gly Gln Lys Gly Tyr Tyr290 295 300Pro Thr Ser Leu Gln Gln Pro Gly Gln Gly Gln Gln Gly His Tyr Pro305 310 315 320Ala Ser Gln His Gln Pro Gly Gln Gly Gln Gln Gly His His Pro Ala325 330 335Ser Leu Gln Gln Ser Gly Gln Gly Gln Gln Gly His His Pro Ala Ser340 345 350Leu Gln Gln Pro Gly Gln Gly Lys Gln Thr Gly Gln Arg Glu Gln Arg355 360 365Gln Gln Pro Gly Gln Gly Gln Gln Thr Gly Gln Gly Gln Gln Pro Glu370 375 380Gln Glu Gln Gln Pro Gly Gln Gly Gln Gln Gly Tyr Tyr Pro Thr Tyr385 390 395 400Pro Gln Gln Pro Gly Gln Gly Gln Gln Pro Glu Gln Trp Gln Gln Pro405 410 415Gly Gln Gly Gln Gln Arg His Tyr Pro Ala Ser Leu Gln Gln Ser Gly420 425 430
Gln Gly Gln Gln Gly His Tyr Pro Ala Ser Leu Gln Gln Pro Gly Gln435 440 445Gly Gln Pro Gly Gln Thr Gln Gln Pro Gly Gln Gly Gln His Pro Glu450 455 460Gln Glu Glu Gln Pro Gly Gln Gly Gln Gln Gly Tyr Tyr Pro Thr Ser465 470 475 480Pro Gln Gln Pro Gly Gln Gly Gln Gln Pro Gly Gln Gly Gln Gln Gly485 490 495His Phe Pro Thr Ser Gly Gln Ala Gln Gln Pro Gly Gln Gly Gln Gln500 505 510Ile Gly Gln Ala Gln Gln Leu Gly Gln Gly Gln Gln Gly Tyr Tyr Pro515 520 525Thr Ser Leu Gln Gln Pro Gly Gln Glu Gln Gln Ser Gly Gln Gly Gln530 535 540Gln Leu Gly Gln Gly His Gln Pro Gly Gln Gly Gln Gln Ser Gly Gln545 550 555 560Glu Gln Gln Gly Tyr Asp Ser Pro Tyr His Val Ser Val Glu Gln Gln565 570 575Ala Ala Ser Pro Lys Val Ala Lys Ala His His Pro Val Ala Gln Leu580 585 590Pro Thr Met Cys Gln Met Glu Gly Gly Asp Ala Leu Ser Ala Ser Gln595 600 605<210>3<211>845<212>DNA<213>乌拉尔图小麦(Triticum.urartu)<400>3agggaaagac aatggacatg cagaggggcg ggggcgagga agaaacacat ggagatcata 60gaagaacata agaggttaaa cataggagga ggatataatg gacaattaaa tccacattac120ttgaactcat ttgggaagtg gaaaaatccc ctattctggt gtaaatcaaa ctaattgacg180
cgagttttct ctcaagatcc tatgttaatt ttagacatga atgaccaaag gtttcagtta240gttgagtctt gtcatcgaaa ggtgtttaca taagcccaaa aattctacca gcttttggta300cggtgcgtca tagcacacat aaatgttgcg agtcattgga tagatattgt gagtcatagc360atgcatttgt gttgcctaaa aattcaacta catgaaaaga aacaaaacat aaatgtgatt420ttgaaagatg atttatcaac tttccttatc catgcaagct accttccact gcataaccac480ttcttttaga taaaaatagc agatcgatat acaaacgtct acacttctgt aaacagtacc540caaaagccag aattaggatt gaactgatta cgtggcttta gcagaccgtc caaaaatctg600ttttgcaaag ctccaattgc tccttgctta tccagcttct tttgtgttgg caaattgctc660ttttacaact gactttattc ttctcgtgtt tcttcttagg ctgaactaac atcaccgtac720acacaaccat tgtcatgaac cttcaccacg tccctataaa agcccaacca atccccacaa780tctcatcatc acccacaaca ccgagcacca caaaatagag atcaattcac tgacagtcca840ccgaa84权利要求
1.一种具有表达活性的高分子量谷蛋白亚基的编码基因序列,其特征在于,所述基因序列为序列表中SEQ ID No.1所示的核酸序列。
2.一种具有表达活性的高分子量谷蛋白亚基氨基酸序列,其特征在于,所述氨基酸序列为序列表中SEQ ID No.2所示的氨基酸序列。
3.一种具有表达活性的高分子量谷蛋白亚基基因胚乳特异性启基因表达启动子的编码序列,其特征在于,所述基因序列为序列表中SEQ ID No.3所示的核酸序列。
4.一种具有表达活性的高分子量谷蛋白亚基的编码基因序列的衍生序列,其特征在于,该衍生序列为权利要求1所述的基因序列的一个或几个碱基的置换、插入或缺失获得的该基因序列的变构体。
5.一种具有表达活性的高分子量谷蛋白亚基氨基酸序列的衍生序列,其特征在于,该衍生序列与权利要求3所述的一种具有表达活性的高分子量谷蛋白亚基氨基酸序列的衍生序列相对应,为在相应蛋白质的氨基酸序列基础上经过一个或几个氨基酸的一个或几个碱基的置换、插入或缺失获得的该基因序列的变构体。
6.一种具有表达活性的高分子量谷蛋白亚基基因胚乳特异性启基因表达启动子的应用,其特征在于利用胚乳特异性启动子构建胚乳特异性转基因表达载体,将外源基因转入小麦,培育加工品质优良的转基因小麦品种和小麦种质。
7.一种具有表达活性的高分子量谷蛋白亚基基因胚乳特异性启基因表达启动子的应用,其特征在利用基因枪法、农杆菌介导法和花粉管通道法等方法向普通小麦转化该基因,培育品质优良的转基因小麦品种和小麦种质。
全文摘要
本发明公开了一种具有表达活性的高分子量谷蛋白亚基的编码基因序列及其氨基酸序列,分别如序列表SEQ ID No.1和SEQ ID No.2所示,属于生物基因工程技术领域。同时公开了一种具有表达活性的高分子量谷蛋白亚基基因胚乳特异性启基因表达启动子,如序列表SEQ ID No.3所示。可通过利用有该基因对小麦面粉品质影响,构建胚乳特异性表达的转基因载体,利用基因枪法、农杆菌介导法和花粉管通道法等方法向普通小麦转化该基因,培育品质优良的转基因小麦。
文档编号C12N15/82GK1970765SQ20061002250
公开日2007年5月30日 申请日期2006年12月14日 优先权日2006年12月14日
发明者郑有良, 江千涛, 魏育明, 颜泽洪 申请人:四川农业大学