本发明属于生物医药工程
技术领域:
。具体地,本发明涉及利用质粒系统在蛋白中引入非天然氨基酸。
背景技术:
:作为蛋白质的翻译后修饰的重要位点以及多种酶活性中心的关键残基,非天然氨基酸在多种蛋白质行使其生理病理功能的过程中扮演重要的角色。对于蛋白质,特别是多肽药物,非天然氨基酸的修饰,不仅可能增强多肽药物的药效,降低药物毒性,还由于非天然氨基酸的掺入,使得多肽药物大大降低免疫原性,减少免疫排异反应,而且某些蛋白酶可能不再识别掺入非天然氨基酸的多肽物,使得药物在体内维系更长时间不被降解,从而延长药物半衰期,以革除多肽类药物不断注射给药的弊端;并且还有望通过修饰,使多肽药物“搭载”其它化学附件,从而导致疾病治疗新方法的出现。对于多肽药物的修饰,大多只通过化学合成的方法修饰。因此,本领域急需开发一种能够高效地在多肽药物中定点引入非天然氨基酸的方法。技术实现要素:本发明的目的是提供一种高效地在多肽药物中定点引入非天然氨基酸的方法。本发明的第一方面,提供了一种质粒系统,所述质粒系统包含:(1)第一表达盒,所述第一表达盒含有编码目的蛋白的第一编码序列,所述第一编码序列中含有用于引入预定的修饰氨基酸的天然密码子,所述天然密码子为uag(琥珀)、uaa(赭石)、或uga(蛋白石);和(2)第二表达盒,所述第二表达盒含有编码氨酰基-trna合成酶的第二编码序列;并且,所述系统还含有第三表达盒,所述第三表达盒含有编码人工trna的第三编码序列,其中所述人工trna含有对应于所述天然密码子的反密码子;并且所述的氨酰基-trna合成酶特异性催化所述人工trna形成“人工trna-xa”复合物,其中xa为氨酰基形式的所述预定的修饰氨基酸。在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。在另一优选例中,所述天然密码子为uag(琥珀)或uga(蛋白石)。在另一优选例中,所述的密码子包括mrna或dna上对应于氨基酸的三碱基核苷酸序列。在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(boc)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。在另一优选例中,所述炔基氧羰基赖氨酸的结构如下式i所示:其中,n为0-8。在另一优选例中,所述氨酰基-trna合成酶为野生型的氨酰基-trna合成酶或突变型氨酰基-trna合成酶。在另一优选例中,所述氨酰基-trna合成酶为赖氨酰-trna合成酶。在另一优选例中,所述氨酰基-trna合成酶为突变型赖氨酰-trna合成酶。在另一优选例中,所述突变型赖氨酰-trna合成酶在对应于野生型赖氨酰-trna合成酶的氨基酸序列中第19位精氨酸(r)和/或第29位组氨酸(h)发生突变。在另一优选例中,所述野生型赖氨酰-trna合成酶来自产甲烷古细菌的马氏甲烷八叠球菌(methanosarcinamazei)、巴氏甲烷八叠球菌(methanosarcinabarkeri)或噬乙酸甲烷八叠球菌(methanosarcinaacetivorans)。在另一优选例中,所述野生型赖氨酰-trna合成酶的氨基酸序列如seqidno.:1所示。在另一优选例中,所述野生型赖氨酰-trna合成酶的氨基酸序列如seqidno.:2所示。在另一优选例中,所述第19位精氨酸(r)突变为组氨酸(h)或赖氨酸(k);和/或第29位组氨酸(h)突变为精氨酸(r)或赖氨酸(k)。在另一优选例中,所述突变型赖氨酰-trna合成酶中的突变选自下组:r19h、r19k、h29r、h29k、或其组合。在另一优选例中,所述突变型赖氨酰-trna合成酶还包括选自下组的位点发生突变:第26位异亮氨酸(i)、第122位苏氨酸(t)、第309位亮氨酸(l)、第348位半胱氨酸(c)、第384位酪氨酸(y)、或其组合。在另一优选例中,所述突变型赖氨酰-trna合成酶的突变位点还包括第26位异亮氨酸(i);优选地,所述第26位异亮氨酸(i)突变为缬氨酸(v)。在另一优选例中,所述突变型赖氨酰-trna合成酶的突变位点还包括第122位苏氨酸(t);优选地,所述第122位苏氨酸(t)突变为色氨酸(s)。在另一优选例中,所述突变型赖氨酰-trna合成酶的突变位点还包括第309位亮氨酸(l);优选地,所述第309位亮氨酸(l)突变为丙氨酸(a)。在另一优选例中,所述突变型赖氨酰-trna合成酶的突变位点还包括第348位半胱氨酸(c);优选地,所述第348位半胱氨酸(c)突变为色氨酸(s)。在另一优选例中,所述突变型赖氨酰-trna合成酶的突变位点还包括第384位酪氨酸(y);优选地,所述第384位酪氨酸(y)突变为苯丙氨酸(f)。在另一优选例中,所述突变型赖氨酰-trna合成酶还包括选自下组的突变:i26v、t122s、l309a、c348s、y384f、或其组合。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19h和h29r。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19k和h29r。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19h和h29k。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19k和h29k。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19h、i26v和h29r。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19h、h29r、t122s和y384f。在另一优选例中,所述的突变型赖氨酰-trna合成酶包括选自下组的突变:r19h、h29r、l309a和c348s。在另一优选例中,所述的突变型赖氨酰-trna合成酶除所述突变(如第19和/或29位,以及任选的第26、122、309、348和/或384位)外,其余氨基酸与seqidno.:1或seqidno.:2所示的序列相同或基本相同。在另一优选例中,所述的基本相同是至多有50个(较佳地为1-20个,更佳地为1-10个)氨基酸不相同,其中,所述的不相同包括氨基酸的取代、缺失或添加,且所述的突变蛋白仍具有赖氨酰-trna合成酶的活性。在另一优选例中,所述突变型赖氨酰-trna合成酶的氨基酸序列与seqidno.1或seqidno.:2相比具有至少70%,优选至少75%、80%、85%、90%,更优选至少95%、96%、97%、98%、99%以上的序列相同性。在另一优选例中,所述突变型赖氨酰-trna合成酶为seqidno.:1或seqidno.:2所示的野生型赖氨酰-trna合成酶经突变形成的。在另一优选例中,所述突变型赖氨酰-trna合成酶选自下组:(1)氨基酸序列如seqidno.:3-9任一所示的多肽;或(2)将seqidno.:3-9任一所示氨基酸序列经过一个或几个,优选1-20个、更优选1-15个、更优选1-10个、更优选1-8个、更优选1-3个、最优选1个氨基酸残基的取代、缺失或添加而形成的,具有(1)所述多肽功能的由seqidno.:3-9任一所示氨基酸序列的多肽衍生的多肽。在另一优选例中,所述突变型赖氨酰-trna合成酶的氨基酸序列如seqidno.:3-9任一所示。在另一优选例中,所述突变型赖氨酰-trna合成酶为非天然蛋白。在另一优选例中,所述突变型赖氨酰-trna合成酶用于将赖氨酸衍生物引入目的蛋白中。在另一优选例中,所述突变型赖氨酰-trna合成酶具有以下特征:与野生型赖氨酰-trna合成酶相比,能将大官能团的赖氨酸衍生物导入蛋白中。在另一优选例中,所述人工trna的编码核酸序列如seqidno.:10所示。ggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttagattcccggggtttccgcca(seqidno.:10)在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、bh3肽、淀粉样变肽、或上述肽的片段、或其组合。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒位于同一质粒中。在另一优选例中,所述质粒为选自下组的表达载体:pbad/giiiabc、pbad/hisabc、pet28a、petduet-1、或pevol-pbpf载体。在另一优选例中,所述质粒还包含抗性基因、标签序列、阻遏蛋白基因(arac)、启动子基因(arabad)、或其组合。在另一优选例中,所述抗性基因选自下组:氨苄青霉素抗性基因(ampr)、氯霉素抗性基因(cmr)、卡那霉素抗性基因(kanar)、四环素抗性基因(tetr)、或其组合。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒在单质粒系统中的位置无任何限定。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个或三个可以合二为一。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个之间可以通过连接序列(如ires、p2a、t2a等)连接。在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒可以含有启动子,也可以不含启动子。在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒还包含一个或多个启动子,所述启动子可操作地与所述第一编码序列、所述第二编码序列、所述第三编码序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。在另一优选例中,所述第一表达盒中还包含第一启动子,较佳地所述第一启动子为可诱导启动子。在另一优选例中,所述第一启动子选自下组:阿拉伯糖启动子(arabad)、乳糖启动子(plac)、placuv5启动子、ptac启动子、或其组合。在另一优选例中,所述第一表达盒从5’-3’依次包括:启动子(如arabad)、核糖体结合位点rbs、所述第一编码序列、终止子或标签序列。在另一优选例中,所述第二表达盒中还包含第二启动子,较佳地所述第二启动子为可诱导启动子。在另一优选例中,所述第二启动子选自下组:阿拉伯糖启动子(arabad)、glns启动子或其组合。在另一优选例中,所述第二表达盒从5’-3’依次包括:启动子(如glns)、核糖体结合位点rbs、所述第二编码序列和终止子(glnst)。在另一优选例中,所述第三表达盒中还包含第三启动子,较佳地所述第三启动子为组成型启动子。在另一优选例中,所述第三启动子为逆转录启动子prok。在另一优选例中,所述第三表达盒从5’-3’依次包括:启动子(如prok)、核糖体结合位点rbs、第三编码序列和终止子或标签序列。本发明的第二方面,提供了一种宿主细胞或细胞提取液,所述宿主细胞或细胞提取液含有本发明第一方面所述的质粒系统。在另一优选例中,所述宿主细胞选自下组:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。在另一优选例中,所述细胞提取液来自选自下组的细胞:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。本发明的第三方面,提供了一种试剂盒,所述试剂盒含有(a)容器,以及(b)位于所述容器内的本发明第一方面所述的质粒系统。在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。在另一优选例中,所述试剂盒还包含细胞提取液。在另一优选例中,所述质粒系统为多质粒系统,所述的各质粒位于相同或不同的容器内。在另一优选例中,所述天然密码子为uag(琥珀)或uga(蛋白石)密码子。在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(boc)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。在另一优选例中,所述氨酰基-trna合成酶为野生型的氨酰基-trna合成酶或突变型氨酰基-trna合成酶。在另一优选例中,所述氨酰基-trna合成酶为赖氨酰-trna合成酶。在另一优选例中,所述氨酰基-trna合成酶为突变型赖氨酰-trna合成酶。在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、bh3肽、淀粉样变肽、或上述肽的片段、或其组合。本发明的第四方面,提供了如本发明第一方面所述的质粒系统、或本发明第二方面所述的宿主细胞或细胞提取液、或本发明第三方面所述的试剂盒的用途,用于制备含预定的修饰氨基酸的蛋白。在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(boc)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。本发明的第五方面,提供了一种制备含预定的修饰氨基酸的蛋白的方法,所述方法包括步骤:(1)提供本发明第二方面所述的宿主细胞或细胞提取液,和(2)添加所述预定的修饰氨基酸,培养所述细胞或细胞提取液,从而得到含所述预定的修饰氨基酸的蛋白。在另一优选例中,所述宿主细胞选自下组:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。在另一优选例中,所述细胞提取液来自选自下组的细胞:大肠杆菌、枯草芽孢杆菌、酵母细胞、昆虫细胞、哺乳动物细胞、或其组合。在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(boc)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。在另一优选例中,所述目的蛋白选自下组:胰岛素、人胰岛素前体蛋白、赖脯胰岛素的前体蛋白、甘精胰岛素的前体蛋白、甲状旁腺素、可的瑞琳、降血钙素、比伐卢定、胰高血糖素样肽及其衍生物艾塞那肽和利拉鲁肽、索玛鲁肽、齐考诺肽、舍莫瑞林、生长瑞林、分泌素、替度鲁肽、水蛭素、生长激素、生长因子、生长激素释放因子、促肾上腺皮质激素、释放因子、德舍瑞林、去氨加压素、依降钙素、胰高血糖素、亮丙瑞林、促黄体激素释放激素、生长激素抑制素、促甲状腺激素释放激素、曲普瑞林、血管活性肠肽、干扰素、甲状旁腺激素、bh3肽、淀粉样变肽、或上述肽的片段、或其组合。应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。附图说明图1显示了pbad-a1-u4-u5-tev-r-miniins质粒图谱。图2显示了pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs]-prok[pylt]质粒图谱。图3显示了pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(r19h,h29r,t122s,y384f)]-prok[pylt]的质粒图谱。具体实施方式本发明人经过广泛而深入的研究,首次意外地发现通过本发明质粒系统能够将非天然氨基酸直接引入到蛋白中,成本低,产率高,环境污染小。此外,本申请还意外地获得一种突变型赖氨酰-trna合成酶。相比野生型赖氨酰-trna合成酶,本发明突变型赖氨酰-trna合成酶可提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。此外,本发明突变型赖氨酰-trna合成酶还可以提高目的蛋白的稳定性,使其不容易断裂。本发明质粒系统优选为单质粒系统,相比多质粒系统,能够降低质粒丢失率,从而保证菌株高效稳定表达目的蛋白;在菌珠筛选时,可以仅使用单一抗性筛选,减少抗生素的使用。在此基础上,发明人完成了本发明。术语说明除非另外定义,否则本文中所用的全部技术与科学术语均具有如本发明所属领域的普通技术人员通常理解的相同含义。如本文所用,在提到具体列举的数值中使用时,术语“约”意指该值可以从列举的值变动不多于1%。例如,如本文所用,表述“约100”包括99和101和之间的全部值(例如,99.1、99.2、99.3、99.4等)。如本文所用,术语“含有”或“包括(包含)”可以是开放式、半封闭式和封闭式的。换言之,所述术语也包括“基本上由…构成”、或“由…构成”。序列同一性(或同源性)通过沿着预定的比较窗(其可以是参考核苷酸序列或蛋白的长度的50%、60%、70%、80%、90%、95%或100%)比较两个对齐的序列,并且确定出现相同的残基的位置的数目来确定。通常地,这表示为百分比。核苷酸序列的序列同一性的测量是本领域技术人员熟知的方法。载体如本文所用,术语“构建体”或“载体”通常是指能够转运其所连接的目的蛋白的编码序列的核酸。一种类型的载体是“质粒”,其是指可以连接另外的dna区段的环状双链dna环。目的蛋白的编码序列可以被掺入载体中。载体可用于在兼容的宿主细胞中复制核酸。载体可以从宿主细胞中回收。载体可以是用于在相容的宿主细胞中表达目的核酸序列的表达载体。适当地,目的蛋白的编码序列可操作地连接到能够提供目的蛋白的编码序列在宿主细胞中的表达的控制序列(例如启动子或增强子)。术语“可操作地连接”是指所描述的组分处于允许它们以其预期方式起作用的关系中。可操作地连接到目的蛋白的编码序列的调节序列以这样的方式连接,使得在与控制序列相容的条件下实现目的核酸序列的表达。载体可以被转化或转染到合适的宿主细胞中以提供蛋白质的表达。该过程可以包括在提供编码蛋白质的目的核酸序列的载体的表达的条件下培养用表达载体转化的宿主细胞,和任选地回收表达的蛋白质。载体可以是例如提供有复制起点、任选地用于表达目标核酸序列的启动子和任选的启动子的调节子的质粒或病毒载体。在细菌质粒的情况下,载体可以含有一个或多个选择标记基因,例如卡那霉素抗性基因。本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码dna序列和合适的转录/翻译控制信号的表达载体,优选市售的载体:细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。所述的dna序列可有效连接到表达载体中的适当启动子上,以指导mrna合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体的pl启动子:真核启动子包括cmv早期启动子、hsv胸苷激酶启动子、早期和晚期sv40启动子、反转录病毒的ltrs和其它一些已知的可控制基因在原核细胞或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子,在载体中插入增强子序列将会使其在高等真核细胞中的转录得到增强。增强子是dna表达的顺式作用因子,通常大约有10-300bp,作用于启动子以增强基因的转录。如腺病毒增强子。此外,表达载体优选包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状。本发明还提供的重组载体,其包含本发明的目的蛋白、突变型赖氨酰-trna合成酶基因、以及任选的trna的dna序列。在优选的实施方式中,所述重组载体的启动子下游包含多克隆位点或至少一个酶切位点。需要表达目的基因时,将目的基因连接入适合的多克隆位点或酶切位点,从而可操作地连接目的基因与启动子。在另一优选的实施方式中,所述重组载体在5’到3’方向上包括:启动子,目的基因和终止子。如果需要,所述重组载体还可以包括以下元件:蛋白纯化标签;3’多聚核苷酸化信号;非翻译核酸序列;转运和靶向核酸序列;选择标记(抗生素抗性基因、荧光蛋白等);增强子;或操作子。用于制备重组载体的方法是本领域普通技术人员所熟知的。表达载体可以是细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒或其他载体,在一优选实施方式中,表达的载体可以为pet、pcw、puc、ppic9k、pma5或其他载体。总之,只要其能够在宿主体内复制和稳定,任何质粒和载体都可以被采用。本领域普通技术人员可以采用熟知的方法构建含有本发明启动子和/或目的基因序列的载体。这些方法包括体外重组dna技术、dna合成技术、体内重组技术等。本发明的表达载体,可以用于转化适当的宿主细胞,以使宿主转录目的rna或表达目的蛋白质。宿主细胞可以是原核细胞,如大肠杆菌、谷氨酸棒杆菌、黄色短杆菌、链霉菌属、农杆菌:或是低等真核细胞,如酵母细胞;或是高等真核细胞,如植物细胞,较佳地,油菜、烟草、大豆;昆虫细胞如果蝇s2或sf9;动物细胞如cho、cos或bowes黑素瘤细胞等。在一优选实施方式中,表达宿主可以为大肠杆菌、枯草芽孢杆菌、毕赤酵母、链霉菌或其他宿主细胞。本领域一般技术人员都清楚如何选择适当的载体和宿主细胞。用重组dna转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用cacl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的dna转染方法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。该方法是这样实现的,根据宿主细胞,用本领域技术人员所共知的方法生长或培养。比如微生物细胞通常是在0-100℃,优选10-60℃,同时还要氧气。培养基中含有碳源,如葡萄糖;氮源,通常是有机氮的形式,如酵母提取物、氨基酸;盐,如硫酸铵,微量元素,如铁、镁盐;如果需要的话还有维生素。在此期间培养基的ph可以保持固定的值,就是说,在培养期间进行控制或不控制。培养可以分批培养、半不连续培养或连续培养形式进行。在培养之后,收集细胞,破碎或直接使用。转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、花芽浸泡法等。对于转化的植物细胞、组织或器官可以用常规方法再生成植株,从而获得转基因的植物。获得的转化子可以用常规方法培养,表达本发明的目的蛋白。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(hplc)和其它各种液相层析技术及这些方法的结合。术语“可操作连接”是指将准备转录表达的目的基因以一种本领域的常规方式连接到它的控制序列以被表达。质粒系统本发明提供了一种质粒系统,所述质粒系统包含:(1)第一表达盒,所述第一表达盒含有编码目的蛋白的第一编码序列,所述第一编码序列中含有用于引入预定的修饰氨基酸的天然密码子,所述天然密码子为uag(琥珀)、uaa(赭石)、或uga(蛋白石);和(2)第二表达盒,所述第二表达盒含有编码氨酰基-trna合成酶的第二编码序列;(3)第三表达盒,所述第三表达盒含有编码人工trna的第三编码序列,其中所述人工trna含有对应于所述天然密码子的反密码子;并且所述的氨酰基-trna合成酶特异性催化所述人工trna形成“人工trna-xa”复合物,其中xa为氨酰基形式的所述预定的修饰氨基酸。在另一优选例中,所述质粒系统为单质粒系统或多质粒系统,优选为单质粒系统。在另一优选例中,所述天然密码子为uag(琥珀)或uga(蛋白石)。在另一优选例中,所述的密码子包括mrna或dna上对应于氨基酸的三碱基核苷酸序列。在另一优选例中,所述预定的修饰氨基酸为带有修饰基团的赖氨酸。在另一优选例中,所述修饰氨基酸选自下组:炔基氧羰基赖氨酸衍生物、叔丁氧羰基(boc)-赖氨酸衍生物、脂肪酰化赖氨酸衍生物、或其组合。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒位于同一质粒中。在另一优选例中,所述质粒为选自下组的表达载体:pbad/giiiabc、pbad/hisabc、pet28a、petduet-1、或pevol-pbpf载体。在另一优选例中,所述质粒还包含抗性基因、标签序列、阻遏蛋白基因(arac)、启动子基因(arabad)、或其组合。在另一优选例中,所述抗性基因选自下组:氨苄青霉素抗性基因(ampr)、氯霉素抗性基因(cmr)、卡那霉素抗性基因(kanar)、四环素抗性基因(tetr)、或其组合。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒在单质粒系统中的位置无任何限定。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个或三个可以合二为一。在另一优选例中,所述第一表达盒、第二表达盒和第三表达盒中的任何两个之间可以通过连接序列(如ires、p2a、t2a等)连接。在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒可以含有启动子,也可以不含启动子。在另一优选例中,所述第一表达盒、第二表达盒和/或第三表达盒还包含一个或多个启动子,所述启动子可操作地与所述第一编码序列、所述第二编码序列、所述第三编码序列、增强子、转录终止信号、多腺苷酸化序列、复制起点、选择性标记、核酸限制性位点、和/或同源重组位点连接。在另一优选例中,所述第一表达盒中还包含第一启动子,较佳地所述第一启动子为可诱导启动子。在另一优选例中,所述第一启动子选自下组:阿拉伯糖启动子(arabad)、乳糖启动子(plac)、placuv5启动子、ptac启动子、或其组合。在另一优选例中,所述第一表达盒从5’-3’依次包括:启动子(如arabad)、核糖体结合位点rbs、所述第一编码序列、终止子或标签序列。在另一优选例中,所述第二表达盒中还包含第二启动子,较佳地所述第二启动子为可诱导启动子。在另一优选例中,所述第二启动子选自下组:阿拉伯糖启动子(arabad)、glns启动子或其组合。在另一优选例中,所述第二表达盒从5’-3’依次包括:启动子(如glns)、核糖体结合位点rbs、所述第二编码序列、终止子(glnst)。在另一优选例中,所述第三表达盒中还包含第三启动子,较佳地所述第三启动子为组成型启动子。在另一优选例中,所述第三启动子为逆转录启动子prok。在另一优选例中,所述第三表达盒从5’-3’依次包括:启动子(如prok)、核糖体结合位点rbs、第三编码序列、终止子或标签序列。在另一优选例中,所述启动子glns的dna序列如seqidno.:13所示。ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgttgtttacgctttg(seqidno.:13)在另一优选例中,所述终止子glnst的dna序列如seqidno.:14所示。caaacaatccaaaacgccgcgttcagcggcgttttttctgctttt(seqidno.:14)在另一优选例中,所述启动子prok的dna序列如seqidno.:15所示。tgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggtaataattgacgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgatcaaaaggcattttgctattaagggattgacgagggcgt(seqidno.:15)在另一优选例中,所述终止子prokt的dna序列如seqidno.:16所示。aattcgaaaagcctgctcaacgagcaggcttttttgcatg(seqidno.:16)野生型赖氨酰-trna合成酶如本文所用,“野生型赖氨酰-trna合成酶”、“野生型酶pylrs”是指天然存在的、未经过人工改造的氨酰-trna合成酶,其核苷酸可以通过基因工程技术来获得,如基因组测序、聚合酶链式反应(pcr)等,其氨基酸序列可由核苷酸序列推导而得到。所述野生型赖氨酰-trna合成酶的来源没有特别限制,一种优选的来源为产甲烷古细菌的马氏甲烷八叠球菌(methanosarcinamazei)、巴氏甲烷八叠球菌(methanosarcinabarkeri)和噬乙酸甲烷八叠球菌(methanosarcinaacetivorans)等取得,但不限于此。在本发明的一个优选例中,所述野生型赖氨酰-trna合成酶的氨基酸序列如seqidno.:1所示。mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:1)在本发明的一个优选例中,所述野生型赖氨酰-trna合成酶的氨基酸序列如seqidno.:2所示。mdkkplntlisatglwmsrtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsgsyyngistnl(seqidno.:2)突变型赖氨酰-trna合成酶如本文所用,术语“突变蛋白”、“本发明突变蛋白”、“本发明突变的氨酰-trna合成酶”、“突变型赖氨酰-trna合成酶”、“突变体酶”、“氨酰-trna合成酶的突变体”可互换使用,均指非天然存在的突变的氨酰-trna合成酶,且所述突变的氨酰-trna合成酶为对seqidno.:1或seqidno.:2所示多肽进行人工改造的蛋白。具体地,所述突变的氨酰-trna合成酶如本发明第一方面所述。应理解,本发明突变型赖氨酰-trna合成酶中的氨基酸编号基于野生型赖氨酰-trna合成酶(优选地,seqidno.:1或seqidno.:2)作出。当某一具体突变蛋白与seqidno.:1或seqidno.:2所示序列的同源性达到80%或以上时,突变蛋白的氨基酸编号可能会有相对于seqidno.:1或seqidno.:2的氨基酸编号的错位,如向氨基酸的n末端或c末端错位1-5位,而采用本领域常规的序列比对技术,本领域技术人员通常可以理解这样的错位是在合理范围内的,且不应当由于氨基酸编号的错位而使同源性达80%(如90%、95%、98%)的、具有相同或相似糖基转移酶活性的突变蛋白不在本发明突变蛋白的范围内。本发明突变蛋白是合成蛋白或重组蛋白,即可以是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的突变蛋白可以是糖基化的,或可以是非糖基化的。本发明的突变蛋白还可包括或不包括起始的甲硫氨酸残基。本发明还包括所述突变蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述突变蛋白相同的生物学功能或活性的蛋白。本发明的突变蛋白片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的突变蛋白,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的突变蛋白,或(iii)成熟突变蛋白与另一个化合物(比如延长突变蛋白半衰期的化合物,例如聚乙二醇)融合所形成的突变蛋白,或(iv)附加的氨基酸序列融合到此突变蛋白序列而形成的突变蛋白(如前导序列或分泌序列或用来纯化此突变蛋白的序列或蛋白原序列,或与抗原igg片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。本发明中,保守性替换的氨基酸最好根据表i进行氨基酸替换而产生。表ipylrs的氨基酸底物的识别与催化活性功能域的立体结构相关,野生型pylrs能够活化的赖氨酸衍生物的大小有限,具有大官能团的赖氨酸衍生物就不能导入到蛋白质中,因此,通过对pylrs位点的突变,避免结合底物的空间位阻,或突变氨基酸与底物氨基酸或者是主链部分发生的相互作用,来提高效果。优选地,所述的突变蛋白如seqidno.:3-9中任一所示。mdkkplntlisatglwmshtgtihkvkhrevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:3)mdkkplntlisatglwmshtgtihkikhrevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenseaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvfgdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:4)mdkkplntlisatglwmshtgtihkikhrevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynyarkldralpdpikifeigpcyrkesdgkehleeftmlnfsqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:5)mdkkplntlisatglwmshtgtihkikhrevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:6)mdkkplntlisatglwmshtgtihkikhhevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:7)mdkkplntlisatglwmsrtgtihkikhrevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:8)mdkkplntlisatglwmsktgtihkikhkevsrskiyiemacgdhlvvnnsrssrtaralrhhkyrktckrcrvsdedlnkfltkanedqtsvkvkvvsaptrtkkampksvarapkplenteaaqaqpsgskfspaipvstqesvsvpasvstsissistgatasalvkgntnpitsmsapvqasapaltksqtdrlevllnpkdeislnsgkpfrelesellsrrkkdlqqiyaeerenylgklereitrffvdrgfleikspilipleyiermgidndtelskqifrvdknfclrpmlapnlynylrkldralpdpikifeigpcyrkesdgkehleeftmlnfcqmgsgctrenlesiitdflnhlgidfkivgdscmvygdtldvmhgdlelssavvgpipldrewgidkpwigagfglerllkvkhdfknikraarsesyyngistnl(seqidno.:9)应理解,本发明突变蛋白与seqidno.:1或seqidno.:2所示的序列相比,通常具有较高的同源性(相同性),优选地,所述的突变蛋白与seqidno.:1或seqidno.:2所示序列的同源性至少为80%,较佳地至少为85%-90%,更佳地至少为95%,更佳地至少为98%,最佳地至少为99%。此外,还可以对本发明突变蛋白进行修饰。修饰(通常不改变一级结构)形式包括:体内或体外的突变蛋白的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在突变蛋白的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的突变蛋白。这种修饰可以通过将突变蛋白暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的突变蛋白。术语“编码突变型赖氨酰-trna合成酶的多核苷酸”可以是包括编码本发明突变型赖氨酰-trna合成酶的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或突变蛋白的片段、类似物和衍生物。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的突变蛋白的功能。本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×ssc,0.1%sds,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。本发明的突变蛋白和多核苷酸优选以分离的形式提供,更佳地,被纯化至均质。本发明多核苷酸全长序列通常可以通过pcr扩增法、重组法或人工合成的方法获得。对于pcr扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cdna库或按本领域技术人员已知的常规方法所制备的cdna库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次pcr扩增,然后再将各次扩增出的片段按正确次序拼接在一起。一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,已经可以完全通过化学合成来得到编码本发明蛋白(或其片段,或其衍生物)的dna序列。然后可将该dna序列引入本领域中已知的各种现有的dna分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。应用pcr技术扩增dna/rna的方法被优选用于获得本发明的多核苷酸。特别是很难从文库中得到全长的cdna时,可优选使用race法(race-cdna末端快速扩增法),用于pcr的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的dna/rna片段。本发明的技术方案,具有如下有益效果:(1)本发明通过质粒系统,将非天然氨基酸直接引入到蛋白的合成过程中,成本低,产率高,环境污染小。(2)只需要化学合成带有修饰基团的氨基酸,省去化学合成肽链方法的合成路径摸索时间,相较于有机合成,修饰效率及终产物得率高。(3)相比野生型赖氨酰-trna合成酶,本发明突变型赖氨酰-trna合成酶可提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。此外,本发明突变型赖氨酰-trna合成酶还可以提高目的蛋白的稳定性,使其不容易断裂。通过对赖氨酰-trna合成酶部分序列的突变,可以促使其可溶表达,更有利于对不同表达形式的目的蛋白的分离纯化。(4)本发明的单质粒系统能够降低质粒丢失率,保证菌株高效稳定表达目的蛋白。(5)菌珠筛选时,本发明的单质粒系统可以仅仅使用单一抗性筛选,从而减少抗生素的使用。下面结合具体实施,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如sambrook等人,分子克隆:实验室手册(newyork:coldspringharborlaboratorypress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。实施例1、表达野生型pylrs的菌种的构建根据融合蛋白a1-u4-u5-tev-r-miniins的氨基酸序列(seqidno.:11),根据大肠杆菌的密码子偏好性,合成了a1-u4-u5-tev-r-miniins的dna序列(seqidno.:12),克隆至表达载体质粒pbad/hisa(购自ntcc公司,卡那霉素抗性)的arabad启动子下游ncoi-xhoi位点。不保留表达载体质粒pbad/hisa原有的标签基因(6*his)。a1-u4-u5-tev-r-miniins的氨基酸序列mvskgeelftgvyvqertisfkdtyktraevkfegdenlyfqgrfvnqhlcgshlvealylvcgergffytpktrgiveqcctsicslyqlenycn(seqidno.:11)a1-u4-u5-tev-r-miniins的dna序列atggttagcaaaggtgaagaactgtttaccggcgtttatgtgcaggaacgtaccattagcttcaaagatacctataaaacccgtgcggaagttaaatttgaaggcgatgaaaacctgtattttcagggacgtttcgttaaccaacacctgtgcggcagccacctggtagaggcactgtatctggtttgtggtgaacgtggcttcttctatactccgtagactcgtggtatcgtggaacagtgttgcacttctatttgctctctgtatcagctggaaaattactgtaattaa(seqidno.:12)以限制性内切酶ncoi和xhoi将序列1从克隆载体puc57-a1-u4-u5-tev-r-miniins上切下,同时以ncoi和xhoi将表达载体质粒pbad/hisa切开,以核酸电泳进行分离,以琼脂糖凝胶dna回收试剂盒提取,使用t4dnaligase连接,以化学法(cacl2法)转化到e.colitop10感受态细胞中,将所述转化的细胞培养在含有卡那霉素的lb琼脂培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有卡那霉素的液体lb培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl)中37℃220rpm培养过夜。以质粒小量提取试剂盒提取质粒,得到的质粒命名为pbad-a1-u4-u5-tev-r-miniins。质粒图谱见图1。根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),根据非天然trna(pylt)的dna序列(seqidno.:10),根据来源于pevol-pbpf载体的谷氨酰胺启动子glns和启动子prok及其对应终止子的dna序列(seqidno.:13-16),根据大肠杆菌的密码子偏好性,合成了glns[pylrs]-prok[pylt]的dna序列(seqidno.:17),克隆至质粒pbad-a1-u4-u5-tev-r-miniins上,终止子rrnb下游的avrii-xbai位点,其中avrii和xbai酶切位点通过pcr方法增加。glns[pylrs]-prok[pylt]的dna序列:ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgttgtttacgctttgaggaatcccatatggataagaaaccgctgaatactctgatttctgcaactggtctgtggatgagccgtaccggcaccatccacaagatcaaacaccacgaggtttcccgtagcaaaatctacatcgaaatggcgtgcggtgaccacctggtggtaaacaactcccgttcttctcgtactgcacgtgctctgcgccaccacaagtaccgtaagacctgcaagcgctgtcgcgtgtctgatgaagacctgaacaaattcctgactaaagcgaacgaagatcagacttctgtgaaggtgaaagttgtttctgccccaacccgcaccaagaaagcgatgccgaagtccgttgcacgcgctccgaaaccgctggagaacaccgaagccgcacaggcccagccgtctggttctaagttttctccggcaatcccggtttctactcaggagtctgtgtctgtgccagcttctgttagcacttctatttcctctatcagcactggtgcgactgcgtccgctctggtaaaaggtaacactaacccgatcaccagcatgtctgctccggttcaggcttctgcaccggcactgactaaaagccagactgaccgtctggaggttctgctgaacccgaaagatgaaatcagcctgaactctggcaaaccgttccgtgaactggaatccgaactgctgtctcgtcgtaagaaagacctgcaacaaatctatgctgaagagcgtgaaaactacctgggtaaactggaacgtgaaatcacccgtttctttgtggaccgtggtttcctggaaatcaagtctccgatcctgatcccgctggaatacatcgagcgcatgggtattgataacgacaccgaactgtccaagcagattttccgtgtggacaagaacttctgcctgcgtccgatgctggcaccgaacctgtacaattacctgcgtaaactggatcgtgcactgccggacccgatcaaaatctttgaaatcggtccatgctatcgtaaggagagcgacggtaaagaacacctggaagagttcactatgctgaacttttgtcagatgggttctggctgcacccgtgaaaatctggaatctatcatcaccgacttcctgaaccacctgggcattgacttcaaaatcgttggtgattcctgcatggtttacggtgacactctggacgttatgcatggtgatctggaactgagcagcgctgttgtgggtccgattccgctggatcgtgaatggggtatcgataaaccgtggattggtgctggcttcggtctggaacgtctgctgaaagttaagcacgactttaagaacatcaaacgtgctgcgcgttccgagtcctattacaacggcattagcactaacctgtaagtcgaccaaacaatccaaaacgccgcgttcagcggcgttttttctgcttttgcggccgctgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggtaataattgacgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgatcaaaaggcattttgctattaagggattgacgagggcgtatctgcgcagtaagatgcgccccgcattggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttagattcccggggtttccgccaaattcgaaaagcctgctcaacgagcaggcttttttgcatg(seqidno.:17)以限制性内切酶avrii和xbai将seqidno.:17所示的序列从克隆载体puc57-glns[pylrs]-prok[pylt]上切下,同时以avrii和xbai将质粒pbad-a1-u4-u5-tev-r-miniins切开,以核酸电泳进行分离,以琼脂糖凝胶dna回收试剂盒提取,使用t4dnaligase连接,以化学法(cacl2法)转化到e.colitop10感受态细胞中,将所述转化的细胞培养在含有卡那霉素的lb琼脂培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有卡那霉素的液体lb培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl)中37℃220rpm培养过夜。加入终浓度20%甘油保存菌种。以质粒小量提取试剂盒提取质粒,得到的含有野生型赖氨酰-trna合成酶的质粒命名为pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs]-prok[pylt]。质粒图谱见图2。实施例2、表达突变型pylrs的菌种的构建根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),引入突变r19h,h29r,t122s,y384f,得到氨基酸序列如seqidno.:4所示的突变型赖氨酰-trna合成酶pylrs(r19h,h29r,t122s,y384f)。根据来源于pevol-pbpf载体的谷氨酰胺启动子glns及其对应终止子glnst的dna序列(seqidno.:13,14),根据大肠杆菌的密码子偏好性,合成了glns[pylrs(r19h,h29r,t122s,y384f)]的dna序列(seqidno.:18)。glns[pylrs(r19h,h29r,t122s,y384f)]的dna序列:ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgttgtttacgctttgaggaatcccatatggataagaaaccgctgaatactctgatttctgcaactggtctgtggatgagccataccggcaccatccacaagatcaaacaccgcgaggtttcccgaagcaaaatctacatcgaaatggcgtgcggtgaccacctggtggtaaacaactcccgttcttctcgtactgcacgtgctctgcgccaccacaagtaccgtaagacctgcaagcgctgtcgcgtgtctgatgaagacctgaacaaattcctgactaaagcgaacgaagatcagacttctgtgaaggtgaaagttgtttctgccccaacccgcaccaagaaagcgatgccgaagtccgttgcacgcgctccgaaaccgctggagaactccgaagccgcacaggcccagccgtctggttctaagttttctccggcaatcccggtttctactcaggagtctgtgtctgtgccagcttctgttagcacttctatttcctctatcagcactggtgcgactgcgtccgctctggtaaaaggtaacactaacccgatcaccagcatgtctgctccggttcaggcttctgcaccggcactgactaaaagccagactgaccgtctggaggttctgctgaacccgaaagatgaaatcagcctgaactctggcaaaccgttccgtgaactggaatccgaactgctgtctcgtcgtaagaaagacctgcaacaaatctatgctgaagagcgtgaaaactacctgggtaaactggaacgtgaaatcacccgtttctttgtggaccgtggtttcctggaaatcaagtctccgatcctgatcccgctggaatacatcgagcgcatgggtattgataacgacaccgaactgtccaagcagattttccgtgtggacaagaacttctgcctgcgtccgatgctggcaccgaacctgtacaattacctgcgtaaactggatcgtgcactgccggacccgatcaaaatctttgaaatcggtccatgctatcgtaaggagagcgacggtaaagaacacctggaagagttcactatgctgaacttttgtcagatgggttctggctgcacccgtgaaaatctggaatctatcatcaccgacttcctgaaccacctgggcattgacttcaaaatcgttggtgattcctgcatggttttcggtgacactctggacgttatgcatggtgatctggaactgagcagcgctgttgtgggtccgattccgctggatcgtgaatggggtatcgataaaccgtggattggtgctggcttcggtctggaacgtctgctgaaagttaagcacgactttaagaacatcaaacgtgctgcgcgttccgagtcctattacaacggcattagcactaacctgtaagtcgaccaaacaatccaaaacgccgcgttcagcggcgttttttctgcttttgcggccgctgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggtaataattgacgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgatcaaaaggcattttgctattaagggattgacgagggcgtatctgcgcagtaagatgcgccccgcattggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttagattcccggggtttccgccaaattcgaaaagcctgctcaacgagcaggcttttttgcatg(seqidno.:18)以限制性内切酶avrii和noti将序列20从克隆载体puc57-pylrs(r19h,h29r,t122s,y384f)上切下,同时以avrii和noti将质粒pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs]-prok[pylt]切开(目的dna片段为其中4.5kb的大片段),以核酸电泳进行分离,以琼脂糖凝胶dna回收试剂盒提取,使用t4dnaligase连接,以化学法(cacl2法)转化大e.colitop10感受态细胞中,将所述转化的细胞培养在含有卡那素的lb琼脂培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl,1.5%琼脂)上37℃培养过夜。挑取单个活菌落,在含有氯霉素的液体lb培养基(10g/l酵母蛋白胨,5g/l酵母浸粉,10g/lnacl)中37℃220rpm培养过夜。以质粒小量提取试剂盒提取质粒,得到的含有突变型赖氨酰-trna合成酶pylrs的质粒命名为pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(r19h,h29r,t122s,y384f)]-prok[pylt],质粒图谱见图3。根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),引入突变r19h,得到氨基酸序列如seqidno.:7所示的突变型赖氨酰-trna合成酶pylrs(r19h)。并根据大肠杆菌的密码子偏好性,合成了pylrs(r19h)的dna序列。根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),引入突变h29r,得到氨基酸序列如seqidno.:8所示的突变型赖氨酰-trna合成酶pylrs(h29r)。并根据大肠杆菌的密码子偏好性,合成了pylrs(h29r)的dna序列。根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),引入突变r19h,h29r,得到氨基酸序列如seqidno.:6所示的突变型赖氨酰-trna合成酶pylrs(r19h,h29r)。并根据大肠杆菌的密码子偏好性,合成了pylrs(r19h,h29r)的dna序列。根据野生型赖氨酰-trna合成酶pylrs的氨基酸序列(seqidno.:1),引入突变r19h,i26v,h29r,得到氨基酸序列如seqidno.:3所示的突变型赖氨酰-trna合成酶pylrs(r19h,i26v,h29r)。并根据大肠杆菌的密码子偏好性,合成了pylrs(r19h,i26v,h29r)的dna序列。按照上述突变型菌株的构建方法,将pylrs(r19h,h29r,t122s,y384f)的dna序列分别替换为pylrs(r19h)的dna序列、pylrs(h29r)的dna序列、pylrs(r19h,h29r)的dna序列和pylrs(r19h,i26v,h29r)的dna序列,分别构建得到质粒pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(r19h)]-prok[pylt]、质粒pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(h29r)]-prok[pylt]、质粒pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(r19h,h29r)]-prok[pylt]和质粒pbad-arabad[a1-u4-u5-tev-r-miniins]-glns[pylrs(r19h,i26v,h29r]-prok[pylt]。实施例3、叔丁氧羰基(boc)修饰融合蛋白的高密度表达将实施例1和实施例2构建的各菌种接种于液体lb培养基中37℃220rpm培养过夜,以1%(v/v)接种罐发酵培养基(12g/l酵母蛋白胨,24g/l酵母浸粉,4ml/l甘油,12.8g/l磷酸氢二钠,3g/l磷酸二氢钾,0.3‰消泡剂),在35(±3)℃,200~1000rpm,空气流量2~6l/min的条件下培养。培养3~10h后,以步进速率流加含甘油和酵母蛋白胨的补料培养基,持续至发酵结束。培养至od600达到25~80时,加入终浓度0.25%l-ara和终浓度5mmboc-lys进行诱导。继续培养至od600达到180~220时,放罐。然后离心(5000rpm,30min,25℃)收集。以sds-聚丙烯酰胺电泳对各菌种全细胞中含有boc修饰赖氨酸的融合蛋白表达情况进行检测。不同突变酶的融合蛋白表达量如下表:融合蛋白是以不可溶的“包涵体”形式表达。为释放包涵体,用高压均质机将大肠杆菌细胞破碎。通过10000g离心法去除核酸、细胞碎片和可溶性蛋白。用纯水洗涤含有融合蛋白的包涵体,所得的包涵体沉淀用作折叠的原材料。为了使融合蛋白重折叠,将包涵体溶解于ph10.5并含有2~10mm巯基乙醇的7.5m脲溶液中,使溶解后总蛋白的浓度为10~25mg/ml。将样品稀释5~10倍,在4~8℃,ph为10.5~11.7的条件下进行常规折叠16~30小时。于18~25℃下,ph值维持在8.0~9.5,用胰蛋白酶和羧肽酶b将融合蛋白酶解10~20小时,然后加入0.45m硫酸铵终止酶解反应。反相hplc分析结果表明,该酶解步骤的收率高于90%。胰蛋白酶与羧肽酶b酶解后获得的胰岛素类似物被命名为boc-赖氨酸胰岛素。boc-赖氨酸胰岛素在上述条件下不能被酶解。通过膜过滤澄清样品,以0.45mm硫酸铵作为缓冲液,经疏水层析初纯化,sds-聚丙烯酰胺凝胶电泳纯度达90%。并且对获得的boc-人胰岛素进行maldi-tof质谱分析,结果检测出其分子量与理论分子量5907.7da相符合。经疏水层析洗脱收集样品,加入盐酸进行boc-人胰岛素脱保护反应,加入氢氧化钠溶液控制ph为2.8~3.2以终止反应,再经两步高压反相层析,重组人胰岛素的得率高于85%。不同突变酶的重组人胰岛素表达量如下表:酶boc人胰岛素的产量(mg/l发酵液)pylrs310r19h370h29r340r19h,h29r390r19h,i26v,h29r490r19h,h29r,t122s,y384f600结果表明,利用本发明的突变酶制备含有boc-赖氨酸的目的蛋白,可显著提高非天然氨基酸插入量和含有非天然氨基酸的目的蛋白量。在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。序列表<110>苏州鲲鹏生物技术有限公司<120>利用质粒系统在蛋白中引入非天然氨基酸<130>p2019-0358<160>18<170>siposequencelisting1.0<210>1<211>454<212>prt<213>马氏甲烷八叠球菌(methanosarcinamazei)<400>1metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserargthrglythrilehislysilelyshishisgluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>2<211>454<212>prt<213>巴氏甲烷八叠球菌(methanosarcinabarkeri)<400>2metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserargthrglythrilehislysilelyshishisgluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglysertyrtyrasn435440445glyileserthrasnleu450<210>3<211>454<212>prt<213>人工序列(artificialsequence)<400>3metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserhisthrglythrilehislysvallyshisarggluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>4<211>454<212>prt<213>人工序列(artificialsequence)<400>4metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserhisthrglythrilehislysilelyshisarggluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnserglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvalphe370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>5<211>454<212>prt<213>人工序列(artificialsequence)<400>5metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserhisthrglythrilehislysilelyshisarggluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyralaarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnpheserglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>6<211>454<212>prt<213>人工序列(artificialsequence)<400>6metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserhisthrglythrilehislysilelyshisarggluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>7<211>454<212>prt<213>人工序列(artificialsequence)<400>7metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserhisthrglythrilehislysilelyshishisgluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>8<211>454<212>prt<213>人工序列(artificialsequence)<400>8metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserargthrglythrilehislysilelyshisarggluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>9<211>454<212>prt<213>人工序列(artificialsequence)<400>9metasplyslysproleuasnthrleuileseralathrglyleutrp151015metserlysthrglythrilehislysilelyshislysgluvalser202530argserlysiletyrileglumetalacysglyasphisleuvalval354045asnasnserargserserargthralaargalaleuarghishislys505560tyrarglysthrcyslysargcysargvalseraspgluaspleuasn65707580lyspheleuthrlysalaasngluaspglnthrservallysvallys859095valvalseralaprothrargthrlyslysalametprolysserval100105110alaargalaprolysproleugluasnthrglualaalaglnalagln115120125proserglyserlyspheserproalaileprovalserthrglnglu130135140servalservalproalaservalserthrserileserserileser145150155160thrglyalathralaseralaleuvallysglyasnthrasnproile165170175thrsermetseralaprovalglnalaseralaproalaleuthrlys180185190serglnthraspargleugluvalleuleuasnprolysaspgluile195200205serleuasnserglylysprophearggluleuglusergluleuleu210215220serargarglyslysaspleuglnglniletyralaglugluargglu225230235240asntyrleuglylysleugluarggluilethrargphephevalasp245250255argglypheleugluilelysserproileleuileproleuglutyr260265270ilegluargmetglyileaspasnaspthrgluleuserlysglnile275280285pheargvalasplysasnphecysleuargprometleualaproasn290295300leutyrasntyrleuarglysleuaspargalaleuproaspproile305310315320lysilephegluileglyprocystyrarglysgluseraspglylys325330335gluhisleuglugluphethrmetleuasnphecysglnmetglyser340345350glycysthrarggluasnleugluserileilethrasppheleuasn355360365hisleuglyileaspphelysilevalglyaspsercysmetvaltyr370375380glyaspthrleuaspvalmethisglyaspleugluleuserserala385390395400valvalglyproileproleuaspargglutrpglyileasplyspro405410415trpileglyalaglypheglyleugluargleuleulysvallyshis420425430aspphelysasnilelysargalaalaargserglusertyrtyrasn435440445glyileserthrasnleu450<210>10<211>72<212>dna<213>人工序列(artificialsequence)<400>10ggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttagattcccg60gggtttccgcca72<210>11<211>96<212>prt<213>人工序列(artificialsequence)<400>11metvalserlysglyglugluleuphethrglyvaltyrvalglnglu151015argthrileserphelysaspthrtyrlysthrargalagluvallys202530phegluglyaspgluasnleutyrpheglnglyargphevalasngln354045hisleucysglyserhisleuvalglualaleutyrleuvalcysgly505560gluargglyphephetyrthrprolysthrargglyilevalglugln65707580cyscysthrserilecysserleutyrglnleugluasntyrcysasn859095<210>12<211>291<212>dna<213>人工序列(artificialsequence)<400>12atggttagcaaaggtgaagaactgtttaccggcgtttatgtgcaggaacgtaccattagc60ttcaaagatacctataaaacccgtgcggaagttaaatttgaaggcgatgaaaacctgtat120tttcagggacgtttcgttaaccaacacctgtgcggcagccacctggtagaggcactgtat180ctggtttgtggtgaacgtggcttcttctatactccgtagactcgtggtatcgtggaacag240tgttgcacttctatttgctctctgtatcagctggaaaattactgtaattaa291<210>13<211>72<212>dna<213>人工序列(artificialsequence)<400>13ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgtt60gtttacgctttg72<210>14<211>45<212>dna<213>人工序列(artificialsequence)<400>14caaacaatccaaaacgccgcgttcagcggcgttttttctgctttt45<210>15<211>151<212>dna<213>人工序列(artificialsequence)<400>15tgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggtaataattg60acgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgatcaaaagg120cattttgctattaagggattgacgagggcgt151<210>16<211>40<212>dna<213>人工序列(artificialsequence)<400>16aattcgaaaagcctgctcaacgagcaggcttttttgcatg40<210>17<211>1798<212>dna<213>人工序列(artificialsequence)<400>17ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgtt60gtttacgctttgaggaatcccatatggataagaaaccgctgaatactctgatttctgcaa120ctggtctgtggatgagccgtaccggcaccatccacaagatcaaacaccacgaggtttccc180gtagcaaaatctacatcgaaatggcgtgcggtgaccacctggtggtaaacaactcccgtt240cttctcgtactgcacgtgctctgcgccaccacaagtaccgtaagacctgcaagcgctgtc300gcgtgtctgatgaagacctgaacaaattcctgactaaagcgaacgaagatcagacttctg360tgaaggtgaaagttgtttctgccccaacccgcaccaagaaagcgatgccgaagtccgttg420cacgcgctccgaaaccgctggagaacaccgaagccgcacaggcccagccgtctggttcta480agttttctccggcaatcccggtttctactcaggagtctgtgtctgtgccagcttctgtta540gcacttctatttcctctatcagcactggtgcgactgcgtccgctctggtaaaaggtaaca600ctaacccgatcaccagcatgtctgctccggttcaggcttctgcaccggcactgactaaaa660gccagactgaccgtctggaggttctgctgaacccgaaagatgaaatcagcctgaactctg720gcaaaccgttccgtgaactggaatccgaactgctgtctcgtcgtaagaaagacctgcaac780aaatctatgctgaagagcgtgaaaactacctgggtaaactggaacgtgaaatcacccgtt840tctttgtggaccgtggtttcctggaaatcaagtctccgatcctgatcccgctggaataca900tcgagcgcatgggtattgataacgacaccgaactgtccaagcagattttccgtgtggaca960agaacttctgcctgcgtccgatgctggcaccgaacctgtacaattacctgcgtaaactgg1020atcgtgcactgccggacccgatcaaaatctttgaaatcggtccatgctatcgtaaggaga1080gcgacggtaaagaacacctggaagagttcactatgctgaacttttgtcagatgggttctg1140gctgcacccgtgaaaatctggaatctatcatcaccgacttcctgaaccacctgggcattg1200acttcaaaatcgttggtgattcctgcatggtttacggtgacactctggacgttatgcatg1260gtgatctggaactgagcagcgctgttgtgggtccgattccgctggatcgtgaatggggta1320tcgataaaccgtggattggtgctggcttcggtctggaacgtctgctgaaagttaagcacg1380actttaagaacatcaaacgtgctgcgcgttccgagtcctattacaacggcattagcacta1440acctgtaagtcgaccaaacaatccaaaacgccgcgttcagcggcgttttttctgcttttg1500cggccgctgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggta1560ataattgacgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgat1620caaaaggcattttgctattaagggattgacgagggcgtatctgcgcagtaagatgcgccc1680cgcattggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttaga1740ttcccggggtttccgccaaattcgaaaagcctgctcaacgagcaggcttttttgcatg1798<210>18<211>1798<212>dna<213>人工序列(artificialsequence)<400>18ttttaaaaaactaacagttgtcagcctgtcccgctttaatatcatacgccgttatacgtt60gtttacgctttgaggaatcccatatggataagaaaccgctgaatactctgatttctgcaa120ctggtctgtggatgagccataccggcaccatccacaagatcaaacaccgcgaggtttccc180gaagcaaaatctacatcgaaatggcgtgcggtgaccacctggtggtaaacaactcccgtt240cttctcgtactgcacgtgctctgcgccaccacaagtaccgtaagacctgcaagcgctgtc300gcgtgtctgatgaagacctgaacaaattcctgactaaagcgaacgaagatcagacttctg360tgaaggtgaaagttgtttctgccccaacccgcaccaagaaagcgatgccgaagtccgttg420cacgcgctccgaaaccgctggagaactccgaagccgcacaggcccagccgtctggttcta480agttttctccggcaatcccggtttctactcaggagtctgtgtctgtgccagcttctgtta540gcacttctatttcctctatcagcactggtgcgactgcgtccgctctggtaaaaggtaaca600ctaacccgatcaccagcatgtctgctccggttcaggcttctgcaccggcactgactaaaa660gccagactgaccgtctggaggttctgctgaacccgaaagatgaaatcagcctgaactctg720gcaaaccgttccgtgaactggaatccgaactgctgtctcgtcgtaagaaagacctgcaac780aaatctatgctgaagagcgtgaaaactacctgggtaaactggaacgtgaaatcacccgtt840tctttgtggaccgtggtttcctggaaatcaagtctccgatcctgatcccgctggaataca900tcgagcgcatgggtattgataacgacaccgaactgtccaagcagattttccgtgtggaca960agaacttctgcctgcgtccgatgctggcaccgaacctgtacaattacctgcgtaaactgg1020atcgtgcactgccggacccgatcaaaatctttgaaatcggtccatgctatcgtaaggaga1080gcgacggtaaagaacacctggaagagttcactatgctgaacttttgtcagatgggttctg1140gctgcacccgtgaaaatctggaatctatcatcaccgacttcctgaaccacctgggcattg1200acttcaaaatcgttggtgattcctgcatggttttcggtgacactctggacgttatgcatg1260gtgatctggaactgagcagcgctgttgtgggtccgattccgctggatcgtgaatggggta1320tcgataaaccgtggattggtgctggcttcggtctggaacgtctgctgaaagttaagcacg1380actttaagaacatcaaacgtgctgcgcgttccgagtcctattacaacggcattagcacta1440acctgtaagtcgaccaaacaatccaaaacgccgcgttcagcggcgttttttctgcttttg1500cggccgctgtgcttctcaaatgcctgaggccagtttgctcaggctctccccgtggaggta1560ataattgacgatatgatcagtgcacggctaactaagcggcctgctgactttctcgccgat1620caaaaggcattttgctattaagggattgacgagggcgtatctgcgcagtaagatgcgccc1680cgcattggaaacctgatcatgtagatcgaatggactctaaatccgttcagccgggttaga1740ttcccggggtttccgccaaattcgaaaagcctgctcaacgagcaggcttttttgcatg1798当前第1页12