改造宿主细胞基因组的方法及其用途与流程

文档序号:19419069发布日期:2019-12-14 01:14阅读:510来源:国知局
改造宿主细胞基因组的方法及其用途与流程
本发明属于分子生物学、细胞生物学和生物工程学领域。具体而言,本发明涉及一种改造宿主细胞基因组的方法,本发明还涉及使用经该方法改造的宿主细胞,以及所述经改造的宿主细胞的用途。
背景技术
:自1982年美国fda批准genetech的重组胰岛素上市以来,重组蛋白已经成功用于科学研究、多种疾病的诊断、治疗及预防等。目前,重组蛋白主要使用外源蛋白表达系统来进行生产和表达。用哺乳动物细胞生产重组蛋白已经成为生物技术药物的主流技术。目前已上市、正在进行临床实验及临床前研究的蛋白药物,大部分都由哺乳动物细胞进行表达,而其中,中国仓鼠卵巢(chinesehamsterovary,cho)细胞是在重组蛋白生产中最广泛使用的宿主细胞。cho细胞具有多个品系。目前用于工业生产的cho细胞主要系包括cho-k1、cho-dg44、cho-dxb11(又称cho-dukx)、cho-s及chozn(choznzfn-modifiedchocelllines)等,还有在开发中的cho-mk。尽管cho细胞被工业界广泛用来生产医用抗体,但是现有技术条件下的cho细胞存在各种不足。首先,cho细胞的组织来源属性是成纤维细胞,与免疫系统中专业表达抗体的浆细胞,在抗体的表达能力和修饰上还有不少差距。以细胞单产的指标pg/cell/day(pcd)为例,cho细胞株历经冗长繁复的基因扩增和筛选后,如能达到20~40pcd左右就被用于工业化生产了,而抗体的商业化大规模生产则主要通过下游的高密度细胞培养和发酵工艺的优化来实现。对比cho细胞,浆细胞往往能轻松地达到100~200pcd的表达水平,而且对于超大分子五聚体igm的组装和分泌,也毫无困难。对表达需要进行复杂的糖基化修饰和多条链组装的大分子,cho细胞则显示出瓶颈,无论是在表达载体构建,还是在药物增压筛选方面,pcd在20~40之后的增加都似乎触及了天花板。其次,野生型cho细胞所分泌的糖蛋白(包括抗体)都带有岩藻糖(fucose)糖基。抗体fc部分所携带的糖链上的岩藻糖会阻碍抗体和fc受体之间的结合。虽然当前有多种方法去除岩藻糖(fucose)糖基,例如用化学或酶法处理、小分子类似物作抑制剂、rna干扰、过表达β-1,4-n-acetyl-glucosaminyltransferaseiii(β-1,4-n-乙酰葡糖胺转移酶iii)和高尔基体α-mannosidaseii(α-甘露糖苷酶ii)两种酶以改变岩藻糖合成路径,或者利用某些岩藻糖低表达的自然突变cho株(例如蛋白质岩藻糖化缺陷的lec13cho细胞)。但是,这些方法都很难做到完全去除抗体的岩藻糖,因而抗体药物无法达到制剂均一性方面的严格要求。通过把cho细胞中负责岩藻糖合成的特定基因敲除,可以在基因水平确保cho细胞表达的抗体100%完全不再带有岩藻糖。具体来说,敲除负责岩藻糖终末加成的岩藻糖转移酶8(fucosyltransferase8,fut8)基因是使得抗体不再带有岩藻糖的有效途径。传统的基因敲除的方法是构建基因打靶载体,利用同源重组,以外源基因替代目的基因。但这种方法的效率很低:在小鼠的es细胞中,同源重组的效率在百万分之一。而cho是双倍体体细胞,其同源重组的效率比小鼠es细胞还要低100倍。虽然一家日本实验室使用此法,耗时1年半,从约12000个cho-dg44细胞克隆中艰辛筛选到一个fut8-/-的cho细胞株(yamane-ohnukin,等,biotechnolbioeng2004;87:614–622),但他们的方法对普通实验室不具有简易的可重复性和推广的实用性。利用锌指核酸酶(zincfingernuclease,zfn)、类转录激活因子效应物核酸酶(talen),以及原核生物后天免疫系统(簇间规则间隔短回文重复序列,clusteredregularlyinterspacedshortpalindromicrepeats,crispr)进行的染色体dna切割大大增强了人们对基因组定点部位的任意操作的能力。用zfn将cho细胞中的fut8基因敲除,已见报道(malphettesl等,biotechnolbioeng.2010;106:774-83)。但zfn存在严重的脱靶效应(wangx等,natbiotechnol.2015;33:175-8),很难确定zfn还会对cho细胞基因组中的其它功能基因有什么影响。同样,尽管用crispr技术可以比较高效地敲除cho细胞中的fut8基因(sunt等,engineeringinlifesciences,2015;15:660–6;rondac.etal.,biotechnol.bioeng.2014;111:1604–16),但是脱靶几率依然很高。rondac等人的工作表明,对于一个标准的gn19ngg靶标序列,cho-k1的基因组中平均有6个完全相同的序列、377个有一个核苷酸误配的序列、4558个有两个核苷酸误配的序列。全基因组测序表明,用crispr技术定点改造基因而制成的转基因小鼠与野生型对照小鼠相比,出现1397个单核苷酸突变和117处dna序列的插入或缺失(schaefer,k.a.etal.nat.methods2017;14,547-8)。因而,用zfn和crispr方法制成的fut8-/-cho细胞,具有太多的遗传和表观不确定性,难以做为医用蛋白生产的稳定的通用性工业化细胞株。与zfn和crispr相比,talen的特异性则要高得多。这是因为,talen的左右两个臂膀不仅对各自在dna正义和反义链上的结合序列有精确要求,而且它们之间必须严格间隔14~20碱基对。这大大降低了在cho基因组中的脱靶效应。目前,用talen制备fut8-/-cho细胞株的报道仅来自于sangamobiosciences的gregorycost实验室。然而,其采用的方法是在cho细胞的fut8基因中插入抗体表达的组件(cristeas等,biotechnolbioeng.2013;110:871-80),籍此既表达抗体基因,又敲除fut8基因。但是,由于fut8基因的表达和调控不能与抗体的表达相比,如此获得的fut8-/-cho细胞在产量上难以作为大规模生产医用蛋白的通用性工业化细胞株。再次,cho细胞在高密度生长的后期,营养消耗而体系中的铵离子增加,这对细胞的存活带来很大压力。谷氨酰胺合成酶(glutaminesynthetase,gs)是一种控制氮代谢的酶。谷氨酰胺这种氨基酸,不仅被细胞用来合成蛋白质,也是用来运输氮的。铵离子对细胞有毒性,当细胞需要排除多余的铵离子的时候,就用铵离子和谷氨酸来合成谷氨酰胺。谷氨酰胺合成酶(gs)催化的就是该反应。对于工业化生产抗体用的cho细胞株而言,敲除其内源性的gs基因之后,细胞在谷氨酰胺缺失的培养基中无法生长。而外源质粒上带有的gs基因,不仅可以增加在谷氨酰胺缺失的培养基中筛选稳定细胞株时候的严谨性,而且更增强了将废物铵离子转化成谷氨酰胺氨基酸的反应,对大规模细胞培养非常有利。gs敲除的cho细胞株已经通过zfn方法得到(fanl.etal.biotechnolbioeng.2012apr;109(4):1007-15)。但这一方法的缺点亦如用zfn敲除fut8基因所分析的一样。综上所述,如果能在cho细胞中实现上述对cho细胞的生长、蛋白(包括抗体)生产和活性有利的多基因的受控表达,cho细胞工程株的改建和优化是可期的。cho细胞株的工程改造(celllineengineering)可以为生物学基础研究和药物开发提供不可或缺的工具。建立能同时稳定高表达若干基因产物的特殊细胞系,对于研究多亚基的膜受体功能和酶活性、信号传导、代谢途径、蛋白修饰、病毒组装等等由多个基因参与的过程,是非常重要的。而且这些基因产物往往要求按特定的比例表达。虽然crispr等新出现的基因编辑(genomeediting)技术有助于快速的基因失活和替换,但要实现多基因的按比例稳定高表达,长久以来一直是业界的瓶颈,因技术难度大而进展甚微。遇到的主要技术问题是:1)常规方法是外源基因在染色体上的随机插入。基因a高表达的细胞株,不一定高表达基因b。多转几个基因后,会造成细胞株的异质性,筛选难度大。而且由于基因沉默效应(genesilencing),插在不同染色体部位的基因,会按不同的速度慢慢关闭表达,更增加了细胞株的不可控性和实验的不确定性。2)如果每个基因都用一个带有特定抗药性基因的载体,那么转3~4个基因后,会把现有的抗药性基因差不多用完。如果在此改造的cho细胞株上,还要表达抗体基因,则又要用到至少一个抗药性基因。综上所述,当前对能够高效全面地改造cho细胞株的方法存在需求。技术实现要素:基于现有技术的不足,本发明的目的是提供一种改造宿主细胞基因组的方法,本发明提供的方法不仅能够在宿主细胞基因组中定点整合多个外源基因使其稳定高效地共表达,而且能够有效地敲除fut8基因和/或gs基因和/或α2,3-唾液酸转移酶基因4和/或α2,3-唾液酸转移酶基因6,从而构建能满足工业大规模抗体生产的高效的宿主细胞。本发明还提供了根据所述方法制备的宿主细胞及其用途。一方面,本发明提供了一种在宿主细胞的指定位点整合多种外源基因的方法,所述方法为基于cre-loxp系统的“toggle-in”法,包括以下步骤:1)制备“锚定”的宿主细胞,所述“锚定”的宿主细胞包含位点特异性重组酶识别序列loxpwt、loxp1、pgk启动子驱动的正筛选序列;优选地,所述正筛选序列为puro-t2a-d1egfp;该序列使得“锚定”的宿主细胞在荧光显微镜下呈现微弱的绿色荧光标记,且为puromycin抗性。优选地,所述“锚定”的宿主细胞通过打靶载体获得,所述打靶载体含有指定位点的同源左右臂、位点特异性重组酶识别序列loxpwt、loxp1和正负筛选序列;更优选地,所述打靶载体依次含有gapdh同源左臂、zeocin-t2a-tk的正负筛选序列、puro-t2a-d1egfp的正筛选序列,cre-loxp系统中的位点特异性重组酶识别序列loxpwt和loxp1、gapdh同源右臂和白喉霉素(diphtheriatoxin)a链(dta)的负筛选序列;2)制备含有外源基因的定点整合载体系列(ptoggle),其中包括:第一定点整合载体,其使用第一载体制备,包含第一外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列loxpwt、loxp4和loxp2;第二定点整合载体,其使用第二载体制备,包含第二外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列loxpwt、loxp1和loxp5;任选地,第三定点整合载体,其使用第一载体制备,包含第三外源基因,第一抗生素抗性基因、位点特异性重组酶识别序列loxpwt、loxp4和loxp2;任选地,第四定点整合载体,其使用第二载体制备,包含第四外源基因,第二抗生素抗性基因、位点特异性重组酶识别序列loxpwt、loxp1和loxp5;任选地,根据拟整合的基因制备相应的载体;3)使用第一定点整合载体转染宿主细胞,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆;4)使用第二定点整合载体转染步骤3)得到的克隆,并用第二抗生素筛选出筛选出第二抗生素抗性、第一抗生素敏感的克隆;5)任选地,使用第三定点整合载体转染步骤4)得到的克隆,并用第一抗生素筛选出第一抗生素抗性、第二抗生素敏感的克隆;6)任选地,使用第四定点整合载体转染步骤5)得到的克隆,并用第二抗生素筛选出筛选出第二抗生素抗性、第一抗生素敏感的克隆;7)任选地,根据拟整合的基因制备相应的载体依次整合,得到在指定位点整合多种基因的宿主细胞。优选地,所述第一抗生素抗性基因和第二抗生素抗性基因分别选自以下的两个:潮霉素b基因、嘌呤霉素抗性基因、遗传霉素基因、杀稻瘟菌素基因、腐草霉素基因。优选地,所述第一抗生素抗性基因和/或第二抗生素基因还通过自动切割肽段连接示踪蛋白的基因序列;优选地,所述示踪蛋白选自d1egfp或dsred-e2;优选地,所述第一定点整合载体按排列顺序依次是:重组酶识别序列loxpwt、不带启动子的抗性基因hygb序列(优选地,其核苷酸序列如seqidno:13所示)或hygb-t2a-dsred-e2序列、重组酶识别序列loxp4、人延长因子1a(ef1a)启动子(优选地,其核苷酸序列如seqidno:14所示)、第一外源基因和重组酶识别序列loxp2;优选地,所述第二定点整合载体按排列顺序依次是:重组酶识别序列loxpwt、不带启动子的抗性基因puro序列或puro-t2a-d1egfp序列(优选地,其核苷酸序列如seqidno:15所示)、重组酶识别序列loxp1、人延长因子1a(ef1a)启动子、第二外源基因和重组酶识别序列loxp5;优选地,所述第三定点整合载体按排列顺序依次是:重组酶识别序列loxpwt、不带启动子的抗性基因hygb序列或hygb-t2a-dsred-e2序列、重组酶识别序列loxp4、人延长因子1a(ef1a)启动子、第三外源基因和重组酶识别序列loxp2;优选地,所述第四定点整合载体按排列顺序依次是:重组酶识别序列loxpwt、不带启动子的抗性基因puro序列或puro-t2a-d1egfp序列、重组酶识别序列loxp1、人延长因子1a(ef1a)启动子、第四外源基因和重组酶识别序列loxp5;优选地,所述第一抗生素抗性基因和第二抗生素抗性基因分别选自以下的两个:潮霉素b基因、嘌呤霉素抗性基因、遗传霉素基因、杀稻瘟菌素基因、腐草霉素基因。优选地,所述第一载体和第二载体分别选自质粒载体pbr322、puc57、pbluescript、pci-neo、pcdna3.1;在优选的实施方案中,本发明所用的第一载体和第二载体分别为ptog3和ptog4;所述载体ptog3核苷酸序列如seqidno:11所示;所述载体ptog4核苷酸序列如seqidno:12所示;优选地,将两种或更多种基因的序列用自动切割肽段连接作为任选的外源基因;将另外的两种或更多种基因的序列用自动切割肽段连接作为另一任选的外源基因;更优选地,所述自动切割肽段选自p2a、t2a或e2a;更优选地,所述自动切割肽段为p2a,更优选地,其序列如seqidno:16所示:seqidno:16:gsgatnfsllkqagdveenpgp。优选地,所述宿主细胞为哺乳动物宿主细胞;优选地为中国仓鼠卵巢细胞;更优选地,所述宿主细胞选自以下的细胞株:cho-k1细胞株、cho-s细胞株、dg44细胞株、cho-dxb11细胞株、chozn细胞株、cho-mk细胞株、chl-yn细胞株。优选地,所述指定位点为宿主细胞基因组的高表达热点区域;优选地,所述指定位点选自以下基因的区域:rosa26基因、β-actin、β2-microglobulin、cdk2、ubiquitin、dhfr和gapdh基因;更优选地,所述指定位点选自gapdh基因的区域;进一步优选地,所述指定位点为gapdh基因在cho-k1基因组中从3574544到3575484位的区域;优选地,所述位点区域的序列如seqidno:8所示。另一方面,本发明提供了一种改造宿主细胞基因组的方法,所述方法包括:a.在宿主细胞基因组的指定位点整合外源基因信号识别颗粒-9(signalrecognitionparticle-9,srp-9)、信号识别颗粒-14(signalrecognitionparticle-14,srp-14)、信号识别颗粒-54(signalrecognitionparticle-9,srp-54)、内质网氧化还原酶(endoplasmicreticulumoxidoreductase,ero1-l)、成纤维细胞生长因子9(fibroblastgrowthfactor9,fgf-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和/或α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st1)中的一个或多个;和/或b.在宿主细胞基因组中,使用类转录激活因子效应物核酸酶(talen)敲除岩藻糖转移酶8(fucosyltransferase8,fut8)基因和/或谷氨酰胺合成酶(glutaminesynthetase,gs)基因和/或α2,3-唾液酸转移酶基因4(α2,3-sialyltransferase4,st4)和/或α2,3-唾液酸转移酶基因6(α2,3-sialyltransferase6,st6);优选地,所述宿主细胞为哺乳动物宿主细胞;更优选地为中国仓鼠卵巢(cho)细胞;进一步优选地为cho-k1、cho-s、chozn、dg44、cho-dxb11、cho-mk或chl-yn细胞株;优选地,所述指定位点为宿主细胞基因组的高表达热点区域,更优选地,所述指定位点选自以下基因的区域:rosa26,β-actin,β2-microglobulin,cdk2,ubiquitin,dhfr和gapdh等恒定型高表达热点区域。进一步优选地,所述定点为甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-phosphatedehydrogenase,gapdh)基因所在的区域。具体地是gapdh基因在cho-k1基因组中从3574544到3575484位的区域,在一个具体的实施方案中,所述位点序列的序列如seqidno:8所示。优选地,在步骤a中,通过“toggle-in”将编码外源基因的异源多核苷酸序列依次插入到宿主细胞的指定位点;更优选地,将人源整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54三个基因用自动切割肽段连接作为任选的外源基因,优选地如seqidno:17所示;将内质网氧化还原酶、成纤维细胞生长因子9用自动切割肽段连接,为任选的外源基因;将人源β1,4-半乳糖基转移酶1和/或α2,6-唾液酸转移酶1基因用自动切割肽段连接,为任选的外源基因。优选地,在所述步骤b中,采用talen方法进行敲除。优选地,敲除fut8基因所构建的talen左右臂蛋白基因序列如seqidno:18和seqidno:19所示;所靶向的区域是cho细胞fut8基因的10号外显子,但也可以是任何影响其功能的外显子;更优选地,所使用的引物如seqidno:20和seqidno:21所示。优选地,敲除gs基因所构建的talen左右臂蛋白基因序列如seqidno:22和23所示。所靶向的区域是cho细胞gs基因的7号外显子,但也可以是任何影响其功能的外显子;更优选地,所使用的引物如seqidno:24和seqidno:25所示。优选地,敲除st3gal4基因所构建的talen左右臂蛋白基因序列如seqidno:26和27所示;所靶向的区域是cho细胞st3gal4基因的5号外显子,但也可以是任何影响其功能的外显子。更优选地,所使用的引物如seqidno:28和seqidno:29所示。优选地,敲除st3gal6基因所构建的talen左右臂蛋白基因序列如seqidno:30和31所示;所靶向的区域是cho细胞st3gal6基因的2号外显子,但也可以是任何影响其功能的外显子;更优选地,所使用的引物如seqidno:32和seqidno:33所示。另一方面,本发明提供了根据本发明的方法改造的宿主细胞;优选地,所述改造的宿主细胞携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(endoplasmicreticulumoxidoreductase,ero1-l)、成纤维细胞生长因子9(fibroblastgrowthfactor9,fgf-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和/或α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6)中的一个或多个;优选地,所述改造的宿主细胞至少携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9;优选地,所述改造的宿主细胞携带外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54、内质网氧化还原酶、成纤维细胞生长因子9、β1,4-半乳糖基转移酶1和α2,6-唾液酸转移酶1;优选地,所述改造的宿主细胞不表达岩藻糖转移酶8基因和/或谷氨酰胺合成酶基因和/或α2,3-唾液酸转移酶4和/或α2,3-唾液酸转移酶6中的一个或多个;优选地,所述改造的宿主细胞不表达岩藻糖转移酶8(fucosyltransferase8,fut8)基因和/或谷氨酰胺合成酶(glutaminesynthetase,gs)基因;优选地,所述改造的宿主细胞不表达岩藻糖转移酶8基因、谷氨酰胺合成酶基因、α2,3-唾液酸转移酶4和α2,3-唾液酸转移酶6;更优选地,本发明提供了如下所述的cho细胞株。cho-e细胞株:在野生型cho-k1基础上携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)和成纤维细胞生长因子9(fgf-9),具有更佳的蛋白翻译能力和抵御细胞凋亡的能力。cho-ef细胞株:敲除fut8基因,并且携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)和成纤维细胞生长因子9(fgf-9),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子完全不带有岩藻糖。cho-eg细胞株:携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子的糖链末端更多地带β1,4-位的半乳糖基。cho-efg细胞株:敲除fut8基因,并且携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt),具更佳的蛋白翻译能力和抵御细胞凋亡的能力,且表达的蛋白分子完全不带有岩藻糖,糖链末端更多地带β1,4-位的半乳糖基。cho-es(3,6)细胞株:携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6)。该细胞株除了具有上述cho-e细胞株的基本特性外,还能使得cho细胞表达的蛋白分子带有α2,6-位链接的唾液酸。由于cho细胞内源的α2,3-唾液酸转移酶(α2,3-sialyltransferase,st3)的存在,细胞表达的蛋白分子同时带有α2,3-位和α2,6-位链接的唾液酸,更接近于人源糖基化形式。cho-efs(3,6)细胞株:敲除fut8基因,并且携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6)。该细胞株除了具有上述cho-es(3,6)细胞株的基本特性外,还能使得cho细胞表达的蛋白分子完全不带有岩藻糖。cho-efs(3,6)gs细胞株:敲除fut8基因和gs基因,并且携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)、β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6)。该细胞株同时表达α-2,3-唾液酸转移酶和α-2,6-唾液酸转移酶、并且岩藻糖转移酶基因8和谷氨酸酰合成酶基因双缺失的高性能cho-k1细胞株。cho-es(6)细胞株:携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6),并且敲除了cho细胞内源性的α2,3-唾液酸转移酶(α2,3-sialyltransferase,st3)。该细胞株除了具有上述cho-e细胞株的基本特性外,还能使得cho细胞表达的蛋白分子只带有α2,6-位链接的唾液酸,不带有α2,3-位链接的唾液酸,能更均一地表达生物活性依赖于α2,6-位唾液酸的生物大分子。cho-efs(6)细胞株:敲除fut8基因,并且携带外源基因srp-9、srp-14、srp-54、内质网氧化还原酶(ero1-l)、成纤维细胞生长因子9(fgf-9)和β1,4-半乳糖基转移酶1(β1,4-galactosyltransferase1,gt)和α2,6-唾液酸转移酶1(α2,6-sialyltransferase1,st6),并且敲除了cho细胞内源性的α2,3-唾液酸转移酶(α2,3-sialyltransferase,st3)。该细胞株除了具有上述cho-es(6)细胞株的基本特性外,还能使得cho细胞表达的蛋白分子完全不带有岩藻糖。本发明的cho细胞株系列具有以下性质:所表达的蛋白,优选地抗体完全不带有岩藻糖;或者能表达人源的糖基化,尤其是对糖蛋白进行半乳糖苷化修饰或cho细胞所不能的α2,6位唾液酸化修饰;尤其是敲除了cho细胞内源的α2,3位唾液酸修饰酶,或者是上述不同基因型的不同组合对医药蛋白的理化性质带来的定向优化。再一方面,本发明提供了所述宿主细胞用于表达目的蛋白的用途;优选地,所述目的蛋白为抗体。与现有技术相比,本发明的细胞株具有以下优点:1)本发明提供的cho细胞株敲除了cho细胞中的fut8基因和/或gs基因和/或α2,3-唾液酸转移酶基因。fut8基因的敲除使得cho细胞株所表达的抗体具有更高的与fcγriiia受体的结合力,大大提高抗体的adcc(antibody-dependentcell-mediatedcytotoxicity,抗体依赖的细胞介导的细胞毒性)效应和体内杀肿瘤活性。gs基因的敲除使得外源基因的表达和克隆的挑选与载体上的gs挂钩,同时也能在大规模生产时对细胞生长有利;2)本发明提供的cho株的细胞基因组中定点整合了能够提高抗体表达的srp-14、srp-54、srp-9、ero-l1、fgf9等基因,以及负责人源糖基化的gt和st6基因,使得构建的cho细胞株不仅能提高产量,而且所产生的抗体带有人类抗体的唾液酸修饰或半乳糖苷修饰。在岩藻糖缺失的基础上(fut8敲除),引入人源唾液酸化,不仅提升adcc活性,而且还能屏蔽分子的免疫原性、增加体内的半衰期。在岩藻糖缺失的基础上,引入人源半乳糖苷化,能同时提升adcc和补体激活的cdc(complementdependentcytotoxicity,补体依赖的细胞毒性)功能。对于某些特殊需要的蛋白,例如活性特别依赖于带α2,6-位唾液酸的静脉丙种球蛋白(ivig)、诱导中和抗体所必需的α2,6-位唾液酸修饰的hiv外壳env蛋白,等等,本发明的cho-es(6)细胞株,可提供不带α2,3-位唾液酸而仅带α2,6-位唾液酸的蛋白表达平台,使得唾液酸修饰更偏向于对生物活性重要的方向。这些糖基合成途径改造过的cho细胞株,尤其是在此基础上gs基因敲除的各种衍生株,对于开发新型抗体和高端仿制抗体,有着重要的意义。附图说明以下,结合附图来详细说明本发明的实施方案,其中:图1显示了cho细胞打靶载体chogapdh-zeo-tkhrv1.5,其中在gapdh同源序列的左右臂之间,包含了tk基因作为负筛选,pgk启动子-嘌呤霉素-t2a-d1egfp表达盒作为正筛选。而且,在紧邻该表达盒的上下游,分别带有loxpwt和loxp1序列。图2显示了cho-k1细胞(atcc,ccl-61)接受打靶载体的电转化,并经药物(嘌呤霉素)筛选以后的facs图谱。其中,绝大多数的抗性克隆是随机插入,表达很弱的d1egfp信号(图2左下)。而只有0.6%非常低比例的才是真正gapdh位点定点整合的事件,表达很强的d1egfp信号(图2右下)。图3显示了ptog3载体与带有loxp序列的染色体dna在cre重组酶介导下发生同源重组,亦即“togglein”反应第一步的情况。图4显示了ptog4载体与带有loxp序列的染色体dna在cre重组酶介导下发生同源重组,亦即“togglein”反应第二步的情况。图5显示了带有dsred-e2的ptog3载体,转化锚定cho细胞,并经过潮霉素筛选后的显微镜照片。普通光镜视野下的细胞克隆,与荧光显微镜视野下发出红色荧光的细胞克隆高度重合(图5a),说明此染色体基因组定点整合技术的高效率。rt-pcr显示,随机挑选的整合了srp-14-9-54、hero-l、hfgf9等基因的cho-e细胞株的不同克隆均表达同等水平的上述基因,说明各个细胞克隆之间的基因同质性(isogenicity)(图5b)。图6显示了cho-k1细胞(atcc,ccl-61)接受talen载体转化,敲除fut8基因之后,用fitc标记的植物凝集素lca对获得的克隆进行facs分析的结果。野生型cho细胞表面因带有岩藻糖而显强阳性,而fut8-/-的克隆则都为阴性。图7显示了对fut8-/-的cho细胞克隆的dna序列分析。用pcr将talen针对的10号外显子区域基因组dna扩增(715bp),限制性内切酶msci作用后走琼脂糖电泳。与野生型等位基因酶切片段(417bp、298bp)相对比,各个fut8-/-的cho细胞克隆至少有一条甚至两条等位基因的msci位点都被talen破坏了(图7a)。对1号克隆的两条等位基因的测序表明,talen均造成了两者的无义突变,蛋白产物提前终止。测序结果表明其中一条等位基因的msci位点被talen破坏,与图7b结果相符。图8显示了野生型cho-k1和cho-fut8-/-细胞表达的fc融合蛋白的糖链massspec质谱分析。结果表明cho-fut8-/-细胞表达的产物100%不带有岩藻糖(图中实心菱形标记)。图9显示了野生型cho-k1和cho-fut8-/-细胞表达的抗体的糖链massspec质谱分析。结果表明cho-fut8-/-细胞表达的产物100%不带有岩藻糖(图中实心菱形标记)。图10显示了野生型cho-k1和cho-fut8-/-细胞表达的higg1抗体对多种小鼠和人的fc受体蛋白的elisa结合活性。结果表明,岩藻糖缺失的higg1抗体对小鼠fcrγi、fcrγiib、fcrγiii,以及人的fcrγi、fcrγiia(h133)、fcrγiia(r133)、fcrγiib的结合力没有变化,而对fcrγiiia的结合力有很大提升。图11显示了用生物信息学方法,从uniprot蛋白序列库中鉴定出的豚鼠蛋白(h0vdz8,定名为guineapigfcrγiv,gpfcrγiv),与小鼠fcrγiv和人的fcrγiiia在蛋白序列上的高度同源性。图12显示了野生型(空心圆圈)和岩藻糖缺失(实心圆圈)的人higg1、小鼠migg2a抗体与hfcrγiiia-v158、mfcrγiv和gpfcrγiv的结合力差别。结果显示,用cho-fut8-/-细胞表达的岩藻糖缺失的higg1、小鼠migg2a抗体对这些受体的结合力都有不同程度的提高。图13显示了野生型和岩藻糖缺失的higg1对靶细胞的adcc活性比较。此系统中,效应细胞采用的是慢病毒介导在jurkat细胞上表达hfcrγiiia-v158受体,激发下游萤光素酶luciferase的受激表达。图14显示了野生型和岩藻糖缺失的migg2c对靶细胞的adcc活性比较。此系统中,效应细胞采用的是慢病毒介导在jurkat细胞上表达mfcrγiv受体,激发下游萤光素酶luciferase的受激表达。图15显示了cho细胞经talen敲除gs基因之后,#4号亚克隆和野生型细胞分别在完全培养基和谷氨酰胺缺失的培养基中的生长情况。gs-/-的cho细胞只能在完全培养基中生长,而在谷氨酰胺缺失的培养基则不能生长。而gs+/+的cho细胞则能在两者中皆能生长。图16显示了gs-/-的cho-k1#4号克隆株的两条染色体在gs的7号外显子区域的dna序列。由于基因编辑的作用,两条染色体的gs等位基因都提前终止了。图17显示了在gs-/-的cho-k1#4号克隆株的基础上进一步用本发明中揭示的talen方法敲除fut8基因后,用fitc标记的植物凝集素lca对获得的克隆进行facs分析的结果。其中#1,#4,#5和#7为gs-/-和fut8-/-双敲除株。图18显示了cho-ef细胞被gt-p2a-st6基因转化并经药物筛选和亚克隆后得到的cho-efs-6.1、cho-efs-6.3细胞株,经植物凝集素sambucusnigralectin(sna)染色,证明细胞表面带有cho-f母细胞株所不能表达的α2,6位的唾液酸;而植物凝集素maackiaamurensislectinii(malii)所特异识别的α2,3位的唾液酸则在三者没有差别(图18a)。表达α2,6位唾液酸的cho-efs-6.1细胞株,其表面半乳糖被部分遮蔽,故植物凝集素erythrinacristagallilectin(ecl)对半乳糖的特异染色比之cho-f母细胞株要低(图18b)。图19显示了cho-e细胞被gt-p2a-st6基因转化并经药物筛选和亚克隆后得到的cho-es-#3、cho-es-#4、cho-es-#5细胞株。经植物凝集素sambucusnigralectin(sna)染色,证明这些细胞表面带有cho-e母细胞株所不能表达的α2,6位的唾液酸,与cho-efs-6.1细胞株的特征一致,只是前者带有岩藻糖(lca染色阳性,同cho-k1)而后者是岩藻糖缺失的(lca染色阴性,同cho-f)。图20显示了在cho-es(3,6)细胞中用talen技术敲除α2,3唾液酸转移酶(st3gal4和st3gal6)之后得到的cho-es(6)细胞株,经由植物凝集素sambucusnigralectin(sna)和maackiaamurensislectinii(malii)染色后的facs图谱。野生型cho-e细胞仅表达α2,3位的唾液酸。cho-es(3,6)细胞同时表达α2,3和α2,6位的唾液酸。在此基础上敲除α2,3唾液酸转移酶的cho-es(6)细胞株仅表达α2,6位的唾液酸。图21显示了野生型cho-k1和fut8-/-的cho-efs(3,6)细胞株表达的人igg1抗体的糖链massspec质谱分析。结果表明两者的糖链有很大的不同。后者不仅不带有岩藻糖,而且还带有更多的末端唾液酸。图22显示了分别用野生型(wt)cho-k1细胞株、岩藻糖缺失型(af)cho-f细胞株以及岩藻糖缺失并人源唾液酸化型(af+s)cho-efs(3,6)细胞株表达的抗肿瘤靶点gpc3的higg1抗体对gpc3阳性的huh7细胞的adcc效果。岩藻糖缺失抗体的adcc活力比野生型抗体的adcc活力要显著提高,而在岩藻糖缺失基础上又增加唾液酸后,抗体的adcc活力又有提升。实施发明的最佳方式为了更加清楚的解释本发明的目的、技术方案和优点,以下结合实施例进一步说明本发明。此处所描述的具体实施例仅用以说明和解释本发明,并不是限定本发明的应用范畴。本发明实施例中未注明具体条件的实验方法,通常按照常规条件(例如可参考《分子克隆:实验室指南》中所述的条件、或按照制造厂商所建议的条件)即可实现。除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。本发明的详细描述如下:如本文中所使用的,术语“宿主细胞”是指可用于导入载体的细胞,其包括但不限于,原核细胞例如大肠杆菌细胞或枯草杆菌细胞等,真菌细胞例如酵母细胞或曲霉菌细胞等,昆虫细胞例如s2果蝇细胞或sf9细胞,和动物细胞例如纤维源细胞、cho细胞、cos细胞、ns0细胞、hela细胞、bhk细胞、hek293细胞、per.c6细胞或人细胞等。如本文中所使用的,某一细胞的“后代细胞”是指直接或间接起源于该细胞的细胞,其不仅包括该细胞通过细胞分裂或细胞繁殖而直接产生的后代细胞,而且包括由该细胞的后代细胞产生的后代细胞。例如,cho-k1的后代细胞包括,任何直接或间接源于cho-k1的细胞。如本文中所使用的,术语“谷氨酰胺合成酶(gs)”是指,能够催化谷氨酸和铵合成为谷氨酰胺的酶。gs的国际系统分类编号为ec6.3.1.2。cho细胞的基因组中,编码谷氨酰胺合成酶(gs)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nw_003613921.1;第1430036-1435423位。如本文中所使用的,术语“岩藻糖基转移酶8(fut8)”亦称为α-(1,6)-岩藻糖基转移酶,其能够催化岩藻糖基以α-(1,6)的连接方式转移至蛋白的糖基化位点。fut8的国际系统分类编号为ec2.4.1.68。cho细胞的基因组中,编码岩藻糖基转移酶8(fut8)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nw_003613860.1;第570169-731500位。如本文中所使用的,术语“α2,3-唾液酸转移酶4(st3gal4)”亦称为st3β-galactosideα-2,3-sialyltransferase4,是能够催化唾液酸糖基以α-(2,3)的连接方式转移至β-半乳糖苷的第4亚型酶。st3gal4的国际系统分类编号为ec2.4.99.4。cho细胞的基因组中,编码α2,3-唾液酸转移酶4(st3gal4)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nw_003613908.1;第1021239-1065065位。如本文中所使用的,术语“α2,3-唾液酸转移酶6(st3gal6)”亦称为st3β-galactosideα-2,3-sialyltransferase6,是能够催化唾液酸糖基以α-(2,3)的连接方式转移至β-半乳糖苷的第6亚型酶。st3gal6的国际系统分类编号为ec2.4.99.4。cho细胞的基因组中,编码α2,3-唾液酸转移酶6(st3gal6)的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nw_003614792.1;第384880-438354位。如本文中所使用的,术语“内质网氧化还原酶”(ero1-l)亦称为endoplasmicreticulumoxidoreductase,是在内质网中催化二硫键形成的氧化还原酶。ero1-l的国际系统分类编号为ec1.8.4.2。人类基因组中,编码ero1-l的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000014.9;第52639915-52695931位。如本文中所使用的,术语“srp-14”亦称为信号识别颗粒分子量14kda蛋白。它与srp-9、srp-54组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码srp-14的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000015.10;第40035690-40039202位。如本文中所使用的,术语“srp-54”亦称为信号识别颗粒分子量54kda蛋白。它与srp-9、srp-14组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码srp-54的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000014.9;第34982898-35029567位。如本文中所使用的,术语“srp-9”亦称为信号识别颗粒分子量9kda蛋白。它与srp-14、srp-54组成识别信号肽并暂时终止翻译的复合物,将分泌蛋白导入粗糙内质网内腔。人类基因组中,编码srp-9的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000001.11;第225777813-225790466位。如本文中所使用的,术语“fgf9”亦称为成纤维细胞生长因子9,术语“hfgf9”亦称为人成纤维细胞生长因子9,可促进cho细胞的生长和抗凋亡。人类基因组中,编码fgf9的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_0000013.11;第21671076-21704501位。如本文中所使用的,术语“gt”亦称为β1,4-galactosyltransferase1,参与高尔基体中蛋白糖基化过程中以β1,4位链接的半乳糖残基加成。gt的国际系统分类编号为ec2.4.1.133。人类基因组中,编码gt的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000009.12;第33110641-33167358位。如本文中所使用的,术语“st6”亦称为α2,6-sialyltransferase1,参与高尔基体中蛋白糖基化过程中以α2,6位链接的唾液酸残基加成。st6的国际系统分类编号为ec2.4.99.10。人类基因组中,编码st6的核苷酸序列是已知的,其示例性核苷酸序列可参见例如,ncbi登录号nc_000003.12;第186930526-187078553位。如本文中所使用的,术语“载体(vector)”是指,可将多聚核苷酸插入其中的一种核酸运载工具。当载体能使插入的多核苷酸编码的蛋白获得表达时,载体称为表达载体。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。载体是本领域技术人员公知的,包括但不限于:质粒;噬菌粒;人工染色体,例如酵母人工染色体(yac)、细菌人工染色体(bac)或p1来源的人工染色体(pac);噬菌体如λ噬菌体或m13噬菌体及动物病毒等。可用作载体的动物病毒包括但不限于,逆转录酶病毒(包括慢病毒)、腺病毒、腺相关病毒、疱疹病毒(如单纯疱疹病毒)、痘病毒、杆状病毒、乳头瘤病毒、乳头多瘤空泡病毒(如sv40)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。如本文中所使用的,术语“稳定表达”是指,宿主细胞将整合到宿主细胞基因组中的编码外源蛋白的基因表达为外源蛋白。在稳定表达过程中,编码外源蛋白的基因被稳定插入宿主细胞的基因组(例如染色体)中,因此,宿主细胞能够长期稳定地表达外源蛋白。如本文中所使用的,术语“基因敲除”是指,对细胞基因组中的基因进行编辑(例如,对该基因进行插入、替换、和/或删除等改造),使得该基因丧失其原有功能(例如,不能表达功能性的蛋白)。可使用各种已知的分子生物学技术(例如,使用zfn、talen、crispr/cas9、或ngago的基因编辑技术)来编辑细胞基因组中的基因。基因敲除并不局限于将整个基因完整缺失或去除,而只要使基因丧失其原有功能即可。例如,可通过在基因中插入外源dna片段,使得该基因无法表达功能性蛋白,或可通过在基因中插入或缺失一个或数个碱基,使得该基因发生移码突变,来实现对该基因的敲除。如本文中所使用的,术语“adcc”,亦称为抗体依赖的细胞介导的细胞毒作用(antibody-dependentcell-mediatedcytotoxicity),是指具有杀伤活性的细胞(例如nk细胞、巨噬细胞和中性粒细胞),通过其表面表达的fc受体(fcr)识别特异性结合于靶细胞(例如病毒感染的细胞和肿瘤细胞)表面抗原的抗体的fc片段,直接杀伤靶细胞(例如病毒感染的细胞和肿瘤细胞)。如本文中所使用的,术语“cdc”,亦称为补体依赖的细胞毒作用(complementdependentcytotoxicity),是指抗体通过激活补体系统来直接杀伤靶细胞的作用,即通过特异性抗体与细胞膜表面相应抗原结合,形成复合物而激活补体经典途径,所形成的攻膜复合物对靶细胞发挥裂解效应。如本文所使用的,其中所述loxp野生型和突变体的序列如下所示:loxpwt如seqidno:1所示ataacttcgtatagcatacattatacgaagttatloxp1如seqidno:2所示ataacttcgtatagtatagtatatacgaacggtaloxp2如seqidno:3所示taccgttcgtatagtatagtatatacgaagttatloxp3如seqidno:4所示taccgttcgtatagtatagtaatacgaacggtaloxp4如seqidno:5所示ataacttcgtataggctatagtatacgaacggtaloxp5如seqidno:6所示taccgttcgtataggctatagtatacgaagttatloxp6如seqidno:7所示taccgttcgtataggctatagtatacgaacggtagapdh基因3574544位到3575484位的核苷酸序列如seqidno:8所示:gggtgatgctggcgccgagtatgttgtggaatctactggcgtcttcaccaccatggagaaggctggggcccacttgaagggcggggccaagagggtcatcatctccgccccttctgctgatgcccccatgtttgtgatgggtgtgaaccaagacaagtatgacaactccctcaagattgtcaggtgaggatggcagagggctgtggcaaagtgggcaagcaggggcaaggttacaggtgggcgagcctcctaacctgtctcttctcttcagcaatgcgtcctgcaccaccaactgcttagcccccctggccaaggtcatccatgacaactttggcattgtggaaggactcatggtatgtagttcatctgtttcatcctgccagcagtgggcgctgtggtgggggccctgcaagacctcactccctgcctctgtgtctttcagaccacggtccatgccatcactgccacccagaagactgtggatggcccctccgggaagctgtggcgtgatggccgtggggctgcccagaacatcatccctgcatccactggcgctgccaaggctgtgggcaaagtcatcccagagctgaacgggaagctgactggcatggccttccgtgttcctacccccaacgtgtccgttgtggatctgacatgtcgcctggagaaacctgtatgtctggggtgggctgagggttgtctctagtggtgaggttggggcttgagtagtcaccttgatttttgcccttaataggccaagtatgaggacatcaagaaggtggtgaagcaggcatctgagggcccactgaagggcatcctgggctacaccgaggaccaggttgtctcctgcgacttcaacagtgactcccactcttccacctttgatgctggggctggcattgctctcaatgacaactttgtaaagctcatttcctggtatgacaatgaatttggctacagcaacagagtggtggacctcatggcctacatggcctccaagg正筛选序列puromycin-t2a-d1egfp的氨基酸序列如seqidno:9所示:mateykptvrlatrddvpravrtlaaafadypatrhtvdpdrhiervtelqelfltrvgldigkvwvaddgaavavwttpesveagavfaeigsrmaelsgsrlaaqqqmegllaphrpkepawflatvgvspdhqgkglgsavvlpgveaaeragvpafletsaprnlpfyerlgftvtadvevpegprtwcmtrkpgagsegrgslltcgdveenpgpmvskgeelftgvvpilveldgdvnghkfsvsgegegdatygkltlkficttgklpvpwptlvttltygvqcfsrypdhmkqhdffksampegyvqertiffkddgnyktraevkfegdtlvnrielkgidfkedgnilghkleynynshnvyimadkqkngikvnfkirhniedgsvqladhyqqntpigdgpvllpdnhylstqsalskdpnekrdhmvllefvtaagitlgmdelykklshgfppavaaqddgtlpmscaqesgmdrhpaacasarinv所述打靶载体(gapdh同源序列的左右臂及中间部分dna序列,包括tk基因-sv40polya-pgk启动子-puromycin-t2a-d1egfp)的dna序列如seqidno:10所示,其中,所述puromycin-t2a-d1egfp序列(seqidno:15)使用加粗下划线表示:所述载体ptog3核苷酸序列如seqidno:11所示,其中加黑下划线处为示踪蛋白dsred-e2,其核苷酸序列如seqidno:36所示(未单独列出):所述载体ptog4核苷酸序列如seqidno:12所示,其中加黑下划线处为示踪蛋白d1egfp,其核苷酸序列如seqidno:37所示(未单独列出):不带启动子的抗性基因hygb如seqidno:13所示;atgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgacagcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgatgtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagatcgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacattggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttgcaagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggatgcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaaggaatcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtatcactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgagctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggctccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcgatgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggcttgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccgcggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgacggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccggagccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggctgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaaggaatag人延长因子1a(ef1a)启动子如seqidno:14所示;cgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgcacatgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctggagcttttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgtcgtga人源整合外源基因信号识别颗粒9、信号识别颗粒14、信号识别颗粒54三个基因用自动切割肽段连接作为任选的外源基因,如seqidno:17所示:atggtgttgttggagagcgagcagttcctgacggagctgaccagacttttccagaagtgccggacgtcgggcagcgtctatatcaccttgaagaagtatgacggtcgaaccaaacccattccaaagaaaggtactgtggagggctttgagcccgcagacaacaagtgtctgttaagagctaccgatgggaagaagaagatcagcactgtggtgagctccaaggaagtgaataagtttcagatggcttattcaaacctccttagagctaacatggatgggttgaagaagagagacaaaaagaacaaaactaagaagaccaaagcagcagcagcagcagcagcagcagcacctgccgcagcagcaacagcagcacagggcagcgagggaaggggaagcctgctcacatgcggcgacgtcgaagagaaccctggccccatgccgcagtaccagacctgggaggagttcagccgcgctgccgagaagctttacctcgctgaccctatgaaggcacgtgtggttctcaaatataggcattctgatgggaacttgtgtgttaaagtaacagatgatttagttagacagtgtcttgctctattgctcaggctgcagtgcagtggcatgatcatagctcactgcatcctcgacctcctgggctcaagcggtcctcttgcttcagcctccggagccaccaacttcagcctgctgaagcaggccggcgatgtggaggagaatcctggccccatggttctagcagaccttggaagaaaaataacatcagcattacgctcgttgagcaatgccaccattatcaatgaagaggtattgaatgctatgctaaaagaagtctgtaccgctttgttggaagcagatgttaatattaaactagtgaagcaactaagagaaaatgttaagtctgctattgatcttgaagagatggcatctggtcttaacaaaagaaaaatgattcagcatgctgtatttaaagaacttgtgaagcttgtagaccctggagttaaggcatggacacccactaaaggaaaacaaaatgtgattatgtttgttggattgcaagggagtggtaaaacaacaacatgttcaaagctagcatattattaccagaggaaaggttggaagacctgtttaatatgtgcagacacattcagagcaggggcttttgaccaactaaaacagaatgctaccaaagcaagaattccattttatggaagctatacagaaatggatcctgtcatcattgcttctgaaggagtagagaaatttaaaaatgaaaattttgaaattattattgttgatacaagtggccgccacaaacaagaagactctttgtttgaagaaatgcttcaagttgctaatgctatacaacctgataacattgtttatgtgatggatgcctccattgggcaggcttgtgaagcccaggctaaggcttttaaagataaagtagatgtagcctcagtaatagtgacaaaacttgatggccatgcaaaaggaggtggtgcactcagtgcagtcgctgccacaaaaagtccgattattttcattggtacaggggaacatatagatgactttgaacctttcaaaacacagccttttattagcaaacttcttggtatgggcgacattgaaggactgatagataaagtcaacgagttgaagttggatgacaatgaagcacttatagagaagttgaaacatggtcagtttacgttgcgagacatgtatgagcaatttcaaaatatcatgaaaatgggccccttcagtcagatcttggggatgatccctggttttgggacagattttatgagcaaaggaaatgaacaggagtcaatggcaaggctaaagaaattaatgacaataatggatagtatgaatgatcaagaactagacagtacggatggtgccaaagtttttagtaaacaaccaggaagaatccaaagagtagcaagaggatcgggtgtatcaacaagagatgttcaagaacttttgacacaatataccaagtttgcacagatggtaaaaaagatgggaggtatcaaaggacttttcaaaggtggcgacatgtctaagaatgtgagccagtcacagatggcaaaattgaaccaacaaatggccaaaatgatggatcctagggttcttcatcacatgggtggtatggcaggacttcagtcaatgatgaggcagtttcaacagggtgctgctggcaacatgaaaggcatgatgggattcaataatatgtaa敲除fut8基因所构建的talen左臂蛋白的dna序列如seqidno:18所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa敲除fut8基因所构建的talen右臂蛋白的dna序列如seqidno:19所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatcccatgacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa用于扩增fut8基因10号外显子talen靶向区域的pcr引物1如seqidno:20所示:taaatctgttgattccaggttccc用于扩增fut8基因10号外显子talen靶向区域的pcr引物2如seqidno:21所示:gtactaagaagtgtggtactgtgttg敲除gs基因所构建的talen左臂蛋白的dna序列如seqidno:22所示:atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatggtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtgagaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccacatcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggacatgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtggagcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggcccccccctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtggaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagccatgacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaacaacggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgccctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgccctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacagaagaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctggaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgagctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggagttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgacggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcctacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggaggagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagcagcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcccagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggagctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaagaaagttcaacaacggcgagatcaacttcagaagctctagatga敲除gs基因所构建的talen右臂蛋白的dna序列如seqidno:23所示:atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgacgacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatggtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtgagaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccacatcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggacatgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtggagcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggcccccccctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtggaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacaacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggccattgccagccatgacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgccatcgcctctcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaacggtggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgccctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgccctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacagaagaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctggaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgagctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggagttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgacggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcctacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggaggagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagcagcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcccagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggagctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaagaaagttcaacaacggcgagatcaacttcagaagctctagatga用于扩增gs基因7号外显子talen靶向区域的pcr引物1如seqidno:24所示ttgtacccgttggagaagtgacag用于扩增gs基因7号外显子talen靶向区域的pcr引物2如seqidno:25所示:gatgaactaggaaaggctcaagatcac敲除st3gal4基因所构建的talen左臂蛋白的dna序列如seqidno:26所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacaacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa敲除st3gal4基因所构建的talen右臂蛋白的dna序列如seqidno:27所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa用于扩增st3gal4基因5号外显子talen靶向区域的pcr引物1如seqidno:28所示:ctaaaggctgctcccactctac用于扩增st3gal4基因5号外显子talen靶向区域的pcr引物2如seqidno:29所示:caaagtggaacttgggttgagg敲除st3gal6基因所构建的talen左臂蛋白基因序列如seqidno:30所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacggcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa敲除st3gal6基因所构建的talen右臂蛋白基因序列如seqidno:31所示:atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgatgacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagccgtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtgaggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccacatcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggacatgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtggagcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccccttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtcgaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaacatcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcgctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgccttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacagaaggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaacttgaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaacttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggagttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgacggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcctacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaagaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttcatcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcccagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaactgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgcaagtttaacaatggcgagatcaatttccgctcataa用于扩增st3gal6基因2号外显子talen靶向区域的pcr引物1如seqidno:32所示:gggtgtagagatagattctcc用于扩增st3gal6基因2号外显子talen靶向区域的pcr引物2如seqidno:33所示:ggccagccatcactagtattc所述hero-l基因的dna序列如seqidno:38所示:atgggccgcggctggggattcttgtttggcctcctgggcgccgtgtggctgctcagctcgggccacggagaggagcagcccccggagacagcggcacagaggtgcttctgccaggttagtggttacttggatgattgtacctgtgatgttgaaaccattgatagatttaataactacaggcttttcccaagactacaaaaacttcttgaaagtgactactttaggtattacaaggtaaacctgaagaggccgtgtcctttctggaatgacatcagccagtgtggaagaagggactgtgctgtcaaaccatgtcaatctgatgaagttcctgatggaattaaatctgcgagctacaagtattctgaagaagccaataatctcattgaagaatgtgaacaagctgaacgacttggagcagtggatgaatctctgagtgaggaaacacagaaggctgttcttcagtggaccaagcatgatgattcttcagataacttctgtgaagctgatgacattcagtcccctgaagctgaatatgtagatttgcttcttaatcctgagcgctacactggttacaagggaccagatgcttggaaaatatggaatgtcatctacgaagaaaactgttttaagccacagacaattaaaagacctttaaatcctttggcttctggtcaagggacaagtgaagagaacactttttacagttggctagaaggtctctgtgtagaaaaaagagcattctacagacttatatctggcctacatgcaagcattaatgtgcatttgagtgcaagatatcttttacaagagacctggttagaaaagaaatggggacacaacattacagaatttcaacagcgatttgatggaattttgactgaaggagaaggtccaagaaggcttaagaacttgtattttctctacttaatagaactaagggctttatccaaagtgttaccattcttcgagcgcccagattttcaactctttactggaaataaaattcaggatgaggaaaacaaaatgttacttctggaaatacttcatgaaatcaagtcatttcctttgcattttgatgagaattcattttttgctggggataaaaaagaagcacacaaactaaaggaggactttcgactgcattttagaaatatttcaagaattatggattgtgttggttgttttaaatgtcgtctgtggggaaagcttcagactcagggtttgggcactgctctgaagatcttattttctgagaaattgatagcaaatatgccagaaagtggacctagttatgaattccatctaaccagacaagaaatagtatcattattcaacgcatttggaagaatttctacaagtgtgaaagaattagaaaacttcaggaacttgttacagaatattcattga所述hfgf9基因的dna序列如seqidno:39所示:atgaccagcaagctcgccgtggctctgctggctgccttcctgatcagcgccgccctctgcgagggcttaggtgaagttgggaactatttcggtgtgcaggatgcggtaccgtttgggaatgtgcccgtgttgccggtggacagcccggttttgttaagtgaccacctgggtcagtccgaagcaggggggctccccaggggacccgcagtcacggacttggatcatttaaaggggattctcaggcggaggcagctatactgcaggactggatttcacttagaaatcttccccaatggtactatccagggaaccaggaaagaccacagccgatttggcattctggaatttatcagtatagcagtgggcctggtcagcattcgaggcgtggacagtggactctacctcgggatgaatgagaagggggagctgtatggatcagaaaaactaacccaagagtgtgtattcagagaacagttcgaagaaaactggtataatacgtactcatcaaacctatataagcacgtggacactggaaggcgatactatgttgcattaaataaagatgggaccccgagagaagggactaggactaaacggcaccagaaattcacacattttttacctagaccagtggaccccgacaaagtacctgaactgtataaggatattctaagccaaagttga所述gt-p2a-st6基因的dna序列如seqidno:40所示:atgaggcttcgggagccgctcctgagcggcagcgccgcgatgccaggcgcgtccctacagcgggcctgccgcctgctcgtggccgtctgcgctctgcaccttggcgtcaccctcgtttactacctggctggccgcgacctgagccgcctgccccaactggtcggagtctccacaccgctgcagggcggctcgaacagtgccgccgccatcgggcagtcctccggggagctccggaccggaggggcccggccgccgcctcctctaggcgcctcctcccagccgcgcccgggtggcgactccagcccagtcgtggattctggccctggccccgctagcaacttgacctcggtcccagtgccccacaccaccgcactgtcgctgcccgcctgccctgaggagtccccgctgcttgtgggccccatgctgattgagtttaacatgcctgtggacctggagctcgtggcaaagcagaacccaaatgtgaagatgggcggccgctatgcccccagggactgcgtctctcctcacaaggtggccatcatcattccattccgcaaccggcaggagcacctcaagtactggctatattatttgcacccagtcctgcagcgccagcagctggactatggcatctatgttatcaaccaggcgggagacactatattcaatcgtgctaagctcctcaatgttggctttcaagaagccttgaaggactatgactacacctgctttgtgtttagtgacgtggacctcattccaatgaatgaccataatgcgtacaggtgtttttcacagccacggcacatttccgttgcaatggataagtttggattcagcctaccttatgttcagtattttggaggtgtctctgctctaagtaaacaacagtttctaaccatcaatggatttcctaataattattggggctggggaggagaagatgatgacatttttaacagattagtttttagaggcatgtctatatctcgcccaaatgctgtggtcgggaggtgtcgcatgatccgccactcaagagacaagaaaaatgaacccaatcctcagaggtttgaccgaattgcacacacaaaggagacaatgctctctgatggtttgaactcactcacctaccaggtgctggatgtacagagatacccattgtatacccaaatcacagtggacatcgggacaccgagctcgagcggcagcggagccaccaacttcagcctgctgaagcaggccggcgatgtggaggagaatcctggccccatgattcacaccaacctgaagaaaaagttcagctgctgcgtcctggtctttcttctgtttgcagtcatctgtgtgtggaaggaaaagaagaaagggagttactatgattcctttaaattgcaaaccaaggaattccaggtgttaaagagtctggggaaattggccatggggtctgattcccagtctgtatcctcaagcagcacccaggacccccacaggggccgccagaccctcggcagtctcagaggcctagccaaggccaaaccagaggcctccttccaggtgtggaacaaggacagctcttccaaaaaccttatccctaggctgcaaaagatctggaagaattacctaagcatgaacaagtacaaagtgtcctacaaggggccaggaccaggcatcaagttcagtgcagaggccctgcgctgccacctccgggaccatgtgaatgtatccatggtagaggtcacagattttcccttcaatacctctgaatgggagggttatctgcccaaggagagcattaggaccaaggctgggccttggggcaggtgtgctgttgtgtcgtcagcgggatctctgaagtcctcccaactaggcagagaaatcgatgatcatgacgcagtcctgaggtttaatggggcacccacagccaacttccaacaagatgtgggcacaaaaactaccattcgcctgatgaactctcagttggttaccacagagaagcgcttcctcaaagacagtttgtacaatgaaggaatcctaattgtatgggacccatctgtataccactcagatatcccaaagtggtaccagaatccggattataatttctttaacaactacaagacttatcgtaagctgcaccccaatcagcccttttacatcctcaagccccagatgccttgggagctatgggacattcttcaagaaatctccccagaagagattcagccaaaccccccatcctctgggatgcttggtatcatcatcatgatgacgctgtgtgaccaggtggatatttatgagttcctcccatccaagcgcaagactgacgtgtgctactactaccagaagttcttcgatagtgcctgcacgatgggtgcctaccacccgctgctctatgagaagaatttggtgaagcatctcaaccagggcacagatgaggacatctacctgcttggaaaagccacactgcctggcttccggaccattcactgctaa实施例1:cho细胞打靶载体的构建和锚定细胞株的建立为了实现在cho细胞基因组上的连续的、循环交替的、无上限的定点整合,首先需要在cho细胞基因组中找到一个高表达的热点(hot-spot)。发明人经过深入研究,发现组成型高表达的管家基因gapdh的启动子(promoter)符合染色体结构开放、恒定高表达的要求。例如,bahrs.等人在cho细胞中鉴定出类似于小鼠rosa26的位点。rosa26是已知的小鼠基因组中结构开放、恒定高表达的位点,经常被用于植入外源基因,制备转基因小鼠。尽管cho细胞中的也存在rosa26基因,但其mrna水平的转录强度,与其它数个恒定型管家基因相比,是较低的,尤其仅为gapdh转录强度的1/300。gapdh基因比第二位的β-actin基因要高4~5倍。所以,我们选取cho细胞中的gapdh基因3574544位到3575484位的核苷酸序列(seqidno:8)所示进行基因打靶。基因打靶技术已经被广泛用于制备基因敲除(knockout)、基因敲入(knockin)小鼠,其原理是建立在染色体dna与外源dna的同源重组基础上的。我们在购自商业化公司的打靶载体pdnl(addgene)上,在paci和fsei酶切位点之间,克隆进gapdh的左右臂。在gapdh左右臂之间,包含了tk基因作为负筛选,pgk启动子-嘌呤霉素-t2a-d1egfp表达盒作为正筛选。而且,在紧邻该表达盒的上下游,分别带有loxpwt和loxp1序列。此打靶载体被命名为chogapdh-zeo-tkhrv1.5(图1,其部分核苷酸序列如seqidno:10所示)。在这个过程中,所有的分子克隆操作都采用高保真dna聚合酶herculaseiifusiondnapolymerase(aligent公司),按overlappingpcr方法将不同片段连接起来。所有的pcr引物都由integrateddnatechnology(idt)公司合成。限制性内切酶都购自newenglandbiolabs(neb)。cho-k1细胞(atcc,ccl-61)接受打靶载体的电转。电转仪是lifetech公司的neonelectroporation系统。电转条件是1620v,10ms,3次脉冲。打靶载体的dna用量是10μg,细胞用量是2百万个。电转后,cho细胞培养在含5%fbs的dmem培养基中,48小时后,用药物嘌呤霉素(10μg/ml)筛选。我们用d1egfp作为示踪蛋白,与嘌呤霉素通过自动切割序列连接,其氨基酸序列如seqidno:9所示。所述自动切割序列选自2a肽段(参阅“基于2a肽策略构建多基因表达载体的研究进展”,chinabiotechnology,2013,33:104-108)。自剪切2a肽源于口蹄疫病毒(foot-and-mouthdiseaseviruses,fmdv)。这些2a肽段或2a类似肽段均由18~22个氨基酸组成,c末端序列高度保守:-dxexnpgp-。在核糖体翻译至此序列时,因发生“跳跃”而实现无需蛋白酶的自动断裂(剪切)。剪切发生在c末端g-p残基之间。优选地选自p2a(seqidno:16:atnfsllkqagdveenpgp)、t2a(seqidno:34:egrgslltcgdveenpgp)或e2a(seqidno:35:qctnyallklagdvesnpgp)。egfp在细胞内的半衰期约为24小时,荧光强度很强。d1egfp是半衰期仅为1小时的egfp的突变体,荧光强度大大减弱(序列购自clontech公司)。本发明中,采用d1egfp作为表达示踪蛋白的原理是:当打靶载体定位于gapdh表达热点后,因转录旺盛,即便是荧光很弱的d1egfp都能发出很强的荧光;而那些随机插入染色体其他位置的事件则给出羸弱的荧光。将嘌呤霉素筛选出的抗性克隆用facs检测,发现绝大多数的抗性克隆是随机插入,表达很弱的d1egfp信号。而只有0.6%非常低比例的才是真正gapdh位点定点整合的事件,表达很强的d1egfp信号(图2)。发明人进而用流式细胞仪(moflo)将这些d1egfp高表达的克隆富集后亚克隆。获得的一株表达很强的d1egfp信号、形态好且生长快的cho细胞株,作为可供进一步实现“连续、循环交替的、无上限的基因组定点整合”的锚定cho细胞株(anchorcellline)。实施例2:“toggle-in”载体的构建和多基因稳定共表达的方法为解决cho细胞株改造所面临的多基因稳定共表达的难题,发明人在前述锚定cho细胞株的基础上,研发出一套cre-loxp介导的同源重组的“toggle-in”平台系统。该系统的特征是:依次用两个载体(ptog3和ptog4,只用两个抗药性基因(潮霉素b和嘌呤霉素)就可以实现连续、循环交替的、无上限的基因组定点整合。而且,这些cho细胞克隆,每个都是均质(isogeneic)的,可以做到插入片段1:1表达。ptog3(其核苷酸序列如seqidno:11所示,其中携带dsred-e2示踪蛋白,其核苷酸序列如seqidno:36)和ptog4(其核苷酸序列如seqidno:12所示,其中携带d1egfp示踪蛋白,其核苷酸序列如seqidno:37所示)的构建依然采用前述分子克隆操作方法,即由高保真dna聚合酶herculaseiifusiondnapolymerase(aligent公司),按overlappingpcr方法将不同片段连接起来。所有的pcr引物都由integrateddnatechnology(idt)公司合成。限制性内切酶都购自newenglandbiolabs(neb)。其中,ptog3带有潮霉素抗性基因(潮霉素b)和外源基因-1(gene-of-interest,goi-1),而ptog4则带有嘌呤霉素抗性基因(嘌呤霉素)和外源基因-2(goi-2)。表1列出了ptog3和ptog4载体所用到的loxp野生型和突变体的序列。loxp序列(34nt)可以分为左臂(13nt)、间隔区(8nt)和右臂(13nt)。核心的间隔区决定了loxp序列之间的匹配,即只有相同间隔区的loxp序列,之间才能进行同源重组(例如loxp1和loxp2,或loxp4和loxp5)。cre重组酶可以容忍在左右臂区之一有一定程度的突变(例如loxp1的右臂相较于loxpwt的右臂),但不能容忍左右臂区同时出现突变(例如loxp3或loxp6相较于loxpwt)。一旦如此,重组后新产生的loxp3或loxp6便失活了,不能进一步发生cre介导的重组。表1loxp序列左臂间隔区右臂序列号loxpwtataacttcgtatagcatacattatacgaagttatseqidno:1loxp1ataacttcgtatagtatagtatatacgaacggtaseqidno:2loxp2taccgttcgtatagtatagtatatacgaagttatseqidno:3loxp3taccgttcgtatagtatagtatatacgaacggtaseqidno:4loxp4ataacttcgtataggctatagtatacgaacggtaseqidno:5loxp5taccgttcgtataggctatagtatacgaagttatseqidno:6loxp6taccgttcgtataggctatagtatacgaacggtaseqidno:7第一步,先在实施例1制备的锚定cho细胞中,转化ptog3。具体方法是:将锚定cho细胞用含5%fbs的dmem培养在6孔板中。当细胞密度达到80%满时,用fugene6试剂(promega公司)同时转化1.0μg的带外源基因的ptog3和20ng编码cre蛋白的pog231质粒(购自addgene)。由于此一步cre-loxp同源重组的效率非常之高,pog231的量不能太多否则效率反而下降,20ng的量是已滴定过的最优剂量。转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加800μg/ml的潮霉素b,筛选7~10天后,可见几百个克隆形成。作为示范,发明人将dsred-e2示踪蛋白的基因(seqidno:36),克隆到ptog3的mlui和xhoi酶切位点之间,由ptog3载体导入锚定cho细胞的gapdh的表达热点,并经过潮霉素筛选出克隆。荧光显微镜观察表明,所有药物抗性克隆均表达很高水平的红色荧光蛋白(图5a),说明此染色体基因组定点整合技术的高效率。药物抗性试验(drugtest)的目的是筛选出真正的基因打靶事件,而非随机整合事件。在潮霉素b筛选出的克隆长至1000个细胞左右时,用2mlpbs将平皿洗三次,去除任何漂浮的细胞。然后用无菌枪头挑取形态好的克隆至48孔中,继续用含5%fbs的dmem培养。当细胞在48孔中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组加嘌呤霉素(10μg/ml)筛选,另一组留种。一般1~2天后即可看出细胞是否对嘌呤霉素敏感。根据“toggle-in”平台系统的原理,带有goi-1的ptog3载体与gapdh位点上的loxpwt:loxpwt序列以及loxp1:loxp2序列之间发生同源重组,保留loxpwt序列,并生成失活的loxp3序列。goi-1由此整合到染色体高表达位点,并由潮霉素筛选出带有loxp4序列的正确克隆(图3)。而这些真正发生同源重组的正确克隆,其嘌呤霉素抗性基因是被潮霉素抗性基因置换掉的,故细胞应该显出对嘌呤霉素敏感。如果不敏感,则是随机整合事件。虽然有些双抗性的克隆也可能会表达goi-1,但却无法进行下一步的“toggle-in”操作。第二步,将上述嘌呤霉素敏感的克隆用含5%fbs的dmem培养在6孔板中。当孔内的细胞密度达到80%满时,用fugene6试剂同时转化1.0μg的带外源基因goi-2的ptog4和20ng的pog231质粒,由嘌呤霉素筛选出带有loxp1序列的正确克隆(图4)。在此过程中,ptog4载体和上述新整合位点上的loxpwt:loxpwt序列以及loxp4:loxp5序列之间发生同源重组,保留loxpwt序列,并生成失活的loxp6序列,goi-2由此整合到同一染色体高表达位点。上述转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加10μg/ml的嘌呤霉素,筛选7~10天后,可见10-20个克隆形成。因为loxp序列的关系,此一步的重组效率要比ptog3的要明显低很多。药物抗性试验(drugtest):当嘌呤霉素筛选出的克隆长至1000个细胞左右时,用2mlpbs将平皿洗三次,去除任何漂浮的细胞。然后用无菌枪头挑取形态好的克隆至48孔中,继续用含5%fbs的dmem培养。当细胞在48孔中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组加潮霉素(800μg/ml)筛选,另一组留种。一般7天后即可看出细胞是否对潮霉素敏感。经过这两轮的同源重组整合,染色体上又恢复到带有loxpwt和loxp1序列的初始状态,又可以进行下一轮的整合。每轮整合的筛选仅用潮霉素或嘌呤霉素两种抗生素交替进行。发明人用此方法,把srp-14-9-54(核苷酸序列如seqidno:17所示)、hero-l(核苷酸序列如seqidno:38所示)、hfgf9(核苷酸序列如seqidno:39所示)等基因,转入到cho细胞高表达位点,形成能促进抗体配对、折叠和分泌的高表达细胞株,被命名为cho-e,其中”e“代表enhanced之意。rt-pcr显示各个cho-e细胞克隆之间的基因同质性(isogenicity)(图5b)。实施例3:用talen技术敲除cho细胞中的fut8基因为方便快速地敲除cho细胞中fut8基因,发明人构建了针对cho细胞fut8基因第10号外显子的一对talen载体(编码敲除cho细胞fut8基因的talen蛋白左臂的dna序列如seqidno:18所示,编码敲除cho细胞fut8基因的talen蛋白右臂的dna序列如seqidno:19所示),分别命名为fl#2和fr#12。取这两个miniprep制备的质粒各5μg,用电转方法导入1百万个cho-k1细胞(atcc,ccl-61)。电转仪是lifetech公司的neonelectroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,cho细胞在含5%fbs的dmem培养基中培养8天,不加任何药物筛选。此一生长阶段是让那些fut8基因被破坏的克隆能充分地分裂,并通过细胞膜的周转代谢,稀释掉膜上原先带有岩藻糖(fucose)的糖蛋白,而那些新产生的跨膜糖蛋白则不带有岩藻糖了。此后,fut8-/-的cho细胞可用macs磁珠负筛选。具体做法是:于15ml离心管中,离心(1200rpm,5分钟)收集细胞。弃上清,细胞团悬浮在1ml的macs缓冲液(pbs加5mmedta加1%bsa)中,用1:2500倍稀释(终浓度2μg/ml)的biotin标记的特异结合岩藻糖的植物凝集素lensculinarisagglutinin(lca)4℃染色15分钟。lca-biotin购自美国vectorlaboratories,inc.公司(burlingame,ca)。细胞悬液加10mlmacs缓冲液,离心(1200rpm,5分钟)收集细胞,用1ml的macs缓冲液重悬。加pe标记的streptavidin(终浓度1μg/ml)4℃避光染色15分钟。streptavidin-pe购自美国ebioscience,inc.公司(sandiego,ca)。细胞悬液加10mlmacs缓冲液,离心(1200rpm,5分钟)收集细胞,用1ml的macs缓冲液重悬。加anti-pemicrobeads70μl,4℃结合15分钟。抗pe的磁珠购自miltenyibiotec公司(sandiego,ca)。细胞悬液加10mlmacs缓冲液,离心(1200rpm,5分钟)收集细胞,用0.5ml的macs缓冲液重悬,加到已经用5mlmacs缓冲液淋润过,并置于磁铁上的ms分离柱上。当细胞悬液进入柱面后,加10mlmacs缓冲液洗涤柱子。用15ml离心管收集从柱上流出的液体,离心(1200rpm,5分钟)收集细胞。此部分细胞是不被lca结合的,亦即岩藻糖缺失的。这部分的细胞约占细胞总数的1%。将细胞按一定浓度稀释种在含5%fbsdmem培养基的10厘米培养皿中。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%fbs的dmem培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组用facs验证其表面是否存在lca结合位点,另一组留种。图6即显示获得的facs图谱。在获得了18个lca染色阴性的克隆后,发明人继续对1号克隆进一步进行10号外显子区域基因组dna的pcr扩增(所用引物序列seqidno:20-21所示)。基因组dna的提取方法按qiagen试剂盒的说明书操作。pcr片段用qiagen公司的pcr回收试剂盒回收,并于37℃用neb公司的msci酶切1个小时。2%琼脂糖电泳走胶的图谱(图7a)显示:野生型细胞的715bppcr产物被完全切成417bp和298bp两段,与msci酶切位点在扩增片段中的位置相符。1、2、18号克隆则有一半dna被完全切成417bp和298bp两段,另一半dna则不被酶切。而3、4、12号克隆的pcr产物则完全不能酶切。这一结果说明:1、2、18号克隆有一条等位基因上的msci酶切位点被talen失活了,而3、4、12号克隆的两条等位基因上的msci酶切位点都被talen失活了。为了更进一步确立fut8基因不再表达功能性蛋白,发明人针对1号克隆,将其未经酶切的纯化后的pcr产物用t4dnapolymerase末端加磷,然后用lifetech公司的tacloning试剂盒克隆并转化细菌。随机挑取5个单菌落,接种培养后抽取质粒测序。测序结果(图7b)表明,1号克隆的两条fut8的外显子10的等位基因都已经失活了:其中一条是在msci酶切位点附近,发生核苷酸缺失和插入的突变,不仅使得msci酶切位点丧失,而且造成蛋白转译的提前终止;另外一条虽然保留了msci酶切位点,但核苷酸插入突变也造成了蛋白转译的提前终止。这一结果与pcr片段的酶切图谱是相符的。由此,发明人建立了cho-fut8-/-细胞株,即cho-f细胞株(表2)。为了更进一步说明cho-f细胞株确能表达100%岩藻糖缺失的抗体,在根据本发明的另一个实施方案中,发明人用massspec质谱分析比较了野生型cho-k1和cho-f细胞表达的fc融合蛋白(图8)或抗体(图9)的糖链。此部分工作由提供外包服务的waters公司按糖链massspec质谱分析的标准方法进行。结果表明cho-f细胞表达的产物100%不带有岩藻糖。实施例4:岩藻糖缺失抗体的fc受体结合活力比较为了更进一步说明岩藻糖缺失抗体与fc受体的结合活性的改变,在本发明的另一个实施方案中,发明人用elisa的方法,比较了野生型cho-k1和cho-f细胞表达的higg1抗体对多种小鼠和人的fc受体蛋白的结合能力(图10)。elisa操作按标准方法进行,即把各种fc受体蛋白(美国abbiosciences公司,boston,ma)按2μg/ml的剂量包在elisa板上。脱脂奶粉封闭之后,加相同剂量的野生型或岩藻糖缺失抗体1μg/ml,充分洗涤后再用hrp标记的羊抗人抗体检测。结果表明,岩藻糖缺失的higg1抗体对小鼠fcrγi、fcrγiib、fcrγiii,以及人的fcrγi、fcrγiia(h133)、fcrγiia(r133)、fcrγiib的结合力没有变化,而对人的fcrγiiia的结合力有很大提升。根据小鼠fcrγiv是人的fcrγiiia的功能类似物的文献报道(mechetina,l.v.etal.,immunogenetics.2002;54:463-8),发明人希望比较两者对野生型和岩藻糖缺失的higg1、小鼠migg2a抗体的结合曲线。发明人还用生物信息学方法,从uniprot蛋白序列库中鉴定出先前未知的一个豚鼠蛋白(h0vdz8),与小鼠fcrγiv和人的fcrγiiia序列高度同源(图11),进而将其定名为guineapigfcrγiv(gpfcrγiv)。发明人将hfcrγiiia-v158、mfcrγiv或gpfcrγiv分别用ptog3和“toggle-in”方法表达在转化了fcreceptorcommonγchain的cho-e细胞表面,然后用facs的方法比较野生型和岩藻糖缺失的higg1、小鼠migg2a抗体与三者的结合力(图12)。结果显示,用cho-f细胞表达的岩藻糖缺失的higg1、小鼠migg2a抗体对这些受体的结合力都有不同程度的提高(mao,c.etal.,j.infect.dis.med.,2016;1:1)。至此,发明人建立的talen快速敲除cho细胞中fut8基因的方法已经从基因和蛋白的功能水平得以验证。需要指出的是,在用ptog3导入hfcrγiiia-v158、mfcrγiv或gpfcrγiv之前,发明人考虑到很多fc受体的膜表达和活性功能都依赖一个称为fcreceptorcommonγchain的通用受体亚基(nimmerjahnf.etal,immunity.2005jul;23:41-51),故将它克隆在ptog4载体上,预先用“toggle-in”方法表达在cho-e细胞表面。继而在下一轮的ptog3导入hfcrγiiia-v158、mfcrγiv或gpfcrγiv之后,所建立的cho细胞株都能同时表达亚基1:1比例构成的功能性的fc受体复合物。因为是单拷贝定点整合,不同fc受体在不同细胞株上的表达密度是非常接近的。这为横向比较同一抗体对不同受体的结合力提供了随机整合所无法提供的优势。例如,从图12中y轴的mfi数值可知,人igg1抗体对豚鼠gpfcrγiv受体的结合活性远高于其他两个种属的同源受体。因而人的治疗性igg1抗体在不同种属的动物模型中,所获得的药代动力学等数据是否能作跨种属的推论,是需要谨慎考虑的。上述案例也是本发明所阐述的“toggle-in”方法的又一个成功应用。实施例5:岩藻糖缺失抗体的adcc活力比较为了在细胞功能水平进一步阐述岩藻糖缺失抗体的性质,发明人进一步比较了野生型和岩藻糖缺失的higg1、小鼠migg2c抗体的adcc能力。传统的检测adcc的方法是测量靶细胞的死亡(51cr或ldh的释放),而效应细胞多采用pbmc或从中纯化的nk细胞。但不同捐献者的效应细胞往往有很多差异,且不易收集和储存。promega公司开发出一种检测效应细胞系(jurkat)通过转化的hfcrγiiia(v158)受体被激活、引发荧光信号的测活方案。但是该细胞系是通过三个质粒共转化、两种抗生素药物筛选来维持功能性hfcrγiiia表达的。传代多了之后,渐渐出现hfcrγiiia功能性丢失的现象。在本发明中,发明人采用慢病毒介导的方法,在jurkat系中稳定地表达hfcrγiiia或mfcrγiv受体,使得jurkat系长期稳定且荧光信号大大增强。利用此系统,发明人用hfcrγiiia-jurkat细胞比较了野生型和岩藻糖缺失的higg1对靶细胞的adcc。具体做法是:在falconwhiteopaque细胞培养96孔板(cat#353296)里,于实验开始24小时之前预先接种10000个表达靶抗原的细胞。这样的细胞可以是表达靶抗原的肿瘤细胞系,也可以是将靶抗原克隆后用ptog3和“toggle-in”方法在表面表达的cho-e细胞。实验当天,在上述96孔板中,加入2×105/孔的hfcrγiiia-jurkat细胞,并与不同稀释度的抗靶抗原的抗体混合,总体积控制在75~90μl,在37℃孵育6小时。孵育结束后,于每孔加60μl的bio-glo萤光素酶底物(promega公司,cat#g719a),室温30分钟后上荧光读数仪读数。结果显示,用cho-f细胞表达的岩藻糖缺失的higg1对靶细胞的adcc比野生型higg1提高了50~100倍(图13)。按同样方法,发明人比较了野生型和岩藻糖缺失的migg2c对靶细胞的adcc。所不同的是,效应细胞采用的是用慢病毒介导表达的mfcrγiv-jurkat细胞。结果显示,岩藻糖缺失的migg2c对靶细胞的adcc比野生型migg2c提高了50~100倍(图14)。至此,建立快速敲除cho细胞株中fut8基因的方法,已经在本发明的实施例中,不仅在基因和蛋白的功能水平,而且在抗体介导的细胞活性水平得以确立。运用此方法,发明人不仅在cho-k1细胞株中敲除了fut8基因,得到cho-f细胞株,而且在第一部分实施例中建立的、同时表达多个基因的cho-e细胞株中也敲除了fut8基因,得到cho-ef细胞株。实施例6:gs缺失的cho细胞克隆的筛选如实施例3所示,cho-k1细胞或fut8基因缺失的cho-f细胞,经电转导入针对gs基因的talen左臂(seqidno:22)和右臂(seqidno:23)载体gs-l和gs-r(各5μg)。电转仪是lifetech公司的neonelectroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,cho细胞按一定浓度稀释后种在含5%fbs的dmem培养基的10厘米培养皿中培养,不加任何药物筛选,以形成单克隆。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%fbs的dmem培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组复孔中,其中一组用pbs洗涤两遍后,换成用不含谷氨酰胺的hycell培养基(gehealthsciences,logan,ct.catno.sh30934.01);另一组则在上述hycell培养基中补充2mm的谷氨酰胺。7天以后,gs-/-的cho细胞(clone#4)只能在含谷氨酰胺的hycell培养基中生长,而在谷氨酰胺缺失的培养基则不能生长。而gs+/+的cho细胞则能在两者中皆能生长(图15)。我们用针对gs基因7号外显子的一对引物(seqidno:24和25)从clone#4基因组中扩增出被talen打靶的dna区域。用分子克隆技术分别进行测序,结果表明两条等位基因都被打靶失活了(图16)。为进一步验证gs-/-cho-k1株能用于外源基因的筛选,我们按上述电转的方法,将用于抗体基因表达并带有gs表达盒子的pdirect载体(10μg)导入gs-/-cho-k1细胞。电转后,细胞先用含谷氨酰胺的5%fbs-dmem培养基培养一天,然后用pbs洗涤两次,换作不含谷氨酰胺的hycell培养基,继续培养。8~10天后,当没有转外源gs基因的gs-/-cho-k1细胞都死亡时,接受了外源gs基因的gs-/-cho-k1细胞,于培养皿中出现抗性克隆。至此,我们用功能性生长实验证明了cho-k1细胞经talen处理后,#4克隆中不再带有功能性的gs基因。用同样的方法,我们也得到了fut8基因缺失的cho-f细胞的gs-/-克隆株(图17中的#1,#4,#5和#7)和gs-/-、gs-/-fut8-/-的cho-dg44细胞株。实施例7:cho细胞的人源糖基化改造为使cho细胞表达的抗体更具有类似人源抗体的糖基化(尤其是cho细胞所不能进行的α2,6位的唾液酸化),发明人采用前述建立的岩藻糖缺失的cho-ef细胞株为模型,进一步按实施例2中阐述的方法,转入负责特殊糖基合成的酶的基因。具体做法是:首先,为使cho细胞能进行原本不具有的α2,6位的唾液酸化,gt-p2a-st6基因(seqidno:40)被克隆到ptog3载体上,转化cho-ef细胞。将cho-ef细胞用含5%fbs的dmem培养在6孔板中。当细胞密度达到80%满时,用fugene6试剂(promega公司)同时转化1.0μg的带gt-p2a-st6基因的ptog3和20ng编码cre蛋白的pog231质粒(购自addgene)。由于此一步cre-loxp同源重组的效率非常之高,pog231的量不能太多否则效率反而下降,20ng的量是已滴定过的最优剂量。转化48小时后,将细胞用胰酶消化后,重新铺在两块10厘米平皿里,加800μg/ml的潮霉素b,筛选7~10天后,可见几百个克隆形成。10~14天后,用无菌枪头挑取形态好的克隆至48孔板中,继续用含5%fbs的dmem培养。当细胞在48孔板中长至80%满时,可胰酶消化,各个克隆分别种在两组48孔复孔中,其中一组用嘌呤霉素(10μg/ml)做药物试验,另一组留种。那些真正发生同源重组的正确克隆,其嘌呤霉素抗性基因是被潮霉素抗性基因置换掉的,故细胞应该显出对嘌呤霉素敏感。如果不敏感,则是随机整合事件。发明人因此获得了潮霉素抗性且嘌呤霉素敏感的cho-efs-6.1、cho-efs-6.3两株克隆。然后,细胞经biotin标记的植物凝集素sambucusnigralectin(sna)或biotin标记的植物凝集素maackiaamurensislectinii(malii)于4℃染色15分钟(原液稀释2000倍,至终浓度2.5μg/ml)。sna-biotin和malii-biotin购自美国vectorlaboratories,inc.公司(burlingame,ca)。细胞悬液加10mlmacs缓冲液,离心(1200rpm,5分钟)收集细胞,用1ml的macs缓冲液重悬。加pe标记的streptavidin(终浓度1μg/ml)4℃避光染色15分钟。streptavidin-pe购自美国ebioscience,inc.公司(sandiego,ca)。图18即显示获得的facs图谱。cho-f母细胞株不能表达α2,6位的唾液酸,sna染色呈阴性;但它们能表达α2,3位的唾液酸,故malii染色呈阳性。cho-efs-6.1、cho-efs-6.3两株克隆的sna染色和malii染色皆呈阳性,说明它们在原有α2,3位唾液酸化的基础上,也能进行α2,6位唾液酸化(图18a)。图18b则显示cho-efs-6.1克隆与母细胞株cho-f细胞相比,其表面植物凝集素erythrinacristagallilectin(ecl)的结合位点减少了。ecl-biotin也购自美国vectorlaboratories,inc.公司(burlingame,ca),染色方法同上。ecl特异识别半乳糖(galactose)。抗体糖链末端未被唾液酸封闭的半乳糖(galactose)和高甘露糖对抗体的体内分布和动力学影响很大。没有唾液酸化的抗体会被肝脏中的asialoglycoproteinreceptor(asgpr)结合并从血液中清除。带有高甘露糖的抗体也会被肝脏中的甘露糖受体(mannosereceptor,manr)结合并迅速清除。可以预期,由cho-efs-6.1或cho-efs-6.3细胞生产的抗体,更能抵御asgpr和manr的清除,故体内半衰期应更长,且免疫原性应更低。发明人选取经两次亚克隆后形态最好的cho-efs-6.1号细胞株,命名为cho-efs(3,6)(表2),其中数字3和6分别表示细胞株能同时进行α2,3位和α2,6位的末端唾液酸修饰。类似地,按前述方法,ptog3-gt-p2a-st6转入岩藻糖保有的cho-e细胞后建立了细胞株cho-es#3,#4,#5(图19),其中cho-es#3被命名为cho-es(3,6)(表2)。该细胞株的特征是:表达岩藻糖和α2,6位唾液酸(图19)。在本发明的另一个实施方案中,为使cho细胞能进行人类抗体的半乳糖化,促进补体激活能力,gt基因被克隆到ptog3载体上,转化cho-e或cho-ef细胞。所得到的潮霉素抗性且嘌呤霉素敏感的克隆分别被命名为cho-eg或cho-efg(表2)。至此,建立定向改造cho细胞糖基化(尤其是人源α2,6位唾液酸化)的方法,已经在本发明的实施例中得以确立。实施例8:用talen技术敲除cho细胞中的st3gal4和st3gal6基因即便是通过上述方法转入了人源α2,6位唾液酸化的酶基因,但由于cho细胞内源性的α2,3位唾液酸转移酶(主要是st3gal4和st3gal6这两个酶)的存在,糖蛋白末端唾液酸修饰会同时呈现α2,3和α2,6位链接的唾液酸,造成产物均一性的不可控性。此外,文献报道,利用体外酶化学修饰的方法证明,α2,3位链接的唾液酸对adcc是抑制的,而α2,6位链接的唾液酸则是一种最佳的形式,能在岩藻糖缺失的情况下更进一步提高adcc活性(lincwetal.procnatlacadsciusa.2015;112(34):10611-6)。为此,我们继续用talen技术对已获得的cho-es(3,6)和cho-efs(3,6)细胞株进行基因水平的改造,同时敲除其st3gal4和st3gal6酶基因。我们构建了针对cho细胞st3gal4基因第5号外显子的一对talen载体(seqidno:26-27显示编码talen蛋白的dna序列),分别命名为s3g4-1和s3g4-2,针对其的引物为seqidno:28-29。我们还构建了针对cho细胞st3gal6基因第2号外显子的一对talen载体(seqidno:30-31显示编码talen蛋白的dna序列),分别命名为s3g6-1和s3g6-2;针对其的引物为seqidno:32-33。取这四个miniprep制备的质粒各2μg,用电转方法导入2百万个cho-es(3,6)细胞或cho-efs(3,6)。电转仪是lifetech公司的neonelectroporation系统。电转条件是1620v,10ms,3次脉冲。电转后,cho细胞在含5%fbs的dmem培养基中培养8天,不加任何药物筛选。此一生长阶段是让那些st3gal4/6基因被破坏的克隆能充分地分裂,并通过细胞膜的周转代谢,稀释掉膜上原先带有α2,3位链接的唾液酸的糖蛋白或糖脂,而那些新产生的跨膜糖蛋白或糖脂则不带有α2,3位链接的唾液酸了。此后,st3-/-的cho细胞可用facs方法负筛选。具体做法是:细胞经biotin标记的植物凝集素maackiaamurensislectinii(malii)于4℃染色15分钟(原液稀释2000倍,至终浓度2.5μg/ml)。malii-biotin购自美国vectorlaboratories,inc.公司(burlingame,ca)。细胞用facs缓冲液洗涤,离心(1200rpm,5分钟)收集细胞,加pe标记的streptavidin(终浓度1μg/ml)4℃避光染色15分钟。streptavidin-pe购自美国ebioscience,inc.公司(sandiego,ca)。然后用moflo流式细胞仪分选malii阴性的细胞群(图20),并用96孔板亚克隆即得。表2列出了本发明中涉及或新制备的cho细胞株,及其基因型特征。其中,在cho-k1基础上敲除fut8基因之后的细胞株,被命名为cho-f。敲除gs基因之后的细胞株,被命名为cho-gs。双敲除gs和fut8基因之后的细胞株,被命名为cho-gsf。用cre-loxp方法定点转入srp-14-9-54、hero-l、hfgf9等基因,促进抗体高表达的细胞株,被命名为cho-e,其中“e”代表enhanced之意。在cho-e和cho-ef基础上,转入能进行人源α2,6位唾液酸化的gt和st6基因后的细胞株,分别被命名为cho-es(3,6)和cho-efs(3,6);转入能进行半乳糖苷化的gt基因后的细胞株,分别被命名为cho-eg和cho-efg。在cho-es(3,6)和cho-efs(3,6)基础上,用talen技术敲除cho细胞内源α2,3位唾液酸转移酶4/6基因后的细胞株,分别被命名为cho-es(6)和cho-efs(6)。在cho-dg44基础上敲除fut8基因之后的细胞株,被命名为cho-f(dg44)。敲除gs基因之后的细胞株,被命名为cho-gs(dg44)。双敲除gs和fut8基因之后的细胞株,被命名为cho-gsf(dg44)。表2实施例9:cho细胞人源糖基化改造后的效果时至今日,在抗体制药工业界,用野生型cho细胞生产抗体仍然是普遍现象。随着培养基的不断优化和发酵工艺的改进,所生产的抗体在量上虽已能达到下游纯化工艺的要求(2~5g/l),但也已经触及发展的瓶颈。另一方面,目前医用抗体在质上仍然具有很大的成长空间。本发明所构建的诸多基因改造的细胞株,主要侧重于后者,提出了具体的改进方案。例如,岩藻糖缺失的cho细胞株可以提高抗体的adcc活力50~100倍,大大降低了体内用量、毒副作用和生产成本。但其它形式的糖基改造,及其各种组合,对抗体的质的提升,尚未有很系统的探索。文献报道的体外酶化学修饰的方法,并不具有大规模工业化的可操作性。在本实施例中,我们提供了在基因水平上进行这些严格意义的、系统性探索的方法。例如,我们在togglein定点整合机制的确保下制备稳定细胞株,引入人源α2,6位唾液酸修饰所必需的gt和st6两个酶,制备了cho-es(3,6)和cho-efs(3,6)两个细胞株,以便头对头地比较在岩藻糖有无的情况下,唾液酸修饰对抗体adcc活性的影响。图21显示了野生型cho-k1和fut8-/-的cho-efs(3,6)细胞株表达的人igg1抗体的糖链massspec质谱分析。结果表明两者的糖链有很大的不同。后者不仅不带有岩藻糖,而且还带有更多的末端唾液酸。接着,我们分别用野生型(wt)cho-k1细胞株、岩藻糖缺失型(af)cho-f细胞株以及岩藻糖缺失并人源唾液酸化型(af+s)cho-efs(3,6)细胞株表达了抗肿瘤靶点gpc3的higg1抗体,并在体外测试了它们对gpc3阳性的huh7细胞的adcc效果。具体实验操作,参见实施例5中体外adcc测定的荧光素酶法。岩藻糖缺失抗体的adcc活力比野生型抗体的adcc活力要显著提高,而在岩藻糖缺失基础上增加唾液酸后,抗体的adcc活力又有提升(图22),这与文献报道的增加α2,6位唾液酸能在岩藻糖缺失基础上再进一步提升adcc也是相符合的(lincwetal.procnatlacadsciusa.2015;112(34):10611-6)。以此类推,我们提供的方法,也可比较岩藻糖有无情况下,末端仅带有α2,6位唾液酸而不带α2,3位唾液酸对抗体adcc的影响,或者末端半乳糖残基修饰对补体激活cdc活性的影响,等等。尽管已经对本发明的具体实施方式进行了详细说明和描述,但应当认识到,本发明不受所述具体实施方式的限制。本发明所提供的方法,不仅适用于cho-k1细胞株,也适用于cho-dg44等其它cho细胞株系。在不脱离本发明主旨和范围的情况下,可以对本发明做出各种改进、修饰和变化,而这些改进、修饰和变化均在本发明的范围之内。序列表<110>安泰吉(北京)生物技术有限公司<120>改造宿主细胞基因组的方法及其用途<130>dic18110048<160>40<170>siposequencelisting1.0<210>1<211>34<212>dna<213>人工序列(artificialsequence)<400>1ataacttcgtatagcatacattatacgaagttat34<210>2<211>34<212>dna<213>人工序列(artificialsequence)<400>2ataacttcgtatagtatagtatatacgaacggta34<210>3<211>34<212>dna<213>人工序列(artificialsequence)<400>3taccgttcgtatagtatagtatatacgaagttat34<210>4<211>33<212>dna<213>人工序列(artificialsequence)<400>4taccgttcgtatagtatagtaatacgaacggta33<210>5<211>34<212>dna<213>人工序列(artificialsequence)<400>5ataacttcgtataggctatagtatacgaacggta34<210>6<211>34<212>dna<213>人工序列(artificialsequence)<400>6taccgttcgtataggctatagtatacgaagttat34<210>7<211>34<212>dna<213>人工序列(artificialsequence)<400>7taccgttcgtataggctatagtatacgaacggta34<210>8<211>1001<212>dna<213>人工序列(artificialsequence)<400>8gggtgatgctggcgccgagtatgttgtggaatctactggcgtcttcaccaccatggagaa60ggctggggcccacttgaagggcggggccaagagggtcatcatctccgccccttctgctga120tgcccccatgtttgtgatgggtgtgaaccaagacaagtatgacaactccctcaagattgt180caggtgaggatggcagagggctgtggcaaagtgggcaagcaggggcaaggttacaggtgg240gcgagcctcctaacctgtctcttctcttcagcaatgcgtcctgcaccaccaactgcttag300cccccctggccaaggtcatccatgacaactttggcattgtggaaggactcatggtatgta360gttcatctgtttcatcctgccagcagtgggcgctgtggtgggggccctgcaagacctcac420tccctgcctctgtgtctttcagaccacggtccatgccatcactgccacccagaagactgt480ggatggcccctccgggaagctgtggcgtgatggccgtggggctgcccagaacatcatccc540tgcatccactggcgctgccaaggctgtgggcaaagtcatcccagagctgaacgggaagct600gactggcatggccttccgtgttcctacccccaacgtgtccgttgtggatctgacatgtcg660cctggagaaacctgtatgtctggggtgggctgagggttgtctctagtggtgaggttgggg720cttgagtagtcaccttgatttttgcccttaataggccaagtatgaggacatcaagaaggt780ggtgaagcaggcatctgagggcccactgaagggcatcctgggctacaccgaggaccaggt840tgtctcctgcgacttcaacagtgactcccactcttccacctttgatgctggggctggcat900tgctctcaatgacaactttgtaaagctcatttcctggtatgacaatgaatttggctacag960caacagagtggtggacctcatggcctacatggcctccaagg1001<210>9<211>501<212>prt<213>人工序列(artificialsequence)<400>9metalathrglutyrlysprothrvalargleualathrargaspasp151015valproargalavalargthrleualaalaalaphealaasptyrpro202530alathrarghisthrvalaspproasparghisilegluargvalthr354045gluleuglngluleupheleuthrargvalglyleuaspileglylys505560valtrpvalalaaspaspglyalaalavalalavaltrpthrthrpro65707580gluservalglualaglyalavalphealagluileglyserargmet859095alagluleuserglyserargleualaalaglnglnglnmetglugly100105110leuleualaprohisargprolysgluproalatrppheleualathr115120125valglyvalserproasphisglnglylysglyleuglyseralaval130135140valleuproglyvalglualaalagluargalaglyvalproalaphe145150155160leugluthrseralaproargasnleuprophetyrgluargleugly165170175phethrvalthralaaspvalgluvalprogluglyproargthrtrp180185190cysmetthrarglysproglyalaglysergluglyargglyserleu195200205leuthrcysglyaspvalglugluasnproglyprometvalserlys210215220glyglugluleuphethrglyvalvalproileleuvalgluleuasp225230235240glyaspvalasnglyhislyspheservalserglygluglyglugly245250255aspalathrtyrglylysleuthrleulyspheilecysthrthrgly260265270lysleuprovalprotrpprothrleuvalthrthrleuthrtyrgly275280285valglncyspheserargtyrproasphismetlysglnhisaspphe290295300phelysseralametprogluglytyrvalglngluargthrilephe305310315320phelysaspaspglyasntyrlysthrargalagluvallyspheglu325330335glyaspthrleuvalasnargilegluleulysglyileaspphelys340345350gluaspglyasnileleuglyhislysleuglutyrasntyrasnser355360365hisasnvaltyrilemetalaasplysglnlysasnglyilelysval370375380asnphelysilearghisasnilegluaspglyservalglnleuala385390395400asphistyrglnglnasnthrproileglyaspglyprovalleuleu405410415proaspasnhistyrleuserthrglnseralaleuserlysasppro420425430asnglulysargasphismetvalleuleugluphevalthralaala435440445glyilethrleuglymetaspgluleutyrlyslysleuserhisgly450455460pheproproalavalalaalaglnaspaspglythrleuprometser465470475480cysalaglngluserglymetasparghisproalaalacysalaser485490495alaargileasnval500<210>10<211>6128<212>dna<213>人工序列(artificialsequence)<400>10gggtgatgctggcgccgagtatgttgtggaatctactggcgtcttcaccaccatggagaa60ggctggggcccacttgaagggcggggccaagagggtcatcatctccgccccttctgctga120tgcccccatgtttgtgatgggtgtgaaccaagacaagtatgacaactccctcaagattgt180caggtgaggatggcagagggctgtggcaaagtgggcaagcaggggcaaggttacaggtgg240gcgagcctcctaacctgtctcttctcttcagcaatgcgtcctgcaccaccaactgcttag300cccccctggccaaggtcatccatgacaactttggcattgtggaaggactcatggtatgta360gttcatctgtttcatcctgccagcagtgggcgctgtggtgggggccctgcaagacctcac420tccctgcctctgtgtctttcagaccacggtccatgccatcactgccacccagaagactgt480ggatggcccctccgggaagctgtggcgtgatggccgtggggctgcccagaacatcatccc540tgcatccactggcgctgccaaggctgtgggcaaagtcatcccagagctgaacgggaagct600gactggcatggccttccgtgttcctacccccaacgtgtccgttgtggatctgacatgtcg660cctggagaaacctgtatgtctggggtgggctgagggttgtctctagtggtgaggttgggg720cttgagtagtcaccttgatttttgcccttaataggccaagtatgaggacatcaagaaggt780ggtgaagcaggcatctgagggcccactgaagggcatcctgggctacaccgaggaccaggt840tgtctcctgcgacttcaacagtgactcccactcttccacctttgatgctggggctggcat900tgctctcaatgacaactttgtaaagctcatttcctggtatgacaatgaatttggctacag960caacagagtggtggacctcatggcctacatggcctccaaggagggaggtgggaagttcct1020attccgaagttcctattcttcaaatagtataggaacttcgggcagcggagccaccaactt1080cagcctgctgaagcaggccggcgatgtggaggagaatcctggccccttggccaagttgac1140cagtgccgttccggtgctcaccgcgcgcgacgtcgccggagcggtcgagttctggaccga1200ccggctcgggttctcccgggacttcgtggaggacgacttcgccggtgtggtccgggacga1260cgtgaccctgttcatcagcgcggtccaggaccaggtggtgccggacaacaccctggcctg1320ggtgtgggtgcgcggcctggacgagctgtacgccgagtggtcggaggtcgtgtccacgaa1380cttccgggacgcctccgggccggccttgaccgagatcggcgagcagccgtgggggcggga1440gttcgccctgcgcgacccggccggcaactgcgtgcacttcgtggccgaggagcaggacgg1500cagcgagggcagaggcagcctgctgacctgcggcgacgtggaggagaaccccggccccat1560ggcttcgtacccctgccatcaacacgcgtctgcgttcgaccaggctgcgcgttctcgcgg1620ccatagcaaccgacgtacggcgttgcgccctcgccggcagcaagaagccacggaagtccg1680cctggagcagaaaatgcccacgctactgcgggtttatatagacggtcctcacgggatggg1740gaaaaccaccaccacgcaactgctggtggccctgggttcgcgcgacgatatcgtctacgt1800acccgagccgatgacttactggcaggtgctgggggcttccgagacaatcgcgaacatcta1860caccacacaacaccgcctcgaccagggtgagatatcggccggggacgcggcggtggtaat1920gacaagcgcccagataacaatgggcatgccttatgccgtgaccgacgccgttctggctcc1980tcatatcgggggggaggctgggagttcacatgccccgcccccggccctcaccctcatctt2040cgaccgccatcccatcgccgccctcctgtgctacccggccgcgcgataccttatgggcag2100catgaccccccaggccgtgctggcgttcgtggccctcatcccgccgaccttgcccggcac2160aaacatcgtgttgggggcccttccggaggacagacacatcgaccgcctggccaaacgcca2220gcgccccggcgagcggcttgacctggctatgctggccgcgattcgccgcgtttacgggct2280gcttgccaatacggtgcggtatctgcagggcggcgggtcgtggcgggaggattggggaca2340gctttcggggacggccgtgccgccccagggtgccgagccccagagcaacgcgggcccacg2400accccatatcggggacacgttatttaccctgtttcgggcccccgagttgctggcccccaa2460cggcgacctgtacaacgtgtttgcctgggccttggacgtcttggccaaacgcctccgtcc2520catgcacgtctttatcctggattacgaccaatcgcccgccggctgccgggacgccctgct2580gcaacttacctccgggatggtccagacccacgtcaccacccccggctccataccgacgat2640ctgcgacctggcgcgcacgtttgcccgggagatgggggaggctaactgaagttcctattc2700cgaagttcctattctctagaaagtataggaacttcatcataatcagccataccacatttg2760tagaggttttacttgctttaaaaaacctcccacacctccccctgaacctgaaacataaaa2820tgaatgcatttgttgttgttaacttgtttattgcagcttataatggttacaaataaagca2880atagcatcacaaatttcacaaataaagcatttttttcactgcattctagttgtggtttgt2940ccaaactcatcaatgtatcttatcatgtctcaattgtaccgggtagggtaggcgcttttc3000ccaaggcagtctggagcatgcgctttagcagccccgctgggcacttggcgctacacaagt3060ggcctctggcctcgcacacattccacatccaccggtaggcgccaaccggctccgttcttt3120ggtggccccttcgcgccaccttctactcctcccctagtcaggaagttcccccccgccccg3180cagctcgcgtcgtgcaggacgtgacaaatggaagtagcacgtctcactagtctcgtgcag3240atggacagcaccgctgagcaatggaagcgggtaggcctttggggcagcggccaatagcag3300ctttgctccttcgctttctgggctcagaggctgggaaggggtgggtccgggggcgggctc3360aggggcgggctcaggggcggggcgggcgcccgaaggtcctccggaggcccggcattctgc3420acgcttcaaaagcgcacgtctgccgcgctgttctcctcttcctcatctccgggcctttcg3480accataacttcgtatagcatacattatacgaagttatgccgccaccatggccaccgagta3540caagcccacggtgcgcctcgccacccgcgacgacgtcccccgggccgtacgcaccctcgc3600cgccgcgttcgccgactaccccgccacgcgccacaccgtcgacccggaccgccacatcga3660gcgggtcaccgagctgcaagaactcttcctcacgcgcgtcgggctcgacatcggcaaggt3720gtgggtcgcggacgacggcgccgcggtggcggtctggaccacgccggagagcgtcgaagc3780gggggcggtgttcgccgagatcggctcgcgcatggccgagttgagcggttcccggctggc3840cgcgcagcaacagatggaaggcctcctggcgccgcaccggcccaaggagcccgcgtggtt3900cctggccaccgtcggcgtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgt3960gctccccggagtggaggcggccgagcgcgctggggtgcccgccttcctggagacctccgc4020gccccgcaacctccccttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggt4080gcccgaaggaccgcgcacctggtgcatgacccgcaagcccggtgccggcagcgagggcag4140aggcagcctgctgacctgcggcgacgtggaggagaaccccggccccatggtgagcaaggg4200cgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacgg4260ccacaagttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccct4320gaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccct4380gacctacggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttctt4440caagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacgg4500caactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcga4560gctgaagggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaa4620ctacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaa4680cttcaagatccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagca4740gaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcaccca4800gtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgt4860gaccgccgccgggatcactctcggcatggacgagctgtacaagaagctcagccatggctt4920cccgccggcggtggcggcgcaggatgatggcacgctgcccatgtcttgtgcccaggagag4980cgggatggaccgtcaccctgcagcctgtgcttctgctaggatcaatgtataacttcgtat5040agtatagtatatacgaacggtagcggccgcgaagcccaccctggaccatccaccccagca5100aggactcgagcaagagggaggccctggctgctgagcagtccctgtccaataacccccaca5160ccgatcatctccctcacagtttccatcccagacccccagaataaggaggggcttagggag5220ccctactctcttgaataccatcaataaagttcactgcacccatcttccttggcctttcaa5280tgtaaggttgggggagggaggctgtgacctagcaaggttgggaatcctctgtgtcacttt5340tcaaacagggcactagccacatgccagcccaggtttcctgtcctgaacagatgaaaattc5400acctaaggtgtcttggtgctgggaggagtgggggttgacaatgggaccagtagtatggtc5460ttagaggcttgggctggactgcatcaagttccagggctgtgtgtgtgttatctgcaaaca5520aaggtcatttgtgtctggaggccttaggtaaaattggaaggatgcccaacatagtaaaaa5580tgtatcagccaggggaagtgactacactgtatctaacctgaaacagctgagctgtaagcc5640agcagctgtcactatgttcaggtgtggtccgctggttctggggtggtcacttgtatccag5700tttgttaggaagtgttgtcattgcttgttaggaagacaacacatctcaggctgggcagtg5760gtagtgcgtgcctctaatgccagcattcccagcacggaagtggcagaggcaggaggacag5820cctggaataacaacccagggcagagcccccatctcggaaaagacaaaaaccagaaagtgc5880ttaaaacattgacacaaaggtgctcaaatattccttcattgcttttagagattccactgt5940cagcttggcatggcctctagtgagacatcctgacttggtcccctgctttccaaggtcagg6000agaatgatagccacagaacgttccctcagctgatggctggagaaccggggtccctgagcc6060cccaccctcacacccatgtgcaggagggagcttcacctttccctccgagcagtgtctgcc6120ttcaggac6128<210>11<211>6208<212>dna<213>人工序列(artificialsequence)<400>11aaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctggatccataa60cttcgtatagcatacattatacgaagttatgccgccaccatgtggtggcgcctgtggtgg120ctgctgctgctgctgctgctgctgtggcccatggtgtgggctatgttccccgccatgccc180ctgagcagcctgttcgtgaacggccccagaaccctgtgcggcgccgagctggtggacgcc240ctgcagttcgtgtgcggcgaccggggcttctacttcaacaagcccaccggctacggcagc300agcagccggcgggccccccagaccggcatcgtggacgagtgctgcttcagaagctgcgac360ctgcggagactggagatgtactgcgcccccctgaagcccgccaagagcgccggcagcgag420ggcagaggcagcctgctgacctgcggcgacgtggaggagaaccccggccccatgaaccca480gccatcagcgtcgctctcctgctctcagtcttgcaggtgtcccgagggcagaaggtgacc540agcctgacagcctgcctggtgaaccaaaaccttcgcctggactgccgccatgagaataac600accaaggataactccatccagcatgagttcagcctgacccgagagaagaggaagcacgtg660ctctcaggcaccctcgggatacccgagcacacgtaccgctcccgcgtcaccctctccaac720cagccctatatcaaggtccttaccctagccaacttcaccaccaaggatgagggcgactac780ttttgtgagcttcgagtctcgggcgcgaatcccatgagctccaataaaagtatcagtgtg840tatagagacaaactggtcaagtgtggcggcataagcctgctggttcagaacacatcctgg900atgctgctgctgctgctttccctctccctcctccaagccctggacttcatttctctgggc960agccagtgcacaaactacgccctgctgaaactggccggagatgtggaaagcaaccccgga1020cccaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgac1080agcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgat1140gtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagat1200cgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacatt1260ggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttg1320caagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggat1380gcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaagga1440atcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtat1500cactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgag1560ctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggc1620tccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcg1680atgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggct1740tgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccg1800cggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgac1860ggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccgga1920gccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggc1980tgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaag2040gaatagaagcttatcataatcagccataccacatttgtagaggttttacttgctttaaaa2100aacctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttaac2160ttgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaat2220aaagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttat2280catgtctgataacttcgtataggctatagtatacgaacggtacgtgaggctccggtgccc2340gtcagtgggcagagcgcacatcgcccacagtccccgagaagttggggggaggggtcggca2400attgaaccggtgcctagagaaggtggcgcggggtaaactgggaaagtgatgtcgtgtact2460ggctccgcctttttcccgagggtgggggagaaccgtatataagtgcagtagtcgccgtga2520acgttctttttcgcaacgggtttgccgccagaacacaggtaagtgccgtgtgtggttccc2580gcgggcctggcctctttacgggttatggcccttgcgtgccttgaattacttccacctggc2640tgcagtacgtgattcttgatcccgagcttcgggttggaagtgggtgggagagttcgaggc2700cttgcgcttaaggagccccttcgcctcgtgcttgagttgaggcctggcctgggcgctggg2760gccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcgctgctttcgataagtctc2820tagccatttaaaatttttgatgacctgctgcgacgctttttttctggcaagatagtcttg2880taaatgcgggccaagatctgcacactggtatttcggtttttggggccgcgggcggcgacg2940gggcccgtgcgtcccagcgcacatgttcggcgaggcggggcctgcgagcgcggccaccga3000gaatcggacgggggtagtctcaagctggccggcctgctctggtgcctggcctcgcgccgc3060cgtgtatcgccccgccctgggcggcaaggctggcccggtcggcaccagttgcgtgagcgg3120aaagatggccgcttcccggccctgctgcagggagctcaaaatggaggacgcggcgctcgg3180gagagcgggcgggtgagtcacccacacaaaggaaaagggcctttccgtcctcagccgtcg3240cttcatgtgactccacggagtaccgggcgccgtccaggcacctcgattagttctggagct3300tttggagtacgtcgtctttaggttggggggaggggttttatgcgatggagtttccccaca3360ctgagtgggtggagactgaagttaggccagcttggcacttgatgtaattctccttggaat3420ttgccctttttgagtttggatcttggttcattctcaagcctcagacagtggttcaaagtt3480tttttcttccatttcaggtgtcgtgaacgcgtcgccaccatgagcgatagcactgagaac3540gtcatcaagcccttcatgcgcttcaaggtgcacatggagggctccgtgaacggccacgag3600ttcgagatcgagggcgagggcgagggcaagccctacgagggcacccagaccgccaagctg3660caggtgaccaagggcggccccctgcccttcgcctgggacatcctgtccccccagttccag3720tacggctccaaggtgtacgtgaagcaccccgccgacatccccgactacaagaagctgtcc3780ttccccgagggcttcaagtgggagcgcgtgatgaacttcgaggacggcggcgtggtgacc3840gtgacccaggactcctccctgcaggacggcaccttcatctaccacgtgaagttcatcggc3900gtgaacttcccctccgacggccccgtaatgcagaagaagactctgggctgggagccctcc3960accgagcgcctgtacccccgcgacggcgtgctgaagggcgagatccacaaggcgctgaag4020ctgaagggcggcggccactacctggtggagttcaagtcaatctacatggccaagaagccc4080gtgaagctgcccggctactactacgtggactccaagctggacatcacctcccacaacgag4140gactacaccgtggtggagcagtacgagcgcgccgaggcccgccaccacctgttccagtag4200ctcgaggactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttc4260cttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatc4320gcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaaggg4380ggaggattgggaagagaatagcaggcatggcggccgctaccgttcgtatagtatagtata4440tacgaagttatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttg4500ctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagt4560cagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctcc4620ctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctccct4680tcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtc4740gttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgcctta4800tccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagca4860gccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaag4920tggtggcctaactacggctacactagaaggacagtatttggtatctgcgctctgctgaag4980ccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggt5040agcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaa5100gatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggg5160attttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatga5220agttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgctta5280atcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactc5340cccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatg5400ataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccgga5460agggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgt5520tgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccatt5580gctgcaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcc5640caacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttc5700ggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggca5760gcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgag5820tactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcg5880tcaacacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaa5940cgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaa6000cccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtga6060gcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttga6120atactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatg6180agcggatacatatttgaatgtatttaga6208<210>12<211>5932<212>dna<213>人工序列(artificialsequence)<400>12aaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctggatccataa60cttcgtatagcatacattatacgaagttatgccgccaccatggccaccgagtacaagccc120acggtgcgcctcgccacccgcgacgacgtcccccgggccgtacgcaccctcgccgccgcg180ttcgccgactaccccgccacgcgccacaccgtcgacccggaccgccacatcgagcgggtc240accgagctgcaagaactcttcctcacgcgcgtcgggctcgacatcggcaaggtgtgggtc300gcggacgacggcgccgcggtggcggtctggaccacgccggagagcgtcgaagcgggggcg360gtgttcgccgagatcggctcgcgcatggccgagttgagcggttcccggctggccgcgcag420caacagatggaaggcctcctggcgccgcaccggcccaaggagcccgcgtggttcctggcc480accgtcggcgtctcgcccgaccaccagggcaagggtctgggcagcgccgtcgtgctcccc540ggagtggaggcggccgagcgcgctggggtgcccgccttcctggagacctccgcgccccgc600aacctccccttctacgagcggctcggcttcaccgtcaccgccgacgtcgaggtgcccgaa660ggaccgcgcacctggtgcatgacccgcaagcccggtgccggcagcgagggcagaggcagc720ctgctgacctgcggcgacgtggaggagaaccccggccccatggtgagcaagggcgaggag780ctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaag840ttcagcgtgtccggcgagggcgagggcgatgccacctacggcaagctgaccctgaagttc900atctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctac960ggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtcc1020gccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggacgacggcaactac1080aagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaag1140ggcatcgacttcaaggaggacggcaacatcctggggcacaagctggagtacaactacaac1200agccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaag1260atccgccacaacatcgaggacggcagcgtgcagctcgccgaccactaccagcagaacacc1320cccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccgcc1380ctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgcc1440gccgggatcactctcggcatggacgagctgtacaagaagctcagccatggcttcccgccg1500gcggtggcggcgcaggatgatggcacgctgcccatgtcttgtgcccaggagagcgggatg1560gaccgtcaccctgcagcctgtgcttctgctaggatcaatgtgtagaagcttatcataatc1620agccataccacatttgtagaggttttacttgctttaaaaaacctcccacacctccccctg1680aacctgaaacataaaatgaatgcaattgttgttgttaacttgtttattgcagcttataat1740ggttacaaataaagcaatagcatcacaaatttcacaaataaagcatttttttcactgcat1800tctagttgtggtttgtccaaactcatcaatgtatcttatcatgtctgataacttcgtata1860gtatagtatatacgaacggtacgtgaggctccggtgcccgtcagtgggcagagcgcacat1920cgcccacagtccccgagaagttggggggaggggtcggcaattgaaccggtgcctagagaa1980ggtggcgcggggtaaactgggaaagtgatgtcgtgtactggctccgcctttttcccgagg2040gtgggggagaaccgtatataagtgcagtagtcgccgtgaacgttctttttcgcaacgggt2100ttgccgccagaacacaggtaagtgccgtgtgtggttcccgcgggcctggcctctttacgg2160gttatggcccttgcgtgccttgaattacttccacctggctgcagtacgtgattcttgatc2220ccgagcttcgggttggaagtgggtgggagagttcgaggccttgcgcttaaggagcccctt2280cgcctcgtgcttgagttgaggcctggcctgggcgctggggccgccgcgtgcgaatctggt2340ggcaccttcgcgcctgtctcgctgctttcgataagtctctagccatttaaaatttttgat2400gacctgctgcgacgctttttttctggcaagatagtcttgtaaatgcgggccaagatctgc2460acactggtatttcggtttttggggccgcgggcggcgacggggcccgtgcgtcccagcgca2520catgttcggcgaggcggggcctgcgagcgcggccaccgagaatcggacgggggtagtctc2580aagctggccggcctgctctggtgcctggcctcgcgccgccgtgtatcgccccgccctggg2640cggcaaggctggcccggtcggcaccagttgcgtgagcggaaagatggccgcttcccggcc2700ctgctgcagggagctcaaaatggaggacgcggcgctcgggagagcgggcgggtgagtcac2760ccacacaaaggaaaagggcctttccgtcctcagccgtcgcttcatgtgactccacggagt2820accgggcgccgtccaggcacctcgattagttctggagcttttggagtacgtcgtctttag2880gttggggggaggggttttatgcgatggagtttccccacactgagtgggtggagactgaag2940ttaggccagcttggcacttgatgtaattctccttggaatttgccctttttgagtttggat3000cttggttcattctcaagcctcagacagtggttcaaagtttttttcttccatttcaggtgt3060cgtgaacgcgtgccgccaccatggtgagcaagggcgaggagctgttcaccggggtggtgc3120ccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagg3180gcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagc3240tgcccgtgccctggcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagcc3300gctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacg3360tccaggagcgcaccatcttcttcaaggacgacggcaactacaagacccgcgccgaggtga3420agttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggagg3480acggcaacatcctggggcacaagctggagtacaactacaacagccacaacgtctatatca3540tggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatcgagg3600acggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccg3660tgctgctgcccgacaaccactacctgagcacccagtccgccctgagcaaagaccccaacg3720agaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggca3780tggacgagctgtacaagaagctcagccatggcttcccgccggcggtggcggcgcaggatg3840atggcacgctgcccatgtcttgtgcccaggagagcgggatggaccgtcaccctgcagcct3900gtgcttctgctaggatcaatgtataactcgaggactgtgccttctagttgccagccatct3960gttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctt4020tcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctgggg4080ggtggggtggggcaggacagcaagggggaggattgggaagagaatagcaggcatggcggc4140ctaccgttcgtataggctatagtatacgaagttatgtgagcaaaaggccagcaaaaggcc4200aggaaccgtaaaaaggccgcgttgctggcgtttttccataggctccgcccccctgacgag4260catcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagatac4320caggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttacc4380ggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgt4440aggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaacccccc4500gttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaaga4560cacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgta4620ggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaaggacagta4680tttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttga4740tccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacg4800cgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcag4860tggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacc4920tagatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaact4980tggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctattt5040cgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggctta5100ccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagattta5160tcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatcc5220gcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaat5280agtttgcgcaacgttgttgccattgctgcaggcatcgtggtgtcacgctcgtcgtttggt5340atggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttg5400tgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgca5460gtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgta5520agatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcgg5580cgaccgagttgctcttgcccggcgtcaacacgggataataccgcgccacatagcagaact5640ttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccg5700ctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatctttt5760actttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaaggga5820ataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagc5880atttatcagggttattgtctcatgagcggatacatatttgaatgtatttaga5932<210>13<211>1026<212>dna<213>人工序列(artificialsequence)<400>13atgaaaaagcctgaactcaccgcgacgtctgtcgagaagtttctgatcgaaaagttcgac60agcgtctccgacctgatgcagctctcggagggcgaagaatctcgtgctttcagcttcgat120gtaggagggcgtggatatgtcctgcgggtaaatagctgcgccgatggtttctacaaagat180cgttatgtttatcggcactttgcatcggccgcgctcccgattccggaagtgcttgacatt240ggggaattcagcgagagcctgacctattgcatctcccgccgtgcacagggtgtcacgttg300caagacctgcctgaaaccgaactgcccgctgttctgcagccggtcgcggaggccatggat360gcgatcgctgcggccgatcttagccagacgagcgggttcggcccattcggaccgcaagga420atcggtcaatacactacatggcgtgatttcatatgcgcgattgctgatccccatgtgtat480cactggcaaactgtgatggacgacaccgtcagtgcgtccgtcgcgcaggctctcgatgag540ctgatgctttgggccgaggactgccccgaagtccggcacctcgtgcacgcggatttcggc600tccaacaatgtcctgacggacaatggccgcataacagcggtcattgactggagcgaggcg660atgttcggggattcccaatacgaggtcgccaacatcttcttctggaggccgtggttggct720tgtatggagcagcagacgcgctacttcgagcggaggcatccggagcttgcaggatcgccg780cggctccgggcgtatatgctccgcattggtcttgaccaactctatcagagcttggttgac840ggcaatttcgatgatgcagcttgggcgcagggtcgatgcgacgcaatcgtccgatccgga900gccgggactgtcgggcgtacacaaatcgcccgcagaagcgcggccgtctggaccgatggc960tgtgtagaagtactcgccgatagtggaaaccgacgccccagcactcgtccgagggcaaag1020gaatag1026<210>14<211>1184<212>dna<213>人工序列(artificialsequence)<400>14cgtgaggctccggtgcccgtcagtgggcagagcgcacatcgcccacagtccccgagaagt60tggggggaggggtcggcaattgaaccggtgcctagagaaggtggcgcggggtaaactggg120aaagtgatgtcgtgtactggctccgcctttttcccgagggtgggggagaaccgtatataa180gtgcagtagtcgccgtgaacgttctttttcgcaacgggtttgccgccagaacacaggtaa240gtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgcctt300gaattacttccacctggctgcagtacgtgattcttgatcccgagcttcgggttggaagtg360ggtgggagagttcgaggccttgcgcttaaggagccccttcgcctcgtgcttgagttgagg420cctggcctgggcgctggggccgccgcgtgcgaatctggtggcaccttcgcgcctgtctcg480ctgctttcgataagtctctagccatttaaaatttttgatgacctgctgcgacgctttttt540tctggcaagatagtcttgtaaatgcgggccaagatctgcacactggtatttcggtttttg600gggccgcgggcggcgacggggcccgtgcgtcccagcgcacatgttcggcgaggcggggcc660tgcgagcgcggccaccgagaatcggacgggggtagtctcaagctggccggcctgctctgg720tgcctggcctcgcgccgccgtgtatcgccccgccctgggcggcaaggctggcccggtcgg780caccagttgcgtgagcggaaagatggccgcttcccggccctgctgcagggagctcaaaat840ggaggacgcggcgctcgggagagcgggcgggtgagtcacccacacaaaggaaaagggcct900ttccgtcctcagccgtcgcttcatgtgactccacggagtaccgggcgccgtccaggcacc960tcgattagttctggagcttttggagtacgtcgtctttaggttggggggaggggttttatg1020cgatggagtttccccacactgagtgggtggagactgaagttaggccagcttggcacttga1080tgtaattctccttggaatttgccctttttgagtttggatcttggttcattctcaagcctc1140agacagtggttcaaagtttttttcttccatttcaggtgtcgtga1184<210>15<211>1506<212>dna<213>人工序列(artificialsequence)<400>15atggccaccgagtacaagcccacggtgcgcctcgccacccgcgacgacgtcccccgggcc60gtacgcaccctcgccgccgcgttcgccgactaccccgccacgcgccacaccgtcgacccg120gaccgccacatcgagcgggtcaccgagctgcaagaactcttcctcacgcgcgtcgggctc180gacatcggcaaggtgtgggtcgcggacgacggcgccgcggtggcggtctggaccacgccg240gagagcgtcgaagcgggggcggtgttcgccgagatcggctcgcgcatggccgagttgagc300ggttcccggctggccgcgcagcaacagatggaaggcctcctggcgccgcaccggcccaag360gagcccgcgtggttcctggccaccgtcggcgtctcgcccgaccaccagggcaagggtctg420ggcagcgccgtcgtgctccccggagtggaggcggccgagcgcgctggggtgcccgccttc480ctggagacctccgcgccccgcaacctccccttctacgagcggctcggcttcaccgtcacc540gccgacgtcgaggtgcccgaaggaccgcgcacctggtgcatgacccgcaagcccggtgcc600ggcagcgagggcagaggcagcctgctgacctgcggcgacgtggaggagaaccccggcccc660atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggac720ggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctac780ggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccacc840ctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag900cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttc960ttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctg1020gtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcac1080aagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaac1140ggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgcc1200gaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac1260tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtc1320ctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagaag1380ctcagccatggcttcccgccggcggtggcggcgcaggatgatggcacgctgcccatgtct1440tgtgcccaggagagcgggatggaccgtcaccctgcagcctgtgcttctgctaggatcaat1500gtataa1506<210>16<211>19<212>prt<213>人工序列(artificialsequence)<400>16alathrasnpheserleuleulysglnalaglyaspvalglugluasn151015proglypro<210>17<211>2256<212>dna<213>人工序列(artificialsequence)<400>17atggtgttgttggagagcgagcagttcctgacggagctgaccagacttttccagaagtgc60cggacgtcgggcagcgtctatatcaccttgaagaagtatgacggtcgaaccaaacccatt120ccaaagaaaggtactgtggagggctttgagcccgcagacaacaagtgtctgttaagagct180accgatgggaagaagaagatcagcactgtggtgagctccaaggaagtgaataagtttcag240atggcttattcaaacctccttagagctaacatggatgggttgaagaagagagacaaaaag300aacaaaactaagaagaccaaagcagcagcagcagcagcagcagcagcacctgccgcagca360gcaacagcagcacagggcagcgagggaaggggaagcctgctcacatgcggcgacgtcgaa420gagaaccctggccccatgccgcagtaccagacctgggaggagttcagccgcgctgccgag480aagctttacctcgctgaccctatgaaggcacgtgtggttctcaaatataggcattctgat540gggaacttgtgtgttaaagtaacagatgatttagttagacagtgtcttgctctattgctc600aggctgcagtgcagtggcatgatcatagctcactgcatcctcgacctcctgggctcaagc660ggtcctcttgcttcagcctccggagccaccaacttcagcctgctgaagcaggccggcgat720gtggaggagaatcctggccccatggttctagcagaccttggaagaaaaataacatcagca780ttacgctcgttgagcaatgccaccattatcaatgaagaggtattgaatgctatgctaaaa840gaagtctgtaccgctttgttggaagcagatgttaatattaaactagtgaagcaactaaga900gaaaatgttaagtctgctattgatcttgaagagatggcatctggtcttaacaaaagaaaa960atgattcagcatgctgtatttaaagaacttgtgaagcttgtagaccctggagttaaggca1020tggacacccactaaaggaaaacaaaatgtgattatgtttgttggattgcaagggagtggt1080aaaacaacaacatgttcaaagctagcatattattaccagaggaaaggttggaagacctgt1140ttaatatgtgcagacacattcagagcaggggcttttgaccaactaaaacagaatgctacc1200aaagcaagaattccattttatggaagctatacagaaatggatcctgtcatcattgcttct1260gaaggagtagagaaatttaaaaatgaaaattttgaaattattattgttgatacaagtggc1320cgccacaaacaagaagactctttgtttgaagaaatgcttcaagttgctaatgctatacaa1380cctgataacattgtttatgtgatggatgcctccattgggcaggcttgtgaagcccaggct1440aaggcttttaaagataaagtagatgtagcctcagtaatagtgacaaaacttgatggccat1500gcaaaaggaggtggtgcactcagtgcagtcgctgccacaaaaagtccgattattttcatt1560ggtacaggggaacatatagatgactttgaacctttcaaaacacagccttttattagcaaa1620cttcttggtatgggcgacattgaaggactgatagataaagtcaacgagttgaagttggat1680gacaatgaagcacttatagagaagttgaaacatggtcagtttacgttgcgagacatgtat1740gagcaatttcaaaatatcatgaaaatgggccccttcagtcagatcttggggatgatccct1800ggttttgggacagattttatgagcaaaggaaatgaacaggagtcaatggcaaggctaaag1860aaattaatgacaataatggatagtatgaatgatcaagaactagacagtacggatggtgcc1920aaagtttttagtaaacaaccaggaagaatccaaagagtagcaagaggatcgggtgtatca1980acaagagatgttcaagaacttttgacacaatataccaagtttgcacagatggtaaaaaag2040atgggaggtatcaaaggacttttcaaaggtggcgacatgtctaagaatgtgagccagtca2100cagatggcaaaattgaaccaacaaatggccaaaatgatggatcctagggttcttcatcac2160atgggtggtatggcaggacttcagtcaatgatgaggcagtttcaacagggtgctgctggc2220aacatgaaaggcatgatgggattcaataatatgtaa2256<210>18<211>3216<212>dna<213>人工序列(artificialsequence)<400>18atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggaggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380atcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaac2400atcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>19<211>3216<212>dna<213>人工序列(artificialsequence)<400>19atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggagggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagccatgacgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380atcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacggagggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatcccat2400gacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>20<211>24<212>dna<213>人工序列(artificialsequence)<400>20taaatctgttgattccaggttccc24<210>21<211>26<212>dna<213>人工序列(artificialsequence)<400>21gtactaagaagtgtggtactgtgttg26<210>22<211>3222<212>dna<213>人工序列(artificialsequence)<400>22atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgac60gacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatg120gtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtg180agaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccac240atcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggac300atgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtgg360agcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggccccccc420ctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtg480gaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgac540caagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacgg600ctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcc660tcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgt720caagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaag780caagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttaca840cccgagcaagtcgtggccattgcatcaaacatcggtggcaaacaggctcttgagactgtt900cagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggcc960attgccagcaacaacggagggaaacaagcattggagactgtccaacggctccttcccgtg1020ttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggc1080ggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatgga1140ctgaccccagaccaggttgtcgccatcgcctctaacatcgggggaaagcaagccctggaa1200accgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtc1260gtggccattgcatcaaacatcggtggcaaacaggctcttgagactgttcagagacttctc1320ccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagccat1380gacggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcc1440cacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggcc1500ctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagac1560caggtggtcgcaatcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaagg1620ttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgca1680tcaaacatcggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgc1740caggcacacgggcttactcccgatcaagttgtggccattgccagcaacaacggagggaaa1800caagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacc1860cctgcacaagtggtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtg1920cagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgcc1980atcgcctctaacatcgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtc2040ctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacatcggt2100ggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggt2160ttgacacccgaccaagttgtggccattgccagcaacaacggagggaaacaagcattggag2220actgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtg2280gtcgccatcgcctcccatgacggcggtaagcaggccctggaaacagtgcaacggttgctc2340cctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaac2400aacggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgcc2460ctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgcc2520ctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacaga2580agaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctg2640gaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgag2700ctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggag2760ttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgac2820ggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcc2880tacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggag2940gagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagc3000agcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcc3060cagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggag3120ctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaaga3180aagttcaacaacggcgagatcaacttcagaagctctagatga3222<210>23<211>3222<212>dna<213>人工序列(artificialsequence)<400>23atggactacaaggaccacgacggcgactacaaggaccacgacatcgactacaaggacgac60gacgacaagatggcccccaagaagaagagaaaggtgggcatccacagaggcgtgcccatg120gtggacctgagaaccctgggctacagccagcagcagcaggagaagatcaagcccaaggtg180agaagcaccgtggcccagcaccacgaggccctggtgggccacggcttcacccacgcccac240atcgtggccctgagccagcaccccgccgccctgggcaccgtggccgtgaagtaccaggac300atgatcgccgccctgcccgaggccacccacgaggccatcgtgggcgtgggcaagcagtgg360agcggcgccagagccctggaggccctgctgaccgtggccggcgagctgagaggccccccc420ctccagctggacaccggccagctgctgaagatcgccaagagaggcggcgtgaccgccgtg480gaggccgtgcacgcctggagaaacgccctgaccggcgcccccctgaatttgacacccgac540caagttgtggccattgccagcaacggtggagggaaacaagcattggagactgtccaacgg600ctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcc660tccaacaacggcggtaagcaggccctggaaacagtgcaacggttgctccctgtcttgtgt720caagatcatggactgaccccagaccaggtggtcgcaatcgcctctaacaacgggggaaag780caagccctggaaaccgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttaca840cccgagcaagtcgtggccattgcatcaaacaacggtggcaaacaggctcttgagactgtt900cagagacttctcccagttctctgccaggcacacgggcttactcccgatcaagttgtggcc960attgccagcaacatcggagggaaacaagcattggagactgtccaacggctccttcccgtg1020ttgtgtcaagcccacggtttgacccctgcacaagtggtcgccatcgcctccaacggtggc1080ggtaagcaggccctggaaacagtgcagcgcctgctgcctgtgctgtgccaggatcatgga1140ctgaccccagaccaggttgtcgccatcgcctctcatgacgggggaaagcaagccctggaa1200accgtgcaaaggttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtc1260gtggccattgcatcaaacaacggtggcaaacaggctcttgagactgttcagagacttctc1320ccagttctctgtcaagcccacggtttgacacccgaccaagttgtggccattgccagcaac1380ggtggagggaaacaagcattggagactgtccaacggctccttcccgtgttgtgtcaagcc1440cacggtttgacccctgcacaagtggtcgccatcgcctccaacatcggcggtaagcaggcc1500ctggaaacagtgcaacggttgctccctgtcttgtgtcaagatcatggactgaccccagac1560caggtggtcgcaatcgcctctaacaacgggggaaagcaagccctggaaaccgtgcaaagg1620ttgttgcccgtcctttgtcaagaccacggccttacacccgagcaagtcgtggccattgca1680tcaaacaacggtggcaaacaggctcttgagactgttcagagacttctcccagttctctgc1740caggcacacgggcttactcccgatcaagttgtggccattgccagccatgacggagggaaa1800caagcattggagactgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacc1860cctgcacaagtggtcgccatcgcctccaacggtggcggtaagcaggccctggaaacagtg1920cagcgcctgctgcctgtgctgtgccaggatcatggactgaccccagaccaggttgtcgcc1980atcgcctctcatgacgggggaaagcaagccctggaaaccgtgcaaaggttgttgcccgtc2040ctttgtcaagaccacggccttacacccgagcaagtcgtggccattgcatcaaacaacggt2100ggcaaacaggctcttgagactgttcagagacttctcccagttctctgtcaagcccacggt2160ttgacacccgaccaagttgtggccattgccagcaacatcggagggaaacaagcattggag2220actgtccaacggctccttcccgtgttgtgtcaagcccacggtttgacccctgcacaagtg2280gtcgccatcgcctccaacatcggcggtaagcaggccctggaaacagtgcaacggttgctc2340cctgtcttgtgtcaagaccatgggctgacccccgagcaggtggtggccatcgccagcaac2400ggtggcggcagacccgccctggagagcatcgtggcccagctgagcagacccgaccccgcc2460ctggccgccctgaccaacgaccacctggtggccctggcctgcctgggcggcagacccgcc2520ctggacgccgtgaagaagggcctgccccacgcccccgccctgatcaagagaaccaacaga2580agaatccccgagagaaccagccacagagtggccggcagccagctggtgaagagcgagctg2640gaggagaagaagagcgagctgagacacaagctgaagtacgtgccccacgagtacatcgag2700ctgatcgagatcgccagaaacagcacccaggacagaatcctggagatgaaggtgatggag2760ttcttcatgaaggtgtacggctacagaggcaagcacctgggcggcagcagaaagcccgac2820ggcgccatctacaccgtgggcagccccatcgactacggcgtgatcgtggacaccaaggcc2880tacagcggcggctacaacctgcccatcggccaggccgacgagatgcagagatacgtggag2940gagaaccagaccagaaacaagcacatcaaccccaacgagtggtggaaggtgtaccccagc3000agcgtgaccgagttcaagttcctgttcgtgagcggccacttcaagggcaactacaaggcc3060cagctgaccagactgaaccacatcaccaactgcaacggcgccgtgctgagcgtggaggag3120ctgctgatcggcggcgagatgatcaaggccggcaccctgaccctggaggaggtgagaaga3180aagttcaacaacggcgagatcaacttcagaagctctagatga3222<210>24<211>24<212>dna<213>人工序列(artificialsequence)<400>24ttgtacccgttggagaagtgacag24<210>25<211>27<212>dna<213>人工序列(artificialsequence)<400>25gatgaactaggaaaggctcaagatcac27<210>26<211>3216<212>dna<213>人工序列(artificialsequence)<400>26atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacggaggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380atcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaac2400aacgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>27<211>3216<212>dna<213>人工序列(artificialsequence)<400>27atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacaacggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380atcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaac2400atcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>28<211>22<212>dna<213>人工序列(artificialsequence)<400>28ctaaaggctgctcccactctac22<210>29<211>22<212>dna<213>人工序列(artificialsequence)<400>29caaagtggaacttgggttgagg22<210>30<211>3216<212>dna<213>人工序列(artificialsequence)<400>30atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagccacgacggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380ggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagccacgacgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaac2400ggcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>31<211>3216<212>dna<213>人工序列(artificialsequence)<400>31atggactataaggaccacgacggagactacaaggatcatgatattgattacaaagacgat60gacgataagatggccccaaagaagaagcggaaggtcggtatccacggagtcccagcagcc120gtagatttgagaactttgggatattcacagcagcagcaggaaaagatcaagcccaaagtg180aggtcgacagtcgcgcagcatcacgaagcgctggtgggtcatgggtttacacatgcccac240atcgtagccttgtcgcagcaccctgcagcccttggcacggtcgccgtcaagtaccaggac300atgattgcggcgttgccggaagccacacatgaggcgatcgtcggtgtggggaaacagtgg360agcggagcccgagcgcttgaggccctgttgacggtcgcgggagagctgagagggcctccc420cttcagctggacacgggccagttgctgaagatcgcgaagcggggaggagtcacggcggtc480gaggcggtgcacgcgtggcgcaatgcgctcacgggagcacccctcaacctgaccccagag540caggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagagg600ttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtcgtggcaattgcg660agcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc720caagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaag780caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgggttgacc840ccagagcaggtcgtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtc900cagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagagcaggtcgtggca960attgcgagcaacatcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg1020ctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcgagcaacatcggg1080ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacgga1140cttacacccgaacaagtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaa1200accgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacgccagagcaggtc1260gtggcaattgcgagccacgacgggggaaagcaggcactcgaaaccgtccagaggttgctg1320cctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggcaattgcgagcaac1380atcgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcg1440cacgggttgaccccagagcaggtcgtggcaattgcgagcaacaacgggggaaagcaggca1500ctcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggcctgaccccagag1560caggtcgtggcaattgcgagcaacggcgggggaaagcaggcactcgaaaccgtccagagg1620ttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtcgtggcaattgcg1680agcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgc1740caagcgcacggcctcaccccagagcaggtcgtggcaattgcgagcaacggcgggggaaag1800caggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggacttacg1860ccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaaaccgtc1920cagaggttgctgcctgtgctgtgccaagcgcacggactaaccccagagcaggtcgtggca1980attgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctgcctgtg2040ctgtgccaagcgcacgggttgaccccagagcaggtcgtggcaattgcgagcaacggcggg2100ggaaagcaggcactcgaaaccgtccagaggttgctgcctgtgctgtgccaagcgcacggc2160ctgaccccagagcaggtcgtggcaattgcgagcaacatcgggggaaagcaggcactcgaa2220accgtccagaggttgctgcctgtgctgtgccaagcgcacggactgacaccagagcaggtc2280gtggcaattgcgagcaacaacgggggaaagcaggcactcgaaaccgtccagaggttgctg2340cctgtgctgtgccaagcgcacggactcacgcctgagcaggtagtggctattgcatccaac2400atcgggggcagacccgcactggagtcaatcgtggcccagctttcgaggccggaccccgcg2460ctggccgcactcactaatgatcatcttgtagcgctggcctgcctcggcggacgacccgcc2520ttggatgcggtgaagaaggggctcccgcacgcgcctgcattgattaagcggaccaacaga2580aggattcccgagaggacatcacatcgagtggcaggttcccaactcgtgaagagtgaactt2640gaggagaaaaagtcggagctgcggcacaaattgaaatacgtaccgcatgaatacatcgaa2700cttatcgaaattgctaggaactcgactcaagacagaatccttgagatgaaggtaatggag2760ttctttatgaaggtttatggataccgagggaagcatctcggtggatcacgaaaacccgac2820ggagcaatctatacggtggggagcccgattgattacggagtgatcgtcgacacgaaagcc2880tacagcggtgggtacaatcttcccatcgggcaggcagatgagatgcaacgttatgtcgaa2940gaaaatcagaccaggaacaaacacatcaatccaaatgagtggtggaaagtgtatccttca3000tcagtgaccgagtttaagtttttgtttgtctctgggcatttcaaaggcaactataaggcc3060cagctcacacggttgaatcacattacgaactgcaatggtgcggttttgtccgtagaggaa3120ctgctcattggtggagaaatgatcaaagcgggaactctgacactggaagaagtcagacgc3180aagtttaacaatggcgagatcaatttccgctcataa3216<210>32<211>21<212>dna<213>人工序列(artificialsequence)<400>32gggtgtagagatagattctcc21<210>33<211>21<212>dna<213>人工序列(artificialsequence)<400>33ggccagccatcactagtattc21<210>34<211>18<212>prt<213>人工序列(artificialsequence)<400>34gluglyargglyserleuleuthrcysglyaspvalglugluasnpro151015glypro<210>35<211>20<212>prt<213>人工序列(artificialsequence)<400>35glncysthrasntyralaleuleulysleualaglyaspvalgluser151015asnproglypro20<210>36<211>681<212>dna<213>人工序列(artificialsequence)<400>36atgagcgatagcactgagaacgtcatcaagcccttcatgcgcttcaaggtgcacatggag60ggctccgtgaacggccacgagttcgagatcgagggcgagggcgagggcaagccctacgag120ggcacccagaccgccaagctgcaggtgaccaagggcggccccctgcccttcgcctgggac180atcctgtccccccagttccagtacggctccaaggtgtacgtgaagcaccccgccgacatc240cccgactacaagaagctgtccttccccgagggcttcaagtgggagcgcgtgatgaacttc300gaggacggcggcgtggtgaccgtgacccaggactcctccctgcaggacggcaccttcatc360taccacgtgaagttcatcggcgtgaacttcccctccgacggccccgtaatgcagaagaag420actctgggctgggagccctccaccgagcgcctgtacccccgcgacggcgtgctgaagggc480gagatccacaaggcgctgaagctgaagggcggcggccactacctggtggagttcaagtca540atctacatggccaagaagcccgtgaagctgcccggctactactacgtggactccaagctg600gacatcacctcccacaacgaggactacaccgtggtggagcagtacgagcgcgccgaggcc660cgccaccacctgttccagtag681<210>37<211>846<212>dna<213>人工序列(artificialsequence)<400>37atggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggac60ggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgccacctac120ggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccacc180ctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgaccacatgaag240cagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttc300ttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctg360gtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcctggggcac420aagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaac480ggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgcagctcgcc540gaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccac600tacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatcacatggtc660ctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagaag720ctcagccatggcttcccgccggcggtggcggcgcaggatgatggcacgctgcccatgtct780tgtgcccaggagagcgggatggaccgtcaccctgcagcctgtgcttctgctaggatcaat840gtataa846<210>38<211>1407<212>dna<213>人工序列(artificialsequence)<400>38atgggccgcggctggggattcttgtttggcctcctgggcgccgtgtggctgctcagctcg60ggccacggagaggagcagcccccggagacagcggcacagaggtgcttctgccaggttagt120ggttacttggatgattgtacctgtgatgttgaaaccattgatagatttaataactacagg180cttttcccaagactacaaaaacttcttgaaagtgactactttaggtattacaaggtaaac240ctgaagaggccgtgtcctttctggaatgacatcagccagtgtggaagaagggactgtgct300gtcaaaccatgtcaatctgatgaagttcctgatggaattaaatctgcgagctacaagtat360tctgaagaagccaataatctcattgaagaatgtgaacaagctgaacgacttggagcagtg420gatgaatctctgagtgaggaaacacagaaggctgttcttcagtggaccaagcatgatgat480tcttcagataacttctgtgaagctgatgacattcagtcccctgaagctgaatatgtagat540ttgcttcttaatcctgagcgctacactggttacaagggaccagatgcttggaaaatatgg600aatgtcatctacgaagaaaactgttttaagccacagacaattaaaagacctttaaatcct660ttggcttctggtcaagggacaagtgaagagaacactttttacagttggctagaaggtctc720tgtgtagaaaaaagagcattctacagacttatatctggcctacatgcaagcattaatgtg780catttgagtgcaagatatcttttacaagagacctggttagaaaagaaatggggacacaac840attacagaatttcaacagcgatttgatggaattttgactgaaggagaaggtccaagaagg900cttaagaacttgtattttctctacttaatagaactaagggctttatccaaagtgttacca960ttcttcgagcgcccagattttcaactctttactggaaataaaattcaggatgaggaaaac1020aaaatgttacttctggaaatacttcatgaaatcaagtcatttcctttgcattttgatgag1080aattcattttttgctggggataaaaaagaagcacacaaactaaaggaggactttcgactg1140cattttagaaatatttcaagaattatggattgtgttggttgttttaaatgtcgtctgtgg1200ggaaagcttcagactcagggtttgggcactgctctgaagatcttattttctgagaaattg1260atagcaaatatgccagaaagtggacctagttatgaattccatctaaccagacaagaaata1320gtatcattattcaacgcatttggaagaatttctacaagtgtgaaagaattagaaaacttc1380aggaacttgttacagaatattcattga1407<210>39<211>684<212>dna<213>人工序列(artificialsequence)<400>39atgaccagcaagctcgccgtggctctgctggctgccttcctgatcagcgccgccctctgc60gagggcttaggtgaagttgggaactatttcggtgtgcaggatgcggtaccgtttgggaat120gtgcccgtgttgccggtggacagcccggttttgttaagtgaccacctgggtcagtccgaa180gcaggggggctccccaggggacccgcagtcacggacttggatcatttaaaggggattctc240aggcggaggcagctatactgcaggactggatttcacttagaaatcttccccaatggtact300atccagggaaccaggaaagaccacagccgatttggcattctggaatttatcagtatagca360gtgggcctggtcagcattcgaggcgtggacagtggactctacctcgggatgaatgagaag420ggggagctgtatggatcagaaaaactaacccaagagtgtgtattcagagaacagttcgaa480gaaaactggtataatacgtactcatcaaacctatataagcacgtggacactggaaggcga540tactatgttgcattaaataaagatgggaccccgagagaagggactaggactaaacggcac600cagaaattcacacattttttacctagaccagtggaccccgacaaagtacctgaactgtat660aaggatattctaagccaaagttga684<210>40<211>2487<212>dna<213>人工序列(artificialsequence)<400>40atgaggcttcgggagccgctcctgagcggcagcgccgcgatgccaggcgcgtccctacag60cgggcctgccgcctgctcgtggccgtctgcgctctgcaccttggcgtcaccctcgtttac120tacctggctggccgcgacctgagccgcctgccccaactggtcggagtctccacaccgctg180cagggcggctcgaacagtgccgccgccatcgggcagtcctccggggagctccggaccgga240ggggcccggccgccgcctcctctaggcgcctcctcccagccgcgcccgggtggcgactcc300agcccagtcgtggattctggccctggccccgctagcaacttgacctcggtcccagtgccc360cacaccaccgcactgtcgctgcccgcctgccctgaggagtccccgctgcttgtgggcccc420atgctgattgagtttaacatgcctgtggacctggagctcgtggcaaagcagaacccaaat480gtgaagatgggcggccgctatgcccccagggactgcgtctctcctcacaaggtggccatc540atcattccattccgcaaccggcaggagcacctcaagtactggctatattatttgcaccca600gtcctgcagcgccagcagctggactatggcatctatgttatcaaccaggcgggagacact660atattcaatcgtgctaagctcctcaatgttggctttcaagaagccttgaaggactatgac720tacacctgctttgtgtttagtgacgtggacctcattccaatgaatgaccataatgcgtac780aggtgtttttcacagccacggcacatttccgttgcaatggataagtttggattcagccta840ccttatgttcagtattttggaggtgtctctgctctaagtaaacaacagtttctaaccatc900aatggatttcctaataattattggggctggggaggagaagatgatgacatttttaacaga960ttagtttttagaggcatgtctatatctcgcccaaatgctgtggtcgggaggtgtcgcatg1020atccgccactcaagagacaagaaaaatgaacccaatcctcagaggtttgaccgaattgca1080cacacaaaggagacaatgctctctgatggtttgaactcactcacctaccaggtgctggat1140gtacagagatacccattgtatacccaaatcacagtggacatcgggacaccgagctcgagc1200ggcagcggagccaccaacttcagcctgctgaagcaggccggcgatgtggaggagaatcct1260ggccccatgattcacaccaacctgaagaaaaagttcagctgctgcgtcctggtctttctt1320ctgtttgcagtcatctgtgtgtggaaggaaaagaagaaagggagttactatgattccttt1380aaattgcaaaccaaggaattccaggtgttaaagagtctggggaaattggccatggggtct1440gattcccagtctgtatcctcaagcagcacccaggacccccacaggggccgccagaccctc1500ggcagtctcagaggcctagccaaggccaaaccagaggcctccttccaggtgtggaacaag1560gacagctcttccaaaaaccttatccctaggctgcaaaagatctggaagaattacctaagc1620atgaacaagtacaaagtgtcctacaaggggccaggaccaggcatcaagttcagtgcagag1680gccctgcgctgccacctccgggaccatgtgaatgtatccatggtagaggtcacagatttt1740cccttcaatacctctgaatgggagggttatctgcccaaggagagcattaggaccaaggct1800gggccttggggcaggtgtgctgttgtgtcgtcagcgggatctctgaagtcctcccaacta1860ggcagagaaatcgatgatcatgacgcagtcctgaggtttaatggggcacccacagccaac1920ttccaacaagatgtgggcacaaaaactaccattcgcctgatgaactctcagttggttacc1980acagagaagcgcttcctcaaagacagtttgtacaatgaaggaatcctaattgtatgggac2040ccatctgtataccactcagatatcccaaagtggtaccagaatccggattataatttcttt2100aacaactacaagacttatcgtaagctgcaccccaatcagcccttttacatcctcaagccc2160cagatgccttgggagctatgggacattcttcaagaaatctccccagaagagattcagcca2220aaccccccatcctctgggatgcttggtatcatcatcatgatgacgctgtgtgaccaggtg2280gatatttatgagttcctcccatccaagcgcaagactgacgtgtgctactactaccagaag2340ttcttcgatagtgcctgcacgatgggtgcctaccacccgctgctctatgagaagaatttg2400gtgaagcatctcaaccagggcacagatgaggacatctacctgcttggaaaagccacactg2460cctggcttccggaccattcactgctaa2487当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1