背景技术:
:序列表本申请以引用方式并入以计算机可读形式提交的序列表,该序列表于2015年8月3日创建为文件8700wo_st25.txt(75,769字节)。本发明提供重组蛋白在哺乳动物细胞中以一致和高效的方式表达。具体地讲,本发明包括通过采用哺乳动物选择标记在哺乳动物细胞中实现改善的蛋白表达的方法和组合物。本发明包括在哺乳动物细胞中促进重组蛋白的选择性以及增加表达拷贝数和蛋白产率的方法,和使用此类表达系统的方法。相关领域说明细胞表达系统的开发是提供用于研究和治疗用途的可靠且高效的给定蛋白来源的重要目标。由于例如哺乳动物表达系统对重组蛋白进行适当的翻译后修饰的能力,哺乳动物细胞中的重组蛋白表达就制备治疗性蛋白而言通常是优选的。有多种载体可用于在哺乳动物宿主中表达,它们各自含有使得能够在细胞培养期间容易地分离表达重组蛋白的细胞的选择标记。在此类系统中利用选择性标记基因(smg),原因是它们为表达所关注蛋白的细胞赋予选择性优势,然而,smg必须就其表型中性、高效性和多能性等原因进行优化。尽管有许多宿寄smg的载体和表达系统可用,但在哺乳动物系统中实现的重组蛋白的表达无论在数量还是质量还是这两者上通常都无法令人满意。分子的生物“指纹”(例如翻译后修饰,比如糖基化)在开发重组蛋白治疗剂中在限定分子的实用性和功效方面尤为重要(cumming,d.a.,1990,glycobiology,1(2):115-130)。对表达的所关注蛋白的生物性质不会有负面影响的smg是特别有利的。大多数smg为细菌来源的,且由于日渐担忧细菌抗生素抗性基因对环境细菌的横向转移风险,就用于哺乳动物系统而言带来其他缺点(breyer,d.等人,2014,criticalreviewsinplantsciences33:286-330)。取消使用细菌抗生素抗性基因可能对于消费者认可和减轻此类感知风险具有积极作用。基因工程化的自体细胞在临床上快速取得成功(参见例如kershaw,m.h.等人,2013,naturereviews:cancer13:525-541)。对用于人类自体细胞产物中的基因修饰的载体的选择和设计是至关重要的,特别是因为将非人类组分不希望地引入人类自体细胞可能对患者的安全具有严重后果(eaker等人2013,stemcellstrans.med.2:871–883;最先在2013年10月7日在线发表于sctmexpress)。仅具有哺乳动物来源而非细菌来源的组分的载体系统就用于过继性免疫治疗的患者特异性t细胞而言将是有利的。因此,期望引入哺乳动物选择性基因,特别是在用于产生所关注的哺乳动物蛋白的表达系统中为转化的细胞提供表型或代谢优势的那些基因。此外,可靠地表达足够高水平的治疗性蛋白并对该治疗性蛋白进行适当且一致的翻译后修饰的细胞系是高度期望的。因此,在本领域中需要改善的哺乳动物表达系统。技术实现要素:使用哺乳动物衣霉素(tn)抗性基因作为哺乳动物表达系统中的选择性标记可增加转染子的效率和拷贝数。已观察到,可操作地连接到所关注基因的tn抗性基因的使用对哺乳动物细胞群产生选择性压力,从而增加转染子(即所关注基因)的随机整合。应当理解,选择性标记系统可促进所需转染子的选择,然而本发明的方法赋予所关注基因的效率和随机整合出人意料的增加,以及赋予所需蛋白可靠的生物质量。因此本发明的组合物和方法使得可以实现对所表达蛋白的质量上良好的翻译后修饰的有利选择。在一个方面,本发明提供包括哺乳动物衣霉素(tn)抗性基因的分离的细胞,所述基因编码与seqidno:3氨基酸序列具有至少93%同一性的蛋白,所述基因可操作地连接到所关注基因(goi)和至少一个调控元件。在另一个方面,本发明提供制备重组的所关注蛋白(poi)的方法,其中该方法包括:提供编码核酸分子的哺乳动物宿主细胞,所述核酸分子包含(i)哺乳动物衣霉素(tn)抗性基因和(ii)编码该poi的基因;在第一浓度的tn存在下培养该细胞;分离表达tn抗性基因的至少一个拷贝的细胞群;在增加浓度的tn存在下培养该细胞群,其中增加tn的浓度增加poi的产生;以及从细胞培养中分离该poi。在又一个方面,本发明提供使n-聚糖蛋白底物糖基化的方法,其中该方法包括:提供编码核酸分子的哺乳动物宿主细胞,所述核酸分子包含可操作地连接到编码需要糖基化的蛋白底物的基因的哺乳动物衣霉素(tn)抗性基因;在第一浓度的tn存在下培养该细胞;分离表达tn抗性基因的至少一个拷贝的细胞群;在增加浓度的tn存在下培养该细胞群,其中增加tn的浓度增加poi的产生;以及从细胞培养中分离该蛋白底物。在所述方法的一些实施方案中,该tn抗性基因可操作地连接到编码poi的基因,且该编码poi的基因可操作地连接到至少一个调控元件。在一些实施方案中,该tn抗性基因外源性添加到细胞。在其他实施方案中,该tn抗性基因编码与seqidno:3的氨基酸序列具有至少93%同一性的蛋白。在其他实施方案中,该tn抗性基因编码与seqidno:3的氨基酸序列具有至少94%同一性的蛋白。在一些实施方案中,该tn抗性基因编码与seqidno:4的氨基酸序列具有至少93%同一性的蛋白。在另外其他实施方案中,该tn抗性基因编码与seqidno:4的氨基酸序列具有至少94%同一性的蛋白。在一些实施方案中,该哺乳动物tn抗性基因包括中国仓鼠(cricetulusgriseus)tn抗性基因。在其他实施方案中,该哺乳动物tn抗性基因包括人类tn抗性基因。tn抗性基因还可包括选自以下的核酸序列:seqidno:2、seqidno:11、seqidno:12、seqidno:13、seqidno:14、seqidno:15、seqidno:16和seqidno:17。在前述发明的某些实施方案中,该哺乳动物tn抗性基因包括与seqidno:2的核酸序列具有至少92%同一性的核酸序列。在一些实施方案中,该哺乳动物tn抗性基因包括与seqidno:12的核酸序列具有至少92%同一性的核酸序列。在本发明的分离的细胞中提供可操作地连接到tn抗性基因的至少一个调控元件,其中该调控元件包括但不限于启动子、核糖体结合位点和增强子。在又一个实施方案中,该goi可操作地连接到启动子。在另一个实施方案中,该goi可操作地连接到核糖体结合位点,诸如ires。在一些实施方案中,本发明的分离的细胞和方法还包括第二所关注基因(goi),而该goi编码所关注蛋白(poi)。在一个实施方案中,该所关注基因(goi)为外源性添加的goi。在另一个实施方案中,该外源性添加的goi为人类基因。在又一个实施方案中,该调控元件为外源性添加的调控元件。在其他实施方案中,该第一和/或第二goi编码包括但不限于抗体重链、抗体轻链、抗原结合片段和/或fc融合蛋白的poi。在另一个实施方案中,该第一goi和第二goi独立地选自编码抗体轻链或其抗原特异性片段、抗体重链或其抗原特异性片段、fc融合蛋白或其片段以及受体或其配体特异性片段的基因。在一个实施方案中,重组酶识别位点存在于第一goi与第二goi之间。在其他实施方案中,本发明还提供在第一goi的5’的重组酶识别位点和相对于第二goi在3’的重组酶识别位点。在又一个实施方案中,该goi编码选自抗体轻链或其抗原结合片段、抗体重链或其抗原结合片段、fc融合蛋白或其片段、配体以及受体或其配体结合片段的糖蛋白。本发明的分离的、非天然存在的细胞可衍生自真核细胞。在一个实施方案中,该细胞为哺乳动物细胞。在一些实施方案中,该分离的细胞为离体人类细胞。在其他实施方案中,该细胞选自:cho(例如chok1、dxb-11cho、veggie-cho)、cos(例如cos-7)、淋巴细胞、干细胞、视网膜细胞、vero、cv1、肾(例如hek293、293ebna、msr293、mdck、hak、bhk21)、hela、hepg2、wi38、mrc5、colo25、hb8065、hl-60、jurkat、daudi、a431(表皮的)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt细胞、肿瘤细胞以及衍生自前述细胞的细胞系。在某些实施方案中,本发明的分离的细胞为cho-k1细胞、淋巴细胞、视网膜细胞或干细胞。在一个实施方案中,第一浓度的tn为1μg/ml。在另一个实施方案中,增加浓度的tn包括第二和第三浓度的tn。在一些实施方案中,第二浓度大于第一浓度的tn,而第三浓度大于第二浓度的tn。在某些实施方案中,第二浓度的tn为2.5μg/ml,而第三浓度为5μg/ml。在另外其他实施方案中,增加浓度的tn包括第二浓度的tn,其中该第二浓度的tn为2.5μg/ml或5μg/ml。除非另有说明或上下文中显而易见,否则本发明的任何方面和实施方案可与本发明的任何其他方面或实施方案结合使用。通过审阅接下来的详细说明,其他目标和优点将变得显而易见。附图说明图1说明用于将编码所关注基因(例如egfp)的核酸序列引入细胞基因组中的克隆载体结构中的可操作表达盒的示意图。sv40启动子:猴病毒40启动子;gpt:glcnac-1-p转移酶(例如cho-gpt,seqidno:2;或hgpt,seqidno:12);ires:内部核糖体进入位点;egfp:增强的绿色荧光蛋白;sv40polya:猴病毒40polya。图2a至2c代表哺乳动物gpt氨基酸序列,即人类(gpt_human;uniprotkb登录号q9h3h5;seqidno:4)、恒河猴(rhesusmacaque)(gpt_macmu;uniprotkb登录号f6txm3;seqidno:5)、黑猩猩(gpt_pantr;uniprotkb登录号h2r346;seqidno:6)、狗(gpt_canfa;uniprotkb登录号e2rq47;seqidno:7)、豚鼠(gpt_cavpo;uniprotkb登录号e2rq47;seqidno:8)、大鼠(gpt_rat;uniprotkb登录号q6p4z8;seqidno:9)和小鼠(gpt_mouse;uniprotkb登录号p42867;seqidno:10)相较于中国仓鼠(gpt_crigr;uniprotkb登录号p24140;seqidno:3)gpt氨基酸序列的比对。图3a和3b举例说明可如何使用本发明的方法和组合物实现蛋白优化。图3a描绘从用1μg/ml衣霉素(tn)培养的第一细胞池中选择阳性细胞转染子的方法。随后,以增加浓度的衣霉素(例如2.5μg/ml或5μg/ml)培养第二细胞,以增强蛋白表达。图3b描绘从用1μg/ml衣霉素(tn)培养的第一细胞池中选择阳性细胞转染子的方法,然后连续地增加后续细胞培养中的tn浓度以便优化蛋白表达。图4a至4b经修饰的cho细胞包括侧翼为lox位点的yfp基因。侧翼为lox位点的选择标记(抗生素抗性基因和egfp)合并在yfp位点并经由靶向整合用cre重组酶置换yfp。随机整合体既表达yfp也表达egfp。图4a:用cre重组酶载体和包括egfp的hpt表达载体转染细胞;但培养中无潮霉素。图4b:用cre重组酶载体和包括egfp的hpt表达载体转染细胞;存在400μg/ml潮霉素。图5a至5f显示代表衣霉素选择性的各种参数的facs散点图。经修饰的cho细胞包括侧翼为lox位点的yfp基因。侧翼为lox位点的选择标记(抗生素抗性基因和egfp)合并在yfp位点并经由靶向整合用cre重组酶置换yfp。随机整合体既表达yfp也表达egfp。图5a:用cre重组酶载体和包括egfp的cho-gpt表达载体转染细胞;但培养中无衣霉素。图5b:用cre重组酶载体和包括egfp的cho-gpt表达载体转染细胞;存在1μg/ml衣霉素。图5c:用cre重组酶载体和包括egfp的cho-gpt表达载体转染细胞;存在2.5μg/ml衣霉素。图5d:用cre重组酶载体和包括egfp的人类gpt表达载体转染细胞;但培养中无衣霉素。图5e:用cre重组酶载体和包括egfp的人类gpt表达载体转染细胞;存在1μg/mltn。图5f:用cre重组酶载体和包括egfp的人类gpt表达载体转染细胞;存在2.5μg/mltn。图6a和6b显示gpt表达细胞池与非gpt表达池在其增强可操作地连接的goi(诸如egfp)的表达的相对能力方面的比较。图6a如下说明通过pcr就细胞池所测得的cho-gpt的基因拷贝相对数:无tn选择的pool-49细胞(未添加外源性gpt);具有5μgtn选择的pool-49细胞(无外源性gpt);pool-1细胞天然表达较高量的gpt(数据未显示),并在无tn选择的情况下进行测试;无tn选择的pool-78细胞(无外源性gpt);表达外源性添加的hpt的cho细胞和400μg/ml潮霉素选择;在1μg/mltn选择条件下表达外源性gpt的cho细胞;从1μg/mltn选择池选择的表达外源性gpt的cho细胞进一步在1μg/mltn中培养;从1μg/mltn选择池选择的表达外源性gpt的cho细胞进一步在2.5μg/mltn中培养;从1μg/mltn选择池选择的表达外源性gpt的cho细胞进一步在5μg/mltn中培养。图6b说明通过qpcr就相同的细胞池(如图6a)所测得的所关注基因egpt的基因拷贝相对数目。图7a至7d如下说明由细胞培养所产生的fc融合蛋白1fcfp1)的糖型特征,图7a:使用标准方案的不表达gpt的cho细胞(批次b10002m410),相较于图7b:表达cho-gpt且无tn选择的cho细胞(批次110728)。图7c:表达cho-gpt的且以1μg/mltn选择的cho细胞(批次110728-01),相较于图7d:表达cho-gpt的且以5μg/mltn选择的cho细胞(批次110728-02)。各色谱图如下指出含有唾液酸化残基的级分:0sa=0个唾液酸残基;1sa=1个唾液酸残基;2sa=2个唾液酸残基;3sa=3个唾液酸残基;4sa=4个唾液酸残基。图8说明从(a)批次b10002m410、(b)批次110728、(c)批次110728-01和(d)批次110728-02取样的fc融合蛋白1(fcfp1)的叠加糖基化谱。从gpt批次中产生的各蛋白的糖基化谱(glycoprofile)与参比标准蛋白相容,且一致地产生主要的糖型种类。显然的是,相较于参比标准蛋白,在gpt批次中并未产生新的和独特的糖型种类。具体实施方式在描述本发明的方法前,应当理解,本发明不限于所述的特定方法和实验条件,因为此类方法和条件可以变化。还应当理解,本文所用的术语仅用于描述特定实施方案的目的,而无意进行限制,因为本发明的范围将仅由所附权利要求书限制。如在该说明书和所附权利要求书中所用,除非上下文明确地相反指出,否则单数形式“一个”、“一种”和“该/所述”包括复数含义。因此,例如提及“一种方法”包括本文所述类型的和/或在阅读本公开后对本领域的技术人员将变得显而易见的一种或多种方法和/或一个或多个步骤。除非另有定义或另有规定,否则本文所用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常理解的相同意义。尽管与本文中描述的那些方法和材料类似或等同的任何方法和材料均可用于本发明的实践或检验,但现在描述特定的方法和材料。本文提及的所有出版物均以引用方式整体并入本文。本领域中熟知的多种基因可向培养中的哺乳动物细胞赋予选择性表型。一般来讲,选择性标记基因表达蛋白,通常是在细胞培养中赋予对各种抗生素的抗性的酶。在某些选择条件下,可使表达荧光蛋白标记的细胞显现,并因此为可选择的。本领域的实例包括β-内酰胺酶(bla;β-内酰胺抗生素抗性基因或ampr;氨苄青霉素抗性基因)、bls(灭瘟素抗性乙酰转移酶基因)、潮霉素磷酸转移酶(hpt;潮霉素抗性基因)等。本文所述的方法依赖于使用衣霉素以及能让细胞耐衣霉素而得以在细胞培养中生长的酶(标记)。衣霉素(tn)为抗生素的混合物,其作为细菌和真核生物n-乙酰葡糖胺转移酶的抑制剂,从而防止n-乙酰葡糖胺脂质中间体的形成以及新合成的糖蛋白的糖基化。(king,i.a.和tabiowo,a.,1981,effectoftunicamycinonepidermalglycoproteinandglycosaminoglycansynthesisinvitro.biochem.j.,198(2):331-338)。tn具有细胞毒性,因为其特异性抑制udp-n-乙酰葡糖胺:磷酸多萜醇n-乙酰葡糖胺-1-p转移酶(gpt),一种催化多萜醇连接的寡糖类的生物合成起始步骤的酶。在衣霉素的存在下,在内质网(er)中制备的天冬酰胺连接的糖蛋白不被n-连接的聚糖糖基化,并因此在er内可能无法正确折叠且因而可被分解(koizumi等人1999,plantphysiol.121(2):353–362)。因此,tn是在细菌和真核细胞中导致细胞凋亡的值得注意的未折叠蛋白反应(upr)的诱导物。二磷酸尿苷gpt(也称为glcnac-1-p转移酶)的基因被鉴定为在某些细胞条件下过表达,以便于赋予对tn的抗性(criscuolo和krag,1982,jbiolchem,263(36):19796-19803;koizumi等人,1999,plantphysiology,第121卷,第353–361页)。编码gpt的基因(也描述为genbank登录号m36899(seqidno:2))从耐tn的中国仓鼠卵巢细胞系中分离出且编码408个氨基酸的蛋白(seqidno:3)(scocca和krag,1990,jbiolchem265(33):20621-20626;lehrman,m.等人,1988,jbiolchem263(36):19796-803)。仓鼠gpt在酵母细胞(粟酒裂殖酵母(s.pombe))中过表达且在这些细胞中赋予tn抗性;还提供方便的纯化gpt酶的来源(scoccajr等人1995,glycobiology,5(1):129-36)。在杂交瘤细胞(表达igg的b细胞,相比静止期b细胞)中分析了gpt的转录水平,尽管观察到产igg的细胞并未表现出升高水平的gpt转录或活性,但在从静止期过渡到活化的b细胞中看到了gpt的少量增加。结论是,gpt水平可与b细胞中对lps(抗原)刺激的增殖反应的早期产生相对应(crick,d.c.等人1994,jbiolchem269(14):10559-65)。此外,之前并不清楚,在有或无tn存在下改变gpt的表达,在细胞表达系统中是否对蛋白产物的糖基化有影响并因而影响产物质量。应当理解,最佳和一致的糖基化在制备治疗性糖蛋白中至关重要的蛋白属性。本发明提供在哺乳动物细胞系统中利用哺乳动物tn抗性基因gpt作为可调节的选择标记来制备重组蛋白的改进方法,而可操作地连接到gpt的所关注基因增加的拷贝数与gpt表达盒增加的随机整合到细胞中相关。本领域已认识到,制备治疗性蛋白特别是糖蛋白依赖于模拟此类蛋白的天然糖基化的哺乳动物型表达系统。(有关综述,参见bork,k.等人,2009,jpharmsci.98(10):3499-3508)。例如,某些糖蛋白的末端单糖(诸如n‐连接的复合聚糖)通常被唾液酸占据。唾液酸化可影响糖蛋白的药代动力学性质,诸如吸收度、血清半衰期和清除率或糖蛋白的其他物理化学或免疫原性性质。过表达的重组糖蛋白通常具有不完整或不一致的糖基化。可靠的方法对于在哺乳动物细胞系中产生的治疗性糖蛋白的工艺一致性和质量至关重要。本发明还提供用于使重组蛋白糖基化的改进方法,即在哺乳动物细胞系统中制备糖蛋白的方法,以便提供一致质量产率的所需的蛋白。定义dna区当在功能上彼此相关时为可操作地连接的。例如,如果启动子能够参与序列的转录,则该启动子可操作地连接到编码序列;如果核糖体结合位点经定位成以便可以翻译,则该核糖体结合位点可操作地连接到编码序列。一般来讲,可操作地连接包括但不必须为邻近。就序列诸如分泌性前导序列而言,邻近且适当放置在阅读框中为典型的特征。增强生成的序列(诸如启动子)当与goi功能上相关,例如其存在造成goi的表达增加时,则可操作地连接到所关注基因(goi)。因此,短语“可操作地连接的”(诸如在dna表达载体构建体的上下文中)控制序列(例如启动子或操纵子或标记)适当地位于相对于编码序列的某一位置,使得该控制序列指导或允许由该编码序列编码的所关注多肽/蛋白的产生。例如,当选择标记为细胞在某些培养条件下存活所必需的时,该所关注基因可操作地连接到该选择标记基因,因为在没有可操作的选择标记蛋白的存在下,表达将不会发生。如本文所用的“启动子”是指足以指导其可操作地连接到的dna序列转录的dna序列,即其连接方式使得当适当的信号存在时,允许所关注基因和/或选择标记基因转录。基因的表达可置于本领域已知的任何启动子或增强子元件的控制下。在本发明的上下文中的“表达载体”可以是任何适合的载体,包括染色体、非染色体和合成的核酸载体(包括一组适合的表达控制元件的核酸序列)。此类载体的实例包括sv40的衍生物、细菌质粒、嗜菌体dna、杆状病毒、酵母质粒、衍生自质粒和嗜菌体dna组合的载体、以及病毒核酸(rna或dna)载体。在一个实施方案中,编码fc融合蛋白或多肽的核酸分子包括在裸dna或rna载体(包括例如线性表达元件(如描述于例如sykes和johnston,1997,natbiotech12,355-59中))、紧凑的核酸载体(如描述于例如us6,077,835和/或wo00/70087中)或质粒载体诸如pbr322、puc19/18或puc118/119中。此类核酸载体及其用法是本领域熟知的(参见例如us5,589,466和us5,973,972)。如本文所用的“操纵子”是指这样的dna序列,其引入基因中或基因附近的方式使得该基因可通过将阻遏蛋白与该操纵子结合而调控,并因此防止或允许goi(即编码所关注多肽或蛋白的核苷酸)的转录。核糖体结合位包括“内部核糖体进入位”(ires)或可包括5’帽。许多ires序列是本领域熟知的。ires代表翻译控制序列,其中ires位点通常位于所关注基因的5’,并使得以帽非依赖性方式翻译rna。经转录的ires可直接结合核糖体亚单位,以使得mrna起始密码子的位置在核糖体中适当地取向以进行翻译。ires序列通常位于mrna的5’utr中(起始密码子的正上游)。ires在功能上取代对各种与真核生物翻译机制相互作用的蛋白因子的需求。术语“增强的”或“改善的”当用于描述蛋白表达时包括由本发明的表达系统或方法产生的蛋白(即基因产物)的量和/或质量一致性的增加。因此,这包括相比通常通过随机整合到基因组中所观察到的结果,例如相较于使用另一种选择性标记构建体的整合体池,在表达上增加至少约1.5倍至增加至少约3倍。因此,将所关注蛋白所观察到的表达增加倍数与在不存在包括gpt基因的本发明表达盒或细胞的情况下,或在存在包括不同选择性标记的表达盒或细胞的情况下,在基本上相同条件下测得的相同基因的表达水平进行比较。表达增加还可通过所产生的随机整合事件的数量来测量。增加的重组效率包括基因座重组能力的增强(例如,采用重组酶识别位点)。增强是指相比随机重组而言的可测量效率,随机重组通常为0.1%。在某些条件下,增强的重组效率是随机的大约10倍,或约1%。除非规定,否则受权利要求书保护的发明不限于特定的重组效率。表达增强也可通过所产生的基因拷贝数来测量,如通过定量聚合酶链式反应(qpcr)或其他熟知的技术来测量。增强或改善的产物还指更一致的质量,例如通过本发明的gpt表达系统所观察到的翻译后修饰。一致的质量包括例如在重复的生产线后具有所需的糖基化谱。一致性就质量而言是指均匀性和标准化程度,而重复的生产批次基本上无变化。在本文中教导了计算用以度量一致性的z数。用于度量一致性的其他统计指标是本领域已知的。短语“选择压力”是施加给活的生物体(例如细胞)或系统(例如表达系统)的力或刺激,其改变该活的生物体或系统在给定环境中的行为和存活(例如存活能力)。短语“基因扩增”表示基因序列的相同拷贝的数目的增加。某些细胞过程的特征在于产生一种或多种特定基因的多个拷贝,其扩增该基因赋予细胞的表型,例如抗生素抗性。当关于表达盒采用短语“外源性添加的基因”或“外源性添加的goi”时,该短语是指不存在于自然界中发现的细胞基因组内的任何基因,或整合至该基因组中(该基因组内的不同的基因座中)的另外的基因拷贝。例如,cho基因组内的“外源性添加的基因”(例如选择性标记基因)可为并非在自然界中在特定cho基因座内发现的仓鼠基因(即,来自仓鼠基因组中的另一基因座的仓鼠基因)、来自任何其他物种的基因(例如人类基因)、嵌合基因(例如人/小鼠),或者可以为并非在自然界中在cho基因组内发现的仓鼠基因(即与来自仓鼠基因组中的另一基因座的基因具有低于99.9%同一性的仓鼠基因),或并非在自然界中发现存在于cho天然基因组内的任何其他基因。随机整合事件不同于靶向整合事件,而将基因插入细胞的基因组在随机整合事件中并非位点特异性的。靶向整合的实例是同源重组。随机(非同源)整合表示所产生的整合体的位置(基因座)并非已知的或指定的。随机整合被认为通过非同源末端接合(nhej)发生,然而并不限于该方法。选择效率表示表达选择性标记且适当时表达在选择性标记控制下的所关注蛋白的存活细胞的群体百分比。百分比同一性当描述tn抗性蛋白时意在包括沿着邻接的同源区展示出所述同一性的同源序列,但在相比较的序列中不具有同源性的间隙、缺失或插入的存在不纳入百分比同一性的计算中。在该上下文中在解释“百分比同一性”的使用时,将涉及下列氨基酸序列比较:如本文所用,上述“gpt_crig”序列(对于中国仓鼠gpt)与小鼠同源物(“gpt_小鼠”)之间的“百分比同一性”测定不应包括仓鼠氨基酸10和11的比较,因为在比对中该仓鼠同源物并不具有同源的序列来进行比较(即小鼠gpt在该点具有插入,或该仓鼠同源物具有间隙或缺失,视具体情况而定)。因此,在上述比较中,百分比同一性比较将从5’端的“mwa”延伸至3’端的“esq”。在该事件中,小鼠同源物的差异仅在于:其在仓鼠gpt位置51具有“r”。因为该比较在一段60个碱基对中的58个邻接的碱基上进行,其中仅有一个氨基酸差异(其并非间隙、缺失或插入),所以两个序列(小鼠和仓鼠)之间从仓鼠gpt位置1至仓鼠gpt位置58有超过98%的同一性(因为“百分比同一性”并不包括间隙、缺失和插入的罚分)。虽然上述实例以氨基酸序列为基础,但是应当理解,核酸序列百分比同一性将以相同的方式来计算。术语“细胞”包括适合表达重组核酸序列的任何细胞。细胞包括原核生物和真核生物(单细胞或多细胞)的细胞、细菌细胞(例如,大肠杆菌(e.coli)、芽孢杆菌属菌种(bacillusspp.)、链霉菌属菌种(streptomycesspp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母(s.cerevisiae)、粟酒裂殖酵母(s.pombe)、巴斯德毕赤酵母(p.partoris)、甲醇毕赤酵母(p.methanolica)等)、植物细胞、昆虫细胞(例如,sf-9、sf-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(trichoplusiani)等)、非人动物细胞、哺乳动物细胞、人细胞或细胞融合物例如杂交瘤或四源杂交瘤。在某些实施方案中,细胞为人、猴、猿、仓鼠、大鼠或小鼠细胞。在其他实施方案中,细胞为真核细胞并且选自以下细胞:cho(例如chok1、dxb-11cho、veggie-cho)、cos(例如cos-7)、视网膜细胞、vero、cv1、肾(例如hek293、293ebna、msr293、mdck、hak、bhk21)、hela、hepg2、wi38、mrc5、colo25、hb8065、hl-60、jurkat、daudi、a431(表皮的)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如per.细胞)。短语“累积细胞密度”或“icd”表示在一段时间内作为整体考虑的培养基中的细胞密度,以每毫升的细胞-天数来表示。在一些实施方案中,icd以培养中约第12天的细胞来测量。“糖基化”或短语“使蛋白糖基化”包括形成糖蛋白,而寡糖附连到蛋白的天冬酰胺(asn)残基(即n-连接的)或丝氨酸(ser)/苏氨酸(thr)残基(即o-连接的)的侧链。聚糖可以为单糖残基的均聚物或杂聚物,其可以为直链的或支链的。n-连接的糖基化已知主要在内质网中开始,而o-连接的糖基化显示出在er或高尔基体中开始。“n-聚糖蛋白”或“n-聚糖蛋白底物”包括含有或可接受n-连接的寡糖的蛋白。n-聚糖可由n-乙酰基半乳糖胺(galnac)、甘露糖(man)、果糖(fuc)、半乳糖(gal)、神经氨酸(nana)和其他单糖组成,然而n-聚糖通常具有共同的核心五糖结构,其包括:三个甘露糖和两个n-乙酰葡糖胺(glcnac)糖。带有连续氨基酸序列(即序列段(sequon))asn-x-ser或asn-x-thr的蛋白(其中x为除脯氨酸之外的任何氨基酸)可提供n-聚糖的附连位点。一般说明本发明至少部分地基于以下发现:在某些条件下可在细胞中产生重组蛋白,其中编码该蛋白的基因可操作地连接到tn抗性基因gpt,且将产蛋白的细胞的选择设定为在细胞基因组中增加随机整合事件并因此增加所关注基因的拷贝数以及最终增加蛋白产量。本发明还至少部分地基于以下发现:产蛋白的细胞可经优化以表达具有一致和可靠的翻译后修饰的蛋白。gpt表达盒还可以如在表达构建体中诸如经由表达载体使用本领域已知的各种基因编辑技术而整合到细胞基因组中。包括gpt的表达载体可通过随机或靶向重组,诸如同源重组或由识别特定重组位点的重组酶所介导的重组(例如,cre-lox介导的重组)整合到基因组中。可通过在整合位点在染色体dna中引入断裂来促进真核细胞中的同源重组。模型系统已证明,如果在染色体靶序列中引入双链断裂,那么在基因靶向期间同源重组的频率会增加。这可通过将某些核酸酶靶向特定整合位点而实现。在靶基因座识别dna序列的dna结合蛋白是本领域已知的。基因靶向载体也用于促进同源重组。在不存在用于同源指导修复(homologydirectedrepair)的基因靶向载体的情况下,细胞常常会通过非同源末端接合(nhej)(其可能在裂解位点处导致多个核苷酸的缺失或插入)来闭合该双链断裂。基因靶向载体构建和核酸酶选择在本发明所属领域的技术人员的技术范围内。在一些实例中,具有模块化结构并含有单独锌指域的锌指核酸酶(zfn)在靶向序列中识别特定的3-核苷酸序列(例如靶向整合的位点)。一些实施方案可利用具有靶向多个靶序列的单独锌指域的组合的zfn。转录活化因子样(tal)效应子核酸酶(talen)也可用于位点特异性基因组编辑。tal效应子蛋白dna结合域通常与限制性核酸酶诸如foki的非特异性裂解域组合使用。在一些实施方案中,将包含tal效应子蛋白dna结合域和限制性核酸酶裂解域的融合蛋白用于识别和裂解本发明基因座内的靶序列处的dna(bochj等人,2009science326:1509-1512)。rna引导的核酸内切酶(rgen)是从细菌适应性免疫机制开发的可编程的基因组工程化工具。在该系统(成簇规律间隔短回文重复序列(crispr)/crispr相关性(cas)免疫反应)中,蛋白cas9当与两个rna(其中一个引导靶选择)复合时形成序列特异性核酸内切酶。rgen由组分(cas9和tracrrna)以及靶特异性crisprrna(crrna)组成。dna靶裂解的效率以及裂解位点的位置均基于前间区序列邻近基序(pam)的位置而变化,该基序是针对靶识别的额外要求(chen,h.等人,j.biol.chem.2014年3月14作为手稿m113.539726在线发表)。另外其他同源重组方法可供技术人员使用,诸如具有精确dna结合特异性的bud衍生的核酸酶(budn)(stella,s.等人actacryst.2014,d70,2042-2052)。精确的基因组修饰方法基于与基因组内的独特靶序列相容可获得的工具来选择,以使得避免细胞表型被破坏。本发明提供细胞和方法以供稳定地将核酸序列(所关注基因)整合到哺乳动物细胞中,其中该核酸序列能够通过与gpt序列整合来增强表达。本发明还提供组合物和方法以供与表达构建体(例如表达载体)相关地使用gpt,以及将外源性gpt添加到所关注的哺乳动物细胞中。本发明提供细胞和方法以供用于一致但稳健地制备糖蛋白特别是治疗性糖蛋白的方法。gpt选择标记盒的构建本文提供包括可操作的gpt表达盒的表达载体。该表达盒包括必需的调控元件以允许和驱动哺乳动物gpt和所需基因产物的转录和翻译。还可开发本文所述的基因和调控序列的各种组合。还可开发的本文所述的适当序列的其他组合的实例包括含有本文所公开的gpt基因的多个拷贝的序列,或通过将所公开的gpt与其他核苷酸序列组合以实现最佳调控元件组合而衍生的序列。此类组合可连续地连接或排列以提供向所关注基因和调控元件取向的最佳的gpt间距。编码gpt的基因的同源序列已知存在于来自其他哺乳动物物种的细胞中(比如人类;参见图2)以及衍生自其他哺乳动物组织类型的细胞系中,且可通过本领域熟知的技术来分离。示例性哺乳动物gpt氨基酸序列的列表提供于图2中。可对seqidno:2和11-17所示的核苷酸序列进行核苷酸序列的改变,诸如密码子优化,以便允许seqidno:3-10所示的对应gpt蛋白的最佳表达。此外,可通过改变编码gpt的核苷酸序列,来改变seqidno:3-10所示的氨基酸序列。此类技术包括但不限于本领域熟知的定点或随机诱变技术。然后可将所得的gpt变体就本文所述的gpt活性进行测试,例如对衣霉素的抗性进行测试。通过常规实验,将氨基酸序列与具有gpt活性的seqidno:3至少约93%相同、或至少约95%相同、或至少约96%相同、或至少约97%相同、或至少约98%相同的gpt蛋白分离出,且预期其表现出与seqidno:3相同的tn抗性、选择性效率和翻译后益处。因此,gpt的哺乳动物同源物和gpt变体也可由本发明的实施方案涵盖。图2a至2c显示各种哺乳动物gpt氨基酸序列(即seqidno:3-10)的比对。哺乳动物gpt序列(核酸和氨基酸)在仓鼠、人类、小鼠和大鼠基因组之中为保守的。表1鉴别示例性哺乳动物gpt蛋白及其同源性程度。表1a:gpt同源物的氨基酸同一性表1b:代表性gpt同源物的核酸同一性动物seqidno%仓鼠同一性仓鼠2-小鼠1192人类1292大鼠1394猕猴1492黑猩猩1592可使用本文所提供的gpt/衣霉素法来产生表达增加水平的所关注蛋白的细胞群。取决于蛋白被细胞加工的效率如何,表达的绝对水平将随特定蛋白而变化。因此,本发明还包括选自seqidno:2和11-17的表达gpt的核苷酸序列。本发明还涵盖表达gpt的核苷酸序列,该序列与选自seqidno:2和11-17的核苷酸序列至少92%相同、至少93%相同、至少94%相同、至少95%相同、至少96%相同、至少98%相同或至少99%相同。本发明包括含有seqidno:1、seqidno:2或seqidno:12的载体。包括哺乳动物gpt基因和任选的调控元件的载体包括供瞬时或稳定转染的载体。在一个实施方案中,gpt基因用于增强goi的表达,如图1所示。图1显示与ires序列和gpt选择性标记可操作地连接的goi。gpt盒还包括启动子序列,例如sv40启动子,和多聚腺苷酸化(poly(a))序列,例如sv40poly(a)。表达增强盒(包括gpt和上游启动子)最佳地整合在细胞基因组中。使用本发明的方法,goi在以增加浓度的tn为基础的培养条件下在gpt表达盒内表达(图3a或图3b)。facs读出结果(诸如图5b、5c、5e和5f中所示)举例说明稳定转染的细胞群中的表达分布,特别是使用哺乳动物tn抗性选择标记cho-gpt和hgpt在选择效率上的急剧增加。哺乳动物gpt表达还增强了所关注基因产物的表达,例如荧光蛋白egfp的产生。相较于使用gpt在以一种浓度的tn为基础的培养条件下在表达系统中表达的goi,增加浓度的tn的连续培养导致约2倍的增强表达,诸如图6b中所举例说明。本发明包括包含这样的gpt基因的哺乳动物细胞,其中该gpt基因为外源性的且通过本发明的方法整合到细胞基因组中。包括这样的gpt基因的细胞具有至少一个外源性添加的所关注基因(goi),该基因在gpt基因的上游或下游。在多种实施方案中,可通过将goi置于哺乳动物选择性标记gpt的控制下来增强goi的表达。在其他实施方案中,可通过将goi置于哺乳动物选择性标记gpt的控制下并提供包括大于0.5μg/mltn浓度的细胞培养条件,来增强goi的随机整合事件。在一些实施方案中,细胞培养条件包括大于1μg/ml的tn浓度。调控元件可以可操作地连接到goi,其中goi的表达—在goi和gpt的选定距离下(在5’或3’方向)-保留增强goi表达的能力,例如,超过通常由于随机整合事件所观察到的表达。在多种实施方案中,增强为至少约1.5倍至约2倍或更多。相较于随机整合或随机表达,表达的增强为约1.5倍或约2倍或更多。在另一个实施方案中,使用本发明的方法和组合物可得到一致地糖基化的蛋白。如表4中所示,经tn处理的gpt/goi重组蛋白批次使得重复批次具有同等的糖基化谱。因此,增强的蛋白表达诸如一致的糖基化谱可直接通过计算如本文所教导的z数来比较。z数方程式将色谱图上代表唾液酸(sa)部分的相对波峰数以及各波峰的相对形状和强度列入考虑。z数以各波峰所占据的面积为基础并且可用作复合糖蛋白的一致性指标(参见例如图7a-7d、图8和实施例3,如本文所述)。蛋白表达优化还可就各goi而实现,包括例如表达盒取向或密码子优化。蛋白优化还可通过在细胞培养法中改变递增的tn浓度来实现。重组表达载体可包括编码蛋白的合成的或cdna衍生的dna片段,其可操作地连接到衍生自哺乳动物、病毒或昆虫基因的适合的转录和/或翻译调控元件。此类调控元件包括转录启动子、增强子、编码适合的mrna核糖体结合位点的序列以及控制转录和翻译终止的序列,如本文详细描述。哺乳动物表达载体还可包括非转录元件,诸如复制起点、其他5'或3'侧翼非转录序列,以及5'或3'非翻译序列诸如剪接供体和受体位点。还可并入帮助识别转染子的另外的选择性标记基因(诸如荧光标记)。在另一个实施方案中,载体包括编码所关注蛋白的核酸分子(或所关注基因),其包括含有所述核酸分子(基因)的表达载体,其中该核酸分子(基因)可操作地连接到表达控制序列。提供包括所关注基因(goi)的载体,其中该goi可操作地连接到适合在哺乳动物宿主细胞中表达的表达控制序列。可用于本发明的有用的启动子包括但不限于sv40早期启动子区、包含在劳氏肉瘤病毒的3'长末端重复序列中的启动子、金属硫蛋白基因的调控序列、小鼠或人类巨细胞病毒ie启动子(gossen等人,(1995)proc.nat.acad.sci.usa89:5547-5551)、花椰菜花叶病毒35srna启动子以及光合成酶核酮糖二磷酸羧化酶的启动子、来自酵母或其他真菌的启动子元件诸如gal4启动子、adc(醇脱氢酶)启动子、pgk(磷酸甘油激酶)启动子、碱性磷酸酶启动子以及下列动物转录控制区,其表现出组织特异性并已用于转基因动物:弹性蛋白酶i、胰岛素、免疫球蛋白、小鼠乳腺肿瘤病毒、白蛋白、甲胎蛋白、α1-抗胰蛋白酶、β-球蛋白和肌球蛋白轻链-2。本发明的核酸分子还可以可操作地连接到有效的poly(a)终止序列(例如sv40poly(a))、用于大肠杆菌中质粒产物的复制起点和/或方便的克隆位点(例如多接头)。核酸还可包括与组成型启动子相反的可调节的诱导型启动子(可诱导的、可抑制的、发育性调节的),诸如cmvie(技术人员将认识到,此类术语实际上为某些条件下的基因表达程度的描述语)。本发明提供制备所关注蛋白的方法,而提供包括所关注基因(goi)的表达载体。此类表达载体可用于重组制备任何所关注蛋白。可用于转染脊椎动物细胞的表达载体中的转录和翻译控制序列可通过病毒来源而提供。例如,常用的启动子和增强子衍生自病毒,诸如多瘤病毒、腺病毒2、猴病毒40(sv40)和人类巨细胞病毒(cmv)。病毒基因组启动子、控制和/或信号序列可用于驱动表达,所提供的此类控制序列与所选择的宿主细胞相容。取决于在其中表达重组蛋白的细胞类型,还可使用非病毒细胞启动子(例如,β-球蛋白和ef-1α启动子)。衍生自sv40病毒基因组的dna序列例如sv40起点、早期和晚期启动子、增强子、剪接和多聚腺苷化位点可用于提供对异源dna序列的表达有用的其他基因元件。早期和晚期启动子是特别有用的,因为二者可容易地从sv40病毒作为还含有sv40病毒复制起点的片段得到(fiers等人,nature273:113,1978)。也可使用较小或较大的sv40片段。通常,包括从位于sv40复制起点中的hindiii位点向bgli位点延伸的大约250bp序列。用于表达多个转录物的双顺反子表达载体先前已有描述(kims.k.和woldb.j.,cell42:129,1985;kaufman等人1991,同上)并可与gpt表达系统组合使用。其他类型的表达载体也将是有用的,例如描述于美国专利第4,634,665号(axel等人)和美国专利第4,656,134号(ringold等人)中的那些。整合位点(例如重组酶识别位点)可置于编码poi的基因序列的5’或3’。适合的整合位点的一个实例为loxp位点。适合的整合位点的另一个实例为两个重组酶识别位点,例如选自loxp位点、lox和lox5511位点。基因扩增盒及其表达载体先前已描述或本领域已知的有用调控元件也可包括在用于转染哺乳动物细胞的核酸中。图1举例说明gpt载体中的可操作盒,其还包括启动子序列、ires序列、所关注基因和poly(a)序列。在本发明的上下文中的表达载体可以是任何适合的载体,包括染色体、非染色体和合成的核酸载体(包括一组适合的表达控制元件的核酸序列)。此类载体的实例包括sv40的衍生物、细菌质粒、嗜菌体dna、杆状病毒、酵母质粒、衍生自质粒和嗜菌体dna组合的载体、以及病毒核酸(rna或dna)载体。在一个实施方案中,编码抗体的核酸分子包含在裸dna或rna载体中,包括例如线性表达元件(如描述于例如sykes和johnston,natbiotech12,355-59(1997)中)、紧凑的核酸载体(如描述于例如us6,077,835和/或wo00/70087中)或质粒载体诸如pbr322、puc19/18或puc118/119。此类核酸载体及其用法为本领域熟知的(参见例如us5,589,466和us5,973,972)。或者,表达载体可为适合在酵母系统中表达的载体。可使用任何适合在酵母系统中表达的载体。适合的载体包括例如包含组成型或诱导型启动子的载体,诸如酵母α因子、醇氧化酶和pgh(综述见于:f.ausubel等人编currentprotocolsinmolecularbiology,greenepublishingandwileyintersciencenewyork(1987)以及grant等人,methodsinenzymol153,516-544(1987))。在某些实施方案中,载体包括编码所关注蛋白的核酸分子(或所关注基因),其包括含有所述核酸分子(基因)的表达载体,其中该核酸分子(基因)可操作地连接到适合在宿主细胞中表达的表达控制序列。表达控制序列经工程化以控制和驱动所关注基因的转录,及后续在各种细胞系统中的蛋白表达。质粒将可表达的所关注基因与包括所需调控元件比如启动子、增强子、选择性标记、操纵子等的表达控制序列(即表达盒)组合。在本发明的表达载体中,gpt和所关注蛋白诸如编码抗体的核酸分子可包括以下部分或与它们相关:任何适合的启动子、增强子、操纵子、阻遏蛋白、poly(a)终止序列和其他表达促进元件。所关注基因(例如编码抗体的核苷酸序列)的表达可置于本领域已知的任何启动子或增强子元件的控制下。此类元件的实例包括强表达启动子(例如,人类cmvie启动子/增强子或cmv主要ie(cmv-mie)启动子,以及rsv、sv40晚期启动子、sl3-3、mmtv、泛素(ubi)、泛素c(ubc)和hivltr启动子)。在一些实施方案中,该载体包括选自以下的启动子:sv40、cmv、cmv-ie、cmv-mie、rsv、sl3-3、mmtv、ubi、ubc和hivltr。本发明的核酸分子还可以可操作地连接到有效的poly(a)终止序列、用于大肠杆菌中质粒产物的复制起点、作为选择性标记的抗生素抗性基因、和/或方便的克隆位点(例如多接头)。核酸还可包括与组成型启动子相反的可调节的诱导型启动子(可诱导的、可抑制的、发育性调节的),诸如cmvie(技术人员将认识到,此类术语实际上为某些条件下的基因表达程度的描述语)。选择性标记是本领域熟知的元件。在某些情况下,除了gpt之外,还可以使用另外的选择性标记,其中此类标记使细胞可见。可使用正选择或负选择。在一些实施方案中,该载体包括一种或多种编码绿色荧光蛋白(gfp)、增强的绿色荧光蛋白(egfp)、氰基荧光蛋白(cfp)、增强的氰基荧光蛋白(ecfp)、黄色荧光蛋白(yfp)或增强的黄色荧光蛋白(eyfp)的选择性标记基因。就本发明的目的而言,真核细胞中的基因表达可使用强启动子紧密调节,该启动子通过操纵子来控制,而该操纵子继而由调节性融合蛋白(rfp)来调节。rfp基本上由转录阻断域和调节其活性的配体结合域组成。此类表达系统的实例描述于us20090162901a1中,其全文以引用方式并入本文。许多真核细胞和嗜菌体中的操纵子已研究透彻(neidhardt编escherichiacoliandsalmonella;cellularandmolecularbiology第2版第2卷asmpress,washingtond.c.1996)。这些包括但不限于大肠杆菌的lexa基因的操纵子区,其与lexa肽结合,以及乳糖和色氨酸操纵子,其与由大肠杆菌的laci和trpr基因编码的阻遏蛋白结合。这些还包括来自λpr和噬菌体p22ant/mnt基因的嗜菌体操纵子,其与由λci和p22arc编码的阻遏蛋白结合。在一些实施方案中,当阻遏蛋白的转录阻断域为限制酶诸如noti时,操纵子为该酶的识别序列。本领域的技术人员将认识到,操纵子必须位于启动子附近或位于启动子的3',以使得其能够通过该启动子控制转录。例如,美国专利第5,972,650号(以引用方式并入本文)规定了teto序列在tata盒的特定距离内。在具体实施方案中,该操纵子优选地置于启动子的正下游。在其他实施方案中,该操纵子置于启动子的10个碱基对内。在某些实施方案中,该操纵子选自:tet操纵子(teto)、noti识别序列、lexa操纵子、乳糖操纵子、色氨酸操纵子和arc操纵子(ao)。在一些实施方案中,阻遏蛋白选自tetr、lexa、laci、trpr、arc、λc1和gal4。在其他实施方案中,该转录阻断域衍生自真核阻遏蛋白,例如衍生自gal4的阻遏域。在示例性细胞表达系统中,细胞经工程化以表达四环素阻遏蛋白(tetr)且所关注蛋白置于启动子的转录控制下,而该启动子的活性受tetr调控。两个一前一后的tetr操纵子(teto)置于载体中的cmv-mie启动子/增强子的正下游。由这样的载体中的cmv-mie启动子所指导的编码所关注蛋白的基因的转录在不存在四环素或在某些其他适合的诱导物(例如强力霉素)的情况下可被tetr阻断。在诱导物的存在下,tetr蛋白能结合teto,因而使所关注蛋白的转录然后使翻译(表达)发生(参见例如美国专利第7,435,553号,其全文以引用方式并入本文)。另一种示例细胞表达系统包括调节性融合蛋白,诸如tetr-erlbdt2融合蛋白,其中该融合蛋白的转录阻断域为tetr而配体结合域为具有t2突变的雌激素受体配体结合域(erlbd)(erlbdt2;feil等人(1997)biochem.biophys.res.commun.237:752-757)。当teto序列置于强cmv-mie启动子的下游和附近时,来自cmv-mie/teto启动子的所关注核苷酸序列的转录在他莫昔芬的存在下被阻断,并通过移除他莫昔芬解除阻断。在另一个实例中,使用融合蛋白arc2-erlbdt2(由通过15个氨基酸的接头所连接的两个arc蛋白所组成的单链二聚体和erlbdt2(同上)所组成的融合蛋白)涉以及arc操纵子(ao),更具体地讲,cmv-mie启动子/增强子正下游的两个一前一后的arc操纵子。细胞系可由arc2-erlbdt2调节,其中表达所关注蛋白的细胞由cmv-mie/arco2启动子驱动并可通过移除他莫昔芬来诱导。(参见例如us20090162901a1,其以引用方式并入本文)。在一些实施方案中,本发明的载体包括cmv-mie/teto或cmv-mie/ao2杂交启动子。本发明的载体还可将cre-lox工具用于重组技术,以便有利于所关注基因的复制。cre-lox策略需要至少两个组成部分:1)cre重组酶,一种催化两个loxp位点之间的重组的酶;以及2)loxp位点(例如,由8-bp核心序列(重组在其中进行)和两个侧翼13-bp反向重复序列所组成的特异性34-碱基对bp序列)或突变lox位点。(参见例如araki等人pnas92:160-4(1995);nagy,a.等人genesis26:99-109(2000);araki等人nucacidsres30(19):e103(2002)和us20100291626a1,其全部以引用方式并入本文)。在另一种重组策略中,酵母衍生的flp重组酶可与共有序列frt一起使用(另见例如dymecki,s.pnas93(12):6191-6196(1996))。在另一个方面,基因(即编码本发明重组多肽的核苷酸序列)插入表达盒的gpt基因的上游或下游,且任选可操作地连接到启动子,其中该启动子连接的基因的5’侧翼为第一重组酶识别位点而3’侧翼为第二重组酶识别位点。此类重组酶识别位点允许表达系统的宿主细胞中cre介导的重组。在一些情况下,第二启动子连接的基因在第一基因的下游(3’)且3’侧翼为第二重组酶识别位点。在另外其他情况下,第二启动子连接的基因的5’侧翼为第二重组酶识别位点,而3’侧翼为第三重组酶识别位点。在一些实施方案中,重组酶识别位点选自loxp位点、lox511位点、lox2272位点和frt位点。在其他实施方案中,重组酶识别位点为不同的。在又一个实施方案中,宿主细胞包括能表达cre重组酶的基因。在一个实施方案中,载体包括编码本发明的抗体轻链或抗体重链的第一基因,以及编码本发明的抗体轻链或抗体重链的第二基因。在一些实施方案中,载体还包括x-盒结合蛋白1(mxbp1)基因,其能够通过内质网(er)中的蛋白折叠所涉及到的基因表达的控制进一步增强蛋白产生/蛋白分泌。(参见例如rond和walterp.natrevmolcellbiol.8:519–529(2007))。任何细胞均适于表达本发明的重组核酸序列。用于本发明的细胞包括哺乳动物细胞,诸如非人类动物细胞、人类细胞或细胞融合物,比如杂交瘤或四源杂交瘤。在某些实施方案中,细胞为人、猴、仓鼠、大鼠或小鼠细胞。在其他实施方案中,细胞为真核细胞并且选自以下细胞:cho(例如chok1、dxb-11cho、veggie-cho)、cos(例如cos-7)、视网膜细胞、vero、cv1、肾(例如hek293、293ebna、msr293、mdck、hak、bhk21)、hela、hepg2、wi38、mrc5、colo25、hb8065、hl-60、jurkat、daudi、a431(表皮的)、cv-1、u937、3t3、l细胞、c127细胞、sp2/0、ns-0、mmt细胞、肿瘤细胞和来源于前述细胞的细胞系。在一些实施方案中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如per.细胞)。在又一个方面,本发明涉及重组的哺乳动物宿主细胞,诸如转染瘤,其产生免疫球蛋白,诸如抗体或双特异性分子。此类宿主细胞的实例包括工程化的哺乳动物细胞,诸如cho或hek细胞。例如,在一个实施方案中,本发明提供包括稳定整合到细胞基因组中的核酸的细胞,该核酸包括编码抗体表达的序列,而该抗体包括本发明的重组多肽。在另一个实施方案中,本发明提供包括非整合(即附加型)核酸(诸如质粒、粘粒、噬粒或线性表达元件)的细胞,该核酸包括编码抗体表达的序列,而该抗体包括本发明的重组多肽。在其他实施方案中,本发明提供通过用包括本发明表达载体的质粒来稳定转染宿主细胞而产生的细胞系。因此,在一个方面,本发明提供包含以下部分的细胞:(a)编码外源性添加的哺乳动物gpt基因的重组多核苷酸以及(b)编码多亚基蛋白的多核苷酸。在一些实施方案中,外源性添加的gpt基因与seqidno:2的核酸序列90%相同,其非限制性实例提供于seqidno:11-17中,且多亚基蛋白为抗体。在其他实施方案中,细胞还含有外源性添加的gpt基因和调控元件。在一个实施方案中,细胞为哺乳动物细胞,诸如用于制备生物药品的cho细胞。在另一个方面,本发明提供衍生自在之前方面所述的细胞的细胞系。所谓“衍生自”是指由各个细胞无性繁殖的并具有某些选定品质(诸如以给定效价产生活性蛋白的能力,或增殖至特定密度的能力)的细胞群。在一些实施方案中,衍生自具有编码哺乳动物gpt基因的重组多核苷酸和编码多亚基蛋白的多核苷酸的细胞的细胞系能够以至少3克每升(g/l)培养基、至少5g/l或至少8g/l的效价产生多亚基蛋白。在一些实施方案中,该细胞系可达到比由基本上相同但无编码gpt的重组多核苷酸的细胞所衍生的细胞系所能达到的累积细胞密度(icd)大至少30%、大至少50%、大至少60%或大至少90%的累积细胞密度。提供了扩增goi的方法。举例说明的方法将增加浓度的衣霉素施用于真核gpt表达系统,从而扩增可操作地连接到外源性添加的哺乳动物gpt基因的goi的基因拷贝。所关注蛋白编码所关注基因的核酸序列可方便地整合到包括tn抗性标记基因和ires,且任选侧翼有重组酶识别位点的细胞中。可使用任何适合在哺乳动物细胞中表达的所关注蛋白,然而糖蛋白将尤其受益于本发明的方法。例如,所关注蛋白可为抗体或其抗原结合片段、双特异性抗体或其片段、嵌合抗体或其片段、scfv或其片段、fc标签蛋白(例如trap蛋白)或其片段、生长因子或其片段、细胞因子或其片段、细胞表面受体的胞外域或其片段。具有天冬酰胺连接的(n-连接的)聚糖的糖蛋白普遍存在于真核细胞中。这些聚糖的生物合成及其向多肽的转化在内质网(er)中发生。n-聚糖结构在er和高尔基复合体中通过许多糖苷酶和糖基转移酶进一步修饰。使用本发明进行的蛋白制备针对天然n-聚糖结构的一致性,以消除免疫原性表位(“糖表位”(glycotope))。使用本发明的方法,重组蛋白批次表现出有利的特性。重复的蛋白生产批次的hplc(以荧光检测)证明了糖蛋白具有统一的表达和糖基化模式,如本文图7-8中举例说明。提供了使n-聚糖蛋白底物糖基化的方法,其中提供编码核酸分子的哺乳动物宿主细胞,该核酸分子包含可操作地连接到编码需要糖基化的蛋白底物的基因的哺乳动物衣霉素(tn)抗性基因;将该细胞在第一浓度的tn存在下培养;将表达tn抗性基因的至少一个拷贝的细胞群分离;将该细胞群在增加浓度的tn存在下培养;以及从细胞培养中分离n-聚糖蛋白底物。蛋白底物的n-聚糖含量可就单糖、寡糖的存在通过本领域已知的任何方法来评估。聚糖连接的蛋白的详细结构分析可与蛋白的功能特征相关联。这种对蛋白糖基化进行表征的分析通常涉以及以下几个步骤:i)酶或化学释放所连接的聚糖;ii)经由芳族或脂族胺的还原性胺化或全甲基化使释放的聚糖衍生化;iii)分析聚糖。许多分析糖化模式的变化是技术人员已知的。糖蛋白可带有以特定数量占据各个位点的数种形式的糖型,并因此而言,其复杂性可能使其难以在某些生产方法中重现。糖型的类型和数量的一致性是可测量的且代表治疗性蛋白生产的期望结果。宿主细胞和转染用于本发明方法中的哺乳动物宿主细胞为真核宿主细胞,通常为哺乳动物细胞,包括例如cho细胞和小鼠细胞。在一个实施方案中,本发明提供包括编码衍生自中国仓鼠(cricetulusgriseus)的tn抗性标记蛋白的核酸序列(如seqidno:3所示)或其同源物或变体的细胞。在一些实施方案中,该细胞包括tn抗性标记基因的多基因拷贝。在其他实施方案中,本发明提供编码衍生自人类(seqidno:4)、猕猴(seqidno:5)、黑猩猩(seqidno:6)、狗(seqidno:7)、豚鼠(seqidno:8)、大鼠(seqidno:9)或小鼠(seqidno:10)的tn抗性标记蛋白的核酸序列。本发明包括用本发明的表达载体转染的哺乳动物宿主细胞。经转染的宿主细胞包括经表达载体转染的细胞,而该表达载体包括编码所关注蛋白或多肽的序列。所表达的蛋白将通常取决于所选的核酸序列而分泌到培养基中,但可能保持在细胞中或沉积在细胞膜中。各种哺乳动物细胞培养系统均可用于表达重组蛋白。适合的哺乳动物宿主细胞系的实例包括gluzman(1981)cell23:175所述的猴肾脏细胞的cos-7细胞系,以及能够表达适当载体的其他细胞系,包括例如cv-1/ebna(atcccrl10478)、l细胞、c127、3t3、cho、hela和bhk细胞系。针对特定选择或扩增流程而开发的其他细胞系也可与本文所提供的方法和组合物一起使用。在本发明的一个实施方案中,该细胞为称为k1的cho细胞系(即chok1细胞)。为了实现重组蛋白高产量的目标,宿主细胞系应在适当的情况下预先适应生物反应器培养基。本领域已知数种转染方法,它们在kaufman(1988)meth.enzymology185:537中进行了综述。所选的转染方案将取决于宿主细胞类型和goi性质,且可基于常规实验来选择。任何这样的方案的基本要求是首先将编码所关注蛋白的dna引入适合的宿主细胞中,然后以相对稳定、可表达的方式鉴定和分离已包含异源dna的宿主细胞。可用于将异源dna引入哺乳动物细胞的某些试剂包括lipofectintm试剂和lipofectaminetm试剂(gibcobrl,gaithersburg,md.)。这两种试剂均为用于形成脂质-核酸复合物(或脂质体)的市售试剂,当应用于培养的细胞时,有利于核酸摄入细胞中。所选的转染方案和选择用于其中的元件将取决于所用的宿主细胞的类型。本领域的技术人员知道许多不同的方案和宿主细胞,并且可基于所用的细胞培养系统的要求来选择用于表达所需蛋白的适当系统。在另一个方面,本发明涉及编码多肽的表达载体,其包括但不限于抗体、双特异性抗体、嵌合抗体、scfv、抗原结合蛋白或fc融合蛋白。此类表达载体可用于使用本发明的方法和组合物进行的重组多肽制备。本发明的其他特征在以下对示例性实施方案的描述过程中将变得显而易见,这些实施方案用于说明本发明而无意限制本发明。实施例提供以下实施例是为了向本领域的普通技术人员描述如何构造和使用本发明的方法和组合物,而非旨在限制发明人所认为的其发明的范围。已努力确保有关所用的数字(例如量、温度等)的准确性,但应考虑某些实验误差和偏差。除非另有指出,否则份数为重量份,分子量为平均分子量,温度为摄氏度,而压力为大气压或接近大气压。实施例1表达gpt的转染细胞的选择效率。将经修饰的chok1细胞用含有cho-gpt(seqidno:2)、人类gpt(seqidno:12)的质粒载体或含有潮霉素磷酸转移酶(hpt,潮霉素抗性基因)的质粒载体转染;例如,将选择性标记基因(cho-gpt或hpt)在其相应载体中经由ires序列在转录上连接到下游egfp基因。例如,各质粒被构建成在5’至3’方向上包含下列基因序列:lox位点、sv40晚期启动子、cho-gpt(或hpt)、ires、增强的绿色荧光蛋白(egfp)和第二lox位点。将纯化的重组质粒与表达cre重组酶的质粒共同转染进从5'至3'在转录活性基因座处含有以下位点的经修饰的cho宿主细胞:lox位点、yfp和第二lox位点。因此,宿主cho细胞可通过流式细胞术作为绿色阳性或黄色阴性细胞分离。当表达egfp(转录上受gpt或hpt基因调控)的重组质粒与表达cre重组酶的质粒共同转染时,由cre重组酶介导的重组在含有lox位点的染色体基因座处导致gpt/egfp盒的位点特异性整合,并且发生yfp基因的取代(即绿色阳性细胞)。若egfp随机整合,则将产生绿色阳性和黄色阳性两种细胞。将细胞群用0、1μg/ml、2.5μg/ml或5μg/ml衣霉素(tn)或400μg潮霉素(hyg)温育,如表2所概述。通过荧光激活细胞分选(facs)分析来测量观察到的重组群体(orp)。对细胞进行分选以定量各细胞群,并针对仅表达gfp而不表达yfp的细胞计算选择效率(图4或5)。比较耐tn或hyg的细胞池之间的选择效率(表达gfp的存活细胞的群体百分比)(表2)。表2:选择效率据观察,衣霉素选择与潮霉素选择同样高效。cho-gpt和人类gpt在1μg/ml或2.5μg/ml衣霉素存在下在整合体的选择方面均是高效的。实施例2基因产物的扩增。通过将增加浓度的衣霉素施用于gpt表达系统来进行增量选择。用含有如上cho-gpt基因(seqidno:2)的质粒载体转染chok1细胞。该质粒以5’至3’方向含有第一lox位点、sv40晚期启动子、cho-gpt基因、ires、egfp和第二lox位点。cre-lox位点指导所关注基因整合到基因组中,从而产生每个细胞具有至少一个gpt插入的稳定的转染细胞池。(如上所见,由于随机整合,可产生更多的整合体)。最初在1μg/ml衣霉素(tn)存在下培养cho细胞。然后从稳定的池(称为细胞池2)中选择转染子,随后在1μg/ml、2.5μg/ml或5μg/mltn存在下扩增。进行数轮选择以鉴别能增强egfp表达(多个拷贝)的细胞群。在2.5μg/ml或5μg/mltn存在下,随机整合事件大大增加。使用标准qpcr法测量基因产物chogpt、egfp或mgapdh(归一化对照)的拷贝数。来自进一步用2.5μg/mltn温育的1μg/mltn抗性池的细胞中的egfp拷贝数为来自进一步用1μg/mltn温育的1μg/mltn抗性池的egfp拷贝数的至少2倍。当经1μg/mltn处理的池进一步用5μg/mltn温育时,基因拷贝数进一步增加。egfp基因拷贝数的增加与增加的cho-gpt基因拷贝相关联。(参见图6a和6b)。为了确定基因拷贝数的增加是否会转变成增加的蛋白表达,针对经多轮tn选择(即1、2.5或5μgtn)处理过的表达gpt和egfp的相同细胞池,通过facs测量了平均荧光强度(mfi)(参见例如图6b中的实例7、8和9)。这些细胞池的egfp表达的比较在表3中示出。就egfp生成而言,接受第二轮5μgtn选择的表达gpt的细胞池,相较于1μgtn处理,产量恰好为2.5倍,相较于2.5μgtn处理,产量为1.5倍(表3)。表3:egfp蛋白产生gpt1μg池+第二tn(μg)处理mfi1μg10982.5μg18675μg2854不受任一理论的束缚,tn浓度的递增以受控的方式放大了对细胞的选择压力,从而提高产量。如下所述,还将tn抗性表达载体用于另外的实验,以检测tn选择对糖基化模式的作用。实施例3示例性二聚蛋白的表达和糖基化谱。用含有gpt的表达载体转染表达“trap”蛋白(fc融合蛋白1,下文称为fcfp1)的cho细胞。该质粒以5’至3’方向具有lox位点、sv40晚期启动子、tn抗性基因(cho-gpt)、iresegfp、sv40polya和第二lox位点。使用1μg/mltn或5μg/mltn进行gpt选择性标记的选择。通过悬浮培养于无血清的生产培养基中来扩增所选的细胞池。通过facs分析,由egfp的表达确认了gpt转染。将从所选的池收集的团块送去进行gpt表达的拷贝数分析,并建立12天的生产率分析,以测定用不同浓度的衣霉素选择的池中的fcfp1表达水平。对fcfp1就其复合糖基化模式进行选择,其具有丰富的糖基化位点。为了测定糖基化谱,将表达fcf1蛋白的细胞在标准方案(无tn)或tn处理条件(如表4所示)下进行细胞培养而扩增,然后分离并纯化蛋白。表4:fcfp1蛋白产生蛋白批号处理fcfp1trap110728无fcfp1trap110728-11μg/mltnfcfp1trap110728-25μg/mltn使用基于熟知的hplc方法的色谱法和荧光邻氨基苯甲酸(aa)标签(anumula和dhume,glycobiology,8(7):685-694,1998),就各批次糖蛋白进行详细的聚糖分析,以确定tn对糖基化谱是否有负面影响。还将生产批次与代表治疗上可接受的蛋白批次的参照标准进行了比较。代表性聚糖分析如图7a-7d所示。各批次(相较于参照批次)一致地产生相同的波峰数目、相对形状和相对强度。各色谱图的重叠(图8)表明并无独特或异常的波峰露出。通过熟知的hplc方法针对参照标准批次就fcfp1蛋白进行了寡糖性质分析。就fcfp1trap蛋白批次测量了唾液酸化的量,并计算了各批次(3个重复)的z数。z数代表各批次之间变异的量度。z数考虑相对波峰数以及各波峰的相对形状和强度。例如,图7a-7d中各0sa、1sa、2sa、3sa和4sa波峰的面积如表5经定量。表5:寡糖定量分析os=寡糖;0sa=0个唾液酸残基;1sa=1个唾液酸残基;2sa=2个唾液酸残基;3sa=3个唾液酸残基;4sa=4个唾液酸残基相较于参照批次,各批所计算的z数在可接受范围内,因此应当理解,各蛋白批次达到与治疗分子相同的物质。因为tn的存在已知对于n-连接的糖蛋白的糖基化具有负面作用,因此,鉴于由tn产生的增加的选择压力条件,蛋白产生和产率是可靠和一致的这种情况出人意料。在不背离本发明的精神或实质的情况下,本发明可以体现为其他具体实施方案。序列表<110>regeneronpharmaceuticals,inc.deshpande,dipaliburakov,daryachen,gangfandl,jamesp.<120>重组蛋白的高效选择性<130>8700wo<150>us62/039,416<151>2014-08-19<160>17<170>patentin3.5版<210>1<211>6964<212>dna<213>人工序列<220><223>合成的<400>1aagcttatactcgagctctagattgggaacccgggtctctcgaattcgagatctagttta60aacacgcggccgctaatcagccataccacatttgtagaggttttacttgctttaaaaaac120ctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttaacttg180tttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaataaa240gcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatcat300gtctaccggtataacttcgtataatgtatactatacgaagttagccggtagggcccctct360cttcatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggc420gtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagag480gtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgt540gcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcggg600aagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcg660ctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccgg720taactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccac780tggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtg840gcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagt900taccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcgg960tggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcc1020tttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggatttt1080ggtcatgggcgcgcctcatactcctgcaggcatgagattatcaaaaaggatcttcaccta1140gatccttttaaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttg1200gtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcg1260ttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttacc1320atctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatc1380agcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgc1440ctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatag1500tttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtat1560ggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtg1620caaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagt1680gttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaag1740atgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcg1800accgagttgctcttgcccggcgtcaatacgggataatactgcgccacatagcagaacttt1860aaaagtgctcatcattggaaaacgtttttcggggcgaaaactctcaaggatcttaccgct1920gttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttac1980tttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaat2040aagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcat2100ttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaaca2160aataggggttccgcgcacatttccccgaaaagtgccacctgacgtcaggtacacaacttc2220gtatagcatacattatacgaagttatggtaccaagcctaggcctccaaaaaagcctcctc2280actacttctggaatagctcagaggcagaggcggcctcggcctctgcataaataaaaaaaa2340ttagtcagccatggggcggagaatgggcggaactgggcggagttaggggcgggatgggcg2400gagttaggggcgggactatggttgctgactaattgagatgcatgctttgcatacttctgc2460ctgctggggagcctggggactttccacacctggttgctgactaattgagatgcatgcttt2520gcatacttctgcctgctggggagcctggggactttccacaccggatccaccatgtgggcc2580ttcccggagttgccgctgccgctgctggtgaatttgttcggctcgctgctgggatttgtg2640gctactgtgaccctcatccctgccttccgtagccactttatcgccgcgcgcctctgtggc2700caggacctcaacaagctcagccggcagcagatcccagaatcccagggagtgatctgcggt2760gctgttttccttatcatcctcttctgcttcatccctttccccttcctgaactgctttgtg2820gaggagcagtgtaaggcattcccccaccatgaatttgtggccctgataggtgccctcctt2880gccatctgctgcatgatcttcctgggcttcgctgatgatgtactcaatctgcgctggcgc2940cataagctgctgctgcccacagctgcctctctacctctcctcatggtttacttcactaac3000tttggcaatacaaccattgtggtacccaagcccttccgctggattcttggcctgcatttg3060gacttgggaatcctatactatgtctacatgggactgcttgcggtgttctgtaccaatgcc3120atcaacatcctagcaggaattaatggcctagaggctggtcagtcactagtcatctctgct3180tctatcattgtcttcaacctggtagagctggaaggtgattatcgggatgatcatgtcttt3240tccctctacttcatgataccatttttttttaccaccttgggattgctataccataactgg3300tacccatcacaggtgtttgtgggagataccttctgttattttgctggcatgacctttgcc3360gtggtgggaatcttgggacacttcagcaagaccatgctactcttctttattccacaagtg3420ttcaatttcctctactcgctgcctcagctccttcacgccatcccctgccctcgacaccgc3480atacccagactcaatccgaagacgggcaaactggagatgagctattccaagttcaagacc3540aagaacctctctttcttgggcacctttattttaaaggtagcagagcgcctccagctagtg3600acagttcaccgaggcgagagtgaggatggtgccttcactgaatgtaacaacatgaccctc3660atcaacttgctactcaaaatctttgggcccatacatgagagaaacctcacactgctcctg3720ctgcttttgcagatcctgagcagcgctgtcaccttctccattcgataccagcttgtccga3780ctcttctatgatgtctgaacgcgtcccccctctccctcccccccccctaacgttactggc3840cgaagccgcttggaataaggccggtgtgcgtttgtctatatgttattttccaccatattg3900ccgtcttttggcaatgtgagggcccggaaacctggccctgtcttcttgacgagcattcct3960aggggtctttcccctctcgccaaaggaatgcaaggtctgttgaatgtcgtgaaggaagca4020gttcctctggaagcttcttgaagacaaacaacgtctgtagcgaccctttgcaggcagcgg4080aaccccccacctggcgacaggtgcctctgcggccaaaagccacgtgtataagatacacct4140gcaaaggcggcacaaccccagtgccacgttgtgagttggatagttgtggaaagagtcaaa4200tggctctcctcaagcgtattcaacaaggggctgaaggatgcccagaaggtaccccattgt4260atgggatctgatctggggcctcggtgcacatgctttacatgtgtttagtcgaggttaaaa4320aacgtctaggccccccgaaccacggggacgtggttttcctttgaaaaacacgattgctcg4380aatcaccatggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcga4440gctggacggcgacgtaaacggccacaagttcagcgtgtccggcgagggcgagggcgatgc4500cacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctg4560gcccaccctcgtgaccaccctgacctacggcgtgcagtgcttcagccgctaccccgacca4620catgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcac4680catcttcttcaaggacgacggcaactacaagacccgcgccgaggtgaagttcgagggcga4740caccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatcct4800ggggcacaagctggagtacaactacaacagccacaacgtctacatcatggccgacaagca4860gaagaacggcatcaaggtgaacttcaagatccgccacaacatcgaggacggcagcgtgca4920gctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccga4980caaccactacctgagcacccagtccgccctgagcaaagaccccaacgagaagcgcgatca5040catggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgta5100caagtaatcggccgctaatcagccataccacatttgtagaggttttacttgctttaaaaa5160acctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttaact5220tgtttattgcagcttataatggttacaaataaagcaatagcatcacaaatttcacaaata5280aagcatttttttcactgcattctagttgtggtttgtccaaactcatcaatgtatcttatc5340atgtcggcgcgttgacattgattattgactagttattaatagtaatcaattacggggtca5400ttagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcct5460ggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagta5520acgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccac5580ttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggt5640aaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcag5700tacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaat5760gggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaat5820gggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgcc5880ccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctctc5940cctatcagtgatagagatctccctatcagtgatagagatcgtcgacgtttagtgaaccgt6000cagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgggaccga6060tccagcctccgcggccgggaacggtgcattggaacgcggattccccgtgccaagagtgac6120gtaagtaccgcctatagagtctataggcccacccccttggcttcttatgcatgctatact6180gtttttggcttggggtctatacacccccgcttcctcatgttataggtgatggtatagctt6240agcctataggtgtgggttattgaccattattgaccactcccctattggtgacgatacttt6300ccattactaatccataacatggctctttgccacaactctctttattggctatatgccaat6360acactgtccttcagagactgacacggactctgtatttttacaggatggggtctcatttat6420tatttacaaattcacatatacaacaccaccgtccccagtgcccgcagtttttattaaaca6480taacgtgggatctccacgcgaatctcgggtacgtgttccggacatgggctcttctccggt6540agcggcggagcttctacatccgagccctgctcccatgcctccagcgactcatggtcgctc6600ggcagctccttgctcctaacagtggaggccagacttaggcacagcacgatgcccaccacc6660accagtgtgccgcacaaggccgtggcggtagggtatgtgtctgaaaatgagctcggggag6720cgggcttgcaccgctgacgcatttggaagacttaaggcagcggcagaagaagatgcaggc6780agctgagttgttgtgttctgataagagtcagaggtaactcccgttgcggtgctgttaacg6840gtggagggcagtgtagtctgagcagtactcgttgctgccgcgcgcgccaccagacataat6900agctgacagactaacagactgttcctttccatgggtcttttctgcagtcaccgtccttga6960cacg6964<210>2<211>1231<212>dna<213>中国仓鼠<400>2caccatgtgggccttcccggagttgccgctgccgctgctggtgaatttgttcggctcgct60gctgggatttgtggctactgtgaccctcatccctgccttccgtagccactttatcgccgc120gcgcctctgtggccaggacctcaacaagctcagccggcagcagatcccagaatcccaggg180agtgatctgcggtgctgttttccttatcatcctcttctgcttcatccctttccccttcct240gaactgctttgtggaggagcagtgtaaggcattcccccaccatgaatttgtggccctgat300aggtgccctccttgccatctgctgcatgatcttcctgggcttcgctgatgatgtactcaa360tctgcgctggcgccataagctgctgctgcccacagctgcctctctacctctcctcatggt420ttacttcactaactttggcaatacaaccattgtggtacccaagcccttccgctggattct480tggcctgcatttggacttgggaatcctatactatgtctacatgggactgcttgcggtgtt540ctgtaccaatgccatcaacatcctagcaggaattaatggcctagaggctggtcagtcact600agtcatctctgcttctatcattgtcttcaacctggtagagctggaaggtgattatcggga660tgatcatgtcttttccctctacttcatgataccatttttttttaccaccttgggattgct720ataccataactggtacccatcacaggtgtttgtgggagataccttctgttattttgctgg780catgacctttgccgtggtgggaatcttgggacacttcagcaagaccatgctactcttctt840tattccacaagtgttcaatttcctctactcgctgcctcagctccttcacgccatcccctg900ccctcgacaccgcatacccagactcaatccgaagacgggcaaactggagatgagctattc960caagttcaagaccaagaacctctctttcttgggcacctttattttaaaggtagcagagcg1020cctccagctagtgacagttcaccgaggcgagagtgaggatggtgccttcactgaatgtaa1080caacatgaccctcatcaacttgctactcaaaatctttgggcccatacatgagagaaacct1140cacactgctcctgctgcttttgcagatcctgagcagcgctgtcaccttctccattcgata1200ccagcttgtccgactcttctatgatgtctga1231<210>3<211>408<212>prt<213>中国仓鼠<400>3mettrpalapheprogluleuproleuproleuleuvalasnleuphe151015glyserleuleuglyphevalalathrvalthrleuileproalaphe202530argserhispheilealaalaargleucysglyglnaspleuasnlys354045leuserargglnglnileprogluserglnglyvalilecysglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphevalglugluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargtrpileleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleugluglyasptyrargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserglnvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphepheileproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisalaileprocysproarghisargile290295300proargleuasnprolysthrglylysleuglumetsertyrserlys305310315320phelysthrlysasnleuserpheleuglythrpheileleulysval325330335alagluargleuglnleuvalthrvalhisargglyglusergluasp340345350glyalaphethrglucysasnasnmetthrleuileasnleuleuleu355360365lysilepheglyproilehisgluargasnleuthrleuleuleuleu370375380leuleuglnileleuserseralavalthrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>4<211>408<212>prt<213>智人<400>4mettrpalaphesergluleuprometproleuleuileasnleuile151015valserleuleuglyphevalalathrvalthrleuileproalaphe202530argglyhispheilealaalaargleucysglyglnaspleuasnlys354045thrserargglnglnileprogluserglnglyvalileserglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphevallysgluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargproileleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleugluglyaspcysargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserargvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphephemetproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisileileprocysproarghisargile290295300proargleuasnilelysthrglylysleuglumetsertyrserlys305310315320phelysthrlysserleuserpheleuglythrpheileleulysval325330335alagluserleuglnleuvalthrvalhisglnsergluthrgluasp340345350glygluphethrglucysasnasnmetthrleuileasnleuleuleu355360365lysvalleuglyproilehisgluargasnleuthrleuleuleuleu370375380leuleuglnileleuglyseralailethrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>5<211>408<212>prt<213>猕猴<400>5mettrpalaphesergluleuprometproleuleuvalasnleuile151015valserleuleuglyphevalalathrvalthrleuileproalaphe202530argglyhispheilealaalaargleucysglyglnaspleuasnlys354045thrserargglnglnileprogluserglnglyvalileserglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphevallysgluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargproileleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleugluglyaspcysargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserargvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphephemetproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisileileprocysproarghisargile290295300proargleuasnilelysthrglylysleuglumetsertyrserlys305310315320phelysthrlysserleuserpheleuglythrpheileleulysval325330335alagluserleuargleuvalthrilehisglnseraspthrgluasp340345350glygluphethrglucysasnasnmetthrleuileasnleuleuleu355360365lysilepheglyproilehisgluargasnleuthrleuleuleuleu370375380leuleuglnileleuglyseralaphethrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>6<211>408<212>prt<213>黑猩猩<400>6mettrpalaphesergluleuprometproleuleuileasnleuile151015valserleuleuglyphevalalathrvalthrleuileproalaphe202530argglyhispheilealaalaargleucysglyglnaspleuasnlys354045thrserargglnglnileprogluserglnglyvalileserglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphevallysgluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargproileleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleugluglyaspcysargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserargvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphephemetproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisileileprocysproarghisargile290295300proargleuasnilelysthrglylysleuglumetsertyrserlys305310315320phelysthrlysserleuserpheleuglythrpheileleulysval325330335alagluserleuglnleuvalthrvalhisglnsergluthrgluasp340345350glygluphethrglucysasnasnmetthrleuileasnleuleuleu355360365lysileleuglyproilehisgluargasnleuthrleuleuleuleu370375380leuleuglnileleuglyseralailethrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>7<211>408<212>prt<213>家犬<400>7mettrpalapheprogluleuprometproleuleuvalasnleuval151015glyserleuleuglyphevalalathrvalthrleuileproalaphe202530argglyhispheilealaalahisleucysglyglnaspleuasnlys354045thrglyargglnglnileprogluserglnglyvalileserglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphemetglugluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargproileleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleugluglyasptyrargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserglnvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphephemetproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisileileprocysproarghisargile290295300proargleuasnthrlysthrglylysleuglumetsertyrserlys305310315320phelysthrlysserleuserpheleuglyasnpheileleulysval325330335alaalaserleuglnleuvalthrvalhisglnsergluasngluasp340345350glyalaphethrglucysasnasnmetthrleuleuasnleuleuleu355360365lysvalleuglypromethisgluargasnleuthrleuleuleuleu370375380leuleuglnileleuglyseralavalthrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>8<211>408<212>prt<213>豚鼠<400>8mettrpalaphesergluvalproileproleuleuvalasnleuile151015glyserleuleuglyphevalalathrleuthrleuileproalaphe202530argglyhispheilealaalaargleucysglyglnaspleuasnlys354045thrasnargglnglnileprogluserglnglyvalileserglyala505560valpheleuileileleuphecyspheileprophepropheleuasn65707580cysphevallysgluglncyslysalapheprohishisglupheval859095alaleuileglyalaleuleualailecyscysmetilepheleugly100105110phealaaspaspvalleuasnleuargtrparghislysleuleuleu115120125prothralaalaserleuproleuleumetvaltyrphethrasnphe130135140glyasnthrthrilevalvalprolyspropheargprovalleugly145150155160leuhisleuaspleuglyileleutyrtyrvaltyrmetglyleuleu165170175alavalphecysthrasnalaileasnileleualaglyileasngly180185190leuglualaglyglnserleuvalileseralaserileilevalphe195200205asnleuvalgluleuglnglyasptyrargaspasphisvalpheser210215220leutyrphemetileprophephephethrthrleuglyleuleutyr225230235240hisasntrptyrproserglnvalphevalglyaspthrphecystyr245250255phealaglymetthrphealavalvalglyileleuglyhispheser260265270lysthrmetleuleuphephemetproglnvalpheasnpheleutyr275280285serleuproglnleuleuhisileileprocysproarghisargile290295300proargleuasnthrlysthrglylysleuglumetsertyrserlys305310315320phelysthrasnserleuserpheleuglythrpheileleulysval325330335alagluargleuglnleuvalthrvalhisargsergluglygluasp340345350glyalaphethrglucysasnasnmetthrleuileasnleuleuleu355360365lysilepheglyproilehisgluargasnleuthrleuleuleuleu370375380leuleuglnilevalglyseralavalthrpheserileargtyrgln385390395400leuvalargleuphetyraspval405<210>9<211>410<212>prt<213>褐家鼠<400>9mettrpalapheprogluleuproleuproleuproleuleuvalasn151015leuileglyserleuleuglyphevalalathrvalthrleuilepro202530alapheargserhispheilealaalaargleucysglyglnaspleu354045asnlysleuserargglnglnileprogluserglnglyvalileser505560glyalavalpheleuileileleuphecyspheilepropheprophe65707580leuasncysphevalglugluglncyslysalapheprohishisglu859095phevalalaleuileglyalaleuleualailecyscysmetilephe100105110leuglyphealaaspaspvalleuasnleuargtrparghislysleu115120125leuleuprothralaalaserleuproleuleumetvaltyrphethr130135140asnpheglyasnthrthrilevalvalprolyspropheargtrpile145150155160leuglyleuhisleuaspleuglyileleutyrtyrvaltyrmetgly165170175leuleualavalphecysthrasnalaileasnileleualaglyile180185190asnglyleuglualaglyglnserleuvalileseralaserileile195200205valpheasnleuvalgluleugluglyasptyrargaspasphisval210215220pheserleutyrphemetmetprophephephethrthrleuglyleu225230235240leutyrhisasntrptyrproserglnvalphevalglyaspthrphe245250255cystyrphealaglymetthrphealavalvalglyileleuglyhis260265270pheserlysthrmetleuleuphephemetproglnvalpheasnphe275280285leutyrserleuproglnleupheglnileileprocysproarghis290295300argmetproargleuasnthrlysthrglylysleuglumetsertyr305310315320serlysphelysthrlysserleuserpheleuglythrpheileleu325330335lysvalalagluserleuargleuvalthrvalhisargglygluser340345350gluaspglyalaphethrglucysasnasnmetthrleuileasnleu355360365leuleulysvalpheglyprothrhisgluargasnleuthrleuphe370375380leuleuleuleuglnvalleuserseralavalthrpheserilearg385390395400tyrglnleuvalargleuphetyraspval405410<210>10<211>410<212>prt<213>小家鼠<400>10mettrpalapheprogluleuproleuproleuproleuleuvalasn151015leuileglyserleuleuglyphevalalathrvalthrleuilepro202530alapheargserhispheilealaalaargleucysglyglnaspleu354045asnlysleuserglnglnglnileprogluserglnglyvalileser505560glyalavalpheleuileileleuphecyspheilepropheprophe65707580leuasncysphevalglugluglncyslysalapheprohishisglu859095phevalalaleuileglyalaleuleualailecyscysmetilephe100105110leuglyphealaaspaspvalleuasnleuargtrparghislysleu115120125leuleuprothralaalaserleuproleuleumetvaltyrphethr130135140asnpheglyasnthrthrilevalvalprolyspropheargtrpile145150155160leuglyleuhisleuaspleuglyileleutyrtyrvaltyrmetgly165170175leuleualavalphecysthrasnalaileasnileleualaglyile180185190asnglyleuglualaglyglnserleuvalileseralaserileile195200205valpheasnleuvalgluleugluglyasptyrargaspasphisile210215220pheserleutyrphemetileprophephephethrthrleuglyleu225230235240leutyrhisasntrptyrproserargvalphevalglyaspthrphe245250255cystyrphealaglymetthrphealavalvalglyileleuglyhis260265270pheserlysthrmetleuleuphephemetproglnvalpheasnphe275280285leutyrserleuproglnleuphehisileileprocysproarghis290295300argmetproargleuasnalalysthrglylysleuglumetsertyr305310315320serlysphelysthrlysasnleuserpheleuglythrpheileleu325330335lysvalalagluasnleuargleuvalthrvalhisglnglygluser340345350gluaspglyalaphethrglucysasnasnmetthrleuileasnleu355360365leuleulysvalpheglyproilehisgluargasnleuthrleuleu370375380leuleuleuleuglnvalleuserseralaalathrpheserilearg385390395400tyrglnleuvalargleuphetyraspval405410<210>11<211>1920<212>dna<213>小家鼠<400>11gttgcttcctaagagcttcttgctggtcaggagggagggtcaggtcctagcgtcctagct60gggttttgttcccgctggcgccggaatcctctgcgggttgggagccgcactgccggctgc120cgaggccacgggattgttcctggcttaccagttagctgagtaggcggcggggcggcggcc180accggagggtcaccatgtgggccttcccggagttgcccctgccgctgccgctgctggtga240atttgatcggctcgctgttgggattcgtggctacagtcaccctcatccctgccttccgta300gccactttatcgccgcgcgcctctgtggccaggacctcaacaagctcagccagcagcaga360tcccagagtcccagggagtgatcagcggtgctgttttccttatcatcctcttctgcttca420tccctttccccttcctgaactgcttcgtggaggagcagtgtaaggcattcccccaccatg480aatttgtggccctaataggtgccctccttgccatctgctgcatgatcttcctggggtttg540ctgatgatgtcctcaatctccgctggcgccacaagctgctgctgcccacagctgcctcac600tacctctcctcatggtctacttcacaaactttggcaatacaaccatcgtggtgcccaagc660ccttccgctggattctgggcctgcatttggacttggggatcctgtactacgtctacatgg720ggctgcttgcagtgttctgtaccaatgccatcaacatcctggcgggcattaatggcctag780aggccggtcagtcactagtcatctctgcttctatcattgtcttcaacctggtggaactgg840aaggtgattatcgagatgatcatatcttttccctttacttcatgataccatttttcttta900ccaccttgggactgctttaccacaactggtacccgtcccgcgtgtttgtgggagacacct960tctgttactttgcgggcatgacttttgccgtggtggggatcttgggacacttcagcaaga1020ccatgctgctcttctttatgccacaagtattcaatttcctctactcactgcctcagctct1080tccatatcatcccctgccctcgacaccggatgcccagactcaacgcaaagacaggcaaac1140tggaaatgagctattccaagttcaagaccaagaacctctctttcctgggcacctttattt1200taaaggtagcagagaacctccggttagtgacagttcaccaaggtgagagtgaggacggtg1260ccttcactgagtgtaacaacatgaccctcatcaacttgctacttaaagtctttgggccta1320tacatgagagaaacctcaccctgctcctgctgctcctgcaggtcctaagcagcgccgcca1380ccttctccattcgttaccaactcgtccgactcttctatgatgtctgagctccctgacagc1440tgccctttacctcacagtctccattggacctcagccaggaccagcctctgtctggtccga1500gatgaccctctggtccaggcctcgctgacacttttgttctcagcttctgccatctgtgac1560tactgatatcctggatggacaccttgctggacttgaagtccgctagttggactttgccta1620gggctttcatcttgccttgccctccctttctgtcccatctgcagcctcaccaggtgggct1680tgtagcctctattatgcaaatattcgtagctcagctttcagagcgctaactctaaaggaa1740ttcacctgagccttgagagagaacctgggctagggctagagttagggctacatactccaa1800ggtgacctcacatttgactatcaaatgaagtgttgtgattgggaagcgtagaggcagggc1860catgtgctcagaacggtgacaataaaggactgccttttacttgttaaaaaaaaaaaaaaa1920<210>12<211>2150<212>dna<213>智人<400>12aagtatccgttcttggctgcctttctttaattgcgtttccagtactctctcggtgattct60actcttgaacataggatgaaatttggaatcacacttctcttccacttccatccccaccct120ctaatgcccatattaaaaatggcggccgccgccttccgcagtaatggttgttcagcgaac180aagatccgggcggaaacagtagataggcgggtgcagcggggcagaacataggttgcctta240gagaggttccccggtgtcccgacggcggctcaagtcagagttgctgggttttgctcagat300tggtgtgggaagagcctgcctgtggggagcggccactccatactgctgaggcctcaggac360tgctgctcagcttgcccgttacctgaagaggcggcggagccgggcccctgaccggtcacc420atgtgggccttctcggaattgcccatgccgctgctgatcaatttgatcgtctcgctgctg480ggatttgtggccacagtcaccctcatcccggccttccggggccacttcattgctgcgcgc540ctctgtggtcaggacctcaacaaaaccagccgacagcagatcccagaatcccagggagtg600atcagcggtgctgttttccttatcatcctcttctgcttcatccctttccccttcctgaac660tgctttgtgaaggagcagtgtaaggcattcccccaccatgaatttgtggccctgataggt720gccctccttgccatctgctgcatgatcttcctgggctttgcggatgatgtactgaatctg780cgctggcgccataagctgctgctacctacagctgcctcactacctctcctcatggtctat840ttcaccaactttggcaacacgaccattgtggtgcccaagcccttccgcccgatacttggc900ctgcatctggacttgggaatcctgtactatgtctacatggggctgctggcagtgttctgt960accaatgccatcaatatcctagcaggaattaacggcctagaggctggccagtcactagtc1020atttctgcttccatcattgtcttcaacctggtagagttggaaggtgattgtcgggatgat1080catgtcttttccctctacttcatgatacccttttttttcaccactttgggattgctctac1140cacaactggtacccatcacgggtgtttgtgggagataccttctgttactttgctggcatg1200acctttgccgtggtgggcatcttgggacacttcagcaagaccatgctactattcttcatg1260ccccaggtgttcaacttcctctactcactgcctcagctcctgcatatcatcccctgccct1320cgccaccgcatacccagactcaatatcaagacaggcaaactggagatgagctattccaag1380ttcaagaccaagagcctctctttcttgggcacctttattttaaaggtggcagagagcctc1440cagctggtgacagtacaccagagtgagactgaagatggtgaattcactgaatgtaacaac1500atgaccctcatcaacttgctacttaaagtccttgggcccatacatgagagaaacctcaca1560ttgctcctgctgctgctgcagatcctgggcagtgccatcaccttctccattcgatatcag1620ctcgttcgactcttctatgatgtctgagtcccttgatcattgtcctttacctcacagtct1680ctaggattcctgactcaggctgacctctctctctggtcccagactgcctccttgcccagg1740cctctctcactcttcatactcctccagattttgttctcagcattttcctttctctgtgat1800cattggcatcctgggcgtttcttgccctctgctgactactgattggattttacctatggc1860tttctgcaacttgctactctctccctctccatcccatctttgcagcctcatagggtggga1920tacagcagctttttttgcagttatccacactcacatttcagagtcctgactctcaaggaa1980ccactggtttttgggatagaacttgggccagggctaggaacacaggctccacggtgacat2040gtcatttgattgtaaattaagtgttctgattagtaagaactaagcagggggccacatgct2100ctcaatggagacaataaagtgttgtctttttcttattgtttaaaaaaaaa2150<210>13<211>1840<212>dna<213>褐家鼠<400>13gggggctggcgccggaatcctctgagtgtagggagctgcactgctggctgccgaggcctc60tggtttgttcctggcttaccaagttagctgagtaggcggcggagcggcggcccccggagg120gtcactatgtgggccttcccggagttacctctgccgctgccgctgttggtgaatttgatc180ggatcgctgttgggatttgtggctaccgtcaccctcatccctgccttccgtagccacttt240atcgccgcgcgtctctgtggccaggacctcaacaagctcagccggcagcagatcccagag300tcccagggagtgatcagcggtgctgttttccttatcatcctcttctgcttcatccctttc360cctttcctgaactgctttgtggaggagcagtgtaaggcattcccccaccatgaatttgtg420gccctgataggtgccctccttgctatctgctgcatgatcttcctgggttttgctgatgac480gtactcaatctgcgatggcgtcataagctgctgctccccacagctgcctcactacctctc540ctcatggtctacttcactaactttggcaatacaaccattgtggtgccgaagcccttccgc600tggattcttggcctgcatttggatttgggcatcctgtactatgtctacatgggactgctt660gcagtgttctgtaccaatgccatcaacatcctagcgggaattaatggcctagaggctggt720caatcactagtcatctctgcttctattattgtcttcaacctggtggagctggaaggtgat780tatcgggacgatcatgtcttttccctctacttcatgatgccatttttttttaccaccttg840ggattgctgtaccataactggtacccgtctcaggtgtttgtgggagacaccttctgttat900tttgctggcatgacctttgccgtggtgggaatcttgggacacttcagcaagaccatgctg960ctcttctttatgccacaagtattcaatttcctctactcactgcctcagctctttcagatc1020atcccctgccctcgacaccgtatgcccagactcaatacgaagacaggcaaactggagatg1080agctattccaagttcaagaccaagagcctctctttcttgggcacgtttattttaaaggta1140gcagagagcctccggctggtgacagttcaccgaggggagagtgaggatggtgccttcact1200gagtgtaacaacatgaccctcatcaacttgctacttaaagtctttgggcctacacatgag1260agaaacctcacactgttcctgctgctcctgcaggttctgagcagcgctgtcaccttctcc1320attcgttaccagctcgtccgactcttctatgatgtctgagctccctgacgactgcccttt1380accacacagtctccattggacctcagccaggacccacctctgtccgctccgaccgccttc1440tggtccaggctcagcttctgccgtcatctgtgactactgacatcctggatggactcctta1500gtggacttgacgtccactagttggacttgcctatgctttcttgagtttgctactccctcc1560ctttctgcagcctcaccaggtgggcctgtagcatcttttatgcaaatattcatggctcaa1620ctttcagaaccctaactctaaaggaatcccctgggccttgagagagaacctgggctaggg1680ctagagttagggcaacatactccaaggtaacctcacatctgactatcaaattaagtgttc1740tgattaggaagagcagaggcagggccatgtgctcagaatggtgacaataaaggattgcct1800tttacttgccaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa1840<210>14<211>5424<212>dna<213>猕猴<400>14tattaaaaatggcggctgccgccctccgcagtaatagttgttcagcgaataaaatccggg60cggaaacagtaggtaggctggttcagtgggggcagaacctaggttgccttagagaggttc120ttcgaggtcccgagggcggctcaagtcagagttgttggattctgctcagattggtgtggg180aagagcctgcctgtggggagcggccactccatactgctgaggcctcaggactgctgctca240gcttgccagttacctgaagaggcggcggagccgggcccctgaccggtcaccatgtgggcc300ttctcggaattgcccatgccgctgctggtcaatttgatcgtctcgctgctgggatttgtg360gccacagtcaccctcatcccagccttccggggccacttcattgctgcgcgcctctgtggt420caggacctcaacaaaaccagccgacaacagatgtgagcagcggcacacggttccgggcag480ggggcaagggctaaggaaggagtggctagggcaggggcggggaccggggtgtttgaccac540acgtgaaaactcagaactaacccaggcagcctggaactcggagaggtgatgagcagaact600tattcgcattggggaaaggatgggtagggaaccttgggtatatcagggactctagcagtg660gtgctttcctccctccgcccccctcaccacttcccaaaataaaaaaccaggaatgagaag720accgctttgggttattgtaacacctgcactagtgagtgaccacaccccctttcctctttc780ccctcgcccccttgctgctgggccacagcccagaatcccagggagtgatcagcggtgctg840ttttccttatcatcctcttctgcttcatccctttccccttcctgaactgctttgtgaagg900agcagtgtaaggcattcccccaccatgaagtaagtgggttcgtgggggttgttgcctgtg960gctgggacctgggaggtacctgagagaattggtgttatttgggcttgtggggaggggcta1020agaaatgataagaaaagacaagaattcttaaaaggtgaaatgggagcaggcttgagtcat1080ggacctgccctagcctcccccagtttgtggccctgataggtgccctccttgccatctgct1140gcatgatcttcctgggctttgcggatgatgtactgaatctgcgctggcgccataagctgc1200tgctacccacagctgcctcactacctctcctcatggtctatttcaccaactttggcaaca1260cgaccattgtggtgccgaagcccttccgcccgattcttggcctgcatctggacttgggta1320ggtagtcctgccactgctactcctatggcacctacttcagggcacccttcctggtgcttc1380acattctccttcaagtgttccttttctgtctctgtgtcttcccagatcctttctggtagc1440ccttcatcctatcctctgtcctcaccacttttctaaatcctcctcccctaggtggcacta1500cttttcctaccatctctcccttcaggaatcctgtactatgtctacatggggctgctggca1560gtgttctgtaccaatgccatcaatatcctagcaggaattaatggcctagaggctggccag1620tcactagtaatttctgcttccatcattgtcttcaacctggtagagttggaaggtaggtgg1680gattgggggtggggagagagaagtctgaatgttaaaggtgtggcctgatatatgactttg1740ggaaattcagggaaaaaaagcaatatgcgtagtaattatagaagataagggaggctactt1800actttgcaaataatgcagatttattgaaagtgagaaagaaaaatagcagccgtgtcattt1860atagctggattggcactaacagctaggccatgatcttctcccattgaatataaacaattt1920cacagaacctcaacgttacacagggtcattctgtgaccatgatggaggaagaccaaaact1980cgacccctccctctataatcctgtttgagcacagataaaaccacaaaaacactgagcaac2040ccacaaaatggccaagatcctctctctctgttaacgtgagccatgagcgactgctgcggc2100tttccaataacaactcagttcctaccaccttttattttgttttttgagacagggtctccc2160tctgtcacccaggctggagagcagtggcacgatcttagctcactgcatcctctgactcaa2220acgatcctcctgccccagactcccaggtagctggggctacaggcatgcgccaccacacct2280ggcaaatttttgtattttttgtagagacagggtttcaccacgttgcctaggctggtcttg2340aactcctgggccgaagtgatttgtcagccttggcctcccaaagtgctgggattacactct2400tgagccactgtggccagccagttcctaccacttcttagataaacattaaaatgcttgatc2460agagaattattgttgttttcttttctttttcttttttttttttttttgagacggagtttc2520actcttgcccaggctggagtgcaatggtgcgatctcggctcactgcaacctccacctccc2580aggttcaggcgattctcctgcctcagcctccctagtagctgggattacaggcatgtgcca2640tcacgcccagctagttttgtatttttagtagagatgggatttctccatgttggtcaagct2700ggtctcaaactccagacctcaggtgatccgcccacctcggcctcccaaagtgctgggatt2760acaggtgtgagccaccgcacccggccatgaattacacctgctttctaacagcacccaatc2820cagagcaaaactcttactttcttttaccctctcccaaaatacccaaaactgcaagcccct2880cctaacactctcttactgagacattccgtggttcccaatggtgtgtggtttctgaagtct2940ccctttttacaacaagtcattaaacctagcttcgaactatagatgtgtttctagtggtct3000ttggctgatggacatcaacaaatgtttattaaagctaagtactttttaaacatgatcgta3060tttaaatcttgtaatggttttatgtggcacatgttataatcagccctgttttacagatga3120gtaaacagatttagagaagttaaatgtgtcatgatcaagatcaaggtcacaaagctaaga3180agtaaagttggtgtccaaactgacatcagaatgggctaaaccaaatttaagacagtaact3240agtttggaaggctgcatgaaagaggtggaatattgggaattgccttgggtgacataaaag3300gggtattgagttcttgaaagtgacttgggtgaggtggatgatacagctgtaaacagaact3360tagacaaaaataggaccatggtatgcagaagaagtgggtattaattttcccttctttctt3420ccttgcttccaaaggtgattgtcgggatgatcatgtcttttccctctacttcatgatacc3480cttttttttcaccactttgggattgctgtaccacaactggtaagtaggcctatggataag3540gggaaaaggggaaaactacccgaacacatggcaaagatggcccttatcataacccacctt3600gtggtggagaggttaaacctgtgcatacctccatggaattttctgtgtcttcagttggtc3660gtattctgaaatttctccctacccaacagtatttggggatgagtgcgtggaggtcccagg3720aatagatgaattcagggccttggatcctgcagagttgctgcacaactggagtctcctcta3780agtcagaactagggtcagggctagtacagtgcccatagggtgtgatgtgagagaaaggat3840tggtaatgcctcttgccactggctcggatcctctcccccacacaggtacccatcacgggt3900gtttgtgggagacaccttctgttactttgctggcatgacctttgccgtggtgggcatctt3960gggacacttcagcaagaccatgctactattcttcatgccccaggtgttcaacttcctcta4020ctcactgcctcagctcctgcatatcatcccctgccctcgccaccgcatacccaggtagcc4080gctttggggcttgaaatggacatcatagccttttcacttgggatatctaatgccagcctt4140tacattgctgtgcaaagggagtgggcccaaagaagggctatttccatgtgagtaaccctt4200tataacttccaaagcacatttatttgcatcatctgatactcacagtggttctgataacag4260caagcagcagagccagaaatagatctcaggttgactccacattcaatgctcttcctattg4320attagccacagggaggagggttcaaatagtggcccagtcacatgaagctgtcttcccccc4380gcagactcaatatcaagacaggcaaactggagatgagctattccaagttcaagaccaaga4440gcctctctttcttgggcacctttattttaaaggtaacagggtaacaaggaggtaaggccc4500taggctgccatcctgaccttgaggaatggggaacctaggcctacatcagatccaagggga4560acttggaagcattaaatagatccacattcctaaagcataggtattagctgaggttctctt4620cacctctggtccctccaggtggcagagagcctccggctggtgacaatacaccaaagtgat4680actgaggatggtgaattcactgaatgtaacaacatgaccctcatcaacttgctacttaaa4740atctttgggcccatacatgagagaaacctcacattgctcctgctgctgctgcaggtgagg4800atggggattgggtttatacctccttgtctccctttctccgtgattcttattccagtccat4860ttctccttgcagatcctgggcagtgccttcaccttctccattcgatatcagctcgttcga4920ctcttctatgatgtctgagtcccttgatcattgtcctttacctcacagtctctaggattc4980ctgactcaggctgacctctctctggtcccagactgcctccttgcccaggcctctctcact5040cttcatactcttccagattttgttctcagcattttcttttccctgtgatcactggcatcc5100tgggcgtttcttgccccctactgtctactgattggattttacttatgactttctgcaact5160tgctactctccctctccatcctgtctttgcagcctcacagggtgggatacagaagttttt5220tttttgcagttatccacagtcacatttcagagtcctgactctcaaggaactactggtttt5280tgggatagaacttgggccagggctagggacacaggctccacagtgacctgttatttgatt5340gtaaattaagtgttctgattagtaagaagtaagcagggggccacatgctctcaatggaga5400caataaagtgttgtctatttctta5424<210>15<211>5894<212>dna<213>黑猩猩<220><221>misc_feature<222>(3408)..(3408)<223>n为a、c、g或t<400>15aaaccgtagctgcgtttccgggaactgagttgtgtttaccttggcttccgactatgttgg60caacaggtttcctgcaagaaactggcgcgtctccacaccctcgtccctcctccccacccc120ctgcctttcaatagccatcttcctggagccggaggcatcccagattaagggagaggtacg180ggccctttaagcttgacctatggaggcggacggagctaaaactgacgtggaaccggaatg240tgagcggtgtcagacacgtggtacaaggaggcattcatcttggaaccgggcaattggcat300ttccgctctgggtagtacatctttaacataatgttagggaagtatccgttcttggctgcc360tttctttaattgcgtttccagtactctctcggtgattctactcttgaacataggatgaaa420tttggaatcacacttctcttgcacttccatccccaccctctaatgcccatattaaaaatg480gcggccgccgccttccgcagtaatggttgttcagcgaacaagatccgggcggaaacagta540gataggcgggtgcagcggggcagaacataggttgccttagagaggttctccggtgtctcg600agggcggctcaagttagagttgttgggttttgctcagattggtgtgggaagagcctgcct660gtggggagcggccactccatactgctgaggcctcaggactgctgctcagcttgcccgtta720cctgaagaggcggcggagccgggcccctgaccggtcaccatgtgggccttctcggaattg780cccatgccgctgctgatcaatttgatcgtctcgctgctgggatttgtggccacagtcacc840ctcatcccggccttccggggccacttcattgctgcgcgcctctgtggtcaggacctcaac900aaaaccagccgacagcagatgtgagcagcggcacacgggtctgggcagggggcaagggct960aaggaaggagtggctagggcaggggcggggaccggggtgcttgaccacacgtgaagactc1020agaactaacccaggcagcctggaactcggagaggtgatgagcagaacttactcgcattgg1080ggaaaggatgggtagggacccttgggtatatctgggactctggcagtggtgctttcctcc1140ctccgcccccctcaccacttaccagaataaaaaaccgggaatgagaagaccactttgggt1200tattgtaacacctgcactagtgagtgaccacgccccctttgctcttccccctcgccccct1260tgctgctgggccacagcccagaatcccagggagtgatcagcggtgctgttttccttatca1320tcctcttctgcttcatccctttccccttcctgaactgctttgtgaaggagcagtgtaagg1380cattcccccaccatgaagtaagtgggttcgtgggggtgattgcctgtggctgggacctgg1440gaggtacctgagagaattggggttatttgggcttgtggggaggggctaagaaattatcag1500aaaagacaggaattcttaaaaggtggaatgggagcaggcttgagtcatggacctgcccga1560gccccccccagtttgtggccctgataggtgccctccttgccatctgctgcatgatcttcc1620tgggctttgcggatgatgtactgaatctgcgctggcgccataaactgctgctacctacag1680ctgcctcactacctctcctcatggtctatttcaccaactttggcaacacgaccattgtgg1740tgcccaagcccttccgcccgatacttggcctgcatctggacttgggtaggtagtcctacc1800actgctgcccctatggcacctacttcagggaacccttcctggtgctccacattctcctcc1860aagtgttccttttctgtctctgtgtcttcccagatcctttctggtagcccttcatcctat1920cgtccgtcctcaccacttttctaaaaattcttaaatcctcctcccctaggtggcactact1980tcttttcctaccatttctccccgcaggaatcctgtactatgtctacatggggctgctggc2040agtgttctgtaccaatgccatcaatatcctagcaggaattaacggcctagaggctggcca2100gtcactagtcatttctgcttccatcattgtcttcaacctggtagagttggaaggtaggtg2160ggattgggggtggggagagagaagtctgagcattaaaggtgtggcctgatatatgacttt2220gggaaattcagggaaaaaaagcaatatgtgtagtaattatagaagataagggaagctact2280tactttgcaaataacaatgcagatttattaaaagtgagaaagaaaaatagcagccctgtc2340atttatagctggattggcactaatagctaggccatgatcttctcccattgaatataaaca2400gtttcacagaaccccaacgttacacagggtcattctgtgaccatgatggagcaagactaa2460aactagacccctccctctgtaatcatgtttgagcacaggcaaaaccacaagaacactgag2520caacccacaaaatggccaagatcccctctctcggctaacatgagcgactgctgctgctct2580ccaataacaactcagttcctaccacttcttttttttttttttgagacagggtctccctct2640gtcatgcaggctggagagcagtggcgcaatcttagctcactgcatcctctgactcaaacg2700atcctcctgccccagcctcccaagtagctggggctacaggcatgtgccaccacacctggc2760aaatttttgtattttttgtagagacagggtttcaccatgttccctaggctggtcttgaac2820tcctggactcaagtgatctgccaggcctcccaaagtgctgggattcactcttgagccact2880gtgcccagccagttcctaccatttcttaaataaacattaaaatgcttgatcatagaatta2940ctcttgctttcttttcttttcttttcttttttttttgagacggagttttgttcttgccca3000ggccggagtacaatggtgcgatctcggctcaccgcaacctccgcctcccaggttcaagcg3060attctcctgcctcagcctccctagtagctgggattacaggcacgtgccaccacgcccagc3120taattttgtatttctagtagagacggggtttctccatgttggtcaggctggtctcgaact3180cctgacctcaggtgatctgcctgcttcagcctcccaaagtgctgggattacaggcgtgag3240tcaccgcacccggccatgaattactcctgctttctaacagcacccagtccagagcaaaac3300tactttctttcaccctctcccaaaatacccaaaacaaacgctactacaagcccctcctaa3360caccctcttactgagacattccgtggttcccaatggtgtgtggtttcngaagtctccctt3420tttacaacaagtcattaaacctagctttgagctatagatgtgtttctgatggtcttggct3480gatgaacatcaacaagtgtttattaaagctaagtactttttaaacactatcttatttaaa3540tcttgtaatggttttatgtggcagatgttataatcagccctgttttacagatgagaaaac3600aggcttagagaagtcaaatgtgtcatgatcaagatgaaggtcacaaagctaagaagtaaa3660gttggtatccaaacttacatcagaatgggctaaaccaaatttaagatagtaactagtttg3720gaaggctgcacgaaagaggtggaatattgggaattgccttgggtgacataaaaggagtat3780tgagttcttaaaagtgacttgggtgaggtggatgataacagctgtaaacagaacttagac3840aaaaataggaccaaggtttgcagaggaagtgggtattaacttttccttctttcttccttg3900cttccaaaggtgattgtcgggatgatcatgtcttttccctctacttcatgataccctttt3960ttttcaccactttgggattgctctaccacaactggtaagtaggcctgtggataaggggac4020aactacctgaacacatggcaaagatggcccttatcataacccaccttgtggtggtgaagc4080taaacctgcgcatacctctatggagttttctgcgtcttcagttggtagtattctgaaatt4140tctctctacccagtagtagttagggatgagtgcgtggaggccccaggaatagttgaattc4200agggccttggatcctgcagagttgctgcacaactggagtctcctctgagtcagaactagg4260gtcagggctagtccagtgcccatagggtgtgatgtgagagaagggattggtaatgcctct4320tgccactggctcggatcctcttcccccacacaggtacccatcacgggtgtttgtgggaga4380taccttctgttactttgctggcatgacctttgccgtggtgggcatcttgggacacttcag4440caagaccatgctactattcttcatgccccaggtgttcaacttcctctactcactgcctca4500gctcctgcatatcatcccctgccctcgccaccgcatacccaggtagccgctttggggctt4560gaaatggacatcatagccttttcacttgggatatctaatgccagcctatacatttgctgt4620gcaaagggagtgggcccaaagaagggctatttccatgtgagtagccctttataacttaca4680aagcacatttatttgcataatctgctacagtggttctgataacagtaagcagcagagcca4740gaaatagatctcaggttgactccacattcaatgctcttcctattagccacagggaggagg4800gttcaaatagtggcccagtcacatgaagctatcttccccccgcagactcaatatcaagac4860aggcaaactggagatgagctattccaagttcaagaccaagagcctctctttcttgggcac4920ctttattttaaaggtaacagggtaacaaggaggtaaggccctaggctgccatcctgacct4980tgaggaatggggaacctagtcctacatcagatccaaggggaacttgaaagcattaaatag5040atccacattcctaaagcataggtattagctgaggttctcttcacctctggtccctccagg5100tggcagagagcctccagctggtgacagtacaccagagtgagactgaagatggtgaattca5160ctgaatgtaacaacatgaccctcatcaacttgctacttaaaatccttgggcccatacatg5220agagaaacctcacattgctcctgctgctgctgcaggtgaggatgggaatcgagtttatac5280ctccgtgtctccctttctgcgtgattcttactccagtccatttctccttgcagatcctgg5340gcagtgccatcaccttctccattcgatatcagctcgttcgactcttctatgatgtctgag5400tcccttgatcattgtcctttacctcacagtctctaggattcctgactcaggctgacctct5460ctctctggtcccagactgcctccttgcccaggcctctctcactcttcatactcctccaga5520ttttgttctcagcattttcctttctctgtgatcattggcatcctgggcgtttcttgccct5580ctactgactactgattggattttacctatggctttctgcgacttgctactctctccctct5640ccatcccatctttgcagcctcatagggtgggatacagcagctttttttgcagttatccac5700actcacatttcagagtcctgactctcaaggaaccactggtttttgggatagaacttgggc5760cagggctaggaacacaggctccacggtgacatgtcatttgattgtaaattaagtgttctg5820attagtaagaactaagcagggggccacatgctctcaatggagacaataaagtgttgtctt5880tttcttattgttta5894<210>16<211>4557<212>dna<213>家犬<400>16gtgaggaggcaagtgcggcgggggacagccgagggtgcgcgctggaggctcgcgggagtc60ctgggggcgcctcaattcagagttgggttttgctcaggccgctgtgggaggatccagcct120gtgccgagcggctgctcctccccgcggggggctccgggctaccgcccagctcgcccatta180gccgaggcggcggcagagcggggcccctggctggtcatcatgtgggccttcccggagttg240ccgatgccgctgctggtgaatttggtcggctcgctgctgggatttgtggccacggtcacc300ctcatccccgccttccgtggccacttcatcgccgcgcacctctgtggccaggacctcaac360aaaaccggccggcagcagatgtgagcggtggcacccgggtccggggagggggccggcagg420gcaagggcgggacctggggtgcctgaccccgcggacacgcagcgctaaccccgcagacag480ctgcgggctctgggagacgaagggcagcgctggccaactctgggaagggatgttgcagta540caggggaccctcgggtgtatcagggactccagcgctggtgcccttccaccccccttcccc600gtagatcgctgtaatgcttgctctagtgagtgaccacgccccctctcctctcccccgccc660cctccctttgctgctgggccacagcccagagtcccagggagtgatcagcggtgctgtttt720ccttatcatcctcttctgcttcatccctttccccttcctgaactgttttatggaggagca780gtgtaaagccttcccccatcacgaagtaagtgggtgagttgggggcggttgcttggggct840ggggcctgggagctacctgggagagttgtggttattagggtttgggtggaggggctgagg900aaggagcgaagagacgggtgtttttgcaagatgatgtgggcataggcttgagcggtgacc960tgcccgagcctcccccagttcgtggccctgataggtgcgctccttgccatctgctgcatg1020attttcctgggctttgcggacgatgtactgaatctgcgctggcgccacaagctgctgctg1080cctacagctgcctcgctacctcttcttatggtctatttcaccaactttggcaacacgacc1140attgtggtgcccaagcctttccggccgattcttggcctgcatctggacttgggtgagtag1200ccctgtgactgacgtccctgtggcccttactttggggcacccttaccctgggagataatc1260tagcagagcatcattcctggtgctccagatcctcttccaagtgtccccatcttgttcctg1320tgtcttctcagatccgttctgttggtccttcgtccaatcctctgtcctcaccacttttct1380cagaagaatattcttaagtcctcatttctatggatggcacacttcttactctcttcttcc1440cccagggatcctgtattatgtttacatggggctgctggcagtgttctgtaccaatgccat1500caatatcctagcaggaattaatggcctagaggcaggccagtcgctagttatttctgcttc1560catcatcgtcttcaatctggtggagctggaaggtaggtgagagtgggagtctgagtatta1620aggaaactgcctgatacctggctttggggaattcaggaaaaaataaaagcaatatattaa1680gattaaatgtaaagaaaaacagctctgtcattgacagctgaattggcactaataggtagg1740ccatggtcttctgctgaacataaacaatttcacagaacttcacaatcagacgaggtcact1800ctatgtccatgatagagtaaagcaaacccagattcctccataaacatgtctgagtatagc1860cagaactgcattttgtgcatcccacaaaaatgactaggatctccctcttctggctaaggt1920gagcaattgcttccttctgataacttggttctacttagagaaaactaagatgctcataga1980attacttccactgacagcacccagtcttgggcaaaactttgcctccttcctttctccccc2040aaattactcaaaacaatcctataacacatcttcctaatacttccctactgaggcatcccc2100tggttacctatggtgcgtggtctacagtgtctctcttgttacacgtcagtaaacccagct2160ttgactgcaggtgtgtttctggtggtctttggctgatggatatcagtgcttattaaaaca2220aaatactcttaaagcatttaaactttgtaatgtggcaagtgttctcatgaaccatatttt2280acagttgaggaaacagagggcgagagaatttaagtgtgtcatgatcaaggtcacacagtt2340agaaagtaaagctagtattcaaacctgggctgaatgatctaaaccaaattgaagacagca2400acttgtattaggaagggttcatgaatgaggtggaatattaggaattgcctgagtgacaca2460aaagaagtagtgagttctggaatgggacttggaagaggtggaaagtacagctggggacag2520aacttgagacagaaataggacccagttatgcagggggaagtaccttatcaactcatcctt2580ctttctttttcttcttcccctgcttccaaaggtgattatcgggatgatcacgtcttttcc2640ctctactttatgatacccttttttttcaccaccttgggattgctctaccataactggtaa2700gtgggccatgtgaacatgtagcaagtatggtcctgttggtcctgacccaactcctgttgg2760agaggctaagcctgcgcacacctgtattgagtgttttctggatgcctagttggtaatatt2820cttcaattactctctacccagttgcagttagagacaagtgctgtggagcccccaagaaga2880gatgaattcagggctttgggttctggaggcttgttggaagatctggagtttcctccgggc2940caggactagagtcagggctagtccagggttcagggcgtgtaatatgagagaaaagactga3000tagtgcctcctgccactggctcagatcctctcccccacacaggtacccatcacaggtgtt3060tgtgggagataccttctgttactttgctggcatgacctttgccgtggtgggcatcttggg3120acacttcagcaagaccatgctactcttcttcatgccccaggtgttcaacttcctctactc3180actgcctcagctcctgcatatcataccctgccctcgccaccgcattcccaggtagccact3240ttggggcttaaaagggacatcttagctttttcacttgggatgcataaagccagccttctg3300catctgctgtgtaaggggaatgggcccaaaggagggctctttccgtgcaattagccctta3360taaatgacagagcacattcacccacataatctgatcagctctgatcacacagtggtaagc3420agagccggaaacagatcttcaggttgtctgattccactttcggtactcttcctattaatt3480gaccgcagtgtggagagttcttggagtagtggcccagtcacataaagctctcttccccct3540gcagactcaataccaagacaggcaaactggagatgagctattccaagttcaagaccaaga3600gcctctctttcttgggcaactttattctaaaggtaacagggtaacgaggtaaggctctag3660gccaccatccggaattcagggcctggggaccctcggcttgcatcagatccaaggggagcc3720tggaagcatgaagcagatcccccattgctgaagcagagttgaagttctctccacctctgg3780cccctccaggtagcagcgagcctgcagctagtgacagtgcaccagagtgagaatgaggat3840ggtgccttcacggagtgtaacaacatgacgctcctcaacttgctccttaaggttctcggg3900cccatgcatgagagaaacctgactctgctcctgctgctgctccaggtgtggtcagggaag3960ggctttgctggctctggtctccctttctccatggctctgactctggtgtgtttctttctc4020ctcacagatccttggcagtgctgtcaccttctccatccggtaccagcttgtccggctctt4080ctacgatgtctgagtcccccaatccttgcccttcactgcatagtctgcagggttcctgac4140tcaggcctgcctctttctgggccaggcacgcttccgggcccaggcctctctcacctctta4200cttttctccagattttgtacttagcgattccgttccgctgtgatcgacatcctgggcctg4260tcttgccctgtactgactgttgattggactttgcctgtggctttcttcaacttgctgctc4320tccctctctatcccatccctgcggcctcccaaagtgggatactgtgctttttatgcagtt4380atccaccactcggactctcgaggaatatgttgggcctggggatagaaccctggctgggga4440gagggacacaggctcgaagatcacttgattatttgaccataaattaagtattctgattcg4500taagagcagattggggggccaggtgctcccagtggtgacaataaagtgttgtctttt4557<210>17<211>5374<212>dna<213>中国仓鼠<400>17caaggcagagcctaggttgctttataaaacctcttggggaagcccgagggcggttcaaat60taagagttgttgggttttgccccgcctcgcatgtgaggagcggacactgctcacggctga120gacctcggggctgcttcccaccagttagctgagaaggctgcggagctggaacctctggcc180actcgccatgtgggccttctctgaggtaccgattccgctgctggtgaatttgatcggctc240gctgctgggatttgtggccacgctcaccctcatcccggcctttcgtggccactttatcgc300tgcgcgcctctgtggccaggacctcaacaaaaccaaccggcagcagatgtgagcagtggc360acacgggtgtcccgggcaggggccaggggtgggcaaggcacaggcgagctctgaggtgct420taaatgtgcgtacgaaccaaatctaactggagttgtccgggaccctgggactcgatggcc480agaagtggttagcactggggaatgctaaggaaggggacccttgagtgagaacatccagcg540gcgcctgcctccccccgccccccactgccctcccgctccactgctcccccgcctcactcc600tgggaagatcttttgggtcacatggtttttgcactaaccacgcccatttcttcttccttc660tccacccccttgctgcggggccacagcccagaatcccagggagtgatcagcggtgccgtt720ttccttatcatcctgttctgcttcatccccttccccttcttgaactgctttgtgaaggag780cagtgtaaggctttcccccaccatgaagtaagtgggttcgtgggggcggttgcctggggc840ctgggaggttcccgagagagttggggttgtgtggatttgaggaggagggactgaggacct900agtggaaaagacagaaatttttgaaagcttgaatggcagtaggcttgagtcatgacctgc960ccgagcctcccccagtttgtggccctcataggtgcccttcttgccatctgctgcatgatt1020ttcttgggcttcgcggacgatgtcctgaatctacgctggcgccataagctgctgctgccc1080acagctgcatcactacctcttcttatggtctattttaccaactttggcaacacaaccatt1140gtggtacccaagcccttccgcccagttcttggcttgcatctggatttgggtgagtatccc1200tgctgctacagcccctgtggcacttatttcaagtcaccctccccccaaaggtgcccagca1260gagcacccttcttgatgttccacactcccctgtttttgttccgtccctgtgaatgctcag1320gttctctcttgtgccctgtcattgtgtgttctgttttcagaataccgttagatcctttcc1380tagctgtcactgctttttatactatgtcttgcagggatcctgtactatgtctacatgggg1440ctcctggcagtgttctgtaccaatgccatcaatatcctagcaggaattaacggcctagag1500gccggccagtcattggtcatctctgcttccatcattgtcttcaacctggtggagctgcaa1560ggttggtgggaagagagagatctcagtgttcagagaattgcctgatatatagctttgaga1620aaaggggggcttatagaagatagggaaagctatttactttgcaaataacaatgaagagtt1680acttgagtaggaggaagaaaaatagcagtctgtcatttatagctggattggcatgagtag1740ctagaccatgactgtttcctattggacataaatagtttcatagaaccccagcatgagaga1800ggggcgccctgaccgtggtgaaacaagacagaaaccagacttctcccactgtaatcatgt1860ctgaacaccgacaaaagcacaggaacaaagtcagcccaaacatcccttcttgtctaatgt1920gagagggtatagcttctttgcagtaacaactcagttcctgctacttcttaagttgttcag1980tcagaaaattacttctgctttctgacatcaggcagtccagagcacaacttttccttgcag2040cctccccagaaccacttaaagtgaatcctattgtaagtcccttctaacaacctttagagt2100acctgcccagcatgaggccttgggtacagtccccagtatctctgtttgcatgcatgtaca2160catacccacatgcacacactgaacttacttattgaaggtaagcaatatttatttgcattt2220tttgtgtgtgtgacaaaatttcactatgtaattcagaatagccttgaattcactatgtag2280cctaggccgtcctcgaacttacagtgataatcctgcctcagcttcctaagtgctaagatt2340caaggtatgcactaccaggccagctaagaaagcaatttttaaactaggtatggtggcaca2400catcactaattctaacactctgggagacttgggcaggaagatcatgagtttgagctcagc2460ctgggcacttggtaagtctctgtttctagaaataaaacatggagtggtgatacacacctg2520taatcccagcattcatgaggctggggcaggaggatcaccacaaggtcaagacctgcctgg2580gttacataagcaagttcaaggccagcgtgaactacgtagtgagaccctgcctcaaacaaa2640caaataaataaataaacatgatcctgagtttggttcccagtactccccccaataaatgaa2700atgaaatgaaagagctggggaggcagcttagtgctaaggtccaggaccccatgtgaaggc2760agctgcgtgtatgtgttatcagccctgtttcatacactagataataaaactggttttcaa2820acttaagtcagcatgtctggacaaagtgaagactttaacttgtttttgacggtttcatga2880cagtagtgagctattgggaactgcctgggtaccatcaaaggaataatgaggggctgggga2940tttagctcagcggcataagcgcctgccttgcaagcaggcagtcatgagtttgatccccgg3000taccgataaaaaggaaaaagacaaaaaaaaaaggaataatgagtttttgaaggtggctcg3060ggtgaggggaggtggcaacagagacagggatgcgacagacaaaatgaagagcaggggaca3120taggggagatgggtgttcacttttccttctttgtcctttgtttcccaaggtgattaccgg3180gatgatcatgtcttttccctctacttcatgataccgttttttttcaccaccttgggattg3240ctgtatcataactggtaaggaggctgtggctcagggaaaaggaaaacaactaactggtca3300ttggacaaagatggtcctgatcttaacccagctcctgaaagacaggctgaacttgcgcat3360acttttgctcagtgttttctgggtattcagttggtggattgcctccccccgccccgtttt3420ttttttgagacacctgtggcctctcgagtgctaggccagtgctttactactgagtcttgc3480cctctagtattctcaggtttgttcttttctcagcagttggagacaagtgctatggagccc3540caggaataattatggggacttgcgttctgcagacttgctagaccctcctgtccgaactag3600gatcaggggagcatgtgtggtggctcacacctgtaatcccagcactcaggagactgaggc3660aggaggattaccatgagatcgagggcaccctcagctcacatagtgactttgaggccagcc3720tggactacatagcgagactcttgtctccaaaagaaaaaaaaagaaagaataaaagaacag3780gggtctgagttcgtccagtacctagcctgtgtgatgtgagagaaaagactgtgatgcctc3840ttggcactggcttggatcctttcccccacacaggtacccatctcaggtgtttgtgggaga3900caccttctgttactttgctggcatgacctttgccgtggtaggcatcttgggacacttcag3960caagaccatgctgctcttcttcatgccacaggtgttcaacttcctctactcgctgcctca4020gctcctgcatatcatcccctgtcctcgccaccgtatacccaggtagctgtttgggggctg4080gaaagcctttctactgggatgtctaacaccaggctctacatttgctgtgcaaagaatgtg4140ggcccataggaaggctaacttttttcatgtaggtggccctttaagtttacacagcacgtt4200tacttccataatctcatttaatactcacagtagttctgatcatagagtagtaagcagcag4260agccagaaatagatctcactccatgatcagtgtttttcttagtcattaacggaagaaagt4320tttttgagtagtgacccagtcacacgaagctgtctttcccctacagactcaataccaaga4380caggcaaactggagatgagctattccaagttcaagaccaacagcctttctttcttgggca4440cctttattttaaaggtaacaaggtaacgaggaggtaaggccccaggccaccatcctgaac4500ttgggacatgggggacccaggcctacattagatctagagggagcttggaagcattaagca4560gagccctgttcctgacatacaggtattggctgaagtttttctgtctgtctctggtctctc4620taggtagcagagagactccagctagtgacagtgcaccggagtgagggtgaggacggggcc4680ttcactgagtgtaacaacatgaccctcatcaacttgctgcttaaaatctttgggcccata4740catgagaggaacctcacattgctcttgctgctgctacaggtgagcctggggtgagtttgt4800gcctcctcatgtccttttctctatggttcttattctagtccatttctccttgcagatcgt4860gggcagtgctgtcaccttctccattcgataccagcttgtccgactcttctatgacgtttg4920agttcctgaagattgccctctgccacactgtctccaggggtcctgctcaggccagccagt4980ctggttctgtgggcctctcccaatcttcagtctccttcagatttattcccagcatttttc5040ataacctatgattatcaacatcctgagccatttttgccctccagcaactactaactggac5100tttgcctatggcctccttcaacttgccactctccctacccatcacagccagaggcttgat5160gtagcagcttttatgcagatatccacaactcagctttcagagtcctcactctcaaagaac5220atgctgggccttgagatagaacctgagctagggctagggacactggtgcaagggtgattt5280gatatttgattataaattaagtgttctgattagtaagacagaaggggagcctggtgctcc5340caacggtgacaataaagtgttacctttttcttgt5374当前第1页12