核酸分子及其用于非病毒基因疗法的用途的制作方法

文档序号:26191836发布日期:2021-08-06 18:44阅读:136来源:国知局
核酸分子及其用于非病毒基因疗法的用途的制作方法
相关申请本申请要求2018年8月9日提交的美国临时专利申请序列号62/716,826的优先权,将所述申请的全部公开内容通过提述在此并入本文。对电子提交的序列表的引用以ascii文本文件电子提交的序列表(名称:sa9-465pc_sl_st25.txt;大小:460,648字节;创建日期:2019年8月8日)的内容通过引用以其整体并入本文。
背景技术
:基因疗法提供了治疗多种疾病的持久手段的可能性。过去,许多基因疗法治疗通常依赖于使用病毒。有多种可以选择用于这个目的的病毒剂,每种病毒剂具有不同特性,这使得它们更适于或更不适于基因疗法。zhou等,advdrugdelivrev.106(pta):3-26,2016。然而,一些病毒载体的不期望特性(包括其免疫原性谱或其引起癌症的倾向)已经导致临床安全性问题,并且直到最近,限制其在某些应用(例如,疫苗和溶瘤策略)中的临床使用。cotter等,frontbiosci.10:1098-105(2005)。腺相关病毒(aav)是一种最常研究的基因疗法载体。aav是包围并保护大约4.8千碱基(kb)的小的单链dna基因组的蛋白质外壳。naso等,biodrugs,31(4):317-334,2017。aav属于细小病毒家族并且依赖于与其他病毒(主要是腺病毒)共感染以复制。同上。其单链基因组含有三个基因rep(复制)、cap(衣壳)和aap(组装)。同上。这些编码序列侧接有基因组复制和包装所需的反向末端重复(itr)。同上。这两个顺式作用aavitr的长度为大约145个核苷酸,具有中断的回文序列,所述回文序列可以折叠成在dna复制的起始期间起引物作用的t形发夹结构。然而,使用常规aav作为基因递送载体具有某些缺点。一个主要缺点与aav的约4.5kb异源dna的有限病毒包装能力有关。(dong等,humgenether.7(17):2101-12,1996)。另外,施用aav载体可诱导人的免疫应答。虽然已显示aav的免疫原性低于一些其他病毒(即腺病毒),但是衣壳蛋白可以触发人免疫系统的多种组分。参见naso等,2017。aav是人群中的常见病毒,并且大多数人已经暴露于aav,因此大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括中和抗体(nab)和t细胞,它们可降低随后用aav再感染的临床功效和/或已经被转导的细胞的消除,这可能使具有预先存在的抗aav免疫力的患者没有资格接受基于avv的基因疗法治疗。此外,有证据表明,aavitr的t形发夹环易受结合aavitr的t形发夹结构的宿主细胞蛋白质/蛋白质复合物的抑制。参见例如,zhou等,scientificreports7:5432(2017年7月14日)。因此,本领域需要在体外和体内环境中有效且持久地表达靶序列(例如,治疗性蛋白质和/或mirna),同时避免现有aav载体技术的一些无意的结果和限制。技术实现要素:在某些方面中,提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些示例性实施例中,第一itr包含seqidno:180中所述的核苷酸序列,并且第二itr包含seqidno:181中所述的核苷酸序列。在某些示例性实施例中,第一itr包含seqidno:183中所述的核苷酸序列,并且第二itr包含seqidno:184中所述的核苷酸序列。在某些示例性实施例中,第一itr包含seqidno:185中所述的核苷酸序列,并且第二itr包含seqidno:186中所述的核苷酸序列。在某些示例性实施例中,第一itr包含seqidno:187中所述的核苷酸序列,并且第二itr包含seqidno:188中所述的核苷酸序列。在某些示例性实施例中,第一itr和/或第二itr由seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列组成。在某些示例性实施例中,第一itr和第二itr是彼此的反向互补物。在某些示例性实施例中,核酸分子还包含启动子。在某些示例性实施例中,激活子是组织特异性启动子。在某些示例性实施例中,启动子驱动异源多核苷酸序列在选自以下的器官中的表达:肌肉、中枢神经系统(cns)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些示例性实施例中,启动子驱动异源多核苷酸序列在以下细胞中的表达:肝细胞、内皮细胞、心肌细胞、骨骼肌细胞、窦状细胞、传入神经元、传出神经元、中间神经元、神经胶质细胞、星形胶质细胞、少突胶质细胞、小神经胶质细胞、室管膜细胞、肺上皮细胞、许旺细胞(schwanncell)、卫星细胞、感光细胞、视网膜神经节细胞或其任何组合。在某些示例性实施例中,启动子定位于异源多核苷酸序列的5'。在某些示例性实施例中,启动子选自小鼠甲状腺素启动子(mttr)、内源人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(ttp)启动子、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、α1-抗胰蛋白酶(aat)、肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)、结蛋白(des)、spc5-12、2r5sc5-12、dmck、tmck和磷酸甘油酸激酶(pgk)启动子。在某些示例性实施例中,异源多核苷酸序列还包含内含子序列。在某些示例性实施例中,内含子序列定位于异源多核苷酸序列的5'。在某些示例性实施例中,内含子序列定位于启动子的3'。在某些示例性实施例中,内含子序列包含合成内含子序列。在某些示例性实施例中,内含子序列包含seqidno:115或192。在某些示例性实施例中,基因盒还包含转录后调控元件。在某些示例性实施例中,转录后调控元件定位于异源多核苷酸序列的3'。在某些示例性实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(wpre)、微小rna结合位点、dna核靶向序列或其任何组合。在某些示例性实施例中,微小rna结合位点包含与mir142-3p的结合位点。在某些示例性实施例中,基因盒还包含3'utr多聚(a)尾序列。在某些示例性实施例中,3'utr多聚(a)尾序列选自bgh多聚(a)、肌动蛋白多聚(a)、血红蛋白多聚(a)及其任何组合。在某些示例性实施例中,3'utr多聚(a)尾序列包含bgh多聚(a)。在某些示例性实施例中,基因盒还包含增强子序列。在某些示例性实施例中,增强子序列定位于第一itr与第二itr之间。在某些示例性实施例中,核酸分子从5'至3'包含:第一itr、基因盒和第二itr;其中基因盒包含组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'utr多聚(a)尾序列。在某些示例性实施例中,基因盒从5'至3'包含:组织特异性启动子序列、内含子序列、异源多核苷酸序列、转录后调控元件和3'utr多聚(a)尾序列。在某些示例性实施例中,组织特异性启动子序列包含ttt启动子;内含子是合成内含子;转录后调控元件包含wpre;并且3'utr多聚(a)尾序列包含bghpa。在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。在某些示例性实施例中,异源多核苷酸序列编码凝血因子、生长因子、激素、细胞因子、抗体、其片段或其任何组合。在某些示例性实施例中,异源多核苷酸序列编码选自以下的生长因子:肾上腺髓质素(am)、血管生成素(ang)、自分泌运动因子、骨形态发生蛋白(bmp)(例如,bmp2、bmp4、bmp5、bmp7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(cntf)、白血病抑制因子(lif)、白介素-6(il-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-csf)、粒细胞集落刺激因子(g-csf)、粒细胞巨噬细胞集落刺激因子(gm-csf))、表皮生长因子(egf)、肝配蛋白(例如,肝配蛋白a1、肝配蛋白a2、肝配蛋白a3、肝配蛋白a4、肝配蛋白a5、肝配蛋白b1、肝配蛋白b2、肝配蛋白b3)、促红细胞生成素(epo)、成纤维细胞生长因子(fgf)(例如,fgf1、fgf2、fgf3、fgf4、fgf5、fgf6、fgf7、fgf8、fgf9、fgf10、fgf11、fgf12、fgf13、fgf14、fgf15、fgf16、fgf17、fgf18、fgf19、fgf20、fgf21、fgf22、fgf23)、胎牛促体素(fbs)、gdnf家族成员(例如,神经胶质细胞系衍生的神经营养因子(gdnf)、神经秩蛋白、普塞芬蛋白(persephin)、阿特敏蛋白(artemin))、生长分化因子-9(gdf9)、肝细胞生长因子(hgf)、肝细胞瘤衍生的生长因子(hdgf)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(igf-1)或igf-2、白介素(il)(例如,il-1、il-2、il-3、il-4、il-5、il-6、il-7)、角质形成细胞生长因子(kgf)、迁移刺激因子(msf)、巨噬细胞刺激蛋白(msp或肝细胞生长因子样蛋白(hgflp))、肌生成抑制蛋白(gdf-8)、神经调节蛋白(例如,神经调节蛋白1(nrg1)、nrg2、nrg3、nrg4)、神经营养蛋白(例如,脑衍生的神经营养因子(bdnf)、神经生长因子(ngf)、神经营养蛋白-3(nt-3)、nt-4、胎盘生长因子(pgf)、血小板衍生的生长因子(pdgf)、肾胺酶(renalase)(rnls)、t细胞生长因子(tcgf)、血小板生成素(tpo)、转化生长因子(例如,转化生长因子α(tgf-α)、tgf-β、肿瘤坏死因子-α(tnf-α)和血管内皮生长因子(vegf)及其任何组合。在某些示例性实施例中,异源多核苷酸序列编码激素。在某些示例性实施例中,异源多核苷酸序列编码细胞因子。在某些示例性实施例中,异源多核苷酸序列编码抗体或其片段。在某些示例性实施例中,异源多核苷酸序列编码选自以下的基因:x连锁肌营养不良蛋白、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环水解酶、smn1、fxn(线粒体型共济失调蛋白(frataxin))、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)及其任何组合。在某些示例性实施例中,异源多核苷酸序列编码微小rna(mirna)。在某些示例性实施例中,mirna下调选自以下的靶基因的表达:sod1、htt、rho及其任何组合。在某些示例性实施例中,异源多核苷酸序列编码选自以下的凝血因子:因子i(fi)、因子ii(fii)、因子iii(fiii)、因子iv(fvi)、因子v(fv)、因子vi(fvi)、因子vii(fvii)、因子viii(fviii)、因子ix(fix)、因子x(fx)、因子xi(fxi)、因子xii(fxii)、因子xiii(fviii)、血管性血友病因子(vonwillebrandfactor,vwf)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白质z相关蛋白酶抑制剂(zpi)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tpa)、尿激酶、纤溶酶原激活物抑制剂-1(pai-1)、纤溶酶原激活物抑制剂-2(pai2)及其任何组合。在某些示例性实施例中,凝血因子是fviii。在某些示例性实施例中,fviii包含全长成熟fviii。在某些示例性实施例中,fviii包含与具有seqidno:106的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。在某些示例性实施例中,fviii包含a1结构域、a2结构域、a3结构域、c1结构域、c2结构域以及部分或无b结构域。在某些示例性实施例中,fviii包含与seqidno:109的氨基酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的氨基酸序列。在某些示例性实施例中,凝血因子包含异源部分。在某些示例性实施例中,异源部分选自白蛋白或其片段、免疫球蛋白fc区、人绒毛膜促性腺激素的β亚基的c末端肽(ctp)、pas序列、hap序列、转铁蛋白或其片段、白蛋白结合部分、其衍生物或其任何组合。在某些示例性实施例中,异源部分连接至fviii的n末端或c末端或者插入fviii的两个氨基酸之间。在某些示例性实施例中,异源部分在选自表4中所列插入位点的一个或多个插入位点插入两个氨基酸之间。在某些示例性实施例中,fviii还包含a1结构域、a2结构域、c1结构域、c2结构域、任选的b结构域和异源部分,其中异源部分紧邻对应于成熟fviii(seqidno:106)的氨基酸745的下游插入。在某些示例性实施例中,fviii还包含fcrn结合配偶体。在某些示例性实施例中,fcrn结合配偶体包含免疫球蛋白恒定结构域的fc区。在某些示例性实施例中,编码fviii的核酸序列经密码子优化。在某些示例性实施例中,编码fviii的核酸序列经密码子优化以供在人体内表达。在某些示例性实施例中,编码fviii的核酸序列包含与seqidno:107的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。在某些示例性实施例中,编码fviii的核酸序列包含与seqidno:71的核苷酸序列至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的核苷酸序列。在某些示例性实施例中,异源多核苷酸序列经密码子优化。在某些示例性实施例中,异源多核苷酸序列经密码子优化以供在人体内表达。在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。在某些示例性实施例中,递送剂选自脂质体、非脂质聚合分子和内体及其任何组合。在某些示例性实施例中,核酸分子经配制用于静脉内、经皮、皮内、皮下、经肺或口服递送或其任何组合。在某些示例性实施例中,核酸分子经配制用于静脉内递送。在某些方面中,提供了包含如本文所述的核酸分子的载体。在某些方面中,提供了包含如本文所述的核酸分子的宿主细胞。在某些方面中,提供了药物组合物,其包含如本文所述的核酸分子或载体以及医药上可接受的赋形剂。在某些方面中,提供了药物组合物,其包含如本文所述的宿主细胞以及医药上可接受的赋形剂。在某些方面中,提供了套组(试剂盒),其包含如本文所述的核酸分子以及用于将核酸分子施用于有需要的受试者的说明书。在某些方面中,提供了用于产生如本文所述的核酸分子的杆状病毒系统。在某些示例性实施例中,在昆虫细胞中产生如本文所述的核酸分子。在某些方面中,提供了包含如本文所述的核酸分子的纳米颗粒递送系统。在某些方面中,提供了产生多肽的方法,其包括在适宜条件下培养如本文所述的宿主细胞和回收多肽。在某些方面中,提供了产生具有凝血活性的多肽的方法,其包括:在适宜条件下培养如本文所述的宿主细胞和回收具有凝血活性的多肽。在某些方面中,提供了在有需要的受试者体内表达异源多核苷酸序列的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。在某些方面中,提供了在有需要的受试者体内表达凝血因子的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。在某些方面中,提供了治疗有需要的受试者的疾病或病症的方法,其包括将如本文所述的核酸分子、如本文所述的载体或如本文所述的药物组合物施用于受试者。在某些方面中,提供了治疗患有凝血因子缺乏的受试者的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。在某些方面中,提供了治疗有需要的受试者中的凝血因子缺乏的方法,其包括将如本文所述的核酸分子、如本文所述的载体、如本文所述的多肽或如本文所述的药物组合物施用于受试者。在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。在某些示例性实施例中,相对于施用前受试者体内的fviii活性,将核酸分子施用于受试者导致增加的fviii活性,其中fviii活性增加至少约2倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍、至少约12倍、至少约13倍、至少约14倍、至少约15倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约50倍、至少约60倍、至少约70倍、至少约80倍、至少约90倍或至少约100倍。在某些示例性实施例中,受试者患有出血病症。在某些示例性实施例中,出血病症是血友病。在某些示例性实施例中,出血病症是血友病a。在某些方面中,提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些方面中,提供了治疗有需要的受试者的血友病a的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码因子viii(fviii)的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在某些示例性实施例中,第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些方面中,提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。在某些示例性实施例中,肝脏代谢病症选自苯丙酮尿症(pku)、尿素循环疾病、溶酶体贮积病症和糖原贮积病。在某些示例性实施例中,肝脏代谢病症是苯丙酮尿症(pku)。在某些示例性实施例中,核酸分子是静脉内、经皮、皮内、皮下、口服、经肺或其任何组合地施用。在某些示例性实施例中,核酸分子静脉内施用的。在某些示例性实施例中,所述方法还包括将第二药剂施用于受试者。在某些示例性实施例中,受试者是哺乳动物。在某些示例性实施例中,受试者是人。在某些方面中,提供了治疗有需要的受试者的苯丙酮尿症(pku)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些示例性实施例中,基因盒包含单链核酸。在某些示例性实施例中,基因盒包含双链核酸。在某些示例性实施例中,核酸分子是用递送剂配制。在某些示例性实施例中,递送剂包含脂质纳米颗粒。在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含sbccd复合物中的破坏的细菌宿主菌株中。在某些示例性实施例中,sbccd复合物中的破坏包含sbcc基因和/或sbcd基因中的基因破坏。在某些示例性实施例中,sbccd复合物中的破坏包含sbcc基因中的基因破坏。在某些示例性实施例中,sbccd复合物中的破坏包含sbcd基因中的基因破坏。在某些示例性实施例中,核酸分子包含第一反向末端重复(itr)和第二itr,其中第一和/或第二itr是非腺相关病毒(非aav)itr。在某些示例性实施例中,第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在某些示例性实施例中,核酸分子还包含基因盒,其中基因盒侧接有第一itr和第二itr。在某些示例性实施例中,基因盒包含异源多核苷酸序列。在某些示例性实施例中,适宜载体是低拷贝载体。在某些示例性实施例中,适宜载体是pbr322。在某些示例性实施例中,细菌宿主菌株不能拆分十字形dna结构。在某些示例性实施例中,细菌宿主菌株是pmc103,其包含基因型sbcc、recd、mcra、δmcrbcf。在某些示例性实施例中,细菌宿主菌株是pmc107,其包含基因型recbc、recj、sbcbc、mcra、δmcrbcf。在某些示例性实施例中,细菌宿主菌株是sure,其包含基因型recb、recj、sbcc、mcra、δmcrbcf、umuc、uvrc。在某些方面中,提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含sbccd复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(itr)和第二itr,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。附图简述图1a-1b是单链凝血因子(例如,fviii)表达盒的示意图。显示了来自非aav的5'itr(在ssdna结构的末端具有发夹环)、来自非aav的3'itr(具有发夹环)、启动子序列(例如,ttpp或cagp)和转基因序列(例如,在b结构域内插入xten144的fviiico6xten序列)的位置。示例性表达盒还显示了其他可能的组件,例如内含子序列、wpremut序列和bghpa序列。图1c-1f是用于制备单链凝血因子表达盒(如图1a-1b中所示的盒)的质粒的示意图,其中盒的itr衍生自aav2(图1c)、b19(图1d)、gpv(图1e),或者是野生型b19itr序列(图1f)。用pvuii(在pvuii位点)(图1c)或lgui(在lgui位点)(图1d-1f)消化包含如此处所示的ssfviii表达盒的质粒构建体,以精确释放包含itr和表达盒的序列。使双链dna在95℃下热变性以产生ssdna,然后在4℃下温育以允许itr结构形成。图2a是系统发生树,其说明了各种细小病毒家族成员之间的关系。b19、aav-2和gpv用轮廓框标记。图2b是包括发夹结构在内的各种盒的示意图。图3a和3b是b19、gpv和aav2的itr(图3a)以及b19和gpv的itr(图3b)的比对。灰色阴影显示了同源性。图4a-4c显示了在hema小鼠体内在通过流体力学注射(hdi)施用单链fviii-aav裸dna(ssaav-fviii;图1c)、ssdna-b19fviii(图1d)或ssdna-gpvfviii(图1e)后的fviii血浆活性。在用50μg/小鼠(图4c)、20μg/小鼠(图4a和4b)、10μg/小鼠(图4a、4b和4c)或5μg/小鼠(图4a)的ssdna的单次hdi处理的小鼠体内,在24小时、3天、2周、3周、1个月、2个月、3个月、4个月、5个月和6个月时,量测血浆样品中的fviii活性(作为人体内正常生理水平的百分比)。给出5μg/小鼠的质粒dna的hdi作为对照(图4a、4b和4c)。图5显示了在单次流体力学注射等摩尔量的单链裸dna(ssaav-fviii,图1a)、含有itr序列的双链aav-fviiidna(dsdna)、不含itr序列的双链fviiidna(无itr的dsdna)或不含itr或细菌序列的环化双链fviiidna(微环)后,血友病a小鼠血浆中的fviii活性。dsdna是通过用pvuii对aav-fviii质粒(图2c)进行酶切割来产生,但没有进行热变性。无itr的dsdna是通过用aflii对aav-fviii质粒(图2c)进行酶切割来产生并且随后进行纯化。微环dna是通过在aflii位点连接无itrdna的dsdna来产生。经3个月或4个月收集小鼠血浆并且通过生色活性测定来确定fviii。图6显示了在流体力学注射30μg单链裸fviii-dna(图1a、图1d-1f)后,血友病a小鼠血浆中的fviii活性。每周收集血浆持续7周并且通过生色测定来确定fviii活性。在35天(描绘为黑色箭头)后,通过流体力学注射向接受fviii-b19d135和fviii-gpvd162ssdna的小鼠再次施用30μg。图7a是单链鼠类苯丙氨酸羟化酶(例如,pah)表达盒的示意图。显示了来自非aav的5'itr(在ssdna结构的末端具有发夹环)、来自非aav的3'itr(具有发夹环)、启动子序列(例如,cagp)和转基因序列(例如,3xflag_mpah序列)的位置。示例性表达盒还显示了其他可能的组件,例如wpremut序列和bghpa序列。图7b-7d显示了在通过流体力学注射单次施用含有鼠类pahcdna和非aavitrb19d135或gpvd162的单链dna之前(第0天)和之后,苯丙酮尿症(pku)小鼠体内苯丙氨酸(phe)的血浆浓度。在ssdna施用后第3、7、14、28、42和56天收集血浆。残余苯丙氨酸水平显示为以μg/ml计的浓度(图7b-7c)或显示为施用前的百分比(图7d)。水平线描绘了施用前的基线phe水平。图7e显示了来自用含有鼠类pah转基因和b19d135或gpvd165itr的ssdna处理的pku小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用m2抗flag抗体侦检flag标记的鼠类pah蛋白,并且包括gapdh上样对照以供比较。图8a-b显示了在用囊封fviii-aavdna(图1a-1c)的脂质纳米颗粒转导后,huh7细胞上清液中的fviii活性水平。将在cagp启动子(图1b)下的质粒fviii-aav以等于3的胺与磷酸(np)比率囊封,并且以通过picogreen测定确定的不同浓度应用于huh7细胞(图8a)。将在ttpp启动子(图1a)下的质粒、双链线性(ds)和单链(ss)aav-fviii以等于2的np比率也囊封于脂质纳米颗粒中,并且用于以不同dna浓度转导huh7细胞(图8b)。与人fact血浆标准品相比,通过生色活性测定来量测fviii。发明详述本公开文本描述了质粒样核酸分子,其包含第一反向末端重复(itr)、第二itr和基因盒(例如,编码靶序列(本文中也称作异源多核苷酸序列),例如治疗性蛋白质或mirna),其中第一itr和/或第二itr是非腺相关病毒的itr(例如,第一itr和/或第二itr来自非aav)。在一些实施例中,基因盒编码治疗性蛋白质,例如,靶序列编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、激素、细胞因子、抗体、其片段或其组合。在一些实施例中,基因盒编码x连锁肌营养不良蛋白、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环水解酶、smn1、fxn(线粒体型共济失调蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)或其任何组合。在一些实施例中,治疗性蛋白质包含凝血因子。在一个特定实施例中,治疗性蛋白质包含fviii或fix蛋白。在一些实施例中,基因盒编码mirna。在某些实施例中,mirna下调选自以下的靶基因的表达:sod1、htt、rho或其任何组合。在某些实施例中,非aav选自病毒科细小病毒科(parvoviridae)的成员及其任何组合。本公开文本还涉及在有需要的受试者体内表达治疗性蛋白质(例如,凝血因子(例如,fviii))的方法,其包括将包含第一反向末端重复(itr)、第二itr和基因盒(例如,编码治疗性蛋白质或mirna)的核酸分子施用于受试者,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在某些实施例中,本公开文本描述了分离的核酸分子,其包含与选自seqidno:113和120的核苷酸序列具有序列同源性的核苷酸序列。在某些实施例中,本公开文本提供了核酸分子,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含异源多核苷酸序列,其中第一和/或第二itr衍生自细小病毒b19或鹅细小病毒(gpv)。本公开文本的示例性构建体说明于附图和序列表中。为了提供对说明书和申请专利范围的清晰理解,下文提供了以下定义。i.定义应注意,术语“一个/一种(a)”或“一个/一种(an)”实体是指一个/一种或多个/多种所述实体:例如,“一个核苷酸序列”应理解为代表一个或多个核苷酸序列。类似地,“一种治疗性蛋白质”和“一种mirna”应理解为分别代表一种或多种治疗性蛋白质和一种或多种mirna。因此,术语“一个/一种(a)”(或“一个/一种(an)”)、“一个/一种或多个/多种”和“至少一个/一种”在本文中可互换使用。术语“约”在本文中用于意指大约、大致、大约地或在…左右。在术语“约”结合数字范围使用时,其通过扩展所述数值上下的边界来修饰所述范围。通常,术语“约”在本文中用于向上或向下(较高或较低)以10%的差异修饰高于和低于所述值的数值。同样如本文所用,“和/或”是指并且涵盖一个或多个相关列示项目的任何和所有可能组合,以及在替代方案(“或”)中解释时组合的缺少。“核酸”、“核酸分子”、“核苷酸”、“一个或多个核苷酸的序列”和“多核苷酸”可互换使用并且是指呈单链形式或双链螺旋的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“rna分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“dna分子”)的磷酸酯聚合形式或其任何磷酸酯类似物,如硫代磷酸酯和硫代酸酯。单链核酸序列是指单链dna(ssdna)或单链rna(ssrna)。双链dna-dna、dna-rna和rna-rna螺旋是可能的。术语核酸分子、特别是dna或rna分子仅仅是指分子的一级和二级结构,并且不将其限制为任何特定三级形式。因此,这个术语包括尤其在线性或环状dna分子(例如,限制性片段)、质粒、超螺旋化dna和染色体中发现的双链dna。在讨论特定双链dna分子的结构时,在本文中可以根据常规习惯描述序列,仅沿dna的非转录链(即,具有与mrna同源的序列的链)以5’至3’方向给出序列。“重组dna分子”是已经经历分子生物学操纵的dna分子。dna包括但不限于cdna、基因组dna、质粒dna、合成dna和半合成dna。本公开文本的“核酸组合物”包含如本文所述的一种或多种核酸。如本文所用,“反向末端重复”(或“itr”)是指位于单链核酸序列的5'端或3'端的核酸子序列,其包含一组核苷酸(初始序列),之后下游是其反向互补物,即回文序列。初始序列与反向互补物之间的插入核苷酸序列可以具有任何长度,包括零。在一个实施例中,可用于本公开文本的itr包含一个或多个“回文序列”。itr可以具有任何数目的功能。在一些实施例中,本文所述的itr形成发夹结构。在一些实施例中,itr形成t形发夹结构。在一些实施例中,itr形成非t形发夹结构,例如u形发夹结构。在一些实施例中,itr促进核酸分子在细胞的细胞核中的长期存活。在一些实施例中,itr促进核酸分子在细胞的细胞核中的永久存活(例如,持续细胞的整个寿命)。在一些实施例中,itr促进核酸分子在细胞的细胞核中的稳定性。在一些实施例中,itr促进核酸分子在细胞的细胞核中的保留。在一些实施例中,itr促进核酸分子在细胞的细胞核中的持久性。在一些实施例中,itr抑制或防止核酸分子在细胞的细胞核中的降解。在一个实施例中,初始序列和/或反向互补物包含约2-600个核苷酸、约2-550个核苷酸、约2-500个核苷酸、约2-450个核苷酸、约2-400个核苷酸、约2-350个核苷酸、约2-300个核苷酸或约2-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-600个核苷酸、约10-600个核苷酸、约15-600个核苷酸、约20-600个核苷酸、约25-600个核苷酸、约30-600个核苷酸、约35-600个核苷酸、约40-600个核苷酸、约45-600个核苷酸、约50-600个核苷酸、约60-600个核苷酸、约70-600个核苷酸、约80-600个核苷酸、约90-600个核苷酸、约100-600个核苷酸、约150-600个核苷酸、约200-600个核苷酸、约300-600个核苷酸、约350-600个核苷酸、约400-600个核苷酸、约450-600个核苷酸、约500-600个核苷酸或约550-600个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约5-550个核苷酸、约5至500个核苷酸、约5-450个核苷酸、约5至400个核苷酸、约5-350个核苷酸、约5至300个核苷酸或约5-250个核苷酸。在一些实施例中,初始序列和/或反向互补物包含约10-550个核苷酸、约15-500个核苷酸、约20-450个核苷酸、约25-400个核苷酸、约30-350个核苷酸、约35-300个核苷酸或约40-250个核苷酸。在某些实施例中,初始序列和/或反向互补物包含约225个核苷酸、约250个核苷酸、约275个核苷酸、约300个核苷酸、约325个核苷酸、约350个核苷酸、约375个核苷酸、约400个核苷酸、约425个核苷酸、约450个核苷酸、约475个核苷酸、约500个核苷酸、约525个核苷酸、约550个核苷酸、约575个核苷酸或约600个核苷酸。在特定实施例中,初始序列和/或反向互补物包含约400个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-200个核苷酸、约5-200个核苷酸、约10-200个核苷酸、约20-200个核苷酸、约30-200个核苷酸、约40-200个核苷酸、约50-200个核苷酸、约60-200个核苷酸、约70-200个核苷酸、约80-200个核苷酸、约90-200个核苷酸、约100-200个核苷酸、约125-200个核苷酸、约150-200个核苷酸或约175-200个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-150个核苷酸、约5-150个核苷酸、约10-150个核苷酸、约20-150个核苷酸、约30-150个核苷酸、约40-150个核苷酸、约50-150个核苷酸、约75-150个核苷酸、约100-150个核苷酸或约125-150个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-100个核苷酸、约5-100个核苷酸、约10-100个核苷酸、约20-100个核苷酸、约30-100个核苷酸、约40-100个核苷酸、约50-100个核苷酸或约75-100个核苷酸。在其他实施例中,初始序列和/或反向互补物包含约2-50个核苷酸、约10-50个核苷酸、约20-50个核苷酸、约30-50个核苷酸、约40-50个核苷酸、约3-30个核苷酸、约4-20个核苷酸或约5-10个核苷酸。在另一个实施例中,初始序列和/或反向互补物由2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸组成。在其他实施例中,初始序列与反向互补物之间的插入核苷酸是(例如,由以下组成)0个核苷酸、1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、11个核苷酸、12个核苷酸、13个核苷酸、14个核苷酸、15个核苷酸、16个核苷酸、17个核苷酸、18个核苷酸、19个核苷酸或20个核苷酸。因此,如本文所用的“itr”可以折叠回于自身并形成双链区段。例如,在折叠形成双螺旋时,序列gatcxxxxgatc包含gatc的初始序列及其补体(3'ctag5')。在一些实施例中,itr包含初始序列与反向互补物之间的连续回文序列(例如,gatcgatc)。在一些实施例中,itr包含初始序列与反向互补物之间的中断的回文序列(例如,gatcxxxxgatc)。在一些实施例中,连续或中断的回文序列的互补部分彼此相互作用以形成“发夹环”结构。如本文所用,在单链核苷酸分子上的至少两个互补序列碱基配对形成双链部分时,产生“发夹环”结构。在一些实施例中,仅itr的一部分形成发夹环。在其他实施例中,整个itr形成发夹环。在本公开文本中,至少一个itr是非腺病毒相关病毒(非aav)的itr。在某些实施例中,itr是病毒科细小病毒科的非aav成员的itr。在一些实施例中,itr是依赖病毒属(dependovirus)或红病毒属(erythrovirus)的非aav成员的itr。在特定实施例中,itr是以下病毒的itr:鹅细小病毒(gpv)、番鸭细小病毒(mdpv)或红病毒属细小病毒b19(也称为细小病毒b19、灵长类红细小病毒1、b19病毒和红病毒)。在某些实施例中,两个itr中的一个itr是aav的itr。在其他实施例中,构建体中两个itr中的一个itr是选自以下的aav血清型的itr:血清型1、2、3、4、5、6、7、8、9、10、11及其任何组合。在一个特定实施例中,itr衍生自aav血清型2,例如aav血清型2的itr。在本公开文本的某些方面中,核酸分子包含两个itr,5'itr和3'itr,其中5'itr位于核酸分子的5'末端,并且3'itr位于核酸分子的3'末端。5'itr和3'itr可以衍生自相同病毒或不同病毒。在某些实施例中,5'itr衍生自aav并且3'itr并非衍生自aav病毒(例如,非aav)。在一些实施例中,3'itr衍生自aav并且5'itr并非衍生自aav病毒(例如,非aav)。在其他实施例中,5'itr并非衍生自aav病毒(例如,非aav),并且3'itr衍生自相同或不同的非aav病毒。如本文所用的术语“细小病毒”涵盖细小病毒科,包括但不限于自主复制的细小病毒和依赖病毒。自主细小病毒包括例如以下属的成员:博卡病毒属(bocavirus)、依赖病毒属、红病毒属、阿留申病毒属(amdovirus)、细小病毒属(parvovirus)、浓核病毒属(densovirus)、重复病毒属(iteravirus)、康特拉病毒属(contravirus)、禽细小病毒属(aveparvovirus)、反刍类细小病毒属(copiparvovirus)、原细小病毒属(protoparvovirus)、四型细小病毒属(tetraparvovirus)、双义浓核病毒属(ambidensovirus)、短浓核病毒属(brevidensovirus)、肝胰浓核病毒属(hepandensovirus)和对虾浓核病毒属(penstyldensovirus)。示例性自主细小病毒包括但不限于猪细小病毒、小鼠微小病毒、犬细小病毒、水貂肠炎病毒、牛细小病毒、鸡细小病毒、猫瘟病毒、猫细小病毒、鹅细小病毒、h1细小病毒、番鸭细小病毒、蛇细小病毒和b19病毒。其他自主细小病毒是本领域的技术人员已知的。参见例如,fields等virology,第2卷,第69章(第4版,lippincott-ravenpublishers)。如本文所用的术语“非aav”涵盖来自细小病毒科的核酸、蛋白质和病毒,不包括细小病毒科的任何腺相关病毒(aav)。“非aav”包括但不限于以下属的自主复制成员:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属和对虾浓核病毒属。如本文所用,术语“腺相关病毒”(aav)包括但不限于aav1型、aav2型、aav3型(包括3a型和3b型)、aav4型、aav5型、aav6型、aav7型、aav8型、aav9型、aav10型、aav11型、aav12型、aav13型、蛇aav、禽aav、牛aav、犬aav、马aav、绵羊aav、山羊aav、虾aav、gao等(j.virol.78:6381(2004))和moris等(virol.33:375(2004))所披露的那些aav血清型和进化枝以及目前已知或将来发现的任何其他aav。参见例如,fields等virology,第2卷,第69章(第4版,lippincott-ravenpublishers)。如本文所用,术语“衍生自”是指组分从指定分子或生物体分离或使用指定分子或生物体制备,或者信息(例如,氨基酸或核酸序列)来自指定分子或生物体。例如,衍生自第二核酸序列(例如,itr)的核酸序列(例如,itr)可包括与第二核酸序列的核苷酸序列相同或基本上相似的核苷酸序列。在核苷酸或多肽的情况下,衍生的物质可以通过例如天然存在的突变诱发、人工定向突变诱发或人工随机突变诱发来获得。用于衍生核苷酸或多肽的突变诱发可以是有意定向的或有意随机的,或者是各自的混合。突变诱发核苷酸或多肽以产生衍生自第一核苷酸或多肽的不同核苷酸或多肽可以是随机事件(例如,由于聚合酶失真而引起),并且所衍生的核苷酸或多肽的鉴定可通过适当的筛选方法(例如,如本文所讨论)来进行。多肽的突变诱发通常需要操纵编码多肽的多核苷酸。在一些实施例中,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)至少90%相同,其中非aav(或aav)itr保留非aavitr(或分别地,aavitr)的功能特性。在一些实施例中,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)至少80%相同,其中非aav(或aav)itr保留非aavitr(或分别地,aavitr)的功能特性。在一些实施例中,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)至少70%相同,其中非aav(或aav)itr保留非aavitr(或分别地,aavitr)的功能特性。在一些实施例中,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)至少60%相同,其中非aav(或aav)itr保留非aavitr(或分别地,aavitr)的功能特性。在一些实施例中,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)至少50%相同,其中非aav(或aav)itr保留非aavitr(或分别地,aavitr)的功能特性。在某些实施例中,衍生自非aav(或aav)的itr的itr包含非aav(或aav)的itr的片段或由所述片段组成。在一些实施例中,衍生自非aav(或aav)的itr的itr包含非aav(或aav)的itr的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中衍生自非aav(或aav)的itr的itr保留非aavitr(或分别地,aavitr)的功能特性。在某些实施例中,衍生自非aav(或aav)的itr的itr包含非aav(或aav)的itr的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸,并且其中衍生自非aav(或aav)的itr的itr保留非aavitr(或分别地,aavitr)的功能特性。在某些实施例中,衍生自非aav(或aav)的itr的itr包含非aav(或aav)的itr的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸,并且其中衍生自非aav(或aav)的itr的itr保留非aavitr(或分别地,aavitr)的功能特性。在一些实施例中,衍生自非aav(或aav)的itr的itr包含非aav(或aav)的itr的片段或由所述片段组成,其中所述片段包含非aav(或aav)的itr的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在某些实施例中,在正确比对时,衍生自第二核苷酸或氨基酸序列的核苷酸或氨基酸序列分别与第二核苷酸或氨基酸序列的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在其他实施例中,在正确比对时,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)的同源部分至少90%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)的同源部分至少80%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)的同源部分至少70%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)的同源部分至少60%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。在一些实施例中,在正确比对时,衍生自非aav(或aav)的itr的itr与非aavitr(或分别地,aavitr)的同源部分至少50%相同,其中第一核苷酸或氨基酸序列保留第二核苷酸或氨基酸序列的生物学活性。“无衣壳(capsid-free)”或“无衣壳(capsid-less)”载体或核酸分子是指不具有衣壳的载体构建体。在一些实施例中,无衣壳载体或核酸分子不含编码例如aavrep蛋白的序列。如本文所用,“编码区”或“编码序列”是多核苷酸中由可翻译成氨基酸的密码子组成的部分。虽然“终止密码子”(tag、tga或taa)通常不翻译成氨基酸,但是可以认为其是编码区的一部分,但是任何侧接序列(例如启动子、核糖体结合位点、转录终止子、内含子等)不是编码区的一部分。编码区的边界通常由5’末端的起始密码子(编码所得多肽的胺基末端)和3’末端的翻译终止密码子(编码所得多肽的羧基末端)来决定。两个或更多个编码区可存在于单一多核苷酸构建体中(例如,在单一载体上),或者存在于单独的多核苷酸构建体中(例如,在单独的(不同的)载体上)。然后,结果就是单一载体可仅含有单个编码区,或者包含两个或更多个编码区。哺乳动物细胞分泌的某些蛋白质与分泌信号肽相关,一旦生长中的蛋白质链跨越糙面内质网的输出已经起始所述分泌信号肽便从成熟蛋白质切割下来。本领域的技术人员知道,信号肽通常融合至多肽的n末端,并且是从完整或“全长”多肽切割下来以产生多肽的分泌或“成熟”形式。在某些实施例中,天然信号肽或所述序列的保留指导多肽分泌的能力的功能衍生物与所述多肽可操作地相关。可替代地,可以使用异源哺乳动物信号肽(例如,人组织纤溶酶原激活物(tpa)或小鼠β-葡糖醛酸糖苷酶信号肽)或其功能衍生物。术语“下游”是指核苷酸序列位于参考核苷酸序列的3’。在某些实施例中,下游核苷酸序列是指转录起点之后的序列。例如,基因的翻译起始密码子位于转录起始位点的下游。术语“上游”是指核苷酸序列位于参考核苷酸序列的5’。在某些实施例中,上游核苷酸序列是指位于编码区或转录起点的5’侧的序列。例如,大多数启动子位于转录起始位点的上游。如本文所用,术语“基因调控区”或“调控区”是指位于编码区的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码区的转录、rna加工、稳定性或翻译的核苷酸序列。调控区可以包括启动子、翻译前导序列、内含子、多聚腺苷酸化识别序列、rna加工位点、效应子结合位点或茎环结构。如果意图在真核细胞中表达编码区,则多聚腺苷酸化信号和转录终止序列通常将位于编码序列的3’。编码产物(例如,mirna或基因产物(例如,多肽,如治疗性蛋白质))的多核苷酸可以包括与一个或多个编码区可操作地缔合的启动子和/或其他表达(例如,转录或翻译)控制组件。在可操作缔合中,以将基因产物的表达置于一个或多个调控区的影响或控制下的方式将基因产物(例如,多肽)的编码区与所述一个或多个调控区缔合。例如,如果启动子功能的诱导引起编码由编码区所编码的基因产物的mrna的转录,并且如果启动子与编码区之间的连接的性质不干扰启动子指导基因产物表达的能力或者不干扰dna模板被转录的能力,则编码区和启动子“可操作地缔合”。除了启动子以外的其他表达控制组件(例如,增强子、操纵子、阻遏物和转录终止信号)也可以与编码区可操作地缔合以指导基因产物表达。“转录控制序列”是指提供编码序列在宿主细胞中的表达的dna调控序列,如启动子、增强子、终止子等。多种转录控制区是本领域的技术人员已知的。这些转录控制区包括但不限于作用于脊椎动物细胞中的转录控制区,例如但不限于来自巨细胞病毒(立即早期启动子,与内含子-a结合)、猿猴病毒40(早期启动子)和逆转录病毒(如劳斯肉瘤病毒)的启动子和增强子区段。其他转录控制区包括衍生自脊椎动物基因的那些控制区,如肌动蛋白、热休克蛋白、牛生长激素和兔β-珠蛋白,以及能够控制真核细胞中的基因表达的其他序列。其他适宜转录控制区包括组织特异性启动子和增强子以及淋巴因子诱导型启动子(例如,可由干扰素或白介素诱导的启动子)。类似地,多种翻译控制组件是本领域的技术人员已知的。这些翻译控制组件包括但不限于核糖体结合位点、翻译起始和终止密码子以及衍生自微小核糖核酸病毒的组件(特别是内部核糖体进入位点,或ires,也称为cite序列)。如本文所用的术语“表达”是指多核苷酸产生基因产物(例如,rna或多肽)的过程。其包括但不限于多核苷酸转录为信使rna(mrna)、转移rna(trna)、小发夹rna(shrna)、小干扰rna(sirna)或任何其他rna产物,以及mrna翻译为多肽。表达产生“基因产物”。如本文所用,基因产物可以是核酸(例如,通过基因转录产生的信使rna)或从转录物翻译的多肽。本文所述的基因产物还包括具有转录后修饰(例如,多聚腺苷酸化或剪接)的核酸,或者具有翻译后修饰(例如,甲基化、糖基化、脂质添加、与其他蛋白质亚基缔合或蛋白质水解切割)的多肽。如本文所用,术语“产量”是指通过基因表达产生的多肽的量。“载体”是指用于将核酸克隆和/或转移至宿主细胞中的任何媒剂。载体可以是复制子,另一核酸区段可以与其连接以实现所连接区段的复制。“复制子”是指在体内起自主复制单元的作用(即,能够在其自身控制下复制)的任何基因组件(例如,质粒、噬菌体、粘粒、染色体、病毒)。术语“载体”包括在体外、离体或在体内将核酸引入细胞中的媒剂。本领域已知并使用大量载体,包括例如质粒、经修饰真核病毒或经修饰细菌病毒。将多核苷酸插入适宜载体中可以通过将适当多核苷酸片段连接至具有互补粘性末端的所选载体中来完成。可以对载体进行工程化以编码可选标记或报告物,其提供对已经并入载体的细胞的选择或鉴定。可选标记或报告物的表达允许鉴定和/或选择并入并表达含于载体上的其他编码区的宿主细胞。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。本领域已知并使用的报告物的例子包括:荧光素酶(luc)、绿色荧光蛋白(gfp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶(lacz)、β-葡糖醛酸糖苷酶(gus)等。还可以将可选标记视为报告物。如本文所用的术语“宿主细胞”是指例如可以或已经用作ssdna或载体的接受者的微生物、酵母细胞、昆虫细胞和哺乳动物细胞。所述术语包括已经转导的初始细胞的后代。因此,如本文所用的“宿主细胞”通常是指已经用外源dna序列转导的细胞。应理解,由于天然、偶然或刻意突变,单个亲代细胞的后代的形态或基因组或总dna补体可能不一定与初始亲代完全相同。在一些实施例中,宿主细胞可以是体外宿主细胞。术语“可选标记”是指能够基于标记基因的效应(即,对抗生素的抗性、对除草剂的抗性、比色标记、酶、荧光标记等)加以选择的鉴定因子(通常是抗生素或化学抗性基因),其中所述效应用于跟踪所关注核酸的遗传和/或鉴定已经遗传所关注核酸的细胞或生物体。本领域已知并使用的可选标记基因的例子包括:提供针对氨苄青霉素、链霉素、庆大霉素、卡那霉素、潮霉素、双丙胺磷除草剂、磺酰胺等的抗性的基因;和用作表型标记的基因,即花色苷调控基因、异戊烷基转移酶基因等。术语“报告基因”是指编码能够基于报告基因的效应加以鉴定的鉴定因子的核酸,其中所述效应用于跟踪所关注核酸的遗传性、鉴定已经遗传所关注核酸的细胞或生物体和/或量测基因表达诱导或转录。本领域已知并使用的报告基因的例子包括:荧光素酶(luc)、绿色荧光蛋白(gfp)、氯霉素乙酰转移酶(cat)、β-半乳糖苷酶(lacz)、β-葡糖醛酸糖苷酶(gus)等。也可以将可选标记基因视为报告基因。“启动子”与“启动子序列”可互换使用并且是指能够控制编码序列或功能rna的表达的dna序列。通常,编码序列位于启动子序列的3'。启动子可以整体衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同组件构成,或者甚至包含合成dna区段。本领域的技术人员应理解,不同的启动子可以指导基因在不同组织或细胞类型中、或在不同发育阶段、或响应不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子一般被称为“组成型启动子”。使基因在特定细胞类型中表达的启动子一般被称为“细胞特异性启动子”或“组织特异性启动子”。使基因在发育或细胞分化的特定阶段表达的启动子一般被称为“发育特异性启动子”或“细胞分化特异性启动子”。在用诱导启动子的试剂、生物分子、化学品、配位体、光等暴露或处理细胞后被诱导并且使基因表达的启动子一般被称为“诱导型启动子”或“可调型启动子”。还认识到,由于在大多数情况下,尚未完全界定调控序列的确切边界,所以不同长度的dna片段可以具有相同的启动子活性。启动子序列通常在其3’末端以转录起始位点为界,并向上游(5’方向)延伸以包括以高于背景的可侦检水平起始转录所必需的最小数目的碱基或组件。在启动子序列内将发现转录起始位点(例如通过用核酸酶s1标示(mapping)方便地界定)以及负责rna聚合酶的结合的蛋白质结合结构域(共有序列)。在一些实施例中,核酸分子包含组织特异性启动子。在某些实施例中,组织特异性启动子驱动治疗性蛋白质(例如,凝血因子)在肝脏中(例如,在肝细胞和/或内皮细胞中)的表达。在特定实施例中,启动子选自小鼠甲状腺素启动子(mttr)、内源人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、三重四脯氨酸(ttp)启动子、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、磷酸甘油酸激酶(pgk)启动子及其任何组合。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(aat))、肌肉特异性启动子(例如,肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)和结蛋白(des))、合成启动子(例如,spc5-12、2r5sc5-12、dmck和tmck)及其任何组合。在一个特定实施例中,启动子包含ttp启动子。术语“限制性内切核酸酶”与“限制酶”可互换使用并且是指在双链dna内的特定核苷酸序列内结合并切割的酶。术语“质粒”是指通常携带并非细胞的中心代谢的一部分的基因,并且通常呈环状双链dna分子的形式的染色体外组件。此类组件可以是衍生自任何来源的单链或双链dna或rna的线性、环状或超螺旋化的自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多个核苷酸序列已经接合或重组至独特构建体中,所述构建体能够将用于所选基因产物的启动子片段和dna序列以及适当的3'非翻译序列引入细胞中。可以使用的真核病毒载体包括但不限于腺病毒载体、逆转录病毒载体、腺相关病毒载体、痘病毒(例如,牛痘病毒载体)、杆状病毒载体或疱疹病毒载体。非病毒载体包括质粒、脂质体、带电脂质(细胞转染剂)、dna-蛋白质复合物和生物聚合物。“克隆载体”是指“复制子”,其是单位长度的连续复制的核酸并且其包含复制起点,如质粒、噬菌体或粘粒,另一核酸区段可以与所述复制子连接以实现所连接区段的复制。某些克隆载体能够在一种细胞类型(例如,细菌)中复制,并在另一细胞类型(例如,真核细胞)中表达。克隆载体通常包含一个或多个可以用于选择包含载体的细胞的序列和/或一个或多个用于插入所关注核酸序列的多重克隆位点。术语“表达载体”是指设计为使得所插入核酸序列在插入宿主细胞中之后能够表达的媒剂。将所插入核酸序列以如上所述的与调控区可操作地缔合地放置。通过业内熟知的方法将载体引入宿主细胞中,所述方法是例如转染、电穿孔、显微注射、转导、细胞融合、deae葡聚糖、磷酸钙沈淀、脂转染(溶酶体融合)、使用基因枪或dna载体转运蛋白。如本文所用,“培养(culture)”、“培养(toculture)”和“培养(culturing)”意指在允许细胞生长或分裂的体外条件下温育细胞或使细胞维持存活状态。如本文所用,“所培养细胞”意指在体外繁殖的细胞。如本文所用,术语“多肽”旨在涵盖单数“多肽”以及复数“多肽”,并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)构成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链,并且不涉及产物的具体长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条或多条链的任何其他术语包括于“多肽”的定义内,并且术语“多肽”可以代替这些术语中的任一个术语或与其互换使用。术语“多肽”还意图指多肽的表达后修饰的产物,所述修饰包括但不限于糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生、蛋白质水解切割或通过非天然存在的氨基酸修饰。多肽可以从天然生物来源衍生或通过重组技术产生,但不一定是从指定的核酸序列翻译。其能以任何方式产生,包括通过化学合成产生。术语“氨基酸”包括丙氨酸(ala或a);精氨酸(arg或r);天冬酰胺(asn或n);天冬氨酸(asp或d);半胱氨酸(cys或c);谷氨酰胺(gln或q);谷氨酸(glu或e);甘氨酸(gly或g);组氨酸(his或h);异亮氨酸(ile或i);亮氨酸(leu或l);赖氨酸(lys或k);甲硫氨酸(met或m);苯丙氨酸(phe或f);脯氨酸(pro或p);丝氨酸(ser或s);苏氨酸(thr或t);色氨酸(trp或w);酪氨酸(tyr或y);和缬氨酸(val或v)。非传统氨基酸也在本公开文本的范围内,并且包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,如ellman等meth.enzym.202:301-336(1991)中所述的那些。为了产生此类非天然存在的氨基酸残基,可使用noren等science244:182(1989)和ellman等(同上)的程序。简言之,这些程序涉及用非天然存在的氨基酸残基化学激活抑制剂trna,之后进行rna的体外转录和翻译。引入非传统氨基酸也可使用本领域已知的肽化学来实现。如本文所用,术语“极性氨基酸”包括具有零个净电荷,但是在其侧链的不同部分具有非零部分电荷的氨基酸(例如,m、f、w、s、y、n、q、c)。这些氨基酸可参与疏水相互作用和静电相互作用。如本文所用,术语“带电氨基酸”包括在其侧链上具有非零净电荷的氨基酸(例如,r、k、h、e、d)。这些氨基酸可参与疏水相互作用和静电相互作用。本公开文本中还包括多肽的片段或变异体及其任何组合。术语“片段”或“变异体”在涉及本公开文本的多肽结合结构域或结合分子时包括保留参考多肽的至少一些特性(例如,对fcrn结合结构域或fc变异体的fcrn结合亲和性、对fviii变异体的凝结活性或对vwf片段的fviii结合活性)的任何多肽。除了本文中其他地方讨论的特定抗体片段以外,多肽片段包括蛋白质水解片段以及缺失片段,但是不包括天然存在的全长多肽(或成熟多肽)。本公开文本的多肽结合结构域或结合分子的变异体包括如上所述的片段,以及由于氨基酸取代、缺失或插入而具有改变的氨基酸序列的多肽。变异体可以是天然存在的或非天然存在的。非天然存在的变异体可以使用本领域已知的突变诱发技术来产生。变异体多肽可以包含保守或非保守氨基酸取代、缺失或添加。“保守氨基酸取代”是用具有类似侧链的氨基酸残基替代氨基酸残基的取代。业内已经定义具有类似侧链的氨基酸残基的家族,包括碱性侧链(例如,赖氨酸、精氨酸、组氨酸)、酸性侧链(例如,天冬氨酸、谷氨酸)、不带电极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-分支侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,如果用来自相同侧链家族的另一氨基酸替代多肽中的氨基酸,则将取代视为保守的。在另一个实施例中,氨基酸串可以用结构上类似但侧链家族成员的顺序和/或组成不同的串来保守地替代。如本领域已知的术语“同一性百分比”是两个或更多个多肽序列或者两个或更多个多核苷酸序列之间的关系,如通过比较序列所确定。在业内,根据具体情况,“同一性”也意指多肽或多核苷酸序列之间的序列关联性程度,如通过此类序列的串之间的匹配所确定。“同一性”可通过已知方法容易地计算,所述方法包括但不限于以下文献中所述的那些方法:computationalmolecularbiology(lesk,a.m.编)oxforduniversitypress,newyork(1988);biocomputing:informaticsandgenomeprojects(smith,d.w.编)academicpress,newyork(1993);computeranalysisofsequencedata,parti(griffin,a.m.和griffin,h.g.编)humanapress,newjersey(1994);sequenceanalysisinmolecularbiology(vonheinje,g.编)academicpress(1987);和sequenceanalysisprimer(gribskov,m.和devereux,j.编)stocktonpress,newyork(1991)。确定同一性的较佳方法设计为给出所测试序列之间的最佳匹配。确定同一性的方法被编纂于可公开获得的计算机程序中。序列比对和同一性百分比计算可使用序列分析软件来进行,所述序列分析软件是例如lasergene生物信息学计算套件的megalign程序(dnastarinc.,威斯康星州麦迪逊市)、gcg程序套件(wisconsinpackage9.0版,geneticscomputergroup(gcg),威斯康星州麦迪逊市)、blastp、blastn、blastx(altschul等,j.mol.biol.215:403(1990))和dnastar(dnastar,inc.1228s.parkst.威斯康星州麦迪逊市53715usa)。在本申请的上下文中将理解,如果使用序列分析软件进行分析,除非另外指定,否则分析结果将基于所参考程序的“缺省值”。如本文所用的“缺省值”将意指在首次初始化时最初用软件加载的任一组值或参数。出于确定本公开文本的治疗性蛋白质(例如,凝血因子)序列与参考序列之间的同一性百分比的目的,仅使用参考序列中对应于本公开文本的治疗性蛋白质(例如,凝血因子)序列中的核苷酸的核苷酸来计算同一性百分比。例如,在比较含有b结构域的全长fviii核苷酸序列与本公开文本的优化的b结构域缺失(bdd)fviii核苷酸序列时,将使用包括a1、a2、a3、c1和c2结构域的比对部分来计算同一性百分比。全长fviii序列的编码b结构域的部分(其将在比对中产生大的“空位”)中的核苷酸将不会被计为错配。另外,在确定本公开文本的优化的bddfviii序列或其指定部分(例如,seqidno:3的核苷酸58-2277和2320-4374)与参考序列之间的同一性百分比时,将通过比对、用匹配核苷酸数除以如本文所述的优化的bdd-fviii序列或其指定部分的完整序列中的核苷酸总数来计算同一性百分比。如本文所用,对应于本公开文本的特定序列中的核苷酸的核苷酸是通过比对本公开文本的序列以最大化与参考序列的同一性来鉴定。用于鉴定参考序列中的等效氨基酸的编号是基于用于鉴定本公开文本的序列中的相应氨基酸的编号。“融合”或“嵌合”蛋白包含连接至第二氨基酸序列的第一氨基酸序列,所述第一氨基酸序列在自然界中并非天然地与所述第二氨基酸序列连接。可以使通常存在于单独蛋白质中的氨基酸序列在融合多肽中聚在一起,或者可以将通常存在于相同蛋白质中的氨基酸序列以新排列置于融合多肽(例如,本公开文本的因子viii结构域与igfc结构域的融合物)中。例如通过化学合成或通过产生并翻译其中以所需关系编码肽区的多核苷酸来产生融合蛋白。嵌合蛋白还可以包含通过共价非肽键或非共价键与第一氨基酸序列缔合的第二氨基酸序列。如本文所用,术语“插入位点”是指多肽或其片段、变异体或衍生物中的如下位置,其紧邻可插入异源部分的位置的上游。将“插入位点”指定为编号,所述编号是氨基酸在参考序列中的编号。例如,fviii中的“插入位点”是指成熟天然fviii(seqidno:15)中插入位点所对应的氨基酸序列的编号,其紧邻插入位置的n末端。例如,词组“a3在对应于seqidno:15的氨基酸1656的插入位点包含异源部分”指示,异源部分位于对应于seqidno:15的氨基酸1656和氨基酸1657的两个氨基酸之间。如本文所用的词组“紧邻氨基酸的下游”是指与氨基酸的末端羧基紧紧相邻的位置。类似地,词组“紧邻氨基酸的上游”是指与氨基酸的末端胺基紧紧相邻的位置。如本文所用的术语“插入(inserted)”、“被插入(isinserted)”、“插入于(insertedinto)”或语法相关术语涉及相对于亲代多肽中的类似位置,异源部分在多肽(例如,凝血因子)中的位置。例如,在某些实施例中,“插入”等涉及相对于天然成熟人fviii中的类似位置,异源部分在重组fviii多肽中的位置。如本文所用,所述术语是指多肽的特征,并且并非指示、暗示或意味着制备多肽的任何方法或工艺。如本文所用,术语“半衰期”是指特定多肽在体内的生物半衰期。半衰期可以表示为施用于受试者的数量的一半被从动物的循环和/或其他组织中清除所需的时间。在将给定多肽的清除曲线构建为时间函数时,所述曲线通常是二相的,具有快速的α相和较长的β相。α相通常代表所施用的fc多肽在血管内与血管外空间之间的平衡,并且部分取决于多肽的大小。β相通常代表多肽在血管内空间中的分解代谢。在一些实施例中,治疗性蛋白质(例如,凝血因子,例如fviii)和包含所述治疗性蛋白质的嵌合蛋白是单相的,并且因此不具有α相,而是只具有单一β相。因此,在某些实施例中,如本文所用的术语半衰期是指多肽在β相中的半衰期。如本文所用的术语“连接”是指第一氨基酸序列或核苷酸序列分别与第二氨基酸序列或核苷酸序列共价或非共价接合。第一氨基酸或核苷酸序列可以与第二氨基酸或核苷酸序列直接接合或并置,或者可替代地,插入序列可以将第一序列共价接合至第二序列。术语“连接”不仅意指第一氨基酸序列与第二氨基酸序列在c末端或n末端融合,还包括将完整的第一氨基酸序列(或第二氨基酸序列)插入第二氨基酸序列(或分别地,第一氨基酸序列)中的任两个氨基酸之间。在一个实施例中,第一氨基酸序列可通过肽键或接头连接至第二氨基酸序列。第一核苷酸序列可通过磷酸二酯键或接头连接至第二核苷酸序列。接头可为肽或多肽(对于多肽链)或者核苷酸或核苷酸链(对于核苷酸链)或者任何化学部分(对于多肽和多核苷酸链二者)。术语“连接”还通过连字符(-)来指示。如本文所用的止血意指停止或减慢出血(bleeding)或出血症(hemorrhage);或者停止或减慢血液流经血管或身体部分。如本文所用的止血病症意指遗传上的遗传性或获得性病症,特征在于由于形成纤维蛋白凝块的能力受损或无能,倾向于自发地或由于创伤而出血。此类病症的例子包括血友病。三种主要形式是血友病a(因子viii缺乏)、血友病b(因子ix缺乏或“克雷司马斯病”)和血友病c(因子xi缺乏,轻度出血倾向)。其他止血病症包括例如血管性血友病、因子xi缺乏(pta缺乏)、因子xii缺乏、纤维蛋白原、凝血酶原、因子v、因子vii、因子x或因子xiii的缺乏或结构异常、gpib缺陷或缺乏的巨血小板综合征。vwf受体gpib可能缺陷并导致缺少初级凝块形成(初级止血)和增加的出血倾向、以及glanzman和naegeli的血小板无力症(glanzmann血小板无力症)。在肝功能衰竭(急性和慢性形式)中,肝脏的凝结因子产生不足;这可能增加出血风险。可以预防性地使用本公开文本的分离的核酸分子、分离的多肽或包含分离核酸分子的载体。如本文所用,术语“预防性治疗”是指在出血发作之前施用分子。在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的多核苷酸、多肽或载体可以作为预防药在手术之前或之后施用。本公开文本的多核苷酸、多肽或载体可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除、牙科手术或干细胞移植。本公开文本的分离的核酸分子、分离的多肽或载体也用于按需治疗。术语“按需治疗”是指响应出血发作的症状或者在可能引起出血的活动之前施用分离的核酸分子、分离的多肽或载体。在一个方面中,可以在出血开始时(如在损伤后)或在预期要出血时(如在手术前),将按需治疗施用于受试者。在另一个方面中,可以在增加出血风险的活动(如接触运动)之前施用按需治疗。如本文所用,术语“急性出血”是指不论潜在原因的出血发作。例如,受试者可能患有创伤、尿毒症、遗传性出血病症(例如,因子vii缺乏)、血小板病症或由于产生针对凝血因子的抗体而产生的抗性。如本文所用的治疗(treat)、治疗(treatment)、治疗(treating)是指例如疾病或病症的严重程度的降低;病程持续时间的减少;与疾病或病症相关的一种或多种症状的改善;向患有疾病或病症的受试者提供有益作用,但不一定治愈疾病或病症;或者预防与疾病或病症相关的一种或多种症状。在一个实施例中,术语“治疗(treating)”或“治疗(treatment)”意指在受试者体内通过施用本公开文本的分离的核酸分子、分离的多肽或载体维持例如fviii谷水平为至少约1iu/dl、2iu/dl、3iu/dl、4iu/dl、5iu/dl、6iu/dl、7iu/dl、8iu/dl、9iu/dl、10iu/dl、11iu/dl、12iu/dl、13iu/dl、14iu/dl、15iu/dl、16iu/dl、17iu/dl、18iu/dl、19iu/dl、20iu/dl、25iu/dl、30iu/dl、35iu/dl、40iu/dl、45iu/dl、50iu/dl、55iu/dl、60iu/dl、65iu/dl、70iu/dl、75iu/dl、80iu/dl、85iu/dl、90iu/dl、95iu/dl、100iu/dl、105iu/dl、110iu/dl、115iu/dl、120iu/dl、125iu/dl、130iu/dl、135iu/dl、140iu/dl、145iu/dl或150iu/dl。在另一个实施例中,治疗(treating)或治疗(treatment)意指维持fviii谷水平为约1-约150iu/dl、约1-约125iu/dl、约1-约100iu/dl、约1-约90iu/dl、约1-约85iu/dl、约1-约80iu/dl、约1-约75iu/dl、约1-约70iu/dl、约1-约65iu/dl、约1-约60iu/dl、约1-约55iu/dl、约1-约50iu/dl、约1-约45iu/dl、约1-约40iu/dl、约1-约35iu/dl、约1-约30iu/dl、约1-约25iu/dl、约25-约125iu/dl、约50-约100iu/dl、约50-约75iu/dl、约75-约100iu/dl、约1-约20iu/dl、约2-约20iu/dl、约3-约20iu/dl、约4-约20iu/dl、约5-约20iu/dl、约6-约20iu/dl、约7-约20iu/dl、约8-约20iu/dl、约9-约20iu/dl或约10-约20iu/dl。疾病或病症的治疗(treatment)或治疗(treating)还可以包括维持受试者体内的fviii活性为以下水平:与非血友病受试者体内的fviii活性的至少约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%相当。治疗所需的最低谷水平可通过一种或多种已知方法来量测,并且可针对每个个人加以调节(增加或减小)。如本文所用,“施用”意指通过医药上可接受的途径将本公开文本的医药上可接受的核酸分子、从所述核酸分子表达的多肽或包含所述核酸分子的载体施用于受试者。施用途径可为静脉内的,例如静脉内注射和静脉内输注。其他施用途径包括例如皮下、肌内、口服、经鼻和经肺施用。核酸分子、多肽和载体可作为包含至少一种赋形剂的药物组合物的一部分来施用。如本文所用的术语“医药上可接受的”是指分子实体和组合物在施用于人时在生理上可耐受并且通常不会产生毒性或过敏反应或类似的不良反应(如胃部不适、头晕等)。任选地,如本文所用,术语“医药上可接受的”意指由联邦政府或州政府的管理机构批准或者在美国药典或其他公认药典中列示用于动物,更特别是用于人。如本文所用,词组“有需要的受试者”包括将受益于本公开文本的核酸分子、多肽或载体的施用于例如以改良止血的受试者(如哺乳动物受试者)。在一个实施例中,受试者包括但不限于患有血友病的个体。在另一个实施例中,受试者包括但不限于已经产生针对治疗性蛋白质(例如,凝血因子,例如fviii)的抑制剂,并且因此需要绕路疗法的个体。受试者可以是成年人或未成年人(例如,小于12岁)。如本文所用,术语“治疗性蛋白质”是指本领域已知可以施用于受试者的任何多肽。在一些实施例中,治疗性蛋白质包含选自以下的蛋白质:凝血因子、生长因子、抗体、其功能片段或其组合。如本文所用,术语“凝血因子”是指天然存在的或重组产生的分子或其类似物,其预防受试者的出血发作或缩短出血发作的持续时间。换句话说,其意指具有促凝血活性(即,负责将纤维蛋白原转化为不溶性纤维蛋白的网状物,从而引起血液凝结或凝血)的分子。如本文所用的“凝血因子”包括激活的凝血因子、其酶原或可激活的凝血因子。“可激活的凝血因子”是呈无活性形式(例如,呈其酶原形式)的凝血因子,其能够被转化为活性形式。术语“凝血因子”包括但不限于因子i(fi)、因子ii(fii)、因子v(fv)、fvii、fviii、fix、因子x(fx)、因子xi(fxi)、因子xii(fxii)、因子xiii(fxiii)、血管性血友病因子(vwf)、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白质z相关蛋白酶抑制剂(zpi)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tpa)、尿激酶、纤溶酶原激活物抑制剂-1(pai-1)、纤溶酶原激活物抑制剂-2(pai2)、其酶原、其激活形式或其任何组合。如本文所用的凝血活性意指参与生化反应级联的能力,所述级联以形成纤维蛋白凝块告终和/或降低出血症或出血发作的严重程度、持续时间或频率。如本文所用,“生长因子”包括本领域已知的包括细胞因子和激素在内的任何生长因子。在一些实施例中,生长因子选自肾上腺髓质素(am)、血管生成素(ang)、自分泌运动因子、骨形态发生蛋白(bmp)(例如,bmp2、bmp4、bmp5、bmp7)、睫状神经营养因子家族成员(例如,睫状神经营养因子(cntf)、白血病抑制因子(lif)、白介素-6(il-6))、集落刺激因子(例如,巨噬细胞集落刺激因子(m-csf)、粒细胞集落刺激因子(g-csf)、粒细胞巨噬细胞集落刺激因子(gm-csf))、表皮生长因子(egf)、肝配蛋白(例如,肝配蛋白a1、肝配蛋白a2、肝配蛋白a3、肝配蛋白a4、肝配蛋白a5、肝配蛋白b1、肝配蛋白b2、肝配蛋白b3)、促红细胞生成素(epo)、成纤维细胞生长因子(fgf)(例如,fgf1、fgf2、fgf3、fgf4、fgf5、fgf6、fgf7、fgf8、fgf9、fgf10、fgf11、fgf12、fgf13、fgf14、fgf15、fgf16、fgf17、fgf18、fgf19、fgf20、fgf21、fgf22、fgf23)、胎牛促体素(fbs)、gdnf家族成员(例如,神经胶质细胞系衍生的神经营养因子(gdnf)、神经秩蛋白、普塞芬蛋白、阿特敏蛋白)、生长分化因子-9(gdf9)、肝细胞生长因子(hgf)、肝细胞瘤衍生的生长因子(hdgf)、胰岛素、胰岛素样生长因子(例如,胰岛素样生长因子-1(igf-1)或igf-2、白介素(il)(例如,il-1、il-2、il-3、il-4、il-5、il-6、il-7)、角质形成细胞生长因子(kgf)、迁移刺激因子(msf)、巨噬细胞刺激蛋白(msp或肝细胞生长因子样蛋白(hgflp))、肌生成抑制蛋白(gdf-8)、神经调节蛋白(例如,神经调节蛋白1(nrg1)、nrg2、nrg3、nrg4)、神经营养蛋白(例如,脑衍生的神经营养因子(bdnf)、神经生长因子(ngf)、神经营养蛋白-3(nt-3)、nt-4、胎盘生长因子(pgf)、血小板衍生的生长因子(pdgf)、肾胺酶(rnls)、t细胞生长因子(tcgf)、血小板生成素(tpo)、转化生长因子(例如,转化生长因子α(tgf-α)、tgf-β、肿瘤坏死因子-α(tnf-α)和血管内皮生长因子(vegf)。在一些实施例中,治疗性蛋白质由选自以下的基因编码:x连锁肌营养不良蛋白、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环水解酶、smn1、fxn(线粒体型共济失调蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)或其任何组合。如本文所用,术语“异源的”或“外源的”是指此类分子通常在给定背景下(例如,在细胞中或在多肽中)未发现。例如,可以将外源或异源分子引入细胞中并且仅在例如通过转染或其他形式的遗传工程化操纵细胞之后存在,或者异源氨基酸序列可以存在于其天然不存在的蛋白质中。如本文所用,术语“异源核苷酸序列”是指不与给定多核苷酸序列一起天然存在的核苷酸序列。在一个实施例中,异源核苷酸序列编码能够延长治疗性蛋白质(例如,凝血因子,例如fviii)的半衰期的多肽。在另一个实施例中,异源核苷酸序列编码增加治疗性蛋白质(例如,凝血因子,例如fviii)的流体力学半径的多肽。在其他实施例中,异源核苷酸序列编码改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能(例如,促凝血活性)的多肽。在一些实施例中,治疗性蛋白质通过接头与异源核苷酸序列编码的多肽连接或相连。异源核苷酸序列编码的多肽部分的非限制性例子尤其包括免疫球蛋白恒定区或其部分、白蛋白或其片段、白蛋白结合部分、转铁蛋白、美国专利申请号20100292130的pas多肽、hap序列、转铁蛋白或其片段、人绒毛膜促性腺激素的β亚基的c末端肽(ctp)、白蛋白结合小分子、xten序列、fcrn结合部分(例如,完整fc区或其结合至fcrn的部分)、单链fc区(scfc区,例如如us2008/0260738、wo2008/012543或wo2008/1439545中所述)、聚甘氨酸接头、聚丝氨酸接头、选自甘氨酸(g)、丙氨酸(a)、丝氨酸(s)、苏氨酸(t)、谷氨酸(e)和脯氨酸(p)的两种类型氨基酸的6-40个氨基酸的肽和短多肽(具有从小于50%至大于50%变化的二级结构程度)、或其两个或更多个组合。在一些实施例中,异源核苷酸序列编码的多肽连接至非多肽部分。非多肽部分的非限制性例子包括聚乙二醇(peg)、白蛋白结合小分子、聚唾液酸、羟乙基淀粉(hes)、其衍生物或其任何组合。如本文所用,术语“fc区”定义为多肽中对应于天然ig的fc区的部分,即如通过其两条重链的相应fc结构域的二聚缔合所形成。天然fc区与另一fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的fc区”或“单链fc区”(scfc区)是指合成二聚fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的fc结构域。在一个实施例中,“fc区”是指单条ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,igg中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的c末端。因此,完整fc结构域至少包含铰链结构域、ch2结构域和ch3结构域。根据ig同种型,ig恒定区的fc区可以包括ch2、ch3和ch4结构域以及铰链区。包含ig的fc区的嵌合蛋白赋予嵌合蛋白若干种所需特性,包括增加的稳定性、增加的血清半衰期(参见capon等,1989,nature337:525)以及与fc受体(如新生fc受体(fcrn))的结合(美国专利号6,086,875、6,485,726、6,030,613;wo03/077834;us2003-0235536a1),将上述文献通过引用以其整体并入本文。“参考核苷酸序列”在本文中用作与本公开文本的核苷酸序列的比较时,是与本公开文本的核苷酸序列基本上相同的多核苷酸序列,但是所述参考序列未经优化。例如,由seqidno:1的密码子优化的bddfviii和在其3'端连接至seqidno:1的编码单链fc区的异源核苷酸序列组成的核酸分子的参考核苷酸序列是由seqidno:16的初始(或“亲代”)bddfviii和在其3'端连接至seqidno:16的编码单链fc区的相同异源核苷酸序列组成的核酸分子。如本文所用,关于核苷酸序列的术语“优化”是指编码多肽的多核苷酸序列,其中所述多核苷酸序列已经突变以增强所述多核苷酸序列的特性。在一些实施例中,进行优化以增加转录水平、增加翻译水平、增加稳态mrna水平、增加或减少调控蛋白(如通用转录因子)的结合、增加或减少剪接或增加多核苷酸序列产生的多肽的产量。可以对多核苷酸序列进行以使其优化的变化的例子包括密码子优化、g/c含量优化、去除重复序列、去除富含at的组件、去除隐蔽剪接位点、去除阻遏转录或翻译的顺式作用组件、添加或去除多聚t或多聚a序列、在转录起始位点周围添加增强转录的序列(如kozak共有序列)、去除可以形成茎环结构的序列、去除去稳定序列及其两个或更多个组合。ii.核酸分子本公开文本涉及编码靶序列的质粒样无衣壳的核酸分子,其中靶序列编码治疗性蛋白质或可以调节靶蛋白(例如,mirna)的表达的基因。衣壳是病毒的蛋白质外壳,包封病毒的遗传物质。已知衣壳通过保护病毒基因组、将基因组递送至宿主和与宿主相互作用来辅助病毒粒子的功能。然而,尤其在用于基因疗法中时,病毒衣壳可以是限制载体的包装能力和/或诱导免疫应答方面的因素。aav载体已经作为一种更常见类型的基因疗法载体出现。然而,衣壳的存在限制了aav载体在基因疗法中的效用。具体地,衣壳自身可能将载体中包括的转基因的大小限制到低至小于4.5kb。即使在添加调控组件之前,可用于基因疗法中的多种治疗性蛋白质也可以轻易超过这个大小。此外,构成衣壳的蛋白质可能起到受试者的免疫系统可靶向的抗原的作用。aav在一般群体中非常常见,大多数人在其一生中已经暴露于aav。因此,大多数潜在的基因疗法接受者可能已经产生过针对aav的免疫应答,并且因此更有可能排斥所述疗法。本公开文本的某些方面旨在克服aav载体的这些缺陷。具体地,本公开文本的某些方面涉及核酸分子,其包含第一itr、第二itr和基因盒(例如,编码治疗性蛋白质和/或mirna)。在一些实施例中,第一itr和第二itr侧接于包含异源多核苷酸序列的基因盒。在一些实施例中,核酸分子不包含编码衣壳蛋白、复制蛋白和/或组装蛋白的基因。在一些实施例中,基因盒编码治疗性蛋白质。在一些实施例中,治疗性蛋白质包含凝血因子。在一些实施例中,基因盒编码mirna。在某些实施例中,基因盒定位于第一itr与第二itr之间。在一些实施例中,核酸分子还包含一个或多个非编码区。在某些实施例中,所述一个或多个非编码区包含启动子序列、内含子、转录后调控元件、3'utr多聚(a)序列或其任何组合。在一个实施例中,基因盒是单链核酸。在另一个实施例中,基因盒是双链核酸。在一个实施例中,核酸分子包含:(a)作为细小病毒科的非aav家族成员的itr(例如,b19或gpvitr)的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;(g)作为细小病毒科的非aav家族成员的itr(例如,b19或gpvitr)的第二itr。在一个实施例中,核酸分子包含:(a)作为细小病毒科的非aav家族成员的itr的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码mirna的核苷酸,其中所述mirna下调选自以下的靶基因的表达:sod1、htt、rho及其任何组合;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;(g)作为细小病毒科的非aav家族成员的itr的第二itr。在一个实施例中,核酸分子包含:(a)作为细小病毒科的非aav家族成员的itr的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码x连锁肌营养不良蛋白、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环水解酶、smn1、fxn(线粒体型共济失调蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)或其任何组合的核苷酸;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;(g)作为细小病毒科的非aav家族成员的itr的第二itr。在一个实施例中,核酸分子包含:(a)作为aav(例如,aav血清型2基因组)的itr的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii的核苷酸;其中所述核苷酸与选自seqidno:1-14或seqidno:71的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性,其中所述核苷酸编码的fviii保留fviii活性;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和(g)作为aav(例如,aav血清型2基因组)的itr的第二itr。在一个实施例中,核酸分子包含:(a)作为aav(例如,aav血清型2基因组)的itr的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码mirna的核苷酸,其中所述mirna下调靶基因的表达,所述靶基因是例如sod1、htt、rho及其任何组合;(f)3'utr多聚(a)尾序列,例如bghpa;和(g)作为aav(例如,aav血清型2基因组)的itr的第二itr。在一个实施例中,核酸分子包含:(a)作为aav(例如,aav血清型2基因组)的itr的第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码x连锁肌营养不良蛋白、mtm1(肌微管素)、酪氨酸羟化酶、aadc、环水解酶、smn1、fxn(线粒体型共济失调蛋白)、gucy2d、rs1、cfh、htra、arms、cfb/cc2、cnga/cngb、prf65、arsa、psap、idua(mpsi)、ids(mpsii)、pah、gaa(酸性α-葡糖苷酶)或其任何组合的核苷酸;(f)3'utr多聚(a)尾序列,例如bghpa;和(g)作为aav(例如,aav血清型2基因组)的itr的第二itr。在另一个实施例中,核酸分子包含:(a)第一itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和(g)第二itr,其中第一itr或第二itr中的一个是细小病毒科的非aav家族成员的itr,并且另一个itr是aav(例如,aav血清型2基因组)的itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:111中所述的aav25’itr序列的5’itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:124中所述的aav23’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:111中所述的aav25’itr序列的5’itr;(b)组织特异性启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:193中所述的aav23’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)第一itr;(b)组织特异性启动子序列,ttp激活子;(c)内含子,例如合成内含子;(d)编码mirna或治疗性蛋白质(例如,凝血因子)的核苷酸;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和(g)第二itr,其中第一itr是合成itr,第二itr是合成itr,或者第一itr和第二itr二者都是合成itr。在另一个实施例中,核酸分子包含:(a)第一b19itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二b19itr。在另一个实施例中,核酸分子包含:(a)第一gpvitr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二gpvitr。在另一个实施例中,核酸分子包含:(a)第一b19itr;(b)泛在启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二b19itr。在另一个实施例中,核酸分子包含:(a)第一gpvitr;(b)泛在启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码选自以下的治疗性蛋白质的异源多核苷酸序列:凝血因子、生长因子、激素、细胞因子、抗体、其片段及其组合;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二gpvitr。在另一个实施例中,核酸分子包含:(a)第一b19itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码苯丙氨酸羟化酶(pah)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二b19itr。在另一个实施例中,核酸分子包含:(a)第一gpvitr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码苯丙氨酸羟化酶(pah)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)第二gpvitr。在另一个实施例中,核酸分子包含:(a)带有seqidno:180中所述的b19d1355’itr序列的5’itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:181中所述的b19d1353’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:183中所述的gpvd1625’itr序列的5’itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:184中所述的gpvd1623’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:185中所述的全长b195’itr序列的5’itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:186中所述的全长b193’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:187中所述的全长gpv5’itr序列的5’itr;(b)组织特异性启动子序列,例如ttp启动子;(c)内含子,例如合成内含子;(d)编码fviii(例如,fviiico6xten)的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:188中所述的全长gpv3’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:180中所述的b19d1355’itr序列的5’itr;(b)组织特异性启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码pah的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:181中所述的b19d1353’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:183中所述的gpvd1625’itr序列的5’itr;(b)组织特异性启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码pah的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:184中所述的gpvd1623’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:185中所述的全长b195’itr序列的5’itr;(b)组织特异性启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码pah的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:186中所述的全长b193’itr序列的3’itr。在另一个实施例中,核酸分子包含:(a)带有seqidno:187中所述的全长gpv5’itr序列的5’itr;(b)组织特异性启动子序列,例如cag启动子;(c)内含子,例如合成内含子;(d)编码pah的异源多核苷酸序列;(e)转录后调控元件,例如wpre;(f)3'utr多聚(a)尾序列,例如bghpa;和/或(g)带有seqidno:188中所述的全长gpv3’itr序列的3’itr。a.反向末端重复本公开文本的某些方面涉及核酸分子,其包含第一itr(例如,5'itr)和第二itr(例如,3'itr)。通常,itr参与细小病毒(例如,aav)从原核质粒进行dna复制和拯救或切除(samulski等,1983,1987;senapathy等,1984;gottlieb和muzyczka,1988)。另外,itr似乎是aav原病毒整合和将aavdna包装至病毒粒子中所需的最小序列(mclaughlin等,1988;samulski等,1989)。这些组件是细小病毒基因组的有效操纵必需的。假设,对于itr功能必不可少的最小限定组件是rep结合位点(例如,rbs;对于aav2,gcgcgctcgctcgctc(seqidno:104))和末端解链位点(例如,trs;对于aav2,agttgg(seqidno:105))加上允许发夹形成的可变回文序列。回文核苷酸区域通常作为dna复制的起点以及作为病毒的包装信号以顺式一起作用。itr中的互补序列在dna复制期间折叠成发夹结构。在一些实施例中,itr折叠成发夹t形结构。在其他实施例中,itr折叠成非t形发夹结构,例如折叠成u形发夹结构。数据表明,aavitr的t形发夹结构可以抑制由itr侧接的转基因的表达。参见例如,zhou等,scientificreports7:5432(2017年7月14日)。通过利用不形成t形发夹结构的itr,可以避免这种形式的抑制。因此,在某些方面中,与包含形成t形发夹的aavitr的多核苷酸相比,包含非aavitr的多核苷酸具有改良的转基因表达。在一些实施例中,itr包含天然存在的itr,例如,itr包含细小病毒itr的全部或一部分。在一些实施例中,itr包含合成序列。在一个实施例中,第一itr或第二itr包含合成序列。在另一个实施例中,第一itr和第二itr各自包含合成序列。在一些实施例中,第一itr或第二itr包含天然存在的序列。在另一个实施例中,第一itr和第二itr各自包含天然存在的序列。在一些实施例中,itr包含天然存在的itr的一部分(例如,截短的itr)或由所述部分组成。在一些实施例中,itr包含天然存在的itr的片段或由所述片段组成,其中所述片段包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸、至少约100个核苷酸、至少约125个核苷酸、至少约150个核苷酸、至少约175个核苷酸、至少约200个核苷酸、至少约225个核苷酸、至少约250个核苷酸、至少约275个核苷酸、至少约300个核苷酸、至少约325个核苷酸、至少约350个核苷酸、至少约375个核苷酸、至少约400个核苷酸、至少约425个核苷酸、至少约450个核苷酸、至少约475个核苷酸、至少约500个核苷酸、至少约525个核苷酸、至少约550个核苷酸、至少约575个核苷酸或至少约600个核苷酸;其中itr保留天然存在的itr的功能特性。在某些实施例中,itr包含天然存在的itr的片段或由所述片段组成,其中所述片段包含至少约129个核苷酸;其中itr保留天然存在的itr的功能特性。在某些实施例中,itr包含天然存在的itr的片段或由所述片段组成,其中所述片段包含至少约102个核苷酸;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含天然存在的itr的一部分或由所述部分组成,其中所述片段包含天然存在的itr的长度的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%;其中所述片段保留天然存在的itr的功能特性。在某些实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性;其中itr保留天然存在的itr的功能特性。在其他实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少90%的序列同一性;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少80%的序列同一性;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少70%的序列同一性;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少60%的序列同一性;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含如下序列或由如下序列组成,所述序列在正确比对时与天然存在的itr的同源部分具有至少50%的序列同一性;其中itr保留天然存在的itr的功能特性。在一些实施例中,itr包含来自aav基因组的itr。在一些实施例中,itr是选自以下的aav基因组的itr:aav1、aav2、aav3、aav4、aav5、aav6、aav7、aav8、aav9、aav10、aav11及其任何组合。在一个特定实施例中,itr是aav2基因组的itr。在另一个实施例中,itr是经遗传工程化以在其5′和3′端包括衍生自一个或多个aav基因组的itr的合成序列。在一些实施例中,itr并非衍生自aav基因组。在一些实施例中,itr是非aav的itr。在一些实施例中,itr是来自选自但不限于以下的病毒科细小病毒科的非aav基因组的itr:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在某些实施例中,itr衍生自红病毒属细小病毒b19(人病毒)。在另一个实施例中,itr衍生自番鸭细小病毒(mdpv)株。在某些实施例中,mdpv株被减弱,例如mdpv株fz91-30。在其他实施例中,mdpv株是病原性的,例如mdpv株yy。在一些实施例中,itr衍生自猪细小病毒,例如猪细小病毒u44978。在一些实施例中,itr衍生自小鼠微小病毒,例如小鼠微小病毒u34256。在一些实施例中,itr衍生自犬细小病毒,例如犬细小病毒m19296。在一些实施例中,itr衍生自水貂肠炎病毒,例如水貂肠炎病毒d00765。在一些实施例中,itr衍生自依赖细小病毒(dependoparvovirus)。在一个实施例中,依赖细小病毒是依赖病毒属鹅细小病毒(gpv)株。在一个具体实施例中,gpv株被减弱,例如gpv株82-0321v。在另一个具体实施例中,gpv株是病原性的,例如gpv株b。核酸分子的第一itr和第二itr可以衍生自相同基因组(例如,衍生自相同病毒的基因组),或衍生自不同基因组(例如,衍生自两种或更多种不同病毒基因组的基因组)。在某些实施例中,第一itr和第二itr衍生自相同的aav基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个itr是相同的,并且特别地可以是aav2itr。在其他实施例中,第一itr衍生自aav基因组并且第二itr并非衍生自aav基因组(例如,非aav基因组)。在其他实施例中,第一itr并非衍生自aav基因组(例如,非aav基因组)并且第二itr衍生自aav基因组。在仍其他实施例中,第一itr和第二itr二者都并非衍生自aav基因组(例如,非aav基因组)。在一个特定实施例中,第一itr和第二itr是相同的。在一些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合。在其他实施例中,第一itr和第二itr衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一itr和第二itr衍生自相同的基因组。在其他实施例中,第一itr和第二itr衍生自选自以下的基因组:博卡病毒属、依赖病毒属、红病毒属、阿留申病毒属、细小病毒属、浓核病毒属、重复病毒属、康特拉病毒属、禽细小病毒属、反刍类细小病毒属、原细小病毒属、四型细小病毒属、双义浓核病毒属、短浓核病毒属、肝胰浓核病毒属、对虾浓核病毒属及其任何组合,其中第一itr和第二itr衍生自不同的基因组。在一些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自红病毒属细小病毒b19(人病毒)。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自红病毒属细小病毒b19(人病毒)。在某些实施例中,第一itr和/或第二itr包含衍生自b19的itr的全部或一部分,或由所述itr的全部或一部分组成。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自seqidno:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr保留衍生出它的b19itr的功能特性。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自seqidno:167、168、169、170和171的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在一些实施例中,第一itr和/或第二itr包含选自seqidno:167、168、169、170和171的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:167中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:168中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:169中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:170中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:171中所述的核苷酸序列或由所述核苷酸序列组成。表1.样品细小病毒itr序列。在某些实施例中,第一itr和/或第二itr包含与seqidno:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:167组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:168中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:168组成。在某些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,保留衍生出它的b19itr的功能特性。在一些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:169中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:167中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在某些实施例中,第一itr和/或第二itr包含衍生自b19的itr的全部或一部分,或由所述itr的全部或一部分组成。在一些实施例中,第二itr是第一itr的反向互补物。在一些实施例中,第一itr是第二itr的反向互补物。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自seqidno:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的b19itr的功能特性。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自seqidno:180、181、185和186的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在某些实施例中,第一itr和/或第二itr包含与seqidno:180中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:180组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:181中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:181组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:185中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:185组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:186中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:186组成。在一些实施例中,第一itr和/或第二itr包含选自seqidno:180、181、185和186的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:180中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:181中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:181中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:180中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:185中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:186中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:186中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:185中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自gpv。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自gpv。在某些实施例中,第一itr和/或第二itr包含与seqidno:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:172组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:173中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:173组成。在某些实施例中,第一itr和/或第二itr包含衍生自gpv的itr的全部或一部分,或由所述itr的全部或一部分组成。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自seqidno:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr保留衍生出它的gpvitr的功能特性。在一些实施例中,第一itr和/或第二itr包含衍生自gpv的itr的全部或一部分,或由所述itr的全部或一部分组成。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与选自seqidno:172、173、174、175和176的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在一些实施例中,第一itr和/或第二itr包含选自seqidno:172、173、174、175和176的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:172中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:173中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:174中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:175中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:176中所述的核苷酸序列或由所述核苷酸序列组成。在某些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr保留衍生出它的gpvitr的功能特性。在一些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:174中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在某些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr保留衍生出它的gpvitr的功能特性。在一些实施例中,第一itr和/或第二itr包含核苷酸序列,其中所述核苷酸序列包含seqidno:176中所述的最小核苷酸序列,并且其中所述核苷酸序列与seqidno:172中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在某些实施例中,第一itr和/或第二itr包含衍生自gpv的itr的全部或一部分,或由所述itr的全部或一部分组成。在一些实施例中,第二itr是第一itr的反向互补物。在一些实施例中,第一itr是第二itr的反向互补物。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自seqidno:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物保留衍生出它的gpvitr的功能特性。在一些实施例中,第一itr和/或第二itr包含如下核苷酸序列或其功能衍生物,或由如下核苷酸序列或其功能衍生物组成,所述核苷酸序列与选自seqidno:183、184、187和188的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同。在一些实施例中,功能衍生物能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在某些实施例中,第一itr和/或第二itr包含与seqidno:183中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:183组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:184中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:184组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:187中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:187组成。在某些实施例中,第一itr和/或第二itr包含与seqidno:188中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列。在某些实施例中,第一itr和/或第二itr由seqidno:188组成。在一些实施例中,第一itr和/或第二itr包含选自seqidno:183、184、187和188的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:187中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第二itr包含seqidno:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:183中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:184中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:184中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:183中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:187中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:188中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr包含seqidno:188中所述的核苷酸序列或由所述核苷酸序列组成,并且第二itr包含seqidno:187中所述的核苷酸序列或由所述核苷酸序列组成。在某些实施例中,第一itr或第二itr中的一个包含衍生自aav2的itr的全部或一部分或由所述itr的全部或一部分组成。在一些实施例中,第一itr或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与seqidno:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr保留衍生出它的aav2itr的功能特性。在一些实施例中,第一itr或第二itr包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与seqidno:177或178中所述的核苷酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同,其中第一itr和/或第二itr能够形成发夹结构。在某些实施例中,发夹结构不包含t形发夹。在一些实施例中,第一itr和/或第二itr包含seqidno:177或178中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:177中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr和/或第二itr包含seqidno:178中所述的核苷酸序列或由所述核苷酸序列组成。在一些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自番鸭细小病毒(mdpv)株。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自番鸭细小病毒(mdpv)株。在某些实施例中,mdpv株被减弱,例如mdpv株fz91-30。在其他实施例中,mdpv株是病原性的,例如mdpv株yy。在一些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自依赖细小病毒。在一些实施例中,第二itr衍生自aav基因组,并且第一itr衍生自依赖细小病毒。在其他实施例中,第一itr衍生自aav基因组,并且第二itr衍生自依赖病毒属鹅细小病毒(gpv)株。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自依赖病毒属gpv株。在某些实施例中,gpv株被减弱,例如gpv株82-0321v。在其他实施例中,gpv株是病原性的,例如gpv株b。在某些实施例中,第一itr衍生自aav基因组,并且第二itr衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株u44978;小鼠微小病毒,例如小鼠微小病毒株u34256;犬细小病毒,例如犬细小病毒株m19296;水貂肠炎病毒,例如水貂肠炎病毒株d00765;及其任何组合。在其他实施例中,第二itr衍生自aav基因组,并且第一itr衍生自选自以下的基因组:猪细小病毒,例如猪细小病毒株u44978;小鼠微小病毒,例如小鼠微小病毒株u34256;犬细小病毒,例如犬细小病毒株m19296;水貂肠炎病毒,例如水貂肠炎病毒株d00765;及其任何组合。在另一个特定实施例中,itr是经遗传工程化以在其5′和3′端包括并非衍生自aav基因组的itr的合成序列。在另一个特定实施例中,itr是经遗传工程化以在其5′和3′端包括衍生自一个或多个非aav基因组的itr的合成序列。存在于本发明的核酸分子中的这两个itr可为相同或不同的非aav基因组。具体地,itr可衍生自相同的非aav基因组。在一个具体实施例中,存在于本发明的核酸分子中的这两个itr是相同的,并且特别地可为aav2itr。在一些实施例中,itr序列包含一个或多个回文序列。本文所公开的itr的回文序列包括但不限于天然回文序列(即,在自然界中发现的序列)、合成序列(即,未在自然界中发现的序列)(如伪回文序列)及其组合或经修饰形式。“伪回文序列”是包括不完美的回文序列在内的回文dna序列,其与形成二级结构的天然aav或非aav回文序列中的序列共享小于80%(包括小于70%、60%、50%、40%、30%、20%、10%或5%或无)核酸序列同一性。天然回文序列可以从本文所公开的任何基因组获得或衍生。合成回文序列可以基于本文所公开的任何基因组。回文序列可以是连续或中断的。在一些实施例中,回文序列是中断的,其中回文序列包含第二序列的插入。在一些实施例中,第二序列包含启动子、增强子、整合酶的整合位点(例如,cre或flp重组酶的位点)、基因产物的开放阅读框或其组合。在一些实施例中,itr形成发夹环结构。在一个实施例中,第一itr形成发夹结构。在另一个实施例中,第二itr形成发夹结构。仍然在另一个实施例中,第一itr和第二itr二者都形成发夹结构。在一些实施例中,第一itr和/或第二itr不形成t形发夹结构。在某些实施例中,第一itr和/或第二itr形成非t形发夹结构。在一些实施例中,非t形发夹结构包含u形发夹结构。在一些实施例中,本文所述的核酸分子中的itr可以是转录激活的itr。转录激活的itr可以包含已经通过包括至少一个转录活性元件而被转录激活的野生型itr的全部或一部分。多种类型的转录活性元件适用于这个背景。在一些实施例中,转录活性元件是组成型转录活性元件。组成型转录活性元件提供持续水平的基因转录,并且在需要持续表达转基因时是较佳的。在其他实施例中,转录活性元件是诱导型转录活性元件。诱导型转录活性元件通常在诱导物(或诱导条件)不存在下展现低活性,并且在诱导物存在下(或切换至诱导条件)上调。当仅在某些时间或在某些位置需要表达时或当需要使用诱导剂逐步增加表达水平时,诱导型转录活性元件可能是较佳的。转录活性元件也可以具有组织特异性;也就是说,其仅在某些组织或细胞类型中展现活性。能以多种方式将转录活性元件并入itr中。在一些实施例中,将转录活性元件并入itr的任何部分的5′或itr的任何部分的3′。在其他实施例中,转录激活的itr的转录活性元件位于两个itr序列之间。如果转录活性元件包含两个或更多个必须被间隔开的组件,则那些组件可与itr的部分交替。在一些实施例中,itr的发夹结构缺失并用转录组件的反向重复来替代。这后一种排列将产生仿真结构中的缺失部分的发夹。多个串联转录活性元件也可存在于转录激活的itr中,并且这些组件可以相邻或间隔开。另外,可将蛋白质结合位点(例如,rep结合位点)引入转录激活的itr的转录活性元件中。转录活性元件可包含使得能够通过rna聚合酶受控转录dna以形成rna的任何序列,并且可包含例如如下文所定义的转录活性元件。转录激活的itr向具有相对受限的核苷酸序列长度的核酸分子提供转录激活和itr功能二者,这有效地使可以携带并从核酸分子表达的转基因的长度最大化。将转录活性元件并入itr中能以多种方式来完成。对itr序列和转录活性元件的序列需求的比较可以提供对编码itr内的组件的方式的了解。例如,可以通过在复制转录活性元件的功能组件的itr序列中引入特定变化将转录活性添加至itr。业内存在多种技术可有效添加、缺失和/或改变特定位点的具体核苷酸序列(参见例如,deng和nickoloff(1992)anal.biochem.200:81-88)。产生转录激活的itr的另一方式涉及在itr中的所需位置引入限制位点。另外,可以使用本领域已知的方法将多个转录激活元件并入转录激活的itr中。通过说明,可以通过包括一个或多个如以下等转录活性元件来产生转录激活的itr:tata盒、gc盒、ccaat盒、sp1位点、inr区、cre(camp调控组件)位点、atf-1/cre位点、apbβ盒、apbα盒、carg盒、ccac盒或如本领域已知参与转录的任何其他组件。本公开文本的多个方面提供了克隆本文所述的核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入适宜细菌宿主菌株中。如本领域已知,核酸的复杂二级结构(例如,长回文区)可能不稳定并且难以在细菌宿主菌株中克隆。例如,本公开文本的包含第一itr和第二itr(例如,非aav细小病毒itr,例如b19或gpvitr)的核酸分子可能难以使用常规方法来克隆。长dna回文序列抑制dna复制并且在大肠杆菌(e.coli)、芽孢杆菌属(bacillus)、链球菌属(steptococcus)、链霉菌属(streptomyces)、酿酒酵母(s.cerevisiae)、小鼠和人的基因组中不稳定。这些效应是由于通过链内碱基配对形成发夹或十字形结构所致。在大肠杆菌中,在sbcc或sbcd突变体中可以显著克服对dna复制的抑制。sbcd是核酸酶亚基,并且sbcc是sbccd复合物的atp酶亚基。大肠杆菌sbccd复合物是负责防止长回文序列复制的外切核酸酶复合物。sbccd复合物是具有atp依赖性双链dna外切核酸酶活性和atp非依赖性单链dna内切核酸酶活性的核复合物。sbccd可以识别dna回文序列并通过攻击所产生的发夹结构来瓦解复制叉。在某些实施例中,适宜细菌宿主菌株不能拆分十字形dna结构。在某些实施例中,适宜细菌宿主菌株包含sbccd复合物中的破坏。在一些实施例中,sbccd复合物中的破坏包含sbcc基因和/或sbcd基因中的基因破坏。在某些实施例中,sbccd复合物中的破坏包含sbcc基因中的基因破坏。包含sbcc基因中的基因破坏的各种细菌宿主菌株是本领域已知的。例如但不限于,细菌宿主菌株pmc103包含基因型sbcc、recd、mcra、δmcrbcf;细菌宿主菌株pmc107包含基因型recbc、recj、sbcbc、mcra、δmcrbcf;并且细菌宿主菌株sure包含基因型recb、recj、sbcc、mcra、δmcrbcf、umuc、uvrc。因此,在一些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株pmc103、pmc107或sure中。在某些实施例中,克隆本文所述的核酸分子的方法包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入宿主菌株pmc103中。适宜载体是本领域已知的并且描述于本文中的其他地方。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是低拷贝载体。在某些实施例中,用于本公开文本的克隆方法中的适宜载体是pbr322。因此,本公开文本提供了克隆核酸分子的方法,其包括将能够形成复杂二级结构的核酸分子插入适宜载体中,和将所得载体引入包含sbccd复合物中的破坏的细菌宿主菌株中,其中核酸分子包含第一反向末端重复(itr)和第二itr,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。b.治疗性蛋白质本公开文本的某些方面涉及包含第一itr、第二itr和编码靶序列的基因盒的核酸分子,其中靶序列编码治疗性蛋白质。在一些实施例中,基因盒编码一种治疗性蛋白质。在一些实施例中,基因盒编码多于一种治疗性蛋白质。在一些实施例中,基因盒编码相同治疗性蛋白质的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在一些实施例中,基因盒编码两种或更多种不同的治疗性蛋白质。本公开文本的某些实施例涉及包含第一itr、第二itr和编码治疗性蛋白质的基因盒的核酸分子,其中治疗性蛋白质包含凝血因子。在一些实施例中,凝血因子选自fi、fii、fiii、fiv、fv、fvi、fvii、fviii、fix、fx、fxi、fxii、fxiii、vwf、前激肽释放酶、高分子量激肽原、纤连蛋白、抗凝血酶iii、肝素辅因子ii、蛋白质c、蛋白质s、蛋白质z、蛋白质z相关蛋白酶抑制剂(zpi)、纤溶酶原、α2-抗纤维蛋白溶酶、组织纤溶酶原激活物(tpa)、尿激酶、纤溶酶原激活物抑制剂-1(pai-1)、纤溶酶原激活物抑制剂-2(pai2)、其任何酶原、其任何活性形式及其任何组合。在一个实施例中,凝血因子包含fviii或其变异体或片段。在另一个实施例中,凝血因子包含fix或其变异体或片段。在另一个实施例中,凝血因子包含fvii或其变异体或片段。在另一个实施例中,凝血因子包含vwf或其变异体或片段。1.凝血因子在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子viii多肽。除非另外指定,否则如本文所用的“因子viii”在整个本申请中缩写为“fviii”,意指具有其在凝结中的正常作用的功能性fviii多肽。因此,术语fviii包括功能性变异体多肽。“fviii蛋白”可与fviii多肽(或蛋白质)或fviii互换使用。fviii功能的例子包括但不限于激活凝结的能力、作为因子ix的辅因子作用的能力或在ca2+和磷脂存在下与因子ix形成因子ⅹ酶(tenase)复合物的能力,所述复合物然后将因子x转化为激活形式xa。fviii蛋白可以是人、猪、犬、大鼠或鼠类fviii蛋白。另外,来自人和其他物种的fviii之间的比较已经鉴定出可能为功能所需的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632)。全长多肽和多核苷酸序列是已知的,许多功能片段、突变体和经修饰形式也是已知的。多个fviii氨基酸和核苷酸序列披露于例如以下文献中:美国公开号2015/0158929a1、2014/0308280a1和2014/0370035a1以及国际公开号wo2015/106052a1。fviii多肽包括例如全长fviii、在n末端缺少met的全长fviii、成熟fviii(缺少信号序列)、在n末端具有额外met的成熟fviii和/或完全或部分缺失b结构域的fviii。fviii变异体包括部分或完全缺失的b结构域缺失。a.fviii和编码fviii蛋白的多核苷酸序列在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子viii多肽。除非另外指定,否则如本文所用的“因子viii”在整个本申请中缩写为“fviii”,意指具有其在凝结中的正常作用的功能性fviii多肽。因此,术语fviii包括功能性变异体多肽。“fviii蛋白”可与fviii多肽(或蛋白质)或fviii互换使用。fviii功能的例子包括但不限于激活凝结的能力、作为因子ix的辅因子作用的能力或在ca2+和磷脂存在下与因子ix形成因子ⅹ酶复合物的能力,所述复合物然后将因子x转化为激活形式xa。fviii蛋白可以是人、猪、犬、大鼠或鼠类fviii蛋白。另外,来自人和其他物种的fviii之间的比较已经鉴定出可能为功能所需的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632)。全长多肽和多核苷酸序列是已知的,许多功能片段、突变体和经修饰形式也是已知的。多个fviii氨基酸和核苷酸序列披露于例如以下文献中:美国公开号2015/0158929a1、2014/0308280a1和2014/0370035a1以及国际公开号wo2015/106052a1。fviii多肽包括例如全长fviii、在n末端缺少met的全长fviii、成熟fviii(缺少信号序列)、在n末端具有额外met的成熟fviii和/或完全或部分缺失b结构域的fviii。fviii变异体包括部分或完全缺失的b结构域缺失。本文所用的嵌合蛋白中的fviii部分具有fviii活性。fviii活性可以通过业内任何已知方法来量测。多种测试可用于评估凝结系统的功能:激活部分促凝血酶原激酶时间(aptt)测试、生色测定、rotem测定、凝血酶原时间(pt)测试(也用于确定inr)、纤维蛋白原测试(通常通过克劳斯法进行)、血小板计数、血小板功能测试(通常通过pfa-100进行)、tct、出血时间、混合测试(如果将患者的血浆与正常血浆混合,是否矫正异常)、凝结因子测定、抗磷脂抗体、d-二聚体、遗传测试(例如,因子vleiden、凝血酶原突变g20210a)、稀释鲁塞尔蝰蛇毒时间(drvvt)、杂项血小板功能测试、凝血弹性描记法(teg或sonoclot)、凝血弹性量测法(例如)或优球蛋白溶解时间(elt)。aptt测试是量测“固有”(也称为接触激活路径)和常见凝结路径二者的功效的表达指示物。这个测试一般用于量测市售重组凝血因子(例如,fviii)的凝血活性。其与量测外在路径的凝血酶原时间(pt)结合使用。rotem分析提供关于止血的整体动力学的信息:凝血时间、凝块形成、凝块稳定性和溶解。凝血弹性量测法中的不同参数依赖于血浆凝结系统的活性、血小板功能、纤维蛋白溶解或影响这些相互作用的许多因素。这个分析可以提供次级止血的全面见解。生色测定机制是基于血液凝结级联的原理,其中在激活的因子ix、磷脂和钙离子存在下,激活的fviii加速因子x转化为因子xa。因子xa活性是通过水解对因子xa具有特异性的对硝基苯胺(pna)底物来评估。在405nm下量测的对硝基苯胺的初始释放速率与因子xa活性成正比,并且因此与样品中的fviii活性成正比。生色测定得到了国际血栓形成与止血学会(isth)的科学标准化委员会(ssc)的fviii和因子ix小组委员会的推荐。从1994以来,生色测定也已经是欧洲药典中用于指定fviii浓缩物效力的参考方法。因此,在一个实施例中,包含fviii的嵌合多肽具有与包含成熟fviii或bddfviii的嵌合多肽(例如,或)相当的fviii活性。在另一个实施例中,本公开文本的包含fviii的嵌合蛋白的因子xa产生速率与包含成熟fviii或bddfviii的嵌合蛋白(例如,或)相当。为了将因子x激活为因子xa,激活的因子ix(因子ixa)在ca2+、膜磷脂和fviii辅因子存在下水解因子x中的一个精氨酸-异亮氨酸键以形成因子xa。因此,fviii与因子ix的相互作用在凝结路径中具有关键作用。在某些实施例中,包含fviii的嵌合多肽能以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的速率与因子ixa相互作用。另外,fviii结合至血管性血友病因子,同时在循环中无活性。fviii在不结合至vwf时快速降解,并且通过凝血酶的作用从vwf释放。在一些实施例中,包含fviii的嵌合多肽以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的水平结合至血管性血友病因子。可在钙和磷脂存在下通过激活的蛋白质c使fviii失活。激活的蛋白质c在a1结构域中的精氨酸336之后切割fviii重链,从而破坏因子x底物相互作用位点,并在a2结构域中的精氨酸562之后切割,从而增强a2结构域的解离并且破坏与因子ixa的相互作用位点。这种切割还对切a2结构域(43kda)并产生a2-n(18kda)和a2-c(25kda)结构域。因此,激活的蛋白质c可催化重链中的多个切割位点。在一个实施例中,通过激活的蛋白质c以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的水平使包含fviii的嵌合多肽失活。在其他实施例中,包含fviii的嵌合蛋白具有与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的体内fviii活性。在一个特定实施例中,在hema小鼠尾静脉横断模型中,包含fviii的嵌合多肽能够以与包含成熟fviii序列或bddfviii的嵌合多肽(例如,或)相当的水平保护hema小鼠。如本文所用的fviii的“b结构域”与本领域已知的b结构域相同,所述b结构域是通过成熟人fviii的内部氨基酸序列同一性和凝血酶的蛋白质水解切割位点(例如,残基ser741-arg1648)来定义。其他人fviii结构域是相对于成熟人fviii,通过以下氨基酸残基来定义:成熟fviii的a1,残基ala1-arg372;a2,残基ser373-arg740;a3,残基ser1690-ile2032;c1,残基arg2033-asn2172;c2,残基ser2173-tyr2332。除非另外指示,否则在不提及任何seqid编号的情况下,本文中使用的序列残基编号对应于不含信号肽序列(19个氨基酸)的fviii序列。a3-c1-c2序列(也称为fviii重链)包括残基ser1690-tyr2332。其余序列(残基glu1649-arg1689)通常被称为fviii轻链激活肽。猪、小鼠和犬fviii的所有结构域(包括b结构域)的边界的位置也是本领域已知的。在一个实施例中,fviii的b结构域缺失(“b结构域缺失的fviii”或“bddfviii”)。bddfviii的例子是(重组bddfviii)。在一个特定实施例中,b结构域缺失的fviii变异体包含成熟fviii的氨基酸残基746至1648的缺失。“b结构域缺失的fviii”可以具有以下文献中披露的完全或部分缺失:美国专利号6,316,226、6,346,513、7,041,635、5,789,203、6,060,447、5,595,886、6,228,620、5,972,885、6,048,720、5,543,502、5,610,278、5,171,844、5,112,950、4,868,112和6,458,563以及国际公开号wo2015106052a1(pct/us2015/010738)。在一些实施例中,用于本公开文本的方法中的b结构域缺失的fviii序列包含美国专利号6,316,226(也在us6,346,513中)的第4栏第4行至第5栏第28行和实例1-5中披露的缺失中的任何一个。在另一个实施例中,b结构域缺失的因子viii是s743/q1638b结构域缺失的因子viii(sqbddfviii)(例如,具有氨基酸744至氨基酸1637的缺失的因子viii,例如具有成熟fviii的氨基酸1-743和氨基酸1638-2332的因子viii)。在一些实施例中,用于本公开文本的方法中的b结构域缺失的fviii具有美国专利号5,789,203(还有us6,060,447、us5,595,886和us6,228,620)的第2栏第26-51行和实例5-8中披露的缺失。在一些实施例中,b结构域缺失的因子viii具有以下文献中所述的缺失:美国专利号5,972,885的第1栏第25行至第2栏第40行;美国专利号6,048,720的第6栏第1-22行和实例1;美国专利号5,543,502的第2栏第17-46行;美国专利号5,171,844的第4栏第22行至第5栏第36行;美国专利号5,112,950的第2栏第55-68行、图2和实例1;美国专利号4,868,112的第2栏第2行至第19栏第21行和表2;美国专利号7,041,635的第2栏第1行至第3栏第19行、第3栏第40行至第4栏第67行、第7栏第43行至第8栏第26行和第11栏第5行至第13栏第39行;或美国专利号6,458,563的第4栏第25-53行。在一些实施例中,b结构域缺失的fviii具有大部分b结构域的缺失,但是仍含有将初级翻译产物在体内蛋白质水解加工为两条多肽链所必需的b结构域的胺基末端序列,如wo91/09122中所披露。在一些实施例中,b结构域缺失的fviii构建为具有氨基酸747-1638的缺失,即实际上完全缺失b结构域。hoebenr.c.等j.biol.chem.265(13):7318-7323(1990)。b结构域缺失的因子viii还可以含有fviii的氨基酸771–1666或氨基酸868-1562的缺失。meulienp.等proteineng.2(4):301-6(1988)。作为本发明的一部分的其他b结构域缺失包括:氨基酸982至1562或760至1639(toole等,proc.natl.acad.sci.u.s.a.(1986)83,5939-5942)、797至1562(eaton,等biochemistry(1986)25:8343-8347)、741至1646(kaufman(pct公开申请号wo87/04187))、747-1560(sarver等,dna(1987)6:553-564)、741至1648(pasek(pct申请号88/00831))或者816至1598或741至1648(lagner(behringinst.mitt.(1988)第82期:16-25、ep295597))的缺失。在一个特定实施例中,b结构域缺失的fviii包含成熟fviii的氨基酸残基746至1648的缺失。在另一个实施例中,b结构域缺失的fviii包含成熟fviii的氨基酸残基745至1648的缺失。在一些实施例中,bddfviii包含含有对应于成熟全长fviii的氨基酸765至1652中的缺失的单链fviii(也称为rviii-singlechain和)。参见美国专利号7,041,635。在其他实施例中,bddfviii包括含有b结构域的如下片段的fviii多肽,所述片段保留一个或多个n连接糖基化位点,例如对应于全长fviii序列的氨基酸序列的残基757、784、828、900、963或任选地943。b结构域片段的例子包括b结构域的226个氨基酸或163个氨基酸,如miao,h.z.等,blood103(a):3412-3419(2004);kasuda,a等,j.thromb.haemost.6:1352-1359(2008)和pipe,s.w.等,j.thromb.haemost.9:2235-2242(2011)中所披露(即,保留b结构域的前226个氨基酸或163个氨基酸)。在仍其他实施例中,bddfviii还包含在残基309处的点突变(从phe至ser)以改良bddfviii蛋白的表达。参见miao,h.z.等,blood103(a):3412-3419(2004)。在仍其他实施例中,bddfviii包括含有b结构域的一部分,但是不含一个或多个弗林蛋白酶切割位点(例如,arg1313和arg1648)的fviii多肽。参见pipe,s.w.等,j.thromb.haemost.9:2235-2242(2011)。在一些实施例中,bddfviii包含含有对应于成熟全长fviii的氨基酸765至1652中的缺失的单链fviii(也称为rviii-singlechain和参见美国专利号7,041,635。可以在任何fviii序列中产生前述每一种缺失。已知众多种功能fviii变异体,如上文和下文所讨论。另外,已经在血友病患者体内鉴定出fviii中的数百种非功能性突变,并且已经确定,这些突变对fviii功能的影响更多归因于其在fviii的三维结构内的位置而不是取代的性质(cutler等,hum.mutat.19:274-8(2002)),将所述文献通过引用以其整体并入本文。另外,来自人和其他物种的fviii之间的比较已经鉴定出可能为功能所需的保守残基(cameron等,thromb.haemost.79:317-22(1998);us6,251,632),将所述文献通过引用以其整体并入本文。在一些实施例中,fviii多肽包含其fviii变异体或片段,其中其fviii变异体或片段具有fviii活性。在一些实施例中,基因盒编码全长fviii多肽。在其他实施例中,基因盒编码b结构域缺失的(bdd)fviii多肽,其中缺失fviii的b结构域的全部或一部分。在一个特定实施例中,基因盒编码包含与seqidno:106、107、109、110、111或112具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽。在一些实施例中,基因盒编码具有seqidno:17的氨基酸序列的多肽或其片段。在一些实施例中,基因盒编码具有seqidno:106的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与seqidno:107具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒编码具有seqidno:109的氨基酸序列的多肽或其片段。在一些实施例中,基因盒包含与seqidno:16具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与seqidno:109具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,本公开文本的基因盒编码包含信号肽的fviii多肽或其片段。在其他实施例中,基因盒编码缺少信号肽的fviii多肽。在一些实施例中,信号肽包含seqidno:17的氨基酸1-19。在一些实施例中,基因盒包含编码fviii多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含国际申请号pct/us2017/015879中披露的核苷酸序列,将所述申请通过引用以其整体并入本文。在一些实施例中,基因盒包含编码fviii多肽的核苷酸序列,其中核苷酸序列经密码子优化。在某些实施例中,基因盒包含与选自seqidno:1-14的核苷酸序列具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与seqidno:71具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。在一些实施例中,基因盒包含与seqidno:19具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列。i.编码fviii多肽的密码子优化的核苷酸序列在一些实施例中,本公开文本的核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中第一itr和第二itr衍生自aav基因组,并且其中基因盒包含编码fviii多肽的密码子优化的核苷酸序列。在一些实施例中,密码子优化的核苷酸序列编码全长fviii多肽。在其他实施例中,密码子优化的核苷酸序列编码b结构域缺失的(bdd)fviii多肽,其中缺失fviii的b结构域的全部或一部分。在一个特定实施例中,密码子优化的核苷酸序列编码包含与seqidno:17具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的多肽或其片段。在一个实施例中,密码子优化的核苷酸序列编码具有seqidno:17的氨基酸序列的多肽或其片段。在一些实施例中,密码子优化的核苷酸序列编码包含信号肽的fviii多肽或其片段。在其他实施例中,密码子优化的序列编码缺少信号肽的fviii多肽。在一些实施例中,信号肽包含seqidno:17的氨基酸1-19。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791或(ii)seqidno:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在一个特定实施例中,第一核酸序列与seqidno:3的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在另一个实施例中,第一核酸序列与seqidno:4的核苷酸58-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第一核苷酸序列包含seqidno:3的核苷酸58-1791或seqidno:4的核苷酸58-1791。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸1-1791或(ii)seqidno:4的核苷酸1-1791具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在一个实施例中,第一核苷酸序列包含seqidno:3的核苷酸1-1791或seqidno:4的核苷酸1-1791。在另一个实施例中,第二核苷酸序列与seqidno:3的核苷酸1792-4374或seqidno:4的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含seqidno:3的核苷酸1792-4374或seqidno:4的核苷酸1792-4374。在仍另一个实施例中,第二核苷酸序列与seqidno:3的核苷酸1792-2277和2320-4374或seqidno:4的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:3的核苷酸1792-4374或seqidno:4的核苷酸1792-4374)具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核苷酸序列包含seqidno:3的核苷酸1792-2277和2320-4374或seqidno:4的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:3的核苷酸1792-4374或seqidno:4的核苷酸1792-4374)。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374或(ii)seqidno:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在某些实施例中,第二核酸序列与seqidno:5的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与seqidno:6的核苷酸1792-4374具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含seqidno:5的核苷酸1792-4374或seqidno:6的核苷酸1792-4374。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸58-1791或seqidno:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸1-1791或seqidno:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374)或(ii)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在某些实施例中,第二核酸序列与seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,第二核酸序列与seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,第二核酸序列包含seqidno:5的核苷酸1792-2277和2320-4374或seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374或seqidno:6的核苷酸1792-4374)。在一些实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸58-1791或seqidno:6的核苷酸58-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,上文所列示的与第二核酸序列连接的第一核酸序列与seqidno:5的核苷酸1-1791或seqidno:6的核苷酸1-1791具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:1的核苷酸58-1791、(ii)seqidno:2的核苷酸58-1791、(iii)seqidno:70的核苷酸58-1791或(iv)seqidno:71的核苷酸58-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在其他实施例中,第一核苷酸序列包含seqidno:1的核苷酸58-1791、seqidno:2的核苷酸58-1791、(iii)seqidno:70的核苷酸58-1791或(iv)seqidno:71的核苷酸58-1791。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:1的核苷酸1-1791、(ii)seqidno:2的核苷酸1-1791、(iii)seqidno:70的核苷酸1-1791或(iv)seqidno:71的核苷酸1-1791具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在一个实施例中,第一核苷酸序列包含seqidno:1的核苷酸1-1791、seqidno:2的核苷酸1-1791、(iii)seqidno:70的核苷酸1-1791或(iv)seqidno:71的核苷酸1-1791。在另一个实施例中,与第一核苷酸序列连接的第二核苷酸序列与seqidno:1的核苷酸1792-4374、seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个特定实施例中,与第一核苷酸序列连接的第二核苷酸序列包含(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374。在其他实施例中,与第一核苷酸序列连接的第二核苷酸序列与(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一个实施例中,第二核苷酸序列包含(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在一个特定实施例中,第二核酸序列包含(i)seqidno:1的核苷酸1792-4374、(ii)seqidno:2的核苷酸1792-4374、(iii)seqidno:70的核苷酸1792-4374或(iv)seqidno:71的核苷酸1792-4374。在一些实施例中,编码fviii多肽的密码子优化的序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1的核苷酸1792-4374、seqidno:2的核苷酸1792-4374、seqidno:70的核苷酸1792-4374或seqidno:71的核苷酸1792-4374)具有至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性;并且其中n末端部分和c末端部分一起具有fviii多肽活性。在一个实施例中,第二核酸序列包含(i)seqidno:1的核苷酸1792-2277和2320-4374、(ii)seqidno:2的核苷酸1792-2277和2320-4374、(iii)seqidno:70的核苷酸1792-2277和2320-4374或(iv)seqidno:71的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1的核苷酸1792-4374、seqidno:2的核苷酸1792-4374、seqidno:70的核苷酸1792-4374或seqidno:71的核苷酸1792-4374)。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:1的核苷酸58至4374具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:1的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1的核苷酸58-4374)具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与seqidno:1具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含seqidno:1的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1的核苷酸58-4374)或seqidno:1的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:1的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1的核苷酸1-4374)或seqidno:1的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:2的核苷酸58至4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:2的核苷酸58-2277和2320-4374具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与seqidno:2具有至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含seqidno:2的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:2的核苷酸58-4374)或seqidno:2的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:2的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:2的核苷酸1-4374)或seqidno:2的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:70的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:70的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:70的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与seqidno:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含seqidno:70的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:70的核苷酸58-4374)或seqidno:70的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:70的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:70的核苷酸1-4374)或seqidno:70的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:71的核苷酸58至4374具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:71的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:71的核苷酸58-4374)具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与seqidno:71具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含seqidno:71的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:71的核苷酸58-4374)或seqidno:71的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:71的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:71的核苷酸1-4374)或seqidno:71的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:3的核苷酸58至4374具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:3的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:3的核苷酸58-4374)具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与seqidno:3具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含seqidno:3的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:3的核苷酸58-4374)或seqidno:3的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:3的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:3的核苷酸1-4374)或seqidno:3的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:4的核苷酸58至4374具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:4的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:4的核苷酸58-4374)具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核酸序列与seqidno:4具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在其他实施例中,核苷酸序列包含seqidno:4的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:4的核苷酸58-4374)或seqidno:4的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:4的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:4的核苷酸1-4374)或seqidno:4的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:5的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:5的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与seqidno:5具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含seqidno:5的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸58-4374)或seqidno:5的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:5的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1-4374)或seqidno:5的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与seqidno:6的核苷酸58至4374具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在其他实施例中,核苷酸序列包含与seqidno:6的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸58-4374)具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核酸序列。在某些实施例中,核酸序列与seqidno:6具有至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性。在一些实施例中,核苷酸序列包含seqidno:6的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸58-4374)或seqidno:6的核苷酸58至4374。在仍其他实施例中,核苷酸序列包含seqidno:6的核苷酸1-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1-4374)或seqidno:6的核苷酸1至4374。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码信号肽的核酸序列。在某些实施例中,信号肽是fviii信号肽。在一些实施例中,编码信号肽的核酸序列经密码子优化。在一个特定实施例中,编码信号肽的核酸序列与(i)seqidno:1的核苷酸1至57;(ii)seqidno:2的核苷酸1至57;(iii)seqidno:3的核苷酸1至57;(iv)seqidno:4的核苷酸1至57;(v)seqidno:5的核苷酸1至57;(vi)seqidno:6的核苷酸1至57;(vii)seqidno:70的核苷酸1至57;(viii)seqidno:71的核苷酸1至57;或(ix)seqidno:68的核苷酸1至57具有至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。seqidno:1-6、70和71是起始或“亲代”或“野生型”fviii核苷酸序列seqidno:16的优化形式。seqidno:16编码b结构域缺失的人fviii。虽然seqidno:1-6、70和71衍生自fviii的特定b结构域缺失形式(seqidno:16),但是应理解,本公开文本还包括编码fviii的其他形式的核酸的优化形式。例如,fviii的其他形式可以包括全长fviii、fviii的其他b结构域缺失(本文所述)或保留fviii活性的其他fviii片段。在一个实施例中,基因盒包含fviii构建体,其包括如表2a-2f中所列示的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2a中所述的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2b中所述的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2c中所述的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2d中所述的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2e中所述的多核苷酸序列。在一个实施例中,基因盒包含fviii构建体,其包括表2f中所述的多核苷酸序列。在某些实施例中,分离的核酸分子包含与seqidno:179、182、189或194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:179的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:182的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:189的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:194的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性fviii蛋白的能力。表2a:示例性aav-fviii构建体(核苷酸1-6526;seqidno:110)表2b:带有b19d135itr的示例性b19-fviii构建体(核苷酸1-6762;seqidno:179)表2c:带有gpvd162itr的示例性gpv-fviii构建体(核苷酸1-6830;seqidno:182)表2d:带有全长b19itr的示例性b19-fviii构建体(核苷酸1-7032;seqidno:189)表2e:示例性aav-fviii构建体(核苷酸1-6824;seqidno:190)表2f:带有全长gpvitr的示例性gpv-fviii构建体(核苷酸1-7154;seqidno:194)在一个实施例中,基因盒包含苯丙氨酸羟化酶(pah)构建体,其包括如表10a和10b中所列示的多核苷酸序列。在一个实施例中,基因盒包含pah构建体,其包括表10a中所述的多核苷酸序列。在一个实施例中,基因盒包含pah构建体,其包括表10b中所述的多核苷酸序列。在某些实施例中,分离的核酸分子包含与seqidno:197或198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:197的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子包含与seqidno:198的核苷酸序列具有至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%序列同一性的核苷酸序列。在一些实施例中,分离的核酸分子保留表达功能性苯丙氨酸羟化酶的能力。a.密码子适应指数在一个实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列的人密码子适应指数相对于seqidno:16增加。例如,密码子优化的核苷酸序列可具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)、至少约0.91(91%)、至少约0.92(92%)、至少约0.93(93%)、至少约0.94(94%)、至少约0.95(95%)、至少约0.96(96%)、至少约0.97(97%)、至少约0.98(98%)或至少约0.99(99%)。在一些实施例中,密码子优化的核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(91%)的人密码子适应指数。在其他实施例中,密码子优化的核苷酸序列具有至少约.91(97%)的人密码子适应指数。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)、至少约0.88(88%)、至少约0.89(89%)、至少约0.90(90%)或至少约.91(91%)。在一个特定实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.91(91%)的人密码子适应指数。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含如下核苷酸序列,其包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-2277和2320-4374或(ii)seqidno:6的核苷酸1792-2277和2320-4374具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中所述核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约.88(88%)的人密码子适应指数。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码具有fviii活性的多肽的核苷酸序列,其中所述核苷酸序列包含与选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中所述核苷酸序列的人密码子适应指数相对于seqidno:16增加。在一些实施例中,核苷酸序列具有以下人密码子适应指数:至少约0.75(75%)、至少约0.76(76%)、至少约0.77(77%)、至少约0.78(78%)、至少约0.79(79%)、至少约0.80(80%)、至少约0.81(81%)、至少约0.82(82%)、至少约0.83(83%)、至少约0.84(84%)、至少约0.85(85%)、至少约0.86(86%)、至少约0.87(87%)或至少约0.88(88%)。在一个特定实施例中,核苷酸序列具有至少约0.75(75%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.83(83%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.88(88%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.91(91%)的人密码子适应指数。在另一个实施例中,核苷酸序列具有至少约0.97(97%)的人密码子适应指数。在一些实施例中,本公开文本的编码fviii多肽的密码子优化的核苷酸序列具有相对于seqidno:16增加的最优密码子频率(fop)。在某些实施例中,编码fviii多肽的密码子优化的核苷酸序列的fop是至少约40、至少约45、至少约50、至少约55、至少约60、至少约64、至少约65、至少约70、至少约75、至少约79、至少约80、至少约85或至少约90。在其他实施例中,本公开文本的编码fviii多肽的密码子优化的核苷酸序列具有相对于seqidno:16增加的同义密码子相对使用度(rcsu)。在一些实施例中,分离的核酸分子的rcsu大于1.5。在其他实施例中,分离的核酸分子的rcsu大于2.0。在某些实施例中,分离的核酸分子的rcsu是至少约1.5、至少约1.6、至少约1.7、至少约1.8、至少约1.9、至少约2.0、至少约2.1、至少约2.2、至少约2.3、至少约2.4、至少约2.5、至少约2.6或至少约2.7。在仍其他实施例中,本公开文本的编码fviii多肽的密码子优化的核苷酸序列具有相对于seqidno:16减少的密码子有效数。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列具有以下密码子有效数:小于约50、小于约45、小于约40、小于约35、小于约30或小于约25。在一个特定实施例中,分离的核酸分子具有以下密码子有效数:约40、约35、约30、约25或约20。b.g/c含量优化在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中与seqidno:16中的g/c核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的g/c核苷酸。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列具有以下g/c含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%、至少约58%、至少约59%或至少约60%。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中与seqidno:16中的g/c核苷酸的百分比相比,所述核苷酸序列含有更高百分比的g/c核苷酸。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含以下g/c含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%、至少约57%或至少约58%。在一个特定实施例中,编码具有fviii活性的多肽的核苷酸序列具有至少约58%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374)或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中与seqidno:16中的g/c核苷酸的百分比相比,密码子优化的核苷酸序列含有更高百分比的g/c核苷酸。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列具有以下g/c含量:至少约45%、至少约46%、至少约47%、至少约48%、至少约49%、至少约50%、至少约51%、至少约52%、至少约53%、至少约54%、至少约55%、至少约56%或至少约57%。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约52%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约55%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约57%的g/c含量。在其他实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中与seqidno:16中的g/c核苷酸的百分比相比,所述核苷酸序列含有更高百分比的g/c核苷酸。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约45%的g/c含量。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约52%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约55%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约57%的g/c含量。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约58%的g/c含量。在仍另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列具有至少约60%的g/c含量。“g/c含量”(或鸟嘌呤-胞嘧啶含量)或“g/c核苷酸的百分比”是指dna分子中是鸟嘌呤或胞嘧啶的含氮碱基的百分比。g/c含量可使用下式计算:人基因的g/c含量具有高异质性,其中一些基因的g/c含量低至20%,并且其他基因的g/c含量高至95%。通常,富含g/c的基因具有更高表达。事实上,已证实,增加基因的g/c含量可导致基因表达增加,这主要是由于转录增加和较高稳态mrna水平所致。参见kudla等,plosbiol.,4(6):e180(2006)。c.基质附着区样序列在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于seqidno:16含有更少mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多1个mars/ars序列。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含mars/ars序列。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少mars/ars序列。在其他实施例中,编码具有fviii活性的多肽的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多1个mars/ars序列。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含mars/ars序列。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中所述核苷酸序列相对于seqidno:16含有更少mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多1个mars/ars序列。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含mars/ars序列。在其他实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374或(ii)seqidno:1、2、3、4、5、6、70或71的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多6个、至多5个、至多4个、至多3个或至多2个mars/ars序列。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多1个mars/ars序列。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含mars/ars序列。已经鉴定出人fviii核苷酸序列中富含at的组件,其与酿酒酵母(saccharomycescerevisiae)自主复制序列(ars)和核基质附着区(mar)共享序列相似性。(fallux等,mol.cell.biol.16:4264-4272(1996))。已经证实这些组件中的一种在体外结合核因子并阻遏氯霉素乙酰转移酶(cat)报告基因的表达。同上。已经假设,这些序列可能有助于人fviii基因的转录阻遏。因此,在一个实施例中,在本公开文本的编码fviii多肽的密码子优化的核苷酸序列中消除所有mar/ars序列。在亲代fviii序列(seqidno:16)中存在4个mar/arsatattt序列(seqidno:21)和3个mar/arsaaatat序列(seqidno:22)。所有这些位点都发生突变以破坏优化的fviii序列(seqidno:1-6)中的mar/ars序列。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于下表3中。表3:阻遏组件的变化概述d.去稳定序列在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列相对于seqidno:16含有更少去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含去稳定元件。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少去稳定元件。在其他实施例中,编码具有fviii活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含去稳定元件。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少去稳定元件。在其他实施例中,编码具有fviii活性的多肽的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含去稳定元件。在其他实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个去稳定元件。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个去稳定元件。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含去稳定元件。在亲代fviii序列(seqidno:16)中存在10个去稳定元件:6个attta序列(seqidno:23)和4个taaat序列(seqidno:24)。在一个实施例中,这些位点的序列发生突变以破坏优化的fviiiseqidno:1-6、70和71中的去稳定元件。优化的序列中这些组件各自的位置以及相应核苷酸的序列显示于表3中。e.潜在启动子结合位点在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中所述核苷酸序列相对于seqidno:16含有更少潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。在一个特定实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。在其他实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列相对于seqidno:16含有更少潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多9个、至多8个、至多7个、至多6个或至多5个潜在启动子结合位点。在其他实施例中,编码fviii多肽的密码子优化的核苷酸序列含有至多4个、至多3个、至多2个或至多1个潜在启动子结合位点。在又其他实施例中,编码fviii多肽的密码子优化的核苷酸序列不含潜在启动子结合位点。tata盒是通常在真核生物的启动子区中发现的调控序列。其用作通用转录因子tata结合蛋白(tbp)的结合位点。tata盒通常包含序列tataa(seqidno:28)或相似变异体。然而,编码序列内的tata盒可以抑制全长蛋白质的翻译。在野生型bddfviii序列(seqidno:16)中存在10个潜在启动子结合序列:5个tataa序列(seqidno:28)和5个ttata序列(seqidno:29)。在一些实施例中,在本公开文本的fviii基因中消除至少1个、至少2个、至少3个或至少4个激活子结合位点。在一些实施例中,在本公开文本的fviii基因中消除至少5个激活子结合位点。在其他实施例中,在本公开文本的fviii基因中消除至少6个、至少7个或至少8个激活子结合位点。在一个实施例中,在本公开文本的fviii基因中消除至少9个激活子结合位点。在一个特定实施例中,在本公开文本的fviii基因中消除所有启动子结合位点。优化的序列中每个潜在启动子结合位点的位置以及相应核苷酸的序列显示于表3中。f.其他顺式作用负调控组件除了上述的mar/ars序列、去稳定元件和潜在启动子位点以外,在野生型bddfviii序列(seqidno:16)中还可以鉴定出若干个其他潜在抑制性序列。在未经优化的bddfviii序列中可以鉴定出两个富含au的序列组件(are)(attttatt(seqidno:30);和atttttaa(seqidno:31))以及多聚a位点(aaaaaaa;seqidno:26)、多聚t位点(tttttt;seqidno:25)和剪接位点(ggtgat;seqidno:27)。这些组件中的一个或多个可以从优化的fviii序列去除。优化的序列中这些位点各自的位置以及相应核苷酸的序列显示于表3中。在某些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚t序列、多聚a序列、are序列或其任何组合。在另一个实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第二核酸序列与(i)seqidno:5的核苷酸1792-4374;(ii)seqidno:6的核苷酸1792-4374;(iii)seqidno:5的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:5的核苷酸1792-4374);或(iv)seqidno:6的核苷酸1792-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:6的核苷酸1792-4374)具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚t序列、多聚a序列、are序列或其任何组合。在其他实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中所述核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含一个或多个顺式作用负调控组件,例如剪接位点、多聚t序列、多聚a序列、are序列或其任何组合。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含剪接位点ggtgat(seqidno:27)。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含多聚t序列(seqidno:25)。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含多聚a序列(seqidno:26)。在一些实施例中,编码fviii多肽的密码子优化的核苷酸序列包含编码fviii多肽的n末端部分的第一核酸序列和编码fviii多肽的c末端部分的第二核酸序列;其中第一核酸序列与(i)seqidno:3的核苷酸58-1791;(ii)seqidno:3的核苷酸1-1791;(iii)seqidno:4的核苷酸58-1791;或(iv)seqidno:4的核苷酸1-1791具有至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性;其中n末端部分和c末端部分一起具有fviii多肽活性;并且其中密码子优化的核苷酸序列不含are组件(seqidno:30或seqidno:31)。在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含剪接位点ggtgat(seqidno:27)。在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚t序列(seqidno:25)。在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含多聚a序列(seqidno:26)。在一些实施例中,基因盒包含编码fviii多肽的密码子优化的核苷酸序列,其中密码子优化的核苷酸序列包含与(i)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-4374或(ii)选自seqidno:1、2、3、4、5、6、70和71的氨基酸序列的核苷酸58-2277和2320-4374(即,不含编码b结构域或b结构域片段的核苷酸的seqidno:1、2、3、4、5、6、70或71的核苷酸58-4374)具有至少约80%、至少约85%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核酸序列;并且其中密码子优化的核苷酸序列不含are组件(seqidno:30或seqidno:31)。在其他实施例中,本公开文本的优化的fviii序列不含抗病毒基序、茎环结构和重复序列中的一个或多个。在仍其他实施例中,转录起始位点周围的核苷酸变为kozak共有序列(gccgccaccatgc(seqidno:32),其中加下划线的核苷酸是起始密码子)。在其他实施例中,可添加或去除限制位点以有助于克隆过程。b.fix和编码fix蛋白的多核苷酸序列在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含fix多肽。在一些实施例中,fix多肽包含fix或其变异体或片段,其中fix或其变异体或片段具有fix活性。人fix是丝氨酸蛋白酶,其是血液凝结级联的固有路径的重要组分。如本文所用的“因子ix”或“fix”是指凝结因子蛋白和种类及其序列变异体,并且包括但不限于人fix前体多肽(“prepro”)的461单链氨基酸序列、成熟人fix(seqidno:125)的415单链氨基酸序列和r338lfix(padua)变异体(seqidno:126)。fix包括具有血液凝结fix的典型特征的任何形式的fix分子。如本文所用,“因子ix”和“fix”旨在涵盖包含以下的多肽:结构域gla(含有γ-羧基谷氨酸残基的区域)、egf1和egf2(含有与人表皮生长因子同源的序列的区域)、激活肽(由成熟fix的残基r136-r180形成的“ap”)和c末端蛋白酶结构域(“pro”)或本领域已知的这些结构域的同义词,或者可为保留天然蛋白的生物学活性的至少一部分的截短片段或序列变异体。已经克隆出fix或序列变异体,如美国专利号4,770,999和7,700,734中所述,并且编码人fix的cdna已经被分离,表征并克隆至表达载体中(参见例如,choo等,nature299:178-180(1982);fair等,blood64:194-204(1984);和kurachi等,proc.natl.acad.sci.,u.s.a.79:6461-6464(1982))。由simioni等在2009年表征的fix的一种特定变异体r338lfix(padua)变异体(seqidno:2)包含获得功能突变,所述突变与padua变异体活性相对于天然fix的几乎8倍增加相关(表4)。fix变异体还可包括具有一个或多个不影响fix多肽的fix活性的保守氨基酸取代的任何fix多肽。在一些实施例中,fix变异体包含通过可切割接头(例如,)融合的rfix-白蛋白。参见us7,939,632,通过引用以其整体并入本文。表4:示例性fix序列*灰色阴影=信号肽;下划线=xten序列;粗体=fc。**美国专利号9,856,468的seqidno:67,所述专利通过引用以其整体并入本文。fix多肽为55kda,合成为由三个区域构成的前原多肽链(seqidno:125):28个氨基酸的信号肽(seqidno:127的氨基酸1至28)、谷氨酸残基的γ-羧基化所需的18个氨基酸的前肽(氨基酸29至46)和415个氨基酸的成熟因子ix(seqidno:125或126)。前肽是γ-羧基谷氨酸结构域n末端的18个氨基酸残基的序列。前肽结合维生素k依赖性γ羧化酶,然后通过内源蛋白酶从fix的前体多肽切割,所述内源蛋白酶最可能是pace(成对碱性氨基酸切割酶),也称为弗林蛋白酶或pcsk3。在不进行γ羧基化的情况下,gla结构域不能结合钙以采取将蛋白质锚定至带负电的磷脂表面所必需的正确构象,从而使因子ix无功能。即使将其羧基化,gla结构域也依赖于前肽的切割以获得正常功能,因为保留的前肽干扰与钙和磷脂的最优结合所必需的gla结构域的构象变化。在人体内,所得成熟因子ix由肝细胞作为无活性酶原分泌至血流中,所述酶原是415个氨基酸残基的单链蛋白,其含有以重量计大约17%的碳水化合物(schmidt,a.e.等(2003)trendscardiovascmed,13:39)。成熟fix由若干个结构域构成,所述结构域以n末端至c末端构型是:gla结构域、egf1结构域、egf2结构域、激活肽(ap)结构域和蛋白酶(或催化)结构域。短接头连接egf2结构域与ap结构域。fix含有两种激活肽,分别由r145-a146和r180-v181形成。在激活后,单链fix变为2链分子,其中两条链通过二硫键连接。凝血因子可以通过替代其激活肽来工程化,从而得到改变的激活特异性。在哺乳动物体内,成熟fix必须由激活的因子xi激活以产生因子ixa。在将fix激活为fixa之后,蛋白酶结构域提供fix的催化活性。激活的因子viii(fviiia)是完全表达fixa活性的特定辅因子。在某些实施例中,fix多肽包含血浆衍生的fix的thr148等位基因形式,并且具有与内源fix类似的结构和功能特征。许多功能性fix变异体是本领域已知的。国际公开号wo02/040544a3在第4页第9-30行和第15页第6-31行披露了展现增加的对肝素抑制的抗性的突变体。国际公开号wo03/020764a2在表2和表3(在第14-24页)和第12页第1-27行披露了具有降低的t细胞免疫原性的fix突变体。国际公开号wo2007/149406a2在第4页第1行至第19页第11行披露了功能性突变体fix分子,其展现增加的蛋白质稳定性、增加的体内和体外半衰期以及增加的蛋白酶抗性。wo2007/149406a2在第19页第12行至第20行第9行还披露了嵌合的和其他变异体fix分子。国际公开号wo08/118507a2在第5页第14行至第6页第5行披露了展现增加的凝血活性的fix突变体。国际公开号wo09/051717a2在第9页第11行至第20页第2行披露了fix突变体,其具有增加的n连接和/或o连接糖基化位点数目,这导致增加的半衰期和/或回收率。国际公开号wo09/137254a2在第2页第[006]段至第5页第[011]段以及第16页第[044]段至第24页第[057]段还披露了具有增加的糖基化位点数目的因子ix突变体。国际公开号wo09/130198a2在第4页第26行至第12页第6行披露了功能性突变体fix分子,其具有增加的糖基化位点数目,这导致增加的半衰期。国际公开号wo09/140015a2在第11页第[0043]段至第13页第[0053]段披露了功能性fix突变体,其具有增加的可用于聚合物(例如,peg)缀合的cys残基数。2011年7月11日提交并且作为wo2012/006624于2012年1月12日公开的国际申请号pct/us2011/043569中所述的fix多肽也通过引用以其整体并入本文。在一些实施例中,fix多肽包含融合至白蛋白的fix多肽(例如,fix-白蛋白)。在某些实施例中,fix多肽是或rix-fp。另外,已经在血友病受试者体内鉴定出fix中的数百个非功能性突变,其中许多突变披露于国际公开号wo09/137254a2的第11-14页的表6中。此类非功能性突变不包括于本发明中,但提供了哪些突变更有可能或更不可能产生功能性fix多肽的额外指导。在一个实施例中,fix多肽(或融合多肽的因子ix部分)包含与seqidno:1或2中所述的序列(seqidno:125或126的氨基酸1至415)或者可替代地与前肽序列或与前肽和信号序列(全长fix)至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。在另一个实施例中,fix多肽包含与seqidno:2中所述的序列至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的氨基酸序列。fix促凝剂活性表示为一个或多个国际单位(iu)。1iu的fix活性大致对应于1毫升正常人血浆中fix的量。若干种测定可用于量测fix活性,包括一步式凝血测定(激活部分促凝血酶原激酶时间;aptt)、凝血酶产生时间(tga)和旋转凝血弹性量测法本发明考虑了与fix序列、天然(如来自人、非人灵长类动物、哺乳动物(包括家畜))序列片段和非天然序列变异体具有同源性的序列,所述序列保留fix的生物活性或生物功能的至少一部分和/或可用于预防、治疗、调解或改善凝结因子相关疾病、缺乏、病症或病症(例如,与创伤、手术或凝结因子缺乏相关的出血发作)。与人fix具有同源性的序列可通过标准同源性搜索技术(如ncbiblast)来发现。在某些实施例中,fix序列经过密码子优化。密码子优化的fix序列的例子包括但不限于国际公开号wo2016/004113a1的seqidno:1和54-58,将所述专利通过引用以其整体并入本文。c.fvii和编码fvii蛋白的多核苷酸序列在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,其中治疗性蛋白质包含因子vii多肽。在一些实施例中,fvii多肽包含fvii或其变异体或片段,其中其变异体或片段具有fvii活性。“因子vii”(“fvii”或“f7”;也称为因子7、凝结因子vii、血清因子vii、血清凝血酶原转化加速因子、spca、前转化素(proconvertin)和依他凝血素α(eptacogα))是丝氨酸蛋白酶,其是凝结级联的一部分。在一个实施例中,本文所述的核酸中的凝血因子是fvii。重组激活的因子vii(“fvii”)已经广泛用于治疗大出血,如发生在患有以下疾病的患者中的大出血:血友病a或b、缺乏凝结因子xi、fvii、血小板功能缺陷、血小板减少症或血管性血友病。重组激活的fvii(rfviia;)用于治疗以下患者的出血发作:(i)具有针对fviii或fix的中和抗体(抑制剂)的血友病患者,(ii)具有fvii缺乏的患者,或(iii)正在进行外科手术的患有血友病a或b且具有抑制剂的患者。然而,展示较差功效。通常需要高浓度的fviia重复剂量来控制出血,因为fviia与激活的血小板的亲和性低,半衰期短,并且在组织因子不存在下酶活性较差。因此,对于具有fviii和fix抑制剂和/或具有fvii缺乏的血友病患者,对更好的治疗和预防选择存在未满足的医疗需求。在一个实施例中,基因盒编码fvii的成熟形式或其变异体。fvii包括gla结构域、两个egf结构域(egf-1和egf-2)以及丝氨酸蛋白酶结构域(或肽酶s1结构域),所述丝氨酸蛋白酶结构域在丝氨酸蛋白酶的肽酶s1家族的所有成员之间高度保守,如例如糜蛋白酶的情况。fvii作为单链酶原(即,可激活的fvii)和完全激活的双链形式出现。c.生长因子在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含生长因子。生长因子可以选自本领域已知的任何生长因子。在一些实施例中,生长因子是激素。在其他实施例中,生长因子是细胞因子。在一些实施例中,生长因子是趋化因子。在一些实施例中,生长因子是肾上腺髓质素(am)。在一些实施例中,生长因子是血管生成素(ang)。在一些实施例中,生长因子是自分泌运动因子。在一些实施例中,生长因子是骨形态发生蛋白(bmp)。在一些实施例中,bmp选自bmp2、bmp4、bmp5和bmp7。在一些实施例中,生长因子是睫状神经营养因子家族成员。在一些实施例中,睫状神经营养因子家族成员选自睫状神经营养因子(cntf)、白血病抑制因子(lif)、白介素-6(il-6)。在一些实施例中,生长因子是集落刺激因子。在一些实施例中,集落刺激因子选自巨噬细胞集落刺激因子(m-csf)、粒细胞集落刺激因子(g-csf)和粒细胞巨噬细胞集落刺激因子(gm-csf)。在一些实施例中,生长因子是表皮生长因子(egf)。在一些实施例中,生长因子是肝配蛋白。在一些实施例中,肝配蛋白选自肝配蛋白a1、肝配蛋白a2、肝配蛋白a3、肝配蛋白a4、肝配蛋白a5、肝配蛋白b1、肝配蛋白b2和肝配蛋白b3。在一些实施例中,生长因子是促红细胞生成素(epo)。在一些实施例中,生长因子是成纤维细胞生长因子(fgf)。在一些实施例中,fgf选自fgf1、fgf2、fgf3、fgf4、fgf5、fgf6、fgf7、fgf8、fgf9、fgf10、fgf11、fgf12、fgf13、fgf14、fgf15、fgf16、fgf17、fgf18、fgf19、fgf20、fgf21、fgf22和fgf23。在一些实施例中,生长因子是胎牛促体素(fbs)。在一些实施例中,生长因子是gdnf家族成员。在一些实施例中,gdnf家族成员选自神经胶质细胞系衍生的神经营养因子(gdnf)、神经秩蛋白、普塞芬蛋白和阿特敏蛋白。在一些实施例中,生长因子是生长分化因子-9(gdf9)。在一些实施例中,生长因子是肝细胞生长因子(hgf)。在一些实施例中,生长因子是肝细胞瘤衍生的生长因子(hdgf)。在一些实施例中,生长因子是胰岛素。在一些实施例中,生长因子是胰岛素样生长因子。在一些实施例中,胰岛素样生长因子是胰岛素样生长因子-1(igf-1)或igf-2。在一些实施例中,生长因子是白介素(il)。在一些实施例中,il选自il-1、il-2、il-3、il-4、il-5、il-6和il-7。在一些实施例中,生长因子是角质形成细胞生长因子(kgf)。在一些实施例中,生长因子是迁移刺激因子(msf)。在一些实施例中,生长因子是巨噬细胞刺激蛋白(msp或肝细胞生长因子样蛋白(hgflp))。在一些实施例中,生长因子是肌生成抑制蛋白(gdf-8)。在一些实施例中,生长因子是神经调节蛋白。在一些实施例中,神经调节蛋白选自神经调节蛋白1(nrg1)、nrg2、nrg3和nrg4。在一些实施例中,生长因子是神经营养蛋白。在一些实施例中,生长因子是脑衍生的神经营养因子(bdnf)。在一些实施例中,生长因子是神经生长因子(ngf)。在一些实施例中,ngf是神经营养蛋白-3(nt-3)或nt-4。在一些实施例中,生长因子是胎盘生长因子(pgf)。在一些实施例中,生长因子是血小板衍生的生长因子(pdgf)。在一些实施例中,生长因子是肾胺酶(rnls)。在一些实施例中,生长因子是t细胞生长因子(tcgf)。在一些实施例中,生长因子是血小板生成素(tpo)。在一些实施例中,生长因子是转化生长因子。在一些实施例中,转化生长因子是转化生长因子α(tgf-α)或tgf-β。在一些实施例中,生长因子是肿瘤坏死因子-α(tnf-α)。在一些实施例中,生长因子是血管内皮生长因子(vegf)。d.微小rna(mirna)微小rna(mirna)是通过抑制翻译或诱导信使rna(mrna)降解来负调控基因表达的小非编码rna分子(约18-22个核苷酸)。从其发现以来,mirna已经参与多种细胞过程,包括细胞凋亡、分化和细胞增生,并且其已显示在致癌中具有关键作用。mirna调控基因表达的能力使得体内mirna表达成为基因疗法中有价值的工具。本公开文本的某些方面涉及质粒样核酸分子,其包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码mirna,并且其中第一itr和/或第二itr是非腺相关病毒的itr(例如,第一itr和/或第二itr来自非aav)。mirna可以是本领域已知的任何mirna。在一些实施例中,mirna下调靶基因的表达。在某些实施例中,靶基因选自sod1、htt、rho或其任何组合。在一些实施例中,基因盒编码一种mirna。在一些实施例中,基因盒编码多于一种mirna。在一些实施例中,基因盒编码两种或更多种不同的mirna。在一些实施例中,基因盒编码相同mirna的两个或更多个拷贝。在一些实施例中,基因盒编码相同治疗性蛋白质的两种或更多种变异体。在某些实施例中,基因盒编码一种或多种mirna以及一种或多种治疗性蛋白质。在一些实施例中,mirna是天然存在的mirna。在一些实施例中,mirna是工程化mirna。在一些实施例中,mirna是人工mirna。在某些实施例中,mirna包含evers等,moleculartherapy26(9):1-15(印刷版之前的电子版,2018年6月)披露的mihtt工程化的mirna。在某些实施例中,mirna包含dirren等,annalsofclinicalandtranslationalneurology2(2):167-84(2015年2月)披露的mirsod1人工mirna。在某些实施例中,mirna包含mir-708,其靶向rho(参见behrman等,jcb192(6):919-27(2011))。在一些实施例中,mirna通过下调基因抑制剂的表达来上调所述基因的表达。在一些实施例中,抑制剂是天然(例如,野生型)抑制剂。在一些实施例中,抑制剂得自突变的、异源性和/或错误表达的基因。e.异源部分在一些实施例中,核酸分子包含第一itr、第二itr和编码靶序列的基因盒,其中靶序列编码治疗性蛋白质,并且其中治疗性蛋白质包含至少一个异源部分。在一些实施例中,异源部分融合至治疗性蛋白质的n末端或c末端。在其他实施例中,异源部分插入治疗性蛋白质内的两个氨基酸之间。在一些实施例中,治疗性蛋白质包含fviii多肽和异源部分,所述异源部分插入fviii多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入fviii多肽内。在一些实施例中,异源氨基酸序列可以在以下文献中披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内:国际公开号wo2013/123457a1、wo2015/106052a1或美国公开号2015/0158929a1,将上述文献通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含fviii和异源部分,其中所述异源部分紧邻相对于成熟fviii的氨基酸745下游插入fviii内。在一个特定实施例中,治疗性蛋白质包含fviii和xten,其中所述xten紧邻相对于成熟fviii的氨基酸745下游插入fviii内。在一个特定实施例中,fviii包含对应于成熟人fviii(seqidno:15)的氨基酸746-1646的缺失,并且异源部分紧邻对应于成熟人fviii(seqidno:15)的氨基酸745下游插入。表5:fviii异源部分插入位点在一些实施例中,治疗性蛋白质包含fix多肽和异源部分,所述异源部分插入fix多肽内的两个氨基酸之间。在一些实施例中,异源部分在选自表5的一个或多个插入位点插入fix多肽内。在一些实施例中,异源氨基酸序列可以在国际申请号pct/us2017/015879中所披露的任何位点插入本公开文本的核酸分子编码的凝血因子多肽内,将所述申请通过引用以其整体并入本文。在一个特定实施例中,治疗性蛋白质包含fix多肽和异源部分,其中所述异源部分紧邻相对于成熟fix的氨基酸166下游插入fix多肽内。在一个特定实施例中,治疗性蛋白质包含fix多肽和xten,其中所述xten紧邻相对于成熟fviii的氨基酸166下游插入fix内。表6:fix异源部分插入位点在其他实施例中,本公开文本的治疗性蛋白质还包含2个、3个、4个、5个、6个、7个或8个异源核苷酸序列。在一些实施例中,所有异源部分是相同的。在一些实施例中,至少一个异源部分与其他异源部分不同。在一些实施例中,本公开文本可包含2个、3个、4个、5个、6个或多于7个串联的异源部分。在一些实施例中,异源部分增加治疗性蛋白质的半衰期(是“半衰期延长剂”)。在一些实施例中,异源部分是具有非结构化或结构化特征的肽或多肽,所述特征与并入本公开文本的蛋白质中时体内半衰期的延长相关。非限制性例子包括白蛋白、白蛋白片段、免疫球蛋白的fc片段、人绒毛膜促性腺激素的β亚基的c末端肽(ctp)、hap序列、xten序列、转铁蛋白或其片段、pas多肽、聚甘氨酸接头、聚丝氨酸接头、白蛋白结合部分或者这些多肽的任何片段、衍生物、变异体或组合。在一个特定实施例中,异源氨基酸序列是免疫球蛋白恒定区或其部分、转铁蛋白、白蛋白或pas序列。在一些方面中,异源部分包括血管性血友病因子或其片段。在其他相关方面中,异源部分可以包括非多肽部分的附着位点(例如,半胱氨酸氨基酸),所述非多肽部分是例如聚乙二醇(peg)、羟乙基淀粉(hes)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。在一些方面中,异源部分包含半胱氨酸氨基酸,其用作非多肽部分的附着位点,所述非多肽部分是例如聚乙二醇(peg)、羟乙基淀粉(hes)、聚唾液酸或者这些组件的任何衍生物、变异体或组合。在一个具体实施例中,第一异源部分是本领域已知的半衰期延长分子,并且第二异源部分是本领域已知的半衰期延长分子。在某些实施例中,第一异源部分(例如,第一fc部分)和第二异源部分(例如,第二fc部分)彼此缔合形成二聚体。在一个实施例中,第二异源部分是第二fc部分,其中第二fc部分与第一异源部分(例如,第一fc部分)连接或缔合。例如,第二异源部分(例如,第二fc部分)可以通过接头连接至第一异源部分(例如,第一fc部分),或者通过共价或非共价键与第一异源部分缔合。在一些实施例中,异源部分是如下多肽,其包含至少约10个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2500个、至少约3000个或至少约4000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。在其他实施例中,异源部分是如下多肽,其包含约100个至约200个氨基酸、约200个至约300个氨基酸、约300个至约400个氨基酸、约400个至约500个氨基酸、约500个至约600个氨基酸、约600个至约700个氨基酸、约700个至约800个氨基酸、约800个至约900个氨基酸或约900个至约1000个氨基酸,基本上由所述氨基酸组成,或由所述氨基酸组成。在某些实施例中,异源部分改良治疗性蛋白质的一种或多种药物代谢动力学特性但不显著影响其生物学活性或功能。在某些实施例中,异源部分增加本公开文本的治疗性蛋白质的体内和/或体外半衰期。在其他实施例中,异源部分有助于本公开文本的治疗性蛋白质或其片段(例如,在fviii蛋白的蛋白质水解切割后包含异源部分的片段)的可视化或定位。本公开文本的治疗性蛋白质或其片段的可视化和/或定位可以是体内的、体外的、离体的或其组合。在其他实施例中,异源部分增加本公开文本的治疗性蛋白质或其片段(例如,在治疗性蛋白质(例如,凝血因子)的蛋白质水解切割后包含异源部分的片段)的稳定性。如本文所用,术语“稳定性”是指本领域公认的响应环境条件(例如,升高或降低的温度)维持治疗性蛋白质的一种或多种物理特性的量度。在某些方面中,物理特性可以是维持治疗性蛋白质的共价结构(例如,不存在蛋白质水解切割、不期望的氧化或脱酰胺作用)。在其他方面中,物理特性还可以是处于正确折叠状态的治疗性蛋白质的存在(例如,不存在可溶性或不溶性聚集体或沈淀物)。在一个方面中,治疗性蛋白质的稳定性是通过测定治疗性蛋白质的生物物理特性来量测,所述生物物理特性是例如热稳定性、ph解折叠谱、糖基化的稳定去除、溶解度、生化功能(例如,结合至蛋白质、受体或配位体的能力)等和/或其组合。在另一个方面中,生化功能是通过相互作用的结合亲和性来证实。在一个方面中,蛋白质稳定性的量度是热稳定性,即对热激发的抗性。稳定性可以使用本领域已知的方法来量测,如hplc(高效液相色谱)、sec(尺寸排阻色谱)、dls(动态光散射)等。量测热稳定性的方法包括但不限于差式扫描量热法(dsc)、差式扫描荧光测定法(dsf)、圆二色性(cd)和热激发测定。在某些方面中,由本公开文本的核酸分子编码的治疗性蛋白质包含至少一种半衰期延长剂,即相对于缺少这种异源部分的相应治疗性蛋白质的体内半衰期增加治疗性蛋白质的体内半衰期的异源部分。治疗性蛋白质的体内半衰期可以通过本领域的技术人员已知的任何方法来确定,例如活性测定(例如,生色测定或一步式凝血aptt测定,其中治疗性蛋白质包含fviii多肽)、elisa、等。在一些实施例中,一种或多种半衰期延长剂的存在导致治疗性蛋白质的半衰期与缺少这一种或多种半衰期延长剂的相应蛋白质的半衰期相比有所增加。包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应治疗性蛋白质的体内半衰期的至少约1.5倍、至少约2倍、至少约2.5倍、至少约3倍、至少约4倍、至少约5倍、至少约6倍、至少约7倍、至少约8倍、至少约9倍、至少约10倍、至少约11倍或至少约12倍长。在一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是缺少这种半衰期延长剂的相应蛋白质的体内半衰期的约1.5倍至约20倍、约1.5倍至约15倍或约1.5倍至约10倍长。在另一个实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期与缺少这种半衰期延长剂的相应蛋白质的体内半衰期相比延长约2倍至约10倍、约2倍至约9倍、约2倍至约8倍、约2倍至约7倍、约2倍至约6倍、约2倍至约5倍、约2倍至约4倍、约2倍至约3倍、约2.5倍至约10倍、约2.5倍至约9倍、约2.5倍至约8倍、约2.5倍至约7倍、约2.5倍至约6倍、约2.5倍至约5倍、约2.5倍至约4倍、约2.5倍至约3倍、约3倍至约10倍、约3倍至约9倍、约3倍至约8倍、约3倍至约7倍、约3倍至约6倍、约3倍至约5倍、约3倍至约4倍、约4倍至约6倍、约5倍至约7倍或约6倍至约8倍。在其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是至少约17小时、至少约18小时、至少约19小时、至少约20小时、至少约21小时、至少约22小时、至少约23小时、至少约24小时、至少约25小时、至少约26小时、至少约27小时、至少约28小时、至少约29小时、至少约30小时、至少约31小时、至少约32小时、至少约33小时、至少约34小时、至少约35小时、至少约36小时、至少约48小时、至少约60小时、至少约72小时、至少约84小时、至少约96小时或至少约108小时。在仍其他实施例中,包含半衰期延长剂的治疗性蛋白质的半衰期是约15小时至约2周、约16小时至约1周、约17小时至约1周、约18小时至约1周、约19小时至约1周、约20小时至约1周、约21小时至约1周、约22小时至约1周、约23小时至约1周、约24小时至约1周、约36小时至约1周、约48小时至约1周、约60小时至约1周、约24小时至约6天、约24小时至约5天、约24小时至约4天、约24小时至约3天或约24小时至约2天。在一些实施例中,包含半衰期延长剂的治疗性蛋白质的每名受试者的平均半衰期是约15小时、约16小时、约17小时、约18小时、约19小时、约20小时、约21小时、约22小时、约23小时、约24小时(1天)、约25小时、约26小时、约27小时、约28小时、约29小时、约30小时、约31小时、约32小时、约33小时、约34小时、约35小时、约36小时、约40小时、约44小时、约48小时(2天)、约54小时、约60小时、约72小时(3天)、约84小时、约96小时(4天)、约108小时、约120小时(5天)、约6天、约7天(1周)、约8天、约9天、约10天、约11天、约12天、约13天或约14天。一种或多种半衰期延长剂可融合至治疗性蛋白质的c末端或n末端或插入治疗性蛋白质内。1.免疫球蛋白恒定区或其部分在另一个方面中,异源部分包含一个或多个免疫球蛋白恒定区或其部分(例如,fc区)。在一个实施例中,本公开文本的分离的核酸分子还包含编码免疫球蛋白恒定区或其部分的异源核酸序列。在一些实施例中,免疫球蛋白恒定区或其部分是fc区。免疫球蛋白恒定区包括表示为ch(恒定重)结构域(ch1、ch2等)的结构域。根据同种型(即igg、igm、iga、igd或ige),恒定区可以包括3个或4个ch结构域。一些同种型(例如igg)恒定区还含有铰链区。参见janeway等2001,immunobiology,garlandpublishing,n.y.,n.y。本公开文本的免疫球蛋白恒定区或其部分可以从多种不同来源获得。在一个实施例中,免疫球蛋白恒定区或其部分衍生自人免疫球蛋白。然而,应理解,免疫球蛋白恒定区或其部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,免疫球蛋白恒定区或其部分可以衍生自任何免疫球蛋白类别(包括igm、igg、igd、iga和ige)以及任何免疫球蛋白同种型(包括igg1、igg2、igg3和igg4)。在一个实施例中,使用人同种型igg1。多个免疫球蛋白恒定区基因序列(例如,人恒定区基因序列)能以可公开获得的存放物的形式获得。可选择具有特定效应子功能(或缺少特定效应子功能)或具有特定修饰的恒定区结构域序列以降低免疫原性。已经公开了许多抗体和抗体编码基因的序列并且适宜的ig恒定区序列(例如,铰链、ch2和/或ch3序列或其部分)可使用本领域公认的技术衍生自这些序列。然后可改变或合成使用任何前述方法获得的遗传物质以获得本公开文本的多肽。应进一步了解,本公开文本的范围涵盖恒定区dna序列的等位基因、变异体和突变。免疫球蛋白恒定区或其部分的序列可例如使用聚合酶链式反应和所选用于扩增所关注结构域的引物来克隆。为了从抗体克隆免疫球蛋白恒定区或其部分的序列,可从杂交瘤、脾脏或淋巴细胞分离mrna,逆转录成dna,并通过pcr扩增抗体基因。pcr扩增方法详细描述于以下文献中:美国专利号4,683,195;4,683,202;4,800,159;4,965,188;以及例如,“pcrprotocols:aguidetomethodsandapplications”innis等编,academicpress,sandiego,ca(1990);ho等1989.gene77:51;horton等1993.methodsenzymol.217:270。pcr可以基于所公开的重链和轻链dna和氨基酸序列由共有恒定区引物或由更具特异性的引物来起始。pcr还可用于分离编码抗体轻链和重链的dna克隆。在这种情况下,可通过共有引物或较大同源探针(如小鼠恒定区探针)筛选文库。适于扩增抗体基因的多个引物组是本领域已知的(例如,基于经纯化抗体的n末端序列的5’引物(benhar和pastan.1994.proteinengineering7:1509);cdna末端的快速扩增(ruberti,f.等1994.j.immunol.methods173:33);抗体前导序列(larrick等1989biochem.biophys.res.commun.160:1250))。抗体序列的克隆还描述于newman等于1995年1月25日提交的美国专利号5,658,570中,将所述专利通过引用并入本文。本文所用的免疫球蛋白恒定区可以包括所有结构域和铰链区或其部分。在一个实施例中,免疫球蛋白恒定区或其部分包含ch2结构域、ch3结构域和铰链区,即fc区或fcrn结合配偶体。如本文所用,术语“fc区”定义为多肽中对应于天然ig的fc区的部分,即如通过其两条重链的相应fc结构域的二聚缔合所形成。天然fc区与另一fc区形成同二聚体。相比之下,如本文所用的术语“基因融合的fc区”或“单链fc区”(scfc区)是指合成二聚fc区,其包括基因连接于单条多肽链内(即,编码于单个连续基因序列中)的fc结构域。参见国际公开号wo2012/006635,通过引用以其整体并入本文。在一个实施例中,“fc区”是指单条ig重链的如下部分,其始于紧邻木瓜蛋白酶切割位点(即,igg中的残基216,以重链恒定区的第一个残基为114)上游的铰链区并终于抗体的c末端。因此,完整fc区至少包含铰链结构域、ch2结构域和ch3结构域。免疫球蛋白恒定区或其部分可为fcrn结合配偶体。fcrn在成人上皮组织中有活性并在肠腔、肺气道、鼻表面、阴道表面、结肠和直肠表面中表达(美国专利号6,485,726)。fcrn结合配偶体是免疫球蛋白的结合至fcrn的一部分。已经从包括人类在内的若干哺乳动物物种分离出fcrn受体。人fcrn、猴fcrn、大鼠fcrn和小鼠fcrn的序列是已知的(story等1994,j.exp.med.180:2377)。fcrn受体在相对低ph下结合igg(但不结合其他免疫球蛋白类别,如iga、igm、igd和ige),以内腔至浆膜方向跨细胞主动转运igg,然后在间质液中发现的相对高ph下释放igg。其在成人上皮组织中表达(美国专利号6,485,726、6,030,613、6,086,875;wo03/077834;us2003-0235536a1),包括肺和肠上皮(israel等1997,immunology92:69)、肾近端小管上皮(kobayashi等2002,am.j.physiol.renalphysiol.282:f358)以及鼻上皮、阴道表面和胆道系统表面。可用于本公开文本中的fcrn结合配偶体涵盖可由fcrn受体特异性结合的分子,包括完整igg、igg的fc片段和包括fcrn受体的完整结合区的其他片段。已经基于x射线晶体学描述了igg的fc部分中结合至fcrn受体的区域(burmeister等1994,nature372:379)。fc与fcrn的主要接触区域靠近ch2和ch3结构域的接合点。fc-fcrn接触全部位于单条ig重链内。fcrn结合配偶体包括完整igg、igg的fc片段和igg的包括fcrn的完整结合区的其他片段。主要接触位点包括ch2结构域的氨基酸残基248、250-257、272、285、288、290-291、308-311和314以及ch3结构域的氨基酸残基385-387、428和433-436。对免疫球蛋白或免疫球蛋白片段或区域的氨基酸编号的提及都是基于kabat等1991,sequencesofproteinsofimmunologicalinterest,u.s.departmentofpublichealth,bethesda,md。结合至fcrn的fc区或fcrn结合配偶体可以通过fcrn有效穿梭跨越上皮障壁,由此提供全身施用所需治疗分子的非侵入性手段。另外,包含fc区或fcrn结合配偶体的融合蛋白被表达fcrn的细胞内吞。但是这些融合蛋白再次再循环进循环中,而不是经标记以供降解,由此增加这些蛋白质的体内半衰期。在某些实施例中,免疫球蛋白恒定区的部分是fc区或fcrn结合配偶体,其通常通过二硫键和其他非特异性相互作用与另一fc区或另一fcrn结合配偶体缔合,以形成二聚体和更高阶多聚体。两个fcrn受体可以结合单个fc分子。晶体学数据表明,每个fcrn分子结合fc同二聚体的单一多肽。在一个实施例中,将fcrn结合配偶体(例如,igg的fc片段)与生物活性分子连接提供口服、经颊、舌下、经直肠、经阴道、作为经鼻施用的气溶胶或通过肺途径或通过眼部途径递送生物活性分子的手段。在另一个实施例中,凝血因子蛋白能以侵入性方式(例如,皮下、静脉内)施用。fcrn结合配偶体区域是可由fcrn受体特异性结合,随后通过fc区的fcrn受体主动转运的分子或其部分。特异性结合是指两个分子形成在生理条件下相对稳定的复合物。特异性结合的特征在于区分于通常具有低亲和性和中至高容量的非特异性结合的高亲和性和低至中容量。通常,在亲和常数ka高于106m-1或高于108m-1时,将结合视为特异性的。如果需要,可以通过改变结合条件在不显著影响特异性结合的情况下减少非特异性结合。熟习此项技术者使用常规技术可以优化适当的结合条件,如分子浓度、溶液的离子强度、温度、允许结合的时间、阻断剂(例如,血清白蛋白、奶酪蛋白)浓度等。在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含一个或多个截短fc区,但是其足以将fc受体(fcr)结合特性赋予fc区。例如,fc区中结合至fcrn的部分(即,fcrn结合部分)包含igg1的约氨基酸282-438,eu编号(主要接触位点是ch2结构域的氨基酸248、250-257、272、285、288、290-291、308-311和314以及ch3结构域的氨基酸残基385-387、428和433-436)。因此,本公开文本的fc区可以包含fcrn结合部分或由所述fcrn结合部分组成。fcrn结合部分可以衍生自任何同种型(包括iggl、igg2、igg3和igg4)的重链。在一个实施例中,使用来自人同种型igg1的抗体的fcrn结合部分。在另一个实施例中,使用来自人同种型igg4的抗体的fcrn结合部分。fc区可以从多种不同来源获得。在一个实施例中,多肽的fc区衍生自人免疫球蛋白。然而,应理解,fc部分可以衍生自另一哺乳动物物种的免疫球蛋白,所述哺乳动物物种包括例如啮齿类动物(例如,小鼠、大鼠、兔、豚鼠)或非人灵长类动物(例如,黑猩猩、猕猴)物种。此外,fc结构域或其部分的多肽可以衍生自任何免疫球蛋白类别(包括igm、igg、igd、iga和ige)以及任何免疫球蛋白同种型(包括igg1、igg2、igg3和igg4)。在另一个实施例中,使用人同种型igg1。在某些实施例中,fc变异体赋予至少一种由包含所述野生型fc结构域的fc部分赋予的效应子功能的变化(例如,fc区结合至fc受体(例如fcγri、fcγrii或fcγriii)或补体蛋白(例如,c1q)或触发抗体依赖性细胞毒性(adcc)、吞噬作用或补体依赖性细胞毒性(cdcc)的能力的改进或降低)。在其他实施例中,fc变异体提供工程化半胱氨酸残基。本公开文本的fc区可利用本领域公认的fc变异体,已知所述fc变异体可赋予效应子功能和/或fcr或fcrn结合的变化(例如,增强或降低)。具体来说,本公开文本的fc区可包括例如在以下文献中披露的一个或多个氨基酸位置处的变化(例如,取代):国际pct公开案wo88/07089a1、wo96/14339a1、wo98/05787a1、wo98/23289a1、wo99/51642a1、wo99/58572a1、wo00/09560a2、wo00/32767a1、wo00/42072a2、wo02/44215a2、wo02/060919a2、wo03/074569a2、wo04/016750a2、wo04/029207a2、wo04/035752a2、wo04/063351a2、wo04/074455a2、wo04/099249a2、wo05/040217a2、wo04/044859、wo05/070963a1、wo05/077981a2、wo05/092925a2、wo05/123780a2、wo06/019447a1、wo06/047350a2和wo06/085967a2;美国专利公开号us2007/0231329、us2007/0231329、us2007/0237765、us2007/0237766、us2007/0237767、us2007/0243188、us20070248603、us20070286859、us20080057056;或美国专利5,648,260;5,739,277;5,834,250;5,869,046;6,096,871;6,121,022;6,194,551;6,242,195;6,277,375;6,528,624;6,538,124;6,737,056;6,821,505;6,998,253;7,083,784;7,404,956和7,317,091,将每篇文献通过引用并入本文。在一个实施例中,可在一个或多个所公开的氨基酸位置进行特定变化(例如,业内披露的一个或多个氨基酸的特定取代)。在另一个实施例中,可在一个或多个所公开氨基酸位置进行不同变化(例如,业内披露的一个或多个氨基酸位置的不同取代)。igg的fc区或fcrn结合配偶体可根据公认程序(如定点突变诱发等)来修饰,以产生将由fcrn结合的经修饰igg或其fc片段或部分。此类修饰包括远离fcrn接触位点的修饰以及在接触位点内的修饰,所述修饰保留或甚至增强与fcrn的结合。例如,可在不显著损失fc对fcrn的结合亲和性的情况下取代人igg1fc(fcγ1)中的以下单个氨基酸残基:p238a、s239a、k246a、k248a、d249a、m252a、t256a、e258a、t260a、d265a、s267a、h268a、e269a、d270a、e272a、l274a、n276a、y278a、d280a、v282a、e283a、h285a、n286a、t289a、k290a、r292a、e293a、e294a、q295a、y296f、n297a、s298a、y300f、r301a、v303a、v305a、t307a、l309a、q311a、d312a、n315a、k317a、e318a、k320a、k322a、s324a、k326a、a327q、p329a、a330q、p331a、e333a、k334a、t335a、s337a、k338a、k340a、q342a、r344a、e345a、q347a、r355a、e356a、m358a、t359a、k360a、n361a、q362a、y373a、s375a、d376a、a378q、e380a、e382a、s383a、n384a、q386a、e388a、n389a、n390a、y391f、k392a、l398a、s400a、d401a、d413a、k414a、r416a、q418a、q419a、n421a、v422a、s424a、e430a、n434a、t437a、q438a、k439a、s440a、s444a和k447a,其中例如p238a代表在位置编号238处由丙氨酸取代的野生型脯氨酸。作为例子,一个具体实施例并入n297a突变,从而去除高度保守的n糖基化位点。除了丙氨酸以外,可在上文指定的位置用其他氨基酸取代野生型氨基酸。可将突变单独引入fc中,从而产生多于一百个与天然fc不同的fc区。另外,这些单独突变中的2个、3个或更多个的组合可一起引入,从而产生另外数百个fc区。某些上述突变可以对fc区或fcrn结合配偶体赋予新功能。例如,一个实施例并入n297a,从而去除高度保守的n糖基化位点。这个突变的作用是降低免疫原性,由此增强fc区的循环半衰期,并使fc区不能结合至fcγri、fcγriia、fcγriib和fcγriiia,并且不损害对fcrn的亲和性(routledge等1995,transplantation60:847;friend等1999,transplantation68:1632;shields等1995,j.biol.chem.276:6591)。作为从上述突变产生的新功能的另一例子,对fcrn的亲和性可以增加,在一些情况下超过野生型的亲和性。这种增加的亲和性可以反映增加的“缔合”速率、降低的“解离”速率或增加的“缔合”速率与降低的“解离”速率二者。相信可赋予增加的对fcrn的亲和性的突变的例子包括但不限于t256a、t307a、e380a和n434a(shields等2001,j.biol.chem.276:6591)。另外,至少三种人fcγ受体似乎识别igg上下铰链区内的结合位点,通常是氨基酸234-237。因此,如例如通过将人igg1的氨基酸233-236“ellg”(seqidno:45)替代为来自igg2的相应序列“pva”(一个氨基酸缺失),可以从这个区域的突变产生新功能的另一例子和可能降低的免疫原性。已经显示,在已经引入此类突变时,介导多种效应子功能的fcγri、fcγrii和fcγriii不会结合至igg1。ward和ghetie1995,therapeuticimmunology2:77;和armour等1999,eur.j.immunol.29:2613。在另一个实施例中,免疫球蛋白恒定区或其部分包含铰链区或其部分中的与第二免疫球蛋白恒定区或其部分形成一个或多个二硫键的氨基酸序列。第二免疫球蛋白恒定区或其部分可以连接至第二多肽,使治疗性蛋白质与第二多肽结合在一起。在一些实施例中,第二多肽是增强子部分。如本文所用,术语“增强子部分”是指能够增强治疗性蛋白质的活性的分子、其片段或多肽组分。增强子部分可以是辅因子,如其中治疗性蛋白质是凝血因子、可溶性组织因子(stf)或促凝血肽。因此,在激活凝血因子后,增强子部分可用于增强凝血因子活性。在某些实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含对免疫球蛋白恒定区或其部分的氨基酸取代(例如,fc变异体),所述氨基酸取代改变ig恒定区的抗原非依赖性效应子功能,特别是蛋白质的循环半衰期。2.scfc区在另一个方面中,异源部分包含scfc(单链fc)区。在一个实施例中,本公开文本的分离的核酸分子还包含编码scfc区的异源核酸序列。scfc区在同一线性多肽链内包含至少两个免疫球蛋白恒定区或其部分(例如,fc部分或结构域(例如,2、3、4、5、6个或更多个fc部分或结构域)),所述恒定区或其部分能够折叠(例如,分子内或分子间折叠)以形成一个由fc肽接头连接的功能性scfc区。例如,在一个实施例中,本公开文本的多肽能够通过其scfc区结合至至少一种fc受体(例如,fcrn、fcγr受体(例如,fcγriii)或补体蛋白(例如,c1q)),以改良半衰期或触发免疫效应子功能(例如,抗体依赖性细胞毒性(adcc)、吞噬作用或补体依赖性细胞毒性(cdcc)和/或改善可制造性)。3.ctp在另一个方面中,异源部分包含人绒毛膜促性腺激素的β亚基的一种c末端肽(ctp)或其片段、变异体或衍生物。已知插入重组蛋白中的一种或多种ctp肽增加所述蛋白质的体内半衰期。参见例如,美国专利号5,712,122,通过引用以其整体并入本文。示例性ctp肽包括dprfqdsssskapppslpspsrlpgpsdtpil(seqidno:33)或sssskapppslpspsrlpgpsdtpilpq(seqidno:34)。参见例如,美国专利申请公开号us2009/0087411a1,通过引用并入。4.xten序列在一些实施例中,异源部分包含一个或多个xten序列、其片段、变异体或衍生物。如本文所用,“xten序列”是指延伸长度的多肽,其具有非天然存在的基本上不重复的序列,所述序列主要由小亲水氨基酸构成,并且所述序列在生理条件下具有较低程度的或不具有二级或三级结构。作为异源部分,xten可以用作半衰期延长部分。另外,xten可以提供所需特性,包括但不限于增强的药物代谢动力学参数和溶解度特征。将包含xten序列的异源部分并入本公开文本的蛋白质中可以赋予蛋白质以下有利特性中的一种或多种:构象柔性、增强的水溶解度、高蛋白酶抗性程度、低免疫原性、与哺乳动物受体的低结合或增加的流体力学(或斯托克斯(stokes))半径。在某些方面中,xten序列可以增加药物代谢动力学特性,如较长体内半衰期或增加的曲线下面积(auc),使得与相同的但不具有xten异源部分的蛋白质相比,本公开文本的蛋白质保持在体内并且持续增加的时间段具有促凝血活性。在一些实施例中,可用于本公开文本的xten序列是具有大于约20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1200、1400、1600、1800或2000个氨基酸残基的肽或多肽。在某些实施例中,xten是具有大于约20至约3000个氨基酸残基、大于30至约2500个残基、大于40至约2000个残基、大于50至约1500个残基、大于60至约1000个残基、大于70至约900个残基、大于80至约800个残基、大于90至约700个残基、大于100至约600个残基、大于110至约500个残基或大于120至约400个残基的肽或多肽。在一个特定实施例中,xten包含长度长于42个氨基酸并且短于144个氨基酸的氨基酸序列。本公开文本的xten序列可以包含一个或多个5至14(例如,9至14)个氨基酸残基的序列基序或与所述序列基序至少80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,其中所述基序包含4至6种类型的选自甘氨酸(g)、丙氨酸(a)、丝氨酸(s)、苏氨酸(t)、谷氨酸(e)和脯氨酸(p)的氨基酸(例如,5种氨基酸),基本上由所述氨基酸组成或由所述氨基酸组成。参见us2010-0239554a1。在一些实施例中,xten包含非重迭序列基序,其中约80%、或至少约85%、或至少约90%、或约91%、或约92%、或约93%、或约94%、或约95%、或约96%、或约97%、或约98%、或约99%或约100%的序列由选自从表7选择的单一基序家族的非重迭序列的多个单元组成,从而得到家族序列。如本文所用,“家族”意指,xten具有仅选自表7的单一基序类别的基序;即,ad、ae、af、ag、am、aq、bc或bdxten,并且选择xten中并非来自家族基序的任何其他氨基酸以实现所需特性,如允许通过编码核苷酸并入限制位点、并入切割序列,或实现与治疗性蛋白质的更佳连接。在xten家族的一些实施例中,xten序列包含ad基序家族、或ae基序家族、或af基序家族、或ag基序家族、或am基序家族、或aq基序家族、或bc家族、或bd家族的非重迭序列基序的多个单元,并且所得xten展现上述同源性范围。在其他实施例中,xten包含来自表7的两个或更多个基序家族的基序序列的多个单元。可以选择这些序列以实现所需的物理/化学特征,包括如净电荷、亲水性、缺少二级结构或缺少重复性等由基序的氨基酸组成所赋予的特性,更全面地描述于下文中。在本段落的上述实施例中,可以使用本文所述方法选择并组装并入xten中的基序,以得到约36至约3000个氨基酸残基的xten。表7.12个氨基酸的xten序列基序和基序家族基序家族*基序序列seqidno:adgespggssgses73adgsegssgpgess74adgssesgsseggp75adgsggepsesgss76ae、amgspagsptstee77ae、am、aqgsepatsgsetp78ae、am、aqgtsesatpesgp79ae、am、aqgtstepsegsap80af、amgstsespsgtap81af、amgtstpesgsasp82af、amgtspsgesstap83af、amgstsstaespgp84ag、amgtpgsgtasssp85ag、amgsstpsgatgsp86ag、amgsspsastgtgp87ag、amgaspgtsstgsp88aqgepagsptstse89aqgtgepsstpase90aqgsgpstesapte91aqgsetpsgpseta92aqgpsetstsepga93aqgspseptegtsa94bcgsgaseptstep95bcgsepatsgteps96bcgtsepstsepga97bcgtstepsepgsa98bdgstagsetstea99bdgsetatsgseta100bdgtsesatsesga101bdgtsteasegsas102*表示单独基序序列,其在以各种排列一起使用时产生“家族序列”可以用作本公开文本的治疗性蛋白质中的异源部分的xten序列的例子披露于例如以下文献中:美国专利公开号2010/0239554a1、2010/0323956a1、2011/0046060a1、2011/0046061a1、2011/0077199a1或2011/0172146a1,或者国际专利公开号wo2010091122a1、wo2010144502a2、wo2010144508a1、wo2011028228a1、wo2011028229a1或wo2011028344a2,将每篇文献通过引用以其整体并入本文。xten可具有变化的长度以供插入或连接至治疗性蛋白质。在一个实施例中,所述一个或多个xten序列的长度是基于要在融合蛋白中实现的特性或功能来选择。根据预期的特性或功能,xten可以是可用作载剂的短或中等长度的序列或较长的序列。在某些实施例中,xten包括约6至约99个氨基酸残基的短区段、约100至约399个氨基酸残基的中等长度和约400至约1000以及多达约3000个氨基酸残基的较长长度。因此,插入或连接至治疗性蛋白质的xten可具有约6、约12、约36、约40、约42、约72、约96、约144、约288、约400、约500、约576、约600、约700、约800、约864、约900、约1000、约1500、约2000、约2500或多达约3000个氨基酸残基的长度。在其他实施例中,xten序列的长度为约6至约50、约50至约100、约100至150、约150至250、约250至400、约400至约500、约500至约900、约900至1500、约1500至2000或约2000至约3000个氨基酸残基。在对治疗性蛋白质的活性没有不利影响的情况下,插入或连接至治疗性蛋白质的xten的精确长度可以变化。在一个实施例中,本文所用的一个或多个xten具有42个氨基酸、72个氨基酸、144个氨基酸、288个氨基酸、576个氨基酸或864个氨基酸的长度,并且可选自一个或多个xten家族序列;即,ad、ae、af、ag、am、aq、bc或bd。在一些实施例中,治疗性蛋白质包含fviii多肽和xten,其中xten包含288个氨基酸。在一个实施例中,治疗性蛋白质包含fviii多肽和xten,其中xten包含288个氨基酸,并且xten插入fviii多肽的b结构域内。在一个特定实施例中,治疗性蛋白质包含fviii多肽和包含seqidno:109的xten,并且xten插入fviii多肽的b结构域内。在一个特定实施例中,治疗性蛋白质包含fviii多肽和包含seqidno:109的xten,并且xten紧邻成熟fviii的氨基酸745下游插入fviii多肽内。在一些实施例中,治疗性蛋白质包含fix多肽和xten,其中xten包含72个氨基酸。在一个实施例中,治疗性蛋白质包含fix多肽和xten,其中xten包含72个氨基酸,并且xten紧邻成熟fix的氨基酸166下游插入fix多肽内。在一些实施例中,用于本公开文本中的xten序列与选自以下的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同:ae42、ag42、ae48、am48、ae72、ag72、ae108、ag108、ae144、af144、ag144、ae180、ag180、ae216、ag216、ae252、ag252、ae288、ag288、ae324、ag324、ae360、ag360、ae396、ag396、ae432、ag432、ae468、ag468、ae504、ag504、af504、ae540、ag540、af540、ad576、ae576、af576、ag576、ae612、ag612、ae624、ae648、ag648、ag684、ae720、ag720、ae756、ag756、ae792、ag792、ae828、ag828、ad836、ae864、af864、ag864、am875、ae912、am923、am1318、bc864、bd864、ae948、ae1044、ae1140、ae1236、ae1332、ae1428、ae1524、ae1620、ae1716、ae1812、ae1908、ae2004a、ag948、ag1044、ag1140、ag1236、ag1332、ag1428、ag1524、ag1620、ag1716、ag1812、ag1908、ag2004及其任何组合。参见us2010-0239554a1。在一个特定实施例中,xten包含ae42、ae72、ae144、ae288、ae576、ae864、ag42、ag72、ag144、ag288、ag576、ag864或其任何组合。可用作本公开文本的治疗性蛋白质中的异源部分的示例性xten序列包括xtenae42-4(seqidno:46,由seqidno:47编码)、xtenae144-2a(seqidno:48,由seqidno:49编码)、xtenae144-3b(seqidno:50,由seqidno:51编码)、xtenae144-4a(seqidno:52,由seqidno:53编码)、xtenae144-5a(seqidno:54,由seqidno:55编码)、xtenae144-6b(seqidno:56,由seqidno:57编码)、xtenag144-1(seqidno:58,由seqidno:59编码)、xtenag144-a(seqidno:60,由seqidno:61编码)、xtenag144-b(seqidno:62,由seqidno:63编码)、xtenag144-c(seqidno:64,由seqidno:65编码)和xtenag144-f(seqidno:66,由seqidno:67编码)。在一个特定实施例中,xten由seqidno:18编码。在另一个实施例中,xten序列选自ae36(seqidno:130)、ae42(seqidno:131)、ae72(seqidno:132)、ae78(seqidno:133)、ae144(seqidno:134)、ae144_2a(seqidno:48)、ae144_3b(seqidno:50)、ae144_4a(seqidno:52)、ae144_5a(seqidno:54)、ae144_6b(seqidno:135)、ag144(seqidno:136)、ag144_a(seqidno:137)、ag144_b(seqidno:62)、ag144_c(seqidno:64)、ag144_f(seqidno:66)、ae288(seqidno:138)、ae288_2(seqidno:139)、ag288(seqidno:140)、ae576(seqidno:141)、ag576(seqidno:142)、ae864(seqidno:143)、ag864(seqidno:144)、xten_ae72_2a_1(seqidno:145)、xten_ae72_2a_2(seqidno:146)、xten_ae72_3b_1(seqidno:147)、xten_ae72_3b_2(seqidno:148)、xten_ae72_4a_2(seqidno:149)、xten_ae72_5a_2(seqidno:150)、xten_ae72_6b_1(seqidno:151)、xten_ae72_6b_2(seqidno:152)、xten_ae72_1a_1(seqidno:153)、xten_ae72_1a_2(seqidno:154)、xten_ae144_1a(seqidno:155)、ae150(seqidno:156)、ag150(seqidno:157)、ae294(seqidno:158)、ag294(seqidno:159)及其任何组合。在一个具体实施例中,xten序列选自下组:ae72、ae144和ae288。本发明的某些xten序列的氨基酸序列显示于表8中。表8.xten序列在一些实施例中,xten的小于100%的氨基酸选自甘氨酸(g)、丙氨酸(a)、丝氨酸(s)、苏氨酸(t)、谷氨酸(e)和脯氨酸(p),或者小于100%的序列由来自表7的序列基序或本文所提供的xten序列组成。在此类实施例中,xten的其余氨基酸残基选自其他14种天然l-氨基酸中的任一种,但是可优先地选自亲水氨基酸,使得xten序列含有至少约90%、91%、92%、93%、94%、95%、96%、97%、98%或至少约99%的亲水氨基酸。缀合构建体中所利用的xten中疏水氨基酸的含量可以小于5%、或小于2%、或小于1%疏水氨基酸含量。在xten构建中较不有利的疏水残基包括色氨酸、苯丙氨酸、酪氨酸、亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸。另外,xten序列可含有小于5%或小于4%或小于3%或小于2%或小于1%或无以下氨基酸:甲硫氨酸(例如,以避免氧化)、或天冬酰胺和谷氨酰胺(以避免脱酰胺)。所述一个或多个xten序列可以插入治疗性蛋白质的c末端或n末端处,或者插入治疗性蛋白质的氨基酸序列中的两个氨基酸之间。例如,如果治疗性蛋白质包含fviii多肽,则xten可以在选自表5的一个或多个插入位点插入两个氨基酸之间。如果治疗性蛋白质包含fix多肽,则xten可以在选自表5的一个或多个插入位点插入两个氨基酸之间。可以根据本发明使用的xten序列的其他例子披露于以下文献中:美国专利公开号2010/0239554a1、2010/0323956a1、2011/0046060a1、2011/0046061a1、2011/0077199a1或2011/0172146a1,或者国际专利公开号wo2010091122a1、wo2010144502a2、wo2010144508a1、wo2011028228a1、wo2011028229a1、wo2011028344a2、wo2014/011819a2或wo2015/023891。5.白蛋白或其片段、衍生物或变异体在一些实施例中,异源部分包含白蛋白或其功能片段。人血清白蛋白(hsa或ha)是其全长形式的609个氨基酸的蛋白质,负责血清渗透压的大部分,并且还用作内源和外源配位体的载剂。如本文所用的术语“白蛋白”包括全长白蛋白或其功能片段、变异体、衍生物或类似物。白蛋白或其片段或变异体的例子披露于以下文献中:美国专利公开号2008/0194481a1、2008/0004206a1、2008/0161243a1、2008/0261877a1或2008/0153751a1,或者pct申请公开号2008/033413a2、2009/058322a1或2007/021494a2,将上述文献通过引用以其整体并入本文。在一个实施例中,本公开文本的治疗性蛋白质包含进一步连接至第二异源部分的白蛋白、其片段或变异体,所述第二异源部分选自免疫球蛋白恒定区或其部分(例如,fc区)、pas序列、hes、peg及其任何组合。6.白蛋白结合部分在某些实施例中,异源部分是白蛋白结合部分,其包含白蛋白结合肽、细菌白蛋白结合结构域、白蛋白结合抗体片段或其任何组合。例如,白蛋白结合蛋白可以是细菌白蛋白结合蛋白、抗体或抗体片段,包括结构域抗体(参见美国专利号6,696,245)。例如,白蛋白结合蛋白可以是细菌白蛋白结合结构域,如一种链球菌蛋白g(konig,t.和skerra,a.(1998)j.immunol.methods218,73-83)。可以用作缀合配偶体的白蛋白结合肽的其他例子是例如具有cys-xaa1-xaa2-xaa3-xaa4-cys共有序列的那些白蛋白结合肽,其中xaa1是asp、asn、ser、thr或trp;xaa2是asn、gln、his、ile、leu或lys;xaa3是ala、asp、phe、trp或tyr;并且xaa4是asp、gly、leu、phe、ser或thr,如美国专利申请2003/0069395或dennis等(dennis等(2002)j.biol.chem.277,35035-35043)中所述。如kraulis等,febslett.378:190-194(1996)和linhult等,proteinsci.11:206-213(2002)所披露的来自链球菌蛋白g的结构域3是细菌白蛋白结合结构域的例子。白蛋白结合肽的例子包括具有核心序列diclprwgclw(seqidno:35)的一系列肽。参见例如,dennis等,j.biol.chem.2002,277:35035-35043(2002)。白蛋白结合抗体片段的例子披露于以下文献中:muller和kontermann,curr.opin.mol.ther.9:319-326(2007);roovers等,cancerimmunol.immunother.56:303-317(2007);和holt等,prot.eng.designsci.,21:283-288(2008),将上述文献通过引用以其整体并入本文。这种白蛋白结合部分的例子是如trussel等,bioconjugatechem.20:2286-2292(2009)所披露的2-(3-马来酰亚胺基丙酰胺基)-6-(4-(4-碘苯基)丁酰胺基)己酸酯(“albu”标签)。脂肪酸、特别是长链脂肪酸(lcfa)和长链脂肪酸样白蛋白结合化合物可以用于延长本公开文本的凝血因子蛋白的体内半衰期。lcfa样白蛋白结合化合物的例子是16-(l-(3-(9-(((2,5-二氧代吡咯烷-l-基氧基)羰氧基)-甲基)-7-磺基-9h-芴-2-基胺基)-3-氧代丙基)-2,5-二氧代吡咯烷-3-基硫基)十六烷酸(参见例如,wo2010/140148)。7.pas序列在其他实施例中,异源部分是pas序列。如本文所用的pas序列意指主要包含丙氨酸和丝氨酸残基或主要包含丙氨酸、丝氨酸和脯氨酸残基的氨基酸序列,所述氨基酸序列在生理条件下形成随机螺旋构象。因此,pas序列是包含丙氨酸、丝氨酸和脯氨酸、基本上由所述氨基酸组成或由所述氨基酸组成的结构单元、氨基酸聚合物或序列盒,其可以用作嵌合蛋白中异源部分的一部分。然而,熟习此项技术者知道,在添加除了丙氨酸、丝氨酸和脯氨酸以外的残基作为pas序列中的次要成分时,氨基酸聚合物还可以形成随机螺旋构象。如本文所用的术语“次要成分”意指,可以在pas序列中添加除了丙氨酸、丝氨酸和脯氨酸以外的氨基酸至某种程度,例如,高达约12%,即pas序列的100个氨基酸中的约12个;高达约10%,即pas序列的100个氨基酸中的约10个;高达约9%,即100个氨基酸中的约9个;高达约8%,即100个氨基酸中的约8个;约6%,即100个氨基酸中的约6个;约5%,即100个氨基酸中的约5个;约4%,即100个氨基酸中的约4个;约3%,即100个氨基酸中的约3个;约2%,即100个氨基酸中的约2个;约1%,即100个氨基酸中的约1个。与丙氨酸、丝氨酸和脯氨酸不同的氨基酸可以选自arg、asn、asp、cys、gln、glu、gly、his、ile、leu、lys、met、phe、thr、trp、tyr和val。在生理条件下,pas序列段形成随机螺旋构象,由此可以介导凝血因子蛋白的增加的体内和/或体外稳定性。由于随机螺旋结构域自身不具有稳定结构或功能,基本上保留了由凝血因子蛋白介导的生物学活性。在其他实施例中,尤其关于血浆中的蛋白质水解、免疫原性、等电点/静电行为、与细胞表面受体的结合或内化,形成随机螺旋结构域的pas序列具有生物惰性,但仍然是生物可降解的,这提供了优于如peg等合成聚合物的明显优势。形成随机螺旋构象的pas序列的非限制性例子包含选自以下的氨基酸序列:aspaapapaspaapapsapa(seqidno:36)、aapaspapaapsapapaaps(seqidno:37)、apsspspsapsspspaspss(seqidno:38)、apsspspsapsspspasps(seqidno:39)、sspsapspsspaspspsspa(seqidno:40)、aaspaapsappaaaspaapsappa(seqidno:41)、asaaapaaasaaasapsaaa(seqidno:42)及其任何组合。pas序列的其他例子是从例如以下文献得知:美国专利公开号2010/0292130a1和pct申请公开号wo2008/155134a1。8.hap序列在某些实施例中,异源部分是富含甘氨酸的同氨基酸聚合物(hap)。hap序列可以包含甘氨酸的重复序列,所述重复序列的长度为至少50个氨基酸、至少100个氨基酸、120个氨基酸、140个氨基酸、160个氨基酸、180个氨基酸、200个氨基酸、250个氨基酸、300个氨基酸、350个氨基酸、400个氨基酸、450个氨基酸或500个氨基酸。在一个实施例中,hap序列能够延长融合至或连接至hap序列的部分的半衰期。hap序列的非限制性例子包括但不限于(gly)n、(gly4ser)n或s(gly4ser)n,其中n是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在一个实施例中,n是20、21、22、23、24、25、26、26、28、29、30、31、32、33、34、35、36、37、38、39或40。在另一个实施例中,n是50、60、70、80、90、100、110、120、130、140、150、160、170、180、190或200。9.转铁蛋白或其片段在某些实施例中,异源部分是转铁蛋白或其片段。任何转铁蛋白都可用于制备本公开文本的凝血因子蛋白。作为例子,野生型人tf(tf)是679个氨基酸的蛋白质,大约75kda(不计糖基化),具有似乎源自基因重复的两个主要结构域n(约330个氨基酸)和c(约340个氨基酸)。参见genbank登录号nm001063、xm002793、m12530、xm039845、xm039847和s95936(www.ncbi.nlm.nih.gov/),将所有登录号通过引用以其整体并入本文。转铁蛋白包含两个结构域n结构域和c结构域。n结构域包含两个子结构域n1结构域和n2结构域,并且c结构域包含两个子结构域c1结构域和c2结构域。在一个实施例中,转铁蛋白异源部分包括转铁蛋白剪接变异体。在一个例子中,转铁蛋白剪接变异体可以是人转铁蛋白的剪接变异体,例如genbank登录号aaa61140。在另一个实施例中,嵌合蛋白的转铁蛋白部分包括转铁蛋白序列的一个或多个结构域,例如n结构域、c结构域、n1结构域、n2结构域、c1结构域、c2结构域或其任何组合。10.清除受体在某些实施例中,异源部分是清除受体、其片段、变异体或衍生物。lrp1是600kda膜内在蛋白,其参与受体介导的如因子x等多种蛋白质的清除。参见例如,narita等,blood91:555-560(1998)。11.血管性血友病因子或其片段在某些实施例中,异源部分是血管性血友病因子(vwf)或其一个或多个片段。vwf(也称为f8vwf)是存在于血浆中的大多聚糖蛋白,并且在内皮(在怀布尔-帕拉德体(weibel-paladebody)中)、巨核细胞(血小板的α颗粒)和内皮下结缔组织中组成性地产生。基本vwf单体是2813个氨基酸的蛋白质。每个单体含有多个具有特定功能的特定结构域,即d'和d3结构域(其一起结合至因子viii)、a1结构域(其结合至血小板gpib-受体、肝素和/或可能地胶原)、a3结构域(其结合至胶原)、c1结构域(其中rgd结构域在被激活时结合至血小板整联蛋白αiibβ3)和在蛋白质c末端的“半胱氨酸结”结构域(其是vwf与血小板衍生的生长因子(pdgf)、转化生长因子-β(tgfβ)和β-人绒毛膜促性腺激素(βhcg)共享的)。人vwf的2813单体氨基酸序列是作为genbank中的登录号np000543.2来报道。编码人vwf的核苷酸序列是作为genbank中的登录号nm000552.3来报道。seqidno:129是由seqidno:128编码的氨基酸序列。d’结构域包括seqidno:129的氨基酸764至866。d3结构域包括seqidno:44的氨基酸867至1240。在血浆中,95%-98%的fviii以与全长vwf的紧密非共价复合物来循环。这种复合物的形成对于在体内维持适当的fviiii血浆水平是重要的。lenting等,blood.92(11):3983-96(1998);lenting等,j.thromb.haemost.5(7):1353-60(2007)。在fviii由于在重链中的位置372和740以及轻链中的位置1689的蛋白质水解而被激活时,从激活的fviii去除结合至fviii的vwf。在某些实施例中,异源部分是全长血管性血友病因子。在其他实施例中,异源部分是血管性血友病因子片段。如本文所用,本文所用的术语“vwf片段(vwffragment)”或“vwf片段(vwffragments)”意指任何vwf片段,其与fviii相互作用并保留至少一种或多种通常由全长vwf提供给fviii的特性,所述特性是例如防止过早激活为fviiia、防止过早蛋白质水解、防止可导致过早清除的与磷脂膜的缔合、防止与可以结合裸fviii而不是vwf结合fviii的fviii清除受体结合和/或稳定fviii重链和轻链相互作用。在一个具体实施例中,异源部分是包含vwf的d’结构域和d3结构域的(vwf)片段。包含d’结构域和d3结构域的vwf片段还可以包含选自以下的vwf结构域:a1结构域、a2结构域、a3结构域、d1结构域、d2结构域、d4结构域、b1结构域、b2结构域、b3结构域、c1结构域、c2结构域、ck结构域、其一个或多个片段及其任何组合。融合至vwf片段的具有fviii活性的多肽的其他例子披露于以下文献中:2012年7月3日提交的美国临时专利申请号61/667,901和美国公开号2015/0023959a1,将这两篇文献都通过引用以其整体并入本文。12.接头部分在某些实施例中,异源部分是肽接头。如本文所用,术语“肽接头”或“接头部分”是指连接多肽链的线性氨基酸序列中的两个结构域的肽或多肽序列(例如,合成肽或多肽序列)。在一些实施例中,肽接头可插入本公开文本的治疗性蛋白质与上述异源部分(如白蛋白)之间。肽接头可向嵌合多肽分子提供柔性。接头通常不被切割,但是可能需要这种切割。在一个实施例中,在加工期间不去除这些接头。可存在于本公开文本的嵌合蛋白中的一种类型的接头是蛋白酶可切割的接头,其包含切割位点(即,蛋白酶切割位点底物,例如因子xia、xa或凝血酶切割位点)并可在切割位点的n末端或c末端或两侧上包括其他接头。这些可切割接头在并入本公开文本的构建体中时产生具有异源切割位点的嵌合分子。在一个实施例中,由本公开文本的核酸分子编码的治疗性蛋白质包含两个或更多个fc结构域或部分,其通过cscfc接头连接以形成包含于单条多肽链中的fc区。cscfc接头侧接有至少一个细胞内加工位点,即由细胞内酶切割的位点。多肽在所述至少一个细胞内加工位点的切割产生包含至少两条多肽链的多肽。其他肽接头可以任选地用于本公开文本的构建体中,例如以将凝血因子蛋白连接至fc区。可以结合本公开文本使用的一些示例性接头包括例如更详细地描述于下文中的包含glyser氨基酸的多肽。在一个实施例中,肽接头是合成的,即非天然存在的。在一个实施例中,肽接头包括包含如下氨基酸序列的肽(或多肽)(其可以是或可以不是天然存在的),所述氨基酸序列将第一线性氨基酸序列与在自然界中并非与其天然地连接或遗传融合的第二线性氨基酸序列连接或遗传融合。例如,在一个实施例中,肽接头可以包含非天然存在的多肽,其是天然存在的多肽的修饰形式(例如,包含突变,如添加、取代或缺失)。在另一个实施例中,肽接头可以包含非天然存在的氨基酸。在另一个实施例中,肽接头可以包含存在于在自然界中不存在的线性序列中的天然存在的氨基酸。在仍另一个实施例中,肽接头可以包含天然存在的多肽序列。例如,在某些实施例中,肽接头可以用于融合相同的fc部分,由此形成同二聚scfc区。在其他实施例中,肽接头可以用于融合不同的fc部分(例如野生型fc部分和fc部分变异体),由此形成异二聚scfc区。在另一个实施例中,肽接头包含gly-ser接头或由所述gly-ser接头组成。在一个实施例中,scfc或cscfc接头包含免疫球蛋白铰链的至少一部分和gly-ser接头。如本文所用,术语“gly-ser接头”是指由甘氨酸和丝氨酸残基组成的肽。在某些实施例中,所述gly-ser接头可以插入肽接头的两个其他序列之间。在其他实施例中,gly-ser接头连接于肽接头的另一序列的一个或两个末端。在又其他实施例中,两个或更多个gly-ser接头串联并入肽接头中。在一个实施例中,本公开文本的肽接头包含上铰链区的至少一部分(例如,衍生自igg1、igg2、igg3或igg4分子)、中铰链区的至少一部分(例如,衍生自igg1、igg2、igg3或igg4分子)和一系列gly/ser氨基酸残基。本公开文本的肽接头的长度为至少一个氨基酸并且可以具有变化的长度。在一个实施例中,本公开文本的肽接头的长度为约1至约50个氨基酸。如在此上下文中所用,术语“约”指示+/-两个氨基酸残基。由于接头长度必须是正整数,长度为约1至约50个氨基酸的长度意指长度为1-3至48-52个氨基酸的长度。在另一个实施例中,本公开文本的肽接头的长度为约10至约20个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约50个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约20至约45个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约15至约35或约20至约30个氨基酸。在另一个实施例中,本公开文本的肽接头的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、500、1000或2000个氨基酸。在一个实施例中,本公开文本的肽接头的长度为20或30个氨基酸。在一些实施例中,肽接头可以包含至少2、至少3、至少4、至少5、至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90或至少100个氨基酸。在其他实施例中,肽接头可以包含至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1,000个氨基酸。在一些实施例中,肽接头可以包含至少约10、20、30、40、50、60、70、80、90、100、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个氨基酸。肽接头可以包含1-5个氨基酸、1-10个氨基酸、1-20个氨基酸、10-50个氨基酸、50-100个氨基酸、100-200个氨基酸、200-300个氨基酸、300-400个氨基酸、400-500个氨基酸、500-600个氨基酸、600-700个氨基酸、700-800个氨基酸、800-900个氨基酸或900-1000个氨基酸。可使用本领域已知的技术将肽接头引入多肽序列中。可通过dna序列分析来确认修饰。可使用质粒dna转化宿主细胞用于稳定产生所产生的多肽。13.单体-二聚体杂合物在一些实施例中,本公开文本的治疗性蛋白质包含含有凝血因子的单体-二聚体杂合物分子。本文所用的术语“单体-二聚体杂合物”是指包含通过二硫键相互缔合的第一多肽链和第二多肽链的嵌合蛋白,其中第一链包含凝血因子(例如,fviii)和第一fc区,并且第二链包含无凝血因子的第二fc区,基本上由所述第二fc区组成或由所述第二fc区组成。因此,单体-二聚体杂合构建体是包含仅具有一种凝血因子的单体方面和具有两个fc区的二聚体方面的杂合物。14.表达控制序列在一些实施例中,本公开文本的核酸分子还包含至少一个表达控制序列。如本文所用的表达控制序列是有助于与其可操作地连接的编码核酸的有效转录和翻译的任何调控核苷酸序列,如启动子序列或启动子-增强子组合。例如,本公开文本的核酸分子可以可操作地连接至至少一个转录控制序列。基因表达控制序列可以是例如哺乳动物或病毒启动子,如组成型或诱导型启动子。组成型哺乳动物启动子包括但不限于以下基因的启动子:次黄嘌呤磷酸核糖基转移酶(hprt)、腺苷脱胺酶、丙酮酸激酶、β-肌动蛋白启动子和其他组成型启动子。在真核细胞中组成性地发挥作用的示例性病毒启动子包括例如来自以下病毒的启动子:巨细胞病毒(cmv)、猿猴病毒(例如,sv40)、乳头状瘤病毒、腺病毒、人免疫缺陷病毒(hiv)、劳斯肉瘤病毒、巨细胞病毒、莫罗尼白血病病毒的长末端重复(ltr)和其他逆转录病毒、以及单纯疱疹病毒的胸苷激酶启动子。其他组成型启动子是本领域的技术人员已知的。可用作本公开文本的基因表达序列的启动子还包括诱导型启动子。诱导型启动子是在诱导剂存在下表达。例如,在某些金属离子存在下诱导金属硫蛋白启动子以促进转录和翻译。其他诱导型启动子是本领域的技术人员已知的。在一个实施例中,本公开文本包括转基因在组织特异性启动子和/或增强子控制下的表达。在另一个实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在肝细胞、窦状细胞和/或内皮细胞中的表达。在一个特定实施例中,启动子或其他表达控制序列选择性地增强转基因在内皮细胞中的表达。在某些实施例中,启动子或其他表达控制序列选择性地增强转基因在以下中的表达:肌肉细胞、中枢神经系统、眼睛、肝脏、心脏或其任何组合。肝脏特异性启动子的例子包括但不限于小鼠甲状腺素启动子(mttr)、内源人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子和小鼠白蛋白启动子。在一个特定实施例中,启动子包含mttr启动子。mttr启动子描述于r.h.costa等,1986,mol.cell.biol.6:4697中。f8启动子描述于figueiredo和brownlee,1995,j.biol.chem.270:11828-11838中。在一些实施例中,启动子选自肝脏特异性启动子(例如,α1-抗胰蛋白酶(aat))、肌肉特异性启动子(例如,肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)和结蛋白(des))、合成启动子(例如,spc5-12、2r5sc5-12、dmck和tmck)及其任何组合。在一个实施例中,启动子选自小鼠甲状腺素启动子(mttr)、内源人因子viii启动子(f8)、人α-1-抗胰蛋白酶启动子(haat)、人白蛋白最小启动子、小鼠白蛋白启动子、ttpp、casi启动子、cag启动子、巨细胞病毒(cmv)启动子、α1-抗胰蛋白酶(aat)、肌肉肌酸激酶(mck)、肌球蛋白重链α(αmhc)、肌红蛋白(mb)、结蛋白(des)、spc5-12、2r5sc5-12、dmck和tmck、磷酸甘油酸激酶(pgk)启动子及其任何组合。可以使用一种或多种增强子进一步增强表达水平以实现治疗功效。一种或多种增强子可以单独提供,或与一种或多种启动子组件一起提供。通常,表达控制序列包含多个增强子组件和组织特异性启动子。在一个实施例中,增强子包含一个或多个拷贝的α-1-微球蛋白/比库宁蛋白(bikunin)增强子(rouet等,1992,j.biol.chem.267:20765-20773;rouet等,1995,nucleicacidsres.23:395-404;rouet等,1998,biochem.j.334:577-584;ill等,1997,bloodcoagulationfibrinolysis8:s23-s30)。在另一个实施例中,增强子衍生自肝脏特异性转录因子结合位点,如ebp、dbp、hnf1、hnf3、hnf4、hnf6和enh1,包含hnf1、(有义)-hnf3、(有义)-hnf4、(反义)-hnf1、(反义)-hnf6、(有义)-ebp、(反义)-hnf4(反义)。在一个特定例子中,可用于本公开文本的启动子包含seqidno:69(即,et启动子),其还作为genbank编号ay661265而已知。还参见vigna等,moleculartherapy11(5):763(2005)。其他适宜载体和基因调控组件的例子描述于以下文献中:wo02/092134、ep1395293或美国专利号6,808,905、7,745,179或7,179,903,将上述文献通过引用以其整体并入本文。在一个实施例中,本公开文本的核酸分子还包含内含子序列。在一些实施例中,内含子序列定位于编码fviii多肽的核酸序列的5'。在一些实施例中,内含子序列是天然存在的内含子序列。在一些实施例中,内含子序列是合成序列。在一些实施例中,内含子序列衍生自天然存在的内含子序列。在某些实施例中,内含子序列包含sv40小t内含子。在一个实施例中,内含子序列包含seqidno:115。在一些实施例中,核酸分子还包含转录后调控元件。在某些实施例中,转录后调控元件包含突变的土拨鼠肝炎病毒转录后调控元件(wpre)。在一个特定实施例中,转录后调控元件包含seqidno:120。在一些实施例中,核酸分子包含微小rna(mirna)结合位点。在一个实施例中,mirna结合位点是mir-142-3p的mirna结合位点。在其他实施例中,mirna结合位点选自rennie等,rnabiol.13(6):554-560(2016)所披露的mirna结合位点以及可在http://sfold.wadsworth.org/starmirdb.php获得的starmirdb,将上述文献通过引用以其整体并入本文。在一些实施例中,核酸分子包含一个或多个dna核靶向序列(dts)。dts促进含有此类序列的dna分子易位至核中。在某些实施例中,dts包含sv40增强子序列。在某些实施例中,dts包含c-myc增强子序列。在一些实施例中,dts介于第一itr与第二itr之间。在一些实施例中,dts在第一itr的3'和治疗性蛋白质的5'。在其他实施例中,dts在治疗性蛋白质的3'和第二itr的5'。在一些实施例中,核酸分子还包含3'utr多聚(a)尾序列。在一个实施例中,3'utr多聚(a)尾序列包含bgh多聚(a)。在一个实施例中,3'utr多聚(a)尾包含肌动蛋白多聚(a)位点。在一个实施例中,3'utr多聚(a)尾包含血红蛋白多聚(a)位点。在一个特定实施例中,3'utr多聚(a)尾序列包含seqidno:122。iii.组织特异性表达在某些实施例中,有用的是在载体内包括一个或多个mirna靶序列,其例如与凝血因子转基因可操作地连接。因此,本公开文本还提供了至少一个与凝血因子核苷酸序列可操作地连接或以其他方式插入载体内的mirna序列靶标。载体中包括的多于一个拷贝的mirna靶序列可以增加系统的有效性。还包括不同mirna靶序列。例如,表达多于一种转基因的载体可以具有在多于一个可以相同或不同的mirna靶序列控制下的转基因。mirna靶序列可以是串联的,但是也包括其他排列。含有mirna靶序列的转基因表达盒也能以反义定向插入载体内。反义定向可用于产生病毒颗粒,以避免原本可能对产生细胞有毒的基因产物的表达。在其他实施例中,载体包含1、2、3、4、5、6、7或8个拷贝的相同或不同的mirna靶序列。然而,在某些其他实施例中,载体将不包括任何mirna靶序列。是否要包括mirna靶序列(以及数量)的选择将通过如预期的组织靶标、所需的表达水平等已知参数来指导。在一个实施例中,靶序列是mir-223靶标,已经报道其可在骨髓定向祖细胞中以及至少部分地在更原始的hspc中最有效地阻断表达。mir-223靶标可以在分化的髓样细胞(包括粒细胞、单核细胞、巨噬细胞、髓样树突细胞)中阻断表达。mir-223靶标还可以适于依赖于淋巴或红细胞谱系中的稳健转基因表达的基因疗法应用。mir-223靶标还可在人hsc中非常有效地阻断表达。在另一个实施例中,靶序列是mir142靶标(tccataaagtaggaaacactaca(seqidno:43))。在一个实施例中,载体包含4个拷贝的mir-142靶序列。在某些实施例中,将造血特异性微小rna(如mir-142(142t))的互补序列并入载体(例如,慢病毒载体(lv))的3'非翻译区中,使得编码转基因的转录物易发生mirna介导的下调。通过这种方法,可以在造血谱系抗原呈递细胞(apc)中防止转基因表达,同时在非造血细胞中维持所述转基因表达(brown等,natmed2006)。这种策略可以对转基因表达施加严格的转录后控制,并且由此使得能够稳定递送和长期表达转基因。在一些实施例中,mir-142调控防止经转导细胞的免疫介导的清除和/或诱导抗原特异性调控t细胞(treg),并且介导对转基因编码抗原的稳固的免疫耐受。在一些实施例中,靶序列是mir181靶标。chenc-z和lodishh,seminarsinimmunology(2005)17(2):155-165披露了mir-181,它是在小鼠骨髓内的b细胞中特异性表达的mirna(chen和lodish,2005)。所述文献还披露,一些人mirna与白血病相关。靶序列可以与mirna完全或部分互补。术语“完全互补”意指,靶序列的核酸序列与识别所述靶序列的mirna的序列100%互补。术语“部分互补”意指,靶序列与识别所述靶序列的mirna的序列仅部分互补,借此部分互补的序列仍然被mirna识别。换句话说,在本公开文本的上下文中,部分互补的靶序列有效识别相应mirna,并且实现在表达所述mirna的细胞中防止或减少转基因表达。mirna靶序列的例子描述于以下文献中:wo2007/000668、wo2004/094642、wo2010/055413或wo2010/125471,将上述文献通过引用以其整体并入本文。在一些实施例中,转基因表达靶向肝脏。在某些实施例中,转基因表达靶向肝细胞。在其他实施例中,转基因表达靶向内皮细胞。在一个特定实施例中,转基因表达靶向天然表达内源fviii的任何组织。在一些实施例中,转基因表达靶向中枢神经系统。在某些实施例中,转基因表达靶向神经元。在一些实施例中,转基因表达靶向传入神经元。在一些实施例中,转基因表达靶向传出神经元。在一些实施例中,转基因表达靶向中间神经元。在一些实施例中,转基因表达靶向神经胶质细胞。在一些实施例中,转基因表达靶向星形胶质细胞。在一些实施例中,转基因表达靶向少突胶质细胞。在一些实施例中,转基因表达靶向小神经胶质细胞。在一些实施例中,转基因表达靶向室管膜细胞。在一些实施例中,转基因表达靶向许旺细胞。在一些实施例中,转基因表达靶向卫星细胞。在一些实施例中,转基因表达靶向肌肉组织。在一些实施例中,转基因表达靶向平滑肌。在一些实施例中,转基因表达靶向心肌。在一些实施例中,转基因表达靶向骨骼肌。在一些实施例中,转基因表达靶向眼睛。在一些实施例中,转基因表达靶向感光细胞。在一些实施例中,转基因表达靶向视网膜神经节细胞。iv.宿主细胞本公开文本还提供了包含本公开文本的核酸分子或载体的宿主细胞。如本文所用,术语“转化”应在广义上使用,是指将dna引入受体宿主细胞中,这改变了基因型并因此导致受体细胞的变化。“宿主细胞”是指已经用使用重组dna技术构建并且编码至少一种异源基因的载体转化的细胞。本公开文本的宿主细胞较佳地具有哺乳动物来源;最佳地具有人或小鼠来源。相信本领域的技术人员有能力优先地确定最适合于其目的的特定宿主细胞系。示例性宿主细胞系包括但不限于cho、dg44和duxb11(中国仓鼠卵巢系,dhfr-)、hela(人宫颈癌)、cvi(猴肾系)、cos(具有sv40t抗原的cvi的衍生物)、r1610(中国仓鼠成纤维细胞)、balbc/3t3(小鼠成纤维细胞)、hak(仓鼠肾系)、sp2/o(小鼠骨髓瘤)、p3x63-ag3.653(小鼠骨髓瘤)、bfa-1c1bpt(牛内皮细胞)、raji(人淋巴细胞)、ns0、cap、bhk21和hek293(人肾)。在一个特定实施例中,宿主细胞选自:cho细胞、hek293细胞、bhk21细胞、细胞、ns0细胞、cap细胞及其任何组合。在一些实施例中,本公开文本的宿主细胞具有昆虫来源。在一个特定实施例中,宿主细胞是sf9细胞。宿主细胞系通常可以从商业服务、美国组织培养物保藏中心(americantissueculturecollection)或从公开文献获得。将本公开文本的核酸分子或载体引入宿主细胞中可以通过本领域的技术人员熟知的多种技术来完成。这些技术包括但不限于转染(包括电泳和电穿孔)、原生质粒融合、磷酸钙沈淀、与包膜dna的细胞融合、显微注射和完整病毒感染。参见ridgway,a.a.g.“mammalianexpressionvectors”第24.2章,第470-472页vectors,rodriguez和denhardt编(butterworths,boston,mass.1988)。最佳地,通过电穿孔将质粒引入宿主中。使转化的细胞在适于产生轻链和重链的条件下生长,并测定重链和/或轻链蛋白质合成。示例性测定技术包括酶联免疫吸附测定(elisa)、放射免疫测定(ria)、或荧光激活细胞分选仪分析(facs)、免疫组织化学等。使包含本公开文本的分离的核酸分子或载体的宿主细胞在适当生长培养基中生长。如本文所用,术语“适当生长培养基”意指含有细胞生长所需营养素的培养基。细胞生长所需的营养素可以包括碳源、氮源、必需氨基酸、维生素、矿物质和生长因子。任选地,培养基可含有一种或多种选择因子。任选地,培养基可含有小牛血清或胎牛血清(fcs)。在一个实施例中,培养基基本上不含igg。生长培养基通常将例如通过药物选择或必需营养素的缺乏来选择含有dna构建体的细胞,所述营养素通过dna构建体上或与dna构建体共转染的可选标记来补充。所培养的哺乳动物细胞通常在市售的含血清或无血清培养基(例如,mem、dmem、dmem/f12)中生长。在一个实施例中,培养基是cdopticho(invitrogen,加利福尼亚州卡尔斯巴德)。在另一个实施例中,培养基是cd17(invitrogen,加利福尼亚州卡尔斯巴德)。适合于所用特定细胞系的培养基的选择在本领域的技术人员的水平内。v.多肽的制备本公开文本还提供了由本公开文本的核酸分子编码的多肽。在其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的载体编码。在又其他实施例中,本公开文本的多肽由包含本公开文本的核酸分子的宿主细胞产生。在其他实施例中,本公开文本还提供了产生具有凝血因子(例如,fviii)活性的多肽的方法,其包括在产生具有凝血因子(例如,fviii)活性的多肽的条件下培养本公开文本的宿主细胞,以及回收具有凝血因子(例如,fviii)活性的多肽。在一些实施例中,具有凝血因子(例如,fviii)活性的多肽的表达相对于在相同条件下培养但包含参考核苷酸序列(例如,seqidno:16,亲代fviii基因序列)的宿主细胞有所增加。在其他实施例中,本公开文本提供了增加具有凝血因子(例如,fviii)活性的多肽的表达的方法,其包括在由核酸分子表达具有凝血因子(例如,fviii)活性的多肽的条件下培养本公开文本的宿主细胞,其中具有凝血因子(例如,fviii)活性的多肽的表达相对于在相同条件下培养但包含参考核酸分子(例如,seqidno:16,亲代fviii基因序列)的宿主细胞有所增加。在其他实施例中,本公开文本提供了改良具有凝血因子(例如,fviii)活性的多肽的产量的方法,其包括在通过本文所公开的核酸分子产生具有凝血因子(例如,fviii)活性的多肽的条件下培养宿主细胞,其中具有凝血因子(例如,fviii)活性的多肽的产量相对于在相同条件下培养但包含参考核酸序列(例如,seqidno:16,亲代fviii基因序列)的宿主细胞有所提高。本公开文本的治疗性蛋白质(例如,凝血因子)可以在转基因动物(如啮齿类动物、山羊、绵羊、猪或牛)体内合成。术语“转基因动物”是指已经将外来基因并入基因组中的非人动物。因为这个基因是在种系组织中存在,其从亲代传递给后代。将外源基因引入单细胞胚胎中(brinster等1985,proc.natl.acad.sci.usa82:4438)。产生转基因动物的方法是本领域已知的,包括产生免疫球蛋白分子的转基因学(wagner等1981,proc.natl.acad.sci.usa78:6376;mcknight等1983,cell34:335;brinster等1983,nature306:332;ritchie等1984,nature312:517;baldassarre等2003,theriogenology59:831;robl等2003,theriogenology59:107;malassagne等2003,xenotransplantation10(3):267)。vii.药物组合物含有本公开文本的核酸分子、核酸分子编码的多肽、载体或宿主细胞的组合物可含有适宜的医药上可接受的载剂。例如,所述组合物可含有有助于将活性化合物加工成设计用于递送至作用位点的制剂的赋形剂和/或助剂。在一个实施例中,本公开文本涉及药物组合物,其包含(a)本文所公开的核酸分子、载体、多肽或宿主细胞;和(b)医药上可接受的赋形剂。在一些实施例中,药物组合物还包含递送剂。在某些实施例中,递送剂包含脂质纳米颗粒(lnp)。在其他实施例中,药物组合物还包含脂质体、其他聚合分子和外来体。如本文所用,“脂质纳米颗粒”是指包含多个通过分子间力相互物理缔合的脂质分子的纳米颗粒。脂质纳米颗粒可以是例如微球体(包括单层和多层囊泡,例如脂质体)、乳液中的分散相、胶束或悬浮液中的内相。在一些实施例中,本公开文本提供了包封的核酸分子组合物,其可以包括包封本发明的核酸分子的脂质纳米颗粒宿主。脂质纳米颗粒可以包含一种或多种脂质(例如,阳离子脂质、非阳离子脂质和peg修饰的脂质)。在某些实施例中,本公开文本的脂质纳米颗粒配制为将本发明的一种或多种核酸分子递送至一种或多种靶细胞。适宜脂质的例子包括但不限于磷脂酰基化合物(例如,磷脂酰基乙醇胺、鞘脂、磷脂酰基胆碱、磷脂酰基丝氨酸、磷脂酰基甘油、神经节苷脂和脑苷脂)。“阳离子脂质”是指在某一ph(例如,生理ph)下携带净正电荷的任何脂质种类。在某些实施例中,本公开文本的脂质纳米颗粒具有某一n/p比率。如本文所用,“n/p比率”或“np比率”是指可带正电的聚合物胺基与带负电的核酸磷酸基的比率。脂质纳米颗粒/核酸分子复合物的n/p特征可以影响如表面净电荷、稳定性和大小等特性。如本文所述的脂质纳米颗粒的np比率可以是约1、约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100和其间的任何比率。例如,如本文所述的脂质纳米颗粒的np比率可以是约18、约36或约72。因此,在某些实施例中,药物组合物包含包封于脂质纳米颗粒中的本公开文本的核酸分子以及医药上可接受的赋形剂。药物组合物可经配制用于通过推注注射肠胃外施用(即静脉内、皮下或肌内)。注射用配制物能以单位剂型存在,例如在添加有防腐剂的安瓿中或多剂量容器中。组合物可采取如于油性或水性媒剂中的悬浮液、溶液或乳液等形式,并且含有如悬浮剂、稳定剂和/或分散剂等配制剂。可替代地,活性成分可呈粉末形式,用于用适宜媒剂(例如,无热原水)来构造。适于肠胃外施用的配制物还包括呈水溶性形式(例如,水溶性盐)的活性化合物的水溶液。另外,可以施用作为适当油性注射悬浮液的活性化合物的悬浮液。适宜亲脂溶剂或媒剂包括脂肪油(例如,芝麻油)或合成脂肪酸酯(例如,油酸乙酯或甘油三酯)。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和葡聚糖。任选地,悬浮液还可以含有稳定剂。脂质体还可以用于包封本公开文本的分子,用于递送至细胞或间质空间中。示例性医药上可接受的载剂是生理上相容的溶剂、分散介体、包衣、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、水、盐水、磷酸盐缓冲盐水、右旋糖、甘油、乙醇等。在一些实施例中,组合物包含等渗剂,例如糖、多元醇(如甘露醇、山梨醇)或氯化钠。在其他实施例中,组合物包含增强活性成分的贮存期限或有效性的医药上可接受的物质(如润湿剂)或少量辅助物质(如润湿剂或乳化剂、防腐剂或缓冲剂)。本公开文本的组合物可以呈多种形式,包括例如液体(例如,可注射和可输注的溶液)、分散液、悬浮液、半固体和固体剂型。较佳形式取决于施用方式和治疗应用。组合物可以配制为溶液、微乳液、分散液、脂质体或其他适于高药物浓度的有序结构。无菌可注射溶液可以通过以下方式制备:将活性成分以所需量并入视需要具有上文所列举成分中的一种或组合的适当溶剂中,之后过滤灭菌。通常,分散液是通过以下方式来制备:将活性成分并入无菌媒剂中,所述媒剂含有基础分散介体和来自上文所列举的那些成分的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,较佳制备方法是真空干燥和冷冻干燥,其从预先无菌过滤的溶液产生活性成分加上任何其他所需成分的粉末。可以例如通过以下方式维持溶液的适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。可注射组合物的延长吸收可以通过以下方式来实现:在组合物中包括延迟吸收的试剂,例如单硬脂酸盐和明胶。活性成分可以用受控释放配制物或装置来配制。此类配制物和装置的例子包括植入物、经皮贴剂和微包封递送系统。可以使用生物可降解的生物兼容性聚合物,例如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。制备此类配制物和装置的方法是本领域已知的。参见例如,sustainedandcontrolledreleasedrugdeliverysystems,j.r.robinson编,marceldekker,inc.,newyork,1978。可注射长效配制物可以通过以下方式来制备:形成药物于生物可降解聚合物(如聚丙交酯-聚乙交酯)中的微包封基质。根据药物与聚合物的比率以及所采用聚合物的性质,可以控制药物释放速率。其他示例性生物可降解聚合物是聚原酸酯和聚酐。可注射长效配制物还可以通过将药物捕集于脂质体或微乳液中来制备。可以将补充性活性化合物并入组合物中。在一个实施例中,用凝血因子或其变异体、片段、类似物或衍生物配制本公开文本的核酸分子。例如,凝血因子包括但不限于因子v、因子vii、因子viii、因子ix、因子x、因子xi、因子xii、因子xiii、凝血酶原、纤维蛋白原、血管性血友病因子或重组可溶性组织因子(rstf)或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。可以调节剂量方案以提供最佳所需反应。例如,可以施用单次推注,可以随时间施用若干次分开剂量,或者可以如治疗情况的紧迫性所示的成比例地减少或增加剂量。有利的是以剂量单位形式配制肠胃外组合物,以便于施用和剂量均匀。参见例如,remington'spharmaceuticalsciences(mackpub.co.,easton,pa.1980)。除了活性化合物以外,液体剂型还可以含有惰性成分,如水、乙醇、碳酸乙酯、乙酸乙酯、苯甲醇、苯甲酸苄酯、丙二醇、1,3-丁二醇、二甲基甲酰胺、油、甘油、四氢糠醇、聚乙二醇和山梨聚糖的脂肪酸酯。适宜药物载剂的非限制性例子也描述于e.w.martin的remington'spharmaceuticalsciences中。赋形剂的一些例子包括淀粉、葡萄糖、乳糖、蔗糖、明胶、麦芽、水稻、面粉、白垩、硅胶、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂乳粉、甘油、丙烯、二醇、水、乙醇等。组合物还可以含有ph缓冲试剂以及润湿剂或乳化剂。对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。对于经颊施用,组合物可以采取根据常规方案的片剂或锭剂的形式。对于通过吸入施用,根据本公开文本使用的化合物便捷地以含有或不含赋形剂的雾化气溶胶的形式或以气溶胶喷雾剂的形式从任选地具有推进剂的加压包或雾化器递送,所述推进剂是例如二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可以配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。在一些实施例中,组合物是通过选自以下的途径来施用:局部施用、眼内施用、肠胃外施用、鞘内施用、硬膜下施用和口服施用。肠胃外施用可以是静脉内或皮下施用。viii.治疗方法在一些方面中,本公开文本涉及治疗有需要的受试者的疾病或病症的方法,其包括施用本文所公开的核酸分子、载体、多肽或药物组合物。在一些实施例中,核酸分子包含第一itr、第二itr和基因盒,其中基因盒编码靶序列,其中靶序列编码治疗性蛋白质,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症影响选自以下的器官:肌肉、中枢神经系统(cns)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道及其任何组合。在一些实施例中,受试者患有选自以下的疾病或病症:dmd(杜氏肌营养不良)、xlmtm(x连锁肌小管性肌病)、帕金森病、sma(脊髓性肌萎缩)、弗里德赖希共济失调、gucy2d-lca(利伯先天性黑矇)、xlrs(x连锁视网膜劈裂症)、amd(年龄相关性黄斑变性)、achm(全色盲)、rpf65介导的ird及其任何组合。在一些实施例中,核酸分子包含第一itr、第二itr和基因盒,其中基因盒编码靶序列,其中靶序列编码mirna,并且其中核酸分子用于治疗有需要的受试者的疾病或病症。在一些实施例中,疾病或病症包含肌萎缩侧索硬化(als)、亨廷顿病和/或常染色体显性色素性视网膜炎。在一些实施例中,核酸分子包含第一itr、第二itr和基因盒,其中基因盒编码靶序列,其中靶序列编码凝血因子,并且其中核酸分子用于治疗有需要的受试者的出血疾病或病症。出血疾病或病症选自出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤(traumacapitis)、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血、髂腰肌鞘出血及其任何组合。在仍其他实施例中,安排受试者进行手术。在又其他实施例中,治疗是预防性的或按需的。本公开文本提供了治疗出血病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,出血病症的特征在于缺乏凝血因子(例如,fviii)。在一些实施例中,出血病症是血友病。在一些实施例中,出血病症是血友病a。在治疗出血病症的方法的一些实施例中,在施用于后24小时,凝血因子(例如,fviii)的血浆活性相对于施用参考核酸分子(例如,seqidno:16,亲代fviii基因序列)、包含参考核酸分子的载体或参考核酸分子编码的多肽的受试者有所增加。本公开文本还涉及治疗、改善或预防受试者的止血病症的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子或由本公开文本的核酸分子编码的具有凝血因子(例如,fviii)活性的多肽。通过分离的核酸分子或所编码多肽进行的治疗、改善和预防可以是绕路疗法。接受绕路疗法的受试者可能已经产生针对凝血因子(例如,fviii)的抑制剂,或者正在产生凝血因子抑制剂。本公开文本的核酸分子、载体或多肽通过促进纤维蛋白凝块的形成治疗或预防止血病症。由本公开文本的核酸分子编码的具有凝血因子(例如,fviii)活性的多肽可以激活凝结级联的成员。凝血因子可以是外在路径、固有路径或二者的参与者。本公开文本的核酸分子、载体或多肽可用于治疗已知可用凝血因子治疗的止血病症。可使用本公开文本的方法治疗的止血病症包括但不限于血友病a、血友病b、血管性血友病、因子xi缺乏(pta缺乏)、因子xii缺乏、以及纤维蛋白原、凝血酶原、因子v、因子vii、因子x或因子xiii的缺乏或结构异常、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一些实施例中,止血病症是遗传性病症。在一个实施例中,受试者患有血友病a。在其他实施例中,止血病症是缺乏凝血因子的结果。在其他实施例中,止血病症是缺乏fviii的结果。在其他实施例中,止血病症可能是缺陷性fviii凝血因子的结果。在另一个实施例中,止血病症可以是获得性病症。获得性病症可能源自潜在的继发性疾病或病症。无关病症可以是(作为例子但不限制)癌症、自身免疫疾病或妊娠。获得性病症可能源自衰老或源自治疗潜在继发性病症的药物疗法(例如,癌症化学疗法)。本公开文本还涉及治疗未患止血病症或导致获得止血病症的继发性疾病或病症的受试者的方法。本公开文本因此涉及治疗需要通用止血剂的受试者的方法,其包括施用治疗有效量的本公开文本的分离的核酸分子、载体或多肽。例如,在一个实施例中,需要通用止血剂的受试者正在进行或即将进行手术。本公开文本的分离的核酸分子、载体或多肽可以作为预防药在手术之前或之后施用。本公开文本的分离的核酸分子、载体或多肽可以在手术期间或之后施用以控制急性出血发作。手术可以包括但不限于肝移植、肝切除或干细胞移植。在另一个实施例中,本公开文本的分离的核酸分子、载体或多肽可以用于治疗患有急性出血发作但未患止血病症的受试者。急性出血发作可能源自严重创伤(例如,手术)、车祸、伤口、枪击撕裂(lacerationgunshot)或导致不受控制的出血的任何其他创伤性事件。分离的核酸分子、载体或蛋白质可以用于预防性治疗患有止血病症的受试者。分离的核酸分子、载体或蛋白质可以用于治疗患有止血病症的受试者的急性出血发作。在另一个实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白不诱导受试者的免疫应答。在一些实施例中,免疫应答包含产生针对凝血因子的抗体。在一个实施例中,免疫应答包含产生针对fviii的抗体。在一些实施例中,免疫应答包含细胞因子分泌。在一些实施例中,免疫应答包含激活b细胞、t细胞或b细胞和t细胞二者。在一些实施例中,免疫应答是抑制性免疫应答,其中相对于未产生免疫应答的受试者的凝血因子的活性,受试者的免疫应答降低凝血因子蛋白的活性。在某些实施例中,通过施用本公开文本的分离的核酸分子或载体表达凝血因子蛋白预防针对凝血因子蛋白或从分离的核酸分子或载体表达的凝血因子蛋白的抑制性免疫应答。在一些实施例中,本公开文本的分离的核酸分子、载体或蛋白质组合物与至少一种促进止血的其他药剂组合施用。促进止血的所述其他药剂是具有已证实的凝血活性的治疗剂。作为例子但不限制,止血剂可以包括fv、fvii、fix、fx、fxi、fxii、fxiii、凝血酶原或纤维蛋白原或前述任一种的激活形式。凝血因子或止血剂还可以包括抗纤维蛋白溶药,例如ε-氨基己酸、氨甲环酸。在本公开文本的一个实施例中,组合物(例如,分离的核酸分子、载体或多肽)是凝血因子在施用于受试者时以可激活的形式存在的组合物。这种可激活的分子可以在施用于受试者后在体内于凝血位点被激活。因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一itr和/或第二itr包含seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的出血病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码凝血因子的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。因此,在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病a的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码因子viii的异源多核苷酸序列,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病a的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码因子viii的异源多核苷酸序列,其中第一itr和/或第二itr包含seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的血友病a的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码因子viii的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。本公开文本还提供了治疗肝脏代谢病症的方法,其包括将本公开文本的核酸分子、载体或多肽施用于有需要的受试者。在一些实施例中,肝脏代谢病症选自苯丙酮尿(图7e显示了来自用含有鼠类pah转基因和b19d135或gpcd165itr的ssdna处理的pku小鼠的肝脏裂解物的蛋白质免疫印迹。在处理后第81天收集肝脏,并提取蛋白质裂解物。每个孔代表单只动物。使用m2抗flag抗体侦检flag标记的鼠类pah蛋白,并且包括gapdh上样对照以供比较。)、尿素循环疾病(例如,缺乏转胺甲酰酶(otc)或精胺琥珀酸合成酶(ass))、溶酶体贮积病症(例如,粘多糖贮积症)和糖原贮积病(例如,i、ii、iii、iv型糖原贮积病)。其他肝脏代谢病症包括但不限于威尔森病(wilson’sdisease)、α-1抗胰蛋白酶缺乏、妊娠期同种免疫肝病(gald)、脂肪酸氧化缺陷、半乳糖血症、脂质贮积病、酪氨酸血症和过氧化物酶体病症。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码在受试者体内缺乏的肝脏相关代谢酶的异源多核苷酸序列,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一itr和/或第二itr包含seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的肝脏代谢病症的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码治疗性蛋白质(例如,正常的肝脏代谢功能所需的蛋白质)的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(pku)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码苯丙氨酸羟化酶(pah)的异源多核苷酸序列,其中第一itr和/或第二itr是非腺相关病毒(非aav)的itr。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(pku)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码苯丙氨酸羟化酶(pah)的异源多核苷酸序列,其中第一itr和/或第二itr包含seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列。在一些实施例中,本公开文本提供了治疗有需要的受试者的苯丙酮尿症(pku)的方法,其包括将核酸分子施用于受试者,所述核酸分子包含侧接于基因盒的第一反向末端重复(itr)和第二itr,所述基因盒包含编码苯丙氨酸羟化酶的异源多核苷酸序列,其中第一itr和/或第二itr包含与seqidno:180、181、183、184、185、186、187或188中所述的核苷酸序列至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%相同的核苷酸序列或其功能衍生物。分离的核酸分子、载体或多肽可以用以下方式施用:静脉内、皮下、肌内或通过任何粘膜表面,例如口服、舌下、经颊、舌下、经鼻、经直肠、经阴道或通过经肺途径。可以将凝血因子蛋白植入生物聚合物固相支持体内或与所述固相支持体连接,从而允许将嵌合蛋白缓慢释放至所需位点。对于口服施用,药物组合物可以采取通过常规手段制备的片剂或胶囊的形式。还可以将组合物制备为液体,例如糖浆或悬浮液。液体可以包括悬浮剂(例如,山梨醇糖浆、纤维素衍生物或氢化食用脂肪)、乳化剂(卵磷脂或阿拉伯胶)、非水性媒剂(例如,扁桃仁油、油性酯、乙醇或分馏植物油)和防腐剂(例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸)。制剂还可以包括矫味剂、着色剂和甜味剂。可替代地,组合物可以作为干产品存在,用于用水或另一种适宜媒剂来构造。对于经颊和舌下施用,组合物可以采取根据常规方案的片剂、锭剂或速溶薄膜的形式。对于通过吸入施用,根据本公开文本使用的具有凝血因子活性的多肽便捷地以气溶胶喷雾剂的形式从具有适宜推进剂(例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟甲烷、二氧化碳或其他适宜气体)的加压包或雾化器(例如,于pbs中)递送。在加压气溶胶的情况下,剂量单位可以通过提供递送计量量的阀来确定。例如用于吸入器或吹入器中的明胶的胶囊和药筒可配制含有化合物与如乳糖或淀粉等适宜粉末基质的粉末混合物。在一个实施例中,分离的核酸分子、载体或多肽的施用途径是肠胃外的。如本文所用的术语肠胃外包括静脉内、动脉内、腹膜内、肌内、皮下、直肠或阴道施用。肠胃外施用的静脉内形式是较佳的。虽然所有这些施用形式都明确地考虑在本公开文本的范围内,但是施用形式可以是注射用溶液,特别是用于静脉内或动脉内注射或滴注。通常,适于注射的药物组合物可以包含缓冲液(例如乙酸盐、磷酸盐或柠檬酸盐缓冲液)、表面活性剂(例如聚山梨醇酯)、任选地稳定剂(例如人白蛋白)等。然而,在与本文的传授内容兼容的其他方法中,可以将分离的核酸分子、载体或多肽直接递送至不良细胞群的位点,由此增加患病组织对治疗剂的暴露。用于肠胃外施用的制剂包括无菌的水性或非水性溶液、悬浮液和乳液。非水性溶剂的例子是丙二醇、聚乙二醇、植物油如橄榄油、以及可注射的有机酯如油酸乙酯。水性载剂包括水、醇性/水性溶液、乳液或悬浮液,包括盐水和缓冲介体。在本公开文本中,医药上可接受的载剂包括但不限于0.01-0.1m且较佳地0.05m磷酸盐缓冲液或0.8%盐水。其他常见肠胃外媒剂包括磷酸钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸林格氏液或固定油。静脉内媒剂包括流体和营养补充剂、电解质补充剂(如基于林格氏右旋糖的那些)等。也可以存在防腐剂和其他添加剂,如例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。更具体地,适于注射使用的药物组合物包括无菌的水性溶液(水溶性的)或分散液、以及用于临时制备无菌可注射溶液或分散液的无菌粉末。在此类情况下,组合物必须是无菌的并且应当是易于注射的程度的流体。其在制造和储存条件下应当稳定,并且将较佳地抵抗微生物(如细菌和真菌)的污染作用而保存。载剂可以是溶剂或分散介体,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液体聚乙二醇等)及其适宜混合物。可以例如通过以下方式维持适当流动性:通过使用如卵磷脂等包衣,在分散液情况下通过维持所需粒径,以及通过使用表面活性剂。药物组合物还可以经配制用于作为例如含有常规栓剂基质(如可可脂或其他甘油酯)的栓剂或保留灌肠剂经直肠施用。用于治疗病症的本公开文本的组合物的有效剂量根据许多不同因素而变化,所述因素包括施用方式、靶位点、患者的生理状态、患者是人还是动物、所施用的其他药物以及治疗是预防性的还是治疗性的。通常,患者是人,但是也可治疗非人哺乳动物,包括转基因哺乳动物。治疗剂量可使用本领域的技术人员已知的常规方法逐步增加,以优化安全性和功效。本公开文本的核酸分子、载体或多肽可以任选地与在需要治疗(例如,预防性或治疗性)的病症或病症的治疗中有效的其他药剂组合施用。如本文所用,与辅助疗法结合或组合的本公开文本的分离的核酸分子、载体或多肽的施用意指依序、同时、同延、并行、伴随或同期施用或施用所述疗法和所公开多肽。本领域的技术人员应了解,组合治疗方案中各种组分的施用或施用可以定时以增强治疗的整体有效性。基于所选辅助疗法和本说明书的传授内容,熟习此项技术者(例如,医师)在不进行过度实验的情况下便能够容易地辨别有效的组合治疗方案。应进一步了解,本公开文本的分离的核酸分子、载体或多肽可以与一种或多种药剂结合或组合使用(例如,以提供组合治疗方案)。本公开文本的多肽或多核苷酸可以组合的示例性药剂包括代表用于所治疗的特定病症的当前护理标准的药剂。此类药剂在本质上可以是化学的或生物的。术语“生物剂(biologic)”或“生物剂(biologicagent)”是指预期用作治疗剂的从活的生物体和/或其产物制备的任何药学活性剂。要与本公开文本的多核苷酸或多肽组合使用的药剂的量可以随受试者变化,或者可以根据本领域的知识来施用。参见例如,bruceachabner等,antineoplasticagents,于goodman&gilman'sthepharmacologicalbasisoftherapeutics1233-1287(joelg.hardman等编,第9版1996).。在另一个实施例中,施用符合护理标准的量的这种药剂。在一个实施例中,本文还公开了套组,其包含本文所公开的核酸分子以及将核酸分子施用于有需要的受试者的说明书。在另一个实施例中,本文公开了用于产生本文所提供的核酸分子的杆状病毒系统。核酸分子是在昆虫细胞中产生。在另一个实施例中,提供了表达构建体的纳米颗粒递送系统。表达构建体包含本文所公开的核酸分子。ix.基因疗法本公开文本的某些方面提供了在受试者体内表达基因构建体的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在一些方面中,本公开文本提供了增加受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子施用于有需要的受试者。在其他方面中,本公开文本提供了调节有需要的受试者体内多肽的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含mirna的核酸序列)施用于受试者。在一些方面中,本公开文本提供了下调有需要的受试者体内靶基因的表达的方法,其包括将本公开文本的分离的核酸分子(例如,包含mirna的核酸序列)施用于受试者。已经探索出体基因疗法作为多种病症的可能的治疗,所述病症包括但不限于血友病a。基因疗法是血友病的非常有吸引力的治疗,因为其可能在载体的单次施用于后通过连续内源性产生凝血因子(例如,fviii)治愈所述疾病。血友病a非常适合于基因替代方法,因为其临床表达可完全归因于缺少以微小量(200ng/ml)在血浆中循环的单一基因产物(例如,fviii)。已经显示使用常规的基于病毒的基因递送诱导人的免疫应答。病毒衣壳蛋白可触发人免疫系统的多种组分。基于aav的基因递送一直是有吸引力的,因为aav是人群中的常见病毒,大多数人已经暴露于aav,并且已经显示aav的免疫原性低于例如腺病毒。因此,大多数人已经产生针对其先前所暴露的特定变异体的免疫应答。这种预先存在的适应性应答可包括nab和t细胞,它们可降低随后用aav再感染的临床功效和/或已经被转导的细胞的消除,这使具有预先存在的抗aav免疫力的患者没有资格接受基于avv的基因疗法治疗。本公开文本的核酸分子可用于基于非病毒的基因疗法。由于使用本公开文本的核酸分子的基因递送不需要病毒衣壳,所以除非之后向受试者再次施用(或再次给药),否则不会产生针对病毒组分的免疫力。因此,本公开文本的核酸分子允许长期基因递送策略的再次给药。另外,如本文所述,本公开文本的核酸分子包含非aav细小病毒itr,所述itr侧接于基因盒以在施用后驱动稳定的转基因表达。itr的存在是稳定的转基因表达所必需的,如图5中所示,其中不含itr的核酸不能实现稳定的转基因表达(参见,“无itr的dsdna”和“微环”)。本公开文本的凝血因子蛋白可以在哺乳动物(例如,人患者)体内产生,使用基因治疗方法对于选自以下的出血疾病或病症的治疗将是治疗上有益的:出血凝结病症、关节积血、肌肉出血、口腔出血、出血症、出血至肌肉中、口腔出血症、创伤、头部创伤、胃肠出血、颅内出血、腹内出血、胸腔内出血、骨折、中枢神经系统出血、咽后间隙出血、腹膜后间隙出血和髂腰肌鞘出血。在一个实施例中,出血疾病或病症是血友病。在另一个实施例中,出血疾病或病症是血友病a。其他病症也适于使用本文所公开的核酸分子治疗。在某些实施例中,使用本文所述方法治疗影响选自以下的靶器官的疾病或病症:肌肉、中枢神经系统(cns)、眼睛、肝脏、心脏、肾脏、胰腺、肺、皮肤、膀胱、泌尿道或其任何组合。在某些实施例中,使用本文所述方法治疗选自以下的疾病或病症:dmd(杜氏肌营养不良)、xlmtm(x连锁肌小管性肌病)、帕金森病、sma(脊髓性肌萎缩)、弗里德赖希共济失调、gucy2d-lca(利伯先天性黑矇)、xlrs(x连锁视网膜劈裂症)、amd(年龄相关性黄斑变性)、achm(全色盲)、rpf65介导的ird(表9)。表9.可通过本文所公开的方法治疗的疾病和病症。1:sod1基因的突变占遗传性als病例的20%。野生型sod1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体sod1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的sod1表达可能在als中抑制运动神经元变性。2:hd是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。htt含有重复多次的三个dna碱基(胞嘧啶-腺嘌呤-鸟嘌呤(cag))的序列(即...cagcagcag...),称为三核苷酸重复。cag是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列cag导致产生称为聚谷氨酰胺段(或聚q段)的谷氨酰胺链以及基因的重复部分聚q区。通常,人们在聚q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mhtt),增加某些神经元类型的衰变率。通常,cag重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改hd机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,hd具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型hd、运动不能-僵硬或韦斯特法尔(westphal)变异体hd。这种情况占hd载剂的约7%。3:大多数导致色素性视网膜炎的rho基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。在一些实施例中,使用本文所述方法治疗溶酶体贮积病症。在一些实施例中,溶酶体贮积病症选自mld(异染性脑白质营养不良)、mps(粘多糖贮积症)、pku(苯丙酮尿症)、庞贝糖原贮积病ii型或其任何组合。在一些实施例中,本文所述方法用于微小rna(mirna)疗法中。在一些实施例中,mirna治疗因基因或蛋白质过表达而引起的病症。在一些实施例中,mirna治疗因蛋白质积累而引起的病症。在一些实施例中,mirna治疗因基因或蛋白质错误表达而引起的病症。在一些实施例中,mirna治疗因突变体基因表达而引起的病症。在一些实施例中,mirna治疗因异源基因表达而引起的病症。在某些实施例中,mirna疗法治疗选自以下的病症:als(肌萎缩侧索硬化)、亨廷顿病、adrp(常染色体显性色素性视网膜炎)及其任何组合。在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗als,其中核酸分子包含编码mirna的基因盒,其中mirna靶向sod1的表达。在某些实施例中,mirna包含dirren等,annalsofclinicalandtranslationalneurology2(2):167-84(2015年2月)披露的mirsod1人工mirna。sod1基因的突变占遗传性als病例的20%。野生型sod1已经在神经培养中显示抗细胞凋亡特性,同时已经观察到突变体sod1在脊髓线粒体中而不是肝脏线粒体中促进细胞凋亡,但是其在这两种线粒体中同等表达。下调突变的sod1表达可能在als中抑制运动神经元变性。在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗亨廷顿病,其中核酸分子包含编码mirna的基因盒,其中mirna靶向htt的表达。在某些实施例中,mirna包含evers等,moleculartherapy26(9):1-15(印刷版之前的电子版,2018年6月)披露的mihtt工程化的mirna。亨廷顿病是由于基因重复部分的长度超过正常范围而引起的若干种三核苷酸重复病症中的一种。htt含有重复多次的三个dna碱基(胞嘧啶-腺嘌呤-鸟嘌呤(cag))的序列(即...cagcagcag...),其被称为三核苷酸重复。cag是氨基酸谷氨酰胺的3字母遗传密码(密码子),因此一系列的这些重复导致产生称为聚谷氨酰胺段(或聚q段)的谷氨酰胺链以及基因的重复部分聚q区。通常,人们在聚q区中具有少于36个重复谷氨酰胺,这导致产生细胞质蛋白亨廷顿蛋白。然而,36个或更多个谷氨酰胺的序列导致产生具有不同特征的蛋白质。这种改变的形式称为突变体亨廷顿蛋白(mhtt),增加某些神经元类型的衰变率。通常,cag重复数与这个过程受影响的程度相关,并且占症状发作年龄变化的约60%。其余变化归因于环境和修改亨廷顿病机制的其他基因。36-39个重复产生疾病的外显率降低形式,其症状具有迟得多的发作和较慢的进展。在一些情况下,发作可能迟至使得从未注意到症状。在极大重复计数的情况下,亨廷顿病具有完全外显率并且可以在20岁以下发生,这时将其称为幼年型亨廷顿病、运动不能-僵硬或韦斯特法尔变异体亨廷顿病。这种情况占亨廷顿病载剂的约7%。在某些实施例中,本公开文本的方法包括通过施用本文所公开的核酸分子靶向治疗常染色体显性色素性视网膜炎(adrp),其中核酸分子包含编码mirna的基因盒,其中mirna靶向rho(视紫质)的表达。在某些实施例中,mirna包含mir-708(参见behrman等,jcb192(6):919-27(2011))。大多数导致色素性视网膜炎的rho基因突变改变视紫质蛋白的折叠或转运。少数突变引起视紫质组成性激活而不是响应光才被激活。研究表明,改变的视紫质形式干扰必需的细胞功能,从而引起视杆自毁(经历细胞凋亡)。由于视杆是低光条件下的视力所必需的,因此这些细胞的损失在患有色素性视网膜炎的人中引起进行性夜盲症。本文所述的所有各个方面、实施例和选择都能以任何和所有变化组合。本说明书中所提到的所有出版物、专利和专利申请都通过引用并入本文,并入程度如同指示每个单独出版物、专利或专利申请明确且单独地通过引用并入一般。已经一般性地描述了本公开文本,通过参考本文所提供的实例可以获得进一步的理解。这些实例仅用于说明的目的,而不旨在是限制性的。实施例实施例1.带有aav和非aav细小病毒itr的fviii表达构建体的产生。实例1a.将密码子优化的fviii基因和来自aav的反向末端重复(itr)区克隆至基因盒中。fviii基因盒是基于aav血清型2的基因组来产生。然而,源自任何血清型(包括合成的)的itr区可以用于这种方法中(图1a)。设计在肝脏特异性启动子(ttpp)或泛在启动子(cagp,图1a和1b)调控下编码侧接有来自aav的反向末端重复(itr)区的密码子优化的fviii编码序列(aav-fviii)的表达质粒aav2-fviiico6xten用于体外和体内表达,如图1c中所示。基因盒还含有wpre和bghpa组件用于转基因的最佳表达(图1a-1c)。将itr侧接的密码子优化的fviii序列克隆至包含cole1复制起点和赋予氨苄青霉素抗性的β-内酰胺酶的表达盒的质粒骨架中(图1c)。侧接于表达盒的限制性内切核酸酶pvuii的识别位点经工程化以允许在pvuii消化时准确切除aav-fviii构建体(图1c)。实例1b.将密码子优化的fviii基因和来自非aav细小病毒的反向末端重复(itr)区克隆至基因盒中。基于aav所属的病毒科细小病毒科的成员之间的种系发生关系(图2a),假设依赖病毒属的其他非aav成员和红病毒属的成员利用类似的细胞机制维持病毒生命周期并建立持久的潜在性感染。因此,可以利用源自这些病毒的基因组的itr区研发aav样(但并非基于aav)基因表达盒。测试以下细小病毒的itr区对研发用于基因疗法应用的基因构建体的适合性:依赖病毒属鹅细小病毒(gpv)株b和红病毒属b19细小病毒(图2a)。细小病毒itr区在质粒载体于细菌细胞中繁殖期间的不稳定性对基因构建体的产生和操作造成挑战。已经成功产生一些含有全长aav2itr(145nt)的基因构建体,但是这些构建体非常不稳定,并且大多数基于aav2itr的质粒含有itr区的截短的130nt形式(例示于表1中)。类似地,所产生的带有b19itr和gpvitr二者的全长序列的质粒构建体在细菌宿主中展现高度不稳定性(数据未显示),这显著限制了这些itr对于研发用于基因疗法应用的基因载体的实用性。先前已经研发出用于拯救带有itr的截短形式的重组b19病毒的反求遗传学系统(manaresi等virology508(2017):54-62)(表2b,itrid:b19d135)。因此,利用b19d135itr产生遗传上稳定的fviii表达质粒b19-fviiico6xten(图1d)。为了进一步利用这种方法合成基于gpvitr的构建体,比较b19itr、gpvitr和aav2itr的全长野生型序列(图3a)。分别基于与b19itr和avv2itr序列中对于itr功能非必要的前135个和前15个核苷酸的同源性,假设可以去除gpvitr的前162个核苷酸以合成具有完整功能的itr(图3a,加框序列)的稳定基因构建体。因此,与带有相应itr的截短形式的构建体aav2-fviiico6xten和b19-fviiico6xten类似,使用gpvd162(表2c)产生稳定fviii表达质粒构建体gpv-fviiico6xten(图1e)。值得注意的是,全长b19itr和gpvitr二者都比全长aav2itr长得多(表1),并且不会形成aavitr的独特的t形发夹结构(图2b)。含有全长b19itr序列的质粒在细菌宿主细胞中展现高度不稳定性,因为可能产生仅含有3’itr的fviiico6xten表达构建体。使用标准分子克隆技术,可能无法获得含有5’和3’全长b19itr二者的阳性克隆。为了产生侧接有全长b19itr的fviiico6xten表达构建体b19wt-fviiico6xten(图1f),使用特定宿主大肠杆菌菌株pmc103。pmc103含有基因sbcc的缺失,所述基因编码识别并消除十字形dna结构的外切核酸酶。不受理论束缚,认为使用缺少sbcc的菌株pmc103可允许复制长回文序列(即,含有复杂二级结构的序列)并成功克隆b19wt-fviiico6xten以及gpvwt-fviiico6xten。所得质粒编码383个碱基对的野生型b195’和3’itr序列(表2d),并且另一种质粒编码444个碱基对的野生型gpv5’和3’itr序列(表2f)。如实例1a中所述产生含有侧接有非aav细小病毒itr(b19d135、gpvd162和b19wt)的fviii表达盒的质粒b19-fviiico6xten(图1d;表2b)、gpv-fviiico6xten(图1e;表2c)和b19wt-fviiico6xten(图1f,表2d)。使用限制性内切核酸酶lgui的识别位点侧接于所有fviii表达盒(图1d-1f)。实例1c.含有侧接有aav和非aav细小病毒itr的fviii表达盒的单链dna片段的制备。假设侧接于fviii表达盒的itr区内发夹结构的形成会驱动靶细胞的持久转导。对于概念验证研究,分别用pvuii和lgui消化基于aavitr的质粒aav2-fviiico6xten以及基于非aavitr的质粒b19-fviiico6xten和gpv-fviiico6xten。具有形成的发夹itr结构的单链(ss)aav-fviii、b19-fviii或gpv-fviii片段是通过以下方式来产生:在95℃下使pvuii或lgui消化的双链dna片段产物(fviii表达盒和质粒骨架)变性,然后在4℃下冷却以允许回文itr序列折叠(图1a-1b)。在hema(血友病a)小鼠模型中测试所得ssaav-fviii、ssb19-fviii或ssgpv-fviii建立肝细胞的持久转导的能力。实例1d.使用杆状病毒表达系统产生fviii表达构建体。将利用描述于li等,plosone8(8):e69879(2013)中的杆状病毒表达系统在昆虫细胞中产生呈闭端dna(cedna)分子形式的aav-fviii、b19-fviii和gpv-fviii构建体。已经证实cedna表达盒的全身递送建立肝细胞的持久转导,并驱动肝脏中的稳定长期转基因表达。实例2.在hema小鼠体内,包含侧接有aav和非aav细小病毒itr的fviii表达盒的基因构建体的全身注射导致长期fviii表达。实例2a.ssaav-fviii介导的fviii表达的体内评价。为了验证带有aavitr区的ssaav-fviii在体内介导持久转基因表达的能力,在5-12周龄血友病a(hema)小鼠(4只动物/组)中以5μg、10μg、20μgssdna基因表达盒(ssaav-fviii)通过流体力学注射全身递送所述基因表达盒(图4a)。hdi导致所注射材料主要递送至实验动物的肝脏中。在单次流体力学注射ssaav-fviii后18小时、3天、2周、3周、1个月、2个月、3个月和4个月,从实验动物收集血浆样品。通过生色fviii活性测定分析血液中的fviii血浆活性。用5μg/小鼠的亲代表达质粒注射的对照动物在施用后不久即显示高fviii血浆活性水平。然而,循环fviii的水平快速下降,并且截至注射后(p.i.)15天变得无法侦检。相比之下,用5、10和20μg/小鼠的ssaav-fviii注射的实验动物产生了转基因的长期表达,循环fviii的稳定水平分别为正常fviii水平的约8%、16%和32%(图4a)。观察到强剂量反应,表明所注射剂量与治疗结果之间高度相关。实例2b.ssb19-fviii和ssgpv-fviii介导的fviii表达的体内评价。为了评价来自分别带有非aav细小病毒itr区b19d135和gpvd162的ssb19-fviii和ssgpv-fviii的fviii的体内表达,在5-12周龄血友病a(hema)小鼠体内通过hdi全身递送10或20μg/小鼠的ssb19-fviii以及10或50μg/小鼠的ssgpv-fviii基因表达盒。在注射后1、3、7、14、21、28、42、56、84、112、140和168天收集血液样品,并通过生色fviii活性测定分析血液中的fviii活性。如在aav-fviii构建体的情况下所观察到的,用5μg/小鼠的亲代fviii表达质粒注射的对照动物在注射后24小时显示高fviii血浆活性水平,其快速下降,并且截至注射后14天变得无法侦检。用ssb19-fviii注射的实验动物在注射后3天显示峰值fviii血浆活性,其然后在21天期间逐渐下降,并且在注射后28天左右稳定。(图4b)另一方面,用ssgpv-fviii注射的hema小鼠在第112天左右产生稳定的fviii血浆活性水平,其在剩余观察阶段期间维持(图4c)。值得注意的是,用10μg/小鼠的ssaav-fviii(图4a)或ssgpv-fviii(图4c)注射的动物产生了非常相似的稳定fviii血浆活性水平,表明aav2itr和gpvitr区二者都包含有效建立靶细胞的持久转导所需的遗传因子。实例2c.fviii在hema小鼠体内的稳定长期表达的itr和发夹需求的体内评价。为了比较单链dna盒与替代核酸治疗剂的稳定性和长期表达,用pvuii或aflii消化fviiico6xten质粒构建体(图1a)以产生具有或不具有aavitr序列的双链线性dna。纯化不具有itr的线性双链dna以产生‘无itr的dsdna’构建体。最后,通过重迭aflii识别位点连接纯化的不具有itr的dsdna,导致形成微环dna。这种小环状质粒样dna构建体缺乏任何细菌序列和/或itr序列。通过流体力学注射用等摩尔浓度的dna构建体注射hema小鼠,并根据在2-4个月期间收集的血浆确定fviii活性水平。所有dna构建体都产生了在30%-60%正常范围内的初始治疗水平的fviii,然而,只有单链dna在注射后持续4个月显示32%的转基因表达的稳定持久性(图5)。所有双链dna和微环dna都在第14-42天达到了6%-10%正常值的稳定表达水平,然而,这些平台期仅代表所观察到的初始fviii活性的10%。因为瞬时升高水平的fviii表达可以导致形成中和抗药物抗体,因此在血友病a环境中的免疫耐受性需要稳定表达。实例2d.野生型与衍生b19itr的体内比较。为了比较b19衍生itr(b19d135,图1d,表2c)与全长b19itr(表2c)的作用,产生侧接有248个碱基对的itr(图1f)的fviiico6xten表达盒。用30μg侧接有b19d135(图1d)、gpvd165(图1e)或野生型b19itr(图1f)的单链fviii-dna流体力学注射血友病a小鼠。在注射后3、7、14、21、28和35天收集所有群组的血浆,b19d135和gpvd165构建体的其他样品在第42天、第55天和第84天采集,并通过生色测定分析fviii活性(图6)。与衍生b19itr相比,全长itr导致fviii表达增加约2.5倍。此外,来自野生型itr的fviii的表达一开始稳定。实例2e.体内单链裸dna的再次施用的评价。当前基因治疗方式的关键限制是由于形成针对基因疗法载体的病毒衣壳的抗药物抗体而无法再次施用治疗剂。然而,不存在免疫原性蛋白质的基因疗法系统可以再次给药,以使患者逐步增加至所需治疗水平。为了评价我们的侧接非aavitr的单链盒是否可以再次施用,在第0天和第35天用30μg含有b19d135itr和gpvd165itr的ssdna注射hema小鼠(图6)。在观察的第一个月期间,施用gpvd165-fviii的小鼠达到了大约5%正常值的稳定fviii水平。在ssdna的第二剂量后,fviii水平上升至10%,之后略有下降,显示fviii水平的2倍增加。在第一周期间,施用b19d135-fviii的小鼠达到了8%的稳定fviii水平,其上升约3.5倍至30%,之后下降至25%。这些数据证实,在血友病a小鼠体内,再次施用具有非aavitr的单链dna可以增加fviii的稳定表达水平。实例3.带有b19d135和gpvd162非aav细小病毒itr的衍生物的fviii表达构建体的产生和体内评价。实例3a.b19itr和gpvitr的最小必需序列的确定。基于依赖病毒属aav2和gpv以及红病毒属b19的itr序列之间的比较(genebank登录号分别为nc_001401.2、u25749.1和ky940273.1),设计用带有此类itr的基因构建体持久转导真核细胞所需的gpv和b19细小病毒itr的最小序列,其具有或不具有其他序列(间隔子、插入、倒位、添加和/或用其他细小病毒itr的野生型序列重组)(图3a和3b)。aav2itr、gpvitr和b19itr的序列比对揭示了所有三种病毒物种之间的保守区b19v1和gpvv1(呈现于表2a-2c中),其作为连续序列而不含可变序列的间隔子区。同样,基于b19itr与gpvitr之间的序列比较设计最小必需序列变异体b19v3和gpvv3。由于带有gpvd162itr的fviii表达构建体在体内实验中的表达优于带有b19d135itr的基因构建体,假设b19v3序列包含在b19itr与gpvitr序列之间保守的最小b19itr序列区,并且gpvv3序列包含在gpvitr序列中存在并且在b19itr序列中缺少的最小gpvitr序列区(表2b和2c)。序列b19v2和gpvv2分别是通过排除b19itr和gpvitr序列的itr回文序列区中前135个和前162个核苷酸以及相应互补的135个和162个核苷酸来产生(表2b和2c)。实例3b.b19itr和gpvitr及其衍生物的回文区在功能性基因构建体上的定向。细小病毒itr的一部分是由自我互补的回文区组成。先前已证实,对于重组感染性b19细小病毒,所拯救的带有呈正向和反向定向的回文区的病毒展现类似的生长特性(manaresi等virology508(2017):54-62)。因此,提出不管此类itr的回文区关于基因表达盒是呈5’和3’itr组合的正向、反向或任何可能组合,带有b19itr和gpvitr及其衍生物的基因表达构建体保持功能性。为了验证这个假设,将使用相同物种itr的相同以及反向的互补序列,将b19d135itr和gpvd162itr以及野生型b19itr和gpvitr以正向、反向和倒转定向并入fviiico6xten表达盒中。将产生来自这些质粒的单链dna并如实例2a、2b和2d中所述在血友病a小鼠体内测试由ttpp启动子驱动的肝脏定向的fviii表达。除了研究相同物种itr的所有定向以外,还将产生gpv和b19野生型itr及其衍生物的组合并在血友病a小鼠体内测试fviii表达。这些表达盒将含有1个b19来源的itr和1个gpv来源的itr,以确定非同源itr序列是否可以增强所需转基因的附加型连环化以及长期表达。将通过流体力学注射用10、20或50μg含有前述表达盒的ssdna注射血友病a小鼠,并且将从在注射后以每周间隔收集的鼠类血浆量测fviii。将对施用这些表达盒的小鼠体内的fviii表达和寿命的影响与施用b19d135、gpvd162和相应野生型itr表达盒的小鼠体内的fviii表达和寿命进行直接比较(表2b、2c、2d和2f)。实例3c.在hema小鼠体内带有b19d135和gpvd162非aav细小病毒itr的衍生物的基因构建体的全身注射。为了评价来自带有b19d135和gpvd162非aav细小病毒itr的衍生物的ssdna构建体的fviii体内表达,将在5-12周龄hema小鼠体内通过hdi全身递送5、10、20或50μg/小鼠的每种ssdna基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色fviii活性测定分析血液中的fviii活性。实例4.带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna表达构建体在昆虫细胞中的产生和体内评价。实例4a.使用杆状病毒表达系统产生带有b19d135itr和gpvd162itr的cedna表达构建体。与实例1d中所述的aav-fviii、b19-fviii和gpv-fviii构建体类似,将使用杆状病毒表达系统在昆虫细胞中产生呈cedna形式的带有b19d135和gpvd162非aav细小病毒itr的衍生物的基因构建体的fviii表达。实例4b.在hema小鼠体内带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna表达构建体的全身注射。为了评价来自带有b19d135和gpvd162非aav细小病毒itr的衍生物的cedna构建体的fviii体内表达,将在5-12周龄hema小鼠体内通过hdi全身递送5、10、20或50μg/小鼠的每种cedna基因表达盒。将在注射后1、3、7、14、21和28天,然后在4个月期间每个月一次收集血液样品。将通过生色fviii活性测定分析血液中的fviii活性。实例5.ssdna和cednafviii表达构建体的脂质纳米颗粒配制物的产生。在如实例1和4中所述产生每种ssdna或cedna后,将使用适当的脂质组合物通过微流体混合将每种基因构建体配制到脂质纳米颗粒(lnp)中(lnp-ssdna和lnp-cedna)。将调节脂质与dna的比率(n/p)以优化细胞转导和fviii表达。将使用配制到lnp中的编码侧接有aav或非aav细小病毒itr的fviii表达盒的亲代质粒作为转导效率的对照。实例6.lnp-ssdna和lnp-cedna的体外和体内评价。实例6a.在所培养肝细胞中ssdna和cedna介导的fviii表达的体外评价。如实例5中所述将ssdna或cednafviii表达基因构建体和相应的亲代对照质粒配制到lnp中用于靶向基因递送。将huh7细胞以1x105个细胞/孔接种至24孔组织培养板中并温育过夜。在第二天,将lnp-ssdna或配制物以1000、500、250、125和62.5ng/孔添加至细胞上。在转导后24小时更换培养基后,在转导后48小时收获培养基。与人血浆fact标准品相比,通过生色fviii活性测定量测培养基中的fviii活性。将带有在cagp启动子下并且侧接有aavitr的fviiico6xten盒的质粒以72、36和18的n/p比率包封于脂质纳米颗粒中(图8a)。在转导huh7细胞后,在条件化培养基中量测fviii。以18的n/p比率转导细胞产生了36和72的比率的增加的fviii水平,且1μg/ml的峰值剂量产生超过2iu/ml。这个数据证实了lnp递送在肝脏靶细胞中的实用性。为了研究通过lnp递送ssdna在肝脏特异性启动子下的转导效率,将在ttpp启动子下的fviiico6xten盒以2n/p比率包封并转导huh7细胞(图8b)。与我们的先前数据一致(图8a),与36的比率相比,18的n/p比率导致增加的fviii活性水平。另外,这个数据证实了fviiissdna在肝细胞中的概念验证lnp递送。在24小时后,用2μg/ml单链fviiico6xten-aav转导的约2x105个huh7细胞产生了0.33iu/mlfviii。另外,文献中已经显示,细胞组蛋白沿raav附加体规则定位,从而产生与细胞染色体dna核小体模式类似的染色质样结构。因此,还将通过southern印迹来评估这些构建体建立持久转导靶细胞所需的染色质样核小体结构的能力。实例6b.在hema小鼠体内在静脉内施用后对lnp配制的ssdna和cedna介导的长期fviii表达的评价。将以5、10、20、40、100ug/小鼠通过iv注射将lnp-ssdna、lnp-cedna或lnp-pdna(质粒对照)施用于5-12周龄hema小鼠,n=4/组。将在注射后48小时开始长达6个月中的所选时间点收集血液样品,并将通过生色fviii活性测定分析血液中的fviii活性。将针对实例1和4中所述的每种基因构建体比较用lnp-ssdna或lnp-cedna处理的小鼠体内的fviii表达谱与用lnp-pdna处理的小鼠的fviii表达谱。实例6c.在加强注射后ssdna或cedna介导的fviii表达的体内评价。将在初始注射后2个月向实例6b中用lnp-ssdna或lnp-cedna处理的小鼠的亚组施用相同剂量的相应lnp的额外iv注射加强。将在加强注射后48小时开始长达6个月中的所选时间点收集血液样品。将通过生色fviii活性测定分析血液中的fviii活性。将用lnp-ssdna或lnp-cedna处理的小鼠体内的fviii表达谱与用相应lnp-pdna处理的小鼠的fviii表达谱进行比较。实例7.带有b19或gpv来源的itr的基因表达构建体在基因疗法中的一般使用的实用性。实例7a.带有b19或gpv来源的itr的报告基因构建体的产生。为了证实基于非aavitr的基因表达系统作为平台在基因疗法应用中的一般使用的实用性,基于实例1b中所述的构建体用侧接有b19d135itr或gpvd162itr的绿色荧光蛋白(gfp)或荧光素酶(luc)产生包含表达盒的报告基因构建体。因此,通过常规分子克隆技术用gfp或luc的orf替代b19-fviiico6xten(图1c)和gpv-fviiico6xten(图1d)中fviii的开放阅读框(orf)。还产生含有鼠类苯丙氨酸羟化酶(pah)转基因的侧接有b19d135itr或gpvd162itr的表达盒(图7a),使用其在苯丙酮尿的相关小鼠模型中评价pah表达和血液苯丙氨酸浓度的降低。使用这个模型,通过流体力学注射将200μg侧接有非aavitr的ssdna施用于pku小鼠(n=3)用于肝脏表达。在第3、7、14、28、42、56、70和81天收集血液样品,并分离血浆用于苯丙氨酸浓度确定(图7b-7c)。接受含有b19d135itr的表达盒的小鼠在第3天展现苯丙氨酸水平从370μg/ml至210μg/ml的下降,所述水平稳定维持至第81天(图7b)。接受gpvd162itr盒的小鼠在第14天显示血液苯丙氨酸水平从350μg/ml至310μg/ml的下降,所述水平继续下降至截至第42天的250μg/ml的稳定水平(图7c)。血液苯丙氨酸浓度的这些下降代表与注射前浓度相比45%和30%的降低(图7d)。为了确认鼠类pah蛋白在肝脏中的存在,对在注射后第81天取自所处理小鼠的肝脏裂解物进行蛋白质印迹。使用抗flag标签抗体侦检鼠类pah蛋白,图7e显示在6只所处理动物的5只中可侦检的鼠类pah蛋白,并且在用含有b19d135itr的ssdna处理的小鼠体内观察到显著较高的蛋白质水平。这些数据与在图7b-7d中观察到的血液苯丙氨酸减少一致。总而言之,这些证实示,单链dna递送可以导致功能性肝酶的长期表达。实验中所用的各种pah构建体的序列陈述于表10a和10b中。表10a:带有b19d135itr的b19-pah构建体(核苷酸1-4146;seqidno:197)表10b:带有gpvd162itr的gpv-pah构建体(核苷酸1-4214;seqidno:198)实例7b.带有b19或gpv来源的itr的ssdna报告基因构建体的制备。将如实例1c中所述制备ssdna报告基因/pah构建体。简言之,将用lgui消化质粒。具有形成的发夹itr结构的ssdna片段将通过以下方式来产生:使lgui消化的双链dna片段产物(报告基因表达盒和质粒骨架)在95℃下变性,然后在4℃下冷却以允许回文itr序列折叠(图1a)。将在小鼠体内测试所得ssdna构建体建立肝脏、肌肉组织、眼睛中的光感受器和中枢神经系统(cns)的持久转导的能力。实例7c.ssdna介导的报告基因表达的体内评价。为了验证实例7b中所述的ssdna报告基因构建体在体内介导持久转基因表达的能力,将用5、10或20μg/小鼠的报告基因ssdna向5-12周龄小鼠(4只动物/组)全身注射,局部注射至靶肌肉组织和cns细胞,和/或视网膜下注射至靶感光细胞。为了评价来自基于b19itr和gpvitr的表达构建体的pah,将使用相关疾病的小鼠模型。这些基因构建体将通过hdi全身递送以靶向肝脏。序列表<110>比奥维拉迪维治疗股份有限公司(bioverativtherapeuticsinc.)<120>核酸分子及其用于非病毒基因疗法的用途<130>615112:sa9-465tw<150>62/716,826<151>2018-08-09<160>198<170>patentin3.5版<210>1<211>4374<212>dna<213>人工序列<220><223>cofviii-5<400>1atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>2<211>4374<212>dna<213>人工序列<220><223>cofviii-4<400>2atgcagatcgagctgagcacgtgcttcttcctgtgcctgctgaggttctgcttcagcgcc60accaggaggtactacctgggcgccgtggagctgagctgggactacatgcagagcgacctg120ggcgagctgcccgtggacgccaggttcccccccagggtgcccaagagcttccccttcaac180acgagcgtggtgtacaagaagaccctgttcgtggagttcaccgaccatctgttcaatatc240gccaagcccaggcccccctggatggggctgctggggcccacgatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtgagcctgcacgccgtg360ggcgtgagctactggaaggccagcgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccccggcggcagccacacctacgtgtggcaggtgctg480aaggagaatgggcccatggccagcgaccccctgtgcctgacctactcttacctgagccac540gtggatctggtgaaggacctgaacagcggcctgatcggcgccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcacagcgagaccaagaacagcctgatgcaggatagggac720gccgccagcgccagggcctggcccaagatgcacaccgtgaacggctacgtgaacaggtct780ctgcccggcctgatcggctgccacaggaagagcgtgtactggcacgtgatcggcatgggg840accacccccgaggtgcacagcatcttcctggagggccacacgttcctggtgaggaatcac900aggcaggccagcctggagatcagcccgatcaccttcctgaccgcccagaccctgctgatg960gacctggggcagttcctgctgttctgccatatcagctctcaccagcacgacggcatggag1020gcctacgtgaaggtggatagctgccccgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactacgacgacgacctgaccgacagcgagatggacgtggtgaggttcgac1140gacgacaatagcccgagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcattacatcgccgccgaggaggaggattgggactacgcccccctggtgctggcc1260cccgacgacaggtcttacaagagccagtacctgaacaacgggccccagaggatcggcagg1320aagtacaagaaggtgaggttcatggcctacaccgacgagaccttcaagaccagggaggcg1380atccagcacgagagcgggatcctggggcccctgctgtacggcgaggtgggcgacacgctg1440ctgatcatcttcaagaaccaggccagcaggccgtacaatatctacccccacgggatcacc1500gacgtgaggcccctgtactctaggaggctgcccaagggcgtgaagcacctgaaggacttc1560cccatcctgcccggcgagatcttcaagtacaagtggaccgtgaccgtggaggacgggccc1620acgaagagcgaccccaggtgcctgaccaggtactacagctctttcgtgaacatggagagg1680gacctggccagcggcctgatcgggcccctgctgatctgctacaaggagagcgtggatcag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttcagcgtgttcgacgag1800aataggtcttggtacctgaccgagaatatccagaggttcctgcccaaccccgccggcgtg1860cagctggaggatcccgagttccaggccagcaacatcatgcacagcatcaacggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttcagcggctacaccttcaagcacaag2040atggtgtacgaggataccctgaccctgttccccttcagcggcgagaccgtgttcatgagc2100atggagaaccccggcctgtggatcctgggctgccataactccgacttcaggaataggggc2160atgaccgccctgctgaaggtgagctcttgcgacaagaacaccggcgactactacgaggat2220agctacgaggatatcagcgcctacctgctgagcaagaacaacgccatcgagcccaggtct2280ttcagccagaacccccccgtgctgaagaggcaccagagggagatcaccaggacgaccctg2340cagagcgaccaggaggagatcgactacgacgacacgatcagcgtggagatgaagaaggag2400gatttcgacatctacgacgaggacgagaatcagagccccaggtctttccagaagaagacc2460aggcattacttcatcgccgccgtggagaggctgtgggactacggcatgagcagctctccc2520cacgtgctgaggaatagggcccagagcggcagcgtgccccagttcaagaaggtggtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacaggggcgagctgaacgagcac2640ctgggcctgctggggccctacatcagggccgaggtggaggataacatcatggtgaccttc2700aggaatcaggccagcaggccctatagcttctatagctctctgatcagctacgaggaggat2760cagaggcagggcgccgagcccaggaagaacttcgtgaagcccaacgagaccaagacctac2820ttctggaaggtgcagcaccacatggcccccacgaaggacgagttcgactgcaaggcctgg2880gcctacttcagcgacgtggatctggagaaggacgtgcacagcggcctgatcgggcccctg2940ctggtgtgccacaccaacaccctgaaccccgcccacggcaggcaggtgaccgtgcaggag3000ttcgccctgttcttcaccatcttcgacgagaccaagagctggtacttcaccgagaatatg3060gagaggaattgcagggccccctgcaatatccagatggaggacccgaccttcaaggagaat3120tacaggttccacgccatcaacggctacatcatggacacgctgcccggcctggtcatggcc3180caggatcagaggatcaggtggtatctgctgagcatggggagcaacgagaatatccacagc3240atccacttcagcggccacgtgttcaccgtgaggaagaaggaggagtacaagatggccctg3300tacaatctgtaccccggcgtgttcgagaccgtggagatgctgcccagcaaggccgggatc3360tggagggtggagtgcctgatcggcgagcacctgcacgccggcatgagcacgctgttcctg3420gtgtactctaacaagtgccagacccccctggggatggccagcggccacatcagggacttc3480cagatcaccgccagcggccagtacggccagtgggcccccaagctggccaggctgcactat3540tccggaagcatcaacgcctggagcacgaaggagcccttcagctggatcaaggtggatctg3600ctggcccccatgatcatccacgggatcaagacccagggcgccaggcagaagttcagctct3660ctgtatatcagccagttcatcatcatgtactctctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcacgctgatggtgttcttcggcaacgtggactctagcgggatc3780aagcacaatatcttcaacccccccatcatcgccaggtacatcaggctgcaccccacccat3840tactctatcaggtctaccctgaggatggagctgatgggctgcgacctgaacagctgcagc3900atgcccctggggatggagagcaaggccatcagcgacgcccagatcaccgccagctcttac3960ttcaccaacatgttcgccacctggagcccgagcaaggccaggctgcacctgcagggcagg4020tctaacgcctggaggccccaggtgaacaaccccaaggagtggctgcaggtggatttccag4080aagaccatgaaggtgaccggcgtgaccacgcagggcgtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatcagctctagccaggacggccaccagtggaccctgttcttc4200cagaacggcaaggtgaaggtgttccagggcaaccaggatagcttcacccccgtggtgaac4260agcctggacccccccctgctgaccaggtatctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgcgaggcccaggatctgtattga4374<210>3<211>4374<212>dna<213>人工序列<220><223>cofviii-52<400>3atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccaggaccaccctg2340cagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatgaagaaggag2400gacttcgacatctacgacgaggacgagaaccagagccccaggagcttccagaagaagacc2460aggcactacttcattgctgctgtggagaggctgtgggactatggcatgtccagcagcccc2520catgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaagtcgtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacagaggggagctgaacgagcac2640ctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatggtgaccttc2700aggaaccaggccagcaggccctacagcttctacagcagcctgatcagctacgaggaggac2760cagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaaccaagacctac2820ttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgcaaggcctgg2880gcctacttctctgacgtggacctggagaaggacgtgcactctggcctgattggccccctg2940ctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgactgtgcaggag3000ttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcactgagaacatg3060gagaggaactgcagggccccctgcaacatccagatggaggaccccaccttcaaggagaac3120tacaggttccatgccatcaatggctacatcatggacaccctgcctggcctggtcatggcc3180caggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaacatccacagc3240atccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaagatggccctg3300tacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaaggccggcatc3360tggagggtggagtgcctgattggggagcacctgcacgccggcatgagcaccctgttcctg3420gtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatcagggacttc3480cagatcactgcctctggccagtacggccagtgggcccccaagctggccaggctgcactac3540tccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaagtggacctg3600ctggcccccatgatcatccacggcatcaagacccagggggccaggcagaagttctccagc3660ctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagcagcggcatc3780aagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcaccccacccac3840tacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaacagctgcagc3900atgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcctccagctac3960ttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctgcagggcagg4020agcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtggacttccag4080aagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatctccagcagccaggacggccaccagtggaccctgttcttc4200cagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccctgtggtcaac4260agcctggacccccccctgctgaccagatacctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtactga4374<210>4<211>4374<212>dna<213>人工序列<220><223>cofviii-62<400>4atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccaggaccaccctg2340cagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatgaagaaggag2400gacttcgacatctacgacgaggacgagaaccagagccccaggagcttccagaagaagacc2460aggcactacttcattgctgctgtggagaggctgtgggactatggcatgtccagcagcccc2520catgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaagtcgtgttc2580caggagttcaccgacggcagcttcacccagcccctgtacagaggggagctgaacgagcac2640ctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatggtgaccttc2700aggaaccaggccagcaggccctacagcttctacagcagcctgatcagctacgaggaggac2760cagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaaccaagacctac2820ttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgcaaggcctgg2880gcctacttctctgacgtggacctggagaaggacgtgcactctggcctgattggccccctg2940ctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgactgtgcaggag3000ttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcactgagaacatg3060gagaggaactgcagggccccctgcaacatccagatggaggaccccaccttcaaggagaac3120tacaggttccatgccatcaatggctacatcatggacaccctgcctggcctggtcatggcc3180caggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaacatccacagc3240atccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaagatggccctg3300tacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaaggccggcatc3360tggagggtggagtgcctgattggggagcacctgcacgccggcatgagcaccctgttcctg3420gtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatcagggacttc3480cagatcactgcctctggccagtacggccagtgggcccccaagctggccaggctgcactac3540tccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaagtggacctg3600ctggcccccatgatcatccacggcatcaagacccagggggccaggcagaagttctccagc3660ctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtggcagacctac3720aggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagcagcggcatc3780aagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcaccccacccac3840tacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaacagctgcagc3900atgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcctccagctac3960ttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctgcagggcagg4020agcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtggacttccag4080aagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctgaccagcatg4140tacgtgaaggagttcctgatctccagcagccaggacggccaccagtggaccctgttcttc4200cagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccctgtggtcaac4260agcctggacccccccctgctgaccagatacctgaggatccacccccagagctgggtgcac4320cagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtactga4374<210>5<211>4374<212>dna<213>人工序列<220><223>cofviii-25<400>5atgcagattgagctgagcacctgcttcttcctgtgcctgctgaggttctgcttctctgcc60accaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgacctg120ggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttcaac180accagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaacatc240gccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgccgtg360ggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtcctg480aaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagccac540gtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagggac720gccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacaggagc780ctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatgggc840accacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaaccac900aggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctgatg960gacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatggag1020gcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttcgac1140gacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctggcc1260cctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggcagg1320aagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggaggcc1380atccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacaccctg1440ctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatcacc1500gacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagacttc1560cccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggcccc1620accaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggagagg1680gacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggaccag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtcttcgacgag1800aacaggagctggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>6<211>4374<212>dna<213>人工序列<220><223>cofviii-26<400>6atgcagattgagctgagcacctgcttcttcctgtgcctgctgaggttctgcttctctgcc60accaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgacctg120ggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttcaac180accagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaacatc240gccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtgtac300gacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgccgtg360ggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccagagg420gagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtcctg480aaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagccac540gtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagggag600ggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgccgtg660ttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagggac720gccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacaggagc780ctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatgggc840accacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaaccac900aggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctgatg960gacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatggag1020gcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaacgag1080gaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttcgac1140gacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaagacc1200tgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctggcc1260cctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggcagg1320aagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggaggcc1380atccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacaccctg1440ctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatcacc1500gacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagacttc1560cccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggcccc1620accaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggagagg1680gacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggaccag1740aggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtcttcgacgag1800aacaggagctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctc2340caatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaa2400gatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaact2460agacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccct2520cacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttc2580caggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacac2640ctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttc2700cgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgaggaggac2760cagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctac2820ttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgg2880gcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctg2940ctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggag3000tttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatg3060gagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaaggagaac3120tatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcatggcc3180caggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactcc3240attcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctg3300tacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatc3360tggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctg3420gtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagagacttc3480cagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgcactac3540tccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctc3600ctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctcctcc3660ctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttac3720aggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccggcatt3780aagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccactcac3840tactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctgctcc3900atgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctac3960ttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcagggacgg4020tcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaa4080aagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatg4140tatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgttcttc4200caaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaac4260tccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccat4320cagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactga4374<210>7<211>1734<212>dna<213>人工序列<220><223>cofviii-52-nt58<400>7gcgacccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgac60cttggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttc120aacacctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaat180atcgccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtg240tacgacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgcc300gtgggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcag360agagaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtg420ttgaaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcc480cacgtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagg540gaaggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgct600gtgttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagataga660gatgccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgc720tccctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatg780gggaccacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaac840caccggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctg900atggacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatg960gaggcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaat1020gaggaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttc1080gatgacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaag1140acctgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctc1200gctcctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggt1260agaaagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagag1320gccatccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacacc1380cttctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatc1440actgacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggat1500tttccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggc1560ccaactaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggag1620cgcgacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggac1680caacggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtg1734<210>8<211>2583<212>dna<213>人工序列<220><223>cofviii-52-ct<400>8tttgacgaaaaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccct60gctggggtgcagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaat120ggctacgtgttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtac180atcctgagcatcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttc240aagcacaagatggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtc300ttcatgagcatggagaaccctggcctgtggatcctgggctgccacaacagcgacttcagg360aacaggggcatgactgccctgctgaaagtctccagctgtgacaagaacaccggggactac420tacgaggacagctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgag480cccaggagcttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccagg540accaccctgcagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatg600aagaaggaggacttcgacatctacgacgaggacgagaaccagagccccaggagcttccag660aagaagaccaggcactacttcattgctgctgtggagaggctgtgggactatggcatgtcc720agcagcccccatgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaa780gtcgtgttccaggagttcaccgacggcagcttcacccagcccctgtacagaggggagctg840aacgagcacctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatg900gtgaccttcaggaaccaggccagcaggccctacagcttctacagcagcctgatcagctac960gaggaggaccagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaacc1020aagacctacttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgc1080aaggcctgggcctacttctctgacgtggacctggagaaggacgtgcactctggcctgatt1140ggccccctgctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgact1200gtgcaggagttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcact1260gagaacatggagaggaactgcagggccccctgcaacatccagatggaggaccccaccttc1320aaggagaactacaggttccatgccatcaatggctacatcatggacaccctgcctggcctg1380gtcatggcccaggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaac1440atccacagcatccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaag1500atggccctgtacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaag1560gccggcatctggagggtggagtgcctgattggggagcacctgcacgccggcatgagcacc1620ctgttcctggtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatc1680agggacttccagatcactgcctctggccagtacggccagtgggcccccaagctggccagg1740ctgcactactccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaa1800gtggacctgctggcccccatgatcatccacggcatcaagacccagggggccaggcagaag1860ttctccagcctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtgg1920cagacctacaggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagc1980agcggcatcaagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcac2040cccacccactacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaac2100agctgcagcatgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcc2160tccagctacttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctg2220cagggcaggagcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtg2280gacttccagaagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctg2340accagcatgtacgtgaaggagttcctgatctccagcagccaggacggccaccagtggacc2400ctgttcttccagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccct2460gtggtcaacagcctggacccccccctgctgaccagatacctgaggatccacccccagagc2520tgggtgcaccagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtac2580tga2583<210>9<211>1734<212>dna<213>人工序列<220><223>cofviii-62-nt58<400>9gccactcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgac60ctgggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttccccttt120aacacctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaac180atcgccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtg240tacgacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcg300gtcggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccag360cgggaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtc420ctgaaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcc480catgtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgc540gaaggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgct600gtgttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgg660gatgccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcgg720tcactgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatg780ggcactacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaac840caccgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctc900atggacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatg960gaggcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaac1020gaggaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttc1080gatgacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaa1140acctgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctg1200gcacccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggc1260agaaagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggag1320gccattcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgatacc1380ctgctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatc1440accgacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagac1500ttccctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacggg1560cccaccaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaa1620cgggacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggat1680caacgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtg1734<210>10<211>2583<212>dna<213>人工序列<220><223>cofviii-62-ct<400>10tttgatgaaaacagatcctggtacctgaccgagaacatccagaggttcctgcccaaccct60gctggggtgcagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaat120ggctacgtgttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtac180atcctgagcatcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttc240aagcacaagatggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtc300ttcatgagcatggagaaccctggcctgtggatcctgggctgccacaacagcgacttcagg360aacaggggcatgactgccctgctgaaagtctccagctgtgacaagaacaccggggactac420tacgaggacagctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgag480cccaggagcttctctcagaaccccccagtgctgaagaggcaccagagggagatcaccagg540accaccctgcagtctgaccaggaggagatcgactatgatgacaccatcagcgtggagatg600aagaaggaggacttcgacatctacgacgaggacgagaaccagagccccaggagcttccag660aagaagaccaggcactacttcattgctgctgtggagaggctgtgggactatggcatgtcc720agcagcccccatgtgctgaggaacagggcccagtctggcagcgtgccccagttcaagaaa780gtcgtgttccaggagttcaccgacggcagcttcacccagcccctgtacagaggggagctg840aacgagcacctgggcctgctgggcccctacatcagggccgaggtggaggacaacatcatg900gtgaccttcaggaaccaggccagcaggccctacagcttctacagcagcctgatcagctac960gaggaggaccagaggcagggggctgagcccaggaagaactttgtgaagcccaatgaaacc1020aagacctacttctggaaggtgcagcaccacatggcccccaccaaggacgagttcgactgc1080aaggcctgggcctacttctctgacgtggacctggagaaggacgtgcactctggcctgatt1140ggccccctgctggtgtgccacaccaacaccctgaaccctgcccatggcaggcaggtgact1200gtgcaggagttcgccctgttcttcaccatcttcgatgaaaccaagagctggtacttcact1260gagaacatggagaggaactgcagggccccctgcaacatccagatggaggaccccaccttc1320aaggagaactacaggttccatgccatcaatggctacatcatggacaccctgcctggcctg1380gtcatggcccaggaccagaggatcaggtggtatctgctgagcatgggcagcaacgagaac1440atccacagcatccacttctctggccacgtgttcactgtgaggaagaaggaggagtacaag1500atggccctgtacaacctgtaccctggggtgttcgaaaccgtggagatgctgcccagcaag1560gccggcatctggagggtggagtgcctgattggggagcacctgcacgccggcatgagcacc1620ctgttcctggtgtacagcaacaagtgccagacccccctgggcatggcctctggccacatc1680agggacttccagatcactgcctctggccagtacggccagtgggcccccaagctggccagg1740ctgcactactccggaagcatcaatgcctggagcaccaaggagcccttcagctggatcaaa1800gtggacctgctggcccccatgatcatccacggcatcaagacccagggggccaggcagaag1860ttctccagcctgtacatcagccagttcatcatcatgtacagcctggacggcaagaagtgg1920cagacctacaggggcaacagcaccggcaccctgatggtgttcttcggcaacgtggacagc1980agcggcatcaagcacaacatcttcaacccccccatcatcgccagatacatcaggctgcac2040cccacccactacagcatcaggagcaccctgaggatggagctgatgggctgtgacctgaac2100agctgcagcatgcccctgggcatggagagcaaggccatctctgacgcccagatcactgcc2160tccagctacttcaccaacatgtttgccacctggagccccagcaaggccaggctgcacctg2220cagggcaggagcaatgcctggaggccccaggtcaacaaccccaaggagtggctgcaggtg2280gacttccagaagaccatgaaggtgactggggtgaccacccagggggtgaagagcctgctg2340accagcatgtacgtgaaggagttcctgatctccagcagccaggacggccaccagtggacc2400ctgttcttccagaatggcaaggtgaaggtgttccagggcaaccaggacagcttcacccct2460gtggtcaacagcctggacccccccctgctgaccagatacctgaggatccacccccagagc2520tgggtgcaccagatcgccctgaggatggaggtgctgggctgtgaggcccaggacctgtac2580tga2583<210>11<211>1734<212>dna<213>人工序列<220><223>cofviii-25-nt58<400>11gccaccaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgac60ctgggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttc120aacaccagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaac180atcgccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtg240tacgacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgcc300gtgggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccag360agggagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtc420ctgaaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagc480cacgtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagg540gagggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgcc600gtgttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagg660gacgccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacagg720agcctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatg780ggcaccacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaac840cacaggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctg900atggacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatg960gaggcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaac1020gaggaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttc1080gacgacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaag1140acctgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctg1200gcccctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggc1260aggaagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggag1320gccatccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacacc1380ctgctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatc1440accgacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagac1500ttccccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggc1560cccaccaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggag1620agggacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggac1680cagaggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtc1734<210>12<211>2583<212>dna<213>人工序列<220><223>cofviii-25-ct<400>12ttcgacgagaacaggagctggtacctgactgaaaacatccagcggttcctccccaacccc60gcgggcgtgcagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaac120ggctacgtgttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtac180atcctgtccattggtgcccagactgacttcctgtccgtgtttttctccggctacacgttc240aagcacaagatggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtg300tttatgagcatggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgt360aacagaggaatgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactat420tatgaggactcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaa480cctcggagcttcagccagaacccacccgtgcttaagagacatcaacgggagatcactagg540accaccctgcagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatg600aagaaggaggactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaa660aagaaaacccgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcg720tcctcgccgcacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaag780gtcgtgttccaggagttcactgacgggagcttcactcagcctttgtaccggggagaactc840aatgaacatctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatg900gtcactttccgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttac960gaagaggaccagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaacc1020aagacctacttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgc1080aaagcctgggcctacttctccgatgtggacttggagaaggacgtccactccggcctcatc1140ggtcccctgctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcacc1200gtgcaggagttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcacc1260gagaacatggagaggaactgcagagccccctgtaacatccagatggaggacccgacgttc1320aaggaaaactaccggttccacgccattaacggatacatcatggatacgctgccgggtctt1380gtgatggcccaggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaac1440atccactctattcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaag1500atggccctgtacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaag1560gccggcatttggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaacc1620ctgttcctggtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacatt1680agggatttccagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgc1740ctgcattactccggatccattaacgcctggtcaaccaaggagccattctcctggatcaag1800gtggaccttctggcccccatgattatccacggaattaagacccagggggcccggcagaag1860ttctcctcactgtacatcagccagttcataatcatgtactccctggacggaaagaagtgg1920caaacctacagggggaacagcaccggcacactgatggtctttttcggaaatgtggactcc1980tccgggattaagcataacatcttcaaccctccgattatcgctcggtacattagacttcac2040cctacccactacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaac2100tcgtgcagcatgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcc2160tcgtcctactttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctc2220cagggaagatccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtg2280gacttccagaaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctg2340acttctatgtacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggacc2400ctgttcttccaaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccg2460gtggtgaactcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcc2520tgggtgcaccagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtac2580tga2583<210>13<211>1734<212>dna<213>人工序列<220><223>cofviii-26-nt58<400>13gccaccaggagatactacctgggcgccgtggagctgagctgggactacatgcagtctgac60ctgggcgagctgccagtggacgccaggttcccccccagagtgcccaagagcttccccttc120aacaccagcgtggtgtacaagaagaccctgttcgtggagttcactgaccacctgttcaac180atcgccaagcccaggcccccctggatgggcctgctgggccccaccatccaggccgaggtg240tacgacaccgtggtcatcaccctgaagaacatggccagccaccccgtctccctgcacgcc300gtgggggtgagctactggaaggcctctgagggcgccgagtacgacgaccagaccagccag360agggagaaggaggacgacaaggtgttccctgggggcagccacacctacgtgtggcaggtc420ctgaaggagaacggccccatggcctctgaccccctgtgcctgacctacagctacctgagc480cacgtggacctggtgaaggacctgaactctggcctgattggggccctgctggtgtgcagg540gagggcagcctggccaaggagaagacccagaccctgcacaagttcatcctgctgttcgcc600gtgttcgacgagggcaagagctggcactctgaaaccaagaacagcctgatgcaggacagg660gacgccgcctctgccagggcctggcccaagatgcacaccgtcaacggctacgtcaacagg720agcctgcctggcctgattggctgccacaggaagagcgtgtactggcatgtgatcggcatg780ggcaccacccctgaggtgcacagcatcttcctggagggccacaccttcctggtcaggaac840cacaggcaggccagcctggagatcagccccatcaccttcctgaccgcccagaccctgctg900atggacctgggccagttcctgctgttctgccacatctccagccaccagcacgacggcatg960gaggcctacgtgaaagtggacagctgccctgaggagccccagctgaggatgaagaacaac1020gaggaggccgaggactatgatgacgacctgaccgacagcgagatggacgtggtcaggttc1080gacgacgacaacagccccagcttcatccagatcaggagcgtggccaagaagcaccccaag1140acctgggtgcactacatcgctgctgaggaggaggactgggactatgcccccctggtgctg1200gcccctgatgacaggagctacaagagccagtacctgaacaatggcccccagaggattggc1260aggaagtacaagaaagtcaggttcatggcctacactgatgaaaccttcaagaccagggag1320gccatccagcatgagtctggcatcctgggccccctgctgtacggggaggtgggggacacc1380ctgctgatcatcttcaagaaccaggccagcaggccctacaacatctacccccatggcatc1440accgacgtgaggcccctgtacagcaggaggctgcctaagggggtgaagcacctgaaagac1500ttccccatcctgcctggggagatcttcaagtacaagtggactgtgactgtggaggacggc1560cccaccaagagcgaccccaggtgcctgaccagatactacagcagcttcgtcaacatggag1620agggacctggcctctggcctgattggccccctgctgatctgctacaaggagtctgtggac1680cagaggggcaaccagatcatgagcgacaagaggaacgtgatcctgttctctgtc1734<210>14<211>2583<212>dna<213>人工序列<220><223>cofviii-26-ct<400>14ttcgacgagaacaggagctggtacctcactgaaaacatccagaggttcctcccaaacccc60gcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaac120ggttacgtgttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtac180attctgtccatcggcgcccagactgacttcctgagcgtgttcttttccggttacaccttt240aagcacaagatggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtg300ttcatgtcgatggagaacccgggtctgtggattctgggatgccacaacagcgactttcgg360aaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactac420tacgaggactcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgag480ccgcgcagcttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccgg540accaccctccaatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatg600aagaaggaagatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaa660aagaaaactagacactactttatcgccgcggtggaaagactgtgggactatggaatgtca720tccagccctcacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaa780gtggtgttccaggagttcaccgacggcagcttcacccagccgctgtaccggggagaactg840aacgaacacctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatg900gtgaccttccgtaaccaagcatccagaccttactccttctattcctccctgatctcatac960gaggaggaccagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagact1020aagacctacttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgc1080aaggcctgggcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatc1140gggccgctgctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcacc1200gtccaggagtttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcacc1260gagaatatggagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttc1320aaggagaactatagattccacgccatcaacgggtacatcatggatactctgccggggctg1380gtcatggcccaggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaac1440attcactccattcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaag1500atggcgctgtacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaag1560gccggcatctggagagtggagtgcctgatcggagagcacctccacgcggggatgtccacc1620ctcttcctggtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatc1680agagacttccagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgc1740ttgcactactccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaag1800gtggacctcctggcccctatgattatccacggaattaagacccagggcgccaggcagaag1860ttctcctccctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtgg1920cagacttacaggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcc1980tccggcattaagcacaacatcttcaacccaccgatcatagccagatatattaggctccac2040cccactcactactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaac2100tcctgctccatgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcg2160agctcctacttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttg2220cagggacggtcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtg2280gatttccaaaagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctg2340acctcgatgtatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggacc2400ctgttcttccaaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacaccc2460gtggtgaactccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcc2520tgggtccatcagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtac2580tga2583<210>15<211>2332<212>prt<213>人(homosapiens)<400>15alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnserarghisproserthrarg740745750glnlysglnpheasnalathrthrileprogluasnaspileglulys755760765thraspprotrpphealahisargthrprometprolysileglnasn770775780valserserseraspleuleumetleuleuargglnserprothrpro785790795800hisglyleuserleuseraspleuglnglualalystyrgluthrphe805810815seraspaspproserproglyalaileaspserasnasnserleuser820825830glumetthrhispheargproglnleuhishisserglyaspmetval835840845phethrprogluserglyleuglnleuargleuasnglulysleugly850855860thrthralaalathrgluleulyslysleuaspphelysvalserser865870875880thrserasnasnleuileserthrileproseraspasnleualaala885890895glythraspasnthrserserleuglyproprosermetprovalhis900905910tyraspserglnleuaspthrthrleupheglylyslysserserpro915920925leuthrgluserglyglyproleuserleuserglugluasnasnasp930935940serlysleuleugluserglyleumetasnserglnglusersertrp945950955960glylysasnvalserserthrgluserglyargleuphelysglylys965970975argalahisglyproalaleuleuthrlysaspasnalaleuphelys980985990valserileserleuleulysthrasnlysthrserasnasnserala99510001005thrasnarglysthrhisileaspglyproserleuleuileglu101010151020asnserproservaltrpglnasnileleugluseraspthrglu102510301035phelyslysvalthrproleuilehisaspargmetleumetasp104010451050lysasnalathralaleuargleuasnhismetserasnlysthr105510601065thrserserlysasnmetglumetvalglnglnlyslysglugly107010751080proileproproaspalaglnasnproaspmetserphephelys108510901095metleupheleuprogluseralaargtrpileglnargthrhis110011051110glylysasnserleuasnserglyglnglyproserprolysgln111511201125leuvalserleuglyproglulysservalgluglyglnasnphe113011351140leuserglulysasnlysvalvalvalglylysglygluphethr114511501155lysaspvalglyleulysglumetvalpheproserserargasn116011651170leupheleuthrasnleuaspasnleuhisgluasnasnthrhis117511801185asnglnglulyslysileglnglugluileglulyslysgluthr119011951200leuileglngluasnvalvalleuproglnilehisthrvalthr120512101215glythrlysasnphemetlysasnleupheleuleuserthrarg122012251230glnasnvalgluglysertyraspglyalatyralaprovalleu123512401245glnasppheargserleuasnaspserthrasnargthrlyslys125012551260histhralahispheserlyslysglygluglugluasnleuglu126512701275glyleuglyasnglnthrlysglnilevalglulystyralacys128012851290thrthrargileserproasnthrserglnglnasnphevalthr129513001305glnargserlysargalaleulysglnpheargleuproleuglu131013151320gluthrgluleuglulysargileilevalaspaspthrserthr132513301335glntrpserlysasnmetlyshisleuthrproserthrleuthr134013451350glnileasptyrasnglulysglulysglyalailethrglnser135513601365proleuseraspcysleuthrargserhisserileproglnala137013751380asnargserproleuproilealalysvalserserpheproser138513901395ileargproiletyrleuthrargvalleupheglnaspasnser140014051410serhisleuproalaalasertyrarglyslysaspserglyval141514201425glngluserserhispheleuglnglyalalyslysasnasnleu143014351440serleualaileleuthrleuglumetthrglyaspglnargglu144514501455valglyserleuglythrseralathrasnservalthrtyrlys146014651470lysvalgluasnthrvalleuprolysproaspleuprolysthr147514801485serglylysvalgluleuleuprolysvalhisiletyrglnlys149014951500aspleupheprothrgluthrserasnglyserproglyhisleu150515101515aspleuvalgluglyserleuleuglnglythrgluglyalaile152015251530lystrpasnglualaasnargproglylysvalpropheleuarg153515401545valalathrgluserseralalysthrproserlysleuleuasp155015551560proleualatrpaspasnhistyrglythrglnileprolysglu156515701575glutrplysserglnglulysserproglulysthralaphelys158015851590lyslysaspthrileleuserleuasnalacysgluserasnhis159516001605alailealaalaileasngluglyglnasnlysprogluileglu161016151620valthrtrpalalysglnglyargthrgluargleucyssergln162516301635asnproprovalleulysarghisglnarggluilethrargthr164016451650thrleuglnseraspglnglugluileasptyraspaspthrile165516601665servalglumetlyslysgluasppheaspiletyraspgluasp167016751680gluasnglnserproargserpheglnlyslysthrarghistyr168516901695pheilealaalavalgluargleutrpasptyrglymetserser170017051710serprohisvalleuargasnargalaglnserglyservalpro171517201725glnphelyslysvalvalpheglngluphethraspglyserphe173017351740thrglnproleutyrargglygluleuasngluhisleuglyleu174517501755leuglyprotyrileargalagluvalgluaspasnilemetval176017651770thrpheargasnglnalaserargprotyrserphetyrserser177517801785leuilesertyrglugluaspglnargglnglyalagluproarg179017951800lysasnphevallysproasngluthrlysthrtyrphetrplys180518101815valglnhishismetalaprothrlysaspglupheaspcyslys182018251830alatrpalatyrpheseraspvalaspleuglulysaspvalhis183518401845serglyleuileglyproleuleuvalcyshisthrasnthrleu185018551860asnproalahisglyargglnvalthrvalglngluphealaleu186518701875phephethrilepheaspgluthrlyssertrptyrphethrglu188018851890asnmetgluargasncysargalaprocysasnileglnmetglu189519001905aspprothrphelysgluasntyrargphehisalaileasngly191019151920tyrilemetaspthrleuproglyleuvalmetalaglnaspgln192519301935argileargtrptyrleuleusermetglyserasngluasnile194019451950hisserilehispheserglyhisvalphethrvalarglyslys195519601965gluglutyrlysmetalaleutyrasnleutyrproglyvalphe197019751980gluthrvalglumetleuproserlysalaglyiletrpargval198519901995glucysleuileglygluhisleuhisalaglymetserthrleu200020052010pheleuvaltyrserasnlyscysglnthrproleuglymetala201520202025serglyhisileargasppheglnilethralaserglyglntyr203020352040glyglntrpalaprolysleualaargleuhistyrserglyser204520502055ileasnalatrpserthrlysgluprophesertrpilelysval206020652070aspleuleualaprometileilehisglyilelysthrglngly207520802085alaargglnlyspheserserleutyrileserglnpheileile209020952100mettyrserleuaspglylyslystrpglnthrtyrargglyasn210521102115serthrglythrleumetvalphepheglyasnvalaspserser212021252130glyilelyshisasnilepheasnproproileilealaargtyr213521402145ileargleuhisprothrhistyrserileargserthrleuarg215021552160metgluleumetglycysaspleuasnsercyssermetproleu216521702175glymetgluserlysalaileseraspalaglnilethralaser218021852190sertyrphethrasnmetphealathrtrpserproserlysala219522002205argleuhisleuglnglyargserasnalatrpargproglnval221022152220asnasnprolysglutrpleuglnvalasppheglnlysthrmet222522302235lysvalthrglyvalthrthrglnglyvallysserleuleuthr224022452250sermettyrvallysglupheleuileserserserglnaspgly225522602265hisglntrpthrleuphepheglnasnglylysvallysvalphe227022752280glnglyasnglnaspserphethrprovalvalasnserleuasp228522902295proproleuleuthrargtyrleuargilehisproglnsertrp230023052310valhisglnilealaleuargmetgluvalleuglycysgluala231523202325glnaspleutyr2330<210>16<211>4371<212>dna<213>人工序列<220><223>bdd-fviii(未优化;“亲代”),核苷酸序列<400>16atgcaaatagagctctccacctgcttctttctgtgccttttgcgattctgctttagtgcc60accagaagatactacctgggtgcagtggaactgtcatgggactatatgcaaagtgatctc120ggtgagctgcctgtggacgcaagatttcctcctagagtgccaaaatcttttccattcaac180acctcagtcgtgtacaaaaagactctgtttgtagaattcacggatcaccttttcaacatc240gctaagccaaggccaccctggatgggtctgctaggtcctaccatccaggctgaggtttat300gatacagtggtcattacacttaagaacatggcttcccatcctgtcagtcttcatgctgtt360ggtgtatcctactggaaagcttctgagggagctgaatatgatgatcagaccagtcaaagg420gagaaagaagatgataaagtcttccctggtggaagccatacatatgtctggcaggtcctg480aaagagaatggtccaatggcctctgacccactgtgccttacctactcatatctttctcat540gtggacctggtaaaagacttgaattcaggcctcattggagccctactagtatgtagagaa600gggagtctggccaaggaaaagacacagaccttgcacaaatttatactactttttgctgta660tttgatgaagggaaaagttggcactcagaaacaaagaactccttgatgcaggatagggat720gctgcatctgctcgggcctggcctaaaatgcacacagtcaatggttatgtaaacaggtct780ctgccaggtctgattggatgccacaggaaatcagtctattggcatgtgattggaatgggc840accactcctgaagtgcactcaatattcctcgaaggtcacacatttcttgtgaggaaccat900cgccaggcgtccttggaaatctcgccaataactttccttactgctcaaacactcttgatg960gaccttggacagtttctactgttttgtcatatctcttcccaccaacatgatggcatggaa1020gcttatgtcaaagtagacagctgtccagaggaaccccaactacgaatgaaaaataatgaa1080gaagcggaagactatgatgatgatcttactgattctgaaatggatgtggtcaggtttgat1140gatgacaactctccttcctttatccaaattcgctcagttgccaagaagcatcctaaaact1200tgggtacattacattgctgctgaagaggaggactgggactatgctcccttagtcctcgcc1260cccgatgacagaagttataaaagtcaatatttgaacaatggccctcagcggattggtagg1320aagtacaaaaaagtccgatttatggcatacacagatgaaacctttaagactcgtgaagct1380attcagcatgaatcaggaatcttgggacctttactttatggggaagttggagacacactg1440ttgattatatttaagaatcaagcaagcagaccatataacatctaccctcacggaatcact1500gatgtccgtcctttgtattcaaggagattaccaaaaggtgtaaaacatttgaaggatttt1560ccaattctgccaggagaaatattcaaatataaatggacagtgactgtagaagatgggcca1620actaaatcagatcctcggtgcctgacccgctattactctagtttcgttaatatggagaga1680gatctagcttcaggactcattggccctctcctcatctgctacaaagaatctgtagatcaa1740agaggaaaccagataatgtcagacaagaggaatgtcatcctgttttctgtatttgatgag1800aaccgaagctggtacctcacagagaatatacaacgctttctccccaatccagctggagtg1860cagcttgaggatccagagttccaagcctccaacatcatgcacagcatcaatggctatgtt1920tttgatagtttgcagttgtcagtttgtttgcatgaggtggcatactggtacattctaagc1980attggagcacagactgacttcctttctgtcttcttctctggatataccttcaaacacaaa2040atggtctatgaagacacactcaccctattcccattctcaggagaaactgtcttcatgtcg2100atggaaaacccaggtctatggattctggggtgccacaactcagactttcggaacagaggc2160atgaccgccttactgaaggtttctagttgtgacaagaacactggtgattattacgaggac2220agttatgaagatatttcagcatacttgctgagtaaaaacaatgccattgaaccaagaagc2280ttctctcaaaacccaccagtcttgaaacgccatcaacgggaaataactcgtactactctt2340cagtcagatcaagaggaaattgactatgatgataccatatcagttgaaatgaagaaggaa2400gattttgacatttatgatgaggatgaaaatcagagcccccgcagctttcaaaagaaaaca2460cgacactattttattgctgcagtggagaggctctgggattatgggatgagtagctcccca2520catgttctaagaaacagggctcagagtggcagtgtccctcagttcaagaaagttgttttc2580caggaatttactgatggctcctttactcagcccttataccgtggagaactaaatgaacat2640ttgggactcctggggccatatataagagcagaagttgaagataatatcatggtaactttc2700agaaatcaggcctctcgtccctattccttctattctagccttatttcttatgaggaagat2760cagaggcaaggagcagaacctagaaaaaactttgtcaagcctaatgaaaccaaaacttac2820ttttggaaagtgcaacatcatatggcacccactaaagatgagtttgactgcaaagcctgg2880gcttatttctctgatgttgacctggaaaaagatgtgcactcaggcctgattggacccctt2940ctggtctgccacactaacacactgaaccctgctcatgggagacaagtgacagtacaggaa3000tttgctctgtttttcaccatctttgatgagaccaaaagctggtacttcactgaaaatatg3060gaaagaaactgcagggctccctgcaatatccagatggaagatcccacttttaaagagaat3120tatcgcttccatgcaatcaatggctacataatggatacactacctggcttagtaatggct3180caggatcaaaggattcgatggtatctgctcagcatgggcagcaatgaaaacatccattct3240attcatttcagtggacatgtgttcactgtacgaaaaaaagaggagtataaaatggcactg3300tacaatctctatccaggtgtttttgagacagtggaaatgttaccatccaaagctggaatt3360tggcgggtggaatgccttattggcgagcatctacatgctgggatgagcacactttttctg3420gtgtacagcaataagtgtcagactcccctgggaatggcttctggacacattagagatttt3480cagattacagcttcaggacaatatggacagtgggccccaaagctggccagacttcattat3540tccggatcaatcaatgcctggagcaccaaggagcccttttcttggatcaaggtggatctg3600ttggcaccaatgattattcacggcatcaagacccagggtgcccgtcagaagttctccagc3660ctctacatctctcagtttatcatcatgtatagtcttgatgggaagaagtggcagacttat3720cgaggaaattccactggaaccttaatggtcttctttggcaatgtggattcatctgggata3780aaacacaatatttttaaccctccaattattgctcgatacatccgtttgcacccaactcat3840tatagcattcgcagcactcttcgcatggagttgatgggctgtgatttaaatagttgcagc3900atgccattgggaatggagagtaaagcaatatcagatgcacagattactgcttcatcctac3960tttaccaatatgtttgccacctggtctccttcaaaagctcgacttcacctccaagggagg4020agtaatgcctggagacctcaggtgaataatccaaaagagtggctgcaagtggacttccag4080aagacaatgaaagtcacaggagtaactactcagggagtaaaatctctgcttaccagcatg4140tatgtgaaggagttcctcatctccagcagtcaagatggccatcagtggactctctttttt4200cagaatggcaaagtaaaggtttttcagggaaatcaagactccttcacacctgtggtgaac4260tctctagacccaccgttactgactcgctaccttcgaattcacccccagagttgggtgcac4320cagattgccctgaggatggaggttctgggctgcgaggcacaggacctctac4371<210>17<211>1438<212>prt<213>人工序列<220><223>bdd-fviii(未优化;“亲代”),氨基酸序列<400>17alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnproprovalleulysarghis740745750glnarggluilethrargthrthrleuglnseraspglnglugluile755760765asptyraspaspthrileservalglumetlyslysgluasppheasp770775780iletyraspgluaspgluasnglnserproargserpheglnlyslys785790795800thrarghistyrpheilealaalavalgluargleutrpasptyrgly805810815metserserserprohisvalleuargasnargalaglnserglyser820825830valproglnphelyslysvalvalpheglngluphethraspglyser835840845phethrglnproleutyrargglygluleuasngluhisleuglyleu850855860leuglyprotyrileargalagluvalgluaspasnilemetvalthr865870875880pheargasnglnalaserargprotyrserphetyrserserleuile885890895sertyrglugluaspglnargglnglyalagluproarglysasnphe900905910vallysproasngluthrlysthrtyrphetrplysvalglnhishis915920925metalaprothrlysaspglupheaspcyslysalatrpalatyrphe930935940seraspvalaspleuglulysaspvalhisserglyleuileglypro945950955960leuleuvalcyshisthrasnthrleuasnproalahisglyarggln965970975valthrvalglngluphealaleuphephethrilepheaspgluthr980985990lyssertrptyrphethrgluasnmetgluargasncysargalapro99510001005cysasnileglnmetgluaspprothrphelysgluasntyrarg101010151020phehisalaileasnglytyrilemetaspthrleuproglyleu102510301035valmetalaglnaspglnargileargtrptyrleuleusermet104010451050glyserasngluasnilehisserilehispheserglyhisval105510601065phethrvalarglyslysgluglutyrlysmetalaleutyrasn107010751080leutyrproglyvalphegluthrvalglumetleuproserlys108510901095alaglyiletrpargvalglucysleuileglygluhisleuhis110011051110alaglymetserthrleupheleuvaltyrserasnlyscysgln111511201125thrproleuglymetalaserglyhisileargasppheglnile113011351140thralaserglyglntyrglyglntrpalaprolysleualaarg114511501155leuhistyrserglyserileasnalatrpserthrlysglupro116011651170phesertrpilelysvalaspleuleualaprometileilehis117511801185glyilelysthrglnglyalaargglnlyspheserserleutyr119011951200ileserglnpheileilemettyrserleuaspglylyslystrp120512101215glnthrtyrargglyasnserthrglythrleumetvalphephe122012251230glyasnvalaspserserglyilelyshisasnilepheasnpro123512401245proileilealaargtyrileargleuhisprothrhistyrser125012551260ileargserthrleuargmetgluleumetglycysaspleuasn126512701275sercyssermetproleuglymetgluserlysalaileserasp128012851290alaglnilethralasersertyrphethrasnmetphealathr129513001305trpserproserlysalaargleuhisleuglnglyargserasn131013151320alatrpargproglnvalasnasnprolysglutrpleuglnval132513301335asppheglnlysthrmetlysvalthrglyvalthrthrglngly134013451350vallysserleuleuthrsermettyrvallysglupheleuile135513601365serserserglnaspglyhisglntrpthrleuphepheglnasn137013751380glylysvallysvalpheglnglyasnglnaspserphethrpro138513901395valvalasnserleuaspproproleuleuthrargtyrleuarg140014051410ilehisproglnsertrpvalhisglnilealaleuargmetglu141514201425valleuglycysglualaglnaspleutyr14301435<210>18<211>450<212>dna<213>人工序列<220><223>xten核苷酸序列<400>18ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>19<211>4824<212>dna<213>人工序列<220><223>cofviii-52-xten<400>19atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgaccgagaacatccagaggttcctgcccaaccctgctggggtg1860cagctggaggaccccgagttccaggccagcaacatcatgcacagcatcaatggctacgtg1920ttcgacagcctgcagctgagcgtgtgcctgcacgaggtggcctactggtacatcctgagc1980atcggcgcccagaccgacttcctgagcgtgttcttctctggctacaccttcaagcacaag2040atggtgtatgaggacaccctgaccctgttccccttcagcggggagactgtcttcatgagc2100atggagaaccctggcctgtggatcctgggctgccacaacagcgacttcaggaacaggggc2160atgactgccctgctgaaagtctccagctgtgacaagaacaccggggactactacgaggac2220agctacgaggacatcagcgcctacctgctgagcaagaacaatgccatcgagcccaggagc2280ttctctcagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagccccccagtgctgaagagg2760caccagagggagatcaccaggaccaccctgcagtctgaccaggaggagatcgactatgat2820gacaccatcagcgtggagatgaagaaggaggacttcgacatctacgacgaggacgagaac2880cagagccccaggagcttccagaagaagaccaggcactacttcattgctgctgtggagagg2940ctgtgggactatggcatgtccagcagcccccatgtgctgaggaacagggcccagtctggc3000agcgtgccccagttcaagaaagtcgtgttccaggagttcaccgacggcagcttcacccag3060cccctgtacagaggggagctgaacgagcacctgggcctgctgggcccctacatcagggcc3120gaggtggaggacaacatcatggtgaccttcaggaaccaggccagcaggccctacagcttc3180tacagcagcctgatcagctacgaggaggaccagaggcagggggctgagcccaggaagaac3240tttgtgaagcccaatgaaaccaagacctacttctggaaggtgcagcaccacatggccccc3300accaaggacgagttcgactgcaaggcctgggcctacttctctgacgtggacctggagaag3360gacgtgcactctggcctgattggccccctgctggtgtgccacaccaacaccctgaaccct3420gcccatggcaggcaggtgactgtgcaggagttcgccctgttcttcaccatcttcgatgaa3480accaagagctggtacttcactgagaacatggagaggaactgcagggccccctgcaacatc3540cagatggaggaccccaccttcaaggagaactacaggttccatgccatcaatggctacatc3600atggacaccctgcctggcctggtcatggcccaggaccagaggatcaggtggtatctgctg3660agcatgggcagcaacgagaacatccacagcatccacttctctggccacgtgttcactgtg3720aggaagaaggaggagtacaagatggccctgtacaacctgtaccctggggtgttcgaaacc3780gtggagatgctgcccagcaaggccggcatctggagggtggagtgcctgattggggagcac3840ctgcacgccggcatgagcaccctgttcctggtgtacagcaacaagtgccagacccccctg3900ggcatggcctctggccacatcagggacttccagatcactgcctctggccagtacggccag3960tgggcccccaagctggccaggctgcactactccggaagcatcaatgcctggagcaccaag4020gagcccttcagctggatcaaagtggacctgctggcccccatgatcatccacggcatcaag4080acccagggggccaggcagaagttctccagcctgtacatcagccagttcatcatcatgtac4140agcctggacggcaagaagtggcagacctacaggggcaacagcaccggcaccctgatggtg4200ttcttcggcaacgtggacagcagcggcatcaagcacaacatcttcaacccccccatcatc4260gccagatacatcaggctgcaccccacccactacagcatcaggagcaccctgaggatggag4320ctgatgggctgtgacctgaacagctgcagcatgcccctgggcatggagagcaaggccatc4380tctgacgcccagatcactgcctccagctacttcaccaacatgtttgccacctggagcccc4440agcaaggccaggctgcacctgcagggcaggagcaatgcctggaggccccaggtcaacaac4500cccaaggagtggctgcaggtggacttccagaagaccatgaaggtgactggggtgaccacc4560cagggggtgaagagcctgctgaccagcatgtacgtgaaggagttcctgatctccagcagc4620caggacggccaccagtggaccctgttcttccagaatggcaaggtgaaggtgttccagggc4680aaccaggacagcttcacccctgtggtcaacagcctggacccccccctgctgaccagatac4740ctgaggatccacccccagagctgggtgcaccagatcgccctgaggatggaggtgctgggc4800tgtgaggcccaggacctgtactga4824<210>20<211>4824<212>dna<213>人工序列<220><223>cofviii-1-xten<400>20atgcagattgagctgtctacttgctttttcctgtgcctgctgaggttttgcttttccgct60acacgaaggtattatctgggggctgtggaactgtcttgggattacatgcagagtgacctg120ggagagctgccagtggacgcaaggtttccccctagagtccctaagtcattccccttcaac180actagcgtggtctacaagaaaacactgttcgtggagtttactgatcacctgttcaacatc240gcaaagcctaggccaccctggatgggactgctggggccaacaatccaggccgaggtgtac300gacaccgtggtcattacacttaagaacatggcctcacaccccgtgagcctgcatgctgtg360ggcgtcagctactggaaggcttccgaaggagcagagtatgacgatcagacttcccagaga420gaaaaagaggacgataaggtgtttcctggcggatctcatacctacgtgtggcaggtcctg480aaagagaatggccctatggcctccgaccctctgtgcctgacctactcttatctgagtcac540gtggacctggtcaaggatctgaacagcggcctgatcggagccctgctggtgtgcagggaa600ggaagcctggctaaggagaaaacccagacactgcataagttcattctgctgttcgccgtg660tttgacgaagggaaatcatggcacagcgagacaaagaatagtctgatgcaggacagggat720gccgcttcagccagagcttggcccaaaatgcacactgtgaacggctacgtcaatcgctca780ctgcctgggctgatcggctgccaccgaaagagcgtgtattggcatgtcatcgggatgggc840accacacctgaagtgcactccattttcctggagggacatacctttctggtccgcaaccac900cgacaggcttccctggagatctctccaattaccttcctgacagcacagactctgctgatg960gacctggggcagttcctgctgttttgccacatcagctcccaccagcatgatggcatggag1020gcttacgtgaaagtggactcttgtcccgaggaacctcagctgcggatgaagaacaatgag1080gaagcagaagactatgacgatgacctgaccgactccgagatggatgtggtccgattcgat1140gacgataacagcccctcctttatccagattagatctgtggccaagaaacaccctaagaca1200tgggtccattacatcgcagccgaggaagaggactgggattatgcaccactggtgctggca1260ccagacgatcgctcctacaaatctcagtatctgaacaatgggccacagaggattggcaga1320aagtacaagaaagtgcggttcatggcatataccgatgagaccttcaagactcgcgaagcc1380atccagcacgagagcggcatcctgggaccactgctgtacggagaagtgggagacaccctg1440ctgatcattttcaagaaccaggccagccggccttacaatatctatccacatgggattaca1500gatgtgcgccctctgtacagcaggagactgccaaagggcgtcaaacacctgaaggacttc1560ccaatcctgcccggagaaatcttcaagtacaagtggactgtcaccgtcgaggatggcccc1620actaagagcgaccctcggtgcctgacccgctactattctagtttcgtgaatatggaaaga1680gatctggcaagcggactgatcggaccactgctgatttgttacaaagagagcgtggatcag1740agaggcaaccagatcatgtccgacaagcggaatgtgattctgttcagtgtctttgacgaa1800aacaggtcatggtacctgaccgagaacatccagagattcctgcctaatccagctggggtg1860cagctggaagatcctgagtttcaggcatctaacatcatgcatagtattaatggctacgtg1920ttcgacagtttgcagctgagcgtgtgcctgcacgaggtcgcttactggtatatcctgagc1980attggggcacagacagatttcctgagcgtgttcttttccggctacacttttaagcataaa2040atggtctatgaggacacactgactctgttccccttcagcggcgaaaccgtgtttatgagc2100atggagaatcccggactgtggattctggggtgccacaacagcgatttcagaaatcgcgga2160atgactgccctgctgaaagtgtcaagctgtgacaagaacaccggggactactatgaagat2220tcatacgaggacatcagcgcatatctgctgtccaaaaacaatgccattgaaccccggtct2280tttagtcagaatggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagccctccagtgctgaagcgg2760caccagcgcgagatcacccgcactaccctgcagagtgatcaggaagagatcgactacgac2820gatacaatttctgtggaaatgaagaaagaggacttcgatatctatgacgaagatgagaac2880cagagtcctcgatcattccagaagaaaaccaggcattactttattgccgcagtggagcgg2940ctgtgggattatggcatgtcctctagtcctcacgtgctgcgaaatagggcccagtcagga3000agcgtcccacagttcaagaaagtggtcttccaggagtttacagacgggtcctttactcag3060ccactgtacaggggcgaactgaacgagcacctgggactgctggggccctatatcagagca3120gaagtggaggataacattatggtcaccttcagaaatcaggcctctcggccttacagtttt3180tattcaagcctgatctcttacgaagaggaccagcgacagggagctgaaccacgaaaaaac3240ttcgtgaagcctaatgagaccaaaacatacttttggaaggtgcagcaccatatggcccca3300acaaaagacgagttcgattgcaaggcatgggcctatttttctgacgtggatctggagaag3360gacgtgcacagtggcctgattggcccactgctggtgtgccatactaacaccctgaatcca3420gcccacggccggcaggtcactgtccaggagttcgctctgttctttaccatctttgatgag3480acaaagagctggtacttcaccgaaaacatggagcgaaattgcagggctccatgtaacatt3540cagatggaagaccccacattcaaggagaactaccgctttcatgctatcaatggatacatc3600atggatactctgcccgggctggtcatggcacaggaccagagaatccggtggtatctgctg3660agcatgggcagcaacgagaatatccactcaattcatttcagcgggcacgtgtttactgtc3720aggaagaaagaagagtacaagatggccctgtacaacctgtatcccggcgtgttcgaaacc3780gtcgagatgctgcctagcaaggccggaatctggagagtggaatgcctgattggagagcac3840ctgcatgctgggatgtctaccctgtttctggtgtacagtaataagtgtcagacacccctg3900ggaatggcatccgggcatatcagggatttccagattaccgcatctggacagtacggacag3960tgggcacctaagctggctagactgcactattccggatctatcaacgcttggtccacaaaa4020gagcctttctcttggattaaggtggacctgctggccccaatgatcattcatggcatcaaa4080actcagggagctcggcagaagttctcctctctgtacatctcacagtttatcatcatgtac4140agcctggatgggaagaaatggcagacataccgcggcaatagcacaggaactctgatggtg4200ttctttggcaacgtggacagcagcggaatcaagcacaacattttcaatccccctatcatt4260gctagatacatccggctgcacccaacccattattctattcgaagtacactgaggatggaa4320ctgatgggatgcgatctgaacagttgttcaatgcccctggggatggagtccaaggcaatc4380tctgacgcccagattaccgccagctcctacttcactaatatgtttgctacctggagccct4440tccaaagcaagactgcacctgcaaggccgcagcaacgcatggcgaccacaggtgaacaat4500cccaaggagtggttgcaggtcgattttcagaaaactatgaaggtgaccggggtcacaact4560cagggcgtgaaaagtctgctgacctcaatgtacgtcaaggagttcctgatctctagttca4620caggacggacatcagtggacactgttctttcagaacgggaaggtgaaagtcttccagggc4680aatcaggattcctttacacctgtggtcaacagtctagaccctccactgctgaccagatac4740ctgagaatccaccctcagtcctgggtgcaccagattgccctgagaatggaagtgctggga4800tgcgaggcccaggatctgtactga4824<210>21<211>6<212>dna<213>人工序列<220><223>mar/ars<400>21atattt6<210>22<211>6<212>dna<213>人工序列<220><223>mar/ars<400>22aaatat6<210>23<211>5<212>dna<213>人工序列<220><223>去稳定组件<400>23attta5<210>24<211>5<212>dna<213>人工序列<220><223>去稳定组件<400>24taaat5<210>25<211>6<212>dna<213>人工序列<220><223>多聚t位点<400>25tttttt6<210>26<211>7<212>dna<213>人工序列<220><223>多聚a位点<400>26aaaaaaa7<210>27<211>6<212>dna<213>人工序列<220><223>剪接位点<400>27ggtgat6<210>28<211>5<212>dna<213>人工序列<220><223>tata盒<400>28tataa5<210>29<211>5<212>dna<213>人工序列<220><223>tata盒<400>29ttata5<210>30<211>8<212>dna<213>人工序列<220><223>富含au的序列组件<400>30attttatt8<210>31<211>8<212>dna<213>人工序列<220><223>富含au的序列组件<400>31atttttaa8<210>32<211>13<212>dna<213>人工序列<220><223>kozak共有序列<400>32gccgccaccatgc13<210>33<211>32<212>prt<213>人工序列<220><223>ctp肽<400>33aspproargpheglnaspserserserserlysalaproproproser151015leuproserproserargleuproglyproseraspthrproileleu202530<210>34<211>28<212>prt<213>人工序列<220><223>ctp肽<400>34serserserserlysalaproproproserleuproserproserarg151015leuproglyproseraspthrproileleuprogln2025<210>35<211>11<212>prt<213>人工序列<220><223>白蛋白结合肽核心序列<400>35aspilecysleuproargtrpglycysleutrp1510<210>36<211>20<212>prt<213>人工序列<220><223>pas序列<400>36alaserproalaalaproalaproalaserproalaalaproalapro151015seralaproala20<210>37<211>20<212>prt<213>人工序列<220><223>pas序列<400>37alaalaproalaserproalaproalaalaproseralaproalapro151015alaalaproser20<210>38<211>20<212>prt<213>人工序列<220><223>pas序列<400>38alaproserserproserproseralaproserserproserproala151015serproserser20<210>39<211>19<212>prt<213>人工序列<220><223>pas序列<400>39alaproserserproserproseralaproserserproserproala151015serproser<210>40<211>20<212>prt<213>人工序列<220><223>pas序列<400>40serserproseralaproserproserserproalaserproserpro151015serserproala20<210>41<211>24<212>prt<213>人工序列<220><223>pas序列<400>41alaalaserproalaalaproseralaproproalaalaalaserpro151015alaalaproseralaproproala20<210>42<211>20<212>prt<213>人工序列<220><223>pas序列<400>42alaseralaalaalaproalaalaalaseralaalaalaseralapro151015seralaalaala20<210>43<211>23<212>dna<213>人工序列<220><223>mir142靶标<400>43tccataaagtaggaaacactaca23<210>44<211>2332<212>prt<213>人(homosapiens)<400>44alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargproleutyrserargargleuprolysglyvallys485490495hisleulysasppheproileleuproglygluilephelystyrlys500505510trpthrvalthrvalgluaspglyprothrlysseraspproargcys515520525leuthrargtyrtyrserserphevalasnmetgluargaspleuala530535540serglyleuileglyproleuleuilecystyrlysgluservalasp545550555560glnargglyasnglnilemetserasplysargasnvalileleuphe565570575servalpheaspgluasnargsertrptyrleuthrgluasnilegln580585590argpheleuproasnproalaglyvalglnleugluaspprogluphe595600605glnalaserasnilemethisserileasnglytyrvalpheaspser610615620leuglnleuservalcysleuhisgluvalalatyrtrptyrileleu625630635640serileglyalaglnthrasppheleuservalphepheserglytyr645650655thrphelyshislysmetvaltyrgluaspthrleuthrleuphepro660665670pheserglygluthrvalphemetsermetgluasnproglyleutrp675680685ileleuglycyshisasnserasppheargasnargglymetthrala690695700leuleulysvalsersercysasplysasnthrglyasptyrtyrglu705710715720aspsertyrgluaspileseralatyrleuleuserlysasnasnala725730735ilegluproargserpheserglnasnserarghisproserthrarg740745750glnlysglnpheasnalathrthrileprogluasnaspileglulys755760765thraspprotrpphealahisargthrprometprolysileglnasn770775780valserserseraspleuleumetleuleuargglnserprothrpro785790795800hisglyleuserleuseraspleuglnglualalystyrgluthrphe805810815seraspaspproserproglyalaileaspserasnasnserleuser820825830glumetthrhispheargproglnleuhishisserglyaspmetval835840845phethrprogluserglyleuglnleuargleuasnglulysleugly850855860thrthralaalathrgluleulyslysleuaspphelysvalserser865870875880thrserasnasnleuileserthrileproseraspasnleualaala885890895glythraspasnthrserserleuglyproprosermetprovalhis900905910tyraspserglnleuaspthrthrleupheglylyslysserserpro915920925leuthrgluserglyglyproleuserleuserglugluasnasnasp930935940serlysleuleugluserglyleumetasnserglnglusersertrp945950955960glylysasnvalserserthrgluserglyargleuphelysglylys965970975argalahisglyproalaleuleuthrlysaspasnalaleuphelys980985990valserileserleuleulysthrasnlysthrserasnasnserala99510001005thrasnarglysthrhisileaspglyproserleuleuileglu101010151020asnserproservaltrpglnasnileleugluseraspthrglu102510301035phelyslysvalthrproleuilehisaspargmetleumetasp104010451050lysasnalathralaleuargleuasnhismetserasnlysthr105510601065thrserserlysasnmetglumetvalglnglnlyslysglugly107010751080proileproproaspalaglnasnproaspmetserphephelys108510901095metleupheleuprogluseralaargtrpileglnargthrhis110011051110glylysasnserleuasnserglyglnglyproserprolysgln111511201125leuvalserleuglyproglulysservalgluglyglnasnphe113011351140leuserglulysasnlysvalvalvalglylysglygluphethr114511501155lysaspvalglyleulysglumetvalpheproserserargasn116011651170leupheleuthrasnleuaspasnleuhisgluasnasnthrhis117511801185asnglnglulyslysileglnglugluileglulyslysgluthr119011951200leuileglngluasnvalvalleuproglnilehisthrvalthr120512101215glythrlysasnphemetlysasnleupheleuleuserthrarg122012251230glnasnvalgluglysertyraspglyalatyralaprovalleu123512401245glnasppheargserleuasnaspserthrasnargthrlyslys125012551260histhralahispheserlyslysglygluglugluasnleuglu126512701275glyleuglyasnglnthrlysglnilevalglulystyralacys128012851290thrthrargileserproasnthrserglnglnasnphevalthr129513001305glnargserlysargalaleulysglnpheargleuproleuglu131013151320gluthrgluleuglulysargileilevalaspaspthrserthr132513301335glntrpserlysasnmetlyshisleuthrproserthrleuthr134013451350glnileasptyrasnglulysglulysglyalailethrglnser135513601365proleuseraspcysleuthrargserhisserileproglnala137013751380asnargserproleuproilealalysvalserserpheproser138513901395ileargproiletyrleuthrargvalleupheglnaspasnser140014051410serhisleuproalaalasertyrarglyslysaspserglyval141514201425glngluserserhispheleuglnglyalalyslysasnasnleu143014351440serleualaileleuthrleuglumetthrglyaspglnargglu144514501455valglyserleuglythrseralathrasnservalthrtyrlys146014651470lysvalgluasnthrvalleuprolysproaspleuprolysthr147514801485serglylysvalgluleuleuprolysvalhisiletyrglnlys149014951500aspleupheprothrgluthrserasnglyserproglyhisleu150515101515aspleuvalgluglyserleuleuglnglythrgluglyalaile152015251530lystrpasnglualaasnargproglylysvalpropheleuarg153515401545valalathrgluserseralalysthrproserlysleuleuasp155015551560proleualatrpaspasnhistyrglythrglnileprolysglu156515701575glutrplysserglnglulysserproglulysthralaphelys158015851590lyslysaspthrileleuserleuasnalacysgluserasnhis159516001605alailealaalaileasngluglyglnasnlysprogluileglu161016151620valthrtrpalalysglnglyargthrgluargleucyssergln162516301635asnproprovalleulysarghisglnarggluilethrargthr164016451650thrleuglnseraspglnglugluileasptyraspaspthrile165516601665servalglumetlyslysgluasppheaspiletyraspgluasp167016751680gluasnglnserproargserpheglnlyslysthrarghistyr168516901695pheilealaalavalgluargleutrpasptyrglymetserser170017051710serprohisvalleuargasnargalaglnserglyservalpro171517201725glnphelyslysvalvalpheglngluphethraspglyserphe173017351740thrglnproleutyrargglygluleuasngluhisleuglyleu174517501755leuglyprotyrileargalagluvalgluaspasnilemetval176017651770thrpheargasnglnalaserargprotyrserphetyrserser177517801785leuilesertyrglugluaspglnargglnglyalagluproarg179017951800lysasnphevallysproasngluthrlysthrtyrphetrplys180518101815valglnhishismetalaprothrlysaspglupheaspcyslys182018251830alatrpalatyrpheseraspvalaspleuglulysaspvalhis183518401845serglyleuileglyproleuleuvalcyshisthrasnthrleu185018551860asnproalahisglyargglnvalthrvalglngluphealaleu186518701875phephethrilepheaspgluthrlyssertrptyrphethrglu188018851890asnmetgluargasncysargalaprocysasnileglnmetglu189519001905aspprothrphelysgluasntyrargphehisalaileasngly191019151920tyrilemetaspthrleuproglyleuvalmetalaglnaspgln192519301935argileargtrptyrleuleusermetglyserasngluasnile194019451950hisserilehispheserglyhisvalphethrvalarglyslys195519601965gluglutyrlysmetalaleutyrasnleutyrproglyvalphe197019751980gluthrvalglumetleuproserlysalaglyiletrpargval198519901995glucysleuileglygluhisleuhisalaglymetserthrleu200020052010pheleuvaltyrserasnlyscysglnthrproleuglymetala201520202025serglyhisileargasppheglnilethralaserglyglntyr203020352040glyglntrpalaprolysleualaargleuhistyrserglyser204520502055ileasnalatrpserthrlysgluprophesertrpilelysval206020652070aspleuleualaprometileilehisglyilelysthrglngly207520802085alaargglnlyspheserserleutyrileserglnpheileile209020952100mettyrserleuaspglylyslystrpglnthrtyrargglyasn210521102115serthrglythrleumetvalphepheglyasnvalaspserser212021252130glyilelyshisasnilepheasnproproileilealaargtyr213521402145ileargleuhisprothrhistyrserileargserthrleuarg215021552160metgluleumetglycysaspleuasnsercyssermetproleu216521702175glymetgluserlysalaileseraspalaglnilethralaser218021852190sertyrphethrasnmetphealathrtrpserproserlysala219522002205argleuhisleuglnglyargserasnalatrpargproglnval221022152220asnasnprolysglutrpleuglnvalasppheglnlysthrmet222522302235lysvalthrglyvalthrthrglnglyvallysserleuleuthr224022452250sermettyrvallysglupheleuileserserserglnaspgly225522602265hisglntrpthrleuphepheglnasnglylysvallysvalphe227022752280glnglyasnglnaspserphethrprovalvalasnserleuasp228522902295proproleuleuthrargtyrleuargilehisproglnsertrp230023052310valhisglnilealaleuargmetgluvalleuglycysgluala231523202325glnaspleutyr2330<210>45<211>4<212>prt<213>人工序列<220><223>人igg1的氨基酸233-236<400>45gluleuleugly1<210>46<211>42<212>prt<213>人工序列<220><223>xtenae42-4,蛋白质序列<400>46glyalaproglyserproalaglyserprothrserthrgluglugly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproalaserser3540<210>47<211>126<212>dna<213>人工序列<220><223>xtenae42-4,dna序列<400>47ggcgcgccaggttctcctgctggctcccccacctcaacagaagaggggacaagcgaaagc60gctacgcctgagagtggccctggctctgagccagccacctccggctctgaaacccctgcc120tcgagc126<210>48<211>144<212>prt<213>人工序列<220><223>xtenae144-2a,蛋白质序列<400>48thrserthrgluprosergluglyseralaproglyserproalagly151015serprothrserthrglugluglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglysergluproalathrserglysergluthrprogly859095thrserthrgluprosergluglyseralaproglythrserthrglu100105110prosergluglyseralaproglythrsergluseralathrproglu115120125serglyproglythrsergluseralathrprogluserglyprogly130135140<210>49<211>450<212>dna<213>人工序列<220><223>xtenae144-2a,dna序列<400>49ggcgcgccaaccagtacggagccgtccgaggggagcgcaccaggaagcccggctgggagc60ccgacttctaccgaagagggtacatctaccgaaccaagtgaaggttcagcaccaggcacc120tcaacagaaccctctgagggctcggcgcctggtacaagtgagtccgccaccccagaatcc180gggcctgggacaagcacagaaccttcggaagggagtgcccctggaacatccgaatcggca240accccagaatcagggccaggatctgagcccgcgacttcgggctccgagacgcctgggaca300tccaccgagccctccgaaggatcagccccaggcaccagcacggagccctctgagggaagc360gcacctggtaccagcgaaagcgcaactcccgaatcaggtcccggtacgagcgagtcggcg420accccggagagcgggccaggtgcctcgagc450<210>50<211>144<212>prt<213>人工序列<220><223>xtenae144-3b,蛋白质序列<400>50serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaproglythrserthrgluproserglugly65707580seralaproglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglythrserthrglu100105110prosergluglyseralaproglyserproalaglyserprothrser115120125thrglugluglythrserthrgluprosergluglyseralaprogly130135140<210>51<211>450<212>dna<213>人工序列<220><223>xtenae144-3b,dna序列<400>51ggcgcgccaagtcccgctggaagcccaactagcaccgaagaggggacctcagagtccgcc60acccccgagtccggccctggctctgagcctgccactagcggctccgagactcctggcaca120tccgaaagcgctacacccgagagtggacccggcacctctaccgagcccagtgagggctcc180gcccctggaacaagcaccgagcccagcgaaggcagcgccccagggacctccacagagccc240agtgaaggcagtgctcctggcaccagcaccgaaccaagcgagggctctgcacccgggacc300tccaccgagccaagcgaaggctctgcccctggcacttccaccgagcccagcgaaggcagc360gcccctgggagccccgctggctctcccaccagcactgaggagggcacatctaccgaacca420agtgaaggctctgcaccaggtgcctcgagc450<210>52<211>144<212>prt<213>人工序列<220><223>xtenae144-4a,蛋白质序列<400>52thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrsergluseralathrproglu202530serglyproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglyserproalaglyserprothrserthrgluglugly859095serproalaglyserprothrserthrglugluglyserproalagly100105110serprothrserthrglugluglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>53<211>450<212>dna<213>人工序列<220><223>xtenae144-4a,dna序列<400>53ggcgcgccaacgtccgaaagtgctacccctgagtcaggccctggtagtgagcctgccaca60agcggaagcgaaactccggggacctcagagtctgccactcccgaatcggggccaggctct120gaaccggccacttcagggagcgaaacaccaggaacatcggagagcgctaccccggagagc180gggccaggaactagtactgagcctagcgagggaagtgcacctggtacaagcgagtccgcc240acacccgagtctggccctggctctccagcgggctcacccacgagcactgaagagggctct300cccgctggcagcccaacgtcgacagaagaaggatcaccagcaggctcccccacatcaaca360gaggagggtacatcagaatctgctactcccgagagtggacccggtacctccactgagccc420agcgaggggagtgcaccaggtgcctcgagc450<210>54<211>144<212>prt<213>人工序列<220><223>xtenae144-5a,蛋白质序列<400>54thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrsergluseralathrproglu202530serglyproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaproglyserproalaglyserprothrser65707580thrglugluglythrsergluseralathrprogluserglyprogly859095sergluproalathrserglysergluthrproglythrsergluser100105110alathrprogluserglyproglyserproalaglyserprothrser115120125thrglugluglyserproalaglyserprothrserthrgluglugly130135140<210>55<211>450<212>dna<213>人工序列<220><223>xtenae144-5a,dna序列<400>55ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>56<211>144<212>prt<213>人工序列<220><223>xtenae144-6b,蛋白质序列<400>56thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrproglyserproalaglyserprothrser65707580thrglugluglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglysergluproala100105110thrserglysergluthrproglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>57<211>450<212>dna<213>人工序列<220><223>xtenae144-6b,dna序列<400>57ggcgcgccaacatctaccgagccttccgaaggctctgcccctgggacctcagaatctgca60acccctgaaagcggccctggaacctccgaaagtgccactcccgagagcggcccagggaca120agcgagtcagcaacccctgagtctggacccggcagcgagcctgcaacctctggctcagag180actcccggctcagaacccgctacctcaggctccgagacacccggctctcctgctgggagt240cccacttccaccgaggaaggaacatccactgagcctagtgagggctctgcccctggaacc300agcacagagccaagtgagggcagtgcaccaggatccgagccagcaaccagcgggtccgag360actcccgggacctctgagtctgccaccccagagagcggacccggcacttcaaccgagccc420tccgaaggatcagcaccaggtgcctcgagc450<210>58<211>144<212>prt<213>人工序列<220><223>xtenag144-1,蛋白质序列<400>58proglyserserproseralaserthrglythrglyproglyserser151015proseralaserthrglythrglyproglythrproglyserglythr202530alaserserserproglyserserthrproserglyalathrglyser354045proglyserserproseralaserthrglythrglyproglyalaser505560proglythrserserthrglyserproglythrproglyserglythr65707580alaserserserproglyserserthrproserglyalathrglyser859095proglythrproglyserglythralaserserserproglyalaser100105110proglythrserserthrglyserproglyalaserproglythrser115120125serthrglyserproglythrproglyserglythralaserserser130135140<210>59<211>450<212>dna<213>人工序列<220><223>xtenag144-1,dna序列<400>59ggcgcgccacccgggtcgtccccgtcggcgtccaccggaacagggccagggtcatccccg60tcagcgtcgactgggacgggacccgggacacccggttcggggactgcatcctcctcgcct120ggttcgtccaccccgtcaggagccacgggttcgccgggaagcagcccaagcgcatccact180ggtacagggcctggggcttcaccgggtacttcatccacggggtcaccgggaacgcccgga240tcggggacggcttcctcatcaccaggatcgtcaacaccctcgggcgcaacgggcagcccc300ggaacccctggttcgggtacggcgtcgtcgagccccggtgcgagcccgggaacaagctcg360acaggatcgcctggggcgtcacccggcacgtcgagcacaggcagccccggaacccctgga420tcgggaaccgcgtcgtcaagcgcctcgagc450<210>60<211>144<212>prt<213>人工序列<220><223>xtenag144-a,蛋白质序列<400>60glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>61<211>450<212>dna<213>人工序列<220><223>xtenag144-a,dna序列<400>61ggcgcgccaggtgcctcgccgggaacatcatcaactggttcacccgggtcatccccctcg60gcctcaaccgggacgggtcccggctcatcccccagcgccagcactggaacaggtcctggc120actcctggttccggtacggcatcgtcatccccgggaagctcaacaccgtccggagcgaca180ggatcacctggctcgtcaccttcggcgtcaactggaacggggccaggggcctcacccgga240acgtcctcgactgggtcgcctggtacgccgggatcaggaacggcctcatcctcgcctggg300tcctcaacgccctcgggtgcgactggttcgccgggaactcctggctcggggacggcctcg360tcgtcgcctggggcatcaccggggacgagctccacggggtcccctggagcgtcaccgggg420acctcctcgacaggtagcccggcctcgagc450<210>62<211>144<212>prt<213>人工序列<220><223>xtenag144-b,蛋白质序列<400>62glythrproglyserglythralaserserserproglyserserthr151015proserglyalathrglyserproglyalaserproglythrserser202530thrglyserproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyserserproseralaserthr65707580glythrglyproglyserserthrproserglyalathrglyserpro859095glyserserthrproserglyalathrglyserproglyalaserpro100105110glythrserserthrglyserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>63<211>450<212>dna<213>人工序列<220><223>xtenag144-b,dna序列<400>63ggcgcgccaggtacaccgggcagcggcacggcttcgtcgtcacccggctcgtccacaccg60tcgggagctacgggaagcccaggagcgtcaccgggaacgtcgtcaacggggtcaccgggt120acgccaggtagcggcacggccagcagctcgccaggttcatcgaccccgtcgggagcgact180gggtcgcccggatcaagcccgtcagcttccactggaacaggacccgggtcgtcgccgtca240gcctcaacggggacaggacctggttcatcgacgccgtcaggggcgacaggctcgcccgga300tcgtcaacaccctcgggggcaacggggagccctggtgcgtcgcctggaacctcatccacc360ggaagcccgggggcctcgccgggtacgagctccacgggatcgcccggagcgtcccccgga420acttcaagcacagggagccctgcctcgagc450<210>64<211>144<212>prt<213>人工序列<220><223>xtenag144-c,蛋白质序列<400>64glythrproglyserglythralaserserserproglyalaserpro151015glythrserserthrglyserproglyalaserproglythrserser202530thrglyserproglyalaserproglythrserserthrglyserpro354045glyserserproseralaserthrglythrglyproglythrprogly505560serglythralaserserserproglyalaserproglythrserser65707580thrglyserproglyalaserproglythrserserthrglyserpro859095glyalaserproglythrserserthrglyserproglyserserthr100105110proserglyalathrglyserproglyserserthrproserglyala115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>65<211>450<212>dna<213>人工序列<220><223>xtenag144-c,dna序列<400>65ggcgcgccaggtacacccggatcgggtacagcgtcatcgagccccggtgcgtcacctggt60acgtcgagcacggggtcgccaggggcgtcccctgggacgtcctcaacaggctcgcccggt120gcgtcacccggcacgtcgtccacgggttcacctggtagctccccttccgcgtccactggc180accgggcctggaactccggggagcggcacagcgagctcgtcgccgggagcatcgcctggg240acatcgagcaccgggtcgccaggagcatcgcccggaacatccagcacaggaagccccggc300gcgtcgcccgggacatcaagcacaggttccccgggatcgagcacgccgtccggagccact360ggatcaccagggagctcgacaccttccggcgcaacgggatcgcccggagccagcccgggt420acgtcaagcactggctcccctgcctcgagc450<210>66<211>144<212>prt<213>人工序列<220><223>xtenag144-f,蛋白质序列<400>66glyserserproseralaserthrglythrglyproglyserserpro151015seralaserthrglythrglyproglyalaserproglythrserser202530thrglyserproglyalaserproglythrserserthrglyserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglyserserproseralaserthrglythrglypro859095glythrproglyserglythralaserserserproglyserserthr100105110proserglyalathrglyserproglyserserthrproserglyala115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>67<211>450<212>dna<213>人工序列<220><223>xtenag144-f,dna序列<400>67ggcgcgccaggctccagcccctccgcgagcacgggaaccggaccaggttcgtcaccctca60gcatcaacggggacgggaccgggggcgtcaccaggaacgtcctccaccggctcgccgggt120gcatcacccggaacgtcatcgaccggatcgccagggagctcgacgccatcaggcgcaaca180ggatcacctggctcaagccctagcgcgtcaaccggcacgggtccgggtgcctcccctggc240acgtccagcaccggatcacccggatcgagcccatccgcctcaaccggaaccggacccggt300acaccagggtcgggaacagcctcctcgtcaccaggctcctcaaccccctcgggagccacg360ggttcgcccggttcgtcaacgccttccggagcaactggtagccccggagcatcgccagga420acttcgagcacggggtcgcccgcctcgagc450<210>68<211>4374<212>dna<213>人工序列<220><223>cofviii-1dna序列<400>68atgcagattgagctgtctacttgctttttcctgtgcctgctgaggttttgcttttccgct60acacgaaggtattatctgggggctgtggaactgtcttgggattacatgcagagtgacctg120ggagagctgccagtggacgcaaggtttccccctagagtccctaagtcattccccttcaac180actagcgtggtctacaagaaaacactgttcgtggagtttactgatcacctgttcaacatc240gcaaagcctaggccaccctggatgggactgctggggccaacaatccaggccgaggtgtac300gacaccgtggtcattacacttaagaacatggcctcacaccccgtgagcctgcatgctgtg360ggcgtcagctactggaaggcttccgaaggagcagagtatgacgatcagacttcccagaga420gaaaaagaggacgataaggtgtttcctggcggatctcatacctacgtgtggcaggtcctg480aaagagaatggccctatggcctccgaccctctgtgcctgacctactcttatctgagtcac540gtggacctggtcaaggatctgaacagcggcctgatcggagccctgctggtgtgcagggaa600ggaagcctggctaaggagaaaacccagacactgcataagttcattctgctgttcgccgtg660tttgacgaagggaaatcatggcacagcgagacaaagaatagtctgatgcaggacagggat720gccgcttcagccagagcttggcccaaaatgcacactgtgaacggctacgtcaatcgctca780ctgcctgggctgatcggctgccaccgaaagagcgtgtattggcatgtcatcgggatgggc840accacacctgaagtgcactccattttcctggagggacatacctttctggtccgcaaccac900cgacaggcttccctggagatctctccaattaccttcctgacagcacagactctgctgatg960gacctggggcagttcctgctgttttgccacatcagctcccaccagcatgatggcatggag1020gcttacgtgaaagtggactcttgtcccgaggaacctcagctgcggatgaagaacaatgag1080gaagcagaagactatgacgatgacctgaccgactccgagatggatgtggtccgattcgat1140gacgataacagcccctcctttatccagattagatctgtggccaagaaacaccctaagaca1200tgggtccattacatcgcagccgaggaagaggactgggattatgcaccactggtgctggca1260ccagacgatcgctcctacaaatctcagtatctgaacaatgggccacagaggattggcaga1320aagtacaagaaagtgcggttcatggcatataccgatgagaccttcaagactcgcgaagcc1380atccagcacgagagcggcatcctgggaccactgctgtacggagaagtgggagacaccctg1440ctgatcattttcaagaaccaggccagccggccttacaatatctatccacatgggattaca1500gatgtgcgccctctgtacagcaggagactgccaaagggcgtcaaacacctgaaggacttc1560ccaatcctgcccggagaaatcttcaagtacaagtggactgtcaccgtcgaggatggcccc1620actaagagcgaccctcggtgcctgacccgctactattctagtttcgtgaatatggaaaga1680gatctggcaagcggactgatcggaccactgctgatttgttacaaagagagcgtggatcag1740agaggcaaccagatcatgtccgacaagcggaatgtgattctgttcagtgtctttgacgaa1800aacaggtcatggtacctgaccgagaacatccagagattcctgcctaatccagctggggtg1860cagctggaagatcctgagtttcaggcatctaacatcatgcatagtattaatggctacgtg1920ttcgacagtttgcagctgagcgtgtgcctgcacgaggtcgcttactggtatatcctgagc1980attggggcacagacagatttcctgagcgtgttcttttccggctacacttttaagcataaa2040atggtctatgaggacacactgactctgttccccttcagcggcgaaaccgtgtttatgagc2100atggagaatcccggactgtggattctggggtgccacaacagcgatttcagaaatcgcgga2160atgactgccctgctgaaagtgtcaagctgtgacaagaacaccggggactactatgaagat2220tcatacgaggacatcagcgcatatctgctgtccaaaaacaatgccattgaaccccggtct2280tttagtcagaatcctccagtgctgaagaggcaccagagggagatcacccgcactaccctg2340cagagtgatcaggaagagatcgactacgacgatacaatttctgtggaaatgaagaaagag2400gacttcgatatctatgacgaagatgagaaccagagtcctcgatcattccagaagaaaacc2460aggcattactttattgccgcagtggagcggctgtgggattatggcatgtcctctagtcct2520cacgtgctgcgaaatagggcccagtcaggaagcgtcccacagttcaagaaagtggtcttc2580caggagtttacagacgggtcctttactcagccactgtacaggggcgaactgaacgagcac2640ctgggactgctggggccctatatcagagcagaagtggaggataacattatggtcaccttc2700agaaatcaggcctctcggccttacagtttttattcaagcctgatctcttacgaagaggac2760cagcgacagggagctgaaccacgaaaaaacttcgtgaagcctaatgagaccaaaacatac2820ttttggaaggtgcagcaccatatggccccaacaaaagacgagttcgattgcaaggcatgg2880gcctatttttctgacgtggatctggagaaggacgtgcacagtggcctgattggcccactg2940ctggtgtgccatactaacaccctgaatccagcccacggccggcaggtcactgtccaggag3000ttcgctctgttctttaccatctttgatgagacaaagagctggtacttcaccgaaaacatg3060gagcgaaattgcagggctccatgtaacattcagatggaagaccccacattcaaggagaac3120taccgctttcatgctatcaatggatacatcatggatactctgcccgggctggtcatggca3180caggaccagagaatccggtggtatctgctgagcatgggcagcaacgagaatatccactca3240attcatttcagcgggcacgtgtttactgtcaggaagaaagaagagtacaagatggccctg3300tacaacctgtatcccggcgtgttcgaaaccgtcgagatgctgcctagcaaggccggaatc3360tggagagtggaatgcctgattggagagcacctgcatgctgggatgtctaccctgtttctg3420gtgtacagtaataagtgtcagacacccctgggaatggcatccgggcatatcagggatttc3480cagattaccgcatctggacagtacggacagtgggcacctaagctggctagactgcactat3540tccggatctatcaacgcttggtccacaaaagagcctttctcttggattaaggtggacctg3600ctggccccaatgatcattcatggcatcaaaactcagggagctcggcagaagttctcctct3660ctgtacatctcacagtttatcatcatgtacagcctggatgggaagaaatggcagacatac3720cgcggcaatagcacaggaactctgatggtgttctttggcaacgtggacagcagcggaatc3780aagcacaacattttcaatccccctatcattgctagatacatccggctgcacccaacccat3840tattctattcgaagtacactgaggatggaactgatgggatgcgatctgaacagttgttca3900atgcccctggggatggagtccaaggcaatctctgacgcccagattaccgccagctcctac3960ttcactaatatgtttgctacctggagcccttccaaagcaagactgcacctgcaaggccgc4020agcaacgcatggcgaccacaggtgaacaatcccaaggagtggttgcaggtcgattttcag4080aaaactatgaaggtgaccggggtcacaactcagggcgtgaaaagtctgctgacctcaatg4140tacgtcaaggagttcctgatctctagttcacaggacggacatcagtggacactgttcttt4200cagaacgggaaggtgaaagtcttccagggcaatcaggattcctttacacctgtggtcaac4260agtctagaccctccactgctgaccagatacctgagaatccaccctcagtcctgggtgcac4320cagattgccctgagaatggaagtgctgggatgcgaggcccaggatctgtactga4374<210>69<211>577<212>dna<213>人工序列<220><223>et启动子,dna序列<400>69ctcgaggtcaattcacgcgagttaataattaccagcgcgggccaaataaataatccgcga60ggggcaggtgacgtttgcccagcgcgcgctggtaattattaacctcgcgaatattgattc120gaggccgcgattgccgcaatcgcgaggggcaggtgacctttgcccagcgcgcgttcgccc180cgccccggacggtatcgataagcttaggagcttgggctgcaggtcgagggcactgggagg240atgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgt300ttgaacaggggccgggcgatcagcaggtagctctagaggatccccgtctgtctgcacatt360tcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggt420tacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagct480tggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggaga540agccgtcacacagatccacaagctcctgccaccatgg577<210>70<211>4374<212>dna<213>人工序列<220><223>cofviii-5<400>70atgcaaatcgaactgagcacctgtttcttcctctgcctgctgagattctgtttctccgcg60acccgccgatactacctgggagcagtggagctctcctgggattacatgcagagcgacctt120ggggagctgcccgtggatgccaggttccctccccgggtgccaaagtcgtttccgttcaac180acctccgtggtgtacaagaaaactctgttcgtggagttcaccgaccacctgttcaatatc240gccaagcccagacctccctggatggggctgttgggacctaccatccaagcggaggtgtac300gacactgtggtcatcactctgaagaacatggcctcgcatcccgtgtccctgcacgccgtg360ggagtgtcttactggaaagcgtccgagggggccgaatacgacgaccagacctcgcagaga420gaaaaggaagatgacaaggtgttcccaggaggatcgcacacctacgtgtggcaagtgttg480aaggagaacggcccaatggcctccgacccgctgtgcctgacctactcgtacctgtcccac540gtggacctcgtgaaggacctcaactcgggactgattggagccctgctggtctgcagggaa600ggctcactggcgaaagaaaagactcagaccttgcacaagttcattctgctgttcgctgtg660ttcgacgaggggaagtcgtggcacagcgagactaagaactccctgatgcaagatagagat720gccgcctccgcccgggcctggcctaagatgcacaccgtgaacggttacgtgaaccgctcc780ctccctggcctgattggatgccaccggaagtccgtgtactggcacgtgatcgggatgggg840accacccccgaggtgcacagcatcttcctggaaggtcacacatttctcgtgcgcaaccac900cggcaggcctccctggaaatcagccccattaccttcctcactgcccagactctgctgatg960gacctgggacagttcctgctgttctgccatatctcctcccaccaacatgacggaatggag1020gcatacgtgaaggtcgattcctgccctgaggaaccccagctccgcatgaagaacaatgag1080gaagccgaggactacgacgacgacctgacggatagcgagatggatgtggtccggttcgat1140gacgataacagcccttccttcatccaaattcgctcggtggcaaagaagcaccccaagacc1200tgggtgcattacattgcggcggaagaagaggactgggattatgccccgcttgtcctcgct1260cctgacgaccggagctacaagagccagtacctgaacaacggtccacagaggatcggtaga1320aagtacaagaaggtccgcttcatggcctataccgacgaaaccttcaaaactagagaggcc1380atccaacacgaatccggcatcctgggcccgctcttgtacggagaagtcggcgacaccctt1440ctcattatcttcaagaaccaggcttcccggccgtacaacatctatccgcatgggatcact1500gacgtgcgcccactgtactcgcggcgcctgcccaagggtgtcaaacacctgaaggatttt1560ccgatccttccgggagaaatcttcaagtacaagtggaccgtgaccgtggaagatggccca1620actaagtctgaccctagatgcctcacccgctactactcatccttcgtcaacatggagcgc1680gacctggccagcggactgatcggcccgctgctgatttgctacaaggaatcagtggaccaa1740cggggaaaccagatcatgtcggataagaggaacgtcatcctcttctccgtgtttgacgaa1800aaccggtcgtggtacctgactgaaaacatccagcggttcctccccaaccccgcgggcgtg1860cagctggaagatcctgagtttcaggcatcaaacatcatgcactccattaacggctacgtg1920ttcgattcgctgcagctgagcgtgtgtctgcacgaagtggcctactggtacatcctgtcc1980attggtgcccagactgacttcctgtccgtgtttttctccggctacacgttcaagcacaag2040atggtgtacgaggacaccctgaccctcttccctttttccggcgaaactgtgtttatgagc2100atggagaatcccggcctgtggatcttgggctgccacaacagcgacttccgtaacagagga2160atgactgcgctgctcaaggtgtccagctgcgacaagaacaccggagactattatgaggac2220tcatacgaggacatctccgcctacctcctgtccaagaataacgccattgaacctcggagc2280ttcagccagaacccacccgtgcttaagagacatcaacgggagatcactaggaccaccctg2340cagtcagaccaggaggaaatcgactacgatgacaccatctcggtcgagatgaagaaggag2400gactttgacatctacgacgaagatgaaaaccagagcccgaggtcgttccaaaagaaaacc2460cgccactactttattgctgctgtcgagcggctgtgggactacggaatgtcgtcctcgccg2520cacgtgctccgcaaccgagcccagagcggctcggtgccgcaattcaagaaggtcgtgttc2580caggagttcactgacgggagcttcactcagcctttgtaccggggagaactcaatgaacat2640ctcggcctcctcggaccttacatcagagcagaagtggaagataacatcatggtcactttc2700cgtaaccaagccagccgcccgtactcgttctactcctccctcatttcttacgaagaggac2760cagcggcagggcgcagaaccgcgcaagaacttcgtgaagcccaacgaaaccaagacctac2820ttctggaaagtgcagcatcatatggccccgactaaggacgagtttgactgcaaagcctgg2880gcctacttctccgatgtggacttggagaaggacgtccactccggcctcatcggtcccctg2940ctcgtgtgccataccaataccctgaaccccgcacacggtcgccaggtcaccgtgcaggag3000ttcgctctgttcttcactatcttcgacgaaactaagtcctggtacttcaccgagaacatg3060gagaggaactgcagagccccctgtaacatccagatggaggacccgacgttcaaggaaaac3120taccggttccacgccattaacggatacatcatggatacgctgccgggtcttgtgatggcc3180caggatcaacggatcagatggtacttattgtcgatgggcagcaacgagaacatccactct3240attcacttctccggtcatgtgttcactgtgcggaagaaggaagagtacaagatggccctg3300tacaacctttatcccggagtgttcgaaactgtggaaatgctgccgtcgaaggccggcatt3360tggcgcgtggagtgtttgattggagaacatctccatgcggggatgtcaaccctgttcctg3420gtgtatagcaacaagtgccagactccgcttgggatggcgtcaggacacattagggatttc3480cagatcactgcgtccggccagtacggccaatgggcccctaagctggcccgcctgcattac3540tccggatccattaacgcctggtcaaccaaggagccattctcctggatcaaggtggacctt3600ctggcccccatgattatccacggaattaagacccagggggcccggcagaagttctcctca3660ctgtacatcagccagttcataatcatgtactccctggacggaaagaagtggcaaacctac3720agggggaacagcaccggcacactgatggtctttttcggaaatgtggactcctccgggatt3780aagcataacatcttcaaccctccgattatcgctcggtacattagacttcaccctacccac3840tacagcattcgctccaccctgcggatggaactgatgggctgcgatctgaactcgtgcagc3900atgccgttgggaatggagtccaaagcaatttccgacgcgcagatcaccgcctcgtcctac3960tttaccaacatgttcgccacgtggtcaccgtccaaggcccggctgcacctccagggaaga4020tccaacgcatggcggccacaggtcaacaaccctaaggagtggctccaggtggacttccag4080aaaaccatgaaggtcaccggagtcacaacccagggagtgaagtcgctgctgacttctatg4140tacgtcaaggagttcctgatctccagcagccaggacgggcaccagtggaccctgttcttc4200caaaatggaaaggtcaaggtgtttcagggcaatcaggattcattcaccccggtggtgaac4260tcccttgatccacccctcctgacccgctaccttcgcatccacccacagtcctgggtgcac4320cagatcgcgctgaggatggaggtcctgggatgcgaagcccaggacctgtactga4374<210>71<211>4374<212>dna<213>人工序列<220><223>cofviii-6<400>71atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctc2340caatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaa2400gatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaact2460agacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccct2520cacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttc2580caggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacac2640ctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttc2700cgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgaggaggac2760cagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctac2820ttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgg2880gcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctg2940ctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggag3000tttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatg3060gagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaaggagaac3120tatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcatggcc3180caggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactcc3240attcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctg3300tacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatc3360tggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctg3420gtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagagacttc3480cagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgcactac3540tccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctc3600ctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctcctcc3660ctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttac3720aggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccggcatt3780aagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccactcac3840tactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctgctcc3900atgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctac3960ttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcagggacgg4020tcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaa4080aagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatg4140tatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgttcttc4200caaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaac4260tccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccat4320cagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactga4374<210>72<211>4824<212>dna<213>人工序列<220><223>cofviii-6-xten<400>72atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcagctgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagagg2760caccagcgagaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgac2820gacaccatctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaat2880cagtcccctcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaaga2940ctgtgggactatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcgga3000tcggtgcctcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccag3060ccgctgtaccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcg3120gaagtggaggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttc3180tattcctccctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaac3240ttcgtcaagcccaacgagactaagacctacttctggaaggtccaacaccatatggccccg3300accaaggatgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaag3360gatgtccattccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaaccca3420gcgcatggacgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaa3480actaagtcctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatc3540cagatggaagatccgactttcaaggagaactatagattccacgccatcaacgggtacatc3600atggatactctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctg3660tcaatgggatcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtg3720cgcaagaaggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaact3780gtggagatgctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcac3840ctccacgcggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctg3900ggcatggcctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaa3960tgggcgccgaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaag4020gaaccgttctcgtggattaaggtggacctcctggcccctatgattatccacggaattaag4080acccagggcgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtac4140agcctggacgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtc4200tttttcggcaacgtggattcctccggcattaagcacaacatcttcaacccaccgatcata4260gccagatatattaggctccaccccactcactactcaatccgctcaactcttcggatggaa4320ctcatggggtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctatt4380agcgacgcccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccc4440tccaaggccaggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaat4500ccgaaggaatggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacc4560cagggagtgaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagc4620caggacgggcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccagggg4680aaccaggactcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtac4740ttgaggattcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggc4800tgcgaggcccaggacctgtactga4824<210>73<211>12<212>prt<213>人工序列<220><223>ad基序<400>73glygluserproglyglyserserglysergluser1510<210>74<211>12<212>prt<213>人工序列<220><223>ad基序<400>74glysergluglyserserglyproglygluserser1510<210>75<211>12<212>prt<213>人工序列<220><223>ad基序<400>75glysersergluserglysersergluglyglypro1510<210>76<211>12<212>prt<213>人工序列<220><223>ad基序<400>76glyserglyglygluprosergluserglyserser1510<210>77<211>12<212>prt<213>人工序列<220><223>ae、am基序<400>77glyserproalaglyserprothrserthrgluglu1510<210>78<211>12<212>prt<213>人工序列<220><223>ae、am、aq基序<400>78glysergluproalathrserglysergluthrpro1510<210>79<211>12<212>prt<213>人工序列<220><223>ae、am、aq基序<400>79glythrsergluseralathrprogluserglypro1510<210>80<211>12<212>prt<213>人工序列<220><223>ae、am、aq基序<400>80glythrserthrgluprosergluglyseralapro1510<210>81<211>12<212>prt<213>人工序列<220><223>af、am基序<400>81glyserthrsergluserproserglythralapro1510<210>82<211>12<212>prt<213>人工序列<220><223>af、am基序<400>82glythrserthrprogluserglyseralaserpro1510<210>83<211>12<212>prt<213>人工序列<220><223>af、am基序<400>83glythrserproserglygluserserthralapro1510<210>84<211>12<212>prt<213>人工序列<220><223>af、am基序<400>84glyserthrserserthralagluserproglypro1510<210>85<211>12<212>prt<213>人工序列<220><223>ag、am基序<400>85glythrproglyserglythralaserserserpro1510<210>86<211>12<212>prt<213>人工序列<220><223>ag、am基序<400>86glyserserthrproserglyalathrglyserpro1510<210>87<211>12<212>prt<213>人工序列<220><223>ag、am基序<400>87glyserserproseralaserthrglythrglypro1510<210>88<211>12<212>prt<213>人工序列<220><223>ag、am基序<400>88glyalaserproglythrserserthrglyserpro1510<210>89<211>12<212>prt<213>人工序列<220><223>aq基序<400>89glygluproalaglyserprothrserthrserglu1510<210>90<211>12<212>prt<213>人工序列<220><223>aq基序<400>90glythrglygluproserserthrproalaserglu1510<210>91<211>12<212>prt<213>人工序列<220><223>aq基序<400>91glyserglyproserthrgluseralaprothrglu1510<210>92<211>12<212>prt<213>人工序列<220><223>aq基序<400>92glysergluthrproserglyprosergluthrala1510<210>93<211>12<212>prt<213>人工序列<220><223>aq基序<400>93glyprosergluthrserthrsergluproglyala1510<210>94<211>12<212>prt<213>人工序列<220><223>aq基序<400>94glyserprosergluprothrgluglythrserala1510<210>95<211>12<212>prt<213>人工序列<220><223>bc基序<400>95glyserglyalasergluprothrserthrglupro1510<210>96<211>12<212>prt<213>人工序列<220><223>bc基序<400>96glysergluproalathrserglythrgluproser1510<210>97<211>12<212>prt<213>人工序列<220><223>bc基序<400>97glythrsergluproserthrsergluproglyala1510<210>98<211>12<212>prt<213>人工序列<220><223>bc基序<400>98glythrserthrgluprosergluproglyserala1510<210>99<211>12<212>prt<213>人工序列<220><223>bd基序<400>99glyserthralaglysergluthrserthrgluala1510<210>100<211>12<212>prt<213>人工序列<220><223>bd基序<400>100glysergluthralathrserglysergluthrala1510<210>101<211>12<212>prt<213>人工序列<220><223>bd基序<400>101glythrsergluseralathrsergluserglyala1510<210>102<211>12<212>prt<213>人工序列<220><223>bd基序<400>102glythrserthrglualasergluglyseralaser1510<210>103<211>1607<212>prt<213>人工序列<220><223>cofviii-6-xten蛋白质序列<400>103metglnilegluleuserthrcysphepheleucysleuleuargphe151015cyspheseralathrargargtyrtyrleuglyalavalgluleuser202530trpasptyrmetglnseraspleuglygluleuprovalaspalaarg354045pheproproargvalprolysserphepropheasnthrservalval505560tyrlyslysthrleuphevalgluphethrasphisleupheasnile65707580alalysproargproprotrpmetglyleuleuglyprothrilegln859095alagluvaltyraspthrvalvalilethrleulysasnmetalaser100105110hisprovalserleuhisalavalglyvalsertyrtrplysalaser115120125gluglyalaglutyraspaspglnthrserglnargglulysgluasp130135140asplysvalpheproglyglyserhisthrtyrvaltrpglnvalleu145150155160lysgluasnglyprometalaseraspproleucysleuthrtyrser165170175tyrleuserhisvalaspleuvallysaspleuasnserglyleuile180185190glyalaleuleuvalcysarggluglyserleualalysglulysthr195200205glnthrleuhislyspheileleuleuphealavalpheaspglugly210215220lyssertrphissergluthrlysasnserleumetglnaspargasp225230235240alaalaseralaargalatrpprolysmethisthrvalasnglytyr245250255valasnargserleuproglyleuileglycyshisarglysserval260265270tyrtrphisvalileglymetglythrthrprogluvalhisserile275280285pheleugluglyhisthrpheleuvalargasnhisargglnalaser290295300leugluileserproilethrpheleuthralaglnthrleuleumet305310315320aspleuglyglnpheleuleuphecyshisileserserhisglnhis325330335aspglymetglualatyrvallysvalaspsercysprogluglupro340345350glnleuargmetlysasnasngluglualagluasptyraspaspasp355360365leuthraspserglumetaspvalvalargpheaspaspaspasnser370375380proserpheileglnileargservalalalyslyshisprolysthr385390395400trpvalhistyrilealaalagluglugluasptrpasptyralapro405410415leuvalleualaproaspaspargsertyrlysserglntyrleuasn420425430asnglyproglnargileglyarglystyrlyslysvalargphemet435440445alatyrthraspgluthrphelysthrargglualaileglnhisglu450455460serglyileleuglyproleuleutyrglygluvalglyaspthrleu465470475480leuileilephelysasnglnalaserargprotyrasniletyrpro485490495hisglyilethraspvalargproleutyrserargargleuprolys500505510glyvallyshisleulysasppheproileleuproglygluilephe515520525lystyrlystrpthrvalthrvalgluaspglyprothrlysserasp530535540proargcysleuthrargtyrtyrserserphevalasnmetgluarg545550555560aspleualaserglyleuileglyproleuleuilecystyrlysglu565570575servalaspglnargglyasnglnilemetserasplysargasnval580585590ileleupheservalpheaspgluasnargsertrptyrleuthrglu595600605asnileglnargpheleuproasnproalaglyvalglnleugluasp610615620proglupheglnalaserasnilemethisserileasnglytyrval625630635640pheaspserleuglnleuservalcysleuhisgluvalalatyrtrp645650655tyrileleuserileglyalaglnthrasppheleuservalphephe660665670serglytyrthrphelyshislysmetvaltyrgluaspthrleuthr675680685leuphepropheserglygluthrvalphemetsermetgluasnpro690695700glyleutrpileleuglycyshisasnserasppheargasnarggly705710715720metthralaleuleulysvalsersercysasplysasnthrglyasp725730735tyrtyrgluaspsertyrgluaspileseralatyrleuleuserlys740745750asnasnalailegluproargserpheserglnasnglyalaprothr755760765sergluseralathrprogluserglyproglysergluproalathr770775780serglysergluthrproglythrsergluseralathrprogluser785790795800glyproglysergluproalathrserglysergluthrproglythr805810815sergluseralathrprogluserglyproglythrserthrglupro820825830sergluglyseralaproglyserproalaglyserprothrserthr835840845glugluglythrsergluseralathrprogluserglyproglyser850855860gluproalathrserglysergluthrproglythrsergluserala865870875880thrprogluserglyproglyserproalaglyserprothrserthr885890895glugluglyserproalaglyserprothrserthrglugluglyala900905910serserproprovalleulysarghisglnarggluilethrargthr915920925thrleuglnseraspglnglugluileasptyraspaspthrileser930935940valglumetlyslysgluasppheaspiletyraspgluaspgluasn945950955960glnserproargserpheglnlyslysthrarghistyrpheileala965970975alavalgluargleutrpasptyrglymetserserserprohisval980985990leuargasnargalaglnserglyservalproglnphelyslysval99510001005valpheglngluphethraspglyserphethrglnproleutyr101010151020argglygluleuasngluhisleuglyleuleuglyprotyrile102510301035argalagluvalgluaspasnilemetvalthrpheargasngln104010451050alaserargprotyrserphetyrserserleuilesertyrglu105510601065gluaspglnargglnglyalagluproarglysasnphevallys107010751080proasngluthrlysthrtyrphetrplysvalglnhishismet108510901095alaprothrlysaspglupheaspcyslysalatrpalatyrphe110011051110seraspvalaspleuglulysaspvalhisserglyleuilegly111511201125proleuleuvalcyshisthrasnthrleuasnproalahisgly113011351140argglnvalthrvalglngluphealaleuphephethrilephe114511501155aspgluthrlyssertrptyrphethrgluasnmetgluargasn116011651170cysargalaprocysasnileglnmetgluaspprothrphelys117511801185gluasntyrargphehisalaileasnglytyrilemetaspthr119011951200leuproglyleuvalmetalaglnaspglnargileargtrptyr120512101215leuleusermetglyserasngluasnilehisserilehisphe122012251230serglyhisvalphethrvalarglyslysgluglutyrlysmet123512401245alaleutyrasnleutyrproglyvalphegluthrvalglumet125012551260leuproserlysalaglyiletrpargvalglucysleuilegly126512701275gluhisleuhisalaglymetserthrleupheleuvaltyrser128012851290asnlyscysglnthrproleuglymetalaserglyhisilearg129513001305asppheglnilethralaserglyglntyrglyglntrpalapro131013151320lysleualaargleuhistyrserglyserileasnalatrpser132513301335thrlysgluprophesertrpilelysvalaspleuleualapro134013451350metileilehisglyilelysthrglnglyalaargglnlysphe135513601365serserleutyrileserglnpheileilemettyrserleuasp137013751380glylyslystrpglnthrtyrargglyasnserthrglythrleu138513901395metvalphepheglyasnvalaspserserglyilelyshisasn140014051410ilepheasnproproileilealaargtyrileargleuhispro141514201425thrhistyrserileargserthrleuargmetgluleumetgly143014351440cysaspleuasnsercyssermetproleuglymetgluserlys144514501455alaileseraspalaglnilethralasersertyrphethrasn146014651470metphealathrtrpserproserlysalaargleuhisleugln147514801485glyargserasnalatrpargproglnvalasnasnprolysglu149014951500trpleuglnvalasppheglnlysthrmetlysvalthrglyval150515101515thrthrglnglyvallysserleuleuthrsermettyrvallys152015251530glupheleuileserserserglnaspglyhisglntrpthrleu153515401545phepheglnasnglylysvallysvalpheglnglyasnglnasp155015551560serphethrprovalvalasnserleuaspproproleuleuthr156515701575argtyrleuargilehisproglnsertrpvalhisglnileala158015851590leuargmetgluvalleuglycysglualaglnaspleutyr159516001605<210>104<211>16<212>dna<213>人工序列<220><223>aav2的rep结合位点(rbs)<400>104gcgcgctcgctcgctc16<210>105<211>6<212>dna<213>人工序列<220><223>aav2的末端解链位点(trs)<400>105agttgg6<210>106<211>2328<212>prt<213>人工序列<220><223>成熟全长fviii<400>106alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargprolysargargleuprolysglyvallyshisleu485490495lysasppheproileleuproglygluilephelystyrlystrpthr500505510valthrvalgluaspglyprothrlysseraspproargcysleuthr515520525argtyrtyrserserphevalasnmetgluargaspleualasergly530535540leuileglyproleuleuilecystyrlysgluservalaspglnarg545550555560glyasnglnilemetserasplysargasnvalileleupheserval565570575pheaspgluasnargsertrptyrleuthrgluasnileglnargphe580585590leuproasnproalaglyvalglnleugluaspproglupheglnala595600605serasnilemethisserileasnglytyrvalpheaspserleugln610615620leuservalcysleuhisgluvalalatyrtrptyrileleuserile625630635640glyalaglnthrasppheleuservalphepheserglytyrthrphe645650655lyshislysmetvaltyrgluaspthrleuthrleuphepropheser660665670glygluthrvalphemetsermetgluasnproglyleutrpileleu675680685glycyshisasnserasppheargasnargglymetthralaleuleu690695700lysvalsersercysasplysasnthrglyasptyrtyrgluaspser705710715720tyrgluaspileseralatyrleuleuserlysasnasnalaileglu725730735proargserpheserglnasnserarghisproserthrargglnlys740745750glnpheasnalathrthrileprogluasnaspileglulysthrasp755760765protrpphealahisargthrprometprolysileglnasnvalser770775780serseraspleuleumetleuleuargglnserprothrprohisgly785790795800leuserleuseraspleuglnglualalystyrgluthrpheserasp805810815aspproserproglyalaileaspserasnasnserleuserglumet820825830thrhispheargproglnleuhishisserglyaspmetvalphethr835840845progluserglyleuglnleuargleuasnglulysleuglythrthr850855860alaalathrgluleulyslysleuaspphelysvalserserthrser865870875880asnasnleuileserthrileproseraspasnleualaalaglythr885890895aspasnthrserserleuglyproprosermetprovalhistyrasp900905910serglnleuaspthrthrleupheglylyslysserserproleuthr915920925gluserglyglyproleuserleuserglugluasnasnaspserlys930935940leuleugluserglyleumetasnserglnglusersertrpglylys945950955960asnvalserserthrgluserglyargleuphelysglylysargala965970975hisglyproalaleuleuthrlysaspasnalaleuphelysvalser980985990ileserleuleulysthrasnlysthrserasnasnseralathrasn99510001005arglysthrhisileaspglyproserleuleuilegluasnser101010151020proservaltrpglnasnileseraspthrgluphelyslysval102510301035thrproleuilehisaspargmetleumetasplysasnalathr104010451050alaleuargleuasnhismetserasnlysthrthrserserlys105510601065asnmetglumetvalglnglnlyslysgluglyproilepropro107010751080aspalaglnasnproaspmetserphephelysmetleupheleu108510901095progluseralaargtrpileglnargthrhisglylysasnser110011051110leuasnserglyglnglyproserprolysglnleuvalserleu111511201125glyproglulysservalgluglyglnasnpheleuserglulys113011351140asnlysvalvalvalglylysglygluphethrlysaspvalgly114511501155leulysglumetvalpheproserserargasnleupheleuthr116011651170asnleuaspasnleuhisgluasnasnthrhisasnglnglulys117511801185lysileglnglugluileglulyslysgluthrleuileglnglu119011951200asnvalvalleuproglnilehisthrvalthrglythrlysasn120512101215phemetlysasnleupheleuleuserthrargglnasnvalglu122012251230glysertyraspglyalatyralaprovalleuglnaspphearg123512401245serleuasnaspserthrasnargthrlyslyshisthralahis125012551260pheserlyslysglygluglugluasnleugluglyleuglyasn126512701275glnthrlysglnilevalglulystyralacysthrthrargile128012851290serproasnthrserglnglnasnphevalthrglnargserlys129513001305argalaleulysglnpheargleuproleuglugluthrgluleu131013151320glulysargileilevalaspaspthrserthrglntrpserlys132513301335asnmetlyshisleuthrproserthrleuthrglnileasptyr134013451350asnglulysglulysglyalailethrglnserproleuserasp135513601365cysleuthrargserhisserileproglnalaasnargserpro137013751380leuproilealalysvalserserpheproserileargproile138513901395tyrleuthrargvalleupheglnaspasnserserhisleupro140014051410alaalasertyrarglyslysaspserglyvalglngluserser141514201425hispheleuglnglyalalyslysasnasnleuserleualaile143014351440leuthrleuglumetthrglyaspglnarggluvalglyserleu144514501455glythrseralathrasnservalthrtyrlyslysvalgluasn146014651470thrvalleuprolysproaspleuprolysthrserglylysval147514801485gluleuleuprolysvalhisiletyrglnlysaspleuphepro149014951500thrgluthrserasnglyserproglyhisleuaspleuvalglu150515101515glyserleuleuglnglythrgluglyalailelystrpasnglu152015251530alaasnargproglylysvalpropheleuargvalalathrglu153515401545serseralalysthrproserlysleuleuaspproleualatrp155015551560aspasnhistyrglythrglnileprolysgluglutrplysser156515701575glnglulysserproglulysthralaphelyslyslysaspthr158015851590ileleuserleuasnalacysgluserasnhisalailealaala159516001605ileasngluglyglnasnlysprogluilegluvalthrtrpala161016151620lysglnglyargthrgluargleucysserglnasnproproval162516301635leulysarghisglnarggluilethrargthrthrleuglnser164016451650aspglnglugluileasptyraspaspthrileservalglumet165516601665lyslysgluasppheaspiletyraspgluaspgluasnglnser167016751680proargserpheglnlyslysthrarghistyrpheilealaala168516901695valgluargleutrpasptyrglymetserserserprohisval170017051710leuargasnargalaglnserglyservalproglnphelyslys171517201725valvalpheglngluphethraspglyserphethrglnproleu173017351740tyrargglygluleuasngluhisleuglyleuleuglyprotyr174517501755ileargalagluvalgluaspasnilemetvalthrpheargasn176017651770glnalaserargprotyrserphetyrserserleuilesertyr177517801785glugluaspglnargglnglyalagluproarglysasnpheval179017951800lysproasngluthrlysthrtyrphetrplysvalglnhishis180518101815metalaprothrlysaspglupheaspcyslysalatrpalatyr182018251830pheseraspvalaspleuglulysaspvalhisserglyleuile183518401845glyproleuleuvalcyshisthrasnthrleuasnproalahis185018551860glyargglnvalthrvalglngluphealaleuphephethrile186518701875pheaspgluthrlyssertrptyrphethrgluasnmetgluarg188018851890asncysargalaprocysasnileglnmetgluaspprothrphe189519001905lysgluasntyrargphehisalaileasnglytyrilemetasp191019151920thrleuproglyleuvalmetalaglnaspglnargileargtrp192519301935tyrleuleusermetglyserasngluasnilehisserilehis194019451950pheserglyhisvalphethrvalarglyslysgluglutyrlys195519601965metalaleutyrasnleutyrproglyvalphegluthrvalglu197019751980metleuproserlysalaglyiletrpargvalglucysleuile198519901995glygluhisleuhisalaglymetserthrleupheleuvaltyr200020052010serasnlyscysglnthrproleuglymetalaserglyhisile201520202025argasppheglnilethralaserglyglntyrglyglntrpala203020352040prolysleualaargleuhistyrserglyserileasnalatrp204520502055serthrlysgluprophesertrpilelysvalaspleuleuala206020652070prometileilehisglyilelysthrglnglyalaargglnlys207520802085pheserserleutyrileserglnpheileilemettyrserleu209020952100aspglylyslystrpglnthrtyrargglyasnserthrglythr210521102115leumetvalphepheglyasnvalaspserserglyilelyshis212021252130asnilepheasnproproileilealaargtyrileargleuhis213521402145prothrhistyrserileargserthrleuargmetgluleumet215021552160glycysaspleuasnsercyssermetproleuglymetgluser216521702175lysalaileseraspalaglnilethralasersertyrphethr218021852190asnmetphealathrtrpserproserlysalaargleuhisleu219522002205glnglyargserasnalatrpargproglnvalasnasnprolys221022152220glutrpleuglnvalasppheglnlysthrmetlysvalthrgly222522302235valthrthrglnglyvallysserleuleuthrsermettyrval224022452250lysglupheleuileserserserglnaspglyhisglntrpthr225522602265leuphepheglnasnglylysvallysvalpheglnglyasngln227022752280aspserphethrprovalvalasnserleuaspproproleuleu228522902295thrargtyrleuargilehisproglnsertrpvalhisglnile230023052310alaleuargmetgluvalleuglycysglualaglnaspleutyr231523202325<210>107<211>7053<212>dna<213>人工序列<220><223>成熟全长fviii<400>107atgcaaatagagctctccacctgcttctttctgtgccttttgcgattctgctttagtgcc60accagaagatactacctgggtgcagtggaactgtcatgggactatatgcaaagtgatctc120ggtgagctgcctgtggacgcaagatttcctcctagagtgccaaaatcttttccattcaac180acctcagtcgtgtacaaaaagactctgtttgtagaattcacggatcaccttttcaacatc240gctaagccaaggccaccctggatgggtctgctaggtcctaccatccaggctgaggtttat300gatacagtggtcattacacttaagaacatggcttcccatcctgtcagtcttcatgctgtt360ggtgtatcctactggaaagcttctgagggagctgaatatgatgatcagaccagtcaaagg420gagaaagaagatgataaagtcttccctggtggaagccatacatatgtctggcaggtcctg480aaagagaatggtccaatggcctctgacccactgtgccttacctactcatatctttctcat540gtggacctggtaaaagacttgaattcaggcctcattggagccctactagtatgtagagaa600gggagtctggccaaggaaaagacacagaccttgcacaaatttatactactttttgctgta660tttgatgaagggaaaagttggcactcagaaacaaagaactccttgatgcaggatagggat720gctgcatctgctcgggcctggcctaaaatgcacacagtcaatggttatgtaaacaggtct780ctgccaggtctgattggatgccacaggaaatcagtctattggcatgtgattggaatgggc840accactcctgaagtgcactcaatattcctcgaaggtcacacatttcttgtgaggaaccat900cgccaggcgtccttggaaatctcgccaataactttccttactgctcaaacactcttgatg960gaccttggacagtttctactgttttgtcatatctcttcccaccaacatgatggcatggaa1020gcttatgtcaaagtagacagctgtccagaggaaccccaactacgaatgaaaaataatgaa1080gaagcggaagactatgatgatgatcttactgattctgaaatggatgtggtcaggtttgat1140gatgacaactctccttcctttatccaaattcgctcagttgccaagaagcatcctaaaact1200tgggtacattacattgctgctgaagaggaggactgggactatgctcccttagtcctcgcc1260cccgatgacagaagttataaaagtcaatatttgaacaatggccctcagcggattggtagg1320aagtacaaaaaagtccgatttatggcatacacagatgaaacctttaagactcgtgaagct1380attcagcatgaatcaggaatcttgggacctttactttatggggaagttggagacacactg1440ttgattatatttaagaatcaagcaagcagaccatataacatctaccctcacggaatcact1500gatgtccgtcctttgtattcaaggagattaccaaaaggtgtaaaacatttgaaggatttt1560ccaattctgccaggagaaatattcaaatataaatggacagtgactgtagaagatgggcca1620actaaatcagatcctcggtgcctgacccgctattactctagtttcgttaatatggagaga1680gatctagcttcaggactcattggccctctcctcatctgctacaaagaatctgtagatcaa1740agaggaaaccagataatgtcagacaagaggaatgtcatcctgttttctgtatttgatgag1800aaccgaagctggtacctcacagagaatatacaacgctttctccccaatccagctggagtg1860cagcttgaggatccagagttccaagcctccaacatcatgcacagcatcaatggctatgtt1920tttgatagtttgcagttgtcagtttgtttgcatgaggtggcatactggtacattctaagc1980attggagcacagactgacttcctttctgtcttcttctctggatataccttcaaacacaaa2040atggtctatgaagacacactcaccctattcccattctcaggagaaactgtcttcatgtcg2100atggaaaacccaggtctatggattctggggtgccacaactcagactttcggaacagaggc2160atgaccgccttactgaaggtttctagttgtgacaagaacactggtgattattacgaggac2220agttatgaagatatttcagcatacttgctgagtaaaaacaatgccattgaaccaagaagc2280ttctcccagaattcaagacaccctagcactaggcaaaagcaatttaatgccaccacaatt2340ccagaaaatgacatagagaagactgacccttggtttgcacacagaacacctatgcctaaa2400atacaaaatgtctcctctagtgatttgttgatgctcttgcgacagagtcctactccacat2460gggctatccttatctgatctccaagaagccaaatatgagactttttctgatgatccatca2520cctggagcaatagacagtaataacagcctgtctgaaatgacacacttcaggccacagctc2580catcacagtggggacatggtatttacccctgagtcaggcctccaattaagattaaatgag2640aaactggggacaactgcagcaacagagttgaagaaacttgatttcaaagtttctagtaca2700tcaaataatctgatttcaacaattccatcagacaatttggcagcaggtactgataataca2760agttccttaggacccccaagtatgccagttcattatgatagtcaattagataccactcta2820tttggcaaaaagtcatctccccttactgagtctggtggacctctgagcttgagtgaagaa2880aataatgattcaaagttgttagaatcaggtttaatgaatagccaagaaagttcatgggga2940aaaaatgtatcgtcaacagagagtggtaggttatttaaagggaaaagagctcatggacct3000gctttgttgactaaagataatgccttattcaaagttagcatctctttgttaaagacaaac3060aaaacttccaataattcagcaactaatagaaagactcacattgatggcccatcattatta3120attgagaatagtccatcagtctggcaaaatatattagaaagtgacactgagtttaaaaaa3180gtgacacctttgattcatgacagaatgcttatggacaaaaatgctacagctttgaggcta3240aatcatatgtcaaataaaactacttcatcaaaaaacatggaaatggtccaacagaaaaaa3300gagggccccattccaccagatgcacaaaatccagatatgtcgttctttaagatgctattc3360ttgccagaatcagcaaggtggatacaaaggactcatggaaagaactctctgaactctggg3420caaggccccagtccaaagcaattagtatccttaggaccagaaaaatctgtggaaggtcag3480aatttcttgtctgagaaaaacaaagtggtagtaggaaagggtgaatttacaaaggacgta3540ggactcaaagagatggtttttccaagcagcagaaacctatttcttactaacttggataat3600ttacatgaaaataatacacacaatcaagaaaaaaaaattcaggaagaaatagaaaagaag3660gaaacattaatccaagagaatgtagttttgcctcagatacatacagtgactggcactaag3720aatttcatgaagaaccttttcttactgagcactaggcaaaatgtagaaggttcatatgac3780ggggcatatgctccagtacttcaagattttaggtcattaaatgattcaacaaatagaaca3840aagaaacacacagctcatttctcaaaaaaaggggaggaagaaaacttggaaggcttggga3900aatcaaaccaagcaaattgtagagaaatatgcatgcaccacaaggatatctcctaataca3960agccagcagaattttgtcacgcaacgtagtaagagagctttgaaacaattcagactccca4020ctagaagaaacagaacttgaaaaaaggataattgtggatgacacctcaacccagtggtcc4080aaaaacatgaaacatttgaccccgagcaccctcacacagatagactacaatgagaaggag4140aaaggggccattactcagtctcccttatcagattgccttacgaggagtcatagcatccct4200caagcaaatagatctccattacccattgcaaaggtatcatcatttccatctattagacct4260atatatctgaccagggtcctattccaagacaactcttctcatcttccagcagcatcttat4320agaaagaaagattctggggtccaagaaagcagtcatttcttacaaggagccaaaaaaaat4380aacctttctttagccattctaaccttggagatgactggtgatcaaagagaggttggctcc4440ctggggacaagtgccacaaattcagtcacatacaagaaagttgagaacactgttctcccg4500aaaccagacttgcccaaaacatctggcaaagttgaattgcttccaaaagttcacatttat4560cagaaggacctattccctacggaaactagcaatgggtctcctggccatctggatctcgtg4620gaagggagccttcttcagggaacagagggagcgattaagtggaatgaagcaaacagacct4680ggaaaagttccctttctgagagtagcaacagaaagctctgcaaagactccctccaagcta4740ttggatcctcttgcttgggataaccactatggtactcagataccaaaagaagagtggaaa4800tcccaagagaagtcaccagaaaaaacagcttttaagaaaaaggataccattttgtccctg4860aacgcttgtgaaagcaatcatgcaatagcagcaataaatgagggacaaaataagcccgaa4920atagaagtcacctgggcaaagcaaggtaggactgaaaggctgtgctctcaaaacccacca4980gtcttgaaacgccatcaacgggaaataactcgtactactcttcagtcagatcaagaggaa5040attgactatgatgataccatatcagttgaaatgaagaaggaagattttgacatttatgat5100gaggatgaaaatcagagcccccgcagctttcaaaagaaaacacgacactattttattgct5160gcagtggagaggctctgggattatgggatgagtagctccccacatgttctaagaaacagg5220gctcagagtggcagtgtccctcagttcaagaaagttgttttccaggaatttactgatggc5280tcctttactcagcccttataccgtggagaactaaatgaacatttgggactcctggggcca5340tatataagagcagaagttgaagataatatcatggtaactttcagaaatcaggcctctcgt5400ccctattccttctattctagccttatttcttatgaggaagatcagaggcaaggagcagaa5460cctagaaaaaactttgtcaagcctaatgaaaccaaaacttacttttggaaagtgcaacat5520catatggcacccactaaagatgagtttgactgcaaagcctgggcttatttctctgatgtt5580gacctggaaaaagatgtgcactcaggcctgattggaccccttctggtctgccacactaac5640acactgaaccctgctcatgggagacaagtgacagtacaggaatttgctctgtttttcacc5700atctttgatgagaccaaaagctggtacttcactgaaaatatggaaagaaactgcagggct5760ccctgcaatatccagatggaagatcccacttttaaagagaattatcgcttccatgcaatc5820aatggctacataatggatacactacctggcttagtaatggctcaggatcaaaggattcga5880tggtatctgctcagcatgggcagcaatgaaaacatccattctattcatttcagtggacat5940gtgttcactgtacgaaaaaaagaggagtataaaatggcactgtacaatctctatccaggt6000gtttttgagacagtggaaatgttaccatccaaagctggaatttggcgggtggaatgcctt6060attggcgagcatctacatgctgggatgagcacactttttctggtgtacagcaataagtgt6120cagactcccctgggaatggcttctggacacattagagattttcagattacagcttcagga6180caatatggacagtgggccccaaagctggccagacttcattattccggatcaatcaatgcc6240tggagcaccaaggagcccttttcttggatcaaggtggatctgttggcaccaatgattatt6300cacggcatcaagacccagggtgcccgtcagaagttctccagcctctacatctctcagttt6360atcatcatgtatagtcttgatgggaagaagtggcagacttatcgaggaaattccactgga6420accttaatggtcttctttggcaatgtggattcatctgggataaaacacaatatttttaac6480cctccaattattgctcgatacatccgtttgcacccaactcattatagcattcgcagcact6540cttcgcatggagttgatgggctgtgatttaaatagttgcagcatgccattgggaatggag6600agtaaagcaatatcagatgcacagattactgcttcatcctactttaccaatatgtttgcc6660acctggtctccttcaaaagctcgacttcacctccaagggaggagtaatgcctggagacct6720caggtgaataatccaaaagagtggctgcaagtggacttccagaagacaatgaaagtcaca6780ggagtaactactcagggagtaaaatctctgcttaccagcatgtatgtgaaggagttcctc6840atctccagcagtcaagatggccatcagtggactctcttttttcagaatggcaaagtaaag6900gtttttcagggaaatcaagactccttcacacctgtggtgaactctctagacccaccgtta6960ctgactcgctaccttcgaattcacccccagagttgggtgcaccagattgccctgaggatg7020gaggttctgggctgcgaggcacaggacctctac7053<210>108<400>108000<210>109<211>1718<212>prt<213>人工序列<220><223>bivv001bdd-fviii(xten)序列(无fc)<400>109alathrargargtyrtyrleuglyalavalgluleusertrpasptyr151015metglnseraspleuglygluleuprovalaspalaargphepropro202530argvalprolysserphepropheasnthrservalvaltyrlyslys354045thrleuphevalgluphethrasphisleupheasnilealalyspro505560argproprotrpmetglyleuleuglyprothrileglnalagluval65707580tyraspthrvalvalilethrleulysasnmetalaserhisproval859095serleuhisalavalglyvalsertyrtrplysalasergluglyala100105110glutyraspaspglnthrserglnargglulysgluaspasplysval115120125pheproglyglyserhisthrtyrvaltrpglnvalleulysgluasn130135140glyprometalaseraspproleucysleuthrtyrsertyrleuser145150155160hisvalaspleuvallysaspleuasnserglyleuileglyalaleu165170175leuvalcysarggluglyserleualalysglulysthrglnthrleu180185190hislyspheileleuleuphealavalpheaspgluglylyssertrp195200205hissergluthrlysasnserleumetglnaspargaspalaalaser210215220alaargalatrpprolysmethisthrvalasnglytyrvalasnarg225230235240serleuproglyleuileglycyshisarglysservaltyrtrphis245250255valileglymetglythrthrprogluvalhisserilepheleuglu260265270glyhisthrpheleuvalargasnhisargglnalaserleugluile275280285serproilethrpheleuthralaglnthrleuleumetaspleugly290295300glnpheleuleuphecyshisileserserhisglnhisaspglymet305310315320glualatyrvallysvalaspsercysproglugluproglnleuarg325330335metlysasnasngluglualagluasptyraspaspaspleuthrasp340345350serglumetaspvalvalargpheaspaspaspasnserproserphe355360365ileglnileargservalalalyslyshisprolysthrtrpvalhis370375380tyrilealaalagluglugluasptrpasptyralaproleuvalleu385390395400alaproaspaspargsertyrlysserglntyrleuasnasnglypro405410415glnargileglyarglystyrlyslysvalargphemetalatyrthr420425430aspgluthrphelysthrargglualaileglnhisgluserglyile435440445leuglyproleuleutyrglygluvalglyaspthrleuleuileile450455460phelysasnglnalaserargprotyrasniletyrprohisglyile465470475480thraspvalargprolysargargleuprolysglyvallyshisleu485490495lysasppheproileleuproglygluilephelystyrlystrpthr500505510valthrvalgluaspglyprothrlysseraspproargcysleuthr515520525argtyrtyrserserphevalasnmetgluargaspleualasergly530535540leuileglyproleuleuilecystyrlysgluservalaspglnarg545550555560glyasnglnilemetserasplysargasnvalileleupheserval565570575pheaspgluasnargsertrptyrleuthrgluasnileglnargphe580585590leuproasnproalaglyvalglnleugluaspproglupheglnala595600605serasnilemethisserileasnglytyrvalpheaspserleugln610615620leuservalcysleuhisgluvalalatyrtrptyrileleuserile625630635640glyalaglnthrasppheleuservalphepheserglytyrthrphe645650655lyshislysmetvaltyrgluaspthrleuthrleuphepropheser660665670glygluthrvalphemetsermetgluasnproglyleutrpileleu675680685glycyshisasnserasppheargasnargglymetthralaleuleu690695700lysvalsersercysasplysasnthrglyasptyrtyrgluaspser705710715720tyrgluaspileseralatyrleuleuserlysasnasnalaileglu725730735proargserpheserglnasnglythrsergluseralathrproglu740745750serglyproglysergluproalathrserglysergluthrprogly755760765thrsergluseralathrprogluserglyproglysergluproala770775780thrserglysergluthrproglythrsergluseralathrproglu785790795800serglyproglythrserthrgluprosergluglyseralaprogly805810815serproalaglyserprothrserthrglugluglythrsergluser820825830alathrprogluserglyproglysergluproalathrserglyser835840845gluthrproglythrsergluseralathrprogluserglyprogly850855860serproalaglyserprothrserthrglugluglyserproalagly865870875880serprothrserthrglugluglythrserthrgluproserglugly885890895seralaproglythrsergluseralathrprogluserglyprogly900905910thrsergluseralathrprogluserglyproglythrsergluser915920925alathrprogluserglyproglysergluproalathrserglyser930935940gluthrproglysergluproalathrserglysergluthrprogly945950955960serproalaglyserprothrserthrglugluglythrserthrglu965970975prosergluglyseralaproglythrserthrgluproserglugly980985990seralaproglysergluproalathrserglysergluthrprogly99510001005thrsergluseralathrprogluserglyproglythrserthr101010151020gluprosergluglyseralaproalasersergluilethrarg102510301035thrthrleuglnseraspglnglugluileasptyraspaspthr104010451050ileservalglumetlyslysgluasppheaspiletyraspglu105510601065aspgluasnglnserproargserpheglnlyslysthrarghis107010751080tyrpheilealaalavalgluargleutrpasptyrglymetser108510901095serserprohisvalleuargasnargalaglnserglyserval110011051110proglnphelyslysvalvalpheglngluphethraspglyser111511201125phethrglnproleutyrargglygluleuasngluhisleugly113011351140leuleuglyprotyrileargalagluvalgluaspasnilemet114511501155valthrpheargasnglnalaserargprotyrserphetyrser116011651170serleuilesertyrglugluaspglnargglnglyalaglupro117511801185arglysasnphevallysproasngluthrlysthrtyrphetrp119011951200lysvalglnhishismetalaprothrlysaspglupheaspcys120512101215lysalatrpalatyrpheseraspvalaspleuglulysaspval122012251230hisserglyleuileglyproleuleuvalcyshisthrasnthr123512401245leuasnproalahisglyargglnvalthrvalglnglupheala125012551260leuphephethrilepheaspgluthrlyssertrptyrphethr126512701275gluasnmetgluargasncysargalaprocysasnileglnmet128012851290gluaspprothrphelysgluasntyrargphehisalaileasn129513001305glytyrilemetaspthrleuproglyleuvalmetalaglnasp131013151320glnargileargtrptyrleuleusermetglyserasngluasn132513301335ilehisserilehispheserglyhisvalphethrvalarglys134013451350lysgluglutyrlysmetalaleutyrasnleutyrproglyval135513601365phegluthrvalglumetleuproserlysalaglyiletrparg137013751380valglucysleuileglygluhisleuhisalaglymetserthr138513901395leupheleuvaltyrserasnlyscysglnthrproleuglymet140014051410alaserglyhisileargasppheglnilethralaserglygln141514201425tyrglyglntrpalaprolysleualaargleuhistyrsergly143014351440serileasnalatrpserthrlysgluprophesertrpilelys144514501455valaspleuleualaprometileilehisglyilelysthrgln146014651470glyalaargglnlyspheserserleutyrileserglnpheile147514801485ilemettyrserleuaspglylyslystrpglnthrtyrarggly149014951500asnserthrglythrleumetvalphepheglyasnvalaspser150515101515serglyilelyshisasnilepheasnproproileilealaarg152015251530tyrileargleuhisprothrhistyrserileargserthrleu153515401545argmetgluleumetglycysaspleuasnsercyssermetpro155015551560leuglymetgluserlysalaileseraspalaglnilethrala156515701575sersertyrphethrasnmetphealathrtrpserproserlys158015851590alaargleuhisleuglnglyargserasnalatrpargprogln159516001605valasnasnprolysglutrpleuglnvalasppheglnlysthr161016151620metlysvalthrglyvalthrthrglnglyvallysserleuleu162516301635thrsermettyrvallysglupheleuileserserserglnasp164016451650glyhisglntrpthrleuphepheglnasnglylysvallysval165516601665pheglnglyasnglnaspserphethrprovalvalasnserleu167016751680aspproproleuleuthrargtyrleuargilehisproglnser168516901695trpvalhisglnilealaleuargmetgluvalleuglycysglu170017051710alaglnaspleutyr1715<210>110<211>6526<212>dna<213>人工序列<220><223>nb15.1v32构建体(aav-fviiico6xten-ssdna)<400>110ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcctgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaata180cgcgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaatt240cgcggccgcctcgacgactagcgtttaattaaacgcgtgtctgtctgcacatttcgtaga300gcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttat360tctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagg420gatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtc480acacagatccacaagctcctgaggtaagtgccgtgtgtggttcccgcgggcctggcctct540ttacgggttatggcccttgcgtgccttgaattactgacactgacatccactttttctttt600tctccacagctagcgccaccatgcagattgagctgtccacttgtttcttcctgtgcctcc660tgcgcttctgtttctccgccactcgccggtactaccttggagccgtggagctttcatggg720actacatgcagagcgacctgggcgaactccccgtggatgccagattccccccccgcgtgc780caaagtccttcccctttaacacctccgtggtgtacaagaaaaccctctttgtcgagttca840ctgaccacctgttcaacatcgccaagccgcgcccaccttggatgggcctcctgggaccga900ccattcaagctgaagtgtacgacaccgtggtgatcaccctgaagaacatggcgtcccacc960ccgtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaaggagctgagtacg1020acgaccagactagccagcgggaaaaggaggacgataaagtgttcccgggcggctcgcata1080cttacgtgtggcaagtcctgaaggaaaacggacctatggcatccgatcctctgtgcctga1140cttactcctacctttcccatgtggacctcgtgaaggacctgaacagcgggctgattggtg1200cacttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccagaccctccataagt1260tcatccttttgttcgctgtgttcgatgaaggaaagtcatggcattccgaaactaagaact1320cgctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaaatgcatacagtca1380acggatacgtgaatcggtcactgcccgggctcatcggttgtcacagaaagtccgtgtact1440ggcacgtcatcggcatgggcactacgcctgaagtgcactccatcttcctggaagggcaca1500ccttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccgattacctttctga1560ccgcccagactctgctcatggacctggggcagttccttctcttctgccacatctccagcc1620atcagcacgacggaatggaggcctacgtgaaggtggactcatgcccggaagaacctcagt1680tgcggatgaagaacaacgaggaggccgaggactatgacgacgatttgactgactccgaga1740tggacgtcgtgcggttcgatgacgacaacagccccagcttcatccagattcgcagcgtgg1800ccaagaagcaccccaaaacctgggtgcactacatcgcggccgaggaagaagattgggact1860acgccccgttggtgctggcacccgatgaccggtcgtacaagtcccagtatctgaacaatg1920gtccgcagcggattggcagaaagtacaagaaagtgcggttcatggcgtacactgacgaaa1980cgtttaagacccgggaggccattcaacatgagagcggcattctgggaccactgctgtacg2040gagaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcccggccttacaaca2100tctaccctcacggaatcaccgacgtgcggccactctactcgcggcgcctgccgaagggcg2160tcaagcacctgaaagacttccctatcctgccgggcgaaatcttcaagtataagtggaccg2220tcaccgtggaggacgggcccaccaagagcgatcctaggtgtctgactcggtactactcca2280gcttcgtgaacatggaacgggacctggcatcgggactcattggaccgctgctgatctgct2340acaaagagtcggtggatcaacgcggcaaccagatcatgtccgacaagcgcaacgtgatcc2400tgttctccgtgtttgatgaaaacagatcctggtacctcactgaaaacatccagaggttcc2460tcccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgc2520actcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgcctccatgaagtcg2580cttactggtacattctgtccatcggcgcccagactgacttcctgagcgtgttcttttccg2640gttacacctttaagcacaagatggtgtacgaagataccctgaccctgttccctttctccg2700gcgaaacggtgttcatgtcgatggagaacccgggtctgtggattctgggatgccacaaca2760gcgactttcggaaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaaca2820ccggagactactacgaggactcctacgaggatatctcagcctacctcctgtccaagaaca2880acgcgatcgagccgcgcagcttcagccagaacggcgcgccaacatcagagagcgccaccc2940ctgaaagtggtcccgggagcgagccagccacatctgggtcggaaacgccaggcacaagtg3000agtctgcaactcccgagtccggacctggctccgagcctgccactagcggctccgagactc3060cgggaacttccgagagcgctacaccagaaagcggacccggaaccagtaccgaacctagcg3120agggctctgctccgggcagcccagccggctctcctacatccacggaggagggcacttccg3180aatccgccaccccggagtcagggccaggatctgaacccgctacctcaggcagtgagacgc3240caggaacgagcgagtccgctacaccggagagtgggccagggagccctgctggatctccta3300cgtccactgaggaagggtcaccagcgggctcgcccaccagcactgaagaaggtgcctcga3360gcccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctccaatcggatc3420aggaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaagatttcgata3480tctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaactagacactact3540ttatcgccgcggtggaaagactgtgggactatggaatgtcatccagccctcacgtccttc3600ggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttccaggagttca3660ccgacggcagcttcacccagccgctgtaccggggagaactgaacgaacacctgggcctgc3720tcggtccctacatccgcgcggaagtggaggataacatcatggtgaccttccgtaaccaag3780catccagaccttactccttctattcctccctgatctcatacgaggaggaccagcgccaag3840gcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacctacttctggaagg3900tccaacaccatatggccccgaccaaggatgagtttgactgcaaggcctgggcctacttct3960ccgacgtggaccttgagaaggatgtccattccggcctgatcgggccgctgctcgtgtgtc4020acaccaacaccctgaacccagcgcatggacgccaggtcaccgtccaggagtttgctctgt4080tcttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatggagcgaaact4140gtagagcgccctgcaatatccagatggaagatccgactttcaaggagaactatagattcc4200acgccatcaacgggtacatcatggatactctgccggggctggtcatggcccaggatcaga4260ggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcactccattcacttct4320ccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctgtacaatctgt4380accccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatctggagagtgg4440agtgcctgatcggagagcacctccacgcggggatgtccaccctcttcctggtgtactcga4500ataagtgccagaccccgctgggcatggcctcgggccacatcagagacttccagatcacag4560caagcggacaatacggccaatgggcgccgaagctggcccgcttgcactactccggatcga4620tcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctcctggccccta4680tgattatccacggaattaagacccagggcgccaggcagaagttctcctccctgtacatct4740cgcaattcatcatcatgtacagcctggacgggaagaagtggcagacttacaggggaaact4800ccaccggcaccctgatggtctttttcggcaacgtggattcctccggcattaagcacaaca4860tcttcaacccaccgatcatagccagatatattaggctccaccccactcactactcaatcc4920gctcaactcttcggatggaactcatggggtgcgacctgaactcctgctccatgccgttgg4980ggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcctacttcactaaca5040tgttcgccacctggagcccctccaaggccaggctgcacttgcagggacggtcaaatgcct5100ggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaaaagaccatga5160aagtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatgtatgtgaagg5220agttcctgattagcagcagccaggacgggcaccagtggaccctgttcttccaaaacggaa5280aggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaactccctggacc5340ccccactgctgacgcggtacttgaggattcatcctcagtcctgggtccatcagattgcat5400tgcgaatggaagtcctgggctgcgaggcccaggacctgtactgaatcagcctgagctcgc5460tgatcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaacta5520tgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgc5580ttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatga5640ggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaac5700ccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccc5760cctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggc5820tcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttg5880gctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttc5940ggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttcc6000gcgtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgat6060cagcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgcctt6120ccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcat6180cgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagg6240gggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctg6300aggcggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagat6360ttaaattagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttgg6420ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgac6480gcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag6526<210>111<211>130<212>dna<213>人工序列<220><223>5'itr(5'端aav2反向末端重复)<400>111ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcct130<210>112<211>142<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-1<400>112gcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatacgcgctctct60taaggtagccccgggacgcgtcaattgagatctggatccggtaccgaattcgcggccgcc120tcgacgactagcgtttaattaa142<210>113<211>229<212>dna<213>人工序列<220><223>ttpp(肝脏特异性启动子)<400>113acgcgtgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggc60aaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaa120tcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtat180aaaagccccttcaccaggagaagccgtcacacagatccacaagctcctg229<210>114<211>2<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-2<400>114ag2<210>115<211>106<212>dna<213>人工序列<220><223>合成内含子<400>115gtaagtgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtg60ccttgaattactgacactgacatccactttttctttttctccacag106<210>116<211>11<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-3<400>116ctagcgccacc11<210>117<211>4824<212>dna<213>人工序列<220><223>fviiico6xten(含有xten144的密码子优化的fviii形式6的开放阅读框)<400>117atgcagattgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgcc60actcgccggtactaccttggagccgtggagctttcatgggactacatgcagagcgacctg120ggcgaactccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaac180acctccgtggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatc240gccaagccgcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtac300gacaccgtggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtc360ggagtgtcctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgg420gaaaaggaggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctg480aaggaaaacggacctatggcatccgatcctctgtgcctgacttactcctacctttcccat540gtggacctcgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaa600ggttcgctcgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtg660ttcgatgaaggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggat720gccgcctcagcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtca780ctgcccgggctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggc840actacgcctgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccac900cgccaggcctctctggaaatctccccgattacctttctgaccgcccagactctgctcatg960gacctggggcagttccttctcttctgccacatctccagccatcagcacgacggaatggag1020gcctacgtgaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgag1080gaggccgaggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgat1140gacgacaacagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacc1200tgggtgcactacatcgcggccgaggaagaagattgggactacgccccgttggtgctggca1260cccgatgaccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcaga1320aagtacaagaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggcc1380attcaacatgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctg1440ctcatcatcttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcacc1500gacgtgcggccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttc1560cctatcctgccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggccc1620accaagagcgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgg1680gacctggcatcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaa1740cgcggcaaccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaa1800aacagatcctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtg1860caactggaggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtg1920ttcgactcgctgcaactgagcgtgtgcctccatgaagtcgcttactggtacattctgtcc1980atcggcgcccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaag2040atggtgtacgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcg2100atggagaacccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcgga2160atgactgccctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggac2220tcctacgaggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagc2280ttcagccagaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagc2340gagccagccacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtcc2400ggacctggctccgagcctgccactagcggctccgagactccgggaacttccgagagcgct2460acaccagaaagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagc2520ccagccggctctcctacatccacggaggagggcacttccgaatccgccaccccggagtca2580gggccaggatctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgct2640acaccggagagtgggccagggagccctgctggatctcctacgtccactgaggaagggtca2700ccagcgggctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagagg2760caccagcgagaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgac2820gacaccatctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaat2880cagtcccctcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaaga2940ctgtgggactatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcgga3000tcggtgcctcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccag3060ccgctgtaccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcg3120gaagtggaggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttc3180tattcctccctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaac3240ttcgtcaagcccaacgagactaagacctacttctggaaggtccaacaccatatggccccg3300accaaggatgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaag3360gatgtccattccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaaccca3420gcgcatggacgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaa3480actaagtcctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatc3540cagatggaagatccgactttcaaggagaactatagattccacgccatcaacgggtacatc3600atggatactctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctg3660tcaatgggatcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtg3720cgcaagaaggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaact3780gtggagatgctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcac3840ctccacgcggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctg3900ggcatggcctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaa3960tgggcgccgaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaag4020gaaccgttctcgtggattaaggtggacctcctggcccctatgattatccacggaattaag4080acccagggcgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtac4140agcctggacgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtc4200tttttcggcaacgtggattcctccggcattaagcacaacatcttcaacccaccgatcata4260gccagatatattaggctccaccccactcactactcaatccgctcaactcttcggatggaa4320ctcatggggtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctatt4380agcgacgcccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccc4440tccaaggccaggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaat4500ccgaaggaatggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacc4560cagggagtgaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagc4620caggacgggcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccagggg4680aaccaggactcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtac4740ttgaggattcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggc4800tgcgaggcccaggacctgtactga4824<210>118<211>450<212>dna<213>人工序列<220><223>xten144<400>118ggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagccaca60tctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctggctcc120gagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccagaaagc180ggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccggctct240cctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccaggatct300gaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccggagagt360gggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcgggctcg420cccaccagcactgaagaaggtgcctcgagc450<210>119<211>19<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-4<400>119atcagcctgagctcgctga19<210>120<211>595<212>dna<213>人工序列<220><223>wpre(突变的土拨鼠肝炎病毒转录后调控组件)<400>120tcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgt60tgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttc120ccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagga180gttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccc240cactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccct300ccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcg360gctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggct420gctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggc480cctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcg540tcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctg595<210>121<211>8<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-5<400>121atcagcct8<210>122<211>211<212>dna<213>人工序列<220><223>bghpa(牛生长激素多聚腺苷酸化信号)<400>122cgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttga60ccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcatt120gtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggagg180attgggaagacaatagcaggcatgctgggga211<210>123<211>119<212>dna<213>人工序列<220><223>质粒骨架序列(pbs)-6<400>123tgcggtgggctctatggcttctgaggcggaaagaacgggctcgagaagcttctagatatc60ctctcttaaggtagcatcgagatttaaattagggataacagggtaatggcgcgggccgc119<210>124<211>130<212>dna<213>人工序列<220><223>3'itr(3'端aav2反向末端重复)<400>124aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgagg60ccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc120gagcgcgcag130<210>125<211>415<212>prt<213>人工序列<220><223>成熟fix多肽<400>125tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthr405410415<210>126<211>415<212>prt<213>人工序列<220><223>成熟padua(r338l)fix多肽<400>126tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuleuserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthr405410415<210>127<211>46<212>prt<213>人工序列<220><223>fix信号多肽和前肽<400>127metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysarg354045<210>128<211>8442<212>dna<213>人工序列<220><223>人vwf<400>128atgattcctgccagatttgccggggtgctgcttgctctggccctcattttgccagggacc60ctttgtgcagaaggaactcgcggcaggtcatccacggcccgatgcagccttttcggaagt120gacttcgtcaacacctttgatgggagcatgtacagctttgcgggatactgcagttacctc180ctggcagggggctgccagaaacgctccttctcgattattggggacttccagaatggcaag240agagtgagcctctccgtgtatcttggggaattttttgacatccatttgtttgtcaatggt300accgtgacacagggggaccaaagagtctccatgccctatgcctccaaagggctgtatcta360gaaactgaggctgggtactacaagctgtccggtgaggcctatggctttgtggccaggatc420gatggcagcggcaactttcaagtcctgctgtcagacagatacttcaacaagacctgcggg480ctgtgtggcaactttaacatctttgctgaagatgactttatgacccaagaagggaccttg540acctcggacccttatgactttgccaactcatgggctctgagcagtggagaacagtggtgt600gaacgggcatctcctcccagcagctcatgcaacatctcctctggggaaatgcagaagggc660ctgtgggagcagtgccagcttctgaagagcacctcggtgtttgcccgctgccaccctctg720gtggaccccgagccttttgtggccctgtgtgagaagactttgtgtgagtgtgctgggggg780ctggagtgcgcctgccctgccctcctggagtacgcccggacctgtgcccaggagggaatg840gtgctgtacggctggaccgaccacagcgcgtgcagcccagtgtgccctgctggtatggag900tataggcagtgtgtgtccccttgcgccaggacctgccagagcctgcacatcaatgaaatg960tgtcaggagcgatgcgtggatggctgcagctgccctgagggacagctcctggatgaaggc1020ctctgcgtggagagcaccgagtgtccctgcgtgcattccggaaagcgctaccctcccggc1080acctccctctctcgagactgcaacacctgcatttgccgaaacagccagtggatctgcagc1140aatgaagaatgtccaggggagtgccttgtcactggtcaatcccacttcaagagctttgac1200aacagatacttcaccttcagtgggatctgccagtacctgctggcccgggattgccaggac1260cactccttctccattgtcattgagactgtccagtgtgctgatgaccgcgacgctgtgtgc1320acccgctccgtcaccgtccggctgcctggcctgcacaacagccttgtgaaactgaagcat1380ggggcaggagttgccatggatggccaggacatccagctccccctcctgaaaggtgacctc1440cgcatccagcatacagtgacggcctccgtgcgcctcagctacggggaggacctgcagatg1500gactgggatggccgcgggaggctgctggtgaagctgtcccccgtctatgccgggaagacc1560tgcggcctgtgtgggaattacaatggcaaccagggcgacgacttccttaccccctctggg1620ctggcrgagccccgggtggaggacttcgggaacgcctggaagctgcacggggactgccag1680gacctgcagaagcagcacagcgatccctgcgccctcaacccgcgcatgaccaggttctcc1740gaggaggcgtgcgcggtcctgacgtcccccacattcgaggcctgccatcgtgccgtcagc1800ccgctgccctacctgcggaactgccgctacgacgtgtgctcctgctcggacggccgcgag1860tgcctgtgcggcgccctggccagctatgccgcggcctgcgcggggagaggcgtgcgcgtc1920gcgtggcgcgagccaggccgctgtgagctgaactgcccgaaaggccaggtgtacctgcag1980tgcgggaccccctgcaacctgacctgccgctctctctcttacccggatgaggaatgcaat2040gaggcctgcctggagggctgcttctgccccccagggctctacatggatgagaggggggac2100tgcgtgcccaaggcccagtgcccctgttactatgacggtgagatcttccagccagaagac2160atcttctcagaccatcacaccatgtgctactgtgaggatggcttcatgcactgtaccatg2220agtggagtccccggaagcttgctgcctgacgctgtcctcagcagtcccctgtctcatcgc2280agcaaaaggagcctatcctgtcggccccccatggtcaagctggtgtgtcccgctgacaac2340ctgcgggctgaagggctcgagtgtaccaaaacgtgccagaactatgacctggagtgcatg2400agcatgggctgtgtctctggctgcctctgccccccgggcatggtccggcatgagaacaga2460tgtgtggccctggaaaggtgtccctgcttccatcagggcaaggagtatgcccctggagaa2520acagtgaagattggctgcaacacttgtgtctgtcgggaccggaagtggaactgcacagac2580catgtgtgtgatgccacgtgctccacgatcggcatggcccactacctcaccttcgacggg2640ctcaaatacctgttccccggggagtgccagtacgttctggtgcaggattactgcggcagt2700aaccctgggacctttcggatcctagtggggaataagggatgcagccacccctcagtgaaa2760tgcaagaaacgggtcaccatcctggtggagggaggagagattgagctgtttgacggggag2820gtgaatgtgaagaggcccatgaaggatgagactcactttgaggtggtggagtctggccgg2880tacatcattctgctgctgggcaaagccctctccgtggtctgggaccgccacctgagcatc2940tccgtggtcctgaagcagacataccaggagaaagtgtgtggcctgtgtgggaattttgat3000ggcatccagaacaatgacctcaccagcagcaacctccaagtggaggaagaccctgtggac3060tttgggaactcctggaaagtgagctcgcagtgtgctgacaccagaaaagtgcctctggac3120tcatcccctgccacctgccataacaacatcatgaagcagacgatggtggattcctcctgt3180agaatccttaccagtgacgtcttccaggactgcaacaagctggtggaccccgagccatat3240ctggatgtctgcatttacgacacctgctcctgtgagtccattggggactgcgcctgcttc3300tgcgacaccattgctgcctatgcccacgtgtgtgcccagcatggcaaggtggtgacctgg3360aggacggccacattgtgcccccagagctgcgaggagaggaatctccgggagaacgggtat3420gagtgtgagtggcgctataacagctgtgcacctgcctgtcaagtcacgtgtcagcaccct3480gagccactggcctgccctgtgcagtgtgtggagggctgccatgcccactgccctccaggg3540aaaatcctggatgagcttttgcagacctgcgttgaccctgaagactgtccagtgtgtgag3600gtggctggccggcgttttgcctcaggaaagaaagtcaccttgaatcccagtgaccctgag3660cactgccagatttgccactgtgatgttgtcaacctcacctgtgaagcctgccaggagccg3720ggaggcctggtggtgcctcccacagatgccccggtgagccccaccactctgtatgtggag3780gacatctcggaaccgccgttgcacgatttctactgcagcaggctactggacctggtcttc3840ctgctggatggctcctccaggctgtccgaggctgagtttgaagtgctgaaggcctttgtg3900gtggacatgatggagcggctgcgcatctcccagaagtgggtccgcgtggccgtggtggag3960taccacgacggctcccacgcctacatcgggctcaaggaccggaagcgaccgtcagagctg4020cggcgcattgccagccaggtgaagtatgcgggcagccaggtggcctccaccagcgaggtc4080ttgaaatacacactgttccaaatcttcagcaagatcgaccgccctgaagcctcccgcatc4140gccctgctcctgatggccagccaggagccccaacggatgtcccggaactttgtccgctac4200gtccagggcctgaagaagaagaaggtcattgtgatcccggtgggcattgggccccatgcc4260aacctcaagcagatccgcctcatcgagaagcaggcccctgagaacaaggccttcgtgctg4320agcagtgtggatgagctggagcagcaaagggacgagatcgttagctacctctgtgacctt4380gcccctgaagcccctcctcctactctgccccccgacatggcacaagtcactgtgggcccg4440gggctcttgggggtttcgaccctggggcccaagaggaactccatggttctggatgtggcg4500ttcgtcctggaaggatcggacaaaattggtgaagccgacttcaacaggagcaaggagttc4560atggaggaggtgattcagcggatggatgtgggccaggacagcatccacgtcacggtgctg4620cagtactcctacatggtgaccgtggagtaccccttcagcgaggcacagtccaaaggggac4680atcctgcagcgggtgcgagagatccgctaccagggcggcaacaggaccaacactgggctg4740gccctgcggtacctctctgaccacagcttcttggtcagccagggtgaccgggagcaggcg4800cccaacctggtctacatggtcaccggaaatcctgcctctgatgagatcaagaggctgcct4860ggagacatccaggtggtgcccattggagtgggccctaatgccaacgtgcaggagctggag4920aggattggctggcccaatgcccctatcctcatccaggactttgagacgctcccccgagag4980gctcctgacctggtgctgcagaggtgctgctccggagaggggctgcagatccccaccctc5040tcccctgcacctgactgcagccagcccctggacgtgatccttctcctggatggctcctcc5100agtttcccagcttcttattttgatgaaatgaagagtttcgccaaggctttcatttcaaaa5160gccaatatagggcctcgtctcactcaggtgtcagtgctgcagtatggaagcatcaccacc5220attgacgtgccatggaacgtggtcccggagaaagcccatttgctgagccttgtggacgtc5280atgcagcgggagggaggccccagccaaatcggggatgccttgggctttgctgtgcgatac5340ttgacttcagaaatgcatggtgccaggccgggagcctcaaaggcggtggtcatcctggtc5400acggacgtctctgtggattcagtggatgcagcagctgatgccgccaggtccaacagagtg5460acagtgttccctattggaattggagatcgctacgatgcagcccagctacggatcttggca5520ggcccagcaggcgactccaacgtggtgaagctccagcgaatcgaagacctccctaccatg5580gtcaccttgggcaattccttcctccacaaactgtgctctggatttgttaggatttgcatg5640gatgaggatgggaatgagaagaggcccggggacgtctggaccttgccagaccagtgccac5700accgtgacttgccagccagatggccagaccttgctgaagagtcatcgggtcaactgtgac5760cgggggctgaggccttcgtgccctaacagccagtcccctgttaaagtggaagagacctgt5820ggctgccgctggacctgcccctgygtgtgcacaggcagctccactcggcacatcgtgacc5880tttgatgggcagaatttcaagctgactggcagctgttcttatgtcctatttcaaaacaag5940gagcaggacctggaggtgattctccataatggtgcctgcagccctggagcaaggcagggc6000tgcatgaaatccatcgaggtgaagcacagtgccctctccgtcgagstgcacagtgacatg6060gaggtgacggtgaatgggagactggtctctgttccttacgtgggtgggaacatggaagtc6120aacgtttatggtgccatcatgcatgaggtcagattcaatcaccttggtcacatcttcaca6180ttcactccacaaaacaatgagttccaactgcagctcagccccaagacttttgcttcaaag6240acgtatggtctgtgtgggatctgtgatgagaacggagccaatgacttcatgctgagggat6300ggcacagtcaccacagactggaaaacacttgttcaggaatggactgtgcagcggccaggg6360cagacgtgccagcccatcctggaggagcagtgtcttgtccccgacagctcccactgccag6420gtcctcctcttaccactgtttgctgaatgccacaaggtcctggctccagccacattctat6480gccatctgccagcaggacagttgccaccaggagcaagtgtgtgaggtgatcgcctcttat6540gcccacctctgtcggaccaacggggtctgcgttgactggaggacacctgatttctgtgct6600atgtcatgcccaccatctctggtctacaaccactgtgagcatggctgtccccggcactgt6660gatggcaacgtgagctcctgtggggaccatccctccgaaggctgtttctgccctccagat6720aaagtcatgttggaaggcagctgtgtccctgaagaggcctgcactcagtgcattggtgag6780gatggagtccagcaccagttcctggaagcctgggtcccggaccaccagccctgtcagatc6840tgcacatgcctcagcgggcggaaggtcaactgcacaacgcagccctgccccacggccaaa6900gctcccacgtgtggcctgtgtgaagtagcccgcctccgccagaatgcagaccagtgctgc6960cccgagtatgagtgtgtgtgtgacccagtgagctgtgacctgcccccagtgcctcactgt7020gaacgtggcctccagcccacactgaccaaccctggcgagtgcagacccaacttcacctgc7080gcctgcaggaaggaggagtgcaaaagagtgtccccaccctcctgccccccgcaccgtttg7140cccacccttcggaagacccagtgctgtgatgagtatgagtgtgcctgcaactgtgtcaac7200tccacagtgagctgtccccttgggtacttggcctcaaccgccaccaatgactgtggctgt7260accacaaccacctgccttcccgacaaggtgtgtgtccaccgaagcaccatctaccctgtg7320ggccagttctgggaggagggctgcgatgtgtgcacctgcaccgacatggaggatgccgtg7380atgggcctccgcgtggcccagtgctcccagaagccctgtgaggacagctgtcggtcgggc7440ttcacttacgttctgcatgaaggcgagtgctgtggaaggtgcctgccatctgcctgtgag7500gtggtgactggctcaccgcggggggactcccagtcttcctggaagagtgtcggctcccag7560tgggcctccccggagaacccctgcctcatcaatgagtgtgtccgagtgaaggaggaggtc7620tttatacaacaaaggaacgtctcctgcccccagctggaggtccctgtctgcccctcgggc7680tttcagctgagctgtaagacctcagcgtgctgcccaagctgtcgctgtgagcgcatggag7740gcctgcatgctcaatggcactgtcattgggcccgggaagactgtgatgatcgatgtgtgc7800acgacctgccgctgcatggtgcaggtgggggtcatctctggattcaagctggagtgcagg7860aagaccacctgcaacccctgccccctgggttacaaggaagaaaataacacaggtgaatgt7920tgtgggagatgtttgcctacggcttgcaccattcagctaagaggaggacagatcatgaca7980ctgaagcgtgatgagacgctccaggatggctgtgatactcacttctgcaaggtcaatgag8040agaggagagtacttctgggagaagagggtcacaggctgcccaccctttgatgaacacaag8100tgtcttgctgagggaggtaaaattatgaaaattccaggcacctgctgtgacacatgtgag8160gagcctgagtgcaacgacatcactgccaggctgcagtatgtcaaggtgggaagctgtaag8220tctgaagtagaggtggatatccactactgccagggcaaatgtgccagcaaagccatgtac8280tccattgacatcaacgatgtgcaggaccagtgctcctgctgctctccgacacggacggag8340cccatgcaggtggccctgcactgcaccaatggctctgttgtgtaccatgaggttctcaat8400gccatggagtgcaaatgctcccccaggaagtgcagcaagtga8442<210>129<211>2809<212>prt<213>人工序列<220><223>人vwf<220><221>尚未归类的特征<222>(540)..(540)<223>xaa可以是任何天然存在的氨基酸<220><221>尚未归类的特征<222>(1944)..(1944)<223>xaa可以是任何天然存在的氨基酸<220><221>尚未归类的特征<222>(2012)..(2012)<223>xaa可以是任何天然存在的氨基酸<400>129metileproalaargphealaglyvalleuleualaleualaleuile151015leuproglythrleucysalagluglythrargglyargserserthr202530alaargcysserleupheglyseraspphevalasnthrpheaspgly354045sermettyrserphealaglytyrcyssertyrleuleualaglygly505560cysglnlysargserpheserileileglyasppheglnasnglylys65707580argvalserleuservaltyrleuglygluphepheaspilehisleu859095phevalasnglythrvalthrglnglyaspglnargvalsermetpro100105110tyralaserlysglyleutyrleugluthrglualaglytyrtyrlys115120125leuserglyglualatyrglyphevalalaargileaspglysergly130135140asnpheglnvalleuleuseraspargtyrpheasnlysthrcysgly145150155160leucysglyasnpheasnilephealagluaspaspphemetthrgln165170175gluglythrleuthrseraspprotyraspphealaasnsertrpala180185190leuserserglygluglntrpcysgluargalaserproproserser195200205sercysasnileserserglyglumetglnlysglyleutrpglugln210215220cysglnleuleulysserthrservalphealaargcyshisproleu225230235240valaspprogluprophevalcysglulysthrleucysglucysala245250255glyglyleuglucysalacysproalaleuleuglutyralaargthr260265270cysalaglngluglymetvalleutyrglytrpthrasphisserala275280285cysserprovalcysproalaglymetglutyrargglncysvalser290295300procysalaargthrcysglnserleuhisileasnglumetcysgln305310315320gluargcysvalaspglycyssercysprogluglyglnleuleuasp325330335gluglyleucysvalgluserthrglucysprocysvalhissergly340345350lysargtyrproproglythrserleuserargaspcysasnthrcys355360365ilecysargasnserglntrpilecysserasngluglucysprogly370375380glucysleuvalthrglyglnserhisphelysserpheaspasnarg385390395400tyrphethrpheserglyilecysglntyrleuleualaargaspcys405410415glnasphisserpheserilevalilegluthrvalglncysalaasp420425430aspargaspalavalcysthrargservalthrvalargleuprogly435440445leuhisasnserleuvallysleulyshisglyalaglyvalalamet450455460aspglyglnaspileglnleuproleuleulysglyaspleuargile465470475480glnhisthrvalthralaservalargleusertyrglygluaspleu485490495glnmetasptrpaspglyargglyargleuleuvallysleuserpro500505510valtyralaglylysthrcysglyleucysglyasntyrasnglyasn515520525glnglyaspasppheleuthrproserglyleuxaagluproargval530535540gluasppheglyasnalatrplysleuhisglyaspcysglnaspleu545550555560glnlysglnhisseraspprocysalaleuasnproargmetthrarg565570575phesergluglualacysalavalleuthrserprothrphegluala580585590cyshisargalavalserproleuprotyrleuargasncysargtyr595600605aspvalcyssercysseraspglyargglucysleucysglyalaser610615620tyralaalaalacysalaglyargglyvalargvalalatrpargglu625630635640proglyargcysgluleuasncysprolysglyglnvaltyrleugln645650655cysglythrprocysasnleuthrcysargserleusertyrproasp660665670gluglucysasnglualacysleugluglycysphecysproprogly675680685leutyrmetaspgluargglyaspcysvalprolysalaglncyspro690695700cystyrtyraspglygluilepheglnprogluaspilepheserasp705710715720hishisthrmetcystyrcysgluaspglyphemethiscysthrmet725730735serglyvalproglyserleuleuproaspalavalleuserserpro740745750leuserhisargserlysargserleusercysargproprometval755760765lysleuvalcysproalaaspasnleuargalagluglyleuglucys770775780thrlysthrcysglnasntyraspleuglucysmetsermetglycys785790795800valserglycysleucysproproglymetvalarghisgluasnarg805810815cysvalalaleugluargcysprocysphehisglnglylysglutyr820825830alaproglygluthrvallysileglycysasnthrcysvalcysarg835840845asparglystrpasncysthrasphisvalcysaspalathrcysser850855860thrileglymetalahistyrleuthrpheaspglyleulystyrleu865870875880pheproglyglucysglntyrvalleuvalglnasptyrcysglyser885890895asnproglythrpheargileleuvalglyasnlysglycysserhis900905910proservallyscyslyslysargvalthrileleuvalgluglygly915920925gluilegluleupheaspglygluvalasnvallysargprometlys930935940aspgluthrhisphegluvalvalgluserglyargtyrileileleu945950955960leuleuglylysalaleuservalvaltrpasparghisleuserile965970975servalvalleulysglnthrtyrglnglulysvalcysglyleucys980985990glyasnpheaspglyileglnasnasnaspleuthrserserasnleu99510001005glnvalglugluaspprovalasppheglyasnsertrplysval101010151020serserglncysalaaspthrarglysvalproleuaspserser102510301035proalathrcyshisasnasnilemetlysglnthrmetvalasp104010451050sersercysargileleuthrseraspvalpheglnaspcysasn105510601065lysleuvalaspprogluprotyrleuaspvalcysiletyrasp107010751080thrcyssercysgluserileglyaspcysalacysphecysasp108510901095thrilealaalatyralahisvalcysalaglnhisglylysval110011051110valthrtrpargthralathrleucysproglnsercysgluglu111511201125argasnleuarggluasnglytyrglucysglutrpargtyrasn113011351140sercysalaproalacysglnvalthrcysglnhisproglupro114511501155leualacysprovalglncysvalgluglycyshisalahiscys116011651170proproglylysileleuaspgluleuleuglnthrcysvalasp117511801185progluaspcysprovalcysgluvalalaglyargargpheala119011951200serglylyslysvalthrleuasnproseraspprogluhiscys120512101215glnilecyshiscysaspvalvalasnleuthrcysglualacys122012251230glngluproglyglyleuvalvalproprothraspalaproval123512401245serprothrthrleutyrvalgluaspilesergluproproleu125012551260hisaspphetyrcysserargleuleuaspleuvalpheleuleu126512701275aspglyserserargleuserglualagluphegluvalleulys128012851290alaphevalvalaspmetmetgluargleuargileserglnlys129513001305trpvalargvalalavalvalglutyrhisaspglyserhisala131013151320tyrileglyleulysasparglysargprosergluleuargarg132513301335ilealaserglnvallystyralaglyserglnvalalaserthr134013451350sergluvalleulystyrthrleupheglnilepheserlysile135513601365aspargproglualaserargilealaleuleuleumetalaser137013751380glngluproglnargmetserargasnphevalargtyrvalgln138513901395glyleulyslyslyslysvalilevalileprovalglyilegly140014051410prohisalaasnleulysglnileargleuileglulysglnala141514201425progluasnlysalaphevalleuserservalaspgluleuglu143014351440glnglnargaspgluilevalsertyrleucysaspleualapro144514501455glualaproproprothrleuproproaspmetalaglnvalthr146014651470valglyproglyleuleuglyvalserthrleuglyprolysarg147514801485asnsermetvalleuaspvalalaphevalleugluglyserasp149014951500lysileglyglualaasppheasnargserlysgluphemetglu150515101515gluvalileglnargmetaspvalglyglnaspserilehisval152015251530thrvalleuglntyrsertyrmetvalthrvalglutyrprophe153515401545serglualaglnserlysglyaspileleuglnargvalargglu155015551560ileargtyrglnglyglyasnargthrasnthrglyleualaleu156515701575argtyrleuserasphisserpheleuvalserglnglyasparg158015851590gluglnalaproasnleuvaltyrmetvalthrglyasnproala159516001605seraspgluilelysargleuproglyaspileglnvalvalpro161016151620ileglyvalglyproasnalaasnvalglngluleugluargile162516301635glytrpproasnalaproileleuileglnaspphegluthrleu164016451650proargglualaproaspleuvalleuglnargcyscyssergly165516601665gluglyleuglnileprothrleuserproalaproaspcysser167016751680glnproleuaspvalileleuleuleuaspglyserserserphe168516901695proalasertyrpheaspglumetlysserphealalysalaphe170017051710ileserlysalaasnileglyproargleuthrglnvalserval171517201725leuglntyrglyserilethrthrileaspvalprotrpasnval173017351740valproglulysalahisleuleuserleuvalaspvalmetgln174517501755arggluglyglyproserglnileglyaspalaleuglypheala176017651770valargtyrleuthrserglumethisglyalaargproglyala177517801785serlysalavalvalileleuvalthraspvalservalaspser179017951800valaspalaalaalaaspalaalaargserasnargvalthrval180518101815pheproileglyileglyaspargtyraspalaalaglnleuarg182018251830ileleualaglyproalaglyaspserasnvalvallysleugln183518401845argilegluaspleuprothrmetvalthrleuglyasnserphe185018551860leuhislysleucysserglyphevalargilecysmetaspglu186518701875aspglyasnglulysargproglyaspvaltrpthrleuproasp188018851890glncyshisthrvalthrcysglnproaspglyglnthrleuleu189519001905lysserhisargvalasncysaspargglyleuargprosercys191019151920proasnserglnserprovallysvalglugluthrcysglycys192519301935argtrpthrcysproxaavalcysthrglyserserthrarghis194019451950ilevalthrpheaspglyglnasnphelysleuthrglysercys195519601965sertyrvalleupheglnasnlysgluglnaspleugluvalile197019751980leuhisasnglyalacysserproglyalaargglnglycysmet198519901995lysserilegluvallyshisseralaleuservalgluxaahis200020052010seraspmetgluvalthrvalasnglyargleuvalservalpro201520202025tyrvalglyglyasnmetgluvalasnvaltyrglyalailemet203020352040hisgluvalargpheasnhisleuglyhisilephethrphethr204520502055proglnasnasnglupheglnleuglnleuserprolysthrphe206020652070alaserlysthrtyrglyleucysglyilecysaspgluasngly207520802085alaasnaspphemetleuargaspglythrvalthrthrasptrp209020952100lysthrleuvalglnglutrpthrvalglnargproglyglnthr210521102115cysglnproileleuglugluglncysleuvalproaspserser212021252130hiscysglnvalleuleuleuproleuphealaglucyshislys213521402145valleualaproalathrphetyralailecysglnglnaspser215021552160cyshisglngluglnvalcysgluvalilealasertyralahis216521702175leucysargthrasnglyvalcysvalasptrpargthrproasp218021852190phecysalametsercysproproserleuvaltyrasnhiscys219522002205gluhisglycysproarghiscysaspglyasnvalsersercys221022152220glyasphisprosergluglycysphecysproproasplysval222522302235metleugluglysercysvalprogluglualacysthrglncys224022452250ileglygluaspglyvalglnhisglnpheleuglualatrpval225522602265proasphisglnprocysglnilecysthrcysleuserglyarg227022752280lysvalasncysthrthrglnprocysprothralalysalapro228522902295thrcysglyleucysgluvalalaargleuargglnasnalaasp230023052310glncyscysproglutyrglucysvalcysaspprovalsercys231523202325aspleuproprovalprohiscysgluargglyleuglnprothr233023352340leuthrasnproglyglucysargproasnphethrcysalacys234523502355arglysgluglucyslysargvalserproprosercyspropro236023652370hisargleuprothrleuarglysthrglncyscysaspglutyr237523802385glucysalacysasncysvalasnserthrvalsercysproleu239023952400glytyrleualaserthralathrasnaspcysglycysthrthr240524102415thrthrcysleuproasplysvalcysvalhisargserthrile242024252430tyrprovalglyglnphetrpglugluglycysaspvalcysthr243524402445cysthraspmetgluaspalavalmetglyleuargvalalagln245024552460cysserglnlysprocysgluaspsercysargserglyphethr246524702475tyrvalleuhisgluglyglucyscysglyargcysleuproser248024852490alacysgluvalvalthrglyserproargglyaspserglnser249525002505sertrplysservalglyserglntrpalaserprogluasnpro251025152520cysleuileasnglucysvalargvallysglugluvalpheile252525302535glnglnargasnvalsercysproglnleugluvalprovalcys254025452550proserglypheglnleusercyslysthrseralacyscyspro255525602565sercysargcysgluargmetglualacysmetleuasnglythr257025752580valileglyproglylysthrvalmetileaspvalcysthrthr258525902595cysargcysmetvalglnvalglyvalileserglyphelysleu260026052610glucysarglysthrthrcysasnprocysproleuglytyrlys261526202625glugluasnasnthrglyglucyscysglyargcysleuprothr263026352640alacysthrileglnleuargglyglyglnilemetthrleulys264526502655argaspgluthrleuglnaspglycysaspthrhisphecyslys266026652670valasngluargglyglutyrphetrpglulysargvalthrgly267526802685cyspropropheaspgluhislyscysleualagluglyglylys269026952700ilemetlysileproglythrcyscysaspthrcysgluglupro270527102715glucysasnaspilethralaargleuglntyrvallysvalgly272027252730sercyslyssergluvalgluvalaspilehistyrcysglngly273527402745lyscysalaserlysalamettyrserileaspileasnaspval275027552760glnaspglncyssercyscysserprothrargthrglupromet276527702775glnvalalaleuhiscysthrasnglyservalvaltyrhisglu278027852790valleuasnalametglucyslyscysserproarglyscysser279528002805lys<210>130<211>36<212>prt<213>人工序列<220><223>ae36<400>130glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrpro35<210>131<211>42<212>prt<213>人工序列<220><223>ae42<400>131glyalaproglyserproalaglyserprothrserthrgluglugly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproalaserser3540<210>132<211>78<212>prt<213>人工序列<220><223>ae72<400>132glyalaprothrsergluseralathrprogluserglyproglyser151015gluproalathrserglysergluthrproglythrsergluserala202530thrprogluserglyproglysergluproalathrserglyserglu354045thrproglythrsergluseralathrprogluserglyproglythr505560serthrgluprosergluglyseralaproglyalaserser657075<210>133<211>78<212>prt<213>人工序列<220><223>ae78<400>133glyalaprothrsergluseralathrprogluserglyproglyser151015gluproalathrserglysergluthrproglythrsergluserala202530thrprogluserglyproglysergluproalathrserglyserglu354045thrproglythrsergluseralathrprogluserglyproglythr505560serthrgluprosergluglyseralaproglyalaserser657075<210>134<211>143<212>prt<213>人工序列<220><223>ae144<400>134glysergluproalathrserglysergluthrproglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglyserglupro505560alathrserglysergluthrproglysergluproalathrsergly65707580sergluthrproglysergluproalathrserglysergluthrpro859095glythrserthrgluprosergluglyseralaproglythrserglu100105110seralaprogluserglyproglysergluproalathrserglyser115120125gluthrproglythrserthrgluprosergluglyseralapro130135140<210>135<211>144<212>prt<213>人工序列<220><223>ae144_6b<400>135thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrproglyserproalaglyserprothrser65707580thrglugluglythrserthrgluprosergluglyseralaprogly859095thrserthrgluprosergluglyseralaproglysergluproala100105110thrserglysergluthrproglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>136<211>144<212>prt<213>人工序列<220><223>ag144<400>136glythrproglyserglythralaserserserproglyserserthr151015proserglyalathrglyserproglyserserproseralaserthr202530glythrglyproglyserserproseralaserthrglythrglypro354045glyalaserproglythrserserthrglyserproglyalaserpro505560glythrserserthrglyserproglyserserthrproserglyala65707580thrglyserproglyserserproseralaserthrglythrglypro859095glyalaserproglythrserserthrglyserproglyserserpro100105110seralaserthrglythrglyproglythrproglyserglythrala115120125serserserproglyserserthrproserglyalathrglyserpro130135140<210>137<211>144<212>prt<213>人工序列<220><223>ag144_a<400>137glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140<210>138<211>288<212>prt<213>人工序列<220><223>ae288<400>138glythrsergluseralathrprogluserglyproglyserglupro151015alathrserglysergluthrproglythrsergluseralathrpro202530gluserglyproglysergluproalathrserglysergluthrpro354045glythrsergluseralathrprogluserglyproglythrserthr505560gluprosergluglyseralaproglyserproalaglyserprothr65707580serthrglugluglythrsergluseralathrprogluserglypro859095glysergluproalathrserglysergluthrproglythrserglu100105110seralathrprogluserglyproglyserproalaglyserprothr115120125serthrglugluglyserproalaglyserprothrserthrgluglu130135140glythrserthrgluprosergluglyseralaproglythrserglu145150155160seralathrprogluserglyproglythrsergluseralathrpro165170175gluserglyproglythrsergluseralathrprogluserglypro180185190glysergluproalathrserglysergluthrproglyserglupro195200205alathrserglysergluthrproglyserproalaglyserprothr210215220serthrglugluglythrserthrgluprosergluglyseralapro225230235240glythrserthrgluprosergluglyseralaproglyserglupro245250255alathrserglysergluthrproglythrsergluseralathrpro260265270gluserglyproglythrserthrgluprosergluglyseralapro275280285<210>139<211>288<212>prt<213>人工序列<220><223>ae288_2<400>139glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglysergluproalathrsergly202530sergluthrproglythrsergluseralathrprogluserglypro354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrserthrgluproserglu65707580glyseralaproglythrserthrgluprosergluglyseralapro859095glythrserthrgluprosergluglyseralaproglythrserthr100105110gluprosergluglyseralaproglyserproalaglyserprothr115120125serthrglugluglythrserthrgluprosergluglyseralapro130135140glythrsergluseralathrprogluserglyproglyserglupro145150155160alathrserglysergluthrproglythrsergluseralathrpro165170175gluserglyproglysergluproalathrserglysergluthrpro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglyserproalaglyserprothrserthrgluglu225230235240glyserproalaglyserprothrserthrglugluglyserproala245250255glyserprothrserthrglugluglythrsergluseralathrpro260265270gluserglyproglythrserthrgluprosergluglyseralapro275280285<210>140<211>288<212>prt<213>人工序列<220><223>ag288<400>140proglyalaserproglythrserserthrglyserproglyalaser151015proglythrserserthrglyserproglythrproglyserglythr202530alaserserserproglyserserthrproserglyalathrglyser354045proglythrproglyserglythralaserserserproglyserser505560thrproserglyalathrglyserproglythrproglyserglythr65707580alaserserserproglyserserthrproserglyalathrglyser859095proglyserserthrproserglyalathrglyserproglyserser100105110proseralaserthrglythrglyproglyserserproseralaser115120125thrglythrglyproglyalaserproglythrserserthrglyser130135140proglythrproglyserglythralaserserserproglyserser145150155160thrproserglyalathrglyserproglyserserproseralaser165170175thrglythrglyproglyserserproseralaserthrglythrgly180185190proglyalaserproglythrserserthrglyserproglyalaser195200205proglythrserserthrglyserproglyserserthrprosergly210215220alathrglyserproglyserserproseralaserthrglythrgly225230235240proglyalaserproglythrserserthrglyserproglyserser245250255proseralaserthrglythrglyproglythrproglyserglythr260265270alaserserserproglyserserthrproserglyalathrglyser275280285<210>141<211>576<212>prt<213>人工序列<220><223>ae576<400>141glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglythrserthrgluproserglu202530glyseralaproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrsergluseralathrpro65707580gluserglyproglysergluproalathrserglysergluthrpro859095glysergluproalathrserglysergluthrproglyserproala100105110glyserprothrserthrglugluglythrsergluseralathrpro115120125gluserglyproglythrserthrgluprosergluglyseralapro130135140glythrserthrgluprosergluglyseralaproglyserproala145150155160glyserprothrserthrglugluglythrserthrgluproserglu165170175glyseralaproglythrserthrgluprosergluglyseralapro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglysergluproalathrserglysergluthrpro225230235240glythrserthrgluprosergluglyseralaproglythrserthr245250255gluprosergluglyseralaproglythrsergluseralathrpro260265270gluserglyproglythrsergluseralathrprogluserglypro275280285glyserproalaglyserprothrserthrglugluglythrserglu290295300seralathrprogluserglyproglysergluproalathrsergly305310315320sergluthrproglythrsergluseralathrprogluserglypro325330335glythrserthrgluprosergluglyseralaproglythrserthr340345350gluprosergluglyseralaproglythrserthrgluproserglu355360365glyseralaproglythrserthrgluprosergluglyseralapro370375380glythrserthrgluprosergluglyseralaproglythrserthr385390395400gluprosergluglyseralaproglyserproalaglyserprothr405410415serthrglugluglythrserthrgluprosergluglyseralapro420425430glythrsergluseralathrprogluserglyproglyserglupro435440445alathrserglysergluthrproglythrsergluseralathrpro450455460gluserglyproglysergluproalathrserglysergluthrpro465470475480glythrsergluseralathrprogluserglyproglythrserthr485490495gluprosergluglyseralaproglythrsergluseralathrpro500505510gluserglyproglyserproalaglyserprothrserthrgluglu515520525glyserproalaglyserprothrserthrglugluglyserproala530535540glyserprothrserthrglugluglythrsergluseralathrpro545550555560gluserglyproglythrserthrgluprosergluglyseralapro565570575<210>142<211>576<212>prt<213>人工序列<220><223>ag576<400>142proglythrproglyserglythralaserserserproglyserser151015thrproserglyalathrglyserproglyserserproseralaser202530thrglythrglyproglyserserproseralaserthrglythrgly354045proglyserserthrproserglyalathrglyserproglyserser505560thrproserglyalathrglyserproglyalaserproglythrser65707580serthrglyserproglyalaserproglythrserserthrglyser859095proglyalaserproglythrserserthrglyserproglythrpro100105110glyserglythralaserserserproglyalaserproglythrser115120125serthrglyserproglyalaserproglythrserserthrglyser130135140proglyalaserproglythrserserthrglyserproglyserser145150155160proseralaserthrglythrglyproglythrproglyserglythr165170175alaserserserproglyalaserproglythrserserthrglyser180185190proglyalaserproglythrserserthrglyserproglyalaser195200205proglythrserserthrglyserproglyserserthrprosergly210215220alathrglyserproglyserserthrproserglyalathrglyser225230235240proglyalaserproglythrserserthrglyserproglythrpro245250255glyserglythralaserserserproglyserserthrprosergly260265270alathrglyserproglyserserthrproserglyalathrglyser275280285proglyserserthrproserglyalathrglyserproglyserser290295300proseralaserthrglythrglyproglyalaserproglythrser305310315320serthrglyserproglyalaserproglythrserserthrglyser325330335proglythrproglyserglythralaserserserproglyalaser340345350proglythrserserthrglyserproglyalaserproglythrser355360365serthrglyserproglyalaserproglythrserserthrglyser370375380proglyalaserproglythrserserthrglyserproglythrpro385390395400glyserglythralaserserserproglyserserthrprosergly405410415alathrglyserproglythrproglyserglythralaserserser420425430proglyserserthrproserglyalathrglyserproglythrpro435440445glyserglythralaserserserproglyserserthrprosergly450455460alathrglyserproglyserserthrproserglyalathrglyser465470475480proglyserserproseralaserthrglythrglyproglyserser485490495proseralaserthrglythrglyproglyalaserproglythrser500505510serthrglyserproglythrproglyserglythralaserserser515520525proglyserserthrproserglyalathrglyserproglyserser530535540proseralaserthrglythrglyproglyserserproseralaser545550555560thrglythrglyproglyalaserproglythrserserthrglyser565570575<210>143<211>864<212>prt<213>人工序列<220><223>ae864<400>143glyserproalaglyserprothrserthrglugluglythrserglu151015seralathrprogluserglyproglythrserthrgluproserglu202530glyseralaproglyserproalaglyserprothrserthrgluglu354045glythrserthrgluprosergluglyseralaproglythrserthr505560gluprosergluglyseralaproglythrsergluseralathrpro65707580gluserglyproglysergluproalathrserglysergluthrpro859095glysergluproalathrserglysergluthrproglyserproala100105110glyserprothrserthrglugluglythrsergluseralathrpro115120125gluserglyproglythrserthrgluprosergluglyseralapro130135140glythrserthrgluprosergluglyseralaproglyserproala145150155160glyserprothrserthrglugluglythrserthrgluproserglu165170175glyseralaproglythrserthrgluprosergluglyseralapro180185190glythrsergluseralathrprogluserglyproglythrserthr195200205gluprosergluglyseralaproglythrsergluseralathrpro210215220gluserglyproglysergluproalathrserglysergluthrpro225230235240glythrserthrgluprosergluglyseralaproglythrserthr245250255gluprosergluglyseralaproglythrsergluseralathrpro260265270gluserglyproglythrsergluseralathrprogluserglypro275280285glyserproalaglyserprothrserthrglugluglythrserglu290295300seralathrprogluserglyproglysergluproalathrsergly305310315320sergluthrproglythrsergluseralathrprogluserglypro325330335glythrserthrgluprosergluglyseralaproglythrserthr340345350gluprosergluglyseralaproglythrserthrgluproserglu355360365glyseralaproglythrserthrgluprosergluglyseralapro370375380glythrserthrgluprosergluglyseralaproglythrserthr385390395400gluprosergluglyseralaproglyserproalaglyserprothr405410415serthrglugluglythrserthrgluprosergluglyseralapro420425430glythrsergluseralathrprogluserglyproglyserglupro435440445alathrserglysergluthrproglythrsergluseralathrpro450455460gluserglyproglysergluproalathrserglysergluthrpro465470475480glythrsergluseralathrprogluserglyproglythrserthr485490495gluprosergluglyseralaproglythrsergluseralathrpro500505510gluserglyproglyserproalaglyserprothrserthrgluglu515520525glyserproalaglyserprothrserthrglugluglyserproala530535540glyserprothrserthrglugluglythrsergluseralathrpro545550555560gluserglyproglythrserthrgluprosergluglyseralapro565570575glythrsergluseralathrprogluserglyproglyserglupro580585590alathrserglysergluthrproglythrsergluseralathrpro595600605gluserglyproglysergluproalathrserglysergluthrpro610615620glythrsergluseralathrprogluserglyproglythrserthr625630635640gluprosergluglyseralaproglyserproalaglyserprothr645650655serthrglugluglythrsergluseralathrprogluserglypro660665670glysergluproalathrserglysergluthrproglythrserglu675680685seralathrprogluserglyproglyserproalaglyserprothr690695700serthrglugluglyserproalaglyserprothrserthrgluglu705710715720glythrserthrgluprosergluglyseralaproglythrserglu725730735seralathrprogluserglyproglythrsergluseralathrpro740745750gluserglyproglythrsergluseralathrprogluserglypro755760765glysergluproalathrserglysergluthrproglyserglupro770775780alathrserglysergluthrproglyserproalaglyserprothr785790795800serthrglugluglythrserthrgluprosergluglyseralapro805810815glythrserthrgluprosergluglyseralaproglyserglupro820825830alathrserglysergluthrproglythrsergluseralathrpro835840845gluserglyproglythrserthrgluprosergluglyseralapro850855860<210>144<211>864<212>prt<213>人工序列<220><223>ag864<400>144glyalaserproglythrserserthrglyserproglyserserpro151015seralaserthrglythrglyproglyserserproseralaserthr202530glythrglyproglythrproglyserglythralaserserserpro354045glyserserthrproserglyalathrglyserproglyserserpro505560seralaserthrglythrglyproglyalaserproglythrserser65707580thrglyserproglythrproglyserglythralaserserserpro859095glyserserthrproserglyalathrglyserproglythrprogly100105110serglythralaserserserproglyalaserproglythrserser115120125thrglyserproglyalaserproglythrserserthrglyserpro130135140glythrproglyserglythralaserserserproglyserserthr145150155160proserglyalathrglyserproglyalaserproglythrserser165170175thrglyserproglythrproglyserglythralaserserserpro180185190glyserserthrproserglyalathrglyserproglyserserpro195200205seralaserthrglythrglyproglyserserproseralaserthr210215220glythrglyproglyserserthrproserglyalathrglyserpro225230235240glyserserthrproserglyalathrglyserproglyalaserpro245250255glythrserserthrglyserproglyalaserproglythrserser260265270thrglyserproglyalaserproglythrserserthrglyserpro275280285glythrproglyserglythralaserserserproglyalaserpro290295300glythrserserthrglyserproglyalaserproglythrserser305310315320thrglyserproglyalaserproglythrserserthrglyserpro325330335glyserserproseralaserthrglythrglyproglythrprogly340345350serglythralaserserserproglyalaserproglythrserser355360365thrglyserproglyalaserproglythrserserthrglyserpro370375380glyalaserproglythrserserthrglyserproglyserserthr385390395400proserglyalathrglyserproglyserserthrproserglyala405410415thrglyserproglyalaserproglythrserserthrglyserpro420425430glythrproglyserglythralaserserserproglyserserthr435440445proserglyalathrglyserproglyserserthrproserglyala450455460thrglyserproglyserserthrproserglyalathrglyserpro465470475480glyserserproseralaserthrglythrglyproglyalaserpro485490495glythrserserthrglyserproglyalaserproglythrserser500505510thrglyserproglythrproglyserglythralaserserserpro515520525glyalaserproglythrserserthrglyserproglyalaserpro530535540glythrserserthrglyserproglyalaserproglythrserser545550555560thrglyserproglyalaserproglythrserserthrglyserpro565570575glythrproglyserglythralaserserserproglyserserthr580585590proserglyalathrglyserproglythrproglyserglythrala595600605serserserproglyserserthrproserglyalathrglyserpro610615620glythrproglyserglythralaserserserproglyserserthr625630635640proserglyalathrglyserproglyserserthrproserglyala645650655thrglyserproglyserserproseralaserthrglythrglypro660665670glyserserproseralaserthrglythrglyproglyalaserpro675680685glythrserserthrglyserproglythrproglyserglythrala690695700serserserproglyserserthrproserglyalathrglyserpro705710715720glyserserproseralaserthrglythrglyproglyserserpro725730735seralaserthrglythrglyproglyalaserproglythrserser740745750thrglyserproglyalaserproglythrserserthrglyserpro755760765glyserserthrproserglyalathrglyserproglyserserpro770775780seralaserthrglythrglyproglyalaserproglythrserser785790795800thrglyserproglyserserproseralaserthrglythrglypro805810815glythrproglyserglythralaserserserproglyserserthr820825830proserglyalathrglyserproglyserserthrproserglyala835840845thrglyserproglyalaserproglythrserserthrglyserpro850855860<210>145<211>72<212>prt<213>人工序列<220><223>xten_ae72_2a_1<400>145thrserthrgluprosergluglyseralaproglyserproalagly151015serprothrserthrglugluglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>146<211>72<212>prt<213>人工序列<220><223>xten_ae72_2a_2<400>146thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045thrsergluseralathrprogluserglyproglythrsergluser505560alathrprogluserglyprogly6570<210>147<211>72<212>prt<213>人工序列<220><223>xten_ae72_3b_1<400>147serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaprogly6570<210>148<211>72<212>prt<213>人工序列<220><223>xten_ae72_3b_2<400>148thrserthrgluprosergluglyseralaproglythrserthrglu151015prosergluglyseralaproglythrserthrgluproserglugly202530seralaproglythrserthrgluprosergluglyseralaprogly354045serproalaglyserprothrserthrglugluglythrserthrglu505560prosergluglyseralaprogly6570<210>149<211>72<212>prt<213>人工序列<220><223>xten_ae72_4a_2<400>149thrsergluseralathrprogluserglyproglyserproalagly151015serprothrserthrglugluglyserproalaglyserprothrser202530thrglugluglyserproalaglyserprothrserthrgluglugly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>150<211>72<212>prt<213>人工序列<220><223>xten_ae72_5a_2<400>150serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglysergluproalathrserglyser202530gluthrproglythrsergluseralathrprogluserglyprogly354045serproalaglyserprothrserthrglugluglyserproalagly505560serprothrserthrgluglugly6570<210>151<211>72<212>prt<213>人工序列<220><223>xten_ae72_6b_1<400>151thrserthrgluprosergluglyseralaproglythrsergluser151015alathrprogluserglyproglythrsergluseralathrproglu202530serglyproglythrsergluseralathrprogluserglyprogly354045sergluproalathrserglysergluthrproglysergluproala505560thrserglysergluthrprogly6570<210>152<211>72<212>prt<213>人工序列<220><223>xten_ae72_6b_2<400>152serproalaglyserprothrserthrglugluglythrserthrglu151015prosergluglyseralaproglythrserthrgluproserglugly202530seralaproglysergluproalathrserglysergluthrprogly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>153<211>72<212>prt<213>人工序列<220><223>xten_ae72_1a_1<400>153serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglythrserthrgluproserglugly202530seralaproglyserproalaglyserprothrserthrgluglugly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaprogly6570<210>154<211>72<212>prt<213>人工序列<220><223>xten_ae72_1a_2<400>154thrsergluseralathrprogluserglyproglysergluproala151015thrserglysergluthrproglysergluproalathrserglyser202530gluthrproglyserproalaglyserprothrserthrgluglugly354045thrsergluseralathrprogluserglyproglythrserthrglu505560prosergluglyseralaprogly6570<210>155<211>144<212>prt<213>人工序列<220><223>xten_ae144_1a<400>155serproalaglyserprothrserthrglugluglythrsergluser151015alathrprogluserglyproglythrserthrgluproserglugly202530seralaproglyserproalaglyserprothrserthrgluglugly354045thrserthrgluprosergluglyseralaproglythrserthrglu505560prosergluglyseralaproglythrsergluseralathrproglu65707580serglyproglysergluproalathrserglysergluthrprogly859095sergluproalathrserglysergluthrproglyserproalagly100105110serprothrserthrglugluglythrsergluseralathrproglu115120125serglyproglythrserthrgluprosergluglyseralaprogly130135140<210>156<211>150<212>prt<213>人工序列<220><223>ae150<400>156glyalaproglysergluproalathrserglysergluthrprogly151015thrsergluseralathrprogluserglyproglysergluproala202530thrserglysergluthrproglyserproalaglyserprothrser354045thrglugluglythrserthrgluprosergluglyseralaprogly505560sergluproalathrserglysergluthrproglysergluproala65707580thrserglysergluthrproglysergluproalathrserglyser859095gluthrproglythrserthrgluprosergluglyseralaprogly100105110thrsergluseralathrprogluserglyproglysergluproala115120125thrserglysergluthrproglythrserthrgluproserglugly130135140seralaproalaserser145150<210>157<211>150<212>prt<213>人工序列<220><223>g150<400>157glyalaproglythrproglyserglythralaserserserprogly151015serserthrproserglyalathrglyserproglyserserproser202530alaserthrglythrglyproglyserserproseralaserthrgly354045thrglyproglyalaserproglythrserserthrglyserprogly505560alaserproglythrserserthrglyserproglyserserthrpro65707580serglyalathrglyserproglyserserproseralaserthrgly859095thrglyproglyalaserproglythrserserthrglyserprogly100105110serserproseralaserthrglythrglyproglythrproglyser115120125glythralaserserserproglyserserthrproserglyalathr130135140glyserproalaserser145150<210>158<211>294<212>prt<213>人工序列<220><223>ae294<400>158glyalaproglythrsergluseralathrprogluserglyprogly151015sergluproalathrserglysergluthrproglythrsergluser202530alathrprogluserglyproglysergluproalathrserglyser354045gluthrproglythrsergluseralathrprogluserglyprogly505560thrserthrgluprosergluglyseralaproglyserproalagly65707580serprothrserthrglugluglythrsergluseralathrproglu859095serglyproglysergluproalathrserglysergluthrprogly100105110thrsergluseralathrprogluserglyproglyserproalagly115120125serprothrserthrglugluglyserproalaglyserprothrser130135140thrglugluglythrserthrgluprosergluglyseralaprogly145150155160thrsergluseralathrprogluserglyproglythrsergluser165170175alathrprogluserglyproglythrsergluseralathrproglu180185190serglyproglysergluproalathrserglysergluthrprogly195200205sergluproalathrserglysergluthrproglyserproalagly210215220serprothrserthrglugluglythrserthrgluproserglugly225230235240seralaproglythrserthrgluprosergluglyseralaprogly245250255sergluproalathrserglysergluthrproglythrsergluser260265270alathrprogluserglyproglythrserthrgluproserglugly275280285seralaproalaserser290<210>159<211>294<212>prt<213>人工序列<220><223>ag294<400>159glyalaproproglyalaserproglythrserserthrglyserpro151015glyalaserproglythrserserthrglyserproglythrprogly202530serglythralaserserserproglyserserthrproserglyala354045thrglyserproglythrproglyserglythralaserserserpro505560glyserserthrproserglyalathrglyserproglythrprogly65707580serglythralaserserserproglyserserthrproserglyala859095thrglyserproglyserserthrproserglyalathrglyserpro100105110glyserserproseralaserthrglythrglyproglyserserpro115120125seralaserthrglythrglyproglyalaserproglythrserser130135140thrglyserproglythrproglyserglythralaserserserpro145150155160glyserserthrproserglyalathrglyserproglyserserpro165170175seralaserthrglythrglyproglyserserproseralaserthr180185190glythrglyproglyalaserproglythrserserthrglyserpro195200205glyalaserproglythrserserthrglyserproglyserserthr210215220proserglyalathrglyserproglyserserproseralaserthr225230235240glythrglyproglyalaserproglythrserserthrglyserpro245250255glyserserproseralaserthrglythrglyproglythrprogly260265270serglythralaserserserproglyserserthrproserglyala275280285thrglyseralaserser290<210>160<211>1016<212>prt<213>人工序列<220><223>fix-连接符-白蛋白<400>160tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrpro405410415valserglnthrserlysleuthrargalagluthrvalpheproasp420425430valaspalahislyssergluvalalahisargphelysaspleugly435440445glugluasnphelysalaleuvalleuilealaphealaglntyrleu450455460glnglncysprophegluasphisvallysleuvalasngluvalthr465470475480gluphealalysthrcysvalalaaspgluseralagluasncysasp485490495lysserleuhisthrleupheglyasplysleucysthrvalalathr500505510leuarggluthrtyrglyglumetalaaspcyscysalalysglnglu515520525progluargasnglucyspheleuglnhislysaspaspasnproasn530535540leuproargleuvalargprogluvalaspvalmetcysthralaphe545550555560hisaspasnglugluthrpheleulyslystyrleutyrgluileala565570575argarghisprotyrphetyralaprogluleuleuphephealalys580585590argtyrlysalaalaphethrglucyscysglnalaalaasplysala595600605alacysleuleuprolysleuaspgluleuargaspgluglylysala610615620serseralalysglnargleulyscysalaserleuglnlysphegly625630635640gluargalaphelysalatrpalavalalaargleuserglnargphe645650655prolysalagluphealagluvalserlysleuvalthraspleuthr660665670lysvalhisthrglucyscyshisglyaspleuleuglucysalaasp675680685aspargalaaspleualalystyrilecysgluasnglnaspserile690695700serserlysleulysglucyscysglulysproleuleuglulysser705710715720hiscysilealagluvalgluasnaspglumetproalaaspleupro725730735serleualaalaaspphevalgluserlysaspvalcyslysasntyr740745750alaglualalysaspvalpheleuglymetpheleutyrglutyrala755760765argarghisproasptyrservalvalleuleuleuargleualalys770775780thrtyrgluthrthrleuglulyscyscysalaalaalaaspphecys785790795800tyralalysvalpheaspgluphelysproleuvalglugluprogln805810815asnleuilelysglnasncysgluleuphegluglnleuglyglutyr820825830lyspheglnasnalaleuleuvalargtyrthrlyslysvalprogln835840845valserthrprothrleuvalgluvalserargasnleuglylysval850855860glyserlyscyscyslyshisproglualalysargmetprocysala865870875880gluasptyrleuservalvalleuasnglnleucysvalleuhisglu885890895lysthrprovalseraspargvalthrlyscyscysthrgluserleu900905910valasnargargprocyspheseralaleugluvalaspgluthrtyr915920925valprolysglupheasnalagluthrphethrphehisalaaspile930935940cysthrleuserglulysgluargglnilelyslysglnthralaleu945950955960valgluleuvallyshislysprolysalathrlysgluglnleulys965970975alavalmetaspaspphealaalaphevalglulyscyscyslysala980985990aspasplysgluthrcysphealaglugluglylyslysleuvalala99510001005alaserglnalaalaleuglyleu10101015<210>161<211>424<212>prt<213>人工序列<220><223>fix<400>161tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrpro405410415valserglnthrserlysleuthr420<210>162<211>9<212>prt<213>人工序列<220><223>连接符<400>162argalagluthrvalpheproaspval15<210>163<211>585<212>prt<213>人工序列<220><223>白蛋白<400>163aspalahislyssergluvalalahisargphelysaspleuglyglu151015gluasnphelysalaleuvalleuilealaphealaglntyrleugln202530glncysprophegluasphisvallysleuvalasngluvalthrglu354045phealalysthrcysvalalaaspgluseralagluasncysasplys505560serleuhisthrleupheglyasplysleucysthrvalalathrleu65707580arggluthrtyrglyglumetalaaspcyscysalalysglnglupro859095gluargasnglucyspheleuglnhislysaspaspasnproasnleu100105110proargleuvalargprogluvalaspvalmetcysthralaphehis115120125aspasnglugluthrpheleulyslystyrleutyrgluilealaarg130135140arghisprotyrphetyralaprogluleuleuphephealalysarg145150155160tyrlysalaalaphethrglucyscysglnalaalaasplysalaala165170175cysleuleuprolysleuaspgluleuargaspgluglylysalaser180185190seralalysglnargleulyscysalaserleuglnlyspheglyglu195200205argalaphelysalatrpalavalalaargleuserglnargphepro210215220lysalagluphealagluvalserlysleuvalthraspleuthrlys225230235240valhisthrglucyscyshisglyaspleuleuglucysalaaspasp245250255argalaaspleualalystyrilecysgluasnglnaspserileser260265270serlysleulysglucyscysglulysproleuleuglulysserhis275280285cysilealagluvalgluasnaspglumetproalaaspleuproser290295300leualaalaaspphevalgluserlysaspvalcyslysasntyrala305310315320glualalysaspvalpheleuglymetpheleutyrglutyralaarg325330335arghisproasptyrservalvalleuleuleuargleualalysthr340345350tyrgluthrthrleuglulyscyscysalaalaalaaspprohisglu355360365cystyralalysvalpheaspgluphelysproleuvalgluglupro370375380glnasnleuilelysglnasncysgluleuphegluglnleuglyglu385390395400tyrlyspheglnasnalaleuleuvalargtyrthrlyslysvalpro405410415glnvalserthrprothrleuvalgluvalserargasnleuglylys420425430valglyserlyscyscyslyshisproglualalysargmetprocys435440445alagluasptyrleuservalvalleuasnglnleucysvalleuhis450455460glulysthrprovalseraspargvalthrlyscyscysthrgluser465470475480leuvalasnargargprocyspheseralaleugluvalaspgluthr485490495tyrvalprolysglupheasnalagluthrphethrphehisalaasp500505510ilecysthrleuserglulysgluargglnilelyslysglnthrala515520525leuvalgluleuvallyshislysprolysalathrlysgluglnleu530535540lysalavalmetaspaspphealaalaphevalglulyscyscyslys545550555560alaaspasplysgluthrcysphealaglugluglylyslysleuval565570575alaalaserglnalaalaleuglyleu580585<210>164<211>763<212>prt<213>人工序列<220><223>fix(xten)-fc<400>164metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysargtyrasn354045serglylysleuglugluphevalglnglyasnleugluargglucys505560metgluglulyscysserphegluglualaarggluvalphegluasn65707580thrgluargthrthrgluphetrplysglntyrvalaspglyaspgln859095cysgluserasnprocysleuasnglyglysercyslysaspaspile100105110asnsertyrglucystrpcyspropheglyphegluglylysasncys115120125gluleuaspvalthrcysasnilelysasnglyargcysgluglnphe130135140cyslysasnseralaaspasnlysvalvalcyssercysthrglugly145150155160tyrargleualagluasnglnlyssercysgluproalavalprophe165170175procysglyargvalservalserglnthrserlysleuthrargala180185190gluthrvalpheproaspvalasptyrvalasnserthrglualaglu195200205thrileleuaspglyproserproglyserprothrserthrgluglu210215220glythrsergluseralathrprogluserglyproglyserglupro225230235240alathrserglysergluthrproglythrsergluseralathrpro245250255gluserglyproglythrserthrgluprosergluglyseralapro260265270glythrserthrgluprosergluglyseralaproglyalaserser275280285asnilethrglnserthrglnserpheasnaspphethrargvalval290295300glyglygluaspalalysproglyglnpheprotrpglnvalvalleu305310315320asnglylysvalaspalaphecysglyglyserilevalasnglulys325330335trpilevalthralaalahiscysvalgluthrglyvallysilethr340345350valvalalaglygluhisasnileglugluthrgluhisthrglugln355360365lysargasnvalileargileileprohishisasntyrasnalaala370375380ileasnlystyrasnhisaspilealaleuleugluleuaspglupro385390395400leuvalleuasnsertyrvalthrproilecysilealaasplysglu405410415tyrthrasnilepheleulyspheglyserglytyrvalserglytrp420425430glyargvalphehislysglyargseralaleuvalleuglntyrleu435440445argvalproleuvalaspargalathrcysleuleuserthrlysphe450455460thriletyrasnasnmetphecysalaglyphehisgluglyglyarg465470475480aspsercysglnglyaspserglyglyprohisvalthrgluvalglu485490495glythrserpheleuthrglyileilesertrpglygluglucysala500505510metlysglylystyrglyiletyrthrlysvalserargtyrvalasn515520525trpilelysglulysthrlysleuthrasplysthrhisthrcyspro530535540procysproalaprogluleuleuglyglyproservalpheleuphe545550555560proprolysprolysaspthrleumetileserargthrprogluval565570575thrcysvalvalvalaspvalserhisgluaspprogluvallysphe580585590asntrptyrvalaspglyvalgluvalhisasnalalysthrlyspro595600605argglugluglntyrasnserthrtyrargvalvalservalleuthr610615620valleuhisglnasptrpleuasnglylysglutyrlyscyslysval625630635640serasnlysalaleuproalaproileglulysthrileserlysala645650655lysglyglnproarggluproglnvaltyrthrleuproproserarg660665670aspgluleuthrlysasnglnvalserleuthrcysleuvallysgly675680685phetyrproseraspilealavalglutrpgluserasnglyglnpro690695700gluasnasntyrlysthrthrproprovalleuaspseraspglyser705710715720phepheleutyrserlysleuthrvalasplysserargtrpglngln725730735glyasnvalphesercysservalmethisglualaleuhisasnhis740745750tyrthrglnlysserleuserleuserprogly755760<210>165<211>712<212>prt<213>人工序列<220><223>fix-fxia-ae288<400>165tyrasnserglylysleuglugluphevalglnglyasnleugluarg151015glucysmetgluglulyscysserphegluglualaarggluvalphe202530gluasnthrgluargthrthrgluphetrplysglntyrvalaspgly354045aspglncysgluserasnprocysleuasnglyglysercyslysasp505560aspileasnsertyrglucystrpcyspropheglyphegluglylys65707580asncysgluleuaspvalthrcysasnilelysasnglyargcysglu859095glnphecyslysasnseralaaspasnlysvalvalcyssercysthr100105110gluglytyrargleualagluasnglnlyssercysgluproalaval115120125propheprocysglyargvalservalserglnthrserlysleuthr130135140argalagluthrvalpheproaspvalasptyrvalasnserthrglu145150155160alagluthrileleuaspasnilethrglnserthrglnserpheasn165170175aspphethrargvalvalglyglygluaspalalysproglyglnphe180185190protrpglnvalvalleuasnglylysvalaspalaphecysglygly195200205serilevalasnglulystrpilevalthralaalahiscysvalglu210215220thrglyvallysilethrvalvalalaglygluhisasnilegluglu225230235240thrgluhisthrgluglnlysargasnvalileargileileprohis245250255hisasntyrasnalaalaileasnlystyrasnhisaspilealaleu260265270leugluleuaspgluproleuvalleuasnsertyrvalthrproile275280285cysilealaasplysglutyrthrasnilepheleulyspheglyser290295300glytyrvalserglytrpglyargvalphehislysglyargserala305310315320leuvalleuglntyrleuargvalproleuvalaspargalathrcys325330335leuargserthrlysphethriletyrasnasnmetphecysalagly340345350phehisgluglyglyargaspsercysglnglyaspserglyglypro355360365hisvalthrgluvalgluglythrserpheleuthrglyileileser370375380trpglygluglucysalametlysglylystyrglyiletyrthrlys385390395400valserargtyrvalasntrpilelysglulysthrlysleuthrgly405410415lysleuthrargalagluthrglyglythrsergluseralathrpro420425430gluserglyproglysergluproalathrserglysergluthrpro435440445glythrsergluseralathrprogluserglyproglyserglupro450455460alathrserglysergluthrproglythrsergluseralathrpro465470475480gluserglyproglythrserthrgluprosergluglyseralapro485490495glyserproalaglyserprothrserthrglugluglythrserglu500505510seralathrprogluserglyproglysergluproalathrsergly515520525sergluthrproglythrsergluseralathrprogluserglypro530535540glyserproalaglyserprothrserthrglugluglyserproala545550555560glyserprothrserthrglugluglythrserthrgluproserglu565570575glyseralaproglythrsergluseralathrprogluserglypro580585590glythrsergluseralathrprogluserglyproglythrserglu595600605seralathrprogluserglyproglysergluproalathrsergly610615620sergluthrproglysergluproalathrserglysergluthrpro625630635640glyserproalaglyserprothrserthrglugluglythrserthr645650655gluprosergluglyseralaproglythrserthrgluproserglu660665670glyseralaproglysergluproalathrserglysergluthrpro675680685glythrsergluseralathrprogluserglyproglythrserthr690695700gluprosergluglyseralapro705710<210>166<211>944<212>prt<213>人工序列<220><223>fix-fc-fc<400>166metglnargvalasnmetilemetalagluserproglyleuilethr151015ilecysleuleuglytyrleuleuseralaglucysthrvalpheleu202530asphisgluasnalaasnlysileleuasnargprolysargtyrasn354045serglylysleuglugluphevalglnglyasnleugluargglucys505560metgluglulyscysserphegluglualaarggluvalphegluasn65707580thrgluargthrthrgluphetrplysglntyrvalaspglyaspgln859095cysgluserasnprocysleuasnglyglysercyslysaspaspile100105110asnsertyrglucystrpcyspropheglyphegluglylysasncys115120125gluleuaspvalthrcysasnilelysasnglyargcysgluglnphe130135140cyslysasnseralaaspasnlysvalvalcyssercysthrglugly145150155160tyrargleualagluasnglnlyssercysgluproalavalprophe165170175procysglyargvalservalserglnthrserlysleuthrargala180185190gluthrvalpheproaspvalasptyrvalasnserthrglualaglu195200205thrileleuaspasnilethrglnserthrglnserpheasnaspphe210215220thrargvalvalglyglygluaspalalysproglyglnpheprotrp225230235240glnvalvalleuasnglylysvalaspalaphecysglyglyserile245250255valasnglulystrpilevalthralaalahiscysvalgluthrgly260265270vallysilethrvalvalalaglygluhisasnileglugluthrglu275280285histhrgluglnlysargasnvalileargileileprohishisasn290295300tyrasnalaalaileasnlystyrasnhisaspilealaleuleuglu305310315320leuaspgluproleuvalleuasnsertyrvalthrproilecysile325330335alaasplysglutyrthrasnilepheleulyspheglyserglytyr340345350valserglytrpglyargvalphehislysglyargseralaleuval355360365leuglntyrleuargvalproleuvalaspargalathrcysleuarg370375380serthrlysphethriletyrasnasnmetphecysalaglyphehis385390395400gluglyglyargaspsercysglnglyaspserglyglyprohisval405410415thrgluvalgluglythrserpheleuthrglyileilesertrpgly420425430gluglucysalametlysglylystyrglyiletyrthrlysvalser435440445argtyrvalasntrpilelysglulysthrlysleuthrasplysthr450455460histhrcysproprocysproalaprogluleuleuglyglyproser465470475480valpheleupheproprolysprolysaspthrleumetileserarg485490495thrprogluvalthrcysvalvalvalaspvalserhisgluasppro500505510gluvallyspheasntrptyrvalaspglyvalgluvalhisasnala515520525lysthrlysproargglugluglntyrasnserthrtyrargvalval530535540servalleuthrvalleuhisglnasptrpleuasnglylysglutyr545550555560lyscyslysvalserasnlysalaleuproalaproileglulysthr565570575ileserlysalalysglyglnproarggluproglnvaltyrthrleu580585590proproserargaspgluleuthrlysasnglnvalserleuthrcys595600605leuvallysglyphetyrproseraspilealavalglutrpgluser610615620asnglyglnprogluasnasntyrlysthrthrproprovalleuasp625630635640seraspglyserphepheleutyrserlysleuthrvalasplysser645650655argtrpglnglnglyasnvalphesercysservalmethisgluala660665670leuhisasnhistyrthrglnlysserleuserleuserproglylys675680685argargargargserglyglyglyglyserglyglyglyglysergly690695700glyglyglyserglyglyglyglyserargargargargasplysthr705710715720histhrcysproprocysproalaprogluleuleuglyglyproser725730735valpheleupheproprolysprolysaspthrleumetileserarg740745750thrprogluvalthrcysvalvalvalaspvalserhisgluasppro755760765gluvallyspheasntrptyrvalaspglyvalgluvalhisasnala770775780lysthrlysproargglugluglntyrasnserthrtyrargvalval785790795800servalleuthrvalleuhisglnasptrpleuasnglylysglutyr805810815lyscyslysvalserasnlysalaleuproalaproileglulysthr820825830ileserlysalalysglyglnproarggluproglnvaltyrthrleu835840845proproserargaspgluleuthrlysasnglnvalserleuthrcys850855860leuvallysglyphetyrproseraspilealavalglutrpgluser865870875880asnglyglnprogluasnasntyrlysthrthrproprovalleuasp885890895seraspglyserphepheleutyrserlysleuthrvalasplysser900905910argtrpglnglnglyasnvalphesercysservalmethisgluala915920925leuhisasnhistyrthrglnlysserleuserleuserproglylys930935940<210>167<211>383<212>dna<213>人工序列<220><223>细小病毒b19ky940273.1<400>167ccaaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggac60aattacgtcatttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttc120cggaattagggttggctctgggccagcttgcttggggttgccttgacactaagacaagcg180gcgcgccgcttgatcttagtggcacgtcaaccccaagcgctggcccagagccaaccctaa240ttccggaagtcccgcccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacg300taattgtccgccatcttgtaccggaagtcccgcctaccggcggcgaccggcggcatctga360tttggtgtcttcttttaaatttt383<210>168<211>248<212>dna<213>人工序列<220><223>细小病毒b19d135<400>168ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaatttt248<210>169<211>129<212>dna<213>人工序列<220><223>细小病毒v1aav2<400>169cggcgcgccgcttgatcttagtggcacgtcaaccagcgctggcccagagccaaccctaat60tccggaagtcctcagtccgccatcttgcccgcctaccggcggcgaccggcggcatcattt120ggtgttctt129<210>170<211>113<212>dna<213>人工序列<220><223>细小病毒v2<400>170ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagtgtcttcttttaaatttt113<210>171<211>340<212>dna<213>人工序列<220><223>细小病毒v3<400>171caaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggaca60attacgtcatttcctgtgacgtatttcctgtgacgtacttccggtggcgggacttccgga120attttggctctgggccagcttgcttggggttgccttgaccaagcgcgcgccgcttgatca180ccccaagcgctggcccagagccacctaaccggaagtccccccaccggaagtgacgtcaca240ggaaagacgtcacaggaagtaattgtccgccatcttgtaccggaagtcccgcaccggcgg300cgaccggcggcatctgatttggtgtcttcttttaaatttt340<210>172<211>444<212>dna<213>人工序列<220><223>细小病毒u25749.1<400>172ctcattggagggttcgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagt60tccggtcacatgcttccggtgacgcacatccggtgacgtagttccggtcacgtgcttcct120gtcacgtgtttccggtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggc180tgttaggttgaccacgcgcatgccgcgcggtcagcccaatagttaagccggaaacacgtc240accggaagtcacatgaccggaagtcacgtgaccggaaacacgtgacaggaagcacgtgac300cggaactacgtcaccggatgtgcgtcaccggaagcatgtgaccggaacttgcgtcacttc360cccctcccctgattggctggttcgaacgaacgaaccctccaatgagactcaaggacaaga420ggatattttgcgcgccaggaagtg444<210>173<211>282<212>dna<213>人工序列<220><223>细小病毒gpvaav2v1<400>173cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtg282<210>174<211>145<212>dna<213>人工序列<220><223>细小病毒gpvaav2v1<400>174ttgaccacgcgcatgccgcgcggtcagcccaatagttaagccgggtgaccacacgtgaca60ggaagcacgggatgtgcgtcaccggaagcagtgaccgggctggttcgaacgaacgaaccc120tccaactcaaggacaagaggatatt145<210>175<211>120<212>dna<213>人工序列<220><223>细小病毒gpvv2<400>175cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccgactcaaggacaagaggatattttgcgcgccaggaagtg120<210>176<211>102<212>dna<213>人工序列<220><223>细小病毒gpvv3<400>176gggaacaatcaggggaagtgaccggtgacgtcatgtaacttgcgtcacttcccgttcgaa60cgaacgaacgagactcaaggacaagaggcgcgccaggaagtg102<210>177<211>145<212>dna<213>人工序列<220><223>细小病毒aav2nc_001401.2<400>177ttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcc60cgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtg120gccaactccatcactaggggttcct145<210>178<211>130<212>dna<213>人工序列<220><223>细小病毒gtx<400>178ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcct130<210>179<211>6762<212>dna<213>人工序列<220><223>b19-fviii构建体<400>179ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaattttgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatacg300cgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaattcg360cggccgcctcgacgactagcgtttaattaaacgcgtgtctgtctgcacatttcgtagagc420gagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattc480tccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcaggga540tcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcac600acagatccacaagctcctgaggtaagtgccgtgtgtggttcccgcgggcctggcctcttt660acgggttatggcccttgcgtgccttgaattactgacactgacatccactttttctttttc720tccacagctagcgccaccatgcagattgagctgtccacttgtttcttcctgtgcctcctg780cgcttctgtttctccgccactcgccggtactaccttggagccgtggagctttcatgggac840tacatgcagagcgacctgggcgaactccccgtggatgccagattccccccccgcgtgcca900aagtccttcccctttaacacctccgtggtgtacaagaaaaccctctttgtcgagttcact960gaccacctgttcaacatcgccaagccgcgcccaccttggatgggcctcctgggaccgacc1020attcaagctgaagtgtacgacaccgtggtgatcaccctgaagaacatggcgtcccacccc1080gtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaaggagctgagtacgac1140gaccagactagccagcgggaaaaggaggacgataaagtgttcccgggcggctcgcatact1200tacgtgtggcaagtcctgaaggaaaacggacctatggcatccgatcctctgtgcctgact1260tactcctacctttcccatgtggacctcgtgaaggacctgaacagcgggctgattggtgca1320cttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccagaccctccataagttc1380atccttttgttcgctgtgttcgatgaaggaaagtcatggcattccgaaactaagaactcg1440ctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaaatgcatacagtcaac1500ggatacgtgaatcggtcactgcccgggctcatcggttgtcacagaaagtccgtgtactgg1560cacgtcatcggcatgggcactacgcctgaagtgcactccatcttcctggaagggcacacc1620ttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccgattacctttctgacc1680gcccagactctgctcatggacctggggcagttccttctcttctgccacatctccagccat1740cagcacgacggaatggaggcctacgtgaaggtggactcatgcccggaagaacctcagttg1800cggatgaagaacaacgaggaggccgaggactatgacgacgatttgactgactccgagatg1860gacgtcgtgcggttcgatgacgacaacagccccagcttcatccagattcgcagcgtggcc1920aagaagcaccccaaaacctgggtgcactacatcgcggccgaggaagaagattgggactac1980gccccgttggtgctggcacccgatgaccggtcgtacaagtcccagtatctgaacaatggt2040ccgcagcggattggcagaaagtacaagaaagtgcggttcatggcgtacactgacgaaacg2100tttaagacccgggaggccattcaacatgagagcggcattctgggaccactgctgtacgga2160gaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcccggccttacaacatc2220taccctcacggaatcaccgacgtgcggccactctactcgcggcgcctgccgaagggcgtc2280aagcacctgaaagacttccctatcctgccgggcgaaatcttcaagtataagtggaccgtc2340accgtggaggacgggcccaccaagagcgatcctaggtgtctgactcggtactactccagc2400ttcgtgaacatggaacgggacctggcatcgggactcattggaccgctgctgatctgctac2460aaagagtcggtggatcaacgcggcaaccagatcatgtccgacaagcgcaacgtgatcctg2520ttctccgtgtttgatgaaaacagatcctggtacctcactgaaaacatccagaggttcctc2580ccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgcac2640tcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgcctccatgaagtcgct2700tactggtacattctgtccatcggcgcccagactgacttcctgagcgtgttcttttccggt2760tacacctttaagcacaagatggtgtacgaagataccctgaccctgttccctttctccggc2820gaaacggtgttcatgtcgatggagaacccgggtctgtggattctgggatgccacaacagc2880gactttcggaaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaacacc2940ggagactactacgaggactcctacgaggatatctcagcctacctcctgtccaagaacaac3000gcgatcgagccgcgcagcttcagccagaacggcgcgccaacatcagagagcgccacccct3060gaaagtggtcccgggagcgagccagccacatctgggtcggaaacgccaggcacaagtgag3120tctgcaactcccgagtccggacctggctccgagcctgccactagcggctccgagactccg3180ggaacttccgagagcgctacaccagaaagcggacccggaaccagtaccgaacctagcgag3240ggctctgctccgggcagcccagccggctctcctacatccacggaggagggcacttccgaa3300tccgccaccccggagtcagggccaggatctgaacccgctacctcaggcagtgagacgcca3360ggaacgagcgagtccgctacaccggagagtgggccagggagccctgctggatctcctacg3420tccactgaggaagggtcaccagcgggctcgcccaccagcactgaagaaggtgcctcgagc3480ccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctccaatcggatcag3540gaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaagatttcgatatc3600tacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaactagacactacttt3660atcgccgcggtggaaagactgtgggactatggaatgtcatccagccctcacgtccttcgg3720aaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttccaggagttcacc3780gacggcagcttcacccagccgctgtaccggggagaactgaacgaacacctgggcctgctc3840ggtccctacatccgcgcggaagtggaggataacatcatggtgaccttccgtaaccaagca3900tccagaccttactccttctattcctccctgatctcatacgaggaggaccagcgccaaggc3960gccgagccccgcaagaacttcgtcaagcccaacgagactaagacctacttctggaaggtc4020caacaccatatggccccgaccaaggatgagtttgactgcaaggcctgggcctacttctcc4080gacgtggaccttgagaaggatgtccattccggcctgatcgggccgctgctcgtgtgtcac4140accaacaccctgaacccagcgcatggacgccaggtcaccgtccaggagtttgctctgttc4200ttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatggagcgaaactgt4260agagcgccctgcaatatccagatggaagatccgactttcaaggagaactatagattccac4320gccatcaacgggtacatcatggatactctgccggggctggtcatggcccaggatcagagg4380attcggtggtacttgctgtcaatgggatcgaacgaaaacattcactccattcacttctcc4440ggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctgtacaatctgtac4500cccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatctggagagtggag4560tgcctgatcggagagcacctccacgcggggatgtccaccctcttcctggtgtactcgaat4620aagtgccagaccccgctgggcatggcctcgggccacatcagagacttccagatcacagca4680agcggacaatacggccaatgggcgccgaagctggcccgcttgcactactccggatcgatc4740aacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctcctggcccctatg4800attatccacggaattaagacccagggcgccaggcagaagttctcctccctgtacatctcg4860caattcatcatcatgtacagcctggacgggaagaagtggcagacttacaggggaaactcc4920accggcaccctgatggtctttttcggcaacgtggattcctccggcattaagcacaacatc4980ttcaacccaccgatcatagccagatatattaggctccaccccactcactactcaatccgc5040tcaactcttcggatggaactcatggggtgcgacctgaactcctgctccatgccgttgggg5100atggaatcaaaggctattagcgacgcccagatcaccgcgagctcctacttcactaacatg5160ttcgccacctggagcccctccaaggccaggctgcacttgcagggacggtcaaatgcctgg5220cggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaaaagaccatgaaa5280gtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatgtatgtgaaggag5340ttcctgattagcagcagccaggacgggcaccagtggaccctgttcttccaaaacggaaag5400gtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaactccctggacccc5460ccactgctgacgcggtacttgaggattcatcctcagtcctgggtccatcagattgcattg5520cgaatggaagtcctgggctgcgaggcccaggacctgtactgaatcagcctgagctcgctg5580atcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatg5640ttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgctt5700cccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagg5760agttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaaccc5820ccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccc5880tccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctc5940ggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggc6000tgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcgg6060ccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgc6120gtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgatca6180gcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcc6240ttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcg6300cattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggg6360gaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgag6420gcggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagattt6480aaattagggataacagggtaatggcgcgggccgcaaaatttaaaagaagacaccaaatca6540gatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggacaattacgt6600catttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttccggaatta6660gggttggctctgggccagcgcttggggttgacgtgccactaagatcaagcggcgcgccgc6720ttgtcttagtgtcaaggcaaccccaagcaagctggcccagag6762<210>180<211>248<212>dna<213>人工序列<220><223>5'itr<400>180ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaatttt248<210>181<211>248<212>dna<213>人工序列<220><223>3'itr<400>181aaaatttaaaagaagacaccaaatcagatgccgccggtcgccgccggtaggcgggacttc60cggtacaagatggcggacaattacgtcatttcctgtgacgtcatttcctgtgacgtcact120tccggtgggcgggacttccggaattagggttggctctgggccagcgcttggggttgacgt180gccactaagatcaagcggcgcgccgcttgtcttagtgtcaaggcaaccccaagcaagctg240gcccagag248<210>182<211>6830<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>182cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtggcggcaattcagtcgata300actataacggtcctaaggtagcgatttaaatacgcgctctcttaaggtagccccgggacg360cgtcaattgagatctggatccggtaccgaattcgcggccgcctcgacgactagcgtttaa420ttaaacgcgtgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccct480aggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatc540agaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggg600gtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgaggtaag660tgccgtgtgtggttcccgcgggcctggcctctttacgggttatggcccttgcgtgccttg720aattactgacactgacatccactttttctttttctccacagctagcgccaccatgcagat780tgagctgtccacttgtttcttcctgtgcctcctgcgcttctgtttctccgccactcgccg840gtactaccttggagccgtggagctttcatgggactacatgcagagcgacctgggcgaact900ccccgtggatgccagattccccccccgcgtgccaaagtccttcccctttaacacctccgt960ggtgtacaagaaaaccctctttgtcgagttcactgaccacctgttcaacatcgccaagcc1020gcgcccaccttggatgggcctcctgggaccgaccattcaagctgaagtgtacgacaccgt1080ggtgatcaccctgaagaacatggcgtcccaccccgtgtccctgcatgcggtcggagtgtc1140ctactggaaggcctccgaaggagctgagtacgacgaccagactagccagcgggaaaagga1200ggacgataaagtgttcccgggcggctcgcatacttacgtgtggcaagtcctgaaggaaaa1260cggacctatggcatccgatcctctgtgcctgacttactcctacctttcccatgtggacct1320cgtgaaggacctgaacagcgggctgattggtgcacttctcgtgtgccgcgaaggttcgct1380cgctaaggaaaagacccagaccctccataagttcatccttttgttcgctgtgttcgatga1440aggaaagtcatggcattccgaaactaagaactcgctgatgcaggaccgggatgccgcctc1500agcccgcgcctggcctaaaatgcatacagtcaacggatacgtgaatcggtcactgcccgg1560gctcatcggttgtcacagaaagtccgtgtactggcacgtcatcggcatgggcactacgcc1620tgaagtgcactccatcttcctggaagggcacaccttcctcgtgcgcaaccaccgccaggc1680ctctctggaaatctccccgattacctttctgaccgcccagactctgctcatggacctggg1740gcagttccttctcttctgccacatctccagccatcagcacgacggaatggaggcctacgt1800gaaggtggactcatgcccggaagaacctcagttgcggatgaagaacaacgaggaggccga1860ggactatgacgacgatttgactgactccgagatggacgtcgtgcggttcgatgacgacaa1920cagccccagcttcatccagattcgcagcgtggccaagaagcaccccaaaacctgggtgca1980ctacatcgcggccgaggaagaagattgggactacgccccgttggtgctggcacccgatga2040ccggtcgtacaagtcccagtatctgaacaatggtccgcagcggattggcagaaagtacaa2100gaaagtgcggttcatggcgtacactgacgaaacgtttaagacccgggaggccattcaaca2160tgagagcggcattctgggaccactgctgtacggagaggtcggcgataccctgctcatcat2220cttcaaaaaccaggcctcccggccttacaacatctaccctcacggaatcaccgacgtgcg2280gccactctactcgcggcgcctgccgaagggcgtcaagcacctgaaagacttccctatcct2340gccgggcgaaatcttcaagtataagtggaccgtcaccgtggaggacgggcccaccaagag2400cgatcctaggtgtctgactcggtactactccagcttcgtgaacatggaacgggacctggc2460atcgggactcattggaccgctgctgatctgctacaaagagtcggtggatcaacgcggcaa2520ccagatcatgtccgacaagcgcaacgtgatcctgttctccgtgtttgatgaaaacagatc2580ctggtacctcactgaaaacatccagaggttcctcccaaaccccgcaggagtgcaactgga2640ggaccctgagtttcaggcctcgaatatcatgcactcgattaacggttacgtgttcgactc2700gctgcaactgagcgtgtgcctccatgaagtcgcttactggtacattctgtccatcggcgc2760ccagactgacttcctgagcgtgttcttttccggttacacctttaagcacaagatggtgta2820cgaagataccctgaccctgttccctttctccggcgaaacggtgttcatgtcgatggagaa2880cccgggtctgtggattctgggatgccacaacagcgactttcggaaccgcggaatgactgc2940cctgctgaaggtgtcctcatgcgacaagaacaccggagactactacgaggactcctacga3000ggatatctcagcctacctcctgtccaagaacaacgcgatcgagccgcgcagcttcagcca3060gaacggcgcgccaacatcagagagcgccacccctgaaagtggtcccgggagcgagccagc3120cacatctgggtcggaaacgccaggcacaagtgagtctgcaactcccgagtccggacctgg3180ctccgagcctgccactagcggctccgagactccgggaacttccgagagcgctacaccaga3240aagcggacccggaaccagtaccgaacctagcgagggctctgctccgggcagcccagccgg3300ctctcctacatccacggaggagggcacttccgaatccgccaccccggagtcagggccagg3360atctgaacccgctacctcaggcagtgagacgccaggaacgagcgagtccgctacaccgga3420gagtgggccagggagccctgctggatctcctacgtccactgaggaagggtcaccagcggg3480ctcgcccaccagcactgaagaaggtgcctcgagcccgcctgtgctgaagaggcaccagcg3540agaaattacccggaccaccctccaatcggatcaggaggaaatcgactacgacgacaccat3600ctcggtggaaatgaagaaggaagatttcgatatctacgacgaggacgaaaatcagtcccc3660tcgctcattccaaaagaaaactagacactactttatcgccgcggtggaaagactgtggga3720ctatggaatgtcatccagccctcacgtccttcggaaccgggcccagagcggatcggtgcc3780tcagttcaagaaagtggtgttccaggagttcaccgacggcagcttcacccagccgctgta3840ccggggagaactgaacgaacacctgggcctgctcggtccctacatccgcgcggaagtgga3900ggataacatcatggtgaccttccgtaaccaagcatccagaccttactccttctattcctc3960cctgatctcatacgaggaggaccagcgccaaggcgccgagccccgcaagaacttcgtcaa4020gcccaacgagactaagacctacttctggaaggtccaacaccatatggccccgaccaagga4080tgagtttgactgcaaggcctgggcctacttctccgacgtggaccttgagaaggatgtcca4140ttccggcctgatcgggccgctgctcgtgtgtcacaccaacaccctgaacccagcgcatgg4200acgccaggtcaccgtccaggagtttgctctgttcttcaccatttttgacgaaactaagtc4260ctggtacttcaccgagaatatggagcgaaactgtagagcgccctgcaatatccagatgga4320agatccgactttcaaggagaactatagattccacgccatcaacgggtacatcatggatac4380tctgccggggctggtcatggcccaggatcagaggattcggtggtacttgctgtcaatggg4440atcgaacgaaaacattcactccattcacttctccggtcacgtgttcactgtgcgcaagaa4500ggaggagtacaagatggcgctgtacaatctgtaccccggggtgttcgaaactgtggagat4560gctgccgtccaaggccggcatctggagagtggagtgcctgatcggagagcacctccacgc4620ggggatgtccaccctcttcctggtgtactcgaataagtgccagaccccgctgggcatggc4680ctcgggccacatcagagacttccagatcacagcaagcggacaatacggccaatgggcgcc4740gaagctggcccgcttgcactactccggatcgatcaacgcatggtccaccaaggaaccgtt4800ctcgtggattaaggtggacctcctggcccctatgattatccacggaattaagacccaggg4860cgccaggcagaagttctcctccctgtacatctcgcaattcatcatcatgtacagcctgga4920cgggaagaagtggcagacttacaggggaaactccaccggcaccctgatggtctttttcgg4980caacgtggattcctccggcattaagcacaacatcttcaacccaccgatcatagccagata5040tattaggctccaccccactcactactcaatccgctcaactcttcggatggaactcatggg5100gtgcgacctgaactcctgctccatgccgttggggatggaatcaaaggctattagcgacgc5160ccagatcaccgcgagctcctacttcactaacatgttcgccacctggagcccctccaaggc5220caggctgcacttgcagggacggtcaaatgcctggcggccgcaagtgaacaatccgaagga5280atggcttcaagtggatttccaaaagaccatgaaagtgaccggagtcaccacccagggagt5340gaagtcccttctgacctcgatgtatgtgaaggagttcctgattagcagcagccaggacgg5400gcaccagtggaccctgttcttccaaaacggaaaggtcaaggtgttccaggggaaccagga5460ctcgttcacacccgtggtgaactccctggaccccccactgctgacgcggtacttgaggat5520tcatcctcagtcctgggtccatcagattgcattgcgaatggaagtcctgggctgcgaggc5580ccaggacctgtactgaatcagcctgagctcgctgatcataatcaacctctggattacaaa5640atttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatac5700gctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctcc5760ttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgt5820ggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacc5880tgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatc5940gccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtg6000gtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggatt6060ctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcc6120cgcggcctgctgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagt6180cggatctccctttgggccgcctccccgctgatcagcctcgactgtgccttctagttgcca6240gccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccac6300tgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctat6360tctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggca6420tgctggggatgcggtgggctctatggcttctgaggcggaaagaacgggctcgagaagctt6480ctagatatcctctcttaaggtagcatcgagatttaaattagggataacagggtaatggcg6540cgggccgccacttcctggcgcgcaaaatatcctcttgtccttgagtctcattggagggtt6600cgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagttccggtcacatgct6660tccggtgacgcacatccggtgacgtagttccggtcacgtgcttcctgtcacgtgtttccg6720gtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggcttaactattgggct6780gaccgcgcggcatgcgcgtggtcaacctaacagccggaaacacgtcaccg6830<210>183<211>282<212>dna<213>人工序列<220><223>5'itr<400>183cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtg282<210>184<211>282<212>dna<213>人工序列<220><223>3'itr<400>184cacttcctggcgcgcaaaatatcctcttgtccttgagtctcattggagggttcgttcgtt60cgaaccagccaatcaggggagggggaagtgacgcaagttccggtcacatgcttccggtga120cgcacatccggtgacgtagttccggtcacgtgcttcctgtcacgtgtttccggtcacgtg180acttccggtcatgtgacttccggtgacgtgtttccggcttaactattgggctgaccgcgc240ggcatgcgcgtggtcaacctaacagccggaaacacgtcaccg282<210>185<211>383<212>dna<213>人工序列<220><223>5'itr<400>185ccaaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggac60aattacgtcatttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttc120cggaattagggttggctctgggccagcttgcttggggttgccttgacactaagacaagcg180gcgcgccgcttgatcttagtggcacgtcaaccccaagcgctggcccagagccaaccctaa240ttccggaagtcccgcccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacg300taattgtccgccatcttgtaccggaagtcccgcctaccggcggcgaccggcggcatctga360tttggtgtcttcttttaaatttt383<210>186<211>383<212>dna<213>人工序列<220><223>3'itr<400>186aaaatttaaaagaagacaccaaatcagatgccgccggtcgccgccggtaggcgggacttc60cggtacaagatggcggacaattacgtcatttcctgtgacgtcatttcctgtgacgtcact120tccggtgggcgggacttccggaattagggttggctctgggccagcgcttggggttgacgt180gccactaagatcaagcggcgcgccgcttgtcttagtgtcaaggcaaccccaagcaagctg240gcccagagccaaccctaattccggaagtcccgcccaccggaagtgacgtcacaggaaatg300acgtcacaggaaatgacgtaattgtccgccatcttgtaccggaagtcccgcctaccggcg360gcgaccggcggcatctgatttgg383<210>187<211>444<212>dna<213>人工序列<220><223>5'itr<400>187ctcattggagggttcgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagt60tccggtcacatgcttccggtgacgcacatccggtgacgtagttccggtcacgtgcttcct120gtcacgtgtttccggtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggc180tgttaggttgaccacgcgcatgccgcgcggtcagcccaatagttaagccggaaacacgtc240accggaagtcacatgaccggaagtcacgtgaccggaaacacgtgacaggaagcacgtgac300cggaactacgtcaccggatgtgcgtcaccggaagcatgtgaccggaacttgcgtcacttc360cccctcccctgattggctggttcgaacgaacgaaccctccaatgagactcaaggacaaga420ggatattttgcgcgccaggaagtg444<210>188<211>444<212>dna<213>人工序列<220><223>3'itr<400>188cacttcctggcgcgcaaaatatcctcttgtccttgagtctcattggagggttcgttcgtt60cgaaccagccaatcaggggagggggaagtgacgcaagttccggtcacatgcttccggtga120cgcacatccggtgacgtagttccggtcacgtgcttcctgtcacgtgtttccggtcacgtg180acttccggtcatgtgacttccggtgacgtgtttccggcttaactattgggctgaccgcgc240ggcatgcgcgtggtcaacctaacagccggaaacacgtcaccggaagtcacatgaccggaa300gtcacgtgaccggaaacacgtgacaggaagcacgtgaccggaactacgtcaccggatgtg360cgtcaccggaagcatgtgaccggaacttgcgtcacttccccctcccctgattggctggtt420cgaacgaacgaaccctccaatgag444<210>189<211>7032<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>189ccaaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagatggcggac60aattacgtcatttcctgtgacgtcatttcctgtgacgtcacttccggtgggcgggacttc120cggaattagggttggctctgggccagcttgcttggggttgccttgacactaagacaagcg180gcgcgccgcttgatcttagtggcacgtcaaccccaagcgctggcccagagccaaccctaa240ttccggaagtcccgcccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacg300taattgtccgccatcttgtaccggaagtcccgcctaccggcggcgaccggcggcatctga360tttggtgtcttcttttaaattttgcggcaattcagtcgataactataacggtcctaaggt420agcgatttaaatacgcgctctcttaaggtagccccgggacgcgtcaattgagatctggat480ccggtaccgaattcgcggccgcctcgacgactagcgtttaattaaacgcgtgtctgtctg540cacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgt600gtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggag660tcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcacc720aggagaagccgtcacacagatccacaagctcctgaggtaagtgccgtgtgtggttcccgc780gggcctggcctctttacgggttatggcccttgcgtgccttgaattactgacactgacatc840cactttttctttttctccacagctagcgccaccatgcagattgagctgtccacttgtttc900ttcctgtgcctcctgcgcttctgtttctccgccactcgccggtactaccttggagccgtg960gagctttcatgggactacatgcagagcgacctgggcgaactccccgtggatgccagattc1020cccccccgcgtgccaaagtccttcccctttaacacctccgtggtgtacaagaaaaccctc1080tttgtcgagttcactgaccacctgttcaacatcgccaagccgcgcccaccttggatgggc1140ctcctgggaccgaccattcaagctgaagtgtacgacaccgtggtgatcaccctgaagaac1200atggcgtcccaccccgtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaa1260ggagctgagtacgacgaccagactagccagcgggaaaaggaggacgataaagtgttcccg1320ggcggctcgcatacttacgtgtggcaagtcctgaaggaaaacggacctatggcatccgat1380cctctgtgcctgacttactcctacctttcccatgtggacctcgtgaaggacctgaacagc1440gggctgattggtgcacttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccag1500accctccataagttcatccttttgttcgctgtgttcgatgaaggaaagtcatggcattcc1560gaaactaagaactcgctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaa1620atgcatacagtcaacggatacgtgaatcggtcactgcccgggctcatcggttgtcacaga1680aagtccgtgtactggcacgtcatcggcatgggcactacgcctgaagtgcactccatcttc1740ctggaagggcacaccttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccg1800attacctttctgaccgcccagactctgctcatggacctggggcagttccttctcttctgc1860cacatctccagccatcagcacgacggaatggaggcctacgtgaaggtggactcatgcccg1920gaagaacctcagttgcggatgaagaacaacgaggaggccgaggactatgacgacgatttg1980actgactccgagatggacgtcgtgcggttcgatgacgacaacagccccagcttcatccag2040attcgcagcgtggccaagaagcaccccaaaacctgggtgcactacatcgcggccgaggaa2100gaagattgggactacgccccgttggtgctggcacccgatgaccggtcgtacaagtcccag2160tatctgaacaatggtccgcagcggattggcagaaagtacaagaaagtgcggttcatggcg2220tacactgacgaaacgtttaagacccgggaggccattcaacatgagagcggcattctggga2280ccactgctgtacggagaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcc2340cggccttacaacatctaccctcacggaatcaccgacgtgcggccactctactcgcggcgc2400ctgccgaagggcgtcaagcacctgaaagacttccctatcctgccgggcgaaatcttcaag2460tataagtggaccgtcaccgtggaggacgggcccaccaagagcgatcctaggtgtctgact2520cggtactactccagcttcgtgaacatggaacgggacctggcatcgggactcattggaccg2580ctgctgatctgctacaaagagtcggtggatcaacgcggcaaccagatcatgtccgacaag2640cgcaacgtgatcctgttctccgtgtttgatgaaaacagatcctggtacctcactgaaaac2700atccagaggttcctcccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcc2760tcgaatatcatgcactcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgc2820ctccatgaagtcgcttactggtacattctgtccatcggcgcccagactgacttcctgagc2880gtgttcttttccggttacacctttaagcacaagatggtgtacgaagataccctgaccctg2940ttccctttctccggcgaaacggtgttcatgtcgatggagaacccgggtctgtggattctg3000ggatgccacaacagcgactttcggaaccgcggaatgactgccctgctgaaggtgtcctca3060tgcgacaagaacaccggagactactacgaggactcctacgaggatatctcagcctacctc3120ctgtccaagaacaacgcgatcgagccgcgcagcttcagccagaacggcgcgccaacatca3180gagagcgccacccctgaaagtggtcccgggagcgagccagccacatctgggtcggaaacg3240ccaggcacaagtgagtctgcaactcccgagtccggacctggctccgagcctgccactagc3300ggctccgagactccgggaacttccgagagcgctacaccagaaagcggacccggaaccagt3360accgaacctagcgagggctctgctccgggcagcccagccggctctcctacatccacggag3420gagggcacttccgaatccgccaccccggagtcagggccaggatctgaacccgctacctca3480ggcagtgagacgccaggaacgagcgagtccgctacaccggagagtgggccagggagccct3540gctggatctcctacgtccactgaggaagggtcaccagcgggctcgcccaccagcactgaa3600gaaggtgcctcgagcccgcctgtgctgaagaggcaccagcgagaaattacccggaccacc3660ctccaatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaag3720gaagatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaa3780actagacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccagc3840cctcacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggtg3900ttccaggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacgaa3960cacctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgacc4020ttccgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgaggag4080gaccagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagacc4140tacttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggcc4200tgggcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggccg4260ctgctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtccag4320gagtttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaat4380atggagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaaggag4440aactatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcatg4500gcccaggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattcac4560tccattcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcg4620ctgtacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccggc4680atctggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctcttc4740ctggtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagagac4800ttccagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgcac4860tactccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtggac4920ctcctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctcc4980tccctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagact5040tacaggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccggc5100attaagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccact5160cactactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctgc5220tccatgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctcc5280tacttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcaggga5340cggtcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggatttc5400caaaagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctcg5460atgtatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgttc5520ttccaaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggtg5580aactccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggtc5640catcagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactgaatc5700agcctgagctcgctgatcataatcaacctctggattacaaaatttgtgaaagattgactg5760gtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgt5820atcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgc5880tgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgt5940ttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccggga6000ctttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgct6060gctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcat6120cgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttct6180gctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctc6240tgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggccg6300cctccccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgcccc6360tcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaat6420gaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtgggg6480caggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggc6540tctatggcttctgaggcggaaagaacgggctcgagaagcttctagatatcctctcttaag6600gtagcatcgagatttaaattagggataacagggtaatggcgcgggccgcaaaatttaaaa6660gaagacaccaaatcagatgccgccggtcgccgccggtaggcgggacttccggtacaagat6720ggcggacaattacgtcatttcctgtgacgtcatttcctgtgacgtcacttccggtgggcg6780ggacttccggaattagggttggctctgggccagcgcttggggttgacgtgccactaagat6840caagcggcgcgccgcttgtcttagtgtcaaggcaaccccaagcaagctggcccagagcca6900accctaattccggaagtcccgcccaccggaagtgacgtcacaggaaatgacgtcacagga6960aatgacgtaattgtccgccatcttgtaccggaagtcccgcctaccggcggcgaccggcgg7020catctgatttgg7032<210>190<211>6824<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>190ctgcgcgctcgctcgctcactgaggccgcccgggcaaagcccgggcgtcgggcgaccttt60ggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcact120aggggttcctgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaata180cgcgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaatt240cgcggccgcctcgacgactagcgtttaattaaatcgaggtgagccccacgttctgcttca300ctctccccatctcccccccctccccacccccaattttgtatttatttattttttaattat360tttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcggg420gcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcgc480tccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagcg540cgcggcgggcgggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcct600cgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacg660gcccttctccttcgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgt720ggctgcgtgaaagccttgaggggctccgggagggccctttgtgcggggggagcggctcgg780ggctgtccgcggggggacggctgccttcgggggggacggggcagggcggggttcggcttc840tggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttctttttc900ctacaggctagcgccaccatgcagattgagctgtccacttgtttcttcctgtgcctcctg960cgcttctgtttctccgccactcgccggtactaccttggagccgtggagctttcatgggac1020tacatgcagagcgacctgggcgaactccccgtggatgccagattccccccccgcgtgcca1080aagtccttcccctttaacacctccgtggtgtacaagaaaaccctctttgtcgagttcact1140gaccacctgttcaacatcgccaagccgcgcccaccttggatgggcctcctgggaccgacc1200attcaagctgaagtgtacgacaccgtggtgatcaccctgaagaacatggcgtcccacccc1260gtgtccctgcatgcggtcggagtgtcctactggaaggcctccgaaggagctgagtacgac1320gaccagactagccagcgggaaaaggaggacgataaagtgttcccgggcggctcgcatact1380tacgtgtggcaagtcctgaaggaaaacggacctatggcatccgatcctctgtgcctgact1440tactcctacctttcccatgtggacctcgtgaaggacctgaacagcgggctgattggtgca1500cttctcgtgtgccgcgaaggttcgctcgctaaggaaaagacccagaccctccataagttc1560atccttttgttcgctgtgttcgatgaaggaaagtcatggcattccgaaactaagaactcg1620ctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaaaatgcatacagtcaac1680ggatacgtgaatcggtcactgcccgggctcatcggttgtcacagaaagtccgtgtactgg1740cacgtcatcggcatgggcactacgcctgaagtgcactccatcttcctggaagggcacacc1800ttcctcgtgcgcaaccaccgccaggcctctctggaaatctccccgattacctttctgacc1860gcccagactctgctcatggacctggggcagttccttctcttctgccacatctccagccat1920cagcacgacggaatggaggcctacgtgaaggtggactcatgcccggaagaacctcagttg1980cggatgaagaacaacgaggaggccgaggactatgacgacgatttgactgactccgagatg2040gacgtcgtgcggttcgatgacgacaacagccccagcttcatccagattcgcagcgtggcc2100aagaagcaccccaaaacctgggtgcactacatcgcggccgaggaagaagattgggactac2160gccccgttggtgctggcacccgatgaccggtcgtacaagtcccagtatctgaacaatggt2220ccgcagcggattggcagaaagtacaagaaagtgcggttcatggcgtacactgacgaaacg2280tttaagacccgggaggccattcaacatgagagcggcattctgggaccactgctgtacgga2340gaggtcggcgataccctgctcatcatcttcaaaaaccaggcctcccggccttacaacatc2400taccctcacggaatcaccgacgtgcggccactctactcgcggcgcctgccgaagggcgtc2460aagcacctgaaagacttccctatcctgccgggcgaaatcttcaagtataagtggaccgtc2520accgtggaggacgggcccaccaagagcgatcctaggtgtctgactcggtactactccagc2580ttcgtgaacatggaacgggacctggcatcgggactcattggaccgctgctgatctgctac2640aaagagtcggtggatcaacgcggcaaccagatcatgtccgacaagcgcaacgtgatcctg2700ttctccgtgtttgatgaaaacagatcctggtacctcactgaaaacatccagaggttcctc2760ccaaaccccgcaggagtgcaactggaggaccctgagtttcaggcctcgaatatcatgcac2820tcgattaacggttacgtgttcgactcgctgcaactgagcgtgtgcctccatgaagtcgct2880tactggtacattctgtccatcggcgcccagactgacttcctgagcgtgttcttttccggt2940tacacctttaagcacaagatggtgtacgaagataccctgaccctgttccctttctccggc3000gaaacggtgttcatgtcgatggagaacccgggtctgtggattctgggatgccacaacagc3060gactttcggaaccgcggaatgactgccctgctgaaggtgtcctcatgcgacaagaacacc3120ggagactactacgaggactcctacgaggatatctcagcctacctcctgtccaagaacaac3180gcgatcgagccgcgcagcttcagccagaacggcgcgccaacatcagagagcgccacccct3240gaaagtggtcccgggagcgagccagccacatctgggtcggaaacgccaggcacaagtgag3300tctgcaactcccgagtccggacctggctccgagcctgccactagcggctccgagactccg3360ggaacttccgagagcgctacaccagaaagcggacccggaaccagtaccgaacctagcgag3420ggctctgctccgggcagcccagccggctctcctacatccacggaggagggcacttccgaa3480tccgccaccccggagtcagggccaggatctgaacccgctacctcaggcagtgagacgcca3540ggaacgagcgagtccgctacaccggagagtgggccagggagccctgctggatctcctacg3600tccactgaggaagggtcaccagcgggctcgcccaccagcactgaagaaggtgcctcgagc3660ccgcctgtgctgaagaggcaccagcgagaaattacccggaccaccctccaatcggatcag3720gaggaaatcgactacgacgacaccatctcggtggaaatgaagaaggaagatttcgatatc3780tacgacgaggacgaaaatcagtcccctcgctcattccaaaagaaaactagacactacttt3840atcgccgcggtggaaagactgtgggactatggaatgtcatccagccctcacgtccttcgg3900aaccgggcccagagcggatcggtgcctcagttcaagaaagtggtgttccaggagttcacc3960gacggcagcttcacccagccgctgtaccggggagaactgaacgaacacctgggcctgctc4020ggtccctacatccgcgcggaagtggaggataacatcatggtgaccttccgtaaccaagca4080tccagaccttactccttctattcctccctgatctcatacgaggaggaccagcgccaaggc4140gccgagccccgcaagaacttcgtcaagcccaacgagactaagacctacttctggaaggtc4200caacaccatatggccccgaccaaggatgagtttgactgcaaggcctgggcctacttctcc4260gacgtggaccttgagaaggatgtccattccggcctgatcgggccgctgctcgtgtgtcac4320accaacaccctgaacccagcgcatggacgccaggtcaccgtccaggagtttgctctgttc4380ttcaccatttttgacgaaactaagtcctggtacttcaccgagaatatggagcgaaactgt4440agagcgccctgcaatatccagatggaagatccgactttcaaggagaactatagattccac4500gccatcaacgggtacatcatggatactctgccggggctggtcatggcccaggatcagagg4560attcggtggtacttgctgtcaatgggatcgaacgaaaacattcactccattcacttctcc4620ggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggcgctgtacaatctgtac4680cccggggtgttcgaaactgtggagatgctgccgtccaaggccggcatctggagagtggag4740tgcctgatcggagagcacctccacgcggggatgtccaccctcttcctggtgtactcgaat4800aagtgccagaccccgctgggcatggcctcgggccacatcagagacttccagatcacagca4860agcggacaatacggccaatgggcgccgaagctggcccgcttgcactactccggatcgatc4920aacgcatggtccaccaaggaaccgttctcgtggattaaggtggacctcctggcccctatg4980attatccacggaattaagacccagggcgccaggcagaagttctcctccctgtacatctcg5040caattcatcatcatgtacagcctggacgggaagaagtggcagacttacaggggaaactcc5100accggcaccctgatggtctttttcggcaacgtggattcctccggcattaagcacaacatc5160ttcaacccaccgatcatagccagatatattaggctccaccccactcactactcaatccgc5220tcaactcttcggatggaactcatggggtgcgacctgaactcctgctccatgccgttgggg5280atggaatcaaaggctattagcgacgcccagatcaccgcgagctcctacttcactaacatg5340ttcgccacctggagcccctccaaggccaggctgcacttgcagggacggtcaaatgcctgg5400cggccgcaagtgaacaatccgaaggaatggcttcaagtggatttccaaaagaccatgaaa5460gtgaccggagtcaccacccagggagtgaagtcccttctgacctcgatgtatgtgaaggag5520ttcctgattagcagcagccaggacgggcaccagtggaccctgttcttccaaaacggaaag5580gtcaaggtgttccaggggaaccaggactcgttcacacccgtggtgaactccctggacccc5640ccactgctgacgcggtacttgaggattcatcctcagtcctgggtccatcagattgcattg5700cgaatggaagtcctgggctgcgaggcccaggacctgtactgaatcagcctgagctcgctg5760atcataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatg5820ttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgctt5880cccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgagg5940agttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaaccc6000ccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccc6060tccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctc6120ggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggc6180tgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcgg6240ccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgc6300gtcttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgatca6360gcctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcc6420ttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcg6480cattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggg6540gaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgag6600gcggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagattt6660aaattagggataacagggtaatggcgcgggccgcaggaacccctagtgatggagttggcc6720actccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgc6780ccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcag6824<210>191<211>278<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>191tcgaggtgagccccacgttctgcttcactctccccatctcccccccctccccacccccaa60ttttgtatttatttattttttaattattttgtgcagcgatgggggcgggggggggggggg120ggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcggagaggtg180cggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgaggcggcggc240ggcggcggccctataaaaagcgaagcgcgcggcgggcg278<210>192<211>262<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>192gtgagcgggcgggacggcccttctccttcgggctgtaattagcgcttggtttaatgacgg60cttgtttcttttctgtggctgcgtgaaagccttgaggggctccgggagggccctttgtgc120ggggggagcggctcggggctgtccgcggggggacggctgccttcgggggggacggggcag180ggcggggttcggcttctggcgtgtgaccggcggctctagagcctctgctaaccatgttca240tgccttcttctttttcctacag262<210>193<211>130<212>dna<213>人工序列<220><223>3'itr<400>193aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgagg60ccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagc120gagcgcgcag130<210>194<211>7154<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>194ctcattggagggttcgttcgttcgaaccagccaatcaggggagggggaagtgacgcaagt60tccggtcacatgcttccggtgacgcacatccggtgacgtagttccggtcacgtgcttcct120gtcacgtgtttccggtcacgtgacttccggtcatgtgacttccggtgacgtgtttccggc180tgttaggttgaccacgcgcatgccgcgcggtcagcccaatagttaagccggaaacacgtc240accggaagtcacatgaccggaagtcacgtgaccggaaacacgtgacaggaagcacgtgac300cggaactacgtcaccggatgtgcgtcaccggaagcatgtgaccggaacttgcgtcacttc360cccctcccctgattggctggttcgaacgaacgaaccctccaatgagactcaaggacaaga420ggatattttgcgcgccaggaagtggcggcaattcagtcgataactataacggtcctaagg480tagcgatttaaatacgcgctctcttaaggtagccccgggacgcgtcaattgagatctgga540tccggtaccgaattcgcggccgcctcgacgactagcgtttaattaaacgcgtgtctgtct600gcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttg660tgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttgga720gtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcac780caggagaagccgtcacacagatccacaagctcctgaggtaagtgccgtgtgtggttcccg840cgggcctggcctctttacgggttatggcccttgcgtgccttgaattactgacactgacat900ccactttttctttttctccacagctagcgccaccatgcagattgagctgtccacttgttt960cttcctgtgcctcctgcgcttctgtttctccgccactcgccggtactaccttggagccgt1020ggagctttcatgggactacatgcagagcgacctgggcgaactccccgtggatgccagatt1080ccccccccgcgtgccaaagtccttcccctttaacacctccgtggtgtacaagaaaaccct1140ctttgtcgagttcactgaccacctgttcaacatcgccaagccgcgcccaccttggatggg1200cctcctgggaccgaccattcaagctgaagtgtacgacaccgtggtgatcaccctgaagaa1260catggcgtcccaccccgtgtccctgcatgcggtcggagtgtcctactggaaggcctccga1320aggagctgagtacgacgaccagactagccagcgggaaaaggaggacgataaagtgttccc1380gggcggctcgcatacttacgtgtggcaagtcctgaaggaaaacggacctatggcatccga1440tcctctgtgcctgacttactcctacctttcccatgtggacctcgtgaaggacctgaacag1500cgggctgattggtgcacttctcgtgtgccgcgaaggttcgctcgctaaggaaaagaccca1560gaccctccataagttcatccttttgttcgctgtgttcgatgaaggaaagtcatggcattc1620cgaaactaagaactcgctgatgcaggaccgggatgccgcctcagcccgcgcctggcctaa1680aatgcatacagtcaacggatacgtgaatcggtcactgcccgggctcatcggttgtcacag1740aaagtccgtgtactggcacgtcatcggcatgggcactacgcctgaagtgcactccatctt1800cctggaagggcacaccttcctcgtgcgcaaccaccgccaggcctctctggaaatctcccc1860gattacctttctgaccgcccagactctgctcatggacctggggcagttccttctcttctg1920ccacatctccagccatcagcacgacggaatggaggcctacgtgaaggtggactcatgccc1980ggaagaacctcagttgcggatgaagaacaacgaggaggccgaggactatgacgacgattt2040gactgactccgagatggacgtcgtgcggttcgatgacgacaacagccccagcttcatcca2100gattcgcagcgtggccaagaagcaccccaaaacctgggtgcactacatcgcggccgagga2160agaagattgggactacgccccgttggtgctggcacccgatgaccggtcgtacaagtccca2220gtatctgaacaatggtccgcagcggattggcagaaagtacaagaaagtgcggttcatggc2280gtacactgacgaaacgtttaagacccgggaggccattcaacatgagagcggcattctggg2340accactgctgtacggagaggtcggcgataccctgctcatcatcttcaaaaaccaggcctc2400ccggccttacaacatctaccctcacggaatcaccgacgtgcggccactctactcgcggcg2460cctgccgaagggcgtcaagcacctgaaagacttccctatcctgccgggcgaaatcttcaa2520gtataagtggaccgtcaccgtggaggacgggcccaccaagagcgatcctaggtgtctgac2580tcggtactactccagcttcgtgaacatggaacgggacctggcatcgggactcattggacc2640gctgctgatctgctacaaagagtcggtggatcaacgcggcaaccagatcatgtccgacaa2700gcgcaacgtgatcctgttctccgtgtttgatgaaaacagatcctggtacctcactgaaaa2760catccagaggttcctcccaaaccccgcaggagtgcaactggaggaccctgagtttcaggc2820ctcgaatatcatgcactcgattaacggttacgtgttcgactcgctgcaactgagcgtgtg2880cctccatgaagtcgcttactggtacattctgtccatcggcgcccagactgacttcctgag2940cgtgttcttttccggttacacctttaagcacaagatggtgtacgaagataccctgaccct3000gttccctttctccggcgaaacggtgttcatgtcgatggagaacccgggtctgtggattct3060gggatgccacaacagcgactttcggaaccgcggaatgactgccctgctgaaggtgtcctc3120atgcgacaagaacaccggagactactacgaggactcctacgaggatatctcagcctacct3180cctgtccaagaacaacgcgatcgagccgcgcagcttcagccagaacggcgcgccaacatc3240agagagcgccacccctgaaagtggtcccgggagcgagccagccacatctgggtcggaaac3300gccaggcacaagtgagtctgcaactcccgagtccggacctggctccgagcctgccactag3360cggctccgagactccgggaacttccgagagcgctacaccagaaagcggacccggaaccag3420taccgaacctagcgagggctctgctccgggcagcccagccggctctcctacatccacgga3480ggagggcacttccgaatccgccaccccggagtcagggccaggatctgaacccgctacctc3540aggcagtgagacgccaggaacgagcgagtccgctacaccggagagtgggccagggagccc3600tgctggatctcctacgtccactgaggaagggtcaccagcgggctcgcccaccagcactga3660agaaggtgcctcgagcccgcctgtgctgaagaggcaccagcgagaaattacccggaccac3720cctccaatcggatcaggaggaaatcgactacgacgacaccatctcggtggaaatgaagaa3780ggaagatttcgatatctacgacgaggacgaaaatcagtcccctcgctcattccaaaagaa3840aactagacactactttatcgccgcggtggaaagactgtgggactatggaatgtcatccag3900ccctcacgtccttcggaaccgggcccagagcggatcggtgcctcagttcaagaaagtggt3960gttccaggagttcaccgacggcagcttcacccagccgctgtaccggggagaactgaacga4020acacctgggcctgctcggtccctacatccgcgcggaagtggaggataacatcatggtgac4080cttccgtaaccaagcatccagaccttactccttctattcctccctgatctcatacgagga4140ggaccagcgccaaggcgccgagccccgcaagaacttcgtcaagcccaacgagactaagac4200ctacttctggaaggtccaacaccatatggccccgaccaaggatgagtttgactgcaaggc4260ctgggcctacttctccgacgtggaccttgagaaggatgtccattccggcctgatcgggcc4320gctgctcgtgtgtcacaccaacaccctgaacccagcgcatggacgccaggtcaccgtcca4380ggagtttgctctgttcttcaccatttttgacgaaactaagtcctggtacttcaccgagaa4440tatggagcgaaactgtagagcgccctgcaatatccagatggaagatccgactttcaagga4500gaactatagattccacgccatcaacgggtacatcatggatactctgccggggctggtcat4560ggcccaggatcagaggattcggtggtacttgctgtcaatgggatcgaacgaaaacattca4620ctccattcacttctccggtcacgtgttcactgtgcgcaagaaggaggagtacaagatggc4680gctgtacaatctgtaccccggggtgttcgaaactgtggagatgctgccgtccaaggccgg4740catctggagagtggagtgcctgatcggagagcacctccacgcggggatgtccaccctctt4800cctggtgtactcgaataagtgccagaccccgctgggcatggcctcgggccacatcagaga4860cttccagatcacagcaagcggacaatacggccaatgggcgccgaagctggcccgcttgca4920ctactccggatcgatcaacgcatggtccaccaaggaaccgttctcgtggattaaggtgga4980cctcctggcccctatgattatccacggaattaagacccagggcgccaggcagaagttctc5040ctccctgtacatctcgcaattcatcatcatgtacagcctggacgggaagaagtggcagac5100ttacaggggaaactccaccggcaccctgatggtctttttcggcaacgtggattcctccgg5160cattaagcacaacatcttcaacccaccgatcatagccagatatattaggctccaccccac5220tcactactcaatccgctcaactcttcggatggaactcatggggtgcgacctgaactcctg5280ctccatgccgttggggatggaatcaaaggctattagcgacgcccagatcaccgcgagctc5340ctacttcactaacatgttcgccacctggagcccctccaaggccaggctgcacttgcaggg5400acggtcaaatgcctggcggccgcaagtgaacaatccgaaggaatggcttcaagtggattt5460ccaaaagaccatgaaagtgaccggagtcaccacccagggagtgaagtcccttctgacctc5520gatgtatgtgaaggagttcctgattagcagcagccaggacgggcaccagtggaccctgtt5580cttccaaaacggaaaggtcaaggtgttccaggggaaccaggactcgttcacacccgtggt5640gaactccctggaccccccactgctgacgcggtacttgaggattcatcctcagtcctgggt5700ccatcagattgcattgcgaatggaagtcctgggctgcgaggcccaggacctgtactgaat5760cagcctgagctcgctgatcataatcaacctctggattacaaaatttgtgaaagattgact5820ggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttg5880tatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttg5940ctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtg6000tttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccggg6060actttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgc6120tgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatca6180tcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttc6240tgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggct6300ctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccctttgggcc6360gcctccccgctgatcagcctcgactgtgccttctagttgccagccatctgttgtttgccc6420ctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaa6480tgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggg6540gcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtggg6600ctctatggcttctgaggcggaaagaacgggctcgagaagcttctagatatcctctcttaa6660ggtagcatcgagatttaaattagggataacagggtaatggcgcgggccgccacttcctgg6720cgcgcaaaatatcctcttgtccttgagtctcattggagggttcgttcgttcgaaccagcc6780aatcaggggagggggaagtgacgcaagttccggtcacatgcttccggtgacgcacatccg6840gtgacgtagttccggtcacgtgcttcctgtcacgtgtttccggtcacgtgacttccggtc6900atgtgacttccggtgacgtgtttccggcttaactattgggctgaccgcgcggcatgcgcg6960tggtcaacctaacagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgac7020cggaaacacgtgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccgga7080agcatgtgaccggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacg7140aaccctccaatgag7154<210>195<211>648<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>195ctagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttcc60gcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccat120tgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtc180aatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc240caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagt300acatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctatta360ccatgcatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctcc420ccacccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcgggg480ggggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgagg540cggagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcg600aggcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcg648<210>196<211>1428<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>196atggactacaaagaccatgacggtgattataaagatcatgatatcgattacaaggatgac60gatgacaaggctgctgtggttctggaaaatggcgtgctgagccggaagctgagcgacttc120ggacaagagacaagctacatcgaggacaacagcaaccagaatggcgccgtgtctctgatc180ttcagcctgaaagaagaagtgggcgccctggccaaggtgctgagactgttcgaggaaaac240gagatcaatctgacccacatcgagagcagacccagcagactgaacaaggacgagtacgag300ttcttcacctacctggacaagcggagcaagcctgtgctgggcagcatcatcaagagcctg360agaaacgacatcggcgccaccgtgcacgagctgagcagagacaaagaaaagaacaccgtg420ccatggttccccaggaccatccaagagctggacagattcgccaaccagatcctgagctat480ggcgccgagctggacgctgatcaccctggctttaaggaccccgtgtaccgggccagaaga540aagcagtttgccgatatcgcctacaactaccggcacggccagcctattcctcgggtcgag600tacaccgaggaagagagaaagacctggggcaccgtgttcagaaccctgaaggccctgtac660aagacccacgcctgctacgagcacaaccacatcttcccactgctggaaaagtactgcggc720ttccgcgaggacaatatccctcagctcgaagacgtgtcccagttcctgcagacctgcacc780ggctttagactgaggcctgttgccggactgctgagcagcagagattttctcggcggcctg840gccttcagagtgttccactgtacccagtacatcagacacggcagcaagcccatgtacacc900cctgagcctgatatctgccacgagctgctgggacatgtgcccctgttcagcgatagaagc960ttcgcccagttcagccaagagatcggactggcttctctgggagcccctgacgagtacatt1020gagaagctggccaccatctactggttcaccgtggaattcggcctgtgcaaagagggcgac1080agcatcaaggcttatggcgctggactgctgtctagcttcggcgagctgcagtactgtctg1140agcgacaagcctaagctgctgcccctggaactggaaaagaccgcctgccaagagtacaca1200gtgaccgagttccagcctctgtactacgtggccgagagcttcaacgacgccaaagaaaaa1260gtgcggaccttcgccgccaccattcctcggccttttagcgtcagatacgacccctacaca1320cagcgcgtggaagtgctggacaacacacagcagctgaagattctggccgactccatcaac1380agcgaagtgggcattctgtgtcacgccctgcagaagatcaagagctga1428<210>197<211>4146<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>197ctctgggccagcttgcttggggttgccttgacactaagacaagcggcgcgccgcttgatc60ttagtggcacgtcaaccccaagcgctggcccagagccaaccctaattccggaagtcccgc120ccaccggaagtgacgtcacaggaaatgacgtcacaggaaatgacgtaattgtccgccatc180ttgtaccggaagtcccgcctaccggcggcgaccggcggcatctgatttggtgtcttcttt240taaattttgcggcaattcagtcgataactataacggtcctaaggtagcgatttaaatacg300cgctctcttaaggtagccccgggacgcgtcaattgagatctggatccggtaccgaattcg360cggccgcctcgacgactagcgtttagtaatgagacgcacaaactaatatcacaaactgga420aatgtctatcaatatatagttgctctagttattaatagtaatcaattacggggtcattag480ttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggct540gaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgc600caatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttgg660cagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaat720ggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtaca780tctacgtattagtcatcgctattaccatgcatggtcgaggtgagccccacgttctgcttc840actctccccatctcccccccctccccacccccaattttgtatttatttattttttaatta900ttttgtgcagcgatgggggcggggggggggggggggcgcgcgccaggcggggcggggcgg960ggcgaggggcggggcggggcgaggcggagaggtgcggcggcagccaatcagagcggcgcg1020ctccgaaagtttccttttatggcgaggcggcggcggcggcggccctataaaaagcgaagc1080gcgcggcgggcgggagtcgctgcgcgctgccttcgccccgtgccccgctccgccgccgcc1140tcgcgccgcccgccccggctctgactgaccgcgttactcccacaggtgagcgggcgggac1200ggcccttctccttcgggctgtaattagcgcttggtttaatgacggcttgtttcttttctg1260tggctgcgtgaaagccttgaggggctccgggagggccctttgtgcggggggagcggctcg1320gggctgtccgcggggggacggctgccttcgggggggacggggcagggcggggttcggctt1380ctggcgtgtgaccggcggctctagagcctctgctaaccatgttcatgccttcttcttttt1440cctacagctcctgggcaacgtgctggttattgtgctgtctcatcattttggcaaagaatt1500ggatcgcgaagccgccaccatggactacaaagaccatgacggtgattataaagatcatga1560tatcgattacaaggatgacgatgacaaggctgctgtggttctggaaaatggcgtgctgag1620ccggaagctgagcgacttcggacaagagacaagctacatcgaggacaacagcaaccagaa1680tggcgccgtgtctctgatcttcagcctgaaagaagaagtgggcgccctggccaaggtgct1740gagactgttcgaggaaaacgagatcaatctgacccacatcgagagcagacccagcagact1800gaacaaggacgagtacgagttcttcacctacctggacaagcggagcaagcctgtgctggg1860cagcatcatcaagagcctgagaaacgacatcggcgccaccgtgcacgagctgagcagaga1920caaagaaaagaacaccgtgccatggttccccaggaccatccaagagctggacagattcgc1980caaccagatcctgagctatggcgccgagctggacgctgatcaccctggctttaaggaccc2040cgtgtaccgggccagaagaaagcagtttgccgatatcgcctacaactaccggcacggcca2100gcctattcctcgggtcgagtacaccgaggaagagagaaagacctggggcaccgtgttcag2160aaccctgaaggccctgtacaagacccacgcctgctacgagcacaaccacatcttcccact2220gctggaaaagtactgcggcttccgcgaggacaatatccctcagctcgaagacgtgtccca2280gttcctgcagacctgcaccggctttagactgaggcctgttgccggactgctgagcagcag2340agattttctcggcggcctggccttcagagtgttccactgtacccagtacatcagacacgg2400cagcaagcccatgtacacccctgagcctgatatctgccacgagctgctgggacatgtgcc2460cctgttcagcgatagaagcttcgcccagttcagccaagagatcggactggcttctctggg2520agcccctgacgagtacattgagaagctggccaccatctactggttcaccgtggaattcgg2580cctgtgcaaagagggcgacagcatcaaggcttatggcgctggactgctgtctagcttcgg2640cgagctgcagtactgtctgagcgacaagcctaagctgctgcccctggaactggaaaagac2700cgcctgccaagagtacacagtgaccgagttccagcctctgtactacgtggccgagagctt2760caacgacgccaaagaaaaagtgcggaccttcgccgccaccattcctcggccttttagcgt2820cagatacgacccctacacacagcgcgtggaagtgctggacaacacacagcagctgaagat2880tctggccgactccatcaacagcgaagtgggcattctgtgtcacgccctgcagaagatcaa2940gagctgagcaagtaatgagcgctgatcataatcaacctctggattacaaaatttgtgaaa3000gattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaa3060tgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaat3120cctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgt3180gcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcc3240tttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgcc3300ttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcgg3360ggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcggga3420cgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgc3480tgccggctctgcggcctcttccgcgtcttcgccttcgccctcagacgagtcggatctccc3540tttgggccgcctccccgctgatcagcctcgactgtgccttctagttgccagccatctgtt3600gtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcc3660taataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggt3720ggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggat3780gcggtgggctctatggcttctgaggcggaaagaacgggctcgagaagcttctagatatcc3840tctcttaaggtagcatcgagatttaaattagggataacagggtaatggcgcgggccgcaa3900aatttaaaagaagacaccaaatcagatgccgccggtcgccgccggtaggcgggacttccg3960gtacaagatggcggacaattacgtcatttcctgtgacgtcatttcctgtgacgtcacttc4020cggtgggcgggacttccggaattagggttggctctgggccagcgcttggggttgacgtgc4080cactaagatcaagcggcgcgccgcttgtcttagtgtcaaggcaaccccaagcaagctggc4140ccagag4146<210>198<211>4214<212>dna<213>人工序列<220><223>合成的多核苷酸序列<400>198cggtgacgtgtttccggctgttaggttgaccacgcgcatgccgcgcggtcagcccaatag60ttaagccggaaacacgtcaccggaagtcacatgaccggaagtcacgtgaccggaaacacg120tgacaggaagcacgtgaccggaactacgtcaccggatgtgcgtcaccggaagcatgtgac180cggaacttgcgtcacttccccctcccctgattggctggttcgaacgaacgaaccctccaa240tgagactcaaggacaagaggatattttgcgcgccaggaagtggcggcaattcagtcgata300actataacggtcctaaggtagcgatttaaatacgcgctctcttaaggtagccccgggacg360cgtcaattgagatctggatccggtaccgaattcgcggccgcctcgacgactagcgtttag420taatgagacgcacaaactaatatcacaaactggaaatgtctatcaatatatagttgctct480agttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgc540gttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattg600acgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaa660tgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgcca720agtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtac780atgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattacc840atgcatggtcgaggtgagccccacgttctgcttcactctccccatctcccccccctcccc900acccccaattttgtatttatttattttttaattattttgtgcagcgatgggggcgggggg960ggggggggggcgcgcgccaggcggggcggggcggggcgaggggcggggcggggcgaggcg1020gagaggtgcggcggcagccaatcagagcggcgcgctccgaaagtttccttttatggcgag1080gcggcggcggcggcggccctataaaaagcgaagcgcgcggcgggcgggagtcgctgcgcg1140ctgccttcgccccgtgccccgctccgccgccgcctcgcgccgcccgccccggctctgact1200gaccgcgttactcccacaggtgagcgggcgggacggcccttctccttcgggctgtaatta1260gcgcttggtttaatgacggcttgtttcttttctgtggctgcgtgaaagccttgaggggct1320ccgggagggccctttgtgcggggggagcggctcggggctgtccgcggggggacggctgcc1380ttcgggggggacggggcagggcggggttcggcttctggcgtgtgaccggcggctctagag1440cctctgctaaccatgttcatgccttcttctttttcctacagctcctgggcaacgtgctgg1500ttattgtgctgtctcatcattttggcaaagaattggatcgcgaagccgccaccatggact1560acaaagaccatgacggtgattataaagatcatgatatcgattacaaggatgacgatgaca1620aggctgctgtggttctggaaaatggcgtgctgagccggaagctgagcgacttcggacaag1680agacaagctacatcgaggacaacagcaaccagaatggcgccgtgtctctgatcttcagcc1740tgaaagaagaagtgggcgccctggccaaggtgctgagactgttcgaggaaaacgagatca1800atctgacccacatcgagagcagacccagcagactgaacaaggacgagtacgagttcttca1860cctacctggacaagcggagcaagcctgtgctgggcagcatcatcaagagcctgagaaacg1920acatcggcgccaccgtgcacgagctgagcagagacaaagaaaagaacaccgtgccatggt1980tccccaggaccatccaagagctggacagattcgccaaccagatcctgagctatggcgccg2040agctggacgctgatcaccctggctttaaggaccccgtgtaccgggccagaagaaagcagt2100ttgccgatatcgcctacaactaccggcacggccagcctattcctcgggtcgagtacaccg2160aggaagagagaaagacctggggcaccgtgttcagaaccctgaaggccctgtacaagaccc2220acgcctgctacgagcacaaccacatcttcccactgctggaaaagtactgcggcttccgcg2280aggacaatatccctcagctcgaagacgtgtcccagttcctgcagacctgcaccggcttta2340gactgaggcctgttgccggactgctgagcagcagagattttctcggcggcctggccttca2400gagtgttccactgtacccagtacatcagacacggcagcaagcccatgtacacccctgagc2460ctgatatctgccacgagctgctgggacatgtgcccctgttcagcgatagaagcttcgccc2520agttcagccaagagatcggactggcttctctgggagcccctgacgagtacattgagaagc2580tggccaccatctactggttcaccgtggaattcggcctgtgcaaagagggcgacagcatca2640aggcttatggcgctggactgctgtctagcttcggcgagctgcagtactgtctgagcgaca2700agcctaagctgctgcccctggaactggaaaagaccgcctgccaagagtacacagtgaccg2760agttccagcctctgtactacgtggccgagagcttcaacgacgccaaagaaaaagtgcgga2820ccttcgccgccaccattcctcggccttttagcgtcagatacgacccctacacacagcgcg2880tggaagtgctggacaacacacagcagctgaagattctggccgactccatcaacagcgaag2940tgggcattctgtgtcacgccctgcagaagatcaagagctgagcaagtaatgagcgctgat3000cataatcaacctctggattacaaaatttgtgaaagattgactggtattcttaactatgtt3060gctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcc3120cgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggag3180ttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaaccccc3240actggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctc3300cctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcgg3360ctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctg3420ctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggcc3480ctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgt3540cttcgccttcgccctcagacgagtcggatctccctttgggccgcctccccgctgatcagc3600ctcgactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttcctt3660gaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgca3720ttgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaaggggga3780ggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggcttctgaggc3840ggaaagaacgggctcgagaagcttctagatatcctctcttaaggtagcatcgagatttaa3900attagggataacagggtaatggcgcgggccgccacttcctggcgcgcaaaatatcctctt3960gtccttgagtctcattggagggttcgttcgttcgaaccagccaatcaggggagggggaag4020tgacgcaagttccggtcacatgcttccggtgacgcacatccggtgacgtagttccggtca4080cgtgcttcctgtcacgtgtttccggtcacgtgacttccggtcatgtgacttccggtgacg4140tgtttccggcttaactattgggctgaccgcgcggcatgcgcgtggtcaacctaacagccg4200gaaacacgtcaccg4214当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1