酸性α-葡萄糖苷酶变体及其用途的制作方法

文档序号:17827186发布日期:2019-06-05 22:44阅读:1218来源:国知局
酸性α-葡萄糖苷酶变体及其用途的制作方法

庞贝氏病(pompedisease),也被称为ii型糖原贮积病(gsd)和酸性麦芽糖酶缺乏症,是一种由溶酶体酶酸性α-葡萄糖苷酶(gaa)的缺乏引起的常染色体隐性代谢性肌病。gaa是一种外切-1,4和1,6-α-葡萄糖苷酶,其在溶酶体中将糖原水解成葡萄糖。gaa的缺乏导致溶酶体中糖原积累,并引起呼吸肌、心肌和骨骼肌的渐进性损伤。所述疾病的范围从通常在1-2岁之前致死的快速发展的婴儿期过程,到在儿童和成年人中引起显著发病和早期死亡的发展更慢的非均相过程。hirschhornrr,遗传病的代谢和分子基础(themetabolicandmolecularbasesofinheriteddisease),3:3389-3420(2001,mcgraw-hill);vanderploeg和reuser,lancet372:1342-1351(2008)。

当前用于治疗庞贝氏病的人类疗法包括给药重组人类gaa,也被称为酶替代疗法(ert)。已证实ert对严重的婴儿期gsdii有效。然而,酶疗法的益处受到需要频繁输注和产生针对重组hgaa的抑制性抗体的限制(amalfitano,a.等,(2001)genet.inmed.3:132-138)。此外,ert不能高效地校正整个身体,可能是由于所述蛋白质在外周静脉递送后的不良生物分配、几种组织摄入的不足和高免疫原性的组合。

作为ert的可替选或附属方案,研究了基因治疗方法治疗gsd-ii的可行性。(amalfitano,a.等,(1999)proc.natl.acad.sci.usa96:8861-8866;ding,e.等,(2002)mol.ther.5:436-446;fraites,t.j.等,(2002)mol.ther.5:571-578;tsujino,s.等,(1998)hum.genether.9:1609-1616)。然而,用于校正遗传缺陷的肌肉定向基因转移必须面对疾病的系统性本质和转入基因的肌肉表达与其他组织相比倾向于免疫原性更高这一事实的限制。

doerfler等,2016描述了编码人类密码子优化的gaa的两种构建物的组合给药,一种构建物在肝特异性启动子的控制之下,另一种在肌肉特异性启动子的控制之下。肝特异性启动子驱动的gaa表达被用于在gaa-/-小鼠模型中促进对gaa的免疫耐受性,而肌肉特异性启动子驱动的gaa表达在疗法所靶向的一部分组织中提供治疗性蛋白的表达。然而,这种策略不完全令人满意,因为它需要使用多个构建物,并且它不产生gaa的全身性表达。

过去已提出使用修饰的gaa蛋白来改进溶酶体贮积病治疗。具体来说,申请wo2004064750和sun等,2006,公开了一种包含可操作连接到gaa的信号肽的嵌合gaa多肽,作为提高所述蛋白质向分泌途径的靶向的一种方式。

然而,患者可用的疗法并不完全令人满意,并且在本领域中仍需要改进的gaa多肽和gaa生产。具体来说,对使用gaa的治疗的长期功效、高水平的gaa生产、对产生的gaa多肽的提高的免疫耐受性和gaa被需要它的细胞和组织的增加的摄取,仍存在着需求。此外,在wo2004064750和sun等,2006中,其中公开的嵌合gaa多肽的组织分布不完全令人满意。因此,对允许在如果不是全部也是大多数目标组织中校正糖原积累的全面治疗性gaa多肽,仍存在需求。



技术实现要素:

本发明涉及gaa变体,其与野生型gaa蛋白相比以更高的水平表达和分泌,引发对全身范围的糖原病理性积累的改进的校正,并引起对gaa的免疫耐受性的诱导。

根据一个方面,本发明提供了一种核酸分子,其编码功能性嵌合gaa蛋白,所述功能性嵌合gaa蛋白包含信号肽组成部分和功能性gaa组成部分。在所编码的嵌合gaa多肽中,gaa多肽的内源(或天然)信号肽被另一种蛋白质的信号肽代替。因此,所述核酸分子编码一种嵌合gaa多肽,其包含可操作连接到gaa多肽的来自于gaa之外的另一种蛋白质的信号肽。所编码的嵌合多肽是功能性gaa蛋白,其中对应于gaa的天然信号肽(例如对应于作为编码人类gaa的野生型核酸的seqidno:1的1至81位核苷酸)的氨基酸序列被不同蛋白质的氨基酸序列代替。在优选实施方式中,所编码的信号肽具有选自seqidno:2至4的氨基酸序列。在特定实施方式中,所述gaa组成部分是亲本gaa多肽的n-端截短形式。

在特定实施方式中,所述gaa组成部分与亲本gaa多肽相比在其n-端末端处缺失了1至75个连续氨基酸,其中所述亲本多肽对应于gaa多肽的不含其信号肽的前体形式。在特定实施方式中,所述截短的gaa多肽与所述亲本gaa多肽相比在其n-端末端处缺失了至少2个,特别是至少2个、特别是至少3个、特别是至少4个、特别是至少5个、特别是至少6个、特别是至少7个、特别是至少8个连续氨基酸。在另一个实施方式中,所述截短的gaa多肽与所述亲本gaa多肽相比在其n-端末端处缺失了至多75个,特别是至多70个、特别是至多60个、特别是至多55个、特别是至多50个、特别是至多47个、特别是至多46个、特别是至多45个、特别是至多44个、特别是至多43个连续氨基酸。在其他特定实施方式中,所述截短的gaa多肽与所述亲本gaa多肽相比在其n-端末端处缺失了至多47个,特别是至多46个、特别是至多45个、特别是至多44个、特别是至多43个连续氨基酸。在另一个特定实施方式中,所述截短的gaa多肽与所述亲本gaa多肽相比在其n-端末端处缺失了1至75个、特别是1至47个、特别是1至46个、特别是1至45个、特别是1至44个、特别是1至43个连续氨基酸。在另一个实施方式中,所述截短的gaa多肽与所述亲本gaa多肽相比在其n-端末端处缺失了2至43个,特别是3至43个、特别是4至43个、特别是5至43个、特别是6至43个、特别是7至43个、特别是8至43个连续氨基酸。在更特定的实施方式中,所述截短的gaa多肽与亲本gaa多肽相比在其n-端末端处缺失了6、7、8、9、10、27、28、29、30、31、40、41、42、43、44、45、46或47个连续氨基酸,特别是与亲本gaa多肽相比在其n-端末端处截短了7、8、9、28、29、30、41、42、43或44个,更特别是8、29、42或43个连续氨基酸。示例性的亲本gaa多肽由seqidno:5或seqidno:36中示出的人类gaa多肽表示。

在另一个特定实施方式中,本发明的核酸分子是被优化以在体内提高所述嵌合gaa的表达和/或提高对所述嵌合gaa的免疫耐受性的核苷酸序列。

在特定实施方式中,本发明的核酸分子编码一种嵌合gaa多肽,其包含在下面的表1、表1'或表1”、特别是表1'或表1”中示出的组成部分:

表1

表1'

表1”

例如,这些核酸分子可以是下面在表2、表2'或表2”中示出的组合的结果:

表2

表2'

表2”

另一方面,本发明涉及一种核酸构建物,其包含可操作连接到一种或多种调控序列例如启动子、内含子、多腺苷化信号和/或增强子(例如顺式调控模块或crm)的本发明的核酸分子。在特定实施方式中,所述启动子是优选地选自α-1抗胰蛋白酶启动子(haat)、甲状腺素运载蛋白启动子、白蛋白启动子和甲状腺素结合性球蛋白(tbg)启动子的肝特异性启动子。在另一个特定实施方式中,所述启动子是肌肉特异性启动子例如spc5-12、mck和肌间线蛋白启动子。在另一个实施方式中,所述启动子是遍在启动子例如cmv、cag和pgk启动子。所述核酸构建物还可以任选地包含内含子,特别是选自人类β球蛋白b2(或hbb2)内含子、fix内含子、鸡β-球蛋白内含子和sv40内含子的内含子,其中所述内含子任选地是修饰的内含子例如seqidno:7的修饰的hbb2内含子、seqidno:9的修饰的fix内含子或seqidno:11的修饰的鸡β-球蛋白内含子。

在另一个特定实施方式中,所述核酸构建物优选地以下述顺序包含:增强子;内含子;启动子,特别是肝特异性启动子;编码所述嵌合gaa多肽的核酸序列;和多腺苷化信号,所述构建物优选地以下述顺序包含:apoe控制区;hbb2内含子,特别是修饰的hbb2内含子;haat启动子;编码所述嵌合gaa多肽的核酸序列;和牛生长激素多腺苷化信号。在特定实施方式中,所述核酸构建物包含选自在表2、表2'或表2”中,特别是在表2'或2”中示出的序列组合的核苷酸序列,更特别是seqidno:17(对应于seqidno:26与seqidno:32的融合物)、18(对应于seqidno:27与seqidno:32的融合物)或19(对应于seqidno:28与seqidno:32的融合物)的核苷酸序列。

根据另一方面,本发明涉及一种载体,其包含本发明的核酸分子或核酸构建物。在特定实施方式中,所述载体是病毒载体,优选为反转录病毒载体例如慢病毒载体或aav载体。

根据另一个实施方式,所述病毒载体是单链或双链自身互补的aav载体,优选为具有aav来源的衣壳例如aav1、aav2、变体aav2、aav3、变体aav3、aav3b、变体aav3b、aav4、aav5、aav6、变体aav6、aav7、aav8、aav9、aav10例如aavcy10和aavrh10、aavrh74、aavdj、aav-anc80、aav-lk03、aav2i8和猪aav例如aavpo4和aavpo6衣壳或具有嵌合衣壳的aav载体。

根据其他特定实施方式,所述aav载体具有aav8、aav9、aavrh74或aav2i8衣壳,特别是aav8、aav9或aavrh74衣壳,更特别是aav8衣壳。

另一方面,本发明涉及一种用本发明的核酸分子、核酸构建物或载体转化的细胞。在特定实施方式中,所述细胞是肝细胞或肌细胞。

根据另一方面,本发明涉及一种嵌合gaa多肽,其包含信号肽组成部分和功能性gaa组成部分。所述信号肽组成部分选自seqidno:2至4,优选为seqidno:2。此外,所述gaa组成部分可以是亲本gaa多肽的截短形式,例如与亲本gaa多肽相比在其n-端末端处截短了1至75个连续氨基酸,特别是与亲本gaa多肽相比在其n-端末端处截短了6、7、8、9、10、20、41、42、43或44个连续氨基酸,例如与亲本gaa多肽相比在其n-端末端处截短了8或42个连续氨基酸的gaa组成部分,其中所述gaa组成部分特别是seqidno:5或seqidno:36、特别是seqidno:5的人类gaa蛋白的截短形式。在特定实施方式中,所述gaa组成部分与亲本gaa多肽(更特别是seqidno:5或seqidno:36、特别是seqidno:5的亲本gaa多肽)相比在其n-端末端处截短了8个连续氨基酸。在本发明的特定实施方式中,本发明的嵌合gaa多肽选自在表1、表1'或表1”中,特别是在表1'或表1”中示出的氨基酸序列的组合。所述包含亲本gaa多肽的截短形式的嵌合gaa多肽的其他特定实施方式,公开在下面的详细描述中。

另一方面,本发明涉及一种药物组合物,其在可药用载体中包含本文中公开的核酸序列、核酸构建物、载体、细胞或嵌合多肽。

本发明的另一方面涉及本发明的核酸序列、核酸构建物、载体、细胞或嵌合多肽,其用作药物。

另一方面,本发明涉及本发明的核酸序列、核酸构建物、载体、细胞或嵌合多肽,其用于治疗糖原贮积病的方法中。在特定实施方式中,所述糖原贮积病是gsdi、gsdii、gsdiii、gsdiv、gsdv、gsdvi、gsdvii、gsdviii或心脏的致死性先天性糖原贮积病。在更特定的实施方式中,所述糖原贮积病选自gsdi、gsdii和gsdiii,更特别地选自gsdii和gsdiii。在甚至更特定实施方式中,所述糖原贮积病是gsdii。

附图说明

图1.信号肽在体外和体内以可变的程度提高hgaa的分泌。图a.通过lipofectaminetm,将人类肝细胞瘤细胞(huh7)用对照质粒(gfp)、在肝特异性启动子(被称为sp1)的转录控制之下表达野生型hgaa的质粒或表达与合成来源的或源自于其他高度分泌的蛋白质的信号肽1-8(sp2(sp1-8))融合的序列优化的hgaa(hgaaco)的质粒转染。在转染后48小时,通过产荧光酶测定法测量培养基中的hgaa活性,并针对4-甲基伞形酮的标准曲线评估gaa活性。柱状图显示了源自于三个不同实验的分泌的hgaa水平的平均值±se。统计分析通过anova来进行(*=相对于模拟转染的细胞p<0.05)。图b.柱状图示出了在注射pbs(pbs)或1e12vg/kg的aav8载体后1个月,3月龄c57bl6j小鼠(n=5只小鼠/组)的血清中hgaa活性的平均值±se,所述载体在人类α-1-抗胰蛋白酶启动子的转录控制之下表达与信号肽1至3和7-8(sp1-3、7-8)融合的序列优化的hgaa(hgaaco)。血清中的hgaa活性通过产荧光酶测定法定量,并针对重组hgaa蛋白的标准曲线评估gaa活性。统计分析通过anova来进行(*=相对于pbs注射组p<0.05,§=相对于sp2组p<0.05)。

图2.在庞贝氏病小鼠模型中sp7信号肽提高循环hgaa的水平并挽救呼吸道受损。将4月龄野生型(wt)和gaa-/-小鼠(n=6-9只小鼠/组)用pbs或2e12vg/kg的aav8载体静脉内注射,所述载体在人类α-1-抗胰蛋白酶启动子的转录控制之下表达与信号肽1、2、7和8(sp1、2、7、8)融合的序列优化的hgaa(hgaaco)。图a.柱状图示出了在载体注射后3个月通过产荧光测定法在血液中测量到的hgaa活性。统计分析通过anova来进行(*=如所指示的p<0.05,§=相对于sp1处理的小鼠p<0.05)。图b.在如上所述处理并跟踪6个月的小鼠上测量的kaplan-mayer存活曲线。统计分析通过对数秩检验来进行(*=p<0.05)。图c.呼吸功能评估。柱状图示出了在用所指示的载体处理后3个月(灰色条)和6个月(黑色条)测量到的以毫升(ml)为单位的潮气量。统计分析通过anova来进行,在所述柱状图中报道了相对于sp1处理的gaa-/-动物获得的p-值(*=p<0.05)。

图3.股四头肌中糖原含量的生物化学校正。将4月龄gaa-/-小鼠用pbs或2e12vg/kg的aav8载体静脉内注射,所述载体在人类α-1-抗胰蛋白酶启动子的转录控制之下表达与信号肽1、7和8(sp1、7、8)融合的序列优化的hgaa(hgaaco)。图a.通过产荧光测定法在股四头肌中测量到的hgaa活性。图b.在柱状图中示出了在股四头肌中测量到的糖原含量,其被表示为在糖原的酶消化后释放的葡萄糖。统计分析通过anova来进行(*=相对于pbs注射的gaa-/-小鼠p<0.05)。

图4.心脏、隔膜和股四头肌中糖原含量的生物化学校正。将4月龄野生型(wt)和gaa-/-小鼠(n=4-5只小鼠/组)用pbs或6e11vg/kg的aav8载体静脉内注射,所述载体在人类α-1-抗胰蛋白酶启动子的转录控制之下表达与信号肽1、7和8(sp1、7、8)融合的序列优化的hgaa(hgaaco)。图a.柱状图示出了在载体注射后3个月通过产荧光测定法在血液中测量到的hgaa活性。统计分析通过anova来进行,在所述柱状图中报道了相对于pbs处理的gaa-/-动物获得的p-值(*=p<0.05)。图b-d.在柱状图中示出了在心脏(图b)、隔膜(图c)和股四头肌(图d)中测量到的糖原含量,其被表示为在糖原的酶消化后释放的葡萄糖。统计分析通过anova来进行(*=相对于pbs注射的gaa-/-小鼠p<0.05,§=相对于sp1处理的小鼠p<0,05)。

图5.在庞贝氏病小鼠模型中高度分泌的hgaa降低了针对所述转入基因的体液应答。将4月龄gaa-/-小鼠用pbs或两种不同剂量(5e11或2e12vg/kg)的aav8载体静脉内注射,所述载体包含在人类α-1-抗胰蛋白酶启动子的转录控制之下编码融合到信号肽1(co)、信号肽2(sp2-δ8-co)、信号肽7(sp7-δ8-co)或信号肽8(sp8-δ8-co)的δ8hgaa的优化序列。在注射后1个月,通过elisa分析血清中抗hgaa抗体的存在。使用纯化的小鼠igg作为标准品进行定量。统计分析通过anova和dunnett’s事后检验来进行(*=p<0.01)。

图6.在nhp中aav8-haat-sp7-δ8-hgaaco1注射引起hgaa在血液中的高效分泌和在肌肉中的摄取。在第0天用2e12vg/kg的aav8-haat-sp7-δ8-hgaaco1注射两只食蟹猴(macacafascicularis)。图a对在载体给药之前12天和之后30天从两只猴获得的血清进行的hgaa蛋白质印迹。在左侧指示了与样品平行运行的分子量标志物(st)的条带位置。图b在载体注入后3个月,将猴处死并收获组织,用于hgaa摄取的生物化学评估。对从二头肌和隔膜获得的组织提取物进行hgaa蛋白质印迹。使用抗微管蛋白抗体作为载样对照。在左侧指示了与样品平行运行的分子量标志物的条带位置。

图7.用编码与异源sp7或sp8信号肽组合的gaa变体的质粒转染的细胞的培养基中gaa活性提高。在质粒转染后48小时在huh7细胞的培养基(图a)和裂解液(图b)中测量到的gaa活性,所述质粒包含编码与本源gaasp1信号肽组合的本源gaa(co)或编码包括与异源sp7或sp8信号肽组合的本源gaa的工程化gaa(sp7-co或sp8-co)的优化序列。使用编码egfp的质粒作为阴性对照。统计分析通过单向anova和tukey事后检验来进行。数据是两个独立实验的平均值±sd。*p<0.05,**p<0.01,***p<0.001,****p<0.0001。

图8.用hgaa表达载体注射的gde-/-动物的肝脏中糖原含量的生物化学校正。将3月龄野生型(wt)或gde-/-小鼠用pbs或表达在人类α-1-抗胰蛋白酶启动子的转录控制之下并与信号肽7融合的密码子优化的hgaa的aav8载体(aav8-haat-sp7--δ8-hgaaco1)以1e11或1e12vg/小鼠的剂量静脉内注射。柱状图示出了在肝脏中测量到的糖原含量,其被表示为在糖原的酶消化后释放的葡萄糖。统计分析通过anova来进行(*=相对于pbs注射的gde-/-小鼠p<0.05,§=相对于pbs注射的wt动物p<0.05)。

图9.在用编码不同gaa变体的质粒转染的细胞的培养基中的gaa活性。在质粒转染后24小时(图a)和48小时(图b)测量huh7细胞的培养基中的gaa活性,所述质粒包含编码与本源gaasp1信号肽组合的本源gaa(co)或编码包括与异源sp7信号肽组合的本源gaa的工程化gaa(sp7-co)的优化序列。评估了在sp7信号肽之后的gaa编码序列中的不同缺失的影响(sp7-δ8-co,sp7-δ29-co,sp7-δ42-co,sp7-δ43-co,sp7-δ47-co,sp7-δ62-co)。使用编码egfp的质粒作为阴性对照。统计分析通过单向anova和tukey事后检验来进行。条中的散列标志(#)示出了相对于co的统计学显著差异;tau符号(τ)示出了相对于sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co的统计学显著差异。数据是两个独立实验的平均值±sd。除了使用不同符号的情况之外,*p<0.05,**p<0.01,***p<0.001,****p<0.0001。

图10.不同gaa变体的细胞内gaa活性。在质粒转染后48小时测量huh7细胞的裂解液中的gaa活性,所述质粒包含编码与本源gaasp1信号肽组合的本源gaa(co)或编码包括与异源sp7信号肽组合的本源gaa的工程化gaa(sp7-co)的优化序列。评估了在sp7信号肽之后的gaa编码序列中的不同缺失的影响(sp7-δ8-co,sp7-δ29-co,sp7-δ42-co,sp7-δ43-co,sp7-δ47-co,sp7-δ62-co)。使用编码egfp的质粒作为阴性对照。统计分析通过单向anova和tukey事后检验来进行。tau符号(τ)示出了相对于sp7-co、sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co的统计学显著差异。数据是两个独立实验的平均值±sd。除了使用不同符号的情况之外,*p<0.05,**p<0.01,***p<0.001,****p<0.0001。

图11.使用与sp6或sp8信号肽组合的δ8缺失,在细胞培养基中提高的gaa活性。在质粒转染后48小时测量了huh7细胞的培养基(图a)和裂解液(图b)中的gaa活性,所述质粒包含编码与本源gaasp1信号肽组合的本源gaa(co)或编码包括与异源sp6或sp8信号肽组合的本源gaa的工程化gaa(sp6-co或sp8-co)的优化序列。评估了在信号肽之后的gaa编码序列中的8个氨基酸的缺失的影响(sp6-δ8-co、sp8-δ8-co)。使用编码egfp的质粒作为阴性对照。统计分析通过单向anova和tukey事后检验来进行。条中的星号示出了相对于co的统计学显著差异。数据是两个独立实验的平均值±sd。除了使用不同符号的情况之外,*p<0.05,**p<0.01,***p<0.001,****p<0.0001。

发明详述

本发明涉及一种编码嵌合gaa多肽的核酸分子。这种嵌合gaa多肽包含信号肽组成部分和功能性gaa组成部分,其中所述信号肽组成部分选自seqidno:2至4。发明人令人吃惊地显示,这些信号肽之一与gaa蛋白的融合物极大提高gaa的分泌并同时降低它的免疫原性。

溶酶体酸性α-葡萄糖苷酶或“gaa”(e.c.3.2.1.20)(1,4-α-d-葡聚糖葡萄糖水解酶)是一种外切-1,4-α-d-葡萄糖苷酶,其水解寡糖的α-1,4和α-1,6键两者,以释放葡萄糖。gaa的缺乏引起ii型糖原贮积病(gsdii),也被称为庞贝氏病(尽管这个术语以前是指这种疾病的婴儿期发作形式)。它催化糖原的完全降解,并在分支点处减慢。在17号染色体上28kb的人类酸性α-葡萄糖苷酶基因编码3.6kbmrna,其产生952个氨基酸的多肽(hoefsloot等,(1988)emboj.7:1697;martiniuk等,(1990)dnaandcellbiology9:85)。所述酶在内质网中接受与翻译同时的n-连接糖基化。它被合成为110-kda的前体形式,其经过大量的糖基化修饰、磷酸化并经过蛋白水解加工,通过大约90-kda的内体中间体,成熟为最终的溶酶体76和67kda形式(hoefsloot,(1988)emboj.7:1697;hoefsloot等,(1990)biochem.j.272:485;wisselaar等,(1993)j.biol.chem.268:2223;hermans等,(1993)biochem.j.289:681)。

在患有gsdii的患者中,酸性α-葡萄糖苷酶的缺乏引起糖原在溶酶体中大量积累,破坏细胞功能(hirschhorn,r.和reuser,a.j.,(2001),在《遗传病的代谢和分子基础》(themetabolicandmolecularbasisforinheriteddisease),scriver,c.r.等主编,第3389-3419页(mcgraw-hill,newyork)中)。在最常见的婴儿期形式中,患者表现出渐进性肌肉变性和心肌病,并在2岁之前死亡。在青少年和成年人发作形式中,存在严重衰弱。

此外,患有其他gsd的患者也可能从优化形式的gaa的给药获益。例如,已显示(sun等,(2013)molgenetmetab108(2):145;wo2010/005565)gaa的给药在来自于iii型糖原贮积病(gsdiii)患者的原代成肌细胞中降低糖原。

当在本文中使用时,术语“gaa”或“gaa多肽”涵盖了成熟(~76或~67kda)和前体(例如~110kda)gaa、特别是前体形式,以及通过插入、缺失和/或替换修饰或突变的gaa蛋白或其片段,它们是gaa的功能性衍生物,即它们保留了gaa的生物功能(即具有如上所定义的本源gaa蛋白的至少一种生物学活性,例如可以水解糖原),和gaa变体(例如由kunita等,(1997)biochemicaetbiophysicaacta1362:269所描述的gaaii;由hirschhorn,r.和reuser,a.j.(2001)在《遗传病的代谢和分子基础》(themetabolicandmolecularbasisforinheriteddisease)(scriver,c.r.、beaudet,a.l.、sly,w.s.和valle,d.主编),第3389-3419页,mcgraw-hill,newyork中所描述的gaa多态性和snp,参见第3403-3405页)。可以使用本领域中已知的任何gaa编码序列,例如参见seqidno:1;genbank登记号nm_00152,hoefsloot等,(1988)emboj.7:1697和vanhove等,(1996)proc.natl.acad.sci.usa93:65(人类),genbank登记号nm_008064(小鼠),和kunita等,(1997)biochemicaetbiophysicaacta1362:269(鹌鹑)。

在本发明的情形中,“gaa的前体形式”是gaa多肽的包含其天然信号肽的形式。例如,seqidno:12和seqidno:37的序列是人类gaa(hgaa)变体的前体形式。在seqidno:12和seqidno:37中,1-27位氨基酸残基对应于所述hgaa多肽的信号肽。

在本发明的情形中,本发明的截短的gaa多肽源自于亲本gaa多肽。根据本发明,“亲本gaa多肽”可以是如上所定义的功能性前体gaa序列,但不含其信号肽。例如,参考野生型人类gaa多肽,完整的野生型gaa多肽(即gaa的前体形式)显示在seqidno:12或seqidno:37中,并具有信号肽(对应于seqidno:12或seqidno:37的1-27位氨基酸),而充当这些野生型人类gaa多肽的截短的gaa形式的基础的亲本gaa多肽显示在seqidno:5和seqidno:36中,并且没有信号肽。在这个实例中,对应于seqidno:12的28-952位氨基酸和seqidno:37的28-952位氨基酸的后者,被称为亲本gaa多肽。

所述gaa多肽的编码序列可以源自于任何来源,包括鸟类和哺乳动物物种。当在本文中使用时,术语“鸟类”包括但不限于鸡、鸭、鹅、鹌鹑、火鸡和野鸡。当在本文中使用时,术语“哺乳动物”包括但不限于人类、猿猴和其他非人类灵长动物、牛科动物、绵羊、山羊、马、猫科动物、犬科动物、兔形目动物等。在本发明的实施方式中,本发明的核酸编码人类、小鼠或鹌鹑、特别是人类gaa多肽。在另一个特定实施方式中,由本发明的核酸分子编码的gaa多肽包含在seqidno:5或seqidno:36中示出的氨基酸序列,其对应于不含信号肽的hgaa(值得注意的是,hgaa的天然信号肽对应于seqidno:12或seqidno:37中的1-27位氨基酸,所述两个序列对应于包括天然信号肽的hgaa)。

在本发明的另一个实施方式中,本发明的核酸分子与seqidno:1中示出的序列的82-2859位核苷酸具有至少75%(例如至少77%)、至少80%或至少82%(例如至少83%)的同一性,所述序列是编码seqidno:37的野生型hgaa的序列(seqidno:1的1-81位核苷酸是为hgaa的天然信号肽编码的部分)。

本发明的核酸分子的gaa组成部分与seqidno:13或14的核苷酸序列优选地具有至少85%、更优选地至少90%、甚至更优选地至少92%的同一性,特别是至少95%的同一性,例如至少98、99或100%的同一性,所述核苷酸序列是被优化用于体内转入基因表达的序列。

此外,由本发明的核酸分子编码的嵌合gaa蛋白的信号肽组成部分与seqidno:2至4中示出的序列相比,可以包含1至5个、特别是1至4个、特别是1至3个、更特别是1至2个、特别是1个氨基酸缺失、插入或替换,只要所得到的序列对应于功能性信号肽、即允许gaa蛋白分泌的信号肽即可。在特定实施方式中,所述信号肽组成部分序列由选自seqidno:2至4的序列构成。

术语“同一性”及其偏差是指两个核酸分子之间的序列同一性。当两个被比较序列中的一个位置被同一碱基占据时,例如如果两个dna分子中的每一者中的一个位置被腺嘌呤占据,则所述分子在该位置处具有同一性。两个序列之间的同一性百分数是所述两个序列共有的匹配位置的数目除以被比较的位置的数目x100的函数。例如,如果在两个序列中10个位置中的6个匹配,则所述两个序列具有60%的同一性。通常,在将两个序列对齐以给出最大同一性时做出比较。本领域技术人员已知的各种不同的生物信息学工具可用于比对核酸序列,例如blast或fasta。

在特定实施方式中,本发明的核酸分子的gaa组成部分包含在seqidno:13或seqidno:14中示出的序列。

本发明的核酸分子编码功能性gaa蛋白,即它编码人类gaa多肽,所述多肽在被表达时具有野生型gaa蛋白的功能。正如上文所定义的,野生型gaa的功能是水解寡糖和多糖、更特别是糖原的α-1,4和α-1,6连接两者,以释放出葡萄糖。由本发明的核酸编码的功能性gaa多肽与由seqidno:1、seqidno:13或seqidno:14的核酸序列编码的野生型gaa多肽(即具有seqidno:5的氨基酸序列的gaa多肽)相比,可以具有至少50%、60%、70%、80%、90%、95%、99%或至少100%的对糖原的水解活性。由本发明的核酸编码的gaa蛋白的活性甚至可以为由seqidno:1、seqidno:13或seqidno:14的核酸序列编码的野生型gaa多肽(即具有seqidno:5的氨基酸序列的gaa多肽)的活性的超过100%,例如超过110%、120%、130%、140%或甚至超过150%。

专业技术人员能够容易地确定本发明的核酸是否表达功能性gaa蛋白。适合的方法对于本领域技术人员来说是显而易见的。例如,一种适合的体外方法包括将所述核酸插入到载体例如质粒或病毒载体中,用所述载体转染或转导宿主细胞例如293t或hela细胞或其他细胞例如huh7,并测定gaa活性。可替选地,适合的体内方法包括将含有所述核酸的载体转导到庞贝氏病或另一种糖原贮积病的小鼠模型中,并测定小鼠血浆中的功能性gaa和组织中gaa的存在。适合的方法更详细描述在下面的实验部分中。

发明人已发现,上文描述的核酸分子与野生型gaacdna相比,令人吃惊地引起功能性gaa蛋白在体外和体内两者的高水平表达。此外,也正如本发明人所示,从表达本发明的核酸分子的肝和肌细胞产生的嵌合gaa多肽不诱导针对所述转入基因的体液免疫应答。这意味着该核酸分子可用于生产高水平的gaa多肽并提供治疗益处,例如避免求助于免疫抑制性治疗,允许低剂量的免疫抑制性治疗,和允许向需要的对象重复给药本发明的核酸分子。因此,本发明的核酸分子在缺乏gaa表达和/或活性或gaa的高水平表达可以改善疾病例如糖原贮积病的情形中是特别令人感兴趣的。具体来说,所述糖原贮积病可以是gsdi(冯·吉尔克氏病(vongierke'sdisease))、gsdii(庞贝氏病)、gsdiii(科里氏病(coridisease))、gsdiv、gsdv、gsdvi、gsdvii、gsdviii或心脏的致死性先天性糖原贮积病。更具体来说,所述糖原贮积病选自gsdi、gsdii和gsdiii,甚至更特别地选自gsdii和gsdiii。在甚至更特定的实施方式中,所述糖原贮积病是gsdii。具体来说,本发明的核酸分子可用于基因疗法中,以治疗缺乏gaa的病症或与糖原的积累相关的其他病症,例如gsdi(冯·吉尔克氏病)、gsdii(庞贝氏病)、gsdiii(科里氏病)、gsdiv、gsdv、gsdvi、gsdvii、gsdviii和心脏的致死性先天性糖原贮积病,更特别是gsdi、gsdii或gsdiii,甚至更特别是gsdii和gsdiii。在甚至更特定的实施方式中,本发明的核酸分子可用于基因疗法中,以治疗gsdii。

编码功能性gaa的本发明的核酸分子的序列已针对在体内表达所述gaa多肽被优化。序列优化可以包括核酸序列的大量改变,包括密码子优化,提高gc含量,减少cpg岛的数目,减少可选开放阅读框(arf)的数目和减少拼接供体和拼接受体位点的数目。由于遗传密码的简并性,不同核酸分子可能编码相同蛋白质。也已公知,不同生物体中的遗传密码通常偏向于使用编码同一氨基酸的几个密码子中的一者超过其他密码子。通过密码子优化,将改变引入到核苷酸序列中,其利用给定细胞背景中存在的密码子偏好,以使得到的密码子优化的核苷酸序列与未经密码子优化的序列相比更可能以相对高的水平在这种给定的细胞背景中表达。在本发明的优选实施方式中,这种编码截短的gaa的序列优化过的核苷酸序列被密码子优化,以与编码同一截短的gaa蛋白的未经密码子优化的核苷酸序列相比提高它在人类细胞中的表达,例如通过利用人类特异性密码子使用偏好。

表3提供了针对由发明人进行的序列优化的相关参数的描述:

表3.优化的序列的描述。此表说明了两种hgaa优化序列与野生型的特征的比较。a)密码子适应指数和b)gc含量使用稀有密码子分析工具来计算(http://www.genscript.com)。c)和d)分别是在5’至3’(aorf5'→3')和3’至5’(aorf3'→5')链上计算的可选开放阅读框。e)和f)分别是使用拼接位点在线预测工具计算的受体(sa)和供体(sd)拼接位点(http://www.fruitfly.org/seq_tools/splice.html)。g)和h)分别是针对野生型(wt)和优化的co1序列计算的百分同一性。i)cpg岛使用methdb在线工具计算(http://www.methdb.de/links.html)。cpg岛是长度超过100bp、gc含量>60%并且观察/预期比率>0.6的序列。

在特定实施方式中,所述优化过的gaa编码序列是密码子优化的,和/或与seqidno:1的野生型hgaa编码序列的82-2859位核苷酸相比具有提高的gc含量和/或具有减少的可选开放阅读框数目和/或具有减少的拼接供体和/或拼接受体位点数目。例如,本发明的核酸序列引起所述gaa序列中与野生型gaa序列的序列相比gc含量提高至少2、3、4、5或10%。在特定实施方式中,本发明的核酸序列引起所述gaa序列中与野生型gaa核苷酸序列的序列相比gc含量提高2、3、4或更特别地5%或10%(特别是5%)。在特定实施方式中,编码功能性gaa多肽的本发明的核酸序列与seqidno:1中示出的序列的82-2859位核苷酸“基本上相同”,即具有约70%同一性、更优选地约80%同一性、甚至更优选地约90%同一性、甚至更优选地约95%同一性、甚至更优选地约97%、98%或甚至99%同一性。正如上文提到的,除了gc含量和/或arf数目之外,序列优化还可以包括所述序列中cpg岛数目的减少和/或拼接供体和受体位点数目的减少。当然,正如本领域技术人员公知的,序列优化是所有这些参数之间的平衡,意味着如果上述参数中的至少一者改善而一种或多种其他参数没有改善,则序列可以被认为是优化的,只要所述优化的序列引起所述转入基因的改进例如表达提高和/或在体内对所述转入基因的免疫应答降低即可。

此外,编码功能性gaa的核苷酸序列对人类细胞的密码子使用的适应性可以被表示为密码子适应指数(cai)。密码子适应指数在本文中被定义为基因的密码子使用对高表达的人类基因的密码子使用的相对适应性的度量。每个密码子的相对适应性(w)是每个密码子的使用与同一氨基酸的最丰富的密码子的使用的比率。所述cai被定义为这些相对适应性值的几何平均值。排除非同义密码子和终止密码子(取决于遗传密码)。cai值的范围为0至1,更高的值指示最丰富密码子的更高比例(参见sharp和li,1987,nucleicacidsresearch15:1281-1295;也参见:kim等,gene.1997,199:293-301;zurmegede等,journalofvirology,2000,74:2628-2635)。优选地,编码gaa的核酸分子具有至少0.75(特别是0.77)、0.8、0.85、0.90、0.92或0.94的cai。

在一个实施方式中,本发明的核酸分子编码的蛋白具有与由seqidno:13或seqidno:14的核苷酸序列编码的蛋白相比0至50个之间、0至30个之间、0至20个之间、0至15个之间、0至10个之间或0至5个之间的氨基酸变化。此外,由本发明的核酸编码的gaa蛋白可以是本领域中已知的功能性gaa蛋白变体,其中本发明的核酸分子编码的蛋白具有与本领域中已知的gaa蛋白相比0至50个之间、0至30个之间、0至20个之间、0至15个之间、0至10个之间或0至5个之间的氨基酸变化。这种可以充当设计功能性变体的基础的本领域中已知的gaa蛋白,具体来说可以在uniprot的gaa条目中找到(登记号p10253;对应于genbankcaa68763.1;seqidno:37)。在其他特定实施方式中,本发明的核酸序列的gaa组成部分编码本文中所定义的变体gaa多肽或这些肽的功能性变体,例如选自被鉴定为genbank登记号aaa52506.1(seqidno:38)、eaw89583.1(seqidno:39)和abi53718.1(seqidno:40)的多肽。其他变体gaa多肽包括在wo2012/145644、wo00/34451和us6,858,425中描述的多肽。在特定实施方式中,所述亲本gaa多肽源自于seqidno:12或seqidno:37中示出的氨基酸序列。

在特定实施方式中,由本发明的核酸分子编码的gaa多肽是功能性gaa,并与seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa蛋白具有至少80%,特别是至少85%、90%、95%,更特别是至少96%、97%、98%或99%的序列同一性,其中如果截短形式被当作序列同一性的参比的话,任选地将进行的截短考虑在内。在特定实施方式中,由本发明的核酸分子编码的gaa蛋白具有在seqidno:5或seqidno:36、特别是seqidno:5中示出的序列。

术语“同一性”及其偏差当指称多肽时,意味着当两个被比较的多肽序列中的一个位置被同一氨基酸占据时(例如如果两个多肽的每一者中的一个位置被亮氨酸占据),则所述多肽在该位置处具有同一性。两个多肽之间的同一性百分数是所述两个序列共有的匹配位置的数目除以被比较的位置的数目x100的函数。例如,如果在两个多肽中10个位置中的6个匹配,则所述两个序列具有60%的同一性。通常,在将两个序列对齐以给出最大同一性时做出比较。本领域技术人员已知的各种不同的生物信息学工具可用于比对核酸序列,例如blast或fasta。

术语“核酸序列”(或核酸分子)是指采取单链或双链形式的dna或rna分子,特别是编码本发明的gaa蛋白的dna。

本发明还涉及一种编码嵌合功能性gaa多肽的核酸分子,所述嵌合多肽包含选自seqidno:2至4的信号肽。

具体来说,发明人还令人吃惊地显示,与以前报道的包含融合到人类α-1-抗胰蛋白酶的信号肽的gaa的嵌合gaa多肽(haat,在wo2004064750和sun等,2006中描述的嵌合gaa蛋白)相比,信号肽替换导致产生功能性gaa多肽的更高的表达水平和更高的分泌。在本发明的核酸分子中,所述信号肽组成部分对应于编码具有选自seqidno:2至4的氨基酸序列的信号肽(在本文中也被称为“可选信号肽”)的序列。本发明的核酸分子也可以是优化的序列,其编码包含可操作连接到功能性gaa多肽的可选信号肽的嵌合gaa多肽。

与野生型gaa多肽相比,将野生型gaa的内源信号肽用外源信号肽,即源自于不同于gaa的蛋白的信号肽代替。与包含其天然信号肽的相应gaa多肽相比,所述与gaa蛋白的剩余部分融合的外源信号肽提高了所得嵌合gaa多肽的分泌。此外,根据本发明的特定实施方式,对应于可选信号肽的核苷酸序列可以是如上所提供的优化过的序列。

可以在本发明中工作的信号肽包括来自于艾杜糖醛酸-2-硫酸酯酶的1-25位氨基酸(seqidno:3)、来自于胰凝乳蛋白酶原b2的1-20位氨基酸(seqidno:2)和来自于蛋白酶c1抑制剂的1-23位氨基酸(seqidno:4)。当与包含天然信号肽的gaa或包含haat的信号肽的嵌合gaa蛋白相比时,seqidno:2至seqidno:4的信号肽允许所述嵌合gaa蛋白在体外和体内两者更高地分泌。

从细胞分泌的新合成的gaa的相对比例可以通过本领域中已知的和实施例中所描述的方法常规地确定。分泌的蛋白质可以通过在细胞培养基、血清、奶等中直接测量所述蛋白质本身(例如通过蛋白质印迹)或通过蛋白质活性测定法(例如酶测定法)来检测。

本领域技术人员还应该理解,所述嵌合gaa多肽可以含有另外的氨基酸,例如作为核酸构建物的操作例如添加限制性位点的结果,只要这些另外的氨基酸不使所述信号肽或gaa多肽不具有功能即可。所述另外的氨基酸可以被切除或者可以被成熟多肽保留,只要保留不产生无功能的多肽即可。

此外,由本文中描述的核酸分子编码的嵌合gaa多肽可以包含作为gaa的功能性截短形式的gaa组成部分。“截短形式”意味着包含从亲本gaa多肽的n-端部分缺失一个或几个连续氨基酸的gaa多肽。因此,本发明的嵌合gaa多肽中的gaa组成部分可以是亲本gaa多肽的n-端截短形式。根据本发明,“亲本gaa多肽”是不含信号肽的gaa多肽,例如不含信号肽的gaa的前体形式,特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽,并且可以是如上所公开的任何变体。例如,参考典型的野生型人类gaa多肽,完整的野生型gaa多肽显示在seqidno:12或seqidno:37中并具有信号肽,而充当这种野生型人类gaa多肽的截短的gaa形式的基础的亲本gaa多肽分别显示在seqidno:5或seqidno:36中,并且没有信号肽。在这个实例中,后者被称为亲本gaa多肽。在这个特定实施方式的变化形式中,从所述亲本gaa蛋白的n-端末端缺失至少一个氨基酸。在特定实施方式中,所述gaa组成部分与所述亲本gaa多肽相比,可以从其n-端末端缺失至少1个,特别是至少2个、特别是至少3个、特别是至少4个、特别是至少5个、特别是至少6个、特别是至少7个、特别是至少8个连续氨基酸。例如,所述gaa组成部分与所述亲本gaa多肽相比,可以从其n-端末端缺失1至75个连续氨基酸或超过75个连续氨基酸。在另一个实施方式中,所述gaa组成部分与所述亲本gaa多肽相比在其n-端末端处缺失了至多75个,特别是至多70个、特别是至多60个、特别是至多55个、特别是至多50个、特别是至多47个、特别是至多46个、特别是至多45个、特别是至多44个、特别是至多43个连续氨基酸。在其他特定实施方式中,所述gaa组成部分与所述亲本gaa多肽相比在其n-端末端处缺失了至多47个,特别是至多46个、特别是至多45个、特别是至多44个、特别是至多43个连续氨基酸。具体来说,所述截短的gaa组成部分与所述亲本gaa蛋白相比,可以从其n-端末端缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74或75个连续氨基酸(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa多肽的截短形式)。在另一个特定实施方式中,所述gaa组成部分与所述亲本gaa多肽相比在其n-端末端处缺失了1至75个,特别是1至47个、特别是1至46个、特别是1至45个、特别是1至44个、特别是1至43个连续氨基酸。在另一个实施方式中,所述gaa组成部分与所述亲本gaa多肽相比,在其n-端末端处缺失了2至43个,特别是3至43个、特别是4至43个、特别是5至43个、特别是6至43个、特别是7至43个、特别是8至43个连续氨基酸(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa多肽的截短形式)。使用可替选的命名法,由所述亲本gaa多肽中1个氨基酸的截短产生的gaa多肽被称为δ1gaa截短形式,由从n-端末端截短2个连续氨基酸产生的gaa多肽被称为δ2gaa截短形式,由所述亲本gaa多肽中3个连续氨基酸的截短产生的gaa多肽被称为δ3gaa截短形式,等等。在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45、δ46、δ47、δ48、δ49、δ50、δ51、δ52、δ53、δ54、δ55、δ56、δ57、δ58、δ59、δ60、δ61、δ62、δ63、δ64、δ65、δ66、δ67、δ68、δ69、δ70、δ71、δ72、δ73、δ74或δ75gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45、δ46或δ47gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45或δ46gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44或δ45gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43或δ44gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,本发明的嵌合gaa蛋白包含δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式组成部分(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),所述gaa截短形式组成部分在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ6、δ7、δ8、δ9或δ10截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ7、δ8或δ9截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ8截短形式。

在特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ27、δ28、δ29、δ30或δ31截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ28、δ29或δ30截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ29截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ40、δ41、δ42、δ43或δ44截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ41、δ42或δ43截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ42截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ41、δ42、δ43、δ44或δ45截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ42、δ43或δ44截短形式,特别是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ43截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ6、δ7、δ8、δ9、δ10、δ27、δ28、δ29、δ30、δ31、δ40、δ41、δ42、δ43、δ44、δ45、δ46或δ47截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ7、δ8、δ9、δ28、δ29、δ30、δ41、δ42、δ43或δ44截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ6、δ7、δ8、δ9、δ10、δ40、δ41、δ42、δ43或δ44截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ8、δ29、δ42、δ43或δ47截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ8、δ29、δ42或δ43截短形式。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ8或δ42截短形式。

在本发明的特定实施方式中,本发明的嵌合gaa多肽包含源自于功能性亲本人类gaa多肽的截短的gaa组成部分。在其他特定实施方式中,所述亲本hgaa多肽是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽。在这个实施方式的变化形式中,本发明的嵌合gaa多肽中的gaa组成部分是hgaa多肽、更特别是seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45、δ46、δ47、δ48、δ49、δ50、δ51、δ52、δ53、δ54、δ55、δ56、δ57、δ58、δ59、δ60、δ61、δ62、δ63、δ64、δ65、δ66、δ67、δ68、δ69、δ70、δ71、δ72、δ73、δ74或δ75gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。在其他特定实施方式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45、δ46或δ47、特别是δ6、δ7、δ8、δ9、δ10、δ40、δ41、δ42、δ43或δ44、特别是δ8、δ29、δ42或δ43、特别是δ8或δ42截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性(例如80、85、90、95、96、97、98或99%的同一性)。

在这个实施方式的变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45或δ46gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44或δ45gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43或δ44gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41或δ42gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、甚至更特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42或δ43gaa截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少75、80、85、90、91、92、93、94、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9或δ10、特别是δ7、δ8或δ9、更特别是δ8截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ27、δ28、δ29、δ30或δ31、特别是δ28、δ29或δ30、更特别是δ29截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ40、δ41、δ42、δ43或δ44、特别是δ41、δ42或δ43、更特别是δ42截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ41、δ42、δ43、δ44或δ45、特别是δ42、δ43或δ44、更特别是δ43截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ27、δ28、δ29、δ30、δ31、δ40、δ41、δ42、δ43、δ44或δ45、特别是δ7、δ8、δ9、δ28、δ29、δ30、δ41、δ42、δ43或δ44、特别是δ8、δ29、δ42或δ43截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ40、δ41、δ42、δ43或δ44、特别是δ8或δ42截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ8、δ29、δ42、δ43或δ47截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ8、δ29、δ42或δ43截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的嵌合gaa多肽的gaa组成部分是hgaa多肽、更特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的hgaa多肽或其功能性变体的δ8或δ42截短形式,所述功能性变体在seqidno:5或seqidno:36、特别是seqidno:5所示的序列中包含氨基酸替换,并与seqidno:5或seqidno:36、特别是seqidno:5具有至少80、85、90、95、96、97、98或99%的同一性。

在特定实施方式中,本发明的嵌合gaa多肽中的gaa组成部分具有由seqidno:29、seqidno:30、seqidno:41、seqidno:42或seqidno:43中示出的序列构成的氨基酸序列,特别是由seqidno:29、seqidno:30、seqidno:41或seqidno:42中示出的序列构成的氨基酸序列,特别是由seqidno:29或seqidno:30中示出的序列构成的氨基酸序列。

本发明还涉及包含本发明的核酸分子的核酸构建物。所述核酸构建物可以对应于表达盒,其包含可操作连接到一个或多个表达控制序列和/或提高转入基因的表达的其他序列和/或增强被编码蛋白质的分泌的序列和/或增强被编码蛋白质的摄入的序列的本发明的核酸序列。当在本文中使用时,术语“可操作连接”是指多核苷酸元件以功能性关系相连。当核酸被放置成与另一个核酸序列处于功能性关系时,它被“可操作连接”。例如,启动子或另一个转录调控序列,如果它影响编码序列的转录,则被可操作连接到所述编码序列。这些表达控制序列在本领域中是已知的,例如启动子、增强子(例如顺式调控模块(crm))、内含子、polya信号等。

具体来说,所述表达盒可以包含启动子。所述启动子可以是遍在或组织特异性启动子,特别是能够在需要gaa表达的细胞或组织中,例如在缺乏gaa的患者中的需要gaa表达的细胞或组织中促进表达的启动子。在特定实施方式中,所述启动子是肝特异性启动子例如α-1抗胰蛋白酶启动子(haat)(seqidno:15)、甲状腺素运载蛋白启动子、白蛋白启动子、甲状腺素结合性球蛋白(tbg)启动子、lsp启动子(包含甲状腺素结合性球蛋白启动子序列、两个拷贝的α1-微球蛋白/双库尼茨抑制剂(bikunin)增强子序列和前导序列-34。ill,c.r.等,(1997),用于甲型血友病的基因疗法的人类因子viii互补dna表达质粒的优化(optimizationofthehumanfactorviiicomplementarydnaexpressionplasmidforgenetherapyofhemophiliaa),bloodcoag.fibrinol.8:s23–s30)等。其他有用的肝特异性启动子在本领域中是已知的,例如在冷泉港实验室(coldspringharborlaboratory)编纂的肝特异性基因启动子数据库(http://rulai.cshl.edu/lspd/)中列出的启动子。在本发明的情形中,优选的启动子是haat启动子。在另一个实施方式中,所述启动子是在一种目标组织或细胞中(例如在肌细胞中)和在肝细胞中指导表达的启动子。例如,在一定程度上,对肌细胞特异的启动子例如肌间线蛋白、spc5-12和mck启动子可能在肝细胞中存在一定的表达泄漏,这对于诱导对象对从本发明的核酸表达的gaa蛋白的免疫耐受性来说可以是有利的。

其他组织特异性或非组织特异性启动子在本发明的实践中也可以是有用的。例如,所述表达盒可以包含组织特异性启动子,其是不同于肝特异性启动子的启动子。例如,所述启动子可以是肌肉特异性的,例如肌间线蛋白启动子(和肌间线蛋白启动子变体例如包含天然或人工增强子的肌间线蛋白启动子)、spc5-12启动子或mck启动子。在另一个实施方式中,所述启动子是对其他细胞谱系特异的启动子例如红细胞生成素启动子,用于从红细胞谱系的细胞表达所述gaa多肽。

在另一个实施方式中,所述启动子是遍在启动子。代表性的遍在启动子包括巨细胞病毒增强子/鸡β肌动蛋白(cag)启动子、巨细胞病毒增强子/启动子(cmv)、pgk启动子、sv40早期启动子等。

此外,所述启动子也可以是内源启动子,例如白蛋白启动子或gaa启动子。

在特定实施方式中,所述启动子被结合到增强子序列例如顺式调控模块(crm)或人工增强子序列。例如,所述启动子可以被结合到增强子序列例如人类apoe控制区(或人类载脂蛋白e/c-i基因座,肝控制区hcr-1——genbank登记号u32510,示出在seqidno:16中)。在特定实施方式中,增强子序列例如apoe序列被结合到肝特异性启动子例如上面列出的那些启动子,特别是例如haat启动子。在本发明的实践中有用的其他crm包括在rincon等,molther.2015jan;23(1):43-52;chuah等,molther.2014sep;22(9):1605-13或nair等,blood.2014may15;123(20):3195-9中所描述的crm。

在另一个特定实施方式中,所述核酸构建物包含内含子,特别是置于所述启动子与gaa编码序列之间的内含子。内含子可以被引入以提高mrna的稳定性和蛋白质的生产。在其他实施方式中,所述核酸构建物包含人类β球蛋白b2(或hbb2)内含子、凝血因子ix(fix)内含子、sv40内含子或鸡β-球蛋白内含子。在另一个其他实施方式中,本发明的核酸构建物含有修饰的内含子(特别是修饰的hbb2或fix内含子),其被设计用于减少在所述内含子中存在的可选开放阅读框(arf)的数目或甚至完全除去arf。优选地,除去长度跨度超过50bp并具有与起始密码子同框的终止密码子的arf。arf可以通过修改所述内含子的序列来去除。例如,可以利用核苷酸替换、插入或缺失,优选地通过核苷酸替换进行修饰。作为实例,可以替换在目标内含子序列中存在的atg或gtg起始密码子中的一个或多个核苷酸,特别是一个核苷酸,产生非起始密码子。例如,可以将目标内含子序列内的atg或gtg用不是起始密码子的ctg代替。

在核酸构建物中使用的经典hbb2内含子示出在seqidno:6中。例如,该hbb2内含子可以通过消除所述内含子中的起始密码子(atg和gtg密码子)进行修饰。在特定实施方式中,包含在所述构建物中的修饰的hbb2内含子具有在seqidno:7中示出的序列。在核酸构建物中使用的经典fix内含子源自于人类fix的第一内含子,并示出在seqidno:8中。fix内含子可以通过消除所述内含子中的起始密码子(atg和gtg密码子)进行修饰。在特定实施方式中,包含在本发明的构建物中的修饰的fix内含子具有在seqidno:9中示出的序列。在核酸构建物中使用的经典鸡β-球蛋白内含子示出在seqidno:10中。鸡β-球蛋白内含子可以通过消除所述内含子中的起始密码子(atg和gtg密码子)进行修饰。在特定实施方式中,包含在本发明的构建物中的修饰的鸡β-球蛋白内含子具有在seqidno:11中示出的序列。

发明人以前已在wo2015/162302中显示,这种修饰的内含子特别是修饰的hbb2或fix内含子具有有利的性质,并且可以显著提高转入基因的表达。

在特定实施方式中,本发明的核酸构建物是一种表达盒,其以5'至3'的方向包含任选地在前面带有增强子的启动子、本发明的编码序列(即本发明的优化的gaa编码序列、本发明的嵌合gaa编码序列或本发明的嵌合且优化过的gaa编码序列)和多腺苷化信号(例如牛生长激素多腺苷化信号、sv40多腺苷化信号或另一种天然存在的或人工多腺苷化信号)。在特定实施方式中,本发明的核酸构建物是一种表达盒,其以5'至3'的方向包含任选地在前面带有增强子(例如apoe控制区)的启动子、内含子(特别是如上所定义的内含子)、本发明的编码序列和多腺苷化信号。在另一个特定实施方式中,本发明的核酸构建物是一种表达盒,其以5'至3'的方向包含增强子例如apoe控制区、启动子、内含子(特别是如上所定义的内含子)、本发明的编码序列和多腺苷化信号。在本发明的其他特定实施方式中,所述表达盒以5'至3'的方向包含apoe控制区、haat-肝特异性启动子、hbb2内含子(特别是如上所定义的修饰的hbb2内含子)、本发明的编码序列和牛生长激素多腺苷化信号,例如在seqidno:20至seqidno:22任一者中示出的核酸构建物,其包含与seqidno:2至4中示出的信号肽编码序列中的每一者组合的seqidno:13的序列优化的gaa核酸分子。在其他实施方式中,所述表达盒含有从上面的表2、表2"或表2”、特别是表2'或表2”所示的序列组合之一产生的编码序列。

在特定实施方式中,所述表达盒包含apoe控制区、haat-肝特异性启动子、密码子优化的hbb2内含子、本发明的编码序列和牛生长激素多腺苷化信号。

在设计本发明的核酸构建物时,本领域技术人员应该注意用于将所述构建物递送到细胞和器官的载体的尺寸限制。具体来说,本领域技术人员知道aav载体的主要限制是它的运载容量,其可能随着aav血清型而变,但据认为被限制在母体病毒基因组的尺寸左右。例如,5kb通常被认为是包装在aav8衣壳中的最大尺寸(wuz.等,molther.,2010,18(1):80-86;laiy.等,molther.,2010,18(1):75-79;wangy.等,humgenethermethods,2012,23(4):225-33)。因此,本领域技术人员在本发明的实践中应该注意选择本发明的核酸构建物的组分,以使得到的核酸序列,包括编码aav5'-至3'-itr的序列,优选地不超过所使用的aav载体的运载容量的110%,具体来说优选地不超过5.5kb。

本发明还涉及包含本文中公开的核酸分子或构建物的载体。具体来说,本发明的载体是适合于蛋白质表达,优选地用于基因疗法的载体。在一个实施方式中,所述载体是质粒载体。在另一个实施方式中,所述载体是含有本发明的核酸分子、特别是编码本发明的gaa多肽的信使rna的纳米粒子。在另一个实施方式中,所述载体是基于转座子的系统,允许将本发明的核酸分子或构建物整合到靶细胞的基因组中,例如极度活跃的睡美人(sleepingbeauty)(sb100x)转座子系统(mates等,2009)。在另一个实施方式中,所述载体是适用于基因疗法的病毒载体,靶向任何目标细胞例如肝组织或细胞、肌细胞、cns细胞(例如脑细胞)或造血干细胞例如红细胞谱系的细胞(例如红细胞)。在这种情况下,本发明的核酸构建物还含有本领域中公知的适合于生产高效病毒载体的序列。在特定实施方式中,所述病毒载体源自于整合病毒。具体来说,所述病毒载体可以源自于反转录病毒或慢病毒。在另一个特定实施方式中,所述病毒载体是aav载体,例如适用于转导肝组织或细胞的aav载体,更特别是aav-1、aav-2和aav-2变体(例如包含具有y44+500+730f+t491v改变的工程化衣壳的四重突变的衣壳优化的aav-2,其公开在ling等,2016jul18,humgenethermethods.[epubaheadofprint]中)、aav-3和aav-3变体(例如包含具有两个氨基酸变化s663v+t492v的工程化aav3衣壳的aav3-st变体,其公开在vercauteren等,2016,mol.ther.vol.24(6),p.1042中)、aav-3b和aav-3b变体、aav-4、aav-5、aav-6和aav-6变体(例如包含三重突变的aav6衣壳y731f/y705f/t492v形式的aav6变体,其公开在rosario等,2016,molthermethodsclindev.3,p.16026中)、aav-7、aav-8、aav-9、aav-10例如aav-cy10和aav-rh10、aav-rh74、aav-dj、anc80、lk03、aav2i8、猪aav血清型例如aavpo4和aavpo6等载体,或反转录病毒载体例如慢病毒载体和α-反转录病毒。正如在本领域中已知的,取决于考虑使用的具体病毒载体,将其他适合的序列引入到本发明的核酸构建物中,用于获得功能性病毒载体。适合的序列包括用于aav载体的aavitr或用于慢病毒载体的ltr。因此,本发明还涉及如上所述的表达盒,其在每一侧带有itr或ltr。

病毒载体的优点在本公开下面的部分中讨论。病毒载体对于递送本发明的核酸分子或构建物来说是优选的,例如反转录病毒载体如慢病毒载体,或非致病性细小病毒,更优选为aav载体。人类细小病毒腺相关病毒(aav)是一种天然复制有缺陷的依赖病毒,其能够整合到被感染细胞的基因组中以建立潜伏感染。最后一种性质在哺乳动物病毒中似乎是独特的,因为所述整合发生在人类基因组中被称为aavs1的特异性位点处,其位于19号染色体上(19q13.3-qter)。

因此,aav载体作为用于人类基因疗法的潜在载体引起了相当大的兴趣。所述病毒的有利性质包括它与任何人类疾病缺乏相关性,它感染分裂细胞和非分裂细胞两者的能力,以及可以被感染的源自于不同组织的广范围的细胞系。

在从人类或非人类灵长动物(nhp)分离并被充分表征的aav的血清型中,人类血清型2是被开发作为基因转移载体的第一种aav,其他目前使用的aav血清型包括aav-1、aav-2变体(例如包含具有y44+500+730f+t491v改变的工程化衣壳的四重突变的衣壳优化的aav-2,其公开在ling等,2016jul18,humgenethermethods.[epubaheadofprint]中)、aav-3和aav-3变体(例如包含具有两个氨基酸变化s663v+t492v的工程化aav3衣壳的aav3-st变体,其公开在vercauteren等,2016,mol.ther.vol.24(6),p.1042中)、aav-3b和aav-3b变体、aav-4、aav-5、aav-6和aav-6变体(例如包含三重突变的aav6衣壳y731f/y705f/t492v形式的aav6变体,其公开在rosario等,2016,molthermethodsclindev.3,p.16026中)、aav-7、aav-8、aav-9、aav-10例如aav-cy10和aav-rh10、aav-rh74、aav-dj、anc80、lk03、aav2i8、猪aav血清型例如aavpo4和aavpo6,以及aav血清型的酪氨酸、赖氨酸和丝氨酸衣壳突变体等。此外,其他非天然的工程化变体和嵌合aav也可以是有用的。

aav病毒可以使用常规的分子生物学技术进行工程化改造,使得可以优化这些粒子用于核酸序列的细胞特异性递送,用于最小化免疫原性,用于调节稳定性和粒子寿命,用于高效降解,用于精确递送到核。

用于组装成载体的理想的aav片段包括cap蛋白,包括vp1、vp2、vp3和高变区,rep蛋白,包括rep78、rep68、rep52和rep40,以及编码这些蛋白质的序列。这些片段可以被容易地使用在各种不同的载体系统和宿主细胞中。

缺少rep蛋白的基于aav的重组载体以低效能整合到宿主的基因组中,并主要作为可以在靶细胞中存留数年的稳定的环状游离体存在。

除了使用aav天然血清型之外,在本发明的情形中也可以使用人工aav血清型,包括但不限于具有非天然存在的衣壳蛋白的aav。这种人工衣壳可以通过任何适合的技术,使用所选的aav序列(例如vp1衣壳蛋白的片段)与可以从不同的所选aav血清型、同一aav血清型的非毗连部分、非aav病毒来源或非病毒来源获得的异源序列相组合来产生。人工aav血清型可以是但不限于嵌合aav衣壳、重组aav衣壳或“人源化”aav衣壳。

因此,本发明涉及包含本发明的核酸分子或构建物的aav载体。在本发明的情形中,所述aav载体包含能够转导目标靶细胞、特别是肝细胞的aav衣壳。根据特定实施方式,所述aav载体具有aav-1、aav-2、aav-2变体(例如包含具有y44+500+730f+t491v改变的工程化衣壳的四重突变的衣壳优化的aav-2,其公开在ling等,2016jul18,humgenethermethods.[epubaheadofprint]中)、aav-3和aav-3变体(例如包含具有两个氨基酸变化s663v+t492v的工程化aav3衣壳的aav3-st变体,其公开在vercauteren等,2016,mol.ther.vol.24(6),p.1042中)、aav-3b和aav-3b变体、aav-4、aav-5、aav-6和aav-6变体(例如包含三重突变的aav6衣壳y731f/y705f/t492v形式的aav6变体,其公开在rosario等,2016,molthermethodsclindev.3,p.16026中)、aav-7、aav-8、aav-9、aav-10例如aav-cy10和aav-rh10、aav-rh74、aav-dj、anc80、lk03、aav2i8、猪aav例如aavpo4和aavpo6,以及aav血清型的酪氨酸、赖氨酸和丝氨酸衣壳突变体等的血清型。在特定实施方式中,所述aav载体具有aav8、aav9、aavrh74或aav2i8血清型(即所述aav载体具有aav8、aav9、aavrh74或aav2i8血清型的衣壳)。在另一个特定实施方式中,所述aav载体是假型载体,即它的基因组和衣壳源自于不同血清型的aav。例如,所述假型aav载体可以是其基因组源自于上文提到的血清型之一,并且衣壳源自于另一种血清型的载体。例如,所述假型载体的基因组可以具有源自于aav8、aav9、aavrh74或aav2i8血清型的衣壳,并且它的基因组可以源自于不同的血清型。在特定实施方式中,所述aav载体具有aav8、aav9或aavrh74血清型,特别是aav8或aav9血清型,更特别是aav8血清型的衣壳。

在特定实施方式中,在所述载体被用于将转入基因递送到肌细胞的情形中,所述aav载体可以选自aav8、aav9和aavrh74等。

在另一个特定实施方式中,在所述载体被用于将转入基因递送到肝细胞的情形中,所述aav载体可以选自aav5、aav8、aav9、aav-lk03、aav-anc80和aav3b等。

在另一个实施方式中,所述衣壳是修饰的衣壳。在本发明的情形中,“修饰的衣壳”可以是嵌合衣壳或包含源自于一种或多种野生型aavvp衣壳蛋白的一种或多种变体vp衣壳蛋白的衣壳。

在特定实施方式中,所述aav载体是嵌合载体,即它的衣壳包含源自于至少两种不同aav血清型的vp衣壳蛋白,或包含至少一种将源自于至少两种aav血清型的vp蛋白区域或结构域组合的嵌合vp蛋白。可用于转导肝细胞的这种嵌合aav载体的实例描述在shen等,moleculartherapy,2007和tenney等,virology,2014中。例如,嵌合aav载体可以源自于aav8衣壳序列与不同于aav8血清型的aav血清型例如上文具体提到的任一种aav血清型的序列的组合。在另一个实施方式中,所述aav载体的衣壳包含一种或多种变体vp衣壳蛋白,例如在wo2015013313中所公开的,特别是表现出高的肝趋向性的rhm4-1、rhm15-1、rhm15-2、rhm15-3/rhm15-5、rhm15-4和rhm15-6衣壳变体。

在另一个实施方式中,所述修饰的衣壳也可源自于通过易错pcr和/或肽插入(例如在bartel等,2011中所述)而插入的衣壳修饰。此外,衣壳变体可以包括单氨基酸变化例如酪氨酸突变体(例如在zhong等,2008中所述)。

此外,所述aav载体的基因组可以是单链或自身互补的双链基因组(mccarty等,genetherapy,2003)。自身互补的双链aav载体通过从aav末端重复序列之一中缺失掉末端解链位点(trs)来产生。这些其复制的基因组是野生型aav基因组长度的一半的修饰的载体,具有包装dna二聚体的倾向性。在优选实施方式中,在本发明的实践中使用的aav载体具有单链基因组,并且更优选地包含aav8、aav9、aavrh74或aav2i8衣壳,特别是aav8、aav9或aavrh74衣壳例如aav8或aav9衣壳,更特别是aav8衣壳。

在特别优选的实施方式中,本发明涉及一种aav载体,其在单链或双链的自身互补的基因组(例如单链基因组)中包含本发明的核酸构建物。在一个实施方式中,所述aav载体包含aav8、aav9、aavrh74或aav2i8衣壳,特别是aav8、aav9或aavrh74衣壳例如aav8或aav9衣壳,更特别是aav8衣壳。在另一个特定实施方式中,所述核酸被可操作连接到启动子,特别是遍在或肝特异性启动子。根据特定变体的实施方式,所述启动子是遍在启动子,例如巨细胞病毒增强子/鸡β-肌动蛋白(cag)启动子、巨细胞病毒增强子/启动子(cmv)、pgk启动子和sv40早期启动子。在特定变体中,所述遍在启动子是cag启动子。根据另一种变体,所述启动子是肝特异性启动子,例如α-1抗胰蛋白酶启动子(haat)、甲状腺素运载蛋白启动子、白蛋白启动子和甲状腺素结合性球蛋白(tbg)启动子。在特定变体中,所述肝特异性启动子是seqidno:15的haat肝特异性启动子。在另一个特定实施方式中,包含在本发明的aav载体的基因组中的核酸构建物还包含如上所述的内含子,例如置于所述启动子与编码gaa编码序列(即本发明的优化的gaa编码序列、本发明的嵌合gaa编码序列或本发明的嵌合且优化的gaa编码序列)的核酸序列之间的内含子。可以包含在引入到所述aav载体中的核酸构建物内的代表性内含子包括但不限于人类β球蛋白b2(或hbb2)内含子、fix内含子和鸡β-球蛋白内含子。所述aav载体的基因组中的所述内含子可以是经典(或未修饰的)内含子或被设计以减少所述内含子中的可选开放阅读框(arf)的数目或甚至完全除去arf的修饰的内含子。可以在这种将本发明的核酸引入到aav载体内的实施方式的实践中使用的修饰和未修饰的内含子,已在上文充分描述。在特定实施方式中,本发明的aav载体,特别是包含aav8、aav9、aavrh74或aav2i8衣壳,特别是aav8、aav9或aavrh74衣壳例如aav8或aav9衣壳,更特别是aav8衣壳的aav载体,在其基因组内包括修饰(或优化的)内含子,例如seqidno:7的修饰的hbb2内含子、seqidno:9的修饰的fix内含子和seqidno:11的修饰的鸡β-球蛋白内含子。在另一个特定实施方式中,本发明的载体是包含aav8、aav9、aavrh74或aav2i8衣壳、特别是aav8、aav9或aavrh74衣壳例如aav8或aav9衣壳,更特别是aav8衣壳的aav载体,其包含的基因组以5’至3’方向含有:aav5'-itr(例如aav25’-itr),apoe控制区,haat-肝特异性启动子,hbb2内含子(特别是如上所定义的修饰的hbb2内含子),本发明的gaa编码序列,牛生长激素多腺苷化信号和aav3'-itr(例如aav23'-itr),例如所述基因组包含seqidno:20、21或22中示出的核酸(分别包括在seqidno:17、18和19中示出的核酸序列,对应于编码源自于seqidno:5的亲本hgaa的gaa的δ8截短形式的优化序列)并在侧翼带有aav5'-itr(例如aav25’-itr)和aav3'-itr(例如aav23'-itr)。在本发明的实践中有用的其他表达盒包含在上面的表2、表2'或表2”、特别是表2'或表2”中示出的任一序列组合中的那些信号肽组成部分和gaa组成部分。

在本发明的特定实施方式中,本发明的核酸构建物包含如上所定义的肝特异性启动子,并且所述载体是如上所述的能够转导肝组织或细胞的病毒载体。发明人在下文展示的数据显示,得益于这个实施方式开发了高效且优化的载体以在肝细胞中表达可分泌形式的gaa并诱导对所述蛋白质的免疫耐受,肝的促耐受原和代谢性质被有利地实现。

此外,在另一个特定实施方式中,本发明提供了两种载体例如两种病毒载体、特别是两种aav载体的组合,用于在目标细胞中改进基因递送和治疗功效。例如,所述两种载体可以携带编码本发明的gaa蛋白的本发明的核酸分子,并且其在这两种载体的每一种中,在一个不同的启动子控制之下。在特定实施方式中,一种载体包含作为肝特异性启动子(如上文描述的之一)的启动子,另一种载体包含对用于治疗糖原贮积病的另一种目标组织具有特异性的启动子例如肌肉特异性启动子,例如肌间线蛋白启动子。在这个实施方式的特定变化形式中,这种载体组合对应于如wo2015196179中所述产生的多种共包装aav载体。

另一方面,本发明提供了一种嵌合gaa多肽,其包含信号肽组成部分和gaa组成部分,其中天然存在的gaa信号肽被选自seqidno:2至4的信号肽代替。在特定实施方式中,本发明的嵌合gaa多肽可以是源自于如上所述的gaa的截短形式的多肽。例如,本发明的嵌合gaa蛋白可以是δ1、δ2、δ3、δ4、δ5、δ6、δ7、δ8、δ9、δ10、δ11、δ12、δ13、δ14、δ15、δ16、δ17、δ18、δ19、δ20、δ21、δ22、δ23、δ24、δ25、δ26、δ27、δ28、δ29、δ30、δ31、δ32、δ33、δ34、δ35、δ36、δ37、δ38、δ39、δ40、δ41、δ42、δ43、δ44、δ45、δ46、δ47、δ48、δ49、δ50、δ51、δ52、δ53、δ54、δ55、δ56、δ57、δ58、δ59、δ60、δ61、δ62、δ63、δ64、δ65、δ66、δ67、δ68、δ69、δ70、δ71、δ72、δ73、δ74或δ75gaa截短形式组成部分(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白的截短形式),并在其n-端末端处融合到选自seqidno:2至4的信号肽。

在特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ6、δ7、δ8、δ9或δ10截短形式,特别是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ7、δ8或δ9截短形式,特别是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ8截短形式。

在另一个特定实施方式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ27、δ28、δ29、δ30或δ31、特别是δ28、δ29或δ30、更特别是δ29截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在另一个特定实施方式中,所述嵌合gaa蛋白的gaa组成部分是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ40、δ41、δ42、δ43或δ44截短形式,特别是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ41、δ42或δ43截短形式,特别是gaa(特别是在seqidno:5或seqidno:36、特别是seqidno:5中示出的亲本hgaa蛋白)的δ42截短形式。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ41、δ42、δ43、δ44或δ45、特别是δ42、δ43或δ44、更特别是δ43截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ27、δ28、δ29、δ30、δ31、δ40、δ41、δ42、δ43、δ44或δ45、特别是δ7、δ8、δ9、δ28、δ29、δ30、δ41、δ42、δ43或δ44、特别是δ8、δ29、δ42或δ43截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ6、δ7、δ8、δ9、δ10、δ40、δ41、δ42、δ43或δ44、特别是δ8或δ42截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ8、δ29、δ42、δ43或δ47截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ8、δ29、δ42或δ43截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在这个实施方式的另一种变化形式中,本发明的截短的gaa多肽是hgaa多肽、更特别是在seqidno:1或seqidno:33、特别是seqidno:1中示出的hgaa多肽或其功能性变体的δ8或δ42截短形式,所述功能性变体在seqidno:1或seqidno:33、特别是seqidno:1所示的序列中包含氨基酸替换,并与seqidno:1或seqidno:33、特别是seqidno:1具有至少80、85、90、95、96、97、98或99%的同一性。

在特定实施方式中,本发明的截短的hgaa多肽具有由seqidno:29、seqidno:30、seqidno:41、seqidno:42或seqidno:43中示出的序列或其功能性变体构成的氨基酸序列,所述功能性变体与在seqidno:29、seqidno:30、seqidno:41、seqidno:42或seqidno:43中示出的序列相比包含1至5个,特别是1至4个、特别是1至3个、更特别是1至2个、特别是1个氨基酸替换。在另一个特定实施方式中,本发明的截短的hgaa多肽具有由seqidno:29、seqidno:30、seqidno:41或seqidno:42中示出的序列或其功能性变体构成的氨基酸序列,所述功能性变体与在seqidno:29、seqidno:30、seqidno:41或seqidno:42中示出的序列相比包含1至5个氨基酸替换。在特定实施方式中,本发明的截短的hgaa多肽具有由seqidno:29或seqidno:30中示出的序列或其功能性变体构成的氨基酸序列,所述功能性变体与在seqidno:29或seqidno:30中示出的序列相比包含1至5个,特别是1至4个、特别是1至3个、更特别是1至2个、特别是1个氨基酸替换。

在特定实施方式中,所述嵌合gaa多肽具有从上面的表1、表1'或表1”、特别是表1'或表1”中示出的组合之一产生的序列,或者是其功能性衍生物,所述功能性衍生物与所得到的序列组合具有至少90%的同一性,特别是至少95%、至少96%、至少97%、至少98%或至少99%的同一性。

本发明还涉及用本发明的核酸分子或构建物转化的细胞例如肝细胞,这与用于离体基因疗法的情况相同。本发明的细胞可以通过任何适合的给药途径递送到需要它们的对象例如缺乏gaa的患者,例如通过注射到所述对象的肝脏中或血流中。在特定实施方式中,本发明包括将本发明的核酸引入到肝细胞中,特别是待治疗对象的肝细胞中,并将其中引入有所述核酸的转化的肝细胞给药到所述对象。有利的是,这个实施方式对从所述细胞分泌gaa有用。在特定实施方式中,所述肝细胞是来自于待治疗患者的肝细胞,或者是肝干细胞,其被进一步转化并在体外分化成肝细胞,用于随后给药到所述患者。

本发明还涉及一种转基因非人类动物,在其基因组中包含编码本发明的gaa蛋白的核酸分子或构建物。在特定实施方式中,所述动物是小鼠。

除了在下文实施例中呈现的特定递送系统之外,各种不同的递送系统是已知的,并且可用于给药本发明的核酸分子或构建物,例如包封在脂质体、微粒、微胶囊、能够表达本发明的编码序列的重组细胞中,受体介导的胞吞作用,构建治疗性核酸作为反转录病毒或其他载体的一部分等。

根据一个实施方式,可能希望将本发明的嵌合gaa多肽、核酸分子、核酸构建物或细胞通过任何适合的途径引入到所述对象的肝脏中。除了裸露的dna之外,可以将例如微环和转座子用于慢病毒载体的递送。此外,基因编辑技术例如锌指核酸酶、巨核酸酶(meganuclease)、talen和crispr,也可用于递送本发明的编码序列。

本发明还提供了包含本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞的药物组合物。这些组合物包含治疗有效量的所述治疗剂(本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞)和可药用载体。在特定实施方式中,术语“可药用的”意味着由联邦或州政府的监管机构批准或列于美国或欧洲药典或其他公认的药典中,用于在动物和人类中使用的。术语“载体”是指稀释剂、佐剂、赋形剂或介质,所述治疗剂与它们一起给药。这些药用载体可以是无菌液体例如水和油,包括石油、动物、植物或合成来源的油,例如花生油、大豆油、矿物油、芝麻油等。当所述药物组合物被静脉内给药时,水是优选的载体。盐水溶液和右旋糖和甘油水溶液也可用作液体载体,特别是对于可注射溶液。适合的药物赋形剂包括淀粉、葡萄糖、乳糖、蔗糖、硬脂酸钠、单硬脂酸甘油酯、滑石、氯化钠、脱脂奶粉、甘油、丙二醇、水、乙醇等。

如果需要,所述组合物还可以含有少量润湿剂或乳化剂或ph缓冲剂。这些组合物可以采取溶液、悬液、乳液、片剂、丸剂、胶囊、粉剂、缓释剂等的形式。口服配方可以包含标准的载体例如制药级甘露糖醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素、碳酸镁等。适合的药物载体的实例描述在e.w.martin的《remington制药学》(remington'spharmaceuticalsciences)中。这些组合物应该含有治疗有效量的所述治疗剂、优选是采取纯化形式的治疗剂,以及适合量的载体以便提供适合于给药到所述对象的形式。在特定实施方式中,本发明的核酸、载体或细胞被配制在包含磷酸盐缓冲盐水并增补有0.25%人血清白蛋白的组合物中。在另一个特定实施方式中,本发明的核酸、载体或细胞被配制在包含林格乳酸盐溶液和以总组合物的重量计终浓度为0.01-0.0001%、例如浓度为0.001%的非离子型表面活性剂例如pluronicf68的组合物中。所述组合物还可以包含血清白蛋白,特别是人血清白蛋白,例如0.25%的人血清白蛋白。其他适用于储存或给药的配方在本领域中是已知的,特别是从wo2005/118792或allay等,2011。

在优选实施方式中,所述组合物按照常规程序配制成适合于静脉内给药到人类的药物组合物。通常,用于静脉内给药的组合物是在无菌等渗水性缓冲液中的溶液。在必要时,所述组合物还可以包含增溶剂和局部麻醉剂例如利诺卡因,以缓解注射位点处的疼痛。

在一个实施方式中,本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞可以在囊泡、特别是脂质体中递送。在另一个实施方式中,本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞可以在受控释放系统中递送。

本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞的给药方法包括但不限于真皮内、肌肉内、腹膜内、静脉内、皮下、鼻内、硬膜外和口服途径。在特定实施方式中,所述给药通过静脉内或肌肉内途径。本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞,不论是否被载体化,都可以通过任何方便的途径给药,例如通过输注或快速浓注,通过经上皮或粘膜衬(例如口腔粘膜、直肠和肠粘膜等)的吸收,并且可以与其他生物活性药剂一起给药。给药可以是系统性或局部的。

在特定实施方式中,可能希望将本发明的药物组合物局部给药到需要治疗的区域,例如肝脏。这可以例如利用植入物来实现,所述植入物是多孔、无孔或胶状材料,包括膜例如硅橡胶膜或纤维。

在糖原贮积病的治疗中有效的本发明的治疗剂(即本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞)的量可以通过标准的临床技术来确定。此外,可以任选地使用体内和/或体外测定法来帮助预测最适剂量范围。在所述制剂中使用的精确剂量也取决于给药途径和疾病的严重性,并且应该根据执业医师的判断和每位患者的情况来决定。本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞的给药到需要它们的对象的剂量将随着几种因素而变,包括但不限于给药途径、治疗的具体疾病、对象的年龄或获得治疗效果所必需的表达水平。本领域技术人员可以在本领域知识的基础上,容易地根据这些因素和其他因素确定所需的剂量范围。在治疗包括向对象给药病毒载体例如aav载体的情况下,所述载体的典型剂量为至少1x108个载体基因组每千克体重(vg/kg),例如至少1x109vg/kg、至少1x1010vg/kg、至少1x1011vg/kg、至少1x1012vg/kg、至少1x1013vg/kg或至少1x1014vg/kg。

本发明还涉及一种用于治疗糖原贮积病的方法,所述方法包括向需要的对象递送治疗有效量的本发明的核酸、载体、嵌合多肽、药物组合物或细胞的步骤。

本发明还涉及一种用于治疗糖原贮积病的方法,所述方法不诱导针对所述转入基因(即针对本发明的嵌合gaa多肽)的免疫应答,或诱导针对所述转入基因的降低的免疫应答,所述方法包括向需要的对象递送治疗有效量的本发明的核酸分子、核酸构建物、载体、药物组合物或细胞的步骤。本发明还涉及一种用于治疗糖原贮积病的方法,所述方法包括向需要的对象重复给药治疗有效量的本发明的核酸分子、核酸构建物、载体、药物组合物或细胞。在这种情况下,本发明的核酸分子或核酸构建物包含在肝细胞中有功能的启动子,从而允许从其产生针对所表达的嵌合gaa多肽的免疫耐受性。同样地,在这种情况下,在这种情形中使用的药物组合物包含的核酸分子或核酸构建物包含在肝细胞中有功能的启动子。在递送肝细胞的情况下,所述细胞可以是以前从所述需要治疗的对象收集并通过在其中引入本发明的核酸分子或核酸构建物进行工程化改造从而使它们能够生产本发明的嵌合gaa多肽的细胞。根据一个实施方式,在包含重复给药的情况下,所述给药可以重复至少一次或更多次,并且甚至可以被认为按照定期时间表进行,例如每周、每月或每年一次。所述定期时间表也可以包括每2、3、4、5、6、7、8、9或10年或超过10年给药一次。在另一个特定实施方式中,本发明的病毒载体的每次给药,对于每次连续的给药来说使用不同的病毒来进行,从而避免由于针对以前给药的病毒载体的可能免疫应答而造成的功效降低。例如,第一次给药可以使用包含aav8衣壳的病毒载体,然后给药包含aav9衣壳的载体或甚至给药与aav无关的病毒例如反转录病毒或慢病毒载体。

根据本发明,治疗可以包括治愈、缓解或预防作用。因此,治疗性和预防性治疗包括特定糖原贮积病的症状的改善或阻止或以其他方式降低发生特定糖原贮积病的风险。术语“预防性”可以被认为是降低特定病症的严重性或发生率。“预防性”还包括在以前被诊断为患有特定病症的患者中阻止所述病症的复发。“治疗性”也可以降低现有病症的严重性。术语“治疗”在本文中用于指称可以有益于动物、特别是哺乳动物、更特别是人类对象的任何方案。

本发明还涉及一种用于治疗糖原贮积病的离体基因治疗方法,所述方法包括将本发明的核酸分子或核酸构建物引入到需要治疗的患者的分离的细胞例如分离的造血干细胞中,并将所述细胞引入到所述需要治疗的患者中。在这种情况的特定实施方式中,将所述核酸分子或构建物用如上所定义的载体引入到所述细胞中。在特定实施方式中,所述载体是整合型病毒载体。在另一个特定实施方式中,所述病毒载体是反转录病毒载体例如慢病毒载体。例如,在vantil等,2010,blood,115(26),p.5329中所公开的慢病毒载体可用于本发明的方法的实践中。

本发明还涉及本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞,其用作药物。

本发明还涉及本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞,其用于治疗由gaa基因中的突变引起的疾病的方法中,特别是用于治疗庞贝氏病的方法中。本发明还涉及本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞,其用于治疗糖原贮积病的方法中,所述糖原贮积病例如为gsdi(冯·吉尔克氏病)、gsdii(庞贝氏病)、gsdiii(科里氏病)、gsdiv、gsdv、gsdvi、gsdvii、gsdviii和心脏的致死性先天性糖原贮积病,更特别是gsdi、gsdii或gsdiii,甚至更特别是gsdii和gsdiii,最特别是gsdii。本发明的嵌合gaa多肽可以被给药到需要的患者,用于酶替代疗法(ert)中,例如用于一种糖原贮积病的酶替代疗法中,所述糖原贮积病例如gsdi(冯·吉尔克氏病)、gsdii(庞贝氏病)、gsdiii(科里氏病)、gsdiv、gsdv、gsdvi、gsdvii、gsdviii和心脏的致死性先天性糖原贮积病,更特别是gsdi、gsdii或gsdiii,甚至更特别是gsdii和gsdiii,最特别是gsdii。

本发明还涉及本发明的核酸分子、核酸构建物、载体、嵌合gaa多肽或细胞在制造药物中的用途,所述药物可用于治疗糖原贮积病例如gsdi(冯·吉尔克氏病)、gsdii(庞贝氏病)、gsdiii(科里氏病)、gsdiv、gsdv、gsdvi、gsdvii、gsdviii和心脏的致死性先天性糖原贮积病,更特别是gsdi、gsdii或gsdiii,甚至更特别是gsdii和gsdiii,最特别是gsdii。

实施例

通过参考下面的实验实施例和附图,对本发明进行更详细地描述。提供这些实施例仅仅是出于说明的目的,并且不打算是限制性的。

材料和方法

gaa活性

在将冷冻的组织样品在蒸馏水中匀浆后测量gaa活性。称出50-100mg组织并匀浆,然后以10000xg离心20分钟。在96孔板中,使用10μl上清液和20μl底物4muα-d-葡萄糖苷设置反应。将所述反应混合物在37℃温浴1小时,然后通过添加150μlph10.5的碳酸钠缓冲液终止反应。使用enspireα读板器(perkin-elmer)在449nm(发射)和360nm(激发)下,使用标准曲线(0-2500pmol/μl的4mu)来测量从各个反应混合物释放的荧光4mu。所述澄清的上清液的蛋白质浓度通过bca(thermofisherscientific)来定量。为了计算gaa活性,用释放的4mu浓度除以样品的蛋白质浓度,并将活性以nmol/小时/mg蛋白为单位报告。

糖原含量

糖原含量被间接测量为如上所述获得的组织匀浆液被黑曲霉(aspergillusniger)淀粉葡萄糖苷酶完全消化后释放出的葡萄糖。反应在96孔板中,使用20μl组织匀浆液和55μl蒸馏水来设置。将样品在95℃温浴5min,然后在4℃冷却。向每个样品添加25μl淀粉葡萄糖苷酶(在0.1mph5.5的乙酸钾中1:50稀释)。对每个样品也设置不含淀粉葡萄糖苷酶的对照反应。将样品和对照反应两者在37℃温浴90分钟。通过将样品在95℃温浴5min来终止反应。释放出的葡萄糖使用葡萄糖测定试剂盒(sigma-aldrich),通过使用enspireα读板器(perkin-elmer)在540nm处测量吸收值来确定。

体积描记术

使用流通式(0.5l/min)体积描记仪(emkatechnologies)来测量对照和gaa-/-小鼠中的呼吸模式。在采集数据之前,将透明有机玻璃(plexiglas)仓室用已知的气流和压力信号校准。信号使用iox2软件(emkatechnologies)来分析。测量了下述变量:呼吸频率,潮气量和分钟通气量。通气数据被收集在5-min的数据包中。允许适应仓室5分钟。在适应和数据获取两者期间,小鼠呼吸常氧空气(21%o2,79%n2)。

小鼠研究

gaa-/-小鼠通过定向破坏外显子6来产生,并维持在c57bl/6j/129x1/svj背景上(rabenn.等,1998)。以0.2ml的体积通过尾静脉递送载体。每月收集血清样品以监测分泌的hgaa的水平。使用pbs注射的患病动物和野生型同窝仔畜作为对照。

抗hgaa抗体测定

将maxisorp96孔板(thermofisherscientific)用碳酸盐缓冲液中的蛋白在4℃包被过夜。将大鼠重组igg标准品(sigmaaldrich)以从1μg/ml开始7个两倍的稀释度包被到所述孔。在阻断后,向板添加血浆样品,并在37℃温浴1hr。检测通过向所述孔添加3,3′,5,5′-四甲基联苯胺底物(bdbiosciences)来进行,并在用h2so4阻断反应后在enspire读板器(perkinelmer)上在450和570nm(用于背景减除)处测量颜色生成。

nhp研究

将雄性食蟹猴饲养在不锈钢笼子中并维持在12小时光/暗周期下。在开始研究之前,所有食蟹猴具有<1:5的中和抗体滴度。通过隐静脉输注一剂2e12vg/kg的aav8-haat-sp7-δ8-hgaaco1。在所述注射之前12天和之后30天通过股静脉获取血液样品。将全血收集在含有edta的管中并离心以分离血清。在载体给药后三个月,将所有食蟹猴安乐死。首先将动物用氯胺酮/右旋美托咪啶的混合物麻醉,然后使用iv注射的戊巴比妥钠进行安乐死。立即收集组织并在液氮中冷冻。

蛋白质印迹分析

从冷冻的肌肉获得总匀浆物。通过piercebca蛋白质测定法(thermofisherscientific),按照制造商的说明书确定提取物中的蛋白质浓度。蛋白质印迹使用抗hgaa抗体(abcam)来进行。使用抗微管蛋白抗体(sigmaaldrich)作为载样对照。

结果

在改进当前用于庞贝氏病的基因替代疗法的尝试中,我们通过在序列优化过的hgaa序列(seqidno:13)中用不同的信号肽(sp2至8,描述在表4中)替换野生型信号肽(在本文中被标注为sp1),对hgaa序列进行工程化改造,以提高它的分泌。

表4

我们用表达gfp或野生型hgaa(hgaa;seqidno:37)的质粒与表达与信号肽1至8融合的密码子优化的hgaa(hgaaco)的质粒平行地转染肝细胞瘤细胞(huh-7)。在转染后48小时,分析生长培养基中hgaa的存在。值得注意的是,仅仅四种带有高效信号肽的构建物引起hgaa的分泌水平显著高于在由gfp转染的细胞所代表的的阴性对照中观察到的水平(图1a)。表达带有信号肽sp2、sp6、sp7和sp8的hgaa嵌合蛋白的构建物在培养基中分泌较高水平的hgaa(相对于gfpp<0.05)。

然后我们将这些构建物包装在通过三重转染和氯化铯纯化产生的aav8载体中,并且我们将它们注射到野生型c57bl/6j小鼠中。然后,我们比较了使用信号肽sp1、2、3、7和8的构建物之间的体内gaa血清水平(图1b)。在注射1e12vg/kg的表达hgaaco的aav8载体后一个月,我们观察到与pbs注射的小鼠相比明显更高的循环hgaa水平。有趣的是,在用表达与sp2、7和8融合的hgaaco的载体处理的小鼠中,循环hgaa的水平明显更高。令人吃惊的是,在体内使用sp2构建物获得的分泌水平明显低于使用sp7-和sp8-工程化hgaa所测量到的水平(图1b)。合在一起,这些数据表明用源自于在肝脏中高效分泌的蛋白质的信号肽替换野生型信号肽,是在体内提高hgaa循环水平的有效策略。此外,使用sp7和8信号肽在体内获得的出人意料的结果表明不是所有的信号肽在体内都同等地高效,并且信号肽sp7和sp8与sp1和sp2相比在体内驱动卓越的分泌功效。

然后在所述疾病的动物模型gaa-/-小鼠中验证了这些发现。该小鼠模型在肌肉中不存在残留的酶活性,这与不同器官中的糖原积累合在一起,引起肌肉强度受损和寿命缩短。

为了比较不同载体在gaa-/-小鼠中挽救庞贝氏病表型的有效性,我们对注射2e12vg/kg的表达hgaaco和与信号肽sp2、7和8融合的工程化版本的载体的效果进行了长期跟踪。在注射后三个月,我们观察到在用表达带有高效信号肽sp2、7和8的hgaaco的aav8注射后,循环hgaa显著提高(图2a)。值得注意的是,与sp7信号肽融合的hgaaco引起的循环hgaa水平明显高于对其他两种构建物观察到的水平。这个实验中的长期跟踪允许我们评估gaa-/-小鼠的存活率。小鼠在4月龄时接受注射,然后跟踪6个月。在此期间,在pbs注射组中8/10的gaa-/-小鼠死亡,而在用表达hgaaco的构建物处理的gaa-/-动物中和野生型动物中仅仅报道了1/45的死亡。这一发现的统计学显著性(图2b)表明使用所有hgaaco表达载体的处理,与分泌水平无关,都挽救在gaa-/-小鼠中观察到的致死表型。为这种小鼠模型报道的另一种表型是呼吸功能的降低。具体来说,已报道了潮气量的降低(deruisseau等,pnas2008),并且已证实这种降低是由神经系统中糖原的积累造成的。神经系统中糖原水平的挽救依赖于hgaa跨过血脑屏障的能力,并且在其他溶酶体贮积病中已证实(polito等,hum.mol.genet.2010;cho等,orph.j.ofraredis.2015),这直接依赖于所述蛋白质的循环水平。因此,我们评估了长期的高hgaa循环水平对gaa-/-小鼠的潮气量的影响。在注射后三个月,gaa-/-小鼠显示出降低的潮气量,尽管不显著(p=0.104),而用sp7处理的小鼠显示出与在wt小鼠中观察到的非常相近的潮气量(p=0.974)(图2c,左侧)。在注射后6个月,仅仅两只gaa-/-小鼠存活,并且它们显得具有不太严重的呼吸系统表型。同样地,用sp7hgaaco处理的小鼠具有与在wt动物中观察到的相近的潮气量(p=0.969)(图2c,右侧)。重要的是,在用sp1和sp7hgaaco处理的小鼠中测量到的潮气量之间注意到统计学显著的差异(p=0.041),显示出在sp7-gaa处理的小鼠中更显著的改善。这些数据合在一起表明,用表达与sp7信号肽融合的hgaaco的aav8进行的肝转导引起血液中hgaa的水平升高,并同时完全校正了gaa-/-小鼠中的呼吸功能表型。

然后,我们核实了高水平的循环hgaa是否挽救骨骼肌中的糖原积累。我们测量了如上所述注射的小鼠的股四头肌中的hgaa活性。hgaa表达载体的注射引起股四头肌中的hgaa活性升高到与在wt动物中观察到的可比的水平(图3a)。股四头肌中糖原的测量表明gaa-/-小鼠积累比wt动物多~20倍的糖原(p=3.5e-6)。这种积累被使用hgaa表达载体的处理逆转(相对于gaa-/-p<0.05),其中显示出最低糖原水平的sp7不能与野生型动物的水平区分开(相对于wtp=0.898)(图3b)。

为了证实hgaa与高效信号肽的融合在体内提高它的分泌并提高疾病的表型校正,我们用低的载体剂量注射gaa-/-小鼠,并且我们评估了表型的生物化学校正。在注射6e11vg/kg的表达与信号肽1、7和8融合的hgaaco的载体后三个月,我们测量了循环hgaa。值得注意的是,与pbs处理的小鼠相比,sp7和8引起血清中可检测的分泌的hgaa增加三倍(图4a)。通过对来自于处理过的动物和对照的组织进行生物化学分析,我们进一步研究了表达hgaaco的aav8载体的治疗效果。我们评估了如上所述处理的gaa-/-小鼠的心脏、隔膜和股四头肌中的糖原含量。值得注意的是,在用hgaaco表达载体处理后,我们在组织中观察到高水平的hgaa(数据未示出),其与所有考虑的组织中糖原含量的显著降低相关(图4b-d)。具体来说,在心脏中(图4b),在用带有高效信号肽sp7和8的载体处理后测量到的糖原水平与在未患病的野生型动物中观察到的水平不可区分(相对于wt分别为p=0.983和0.996)。重要的是,与pbs注射或用野生型hgaaco表达载体(被标注为sp1)处理的gaa-/-动物相比,在用sp7和sp8载体两者处理后观察到的水平显著降低。

我们还试验了使用我们的载体的肝转导是否诱导针对所述转入基因的体液应答。将小鼠用在肝特异性启动子的转录控制之下表达带有本源sp1信号肽的hgaaco1(co)或与sp2、sp7或sp8融合的δ8-hgaaco1的aav8载体静脉内注射。结果呈现在图5中。用在组成性启动子的转录控制之下表达δ8-hgaaco1的aav肌肉内注射的gaa-/-显示出非常高水平的总igg(~150μg/ml),而在肝中表达同一蛋白的载体总的来说显示出更低的体液应答水平。有趣的是,用表达sp1hgaaco1(co)的载体注射的小鼠在两种剂量下显示出可检测的抗体水平,而用工程化的高分泌载体注射的小鼠具有不可检测的igg水平。这些数据表明,转入基因在肝中的表达对于外周耐受的诱导来说是基础性的,它们还提供了下述指示,即通过与高效信号肽融合获得的高的循环hgaa水平,诱导针对所述蛋白质本身的体液应答的降低。

将在小鼠研究中选出的性能最好的载体注射到两只非人类灵长动物(nhp,食蟹猴)中,以验证我们的载体的分泌效能和在肌肉中的摄取。我们用2e12vg/kg的aav8-haat-sp7-δ8-hgaaco1注射两只猴。在注射后一个月,我们使用特异性抗hgaa抗体,通过蛋白质印迹测量了两只动物的血清中的hgaa水平。我们在两只猴中观察到大小与hgaa相符的清晰条带。这个条带在载体注射前12天获得的血清样品中不存在,从而证实了我们的检测方法的特异性(图6a)。我们在注射后三个月处死动物并获取组织,以确认从肝脏分泌到血流中的hgaa是否被肌肉高效摄取。我们使用特异性针对hgaa的抗体对从两只猴的二头肌和隔膜获得的总裂解液进行蛋白质印迹。有趣的是,我们能够在2号动物中观察到清晰的条带,所述动物也在血流中显示出最高水平的hgaa(图6b)。在1号动物中,我们也能在两种被分析的肌肉中观察到分子量与hgaa相一致的较弱的条带。这些数据表明,在nhp中aav8-haat-sp7-δ8-hgaaco1载体高效转导肝。它们也证实了分泌在血流中的蛋白被高效摄取到肌肉中,并且这种摄取与在血液中测量到的hgaa水平相关。

我们在用不同版本的gaa(全都密码子优化过)转染的huh7细胞的培养基和裂解物中进一步进行了gaa活性的分析:1.包含本源sp1gaa信号肽的本源gaa(co),2.含有异源sp7或sp8信号肽的工程化的gaa(sp7-co,sp8-co)。所述分析显示(图7),与本源gaa(co)相比在用工程化的版本转染的细胞的培养基中gaa活性明显更高。有趣的是,与所述工程化的版本相比,当使用本源gaa(co)时细胞内gaa活性反而明显更高,表明本源gaa主要保留在细胞内。

我们还确定了在小鼠研究中选出的最佳性能载体(aav8-haat-sp7-δ8-hgaaco1)在gsdiii小鼠模型中的效果。我们开发了糖原脱支酶(gde)的敲除小鼠模型。这种模型重现了在患有iii型糖原贮积病(gsdiii)的人类中观察到的疾病表型。具体来说,完全缺乏gde活性的gde-/-小鼠具有肌肉强度受损并在不同组织中积累糖原。有趣的是,它们也在肝脏中积累糖原,这在人类中也被观察到。在这里,我们试验了肝脏中sp7-δ8-hgaa的过表达是否挽救在gde-/-小鼠中观察到的糖原积累。我们用1e11或1e12vg/小鼠的aav8-haat-sp7-δ8-hgaaco1注射gde-/-小鼠。作为对照,我们用pbs平行地注射野生型(wt)和gde-/-小鼠。在载体给药后三个月,将小鼠处死,并对肝脏中的糖原水平进行定量。结果报告在图8中。正如已经报道的(pagliarani等和我们的模型),gde-/-小鼠显示出肝脏中糖原积累的显著增加(p=1.3e-7),当与野生型动物相比时具有多5倍的糖原。令人吃惊的是,使用1e11和1e12vg/小鼠的aav8-haat-sp7-δ8-hgaaco1载体的处理引起糖原含量的统计学显著的降低(分别为p=4.5e-5和1.4e-6)。重要的是,在用aav8-haat-sp7-δ8-hgaaco1载体注射的小鼠的肝脏中测量到的糖原水平与在野生型动物中测量到的水平不可区分,特别是在最高剂量下(对于1e11剂量组群来说p=0.053,对于1e12剂量组群来说为0.244)。

我们在用不同版本的gaa(全都密码子优化过)转染的huh7细胞的培养基和裂解物中进行了gaa活性的分析:1.包括本源sp1gaa信号肽的本源gaa(co),2.含有异源sp7信号肽的工程化的gaa(sp7-co),和3.含有异源sp7信号肽然后缺失了不同数目的氨基酸的工程化的gaa(sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co、sp7-δ47-co和sp7-δ62-co,其中分别缺失了seqidno:5的前8、29、42、47和62个n-端氨基酸)。所述分析显示(图9),与工程化的未缺失的gaa(sp7-co)和本源gaa(co)两者相比,在用δ8、δ29、δ42和δ43gaa版本转染的细胞的培养基中gaa活性明显更高。相反,与其他工程化的gaa版本[缺失的(sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co)和未缺失的(sp7-co)]相比,在用δ47和δ62gaa版本转染的细胞的培养基中观察到明显更低的gaa活性。有趣的是,(图10)在生产性缺失(sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co)和未缺失的版本(sp7-co)之间细胞内gaa活性没有差异,表明它们都在细胞内高效地生产和加工。相反,对于sp7-δ47-co和sp7-δ62-co版本来说,细胞内gaa活性非常低,并且与所有其他工程化的版本[缺失的(sp7-δ8-co、sp7-δ29-co、sp7-δ42-co、sp7-δ43-co)和未缺失的(sp7-co)]相比明显更低。

我们还在用不同版本的gaa(全都密码子优化过)转染的huh7细胞的培养基和裂解物中进行了gaa活性的分析:1.包括本源sp1gaa信号肽的本源gaa(co),2.含有异源sp6或sp8信号肽的工程化的gaa(sp6-co、sp8-co),和3.含有异源sp6或sp8信号肽然后缺失了8个氨基酸的工程化的gaa(sp6-δ8-co、sp8-δ8-co)。所述分析显示(图11),与i.它们相应的工程化的未缺失的gaa版本(sp6-co或sp8-co)和ii.本源gaa(co)相比,在用δ8版本转染的细胞的培养基中gaa活性明显更高。有趣的是,在所有工程化的gaa版本(缺失和未缺失的两者)之间,细胞内gaa活性没有差异,表明它们都在细胞内高效地生产和加工(细胞裂解液图)。相反,与工程化的版本相比,使用本源gaa(co)时细胞内gaa活性明显更高,表明本源gaa主要保留在细胞内。

序列表

<110>吉尼松公司等

<120>酸性α-葡萄糖苷酶变体及其用途

<130>b2298pc00

<160>54

<170>patentinversion3.3

<210>1

<211>2859

<212>dna

<213>智人

<400>1

atgggagtgaggcacccgccctgctcccaccggctcctggccgtctgcgccctcgtgtcc60

ttggcaaccgcagcgctcctggggcacatcctactccatgatttcctgctggttccccga120

gagctgagtggctcctccccagtcctggaggagactcacccagctcaccagcagggagcc180

agcagaccagggccccgggatgcccaggcacaccccgggcggccgcgagcagtgcccaca240

cagtgcgacgtcccccccaacagccgcttcgattgcgcccctgacaaggccatcacccag300

gaacagtgcgaggcccgcggctgttgctacatccctgcaaagcaggggctgcagggagcc360

cagatggggcagccctggtgcttcttcccacccagctaccccagctacaagctggagaac420

ctgagctcctctgaaatgggctacacggccaccctgacccgtaccacccccaccttcttc480

cccaaggacatcctgaccctgcggctggacgtgatgatggagactgagaaccgcctccac540

ttcacgatcaaagatccagctaacaggcgctacgaggtgcccttggagaccccgcatgtc600

cacagccgggcaccgtccccactctacagcgtggagttctccgaggagcccttcggggtg660

atcgtgcgccggcagctggacggccgcgtgctgctgaacacgacggtggcgcccctgttc720

tttgcggaccagttccttcagctgtccacctcgctgccctcgcagtatatcacaggcctc780

gccgagcacctcagtcccctgatgctcagcaccagctggaccaggatcaccctgtggaac840

cgggaccttgcgcccacgcccggtgcgaacctctacgggtctcaccctttctacctggcg900

ctggaggacggcgggtcggcacacggggtgttcctgctaaacagcaatgccatggatgtg960

gtcctgcagccgagccctgcccttagctggaggtcgacaggtgggatcctggatgtctac1020

atcttcctgggcccagagcccaagagcgtggtgcagcagtacctggacgttgtgggatac1080

ccgttcatgccgccatactggggcctgggcttccacctgtgccgctggggctactcctcc1140

accgctatcacccgccaggtggtggagaacatgaccagggcccacttccccctggacgtc1200

cagtggaacgacctggactacatggactcccggagggacttcacgttcaacaaggatggc1260

ttccgggacttcccggccatggtgcaggagctgcaccagggcggccggcgctacatgatg1320

atcgtggatcctgccatcagcagctcgggccctgccgggagctacaggccctacgacgag1380

ggtctgcggaggggggttttcatcaccaacgagaccggccagccgctgattgggaaggta1440

tggcccgggtccactgccttccccgacttcaccaaccccacagccctggcctggtgggag1500

gacatggtggctgagttccatgaccaggtgcccttcgacggcatgtggattgacatgaac1560

gagccttccaacttcatcaggggctctgaggacggctgccccaacaatgagctggagaac1620

ccaccctacgtgcctggggtggttggggggaccctccaggcggccaccatctgtgcctcc1680

agccaccagtttctctccacacactacaacctgcacaacctctacggcctgaccgaagcc1740

atcgcctcccacagggcgctggtgaaggctcgggggacacgcccatttgtgatctcccgc1800

tcgacctttgctggccacggccgatacgccggccactggacgggggacgtgtggagctcc1860

tgggagcagctcgcctcctccgtgccagaaatcctgcagtttaacctgctgggggtgcct1920

ctggtcggggccgacgtctgcggcttcctgggcaacacctcagaggagctgtgtgtgcgc1980

tggacccagctgggggccttctaccccttcatgcggaaccacaacagcctgctcagtctg2040

ccccaggagccgtacagcttcagcgagccggcccagcaggccatgaggaaggccctcacc2100

ctgcgctacgcactcctcccccacctctacacactgttccaccaggcccacgtcgcgggg2160

gagaccgtggcccggcccctcttcctggagttccccaaggactctagcacctggactgtg2220

gaccaccagctcctgtggggggaggccctgctcatcaccccagtgctccaggccgggaag2280

gccgaagtgactggctacttccccttgggcacatggtacgacctgcagacggtgccagta2340

gaggcccttggcagcctcccacccccacctgcagctccccgtgagccagccatccacagc2400

gaggggcagtgggtgacgctgccggcccccctggacaccatcaacgtccacctccgggct2460

gggtacatcatccccctgcagggccctggcctcacaaccacagagtcccgccagcagccc2520

atggccctggctgtggccctgaccaagggtggggaggcccgaggggagctgttctgggac2580

gatggagagagcctggaagtgctggagcgaggggcctacacacaggtcatcttcctggcc2640

aggaataacacgatcgtgaatgagctggtacgtgtgaccagtgagggagctggcctgcag2700

ctgcagaaggtgactgtcctgggcgtggccacggcgccccagcaggtcctctccaacggt2760

gtccctgtctccaacttcacctacagccccgacaccaaggtcctggacatctgtgtctcg2820

ctgttgatgggagagcagtttctcgtcagctggtgttag2859

<210>2

<211>18

<212>prt

<213>人工序列

<220>

<223>sp7

<400>2

metalapheleutrpleuleusercystrpalaleuleuglythrthr

151015

phegly

<210>3

<211>25

<212>prt

<213>人工序列

<220>

<223>sp6

<400>3

metproproproargthrglyargglyleuleutrpleuglyleuval

151015

leuserservalcysvalalaleugly

2025

<210>4

<211>22

<212>prt

<213>人工序列

<220>

<223>sp8

<400>4

metalaserargleuthrleuleuthrleuleuleuleuleuleuala

151015

glyaspargalaserser

20

<210>5

<211>925

<212>prt

<213>人工序列

<220>

<223>hgaawtw/osp

<400>5

glyhisileleuleuhisasppheleuleuvalproarggluleuser

151015

glyserserprovalleuglugluthrhisproalahisglnglngly

202530

alaserargproglyproargaspalaglnalahisproglyargpro

354045

argalavalprothrglncysaspvalproproasnserargpheasp

505560

cysalaproasplysalailethrglngluglncysglualaarggly

65707580

cyscystyrileproalalysglnglyleuglnglyalaglnmetgly

859095

glnprotrpcysphepheproprosertyrprosertyrlysleuglu

100105110

asnleuserserserglumetglytyrthralathrleuthrargthr

115120125

thrprothrphepheprolysaspileleuthrleuargleuaspval

130135140

metmetgluthrgluasnargleuhisphethrilelysaspproala

145150155160

asnargargtyrgluvalproleugluthrprohisvalhisserarg

165170175

alaproserproleutyrservalglupheserglugluprophegly

180185190

valilevalargargglnleuaspglyargvalleuleuasnthrthr

195200205

valalaproleuphephealaaspglnpheleuglnleuserthrser

210215220

leuproserglntyrilethrglyleualagluhisleuserproleu

225230235240

metleuserthrsertrpthrargilethrleutrpasnargaspleu

245250255

alaprothrproglyalaasnleutyrglyserhisprophetyrleu

260265270

alaleugluaspglyglyseralahisglyvalpheleuleuasnser

275280285

asnalametaspvalvalleuglnproserproalaleusertrparg

290295300

serthrglyglyileleuaspvaltyrilepheleuglyproglupro

305310315320

lysservalvalglnglntyrleuaspvalvalglytyrprophemet

325330335

proprotyrtrpglyleuglyphehisleucysargtrpglytyrser

340345350

serthralailethrargglnvalvalgluasnmetthrargalahis

355360365

pheproleuaspvalglntrpasnaspleuasptyrmetaspserarg

370375380

argaspphethrpheasnlysaspglypheargasppheproalamet

385390395400

valglngluleuhisglnglyglyargargtyrmetmetilevalasp

405410415

proalaileserserserglyproalaglysertyrargprotyrasp

420425430

gluglyleuargargglyvalpheilethrasngluthrglyglnpro

435440445

leuileglylysvaltrpproglyserthralapheproaspphethr

450455460

asnprothralaleualatrptrpgluaspmetvalalagluphehis

465470475480

aspglnvalpropheaspglymettrpileaspmetasngluproser

485490495

asnpheileargglysergluaspglycysproasnasngluleuglu

500505510

asnproprotyrvalproglyvalvalglyglythrleuglnalaala

515520525

thrilecysalaserserhisglnpheleuserthrhistyrasnleu

530535540

hisasnleutyrglyleuthrglualailealaserhisargalaleu

545550555560

vallysalaargglythrargprophevalileserargserthrphe

565570575

alaglyhisglyargtyralaglyhistrpthrglyaspvaltrpser

580585590

sertrpgluglnleualaserservalprogluileleuglnpheasn

595600605

leuleuglyvalproleuvalglyalaaspvalcysglypheleugly

610615620

asnthrserglugluleucysvalargtrpthrglnleuglyalaphe

625630635640

tyrprophemetargasnhisasnserleuleuserleuproglnglu

645650655

protyrserphesergluproalaglnglnalametarglysalaleu

660665670

thrleuargtyralaleuleuprohisleutyrthrleuphehisgln

675680685

alahisvalalaglygluthrvalalaargproleupheleugluphe

690695700

prolysaspserserthrtrpthrvalasphisglnleuleutrpgly

705710715720

glualaleuleuilethrprovalleuglnalaglylysalagluval

725730735

thrglytyrpheproleuglythrtrptyraspleuglnthrvalpro

740745750

valglualaleuglyserleuproproproproalaalaproargglu

755760765

proalailehissergluglyglntrpvalthrleuproalaproleu

770775780

aspthrileasnvalhisleuargalaglytyrileileproleugln

785790795800

glyproglyleuthrthrthrgluserargglnglnprometalaleu

805810815

alavalalaleuthrlysglyglyglualaargglygluleuphetrp

820825830

aspaspglygluserleugluvalleugluargglyalatyrthrgln

835840845

valilepheleualaargasnasnthrilevalasngluleuvalarg

850855860

valthrsergluglyalaglyleuglnleuglnlysvalthrvalleu

865870875880

glyvalalathralaproglnglnvalleuserasnglyvalproval

885890895

serasnphethrtyrserproaspthrlysvalleuaspilecysval

900905910

serleuleumetglygluglnpheleuvalsertrpcys

915920925

<210>6

<211>441

<212>dna

<213>人工序列

<220>

<223>hbb2内含子

<400>6

gtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttctt60

cttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttca120

gggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgata180

atttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgt240

aactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgctt300

ttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaa360

tcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgc420

tggcccatcactttggcaaag441

<210>7

<211>441

<212>dna

<213>修饰的hbb2内含子

<400>7

gtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttctt60

cttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttca120

gggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgata180

atttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgt240

aactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgctt300

ttattttctggttgggataaggctggattattctgagtccaagctaggcccttttgctaa360

tcttgttcatacctcttatcttcctcccacagctcctgggcaacctgctggtctctctgc420

tggcccatcactttggcaaag441

<210>8

<211>1438

<212>dna

<213>人工序列

<220>

<223>fix内含子

<400>8

ggtttgtttccttttttaaaatacattgagtatgcttgccttttagatatagaaatatct60

gatgctgtcttcttcactaaattttgattacatgatttgacagcaatattgaagagtcta120

acagccagcacgcaggttggtaagtactggttctttgttagctaggttttcttcttcttc180

atttttaaaactaaatagatcgacaatgcttatgatgcatttatgtttaataaacactgt240

tcagttcatgatttggtcatgtaattcctgttagaaaacattcatctccttggtttaaaa300

aaattaaaagtgggaaaacaaagaaatagcagaatatagtgaaaaaaaataaccacatta360

tttttgtttggacttaccactttgaaatcaaaatgggaaacaaaagcacaaacaatggcc420

ttatttacacaaaaagtctgattttaagatatatgacatttcaaggtttcagaagtatgt480

aatgaggtgtgtctctaattttttaaattatatatcttcaatttaaagttttagttaaaa540

cataaagattaacctttcattagcaagctgttagttatcaccaacgcttttcatggatta600

ggaaaaaatcattttgtctctatgtcaaacatcttggagttgatatttggggaaacacaa660

tactcagttgagttccctaggggagaaaagcacgcttaagaattgacataaagagtagga720

agttagctaatgcaacatatatcactttgttttttcacaactacagtgactttatgtatt780

tcccagaggaaggcatacagggaagaaattatcccatttggacaaacagcatgttctcac840

aggaagcatttatcacacttacttgtcaactttctagaatcaaatctagtagctgacagt900

accaggatcaggggtgccaaccctaagcacccccagaaagctgactggccctgtggttcc960

cactccagacatgatgtcagctgtgaaatcgacgtcgctggaccataattaggcttctgt1020

tcttcaggagacatttgttcaaagtcatttgggcaaccatattctgaaaacagcccagcc1080

agggtgatggatcactttgcaaagatcctcaatgagctattttcaagtgatgacaaagtg1140

tgaagttaaccgctcatttgagaactttctttttcatccaaagtaaattcaaatatgatt1200

agaaatctgaccttttattactggaattctcttgactaaaagtaaaattgaattttaatt1260

cctaaatctccatgtgtatacagtactgtgggaacatcacagattttggctccatgccct1320

aaagagaaattggctttcagattatttggattaaaaacaaagactttcttaagagatgta1380

aaattttcatgatgttttcttttttgctaaaactaaagaattattcttttacatttca1438

<210>9

<211>1438

<212>dna

<213>人工序列

<220>

<223>修饰的fix内含子

<400>9

ggtttgtttccttttttaaaatacattgagtatgcttgccttttagatatagaaatatct60

gatgctgtcttcttcactaaattttgattacatgatttgacagcaatattgaagagtcta120

acagccagcacgcaggttggtaagtactggttctttgttagctaggttttcttcttcttc180

atttttaaaactaaatagatcgacattgcttttgttgcatttatgtttaataaacactgt240

tcagttcatgatttggtcatgtaattcctgttagaaaacattcatctccttggtttaaaa300

aaattaaaagtgggaaaacaaagaaatagcagaatatagtgaaaaaaaataaccacatta360

tttttgtttggacttaccactttgaaatcaaattgggaaacaaaagcacaaacaatggcc420

ttatttacacaaaaagtctgattttaagatatatgacatttcaaggtttcagaagtatgt480

aatgaggtgtgtctctaattttttaaattatatatcttcaatttaaagttttagttaaaa540

cataaagattaacctttcattagcaagctgttagttatcaccaacgcttttcatggatta600

ggaaaaaatcattttgtctctttgtcaaacatcttggagttgatatttggggaaacacaa660

tactcagttgagttccctaggggagaaaagcacgcttaagaattgacataaagagtagga720

agttagctattgcaacatatatcactttgttttttcacaactacagtgactttttgtatt780

tcccagaggaaggcatacagggaagaaattatcccatttggacaaacagcttgttctcac840

aggaagcatttatcacacttacttgtcaactttctagaatcaaatctagtagctgacagt900

accaggatcaggggtgccaaccctaagcacccccagaaagctgactggccctgtggttcc960

cactccagacatgatgtcagctgtgaaatcgacgtcgctggaccataattaggcttctgt1020

tcttcaggagacatttgttcaaagtcatttgggcaaccatattctgaaaacagcccagcc1080

agggtgttggatcactttgcaaagatcctcattgagctattttcaagtgttgacaaagtg1140

tgaagttaaccgctcatttgagaactttctttttcatccaaagtaaattcaaatatgatt1200

agaaatctgaccttttattactggaattctcttgactaaaagtaaaattgaattttaatt1260

cctaaatctccatgtgtatacagtactgtgggaacatcacagattttggctccatgccct1320

aaagagaaattggctttcagattatttggattaaaaacaaagactttcttaagagatgta1380

aaattttcttgttgttttcttttttgctaaaactaaagaattattcttttacatttca1438

<210>10

<211>881

<212>dna

<213>人工序列

<220>

<223>鸡β-球蛋白内含子

<400>10

gcgggagtcgctgcgttgccttcgccccgtgccccgctccgccgccgcctcgcgccgccc60

gccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcc120

tccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgtggctgcgtga180

aagccttgaggggctccgggagggccctttgtgcggggggagcggctcggggggtgcgtg240

cgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcggctgtgagcg300

ctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgaggggagcgcggccgg360

gggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcgtgcggggtgt420

gtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaaccccccctgca480

cccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtacggggcg540

tggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgggcggggc600

ggggccgcctcgggccggggagggctcgggggaggggcgcggcggcccccggagcgccgg660

cggctgtcgaggcgcggcgagccgcagccattgccttttatggtaatcgtgcgagagggc720

gcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggcgccgccgcac780

cccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaaatgggcgggga840

gggccttcgtgcgtcgccgcgccgccgtccccttctccctc881

<210>11

<211>881

<212>dna

<213>人工序列

<220>

<223>修饰的鸡β-球蛋白内含子

<400>11

gcgggagtcgctgcgttgccttcgccccgtgccccgctccgccgccgcctcgcgccgccc60

gccccggctctgactgaccgcgttactcccacaggtgagcgggcgggacggcccttctcc120

tccgggctgtaattagcgcttggtttaatgacggcttgtttcttttctgtggctgcgtga180

aagccttgaggggctccgggagggccctttgtgcggggggagcggctcggggggtgcgtg240

cgtgtgtgtgtgcgtggggagcgccgcgtgcggctccgcgctgcccggcggctgtgagcg300

ctgcgggcgcggcgcggggctttgtgcgctccgcagtgtgcgcgaggggagcgcggccgg360

gggcggtgccccgcggtgcggggggggctgcgaggggaacaaaggctgcgtgcggggtgt420

gtgcgtgggggggtgagcagggggtgtgggcgcgtcggtcgggctgcaaccccccctgca480

cccccctccccgagttgctgagcacggcccggcttcgggtgcggggctccgtacggggcg540

tggcgcggggctcgccgtgccgggcggggggtggcggcaggtgggggtgccgggcggggc600

ggggccgcctcgggccggggagggctcgggggaggggcgcggcggcccccggagcgccgg660

cggctgtcgaggcgcggcgagccgcagccattgccttttttggtaatcgtgcgagagggc720

gcagggacttcctttgtcccaaatctgtgcggagccgaaatctgggaggcgccgccgcac780

cccctctagcgggcgcggggcgaagcggtgcggcgccggcaggaaggaattgggcgggga840

gggccttcgtgcgtcgccgcgccgccgtccccttctccctc881

<210>12

<211>952

<212>prt

<213>智人

<400>12

metglyvalarghisproprocysserhisargleuleualavalcys

151015

alaleuvalserleualathralaalaleuleuglyhisileleuleu

202530

hisasppheleuleuvalproarggluleuserglyserserproval

354045

leuglugluthrhisproalahisglnglnglyalaserargprogly

505560

proargaspalaglnalahisproglyargproargalavalprothr

65707580

glncysaspvalproproasnserargpheaspcysalaproasplys

859095

alailethrglngluglncysglualaargglycyscystyrilepro

100105110

alalysglnglyleuglnglyalaglnmetglyglnprotrpcysphe

115120125

pheproprosertyrprosertyrlysleugluasnleuserserser

130135140

glumetglytyrthralathrleuthrargthrthrprothrphephe

145150155160

prolysaspileleuthrleuargleuaspvalmetmetgluthrglu

165170175

asnargleuhisphethrilelysaspproalaasnargargtyrglu

180185190

valproleugluthrprohisvalhisserargalaproserproleu

195200205

tyrservalgluphesergluglupropheglyvalilevalargarg

210215220

glnleuaspglyargvalleuleuasnthrthrvalalaproleuphe

225230235240

phealaaspglnpheleuglnleuserthrserleuproserglntyr

245250255

ilethrglyleualagluhisleuserproleumetleuserthrser

260265270

trpthrargilethrleutrpasnargaspleualaprothrprogly

275280285

alaasnleutyrglyserhisprophetyrleualaleugluaspgly

290295300

glyseralahisglyvalpheleuleuasnserasnalametaspval

305310315320

valleuglnproserproalaleusertrpargserthrglyglyile

325330335

leuaspvaltyrilepheleuglyprogluprolysservalvalgln

340345350

glntyrleuaspvalvalglytyrprophemetproprotyrtrpgly

355360365

leuglyphehisleucysargtrpglytyrserserthralailethr

370375380

argglnvalvalgluasnmetthrargalahispheproleuaspval

385390395400

glntrpasnaspleuasptyrmetaspserargargaspphethrphe

405410415

asnlysaspglypheargasppheproalametvalglngluleuhis

420425430

glnglyglyargargtyrmetmetilevalaspproalaileserser

435440445

serglyproalaglysertyrargprotyraspgluglyleuargarg

450455460

glyvalpheilethrasngluthrglyglnproleuileglylysval

465470475480

trpproglyserthralapheproaspphethrasnprothralaleu

485490495

alatrptrpgluaspmetvalalagluphehisaspglnvalprophe

500505510

aspglymettrpileaspmetasngluproserasnpheilearggly

515520525

sergluaspglycysproasnasngluleugluasnproprotyrval

530535540

proglyvalvalglyglythrleuglnalaalathrilecysalaser

545550555560

serhisglnpheleuserthrhistyrasnleuhisasnleutyrgly

565570575

leuthrglualailealaserhisargalaleuvallysalaarggly

580585590

thrargprophevalileserargserthrphealaglyhisglyarg

595600605

tyralaglyhistrpthrglyaspvaltrpsersertrpgluglnleu

610615620

alaserservalprogluileleuglnpheasnleuleuglyvalpro

625630635640

leuvalglyalaaspvalcysglypheleuglyasnthrsergluglu

645650655

leucysvalargtrpthrglnleuglyalaphetyrprophemetarg

660665670

asnhisasnserleuleuserleuproglngluprotyrserpheser

675680685

gluproalaglnglnalametarglysalaleuthrleuargtyrala

690695700

leuleuprohisleutyrthrleuphehisglnalahisvalalagly

705710715720

gluthrvalalaargproleupheleuglupheprolysaspserser

725730735

thrtrpthrvalasphisglnleuleutrpglyglualaleuleuile

740745750

thrprovalleuglnalaglylysalagluvalthrglytyrphepro

755760765

leuglythrtrptyraspleuglnthrvalprovalglualaleugly

770775780

serleuproproproproalaalaproarggluproalailehisser

785790795800

gluglyglntrpvalthrleuproalaproleuaspthrileasnval

805810815

hisleuargalaglytyrileileproleuglnglyproglyleuthr

820825830

thrthrgluserargglnglnprometalaleualavalalaleuthr

835840845

lysglyglyglualaargglygluleuphetrpaspaspglygluser

850855860

leugluvalleugluargglyalatyrthrglnvalilepheleuala

865870875880

argasnasnthrilevalasngluleuvalargvalthrserglugly

885890895

alaglyleuglnleuglnlysvalthrvalleuglyvalalathrala

900905910

proglnglnvalleuserasnglyvalprovalserasnphethrtyr

915920925

serproaspthrlysvalleuaspilecysvalserleuleumetgly

930935940

gluglnpheleuvalsertrpcys

945950

<210>13

<211>2778

<212>dna

<213>人工序列

<220>

<223>hgaaco1w/osp

<400>13

ggccatatcctgctgcacgactttctactagtgcccagagagctgagcggcagctctccc60

gtgctggaagaaacacaccctgcccatcagcagggcgcctctagacctggacctagagat120

gcccaggcccaccccggcagacctagagctgtgcctacccagtgtgacgtgccccccaac180

agcagattcgactgcgcccctgacaaggccatcacccaggaacagtgcgaggccagaggc240

tgctgctacatccctgccaagcagggactgcagggcgctcagatgggacagccctggtgc300

ttcttcccaccctcctaccccagctacaagctggaaaacctgagcagcagcgagatgggc360

tacaccgccaccctgaccagaaccacccccacattcttcccaaaggacatcctgaccctg420

cggctggacgtgatgatggaaaccgagaaccggctgcacttcaccatcaaggaccccgcc480

aatcggagatacgaggtgcccctggaaaccccccacgtgcactctagagcccccagccct540

ctgtacagcgtggaattcagcgaggaacccttcggcgtgatcgtgcggagacagctggat600

ggcagagtgctgctgaacaccaccgtggcccctctgttcttcgccgaccagttcctgcag660

ctgagcaccagcctgcccagccagtacatcacaggactggccgagcacctgagccccctg720

atgctgagcacatcctggacccggatcaccctgtggaacagggatctggcccctacccct780

ggcgccaatctgtacggcagccaccctttctacctggccctggaagatggcggatctgcc840

cacggagtgtttctgctgaactccaacgccatggacgtggtgctgcagcctagccctgcc900

ctgtcttggagaagcacaggcggcatcctggatgtgtacatctttctgggccccgagccc960

aagagcgtggtgcagcagtatctggatgtcgtgggctaccccttcatgcccccttactgg1020

ggcctgggattccacctgtgcagatggggctactccagcaccgccatcaccagacaggtg1080

gtggaaaacatgaccagagcccacttcccactggatgtgcagtggaacgacctggactac1140

atggacagcagacgggacttcaccttcaacaaggacggcttccgggacttccccgccatg1200

gtgcaggaactgcatcagggcggcagacggtacatgatgatcgtggatcccgccatcagc1260

tcctctggccctgccggctcttacagaccctacgacgagggcctgcggagaggcgtgttc1320

atcaccaacgagacaggccagcccctgatcggcaaagtgtggcctggcagcacagccttc1380

cccgacttcaccaatcctaccgccctggcttggtgggaggacatggtggccgagttccac1440

gaccaggtgcccttcgacggcatgtggatcgacatgaacgagcccagcaacttcatccgg1500

ggcagcgaggatggctgccccaacaacgaactggaaaatcccccttacgtgcccggcgtc1560

gtgggcggaacactgcaggccgctacaatctgtgccagcagccaccagtttctgagcacc1620

cactacaacctgcacaacctgtacggcctgaccgaggccattgccagccaccgcgctctc1680

gtgaaagccagaggcacacggcccttcgtgatcagcagaagcacctttgccggccacggc1740

agatacgccggacattggactggcgacgtgtggtcctcttgggagcagctggcctctagc1800

gtgcccgagatcctgcagttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgt1860

ggcttcctgggcaacacctccgaggaactgtgtgtgcggtggacacagctgggcgccttc1920

taccctttcatgagaaaccacaacagcctgctgagcctgccccaggaaccctacagcttt1980

agcgagcctgcacagcaggccatgcggaaggccctgacactgagatacgctctgctgccc2040

cacctgtacaccctgtttcaccaggcccatgtggccggcgagacagtggccagacctctg2100

tttctggaattccccaaggacagcagcacctggaccgtggaccatcagctgctgtgggga2160

gaggctctgctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggctacttt2220

cccctgggcacttggtacgacctgcagaccgtgcctgtggaagccctgggatctctgcct2280

ccacctcctgccgctcctagagagcctgccattcactctgagggccagtgggtcacactg2340

cctgcccccctggataccatcaacgtgcacctgagggccggctacatcataccactgcag2400

ggacctggcctgaccaccaccgagtctagacagcagccaatggccctggccgtggccctg2460

accaaaggcggagaagctaggggcgagctgttctgggacgatggcgagagcctggaagtg2520

ctggaaagaggcgcctatacccaagtgatcttcctggcccggaacaacaccatcgtgaac2580

gagctggtgcgcgtgacctctgaaggcgctggactgcagctgcagaaagtgaccgtgctg2640

ggagtggccacagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaacttcacc2700

tacagccccgacaccaaggtgctggacatctgcgtgtcactgctgatgggagagcagttt2760

ctggtgtcctggtgctga2778

<210>14

<211>2778

<212>dna

<213>人工序列

<220>

<223>hgaaco2w/osp

<400>14

ggacacatcctgctgcacgacttcctgttggtgcctagagagctgagcggatcatcccca60

gtgctggaggagactcatcctgctcaccaacagggagcttccagaccaggaccgagagac120

gcccaagcccatcctggtagaccaagagctgtgcctacccaatgcgacgtgccacccaac180

tcccgattcgactgcgcgccagataaggctattacccaagagcagtgtgaagccagaggt240

tgctgctacatcccagcgaagcaaggattgcaaggcgcccaaatgggacaaccttggtgt300

ttcttccccccttcgtacccatcatataaactcgaaaacctgtcctcttcggaaatgggt360

tatactgccaccctcaccagaactactcctactttcttcccgaaagacatcttgaccttg420

aggctggacgtgatgatggagactgaaaaccggctgcatttcactatcaaagatcctgcc480

aatcggcgatacgaggtccctctggaaacccctcacgtgcactcacgggctccttctccg540

ctttactccgtcgaattctctgaggaacccttcggagtgatcgttagacgccagctggat600

ggtagagtgctgttgaacactactgtggccccacttttcttcgctgaccagtttctgcaa660

ctgtccacttccctgccatcccagtacattactggactcgccgaacacctgtcgccactg720

atgctctcgacctcttggactagaatcactttgtggaacagagacttggcccctactccg780

ggagcaaatctgtacggaagccaccctttttacctggcgctcgaagatggcggatccgct840

cacggagtgttcctgctgaatagcaacgcaatggacgtggtgctgcaaccttcccctgca900

ctcagttggagaagtaccgggggtattctggacgtgtacatcttcctcggaccagaaccc960

aagagcgtggtgcagcaatatctggacgtggtcggatacccttttatgcctccttactgg1020

ggactgggattccacctttgccgttggggctactcatccaccgccattaccagacaggtg1080

gtggagaatatgaccagagcccacttccctctcgacgtgcagtggaacgatctggactat1140

atggactcccggagagatttcaccttcaacaaggacgggttccgcgattttcccgcgatg1200

gttcaagagctccaccagggtggtcgaagatatatgatgatcgtcgacccagccatttcg1260

agcagcggacccgctggatcttatagaccttacgacgaaggccttaggagaggagtgttc1320

atcacaaacgagactggacagcctttgatcggtaaagtgtggcctggatcaaccgccttt1380

cctgactttaccaatcccactgccttggcttggtgggaggacatggtggccgaattccac1440

gaccaagtcccctttgatggaatgtggatcgatatgaacgaaccaagcaattttatcaga1500

ggttccgaagacggttgccccaacaacgaactggaaaaccctccttatgtgcccggagtc1560

gtgggcggaacattacaggccgcgactatttgcgccagcagccaccaattcctgtccact1620

cactacaacctccacaacctttatggattaaccgaagctattgcaagtcacagggctctg1680

gtgaaggctagagggactaggccctttgtgatctcccgatccacctttgccggacacggg1740

agatacgccggtcactggactggtgacgtgtggagctcatgggaacaactggcctcctcc1800

gtgccggaaatcttacagttcaaccttctgggtgtccctcttgtcggagcagacgtgtgt1860

gggtttcttggtaacacctccgaggaactgtgtgtgcgctggactcaactgggtgcattc1920

tacccattcatgagaaaccacaactccttgctgtccctgccacaagagccctactcgttc1980

agcgagcctgcacaacaggctatgcggaaggcactgaccctgagatacgccctgcttcca2040

cacttatacactctcttccatcaagcgcatgtggcaggagaaaccgttgcaaggcctctt2100

ttccttgaattccccaaggattcctcgacttggacggtggatcatcagctgctgtgggga2160

gaagctctgctgattactccagtgttgcaagccggaaaagctgaggtgaccggatacttt2220

ccgctgggaacctggtacgacctccagactgtccctgttgaagcccttggatcactgcct2280

ccgcctccggcagctccacgcgaaccagctatacattccgagggacagtgggttacatta2340

ccagctcctctggacacaatcaacgtccacttaagagctggctacattatccctctgcaa2400

ggaccaggactgactacgaccgagagcagacagcagccaatggcactggctgtggctctg2460

accaagggaggggaagctagaggagaactcttctgggatgatggggagtcccttgaagtg2520

ctggaaagaggcgcttacactcaagtcattttccttgcacggaacaacaccattgtgaac2580

gaattggtgcgagtgaccagcgaaggagctggacttcaactgcagaaggtcactgtgctc2640

ggagtggctaccgctcctcagcaagtgctgtcgaatggagtccccgtgtcaaactttacc2700

tactcccctgacactaaggtgctcgacatttgcgtgtccctcctgatgggagagcagttc2760

cttgtgtcctggtgttga2778

<210>15

<211>397

<212>dna

<213>人工序列

<220>

<223>haat启动子

<400>15

gatcttgctaccagtggaacagccactaaggattctgcagtgagagcagagggccagcta60

agtggtactctcccagagactgtctgactcacgccaccccctccaccttggacacaggac120

gctgtggtttctgagccaggtacaatgactcctttcggtaagtgcagtggaagctgtaca180

ctgcccaggcaaagcgtccgggcagcgtaggcgggcgactcagatcccagccagtggact240

tagcccctgtttgctcctccgataactggggtgaccttggttaatattcaccagcagcct300

cccccgttgcccctctggatccactgcttaaatacggacgaggacagggccctgtctcct360

cagcttcaggcaccaccactgacctgggacagtgaat397

<210>16

<211>321

<212>dna

<213>人工序列

<220>

<223>apoe控制区

<400>16

aggctcagaggcacacaggagtttctgggctcaccctgcccccttccaacccctcagttc60

ccatcctccagcagctgtttgtgtgctgcctctgaagtccacactgaacaaacttcagcc120

tactcatgtccctaaaatgggcaaacattgcaagcagcaaacagcaaacacacagccctc180

cctgcctgctgaccttggagctggggcagaggtcagagacctctctgggcccatgccacc240

tccaacatccactcgaccccttggaatttcggtggagaggagcagaggttgtcctggcgt300

ggtttaggtagtgtgagaggg321

<210>17

<211>2808

<212>dna

<213>人工序列

<220>

<223>sp7+hgaaco1-δ-8

<400>17

atggcctttctgtggctgctgagctgttgggccctgctgggcaccaccttcggcctacta60

gtgcccagagagctgagcggcagctctcccgtgctggaagaaacacaccctgcccatcag120

cagggcgcctctagacctggacctagagatgcccaggcccaccccggcagacctagagct180

gtgcctacccagtgtgacgtgccccccaacagcagattcgactgcgcccctgacaaggcc240

atcacccaggaacagtgcgaggccagaggctgctgctacatccctgccaagcagggactg300

cagggcgctcagatgggacagccctggtgcttcttcccaccctcctaccccagctacaag360

ctggaaaacctgagcagcagcgagatgggctacaccgccaccctgaccagaaccaccccc420

acattcttcccaaaggacatcctgaccctgcggctggacgtgatgatggaaaccgagaac480

cggctgcacttcaccatcaaggaccccgccaatcggagatacgaggtgcccctggaaacc540

ccccacgtgcactctagagcccccagccctctgtacagcgtggaattcagcgaggaaccc600

ttcggcgtgatcgtgcggagacagctggatggcagagtgctgctgaacaccaccgtggcc660

cctctgttcttcgccgaccagttcctgcagctgagcaccagcctgcccagccagtacatc720

acaggactggccgagcacctgagccccctgatgctgagcacatcctggacccggatcacc780

ctgtggaacagggatctggcccctacccctggcgccaatctgtacggcagccaccctttc840

tacctggccctggaagatggcggatctgcccacggagtgtttctgctgaactccaacgcc900

atggacgtggtgctgcagcctagccctgccctgtcttggagaagcacaggcggcatcctg960

gatgtgtacatctttctgggccccgagcccaagagcgtggtgcagcagtatctggatgtc1020

gtgggctaccccttcatgcccccttactggggcctgggattccacctgtgcagatggggc1080

tactccagcaccgccatcaccagacaggtggtggaaaacatgaccagagcccacttccca1140

ctggatgtgcagtggaacgacctggactacatggacagcagacgggacttcaccttcaac1200

aaggacggcttccgggacttccccgccatggtgcaggaactgcatcagggcggcagacgg1260

tacatgatgatcgtggatcccgccatcagctcctctggccctgccggctcttacagaccc1320

tacgacgagggcctgcggagaggcgtgttcatcaccaacgagacaggccagcccctgatc1380

ggcaaagtgtggcctggcagcacagccttccccgacttcaccaatcctaccgccctggct1440

tggtgggaggacatggtggccgagttccacgaccaggtgcccttcgacggcatgtggatc1500

gacatgaacgagcccagcaacttcatccggggcagcgaggatggctgccccaacaacgaa1560

ctggaaaatcccccttacgtgcccggcgtcgtgggcggaacactgcaggccgctacaatc1620

tgtgccagcagccaccagtttctgagcacccactacaacctgcacaacctgtacggcctg1680

accgaggccattgccagccaccgcgctctcgtgaaagccagaggcacacggcccttcgtg1740

atcagcagaagcacctttgccggccacggcagatacgccggacattggactggcgacgtg1800

tggtcctcttgggagcagctggcctctagcgtgcccgagatcctgcagttcaatctgctg1860

ggcgtgccactcgtgggcgccgatgtgtgtggcttcctgggcaacacctccgaggaactg1920

tgtgtgcggtggacacagctgggcgccttctaccctttcatgagaaaccacaacagcctg1980

ctgagcctgccccaggaaccctacagctttagcgagcctgcacagcaggccatgcggaag2040

gccctgacactgagatacgctctgctgccccacctgtacaccctgtttcaccaggcccat2100

gtggccggcgagacagtggccagacctctgtttctggaattccccaaggacagcagcacc2160

tggaccgtggaccatcagctgctgtggggagaggctctgctgattaccccagtgctgcag2220

gcaggcaaggccgaagtgaccggctactttcccctgggcacttggtacgacctgcagacc2280

gtgcctgtggaagccctgggatctctgcctccacctcctgccgctcctagagagcctgcc2340

attcactctgagggccagtgggtcacactgcctgcccccctggataccatcaacgtgcac2400

ctgagggccggctacatcataccactgcagggacctggcctgaccaccaccgagtctaga2460

cagcagccaatggccctggccgtggccctgaccaaaggcggagaagctaggggcgagctg2520

ttctgggacgatggcgagagcctggaagtgctggaaagaggcgcctatacccaagtgatc2580

ttcctggcccggaacaacaccatcgtgaacgagctggtgcgcgtgacctctgaaggcgct2640

ggactgcagctgcagaaagtgaccgtgctgggagtggccacagcccctcagcaggtgctg2700

tctaatggcgtgcccgtgtccaacttcacctacagccccgacaccaaggtgctggacatc2760

tgcgtgtcactgctgatgggagagcagtttctggtgtcctggtgctga2808

<210>18

<211>2829

<212>dna

<213>人工序列

<220>

<223>sp6+hgaaco1-δ-8

<400>18

atgcctccacctagaacaggcagaggcctgctgtggctgggcctggtgctgtctagtgtg60

tgtgtggccctgggcctactagtgcccagagagctgagcggcagctctcccgtgctggaa120

gaaacacaccctgcccatcagcagggcgcctctagacctggacctagagatgcccaggcc180

caccccggcagacctagagctgtgcctacccagtgtgacgtgccccccaacagcagattc240

gactgcgcccctgacaaggccatcacccaggaacagtgcgaggccagaggctgctgctac300

atccctgccaagcagggactgcagggcgctcagatgggacagccctggtgcttcttccca360

ccctcctaccccagctacaagctggaaaacctgagcagcagcgagatgggctacaccgcc420

accctgaccagaaccacccccacattcttcccaaaggacatcctgaccctgcggctggac480

gtgatgatggaaaccgagaaccggctgcacttcaccatcaaggaccccgccaatcggaga540

tacgaggtgcccctggaaaccccccacgtgcactctagagcccccagccctctgtacagc600

gtggaattcagcgaggaacccttcggcgtgatcgtgcggagacagctggatggcagagtg660

ctgctgaacaccaccgtggcccctctgttcttcgccgaccagttcctgcagctgagcacc720

agcctgcccagccagtacatcacaggactggccgagcacctgagccccctgatgctgagc780

acatcctggacccggatcaccctgtggaacagggatctggcccctacccctggcgccaat840

ctgtacggcagccaccctttctacctggccctggaagatggcggatctgcccacggagtg900

tttctgctgaactccaacgccatggacgtggtgctgcagcctagccctgccctgtcttgg960

agaagcacaggcggcatcctggatgtgtacatctttctgggccccgagcccaagagcgtg1020

gtgcagcagtatctggatgtcgtgggctaccccttcatgcccccttactggggcctggga1080

ttccacctgtgcagatggggctactccagcaccgccatcaccagacaggtggtggaaaac1140

atgaccagagcccacttcccactggatgtgcagtggaacgacctggactacatggacagc1200

agacgggacttcaccttcaacaaggacggcttccgggacttccccgccatggtgcaggaa1260

ctgcatcagggcggcagacggtacatgatgatcgtggatcccgccatcagctcctctggc1320

cctgccggctcttacagaccctacgacgagggcctgcggagaggcgtgttcatcaccaac1380

gagacaggccagcccctgatcggcaaagtgtggcctggcagcacagccttccccgacttc1440

accaatcctaccgccctggcttggtgggaggacatggtggccgagttccacgaccaggtg1500

cccttcgacggcatgtggatcgacatgaacgagcccagcaacttcatccggggcagcgag1560

gatggctgccccaacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggcgga1620

acactgcaggccgctacaatctgtgccagcagccaccagtttctgagcacccactacaac1680

ctgcacaacctgtacggcctgaccgaggccattgccagccaccgcgctctcgtgaaagcc1740

agaggcacacggcccttcgtgatcagcagaagcacctttgccggccacggcagatacgcc1800

ggacattggactggcgacgtgtggtcctcttgggagcagctggcctctagcgtgcccgag1860

atcctgcagttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctg1920

ggcaacacctccgaggaactgtgtgtgcggtggacacagctgggcgccttctaccctttc1980

atgagaaaccacaacagcctgctgagcctgccccaggaaccctacagctttagcgagcct2040

gcacagcaggccatgcggaaggccctgacactgagatacgctctgctgccccacctgtac2100

accctgtttcaccaggcccatgtggccggcgagacagtggccagacctctgtttctggaa2160

ttccccaaggacagcagcacctggaccgtggaccatcagctgctgtggggagaggctctg2220

ctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggctactttcccctgggc2280

acttggtacgacctgcagaccgtgcctgtggaagccctgggatctctgcctccacctcct2340

gccgctcctagagagcctgccattcactctgagggccagtgggtcacactgcctgccccc2400

ctggataccatcaacgtgcacctgagggccggctacatcataccactgcagggacctggc2460

ctgaccaccaccgagtctagacagcagccaatggccctggccgtggccctgaccaaaggc2520

ggagaagctaggggcgagctgttctgggacgatggcgagagcctggaagtgctggaaaga2580

ggcgcctatacccaagtgatcttcctggcccggaacaacaccatcgtgaacgagctggtg2640

cgcgtgacctctgaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtggcc2700

acagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaacttcacctacagcccc2760

gacaccaaggtgctggacatctgcgtgtcactgctgatgggagagcagtttctggtgtcc2820

tggtgctga2829

<210>19

<211>2820

<212>dna

<213>人工序列

<220>

<223>sp8+hgaaco1-δ-8

<400>19

atggccagcagactgaccctgctgacactccttctgctgctgctggccggcgatagagcc60

agcagcctactagtgcccagagagctgagcggcagctctcccgtgctggaagaaacacac120

cctgcccatcagcagggcgcctctagacctggacctagagatgcccaggcccaccccggc180

agacctagagctgtgcctacccagtgtgacgtgccccccaacagcagattcgactgcgcc240

cctgacaaggccatcacccaggaacagtgcgaggccagaggctgctgctacatccctgcc300

aagcagggactgcagggcgctcagatgggacagccctggtgcttcttcccaccctcctac360

cccagctacaagctggaaaacctgagcagcagcgagatgggctacaccgccaccctgacc420

agaaccacccccacattcttcccaaaggacatcctgaccctgcggctggacgtgatgatg480

gaaaccgagaaccggctgcacttcaccatcaaggaccccgccaatcggagatacgaggtg540

cccctggaaaccccccacgtgcactctagagcccccagccctctgtacagcgtggaattc600

agcgaggaacccttcggcgtgatcgtgcggagacagctggatggcagagtgctgctgaac660

accaccgtggcccctctgttcttcgccgaccagttcctgcagctgagcaccagcctgccc720

agccagtacatcacaggactggccgagcacctgagccccctgatgctgagcacatcctgg780

acccggatcaccctgtggaacagggatctggcccctacccctggcgccaatctgtacggc840

agccaccctttctacctggccctggaagatggcggatctgcccacggagtgtttctgctg900

aactccaacgccatggacgtggtgctgcagcctagccctgccctgtcttggagaagcaca960

ggcggcatcctggatgtgtacatctttctgggccccgagcccaagagcgtggtgcagcag1020

tatctggatgtcgtgggctaccccttcatgcccccttactggggcctgggattccacctg1080

tgcagatggggctactccagcaccgccatcaccagacaggtggtggaaaacatgaccaga1140

gcccacttcccactggatgtgcagtggaacgacctggactacatggacagcagacgggac1200

ttcaccttcaacaaggacggcttccgggacttccccgccatggtgcaggaactgcatcag1260

ggcggcagacggtacatgatgatcgtggatcccgccatcagctcctctggccctgccggc1320

tcttacagaccctacgacgagggcctgcggagaggcgtgttcatcaccaacgagacaggc1380

cagcccctgatcggcaaagtgtggcctggcagcacagccttccccgacttcaccaatcct1440

accgccctggcttggtgggaggacatggtggccgagttccacgaccaggtgcccttcgac1500

ggcatgtggatcgacatgaacgagcccagcaacttcatccggggcagcgaggatggctgc1560

cccaacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggcggaacactgcag1620

gccgctacaatctgtgccagcagccaccagtttctgagcacccactacaacctgcacaac1680

ctgtacggcctgaccgaggccattgccagccaccgcgctctcgtgaaagccagaggcaca1740

cggcccttcgtgatcagcagaagcacctttgccggccacggcagatacgccggacattgg1800

actggcgacgtgtggtcctcttgggagcagctggcctctagcgtgcccgagatcctgcag1860

ttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctgggcaacacc1920

tccgaggaactgtgtgtgcggtggacacagctgggcgccttctaccctttcatgagaaac1980

cacaacagcctgctgagcctgccccaggaaccctacagctttagcgagcctgcacagcag2040

gccatgcggaaggccctgacactgagatacgctctgctgccccacctgtacaccctgttt2100

caccaggcccatgtggccggcgagacagtggccagacctctgtttctggaattccccaag2160

gacagcagcacctggaccgtggaccatcagctgctgtggggagaggctctgctgattacc2220

ccagtgctgcaggcaggcaaggccgaagtgaccggctactttcccctgggcacttggtac2280

gacctgcagaccgtgcctgtggaagccctgggatctctgcctccacctcctgccgctcct2340

agagagcctgccattcactctgagggccagtgggtcacactgcctgcccccctggatacc2400

atcaacgtgcacctgagggccggctacatcataccactgcagggacctggcctgaccacc2460

accgagtctagacagcagccaatggccctggccgtggccctgaccaaaggcggagaagct2520

aggggcgagctgttctgggacgatggcgagagcctggaagtgctggaaagaggcgcctat2580

acccaagtgatcttcctggcccggaacaacaccatcgtgaacgagctggtgcgcgtgacc2640

tctgaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtggccacagcccct2700

cagcaggtgctgtctaatggcgtgcccgtgtccaacttcacctacagccccgacaccaag2760

gtgctggacatctgcgtgtcactgctgatgggagagcagtttctggtgtcctggtgctga2820

<210>20

<211>4300

<212>dna

<213>人工序列

<220>

<223>构建物:sp7+hgaaco1-δ-8

<400>20

aggctcagaggcacacaggagtttctgggctcaccctgcccccttccaacccctcagttc60

ccatcctccagcagctgtttgtgtgctgcctctgaagtccacactgaacaaacttcagcc120

tactcatgtccctaaaatgggcaaacattgcaagcagcaaacagcaaacacacagccctc180

cctgcctgctgaccttggagctggggcagaggtcagagacctctctgggcccatgccacc240

tccaacatccactcgaccccttggaatttcggtggagaggagcagaggttgtcctggcgt300

ggtttaggtagtgtgagaggggtacccggggatcttgctaccagtggaacagccactaag360

gattctgcagtgagagcagagggccagctaagtggtactctcccagagactgtctgactc420

acgccaccccctccaccttggacacaggacgctgtggtttctgagccaggtacaatgact480

cctttcggtaagtgcagtggaagctgtacactgcccaggcaaagcgtccgggcagcgtag540

gcgggcgactcagatcccagccagtggacttagcccctgtttgctcctccgataactggg600

gtgaccttggttaatattcaccagcagcctcccccgttgcccctctggatccactgctta660

aatacggacgaggacagggccctgtctcctcagcttcaggcaccaccactgacctgggac720

agtgaatagatcctgagaacttcagggtgagtctatgggacccttgatgttttctttccc780

cttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatat840

tgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatat900

acttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataat960

gatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggt1020

taaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgta1080

agaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttctg1140

gttgggataaggctggattattctgagtccaagctaggcccttttgctaatcttgttcat1200

acctcttatcttcctcccacagctcctgggcaacctgctggtctctctgctggcccatca1260

ctttggcaaagcacgcgtgccaccatggcctttctgtggctgctgagctgttgggccctg1320

ctgggcaccaccttcggcctactagtgcccagagagctgagcggcagctctcccgtgctg1380

gaagaaacacaccctgcccatcagcagggcgcctctagacctggacctagagatgcccag1440

gcccaccccggcagacctagagctgtgcctacccagtgtgacgtgccccccaacagcaga1500

ttcgactgcgcccctgacaaggccatcacccaggaacagtgcgaggccagaggctgctgc1560

tacatccctgccaagcagggactgcagggcgctcagatgggacagccctggtgcttcttc1620

ccaccctcctaccccagctacaagctggaaaacctgagcagcagcgagatgggctacacc1680

gccaccctgaccagaaccacccccacattcttcccaaaggacatcctgaccctgcggctg1740

gacgtgatgatggaaaccgagaaccggctgcacttcaccatcaaggaccccgccaatcgg1800

agatacgaggtgcccctggaaaccccccacgtgcactctagagcccccagccctctgtac1860

agcgtggaattcagcgaggaacccttcggcgtgatcgtgcggagacagctggatggcaga1920

gtgctgctgaacaccaccgtggcccctctgttcttcgccgaccagttcctgcagctgagc1980

accagcctgcccagccagtacatcacaggactggccgagcacctgagccccctgatgctg2040

agcacatcctggacccggatcaccctgtggaacagggatctggcccctacccctggcgcc2100

aatctgtacggcagccaccctttctacctggccctggaagatggcggatctgcccacgga2160

gtgtttctgctgaactccaacgccatggacgtggtgctgcagcctagccctgccctgtct2220

tggagaagcacaggcggcatcctggatgtgtacatctttctgggccccgagcccaagagc2280

gtggtgcagcagtatctggatgtcgtgggctaccccttcatgcccccttactggggcctg2340

ggattccacctgtgcagatggggctactccagcaccgccatcaccagacaggtggtggaa2400

aacatgaccagagcccacttcccactggatgtgcagtggaacgacctggactacatggac2460

agcagacgggacttcaccttcaacaaggacggcttccgggacttccccgccatggtgcag2520

gaactgcatcagggcggcagacggtacatgatgatcgtggatcccgccatcagctcctct2580

ggccctgccggctcttacagaccctacgacgagggcctgcggagaggcgtgttcatcacc2640

aacgagacaggccagcccctgatcggcaaagtgtggcctggcagcacagccttccccgac2700

ttcaccaatcctaccgccctggcttggtgggaggacatggtggccgagttccacgaccag2760

gtgcccttcgacggcatgtggatcgacatgaacgagcccagcaacttcatccggggcagc2820

gaggatggctgccccaacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggc2880

ggaacactgcaggccgctacaatctgtgccagcagccaccagtttctgagcacccactac2940

aacctgcacaacctgtacggcctgaccgaggccattgccagccaccgcgctctcgtgaaa3000

gccagaggcacacggcccttcgtgatcagcagaagcacctttgccggccacggcagatac3060

gccggacattggactggcgacgtgtggtcctcttgggagcagctggcctctagcgtgccc3120

gagatcctgcagttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttc3180

ctgggcaacacctccgaggaactgtgtgtgcggtggacacagctgggcgccttctaccct3240

ttcatgagaaaccacaacagcctgctgagcctgccccaggaaccctacagctttagcgag3300

cctgcacagcaggccatgcggaaggccctgacactgagatacgctctgctgccccacctg3360

tacaccctgtttcaccaggcccatgtggccggcgagacagtggccagacctctgtttctg3420

gaattccccaaggacagcagcacctggaccgtggaccatcagctgctgtggggagaggct3480

ctgctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggctactttcccctg3540

ggcacttggtacgacctgcagaccgtgcctgtggaagccctgggatctctgcctccacct3600

cctgccgctcctagagagcctgccattcactctgagggccagtgggtcacactgcctgcc3660

cccctggataccatcaacgtgcacctgagggccggctacatcataccactgcagggacct3720

ggcctgaccaccaccgagtctagacagcagccaatggccctggccgtggccctgaccaaa3780

ggcggagaagctaggggcgagctgttctgggacgatggcgagagcctggaagtgctggaa3840

agaggcgcctatacccaagtgatcttcctggcccggaacaacaccatcgtgaacgagctg3900

gtgcgcgtgacctctgaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtg3960

gccacagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaacttcacctacagc4020

cccgacaccaaggtgctggacatctgcgtgtcactgctgatgggagagcagtttctggtg4080

tcctggtgctgactcgagagatctaccggtgaattcaccgcgggtttaaactgtgccttc4140

tagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgc4200

cactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtg4260

tcattctattctggggggtggggtgggggctagctctaga4300

<210>21

<211>4321

<212>dna

<213>人工序列

<220>

<223>构建物:sp6+hgaaco1-δ-8

<400>21

aggctcagaggcacacaggagtttctgggctcaccctgcccccttccaacccctcagttc60

ccatcctccagcagctgtttgtgtgctgcctctgaagtccacactgaacaaacttcagcc120

tactcatgtccctaaaatgggcaaacattgcaagcagcaaacagcaaacacacagccctc180

cctgcctgctgaccttggagctggggcagaggtcagagacctctctgggcccatgccacc240

tccaacatccactcgaccccttggaatttcggtggagaggagcagaggttgtcctggcgt300

ggtttaggtagtgtgagaggggtacccggggatcttgctaccagtggaacagccactaag360

gattctgcagtgagagcagagggccagctaagtggtactctcccagagactgtctgactc420

acgccaccccctccaccttggacacaggacgctgtggtttctgagccaggtacaatgact480

cctttcggtaagtgcagtggaagctgtacactgcccaggcaaagcgtccgggcagcgtag540

gcgggcgactcagatcccagccagtggacttagcccctgtttgctcctccgataactggg600

gtgaccttggttaatattcaccagcagcctcccccgttgcccctctggatccactgctta660

aatacggacgaggacagggccctgtctcctcagcttcaggcaccaccactgacctgggac720

agtgaatagatcctgagaacttcagggtgagtctatgggacccttgatgttttctttccc780

cttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatat840

tgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatat900

acttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataat960

gatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggt1020

taaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgta1080

agaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttctg1140

gttgggataaggctggattattctgagtccaagctaggcccttttgctaatcttgttcat1200

acctcttatcttcctcccacagctcctgggcaacctgctggtctctctgctggcccatca1260

ctttggcaaagcacgcgtgccaccatgcctccacctagaacaggcagaggcctgctgtgg1320

ctgggcctggtgctgtctagtgtgtgtgtggccctgggcctactagtgcccagagagctg1380

agcggcagctctcccgtgctggaagaaacacaccctgcccatcagcagggcgcctctaga1440

cctggacctagagatgcccaggcccaccccggcagacctagagctgtgcctacccagtgt1500

gacgtgccccccaacagcagattcgactgcgcccctgacaaggccatcacccaggaacag1560

tgcgaggccagaggctgctgctacatccctgccaagcagggactgcagggcgctcagatg1620

ggacagccctggtgcttcttcccaccctcctaccccagctacaagctggaaaacctgagc1680

agcagcgagatgggctacaccgccaccctgaccagaaccacccccacattcttcccaaag1740

gacatcctgaccctgcggctggacgtgatgatggaaaccgagaaccggctgcacttcacc1800

atcaaggaccccgccaatcggagatacgaggtgcccctggaaaccccccacgtgcactct1860

agagcccccagccctctgtacagcgtggaattcagcgaggaacccttcggcgtgatcgtg1920

cggagacagctggatggcagagtgctgctgaacaccaccgtggcccctctgttcttcgcc1980

gaccagttcctgcagctgagcaccagcctgcccagccagtacatcacaggactggccgag2040

cacctgagccccctgatgctgagcacatcctggacccggatcaccctgtggaacagggat2100

ctggcccctacccctggcgccaatctgtacggcagccaccctttctacctggccctggaa2160

gatggcggatctgcccacggagtgtttctgctgaactccaacgccatggacgtggtgctg2220

cagcctagccctgccctgtcttggagaagcacaggcggcatcctggatgtgtacatcttt2280

ctgggccccgagcccaagagcgtggtgcagcagtatctggatgtcgtgggctaccccttc2340

atgcccccttactggggcctgggattccacctgtgcagatggggctactccagcaccgcc2400

atcaccagacaggtggtggaaaacatgaccagagcccacttcccactggatgtgcagtgg2460

aacgacctggactacatggacagcagacgggacttcaccttcaacaaggacggcttccgg2520

gacttccccgccatggtgcaggaactgcatcagggcggcagacggtacatgatgatcgtg2580

gatcccgccatcagctcctctggccctgccggctcttacagaccctacgacgagggcctg2640

cggagaggcgtgttcatcaccaacgagacaggccagcccctgatcggcaaagtgtggcct2700

ggcagcacagccttccccgacttcaccaatcctaccgccctggcttggtgggaggacatg2760

gtggccgagttccacgaccaggtgcccttcgacggcatgtggatcgacatgaacgagccc2820

agcaacttcatccggggcagcgaggatggctgccccaacaacgaactggaaaatccccct2880

tacgtgcccggcgtcgtgggcggaacactgcaggccgctacaatctgtgccagcagccac2940

cagtttctgagcacccactacaacctgcacaacctgtacggcctgaccgaggccattgcc3000

agccaccgcgctctcgtgaaagccagaggcacacggcccttcgtgatcagcagaagcacc3060

tttgccggccacggcagatacgccggacattggactggcgacgtgtggtcctcttgggag3120

cagctggcctctagcgtgcccgagatcctgcagttcaatctgctgggcgtgccactcgtg3180

ggcgccgatgtgtgtggcttcctgggcaacacctccgaggaactgtgtgtgcggtggaca3240

cagctgggcgccttctaccctttcatgagaaaccacaacagcctgctgagcctgccccag3300

gaaccctacagctttagcgagcctgcacagcaggccatgcggaaggccctgacactgaga3360

tacgctctgctgccccacctgtacaccctgtttcaccaggcccatgtggccggcgagaca3420

gtggccagacctctgtttctggaattccccaaggacagcagcacctggaccgtggaccat3480

cagctgctgtggggagaggctctgctgattaccccagtgctgcaggcaggcaaggccgaa3540

gtgaccggctactttcccctgggcacttggtacgacctgcagaccgtgcctgtggaagcc3600

ctgggatctctgcctccacctcctgccgctcctagagagcctgccattcactctgagggc3660

cagtgggtcacactgcctgcccccctggataccatcaacgtgcacctgagggccggctac3720

atcataccactgcagggacctggcctgaccaccaccgagtctagacagcagccaatggcc3780

ctggccgtggccctgaccaaaggcggagaagctaggggcgagctgttctgggacgatggc3840

gagagcctggaagtgctggaaagaggcgcctatacccaagtgatcttcctggcccggaac3900

aacaccatcgtgaacgagctggtgcgcgtgacctctgaaggcgctggactgcagctgcag3960

aaagtgaccgtgctgggagtggccacagcccctcagcaggtgctgtctaatggcgtgccc4020

gtgtccaacttcacctacagccccgacaccaaggtgctggacatctgcgtgtcactgctg4080

atgggagagcagtttctggtgtcctggtgctgactcgagagatctaccggtgaattcacc4140

gcgggtttaaactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgcc4200

ttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgc4260

atcgcattgtctgagtaggtgtcattctattctggggggtggggtgggggctagctctag4320

a4321

<210>22

<211>4312

<212>dna

<213>人工序列

<220>

<223>sp8+hgaaco1-δ-8

<400>22

aggctcagaggcacacaggagtttctgggctcaccctgcccccttccaacccctcagttc60

ccatcctccagcagctgtttgtgtgctgcctctgaagtccacactgaacaaacttcagcc120

tactcatgtccctaaaatgggcaaacattgcaagcagcaaacagcaaacacacagccctc180

cctgcctgctgaccttggagctggggcagaggtcagagacctctctgggcccatgccacc240

tccaacatccactcgaccccttggaatttcggtggagaggagcagaggttgtcctggcgt300

ggtttaggtagtgtgagaggggtacccggggatcttgctaccagtggaacagccactaag360

gattctgcagtgagagcagagggccagctaagtggtactctcccagagactgtctgactc420

acgccaccccctccaccttggacacaggacgctgtggtttctgagccaggtacaatgact480

cctttcggtaagtgcagtggaagctgtacactgcccaggcaaagcgtccgggcagcgtag540

gcgggcgactcagatcccagccagtggacttagcccctgtttgctcctccgataactggg600

gtgaccttggttaatattcaccagcagcctcccccgttgcccctctggatccactgctta660

aatacggacgaggacagggccctgtctcctcagcttcaggcaccaccactgacctgggac720

agtgaatagatcctgagaacttcagggtgagtctatgggacccttgatgttttctttccc780

cttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatat840

tgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatat900

acttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataat960

gatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggt1020

taaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgta1080

agaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttctg1140

gttgggataaggctggattattctgagtccaagctaggcccttttgctaatcttgttcat1200

acctcttatcttcctcccacagctcctgggcaacctgctggtctctctgctggcccatca1260

ctttggcaaagcacgcgtgccaccatggccagcagactgaccctgctgacactccttctg1320

ctgctgctggccggcgatagagccagcagcctactagtgcccagagagctgagcggcagc1380

tctcccgtgctggaagaaacacaccctgcccatcagcagggcgcctctagacctggacct1440

agagatgcccaggcccaccccggcagacctagagctgtgcctacccagtgtgacgtgccc1500

cccaacagcagattcgactgcgcccctgacaaggccatcacccaggaacagtgcgaggcc1560

agaggctgctgctacatccctgccaagcagggactgcagggcgctcagatgggacagccc1620

tggtgcttcttcccaccctcctaccccagctacaagctggaaaacctgagcagcagcgag1680

atgggctacaccgccaccctgaccagaaccacccccacattcttcccaaaggacatcctg1740

accctgcggctggacgtgatgatggaaaccgagaaccggctgcacttcaccatcaaggac1800

cccgccaatcggagatacgaggtgcccctggaaaccccccacgtgcactctagagccccc1860

agccctctgtacagcgtggaattcagcgaggaacccttcggcgtgatcgtgcggagacag1920

ctggatggcagagtgctgctgaacaccaccgtggcccctctgttcttcgccgaccagttc1980

ctgcagctgagcaccagcctgcccagccagtacatcacaggactggccgagcacctgagc2040

cccctgatgctgagcacatcctggacccggatcaccctgtggaacagggatctggcccct2100

acccctggcgccaatctgtacggcagccaccctttctacctggccctggaagatggcgga2160

tctgcccacggagtgtttctgctgaactccaacgccatggacgtggtgctgcagcctagc2220

cctgccctgtcttggagaagcacaggcggcatcctggatgtgtacatctttctgggcccc2280

gagcccaagagcgtggtgcagcagtatctggatgtcgtgggctaccccttcatgccccct2340

tactggggcctgggattccacctgtgcagatggggctactccagcaccgccatcaccaga2400

caggtggtggaaaacatgaccagagcccacttcccactggatgtgcagtggaacgacctg2460

gactacatggacagcagacgggacttcaccttcaacaaggacggcttccgggacttcccc2520

gccatggtgcaggaactgcatcagggcggcagacggtacatgatgatcgtggatcccgcc2580

atcagctcctctggccctgccggctcttacagaccctacgacgagggcctgcggagaggc2640

gtgttcatcaccaacgagacaggccagcccctgatcggcaaagtgtggcctggcagcaca2700

gccttccccgacttcaccaatcctaccgccctggcttggtgggaggacatggtggccgag2760

ttccacgaccaggtgcccttcgacggcatgtggatcgacatgaacgagcccagcaacttc2820

atccggggcagcgaggatggctgccccaacaacgaactggaaaatcccccttacgtgccc2880

ggcgtcgtgggcggaacactgcaggccgctacaatctgtgccagcagccaccagtttctg2940

agcacccactacaacctgcacaacctgtacggcctgaccgaggccattgccagccaccgc3000

gctctcgtgaaagccagaggcacacggcccttcgtgatcagcagaagcacctttgccggc3060

cacggcagatacgccggacattggactggcgacgtgtggtcctcttgggagcagctggcc3120

tctagcgtgcccgagatcctgcagttcaatctgctgggcgtgccactcgtgggcgccgat3180

gtgtgtggcttcctgggcaacacctccgaggaactgtgtgtgcggtggacacagctgggc3240

gccttctaccctttcatgagaaaccacaacagcctgctgagcctgccccaggaaccctac3300

agctttagcgagcctgcacagcaggccatgcggaaggccctgacactgagatacgctctg3360

ctgccccacctgtacaccctgtttcaccaggcccatgtggccggcgagacagtggccaga3420

cctctgtttctggaattccccaaggacagcagcacctggaccgtggaccatcagctgctg3480

tggggagaggctctgctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggc3540

tactttcccctgggcacttggtacgacctgcagaccgtgcctgtggaagccctgggatct3600

ctgcctccacctcctgccgctcctagagagcctgccattcactctgagggccagtgggtc3660

acactgcctgcccccctggataccatcaacgtgcacctgagggccggctacatcatacca3720

ctgcagggacctggcctgaccaccaccgagtctagacagcagccaatggccctggccgtg3780

gccctgaccaaaggcggagaagctaggggcgagctgttctgggacgatggcgagagcctg3840

gaagtgctggaaagaggcgcctatacccaagtgatcttcctggcccggaacaacaccatc3900

gtgaacgagctggtgcgcgtgacctctgaaggcgctggactgcagctgcagaaagtgacc3960

gtgctgggagtggccacagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaac4020

ttcacctacagccccgacaccaaggtgctggacatctgcgtgtcactgctgatgggagag4080

cagtttctggtgtcctggtgctgactcgagagatctaccggtgaattcaccgcgggttta4140

aactgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgac4200

cctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattg4260

tctgagtaggtgtcattctattctggggggtggggtgggggctagctctaga4312

<210>23

<211>16

<212>prt

<213>人工序列

<220>

<223>sp3

<400>23

metleuleuleuseralaleuleuleuglyleualapheglytyrser

151015

<210>24

<211>16

<212>prt

<213>人工序列

<220>

<223>sp4

<400>24

metleuleuserphealaleuleuleuglyleualaleuglytyrser

151015

<210>25

<211>16

<212>prt

<213>人工序列

<220>

<223>sp5

<400>25

metleuleugluhisalaleuleuleuglyleualahisglytyrser

151015

<210>26

<211>54

<212>dna

<213>人工序列

<220>

<223>sp7

<400>26

atggcctttctgtggctgctgagctgttgggccctgctgggcaccaccttcggc54

<210>27

<211>75

<212>dna

<213>人工序列

<220>

<223>sp6

<400>27

atgcctccacctagaacaggcagaggcctgctgtggctgggcctggtgctgtctagtgtg60

tgtgtggccctgggc75

<210>28

<211>66

<212>dna

<213>人工序列

<220>

<223>sp8

<400>28

atggccagcagactgaccctgctgacactccttctgctgctgctggccggcgatagagcc60

agcagc66

<210>29

<211>917

<212>prt

<213>人工序列

<220>

<223>hgaa-δ-8

<400>29

leuleuvalproarggluleuserglyserserprovalleugluglu

151015

thrhisproalahisglnglnglyalaserargproglyproargasp

202530

alaglnalahisproglyargproargalavalprothrglncysasp

354045

valproproasnserargpheaspcysalaproasplysalailethr

505560

glngluglncysglualaargglycyscystyrileproalalysgln

65707580

glyleuglnglyalaglnmetglyglnprotrpcysphephepropro

859095

sertyrprosertyrlysleugluasnleuserserserglumetgly

100105110

tyrthralathrleuthrargthrthrprothrphepheprolysasp

115120125

ileleuthrleuargleuaspvalmetmetgluthrgluasnargleu

130135140

hisphethrilelysaspproalaasnargargtyrgluvalproleu

145150155160

gluthrprohisvalhisserargalaproserproleutyrserval

165170175

gluphesergluglupropheglyvalilevalargargglnleuasp

180185190

glyargvalleuleuasnthrthrvalalaproleuphephealaasp

195200205

glnpheleuglnleuserthrserleuproserglntyrilethrgly

210215220

leualagluhisleuserproleumetleuserthrsertrpthrarg

225230235240

ilethrleutrpasnargaspleualaprothrproglyalaasnleu

245250255

tyrglyserhisprophetyrleualaleugluaspglyglyserala

260265270

hisglyvalpheleuleuasnserasnalametaspvalvalleugln

275280285

proserproalaleusertrpargserthrglyglyileleuaspval

290295300

tyrilepheleuglyprogluprolysservalvalglnglntyrleu

305310315320

aspvalvalglytyrprophemetproprotyrtrpglyleuglyphe

325330335

hisleucysargtrpglytyrserserthralailethrargglnval

340345350

valgluasnmetthrargalahispheproleuaspvalglntrpasn

355360365

aspleuasptyrmetaspserargargaspphethrpheasnlysasp

370375380

glypheargasppheproalametvalglngluleuhisglnglygly

385390395400

argargtyrmetmetilevalaspproalaileserserserglypro

405410415

alaglysertyrargprotyraspgluglyleuargargglyvalphe

420425430

ilethrasngluthrglyglnproleuileglylysvaltrpprogly

435440445

serthralapheproaspphethrasnprothralaleualatrptrp

450455460

gluaspmetvalalagluphehisaspglnvalpropheaspglymet

465470475480

trpileaspmetasngluproserasnpheileargglysergluasp

485490495

glycysproasnasngluleugluasnproprotyrvalproglyval

500505510

valglyglythrleuglnalaalathrilecysalaserserhisgln

515520525

pheleuserthrhistyrasnleuhisasnleutyrglyleuthrglu

530535540

alailealaserhisargalaleuvallysalaargglythrargpro

545550555560

phevalileserargserthrphealaglyhisglyargtyralagly

565570575

histrpthrglyaspvaltrpsersertrpgluglnleualaserser

580585590

valprogluileleuglnpheasnleuleuglyvalproleuvalgly

595600605

alaaspvalcysglypheleuglyasnthrserglugluleucysval

610615620

argtrpthrglnleuglyalaphetyrprophemetargasnhisasn

625630635640

serleuleuserleuproglngluprotyrserphesergluproala

645650655

glnglnalametarglysalaleuthrleuargtyralaleuleupro

660665670

hisleutyrthrleuphehisglnalahisvalalaglygluthrval

675680685

alaargproleupheleuglupheprolysaspserserthrtrpthr

690695700

valasphisglnleuleutrpglyglualaleuleuilethrproval

705710715720

leuglnalaglylysalagluvalthrglytyrpheproleuglythr

725730735

trptyraspleuglnthrvalprovalglualaleuglyserleupro

740745750

proproproalaalaproarggluproalailehissergluglygln

755760765

trpvalthrleuproalaproleuaspthrileasnvalhisleuarg

770775780

alaglytyrileileproleuglnglyproglyleuthrthrthrglu

785790795800

serargglnglnprometalaleualavalalaleuthrlysglygly

805810815

glualaargglygluleuphetrpaspaspglygluserleugluval

820825830

leugluargglyalatyrthrglnvalilepheleualaargasnasn

835840845

thrilevalasngluleuvalargvalthrsergluglyalaglyleu

850855860

glnleuglnlysvalthrvalleuglyvalalathralaproglngln

865870875880

valleuserasnglyvalprovalserasnphethrtyrserproasp

885890895

thrlysvalleuaspilecysvalserleuleumetglygluglnphe

900905910

leuvalsertrpcys

915

<210>30

<211>883

<212>prt

<213>人工序列

<220>

<223>hgaa-δ-42

<400>30

alahisproglyargproargalavalprothrglncysaspvalpro

151015

proasnserargpheaspcysalaproasplysalailethrglnglu

202530

glncysglualaargglycyscystyrileproalalysglnglyleu

354045

glnglyalaglnmetglyglnprotrpcysphepheproprosertyr

505560

prosertyrlysleugluasnleuserserserglumetglytyrthr

65707580

alathrleuthrargthrthrprothrphepheprolysaspileleu

859095

thrleuargleuaspvalmetmetgluthrgluasnargleuhisphe

100105110

thrilelysaspproalaasnargargtyrgluvalproleugluthr

115120125

prohisvalhisserargalaproserproleutyrservalgluphe

130135140

sergluglupropheglyvalilevalargargglnleuaspglyarg

145150155160

valleuleuasnthrthrvalalaproleuphephealaaspglnphe

165170175

leuglnleuserthrserleuproserglntyrilethrglyleuala

180185190

gluhisleuserproleumetleuserthrsertrpthrargilethr

195200205

leutrpasnargaspleualaprothrproglyalaasnleutyrgly

210215220

serhisprophetyrleualaleugluaspglyglyseralahisgly

225230235240

valpheleuleuasnserasnalametaspvalvalleuglnproser

245250255

proalaleusertrpargserthrglyglyileleuaspvaltyrile

260265270

pheleuglyprogluprolysservalvalglnglntyrleuaspval

275280285

valglytyrprophemetproprotyrtrpglyleuglyphehisleu

290295300

cysargtrpglytyrserserthralailethrargglnvalvalglu

305310315320

asnmetthrargalahispheproleuaspvalglntrpasnaspleu

325330335

asptyrmetaspserargargaspphethrpheasnlysaspglyphe

340345350

argasppheproalametvalglngluleuhisglnglyglyargarg

355360365

tyrmetmetilevalaspproalaileserserserglyproalagly

370375380

sertyrargprotyraspgluglyleuargargglyvalpheilethr

385390395400

asngluthrglyglnproleuileglylysvaltrpproglyserthr

405410415

alapheproaspphethrasnprothralaleualatrptrpgluasp

420425430

metvalalagluphehisaspglnvalpropheaspglymettrpile

435440445

aspmetasngluproserasnpheileargglysergluaspglycys

450455460

proasnasngluleugluasnproprotyrvalproglyvalvalgly

465470475480

glythrleuglnalaalathrilecysalaserserhisglnpheleu

485490495

serthrhistyrasnleuhisasnleutyrglyleuthrglualaile

500505510

alaserhisargalaleuvallysalaargglythrargpropheval

515520525

ileserargserthrphealaglyhisglyargtyralaglyhistrp

530535540

thrglyaspvaltrpsersertrpgluglnleualaserservalpro

545550555560

gluileleuglnpheasnleuleuglyvalproleuvalglyalaasp

565570575

valcysglypheleuglyasnthrserglugluleucysvalargtrp

580585590

thrglnleuglyalaphetyrprophemetargasnhisasnserleu

595600605

leuserleuproglngluprotyrserphesergluproalaglngln

610615620

alametarglysalaleuthrleuargtyralaleuleuprohisleu

625630635640

tyrthrleuphehisglnalahisvalalaglygluthrvalalaarg

645650655

proleupheleuglupheprolysaspserserthrtrpthrvalasp

660665670

hisglnleuleutrpglyglualaleuleuilethrprovalleugln

675680685

alaglylysalagluvalthrglytyrpheproleuglythrtrptyr

690695700

aspleuglnthrvalprovalglualaleuglyserleupropropro

705710715720

proalaalaproarggluproalailehissergluglyglntrpval

725730735

thrleuproalaproleuaspthrileasnvalhisleuargalagly

740745750

tyrileileproleuglnglyproglyleuthrthrthrgluserarg

755760765

glnglnprometalaleualavalalaleuthrlysglyglygluala

770775780

argglygluleuphetrpaspaspglygluserleugluvalleuglu

785790795800

argglyalatyrthrglnvalilepheleualaargasnasnthrile

805810815

valasngluleuvalargvalthrsergluglyalaglyleuglnleu

820825830

glnlysvalthrvalleuglyvalalathralaproglnglnvalleu

835840845

serasnglyvalprovalserasnphethrtyrserproaspthrlys

850855860

valleuaspilecysvalserleuleumetglygluglnpheleuval

865870875880

sertrpcys

<210>31

<211>2778

<212>dna

<213>hgaawtw/osp

<400>31

gggcacatcctactccatgatttcctgctggttccccgagagctgagtggctcctcccca60

gtcctggaggagactcacccagctcaccagcagggagccagcagaccagggccccgggat120

gcccaggcacaccccgggcggccgcgagcagtgcccacacagtgcgacgtcccccccaac180

agccgcttcgattgcgcccctgacaaggccatcacccaggaacagtgcgaggcccgcggc240

tgttgctacatccctgcaaagcaggggctgcagggagcccagatggggcagccctggtgc300

ttcttcccacccagctaccccagctacaagctggagaacctgagctcctctgaaatgggc360

tacacggccaccctgacccgtaccacccccaccttcttccccaaggacatcctgaccctg420

cggctggacgtgatgatggagactgagaaccgcctccacttcacgatcaaagatccagct480

aacaggcgctacgaggtgcccttggagaccccgcatgtccacagccgggcaccgtcccca540

ctctacagcgtggagttctccgaggagcccttcggggtgatcgtgcgccggcagctggac600

ggccgcgtgctgctgaacacgacggtggcgcccctgttctttgcggaccagttccttcag660

ctgtccacctcgctgccctcgcagtatatcacaggcctcgccgagcacctcagtcccctg720

atgctcagcaccagctggaccaggatcaccctgtggaaccgggaccttgcgcccacgccc780

ggtgcgaacctctacgggtctcaccctttctacctggcgctggaggacggcgggtcggca840

cacggggtgttcctgctaaacagcaatgccatggatgtggtcctgcagccgagccctgcc900

cttagctggaggtcgacaggtgggatcctggatgtctacatcttcctgggcccagagccc960

aagagcgtggtgcagcagtacctggacgttgtgggatacccgttcatgccgccatactgg1020

ggcctgggcttccacctgtgccgctggggctactcctccaccgctatcacccgccaggtg1080

gtggagaacatgaccagggcccacttccccctggacgtccagtggaacgacctggactac1140

atggactcccggagggacttcacgttcaacaaggatggcttccgggacttcccggccatg1200

gtgcaggagctgcaccagggcggccggcgctacatgatgatcgtggatcctgccatcagc1260

agctcgggccctgccgggagctacaggccctacgacgagggtctgcggaggggggttttc1320

atcaccaacgagaccggccagccgctgattgggaaggtatggcccgggtccactgccttc1380

cccgacttcaccaaccccacagccctggcctggtgggaggacatggtggctgagttccat1440

gaccaggtgcccttcgacggcatgtggattgacatgaacgagccttccaacttcatcagg1500

ggctctgaggacggctgccccaacaatgagctggagaacccaccctacgtgcctggggtg1560

gttggggggaccctccaggcggccaccatctgtgcctccagccaccagtttctctccaca1620

cactacaacctgcacaacctctacggcctgaccgaagccatcgcctcccacagggcgctg1680

gtgaaggctcgggggacacgcccatttgtgatctcccgctcgacctttgctggccacggc1740

cgatacgccggccactggacgggggacgtgtggagctcctgggagcagctcgcctcctcc1800

gtgccagaaatcctgcagtttaacctgctgggggtgcctctggtcggggccgacgtctgc1860

ggcttcctgggcaacacctcagaggagctgtgtgtgcgctggacccagctgggggccttc1920

taccccttcatgcggaaccacaacagcctgctcagtctgccccaggagccgtacagcttc1980

agcgagccggcccagcaggccatgaggaaggccctcaccctgcgctacgcactcctcccc2040

cacctctacacactgttccaccaggcccacgtcgcgggggagaccgtggcccggcccctc2100

ttcctggagttccccaaggactctagcacctggactgtggaccaccagctcctgtggggg2160

gaggccctgctcatcaccccagtgctccaggccgggaaggccgaagtgactggctacttc2220

cccttgggcacatggtacgacctgcagacggtgccagtagaggcccttggcagcctccca2280

cccccacctgcagctccccgtgagccagccatccacagcgaggggcagtgggtgacgctg2340

ccggcccccctggacaccatcaacgtccacctccgggctgggtacatcatccccctgcag2400

ggccctggcctcacaaccacagagtcccgccagcagcccatggccctggctgtggccctg2460

accaagggtggggaggcccgaggggagctgttctgggacgatggagagagcctggaagtg2520

ctggagcgaggggcctacacacaggtcatcttcctggccaggaataacacgatcgtgaat2580

gagctggtacgtgtgaccagtgagggagctggcctgcagctgcagaaggtgactgtcctg2640

ggcgtggccacggcgccccagcaggtcctctccaacggtgtccctgtctccaacttcacc2700

tacagccccgacaccaaggtcctggacatctgtgtctcgctgttgatgggagagcagttt2760

ctcgtcagctggtgttag2778

<210>32

<211>2754

<212>dna

<213>人工序列

<220>

<223>hgaaco1-δ-8w/osp

<400>32

ctactagtgcccagagagctgagcggcagctctcccgtgctggaagaaacacaccctgcc60

catcagcagggcgcctctagacctggacctagagatgcccaggcccaccccggcagacct120

agagctgtgcctacccagtgtgacgtgccccccaacagcagattcgactgcgcccctgac180

aaggccatcacccaggaacagtgcgaggccagaggctgctgctacatccctgccaagcag240

ggactgcagggcgctcagatgggacagccctggtgcttcttcccaccctcctaccccagc300

tacaagctggaaaacctgagcagcagcgagatgggctacaccgccaccctgaccagaacc360

acccccacattcttcccaaaggacatcctgaccctgcggctggacgtgatgatggaaacc420

gagaaccggctgcacttcaccatcaaggaccccgccaatcggagatacgaggtgcccctg480

gaaaccccccacgtgcactctagagcccccagccctctgtacagcgtggaattcagcgag540

gaacccttcggcgtgatcgtgcggagacagctggatggcagagtgctgctgaacaccacc600

gtggcccctctgttcttcgccgaccagttcctgcagctgagcaccagcctgcccagccag660

tacatcacaggactggccgagcacctgagccccctgatgctgagcacatcctggacccgg720

atcaccctgtggaacagggatctggcccctacccctggcgccaatctgtacggcagccac780

cctttctacctggccctggaagatggcggatctgcccacggagtgtttctgctgaactcc840

aacgccatggacgtggtgctgcagcctagccctgccctgtcttggagaagcacaggcggc900

atcctggatgtgtacatctttctgggccccgagcccaagagcgtggtgcagcagtatctg960

gatgtcgtgggctaccccttcatgcccccttactggggcctgggattccacctgtgcaga1020

tggggctactccagcaccgccatcaccagacaggtggtggaaaacatgaccagagcccac1080

ttcccactggatgtgcagtggaacgacctggactacatggacagcagacgggacttcacc1140

ttcaacaaggacggcttccgggacttccccgccatggtgcaggaactgcatcagggcggc1200

agacggtacatgatgatcgtggatcccgccatcagctcctctggccctgccggctcttac1260

agaccctacgacgagggcctgcggagaggcgtgttcatcaccaacgagacaggccagccc1320

ctgatcggcaaagtgtggcctggcagcacagccttccccgacttcaccaatcctaccgcc1380

ctggcttggtgggaggacatggtggccgagttccacgaccaggtgcccttcgacggcatg1440

tggatcgacatgaacgagcccagcaacttcatccggggcagcgaggatggctgccccaac1500

aacgaactggaaaatcccccttacgtgcccggcgtcgtgggcggaacactgcaggccgct1560

acaatctgtgccagcagccaccagtttctgagcacccactacaacctgcacaacctgtac1620

ggcctgaccgaggccattgccagccaccgcgctctcgtgaaagccagaggcacacggccc1680

ttcgtgatcagcagaagcacctttgccggccacggcagatacgccggacattggactggc1740

gacgtgtggtcctcttgggagcagctggcctctagcgtgcccgagatcctgcagttcaat1800

ctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctgggcaacacctccgag1860

gaactgtgtgtgcggtggacacagctgggcgccttctaccctttcatgagaaaccacaac1920

agcctgctgagcctgccccaggaaccctacagctttagcgagcctgcacagcaggccatg1980

cggaaggccctgacactgagatacgctctgctgccccacctgtacaccctgtttcaccag2040

gcccatgtggccggcgagacagtggccagacctctgtttctggaattccccaaggacagc2100

agcacctggaccgtggaccatcagctgctgtggggagaggctctgctgattaccccagtg2160

ctgcaggcaggcaaggccgaagtgaccggctactttcccctgggcacttggtacgacctg2220

cagaccgtgcctgtggaagccctgggatctctgcctccacctcctgccgctcctagagag2280

cctgccattcactctgagggccagtgggtcacactgcctgcccccctggataccatcaac2340

gtgcacctgagggccggctacatcataccactgcagggacctggcctgaccaccaccgag2400

tctagacagcagccaatggccctggccgtggccctgaccaaaggcggagaagctaggggc2460

gagctgttctgggacgatggcgagagcctggaagtgctggaaagaggcgcctatacccaa2520

gtgatcttcctggcccggaacaacaccatcgtgaacgagctggtgcgcgtgacctctgaa2580

ggcgctggactgcagctgcagaaagtgaccgtgctgggagtggccacagcccctcagcag2640

gtgctgtctaatggcgtgcccgtgtccaacttcacctacagccccgacaccaaggtgctg2700

gacatctgcgtgtcactgctgatgggagagcagtttctggtgtcctggtgctga2754

<210>33

<211>2652

<212>dna

<213>人工序列

<220>

<223>hgaaco1-δ-42w/osp

<400>33

gcccaccccggcagacctagagctgtgcctacccagtgtgacgtgccccccaacagcaga60

ttcgactgcgcccctgacaaggccatcacccaggaacagtgcgaggccagaggctgctgc120

tacatccctgccaagcagggactgcagggcgctcagatgggacagccctggtgcttcttc180

ccaccctcctaccccagctacaagctggaaaacctgagcagcagcgagatgggctacacc240

gccaccctgaccagaaccacccccacattcttcccaaaggacatcctgaccctgcggctg300

gacgtgatgatggaaaccgagaaccggctgcacttcaccatcaaggaccccgccaatcgg360

agatacgaggtgcccctggaaaccccccacgtgcactctagagcccccagccctctgtac420

agcgtggaattcagcgaggaacccttcggcgtgatcgtgcggagacagctggatggcaga480

gtgctgctgaacaccaccgtggcccctctgttcttcgccgaccagttcctgcagctgagc540

accagcctgcccagccagtacatcacaggactggccgagcacctgagccccctgatgctg600

agcacatcctggacccggatcaccctgtggaacagggatctggcccctacccctggcgcc660

aatctgtacggcagccaccctttctacctggccctggaagatggcggatctgcccacgga720

gtgtttctgctgaactccaacgccatggacgtggtgctgcagcctagccctgccctgtct780

tggagaagcacaggcggcatcctggatgtgtacatctttctgggccccgagcccaagagc840

gtggtgcagcagtatctggatgtcgtgggctaccccttcatgcccccttactggggcctg900

ggattccacctgtgcagatggggctactccagcaccgccatcaccagacaggtggtggaa960

aacatgaccagagcccacttcccactggatgtgcagtggaacgacctggactacatggac1020

agcagacgggacttcaccttcaacaaggacggcttccgggacttccccgccatggtgcag1080

gaactgcatcagggcggcagacggtacatgatgatcgtggatcccgccatcagctcctct1140

ggccctgccggctcttacagaccctacgacgagggcctgcggagaggcgtgttcatcacc1200

aacgagacaggccagcccctgatcggcaaagtgtggcctggcagcacagccttccccgac1260

ttcaccaatcctaccgccctggcttggtgggaggacatggtggccgagttccacgaccag1320

gtgcccttcgacggcatgtggatcgacatgaacgagcccagcaacttcatccggggcagc1380

gaggatggctgccccaacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggc1440

ggaacactgcaggccgctacaatctgtgccagcagccaccagtttctgagcacccactac1500

aacctgcacaacctgtacggcctgaccgaggccattgccagccaccgcgctctcgtgaaa1560

gccagaggcacacggcccttcgtgatcagcagaagcacctttgccggccacggcagatac1620

gccggacattggactggcgacgtgtggtcctcttgggagcagctggcctctagcgtgccc1680

gagatcctgcagttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttc1740

ctgggcaacacctccgaggaactgtgtgtgcggtggacacagctgggcgccttctaccct1800

ttcatgagaaaccacaacagcctgctgagcctgccccaggaaccctacagctttagcgag1860

cctgcacagcaggccatgcggaaggccctgacactgagatacgctctgctgccccacctg1920

tacaccctgtttcaccaggcccatgtggccggcgagacagtggccagacctctgtttctg1980

gaattccccaaggacagcagcacctggaccgtggaccatcagctgctgtggggagaggct2040

ctgctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggctactttcccctg2100

ggcacttggtacgacctgcagaccgtgcctgtggaagccctgggatctctgcctccacct2160

cctgccgctcctagagagcctgccattcactctgagggccagtgggtcacactgcctgcc2220

cccctggataccatcaacgtgcacctgagggccggctacatcataccactgcagggacct2280

ggcctgaccaccaccgagtctagacagcagccaatggccctggccgtggccctgaccaaa2340

ggcggagaagctaggggcgagctgttctgggacgatggcgagagcctggaagtgctggaa2400

agaggcgcctatacccaagtgatcttcctggcccggaacaacaccatcgtgaacgagctg2460

gtgcgcgtgacctctgaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtg2520

gccacagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaacttcacctacagc2580

cccgacaccaaggtgctggacatctgcgtgtcactgctgatgggagagcagtttctggtg2640

tcctggtgctga2652

<210>34

<211>2754

<212>dna

<213>人工序列

<220>

<223>hgaaco2-δ-8

<400>34

ctgttggtgcctagagagctgagcggatcatccccagtgctggaggagactcatcctgct60

caccaacagggagcttccagaccaggaccgagagacgcccaagcccatcctggtagacca120

agagctgtgcctacccaatgcgacgtgccacccaactcccgattcgactgcgcgccagat180

aaggctattacccaagagcagtgtgaagccagaggttgctgctacatcccagcgaagcaa240

ggattgcaaggcgcccaaatgggacaaccttggtgtttcttccccccttcgtacccatca300

tataaactcgaaaacctgtcctcttcggaaatgggttatactgccaccctcaccagaact360

actcctactttcttcccgaaagacatcttgaccttgaggctggacgtgatgatggagact420

gaaaaccggctgcatttcactatcaaagatcctgccaatcggcgatacgaggtccctctg480

gaaacccctcacgtgcactcacgggctccttctccgctttactccgtcgaattctctgag540

gaacccttcggagtgatcgttagacgccagctggatggtagagtgctgttgaacactact600

gtggccccacttttcttcgctgaccagtttctgcaactgtccacttccctgccatcccag660

tacattactggactcgccgaacacctgtcgccactgatgctctcgacctcttggactaga720

atcactttgtggaacagagacttggcccctactccgggagcaaatctgtacggaagccac780

cctttttacctggcgctcgaagatggcggatccgctcacggagtgttcctgctgaatagc840

aacgcaatggacgtggtgctgcaaccttcccctgcactcagttggagaagtaccgggggt900

attctggacgtgtacatcttcctcggaccagaacccaagagcgtggtgcagcaatatctg960

gacgtggtcggatacccttttatgcctccttactggggactgggattccacctttgccgt1020

tggggctactcatccaccgccattaccagacaggtggtggagaatatgaccagagcccac1080

ttccctctcgacgtgcagtggaacgatctggactatatggactcccggagagatttcacc1140

ttcaacaaggacgggttccgcgattttcccgcgatggttcaagagctccaccagggtggt1200

cgaagatatatgatgatcgtcgacccagccatttcgagcagcggacccgctggatcttat1260

agaccttacgacgaaggccttaggagaggagtgttcatcacaaacgagactggacagcct1320

ttgatcggtaaagtgtggcctggatcaaccgcctttcctgactttaccaatcccactgcc1380

ttggcttggtgggaggacatggtggccgaattccacgaccaagtcccctttgatggaatg1440

tggatcgatatgaacgaaccaagcaattttatcagaggttccgaagacggttgccccaac1500

aacgaactggaaaaccctccttatgtgcccggagtcgtgggcggaacattacaggccgcg1560

actatttgcgccagcagccaccaattcctgtccactcactacaacctccacaacctttat1620

ggattaaccgaagctattgcaagtcacagggctctggtgaaggctagagggactaggccc1680

tttgtgatctcccgatccacctttgccggacacgggagatacgccggtcactggactggt1740

gacgtgtggagctcatgggaacaactggcctcctccgtgccggaaatcttacagttcaac1800

cttctgggtgtccctcttgtcggagcagacgtgtgtgggtttcttggtaacacctccgag1860

gaactgtgtgtgcgctggactcaactgggtgcattctacccattcatgagaaaccacaac1920

tccttgctgtccctgccacaagagccctactcgttcagcgagcctgcacaacaggctatg1980

cggaaggcactgaccctgagatacgccctgcttccacacttatacactctcttccatcaa2040

gcgcatgtggcaggagaaaccgttgcaaggcctcttttccttgaattccccaaggattcc2100

tcgacttggacggtggatcatcagctgctgtggggagaagctctgctgattactccagtg2160

ttgcaagccggaaaagctgaggtgaccggatactttccgctgggaacctggtacgacctc2220

cagactgtccctgttgaagcccttggatcactgcctccgcctccggcagctccacgcgaa2280

ccagctatacattccgagggacagtgggttacattaccagctcctctggacacaatcaac2340

gtccacttaagagctggctacattatccctctgcaaggaccaggactgactacgaccgag2400

agcagacagcagccaatggcactggctgtggctctgaccaagggaggggaagctagagga2460

gaactcttctgggatgatggggagtcccttgaagtgctggaaagaggcgcttacactcaa2520

gtcattttccttgcacggaacaacaccattgtgaacgaattggtgcgagtgaccagcgaa2580

ggagctggacttcaactgcagaaggtcactgtgctcggagtggctaccgctcctcagcaa2640

gtgctgtcgaatggagtccccgtgtcaaactttacctactcccctgacactaaggtgctc2700

gacatttgcgtgtccctcctgatgggagagcagttccttgtgtcctggtgttga2754

<210>35

<211>2652

<212>dna

<213>人工序列

<220>

<223>hgaaco2-δ-42

<400>35

gcccatcctggtagaccaagagctgtgcctacccaatgcgacgtgccacccaactcccga60

ttcgactgcgcgccagataaggctattacccaagagcagtgtgaagccagaggttgctgc120

tacatcccagcgaagcaaggattgcaaggcgcccaaatgggacaaccttggtgtttcttc180

cccccttcgtacccatcatataaactcgaaaacctgtcctcttcggaaatgggttatact240

gccaccctcaccagaactactcctactttcttcccgaaagacatcttgaccttgaggctg300

gacgtgatgatggagactgaaaaccggctgcatttcactatcaaagatcctgccaatcgg360

cgatacgaggtccctctggaaacccctcacgtgcactcacgggctccttctccgctttac420

tccgtcgaattctctgaggaacccttcggagtgatcgttagacgccagctggatggtaga480

gtgctgttgaacactactgtggccccacttttcttcgctgaccagtttctgcaactgtcc540

acttccctgccatcccagtacattactggactcgccgaacacctgtcgccactgatgctc600

tcgacctcttggactagaatcactttgtggaacagagacttggcccctactccgggagca660

aatctgtacggaagccaccctttttacctggcgctcgaagatggcggatccgctcacgga720

gtgttcctgctgaatagcaacgcaatggacgtggtgctgcaaccttcccctgcactcagt780

tggagaagtaccgggggtattctggacgtgtacatcttcctcggaccagaacccaagagc840

gtggtgcagcaatatctggacgtggtcggatacccttttatgcctccttactggggactg900

ggattccacctttgccgttggggctactcatccaccgccattaccagacaggtggtggag960

aatatgaccagagcccacttccctctcgacgtgcagtggaacgatctggactatatggac1020

tcccggagagatttcaccttcaacaaggacgggttccgcgattttcccgcgatggttcaa1080

gagctccaccagggtggtcgaagatatatgatgatcgtcgacccagccatttcgagcagc1140

ggacccgctggatcttatagaccttacgacgaaggccttaggagaggagtgttcatcaca1200

aacgagactggacagcctttgatcggtaaagtgtggcctggatcaaccgcctttcctgac1260

tttaccaatcccactgccttggcttggtgggaggacatggtggccgaattccacgaccaa1320

gtcccctttgatggaatgtggatcgatatgaacgaaccaagcaattttatcagaggttcc1380

gaagacggttgccccaacaacgaactggaaaaccctccttatgtgcccggagtcgtgggc1440

ggaacattacaggccgcgactatttgcgccagcagccaccaattcctgtccactcactac1500

aacctccacaacctttatggattaaccgaagctattgcaagtcacagggctctggtgaag1560

gctagagggactaggccctttgtgatctcccgatccacctttgccggacacgggagatac1620

gccggtcactggactggtgacgtgtggagctcatgggaacaactggcctcctccgtgccg1680

gaaatcttacagttcaaccttctgggtgtccctcttgtcggagcagacgtgtgtgggttt1740

cttggtaacacctccgaggaactgtgtgtgcgctggactcaactgggtgcattctaccca1800

ttcatgagaaaccacaactccttgctgtccctgccacaagagccctactcgttcagcgag1860

cctgcacaacaggctatgcggaaggcactgaccctgagatacgccctgcttccacactta1920

tacactctcttccatcaagcgcatgtggcaggagaaaccgttgcaaggcctcttttcctt1980

gaattccccaaggattcctcgacttggacggtggatcatcagctgctgtggggagaagct2040

ctgctgattactccagtgttgcaagccggaaaagctgaggtgaccggatactttccgctg2100

ggaacctggtacgacctccagactgtccctgttgaagcccttggatcactgcctccgcct2160

ccggcagctccacgcgaaccagctatacattccgagggacagtgggttacattaccagct2220

cctctggacacaatcaacgtccacttaagagctggctacattatccctctgcaaggacca2280

ggactgactacgaccgagagcagacagcagccaatggcactggctgtggctctgaccaag2340

ggaggggaagctagaggagaactcttctgggatgatggggagtcccttgaagtgctggaa2400

agaggcgcttacactcaagtcattttccttgcacggaacaacaccattgtgaacgaattg2460

gtgcgagtgaccagcgaaggagctggacttcaactgcagaaggtcactgtgctcggagtg2520

gctaccgctcctcagcaagtgctgtcgaatggagtccccgtgtcaaactttacctactcc2580

cctgacactaaggtgctcgacatttgcgtgtccctcctgatgggagagcagttccttgtg2640

tcctggtgttga2652

<210>36

<211>925

<212>prt

<213>人工序列

<220>

<223>变体hgaawtw/osp

<400>36

glyhisileleuleuhisasppheleuleuvalproarggluleuser

151015

glyserserprovalleuglugluthrhisproalahisglnglngly

202530

alaserargproglyproargaspalaglnalahisproglyargpro

354045

argalavalprothrglncysaspvalproproasnserargpheasp

505560

cysalaproasplysalailethrglngluglncysglualaarggly

65707580

cyscystyrileproalalysglnglyleuglnglyalaglnmetgly

859095

glnprotrpcysphepheproprosertyrprosertyrlysleuglu

100105110

asnleuserserserglumetglytyrthralathrleuthrargthr

115120125

thrprothrphepheprolysaspileleuthrleuargleuaspval

130135140

metmetgluthrgluasnargleuhisphethrilelysaspproala

145150155160

asnargargtyrgluvalproleugluthrproargvalhisserarg

165170175

alaproserproleutyrservalglupheserglugluprophegly

180185190

valilevalhisargglnleuaspglyargvalleuleuasnthrthr

195200205

valalaproleuphephealaaspglnpheleuglnleuserthrser

210215220

leuproserglntyrilethrglyleualagluhisleuserproleu

225230235240

metleuserthrsertrpthrargilethrleutrpasnargaspleu

245250255

alaprothrproglyalaasnleutyrglyserhisprophetyrleu

260265270

alaleugluaspglyglyseralahisglyvalpheleuleuasnser

275280285

asnalametaspvalvalleuglnproserproalaleusertrparg

290295300

serthrglyglyileleuaspvaltyrilepheleuglyproglupro

305310315320

lysservalvalglnglntyrleuaspvalvalglytyrprophemet

325330335

proprotyrtrpglyleuglyphehisleucysargtrpglytyrser

340345350

serthralailethrargglnvalvalgluasnmetthrargalahis

355360365

pheproleuaspvalglntrpasnaspleuasptyrmetaspserarg

370375380

argaspphethrpheasnlysaspglypheargasppheproalamet

385390395400

valglngluleuhisglnglyglyargargtyrmetmetilevalasp

405410415

proalaileserserserglyproalaglysertyrargprotyrasp

420425430

gluglyleuargargglyvalpheilethrasngluthrglyglnpro

435440445

leuileglylysvaltrpproglyserthralapheproaspphethr

450455460

asnprothralaleualatrptrpgluaspmetvalalagluphehis

465470475480

aspglnvalpropheaspglymettrpileaspmetasngluproser

485490495

asnpheileargglysergluaspglycysproasnasngluleuglu

500505510

asnproprotyrvalproglyvalvalglyglythrleuglnalaala

515520525

thrilecysalaserserhisglnpheleuserthrhistyrasnleu

530535540

hisasnleutyrglyleuthrglualailealaserhisargalaleu

545550555560

vallysalaargglythrargprophevalileserargserthrphe

565570575

alaglyhisglyargtyralaglyhistrpthrglyaspvaltrpser

580585590

sertrpgluglnleualaserservalprogluileleuglnpheasn

595600605

leuleuglyvalproleuvalglyalaaspvalcysglypheleugly

610615620

asnthrserglugluleucysvalargtrpthrglnleuglyalaphe

625630635640

tyrprophemetargasnhisasnserleuleuserleuproglnglu

645650655

protyrserphesergluproalaglnglnalametarglysalaleu

660665670

thrleuargtyralaleuleuprohisleutyrthrleuphehisgln

675680685

alahisvalalaglygluthrvalalaargproleupheleugluphe

690695700

prolysaspserserthrtrpthrvalasphisglnleuleutrpgly

705710715720

glualaleuleuilethrprovalleuglnalaglylysalagluval

725730735

thrglytyrpheproleuglythrtrptyraspleuglnthrvalpro

740745750

ileglualaleuglyserleuproproproproalaalaproargglu

755760765

proalailehissergluglyglntrpvalthrleuproalaproleu

770775780

aspthrileasnvalhisleuargalaglytyrileileproleugln

785790795800

glyproglyleuthrthrthrgluserargglnglnprometalaleu

805810815

alavalalaleuthrlysglyglyglualaargglygluleuphetrp

820825830

aspaspglygluserleugluvalleugluargglyalatyrthrgln

835840845

valilepheleualaargasnasnthrilevalasngluleuvalarg

850855860

valthrsergluglyalaglyleuglnleuglnlysvalthrvalleu

865870875880

glyvalalathralaproglnglnvalleuserasnglyvalproval

885890895

serasnphethrtyrserproaspthrlysvalleuaspilecysval

900905910

serleuleumetglygluglnpheleuvalsertrpcys

915920925

<210>37

<211>952

<212>prt

<213>智人

<400>37

metglyvalarghisproprocysserhisargleuleualavalcys

151015

alaleuvalserleualathralaalaleuleuglyhisileleuleu

202530

hisasppheleuleuvalproarggluleuserglyserserproval

354045

leuglugluthrhisproalahisglnglnglyalaserargprogly

505560

proargaspalaglnalahisproglyargproargalavalprothr

65707580

glncysaspvalproproasnserargpheaspcysalaproasplys

859095

alailethrglngluglncysglualaargglycyscystyrilepro

100105110

alalysglnglyleuglnglyalaglnmetglyglnprotrpcysphe

115120125

pheproprosertyrprosertyrlysleugluasnleuserserser

130135140

glumetglytyrthralathrleuthrargthrthrprothrphephe

145150155160

prolysaspileleuthrleuargleuaspvalmetmetgluthrglu

165170175

asnargleuhisphethrilelysaspproalaasnargargtyrglu

180185190

valproleugluthrproargvalhisserargalaproserproleu

195200205

tyrservalgluphesergluglupropheglyvalilevalhisarg

210215220

glnleuaspglyargvalleuleuasnthrthrvalalaproleuphe

225230235240

phealaaspglnpheleuglnleuserthrserleuproserglntyr

245250255

ilethrglyleualagluhisleuserproleumetleuserthrser

260265270

trpthrargilethrleutrpasnargaspleualaprothrprogly

275280285

alaasnleutyrglyserhisprophetyrleualaleugluaspgly

290295300

glyseralahisglyvalpheleuleuasnserasnalametaspval

305310315320

valleuglnproserproalaleusertrpargserthrglyglyile

325330335

leuaspvaltyrilepheleuglyprogluprolysservalvalgln

340345350

glntyrleuaspvalvalglytyrprophemetproprotyrtrpgly

355360365

leuglyphehisleucysargtrpglytyrserserthralailethr

370375380

argglnvalvalgluasnmetthrargalahispheproleuaspval

385390395400

glntrpasnaspleuasptyrmetaspserargargaspphethrphe

405410415

asnlysaspglypheargasppheproalametvalglngluleuhis

420425430

glnglyglyargargtyrmetmetilevalaspproalaileserser

435440445

serglyproalaglysertyrargprotyraspgluglyleuargarg

450455460

glyvalpheilethrasngluthrglyglnproleuileglylysval

465470475480

trpproglyserthralapheproaspphethrasnprothralaleu

485490495

alatrptrpgluaspmetvalalagluphehisaspglnvalprophe

500505510

aspglymettrpileaspmetasngluproserasnpheilearggly

515520525

sergluaspglycysproasnasngluleugluasnproprotyrval

530535540

proglyvalvalglyglythrleuglnalaalathrilecysalaser

545550555560

serhisglnpheleuserthrhistyrasnleuhisasnleutyrgly

565570575

leuthrglualailealaserhisargalaleuvallysalaarggly

580585590

thrargprophevalileserargserthrphealaglyhisglyarg

595600605

tyralaglyhistrpthrglyaspvaltrpsersertrpgluglnleu

610615620

alaserservalprogluileleuglnpheasnleuleuglyvalpro

625630635640

leuvalglyalaaspvalcysglypheleuglyasnthrsergluglu

645650655

leucysvalargtrpthrglnleuglyalaphetyrprophemetarg

660665670

asnhisasnserleuleuserleuproglngluprotyrserpheser

675680685

gluproalaglnglnalametarglysalaleuthrleuargtyrala

690695700

leuleuprohisleutyrthrleuphehisglnalahisvalalagly

705710715720

gluthrvalalaargproleupheleuglupheprolysaspserser

725730735

thrtrpthrvalasphisglnleuleutrpglyglualaleuleuile

740745750

thrprovalleuglnalaglylysalagluvalthrglytyrphepro

755760765

leuglythrtrptyraspleuglnthrvalproileglualaleugly

770775780

serleuproproproproalaalaproarggluproalailehisser

785790795800

gluglyglntrpvalthrleuproalaproleuaspthrileasnval

805810815

hisleuargalaglytyrileileproleuglnglyproglyleuthr

820825830

thrthrgluserargglnglnprometalaleualavalalaleuthr

835840845

lysglyglyglualaargglygluleuphetrpaspaspglygluser

850855860

leugluvalleugluargglyalatyrthrglnvalilepheleuala

865870875880

argasnasnthrilevalasngluleuvalargvalthrserglugly

885890895

alaglyleuglnleuglnlysvalthrvalleuglyvalalathrala

900905910

proglnglnvalleuserasnglyvalprovalserasnphethrtyr

915920925

serproaspthrlysvalleuaspilecysvalserleuleumetgly

930935940

gluglnpheleuvalsertrpcys

945950

<210>38

<211>952

<212>prt

<213>智人

<400>38

metglyvalarghisproprocysserhisargleuleualavalcys

151015

alaleuvalserleualathralaalaleuleuglyhisileleuleu

202530

hisasppheleuleuvalproarggluleuserglyserserproval

354045

leuglugluthrhisproalahisglnglnglyalaserargprogly

505560

proargaspalaglnalahisproglyargproargalavalprothr

65707580

glncysaspvalproproasnserargpheaspcysalaproasplys

859095

alailethrglngluglncysglualaargglycyscystyrilepro

100105110

alalysglnglyleuglnglyalaglnmetglyglnprotrpcysphe

115120125

pheproprosertyrprosertyrlysleugluasnleuserserser

130135140

glumetglytyrthralathrleuthrargthrthrprothrphephe

145150155160

prolysaspileleuthrleuargleuaspvalmetmetgluthrglu

165170175

asnargleuhisphethrilelysaspproalaasnargargtyrglu

180185190

valproleugluthrprohisvalhisserargalaproserproleu

195200205

tyrservalgluphesergluglupropheglyvalilevalargarg

210215220

glnleuaspglyargvalleuleuasnthrthrvalalaproleuphe

225230235240

phealaaspglnpheleuglnleuserthrserleuproserglntyr

245250255

ilethrglyleualagluhisleuserproleumetleuserthrser

260265270

trpthrargilethrleutrpasnargaspleualaprothrprogly

275280285

alaasnleutyrglyserhisprophetyrleualaleugluaspgly

290295300

glyseralahisglyvalpheleuleuasnserasnalametaspval

305310315320

valleuglnproserproalaleusertrpargserthrglyglyile

325330335

leuaspvaltyrilepheleuglyprogluprolysservalvalgln

340345350

glntyrleuaspvalvalglytyrprophemetproprotyrtrpgly

355360365

leuglyphehisleucysargtrpglytyrserserthralailethr

370375380

argglnvalvalgluasnmetthrargalahispheproleuaspval

385390395400

glntrpasnaspleuasptyrmetaspserargargaspphethrphe

405410415

asnlysaspglypheargasppheproalametvalglngluleuhis

420425430

glnglyglyargargtyrmetmetilevalaspproalaileserser

435440445

serglyproalaglysertyrargprotyraspgluglyleuargarg

450455460

glyvalpheilethrasngluthrglyglnproleuileglylysval

465470475480

trpproglyserthralapheproaspphethrasnprothralaleu

485490495

alatrptrpgluaspmetvalalagluphehisaspglnvalprophe

500505510

aspglymettrpileaspmetasngluproserasnpheilearggly

515520525

sergluaspglycysproasnasngluleugluasnproprotyrval

530535540

proglyvalvalglyglythrleuglnalaalathrilecysalaser

545550555560

serhisglnpheleuserthrhistyrasnleuhisasnleutyrgly

565570575

leuthrglualailealaserhisargalaleuvallysalaarggly

580585590

thrargprophevalileserargserthrphealaglyhisglyarg

595600605

tyralaglyhistrpthrglyaspvaltrpsersertrpgluglnleu

610615620

alaserservalprogluileleuglnpheasnleuleuglyvalpro

625630635640

leuvalglyalaaspvalcysglypheleuglyasnthrsergluglu

645650655

leucysvalargtrpthrglnleuglyalaphetyrprophemetarg

660665670

asnhisasnserleuleuserleuproglngluprotyrserpheser

675680685

gluproalaglnglnalametarglysalaleuthrleuargtyrala

690695700

leuleuprohisleutyrthrleuphehisglnalahisvalalagly

705710715720

gluthrvalalaargproleupheleuglupheprolysaspserser

725730735

thrtrpthrvalasphisglnleuleutrpglyglualaleuleuile

740745750

thrprovalleuglnalaglylysalagluvalthrglytyrphepro

755760765

leuglythrtrptyraspleuglnthrvalproileglualaleugly

770775780

serleuproproproproalaalaproarggluproalailehisser

785790795800

gluglyglntrpvalthrleuproalaproleuaspthrileasnval

805810815

hisleuargalaglytyrileileproleuglnglyproglyleuthr

820825830

thrthrgluserargglnglnprometalaleualavalalaleuthr

835840845

lysglyglyglualaargglygluleuphetrpaspaspglygluser

850855860

leugluvalleugluargglyalatyrthrglnvalilepheleuala

865870875880

argasnasnthrilevalasngluleuvalargvalthrserglugly

885890895

alaglyleuglnleuglnlysvalthrvalleuglyvalalathrala

900905910

proglnglnvalleuserasnglyvalprovalserasnphethrtyr

915920925

serproaspthrlysvalleuaspilecysvalserleuleumetgly

930935940

gluglnpheleuvalsertrpcys

945950

<210>39

<211>957

<212>prt

<213>智人

<400>39

metglyvalarghisproprocysserhisargleuleualavalcys

151015

alaleuvalserleualathralaalaleuleuglyhisileleuleu

202530

hisasppheleuleuvalproarggluleuserglyserserproval

354045

leuglugluthrhisproalahisglnglnglyalaserargprogly

505560

proargaspalaglnalahisproglyargproargalavalprothr

65707580

glncysaspvalproproasnserargpheaspcysalaproasplys

859095

alailethrglngluglncysglualaargglycyscystyrilepro

100105110

alalysglnglyleuglnglyalaglnmetglyglnprotrpcysphe

115120125

pheproprosertyrprosertyrlysleugluasnleuserserser

130135140

glumetglytyrthralathrleuthrargthrthrprothrphephe

145150155160

prolysaspileleuthrleuargleuaspvalmetmetgluthrglu

165170175

asnargleuhisphethrilelysaspproalaasnargargtyrglu

180185190

valproleugluthrprohisvalhisserargalaproserproleu

195200205

tyrservalgluphesergluglupropheglyvalilevalargarg

210215220

glnleuaspglyargvalleuleuasnthrthrvalalaproleuphe

225230235240

phealaaspglnpheleuglnleuserthrserleuproserglntyr

245250255

ilethrglyleualagluhisleuserproleumetleuserthrser

260265270

trpthrargilethrleutrpasnargaspleualaprothrprogly

275280285

alaasnleutyrglyserhisprophetyrleualaleugluaspgly

290295300

glyseralahisglyvalpheleuleuasnserasnalametaspval

305310315320

valleuglnproserproalaleusertrpargserthrglyglyile

325330335

leuaspvaltyrilepheleuglyprogluprolysservalvalgln

340345350

glntyrleuaspvalvalglytyrprophemetproprotyrtrpgly

355360365

leuglyphehisleucysargtrpglytyrserserthralailethr

370375380

argglnvalvalgluasnmetthrargalahispheproleuaspval

385390395400

glntrpasnaspleuasptyrmetaspserargargaspphethrphe

405410415

asnlysaspglypheargasppheproalametvalglngluleuhis

420425430

glnglyglyargargtyrmetmetilevalaspproalaileserser

435440445

serglyproalaglysertyrargprotyraspgluglyleuargarg

450455460

glyvalpheilethrasngluthrglyglnproleuileglylysval

465470475480

trpproglyserthralapheproaspphethrasnprothralaleu

485490495

alatrptrpgluaspmetvalalagluphehisaspglnvalprophe

500505510

aspglymettrpileaspmetasngluproserasnpheilearggly

515520525

sergluaspglycysproasnasngluleugluasnproprotyrval

530535540

proglyvalvalglyglythrleuglnalaalathrilecysalaser

545550555560

serhisglnpheleuserthrhistyrasnleuhisasnleutyrgly

565570575

leuthrglualailealaserhisargalaleuvallysalaarggly

580585590

thrargprophevalileserargserthrphealaglyhisglyarg

595600605

tyralaglyhistrpthrglyaspvaltrpsersertrpgluglnleu

610615620

alaserservalprogluileleuglnpheasnleuleuglyvalpro

625630635640

leuvalglyalaaspvalcysglypheleuglyasnthrsergluglu

645650655

leucysvalargtrpthrglnleuglyalaphetyrprophemetarg

660665670

asnhisasnserleuleuserleuproglngluprotyrserpheser

675680685

gluproalaglnglnalametarglysalaleuthrleuargtyrala

690695700

leuleuprohisleutyrthrleuphehisglnalahisvalalagly

705710715720

gluthrvalalaargproleupheleuglupheprolysaspserser

725730735

thrtrpthrvalasphisglnleuleutrpglyglualaleuleuile

740745750

thrprovalleuglnalaglylysalagluvalthrglytyrphepro

755760765

leuglythrtrptyraspleuglnthrvalproileglualaleugly

770775780

serleuproproproproalaalaproarggluproalailehisser

785790795800

gluglyglntrpvalthrleuproalaproleuaspthrileasnval

805810815

hisleuargalaglytyrileileproleuglnglyproglyleuthr

820825830

thrthrgluserargglnglnprometalaleualavalalaleuthr

835840845

lysglyglyglualaargglygluleuphetrpaspaspglygluser

850855860

leugluvalleugluargglyalatyrthrglnvalilepheleuala

865870875880

argasnasnthrilevalasngluleuvalargvalthrserglugly

885890895

alaglyleuglnleuglnlysvalthrvalleuglyvalalathrala

900905910

proglnglnvalleuserasnglyvalprovalserasnphethrtyr

915920925

serproaspthrlysalaargglyproargvalleuaspilecysval

930935940

serleuleumetglygluglnpheleuvalsertrpcys

945950955

<210>40

<211>952

<212>prt

<213>智人

<400>40

metglyvalarghisproprocysserhisargleuleualavalcys

151015

alaleuvalserleualathralaalaleuleuglyhisileleuleu

202530

hisasppheleuleuvalproarggluleuserglyserserproval

354045

leuglugluthrhisproalahisglnglnglyalaserargprogly

505560

proargaspalaglnalahisproglyargproargalavalprothr

65707580

glncysaspvalproproasnserargpheaspcysalaproasplys

859095

alailethrglngluglncysglualaargglycyscystyrilepro

100105110

alalysglnglyleuglnglyalaglnmetglyglnprotrpcysphe

115120125

pheproprosertyrprosertyrlysleugluasnleuserserser

130135140

glumetglytyrthralathrleuthrargthrthrprothrphephe

145150155160

prolysaspileleuthrleuargleuaspvalmetmetgluthrglu

165170175

asnargleuhisphethrilelysaspproalaasnargargtyrglu

180185190

valproleugluthrproargvalhisserargalaproserproleu

195200205

tyrservalgluphesergluglupropheglyvalilevalhisarg

210215220

glnleuaspglyargvalleuleuasnthrthrvalalaproleuphe

225230235240

phealaaspglnpheleuglnleuserthrserleuproserglntyr

245250255

ilethrglyleualagluhisleuserproleumetleuserthrser

260265270

trpthrargilethrleutrpasnargaspleualaprothrprogly

275280285

alaasnleutyrglyserhisprophetyrleualaleugluaspgly

290295300

glyseralahisglyvalpheleuleuasnserasnalametaspval

305310315320

valleuglnproserproalaleusertrpargserthrglyglyile

325330335

leuaspvaltyrilepheleuglyprogluprolysservalvalgln

340345350

glntyrleuaspvalvalglytyrprophemetproprotyrtrpgly

355360365

leuglyphehisleucysargtrpglytyrserserthralailethr

370375380

argglnvalvalgluasnmetthrargalahispheproleuaspval

385390395400

glntrpasnaspleuasptyrmetaspserargargaspphethrphe

405410415

asnlysaspglypheargasppheproalametvalglngluleuhis

420425430

glnglyglyargargtyrmetmetilevalaspproalaileserser

435440445

serglyproalaglysertyrargleutyraspgluglyleuargarg

450455460

glyvalpheilethrasngluthrglyglnproleuileglylysval

465470475480

trpproglyserthralapheproaspphethrasnprothralaleu

485490495

alatrptrpgluaspmetvalalagluphehisaspglnvalprophe

500505510

aspglymettrpileaspmetasngluproserasnpheilearggly

515520525

sergluaspglycysproasnasngluleugluasnproprotyrval

530535540

proglyvalvalglyglythrleuglnalaalathrilecysalaser

545550555560

serhisglnpheleuserthrhistyrasnleuhisasnleutyrgly

565570575

leuthrglualailealaserhisargalaleuvallysalaarggly

580585590

thrargprophevalileserargserthrphealaglyhisglyarg

595600605

tyralaglyhistrpthrglyaspvaltrpsersertrpgluglnleu

610615620

alaserservalprogluileleuglnpheasnleuleuglyvalpro

625630635640

leuvalglyalaaspvalcysglypheleuglyasnthrsergluglu

645650655

leucysvalargtrpthrglnleuglyalaphetyrprophemetarg

660665670

asnhisasnserleuleuserleuproglngluprotyrserpheser

675680685

gluproalaglnglnalametarglysalaleuthrleuargtyrala

690695700

leuleuprohisleutyrthrleuphehisglnalahisvalalagly

705710715720

gluthrvalalaargproleupheleuglupheprolysaspserser

725730735

thrtrpthrvalasphisglnleuleutrpglyglualaleuleuile

740745750

thrprovalleuglnalaglylysalagluvalthrglytyrphepro

755760765

leuglythrtrptyraspleuglnthrvalproileglualaleugly

770775780

serleuproproproproalaalaproarggluproalailehisser

785790795800

gluglyglntrpvalthrleuproalaproleuaspthrileasnval

805810815

hisleuargalaglytyrileileproleuglnglyproglyleuthr

820825830

thrthrgluserargglnglnprometalaleualavalalaleuthr

835840845

lysglyglyglualaargglygluleuphetrpaspaspglygluser

850855860

leugluvalleugluargglyalatyrthrglnvalilepheleuala

865870875880

argasnasnthrilevalasngluleuvalargvalthrserglugly

885890895

alaglyleuglnleuglnlysvalthrvalleuglyvalalathrala

900905910

proglnglnvalleuserasnglyvalprovalserasnphethrtyr

915920925

serproaspthrlysvalleuaspilecysvalserleuleumetgly

930935940

gluglnpheleuvalsertrpcys

945950

<210>41

<211>896

<212>prt

<213>人工序列

<220>

<223>hgaa-δ-29

<400>41

glnglnglyalaserargproglyproargaspalaglnalahispro

151015

glyargproargalavalprothrglncysaspvalproproasnser

202530

argpheaspcysalaproasplysalailethrglngluglncysglu

354045

alaargglycyscystyrileproalalysglnglyleuglnglyala

505560

glnmetglyglnprotrpcysphepheproprosertyrprosertyr

65707580

lysleugluasnleuserserserglumetglytyrthralathrleu

859095

thrargthrthrprothrphepheprolysaspileleuthrleuarg

100105110

leuaspvalmetmetgluthrgluasnargleuhisphethrilelys

115120125

aspproalaasnargargtyrgluvalproleugluthrprohisval

130135140

hisserargalaproserproleutyrservalgluphesergluglu

145150155160

propheglyvalilevalargargglnleuaspglyargvalleuleu

165170175

asnthrthrvalalaproleuphephealaaspglnpheleuglnleu

180185190

serthrserleuproserglntyrilethrglyleualagluhisleu

195200205

serproleumetleuserthrsertrpthrargilethrleutrpasn

210215220

argaspleualaprothrproglyalaasnleutyrglyserhispro

225230235240

phetyrleualaleugluaspglyglyseralahisglyvalpheleu

245250255

leuasnserasnalametaspvalvalleuglnproserproalaleu

260265270

sertrpargserthrglyglyileleuaspvaltyrilepheleugly

275280285

progluprolysservalvalglnglntyrleuaspvalvalglytyr

290295300

prophemetproprotyrtrpglyleuglyphehisleucysargtrp

305310315320

glytyrserserthralailethrargglnvalvalgluasnmetthr

325330335

argalahispheproleuaspvalglntrpasnaspleuasptyrmet

340345350

aspserargargaspphethrpheasnlysaspglypheargaspphe

355360365

proalametvalglngluleuhisglnglyglyargargtyrmetmet

370375380

ilevalaspproalaileserserserglyproalaglysertyrarg

385390395400

protyraspgluglyleuargargglyvalpheilethrasngluthr

405410415

glyglnproleuileglylysvaltrpproglyserthralaphepro

420425430

aspphethrasnprothralaleualatrptrpgluaspmetvalala

435440445

gluphehisaspglnvalpropheaspglymettrpileaspmetasn

450455460

gluproserasnpheileargglysergluaspglycysproasnasn

465470475480

gluleugluasnproprotyrvalproglyvalvalglyglythrleu

485490495

glnalaalathrilecysalaserserhisglnpheleuserthrhis

500505510

tyrasnleuhisasnleutyrglyleuthrglualailealaserhis

515520525

argalaleuvallysalaargglythrargprophevalileserarg

530535540

serthrphealaglyhisglyargtyralaglyhistrpthrglyasp

545550555560

valtrpsersertrpgluglnleualaserservalprogluileleu

565570575

glnpheasnleuleuglyvalproleuvalglyalaaspvalcysgly

580585590

pheleuglyasnthrserglugluleucysvalargtrpthrglnleu

595600605

glyalaphetyrprophemetargasnhisasnserleuleuserleu

610615620

proglngluprotyrserphesergluproalaglnglnalametarg

625630635640

lysalaleuthrleuargtyralaleuleuprohisleutyrthrleu

645650655

phehisglnalahisvalalaglygluthrvalalaargproleuphe

660665670

leuglupheprolysaspserserthrtrpthrvalasphisglnleu

675680685

leutrpglyglualaleuleuilethrprovalleuglnalaglylys

690695700

alagluvalthrglytyrpheproleuglythrtrptyraspleugln

705710715720

thrvalprovalglualaleuglyserleuproproproproalaala

725730735

proarggluproalailehissergluglyglntrpvalthrleupro

740745750

alaproleuaspthrileasnvalhisleuargalaglytyrileile

755760765

proleuglnglyproglyleuthrthrthrgluserargglnglnpro

770775780

metalaleualavalalaleuthrlysglyglyglualaargglyglu

785790795800

leuphetrpaspaspglygluserleugluvalleugluargglyala

805810815

tyrthrglnvalilepheleualaargasnasnthrilevalasnglu

820825830

leuvalargvalthrsergluglyalaglyleuglnleuglnlysval

835840845

thrvalleuglyvalalathralaproglnglnvalleuserasngly

850855860

valprovalserasnphethrtyrserproaspthrlysvalleuasp

865870875880

ilecysvalserleuleumetglygluglnpheleuvalsertrpcys

885890895

<210>42

<211>882

<212>prt

<213>人工序列

<220>

<223>hgaa-δ-43

<400>42

hisproglyargproargalavalprothrglncysaspvalpropro

151015

asnserargpheaspcysalaproasplysalailethrglnglugln

202530

cysglualaargglycyscystyrileproalalysglnglyleugln

354045

glyalaglnmetglyglnprotrpcysphepheproprosertyrpro

505560

sertyrlysleugluasnleuserserserglumetglytyrthrala

65707580

thrleuthrargthrthrprothrphepheprolysaspileleuthr

859095

leuargleuaspvalmetmetgluthrgluasnargleuhisphethr

100105110

ilelysaspproalaasnargargtyrgluvalproleugluthrpro

115120125

hisvalhisserargalaproserproleutyrservalglupheser

130135140

gluglupropheglyvalilevalargargglnleuaspglyargval

145150155160

leuleuasnthrthrvalalaproleuphephealaaspglnpheleu

165170175

glnleuserthrserleuproserglntyrilethrglyleualaglu

180185190

hisleuserproleumetleuserthrsertrpthrargilethrleu

195200205

trpasnargaspleualaprothrproglyalaasnleutyrglyser

210215220

hisprophetyrleualaleugluaspglyglyseralahisglyval

225230235240

pheleuleuasnserasnalametaspvalvalleuglnproserpro

245250255

alaleusertrpargserthrglyglyileleuaspvaltyrilephe

260265270

leuglyprogluprolysservalvalglnglntyrleuaspvalval

275280285

glytyrprophemetproprotyrtrpglyleuglyphehisleucys

290295300

argtrpglytyrserserthralailethrargglnvalvalgluasn

305310315320

metthrargalahispheproleuaspvalglntrpasnaspleuasp

325330335

tyrmetaspserargargaspphethrpheasnlysaspglyphearg

340345350

asppheproalametvalglngluleuhisglnglyglyargargtyr

355360365

metmetilevalaspproalaileserserserglyproalaglyser

370375380

tyrargprotyraspgluglyleuargargglyvalpheilethrasn

385390395400

gluthrglyglnproleuileglylysvaltrpproglyserthrala

405410415

pheproaspphethrasnprothralaleualatrptrpgluaspmet

420425430

valalagluphehisaspglnvalpropheaspglymettrpileasp

435440445

metasngluproserasnpheileargglysergluaspglycyspro

450455460

asnasngluleugluasnproprotyrvalproglyvalvalglygly

465470475480

thrleuglnalaalathrilecysalaserserhisglnpheleuser

485490495

thrhistyrasnleuhisasnleutyrglyleuthrglualaileala

500505510

serhisargalaleuvallysalaargglythrargprophevalile

515520525

serargserthrphealaglyhisglyargtyralaglyhistrpthr

530535540

glyaspvaltrpsersertrpgluglnleualaserservalproglu

545550555560

ileleuglnpheasnleuleuglyvalproleuvalglyalaaspval

565570575

cysglypheleuglyasnthrserglugluleucysvalargtrpthr

580585590

glnleuglyalaphetyrprophemetargasnhisasnserleuleu

595600605

serleuproglngluprotyrserphesergluproalaglnglnala

610615620

metarglysalaleuthrleuargtyralaleuleuprohisleutyr

625630635640

thrleuphehisglnalahisvalalaglygluthrvalalaargpro

645650655

leupheleuglupheprolysaspserserthrtrpthrvalasphis

660665670

glnleuleutrpglyglualaleuleuilethrprovalleuglnala

675680685

glylysalagluvalthrglytyrpheproleuglythrtrptyrasp

690695700

leuglnthrvalprovalglualaleuglyserleupropropropro

705710715720

alaalaproarggluproalailehissergluglyglntrpvalthr

725730735

leuproalaproleuaspthrileasnvalhisleuargalaglytyr

740745750

ileileproleuglnglyproglyleuthrthrthrgluserarggln

755760765

glnprometalaleualavalalaleuthrlysglyglyglualaarg

770775780

glygluleuphetrpaspaspglygluserleugluvalleugluarg

785790795800

glyalatyrthrglnvalilepheleualaargasnasnthrileval

805810815

asngluleuvalargvalthrsergluglyalaglyleuglnleugln

820825830

lysvalthrvalleuglyvalalathralaproglnglnvalleuser

835840845

asnglyvalprovalserasnphethrtyrserproaspthrlysval

850855860

leuaspilecysvalserleuleumetglygluglnpheleuvalser

865870875880

trpcys

<210>43

<211>878

<212>prt

<213>人工序列

<220>

<223>hgaa-δ-47

<400>43

proargalavalprothrglncysaspvalproproasnserargphe

151015

aspcysalaproasplysalailethrglngluglncysglualaarg

202530

glycyscystyrileproalalysglnglyleuglnglyalaglnmet

354045

glyglnprotrpcysphepheproprosertyrprosertyrlysleu

505560

gluasnleuserserserglumetglytyrthralathrleuthrarg

65707580

thrthrprothrphepheprolysaspileleuthrleuargleuasp

859095

valmetmetgluthrgluasnargleuhisphethrilelysasppro

100105110

alaasnargargtyrgluvalproleugluthrprohisvalhisser

115120125

argalaproserproleutyrservalglupheserglugluprophe

130135140

glyvalilevalargargglnleuaspglyargvalleuleuasnthr

145150155160

thrvalalaproleuphephealaaspglnpheleuglnleuserthr

165170175

serleuproserglntyrilethrglyleualagluhisleuserpro

180185190

leumetleuserthrsertrpthrargilethrleutrpasnargasp

195200205

leualaprothrproglyalaasnleutyrglyserhisprophetyr

210215220

leualaleugluaspglyglyseralahisglyvalpheleuleuasn

225230235240

serasnalametaspvalvalleuglnproserproalaleusertrp

245250255

argserthrglyglyileleuaspvaltyrilepheleuglyproglu

260265270

prolysservalvalglnglntyrleuaspvalvalglytyrprophe

275280285

metproprotyrtrpglyleuglyphehisleucysargtrpglytyr

290295300

serserthralailethrargglnvalvalgluasnmetthrargala

305310315320

hispheproleuaspvalglntrpasnaspleuasptyrmetaspser

325330335

argargaspphethrpheasnlysaspglypheargasppheproala

340345350

metvalglngluleuhisglnglyglyargargtyrmetmetileval

355360365

aspproalaileserserserglyproalaglysertyrargprotyr

370375380

aspgluglyleuargargglyvalpheilethrasngluthrglygln

385390395400

proleuileglylysvaltrpproglyserthralapheproaspphe

405410415

thrasnprothralaleualatrptrpgluaspmetvalalagluphe

420425430

hisaspglnvalpropheaspglymettrpileaspmetasnglupro

435440445

serasnpheileargglysergluaspglycysproasnasngluleu

450455460

gluasnproprotyrvalproglyvalvalglyglythrleuglnala

465470475480

alathrilecysalaserserhisglnpheleuserthrhistyrasn

485490495

leuhisasnleutyrglyleuthrglualailealaserhisargala

500505510

leuvallysalaargglythrargprophevalileserargserthr

515520525

phealaglyhisglyargtyralaglyhistrpthrglyaspvaltrp

530535540

sersertrpgluglnleualaserservalprogluileleuglnphe

545550555560

asnleuleuglyvalproleuvalglyalaaspvalcysglypheleu

565570575

glyasnthrserglugluleucysvalargtrpthrglnleuglyala

580585590

phetyrprophemetargasnhisasnserleuleuserleuprogln

595600605

gluprotyrserphesergluproalaglnglnalametarglysala

610615620

leuthrleuargtyralaleuleuprohisleutyrthrleuphehis

625630635640

glnalahisvalalaglygluthrvalalaargproleupheleuglu

645650655

pheprolysaspserserthrtrpthrvalasphisglnleuleutrp

660665670

glyglualaleuleuilethrprovalleuglnalaglylysalaglu

675680685

valthrglytyrpheproleuglythrtrptyraspleuglnthrval

690695700

provalglualaleuglyserleuproproproproalaalaproarg

705710715720

gluproalailehissergluglyglntrpvalthrleuproalapro

725730735

leuaspthrileasnvalhisleuargalaglytyrileileproleu

740745750

glnglyproglyleuthrthrthrgluserargglnglnprometala

755760765

leualavalalaleuthrlysglyglyglualaargglygluleuphe

770775780

trpaspaspglygluserleugluvalleugluargglyalatyrthr

785790795800

glnvalilepheleualaargasnasnthrilevalasngluleuval

805810815

argvalthrsergluglyalaglyleuglnleuglnlysvalthrval

820825830

leuglyvalalathralaproglnglnvalleuserasnglyvalpro

835840845

valserasnphethrtyrserproaspthrlysvalleuaspilecys

850855860

valserleuleumetglygluglnpheleuvalsertrpcys

865870875

<210>44

<211>2754

<212>dna

<213>人工序列

<220>

<223>hgaawt-δ-8

<400>44

ctgctggttccccgagagctgagtggctcctccccagtcctggaggagactcacccagct60

caccagcagggagccagcagaccagggccccgggatgcccaggcacaccccgggcggccg120

cgagcagtgcccacacagtgcgacgtcccccccaacagccgcttcgattgcgcccctgac180

aaggccatcacccaggaacagtgcgaggcccgcggctgttgctacatccctgcaaagcag240

gggctgcagggagcccagatggggcagccctggtgcttcttcccacccagctaccccagc300

tacaagctggagaacctgagctcctctgaaatgggctacacggccaccctgacccgtacc360

acccccaccttcttccccaaggacatcctgaccctgcggctggacgtgatgatggagact420

gagaaccgcctccacttcacgatcaaagatccagctaacaggcgctacgaggtgcccttg480

gagaccccgcatgtccacagccgggcaccgtccccactctacagcgtggagttctccgag540

gagcccttcggggtgatcgtgcgccggcagctggacggccgcgtgctgctgaacacgacg600

gtggcgcccctgttctttgcggaccagttccttcagctgtccacctcgctgccctcgcag660

tatatcacaggcctcgccgagcacctcagtcccctgatgctcagcaccagctggaccagg720

atcaccctgtggaaccgggaccttgcgcccacgcccggtgcgaacctctacgggtctcac780

cctttctacctggcgctggaggacggcgggtcggcacacggggtgttcctgctaaacagc840

aatgccatggatgtggtcctgcagccgagccctgcccttagctggaggtcgacaggtggg900

atcctggatgtctacatcttcctgggcccagagcccaagagcgtggtgcagcagtacctg960

gacgttgtgggatacccgttcatgccgccatactggggcctgggcttccacctgtgccgc1020

tggggctactcctccaccgctatcacccgccaggtggtggagaacatgaccagggcccac1080

ttccccctggacgtccagtggaacgacctggactacatggactcccggagggacttcacg1140

ttcaacaaggatggcttccgggacttcccggccatggtgcaggagctgcaccagggcggc1200

cggcgctacatgatgatcgtggatcctgccatcagcagctcgggccctgccgggagctac1260

aggccctacgacgagggtctgcggaggggggttttcatcaccaacgagaccggccagccg1320

ctgattgggaaggtatggcccgggtccactgccttccccgacttcaccaaccccacagcc1380

ctggcctggtgggaggacatggtggctgagttccatgaccaggtgcccttcgacggcatg1440

tggattgacatgaacgagccttccaacttcatcaggggctctgaggacggctgccccaac1500

aatgagctggagaacccaccctacgtgcctggggtggttggggggaccctccaggcggcc1560

accatctgtgcctccagccaccagtttctctccacacactacaacctgcacaacctctac1620

ggcctgaccgaagccatcgcctcccacagggcgctggtgaaggctcgggggacacgccca1680

tttgtgatctcccgctcgacctttgctggccacggccgatacgccggccactggacgggg1740

gacgtgtggagctcctgggagcagctcgcctcctccgtgccagaaatcctgcagtttaac1800

ctgctgggggtgcctctggtcggggccgacgtctgcggcttcctgggcaacacctcagag1860

gagctgtgtgtgcgctggacccagctgggggccttctaccccttcatgcggaaccacaac1920

agcctgctcagtctgccccaggagccgtacagcttcagcgagccggcccagcaggccatg1980

aggaaggccctcaccctgcgctacgcactcctcccccacctctacacactgttccaccag2040

gcccacgtcgcgggggagaccgtggcccggcccctcttcctggagttccccaaggactct2100

agcacctggactgtggaccaccagctcctgtggggggaggccctgctcatcaccccagtg2160

ctccaggccgggaaggccgaagtgactggctacttccccttgggcacatggtacgacctg2220

cagacggtgccagtagaggcccttggcagcctcccacccccacctgcagctccccgtgag2280

ccagccatccacagcgaggggcagtgggtgacgctgccggcccccctggacaccatcaac2340

gtccacctccgggctgggtacatcatccccctgcagggccctggcctcacaaccacagag2400

tcccgccagcagcccatggccctggctgtggccctgaccaagggtggggaggcccgaggg2460

gagctgttctgggacgatggagagagcctggaagtgctggagcgaggggcctacacacag2520

gtcatcttcctggccaggaataacacgatcgtgaatgagctggtacgtgtgaccagtgag2580

ggagctggcctgcagctgcagaaggtgactgtcctgggcgtggccacggcgccccagcag2640

gtcctctccaacggtgtccctgtctccaacttcacctacagccccgacaccaaggtcctg2700

gacatctgtgtctcgctgttgatgggagagcagtttctcgtcagctggtgttag2754

<210>45

<211>2691

<212>dna

<213>人工序列

<220>

<223>hgaawt-δ-29

<400>45

cagcagggagccagcagaccagggccccgggatgcccaggcacaccccgggcggccgcga60

gcagtgcccacacagtgcgacgtcccccccaacagccgcttcgattgcgcccctgacaag120

gccatcacccaggaacagtgcgaggcccgcggctgttgctacatccctgcaaagcagggg180

ctgcagggagcccagatggggcagccctggtgcttcttcccacccagctaccccagctac240

aagctggagaacctgagctcctctgaaatgggctacacggccaccctgacccgtaccacc300

cccaccttcttccccaaggacatcctgaccctgcggctggacgtgatgatggagactgag360

aaccgcctccacttcacgatcaaagatccagctaacaggcgctacgaggtgcccttggag420

accccgcatgtccacagccgggcaccgtccccactctacagcgtggagttctccgaggag480

cccttcggggtgatcgtgcgccggcagctggacggccgcgtgctgctgaacacgacggtg540

gcgcccctgttctttgcggaccagttccttcagctgtccacctcgctgccctcgcagtat600

atcacaggcctcgccgagcacctcagtcccctgatgctcagcaccagctggaccaggatc660

accctgtggaaccgggaccttgcgcccacgcccggtgcgaacctctacgggtctcaccct720

ttctacctggcgctggaggacggcgggtcggcacacggggtgttcctgctaaacagcaat780

gccatggatgtggtcctgcagccgagccctgcccttagctggaggtcgacaggtgggatc840

ctggatgtctacatcttcctgggcccagagcccaagagcgtggtgcagcagtacctggac900

gttgtgggatacccgttcatgccgccatactggggcctgggcttccacctgtgccgctgg960

ggctactcctccaccgctatcacccgccaggtggtggagaacatgaccagggcccacttc1020

cccctggacgtccagtggaacgacctggactacatggactcccggagggacttcacgttc1080

aacaaggatggcttccgggacttcccggccatggtgcaggagctgcaccagggcggccgg1140

cgctacatgatgatcgtggatcctgccatcagcagctcgggccctgccgggagctacagg1200

ccctacgacgagggtctgcggaggggggttttcatcaccaacgagaccggccagccgctg1260

attgggaaggtatggcccgggtccactgccttccccgacttcaccaaccccacagccctg1320

gcctggtgggaggacatggtggctgagttccatgaccaggtgcccttcgacggcatgtgg1380

attgacatgaacgagccttccaacttcatcaggggctctgaggacggctgccccaacaat1440

gagctggagaacccaccctacgtgcctggggtggttggggggaccctccaggcggccacc1500

atctgtgcctccagccaccagtttctctccacacactacaacctgcacaacctctacggc1560

ctgaccgaagccatcgcctcccacagggcgctggtgaaggctcgggggacacgcccattt1620

gtgatctcccgctcgacctttgctggccacggccgatacgccggccactggacgggggac1680

gtgtggagctcctgggagcagctcgcctcctccgtgccagaaatcctgcagtttaacctg1740

ctgggggtgcctctggtcggggccgacgtctgcggcttcctgggcaacacctcagaggag1800

ctgtgtgtgcgctggacccagctgggggccttctaccccttcatgcggaaccacaacagc1860

ctgctcagtctgccccaggagccgtacagcttcagcgagccggcccagcaggccatgagg1920

aaggccctcaccctgcgctacgcactcctcccccacctctacacactgttccaccaggcc1980

cacgtcgcgggggagaccgtggcccggcccctcttcctggagttccccaaggactctagc2040

acctggactgtggaccaccagctcctgtggggggaggccctgctcatcaccccagtgctc2100

caggccgggaaggccgaagtgactggctacttccccttgggcacatggtacgacctgcag2160

acggtgccagtagaggcccttggcagcctcccacccccacctgcagctccccgtgagcca2220

gccatccacagcgaggggcagtgggtgacgctgccggcccccctggacaccatcaacgtc2280

cacctccgggctgggtacatcatccccctgcagggccctggcctcacaaccacagagtcc2340

cgccagcagcccatggccctggctgtggccctgaccaagggtggggaggcccgaggggag2400

ctgttctgggacgatggagagagcctggaagtgctggagcgaggggcctacacacaggtc2460

atcttcctggccaggaataacacgatcgtgaatgagctggtacgtgtgaccagtgaggga2520

gctggcctgcagctgcagaaggtgactgtcctgggcgtggccacggcgccccagcaggtc2580

ctctccaacggtgtccctgtctccaacttcacctacagccccgacaccaaggtcctggac2640

atctgtgtctcgctgttgatgggagagcagtttctcgtcagctggtgttag2691

<210>46

<211>2691

<212>dna

<213>人工序列

<220>

<223>hgaaco1-δ-29

<400>46

cagcagggcgcctctagacctggacctagagatgcccaggcccaccccggcagacctaga60

gctgtgcctacccagtgtgacgtgccccccaacagcagattcgactgcgcccctgacaag120

gccatcacccaggaacagtgcgaggccagaggctgctgctacatccctgccaagcaggga180

ctgcagggcgctcagatgggacagccctggtgcttcttcccaccctcctaccccagctac240

aagctggaaaacctgagcagcagcgagatgggctacaccgccaccctgaccagaaccacc300

cccacattcttcccaaaggacatcctgaccctgcggctggacgtgatgatggaaaccgag360

aaccggctgcacttcaccatcaaggaccccgccaatcggagatacgaggtgcccctggaa420

accccccacgtgcactctagagcccccagccctctgtacagcgtggaattcagcgaggaa480

cccttcggcgtgatcgtgcggagacagctggatggcagagtgctgctgaacaccaccgtg540

gcccctctgttcttcgccgaccagttcctgcagctgagcaccagcctgcccagccagtac600

atcacaggactggccgagcacctgagccccctgatgctgagcacatcctggacccggatc660

accctgtggaacagggatctggcccctacccctggcgccaatctgtacggcagccaccct720

ttctacctggccctggaagatggcggatctgcccacggagtgtttctgctgaactccaac780

gccatggacgtggtgctgcagcctagccctgccctgtcttggagaagcacaggcggcatc840

ctggatgtgtacatctttctgggccccgagcccaagagcgtggtgcagcagtatctggat900

gtcgtgggctaccccttcatgcccccttactggggcctgggattccacctgtgcagatgg960

ggctactccagcaccgccatcaccagacaggtggtggaaaacatgaccagagcccacttc1020

ccactggatgtgcagtggaacgacctggactacatggacagcagacgggacttcaccttc1080

aacaaggacggcttccgggacttccccgccatggtgcaggaactgcatcagggcggcaga1140

cggtacatgatgatcgtggatcccgccatcagctcctctggccctgccggctcttacaga1200

ccctacgacgagggcctgcggagaggcgtgttcatcaccaacgagacaggccagcccctg1260

atcggcaaagtgtggcctggcagcacagccttccccgacttcaccaatcctaccgccctg1320

gcttggtgggaggacatggtggccgagttccacgaccaggtgcccttcgacggcatgtgg1380

atcgacatgaacgagcccagcaacttcatccggggcagcgaggatggctgccccaacaac1440

gaactggaaaatcccccttacgtgcccggcgtcgtgggcggaacactgcaggccgctaca1500

atctgtgccagcagccaccagtttctgagcacccactacaacctgcacaacctgtacggc1560

ctgaccgaggccattgccagccaccgcgctctcgtgaaagccagaggcacacggcccttc1620

gtgatcagcagaagcacctttgccggccacggcagatacgccggacattggactggcgac1680

gtgtggtcctcttgggagcagctggcctctagcgtgcccgagatcctgcagttcaatctg1740

ctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctgggcaacacctccgaggaa1800

ctgtgtgtgcggtggacacagctgggcgccttctaccctttcatgagaaaccacaacagc1860

ctgctgagcctgccccaggaaccctacagctttagcgagcctgcacagcaggccatgcgg1920

aaggccctgacactgagatacgctctgctgccccacctgtacaccctgtttcaccaggcc1980

catgtggccggcgagacagtggccagacctctgtttctggaattccccaaggacagcagc2040

acctggaccgtggaccatcagctgctgtggggagaggctctgctgattaccccagtgctg2100

caggcaggcaaggccgaagtgaccggctactttcccctgggcacttggtacgacctgcag2160

accgtgcctgtggaagccctgggatctctgcctccacctcctgccgctcctagagagcct2220

gccattcactctgagggccagtgggtcacactgcctgcccccctggataccatcaacgtg2280

cacctgagggccggctacatcataccactgcagggacctggcctgaccaccaccgagtct2340

agacagcagccaatggccctggccgtggccctgaccaaaggcggagaagctaggggcgag2400

ctgttctgggacgatggcgagagcctggaagtgctggaaagaggcgcctatacccaagtg2460

atcttcctggcccggaacaacaccatcgtgaacgagctggtgcgcgtgacctctgaaggc2520

gctggactgcagctgcagaaagtgaccgtgctgggagtggccacagcccctcagcaggtg2580

ctgtctaatggcgtgcccgtgtccaacttcacctacagccccgacaccaaggtgctggac2640

atctgcgtgtcactgctgatgggagagcagtttctggtgtcctggtgctga2691

<210>47

<211>2691

<212>dna

<213>人工序列

<220>

<223>hgaaco2-δ-29

<400>47

caacagggagcttccagaccaggaccgagagacgcccaagcccatcctggtagaccaaga60

gctgtgcctacccaatgcgacgtgccacccaactcccgattcgactgcgcgccagataag120

gctattacccaagagcagtgtgaagccagaggttgctgctacatcccagcgaagcaagga180

ttgcaaggcgcccaaatgggacaaccttggtgtttcttccccccttcgtacccatcatat240

aaactcgaaaacctgtcctcttcggaaatgggttatactgccaccctcaccagaactact300

cctactttcttcccgaaagacatcttgaccttgaggctggacgtgatgatggagactgaa360

aaccggctgcatttcactatcaaagatcctgccaatcggcgatacgaggtccctctggaa420

acccctcacgtgcactcacgggctccttctccgctttactccgtcgaattctctgaggaa480

cccttcggagtgatcgttagacgccagctggatggtagagtgctgttgaacactactgtg540

gccccacttttcttcgctgaccagtttctgcaactgtccacttccctgccatcccagtac600

attactggactcgccgaacacctgtcgccactgatgctctcgacctcttggactagaatc660

actttgtggaacagagacttggcccctactccgggagcaaatctgtacggaagccaccct720

ttttacctggcgctcgaagatggcggatccgctcacggagtgttcctgctgaatagcaac780

gcaatggacgtggtgctgcaaccttcccctgcactcagttggagaagtaccgggggtatt840

ctggacgtgtacatcttcctcggaccagaacccaagagcgtggtgcagcaatatctggac900

gtggtcggatacccttttatgcctccttactggggactgggattccacctttgccgttgg960

ggctactcatccaccgccattaccagacaggtggtggagaatatgaccagagcccacttc1020

cctctcgacgtgcagtggaacgatctggactatatggactcccggagagatttcaccttc1080

aacaaggacgggttccgcgattttcccgcgatggttcaagagctccaccagggtggtcga1140

agatatatgatgatcgtcgacccagccatttcgagcagcggacccgctggatcttataga1200

ccttacgacgaaggccttaggagaggagtgttcatcacaaacgagactggacagcctttg1260

atcggtaaagtgtggcctggatcaaccgcctttcctgactttaccaatcccactgccttg1320

gcttggtgggaggacatggtggccgaattccacgaccaagtcccctttgatggaatgtgg1380

atcgatatgaacgaaccaagcaattttatcagaggttccgaagacggttgccccaacaac1440

gaactggaaaaccctccttatgtgcccggagtcgtgggcggaacattacaggccgcgact1500

atttgcgccagcagccaccaattcctgtccactcactacaacctccacaacctttatgga1560

ttaaccgaagctattgcaagtcacagggctctggtgaaggctagagggactaggcccttt1620

gtgatctcccgatccacctttgccggacacgggagatacgccggtcactggactggtgac1680

gtgtggagctcatgggaacaactggcctcctccgtgccggaaatcttacagttcaacctt1740

ctgggtgtccctcttgtcggagcagacgtgtgtgggtttcttggtaacacctccgaggaa1800

ctgtgtgtgcgctggactcaactgggtgcattctacccattcatgagaaaccacaactcc1860

ttgctgtccctgccacaagagccctactcgttcagcgagcctgcacaacaggctatgcgg1920

aaggcactgaccctgagatacgccctgcttccacacttatacactctcttccatcaagcg1980

catgtggcaggagaaaccgttgcaaggcctcttttccttgaattccccaaggattcctcg2040

acttggacggtggatcatcagctgctgtggggagaagctctgctgattactccagtgttg2100

caagccggaaaagctgaggtgaccggatactttccgctgggaacctggtacgacctccag2160

actgtccctgttgaagcccttggatcactgcctccgcctccggcagctccacgcgaacca2220

gctatacattccgagggacagtgggttacattaccagctcctctggacacaatcaacgtc2280

cacttaagagctggctacattatccctctgcaaggaccaggactgactacgaccgagagc2340

agacagcagccaatggcactggctgtggctctgaccaagggaggggaagctagaggagaa2400

ctcttctgggatgatggggagtcccttgaagtgctggaaagaggcgcttacactcaagtc2460

attttccttgcacggaacaacaccattgtgaacgaattggtgcgagtgaccagcgaagga2520

gctggacttcaactgcagaaggtcactgtgctcggagtggctaccgctcctcagcaagtg2580

ctgtcgaatggagtccccgtgtcaaactttacctactcccctgacactaaggtgctcgac2640

atttgcgtgtccctcctgatgggagagcagttccttgtgtcctggtgttga2691

<210>48

<211>2652

<212>dna

<213>人工序列

<220>

<223>hgaawt-δ-42

<400>48

gcacaccccgggcggccgcgagcagtgcccacacagtgcgacgtcccccccaacagccgc60

ttcgattgcgcccctgacaaggccatcacccaggaacagtgcgaggcccgcggctgttgc120

tacatccctgcaaagcaggggctgcagggagcccagatggggcagccctggtgcttcttc180

ccacccagctaccccagctacaagctggagaacctgagctcctctgaaatgggctacacg240

gccaccctgacccgtaccacccccaccttcttccccaaggacatcctgaccctgcggctg300

gacgtgatgatggagactgagaaccgcctccacttcacgatcaaagatccagctaacagg360

cgctacgaggtgcccttggagaccccgcatgtccacagccgggcaccgtccccactctac420

agcgtggagttctccgaggagcccttcggggtgatcgtgcgccggcagctggacggccgc480

gtgctgctgaacacgacggtggcgcccctgttctttgcggaccagttccttcagctgtcc540

acctcgctgccctcgcagtatatcacaggcctcgccgagcacctcagtcccctgatgctc600

agcaccagctggaccaggatcaccctgtggaaccgggaccttgcgcccacgcccggtgcg660

aacctctacgggtctcaccctttctacctggcgctggaggacggcgggtcggcacacggg720

gtgttcctgctaaacagcaatgccatggatgtggtcctgcagccgagccctgcccttagc780

tggaggtcgacaggtgggatcctggatgtctacatcttcctgggcccagagcccaagagc840

gtggtgcagcagtacctggacgttgtgggatacccgttcatgccgccatactggggcctg900

ggcttccacctgtgccgctggggctactcctccaccgctatcacccgccaggtggtggag960

aacatgaccagggcccacttccccctggacgtccagtggaacgacctggactacatggac1020

tcccggagggacttcacgttcaacaaggatggcttccgggacttcccggccatggtgcag1080

gagctgcaccagggcggccggcgctacatgatgatcgtggatcctgccatcagcagctcg1140

ggccctgccgggagctacaggccctacgacgagggtctgcggaggggggttttcatcacc1200

aacgagaccggccagccgctgattgggaaggtatggcccgggtccactgccttccccgac1260

ttcaccaaccccacagccctggcctggtgggaggacatggtggctgagttccatgaccag1320

gtgcccttcgacggcatgtggattgacatgaacgagccttccaacttcatcaggggctct1380

gaggacggctgccccaacaatgagctggagaacccaccctacgtgcctggggtggttggg1440

gggaccctccaggcggccaccatctgtgcctccagccaccagtttctctccacacactac1500

aacctgcacaacctctacggcctgaccgaagccatcgcctcccacagggcgctggtgaag1560

gctcgggggacacgcccatttgtgatctcccgctcgacctttgctggccacggccgatac1620

gccggccactggacgggggacgtgtggagctcctgggagcagctcgcctcctccgtgcca1680

gaaatcctgcagtttaacctgctgggggtgcctctggtcggggccgacgtctgcggcttc1740

ctgggcaacacctcagaggagctgtgtgtgcgctggacccagctgggggccttctacccc1800

ttcatgcggaaccacaacagcctgctcagtctgccccaggagccgtacagcttcagcgag1860

ccggcccagcaggccatgaggaaggccctcaccctgcgctacgcactcctcccccacctc1920

tacacactgttccaccaggcccacgtcgcgggggagaccgtggcccggcccctcttcctg1980

gagttccccaaggactctagcacctggactgtggaccaccagctcctgtggggggaggcc2040

ctgctcatcaccccagtgctccaggccgggaaggccgaagtgactggctacttccccttg2100

ggcacatggtacgacctgcagacggtgccagtagaggcccttggcagcctcccaccccca2160

cctgcagctccccgtgagccagccatccacagcgaggggcagtgggtgacgctgccggcc2220

cccctggacaccatcaacgtccacctccgggctgggtacatcatccccctgcagggccct2280

ggcctcacaaccacagagtcccgccagcagcccatggccctggctgtggccctgaccaag2340

ggtggggaggcccgaggggagctgttctgggacgatggagagagcctggaagtgctggag2400

cgaggggcctacacacaggtcatcttcctggccaggaataacacgatcgtgaatgagctg2460

gtacgtgtgaccagtgagggagctggcctgcagctgcagaaggtgactgtcctgggcgtg2520

gccacggcgccccagcaggtcctctccaacggtgtccctgtctccaacttcacctacagc2580

cccgacaccaaggtcctggacatctgtgtctcgctgttgatgggagagcagtttctcgtc2640

agctggtgttag2652

<210>49

<211>2649

<212>dna

<213>人工序列

<220>

<223>hgaawt-δ-43

<400>49

caccccgggcggccgcgagcagtgcccacacagtgcgacgtcccccccaacagccgcttc60

gattgcgcccctgacaaggccatcacccaggaacagtgcgaggcccgcggctgttgctac120

atccctgcaaagcaggggctgcagggagcccagatggggcagccctggtgcttcttccca180

cccagctaccccagctacaagctggagaacctgagctcctctgaaatgggctacacggcc240

accctgacccgtaccacccccaccttcttccccaaggacatcctgaccctgcggctggac300

gtgatgatggagactgagaaccgcctccacttcacgatcaaagatccagctaacaggcgc360

tacgaggtgcccttggagaccccgcatgtccacagccgggcaccgtccccactctacagc420

gtggagttctccgaggagcccttcggggtgatcgtgcgccggcagctggacggccgcgtg480

ctgctgaacacgacggtggcgcccctgttctttgcggaccagttccttcagctgtccacc540

tcgctgccctcgcagtatatcacaggcctcgccgagcacctcagtcccctgatgctcagc600

accagctggaccaggatcaccctgtggaaccgggaccttgcgcccacgcccggtgcgaac660

ctctacgggtctcaccctttctacctggcgctggaggacggcgggtcggcacacggggtg720

ttcctgctaaacagcaatgccatggatgtggtcctgcagccgagccctgcccttagctgg780

aggtcgacaggtgggatcctggatgtctacatcttcctgggcccagagcccaagagcgtg840

gtgcagcagtacctggacgttgtgggatacccgttcatgccgccatactggggcctgggc900

ttccacctgtgccgctggggctactcctccaccgctatcacccgccaggtggtggagaac960

atgaccagggcccacttccccctggacgtccagtggaacgacctggactacatggactcc1020

cggagggacttcacgttcaacaaggatggcttccgggacttcccggccatggtgcaggag1080

ctgcaccagggcggccggcgctacatgatgatcgtggatcctgccatcagcagctcgggc1140

cctgccgggagctacaggccctacgacgagggtctgcggaggggggttttcatcaccaac1200

gagaccggccagccgctgattgggaaggtatggcccgggtccactgccttccccgacttc1260

accaaccccacagccctggcctggtgggaggacatggtggctgagttccatgaccaggtg1320

cccttcgacggcatgtggattgacatgaacgagccttccaacttcatcaggggctctgag1380

gacggctgccccaacaatgagctggagaacccaccctacgtgcctggggtggttgggggg1440

accctccaggcggccaccatctgtgcctccagccaccagtttctctccacacactacaac1500

ctgcacaacctctacggcctgaccgaagccatcgcctcccacagggcgctggtgaaggct1560

cgggggacacgcccatttgtgatctcccgctcgacctttgctggccacggccgatacgcc1620

ggccactggacgggggacgtgtggagctcctgggagcagctcgcctcctccgtgccagaa1680

atcctgcagtttaacctgctgggggtgcctctggtcggggccgacgtctgcggcttcctg1740

ggcaacacctcagaggagctgtgtgtgcgctggacccagctgggggccttctaccccttc1800

atgcggaaccacaacagcctgctcagtctgccccaggagccgtacagcttcagcgagccg1860

gcccagcaggccatgaggaaggccctcaccctgcgctacgcactcctcccccacctctac1920

acactgttccaccaggcccacgtcgcgggggagaccgtggcccggcccctcttcctggag1980

ttccccaaggactctagcacctggactgtggaccaccagctcctgtggggggaggccctg2040

ctcatcaccccagtgctccaggccgggaaggccgaagtgactggctacttccccttgggc2100

acatggtacgacctgcagacggtgccagtagaggcccttggcagcctcccacccccacct2160

gcagctccccgtgagccagccatccacagcgaggggcagtgggtgacgctgccggccccc2220

ctggacaccatcaacgtccacctccgggctgggtacatcatccccctgcagggccctggc2280

ctcacaaccacagagtcccgccagcagcccatggccctggctgtggccctgaccaagggt2340

ggggaggcccgaggggagctgttctgggacgatggagagagcctggaagtgctggagcga2400

ggggcctacacacaggtcatcttcctggccaggaataacacgatcgtgaatgagctggta2460

cgtgtgaccagtgagggagctggcctgcagctgcagaaggtgactgtcctgggcgtggcc2520

acggcgccccagcaggtcctctccaacggtgtccctgtctccaacttcacctacagcccc2580

gacaccaaggtcctggacatctgtgtctcgctgttgatgggagagcagtttctcgtcagc2640

tggtgttag2649

<210>50

<211>2649

<212>dna

<213>人工序列

<220>

<223>hgaaco1-δ-43

<400>50

caccccggcagacctagagctgtgcctacccagtgtgacgtgccccccaacagcagattc60

gactgcgcccctgacaaggccatcacccaggaacagtgcgaggccagaggctgctgctac120

atccctgccaagcagggactgcagggcgctcagatgggacagccctggtgcttcttccca180

ccctcctaccccagctacaagctggaaaacctgagcagcagcgagatgggctacaccgcc240

accctgaccagaaccacccccacattcttcccaaaggacatcctgaccctgcggctggac300

gtgatgatggaaaccgagaaccggctgcacttcaccatcaaggaccccgccaatcggaga360

tacgaggtgcccctggaaaccccccacgtgcactctagagcccccagccctctgtacagc420

gtggaattcagcgaggaacccttcggcgtgatcgtgcggagacagctggatggcagagtg480

ctgctgaacaccaccgtggcccctctgttcttcgccgaccagttcctgcagctgagcacc540

agcctgcccagccagtacatcacaggactggccgagcacctgagccccctgatgctgagc600

acatcctggacccggatcaccctgtggaacagggatctggcccctacccctggcgccaat660

ctgtacggcagccaccctttctacctggccctggaagatggcggatctgcccacggagtg720

tttctgctgaactccaacgccatggacgtggtgctgcagcctagccctgccctgtcttgg780

agaagcacaggcggcatcctggatgtgtacatctttctgggccccgagcccaagagcgtg840

gtgcagcagtatctggatgtcgtgggctaccccttcatgcccccttactggggcctggga900

ttccacctgtgcagatggggctactccagcaccgccatcaccagacaggtggtggaaaac960

atgaccagagcccacttcccactggatgtgcagtggaacgacctggactacatggacagc1020

agacgggacttcaccttcaacaaggacggcttccgggacttccccgccatggtgcaggaa1080

ctgcatcagggcggcagacggtacatgatgatcgtggatcccgccatcagctcctctggc1140

cctgccggctcttacagaccctacgacgagggcctgcggagaggcgtgttcatcaccaac1200

gagacaggccagcccctgatcggcaaagtgtggcctggcagcacagccttccccgacttc1260

accaatcctaccgccctggcttggtgggaggacatggtggccgagttccacgaccaggtg1320

cccttcgacggcatgtggatcgacatgaacgagcccagcaacttcatccggggcagcgag1380

gatggctgccccaacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggcgga1440

acactgcaggccgctacaatctgtgccagcagccaccagtttctgagcacccactacaac1500

ctgcacaacctgtacggcctgaccgaggccattgccagccaccgcgctctcgtgaaagcc1560

agaggcacacggcccttcgtgatcagcagaagcacctttgccggccacggcagatacgcc1620

ggacattggactggcgacgtgtggtcctcttgggagcagctggcctctagcgtgcccgag1680

atcctgcagttcaatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctg1740

ggcaacacctccgaggaactgtgtgtgcggtggacacagctgggcgccttctaccctttc1800

atgagaaaccacaacagcctgctgagcctgccccaggaaccctacagctttagcgagcct1860

gcacagcaggccatgcggaaggccctgacactgagatacgctctgctgccccacctgtac1920

accctgtttcaccaggcccatgtggccggcgagacagtggccagacctctgtttctggaa1980

ttccccaaggacagcagcacctggaccgtggaccatcagctgctgtggggagaggctctg2040

ctgattaccccagtgctgcaggcaggcaaggccgaagtgaccggctactttcccctgggc2100

acttggtacgacctgcagaccgtgcctgtggaagccctgggatctctgcctccacctcct2160

gccgctcctagagagcctgccattcactctgagggccagtgggtcacactgcctgccccc2220

ctggataccatcaacgtgcacctgagggccggctacatcataccactgcagggacctggc2280

ctgaccaccaccgagtctagacagcagccaatggccctggccgtggccctgaccaaaggc2340

ggagaagctaggggcgagctgttctgggacgatggcgagagcctggaagtgctggaaaga2400

ggcgcctatacccaagtgatcttcctggcccggaacaacaccatcgtgaacgagctggtg2460

cgcgtgacctctgaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtggcc2520

acagcccctcagcaggtgctgtctaatggcgtgcccgtgtccaacttcacctacagcccc2580

gacaccaaggtgctggacatctgcgtgtcactgctgatgggagagcagtttctggtgtcc2640

tggtgctga2649

<210>51

<211>2649

<212>dna

<213>人工序列

<220>

<223>hgaaco2-δ-43

<400>51

catcctggtagaccaagagctgtgcctacccaatgcgacgtgccacccaactcccgattc60

gactgcgcgccagataaggctattacccaagagcagtgtgaagccagaggttgctgctac120

atcccagcgaagcaaggattgcaaggcgcccaaatgggacaaccttggtgtttcttcccc180

ccttcgtacccatcatataaactcgaaaacctgtcctcttcggaaatgggttatactgcc240

accctcaccagaactactcctactttcttcccgaaagacatcttgaccttgaggctggac300

gtgatgatggagactgaaaaccggctgcatttcactatcaaagatcctgccaatcggcga360

tacgaggtccctctggaaacccctcacgtgcactcacgggctccttctccgctttactcc420

gtcgaattctctgaggaacccttcggagtgatcgttagacgccagctggatggtagagtg480

ctgttgaacactactgtggccccacttttcttcgctgaccagtttctgcaactgtccact540

tccctgccatcccagtacattactggactcgccgaacacctgtcgccactgatgctctcg600

acctcttggactagaatcactttgtggaacagagacttggcccctactccgggagcaaat660

ctgtacggaagccaccctttttacctggcgctcgaagatggcggatccgctcacggagtg720

ttcctgctgaatagcaacgcaatggacgtggtgctgcaaccttcccctgcactcagttgg780

agaagtaccgggggtattctggacgtgtacatcttcctcggaccagaacccaagagcgtg840

gtgcagcaatatctggacgtggtcggatacccttttatgcctccttactggggactggga900

ttccacctttgccgttggggctactcatccaccgccattaccagacaggtggtggagaat960

atgaccagagcccacttccctctcgacgtgcagtggaacgatctggactatatggactcc1020

cggagagatttcaccttcaacaaggacgggttccgcgattttcccgcgatggttcaagag1080

ctccaccagggtggtcgaagatatatgatgatcgtcgacccagccatttcgagcagcgga1140

cccgctggatcttatagaccttacgacgaaggccttaggagaggagtgttcatcacaaac1200

gagactggacagcctttgatcggtaaagtgtggcctggatcaaccgcctttcctgacttt1260

accaatcccactgccttggcttggtgggaggacatggtggccgaattccacgaccaagtc1320

ccctttgatggaatgtggatcgatatgaacgaaccaagcaattttatcagaggttccgaa1380

gacggttgccccaacaacgaactggaaaaccctccttatgtgcccggagtcgtgggcgga1440

acattacaggccgcgactatttgcgccagcagccaccaattcctgtccactcactacaac1500

ctccacaacctttatggattaaccgaagctattgcaagtcacagggctctggtgaaggct1560

agagggactaggccctttgtgatctcccgatccacctttgccggacacgggagatacgcc1620

ggtcactggactggtgacgtgtggagctcatgggaacaactggcctcctccgtgccggaa1680

atcttacagttcaaccttctgggtgtccctcttgtcggagcagacgtgtgtgggtttctt1740

ggtaacacctccgaggaactgtgtgtgcgctggactcaactgggtgcattctacccattc1800

atgagaaaccacaactccttgctgtccctgccacaagagccctactcgttcagcgagcct1860

gcacaacaggctatgcggaaggcactgaccctgagatacgccctgcttccacacttatac1920

actctcttccatcaagcgcatgtggcaggagaaaccgttgcaaggcctcttttccttgaa1980

ttccccaaggattcctcgacttggacggtggatcatcagctgctgtggggagaagctctg2040

ctgattactccagtgttgcaagccggaaaagctgaggtgaccggatactttccgctggga2100

acctggtacgacctccagactgtccctgttgaagcccttggatcactgcctccgcctccg2160

gcagctccacgcgaaccagctatacattccgagggacagtgggttacattaccagctcct2220

ctggacacaatcaacgtccacttaagagctggctacattatccctctgcaaggaccagga2280

ctgactacgaccgagagcagacagcagccaatggcactggctgtggctctgaccaaggga2340

ggggaagctagaggagaactcttctgggatgatggggagtcccttgaagtgctggaaaga2400

ggcgcttacactcaagtcattttccttgcacggaacaacaccattgtgaacgaattggtg2460

cgagtgaccagcgaaggagctggacttcaactgcagaaggtcactgtgctcggagtggct2520

accgctcctcagcaagtgctgtcgaatggagtccccgtgtcaaactttacctactcccct2580

gacactaaggtgctcgacatttgcgtgtccctcctgatgggagagcagttccttgtgtcc2640

tggtgttga2649

<210>52

<211>2637

<212>dna

<213>人工序列

<220>

<223>hgaawt-δ-47

<400>52

ccgcgagcagtgcccacacagtgcgacgtcccccccaacagccgcttcgattgcgcccct60

gacaaggccatcacccaggaacagtgcgaggcccgcggctgttgctacatccctgcaaag120

caggggctgcagggagcccagatggggcagccctggtgcttcttcccacccagctacccc180

agctacaagctggagaacctgagctcctctgaaatgggctacacggccaccctgacccgt240

accacccccaccttcttccccaaggacatcctgaccctgcggctggacgtgatgatggag300

actgagaaccgcctccacttcacgatcaaagatccagctaacaggcgctacgaggtgccc360

ttggagaccccgcatgtccacagccgggcaccgtccccactctacagcgtggagttctcc420

gaggagcccttcggggtgatcgtgcgccggcagctggacggccgcgtgctgctgaacacg480

acggtggcgcccctgttctttgcggaccagttccttcagctgtccacctcgctgccctcg540

cagtatatcacaggcctcgccgagcacctcagtcccctgatgctcagcaccagctggacc600

aggatcaccctgtggaaccgggaccttgcgcccacgcccggtgcgaacctctacgggtct660

caccctttctacctggcgctggaggacggcgggtcggcacacggggtgttcctgctaaac720

agcaatgccatggatgtggtcctgcagccgagccctgcccttagctggaggtcgacaggt780

gggatcctggatgtctacatcttcctgggcccagagcccaagagcgtggtgcagcagtac840

ctggacgttgtgggatacccgttcatgccgccatactggggcctgggcttccacctgtgc900

cgctggggctactcctccaccgctatcacccgccaggtggtggagaacatgaccagggcc960

cacttccccctggacgtccagtggaacgacctggactacatggactcccggagggacttc1020

acgttcaacaaggatggcttccgggacttcccggccatggtgcaggagctgcaccagggc1080

ggccggcgctacatgatgatcgtggatcctgccatcagcagctcgggccctgccgggagc1140

tacaggccctacgacgagggtctgcggaggggggttttcatcaccaacgagaccggccag1200

ccgctgattgggaaggtatggcccgggtccactgccttccccgacttcaccaaccccaca1260

gccctggcctggtgggaggacatggtggctgagttccatgaccaggtgcccttcgacggc1320

atgtggattgacatgaacgagccttccaacttcatcaggggctctgaggacggctgcccc1380

aacaatgagctggagaacccaccctacgtgcctggggtggttggggggaccctccaggcg1440

gccaccatctgtgcctccagccaccagtttctctccacacactacaacctgcacaacctc1500

tacggcctgaccgaagccatcgcctcccacagggcgctggtgaaggctcgggggacacgc1560

ccatttgtgatctcccgctcgacctttgctggccacggccgatacgccggccactggacg1620

ggggacgtgtggagctcctgggagcagctcgcctcctccgtgccagaaatcctgcagttt1680

aacctgctgggggtgcctctggtcggggccgacgtctgcggcttcctgggcaacacctca1740

gaggagctgtgtgtgcgctggacccagctgggggccttctaccccttcatgcggaaccac1800

aacagcctgctcagtctgccccaggagccgtacagcttcagcgagccggcccagcaggcc1860

atgaggaaggccctcaccctgcgctacgcactcctcccccacctctacacactgttccac1920

caggcccacgtcgcgggggagaccgtggcccggcccctcttcctggagttccccaaggac1980

tctagcacctggactgtggaccaccagctcctgtggggggaggccctgctcatcacccca2040

gtgctccaggccgggaaggccgaagtgactggctacttccccttgggcacatggtacgac2100

ctgcagacggtgccagtagaggcccttggcagcctcccacccccacctgcagctccccgt2160

gagccagccatccacagcgaggggcagtgggtgacgctgccggcccccctggacaccatc2220

aacgtccacctccgggctgggtacatcatccccctgcagggccctggcctcacaaccaca2280

gagtcccgccagcagcccatggccctggctgtggccctgaccaagggtggggaggcccga2340

ggggagctgttctgggacgatggagagagcctggaagtgctggagcgaggggcctacaca2400

caggtcatcttcctggccaggaataacacgatcgtgaatgagctggtacgtgtgaccagt2460

gagggagctggcctgcagctgcagaaggtgactgtcctgggcgtggccacggcgccccag2520

caggtcctctccaacggtgtccctgtctccaacttcacctacagccccgacaccaaggtc2580

ctggacatctgtgtctcgctgttgatgggagagcagtttctcgtcagctggtgttag2637

<210>53

<211>2637

<212>dna

<213>人工序列

<220>

<223>hgaaco1-δ-47

<400>53

cctagagctgtgcctacccagtgtgacgtgccccccaacagcagattcgactgcgcccct60

gacaaggccatcacccaggaacagtgcgaggccagaggctgctgctacatccctgccaag120

cagggactgcagggcgctcagatgggacagccctggtgcttcttcccaccctcctacccc180

agctacaagctggaaaacctgagcagcagcgagatgggctacaccgccaccctgaccaga240

accacccccacattcttcccaaaggacatcctgaccctgcggctggacgtgatgatggaa300

accgagaaccggctgcacttcaccatcaaggaccccgccaatcggagatacgaggtgccc360

ctggaaaccccccacgtgcactctagagcccccagccctctgtacagcgtggaattcagc420

gaggaacccttcggcgtgatcgtgcggagacagctggatggcagagtgctgctgaacacc480

accgtggcccctctgttcttcgccgaccagttcctgcagctgagcaccagcctgcccagc540

cagtacatcacaggactggccgagcacctgagccccctgatgctgagcacatcctggacc600

cggatcaccctgtggaacagggatctggcccctacccctggcgccaatctgtacggcagc660

caccctttctacctggccctggaagatggcggatctgcccacggagtgtttctgctgaac720

tccaacgccatggacgtggtgctgcagcctagccctgccctgtcttggagaagcacaggc780

ggcatcctggatgtgtacatctttctgggccccgagcccaagagcgtggtgcagcagtat840

ctggatgtcgtgggctaccccttcatgcccccttactggggcctgggattccacctgtgc900

agatggggctactccagcaccgccatcaccagacaggtggtggaaaacatgaccagagcc960

cacttcccactggatgtgcagtggaacgacctggactacatggacagcagacgggacttc1020

accttcaacaaggacggcttccgggacttccccgccatggtgcaggaactgcatcagggc1080

ggcagacggtacatgatgatcgtggatcccgccatcagctcctctggccctgccggctct1140

tacagaccctacgacgagggcctgcggagaggcgtgttcatcaccaacgagacaggccag1200

cccctgatcggcaaagtgtggcctggcagcacagccttccccgacttcaccaatcctacc1260

gccctggcttggtgggaggacatggtggccgagttccacgaccaggtgcccttcgacggc1320

atgtggatcgacatgaacgagcccagcaacttcatccggggcagcgaggatggctgcccc1380

aacaacgaactggaaaatcccccttacgtgcccggcgtcgtgggcggaacactgcaggcc1440

gctacaatctgtgccagcagccaccagtttctgagcacccactacaacctgcacaacctg1500

tacggcctgaccgaggccattgccagccaccgcgctctcgtgaaagccagaggcacacgg1560

cccttcgtgatcagcagaagcacctttgccggccacggcagatacgccggacattggact1620

ggcgacgtgtggtcctcttgggagcagctggcctctagcgtgcccgagatcctgcagttc1680

aatctgctgggcgtgccactcgtgggcgccgatgtgtgtggcttcctgggcaacacctcc1740

gaggaactgtgtgtgcggtggacacagctgggcgccttctaccctttcatgagaaaccac1800

aacagcctgctgagcctgccccaggaaccctacagctttagcgagcctgcacagcaggcc1860

atgcggaaggccctgacactgagatacgctctgctgccccacctgtacaccctgtttcac1920

caggcccatgtggccggcgagacagtggccagacctctgtttctggaattccccaaggac1980

agcagcacctggaccgtggaccatcagctgctgtggggagaggctctgctgattacccca2040

gtgctgcaggcaggcaaggccgaagtgaccggctactttcccctgggcacttggtacgac2100

ctgcagaccgtgcctgtggaagccctgggatctctgcctccacctcctgccgctcctaga2160

gagcctgccattcactctgagggccagtgggtcacactgcctgcccccctggataccatc2220

aacgtgcacctgagggccggctacatcataccactgcagggacctggcctgaccaccacc2280

gagtctagacagcagccaatggccctggccgtggccctgaccaaaggcggagaagctagg2340

ggcgagctgttctgggacgatggcgagagcctggaagtgctggaaagaggcgcctatacc2400

caagtgatcttcctggcccggaacaacaccatcgtgaacgagctggtgcgcgtgacctct2460

gaaggcgctggactgcagctgcagaaagtgaccgtgctgggagtggccacagcccctcag2520

caggtgctgtctaatggcgtgcccgtgtccaacttcacctacagccccgacaccaaggtg2580

ctggacatctgcgtgtcactgctgatgggagagcagtttctggtgtcctggtgctga2637

<210>54

<211>2637

<212>dna

<213>人工序列

<220>

<223>hgaaco2-δ-47

<400>54

ccaagagctgtgcctacccaatgcgacgtgccacccaactcccgattcgactgcgcgcca60

gataaggctattacccaagagcagtgtgaagccagaggttgctgctacatcccagcgaag120

caaggattgcaaggcgcccaaatgggacaaccttggtgtttcttccccccttcgtaccca180

tcatataaactcgaaaacctgtcctcttcggaaatgggttatactgccaccctcaccaga240

actactcctactttcttcccgaaagacatcttgaccttgaggctggacgtgatgatggag300

actgaaaaccggctgcatttcactatcaaagatcctgccaatcggcgatacgaggtccct360

ctggaaacccctcacgtgcactcacgggctccttctccgctttactccgtcgaattctct420

gaggaacccttcggagtgatcgttagacgccagctggatggtagagtgctgttgaacact480

actgtggccccacttttcttcgctgaccagtttctgcaactgtccacttccctgccatcc540

cagtacattactggactcgccgaacacctgtcgccactgatgctctcgacctcttggact600

agaatcactttgtggaacagagacttggcccctactccgggagcaaatctgtacggaagc660

caccctttttacctggcgctcgaagatggcggatccgctcacggagtgttcctgctgaat720

agcaacgcaatggacgtggtgctgcaaccttcccctgcactcagttggagaagtaccggg780

ggtattctggacgtgtacatcttcctcggaccagaacccaagagcgtggtgcagcaatat840

ctggacgtggtcggatacccttttatgcctccttactggggactgggattccacctttgc900

cgttggggctactcatccaccgccattaccagacaggtggtggagaatatgaccagagcc960

cacttccctctcgacgtgcagtggaacgatctggactatatggactcccggagagatttc1020

accttcaacaaggacgggttccgcgattttcccgcgatggttcaagagctccaccagggt1080

ggtcgaagatatatgatgatcgtcgacccagccatttcgagcagcggacccgctggatct1140

tatagaccttacgacgaaggccttaggagaggagtgttcatcacaaacgagactggacag1200

cctttgatcggtaaagtgtggcctggatcaaccgcctttcctgactttaccaatcccact1260

gccttggcttggtgggaggacatggtggccgaattccacgaccaagtcccctttgatgga1320

atgtggatcgatatgaacgaaccaagcaattttatcagaggttccgaagacggttgcccc1380

aacaacgaactggaaaaccctccttatgtgcccggagtcgtgggcggaacattacaggcc1440

gcgactatttgcgccagcagccaccaattcctgtccactcactacaacctccacaacctt1500

tatggattaaccgaagctattgcaagtcacagggctctggtgaaggctagagggactagg1560

ccctttgtgatctcccgatccacctttgccggacacgggagatacgccggtcactggact1620

ggtgacgtgtggagctcatgggaacaactggcctcctccgtgccggaaatcttacagttc1680

aaccttctgggtgtccctcttgtcggagcagacgtgtgtgggtttcttggtaacacctcc1740

gaggaactgtgtgtgcgctggactcaactgggtgcattctacccattcatgagaaaccac1800

aactccttgctgtccctgccacaagagccctactcgttcagcgagcctgcacaacaggct1860

atgcggaaggcactgaccctgagatacgccctgcttccacacttatacactctcttccat1920

caagcgcatgtggcaggagaaaccgttgcaaggcctcttttccttgaattccccaaggat1980

tcctcgacttggacggtggatcatcagctgctgtggggagaagctctgctgattactcca2040

gtgttgcaagccggaaaagctgaggtgaccggatactttccgctgggaacctggtacgac2100

ctccagactgtccctgttgaagcccttggatcactgcctccgcctccggcagctccacgc2160

gaaccagctatacattccgagggacagtgggttacattaccagctcctctggacacaatc2220

aacgtccacttaagagctggctacattatccctctgcaaggaccaggactgactacgacc2280

gagagcagacagcagccaatggcactggctgtggctctgaccaagggaggggaagctaga2340

ggagaactcttctgggatgatggggagtcccttgaagtgctggaaagaggcgcttacact2400

caagtcattttccttgcacggaacaacaccattgtgaacgaattggtgcgagtgaccagc2460

gaaggagctggacttcaactgcagaaggtcactgtgctcggagtggctaccgctcctcag2520

caagtgctgtcgaatggagtccccgtgtcaaactttacctactcccctgacactaaggtg2580

ctcgacatttgcgtgtccctcctgatgggagagcagttccttgtgtcctggtgttga2637

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1